产品简介
Hermes Agent 是由开源 AI 实验室 Nous Research 推出的开源自主 AI 智能体(Self-Improving AI Agent),采用 MIT 许可证发布,支持在 Linux、macOS 及 WSL2 环境下一键安装运行。与传统对话式 AI 不同,Hermes Agent 具备内置学习闭环——在执行任务过程中可自动将成功经验提炼为可复用技能文件(Skill),并通过跨会话持久化记忆(MEMORY.md / USER.md)记住用户偏好、项目背景和历史上下文,做到"越用越聪明"。该智能体兼容 OpenAI、Anthropic、DeepSeek、通义千问等 200+ 大模型的 API 接入,也支持通过本地 Ollama/vLLM 运行完全离线;内置 40+ 工具涵盖终端命令执行、文件读写、网页搜索与浏览器自动化、代码运行、图像生成、语音交互等;提供统一消息网关可同时接入 Telegram、Discord、Slack、WhatsApp、飞书、钉钉等十余种即时通讯平台,支持定时 Cron 自动化任务与并行子智能体委派。所有对话记录、记忆数据和技能文件均存储于用户本地机器(~/.hermes/),零遥测、无数据上传第三方,适合个人开发者、研究团队及企业对隐私可控的私有化部署需求。
主要功能
-
持久化跨会话记忆与自主学习闭环:Hermes Agent 通过 MEMORY.md 和 USER.md 跨会话保存用户偏好、项目信息与已学经验,并具备 FTS5 全文检索与 LLM 摘要召回能力;当智能体成功解决复杂问题时自动撰写可复用 SKILL.md 技能文档,后续同类任务直接调用,随使用时间增长不断自我进化。
-
多平台统一消息网关与语音交互:单个网关进程即可对接 Telegram、Discord、Slack、WhatsApp、Signal、飞书、钉钉、微信等 20+ 平台,各端共享同一套记忆与技能;支持 CLI 及消息平台的语音输入转录与 TTS 语音回复,可在 Discord 语音频道进行实时语音对话。
-
完整浏览器自动化与多模态能力:内置网页搜索、页面内容提取及完整浏览器自动化(支持本地 Chrome/CDP 与云端 Browserbase),可执行点击、填表、截图等操作;支持粘贴剪贴板图片进行多模态视觉分析,以及接入 FAL.ai 进行文生图、文字转语音等多种媒体处理。
-
定时自动化任务与并行子智能体委派:内置 Cron 调度器可用自然语言或标准 cron 表达式设定周期性任务(如每日简报、夜间备份、周度审计),结果可推送至指定消息平台;支持通过 delegate_task 派生具有独立上下文和受限工具集的子智能体并行处理多步骤工作流,提升复杂任务效率。
-
多后端运行环境与多模型提供商路由:支持本地终端、Docker 隔离容器、SSH 远程服务器、Modal/Daytona 无服务器、Singularity HPC 等多种运行后端;可接入 Nous Portal、OpenRouter、Anthropic、OpenAI、自定义 OpenAI 兼容端点及本地模型,支持主备故障转移、凭证池轮转及跨会话 Prompt 缓存。
-
MCP 协议集成与开放技能生态:可通过 stdio 或 HTTP 连接任意 Model Context Protocol(MCP)服务器以扩展外部工具(GitHub、数据库、内部 API 等),无需编写原生工具;技能系统兼容 agentskills.io 开放标准,支持从社区技能库安装或导出分享,也可将对话轨迹导出为 ShareGPT 格式用于强化学习与模型微调。
-
代码执行沙箱与文件系统检查点:提供 execute_code 工具让智能体编写并执行 Python 脚本调用自身工具,将多步骤流水线压缩为单次推理;进行文件修改前自动创建 Git 风格快照检查点,用户可通过 /rollback 命令一键回滚至修改前状态保障操作安全。
使用方法
-
环境准备与一键安装:确保系统为 Linux / macOS / WSL2,在终端执行官方安装脚本 curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash,安装器会自动配置 Python 3.11+、uv 及依赖项,无需 sudo 权限。
-
交互式初始配置:运行 hermes setup启动向导,按提示选择 LLM 提供商(Nous Portal OAuth / OpenRouter API Key / 自定义 OpenAI 兼容端点如通义千问、DeepSeek 等)并填入凭据,也可用 hermes model单独切换模型,hermes doctor可检查环境健康状态。
-
启动本地交互对话:直接输入 hermes进入交互式 CLI 聊天界面,内置工具、记忆与技能系统自动加载,可输入自然语言下达任务指令,使用 @文件名引用项目文件注入上下文。
-
(可选)配置消息平台网关:运行 hermes gateway setup交互式选择要接入的 IM 平台(Telegram / Discord / Slack / 飞书等)并填入 Bot Token,然后用 hermes gateway install注册为 systemd 后台服务,hermes gateway start启动多平台消息监听。
-
日常管理与升级:使用 hermes skills install <ID>从技能中心安装扩展能力,hermes tools启用或禁用特定工具集,hermes cron create设定定时任务,hermes update拉取最新版本,所有配置与记忆存于 ~/.hermes/目录。
应用场景
-
个人开发与代码辅助工作流:作为常驻开发助手帮开发者自动编写与调试代码、运行单元测试、审查 Pull Request、定位 Bug,并将常见修复经验沉淀为技能文件,下次遇到同类编译错误或依赖冲突时可自动给出解决方案,大幅提升重复性开发任务效率。
-
企业运维监控与无人值守自动化:配合 SSH 后端接入团队飞书或钉钉群,定时执行服务器日志分析、磁盘与进程监控、数据库备份,出现告警时自动诊断常见问题(如端口占用、磁盘满)并尝试修复,结果推送到群组实现小型团队零成本运维值守。
-
深度信息调研与数据分析报告生成:利用内置网页搜索与浏览器自动化采集行业资讯、竞品数据或学术文献,结合持久记忆跨会话积累研究领域背景,定期自动生成带图表的分析报告并推送至指定平台,适合分析师、研究员做长期追踪型课题。
-
个人知识管理与第二大脑搭建:通过微信或飞书桥接与 Hermes Agent 日常对话记录读书笔记、待办事项与生活规划,智能体学习用户思维偏好与关注主题,支持语义检索历史对话内容,并可设定每月自动生成个人月度总结与目标回顾。
-
内容创作与多平台社媒运营辅助:自动根据选题撰写文章、SEO 优化文案、生成配图,规划社媒发布排期并可通过消息网关分发至不同平台,创作者在长期使用中让智能体习得自身写作风格与品牌调性,实现个性化内容流水线。
-
AI 研究与训练数据生成平台:批量并行运行 Hermes Agent 生成数千条工具调用轨迹(Trajectory),导出 ShareGPT 格式数据用于监督微调或强化学习训练,配合 Atropos 框架对智能体行为进行 RL 训练,适合从事 LLM Agent 方向的研究人员。