产品简介
Craft Agents是由知名笔记协作工具 Craft 团队推出的开源 AI Agent 原生桌面应用与工作流界面,基于 Claude Agent SDK 构建,旨在让用户以自然语言驱动最强大的大语言模型(如 Claude、ChatGPT、Gemini、本地 Ollama 模型等)来完成跨工具的复杂工作任务。与传统聊天机器人不同,Craft Agents 提供类邮件收件箱式的会话管理界面,支持多任务并行、后台运行及会话状态追踪,并将每一次对话自动沉淀为可共享的文档化决策记录。用户可通过 Model Context Protocol(MCP)、REST API 或直接挂载本地文件系统,将 GitHub、Linear、Slack、Gmail、Obsidian 笔记库、本地数据库等各类数据源一键接入——甚至只需用自然语言告诉 Agent"连接 Linear",便能自动读取公开 API 与 MCP 文档、获取凭证并完成配置。Craft Agents 内置完整 Chromium 浏览器,Agent 可自主导航网页、填表、抓数、截图;同时提供 Explore(只读研究)、Ask to Edit(审阅后修改)、Execute(全自动执行)三级权限模式,让用户安全掌控 Agent 行为边界。作为 Apache 2.0 开源软件,支持 macOS / Windows / Linux 桌面端、CLI 及自托管远程服务器部署,适合开发者、知识工作者与团队构建下一代 Agent 原生工作流。
主要功能
-
多模型与自定义 API 接入 — 支持接入 Anthropic Claude(API Key 或 Max 订阅)、OpenAI ChatGPT Plus、Google Gemini、DeepSeek、Meta Llama 等数百种模型 via OpenRouter,也支持本地离线运行 Ollama 或 LM Studio,随时切换模型而工作流保持不变,真正实现"自带模型(Bring Your Own Model)"。
-
全渠道数据源连接(Sources) — 可通过 MCP 服务器、REST API(含 OpenAPI Spec 导入)、本地文件/文件夹三种方式连接任意外部系统,如 GitHub 仓库、Linear 项目、Slack 频道、Gmail 邮箱、Obsidian 笔记库、PostgreSQL 数据库等,且支持细粒度权限控制(只读/读写/执行),单个对话中可同时调用多源数据。
-
三级权限模式与探索-执行工作流 — 提供 Explore(只读研究分析,不做任何修改)、Ask to Edit(提出变更方案等待人工审批)、Execute(全自动自主执行)三种模式,可用快捷键即时切换,保障敏感操作前有人工审阅环节,适合安全地进行代码审查、数据分析与自动化任务。
-
内置 Chromium 浏览器与网页自动化 — Agent 拥有完整内置浏览器,可通过自然语言指令让 Agent 登录网站、导航页面、点击按钮、填写表单、提取结构化数据或截取标注截图,对于没有开放 API 的古老系统也能直接以浏览器模拟人工操作完成工作。
-
可复用技能系统(Skills)与隔离工作区(Workspaces) — 支持创建带 YAML Frontmatter 的 Markdown 格式可复用指令模板(如代码审查流程、周报生成、Bug 分类),对话中用 @ 召唤即激活;工作区机制使不同项目拥有独立的数据源、技能与对话历史,互不干扰便于多人协作与个人事务分类管理。
-
收件箱式会话管理与自动文档化 — 每次 Agent 对话作为持久化会话保存于收件箱,可标记 Todo / In Progress / Done 等自定义状态,支持多任务并行切换与后台运行通知;完整对话(含推理过程、决策取舍、执行结果)可导出或附加至 Linear Issue / GitHub PR / Confluence 页面,成为团队可追溯的工作记录。
-
开源与自托管部署 — 以 Apache 2.0 协议开源(GitHub: lukilabs/craft-agents-oss),支持本地桌面运行(凭据 AES-256-GCM 加密存储)或部署为独立远程服务器供多设备访问,所有界面主题、状态、权限均可通过对话或配置文件自定义,满足企业内网隐私合规需求。
使用方法
-
下载安装 — 前往 https://agents.craft.do/下载对应操作系统(macOS / Windows / Linux)的桌面客户端,或通过官方一键脚本 / Docker / 源码(需 Bun 环境)自行构建部署。
-
配置大模型 — 首次启动后选择 LLM 提供商,填入 Anthropic API Key、登录 GitHub Copilot OAuth 或指向本地 Ollama 端点完成鉴权,确认连接成功后进入主界面。
-
创建工作区并连接数据源 — 点击新建 Workspace 命名(如"开发项目"或"个人事务"),随后通过侧栏 Sources 添加 MCP 服务器、粘贴 REST API 地址/OpenAPI 文档或选择本地文件夹,也可直接在对话中输入"连接 GitHub / Linear / Slack"让 Agent 引导自动配置。
-
新建会话并发起任务 — 点击 New Session 开启对话,设定工作目录,用自然语言描述需求(如"帮我总结本周 GitHub 上的 PR 并在 Craft 文档中生成周报"),根据需要在界面底部切换 Explore / Ask to Edit / Execute 权限模式。
-
审阅结果并管理会话 — 观察 Agent 逐步执行的工具调用与计划提案,在 Ask to Edit 模式下审批修改内容,任务完成后将会话标记状态或分享链接给团队成员,必要时切换其他并行会话继续工作。
应用场景
-
软件开发与 DevOps 工作流整合 — 工程师可在单一对话中让 Agent 拉取 GitHub 仓库代码、查阅 Linear 中关联 Issue、运行本地测试命令、生成代码审查意见并直接将结果回写至 PR 描述,消除终端、浏览器与项目管理工具间的频繁切换,也可用于自动化简单 Bug 修复与文档同步。
-
跨工具研究与数据分析 — 分析师或研究者以 Explore 模式让 Agent 只读访问本地 CSV / 数据库及第三方 API,自动汇总多源数据、提炼洞察并生成分析报告草稿,全程不修改原始数据,执行前可充分审阅 Agent 提出的分析思路与处理计划。
-
内容与文档自动化生产 — 内容团队定义"SEO 调研""博客撰写""排版发布"等可复用 Skill,Agent 从 Analytics API 拉取关键词数据、交叉引用 Craft 笔记库参考资料、生成结构化文章并直接写入指定文档空间,实现多步骤内容流水线编排。
-
客户支持与工单自动化 — 客服团队连接 Zendesk / Intercom 等工单系统,配置分类与回复生成 Skill,Agent 自动读取新工单内容、判断优先级、检索知识库匹配答案草案供人工确认后发送,并同步更新 CRM 记录,大幅降低重复劳动。
-
HR 招聘与入职流程编排 — HR 部门用 Agent 解析招聘系统传来的简历附件进行初筛打分,自动向面试官发送日历邀请、创建 Linear 跟踪任务、将录用信息推送到 Slack 频道并更新新员工入职文档,串联原本割裂的多套 SaaS 工具。
-
个人知识管理与日常事务助理 — 个人用户挂载 Obsidian 笔记库、日历与邮件账户,通过自然语言查询"本周待办事项有哪些""找出去年关于 XX 项目的所有笔记""帮我起草回复这封邮件",打造统一的本地优先 AI 助理中枢。