一文看懂主流 AI Agent 工具

Goat_Yang2026/6/7约 2353 字大约 8 分钟

一文看懂主流 AI Agent 工具

Codex、Claude Code、Cursor、OpenClaw、Hermes 都被称为 Agent，但它们并不是同一类产品。

简单来说：

Codex、Claude Code：在终端中编写和修改代码；
Cursor、Devin Desktop：集成 Agent 的代码编辑器；
Devin、OpenHands：可以独立处理开发任务的软件工程 Agent；
ChatGPT Agent、Manus：处理网页、文档和办公任务；
OpenClaw、Hermes Agent：长期运行的个人 AI 助手。

本文按照实际用途，对目前具有代表性的 Agent 工具进行分类。

产品信息核对时间为 2026 年 6 月 7 日。本文列举的是具有代表性的产品，不是严格的市场份额排名。

什么是 Agent

普通大模型主要负责理解和生成内容，而 Agent 还能够调用工具执行操作，例如：

读取和修改文件；
执行终端命令；
浏览网页；
运行测试；
操作邮件、文档和第三方服务；
根据执行结果继续调整计划。

因此，评价一个 Agent 不能只看它使用了什么模型，还要看它的工具、上下文、权限控制和执行环境。

Agent 工具的主要分类

类型	代表工具	主要用途
终端编程 Agent	Codex、Claude Code、Gemini CLI、Aider	在终端中修改代码和执行命令
Agent 编辑器	Cursor、Devin Desktop、GitHub Copilot	在 IDE 中完成代码编写与项目操作
软件工程 Agent	Devin、OpenHands	独立处理 Issue、测试和 Pull Request
通用工作 Agent	ChatGPT Agent、Claude Cowork、Manus	处理网页、文件、表格和办公任务
常驻个人 Agent	OpenClaw、Hermes Agent	长期运行，通过聊天软件或定时任务工作
Agent 开发框架	LangGraph、AutoGen、CrewAI	开发自己的 Agent 应用

终端编程 Agent

Codex

Codex 是 OpenAI 推出的编程 Agent，目前覆盖 CLI、IDE、桌面端和云端任务。

它可以读取代码仓库、修改文件、运行命令、执行测试，并使用 MCP、Skills 和子 Agent。

适合：

OpenAI 和 ChatGPT 用户；
喜欢终端开发；
需要同时处理多个编程任务；
需要本地与云端协作。

Claude Code

Claude Code 是 Anthropic 推出的终端编程 Agent。

它擅长理解大型代码仓库，可以修改代码、执行命令、操作 Git，并支持 MCP、Skills、Hooks 和子 Agent。

适合：

Claude 用户；
复杂代码阅读与重构；
希望深度自定义 Agent 工作流；
以终端为主要开发环境的用户。

Gemini CLI

Gemini CLI 是 Google 推出的开源终端 Agent，支持文件操作、终端命令和 MCP。

它更适合 Gemini 和 Google Cloud 用户。

Aider

Aider 是轻量级终端编程工具，强调与 Git 配合，并支持多种模型供应商。

它适合希望接入国产模型、本地模型或自定义 API 的用户。

Agent 编辑器

Cursor

Cursor 是目前较有代表性的 AI 代码编辑器。

它在编辑器中集成了：

代码补全；
项目索引；
Agent 模式；
终端和浏览器工具；
MCP 与 Skills；
本地和云端 Agent。

Cursor 的优点是安装后即可使用，适合不想花费太多时间配置环境的开发者。

Devin Desktop

Devin Desktop 原名 Windsurf，是集编辑器、本地 Agent 和云端 Devin 于一体的开发环境。

它更强调同时管理本地与云端 Agent，而不只是代码补全。

GitHub Copilot

GitHub Copilot 已经从代码补全工具发展为完整的编程 Agent。

它支持 IDE Agent、命令行工具、代码审查和云端 Agent，适合代码主要托管在 GitHub 的个人或团队。

Cline 与 Roo Code

Cline 和 Roo Code 都是较受欢迎的开源 VS Code Agent。

它们支持多种模型供应商、MCP、终端和文件操作，适合：

接入国产模型；
使用本地模型；
自行控制 API 成本；
深度配置提示词和权限。

缺点是配置复杂度通常高于 Cursor。

软件工程 Agent

Devin

Devin 是面向完整软件工程任务的云端 Agent。

用户可以直接把 Issue、依赖升级、代码迁移或测试任务交给它，完成后检查代码和 Pull Request。

它更适合目标明确、验收标准清晰的工程任务。

OpenHands

OpenHands 是开源软件开发 Agent 平台，提供 CLI、Web 界面、云端服务和 SDK。

它支持多种模型，适合希望自行部署或开发 Agent 的用户。

通用工作 Agent

ChatGPT Agent

ChatGPT Agent 主要处理网页和办公任务，例如：

搜集资料；
浏览网站；
编辑文档和表格；
处理上传文件；
使用连接的第三方服务。

它面向普通用户和知识工作者，而不是专门针对代码仓库。

Claude Cowork

Claude Cowork 可以操作授权的本地文件和应用，适合整理资料、制作文档和执行跨应用工作流。

Manus

Manus 是通用云端 Agent，可以进行网络调研、数据整理、网页制作、幻灯片生成和浏览器自动化。

它更接近“提出目标后等待交付结果”的使用方式。

常驻个人 Agent

OpenClaw

OpenClaw 是可以自行部署的开源个人 Agent。

它能够长期运行，并接入 Telegram、Discord、Slack、飞书、微信等通信渠道。用户可以直接通过聊天软件远程下达任务。

OpenClaw 的重点是：

多聊天渠道接入；
长期在线；
文件、终端和浏览器操作；
多模型支持；
自托管和设备连接。

它更像一个私人 AI 助手网关，而不是专门的编程工具。

Hermes Agent

Hermes Agent 是 Nous Research 开发的开源常驻 Agent。

它强调：

持久化记忆；
自动生成 Skills；
定时任务；
子 Agent；
跨会话保存项目知识；
多种聊天和命令行入口。

Hermes Agent 更适合需要长期记忆、自动化任务和 Agent 自我积累能力的用户。

OpenClaw 与 Hermes 的区别

对比项	OpenClaw	Hermes Agent
核心定位	多渠道个人助手	长期记忆型自主 Agent
主要特色	聊天软件、设备和服务连接	记忆、Skills、定时任务和子 Agent
使用场景	远程控制个人 AI 助手	长期项目和自动化工作流
是否编程优先	否	否

主流工具快速对照

工具	主要形态	模型自由度	适合场景
Codex	CLI、IDE、Cloud	较低	OpenAI 生态编程
Claude Code	CLI	较低	代码理解与重构
Gemini CLI	CLI	较低	Gemini 与 Google Cloud
Aider	CLI	高	多模型轻量编程
Cursor	IDE	中等	开箱即用的 AI 开发
Cline	IDE 插件	高	自定义模型和权限
Roo Code	IDE 插件	高	高自由度 Agent
Devin	云端 Agent	较低	独立完成工程任务
OpenHands	Web、CLI、SDK	高	开源软件 Agent 平台
ChatGPT Agent	通用云端 Agent	较低	网页和办公任务
Manus	通用云端 Agent	较低	调研和内容交付
OpenClaw	常驻个人 Agent	高	多渠道私人助手
Hermes Agent	常驻个人 Agent	高	记忆和自动化任务