Skip to main content

Agent 开发的完整知识体系(全景图)

为了让你知道接下来要学什么,先给你一份总纲。Agent 系统由四大核心组成:


1. Agent Core:智能体本体

包含:

  • 认知(LLM 或模型)
  • 记忆(Memory)
  • 工具调用(Tool Use)
  • 规划(Planning)
  • 执行(Action Execution)

常见架构:

  • ReAct(Reason + Act)
  • Reflexion(带总结性记忆)
  • CoT Agent(链式推理 agent)
  • Adaptive Agent(动态策略 agent)
  • 多模态 agent(图文/视频/语音)

2. Multi-Agent System:多智能体协作框架

包括:

  • Agent 间通信(message passing)
  • 协商 / 任务分解(task negotiation)
  • 层级管理(manager-worker)
  • 角色分工(planner、explorer、executor…)
  • 状态共享(blackboard,graph memory)

常用框架思想:

  • AutoGen
  • CrewAI
  • LangGraph
  • CAMEL
  • Swarm

3. Tool & Environment:工具与环境集成

包括:

  • API 工具
  • 本地代码执行(Python sandbox)
  • 搜索工具(web search)
  • 数据库(知识库 agent)
  • 浏览器 agent(playwright/selenium)
  • 文件系统
  • 自定义工具插件(function-calling)

4. Agent Infrastructure:部署与服务化

包括:

  • 状态管理(Memory store)
  • 决策日志(Trace / Step / Graph)
  • 任务编排(Workflow)
  • 并发与防爆走机制(Safety)
  • 多 agent 对话协议
  • 本地与云端架构(边缘 + 云)

我们的学习路线

第 1 阶段:单智能体(Agent Core)

✓ LLM 作为决策引擎 ✓ ReAct / CoT / Reflexion 架构 ✓ 规划(Planner)与执行(Executor) ✓ Memory:短期、长期、检索式 ✓ 工具调用(function-calling) ✓ 状态机与可控 Agent

第 2 阶段:多智能体(Multi-Agent)

✓ Manager–Worker ✓ 竞赛式 Agent(debate) ✓ 协作式 Agent(swarm) ✓ 角色扮演(role-playing) ✓ 图结构 Agent 系统(LangGraph)

第 3 阶段:工具与环境集成

✓ 浏览器 Agent(自动化 + 搜索) ✓ Python 工具库 ✓ API 工具编排 ✓ 文件/数据库 agent ✓ 自定义工具系统

第 4 阶段:大项目实战**

你最终可以做出:

  • 互联网信息自动挖掘系统(MemeMiner)
  • 实时舆情追踪 + 传播链分析 agent
  • 网站深度爬取 agent
  • 数据分析 agent pipeline
  • 企业级 task-oriented agent