Agent 实战：智能路由、任务拆解和链路工程

Jun 15, 2025 in AGENT
qwen agent reactchat function calling nl2sql workflow gradio
3 min read

大模型天生具有幻觉，为了工程的准确性，我们奉行“非必要不Agent”原则。我们是专业的，除非忍不住，否则绝不用 Agent。

特别声明：本文使用 Qwen Agent 实现。

本文包含以下两个项目：

1）智能路由

概述：如果一个业务可以分很多种情况处理。针对每种情况，我们开发一个工具函数 (Function Calling)，来处理此种情况内部的复杂性。此时，Agent 充当智能路由的角色，将对应的情况路由到对应的工具函数。工具函数内部带有描述信息，Agent 可以访问这些信息，以此判断在何种情况下，调用这个工具函数。

具体来讲，本项目开发了一个 客诉核查 Agent。针对物流逾期和假货两种客诉，分别开发了对应的工具函数。Agent 通过接入工具函数，获得了核查以上两种客诉真实性的能力。当我们将客诉信息传递给 Agent，它会输出针对该客诉的 核查结论 和 相应证据。

2）数据库查询优化

概述：数据库查询是一个非常通用的需求，其中 NL2SQL 是难点。为了提升 NL2SQL 的准确性，很容易想到把数据表的 Schema、样例数据、个别字段的枚举值作为上下文 (context) 注入到原始 Prompt 中。本项目实现了这一点。

具体来说，本项目做了以下工作：

启用 Qwen Agent 的 ReActChat 模式，以提升多步骤情况下的性能
开发定制的 Workflow，用于将 Schema 等上下文信息注入原始 Prompt 中
开发可流式对话的 Gradio WebUI，以方便调试 Agent 和 Workflow

✨ 所有代码见 GitHub 仓库：luochang212/agent-project

一、引言

1. 尚未到来的涌现

We always overestimate the change that will occur in the next two years and underestimate the change that will occur in the next ten. – Bill Gates

把大象放进冰箱只需要三步。让大模型实现自举，也只需要三步：

让大模型自己处理语料
让大模型自己训练自己
让大模型自己评估自己、反思、优化、调整超参、继续实验 ……

只要完成一次循环，即一次自我进化，就能完成两次、三次、乃至 N 次，这就是自举。一旦大模型能够自我演化，某种意义上，它就成了生物，也意味着 AGI 真正到来。至少目前，我们尚未触发这样的循环。可能是基座模型不够强大，也可能是 Agent 框架不够成熟，或者是什么我们还不了解的原因。

就这个比较初级的 Agent 看，它对智能的提升幅度有限。并不是说，只要把大模型连起来，智能就会成倍地增加。要实现 AGI，恐怕还是要基座模型本身 AGI 才行。Agent 不是 Alpha，顶多是 Smart Beta.

2024 年，Agent 曾被寄予厚望。那一年，Sora, GR, GPT-4o 等新技术层出不穷，大家对 AI 前景无限乐观。马斯克甚至说，到 2025 年，AI 可能比任何一个人都聪明 [原文]。然而事实是，2025 年最大的红利是 Agent，当红利释放后，想象中的智能涌现没有来。今年就 AGI 的概率已经很小很小了。

2. 小米加步枪

Agent 的本质是：模型能力不够，工程方法来凑。

单个大模型的能力有限。通过组织多个模型一起工作，每个模型负责其中一块，分而治之。如此便能突破单个模型能力的上限，做更多更复杂的事情。

Agent 工作时大多遵循以下模式：

感知：一个任务过来，无论是 被动接受 任务信息，还是 主动探索 与任务有关的线索，这都属于“感知”。
规划：有了对任务的感知，我们拆解任务，规划出一条或多条实现路径
控制：有了实现路径，在路径上的每一个节点，通过 MCP 调用资源，执行任务；如果当前节点遇到困难，则动态地创建 sub-agent 继续分解任务
反思：对各个路径的实现结果进行评估。如果某条路径失败，总结失败经验，重新来过，直到抵达重试次数上限
记忆：收集本次任务信息，提炼重点，存入知识库。下次执行相似任务时，从知识库中取出，作为先验知识

一个大模型搞不定，就用多个大模型解决；没有大炮没关系，就用小米加步枪战斗。

3. 还有 MCP

MCP 相当于引入了 Action -> React Pair。大模型可以通过 MCP 与现实世界交互，获得即时反馈。它可以交互的东西很多，比如：

FastAPI（接入中台能力）
PostgreSQL（长期记忆）
Redis（短期记忆）
Docker（代码执行能力）

Agent 兼具眼和脑的功能，加上 MCP 这个手，事情变得有趣起来。毕竟人类也是靠 眼 -> 脑 -> 手 循环，把活干起来的。

4. Agent 能做什么

回到务实的问题，Agent 能做什么？Agent 可以看作是大模型的调度器，它擅长的无非是大模型擅长的那些，外加一些由组织和规划产生的能力。

有些公司，把 Agent 当作中台服务的调度器。用 MCP 把中台服务轮询一遍，再用大模型把轮询的结果总结一下。这当然也是一种用法，但是有点画蛇添足。因为用传统的 for loop 和 if else 控制块，也能实现相同的逻辑。

Agent 的价值在传统编程的能力圈之外。

新技术的落地是这样的，总有一个拿着锤子找钉子的过程，但终究要做真正有收益的事。

1）智能路由 (Function Calling)

我们确实可以把 Agent 当调度器，但不能是简单的 if else 可以实现的那种。

Note: 举个例子，我们写一个 Agent 来 核查客诉是否属实。如果用户投诉“商家未发货”，就查发货记录；如果投诉“好几天了，还没收到货”，就去查物流表；如果投诉“商家真没素质”，就去查聊天记录。传统编程处理这种问题，遇到长尾 case 会没法解，需要人工介入。这种本身属于语言模态，问题又无法特别明确定义的，就适合用 智能路由 的方式解决。

2）任务拆解（ReActChat）

理想情况下，我们把 MCP 开发好丢给 Agent，告诉它我们想要什么。Agent 应该自己将任务拆解成若干步骤，再将每个步骤交由 MCP 处理。遇到错误会自己重试。这种功能已经被开发出来了，它叫 ReAct 模式。

ReAct (Reasoning-Action) 是一种结合了 思考决策 (Reasoning) 和 环境交互 (Action) 的智能体模式。其核心逻辑是：先规划一系列操作，依次执行，再基于操作结果进一步思考，循环往复直至问题解决。ReAct 模式并非银弹，即使上了 Qwen3 和 Deepseek-0528 最大尺寸的模型，只要问题一难，就会有相当程度的失败概率。我们遇到失败，就往里掺链路工程，一点点地把良率做上去。因此和同事戏言：有多少人工，就有多少人工智能。

3）深度研究（Deep Research）

当你需要解决业务难题时，仅凭 Function Calling 或 ReActChat 是不够的，你要做 Agent 的 链路工程。具体来说，你要将 Function Calling 和 ReAct 作为基础组件，开发许多工作流。

以上是一个 Agentic 风格的 风控引擎。当监控发现用户在支付路由下有风险时，监控立即向风控引擎发送一条消息，形如：

{
    "uid": 19335701,
    "route": "pay",
    "reason": "card_fraud",
    "timestamp": "2025-06-01 19:21:09"
}

风控引擎 Agent 会运行一个初步的排查程序，生成简单的风险报告。如果发现简单的报告不足以揭示风险，则调用更高消耗的计算模块，获得更多风险信息。最后它综合所有信息进行研判，告诉我们这个用户是不是坏人。如果用户是坏人，它还能继续探查坏人的周边用户，召回更多坏人，进而打击整个黑产团伙。

参考：deep-research

5. 世之显学 Agent+

Agentic 已经成为一种显学，万物皆可 Agentic，比如 RAG 用 Agent 重做一下叫 Agentic RAG。这是好事，说明 Agent 真的有用。事实上，它已经为许多业务带来提升，比如智能客服、内容风控、商业智能 (ChatBI) ……

不得不感叹，Agent 发展得实在太快了。让我们回顾一下过去半年的技术进展：

2024 年 11 月，Anthropic 发布了 MCP
2025 年 1 月，阿里发布 Qwen Agent
2025 年 3 月，OpenAI 发布 OpenAI Agents
2025 年 4 月，Google 发布 A2A

最近，MAS (multi-agent system) 领域的声量也不小。就在前几天，Anthropic 发布了题为 How we built our multi-agent research system 的博客，介绍他们将多智能体应用在研究系统中的进展。

二、智能路由

本节通过一个客诉核查 Agent，来实践智能路由模式。

想象我们是一家电商平台，有位用户发起了客诉，我们用 Agent 核查用户投诉的内容是否属实。这个 Agent 的功能是，根据预设的客诉类型，将客诉转入对应的流程。我们希望待决策问题不要过于简单，必须是 if else 无法实现的，否则 Agent 将变成画蛇添足的产物。

客诉以 json 形式传入：

{
    "uid": 103,
    "route": "after_sales",
    "content": "我等了很久，没收到货",
    "time": "2025-06-01 12:03:55"
}

Agent 接到这条消息，立即判断属于哪种客诉类型，并交给对应的 MCP 核查。核查需要包含最终结果和数据库中的数据作为证据。在没有核查到对应问题的情况下，需要额外检查用户订单状态是否有其他异常。如果有，也应该作为上下文返回给运营同学。

构造样本数据
使用 Python 连接 Postgres
使用 MCP 查询 Postgres
开发客诉核查 Workflow

三、数据库查询优化 (NL2SQL 优化)

我发现只用 Postgres MCP Server 无法达到很好的查询效果。于是决定做一些 Agent 的链路工程开发，以提升 MCP 使用数据库数据的能力。我们注意到直接使用 MCP 无法达到很好效果的原因是：Agent 不会固定地“先获取表结构，再写 SQL”；而是“在缺乏背景信息的情况下，直接写 SQL”，由此产生了幻觉。

1. 两种思路

我们尝试以下两种思路，看一下哪种方法更优：

1）提示词工程

在 Prompt 中，让 Agent 先获取表结构，再根据表结构写 SQL。由于此任务较为复杂，可以开启 ReActChat 模式。

2）链路工程

开发一个定制的链路工程，为 MCP 添加更多上下文，让 Agent 获得充分的上下文之后再写 SQL。

2. 开发 WebUI

我还开发了对应的 WebUI：

ReActChat WebUI：gradio_postgres_agent.py
Workflow WebUI：gradio_postgres_workflow.py

在本地启动 WebUI 尝试哪种方法更优：

1）ReActChat WebUI：用于验证提示词工程思路

运行以下代码以启动 WebUI：

# 启动 ReActChat WebUI
python gradio_postgres_agent.py

提示词：

查询用户（用户ID为103）的所有订单信息。
请先调用工具，查询订单表的表结构；然后写 SQL；最后调用工具执行 SQL。
请以 Markdown 表格的形式，展示该用户的订单信息。

执行结果：

对比数据库中的真实数据：

(1003, 103, 1, 5003, 'ordered', '2025-05-03 09:15:00')

我们发现 Agent 出现了幻觉。但是不要对 ReActChat 梁木好吗，毕竟我用的是 Qwen3-0.6B-FP8 这样的小尺寸模型。

2）Workflow WebUI：用于验证链路工程思路

运行以下代码以启动 WebUI：

# 启动 Workflow WebUI
python gradio_postgres_workflow.py

提示词：

查询用户（用户ID为103）的所有订单信息。
请以 Markdown 表格的形式，展示该用户的订单信息。

执行结果：

我们对比数据库中的真实数据，发现 Agent 的结果完全正确。

注：数据库中的 timestamp 是以 UTC 格式存储的。

3. 小结

好啦，两种思路的结果对比完成！

在同样使用 0.6B 模型的情况下，链路工程显然更胜一筹。虽然开发链路工程很辛苦，但是我们的努力带来了回报！它最终提升了查询结果的准确性。

下面，我们来看一下链路工程具体是怎么开发的。

剩余内容的目录：

初始化 Qwen Agent
从一个简单的例子出发
开发 Postgres 数据库查询模块
开发 Postgres 数据库查询工具
回到最初的例子

四、后日谈

一些碎碎念。

1. 技术大爆发

大模型输入是语言，输出也是语言，它终究是一种语言模态的东西。想要影响现实世界，比如执行程序、操纵机械臂，就需要一种通信协议，来实现自然语言到接口语言的转换，于是 MCP 出现了；囿于单个大模型的上下文窗口限制、参数量限制、思考时间限制，它无法完成复杂且长程的工作。如果有一个框架，把多个乃至多种大模型组织起来，通力协作，共同完成一项任务该有多好，于是 Agent 又出现了。

蛮不可思议的。短短数年间，我们经历了：

互联网+
AI+
LLM+
Agent+

看似每项技术都发展得普通且合理，但是跳出来一看，就被技术爆发的速度所震惊。不知道的还以为我们 2017 年捡到外星飞船了呢。

2. 对 OpenAI Agents 的看法

做技术选型的时候，我没有选 OpenAI Agents，最终还是选了 Qwen Agent。究其根本，是因为 OpenAI Agents 不是一个完全开源的 Agent.

功能阉割：OpenAI Agents 的付费接口叫 Responses API，开源接口叫 Chat Completions API，付费接口和开源接口协议不同，且开源接口功能阉割严重
封禁供应商：检查模型名中的供应商名，若供应商遭封禁，运行时会报错
追踪 IP：默认开启 tracing 模式。若要关闭追踪，需设置环境变量 OPENAI_AGENTS_DISABLE_TRACING=1。初次使用者几乎必然向 OpenAI 的服务器暴露自己的 IP

虽然 OpenAI 依然是行业的开创者和领先者，但是嘴脸实在太难看了。声称为了人类福祉却做着蝇营狗苟的事，这一点上我赞同马斯克，OpenAI 应该改名叫 CloseAI.

3. 预研计划

Agent 是调用 MCP 的最佳方法，两者无法分开，因此不得不将两者置于同一项目下。如此，项目便显得有些臃肿。为了让它条理清晰，我又不得不设置了一些阶段性的小目标。于是便有了预研计划。

预研计划如下：

Qwen3 推理脚本开发：test_qwen3
基于 LangChain 实现 RAG：test_rag
Qwen Agent 的简单使用：test_qwen_agent
OpenAI Agents 的简单使用：test_openai_agent

关于预研计划的具体说明见预研计划。

参考：