智能体架构设计 | 埃森德信息科技

📄️ 架构1：自然语言到工具调用

智能体构建中最常见的模式之一是将自然语言转换为结构化的工具调用。这是一个强大的模式，允许您构建能够推理任务并执行任务的智能体。

不要将你的提示词工程外包给某个框架。

在任何给定时刻，你在智能体中输入给 LLM 的内容本质上是：“这是到目前为止发生的情况，下一步该怎么做？”

工具不需要很复杂。它们的核心只是来自LLM的结构化输出，用于触发确定性代码。

即使在AI领域之外，许多基础设施系统也试图将“执行状态”与“业务状态”分离开来。对于AI应用而言，这可能涉及复杂的抽象来追踪诸如当前步骤、下一步、等待状态、重试次数等信息。这种分离带来了复杂性，虽然有时是值得的，但对于你的使用场景来说可能有些过度。

智能体（Agents）本质上是程序，我们按照既定的期望动、查询、恢复和停止它们

默认情况下，LLM API 依赖于一个根本性的高风险 Token 选择：我们是返回纯文本内容，还是返回结构化数据？

如果你能掌控自己的控制流，就可以做很多有趣的事情。

智能体的优势之一在于“自我修复”——对于短任务，大语言模型（LLM）可能会调用某个失败的工具。优秀的 LLM 有很大概率能够读取错误信息或堆栈跟踪，并在后续的工具调用中找出需要修改的地方。

与其构建试图包办一切的大型单体智能体，不如构建小巧、专注、只做好一件事的智能体。智能体只是一个更大的、基本确定的系统中的构建模块之一。

1b0-trigger-from-anywhere

1c0-stateless-reducer