## Agent Harness 综述核心：LLM Agent 外化不是增强模型，而是重构任务
一篇长达54页的综述《Externalization in LLM Agents》揭示了一个反直觉的核心观点：为大型语言模型（LLM）Agent配备外部工具，其本质并非增强模型本身的能力，而是从根本上将复杂的认知任务重构为更简单的任务。论文援引认知科学家Donald Norman的“认知制品”理论作为支点，指出外部工具的作用是改变任务的性质。例如，购物清单并非增强记忆力，而是将“回忆”任务转变为更简单的“识别”任务。对于LLM Agent而言，外化过程遵循同样的逻辑。

具体而言，裸模型面临三大困境：有限的上下文窗口导致会话中断即失忆、同一提示的执行流程不稳定、以及调用工具时需猜测参数格式。外化通过引入Memory、Skills和Protocols等组件来应对。外部Memory将回忆变为检索，Skill库将从头发明变为选择组合，而标准化的Protocol（如MCP）则将临场猜测变为按规范填写。其共同结果是，模型需要解决的核心问题被显著简化，难度降低。

论文进一步将2022年至今的演变梳理为三个层次：Weights（模型权重）、Context（上下文）和Harness（驾驭环境）。这一发展脉络并非意味着旧层过时，而是标志着开发者投入的边际精力正从直接修改模型参数，转向设计和改造模型运行的外部环境。这一转向为AI工程实践提供了新的框架，将看似分散的技术趋势统一到“外化”这一核心逻辑之下，对构建更稳定、高效的智能体系统具有明确的指导意义。
---
- **Source**: V2EX
- **Sector**: The Lab
- **Tags**: 人工智能, LLM Agent, 认知科学, AI工程, 论文综述
- **Credibility**: unverified
- **Published**: 2026-04-15 07:33:02
- **ID**: 65069
- **URL**: https://whisperx.ai/zh/intel/65069