## 阿里Qwen前技术负责人林俊旸离职首曝：曾踩中“致命”技术误区，推翻堆长推理链路线
当整个行业都在追逐更长的推理链时，阿里千问（Qwen）的前技术负责人林俊旸在离职后首次公开复盘，直言团队曾踩中一个“致命”的技术误区。他发布的长文《从“推理”思维到“智能体思维”》不仅是一次个人反思，更是对当前AI主流发展路径的一次系统性质疑。林俊旸的核心论断是：大模型的未来，并非无限拉长推理链，而应转向一种为行动而思考、在环境中思考、并通过反馈闭环持续修正的“智能体思维”。

文中罕见披露了Qwen3训练过程中的一次关键尝试。2025年初，团队试图将“思考”（thinking）模式与“指令”（Instruct）模式合并到同一个模型中，以期让模型能根据问题复杂度自动分配计算资源。Qwen3正是这一理念下引入“混合思维模式”的大胆尝试。然而，结果并不理想。合并后，思考模式变得啰嗦犹豫，指令模式也失去了原有的干脆、稳定和低成本优势。林俊旸指出，问题的根源在于数据：两种模式的数据分布与行为目标本就不同，缺乏精细化融合与校准，最终导致“两头都受损”，而非取长补短。

这一失败促使林俊旸在行业集体涌入“推理模型时代”时，开始追问一个更根本的问题：大模型最好的思考方式究竟是什么？他认为，单纯延长推理链并非终点。真正有效的方向是让模型“为了行动而思考”。在这一判断上，Anthropic的Claude系列给了他重要启发。林俊旸注意到，Anthropic始终强调“思考应该由目标工作负载来塑造”，例如Claude 3.7被定义为带可控预算的混合推理模型，而Claude 4则允许推理过程与工具使用交错进行。这标志着顶尖团队的技术路线已出现关键分野。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: 人工智能, 大语言模型, 技术路线, 阿里巴巴, 人才流动
- **Credibility**: unverified
- **Published**: 2026-03-27 04:39:56
- **ID**: 36796
- **URL**: https://whisperx.ai/zh/intel/36796