## Claude Opus 4.6 性能断崖式下跌：全球排名从第2暴跌至第10，用户信任危机爆发
Anthropic的旗舰模型Claude Opus 4.6正面临一场严重的信任危机。最新的BridgeBench评测报告给出了冰冷的数据：该模型的全球排名从第2名垂直坠落至第10名。其准确率从83.3%断崖式跌至68.3%，而幻觉率则几乎翻倍，增加了98%。这一实锤证据终结了所有用户的疑问——Claude Opus 4.6确实变差了，并非用户自身的问题。AMD的AI总监也证实了Claude Code在复杂任务上已“不可用”。对于依赖该模型处理关键任务的用户而言，这种未经告知的性能降级无异于一场背叛，引发了“这怎么可能合法？”的广泛质疑。

就在全网群嘲、用户感觉上当受骗之际，Anthropic的动向却指向了另一个战场。疑似内部工具界面截图流出，揭示了名为“Claude Projects”的项目正在测试一套完整的全栈应用构建系统。泄露画面显示，该系统提供一系列预置模板，覆盖AI聊天机器人、互动小游戏、商业落地页、SaaS数据仪表盘等高频需求。其核心能力链更令人侧目：身份验证、数据库选型与搭建、前端界面生成乃至部署上线，均宣称可实现“勾选即配”或“一键搞定”。

这并非简单的“AI辅助编程”，其目标直指“AI替代编程”。当外界还在为模型评分争吵时，Anthropic似乎已悄然更换了牌桌。这一泄露的战略动向，将Claude性能下滑的争议瞬间置于一个更宏大的竞争格局中。它不再仅仅是关于一个模型变“笨”了，而是关乎一家顶级AI公司可能正在进行的底层战略重心转移，以及其对整个开发生态可能带来的颠覆性冲击。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: Claude, AI模型, 性能下降, BridgeBench, 全栈开发
- **Credibility**: unverified
- **Published**: 2026-04-13 12:33:02
- **ID**: 61939
- **URL**: https://whisperx.ai/en/intel/61939