## Anthropic 3000份文件泄露：AI安全承诺破产，RSP 3.0删除“硬刹车”条款
过去三天，Anthropic新模型相关3000份内部文件因CMS配置失误而泄露，事件持续发酵。然而，比数据泄露本身更值得警惕的信号，是这家估值3800亿美元的AI公司在事发前一个月对其核心安全承诺的实质性修改。其最新版《负责任扩展政策》（RSP 3.0）中，曾让行业瞩目的“若风险不可控，就暂停训练”的硬性约束条款已被悄然删除。这并非一次简单的技术调整，而是AI行业在激烈竞争与安全承诺之间深层困境的直接体现。

RSP 3.0的修改标志着策略的根本转向。2023年，Anthropic的RSP以“硬刹车”逻辑著称，公开承诺将安全置于商业进度之上。而2026年2月发布的新政策，用“前沿安全路线图、风险报告、外部审查”等定期披露机制，取代了预设危险阈值并立即暂停的刚性规则。官方解释是技术边界模糊，无法预设红线。但首席科学家Jared Kaplan的言论揭示了更现实的驱动力：“如果竞争对手飞速前进，我们单方面承诺暂停训练没有意义。”这本质上是囚徒困境下的生存判断，从“做不到就不许动”转向了“边做边说”。

与此同时，Anthropic正面临来自国家意志的底线考验。该公司曾公开承诺拒绝参与全自主武器和国内大规模监控。然而，2026年2月24日，美国国防部长皮特·赫格塞斯向Anthropic CEO达里奥·阿莫迪下达了最后通牒，要求解除Claude模型的所有军事用途限制，否则将面临惩罚。可能的后果包括五角大楼动用《国防生产法》强制接管模型，或被列为供应链风险企业。这使Anthropic陷入两难：是坚守最初的安全红线，还是在国家压力下妥协。内部安全承诺的软化与外部军事压力的增强，共同构成了这家AI安全标杆企业当前的核心危机。
---
- **Source**: 钛媒体
- **Sector**: The Lab
- **Tags**: AI安全, 数据泄露, 负责任AI, 军事AI, 行业竞争
- **Credibility**: unverified
- **Published**: 2026-03-28 08:39:13
- **ID**: 38869
- **URL**: https://whisperx.ai/zh/intel/38869