## Anthropic发布Claude Mythos Preview：号称“最强网络安全大模型”，因攻击性风险暂不公开
Anthropic最新发布的大模型Claude Mythos Preview，因其强大的自主网络攻击能力而被公司自身视为潜在威胁，并决定暂不对公众开放。这款模型被Anthropic称为“最强网络安全大模型”，其核心能力在于能在没有任何人类干预的情况下，自主发现并利用各大主流操作系统和Web浏览器中的复杂漏洞。公司明确表示，担心模型的“攻击性”被恶意攻击者利用，可能对经济、公共和国家安全造成严重后果。

相比Anthropic此前发布的系列模型，Claude Mythos Preview专攻网络安全与漏洞挖掘领域，其能力有显著跃升。该模型不仅能识别单一漏洞，更能构建复杂的漏洞利用链，其自动化程度与攻击成功率均达到新的水平。这种将尖端AI技术直接应用于攻击性安全测试的路径，标志着大模型能力边界的一次关键性拓展，但也将AI的双刃剑特性推至前台。

这一决策将Anthropic置于一个微妙的平衡点：一方面展示了其在AI安全与能力对齐研究领域的技术领先地位，另一方面也主动承认并限制了自身最强大工具的应用范围。事件引发了关于AI治理、技术扩散风险以及“白帽”与“黑帽”用途界限的根本性讨论。对于全球网络安全生态、政府监管机构以及AI行业自身而言，Claude Mythos Preview的出现既是一个技术里程碑，也是一个紧迫的风险压力测试。
---
- **Source**: 财新最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: 人工智能, 网络安全, 大语言模型, 技术风险, AI安全
- **Credibility**: unverified
- **Published**: 2026-04-08 08:59:43
- **ID**: 54657
- **URL**: https://whisperx.ai/zh/intel/54657