## Anthropic神话破功：AISLE实测显示，便宜模型DeepSeek R1同样能挖出17年核心漏洞
Anthropic上周发布的Mythos Preview模型，因其自主发现并利用多个长达数十年的开源软件漏洞，一度在安全圈引发“震惊”与“人类完蛋”的讨论。然而，一家名为AISLE的AI安全初创公司，用一次尖锐的实测揭示了神话的另一面：Mythos展示的“零日漏洞”，并非其独家能力，一批成本低廉得多的小模型同样能做到。

AISLE将Mythos用来“秀肌肉”的核心漏洞——一个藏匿17年的FreeBSD远程代码执行漏洞——交给8个不同模型进行测试。结果，所有模型均成功找到该漏洞，其中包括一个参数小、成本仅约0.11美元/百万token的模型，其价格仅为Mythos的几十分之一。其中，深度求索的DeepSeek R1表现最为精确，其分析结果与已发布的漏洞利用文档中的实际栈布局相符。对于另一个更复杂、涉及较深数学原理的27年OpenBSD TCP协议缺陷，GPT-OSS-120b模型一次就复现了整个攻击路径，并提出了与Anthropic实际修复方案基本一致的补丁。Kimi K2模型也表现出色。

更具讽刺意味的对比出现在基础测试中。AISLE设置了一道相当于安全行业“小学毕业考题”的简单题目：一段看似有漏洞的代码，实则因数据被中途丢弃而安全。测试结果显示，最昂贵的模型答错了这道最简单的题。这一系列测试不仅挑战了市场对顶级模型能力的盲目崇拜，也表明在特定安全审计任务上，成本与性能并非绝对正相关，为行业的技术选型与风险评估提供了新的关键视角。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: AI安全, 漏洞挖掘, 大模型评测, Anthropic, DeepSeek
- **Credibility**: unverified
- **Published**: 2026-04-16 00:33:21
- **ID**: 66498
- **URL**: https://whisperx.ai/en/intel/66498