## 谷歌Gemma 4开源模型发布90分钟即遭破解，越狱版可伪造支票、寻找盗版
谷歌新一代开源模型Gemma 4的发布，迅速演变成一场安全危机。模型发布仅90分钟后，名为“gemma-4-E2B-it-heretic-ara”的无审查越狱版本便在网络上流传，紧随其后，参数更大、能力更强的Gemma-4-31B版本也被移除所有安全限制并公开。这些被“越狱”的模型绕过了谷歌设置的安全护栏，能够响应包括伪造支票、寻找盗版电影在内的各类违法或不道德指令，引发了公众对不受控AI工具广泛传播的深切担忧。

此次破解由开发者p-e-w、研究者Heretic以及用户dealignai等人迅速完成，相关文件已在Hugging Face等平台公开。技术核心在于移除了模型在发布前进行的“人类偏好对齐”设置。这一过程本意是将模型的“拒绝”行为编码为神经网络中的特定向量，使其在面对有害指令时直接拒绝。然而，破解者通过特殊手段移除了这一安全限制，使得模型“有求必应”。其中，参数量较小的Gemma-4-E2B模型对硬件要求低，而具备更强推理和多模态能力的Gemma-4-31B模型，理论上仅需一台32GB内存的Mac即可运行，其被破解后可能带来的风险也显著更高。

事件暴露了当前开源大模型安全机制的脆弱性。谷歌等巨头为开源模型设立的“安全阀”和“防火墙”被如此轻易地攻破，迫使行业重新审视模型发布与安全管控之间的平衡。越狱版模型的广泛存在，不仅降低了恶意使用的技术门槛，也可能催生新型网络犯罪工具，对数字安全、内容版权乃至金融秩序构成潜在威胁。这起事件标志着AI安全已从理论讨论进入紧迫的实战考验阶段。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: 人工智能安全, 模型越狱, 开源风险, 谷歌Gemma, AI伦理
- **Credibility**: unverified
- **Published**: 2026-04-10 00:29:44
- **ID**: 57798
- **URL**: https://whisperx.ai/zh/intel/57798