## 法国巴斯德研究所AI模型预测239万抗噬菌体蛋白，揭示细菌免疫系统远超想象的规模与多样性
法国巴斯德研究所的研究团队利用深度学习，成功绘制出一幅规模远超预期的细菌抗病毒免疫图谱。他们开发的模型在超过32,000个细菌基因组中，预测出约239万个具有抗噬菌体功能的蛋白质，其中超过85%的预测蛋白家族此前从未与免疫功能相关联。这一发现表明，细菌用以对抗病毒（噬菌体）的防御系统，其复杂性和多样性可能远超科学界当前的认知。

在微观世界的“军备竞赛”中，噬菌体数量约为细菌的10倍，而细菌则进化出超过250种已知的抗噬菌体系统。然而，受限于传统实验方法，大量潜在机制仍隐藏在基因组中未被发掘。研究团队注意到，已知系统在蛋白质序列和基因组组织上存在共性模式，例如在“防御岛”区域的富集。基于此，他们开发并微调了三种互补的深度学习模型：ALBERT_DF依赖局部基因组语境；ESM_DF解析氨基酸序列；GeneCLR_DF则整合了序列与基因组信息。在基准测试中，GeneCLR_DF表现最优，达到了99%的精确率和92%的召回率。

利用这一高精度模型进行泛基因组尺度预测，结果显示，一个典型细菌基因组中约有1.5%的基因参与抗病毒防御。模型不仅预测出海量蛋白，还基于基因共现关系定义了约23,000个操纵子家族，其中绝大多数此前与抗病毒防御毫无关联。这项研究系统性揭示了细菌免疫的未知疆域，为理解微生物间的攻防动态、乃至开发新型抗菌或抗病毒策略，提供了全新的数据基础和探索方向。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: 深度学习, 人工智能, 微生物学, 噬菌体, 基因组学
- **Credibility**: unverified
- **Published**: 2026-04-13 10:33:19
- **ID**: 61746
- **URL**: https://whisperx.ai/zh/intel/61746