## 22岁开发者Kye Gomez开源OpenMythos，逆向工程Claude Mythos架构，以循环深度Transformer挑战AI堆参数范式
传闻中因过于强大而被‘封印’的Claude Mythos架构，其核心设计已被一名22岁的开发者逆向工程并开源。这个名为OpenMythos的项目，整合了公开研究和当前对Mythos架构的主流推测，实现了一种名为循环深度Transformer（RDT）的创新模型。其核心在于，通过让同一组模型权重在潜在空间中循环计算最多16次，并每次激活不同的专家路径，实现了不依赖堆叠参数层数的深度推理。已有研究证实，这种架构仅用一半的参数，就能获得与传统Transformer模型同等的效果。

将这一系列技术碎片拼凑起来的关键人物是Kye Gomez，年仅22岁，也是Swarms智能体框架的创始人。他设计的RDT架构有三个支柱：权重在循环中复用、每次循环激活不同的混合专家（MoE）子集、以及推理全程在隐藏状态向量中完成。这颠覆了过去两年AI行业通过堆叠上百层不同Transformer来增加模型容量的标准做法。RDT的MoE设计借鉴了DeepSeek-MoE的思路，采用大量细粒度路由专家加少量共享专家的组合。Gomez将其总结为：MoE提供领域知识的广度，循环提供推理的深度。

为了确保这种循环架构的稳定性，项目引入了来自UCSD和Together AI研究的新技术——LTI稳定循环注入，以防止循环过程发散。实验数据显示，一个770M参数的RDT模型在性能上追平了1.3B参数的标准Transformer。最后一块拼图是连续潜在空间推理，模型在完成全部16轮内部‘思考’后，才一次性输出最终答案，这与需要逐步生成中间标记的思维链推理截然不同，将整个复杂推理过程完全内化。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: 人工智能, 开源, 模型架构, Transformer, 逆向工程
- **Credibility**: unverified
- **Published**: 2026-04-20 14:32:56
- **ID**: 72602
- **URL**: https://whisperx.ai/zh/intel/72602