## 英伟达开源CaP-X：机器人学会“现场写代码”，具身智能迎来“驾驭”时刻
英伟达刚刚为机器人领域投下了一枚重磅炸弹——开源了全新的机器人操控框架CaP-X。这个框架的核心突破在于，机器人能够通过摄像头实时理解环境，并当场生成一段Python代码来控制自己完成任务。更关键的是，一旦某段代码被验证有效，它会被自动存入一个通用的“技能库”，供不同形态和本体的机器人系统调用，实现了技能的跨平台复用。这标志着机器人控制正从依赖工程师逐行编写、调试的“人工脚手架”模式，向“代码即策略”的自动化范式跃迁。

CaP-X的颠覆性在于其独特的“逻辑取胜”路径。它并非一个端到端的黑盒模型，而是将具身大模型（如VLA）当作API来调用，充当一个“大脑”，来协调和驾驭各种负责感知与控制的“小脑”。在实测中，基于该框架构建的CaP-Agent0，在7项核心任务中有4项的成功率追平甚至超过了人类专家手写的程序。即便面对OpenVLA、Pi系列等基于海量数据预训练的端到端模型，CaP-X也展现出了旗鼓相当乃至更优的性能。英伟达机器人研究负责人Jim Fan断言，这宣告了“智能体机器人”时代的到来。

这一进展被业界视为机器人领域的“Harness”时刻。如果说大模型的Harness是把引擎装进车里，那么CaP-X则是让引擎学会了根据实时路况自己编写驱动程序，并持续自我升级。它巧妙地融合了传统控制方法的可解释性与数据驱动模型的泛化潜力，试图解决VLA模型“黑盒”、难调试、需重复训练的痛点。加州大学伯克利分校教授Ken Goldberg对此评论称，对“代码即策略”的前景感到非常兴奋。这一框架的发布，可能从根本上改变机器人的开发、部署与进化方式，推动具身智能从实验室演示走向更广泛、更自主的现实应用。
---
- **Source**: 华尔街见闻 (RSSHub)
- **Sector**: The Lab
- **Tags**: 人工智能, 机器人, 开源框架, 具身智能, 代码生成
- **Credibility**: unverified
- **Published**: 2026-04-02 11:30:13
- **ID**: 47234
- **URL**: https://whisperx.ai/zh/intel/47234