## 字节暂停豆包AI眼镜，阿里千问押注眼镜：大模型巨头争夺Agent“物理开机键”
当AI竞争从生成对话转向执行任务，一个根本问题浮出水面：谁将控制Agent在真实世界中的“物理开机键”？字节跳动内部已决定暂停其豆包AI眼镜项目，而阿里巴巴的千问则继续押注眼镜形态。这并非简单的硬件取舍，而是两家巨头对同一核心问题的不同工程解答：究竟由谁来充当AI执行链路的物理接口。这场争夺的背后，是Token消耗暴涨下，对用户入口控制权的重新定义。

据《晚点LatePost》报道，火山引擎豆包大模型的日均调用量已超120万亿Token，半年增长4倍。然而，OpenClaw等Agent应用的爆火，将竞争焦点从生成式问答转向了任务执行。执行需要物理锚点。豆包选择以“操作系统级合作”模式切入AI手机赛道，通过与手机厂商深度合作，获得识别屏幕、模拟操作的核心权限。千问则坚持眼镜路径，其AI眼镜已上线话费充值、扫码骑车等“AI办事”能力，试图让AI直接在真实世界闭环。两条路径，指向同一个目标：更靠近用户身体的触发入口。

这场入口争夺，源于AI成本结构的根本性改写。激烈的价格战已将Token单价压至三年前高点的约三百分之一，但Agent应用让单次任务的Token消耗呈数十倍起跳。据腾讯科技报道，有技术团队启用Claude Code后，首月支出高达2400美元，经八周优化才勉强控制。不可预测的Token支出管理本身已成为一项专门技能。在此逻辑下，谁掌握了Agent的触发入口，谁就掌握了成本与用户体验的关键阀门。硬件，正成为大模型公司从Token经济学中延伸出的新战场。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: AI硬件, 大模型, Agent, 字节跳动, 阿里巴巴
- **Credibility**: unverified
- **Published**: 2026-04-21 13:32:59
- **ID**: 74332
- **URL**: https://whisperx.ai/en/intel/74332