## Chance AI：字节、OPPO、一加背景创始人，以“视觉智能体”颠覆AI交互，让AI看懂世界
主流AI交互仍困在输入框里，但人类认知世界的起点是“看见”，而非“提问”。一家名为Chance AI的年轻公司正试图打破这一范式，其推出的“Visual Agent”（视觉智能体）旨在让AI从“回答问题”的工具，进化为“看懂世界”的系统。这家成立于2025年的公司，其核心产品以摄像头为交互入口，用户拍摄眼前事物，AI即可进行实时视觉推理，将交互效率提升至更自然的维度。

Chance AI的创始人曾熙，其背景横跨学术与顶尖科技公司。他在巴塞罗那大学研究认知科学与艺术，后进入消费电子行业，先后在OnePlus、OPPO负责产品与设计，随后加入字节跳动Flow部门，参与豆包等AI产品的从0到1探索。这段经历让他洞察到一个结构性问题：大语言模型擅长处理语言，但在支持人类基于视觉的现实世界判断方面，能力严重不足。2025年离开字节后，他迅速创立公司，并于9月上线首款产品。目前，用户已自发将其用于解读艺术品、分析穿搭、识别卡牌潮玩、检测皮肤状态乃至拍菜单识植物等广泛场景。

技术层面，其Visual Agent在衡量多模态模型视觉推理能力的权威基准MMMU-Pro评测中取得了86.07分，位列世界第一。今年3月，Chance AI更成为Art Central官方AI合作伙伴，标志着AI首次深度介入国际大型艺术展会的“观看过程”。支撑这一体验的是其新推出的“Live模式”——一套实时视觉交互系统。与行业已有的简单识别不同，该系统能将知识检索、内容对比、上下文理解、多能力调度整合为一个具备实时响应能力的完整智能体。这一突破，正将软硬一体的AI能力写入产品底层，试图重新定义人机交互的边界。
---
- **Source**: 36氪
- **Sector**: The Lab
- **Tags**: 人工智能, 计算机视觉, 人机交互, 初创公司, 多模态AI
- **Credibility**: unverified
- **Published**: 2026-04-10 01:29:33
- **ID**: 57877
- **URL**: https://whisperx.ai/zh/intel/57877