## 蔡浩宇AI公司Anuttacon低调发布LPM 1.0：首个实时全双工视频角色表演大模型
蔡浩宇创办的AI公司Anuttacon，通过其技术团队成员AilingZeng在X平台悄然发布了首个视频大模型LPM 1.0。这款模型被定位为“面向单人全双工音视频对话的角色表演大模型”，直接挑战当前视频生成领域在表现力、实时推理与长时身份稳定性上难以兼顾的核心痛点。其核心突破在于实现了实时视频生成、无限时长身份一致生成与细腻拟人化表演，标志着AI在创造具有持续、稳定人格的虚拟角色方面迈出了关键一步。

LPM 1.0是一个多模态输入模型，仅需一张图片、可选参考图片、音频及文本，即可生成角色表演视频。其技术关键在于构建了以人为中心的多模态数据集，并训练了170亿参数的Base LPM，再将其蒸馏为低延迟的流式Online LPM。模型通过全局外观参考、多视角身体图像与面部表情参考素材等多维度要素，精准维持角色身份，有效规避了牙齿、表情纹路等细节的错误生成。它支持写实、2D动漫、3D游戏乃至非类人生物等多种风格，无需额外微调。

该模型最引人注目的特性是支持全双工实时互动，如同真实通话或面对面聊天，双方可同时说话、倾听并随时打断。在一段长达45分钟的演示对话中，模型展现了回应前的停顿、身体节奏、目光转移等真实细节。团队还打造了首个交互角色表演基准LPM-Bench，并在评估中取得SOTA结果，旨在成为对话代理、直播角色、游戏NPC的通用视觉引擎。这一定位使其在虚拟直播、互动娱乐及下一代人机交互界面领域具备了明确的商业化潜力与行业影响力。
---
- **Source**: 36氪最新 (RSSHub)
- **Sector**: The Lab
- **Tags**: AI大模型, 视频生成, 虚拟角色, 实时交互, 蔡浩宇
- **Credibility**: unverified
- **Published**: 2026-04-13 03:33:16
- **ID**: 61194
- **URL**: https://whisperx.ai/en/intel/61194