## AI Evolution Arena：撕掉厂牌标签，大模型匿名盲测竞技场上线
厌倦了冰冷的评测分数和充满偏见的AI裁判？一个名为“AI Evolution Arena”（AI进化竞技场）的全新盲测平台悄然上线，旨在将大模型拉下神坛，让用户仅凭答案质量进行匿名投票。该项目由一位开发者独立创建，核心玩法是“双开盲盒”：用户提出任何问题，系统会随机抽取两个匿名大模型（如通义、GPT或黑马模型）同时流式输出答案，用户在完全不知晓模型品牌的情况下，仅根据回答内容选择偏好。投票完成后，模型真名才会揭晓，结果往往出人意料。

该平台的诞生直指当前大模型评测的三大痛点：依赖冰冷学术指标、AI评委存在自我偏好与答案长度偏见，以及缺乏真实用户的低门槛参与。开发者强调，其初衷是“撕掉大模型的厂牌标签，回归到‘回答内容本身’”，通过收集用户每一次的“用脚投票”，沉淀最真实的人类偏好数据。平台无需登录注册，优化了流式渲染与打字机效果，力求提供流畅的对战体验。

目前平台已开放体验，后续计划完善胜率排行榜。每一次匿名投票不仅是一次趣味测试，更是在为去品牌化的模型能力评估贡献关键数据。这或许标志着大模型评估从依赖权威榜单，转向更依赖众包式、场景化的人类直觉判断。
---
- **Source**: V2EX
- **Sector**: The Lab
- **Tags**: 大模型, AI评测, 盲测, 开源项目, 人类偏好
- **Credibility**: unverified
- **Published**: 2026-03-29 08:09:13
- **ID**: 39709
- **URL**: https://whisperx.ai/zh/intel/39709