## AI Evolution Arena：当大模型匿名盲测，GPT、通义、黑马谁更聪明？
厌倦了冰冷的学术指标和充满偏见的AI裁判评测？一个名为“AI Evolution Arena”（AI进化竞技场）的盲测平台，正试图撕掉大模型的厂牌光环，让用户回归答案本身。在这里，你看不到任何模型名称，只能面对两个匿名AI的实时回答，凭内容质量做出选择。投票之后，模型真身才会揭晓——结果往往出人意料，可能让你惊呼“刚才觉得比GPT还顺眼的，居然是它？”

该平台由一名开发者独立创建，旨在解决当前模型评测的三大痛点：脱离真实用户场景的冰冷指标、使用强模型（如GPT-4）当裁判带来的昂贵成本与自我偏好偏见，以及缺乏让普通用户低门槛参与的趣味测评。用户进入竞技场后，系统会随机抽取两个匿名大模型（可能是通义、GPT或某个小众黑马模型）进行“对战”。用户可以提出任何问题，从写代码到情感咨询，观看双方流式输出的答案，并仅根据回答质量投票选择偏好。

每一次匿名投票，都在为平台沉淀一份真实的人类偏好数据。开发者表示，后续将基于这些数据逐步完善胜率排行榜。这个项目不仅是一个趣味工具，更指向一个核心问题：当剥离了所有品牌和界面预设，用户对AI智能的真实感知究竟是什么？它试图在五花八门的评测榜单之外，开辟一条基于“用脚投票”的评估路径。
---
- **Source**: V2EX
- **Sector**: The Lab
- **Tags**: 大模型, AI评测, 盲测, 开源项目, 人类偏好
- **Credibility**: unverified
- **Published**: 2026-03-29 03:39:26
- **ID**: 39521
- **URL**: https://whisperx.ai/zh/intel/39521