## DeepSeek V4测评出炉：代码能力冲进开源前三，百万上下文+低价搅动大模型格局
DeepSeek V4预览版开源上线后，第三方测评结果密集释出，代码能力成为最亮眼的核心标签。Arena.ai平台将V4 Pro（思考模式）定性为“相较DeepSeek V3.2的重大飞跃”，在其代码竞技场中位列开源模型第3位、综合排名第14位；Vals AI则更为直接，称V4在其Vibe Code Benchmark中“压倒性”登顶开源权重模型榜首，同时超越Gemini 3.1 Pro等闭源前沿模型，较上代V3.2实现约10倍性能跃升。开源阵营在代码任务上首次正面挑战闭os源顶级模型的格局已经成型。

两款模型参数规模差异显著：V4-Pro总参数1.6万亿（激活参数49B），V4-Flash总参数2840亿（激活参数13B），均支持100万token超长上下文窗口，采用MIT开源协议。定价策略进一步放大竞争力——V4-Flash输出价格每百万token仅0.28美元，较Claude Opus 4.7低逾99%；V4-Pro输出价格3.48美元，处于“大模型前沿”区间低位。多位开发者已在社交平台称其性价比“打穿”行业底线，中小团队与独立开发者的使用门槛被显著压低。

热度之下，DeepSeek自身保持克制。官方材料显示，V4在知识与推理能力上接近闭源系统，但仍有约3至6个月差距；同时提示“受限于高端算力”，Pro服务吞吐有限，后续价格存在下调预期。竞争格局正在重塑：高端算力瓶颈、闭源模型的价格护城河、开源社区的快速迭代，三重变量在V4发布后进入新一轮博弈。
---
- **Source**: 华尔街见闻 (RSSHub)
- **Sector**: The Lab
- **Tags**: DeepSeek V4, 大模型开源, 代码能力, 基准测评, 人工智能
- **Credibility**: unverified
- **Published**: 2026-04-24 09:27:48
- **ID**: 76754
- **URL**: https://whisperx.ai/en/intel/76754