## 谷歌Gemini API定价策略突变：新增弹性与批量档位，算力成本博弈升级
谷歌对其核心AI产品Gemini的API定价体系进行了关键性调整，标志着AI服务正从简单的调用计费转向更精细、更具策略性的算力资源博弈。此次更新并非简单的价格变动，而是引入了基于推理使用场景和资源供需关系的分档计费模式，直接触及开发者和企业最敏感的成本神经。

新方案的核心是新增五个服务档位：标准（Standard）、弹性（Flex）、优先（Priority）、批量（Batch）和缓存（Caching）。其中最具信号意义的是“弹性推理”档位，它通过利用谷歌数据中心的非高峰闲置算力，为用户提供标准价格五折的优惠，目标延迟为1至15分钟，但不提供延迟保证。这实质上是一种“错峰用电”模式，将算力资源商品化并动态定价。同时，“批量”API档位也提供五折费率，但延迟可长达24小时，瞄准了对时效性不敏感的大规模离线处理任务。

这一策略调整将压力直接传导至AI应用开发层。开发者必须在成本、延迟和稳定性之间做出更复杂的权衡。弹性档位虽便宜，但其不确定的延迟意味着它不适合实时交互应用，可能重塑部分AI产品的服务架构。此举也反映出谷歌在应对日益增长的推理成本压力，试图通过价格杠杆更高效地调度其庞大的算力池，并与其他云AI服务商展开差异化竞争。对于依赖Gemini API的企业而言，成本模型和运维策略需要重新评估。
---
- **Source**: 36氪
- **Sector**: The Lab
- **Tags**: 人工智能, 云计算, API定价, 算力成本, 谷歌Gemini
- **Credibility**: unverified
- **Published**: 2026-04-03 06:59:18
- **ID**: 48596
- **URL**: https://whisperx.ai/en/intel/48596