## Intel и SambaNova бросают вызов монополии GPU: гетерогенный инференс для эпохи ИИ-агентов
В апреле 2026 года Intel и ИИ-платформа SambaNova представили архитектурный blueprint, который ставит под вопрос экономику монолитного подхода «GPU на всё» в инференсе больших языковых моделей. Ключевая идея — разделить три фазы работы ИИ-агентов между специализированными процессорами: prefill на GPU, decode на SambaNova SN50 RDU, агентские действия на Intel Xeon 6. Готовое решение обещают во второй половине 2026 года, и оно вписывается в стандартную стойку 30 кВт с воздушным охлаждением — без капитальной перестройки машинных залов.

Архитектурный сдвиг обусловлен изменением характера нагрузки: с массовым распространением ИИ-агентов фаза decode перестала быть побочной и превратилась в доминирующую. Традиционная модель, где GPU обрабатывает все этапы, начала просаживаться по экономике при агентских сценариях. SambaNova SN50 RDU — специализированный процессор для рекуррентных вычислений — берёт на себя decode, освобождая GPU для prefill, где видеокарты сохраняют преимущество. Intel Xeon 6 отвечает за координацию агентских действий, создавая конвейер с чётким разделением труда между тремя типами аппаратуры.

Для индустрии это сигнал о возможном пересмотре инфраструктурных стандартов. Если blueprint Intel и SambaNova получит коммерческое воплощение, дата-центры получат альтернативу дорогостоящим GPU-кластерам при работе с агентскими нагрузками. Воздушное охлаждение и стандартная стойка снижают порог входа — не требуются ни жидкостные системы, ни специализированные помещения. Вопрос остаётся за реальной производительностью и экономикой в продакшене, но сама постановка задачи указывает на растущее давление на бизнес-модель производителей GPU и поиск архитектурных ответов на новую реальность ИИ-агентов.
---
- **Source**: Habr
- **Sector**: The Lab
- **Tags**: инференс, GPU, SambaNova, ИИ-агенты, гетерогенные вычисления
- **Credibility**: unverified
- **Published**: 2026-05-10 08:01:46
- **ID**: 81472
- **URL**: https://whisperx.ai/ru/intel/81472