## Контур внедряет гибридную LLM-архитектуру SALM для распознавания спонтанной русской речи
Команда речевых технологий «Контура» адаптирует передовую гибридную архитектуру SALM для распознавания спонтанной русскоязычной речи в своих продуктах. В основе подхода — модель Canary-Qwen-2.5B от Nvidia, которая установила рекорд качества в бенчмарке HuggingFace OpenASR. Эта архитектура совмещает речевой энкодер с большой языковой моделью (LLM), используя последнюю в качестве интеллектуального декодера. Для «Контура», чья система ежедневно обрабатывает миллионы звонков и записей видеоконференций, внедрение таких технологий — ключевой шаг в борьбе за десятые доли процента в метрике WER (Word Error Rate).

Разработчики компании, включая автора статьи, разработчика машинного обучения Колю, отмечают, что SALM-подход особенно перспективен для сложных случаев, характерных для спонтанной речи в бизнес-коммуникациях. Традиционные системы ASR часто сталкиваются с проблемами из-за неформальной лексики, акцентов, шумов и перебиваний. Использование LLM в качестве декодера позволяет лучше понимать контекст и семантику, что критически важно для последующей аналитики качества коммуникаций с клиентами и автоматического создания протоколов встреч.

Внедрение подобных SOTA-решений сигнализирует о растущем технологическом давлении в индустрии речевых технологий, где открытые модели от крупных игроков, таких как Nvidia, задают новый уровень качества. Для «Контура» успешная адаптация Canary-Qwen под русский язык и специфику бизнес-среды может стать значительным конкурентным преимуществом, повышая точность и полезность их продуктов для тысяч корпоративных пользователей. Однако работа с гибридными архитектурами требует значительных вычислительных ресурсов и экспертизы, что создает высокий барьер для входа и консолидирует рынок вокруг технологических лидеров.
---
- **Source**: Habr
- **Sector**: The Lab
- **Tags**: ASR, LLM, распознавание речи, SALM, машинное обучение
- **Credibility**: unverified
- **Published**: 2026-04-21 12:52:57
- **ID**: 74277
- **URL**: https://whisperx.ai/en/intel/74277