Digital

08.04.2024 18:51:29
Digital

SberDevices создала ИИ-модель для распознавания речи и эмоций

Команды разработки сервисов GigaChat и SaluteSpeech в SberDevicesпредставили нейросеть GigaAM (Giga Acoustic Model) —семейство акустических моделей для русского языка, которые позволяютраспознавать речь и эмоции.

В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.

Технология GigaAM предобучена на разнообразной русской речи. Она можетподойти для адаптации под различные задачи работы со звуком, включаяраспознавание речи и эмоций, определение диктора и другие. GigaAM-CTC —открытая модель для распознавания русскоязычных запросов. А GigaAM-Emo —акустическая модель для определения эмоций. 

«Улучшенные версии этих моделей бизнесу доступны на нашей платформе длясинтеза и распознавания речи SaluteSpeech API, а физические лица также могутими воспользоваться в приложении SaluteSpeech App», — рассказали вкомпании. 

Ранее сообщалось, что SberDevices начала применять ИИ в рекламныхформатах. Сервис внедряет нейросети в виджеты, смарт-баннеры и Out-SteamVideo.

Автор: Pupkin

Источник: ria novosti