Yandex Cloud разработала новый сервис для синтеза речи под названием Brand Voice Call Center, который позволяет создавать уникальные голоса для виртуальных операторов колл-центра.
Этот сервис использует алгоритм, который обрабатывает один аудиошаблон и синтезирует сотни фраз, меняя отдельные слова в соответствии с заданным скриптом. Синтезированная речь звучит естественно, передавая все детали речи живого человека, включая эмоции, интонации и изменения громкости. Brand Voice Call Center уже доступен для коммерческого использования и может настраиваться под потребности компаний.
Для обучения сервиса Brand Voice Call Center специалисты Yandex Cloud использовали датасет с тысячами часов записей различных дикторов на русском языке из открытого доступа. С помощью трансформерной архитектуры модели обучались на современных GPU и сосредотачивались на важных частях текста, что повышает качество синтеза. Brand Voice Call Center является первым сервисом на русском языке, который может создавать уникальные голоса для виртуальных операторов колл-центра и уже используется несколькими крупными компаниями.
Brand Voice Call Center дополняет линейку продуктов Brand Voice, в которой также представлены Brand Voice Self Service и Brand Voice Premium. Brand Voice Self Service позволяет создавать синтезированный голос для любых коммуникаций с клиентами и озвучивать текстовый контент, а Brand Voice Premium позволяет создавать уникальные голоса для маркетинговых, PR-кампаний и голосовых помощников.