Компания Meta* представила инновационную модель перевода под названием SeamlessM4T. Эта первая в своем роде универсальная мультимодальная и многоязычная система, основанная на искусственном интеллекте, которая позволяет пользователям общаться, преодолевая языковые барьеры. В настоящее время исследователи и разработчики могут использовать её на условиях соответствующей лицензии. Кроме того, были представлены метаданные модели SeamlessAlign, представляющей собой обширный набор данных для мультимодального перевода, включающий в себя 270 000 часов записей произнесенной речи.
SeamlessM4T является результатом многолетних исследований ученых со всего мира, нацеленных на создание универсальной технологии перевода. По сравнению с методами, которые оперируют отдельными моделями, SeamlessM4T использует единый системный подход, что снижает количество ошибок и задержек, повышая эффективность и качество процесса перевода.
В прошлом году команда разработчиков Meta* представила модель No Language Left Behind (NLLB), способную переводить тексты на 200 языков. Эта модель была интегрирована в Википедию как один из поставщиков услуг перевода. Ранее был представлен также универсальный переводчик речи, который обеспечивает прямое преобразование речи на южноминьском языке (диалект китайского). Компания также разработала проект Massively Multilingual Speech, который способен распознавать, идентифицировать и синтезировать речь на более чем 1100 языках.
SeamlessM4T объединяет результаты всех предыдущих проектов, создавая многоязычную и мультимодальную модель перевода на основе единой системы, использующей широкий спектр данных из различных устных источников. Возможности SeamlessM4T включают:
- Распознавание речи для почти 100 языков;
- Текстовый перевод для почти 100 языков;
- Преобразование речи в текст и обратно для почти 100 языков;
- Преобразование текста в речь и обратно для почти 100 языков, включая английский и русский.
SeamlessM4T представляет следующий этап в стремлении ученых создать искусственно интеллектуальную технологию, способную связывать людей, говорящих на разных языках. Подробнее о модели можно узнать в блоге Meta* AI.