Вебинары, конференции, деловые совещания, презентации и прямые эфиры стали неотъемлемой частью нашего быта. Однако во многих из них используется иностранный язык. Если это английский, еще ладно. Но что, если это японский? Не каждый стрим или звонок предоставляет субтитры. Просто сидеть и делать вид, что понимаешь? Конечно, нет! Давайте поговорим о сервисах на базе ИИ для перевода видео и звонков в реальном времени.
«Яндекс.Браузер» недавно представил функцию автоматического перевода видеотрансляций в реальном времени. Пока что эта функция работает только на YouTube и поддерживается ограниченным числом каналов. Но команда активно дорабатывает этот инструмент. На данный момент, осенью 2023 года, эта опция доступна только в десктопной версии «Яндекс.Браузера».
Теперь просмотр прямых эфиров на иностранных языках становится более продуктивным, так как можно понимать суть обсуждения, даже не зная языка.
Перевод стримов через Яндекс.Браузер (бета-версия)
На данный момент, осень 2023 года, новый инструмент от Яндекса еще проходит бета-тестирование.
Доступно в Яндекс.Браузере начиная с версии 22.7. Совместимо с ОС: Windows, macOS и Linux.
Похоже, Яндекс сейчас активно собирает обратную связь для доработки сервиса. Хотя функция была запущена год назад, она все еще в стадии бета.
Как это устроено?
Технология основана на нейросети, которую Яндекс использовал ранее для автоматического перевода видео. Эта функция была представлена в 2021 году.
Перевод видео в реальном времени не является новшеством. Однако для стримов пришлось разработать многие алгоритмы с нуля. В отличие от готового видео, где контекст известен заранее, стримы требуют более сложной обработки. Для этого используются четыре нейросети: одна обрабатывает аудио и переводит его в текст в реальном времени, вторая определяет пол говорящего и переводит текст, третья расставляет знаки препинания и выделяет ключевые моменты, а четвертая озвучивает текст.
Ограничения
На старте Яндекс поддерживал перевод только на YouTube. Хотя были планы расширить список платформ, включая Twitch, изменений пока нет. Только YouTube и несколько каналов.
Скорее всего, не каждый стример получит возможность синхронного перевода. Яндекс, вероятно, будет фокусироваться на популярных каналах.
Доступные каналы
Перевод доступен с пяти языков: английский, испанский, итальянский, немецкий и французский. Среди доступных каналов:
- Круглосуточные стримы: NASA, English Speeches.
- Образование: English Speeches, TED, TEDx.
- Космос: NASA, SpaceX.
- Игровые новости: IGN, TheGameAwards.
- Технологии: Apple, CNET Highlights, Google, AMD, HONOR, Huawei Mobile, Microsoft, Microsoft 365, NVIDIA, NVIDIA Studio, POCO Global, Samsung, Xiaomi, Google Developers, TechCrunch.
- Бизнес: Business Insider, Bloomberg TV, FREENVESTING.
- Интервью со знаменитостями: Overlap.
Если ваш любимый канал отсутствует, вы можете предложить его добавление, написав на want-stream@support.yandex.ru.
Также рассмотрим несколько иностранных аналогов данного сервиса:
Felo Subtitles: Мгновенный перевод с ChatGPT
Felo Subtitles представляет собой инновационный инструмент для мгновенного перевода стримов, вебинаров, конференций и других онлайн-событий. Основная особенность — перевод в реальном времени. Стоит отметить, что Felo — японская разработка.
Этот инструмент совместим с различными платформами для видеоконференций, включая Zoom, Google Meet, Microsoft Teams и YouTube. Поддерживается более 10 языков, в том числе русский. Felo гарантирует высокую точность перевода. Однако стоит учитывать, что расширение работает только с официальными платформами, исключая альтернативные сервисы.
Felo облегчает коммуникацию на разных языках во время онлайн-мероприятий, предоставляя субтитры в реальном времени.
Инструкция по использованию
- Установите расширение для Google Chrome.
- Организуйте онлайн-встречу через Zoom, Google Meet или MS Teams.
- Активируйте Felo, и он автоматически начнет транскрибацию и перевод.
Возможности Felo
- Мгновенный перевод субтитров на YouTube;
- Двуязычные субтитры во время YouTube-трансляций
- Быстрый перевод субтитров с YouTube-видео;
- Сохранение переведенных субтитров в TXT-формате;
- Одно- или двуязычные субтитры.
Felo может одновременно работать с тремя языками, обеспечивая перевод менее чем за секунду.
Мы обеспечиваем безопасность и приватность ваших данных, отказываясь от использования автоматизированных ассистентов.
Разработчики
Skype: Новое измерение перевода
Кто бы мог подумать, что проверенное временем приложение Skype продолжит инновационное развитие? Несмотря на то что многие считали его устаревшим, сегодня Skype предлагает функцию онлайн-перевода для видеозвонков.
Эта функция поддерживает множество языков, включая английский, русский, испанский, французский, немецкий, китайский и многие другие. Благодаря технологиям искусственного интеллекта и нейросетей, Skype может переводить разговоры в реальном времени, что делает его отличным инструментом для международного общения. Теперь, даже если вы не знаете китайского языка, вы сможете свободно общаться с кем-то, кто говорит на нем.
Многие международные компании уже выразили свою благодарность за эту функцию, отмечая, что общение с зарубежными партнерами стало гораздо проще. Некоторые даже утверждают, что услуги профессиональных переводчиков теперь им не понадобятся.
Механизм работы
Skype применяет ИИ для распознавания и перевода языка в реальном времени. Известно, что приложение использует технологии распознавания речи и анализа естественного языка. Это позволяет Skype мгновенно определять, интерпретировать и переводить исходный аудиосигнал на другой язык.
Как применять
Для активации функции перевода во время звонка просто перейдите в меню «Еще» (символизируется тремя точками) и выберите «Перевести». Skype даст инструкции обоим участникам разговора.
Отличительной особенностью Skype является использование ИИ и нейросетей не только для перевода, но и для адаптации ваших ответов, делая разговор более естественным.
В скором времени (зима 2023 года) Skype планирует внедрить функцию перевода в реальном времени для групповых видеозвонков и телефонных звонков.
Interprefy: Переход на новый уровень многоязычного общения
Interprefy не просто еще один сервис для перевода: это платформа, которая помогает преодолевать языковые преграды в самых неожиданных ситуациях. От обычных конференций и виртуальных саммитов до уникальных событий, таких как миссии к Международной космической станции или экспедиции в Арктику.
Сервис предлагает как письменный, так и устный перевод в реальном времени для различных онлайн-мероприятий. Он интегрирован с популярными платформами, такими как Zoom, Webex и MS Teams. Кроме того, Interprefy предоставляет профессиональных переводчиков для различных мероприятий и создает субтитры для кино.
К концу 2023 года платформа поддерживает перевод с 45 языков на 74, и этот список планируется расширить.
Основные характеристики
- Безопасность. Сервис соответствует стандарту ISO 27001, гарантируя безопасность передачи данных.
- Мгновенные субтитры. Высококачественные субтитры, создаваемые в реальном времени.
- Перевод на лету. Используя искусственный интеллект, участники мероприятия могут следить за обсуждением на выбранном языке.
- Универсальность. Благодаря различным плагинам и интеграциям, Interprefy может быть интегрирован с любой платформой. Поддерживаются мобильные, веб- и десктоп-версии.
- Человеческий фактор. Возможность получения качественного перевода от профессиональных переводчиков.
- Широкая интеграция. Поддержка более 60 платформ для видеоконференций и звонков.
Дополнительные преимущества
- Запись и редактирование. Возможность записи, редактирования и расшифровки любой трансляции.
- Передовые технологии. Использование лучших нейросетей и языковых моделей с ИИ для оптимального перевода.
- Эксперты в области перевода. По запросу клиентам предоставляются профессиональные переводчики.
Stenomatic: Автоматизированный перевод в реальном времени
Stenomatic представляет собой высокоэффективный инструмент для мгновенного устного перевода. Он идеально подходит для перевода видеозвонков, онлайн-конференций и прямых трансляций.
Главное отличие Stenomatic заключается в его автоматизации. После первоначальной настройки сервис обеспечивает непрерывный перевод без необходимости дополнительных действий со стороны пользователя.
Основные преимущества
- Быстрая настройка. Интеграция и конфигурация инструмента занимают всего несколько минут.
- Передовые технологии. Использование искусственного интеллекта, нейронных сетей и методов машинного обучения для обеспечения высококачественного перевода.
- Простота доступа. Перевод и транскрипция речи доступны по удобной ссылке, которую можно легко открыть на любом устройстве, включая мобильные.
- Универсальность. Stenomatic совместим с различными платформами видеоконференций, стриминговыми сервисами и другими приложениями для видеотрансляций.
- Широкий выбор языков. Поддержка более 70 языков, включая русский.