Социальная сеть «ВКонтакте» представила новую функцию в «VK Мессенджере» — возможность автоматической текстовой расшифровки видеосообщений с помощью искусственного интеллекта. Для этой функции используются три нейронные сети, каждая из которых решает отдельные задачи: распознавание звуков, формирование слов, а также определение границ предложений и расстановку знаков препинания.
Технология ASR (Automatic Speech Recognition) позволяет автоматически расшифровывать видеосообщения при помощи трех нейронных сетей. Акустическая сеть отвечает за распознавание звуков, языковая сеть соединяет эти звуки в слова, а пунктуационная сеть определяет границы предложений и ставит знаки препинания. Весь процесс происходит без участия человека.
Эта функция работает как для полученных, так и для отправленных видеосообщений. Для ее использования достаточно нажать на значок «Аа», и остальное сделает искусственный интеллект. Такой инструмент будет полезен, когда просмотр или прослушивание видеосообщения представляется неудобным. Текстовая расшифровка также помогает быстро найти нужную информацию в переписке с помощью поиска по тексту.
Новая функция уже доступна в веб-версии сервиса и некоторых Android-приложениях, таких как «ВКонтакте» и «VK Мессенджер», включая учебный профиль «Сферум». В ближайшем будущем текстовая расшифровка видеосообщений станет доступна и для iOS-приложений. В приложении для iOS также увеличена максимальная продолжительность видеосообщений до трех минут, а также появилась возможность ускорения воспроизведения видео в полтора или два раза. Были добавлены новые эксклюзивные формы видеосообщений, такие как звезда и котенок. Возможности этих новых функций появятся в Android-версии приложения позже.
Другим нововведением в обмене сообщениями являются анимированные реакции в чатах на всех платформах: лайки, сердечки, огоньки и другие реакции сопровождаются анимированными иллюстрациями.