Компания OpenAI представила новый голосовой интерфейс Advanced Voice Mode в веб-версии ChatGPT. Об этом сообщил директор по продуктам компании Кевин Вейл (Kevin Weil) на своей странице в социальной сети X. Продвинутая голосовая функция пока остается доступной только для пользователей платной версии ChatGPT.
Веб-версия ChatGPT теперь поддерживает голосовой интерфейс Advanced Voice Mode, который стал доступен для подписчиков Plus, Enterprise, Teams и Edu. Ранее, с момента запуска функции в сентябре, она была доступна исключительно в мобильных приложениях ChatGPT для iOS и Android.
Advanced Voice Mode использует аудиовозможности ИИ-модели GPT-4o, обеспечивая естественное общение в реальном времени. Чат-бот понимает невербальные сигналы, такие как скорость речи, и может реагировать с «эмоциями», делая взаимодействие более живым и интуитивным.
Чтобы начать голосовой чат в веб-версии, нужно нажать на значок «Голос» в правом нижнем углу окна ввода запроса. После этого необходимо предоставить браузеру доступ к микрофону. В процессе общения пользователь увидит экран с синим шаром в центре, который сопровождает голосовой режим.
Функция предоставляет выбор из девяти различных голосов для ChatGPT, каждый с уникальным тоном и характером. Например, можно выбрать «лёгкий и универсальный голос Arbor» или «уверенный и оптимистичный голос Ember».
Как отметил Кевин Вейл, OpenAI планирует в ближайшие недели сделать голосовое взаимодействие с ChatGPT доступным и для бесплатных пользователей. При этом подписчики Plus и Team могут пользоваться Advanced Voice Mode только ограниченное количество времени в день.
Система заранее предупредит пользователя, когда до окончания дневного лимита на голосовое взаимодействие с ИИ-ботом останется 15 минут. Для бесплатных пользователей будет предоставлен кратковременный доступ, чтобы они могли познакомиться с функционалом.