Google выпустила новый инновационный генератор изображений под названием Imagen 2, который, по заявлению разработчиков, отличается высоким уровнем реализма и свободен от типичных артефактов, присущих системам искусственного интеллекта. Этот инструмент доступен как часть чат-бота Bard, так и в виде отдельного сервиса ImageFX на платформе AI Test Kitchen, находящейся в стадии бета-тестирования.
Google значительно улучшила функционал Bard, внедрив в него более крупную языковую модель Gemini Pro, которая была представлена ранее, но использовалась лишь ограниченным числом пользователей. Теперь Gemini Pro доступна всем пользователям Bard на всех поддерживаемых языках и во всех регионах.
Однако до недавнего времени Bard не имел встроенного генератора изображений, что отличало его от конкурентов, таких как Bing Image Creator и Midjourney. Но с появлением Imagen 2 ситуация изменилась: эта нейросеть теперь доступна как часть Bard, так и в виде отдельного сервиса ImageFX. Для использования ImageFX необходима регистрация в программе AI Test Kitchen, где также доступен улучшенный сервис MusicFX от Google. ImageFX позволяет не только генерировать реалистичные изображения по текстовому описанию, но и редактировать их, включая изменение стиля.
В Google отметили, что изображения, созданные с помощью ImageFX, маркируются метаданными и цифровыми водяными знаками SynthID как продукт искусственного интеллекта. Это обеспечивает прозрачность происхождения созданных изображений, и если они будут использованы в поиске Google, то получат соответствующую пометку.
Вице-президент подразделения Google DeepMind, Эли Коллинз, отметил, что модель Imagen 2 предлагает изображения высочайшего качества на сегодняшний день и вносит улучшения в области преобразования текста в изображение, включая более реалистичное изображение человеческих рук и лиц и устранение отвлекающих визуальных артефактов. Разработчики также подчеркнули, что были приняты меры по предотвращению генерации неприемлемого контента платформой.