Наконец и отечественная компания добралась до создания аналога Midjourney . Первопроходцем стал Яндекс со своим приложением Шедеврум, который создаёт изображения по текстовому запросу. Сегодня подробно поговорим про ИИ от компании Яндекс: как он работает, как подключиться к нейросети и посмотрим примеры созданных изображений.
Что такое нейросети для генерации картинок все давно знают, поэтому не станем заострять на этом внимание. Лучше подробнее поговорим о том, как реализована нейросеть и каков её функционал.
Как скачать Шедеврум
5 апреля 2023 года компания Яндекс анонсировала beta-версию ИИ для создания картинок. В отличии от западных аналогов, Шедеврум работает не как онлайн-сервис. Это полностью бесплатное приложение, скачать которое можно в Google Play/ App Store или по QR-коду:
За пару дней продукт уже завоевал популярность, о чём говорит наличие ожидания при создании изображений.
Функционал Шедеврум
Шедеврум понимает запросы на русском и английском языках. В создании он «любит» детальность и точность: чем конкретней вы поставите задачу, тем более релевантным окажется результат.
В техническом плане Шедеврум не отличается от аналогов, он также обучен на Big Data и может имитировать художественные стили, манеру отдельных художников и так далее(например: «Черепашки ниндзя в стиле Винсента Ван Гога» или «Крупные города в стиле сюрреализма»).
Для обучения первой версии модели компания Яндекс использовала 240 миллионов картинок. В своём пресс-релизе Яндекс сообщил, что для создания изображения ИИ использует каскадную диффузию.
Каскадная диффузия — процесс генерации изображения на основе написанного запроса и обучения нейросети. После генерации нейросеть начинает поэтапно увеличивать разрешение, насыщая изображения репрезентативными данными.
Интерфейс приложения
Интуитивно простой внешний вид, который немного походит на социальные сети. В приложении нет регистрации и при входе и весь контент разделён на 2 раздела: «Недавние» и «Лучшие»:
Лучшие изображения сортируются по дате создания: за все время, за неделю и за день. К слову о первоначальном сходстве интерфейса с социальными сетями: ротация картинок происходит посредством лайков(чем их больше, тем чаще другие пользователи видят вашу картину). Похоже, что компания Яндекс хочет сделать из нейросети нечто большее с помощью внедрения социальной составляющей.
Как работает Шедеврум
При входе в приложение нажмите «+» в правой верхней части экрана:
После вы генерируете запрос к нейросети(prompt) и нажимаете «Сгенерировать». Через пару минут Шедеврум создаст 4 варианта вашей картинки по текстовому запросу. Самый лучший, по вашему мнению, можно опубликовать:
В правом верхнем углу можно зайти в свой аккаунт, чтобы посмотреть опубликованные работы:
Отличия Шедеврум и Midjourney
- Главное отличие Шедеврума — простота использования. Здесь нет сложных регистраций, непонимания «почему всё это в дискорде», изучения промптов и выбор наборов для детализации. У Яндекс получилось создать действительно качественный массовый продукт, в который хочется погрузиться.
- Пользователи отмечают, что реалистичность изображений искусственного интеллекта от отечественной компании превосходит Midjourney. Без сложных промптов Шедеврум создаёт реалистичные картинки, которые сложно отличить от фотографии.
Правила и ограничения
Список запрещённых тем для Шедеврум:
- Знаменитости и конкретные личности.
- Контент 18+.
- Политика.
- Религия.
- Жестокость и насилие.
Так как ИИ ещё учится и находится в бета-версии, некоторые запросы могут не сгенерироваться, так как нейросеть относит их к одной из вышеперечисленных тематик.
Примеры картинок Шедеврум
Заключение
С точки зрения маркетинга Шедеврум — качественный продукт, даже в beta-тестировании. Разработчики обещают добавлять новые «фишки» и улучшать имеющийся результат. Вот что на этот счёт думает Алексей Гусаков,
руководитель управления машинного интеллекта и исследований Яндекса: