Вышла Midjourney V5

На сервере Discord компании Midjourney, занимающейся созданием художественного искусственного интеллекта, было объявлено о начале тестирования новой версии движка V5. Ожидается, что данная технология будет представлять еще более высокий уровень генерации изображений.

Midjourney — один из лидеров на рынке генерации изображений , предлагающий оптимальное сочетание доступности и качества. Они уже выпустили четвертую версию своей технологии, которая стала значительным улучшением по сравнению с третьей. В настоящее время они активно работают над разработкой пятой версии, которая обещает быть еще более продвинутой!

Midjourney в настоящее время тестирует новый алгоритм и просит пользователей оставлять отзывы о созданных с его помощью изображениях. Несмотря на то, что уже есть некоторые изображения, созданные с помощью этой версии, компания отмечает, что они не представляют окончательную версию и не могут полностью отражать ее возможности. Они внимательно изучают отзывы пользователей и используют их для улучшения качества окончательной версии.

Обновления Midjourney V5

Давайте начнем с того, что произошло после обновления от разработчиков MJ. Вот основные изменения, которые были внесены:

  • Был расширен список стилей, в которых нейронная сеть может рисовать, и улучшена ее чувствительность к запросам.
  • Разрешение генерируемых изображений увеличено. Теперь разрешение изображений v5 соответствует разрешению увеличенных (upscaled) изображений v4.
  • Больше внимания уделено деталям, а количество текста уменьшено.
  • Добавлена поддержка параметра —tile, который позволяет генерировать изображения в виде тайлов с безшовным переходом.
  • Теперь можно использовать не квадратное соотношение сторон с помощью аргумента —ar.
  • Добавлена поддержка весов для изображений через аргумент —iw.
  • На данный момент функция увеличения изображений (upscale) отключена.

Разработчики MJ отмечают, что v5 имеет меньшую склонность к проявлению «собственного мнения», поэтому требуется более длинное и подробное описание для корректной работы с запросами. Однако при использовании коротких запросов могут возникнуть проблемы.

Хотя в обновлении было заявлено об увеличении производительности, генерация изображений на v5 алгоритме занимает в два раза больше времени, примерно одну минуту. Предположительно, это связано с более высоким разрешением изображений.

Сравнения Midjourney v4 и v5

Сдержанность

Визуальные элементы версии 5 выглядят более сдержанно. Однако, стоит заметить, что данный минус уравновешивается увеличенным уровень реалистичности в процессе генерации.

Вышла Midjourney V5
V4
Вышла Midjourney V5
V5
Вышла Midjourney V5
V4
Вышла Midjourney V5
V5

Реалистичность

Изображения, созданные с помощью v5, демонстрируют более высокий уровень детализации и точности, особенно в фотореалистичных изображениях. Они имеют более высокое разрешение по умолчанию (1024 x 1024) и могут отображать более широкий диапазон стилей.

Детализированный запрос

Улучшенная версия теперь более чувствительна к контексту и может правильно интерпретировать слова, такие как «beautiful», что действительно отражается в конечном результате.

Вышла Midjourney V5
Запрос: woman portrait —seed 2131932819
без дополнительных слов
Вышла Midjourney V5
Запрос: woman portrait —seed 2131932819
с доп.словами : beautiful 8k octane unreal realistic

Присутствие или отсутствие определенных слов может значительно изменить визуальный стиль создаваемого изображения. Например, использование слова «portrait» в запросе может быть расценено как запрос на создание художественного портрета, а упоминание слова «octane» может породить образы, подобные тем, что можно увидеть в высокобюджетных играх класса AAA.

Вышла Midjourney V5
Генерация без дополнтельных слов
Вышла Midjourney V5
Генерация с дополнительными словами

Руки

В MJv5 всё так же сохраняется проблема с созданием реалистичных изображений человеческих рук, но, тем не менее, изображение выглядит менее пугающе, чем прежде. Хотя это не революционный прорыв в генерации изображений рук, можно говорить о значительном прогрессе в данной области.

Вышла Midjourney V5
V4
Вышла Midjourney V5
V5

Широкоформатные изображения

В четвертой версии алгоритма возможность генерации только квадратных изображений была расширена позже, чтобы поддерживать соотношения сторон 1:2 и 2:1. Третье поколение алгоритма, в свою очередь, в некоторых случаях могло создавать вытянутые изображения, которые были результатом смешения нескольких квадратных изображений.

В пятой версии алгоритма этот недостаток был исправлен, но появилась новая проблема: иногда при генерации изображений могут появляться черные полосы, которые «корректируют» соотношение сторон изображения. Стоит отметить, что в третьей версии алгоритма вытянутость изображений была неявно ограничена, и генерация изображений соотношения 32:9, например, давала результат, который больше походил на 21:9. В свою очередь, MJv5 способна генерировать даже изображения соотношения сторон 100:9.

Вышла Midjourney V5
V3
Вышла Midjourney V5
V5

Тайлы

MidJourney v5 теперь включает экспериментальную функцию: создание тайловых изображений. Тайлы представляют собой изображения, которые могут без швов заполнять плоскость. Такой режим может быть полезен, например, при разработке игр для быстрого создания повторяющихся текстур.

Midjourney V5 тайлы

Заключение

В общем и целом, Midjourney V5 является триумфом искусственного интеллекта, который приводит нас ещё ближе к реализации наших самых смелых творческих идей. Это впечатляющее достижение, которое, несомненно, вызовет восхищение и удивление у всех, кто с ним столкнется.

Midjourney продолжает развиваться и обещает еще больше улучшений в будущем. Они постоянно улучшают свой генеративный ИИ и оставляют конкурентов позади!

Добавить комментарий