На сервере Discord компании Midjourney, занимающейся созданием художественного искусственного интеллекта, было объявлено о начале тестирования новой версии движка V5. Ожидается, что данная технология будет представлять еще более высокий уровень генерации изображений.
Midjourney — один из лидеров на рынке генерации изображений, предлагающий оптимальное сочетание доступности и качества. Они уже выпустили четвертую версию своей технологии, которая стала значительным улучшением по сравнению с третьей. В настоящее время они активно работают над разработкой пятой версии, которая обещает быть еще более продвинутой!
Midjourney в настоящее время тестирует новый алгоритм и просит пользователей оставлять отзывы о созданных с его помощью изображениях. Несмотря на то, что уже есть некоторые изображения, созданные с помощью этой версии, компания отмечает, что они не представляют окончательную версию и не могут полностью отражать ее возможности. Они внимательно изучают отзывы пользователей и используют их для улучшения качества окончательной версии.
Обновления Midjourney V5
Давайте начнем с того, что произошло после обновления от разработчиков MJ. Вот основные изменения, которые были внесены:
- Был расширен список стилей, в которых нейронная сеть может рисовать, и улучшена ее чувствительность к запросам.
- Разрешение генерируемых изображений увеличено. Теперь разрешение изображений v5 соответствует разрешению увеличенных (upscaled) изображений v4.
- Больше внимания уделено деталям, а количество текста уменьшено.
- Добавлена поддержка параметра —tile, который позволяет генерировать изображения в виде тайлов с безшовным переходом.
- Теперь можно использовать не квадратное соотношение сторон с помощью аргумента —ar.
- Добавлена поддержка весов для изображений через аргумент —iw.
- На данный момент функция увеличения изображений (upscale) отключена.
Разработчики MJ отмечают, что v5 имеет меньшую склонность к проявлению «собственного мнения», поэтому требуется более длинное и подробное описание для корректной работы с запросами. Однако при использовании коротких запросов могут возникнуть проблемы.
Хотя в обновлении было заявлено об увеличении производительности, генерация изображений на v5 алгоритме занимает в два раза больше времени, примерно одну минуту. Предположительно, это связано с более высоким разрешением изображений.
Сравнения Midjourney v4 и v5
Сдержанность
Визуальные элементы версии 5 выглядят более сдержанно. Однако, стоит заметить, что данный минус уравновешивается увеличенным уровень реалистичности в процессе генерации.
Реалистичность
Изображения, созданные с помощью v5, демонстрируют более высокий уровень детализации и точности, особенно в фотореалистичных изображениях. Они имеют более высокое разрешение по умолчанию (1024 x 1024) и могут отображать более широкий диапазон стилей.
Детализированный запрос
Улучшенная версия теперь более чувствительна к контексту и может правильно интерпретировать слова, такие как «beautiful», что действительно отражается в конечном результате.
без дополнительных слов
с доп.словами : beautiful 8k octane unreal realistic
Присутствие или отсутствие определенных слов может значительно изменить визуальный стиль создаваемого изображения. Например, использование слова «portrait» в запросе может быть расценено как запрос на создание художественного портрета, а упоминание слова «octane» может породить образы, подобные тем, что можно увидеть в высокобюджетных играх класса AAA.
Руки
В MJv5 всё так же сохраняется проблема с созданием реалистичных изображений человеческих рук, но, тем не менее, изображение выглядит менее пугающе, чем прежде. Хотя это не революционный прорыв в генерации изображений рук, можно говорить о значительном прогрессе в данной области.
Широкоформатные изображения
В четвертой версии алгоритма возможность генерации только квадратных изображений была расширена позже, чтобы поддерживать соотношения сторон 1:2 и 2:1. Третье поколение алгоритма, в свою очередь, в некоторых случаях могло создавать вытянутые изображения, которые были результатом смешения нескольких квадратных изображений.
В пятой версии алгоритма этот недостаток был исправлен, но появилась новая проблема: иногда при генерации изображений могут появляться черные полосы, которые «корректируют» соотношение сторон изображения. Стоит отметить, что в третьей версии алгоритма вытянутость изображений была неявно ограничена, и генерация изображений соотношения 32:9, например, давала результат, который больше походил на 21:9. В свою очередь, MJv5 способна генерировать даже изображения соотношения сторон 100:9.
Тайлы
MidJourney v5 теперь включает экспериментальную функцию: создание тайловых изображений. Тайлы представляют собой изображения, которые могут без швов заполнять плоскость. Такой режим может быть полезен, например, при разработке игр для быстрого создания повторяющихся текстур.
Заключение
В общем и целом, Midjourney V5 является триумфом искусственного интеллекта, который приводит нас ещё ближе к реализации наших самых смелых творческих идей. Это впечатляющее достижение, которое, несомненно, вызовет восхищение и удивление у всех, кто с ним столкнется.
Midjourney продолжает развиваться и обещает еще больше улучшений в будущем. Они постоянно улучшают свой генеративный ИИ и оставляют конкурентов позади!