Команда исследователей из Adobe и Австралийского национального университета представила новаторский алгоритм, способный преобразовывать 2D-изображения в 3D-модели всего за пять секунд. Этот технологический прорыв обещает кардинально изменить процесс создания контента в сферах дизайна и развлечений, хотя и поднимает вопросы о потенциальных проблемах с качеством текстур и нарушениями авторских прав.
Названный «Большой моделью реконструкции» (Large Reconstruction Model, LRM), этот алгоритм представляет собой значительный шаг вперёд в области быстрого создания 3D-моделей из одиночных изображений. Обученный на обширной базе данных, включающей около миллиона трёхмерных объектов из ресурсов Objaverse и MVImgNet, LRM демонстрирует выдающуюся способность к адаптации при работе с различными типами изображений для создания 3D-контента.
В отличие от предшествующих моделей, ограниченных узкими наборами данных и фокусирующихся на конкретных категориях изображений, LRM использует трансформерную архитектуру, которая является фундаментом для многих разработок в сфере глубокого обучения, и обладает 500 миллионами параметров. Это позволяет модели эффективно обрабатывать разнообразные изображения, включая фотографии из реального мира и графические композиции, созданные с помощью других ИИ-сервисов, таких как DALL-E и Stable Diffusion.
Ведущий автор исследования, Ицонг Хонг (Yicong Hong), подчеркивает, что алгоритм является значительным достижением в сфере трёхмерной реконструкции, способным воспроизводить сложные текстуры и детализированную геометрию с высокой точностью.
Применение LRM может оказать значительное влияние на различные сферы, от дизайна и развлечений до игровой индустрии. Для дизайнеров и 3D-художников это означает возможность ускорения процесса создания моделей, что особенно актуально для разработки видеоигр и анимаций. Кроме того, доступность LRM для широкой публики может сделать 3D-моделирование доступным не только для профессионалов. Теперь даже обычные пользователи смогут создавать детализированные модели, используя фотографии со своих смартфонов.
Однако у LRM есть свои ограничения, включая потенциальную размытость текстур в невидимых на изображении областях. Также важно учитывать вопросы, связанные с авторскими правами, особенно при использовании изображений, созданных другими ИИ-сервисами. Для демонстрации возможностей LRM исследователи разработали страницу с видеодемонстрациями и интерактивными 3D-моделями, что подчёркивает растущее значение ИИ в современном мире и его потенциальное влияние на будущее творческих индустрий.