26 апреля компания Stability AI объявила о выпуске своего Image Upscaling API — инструмента на основе искусственного интеллекта, который увеличивает размер любого изображения, не ухудшая его качества.
Image Upscaling API — это последнее дополнение к уже существующему набору API для генерации и редактирования изображений от Stability AI, таких как популярные текст-в-изображение, изображение-в-изображение и заполнение API. Увеличение масштаба добавляет к этим популярным инструментам возможность расширять маленькие изображения до больших размеров, сохраняя — или даже улучшая — их уровень детализации.
Image Upscaling API использует две модели с открытым исходным кодом. Первая — это Real-ESRGAN с супербыстрой скоростью, которая может удваивать разрешение типичного изображения размером 512×512 за полсекунды. Вторая — это «latent» Stable Diffusion 4x Upscaler, который занимает от 20 до 40 секунд, чтобы увеличить изображение, но дает более детализированные результаты с более насыщенной текстурой.
Обе модели могут использоваться для увеличения масштаба любых изображений, независимо от того, были ли они сгенерированы с помощью API Stability или нет. Одним из ключевых преимуществ латентного Stable Diffusion 4x Upscaler является его продвинутый процесс диффузии, который увеличивает воспринимаемый уровень детализации при увеличении входного изображения.
Пользователи официальных плагинов для Photoshop и Blender уже могут пользоваться фичей через API. Должно также работать и с расширением для A1111, а также Dreamstudio.