«Сбер» сообщил о разработке нейросети GigaChat.
«Сбер» разработал собственную мультимодальную нейросеть GigaChat, которая способна отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и изображения на основе описаний в рамках единого контекста, а также более грамотно общаться на русском языке, чем иностранные аналоги.
Создание новой нейросети — это серьезный шаг в цифровизации услуг Сбербанка и может привести к его трансформации в российского IT-гиганта.
Новая разработка Сбера, которую мы сегодня представили, является прорывной для всей большой вселенной российских технологий. Более того, GigaChat уникален своей открытостью архитектуры, в то время как мировые аналоги нашей модели придерживаются курса Closed AI. Важно, что GigaChat могут использовать не только массовые пользователи, которые любят экспериментировать с инновациями, но студенты и даже исследователи для серьезных научных работ.
герман Греф, Президент, Председатель Правления Сбербанка
Один из главных плюсов этой разработки заключается в том, что ее основой является ансамбль моделей NeONKA, который включает в себя ru-GPT 3.5 с 13 млрд параметров. Сбербанк планирует выложить эту модель в открытый доступ, чтобы ускорить развитие сообщества Open Source в области искусственного интеллекта.
Название модели — отсылка к популярному мему GigaChad, который обычно используется для обозначения гипермаскулинного и карикатурно привлекательного мужчины.
Сообщается, что, в отличие от зарубежных конкурентов, GigaChat уже поддерживает мультимодальное взаимодействие — то есть работает и с текстом, и с картинками — и более грамотно общается на русском языке. В GigaChat встроена модель Kandinsky 2.1, чтобы создавать изображения по запросу.
Создание GigaChat является ключевым шагом для Сбербанка в совершенствовании его виртуального ассистента «Салют», ведь он один из первых получит в ближайшее время все возможности нейросети. В дальнейшем GigaChat будет доступна через облачное API для разработчиков и бизнеса.
В разработке модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и отраслевых экспертов, а обучение нейросети выполнялось на суперкомпьютере Christofari Neo.
По мнению представителей «Сбербанка», новая нейросеть может быть полезной для работников СМИ, программистов, педагогов, студентов, маркетологов и других профессионалов.
Сейчас модель работает в режиме закрытой бета-версии. Для участия в её бесплатном тестировании необходимо вступить в закрытое сообщество в Telegram-канале.