Всего через пару месяцев после запуска передовой нейросети Gemini, Google объявила о выпуске её обновленной версии. Новая модель, Gemini 1.5, уже доступна для разработчиков и бизнес-пользователей, а вскоре её начнут использовать и обычные потребители. Google планирует применять Gemini в различных сферах, включая бизнес и личные помощники.
В новой модели внедрено множество улучшений. Профессиональная версия Gemini 1.5 Pro превосходит предыдущую версию, Gemini 1.0 Pro, на 87% в тестированиях и сопоставима с высшей моделью Gеmini 1.0 Ultra. В проектировании модели использовался метод «смесь экспертов» (MoE), позволяющий при запросе активировать только часть модели, ускоряя её работу и повышая эффективность.
Однако наибольший интерес в Google вызывает огромное контекстное окно новой модели, позволяющее обрабатывать значительно большие объемы данных. Контекстное окно Gemini 1.5 составляет 1 миллион токенов, что значительно превышает 128 000 у GPT-4 от OpenAI и 32 000 у текущей версии Gеmini Pro. Сундар Пичаи, генеральный директор Google, упоминает, что такой объем информации сравним с 10-11 часами видео или десятками тысяч строк кода.
Пичаи также подчеркивает потенциальную пользу расширенного контекстного окна для бизнеса. Он представляет, как кинематографисты могут анализировать целые фильмы, а компании — обрабатывать большие массивы финансовых данных. По его мнению, это один из самых значительных прорывов Google.
Пока Gemini 1.5 доступна только для бизнес-пользователей и разработчиков через платформы Google Vertex AI и AI Studio. Со временем она заменит Gеmini 1.0, а стандартная версия Pro будет обновлена до 1.5 Pro. Предполагается дополнительная плата за доступ к контекстному окну в 1 миллион токенов. Компания также активно тестирует безопасность и этические аспекты новой модели.
В то время как Google ускоряет разработку AI-технологий, мировые компании определяют свои стратегии в области искусственного интеллекта, сотрудничая с OpenAI, Google и другими. Пичаи подчеркивает, что в конечном итоге для пользователей важен не бренд или технические характеристики, а качество пользовательского опыта, подобно тому, как люди используют смартфоны, не вдаваясь в детали процессоров. Однако, по его словам, на текущем этапе базовые технологии все еще играют важную роль.