Google объявила о предоставлении доступа ко всем пользователям к бета-версии своей нейросети Gemini 1.5 Pro. Джефф Дин, главный научный сотрудник подразделения Google DeepMind, поделился новостью в социальной сети X, уточнив, что изначально подключение к API будет происходить поэтапно, а впоследствии масштабироваться. Разработчики уже могут тестировать Gemini 1.5 Pro в пользовательском интерфейсе AI Studio.
Gemini 1.5 Pro работает с контекстным окном в 128 000 токенов, с возможностью расширения до 1 миллиона токенов. Эта нейросеть способна обрабатывать до часа видеоконтента, 11 часов аудиозаписей, кодовые базы более чем на 30 000 строк или текстов объёмом свыше 700 000 слов. Google успешно провела испытания на обработку до 10 миллионов токенов.
Сочетая архитектуру Transformer и MoE, Gemini 1.5 Pro эффективно выполняет разнообразные задачи, включая анализ исторических документов, таких как расшифровка стенограмм миссии «Аполлон-11». Нейросеть умеет не только анализировать большие объёмы данных, но и быстро находить конкретные фрагменты текста, а также эффективно обрабатывать крупные блоки кода. В AI Studio Gemini 1.5 доступна с ограничением в 20 запросов в день.
В тесте Needle In A Haystack (NIAH) ИИ демонстрирует 99% точность в нахождении конкретных фактов в длинных текстах. Её способность адаптироваться к конкретным условиям, показанная в бенчмарке Machine Translation from One Book (MTOB), выдвигает её в число лидеров в области адаптивного обучения.