OpenAI с гордостью представила новую версию своей языковой ИИ-модели, GPT-4, которая демонстрирует производительность на уровне человека во многих профессиональных задачах. Нейросеть была обучена на большем количестве данных и использует больший объем информации, что делает ее более дорогой в работе, но, при этом, она способна работать не только с текстом, но и с изображениями.

Новые возможности GPT-4

Хотя в некоторых реальных сценариях GPT-4 все еще уступает людям, на различных профессиональных и академических тестах модель демонстрирует производительность на уровне человека. В частности, GPT-4 успешно сдает симуляционный адвокатский экзамен, показывая результаты, находящиеся примерно в верхней десятке тестировщиков, что значительно превосходит результаты предыдущей версии GPT-3.5.

Кроме того, GPT-4 стала более надежной и креативной в сложных темах и способна обрабатывать более подробные инструкции, чем предыдущие версии модели.

GPT-4 понимает естественный язык и выполняет задачи на всех языках. Это позволяет модели работать с запросами на разных языках и выдавать результат на нужном языке.

Новая версия нейросети может понимать, что изображено на фото, схеме, рисунке или другом изображении, и учитывать эти данные при решении задачи. Еще ИИ способен объяснять данные, представленные в виде диаграммы. Это открывает новые возможности для использования GPT-4 в различных сферах, включая чат-боты и поисковые системы.

Запрос: «Что забавного в этом изображении? Опиши кадр за кадром».

GPT-4: «На изображении показан набор из трех картинок об адаптере Lightning.

Картинка 1: Смартфон с кабелем VGA (большой, голубой, 15-контактный штекер, обычно используемый для мониторов компьютеров), вставленным в его разъем зарядки.

Картинка 2: Упаковка от адаптера Lightning с изображением кабеля VGA на ней.

Картинка 3: Увеличенное изображение кабеля VGA с небольшим штекером Lightning (используется для зарядки iPhone и других устройств Apple) на конце.

Забава в этой картинке заключается в абсурдности вставки большого устаревшего кабеля VGA в небольшой современный разъем зарядки смартфона».

Компания полностью перестроила свой стек глубокого обучения и совместно с Azure разработала суперкомпьютер специально для работы с нейронными сетями, что позволило получить устойчивую модель, результаты которой можно было предсказать.

OpenAI запустила GPT-4 — новая модель обрабатывает изображения и текст

GPT-4 уже используется в некоторых системах искусственного интеллекта, таких как поисковик Bing и ChatGPT. Новые достижения, которые может принести GPT-4, начнут просачиваться в потребительские продукты, такие как чат-боты, в ближайшие недели.

OpenAI также открыла OpenAI Evals, собственный фреймворк для автоматической оценки производительности моделей искусственного интеллекта, чтобы любой желающий мог сообщить об ошибках в их моделях и помочь компании улучшить их.

GPT-4 представляет собой новую эру в развитии искусственного интеллекта, предоставляя возможность создания более умных и продвинутых продуктов, основанных на машинном обучении.

Доступ к GPT-4

ChatGPT Plus могут использовать GPT-4 на chat.openai.com с ограничением в 100 запросов в 4 часа. Использование будет контролироваться компанией в зависимости от спроса и производительности системы на практике. Ожидается значительное ограничение доступности (хотя компания планирует увеличить масштаб и оптимизировать производительность в ближайшие месяцы). В зависимости от трафика, компания может представить новый уровень подписки для интенсивной работы с GPT-4.

Чтобы попробовать новую модель в деле, придётся записаться в лист ожидания.

Однако, в настоящее время доступен только текстовый режим для разработчиков, которые имеют доступ к API. Поддержка обработки изображений пока неизвестна и будет предоставлена в более позднем релизе.

Скорее всего, тестирование API не будет доступно для пользователей из Беларуси, России и Украины из-за запрета на использование языковой модели в этих странах.

Чтобы получить доступ к API, нужно заполнить форму с указанием имени, фамилии пользователя, адреса электронной почты и ID организации.

API можно будет использовать для любой сферы, кроме перечисленных в Политике платформы. К таким сферам относятся:

Незаконная деятельность.
Сферы, связанные с сексуальным насилием над детьми.
Создание вирусов и вредоносных программ
Культивация ненависти, преследования или насилия, а также запугивания человека.
Сферы с риском экономического ущерба. В их числе: многоуровневый маркетинг, азартные игры, кредитование(!), трудоустройство, образовательные услуги.
Деятельность с высоким риском причинения физического вреда. В их числе: разработка оружия, военные действия, управление критической инфраструктурой, а также пропаганда членовредительства: самоубийства, порезов и расстройств пищевого поведения.
Контент для взрослых, порнография.
Мошенничество. Также — плагиат, академическая нечестность, создание поддельных отзывов, дезинформация, спам.
Принятие государственных решений с высокой степенью риска.
Политическая агитация или лоббирование.
Сталкеринг и незаконный сбор личных данных.
Несанкционированная юридическая практика.
Медицина.

Как видно, среди перечисленных сфер находятся не только преступные. Использовать GPT-4 также нельзя для принятия решений, которые могут принести огромный ущерб.

Официаьную презентацию GPT-4 можно посмотреть здесь: