OpenAI представила GPT-5.4 спустя два дня после анонса GPT-5.3 Instant

Кодик кратко объясняет суть статьи
OpenAI представила новую модель GPT-5.4 для ChatGPT, API и Codex, а также расширенную версию GPT-5.4 Pro. Модель GPT-5.4 Thinking доступна подписчикам Plus, Team и Pro в ChatGPT, а через API стоит $2,5 за миллион входных и $15 за миллион выходных токенов. GPT-5.4 Pro предназначена для пользователей Pro и Enterprise и стоит $30 и $180 соответственно. В ChatGPT модель отображает промежуточный план рассуждений, позволяя корректировать запрос до завершения ответа, и демонстрирует улучшенные способности к глубокому интернет-поиску и сохранению контекста. GPT-5.4 показывает более точные и последовательные результаты в реальных задачах: в бенчмарке GDPval она превосходит или соответствует уровню специалистов в 83% случаев против 70,9% у GPT-5.2. Модель улучшила работу с таблицами, презентациями и документами, стала первой универсальной моделью OpenAI с нативными возможностями управления компьютером, эффективно интерпретируя скриншоты и выполняя команды. В тестах OSWorld-Verified и WebArena-Verified она достигла 75% и 67,3% соответственно, опередив GPT-5.2 (47,3% и 65,4%). OpenAI называет GPT-5.4 своей самой достоверной моделью на данный момент.
Читайте в Telegram
|
OpenAI выпустила новую модель GPT-5.4 для ChatGPT, API и Codex, а также расширенную версию GPT-5.4 Pro.
GPT-5.4 Thinking доступна подписчикам Plus, Team и Pro в ChatGPT. Через API модель стоит $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. GPT-5.4 Pro для подписчиков Pro и Enterprise, а также через API обойдётся в $30 и $180 соответственно.

В ChatGPT модель показывает предварительный план своих размышлений, позволяя пользователю корректировать запрос по мере формирования ответа. GPT-5.4 Thinking улучшила навыки «глубокого интернет-поиска», особенно для специфических запросов, сохраняя контекст.
GPT-5.4 выдаёт более последовательные и точные ответы в реальных задачах. В бенчмарке GDPval, который проверяет определённые знания в 44 профессиях, модель соответствует показателям специалистов-людей или превосходит их в 83% случаев по сравнению с 70,9% у GPT-5.2.

Компания также улучшила возможности GPT-5.4 в создании и редактировании таблиц, презентаций и документов. По словам OpenAI, GPT-5.4 — самая достоверная модель компании и первая универсальная модель с нативными возможностями использования компьютера. Она «отлично» умеет интерпретировать скриншоты и отдавать команды для выполнения разных задач.
В бенчмарке OSWorld-Verified модель достигла 75% по сравнению с 47,3% у GPT-5.2. В WebArena-Verified, который оценивает использование браузера, — 67,3% по сравнению с 65,4% у GPT-5.2.







