OpenAI запускає GPT-5.2 на тлі розширення основних контрактів

Коротко

  • OpenAI представила нові внутрішні тести для оцінки продуктивності на рівні проекту.
  • Наукові та математичні benchmarks показали вищі результати, ніж попередні моделі.
  • Оголошення з’являється на тлі укладання угод OpenAI щодо інтеграції GPT у уряд США та корпорації.

Центр мистецтва, моди та розваг Decrypt.


Відкрийте SCENE

Лише кілька тижнів після останнього масштабного релізу, OpenAI активно переводить свій флагманський ChatGPT із споживчої новинки в незамінну корпоративну потужність.

У четвер компанія випустила GPT-5.2 — нову велику мовну модель, яка, за їхніми словами, швидша, надійніша і розроблена для обробки складних професійних робочих процесів.

Оновлення свідчить про те, що OpenAI рухається далі за допомогою домашніх завдань і загальних запитів, прагнучи впровадити свою технологію як необхідний, щоденний інструмент у бізнес-сфері, про що свідчать її вигідні угоди з урядом США і Disney.

«Ми розробили GPT‑5.2, щоб розблокувати ще більшу економічну цінність для людей», — заявила OpenAI у заяві. «Він краще створює таблиці, робить презентації, пише код, сприймає зображення, розуміє довгі контексти, використовує інструменти та обробляє складні, багатоступінчасті проекти.»

Новий стандарт автоматизації робочих місць

Під час презентації продуктивності GPT-5.2 компанія представила власний оцінювальний benchmark, GDPval, що імітує завдання у 44 професіях.

GPT-5.2 у 71% випадків співпадає або перевищує продуктивність людського працівника у порівнянні, стверджує компанія.

«На GDPval модель мислення перевершує або дорівнює людським експертам у 70.9% поширених професійних завдань, таких як створення таблиць, презентацій і документів», — написала у X керівниця з застосувань OpenAI Фіджі Сімо. «Він також краще справляється з загальним інтелектом, написанням коду, викликами інструментів, зором і розумінням довгого контексту, щоб розблокувати ще більшу економічну цінність для людей.»

Невідомо, чи проходив benchmark зовнішній огляд, тому галузеві експерти чекають на незалежну перевірку заяв.

Технічний розбір: три моделі для трьох завдань

GPT-5.2 став доступним у рамках платних підписних рівнів у четвер, з відкриттям API того ж дня. Розробники тепер можуть обирати з трьох різних версій, кожна оптимізована для різних професійних потреб.

  • Швидка: для швидких, простих професійних завдань.
  • Мисляча: для складніших, багатоступінчастих завдань.
  • Професійна: вищий рівень, створений для інтенсивних досліджень і довгих проектів.

Ціноутворення API встановлено на рівні $1.75 за мільйон вхідних токенів і $14 за мільйон вихідних токенів.

Крім benchmark GDPval, GPT-5.2 показала покращену продуктивність у відомих технічних тестах, отримавши вищі бали на GPQA Diamond і FrontierMath. Також повідомляється, що він демонструє більш надійні результати у вимогливих завданнях, таких як кодування, аналіз даних і експериментальний дизайн.

У заяві компанія навела кілька схвальних відгуків від ранніх тестувальників.

Вихід більш компетентного робочого AI вже відбувається в умовах напруженого трудового середовища.

Корпоративні керівники здебільшого налаштовані оптимістично: недавнє опитування Just Capital показало, що 93% бізнес-лідерів вважають AI позитивною силою. Однак у тому ж дослідженні майже половина американців очікує, що технологія знищить робочі місця, тоді як керівники, за повідомленнями, менш стурбовані цим.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити