OpenAI представила нові внутрішні тести для оцінки продуктивності на рівні проекту.
Наукові та математичні benchmarks показали вищі результати, ніж попередні моделі.
Оголошення з’являється на тлі укладання угод OpenAI щодо інтеграції GPT у уряд США та корпорації.
Центр мистецтва, моди та розваг Decrypt.
Відкрийте SCENE
Лише кілька тижнів після останнього масштабного релізу, OpenAI активно переводить свій флагманський ChatGPT із споживчої новинки в незамінну корпоративну потужність.
У четвер компанія випустила GPT-5.2 — нову велику мовну модель, яка, за їхніми словами, швидша, надійніша і розроблена для обробки складних професійних робочих процесів.
Оновлення свідчить про те, що OpenAI рухається далі за допомогою домашніх завдань і загальних запитів, прагнучи впровадити свою технологію як необхідний, щоденний інструмент у бізнес-сфері, про що свідчать її вигідні угоди з урядом США і Disney.
«Ми розробили GPT‑5.2, щоб розблокувати ще більшу економічну цінність для людей», — заявила OpenAI у заяві. «Він краще створює таблиці, робить презентації, пише код, сприймає зображення, розуміє довгі контексти, використовує інструменти та обробляє складні, багатоступінчасті проекти.»
Новий стандарт автоматизації робочих місць
Під час презентації продуктивності GPT-5.2 компанія представила власний оцінювальний benchmark, GDPval, що імітує завдання у 44 професіях.
GPT-5.2 у 71% випадків співпадає або перевищує продуктивність людського працівника у порівнянні, стверджує компанія.
«На GDPval модель мислення перевершує або дорівнює людським експертам у 70.9% поширених професійних завдань, таких як створення таблиць, презентацій і документів», — написала у X керівниця з застосувань OpenAI Фіджі Сімо. «Він також краще справляється з загальним інтелектом, написанням коду, викликами інструментів, зором і розумінням довгого контексту, щоб розблокувати ще більшу економічну цінність для людей.»
Невідомо, чи проходив benchmark зовнішній огляд, тому галузеві експерти чекають на незалежну перевірку заяв.
Технічний розбір: три моделі для трьох завдань
GPT-5.2 став доступним у рамках платних підписних рівнів у четвер, з відкриттям API того ж дня. Розробники тепер можуть обирати з трьох різних версій, кожна оптимізована для різних професійних потреб.
Швидка: для швидких, простих професійних завдань.
Мисляча: для складніших, багатоступінчастих завдань.
Професійна: вищий рівень, створений для інтенсивних досліджень і довгих проектів.
Ціноутворення API встановлено на рівні $1.75 за мільйон вхідних токенів і $14 за мільйон вихідних токенів.
Крім benchmark GDPval, GPT-5.2 показала покращену продуктивність у відомих технічних тестах, отримавши вищі бали на GPQA Diamond і FrontierMath. Також повідомляється, що він демонструє більш надійні результати у вимогливих завданнях, таких як кодування, аналіз даних і експериментальний дизайн.
У заяві компанія навела кілька схвальних відгуків від ранніх тестувальників.
Вихід більш компетентного робочого AI вже відбувається в умовах напруженого трудового середовища.
Корпоративні керівники здебільшого налаштовані оптимістично: недавнє опитування Just Capital показало, що 93% бізнес-лідерів вважають AI позитивною силою. Однак у тому ж дослідженні майже половина американців очікує, що технологія знищить робочі місця, тоді як керівники, за повідомленнями, менш стурбовані цим.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
OpenAI запускає GPT-5.2 на тлі розширення основних контрактів
Коротко
Центр мистецтва, моди та розваг Decrypt.
Відкрийте SCENE
Лише кілька тижнів після останнього масштабного релізу, OpenAI активно переводить свій флагманський ChatGPT із споживчої новинки в незамінну корпоративну потужність.
У четвер компанія випустила GPT-5.2 — нову велику мовну модель, яка, за їхніми словами, швидша, надійніша і розроблена для обробки складних професійних робочих процесів.
Оновлення свідчить про те, що OpenAI рухається далі за допомогою домашніх завдань і загальних запитів, прагнучи впровадити свою технологію як необхідний, щоденний інструмент у бізнес-сфері, про що свідчать її вигідні угоди з урядом США і Disney.
«Ми розробили GPT‑5.2, щоб розблокувати ще більшу економічну цінність для людей», — заявила OpenAI у заяві. «Він краще створює таблиці, робить презентації, пише код, сприймає зображення, розуміє довгі контексти, використовує інструменти та обробляє складні, багатоступінчасті проекти.»
Новий стандарт автоматизації робочих місць
Під час презентації продуктивності GPT-5.2 компанія представила власний оцінювальний benchmark, GDPval, що імітує завдання у 44 професіях.
GPT-5.2 у 71% випадків співпадає або перевищує продуктивність людського працівника у порівнянні, стверджує компанія.
«На GDPval модель мислення перевершує або дорівнює людським експертам у 70.9% поширених професійних завдань, таких як створення таблиць, презентацій і документів», — написала у X керівниця з застосувань OpenAI Фіджі Сімо. «Він також краще справляється з загальним інтелектом, написанням коду, викликами інструментів, зором і розумінням довгого контексту, щоб розблокувати ще більшу економічну цінність для людей.»
Невідомо, чи проходив benchmark зовнішній огляд, тому галузеві експерти чекають на незалежну перевірку заяв.
Технічний розбір: три моделі для трьох завдань
GPT-5.2 став доступним у рамках платних підписних рівнів у четвер, з відкриттям API того ж дня. Розробники тепер можуть обирати з трьох різних версій, кожна оптимізована для різних професійних потреб.
Ціноутворення API встановлено на рівні $1.75 за мільйон вхідних токенів і $14 за мільйон вихідних токенів.
Крім benchmark GDPval, GPT-5.2 показала покращену продуктивність у відомих технічних тестах, отримавши вищі бали на GPQA Diamond і FrontierMath. Також повідомляється, що він демонструє більш надійні результати у вимогливих завданнях, таких як кодування, аналіз даних і експериментальний дизайн.
У заяві компанія навела кілька схвальних відгуків від ранніх тестувальників.
Вихід більш компетентного робочого AI вже відбувається в умовах напруженого трудового середовища.
Корпоративні керівники здебільшого налаштовані оптимістично: недавнє опитування Just Capital показало, що 93% бізнес-лідерів вважають AI позитивною силою. Однак у тому ж дослідженні майже половина американців очікує, що технологія знищить робочі місця, тоді як керівники, за повідомленнями, менш стурбовані цим.