OpenAI представила новые внутренние тесты для оценки эффективности на уровне проектов.
Научные и математические бенчмарки показали более высокие результаты, чем предыдущие модели.
Объявление поступает на фоне сделок OpenAI по интеграции GPT в правительство США и корпоративные структуры.
Центр искусства, моды и развлечений Decrypt.
Откройте для себя SCENE
Всего через несколько недель после последнего крупного релиза OpenAI активно переводит свой флагманский ChatGPT с потребительского новшества на незаменимую корпоративную мощь.
В четверг компания выпустила GPT-5.2 — новую крупную языковую модель, которая, по их утверждениям, быстрее, более надежна и предназначена для обработки сложных профессиональных рабочих процессов.
Обновление свидетельствует о том, что OpenAI выходит за рамки помощи с домашними заданиями и общих запросов, стремясь встроить свою технологию как важный ежедневный инструмент в бизнес-мире, что подтверждается выгодными сделками с правительством США и Disney.
«Мы разработали GPT‑5.2, чтобы открыть еще больше экономической ценности для людей», — заявил OpenAI в утверждении. «Она лучше создает таблицы, строит презентации, пишет код, воспринимает изображения, понимает длинные контексты, использует инструменты и справляется со сложными многозадачными проектами.»
Новый стандарт для автоматизации работы
Говоря о производительности GPT-5.2, компания представила собственный оценочный бенчмарк GDPval, моделирующий задачи в 44 профессиях.
GPT-5.2 достигла или превзошла показатели человеческих работников примерно в 71% сравнений, утверждает компания.
«На GDPval модель мышления побеждает или сравнивается с экспертами в 70,9% типичных профессиональных задач, таких как создание таблиц, презентаций и документов», — написал в X CEO OpenAI по приложениям, Фиджи Симбо. «Она также лучше в области общего интеллекта, написания кода, вызова инструментов, визуального восприятия и понимания длинных контекстов, что позволяет ей открывать еще больше экономической ценности для людей.»
GPT-5.2 стал доступен в рамках платных подписок в четверг, а доступ к API был открыт в тот же день. Разработчики теперь могут выбирать из трех различных версий, каждая из которых оптимизирована для различных профессиональных потребностей.
Instant: для быстрых, простых профессиональных задач.
Thinking: для более сложных, многоступенчатых задач.
Pro: модель высшего уровня, предназначенная для интенсивных исследований и долгосрочных проектов.
Цены на API установлены в размере $1.75 за миллион входных токенов и $14 за миллион выходных токенов.
Помимо бенчмарка GDPval, GPT-5.2 показала улучшенные результаты на известных технических тестах, набрав более высокие оценки на GPQA Diamond и FrontierMath. Также, по сообщениям, она продемонстрировала более надежные результаты в сложных задачах, таких как кодирование, анализ данных и проектирование экспериментов.
В объявлении компания представила несколько положительных отзывов от ранних тестировщиков.
Релиз более компетентного AI для работы приходится на уже напряженную рабочую среду.
Корпоративные руководители в основном настроены оптимистично, о чем свидетельствует недавний опрос Just Capital, показывающий, что 93% бизнес-лидеров считают AI положительным фактором. Однако тот же опрос выявил, что почти половина американцев ожидает, что технология уничтожит рабочие места, что, по сообщениям, меньше тревожит руководителей.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
OpenAI запускает GPT-5.2 на фоне расширения крупных контрактов
Вкратце
Центр искусства, моды и развлечений Decrypt.
Откройте для себя SCENE
Всего через несколько недель после последнего крупного релиза OpenAI активно переводит свой флагманский ChatGPT с потребительского новшества на незаменимую корпоративную мощь.
В четверг компания выпустила GPT-5.2 — новую крупную языковую модель, которая, по их утверждениям, быстрее, более надежна и предназначена для обработки сложных профессиональных рабочих процессов.
Обновление свидетельствует о том, что OpenAI выходит за рамки помощи с домашними заданиями и общих запросов, стремясь встроить свою технологию как важный ежедневный инструмент в бизнес-мире, что подтверждается выгодными сделками с правительством США и Disney.
«Мы разработали GPT‑5.2, чтобы открыть еще больше экономической ценности для людей», — заявил OpenAI в утверждении. «Она лучше создает таблицы, строит презентации, пишет код, воспринимает изображения, понимает длинные контексты, использует инструменты и справляется со сложными многозадачными проектами.»
Новый стандарт для автоматизации работы
Говоря о производительности GPT-5.2, компания представила собственный оценочный бенчмарк GDPval, моделирующий задачи в 44 профессиях.
GPT-5.2 достигла или превзошла показатели человеческих работников примерно в 71% сравнений, утверждает компания.
«На GDPval модель мышления побеждает или сравнивается с экспертами в 70,9% типичных профессиональных задач, таких как создание таблиц, презентаций и документов», — написал в X CEO OpenAI по приложениям, Фиджи Симбо. «Она также лучше в области общего интеллекта, написания кода, вызова инструментов, визуального восприятия и понимания длинных контекстов, что позволяет ей открывать еще больше экономической ценности для людей.»
Неясно, прошел ли бенчмарк внешнюю проверку, оставляя отраслевых экспертов ждать независимой верификации утверждений.
Технический разбор: три модели для трех задач
GPT-5.2 стал доступен в рамках платных подписок в четверг, а доступ к API был открыт в тот же день. Разработчики теперь могут выбирать из трех различных версий, каждая из которых оптимизирована для различных профессиональных потребностей.
Цены на API установлены в размере $1.75 за миллион входных токенов и $14 за миллион выходных токенов.
Помимо бенчмарка GDPval, GPT-5.2 показала улучшенные результаты на известных технических тестах, набрав более высокие оценки на GPQA Diamond и FrontierMath. Также, по сообщениям, она продемонстрировала более надежные результаты в сложных задачах, таких как кодирование, анализ данных и проектирование экспериментов.
В объявлении компания представила несколько положительных отзывов от ранних тестировщиков.
Релиз более компетентного AI для работы приходится на уже напряженную рабочую среду.
Корпоративные руководители в основном настроены оптимистично, о чем свидетельствует недавний опрос Just Capital, показывающий, что 93% бизнес-лидеров считают AI положительным фактором. Однако тот же опрос выявил, что почти половина американцев ожидает, что технология уничтожит рабочие места, что, по сообщениям, меньше тревожит руководителей.