SCENEを発見
最後の大規模リリースからわずか数週間後、OpenAIはフラッグシップのChatGPTを消費者向けの新奇性から、不可欠な企業のパワーハウスへと積極的に pivot しています。
木曜日に、同社はGPT-5.2をリリースしました。これは、より高速、より信頼性が高く、複雑な専門的ワークフローに対応できると主張する新しい大規模言語モデルです。
このアップデートは、OpenAIが宿題支援や一般的な問い合わせを超え、代わりにその技術をビジネス世界の重要で日常的なツールとして組み込もうとしていることを示しています。これは、米国政府やディズニーとの収益性の高い契約から明らかです。
「私たちは、GPT‑5.2を設計して、より多くの経済的価値を人々に提供できるようにしました」とOpenAIは声明で述べました。「スプレッドシートの作成、プレゼンテーションの構築、コードの作成、画像の認識、長い文脈の理解、ツールの使用、複雑で多段階のプロジェクトの処理において、より優れています。」
GPT-5.2の性能を宣伝し、同社はGDPvalと呼ばれる独自の評価ベンチマークを導入しました。これは44の職業にわたるタスクをシミュレートします。
GPT-5.2は、比較の約71%において人間の労働者のパフォーマンスと一致、またはそれを超えたと同社は主張しています。
「GDPvalでは、思考モデルがスプレッドシート、プレゼンテーション、ドキュメント作成などの一般的な専門的タスクの70.9%で人間の専門家を上回るか引き分けです」と、OpenAIのアプリケーション担当CEO Fidji SimoはX上で書きました。「また、一般知能、コード作成、ツール呼び出し、ビジョン、長い文脈の理解においても優れており、より多くの経済的価値を人々にもたらすことができます。」
このベンチマークが外部レビューを受けたかどうかは不明であり、業界の専門家は独立した検証を待つ必要があります。
GPT-5.2は木曜日に有料サブスクリプション tiers で利用可能となり、同日APIアクセスも開始されました。開発者は、異なる専門的ニーズに最適化された三つの異なるバージョンから選択できます。
APIの料金は、入力トークン1百万あたり1.75ドル、出力トークン1百万あたり$14 ドルに設定されています。
GDPvalベンチマークに加え、GPT-5.2は既存の技術テストでも向上した性能を示し、GPQA DiamondやFrontierMathでより高いスコアを記録しました。また、コーディング、データ分析、実験設計といった要求の厳しいタスクでもより安定した結果を示したと報告されています。
発表では、早期テスターからの好意的なフィードバックもいくつか紹介されました。
より有能な職場AIのリリースは、すでに緊迫した労働環境の中で行われています。
企業幹部は概ね楽観的であり、Recent Just Capital調査によると、ビジネスリーダーの93%がAIをポジティブな力と見なしています。しかし、同じ調査では、アメリカ人のほぼ半数がこの技術によって仕事がなくなることを懸念しているとされ、幹部の間ではその懸念はやや少ないと報告されています。
3.96K 人気度
639.7K 人気度
54.79K 人気度
12.96K 人気度
540.42K 人気度
OpenAI、GPT-5.2を発表、主要契約の拡大に伴う
要約
Decryptのアート、ファッション、エンターテインメントハブ。
SCENEを発見
最後の大規模リリースからわずか数週間後、OpenAIはフラッグシップのChatGPTを消費者向けの新奇性から、不可欠な企業のパワーハウスへと積極的に pivot しています。
木曜日に、同社はGPT-5.2をリリースしました。これは、より高速、より信頼性が高く、複雑な専門的ワークフローに対応できると主張する新しい大規模言語モデルです。
このアップデートは、OpenAIが宿題支援や一般的な問い合わせを超え、代わりにその技術をビジネス世界の重要で日常的なツールとして組み込もうとしていることを示しています。これは、米国政府やディズニーとの収益性の高い契約から明らかです。
「私たちは、GPT‑5.2を設計して、より多くの経済的価値を人々に提供できるようにしました」とOpenAIは声明で述べました。「スプレッドシートの作成、プレゼンテーションの構築、コードの作成、画像の認識、長い文脈の理解、ツールの使用、複雑で多段階のプロジェクトの処理において、より優れています。」
職場の自動化の新しいベンチマーク
GPT-5.2の性能を宣伝し、同社はGDPvalと呼ばれる独自の評価ベンチマークを導入しました。これは44の職業にわたるタスクをシミュレートします。
GPT-5.2は、比較の約71%において人間の労働者のパフォーマンスと一致、またはそれを超えたと同社は主張しています。
「GDPvalでは、思考モデルがスプレッドシート、プレゼンテーション、ドキュメント作成などの一般的な専門的タスクの70.9%で人間の専門家を上回るか引き分けです」と、OpenAIのアプリケーション担当CEO Fidji SimoはX上で書きました。「また、一般知能、コード作成、ツール呼び出し、ビジョン、長い文脈の理解においても優れており、より多くの経済的価値を人々にもたらすことができます。」
このベンチマークが外部レビューを受けたかどうかは不明であり、業界の専門家は独立した検証を待つ必要があります。
技術的解説:三つのモデルによる三つの仕事
GPT-5.2は木曜日に有料サブスクリプション tiers で利用可能となり、同日APIアクセスも開始されました。開発者は、異なる専門的ニーズに最適化された三つの異なるバージョンから選択できます。
APIの料金は、入力トークン1百万あたり1.75ドル、出力トークン1百万あたり$14 ドルに設定されています。
GDPvalベンチマークに加え、GPT-5.2は既存の技術テストでも向上した性能を示し、GPQA DiamondやFrontierMathでより高いスコアを記録しました。また、コーディング、データ分析、実験設計といった要求の厳しいタスクでもより安定した結果を示したと報告されています。
発表では、早期テスターからの好意的なフィードバックもいくつか紹介されました。
より有能な職場AIのリリースは、すでに緊迫した労働環境の中で行われています。
企業幹部は概ね楽観的であり、Recent Just Capital調査によると、ビジネスリーダーの93%がAIをポジティブな力と見なしています。しかし、同じ調査では、アメリカ人のほぼ半数がこの技術によって仕事がなくなることを懸念しているとされ、幹部の間ではその懸念はやや少ないと報告されています。