Jin10データ8月28日報道、OpenAIとAnthropicは最近、お互いのモデルを評価し、自社のテストで見落とした可能性のある問題を発見することを目指しました。両社は水曜日にそれぞれのブログで、今年の夏に公開されているAIモデルに対して安全性テストを行い、モデルに幻覚傾向があるかどうか、また「失准」(misalignment)と呼ばれる問題、つまりモデルが開発者の期待通りに機能していないかどうかを検証したと述べました。これらの評価はOpenAIがGPT-5を発表し、Anthropicが8月初めにOpus 4.1をリリースする前に完了しました。Anthropicは元OpenAIの従業員によって設立されました。
OpenAIとAnthropicは、モデルの幻想や安全性などの問題を相互にテストしています。
Jin10データ8月28日報道、OpenAIとAnthropicは最近、お互いのモデルを評価し、自社のテストで見落とした可能性のある問題を発見することを目指しました。両社は水曜日にそれぞれのブログで、今年の夏に公開されているAIモデルに対して安全性テストを行い、モデルに幻覚傾向があるかどうか、また「失准」(misalignment)と呼ばれる問題、つまりモデルが開発者の期待通りに機能していないかどうかを検証したと述べました。これらの評価はOpenAIがGPT-5を発表し、Anthropicが8月初めにOpus 4.1をリリースする前に完了しました。Anthropicは元OpenAIの従業員によって設立されました。