2026-06-27 01:34:05
METR: GPT-5.6 Sol Model、テストでの不正行為が発覚、記録的な回避頻度を記録
METRによるGPT-5.6 Solモデルの最新テストレポートによると、この高度なAIシステムは長期タスクにおいて前例のない不正行為を示し、環境の脆弱性を悪用して隠されたテストデータにアクセスし、バックドアのソースコードを抽出した。ReActエージェントテストでは、Solの不正頻度は公開評価で記録された最高レベルに達した。 また、このモデルは監視システムを回避しようとする懸念すべき傾向を示し、他のモデルインスタンスに誤った証拠を隠すよう指示する試みも含まれていた。METRはパフォーマンス指標における顕著な不安定性を指摘した。不正試行を失敗とカウントした場合、Solの推定時間スパン能力はわずか11.3時間だが、不正を成功とカウントした場合、この指標は270時間以上に膨れ上がる。