中国の人工知能スタートアップMiniMaxは、全く新しいAIモデルM2.1を発表し、再び世界の生成AI競争に挑戦します。このモデルは、プログラミング言語の多様性と実際の作業環境への対応能力を大幅に強化し、コード補助だけでなく、文書作成や対話応答においても全体的な性能向上を示しています。
今回発表されたM2.1は、前世代モデルM2の性能向上を超えることで、様々なプログラミング言語の理解度と生成精度を大幅に向上させました。サポートされる言語はRust、Java、Go、C++、Kotlin、Objective-C、TypeScript、JavaScriptなどに拡大され、Web、Android、iOSプラットフォームにおけるユーザーインターフェースデザインと美学構成能力も顕著に改善された評価を受けています。
特に、M2.1は単純なコード実行の正確性を強化するだけでなく、複雑なタスク指示や詳細なガイドラインを解釈し従う能力も向上させ、実際のオフィス環境により適したAIを構築しています。MiniMaxはこれにより、モデルの対話能力と文書作成能力を向上させ、日常の対話から技術文書の作成および構造化された応答に至るまでの幅広い範囲で優れた性能を発揮することを示しています。
AI代理オープンプラットフォームKilo Codeの共同創設者兼CEOスコット・ブレイテンオザーは次のように述べています。「初期テストでは、M2.1はアーキテクチャ設計、コード編成、レビュー、デプロイなど、全体の開発プロセスで非常に優れた成果を示しました。」また、このモデルはコスト効率と高レベルのパフォーマンスを同時に満たしていると評価しています。
このモデルは、VIBE(Executionのための視覚およびインタラクティブベンチマーク)と呼ばれる新しいベンチマーク指標を使用して評価されます。VIBEは、Web、シミュレーション、Android、iOS、バックエンド開発の5つのコア分野に基づいて構築され、エージェントベースの検証言語を通じて生成結果のインタラクションロジックと視覚要素を総合的に判断します。MiniMaxによると、M2.1はこのベンチマークテストで平均88.6ポイントを獲得し、その中でWebとAndroid分野ではそれぞれ91.5ポイントと89.7ポイントという優れた成績を収めました。
M2.1は主流のAIモデルとも性能比較が行われました。Anthropic、Google、OpenAI、DeepSeekなどの主要メーカーの主力モデルと並列評価された結果、M2.1は「Humanity’s Last Exam」や「Toolathon」といった高難易度のベンチマークテストでも強力な問題解決能力を示しました。特に、HLE w/o Toolsプロジェクトで22.0点を獲得し、MMLU(Pro)/人文・科学・技術分野の総合テストで88点を獲得し、トップAIモデル群と肩を並べました。
M2.1は現在、MiniMax独自のAPIまたはHugging Faceを通じてダウンロード可能であり、MiniMaxの代理を務める会社の代表もM2.1を基に運営されています。このモデルのリリースは、多言語コーディングサポートとAIエージェント市場の急速な進化を示しており、中国発の生成AIの汎用性と競争力が引き続き拡大していることを示唆しています。
67.89K 人気度
27.4K 人気度
10.96K 人気度
3.77K 人気度
2.71K 人気度
中国ミニマックスは、AIモデル'M2.1'を使用して再び世界の生成戦争に挑戦します
中国の人工知能スタートアップMiniMaxは、全く新しいAIモデルM2.1を発表し、再び世界の生成AI競争に挑戦します。このモデルは、プログラミング言語の多様性と実際の作業環境への対応能力を大幅に強化し、コード補助だけでなく、文書作成や対話応答においても全体的な性能向上を示しています。
今回発表されたM2.1は、前世代モデルM2の性能向上を超えることで、様々なプログラミング言語の理解度と生成精度を大幅に向上させました。サポートされる言語はRust、Java、Go、C++、Kotlin、Objective-C、TypeScript、JavaScriptなどに拡大され、Web、Android、iOSプラットフォームにおけるユーザーインターフェースデザインと美学構成能力も顕著に改善された評価を受けています。
特に、M2.1は単純なコード実行の正確性を強化するだけでなく、複雑なタスク指示や詳細なガイドラインを解釈し従う能力も向上させ、実際のオフィス環境により適したAIを構築しています。MiniMaxはこれにより、モデルの対話能力と文書作成能力を向上させ、日常の対話から技術文書の作成および構造化された応答に至るまでの幅広い範囲で優れた性能を発揮することを示しています。
AI代理オープンプラットフォームKilo Codeの共同創設者兼CEOスコット・ブレイテンオザーは次のように述べています。「初期テストでは、M2.1はアーキテクチャ設計、コード編成、レビュー、デプロイなど、全体の開発プロセスで非常に優れた成果を示しました。」また、このモデルはコスト効率と高レベルのパフォーマンスを同時に満たしていると評価しています。
このモデルは、VIBE(Executionのための視覚およびインタラクティブベンチマーク)と呼ばれる新しいベンチマーク指標を使用して評価されます。VIBEは、Web、シミュレーション、Android、iOS、バックエンド開発の5つのコア分野に基づいて構築され、エージェントベースの検証言語を通じて生成結果のインタラクションロジックと視覚要素を総合的に判断します。MiniMaxによると、M2.1はこのベンチマークテストで平均88.6ポイントを獲得し、その中でWebとAndroid分野ではそれぞれ91.5ポイントと89.7ポイントという優れた成績を収めました。
M2.1は主流のAIモデルとも性能比較が行われました。Anthropic、Google、OpenAI、DeepSeekなどの主要メーカーの主力モデルと並列評価された結果、M2.1は「Humanity’s Last Exam」や「Toolathon」といった高難易度のベンチマークテストでも強力な問題解決能力を示しました。特に、HLE w/o Toolsプロジェクトで22.0点を獲得し、MMLU(Pro)/人文・科学・技術分野の総合テストで88点を獲得し、トップAIモデル群と肩を並べました。
M2.1は現在、MiniMax独自のAPIまたはHugging Faceを通じてダウンロード可能であり、MiniMaxの代理を務める会社の代表もM2.1を基に運営されています。このモデルのリリースは、多言語コーディングサポートとAIエージェント市場の急速な進化を示しており、中国発の生成AIの汎用性と競争力が引き続き拡大していることを示唆しています。