"GLM"検索結果
2026-03-25
06:07

中国モデルが前回のSWE-rebenchで全て上位10に入らず「スコア稼ぎ」と嘲笑されたが、今回は4席を占めた

SWE-rebenchは リアルタイム ソフトウェア エンジニアリング タスク ベンチマーク テストであり、最新のランキング更新ではデモンストレーションと操作の制限が廃止され、補助的な評価タスクが追加されました。Claude Opus 4.6は65.3%で第1位にランクインし、GLM-5は62.8%で第3位となり、4つの中国のモデルがトップ10に入り、中国のモデルの進歩を示しています。
もっと
05:55

SWE-rebench 最新榜单:中国 AI 模型占前十四席,GLM-5 排名第三 (This text is already in Chinese/Japanese context. Since the instruction asks to translate to Japanese and this appears to be a Chinese title/headline, here is the Japanese translation:) SWE-rebench 最新ランキング:中国のAIモデルがトップ14を独占、GLM-5が3位にランクイン

3月23日、SWE-rebench ベンチマークテストが最新ランキングを発表し、Claude Opus 4.6 が第1位となりました。今回の更新ではサンプルデモンストレーションとステップ数の制限が廃止され、補助的な評価タスクが追加されました。GLM-5 はオープンソースモデルの中で第3位にランクインし、中国のモデルが合わせて4席を占めています。
もっと
04:41

GLM-5はAI予測市場取引コンテストで42.99%のリターンを達成し、人間の基準モデルを唯一上回る存在となった

智谱Z.aiのグローバル責任者である李子玄氏は、GLM-5がPrediction Arenaの予測市場で42.99%のリターン率を記録し、人間のベンチマークを上回る唯一のAIモデルとなったことを明らかにしました。このモデルは98件の取引を行い、卓越したパフォーマンスを示しました。
もっと
02:57

智谱 AI が GLM-5-Turbo モデルを発表、速度が 2-3 倍向上、API 価格を 20%引き上げ

智谱AIは3月16日にGLM-5の高速最適化版であるGLM-5-Turboモデルを発表しました。これはOpenClawエージェントシナリオ向けに特別に設計されたもので、速度は2倍から3倍に向上し、200Kのコンテキストと128Kの最大出力をサポートしています。また、ツール呼び出しの安定性などの点も最適化されています。評価試験ではGLM-5を大きく上回る性能を示し、同時にAPIの価格引き上げと個人ユーザープランの導入も行われました。
もっと
11:16

テンセントクラウドの混元モデルは3月13日から大幅に値上げされ、最大で460%以上の値上げとなります。

Tencent Cloudは、2024年3月13日よりインテリジェントエージェント開発プラットフォームの一部モデルの料金体系を調整します。HY2.0シリーズモデルの価格が大幅に上昇し、また、GLM 5、MiniMax 2.5、Kimi 2.5モデルは無料のパブリックテストを終了し、有料化されます。パッケージプランのユーザーは一部の料金を差し引くことができます。
もっと