Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
8 лайків
Нагородити
8
6
Репост
Поділіться
Прокоментувати
0/400
CryptoHistoryClass
· 15год тому
ах так... класичний "пропустити версію" плейбук з ери доткомів. смх ці метрики викликають у мене серйозні вібрації 1999 року від cisco
GROK 4: БЕНЧМАРКОВИЙ ШТУЧНИЙ ІНТЕЛЕКТ ДЛЯ РОЗВИТКУ
xAI пропустила 3.5 і перейшла відразу до Grok 4, і цифри показують чому.
Бенчмарки ставлять його на верхівку галузі, з оцінками Останнього екзамену людства 38,6% для моделі з одним агентом та 44,4% для Grok 4 Heavy.
Результати ARC-AGI також встановлені