GROK 4: БЕНЧМАРК-ПУШИНГ ИИ ВПЕРЕД



xAI пропустила 3.5 и перешла сразу к Grok 4, и цифры показывают, почему.

Бенчмарки ставят его на вершину области, с результатами Последнего Экзамена Человечества 38.6% для модели с одним агентом и 44.4% для Grok 4 Heavy.

Результаты ARC-AGI также установлены
GROK3.3%
XAI4%
WHY-0.5%
H8.59%
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Репост
  • Поделиться
комментарий
0/400
CryptoHistoryClassvip
· 15ч назад
ах да... классическая "пропустить версию" стратегия из эпохи доткомов. смиритесь, эти метрики вызывают у меня серьезные вибрации Cisco 1999 года
Посмотреть ОригиналОтветить0
FUD_Whisperervip
· 15ч назад
Ах, Маск бык, На луну!
Посмотреть ОригиналОтветить0
MysteriousZhangvip
· 15ч назад
Прямо игнорировать эту операцию 3.5 можно.
Посмотреть ОригиналОтветить0
SerumSurfervip
· 15ч назад
Этот шаг показывает, что Маск действительно спешит.
Посмотреть ОригиналОтветить0
WalletsWatchervip
· 15ч назад
Что это за штука? Цифры такие большие!
Посмотреть ОригиналОтветить0
NeverVoteOnDAOvip
· 15ч назад
Невероятно, прям сразу до 4.0 прыгнули.
Посмотреть ОригиналОтветить0
  • Закрепить