Я заметил кое-что интересное в стратегии NVIDIA в данный момент. На прошлой неделе Дженсен Хуанг подробно объяснил, почему NVIDIA инвестировала 20 миллиардов долларов в приобретение Groq, и честно говоря, это блестящее стратегическое решение, которое показывает, как рынок инференса меняется.



Итак, вот контекст: долгое время все сосредотачивались на одной метрике — пропускной способности. Но Groq понял кое-что, что упустили другие. Инженеры-программисты теперь готовы платить больше за более быстрые ответы. Это совершенно новый сегмент рынка. Как сказал Хуанг, если можно предложить токены с ультра-низкой задержкой, делая разработчиков более продуктивными, они заплатят за это. Это рынок, который только начинает формироваться.

И именно здесь на сцену выходит Groq. Это приобретение заполняет существенный пробел в арсенале инференса NVIDIA. В то время как NVIDIA доминирует в сегменте высокой пропускной способности с традиционными решениями, Groq предлагает нечто совершенно иное: архитектуру LPU, известную своей исключительно низкой детерминированной задержкой. В марте на GTC NVIDIA представила Groq 3 LPU, изготовленный по 4 нм техпроцессу у Samsung. Цифры впечатляют — в 35 раз больше инференса на мегаватт на моделях с 1000 миллиардами параметров по сравнению с Blackwell NVL72.

Это в основном расширение кривой Парето рынка. Вместо выбора между высокой пропускной способностью и низкой задержкой NVIDIA теперь создает два отдельных сегмента. Groq продолжает работать как независимая структура, Джонатан Росс и его команда присоединились к NVIDIA. Саму модель можно оценивать по-разному в зависимости от времени отклика — меньшая пропускная способность, но цена за единицу значительно выше. Это чистая коммерческая гениальность, и она показывает, как усложняется рынок ИИ. Обе подхода будут сосуществовать, и клиенты выберут в зависимости от своих реальных потребностей.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить