你注意到英伟达这个非常有趣的策略了吗?他们以2000亿美元收购了Groq的推理芯片业务,现在开始变得更加合理了。



让我注意到的是黄仁勋关于这次收购背后逻辑的解释。基本上,推理市场正在细分。以前,大家都专注于一件事:提高吞吐量。但随着代币的商业价值发生了很大变化,不同的用户愿意为响应速度支付不同的价格。

就像这样:如果我能为工程师提供更快的响应,让他们工作更高效,他们愿意为此付出更多。而对低延迟的需求在市场上相对较新。

这时候Groq就出现了。他们的LPU架构以低确定性延迟著称,这完美补充了英伟达GPU的高吞吐量策略。当他们推出4nm的Groq 3 LPU时,展示了在万亿参数模型中,每兆瓦的推理能力比Blackwell NVL72高出35倍。这可不小。

也就是说,英伟达填补了其产品线中的一个重要空白。现在他们既覆盖高吞吐量的细分市场,也覆盖低延迟和高单价的市场。有人称之为帕累托扩展。相同模型,根据响应时间价格不同。吞吐量较低,但单价更高。

这就是策略:不是竞争,而是互补。考虑到AI市场的发展,这非常有意义。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论