英伟达砸200 亿美元给groq,让咱们看清了做ai 芯片背后的经济账。

英伟达砸下200亿美元给Groq,让咱们看清了做AI芯片背后的经济账。大家都知道英伟达的帝国是靠着GPU堆起来的,可这一笔巨额投资透露出他们并不完全信GPU能搞定最关键的阶段——“推理”。所谓推理,说白了就是让模型回答问题、写代码、推商品、总结文档、开聊天机器人或者看图片的时候跑的计算。这时候大家就得拼成本、拼速度、拼效率,谁在这块儿能占据优势,谁就能拿到更多的利润。所以英伟达才趁着圣诞假期前的空档,赶紧把Groq的技术给收了过来,顺便还把这家专做低延迟芯片的公司大部分人招进了自家队伍,连创始人乔纳森·罗斯都留了下来。 英伟达的CEO黄仁勋对这事儿看得很透。他虽然嘴上说在AI每个环节都表现得好,但在财报会上还是吐槽推理“确实非常非常难”。现在的推理可不像大家以为的那样发个提示就等答案那么简单,它得处理上亿人的请求、保证低延迟,还得管着别让成本太高。那些需要一步步走的智能助手更是让事情变得更复杂也更容易出错。黄说大家都觉得推理是一次性的活特简单,“谁都能进来抢饭碗”,其实这才是最难的事儿。 这种表态也说明,哪怕是训练AI这块儿的老大也对未来的推理经济心里没底。黄也说了推理对增长至关重要。他在一次参加BG2播客时提到,现在AI相关的收入里已经有超过40%是靠推理撑起来的,并且预言这一比例“马上就要翻好几个跟头”。“大多数人还没弄懂这块呢,”黄说,“这就是我们说的那个行业,那就是工业革命。”正因为CEO这么有信心,英伟达才敢在给不给钱、怎么花钱的策略上走得这么激进。 英伟达这么做其实是为了彻底掌控市场。坎布里安的分析师卡尔·弗罗伊德觉得这就像是当年Meta收购Instagram一样。“不是说Facebook不好,”他解释道,“就是想把另一个可能的竞争对手给堵住。”尽管黄之前在自家平台上表现得信心满满,“我猜他们发现客户买账的程度没达预期,”弗罗伊德猜测道,“或者说他们在Groq还有另一家叫D-Matrix的公司那种基于芯片内存的方法里看出了甜头。”弗罗伊德提到了微软支持的另一家快速AI芯片初创公司D-Matrix。这家公司最近刚融到2.75亿美元,估值达到了20亿美元。弗罗伊德觉得英伟达拿下Groq能给整个行业提气。“我估计D-Matrix现在肯定乐坏了,”他说,“因为这单交易估计能帮他们下一轮融资拿到更高的估值。” 其他高管也觉得现在的AI应用环境变了。随着聊天机器人往机器人、无人机和安防这些实时系统上发展,大家对速度和稳定性的要求越来越高。那些系统受不了数据往云端跑造成的延迟风险,也受不了算力不在线的麻烦。所以它们更喜欢Groq这种专用的芯片架构而不是那种大集群的GPU。OpenInfer的CEO Behnam Bastani就特别注重这种“边缘”应用——也就是在传感器或者本地服务器上直接运行AI推理的地方。他觉得这个市场现在还在起步阶段,英伟达是想借这个机会抢先布局。 因为推理这块的生意模式还在摸索当中,Bastani认为英伟达想把自己打造成一个大平台来覆盖整个生态系统而不是死磕单一的技术路线。“这就把英伟达变成了一个更大的平台,”他说。