英伟达的推理芯片大显身手,黄仁勋都说了,这是“世界从未见过”的东西。

英伟达这次又要在AI领域玩大的了,准备拿一款新的推理芯片大显身手,黄仁勋都说了,这是“世界从未见过”的东西。这个芯片直接把Groq的语言处理单元塞进了硅片里,专为那种“一问一答”的场景做加速。简单来说,它让原来只干训练活儿的GPU头一回直面推理战场,整个行业的格局马上就不一样了。 就在发布会的前几天,英伟达交了一份漂亮的成绩单:营收681亿美元,同比涨了73%,打破了历史纪录;净利润429.6亿美元,同比猛增94%;毛利率也达到了75%,又多了两个百分点。本来大伙儿以为股价会跟着大涨一波,结果盘后先是冲高,接着跳水,第二天直接收跌,几千亿美元的市值就在这“超预期”的一片欢呼声中偷偷溜走了。华尔街开始嘀咕:营收再好,也藏不住长袍下面全是裂缝的事实。 大家都知道GPU在训练这块儿很厉害,可推理这块儿一直被FPGA、ASIC、DSP这些专用芯片霸占着。成本、功耗和延迟这三座大山一压下来,英伟达的这层“长袍”就漏风了。于是他们拿出200亿美元下了血本,想把LPU跟GPU、DSP还有AI加速器缝成一个混合芯片网。只要这招管用,推理速度就能提升10倍,功耗下降5倍。要是成了,英伟达就能把神话从训练端延续到推理端;要是不成,GPU之王的位子估计就保不住了。 对于英伟达来说,这绝对不是简单的产品发布,而是一场像诺曼底登陆那样的突围战。现在的局势是成本上专用芯片把价格压得很低;架构上FPGA和ASIC用定制指令把延迟砍得很短;生态上云、边缘和终端各自为战。英伟达必须把这三个方面的局面都控制住,才能把“训练—推理—服务”全链路攥成拳头,继续吃软件生态的红利。不然就算训练优势再大,也架不住对手在推理端一次次“偷塔”。 等到下个月GTC那场发布会结束的时候,答案就出来了:是英伟达继续称王称霸,还是专用芯片完成逆袭?这场发布会早就写进了AI历史的下一页。