meta为谷歌数十亿租赁tpu 提供ai算力支持

今年2月26日,The Information透露,Meta正在进行一系列动作来减少对单一供应商的依赖。为了应对市场竞争,Meta决定给谷歌数十亿用来租赁其TPU,这样就能给自家的数据中心提供更多的AI算力支持。虽然英伟达GPU在训练模型方面仍然占有很大优势,但Meta开始探索新的选择,比如使用谷歌的TPU进行训练,这是一个不常见的举动。根据消息人士透露,这次租用协议价值数十亿,而且Meta还打算在明年购买更多谷歌的TPU。这个动作的意义在于,它表明Meta正在努力降低对单一供应商的依赖。除了谷歌,Meta还宣布与AMD达成了大订单。但是知情人士表示,这个合作主要是为了给现有模型进行推理,而不是为了训练新模型。为了进一步分散风险,Meta也在继续研发自己的推理芯片。 在这个交易披露不久前,英伟达宣布与Meta达成了新的合作。英伟达表示,未来几年内会给Meta数百万个GPU。这就把两家公司的动态放在一起看:虽然离不开英伟达GPU的训练生态,但是Meta已经开始把一些训练和推理任务分给了第二选择。这个转变部分是因为Meta自研AI训练芯片进展不顺顺且不太顺利。另一个现实因素是OpenAI和Meta等客户在大规模部署英伟达最新Blackwell芯片时遇到过一些技术故障和硬件复杂性问题。 知情人士指出,谷歌正在加大力度与英伟达在AI训练芯片市场竞争,希望TPU销售能给公司带来额外数十亿美元收入。有人曾提到如果把TPU业务加速提升就能拿到相当于英伟达年收入10%的份额;按报道口径估算,英伟达过去12个月年收入约2000亿美元。除了和Meta达成协议外,谷歌还和一家大型投资机构合作设立一个合资项目来租赁TPU给其他客户。还有其他私募股权机构也在与谷歌洽谈类似合资项目。至少已有一家大型投资机构签署条款清单。 同时,谷歌企业发展团队也在和金融伙伴讨论通过特殊目的载体(SPV)融资购买TPU再对外出租;这可能涉及到把TPU作为债务抵押品来筹集资金。报道把这种做法比作xAI与风投机构Valor围绕英伟达GPU所做的“创造性融资”结构。 然而,并不是所有因素都支持这个交易顺利进行。首先是供给端紧张问题:谷歌自家Gemini模型团队也需要使用TPU资源;并且Gemini和英伟达GPU都由台积电生产意味着两者在工厂内争夺同一类产能资源。这决定了谷歌能否快速复制给像Meta那样大客户订单的能力如何均衡发展问题成为关键。