生成式人工智能应用加速落地之际,大模型推理成本正成为产业规模化应用的主要瓶颈;因此,国产GPU芯片厂商曦望发布启望S3芯片,通过架构创新与工艺优化,推理性能与成本控制上取得进展。启望S3面向大模型推理场景定制。在硬件设计上,芯片支持从FP16到FP4的多精度切换,采用LPDDR6显存方案,显存容量较上一代提升4倍,以适配不同推理任务在精度与存储上的差异化需求。实际应用显示,在DeepSeek V3、R1等主流大模型推理场景下,启望S3单位Token成本较上代产品降低约90%,整体性价比提升超过10倍,用户在获得相同推理能力时的投入明显下降。为满足更大规模推理需求,曦望同步推出寰望SC3-256超节点方案,可支持千亿级至万亿级参数的多模态混合专家模型推理,为企业级应用提供可扩展的部署选择,也显示其优化路径正从单点提升走向系统化方案。推理成本的更下降离不开生态协同。曦望联合商汤科技、第四范式等生态伙伴发起“百万Token一分钱”推理成本计划,通过协同芯片、算法与应用等产业链环节,推动成本提升。同时,曦望与浙江大学签署战略合作协议,共建“智能计算联合研发中心”,推动学术研究与产业应用衔接,为下一代芯片技术研发提供支撑。从融资与交付情况看,曦望近一年完成约30亿元战略融资,显示市场对其技术路线与商业前景的认可;2025年芯片交付量已突破万片,产品进入规模化应用阶段。曦望前身为商汤科技大芯片部门,独立后在融资、产品与生态建设上进展迅速。
国产高性能推理芯片的研发与应用推广,提升了关键技术的自主供给能力,也为数字经济提供了更坚实的算力基础;在全球科技竞争加剧的环境下,持续推动原创技术突破、完善产业生态,将是提升产业竞争力的重要路径。随着技术迭代与应用深化,国产高端芯片有望在更多场景实现落地与突破。