曦望发布启望S3推理GPU并推出低成本计划，力促大模型推理普及与生态协同

生成式人工智能应用加速落地之际，大模型推理成本正成为产业规模化应用的主要瓶颈；因此，国产GPU芯片厂商曦望发布启望S3芯片，通过架构创新与工艺优化，推理性能与成本控制上取得进展。启望S3面向大模型推理场景定制。在硬件设计上，芯片支持从FP16到FP4的多精度切换，采用LPDDR6显存方案，显存容量较上一代提升4倍，以适配不同推理任务在精度与存储上的差异化需求。实际应用显示，在DeepSeek V3、R1等主流大模型推理场景下，启望S3单位Token成本较上代产品降低约90%，整体性价比提升超过10倍，用户在获得相同推理能力时的投入明显下降。为满足更大规模推理需求，曦望同步推出寰望SC3-256超节点方案，可支持千亿级至万亿级参数的多模态混合专家模型推理，为企业级应用提供可扩展的部署选择，也显示其优化路径正从单点提升走向系统化方案。推理成本的更下降离不开生态协同。曦望联合商汤科技、第四范式等生态伙伴发起“百万Token一分钱”推理成本计划，通过协同芯片、算法与应用等产业链环节，推动成本提升。同时，曦望与浙江大学签署战略合作协议，共建“智能计算联合研发中心”，推动学术研究与产业应用衔接，为下一代芯片技术研发提供支撑。从融资与交付情况看，曦望近一年完成约30亿元战略融资，显示市场对其技术路线与商业前景的认可；2025年芯片交付量已突破万片，产品进入规模化应用阶段。曦望前身为商汤科技大芯片部门，独立后在融资、产品与生态建设上进展迅速。

国产高性能推理芯片的研发与应用推广，提升了关键技术的自主供给能力，也为数字经济提供了更坚实的算力基础；在全球科技竞争加剧的环境下，持续推动原创技术突破、完善产业生态，将是提升产业竞争力的重要路径。随着技术迭代与应用深化，国产高端芯片有望在更多场景实现落地与突破。