问题:推理规模化落地面临存储瓶颈 随着人工智能服务加速进入行业应用阶段,推理服务对存储系统提出了更高要求。与集中式训练不同,推理场景需要同时满足高并发、低延迟、稳定性和成本效益。频繁的数据调取和模型切换要求存储系统兼具高速响应、大容量和低能耗特性。传统层级存储往往难以平衡带宽、容量和能效,制约了推理服务的部署密度和质量。 原因:存储架构存在性能与容量的断层 当前数据中心存储系统面临结构性挑战:高端存储(如HBM)虽然带宽高但容量有限且成本高昂;固态硬盘容量大、成本可控,却无法提供同等水平的带宽和延迟表现。推理应用既需要内存级的快速访问能力,又要支持大规模数据集的扩展存储,这种"上层快但难扩展、下层可扩展但不够快"的矛盾成为基础设施升级的主要障碍。 影响:新型存储可能改变系统架构与成本结构 闪迪与SK海力士合作开发的HBF技术定位介于高带宽存储和固态存储之间,旨在实现协同效应:高带宽存储处理关键数据通路,HBF则负责带宽敏感型数据的大规模缓存和扩展。行业专家指出,这种方案如能成熟应用,将提升推理集群的资源利用率,减少为追求峰值性能而过度配置昂贵资源的情况,从而优化数据中心总体拥有成本。此外,统一标准还有助于降低生态碎片化风险,促进服务器、加速器和存储系统的协同发展。 对策:通过标准化推动生态协同 双方宣布在OCP框架下成立专项工作组,推进HBF标准化进程。这个举措反映了行业共识:统一标准对降低适配成本至关重要,特别是在涉及芯片、互连、固件和系统软件的推理基础设施领域。标准化不仅能建立可验证的工程路径,还能增强客户信心,为后续大规模部署和多平台兼容奠定基础。 前景:2030年前或迎来需求拐点 业界普遍预测,随着多模态模型发展、在线应用普及和用户规模扩大,推理需求将持续增长。在搜索推荐、智能客服、工业视觉等场景中,数据访问模式正从"少量高频"向"海量多源"转变,这将凸显存储优化的价值。如果HBF能在标准、产品和生态上取得突破,集成存储解决方案有望在2030年前后迎来快速发展期,并推动服务器设计、数据中心运维和采购模式的变革。同时,能效和低碳目标也将成为技术发展的重要考量因素。
闪迪与SK海力士的合作展现了存储行业应对AI挑战的前瞻性;通过推动高带宽闪存标准化,两家企业不仅实现了技术创新,更为AI生态协同发展创造了条件。随着标准化的推进和产业链各方的参与,高带宽闪存有望成为连接高性能计算与大容量存储的关键环节,为AI应用的广泛落地提供有力支撑。