北大团队研发高能效专用计算芯片:面向非负矩阵分解实现速度提升约12倍、能效跃升超228倍

数字经济加速发展的背景下,从社交平台的精准推荐到智能图像识别,海量数据处理正不断抬高对计算芯片的要求;传统数字芯片受串行计算模式限制,在处理非负矩阵分解等复杂任务时,往往同时面临速度跟不上、能耗偏高的问题。该瓶颈会直接影响实时智能服务的响应效率,也成为人工智能应用落地过程中需要突破的关键环节。针对这一难题,北京大学团队提出模拟计算的新路径,利用阻变存储器构建专用硬件加速方案。研究负责人孙仲表示:“传统芯片更像万能扳手,而我们的设计是为特定任务打造的智能钥匙。”团队继续引入电导补偿技术,在RRAM阵列上实现“一步求解”的紧凑型模拟架构,从计算流程层面提升效率。实验结果显示,该芯片在图像分解和电影推荐系统训练等任务中表现突出。面对网飞级别数据集时——信噪比损失几乎可以忽略——计算效率实现数量级提升。值得关注的是,这一架构强调算法与硬件的协同设计,能耗降至传统方案的1/228,为高能耗数据中心的降耗提供了新的思路。业内专家认为,该突破具有三上意义:一是为实时推荐系统、生成式模型训练等应用提供关键硬件支撑;二是为约束优化问题探索了新的求解方式;三是显示我国在下一代计算架构研发上正在形成先发优势。据悉,研究团队正推进产业化落地,未来在医疗影像分析、金融风控等领域也具备应用空间。

当前,全球正处在新一轮科技革命的关键阶段,算力已成为衡量国家科技竞争力的重要指标;北京大学团队的该进展,既反映了我国在芯片设计领域的创新能力,也为应对人工智能时代的算力与能耗挑战提供了更具前瞻性的选择。从模拟计算这一新赛道的探索中,可以看到传统计算架构之外的另一条路径。随着更多高能效专用芯片的研发与应用,我国有望在智能计算领域取得深入突破,为数字经济的高质量发展提供更有力的技术支撑。