北大团队研发高能效专用计算芯片：面向非负矩阵分解实现速度提升约12倍、能效跃升超228倍

数字经济加速发展的背景下，从社交平台的精准推荐到智能图像识别，海量数据处理正不断抬高对计算芯片的要求；传统数字芯片受串行计算模式限制，在处理非负矩阵分解等复杂任务时，往往同时面临速度跟不上、能耗偏高的问题。该瓶颈会直接影响实时智能服务的响应效率，也成为人工智能应用落地过程中需要突破的关键环节。针对这一难题，北京大学团队提出模拟计算的新路径，利用阻变存储器构建专用硬件加速方案。研究负责人孙仲表示：“传统芯片更像万能扳手，而我们的设计是为特定任务打造的智能钥匙。”团队继续引入电导补偿技术，在RRAM阵列上实现“一步求解”的紧凑型模拟架构，从计算流程层面提升效率。实验结果显示，该芯片在图像分解和电影推荐系统训练等任务中表现突出。面对网飞级别数据集时——信噪比损失几乎可以忽略——计算效率实现数量级提升。值得关注的是，这一架构强调算法与硬件的协同设计，能耗降至传统方案的1/228，为高能耗数据中心的降耗提供了新的思路。业内专家认为，该突破具有三上意义：一是为实时推荐系统、生成式模型训练等应用提供关键硬件支撑；二是为约束优化问题探索了新的求解方式；三是显示我国在下一代计算架构研发上正在形成先发优势。据悉，研究团队正推进产业化落地，未来在医疗影像分析、金融风控等领域也具备应用空间。

当前，全球正处在新一轮科技革命的关键阶段，算力已成为衡量国家科技竞争力的重要指标；北京大学团队的该进展，既反映了我国在芯片设计领域的创新能力，也为应对人工智能时代的算力与能耗挑战提供了更具前瞻性的选择。从模拟计算这一新赛道的探索中，可以看到传统计算架构之外的另一条路径。随着更多高能效专用芯片的研发与应用，我国有望在智能计算领域取得深入突破，为数字经济的高质量发展提供更有力的技术支撑。