文章围绕存内计算(Processing in Memory, PIM)系统性地探讨了其基本原理、不同存储设备在PIM中的应用以及近年来的典型开发成果。随着大数据应用的快速增长,传统冯·诺依曼架构在处理数据传输时效率低下,导致能耗增加和性能瓶颈。为解决这一问题,PIM技术通过直接在存储器中执行计算,减少了处理器和存储器之间的数据传输,展现了成为未来计算架构重要组成部分的潜力。
文章首先阐述了PIM的基本理念,并以传统冯·诺依曼架构与PIM架构的对比图展示了后者如何将计算任务转移至存储器内部,从而显著降低数据移动的延迟和功耗。文章回顾了PIM从20世纪70年代首次提出到近期由于人工智能和非易失性存储器技术成熟而再次复兴的历程,揭示了这一技术背后的动因:能效需求和技术条件的准备就绪。
在技术分类上,文章将PIM分为基于电荷的存储器(如SRAM、DRAM和Flash)和基于电阻的非易失性存储器(如RRAM、MRAM和PCM)。基于电荷的PIM依赖于CMOS技术的成熟性,但其易失性和泄漏功率问题限制了其性能;基于电阻的存储器因其非易失性和低功耗特点,近年来逐渐成为研究热点。文章详细讨论了这些存储器的结构设计、物理特性以及在神经网络计算中的具体应用。
文章着重介绍了各种存储器在PIM中的应用原型。例如,SRAM通过增加晶体管数量或调整设计实现向量-矩阵乘法(VMM);DRAM则通过模拟和数字方式扩展了存储器的计算能力;Flash-PIM则尝试利用商用NAND和NOR Flash存储器执行深度神经网络计算。然而,这些技术方案仍面临可靠性、计算精度和面积开销等挑战。
在基于电阻的存储器中,RRAM因其优越的能效比和作为模拟神经突触的潜力备受关注,其典型结构包括交叉阵列和1T1R阵列。MRAM凭借其高速度和非易失性成为大型神经网络应用的潜在选择,而PCM则展示了在模拟生物神经突触中的前景。尽管这些技术各有特点,但目前仍处于实验阶段,尚需进一步克服寄生效应、读写干扰等问题。
最后,文章总结了PIM面临的主要挑战,包括模数转换器(ADC)的分辨率问题、设备间的性能波动以及高精度计算能力的不足。为解决这些问题,作者提出了探索新型存储器设备、推广全数字化PIM架构以及加强存储器与CMOS集成的研究方向。此外,作者强调了PIM在推动人工智能和大数据计算效率方面的广阔前景,并呼吁学术界和产业界加强合作,共同加速PIM技术的产业化。
文章展示了PIM从理论到实际应用的发展历程及其在人工智能领域的潜在价值,同时对未来研究提出了建设性建议。
评论区