近年来,一些新型存储器的种类和构型频出(但多数IP已经有15年+的历史);其中包括:相变存储器(PCM)、阻变存储器(ReRAM)、磁变/磁阻存储器(MRAM)、铁电存储器(FRAM)等等NVM型介质。
首先比较一下几种介质/构型的特点:以ReRAM为参照,ReRAM随机读写速度优于传统存储器,但要慢于MRAM和FRAM;同时ReRAM的读写次数约在100万次左右,较传统存储器有数量级的增加,但少于MRAM的读写次数;其中密度和相应的成本是ReRAM的最大优势;从成本方面看,MRAM由于材料的复杂性、密度瓶颈、抗磁干扰等难点,其成本会较高;而PCRAM的特点则在于密度可以做到与RERAM相同水平,但PCRAM读的速度会逊于ReRAM,同时其与RERAM最大的区别在于,由于工艺制程较为复杂,因此PCRAM的良率有待提升。另外,FRAM则与MRAM的性能较为类似,但其读写速度要优于MRAM,且可以保持较低的功耗,FRAM的劣势则在于,其成本比MRAM还要高,所以它可以应用于一些非常特殊的市场(比如助听器市场);而ReRAM颗粒的国内商用市场也仅有IoT芯和IoT安全领域(NAND/NOR颗粒 - 如电子烟/电池/快充等需要身份认证芯片的gadgets品类)。
随后重点谈谈MRAM。[e]MRAM是当下很流行、性能十分有代表性的一种新型存储器,同样是非易失性的磁性随机存储器,原理上依赖于两个铁磁层的(相对)磁化状态来存储二进制信息;同时兼顾着静态随机存储器(SRAM)的高速读写能力,以及动态随机存储器(DRAM)的高集成度,并且基本上可以无限次地重复写入。同时在应用范围和效益的角度,改变/优化存储设备的Memory Hierarchy结构对于Device/AIoT这种大规模商用场景的节能和空间压缩的意义不言而喻,这也是eMRAM的潜力之一。多年来出现过不同风格的 MRAM 存储器,使 MRAM 对缓存应用程序和内存计算越来越有吸引力;当下的 MRAM 家族成员包括了三类:自旋转移扭矩 (spin-transfer torque :STT)、自旋轨道扭矩 (spin-orbit torque:SOT)、电压控制(VCMA-和 VG-SOT)。
【原理上的比较:无论是易失型的的DRAM还是非易失型的NAND_Flash,都是利用电荷来存储二进制数据的(0/1),而 MRAM不同,它是利用铁磁层的集体磁化状态来达到存储和读写目的;其核心元件就是磁性隧道结 (magnetic tunnel junction:MTJ),其中薄介电层是夹在磁性固定层和磁性自由层之间。Storage_cell的写入操作是通过切换自由铁磁层(MRAM的位单元的存储层)的磁化来执行的;而在读取操作时,MTJ的磁阻是通过使电流通过的隧道中的交叉结<junction>来测量的,这条隧道的磁阻 ( tunnel magnetoresistance:TMR) 可以高或低,它取决于自由层和固定层的磁化的相对方向(即平行或反平行,表达为1或 0)】
其实MRAM介质和构型的发展已经有几十年历史,但直到90年代第一项突破:自旋转移矩MRAM (STT-MRAM)的发明,这种介质才显示出民用商业化的可能。相对于MRAM的原理,STT-MRAM是使用电流来诱导自由磁性层的切换;通过使电流通过固定磁性层,就可以产生自旋极化电流(其中有更多的电子向上或向下旋转);期间,如果此自旋极化电流被引导到自由铁磁层,角动量可以转移到该层(即自旋转移扭矩),从而改变其磁取向。而随后的第二个突破是来自材料方面:当时是将铁磁CoFeB被引入作为自由磁性层的材料,于是器件效率就明显提升了(主要是在更高的隧道磁阻方面)。1 此后的第一种基于STT-MRAM 的产品是在Y15 年上市,起初作为DRAM和SSD的非易失性的缓存,后来又作为嵌入式Flash的替代,直到目前STT-MRAM的产品化形态大都是嵌入式的。--2 近年来,除了STT构型还出现了SOT构型,相比前者,SOT在器件的耐用性和读取稳定性、以及开关延迟都得到了优化(STT操作期间的开关速度是5ns天花板,SOT可以实现低至210ps的可靠开关),但在结构上却比STT型更占用面积,当下SOT的研究方向主要在密度缩放,主要是为了能够替代SRAM。--3 除前两者以外,还存在一种叫作VCMA-MRAM的器件,特点是超低功耗,但写入速度却是相比前两者最慢的。--3 最新的一种方案叫作VG-SOT-MRAM,顾名思义是结合了VCMA和SOT效应的优点,并解决了传统SOT的密度限制,以及继承了传统SOT的优点,VG-SOT也可以在亚纳秒范围内实现快速切换/开关速度,因此VG-SOT就具备了在任何类型的缓存中发挥作用的完整功能,甚至有望实现真正的统一缓存和PIM,关于这种方案的应用前景主要是在模拟内存计算,当下还是概念化的,但模拟内存计算本身已经被认为是实现多级神经网络权重的很有前景的方案。
再回到当下期间的民用商业化问题。其实在当下(Y19),主流的几家Fab多把MRAM看作是过渡技术,IP层很薄,从大厂的角度看不出长远的超级利润,需求也很离散,customer ramping会非常耗力,并不像是大型IC厂争夺的赛道。当然除非Apple这样的富应用生态头部牵头。从 Y18年左右,Intel/Samsung等几家大厂都是拿半报废设备(折旧残值设备)出来玩,都没有一个行业标准,实验室报告是讲讲罢了。事实上,eMRAM存在超过10年了,如今从故纸堆里挖出来,什么动机呢? 几点假想:
泛泛而谈,也要看OS等关键应用的站台情况,生态建设,目前还不是亚洲厂的强项。找哪个厂商去改OS,一并刷full stack呢,这是大问题,倘若不改full stack,也就当成DRAM用,性能不但没有优势还会偏低。网上有一则野闻: 说是Intel要借助MRAM影响Android系的移动端市场。-- 但是,MRAM也要重写OS的,OS厂商做此投入的产出在哪里呢。
不过,MRAM也许会在端侧到Edge侧承担起data exchange intensive,但目前赛道还是窄的。
那么,延伸到嵌入式的[embedded]MRAM,巨头们纷纷下注eMRAM的原因就在于材料工艺的兼容性(与逻辑电路可以集成一个die,前提是材料物理兼容),其磁场干扰问题还在慢慢的攻关排除。而eMRAM的诱惑在于Memory Hierarchy,其中File Hierarchy可以极度简化,OS会轻量很多,尤其对于Device/IOT设备而言,节能和空间压缩的意义不言而喻。但首要是IP,特别是敏感的介质材料配方(CoFeB),Intel PCM如今也没泄露这个介质,甚至没有对外披露是PCM还是ReRAM;但当前用PCM,性能还不理解,因此短期看好一下eMRAM吧。
但是eMRAM不可回避的存在电磁环境干扰问题,AIoT场景因此会面临挑战;此外它还昂贵,工艺复杂,设计难度高。但在短期eMRAM是可以当作车载NVM营销的(这是刚需,NVM卖的特贵)。虽然单价昂贵且TAM可期,但由于短期需求同样碎片化而并未被传统大厂/IDM的产能所重视。国内一些有独道介质技术的初创公司在AIoT的定位是准确的,开发智能硬件/IOT等小型应用/gadgets的设计是更可行的,能用到7x7即满足了,TSV都用不到(因为低速)。
不论是MRAM还是RRAM芯片,它们的特性都是超强性能,延迟堪比内存,而且是超长寿命及可靠性,写入次数都是上万次起的,耐高温,寿命长达10多年;但是现在的问题就是这些芯片的容量都低,通常是256Mb、512Mb、1Gb,相比常规的RAM及NAND还差很远。另外大块的MRAM、RRAM颗粒也肯定不能跟逻辑电路混在一个die上的,材料物理不兼容;所以才发展出了嵌入式的eMRAM、eRRAM。
说到Fab制造成本和应用范围。考虑到MRAM的核心机密是CoFeB钴铁硼合金靶材的配比及制备(固体物理),其中基材、前道(材料)太昂贵,后道则无所谓了;其中那层CoFeB磁性材料,要么在晶圆制备的时候涂上去,光刻过程中多一道酸洗…或者先光刻,然后镀一层;但即使制造ROIC可控,磁性原理的器件也会由于场干扰而不能缩微到太小,这跟光电器件的场干扰问题相似。应用范围方面:有人提到一方面做eFlash(大尺寸/高容量的嵌入式),比如前文提到的车载NVM或是提供给design house设计mixed circuits用的模组;一方面去替代SRAM,但是SRAM是跟logic在一个die上的,怎么在同一个die上部分掺杂CoFeB那一磁层呢(参见上面镀层的说明)?恐怕只能fabric胶水拼接+总线了;同时还也是一层不能逾越的成本障碍,体现在这个钴铁的涂层作为磁性元素,在通常的逻辑电路是不能用的,想做到兼容的工艺太复杂/昂贵了。但替代SRAM思路是可行的,毕竟STT-MRAM的单元仅占SRAM宏的 43.3%面积,并且与高密度storage_cell的SRAM相比,STT-MRAM的能效也更高;优点是突出的,但是在生产制备层面,各层异质材料的沉积/干刻湿刻,工艺复杂度相比传统SRAM大了一个数量级。最近的消息是听闻IMEC已经设计出了用于末级缓存(L3)的基于STT-MRAM的替代品。--但似乎并不能扩展到更快、更低级别的缓存 (L1/L2);当下它与SRAM相比,写入过程仍然相对低效且耗时,对切换速度(不快于5ns)构成了限制(L1/L2需要亚纳秒的切换速度);其次,速度增益将需要增加流过MTJ隧道结的电流,从而需要流过更薄的电介质屏障,这就会施加更多的结构应力/压力,使设备的耐用性降低。这些可靠性问题以及与快速切换速度下增加的耗电问题,使得 STT-MRAM不适合L1/L2缓存操作。前文提过的SOT-MRAM器件,它在器件的耐用性和读取稳定性、以及开关延迟都得到了优化(STT操作期间的开关速度是5ns天花板,SOT可以实现低至210ps的可靠开关),但在结构上却比STT型更占用面积,当下SOT的研究方向主要在密度缩放,以便于未来真的可以替代SRAM。
所以目前看来,eMRAM也许会替代eFlash(高容量的嵌入式NOR闪存)。另外带[e]的都是提供给design house设计mixed circuits用的模组,搭配个MCU等,出SOC的,不是单一颗粒的概念。 而单一颗粒的MRAM好像只有上述的车载NVM这个刚需场景,TAM量不大。
相比当下主流的DRAM和SRAM,MRAM的优势是:写入速度确实不落下风(如下图),且由于MTJ上磁层自旋固定,无需一直通电,因此能耗水平要比前两者更低;早在Y16年,Samsung和IBM联合开发的一款11nm pMTJ的MRAM,当时它驱动电流仅用7.5微安。在如今全球降低碳排的背景下,倘若[e]MRAM能够顺利攻关“磁场干扰、基材制备成本、与logic die的材料物理兼容性以及扩大容量的难题” 并实现规模化应用,肯定会受到IDC和边端厂商的生态响应。
BTW:倘若扩展颗粒容量并试图延伸到IDC需求,就需要fabric拼接方式了(Interconnect是热点啊),用拼接(胶水)方案的话,就又要靠总线,神经元级别的本地运算就实现不了了。
最后关于产能问题的现状:至少在Y18-Y19年,Intel 22nm和Samsung 28nm外宣的都是利用被淘汰的产能加工eMRAM,想想eMRAM所用产线的0折旧率吧,全是净现金流吧:)纵然有靶材介质的IP配方,对于中小型Fab而言就值得投资和启动新产线么,存储技术的迭代和应用,要看中长期的大利润预期的市场TAM。
另补充说明一下ReRAM国内现状:如今包括ReRAM在内的厂商也在觊觎企业级SSD市场,毕竟Commodity市场的品类碎片化、产能、渠道和议价能力都是苛刻的,企业级的NAND存储颗粒是利润率和护城河都十分理想的品类。个别厂商会主打存内计算的概念,但充其量会采取对外IP授权的方式,并不具备贴近业务场景的logic design能力。商业模式上,国内相比Crossbar的ReRAM量产厂商,比如昕原半导体采取的是新型IDM模式,拥有ReRAM 28nm后道量产线;在生产规模上,即避免了对Fab的完全依赖,同时又可以契合FAB已有的工艺产线,可以做到快速匹配生产;同时也极大缩短了产品开发和迭代的周期;而在投资规模上,由于仅进行后道工艺的生产,投资规模整体算是可控,且可以分阶段地提升产能,“目前公司跟一个代工厂合作的产能可达到2000片/月,在IDM工厂建成后,产能可达到30000片/月,Yield 70%+” —— 但是,Crossbar RRAM国内厂商虽然历经15年+了也很难达到企业级商用水平,但以VC和地方国资为首的攒局者依然热衷拿这个IP核包装一个IDM出来,发改委备案、上海拿地、建12吋FAB,游戏至少持续3-5年吧;到期后,即使RRAM技术攻关和产能还是不行,这12吋FAB也可以改嫁其它产品线,也可以做代工,更可作为资产变卖,…立项,拿地,圈钱,开厂,上市…操盘关键节点跟具体产品无关的。