来源:全球半导体观察 原作者:韦思维
人工智能ai吹起新一轮科技革命浪潮,衍生出诸多新兴应用,庞大的需求驱动存储技术更迭。随着ai模型和数据集不断扩大,高效、高性能的存储显得愈发关键,符合ai模型需求的ddr、gddr、hbm技术从幕后走向台前,并随着ai发展而不断推陈出新。
ddr完整的应该称ddr sdram,英文全称为double data rate sdram,中文含义是双倍速率同步动态随机存储器”,应用于高性能服务器、台式机、笔记本电脑及其他设备中,该技术将高带宽和高能效结合在一起,可以使性能翻倍。
从本质上讲,ddr是现有sdram内存的一种进化,sdram在一个时钟周期内只传输一次数据,是在时钟的上升期进行数据传输,而ddr内存在一个时钟周期内可以传输两次数据,它能够在时钟的上升期和下降期各传输一次数据,因此得名“双倍速率同步动态随机存储器”。在与sdram相同的总线频率下,ddr内存可以达到更高的数据传输率,带来优异的数据处理性能。
sdram根据时钟边沿读取数据情况分为sdr、ddr技术。经过多年的发展,ddr已从第一代ddr sdram,第二代ddr2 sdram,第三代ddr3 sdram,第四代ddr4 sdram,发展至第五代ddr5 sdram、第六代ddr6 sdram。
随着技术的进步,ddr内存的版本不断更新,每一代的ddr产品都提供更高的带宽和更低的功耗。从目前主流的ddr4、ddr5来看,ddr5内存的工作电压进一步降低至1.1v,相较于ddr4进一步提高了能效,带宽相较于ddr4有大幅提升。
据jedec(固态技术协会)6月初消息,ddr6(包括lpddr6)已明确会以camm2取代使用多年的so-dimm和dimm内存标准。ddr6内存最低频率8800mhz,可提高至17.6ghz,理论最高可以推进至21ghz,远超ddr4和ddr5内存。
业界认为,从市场普及来看,ddr6采用的标准是全新的camm2,生产设备也要做大规模替换,这会带来全新的成本结构。同时,存量市场的新标准迭代也会受限成本要求,这都限制了ddr6或lpddr6的大规模普及速度。
图片来源:全球半导体观察制表
高速、高性能的ddr内存颗粒成为在人工智能、云计算、物联网、计算机等领域的优选存储方案。从ai领域来看,ai算法需大量数据训练与推理,ddr作为电脑内存的主要组件,能确保数据传输及存储稳健可靠;云计算领域,ddr在云服务器内承担大容量数据处理与传输的重任;物联网领域,物联设备需要满足低耗能、高效率以及稳定可靠的特性,ddr恰好满足上述要求,可实现设备间的有效连接与交互。
gddr英文全称graphics double data rate dram,是专为图形处理而设计的高性能ddr存储器规格,简称为显存。显存最关键的应用领域便是显卡,后者应用于新媒体和电脑游戏、炒卖加密货币、ai强化学习(如chatgpt、sora)等领域。而用于显卡的dram,需要具备两个关键的特性,高密度寻址能力和配备的高性能,早期因主要考虑兼容cpu,显卡大多采用ddr内存,不过近年随着图像处理需求的增加,显卡逐渐转向专为gpu设计的gddr。
业界指出,gddr有专属的工作频率、时钟频率、电压,因此与市面上标准的ddr存储器有所差异,与普通ddr内存不同,且不能共用。一般它比主内存中使用的普通ddr存储器时钟频率更高,发热量更小,具有更高的频率和带宽,所以更适用于中高端显卡。
目前,gddr已成为人工智能、大数据应用领域中最热门的内存芯片之一。从类型上看,gddr包括gddr2、gddr3、gddr4、gddr5、gddr5x、gddr6和gddr6x等,gddr5和gddr6是高端显卡上常见的显存类型。其实,前两代的gddr和gddr2并没有得到gpu厂商的大规模应用,但随着性能的提升,第三代gddr3数据传输速率最高达到2.5ghz,第四代gddr4虽然性能有了进一步变化,但由于下游厂商对gddr4标准意见不一,市场度接受度不高。为此gddr3成为当时市场主流技术,包括英伟达和amd等头部gpu厂商都使用的gddr3。
从2008年后,产品更新至gddr5,因具备更高的时钟频率和数据传输速率成为高性能显卡的标配,gddr5与gddr4、gddr3一样,皆是基于ddr3技术开发而来。据悉,gddr5之后,英伟达与美光共同合作推出gddr5x半代产品,应用于前者的高端显卡。
据悉,英伟达是首家在其rtx 30 系列gpu中选择gddr6x内存的供应商,至少是高端gpu。gddr6x将每引脚带宽以14gbps增加到21gbps,将总带宽增加到1008gb/s,甚至超过3072位宽的hbm2堆栈。值得一提是,gddr6x还引入了pam4(pulse amplitude modulation 4)信号技术,显著提高了数据传输速率。
图片来源:全球半导体观察制表
目前,今年来,美光、三星和sk海力士均表示已开始提供gddr7内存样品。具体来看,三星gddr7芯片通过首次应用pam3信号,能够在仅1.1 v的dram电压下实现32 gbps的速度,这超过了jedec的gddr7规范中的1.2 v;sk海力士与其前身gddr6相比,最新的gddr7产品提供的最大带宽达到160gb/s,是其上一代产品(gddr6位80gb/s)的两倍,功耗效率提升了40%,内存密度提升1.5倍;美光gddr7具有28gb/s和32gb/s两种速度,采用其1β (1-beta) dram 技术制造,其效率比gddr6 提高了50%。
hbm是高带宽存储器,属于图形ddr内存的一种,是通过使用先进的封装方法(如tsv硅通孔技术)垂直堆叠多个dram,与gpu通过中介层互联封装在一起。hbm具备高容量、高带宽、低延时与低功耗等特性,其优势在于打破内存带宽及功耗瓶颈。不过,hbm由于其复杂的设计及封装工艺导致产能较低同时成本较高,hbm的平均售价至少是dram的三倍。
图片来源:sk海力士
与传统dram芯片相比,hbm具有高带宽、高容量、低延时与低功耗等优势,可以加快ai数据处理速度。业界指出,hbm可以将专用数据处理器直接集成在dram中,将部分数据计算工作从主机处理器转移到存储器当中,从而满足ai芯片训练的高宽带要求,也因此更适用于chatgpt等高性能计算场景。
图片来源:全球半导体观察制表
从技术迭代上看,hbm已经从hbm、hbm2、hbm2e,发展至被业界认为即将成为市场主流的hbm3、hbm3e,未来或将到达hbm4,甚至hbm4e。从大厂最新动态来看,三星已开始向客户提供hbm3e 12h样品,预计于今年下半年开始大规模量产;美光已开始量产hbm3e,英伟达h200 tensor core gpu将采用美光8层堆叠的24gb容量hbm3e内存,并于2024年第二季度开始出货;sk海力士已成功量产超高性能用于ai的存储器新产品hbm3e,实现了全球首次向客户供应现有dram最高性能的hbm3e。
至于hbm4,业界称,随着内存传输速率要求不断提高,尤其是在dram单元的基础物理原理没有改变的情况下,这一速度将无法满足未来ai场景下的数据传输要求。hbm从每堆叠1024位元增加到每堆叠2048位,hbm4将带来突破性变革,采用2048位元内存接口,理论上也可以使传输速度再次翻倍。
trendforce集邦咨询预计,hbm4有望于2026年推出。目前包含nvidia以及其他csp(云端业者)在未来的产品应用上,规格和效能将更优化。例如,随着客户对运算效能要求的提升,hbm4在堆栈的层数上,除了现有的12hi (12层)外,也将再往16hi (16层)发展,更高层数也预估带动新堆栈方式hybrid bonding的需求。hbm4 12hi产品将于2026年推出;而16hi产品则预计于2027年问世。
从市场格局来看,目前,hbm市场高度集中,呈现三足鼎立的态势。此前据trendforce集邦咨询研究显示,2022年三大原厂hbm市占率分别为sk海力士(sk hynix)50%、三星(samsung)约40%、美光(micron)约10%。
ai就像一颗巨大能量的陨星,给予内存市场最新的冲击。随着市场提出的新挑战,三星、美光、sk海力士等大厂正埋头专心研发,致力于引领下一代图形内存技术的发展。业界十分关心的性能、能效、成本等问题,上述中提到的ddr、gddr、hbm技术将如何发展,大厂们在这场内存技术竞赛中又将带来何种新的yb体育app官方下载的解决方案,让我们拭目以待。
全球市场研究机构trendforce集邦咨询此前预计,2023年hbm产值占比之于dram整体产业约8.4%,至2024年底将扩大至20.1%。同时,新型存储技术也不断涌现,3d dram时代即将开启;scm潜力即将释放,pcie 6.0/7.0蓄势待发…
6月19日(周三),trendforce集邦咨询将在深圳隆重举办“2024集邦咨询半导体产业高层论坛(trendforce semiconductor seminar 2024)”。
届时,集邦咨询资深研究副总经理吴雅婷将发表《从hbm火爆看内存产业发展趋势》的主题演讲,敬请期待!
封面图片来源:拍信网