ai芯片大战，英伟达和竞争对手们如何表现？-yb体育app官网

来源：全球半导体观察原作者：竹子 2023-08-14 13:51:48

那个爱穿皮衣的男人带着英伟达的最新超级芯片gh200 grace hopper又来了。在计算机图形和交互技术会议siggraph上，英伟达ceo黄仁勋一袭黑皮衣，对台下数千名观众表示，“生成式人工智能时代即将到来，如果你相信的话，那就是人工智能的iphone时代。”

这是继nvidia gh200爆火后，英伟达今年的二度炫技。颇有“产能供应不上，就在性能卷死大家”的意思。除了英伟达外，amd、英特尔等国内外各大厂也在疯狂赶追这波ai热潮。

卷产能，卷性能

业界消息显示，全球多数大模型都在使用英伟达的gpu芯片，据trendforce集邦咨询研报，预计ai芯片2023年出货量将增长46%。英伟达gpu是ai服务器市场搭载主流，市占率约60%到70%。

与当前一代产品相比，英伟达新一代gh200拥有基本相同的“基因”：其 72 核 arm neoverse v2 grace cpu、hopper gpu 及其 900gb/秒 nvlink-c2c 互连均保持不变。核心区别是它搭载了全球第一款hbm3e内存，将不再配备今年春季型号的 96gb hbm3 vram 和 480gb lpddr5x dram，而是搭载500gb的lpddr5x以及141gb的hbm3e存储器，实现了5tb/秒的数据吞吐量。

简单而言，这是世界上第一款配备hbm3e内存的芯片，能够将其本地gpu内存增加50%。这也是专门对人工智能市场做的“特定升级”，因为顶级生成式ai往往尺寸巨大却内存容量有限。

hbm3 vs hbm3e（图片来源：英伟达）

英伟达表示，hbm3e内存技术带来了50%的速度提升，总共提供了10tb/秒的组合带宽。能够运行比先前版本大3.5倍的模型，并以3倍的内存带宽提高性能。

根据trendforce集邦咨询最新报告指出，以hbm不同世代需求比重而言，trendforce集邦咨询表示，2023年主流需求自hbm2e转往hbm3，需求比重分别预估约是50%及39%。随着使用hbm3的加速芯片陆续放量，2024年市场需求将大幅转往hbm3，而2024年将直接超越hbm2e，比重预估达60%，且受惠于其更高的平均销售单价（asp），将带动明年hbm营收显著成长。

以竞争格局来看，目前sk海力士（sk hynix）hbm3产品领先其他原厂，是nvidia server gpu的主要供应商；三星（samsung）则着重满足其他云端服务业者的订单，在客户加单下，今年与sk海力士的市占率差距会大幅缩小，2023~2024年两家业者hbm市占率预估相当，合计拥hbm市场约95%的市占率，不过因客户组成略有不同，在不同季度的位元出货表现上恐或有先后。美光（micron）今年专注开发hbm3e产品，相较两家韩厂大幅扩产的规划，预期今明两年美光的市占率会受排挤效应而略为下滑。

结合业界消息，三星电子计划于今年底开始hbm3生产，并计划投资数千亿韩元，将忠南天安工厂的hbm产能提高一倍。从第四季度开始，三星的hbm3也将供应英伟达，当前英伟达高端gpu hbm芯片由sk海力士独家供应。

据英伟达官方消息，其最新的gh200产品需要到明年二季度才投产，其售价暂未透露。这其中一个重要原因是hbm3e将在明年才会供货，市场消息显示，三星和sk海力士预计将于明年第一季度发布hbm3e样品，并于2024年下半年开始量产。美光方面，则选择跳过hbm3，直接开发hbm3e。届时，依靠新款英伟达芯片，ai大模型有望迎来新一轮的爆发。

据trendforce集邦咨询观察hbm供需变化，2022年供给无虞，2023年受到ai需求突爆式增长导致客户的预先加单，即便原厂扩大产能但仍无法完全满足客户需求。展望2024年，trendforce集邦咨询认为，基于各原厂积极扩产的策略，hbm供需比（sufficiency ratio）有望获改善，预估将从2023年的-2.4%，转为0.6%。

英伟达的竞争对手们

ai这个巨大的千亿市场，不只是英伟达一家的游戏，amd和英特尔也在加速追赶，希望分得一杯羹。

英特尔在2019年以约20亿美元价格收购了人工智能芯片制造商habana实验室，进军ai芯片市场。今年8月，在英特尔最近的财报电话会议上，英特尔首席执行官pat gelsinger表示，英特尔正在研发下一代falcon shores ai超算芯片，暂定名为falcon shores 2，该芯片预计将于2026年发布。

除了falcon shores 2之外，英特尔还推出ai芯片gaudi2，已经开始销售，而gaudi3则正在开发中。业界认为，目前gaudi2芯片的热度不及预期，这主要在于gaudi2性能难以对英伟达h100和a100形成有效竞争。

英特尔研究院副总裁、英特尔中国研究院院长宋继强近日表示：“在这一波大模型浪潮当中，什么样的硬件更好并没有定论。”他认为，gpu并非大模型唯一的硬件选择，半导体厂商更重要的战场在软件生态上。芯片可能花两三年时间就做出来了，但是要打造芯片生态需要花两倍甚至三倍的时间。英特尔的开源生态oneapi比闭源的英伟达cuda发展可能更快。

amd也在加速追赶。今年6月，amd举行了新品发布会，发布了面向下一代数据中心的apu加速卡产品instinct mi300，直接对标h100。这颗芯片将cpu、gpu和内存全部封装为一体，从而大幅缩短了ddr内存行程和cpu-gpu pcie行程，从而大幅提高了其性能和效率。

instinct mi300将于2023年下半年上市。amd称instinct mi300可带来mi250加速卡8倍的ai性能和5倍的每瓦性能提升（基于稀疏性fp8基准测试），可以将chatgpt和dall-e等超大型ai模型的训练时间从几个月减少到几周，从而节省数百万美元的电费。

此外，谷歌、亚马逊、特斯拉等也都在设计自己的定制人工智能推理芯片。除了国外大厂，国内的芯片企业也迅速入局，其中，昆仑芯ai加速卡rg800、天数智芯的天垓100加速卡、燧原科技第二代训练产品云燧t20/t21均表示能够具有支持大模型训练的能力。

封面图片来源：拍信网

微信

精彩资讯扫码关注
rss

实时更新科技资讯

【免责声明】

1、「dramexchange-全球半导体观察」包含的内容和信息是根据公开资料分析和演释，该公开资料，属可靠之来源搜集，但这些分析和信息并未经独立核实。本网站有权但无此义务，改善或更正在本网站的任何部分之错误或疏失。
2、任何在「dramexchange-全球半导体观察」上出现的信息（包括但不限于公司资料、资讯、研究报告、产品价格等），力求但不保证数据的准确性，均只作为参考，您须对您自主决定的行为负责。如有错漏，请以各公司官方网站公布为准。
3、「dramexchange-全球半导体观察」信息服务基于"现况"及"现有"提供，网站的信息和内容如有更改恕不另行通知。
4、「dramexchange-全球半导体观察」尊重并保护所有使用用户的个人隐私权，您注册的用户名、电子邮件地址等个人资料，非经您亲自许可或根据相关法律、法规的强制性规定，不会主动地泄露给第三方。

「dramexchange-全球半导体观察」所刊原创内容之著作权属于「dramexchange-全球半导体观察」网站所有，未经本站之同意或授权，任何人不得以任何形式重制、转载、散布、引用、变更、播送或出版该内容之全部或局部，亦不得有其他任何违反本站著作权之行为。

ai芯片大战，英伟达和竞争对手们如何表现？-yb体育app官网

卷产能，卷性能

英伟达的竞争对手们

相关文章

每日行情

主编推荐

研究报告