台积电4纳米打造英伟达blackwell架构gpu,建构迄今最强gb200-yb体育app官网

来源:科技新报       

gpu大厂英伟达19日清晨在美国加州圣荷西召开的gtc2024,发表号称迄今最强ai芯片gb200,今年稍晚出货。gb200采新blackwell架构gpu,英伟达创办人暨执行长黄仁勋表示,两年前hopper架构gpu已非常出色,但现在需要更强大的gpu。

英伟达每两年更新频率,升级一次gpu架构,大幅提升ai芯片性能。英伟达2022年发表hopper架构h100ai芯片后,引领全球ai市场风潮。如今再推采blackwell架构的ai芯片性能更强大,更擅长处理ai任务,blackwell架构是以数学家david harold blackwell之名命名。

黄仁勋表示,blackwell架构gpu的ai运算性能在fp8及new fp6都可达20petaflops,是前一代hopper架构运算性能8petaflops的2.5倍。newfp4更可达40petaflops,是前代hopper架构gpu运算性能8petaflops5倍。取决于各种blackwell架构gpu设备的记忆体容量和频宽配置,工作运算执行力的实际性能可能会更高。黄仁勋强调,有额外处理能力,使人工智慧企业训练更大更复杂的模型。

blackwell架构gpu的体积庞大,采台积电4纳米(4np)打造,整合两个独立制造的裸晶(die),共2,080亿个电晶体,透过nvlink5.0介面像拉链绑住芯片。英伟达用10tb/sec nvlink5.0连接两块裸晶,官方称介面为nv-hbi。blackwell complex的nvlink5.0介面为1.8tb频宽,是前代hopper架构gpu nvlink4.0介面速度的两倍。

英伟达最新gb200 ai芯片,含两个blackwell gpu和一个arm架构grace cpu,推理模型性能比h100提升30倍,成本和能耗降至25分之一。

英伟达还对有大型需求的企业提供服务器成品,提供完整服务器出货,如gb200 nvl72服务器,提供36个cpu和72个blackwell架构gpu,完善一体水冷散热方案,可实现总计720petaflops的ai训练性能或1,440petaflops推理性能。电缆长度累计近2英里,共5,000条独立电缆。

亚马逊aws计划采购2万片gb200芯片组建的服务器集群,部署27兆个参数模型。除了亚马逊aws,dell、alphabet、meta、微软、openai、oracle和tesla成为blackwell系列的采用者之一。

封面图片来源:拍信网

网站地图