来源:technews科技新报
facebook母公司meta加入google、亚马逊、微软的半导体大战,首度公开自行研发ai芯片进展。
meta正在打造特别为ai设计的基础设施架构,涵盖硬件与软件堆栈的各个层面,以及串联这些技术的定制化网络,包括meta第一款用于执行ai模型的定制芯片、针对ai最佳化的数据中心设计,以及目前进展至第二阶段的ai超级计算机。
名为meta trainingand inference accelerator(mtia)的全新asic芯片,是meta第一款自行研发的定制芯片,宣称运算效能和处理效率胜过cpu,专门用于处理与ai推荐系统相关的工作,帮助用户找出最佳贴文内容并更快呈现在你眼前。meta在2020年开发出第一代mtia(mtia v1),采用台积电7纳米制程。而据国外媒体techcrunch报道,mtia至少要到2025年才会正式问世、投入服务当中。
除了mtia,meta自行研发另一款芯片,是称为meta scalable video processor(msvp)的asic芯片,以支持持续成长的影音内容处理需求,最终希望将大部分成熟且稳定的影音内容处理工作交由msvp执行。
至于meta新一代数据中心设计除了将支持现有产品以外,更将协助未来新的ai硬件展开训练和推理。新的数据中心针对ai优化,支持液体冷却式ai硬件设备和高效ai网络,将数千个ai芯片串联在一起形成数据中心规模的ai训练集,能与msvp等新硬件设备相辅相成。
meta的research super cluster(rsc)ai超级计算机,可训练新一代大型ai模型以支持新的ar工具、内容理解系统、实时翻译技术等等,它配备16000个nvidia a100 tensor core gpu(2000个nvidia dgx a100系统)。从去年开始rsc参与各项研究计划,例如meta推动的大型语言模型llama(large language model meta ai)。
除了日前宣布将生成式ai运用在广告工具上,meta也计划调整编程编写方式,通过内部开发的生成式ai程序编写辅助工具code compose,提升开发者的工作效率。
自2016年以来,google一直在设计和部署称为tensor processing units(tpu)的ai芯片,用于训练生成式ai系统如palm-2、imagen等,亚马逊则向aws客户提供aws trainium、aws inferentia两款自研芯片进行应用,微软也传出正与amd合作开发一种名为athena的ai芯片。
meta过去主要使用cpu以及用于加速ai算法而设计的定制芯片来处理ai运算工作,为了扭转局面,meta开始自行研发客制化芯片,并与同样向ai领域投入大量资源的google、亚马逊、微软等竞争。
封面图片来源:拍信网