近年来,随着人工智能等技术的快速发展,算力需求大幅增长。其中,智能算力需求尤其显著,主要基于GPU、FPGA、ASIC等芯片的加速计算平台提供,面向人工智能计算。
英伟达发布新一代AI芯片H200,基于Meta的Llama 2大模型的测试表明,H200的输出速度是H100的两倍。在AI热潮中,算力已成为核心硬件,但算力不足也是潜在阻力,大模型公司争相购买英伟达芯片。微软发布自研芯片Maia 100,旨在与英伟达竞争。
谷歌的TPU v5e是专为提升大中型模型的训练、推理性能以及成本效益所设计。与英伟达A100/H100等通用型GPU相比,谷歌TPU更专注于深度学习领域,采用低精度计算,优化矩阵乘法与卷积运算,大幅降低功耗、加快运算速度。亚马逊云科技的三条自研芯片生产线中,Trainium面向训练场景,Inferentia面向推理场景,同时还有通用处理器Graviton和DPU芯片Nitro。亚马逊是唯一一家在服务器中提供训练和推理两种类型芯片的云提供商,降低成本并提高效率。
OpenAI和Anthropic两大模型语言开发商都在积极寻求新的算力来源。由于英伟达的芯片供应紧张,这两家公司都在探索自研AI芯片的可行性。
AMD的MI300芯片在性能上显著超越英伟达的H100,具有更高的内存带宽和更低的成本。微软、Meta、甲骨文、谷歌、亚马逊等公司已经向AMD下了大量订单。虽然AMD的MI300芯片在出货量上预计将快速增长,但仍需要时间来撼动英伟达在人工智能行业的地位。
在中国,华为的昇腾系列AI处理器是最有实力的算力芯片之一。科大讯飞等公司已经采用昇腾系列AI处理器进行大模型训练和推理。此外,中贝通信和优刻得也表示将考虑采购国产GPU。总体来说,选择AMD或中国本土的AI芯片也是可行的方案,但需要考虑软件生态和算力需求等因素。
寒武纪是中国本土的AI芯片供应商之一,其思元370芯片是采用7nm制程工艺的云端AI芯片,最大算力高达256TOPS(INT8)。寒武纪新一代云端智能训练新品思元590芯片受到很多关注和讨论,性能接近A100 90%的水平。
除了寒武纪之外,中国还有其他算力芯片厂商,如海光信息、百度、壁仞科技、燧原等。这些公司的产品也广受市场期待。同时,中国的云厂商也开始寻求其他解法,以应对可能被禁的高端AI芯片。华为利用公司自研的鲲鹏和昇腾AI算力方案,建立智算中心训练大模型。腾讯投资了燧原,百度也开始寻求其他最优解。
虽然国产AI算力已经实现了一定程度的市场占比,但在核心性能、软件生态以及出货能力上依旧不理想,还有很长的路要走。
本文链接://www.dmpip.com//www.dmpip.com/showinfo-27-35467-0.html对标海外算力芯片,中国AI芯片强势崛起
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com
下一篇: DDR第4季合约价平均上涨超10%