当前位置:首页 > 科技  > 测评

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台

来源: 责编: 时间:2023-09-28 15:52:12 269观看
导读 AI大模型的推理训练,最渴求的就是强劲的算力,可以来自CPU通用处理器,可以来自GPU加速器,可以来自ML/DL加速器,也可以是多种异构硬件的组合。当下最火的当然是NVIDIA GPU加速器,但一花独放不是春,能够提

AI大模型的推理训练,最渴求的就是强劲的算力,可以来自CPU通用处理器,可以来自GPU加速器,可以来自ML/DL加速器,也可以是多种异构硬件的组合。pTV28资讯网——每日最新资讯28at.com

当下最火的当然是NVIDIA GPU加速器,但一花独放不是春,能够提供强劲算力硬件方案的厂商很多。pTV28资讯网——每日最新资讯28at.com

纵观整个AI江湖,唯一拥有全套方案、可真正替代NVIDIA的,只能是Intel:至强处理器、GPU Max、Gaudi加速器多管齐下,再加上强大丰富的开发工具、开放生态的开发平台,要啥有啥,表现还相当不赖。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

今年6月,机器学习与人工智能开放产业联盟MLCommons公布了AI性能基准测试MLPerf Training 3.0的结果。pTV28资讯网——每日最新资讯28at.com

结果显示,Intel四代至强内置的各种加速器,使其成为在通用CPU处理器上运行大量AI工作负载的理想方案,Gaudi2加速器则在生成式AI、LLM大语言模型方面有着优秀的性能。pTV28资讯网——每日最新资讯28at.com

此外,Intel还提供了经过优化的、易于编程的开放软件,降低AI部署门槛。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

8月份,MLCommons又公布了针对60亿参数大语言模型、计算机视觉与自然语言处理模型GPT-J的 MLPerf 3.1基准测试结果,Intel的表现依然值得称道。pTV28资讯网——每日最新资讯28at.com

其中在GPT-J模型上,Gaudi2加速器的GPT-J-99、GPT-J-99.9服务器查询和离线样本的推理性能分别为78.58次/秒、84.08 次/秒。pTV28资讯网——每日最新资讯28at.com

与竞品比较,Gaudi2相对于NVIDIA上一代A100的性能优势可达2.4倍(服务器)、2倍(离线),而最新一代的H100相对于Gaudi2也只有1.09 倍(服务器)、1.28 倍(离线)的微弱优势。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

同时,Intel四代至强在视觉、语言处理、语音、音频翻译模型,以及更大的DLRM v2深度学习推荐模型、ChatGPT-J模型上处理通用AI负载时,性能都非常出色。pTV28资讯网——每日最新资讯28at.com

比如使用GPT-J对大约1000-1500字新闻稿进行100字总结的任务,四代至强在离线模式下每秒完成两段,实时服务器模式下则可完成每秒一段。pTV28资讯网——每日最新资讯28at.com

此外,Intel还首次提交了至强CPU Max处理器的MLPerf测试结果,其集成最多64GB HBM3高带宽内存,对于GPT-J而言是唯一能够达到99.9%准确度的CPU,非常适合精度要求极高的应用。pTV28资讯网——每日最新资讯28at.com

还有非常关键的一点:迄今为止,Intel是唯一一个使用行业标准深度学习生态软件并公开提交CPU结果的厂商,Gaudi2是仅有的两个向GPT-3大模型训练基准提交性能结果的解决方案之一。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

那么,Intel Gaudi2加速器、至强处理器为何能在AI算力上如此彪悍?Habana Labs中国区总经理于明扬做出了详细解读。pTV28资讯网——每日最新资讯28at.com

据介绍,MLPerf 3.1推理测试中,Gaudi2和H100一样都采用了FP8精度,GPT-J测试结果非常令人满意,准确率高达99.9%,和H100的差距非常小。pTV28资讯网——每日最新资讯28at.com

这主要是因为Gaudi2 MME支持FP8、BF16精度加速,而且结构设计合理,可以高效提升推理能力。pTV28资讯网——每日最新资讯28at.com

同时,Gaudi2也和H100一样使用了HBM高带宽内存,Intel也很好地预测了市场,并预估了额外的需求,因此基本保证了供应和生产,可以满足市场需求,不像NVIDIA那么头疼产能。pTV28资讯网——每日最新资讯28at.com

至于A100,它并不支持FP8而仅支持FP16,所以Gaudi2比之优势非常明显,这也显示了Gaudi2架构和软件设计的领先性,以及资源利用率的高效性。pTV28资讯网——每日最新资讯28at.com

非常关键的是,Intel Gaudi2的性价比优势明显,不像A100、H100那样动不动几十万一块,让中小企业和个人开发者望洋兴叹。pTV28资讯网——每日最新资讯28at.com

Intel也已经开放了开发者云,让不同客户可以访问不同的Intel AI硬件,大大降低AI工作成本。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

除了硬件性能的比拼,Intel也在软件生态上持续大力投入,虽然暂时还做不到NVIDIA CUDA生态那样有着独一无二的优势,但也有自己的突出特点。pTV28资讯网——每日最新资讯28at.com

于明扬强调,在软件生态上,Intel一直主张开放,比如通过开发者社区与开发者互动,提供优化后的模型、开源驱动和工具库,并支持Pytorch、Deepspeed等开源框架,加入和维护开放生态,为客户、合作伙伴和开发人员提供早期访问和便捷、迅速的途径。pTV28资讯网——每日最新资讯28at.com

Intel oneAPI也能提供更为开放的环境,支持不同层面的定制化开发,Intel和客户都可以在软件中添加新的加速算子,并且upstreaming到框架开源社区中。pTV28资讯网——每日最新资讯28at.com

值得一提的是,在软件上CUDA的影响已经大大缩小,对整体开发和应用环境更加有利。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

事实上,NVIDIA目前的强大只是GPU一条腿走路,CPU通用处理器是欠缺的。pTV28资讯网——每日最新资讯28at.com

虽然NVIDIA也开发了Grace CPU,并打造了所谓的“超级芯片”,可以将两颗Grace CPU或一颗Grace CPU加一颗H100 GPU进行整合,但毕竟是基于Arm架构,性能较弱,而且缺乏通用性。pTV28资讯网——每日最新资讯28at.com

Intel则凭借多管齐下的多硬件组合,可以构建强大、灵活异构计算平台,从而支持更大的模型规模,满足更广泛的系统需求。pTV28资讯网——每日最新资讯28at.com

于明扬指出,至强可扩展处理器有着最好的通用性,可以运行各种AI工作负载。pTV28资讯网——每日最新资讯28at.com

四代至强还衍生出了的至强CPU Max系列,是行业唯一一款具有HBM高带宽内存的x86处理器,无需更改代码,即可加速多种HPC、AI工作负载。pTV28资讯网——每日最新资讯28at.com

Gaudi系列加速器则专注于机器学习、深度学习的环境,以及未来对大语言模型的需求。pTV28资讯网——每日最新资讯28at.com

当然还有数据中心GPU Max系列,虽然才刚刚诞生,但是拥有47个功能模块、1000多亿晶体管的它,有着巨大的潜力和广阔的前景,在各种科学负载中相比H100可综合领先30%,还已经用于百亿亿次超级计算机“Aurora”。pTV28资讯网——每日最新资讯28at.com

这样的丰富组合,别说NVIDIA,在整个行业内都没有可与之匹配的。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

面向未来,Intel也自信满满地公布了Gaudi加速器、至强处理器的多年路线图,让人充满期待。pTV28资讯网——每日最新资讯28at.com

Gaudi 3将把制造工艺从7nm升级到5nm,带来的性能提升堪称一次飞跃:pTV28资讯网——每日最新资讯28at.com

BF16算力提升4倍,计算性能提升2倍,网络带宽提升1.5倍,HBM高带宽内存容量提升1.5倍。pTV28资讯网——每日最新资讯28at.com

从示意图上看,Gaudi3的主芯片将从单颗升级为两颗整合,HBM内存则从6颗增加到8颗。pTV28资讯网——每日最新资讯28at.com

再往后更是革命性的变化:Falcon Shores将是Intel第一次把x86 CPU、Xe GPU双架构融合在一起,官方称之为XPU,类似AMD Instinct MI300A。pTV28资讯网——每日最新资讯28at.com

按照Intel之前给出的数字,对比当今水平,Falcon Shores的能耗比提升超过5倍,x86计算密度提升超过5倍,内存容量与密度提升超过5倍。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

Emerald Rapids五代至强将在12月14日正式发布,这是至强历史上第一次一年内更新两代,增加到最多64核心128线程,同样功耗水平下可提供更高的性能和存储速度。pTV28资讯网——每日最新资讯28at.com

2024年上半年,至强将首次采用E核能效核设计,代号Sierra Forest,最多达到惊人的288核心288线程,而且首次引入Intel 3制造工艺,预计可使机架密度提升2.5倍、每瓦性能(能效)提高2.4倍。pTV28资讯网——每日最新资讯28at.com

紧随其后的是同样Intel 3工艺、全部P核性能核设计的Granite Rapids,AI性能对比四代至强预计可提高2-3倍。pTV28资讯网——每日最新资讯28at.com

2025年,我们将看到代号Clearwater Forest的再下一代至强,纯能效核设计,升级为Intel 18A制造工艺。pTV28资讯网——每日最新资讯28at.com

按照规划,那个时候,Intel将重新夺回制程工艺的领先地位,对于提高AI硬件的能效大有裨益。pTV28资讯网——每日最新资讯28at.com

总之,未来在AI计算领域,Intel将会提供更加强大、可满足不同应用场景和TCO成本的AI产品组合,为客户打造统一的开发平台,形成完整的产品生态链。pTV28资讯网——每日最新资讯28at.com

AI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台pTV28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-25-11789-0.htmlAI算力巅峰之战!Intel凭啥唯一能替代NVIDIA?独有全平台

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 铭凡V3官宣:全球首款锐龙8000二合一笔记本

下一篇: 100%原生木浆!原木日记抽纸大促:100抽仅1元

标签:
  • 热门焦点
  • K60至尊版狂暴引擎2.0加持:超177万跑分斩获性能第一

    K60至尊版狂暴引擎2.0加持:超177万跑分斩获性能第一

    Redmi的后性能时代战略发布会今天下午如期举办,在本次发布会上,Redmi公布了多项关于和联发科的深度合作,以及新机K60 Ultra在软件和硬件方面的特性,例如:“K60 至尊版,双芯旗舰
  • vivo TWS Air开箱体验:真轻 臻好听

    vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 帅气纯真少年!日本最帅初中生选美冠军出炉

    帅气纯真少年!日本最帅初中生选美冠军出炉

    日本第一帅哥初一生选美大赛冠军现已正式出炉,冠军是来自千叶县的宗田悠良。日本一直热衷于各种选美大赛,从“最美JK”起到“最美女星&r
  • Flowable工作流引擎的科普与实践

    Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 只需五步,使用start.spring.io快速入门Spring编程

    只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • 一文搞定Java NIO,以及各种奇葩流

    一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 认真聊聊东方甄选:如何告别低垂的果实

    认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • OPPO K11搭载长寿版100W超级闪充:26分钟充满100%

    OPPO K11搭载长寿版100W超级闪充:26分钟充满100%

    据此前官方宣布,OPPO将于7月25日也就是今天下午14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
Top
Baidu
map