当前位置：首页 > 元宇宙 > AI

CPU,正在被AI时代抛弃？

来源：责编：时间：2024-07-11 17:28:19 39观看

导读在某三甲医院的门诊中，汇集了来自各地的病患，医生们正在以最专业的能力和最快的速度进行会诊。期间，医生与患者的对话可以通过语音识别技术被录入到病例系统中，随后大模型AI 推理技术辅助进行智能总结和诊断，医生们撰写病

在某三甲医院的门诊中，汇集了来自各地的病患，医生们正在以最专业的能力和最快的速度进行会诊。期间，医生与患者的对话可以通过语音识别技术被录入到病例系统中，随后大模型AI 推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI 推理的应用不仅节省了时间，也保护了患者隐私;

在法院、律所等业务场景中，律师通过大模型对海量历史案例进行整理调查，并锁定出拟定法律文件中可能存在的漏洞;

……

以上场景中的大模型应用，几乎都有一个共同的特点——受行业属性限制，在应用大模型时，除了对算力的高要求，AI训练过程中经常出现的坏卡问题也是这些行业不允许出现的。同时，为确保服务效率和隐私安全，他们一般需要将模型部署在本地，且非常看重硬件等基础设施层的稳定性和可靠性。一个中等参数或者轻量参数的模型，加上精调就可以满足他们的场景需求。

而在大模型技术落地过程中，上述需求其实不在少数，基于 CPU的推理方案无疑是一种更具性价比的选择。不仅能够满足其业务需求，还能有效控制成本、保证系统的稳定性和数据的安全性。但这也就愈发让我们好奇，作为通用服务器，CPU在 AI 时代可以发挥怎样的优势?其背后的技术原理又是什么?

1、AI时代，CPU 是否已被被边缘化？

提起 AI 训练和 AI 推理，大家普遍会想到 GPU 更擅长处理大量并行任务，在执行计算密集型任务时表现地更出色，却忽视了 CPU在这其中的价值。

AI 技术的不断演进——从深度神经网络(DNN)到 Transformer 大模型，对硬件的要求产生了显著变化。CPU不仅没有被边缘化，反而持续升级以适应这些变化，并做出了重要改变。

AI 大模型也不是只有推理和训练的单一任务，还包括数据预处理、模型训练、推理和后处理等，整个过程中需要非常多软硬件及系统的配合。在 GPU兴起并广泛应用于 AI 领域之前，CPU 就已经作为执行 AI推理任务的主要硬件在被广泛使用。其作为通用处理器发挥着非常大的作用，整个系统的调度、任何负载的高效运行都离不开它的协同优化。

此外，CPU 的单核性能非常强大，可以处理复杂的计算任务，其核心数量也在不断增加，而且 CPU 的内存容量远大于 GPU 的显存容量，这些优势使得 CPU能够有效运行生成式大模型任务。经过优化的大模型可以在 CPU 上高效执行，特别是当模型非常大，需要跨异构平台计算时，使用 CPU反而能提供更快的速度和更高的效率。

而 AI 推理过程中两个重要阶段的需求，即在预填充阶段，需要高算力的矩阵乘法运算部件;在解码阶段，尤其是小批量请求时，需要更高的内存访问带宽。这些需求CPU 都可以很好地满足。

以英特尔举例，从 2017 年第一代至强® 可扩展处理器开始就利用英特尔® AVX-512 技术的矢量运算能力进行 AI 加速上的尝试;再接着第二代至强®中导入深度学习加速技术(DL Boost);第三代到第五代至强® 的演进中，从 BF16 的增添再到英特尔® AMX 的入驻，可以说英特尔一直在充分利用 CPU资源加速 AI 的道路上深耕。

在英特尔® AMX 大幅提升矩阵计算能力外，第五代至强® 可扩展处理器还增加了每个时钟周期的指令，有效提升了内存带宽与速度，并通过 PCIe 5.0实现了更高的 PCIe 带宽提升。在几个时钟的周期内，一条微指令就可以把一个 16×16 的矩阵计算一次性计算出来。至强® 可扩展处理器可支持 HighBandwidth Memory (HBM) 内存，和 DDR5 相比，其具有更多的访存通道和更长的读取位宽。虽然 HBM的容量相对较小，但足以支撑大多数的大模型推理任务。

可以明确的是，AI 技术的演进还远未停止，当前以消耗大量算力为前提的模型结构也可能会发生改变，但 CPU作为计算机系统的核心，其价值始终是难以被替代的。

同时，AI 应用的需求是多样化的，不同的应用场景需要不同的计算资源和优化策略。因此比起相互替代，CPU 和其他加速器之间的互补关系才是它们在 AI市场中共同发展的长久之道。

2、与其算力焦虑，不如关注效价比

随着人工智能技术在各个领域的广泛应用，AI 推理成为了推动技术进步的关键因素。然而，随着通用大模型参数和 Token数量不断增加，模型单次推理所需的算力也在持续增加，企业的算力焦虑扑面而来。与其关注无法短时间达到的算力规模，不如聚焦在“效价比”，即综合考量大模型训练和推理过程中所需软硬件的经济投入成本、使用效果和产品性能。

CPU 不仅是企业解决 AI算力焦虑过程中的重要选项，更是企业追求“效价比”的优选。在大模型技术落地的“效价比”探索层面上，百度智能云和英特尔也不谋而合。

百度智能云千帆大模型平台(下文简称“千帆大模型平台”)作为一个面向开发者和企业的人工智能服务平台，提供了丰富的大模型，对大模型的推理及部署服务优化积攒了很多作为开发平台的经验，他们发现，CPU的 AI 算力潜力将有助于提升 CPU 云服务器的资源利用率，能够满足用户快速部署 LLM 模型的需求，同时还发现了许多很适合 CPU 的使用场景：

●SFT 长尾模型：每个模型的调用相对稀疏，CPU 的灵活性和通用性得以充分发挥，能够轻松管理和调度这些模型，确保每个模型在需要时都能快速响应。

●小于 10b 的小参数规模大模型：由于模型规模相对较小，CPU 能够提供足够的计算能力，同时保持较低的能耗和成本。

●对首 Token 时延不敏感，更注重整体吞吐的离线批量推理场景：这类场景通常要求系统能够高效处理大量的数据，而 CPU的强大计算能力和高吞吐量特性可以很好地满足要求，能够确保推理任务的快速完成。

英特尔的测试数据也验证了千帆大模型平台团队的发现，其通过测试证明，单台双路 CPU 服务器完全可以轻松胜任几 B 到几十 B参数的大模型推理任务，Token 生成延时完全能够达到数十毫秒的业务需求指标，而针对更大规模参数的模型，例如常用的 Llama 2-70B，CPU同样可以通过分布式推理方式来支持。此外，批量处理任务在 CPU 集群的闲时进行，忙时可以处理其他任务，而无需维护代价高昂的 GPU集群，这将极大节省企业的经济成本。

也正是出于在“CPU 上跑 AI”的共识，双方展开了业务上的深度合作。百度智能云千帆大模型平台采⽤基于英特尔® AMX 加速器和大模型推理软件解决方案xFasterTransformer (xFT)，进⼀步加速英特尔® 至强® 可扩展处理器的 LLM 推理速度。

3、将CPU 在 AI 方面的潜能发挥到极致

为了充分发挥 CPU 在 AI 推理方面的极限潜能，需要从两个方面进行技术探索——硬件层面的升级和软件层面的优化适配。

千帆大模型平台采用 xFT，主要进行了以下三方面的优化：

●系统层面：利用英特尔®AMX/AVX512 等硬件特性，高效快速地完成矩阵 / 向量计算;优化实现针对超长上下文和输出的 Flash Attention/Flash Decoding等核心算子，降低数据类型转换和数据重排布等开销;统一内存分配管理，降低推理任务的内存占用。

●算法层面：在精度满足任务需求的条件下，提供多种针对网络激活层以及模型权重的低精度和量化方法，大幅度降低访存数据量的同时，充分发挥出英特尔®AMX 等加速部件对 BF16/INT8 等低精度数据计算的计算能力。

●多节点并行：支持张量并行(TensorParallelism)等对模型权重进行切分的并行推理部署。使用异构集合通信的方式提高通信效率，进一步降低 70b 规模及以上 LLM推理时延，提高较大批处理请求的吞吐。

第五代至强® 可扩展处理器能在 AI 推理上能够取得如此亮眼的效果，同样离不开软件层面的优化适配。为了解决 CPU 推理性能问题，这就不得不提 xFT开源推理框架了。

xFT 底层适用英特尔 AI 软件栈，包括 oneDNN、oneMKL、IG、oneCCL等高性能库。用户可以调用和组装这些高性能库，形成大模型推理的关键算子，并简单组合算子来支持 Llama、文心一言等大模型。同时，xFT 最上层提供 C++ 和Python 两套便利接口，很容易集成到现有框架或服务后端。

xFT采用了多种优化策略来提升推理效率，其中包括张量并行和流水线并行技术，这两种技术能够显著提高并行处理的能力。通过高性能融合算子和先进的量化技术，其在保持精度的同时提高推理速度。此外，通过低精度量化和稀疏化技术，xFT有效地降低了对内存带宽的需求，在推理速度和准确度之间取得平衡，支持多种数据类型来实现模型推理和部署，包括单一精度和混合精度，可充分利用 CPU的计算资源和带宽资源来提高 LLM 的推理速度。

另外xFT 通过“算子融合”、“最小化数据拷贝”、“重排操作”和“内存重复利用”等手段来进一步优化 LLM的实现，这些优化策略能够最大限度地减少内存占用、提高缓存命中率并提升整体性能。通过仔细分析 LLM的工作流程并减少不必要的计算开销，该引擎进一步提高了数据重用度和计算效率，特别是在处理 Attention机制时，针对不同长度的序列采取了不同的优化算法来确保最高的访存效率。

目前，英特尔的大模型加速方案 xFT 已经成功集成到千帆大模型平台中，这项合作使得在千帆大模型平台上部署的多个开源大模型能够在英特尔至强®可扩展处理器上获得最优的推理性能：

●在线服务部署：用户可以利用千帆大模型平台的 CPU资源在线部署多个开源大模型服务，这些服务不仅为客户应用提供了强大的大模型支持，还能够用于千帆大模型平台 prompt 优化工程等相关任务场景。

●高性能推理：借助英特尔® 至强® 可扩展处理器和 xFT推理解决方案，千帆大模型平台能够实现大幅提升的推理性能。这包括降低推理时延，提高服务响应速度，以及增强模型的整体吞吐能力。

●定制化部署：千帆大模型平台提供了灵活的部署选项，允许用户根据具体业务需求选择最适合的硬件资源配置，从而优化大模型在实际应用中的表现和效果。

4、写在最后

对于千帆大模型平台来说，英特尔帮助其解决了客户在大模型应用过程中对计算资源的需求，进一步提升了大模型的性能和效率，让用户以更低的成本获取高质量的大模型服务。

大模型生态要想持续不断地往前演进，无疑要靠一个个实打实的小业务落地把整个生态构建起来，英特尔联合千帆大模型平台正是在帮助企业以最少的成本落地大模型应用，让他们在探索大模型应用时找到了更具效价比的选项。

未来，双方计划在更高性能的至强®产品支持、软件优化、更多模型支持以及重点客户联合支持等方面展开深入合作。旨在提升大模型运行效率和性能，为千帆大模型平台提供更完善的软件支持，确保用户能及时利用最新的技术成果，从而加速大模型生态持续向前。

更多关于至强® 可扩展处理器为千帆大模型平台推理加速的信息，请点击英特尔官网查阅。

举报 0收藏 0打赏 0评论 0

更多>同类资讯

紫光闪存京东品牌焕新日来袭！多重福利精彩放送

在数字化时代，存储技术是推动科技进步的关键力量。紫光集团，作为国内领先的半导体企业，一直致力于通过技术创新，为消费者带来更高效、更稳定的存储解决方案。7月11日，紫光集团迎来品牌全新升级，同时，将这一天定为紫光闪存京东自营旗舰店品牌焕新日，以一系列精彩

07-11

思看科技3D扫描技术：引领文化遗产数字化保护新篇章

文化遗产作为连接过去与未来的桥梁，承载着无价的历史智慧与民族情感，其保护与传承被赋予了前所未有的重要意义。文物和文化遗产是中华民族的基因和血脉，承载着中华民族的历史记忆和精神追求，是国家文化软实力的重要体现，也是我们必须世代守护的宝贵财富。在此宏伟愿

07-11

挖掘新财富密码：探索HTX Restaking的无限潜力

时间进入2024年下半年，加密市场行情震荡之下，新的财富密码如何寻找? 不妨多关注 Restaking 赛道。作为一种创新的质押模式，Restaking 旨在为用户提供更高的收益和更灵活的资产管理方式。通过Restaking，用户可以在已有的质押基础上，将加密资产进行再次质押，从而获得

07-11

市场份额第一！阿里云WAAP安全产品能力获IDC评测七项满分

近日，全球领先的IT市场研究和咨询公司IDC发布《中国WAAP厂商技术能力评估，2024》和《中国云Web应用防火墙市场份额，2023》报告，阿里云凭借领先的WAAP安全产品性能，在IDC评测报告中成为唯一一家7项能力全部满分的厂商，并在中国云WAF市场份额、中国公有云WAF市场份额

07-11

三维扫描案例分享：思看科技3D扫描仪助力水电站检测与维护！

水轮发电机组作为水力发电站中的核心设施，承载着为社会提供清洁能源的使命，为确保水电站能够持续、稳定地运行，对其各项设施进行精细化的维护与修复工作至关重要。3D扫描技术凭借其高精度、高效率、高便捷性等独特优势，正逐渐成为水电设备检修项目中不可或缺的创新型

07-11

桔多多掀起“夏日美妆大作战”，让高品质美妆触手可及

在消费升级与个性化需求并行的当下，美妆市场正以前所未有的活力书写着美丽的新篇章。据艾媒咨询最新发布的《2024-2025年中国美妆行业发展现状与消费趋势报告》显示，2023年中国化妆品行业的市场规模已达5169亿元，同比增长6.4%，预计到2025年，这一数字将进一步跃升至5

07-11

干衣机迎来革命性创新,小天鹅与Askoll强强联手引领

干衣机正在迎来一项革命性的科技创新。近日，家电圈从知情人士处获悉，行业领军品牌小天鹅，与意大利科技企业Askoll强强联手，共同研发推出“独立双驱一体变频电机”和“三变频智能烘干控制算法”，双管齐下彻底解决现有烘干机普遍存在的“烘不透、衣服缠绕及烘干时间长

07-11

折叠屏体验新标杆三星Galaxy Z Fold6创新AI解锁高效生产力

7月10日，新一代三星Galaxy Z Fold6如期而至。凭借Galaxy AI的加持，三星Galaxy Z Fold6不仅在生成式AI功能和S Pen智慧应用方面展现出三星在AI领域前沿的创新成果，更是将移动生产力推向了新高度，为用户带来了高能创作与办公新方式。AI搭配S Pen 创作体验前所未有当Gal

07-11

Galaxy AI赋能大视野智能外屏三星Galaxy Z Flip6开启折叠屏新时代

2024年，无疑是AI技术重塑智能手机体验与市场格局的一年。今年年初，三星在Galaxy S24系列上首发由Galaxy AI赋能的一系列AI应用，引领智能移动体验正式进入了AI时代。作为行业的领导者，三星自然也会不断推陈出新，为用户带来更具突破性的创新体验。在刚刚过去的全球发

07-11

打破传统生活方式，三星Galaxy Z Fold6以Galaxy AI迎接未来

近两年，AI(人工智能)技术正以前所未有的速度渗透到我们生活的方方面面。作为最贴近用户的智能终端，智能手机无疑是AI技术落地应用的最佳载体。7月10日，三星在巴黎举办的Galaxy Unpacked发布会上推出了新一代折叠旗舰Galaxy Z Fold6。这款手机带来硬件升级的同时，更引

07-11

三星BESPOKE缤色铂格洗烘系列定义高端生活美学，重塑衣物焕新之旅

随着居民生活水平的提高和消费观念的转变，消费者对洗烘产品的需求不再仅仅局限于基本的洗涤和烘干功能，而是更加注重产品的品质、智能化程度以及健康环保特性。在AI技术的深度赋能之下，三星BESPOKE缤色铂格洗/干衣机以超薄嵌入设计结合高效智慧功能，带来省心省力的衣

07-11

三星发布Galaxy Ring智能戒指开启健康新体验

健康生活早已成为全社会的共同追求，尤其是在智能手表与智能手环等科技潮品的加持下，监测身体信息与运动数据已不再是难事。越来越多的人开始使用智能穿戴设备，通过科学的手段来追踪运动数据。而作为推动数字化健康的先行者，三星也在不断对智能穿戴产品的形态进行积极

07-11

三星智能穿戴产品再添新成员为更多用户带来智能健康新体验

三星Galaxy Ring、Galaxy Watch7和Galaxy Watch Ultra通过智能化健康革新，让日常健康管理变得更有意义。2024年7月10日，三星电子今日宣布推出三星Galaxy Ring、Galaxy Watch7和Galaxy Watch Ultra[1]。三款新品的推出旨在为更多用户提供端到端的健康体验[2]，将Galaxy

07-11

“氢风”正劲！上海电气以实力推进氢能产业可持续发展

近年来，全球能源转型步伐加快，氢能作为未来能源的重要发展方向备受瞩目。在这一背景下，上海电气紧跟时代潮流，积极布局氢能全产业链，致力于推动绿色低碳转型。在日前举行的2024上海国际碳中和技术、产品与成果博览会上，上海电气展示了多款氢能领域的创新产品，其中

07-11

空投兑换进行时：一键参与火币HTX_Restaking打新，甄选优质项目，省心又安全

随着2024上半年 Restaking 赛道的火爆，其作为一种创新的质押模式，为用户提供了更高的收益和更灵活的资产管理方式。参与HTX打新 Restaking活动的用户纷纷获得了高额的空投回报。目前，HTX打新 Restaking 已开启r-BB(r-Bouncebit)积分兑换，并同步翻倍每日r-ETHFI奖励。

07-11

点击查看更多 +

全站最新

苹果AI技术成关键推手：iPhone 16系列出货量目标上调，预计超9000万部

萝卜快跑10公里3.9元引热议，官方：暂未定性为营运

IDC：华为擎云商用平板登顶中国市场出货量榜首

郭明錤曝光苹果 iPhone 16-19 系列相机路线图：四重棱镜普及，水晶光电成最大赢家

换机周期越来越长，iPhone超71%的用户使用旧机两年以上

思看科技3D扫描技术：引领文化遗产数字化保护新篇章

热门内容

2024欧洲杯赛程时间出炉，用当贝D6X Pro享受“身临其境”的观赛体验
2024欧洲杯直播在哪看？在哪个软件可以看比赛直播、回放
破土而出：Hamster Kombat和TON区块链的双重冲击
父亲节送什么礼物好？送一台当贝F6更贴心！
2024年欧洲杯赛程出炉！当贝X5S投影仪让你最直观体验赛场！
重磅官宣！宏碁暗影骑士·擎6成无畏契约冠军巡回赛虎牙直播合作伙伴
重塑儿童智能陪护体验跃然创新推出全球首款AI玩具BubblePal
深信服牵头！立项制定《网络安全运营大模型参考架构》技术规范
亿达中国大连软件园引入日本知名企业星崎集团，在中国成立首家独立海外研发中心
值得推荐的3000元左右家用投影仪：当贝D6X Pro轻薄便携体验超赞
洞察智能化趋势，筑牢金融安全基石：BCS第五届金融业网络安全论坛成功举办
小笨智能：机器人灵活运动的秘密，就藏在SLAM技术里
618惊喜价格三星Galaxy S24系列限时加赠Galaxy Buds2 Pro
京东3C数码企业及商采618战报来袭奔图品牌成交额同比增长60%
2024年618性价比最高的4K投影仪！为什么说当贝X5S Pro性价比最高

本栏最新

思看科技3D扫描技术：引领文化遗产数字化保护新篇章

三维扫描案例分享：思看科技3D扫描仪助力水电站检测与维护！

干衣机迎来革命性创新,小天鹅与Askoll强强联手引领

折叠屏体验新标杆三星Galaxy Z Fold6创新AI解锁高效生产力

Galaxy AI赋能大视野智能外屏三星Galaxy Z Flip6开启折叠屏新时代

打破传统生活方式，三星Galaxy Z Fold6以Galaxy AI迎接未来

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-5964-0.htmlCPU,正在被AI时代抛弃？

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：微软对“中国区员工必须使用iPhone”回应：为员工提供访问必要应用的途径

下一篇：紫光闪存京东品牌焕新日来袭！多重福利精彩放送

标签：

热门焦点

ChatGPT访问量增速下滑，AI真的是一场泡沫吗？

来源：首席商业评论2023年，最火的莫过于ChatGPT，席卷全球的同时也引发了生成式AI（人工智能）的投资热潮。在美股，ChatGPT相关概念股飙涨，以AI算力龙头英伟达为例，其股价年内一度累计上
拯救XR，苹果力不从心

来源 | 光子星球撰文 | 文烨豪编辑 | 吴先之苹果终于呈上了它的“答卷”。北京时间6月6日凌晨，苹果2023年全球开发者大会（WWDC）如期举行。作为苹果CEO库克口中&ld
2021年中国智慧城市行业概览：AI慧眼独具，赋能“双碳”目标

中国智慧城市试点项目主要集中于东南地区以及华中地区，受制于应用场景分散以及行业地域建设差异，目前中国智慧城市存在较多弊端，未来数量有望持续突破。中国智慧
韩国国民银行将推出韩国首个加密货币 ETF

韩国国民银行(Kookmin Bank)计划发行该国首个以散户投资者为主要关注点的加密货币投资基金。根据公告，该银行正在等待政府批准，并已建立一个准备就绪的数字资产
FTX 加密货币交易所开始向游戏公司提供加密服务

据媒体报道，业内领先的加密货币交易所FTX宣布将涉足游戏领域。该公司表示，计划推出自己的游戏部门作为中介，专注于为传统游戏公司提供加密相关服务。此举将有助于
虚拟邓丽君后，数字人赛道开启3.0时代

“如果右脑时代来临，虚拟世界将是对人类才华的无限放大。” 郭晓喆称，开发数字人形象时，自己的团队在内部“卷”了一下：“当我们翻阅大量历史典籍的时候，苏小妹找到
元宇宙的应用行业研究：娱乐可能是元宇宙落地最快的场景之一

近日，毕马威正式发布其《初探元宇宙》报告，这也是毕马威在元宇宙领域发布的首份报告。报告指出，元宇宙在以下十个领域的应用场景尤其值得期待，包括娱乐、社交、零
爆发在即的Layer2赛道百花齐放，谁将是领跑者？

还记得几年前最早我们提起ETH扩容，首先想到就是Layer2，而Layer2里，首先想到的是闪电网络，状态通道，Plasma…然后折腾了几年，发现并没有什么用，许多项目方和资本也等不
超级账本Julian Gordon：联盟链与公链的竞争不是非此即彼

在2021年《福布斯》区块链50强榜单中，29家企业使用Hyperledger超级账本技术，占比近60%。同年，研究机构Blockdata发布了的调查报告显示，访问Top100上市公司中，有 81