当前位置:首页 > 元宇宙 > AI

大模型时代:算力浪费竟超50%!百度AI计算部负责人揭秘算力成本之谜

来源: 责编: 时间:2024-09-15 15:17:19 20观看
导读【ITBEAR】9月15日消息,在AI大模型时代,算力成本已成为业界关注的焦点。百度系统架构师、百度智能云AI计算部负责人王雁鹏近日分享了关于如何有效降低万卡集群算力开支的见解,提出了五大解决方案。王雁鹏指出,随着深度学

【ITBEAR】9月15日消息,在AI大模型时代,算力成本已成为业界关注的焦点。百度系统架构师、百度智能云AI计算部负责人王雁鹏近日分享了关于如何有效降低万卡集群算力开支的见解,提出了五大解决方案。QGL28资讯网——每日最新资讯28at.com

QGL28资讯网——每日最新资讯28at.com

王雁鹏指出,随着深度学习技术的不断发展,GPU集群规模已达万卡级别,这使得大模型时代的算力成本远超人力成本。为了应对这一挑战,他提出了包括搭载RDMA网络、采用自动并行策略、确保训练稳定性、动态分配算力以及实现多芯异构混训在内的五大策略。QGL28资讯网——每日最新资讯28at.com

据ITBEAR了解,RDMA网络的应用在AI集群中显得尤为重要。与传统的IB网络相比,RDMA网络更适合AI集群的需求,它优先考虑吞吐量而非延迟,从而有效提升了AI集群的带宽有效率和模型性能。QGL28资讯网——每日最新资讯28at.com

此外,王雁鹏还强调了自动并行策略在AI集群演进中的重要性。通过采用“边计算边通信”的方式和显存优化的切分策略,百度成功提高了模型性能,甚至超越了开源模型和人工调优模型的效果。QGL28资讯网——每日最新资讯28at.com

QGL28资讯网——每日最新资讯28at.com

在谈到训练稳定性时,王雁鹏表示,稳定不间断的任务运行对于AI训练至关重要。百度通过一系列技术手段,如Hang检测、慢节点检测等,确保了文心一言大模型的有效训练时长比例超过99%。QGL28资讯网——每日最新资讯28at.com

针对资源利用率问题,王雁鹏提出了训练一体的解决方案。通过动态分配算力流量和资源,百度百舸异构计算平台成功将资源利用率从50%提升至90%,从而有效应对了主流模型训练中的劣势。QGL28资讯网——每日最新资讯28at.com

最后,王雁鹏探讨了多芯异构混训在解决算力卡脖子问题中的关键作用。他提出,通过搭建跨芯沟通库和采用Accelerator抽象设计方法,百度实现了在千卡和万卡规模下性能损失的最小化。QGL28资讯网——每日最新资讯28at.com

展望未来,王雁鹏透露百度将继续在三个核心技术上寻求突破:实现更高效的拓扑和拥塞控制、扩大跨地域RDMA网络范围以及进一步提升训练故障恢复速度。这些技术突破将为百度在未来十万卡级别的AI集群竞争中占据有利地位提供有力支持。QGL28资讯网——每日最新资讯28at.com

关键词:#百度# #AI大模型# #算力成本# #RDMA网络# #多芯异构混训#QGL28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-7221-0.html大模型时代:算力浪费竟超50%!百度AI计算部负责人揭秘算力成本之谜

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Xbox遭遇挫折,XGP业务受困,微软游戏未来如何破局?

下一篇: 马斯克放大招:三个月打造全球最大GPU集群,竟还嫌不够?再加10万个!

标签:
  • 热门焦点
  • 内容行业大变天,爆款全靠AI?

    内容行业大变天,爆款全靠AI?

    出品 | 微果酱(wjam123456)作者 | 陈出木题图 | 文心一格 AI的发展之快出乎所有人的预料,似乎一夜之间便呼啸而来。无论是资本的风向标,抑或是生活工作的辅助、流量口,还是茶余饭
  • 企业热、用户冷,元宇宙第一站将是“营销场”?

    企业热、用户冷,元宇宙第一站将是“营销场”?

    如果说2021年底什么最火热,那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语,在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日,有消息传
  • 星展银行(DBS)计划推出零售数字资产交易服务

    星展银行(DBS)计划推出零售数字资产交易服务

    2月14日消息,新加坡星展银行CEO Piyush Gupta在财报会议上表示,计划于2022年年底前推出零售数字资产交易服务。据悉,DBS于2021年初开设了机构数字资产交易平台,全
  • 2022年的Web3:定义概念并开创新范式

    2022年的Web3:定义概念并开创新范式

    Web3 是关于加密和区块链应该如何使用的概念,因为它是加密圈的一个离散子领域。社区机会将呈指数级增长,扩大这些子行业的人口统计范围。追求 Web3 项目的组织仍
  • 2030年的元宇宙产业将会如何发展?

    2030年的元宇宙产业将会如何发展?

    对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新,寻找新的增长点,移动互联网流量空间见顶之际,元宇宙时代红利已然开启。序章:元宇宙应用场景大猜想元宇
  • Kitten Coup社区反转Cool Kittens NFT骗局

    Kitten Coup社区反转Cool Kittens NFT骗局

    当狂热的加密爱好者将金钱投入到NFT图片时,浑水摸鱼的骗局随之而来,Cool Kittens NFT便是其中一个作恶者,该项目于去年11月在Sonala链上启动小猫形象的NFT铸造及
  • 韩国国民银行将推出韩国首个加密货币 ETF

    韩国国民银行将推出韩国首个加密货币 ETF

    韩国国民银行(Kookmin Bank)计划发行该国首个以散户投资者为主要关注点的加密货币投资基金。根据公告,该银行正在等待政府批准,并已建立一个准备就绪的数字资产
  • 韩国流行音乐巨头SM与Binance达成NFT合作伙伴关系

    韩国流行音乐巨头SM与Binance达成NFT合作伙伴关系

    韩国流行音乐巨头 SM Entertainment 与加密货币交易所 Binance(币安)达成“Play2Create”NFT 合作伙伴关系。SM 娱乐一直在投资打造元宇宙该公司于 2020 年 10
  • Staking 收益翻倍?

    Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
Top
Baidu
map