当前位置:首页 > 科技  > 数码

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代

来源: 责编: 时间:2024-06-11 17:45:29 85观看
导读 台北电脑展2024活动期间,文Q有幸独家采访了AMD GPU技术与工程研发高级副总裁王启尚(David Wang)。王启尚先生有着30多年的显卡和芯片工程研发经验,目前在AMD负责架构、IP和软件等GPU技术开发,同时领导着AMD显

台北电脑展2024活动期间,文Q有幸独家采访了AMD GPU技术与工程研发高级副总裁王启尚(David Wang)。jjN28资讯网——每日最新资讯28at.com

王启尚先生有着30多年的显卡和芯片工程研发经验,目前在AMD负责架构、IP和软件等GPU技术开发,同时领导着AMD显卡、数据中心GPU、客户端和半定制业务SoC的工程研发。jjN28资讯网——每日最新资讯28at.com

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代与王启尚先生的合影jjN28资讯网——每日最新资讯28at.com

访谈从AI LLM大语言模型开始。jjN28资讯网——每日最新资讯28at.com

王启尚在此前3月份北京举办的AMD AI PC创新峰会上就开门见山地分析了LLM的发展趋势,大型闭源模型越来越庞大,比如GPT-4的参数量已经达到1.76万亿;即便是相对小型的开源模型也在膨胀,Llama 2参数量达700亿,阿里通义千问2达到720亿。jjN28资讯网——每日最新资讯28at.com

如此庞大的LLM,对于算力的需求是十分“饥渴”的,同样需要海量的电力去支撑,远超一般数据中心的承受能力,越发引起行业的担忧。jjN28资讯网——每日最新资讯28at.com

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代jjN28资讯网——每日最新资讯28at.com

对此,王启尚分析指出,基础大模型的参数规模成长曲线比摩尔定律来得还要猛烈,几乎每两年就增长多达5-10倍,所以诞生了新的“混合专家模型”(MOE)策略,将单一大模型变为众多专家模型的集合,每一个都有自己专门擅长的领域,因此不需要超级庞大甚至无限制,相信未来会越来越流行。jjN28资讯网——每日最新资讯28at.com

在硬件方面,每一年都在更新换代,匹配大模型的快速进化趋势,重点就是提升算力和算法、内存容量和带宽。jjN28资讯网——每日最新资讯28at.com

其中,算力和精度密切相关,趋势是越来越低,前几年需要16位,现在逐渐转向8位精度,AMD下一代CDNA4 MI350会进一步降至6位或者4位,而终可能会走向2位或者1位——人脑就是1位或者2位的。jjN28资讯网——每日最新资讯28at.com

当然,这个精度也要看模型的设计,有时可能需要量化和重新训练。jjN28资讯网——每日最新资讯28at.com

目前来看,没什么“魔法”大幅降低硬件的功耗,能做的就是努力提升能效。jjN28资讯网——每日最新资讯28at.com

比如AMD的下一代产品,性能可以提升35倍,但功耗不会增加这么多,客户依然愿意购买越来越多的GPU,毕竟算力依然不够。jjN28资讯网——每日最新资讯28at.com

王启尚承认,电力的问题会一直存在,未来数据中心可能真的需要自建发电厂。jjN28资讯网——每日最新资讯28at.com

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代jjN28资讯网——每日最新资讯28at.com

回到距离我们更近的AI产品,比如说Strix Point的下一代移动处理器锐龙AI 300系列,NPU的算力达到了50TOPS,可以满足更多对算力有需求的场景,更多地接手CPU、GPU的工作。jjN28资讯网——每日最新资讯28at.com

王启尚表示,每一种AI引擎都有适合自己的工作,比如CPU主要做通用运算,GPU可以快速训练大模型,NPU则可以达成低的功耗和高的能效,当然将负载迁移到NPU上都需要一定的优化和时间。jjN28资讯网——每日最新资讯28at.com

特别是在GPU、NPU之间,存在着折衷和妥协,取决于你看中高速度还是高能效。jjN28资讯网——每日最新资讯28at.com

另一方面,在未来,AMD希望通过多层的Graph Compile 编译器,根据系统里的AI引擎类别,可以将不同的负载分配给不同的AI引擎让CPU、GPU、NPU同时跑起来,达到高效率。jjN28资讯网——每日最新资讯28at.com

不过这方面还需要一定的时间,目前仍是将全部的工作负载放在同一个编译器里执行,我们能做的是让整个模型变得更成熟,使其简单地进行编译佳化,但这仍需要一定的人力成本。jjN28资讯网——每日最新资讯28at.com

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代jjN28资讯网——每日最新资讯28at.com

当笔者问到,说起CPU、GPU、NPU的多引擎组合,Intel也已经具备全线实力,NVIDIA也在尝试做自己的CPU,AMD又该怎么办呢?jjN28资讯网——每日最新资讯28at.com

王启尚认为,每一家厂商都有自己的独特优势,AMD的三种引擎在业内都是非常好的,也非常均衡jjN28资讯网——每日最新资讯28at.com

未来,AMD将继续发挥三种引擎都可以提供佳状态的优势,每一样都要做好,同时延续AMD一贯的企业文化,在软件方面坚持开源,和行业伙伴共同创新,打造开放的生态链,拥抱AI大时代。jjN28资讯网——每日最新资讯28at.com

比如AMD联合博通、思科、谷歌、慧与、Intel、Meta、微软共同宣布了开放的行业标准UALink(Ultra Accelerator Link),共同推进AI基础设施建设。jjN28资讯网——每日最新资讯28at.com

在这八大创始成员中,谷歌、慧与、Meta、微软都是数据中心客户,都非常高兴能有这样的开放标准,可以更标准化、更容易地扩建大规模数据中心,不会被限制在专有方案中。jjN28资讯网——每日最新资讯28at.com

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代jjN28资讯网——每日最新资讯28at.com

后聊到了王启尚的专长,也就是GPU发展,包括锐龙AI 300系列核显使用的RDNA 3.5(或者叫RDNA 3+),以及下一代显卡将会使用的RDNA 4。jjN28资讯网——每日最新资讯28at.com

具体细节目前肯定无法公开,不过王启尚透露,RDNA 3.5重点针对APU环境做了优化,比如集成图形核心规模从12个CU单元增加到多提供16个CU单元(笔者换算为增幅33%),对于APU来说是非常强悍的,可以更好地用于游戏。jjN28资讯网——每日最新资讯28at.com

RDNA 4在游戏方面的重点就是通过AI增强游戏体验,包括更强的光线追踪,更多的AI加速画质和帧率。jjN28资讯网——每日最新资讯28at.com

事实上,这也是RDNA GPU家族发展的大方向。jjN28资讯网——每日最新资讯28at.com

独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代jjN28资讯网——每日最新资讯28at.com

根据王启尚先生的精彩分享,我们拭目以待AMD在未来的AI进击!jjN28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-24-93012-0.html独家专访AMD高级副总裁王启尚:打造开放生态链 拥抱AI大时代

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 首搭PAW3398传感器!雷柏VT1PRO鼠标评测:身材轻盈表现硬核

下一篇: NVIDIA与铭瑄为玩家送福利:购买铭瑄指定RTX 40系可获赠《黑神话:悟空》

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • 轿车从天而降电动车主被撞身亡 超速抢道所致:现场视频让网友吵翻

    轿车从天而降电动车主被撞身亡 超速抢道所致:现场视频让网友吵翻

    近日,上海青浦区法院判决轿车从天而降电动车主被撞身亡案,轿车车主被判有期徒刑一年。案件显示当时男子驾驶轿车在上海某路段行驶,前车忽然转弯提速超车,
  • 8月总票房已突破10亿!《封神》第一:口碑已经成了

    8月总票房已突破10亿!《封神》第一:口碑已经成了

    8月5日消息,据灯塔专业版数据,截至8月5日9时35分,8月总票房(含预售)已突破10亿。其中,《封神》以大比分的优势领先。根据官方消息,目前该片总票房已经超过14.
  • 线程通讯的三种方法!通俗易懂

    线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • Flowable工作流引擎的科普与实践

    Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 三言两语说透柯里化和反柯里化

    三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 2天涨粉255万,又一赛道在抖音爆火

    2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 重估百度丨大模型,能撑起百度的“今天”吗?

    重估百度丨大模型,能撑起百度的“今天”吗?

    自象限原创 作者|程心 罗辑2023年之前,对于自己的“今天”,百度也很迷茫。“新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
Top
Baidu
map