当前位置:首页 > 科技  > 知识百科

炼丹速度×7!你的Mac电脑也能在PyTorch训练中用GPU加速了

来源: 责编: 时间:2023-08-07 16:30:18 139观看
导读 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。一直以来,Pytorch在Mac上仅支持使用CPU进行训练。就在刚刚,Pytorch官方宣布,其最新版v1.12可以支持GPU加速了。

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。RVL28资讯网——每日最新资讯28at.com

一直以来,Pytorch在Mac上仅支持使用CPU进行训练。RVL28资讯网——每日最新资讯28at.com

就在刚刚,Pytorch官方宣布,其最新版v1.12可以支持GPU加速了。RVL28资讯网——每日最新资讯28at.com

只要是搭载了M1系列芯片的Mac都行。RVL28资讯网——每日最新资讯28at.com

RVL28资讯网——每日最新资讯28at.com

这也就意味着在Mac本机用Pytorch“炼丹”会更方便了!RVL28资讯网——每日最新资讯28at.com

训练速度可提升约7倍RVL28资讯网——每日最新资讯28at.com

此功能由Pytorch与Apple的Metal工程团队合作推出。RVL28资讯网——每日最新资讯28at.com

它使用Apple的Metal Performance Shaders(MPS) 作为PyTorch的后端来启用GPU加速训练。RVL28资讯网——每日最新资讯28at.com

为了优化计算性能,MPS还针对Metal GPU系列的独特特性对每个内核进行了微调。RVL28资讯网——每日最新资讯28at.com

Metal是一个类似OpenGL的框架,只不过OpenGL适用于各平台的移动端GPU渲染和计算,Metal专用于iOS/MacOS平台,不过也兼顾了性能和易用性。RVL28资讯网——每日最新资讯28at.com

MPS就是一套基于Metal框架的库,直接调用即可使用GPU的高性能进行图形处理、构建卷积神经网络等工作。RVL28资讯网——每日最新资讯28at.com

RVL28资讯网——每日最新资讯28at.com

苹果官方在搭载了M1 Ultra、20核CPU、64核GPU、128GB RAM和2TB SSD的Mac Studio上进行了测试。RVL28资讯网——每日最新资讯28at.com

(这阵容差不多能算是豪华配置了)。RVL28资讯网——每日最新资讯28at.com

他们分别训练了batch size为128的ResNet50、batch size为64的HuggingFace BERT,以及batch size=64的VGG16。RVL28资讯网——每日最新资讯28at.com

从下图中我们可以发现,相比使用CPU加速,使用GPU可将模型训练速度提高约7倍,评估(evaluation)速度则最高能提约20倍。RVL28资讯网——每日最新资讯28at.com

RVL28资讯网——每日最新资讯28at.com

看到这儿,有网友开始好奇它与搭载了Nvidia GPU的laptop相比性能如何。RVL28资讯网——每日最新资讯28at.com

RVL28资讯网——每日最新资讯28at.com

有人表示,虽说目前M1的原始计算性能比不上英伟达的产品,但功耗方面还不错。未来苹果很有可能慢慢追上性能。RVL28资讯网——每日最新资讯28at.com

总的来说,Mac Studio现在看起来实在太香了。RVL28资讯网——每日最新资讯28at.com

他进一步解释道:RVL28资讯网——每日最新资讯28at.com

“毕竟它是你花4800美元就能买到的最便宜、包含128GB GPU内存的机器。现在有了基于GPU加速的PyTorch支持,完全可以用来训练大模型、配置大的batch size。RVL28资讯网——每日最新资讯28at.com

对于我所做的那种DL工作,数据加载比实际的原始计算能力更容易成为瓶颈。”RVL28资讯网——每日最新资讯28at.com

RVL28资讯网——每日最新资讯28at.com

你心动了吗?RVL28资讯网——每日最新资讯28at.com

现在就试试?RVL28资讯网——每日最新资讯28at.com

只需保证你的macOS操作系统在12.3版本及以上,且安装了arm64原生Python,然后去官网下载最新的Pytorch预览版就可以了。RVL28资讯网——每日最新资讯28at.com

RVL28资讯网——每日最新资讯28at.com

地址:RVL28资讯网——每日最新资讯28at.com
https://pytorch.org/blog/introducing-accelerated-pytorch-training-on-mac/RVL28资讯网——每日最新资讯28at.com

 RVL28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-119-2334-0.html炼丹速度×7!你的Mac电脑也能在PyTorch训练中用GPU加速了

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 用Elastic Block Store(EBS)改善性能和数据可用性 译文

下一篇: 浅谈:什么是云网络?

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 腾讯盖楼,字节拆墙

    腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • ESG的面子与里子

    ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 认真聊聊东方甄选:如何告别低垂的果实

    认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 微博大门常打开,迎接海外画师漂洋东渡

    微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
  • 华为发布HarmonyOS 4:更好玩、更流畅、更安全

    华为发布HarmonyOS 4:更好玩、更流畅、更安全

    在8月4日的华为开发者大会2023(HDC.Together)大会上,HarmonyOS 4正式发布。自2019年发布以来,HarmonyOS一直以用户为中心,经历四年多的发展HarmonyOS已
  • SN570 NVMe SSD固态硬盘 价格与性能兼具

    SN570 NVMe SSD固态硬盘 价格与性能兼具

    SN570 NVMe SSD固态硬盘是西部数据发布的最新一代WD Blue系列的固态硬盘,不仅闪存技术更为精进,性能也得到了进一步的跃升。WD Blue SN570 NVMe SSD的包装外
Top
Baidu
map