当前位置:首页 > 科技  > 数码

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

来源: 责编: 时间:2024-08-20 09:02:13 39观看
导读 快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级

快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。voX28资讯网——每日最新资讯28at.com

夸娥1.2主要升级点:voX28资讯网——每日最新资讯28at.com

▼MFU提升10% 高可达55%voX28资讯网——每日最新资讯28at.com

在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。voX28资讯网——每日最新资讯28at.com

稠密模型集群训练中,MFU高达到55%。voX28资讯网——每日最新资讯28at.com

▼Flash Attention2优化voX28资讯网——每日最新资讯28at.com

通过集成新的MUSA SDK平台与优化后的Flash Attention2技术,结合新版Torch MUSA和算子融合,显著提升了大模型训练的效率与资源利用率,大幅缩短训练周期,并降低了整体成本。voX28资讯网——每日最新资讯28at.com

▼64K长文本支持voX28资讯网——每日最新资讯28at.com

增强了对长文本大模型训练的支持,优化了处理长文本理解和生成任务的能力,能够更好地应对文档摘要、文章写作等复杂语言处理任务。voX28资讯网——每日最新资讯28at.com

▼支持混合专家模型MoEvoX28资讯网——每日最新资讯28at.com

MCCL通信库完成了All2All优化,并针对muDNN算子在不同形状下的矩阵运算进行了优化,以更好地支持MoE(Mixture of Experts)大模型的训练。voX28资讯网——每日最新资讯28at.com

这不仅提升了智算效率,还为更大规模参数的大模型训练提供了高度可扩展的基础。voX28资讯网——每日最新资讯28at.com

▼断点续训voX28资讯网——每日最新资讯28at.com

进一步提升了大模型训练的Checkpoint(检查点)读写性能,写入时间小于2秒,显著提高训练效率。voX28资讯网——每日最新资讯28at.com

▼优化DeepSpeedvoX28资讯网——每日最新资讯28at.com

支持DeepSpeed、Ulysses的适配和性能优化,强化了长文本训练支持。voX28资讯网——每日最新资讯28at.com

适配国内外多款大模型,在Hugging Face上支持训练和微调主要的开源大模型,创新型企业可以灵活选择不同的大模型开发智能应用。voX28资讯网——每日最新资讯28at.com

▼稳定性提升voX28资讯网——每日最新资讯28at.com

千卡集群软硬件进一步成熟,实现了连续无故障训练长达15天。voX28资讯网——每日最新资讯28at.com

新版本引入了KUAE Aegis可靠性功能,加强了对GPU、显存、集合通信等方面的监控、自动诊断与故障恢复能力。voX28资讯网——每日最新资讯28at.com

▼可视化/可观测voX28资讯网——每日最新资讯28at.com

引入了PerfSight性能监控系统,可实时显示模型训练过程中的资源消耗与性能分析数据,有助于快速发现并恢复训练期间的故障,满足大模型上的性能调优需求。voX28资讯网——每日最新资讯28at.com

▼内置模型库中新增大模型voX28资讯网——每日最新资讯28at.com

KUAE内置模型库Model Zoo新增LLaMA2全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。voX28资讯网——每日最新资讯28at.com

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2voX28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-24-108653-0.html连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: AOC推出新款24寸显示器:2K 120Hz屏首发仅749元

下一篇: 7月中国主板市场遇冷:华硕稳居首位 成唯一增长品牌

标签:
  • 热门焦点
  • 8月总票房已突破10亿!《封神》第一:口碑已经成了

    8月总票房已突破10亿!《封神》第一:口碑已经成了

    8月5日消息,据灯塔专业版数据,截至8月5日9时35分,8月总票房(含预售)已突破10亿。其中,《封神》以大比分的优势领先。根据官方消息,目前该片总票房已经超过14.
  • SpringBoot中使用Cache提升接口性能详解

    SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 如何正确使用:Has和:Nth-Last-Child

    如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 企业采用CRM系统的11个好处

    企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 让我们一起聊聊文件的操作

    让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 多线程开发带来的问题与解决方法

    多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 2纳米决战2025

    2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    【Techweb评测】中端机型用户群体巨大,占了中国目前手机市场的大头,一直以来都是各手机品牌的“必争之地”,其中OPPO K系列机型一直以来都以高品质、
  • Windows 11发布,微软一改往常对老机型开放的态度

    Windows 11发布,微软一改往常对老机型开放的态度

    距离 Windows 11 发布已经过去一周,在过去一周里,很多数码爱好者围绕其对 Android 应用的支持、对老机型的升级问题展开了激烈讨论。与以往不同的是,在这次大
Top
Baidu
map