当前位置:首页 > 科技  > 软件

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

来源: 责编: 时间:2024-05-11 09:17:52 93观看
导读DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门,成为了Hacker News等许多科技媒体的头版头条。图片Hacker News热榜上紧随其后的则是今年2月发布的论文「一致性大语言模型」。图片到底是什么样的成果,竟然可以顶

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门,成为了Hacker News等许多科技媒体的头版头条。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

Hacker News热榜上紧随其后的则是今年2月发布的论文「一致性大语言模型」。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

到底是什么样的成果,竟然可以顶着AlphaFold 3的热度出圈?FUg28资讯网——每日最新资讯28at.com

这篇论文不仅切中了大语言模型推理速度慢的痛点,而且实现了性能大幅度提升。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

CLLM在多个下游任务上都取得了2-3倍的加速,且推理过程没有引入额外成本。在GSM8K和Spider两个任务中,相比今年1月刚发布的Medusa 2都有了明显提升。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

论文的两位共同一作都是一年级博士生,分别是来自上海交通大学的寇思麒和来自加州大学圣地亚哥分校的胡岚翔,他们的指导老师是交大的邓志杰教授和UCSD的张昊教授,后者也是Vicuna/vLLM/Chatbot Arena等项目的作者。FUg28资讯网——每日最新资讯28at.com

目前这篇论文已经被ICML 2024会议接收,所用代码已在GitHub上开源,可以在HuggingFace仓库上看到模型多个版本的权重。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

https://huggingface.co/cllmFUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

https://github.com/hao-ai-lab/Consistency_LLMFUg28资讯网——每日最新资讯28at.com

LLM苦推理速度久矣

以GPT和Llama家族为代表的大语言模型虽然可以出色地完成人类语言任务,但代价也是巨大的。FUg28资讯网——每日最新资讯28at.com

除了参数量大,推理速度慢、token吞吐量低也是经常被人诟病的问题,尤其是对于上下文信息较多的任务,因此大语言模型的部署和在现实中的应用十分受限。FUg28资讯网——每日最新资讯28at.com

Reddit上经常有开发者询问减少LLM推理时间的方法,有人曾经发帖,在64G GPU内存、4块英伟达T4芯片上用langchain部署7B的Llama 2模型后,需要10秒钟回答较小的查询,较大的查询则需要3分钟。FUg28资讯网——每日最新资讯28at.com

图片FUg28资讯网——每日最新资讯28at.com

为了提高推理速度和token吞吐量,研究者们想了很多方法,比如去年很流行的vLLM推理框架,就是通过改进注意力算法来提高语言模型的效率。FUg28资讯网——每日最新资讯28at.com

CLLM的思路则放在了解码上,使用更适合并行的Jacobi算法替代传统的自回归方法。FUg28资讯网——每日最新资讯28at.com

Jacobi解码算法

自回归解码算法在运行时,每次只能基于已知序列生成1个token,这种基于时间序列的算法对GPT之类的大模型非常不友好,要想实现并行化的推理,就必须修改模型架构或者添加额外的构件。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

这篇研究则提出,使用Jacobi解码算法取代传统的自回归,每一次解码可以同时生成序列后n个token。FUg28资讯网——每日最新资讯28at.com

Jacobi解码源自用于求解非线性方程的Jacobi和Gauss-Seidel定点迭代,并被证明与使用贪婪解码的自回归生成相同。FUg28资讯网——每日最新资讯28at.com

给定一个初始序列时,首先生成n个随机token作为起始点,之后将这n个token的优化问题看作n个非线性方程组,里面含有的n个变量可以基于Jacobi迭代并行求解。FUg28资讯网——每日最新资讯28at.com

每一次Jacobi迭代可以预测出一个或多个正确的token,进行多轮迭代直至收敛,就完成了n个token的预测,迭代的过程形成Jacobi轨迹。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

本篇文章所用Jacobi算法的灵感追溯至2021年的一篇论文,用求解非线性方程组加速神经网络计算。FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/pdf/2002.03629FUg28资讯网——每日最新资讯28at.com

以及张昊组的另一篇论文lookahead decoding:FUg28资讯网——每日最新资讯28at.com

图片图片FUg28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/pdf/2402.02057FUg28资讯网——每日最新资讯28at.com

一致性语言模型

使用Jacobi算法解码时,大语言模型的推理过程可以被归纳为——一致地将雅可比轨迹

本文链接://www.dmpip.com//www.dmpip.com/showinfo-26-87963-0.html抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 异步编程在C#中的应用:深入理解Task

下一篇: 这个 TypeScript 技巧会让你大吃一惊

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • CSS单标签实现转转logo

    CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 企业采用CRM系统的11个好处

    企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 三分钟白话RocketMQ系列—— 如何发送消息

    三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 东方甄选单飞:有些鸟注定是关不住的

    东方甄选单飞:有些鸟注定是关不住的

    文/彭宽鸿编辑/罗卿东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一年多时间里,东方甄选要脱离抖音自立门户的传闻不绝于耳,“7
  • 三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    据官方此前宣布,三星将于7月26日也就是今天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • 最薄的14英寸游戏笔记本电脑  Alienware X14已可以购买

    最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

    2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了,这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
Top
Baidu
map