当前位置:首页 > 科技  > 软件

阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉

来源: 责编: 时间:2024-05-09 17:52:36 101观看
导读 5 月 9 日消息,阿里巴巴达摩院(湖畔实验室)、新加坡南洋理工大学等联合提出了大模型知识链(CoK)框架。相比传统的检索增强生成(RAG)技术,该框架可实时检索异构知识源并逐步纠正推理错误,进一步提高大模型问答知识型问

5 月 9 日消息,阿里巴巴达摩院(湖畔实验室)、新加坡南洋理工大学等联合提出了大模型知识链(CoK)框架。相比传统的检索增强生成(RAG)技术,该框架可实时检索异构知识源并逐步纠正推理错误,进一步提高大模型问答知识型问题的准确率,降低幻觉现象。相关论文入选正在奥地利维也纳举行的国际表征学习大会(ICLR 2024)。Sxa28资讯网——每日最新资讯28at.com

“执导了《El Tio Disparate》的阿根廷演员出生于哪一年?”面对此类需要多步推理的知识型问题,大模型可能会“胡言乱语”,给出看似符合逻辑,实则错误或并不存在的回答。这个问题被称作大模型“幻觉”,极大制约了大模型的应用场景。学界也在重点研究给大模型“外挂知识库”的 RAG 等技术路线。Sxa28资讯网——每日最新资讯28at.com

在论文《Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources》中,达摩院领衔的联合研究团队提出了一种名为“知识链”(Chain-of-Knowledge, CoK)的新框架,包括推理准备、动态知识适应和答案整合三个步骤。对于知识密集型问题,知识链先确定知识领域,并准备若干中间推理步骤和相应答案。如若这些初步结论没有共识,知识链将实时检索相应知识领域内的不同知识源,逐步生成、纠正推理步骤,给出最终答案。Sxa28资讯网——每日最新资讯28at.com

Sxa28资讯网——每日最新资讯28at.com

图说:“知识链”(CoK)框架包括(I)推理准备(II)动态知识适应和(III)答案整合Sxa28资讯网——每日最新资讯28at.com

与传统的 RAG 相比,知识链框架创新性地设计了对推理分析过程的逐步纠错,最大程度地防止错误层层传导。有别于此前的大模型知识增强方案主要使用非结构化数据源,知识链框架同时支持结构化数据源,并引入了经过指令微调的自适应查询生成器,从而更精准地生成查询语句,从知识源提取到有效信息。Sxa28资讯网——每日最新资讯28at.com

在通用知识、医学、物理、生物等多个领域的实验结果显示,相比起思维链(Chain-of-Thought, CoT)方法,知识链框架可将大模型的回答准确率平均提高 4.3%。对比 ReAct、Verify-and-Edit 等 RAG 方法,知识链也表现出稳定的优势。据论文介绍,知识链有望连接各类大模型和不同格式的知识源,帮助解决隐私保护、知识源可靠性和快速信息更新等关键问题。Sxa28资讯网——每日最新资讯28at.com

据介绍,ICLR 由图灵奖得主、深度学习领军人物 Yoshua Bengio 和 Yann LeCun 牵头举办,是国际 AI 顶级学术会议之一。达摩院共有三篇大模型研究论文入选,另外两篇涉及大模型推理长度外推、多语言安全等课题。Sxa28资讯网——每日最新资讯28at.com

论文链接:https://openreview.net/forum?id=cPgh4gWZlzSxa28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-26-87525-0.html阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: PITAKA x 偶遇 - 韦斯・安德森 | 全新色彩编织手机壳

下一篇: 电影《坂本龙一:杰作》定档 5 月 31 日全国上映,记录其生前最后一场钢琴演奏音乐会

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 把LangChain跑起来的三个方法

    把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 学习JavaScript的10个理由...

    学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 虚拟键盘 API 的妙用

    虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 大厂卷向扁平化

    大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 认真聊聊东方甄选:如何告别低垂的果实

    认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 2299元起!iQOO Pad开启预售:性能最强天玑平板

    2299元起!iQOO Pad开启预售:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其搭载了天玑
  • iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    【Techweb评测】去年10月,iQOO推出了一款Neo7手机,该机搭载了联发科天玑9000+,配备独显芯片Pro+,带来了同价位段最佳的游戏体验,一经上市便受到了诸多用
  • 亲历马斯克血洗Twitter,硅谷的苦日子在后头

    亲历马斯克血洗Twitter,硅谷的苦日子在后头

    文/刘哲铭  编辑/李薇  马斯克再次挥下裁员大刀。  美国时间11月14日,Twitter约4400名外包员工遭解雇,此次被解雇的员工的主要工作为内容审核等。此前,T
Top
Baidu
map