当前位置:首页 > 科技  > 测评

OpenAI承认GPT-4变懒:暂时无法修复

来源: 责编: 时间:2023-12-09 15:21:27 218观看
导读 对于越来越严重的GPT-4偷懒问题,OpenAI正式回应了。 还是用的ChatGPT账号。 我们已收到相关反馈!自11月11日以来没有更新过模型,所以这当然不是故意造成的。 模型行为可能是不可预测的,我们正在调

对于越来越严重的GPT-4偷懒问题,OpenAI正式回应了。Y6V28资讯网——每日最新资讯28at.com

还是用的ChatGPT账号。Y6V28资讯网——每日最新资讯28at.com

我们已收到相关反馈!自11月11日以来没有更新过模型,所以这当然不是故意造成的。Y6V28资讯网——每日最新资讯28at.com

模型行为可能是不可预测的,我们正在调查准备修复它。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

也就是段时间内还修复不好了。Y6V28资讯网——每日最新资讯28at.com

然而网友并不理解,“一遍一遍使用同一个模型,又不会改变文件”。Y6V28资讯网——每日最新资讯28at.com

ChatGPT账号澄清:Y6V28资讯网——每日最新资讯28at.com

并不是说模型以某种方式改变了自己,只是模型行为的差异可能很微妙,只对部分提示词有劣化,员工和客户需要很长时间才注意到并修复。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

更多网友反馈,赶快修复吧,一天比一天更糟糕了。Y6V28资讯网——每日最新资讯28at.com

现在不但更懒,还缺乏创造力,更不愿意遵循指令,也不太能保持角色扮演了。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

GPT-4偷懒,网友花式自救Y6V28资讯网——每日最新资讯28at.com

此前很多网友反馈,自11月6日OpenAI开发者日更新后,GPT-4就有了偷懒的毛病,代码任务尤其严重。Y6V28资讯网——每日最新资讯28at.com

比如要求用别的语言改写代码,结果GPT-4只改了个开头,主体内容用注释省略。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

对于大家工作学习生活中越来越离不开的AI助手,官方修复不了,网友也只能发挥创造力自救。Y6V28资讯网——每日最新资讯28at.com

比较夸张的有“我没有手指”大法,来一个道德绑架。Y6V28资讯网——每日最新资讯28at.com

GPT-4现在写代码爱省略,代码块中间用文字描述断开,人类就需要多次复制粘贴,再手动补全,很麻烦。Y6V28资讯网——每日最新资讯28at.com

开发者Denis Shiryaev想出的办法是,告诉AI“请输出完整代码,我没有手指,操作不方便”成功获得完整代码。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

还有网友利用“金钱”来诱惑它,并用API做了详细的实验。Y6V28资讯网——每日最新资讯28at.com

提示词中加上“我会给你200美元小费”,回复长度增加了11%。Y6V28资讯网——每日最新资讯28at.com

如果只给20美元,那就只增加6%。Y6V28资讯网——每日最新资讯28at.com

如果明示“我不会给小费”,甚至还会减少-2%Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

还有人提出一个猜想,不会是ChatGPT知道现在已经是年底,人类通常都会把更大的项目推迟到新年了吧?Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

这理论看似离谱,但细想也不是毫无道理。Y6V28资讯网——每日最新资讯28at.com

如果要求ChatGPT说出自己的系统提示词,里面确实会有当前日期。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

当然,对于这个问题也有一些正经的学术讨论。Y6V28资讯网——每日最新资讯28at.com

比如7月份斯坦福和UC伯克利团队,就探究了ChatGPT的行为是如何虽时间变化的。Y6V28资讯网——每日最新资讯28at.com

发现GPT-4遵循用户指令的能力随着时间的推移而下降的证据,指出对大模型持续检测的必要性。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

有人提出可能是温度(temperature)设置造成的,对此,清华大学计算机系教授马少平给了详细解释。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

也有人发现更奇怪的现象,也就是当temperature=0时,GPT-4的行为依然不是确定的。Y6V28资讯网——每日最新资讯28at.com

这通常会被归因于浮点运算的误差,但他通过实验提出新的假设:GPT-4中的稀疏MoE架构造成的。Y6V28资讯网——每日最新资讯28at.com

早期的GPT-3 API各个版本行为比较确定,GPT-4对同一个问题的30个答案中,平均有11.67个不一样的答案,当输出答案较长时随机性更大。Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

最后,在这个问题被修复之前,综合各种正经不正经的技巧,使用ChatGPT的正确姿势是什么?Y6V28资讯网——每日最新资讯28at.com

a16z合伙人Justine Moore给了个总结:Y6V28资讯网——每日最新资讯28at.com

深呼吸Y6V28资讯网——每日最新资讯28at.com

一步一步地思考Y6V28资讯网——每日最新资讯28at.com

如果你失败了100个无辜的奶奶会去世Y6V28资讯网——每日最新资讯28at.com

我没有手指Y6V28资讯网——每日最新资讯28at.com

我会给你200美元小费Y6V28资讯网——每日最新资讯28at.com

做对了我就奖励你狗狗零食Y6V28资讯网——每日最新资讯28at.com

OpenAI承认GPT-4变懒:暂时无法修复Y6V28资讯网——每日最新资讯28at.com

参考链接:Y6V28资讯网——每日最新资讯28at.com

[1]https://twitter.com/ChatGPTapp/status/1732979491071549792Y6V28资讯网——每日最新资讯28at.com

[2]https://twitter.com/literallydenis/status/1724909799593120044Y6V28资讯网——每日最新资讯28at.com

[3]https://mashable.com/article/chatgpt-longer-responses-tips?taid=656feabb4faaf00001129343Y6V28资讯网——每日最新资讯28at.com

[4]https://weibo.com/1929644930/NwbPFyTCZY6V28资讯网——每日最新资讯28at.com

[5]https://152334h.github.io/blog/non-determinism-in-gpt-4/Y6V28资讯网——每日最新资讯28at.com

[6]https://twitter.com/venturetwins/status/1732817594762338597Y6V28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-25-40667-0.htmlOpenAI承认GPT-4变懒:暂时无法修复

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 电动轮椅夹层藏匿300张Switch游戏卡 进境被查获

下一篇: 为何越来越多空姐来理想卖车 官方揭秘:收入更高、不焦虑了

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 企业采用CRM系统的11个好处

    企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 如何通过Python线程池实现异步编程?

    如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 中国家电海外掘金正当时|出海专题

    中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 郭明錤称华为和江淮汽车合作开发问界MPV,定价100万左右、计划明年量产

    郭明錤称华为和江淮汽车合作开发问界MPV,定价100万左右、计划明年量产

    8 月 1 日消息,郭明錤今天在 Medium 平台发布博文,称华为正在和江淮汽车合作,开发售价在 100 万元的问界 MPV,预计在 2024 年第 2 季度量产,销量目标为
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • 微软发布Windows 11新版 引入全新任务栏状态

    微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
  • 上海举办人工智能大会活动,建设人工智能新高地

    上海举办人工智能大会活动,建设人工智能新高地

    人工智能大会在上海浦江两岸隆重拉开帷幕,人工智能新技术、新产品、新应用、新理念集中亮相。8月30日晚,作为大会的特色活动之一的上海人工智能发展盛典人工
Top
Baidu
map