当前位置：首页 > doinb雷竞技 > dota2吧雷电竞

一道小学奥数题4个AI平台答案不一专家回应

来源：责编：时间：2024-03-18 09:34:54 120观看

导读　　原标题：一道小学奥数题4个AI平台答案不一，专家回应　　“给娃儿辅导奥数题，问了多个AI平台，每个答案都不一样。”　　近日，重庆家长刘先生向上游新闻记者反映：同一道奥数题，百度、阿里云、今日头条等国内4个主流AI大模

　　原标题：一道小学奥数题4个AI平台答案不一，专家回应

　　“给娃儿辅导奥数题，问了多个AI平台，每个答案都不一样。”

　　近日，重庆家长刘先生向上游新闻记者反映：同一道奥数题，百度、阿里云、今日头条等国内4个主流AI大模型平台，竟然给出了不同的答案。

　　3月11日，上游新闻记者从百度客服及人工智能专家处了解到，人工智能大模型平台并不是题库，数据模型一直在学习完善中，尤其是在数学和逻辑方面。

　　同一道奥数题，刘先生得到结果为30分钟、7分钟两种不同答案。/受访者供图

　　刘先生告诉上游新闻记者，自己的孩子上小学四年级，最近他在辅导孩子做奥数题，但自己并非理工科出身，感觉有些困难。因为他从事影视制作方面的工作，经常使用人工智能工具辅助，就想到使用类似平台来帮忙。

　　刘先生将一道题输入经常使用的百度的文心一言、阿里云的通义千问、今日头条的豆包等4个主流人工智能大模型平台进行测试。具体题目为：一天，萱萱到离自己家4000米的表哥家去玩。早晨7:20，萱萱从家出发向表哥家走去，每分钟行60米，同时表哥骑车从家出发来接她。表哥到萱萱家后才发现萱萱已经走了，又立即返回去追，表哥骑车每分钟行260米。当表哥追上萱萱后，带着她一起回表哥家，这时骑车速度为每分钟175米。请问：当他们到达表哥家时，还差几分钟就到8点?

　　“当时两个(AI平台)列出了推理过程，均给出了‘7分钟’的答案，应该是对的。我觉得算得有点复杂，就又让AI用适合小学五年级的算法再算一次，结果答案自此之后就不一致了。”在刘先生提供的截图中，上游新闻记者看到，有的平台会给出“30分钟”的答案。

　　上游新闻记者测试时，要求AI重新计算，有的AI甚至给出了“还差-23分钟就到8点”的离谱答案。刘先生感觉很困惑：“是不是AI自己不敢保证是正确的，多问几遍它自己就把自己绕晕了，越回答越错?”

　　记者得到了一个“-23分钟”的答案。/截图

　　11日，上游新闻记者致电文心一言会员服务热线询问此事，工作人员表示，“目前的系统回复不是每次都一模一样的，它主要针对您的提问和您输入问题的一个复杂性程度进行回复。如果是它输出的结果是不满意或者是有误的，您可以及时点踩反馈，帮助文心一言进步。”

　　工作人员表示，反馈提交之后，后台工作人员也会去不断优化模型的一个能力，“因为AI生成的结果，是根据您输入的一个需求和提示词提供的，它是自动识别和理解您的一个意图和需求，并提供相关的文本图片，目前模型能力确实也在不断地发展，需要时间。”

　　无独有偶。在上海从事AI类自媒体的白先生(化名)，也用孩子的数学题测试了国外的GPT4、Claude和GoogleBard等AI平台以及国内多个主流AI平台，也发现了类似问题，甚至有的AI对题意都出现了理解错误。

　　一位国内人工智能方面的专家告诉上游新闻记者，目前主流的AI大模型平台并不是数学题库，“大数据模型一直在学习完善中，尤其是在数学和逻辑方面，所以很多产品对话框旁边都有点赞点踩的图标。通过这种方式反馈问题，模型才会学习完善。如果家长想要更精准的答案，更推荐给孩子使用学习机一类的AI产品。”

　　该专家表示，“即便是目前国际上一些数学、化学、物理等方面的专业性做题AI，也很难拿到奥赛满分。”

　　据参考消息，今年1月，美国一个名为阿尔法几何(AlphaGeometry)的AI系统，能做出国际数学奥林匹克(IMO)的30道几何题中的25道，已经接近人类奥数金牌得主水平，该突破性成果甚至登上了著名的《自然》(Nature)杂志。

　　据报道，美国亚利桑那州立大学副教授沙卡里安，在2023年1月初用1000个数学问题对ChatGPT进行了测试，结果发现准确率只有60%，低于一般中学生的准确率。

　　牛津大学机器学习研究员西蒙·弗莱德尔，曾在一项研究中让ChatGPT做了一系列数学任务，包括简单的计算、数学证明题、搜索数学文献和奥数题，结果也发现，ChatGPT在大多数任务上表现为“不及格”，在需要多层逻辑推导的题目上表现尤为糟糕。而最具迷惑性的是，哪怕ChatGPT做错数学题，也会非常“迷之自信”地给出看起来权威的错误答案。

　　专家表示，AI的语言模型目标在于处理和理解人类的语言，更擅长生成类似人类的对话，而不是为了成为完美的数学计算器，“AI作为一种工具，只适用于那些最懂数学的人，而不是最不了解数学的人。在借鉴AI给出的答案之前，一定要加以验证，不要过于依赖它。”

编辑：齐少恒

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-102-7872-0.html一道小学奥数题4个AI平台答案不一专家回应

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：女子婚恋网站遭遇电诈反赚骗子20万

下一篇： “点读机女孩”治疗视频是库存?母亲道歉

标签：

热门焦点

百度回答：微信分付如何把钱扫出来秒到账-（具体操作步骤一一列举）

微信分付怎么套出来(推荐十个操作步骤轻松提现出来)微信分付是一款腾信旗下信用消费产品，类似于分期乐的购物额度，主要是消费使用的一个产品。大家在场景消费使用的时候可以
揭穿：白条加油包怎么套出来（4个图文教程方法一看就会）

京东白条的额度能刷出来吗，常用7种操作方法手把手教给你，大家都知道，白条属于京东旗下的一款消费产品，初衷并不是要大家套出来当现金使用的。只是很多朋友可能在月底或者有时候
2024普及花呗怎么自己套出来到余额 -（2024最新方法技巧解读）

　　　　花呗提现商家V：dd118388 全天在线秒，或者扫下方二维码直接添加客服操作　　　　　虽说套花呗已是很普遍，但很多人还是不知道如何才能把支付宝花呗套取现金后不风控
绝招-分付去哪里套出来啊（两种方法今天我来告诉你）

微信分付怎么套出来(推荐十个操作步骤轻松提现出来)微信分付是一款腾信旗下信用消费产品，类似于分期乐的购物额度，主要是消费使用的一个产品。大家在场景消费使用的时候可以
妙笔生花、描摹三秦” 关于陕西省第二届“延长石油杯”三人篮球联赛创作征集公告

　　陕西省第二届“延长石油杯 ”三人篮球联赛“LOGO、吉祥物、主题曲、文创产品 ”创作征集公告。　　为了深入贯彻落实全民健身国家战略，构建更高水平的全民健身公共服务
吸汗除异味用汗发电，全新纳米吸水材料问世（吸汗除异味用汗发电）

图片来源@视觉中国文 | 学术头条出汗，似乎是人类最平凡普通的生理特征。一方面，人的身体内分布着 300 万左右的汗腺，负责汗液的产生与排出，同时具有调节体温、排
马克龙对俄罗斯太不友好了他建议将俄罗斯踢出联合国安理会（马克龙对俄罗斯太不友好了）

俄乌战争迎来一周年之际，西方开始着手构建俄罗斯战败后的世界安全构架和秩序，正在德国举行的慕尼黑安全会议出现了这一引人注目的新动向，而西方密谋构架新的世界安全秩序