当前位置:首页 > 元宇宙 > AI

OpenAI 再成“榜一大哥”:o1-preview AI 模型更轻松驾驭数学、编程等任务

来源: 责编: 时间:2024-09-23 08:52:35 13观看
导读 9 月 20 日消息,科技媒体 The Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一

9 月 20 日消息,科技媒体 The Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。bmS28资讯网——每日最新资讯28at.com

聊天机器人竞技场简介

聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。bmS28资讯网——每日最新资讯28at.com

结果

结果显示,o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。bmS28资讯网——每日最新资讯28at.com

bmS28资讯网——每日最新资讯28at.com

Lmsys 提供的数学模型优势图表清楚地显示,o1-preview 和 o1-mini 的得分超过 1360 分,远高于其他模型的表现。附上相关截图如下:bmS28资讯网——每日最新资讯28at.com

bmS28资讯网——每日最新资讯28at.com

bmS28资讯网——每日最新资讯28at.com

bmS28资讯网——每日最新资讯28at.com

O1 的目标是为人工智能推理设定一个通用新标准,即在回答前“思考”" 更长时间。bmS28资讯网——每日最新资讯28at.com

然而,O1 模型并非在所有方面都优于 GPT-4o。许多任务并不需要复杂的逻辑推理,有时 GPT-4o 的反应更快。bmS28资讯网——每日最新资讯28at.com

注意事项

o1-preview 和 o1-mini 的票数远低于 GPT-4o 或 Anthropic's Claude 3.5 等成熟模型,每个模型都只有不到 3000 条评论,这样小的样本量可能无法准确代表实际结果,限制结果的意义。bmS28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-7504-0.htmlOpenAI 再成“榜一大哥”:o1-preview AI 模型更轻松驾驭数学、编程等任务

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 研究称生成式 AI 耗水量巨大:使用 GPT-4 生成 100 字文本需消耗 3 瓶水

下一篇: 谷歌前高管创办的 Brightband 公司获 1000 万美元融资,可用 AI 预测极端天气

标签:
  • 热门焦点
Top
Baidu
map