当前位置:首页 > 元宇宙 > AI

OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题

来源: 责编: 时间:2024-09-14 16:06:21 19观看
导读 9 月 13 日消息,OpenAI 传闻中的“草莓”(Strawberry)AI 模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。o1和o1-miniOpenAI 表示对该模型进行特殊训练,能够比人类更快地回答更复杂的问题。与

9 月 13 日消息,OpenAI 传闻中的“草莓”(Strawberry)AI 模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。snA28资讯网——每日最新资讯28at.com

o1和o1-mini

OpenAI 表示对该模型进行特殊训练,能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini,一个更小、成本更低的版本。snA28资讯网——每日最新资讯28at.com

snA28资讯网——每日最新资讯28at.com

OpenAI 表示 o1 模型的发布,是其迈向类人 AI 宏伟目标的关键一步。snA28资讯网——每日最新资讯28at.com

注:o1 模型目前处于“预览”阶段,官方强调该模型相关开发尚处于初期阶段,相比较 GPT-4o 模型,使用成本更高且速度更慢,但在编写代码和解决多步骤问题方面表现更为优秀。snA28资讯网——每日最新资讯28at.com

价格

OpenAI 公司表示从今天起,ChatGPT Plus 和 Team 用户将可访问 o1-preview 和 o1-mini,而 Enterprise 和 Edu 用户则将在下周初获得访问权限。snA28资讯网——每日最新资讯28at.com

snA28资讯网——每日最新资讯28at.com

OpenAI 表示计划将 o1-mini 的访问权限扩展至所有 ChatGPT 免费用户,但尚未确定发布日期。snA28资讯网——每日最新资讯28at.com

开发者获取 o1 的访问权限成本相当高昂:如果调用 API,o1-preview 的输入词元(tokens)费用为每百万个成本 15 美元(备注:当前约 107 元人民币),输出词元费用为每百万个 60 美元(当前约 427 元人民币)。snA28资讯网——每日最新资讯28at.com

snA28资讯网——每日最新资讯28at.com

相比之下,GPT-4o 的输入词元费用为每百万个 5 美元(当前约 35.6 元人民币),输出词元费用为每百万个 15 美元(当前约 107 元人民币)。因此o1模型输入词元费用提高了 2 倍,输出词元费用提高了 3倍。snA28资讯网——每日最新资讯28at.com

训练方式

OpenAI 的研究负责人 Jerry Tworek 表示,o1 采用了有别于当前模型的训练方法,但他并未透露具体细节。snA28资讯网——每日最新资讯28at.com

他只是提到,o1“采用了全新的优化算法和专门为其定制的训练数据集进行训练。”snA28资讯网——每日最新资讯28at.com

报道称 OpenAI 在训练 o1 模型中使用一种称为强化学习(reinforcement learning)的技术,来自行解决问题,该技术通过奖励和惩罚来教导系统。随后,o1 采用“思维链”来处理查询,类似于人类通过逐步推理来解决问题的方式。snA28资讯网——每日最新资讯28at.com

由于采用了这种新的训练方法,OpenAI 表示模型应该会更加准确。snA28资讯网——每日最新资讯28at.com

Tworek 表示:“我们不能说已经解决了幻觉问题,但至少从观测的结果来看,这个模型产生的幻觉明显减少”。snA28资讯网——每日最新资讯28at.com

o1 模型优势

o1 模型与 GPT-4o 的主要区别在于,它能够比前代更好地处理复杂的编程和数学问题,并能解释其推理过程,这是 OpenAI 所强调的。snA28资讯网——每日最新资讯28at.com

OpenAI 的首席研究官 Bob McGrew 表示:snA28资讯网——每日最新资讯28at.com

这款模型在解答 AP 数学考试题目上的表现无疑比我更出色,而我大学时还辅修了数学。snA28资讯网——每日最新资讯28at.com

他提到,OpenAI 还让 o1 参加了国际数学奥林匹克竞赛的资格考试,GPT-4o 仅正确解决了 13% 的问题,o1 模型能够解决 83% 的问题。snA28资讯网——每日最新资讯28at.com

在名为 Codeforces 竞赛的在线编程比赛中,这一新型模型达到了参赛者中的第 89 位,OpenAI 声称该模型的下一次更新将在物理、化学和生物学中的挑战性基准任务上表现“与博士生相当”。snA28资讯网——每日最新资讯28at.com

snA28资讯网——每日最新资讯28at.com

同时,o1 在许多领域的能力不及 GPT-4o。它在世界事实知识方面的表现也不如后者。此外,它不具备浏览网页、处理文件和图像的能力。尽管如此,该公司认为它代表了一类全新的功能。将其命名为 o1,意在表明“将计数器重置回 1”。snA28资讯网——每日最新资讯28at.com

snA28资讯网——每日最新资讯28at.com

snA28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-7166-0.htmlOpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉

下一篇: 全球人形机器人约 38% 供应链企业在中国,北京、上海、广东等地已成立具身智能机器人创新中心

标签:
  • 热门焦点
  • 人间诚实周鸿祎:360 All in 大模型的六个解读

    人间诚实周鸿祎:360 All in 大模型的六个解读

    主笔 / 村口有牛文章架构师 / 毛自聪出品 / 巨头财经5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。谁也没想到,今日,360再度刷屏,老牌互联网巨头展现
  • 元宇宙步入暗夜

    元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 关于年度热词NFT,除了钱,我们还可以聊点啥?

    关于年度热词NFT,除了钱,我们还可以聊点啥?

    每到年底,社交媒体总少不了年度盘点、年度总结、年度热词。如果让你来总结2021年度热词,你会想到什么?柯林斯词典将年度热词颁给了“NFT”,而其理由是:一个缩写词的
  • 【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    虚拟数字人行业未来的主要驱动力包括:用户代际变化,新一代消费者对内容消费和虚拟世界更为渴求;虚拟数字人相关技术门槛相对降低,成本有所回落;资本热度上升,受Metav
  • 字节、腾讯、网易鏖战元宇宙背后,大厂究竟在争夺什么?

    字节、腾讯、网易鏖战元宇宙背后,大厂究竟在争夺什么?

    正当互联网商业踌躇不前,互联网大厂为了在存量中的增长挤破头皮之时,元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙,然后字节跳动收购了一家VR硬
  • 知识产权可能在元宇宙中“消失”?

    知识产权可能在元宇宙中“消失”?

    开篇老雅痞先来划重点:一些公司开始采取积极的方式来保护他们在元宇宙的知识产权。耐克、爱马仕和米拉麦克斯最近提起诉讼,声称NFT侵犯了他们的知识产权。Inside
  • GameFi 深度解析,元宇宙内容雏形显现

    GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+Defi(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
  • NFT高玩必备:NFT分析工具大盘点

    NFT高玩必备:NFT分析工具大盘点

    NFT市场的火热让越来越多的投资者投身其中,但当前的 NFT 生态系统存在几个问题却困扰了大多数人,如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、
  • PayPal CEO 的加密语录:加密货币将重新定义金融世界

    PayPal CEO 的加密语录:加密货币将重新定义金融世界

    PayPal 近年来一直是加密行业的倡导者。这个本身拥有超过 3.5 亿名活跃用户的支付巨头,已经允许美国和英国的用户交易或持有比特币(BTC)、以太坊(ETH)、比特现金(BCH
Top
Baidu
map