当前位置:首页 > 科技  > 网络

中国大模型价格战背后的真相

来源: 责编: 时间:2024-05-23 17:09:07 94观看
导读 5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的消息:通义千问 GPT-4 级主力模型推理输入价格降至 0.5 元/百万 tokens,直降 97%。阿里云降价公告 | 来源:阿里云这个大幅度降价的消息瞬间引发了与业

5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的消息:通义千问 GPT-4 级主力模型推理输入价格降至 0.5 元/百万 tokens,直降 97%。Eww28资讯网——每日最新资讯28at.com

中国大模型价格战背后的真相阿里云降价公告 | 来源:阿里云Eww28资讯网——每日最新资讯28at.com

这个大幅度降价的消息瞬间引发了与业界的普遍关注和讨论,但短短数小时连锁反应出现了,百度智能云官宣文心大模型主力模型 ERNIE Speed(上下文长度 8K、128K)、ERNIE Lite(上下文长度 8K、128K)免费。Eww28资讯网——每日最新资讯28at.com

虽然这两个模型和阿里宣布降价的模型并不完全对应,但是这个动作让很多人开始高呼中国大模型企业的 API 商业模式,难道就这样在 3 小时内就消失了吗?Eww28资讯网——每日最新资讯28at.com

中国大模型价格战背后的真相文心大模型两大主力模型全面免费Eww28资讯网——每日最新资讯28at.com

实际上在更早之前,字节跳动宣布,豆包通用模型推理输入价格为 0.8 元/百万 tokens。Eww28资讯网——每日最新资讯28at.com

虽然这些价格背后在并发量,模型能力上有很多不同的细节区别,甚至根据创业者的实际计算,真正落到业务里用起来,各家的成本下降都没有宣传上那么夸张。Eww28资讯网——每日最新资讯28at.com

但至少纸面上看,每百万 token 推理输入量,字节、阿里、百度先后在一周内官宣了 0.8 元,0.5 元和免费的报价。有业界人士甚至开玩笑说,眼瞅着下一家跟进的厂商可能就得发钱补贴让客户用 API 了,在这么短的时间内产生这样剧烈的变化,到底是因为什么?这是一次市场宣传上的内卷?还是大模型 API 调用的商业模式,就真的这么消解了吗?Eww28资讯网——每日最新资讯28at.com

01 价格战背后,大模型 API 调用的商业模式Eww28资讯网——每日最新资讯28at.com

其实早 ChatGPT 发布时,大家对大模型直接作为服务被调用的商业模式有很大期待。毕竟,与上一波 AI 烟囱式的项目交付方式相比,大模型带来了更通用的 AI 能力,作为标准化服务被调用,道理上也说得通。Eww28资讯网——每日最新资讯28at.com

就拿 OpenAI 来说,有两大商业化手段,一是像 ChatGPT Plus 20 美元/月这样的会员订阅模式,另一个是开发者 API 调用服务。在这两大标准化服务的拉动下,2023 年 12 月 31 日,The information 爆出 OpenAI 的年度经常性收入(Annual Recurring Revenue,ARR)已经达到了 16 亿美元。Eww28资讯网——每日最新资讯28at.com

但即便强如 OpenAI 的模型能力,这个体量的营收相比其百亿美金级别的研发成本而言,目前看也还是杯水车薪。Eww28资讯网——每日最新资讯28at.com

事实上,只提供模型的 API,距离 AI 应用在场景中落地还有很大距离,大部分 AI 应用还需要在一个通用的模型 API 之上,在场景里喂数据、做微调等来优化模型引擎。看到这一瓶颈后,国内大模型厂商在过去一年也做了一系列探索来降低 AI 应用的门槛,以期扩大大模型的调用量。Eww28资讯网——每日最新资讯28at.com

以百度智能云为例,去年相继推出模型开发工具 Model Builder 和 AI 应用开发工具 AppBuilder、更具效价比的不同模型等,但模型的调用增长似乎依然有限。今年 4 月,百度智能云推出生态打法,和有渠道、场景的供应商一起合作服务客户,旨在进一步拉升文心大模型标准化的 API 调用量。这些迹象上看,大厂们显然并没有真的准备放弃 API 调用的商业模式,但这个商业模式还没有真正收到成规模的钱,倒是真的问题。Eww28资讯网——每日最新资讯28at.com

上周,百度新公布的数据显示,文心大模型日处理文本 2500 亿 token,另一大厂字节跳动日均处理 1200 亿 token 文本,但其中很大一部分是大厂内部业务在调用做 AI 应用和业务探索。Eww28资讯网——每日最新资讯28at.com

可以看出,尽管模型厂商做了很多尝试,但标准化的模型 API 并没有迎来确定性的增长。Eww28资讯网——每日最新资讯28at.com

这是本周大厂模型推理价格降低的大前提和背景。理解了模型 API 调用的需求现状,也就不难理解这一波降价动作——降价并没有真的损失多少收入,不如激活下市场,赚个吆喝,促进很多企业从「免费试用」开始下水,早点启动对 AI 进入业务流的尝试。Eww28资讯网——每日最新资讯28at.com

其实,这一波降价的连锁反应,真正的源头并不是阿里云,也不是字节跳动,比大厂降价更早的,是一家创业公司。Eww28资讯网——每日最新资讯28at.com

5 月 6 日,国内创业公司幻方旗下的大模型公司「深度求索」开源了第二代 MoE 模型:DeepSeek-V2,主打参数更多、能力更强、成本更低。Eww28资讯网——每日最新资讯28at.com

由于 DeepSeek 的技术优势在全球大模型圈子得到了普遍好评,而其在模型能力逼近第一梯队闭源模型的前提下,还把推理成本降到了 1 块钱/百万 token,也就是说,成本是 Llama3 70B 的七分之一,GPT-4 Turbo 的七十分之一。而且,DeepSeek v2 还能做到有利润,这显然是是模型架构、系统、工程的一系列进步带来的成本降低。Eww28资讯网——每日最新资讯28at.com

这一信息在实际做模型应用的产业界引起了广泛讨论,在海外也引起了不小的波动,半导体和人工智能独立研究机构 SemiAnaysis 称其性能直逼大模型 GPT-4 所代表的第一梯队,同时推理价格相当低,是不可小觑的中国力量。Eww28资讯网——每日最新资讯28at.com

DeepSeek v2 宣布其价格为 1 元/百万 token 后,随即引来了大模型价格战,智谱、面壁、字节、阿里、百度,以及今天跟进的科大讯飞、腾讯云相继宣布了模型推理价格降低。Eww28资讯网——每日最新资讯28at.com

对于各家不同的降价策略,已经有一些质疑声音称一些降价的模型本身吞吐量就低,而高性能模型并没有降价。并且还有很多细节条款会让终企业用起来没有宣传的那么便宜,从这个角度看,降价更多是模型厂商出于市场和品牌的考量,进行的一波内卷。Eww28资讯网——每日最新资讯28at.com

归根结底,能形成价格战的连锁反应,也是当前各大模型的能力放在可用的场景中,尚未拉开差距,用户甚至有免费开源的产品可以用。Eww28资讯网——每日最新资讯28at.com

一位 SaaS 厂商创始人向极客公园表示,「对我来说用谁的其实无所谓,因为他们后跑得都差不多,当把时间线拉长来看,后这些厂商提供的模型 API 服务,99.9% 的概率跟今天的云是差不多的概念。另外,如果一个通用的模型 API 无法深度适配场景,还是要自己基于开源模型,用场景数据做专门的深度训练,也不会接通用的模型 API。」Eww28资讯网——每日最新资讯28at.com

终的的客户需求,其实是端到端的诉求,是可以用、可以看到效果的东西,而不是模型调用。Eww28资讯网——每日最新资讯28at.com

02 大模型,巨头和创业公司有不同的游戏Eww28资讯网——每日最新资讯28at.com

当然,模型推理价格降低本身也是技术发展带来的必然结果,有一系列工程、架构、系统手段可以持续优化。今天凌晨微软 Build 开发者大会上,纳德拉还举例解释了这一趋势。他说,过去一年 GPT-4 性能提升了 6 倍,但成本降低到了之前的 1/12,对应性能/成本提升了 70 倍。Eww28资讯网——每日最新资讯28at.com

「难的是探索模型能力上限,至于模型推理价格一定有办法降低」,Minimax 创始人闫俊杰上周坐客极客公园直播节目中表述了这一技术趋势,他表示,模型推理价格降低到可用,在学术界已经发生过三次了,这不难。Eww28资讯网——每日最新资讯28at.com

模型技术的攀升,才是 API 调用商业模式能继续增长的前提。其实细看今天宣布降价的模型产品也是一样,真正大规模、高性能、支持高并发的模型推理还是要收费,降价幅度是有限的。Eww28资讯网——每日最新资讯28at.com

但长期来看,API 模式终考验的还是模型能力,如果技术拉不开差距,价格也一定拉不开差距,终模型调用的价值会被稀释,虽然依旧是重要的基础设施,但价值大小就从油变水了。Eww28资讯网——每日最新资讯28at.com

换一个角度看,今天一个通用的模型 API 可能不是迫切的需求。就像 Lepton.ai 的创始人贾扬清在朋友圈表达的观点,「站在整个 AI 业界的角度我想说,降价是个拍脑袋就可以做的简单策略,但是真正的 To B 商业成功更难。」今天企业在使用 AI 的时候,并不是成本驱动的,「今天不是说 API 贵才没有人用,而是因为要搞清楚,到底怎么用起来产生业务价值」。Eww28资讯网——每日最新资讯28at.com

从这个角度看,如何把大模型能力推动到企业的业务里的很大一部分任务,可能又回落到传统 SaaS 厂商(用 AI 升级产品之后)手里,需要他们作为智能生产力的「干线物流」+「前置仓」,输送到各个场景中。Eww28资讯网——每日最新资讯28at.com

随着模型 API 直供模式的高度内卷,巨头其实已经在向能交付价值的 SaaS 看,微软今天宣称 GitHub Copilot 订阅者已经有 180 万付费用户。谷歌近日也正在与 CRM 营销巨头 Hubspot 谈高达 300 亿美金收购可能性,因为前者可能会利用这次收购来加强其在 AI 领域产品整合。Eww28资讯网——每日最新资讯28at.com

对于巨头而言,模型技术和实际场景,两个都要抓,才能有规模化的收入。但归根结底,模型能力和别人拉开距离,才是 API 模式可以产生价值的「华山一条路」的挑战。Eww28资讯网——每日最新资讯28at.com

而对于大模型创业公司而言,也是个「华山两条路」的局面,即要么做出比大公司更好的模型技术,要么从模型走向产品,直接创造价值。Eww28资讯网——每日最新资讯28at.com

智能的能力不会是免费的,但是怎么规模化的创造价值,巨头和创业公司,都还在寻找答案。Eww28资讯网——每日最新资讯28at.com


文章出处:极客公园

本文链接://www.dmpip.com//www.dmpip.com/showinfo-17-90272-0.html中国大模型价格战背后的真相

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 第四次工业革命来了 英伟达黄仁勋:下一场工业革命已开始!

下一篇: 腾讯公布“碳寻计划”:三年内提供2亿元用于碳捕集、利用和封存

标签:
  • 热门焦点
  • Find N3入网:最高支持16+1TB

    Find N3入网:最高支持16+1TB

    OPPO将于近期登场的Find N3折叠屏目前已经正式入网,型号为PHN110。本次Find N3在外观方面相比前两代有很大的变化,不再是小号的横向折叠屏,而是跟别的厂商一样采用了较为常见的
  • 微信语音大揭秘:为什么禁止转发?

    微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 19个 JavaScript 单行代码技巧,让你看起来像个专业人士

    19个 JavaScript 单行代码技巧,让你看起来像个专业人士

    今天这篇文章跟大家分享18个JS单行代码,你只需花几分钟时间,即可帮助您了解一些您可能不知道的 JS 知识,如果您已经知道了,就当作复习一下,古人云,温故而知新嘛。现在,我们就开始今
  • 2天涨粉255万,又一赛道在抖音爆火

    2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • ESG的面子与里子

    ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 信通院:小米、华为等11家应用商店基本完成APP签名及验签工作

    信通院:小米、华为等11家应用商店基本完成APP签名及验签工作

    中国信通院表示,目前,小米、华为、OPPO、vivo、360手机助手、百度手机助手、应用宝、豌豆荚和努比亚等9家应用商店,以及抖音和快手2家新型应用分发平
  • 三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    据官方此前宣布,三星将于7月26日也就是今天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想此前宣布,将于11月2日19:30召开联想秋季轻薄新品发布会,推出联想 YOGA 16s 2022 笔记本等新品。官方称,YOGA 16s 2022 笔记本将搭载 16 英寸屏幕,并且是一
Top
Baidu
map