当前位置:首页 > 元宇宙 > AI

面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗

来源: 责编: 时间:2024-07-09 06:57:29 66观看
导读 7 月 5 日消息,今天的 2024 世界人工智能大会(WAIC 2024)期间,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S 模型,同时发布助力开发者一键打造大模型 SuperApp 的

7 月 5 日消息,今天的 2024 世界人工智能大会(WAIC 2024)期间,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S 模型,同时发布助力开发者一键打造大模型 SuperApp 的全栈工具集 MobileCPM。XNz28资讯网——每日最新资讯28at.com

据介绍,面壁 2024 年发布了具备 GPT-3 同等性能但参数仅为 24 亿的 MiniCPM-2.4B,知识密度提高了约 86 倍。面壁方面更称,这“并不是极限”—— 其持续优化 Scaling Law 使模型知识密度不断提升,可不断训练出计算更加高效、表现更强(参数规模降低,数值位宽降低,结构更加高效)的基础大模型。XNz28资讯网——每日最新资讯28at.com

XNz28资讯网——每日最新资讯28at.com

而此次开源的 MiniCPM-S 采用“稀疏激活”在同等参数下减少大模型的推理能耗,稀疏度越高,每个词元(token)激活的神经元越少,大模型的推理成本和能耗就越少。XNz28资讯网——每日最新资讯28at.com

MiniCPM-S 1.2B 采用了高度稀疏架构,通过将激活函数替换为 ReLU 及通过带渐进约束的稀疏感知训练,巧妙地解决了此前主流大模型在稀疏激活上面临的困境。XNz28资讯网——每日最新资讯28at.com

XNz28资讯网——每日最新资讯28at.com

官方还表示,和同规模的稠密模型 MiniCPM 1.2B 相比,MiniCPM-S 1.2 具备如下特征:XNz28资讯网——每日最新资讯28at.com

Sparse-高稀疏低能耗:在 FFN 层实现了高达 87.89% 平均稀疏度,推理算力下降 84%;XNz28资讯网——每日最新资讯28at.com

Speed-神仙推理:更少计算,迅疾响应。纯CPU环境下,结合 Powerinfer 推理框架,推理解码速度提升约 2.8 倍;XNz28资讯网——每日最新资讯28at.com

Strong-无损强大性能:更少计算量,无损下游任务性能。XNz28资讯网——每日最新资讯28at.com

XNz28资讯网——每日最新资讯28at.com

MiniCPM-S 1.2B 号称实现知识密度的“空前提升”—— 达到同规模稠密模型 MiniCPM 1.2B 的 2.57 倍,Mistral-7B 的 12.1 倍。XNz28资讯网——每日最新资讯28at.com

附开源链接:XNz28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/pdf/2402.13516.pdfXNz28资讯网——每日最新资讯28at.com

模型地址:https://huggingface.co/openbmb/MiniCPM-S-1B-llama-formatXNz28资讯网——每日最新资讯28at.com

PowerInfer可直接运行格式:https://huggingface.co/openbmb/MiniCPM-S-1B-sft-ggufXNz28资讯网——每日最新资讯28at.com

此外,面壁还开源了号称业内首个端侧大模型工具集 MobileCPM,开发者可以一键集成大模型到 App,且实现“开箱即用”。其包含开源端侧大模型、SDK 开发套件及翻译、摘要等丰富的 intent,可一站式灵活定制满足不同应用场景需求的大模型 App。其为开发者提供了基础模式、精装模式、全包配件模式,默认集成面壁新一代高效稀疏架构模型 MiniCPM-S 1.2B。XNz28资讯网——每日最新资讯28at.com

XNz28资讯网——每日最新资讯28at.com

XNz28资讯网——每日最新资讯28at.com

XNz28资讯网——每日最新资讯28at.com

MobileCPM 已经支持 iOS 系统,安卓版本也即将上线。附:开源地址、TestFlight 外测地址。XNz28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-5022-0.html面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 智谱发布并开源代码生成大模型 CodeGeeX 第四代,号称百亿以下规模性能最强

下一篇: 百度李彦宏:开源模型是智商税,闭源模型更强大、推理成本更低

标签:
  • 热门焦点
  • 欧盟人工智能法案:四种AI系统风险类型的划分及监管措施

    欧盟人工智能法案:四种AI系统风险类型的划分及监管措施

    作者:赵志东 蔡佳雯来源:区块链日报该法案采用风险分级的规制路径,将人工智能系统的风险划分成不可接受的风险、高风险、有限风险和轻微风险四种类型,并针对不同类型施加了不同
  • 雷克萨斯高管,“受贿”5000万?

    雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • 内容行业大变天,爆款全靠AI?

    内容行业大变天,爆款全靠AI?

    出品 | 微果酱(wjam123456)作者 | 陈出木题图 | 文心一格 AI的发展之快出乎所有人的预料,似乎一夜之间便呼啸而来。无论是资本的风向标,抑或是生活工作的辅助、流量口,还是茶余饭
  • 《蜘蛛侠》火了,超级英雄就该这么演

    《蜘蛛侠》火了,超级英雄就该这么演

    燃次元(ID:chaintruth)原创作者 | 陶 淘编辑 | 曹 拿下豆瓣8.8分、IMDB 9.1的高分,6月2日在全球同步上映的《蜘蛛侠:纵横宇宙》(以下简称《蜘蛛侠》),上映不足一周,便在国内“
  • 在元宇宙卖酸奶,这波联动燃爆了!

    在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • NFT自动售货机来啦!

    NFT自动售货机来啦!

    “纽约市有一台售卖 Solana NFT 的自动售货机,用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT,无需使用加密货币。由于基于 Solana 链的 N
  • 以用户为中心,Web3和区块链如何将用户放在首位

    以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • 全球十大元宇宙概念游戏

    全球十大元宇宙概念游戏

    A股市场中,不少游戏公司早早搭上了元宇宙概念。举例,中青宝宣称将发布一款元宇宙概念的模拟经营类游戏,尽管游戏尚在研发中,这一消息已经让中青宝的股价在51个交易
Top
Baidu
map