当前位置：首页 > 元宇宙 > AI

苹果再出手，300亿参数AI大模型MM1.5来了！

来源：责编：时间：2024-10-13 14:15:15 10观看

导读【ITBEAR】苹果公司近期为其多模态大模型MM推出了1.5版本，新版本在延续前代MM1数据驱动训练原则的基础上，着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布，并附有论文链接。MM1.5版本

【ITBEAR】苹果公司近期为其多模态大模型MM推出了1.5版本，新版本在延续前代MM1数据驱动训练原则的基础上，着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布，并附有论文链接。

MM1.5版本提供了10亿至300亿多种参数规模的选择，具备图像识别和自然语言推理能力。苹果的研发团队在新版本中改进了数据混合策略，显著增强了模型在多文本图像理解、视觉引用与定位以及多图像推理方面的表现。

根据参考论文，苹果在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述，大幅提升了模型对富含文本内容的图像的理解能力。研究团队还在监督式微调阶段分析了不同数据类型对模型性能的影响，并优化了视觉指令微调数据的混合方式，使模型实现了更高的效率，即便是小规模的模型（10亿、30亿参数版本）也能展现出优秀的性能。

苹果公司此次还推出了MM1.5-Video模型，专门用于视频理解，以及MM1.5-UI模型，专注于移动设备用户界面的理解。MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI，它能够处理各种视觉引用与定位任务，总结屏幕上的功能，或者通过对话与用户进行交互。

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-8575-0.html苹果再出手，300亿参数AI大模型MM1.5来了！

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： 6.98万起，订单破5万，吉利星愿能超越比亚迪海鸥吗？

下一篇： AI医疗建议靠谱吗？22%的回答可能致命！

标签：

热门焦点

“平均时代”：ChatGPT模仿秀的隐喻

来源：锦缎如果你问ChatGPT，Instagram上最美的女人是谁？它很可能会给你一个名字，叫卡戴珊。如果你观察过Instagram这个美版小红书：平台上的所有网红，展现的几乎是统一面孔：统一的医
元宇宙这一年：技术加速落地，助传统行业走向新阶段

美国当地时间1月8日，2023年CES（消费电子展览会）完美落幕。而在这项一年一度的科技圈盛事中，元宇宙仍是主角和焦点之一。索尼在1月6日发布了备受关注的PS VR 2头显
完美世界被元宇宙“拒之门外”

春节期间，游戏是消磨时间最好的方式，完美世界的《幻塔》作为选择的首要目标，倒不是因为它的吸引力有多大，纯粹是广大网友的吐槽。继《原神》之后，进击元宇宙的游戏
AI特效、虚拟人、数字盲盒，来看看元宇宙如何融合冬奥会！

今天是冬奥会比赛的第12天，截至目前所累计的成绩，中国代表团已经取得了冬奥历史最佳战绩。全世界的人都在关注着这场盛事，为奥运健儿呐喊助威。谷爱凌、徐梦桃、
智能人机交互技术的春晚大考

1月初的一个早晨，京东智能客户服务产品部紧急开会，进行关于尚未对外公布的“X项目”的初讨论。1月5日，这个神秘的X项目对外公布，京东成为央视2022年春晚独家互动合
以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

作者：三黎过去的一年里，除了 BTC 一如既往稳坐王位，DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时，也使得其网络日渐拥堵、交易费用增高，成为
NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

当Stefan Prodanovic在13岁时开始尝试平面设计，与一位从事编程工作的学校朋友共同创作数字游戏时，他从未料到这个爱好会在他成年后变成一个相当有利可图的生意。
元宇宙平台会是上世纪末的互联网吗？

“元宇宙”火了好几个月，互联网大厂忙于布局，资本市场热烈追捧。然而很多人还是看不明白，更多的人觉得这是一场泡沫，一场骗局。一开始接触这个怪里怪气的名词，感觉
元宇宙不完全是想出来的，而是实打实做出来的

沈阳强调，元宇宙不完全是想出来的，而是靠实打实做出来的；互联网向三维化升级是已经明确的大方向，这意味着大量的资金和技术会持续涌入。跨入2022年，元宇宙并没有“