当前位置：首页 > 元宇宙 > AI

微软推出42亿参数新AI模型Phi-3-vision，主打视觉理解

来源：责编：时间：2024-05-27 08:53:55 32观看

导读5月26日消息，微软最近推出了其小语言AI模型家族(SLM)的全新成员——“Phi-3-vision”。此款模型以“视觉能力”为主打特色，不仅能理解图文内容，还被誉为能在移动平台上实现流畅高效的运行。Phi-3-vision模型，作为微软Phi-

5月26日消息，微软最近推出了其小语言AI模型家族(SLM)的全新成员——“Phi-3-vision”。此款模型以“视觉能力”为主打特色，不仅能理解图文内容，还被誉为能在移动平台上实现流畅高效的运行。

Phi-3-vision模型，作为微软Phi-3系列的首款多模态模型，其文字理解能力源于Phi-3-mini，并继承了其轻量化特性，非常适合在移动设备或嵌入式系统中运行。该模型拥有42亿的参数量，这一数字超过了Phi-3-mini的3.8亿，但低于Phi-3-small的70亿。其上下文长度达到了128ktoken，训练周期从2024年2月持续至4月。

据ITBEAR科技资讯了解，Phi-3-vision模型的最大亮点在于其“图文识别能力”。它不仅能够理解现实世界中图片的含义，还能迅速识别和提取图片中的文字信息。微软表示，这款模型在办公场合中表现出色，特别是在识别和理解图表及方块图方面有着出色的能力。它可以根据用户输入的信息进行推理，并为企业提供有价值的战略建议，其效果甚至可与大型模型相媲美。

在模型训练方面，微软强调Phi-3-vision是通过多种类型的图片和文字数据进行训练的，这些数据来源于一系列经过严格筛选的公开内容，如教育材料、代码、图文标注数据等，从而确保了模型能够处理多样化的输入。同时，微软也注重用户隐私的保护，在训练数据中严格排除了任何个人信息。

性能方面，微软提供了Phi-3-vision与其他竞品模型如字节跳动的Llama3-Llava-Next(8B)、微软研究院与其他机构合作的LlaVA-1.6(7B)以及阿里巴巴的通义千问QWEN-VL-Chat等模型的对比图表。结果显示，Phi-3-vision在多个测试项目中均表现出色。

目前，微软已经将Phi-3-vision模型上传至Hugging Face平台。

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-5568-0.html微软推出42亿参数新AI模型Phi-3-vision，主打视觉理解

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：马斯克再出大手笔，xAI将建由数万个芯片组成的算力超级工厂

下一篇：中国电信发布支持30种方言的语音识别大模型‘星辰

标签：

热门焦点

时尚领域进军元宇宙，2022年会带来哪些颠覆性的全新体验？

想象一个你的数字身份与现实身份同样重要的世界。想象一个你需要为虚拟自我准备资产和物资的地方——你需要金钱（Crypto）、房屋（可能建在Minecraft上）和衣物。随着
“元宇宙”里过大年，《迷你世界》在做一场怎样的实验？

2021年是游戏行业不确定性急剧上升的一年。一方面游戏正风光无限，腾讯等大厂更加密集地投资动作，让游戏创投市场异常火热，"元宇宙"概念的大放异彩，更是吸引了Netfl
2022年最具关注的9个头像NFT项目

什么是 PFP NFT 项目？PFP NFT （个人资料图片NFT）是一组独特的数字收藏品，人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色，在 Twit
以太坊升级将会带来的5个改变

以太坊自2015年诞生以来就广受欢迎，但最近其昂贵的交易费用和低可扩展性对执行复杂的应用程序产生了负面作用，用户对以太坊改进的需求也日益急迫。以太坊2.0已进
NFT也有黄牛？这家公司专门对付外挂作弊机器人

澳大利亚前总理马尔科姆·特恩布尔 (Malcolm Turnbull) 是支持萨姆·Crowther (Sam Crowther) 的人之一，Sam是一名出生于纽卡斯尔的黑客，他的职业生涯始于为国防
元宇宙需要的5个重要安全功能

元宇宙的可能用途使其成为一个令人难以置信的概念，但是，就像科技界的任何事物一样，需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发，以保护用户
大厂打造元宇宙平台的业务重心是什么？

知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告，其中提出互联网大厂各自独立布局元宇宙平台。事实上，在2021年的最后一个季度，包括Meta、英伟达、
多位全国政协委员提交元宇宙提案，国金证券称元宇宙仍处初期投资阶段

财联社|区块链日报2日讯今日《元宇宙新鲜事》有：全国政协委员刘伟建议出台“元宇宙中国”的顶层设计方案；国金证券称元宇宙仍处初期投资庞大获利不易阶段；阿联酋
冬奥会数字收藏品升温，市场再现“一墩难求”

根据公开信息显示，国际奥委会官方授权的冰墩墩数字盲盒于北京时间2月12日凌晨在nWayPlay平台发售，总数为500个，每个99美元，每人限购5个。此外，不同的奥运徽章数字藏