当前位置：首页 > 元宇宙 > AI

阿里通义千问推出 Qwen2-VL：开源 2B 7B 参数 AI 大模型，处理任意分辨率图像无需分割成块

来源：责编：时间：2024-09-02 17:19:13 21观看

导读 8 月 30 日消息，通义千问团队今天对 Qwen-VL（视觉语言、Vision Language）模型进行更新，推出 Qwen2-VL。Qwen2-VL 的一项关键架构改进是实现了动态分辨率支持（Naive Dynamic Resolution support）。与上一代模型 Qwen

8 月 30 日消息，通义千问团队今天对 Qwen-VL（视觉语言、Vision Language）模型进行更新，推出 Qwen2-VL。

Qwen2-VL 的一项关键架构改进是实现了动态分辨率支持（Naive Dynamic Resolution support）。与上一代模型 Qwen-VL 不同，Qwen2-VL 可以处理任意分辨率的图像，而无需将其分割成块，从而确保模型输入与图像固有信息之间的一致性。这种方法更接近地模仿人类的视觉感知，使模型能够处理任何清晰度或大小的图像。

另一个关键架构增强是 Multimodal Rotary Position Embedding（M-ROPE）。通过将 original rotary embedding 分解为代表时间和空间（高度和宽度）信息的三个部分，M-ROPE 使 LLM 能够同时捕获和集成 1D 文本、2D 视觉和 3D 视频位置信息。这使 LLM 能够充当多模态处理器和推理器。

在 7B 规模下，Qwen2-VL-7B 保留了对图像、多图像和视频输入的支持，以更具成本效益的模型大小提供“具有竞争力”的性能。

Qwen2-VL-2B 模型针对潜在的移动部署进行了优化。尽管参数量只有 2B，但官方表示该模型在图像、视频和多语言理解方面表现出色。

附模型链接如下：

Qwen2-VL-2B-Instruct：https://www.modelscope.cn/models/qwen/Qwen2-VL-2B-Instruct

Qwen2-VL-7B-Instruct：https://www.modelscope.cn/models/qwen/Qwen2-VL-7B-Instruct

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-6597-0.html阿里通义千问推出 Qwen2-VL：开源 2B 7B 参数 AI 大模型，处理任意分辨率图像无需分割成块

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： AI 行业风光背后：80% 项目会失败，5 大原因导致

下一篇： OpenAI 和 Anthropic 同意推出新模型前交给美国政府评估安全

标签：

热门焦点

有人狂赚千倍，资金盘游戏日进上亿，元宇宙泡沫还能吹多久？

你还不知道元宇宙？没关系。看看微软、Meta、英伟达的雄心壮志，便可领略元宇宙的辽阔。1月18日，微软宣布将以687亿美元收购动视暴雪，这是有史以来互联网领域最大的
星展银行(DBS)计划推出零售数字资产交易服务

2月14日消息，新加坡星展银行CEO Piyush Gupta在财报会议上表示，计划于2022年年底前推出零售数字资产交易服务。据悉，DBS于2021年初开设了机构数字资产交易平台，全
比特币的价格越高，使用价值越大

隔夜比特币还是在精准地横盘在42k上方。空头昨日试图发起一波小的攻势，但是晚上就被多头掰了回来。以太坊的链上gas price降到了60 gwei以下，彰显着市场活跃度的
Web3 去中心化身份管理系统的历史、现状与展望

身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构，这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
国内涌现70余家数字藏品平台：合规、流量与利润在博弈

作者：杨郑君2月16日，迅雷链企业数字藏品服务平台正式上线，继阿里、腾讯、京东、百度、网易等之后，又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
2022年去中心化交易所会崛起吗？

“在某个时候，去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
NFT艺术家Hayley Rincon 专访：我的迷幻数字艺术之路

Hayley Rincon是一位令人印象深刻才华横溢的创作者，她的作品呈现出迷幻的气息。今天就来聊聊她的艺术作品，和她自己的数字艺术之路。Hayley是加利福尼亚湾区的有
音乐NFT平台里的下一匹黑马是谁？

NFT 销售额在 2021 年开始暴涨，从 2018 年的仅 4069 万美元的交易量，到 2021 年，NFT 交易量飙升至 442 亿美元以上，并不断刷新记录并达到新的高度。预测到2025 年N
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念