当前位置：首页 > 元宇宙 > AI

谷歌发布 Mirasol：30 亿参数，将多模态理解扩展到长视频

来源：责编：时间：2023-11-20 17:10:26 240观看

导读 11 月 16 日消息，谷歌公司近日发布新闻稿，介绍了小型人工智能模型 Mirasol，可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流，如果要让 AI 理解视频，需要整合视频、音频和文本等不同模态的

11 月 16 日消息，谷歌公司近日发布新闻稿，介绍了小型人工智能模型 Mirasol，可以回答有关视频的问题并创造新的记录。

AI 模型目前很难处理不同的数据流，如果要让 AI 理解视频，需要整合视频、音频和文本等不同模态的信息，这大大增加了难度。

谷歌和谷歌 Deepmind 的研究人员提出了新的方法，将多模态理解扩展到长视频领域。

借助 Mirasol AI 模型，该团队试图解决两个关键挑战：

需要以高频采样同步视频和音频，但要异步处理标题和视频描述。

视频和音频会生成大量数据，这会让模型的容量紧张。

谷歌在 Mirasol 中使用合路器（combiners）和自回归转换器（autoregressive transformer）模型。

该模型组件会处理时间同步的视频和音频信号，然后再将视频拆分为单独的片段。

转换器处理每个片段，并学习每个片段之间的联系，然后使用另一个转换器处理上下文文本，这两个组件交换有关其各自输入的信息。

名为 Combiner 的新颖转换模块从每个片段中提取通用表示，并通过降维来压缩数据。每个段包含 4 到 64 帧，该模型当前共有 30 亿个参数，可以处理 128 到 512 帧的视频。

在测试中，Mirasol3B 在视频问题分析方面达到了新的基准，体积明显更小，并且可以处理更长的视频。使用包含内存的组合器变体，该团队可以将所需的计算能力进一步降低 18%。

在此附上 Mirasol 的官方新闻稿，感兴趣的用户可以深入阅读。

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-2592-0.html谷歌发布 Mirasol：30 亿参数，将多模态理解扩展到长视频

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：浙江卫健委推出可陪诊数字健康人“安诊儿”：基于支付宝技术，可提供全流程陪伴

下一篇： TPC 联盟成立：目标万亿以上参数 AI 模型，推进科学发现

标签：

热门焦点

B端难做：留给魔珐科技的时间不多了

来源：零态LT元宇宙泡沫正在碎裂，进入2023年后这一赛道热度一直在递减。今年2月，微软解散了成立仅四个月的工业元宇宙部门；今年3月，该公司2017年收购的虚拟现实社交平台AltspaceVR
文心一言排名垫底，却成为百度业绩增长杠杆

文/侯煜编辑/罗卿知识增强大预言模式文心一言发布后，百度公司热度大幅提升，文心一言到底能为百度的业绩带来多大的增益成为业内关注焦点。近日，百度（NASDAQ：BIDU/09888.HK）公布了
抢先推出“元宇宙”饮料，可口可乐赢麻了

试图傍上元宇宙的品牌千千万，但像可口可乐玩得这么花的，属实不多。01 可口可乐盯上元宇宙1886年，可口可乐诞生于美国乔治亚州亚特兰大市，至今已拥有136年的悠久历
在数字世界再造世界杯，元宇宙体育正变得越来越丰满

撰文/ 葱鲔鱼本届世界杯可能不是最精彩的一届，却绝对是看点十足的一届：后疫情时代的首届世界杯、耗资2200亿美元打造的“史上最贵”世界杯、足坛黄金
中文在线的“元宇宙”故事，资本听腻了？

被誉为“元宇宙”龙头之一的中文在线，这下尴尬了。2022年1月11日，中国移动通信联合会元宇宙产业委员会揭牌，接纳涉足“元宇宙”的8家上市公司，包括中青宝、天下秀
上海虹口成立10亿元元宇宙基金，香港首只元宇宙ETF拟上市

区块链日报17日讯今日《元宇宙新鲜事》有：上海虹口将成立总额约10亿元的元宇宙产业基金；香港市场首只元宇宙主题ETF拟于2月21日上市；元宇宙平台Roblox出现违禁游
高通成立欧洲XR实验室；ICICB计划进军元宇宙......

扩展现实（XR）通过计算机将真实与虚拟相结合，打造了一个可人机交互的虚拟环境，将AR、VR、MR多种技术相融合，为体验者带来了虚拟世界与现实世界之间无缝转换的“沉浸
元宇宙是推动NFT发展的初始家园

现在大家都知道了什么是NFT，但好像离自己的生活还有一定距离。随着我们与NFT 接触增加，该如何将这些数字资产带入我们的日常生活？NFT还是主流吗？如果我们将“主流
想进入web3.0？来看看哪些工作适合你

随着对加密货币需求的增加，加密领域的工作的数量也在增加。以下是一些非技术性加密货币工作简介。加密货币在主流市场获得的可信度提升。导致区块链领域的求职