当前位置：首页 > 元宇宙 > AI

谷歌推出 Gemini 1.5 Pro 公共预览版，现已支持处理音频

来源：责编：时间：2024-04-11 17:25:19 158观看

导读 4 月 9 日消息，谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版，并借此为其赋予了“耳朵”，从而帮助用户处理音频内

4 月 9 日消息，谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini1.5 Pro。

谷歌现已推出 Gemini 1.5 Pro 公共预览版，并借此为其赋予了“耳朵”，从而帮助用户处理音频内容，例如可以直接上传一份音频文件让它来分析，或者上传一份财报电话会议录音或视频来让它总结。

据称，这个 Gemini系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——GeminiUltra。谷歌称，Gemini1.5 Pro 可以理解复杂的指令，并且无需对模型进行微调。

当然，Gemini1.5 Pro 目前仅限于 Vertex AI 用户体验，而 GeminiUltra 则因为Gemini聊天机器人的原因为所有 Pro 用户提供服务。不过，尽管 GeminiUltra 功能更多并且能够理解长指令，但处理速度不如 Gemini1.5 Pro。

实际上，Gemini1.5 Pro 并非唯一获得更新的谷歌大模型，辅助 Gemini生成图像的文生图模型 Imagen 2 也将加入图片修复和扩充功能，使用户可以添加或移除图像元素。

注意到，谷歌还为 Imagen 模型的所有图片提供了数字水印功能“SynthID”。简单来说，SynthID 在图像中添加了一个用户不可见的防伪标识，但可以通过检测工具来确认其来源。

值得注意的是，Imagen 的许多新功能，例如图片修复和扩充，已经出现在其他文生图模型中，例如 Stability AI 的 Stable Diffusion 和 Getty 公司的 Generative AI by iStock 上，更不用说最新款三星 Galaxy 手机还有类似的功能。

谷歌表示，他们还将在公开预览中尝试将 AI 响应与谷歌搜索结果结合，以便利用最新情报进行解答。

参考资料：

《Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context》

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-3952-0.html谷歌推出 Gemini 1.5 Pro 公共预览版，现已支持处理音频

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： Instagram 短视频板块 Reels 测试 AI 同传功能，用户可用自己声音“说外语”

下一篇：联发科推出生成式 AI 服务平台“达哥”，支持“最强繁体中文大模型”MR BreeXe

标签：

热门焦点

林俊杰、余文乐等明星相继入局，元宇宙虚拟土地究竟有何魔力？

上周的元宇宙和明星圈因为一则“林俊杰在推特上宣布持有Decentraland元宇宙虚拟地块”的新闻而备受关注，该新闻一方面在娱乐圈引起了吃瓜群众的好奇，另一方面在
Meta元宇宙女性安全问题频发，元宇宙中相关问题该如何解决？

在女性遭受性骚扰甚至被攻击的事件相继被报道之后，仍处于萌芽状态的虚拟现实空间成为人们关注的焦点。许多女性发声表示在使用Meta旗下的Horizon Worlds及其姊
字节觅《原神》，腾讯元宇宙，游戏新王战旧神？

文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词，“得不到的永远在骚动”，这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起，使得头部游戏大厂感受
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念
以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

作者：三黎过去的一年里，除了 BTC 一如既往稳坐王位，DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时，也使得其网络日渐拥堵、交易费用增高，成为
与元宇宙美少女艺术家的对话

我最近宣布了我自己的NFT项目，这是我已经工作了几个月的事情。由于我之前只是一个收藏家，拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
如何在元宇宙中建立品牌忠诚度

Snoop Dogg、耐克、苏富比和普华永道都有什么共同点？他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
盘点9个主流元宇宙平台，你都知道哪些？

随着NFT的持续升温，它也加入了现在的元宇宙浪潮。本文介绍元宇宙的基本概念以及九个最流行的元宇宙NFT平台，如Decentraland、sandbox等。用熟悉的语言学习以太
NFT行业周报：NBA巨星勒布朗·詹姆斯申请NFT相关商标

1. “无聊猿”BAYC交易总额突破14亿美元3月10日，据DappRader最新数据显示，“无聊猿”Bored Ape Yacht Club（BAYC）交易总额已突破14亿美元，创下历史新高，本文撰写时为