当前位置:首页 > 元宇宙 > AI

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

来源: 责编: 时间:2024-04-11 17:25:19 158观看
导读 4 月 9 日消息,谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内

4 月 9 日消息,谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini1.5 Pro。frr28资讯网——每日最新资讯28at.com

frr28资讯网——每日最新资讯28at.com

谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。frr28资讯网——每日最新资讯28at.com

frr28资讯网——每日最新资讯28at.com

据称,这个 Gemini系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——GeminiUltra。谷歌称,Gemini1.5 Pro 可以理解复杂的指令,并且无需对模型进行微调。frr28资讯网——每日最新资讯28at.com

当然,Gemini1.5 Pro 目前仅限于 Vertex AI 用户体验,而 GeminiUltra 则因为Gemini聊天机器人的原因为所有 Pro 用户提供服务。不过,尽管 GeminiUltra 功能更多并且能够理解长指令,但处理速度不如 Gemini1.5 Pro。frr28资讯网——每日最新资讯28at.com

frr28资讯网——每日最新资讯28at.com

frr28资讯网——每日最新资讯28at.com

实际上,Gemini1.5 Pro 并非唯一获得更新的谷歌大模型,辅助 Gemini生成图像的文生图模型 Imagen 2 也将加入图片修复和扩充功能,使用户可以添加或移除图像元素。frr28资讯网——每日最新资讯28at.com

注意到,谷歌还为 Imagen 模型的所有图片提供了数字水印功能“SynthID”。简单来说,SynthID 在图像中添加了一个用户不可见的防伪标识,但可以通过检测工具来确认其来源。frr28资讯网——每日最新资讯28at.com

值得注意的是,Imagen 的许多新功能,例如图片修复和扩充,已经出现在其他文生图模型中,例如 Stability AI 的 Stable Diffusion 和 Getty 公司的 Generative AI by iStock 上,更不用说最新款三星 Galaxy 手机还有类似的功能。frr28资讯网——每日最新资讯28at.com

谷歌表示,他们还将在公开预览中尝试将 AI 响应与谷歌搜索结果结合,以便利用最新情报进行解答。frr28资讯网——每日最新资讯28at.com

参考资料:frr28资讯网——每日最新资讯28at.com

《Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context》frr28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-3952-0.html谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Instagram 短视频板块 Reels 测试 AI 同传功能,用户可用自己声音“说外语”

下一篇: 联发科推出生成式 AI 服务平台“达哥”,支持“最强繁体中文大模型”MR BreeXe

标签:
  • 热门焦点
Top
Baidu
map