当前位置:首页 > 元宇宙 > AI

Meta 推出 AI 音频模型 Audiobox:支持语音及文字同时输入、可生成多层次声音

来源: 责编: 时间:2023-12-08 09:12:31 259观看
导读 12 月 4 日消息,Meta 日前推出了一款 AI 声音生成模型 Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。据悉,这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型

12 月 4 日消息,Meta 日前推出了一款 AI 声音生成模型 Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。qJP28资讯网——每日最新资讯28at.com

据悉,这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型,据称 Audiobox 能生成各种环境音、自然对话语音,并整合了音频生成和编辑能力,以便于用户自由生成自己所需的音频。qJP28资讯网——每日最新资讯28at.com

qJP28资讯网——每日最新资讯28at.com

Meta 介绍称,生成高品质音频需要有大量音频库及深厚的领域知识,但大众难以获得这些资源,而该公司推出这个模型旨在降低声音生成门槛,让任何人都更容易制作视频、游戏等应用场景的音效。qJP28资讯网——每日最新资讯28at.com

发现,这款 Audiobox 模型基于 Voicebox 的“引导声音”机制,以便于生成目标音频,并配合“流量比对(flow-matching)”扩散模型生成方法,以实现“声音填充(audio infilling)”功能,从而生成多层次的音频。qJP28资讯网——每日最新资讯28at.com

Meta 测试生成带有雷暴声的下雨音频,并输入一系列提示句进行演示,例如“流水声伴随鸟鸣”、“以高音调快节奏说话的年轻女性”等;同时测试了同时输入人声及文字提示,以生成带有情绪(“哀痛而缓慢”)并拥有背景音(身处教堂)的语音。qJP28资讯网——每日最新资讯28at.com

qJP28资讯网——每日最新资讯28at.com

qJP28资讯网——每日最新资讯28at.com

Meta 声称,Audiobox 在音质及“生成内容的准确度” 顺利击败了 AudioLDM2、VoiceLDM 及 TANGO,超越了现有最佳的音频生成模型。qJP28资讯网——每日最新资讯28at.com

qJP28资讯网——每日最新资讯28at.com

目前 Audiobox 已经开放向特定研究人员及学术界试用,以供测试模型品质及安全性,Meta 声称,他们计划“再过几周将社会全面公开该模型”。qJP28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-2805-0.htmlMeta 推出 AI 音频模型 Audiobox:支持语音及文字同时输入、可生成多层次声音

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微软仅凭「提示工程」让 GPT-4 成医学专家!超过一众高度微调模型,专业测试准确率首次超 90%

下一篇: 双11错过的大眼橙投影仪优惠,双12继续低价购!

标签:
  • 热门焦点
Top
Baidu
map