当前位置：首页 > 元宇宙 > AI

阿里云通义千问开源两款语音基座模型，识别效果优于 OpenAI Whisper

来源：责编：时间：2024-07-12 08:25:23 89观看

导读 7 月 9 日消息，阿里云通义千问开源了两款语音基座模型 SenseVoice（用于语音识别）和 CosyVoice（用于语音生成）。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测，有以下特点：多语言识别：采用超过 40

7 月 9 日消息，阿里云通义千问开源了两款语音基座模型 SenseVoice（用于语音识别）和 CosyVoice（用于语音生成）。

SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测，有以下特点：

多语言识别：采用超过 40 万小时数据训练，支持超过 50 种语言，识别效果上优于 Whisper 模型

富文本识别：具备优秀的情感识别，能够在测试数据上达到和超过目前最佳情感识别模型的效果；支持声音事件检测能力，支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测

高效推理：SenseVoice-Small 模型采用非自回归端到端框架，推理延迟极低，10s 音频推理仅耗时 70ms，15 倍优于 Whisper-Large

微调定制：具备便捷的微调脚本与策略，方便用户根据业务场景修复长尾样本问题

服务部署：具有完整的服务部署链路，支持多并发请求，支持的客户端语言有 python、c++、html、java 与 c#等

与开源情感识别模型进行对比，SenseVoice-Large 模型可以在几乎所有数据上都达到了最佳效果，而 SenseVoice-Small 模型同样可以在多数数据集上取得超越其他开源模型的效果。

CosyVoice 模型同样支持多语言、音色和情感控制，该模型在多语言语音、零样本语音生成、跨语言语音克隆和指令跟随等功能方面表现出色。

附相关链接：

SenseVoice：https://github.com/FunAudioLLM/SenseVoice

CosyVoice：https://github.com/FunAudioLLM/CosyVoice

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-5094-0.html阿里云通义千问开源两款语音基座模型，识别效果优于 OpenAI Whisper

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： “国内首款破局性 AI 开发工具”，中国电信发布星辰软件工厂：产品文档生成代码

下一篇：振兴乡村发展助力青少年教育中国三星连续十一年蝉联企业社会责任榜外企第一

标签：

热门焦点

B端难做：留给魔珐科技的时间不多了

来源：零态LT元宇宙泡沫正在碎裂，进入2023年后这一赛道热度一直在递减。今年2月，微软解散了成立仅四个月的工业元宇宙部门；今年3月，该公司2017年收购的虚拟现实社交平台AltspaceVR
蓝标亏钱、Meta裁员：天下秀还值得砸钱元宇宙吗？

日前，天下秀数字科技集团正式公布了2022年报及2023年一季报。报告显示，2022年天下秀实现营收41.29亿元，同比下滑8.48%；归母净利润1.8亿元，同比下滑49.2%，几乎出现了盈利腰斩的态势
保时捷推出虚拟超跑，车企元宇宙营销这么香？

保时捷又出超跑了，不过这次不是在现实世界，而是在虚拟世界。这款Vision Gran Turismo概念车，由保时捷和日本视频游戏开发工作室Polyphony Digital联合打造，将于202
Meta元宇宙女性安全问题频发，元宇宙中相关问题该如何解决？

在女性遭受性骚扰甚至被攻击的事件相继被报道之后，仍处于萌芽状态的虚拟现实空间成为人们关注的焦点。许多女性发声表示在使用Meta旗下的Horizon Worlds及其姊
权限风波过后 X2Y2如何挑战OpenSea？

继LooksRare之后，又一个OpenSea挑战者X2Y2来了。上周，X2Y2宣布向超过86万个OpenSea交易用户发放X2Y2通证空投，并启动了「挂单挖矿」的奖励机制。这场早期激励活动
解决NFT流动性问题：一文了解Floor DAO

流动性是证券市场上的一个术语，流动性是指资产在不影响其市场价格的情况下可以转换为现成现金的效率，流动性最强的资产是现金本身。现在让我们试着从流动性的角
为什么元宇宙将永远改变体育和你的生活？

自从Facebook更名为Meta以来，Metaverse这个词已经被大家所熟知。但是当Metaverse仍然被许多人视为一个虚拟的平行世界时，一些项目已经显示出Metaverse将如何永远
元宇宙+剧本杀：“在异世界里当演员”

你玩过剧本杀吗？体验过“元宇宙+剧本杀”吗？2月，恒信东方推出了一款次时代剧本杀原创作品——《失落的王朝》。其剧本和线索以数字化资产打造，通过VR技术塑造了与
在互联网考古后，我被豆瓣上这座元宇宙古城征服了

最近一段时间，豆瓣可谓命途多舛：APP屡次下架，平台也被相关部门约谈、处罚，国家网信办甚至派人入驻豆瓣以督促整改。有爆料称豆瓣将陆续关闭“小组”功能：这个曾经小