当前位置:首页 > 科技  > 资讯

大模型超拟人合成技术PK赛上演 微软、讯飞谁是“王者”?

来源: 责编: 时间:2024-04-16 08:32:04 100观看
导读近期,微软对其Azure AI语音服务进行了重要升级,新上线了9款更真实的AI语音。微软提升了AI语音的自然度,在语调、节奏和情感上更好捕捉了人类语音的细微差别,让合成的语音更加生动和真实,其逼真的效果引发大家的关注讨论。

近期,微软对其Azure AI语音服务进行了重要升级,新上线了9款更真实的AI语音。微软提升了AI语音的自然度,在语调、节奏和情感上更好捕捉了人类语音的细微差别,让合成的语音更加生动和真实,其逼真的效果引发大家的关注讨论。HfJ28资讯网——每日最新资讯28at.com

HfJ28资讯网——每日最新资讯28at.com

微软Azure AI语音合成体验页面HfJ28资讯网——每日最新资讯28at.com

但这一次微软并非领先者,早在2个月前,科大讯飞就在讯飞星火V3.5发布会上,率先推出了超拟人语音合成技术,并搭载在讯飞星火APP中开放给全民体验。其拟人度超过83%,MOS分达到4.5分(满分5分,分数越高表示语音质量越好),体验下来它的声音流畅自然,表达已非常接近人类的真实声音。HfJ28资讯网——每日最新资讯28at.com

可以看到,随着大模型的发展如火如荼,作为重要的表达方式,超拟人合成技术成为国内外AI巨头争相布局的重点,一场超拟人合成技术PK赛正在上演。HfJ28资讯网——每日最新资讯28at.com

微软VS科大讯飞:星火拟人度更优HfJ28资讯网——每日最新资讯28at.com

语音合成技术在上世纪九十年代后快速发展,尤其是深度学习技术的出现推动语音合成进入全新阶段,逐步走向规模化应用落地、被大众所熟知。相比字正腔圆的“播音腔”,现在语音合成的风向标更多指向贴近真人日常表达,也就是超拟人。HfJ28资讯网——每日最新资讯28at.com

普通人正常交流对话中会带有一定的语气、情感和口语化表达,也会出现重复、卡顿、叹气、呼吸、说错字词,还有吞音、轻声等习惯说法。考量超拟人语音效果,不仅要看说话的自然度、流畅度,也要看这些口语化和副语言的频率和细节是否更贴近真实,以及语音中的情感是否贴合说话内容等维度。HfJ28资讯网——每日最新资讯28at.com

目前,微软上新的AI语音可以在Azure AI服务页面里进行试听和调用,科大讯飞超拟人合成在讯飞星火APP和讯飞开放平台上均可体验和使用。HfJ28资讯网——每日最新资讯28at.com

HfJ28资讯网——每日最新资讯28at.com

近日,也有媒体以相同的文本对两者的超拟人合成技术进行了体验评测,发现微软和科大讯飞在超拟人合成的拟人度上相较传统语音合成效果都有了显著进步,克服了合成声音“板正”、“一丝不苟”的“播音腔”问题;同时在停顿、语速变化等副语言上的表现也相当自然,“哈哈”、“嗯”等常见的口语化词语也和说话内容进行了较好融合。HfJ28资讯网——每日最新资讯28at.com

对比来看,微软上新的9款AI语音覆盖了更多语种和说话风格,说话的自然度和流畅度相对较好,但在语气词等口语化表达上稍显突兀;科大讯飞的超拟人合成在整体的拟人化程度上略胜一筹,交互和表达效果更生活化、也更自然,口语化词语的插入不突兀,遇到一些中英文混杂的词语,也能做到发音自然。HfJ28资讯网——每日最新资讯28at.com

值得一提的是,科大讯飞超拟人合成在情感表达上表现更为突出。在输入表达不同程度开心的相关文字后,讯飞超拟人合成的效果能够根据程度不同展现出可感知的差别;而微软在情感表达上稍逊一筹,合成效果与普通语气基本没有差异。综合来看,科大讯飞的超拟人技术在拟人度与情感表达上更优。HfJ28资讯网——每日最新资讯28at.com

通用大模型+语音大模型 让语音合成更逼真HfJ28资讯网——每日最新资讯28at.com

今年1月30日科大讯飞发布超拟人合成时,也发布了最新的星火语音大模型,它可谓是让语音合成听起来更加自然和逼真的“杀手锏”。HfJ28资讯网——每日最新资讯28at.com

HfJ28资讯网——每日最新资讯28at.com

图片来源于讯飞星火V3.5发布会内容HfJ28资讯网——每日最新资讯28at.com

它是如何做到的呢?首先,基于星火通用大模型的能力,来预测文本中的口语化现象、情感、停顿等细节信息,这对于传达说话者的真实感受非常重要;然后,星火语音大模型学习人类的口语化表达方式后,对通用大模型预测的口语化信息进行还原,从而极大提高了合成的拟人化效果。HfJ28资讯网——每日最新资讯28at.com

之所以能够抓住先机,在超拟人合成技术上率先突破并取得成效,这与讯飞多年来深厚的技术积累与持续创新紧密相关。HfJ28资讯网——每日最新资讯28at.com

在科大讯飞创立之初,就在1998年的国家“863”计划语音合成比赛中夺得冠军。此后,科大讯飞更是在国际语音合成界的“奥斯卡”Blizzard Challenge评测赛事中拿下十四连冠,还实现了中英文语音合成业界首次超过普通人说话水平等一系列成就,可谓是AI语音“王者”。HfJ28资讯网——每日最新资讯28at.com

近年来,讯飞在多语种语音合成应用、方言合成、合成语音情感上持续创新,并且推出全新语音合成系统SMART-TTS,实现多风格、多情感合成,能够根据需求对声音进行调节和创作。超拟人合成技术的率先上线和惊艳效果,背后是科大讯飞多年如一日的积累与突破。HfJ28资讯网——每日最新资讯28at.com

随着讯飞星火APP上线了超拟人合成技术后,受到了许多用户的喜爱,在讯飞开放平台上也成为开发者的热门选择,并将在车载、机器人、智能客服等领域推出落地应用。据了解,讯飞超拟人合成升级版本也会在近期推出,将进一步增强喜怒哀乐等各种类型的情感反馈能力。HfJ28资讯网——每日最新资讯28at.com

超拟人技术有望引爆万物互联时代的交互体验HfJ28资讯网——每日最新资讯28at.com

万物互联时代,语音正在成为人机交互的主要入口。超拟人合成技术不仅能够提供更加自然流畅的交互体验,还能够通过模拟人类的情感和行为,为用户提供更加个性化和富有同理心的服务,将变革我们的人机交互体验。HfJ28资讯网——每日最新资讯28at.com

市场规模的增长也从侧面印证了这一趋势。据相关报告预测,全球生成式AI市场规模将从2022年的400亿美元,扩大至2032年的1.3万亿美元。中国生成式AI商业应用规模预计到2025年将达到2070亿元,未来五年的年均增速84%。超拟人技术作为生成式AI的重要表达方式,展现出巨大的市场潜力。HfJ28资讯网——每日最新资讯28at.com

而在这一技术上,以科大讯飞等为代表的中国AI企业已经率先布局,实现了国际领先,有望在全球市场中占据重要地位。HfJ28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-16-83764-0.html大模型超拟人合成技术PK赛上演 微软、讯飞谁是“王者”?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 三星领导层被指趋于保守,避险文化阻碍创新

下一篇: 「快手优选」项目启动 官方一站式代运营服务助力优质商家线上销售

标签:
  • 热门焦点
  • 7月安卓手机性价比榜:努比亚+红魔两款新机入榜

    7月安卓手机性价比榜:努比亚+红魔两款新机入榜

    7月登场的新机有努比亚Z50S Pro和红魔8S Pro,除了三星之外目前唯二的两款搭载超频版骁龙8Gen2处理器的产品,而且努比亚和红魔也一贯有着不错的性价比,所以在本次的性价比榜单
  • 一文看懂为苹果Vision Pro开发应用程序

    一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 企业采用CRM系统的11个好处

    企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 让我们一起聊聊文件的操作

    让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 如何通过Python线程池实现异步编程?

    如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 多线程开发带来的问题与解决方法

    多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 梁柱接棒两年,腾讯音乐闯出新路子

    梁柱接棒两年,腾讯音乐闯出新路子

    文丨田静 出品丨牛刀财经(niudaocaijing)7月5日,企鹅FM发布官方公告称由于业务调整,将于9月6日正式停止运营,这意味着腾讯音乐长音频业务走向消亡。腾讯在长音频领域还在摸索。为
  • 本地生活这块肥肉,拼多多也想吃一口

    本地生活这块肥肉,拼多多也想吃一口

    出品/壹览商业 作者/李彦编辑/木鱼拼多多也看上本地生活这块蛋糕了。近期,拼多多在App首页“充值中心”入口上线了本机生活界面。壹览商业发现,该界面目前主要
  • 网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低
Top
Baidu
map