当前位置:首页 > 科技  > 测评

全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二

来源: 责编: 时间:2024-08-02 15:55:13 48观看
导读 8月2日消息,根据国内权威大模型评估平台OpenCompass(司南)近日公布的CompassArena周榜,GPT-4o和科大讯飞的星火大模型分别占据了排行榜的前两位。榜单采用专业用户投票方式,结合了用户对各款大模型的

8月2日消息,根据国内权威大模型评估平台OpenCompass(司南)近日公布的CompassArena周榜,GPT-4o和科大讯飞的星火大模型分别占据了排行榜的前两位。7kD28资讯网——每日最新资讯28at.com

榜单采用专业用户投票方式,结合了用户对各款大模型的真实体验,更具客观性和说服力,可谓是含金量十足。7kD28资讯网——每日最新资讯28at.com

全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二7kD28资讯网——每日最新资讯28at.com

OpenCompass的评测体系涵盖了学科、语言、知识、理解、推理等多个维度,能够全面评估大模型的综合能力。7kD28资讯网——每日最新资讯28at.com

在最新三期的评选中,讯飞星火以Elo-1078和Elo-1081的高分连续三周位列前三,并两次获得第二,显示出其在大模型领域的强劲竞争力。7kD28资讯网——每日最新资讯28at.com

全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二7kD28资讯网——每日最新资讯28at.com

值得注意的是,科大讯飞在今年6月27日发布的星火V4.0版本上,已完成了对GPT-4 Turbo的整体超越。7kD28资讯网——每日最新资讯28at.com

根据八个国际主流测试集的横向评测,讯飞星火V4.0排名第一,在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面完成了整体超越。7kD28资讯网——每日最新资讯28at.com

此前,讯飞星火在《麻省理工科技评论》的横评中也获得了高分,凭借领先的语言能力、数学、理综等多项核心能力,斩获国产主流大模型榜首席位。7kD28资讯网——每日最新资讯28at.com

目前,讯飞星火的安卓端APP累计下载量已超过1.31亿次,位列国内工具类通用大模型APP第一,持续领跑国内大模型第一梯队。7kD28资讯网——每日最新资讯28at.com

本文链接://www.dmpip.com//www.dmpip.com/showinfo-25-105362-0.html全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: iQOO Pad2评测:骁龙8sGen3加持 游戏/影音大享受

下一篇: OMEN暗影精灵10评测:一线大厂也玩性价比?

标签:
  • 热门焦点
Top
Baidu
map