【ITBEAR】近期,大模型行业再度掀起波澜。先是OpenAI悄然发布了o1模型的预览版,紧接着,国内智谱公司也推出了其最新的基座大模型GLM-4-Plus,这款模型被认为是智谱当前最强大的产品。
清华大学基础模型研究中心的最新评测显示,GLM-4-Plus在综合能力上排名前三,打破了国外大模型长期垄断前三的局面,并在多个关键能力上保持国际领先水平。
GLM-4-Plus的提升体现在多个方面。首先是语言理解能力,通过大规模语料库训练和优化算法,GLM-4-Plus在处理复杂语义上的表现尤为出色。例如,在难度较高的水果热量计算任务上,GLM-4-Plus成为首个在此题拿到满分的模型。
GLM-4-Plus还具备出色的长文本处理能力,支持128K上下文,凭借创新的记忆机制和分段处理技术,能够高效地处理大量文本信息。同时,它在时序问答和多轮对话能力上也有所突破,能够针对单个视频进行多轮对话问答。
为了验证GLM-4-Plus的实际应用能力,我们在智谱的开放平台上进行了针对性的场景测试。在财务报告的阅读和信息整理任务中,GLM-4-Plus迅速给出了我们想要的信息,并自动将单位进行了换算,精准“捕捉”了未在图表中体现的数据。
在围绕细节信息的对话问答中,GLM-4-Plus也表现出色。例如,在询问“目前有多少研发人员,30岁以下年轻人占比”的问题时,GLM-4-Plus不仅准确抓住了2024年的数据,还给出了表格中没有的计算过程。
除了归纳总结和信息检索,GLM-4-Plus在内容生成方面也有不俗的表现。我们尝试让GLM-4-Plus在报告的基础上提炼核心信息并生成视频脚本,结果再次超出了我们的预期。GLM-4-Plus不仅给出了高分答卷,还涵盖了旁白、画面切换以及对插入图表、数据动画等贴心建议。
GLM-4-Plus的出现,不仅提升了工作效率,还在改变人机交互的习惯。它的多轮对话能力,让我们可以对着目录针对性提问,对整个工作流程和效率进行了重塑。
GLM-4-Plus的应用场景也十分广泛。有人将其用于生成针对性的面试题目,甚至有人尝试将其用于数学问题的解答,充当一对一家教。GLM-4-Plus还为智能硬件开发者提供了软硬协同的合作空间,让电影《Her》中的场景从科幻走进现实。
值得注意的是,智谱在推出GLM-4-Plus的同时,还为用户提供了丰厚的福利:10月份将赠送每位用户1亿tokens额度,并根据消耗梯度提供最高1折的API折扣。这一举措无疑将进一步推动大模型在各行各业的应用。
GLM-4-Plus的能力进阶和落地场景令人兴奋。它的出现,不仅为大模型厂商和硬件开发者提供了合作的机会,也为千行万业带来了前所未有的变革。
本文链接://www.dmpip.com//www.dmpip.com/showinfo-45-8608-0.htmlGLM-4-Plus赋能“阅读智能体”,效率飙升300%?
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com