当前位置：首页 > 元宇宙 > AI

英国 AI 安全研究所轻松越狱主要大语言模型，令其输出有害内容

来源：责编：时间：2024-05-22 17:07:41 129观看

导读 5 月 20 日消息，英国政府下属的人工智能安全研究所（AISI）今日发布了一份新报告，揭示了一个值得重视的事实 —— 当前的 AI 系统可能并非像创建者所说的那样“安全”。报告指出，参与测试的四个大语言模型（注：报告未提

5 月 20 日消息，英国政府下属的人工智能安全研究所（AISI）今日发布了一份新报告，揭示了一个值得重视的事实 —— 当前的 AI 系统可能并非像创建者所说的那样“安全”。

报告指出，参与测试的四个大语言模型（注：报告未提到这些模型的具体名称）“极易受到基本越狱攻击”的影响，更有一些模型在被越狱之前，就主动生成了“有害”内容。

图源 Pexels

当前，大部分公开可用的语言模型都内置了部分保护措施，从而防止其生成有害或非法的内容回应。而“越狱”就意味着通过技术手段“欺骗”模型，来忽略上述措施。

英国 AI 安全研究所使用了近期经过标准化评估的提示词、内部自行开发的提示词进行测试，结果显示：在没有尝试越狱的情况下，所有模型都对至少一些有害问题作出了回应；而在尝试了“相对简单的攻击”之后，所有模型都对 98% 至 100% 的有害问题作出了回应。

报告指出，当前市面上的大语言模型所采取的安全措施仍显不足，后续将计划对其他模型进行进一步测试。

参考

报告原文

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-4363-0.html英国 AI 安全研究所轻松越狱主要大语言模型，令其输出有害内容

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：摩根大通：新员工都将接受人工智能培训

下一篇：振兴乡村发展助力青少年教育中国三星连续十一年蝉联企业社会责任榜外企第一

标签：

热门焦点

雷克萨斯高管，“受贿”5000万？

来源：毒舌科技作者：潘磊雷克萨斯的高管，好像出事了。五六家日本小媒体，突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元（约合人民币5000
虚拟人再升级，企业可以解放双手了？

来源：伯虎财经今天想跟大家来唠唠AI，其实聊到这个话题很多人都不陌生了。在ChatGPT和AIGC大热背后，还有一位低调的“大佬”——虚拟人。比如咱们熟知的虚
上、中、下游加深融合，搭建元宇宙产业全景

元宇宙产业链涉及多种技术和多个领域。在上游，聚集着大量的技术厂商，提供元宇宙相关的硬件和软件支持；在中游，内容运营与分发领域也吸引着越来越多的企业以VR内容
搭上“谷爱凌”，“柳夜熙们”站上风口？

作者：张琳曹杨从“永不塌房”的艺人到频频亮相北京冬奥会，作为元宇宙细分赛道之一的虚拟数字人又火了一把。2月7日，即谷爱凌摘得冬奥会自由式滑雪大跳台金牌的
韩国主权基金增加对硅谷初创公司投资押注元宇宙和人工智能

韩国投资公司(KIC)CEO Seoungho Jin预计，该公司在旧金山的办事处今年将扩招人手，探索在硅谷投资科技、健康和绿色项目。规模高达2000亿美元的韩国主权财富基金—
2022 区块链 50 强榜单；垃圾NFT项目的十三个特性

本期关键字TerraZero在Decentraland完成元宇宙住房抵押贷款；腾讯发行齐白石画作数字藏品；Ripple成为数字欧元协会成员；Gem上线稀有度排名功能；2022 区块链 50 强榜
元宇宙“概念股”集体崩塌，背后究竟发生了什么？

近期，Roblox和Meta公布了第四季度的财务报告，在财报发布一日后，股价大跌。作为市值一度超过1万亿美元的世界第六大公司Meta，股价大跌4%，市值降至5650亿美元，甚至跌出
盘点9个主流元宇宙平台，你都知道哪些？

随着NFT的持续升温，它也加入了现在的元宇宙浪潮。本文介绍元宇宙的基本概念以及九个最流行的元宇宙NFT平台，如Decentraland、sandbox等。用熟悉的语言学习以太
虚拟人的3大纪律和6种品牌孵化模式

作者：陈格雷（老小格）及团队虚拟人很热，我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点，整理出6种最主要的品牌虚拟人模式，后面一一介绍。