每日消息!BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

2023-07-06 12:49:19 来源：环球网

(资料图片)

伴随着大模型等人工智能产业的快速发展，新的安全风险挑战也接踵而至。今天上午，大数据协同安全技术国家工程研究中心（以下简称“BDS国家工程中心”）发布了国内首份《大语言模型提示注入攻击安全风险分析报告》（以下简称“报告”），为国内大模型安全发展提供整体指南。报告指出，提示注入攻击已成大模型安全威胁之首，建议从安全测评、安全防御、安全监测预警等方面，多维度提升大模型的安全性。

大语言模型引领创新浪潮席卷全球，国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时，大模型的安全风险也引发广泛担忧。此前，BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中，对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估，发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外，AI安全实验室还在主流AI框架中发现200多个漏洞，影响超过40亿终端设备。5月30日，二十届中央国家安全委员会第一次会议上也明确提出，需“提升网络数据人工智能安全治理水平”。

目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中，提示注入攻击因利用有害提示覆盖大语言模型的原始指令，具有极高危害性，也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。

为推动行业采取有效防御措施，构建更加安全可信的大语言模型，BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。报告面向大语言模型的提示注入攻击和防御技术展开研究，并通过构建了包含36000条的提示注入攻击验证数据的数据集，覆盖3类典型攻击方法和6类安全场景，用于对大语言模型的提示注入攻击风险测评。

测评结果显示，目前的大型语言模型普遍面临提示注入攻击安全风险，包括在自动问答系统中误导用户，或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面，需进行网络安全测评和内容安全测评，检测模型软件、插件及供应链等的安全漏洞，并评估模型是否产生有害、有偏见、侵权或与事实不符的内容，以提出整改建设方案。在安全防御方面，报告建议应构建多层次的协同防御体系，包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性，以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面，需建设大语言模型安全风险监测预警平台，包括构建威胁情报库和建立自动化预警系统，以实时追踪安全事件、攻击模式和漏洞信息，并及时发出预警。

基于报告形成测评能力，未来，BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”，为国内大模型提供提示注入攻击风险安全测评，全面推动我国构建安全可信的人工智能。

每日消息!BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

每日消息!BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

黎平县：“你点我检”守护百姓食品安全_独家焦点

长续航、大空间！上汽大通MAXUS纯电物流车EV80 PRO正式上市，售价24.18万元起-新动态

暑假期间，全市14家合规学科类培训机构按下暂停键_全球热资讯

世界快报:硅谷银行母公司获准以1亿美元出售其投行部门

国内齿轮加工机床龙头，受益高档数控机床国产替代提速，积极扩展高端制造及零部件产品线，助力公司业绩增长——7月6日研报挖矿

【南篱/指南】7.06黄金反弹到位？原油破位边缘！ 全球速读

中国红十字会总会调拨救灾物资驰援重庆洪涝灾害

两市ETF融券余额连续7日增加-天天微资讯

高薪“挖角” 赴港投保持续火爆

诺安理财宝货币市场基金限制非直销渠道的机构投资者大额申购（含定投）、转换转入业务的公告

中国新能源汽车6月销量达到历史最高水平

我为研学点代言丨打卡土右旗沟门镇板申气村红色旅游新课堂

今日最新！新宏泽财务信披不准确连收警示函、监管函

环球热推荐：长安欧尚X7怎么样及新风行T5多少钱

airpods英语语音翻译_airpods英语怎么读 今日关注

“天生就坏”的人，性格上有4个特征，不可深交 环球关注

福建宁德民俗文化（福建省宁德民俗文化）|全球看热讯

德雷蒙德格林：篮网球星只是缺乏自信，本西蒙斯还是老样子

世界动态:sdr11pe100是什么意思（sdr11）

今日报丨丽江美食团购2-3人餐火锅（丽江美食）

今日快讯：瞄准电竞市场，iQOO 11S系列发布，独显芯片首次实现“超分超帧”并行

今日视点：山东申论培训机构排名榜 智慧在线，公考网课助您成就人生巅峰

excel表格怎么自动调整列宽在哪_excel表格如何自动调整列宽_最新消息

重庆轻轨站线路图新规划 重庆十四五规划8条城轨快线项目_天天热推荐

湖南黄金：子公司本部华家湾金矿临时停产|全球球精选

千万像素影帝（夏普SH 01B精美评测）

天天消息！qq怎么恢复几年前被删除的好友_qq怎么恢复被删除的好友

快讯：网易云音乐网页版登陆入口（网易云音乐网页版）

【天天快播报】山景、水景、城景相结合 打造独特城市绿心景观

俄媒：白俄罗斯交通运输部部长突然去世，原因不明 每日速递

SMM热卷区域库存：终端按需采购 唐山地区库存小幅下降

大宗交易：大金重工成交1.16亿元，成交均价34.17元（07-04）

环球即时：门球杆厂家直销价格 门球网

环球简讯:沙特宣布将自愿减产石油措施延至8月底

2023辛集市购车补贴金额有多少？

苹果查序列号查询真伪网址（apple 查序列号查询真伪）

直布罗陀是哪个国家(直布罗陀是哪个国家的城市) 天天快播报

深成指跌逾1%-最资讯

所得税纳税调整项目明细表有啥用（所得税纳税调整项目明细表）

焦点观察：长春一东（600148）7月4日主力资金净卖出499.80万元

利国社区开展2023年度上半年综治协管员工作考核评议会

天天视点！吉林省四平市2023-06-24 07:40发布高温蓝色预警

焦点消息！科技部"重型车辆液氢储供关键技术研究"项目顺利通过绩效评价

天天要闻：国家发改委等部门：进一步扩大工业重点领域节能降碳改造升级范围

“第一帅”霍启山，和父亲一起出现在葬礼上，一身黑色西装就像拍电影一样

什么样的人是闷骚男（什么样的人是闷骚型的）-当前动态

现在有什么好玩的网页游戏

即时焦点：侨银股份6日内连涨12% 公司称今年新增订单总额超20亿元

广西公路技工学校学校有哪些专业 学费怎么收

蛋仔派对礼包码兑换入口,蛋仔派对什么时候正式上线-快消息

全球最资讯丨机械设备板快速拉升 光智科技涨停

和平精英背景音乐是啥_和平精英游戏背景音乐叫什么 世界热文

网传“房产中介因抢单被杀害”，浙江宁波警方辟谣：系意外溺水死亡|环球聚看点

读书故事100字凿壁借光_读书故事100字 世界球精选

基膜和糯米胶含甲醛吗_糯米胶含甲醛吗

天天观察：sheep可数还是不可数_sheep

宜兴市诚鑫辐射防护器材有限公司_环球新动态

我市公开招募10名政务服务社会监督员 提升服务效能和服务质量 世界热资讯

甘肃省红十字血液中心2023年培养基（瓶）、试剂盒招标采购项目（二次）中标公告

以色列特拉维夫发生汽车冲撞人群事件 多人受伤 全球微资讯

建设工程勘察设计管理

卡普家族中智商最高的是谁？卡普和路飞是大智若愚，龙是有勇有谋|快播报

7月5日全球首发 全新奔驰CLE预告图曝光

今日热文：布洛肯怪兽百度百科_布洛肯现象

“打折”“降费”！多家银行已行动|天天热资讯

全球快播：最全漫威宇宙时间线整理

每日速递：梁晴晴（关于梁晴晴的基本详情介绍）

世界新消息丨仿古建筑 雏形初显

全球微资讯！苹果14有信号没有网络

中信建投：头部酒企积极乐观，高温持续推动啤酒消费

全球速读：失之东隅收之桑榆的意思相近的一句话是（失之东隅收之桑榆的意思）

晋江首家自闭症青年辅助性就业基地——晨露爱心书吧正式开业

【真相 | 漫评】在美国“黑监狱”里，连医生都举起“屠刀”_环球视点

vivid pink_vivid

【天天速看料】宾赞

当前焦点!央行党委书记潘功胜会见韩央行行长李昌镛，就中韩金融合作等交换意见

沈阳3宗地块约2.21亿元成交

全球热点评！公司用于复合铜箔领域的化学品目前有产生收益吗？光华科技：有的

【南篱/指南】7.06黄金反弹到位？原油破位边缘！全球速读

airpods英语语音翻译_airpods英语怎么读今日关注

“天生就坏”的人，性格上有4个特征，不可深交环球关注

今日视点：山东申论培训机构排名榜智慧在线，公考网课助您成就人生巅峰

重庆轻轨站线路图新规划重庆十四五规划8条城轨快线项目_天天热推荐

【天天快播报】山景、水景、城景相结合打造独特城市绿心景观

俄媒：白俄罗斯交通运输部部长突然去世，原因不明每日速递

SMM热卷区域库存：终端按需采购唐山地区库存小幅下降

环球即时：门球杆厂家直销价格门球网

广西公路技工学校学校有哪些专业学费怎么收

全球最资讯丨机械设备板快速拉升光智科技涨停

和平精英背景音乐是啥_和平精英游戏背景音乐叫什么世界热文

读书故事100字凿壁借光_读书故事100字世界球精选

我市公开招募10名政务服务社会监督员提升服务效能和服务质量世界热资讯

以色列特拉维夫发生汽车冲撞人群事件多人受伤全球微资讯

7月5日全球首发全新奔驰CLE预告图曝光

世界新消息丨仿古建筑雏形初显

世界播报:傲腾内存原理详解食之有味的鸡肋

冰雪迎大运全国300余名选手集结蓉城参加热雪奇迹滑雪公开赛|通讯

真我 GT Neo6 渲染图曝光或搭载骁龙 8 Gen 2 近期发布_每日热点

毕业季热点城市租房市场稳定品牌长租公寓推优惠抢客