关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2630人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新年第一顶帽子,就要不基础

时尚COSMO 浏览 2169

北京现代首款纯电平台SUV EO羿欧预售在即

网易汽车 浏览 3876

从造豪车到百万亿美元公司,追觅俞浩:怕我们膨胀,但我们稳得很

贝壳财经 浏览 2558

车企不敢!专家:希望推出伤亡率车型榜单,新能源车极端事故不多

小李车评李建红 浏览 3245

顶流复工,已判若两人

她刊 浏览 765

工信部曝光9台“狠角色”新车:A6L 3.0T功率提升,奇瑞五菱新作

蜗牛车志V 浏览 3047

曼晚:奥比-马丁目前短板很明显,还未达到曼联一线队要求

懂球帝 浏览 1034

刘强东“10年1元年薪”之约到期,律师解构高净值人群如何妥善处理财产

红星资本局 浏览 4335

女子被判向出轨丈夫公开道歉15天 道歉视频引万人围观

大风新闻 浏览 13359

丰田"世极"正式独立 全新概念车剑指劳斯莱斯

网易汽车 浏览 3606

BIGME大我推出7英寸彩色墨水屏电纸书B751CS,1739元

IT之家 浏览 3011

5公里盘山路 超1000米落差!小鹏GX挑战东川49道拐一把过

快科技 浏览 365

董秘也“打短工”?道通科技董秘上任5个月即离任

华夏时报 浏览 3626

泽连斯基:准备进行领土谈判

参考消息 浏览 3765

ImageNet分数越高,生成反而越糊?iREPA给出解释

新智元 浏览 2953

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 2751

年龄差19岁,这对姐弟恋又给内娱上了一课!

伊周潮流 浏览 3047

4名专家被饿晕拒绝评标 曾有女专家擅离评标室被处罚

澎湃新闻 浏览 8391

歌手黄安:屠颖因在跑步机上摔跤致颅内出血去世

红星新闻 浏览 9517

韩星张元英辱华发酵!相关代言遭抵制品牌方回应,本人持续装糊涂

萌神木木 浏览 2256

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

扬子晚报 浏览 8410
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1