关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2624人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子花费2000多元认养老虎 结果虎园隐瞒老虎死讯数月

大风新闻 浏览 31415

《数据周报88》:70大中城市房价全线下跌

智本社 浏览 3501

TA:尤文逐渐展现出斯帕莱蒂所期望的风格,形成了独特的打法

懂球帝 浏览 2499

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 3117

@全球内容创作者:广东喊你来创造,政策大礼包备好了

智谷趋势 浏览 3521

欧盟限制中国企业参与5G建设,商务部回应:坚决反对

时代周报 浏览 2513

豪赚200亿,河南矿王,迎接泼天富贵!

飞鲸投研 浏览 2482

张艺兴单依纯都在跳,“技能五子棋”是什么?

黔乡小姊妹 浏览 3986

海南封关,就能半价买豪车了?

汽车公社 浏览 3053

自杀还是他杀 爱泼斯坦案两位尸检法医"致命争论"披露

红星新闻 浏览 30180

代码无需审核、数据随便喂,AI 正在催生下一场企业级灾难

IT之家 浏览 3547

原来他就是李湘前夫,如今52岁锒铛入狱

楠楠自语 浏览 2928

加沙停火一个月:民众苦难如常 美以又有新动作

国际在线 浏览 3454

NVIDIA显卡真变砖了!买了一张RTX 5080:收到却是真砖块

快科技 浏览 4430

中戏否认闫学晶儿子读新疆班,官方发文打假闫学晶!

素素娱乐 浏览 2731

恩里克:这场比赛对登贝莱有帮助;我们希望继续赢得更多奖杯

懂球帝 浏览 2964

周柏豪相隔7年回港开唱!揭见面会惊喜

TVB资讯台 浏览 2570

私募代持“罗生门”:15万“友情投”被净值击穿

华尔街见闻官方 浏览 2961

纯电续航215km 极狐阿尔法T5增程版官图发布

车质网 浏览 3075

律师谈吃娃娃菜中毒夫妻被抓:最高判刑十年以上

大象新闻 浏览 4711

伊朗:若油气设施遭袭 将摧毁地区所有国家油气设施

红星新闻 浏览 40659
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1