关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2660人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

委内瑞拉外长会见美外交使团团长

环球网资讯 浏览 2429

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者 浏览 3497

43岁李宗伟谈羽联改革:若改用15分制,说不定我也会复出

懂球帝 浏览 828

保时捷出事故保险公司让报废 但只赔100万保额的一半

大象新闻 浏览 24405

“50%汽车芯片由格力产品替代”?广汽回应

第一财经资讯 浏览 2605

港女最爱的国产单品,赢了特斯拉?

新周刊 浏览 3173

长友佑都:目前的巴西并非最强形态,我认为日本队有机会取胜

懂球帝 浏览 3819

美再次在委内瑞拉海域扣押油轮 现场画面公布

新华社 浏览 2962

"世界第一美少年"去世 女儿未透露其具体死因

扬子晚报 浏览 9352

小米杠上奇瑞,争夺高强度钢第一!理想高管吐槽“都是键盘值”

明镜pro 浏览 2529

美军袭击2艘所谓"从事毒品走私活动"船只 致5人死亡

环球网资讯 浏览 2795

2026年春晚分会场官宣 周深肖战刘宇宁令人期待

你我话娱乐 浏览 2242

若昂-内维斯卖便宜了?坎波斯:我们为他支付的价格很合理

懂球帝 浏览 2955

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 3685

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 3790

薛鹤翔:中美欧PPI为什么脱钩?

首席经济学家论坛 浏览 3715

媒体:向乌提供"战斧"或只是幌子 特朗普可能另有打算

枢密院十号 浏览 17715

亚马逊AWS将部署英伟达Groq LPU与超百万块GPU

IT之家 浏览 1689

一夜翻盘,炫富网红蓝战非复活了

TVB的四小花 浏览 3821

以军频袭黎巴嫩南部 黎总统斥责

新华社 浏览 3575

“这件大衣”今年冬天又火了,怎么搭都高级!

LinkFashion 浏览 3066
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1