关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2665人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曲刚:要付出最大努力来打好比赛,罗德里格伤势已没问题

懂球帝 浏览 3662

拼多多,十年启示录

正和岛 浏览 3826

香奈儿2026高级手工坊|最贴近日常的高级奢华

LinkFashion 浏览 3087

小马智行第七代 Robotaxi 自动驾驶出租车正式投运,成本下降70%

IT之家 浏览 3446

关晓彤马尔代夫度假,满屏大长腿超抢镜

扒虾侃娱 浏览 3704

4名专家被饿晕拒绝评标 曾有女专家擅离评标室被处罚

澎湃新闻 浏览 8391

打破场景界限,波司登与Kim Jones的合作让冬天更体面

时尚COSMO 浏览 2900

特朗普宣布延长停火 伊朗表态

界面新闻 浏览 735

刚刚,“海澜之家号”升空!

江南晚报 浏览 3965

中方取消多场重要会议 李在明承诺:帮高市"搞定"中国

现代小青青慕慕 浏览 15563

白银LOF变成了一种分级B

远川聊资管 浏览 2396

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 6611

H-1B签证费涨至10万美元 分析人士:将重创美科技行业

财联社 浏览 21046

杨振宁回国定居在清华园已超20年 为自家取名"归根居"

南方都市报 浏览 4503

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 2604

OPPO Find X9 系列实拍:定位“旅拍神器”,口袋里的哈苏相机

IT之家 浏览 3607

星光730灵犀动力获中汽中心高品质混动认证等奖项

网易汽车 浏览 3469

看看这些穿搭就知道,秋季穿衣很简单,找对方法舒适又得体

静儿时尚达人 浏览 3470

AI眼镜厂商,正在集体拒交“智商税”

钛媒体APP 浏览 3140

媒体:不客气地说 荷兰是在全球面前抢劫中国企业

环球网资讯 浏览 8773

盛放之日·春启颐和:满园春色“想开了”

时尚COSMO 浏览 493
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1