关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2662人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联想 ThinkPad P1 2026 AI 元启版 10 月 20 日首销,25999 元起

IT之家 浏览 3807

“量子科技第一股”董事长离世余波调查:已排除是刑事案件

时代周报 浏览 2906

特朗普强调美以两军配合默契:以装备并操作大量美制武器系统

极目新闻 浏览 1626

钟楚曦过往争议被扒,对苗苗黑脸、戛纳霸占楼梯,一进圈就有野心

萌神木木 浏览 3608

后排配娱乐屏/还有拖挂资质 理想i6将于9月26日上市

网易汽车 浏览 4575

湖南慈利通报“网友反映因瓶装液化气销售价格引发矛盾、广告牌被损毁”:相关部门已介入调查

环球网资讯 浏览 3870

徐峥这一出手,若不出意外,这部耗资7亿的大片估计得“封神”

娱乐圈笔娱君 浏览 2363

吉利陈奇:L3全场景普及仍需时间,安全与成本平衡是行业关键

网易汽车 浏览 3519

50+女人的穿搭封神技巧来了,抓准这4点,轻松穿出简约高级感

静儿时尚达人 浏览 2650

印度商人:有中国就不怕美国加税 中印本应并肩作战

澎湃新闻 浏览 8582

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 3822

重兵集结下美伊本周再谈 特朗普面临两个选择

澎湃新闻 浏览 2082

谷歌间接承认 Tensor G5 芯片 GPU 问题

IT之家 浏览 3600

斯坦福MLE-Smith:自动生成机器学习竞赛题目

科技行者 浏览 3560

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 2715

最高8.8分!盘点2025年评分最高的10部电影

林木体育解说 浏览 2718

雷克萨斯NX绝色限定版上市 售价30.96万起

车质网 浏览 2667

售价8.88万起 RELY威麟R08上市

功夫AUTO 浏览 4535

特朗普为何在最后时刻缩水降级“加冕典礼”?

浏览 25412

警方通报荣梓杉李禹熹纠纷

韩小娱 浏览 3380

丹麦增兵格陵兰岛 欧洲多国派兵

央视新闻客户端 浏览 2137
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1