关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2653人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 2425

东风奕派2026款纳米01、2026款eπ008五座版上市

网易汽车 浏览 3769

鲁比奥称对巴拿马涉港口裁决感到振奋 外交部回应

北京日报 浏览 94417

看王玉雯穿抹胸出席活动,才知啥叫倾国倾城

喜欢历史的阿繁 浏览 2551

男乒横扫韩国打出最佳状态!林诗栋提升两点,梁靖崑找回熟悉感觉

篮球资讯达人 浏览 229

新不如旧!这4件时髦“旧衣服”今年太火了

LinkFashion 浏览 2536

特朗普专机着陆区附近发现"狩猎架" FBI证实介入调查

红星新闻 浏览 9138

印尼总统:已准备好向加沙派遣维和部队

环球时报国际 浏览 4268

奇瑞再次否认与追觅合作:双方并未进行合作签约

IT之家 浏览 2801

妈妈辈如何穿出“贵气感”?4个打扮习惯,轻松提升优雅气质

静儿时尚达人 浏览 3708

塞维利亚总监:没有薪资空间引入拉莫斯,目前不考虑补强中卫

懂球帝 浏览 2373

副院长传出不雅视频后赴外地坐诊引争议 当地医院删文

红星新闻 浏览 13917

枭龙突防S-400:中械武器如何改写印巴冲突

浏览 7602

账面资金高达43亿,却要募集13亿,这家老牌企业差不差钱?

IPO日报 浏览 3660

限时6.58万起 2026款吉利星愿正式上市

网易汽车 浏览 3942

科学家发现世界最大蜘蛛网 面积约106平方米

极目新闻 浏览 8827

全红婵夺金 新搭档身份不简单 赛后发文信息量大

白面书誏 浏览 3393

理想汽车1月销量跌破3万辆,同比、环比均下滑!

车秀小咖 浏览 2390

全系四驱/全新三电/全套华为 岚图追光L开启预订

网易汽车 浏览 4256

她复出拿奖,这次没人笑得出来

独立鱼 浏览 3491

首拍飙至数千万元的“京东第一车”,最低4.54万元就能买到?

都市快报橙柿互动 浏览 3373
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1