关闭广告

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者2321人阅读


这项由首尔大学、韩国科学技术院(KAIST)和德国图宾根大学联合完成的研究发表于2026年的ICLR(International Conference on Learning Representations)会议,论文编号为arXiv:2602.01984v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你同时向AI展示几张照片并提问时,是否发现它有时会把不同照片的内容混淆?比如你问"第一张图片里有没有自行车",它却回答了第二张图片的内容。这种现象就像一个健忘的朋友,明明你分别给他看了几张照片,他却总是把照片内容记混。

这个看似简单的问题背后,其实隐藏着现代AI系统的一个关键技术挑战。当前最先进的多模态大语言模型(就是那些能同时理解文字和图片的AI系统)在处理单张图片时表现卓越,但一旦面对多张图片,性能就会显著下降。这种现象被研究人员称为"跨图像信息泄露",就好比厨师在做菜时,明明准备了不同的食材放在不同的盘子里,但在烹饪过程中却总是搞混各种调料的归属。

为了解决这个问题,现有的AI系统都会在每张图片前后插入特殊的"分隔符",就像在文档中使用分页符一样

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外媒:特朗普反复威胁 欧洲领导人已感到厌倦

参考消息 浏览 14449

SK海力士因环保问题被罚26.4万

雷达财经 浏览 3770

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 2591

匹克被指要求拒绝降薪员工写检讨否则就停薪 当地回应

上游新闻 浏览 8992

就两岸关系 郑丽文、马英九最新表态

新京报政事儿 浏览 8389

戚薇夫妻现身机场!李承铉穿泰迪熊大衣一头白发

料峭春寒洞 浏览 2421

马筱梅不再隐瞒!直播掀上衣展示孕肚

老塕是个手艺人 浏览 2939

《再见爱人5》收官,评论区被骂翻

白面书誏 浏览 2646

孙俪、罗晋53集都市职场剧,阵容强大,值得一看

楠鱼 浏览 4418

或预示未来设计风格 现代汽车发布全新硬派SUV概念车

乐选爱车 浏览 3068

俄军连续45天被机枪火力压制 乌军"秘密武器"被披露

环球网资讯 浏览 2539

AI驱动产业升级 全屋智能迈入生态竞争新阶段

封面新闻 浏览 1778

当智能体爆发在即,数据库如何成为“发动机”?

科技行者 浏览 2597

美政府停摆15天白宫放话要裁1万人 女法官颁令叫停

红星新闻 浏览 8875

华为鸿蒙 HarmonyOS 6.0.0.107 SP7 / SP5 Developer 版本发布

IT之家 浏览 3780

今年冬天最火搭配:毛衣+毛衣,放松穿更好看!

LinkFashion 浏览 2542

特朗普转发针对古巴强硬言论:鲁比奥将成"古巴总统"

环球时报国际 浏览 12082

今年春夏一定要有“这件衣服”,高级又气质!

LinkFashion 浏览 738

泰柬冲突柬方70人死伤 泰国近20万人住进避难中心

财联社 浏览 3132

若羽臣:抖音已成为公司重要渠道之一

北京商报 浏览 2590

仅用一周时间,谷歌就让OpenAI认清现实

字母榜 浏览 2529
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1