关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2481人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 3550

马斯克称新款特斯拉Roadster是“超越汽车范畴的特殊产品”

IT之家 浏览 4575

TA:从进攻核心到压迫发起点,梅西角色延伸提升球队上限

懂球帝 浏览 3216

搭载VLA大模型 魏牌全新蓝山智能进阶版年内上市

网易汽车 浏览 3085

狂发钱的元宝派,除了领红包还能用来干嘛?

量子位 浏览 2397

缅北四大电诈头目被押解回国 特写画面首次披露

大风新闻 浏览 8330

宗馥莉,抛弃娃哈哈?

豹变 浏览 4273

白银LOF变成了一种分级B

远川聊资管 浏览 2395

赵少康称"很多人想退党" 黄建豪:应给郑丽文时间调整

海峡导报社 浏览 8389

1200亿天价订单疑云:宁德时代为何押注一家“小公司”?

野马财经 浏览 2623

一家4口爬山妻子坠亡 警方排除他杀可能:属于高空坠亡

极目新闻 浏览 41885

国庆可提车 吉利银河星耀6先享预售价7.98万元起

网易汽车 浏览 4318

媒体:美方28点计划引全球哗然 泽连斯基将背负骂名

经济观察报 浏览 15264

《寻秦记》成为香港影史首日最高开画票房冠军

皮皮电影 浏览 2686

【原声】阿韦洛亚,最后一个穆里尼奥主义者

体坛周报 浏览 2489

NVIDIA 向英特尔投资 50 亿美元 共同开发 AI 基础设施和个人计算产品

经济观察报 浏览 4471

记者:卡里克处于竞争曼联正式主帅的有利位置

懂球帝 浏览 2569

萨莫拉诺:巴萨必须引导好亚马尔,从没听过梅西说皇马偷窃

懂球帝 浏览 3379

瓜迪奥拉:胡桑诺夫明天可上场踢几分钟;罗德里还没完全恢复

懂球帝 浏览 3660

郑丽文再次公布人事任命朱立伦尴尬了 洪秀柱罕见喊话

策略述 浏览 9487

2025年的中国车市,教会了合资车企如何生存

汽车公社 浏览 2716
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1