关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2679人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

你的高级感,烟管裤轻松搞定!

Yuki女人故事 浏览 452

DO:谢菲联与曼城就租借菲利普斯达成协议,球员将接受体检

懂球帝 浏览 2459

每体:老佛爷想立即解雇阿隆索,但身边人士说服他不让其下课

懂球帝 浏览 2959

1-8月酒饮料茶行业利润增速19.9%,白酒行业迎来困境反转了吗?

郭施亮 浏览 4258

男子醉驾撞死女教师获刑两年半 事发地附近有两所学校

扬子晚报 浏览 31029

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 8667

张本智和惨遭逆转!痛失4个赛点+连丢3局,无缘法国冠军赛男单8强

乒谈 浏览 3555

美国中央司令部透露对伊朗动武全部武器装备清单

参考消息 浏览 1906

Perplexity Comet浏览器iOS版发布,AI驱动超厉害!

IT之家 浏览 1712

绕开监管突破24%限制 分期商城变相放贷息费高达60%

南方都市报 浏览 3005

苏州大学突破:AI评判官能评估人工智能的记忆管理能力吗?

科技行者 浏览 2497

马切吉亚尼:迈尼昂扑点的秘诀是米兰的门将教练菲利皮

懂球帝 浏览 3454

辛纳晋级中网男单八强

体坛周报 浏览 4054

GEO炒出了个大乌龙,301171,20CM跌停!

看财经show 浏览 2500

3人救落水女子4人均遇难 救援人员:水情复杂还有旋涡

极目新闻 浏览 58915

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者 浏览 3426

净利润减少超50%,珍酒李渡能靠“大珍”走出低谷吗?

征探财经 浏览 1954

官方:斯特拉斯堡中场帕普-迪奥普租借加盟图卢兹

懂球帝 浏览 2747

姚期智:我们建成了世界上最好的量子实验室之一

上观新闻 浏览 4290

空姐穿毛衣上班,被吐槽“很土”?

正解局 浏览 2771

媒体:欧洲在委主权问题上"选择性失语" 很快遭遇反噬

极目新闻 浏览 13167
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1