关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2484人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年冬天一定要拥有这4件“大衣服”,松弛又好看!

LinkFashion 浏览 3114

巴基斯坦与沙特阿拉伯签军事协议 多国受震动

环球网资讯 浏览 4502

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

LinkFashion 浏览 2152

美财长公然挑拨中阿关系:米莱承诺"让中国退出阿根廷"

环球网资讯 浏览 6626

CDS复兴?“AI发债潮”重燃了市场的“次贷回忆”

华尔街见闻官方 浏览 3499

何超莲窦骁,婚变风波后首次同框

喜欢历史的阿繁 浏览 3488

一集封神,收视率暴涨,这剧赢麻了

独立鱼 浏览 3388

《树影迷宫》给10位演员演技排个名

皮皮电影 浏览 3439

诺贝尔经济学奖获得者放话:欧洲不能让中美赢了

澎湃新闻 浏览 9052

空客天津第二条总装线投产,称产能提高需联合各方构建更具韧性的供应链

澎湃新闻 浏览 3748

朱江明回顾零跑造车十年:“九死一生”,最艰难时刻曾自掏腰包发工资

红星资本局 浏览 2902

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者 浏览 3501

不确定的时代里,亚马逊广告如何重构确定性?

有数DataVision 浏览 2943

62岁何赛飞的“真实”,让多少明星“无地自容”

可乐谈情感 浏览 3666

韩素希再谈与柳俊烈李惠利争议:还能怎么办呢

韩小娱 浏览 2582

海外市场成行业“香饽饽”,小米汽车也想“分一杯羹”

雷达财经 浏览 233

守护行人安全 四川省人大代表韩华亮建议:制定管理细则,提高电动车违法成本|代表在这里

封面新闻 浏览 2458

波兰外交部称有炮弹击中该国驻乌克兰大使馆

极目新闻 浏览 4276

美国要“收回”阿富汗空军基地 阿政府断然拒绝

环球网资讯 浏览 4511

AI+消费电子硬核“出圈”,华强北亮相CEIC 2025

南方都市报 浏览 3616

天空体育记者:维拉不会在转会截止日带来惊喜

懂球帝 浏览 2381
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1