关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2471人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美军是怎么抓走马杜罗的

澎湃新闻 浏览 2686

2026纽约秋冬时装周,在春天开启美的新故事!

LinkFashion 浏览 2040

媒体:特朗普一口气狂退66个群 还有更多在"排队"审查

上观新闻 浏览 13607

“男人的衣柜”跨界卖水?

诗与星空 浏览 2983

马杜罗在出庭期间在纸上做笔记 对旁听席说"新年快乐"

环球网资讯 浏览 6246

梦碎IPO,又一大忽悠炸雷了

投资家 浏览 3519

人工智能的财富潮水,开始向“瓶颈”处流动

锦缎研究院 浏览 800

知情人曝李昀锐孟子义真谈了!狗仔疑似发文内涵,太多细节藏不住

萌神木木 浏览 3964

女儿手指被门框划伤 父亲获赔后转手捐出

1818黄金眼 浏览 13570

跟队记者:柯蒂斯-琼斯回归利物浦合练,伊萨克仍缺席

懂球帝 浏览 3561

继与霉霉恋情谣言后,里弗斯被传约会网红

艺兔体坛 浏览 2722

来搞笑的?超级杯花名册漏洞百出:照片古早且粗糙,译名叠词

懂球帝 浏览 1945

“电池车”全面压过“发动机”一头?油车时代的辉煌,被彻底终结

少数派报告Report 浏览 3079

这个赛季,NBA的玄学将被终结

虎嗅APP 浏览 3678

沙特大幅下调旗舰原油溢价至五年低点,全球供应过剩压力显现

华尔街见闻官方 浏览 3156

雷军:第一代小米SU7已停售!

大象新闻 浏览 2395

黄金有关税收新政落地首周,市场各方反应如何?

中国商报 浏览 3479

媒体:美伊紧张局势拉满 沙特、阿联酋对美国"亮红灯"

上观新闻 浏览 21912

抖音:卖茅台低于市场行情价将被处罚

第一财经资讯 浏览 3472

增持回购潮背后的A股信心

北京商报 浏览 3238

揭密!中国导弹为何飞越北极圈,不走太平洋

浏览 7726
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1