关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2473人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

徐洁儿浪姐的“三字诀”,稳、飒、燃

醉卧浮生 浏览 1070

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 3150

大疆最大对手,要IPO

投资家 浏览 2659

“羽绒服+半身裙”,混搭风太好看了!保暖又气质!

Yuki女人故事 浏览 2774

山东99-75宁波3喜1忧!高诗岩陈林坚太关键,王证神射,2外出隐患

篮球资讯达人 浏览 2547

利物浦女足前主帅比尔德的葬礼举行,超过六百人参加

懂球帝 浏览 3738

托辛:很荣幸在队内是资深球员;“叔叔”的外号来自马杜埃凯

懂球帝 浏览 3591

伊朗外长在敏感时刻访问中国 美国最不愿看到局面发生

军武咖 浏览 13687

OptiScaler发测试版:抢跑AMD为Vulkan游戏开启FSR 4

IT之家 浏览 2070

瞄准2028年重要选举 郑丽文最新表态

新京报政事儿 浏览 8532

重庆女孩不会杀猪上千网友驱车帮忙 有人白送9头活猪

极目新闻 浏览 12532

荣梓衫工作室回应偏轨事件,暴力行径揭露阴暗面

二凯训猛犬 浏览 3800

64岁关之琳现身南京眼镜店,与老板娘喝下午茶

涵豆说娱 浏览 3881

致敬经典车型 宾利飞驰三款特别版官图发布

车质网 浏览 3393

友人追忆杨振宁:他其实还有一个遗憾

大象新闻 浏览 3728

天越冷社交欲望越低,是我的问题吗?

时尚COSMO 浏览 3097

怒批9人摆烂!穆帅不惧球员造反:你爸一直对你好? 4轮0分非末日

风过乡 浏览 3349

泽连斯基:俄罗斯正为更大规模冲突做准备

红星新闻 浏览 5510

最火的赛道,独角兽撑不下去了?

中国新闻周刊 浏览 2870

官方:31岁巴西中场杜黄轩获得越南国籍,1月可为越南队出战

懂球帝 浏览 3768

陈丽华告别仪式举办 马德华:迟重瑞心里很难过

大象新闻 浏览 59881
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1