关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者769人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄军称再拿下哈尔科夫地区一村庄

每日经济新闻 浏览 10816

60岁陈冲不服老 腰细腿长身材一点没走样

双鱼爱畅谈 浏览 19761

马航MH370重启搜索方案披露 囊括未探及新区域

红星新闻 浏览 84446

芬兰将举行多场联合军演 俄芬关系再度紧张

国际在线 浏览 671

独一无二,世界巨星蒂尔达·斯文顿卓越之作!

幕味儿 浏览 791

王家卫持续被扒

萌神木木 浏览 687

特朗普称俄为"纸老虎" 普京回应

央视新闻客户端 浏览 905

赵丽颖和冯绍峰离婚,汪峰演唱会又没上热搜

趣看热点 浏览 26530

春敏,可不是单纯的皮肤敏感!

时尚COSMO 浏览 11664

李光洁隋雨蒙七夕官宣有二胎 女方挺孕肚比耶灿笑

网易娱乐 浏览 15226

54岁闫妮和27岁女儿同框,母女性格相似如姐妹

小咪侃娱圈 浏览 846

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 4546

图片报:赫内斯、图赫尔等人在拜仁引援会议上讨论了金玟哉

直播吧 浏览 16268

日均不到1000元机器人带回家?智元为机器人租赁市场带来“令人心动的offer”

时代财经 浏览 744

44岁杨怡拍戏生图很惊艳!入戏太深表情不忿,网友怕她要扇店员

文艺圈娱乐号 浏览 12964

德章泰-穆雷、吹羊、杰伦-约翰逊同砍至少25分5助 老鹰队史首次

直播吧 浏览 12478

加拿大德比:巴雷特37-3碾压维金斯创3项纪录 成灭勇士头号英雄

醉卧浮生 浏览 12654

中恒电气:两款旗舰产品发布,重新定义AI数据中心供电技术标准

览富财经网 浏览 719

小川航基:没赢下巴拉圭心有不甘;对阵巴西的机会肯定会更少

懂球帝 浏览 970

传祺向往系列的“降价术”:低配车型弱化华为标签启用Momenta智驾

经济观察报 浏览 995

街边大排档,涌进商场做“漂亮饭”

餐饮老板内参 浏览 1518
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1