关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者781人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从“白幼瘦”到“气血感”,审美标准终于“健康”了?

Yuki女人故事 浏览 230

实探安世半导体东莞工厂:限制出货 员工将"上四休三"

每日经济新闻 浏览 5838

当“中国表格之王”开始发力多维表格

硅星人 浏览 842

京东工业港股上市首日平收,收报14港元/股,为刘强东第六家上市公司

红星资本局 浏览 54

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

静儿时尚达人 浏览 530

“格子衬衫”浓度降低 7年云栖感知科技的温度丨去现场 做原创

封面新闻 浏览 635

方程豹首款车型“豹5”正式发布,“豹9”概念车同步亮相

界面新闻 浏览 14539

孙颖莎生日晒与父母合照,一家三口共用一张脸

观察鉴娱 浏览 704

拜登宣称:将“很快”前往越南

海外网 浏览 14499

已生龙凤胎?何超莲近照曝光 身材纤瘦力破谣言

扒虾侃娱 浏览 16220

中信证券被传停暂停融券业务 回应:绝无此事

财联社 浏览 12414

媒体:美防长住ICU多日拜登毫不知情 让人难以置信

上观新闻 浏览 12954

9系大六座旗舰SUV又添一员,智己LS9预售33.69万起

网易汽车 浏览 695

俄外交部:扎波罗热核电站归属俄罗斯不容置疑

上观新闻 浏览 1586

周末穿搭!7套look,随便搭都好看!

美芽 浏览 15959

中甲综述:广西平果哈嘹5分领跑 广州队收获赛季主场首胜

直播吧 浏览 15336

中老年女性穿衣如何优雅?跟着索菲亚王后学穿搭

巧百搭 浏览 15025

细节优化,2025款大众高尔夫GTI实车图像曝光

天天汽车 浏览 12571

谷歌百人“复仇者联盟”出击!将发对标GPT-4的大模型

智东西 浏览 14326

俄副总理称亲自参战:用狙击步枪在乌军袭击时还击

鲁中晨报 浏览 656

油炸知了成网红美食:千人上山抓蝉 金蝉价格10年涨5倍

红星新闻 浏览 86848
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1