关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者785人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

塞总统:"过去没有、将来也不会"供乌武器和弹药

海外网 浏览 19119

初中学历的男子冒充富二代跟20多名女性交往,其中有一位女性被诈骗900多万

趣看热点 浏览 1025759

邮报列利物浦六大中场引援目标:帕利尼亚、杜库雷在列

直播吧 浏览 14539

他是80年代当红小生因"高大泉"成名,女儿竟是她

我是娱有理 浏览 16647

南部战区:中方参演部队已从军港出征

政知新媒体 浏览 1032

赵继伟三分16中8爆砍37分 一战创两项生涯纪录

网易体育 浏览 26739

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 833

乌军反攻进展比预期慢 美军最高将领:毫不惊讶

看看新闻Knews 浏览 15846

张柏芝与向太的关系彻底崩塌?

涵豆说娱 浏览 1423

忘切号了?桑乔社媒发文鼓励自己后,又用自己账号留言

懂球帝 浏览 1071

千人来珠峰"逛公园" 有人冻到绝望:以为要永远留在这

新京报 浏览 16594

韩国房价犹如过山车,大起大落背后是什么原因?

界面新闻 浏览 16407

俄无人机救下一名正遭乌军性侵女子 顾不上提裤子拔腿就逃

大象新闻 浏览 1020

美媒称美国允许乌对俄使用远程导弹 特朗普:假新闻

界面新闻 浏览 834

小米汽车事故后甩锅,真诚真的难吗?

宏哥谈商道 浏览 967

出圈1年多后流量下滑?刘畊宏回应

新金牌娱乐观察家 浏览 13354

波兰官员称中方不愿迫使俄结束乌克兰危机 外交部回应

澎湃新闻 浏览 1533

普通人还是更适合日系穿搭 小个子也能撑得起来

Yuki时尚酱 浏览 14916

关晓彤照片打码 不敢大方和鹿晗秀恩爱?

传媒一班 浏览 15921

美国政府宣布美英就药品定价达成原则性协议

华尔街见闻官方 浏览 260

略伦特:也许由于前几天的事,今天我们更有动力

懂球帝 浏览 12389
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1