关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3486人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

便宜几千块!三星家电撤出中国后,闲鱼上的「骨折价」值得买吗?

雷科技 浏览 251

韩安冉自曝新男友为她花了十几万,两人交往仅一个多月

扒虾侃娱 浏览 220

强硬夺权、父子决裂!84岁“鞋王”何以至此?

无冕财经 浏览 2636

这些才是适合普通人的穿搭!多穿基础款和半身裙,简约又得体

静儿时尚达人 浏览 3451

太癫了,又一个国民女神翻车了

独立鱼 浏览 3756

美媒:用S-400换F-35 美国逼土耳其“二选一”

环球网资讯 浏览 3024

文班亚马新赛季满血回归 马刺是最被低估球队?

体坛周报 浏览 3635

6000万贱卖总部大楼,“中国催收大王”也被催收了…

深蓝财经 浏览 2968

散户转移战场、交易量枯竭:加密行业的“静默调整期”

智通财经 浏览 2422

泽连斯基:乌谈判团队将于2日晚前往乌美俄三方会谈地点

国际在线 浏览 2451

是时候考虑购买美国大豆了,为了“拴住”特朗普!

北向财经 浏览 3496

国盾量子董事长吕品去世:上任半年多 年仅46岁

时代周报 浏览 3040

中期改款奔驰AMG SL曝光 前脸焕新 依旧多种动力

汽车公告板 浏览 2556

“沙僧”刘大刚去世!生前最后露面消瘦,去年师徒合体表演成绝唱

萌神木木 浏览 3461

节后戒断太难,屏障修复实验室自有招

时尚COSMO 浏览 3155

宁德联手紫金,打得过王传福和他挖矿的表哥吗?

蓝鲸新闻 浏览 1107

跑调风波越演越烈!沈佳润被网友喊话

萌神木木 浏览 2811

柬埔寨"太子集团"资产又遭冻结 豪车公寓总值超35亿元

红星新闻 浏览 15242

科技股重挫,Meta大跌12%,B站、百度跌超4%,加密货币21万人爆仓

21世纪经济报道 浏览 3545

日本自民党高官窜访台湾 外交部:"媚日谋独"令人不齿

澎湃新闻 浏览 8137

热议中超:恶心国安放水,西海岸和英博值得尊重

懂球帝 浏览 3672
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1