关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3481人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

视频:单日发射数百架 俄乌无人机互袭更趋激烈

环球网资讯 浏览 2715

官方确认:歼10CE在空战中击落多架战机

北京青年报 浏览 2667

怼人上瘾?特斯拉官微把非智能车贬得一文不值,车主一点面子不给

小李车评李建红 浏览 2954

上市近30年终落幕,天茂集团主动退市

虎投邦 浏览 3826

剖析智元机器人:一场关于人才与资本的博弈

虎嗅APP 浏览 3724

股票涨停 360三季度净利润同比扭亏为盈

中国经营报 浏览 3497

五十岁的女人,牢记这 “三不穿”,便能轻松平衡优雅与减龄

静儿时尚达人 浏览 5429

官方:勇士正式签下塞斯-库里,后者将身披31号球衣

懂球帝 浏览 3063

看了隆妮表演才知道,观众都冤枉杨幂了?

霁月文娱阁 浏览 3803

瑞信前副总裁挪用客户资金,判囚13年,24名高净值人士获赔8690万

财通社 浏览 2653

伊朗局势趋紧 美国从黎巴嫩撤人

澎湃新闻 浏览 2025

杀进世乒赛四强!国乒男团3-0复仇韩国,林诗栋+梁靖崑同时立大功

侃球熊弟 浏览 233

致态 TiPlus 7100s 固态硬盘发布:长江存储新一代颗粒,659 元起

IT之家 浏览 3407

王家卫繁花有黑幕!?

八卦疯叔 浏览 4400

董路:日本队6届世界杯过不了16强 跟国足24年无缘世界杯一样痛苦

风过乡 浏览 3700

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 8670

司晓迪扯出内娱灰产,难怪王大发连夜起诉割席,网友呼吁整治内娱

萌神木木 浏览 2027

伊姐十一热推:电视剧《沉默的荣耀》;电视剧《是风动、是心动》......

伊周潮流 浏览 3201

章子怡晒照为女儿醒醒庆生!

韩小娱 浏览 2300

媒体:中东欧三国欲组队 在欧盟内部对援乌政策"掀桌"

上观新闻 浏览 10011

印度总统乘坐“阵风”战斗机进行飞行体验

环球网资讯 浏览 3478
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1