关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3480人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普呼吁立即停火 遭俄方坚决驳斥

财联社 浏览 3701

年度最扎心电影,看得中年男女坐立难安

Yuki女人故事 浏览 2629

平台终端双落地,河南移动数智赋能低空经济产业园

大象新闻 浏览 4098

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 189

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

伊周潮流 浏览 2422

恰逢成都保卫战30周年,2025老甲A12月8日在成都双流开赛

懂球帝 浏览 3486

太空“4S店”要开张:Starfish验证“单眼”卫星交会PRO操作

IT之家 浏览 3047

《四喜》的妈圈生存指南:没有全福,只有幸存

仙女事件簿 浏览 3409

美媒探访内蒙古:中国AI的一张“王牌”,藏在这里

观察者网 浏览 3077

我用1秒成为陈妍希梦女,你也来试试吧

时尚COSMO 浏览 3049

25岁女孩海岛求生赛吃老鼠蜈蚣 35天暴瘦28斤

潇湘晨报 浏览 7994

AI首个「铁饭碗」:在浦东美术馆,我用豆包跟毕加索聊了一上午

雷科技 浏览 2624

审美倒退30年?舒淇却被全网夸爆了

Yuki女人故事 浏览 736

每体:多家俱乐部提出租借巴尔德吉,弗里克暂时希望他留队

懂球帝 浏览 3531

每秒可传 1250 万部高清电影,亚马逊启动跨大西洋海底光缆项目

IT之家 浏览 3405

爱泼斯坦死亡疑云再添关键爆料人 其身份被证实为狱警

扬子晚报 浏览 4731

还在磨合纽卡夏窗花近2.8亿欧,英超开局仅1胜3平1负排第13

直播吧 浏览 4406

福建舰更多细节公布 一组动图全方位看清楚

央视新闻客户端 浏览 2685

唐嫣罗晋恩爱人设崩塌了!夫妻常年两地分居,全靠女方一家带娃

萌神木木 浏览 3810

汪小菲罕见亲晒儿子正脸照,眉眼像极了大S,凸牙问题还没改善

萌神木木 浏览 3776

北京105-74广东3利好!曾凡博+斯佩尔曼轰最佳状态,三分联盟第1

篮球资讯达人 浏览 2838
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1