关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3436人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梦碎IPO,又一大忽悠炸雷了

投资家 浏览 3512

陈赫庆生照里看不到鹿晗?

韩小娱 浏览 3370

一天两枚火箭发射失利 中国航天科技集团发文回应

每日经济新闻 浏览 6820

富勒姆出价3500万英镑求购鲍勃

体坛周报 浏览 2573

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 2418

“港版淡马锡”撑腰,大模型第三股要来了?前微软副总干出业内最强商业化

财通社 浏览 206

在特斯拉model Y和小米 YU7里二选一,怎么选?

蜗牛车志V 浏览 2614

媒体:中东欧三国欲组队 在欧盟内部对援乌政策"掀桌"

上观新闻 浏览 10008

老娘们不会完蛋的

江湖人称艾掌门 浏览 3371

增长神话暂停,理想“尖子生”光环失效?

Tech星球 浏览 3010

五粮液是会计差错还是财务造假?

诗与星空 浏览 319

2025年利润在4%徘徊,车圈是从从容容还是连滚带爬‌?

禾颜阅车 浏览 2961

桂林银行网点开到居民家里?

财经众议院 浏览 2033

奥特曼零食之父,要去IPO了

投资家 浏览 3472

理想汽车,又打了一场翻身仗?

电动势 浏览 3584

风云T9L全解析:“理工男”的浪漫情怀该如何表达?

汽湃 浏览 323

俄乌两国元首新年同时强硬 泽连斯基邀特朗普"直飞"乌

上观新闻 浏览 17847

习惯一身黑的穿搭?其实换一种穿衣思路更高级,养眼又有活力

静儿时尚达人 浏览 294

亚之杰李军举报歌手陈红,控诉数十亿资产遭违法掠夺!

市值Observation 浏览 4404

小鹏 P7+ 汽车累计交付 8 万台

IT之家 浏览 3698

美驱逐舰拦截一艘驶往伊朗港口油轮

财联社 浏览 488
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1