关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3445人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国“福特”号航母驶往加勒比海

上观新闻 浏览 3440

采用SSP全新平台 新款奥迪A4最新消息曝光

乐选爱车 浏览 3882

OpenAI确认旗下首款AI硬件今年发布,形态有望为“一支笔”

IT之家 浏览 2534

自称快19岁女子诞下女婴被医生违规抱养 医院5人被罚

大风新闻 浏览 7913

外观微调配置全面 小鹏P7+新老款车型对比

车质网 浏览 2453

研究领军人物告别一线!广发证券全球首席沈明高到龄卸任

券商中国 浏览 2372

2026款奥迪Q6上市!售46.76万起 车长5099mm比Q7还大

念寒车评 浏览 2667

重庆飞三亚航班紧急返航 乘客:听到广播才知出故障

封面新闻 浏览 17943

岛内学者:若赖清德无法降低两岸紧张 特朗普会不开心

海峡导报社 浏览 8984

E句话| 他们将补办婚礼?

仙女事件簿 浏览 3115

性能再升级 保时捷911 GT3 Manthey官图发布

车质网 浏览 3199

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

扬子晚报 浏览 10144

斯基拉:萨索洛换帅考虑米兰旧将阿巴特

懂球帝 浏览 733

成败AI:谷歌市值超越苹果

北京商报 浏览 2626

"特朗普黄金卡"正式接受申请 从500万降至100万美元

国是直通车 浏览 19778

拒绝被逆转,曼联本赛季英超领先后保持不败

懂球帝 浏览 3496

“棋子部署就位” 美国为何执意搅动加勒比海

上观新闻 浏览 3306

前三季度海洋生产总值7.9万亿元 同比增长5.6%

央视财经 浏览 3604

9岁小酒窝,大大方方成顶流

时尚COSMO 浏览 3154

11国将承认巴勒斯坦国之际 美国追加60亿美元对以军售

界面新闻 浏览 21543

小米汽车直播间遭网暴,仅剩一家门店直播,雷军抖音账号半个月掉粉30万

红星资本局 浏览 3723
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1