关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2447人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德转为金球奖竞争评级:登贝莱最被看好,亚马尔为最大竞争对手

直播吧 浏览 4603

英媒:面对美国 欧洲领导人"必须学会反击"

环球网资讯 浏览 7919

多家银行关停旗下App,银行App关闭潮意味着什么?

江瀚视野 浏览 3867

特朗普:美国还将增加航空母舰数量

每日经济新闻 浏览 2820

81岁冯淬帆去世,曾悼念许绍雄时自曝已病入膏肓,苟延残喘的活着

扒虾侃娱 浏览 3446

青海女官员于媛媛被"双开":生活奢靡 大搞权钱交易

鲁中晨报 浏览 9559

辽宁88-61山东迎3喜1忧!原帅付豪成支柱,对阵广东内线引担忧!

篮球资讯达人 浏览 3443

英特尔怒涨逾12%!标普500、纳指再创新高,油价回落

第一财经资讯 浏览 302

积压7年,张若昀新剧《完美证据》终于来了!

娱乐圈笔娱君 浏览 2000

机密报记者:苏契奇因纪律问题落选国王杯大名单

懂球帝 浏览 3114

中国9系新旗舰 长城魏牌V9X正式亮相

网易汽车 浏览 1821

AI杀入美股,DeepSeek又是第一!港大90后开源,AI股神人人都能造

新智元 浏览 3548

今年双11,搞出了点新意思

虎嗅APP 浏览 3455

何超莲评论区沦陷!跟窦骁结婚后态度变化大,遭讨伐骗婚功利心重

萌神木木 浏览 3699

窦泽成下赛季重返美巡赛

体坛周报 浏览 3710

小个子秋季穿搭指南!7件单品穿出大长腿,显高10cm

Yuki女人故事 浏览 5729

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 3699

杨振宁逝世享年103岁 清华大学沉痛悼念

北京青年报 浏览 3890

泽连斯基:乌克兰计划2027年加入欧盟

财联社 浏览 6283

他入行30年不温不火,回村务农却火了

艳儿说电影 浏览 3590

或2026年发布 全新大众T-ROC R渲染图曝光

车质网 浏览 3428
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1