关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12395人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

稳定输出!杜兰特半场10中7拿到14分 正负值+14

直播吧 浏览 13580

《鱿鱼游戏2》官宣新演员阵容,吸毒艺人TOP也参演

网易娱乐 浏览 15911

三方会谈近10小时,亚阿两国同意暂时停火

趣看热点 浏览 25950

丽贝卡·弗格森回归《碟中谍7》全新大片优雅华贵

桃桃淘电影 浏览 16654

网曝大S不止一次流产 因汪小菲不堪对话而离婚

网易娱乐 浏览 19238

罗永浩还了4个亿是真的吗?他还要拍一部纪录片叫真还传

趣看热点 浏览 26280

林子祥和学生结婚,78岁开演唱会,依然一票难求

犀利辣椒 浏览 835

雷军称小米SU7尾标已修改,修改方案公布

界面新闻 浏览 12081

美国威尔明顿发生一起车祸 总统车队一汽车被撞

央视新闻客户端 浏览 13027

太离谱!董路:对手喊来说是10年龄段的球员,结果赛后自己开车走

直播吧 浏览 15495

云南部署打击电诈 政法委书记、公检法一把手均到会

政知新媒体 浏览 87150

泽连斯基:俄乌停火只会让俄方受益

财联社 浏览 12553

英国代表:中方加入美俄裁军“有利于战略稳定”

观察者网 浏览 25925

卸行政职务后郑强重回学术界:以通讯作者身份在国际刊物发文

澎湃新闻 浏览 12624

杨澜晒护照否认移民传闻:我一直都是中国公民

网易娱乐 浏览 18959

全新前脸/三种座椅布局可选 第三代豪越L内外饰曝光

网易汽车 浏览 813

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 990

"富豪"承诺月嫂月薪1万5却1年只发5500 还向她借85万

极目新闻 浏览 3294

马斯克宣布2岁柴犬是推特新CEO 称盈利后出售推特

译言 浏览 19208

跻身世界第一梯队!这一行业,迎爆发风口

环球网资讯 浏览 938

迪士尼,10亿美元投资OpenAI

中国基金报 浏览 41
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1