关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12416人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

向佐一家四口逛迪士尼,郭碧婷坐儿童推车太搞笑

倩倩生日 浏览 12795

广东晋级决赛杜锋谈辽粤大战:广东后场接过接力棒,传承篮球使命

篮球资讯达人 浏览 642

今年冬天一定要拥有这4件“大衣服”,松弛又好看!

LinkFashion 浏览 199

美国政府效率部提前解散

北京商报 浏览 389

百慕大短裤,赫本穿的时髦且高级!

Yuki女人故事 浏览 11280

没钱了!沙特记者:沙特联告知利雅得胜利,分配的转会预算已用尽

直播吧 浏览 14389

马祖拉:没人能防住东欧 他们一定会得分的 要把比赛看作一个整体

直播吧 浏览 10677

4大最新信号!出手“黄金坑”的机会来了?

小白读财经 浏览 958

宝利德破产听证后官司缠身 昔日豪车经销商驶向何方

财闻 浏览 576

黄学东告别信首发!微软30年老将出走,担任Zoom CTO,瞄准AI+AR

新智元 浏览 16579

以军称开始重新执行加沙停火协议

上观新闻 浏览 748

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

澎湃新闻 浏览 694

避险情绪弥漫 比特币12月开局闪崩

北京商报 浏览 247

飞檐走壁"猴哥"闯进小区多日 居民开启直播播报其行踪

极目新闻 浏览 5481

“女足活力玫瑰课堂”走进乡村校园,刘青、李琳等球员参与

懂球帝 浏览 13640

业绩失速,传音控股盯上非洲“电驴”

斑马消费 浏览 71

智界S7交付困难,另有隐情?不是产能不足,而是有人“使绊子”?

小李车评李建红 浏览 12538

真稳!佩顿-沃特森连续8场至少出战10分钟且0失误 平历史最长纪录

直播吧 浏览 12801

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 1045

冯小刚也拉不动华谊兄弟

斑马消费 浏览 12770

美拉德+黑蓝白,太好看了!

Yuki女人故事 浏览 1802
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1