关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12383人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瑞银30亿瑞郎拿下瑞信,5万亿美元“巨无霸”诞生了!

每日经济新闻 浏览 19013

透视以胡“超音速博弈”背后的攻防密码

浏览 4646

米体:米兰今夏本想租借戴维带最终失败 已将他视为明年首选目标

直播吧 浏览 14176

天空:巴黎准备正式报价穆阿尼,多家英超俱乐部也在关注该球员

直播吧 浏览 14025

新设计 兰博基尼Manifesto概念车官图发布

车质网 浏览 970

埃尔多安指责以色列违反加沙停火协议

新华社 浏览 807

乌在黑海海域击沉一艘俄“影子舰队”油轮

上观新闻 浏览 24

美国财长:美对俄等国经济制裁可能危及美元主导地位

环球网资讯 浏览 120791

NYU研究揭示:模型宽度与能力非线性相关

科技行者 浏览 770

孙俪参加大提琴英皇初级考试 开心晒成绩单获高分

娱絮 浏览 18739

劲拓股份实控人等遭证监会合计罚没6.61亿元

网易财经 浏览 12731

VOGUE热捧刘亦菲被反噬,20周年众多大咖不出席,场面太尴尬!

萌神木木 浏览 833

王思聪带30位网红庆生蛋糕烟花太壕 新女友送祝福

萌神木木 浏览 12485

媒体:俄正式"官宣"要先退群了 普京明显带着怨气

北京日报客户端 浏览 18961

基米希:十年前拜仁有很多个人主义,如今队友更愿为团队奉献

懂球帝 浏览 659

王菲没想到女儿窦靖童,会以头秃理由嫌弃亲爹

千言娱乐记 浏览 794

凯迪拉克锐歌将在3月迎来软件升级 国内用户有望同步

智车情报局 浏览 12524

预售15.58万起 极狐阿尔法T5将于12月27日上市

网易汽车 浏览 12942

胡润榜财富增长较快的雷军李书福,每分钟净赚37万和15万?

BT财经 浏览 647

特朗普在科罗拉多州不具备总统选举党内初选资格

财联社 浏览 74162

视界大会后台社交名利场!欧豪起身主动接杨幂,剧组之间互相抱团

萌神木木 浏览 714
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1