关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12419人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美英联合对胡塞武装发动空袭 红海危机何以至此

澎湃新闻 浏览 12910

武汉不是疫情来源,世卫组织发布最新疫情溯源报告

趣看热点 浏览 1267839

稀土是啥?为啥是中国王牌?

混知财经 浏览 1040

杨钰莹造型好新潮:上半身约会,下半身跑步

木子爱娱乐大号 浏览 19645

贾玲瘦身成功!为电影闭关半年暴瘦100斤撞脸苗圃

萌神木木 浏览 12873

用热爱赚钱,其实不难

虎嗅APP 浏览 14889

Skip:佩林卡就是能不断胜出 现在你会希望少花点钱留下里夫斯

直播吧 浏览 15265

网易2023 Q2财报:净收入240亿元,AI技术助自研游戏爆款频出

网易科技报道 浏览 14295

预期正在起变化?杭州首批土拍收金182亿,六成地块“触顶”,民营房企揽地过半

中国基金报 浏览 19257

冬季的“松弛感”,怎么穿?

Yuki女人故事 浏览 682

下一代GPU,竞争激烈

半导体行业观察 浏览 1502

记者坐专列到淄博吃烧烤:单店日均售1万串 4点就排队

第一财经资讯 浏览 111192

半个娱乐圈的时髦精,都在巴黎了!

时尚COSMO 浏览 11751

媒体:高市早苗当选首相 对华采取挑衅措施的可能提升

界面新闻 浏览 5729

一夜进账244亿元!李斌靠爆款车翻身,破除蔚来倒闭魔咒,

象视汽车 浏览 1410

本赛季前5轮三支英超升班马共拿19分,比上赛季三队快一倍

直播吧 浏览 1660

清华团队提出药物相互作用预测方法,预测准确率提升近三成

DeepTech深科技 浏览 1668

吉利ICON巧克力心动紫上市!网友:销量稳了

汽车网评 浏览 741

别总嫌弃经典牛仔裤 低调的时髦才出圈

男士穿衣搭配杂志 浏览 15193

接到立案通知后,股民以为完了,5个月后一算账,7000人账面翻倍

壹只灰鸽子 浏览 68

美女克拉拉官宣离婚,6年豪门婚姻告终

代军哥哥谈娱乐 浏览 951
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1