关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2702人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蓝宝石高管首度回应显卡16Pin烧毁:就算解决、名声也臭了

快科技 浏览 3086

TA:曼联今夏额外借贷1.05亿镑用于引援,目前总债务6.37亿镑

直播吧 浏览 4467

牛弹琴:马克龙众叛亲离 亲信在其最虚弱时公开发难

大象新闻 浏览 19879

德约纪念逝去恩师忍不住落泪,现场打脸意大利网协主席

网球之家 浏览 3431

收藏!2026乒乓赛历出炉:全年63站以上,运动员体能迎来严峻考验

乒谈 浏览 2901

提供燃油与纯电 全新保时捷718效果图曝光

车质网 浏览 2900

纯电续航345km 小鹏X9增程版将于四季度上市

车质网 浏览 3605

比加班更可怕的,是可能加班

识局 浏览 2812

迷雾里的SHEIN

海克财经 浏览 3586

男子在悬崖边请人拍照滑倒坠下 遗体在水潭底部被找到

封面新闻 浏览 9293

又一黑马大剧《表妹万福》来袭,宋祖儿撒娇追夫

动物奇奇怪怪 浏览 3764

伊敏百台无人矿卡常态化安全稳定运行超180天,单日产量创新高

IT之家 浏览 2634

宏福苑4小时内火警连升三级:单户最大面积44.9平方米

红星新闻 浏览 30513

纯电续航325km 小鹏P7+增程版申报信息曝光

车质网 浏览 3538

剑南春丨曼联客场2-2热刺,德利赫特读秒绝平,姆伯莫建功

懂球帝 浏览 3570

曼城过往6战多特仅1负,两队近4次交手曼城3胜1平

懂球帝 浏览 3519

女人会不会打扮很重要!配色不老气、穿衣不拖沓,耐看又大方

静儿时尚达人 浏览 1022

Meta裁员后续:田渊栋被过河拆桥,姚顺雨等集体「抢人」

机器之心Pro 浏览 3571

马卡:C罗在红海购入两栋豪华别墅,享受私密宁静的家庭时光

懂球帝 浏览 2961

9月中级车市场洗牌,新能源新兵为何也栽了跟头?

百姓评车 浏览 3760

吴向东一场前所未见的白酒直播,亮出珍酒李渡的里子和面子

斑马消费 浏览 790
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1