关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2698人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

41岁张靓颖的现状,给所有中年女性提了个醒

科学发掘 浏览 3186

2025秋冬一定要拥有的4款包包,怎么搭都好看

Yuki女人故事 浏览 3050

现在整个AI投资逻辑都错了!微软CEO首次承认:成排的H100正在积灰,插不上电

AI寒武纪 浏览 3519

华为MateBook Pro电脑通过OpenHarmony 6.0 Release认证

IT之家 浏览 2605

看起来很好亲的唇,能养出来?

时尚COSMO 浏览 2734

杨瀚两双登热搜第一!对抗明显提升 有球权真不差 拓媒怀念比帅

颜小白的篮球梦 浏览 3087

恩里克:我的球员今天表现得很出色,不过在结果上略有遗憾

懂球帝 浏览 3111

宁波网球公开赛:袁悦2-0战胜王欣瑜,晋级女单16强

懂球帝 浏览 3761

小米杠上奇瑞,争夺高强度钢第一!理想高管吐槽“都是键盘值”

明镜pro 浏览 2531

沪指4000点临门一脚,与十年前有何不同?豆包AI这样回答

每经牛眼 浏览 3568

两名英格兰球员在西班牙国家德比中交手,为123年来首次

懂球帝 浏览 3625

空间实用/补能高效 吉利蓝气球限时钜惠价3.99万元起

网易汽车 浏览 3645

鸿蒙与它的1000万“合伙人”

雪豹财经社 浏览 3082

五角大楼启动10亿美元新计划 采购数十万架单向攻击无人机

环球网资讯 浏览 3064

一加 15 手机跑分曝光:骁龙 8 Elite Gen 5 芯片

IT之家 浏览 4515

媒体:日本出口护卫舰 不能和中国出口武器混为一谈

新民周刊 浏览 33640

徐正源:无法以全主力出战,又存在伤病,输球很遗憾

懂球帝 浏览 3779

三种动力版本 全新奔驰GLA将于2026年上市

车质网 浏览 3896

太癫了,又一个国民女神翻车了

独立鱼 浏览 3767

金棕榈年度女性最佳力作,首次造访艺术影院

幕味儿 浏览 3786

272马力四驱 全新一汽奥迪Q5L高功率实车曝光

网易汽车 浏览 3715
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1