关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2690人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

布里斯班新科亚军科斯秋克:我的关于萨巴伦卡的话被断章取义

网球之家 浏览 2642

新美联储通讯社:美联储暗示暂停降息行动,新债王:今天或是鲍威尔任内最后一次

华尔街见闻官方 浏览 3101

重庆飞三亚航班紧急返航 乘客:听到广播才知出故障

封面新闻 浏览 17941

Netflix砍掉手机投屏功能:官方称“提升体验”,用户骂声一片

IT之家 浏览 3206

懒懒陪王思聪低调过38岁生日,晒甜蜜日常

丁丁鲤史纪 浏览 2709

与孙继海翻脸!董路:我的对手们甘愿被当枪使,自降身价智商全无

念洲 浏览 2963

谷歌推出开源全栈NPU新架构,旨在实现大模型在终端的低功耗运行

DeepTech深科技 浏览 3705

天空体育:苏超流浪者与海港主帅穆斯卡特谈判已进入最后阶段

懂球帝 浏览 3743

一颗卫星“掉链”,为何让全球航天界紧张?

上游新闻 浏览 2905

《骄阳似我》顾漫花巨资买《遇见》《信仰》不是为庄序偏爱太明显

亦暖追剧随笔 浏览 2693

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 8512

独一无二,世界巨星蒂尔达·斯文顿卓越之作!

幕味儿 浏览 3735

今日热点:《怪奇物语》番外动画剧预告;NEWBEAT签约摩登天空……

伊周潮流 浏览 2829

梁小龙死因被爆!去世前一天还在练咏春

阿坹武器装备科普 浏览 2624

2架美军机在南海相继坠毁 原因正在调查中

界面新闻 浏览 3592

【原声】阿韦洛亚,最后一个穆里尼奥主义者

体坛周报 浏览 2474

特朗普称将会见泽连斯基 讨论防空与远程导弹援助等

新京报 浏览 3087

有人被拖欠工资!毫末智行北京总部人去楼空,员工抱着显示器离开;曝ASML为美国监控中国客户!官方否认;雷军斥资超1亿港元增持小米

雷峰网 浏览 3220

女子新房装玫红色入户门贴大花壁纸 称总花费近100万

极目新闻 浏览 8096

女佣自杀,最贵凶宅诞生!许家印好牌友要吐血

说财猫 浏览 3624

上海交大吴家睿:复杂的科学时代需要复杂性思维|全国科普月

上观新闻 浏览 4504
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1