关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3894人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

何小鹏给车企转型泼冷水:并非都能顺利成为人形机器人企业

快科技 浏览 1811

这家基因编辑初创正在挑战FDA的监管边界

DeepTech深科技 浏览 2653

史上最大IPO前夕,Space X的财务数据部分流出,利润率相当高

华尔街见闻官方 浏览 752

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 5527

辽宁2将打强队太吃力!王岚嵚组织与得分全垮,付豪进攻失灵了!

篮球资讯达人 浏览 2623

斯卢茨基:最后时刻丢球难以接受,争冠主动权已不在我们手中

懂球帝 浏览 4381

第一次见有人被官方认证吹牛!内娱这位“老师”简直让人笑掉大牙

娱乐圈笔娱君 浏览 3349

下一部新剧被曝又是大女主!杨紫真要拍不过来了

星寒新影视 浏览 2939

香港中文大学团队突破:让AI有了"超级记忆",多步推理能力飙升!

科技行者 浏览 2724

“卷”起来!人形机器人,只要9998元!

中国基金报 浏览 3749

她连上5次春晚,私下却和恩师同居怀孕被骗流产

律便利 浏览 3577

中关村首店试营业,东方甄选试水线下,“体验消费”能否撬动会员高增长

华夏时报 浏览 222

以军称对黎巴嫩真主党目标发动新一轮空袭

上观新闻 浏览 4456

5名共和党议员"倒戈" 特朗普"愤怒"向其打电话威胁

环球网资讯 浏览 13274

揭秘!印巴冲突突然停火背后五大关键因素

浏览 7342

今年冬天最经典的4双鞋,年年穿都好看!

LinkFashion 浏览 3319

成熟女性秋天衣服怎么穿?看看这些穿搭就有灵感,舒适又简约

静儿时尚达人 浏览 3846

荣耀MagicOS 10十二月升级资讯:新增支持与Mac一碰互传等

IT之家 浏览 3029

亚冠精英实时积分榜:申花升至第6跻身晋级区,成都第9,海港垫底

懂球帝 浏览 3668

自然奇趣志|大树也“社恐”:探秘“树冠羞避”现象

半岛晨报 浏览 305

海魂衫搭配白色,更解暑!

Yuki女人故事 浏览 188
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1