关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻915人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

多家大行6月8日起下调人民币存款利率

证券时报网 浏览 16764

马斯克否认非法使用毒品,炮轰爆料媒体:不配当厕纸

网易科技报道 浏览 12474

“苏超”“赣超”再破纪录!全国最大规模“社超”来了

国是直通车 浏览 1552

吴京在汶川地震时,给灾民搭建帐篷

趣看热点 浏览 26793

演绎日式豪华MPV 全新日产Elgrand新车图解

车质网 浏览 244

为汪小菲、李子柒代工,这钱也不好赚

中国企业家杂志 浏览 19478

618前京东APP 12.0上线,推出“单价到手价”等功能

网易科技报道 浏览 18357

官宣:帕拉迪诺出任亚特兰大新帅

体坛周报 浏览 613

俄乌冲突近一周年 两国都宣称去年的经济数字比预期好

枢密院十号 浏览 92606

不能和中国战第二轮?特朗普被送上被告席

浏览 10900

美团的“长期有耐心”,并非毫无代价

虎嗅APP 浏览 16591

华南理工大学发生车祸致1死1伤 目击者:车头明显受损

封面新闻 浏览 33665

这是一个跨越二十四年的纪实长镜头

幕味儿 浏览 609

Transformer开山论文惊天"翻车"?图与代码不一致,神秘bug看傻了

新智元 浏览 18531

媒体:向美军舰发射导弹 胡塞武装不是"软柿子"

澎湃新闻 浏览 76192

俄将讨论批准从远东线路向中国供气的法律草案

环球网资讯 浏览 18442

终结热火神迹!掘金客场复仇,夺冠概率82%,阿德巴约豪言打脸

天涯沦落人 浏览 16118

“V领毛衣”今年秋天爆火!知识分子风、老钱风都少不了它

LinkFashion 浏览 1056

东体:广州队下赛季前景仍不明朗,原俱乐部负责人高寒已回球队

直播吧 浏览 12566

向五角大楼匿名捐赠1.3亿美元"军饷"的富豪身份披露

鲁中晨报 浏览 6313

媒体:高市早苗想见中国领导人 也未必是特别难的事

新民周刊 浏览 12790
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1