关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3907人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梅德维德夫晋级中网男单八强

体坛周报 浏览 4264

俄称在多个方向推进 乌称多地遭空袭

极目新闻 浏览 3560

TA:诺丁汉森林不会因对阵曼联存在角球误判向裁判机构上诉

懂球帝 浏览 3606

小个子女生冬天怎么穿衣?上宽下紧、体现曲线,显高显瘦舒适

静儿时尚达人 浏览 2968

17年的双十一底层逻辑变了?“小时达”来了,AI帮你选品

时代周报 浏览 3454

这不是危言耸听:最快明年,比亚迪的插混和纯电,就没有区别了

小李车评李建红 浏览 3717

英国防大臣称访乌克兰途中 专列险被俄“榛树”导弹命中

红星新闻 浏览 2630

羽绒服+阔腿裤:今年冬天最火搭配,松弛又时髦!

LinkFashion 浏览 2640

具身智能何时实现“ChatGPT时刻”,王兴兴说了个关键前提丨聚焦进博会

红星资本局 浏览 3430

实拍体验本田Super-ONE PROTOTYPE:能量产的极致超级K-Car

驾仕派 浏览 3485

冯德莱恩:欧盟将向乌提供紧急能源援助

每日经济新闻 浏览 3463

中恒电气:两款旗舰产品发布,重新定义AI数据中心供电技术标准

览富财经网 浏览 3533

谁说每年都要穿新衣服?准备一些基础款,百搭耐看又不过时

静儿时尚达人 浏览 300

特朗普称美将管理委直至安全过渡

新华社 浏览 2185

懒懒陪王思聪低调过38岁生日,晒甜蜜日常

丁丁鲤史纪 浏览 2715

荣耀护眼学习机火火兔版发布,2999元

IT之家 浏览 2650

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 3118

新春穿搭新趋势,天猫服饰与百大品牌共同演绎新年吉服美学

LinkFashion 浏览 2646

理想汽车段吉超:造车这件事,可以借鉴零售业的胖东来模式

经济观察报 浏览 3103

急诊救命、省钱增效,AI如何改变诊疗?|全民健康大讲堂

澎湃新闻 浏览 2946

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 5544
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1