关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3915人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

当年霍震霆给儿子霍启刚挑儿媳妇,眼光多毒啊

小光侃娱乐 浏览 3283

皱着眉头在看《诉讼女王》......

时尚COSMO 浏览 2362

辛芷蕾飞升独一档,85花格局变了!

Yuki女人故事 浏览 4441

詹姆斯正建造两栋豪宅!11000平米一分为二:为布朗尼准备婚房?

罗说NBA 浏览 2983

配置提升 2026款丰田铂智3X将于今日上市

车质网 浏览 262

舒淇哽咽表白冯德伦:谢谢你娶一个不常在家的女人

Yuki女人故事 浏览 5528

把玄戒O1念成“玄戒零一”,雷军认错:确实是讲错了

三言科技 浏览 2724

泉州市与宁德时代签署新能源电池生产基地项目合作协议

北京商报 浏览 2429

AI智库“智汇”珠海,助力大湾区学术与产业的“双向奔赴”

南方都市报 浏览 3682

曾经最具知名度的播音员病逝 丈夫也是央视知名主持人

环球网 浏览 18485

阿富汗称与巴基斯坦在伊斯坦布尔举行第三轮谈判

国际在线 浏览 3404

理想MEGA车主声明: 车辆系突发自燃并非电池包破损

网易汽车 浏览 3555

拉什福德渴望永久转会愿大幅降薪!暗讽曼联,称巴萨让他重获新生

罗米的曼联博客 浏览 3738

“811汇改”十周年的成就

证券市场周刊 浏览 3786

洋河股份第三季度营收为32.95亿元,同比下降29.01%

红星资本局 浏览 3529

29分钟打卡29+13!坎宁安完压布伦森被赞MVP 尼克斯陷4连败泥沼

颜小白的篮球梦 浏览 2753

天津联通与华为合作:5G-A宽上行样板点峰值速率突破1Gbps

IT之家 浏览 2403

增长遇阻,捷途汽车连续三个月销量下滑?

车秀小咖 浏览 777

大家赚疯没?A股15连阳,打破尘封33年记录

说财猫 浏览 2190

上海楼市温和回暖,招商、保利5天狂揽近30亿销售额

国际金融报 浏览 241

张之臻冲开门红失利白卓璇弥补遗憾,女单最大冷门成就土耳其历史

网球之家 浏览 2573
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1