关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3905人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

她被骂“文盲”影后,如今搭档黄轩交出满意答卷

仙味少女心 浏览 3628

赵心童:要学会带着压力享受比赛;特别爱吃陕西面食和葫芦鸡

懂球帝 浏览 3956

男子认亲1年后被警方告知"亲哥找到了":那家里的是谁

极目新闻 浏览 16334

MRAM,台积电重大突破

半导体行业观察 浏览 3847

格拉斯纳:期待与埃泽的碰面,但在比赛中我们只会全力争胜

懂球帝 浏览 3645

泽连斯基:乌谈判团队将于2日晚前往乌美俄三方会谈地点

国际在线 浏览 2452

TVB那些美到像幻觉的小花们

可乐谈情感 浏览 3446

阿森纳本赛季3次单场通过角球打进至少2球,同期英超球队最多

懂球帝 浏览 2688

记者:哥伦比亚小将马丁内斯的未来将在几天内敲定

懂球帝 浏览 748

美伊本周有望在土耳其开谈 伊朗或在核问题上松口

上观新闻 浏览 5022

广西平果球员:俱乐部没找我们签字,解散都是从网上知道的

懂球帝 浏览 2917

小高领,现在穿刚刚好

Yuki女人故事 浏览 2454

38岁后单赛季为意甲升班马攻入至少4球,瓦尔迪是历史第二人

懂球帝 浏览 3141

对话工程院院士王浩:我国独创的“河湖长制”值得向“全球南方”国家推广

封面新闻 浏览 3555

消息称一加性能新机搭骁龙 8 系旗舰芯 + 超高刷屏、有很酷的联名

IT之家 浏览 3514

乌克兰将在德国和丹麦设立武器出口办事处

上观新闻 浏览 3358

马德里康普顿斯大学VERSE:AI实现文档视觉信息深度理解

科技行者 浏览 2623

下半场7中0背锅?威少8+10+7吞三连败 美记:本有机会染指最佳PG

颜小白的篮球梦 浏览 2951

特朗普称"阻挠达成和平协议的人是泽连斯基" 克宫回应

环球网资讯 浏览 2626

特斯拉Q3销量首超梅赛德斯奔驰,一个时代终结了?

江瀚视野 浏览 3779

杭州男子家中一斤黄金消失找了两天后报警 结局太意外

环球网资讯 浏览 33678
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1