关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻945人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

免费换电、服务无忧被迫缩水,蔚来赌“人性”,输得一塌糊涂

小李车评李建红 浏览 12317

比刘强东只大5岁的丈母娘长啥样?

木子爱娱乐大号 浏览 15371

以色列继续袭击约旦河西岸 哈马斯谴责

每日经济新闻 浏览 634

38岁何洁二婚丈夫刁磊,已经开始为她“争光”了

余鴡搞笑段子 浏览 641

“重大转变”,泰国拟严格限制大麻用途

环球时报国际 浏览 12696

杭州丧偶女子想和邻居再婚 儿子拿出父亲遗嘱把她告了

都市快报橙柿互动 浏览 76153

十年唱吧,一声叹息,转战VR,胜算几何?

连线Insight 浏览 16183

周星驰与石榴姐打卡网红店,他低头玩手机无参与感

扒虾侃娱 浏览 19009

山东金矿火灾起因查明,事故发生前存在多项严重违规

趣看热点 浏览 118344

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 3819

这新片牛,比《沙丘2》更高级

独立鱼 浏览 12028

官方:勇士正式签下塞斯-库里,后者将身披31号球衣

懂球帝 浏览 247

车祸后的伍兹已清醒恢复意识,但身体情况并不容乐观

趣看热点 浏览 139443

宁德时代:钠新乘用车动力电池正在与客户推进开发、落地中

IT之家 浏览 845

切尔西本赛季英超10名不同球员破门,与阿森纳并列最多

懂球帝 浏览 858

首次写入政府工作报告! 商业航天发展按下“加速键”

海外网 浏览 12077

2026款奔驰EQE上市 售价47.8-62.7万元

车质网 浏览 346

亚马逊历史新高!道指标普月线六连阳,中概股探底回升

第一财经资讯 浏览 715

Shams:奇才将蒙特-莫里斯交易至活塞

直播吧 浏览 15493

黄一鸣宣布新恋情,王思聪或成过去式

赵昉是个热血青年 浏览 368

马克龙密会AI专家,法国加入全球人工智能竞赛

环球网资讯 浏览 16124
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1