关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2420人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

两死者死于家中非交通事故 定损员伙同他人骗保120万

红星新闻 浏览 14410

斋戒期间突尼斯联赛下午一点比赛,终场哨响两队球员体力不支均趴窝

懂球帝 浏览 2127

匿名霸榜、阿里“不认”,HappyHorse是谁?

AIX财经 浏览 1138

问界M6官图首发 以年轻化设计叩击25-30万级市场

网易汽车 浏览 2445

90后占比近六成,小鹏X9超级增程成年轻家庭首选

定焦One 浏览 2626

全球红人经济“超级枢纽”!天下秀递表港交所,新浪微博持股近27%|港E声

时代周报 浏览 2739

美媒:未与以及时协商 内塔尼亚胡对特朗普感到愤怒

环球网资讯 浏览 57186

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 209

止步“五连涨”!美股12月“开门黑”

中新经纬 浏览 3120

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 2597

比亚迪双旗舰谍照来了!大汉/大唐,更大、更强

车市红点 浏览 2957

多人手机信号深夜同时消失 出海7次未带回1条鱼被抓捕

极目新闻 浏览 8003

特朗普向60国发出邀请之际 多国正商量怎么对付美国

新民周刊 浏览 7092

谢娜主持晚会还是差一口气!直播接不上话,看热闹忘记控场一直笑

萌神木木 浏览 3432

王涵 : 从资本市场视角看四中全会公报——提振信心,后市可期

首席经济学家论坛 浏览 3763

伊朗公开展示导弹 武装部队警告美国

极目新闻 浏览 724

不止造车 奥迪在北京做了一件关乎自然未来的事

网易汽车 浏览 3784

湖人惨败尼克斯!双核轰52分喜忧参半,艾顿无球权,防守真拉胯!

篮球资讯达人 浏览 2447

若羽臣:抖音已成为公司重要渠道之一

北京商报 浏览 2597

消失8年,这T0级演员突然复出了

独立鱼 浏览 3481

智己LS9上市32.28万起 两个Ultra都是高配

网易汽车 浏览 3383
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1