关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2415人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

胖东来称博主用AI分析毛巾利润,案件已进入司法程序

大象新闻 浏览 365

突发!一辆理想MEGA行驶中起火爆燃!

电动知家 浏览 3688

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 3635

剖析智元机器人:一场关于人才与资本的博弈

虎嗅APP 浏览 3729

有望明年初亮相 小米YU9假想图曝光

车质网 浏览 3078

厚外套+半裙=今冬绝美穿搭,巨洋气巨显瘦!

Yuki女人故事 浏览 3625

净利润暴跌7912%!天域生物亏麻了

包不同 浏览 3282

伊姐周六热推:电视剧《年少有为》;电视剧《有罪之身》......

伊周潮流 浏览 2490

最爱发钱老板开工刷屏:2小时订单破亿 客户排队交钱

极目新闻 浏览 38370

跨省调查结束!被延期留置150天后,德州首富平安返岗

壹只灰鸽子 浏览 3407

雷军跨年直播拆车,15台手机撬动300亿市值?

BT财经 浏览 2762

守不住,阿森纳连续20次联赛对利物浦每场都失球

懂球帝 浏览 2712

用重罚来逼迫商家“限价”,京东在焦虑什么?

斑马消费 浏览 3614

上海交大吴家睿:复杂的科学时代需要复杂性思维|全国科普月

上观新闻 浏览 4506

苏超常州队主帅:明年队伍要年轻化,希望能让球迷场场都开心

懂球帝 浏览 4271

配华为舱内激光视觉技术 华境S明年上半年上市

网易汽车 浏览 2614

大洗牌开启?医药代表管理办法出台,客情回扣模式或将终结

时代周报 浏览 228

丹麦赛石宇奇击败阿塞尔森进决赛

体坛周报 浏览 3674

46岁董璇被曝怀二胎,本人现身机场脱外套辟谣,小腹平坦状态超好

扒虾侃娱 浏览 3638

吉利雷达地平线新车型上市 售价15.18万元

车质网 浏览 2671

官方:利物浦从德比郡召回23岁后卫欧文-贝克

懂球帝 浏览 2806
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1