关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3730人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电续航超400km ID.ERA 9X将于4月正式上市

车质网 浏览 2456

实拍体验本田Super-ONE PROTOTYPE:能量产的极致超级K-Car

驾仕派 浏览 3488

动物纹回潮,那很狂野了

时尚COSMO 浏览 2672

深圳105-95山西取CBA3连胜,贺希宁23分,迪亚洛空砍31分

懂球帝 浏览 2600

马斯克SpaceX太空能源计划浮出水面,中国光伏产业或成关键一环

DeepTech深科技 浏览 2429

Cariad不再是“灵魂”担当,大众请外援能否赌赢未来?

禾颜阅车 浏览 3911

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 33389

19人徒步被困河南辉县南太行山悬崖 1人突发疾病遇难

红星新闻 浏览 8928

何超莲窦骁,婚变风波后首次同框

喜欢历史的阿繁 浏览 3492

英特尔CEO确认:18A工艺已进入大规模量产,为三代产品奠定基础

IT之家 浏览 3570

东风本田10月销量28896台 1-10月累计终端销量255073台

网易汽车 浏览 3550

日本宣布从南鸟岛海域采掘到含稀土的淤泥 外交部回应

环球网资讯 浏览 5895

上新|| 降温天不能错过的绝美毛衣,来了!

黎贝卡的异想世界 浏览 2609

中微半导涨价,最高50%!机构:AI设施投入持续加大为确定性事件

中新经纬 浏览 2490

降温了!羽绒服这样穿显瘦又时髦

LinkFashion 浏览 2548

剑指千亿!松江卫星互联网产业按下“加速键”

上观新闻 浏览 3688

中秋节快乐!

黎贝卡的异想世界 浏览 3117

盘点未夺大满贯的最强选手,谁是你心中的意难平?

网球之家 浏览 3373

OpenAI创始团队对簿公堂,马斯克称创办初衷为拯救人类

环球网资讯 浏览 538

9家车厂推出“7年低息”,今年车市开局就恶战

汽车公社 浏览 2420

时隔8年,苏农银行终换行长

财经众议院 浏览 3577
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1