关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3706人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

搭载1.5T发动机 奇瑞瑞虎5运动版官图发布

车质网 浏览 1733

唐嫣这一出手,若不出意外,央视《爱情没有神话》估计得“封神”

娱乐圈笔娱君 浏览 499

香港火灾初步调查结果:贴在窗户上的发泡胶板高度易燃

南方都市报 浏览 17840

鞋子专场||穿了五年十年,掏心窝子说,最常穿的还是这一双!

黎贝卡的异想世界 浏览 2938

87岁哈梅内伊严正警告美国 公开露面被指传递三层信号

每日经济新闻 浏览 6956

马伊琍新年第一天晒全家福!和大女儿合影好温馨

隔壁灵妹妹 浏览 2780

电车销量涨不动?油车打响“销量保卫战”

少数派报告Report 浏览 2868

媒体:特朗普2.0亚洲"首秀" 重中之重还是与中国有关

上观新闻 浏览 9046

星光伴我心,不朽迷影佳作今晚点亮大银幕!

幕味儿 浏览 2947

马雷斯卡告别切尔西:我在离开时把切尔西留在应有的位置上

懂球帝 浏览 2727

胡塞武装称若加沙停火破裂将恢复袭击以色列

极目新闻 浏览 3454

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 3003

售14.98万起 2026款海豹07DM-i正式上市

网易汽车 浏览 4682

美国或"最快本周"再次对俄罗斯动手 已和27国讨论计划

澎湃新闻 浏览 13466

其实,零百加速5秒的新规才是利好车企

速度计 浏览 3331

降价30万,不是宝马仁慈了,而是被逼没办法

正在说车 浏览 2677

李小龙妻子琳达晚年透露:丈夫其实很怕一种对手

南书房 浏览 3399

特朗普称是自己让大家变得更富有:我的敌人也过得很好

红星新闻 浏览 20186

和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 4546

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技 浏览 2408

知名女演员邢菲被曝光恋情,更多细节透出

乐悠悠娱乐 浏览 3561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1