关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者849人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北约将在德国举办“史上最大规模空中军演”:25国逾200架军机参加

环球网资讯 浏览 16627

realme 真我 12 Pro 系列手机 2 月 27 日国内发布

IT之家 浏览 12391

张慧贤指责万鹏“当小三当惯了”万鹏方严正声明

韩小娱 浏览 959

美英之后,韩国也对太子集团出手了,陈志到底搞了多少钱?

北向财经 浏览 840

外媒:北约讨论在日本设立联络处 马克龙表态反对

环球网资讯 浏览 16566

企业家代表委员热议新质生产力:关键在科技创新

澎湃新闻 浏览 11994

超模回归 刘雯巴黎首日“霸屏走秀”

时尚丽人风行 浏览 19693

锁定汽车行业不知高考志愿如何填?这篇万字长文深度解读请收好!

二师兄玩车 浏览 10884

解放军歼10战机直飞沙特 空中加油保障中途不降落

环球网资讯 浏览 12422

博主成功拆解苹果 iPhone Air,刮去背板涂层打造“透明版”机型

IT之家 浏览 924

手机行业的上半年:卷不动了,家家开始挤牙膏

钛媒体APP 浏览 15241

反转!张庭林瑞阳抓住调查取证公司的小辫子狠锤

安宁007 浏览 13348

五角大楼泄密文件被曝含涉华内容

金羊网 浏览 18811

言承旭哽咽谈父母离异经历 自曝小时候被妈妈抛弃

网易娱乐 浏览 15410

字节跳动:因组织调整离职的员工 过渡补贴最高7.2万元

澎湃新闻 浏览 1079

杨幂化身女保洁摆拍,被男保镖簇拥尽显女王范

深剖娱乐圈 浏览 15578

夏天的裙子 要的就是减龄好看有气质

小西的穿搭日记 浏览 16138

开发商未批先建楼盘烂尾5年 13次专题会督促解决未果

鲁中晨报 浏览 64287

《17号音乐仓库》治好了我的假期综合症

八卦三缺一 浏览 12411

赵丽颖剪短发穿"人鱼姬"礼服 变换风格更美了

时尚丽人风行 浏览 18836

补壹刀:史无前例!德法今天都爆出涉华大消息

环球网资讯 浏览 16708
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1