关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者851人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

乔帅公开日专访!避开艾伦,谈周琦状态,渴望李凯尔,寄语杨瀚森

篮球资讯达人 浏览 15465

伊土两国外长:地区国家应共同应对以色列侵略扩张

环球网资讯 浏览 233

大回血,股票型ETF一周猛增1000亿元!上周两明星产品遭“反噬”,但资金“越跌越买”|ETF规模周报

每经牛眼 浏览 805

今年冬天最流行的大衣“高阶穿搭”,太时髦了!

LinkFashion 浏览 365

冬天要有的鞋子!显高!显腿长!还显瘦!

Yuki女人故事 浏览 615

港媒:蔡英文一举杯敬酒 台商心里直打哆嗦

直新闻 浏览 81137

张翰和吴宣仪加入《妻子的浪漫旅行》第五季

趣看热点 浏览 26075

塞尔维亚将建厂生产中国疫苗,未来可为周边国家提供疫苗

趣看热点 浏览 861105

53岁孙红雷现身眉毛快掉光显老 妻子素颜相伴在旁

叶公子 浏览 13417

以色列战时内阁表态:2024年就是战争年

红星新闻 浏览 11344

真累了!勒布朗将缺席背靠背战国王 赛季首次轮休

网易体育 浏览 26209

警方深夜通报:2人身亡!自制枪械被发现!

环球网资讯 浏览 18600

乔欣、章若楠的“叠叠乐”穿搭,适合逛公园吗?

瑞丽网 浏览 19356

中国核聚变技术获国际原子能机构肯定,“环流三号”亮相聚变能国际大会

上观新闻 浏览 928

女子产后抑郁自缢骨灰被丈夫私自下葬 父母苦寻四年

新民晚报 浏览 4900

“十几万的BBA没人买,我能怎么办?”

汽车公社 浏览 11081

广汽丰田双向突围,是疯了吗?

汽车K线 浏览 251

乌国安局首次承认袭击克里米亚大桥:准备了几个月

环球网资讯 浏览 14313

不知不觉 赵丽颖就变成这样了

西瓜小姐MWM 浏览 15090

17岁少女含冤入狱13年获172万国赔 法院:我们道歉

社会奇闻君 浏览 91043

想要裙子穿得好看 从了解自己的需求开始

虎哥说衣不二 浏览 15975
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1