爆点资讯

由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队，最近在人工智能领域取得了一项重要突破。这项研究发表于2025年，论文编号为arXiv:2509.23371v1，提出了一种名为MetaAPO（Meta-Weighted Adaptive Preference Optimization）的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性，我们先来看一个生活中的例子。假设你正在教孩子学习做饭，你有两种教学资源：一套经典的家传菜谱（就像AI训练中的离线数据），还有让孩子实际动手练习的机会（就像在线生成的数据）。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习，而东南大学团队的新方法则像是配备了一位智慧的厨艺老师，这位老师能够根据孩子当前的水平，灵活决定什么时候该参考菜谱，什么时候该放手让孩子实践，从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战：如何让AI既能从人类已有的经验中学习，又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据，导致AI无法适应新情况；要么完全

东南大学突破：AI学会情境化拒绝能力

尼克斯112...

葡媒：被换下...

特朗普要求日...

天禧AI 3...

收购“Man...

中国色特别策...

尚水智能三度试水A股终迎曙光比亚迪十亿关联交易护航IPO闯关

不敌王楚钦，松岛辉空：满脑子只有不甘心，混双应该能复仇

89岁相声名家李如刚去世！师承侯宝林

蔚来全新ES8正式上市，起售价40.68万元

周深香港跨年唱到凌晨！5万人嗨翻无投诉

租电版售价5.28万元埃安UT系列永冲锋版上市

消息称一加性能新机搭骁龙 8 系旗舰芯 + 超高刷屏、有很酷的联名

微软澄清Gaming Copilot争议：截图仅用于识别游戏，不用于AI训练

今晚发布，OPPO Find X9 系列手机提供 eSIM 版本

去海外卷，并不是件坏事

阿特金森帅位岌岌可危！上季当选年度最佳教练曾获骑士老板力挺

2028年4月投产全新宝马iX6效果图曝光

美伊谈判前景不明：美称＂看到进展＂伊称暂无会谈安排

工信部下达“强制瘦身令”：不达标的新能源车，禁止“出道”

浙大突破：经验学习提升AI智能体现实世界物理认知

全系智混全新奥迪Q5L上市售30.98万起

哈梅内伊次子当选伊朗最高领袖以色列扬言要＂追杀＂

点开查看AI明星们街头大吵架议程｜ACC主舞台明天见！

男子自带3瓶茅台被服务员调包摸酒瓶辨温度识破伎俩

连续被血洗！今年前十个月的涨幅，币圈一个月跌完了

兹维炮轰巴黎场地速度：太慢，弹跳忽高忽低，阿卡出局或与此有关

65岁林俊贤广东景区打工，年过6旬老成“龙王”，努力赚钱不丢人

跟队：萨尔可代表切尔西出战英联杯，但今晚不太可能出场

同游仍少年！精灵世界空降杭州