关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3438人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美方公开核航弹测试画面

北京青年报 浏览 2398

美媒:特朗普敲打高市 要求日本在台海问题上降调

观察者网 浏览 30417

《镖人》直接让陈丽君补拍而非换脸,投资达7亿

芊手若 浏览 2663

以色列议会初步通过吞并约旦河西岸法案 遭15国谴责

环球时报国际 浏览 9211

戏骨许绍雄去世,身家上亿却穿百元衣吃路边摊

八卦南风 浏览 2997

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 14544

造车,京东方向盘转向的下个万亿市场?

速度计 浏览 3657

已减重10公斤的泫雅澳门演出晕倒后公开致歉

封面新闻 浏览 3464

特朗普称取消与普京会晤并对俄实施新制裁 普京回应

每日经济新闻 浏览 6797

中国科技股深夜爆发,腾讯飙升9%,首批“政务龙虾”已上线

21世纪经济报道 浏览 1778

老而弥坚,追梦:我还能再打4-5年,新赛季我仍充满动力

懂球帝 浏览 3618

冬天大衣怎么穿才更好看?选好颜色、找对单品,高级简约又大气

静儿时尚达人 浏览 2510

全新比亚迪SHARK6亮相 1000km综合续航+L2级智驾

华庭讲美食 浏览 3376

两名国民党民代遭起诉 郑丽文:民进党想团灭在野党

海峡导报社 浏览 14381

辛纳重返世界第一无悬念?网友点出阿利西姆难阻意大利人夺冠原因

网球之家 浏览 3536

丹麦国防部称格陵兰岛军事演习将持续到年底

上观新闻 浏览 2564

新人中东度蜜月突遇战争爆发 新娘在领空关闭前幸运离境

极目新闻 浏览 1979

全智贤给了韩娱4年,归来还是0人能打?

时尚COSMO 浏览 4346

记者:阿布拉汗应该是河南第一签,阿奇姆彭难留

懂球帝 浏览 2747

理财代销加速下沉 热销背后警惕收益率“美化”

北京商报 浏览 3264

大带宽+低时延!F5G如何撑起城域“毫秒用算”?

览富财经网 浏览 3765
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1