关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3428人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 3421

俄称已控制库皮扬斯克 正清缴乌军

每日经济新闻 浏览 2767

双子座流星雨即将引爆冬日夜空,成都“观星+”消费持续升温

红星新闻 浏览 3074

卷上天的新能源厂商,销量却被燃油车背刺了

虎嗅APP 浏览 3798

领克900首搭千里浩瀚G-ASD 新增D2D领航驾驶辅助功能

网易汽车 浏览 2741

10月份,本田飞度就卖出去3辆,你没看错,就是3辆

凡兮说 浏览 3500

“恐怖电影成真” 美国男子盗窃人骨公开售卖

澎湃新闻 浏览 7936

美军演练与解放军大规模作战 专家分析

北京日报 浏览 1731

输球后被球迷辱骂,标准列日前锋:大街上也这么跟我说话试试

懂球帝 浏览 3064

博纳老板于冬被澳门赌场追债400多万

严肃八卦 浏览 1780

杨振宁回国定居在清华园已超20年 为自家取名"归根居"

南方都市报 浏览 4479

艾科维曾通过外部客户转贷逾千万元 两家“0人”供应商合计撑起超五千万元采购额

金证研 浏览 3767

刚亮完核杀器 俄罗斯"末日电台"发出6字神秘信号

参考消息网 浏览 14651

韩版Galaxy S26独享,三星Exynos 2600芯片被曝难以走向全球

IT之家 浏览 3135

明明美到雌雄难分,却痴缠渣男20多年

TVB的四小花 浏览 4147

上海工厂生产 廉价版特斯拉Model 3韩国开售

车质网 浏览 2486

拒绝对涉案做出反省 内塔尼亚胡请求特赦遭强烈抗议

环球网资讯 浏览 3238

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 7891

曝杨威与儿子失联!杨阳洋父母情绪崩溃

有趣的胡侃 浏览 3386

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

伊周潮流 浏览 2418

伊朗高级军官:以色列威胁言论暴露其“动荡和软弱”

上观新闻 浏览 2878
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1