关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3447人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

惨!武术冠军自掏腰包拍武侠片,成本超1500万,4天票房仅169万

靠谱电影君 浏览 3700

广州策马向前,跑好第一程!

无冕财经 浏览 2717

涉嫌支持台军心战大队 5家企业主营业务被曝光

日月谭天 浏览 7897

"胖兵照"浏览量超过3000万 数据显示美军肥胖率超20%

红星新闻 浏览 8787

日本前首相:中国批高市理所当然 日媒为什么不批

环球网资讯 浏览 16070

十分亮眼,阿马德5场非洲杯比赛贡献3球1助,3次获得全场最佳

懂球帝 浏览 2638

演绎日式豪华MPV 全新日产Elgrand新车图解

车质网 浏览 3089

9系大六座旗舰SUV又添一员,智己LS9预售33.69万起

网易汽车 浏览 3515

六氟磷酸锂“带飞”氟化工,衢州启动“中国氟谷”的底气在哪里?

时代周报 浏览 3478

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 7448

告别臃肿!这种简约的高级穿法,别拒绝

Yuki女人故事 浏览 2597

德邦快递实力夺魁:斩获中国跨境电商物流“头程物流标杆企业”奖项

中国经济时报 浏览 3226

AI概念股重挫,纳指跌近1%,英伟达跌1.63%,软银狂泻12%,国际油价连续七天走高

第一财经资讯 浏览 486

雷克萨斯,凭什么2025还能逆势增长?

汽车人传媒 浏览 2666

酷态科首款户外电源亮相,还有充电宝充电器二合一产品

IT之家 浏览 3743

蔚来萤火虫上市半年多了,现在卖得怎么样了?

车轮生活 浏览 3441

德约纪念逝去恩师忍不住落泪,现场打脸意大利网协主席

网球之家 浏览 3433

马斯克摊上事了,旗下公司被多国调查封禁

21世纪经济报道 浏览 2765

她们冬天这样穿,真的很美!

黎贝卡的异想世界 浏览 2800

赏叶季人生照片拍摄指南.PDF

时尚COSMO 浏览 2821

拉什福德社媒鼓励球队:这是马拉松不是短跑,我们会继续战斗

懂球帝 浏览 3552
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1