关闭广告

ServiceNow团队破解检索系统评分难题:让AI搜索更懂你的真实需求

科技行者780人阅读


这项由ServiceNow公司的Nima Sheikholeslami领导的研究团队完成的突破性工作,发表于2025年9月30日的arXiv预印本平台(论文编号:arXiv:2510.00137v1)。感兴趣的读者可以通过该编号查询完整论文。这项研究揭开了当前AI检索系统的一个重大缺陷,并提出了一种全新的训练方法,让搜索引擎能够给出更可靠、更一致的相关性评分。

在日常使用搜索引擎或问答系统时,你是否遇到过这样的困扰:明明搜索的是同一个问题,但系统给出的答案质量却忽高忽低,有时候不相关的内容反而排在前面?这个问题的根源其实隐藏在AI检索系统的核心训练机制中。目前主流的检索系统就像一个只会相对比较的评委,它能判断在同一个问题下哪个答案更好,但无法给出绝对的好坏评分。这就导致了一个尴尬的局面:对于不同问题的答案,系统无法进行跨问题的质量比较。

ServiceNow的研究团队发现,这个问题源于目前广泛使用的对比学习方法。这种方法就像让学生只做选择题,永远不做绝对评分题。学生虽然能在给定选项中选出最好的答案,但无法给每个答案一个独立的分数。更严重的是,研究团队通过严格的数学证明发现,现有的训练方法在提升检索质量这个核心

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

老人用爽身粉后患癌离世 家属获赔近70亿元

每日经济新闻 浏览 16802

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者 浏览 691

新冠肺炎可能成为长期流行的传染病,未来依旧面临更大的挑战

趣看热点 浏览 26142

乌方将向美提交新20点和平计划 泽连斯基表态

财联社 浏览 67

第五代骁龙8之后,旗舰机有了新的“标准版”

科技行者 浏览 344

超万人离岗,韩国医生罢工为何持续升级

中国新闻周刊 浏览 12221

申万宏源:牛市1.0高点看26年春季 关注储能、存储、创新药与国防军工

智通财经 浏览 518

养乐多卖不动了?

斑马消费 浏览 816

“强制接管”, 西方这是明抢了?

观察者网 浏览 988

懂穿搭的女人,把“卫衣”收进衣柜,这3件单品才是时髦密码

静儿时尚达人 浏览 982

夏季首选“T恤+直筒裤”,简约不挑人

男士穿衣搭配杂志 浏览 16960

路易斯:感到很失望,明年我不知道还会不会在这里

懂球帝 浏览 734

靠好角色逆风翻盘,娱乐圈是全世界最势利眼的地方?

八卦三缺一 浏览 12853

NVIDIA团队发明超高效视频生成黑科技:让4K视频制作速度提升15倍

科技行者 浏览 816

俄反对派人士狱中放风后失去知觉身亡 拜登发表讲话

红星新闻 浏览 80822

亲生父亲去世当天 尹锡悦再发亲日言论强调"日韩友好"

3号观察室 浏览 85380

游客在成都排火锅等5小时前面还有90多桌 无奈回酒店

红星新闻 浏览 81046

你咋看?美媒列联盟30队首发控卫排名:库里第1 哈登第5 穆雷第10

直播吧 浏览 15941

4、50岁的爱美女人,冬季请收下这些高级的穿搭公式,优雅抬气质

Yuki时尚酱 浏览 13240

周星驰与石榴姐打卡网红店,他低头玩手机无参与感

扒虾侃娱 浏览 18981

多特官宣冬窗首签!桑乔租借回归,三赢交易多特血赚,滕帅赢了

奥拜尔 浏览 13064
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1