关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者822人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

会穿西装的女人气质都不差 这样搭又美又飒

八只爪的猫 浏览 19615

极氪赵昱辉:极氪009订单表现超预期,正解决供应链短缺的影响

Tech星球 浏览 19471

AI狂热不敌冷峻现实:企业下调AI代理预期,实现全自动化仍需数年时间

华尔街见闻官方 浏览 696

2022年住房公积金个人房贷金额减少15%,多地放宽公积金贷款政策能否惠及更广人群?

华夏时报 浏览 16468

男子取170万元现金 在银行门口遭抢劫致重伤左眼失明

扬子晚报 浏览 14512

宝利德破产听证后官司缠身 昔日豪车经销商驶向何方

财闻 浏览 576

曝货拉拉司机不充会员每天只能接两单,平台对割韭菜行为毫不避讳

趣看热点 浏览 552422

驱动绿色智算 筑牢AIDC基石:华为携液冷热管理控制器TMU亮相2025CDCC大会

环球网资讯 浏览 388

玻利维亚决定与以色列断绝外交关系 以色列外交部回应

环球网 浏览 80215

多地突然取消!小地方,不配办马拉松了?

西部城市 浏览 778

金正恩表态:韩国是朝鲜"主敌" 朝方拥有压倒性力量

参考消息 浏览 73757

华语乐坛重量级编曲大师屠颖意外去世 儿子发文悼念

鲁中晨报 浏览 5695

好家伙!《武林外传》姐妹篇开播差评一片,观众差评理由出奇一致

娱乐圈笔娱君 浏览 12884

钟嘉欣携全家游越南,三代同堂幸福满溢,父母海边高调撒糖超甜蜜

扒虾侃娱 浏览 12999

外媒称中国正建设第四艘航母 国防部回应

财联社 浏览 1493

获皮奥利称赞!小法回应:很感谢他,去年曾联系他并聊了两个小时

直播吧 浏览 1645

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 11714

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 1049

外媒聚焦中国“最强航母”:看得清清楚楚 很冲击了

观察者网 浏览 4892

发力高质量发展!全国人大代表李政:深耕高端制造,掌握更多核心科技

时代周报 浏览 18969

连杨幂都要蹭的土造型 究竟是怎么被捧红的?

新氧 浏览 15328
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1