关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者800人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

统计局:中国2023年城镇固定资产投资同比增长3%

国家统计局 浏览 12823

特朗普拿错剧本了?刚扬言要禁中国“地沟油”,就遭美媒啪啪打脸

北向财经 浏览 907

苏丹武装部队总司令拒绝与快速支援部队和解

界面新闻 浏览 12564

普里戈任空难,我大胆又谨慎地推断出一个结论

观察者网 浏览 14479

百亿龙头股董事长获刑,已上诉!IPO关键期行贿官员,过程曝光

深蓝财经 浏览 588

今年夏天,这条裤子穿上就显得很有钱

In风尚 浏览 14939

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 4713

车企曾说弃用,激光雷达为什么却在年底迎来爆发?

电厂 浏览 12905

众望所归!诺兰凭《奥本海默》 获最佳导演

网易娱乐 浏览 12158

俄胜利日阅兵装备:基本是非前线作战武器

环球网资讯 浏览 18244

韩素希生图曝光!鼻子弧度变形被吐槽整成匹诺曹,否认整容太打脸

文艺圈娱乐号 浏览 13185

省委书记暗访次日 市委书记赴现场办公要求加快整改

新京报政事儿 浏览 4474

中资银行,两大突发!

券商中国 浏览 11114

为“打击贩毒” 美军调派“福特”号航母至加勒比海

央视新闻客户端 浏览 676

刘维伟:我们今天的失误真的太多了 天津也发挥出很好的水平

直播吧 浏览 19231

有气质的40岁女人都喜欢低马尾和微卷发

成铭聊发型 浏览 19671

新能源汽车的轮胎,为啥那么贵?

小李车评李建红 浏览 786

✔️✔️联手C罗!多家沙特媒体证实利雅得胜利成功签B罗

直播吧 浏览 15461

亚洲最美面孔,还是救不了这片

独立鱼 浏览 915

东华测试寻求打开机器人领域新空间

爱集微 浏览 819

魔咒!曼联8战利物浦不胜1-18 穆鸟被打下课 滕哈赫最后1场?

念洲 浏览 12936
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1