关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3641人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国商业联合会:人工智能加速拓展服务消费新场景

新华社 浏览 2692

一加Ace 6T宣布12月3日发布!全球首发第五代骁龙8、超8000mAh大电池

快科技 浏览 3225

乌官员:袭击乌方设施的俄"榛树"导弹未携带弹头

环球网资讯 浏览 2611

日本渣男骗前女友拍全裸写真出轨

孤独的独角兽影视 浏览 2637

号称“租手机赚钱”,知名平台突然爆雷!有员工抵押房产上班两月,套牢130多万元,投资者:我66台iPhone没了

每日经济新闻 浏览 3349

全球1~8月电池装机量,韩系继续败退

汽车公社 浏览 3771

今年冬天一定要拥有的6件衣服,谁穿谁好看!

LinkFashion 浏览 3056

女友BELLA+封面 | 高杨:步履稳定,心向未知

伊周潮流 浏览 3194

墨西哥总统宣布将向古巴提供援助并推动恢复石油供应

上观新闻 浏览 2302

官方:马来西亚裁判组将执法成都客战首尔,纳西鲁丁担任主裁

懂球帝 浏览 3589

星海T5预售解析:10万级全场景SUV务实主义答卷

众车网 浏览 3018

小李子塞隆绝色出演,伍迪艾伦的绝妙讽刺剧

幕味儿 浏览 3046

小米集团宣布最高25亿港元的自动股份回购计划并将注销

网易财经 浏览 2584

美媒炒作中国大豆采购进度 遭到美国贸易代表直接反驳

澎湃新闻 浏览 19907

腾讯元宝宣布“任务”功能上线:一句话安排时间,到点就提醒

IT之家 浏览 2903

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 3123

“羽绒服+半身裙”,混搭风太好看了!保暖又气质!

Yuki女人故事 浏览 2781

曼晚:奥比-马丁目前短板很明显,还未达到曼联一线队要求

懂球帝 浏览 1034

26款奇瑞冰淇淋/小蚂蚁上市 报废双补价3.4万元起

网易汽车 浏览 2671

马斯克Grok 4.2炒股收益率夺冠

财闻 浏览 2588

瑞银:中国出现AI泡沫的概率不高,变现靠云与广告

第一财经资讯 浏览 2644
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1