关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3621人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

车标比界“少一角”,华为系“境”与“界”差别在哪?

汽扯扒谈 浏览 2485

揭秘广州男篮打NBA季前赛:获马刺快船森林狼邀请 还能赚出场费

醉卧浮生 浏览 3814

新增AI试穿场,淘宝510答题免单零点已上线

财闻 浏览 302

泸天化“三合一”高管王斌因个人原因辞职,总经理傅利才暂代财务总监、董秘职务

红星资本局 浏览 2002

丫邦组合与凤凰组合会师决赛

体坛周报 浏览 4163

42岁暴瘦脱相崩溃大哭的蒋欣,给所有人提了个醒

阿会情感 浏览 3429

欧洲对美方"28点计划"逐一删改 令俄罗斯舆论颇为不满

环球网资讯 浏览 16157

英国以“最高优先级”正式调查社交平台X

新华社 浏览 2701

记者:曼市双雄尚未和森林谈安德森,若欧联夺冠森林希望留人

懂球帝 浏览 1045

米兰球员身价变更:帕夫洛维奇+1000万,巴尔泰萨吉+1500万

懂球帝 浏览 3190

伊姐周六热推:电视剧《四喜》;电视剧《唐朝诡事录之长安》......

伊周潮流 浏览 3548

三次联排后,央视春晚越看越悬:分会场像宣传片主会场全是老套路

肆季娱乐 浏览 2416

华为智慧屏新品MateTV Max今日预售,110英寸64999元

IT之家 浏览 3240

伊朗突然关闭领空引猜测 西方密集渲染"动武"威胁

环球网资讯 浏览 13887

埃迪-豪7次面对伯恩茅斯场均积分0.7分,仅比对阵曼城、红军更多

直播吧 浏览 4448

70岁老人与歹徒搏斗被咬掉鼻子吞下 曾一度剧痛半昏迷

潇湘晨报 浏览 34386

美军高官称希望韩建核潜艇对抗中国 还引了句"蜘蛛侠"

澎湃新闻 浏览 44892

杨振宁回国定居在清华园已超20年 为自家取名"归根居"

南方都市报 浏览 4482

媒体:高市早苗当选首相 对华采取挑衅措施的可能提升

界面新闻 浏览 8369

递交亮眼成绩单!中国人寿前三季度新业务价值强劲增长41.8%

证券市场周刊 浏览 3633

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 3724
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1