关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者2430人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

湖北U20 1-0山东U20,范绪林点射制胜

懂球帝 浏览 2894

香港知名女歌手自爆追求者众多,择偶靠感觉

TVB剧评社 浏览 2676

媒体分析:特朗普宣称要"接管"委内瑞拉 有多大可行性

澎湃新闻 浏览 10150

古特雷斯:联合国将全力支持加沙停火协议

环球网资讯 浏览 3757

黎巴嫩真主党证实其高级领导人遭以军空袭身亡

环球网资讯 浏览 3304

华为鸿蒙 HarmonyOS 6.0.0.107 SP7 / SP5 Developer 版本发布

IT之家 浏览 3781

特朗普称让美国大型石油公司进入委内瑞拉

界面新闻 浏览 2739

女人会不会穿衣区别很大,记住这“三要三不”原则,得体大方

静儿时尚达人 浏览 295

距离仅10到15米 飞行员驾驶歼-16倒飞驱离外军战机

环球网资讯 浏览 3716

"老虎"高以忱被开除党籍:大搞政商勾连 大肆收钱敛财

界面新闻 浏览 12193

卫星图像首次发现:伊朗两处受损核设施有"重大活动"

澎湃新闻 浏览 7110

玩家用PS5手柄意外获得6700台大疆扫地机器人控制权:实时视频流泄露 官方回应

快科技 浏览 2074

张智霖儿子返港,185魔童气质提升

星夜涟漪 浏览 2538

快船今日首发中有4人34+岁,NBA近9年来首队

懂球帝 浏览 2276

市民举报3600平违建存续8年 官方:违建人患病不能强拆

扬子晚报 浏览 19910

周末重磅!特朗普关税突发,中美经贸磋商进展,下周三大事件

看财经show 浏览 3590

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 2938

河南田地积水玉米发霉 农民:夏天求的雨下在了秋天

经济观察报 浏览 9508

宏福苑4小时内火警连升三级:单户最大面积44.9平方米

红星新闻 浏览 30499

电动车宣称功能永久免费用后却要求付费升级 官方立案

扬子晚报 浏览 31582

混动系统为内燃机续命 沃尔沃最新消息曝光

乐选爱车 浏览 3499
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1