关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2646人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:利物浦从德比郡召回23岁后卫欧文-贝克

懂球帝 浏览 2806

官方:尤文签下曼城19岁前锋奥博阿夫沃多,球员将加入新一代

懂球帝 浏览 2414

重新定义边界,吉利全域安全进入 2.0 时代

网易汽车 浏览 2991

内维尔:B费的表现就像坎通纳;曼联的表现体现了球队的DNA

懂球帝 浏览 2630

港交所陈翊庭:香港IPO发行量全球第一,近半来自A股公司!宁德时代股价翻倍

时代周报 浏览 3768

媒体:中方反制不当域外管辖 欧盟商会又紧张起来了

澎湃新闻 浏览 34115

李小龙妻子琳达晚年透露:丈夫其实很怕一种对手

南书房 浏览 3404

以军频繁袭击 加沙"黄线"附近居民被迫再度离开家园

海外网 浏览 3533

曼联官宣利马伤情,恐缺席两周战水晶宫存疑!曝红魔欲签热刺铁卫

罗米的曼联博客 浏览 2055

四足机器人首次同时「思考+走路」,北大提出链式推理MobileVLA-R1

新智元 浏览 3105

近11战1胜10负!哈登缺阵快船惨败雷霆 近两战合计净负39分

Emily说个球 浏览 2998

MIT研究发现:人工智能已经可以取代美国11.7%的劳动力

华尔街见闻官方 浏览 3145

刘强东“10年1元年薪”之约到期,律师解构高净值人群如何妥善处理财产

红星资本局 浏览 4316

准美术生持枪闯海湖庄园被击毙:来自特朗普铁粉家庭

新民周刊 浏览 38239

地区战争风险加剧 哥伦比亚总统重批美国“侵略拉美”

环球网资讯 浏览 3818

以色列:随时重返战场

极目新闻 浏览 1056

光伏企业3季报里的秘密:反内卷之下,行业真的触底反弹了吗?

赶碳号 浏览 3508

明抢!中国企业147亿半导体资产被荷兰政府冻结,CEO被停职;小米第三款车YU9多张实车谍照曝光;美团外卖骑手能屏蔽顾客了丨雷峰早报

雷峰网 浏览 3866

见证历史!深夜,全线爆发!

券商中国 浏览 4380

女子买房遇"非正常死亡"事件 卖家:死者自愿离开世界

环球网资讯 浏览 8795

蔚来四季度盈利的底气,到底是什么?

21世纪经济报道 浏览 3638
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1