关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3321人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

消失8年,这T0级演员突然复出了

独立鱼 浏览 4130

中方在联合国点名日本 呼吁警惕其涉核消极动向

极目新闻 浏览 1124

歌手黄安:屠颖因在跑步机上摔跤致颅内出血去世

红星新闻 浏览 10147

超34.2万人爆仓,比特币一度跌破10万美元关口

观察者网 浏览 4118

前TVB男星回应拒演电影《寻秦记》传闻

TVB剧评社 浏览 3260

女子把100克黄金当垃圾扔了急哭 查监控发现被人捡走

黄河新闻网吕梁频道 浏览 9665

王嘉尔东京开唱,日本名流圈组团来“团建”?

情感大头说说 浏览 4196

记者:阿根廷19岁中卫托维亚斯-拉米雷斯没考虑去迈阿密国际

懂球帝 浏览 3110

首搭纯电quattro 奥迪E5 Sportback售23.59万起

网易汽车 浏览 5141

郑丽文赴美前表态:不当"麻烦制造者" 不会拖美国下水

海峡导报社 浏览 22846

以色列警告加沙居民:只剩最后机会撤离

环球时报国际 浏览 4508

乌克兰决定与尼加拉瓜断交

参考消息 浏览 3336

全红婵还没回国家队!大概率缺席冬训

草莓解说体育 浏览 2647

布里斯班新科亚军科斯秋克:我的关于萨巴伦卡的话被断章取义

网球之家 浏览 3316

前女友曝19岁荣梓杉出轨打人,男方评论区沦陷,网友喊话道歉退圈

扒虾侃娱 浏览 4445

北京这一天,陈晓秒了罗一舟,短剧男主和长剧男主一眼看出差别

娱乐圈笔娱君 浏览 3897

伊朗官员提开放霍尔木兹海峡条件

央视新闻客户端 浏览 1738

特朗普敲打美最高法院:再做出否决 中国就赚爽了

观察者网 浏览 38431

媒体:被昔日学生中国超越 欧洲落于人后的悲观正蔓延

澎湃新闻 浏览 6278

西蒙菲莎大学发布:1.7万图像皮肤病变数据集训练AI诊断

科技行者 浏览 3328

基米希:十年前拜仁有很多个人主义,如今队友更愿为团队奉献

懂球帝 浏览 4182
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1