关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3267人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李斌被告!蔚来被指虚增收入和利润,港股闪崩13%

深蓝财经 浏览 3672

美可能供乌战斧导弹 俄方:或成俄乌局势重大升级节点

财联社 浏览 3759

“精准”归来:戴尔正式宣布推出"Pro Precision"工作站产品线

IT之家 浏览 1711

刘强东朋友圈疑曝光,自嘲在老婆面前失去没自信

柠檬有娱乐 浏览 3489

长安启源06/阿维塔06GT领衔 长安集团新车前瞻

太平洋汽车 浏览 2051

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 2354

smart精灵#3艺术特别版上市售18.49万

网易汽车 浏览 2500

埃尔多安指责以色列违反加沙停火协议

新华社 浏览 3630

婚后的申敏儿,爱上了穿牛仔

时尚COSMO 浏览 477

赖清德声称打造所谓"台湾之盾"防空系统 国台办回应

界面新闻 浏览 3779

有爱,大马丁赛前与家乡球队阿尔多希维的球迷交换球衣

懂球帝 浏览 3716

TVB万千星辉奖项出炉!佘诗曼四封视后成赢家,黄宗泽爆冷拿视帝

萌神木木 浏览 2523

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

伊周潮流 浏览 2192

4万店美宜佳,为何沦为假烟集散地?

斑马消费 浏览 1641

多名男女在呼伦贝尔大草原上跳起"纸片舞" 当地回应

扬子晚报 浏览 8793

2026年AI赛道群雄逐鹿,跨国车企巨头如何摆兵布阵?

禾颜阅车 浏览 2638

海港0-2町田,傅欢乌龙,海港全场1射正,相马勇纪破门

懂球帝 浏览 3304

随着广东+上海+广厦全赢球,CBA最新积分榜如下:2队全胜+2队全败

侃球熊弟 浏览 3000

媒体:华盛顿一声枪响后 美英两个老人握手较劲八秒

新民周刊 浏览 31685

布朗三节41+6!绿军狂胜老鹰列东部第二 豪瑟30+10三分平纪录

醉卧浮生 浏览 2567

IPO倒计时,解码希迪智驾“攻守道”

第一财经资讯 浏览 3040
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1