关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3278人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

可搭载“波塞冬”核动力无人潜航器 俄新一艘核潜艇出坞

上观新闻 浏览 3516

世体:马竞不会轻易放走拉斯帕多里,未来几天罗马将加大攻势

懂球帝 浏览 2865

梁靖崑一脸沮丧令人心疼!10-6手握赛点被逆转 腰伤困扰他9个月

颜小白的篮球梦 浏览 3234

阿斯:巴萨接近回归财务1:1,今夏或可恢复正常转会操作

懂球帝 浏览 2413

《阿凡达3》票房预估214亿,195分钟一刀不剪,力争影史第一

娱乐圈笔娱君 浏览 3137

风云T9L全解析:“理工男”的浪漫情怀该如何表达?

汽湃 浏览 332

邮报:法布雷加斯和特里不在切尔西新帅候选名单上

懂球帝 浏览 2765

小鹏 P7+ 汽车累计交付 8 万台

IT之家 浏览 3706

"特朗普黄金卡"正式接受申请 从500万降至100万美元

国是直通车 浏览 19771

入秋第一条裤子就买它!时髦显瘦,巨好看!

Yuki女人故事 浏览 4291

约旦基地美军战机骤增 包括F-35隐形战斗机

上观新闻 浏览 2056

豆包手机助手宣布将部分调整AI操作能力

中新经纬 浏览 3013

美防长:战事不会“没完没了”

环球网资讯 浏览 452

《恋人》要空降?会成下个《许我耀眼》吗?

楚楚号 浏览 2884

车机升级 第五代宏光MINIEV将于3月下旬上市

车质网 浏览 1640

E句话| 马尔福已经成了马年吉祥物?

仙女事件簿 浏览 2369

小米澎湃OS 3上线2026年元旦限定水印,三种版式自由选择

IT之家 浏览 2516

具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地|36氪首发

36氪 浏览 3007

诺和诺德再现高层震荡!董事长等7名高管将集体离职,近一年市值蒸发超千亿美元

时代周报 浏览 3603

苦等14年 50岁贝克汉姆获封英国王室最高爵士头衔

封面新闻 浏览 16001

特朗普或为中国制造三大机遇,中国如何利用?

浏览 26458
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1