关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西408人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:郑丽文"由绿转蓝"成功逆袭 支持基础系三股力量

上游新闻 浏览 5800

上海9旬老太举报保姆虐待 儿媳:保姆逼写自愿给钱字据

极目新闻 浏览 92853

1999元起 华为畅享70X尊享版开售:麒麟8000芯片、一键发送北斗卫星消息

快科技 浏览 371

智己汽车11月销量13,577台,连续三个月刷新历史纪录

网易汽车 浏览 270

热巴恋情翻车!工作室遭攻击好友被骚扰

萌神木木 浏览 15749

TA:从进攻核心到压迫发起点,梅西角色延伸提升球队上限

懂球帝 浏览 192

“中国建议”在达沃斯受欢迎

环球时报国际 浏览 12639

撒贝宁随李白回加拿大探亲,俩人带着龙凤胎闲逛

二妹扯娱 浏览 969

华为牵手江淮造车?余承东回应:智选车模式!不是亲自造车

证券时报e公司 浏览 18920

俄罗斯研发新式无人艇 未来将针对北约进行部署

国际在线 浏览 13053

拉姆:相信诺伊尔能找回状态,他和穆勒依然能帮助任何球队

直播吧 浏览 16186

朱江明和费翔一起发零跑车皇!增程配80度大电池,“全身名牌”登场

车东西 浏览 1004

中俄联合空中战略巡航引日本担忧 国防部回应

界面新闻 浏览 73

你好李焕英票房超复联4,跻身中国影史票房第四名

趣看热点 浏览 26201

今年夏天流行这4种连衣裙 谁穿谁好看

小西的穿搭日记 浏览 19027

日均排队超千桌!“反预制”的年轻人捧红了地方菜

餐饮老板内参 浏览 946

3家“通达系”A股快递公司9月单价均同比上涨,快递反内卷见成效

红星资本局 浏览 978

无论女人多大年纪,秋天都要准备几件“针织衫”,温柔舒适

静儿时尚达人 浏览 722

保有量接近500万辆 广州要限制电动自行车了

中国新闻周刊 浏览 91194

俄外交部:扎波罗热核电站归属俄罗斯不容置疑

上观新闻 浏览 1590

23岁美国女孩寻中国亲生父母 志愿者找到当年的孤儿院

封面新闻 浏览 10076
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1