关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3285人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

财政负担持续累积,“节油意识”难以培养,岛内担忧“冻油价”加剧能源困局

环球网资讯 浏览 1651

德邦快递实力夺魁:斩获中国跨境电商物流“头程物流标杆企业”奖项

中国经济时报 浏览 3222

4岁女童在温泉酒店泳池溺水 两名女子跪地抢救20分钟

红星新闻 浏览 92307

古二3次发布录音,王家卫秦雯深陷争议

阿伧说事 浏览 3378

技术+临床双向赋能成都脑机接口产业 迎来新机遇

封面新闻 浏览 761

西班牙拒绝加入美国发起的“和平委员会”

国际在线 浏览 2482

22岁医学生被前男友扼颈杀害 生前开公司转至男方名下

扬子晚报 浏览 9641

日本汽车业面临停产风险!

电动知家 浏览 3769

利智输了?李连杰终是没放下一直亏欠的“她”

顾史 浏览 2573

黄仁勋放大招,全栈 AI 加持的NVIDIA 要承包智驾未来?

汽车观察AUTO 浏览 2591

陈妍希带娃现身海口,儿子小星星近状曝光,母子俩牵手同行好温馨

扒虾侃娱 浏览 3006

中印巴令人意外地站在了同一边 反对美方举措

澎湃新闻 浏览 5336

女人过了40岁真该看看这些穿搭,不老气、不单薄,简单又耐看

静儿时尚达人 浏览 2525

伊姐周六热推:电视剧《余生有涯》;电视剧《猎豹》......

伊周潮流 浏览 3886

第五届意大利繁花电影节圆满落幕!

幕味儿 浏览 3572

美国再退66个"群" 外交部回应

界面新闻 浏览 13051

世上没有免费的豆包

光子星球 浏览 236

为新能源再投10亿,苹果为何还不造车?

BT财经 浏览 3894

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

LinkFashion 浏览 2516

沈梦辰陪婆婆追星圆梦,开朗婆婆让梦辰有点社恐

绿叶贝贝 浏览 2470

伊姐清明热推:电视剧《冰湖重生》;电视剧《月鳞绮纪》......

伊周潮流 浏览 1163
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1