找回密码
 立即注册
搜索

Claude 4发布,能连轴转编程7小时,力压GPT-4.1

[复制链接]
xinwen.mobi 发表于 2025-5-24 08:45:27 | 显示全部楼层 |阅读模式
北京时间2025年5月23日,Anthropic公司发布了Claude 4系列大模型,包含Claude Opus 4和Claude Sonnet 4两个版本。其中Claude Opus 4能连轴转编程7小时,在多项编程测试中表现优于GPT-4.1,展现出了强大的性能。具体如下:长时间编程能力:Claude Opus 4在Rakuten的测试数据中,凭借改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,可在软件环境中连续进行近7小时的代码生成和任务执行,刷新了AI世界纪录,远超前代Claude 3 Opus的不到1小时,也领先于其他同类模型。编程基准测试成绩:在用于评估模型解决真实GitHub问题能力的SWE - bench基准测试中,Claude Opus 4准确率高达72.5%,而GPT-4.1仅为54.6%。在针对多步骤终端代码生成任务验证模型表现的TerminalBench测试里,Claude Opus 4准确率达到43.2%,也展现出了优秀的编程能力。此外,Claude Sonnet 4取代了前代Claude 3.5 Sonnet,在架构上更为稳定,虽推理能力不及Opus 4,但支持多文件代码导航等功能,且延迟表现更佳,在SWE - bench基准测试中也取得了72.7%的高分,表现较为出色。
回复

使用道具 举报

QQ|周边二手车|手机版|标签|xml|txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )|网站地图

GMT+8, 2026-3-19 06:03 , Processed in 0.132414 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表