Article

动态

国产第一:阿里 Qwen3.7 Max 模型 AI 编程能力超 Claude Opus 4.6 5月26日,IT之家报道了全球权威三方编程榜单Code Arena最新更新的排名情况。在这个榜单中,阿里巴巴旗舰模型Qwen3.7 Max以1541分的成绩位列第二,仅次于Claude系列模型,在大模型厂商中稳居全球第二的位置。 Code Ar...

国产第一:阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

国产第一:阿里 Qwen3.7 Max 模型 AI 编程能力超 Claude Opus 4.6 5月26日,IT之家报道了全球权威三方编程榜单Code Arena最新更新的排名情况。在这个榜单中,阿里巴巴旗舰模型Qwen3.7 Max以1541分的成绩位列第二,仅次于Claude系列模型,在大模型厂商中稳居全球第二的位置。 Code Ar...

国产第一:阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

5月26日,IT之家报道了全球权威三方编程榜单Code Arena最新更新的排名情况。在这个榜单中,阿里巴巴旗舰模型Qwen3.7-Max以1541分的成绩位列第二,仅次于Claude系列模型,在大模型厂商中稳居全球第二的位置。

Code Arena:评估模型实际编程能力的顶级平台

Code Arena是一个在全球人工智能领域极具权威性的编程大模型(LLM)能力评测榜单。该榜单不同于传统学术选择题测试,而是侧重于对模型生成、调试和重构复杂代码的实际编程能力进行评估。为了防止刷榜行为,Code Arena采取了用户随机盲测的方式,确保每款模型必须具备真实的硬核代码生成能力。

阿里Qwen3.7-Max:成绩优异

根据IT之家的公开资料,在最新一轮的Code Arena榜单中,阿里旗舰模型Qwen3.7-Max的表现尤为出色。其得分1541分在全球模型榜单中排名第四位,仅次于Claude系列中的claude-opus-4-7-thinking、claude-opus-4-7和claude-opus-4-6-thinking三个模型。

还有一点,Qwen3.7-Max的编程能力不仅在Code Arena中有所突破,在其他相关竞赛平台如Design Arena(以及其图像侧Imag Arena / LMArena)的表现也十分亮眼。这些竞赛同样基于真实用户盲测,被认为是全球公认度最高的AI模型评测平台之一。

竞争对手:Claude系列

在与Claude系列的直接对比中,Qwen3.7-Max不仅超越了claude-opus-4-6这一款模型,在整体排名上也超过了其他如glm-5.1、kimi-k2.6等模型。

Design Arena的成绩

IT之家进一步查询发现,在最新放出的Design Arena榜单中,阿里旗舰模型Qwen3.7-Max同样取得了令人瞩目的成绩,位列第十名。这证明了其在实际应用中的强大实力和稳定表现。

总结

此次Code Arena和Design Arena的表现,不仅展示了阿里Qwen3.7-Max的强大编程能力,也为更多企业开发者提供了一份可靠的参考依据。

这文章写完后,感觉确实对Claude系列模型构成了压力,希望未来能看到更多这样的竞争者出现。

注:本文信息源于IT之家报道及相关公开资料,具体排名和成绩以官方公布为准。

用本文提到的模型?

注册即送 1000 万 Token,GPT / Claude / Gemini 一键接入。

免费注册

评论反馈

0/500

相关推荐