国产第一：阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

tech2026-06-150 阅读

国产第一：阿里 Qwen3.7 Max 模型 AI 编程能力超 Claude Opus 4.6 5月26日，IT之家报道了全球权威三方编程榜单Code Arena最新更新的排名情况。在这个榜单中，阿里巴巴旗舰模型Qwen3.7 Max以1541分的成绩位列第二，仅次于Claude系列模型，在大模型厂商中稳居全球第二的位置。 Code Ar...

5月26日，IT之家报道了全球权威三方编程榜单Code Arena最新更新的排名情况。在这个榜单中，阿里巴巴旗舰模型Qwen3.7-Max以1541分的成绩位列第二，仅次于Claude系列模型，在大模型厂商中稳居全球第二的位置。

Code Arena：评估模型实际编程能力的顶级平台

Code Arena是一个在全球人工智能领域极具权威性的编程大模型（LLM）能力评测榜单。该榜单不同于传统学术选择题测试，而是侧重于对模型生成、调试和重构复杂代码的实际编程能力进行评估。为了防止刷榜行为，Code Arena采取了用户随机盲测的方式，确保每款模型必须具备真实的硬核代码生成能力。

阿里Qwen3.7-Max：成绩优异

根据IT之家的公开资料，在最新一轮的Code Arena榜单中，阿里旗舰模型Qwen3.7-Max的表现尤为出色。其得分1541分在全球模型榜单中排名第四位，仅次于Claude系列中的claude-opus-4-7-thinking、claude-opus-4-7和claude-opus-4-6-thinking三个模型。

还有一点，Qwen3.7-Max的编程能力不仅在Code Arena中有所突破，在其他相关竞赛平台如Design Arena（以及其图像侧Imag Arena / LMArena）的表现也十分亮眼。这些竞赛同样基于真实用户盲测，被认为是全球公认度最高的AI模型评测平台之一。

竞争对手：Claude系列

在与Claude系列的直接对比中，Qwen3.7-Max不仅超越了claude-opus-4-6这一款模型，在整体排名上也超过了其他如glm-5.1、kimi-k2.6等模型。

Design Arena的成绩

IT之家进一步查询发现，在最新放出的Design Arena榜单中，阿里旗舰模型Qwen3.7-Max同样取得了令人瞩目的成绩，位列第十名。这证明了其在实际应用中的强大实力和稳定表现。

总结

此次Code Arena和Design Arena的表现，不仅展示了阿里Qwen3.7-Max的强大编程能力，也为更多企业开发者提供了一份可靠的参考依据。

这文章写完后，感觉确实对Claude系列模型构成了压力，希望未来能看到更多这样的竞争者出现。

注：本文信息源于IT之家报道及相关公开资料，具体排名和成绩以官方公布为准。

用本文提到的模型？

注册即送 1000 万 Token，GPT / Claude / Gemini 一键接入。

免费注册

动态

国产第一：阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

用本文提到的模型？

评论反馈

相关推荐

OpenAI CEO 萨姆 · 奥尔特曼：AI 普及不太可能引发“就业末日”

Claude Code 创始人切尔尼建议计算机科学毕业生创业：现在是黄金时代

华为鸿蒙 HarmonyOS 6.1.1 开发者版本 API 24 转正

消息称微软、优步等巨头重估 AI 成本，Token 用量暴涨未必换来有用功能