Code Arena放榜:阿里千问3.7编程能力排名全球第二

上海证券报·中国证券网 05-26 13:49

5月26日凌晨,全球权威三方编程榜单Code Arena放榜,阿里最新旗舰模型Qwen3.7-Max得分1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二。这也标志着,在代码理解与生成领域,千问3.7成功跻身全球编程模型第一梯队。

编程能力是当下模型智能水平的核心指标,而Code Arena是由知名第三方大模型盲测平台LMArena推出的最具影响力的榜单之一。与传统的代码基准测试不同,Code Arena并不考核孤立的代码片段生成或传统算法题,而是由开发者出题,要求模型从零生成完整的、可交互的Web应用程序,并交由用户对匿名模型的生成效果进行两两PK,由投票综合生成榜单。因此,Code Arena也被认为是目前全球最具公信力的AI编程能力评测之一。

经全球开发者以真实使用体验盲测投票,千问3.7模型编程能力位居前4,打破由Claude-Opus-4.7和4.6统治已久的前四格局,Qwen3.7-Max也成为目前榜单中唯一突破1540分大关的国产大模型。

据了解,面向Agent打造的Qwen3.7-Max在编程、智能体、长程任务等核心能力上实现大幅突破,不但能在数小时内独立完成专业团队耗时2周的复杂项目端到端交付,大幅提升办公自动化和企业级生产力,甚至可以持续运行35小时、累计超1000次工具调用的复杂长程任务,自我编程优化芯片内核。

(文章来源:上海证券报·中国证券网)

文章来源:上海证券报·中国证券网
文章作者:杨翔菲
原标题:Code Arena放榜:阿里千问3.7编程能力排名全球第二
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
国务院印发《加快农业农村现代化“十五五”规划》
国务院印发《加快农业农村现代化“十五五”规划》
新华社 1771评论
上海:推动科创50、深证100、创业板股指期货和期权上市
上海:推动科创50、深证100、创业板股指期货和期权上市
中国基金报 1354评论
全球首条 正式开通!我国光通信技术实现重要突破
全球首条 正式开通!我国光通信技术实现重要突破
科技日报 1087评论
腾讯云:DeepSeek-V4系列模型降价 最高降幅达97.5%
腾讯云:DeepSeek-V4系列模型降价 最高降幅达97.5%
证券时报 1656评论
打开东方财富APP查看更多内容
24小时点击排行
科技主线不改,六月如何逢低布局科创行情?
操作丨CPO大涨再创新高!硬科技行情卷土重来,抓紧时间跑路?
提醒:光亮了!主线强势反攻,机会来了!
科莱瑞迪
探底回升 明天关注一点
点击查看更多内容
写评论 ...