首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
民权县
>
正文
【阿里公布千问Qwen3.7】
2026-05-20 15:46:17
新浪新闻
5月阿里巴巴推出新一代千问旗舰模型Qwen3.7-Max,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。据悉,千问3.7面向当下智能体全新设计,实现了编程、推理等核心能力的持续突破,甚至可全自主完成35小时的超长程智能体复杂任务:该领域上,Qwen3.7-Max借助自主编程和超1000次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升10倍。当下,编程能力已成为衡量LLM大语言模型的核心指标,Qwen3.7-Max较上代模型实现了大量提高,从前端原型开发到复杂的多文件工程均能驾驭。以往需专业团队耗时一至两周的复杂项目,现由 Qwen3.7-Max 驱动的智能体可在数小时内完工端到端交付闭环。经过MCP集成和多智能体协作,Qwen3.7-Max在企业级办公场景实现工作流自动化,在办公自动化基准 SpreadSheetBench-v1上斩获87分,处于顶尖水平,是可靠的办公与生产力助手。实战任务测试中,Qwen3.7-Max还展示了当下智能体所能达到的长程任务极限。千问3.7具有极强的Agent能力,并涌现出跨多种智能体框架的泛化能力,在 Claude Code、OpenClaw、Qwen Code 等框架下都能稳定发挥,有该领域的可靠底座。千问3.7是出色的编程智能体,可自主编写代码创造工具,精准执行任务,完成复杂编程的自我纠错迭代,就像个资深工程师,跑完从需求分析到测试迭代的全流程,自主产出可用的工业级成就。在一个模型训练时该领域平台——平头哥真武M890芯片上,千问3.7自主结束了一个复杂的推理内核优化任务。持续增强的编程能力,也为智能体完成更复杂、更长周期的任务打下坚实基础。在评估AI解决真实世界的实战编程任务SWE-bench系列测评、面向真实科学问题的编程测评SciCode中,Qwen3.7-Max较Qwen3.6-Plus大量增强,并超越了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。在该领域、硬件文档或新架构的示例内核情况下,千问3.7仅从一个包含任务描述、SGLang Triton 参考实现和评测脚本的空白工作空间出发,从“零”开始连续编程 35 小时,独立进行了 432 次内核评估、1158 次工具调用,完全自主地完工了编写、编译、性能分析与迭代改进的全流程。
<
上一篇:网红城市层出不穷 甘肃天水的“热辣滚烫”能否不断?
热点排行
0
(友城故事)斯洛文尼亚驻华大使:卢布尔雅那与成都合作空间广阔
0
美伊干仗,怎么把避|孕套干涨价了?
1
《白俄罗斯“洋女婿”与古都西安的“数字情缘”》
2
{中方敦促美方立即停止针对委内瑞拉的行动}
3
《软银方案在美国上市新人工智能与机器人公司》
4
湖南严打新型非法金融活动< 聘任百>余名公益宣传大使
5
OpenAI挂倒档,1|岁Sora“安乐死”
6
中企承建哈萨克斯坦|首都轻轨建成通车
7
[门票“做减法”,文旅“添活力”——透视景区免票现象]
8
中煤协:预计今年煤炭消费小幅增加,煤炭市场供需总体平衡
9
天津:赴一场海|河河畔的艺术之约
今日商丘
新浪微博
商丘网
商丘日报