智谱 GLM-4.7 全面开源 —— 重新定义 AI 编程与长程推理的边界

1. 概览:迈向“先思考,再行动”的智能新高度 智谱 AI 正式发布并开源了 GLM-4.7。作为 GLM 系列的最新进化版,该模型不仅在参数规模上进行了优化(旗舰版约 4000亿 参数),更在底层架构上引入了创新的“思考模式”。 GLM-4.7 的核心使命是解决复杂工程中的长程任务规划问题。在 Code Arena 全球盲测中,GLM-4.7 位列开源模型第一、国产模型第一,其编程能力已与 Claude 3.5 Sonnet 及 GPT-5 系列处于同一梯队。 2. 三大核心认知突破 (The "Thinking" Engine) GLM-4.7 引入了全新的三段式思考机制,让 AI 在处理复杂逻辑时不再“盲目输出”: 交替式思考 (Interleaved Thinking): 模型在给出最终回答或调用工具前,会先在内部进行逻辑推演。这种“想好了再写”的机制显著提升了指令遵循的准确性。 保留式思考 (Preserved Thinking): 在多轮对话和复杂的编程智能体(Agent)场景中,模型能够跨轮次保留思维链路(Reasoning Trace),有效避免了在长文本处理中的信息丢失。 轮次级控制 (Turn-level Thinking): 开发者可以根据任务复杂度动态调节模型的“思考预算”——轻量请求快速响应,复杂任务深度推理,从而平衡效率与性能。 3. 编程与工程能力的飞跃 3.1 统治级的编程基准表现 SWE-bench Verified: 在解决真实 GitHub Issue 的评测中,GLM-4.7 取得了 73.8% 的峰值成绩,居于开源界领先地位。 LiveCodeBench: 斩获 84.9 的高分,超越了诸多同体量的闭源模型。 3.2 视觉与 UI 原生生成 针对前端开发者,GLM-4.7 的 UI 还原能力大幅提升。它能精准解读设计稿,并生成符合审美标准、具备 16:9 比例适配(适配率从 52% 提升至 91%)的 PPT 和前端组件代码。 4. 强大的工具协同与长文本 200K 超长上下文: 支持高达 202,800 个 Token 的输入窗口,能够一次性吞吐整个中型项目的源代码库。 τ²-Bench 突破: 在复杂的工具调用与智能体评测中获得 87.4 分,展现了极强的多步任务执行与纠错能力。 HLE 基准测试: 在被称为“人类最后考试”的硬核推理测试中,GLM-4.7 较前代提升了 41%,在数学逻辑深度上处于全球第一梯队。 5. 开发者集成指南 GLM-4.7 现已通过 BigModel.cn 提供 API 服务,并完整支持MCP。 Bash # 通过 Python SDK 快速调用 from zhipuai import ZhipuAI client = ZhipuAI(api_key="your_api_key") response = client.chat.completions.create(     model="glm-4.7",     messages=[{"role": "user", "content": "请分析这个 Python 闭包逻辑的潜在内存泄露风险..."}],     extra_body={"thinking_mode": "enabled"} # 开启深度思考模式 ) 结语:开源力量,赋能每一个开发者 GLM-4.7 的开源不仅仅是权重的释放,更是对 AI 生产力的重新赋权。通过更简洁、更智能且更具“人情味”的交互体验,它正在将 AI 辅助编程从简单的“代码补全”推向真正的“自主工程协作”。 相关资源 HuggingFace 仓库: THUDM/glm-4.7 官方实测视频: GLM-4.7 编程与 UI 还原能力深度评测 技术贴士: 在处理高难度数学或复杂算法题时,请务必在 API 参数中开启 reasoning_mode。虽然这会略微增加首字响应时间(TTFT),但能显著提升最终答案的逻辑严密性。...
阅读更多