概览
GLM-5 是智谱新一代的旗舰基座模型,面向 Agentic Engineering 打造,能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。在 Coding 与 Agent 能力上,GLM-5 取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务,是通用 Agent 助手的理想基座。
- GLM-5
定位
旗舰基座模型
输入模态
文本
输出模态
文本
上下文窗口
200K
最大输出 Tokens
128K
能力支持
思考模式
提供多种思考模式,覆盖不同任务需求
流式输出
支持实时流式响应,提升用户交互体验
Function Call
强大的工具调用能力,支持多种外部工具集成
上下文缓存
智能缓存机制,优化长对话性能
结构化输出
支持 JSON 等结构化格式输出,便于系统集成
MCP
可灵活调用外部 MCP 工具与数据源,扩展应用场景
GLM in Excel
适配 Excel 官方的 AI 插件,能深度赋能表格工作流
推荐场景
Agentic Coding
Agentic Coding
能基于自然语言自动生成可运行代码,覆盖前后端与数据处理等开发环节,显著缩短从需求到产物的迭代周期。
智能体任务
智能体任务
具备自主决策与工具调用能力,可在模糊复杂目标下完成从理解、规划到执行与自检的全流程智能体任务,实现“一句话输入到完整交付物”。
办公场景
办公场景
通过强大的长程规划与记忆能力,能够稳定完成跨阶段、多步骤、强逻辑关联的复杂办公任务,确保指令遵循度与目标一致性。
角色扮演(RolePlay)
角色扮演(RolePlay)
能精准理解并持续保持角色设定,在叙事、情绪和逻辑上保持一致,实现自然、可演进的高沉浸式角色扮演体验。
剧本 / 分镜脚本生成
剧本 / 分镜脚本生成
在长文本一致性与复杂人物塑造上大幅增强,可稳定输出可直接进入制作流程的高质量剧本内容。
翻译
翻译
能将正式文本准确转换为符合目标语言表达习惯的专业译文,实现语义、术语与表达的全面对齐。
文本数据提取
文本数据提取
可从合同、公告、财报等复杂文本中精准抽取关键字段与逻辑关系,将原始内容稳定转化为可分析的结构化数据,助力企业数据治理与自动化。
信息质检
信息质检
能精准识别客服工单等复杂文本中的关键信息并自动完成质检与风险识别,大幅提升运营效率。
详细介绍
更大基座,更强智能
GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础:
- 参数规模扩展:从 355B(激活 32B)扩展至 744B(激活 40B),预训练数据从 23T 提升至 28.5T,更大规模的预训练算力显著提升了模型的通用智能水平
- 异步强化学习:构建全新的 “Slime” 框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力
- 稀疏注意力机制:首次集成 DeepSeek Sparse Attention,在维持长文本效果无损的同时,大幅降低模型部署成本,提升 Token Efficiency
Coding 能力:对齐 Claude Opus 4.5
GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐,在业内公认的主流基准测试中取得开源模型最高分数。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型最高分数,性能表现超过 Gemini 3.0 Pro。
在内部 Claude Code 评估集合中,GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7,能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务,使用体验逼近 Opus 4.5。
在内部 Claude Code 评估集合中,GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7,能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务,使用体验逼近 Opus 4.5。
使用资源
体验中心:快速测试模型在业务场景上的效果接口文档:API 调用方式
调用示例
以下是完整的调用示例,帮助您快速上手 GLM-5 模型。
- cURL
- Python
- Java
- Python(旧)
基础调用流式调用
