GLM Coding 套餐全新上线!旗舰模型 GLM-4.5 包月畅享,适用于 Claude Code、Cline 等主流编程工具,1/7价格,3倍用量,独家升级支持联网搜索&多模态理解。限时特惠 ¥20/月起,手慢无,立享好价!
推荐模型
GLM-4.5
最新旗舰模型
- 专为智能体应用打造
- 综合能力开源模型SOTA
GLM-4.5V
同级别最强视觉推理模型
- 视频、图片、复杂图表解析
- 新增“思考模式”开关
GLM-Z1-Air
高性价比深度思考模型
- 强化推理能力
- 逻辑分析清晰
模型一览
若需要看模型价格,请直接前往价格页面。
文本模型
文本模型是一类专注于处理和生成自然语言的模型,涵盖了语言理解与推理能力,能够自动处理海量文本数据并进行逻辑推导。智谱的文本模型结合了强大的语言模型和推理模型,使得系统不仅能理解和生成文本内容,还能进行高层次的推理和判断。模型 | 定位 | 特点 | 上下文 | 最大输出 |
---|---|---|---|---|
GLM-4.5 | 高智能旗舰 | - 性能最优 - 强大的推理能力、代码生成能力 以及工具调用能力 | 128K | 96K |
GLM-4.5-X | 高智能旗舰-极速版 | - 推理速度更快 - 适用于搜索问答、智能助手、实时 翻译等时效性较强场景 | 128K | 96K |
GLM-4.5-Air | 高性价比 | - 同参数规模性能最佳 - 在推理、编码和智能体任务上表现 强劲 | 128K | 96K |
GLM-4.5-AirX | 高性价比-极速版 | - 推理速度快,且价格适中 - 适用于时效性有较强要求的场景 | 128K | 96K |
GLM-4-Plus | 性能优秀 | - 性能最优 - 语言理解、逻辑推理、指令遵循、 长文本处理效果领先 | 128K | 4K |
GLM-4-Air-250414 | 高性价比 | - 快速执行复杂任务 - 擅长工具调用、联网搜索、代码 | 128K | 16K |
GLM-4-Long | 超长输入 | - 支持高达 1M 的上下文长度 - 能够理解和回应复杂的查询 - 专为处理超长文本和记忆型任务 设计 | 1M | 4K |
GLM-4-AirX | 极速推理 | - 超快的推理速度 - 强大的推理效果 | 8K | 4K |
GLM-4-FlashX-250414 | 高速低价 | - Flash 增强版本 - 超快推理速度 - 更快并发保障 | 128K | 16K |
GLM-Z1-Air | 高性价比 | - 高性价比 - 具备深度思考能力 - 数理推理能力显著增强 | 128K | 32K |
GLM-Z1-AirX | 极速推理 | - 国内最快的推理速度,支持 8 倍推理速度 - 问题即问即答 | 32K | 30K |
GLM-Z1-FlashX | 高速低价 | - 超快推理速度 - 更快并发保障 - 极致性价比 | 128K | 32K |
GLM-4.5-Flash | 免费模型 | - 最新基座模型的普惠版本 | 128K | 96K |
GLM-4-Flash-250414 | 免费模型 | - 超长上下文处理能力 - 多语言支持 - 支持外部工具调用 | 128K | 16K |
GLM-Z1-Flash | 免费模型 | - 复杂任务推理 - 轻量级应用 | 128K | 32K |
视觉模型
视觉模型是一类能处理图像或视频等视觉信息的模型,广泛应用于识别、分析与决策任务。其中,视觉理解模型侧重于看懂图像内容,如识别物体、场景和关系;而视觉推理模型进一步具备看图思考的能力,能结合视觉与语言信息完成逻辑判断、因果分析和多步推理,常用于图文问答、图像描述生成、多模态对齐等复杂任务。模型 | 定位 | 特点 | 上下文 | 最大输出 |
---|---|---|---|---|
GLM-4.5V | 旗舰视觉推理 | - 同级别开源视觉推理模型SOTA - 覆盖视频理解、复杂文件解析、前端复刻等核心场景 - 新增“思考模式”开关 | 64K | 16K |
GLM-4.1V-Thinking-FlashX | 轻量视觉推理 | - 视觉推理能力 - 复杂场景理解 - 多步骤分析 - 高并发 | 64K | 16K |
GLM-4V-Plus-0111 | 视觉理解 | - 图像理解能力强 - 支持图文对话 - 场景识别准确 | 16K | 动态计算: 上下文-输入 |
GLM-4.1V-Thinking-Flash | 免费模型 | - 视觉推理能力 - 复杂场景理解 - 多步骤分析 | 64K | 16K |
GLM-4V-Flash | 免费模型 | - 图像理解 - 多语言支持 | 16K | 动态计算: 上下文-输入 |
图像生成模型
图像生成模型是一类通过学习海量图像数据,实现从文本、草图或其他图像自动生成高质量图片的模型,广泛应用于视觉内容创作、游戏美术、产品设计、医学影像合成等领域。模型 | 定位 | 特点 | 多分辨率 |
---|---|---|---|
CogView-4 | 图像生成 | - 高质量图像生成 - 风格多样化 - 细节丰富 | 支持 |
CogView-3-Flash | 免费模型 | - 创意丰富多样 - 推理速度快 | 支持 |
视频生成模型
视频生成模型是一类通过学习时序视觉数据,从文本、图像或其他视频素材生成动态视频内容的模型,广泛应用于影视制作、虚拟人、动画生成、数字营销等领域。模型 | 定位 | 特点 | 多模态支持 | 多分辨率 |
---|---|---|---|---|
CogVideoX-3 | 高智能旗舰 | - 主观清晰度大幅提升 - 更好的指令遵循、物理真实模拟 - 现实、3D风格场景表现提升 - 新增首尾帧生成功能 | 图像、文本、首尾帧 | 支持 |
CogVideoX-2 | 高性价比 | - 支持主体进行大幅度运动 - 驾驭多种艺术风格 | 图像、文本 | 支持 |
Vidu Q1 | 质量较优 | - 影视级的画质清晰度 - 精准解决画面崩坏 - 多艺术形态的风格 - 行业标杆级转场流畅度 | 图像、文本、首尾帧 | 不支持 |
Vidu 2 | 高速低价 | - 速度优、性价比优 - 语义增强的首尾帧衔接 - 多参考图的一致性强化 | 图像、参考、首尾帧 | 不支持 |
CogVideoX-Flash | 免费模型 | - 沉浸式AI音效 - 4K 高清画质呈现 - 10 秒视频时长拓展 - 60fps 高帧率输出 | 图像、文本 | 支持 |
音视频模型
音视频模型是一类处理音频与视频信号的多模态模型,能够理解、生成或编辑视听内容,广泛应用于虚拟人、语音驱动动画、视频配音与剪辑、跨模态检索等场景。模型 | 定位 | 特点 | 多模态支持 |
---|---|---|---|
GLM-4-Voice | 语音模型 | - 直接理解和生成中英文语音,实现实时语音对话 - 根据用户指令灵活调整语音的情感、语调、语速和方言等特性 | 文本、音频 |
GLM-Realtime | 实时音视频 | - 能够提供实时的视频通话功能,通话记忆时长长达2分钟 - 具有跨文本、音频和视频进行实时推理的能力 | 视频、音频、文本 |
GLM-ASR | 语音识别 | - 上下文智能理解 - 强抗噪性能 - 多语言多方言覆盖 | 音频 |
向量模型
向量模型用于将高维的离散数据转换为低维的连续向量,捕捉数据的语义特征和关系。您可以使用我们的向量模型构建语义检索增强、聚类、主题建模和分类等功能。模型 | 定位 | 上下文 |
---|---|---|
Embedding-3 | V3 | 8K |
Embedding-2 | V2 | 8K |
其他模型
模型 | 定位 | 特点 | 上下文 | 最大输出 |
---|---|---|---|---|
CharGLM-4 | 拟人模型 | 适用于情感陪伴和虚拟角色 | 8K | 4K |
Emohaa | 心理模型 | 具备专业咨询能力,帮助用 户理解情感并应对情绪问题 | 8K | 4k |
CodeGeeX-4 | 代码模型 | 适用于代码自动补全任务 | 128K | 32k |
Rerank | 重排序模型 | 计算文本之间的 score 值, 对召回结果进行重排序 | 4K | - |
即将弃用模型
我们已经宣布了以下模型的弃用日期。在这些模型弃用后,我们会将它们自动路由至新的模型。请用户注意在弃用日期之前,将您的模型编码更新为最新版本,以确保服务的顺畅过渡。模型 | 弃用时间 | 指向模型 |
---|---|---|
GLM-4-0520 | 2025年12月30日 | - |