GLM Coding 套餐全新上线!旗舰模型 GLM-4.5 包月畅享,适用于 Claude Code、Cline 等主流编程工具,1/7价格,3倍用量,独家升级支持联网搜索&多模态理解。限时特惠 ¥20/月起,手慢无,立享好价

推荐模型

模型一览

若需要看模型价格,请直接前往价格页面

文本模型

文本模型是一类专注于处理和生成自然语言的模型,涵盖了语言理解与推理能力,能够自动处理海量文本数据并进行逻辑推导。智谱的文本模型结合了强大的语言模型和推理模型,使得系统不仅能理解和生成文本内容,还能进行高层次的推理和判断。
模型定位特点上下文最大输出
GLM-4.5高智能旗舰- 性能最优
- 强大的推理能力、代码生成能力
以及工具调用能力
128K96K
GLM-4.5-X高智能旗舰-极速版- 推理速度更快
- 适用于搜索问答、智能助手、实时
翻译等时效性较强场景
128K96K
GLM-4.5-Air高性价比- 同参数规模性能最佳
- 在推理、编码和智能体任务上表现
强劲
128K96K
GLM-4.5-AirX高性价比-极速版- 推理速度快,且价格适中
- 适用于时效性有较强要求的场景
128K96K
GLM-4-Plus性能优秀- 性能最优
- 语言理解、逻辑推理、指令遵循、
长文本处理效果领先
128K4K
GLM-4-Air-250414高性价比- 快速执行复杂任务
- 擅长工具调用、联网搜索、代码
128K16K
GLM-4-Long超长输入- 支持高达 1M 的上下文长度
- 能够理解和回应复杂的查询
- 专为处理超长文本和记忆型任务
设计
1M4K
GLM-4-AirX极速推理- 超快的推理速度
- 强大的推理效果
8K4K
GLM-4-FlashX-250414高速低价- Flash 增强版本
- 超快推理速度
- 更快并发保障
128K16K
GLM-Z1-Air高性价比- 高性价比
- 具备深度思考能力
- 数理推理能力显著增强
128K32K
GLM-Z1-AirX极速推理- 国内最快的推理速度,支持
8 倍推理速度
- 问题即问即答
32K30K
GLM-Z1-FlashX高速低价- 超快推理速度
- 更快并发保障
- 极致性价比
128K32K
GLM-4.5-Flash免费模型- 最新基座模型的普惠版本128K96K
GLM-4-Flash-250414免费模型- 超长上下文处理能力
- 多语言支持
- 支持外部工具调用
128K16K
GLM-Z1-Flash免费模型- 复杂任务推理
- 轻量级应用
128K32K

视觉模型

视觉模型是一类能处理图像或视频等视觉信息的模型,广泛应用于识别、分析与决策任务。其中,视觉理解模型侧重于看懂图像内容,如识别物体、场景和关系;而视觉推理模型进一步具备看图思考的能力,能结合视觉与语言信息完成逻辑判断、因果分析和多步推理,常用于图文问答、图像描述生成、多模态对齐等复杂任务。
模型定位特点上下文最大输出
GLM-4.5V旗舰视觉推理- 同级别开源视觉推理模型SOTA
- 覆盖视频理解、复杂文件解析、前端复刻等核心场景
- 新增“思考模式”开关
64K16K
GLM-4.1V-Thinking-FlashX轻量视觉推理- 视觉推理能力
- 复杂场景理解
- 多步骤分析
- 高并发
64K16K
GLM-4V-Plus-0111视觉理解- 图像理解能力强
- 支持图文对话
- 场景识别准确
16K动态计算:
上下文-输入
GLM-4.1V-Thinking-Flash免费模型- 视觉推理能力
- 复杂场景理解
- 多步骤分析
64K16K
GLM-4V-Flash免费模型- 图像理解
- 多语言支持
16K动态计算:
上下文-输入

图像生成模型

图像生成模型是一类通过学习海量图像数据,实现从文本、草图或其他图像自动生成高质量图片的模型,广泛应用于视觉内容创作、游戏美术、产品设计、医学影像合成等领域。
模型定位特点多分辨率
CogView-4图像生成- 高质量图像生成
- 风格多样化
- 细节丰富
支持
CogView-3-Flash免费模型- 创意丰富多样
- 推理速度快
支持

视频生成模型

视频生成模型是一类通过学习时序视觉数据,从文本、图像或其他视频素材生成动态视频内容的模型,广泛应用于影视制作、虚拟人、动画生成、数字营销等领域。
模型定位特点多模态支持多分辨率
CogVideoX-3高智能旗舰- 主观清晰度大幅提升
- 更好的指令遵循、物理真实模拟
- 现实、3D风格场景表现提升
- 新增首尾帧生成功能
图像、文本、首尾帧支持
CogVideoX-2高性价比- 支持主体进行大幅度运动
- 驾驭多种艺术风格
图像、文本支持
Vidu Q1质量较优- 影视级的画质清晰度
- 精准解决画面崩坏
- 多艺术形态的风格
- 行业标杆级转场流畅度
图像、文本、首尾帧不支持
Vidu 2高速低价- 速度优、性价比优
- 语义增强的首尾帧衔接
- 多参考图的一致性强化
图像、参考、首尾帧不支持
CogVideoX-Flash免费模型- 沉浸式AI音效
- 4K 高清画质呈现
- 10 秒视频时长拓展
- 60fps 高帧率输出
图像、文本支持

音视频模型

音视频模型是一类处理音频与视频信号的多模态模型,能够理解、生成或编辑视听内容,广泛应用于虚拟人、语音驱动动画、视频配音与剪辑、跨模态检索等场景。
模型定位特点多模态支持
GLM-4-Voice语音模型- 直接理解和生成中英文语音,实现实时语音对话
- 根据用户指令灵活调整语音的情感、语调、语速和方言等特性
文本、音频
GLM-Realtime实时音视频- 能够提供实时的视频通话功能,通话记忆时长长达2分钟
- 具有跨文本、音频和视频进行实时推理的能力
视频、音频、文本
GLM-ASR语音识别- 上下文智能理解
- 强抗噪性能
- 多语言多方言覆盖
音频

向量模型

向量模型用于将高维的离散数据转换为低维的连续向量,捕捉数据的语义特征和关系。您可以使用我们的向量模型构建语义检索增强、聚类、主题建模和分类等功能。
模型定位上下文
Embedding-3V38K
Embedding-2V28K

其他模型

模型定位特点上下文最大输出
CharGLM-4拟人模型适用于情感陪伴和虚拟角色8K4K
Emohaa心理模型具备专业咨询能力,帮助用
户理解情感并应对情绪问题
8K4k
CodeGeeX-4代码模型适用于代码自动补全任务128K32k
Rerank重排序模型计算文本之间的 score 值,
对召回结果进行重排序
4K-

即将弃用模型

我们已经宣布了以下模型的弃用日期。在这些模型弃用后,我们会将它们自动路由至新的模型。请用户注意在弃用日期之前,将您的模型编码更新为最新版本,以确保服务的顺畅过渡。
模型弃用时间指向模型
GLM-4-05202025年12月30日-