GLM-5.2 - 智谱AI开放文档

GLM Coding Plan 团队版已上线 GLM-5.2，让组织安全可控地提升开发效率。立即了解

概览

GLM-5.2 是面向长任务时代的旗舰模型。支持真正可用的 1M 上下文，实测可承载项目级工程上下文，长程任务执行更稳定、工程规范遵循更可靠，开发场景成功率进一步提升。一次任务即可完成“从需求到多端可部署产物”的完整开发链路。

定位

旗舰基座模型

输入模态

文本

输出模态

文本

上下文窗口

最大输出 Tokens

128K

能力支持

思考模式

提供多种思考模式，覆盖不同任务需求

流式输出

支持实时流式响应，提升用户交互体验

Function Call

强大的工具调用能力，支持多种外部工具集成

上下文缓存

智能缓存机制，优化长对话性能

结构化输出

支持 JSON 等结构化格式输出，便于系统集成

MCP

可灵活调用外部 MCP 工具与数据源，扩展应用场景

详细介绍

1M 上下文：让长程任务稳定可用

长程任务的基础，不是拥有 1M 上下文，而是让 1M 上下文真正可用。GLM-5.2 实现了 Solid 1M 无损上下文，并针对长程 Coding Agent 场景进行了数月强化训练，覆盖大规模实现、自动化研究、性能优化等高价值任务。相比仅扩展上下文长度的方案，GLM-5.2 在超长上下文下保持更稳定的性能，在部分真实测试中甚至超过 Opus。（详见技术博客）1M 上下文支撑了 GLM-5.2 出色的长程交付能力。在 FrontierSWE、SWE-Marathon、PostTrainBench 等长程任务基准上，GLM-5.2 整体表现介于 Claude Opus 4.7 与 4.8 之间，是当前排名最高的开源模型。其中，在 FrontierSWE 上仅落后 Opus 4.8 约 1%，同时超过 GPT-5.5（1%）和 Opus 4.7（11%）；在更具挑战性的 SWE-Marathon 上仍有提升空间，与 Opus 4.8 存在约 13% 的差距。 Description

在实际体验中，GLM-5.2 可自主完成任务拆解、架构设计、前后端开发、测试修复与部署交付，最终生成可上线的 Web、移动端和小程序应用。整个流程累计处理超过 85 万（850K）tokens，接近用满 1M 上下文窗口。过去需要团队协作数周完成的工程，如今可在一次连续的长程任务中完成。

榜单与开发者双重验证的 Coding 能力

GLM-5.2 在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升，复杂系统工程与深度调试更稳。在主流编程基准上，GLM-5.2 保持开源SOTA，与Claude Opus 4.8处于可比区间。 Description

在全球百万用户参与盲测的前端开发评估系统Code Arena 上，GLM-5.2 取得全球可用模型第一的表现。 Description

发布前，GLM-5.2 已提前向 GLM Coding Plan 用户开放，开发者感知到的提升集中在以下几点：

项目级上下文承载更强，能把完整工程放进同一条推理链路里
长程任务执行更稳定，复杂任务能持续推进，不容易中途跑偏
生产级工程规范遵循更可靠，能守住团队研发流程里的硬约束
客户端与移动端工程能力更扎实，不止写 App，还能完成真机调试闭环

使用资源

体验中心：快速测试模型在业务场景上的效果
接口文档：API 调用方式

调用示例

以下是完整的调用示例，帮助您快速上手 GLM-5.2 模型。

cURL
Python
Java
Python(旧)

基础调用

curl -X POST "https://open.bigmodel.cn/api/paas/v4/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-api-key" \
-d '{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "system",
      "content": "你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈"
    },
    {
      "role": "user",
      "content": "帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈"
    }
  ],
  "thinking": {
    "type": "enabled"
  },
  "reasoning_effort": "max",
  "max_tokens": 65536,
  "temperature": 1.0
}'

流式调用

curl -X POST "https://open.bigmodel.cn/api/paas/v4/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-api-key" \
-d '{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "system",
      "content": "你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈"
    },
    {
      "role": "user",
      "content": "帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈"
    }
  ],
  "thinking": {
    "type": "enabled"
  },
  "reasoning_effort": "max",
  "stream": true,
  "max_tokens": 65536,
  "temperature": 1.0
}'

安装 SDK

# 安装最新版本
pip install zai-sdk
# 或指定版本
pip install zai-sdk==0.2.3

验证安装

import zai
print(zai.__version__)

基础调用

from zai import ZhipuAiClient

client = ZhipuAiClient(api_key="your-api-key")  # 请填写您自己的 API Key

response = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈"},
        {"role": "user", "content": "帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈"}
    ],
    thinking={
        "type": "enabled"    # 启用深度思考模式
    },
    reasoning_effort="max",  # 推理程度
    max_tokens=65536,          # 最大输出 tokens
    temperature=1.0           # 控制输出的随机性
)

# 获取完整回复
print(response.choices[0].message)

流式调用

from zai import ZhipuAiClient

client = ZhipuAiClient(api_key="your-api-key")  # 请填写您自己的 API Key

response = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈"},
        {"role": "user", "content": "帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈"}
    ],
    thinking={
        "type": "enabled"    # 启用深度思考模式
    },
    reasoning_effort="max",  # 推理程度 
    stream=True,              # 启用流式输出
    max_tokens=65536,          # 最大输出tokens
    temperature=1.0           # 控制输出的随机性
)

# 流式获取回复
for chunk in response:
    if chunk.choices[0].delta.reasoning_content:
        print(chunk.choices[0].delta.reasoning_content, end='', flush=True)

    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end='', flush=True)

安装 SDKMaven

<dependency>
    <groupId>ai.z.openapi</groupId>
    <artifactId>zai-sdk</artifactId>
    <version>0.3.5</version>
</dependency>

Gradle (Groovy)

implementation 'ai.z.openapi:zai-sdk:0.3.5'

基础调用

import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.service.model.ChatCompletionCreateParams;
import ai.z.openapi.service.model.ChatCompletionResponse;
import ai.z.openapi.service.model.ChatMessage;
import ai.z.openapi.service.model.ChatMessageRole;
import ai.z.openapi.service.model.ChatThinking;
import java.util.Arrays;

public class BasicChat {
    public static void main(String[] args) {
        // 初始化客户端
        ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU()
            .apiKey("your-api-key")
            .build();

        // 创建聊天完成请求
        ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
            .model("glm-5.2")
            .messages(Arrays.asList(
                ChatMessage.builder()
                    .role(ChatMessageRole.SYSTEM.value())
                    .content("你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈")
                    .build(),
                ChatMessage.builder()
                    .role(ChatMessageRole.USER.value())
                    .content("帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈")
                    .build()
            ))
            .thinking(ChatThinking.builder().type("enabled").build())
            .reasoningEffort("max")
            .maxTokens(65536)
            .temperature(1.0f)
            .build();

        // 发送请求
        ChatCompletionResponse response = client.chat().createChatCompletion(request);

        // 获取回复
        if (response.isSuccess()) {
            Object reply = response.getData().getChoices().get(0).getMessage();
            System.out.println("AI 回复: " + reply);
        } else {
            System.err.println("错误: " + response.getMsg());
        }
    }
}

流式调用

import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.service.model.ChatCompletionCreateParams;
import ai.z.openapi.service.model.ChatCompletionResponse;
import ai.z.openapi.service.model.ChatMessage;
import ai.z.openapi.service.model.ChatMessageRole;
import ai.z.openapi.service.model.ChatThinking;
import ai.z.openapi.service.model.Delta;
import java.util.Arrays;

public class StreamingChat {
    public static void main(String[] args) {
        // 初始化客户端
        ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU()
            .apiKey("your-api-key")
            .build();

        // 创建流式聊天完成请求
        ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
            .model("glm-5.2")
            .messages(Arrays.asList(
                ChatMessage.builder()
                    .role(ChatMessageRole.SYSTEM.value())
                    .content("你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈")
                    .build(),
                ChatMessage.builder()
                    .role(ChatMessageRole.USER.value())
                    .content("帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈")
                    .build()
            ))
            .thinking(ChatThinking.builder().type("enabled").build())
            .reasoningEffort("max")
            .stream(true)  // 启用流式输出
            .maxTokens(65536)
            .temperature(1.0f)
            .build();

        ChatCompletionResponse response = client.chat().createChatCompletion(request);

        if (response.isSuccess()) {
            response.getFlowable().subscribe(
                // Process streaming message data
                data -> {
                    if (data.getChoices() != null && !data.getChoices().isEmpty()) {
                        Delta delta = data.getChoices().get(0).getDelta();
                        System.out.print(delta + "\n");
                    }
                },
                // Process streaming response error
                error -> System.err.println("\nStream error: " + error.getMessage()),
                // Process streaming response completion event
                () -> System.out.println("\nStreaming response completed")
            );
        } else {
            System.err.println("Error: " + response.getMsg());
        }
    }
}

更新 SDK 至 2.1.5.20250726

# 安装最新版本
pip install zhipuai

# 或指定版本
pip install zhipuai==2.1.5.20250726

基础调用

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="your-api-key")  # 请填写您自己的 API Key

response = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈"},
        {"role": "user", "content": "帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈"}
    ],
    thinking={
        "type": "enabled"
    },
    max_tokens=65536,
    temperature=1.0
)

# 获取完整回复
print(response.choices[0].message)

流式调用

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="your-api-key")  # 请填写您自己的 API Key

response = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "你是一名资深的全栈软件工程师，擅长前端开发、后端架构设计以及现代 Web 技术栈"},
        {"role": "user", "content": "帮我设计并编写一个个人博客网站，包含首页、文章列表、文章详情页，使用 React + Node.js 技术栈"}
    ],
    thinking={
        "type": "enabled"
    },
    stream=True,              # 启用流式输出
    max_tokens=65536,
    temperature=1.0
)

# 流式获取回复
for chunk in response:
    if chunk.choices[0].delta.reasoning_content:
        print(chunk.choices[0].delta.reasoning_content, end='', flush=True)

    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end='', flush=True)

​概览

定位

输入模态

输出模态

上下文窗口

最大输出 Tokens

​能力支持

思考模式

流式输出

Function Call

上下文缓存

结构化输出

MCP

​推荐场景

​详细介绍

1M 上下文：让长程任务稳定可用

榜单与开发者双重验证的 Coding 能力

​使用资源

​调用示例

概览

能力支持

推荐场景

详细介绍

使用资源

调用示例