CogView-4

概览

CogView-4 是智谱首个支持生成汉字的开源文生图模型，在语义理解、图像生成质量、中英文字生成能力等方面全面提升，支持任意长度的中英双语输入，能够生成在给定范围内的任意分辨率图像。

价格

0.06 元 / 次

输入模态

文本

输出模态

图像

使用资源

体验中心：快速测试模型在业务场景上的效果
接口文档：API 调用方式

详细介绍

发布时模型性能达到 SOTA

DPG-Bench （Dense Prompt Graph Benchmark）是一个评估文本到图像生成模型的基准测试，主要关注模型在复杂语义对齐和指令跟随能力方面的表现。CogView-4 发布时期在 DPG-Bench 基准测试中综合评分排名第一，在开源文生图模型中达到 SOTA。 Description

更好的中文理解与生成

在技术实现上，CogView-4 将文本编码器从纯英文的 T5 encoder 换为具备双语能力的 GLM-4 encoder，并通过中英双语图文进行训练，使模型具备双语提示词输入能力。CogView-4 支持中英双语提示词输入，尤其擅长理解和遵循中文提示词，大幅降低使用者提示词门槛，是首个能够在画面中生成汉字的开源文生图模型，能更好地满足广告、短视频等领域的创意需求。

任意分辨率，任意长度提示词

CogView-4 实现了任意长度的文本描述（caption）和任意分辨率图像的混合训练范式。该模型支持输入任意长度提示词，能够生成范围内任意分辨率图像，不仅使用户创作更加自由，也提升了训练效率。

应用示例

餐饮美食宣传
电商产品配图
游戏素材创作
文旅宣传制作

Prompt

特写，商业美食摄影，强烈的室内光，极致的细节，圣诞餐桌，餐桌一角，一个长毛橘色虎斑猫头凑到盘子旁，正在贪婪地闻着圣诞大餐，表情沉醉。桌上有烤鸡、植物、沙拉，香槟酒，镶金边的瓷器茶具。下午的金色光线照向猫咪的侧脸，将食物和它的被毛染上了柔和的金色，背景也有圣诞树。突出食物的质感和猫咪的毛发质感，强烈的光感，温馨的圣诞节日氛围。

生成图片

调用示例

Python
Java
Python(旧)

安装 SDK

# 安装最新版本
pip install zai-sdk
# 或指定版本
pip install zai-sdk==0.2.2

验证安装

import zai
print(zai.__version__)

调用示例

from zai import ZhipuAiClient
client = ZhipuAiClient(api_key="your-api-key")  # 请填写您自己的 APIKey
response = client.images.generations(
    model="cogView-4-250304",  # 请填写您要调用的模型名称
    prompt="一只可爱的小猫咪，坐在阳光明媚的窗台上，背景是蓝天白云",
)
print(response.data[0].url)

安装 SDKMaven

<dependency>
    <groupId>ai.z.openapi</groupId>
    <artifactId>zai-sdk</artifactId>
    <version>0.3.3</version>
</dependency>

Gradle (Groovy)

implementation 'ai.z.openapi:zai-sdk:0.3.3'

调用示例

import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.core.Constants;
import ai.z.openapi.service.image.CreateImageRequest;
import ai.z.openapi.service.image.ImageResponse;

public class CogView4Example {
    public static void main(String[] args) {
        ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU().apiKey("YOUR_API_KEY").build();
        // Create image generation request
        CreateImageRequest request = CreateImageRequest.builder()
            .model(Constants.ModelCogView4250304)
            .prompt("一只可爱的小猫咪，坐在阳光明媚的窗台上，背景是蓝天白云")
            .size("1024x1024")
            .build();
        ImageResponse response = client.images().createImage(request);
        System.out.println(response.getData());
    }
}

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="your-api-key")

response = client.images.generations(
    model="cogView-4-250304", #填写需要调用的模型编码
    prompt="在干燥的沙漠环境中，一棵孤独的仙人掌在夕阳的余晖中显得格外醒目。这幅油画捕捉了仙人掌坚韧的生命力和沙漠中的壮丽景色，色彩饱满且表现力强烈。",
    size="1440x720"
)
print(response.data[0].url)

请注意，CogView-4 模型的输出是图片 URL，您需要通过 URL 下载图片。

用户并发权益

API 调用会受到速率限制，当前我们限制的维度是请求并发数量（在途请求任务数量）。不同等级的用户并发保障如下。

V0	V1	V2	V3
5	10	15	20

开始使用

模型介绍

模型能力

模型工具

知识库

智能体

平台服务

概览

价格

输入模态

输出模态

推荐场景

使用资源

详细介绍

发布时模型性能达到 SOTA

更好的中文理解与生成

任意分辨率，任意长度提示词

应用示例

Prompt

生成图片

Prompt

生成图片

Prompt

生成图片

Prompt

生成图片

调用示例

用户并发权益

开始使用

模型介绍

模型能力

模型工具

知识库

智能体

平台服务

​ 概览

价格

输入模态

输出模态

​ 推荐场景

​ 使用资源

​ 详细介绍

发布时模型性能达到 SOTA

更好的中文理解与生成

任意分辨率，任意长度提示词

​ 应用示例

Prompt

生成图片

Prompt

生成图片

Prompt

生成图片

Prompt

生成图片

​ 调用示例

​ 用户并发权益

概览

推荐场景

使用资源

详细介绍

应用示例

调用示例

用户并发权益