Embedding-3

概览

Embedding-3 是智谱AI 推出的第三代文本向量化模型，在前代基础上全面升级，提供更强的语义理解能力和更灵活的向量维度选择。该模型支持自定义向量维度，在保持高质量语义表示的同时，为不同应用场景提供了更优的性能和成本平衡。

价格

0.5 元 / 百万 Tokens

输入模态

文本

输出模态

向量

上下文窗口

向量维度

256-2048（可自定义）

使用资源

体验中心：快速测试模型在业务场景上的效果
接口文档：API 调用方式

详细介绍

模型升级

Embedding-3 在架构和训练数据上都进行了重大升级，显著提升了语义理解的准确性和泛化能力。新模型在多个评测基准上都取得了显著的性能提升。核心升级：

增强语义理解：更深层的语义捕捉能力，理解复杂的语言表达
多语言优化：针对中文、英文等多语言场景进行专门优化
领域适应性：在科技、金融、医疗等专业领域表现更佳
鲁棒性提升：对噪声文本和非标准表达有更强的容错能力

灵活维度选择

Embedding-3 支持自定义向量维度，用户可以根据具体应用场景选择最适合的维度，在性能和存储成本之间找到最佳平衡。维度选项：

2048维（默认）：最高精度，适合对准确性要求极高的场景
1024维：高精度与效率的平衡，适合大多数应用场景
512维：中等精度，适合大规模部署的场景
256维：较高效率，适合实时性要求高的场景

技术参数：

输入字符串数组中，单条请求最多支持 3072 个 Tokens，且数组最大不得超过 64 条

调用示例

以下是一个完整的调用示例，帮助您快速上手 Embedding-3 模型。

cURL
python
Java
Python(旧)
响应示例

# 使用默认维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本"
}'

# 自定义维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本",
    "dimensions": 512
}'

安装 SDK

# 安装最新版本
pip install zai-sdk
# 或指定版本
pip install zai-sdk==0.2.0

验证安装

import zai
print(zai.__version__)

调用示例

from zai import ZhipuAiClient

client = ZhipuAiClient(api_key="your api key")
response = client.embeddings.create(
    model="embedding-3", #填写需要调用的模型编码
    input=[
        "美食非常美味，服务员也很友好。",
        "这部电影既刺激又令人兴奋。",
        "阅读书籍是扩展知识的好方法。"
    ],
)
print(response)

安装 SDKMaven

<dependency>
    <groupId>ai.z.openapi</groupId>
    <artifactId>zai-sdk</artifactId>
    <version>0.3.0</version>
</dependency>

Gradle (Groovy)

implementation 'ai.z.openapi:zai-sdk:0.3.0'

调用示例

import ai.z.openapi.ZhipuAiClient;
import ai.z.openapi.service.embedding.EmbeddingCreateParams;
import ai.z.openapi.service.embedding.EmbeddingResponse;
import java.util.Arrays;
import java.util.List;

public class Embedding3Example {
    public static void main(String[] args) {
        // 初始化客户端
        ZhipuAiClient client = ZhipuAiClient.builder().ofZHIPU()
            .apiKey("your-api-key")
            .build();

        // 创建向量化请求（自定义维度）
        EmbeddingCreateParams request = EmbeddingCreateParams.builder()
            .model("embedding-3")
            .input(Arrays.asList("Hello world", "How are you?", "How is the weather today?"))
            .dimensions(768)  // 指定768维
            .build();

        // 发送请求
        EmbeddingResponse response = client.embeddings().createEmbeddings(request);
        System.out.println("向量: " + response.getData());
    }
}

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="your api key")
response = client.embeddings.create(
    model="embedding-3", #填写需要调用的模型编码
    input=[
        "美食非常美味，服务员也很友好。",
        "这部电影既刺激又令人兴奋。",
        "阅读书籍是扩展知识的好方法。"
    ],
)
print(response)

{
    "model": "embedding-3",
    "data": [
{
    "embedding": [
    -0.02675454691052437,
    0.019060475751757622,
    ......
    -0.005519774276763201,
    0.014949671924114227
    ],
    "index": 0,
    "object": "embedding"
},
    ...
{
    "embedding": [
    -0.02675454691052437,
    0.019060475751757622,
    ......
    -0.005519774276763201,
    0.014949671924114227
    ],
    "index": 2,
    "object": "embedding"
}
    ],
    "object": "list",
    "usage": {
    "completion_tokens": 0,
    "prompt_tokens": 100,
    "total_tokens": 100
}
}

最佳实践

维度选择策略

根据应用场景选择合适的向量维度：

高精度场景（如法律文档检索）：使用2048维
通用应用（如商品推荐）：使用1024或512维
实时应用（如在线搜索）：使用256维

性能优化

提升向量化性能的建议：

合理使用批处理，单次最多64条文本
预处理文本以去除无关信息
缓存常用文本的向量结果
根据业务需求选择合适的向量维度

质量提升

提高向量质量的技巧：

保持输入文本的完整性和上下文
避免过度分割长文本
统一文本格式和编码
定期评估向量质量并调整策略

存储优化

向量存储的优化建议：

使用适当的向量数据库
建立合适的索引以加速检索
定期清理过期或低质量的向量
考虑向量压缩技术以节省存储空间

用户并发权益

API 调用会受到速率限制，当前我们限制的维度是请求并发数量（在途请求任务数量）。不同等级的用户并发保障如下。

V0	V1	V2	V3
50	100	300	500

开始使用

模型介绍

模型能力

模型工具

知识库

智能体

平台服务

概览

价格

输入模态

输出模态

上下文窗口

向量维度

推荐场景

使用资源

详细介绍

模型升级

灵活维度选择

调用示例

最佳实践

用户并发权益

开始使用

模型介绍

模型能力

模型工具

知识库

智能体

平台服务

​ 概览

价格

输入模态

输出模态

上下文窗口

向量维度

​ 推荐场景

​ 使用资源

​ 详细介绍

模型升级

灵活维度选择

​ 调用示例

​ 最佳实践

​ 用户并发权益

概览

推荐场景

使用资源

详细介绍

调用示例

最佳实践

用户并发权益