Embedding-2

概览

Embedding-2 是智谱AI 推出的第二代文本向量化模型，能够将文本转换为高维向量表示，用于语义相似性计算和搜索。该模型在语义理解、文本检索和相似度计算方面表现优异，适用于构建智能搜索、推荐系统和知识库等应用。

价格

0.5 元 / 百万 Tokens

输入模态

文本

输出模态

向量

上下文窗口

向量维度

1024

使用资源

体验中心：快速测试模型在业务场景上的效果
接口文档：API 调用方式

详细介绍

模型特性

Embedding-2 采用先进的神经网络架构，能够深度理解文本的语义信息。模型支持中英文等多种语言，在保持高质量向量表示的同时，具有良好的计算效率。核心特性：

多语言支持：支持中文、英文等多种语言的文本向量化
语义理解：能够捕捉文本的深层语义信息，而非仅仅是词汇匹配
高效计算：优化的模型架构确保快速的向量生成速度
稳定输出：相同输入始终产生一致的向量表示

技术规格

Embedding-2 提供 1024 维的向量输出，支持最大 8K tokens 的文本输入。模型经过大规模多语言语料训练，在各种文本类型上都有良好的表现。技术参数：

向量维度：1024 维
输入字符串数组中，单条请求最多支持 512 个 Tokens，数组总长度不得超过 8K

调用示例

以下是一个完整的调用示例，帮助您快速上手 Embedding-2 模型。

cURL
python
Java
Python(旧)
响应示例

curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-2",
    "input": "这是一段需要向量化的文本"
}'

最佳实践

文本预处理

在向量化之前，建议对文本进行适当的预处理：

去除多余的空格和特殊字符
统一文本格式（如大小写）
对于长文本，考虑分段处理以获得更好的语义表示

相似度计算

使用余弦相似度计算向量间的相似性：

import numpy as np

def cosine_similarity(vec1, vec2):
    return np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))

批量处理

为提高效率，建议批量处理多个文本：

单次最多处理 8K 长度文本
合理安排批次大小以平衡速度和资源使用

用户并发权益

API调用会受到速率限制，当前我们限制的维度是请求并发数量（在途请求任务数量）。不同等级的用户并发保障如下。

V0	V1	V2	V3
50	100	300	500

开始使用

模型介绍

模型能力

模型工具

智能体

平台服务

概览

价格

输入模态

输出模态

上下文窗口

向量维度

推荐场景

使用资源

详细介绍

模型特性

技术规格

调用示例

最佳实践

用户并发权益

开始使用

模型介绍

模型能力

模型工具

智能体

平台服务

​ 概览

价格

输入模态

输出模态

上下文窗口

向量维度

​ 推荐场景

​ 使用资源

​ 详细介绍

模型特性

技术规格

​ 调用示例

​ 最佳实践

​ 用户并发权益

概览

推荐场景

使用资源

详细介绍

调用示例

最佳实践

用户并发权益