概览

Embedding-2 是智谱AI推出的第二代文本向量化模型,能够将文本转换为高维向量表示,用于语义相似性计算和搜索。该模型在语义理解、文本检索和相似度计算方面表现优异,适用于构建智能搜索、推荐系统和知识库等应用。

价格

0.5 元 / 百万Tokens

输入模态

文本

输出模态

向量

上下文窗口

8K

向量维度

1024

推荐场景

使用资源

体验中心:快速测试模型在业务场景上的效果
接口文档:API调用方式

详细介绍

1

模型特性

Embedding-2 采用先进的神经网络架构,能够深度理解文本的语义信息。模型支持中英文等多种语言,在保持高质量向量表示的同时,具有良好的计算效率。核心特性:
  • 多语言支持:支持中文、英文等多种语言的文本向量化
  • 语义理解:能够捕捉文本的深层语义信息,而非仅仅是词汇匹配
  • 高效计算:优化的模型架构确保快速的向量生成速度
  • 稳定输出:相同输入始终产生一致的向量表示
2

技术规格

Embedding-2 提供1024维的向量输出,支持最大8K tokens的文本输入。模型经过大规模多语言语料训练,在各种文本类型上都有良好的表现。技术参数:
  • 向量维度:1024维
  • 最大输入长度:8K tokens(约6000汉字)
  • 支持格式:单个字符串或字符串数组
  • 输出格式:float数组或base64编码
  • 批处理:支持最多25条文本同时处理

调用示例

以下是一个完整的调用示例,帮助您快速上手 Embedding-2 模型。
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-2",
    "input": "这是一段需要向量化的文本"
}'

最佳实践

用户并发权益

API调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0V1V2V3
50100300500