概览

Embedding-3 是智谱AI推出的第三代文本向量化模型,在前代基础上全面升级,提供更强的语义理解能力和更灵活的向量维度选择。该模型支持自定义向量维度,在保持高质量语义表示的同时,为不同应用场景提供了更优的性能和成本平衡。

价格

0.5 元 / 百万Tokens

输入模态

文本

输出模态

向量

上下文窗口

8K

向量维度

64-1024(可自定义)

推荐场景

使用资源

体验中心:快速测试模型在业务场景上的效果
接口文档:API调用方式

详细介绍

1

模型升级

Embedding-3 在架构和训练数据上都进行了重大升级,显著提升了语义理解的准确性和泛化能力。新模型在多个评测基准上都取得了显著的性能提升。核心升级:
  • 增强语义理解:更深层的语义捕捉能力,理解复杂的语言表达
  • 多语言优化:针对中文、英文等多语言场景进行专门优化
  • 领域适应性:在科技、金融、医疗等专业领域表现更佳
  • 鲁棒性提升:对噪声文本和非标准表达有更强的容错能力
2

灵活维度选择

Embedding-3 支持自定义向量维度,用户可以根据具体应用场景选择最适合的维度,在性能和存储成本之间找到最佳平衡。维度选项:
  • 1024维(默认):最高精度,适合对准确性要求极高的场景
  • 768维:高精度与效率的平衡,适合大多数应用场景
  • 512维:中等精度,适合大规模部署的场景
  • 256维:较高效率,适合实时性要求高的场景
  • 128维:高效率,适合资源受限的环境
  • 64维:最高效率,适合简单的相似度计算任务
技术参数:
  • 最大输入长度:8K tokens(约6000汉字)
  • 支持格式:单个字符串或字符串数组
  • 输出格式:float数组或base64编码
  • 批处理:支持最多10条文本同时处理

调用示例

以下是一个完整的调用示例,帮助您快速上手 Embedding-3 模型。
# 使用默认维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本"
}'

# 自定义维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本",
    "dimensions": 512
}'

最佳实践

性能对比

相比 Embedding-2,Embedding-3 在多个维度都有显著提升:
评测指标Embedding-2Embedding-3提升幅度
语义相似度准确率85.2%91.7%+6.5%
多语言表现82.1%88.9%+6.8%
长文本理解79.8%86.4%+6.6%
专业领域适应81.5%89.2%+7.7%
计算效率基准1.2x+20%

用户并发权益

API调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0V1V2V3
50100300500