概览

Embedding-3 是智谱AI 推出的第三代文本向量化模型,在前代基础上全面升级,提供更强的语义理解能力和更灵活的向量维度选择。该模型支持自定义向量维度,在保持高质量语义表示的同时,为不同应用场景提供了更优的性能和成本平衡。

价格

0.5 元 / 百万 Tokens

输入模态

文本

输出模态

向量

上下文窗口

8K

向量维度

256-2048(可自定义)

推荐场景

使用资源

体验中心:快速测试模型在业务场景上的效果
接口文档:API 调用方式

详细介绍

1

模型升级

Embedding-3 在架构和训练数据上都进行了重大升级,显著提升了语义理解的准确性和泛化能力。新模型在多个评测基准上都取得了显著的性能提升。核心升级:
  • 增强语义理解:更深层的语义捕捉能力,理解复杂的语言表达
  • 多语言优化:针对中文、英文等多语言场景进行专门优化
  • 领域适应性:在科技、金融、医疗等专业领域表现更佳
  • 鲁棒性提升:对噪声文本和非标准表达有更强的容错能力
2

灵活维度选择

Embedding-3 支持自定义向量维度,用户可以根据具体应用场景选择最适合的维度,在性能和存储成本之间找到最佳平衡。维度选项:
  • 2048维(默认):最高精度,适合对准确性要求极高的场景
  • 1024维:高精度与效率的平衡,适合大多数应用场景
  • 512维:中等精度,适合大规模部署的场景
  • 256维:较高效率,适合实时性要求高的场景
技术参数:
  • 输入字符串数组中,单条请求最多支持 3072 个 Tokens,且数组最大不得超过 64 条

调用示例

以下是一个完整的调用示例,帮助您快速上手 Embedding-3 模型。
# 使用默认维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本"
}'

# 自定义维度
curl -X POST \
https://open.bigmodel.cn/api/paas/v4/embeddings \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
    "model": "embedding-3",
    "input": "这是一段需要向量化的文本",
    "dimensions": 512
}'

最佳实践

用户并发权益

API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0V1V2V3
50100300500