概览
Embedding-3 是智谱AI 推出的第三代文本向量化模型,在前代基础上全面升级,提供更强的语义理解能力和更灵活的向量维度选择。该模型支持自定义向量维度,在保持高质量语义表示的同时,为不同应用场景提供了更优的性能和成本平衡。
价格
0.5 元 / 百万 Tokens
输入模态
文本
输出模态
向量
上下文窗口
8K
向量维度
256-2048(可自定义)
推荐场景
高精度语义搜索
高精度语义搜索
利用更强的语义理解能力,实现更精准的文档检索和问答系统,特别适合专业领域的知识库构建。
多模态检索
多模态检索
结合文本和其他模态信息,构建跨模态的检索系统,支持图文匹配、视频内容检索等复杂场景。
智能推荐引擎
智能推荐引擎
基于用户行为和内容特征的深度理解,提供更个性化和精准的推荐服务,提升用户体验。
内容理解与分析
内容理解与分析
深度分析文本内容的主题、情感和意图,用于舆情监控、内容审核和市场分析。
知识图谱构建
知识图谱构建
通过语义向量化技术,自动发现实体关系,构建和完善知识图谱,支持复杂的知识推理。
使用资源
体验中心:快速测试模型在业务场景上的效果接口文档:API 调用方式
详细介绍
1
模型升级
Embedding-3 在架构和训练数据上都进行了重大升级,显著提升了语义理解的准确性和泛化能力。新模型在多个评测基准上都取得了显著的性能提升。核心升级:
- 增强语义理解:更深层的语义捕捉能力,理解复杂的语言表达
- 多语言优化:针对中文、英文等多语言场景进行专门优化
- 领域适应性:在科技、金融、医疗等专业领域表现更佳
- 鲁棒性提升:对噪声文本和非标准表达有更强的容错能力
2
灵活维度选择
Embedding-3 支持自定义向量维度,用户可以根据具体应用场景选择最适合的维度,在性能和存储成本之间找到最佳平衡。维度选项:
- 2048维(默认):最高精度,适合对准确性要求极高的场景
- 1024维:高精度与效率的平衡,适合大多数应用场景
- 512维:中等精度,适合大规模部署的场景
- 256维:较高效率,适合实时性要求高的场景
- 输入字符串数组中,单条请求最多支持 3072 个 Tokens,且数组最大不得超过 64 条
调用示例
以下是一个完整的调用示例,帮助您快速上手 Embedding-3 模型。
最佳实践
维度选择策略
维度选择策略
根据应用场景选择合适的向量维度:
- 高精度场景(如法律文档检索):使用2048维
- 通用应用(如商品推荐):使用1024或512维
- 实时应用(如在线搜索):使用256维
性能优化
性能优化
提升向量化性能的建议:
- 合理使用批处理,单次最多64条文本
- 预处理文本以去除无关信息
- 缓存常用文本的向量结果
- 根据业务需求选择合适的向量维度
质量提升
质量提升
提高向量质量的技巧:
- 保持输入文本的完整性和上下文
- 避免过度分割长文本
- 统一文本格式和编码
- 定期评估向量质量并调整策略
存储优化
存储优化
向量存储的优化建议:
- 使用适当的向量数据库
- 建立合适的索引以加速检索
- 定期清理过期或低质量的向量
- 考虑向量压缩技术以节省存储空间
用户并发权益
API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0 | V1 | V2 | V3 |
---|---|---|---|
50 | 100 | 300 | 500 |