知识库服务计费说明文档
知识库服务计费
1. 基础知识库服务计费
| 功能项目 | 计费模式 | 模型/产品 | 价格(元/百万Tokens) |
|---|---|---|---|
| 知识向量化 | Token计费 | Embedding-3-pro | 0.5 |
| Embedding-3 | 0.5 | ||
| Embedding-2 | 0.5 | ||
| 开启重排 | Token计费 | GLM-rerank-pro | 0.8 |
| GLM-rerank | 0.8 | ||
| bge-reranker-large | 免费 | ||
| AI标签生成 | Token计费 | GLM-4-Plus | 5 |
| 多模态图片理解 | Token计费 | GLM-4V | 50 |
| 知识库存储 | 存储量计费 | knowledge_capacity | 0.04元/GB/小时 |
2. 知识库存储计费规则
| 类别 | 子项 | 详细内容 |
|---|---|---|
| 计费规则详情 | 免费额度 |
|
| 超额计费 |
| |
| 计费与结算细则 |
|
| 类别 | 子项 | 详细内容 |
|---|---|---|
| 欠费处理规则 | 第一阶段:欠费 1–7 天 |
|
| 第二阶段:欠费超过 7 天 |
|
3. 上下文增强计费
| 模型 | 输入规格 | 输入单价 | 输出单价 | 缓存存储 | 命中缓存(经测试,上下文增强功能命中率平均 80%,主要参考该价格) |
|---|---|---|---|---|---|
| GLM-4.5 | 输入长度 [0, 32] 输出长度 [0, 0.2] | 2 元/百万 Tokens | 8 元/百万 Tokens | 限时免费 | 0.4 元/百万 Tokens |
| 输入长度 [0, 32] 输出长度 (0.2+) | 3 元/百万 Tokens | 14 元/百万 Tokens | 限时免费 | 0.6 元/百万 Tokens | |
| 输入长度 [32, 128] | 4 元/百万 Tokens | 16 元/百万 Tokens | 限时免费 | 0.8 元/百万 Tokens |