支持的 Batch API 模型有哪些?
- GLM-4-Flash
- GLM-4-Air
- GLM-3-Turbo
- Embedding-2
- Embedding-3
- GLM-4-0520
- GLM-4
- GLM-4-Plus
- Cogview-3
- CogVideoX
- GLM-4V
- GLM-4-Plus
- GLM-4-Air-250414
- GLM-4-Long
- GLM-4-FlashX-250414
- GLM-4V-Plus-0111
- CogView-4
- CogVideoX-2
Batch API 的价格如何?
价格是标准 API 的 50%。参考 产品定价Batch API 的并发限制是怎样的?
Batch API 的并发限制与现有的每个模型并发限制是分开的。Batch API 引入了两种新的限制:- 单个 Batch 文件中包含最多 50,000 个请求且不超过 100M。
- 每个模型的 Batch 有最大排队限制。当达到请求队列上限时,请等待当前任务完成后再提交新任务。
- 向量模型(Embedding-2、Embedding-3)Batch 文件请求数量限制为不超过 10,000 次。
模型 | Batch 队列限制 |
---|---|
GLM-4-Flash | 1000 万次 |
GLM-4-Air | 1000 万次 |
GLM-3-Turbo | 200 万次 |
Embedding-2 | 200 万次 |
Embedding-3 | 200 万次 |
GLM-4-Plus | 200 万次 |
GLM-4-0520 | 50 万次 |
GLM-4 | 50 万次 |
Cogview-3 | 3 万次 |
CogVideoX | 1 万次 |
GLM-4V | 1 万次 |