Documentation Index
Fetch the complete documentation index at: https://docs.bigmodel.cn/llms.txt
Use this file to discover all available pages before exploring further.
一、知识库 API 相关
Q:知识库 API 有哪些接口? A: 目前知识库 API 包含以下接口:问答 Agent 对话(流式)、全模态知识库检索、知识库检索、知识库列表、创建知识库、知识库详情、编辑知识库、删除知识库、知识库使用量、文档列表、上传文件文档、上传 URL 文档、解析文档图片、文档详情、删除文档、重新向量化。详见:知识库 API 文档Q:体验中心的「知识问答」功能和直接调用知识库 API 有什么区别? A: 区别如下
- 知识问答(体验中心): 面向控制台页面操作,支持文本模型和视觉模型两种入口,无需编写代码,可实时调整检索参数(问题改写、Rerank、QA 干预等),视觉模型还支持「图文并茂」模式同时返回图片与文本。适合调试和体验。详见:知识问答
-
API 调用: 通过在
tools参数中传入知识库 ID,以编程方式将知识库能力集成到自己的应用中,适合生产环境开发。详见:对话调用知识库
Q:问答 Agent 对话(流式)接口是什么,适合什么场景? A: 问答 Agent 对话(流式)是基于 ReAct(Reasoning + Acting)推理引擎的流式对话接口,LLM 会根据用户问题自主决定是否调用工具(如知识检索、查询重写等),并通过 SSE 实时推送思考过程、工具调用和最终回答。适合需要实时反馈、多步推理的智能问答场景。
Q:调用问答 Agent 对话接口时,如何指定检索的知识库? A: 在请求体的
retrieval 参数中传入 know_ids(知识库 ID 列表)即可。
Q:知识库检索支持哪些检索方式?如何配置? A: 三个接口均支持以下检索类型,通过
recall_method 参数配置:
embedding:向量化检索keyword:关键词检索mixed:混合检索(默认)
recall_ratio 参数调整向量检索的权重(知识库检索接口取值范围 0-100,默认 80;全模态检索接口取值范围 0-1,默认 0.8)。
Q:全模态知识库检索如何传入图片进行检索? A: 通过
multimodal_parts 参数传入图片 URL,文本查询(query)与多模态查询(multimodal_parts)必须传入其中之一。
Q:问答 Agent 对话接口如何开启思考模式? A: 在请求体中设置
enable_thinking: true 即可开启思考模式。开启后模型会输出推理过程,通过 reasoning 事件类型在 SSE 流中实时返回。默认为 false(不开启)。
Q:问答 Agent 对话(流式)接口返回的 SSE 事件有哪些类型? A: SSE 流式响应包含以下事件类型:
| 事件类型 | 说明 |
|---|---|
| session_created | 会话创建 |
| reasoning | 推理过程(开启思考模式时返回) |
| thought | 思考内容 |
| tool_call | 工具调用 |
| tool_result | 工具调用结果 |
| answer | 最终回答 |
| done | 完成(含 Token 用量信息) |
| error | 错误 |
二、知识库版本 & 全模态知识库
Q:知识库检索和全模态知识库检索有什么区别? A: 区别如下- 知识库检索:适用于文本检索,并支持查询重写、重排、QA 干预等高级功能。
- 全模态知识库检索:支持文本、图片、视频等全模态内容检索,并支持查询重写、重排、QA 干预等高级功能,适合需要处理多种媒体格式内容的场景。
Q:GLM 全模态知识库支持哪些文件格式?上传限制是什么? A: 支持以下格式导入:
- 文档: pdf、docx、doc、pptx、ppt、txt、md、xlsx、xls、csv,单文件不超过 100MB
- 图片: jpeg、png、webp,单张不超过 5MB
- 视频: mp4、avi、mov,单条时长不超过 15 分钟
- 音频: pcm、wav、mp3、ogg,单条时长不超过 30 分钟
Q:全模态知识库支持对视频和音频内容检索吗?效果如何? A: 支持。系统会对视频和音频文件建立多模态索引:
- 视频检索: 结果中显示视频缩略图及精确时间段(如
00:22-00:38),点击可在页面内直接播放对应片段 - 音频检索: 结果中显示对应时间段与内容摘要,点击后展开播放控件直接收听相关片段
Q:知识库有哪几种版本?该如何选择? A: 创建知识库时,系统根据向量模型和导入格式自动区分为三种版本:
- 全模态版: 选用全模态向量模型(如 Embedding-Multimodal),适合音视频、复杂图文、高精度语义问答等场景
- 文本版: 选用文本向量模型,适合单一文本模态的信息查询
- QA 版: 导入内容为问答对格式时自动识别,适合精准问答和结构化知识体系
三、知识库效果问题
Q:上传文件后,为什么还无法检索到内容? A: 文件上传后需等待系统完成解析和向量索引构建,状态流转如下:数据处理中 → 索引构建中 → 处理完成。只有状态变为「处理完成」后才可以正常检索。大文件处理时间较长,请耐心等待。若状态显示「数据异常」,可点击刷新图标重试。Q:知识库检索结果不准确,有哪些方法可以提升效果? A: 可以尝试以下方式优化:
- 开启问题改写:自动扩展语义覆盖范围,口语化提问效果尤为明显
- 开启Rerank 重排序:对召回结果重新排序,提升精准度
- 开启 QA 干预:优先从 QA 知识库匹配精准问答对
- 调整召回分数阈值(默认 0.3)和召回数量(默认 8)
- 创建知识库时开启上下文增强:可提升复杂问答的平均召回率约 20%(该操作不可逆,且仅对文档类文件生效)
Q:知识库 API 检索结果不准确,如何优化? A: 可以尝试以下方式:
- 开启重排(Rerank):知识库检索接口设置
rerank_status: 1;全模态检索设置enable_rerank: true。 - 开启查询重写(全模态检索接口):设置
enable_rewrite: true,可结合messages实现多轮对话改写。 - 调整相似度阈值(
fractional_threshold/similarity_threshold),过滤低质量切片。 - 开启扩召(全模态检索接口):设置
enable_expansion: true扩大召回范围。 - 检查上传的知识库内容是否与用户问题匹配,必要时优化文档切片。
Q:什么是「上下文增强」功能,它有什么效果? A: 上下文增强是创建知识库时的可选增强设置,开启后系统会保留文档中的关键语义与指代信息,提升复杂问答和精确信息检索的效果。在高准确度场景下,平均召回率可提升约 20%,适用于复杂问答、精确信息检索等场景。需注意:此功能不可逆,一旦开启无法回退,且会增加 glm-4.5 的 Token 消耗。详见:上下文增强技术报告
四、费用问题
Q:知识库服务如何计费?有免费额度吗? A: 知识库服务主要包含以下计费项:| 功能 | 价格 |
|---|---|
| 知识向量化(各 Embedding 模型) | 0.5 元/百万 Tokens |
| 开启重排(GLM-rerank/rerank-pro) | 0.8 元/百万 Tokens |
| 深度解析 | 0.12 元/页 |
| 上下文增强 / 图片理解 / AI 标签生成 | 免费 |
| 知识库存储(超出免费额度部分) | 0.04 元/GB/小时 |
Q:知识库欠费后数据会被删除吗? A: 欠费处理分两个阶段:
- 欠费 1–7 天: 知识库暂停服务,但数据安全保留。补缴欠款后服务自动恢复。
- 欠费超过 7 天: 系统将数据列入删除计划,保留最近上传的 1GB 数据,并删除超出部分。数据删除前 24 小时会发送通知。数据被删除后即使补缴欠款也无法恢复。