问答 Agent 对话(流式)
知识库 API
问答 Agent 对话(流式)
基于 ReAct(Reasoning + Acting)推理引擎的流式对话接口。LLM 会根据用户问题自主决定是否调用工具(知识检索、查询重写等),并通过 SSE 实时推送思考过程、工具调用和最终回答。
POST
问答 Agent 对话(流式)
Authorizations
Headers
会话 ID,续聊时传入
Body
application/json
当前消息列表,支持多模态内容
检索预设参数。预设后 LLM 仅决定是否调用检索,无需自行填写参数
LLM 模型名称,默认为 glm-5v-turbo
采样温度,默认为 0.7
最大推理步数,默认为 10
是否启用思考模式。启用后模型输出推理过程,通过 reasoning 事件流式返回