基于 ReAct(Reasoning + Acting)推理引擎的流式对话接口。LLM 会根据用户问题自主决定是否调用工具(知识检索、查询重写等),并通过 SSE 实时推送思考过程、工具调用和最终回答。
Documentation Index
Fetch the complete documentation index at: https://docs.bigmodel.cn/llms.txt
Use this file to discover all available pages before exploring further.
会话 ID,续聊时传入
当前消息列表,支持多模态内容
检索预设参数。预设后 LLM 仅决定是否调用检索,无需自行填写参数
LLM 模型名称,默认为 glm-5v-turbo
采样温度,默认为 0.7
最大推理步数,默认为 10
是否启用思考模式。启用后模型输出推理过程,通过 reasoning 事件流式返回