智谱AI 致力于做到人工智能的安全可控、可审计、可监督、可追溯和可信赖。为此,我们内置了安全审核机制,旨在减少模型应用中违法及不良信息的出现。
安全审核机制
当我们的内置安全审核机制识别到违法及不良信息时,将提供相应的提示信息或进行拦截处置,例如通过输入拦截、输出限制和终止内容生成。违法及不良信息包括但不限于:违反法律法规、危害国家安全、恶意营销、涉黄、谩骂、暴恐违禁以及其它不良内容。
模型同步响应
当 API 检测到模型输入或输出内容中含有违法及不良信息时,系统会向开发者返回错误码(1301)、输入(role = user)或输出(role = assistant)、严重程度(level 0-3,level 0 表示最严重,3 表示轻微),不再同步生成结果。建议开发者采取措施,对用户进行正面引导,以确保内容的合规性和适当性。
返回示例
模型流式响应
在模型流式输出生成内容的过程中,我们会分批对模型生成内容进行检测,当检测到违法及不良信息时:- API 返回错误码(1301)
- API(V4)返回停止词
"finish_reason":"sensitive"
开发者识别到相关信息,应及时采取终止生成、撤回、修改、清屏、重启等措施删除生成内容,并确保不将含有违法及不良信息的内容传递给模型继续生成,避免其造成负面影响。
返回示例
终端用户管理
在请求中发送终端用户ID可以协助平台对终端用户的违规行为、生成违法及不良信息或其他滥用行为进行干预。
用户ID规范
- ID 是唯一标识终端用户的字符串
- 用户 ID 长度至少为 6 个字符,但不超过 128 个字符
- 您可以通过在 API 请求中上传终端用户 ID
请求示例
安全测试申请
如果您需要进行安全相关的测试,请联系商务经理、致电(400-6883-991)进行申请,避免您的企业账号出现违规或滥用等问题。
违法及不良内容反馈
智谱AI 高度重视生成式人工智能服务的安全性。如果您在开发过程中发现 API 存在任何安全问题,请联系企业微信客服或者致电(400-6883-991)告知我们。我们非常感谢您的贡献和支持。
联系方式
企业微信客服
通过企业微信联系我们的客服团队
客服热线
400-6883-991