智谱AI致力于做到人工智能的安全可控、可审计、可监督、可追溯和可信赖。为此,我们内置了安全审核机制,旨在减少模型应用中违法及不良信息的出现。

安全审核机制

当我们的内置安全审核机制识别到违法及不良信息时,将提供相应的提示信息或进行拦截处置,例如通过输入拦截、输出限制和终止内容生成。
违法及不良信息包括但不限于:违反法律法规、危害国家安全、恶意营销、涉黄、谩骂、暴恐违禁以及其它不良内容。

模型同步响应

当API检测到模型输入或输出内容中含有违法及不良信息时,系统会向开发者返回错误码(1301)、输入(role = user)或输出(role = assistant)、严重程度(level 0-3,level 0表示最严重,3表示轻微),不再同步生成结果。
建议开发者采取措施,对用户进行正面引导,以确保内容的合规性和适当性。

返回示例

{
  "contentFilter": [
    {
      "level": 1,
      "role": "user"
    }
  ],
  "error": {
    "code": "1301",
    "message": "系统检测到输入或生成内容可能包含不安全或敏感内容,请您避免输入易产生敏感内容的提示语,感谢您的配合。"
  }
}

模型流式响应

在模型流式输出生成内容的过程中,我们会分批对模型生成内容进行检测,当检测到违法及不良信息时:
  • API返回错误码(1301)
  • API(V4)返回停止词 "finish_reason":"sensitive"
开发者识别到相关信息,应及时采取终止生成、撤回、修改、清屏、重启等措施删除生成内容,并确保不将含有违法及不良信息的内容传递给模型继续生成,避免其造成负面影响。

返回示例

id='202408121950062bfd5bf951d24169', 
choices=[
  Choice(
    delta=ChoiceDelta(
      content='', 
      role='user', 
      tool_calls=None
    ), 
    finish_reason='sensitive', 
    index=0
  )
], 
created=1723463407, 
model='glm-4-0520', 
usage=None, 
extra_json=None, 
content_filter=[
  {
    'role': 'user', 
    'level': 1
  }
]

终端用户管理

在请求中发送终端用户ID可以协助平台对终端用户的违规行为、生成违法及不良信息或其他滥用行为进行干预。
当我们检测到您的终端用户存在违规、生成违法及不良信息或其他滥用行为时,平台将会对终端用户请求进行封禁处理,避免您的企业账号因终端用户的违规或滥用行为受到影响。

用户ID规范

  • ID是唯一标识终端用户的字符串
  • 用户ID长度至少为6个字符,但不超过128个字符
  • 您可以通过在API请求中上传终端用户ID

请求示例

{
  "model": "glm-3-turbo",
  "messages": [
    {
      "role": "user", 
      "content": "作为一名营销专家,请为智谱开放平台创作一个吸引人的slogan"
    },
    {
      "role": "assistant", 
      "content": "当然,为了创作一个吸引人的slogan,请告诉我一些关于您产品的信息"
    },
    {
      "role": "user", 
      "content": "智谱AI开放平台"
    }
  ],
  "stream": "true",
  "user_id": "user_123456"
}

安全测试申请

如果您需要进行安全相关的测试,请联系商务经理、致电(400-6883-991)进行申请,避免您的企业账号出现违规或滥用等问题。

违法及不良内容反馈

智谱AI高度重视生成式人工智能服务的安全性。如果您在开发过程中发现API存在任何安全问题,请联系企业微信客服或者致电(400-6883-991)告知我们。我们非常感谢您的贡献和支持。

联系方式

企业微信客服

通过企业微信联系我们的客服团队

客服热线

400-6883-991