POST
/
paas
/
v4
/
audio
/
speech
文本转语音
curl --request POST \
  --url https://open.bigmodel.cn/api/paas/v4/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
  "model": "cogtts",
  "input": "你好,今天天气怎么样.",
  "voice": "tongtong",
  "response_format": "wav"
}'
This response does not have an example.

Authorizations

Authorization
string
header
required

使用以下格式进行身份验证:Bearer <your api key>

Body

application/json
model
enum<string>
default:cogtts
required

要使用的TTS模型

Available options:
cogtts
input
string
default:你好,今天天气怎么样
required

要转换为语音的文本

Maximum length: 4096
voice
enum<string>
default:tongtong
required

生成音频时使用的音色,支持系统音色以及复刻音色两种类型,其中系统音色如下: tongtong: 彤彤,默认音色 chuichui: 锤锤 xiaochen: 小陈 jam: 动动动物圈jam音色 kazi: 动动动物圈kazi音色 douji: 动动动物圈douji音色 luodo: 动动动物圈luodo音色

Available options:
tongtong,
chuichui,
xiaochen,
jam,
kazi,
douji,
luodo
speed
number

语速,默认1.0,取值范围[0.5, 2]

volume
number

音量,默认1.0,取值范围(0, 10]

response_format
enum<string>
default:wav

音频输出格式

Available options:
wav
watermark_enabled
boolean

控制AI生成音频时是否添加水印。

  • true: 默认启用AI生成的显式水印及隐式数字水印,符合政策要求。
  • false: 关闭所有水印,仅允许已签署免责声明的客户使用,签署路径:个人中心-安全管理-去水印管理
Example:

true

Response

业务处理成功

The response is of type file.