概览

CogTTS 语音合成模型 以新一代智谱语音大模型为核心,突破传统语音合成框架,通过上下文智能预判文本情绪与语调,显著提升语音自然度与表现力,让合成语音具备真实情感与生命力。

价格

4元 /万字符

输入模态

文本

输出模态

音频

推荐场景

使用资源

接口文档:API 调用方式

详细介绍

CogTTS 结合了 text2token 大语言模型和 token2wav 扩散模型,突破传统语音合成框架。相比传统技术,CogTTS 在口语自然度、拟人化还原、语句衔接和韵律节奏上全面升级,尤其在情感表达上精准呈现,为客户打造生动、富感染力的听觉体验,实现从“清晰传递”到“情感共鸣”的跨越。
1

超拟人语音合成,情感表达增强

依托新一代语音大模型,根据上下文智能预测文本的情感、语调等信息,提升合成语音的自然度和表现力。
2

支持非流式、流式接口

非流式适合完整文本一次性合成,流式支持在文本生成过程中实时输出语音,实现低延迟的交互式体验。非流式适合完整文本一次性合成,流式支持在文本生成过程中实时输出语音,实现低延迟的交互式体验。
3

快速响应

流式接口返回响应结果,首帧响应速度可达400ms以内。
4

动态调参数

支持随心调节语速、音量等参数,满足复杂场景要求。

可选音色

角色音色示例
彤彤(默认)
小陈
锤锤
jam
kazi
douji
luodo

应用示例

文本音频
我叫小智呀~ 是不是刚才有点小委屈呀?跟我说说嘛,我听着呢~
哎呀,可别这么说自己呀!你是不是最近遇到啥事儿了,感觉没做好才这么想的?其实啊,谁还没个手忙脚乱、犯迷糊的时候呢。
初中时看天空的感觉真的很不一样哎!那时候好像总觉得天空特别大,云朵会变成各种形状,傍晚的晚霞能看半天,连星星都比现在亮。

调用示例

基础调用
curl -X POST "https://open.bigmodel.cn/api/paas/v4/audio/speech" \
    -H "Authorization: Bearer API Key" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "cogtts",
          "input": "你好呀,欢迎来到智谱开放平台",
          "voice": "female",
          "speed": 1.0,
          "volume": 1.0
    }' \
--output speech.wav
流式调用及响应示例
curl -X POST "https://open.bigmodel.cn/api/paas/v4/audio/speech" \
    -H "Authorization: Bearer API Key" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "cogtts",
          "input": "你好呀,欢迎来到智谱开放平台",
          "voice": "female",
          "response_format": "pcm",
          "encode_format": "base64",
          "stream": true,
          "speed": 1.0,
          "volume": 1.0
    }' \

data: {"id":"202507151937066dbff80cdc994b58","created":1752579443,"model":"cogtts","choices":[{"index":0,"delta":{"role":"assistant","content":"AgAAAAEAAAAAAAEAAAABAAEAAQABAAEAAQABAAEAAQABAAEAAgABAAEAAQABAAEAAQABAAEAAQABAAAAAQABAAEAAQAAAAAAAAD////////+//7//v/+//7//v/+//7//v/+//3//v/+//7//v////7/AAABAAEAAAAAAAQAAAAAAAAAAAAAAAQABAAEAAQAAAAEA///////////+//7//v/+//////8AAP//AAAAAAAQFjQVUBfEEVAS4AwkDfgI3ArIBEwGvAFgAKQAMAM7/mv97/1j/Q/8p/+7+sv5s/i/+Dv7L/Xz9Rv0e/Qn9Df0g/UX90d/I3+sv+u/jX/fwEXAlb9Bvs="}}]}
data: {"id":"202507151937066dbff80cdc994b58","created":1752579443,"model":"cogtts","choices":[{"index":1,"delta":{"role":"assistant","content":"AgAAAAEAAAAAAAEAAAABAAEAAQABAAEAAQABAAEAAQABAAEAAgABAAEAAQABAAEAAQABAAEAAQABAAAAAQABAAEAAQAAAAAAAAD////////+//7//v/+//7//v/+//7//v/+//3//v/+//7//v////7/AAABAAEAAgACAAMABAAEAAQABAAEAAQAAwADAAIAAQABAAAA//8AAP7////9//7//f/9//3//f/+//7//////wAAAQACAAEAAgACAAEAAAAAAP///v/+//3//f/8//7//f/9//7//f/+//7//v/8//7//f/+/wEAAQACAAMABAAFAAQABQAFAAQABAABAAEAAQD//////////wAAAQAAAAIAAwACAAIAAgABAAAA//8AAP7//f/+//3//P/9//3//v////7//v///////v/9//3//v/b9Bvs="}}]}
data: {"choices":[{"finish_reason":"stop","index":2}],"created":1752579445091,"id":"202507151937066dbff80cdc994b58","model":"cogtts"}
异常调用示例
curl -X POST "https://open.bigmodel.cn/api/paas/v4/audio/speech" \
    -H "Authorization: Bearer API Key" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "cogtts",
          "input": "你好呀,欢迎来到智谱开放平台",
          "voice": "test",
          "response_format": "pcm",
          "encode_format": "base64",
          "stream": true,
          "speed": 1.0,
          "volume": 1.0
    }' \

data: {"error":{"code":"1214","message":"音色id不存在"}}

用户并发权益

API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0V1V2V3
5101520