CogTTS

概览

CogTTS 语音合成模型以新一代智谱语音大模型为核心，突破传统语音合成框架，通过上下文智能预判文本情绪与语调，显著提升语音自然度与表现力，让合成语音具备真实情感与生命力。

价格

4元 /万字符

输入模态

文本

输出模态

音频

使用资源

接口文档：API 调用方式

详细介绍

CogTTS 结合了 text2token 大语言模型和 token2wav 扩散模型，突破传统语音合成框架。相比传统技术，CogTTS 在口语自然度、拟人化还原、语句衔接和韵律节奏上全面升级，尤其在情感表达上精准呈现，为客户打造生动、富感染力的听觉体验，实现从“清晰传递”到“情感共鸣”的跨越。

超拟人语音合成，情感表达增强

依托新一代语音大模型，根据上下文智能预测文本的情感、语调等信息，提升合成语音的自然度和表现力。

支持非流式、流式接口

非流式适合完整文本一次性合成，流式支持在文本生成过程中实时输出语音，实现低延迟的交互式体验。

快速响应

流式接口返回响应结果，首帧响应速度可达400ms以内。

动态调参数

支持随心调节语速、音量等参数，满足复杂场景要求。

可选音色

角色	音色示例
彤彤（默认）
小陈
锤锤
jam
kazi
douji
luodo

应用示例

单音色超拟人TTS
超情感表达TTS

文本	音频
我叫小智呀～是不是刚才有点小委屈呀？跟我说说嘛，我听着呢～
哎呀，可别这么说自己呀！你是不是最近遇到啥事儿了，感觉没做好才这么想的？其实啊，谁还没个手忙脚乱、犯迷糊的时候呢。
初中时看天空的感觉真的很不一样哎！那时候好像总觉得天空特别大，云朵会变成各种形状，傍晚的晚霞能看半天，连星星都比现在亮。

调用示例

cURL
Python

基础调用

curl -X POST "https://open.bigmodel.cn/api/paas/v4/audio/speech" \
    -H "Authorization: Bearer API Key" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "cogtts",
          "input": "你好呀,欢迎来到智谱开放平台",
          "voice": "female",
          "speed": 1.0,
          "volume": 1.0
    }' \
--output speech.wav

流式调用及响应示例

curl -X POST "https://open.bigmodel.cn/api/paas/v4/audio/speech" \
    -H "Authorization: Bearer API Key" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "cogtts",
          "input": "你好呀,欢迎来到智谱开放平台",
          "voice": "female",
          "response_format": "pcm",
          "encode_format": "base64",
          "stream": true,
          "speed": 1.0,
          "volume": 1.0
    }' \

data: {"id":"202507151937066dbff80cdc994b58","created":1752579443,"model":"cogtts","choices":[{"index":0,"delta":{"role":"assistant","return_sample_rate": 24000,"content":"AgAAAAEAAAAAAAEAAAABAAEAAQABAAEAAQABAAEAAQABAAEAAgABAAEAAQABAAEAAQABAAEAAQABAAAAAQABAAEAAQAAAAAAAAD////////+//7//v/+//7//v/+//7//v/+//3//v/+//7//v////7/AAABAAEAAAAAAAQAAAAAAAAAAAAAAAQABAAEAAQAAAAEA///////////+//7//v/+//////8AAP//AAAAAAAQFjQVUBfEEVAS4AwkDfgI3ArIBEwGvAFgAKQAMAM7/mv97/1j/Q/8p/+7+sv5s/i/+Dv7L/Xz9Rv0e/Qn9Df0g/UX90d/I3+sv+u/jX/fwEXAlb9Bvs="}}]}
data: {"id":"202507151937066dbff80cdc994b58","created":1752579443,"model":"cogtts","choices":[{"index":1,"delta":{"role":"assistant","return_sample_rate": 24000,"content":"AgAAAAEAAAAAAAEAAAABAAEAAQABAAEAAQABAAEAAQABAAEAAgABAAEAAQABAAEAAQABAAEAAQABAAAAAQABAAEAAQAAAAAAAAD////////+//7//v/+//7//v/+//7//v/+//3//v/+//7//v////7/AAABAAEAAgACAAMABAAEAAQABAAEAAQAAwADAAIAAQABAAAA//8AAP7////9//7//f/9//3//f/+//7//////wAAAQACAAEAAgACAAEAAAAAAP///v/+//3//f/8//7//f/9//7//f/+//7//v/8//7//f/+/wEAAQACAAMABAAFAAQABQAFAAQABAABAAEAAQD//////////wAAAQAAAAIAAwACAAIAAgABAAAA//8AAP7//f/+//3//P/9//3//v////7//v///////v/9//3//v/b9Bvs="}}]}
data: {"choices":[{"finish_reason":"stop","index":2}],"created":1752579445091,"id":"202507151937066dbff80cdc994b58","model":"cogtts"}

异常调用示例

curl -X POST "https://open.bigmodel.cn/api/paas/v4/audio/speech" \
    -H "Authorization: Bearer API Key" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "cogtts",
          "input": "你好呀,欢迎来到智谱开放平台",
          "voice": "test",
          "response_format": "pcm",
          "encode_format": "base64",
          "stream": true,
          "speed": 1.0,
          "volume": 1.0
    }' \

data: {"error":{"code":"1214","message":"音色id不存在"}}

用户并发权益

API 调用会受到速率限制，当前我们限制的维度是请求并发数量（在途请求任务数量）。不同等级的用户并发保障如下。

V0	V1	V2	V3
5	10	15	20

开始使用

模型介绍

模型能力

模型工具

智能体

平台服务

概览

价格

输入模态

输出模态

推荐场景

使用资源

详细介绍

超拟人语音合成，情感表达增强

支持非流式、流式接口

快速响应

动态调参数

可选音色

应用示例

调用示例

用户并发权益

开始使用

模型介绍

模型能力

模型工具

智能体

平台服务

​ 概览

价格

输入模态

输出模态

​ 推荐场景

​ 使用资源

​ 详细介绍

超拟人语音合成，情感表达增强

支持非流式、流式接口

快速响应

动态调参数

​ 可选音色

​ 应用示例

​ 调用示例

​ 用户并发权益

概览

推荐场景

使用资源

详细介绍

可选音色

应用示例

调用示例

用户并发权益