GLM-TTS-Clone

概览

GLM-TTS-Clone 是智谱推出的音色克隆模型，只需 3 秒语音样本，即可学习说话者的音色与语气习惯，可在通用朗读、情感配音、教育测评、电子书、有声客服等场景中生成自然流畅、贴近真人的语音。

输入模态

需要克隆音色的音频、试听文本（可选）

输出模态

音色ID、试听音频（可选）

模型价格详情请前往价格界面

使用资源

体验中心

快速测试模型在业务场景上的效果

接口文档

API 调用方式

GLM-TTS 使用指南

可先通过 GLM-TTS-Clone 模型获取音色ID，然后用 GLM-TTS 模型生成该音色的音频

详细介绍

只需录制约 3 秒清晰语音，GLM-TTS-Clone 即可生成专属音色：

支持普通话及轻口音日常表达；
保留个人说话节奏、断句习惯和常见语气词；
适配讲解、对话、播音、旁白等多种文本风格。
细腻的情感表达，依托强化学习与情感标注数据能自动匹配情绪。

以下视频中的部分声音由 GLM‑TTS生成，只需 3 秒，即可实现完美复刻：

调用示例

cURL

基础调用

curl -X POST "https://open.bigmodel.cn/api/paas/v4/voice/clone" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
          "model": "glm-tts-clone",
          "voice_name": "my_custom_voice_001",
          "text": "您好，这是一段示例音频的文本内容，用于音色复刻参考。",
          "input": "欢迎使用我们的音色复刻服务，这将生成与示例音频相同音色的语音。",
          "file_id": "file_abc123def456ghi789",
          "request_id": "voice_clone_req_001"
    }'

GLM-TTS GLM-ASR-2512

开始使用

模型介绍

模型能力

模型工具

GLM 全模态知识库

平台服务

概览

输入模态

输出模态

推荐场景

使用资源

体验中心

接口文档

GLM-TTS 使用指南

详细介绍

调用示例

​概览

输入模态

输出模态

​推荐场景

​使用资源

体验中心

接口文档

GLM-TTS 使用指南

​详细介绍

​调用示例

概览

推荐场景

使用资源

详细介绍

调用示例