概览
GLM-ASR 是智谱新一代语音识别模型,相较于传统 ASR 模型,GLM-ASR 在上下文智能理解、抗噪性能及多语言转录等方面取得了显著提升,可以被广泛地应用于各类语音转文本的场景中。
价格
0.06 元/分钟
输入模态
音频
输出模态
文本
推荐场景
客户服务
客户服务
实时记录客户语音需求,并方便事后查询,提升服务响应效率与质量。
人机交互
人机交互
通过语音指令控制智能设备(如家居、机器人),实现“动口不动手”的无缝交互体验。
会议转写
会议转写
生成精准会议与课堂记录,支持中英文混杂、专业术语识别,助力高效复盘与知识沉淀。
字幕生成
字幕生成
一键为音视频添加高精度字幕,适配会议直播、影视剪辑、线上课程等多场景需求。
游戏语言
游戏语言
精准识别玩家高频术语与“游戏黑话”,流式转写语音指令与战术交流,助力边玩边聊不卡顿。
内容质检
内容质检
将录音智能转写为文本,基于规则库实时检测违规内容并预警,同步分析语音数据挖掘潜在业务价值。
语音搜索
语音搜索
车载导航、移动端场景中,快速响应方言或带口音指令,解放双手提升搜索效率。
使用资源
接口文档:API 调用方式
详细介绍
作为一款基于上下文深度理解的语音转文本模型,GLM-ASR 不仅能够将音频精准转录为符合语言习惯的流畅文本,更在复杂噪音环境中展现出卓越的抗干扰能力,为您提供一系列语音转文本的新惊喜:
1
上下文智能理解
依托先进的语言建模技术,模型可结合上下文语境优化输出结果,显著提升文本的流畅性与可读性,让转录内容更贴近真实表达。
2
强抗噪性能
即使在非语言类噪声(如机械声、环境杂音)干扰下,模型仍能保持高精度识别,避免误判与漏识,适应多场景需求。
3
多语言多方言覆盖
支持中文、英语及8种中国地方方言(东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话),打破地域沟通壁垒,满足多样化语音交互需求。
调用示例
安装 SDK验证安装调用示例
用户并发权益
API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下。
V0 | V1 | V2 | V3 |
---|---|---|---|
5 | 10 | 15 | 20 |