ASR语音识别应用实践指导

ASR 语音识别引用深度融合了腾讯云 ASR 和 TRTC，用于将 TRTC 房间的语音数据实时放回，应用运行在云函数 SCF 上，通过 API 网关暴露请求入口，客户可以直接请求 API 快速发起 TRTC 房间的语音识别。

补充：ASR 语音识别应用的官方指导文档（https://cloud.tencent.com/document/product/1154/65812）

整体架构预览

整体流程如下：

环境变量

在应用部署之后，可以通过修改环境变量调整（或者开启）应用的某些特性，目前支持的环境变量有：

ENV_REALTIME_ENABLE=true 返回识别中间结果，不设置该环境变量只返回一句话识别完成后的结果
ENV_ENGINETYTE=16k_en 语音识别引擎，配置16k_en，不设置该环境变量默认使用16k_zh
DEBUG=on 开启debug模式

API 网关

应用部署之后，API 网关默认是开启了应用认证，如果请求端不支持应用认证方式，则会返回如下报错：

HMAC signature cannot be verified

建议：

1、测试时，可以先调整 API 网关的认证模式为免认证。

2、使用应用认证方式，以 golang 语言为例，参考：https://cloud.tencent.com/document/product/628/56544

TRTC 房间的高级权限控制

线上的 TRTC 房间往往都会开启高级权限控制，而当前最新版的 ASR 语音识别应用也支持了开启了高级权限控制的房间加入。请求示例参考如下：

{
    "SdkAppId": 1400000000,
    "RoomId": 43474,
    "UserId": "user_55952145",
    "UserSig": "eJwtzNEKgkAUBNBxxxxxxx",
    "Callback": "https:xxxxxxxx.com/post/xxx"
    "PrivateKey": "xxxxxxxxx"
}

补充：TRTC 的高级权限控制（https://cloud.tencent.com/document/product/647/32240）

上一页全景录制中转cos播放卡顿问题下一页SCF音视频相关问题汇总

最后更新于3年前

hashtag整体架构预览

hashtag环境变量

hashtagAPI 网关

hashtagTRTC 房间的高级权限控制

整体架构预览

环境变量

API 网关

TRTC 房间的高级权限控制