tencent cloud

腾讯云智能数智人

轻量版形象-云渲染场景使用教程

Download
聚焦模式
字号
最后更新时间: 2026-05-15 14:14:14

形象定义及获取

轻量版形象:特指云渲染场景下通过 CPU 进行渲染的形象,与 GPU 渲染模式有区分,故称为轻量版。其主要定义及定制生成详见:2D 端渲染形象定制及下载流程

场景所需购买 SKU 清单

SKU 清单
是否必选
数量
图示
定制配额(2D 小样本专属、2D 小样本通用,二选一)
必选
1

轻量版云端服务小时包
必选
1

定制形象续期服务(包月或包年)
可选
1


接口调用方案

注意:
在调用接口之前,您需要先阅读 数智人 aPaaS 接口调用方式
调用流程跟以往流程一致,总体分为两步:步骤一建流、步骤二音频驱动。

步骤一:建流,即输出一路实时流(RTMP、TRTC 、WebRTC)

1. 参照 使用个人资产形象建流 完成建流动作。注意:建流成功后,就会持续产生消耗,闲置时候,一定要及时调用关闭会话接口进行断流。
2. 参照 查询会话状态 查询会话是否创建成功。
3. 会话创建成功后,参照 开启会话 打开流的会话状态。完成后即可通过驱动接口去驱动数字人了。

步骤二:视频流解析播放

1. 用户选择 RTMP,可以选择三方播放器如 VLC 等支持 RTMP 流协议的播放器进行播放。流地址由第一步的建流结果产生。
2. 用户选择 WebRTC,可以选择 WebRTC 的播放器 SDK 进行播放。流地址由第一步的建流结果产生。
3. 用户选择 TRTC 时候,需要接入 TRTC SDK 来完成视频解析。按照下图格式解析字段信息传入 TRTC SDK,后续按要求运行 TRTC SDK 即可播放视频。
注意:
TRTC 协议场景下,若形象支持透明背景,可以通过两步体现效果:
1. 在 TRTC SDK 中将配置:trtc = TRTC.create(); 调整成 trtc = TRTC.create({ enableSEI: true });
2. 同时在第一步的建流环节,增加 AlphaChannelEnable 参数,并将 AlphaChannelEnable 参数置为 True。


步骤三:音频驱动

注意:
当前轻量版形象仅支持音频驱动,若需要文本驱动,可以参考 端渲染驱动接口,在音频驱动的前置环节增加文本转音频功能。
1. 参照 创建长链接通道 建立驱动的长连接通道
2. 参照 声音驱动指令 发起驱动请求
3. 可选对接。参照 心跳指令 可以保证长连接不会超时断开。
4. 可选对接。依据 长链接下行消息 里的参数信息做业务的各种信息处理。


步骤四:关闭会话

视频流不断开的情况下会持续产生消耗,业务场景下如不需要视频流时候要及时调用关闭会话接口进行断流并关闭对话。默认10分钟没有对话,会自动关闭。
如果不确定当前有几路流且忘记流的 sessionid,可通过调用查询会话列表的三个接口(任选其一)进行查询。
查询会话接口1:查询 uin 下的会话列表

步骤五:持续保活(可选)

视频流默认10分钟没有驱动对话,则会自动断开。如需视频流长期有效,需要通过调用 心跳指令 进行保活。


最佳实践 Demo

注意:
该 Demo 既支持 GPU 版形象也支持 CPU 形象,由于 CPU 形象(轻量版形象)只支持音频驱动的形式,所以在导入轻量版形象并发起交互会话的场景下使用该 Demo 时,只能使用音频驱动,文本驱动不可用。


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈