CN113056908A

CN113056908A - 视频字幕合成方法、装置、存储介质及电子设备

Info

Publication number: CN113056908A
Application number: CN201980076343.7A
Authority: CN
Inventors: 叶青
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd; Shenzhen Huantai Technology Co Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd; Shenzhen Huantai Technology Co Ltd
Priority date: 2019-01-29
Filing date: 2019-01-29
Publication date: 2021-06-29
Anticipated expiration: 2039-01-29
Also published as: CN113056908B; WO2020154916A1

Abstract

本申请公开了一种视频字幕合成方法，包括：获取视频当中的语音信息，根据语音信息的特征得到待识别语音，将待识别语音输入至d‑vector声纹识别模型，以得到待识别语音所对应的声纹标识，声纹标识包含d‑vector特征，对待识别语音进行语音识别以得到对应的文本信息，将声纹标识和文本信息进行合成，以生成待识别语音的字幕。

Description

PCT国内申请，说明书已公开。

Claims

PCT国内申请，权利要求书已公开。