WO2022121158A1

WO2022121158A1 - Procédé et appareil de synthèse de la parole, et dispositif électronique et support d'enregistrement

Info

Publication number: WO2022121158A1
Application number: PCT/CN2021/083186
Authority: WO
Inventors: 孙奥兰; 王健宗; 程宁
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-12-11
Filing date: 2021-03-26
Publication date: 2022-06-16
Also published as: CN112509554A

Abstract

Procédé de synthèse de la parole et appareil de synthèse de la parole (100), et dispositif électronique (1) et support d'enregistrement. Le procédé comprend : l'obtention d'un vecteur de caractère, et la réalisation d'un calcul d'attention sur le vecteur de caractère à l'aide d'un réseau d'attention multi-tête pour obtenir un vecteur d'attention (S4); la réalisation d'une connexion résiduelle sur le vecteur d'attention et le vecteur de caractère pour obtenir un vecteur d'attention de caractère (S5); la réalisation d'une extraction de caractéristiques sur le vecteur d'attention de caractère à l'aide d'un réseau d'extraction de caractéristiques de caractère pour obtenir une séquence de caractéristiques de caractère (S6); et l'entrée du vecteur de caractère dans un modèle de prédiction de pause de prononciation pré-construit pour obtenir une séquence de pause de prononciation (S7); la réalisation d'une connexion résiduelle sur la séquence de caractéristiques de caractère et la séquence de pause de prononciation pour obtenir une séquence de parole, et la réalisation d'une synthèse de la parole sur la séquence de parole à l'aide d'un vocodeur pré-construit pour obtenir une parole synthétisée d'un texte de caractère (S8). Le problème selon lequel la parole synthétisée n'est pas lisse et suffisamment naturelle peut être résolu.