WO2023045954A1

WO2023045954A1 - Procédé et appareil de synthèse de la parole, dispositif électronique et support de stockage lisible

Info

Publication number: WO2023045954A1
Application number: PCT/CN2022/120120
Authority: WO
Inventors: 代东洋; 黄雷; 陈彦洁; 李鑫; 陈远哲; 王玉平
Original assignee: 北京字跳网络技术有限公司
Priority date: 2021-09-22
Filing date: 2022-09-21
Publication date: 2023-03-30
Also published as: CN115938338A

Abstract

L'invention concerne un procédé et un appareil de synthèse de la parole, un dispositif électronique, un support de stockage lisible et un produit de programme. Le procédé consiste : à acquérir un texte à traiter (S201) ; à entrer le texte à traiter dans un modèle de synthèse de la parole de sorte à obtenir une caractéristique spectrale émise correspondant au texte à traiter (S202) ; le modèle de synthèse de la parole comprenant : un sous-modèle de rythme et un sous-modèle de timbre, le sous-modèle de rythme étant utilisé pour délivrer en sortie une première caractéristique acoustique correspondante en fonction du texte entré à traiter et la première caractéristique acoustique comprenant une caractéristique de goulot d'étranglement pour représenter un style rap cible ; le sous-modèle de timbre étant utilisé pour délivrer en sortie, en fonction de la première caractéristique acoustique d'entrée, une caractéristique spectrale pour représenter un timbre cible ; en fonction de la caractéristique spectrale correspondant au texte à traiter, à obtenir un audio cible correspondant au texte à traiter, l'audio cible ayant un timbre cible et un style rap cible (S203).