WO2016172871A1

WO2016172871A1 - Procédé de synthèse de parole basé sur des réseaux neuronaux récurrents

Info

Publication number: WO2016172871A1
Application number: PCT/CN2015/077785
Authority: WO
Inventors: 华侃如
Original assignee: 华侃如
Priority date: 2015-04-29
Filing date: 2015-04-29
Publication date: 2016-11-03

Abstract

L'invention concerne un procédé de synthèse de parole basé sur des réseaux neuronaux récurrents, comprenant, de manière spécifique, les étapes suivantes consistant à : acquérir des informations de contexte d'un texte à synthétiser ; produire une séquence de paramètres statistiques acoustiques selon les informations de contexte du texte ; en fonction de la séquence de paramètres statistiques acoustiques produite à partir des informations de contexte, utiliser un réseau neuronal récurrent pour produire une séquence de paramètres acoustiques d'une parole à synthétiser ; et synthétiser la parole en fonction de la séquence de paramètres acoustiques de la parole à synthétiser. En comparaison avec des procédés de synthèse de parole à paramètres statistiques classiques, le procédé confère plus de naturel à la parole synthétisée et possède une bonne propriété en temps réel.