EP1589524B1

EP1589524B1 - Procédé et dispositif pour la synthèse de la parole

Info

Publication number: EP1589524B1
Application number: EP20050447078
Authority: EP
Inventors: Vincent Colotte; Richard Beaufort
Original assignee: Multitel ASBL
Current assignee: Multitel ASBL
Priority date: 2004-04-15
Filing date: 2005-04-08
Publication date: 2008-03-12
Anticipated expiration: 2025-04-08
Also published as: EP1589524A1

Claims

Procédé pour synthétiser la parole, comprenant les étapes consistant à :
- appliquer une analyse linguistique à une phrase à transformer en un signal vocal, ladite analyse générant des phonèmes à prononcer et, associée à chaque phonème, une liste de particularités linguistiques,

- sélectionner des unités vocales candidates, exclusivement basées sur les particularités linguistiques sélectionnées,

- former ledit signal vocal en concaténant les unités vocales sélectionnées parmi lesdites unités vocales candidates.
Procédé pour synthétiser la parole selon la revendication 1, dans lequel dans une étape d'apprentissage précédente lesdites particularités linguistiques sélectionnées sont déterminées.
Procédé pour synthétiser la parole selon la revendication 1 ou 2, dans lequel l'étape consistant à sélectionner des unités vocales candidates est réalisée en utilisant une base de données comprenant des informations sur les phonèmes et au moins leurs particularités linguistiques.
Procédé pour synthétiser la parole selon la revendication 3, dans lequel lesdites informations sur lesdites particularités linguistiques comprennent un coefficient de pondération pour chaque particularité linguistique, lesdits coefficients de pondération résultant d'une procédure de pondération automatique.
Procédé pour synthétiser la parole selon la revendication 3 ou 4, dans lequel lesdites informations sont obtenues à partir d'une étape d'étiquetage et de segmentation d'un corpus.
Procédé pour synthétiser la parole selon l'une quelconque des revendications 1 à 5, dans lequel l'étape consistant à sélectionner des unités vocales candidates comprend des sous-étapes consistant à
- sélectionner des groupes candidats de représentations acoustiques pour chaque phonème, et

- calculer des unités vocales candidates à partir desdits groupes candidats sélectionnés.
Procédé selon l'une quelconque des revendications précédentes, dans lequel lesdites unités vocales sont des unités diphoniques.
Procédé selon la revendication 6, dans lequel un coût cible est calculé pour chaque groupe candidat.
Procédé selon la revendication 8, dans lequel pour chaque unité vocale candidate un coût cible est calculé à partir desdits coûts cibles pour lesdites groupes candidats.
Procédé selon les revendications 8 ou 9, dans lequel ladite concaténation d'unités vocales est réalisée en prenant en compte ledit coût cible ainsi qu'un coût de concaténation.
Procédé pour synthétiser la parole selon l'une quelconque des revendications 1 à 10, dans lequel lesdites particularités linguistiques comprennent des particularités provenant du groupe (phonèmes environnants, informations d'accentuation, nombre de syllabes, syllabes, emplacement de mot, nombre de mots, informations de groupe de rythme).
Dispositif de synthèse de la parole comprenant
- un moteur d'analyse linguistique agencé pour produire des phonèmes à prononcer et, associée à chaque phonème, une liste de particularités linguistiques,

- un moyen de stockage pour stocker une base de données comprenant des informations sur les phonèmes et au moins leurs particularités linguistiques,

- un moyen de sélection d'unités vocales pour sélectionner des unités vocales candidates exclusivement basées sur les particularités linguistiques sélectionnées,

- un moyen de synthétisation pour concaténer les unités vocales sélectionnées par ledit moyen de sélection.
Dispositif de synthèse de la parole selon la revendication 12, comprenant en outre un moyen de calcul pour calculer automatiquement un coefficient de pondération pour chaque particularité linguistique.