EP1184839B1

EP1184839B1 - Conversion graphème-phonème

Info

Publication number: EP1184839B1
Application number: EP01117869A
Authority: EP
Inventors: Horst-Udo Hain
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2000-08-31
Filing date: 2001-07-23
Publication date: 2005-09-28
Anticipated expiration: 2021-07-23
Also published as: DE50107556D1; EP1184839A2; US7107216B2; EP1184839A3; US20020046025A1; DE10042944C2; DE10042944A1

Claims

Procédé de conversion graphème-phonème d'un mot qui n'est pas contenu en tant que tel dans un lexique de prononciation, lequel procédé comprend les étapes suivantes:

a) le mot est décomposé en mots partiels,

b) on exécute une conversion graphème-phonème des mots partiels,

c) les transcriptions des mots partiels obtenues lors de la conversion sont rangées les unes derrière les autres et l'on obtient au moins une coupure entre les transcriptions des mots partiels,

d) les phonèmes des mots partiels adjacents à l'au moins une coupure sont déterminés,

e) à l'aide d'un lexique qui indique par quel graphème les phonèmes sont créés, on détermine les graphèmes des mots partiels qui créent les phonèmes adjacents à l'au moins une coupure,

f) au moyen d'un réseau neural, la conversion graphème-phonème des graphèmes définis est recalculée en fonction du contexte de gauche et du contexte de droite de la coupure concernée.
Procédé selon la revendication 1,
caractérisé en ce que pour un mot d'une banque de données qui contient les transcriptions phonétiques de mots, on cherche des mots partiels du mot et en ce que pour un mot partiel découvert dans la banque de données, on sélectionne la transcription phonétique référencée dans la banque de données.
Procédé selon la revendication 2,
caractérisé en ce que lorsque le mot partiel a été trouvé, le mot présente au moins un autre composant qui n'est pas référencé dans la banque de données et en ce que cet autre composant est transcrit phonétiquement au moyen d'un traitement par OOV.
Procédé selon l'une des revendications précédentes,
caractérisé en ce que le mot est décomposé en mots partiels d'une certaine longueur minimale.
Produit de programme informatique qui peut être exécuté sur un ordinateur et qui exécute les étapes selon l'une des revendications 1 à 4.
Produit de programme informatique qui est conservé en mémoire sur un support informatique et qui comprend des moyens de programme lisibles par ordinateur qui permettent à un ordinateur d'exécuter le procédé selon l'une des revendications 1 à 4.
Support de données sur lequel un programme informatique est conservé en mémoire et qui permet à un ordinateur d'exécuter après une opération de chargement le procédé selon l'une des revendications 1 à 4.
Système informatique doté de moyens en vue de la mise en oeuvre du procédé selon l'une des revendications 1 à 4.
Système informatique pour la conversion graphème-phonème d'un mot qui n'est pas contenu en tant que tel dans un lexique de prononciation, qui comprend:

un dispositif de mémoire (22, 30) pour conserver en mémoire un programme informatique sur un support de mémoire,

une unité de traitement (20) qui charge le programme informatique stocké sur le dispositif de mémoire et qui exécute le programme informatique,

des moyens de décomposer le mot en mots partiels,

des moyens pour ranger les uns derrière les autres les transcriptions des mots partiels, avec au moins une coupure entre les transcriptions des mots partiels,

des moyens de détermination des phonèmes des mots partiels qui sont adjacents à l'au moins une coupure,

des moyens qui, à l'aide d'un lexique qui indique par quels graphèmes les phonèmes sont créés, déterminent quels graphèmes des mots partiels créent les phonèmes adjacents à l'au moins une coupure,

des moyens pour recalculer au moyen d'un réseau neural la conversion graphème-phonème des graphèmes définis, en fonction du contexte de gauche et du contexte de droite de chaque coupure, et

des moyens pour ensuite écrire dans un deuxième dispositif de mémoire les phonèmes adjacents à la coupure et qui ont été recalculés.