CA2654961C - Correcteur, programme d'ordinateur et procede de correction semantique, syntaxique et lexicale d'une expression erronee dans un texte numerique - Google Patents

Correcteur, programme d'ordinateur et procede de correction semantique, syntaxique et lexicale d'une expression erronee dans un texte numerique Download PDF

Info

Publication number
CA2654961C
CA2654961C CA2654961A CA2654961A CA2654961C CA 2654961 C CA2654961 C CA 2654961C CA 2654961 A CA2654961 A CA 2654961A CA 2654961 A CA2654961 A CA 2654961A CA 2654961 C CA2654961 C CA 2654961C
Authority
CA
Canada
Prior art keywords
expression
digital
module
text
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CA2654961A
Other languages
English (en)
Other versions
CA2654961A1 (fr
Inventor
Gilles Vessiere
Joel Bachelerie
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brini Abderrahman
Original Assignee
Brini Abderrahman
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brini Abderrahman filed Critical Brini Abderrahman
Publication of CA2654961A1 publication Critical patent/CA2654961A1/fr
Application granted granted Critical
Publication of CA2654961C publication Critical patent/CA2654961C/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

Ce procédé est adapté aux personnes dysorthographiques ou malvoyantes, pour faciliter la correction sémantique, syntaxique et/ou lexicale d'une expression erronée dans un texte numérique saisi par un utilisateur. A cet effet, ce procédé comprend à la fois : une étape (74) de transformation du texte numérique en un message vocal numérique, dans laquelle on convertit les graphèmes de l'expression textuelle erronée en phonème(s) constituant une expression vocale intelligible, puis une étape (78) de traitement du message vocal numérique obtenu à la fin de l'étape de transformation (74), dans laquelle on convertit le ou les phonèmes constituant l'expression vocale intelligible en graphème(s) constituant une expression textuelle corrigée de l'expression textuelle erronée, à l'aide de règles d'écriture préétablies.

Description

CORRECTEUR, PROGRAMME D'ORDINATEUR ET PROCEDE DE CORRECTION
SEMANTIQUE, SYNTAXIQUE ET LEXICALE D'UNE EXPRESSION ERRONEE
DANS UN TEXTE NUMERIQUE
La présente invention concerne un correcteur sémantique, syntaxique et/ou lexical électronique pour faciliter la correction sémantique et/ou syntaxique et/ou lexicale d'une expression erronée dans un texte numérique. L'invention concerne également un procédé de correction correspondant, ainsi qu'un support d'enregistrement et un programme d'ordinateur pour la mise en oeuvre de ce procédé. L'invention relève ainsi du domaine du traitement automatique du langage naturel (TALN).
Ici, le terme numérique s'entend dans son sens large des domaines informatique et électronique, c'est-à-dire désigne un objet d'information qui peut être produit, stocké et/ou traité sous forme binaire. De même, ici, le terme expression est utilisé pour désigner aussi bien un mot, un groupe de mots dans une phrase ou une phrase entière ou, plus généralement, tout élément linguistique graphique, tel qu'un chiffre ou un pictogramme, associée à une version vocale ou sonore.
Il existe aujourd'hui de nombreux correcteurs syntaxiques associés à
différents logiciels de traitement de texte existants. L'un des plus connus de ces correcteurs est, par exemple, celui utilisé dans le traitement de texte Word de Microsoft . Typiquement, ce type de correcteur détecte automatiquement une expression erronée et propose une ou plusieurs expressions susceptibles d'être utilisées pour corriger l'expression erronée. L'utilisateur valide la correction appropriée et l'expression correcte remplace l'expression erronée.
Ce type de correcteur est pratique et adapté pour la plupart des utilisateurs. Toutefois, de tels correcteurs ne sont pas faciles à utiliser pour une personne dysorthographique, notamment dyslexique, ou malvoyante, voire aveugle. En effet, ces personnes ont des difficultés importantes pour écrire et pour lire les expressions corrigées proposées par le correcteur, de sorte qu'il leur est délicat, voire impossible de corriger de manière adéquate l'expression erronée.
2 Les difficultés rencontrées par les personnes dyslexiques peuvent toutefois être surmontées en partie grâce à l'informatique, comme évoqué dans l'article An empirical investigation of ways in which some of the problems encountered by some dyslexics maby alleviated using computer techniques (P.
Gregor et al., 13 novembre 2000, the fourth international ACM conference on assistive technologies).
Le logiciel texthelp TM
est présenté comme adapté aux personnes dyslexiques, dans le sens où ce logiciel inclut divers outils, sous forme de sous-programmes indépendants les uns des autres, facilitant l'écriture et la lecture pour ces personnes. En particulier, ce logiciel inclut un outil text-to-speech , qui permet de transformer un texte numérique, notamment un texte saisi de type MS \Nord, en un message vocal à l'attention d'un utilisateur. Autrement dit, cet outil text-to-speech permet à un ordinateur de lire à haute voix un écrit numérique. Un autre outil, indépendant du précédent, consiste en un correcteur orthographique phonologique ( phonetic spellchecker en anglais), qui permet de corriger l'orthographe d'un texte saisi de type MS Word. Un exemple de ce genre de correcteur orthographique phonologique est présenté plus en détail dans GB-A-2 343 037: ce logiciel scinde un mot numérique én grappes de lettre(s) puis associe, à l'aide d'une base de règles préétablies, chacune de ces grappes à
des prononciations envisageables. Ces différentes prononciations sont ensuite traitées à l'aide d'un dictionnaire de prononciation, pour établir une liste d'orthographes possibles pour le mot.
Les outils actuellement disponibles apportent ainsi une certaine aide aux
3 personnes illettrées ou souffrant d'un lourd handicap de communication, congénital ou à la suite d'un accident.
Le but de la présente invention est donc de proposer un procédé de correction et un correcteur correspondant, qui soient efficaces pour un large public de personnes souffrant de troubles de la lecture et de l'écriture.
A cet effet, l'invention a pour objet un procédé de correction sémantique, syntaxique et/ou lexicale d'une expression erronée dans un texte numérique, tel que défini à la revendication 1. L'invention a également pour objet un correcteur sémantique, syntaxique et/ou lexical électronique pour faciliter la correction sémantique et/ou syntaxique et/ou lexicale d'une expression erronée dans un texte numérique, tel que défini à la revendication 4.
Dans le présent document, le terme phonème désigne, de manière large, des éléments phoniques linguistiques, soit élémentaires, soit associés à
d'autres éléments phoniques pour former des phonèmes articulés, de manière préfixée ou suffixée, ou pour former des diphonèmes, voire des triphonèmes ou triphones.
Contrairement aux correcteurs connus, qui corrigent une expression textuelle erronée par l'intermédiaire de modules de traitement direct du texte numérique, le procédé et le fonctionnement du correcteur conformes à
l'invention repose sur l'utilisation d'un message vocal numérique, obtenu par la conversion du texte numérique avec erreur par le module de transformation et utilisé ensuite pour fournir un texte sans erreur par l'intermédiaire du module de traitement. Autrement dit, plutôt que de traiter directement le texte numérique contenant l'expression erronée, l'idée à la base de l'invention est de traiter ce texte de manière indirecte, c'est-à-dire par l'intermédiaire d'un message vocal numérique, étant remarqué que, quand bien même le texte numérique initial contient des erreurs sémantiques, syntaxiques et/ou lexicales, les phonèmes de ce message vocal numérique forment une version vocale du texte dénuée d'erreur phonétique, qui est alors traitée pour fournir le texte numérique corrigé, à l'aide de la base de règles d'écriture associée au module de traitement.
Ainsi, même une personne dysorthographique, telle qu'une personne dyslexique, ou une personne malvoyante peut facilement et efficacement corriger un texte qu'elle a préalablement saisi numériquement.
4 En effet, en exploitant les caractéristiques du langage parlé, qui le rendent indépendant de l'emploi des règles qui régissent l'écriture, des moyens de traitement automatique de la parole, sur lesquels repose l'invention, permettent cette correction efficace, et ce même pour des personnes souffrant de troubles importants de la lecture et de l'écriture. Les technologies de traitement du langage parlé, auxquelles l'invention fait appel, reposent sur l'utilisation d'une suite d'évènements qui offrent la plus petite, mais suffisante, représentation d'une expression, telle que des mots, des lettres, des chiffres, des ponctuations, etc. Ces évènements sont essentiellement des phonèmes, au sens général défini plus haut, de sorte que, en tant qu'élément de parole, un texte peut être considéré comme une suite de phonèmes reliés sans discontinuité. Ceci est vrai tant au regard d'un mot, que d'une phrase. Autrement dit, un élément d'un mot, par exemple une lettre, n'est pas alors identifié au niveau vocal en tant qu'unité
isolée, mais il est identifié en relation insécable avec l'élément de mot qui le précède et/ou l'élément de mot qui le suit, et/ou enfin en relation avec l'ensemble des éléments de mots auquel il appartient. Le traitement automatique de la parole offre ainsi une finesse remarquable, capable de différencier un élément de parole d'un autre, si petit soit il. Au regard de cet aspect, lorsque le procédé
selon l'invention est appliqué à un mot, la précision de ce procédé s'explique par l'identification précise de chaque élément constituant ce mot, à l'aide de phonèmes au sens large, en utilisant des éléments acoustiques et des algorithmes de statistiques. En particulier, il est ainsi possible de différencier, de manière très fine, un phonème mais également de prévoir, à l'aide de modèles statistiques, la coarticulation préfixe et suffixe de ce phonème. En pratique, les moyens de traitement automatiques de la parole à la base de l'invention sont capables de discriminer entre plusieurs concurrents possibles pour une même lettre, en se basant sur la comparaison de signaux acoustiques de faibles dimensions, à laquelle il est avantageusement ajoutée une comparaison de signaux électriques associés. Ainsi, le choix entre deux solutions possibles pour une même lettre est beaucoup plus performant à l'aide de tels moyens de traitement du langage naturel qu'à l'aide de techniques de comparaison de grappes de lettre(s), comme envisagé dans les correcteurs orthographiques phonologiques évoqués plus haut, notamment du type de celui proposé dans GB-A-2 343 037.
Le fait que le procédé selon l'invention traite un texte au niveau vocal, c'est-à-dire au niveau du langage parlé, permet donc de s'affranchir de la
5 discontinuité des mots dans une phrase. Un autre aspect avantageux du passage par le niveau vocal est que l'utilisateur peut écrire un mot de manière incorrecte, dont la prononciation n'a pas à être rigoureusement exacte, dans le sens où une identification par modification de la prosodie, obtenue par des moyens de traitement du langage naturel adéquats, permet de corriger l'erreur de prononciation.
Un autre avantage du procédé selon l'invention est lié à sa capacité à
corriger une phrase fausse constituée de mots justes, c'est-à-dire une phrase intelligible constituée d'une suite de mots corrects au niveau lexical mais incohérents au niveau syntaxique et/ou sémantique. En effet, lorsque ce genre de phrase est traité par un correcteur orthographique phonologique, chaque mot considéré isolément ne nécessite aucune correction, alors que la phrase prise dans son ensemble n'a aucun sens au niveau textuel, alors qu'elle en a un au niveau du langage parlé. On peut d'ailleurs remarquer que le passage par le langage parlé, conformément à l'invention, permet de corriger l'utilisation, dans un texte numérique, de nombres ou de chiffres remplaçant des sons, en particulier au sein d'un mot, car ces nombres ou ces chiffres ne sont pas alors considérés comme des éléments mathématiques, mais comme des éléments acoustiques. Les mêmes considérations s'appliquent à des abréviations du genre de celles que l'on rencontre actuellement dans les messages de type SMS, ainsi qu'à des pictogrammes dans la mesure où ces derniers peuvent être vocalisés de manière univoque.
Encore un autre avantage du procédé et du correcteur selon l'invention, en particulier par comparaison aux correcteurs orthographiques phonologiques, est la facilité avec laquelle de nouvelles langues peuvent être prises en compte, moyennant, d'une part, un réglage adéquat du module de transformation pour que ce dernier puisse transformer de manière optimale un texte numérique en un message vocal numérique dans une nouvelle langue donnée, et, d'autre part, un réglage adéquat du module de traitement pour que ce dernier puisse
6 convertir le message vocal numérique en un texte numérique dans cette nouvelle langue.
D'autres caractéristiques du procédé de correction et du correcteur selon l'invention, prises isolément ou suivant toutes les combinaisons techniquement possibles, sont énoncées aux revendications 2, 3 et 5 à 9. -L'invention a en outre pour objet un support d'enregistrement d'informations et un programme d'ordinateur, tels que définis à la revendication 10.
L'invention sera mieux comprise à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple et faite en se référant aux dessins sur lesquels :
- la figure 1 est un schéma illustrant un système de correction conforme à l'invention, et - la figure 2 est un organigramme d'un procédé de correction conforme à l'invention.
La figure 1 représente un système de correction sémantique, syntaxique et lexicale, désigné par la référence générale 2. Le système 2 est ici réalisé, à
titre d'exemple, à partir d'un ordinateur conventionnel équipé d'un logiciel de traitement de texte conventionnel 6 et d'un correcteur sémantique, syntaxique et lexical 8.
Le logiciel de traitement de texte 6 forme ici un exemple d'un moyen d'acquisition d'un texte numérique dactylographié complet, à corriger. Ce texte complet est formé d'une succession d'expressions.
L'ordinateur comporte une interface homme/machine 12 associée à une unité centrale 14, formée à partir d'un calculateur électronique programmable conventionnel, apte à exécuter le logiciel de traitement de texte 6.
L'interface 12 comporte, entre autres :
- un écran vidéo 20, - un clavier 22 équipé d'un touche 24 d'activation d'un module de traitement appartenant au correcteur 8, et - des haut-parleurs 30 ou analogues.
Le correcteur 8 est apte à corriger des expressions erronées acquises à
l'aide du logiciel 6. A cet effet, ce correcteur comporte :
7 - un module 40 de transformation d'un texte numérique en un message vocal numérique, apte à convertir les graphèmes du texte, c'est-à-dire ses éléments textuels, en des phonèmes, c'est-à-dire en des éléments sonores, tels que des voyelles, consonnes, des diphtongues, etc, l'ensemble de ces phonèmes constituant une version vocale intelligible du texte ;
- un module 42 de traitement d'un message vocal numérique, apte à
convertir les phonèmes du message en des graphèmes pour former un texte numérique constituant une version textuelle lisible du message vocal ; et - un module 44 de correction orthographique automatique d'un texte numérique.
Ces modules 40, 42 et 44 sont prévues pour fonctionner en série au sein du correcteur 8 qui comporte à cet effet des moyens de transmission électroniques ad hoc entre ces modules.
Pour convertir un texte numérique, tel qu'un texte dactylographié, en un message vocal numérique, et vice-versa, les modules 40 et 42 utilisent des techniques connues, telles que celles décrites dans La parole et son traitement automatique , Tubach J.P. et al, 1989, édition Masson, Paris, ou dans les ouvrages de référence de J.P. Haton. Comme expliqué plus haut, ces techniques de traitement automatique du langage parlé permettent d'identifier un élément de mot écrit en tant que signal acoustique, ainsi qu'éventuellement en tant que signal électrique, sous une forme de phonème au sens large, notamment de triphone.
Une mémoire 50 est associée à l'unité centrale 14. Cette mémoire 50 comporte :
- une base préétablie 52 d'un modèle de voix synthétique; cette base 52 est destinée à être utilisée par le module 40 pour fournir des phonèmes présentant un profil vocal prédéterminé, s'apparentant en pratique à une voix synthétique ;
- une base 54 de règles de reconnaissance de voix ; cette base 54 est destinée à être utilisée par le module 42 pour faciliter l'identification des phonèmes à convertir, à l'aide des règles de la base ;
8 - une base préétablie 56 de règles d'écriture ; cette base 56 est destinée à être utilisée par le module 42 pour fournir des expressions textuelles correctes à partir de phonèmes ; et - une base préétablie 58 de règles de correction orthographique, destinée à être utilisée par le module 44.
Avantageusement, les bases 56 et 58 sont chacune divisées en deux parties, une première partie comportant les règles adaptées à tout type d'utilisateur, tandis qu'une seconde partie comporte des règles spécialement établies pour un utilisateur donné du correcteur 8, associé à un identifiant.
Ici, le correcteur 8 est réalisé sous la forme d'un programme d'ordinateur exécutable par le calculateur électronique de l'unité centrale 14. A cet effet, la mémoire 52 comporte également des instructions pour l'exécution du procédé
illustré à la figure 2, ainsi que de variantes de ce procédé.
Un exemple de fonctionnement du système 2 va maintenant être décrit en regard du procédé de la figure 2.
Initialement, lors d'une étape 70 d'initialisation du correcteur 8, un utilisateur donné s'identifie auprès du correcteur. En fonction de cet utilisateur, le correcteur sélectionne, lors de la même étape,- les secondes parties des bases 56 et 58 correspondantes à utiliser.
L'utilisateur saisit ensuite un texte à l'aide du clavier 22. Ce texte est acquis, lors d'une étape 72, par le logiciel 6 sous la forme d'un texte dactylographié numérique. A titre d'exemple, le texte acquis est Je bois delo , étant remarqué que l'expression delo est évidemment erronée dans le contexte de ce texte.
Une fois que le texte complet à corriger a été acquis par le logiciel 6, le module 40 le transforme en un message vocal numérique lors d'une étape 74, en convertissant les graphèmes du texte, en particulier celui de l'expression textuelle erronée delo , en phonèmes. En pratique, l'étape 72 fournit un ensemble numérique de données d'information textuelle représentatives du texte numérique avec l'expression erronée delo , tandis que, lors de l'étape 74, cet ensemble numérique de données d'information textuelle est converti, par le module 40, en un ensemble numérique de données d'information vocale représentatives des phonèmes associées aux graphèmes du texte numérique, y
9 PCT/FR2007/001001 compris les phonèmes constituant l'expression vocale de l'expression textuelle erronée delo . Concrètement, à la fin de l'étape 72, on dispose d'un fichier numérique de texte, tandis qu'à la fin de l'étape 74, le module 40 fournit un fichier numérique de son.
Lors de l'étape 74, le module 40 utilise avantageusement la base 52 pour fournir les phonèmes selon le modèle de voix synthétique.
Avantageusement, le message vocal numérique fourni par le module 40 est envoyé au haut-parleur 30 qui, lors d'une étape optionnelle 76, synthétise ce message vocal en des sons audibles pour l'utilisateur. Ce dernier entend ainsi la version vocale du texte qu'il a dactylographié, après sa transformation par le module 40. L'utilisateur peut alors vérifier l'exactitude phonétique du message vocal synthétisé, étant remarqué que, bien que l'utilisateur ait saisi une expression textuelle erronée, le message vocal synthétisé se révèle exact d'un point de vue sonore.
Dans la mesure où l'utilisateur est satisfait de la version sonore du texte qu'il a saisi à l'étape 72, il enfonce la touche 24.
Soit de manière automatique à la fin de l'étape_ 74 si l'étape 76 n'est pas mise en oeuvre, soit en réponse à l'enfoncement de la touche 24, le module 42 est activé et, lors d'une étape 78, ce module 42 traite le message vocal numérique fourni par le module 40. Lors de cette étape 78, les phonèmes du message vocal numérique sont convertis en graphèmes pour former un texte numérique correspondant, que l'on peut qualifier de texte reconstitué et qui est dépourvu d'erreur dans le sens où ce texte est écrit par le module 42 à
l'aide des règles d'écriture de la base 56. Ainsi, le module 42 convertit les phonèmes de l'exemple précité en Je bois de l'eau , étant remarqué que l'expression textuelle de l'eau est correcte dans le contexte de la phrase et constitue ainsi l'expression corrigée de l'expression erronée delo .
En pratique, lors de l'étape 78, l'ensemble numérique de données d'information vocale fourni à l'étape 74, concrètement le fichier de son, est converti en un ensemble numérique de données d'information textuelle représentatives du texte numérique, concrètement un fichier de texte, avec l'expression textuelle delo corrigée en de l'eau .

Lors de l'étape 78, si la base 52 a été utilisée à l'étape 74, le traitement du message vocal numérique par le module 42 est avantageusement amélioré
de manière significative en utilisant la base 54: le module 42 identifie alors facilement les phonèmes à convertir à l'aide des règles de reconnaissance de la base 54. En pratique, ces règles de reconnaissance ont été, lors d'opérations d'apprentissage antérieures à l'étape 70, établies en fonction du modèle de voix synthétique utilisée par le module 40. Lors de l'étape 78, le module de traitement 42 exploite ainsi un message vocal qui est, en quelque sorte, dicté par la voix synthétique qu'il reconnaît.
10 A l'issue de l'étape 78, le correcteur 8 procède à une étape optionnelle 80 de correction orthographique, par l'intermédiaire du module 44 utilisant la base 58. Durant cette étape 80, on traite le texte fourni par le module 42 afin de corriger d'éventuelles fautes d'orthographe résiduelles.
Si besoin, selon la volonté de l'utilisateur, les étapes 74 à 80 peuvent être réitérées pour le texte numérique fourni à l'issue de l'étape 80, par exemple à
des fins de contrôle et de vérification, ou bien l'utilisateur saisit un nouveau texte et réitère les étapes 72 à 80 pour le nouveau texte saisi.
En variante non représentée, le traitement du message vocal numérique par le module 42 peut conduire à l'obtention de deux, voire plus, de textes numériques différents les uns des autres lorsque plusieurs possibilités de correction sont envisageables. Dans ce cas, ces textes numériques sont avantageusement vocalisés par le module 40, pour obtenir autant de messages vocaux numériques parmi lesquels sera identifié par comparaison sonore le message le plus proche du message fourni à la fin de l'étape 74, grâce à un module adéquat de comparaison sonore automatique. Une autre possibilité
consiste à laisser l'utilisateur faire par soi-même cette comparaison sonore, en prévoyant que le message vocal numérique fourni à l'étape 74 et les différents messages vocaux numériques évoqués ci-dessus soient synthétisés par le haut-parleur 30. On notera que le fait de pouvoir écouter ces différents messages vocaux permet à l'utilisateur de s'autocorriger, avec des effets de remédiation ou des effets pédagogiques mesurables.
Ainsi, les corrections apportées par l'invention reposent essentiellement sur le traitement d'un message vocal numérique, ce qui rend l'invention à la
11 portée de personnes dysorthographiques, malvoyantes, illettrées ou en situation de handicap de communication. De manière plus générale, on comprend que le correcteur et le procédé selon l'invention peuvent être intégrés dans toutes les interfaces de communication pour lesquelles on souhaite corriger une expression textuelle dont on s'attend à ce qu'elle soit erronée.
Pour bien apprécier l'efficacité du procédé conforme à l'invention, on peut considérer l'expression suivante à corriger : Bon jour, île faux champs thé
dents lait blés. J'ai me 100 tire l'art ose. Ja temps de thé nous vèle.
En pratique, cette expression est saisie et corrigée par le système 2, suivant les étapes 70 à 80 telles que décrites ci-dessus. A l'issue de ces étapes, l'expression corrigée fournie par le système est la suivante Bon jour, il faut chanter dans les blés. J'aime sentir la rose. J'attends de tes nouvelles.
Un autre exemple d'expression à corriger par le système 2 est le lit vre de gra maire . Grâce au traitement automatique du langage parlé sur lequel repose le fonctionnement des modules 40 et 42, la correction par le procédé
conforme à l'invention produit l'expression corrigée le livre de grammaire . Si on tentait de corriger cette expression erronée en restant à un niveau textuel, c'est-à-dire en traitant des grappes de lettres, plusieurs possibilités de correction devraient être envisagées : le libre de grand-mère , le livre du Grand Maire , le lit vert de grand-mère et toutes les combinaisons possibles.
Par ailleurs, le système de correction peut être indépendant de la langue de l'utilisateur et n'est pas lié à la nature de la conversion texte/message vocal.
Divers aménagements et variantes au correcteur et au procédé de correction décrits ci-dessus sont par ailleurs envisageables :
- le module de transformation 40 peut être prévu pour segmenter le message vocal numérique qu'il fournit, en mots ou groupes de mots, à l'aide d'une base préétablie de règles de segmentation ; de cette façon, le contrôle du message vocal ainsi segmenté lors de sa synthèse sonore à l'étape 76 en est facilité, tout comme le traitement de ce message vocal par le module 42 lors de l'étape 78;
- d'autres logiciels que le logiciel de traitement de texte 6 peuvent être utilisés pour éditer le texte envoyé au module 40, par exemple des logiciels de messagerie électronique, des logiciels de traduction, etc. ;
12 - la base 54 peut inclure une partie spécialement associée à un utilisateur, avec des règles de reconnaissance vocale obtenues à l'issue d'opérations de modélisation préalables, à l'aide de la voix de cet utilisateur ;
cette possibilité s'avère intéressante lorsque l'utilisateur s'exprime avec une forte déformation prosodique ; en partant du principe que l'utilisateur soumettra au correcteur des expressions écrites de la même façon dont il s'exprime à
l'oral, de meilleurs résultats en terme de correction sont obtenus ;
- plutôt que de prévoir un correcteur sémantique, syntaxique et lexical, l'invention est applicable à un correcteur uniquement adapté pour corriger un ou plusieurs types d'erreurs choisies dans l'ensemble composé des erreurs sémantiques, syntaxiques ou lexicales ; et/ou - les éléments textuels traités par l'invention ne se limitent pas à des lettres, mais peuvent être des chiffres, des symboles, des pictogrammes, etc., tant que ces éléments sont associés à des versions linguistiques sonores ou vocales ; à cet égard, il est envisageable de définir une écriture à minima , par exemple pour le sous-titrage d'images en direct, dont les textes pourront être traités par le procédé selon l'invention afin d'obtenir des textes relevant de l'écriture normale.

Claims (10)

REVENDICATIONS
1. Procédé de correction sémantique, syntaxique et/ou lexicale d'une expression erronée dans un texte numérique, caractérisé en ce qu'il comprend à
la fois :
- une étape (74) de transformation du texte numérique en un message vocal numérique, dans laquelle on convertit des graphèmes de l'expression textuelle erronée en phonème(s) constituant une expression vocale intelligible, puis - une étape (78) de traitement du message vocal numérique obtenu à la fin de l'étape de transformation (74), dans laquelle on convertit le ou les phonèmes constituant l'expression vocale intelligible en graphème(s) constituant une expression textuelle corrigée de l'expression textuelle erronée, à l'aide de règles d'écriture préétablies.
2. Procédé
selon la revendication 1, caractérisé en ce qu'il comporte, avant l'étape de transformation (74), une étape (72) de fourniture d'un ensemble numérique de données d'information textuelle représentatives du texte numérique avec l'expression erronée, en ce que l'étape de transformation (74) comporte une opération de conversion de l'ensemble des données d'information textuelle en un ensemble numérique de données d'information vocale représentatives du ou des phonèmes associés au(x) graphème(s) du texte numérique, y compris le ou les phonèmes constituant l'expression vocale intelligible, et en ce que l'étape de traitement (78) comporte une opération de conversion de l'ensemble numérique de données d'information vocale, fourni par l'opération de conversion de l'étape de transformation (74), en un ensemble numérique de données d'information textuelle représentatives d'un texte numérique reconstitué incluant l'expression textuelle corrigée.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce qu'il comporte en outre, entre l'étape de transformation (74) et l'étape de traitement (78), une étape (76) de synthèse sonore du message vocal numérique obtenu à la fin de l'étape de transformation, étape de synthèse à la fin de laquelle on valide le message vocal numérique à traiter lors de l'étape de traitement (78).
4. Correcteur sémantique, syntaxique et/ou lexical électronique (8) pour faciliter la correction sémantique et/ou syntaxique et/ou lexicale d'une expression erronée dans un texte numérique, caractérisé en ce que ce correcteur inclut à la fois:
- un module (40) de transformation du texte numérique en un message vocal numérique, ce module de transformation étant apte à convertir un ou des graphèmes de l'expression textuelle erronée en phonème(s) constituant une expression vocale intelligible, et - un module (42) de traitement du message vocal numérique fourni par le module de transformation (40), ce module de traitement étant apte à convertir le ou les phonèmes constituant l'expression vocale intelligible et fournis par le module de transformation, en graphème(s) constituant une expression textuelle corrigée de l'expression erronée, à l'aide d'une base préétablie (56) de règles d'écriture.
5. Correcteur selon la revendication 4, caractérisé en ce que le module de transformation (40) et le module de traitement (42) sont respectivement adaptés pour mettre en oeuvre de manière successive l'étape de transformation (74) et l'étape de traitement (78) d'un, procédé conforme à l'une quelconque des revendications 1 à 3.
6. Correcteur selon l'une des revendications 4 ou 5, caractérisé en ce que le module de transformation (40) est apte à fournir le ou les phonèmes selon un modèle de voix prédéterminé, à l'aide d'une base de modèle de voix (52), et en ce que le module de traitement (42) est apte à identifier le ou les phonèmes à
convertir, à l'aide d'une base (54) de règles de reconnaissance du modèle de voix prédéterminé.
7. Correcteur selon l'une quelconque des revendications 4 à 6, caractérisé en ce qu'il comporte en outre:
- au moins un haut-parleur (30) apte à synthétiser en sons audibles le message vocal numérique fourni par le module de transformation (40), et - un dispositif d'activation (24), sous la commande d'un utilisateur, du module de traitement (42) pour appliquer ce module de traitement au message vocal numérique synthétisé par le haut-parleur.
8. Correcteur selon l'une quelconque des revendications 4 à 7, caractérisé en ce que le module de transformation (40) est apte à segmenter le message vocal numérique en mots ou groupes de mots, à l'aide d'une base préétablie de règles de segmentation.
9. Correcteur selon l'une quelconque des revendications 4 à 8, caractérisé en ce qu'il inclut en outre un module (44) de correction orthographique automatique de l'expression textuelle corrigée fournie par le module de traitement (42).
10. Une mémoire lisible par ordinateur caractérisée en ce qu'elle comporte des instructions pour l'exécution d'un procédé de correction conforme à l'une quelconque des revendications 1 à 3, lorsque ces instructions sont exécutées par l'ordinateur.
CA2654961A 2006-06-16 2007-06-15 Correcteur, programme d'ordinateur et procede de correction semantique, syntaxique et lexicale d'une expression erronee dans un texte numerique Expired - Fee Related CA2654961C (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0605378A FR2902542B1 (fr) 2006-06-16 2006-06-16 Correcteur semantiques, syntaxique et/ou lexical, procede de correction, ainsi que support d'enregistrement et programme d'ordinateur pour la mise en oeuvre de ce procede
FR0605378 2006-06-16
PCT/FR2007/001001 WO2007144519A2 (fr) 2006-06-16 2007-06-15 Procede de correction semantique, syntaxique et/ou lexicale, correcteur correspondant, ainsi que support d'enregistrement et programme d'ordinateur pour la mise en œuvre de ce procede

Publications (2)

Publication Number Publication Date
CA2654961A1 CA2654961A1 (fr) 2007-12-21
CA2654961C true CA2654961C (fr) 2017-08-29

Family

ID=37836645

Family Applications (1)

Application Number Title Priority Date Filing Date
CA2654961A Expired - Fee Related CA2654961C (fr) 2006-06-16 2007-06-15 Correcteur, programme d'ordinateur et procede de correction semantique, syntaxique et lexicale d'une expression erronee dans un texte numerique

Country Status (5)

Country Link
US (1) US8249869B2 (fr)
EP (1) EP2030126A2 (fr)
CA (1) CA2654961C (fr)
FR (1) FR2902542B1 (fr)
WO (1) WO2007144519A2 (fr)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10896293B2 (en) * 2016-07-26 2021-01-19 Sony Corporation Information processing apparatus and information processing method

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6064959A (en) * 1997-03-28 2000-05-16 Dragon Systems, Inc. Error correction in speech recognition
US6490563B2 (en) * 1998-08-17 2002-12-03 Microsoft Corporation Proofreading with text to speech feedback
GB2343037B (en) * 1998-10-22 2002-12-31 Ibm Phonetic spell checker
US6618697B1 (en) * 1999-05-14 2003-09-09 Justsystem Corporation Method for rule-based correction of spelling and grammar errors
US6477493B1 (en) * 1999-07-15 2002-11-05 International Business Machines Corporation Off site voice enrollment on a transcription device for speech recognition
US7689416B1 (en) * 1999-09-29 2010-03-30 Poirier Darrell A System for transferring personalize matter from one computer to another
US6678409B1 (en) * 2000-01-14 2004-01-13 Microsoft Corporation Parameterized word segmentation of unsegmented text
US7200555B1 (en) * 2000-07-05 2007-04-03 International Business Machines Corporation Speech recognition correction for devices having limited or no display
US6970820B2 (en) * 2001-02-26 2005-11-29 Matsushita Electric Industrial Co., Ltd. Voice personalization of speech synthesizer
US6834264B2 (en) * 2001-03-29 2004-12-21 Provox Technologies Corporation Method and apparatus for voice dictation and document production
US6859774B2 (en) * 2001-05-02 2005-02-22 International Business Machines Corporation Error corrective mechanisms for consensus decoding of speech
US7668718B2 (en) * 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
US6996528B2 (en) * 2001-08-03 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for efficient, safe and reliable data entry by voice under adverse conditions
US7444286B2 (en) * 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
US7577569B2 (en) * 2001-09-05 2009-08-18 Voice Signal Technologies, Inc. Combined speech recognition and text-to-speech generation
US6952674B2 (en) * 2002-01-07 2005-10-04 Intel Corporation Selecting an acoustic model in a speech recognition system
WO2004003688A2 (fr) * 2002-06-26 2004-01-08 Kahn M D J D Jonathan Procede pour comparer un fichier texte transcrit avec un fichier cree prealablement
US7260534B2 (en) * 2002-07-16 2007-08-21 International Business Machines Corporation Graphical user interface for determining speech recognition accuracy
US7181392B2 (en) * 2002-07-16 2007-02-20 International Business Machines Corporation Determining speech recognition accuracy
US7206738B2 (en) * 2002-08-14 2007-04-17 International Business Machines Corporation Hybrid baseform generation
DE10304229A1 (de) * 2003-01-28 2004-08-05 Deutsche Telekom Ag Kommunikationssystem, Kommunikationsendeinrichtung und Vorrichtung zum Erkennen fehlerbehafteter Text-Nachrichten
JP4714694B2 (ja) * 2003-11-05 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声−テキストトランスクリプションシステムの誤り検出
WO2005050621A2 (fr) * 2003-11-21 2005-06-02 Philips Intellectual Property & Standards Gmbh Modeles specifiques de themes pour le formatage de textes et la reconnaissance vocale
WO2006035402A1 (fr) * 2004-09-30 2006-04-06 Koninklijke Philips Electronics N.V. Correction automatique de textes
US7412387B2 (en) * 2005-01-18 2008-08-12 International Business Machines Corporation Automatic improvement of spoken language
US20070016421A1 (en) * 2005-07-12 2007-01-18 Nokia Corporation Correcting a pronunciation of a synthetically generated speech object
US7698140B2 (en) * 2006-03-06 2010-04-13 Foneweb, Inc. Message transcription, voice query and query delivery system
US7693717B2 (en) * 2006-04-12 2010-04-06 Custom Speech Usa, Inc. Session file modification with annotation using speech recognition or text to speech

Also Published As

Publication number Publication date
WO2007144519A2 (fr) 2007-12-21
EP2030126A2 (fr) 2009-03-04
FR2902542A1 (fr) 2007-12-21
US8249869B2 (en) 2012-08-21
US20100161312A1 (en) 2010-06-24
FR2902542B1 (fr) 2012-12-21
CA2654961A1 (fr) 2007-12-21
WO2007144519A3 (fr) 2008-03-27

Similar Documents

Publication Publication Date Title
Samuel et al. Perceptual learning for speech
Imai et al. Lexical frequency and neighborhood density effects on the recognition of native and Spanish-accented words by native English and Spanish listeners
El-Imam Phonetization of Arabic: rules and algorithms
Brannen The perception and production of interdental fricatives in second language acquisition
US20160365087A1 (en) High end speech synthesis
Bent et al. The influence of talker and foreign-accent variability on spoken word identification
Goldinger Words and voices: Implicit and explicit memory for spoken words
Tseng ILAS Chinese spoken language resources
Tucker et al. Spontaneous speech
Chong The effect of phonotactics on alternation learning
Kiesling et al. The variation in conversation (ViC) project: Creation of the Buckeye Corpus of Conversational Speech
Wagner Intralingual Speech-to-text conversion in real-time: Challenges and Opportunities
CA2654961C (fr) Correcteur, programme d'ordinateur et procede de correction semantique, syntaxique et lexicale d'une expression erronee dans un texte numerique
Wright et al. Speech perception
Kaye The Ins and Outs of phonology
Melguy et al. Perceptual adaptation to a novel accent: Phonetic category expansion or category shift?
Zwitserlood Sublexical and morphological information in speech processing
Bhatt et al. Reading Assistant: a reciter in your pocket
Spiegel et al. Applying speech synthesis to user interfaces
Mitterer Understanding" gardem bench": studies on the perception of assimilated word forms
Anand et al. Email access by visually impaired
Kim The role of prosodic cues in word segmentation of Korean.
Getty Do Listeners Care About the Speaker or the Input? Evidence from Structural Priming
Vonessen et al. Comparing perception of L1 and L2 English by human listeners and machines: Effect of interlocutor adaptations
Shukla Prosodic constraints on statistical strategies in segmenting fluent speech

Legal Events

Date Code Title Description
EEER Examination request
MKLA Lapsed

Effective date: 20210615