EP1189203B1

EP1189203B1 - Homophonewahl in der Spracherkennung

Info

Publication number: EP1189203B1
Application number: EP01307935A
Authority: EP
Inventors: Stijn Van Even; Olivier Divay; Francoise Renaud
Original assignee: L & H Holdings Usa Inc
Current assignee: L & H Holdings Usa Inc
Priority date: 2000-09-18
Filing date: 2001-09-18
Publication date: 2006-05-17
Anticipated expiration: 2021-09-18
Also published as: DE60119643T2; DE60119643D1; ATE326754T1; EP1189203A3; EP1189203A2

Claims

Verfahren zum Korrigieren eines fehlerhaften Textes in Verbindung mit Erkennungsfehlern in der computerunterstützten Spracherkennung, wobei das Verfahren umfasst:
Durchführen einer Spracherkennung zu einer Äußerung, um ein Erkennungsergebnis für die Äußerung zu erzeugen;

Identifizieren eines Korrekturbefehls in dem Erkennungsergebnis für die Äußerung, wobei der Korrekturbefehl umfasst:
eine Gruppe aus ein oder mehreren Worten eines früheren Erkennungsergebnisses, und

ein Affix, das mit der Gruppe aus ein oder mehreren Worten kombiniert werden kann,

um ein Homophon der ein oder mehreren Worte zu bilden; und

Erzeugen des Homophons aus der Gruppe von ein oder mehreren Worten und des Affix basierend auf den Merkmalen ein oder mehrerer Wörter des früheren Erkennungsergebnisses, die nicht in der Gruppe aus ein oder mehreren Worten enthalten sind.
Verfahren nach Anspruch 1, mit einem Ersetzen der Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses durch das Homophon.
Verfahren nach Anspruch 1, in welchem das Erzeugen des Homophons aus der Gruppe aus ein oder mehreren Wörtern und des Affix ein Kombinieren der Gruppe von ein oder mehreren Worten und des Affix in der Weise umfasst, dass die Merkmale der ein oder mehreren Wörter des früheren Erkennungsergebnisses mit dem Homophon zusammenpassen.
Verfahren nach Anspruch 1, in welchem das Erzeugen des Homophons umfasst:
Präsentieren einer Liste möglicher Homophone; und

Erhalten einer Auswahl eines Homophons aus der Liste.
Verfahren nach Anspruch 1, in welchem der Korrekturbefehl umfasst "ecrire <wort><endung>", wobei <wort> die Gruppe von ein oder mehrere Worten des früheren Erkennungsergebnisses repräsentiert und <endung> das Affix repräsentiert.
Verfahren nach Anspruch 5, in weichem die Gruppe aus ein oder mehreren Worten nur ein Wort umfasst und das Affix eine Endung ist.
Verfahren nach Anspruch 1, in welchem das Homophon genauso wie die Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses betont wird.
Verfahren nach Anspruch 1, in welchem ein oder mehrere Phoneme des Homophons in der Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses enthalten sind.
Verfahren nach Anspruch 1, in welchem das Homophon eine Gruppe aus ein oder mehreren Worten umfasst.
Verfahren nach Anspruch 1, in welchem das Affix eine Endung ist.
Computerunterstütztes Spracherkennungssystem mit:
einem Prozessor;

einer Eingabeeinrichtung, die eine Äußerung erhält;

einer Speichereinrichtung zum Speichern von Softwarebefehlen, die von dem Prozessor durchgeführt werden;

Mitteln zum Durchführen einer Spracherkennung zu der Äußerung, um ein Erkennungsergebnis für die Äußerung zu erzeugen;

Mitteln zum identifizieren eines Korrekturbefehls in dem Erkennungsergebnis für die Äußerung, wobei der Korrekturbefehl umfasst:
eine Gruppe aus ein oder mehreren Worten eines früheren Erkennungsergebnisses, und

ein Affix, das mit der Gruppe aus ein oder mehreren Worten kombiniert werden kann, um ein Homophon der ein oder mehreren Worte zu bilden; und

Mittel zum Erzeugen des Homophons aus der Gruppe aus ein oder mehreren Worten und des Affix basierend auf Merkmalen von ein oder mehreren Worten des früheren

Erkennungsergebnisses, die nicht in der Gruppe aus ein oder mehreren Worten enthalten sind.
System nach Anspruch 11, in welchem die Speichereinrichtung von dem Prozessor ausgeführte Softwarebefehle zum Ersetzen der Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses durch das Homophon speichert.
System nach Anspruch 11, in welchem das Mittel zum Erzeugen des Homophons aus der Gruppe aus ein oder mehreren Worten und des Affix Mittel zum Kombinieren der Gruppe aus ein oder mehreren Worten und des Affix umfasst, derart, dass die Merkmale der ein oder mehreren Worte des früheren Erkennungsergebnisses mit dem Homophon zusammenpassen.
System nach Anspruch 11, in welchem die Mittel zum Erzeugen des Homophons Mittel umfassen:
zum Präsentieren einer Liste möglicher Homophone; und

zum Erhalten einer Auswahl eines Homophons aus der Liste.
System nach Anspruch 11, in welchem der Korrekturbefehl umfasst "ecrire <wort><endung>", wobei <wort> die Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses repräsentier und <endung> das Affix repräsentiert.
System nach Anspruch 15, in welchem die Gruppe aus ein mehreren Worten nur ein Wort enthält und das Affix eine Endung ist.
System nach Anspruch 11, in welchem das Homophon genauso wie die Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses betont wird.
System nach Anspruch 11, in welchem ein oder mehrere Phoneme des Homophons in der Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses enthalten sind.
System nach Anspruch 11, in welchem das Homophon eine Gruppe aus ein oder mehreren Worten enthält.
System nach Anspruch 11, in welchem das Affix eine Endung ist.
Computersoftware, merklich ausgeführt in einem computerlesbaren Medium oder in einem mitlaufenden Trägersignal, zum Korrigieren eines fehlerhaften Textes in Verbindung mit Erkennungsfehlern, wobei die Software die folgenden Codesegmente umfasst, um ihre entsprechenden Operationen durchzuführen, wenn sie auf einem Computersystem läuft:
ein erstes Codesegment, um eine Spracherkennung zu der Äußerung durchzuführen, um ein Erkennungsergebnis für die Äußerung zu erzeugen;

ein zweites Codesegment, um einen Korrekturbefehl in dem Erkennungsergebnis für die Äußerung zu identifizieren, wobei der Korrekturbefehl umfasst:
eine Gruppe aus ein oder mehreren Worten eines früheren Erkennungsergebnisses, und

ein Affix, das mit der Gruppe aus ein oder mehreren Worten kombiniert werden kann,

um ein Homophon der ein oder mehreren Worte zu bilden; und

ein drittes Codesegment, um das Homophon aus der Gruppe aus ein oder mehreren Worten und des Affix basierend auf Merkmalen der ein oder mehreren Worte des früheren Erkennungsergebnisses zu erzeugen, die nicht in der Gruppe aus ein oder mehreren Worten enthalten sind.
Software nach Anspruch 21, ferner mit einem vierten Codesegment, um die Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses durch das Homophon zu ersetzen.
Software nach Anspruch 21, in welcher das dritte Codesegment ein Codesegment umfasst, um die Gruppe aus ein oder mehreren Worten und das Affix derart zu kombinieren, dass die Merkmale der ein oder mehreren Worte des früheren Erkennungsergebnisses mit dem Homophon zusammenpassen.
Software nach Anspruch 21, in welcher das dritte Codesegment umfasst:
ein Codesegment, um eine Liste möglicher Homophone zu präsentieren; und

ein Codesegment, um eine Auswahl eines Homophons aus der Liste zu erhalten.
Software nach Anspruch 21, in welcher der Korrekturbefehl umfasst: "ecrire <wort><endung>", wobei <wort> die Gruppe aus oder mehreren Worten des früheren Erkennungsergebnisses repräsentiert und <endung> das Affix repräsentiert.
Software nach Anspruch 25, in welcher die Gruppe aus ein oder mehreren Worten nur ein Wort umfasst und das Affix eine Endung ist.
Software nach Anspruch 21, in welcher das Homophon genauso wie die Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses betont wird.
Software nach Anspruch 21, in welcher ein oder mehrere Phoneme des Homophons in der Gruppe aus ein oder mehreren Worten des früheren Erkennungsergebnisses enthalten sind.
Software nach Anspruch 21, in welcher das Homophon eine Gruppe aus ein oder mehreren Worten enthält.
Software nach Anspruch 21, in welcher das Affix eine Endung ist.