DE60004862T2 - Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem - Google Patents

Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem Download PDF

Info

Publication number
DE60004862T2
DE60004862T2 DE60004862T DE60004862T DE60004862T2 DE 60004862 T2 DE60004862 T2 DE 60004862T2 DE 60004862 T DE60004862 T DE 60004862T DE 60004862 T DE60004862 T DE 60004862T DE 60004862 T2 DE60004862 T2 DE 60004862T2
Authority
DE
Germany
Prior art keywords
phoneme
chain
score
pronunciation
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60004862T
Other languages
English (en)
Other versions
DE60004862D1 (de
Inventor
Etienne Barnard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SpeechWorks International Inc
Original Assignee
SpeechWorks International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SpeechWorks International Inc filed Critical SpeechWorks International Inc
Publication of DE60004862D1 publication Critical patent/DE60004862D1/de
Application granted granted Critical
Publication of DE60004862T2 publication Critical patent/DE60004862T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Description

  • GEBIET DER ERFINDUNG
  • Die Erfindung bezieht sich allgemein auf Spracherkennungssysteme, und bezieht sich genauer auf einen Lösungsansatz zur Bewertung der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem.
  • HINTERGRUND DER ERFINDUNG
  • Die meisten Spracherkennungssysteme verwenden ein Aussprachewörterbuch, um bestimmte Wörter, die in empfangenen Äußerungen enthalten sind, zu identifizieren. Der Ausdruck "Äußerung" wird hier verwendet, um ein oder mehrere Laute zu bezeichnen, die entweder von Menschen oder von Maschinen erzeugt werden. Beispiele einer Äußerung umfassen, sind jedoch nicht hierauf beschränkt, ein einzelner Laut, irgendwelche zwei oder mehr Laute, ein einzelnes Wort oder zwei oder mehr Wörter. Im allgemeinen enthält ein Aussprachewörterbuch Daten, die erwartete Aussprachen von Äußerungen definieren. Wenn eine Äußerung empfangen wird, wird die empfangene Äußerung, oder wenigstens ein Abschnitt der empfangenen Äußerung mit den erwarteten Aussprachen verglichen, die im Aussprachewörterbuch enthalten sind. Eine Äußerung wird erkannt, wenn die empfangene Äußerung, oder der Abschnitt derselben, mit der erwarteten Aussprache übereinstimmt, die im Aussprachewörterbuch enthalten ist.
  • Einer der wichtigsten Punkte bei Aussprachewörterbüchern ist, sicherzustellen, daß die erwarteten Aussprachen von Äußerungen, die durch das Aussprachewörterbuch definiert sind, wirkliche Aussprachen der Äußerungen genau widerspiegeln. Wenn eine wirkliche Aussprache einer bestimmten Äußerung nicht mit der erwarteten Aussprache übereinstimmt, kann die erwartete Aussprache der bestimmten Äußerung bei der Identifizierung der wirklichen Aussprache der bestimmten Äußerung nicht mehr nützlich sein.
  • Wirkliche Aussprachen von Äußerungen können aus einer Vielfalt von Gründen falsch dargestellt werden. Zum Beispiel können in flüssiger Sprache einige Geräusche systematisch unterdrückt oder angepaßt werden. Eine Anwendung kann über diverse geographische Gebiete installiert sein, in denen Benutzer verschiedene regionale Akzente haben. Die erwarteten Aussprachen sind tendenziell etwas benutzerabhängig. Eine Änderung der Benutzer einer bestimmten Anwendung kann daher die Genauigkeit des Spracherkennungssystems beeinträchtigen. Dies gilt für verschiedene Spracheigenschaften von Benutzern, wie z. B. verschiedene Intonationen und Betonungen in der Aussprache.
  • Herkömmlicherweise werden Aussprachewörterbücher manuell aktualisiert, um Änderungen der wirklichen Aussprachen von Äußerungen in Reaktion auf gemeldete Probleme widerzuspiegeln. Wenn eine Änderung in einer Anwendung oder ein Benutzer verhindern, daß ein Spracherkennungssystem Äußerungen erkennt, wird das System dem Administrator des Spracherkennungssystems gemeldet. Der Administrator identifiziert die problematischen Äußerungen und aktualisiert manuell das Aussprachewörterbuch, um die Änderungen für die Anwendung oder die Benutzer wiederzugeben.
  • Das manuelle Aktualisieren eines Aussprachewörterbuches, um Änderungen an einer Anwendung oder an Benutzern widerzuspiegeln, hat mehrere signifikante Nachteile. Erstens beruht sie auf Problemen, die dem Administrator des Spracherkennungssystems gemeldet werden. Probleme können für lange Zeitperioden existieren, bevor sie gemeldet werden. In bestimmten Situationen kann dies das Ansehen des Unternehmens, daß das Spracherkennungssystem verwendet, beeinträchtigen.
  • Selbst nachdem die Probleme identifiziert worden sind, kann ferner eine signifikante Menge an Personalaufwand erforderlich sein, um das Aussprachewörterbuch zu aktualisieren, was das Problem erweitert. Die Aktualisie rung des Aussprachewörterbuches verwendet z. B. typischerweise das Sammeln einer großen Menge von wirklichen Aussprachedaten für die Problemäußerungen. Die wirklichen Aussprachedaten werden anschließend verarbeitet und verwendet, um die erwarteten Aussprachedaten zu aktualisieren, die im Aussprachewörterbuch enthalten sind. Indessen ist das Spracherkennungssystem unfähig, die Problemäußerungen zu erkennen, bis das System aktualisiert ist, was für Kunden und andere Benutzer des Systems sehr frustrierend sein kann. Das Dokument "A New Approach to Speaker Adaption by Modelling Pronunciation in Automatic Speech Recognition" von Schiel, Speech Communication 13 (1993), S. 281–286, offenbart, verschiedene Aussprachen eines Wortes in einem Lexikon zu modellieren.
  • Auf der Grundlage des Vorangehenden besteht daher ein Bedarf an einem automatisierten Lösungsansatz zur Ermittlung der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem.
  • Es besteht ein besonderer Bedarf an einem automatisierten Lösungsansatz zur Ermittlung der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem, das bestimmte erwartete Aussprachedarstellungen identifiziert, die nicht die spezifizierten Genauigkeitskriterien erfüllen und daher aktualisiert werden müssen.
  • Es besteht ferner ein besonderer Bedarf an einem automatisierten Lösungsansatz zum Ermitteln der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem, daß eine reduzierte Menge an Personalaufwand im Identifizierungsprozeß erfordert.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung werden ein Verfahren, ein computerlesbares Medium und ein Spracherkennungs-Diagnosewerkzeug geschaffen, die jeweils in den Ansprüchen 1, 5 bzw. 9 ausgeführt sind.
  • Die vorangehenden Erfordernisse und andere Erfordernisse und Aufgaben, die in der folgenden Beschreibung deutlich werden, werden von der vorliegenden Erfindung gelöst, die in einem Aspekt ein Verfahren zum Ermitteln der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem umfaßt. Gemäß dem Verfahren wird eine erwartete Aussprachedarstellung für eine bestimmte Äußerung aus dem Aussprachewörterbuch abgerufen. Anschließend wird eine Genauigkeitspunktzahl für die erwartete Aussprachedarstellung erzeugt, indem die erwartete Aussprachedarstellung mit einem Satz von einen oder mehreren wirklichen Aussprachen der bestimmten Äußerung verglichen wird.
  • Gemäß einem weiteren Aspekt wird ein Verfahren zum automatischen Aktualisieren eines Aussprachewörterbuches in einem Spracherkennungssystem geschaffen, um eine oder mehrere Änderungen einer wirklichen Aussprache eines bestimmten Wortes widerzuspiegeln, daß im Aussprachewörterbuch dargestellt ist. Gemäß dem Verfahren wird eine erwartete Aussprachedarstellung für das bestimmte Wort aus dem Aussprachewörterbuch abgerufen. Es wird eine Genauigkeitspunktzahl für die erwartete Aussprachedarstellung erzeugt, indem die erwartete Aussprachedarstellung mit einer oder mehreren wirklichen Aussprachen des bestimmten Wortes verglichen wird. Es wird ermittelt, ob die Genauigkeitspunktzahl für die erwartete Aussprachedarstellung die spezifizierten Genauigkeitskriterien erfüllt. Wenn die Genauigkeitspunktzahl für die erwartete Aussprachedarstellung die spezifizierten Genauigkeitskriterien nicht erfüllt, wird die erwartete Aussprachedarstellung aktualisiert, um die eine oder die mehreren wirklichen Aussprachen widerzuspiegeln.
  • Gemäß einem weiteren Aspekt wird eine Spracherkennungsvorrichtung geschaffen. Die Spracherkennungsvorrichtung umfaßt ein Speichermedium mit einem darauf gespeicherten Aussprachewörterbuch, und einem Diagnosemechanismus, der kommunikativ mit dem Speichermedium verbunden ist. Der Diagnosemechanismus ist so konfiguriert, daß er eine erwartete Aussprachedarstellung für eine bestimmte Äußerung aus dem Aussprachewörterbuch abruft. Der Diagnosemechanismus ist ferner dafür konfiguriert, eine Genauigkeitspunktzahl für die erwartete Aussprachedarstellung zu erzeugen, indem er die erwartete Aussprachedarstellung mit einem Satz einer oder mehrerer wirklicher Aussprachen der bestimmten Äußerung vergleicht.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Im folgenden werden Ausführungsformen lediglich beispielhaft, und nicht einschränkend, in den Figuren der beigefügten Zeichnungen erläutert, in welchen ähnliche Bezugszeichen ähnliche Elemente bezeichnen, und in welchen:
  • 1 ein Blockschaltbild eines Systems zum automatischen Ermitteln der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem gemäß einer Ausführungsform ist;
  • 2A ein Blockschaltbild ist, das einen Abschnitt der Inhalte eines Aussprachewörterbuches gemäß einer Ausführungsform zeigt;
  • 2B ein Blockschaltbild ist, das die Inhalte einer Phonemkettenkonfiguration gemäß einer Ausführungsform zeigt;
  • 3A ein Blockschaltbild ist, das den Vergleich einer Phonemkettendarstellung einer erwarteten Aussprache eines Wortes mit einer ersten wirklichen Aussprache eines Wortes gemäß einer Ausführungsform zeigt;
  • 3B ein Blockschaltbild ist, das den Vergleich einer Phonemkettendarstellung einer erwarteten Aussprache eines Wortes mit einer zweiten wirklichen Aussprache eines Wortes gemäß einer Ausführungsform zeigt;
  • 3C ein Blockschaltbild ist, das den Vergleich einer Phonemkettendarstellung einer erwarteten Aussprache eines Wortes mit einer dritten wirklichen Aussprache eines Wortes gemäß einer Ausführungsform zeigt;
  • 4 eine Tabelle ist, die die Ermittlung einer Genauigkeitspunktzahl für Phonemketten gemäß einer Ausführungsform zeigt;
  • 5 ein Flußdiagramm eines Prozesses zum automatischen Ermitteln der Genauigkeit eines Aussprachewörterbuches gemäß einer Ausführungsform ist; und
  • 6 ein Blockschaltbild eines Computersystems ist, auf dem die Ausführungsformen implementiert werden können.
  • GENAUE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
  • In der folgenden Beschreibung sind zum Zweck der Erläuterung spezifische Einzelheiten ausgeführt, um für ein vollständiges Verständnis der Erfindung zu sorgen. Es ist jedoch klar, daß die Erfindung ohne diese spezifischen Einzelheiten ausgeführt werden kann. Unter bestimmten Umständen sind bekannte Strukturen und Vorrichtungen in Blockdiagrammform gezeigt, um eine unnötige Verschleierung der Erfindung zu vermeiden.
  • Verschiedene Aspekte und Merkmale der beispielhaften Ausführungsformen sind in den folgenden Abschnitten genauer beschrieben: (1) Einführung; (2) Systemüberblick; (3) Aussprachedarstellung; (4) Ermittlung der Genauigkeit eines Aussprachewörterbuches; und (5) Implementierungsmechanismen.
  • 1. EINFÜHRUNG
  • Es wird ein Lösungsansatz für die automatische Ermittlung der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem beschrieben. Im allgemeinen wird eine erwartete Aussprachedarstellung für eine bestimmte Äußerung aus einem Aussprachewörterbuch mit wirklichen Aussprachen der bestimmten Äußerung verglichen. Es wird eine Genauigkeitspunktzahl für die bestimmte Äußerung aus dem Vergleich der erwarteten und wirklichen Aussprachen der bestimmten Äußerung ermittelt. Die Genauigkeitspunktzahl wird in bezug auf spezifizierte Genauigkeitskriterien bewertet, um zu ermitteln, ob die erwartete Aussprache für die bestimmte Äußerung die spezifizierten Genauigkeitskriterien erfüllt. Wenn die erwartete Aussprache die spezifizierten Genauigkeitskriterien für die bestimmte Äußerung nicht erfüllt, wird die erwartete Aussprache für die bestimmte Äußerung im Aussprachewörterbuch als eine Aktualisierung erfordernd identifiziert. Anschließend können manuelle oder automatische Aktualisierungsmechanismen verwendet werden, um die identifizierten erwarteten Aussprachedarstellungen die wirklichen Aussprachen widerspiegeln zu lassen.
  • 2. SYSTEMÜBERLICK
  • 1 zeigt ein System 100, das hier verwendet wird, um verschiedene Aspekte und Merkmale der Erfindung zu beschreiben. Das System 100 enthält eine Anwendung 102, die mit einem Spracherkennungssystem (SRS) 104 interagiert. Die Anwendung 102 ist ein Element, daß die Spracherkennungsdienste des SRS 104 nutzt. Beispiele der Anwendung 102 umfassen, sind jedoch nicht hierauf beschränkt, ein sprachaktiviertes System oder einen Dienst auf Telephonbasis, die in Form eines oder mehrerer Computerprogramme oder Prozesse implementiert sind. Die Anwendung 102 ist kommunikativ über eine Verbindung 106 mit dem SRS 104 verbunden.
  • Das SRS 104 enthält eine Erkennungsvorrichtung 108, einen nichtflüchtigen Speicher 110, der ein Aussprachewörterbuch 112 enthält, und ein Aussprachediagnosewerkzeug 114. Die Erkennungsvorrichtung 108 ist kommunikativ mit einem nichtflüchtigen Speicher 110 über eine Verbindung 116 verbunden. Das Diagnosewerkzeug 114 ist operativ über eine Verbindung 118 mit dem nichtflüchtigen Speicher 110 verbunden. Die Verbindungen 116, 118 können unter Verwendung beliebiger Mechanismen implementiert werden, um für einen Datenaustausch zwischen ihren jeweiligen verbundenen Entitäten zu sorgen. Beispiele für Verbindungen 116, 118 umfassen, sind jedoch nicht hierauf beschränkt, Netzverbindungen, Kabel, Glasfaserverbindungen und Funkverbindungen. Der nichtflüchtige Speicher 110 kann z. B. ein oder mehrere Plattenlaufwerke umfassen.
  • Die Erkennungsvorrichtung 108 ist ein Mechanismus, der dafür konfiguriert ist, empfangene Äußerung unter Verwendung eines Aussprachewörterbuches 112 zu erkennen. Die Erkennungsvorrichtung 108 kann ferner eine Interaktion mit anderen Komponenten im SRS 104 erfordern, die hier nicht gezeigt oder beschrieben sind, um eine Verschleierung der verschiedenen Merkmale und Aspekte der Erfindung zu vermeiden.
  • Das Aussprachewörterbuch 112 enthält Daten, die erwartete Aussprachen für Äußerungen definieren, die von SRS 104 erkannt werden können. Das Aussprachewörterbuch 112 wird in diesem Dokument genauer beschrieben.
  • Gemäß einer Ausführungsform ist das Aussprachediagnosewerkzeug 114 dafür konfiguriert, automatisch die Genauigkeit des Aussprachewörterbuches 112 zu ermitteln und bestimmte erwartete Aussprachen zu identifizieren, die nicht spezifizierte Genauigkeitskriterien erfüllen. Die erwarteten Aussprachen, die die spezifizierten Genauigkeitskriterien nicht erfüllen, können anschließend aktualisiert werden, um die wirklichen Aussprachen der empfangenen Äußerungen genauer widerzuspiegeln.
  • Das SRS 104 kann andere Komponenten enthalten, die hier nicht gezeigt und beschrieben sind, um die Verschleierung der verschiedenen Aspekte und Merkmale der Erfindung zu vermeiden. Zum Beispiel kann das SRS 104 verschiedene Softwareentwicklungswerkzeuge und Anwendungstestwerkzeuge enthalten, die zur Verfügung stehen, um den Entwicklungsprozeß zu unterstützen. Ein solches Werkzeug ist ein im Handel erhältliches Paket von wiederverwendbaren Sprachsoftwaremodulen, bekannt als DialogModules® und zur Verfügung gestellt von Speechworks International Inc., Boston, Massachusetts.
  • 3. AUSSPRACHEDARSTELLUNG
  • 2A ist ein Blockschaltbild 200, das eine Beispielimplementierung des Aussprachewörterbuches 112 zeigt. Andere Implementierungen des Aussprachewörterbuches 112 können verwendet werden, wobei die Erfindung nicht auf irgendeine bestimmte Implementierung des Aussprachewörterbuches 112 beschränkt ist.
  • Zum Zweck der Erläuterung werden hier im Zusammenhang mit den bekannten Wörtern verschiedene Ausführungsformen beschrieben. Die Ausführungsformen der Erfindung sind jedoch auf einen beliebigen Typ von Äußerung anwendbar. Im vorliegenden Beispiel enthält das Aussprachewörterbuch 112 ein oder mehrere Einträge 202, von denen jeder einer bestimmten erwarteten Aussprache für ein bestimmtes Wort entspricht. Jeder Eintrag 202 enthält einen Wortidentifiziererwert und erwartete Aussprachedarstellungsdaten.
  • Ein Wortidentifiziererwert entspricht irgendwelchen Daten, die ein bestimmtes Wort spezifizieren, mit dem ein Eintrag 202 in Verbindung gebracht wird. Zum Beispiel kann ein Wortidentifizierer das wirkliche Wort sein, das mit einem bestimmten Eintrag 202 in Verbindung gebracht wird, wie z. B. "Karussell" "Apfel" oder "Zoo". Als ein weiteres Beispiel kann ein Wortidentifiziererwert andere Daten umfassen, als das Wort selbst, wie z. B. Wort1 oder Wort2, die ermöglichen, einen Eintrag 202 auf ein bestimmtes Wort abzubilden. Die Erfindung ist nicht auf irgendeine bestimmte Implementierung von Wortidentifiziererwerten beschränkt.
  • Erwartete Aussprachedarstellungsdaten sind beliebige Daten, die eine erwartete Aussprache des Wortes spezifizieren, das dem Eintrag zugeordnet ist, der die erwarteten Aussprachedarstellungsdaten enthält. Gemäß einer Ausführungsform spezifizieren die Aussprachedarstellungsdaten ein oder mehrere Phoneme, im folgenden als auch als "Phonemkette" bezeichnet. Der Ausdruck "Phonem", wie er hier verwendet wird, bezieht sich auf den kleinsten unterscheidbaren Laut in einem Dialekt einer Sprache.
  • Zum Beispiel ist dem Eintrag 204 ein Wortidentifiziererwert Wort 1 zugeordnet und enthält erwartete Aussprachedarstellungsdaten Daten 1, die eine erwartete Aussprache für Wort 1 definieren. 2B ist ein Blockschaltbild, das eine Beispielphonemkette 208 für Daten 1 gemäß einer Ausführungsform zeigt. Die Phonemkette 208 enthält eine Anzahl N von Phonemen, die mit P1, P2, P3 bis PN bezeichnet sind. Die Phonemkette 208 definiert eine erwartete Aussprache für Wort 1. Die Phonemkette 208 kann eine beliebige Anzahl von Phonemen enthalten, wobei die Erfindung nicht auf Phonemketten irgendeiner bestimmten Länge beschränkt ist.
  • Wie in 2 gezeigt ist, weisen bestimmte Wörter im Aussprachewörterbuch 212, wie z. B. Wort1 und Wort4, nur einen einzigen Eintrag 202 auf, und somit nur eine einzige erwartete Aussprache. Andere Wörter weisen mehrere erwartete Aussprachen auf. Zum Beispiel weist das Wort2 drei Einträge 202 und somit drei erwartete Aussprachen auf. Wort3 weist zwei erwartete Aussprachen auf, während Wort5 vier erwartete Aussprachen aufweist. Somit kann das Aussprachewörterbuch 112 eine beliebige Anzahl von Aussprachen für eine beliebige Anzahl von Wörtern spezifizieren, wobei die Erfindung nicht auf Aussprachewörterbücher mit irgendeiner Anzahl von Wörtern oder irgendeiner Anzahl von erwarteten Aussprachen für ein bestimmtes Wort beschränkt ist.
  • 4. ERMITTLUNG DER GENAUIGKEIT EINES AUSSPRACHEWÖRTERBUCHES
  • Gemäß einer Ausführungsform wird die Genauigkeit des Aussprachewörterbuches 112 automatisch ermittelt, indem ein erster Satz von Phonemketten, der im Aussprachewörterbuch 112 enthalten ist, und die erwartete Aussprachen von Wörtern repräsentieren, mit wirklichen Aussprachen der Wörter verglichen werden. Phonemketten, die im Aussprachewörterbuch enthalten sind, werden hinsichtlich der Genauigkeit auf der Grundlage des Vergleichs mit den wirklichen Aussprachen bewertet. Die Genauigkeitspunktzahlen werden in bezug auf spezifische Genauigkeitskriterien bewertet, um diejenigen im Aussprachewörterbuch enthaltenen Phonemketten zu identifizieren, die aktualisiert werden müssen, um die wirklichen Aussprachen genauer widerzuspiegeln.
  • A. VERGLEICHEN DER ERWARTETEN UND WIRKLICHEN AUSSPRACHEN UNTER VERWENDUNG VON PHONEMKETTEN
  • Die 3A, 3B und 3C sind jeweils Blockschaltbilder 300, 310, 320, die einen Lösungsansatz zum automatischen Ermitteln der Genauigkeit einer erwarteten Aussprachedarstellung aus einem Aussprachewörterbuch gemäß einer Ausführungsform zeigen. Die Phonemkette 302 repräsentiert eine erwartete Aussprache eines bestimmten Wortes und enthält Phoneme P1, P2, P3, P4 bis PN.
  • Gemäß einer Ausführungsform wird die Phonemkette 302 mit einer ersten wirklichen Aussprache des bestimmten Wortes auf phonem-weiser Grundlage verglichen, um zu ermitteln, wie gut die erwartete Aussprache des bestimmten Wortes mit Schätzungen der ersten wirklichen Aussprache des bestimmten Wortes übereinstimmt. Die erste wirkliche Aussprache des bestimmten Wortes wird auf die Phonemkette 102 projiziert, wobei ein Satz von Punktwerten S1, S2, S3, S4 ... SN, die durch das Bezugszeichen 304 repräsentiert werden, ermittelt wird. Jeder Punktwert zeigt eine Korrelation zwischen einem bestimmten Phonem und der ersten wirklichen Aussprache an. Zum Beispiel zeigt in 3A der Punktwert S1 die Korrelation zwischen dem Phonem P1 und der ersten wirklichen Aussprache an. Ein hoher Punktwert zeigt typischerweise eine höhere Korrelation an als ein relativ niedrigerer Punktwert. Zum Beispiel kann ein Punktwert von (0,90) eine relativ höhere Korrelation zwischen einem bestimmten Phonem und einer wirklichen Aussprache anzeigen, als ein Punktwert von (0,30). Im Beispiel der 3A stimmt die erste wirkliche Aussprache des bestimmten Wortes sehr genau mit der erwarteten Aussprache des bestimmten Wortes, dargestellt durch die Phonemkette 302, überein. Die genaue Übereinstimmung wird in einem relativ hohen Satz von Punktwerten S1, S2, S3, S4 ... SN widergespiegelt. Es ist somit wahrscheinlich, daß die Phonemkette 302 für die Erkennungsvorrichtung 108 (1) bei der Erkennung der ersten wirklichen Aussprache des bestimmten Wortes brauchbar ist.
  • Im Blockschaltbild 310 der 3B wird die erwartete Aussprache gegenüber einer zweiten wirklichen Aussprache des bestimmten Wortes bewertet. In diesem Beispiel weist die erwartete Aussprache eine hohe Korrelation zu einer zweiten wirklichen Aussprache auf, mit Ausnahme des Phonems P3, wie durch den Punktwert S3 gezeigt ist. Somit ist der Punktwert S3 ein relativ niedrigerer Punktwert als z. B. der Punktwert S1. Der relativ niedrigere Punktwert für den Punktwert S3 im Vergleich zum Punktwert S2 zeigt, daß das Phonem P3 nicht so streng dargestellt wurde, wie das Phonem P1 in der zweiten wirklichen Aussprache des bestimmten Wortes. Da die erwartete Aussprache bezüglich der meisten der Phoneme gut bewertet wird, ist es trotzdem wahrscheinlich, daß die Phonemkette 302 für die Erkennungsvorrichtung 108 (1) bei der Erkennung der zweiten wirklichen Aussprache des bestimmten Wortes brauchbar ist.
  • Im Blockschaltbild 302 der 3C wird die erwartete Aussprache in bezug auf eine dritte wirkliche Aussprache des bestimmten Wortes bewertet. In diesem Beispiel wird angenommen, daß die erwartete Aussprache, dargestellt durch die Phonemkette 302 bezüglich der dritten wirklichen Aussprache des bestimmten Wortes nicht gut bewertete wird. Das heißt, es existiert eine relativ geringe Korrelation zwischen den in der Phonemkette 302 enthaltenen Phonemen und der dritten wirklichen Aussprache des bestimmten Wortes. Die Folge der signifikanten Unterschiede zwischen der erwarteten Aussprache und der dritten wirklichen Aussprache ist, daß die Phonemkette 302 wahrscheinlich für die Erkennungsvorrichtung 108 (1) bei der Erkennung der dritten wirklichen Aussprache des bestimmten Wortes unbrauchbar ist.
  • B. BEWERTUNG DER PHONEMKETTEN
  • Sobald die Phonemketten von einem Aussprachewörterbuch mit den wirklichen Aussprachen der Wörter verglichen worden sind, werden die Phonemketten in bezug auf die Genauigkeit bewertet. Gemäß einer Ausführungsform beruht die Genauigkeit einer bestimmten Phonemkette bezüglich einer bestimmten wirklichen Aussprache auf der Grundlage der Punktwerte für jedes Phonem, die in der erwarteten Phonemkette enthalten sind. Zum Beispiel kann in 3A eine erwartete Phonemkette 302 einen Punktwert von (1,00) annehmen, um anzuzeigen, daß die erste wirkliche Aussprache sehr genau mit der erwarteten Aussprache übereinstimmt. In 3B stimmt die zweite wirkliche Aussprache nicht gut mit der erwarteten Aussprache überein. Dementsprechend würde die erwartete Phonemkette 302 einen relativ niedrigeren Punktwert bezüglich der zweiten wirklichen Aussprache annehmen, wie z. B. (0,80) oder (0,90). In 3C stimmt die dritte wirkliche Aussprache sehr schlecht mit der erwarteten Aussprache überein.
  • Dementsprechend würde eine erwartete Aussprachekette 302 einen relativ niedrigen Punktwert bezüglich der dritten wirklichen Aussprache annehmen, wie z. B. (0,10) oder (0,20).
  • Sobald eine bestimmte Phonemkette in bezug auf eine oder mehrere wirkliche Aussprachen bewertet worden ist, werden die Punktzahlen in bezug auf spezifizierte Genauigkeitskriterien bewertet, um zu ermitteln, ob die bestimmte Phonemkette aktualisiert werden muß, um die wirklichen Aussprachen des zugehörigen Wortes genauer widerzuspiegeln. Gemäß einer Ausführungsform enthalten die spezifizierten Genauigkeitskriterien eine minimale Durchschnittspunktwertschwelle, die einer minimalen durchschnittlichen Korrelation zwischen Phonemen und einer oder mehreren wirklichen Ansprachen entspricht. Wenn die durchschnittliche Punktzahl für ein be stimmtes Phonem in bezug auf ein oder mehrere wirkliche Aussprachen kleiner ist als die minimale durchschnittliche Punktzahlschwelle, erfüllt die Phonemkette, die dem bestimmten Phonem zugeordnet ist, nicht die spezifizierten Genauigkeitskriterien und muß aktualisiert werden, um die wirklichen Aussprachen des entsprechenden Wortes genauer widerzuspiegeln.
  • Gemäß einer weiteren Ausführungsform enthalten die spezifizierten Genauigkeitskriterien eine minimale Punktzahlschwelle, die die minimale annehmbare Punktzahl (Korrelation) für ein bestimmtes Phonem in bezug auf irgendeine wirkliche Aussprache spezifiziert. Wenn die Punktzahl für das bestimmte Phonem in bezug auf irgendeine wirkliche Aussprache kleiner ist als die minimale Punktzahlschwelle, erfüllt die Phonemkette, die dem bestimmten Phonem zugeordnet ist, nicht die spezifizierten Genauigkeitskriterien und muß aktualisiert werden, um die wirklichen Aussprachen des entsprechenden Wortes genauer widerzuspiegeln. Die minimale Punktzahlschwelle kann ebenfalls erfordern, daß eine spezifizierte Anzahl oder ein Bruchteil von Punktzahlen die minimale Punktzahlschwelle erfüllt oder überschreitet, um die Genauigkeitskriterien zu erfüllen.
  • Die Bewertung der Phonemketten wird im folgenden mit Bezug auf Tabelle 400 der 4 genauer beschrieben. Im allgemeinen enthält die Tabelle 400 die Ergebnisse der Bewertung einer bestimmten Phonemkette für ein bestimmtes Wort, daß die Phoneme P1, P2, P3, P4 und P5 umfaßt, in bezug auf drei wirkliche Aussprachen des bestimmten Wortes. Tabelle 400 enthält fünf Einträge 402, 404, 406, 408, 410 die dem Testen der fünf Phoneme P1, P2, P3, P4 bzw. PF in bezug auf drei wirkliche Aussprachen entsprechen.
  • Jedes Phonem wird in bezug auf drei wirkliche Aussprachen bewertet, wobei der vorher beschriebene Lösungsansatz verwendet wird, und wobei die Ergebnisse in den Spalten 412 angegeben sind. Die mittlere Punktzahl für jedes Phonem in bezug auf alle drei wirklichen Aussprachen ist in Spalte 414 angegeben und wird aus den Punktzahlen in den Spalten 412 berechnet. Eine beispielhafte minimale mittlere Punktzahlschwelle von (0,50) und eine beispielhafte minimale Punktzahlschwelle von (0,30) sind in den Spalten 416 bzw. 418 für jedes Phonem gezeigt. Die Anzahl der Punktzahlen für jedes Phonem, das unter die minimale Punktzahlschwelle fällt, ist in Spalte 420 angegeben.
  • Wie durch die Einträge 402, 406 gezeigt ist, erfüllen gemäß den ersten und dritten Phonemen jeweils die mittleren Punktzahlen für die ersten und dritte Phoneme von (0,79) und (0,93) die minimale mittlere Punktzahlschwelle von (0,50). Ferner liegt keine der Punktzahlen der ersten oder dritten Phoneme unterhalb der minimalen Punktzahlschwelle von (0,30). Dementsprechend erfüllen sowohl das erste als auch das dritte Phonem die spezifizierten Genauigkeitskriterien.
  • Wie mit dem Eintrag 404 gezeigt ist, fällt gemäß dem zweiten Phonem P2 die mittlere Punktzahl von (0,47) für das zweite Phonem P2 unter die minimale mittlere Punktzahlschwelle von (0,50). Daher erfüllt das zweite Phonem nicht die spezifizierten Genauigkeitskriterien.
  • Wie mit den Einträgen 408, 410 gezeigt ist, erfüllen entsprechend den vierten und fünften Phonemen jeweils die mittlere Punktzahlen sowohl für das vierte als auch das fünfte Phonem von (0,68) und (0,51) jeweils die minimale mittlere Punktzahlschwelle von (0,50). Jedoch weisen die vierten und fünften Phoneme jeweils ein und zwei Punktzahlen auf, die unter die minimale Punktzahlschwelle fallen. Dementsprechend bewirken die vierten und fünften Phoneme, daß die bestimmte Phonemkette nicht die spezifizierten Genauigkeitskriterien erfüllt. Dieses Beispiel zeigt verschiedene Techniken, die verwendet werden können, um die Punktzahlen für Phoneme in einer Phonemkette zu bewerten. Es ist klar, daß die Punktzahl für ein einzelnes Phonem bewirken kann, daß die zugehörige Phonemkette aktualisiert werden muß. Da z. B. die mittlere Punktzahl von (0,47) für das Phonem P2 unter die mittlere Punktzahlschwelle von (0,50) fällt, muß die zugehörige Phonemkette aktualisiert werden und die Punktzahlen für anderen Phoneme brauchen nicht bewertet werden.
  • Dieses Beispiel nimmt an, daß unter den spezifizierten Genauigkeitskriterien eine einzelne Punktzahl unterhalb der minimalen Punktzahlschwelle die spezifizierten Genauigkeitskriterien nicht erfüllt. Unter anderen Umständen können die spezifizierten Genauigkeitskriterien spezifizieren, daß eine bestimme Anzahl von Punktzahlen unter der minimalen Punktzahlschwelle bewirkt, daß eine Phonemkette die spezifizierten Genauigkeitskriterien verfehlt. Zum Beispiel können die spezifizierten Genauigkeitskriterien spezifizieren, daß nur eine Phonemkette, die zwei oder mehr Phonempunktzahlen unterhalb der minimalen Punktzahlschwelle aufweist, die spezifizierten Genauigkeitskriterien nicht erfüllt. Unter diesen Umständen würden die Punktzahlen für das vierte Phonem nicht bewirken, daß die bestimmte Phonemkette die spezifizierten Genauigkeitskriterien nicht erfüllt, jedoch würden die Punktzahlen für das fünfte Phonem dies bewirken.
  • Der Lösungsansatz zur Ermittlung der Genauigkeit einer bestimmten erwarteten Aussprache aus einem Aussprachewörterbuch in einem Spracherkennungssystem wird im folgenden mit Bezug sowohl auf die Tabelle 400 der 4 als auch ein Flußdiagramm 500 der 5 beschrieben. Nach dem Start in Schritt 502 wird im Schritt 504 eine bestimmte erwartete Aussprachedarstellung aus einem Aussprachewörterbuch, z. B. dem Aussprachewörterbuch 112 der 1, abgerufen. Erwartete Darstellungen, die im Aussprachewörterbuch 112 enthalten sind, können selektiv abgerufen und bewertet oder systematisch abgerufen und bewertet werden, als Teil einer regelmäßigen Aussprachewörterbuch-"Abstimmungs"-Prozedur.
  • Im Schritt 508 wird die bestimmte erwartete Aussprachedarstellung mit einer oder mehreren wirklichen Aussprachen verglichen, wobei Genauigkeitspunktzahlen für die bestimmte erwartete Aussprache ermittelt werden. Wie durch Tabelle 400 gezeigt ist, werden die Phoneme in der bestimmten Aussprachedarstellung in bezug auf drei wirkliche Aussprachen bewertet. Eine Genauigkeitspunktzahl wird für jedes Phonem mit Bezug auf jede wirkliche Aussprache auf der Grundlage davon ermittelt, wie gut die wirklichen Aussprachen mit den Phonemen korrelieren. Zum Beispiel wird eine mittlere Genauigkeitspunktzahl von (0,79) für das erste Phonem mit Bezug auf die drei wirklichen Aussprachen in Spalte 414 gespeichert.
  • Im Schritt 510 werden die Genauigkeitspunktzahlen in bezug auf spezifizierte Genauigkeitskriterien bewertet. Zum Beispiel wird die durchschnittliche Genauigkeitspunktzahl für das erste Phonem von (0,79) mit der minimalen mittleren Punktzahlschwelle von (0,50) in Spalte 416 verglichen. Außerdem werden die Genauigkeitspunktzahlen für das erste Phonem in bezug auf die drei wirklichen Aussprachen von (0,90), (0,80) bzw. (0,67) mit der minimalen Punktzahlschwelle von (0,30) aus Spalte 418 verglichen.
  • Im Schritt 512 wird ermittelt, ob die mittlere Punktzahl die minimale mittlere Punktzahlschwelle erfüllt. Falls nicht, erfüllt die bestimmte erwartete Aussprachedarstellung nicht die spezifizierten Genauigkeitskriterien, wobei im Schritt 514 die bestimmte erwartete Darstellung aktualisiert wird. Zum Beispiel liegt die mittlere Genauigkeitspunktzahl von (0,47) für das zweite Phonem P2, wie durch den Eintrag 404 dargestellt, unterhalb der mittleren Punktzahlschwelle von (0,50).
  • Wenn im Schritt 512 die mittlere Punktzahl nicht die minimale mittlere Punktzahlschwelle erfüllt, wird im Schritt 516 ermittelt, ob die Genauigkeitspunktzahlen für die bestimmte erwartete Aussprachedarstellung die minimale Punktzahlschwelle erfüllen. Wie oben beschrieben worden ist, werden dann, wenn mehrere Genauigkeitspunktzahlen für die bestimmte erwartete Aussprachedarstellung unter die minimale Punktzahlschwellen fallen, die spezifizierten Genauigkeitskriterien nicht erfüllt. Falls nicht, rückt die Steuerung zum Schritt 514 vor, wo die bestimmte erwartete Darstellung aktualisiert wird, um die aktuellen Aussprachen des entsprechenden Wortes widerzuspiegeln. Zum Beispiel weist das vierte Phonem eine Genauigkeitspunktzahl unterhalb der minimalen Punktzahlschwelle auf, während das fünfte Phänomen zwei Genauigkeitspunktzahl unterhalb der minimalen Punktzahlschwelle aufweist. Falls jedoch im Schritt 516 die Genauigkeitspunktzahlen die minimale Punktzahlschwelle erfüllen, werden die spezifizierten Genauigkeitspunktzahlen erfüllt. Der Prozeß wird anschließend im Schritt 518 beendet.
  • Obwohl hier im Kontext der Ermittlung der Genauigkeit der erwarteten Aussprachen von Wörtern Ausführungsformen beschrieben worden sind, kann der hier beschriebene Lösungsansatz mit einem beliebigen Typ von Äußerung verwendet werden, wobei die Erfindung nicht auf den Kontext von Wörtern beschränkt ist.
  • 5. IMPLEMENTIERUNGSMECHANISMEN
  • A. ÜBERBLICK
  • Der hier beschriebene Lösungsansatz für die automatische Ermittlung der Genauigkeit eines Aussprachewörterbuches in einem Spracherkennungssystem kann in Computersoftware, in einer Hardwareschaltung oder als eine Kombination von Computersoftware und Hardwareschaltung implementiert werden. Dementsprechend ist die Erfindung nicht auf eine bestimmte Computersoftware- oder Hardwareschaltungs-Implementierung beschränkt. Wie z. B. in 1 gezeigt ist, kann der Lösungsansatz in einem Aussprachediagnosewerkzeug 114 als Teil des SRS 104 implementiert sein. Als ein weiteres Beispiel kann der Lösungsansatz als Teil der Erkennungsvorrichtung 108 implementiert sein. Der Lösungsansatz kann auch als ein selbständiger Mechanismus implementiert sein, der außerhalb des SRS 104 angeordnet ist, und der verwendet wird, um die Genauigkeit des Aussprachewörterbuches 112 abzuschätzen und Empfehlungen für die erwarteten Aussprachedarstellungen im Aussprachewörterbuch 112, die nicht die spezifizierten Genauigkeitskriterien erfüllen, bereitzustellen.
  • B. IMPLEMENTIERUNGSHARDWARE
  • 6 ist ein Blockschaltbild, das ein beispielhaftes Computersystem 600 zeigt, auf dem eine Ausführungsform der Erfindung implementiert werden kann. Das Computersystem 600 enthält einen Bus 602 oder einen anderen Kommunikationsmechanismus zum Austausch von Informationen, wobei ein Prozessor 604 mit dem Bus 602 für die Verarbeitung von Informationen verbunden ist. Das Computersystem 600 enthält ferner einen Hauptspeicher 606, wie z. B. einen Schreib/Lese-Speicher (RAM) oder eine andere dynamische Speichervorrichtung, die mit dem Bus 602 gekoppelt ist, um Informationen und Befehle, die vom Prozessor 604 auszuführen sind, zu speichern. Der Hauptspeicher 606 kann ferner zum Speichern vorübergehender Variablen oder andere Zwischeninformationen während der Ausführung der Befehle, die vom Prozessor 604 auszuführen sind, verwendet werden. Das Computersystem 600 enthält ferner einen Nur-Lese-Speicher (ROM) 608 oder eine andere statische Speichervorrichtung, die mit dem Bus 602 gekoppelt ist, um statische Informationen und Befehle für den Prozessor 604 zu speichern. Eine Speichervorrichtung 610, wie z. B. ein Magnetplattenlaufwerk oder ein optisches Plattenlaufwerk, ist vorgesehen und mit dem Bus 602 verbunden, um Informationen und Befehle zu speichern.
  • Das Computersystem 600 kann über den Bus 602 mit einer Anzeigevorrichtung 612 verbunden sein, wie z. B. einer Katodenstrahlröhre (CRT), um Informationen für einen Computerbenutzer anzuzeigen. Eine Eingabevorrichtung 614, die alphanumerische Tasten oder andere Tasten enthält, ist mit dem Bus 602 verbunden, um Informationen und Befehlsauswahlen für den Prozessor 604 einzugeben. Ein weiterer Typ von Benutzereingabevorrichtung ist eine Cursor-Kontrolle 616, wie z. B. eine Maus, eine Steuerungskugel, oder Cursorrichtungstasten für die Eingabe von Richtungsinformationen und Befehlsauswahlen für den Prozessor 604 und zum Steuern der Cursorbewegung auf der Anzeigevorrichtung 612. Diese Eingabevorrichtung weist typischerweise zwei Freiheitsgrade in zwei Achsen auf, einer ersten Achse (z. B. x) und einer zweiten Achse (z. B. y), die der Vorrichtung erlauben, Positionen in einer Ebene zu spezifizieren.
  • Die Erfindung bezieht sich auf die Verwendung eines Computersystems 600 für die automatische Ermittlung der Genauigkeit eines Aussprachewörterbuches. Gemäß einer Ausführungsform der Erfindung wird ein Mechanismus zum automatischen Ermitteln der Genauigkeit eines Aussprachewörterbuches vom Computersystem 600 in Reaktion auf den Prozessor 604 bereitgestellt, der eine oder mehrere Sequenzen eines oder mehrerer Befehle ausführt, die im Hauptspeicher 606 enthalten sind. Solche Befehle können in den Hauptspeicher 606 von einem weiteren computerlesbaren Medium wie z. B. einer Speichervorrichtung 610 eingelesen werden. Die Ausführung der Befehlssequenzen, die im Hauptspeicher 606 enthalten sind, veranlaßt den Prozessor 604, die hier beschriebenen Prozeßschritte auszuführen. Es können auch ein oder mehrere Prozessoren in einer Multiprozessoranordnung verwendet werden, um die Befehlssequenzen, die im Hauptspeicher 606 enthalten sind, auszuführen. In alternativen Ausführungsformen kann eine festverdrahtete Schaltung anstelle von oder in Kombination mit Softwarebefehlen verwendet werden, um die Erfindung zu implementieren. Die Ausführungsformen der Erfindung sind daher nicht auf irgendeine spezifische Kombination von Hardwareschaltung und Software beschränkt.
  • Der Ausdruck "computerlesbares Medium", wie er hier verwendet wird, bezieht sich auf irgendein Medium, das bei der Bereitstellung von Befehlen für den Prozessor 604 zur Ausführung teilnimmt. Ein solches Medium kann viele Formen annehmen, einschließlich, jedoch nicht hierauf beschränkt, nichtflüchtiger Medien, flüchtiger Medien und Übertragungsmedien. Nichtflüchtige Medien umfassen z. B. optische oder magnetische Platten, wie z. B. die Speichervorrichtung 610. Flüchtige Medien umfassen dynamischen Speicher, wie z. B. den Hauptspeicher 606. Übertragungsmedien umfassen Koaxialkabel, Kupferdraht und Glasfasern, einschließlich der Drähte, die den Bus 602 bilden. Übertragungsmedien können auch die Form von akustischen Wellen oder Lichtwellen annehmen, wie z. B. diejenigen, die während Hochfrequenz- und Infrarot-Datenkommunikationsvorgängen erzeugt werden.
  • Gewöhnliche Formen von computerlesbaren Medien umfassen z. B. eine Diskette, eine flexible Platte, eine Festplatte, ein Magnetband oder irgendein anderes magnetisches Medium, einen CD-ROM, irgendein anderes optisches Medium, Lochkarten, Papierband, irgendein anderes physikalisches Medium mit Lochmustern, einen RAM, einen PROM, und EPROM, einen FLASH-EPROM, irgendeinen anderen Speicherchip oder eine Kassette, eine Trägerwelle, wie im folgenden beschrieben wird, oder irgendein anderes Medium, von dem ein Computer lesen kann.
  • Verschiedene Formen von computerlesbaren Medien können verwendet werden, um eine oder mehrere Sequenzen von einem oder mehreren Befehlen für die Ausführung durch den Prozessor 604 zu tragen. Zum Beispiel können sich die Befehle anfangs auf einer Magnetscheibe eines entfernten Computers befinden. Der entfernte Computer kann die Befehle in seinem dynamischen Speicher laden und die Befehle über eine Telephonleitung unter Verwendung eines Modems senden. Ein Modem, daß beim Computersystem 600 angeordnet ist, kann die Daten auf der Telephonleitung empfangen und einen Infrarotsender verwenden, um die Daten in ein Infrarotsignal umzusetzen. Ein Infrarotdetektor, der mit dem Bus 602 verbunden ist, kann die im Infrarotsignal enthaltenen Daten empfangen und die Daten auf dem Bus 602 plazieren. Der Bus 602 liefert die Daten an dem Hauptspeicher 606, von wo der Prozessor 604 die Befehle abruft und ausführt. Die Befehle, die vom Hauptspeicher 606 empfangen werden, können optional auf der Speichervorrichtung 610 entweder vor oder nach der Ausführung durch den Prozessor 604 gespeichert werden.
  • Das Computersystem 600 enthält ferner eine Kommunikationsschnittstelle 618, die mit dem Bus 602 verbunden ist. Die Kommunikationsschnittstelle 618 sorgt für eine Zweiwege-Datenkommunikationsverbindung mit einer Netzverbindung 620, die mit einem lokalen Netz 622 verbunden ist. Zum Beispiel kann die Kommunikationsschnittstelle 618 eine ISDN-Karte (ISDN = Integrated Services Digital Network) oder ein Modem sein, um eine Datenkommunikationsverbindung mit einem entsprechenden Typ von Telephonleitung zur Verfügung zu stellen. Als weiteres Beispiel kann die Kommunikationsschnittstelle 618 eine lokale Netzkarte (LAN-Karte) sein, um eine Datenkommunikationsverbindung mit einem kompatiblen LAN zur Verfügung zu stellen. Drahtlose Verbindungen können ebenfalls implementiert werden. Bei jeder solchen Implementierung sendet und empfängt die Kommunikationsschnittstelle 618 elektrische, elektromagnetische oder optische Signale, die digitale Datenströme führen, die verschiedene Typen von Informationen repräsentieren.
  • Die Netzverbindung 620 sorgt typischerweise für einen Datenaustausch über ein oder mehrere Netze oder Datenvorrichtungen. Zum Beispiel kann die Netzverbindung 620 eine Verbindung über ein lokales Netz 622 zu einem Host-Computer 624 oder zu einer Datenanlage, die von einem Internet-Dienstanbieter (ISP) 626 betrieben wird, bereitstellen. Der ISP 626 kann seinerseits Datenkommunikationsdienste über das weltweite Paketdatenkommunikationsnetz bereitstellen, das derzeit gewöhnlich als "Internet" 628 bezeichnet wird. Das lokale Netz 622 und das Internet 628 verwenden beide elektrische, elektromagnetische oder optische Signale, die digitale Datenströme führen. Die Signale durch die verschiedenen Netze und die Signale auf der Netzverbindung 620 und durch die Kommunikationsschnittstelle 618, die die digitalen Daten zum und vom Computersystem 600 führen, sind beispielhafte Formen von Trägerwellen, die Informationen transportieren.
  • Das Computersystem 600 kann über die Netze, die Netzverbindung 620 und die Kommunikationsschnittstelle 618 Nachrichten senden und Daten empfangen, einschließlich Programmcode. Bei dem Internet-Beispiel kann ein Server 630 einen angeforderten Code für ein Anwendungsprogramm über das Internet 628, den ISP 626, das lokale Netz 622 und die Kommunikationsschnittstelle 618 senden. Gemäß der Endung sorgt eine solche heruntergeladene Anwendung für die automatische Ermittlung der Genauigkeit des Aussprachewörterbuches, wie hier beschrieben worden ist.
  • Der empfangene Code kann vom Prozessor 604 ausgeführt werden, wenn er empfangen worden ist, und/oder in der Speichervorrichtung 610 oder in einem anderen nichtflüchtigen Speicher für eine spätere Ausführung gespeichert werden. Auf diese Weise kann das Computersystem 600 Anwendungscode in Form einer Trägerwelle erhalten.
  • Der in diesem Dokument beschriebene Lösungsansatz zur automatischen Ermittlung der Genauigkeit eines Aussprachewörterbuches bietet mehrere Vorteile gegenüber früheren Lösungsansätzen. Genauer reduziert die Verwendung eines automatisierten Mechanismus die Menge an Personalaufwand, die zum Ermitteln der Genauigkeit eines Aussprachewörterbuches erforderlich ist. Dies erlaubt, die Genauigkeit eines Aussprachewörterbuches periodisch abzuschätzen und zu korrigieren, ohne darauf warten zu müssen, daß Benutzer Probleme mit bestimmten Wörtern identifizieren. Außerdem erlaubt der automatisierte Lösungsansatz, ein Aussprachewörterbuch schneller zu aktualisieren, um Änderungen einer Anwendung, von Benutzern oder Kontext widerzuspiegeln, als frühere manuelle Lösungsansätze. Die automatisierte Eigenart des Lösungsansatzes kann ferner die Genauigkeit des Aussprachewörterbuches 112 erhöhen, da: (1) der Lösungsansatz Eigenschaften des Spracherkennungssystems 104 berücksichtigen kann; und (2) manuell angepaßte Aussprachen weniger genau sein können, aufgrund von voreingenommenen linguistischen Vorurteilen.
  • In der vorangehenden Beschreibung wurden bestimmte Ausführungsformen beschrieben. Es ist jedoch klar, daß daran verschiedene Abwandlungen und Änderungen vorgenommen werden können, ohne vom Umfang der Erfindung abzuweichen, wie er durch die beigefügten Ansprüche definiert wird. Die Beschreibung und die Zeichnungen sind daher als erläuternd und nicht in einem einschränkenden Sinn aufzufassen.

Claims (12)

  1. Verfahren zur Ermittlung der Genauigkeit eines Aussprachewörterbuches eines Spracherkennungssystems (112), so daß das Wörterbuch aktualisiert werden kann, um seine Genauigkeit zu verbessern, umfassend: Bereitstellen eines Aussprachewörterbuches mit mehreren Einträgen (202), wobei jeder Eintrag einen Wortidentifizierer (WORD ID) und wenigstens eine Phonemkette einer erwarteten Aussprache eines Wortes enthält, wobei jede Phonemkette mehrere Phoneme (P1–PN) aufweist; Empfangen mehrerer wirklicher Äußerungen eines spezifischen Wortes von mehreren Benutzern; Vergleichen jeder der Äußerungen (304, 312, 322) mit einer Phonemkette (302) im Wörterbuch, um eine entsprechende Phonemketten-Punktzahl (412) zu erzeugen, wobei jede Phonemketten-Punktzahl auf einer phonem-weisen Basis (402, 404, 406) die Genauigkeit der empfangenen Äußerung relativ zur verglichenen Phonemkette angibt; und Bewerten der Phonemketten-Punktzahlen bezüglich vorgegebener Genauigkeitskriterien (416, 418), um Einträge im Wörterbuch zu identifizieren, die aktualisiert werden sollten.
  2. Verfahren nach Anspruch 1, bei dem die Phonemketten-Punktzahl eine Phonem-Punktzahl für jedes Phonem in der Phonemkette aufweist, wobei jede Phonem-Punktzahl die Korrelation zwischen einem Phonem in der Phonemkette und einem entsprechenden Phonem in der wirklichen Äußerung angibt.
  3. Verfahren nach Anspruch 2, bei dem das Verfahren ferner umfaßt: Berechnen einer mittleren Phonem-Punktzahl (414) für jedes Pho nem in der Phonemkette aus dem entsprechenden Phonem-Punktzahlen jeder der wirklichen Äußerungen; Ermitteln, ob irgendeine der mittleren Phonem-Punktzahlen unterhalb eines Schwellenwertes (416) liegt; und falls dies zutrifft, Identifizieren des entsprechenden Eintrags im Wörterbuch, der die Phonemkette enthält, die eine Aktualisierung erfordert.
  4. Verfahren nach Anspruch 2, bei dem das Verfahren ferner das Vergleichen der Phonem-Punktzahlen mit einer Minimalpunktzahlschwelle (418) und das Identifizieren des entsprechenden Eintrags im Wörterbuch, der die Phonemkette enthält, die eine Aktualisierung erfordert, wenn wenigstens eines der Phoneme in der Kette eine spezifizierte Anzahl von Instanzen aufweist, bei denen die Phonem-Punktzahl unterhalb der Minimalpunktzahlschwelle liegt, umfaßt.
  5. Computerlesbares Medium, das eine oder mehrere Sequenzen von Befehlen zum Ermitteln der Genauigkeit eines Aussprachewörterbuches (112) eines Spracherkennungssystems trägt, so daß das Wörterbuch aktualisiert werden kann, um seine Genauigkeit zu verbessern, wobei die eine oder die mehreren Sequenzen von Befehlen Befehle enthalten, die dann, wenn sie von einem oder mehreren Prozessoren ausgeführt werden, die Schritte ausführen: Bereitstellen eines Aussprachewörterbuches mit mehreren Einträgen (202), wobei jeder Eintrag einen Wortidentifizierer (WORD ID) und wenigstens eine Phonemkette einer erwarteten Aussprache eines Wortes enthält, wobei jede Phonemkette mehrere Phoneme (P1–PN) aufweist; Empfangen mehrerer wirklicher Äußerungen eines spezifischen Wortes von mehreren Benutzern; Vergleichen jeder der Äußerungen (304, 312, 322) mit einer Phonemkette (302) im Wörterbuch, um eine entsprechende Phonemketten-Punktzahl (412) zu erzeugen, wobei jede Phonemketten-Punktzahl auf einer phonem-weisen Basis (402, 404, 406) die Genauigkeit der empfangenen Äußerung relativ zur verglichenen Phonemkette angibt; und Bewerten der Phonemketten-Punktzahlen bezüglich vorgegebener Genauigkeitskriterien (416, 418), um Einträge im Wörterbuch zu identifizieren, die aktualisiert werden sollten.
  6. Computerlesbares Medium nach Anspruch 5, bei dem die Phonemketten-Punktzahl eine Phonem-Punktzahl für jedes Phonem in der Phonemkette aufweist, wobei jede Phonem-Punktzahl die Korrelation zwischen einem Phonem in der Phonemkette und einem entsprechenden Phonem in der wirklichen Äußerung angibt.
  7. Computerlesbares Medium nach Anspruch 6, bei dem die Befehle ferner die Schritte ausführen: Berechnen einer mittleren Phonem-Punktzahl (414) für jedes Phonem in der Phonemkette aus dem entsprechenden Phonem-Punktzahlen jeder der wirklichen Äußerungen; Ermitteln, ob irgendeine der mittleren Phonem-Punktzahlen unterhalb eines Schwellenwertes (416) liegt; und falls dies zutrifft, Identifizieren des entsprechenden Eintrags im Wörterbuch, der die Phonemkette enthält, die eine Aktualisierung erfordert.
  8. Computerlesbares Medium nach Anspruch 6, bei dem die Befehle ferner die Schritte ausführen: Vergleichen der Phonem-Punktzahlen mit einer Minimalpunktzahlschwelle (418); und Identifizieren des entsprechenden Eintrags im Wörterbuch, der die Phonemkette enthält, die eine Aktualisierung erfordert, wenn wenigstens eines der Phoneme in der Kette eine spezifizierte Anzahl von Fällen aufweist, bei denen die Phonem-Punktzahl unterhalb der Minimalpunktzahlschwelle liegt.
  9. Spracherkennungs-Diagnosewerkzeug zum Ermitteln der Genauigkeit eines Aussprachewörterbuches (112), so daß das Wörterbuch aktualisiert werden kann, um seine Genauigkeit zu verbessern, umfassend: ein Aussprachewörterbuch mit mehreren Einträgen (202), wobei jeder Eintrag einen Wortidentifizierer (WORD ID) und wenigstens eine Phonemkette einer erwarteten Aussprache eines Wortes enthält, wobei jede Phonemkette mehrere Phoneme (P1–PN) aufweist; Mittel zum Empfangen mehrerer wirklicher Äußerungen eines spezifischen Wortes von mehreren Benutzern; Mittel zum Vergleichen jeder der Äußerungen (304, 312, 322) mit einer Phonemkette (302) im Wörterbuch, um eine entsprechende Phonemketten-Punktzahl (412) zu erzeugen, wobei jede Phonemketten-Punktzahl auf einer phonem-weisen Basis (402, 404, 406) die Genauigkeit der empfangenen Äußerung relativ zur verglichenen Phonemkette angibt; und Mittel zum Bewerten der Phonemketten-Punktzahlen bezüglich vorgegebener Genauigkeitskriterien (416, 418), um Einträge im Wörterbuch zu identifizieren, die aktualisiert werden sollten.
  10. Spracherkennungs-Diagnosewerkzeug nach Anspruch 9, bei dem das Mittel zum Vergleichen ein Mittel zum Erzeugen einer Phonemketten-Punktzahl enthält, die eine Phonem-Punktzahl für jedes Phonem in der Phonemkette aufweist, wobei jede Phonem-Punktzahl die Korrelation zwischen einem Phonem in der Phonemkette und einem entsprechenden Phonem in der wirklichen Äußerung angibt.
  11. Spracherkennungs-Diagnosewerkzeug nach Anspruch 10, ferner umfassend: Mittel, um für jedes Phonem in der Phonemkette eine mittlere Phonem-Punktzahl (414) aus den entsprechenden Phonem-Punktzahlen jeder der wirklichen Äußerungen zu berechnen; und Mittel zum Ermitteln, ob irgendeine der mittleren Phonem-Punktzahlen unterhalb eines Schwellenwertes (416) liegt, und, falls dies zutrifft, zum Identifizieren des entsprechenden Eintrags im Wörterbuch, der die Phonemkette enthält, die eine Aktualisierung erfordert.
  12. Spracherkennungs-Diagnosewerkzeug nach Anspruch 10, ferner umfassend: Mittel zum Vergleichen der Phonem-Punktzahlen mit einer Minimalpunktzahlschwelle (418), und zum Identifizieren des entsprechenden Eintrags im Wörterbuch, der die Phonemkette enthält, die eine Aktualisierung erfordert, wenn wenigstens eines der Phoneme in der Kette eine spezifizierte Anzahl von Fällen aufweist, bei denen die Phonem-Punktzahl unterhalb der Minimalpunktzahlschwelle liegt.
DE60004862T 1999-06-24 2000-06-23 Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem Expired - Lifetime DE60004862T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US344164 1982-01-29
US09/344,164 US6434521B1 (en) 1999-06-24 1999-06-24 Automatically determining words for updating in a pronunciation dictionary in a speech recognition system
PCT/US2000/017209 WO2000079517A1 (en) 1999-06-24 2000-06-23 Automatically determining the accuracy of a pronunciation dictionary in a speech recognition system

Publications (2)

Publication Number Publication Date
DE60004862D1 DE60004862D1 (de) 2003-10-02
DE60004862T2 true DE60004862T2 (de) 2004-07-15

Family

ID=23349320

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60004862T Expired - Lifetime DE60004862T2 (de) 1999-06-24 2000-06-23 Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem

Country Status (8)

Country Link
US (1) US6434521B1 (de)
EP (1) EP1203366B1 (de)
JP (1) JP4545363B2 (de)
AT (1) ATE248422T1 (de)
AU (1) AU764810B2 (de)
CA (1) CA2375402A1 (de)
DE (1) DE60004862T2 (de)
WO (1) WO2000079517A1 (de)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040190688A1 (en) * 2003-03-31 2004-09-30 Timmins Timothy A. Communications methods and systems using voiceprints
US7107215B2 (en) * 2001-04-16 2006-09-12 Sakhr Software Company Determining a compact model to transcribe the arabic language acoustically in a well defined basic phonetic study
US7016842B2 (en) * 2002-03-26 2006-03-21 Sbc Technology Resources, Inc. Method and system for evaluating automatic speech recognition telephone services
TW556152B (en) * 2002-05-29 2003-10-01 Labs Inc L Interface of automatically labeling phonic symbols for correcting user's pronunciation, and systems and methods
AU2002950336A0 (en) * 2002-07-24 2002-09-12 Telstra New Wave Pty Ltd System and process for developing a voice application
AU2002951244A0 (en) * 2002-09-06 2002-09-19 Telstra New Wave Pty Ltd A development system for a dialog system
AU2003900584A0 (en) * 2003-02-11 2003-02-27 Telstra New Wave Pty Ltd System for predicting speech recognition accuracy and development for a dialog system
US7324940B1 (en) 2003-02-28 2008-01-29 Lumen Vox, Llc Speech recognition concept confidence measurement
AU2003902020A0 (en) * 2003-04-29 2003-05-15 Telstra New Wave Pty Ltd A process for grammatical inference
US20040230431A1 (en) * 2003-05-14 2004-11-18 Gupta Sunil K. Automatic assessment of phonological processes for speech therapy and language instruction
US7302389B2 (en) * 2003-05-14 2007-11-27 Lucent Technologies Inc. Automatic assessment of phonological processes
US7373294B2 (en) * 2003-05-15 2008-05-13 Lucent Technologies Inc. Intonation transformation for speech therapy and the like
US20040243412A1 (en) * 2003-05-29 2004-12-02 Gupta Sunil K. Adaptation of speech models in speech recognition
WO2005024604A2 (en) * 2003-09-09 2005-03-17 Siftology, Inc. Dynamic lexicon
US8019602B2 (en) * 2004-01-20 2011-09-13 Microsoft Corporation Automatic speech recognition learning using user corrections
US7580837B2 (en) * 2004-08-12 2009-08-25 At&T Intellectual Property I, L.P. System and method for targeted tuning module of a speech recognition system
US7110949B2 (en) * 2004-09-13 2006-09-19 At&T Knowledge Ventures, L.P. System and method for analysis and adjustment of speech-enabled systems
US7533018B2 (en) * 2004-10-19 2009-05-12 Motorola, Inc. Tailored speaker-independent voice recognition system
GB2424742A (en) * 2005-03-31 2006-10-04 Ibm Automatic speech recognition
EP1934971A4 (de) * 2005-08-31 2010-10-27 Voicebox Technologies Inc Dynamische sprachverschärfung
JP5040909B2 (ja) * 2006-02-23 2012-10-03 日本電気株式会社 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
WO2009008055A1 (ja) * 2007-07-09 2009-01-15 Fujitsu Limited 音声認識装置、音声認識方法、および、音声認識プログラム
WO2009016729A1 (ja) * 2007-07-31 2009-02-05 Fujitsu Limited 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法
TW200926142A (en) * 2007-12-12 2009-06-16 Inst Information Industry A construction method of English recognition variation pronunciation models
WO2009078256A1 (ja) * 2007-12-18 2009-06-25 Nec Corporation 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム
US8536976B2 (en) * 2008-06-11 2013-09-17 Veritrix, Inc. Single-channel multi-factor authentication
US8185646B2 (en) * 2008-11-03 2012-05-22 Veritrix, Inc. User authentication for social networks
US8166297B2 (en) 2008-07-02 2012-04-24 Veritrix, Inc. Systems and methods for controlling access to encrypted data stored on a mobile device
US9484019B2 (en) 2008-11-19 2016-11-01 At&T Intellectual Property I, L.P. System and method for discriminative pronunciation modeling for voice search
US8296141B2 (en) * 2008-11-19 2012-10-23 At&T Intellectual Property I, L.P. System and method for discriminative pronunciation modeling for voice search
US8301446B2 (en) * 2009-03-30 2012-10-30 Adacel Systems, Inc. System and method for training an acoustic model with reduced feature space variation
US9183834B2 (en) * 2009-07-22 2015-11-10 Cisco Technology, Inc. Speech recognition tuning tool
US9275640B2 (en) * 2009-11-24 2016-03-01 Nexidia Inc. Augmented characterization for speech recognition
DE112010005168B4 (de) * 2010-01-22 2018-12-13 Mitsubishi Electric Corporation Erkennungswörterbuch-Erzeugungsvorrichtung, Spracherkennungsvorrichtung und Stimmensynthesizer
JP5633042B2 (ja) * 2010-01-28 2014-12-03 本田技研工業株式会社 音声認識装置、音声認識方法、及び音声認識ロボット
JP5533042B2 (ja) * 2010-03-04 2014-06-25 富士通株式会社 音声検索装置、音声検索方法、プログラム及び記録媒体
CN102237081B (zh) 2010-04-30 2013-04-24 国际商业机器公司 语音韵律评估方法与系统
US8639508B2 (en) * 2011-02-14 2014-01-28 General Motors Llc User-specific confidence thresholds for speech recognition
KR102443087B1 (ko) 2015-09-23 2022-09-14 삼성전자주식회사 전자 기기 및 그의 음성 인식 방법
EP3511931A4 (de) * 2016-09-09 2019-08-21 Sony Corporation Sprachverarbeitungsvorrichtung, informationsverarbeitungsvorrichtung, sprachverarbeitungsverfahren und informationsverarbeitungsverfahren
CN110209561B (zh) * 2019-05-09 2024-02-09 北京百度网讯科技有限公司 用于对话平台的评测方法和评测装置
CN111506736B (zh) * 2020-04-08 2023-08-08 北京百度网讯科技有限公司 文本发音获取方法、装置和电子设备
CN112687291B (zh) * 2020-12-21 2023-12-01 科大讯飞股份有限公司 一种发音缺陷识别模型训练方法以及发音缺陷识别方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS617890A (ja) * 1984-06-22 1986-01-14 富士通株式会社 音声認識対象単語検査方式
JPH067348B2 (ja) 1989-04-13 1994-01-26 株式会社東芝 パタン認識装置
DE3931638A1 (de) 1989-09-22 1991-04-04 Standard Elektrik Lorenz Ag Verfahren zur sprecheradaptiven erkennung von sprache
US5710864A (en) 1994-12-29 1998-01-20 Lucent Technologies Inc. Systems, methods and articles of manufacture for improving recognition confidence in hypothesized keywords
JPH08248979A (ja) * 1995-03-06 1996-09-27 Fuji Xerox Co Ltd 音声認識装置
US5933804A (en) * 1997-04-10 1999-08-03 Microsoft Corporation Extensible speech recognition system that provides a user with audio feedback
US6208964B1 (en) * 1998-08-31 2001-03-27 Nortel Networks Limited Method and apparatus for providing unsupervised adaptation of transcriptions

Also Published As

Publication number Publication date
EP1203366A1 (de) 2002-05-08
ATE248422T1 (de) 2003-09-15
DE60004862D1 (de) 2003-10-02
CA2375402A1 (en) 2000-12-28
WO2000079517A1 (en) 2000-12-28
AU764810B2 (en) 2003-08-28
AU6336800A (en) 2001-01-09
EP1203366B1 (de) 2003-08-27
JP4545363B2 (ja) 2010-09-15
US6434521B1 (en) 2002-08-13
JP2003502702A (ja) 2003-01-21

Similar Documents

Publication Publication Date Title
DE60004862T2 (de) Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem
DE60010106T2 (de) Verfahren und vorrichtung zum unterscheidenden training von akustischen modellen in einem spracherkennungssystem
DE60124842T2 (de) Rauschrobuste Mustererkennung
DE69421324T2 (de) Verfahren und Vorrichtung zur Sprachkommunikation
DE69822296T2 (de) Mustererkennungsregistrierung in einem verteilten system
DE69834553T2 (de) Erweiterbares spracherkennungssystem mit einer audio-rückkopplung
DE69722980T2 (de) Aufzeichnung von Sprachdaten mit Segmenten von akustisch verschiedenen Umgebungen
DE69923379T2 (de) Nicht-interaktive Registrierung zur Spracherkennung
DE69327188T2 (de) Einrichtung für automatische Spracherkennung
DE60111329T2 (de) Anpassung des phonetischen Kontextes zur Verbesserung der Spracherkennung
DE602004012909T2 (de) Verfahren und Vorrichtung zur Modellierung eines Spracherkennungssystems und zur Schätzung einer Wort-Fehlerrate basierend auf einem Text
DE19847419A1 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung
DE69618503T2 (de) Spracherkennung für Tonsprachen
DE602005000308T2 (de) Vorrichtung für sprachgesteuerte Anwendungen
DE3337353A1 (de) Sprachanalysator auf der grundlage eines verborgenen markov-modells
EP1273003B1 (de) Verfahren und vorrichtung zum bestimmen prosodischer markierungen
DE19942178C1 (de) Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung
DE60133537T2 (de) Automatisches umtrainieren eines spracherkennungssystems
DE602004004310T2 (de) System mit kombiniertem statistischen und regelbasierten Grammatikmodell zur Spracherkennung und zum Sprachverstehen
EP0987682B1 (de) Verfahren zur Adaption von linguistischen Sprachmodellen
DE69519229T2 (de) Verfahren und vorrichtung zur anpassung eines spracherkenners an dialektische sprachvarianten
EP1058235B1 (de) Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese
EP1182646A2 (de) Verfahren zur Zuordnung von Phonemen
DE69333762T2 (de) Spracherkennungssystem
EP0813734B1 (de) Verfahren zur erkennung mindestens eines definierten, durch hidden-markov-modelle modellierten musters in einem zeitvarianten messignal, welches von mindestens einem störsignal überlagert wird

Legal Events

Date Code Title Description
8364 No opposition during term of opposition