DE60014743T2 - Verfahren und Vorrichtung zur Analyse natürlicher Sprache - Google Patents

Verfahren und Vorrichtung zur Analyse natürlicher Sprache Download PDF

Info

Publication number
DE60014743T2
DE60014743T2 DE60014743T DE60014743T DE60014743T2 DE 60014743 T2 DE60014743 T2 DE 60014743T2 DE 60014743 T DE60014743 T DE 60014743T DE 60014743 T DE60014743 T DE 60014743T DE 60014743 T2 DE60014743 T2 DE 60014743T2
Authority
DE
Germany
Prior art keywords
speech analysis
labels
input phrase
grammars
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60014743T
Other languages
English (en)
Other versions
DE60014743D1 (de
Inventor
Murat Santa Barbara Karaorman
Jean-Claude Santa Barbara Junqua
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of DE60014743D1 publication Critical patent/DE60014743D1/de
Application granted granted Critical
Publication of DE60014743T2 publication Critical patent/DE60014743T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Description

  • Hintergrund und Zusammenfassung der Erfindung
  • Die vorliegende Erfindung bezieht sich auf Sprachanalyse und insbesondere auf einen computerimplementierten Parser für natürliche Sprache.
  • Das Verständnis der Bedeutung eines Satzes natürlicher Sprache ist der Grundstein vieler Gebiete der Wissenschaft und hat weitreichende Implikationen – von der Art, wie Menschen mit Computern oder Maschinen interagieren, bis zur Art, wie sie mit anderen intelligenten Mitteln, ob Mensch oder Maschine, über Übersetzungssysteme interagieren können. Die Aufgabe wird komplizierter, wenn der Satz mit einem automatischen Spracherkennungssystem (ASR) beschafft wird, wobei Erkennungsfehler wie Einfügungen, Auslassungen oder Substitutionen den Satz weniger verständlich machen können, selbst für einen Menschen. Zusätzliche, mit der Benutzeroberfläche zusammenhängende Faktoren, können außerdem der eigenen Äußerung des Sprechers ein Element der Unnatürlichkeit verleihen, so dass der erkannte Satz die Auswirkungen von Zögerungen, Pausen, Wiederholungen und bruchstückhaften Phrasen oder Sätzen enthalten kann.
  • Infolge dieser Faktoren, spielt das Parsing von Sätzen natürlicher Sprache bei computerimplementierten sprachverwandten Systemen eine wichtige Rolle. Aktuelle Ansätze für Parser für natürliche Sprache weisen jedoch typischerweise eine relativ suboptimale Robustheit bei der Handhabung der zuvor erwähnten Fehler eines automatischen Spracherkennungssystems auf.
  • In "A modular approach to spoken language translation for large domains", M. Woszczyna. et al. Proceedings of AMTA-1998 18–31 Oktober 1998 Seiten 1 – 10 wird ein Maschinenübersetzungssystem offenbart, das speziell für gesprochenen Dialog geeignet ist, wobei Sprache durch hochgradig unflüssige Äußerungen gekennzeichnet ist, die fragmentiert und ungrammatisch sein können und wobei ein Gitter aus Parsebäumen erzeugt wird, die alle möglichen gebietspezifischen Handlungen enthalten, wobei eine gebietspezifische Handlung eine Tätigkeit wie das Anfordern von Informationen oder das Erteilen von Informationen umfassen kann und aus drei symbolischen Ebenen besteht: Konsistenz einer Sprachhandlung, Begriffe und Argumente.
  • Die vorliegende Erfindung bewältigt die zuvor erwähnten Nachteile sowie andere Nachteile.
  • Gemäß der Lehre der vorliegenden Erfindung werden ein Verfahren und eine Vorrichtung zur computerimplementierten Sprachanalyse zum Verarbeiten einer Eingabephrase bereitgestellt. Das Verfahren und die Vorrichtung umfassen das Bereitstellen einer Vielzahl von Grammatiken, die für vorbestimmte Themen indikativ sind. Es wird eine Vielzahl von Parsewäldern unter Verwendung der Grammatiken generiert und unter Verwendung der generierten Parsewälder werden Etiketten mit Wörtern in der Eingabephrase assoziiert. Für die Etiketten werden basierend auf Attributen der Parsewälder Bewertungen generiert und Etiketten werden basierend auf den generierten Bewertungen als geparste Darstellung der Eingabephrase ausgewählt.
  • Für ein vollständigeres Verständnis der Erfindung, ihrer Aufgaben und Vorteile wird auf die nachfolgende Beschreibung und die beiliegenden Zeichnungen verwiesen.
  • Kurze Beschreibung der Zeichnungen
  • 1 ist ein Blockdiagramm, das die computerimplementierten Komponenten zeigt, die zum Bewirken eines Dialogs zwischen mindestens zwei Personen mit unterschiedlichen Sprachen eingesetzt werden.
  • 2 ist ein Blockdiagramm, das die Komponenten des Systems in 1 detaillierter zeigt;
  • 3 ist ein Etikettengenerierungsdiagramm, das die Anwendung des semantischen Etikettengenerierungsprozesses auf einen Eingabesatz zeigt;
  • 4 ist ein Blockdiagramm, das die Komponenten des lokalen Parsers der vorliegenden Erfindung zeigt;
  • 5 ist ein Etikettengenerierungsdiagramm, das die Anwendung des semantischen Etikettengenerierungsprozesses auf einen Eingabesatz zeigt;
  • 6 ist ein Parsebaumdiagramm, das ein Modell für einen Parsebaum für einen Eingabesatz zeigt;
  • 7 ist ein Parsebaumdiagramm, das mehrere Etiketten zeigt, die während Zwischenstufen des lokalen Parsing als Kandidaten generiert werden;
  • 8 ist ein Prozessdiagramm, das die Ausgabe bei verschiedenen Intervallen für die vorliegende Erfindung zeigt;
  • 9 ist eine Computer-Bildschirmanzeige einer beispielhaften Kosten-Grammatik;
  • 10 ist eine Computer-Bildschirmanzeige eines für einen Eingabesatz generierten Parsewalds;
  • 11 ist ein grafischer Parsewald, der eine teilweise Darstellung in einem grafischen Format des Parsewalds in 10 zeigt;
  • 12 ist ein Flussdiagramm, das die mit der vorliegenden Erfindung, eingesetzt in einer beispielhaften Anwendung, assoziierten Ablaufschritte zeigt; und
  • 13 ist ein Flussdiagramm, das die mit der Verarbeitung eines Eingabesatzes, unter Verwendung des lokalen Parsers der vorliegenden Erfindung, assoziierten Ablaufschritte zeigt.
  • Beschreibung der bevorzugten Ausführungsform
  • 1 zeigt ein computerimplementiertes Verarbeitungssystem für die kontinuierliche Sprache eines Dialogs, das es zwei Personen, die verschiedene Sprachen sprechen, ermöglicht, effektiv zu kommunizieren. Im nicht einschränkenden Beispiel in 1 möchte ein Käufer 20 mit einem Verkäufer 22 kommunizieren, um eine Ware zu kaufen. Es tritt die Schwierigkeit auf, dass der Käufer 20 nur Englisch spricht während der Verkäufer 22 nur Japanisch spricht.
  • Das Dialogsprache-Verarbeitungssystem 24 der vorliegenden Erfindung nutzt einen Spracherkenner 26, um die englische Sprache des Käufers 20 in eine Folge von Wörtern umzuwandeln. Die Folge von Wörtern wird von einem Sprache verstehenden Modul 28 als Text gelesen, das die semantischen Komponenten der Folge auszieht.
  • Ein Dialogmanager 30 bestimmt, basierend auf den vom Sprache verstehenden Modul 28 bestimmten semantischen Komponenten, ob vom Käufer 20 eine ausreichende Menge an Informationen geliefert wurde. Wenn eine ausreichende Menge an Informationen bereitgestellt wurde, erlaubt der Dialogmanager 30 dem Übersetzungsmodul 32, die Sprache des Käufers aus den bestimmten semantischen Komponenten ins Japanische zu übersetzen. Das Übersetzungsmodul 32 übersetzt die semantischen Komponenten ins Japanische und führt über das Computerantwortmodul 42 eine Sprachsynthese durch, um die japanische Übersetzung zu sprechen, so dass der Verkäufer 22 sie hören kann.
  • Der Verkäufer 22 nutzt dann das Dialogsprache-Verarbeitungssystem 24, um dem Käufer zu antworten. Entsprechend führen ein japanischer Spracherkenner 36 und ein japanische Sprache verstehendes Modul 38 jeweils eine Spracherkennung der Sprache des Verkäufers durch, wenn keine ausreichenden Informationen vom Verkäufer 22 geliefert wurden.
  • Wenn der Dialogmanager 30 feststellt, dass vom Käufer 20 eine ungenügende Menge an Informationen geliefert wurde, um ein vorbestimmtes Ziel zu erreichen (beispielsweise das Kaufen einer Ware), weist der Dialogmanager 30 ein Computerantwortmodul 34 an, eine Antwort zu sprechen, die den Käufer 20 auffordert, die fehlende(n) Informationen) zu liefern.
  • Die bevorzugte Ausführungsform ist geeignet für die Implementierung in einem Handheld-Computergerät 43, wobei es sich bei dem Gerät um ein Werkzeug handelt, das es dem/der Benutzer/in ermöglicht, seinen bzw. ihren Wunsch in der Zielsprache zu formulieren. Ein solches tragbares, Handheld-Gerät eignet sich gut, um in einem fremden Land eine Ticket-/Hotelreservierung zu machen, eine Ware zu kaufen, einen örtlichen Auskunftsdienst zu nutzen oder Geld zu wechseln. Die bevorzugte Ausführungsform ermöglicht es dem Benutzer, von einer Aufgabe zur anderen zu wechseln, indem er am Handheld-Gerät wählt, welche Aufgabe er ausführen möchte. In einer alternativen Ausführungsform kann eine für jede Aufgabe einzigartige Flash-Speicherkarte bereitgestellt werden, so dass ein Benutzer von einer Aufgabe zur anderen wechseln kann.
  • 2 zeigt Komponenten des Dialogsprache-Verarbeitungssystems 24 in detaillierterer Darstellung. Insbesondere umfasst das Sprache verstehende Modul 28 einen lokalen Parser 60, um vorbestimmte, aufgabenbezogene Fragmente zu identifizieren. Das Sprache verstehende Modul 28 umfasst außerdem einen globalen Parser 62, um die allgemeine Semantik des Wunschs des Käufers auszuziehen.
  • Der neuartige örtliche Parser 60 nutzt in der bevorzugten Ausführungsform mehrere kleine Grammatiken sowie mehrere Durchgänge und einen einzigartigen Bewertungsmechanismus, um Parsehypothesen aufzustellen. Gemäß diesem Ansatz erkennt der neuartige lokale Parser beispielsweise Phrasen wie Daten, Städtenamen und Preise. Wenn ein Sprecher äußert "besorge mir einen Flug nach Boston am 23. Januar, auf dem Mittagessen serviert wird", erkennt der lokale Parser: "Boston" als Städtenamen; "23. Januar" als Datum; und "Mittagessen" als mit einer Mahlzeit zusammenhängend. Der globale Parser fügt diese Artikel (Städtename, Datum usw.) zusammen und erkennt, dass der Sprecher unter gewissen Randbedingungen in einem Flugzeug fliegen möchte.
  • Das Sprache verstehende Modul 28 umfasst die Wissensdatenbank 63, die die Semantik eines Gebiets (d.h. des zu erreichenden Ziels) codiert. In diesem Sinn ist die Wissensdatenbank 63 vorzugsweise eine gebietsspezifische Datenbank, wie unter Bezugszeichen 65 dargestellt, und wird vom Dialogmanager 30 verwendet, um zu bestimmen, ob eine bestimmte, mit dem Erreichen eines vorbestimmten Ziels zusammenhängende Handlung möglich ist.
  • Die bevorzugte Ausführungsform codiert die Semantik über eine Rahmendatenstruktur 64. Die Rahmendatenstruktur 64 enthält leere Schlitze 66, die gefüllt werden, wenn die semantische Interpretation des globalen Parsers 62 dem Rahmen entspricht. Beispielsweise umfasst eine Rahmendatenstruktur (deren Gebiet das Kaufen von Ware ist) einen leeren Schlitz, um den vom Käufer gewünschten Preis für die Ware anzugeben. Wenn der Käufer 20 den Preis geliefert hat, wird dieser leere Schlitz mit dieser Information gefüllt. Wenn dieser bestimmte Rahmen jedoch gefüllt werden muss, nachdem der Käufer seinen Wunsch erstmals genannt hat, weist der Dialogmanager 30 das Computerantwortmodul 34 an, den Käufer 20 aufzufordern, einen gewünschten Preis zu nennen.
  • Vorzugsweise ist das Computerantwortmodul 34 mehrmodal, insofern als es in der Lage ist, einem Benutzer eine Antwort über Sprachsynthese, Text oder grafisch zu liefern. Wenn der Benutzer beispielsweise um eine Wegbeschreibung zu einem bestimmten Ort gebeten hat, könnte die Computerantwort eine grafische Landkarte anzeigen, wobei die Begriffe auf der Landkarte vom Übersetzungsmodul 40 übersetzt wurden. Darüber hinaus kann das Computerantwortmodul 40 die Wegbeschreibung für den Benutzer über den Audioteil 68 sprechen. Es ist jedoch zu beachten, dass die vorliegende Erfindung nicht darauf beschränkt ist, dass alle drei Modi vorhanden sind, da sie eine oder mehrere der Modi des Computerantwortmoduls 34 umfassen kann.
  • Der Audioteil 68 nutzt die Semantik, die erkannt wurde, um basierend auf dem semantischen Konzept, einen Satz in der Zielsprache des Käufers zu generieren. Dieses Generieren nutzt vorzugsweise ein Lexikon mit gepaarten Sätzen in der Ausgangs- und der Zielsprache. In einer alternativen Ausführungsform werden Sätze automatisch basierend auf pro Typ-Sätzen generiert, die aus den in einem semantischen Rahmen verfügbaren Schlitzen aufgebaut wurden.
  • Die Rahmendatenstruktur 64 umfasst vorzugsweise mehrere Rahmen, die jeweils mehrere Schlitze haben. Ein Rahmen kann Schlitze haben, die auf Attribute eines Hemds wie Farbe, Größe und Preise gerichtet sind. Ein anderer Rahmen kann Schlitze haben, die auf zu dem Ort, an den das Hemd geschickt werden soll, gehörende Attribute wie Name, Adresse, Telefonnummer gerichtet sind.
  • In der folgenden Bezugsquelle werden globale Parser und Rahmen diskutiert: R. Kuhn and R. D. Mori, Spoken Dialogues with Computers (Kapitel 14: Sentence Interpretation), Academic Press, Boston (1998).
  • Der Dialogmanager 30 nutzt die Dialoghistoriendatei 67, um beim Füllen von leeren Schlitzen zu helfen, bevor er den Sprecher um die Information bittet. Die Dialoghistoriendatei 67 enthält ein Protokoll des Gesprächs, das über das Gerät der vorliegenden Erfindung stattgefunden hat. Wenn ein Sprecher beispielsweise äußert "besorge mir einen Flug nach Boston am 23. Januar, auf dem Mittagessen serviert wird", untersucht der Dialogmanager 30 die Dialoghistorien-Datendatei 67, um zu prüfen, welche Städtenamen der Sprecher in einem früheren Dialogaustausch möglicherweise geäußert hat. Wenn der Sprecher erwähnt hat, dass er aus Detroit anruft, füllt der Dialogmanager 30 den leeren Schlitz der Ausgangsstadt mit dem Städtenamen "Detroit". Wenn eine ausreichende Anzahl Schlitze gefüllt wurde, fordert die vorliegende Erfindung den Sprecher auf, den Flugplan zu überprüfen und zu bestätigen. Wenn sich also herausstellt, dass Annahmen, die der Dialogmanager 30 durch die Verwendung der Dialoghistorien-Datendatei 67 gemacht hat, falsch sind, kann der Sprecher die Annahme korrigieren.
  • In einer weiteren alternativen Ausführungsform wird das Computerantwortmodul 34 vom Dialogmanager 30 angewiesen, eine Suche in der entfernten Datenbank 70 durchzuführen, um dem Käufer 20 Informationen über diese Ware zu liefern. In diesem nicht einschränkenden Beispiel kann der Dialogmanager 30 das Computerantwortmodul 34 anweisen, die entfernte Datenbank 70 des Ladens nach dem Preisbereich der Ware zu durchsuchen, an der der Käufer 20 interessiert ist. Die alternative Ausführungsform verbessert die Qualität des Dialogs zwischen dem Käufer 20 und dem Verkäufer 22 erheblich, indem sie dem Käufer 20 Informationen liefert, so dass der Käufer 20 eine besser informierte Anfrage an den Verkäufer 22 formulieren kann.
  • Der Dialogmanager 30 nimmt im Dialog eine integrierende Rolle ein, indem er einen Hin- und Her-Dialog mit dem Käufer 20 führt, bevor der Käufer 20 mit dem Verkäufer 22 kommuniziert. In einer derartigen Rolle ist der Dialogmanager 30, indem er die Lehren der vorliegenden Erfindung nutzt, in der Lage, den abwechselnden Aspekt eines menschenähnlichen Hin- und Her-Dialogs effektiv zu verwalten. Der Dialogmanager 30 ist in der Lage, selbst zu entscheiden, welche Richtung der Dialog mit dem Käufer 20 als nächstes einschlagen wird und wann das Einschlagen einer neuen Richtung initiiert werden soll.
  • Wenn der Käufer 20 beispielsweise eine bestimmte Art von Hemd in einem vorgegebenen Preisbereich gewünscht hat, bestimmt der Dialogmanager 30, ob ein solches Hemd in diesem Preisbereich verfügbar ist. Eine solche Bestimmung erfolgt über die entfernte Datenbank 70. In diesem Beispiel bestimmt der Dialogmanager 30, dass ein solches Hemd nicht im Preisbereich des Käufers erhältlich ist, jedoch ein Hemd eines anderen Typs in dem Preisbereich erhältlich ist. So kann der Dialogmanager 30 bestimmen, ob eine bestimmte Handlung oder ein bestimmtes Ziel des Käufers realisierbar ist und kann dem Käufer helfen, dieses Ziel zu erreichen.
  • Die vorliegende Erfindung analysiert und extrahiert semantisch wichtige und aussagekräftige Themen aus einem lose strukturierten Text in natürlicher Sprache, der als Ausgabe eines automatischen Spracherkennungssystems (ASR), das von einem Dialog oder Sprache verstehenden System genutzt wird, generiert worden sein kann. Die vorliegende Erfindung übersetzt den Text in natürlicher Sprache in eine neue Darstellung, indem sie gut strukturierte Etiketten generiert, die Themeninformationen und Daten enthalten und jedes Etikett mit den Segmenten des Eingabetexts assoziiert, die die etikettierten Informationen enthalten. In einer alternativen Ausführungsform werden Etiketten als getrennte Liste oder als semantischer Rahmen generiert.
  • 3 zeigt ein nicht einschränkendes Beispiel der Rolle des lokalen Parsers der vorliegenden Erfindung in einem Sprache verstehenden System wie beispielsweise bei einem automatischen online Reisebuchungsspezialisten mit Sprachschnittstelle. Bei den folgenden Themen kann es sich um potenzielle Ziele für die vorliegende Erfindung handeln: Flugankunfts- und -abflugzeiten und -daten, möglicherweise mit Bereichen und Einschränkungen; mit dem Flug zusammenhängende Städtenamen; Preisinformationen mit Geldbeträgen; Sitzklasse; Informationen zu Mahlzeiten; Flugnummern; Namen von Fluggesellschaften; Zwischenlandungen usw.
  • Das Beispiel umfasst einen möglichen Eingabesatz 100, wie er von einem Spracherkennungssystem für kontinuierliche Sprache generiert wurde und der Erkennungsfehler enthält. Die entsprechende Ausgabe 102 ist eine mögliche Interpretation durch die vorliegende Erfindung, wobei drei Etiketten generiert wurden, eines das Städtenamen entspricht 104, eines das Zeit entspricht 106 und eines das Daten entspricht 108.
  • Ein Merkmal der vorliegenden Erfindung ist Robustheit, da die Eingabe grammatisch inkorrekte englische Sätze, wie im obigen Beispiel enthalten kann, die aus den folgenden Gründen grammatisch falsch sind: Die Eingabe an den Erkenner erfolgt in natürlicher Sprache in saloppem Dialogstil und kann bruchstückhafte Sätze und unvollständige Phrasen enthalten; die Spracherkennung kann Einfügungen, Auslassungen oder Erkennungsfehler einführen, selbst wenn die Spracheingabe als korrekt betrachtet wird. Die vorliegende Erfindung handhabt auf robuste Weise alle Arten von Eingabe und zieht so viele Informationen aus wie möglich.
  • 4 zeigt die verschiedenen Komponenten des neuartigen lokalen Parsers 60 der vorliegenden Erfindung. Die vorliegende Erfindung nutzt vorzugsweise verallgemeinerte Parsing-Techniken in einem Ansatz mit mehreren Durchgängen als eine Festkommaberechnung. Jedes Thema wird als eine kontextsensitive LR- (links-rechts und mit rechtester Ableitung (rightmost derivation)) Grammatik bei Zulassung von Mehrdeutigkeiten beschrieben. Die folgenden sind Bezugsquellen zum Thema kontextsensitive LR-Grammatiken: A. Aho und J. D. Ullman, Principles of Compiler Design, Addison Wesley Publishing Co., Reading, Massachusetts (1977); und N. Tomita, Generalized LR Parsing, Kluwer Academic Publishers, Boston, Massachusetts (1991).
  • Bei jedem Durchgang der Berechnung wird ein verallgemeinerter Parsing-Algorithmus verwendet, um vorzugsweise alle möglichen (sowohl vollständigen als auch teilweisen) Parsebäume für jedes als Ziel gesetzte Thema unabhängig zu generieren. Jeder Durchgang generiert potenziell mehrere alternative Parsebäume, wobei jeder Parsebaum eine möglicherweise verschiedene Interpretation eines bestimmten Themas darstellt. Die mehreren Durchgänge durch vorzugsweise parallele und unabhängige Pfade führen zu einer erheblichen Eliminierung von Mehrdeutigkeiten und Überlappungen zwischen verschiedenen Themen. Die vorliegende Erfindung ist eine systematische Weise, alle möglichen Parsebäume zu bewerten, so dass unter Nutzung der im System vorhandenen kontextuellen Informationen die (N) besten Kandidaten ausgewählt werden.
  • Das lokale Parsing-System 60 wird in drei Stufen ausgeführt: lexikalische Analyse 120; parallele Parsewaldgenerierung für jedes Thema (zum Beispiel, Generatoren 130 und 132); und Analyse und Synthese geparster Komponenten, wie allgemein unter Bezugszeichen 134 gezeigt. Die bevorzugte Ausführungsform zeigt die Struktur für die Eingaben und Ausgaben des lokalen Parsers in Anlage A nachfolgend.
  • Lexikalische Analyse:
  • Ein Sprecher äußert eine Phrase, die von einem automatischen Spracherkenner 117 erkannt wird, der den Eingabesatz 118 generiert. Die lexikalische Analysestufe 120 identifiziert und generiert unter Verwendung von lexikalischen Filtern 126 und 128 Etiketten für die Themen (die keine umfangreichen Grammatiken erfordern) im Eingabesatz 118. Diese umfassen beispielsweise Städtenamen; Sitzklassen; Informationen zu Mahlzeiten; Namen von Fluggesellschaften; und Informationen zu Zwischenlandungen. Ein Scan des Eingabesatzes 118 auf reguläre Ausdrücke unter Verwendung der mit den erwähnten beispielhaften Etiketten zusammenhängenden Schlüsselwörtern ist auf dieser Ebene typischerweise ausreichend. Außerdem wird in dieser Stufe das Etikettieren von Wörtern im Eingabesatz durchgeführt, die nicht Teil des Lexikons der bestimmten Grammatik sind. Diese Wörter werden durch ein X-Etikett gekennzeichnet, so dass solche Störwörter durch den Buchstaben "X" ersetzt werden.
  • Generieren paralleler Parsewälder:
  • Die vorliegende Erfindung verwendet eine anspruchsvolle Parsing-Strategie, um jedes Thema getrennt zu beschreiben und zu parsen und generiert Etiketten und bildet sie auf dem Eingabestrom ab. Aufgrund der Eigenschaften des unstrukturierten Eingabetexts 118 akzeptiert jeder einzelne Themenparser vorzugsweise eine möglichst große Sprache, wobei er alle außer den wichtigen Wörtern ignoriert und Einfüge- und Auslassfehler handhabt. Das Parsing jedes Themas beinhaltet das Entwickeln kontextsensitiver Grammatikregeln unter Verwendung einer Metaebenen-Spezifizierungssprache, ähnlich wie die beim LR-Parsing verwendeten. Beispiele von Grammatiken umfassen Grammatik A 140 und Grammatik B 142. Bei Anwendung des Ansatzes der vorliegenden Erfindung werden die Themengrammatiken 140 und 142 beschrieben, als wären sie eine LR-Grammatik, die Redundanzen enthält und ohne Verschiebungen zu eliminieren und Konflikte zu reduzieren. Das Ergebnis des Parsing eines Eingabesatzes sind alle möglichen, auf den Grammatikspezifikationen basierenden Parsen.
  • Die Generatoren 130 und 132 generieren die Parsewälder 150 und 152 für ihre Themen. Die Etikettengenerierung erfolgt durch Synthetisierung von tatsächlichen Informationen, die im beim Parsing gewonnenen Parsebaum gefunden wurden.
  • 4 zeigt die Etikettengenerierung über Etiketten- und Bewertungsgeneratoren 160 und 162, die jeweils die Etiketten 164 bzw. 166 generieren. Jedes identifizierte Etikett trägt außerdem Informationen dazu, welche Menge von Eingabewörtern im Eingabesatz durch das Etikett abgedeckt werden. Anschließend ersetzt das Etikett seine Deckungsmenge. In der bevorzugten Ausführungsform werden Kontextinformationen 167 für die Etiketten- und Bewertungsgenerierung verwendet, beispielsweise durch die Generatoren 160 und 162. Die Kontextinformationen 167 werden in der Bewertungsheuristik zum Anpassen von Gewichten verwendet, die mit einer nachfolgend diskutierten heuristischen Bewertungsfaktortechnik assoziiert sind. Die Kontextinformationen 167 enthalten vorzugsweise den Wortvertrauensvektor 168 und Dialogkontextgewichte 169. Es ist jedoch zu beachten, dass die vorliegende Erfindung nicht auf die Verwendung von sowohl dem Wortvertrauensvektor 168 als auch den Dialogkontextgewichten 169 beschränkt ist, sondern auch die Verwendung von einem unter Ausschluss des anderen sowie die Nicht-Nutzung von Kontextinformationen 167 in der vorliegenden Erfindung umfasst.
  • Der automatische Spracherkennungs-Prozessblock 117 generiert den Wortvertrauensvektor 168, der angibt, wie gut die Wörter im Eingabesatz 118 erkannt wurden. Der Dialogmanager 30 generiert Dialogkontextgewichte 169, indem er den Zustand des Dialogs bestimmt. Beispielsweise fragt der Dialogmanager 30 einen Benutzer zu einem bestimmten Thema, z.B. welche Abflugszeit er vorzieht. Aufgrund dieser Anfrage bestimmt der Dialogmanager 30, dass der Zustand des Dialogs zeitorientiert ist. Der Dialogmanager 30 liefert Dialogkontextgewichte 169, um den entsprechenden Prozessen mitzuteilen, dass sie die erfassten zeitorientierten Wörter stärker gewichten sollen.
  • Synthese von Etikettenkomponenten:
  • Der Themen erkennende Parser der vorangegangenen Stufe generiert eine erhebliche Menge an Informationen, die analysiert und zusammengefügt werden müssen, um die endgültige Ausgabe des lokalen Parsers zu bilden. Die vorliegende Erfindung ist vorzugsweise so "aggressiv" wie möglich beim Erkennen jedes Themas, was zum Generieren mehrerer Etikettenkandidaten führt. Außerdem ist es bei Vorhandensein bestimmter Schlüsselwörter wie "zwischen", "vor", "und", "oder", "ungefähr" usw. und insbesondere wenn diese Wörter aufgrund von Erkennungsfehlern eingeführt oder weggelassen wurden möglich, viele alternative Etikettenkandidaten zu konstruieren. Beispielsweise könnte der Eingabesatz 220 in 5 das Ergebnis von Einfüge- oder Auslassungsfehlern sein. Die kombinierende Phase der vorliegenden Erfindung bestimmt, welche Etiketten eine aussagekräftigere Interpretation der Eingabe bilden. Die vorliegende Erfindung definiert Heuristiken und trifft unter Anwendung eines N-besten Kandidatenauswahlprozesses basierend darauf eine Auswahl. Jedes generierte Etikett entspricht einer Menge von Wörtern in der Eingabewortfolge, die als Deckungsmenge des Etiketts bezeichnet wird.
  • Es wird eine Heuristik verwendet, die die zum Generieren einer Bewertung verwendeten Deckungsmengen der Etiketten verwendet. Die Bewertung hängt grob gesehen ab von der Größe der Deckungsmenge, den Größen der Lücken (ausgedrückt in der Anzahl Wörter) in den abgedeckten Objekten und den Gewichten, die dem Vorhandensein gewisser Schlüsselwörter zugewiesen wurden. In der bevorzugten Ausführungsform werden der aus ASR gewonnene Vertrauensvektor und die Dialogkontextinformationen genutzt, um den Etiketten Prioritäten zuzuweisen. Wenn beispielsweise Kostenetiketten-Parsing zuerst angewandt wird, werden mit Kosten zusammenhängende Zahlen, die sich aus dem Eingabestrom leichter eindeutig identifizieren lassen, potenziell entfernt, so dass weniger Zahlen zurückbleiben, die Mehrdeutigkeiten mit anderen Etiketten erzeugen können. Vorzugsweise werden Dialogkontextinformationen verwendet, um die Prioritäten anzupassen.
  • Auswahl der N-besten Kandidaten
  • In 4 wählt am Ende jedes Durchgangs ein N-bester Prozessor 170 basierend auf den mit den Etiketten assoziierten Bewertungen die N-besten Kandidaten und generiert die Themenetiketten, die jeweils die im entsprechenden Parsebaum gefundenen Informationen repräsentieren. Nachdem die Themen auf diese Weise erkannt wurden, können die entsprechenden Wörter in der Eingabe durch die Etiketteninformationen ersetzt werden. Diese Substitution eliminiert die entsprechenden Wörter aus dem aktuellen Eingabetext. Die Ausgabe 180 jedes Durchgangs wird als neue Eingabe an den nächsten Durchgang zurückgeleitet, da die Substitutionen beim Eliminieren gewisser Mehrdeutigkeiten zwischen konkurrierenden Grammatiken helfen können oder helfen können, bessere Parsebäume zu generieren, indem sie überlappende Symbole herausfiltern.
  • Die Berechnung endet, wenn im letzten Durchgang keine zusätzlichen Etiketten generiert werden. Die Ausgabe des letzten Durchgangs wird zur Ausgabe des lokalen Parsers an den globalen Parser 62. Da jede Phase nur die Anzahl Wörter in ihrer Eingabe reduzieren kann und die Länge des Eingabetexts endlich ist, ist die Anzahl von Durchgängen in der Festkommaberechnung durch die Größe ihrer Eingabe linear begrenzt.
  • Die folgenden neuartigen Bewertungsfaktoren werden verwendet, um die alternativen Parsebäume basierend auf den folgenden Attributen eines Parsebaums in einer Rangfolge zu ordnen:
    • – Anzahl von Endstellensymbolen
    • – Anzahl von Nicht-Endstellensymbolen
    • – Tiefe des Parsebaums
    • – Größe der Lücken in den Endstellensymbolen
    • – Mit jedem Endstellensymbol assoziierte ASR-Vertrauensmaße
    • – Mit jedem Endstellensymbol und Nicht-Endstellensymbol assoziierte kontextanpassbare Gewichte.
  • Jeder Pfad entspricht vorzugsweise einem getrennten Thema, das unabhängig entwickelt werden kann, wobei mit einer kleinen Datenmenge auf rechnerisch günstige Weise vorgegangen werden kann. Die Architektur der vorliegenden Erfindung ist flexibel und modular, und integriert so zusätzliche Pfade und Grammatiken für neue Themen, außerdem ist das Ändern von Heuristiken für bestimmte Themen einfach, so dass wiederverwendbare Komponenten entwickelt werden können, die leicht von verschiedenen Systemen gemeinsam genutzt werden können.
  • 6 zeigt eine nicht einschränkende Darstellung eines Baums bezüglich einer Diskussion zur Etikettenbewertungsheuristik. 6 zeigt eine Eingabefolge 250 und einen Muster-Parsebaum 252. Der Parsebaum mit der Wurzel St 254 identifiziert die Unterfolge {w3, w4, w7, w8, w10} als mögliche Parse. Diese Parse hat 5 Endstellensymbole {w3, w4, w7, w8, w10} mit Lücken zwischen w4 u. w7 (Größe = 2) und zwischen w8 und w10 (Größe = 1) bzw. eine Gesamtlückengröße von 3. Der Parsebaum 252 hat vier Nicht-Endstellen: St 254, NTa 256, NTb 258, und NTc 260. Die Tiefe des Parsebaums 252 ist drei, aufgrund der Transversalen von St 254 zu NTf 258 zu NTa 256 zu w3.
  • Eine mögliche Bewertung für diese Parse ist: #Terminals*10 – (GapSize*1.5) – Depth + #Non-terminals = 50–4.5–3+4 = 46.5
  • Die vorliegende Erfindung umfasst außerdem die Nutzung von nicht einheitlichen Gewichten, die den Nicht-End- und den Endstellenknoten zugewiesen werden können. Außerdem werden vorzugsweise Vertrauensmaße genutzt, um die Gewichte eines oder mehrerer der Bewertungsfaktoren anzupassen. Beispielsweise kann ein Wahrscheinlichkeitsverhältnisalgorithmus genutzt werden, um Vertrauensbewertungen zu berechnen (siehe z.B. folgende Bezugsquelle: R. Sukkar und Chin-Hui Lee, Vocabulary Independenf Discriminative Utterance Verification for Non-Key Word Rejection in Sub-Word Based Speech Recognition, IEEE Transactions on Speech and Audio Processing, Vol. 4, No. 6, Seiten 420–29 (1996)).
  • 7 zeigt eine weitere nicht einschränkende Darstellung eines Baums bezüglich einer Diskussion zur Bewertungsheuristik. Unter Bezugszeichen 270, 272, 274, 276 und 278 sind fünf Parsebäume abgebildet.
  • Bezüglich den in 7 gezeigten fünf möglichen Parsebäumen und den entsprechenden Etiketten wird der folgende Bewertungsansatz verwendet:
  • Figure 00160001
  • Das bewertungsbasierte System führt dazu, dass Etikett Nr. 5 als bester Kandidat für Datums- (Date) ziele gewählt wird. Diese Auswahl eliminiert Etikett Nr. 2 und Etikett Nr. 4 aufgrund der Überlappung mit dem Lexikon von Etikett Nr. 1 aus der weiteren Betrachtung. So verbleibt die Parse für Etikett Nr. 1 als nächstbeste Parse und Etikett Nr. 5 und Nr. 1 werden ausgewählt.
  • Die vorliegende Erfindung verwendet mehrere Durchgänge, wie in 8 veranschaulicht. Unter Bezugszeichen 290 werden Ausgaben der vorliegenden Erfindung für verschiedene Durchgänge beim Verarbeiten des Eingabesatzes 294 gezeigt. Der Parsebaumwald 296 wird beim ersten Durchgang generiert und hilft, die Ausgabe des ersten Durchgangs 298 zu generieren. Die Ausgabe des ersten Durchgangs 298 hat das Zeitetikett 300 mit den Wörten "Five thirty pm" des Eingabesatzes 294 assoziiert.
  • Die Ausgabe des ersten Durchgangs 298 wird als Eingabe für eine Verarbeitung des Eingabesatzes 294 in einem zweiten Durchgang verwendet. Der Parsewald 302 wird während der Verarbeitung des zweiten Durchgangs generiert und führt dazu, dass ein Kostenetikett 304 generiert wird. In einer Ausführungsform der vorliegenden Erfindung besteht der Grund dafür, dass die Verarbeitung im ersten Durchgang die hundert Dollar des Eingabesatzes 294 nicht geparst hat, in der Auswahl des N-besten Etiketts und dem Kombinieren von Block 170 aus 4. Während der ersten Phase ist die beste Kostenparse aufgrund von lexikalischem Filtern und aggressivem Parsing "five hundred dollars" und die beste Zeitparse ist der Parsebaumwald 296 für "alter five thirty p-m". Da das Wort "five" gemeinsam genutzt wird, macht der Auswahlvorgang die beste Kostenparse ungültig und generiert das Zeitetikett für "five thirty p-m". Das Ende des zweiten Durchgangs ergibt jedoch eine gefilterte Folge 308, die das Kostenetikett 304 erfolgreich generiert.
  • Grammatik
  • In der bevorzugten Ausführungsform wird jedes Thema als verallgemeinerte LR(0)-Grammatik mit der folgenden Syntax ausgedrückt:
  • Figure 00170001
  • Die Grammatiksyntax sagt informell aus, dass die Grammatik als Folge von Grammatikregeln ausgedrückt wird, wobei jede Grammatikregel entweder eine kontextsensitive Substitutionsregel für ein Endstellen- oder Nicht-Endstellen-Grammatiksymbol beschreibt.
  • 9 zeigt eine beispielhafte Grammatik für das Parsing der Kosten in Dollar- und Yen-Beträgen. Die erste Regel <* COST.> 320 erklärt COST zum Wurzel-Nicht-Endstellensymbol.
  • Jede darauf folgende Regel der Form <A = X Y Z.> spezifiziert ein Nicht-Endstellensymbol A und eine Substitutionsregel, nach der das Symbol A in einer rechtesten Ableitung (rightmost derivation) durch die drei rechten Grammatiksymbole X Y Z ersetzt werden kann, von denen jedes entweder ein Endstellen- oder ein Nicht-Endstellensymbol ist. Beispielsweise definiert die Regel 324:
    C_Gen = C_Num I C_Num C_Currency.
  • C_Gen als eine Nicht-Endstelle, die mit entweder einer Zahl (C_Num) oder einer Zahl, auf die ein Währungssymbol (C_Currency) folgt, reduziert werden kann. Endstellensymbole werden unter Verwendung von <t: s1 s2.> definiert. Beispielsweise definiert die Regel 328:
    c_yen: yen yens.
    c_yen als ein Endstellensymbol, das "yen" oder "yens" als ein nächstes Token im Eingabestrom zuordnet.
  • Die Kostengrammatik ordnet alle Wörter, die nicht als Endstellen definiert sind, der X-Regel zu. Es wird ein lexikalischer Filter verwendet, um alle Eingabewörter, die nach COST-Regeln nicht relevant sind, in das Wort "x" zu konvertieren. Dementsprechend ordnet die X-Regel eines oder mehrere aufeinander folgende "x" zu.
  • 10 zeigt ein nicht einschränkendes Beispiel des Parsings des Satzes 400: "flights under five hundred dollars." Jede Zeile steht für die Anwendung einer Grammatikregel. Beispielsweise steht unter Bezugszeichen 404:
    C_Tens_2_3=c_num_2_3.
    für einen Knoten im Parsewald, wobei das Grammatiksymbol C_tens den Bereich [2-3] abdeckt; d.h. das Wort "five". Ebenso steht Zeile 408:
    c_qualifier_1_2: "under".
    für das Endstellensymbol c_qualifier, das dem Bereich [1-2] zugeordnet ist, d.h. dem Wort "under". Die Wurzelsymbolregel 412, COST_0_5 deckt den gesamten Bereich ab, was eine erfolgreiche Parse meldet, die eine eindeutige Parse für die gesamte Eingabe ergeben hat. Es sind weitere Wurzelsymbolregeln dargestellt, mit eigenen Parsebäumen, die in 10 gezeigt sind. Beispielsweise zeigt 10 einen Parsebaum für das Wurzelsymbol 437. Wenn mehrere Parsen verwendet werden, enthält eine Regel die mit "I"s gezeigten Alternativen. Außerdem ist als nicht einschränkend zu beachten, wie das erste Wort "flights" von der X-Regel übersprungen wird.
  • 11 zeigt eine teilweise grafische Baumdarstellung der Daten aus 10. Beispielsweise ist die Wurzelsymbolregel durch das Bezugszeichen 412 in 11 dargestellt.
  • Etikettengenerierung:
  • Das bevorzugte Etikettengenerierungsverfahren nutzt einen Parsewald und generiert die Etiketten, wie von den Ausgabespezifikationen vorgegeben. Der Etikettengenerierungsalgorithmus ("reduzieren" genannt) nutzt einen Synthese- und Vererbungsansatz, um jedes Etikett unter Nutzung der im Parsebaum gefundenen Informationen aufzubauen (beachte: die Verwendung der Bezeichnung "reduzieren" hierin ist getrennt und verschieden vom Begriff "reduzieren" (wie in Verschiebungs-/Reduktionshandlungen), der in der Literatur zu LR-Parsing verwendet wird). Der vom Etikettengenerierungsverfahren verwendete Reduzierungsalgorithmus funktioniert wie folgt:
    Eingabe: Knoten: α_i_j(beliebiger Knoten im Parsewald.)
    • 1. Wenn α_i_j eine Endstellenregel ist, gebe die rechte Seite (bei der es sich um ein Token im Eingabestrom in Position / handelt) entweder unverändert aus oder indem ihr eine Bedeutung zugewiesen wird – beispielsweise durch Anwendung einer Konvertierung von Ascii zu numerisch für eine Ziffer usw.)
    • 2. Entferne alle X-Regeln von der rechten Seite, was eine Regel der Form α_i_j = βo_io_jo βl_il_jl βk_ik_jk liefert, wobei β≠X.
    • 3. Evaluiere das neue Attribut α für α_i_j durch Verketten der Ergebnisse des Reduzierens der Glieder auf der rechten Seite, d.h.: α_i_j.α = Σi=o..k reduziere (βi_ii_ji)wobei Σ ein Verkettungsoperator ist.
    • 4. Vererbe alle Attribute von jedem reduzierten Glied auf der rechten Seite. für jedes Glied βi_ii_ji in der rechten Seite addiere für jedes Attribut, Φ ∈ βi_ii_ji.AttrList Φ zur Attributliste des Knotens: α_i_j.AttrList ∪ = φvererbe den Attributwert: α_i_j.ϕ = βi_ii_ji.ϕ
    • 5. Wenn nötig, generiere neue Attribute für α_i_j, möglicherweise unter Nutzung der vererbten und berechneten Attribute. Alle neuen Attribute werden von den Vorgängerattributen vererbt, bis hoch zum Wurzelknoten. Dies ist der allgemeine Mechanismus, mit dem wir die Etikettenstrukturen konstruieren und initialisieren können.
  • 12 zeigt die Funktion der vorliegenden Erfindung in einer beispielhaften Anwendung, in der ein Käufer versucht, ein bestimmtes Hemd zu kaufen, wobei er in einer ersten Sprache mit einem Verkäufer spricht, der in einer zweiten Sprache spricht. Der Startanzeigeblock 500 zeigt an, dass der Prozessblock 504 verarbeitet werden soll. Im Prozessblock 504 spricht der Käufer in einer ersten Sprache über ein bestimmtes Hemd. Im Prozessblock 508 wird die Sprache des Käufers erkannt und vorbestimmte Teile der Sprache des Käufers werden über den lokalen Parser der vorliegenden Erfindung im Prozessblock 512 bestimmt.
  • Im Prozessblock 516 werden die semantischen Anteile der Sprache des Käufers über einen globalen Parser bestimmt. Der Prozessblock 520 übersetzt die bestimmten semantischen Teile in eine zweite Sprache, die dann im Prozessblock 524 gesprochen wird. Im Prozessblock 528 wird die Antwort des Verkäufers bzw. Käufers gemäß der vorliegenden Erfindung verarbeitet. Die Verarbeitung endet mit dem Prozessblock 532.
  • 13 zeigt die Ablaufschritte, die mit der Mehrdurchgangs-Architektur des lokalen Parsers der vorliegenden Erfindung assoziiert sind. Der Startanzeigeblock 550 zeigt an, dass der Prozessblock 554 ausgeführt werden soll, in dem ein Eingabesatz empfangen wird. Der Prozessblock 567 führt die automatische Spracherkennung für den Eingabesatz aus.
  • Der Iterationsblock 566 führt für jede Grammatik die folgenden Schritte aus. Vorzugsweise wird die Verarbeitung für jede Grammatik im Wesentlichen gleichzeitig mit der Verarbeitung für eine zweite Grammatik durchgeführt. Der Prozessblock 570 wendet unter Verwendung der Grammatik gemäß der Auswahl durch Iterationsblock 566 einen lexikalischen Filter auf den Eingabesatz an.
  • Der Prozessblock 574 generiert unter Verwendung der ausgewählten Grammatik einen Parsewald und der Prozessblock 578 generiert unter Verwendung von Vertrauensvektoren aus Prozessblock 557 und Dialogkontextgewichten aus Prozessblock 599 (sofern von früherer Verarbeitung des Dialogmanagers vorhanden) Etiketten für den Eingabesatz. Es ist jedoch zu beachten, dass die vorliegende Erfindung nicht darauf beschränkt ist, in dieser Stufe der Verarbeitung kontextverwandte Daten zu verwenden, sondern auch die Verwendung keiner Kontextinformationen in dieser Stufe umfasst.
  • Der Prozessblock 582 generiert eine Bewertung für die Etiketten, die im Prozessblock 578 generiert wurden. Der Prozessblock 586 wählt basierend auf der vom Prozessblock 582 generierten Bewertung die N-besten Etiketten aus. Der Prozessblock 590 generiert die Etikettenausgabe und der Iterationsabbruchblock 594 wiederholt den Prozess, bis jede Grammatik genutzt wurde.
  • Wenn jede Grammatik für einen bestimmten Durchgang genutzt wurde, fragt der Entscheidungsblock 598, ob zusätzliche Etiketten generiert wurden. Wenn zusätzliche Etiketten generiert wurden, fährt die Verarbeitung mit dem Iterationsblock 566 fort. Wenn keine zusätzlichen Etiketten generiert wurden, fährt die Verarbeitung mit dem Prozessblock 599 fort. Im Prozessblock 599 wird das globale Parsing durchgeführt und dann wird die Dialogmanager-Verarbeitung ausgeführt, wobei Kontextgewichte bestimmt werden, die bei Bedarf in der nächsten Verarbeitung eines Eingabesatzes verwendet werden könnten. Die Verarbeitung endet mit dem Endblock 602.
  • Obwohl die Erfindung in ihrer derzeit bevorzugten Form beschrieben wurde, ist zu beachten, dass es zahlreiche Anwendungen und Implementierungen für die vorliegende Erfindung gibt. Dementsprechend kann die Erfindung abgewandelt und verändert werden, ohne vom Erfindungsgedanken, wie er in den angehängten Patentansprüchen dargelegt ist, abzuweichen.
  • ANLAGE A
  • Eingabe: Ascii-Textfolge s, die eine Folge von durch weiße Leerzeichen getrennte Wörter wj ohne Satzzeichen enthält. Die Wörter bestehen aus Kleinbuchstaben des englischen Alphabets und dem einfachen Anführungszeichen [Beachte: keine Ziffern], wobei s = w0 w1 ... wn w = [a–z'] +
  • Ausgabe: Ascü-Textfolge, out, die eine Folge von durch weiße Leerzeichen getrennten Wörtern oder Etiketten ohne Satzzeichen enthält, wobei:
  • Figure 00230001
  • Figure 00240001
  • Figure 00250001

Claims (40)

  1. Computerimplementiertes Sprachanalyseverfahren zum Verarbeiten einer Eingangsphrase (118), das folgende Schritte umfasst: (a) Bereitstellen einer Vielzahl von Grammatiken (140, 142), die für vorbestimmte Themen indikativ sind; (b) Generieren einer Vielzahl von mit der Eingangsphrase (118) verwandten Parsewäldern (150, 152) unter Verwendung der Grammatiken; (c) Assoziieren von Etiketten (164, 166) mit Wörtern in der Eingangsphrase (118) unter Verwendung der generierten Parsewälder (150, 152); (d) Generieren von Bewertungen für die Etiketten (164, 166), basierend auf Attributen der Parsewälder (150, 152); und (e) Auswählen von Etiketten (164, 166) zur Verwendung als geparste Darstellung (180) der Eingangsphrase(118), basierend auf den generierten Bewertungen.
  2. Sprachanalyseverfahren nach Anspruch 1, das weiterfolgenden Schritt umfasst: Ausführen des Schritts (b) über eine Vielzahl von Iterationen, so dass jede Iteration andere Parsewälder produziert.
  3. Sprachanalyseverfahren nach Anspruch 1, wobei der Schritt (b) im Wesentlichen gleichzeitig für jede der Grammatiken ausgeführt wird.
  4. Sprachanalyseverfahren nach Anspruch 3, das weiter folgenden Schritt umfasst: Ausführen des Schritts (b) für eine Vielzahl von Iterationen, wobei jede Iteration andere Parsewälder bezüglich jeder der Grammatiken produziert.
  5. Sprachanalyseverfahren nach Anspruch 1, das weiter folgenden Schritt umfasst: Generieren von Bewertungen für die Etiketten, basierend auf bewertungsbasierten Faktoren, die aus der Anzahl von Endstellen, Lückengröße, Tiefe, Anzahl von Nicht-Endstellen und Kombinationen derselben bestehenden Gruppe ausgewählt werden.
  6. Sprachanalyseverfahren nach Anspruch 5, das weiter folgenden Schritt umfasst: unterschiedliches Gewichten von mindestens zwei der Faktoren.
  7. Sprachanalyseverfahren nach Anspruch 6, das weiter folgenden Schritt umfasst: Verwenden von Kontextinformationen zum unterschiedlichen Gewichten von mindestens zwei der Faktoren.
  8. Sprachanalyseverfahren nach Anspruch 7, das weiter folgende Schritte umfasst: Generieren eines Wortvertrauensvektors für die Eingangsphrase, im Wesentlichen während der Spracherkennung der Eingangsphrase; und unterschiedliches Gewichten von mindestens zwei der Faktoren, basierend auf dem generierten Wortvertrauensvektor.
  9. Sprachanalyseverfahren nach Anspruch 7 oder 8, das weiter folgende Schritte umfasst: Generieren einer Anforderung nach Informationen, zusammenhängend mit einem vorbestimmten Thema; Generieren von Dialogkontextgewichten, basierend auf der generierten Anforderung nach Informationen; und unterschiedliches Gewichten von mindestens zwei der Faktoren, basierend auf den generierten Dialogkontextgewichten.
  10. Sprachanalyseverfahren nach Anspruch 7, das weiter folgende Schritte umfasst: Verwenden des Kontextinformationsprozessors, im Wesentlichen parallel, um den Schritt (b) auszuführen.
  11. Sprachanalyseverfahren nach Anspruch 1, das weiter folgende Schritte umfasst: Generieren von Bewertungen für die Etiketten; und Auswählen von N-besten Etiketten für die Verwendung in der geparsten Darstellung, basierend auf den generierten Bewertungen.
  12. Sprachanalyseverfahren nach Anspruch 11, das weiter folgende Schritte umfasst: Ausführen der Schritte (b) und (c) über eine Vielzahl von Iterationen; und Verwenden der ausgewählten N-besten Etiketten einer ersten Iteration als Eingabe, zusammenhängend mit der Verarbeitung der Schritte (b) und (c) einer zweiten Iteration.
  13. Sprachanalyseverfahren nach Anspruch 1, wobei die Etiketten indikativ für die Themen der Grammatiken sind.
  14. Sprachanalyseverfahren nach Anspruch 1, wobei die Eingangsphrase bezüglich mindestens eines Teils der Eingangsphrase grammatikalisch inkorrekt ist, wobei das Verfahren weiter folgende Schritte umfasst: Generieren, unter Verwendung der Grammatiken, einer Vielzahl von Parsewäldern, zusammenhängend mit der grammatikalisch inkorrekten Eingangsphrase; Assoziieren von Etiketten mit Wörtern in der grammatikalisch inkorrekten Phrase unter Verwendung der generierten Parsewälder; und Verwenden der mit den Wörtern assoziierten Etiketten als analysierte Darstellung der grammatikalisch inkorrekten Eingangsphrase.
  15. Sprachanalyseverfahren nach Anspruch 1, wobei die Grammatiken auf links-rechts kontextsensitiven Grammatiken basieren.
  16. Sprachanalyseverfahren nach Anspruch 1, wobei die Grammatiken auf links-rechts kontextsensitiven Grammatiken basieren und Mehrdeutigkeiten enthalten.
  17. Sprachanalyseverfahren nach Anspruch 1, das weiter folgende Schritte umfasst: Filtern der Eingangsphrase über lexikalische Filter; und Generieren der Vielzahl von Parsewäldern, basierend auf der gefilterten Eingangsphrase.
  18. Sprachanalyseverfahren nach Anspruch 1, das weiter folgenden Schritt umfasst: Ausziehen semantischer Komponenten der Eingangsphrase, basierend auf den Etiketten, die mit den Wörtern assoziiert sind.
  19. Sprachanalyseverfahren nach Anspruch 1, das weiter folgenden Schritt umfasst: Bereitstellen eines globalen Parsers zum Ausziehen der semantischen Komponenten aus der Eingangsphrase, basierend auf den Etiketten, die mit den Wörtern assoziiert sind.
  20. Sprachanalyseverfahren nach Anspruch 19, das weiter folgenden Schritt umfasst: Verwalten, basierend auf den ausgezogenen semantischen Komponenten, des Austauschs von Dialog zwischen einer Spracherkennungsvorrichtung und einem Anwender.
  21. Sprachanalyseverfahren nach Anspruch 19, das weiter folgenden Schritt umfasst: Verwalten, basierend auf den ausgezogenen semantischen Komponenten, des Austauschs von Dialog zwischen zwei Anwendern, die verschiedene Sprachen sprechen.
  22. Computerimplementierte Sprachanalysevorrichtung zum Verarbeiten einer Eingangsphrase, die folgendes umfasst: Mittel zum Bereitstellen einer Vielzahl von Grammatiken (140, 142), die für vorbestimmte Themen indikativ sind; einen Parsewaldgenerator zum Generieren einer Vielzahl von Parsewäldern (150, 152), zusammenhängend mit der Eingangsphrase (118) unter Verwendung der Grammatiken; einen Etikettengenerator zum Assoziieren von Etiketten (164, 166) mit Wörtern in der Eingangsphrase (118), unter Verwendung der generierten Parsewälder (150, 152); einen Etikettenbewertungsgenerator zum Generieren von Bewertungen für die Etiketten (164, 166), basierend auf Attributen der Parsewälder; und einen Etikettenauswähler zum Auswählen von Etiketten zur Verwendung als geparste Darstellung (180) der Eingangsphrase (118), basierend auf den generierten Bewertungen.
  23. Sprachanalysevorrichtung nach Anspruch 22, wobei der Parsewaldgenerator über eine Vielzahl von Iterationen ausgeführt wird, so dass jede Iteration andere Parsewälder produziert.
  24. Sprachanalysevorrichtung nach Anspruch 22, wobei der Parsewaldgenerator über eine Vielzahl von Iterationen ausgeführt wird, so dass jede Iteration andere Parsewälder bezüglich jeder der Grammatiken produziert.
  25. Sprachanalysevorrichtung nach Anspruch 22, wobei der Etikettenbewertungsgenerator, basierend auf bewertungsbasierten Faktoren, die aus der Anzahl von Endstellen, Lückengröße, Tiefe, Anzahl von Nicht-Endstellen und Kombinationen derselben bestehenden Gruppe ausgewählt werden, Bewertungen für die Etiketten generiert.
  26. Sprachanalysevorrichtung nach Anspruch 25, wobei der Etikettenbewertungsgenerator mindestens zwei der Faktoren unterschiedlich gewichtet.
  27. Sprachanalysevorrichtung nach Anspruch 26, wobei der Etikettenbewertungsgenerator Kontextinformationen nutzt, um mindestens zwei der Faktoren unterschiedlich zu gewichten.
  28. Sprachanalysevorrichtung nach Anspruch 27, der weiter folgendes umfasst: ein Spracherkennungsmodul zum Ausführen von Spracherkennung der Eingabephrase und zum Generieren eines Wortvertrauensvektors für die Eingangsphrase, wobei im Wesentlichen der Etikettenbewertungsgenerator mindestens zwei der Faktoren, basierend auf dem generierten Wortvertrauensvektor unterschiedlich gewichtet.
  29. Sprachanalysevorrichtung nach Anspruch 27 oder 28, der weiter folgendes umfasst: einen Dialogverwalter zum Generieren einer Anforderung nach Informationen, zusammenhängend mit einem vorbestimmten Thema, wobei der Dialogverwalter Dialogkontextgewichte, basierend auf der generierten Anforderung nach Informationen generiert, wobei der Etikettenbewertungsgenerator mindestens zwei der Faktoren, basierend auf den generierten Dialogkontextgewichten unterschiedlich gewichtet.
  30. Sprachanalysevorrichtung nach Anspruch 22, der weiter folgendes umfasst: einen Etikettenbewertungsgenerator zum Generieren von Bewertungen für die Etiketten; und einen Etikettenauswähler zum Auswählen von N-besten Etiketten für die Verwendung in der geparsten Darstellung, basierend auf den generierten Bewertungen.
  31. Sprachanalysevorrichtung nach Anspruch 30, wobei der Parsewaldgenerator und der Etikettengenerator über eine Vielzahl von Iterationen ausgeführt werden, wobei die ausgewählten N-besten Etiketten einer ersten Iteration als Eingabe für den Parsewaldgenerator und den Etikettengenerator während einer zweiten Iteration verwendet werden.
  32. Sprachanalysevorrichtung nach Anspruch 22, wobei die Etiketten indikativ für die Themen der Grammatiken sind.
  33. Sprachanalysevorrichtung nach Anspruch 22, wobei die Eingangsphrase bezüglich mindestens eines Teils der Eingangsphrase grammatikalisch inkorrekt ist, wobei die Parsewaldgeneratoren unter Verwendung der Grammatiken eine Vielzahl von Parsewäldern, zusammenhängend mit der grammatikalisch inkorrekten Eingangsphrase generieren, wobei der Etikettengenerator unter Verwendung der generierten Parsewälder Etiketten mit Wörtern in der grammatikalisch inkorrekten Phrase assoziiert, wobei die Etiketten als geparste Darstellung der grammatikalisch inkorrekten Eingangsphrase mit den Wörtern assoziiert werden.
  34. Sprachanalysevorrichtung nach Anspruch 22, wobei die Grammatiken auf links-rechts kontextsensitiven Grammatiken basieren.
  35. Sprachanalysevorrichtung nach Anspruch 22, wobei die Grammatiken auf links-rechts kontextsensitiven Grammatiken basieren und Mehrdeutigkeiten enthalten.
  36. Sprachanalysevorrichtung nach Anspruch 22, die weiter folgendes umfasst: einen lexikalischen Filter zum Filtern der Eingangsphrase, wobei der Parsewaldgenerator die Vielzahl von Parsewäldern, basierend auf der gefilterten Eingangsphrase generiert.
  37. Sprachanalysevorrichtung nach Anspruch 22, die weiter folgendes umfasst: einen semantischen Extraktor zum Ausziehen semantischer Komponenten aus der Eingangsphrase, basierend auf den Etiketten, die mit den Wörtern assoziiert sind.
  38. Sprachanalysevorrichtung nach Anspruch 37, die weiter folgendes umfasst: einen globalen Parser zum Ausziehen der semantischen Komponenten aus der Eingangsphrase, basierend auf den Etiketten, die mit den Wörtern assoziiert sind.
  39. Sprachanalysevorrichtung nach Anspruch 38, die weiter folgendes umfasst: einen Dialogverwalter zum Verwalten, basierend auf den ausgezogenen semantischen Komponenten, des Austauschs von Dialog zwischen einer Spracherkennungsvorrichtung und einem Anwender.
  40. Sprachanalysevorrichtung nach Anspruch 39, die weiter folgendes umfasst: einen Dialogverwalter zum Verwalten, basierend auf den ausgezogenen semantischen Komponenten, des Austauschs von Dialog zwischen zwei Anwendern, die verschiedene Sprachen sprechen.
DE60014743T 1999-04-07 2000-03-08 Verfahren und Vorrichtung zur Analyse natürlicher Sprache Expired - Fee Related DE60014743T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/287,810 US6631346B1 (en) 1999-04-07 1999-04-07 Method and apparatus for natural language parsing using multiple passes and tags
US287810 2002-11-05

Publications (2)

Publication Number Publication Date
DE60014743D1 DE60014743D1 (de) 2004-11-18
DE60014743T2 true DE60014743T2 (de) 2005-10-13

Family

ID=23104455

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60014743T Expired - Fee Related DE60014743T2 (de) 1999-04-07 2000-03-08 Verfahren und Vorrichtung zur Analyse natürlicher Sprache

Country Status (4)

Country Link
US (1) US6631346B1 (de)
EP (1) EP1043711B1 (de)
DE (1) DE60014743T2 (de)
ES (1) ES2228408T3 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210279783A1 (en) * 2014-09-30 2021-09-09 Ebay Inc. Garment Size Mapping

Families Citing this family (259)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1109152A1 (de) * 1999-12-13 2001-06-20 Sony International (Europe) GmbH Verfahren zur Spracherkennung unter Verwendung von semantischen und pragmatischen Informationen
US7010489B1 (en) * 2000-03-09 2006-03-07 International Business Mahcines Corporation Method for guiding text-to-speech output timing using speech recognition markers
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20030023435A1 (en) * 2000-07-13 2003-01-30 Josephson Daryl Craig Interfacing apparatus and methods
TW472232B (en) * 2000-08-11 2002-01-11 Ind Tech Res Inst Probability-base fault-tolerance natural language understanding method
US7162422B1 (en) * 2000-09-29 2007-01-09 Intel Corporation Apparatus and method for using user context information to improve N-best processing in the presence of speech recognition uncertainty
US7149695B1 (en) * 2000-10-13 2006-12-12 Apple Computer, Inc. Method and apparatus for speech recognition using semantic inference and word agglomeration
US6879950B1 (en) * 2000-10-19 2005-04-12 Motorola, Inc. System and method of decoding a packed representation of multiple parses
US20020087316A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented grammar-based speech understanding method and system
US20020087313A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented intelligent speech model partitioning method and system
US20020087309A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented speech expectation-based probability method and system
US7574362B2 (en) * 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
CA2408624A1 (en) * 2001-03-14 2002-09-19 At&T Corp. Method for automated sentence planning
US7072837B2 (en) * 2001-03-16 2006-07-04 International Business Machines Corporation Method for processing initially recognized speech in a speech recognition session
US6859771B2 (en) * 2001-04-23 2005-02-22 Microsoft Corporation System and method for identifying base noun phrases
US7003444B2 (en) * 2001-07-12 2006-02-21 Microsoft Corporation Method and apparatus for improved grammar checking using a stochastic parser
TW518483B (en) * 2001-08-14 2003-01-21 Ind Tech Res Inst Phrase verification method using probability-oriented confidence tag
US7308404B2 (en) * 2001-09-28 2007-12-11 Sri International Method and apparatus for speech recognition using a dynamic vocabulary
US7533020B2 (en) * 2001-09-28 2009-05-12 Nuance Communications, Inc. Method and apparatus for performing relational speech recognition
US6996519B2 (en) * 2001-09-28 2006-02-07 Sri International Method and apparatus for performing relational speech recognition
US6963832B2 (en) * 2001-10-09 2005-11-08 Hewlett-Packard Development Company, L.P. Meaning token dictionary for automatic speech recognition
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US20030154071A1 (en) * 2002-02-11 2003-08-14 Shreve Gregory M. Process for the document management and computer-assisted translation of documents utilizing document corpora constructed by intelligent agents
US7805302B2 (en) * 2002-05-20 2010-09-28 Microsoft Corporation Applying a structured language model to information extraction
US7546382B2 (en) * 2002-05-28 2009-06-09 International Business Machines Corporation Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
TW559783B (en) * 2002-05-31 2003-11-01 Ind Tech Res Inst Error-tolerant natural language understanding system and method integrating with confidence measure
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7353165B2 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US20030115062A1 (en) * 2002-10-29 2003-06-19 Walker Marilyn A. Method for automated sentence planning
US7318022B2 (en) * 2003-06-12 2008-01-08 Microsoft Corporation Method and apparatus for training a translation disambiguation classifier
US7475010B2 (en) * 2003-09-03 2009-01-06 Lingospot, Inc. Adaptive and scalable method for resolving natural language ambiguities
US7395497B1 (en) * 2003-10-31 2008-07-01 Emc Corporation System and methods for processing large datasets
US7853451B1 (en) * 2003-12-18 2010-12-14 At&T Intellectual Property Ii, L.P. System and method of exploiting human-human data for spoken language understanding systems
US20050216256A1 (en) * 2004-03-29 2005-09-29 Mitra Imaging Inc. Configurable formatting system and method
WO2006076398A2 (en) * 2005-01-12 2006-07-20 Metier Ltd Predictive analytic method and apparatus
KR100679043B1 (ko) * 2005-02-15 2007-02-05 삼성전자주식회사 음성 대화 인터페이스 장치 및 방법
US8041570B2 (en) * 2005-05-31 2011-10-18 Robert Bosch Corporation Dialogue management using scripts
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
WO2007027989A2 (en) 2005-08-31 2007-03-08 Voicebox Technologies, Inc. Dynamic speech sharpening
US8265939B2 (en) * 2005-08-31 2012-09-11 Nuance Communications, Inc. Hierarchical methods and apparatus for extracting user intent from spoken utterances
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US8229745B2 (en) * 2005-10-21 2012-07-24 Nuance Communications, Inc. Creating a mixed-initiative grammar from directed dialog grammars
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7879846B2 (en) * 2006-09-21 2011-02-01 Kyorin Pharmaceutical Co.., Ltd. Serine hydrolase inhibitors
US9588958B2 (en) * 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US9495358B2 (en) * 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US9093073B1 (en) * 2007-02-12 2015-07-28 West Corporation Automatic speech recognition tagging
US20080221870A1 (en) * 2007-03-08 2008-09-11 Yahoo! Inc. System and method for revising natural language parse trees
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9286385B2 (en) * 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US7945441B2 (en) * 2007-08-07 2011-05-17 Microsoft Corporation Quantized feature index trajectory
US8135578B2 (en) * 2007-08-24 2012-03-13 Nuance Communications, Inc. Creation and use of application-generic class-based statistical language models for automatic speech recognition
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8065293B2 (en) * 2007-10-24 2011-11-22 Microsoft Corporation Self-compacting pattern indexer: storing, indexing and accessing information in a graph-like data structure
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8296144B2 (en) * 2008-06-04 2012-10-23 Robert Bosch Gmbh System and method for automated testing of complicated dialog systems
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8762969B2 (en) * 2008-08-07 2014-06-24 Microsoft Corporation Immutable parsing
US20100057452A1 (en) * 2008-08-28 2010-03-04 Microsoft Corporation Speech interfaces
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8190423B2 (en) * 2008-09-05 2012-05-29 Trigent Software Ltd. Word sense disambiguation using emergent categories
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US8090770B2 (en) * 2009-04-14 2012-01-03 Fusz Digital Ltd. Systems and methods for identifying non-terrorists using social networking
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8874434B2 (en) * 2010-06-02 2014-10-28 Nec Laboratories America, Inc. Method and apparatus for full natural language parsing
CN101894549A (zh) * 2010-06-24 2010-11-24 中国科学院声学研究所 一种语音识别应用领域中的置信度快速计算方法
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
US8473300B1 (en) * 2012-09-26 2013-06-25 Google Inc. Log mining to modify grammar-based text processing
US9472189B2 (en) 2012-11-02 2016-10-18 Sony Corporation Language processing method and integrated circuit
US9154629B2 (en) * 2012-12-14 2015-10-06 Avaya Inc. System and method for generating personalized tag recommendations for tagging audio content
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
EP2973002B1 (de) 2013-03-15 2019-06-26 Apple Inc. Anwenderschulung durch einen intelligenten digitalen assistenten
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR102057795B1 (ko) 2013-03-15 2019-12-19 애플 인크. 콘텍스트-민감성 방해 처리
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
US9177553B1 (en) * 2013-06-25 2015-11-03 Google Inc. Identifying underserved command inputs
US9183196B1 (en) * 2013-06-25 2015-11-10 Google Inc. Parsing annotator framework from external services
US10339216B2 (en) * 2013-07-26 2019-07-02 Nuance Communications, Inc. Method and apparatus for selecting among competing models in a tool for building natural language understanding models
US10229106B2 (en) * 2013-07-26 2019-03-12 Nuance Communications, Inc. Initializing a workspace for building a natural language understanding system
CN103400579B (zh) * 2013-08-04 2015-11-18 徐华 一种语音识别系统和构建方法
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US9747280B1 (en) * 2013-08-21 2017-08-29 Intelligent Language, LLC Date and time processing
US10102851B1 (en) * 2013-08-28 2018-10-16 Amazon Technologies, Inc. Incremental utterance processing and semantic stability determination
US10162813B2 (en) 2013-11-21 2018-12-25 Microsoft Technology Licensing, Llc Dialogue evaluation via multiple hypothesis ranking
US10832005B1 (en) 2013-11-21 2020-11-10 Soundhound, Inc. Parsing to determine interruptible state in an utterance by detecting pause duration and complete sentences
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10180989B2 (en) 2015-07-24 2019-01-15 International Business Machines Corporation Generating and executing query language statements from natural language
US10332511B2 (en) * 2015-07-24 2019-06-25 International Business Machines Corporation Processing speech to text queries by optimizing conversion of speech queries to text
US10339916B2 (en) 2015-08-31 2019-07-02 Microsoft Technology Licensing, Llc Generation and application of universal hypothesis ranking model
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US9436446B1 (en) * 2015-11-16 2016-09-06 International Business Machines Corporation System for automating calculation of a comprehensibility score for a software program
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10224034B2 (en) * 2016-02-03 2019-03-05 Hua Xu Voice recognition system and construction method thereof
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
KR20180079759A (ko) * 2017-01-02 2018-07-11 삼성전자주식회사 텍스트를 인식하는 방법 및 단말기
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10528664B2 (en) 2017-11-13 2020-01-07 Accenture Global Solutions Limited Preserving and processing ambiguity in natural language
US10636421B2 (en) 2017-12-27 2020-04-28 Soundhound, Inc. Parse prefix-detection in a human-machine interface
US11281864B2 (en) * 2018-12-19 2022-03-22 Accenture Global Solutions Limited Dependency graph based natural language processing
US10747958B2 (en) * 2018-12-19 2020-08-18 Accenture Global Solutions Limited Dependency graph based natural language processing
US11705114B1 (en) * 2019-08-08 2023-07-18 State Farm Mutual Automobile Insurance Company Systems and methods for parsing multiple intents in natural language speech
US11810558B2 (en) * 2021-05-26 2023-11-07 International Business Machines Corporation Explaining anomalous phonetic translations

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418717A (en) * 1990-08-27 1995-05-23 Su; Keh-Yih Multiple score language processing system
US5745776A (en) * 1995-04-19 1998-04-28 Sheppard, Ii; Charles Bradford Enhanced electronic dictionary

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210279783A1 (en) * 2014-09-30 2021-09-09 Ebay Inc. Garment Size Mapping
US11734740B2 (en) * 2014-09-30 2023-08-22 Ebay Inc. Garment size mapping

Also Published As

Publication number Publication date
DE60014743D1 (de) 2004-11-18
US6631346B1 (en) 2003-10-07
EP1043711B1 (de) 2004-10-13
EP1043711A2 (de) 2000-10-11
EP1043711A3 (de) 2003-09-17
ES2228408T3 (es) 2005-04-16

Similar Documents

Publication Publication Date Title
DE60014743T2 (de) Verfahren und Vorrichtung zur Analyse natürlicher Sprache
DE60017000T2 (de) Verfahren zur zielorientierten Sprachübersetzung mittels Extraktion der Bedeutung und Dialog
DE60123952T2 (de) Erzeugung von einem einheitlichen aufgabeabhängigen sprachmodell mittels informationsauffindungverfahren
DE69816676T2 (de) System und verfahren zur bestimmung und minimalisierung eines endlichen transducers zur spracherkennung
Andersen et al. Automatic extraction of facts from press releases to generate news stories
DE60033733T2 (de) Datenbankabfragesystem basierend auf Spracherkennung
DE60016722T2 (de) Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
DE69937176T2 (de) Segmentierungsverfahren zur Erweiterung des aktiven Vokabulars von Spracherkennern
EP0925578B1 (de) Sprachverarbeitungssystem und verfahren zur sprachverarbeitung
DE69928181T2 (de) Verfahren und Vorrichtung zur Spracherkennung unter Verwendung einer Wissensbasis
DE60124559T2 (de) Einrichtung und verfahren zur spracherkennung
DE112013006770B4 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
US20090210411A1 (en) Information Retrieving System
DE102004003878A1 (de) System und Verfahren zum Identifizieren eines speziellen Wortgebrauchs in einem Dokument
DE60109999T2 (de) Spracherkennung mittels lexikalischer Bäumen
DE112014005354T5 (de) Dialog-management-system und dialog-management-verfahren
DE102005029869A1 (de) Verfahren und Vorrichtung zur Anruflenkung für natürliche Sprache unter Verwendung von Vertrauenswertungen
DE19721198A1 (de) Statistisches Sprachmodell für flektierende Sprachen
DE60202847T2 (de) Abfragesystem in natürlicher sprache für den zugriff auf ein informationssystem
DE202017106303U1 (de) Bestimmen phonetischer Beziehungen
DE602004004310T2 (de) System mit kombiniertem statistischen und regelbasierten Grammatikmodell zur Spracherkennung und zum Sprachverstehen
DE69917960T2 (de) Phonembasierte Sprachsynthese
EP1239460B1 (de) Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem
DE112016006512T5 (de) Absichtseinschätzungsvorrichtung und Absichtseinschätzungsverfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee