DE10127559A1 - Benutzergruppenspezifisches Musterverarbeitungssystem - Google Patents

Benutzergruppenspezifisches Musterverarbeitungssystem

Info

Publication number
DE10127559A1
DE10127559A1 DE2001127559 DE10127559A DE10127559A1 DE 10127559 A1 DE10127559 A1 DE 10127559A1 DE 2001127559 DE2001127559 DE 2001127559 DE 10127559 A DE10127559 A DE 10127559A DE 10127559 A1 DE10127559 A1 DE 10127559A1
Authority
DE
Germany
Prior art keywords
user
user group
specific
group
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE2001127559
Other languages
English (en)
Inventor
Peter Beyerlein
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Corporate Intellectual Property GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Corporate Intellectual Property GmbH filed Critical Philips Corporate Intellectual Property GmbH
Priority to DE2001127559 priority Critical patent/DE10127559A1/de
Priority to EP02735724A priority patent/EP1402518B1/de
Priority to JP2003502817A priority patent/JP4837887B2/ja
Priority to PCT/IB2002/002055 priority patent/WO2002099785A1/en
Priority to US10/479,554 priority patent/US20040148165A1/en
Priority to AT02735724T priority patent/ATE340399T1/de
Priority to DE2002614850 priority patent/DE60214850T2/de
Publication of DE10127559A1 publication Critical patent/DE10127559A1/de
Priority to US13/589,394 priority patent/US9009043B2/en
Priority to US14/637,049 priority patent/US9424838B2/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Silicon Polymers (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Macromonomer-Based Addition Polymer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Collating Specific Patterns (AREA)

Abstract

Die Erfindung bezieht sich auf ein Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung, mit den Verfahrensschritten: DOLLAR A - Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und DOLLAR A - Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80...81) für die Verarbeitung (110) einer Mustereingabe des Benutzers.

Description

Die Erfindung bezieht sich auf ein Musterverarbeitungssystem und insbesondere auf ein Sprachverarbeitungssystem. Musterverarbeitungssysteme und insbesondere solche mit Spracherkennung werden an vielen Stellen und für viele Anwendungen eingesetzt. Beispiele sind die über Telefon erreichbaren automatischen Auskunfts- und Transaktions­ systeme, z. B. die automatische Fahrplanauskunft der niederländischen Openbaar Vervoer Reisinformatie (OVR) oder die Telefonbankingsysteme vieler Banken, sowie die in der Stadt Wien aufgestellten Informationskioske der Firma Philips, an denen ein Benutzer mit Hilfe von Tastatur- und Spracheingaben z. B. Informationen über die Wiener Sehens­ würdigkeiten und Hotels erhalten kann.
Sollen Musterverarbeitungssysteme von vielen Benutzern verwendet werden, werden in der Regel für die Musterverarbeitung so genannte benutzerunabhängige Musterverarbeitungs­ datensätze verwendet. D. h., bei der Verarbeitung von Mustern unterschiedlicher Benutzer wird kein Unterschied zwischen den Benutzern gemacht, im Falle der Spracherkennung werden so z. B. für alle Sprecher dieselben akustischen Referenzmodelle verwendet. Dem Fachmann ist jedoch bekannt, dass die Qualität der Musterverarbeitung durch die Ver­ wendung benutzerspezifischer Musterverarbeitungsdatensätze verbessert wird. Z. B. steigt die Genauigkeit von Spracherkennungssystemen, wenn man für einen Sprecher eine speziell auf ihn abgestimmte Vokaltraktlängennormierung seiner sprachlichen Äußerungen durchführt.
Solche sprecherabhängigen Spracherkennungssysteme werden auch bereits weitgehend in Anwendungen mit kleinen Benutzerzahlen eingesetzt. Beispiele sind persönliche Diktiersysteme, z. B. FreeSpeech von Philips, oder die professionellen Diktiersysteme für geschlossene Benutzergruppen,, z. B. SpeechMagic von Philips für den Bereich der Rönt­ genologie. Einer Übertragung dieser Techniken auf Musterverarbeitungssysteme mit vielen Benutzern stehen jedoch verschiedene Hemmnisse im Wege.
Zum einen würde die große Zahl der Benutzer eines solchen Systems zu einem hohen Speicherbedarf für die benutzerspezifischen Musterverarbeitungsdatensätze führen. Zum anderen muss davon ausgegangen werden, dass eine größere Zahl der Benutzer nicht bereit wäre, den Trainingsaufwand für die Erstellung ihrer benutzerspezifischen Musterverarbei­ tungsdatensätze auf sich zu nehmen. Da sich nämlich die Musterverarbeitungssysteme der einzelnen Hersteller und teilweise auch die einzelnen Produkte eines Herstellers von­ einander unterscheiden, und daher die benutzerspezifischen Musterverarbeitungsdaten­ sätze nicht zwischen den Systemen austauschbar sind, wäre dieser Trainingsaufwand für nahezu jedes System nötig, das ein Benutzer verwenden will.
In den Patent Abstracts of Japan, JP 08-123461 A wird daher vorgeschlagen, dass ein Benutzer eine persönliche Informationskarte (individual information card) bei sich trägt, welche die für ihn charakteristischen Daten (individual information data) aufnimmt. Um dann die Sprachverarbeitung (speech processing) eines entsprechenden Systems (speech interface system) auf sich zu spezialisieren (specializing the system for the individual), schiebt er z. B. seine Informationskarte in einen Schlitz des Systems. Dieses liest seine Daten von der Karte und führt mit ihnen eine benutzerabhängige Verarbeitung seiner sprachlichen Äußerungen durch.
Die Verwendung einer persönlichen Informationskarte löst also die Problematik des hohen Speicherbedarfs und des mehrfachen Erstellens benutzerspezifischer Daten, vorausgesetzt die Hersteller der Sprachverarbeitungssysteme unterstützen die Verwendung der Karte an ihren Systemen. Sie schafft jedoch die Notwendigkeit, dass ein Benutzer seine Karte zur Systemnutzung stets bei sich führen und jedes System eine Eingabevorrichtung für die Karte vorsehen muss. Beispielsweise ist sie für die Nutzung eines telefonischen Auskunfts­ systems nicht einsetzbar.
Aufgabe der Erfindung ist es daher, ein Musterverarbeitungssystem, insbesondere ein Sprachverarbeitungssystem, der eingangs genannten Art mit einer den benutzerspezifischen Musterverarbeitungssystemen vergleichbaren Qualität zu schaffen, das die Problematik des hohen Speicherbedarfs und des mehrfachen Erstellens benutzerspezifischer Daten löst, ohne dass der Benutzer zur Systembenutzung zusätzlicher Ausrüstung wie z. B. einer Informationskarte bedarf, und das auch mit bisherigen Benutzerterminals wie z. B. dem Telefon benutzt werden kann.
Diese Aufgabe wird gelöst einerseits durch ein Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung mit den Verfahrensschritten:
  • - Entgegennahme einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
  • - Verwendung eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes für die Verarbeitung einer Mustereingabe des Benutzers,
und andererseits durch ein Musterverarbeitungssystem, insbesondere ein Sprachver­ arbeitungssystem, das
  • - zur Entgegennahme einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
  • - zur Verwendung eines für die Benutzergruppe spezifischen Musterverarbeitungs­ datensatzes für die Verarbeitung einer Mustereingabe des Benutzers
vorgesehen ist.
Durch die Einteilung der Benutzer in Benutzergruppen wird die Problematik des hohen Speicherbedarfes vermieden. Darüber hinaus können die benutzergruppenspezifischen Musterverarbeitungsdatensätze auch auf zentralen Datenspeichern untergebracht und über ein Netzwerk den Musterverarbeitungsvorrichtungen zur Verfügung gestellt werden. Damit ergeben sich durch die Vermeidung mehrfacher Datenhaltung weitere Möglich­ keiten der Speicherersparnis. Die Mehrfachverwendung der benutzergruppenspezifischen Musterverarbeitungsdatensätze in mehreren Systemen vermeidet die Problematik einer mehrfachen Festlegung der Benutzergruppe für den Benutzer.
Zur Benutzung des benutzergruppenspezifischen Musterverarbeitungssystems muss ein Benutzer dem System nur seine Benutzergruppe z. B. durch eine Nummer oder einen symbolischen Namen mitteilen. Während die Benutzergruppeninformation auch auf einer Chipkarte untergebracht werden kann, genügt es zur Benutzung z. B. eines telefonischen Auskunftssystems auch, dem System die Benutzergruppe verbal mitzuteilen oder z. B. bei einer numerischen Kodierung die Nummer über die Tastatur eines DTMF-fähigen Telefons einzugeben. Damit lässt sich ein solches benutzergruppenspezifisches Musterver­ arbeitungssystem auch ohne zusätzliche Ausrüstung wie z. B. einer Informationskarte und auch mit bisherigen Benutzerterminals wie z. B. einem Telefon benutzen.
Die Festlegung der Benutzergruppe für einen Benutzer kann, wie in Anspruch 2 bean­ sprucht, in einer Trainingsphase erfolgen, in welcher der Benutzer z. B. einen vorge­ gebenen Text sprechen muss, den ein Trainingssystem aufnimmt und zur Bestimmung der Benutzergruppe verwendet. Diese Trainingsphase kann unabhängig von einer Benutzung eines benutzergruppenspezifischen Musterverarbeitungssystems erfolgen. Sie kann jedoch einem "neuen" Benutzer, d. h. einem Benutzer, dem noch keine Benutzergruppe zuge­ wiesen wurde, auch bei Benutzung des Systems angeboten werden. Weiter ist es denkbar, die während der Systembenutzung anfallenden Mustereingaben des Benutzers, die vielleicht zunächst mit einer benutzerunabhängigen Musterverarbeitung behandelt wurden, für die erstmalige oder auch die Neufestlegung der Benutzergruppe zu verwenden. Letzteres könnte sich ergeben, wenn sich die Mustercharakteristik des Benutzers oder die Benutzergruppen des Systems verändert haben.
Dem Fachmann sind z. B. aus der Literatur zahlreiche Verfahren aus dem Bereich der Benutzeradaption bekannt, um eine solche Festlegung der Benutzergruppe vorzunehmen. Manche dieser Verfahren wie z. B. das "speaker clustering" aus der Spracherkennung führen dabei unmittelbar auf eine Benutzergruppe. Andere wie z. B. "adaptive speaker clustering", MLLR oder MAP aus der Spracherkennung oder auch die "eigenfaces" aus der Bilderkennung werden üblicherweise eingesetzt, um benutzerspezifische Musterver­ arbeitungsdatensätze zu erhalten. Durch eine Quantelung, d. h. durch eine Beschränkung der benutzerspezifischen Adaptionsparameter auf bestimmte Stufen, lässt sich jedoch die Auflösung der Adaptionsverfahren so weit vergröbern, dass sich die gewünschte Anzahl an Benutzergruppen einstellt.
Im Anspruch 3 wird beansprucht, dass die Festlegung der Benutzergruppe für den Benutzer durch den Benutzer beeinflussbar ist. Es ist dabei z. B. denkbar, dass ein System Benutzergruppen unterschiedlicher Güte anbietet. So kann ein System beispielsweise Benutzergruppen hoher Güte anbieten, indem es für diese Gruppen z. B. sehr fein aufgelöste akustische Referenzmodelle anbietet und sich in einer solchen Benutzergruppe nur Benutzer sehr ähnlicher Sprech- und Verhaltensweisen befinden. Dadurch könnten einer solchen Benutzergruppe z. B. bei einer Spracherkennung annähernd gute Erken­ nungsgenauigkeiten geboten werden, wie dies bei benutzerabhängigen Systemen der Fall wäre. Der dazu im System notwendige höhere Aufwand könnte über eine entsprechende Preistarifstruktur an die Benutzer weitergegeben werden.
Die Unteransprüche 4 und 5 beziehen sich auf zwei vorteilhafte Möglichkeiten der Benutzereingabe. Zum einen können Benutzereingaben an einem öffentlichen Benutzer­ terminal wie z. B. einem eingangs erwähnten Informationskiosk oder aber einem Bank­ automaten gemacht werden. Zum anderen kann ein Benutzer ein Telefon oder auch einen PC oder Laptop benutzen, wobei seine Eingaben über ein Netzwerk, z. B. das Telefonnetz oder das Internet, übermittelt werden.
Der Unteranspruch 6 spezifiziert einige mögliche Bestandteile eines benutzergruppen­ spezifischen Musterverarbeitungsdatensatzes:
  • - eine benutzergruppenspezifische Sprache und/oder Dialekt,
  • - eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
  • - ein benutzergruppenspezifisches akustisches Referenzmodell,
  • - ein benutzergruppenspezifisches Vokabular,
  • - ein benutzergruppenspezifsches Sprachmodell und/oder
  • - ein benutzergruppenspezifisches Dialogmodell.
Dies sind typische Bestandteile eines solchen Datensatzes, der beispielsweise für eine benutzergruppenspezifische Spracherkennung verwendet werden kann. Dabei können die akustischen Referenzmodelle z. B. in der Form so genannter Hidden-Markov-Modelle für die Laute einer Sprache vorliegen. Benutzergruppenspezifische Vokabularien enthalten z. B. die typischerweise von einer Benutzergruppe für eine Anwendung verwendeten Wörter. Sprachmodelle können alle Beziehungen zur Bildung einer Wortfolge also beispielsweise auch grammatische Regeln oder semantische Präferenzen der Benutzer­ gruppe umfassen, während Dialogmodelle die kennzeichnenden Muster der Interaktion zwischen dem System und Benutzern einer Benutzergruppe angeben.
Neben der Spracherkennung umfasst die Erfindung auch andere Arten der benutzer­ gruppenspezifischen Musterverarbeitung wie beispielsweise die benutzergruppenspezifische Sprachkodierung, z. B. durch Verwendung benutzergruppenspezifischer Kodebücher. Aber auch die benutzergruppenspezifische Handschrifterkennung und Mimikverarbeitung, z. B. in Systemen zum "Online-Chatten" mit animierten Charakteren, so genannten Avataren, fällt in den Bereich der Erfindung.
Im Anspruch 7 wird beansprucht, das System zur Beschaffung von Informationen wie z. B. Fahrplan- oder touristischen Auskünften zu benutzen. Weiter wird beansprucht, das System zu verwenden für die Vergabe von Aufträgen wie z. B. für das Tätigen von Ein­ käufen an einem Automaten oder das Erledigen von Bankgeschäften über das Internet.
Diese und weitere Aspekte und Vorteile der Erfindung werden im Folgenden an Hand der Ausführungsbeispiele und insbesondere an Hand der beigefügten Zeichnungen näher erläutert. Es zeigen:
Fig. 1 und 2 Ausführungsformen des erfindungsgemäßen benutzergruppenspezifischen Musterverarbeitungssystems,
Fig. 3 eine schematische Darstellung des Inhalts eines Datenspeichers für die benutzergruppenspezifischen Musterverarbeitungsdatensätze,
Fig. 4 den Ablauf einer Benutzung eines erfindungsgemäßen benutzergruppenspezifischen Musterverarbeitungssystems in Form eines Flussdiagramms.
Die Fig. 1 zeigt eine Ausführungsform des erfindungsgemäßen benutzergruppen­ spezifischen Musterverarbeitungssystems, das für die Benutzereingaben ein öffentliches Benutzerterminal 10 vorsieht. Typische Anwendungen einer solcher Ausführungsform der Erfindung sind die Erledigung von Bankgeschäften an Bankautomaten 10, der Abruf von Informationen an den eingangs erwähnten Informationskiosken 10 oder auch der Kauf von Fahrkarten an Fahrkartenautomaten 10.
Das öffentliche Benutzerterminal 10 verfügt über eine graphische Ausgabeeinheit (Dis­ play) 11, eine Eingabetastatur 12, ein Mikrofon 13 zur Eingabe sprachlicher Äußerungen eines Benutzers und einen Eingabeschlitz 14 für eine benutzereigene Chipkarte 70, z. B. eine EC- oder Kundenkarte. Weiterhin enthält es eine lokale Spracherkennungsvor­ richtung 42, die über einen lokalen Datenspeicher 32 zur Speicherung von benutzer­ gruppenspezifischen Musterverarbeitungsdatensätzen zur benutzergruppenspezifischen Sprachverarbeitung verfügt. Auf der benutzereigenen Chipkarte 70, die zur Benutzung des Systems in den Eingabeschlitz 14 eingeschoben wird, befindet sich z. B. ein Chip 71 zur Speicherung für die Anwendung typischer Daten, beispielsweise für eine Bankkarte die Kontonummer des Girokontos, sowie ein weiterer Chip 72 zur Speicherung einer ein­ deutigen Kennzeichnung der für die benutzergruppenspezifische Sprachverarbeitung festgelegten Benutzergruppe des Benutzers.
Eine solche eindeutige Kennzeichnung kann z. B. aus einer Nummer bestehen, denkbar ist aber auch ein symbolischer Name, beispielsweise der Name einer öffentlich bekannten Person, die ebenfalls zu dieser Benutzergruppe gehört, so dass ihre Sprachverarbeitungs­ charakteristik typisch für die Benutzergruppe ist. Insbesondere ein solcher symbolischer Name aber auch eine Nummer lassen sich von einem Benutzer gut erinnern, so dass eine solche eindeutige Kennzeichnung dem Musterverarbeitungssystem auch ohne Hilfe einer Chipkarte z. B. über das Mikrofon 13 oder die Eingabetastatur 12 übermittelt werden kann. In diesem Fall entfiele dann der Chip 72 auf der Chipkarte 70. Weiter können alle Informationen auf der Chipkarte 70 inklusive einer eventuellen Benutzergruppenkenn­ zeichnung auch auf einem einzigen Chip 71 untergebracht werden.
Speichert man alle benutzergruppenspezifischen Musterverarbeitungsdatensätze auf dem lokalen Datenspeicher 32, so kann die lokale Spracherkennungsvorrichtung 42 vollständig lokal arbeiten. Ein solcher "stand alone" Automat eignet sich z. B. besonders gut für den Verkauf von Zigaretten oder anderen direkt im Automaten verfügbaren Waren. Das öffentliche Benutzerterminal 10 kann aber auch über ein Netzwerk 20 mit weiteren Datenspeichern 30 . . . 31 zur Speicherung von benutzergruppenspezifischen Musterver­ arbeitungsdatensätzen zur benutzergruppenspezifischen Spracherkennung verbunden werden. Bei dem Netzwerk 20 kann es sich dabei z. B. um ein privates MAN (Metro­ politan Area Network), beispielsweise das Netzwerk einer Bank, handeln. Das Netzwerk 20 kann aber auch durch ein öffentliches Netzwerk und insbesondere durch das Internet reali­ siert werden. Als Mischform sind auch beispielsweise auf Basis des Internets verwirklichte VPNs (Virtual Private Networks) möglich.
Fig. 2 zeigt eine weitere Ausführungsform des erfindungsgemäßen benutzergruppen­ spezifischen Musterverarbeitungssystems. Wie in Fig. 1 sind wieder das Netzwerk 20 und die daran angeschlossenen Datenspeicher 30 . . . 31 dargestellt. Im Gegensatz zu Fig. 1 sind jedoch auch die Spracherkennungsvorrichtungen 40 . . . 41 an das Netzwerk 20 ange­ schlossen. Die Benutzereingaben erfolgen hier an einem öffentlichen Benutzerterminal 10, das jedoch im Gegensatz zu Fig. 1 über keine lokale Spracherkennungsvorrichtung 42 mit lokalem Datenspeicher 32 verfügt, oder über ein Telefon 60 oder auch über einen PC, Laptop oder dergleichen 50, die alle dafür am Netzwerk 20 angeschlossen sind bzw. dazu damit verbunden werden können. Diese und andere Eingabemöglichkeiten wie z. B. das in Fig. 1 gezeigte öffentliche Benutzerterminal 10 mit lokaler Spracherkennungsvorrich­ tung 42 können in einem benutzergruppenspezifischen Musterverarbeitungssystem alle oder auch nur teilweise verwirklicht werden.
Die in den Fig. 1 und 2 dargestellten Szenarien unterscheiden sich also vor allem in der Anordnung der Spracherkennungsvorrichtung 42 bzw. 40 . . . 41, in der die Erkennung der sprachlichen Äußerungen eines Benutzers erfolgt. Die in Fig. 1 lokal im öffentlichen Benutzerterminal 10 untergebrachte Spracherkennungsvorrichtung 42 eignet sich besonders für den Fall, dass nur einfache Kommandos erkannt werden müssen und das öffentliche Benutzerterminal 10 hauptsächlich von immer denselben Kunden benutzt wird. In diesem Fall genügt eine relativ einfache und kostengünstige Spracherkennungsvor­ richtung 42 und zur benutzergruppenspezifischen Spracherkennung können die benutzer­ gruppenspezifischen Musterverarbeitungsdatensätze der Hauptnutzer auf dem lokalen Datenspeicher 32 der Spracherkennungsvorrichtung 42 gehalten werden. Weitere benutzergruppenspezifischen Musterverarbeitungsdatensätze, die z. B. von durchreisenden Benutzern benötigt werden und die nicht lokal im Datenspeicher 32 vorhanden sind, werden von den über das Netzwerk 20 angeschlossenen Datenspeichern 30 . . . 31 geladen. Dadurch ergibt sich insgesamt nur eine geringe Belastung des Netzwerkes 20.
In Fig. 2 erfolgt die Spracherkennung der sprachlichen Äußerungen eines Benutzers in den über das Netzwerk angeschlossenen Spracherkennungsvorrichtungen 40 . . . 41. Dies ist sinnvoll bei komplexeren Sprachäußerungen, die eine hohe Erkennungsleistung erfordern und/oder bei ständig wechselnden Benutzern. Durch die Bündelung der Spracherken­ nungsaufgaben und der Datenhaltung ergeben sich Vorteile in der Maschinenauslastung, dem benötigten Speicherplatz und dem nötigen Datenverkehr über das Netzwerk 20. So kann es z. B. sinnvoll sein, innerhalb des Netzwerkes 20 die Spracherkennungsvorrich­ tungen 40 . . . 41 untereinander und mit den Datenspeichern 30 . . . 31 mit einem breit­ bandigen Subnetz zu verbinden. Auch kann es gegebenenfalls von Vorteil sein, die Erkennung der sprachlichen Äußerungen einzelner Benutzer möglichst immer derselben Spracherkennungsvorrichtung 40 . . . 41 zuzuweisen, die dann die benutzergruppen­ spezifischen Musterverarbeitungsdatensätze dieser Benutzer wieder in lokalen Daten­ speichern halten kann.
Neben den gerade erwähnten Systemausgestaltungen sind für den Fachmann je nach Ein­ satzgebiet auch viele weitere Varianten ohne weiteres ausführbar. Hier soll daher nur noch die Technik der gespiegelten Datenhaltung erwähnt werden, die hinreichend aus der Lehre der verteilten Datenbanken bekannt ist. Dabei werden die Daten eines Benutzers, d. h. hier einer Benutzergruppe, in mehreren, i. d. R räumlich weit getrennten Datenspeichern, z. B. in Fig. 1 in den Speichern 32 und 30 . . . 31, gehalten, um dem Benutzer auch bei hoher Belastung des Netzwerkes 20 schnellen Zugriff auf seine Daten zu gestatten. Die Konsistenz der Datenhaltung in den einzelnen Speichern wird dann durch geeignete Synchronisationsprozeduren sichergestellt, die weniger zeitkritisch sind und ggf. zu Zeiten geringerer Netzwerkbelastung abgearbeitet werden können.
Eine nächste Ausführungsform der Erfindung ergibt sich dadurch, wenn die benutzer­ gruppenspezifischen Musterverarbeitungsdatensätze zur benutzergruppenspezifischen Musterverarbeitung nicht in systemeigenen Datenspeichern gehalten werden, sondern beispielsweise von einem dritten Provider oder auch von einem Benutzer selbst (für seine eigene Benutzergruppe) zur Verfügung gestellt werden. Im ersten Fall können sich dritte Unternehmen auf das Erstellen, Verwalten und/oder Aktualisieren der benutzergruppen­ spezifischen Musterverarbeitungsdatensätze spezialisieren, um diese dann z. B. gegen Lizenzgebühren den Betreibern der benutzergruppenspezifischen Musterverarbeitungs­ systeme zur Verfügung zu stellen. Dritte Unternehmen können sich aber auch um die Festlegung der Benutzergruppenzugehörigkeit für die Benutzer kümmern.
Im zweiten Fall würde ein Benutzer selbst die benutzergruppenspezifischen Musterver­ arbeitungsdatensätze seiner Benutzergruppe z. B. aus einem der Datenspeicher 32, 30 . . . 31 eines benutzergruppenspezifischen Musterverarbeitungssystems herunterladen. Bei Benutzung eines anderen benutzergruppenspezifischen Musterverarbeitungssystems, das nicht selbst über die benutzergruppenspezifischen Musterverarbeitungsdatensätze seiner Benutzergruppe verfügt, kann er diese Daten dann auf dem Laptop 50 dem System zur Verfügung stellen. Allgemein kann er sie jedoch auch über einen an das Netzwerk 20, also insbesondere an das Internet angeschlossenen PC zur Verfügung stellen, wobei er dann dem System die Adresse dieses PC's mitteilen würde. In diesem Szenario übernimmt damit die Mitteilung der Adresse des PC's oder Laptops 50 die Rolle der Mitteilung der ein­ deutigen Kennzeichnung der Benutzergruppe.
Während in den obigen Ausführungsbeispielen als Benutzerendgeräte zum Systemzugang öffentliche Benutzerterminals 10 mittlerer Komplexität, Telefone 60 und PC's oder Lap­ tops 50 benutzt wurden, sind auch andere Lösungen möglich. Beispiele sind Mobiltelefone und Informationskioske mit komplexen multimedialen Interaktionsmöglichkeiten wie Touchscreens, Kameras, Lautsprechern, etc.
Fig. 3 zeigt eine schematische Darstellung des Inhalts eines Datenspeichers 30 für die benutzergruppenspezifischen Musterverarbeitungsdatensätze 80 . . . 81. Bei dem Daten­ speicher 30, der hier stellvertretend steht sowohl für die lokalen Datenspeicher 32 wie auch für die am Netzwerk 20 angeschlossenen weiteren Datenspeicher 30 . . . 31, handelt es sich dabei um einen bekannten Computerdatenspeicher, z. B. eine Festplatte. Die benutzer­ gruppenspezifischen Musterverarbeitungsdatensätze 80 . . . 81 können in Form einzelner Dateien vorliegen, die in für das benutzergruppenspezifische Musterverarbeitungssystem geeigneter Weise z. B. binär kodiert sind. Möglich ist aber auch eine Organisation in Form einer Datenbank oder dergleichen.
Fig. 4 zeigt einen möglichen Ablauf einer Benutzung eines erfindungsgemäßen benutzer­ gruppenspezifischen Musterverarbeitungssystems in Form eines Flussdiagramms. Dabei wird nur auf die Vorgänge eingegangen, die für die benutzergruppenspezifische Musterver­ arbeitung von Bedeutung sind, während anwendungsspezifische Aktionen wie z. B. das Mitteilen einer Kontonummer und einer PIN für eine Bankanwendung hier nicht darge­ stellt sind.
Nach dem Startblock 101 fordert das benutzergruppenspezifische Musterverarbeitungs­ system einen Benutzer im Prozessblock 102 auf, ihm seine Benutzergruppe bekannt zu geben, d. h. dem System eine eindeutige Kennzeichnung der für den Benutzer festgelegten Benutzergruppe für die benutzergruppenspezifische Musterverarbeitung zu übergeben. Nach dem Entscheidungsblock 103 verzweigt die weitere Bearbeitung, je nachdem, ob dem Benutzer seine Benutzergruppe bekannt ist oder nicht.
Kennt der Benutzer seine Benutzergruppe, so teilt er diese im Block 104 dem System mit, indem er z. B. in den Szenarien der Fig. 1 und 2 die Chipkarte 70 in den Eingabeschlitz 14 eines öffentlichen Benutzerterminals 10 schiebt, die Eingabetastatur 12 oder das Mikro­ fon 13 des öffentlichen Benutzerterminals 10 benutzt oder die Benutzergruppe über ein Telefon 60 oder einen Laptop 50 dem System bekannt gibt. Das System sucht dann im Block 105 den zur Benutzergruppe des Benutzers gehörigen benutzergruppenspezifischen Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 auf und stellt ihn einer Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung.
Kennt dagegen der Benutzer seine Benutzergruppe nicht, so fragt ihn das System im Block 106, ob er möchte, dass das System jetzt eine Benutzergruppe für ihn festlegen soll. Möchte er dies, so sammelt das System im Block 107 Trainingsmustereingaben des Benutzers und verarbeitet diese zur Festlegung einer Benutzergruppe für den Benutzer. Im Block 108 wird dem Benutzer die so festgelegte Benutzergruppe mitgeteilt und die Kon­ trolle geht über in den schon beschriebenen Block 105, in dem der zur Benutzergruppe des Benutzers gehörige benutzergruppenspezifische Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 aufgesucht und einer Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung gestellt wird.
Möchte der Benutzer jetzt aber keine Benutzergruppe für sich festlegen lassen, z. B. weil er dazu jetzt keine Zeit hat oder weil ihm bereits eine Benutzergruppe zugewiesen wurde, deren eindeutige Kennzeichnung er jedoch im Moment nicht zur Verfügung hat, so ver­ zweigt die Kontrolle nach Block 106 zu Block 109. Dort wird ein benutzerunabhängiger Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 aufgesucht und einer Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung gestellt, so dass die nach­ folgenden Musterverarbeitungsschritte dann unabhängig von den speziellen Charakteristika des Benutzers durchgeführt werden.
Der der Musterverarbeitungsvorrichtung 42, 40 . . . 41 in einem der Blöcke 105 bzw. 109 zur Verfügung gestellte benutzergruppenspezifische bzw. benutzerunabhängige Musterver­ arbeitungsdatensatz kann dabei noch von weiteren Bedingungen abhängen. So kann beispielsweise für unterschiedliche Anwendungen, unterschiedliche Umgebungsbedingun­ gen, also z. B. unterschiedliche Hintergrundgeräusche bei Spracherkennung, oder unter­ schiedliche Terminals für die Benutzereingaben, wie Mikrofontyp bei Spracheingabe oder Kameratyp bei Gestikerkennung, ein jeweils daran angepasster Musterverarbeitungsdaten­ satz verwendet werden.
Nach den jeweiligen Blöcken 105 bzw. 109 erfolgt im Block 110 die Verarbeitung einer Mustereingabe des Benutzers, d. h. der Benutzer wird zu einer Mustereingabe aufgefordert und die Mustereingabe wird aufgenommen und verarbeitet. Bei solchen Mustereingaben kann es sich dabei um über ein Mikrofon 13 oder ein Telefon 60 eingegebene sprachliche Äußerungen handeln. Möglich sind aber auch Eingaben von handschriftlichem Text und/oder Zeigeereignissen zur Auswahl eines auf dem Display 11 angebotenen Menü­ punktes. Dazu ließe sich beispielsweise das Display 11 des öffentlichen Benutzer­ terminals 10 als Touchscreen ausführen und/oder man könnte das öffentliche Benutzer­ terminal 10 mit einer Kamera ausrüsten.
Optional können die im Block 110 gemachten Mustereingaben des Benutzers auch zwischengespeichert und z. B. zur Überprüfung der Benutzergruppenfestlegung für den Benutzer herangezogen werden. Sind ausreichend Benutzereingaben für eine solche Über­ prüfung gesammelt worden und wird festgestellt, dass die momentane Benutzergruppen­ festlegung für den Benutzer unter Musterverarbeitungsgesichtspunkten nicht optimal ist, so kann das System in Absprache mit dem Benutzer einen besser geeigneten benutzer­ gruppenspezifischen Musterverarbeitungsdatensatz in eine Musterverarbeitungsvorrichtung 42, 40 . . . 41 laden, um damit die weiteren Musterverarbeitungsschritte durchzuführen. Ein solches Vorgehen ist z. B. auch dann durchführbar, wenn die bisherige Musterver­ arbeitung mit einem benutzerunabhängigen Musterverarbeitungsdatensatz durchgeführt wurde.
Im Block 111 werden die der Mustereingabe des Benutzers entsprechenden Aktionen durchgeführt, so z. B. bei einer Bankanwendung Kontostände auf dem Display 11 des öffentlichen Benutzerterminals 10 dargestellt. Gegebenenfalls können aber auch Rück­ fragen an den Benutzer gestellt werden. Auch kann der Benutzer zu weiteren Eingaben wie z. B. einer fehlenden Bankleitzahl aufgefordert werden.
Im Block 112 wird entschieden, ob die Interaktion mit dem Benutzer beendet ist. Ist dies nicht der Fall, so tritt die Kontrolle wieder in Block 110 ein, um die nächste Musterein­ gabe des Benutzers zu verarbeiten. Ist die Interaktion mit dem Benutzer dagegen beendet, so wird ggf. (entsprechend den obigen Ausführungen zu Block 110) im Block 113 die neue bzw. veränderte Benutzergruppe für den Benutzer auf die Datenspeicher 32, 30 . . . 31 gespeichert, sofern diese Daten bisher beispielsweise nur lokal in einer der Spracherken­ nungsvorrichtungen 42, 40 . . . 41 gehalten wurden. Danach beendet das System im Block 114 die Bearbeitung der Benutzereingaben.
Die Beendigung der Interaktion mit dem Benutzer im Block 112 kann z. B. durch die Erkennung einer bejahenden Antwort des Benutzers im Block 110 auf eine entsprechende vorherige Systemfrage erfolgen. Alternativ oder zusätzlich kann man jedoch auch eine Abbruchtaste innerhalb der Eingabetastatur 12 des öffentlichen Benutzerterminals 10 vorsehen, die zu jedem Zeitpunkt der Mensch-Maschine-Kommunikation ausgelöst werden kann. Weitere, für den Fachmann naheliegende Variationen sind denkbar.
In den Blöcken 107 und 113 wurde die Möglichkeit vorgesehen, eine Benutzergruppen­ festlegung für den Benutzer während einer solchen Mensch-Maschine-Kommunikation neu zu erstellen, sowie in den Blöcken 110 und 113 eine solche Benutzergruppenfest­ legung zu modifizieren. Die Erstellung oder Modifikation der Benutzergruppenfestlegung muss aber nicht im Rahmen einer Benutzung des Systems z. B. zur Erledigung von Bank­ geschäften erfolgen, sondern kann auch separat für sich vorgenommen werden.
Diese Möglichkeit erscheint z. B. besonders interessant für eines der in Fig. 2 dargestellten Szenarien, in dem ein Benutzer in Ruhe von zu Hause aus seine Benutzergruppe festlegen lassen kann. Dabei kann er dann beispielsweise von einem Systembetreiber zur Verfügung gestellte Software lokal auf seinem Laptop 50 einsetzen und/oder die z. B. über das Inter­ net erreichbare Infrastruktur des Betreibers wie Prozessoren, Programme und/oder Daten­ speicher benutzen. Aber auch das in Fig. 4 beschriebene Szenario der Benutzergruppenfest­ legung direkt am öffentlichen Benutzerterminal 10 hat seine Berechtigung, da diese Fest­ legung besser an die Benutzungsverhältnisse dieser Maschine wie z. B. Mikrofon- oder Kameraeigenschaften oder Umgebungsgeräusche angepasst ist.
Während in Fig. 4 wesentliche Aspekte eines erfindungsgemäßen Verfahrens zur benutzer­ gruppenspezifischen Musterverarbeitung erläutert wurden, ist es für den Fachmann offen­ sichtlich, dass ein solches Verfahren in der Praxis noch weitere Mechanismen beispielsweise zur Behandlung von Fehlersituationen enthalten muss. So kann es z. B. vorkommen, dass einem System die von einem anderen System festgelegte Benutzergruppe eines Benutzers nicht bekannt ist. Dann kann das System sich zur Fehlerbehandlung beispielsweise genauso verhalten wie in dem ab Block 106 beschriebenen Fall, dass dem Benutzer seine Benutzer­ gruppe z. Z. nicht bekannt ist.

Claims (8)

1. Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung, mit den Verfahrensschritten:
  • - Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
  • - Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet dass die Festlegung der Benutzergruppe für den Benutzer in einer Trainingsphase erfolgt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Festlegung der Benutzergruppe für den Benutzer durch den Benutzer beeinflussbar ist.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass Benutzereingaben an einem öffentlichen Benutzerterminal (10), insbesondere einem Bankterminal, einem Fahrkartenautomaten oder einem Informationskiosk, gemacht werden.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass Benutzereingaben über ein Netzwerk (20), insbesondere das Internet, übermittelt werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet,
dass zu einem benutzergruppenspezifischen Musterverarbeitungsdatensatz (80 . . . 81) zur benutzergruppenspezifischen Spracherkennung
eine benutzergruppenspezifische Sprache und/oder Dialekt,
eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
ein benutzergruppenspezifsches akustisches Referenzmodell,
ein benutzergruppenspezifisches Vokabular,
ein benutzergruppenspezifisches Sprachmodell und/oder
ein benutzergruppenspezifisches Dialogmodell
gehören.
7. Verwendung eines Verfahrens nach einem der Ansprüche 1 bis 6 zur Beschaffung von Informationen und/oder zur Vergabe von Aufträgen, insbesondere zur Erledigung von Bankgeschäften.
8. Musterverarbeitungssystem, insbesondere Sprachverarbeitungssystem, das
zur Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
zur Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers vorgesehen ist.
DE2001127559 2001-06-06 2001-06-06 Benutzergruppenspezifisches Musterverarbeitungssystem Withdrawn DE10127559A1 (de)

Priority Applications (9)

Application Number Priority Date Filing Date Title
DE2001127559 DE10127559A1 (de) 2001-06-06 2001-06-06 Benutzergruppenspezifisches Musterverarbeitungssystem
EP02735724A EP1402518B1 (de) 2001-06-06 2002-06-05 Für eine benutzergruppe spezifisches musterverarbeitungssystem
JP2003502817A JP4837887B2 (ja) 2001-06-06 2002-06-05 ユーザ・グループに固有のパターン処理システム
PCT/IB2002/002055 WO2002099785A1 (en) 2001-06-06 2002-06-05 Pattern processing system specific to a user group
US10/479,554 US20040148165A1 (en) 2001-06-06 2002-06-05 Pattern processing system specific to a user group
AT02735724T ATE340399T1 (de) 2001-06-06 2002-06-05 Für eine benutzergruppe spezifisches musterverarbeitungssystem
DE2002614850 DE60214850T2 (de) 2001-06-06 2002-06-05 Für eine benutzergruppe spezifisches musterverarbeitungssystem
US13/589,394 US9009043B2 (en) 2001-06-06 2012-08-20 Pattern processing system specific to a user group
US14/637,049 US9424838B2 (en) 2001-06-06 2015-03-03 Pattern processing system specific to a user group

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2001127559 DE10127559A1 (de) 2001-06-06 2001-06-06 Benutzergruppenspezifisches Musterverarbeitungssystem

Publications (1)

Publication Number Publication Date
DE10127559A1 true DE10127559A1 (de) 2002-12-12

Family

ID=7687445

Family Applications (2)

Application Number Title Priority Date Filing Date
DE2001127559 Withdrawn DE10127559A1 (de) 2001-06-06 2001-06-06 Benutzergruppenspezifisches Musterverarbeitungssystem
DE2002614850 Expired - Lifetime DE60214850T2 (de) 2001-06-06 2002-06-05 Für eine benutzergruppe spezifisches musterverarbeitungssystem

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE2002614850 Expired - Lifetime DE60214850T2 (de) 2001-06-06 2002-06-05 Für eine benutzergruppe spezifisches musterverarbeitungssystem

Country Status (6)

Country Link
US (3) US20040148165A1 (de)
EP (1) EP1402518B1 (de)
JP (1) JP4837887B2 (de)
AT (1) ATE340399T1 (de)
DE (2) DE10127559A1 (de)
WO (1) WO2002099785A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007132404A3 (en) * 2006-05-12 2008-05-08 Koninkl Philips Electronics Nv Method for changing over from a first adaptive data processing version to a second adaptive data processing version

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030220788A1 (en) * 2001-12-17 2003-11-27 Xl8 Systems, Inc. System and method for speech recognition and transcription
US7881822B2 (en) * 2004-05-05 2011-02-01 Provision Interactive Technologies, Inc. System and method for dispensing consumer products
KR100897553B1 (ko) * 2007-01-04 2009-05-15 삼성전자주식회사 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치
US20130325483A1 (en) * 2012-05-29 2013-12-05 GM Global Technology Operations LLC Dialogue models for vehicle occupants
US9899026B2 (en) 2012-05-31 2018-02-20 Elwha Llc Speech recognition adaptation systems based on adaptation data
US10431235B2 (en) 2012-05-31 2019-10-01 Elwha Llc Methods and systems for speech adaptation data
US9899040B2 (en) 2012-05-31 2018-02-20 Elwha, Llc Methods and systems for managing adaptation data
US9620128B2 (en) 2012-05-31 2017-04-11 Elwha Llc Speech recognition adaptation systems based on adaptation data
CN104412322B (zh) * 2012-06-29 2019-01-18 埃尔瓦有限公司 用于管理适应数据的方法和系统
KR101619262B1 (ko) * 2014-11-14 2016-05-18 현대자동차 주식회사 음성인식 장치 및 방법
KR20170034227A (ko) * 2015-09-18 2017-03-28 삼성전자주식회사 음성 인식 장치 및 방법과, 음성 인식을 위한 변환 파라미터 학습 장치 및 방법
US10268683B2 (en) * 2016-05-17 2019-04-23 Google Llc Generating output for presentation in response to user interface input, where the input and/or the output include chatspeak
TWI682386B (zh) * 2018-05-09 2020-01-11 廣達電腦股份有限公司 整合式語音辨識系統及方法
WO2020111676A1 (ko) * 2018-11-28 2020-06-04 삼성전자 주식회사 음성 인식 장치 및 방법
JP7261096B2 (ja) * 2019-06-13 2023-04-19 株式会社日立製作所 計算機システム、モデル生成方法及びモデル管理プログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915236A (en) * 1992-11-13 1999-06-22 Dragon Systems, Inc. Word recognition system which alters code executed as a function of available computational resources
JPH08123461A (ja) * 1994-10-20 1996-05-17 Hitachi Ltd 個人情報カードを用いた音声インタフェースシステム
US5895447A (en) * 1996-02-02 1999-04-20 International Business Machines Corporation Speech recognition using thresholded speaker class model selection or model adaptation
US6665639B2 (en) * 1996-12-06 2003-12-16 Sensory, Inc. Speech recognition in consumer electronic products
US6167377A (en) * 1997-03-28 2000-12-26 Dragon Systems, Inc. Speech recognition language models
US6182037B1 (en) * 1997-05-06 2001-01-30 International Business Machines Corporation Speaker recognition over large population with fast and detailed matches
JP2000089780A (ja) * 1998-09-08 2000-03-31 Seiko Epson Corp 音声認識方法および音声認識装置
US6253181B1 (en) * 1999-01-22 2001-06-26 Matsushita Electric Industrial Co., Ltd. Speech recognition and teaching apparatus able to rapidly adapt to difficult speech of children and foreign speakers
US6487530B1 (en) * 1999-03-30 2002-11-26 Nortel Networks Limited Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models
US7505905B1 (en) * 1999-05-13 2009-03-17 Nuance Communications, Inc. In-the-field adaptation of a large vocabulary automatic speech recognizer (ASR)
JP2000347684A (ja) * 1999-06-02 2000-12-15 Internatl Business Mach Corp <Ibm> 音声認識システム
US6442519B1 (en) * 1999-11-10 2002-08-27 International Business Machines Corp. Speaker model adaptation via network of similar users
EP1134725A1 (de) * 2000-03-15 2001-09-19 Siemens Aktiengesellschaft Anpassung automatischer Spracherkennungssysteme an spezifische Charakteristika von einzelnen Sprechergruppen zur Verbesserung der Erkennungsleistung
US6493669B1 (en) * 2000-05-16 2002-12-10 Delphi Technologies, Inc. Speech recognition driven system with selectable speech models
US20020046030A1 (en) * 2000-05-18 2002-04-18 Haritsa Jayant Ramaswamy Method and apparatus for improved call handling and service based on caller's demographic information
JP3888543B2 (ja) * 2000-07-13 2007-03-07 旭化成株式会社 音声認識装置及び音声認識方法
US6735563B1 (en) * 2000-07-13 2004-05-11 Qualcomm, Inc. Method and apparatus for constructing voice templates for a speaker-independent voice recognition system
DE10047718A1 (de) * 2000-09-27 2002-04-18 Philips Corp Intellectual Pty Verfahren zur Spracherkennung
DE10047724A1 (de) * 2000-09-27 2002-04-11 Philips Corp Intellectual Pty Verfahren zur Ermittlung eines Eigenraumes zur Darstellung einer Mehrzahl von Trainingssprechern
US6823306B2 (en) * 2000-11-30 2004-11-23 Telesector Resources Group, Inc. Methods and apparatus for generating, updating and distributing speech recognition models
US7103549B2 (en) * 2001-03-22 2006-09-05 Intel Corporation Method for improving speech recognition performance using speaker and channel information
US6785647B2 (en) * 2001-04-20 2004-08-31 William R. Hutchison Speech recognition system with network accessible speech processing resources

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007132404A3 (en) * 2006-05-12 2008-05-08 Koninkl Philips Electronics Nv Method for changing over from a first adaptive data processing version to a second adaptive data processing version
US9009695B2 (en) 2006-05-12 2015-04-14 Nuance Communications Austria Gmbh Method for changing over from a first adaptive data processing version to a second adaptive data processing version

Also Published As

Publication number Publication date
US20040148165A1 (en) 2004-07-29
US20150179164A1 (en) 2015-06-25
EP1402518B1 (de) 2006-09-20
US20120310647A1 (en) 2012-12-06
US9424838B2 (en) 2016-08-23
WO2002099785A1 (en) 2002-12-12
EP1402518A1 (de) 2004-03-31
JP2004529390A (ja) 2004-09-24
ATE340399T1 (de) 2006-10-15
DE60214850T2 (de) 2007-05-10
US9009043B2 (en) 2015-04-14
JP4837887B2 (ja) 2011-12-14
DE60214850D1 (de) 2006-11-02

Similar Documents

Publication Publication Date Title
DE69327188T2 (de) Einrichtung für automatische Spracherkennung
DE10127559A1 (de) Benutzergruppenspezifisches Musterverarbeitungssystem
DE60017000T2 (de) Verfahren zur zielorientierten Sprachübersetzung mittels Extraktion der Bedeutung und Dialog
DE102012212185B4 (de) Pflegen und Bereitstellen von Sprachmodellen
DE60313706T2 (de) Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium
DE60207217T2 (de) Verfahren zum ermöglichen der sprachinteraktion mit einer internet-seite
EP1071075A2 (de) Verfahren zur Eingabe von Daten in ein System
EP1926081A1 (de) Verfahren zur Dialoganpassung und Dialogsystem zur Durchführung
DE10220521B4 (de) Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen
DE60133537T2 (de) Automatisches umtrainieren eines spracherkennungssystems
DE10110977C1 (de) Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem
DE60123153T2 (de) Sprachgesteuertes Browsersystem
DE112018007578T5 (de) Dialogsystem, das zu Semantik-Verständnis-Mapping zwischen Benutzerabsichten und Maschinenservices fähig ist
EP1159733B1 (de) Verfahren und anordnung zur bestimmung eines repräsentativen lautes
DE69333762T2 (de) Spracherkennungssystem
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE102020215954A1 (de) Dialogsystem und verfahren zum steuern desselben
DE10220522B4 (de) Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse
EP1321851B1 (de) Verfahren und System zum Nutzen von vom Nutzer frei zu wählenden Markierungsnamen als Einsprungposition in die Menustruktur eines Sprach-Dialogsystems
DE60125597T2 (de) Vorrichtung für die Dienstleistungsvermittlung
DE60222413T2 (de) Spracherkennung
DE102019217751A1 (de) Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
EP2012218B1 (de) Verfahren zur Beeinflussung der Interpretation multimodaler Eingaben
EP1363271A1 (de) Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
DE102004011426B3 (de) Vorrichtung zum Erkennen einer in einem Sprachsignal enthaltenen Emotion und Verfahren zum Erkennen einer in einem Sprachsignal enthaltenen Emotion

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: PHILIPS INTELLECTUAL PROPERTY & STANDARDS GMBH, 20

8139 Disposal/non-payment of the annual fee