DE10127559A1

DE10127559A1 - Benutzergruppenspezifisches Musterverarbeitungssystem

Info

Publication number: DE10127559A1
Application number: DE2001127559
Authority: DE
Inventors: Peter Beyerlein
Original assignee: Philips Corporate Intellectual Property GmbH
Current assignee: Philips Intellectual Property and Standards GmbH
Priority date: 2001-06-06
Filing date: 2001-06-06
Publication date: 2002-12-12
Also published as: US20040148165A1; US20150179164A1; EP1402518B1; US20120310647A1; US9424838B2; WO2002099785A1; EP1402518A1; JP2004529390A; ATE340399T1; DE60214850T2; US9009043B2; JP4837887B2; DE60214850D1

Abstract

Die Erfindung bezieht sich auf ein Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung, mit den Verfahrensschritten: DOLLAR A - Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und DOLLAR A - Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80...81) für die Verarbeitung (110) einer Mustereingabe des Benutzers.

Description

Die Erfindung bezieht sich auf ein Musterverarbeitungssystem und insbesondere auf ein Sprachverarbeitungssystem. Musterverarbeitungssysteme und insbesondere solche mit Spracherkennung werden an vielen Stellen und für viele Anwendungen eingesetzt. Beispiele sind die über Telefon erreichbaren automatischen Auskunfts- und Transaktions systeme, z. B. die automatische Fahrplanauskunft der niederländischen Openbaar Vervoer Reisinformatie (OVR) oder die Telefonbankingsysteme vieler Banken, sowie die in der Stadt Wien aufgestellten Informationskioske der Firma Philips, an denen ein Benutzer mit Hilfe von Tastatur- und Spracheingaben z. B. Informationen über die Wiener Sehens würdigkeiten und Hotels erhalten kann.

Sollen Musterverarbeitungssysteme von vielen Benutzern verwendet werden, werden in der Regel für die Musterverarbeitung so genannte benutzerunabhängige Musterverarbeitungs datensätze verwendet. D. h., bei der Verarbeitung von Mustern unterschiedlicher Benutzer wird kein Unterschied zwischen den Benutzern gemacht, im Falle der Spracherkennung werden so z. B. für alle Sprecher dieselben akustischen Referenzmodelle verwendet. Dem Fachmann ist jedoch bekannt, dass die Qualität der Musterverarbeitung durch die Ver wendung benutzerspezifischer Musterverarbeitungsdatensätze verbessert wird. Z. B. steigt die Genauigkeit von Spracherkennungssystemen, wenn man für einen Sprecher eine speziell auf ihn abgestimmte Vokaltraktlängennormierung seiner sprachlichen Äußerungen durchführt.

Solche sprecherabhängigen Spracherkennungssysteme werden auch bereits weitgehend in Anwendungen mit kleinen Benutzerzahlen eingesetzt. Beispiele sind persönliche Diktiersysteme, z. B. FreeSpeech von Philips, oder die professionellen Diktiersysteme für geschlossene Benutzergruppen,, z. B. SpeechMagic von Philips für den Bereich der Rönt genologie. Einer Übertragung dieser Techniken auf Musterverarbeitungssysteme mit vielen Benutzern stehen jedoch verschiedene Hemmnisse im Wege.

Zum einen würde die große Zahl der Benutzer eines solchen Systems zu einem hohen Speicherbedarf für die benutzerspezifischen Musterverarbeitungsdatensätze führen. Zum anderen muss davon ausgegangen werden, dass eine größere Zahl der Benutzer nicht bereit wäre, den Trainingsaufwand für die Erstellung ihrer benutzerspezifischen Musterverarbei tungsdatensätze auf sich zu nehmen. Da sich nämlich die Musterverarbeitungssysteme der einzelnen Hersteller und teilweise auch die einzelnen Produkte eines Herstellers von einander unterscheiden, und daher die benutzerspezifischen Musterverarbeitungsdaten sätze nicht zwischen den Systemen austauschbar sind, wäre dieser Trainingsaufwand für nahezu jedes System nötig, das ein Benutzer verwenden will.

In den Patent Abstracts of Japan, JP 08-123461 A wird daher vorgeschlagen, dass ein Benutzer eine persönliche Informationskarte (individual information card) bei sich trägt, welche die für ihn charakteristischen Daten (individual information data) aufnimmt. Um dann die Sprachverarbeitung (speech processing) eines entsprechenden Systems (speech interface system) auf sich zu spezialisieren (specializing the system for the individual), schiebt er z. B. seine Informationskarte in einen Schlitz des Systems. Dieses liest seine Daten von der Karte und führt mit ihnen eine benutzerabhängige Verarbeitung seiner sprachlichen Äußerungen durch.

Die Verwendung einer persönlichen Informationskarte löst also die Problematik des hohen Speicherbedarfs und des mehrfachen Erstellens benutzerspezifischer Daten, vorausgesetzt die Hersteller der Sprachverarbeitungssysteme unterstützen die Verwendung der Karte an ihren Systemen. Sie schafft jedoch die Notwendigkeit, dass ein Benutzer seine Karte zur Systemnutzung stets bei sich führen und jedes System eine Eingabevorrichtung für die Karte vorsehen muss. Beispielsweise ist sie für die Nutzung eines telefonischen Auskunfts systems nicht einsetzbar.

Aufgabe der Erfindung ist es daher, ein Musterverarbeitungssystem, insbesondere ein Sprachverarbeitungssystem, der eingangs genannten Art mit einer den benutzerspezifischen Musterverarbeitungssystemen vergleichbaren Qualität zu schaffen, das die Problematik des hohen Speicherbedarfs und des mehrfachen Erstellens benutzerspezifischer Daten löst, ohne dass der Benutzer zur Systembenutzung zusätzlicher Ausrüstung wie z. B. einer Informationskarte bedarf, und das auch mit bisherigen Benutzerterminals wie z. B. dem Telefon benutzt werden kann.

Diese Aufgabe wird gelöst einerseits durch ein Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung mit den Verfahrensschritten:

- Entgegennahme einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
- Verwendung eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes für die Verarbeitung einer Mustereingabe des Benutzers,

und andererseits durch ein Musterverarbeitungssystem, insbesondere ein Sprachver arbeitungssystem, das

- zur Entgegennahme einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
- zur Verwendung eines für die Benutzergruppe spezifischen Musterverarbeitungs datensatzes für die Verarbeitung einer Mustereingabe des Benutzers

vorgesehen ist.

Durch die Einteilung der Benutzer in Benutzergruppen wird die Problematik des hohen Speicherbedarfes vermieden. Darüber hinaus können die benutzergruppenspezifischen Musterverarbeitungsdatensätze auch auf zentralen Datenspeichern untergebracht und über ein Netzwerk den Musterverarbeitungsvorrichtungen zur Verfügung gestellt werden. Damit ergeben sich durch die Vermeidung mehrfacher Datenhaltung weitere Möglich keiten der Speicherersparnis. Die Mehrfachverwendung der benutzergruppenspezifischen Musterverarbeitungsdatensätze in mehreren Systemen vermeidet die Problematik einer mehrfachen Festlegung der Benutzergruppe für den Benutzer.

Zur Benutzung des benutzergruppenspezifischen Musterverarbeitungssystems muss ein Benutzer dem System nur seine Benutzergruppe z. B. durch eine Nummer oder einen symbolischen Namen mitteilen. Während die Benutzergruppeninformation auch auf einer Chipkarte untergebracht werden kann, genügt es zur Benutzung z. B. eines telefonischen Auskunftssystems auch, dem System die Benutzergruppe verbal mitzuteilen oder z. B. bei einer numerischen Kodierung die Nummer über die Tastatur eines DTMF-fähigen Telefons einzugeben. Damit lässt sich ein solches benutzergruppenspezifisches Musterver arbeitungssystem auch ohne zusätzliche Ausrüstung wie z. B. einer Informationskarte und auch mit bisherigen Benutzerterminals wie z. B. einem Telefon benutzen.

Die Festlegung der Benutzergruppe für einen Benutzer kann, wie in Anspruch 2 bean sprucht, in einer Trainingsphase erfolgen, in welcher der Benutzer z. B. einen vorge gebenen Text sprechen muss, den ein Trainingssystem aufnimmt und zur Bestimmung der Benutzergruppe verwendet. Diese Trainingsphase kann unabhängig von einer Benutzung eines benutzergruppenspezifischen Musterverarbeitungssystems erfolgen. Sie kann jedoch einem "neuen" Benutzer, d. h. einem Benutzer, dem noch keine Benutzergruppe zuge wiesen wurde, auch bei Benutzung des Systems angeboten werden. Weiter ist es denkbar, die während der Systembenutzung anfallenden Mustereingaben des Benutzers, die vielleicht zunächst mit einer benutzerunabhängigen Musterverarbeitung behandelt wurden, für die erstmalige oder auch die Neufestlegung der Benutzergruppe zu verwenden. Letzteres könnte sich ergeben, wenn sich die Mustercharakteristik des Benutzers oder die Benutzergruppen des Systems verändert haben.

Dem Fachmann sind z. B. aus der Literatur zahlreiche Verfahren aus dem Bereich der Benutzeradaption bekannt, um eine solche Festlegung der Benutzergruppe vorzunehmen. Manche dieser Verfahren wie z. B. das "speaker clustering" aus der Spracherkennung führen dabei unmittelbar auf eine Benutzergruppe. Andere wie z. B. "adaptive speaker clustering", MLLR oder MAP aus der Spracherkennung oder auch die "eigenfaces" aus der Bilderkennung werden üblicherweise eingesetzt, um benutzerspezifische Musterver arbeitungsdatensätze zu erhalten. Durch eine Quantelung, d. h. durch eine Beschränkung der benutzerspezifischen Adaptionsparameter auf bestimmte Stufen, lässt sich jedoch die Auflösung der Adaptionsverfahren so weit vergröbern, dass sich die gewünschte Anzahl an Benutzergruppen einstellt.

Im Anspruch 3 wird beansprucht, dass die Festlegung der Benutzergruppe für den Benutzer durch den Benutzer beeinflussbar ist. Es ist dabei z. B. denkbar, dass ein System Benutzergruppen unterschiedlicher Güte anbietet. So kann ein System beispielsweise Benutzergruppen hoher Güte anbieten, indem es für diese Gruppen z. B. sehr fein aufgelöste akustische Referenzmodelle anbietet und sich in einer solchen Benutzergruppe nur Benutzer sehr ähnlicher Sprech- und Verhaltensweisen befinden. Dadurch könnten einer solchen Benutzergruppe z. B. bei einer Spracherkennung annähernd gute Erken nungsgenauigkeiten geboten werden, wie dies bei benutzerabhängigen Systemen der Fall wäre. Der dazu im System notwendige höhere Aufwand könnte über eine entsprechende Preistarifstruktur an die Benutzer weitergegeben werden.

Die Unteransprüche 4 und 5 beziehen sich auf zwei vorteilhafte Möglichkeiten der Benutzereingabe. Zum einen können Benutzereingaben an einem öffentlichen Benutzer terminal wie z. B. einem eingangs erwähnten Informationskiosk oder aber einem Bank automaten gemacht werden. Zum anderen kann ein Benutzer ein Telefon oder auch einen PC oder Laptop benutzen, wobei seine Eingaben über ein Netzwerk, z. B. das Telefonnetz oder das Internet, übermittelt werden.

Der Unteranspruch 6 spezifiziert einige mögliche Bestandteile eines benutzergruppen spezifischen Musterverarbeitungsdatensatzes:

- eine benutzergruppenspezifische Sprache und/oder Dialekt,
- eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
- ein benutzergruppenspezifisches akustisches Referenzmodell,
- ein benutzergruppenspezifisches Vokabular,
- ein benutzergruppenspezifsches Sprachmodell und/oder
- ein benutzergruppenspezifisches Dialogmodell.

Dies sind typische Bestandteile eines solchen Datensatzes, der beispielsweise für eine benutzergruppenspezifische Spracherkennung verwendet werden kann. Dabei können die akustischen Referenzmodelle z. B. in der Form so genannter Hidden-Markov-Modelle für die Laute einer Sprache vorliegen. Benutzergruppenspezifische Vokabularien enthalten z. B. die typischerweise von einer Benutzergruppe für eine Anwendung verwendeten Wörter. Sprachmodelle können alle Beziehungen zur Bildung einer Wortfolge also beispielsweise auch grammatische Regeln oder semantische Präferenzen der Benutzer gruppe umfassen, während Dialogmodelle die kennzeichnenden Muster der Interaktion zwischen dem System und Benutzern einer Benutzergruppe angeben.

Neben der Spracherkennung umfasst die Erfindung auch andere Arten der benutzer gruppenspezifischen Musterverarbeitung wie beispielsweise die benutzergruppenspezifische Sprachkodierung, z. B. durch Verwendung benutzergruppenspezifischer Kodebücher. Aber auch die benutzergruppenspezifische Handschrifterkennung und Mimikverarbeitung, z. B. in Systemen zum "Online-Chatten" mit animierten Charakteren, so genannten Avataren, fällt in den Bereich der Erfindung.

Im Anspruch 7 wird beansprucht, das System zur Beschaffung von Informationen wie z. B. Fahrplan- oder touristischen Auskünften zu benutzen. Weiter wird beansprucht, das System zu verwenden für die Vergabe von Aufträgen wie z. B. für das Tätigen von Ein käufen an einem Automaten oder das Erledigen von Bankgeschäften über das Internet.

Diese und weitere Aspekte und Vorteile der Erfindung werden im Folgenden an Hand der Ausführungsbeispiele und insbesondere an Hand der beigefügten Zeichnungen näher erläutert. Es zeigen:

Fig. 1 und 2 Ausführungsformen des erfindungsgemäßen benutzergruppenspezifischen Musterverarbeitungssystems,

Fig. 3 eine schematische Darstellung des Inhalts eines Datenspeichers für die benutzergruppenspezifischen Musterverarbeitungsdatensätze,

Fig. 4 den Ablauf einer Benutzung eines erfindungsgemäßen benutzergruppenspezifischen Musterverarbeitungssystems in Form eines Flussdiagramms.

Die Fig. 1 zeigt eine Ausführungsform des erfindungsgemäßen benutzergruppen spezifischen Musterverarbeitungssystems, das für die Benutzereingaben ein öffentliches Benutzerterminal 10 vorsieht. Typische Anwendungen einer solcher Ausführungsform der Erfindung sind die Erledigung von Bankgeschäften an Bankautomaten 10, der Abruf von Informationen an den eingangs erwähnten Informationskiosken 10 oder auch der Kauf von Fahrkarten an Fahrkartenautomaten 10.

Das öffentliche Benutzerterminal 10 verfügt über eine graphische Ausgabeeinheit (Dis play) 11, eine Eingabetastatur 12, ein Mikrofon 13 zur Eingabe sprachlicher Äußerungen eines Benutzers und einen Eingabeschlitz 14 für eine benutzereigene Chipkarte 70, z. B. eine EC- oder Kundenkarte. Weiterhin enthält es eine lokale Spracherkennungsvor richtung 42, die über einen lokalen Datenspeicher 32 zur Speicherung von benutzer gruppenspezifischen Musterverarbeitungsdatensätzen zur benutzergruppenspezifischen Sprachverarbeitung verfügt. Auf der benutzereigenen Chipkarte 70, die zur Benutzung des Systems in den Eingabeschlitz 14 eingeschoben wird, befindet sich z. B. ein Chip 71 zur Speicherung für die Anwendung typischer Daten, beispielsweise für eine Bankkarte die Kontonummer des Girokontos, sowie ein weiterer Chip 72 zur Speicherung einer ein deutigen Kennzeichnung der für die benutzergruppenspezifische Sprachverarbeitung festgelegten Benutzergruppe des Benutzers.

Eine solche eindeutige Kennzeichnung kann z. B. aus einer Nummer bestehen, denkbar ist aber auch ein symbolischer Name, beispielsweise der Name einer öffentlich bekannten Person, die ebenfalls zu dieser Benutzergruppe gehört, so dass ihre Sprachverarbeitungs charakteristik typisch für die Benutzergruppe ist. Insbesondere ein solcher symbolischer Name aber auch eine Nummer lassen sich von einem Benutzer gut erinnern, so dass eine solche eindeutige Kennzeichnung dem Musterverarbeitungssystem auch ohne Hilfe einer Chipkarte z. B. über das Mikrofon 13 oder die Eingabetastatur 12 übermittelt werden kann. In diesem Fall entfiele dann der Chip 72 auf der Chipkarte 70. Weiter können alle Informationen auf der Chipkarte 70 inklusive einer eventuellen Benutzergruppenkenn zeichnung auch auf einem einzigen Chip 71 untergebracht werden.

Speichert man alle benutzergruppenspezifischen Musterverarbeitungsdatensätze auf dem lokalen Datenspeicher 32, so kann die lokale Spracherkennungsvorrichtung 42 vollständig lokal arbeiten. Ein solcher "stand alone" Automat eignet sich z. B. besonders gut für den Verkauf von Zigaretten oder anderen direkt im Automaten verfügbaren Waren. Das öffentliche Benutzerterminal 10 kann aber auch über ein Netzwerk 20 mit weiteren Datenspeichern 30 . . . 31 zur Speicherung von benutzergruppenspezifischen Musterver arbeitungsdatensätzen zur benutzergruppenspezifischen Spracherkennung verbunden werden. Bei dem Netzwerk 20 kann es sich dabei z. B. um ein privates MAN (Metro politan Area Network), beispielsweise das Netzwerk einer Bank, handeln. Das Netzwerk 20 kann aber auch durch ein öffentliches Netzwerk und insbesondere durch das Internet reali siert werden. Als Mischform sind auch beispielsweise auf Basis des Internets verwirklichte VPNs (Virtual Private Networks) möglich.

Fig. 2 zeigt eine weitere Ausführungsform des erfindungsgemäßen benutzergruppen spezifischen Musterverarbeitungssystems. Wie in Fig. 1 sind wieder das Netzwerk 20 und die daran angeschlossenen Datenspeicher 30 . . . 31 dargestellt. Im Gegensatz zu Fig. 1 sind jedoch auch die Spracherkennungsvorrichtungen 40 . . . 41 an das Netzwerk 20 ange schlossen. Die Benutzereingaben erfolgen hier an einem öffentlichen Benutzerterminal 10, das jedoch im Gegensatz zu Fig. 1 über keine lokale Spracherkennungsvorrichtung 42 mit lokalem Datenspeicher 32 verfügt, oder über ein Telefon 60 oder auch über einen PC, Laptop oder dergleichen 50, die alle dafür am Netzwerk 20 angeschlossen sind bzw. dazu damit verbunden werden können. Diese und andere Eingabemöglichkeiten wie z. B. das in Fig. 1 gezeigte öffentliche Benutzerterminal 10 mit lokaler Spracherkennungsvorrich tung 42 können in einem benutzergruppenspezifischen Musterverarbeitungssystem alle oder auch nur teilweise verwirklicht werden.

Die in den Fig. 1 und 2 dargestellten Szenarien unterscheiden sich also vor allem in der Anordnung der Spracherkennungsvorrichtung 42 bzw. 40 . . . 41, in der die Erkennung der sprachlichen Äußerungen eines Benutzers erfolgt. Die in Fig. 1 lokal im öffentlichen Benutzerterminal 10 untergebrachte Spracherkennungsvorrichtung 42 eignet sich besonders für den Fall, dass nur einfache Kommandos erkannt werden müssen und das öffentliche Benutzerterminal 10 hauptsächlich von immer denselben Kunden benutzt wird. In diesem Fall genügt eine relativ einfache und kostengünstige Spracherkennungsvor richtung 42 und zur benutzergruppenspezifischen Spracherkennung können die benutzer gruppenspezifischen Musterverarbeitungsdatensätze der Hauptnutzer auf dem lokalen Datenspeicher 32 der Spracherkennungsvorrichtung 42 gehalten werden. Weitere benutzergruppenspezifischen Musterverarbeitungsdatensätze, die z. B. von durchreisenden Benutzern benötigt werden und die nicht lokal im Datenspeicher 32 vorhanden sind, werden von den über das Netzwerk 20 angeschlossenen Datenspeichern 30 . . . 31 geladen. Dadurch ergibt sich insgesamt nur eine geringe Belastung des Netzwerkes 20.

In Fig. 2 erfolgt die Spracherkennung der sprachlichen Äußerungen eines Benutzers in den über das Netzwerk angeschlossenen Spracherkennungsvorrichtungen 40 . . . 41. Dies ist sinnvoll bei komplexeren Sprachäußerungen, die eine hohe Erkennungsleistung erfordern und/oder bei ständig wechselnden Benutzern. Durch die Bündelung der Spracherken nungsaufgaben und der Datenhaltung ergeben sich Vorteile in der Maschinenauslastung, dem benötigten Speicherplatz und dem nötigen Datenverkehr über das Netzwerk 20. So kann es z. B. sinnvoll sein, innerhalb des Netzwerkes 20 die Spracherkennungsvorrich tungen 40 . . . 41 untereinander und mit den Datenspeichern 30 . . . 31 mit einem breit bandigen Subnetz zu verbinden. Auch kann es gegebenenfalls von Vorteil sein, die Erkennung der sprachlichen Äußerungen einzelner Benutzer möglichst immer derselben Spracherkennungsvorrichtung 40 . . . 41 zuzuweisen, die dann die benutzergruppen spezifischen Musterverarbeitungsdatensätze dieser Benutzer wieder in lokalen Daten speichern halten kann.

Neben den gerade erwähnten Systemausgestaltungen sind für den Fachmann je nach Ein satzgebiet auch viele weitere Varianten ohne weiteres ausführbar. Hier soll daher nur noch die Technik der gespiegelten Datenhaltung erwähnt werden, die hinreichend aus der Lehre der verteilten Datenbanken bekannt ist. Dabei werden die Daten eines Benutzers, d. h. hier einer Benutzergruppe, in mehreren, i. d. R räumlich weit getrennten Datenspeichern, z. B. in Fig. 1 in den Speichern 32 und 30 . . . 31, gehalten, um dem Benutzer auch bei hoher Belastung des Netzwerkes 20 schnellen Zugriff auf seine Daten zu gestatten. Die Konsistenz der Datenhaltung in den einzelnen Speichern wird dann durch geeignete Synchronisationsprozeduren sichergestellt, die weniger zeitkritisch sind und ggf. zu Zeiten geringerer Netzwerkbelastung abgearbeitet werden können.

Eine nächste Ausführungsform der Erfindung ergibt sich dadurch, wenn die benutzer gruppenspezifischen Musterverarbeitungsdatensätze zur benutzergruppenspezifischen Musterverarbeitung nicht in systemeigenen Datenspeichern gehalten werden, sondern beispielsweise von einem dritten Provider oder auch von einem Benutzer selbst (für seine eigene Benutzergruppe) zur Verfügung gestellt werden. Im ersten Fall können sich dritte Unternehmen auf das Erstellen, Verwalten und/oder Aktualisieren der benutzergruppen spezifischen Musterverarbeitungsdatensätze spezialisieren, um diese dann z. B. gegen Lizenzgebühren den Betreibern der benutzergruppenspezifischen Musterverarbeitungs systeme zur Verfügung zu stellen. Dritte Unternehmen können sich aber auch um die Festlegung der Benutzergruppenzugehörigkeit für die Benutzer kümmern.

Im zweiten Fall würde ein Benutzer selbst die benutzergruppenspezifischen Musterver arbeitungsdatensätze seiner Benutzergruppe z. B. aus einem der Datenspeicher 32, 30 . . . 31 eines benutzergruppenspezifischen Musterverarbeitungssystems herunterladen. Bei Benutzung eines anderen benutzergruppenspezifischen Musterverarbeitungssystems, das nicht selbst über die benutzergruppenspezifischen Musterverarbeitungsdatensätze seiner Benutzergruppe verfügt, kann er diese Daten dann auf dem Laptop 50 dem System zur Verfügung stellen. Allgemein kann er sie jedoch auch über einen an das Netzwerk 20, also insbesondere an das Internet angeschlossenen PC zur Verfügung stellen, wobei er dann dem System die Adresse dieses PC's mitteilen würde. In diesem Szenario übernimmt damit die Mitteilung der Adresse des PC's oder Laptops 50 die Rolle der Mitteilung der ein deutigen Kennzeichnung der Benutzergruppe.

Während in den obigen Ausführungsbeispielen als Benutzerendgeräte zum Systemzugang öffentliche Benutzerterminals 10 mittlerer Komplexität, Telefone 60 und PC's oder Lap tops 50 benutzt wurden, sind auch andere Lösungen möglich. Beispiele sind Mobiltelefone und Informationskioske mit komplexen multimedialen Interaktionsmöglichkeiten wie Touchscreens, Kameras, Lautsprechern, etc.

Fig. 3 zeigt eine schematische Darstellung des Inhalts eines Datenspeichers 30 für die benutzergruppenspezifischen Musterverarbeitungsdatensätze 80 . . . 81. Bei dem Daten speicher 30, der hier stellvertretend steht sowohl für die lokalen Datenspeicher 32 wie auch für die am Netzwerk 20 angeschlossenen weiteren Datenspeicher 30 . . . 31, handelt es sich dabei um einen bekannten Computerdatenspeicher, z. B. eine Festplatte. Die benutzer gruppenspezifischen Musterverarbeitungsdatensätze 80 . . . 81 können in Form einzelner Dateien vorliegen, die in für das benutzergruppenspezifische Musterverarbeitungssystem geeigneter Weise z. B. binär kodiert sind. Möglich ist aber auch eine Organisation in Form einer Datenbank oder dergleichen.

Fig. 4 zeigt einen möglichen Ablauf einer Benutzung eines erfindungsgemäßen benutzer gruppenspezifischen Musterverarbeitungssystems in Form eines Flussdiagramms. Dabei wird nur auf die Vorgänge eingegangen, die für die benutzergruppenspezifische Musterver arbeitung von Bedeutung sind, während anwendungsspezifische Aktionen wie z. B. das Mitteilen einer Kontonummer und einer PIN für eine Bankanwendung hier nicht darge stellt sind.

Nach dem Startblock 101 fordert das benutzergruppenspezifische Musterverarbeitungs system einen Benutzer im Prozessblock 102 auf, ihm seine Benutzergruppe bekannt zu geben, d. h. dem System eine eindeutige Kennzeichnung der für den Benutzer festgelegten Benutzergruppe für die benutzergruppenspezifische Musterverarbeitung zu übergeben. Nach dem Entscheidungsblock 103 verzweigt die weitere Bearbeitung, je nachdem, ob dem Benutzer seine Benutzergruppe bekannt ist oder nicht.

Kennt der Benutzer seine Benutzergruppe, so teilt er diese im Block 104 dem System mit, indem er z. B. in den Szenarien der Fig. 1 und 2 die Chipkarte 70 in den Eingabeschlitz 14 eines öffentlichen Benutzerterminals 10 schiebt, die Eingabetastatur 12 oder das Mikro fon 13 des öffentlichen Benutzerterminals 10 benutzt oder die Benutzergruppe über ein Telefon 60 oder einen Laptop 50 dem System bekannt gibt. Das System sucht dann im Block 105 den zur Benutzergruppe des Benutzers gehörigen benutzergruppenspezifischen Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 auf und stellt ihn einer Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung.

Kennt dagegen der Benutzer seine Benutzergruppe nicht, so fragt ihn das System im Block 106, ob er möchte, dass das System jetzt eine Benutzergruppe für ihn festlegen soll. Möchte er dies, so sammelt das System im Block 107 Trainingsmustereingaben des Benutzers und verarbeitet diese zur Festlegung einer Benutzergruppe für den Benutzer. Im Block 108 wird dem Benutzer die so festgelegte Benutzergruppe mitgeteilt und die Kon trolle geht über in den schon beschriebenen Block 105, in dem der zur Benutzergruppe des Benutzers gehörige benutzergruppenspezifische Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 aufgesucht und einer Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung gestellt wird.

Möchte der Benutzer jetzt aber keine Benutzergruppe für sich festlegen lassen, z. B. weil er dazu jetzt keine Zeit hat oder weil ihm bereits eine Benutzergruppe zugewiesen wurde, deren eindeutige Kennzeichnung er jedoch im Moment nicht zur Verfügung hat, so ver zweigt die Kontrolle nach Block 106 zu Block 109. Dort wird ein benutzerunabhängiger Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 aufgesucht und einer Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung gestellt, so dass die nach folgenden Musterverarbeitungsschritte dann unabhängig von den speziellen Charakteristika des Benutzers durchgeführt werden.

Der der Musterverarbeitungsvorrichtung 42, 40 . . . 41 in einem der Blöcke 105 bzw. 109 zur Verfügung gestellte benutzergruppenspezifische bzw. benutzerunabhängige Musterver arbeitungsdatensatz kann dabei noch von weiteren Bedingungen abhängen. So kann beispielsweise für unterschiedliche Anwendungen, unterschiedliche Umgebungsbedingun gen, also z. B. unterschiedliche Hintergrundgeräusche bei Spracherkennung, oder unter schiedliche Terminals für die Benutzereingaben, wie Mikrofontyp bei Spracheingabe oder Kameratyp bei Gestikerkennung, ein jeweils daran angepasster Musterverarbeitungsdaten satz verwendet werden.

Nach den jeweiligen Blöcken 105 bzw. 109 erfolgt im Block 110 die Verarbeitung einer Mustereingabe des Benutzers, d. h. der Benutzer wird zu einer Mustereingabe aufgefordert und die Mustereingabe wird aufgenommen und verarbeitet. Bei solchen Mustereingaben kann es sich dabei um über ein Mikrofon 13 oder ein Telefon 60 eingegebene sprachliche Äußerungen handeln. Möglich sind aber auch Eingaben von handschriftlichem Text und/oder Zeigeereignissen zur Auswahl eines auf dem Display 11 angebotenen Menü punktes. Dazu ließe sich beispielsweise das Display 11 des öffentlichen Benutzer terminals 10 als Touchscreen ausführen und/oder man könnte das öffentliche Benutzer terminal 10 mit einer Kamera ausrüsten.

Optional können die im Block 110 gemachten Mustereingaben des Benutzers auch zwischengespeichert und z. B. zur Überprüfung der Benutzergruppenfestlegung für den Benutzer herangezogen werden. Sind ausreichend Benutzereingaben für eine solche Über prüfung gesammelt worden und wird festgestellt, dass die momentane Benutzergruppen festlegung für den Benutzer unter Musterverarbeitungsgesichtspunkten nicht optimal ist, so kann das System in Absprache mit dem Benutzer einen besser geeigneten benutzer gruppenspezifischen Musterverarbeitungsdatensatz in eine Musterverarbeitungsvorrichtung 42, 40 . . . 41 laden, um damit die weiteren Musterverarbeitungsschritte durchzuführen. Ein solches Vorgehen ist z. B. auch dann durchführbar, wenn die bisherige Musterver arbeitung mit einem benutzerunabhängigen Musterverarbeitungsdatensatz durchgeführt wurde.

Im Block 111 werden die der Mustereingabe des Benutzers entsprechenden Aktionen durchgeführt, so z. B. bei einer Bankanwendung Kontostände auf dem Display 11 des öffentlichen Benutzerterminals 10 dargestellt. Gegebenenfalls können aber auch Rück fragen an den Benutzer gestellt werden. Auch kann der Benutzer zu weiteren Eingaben wie z. B. einer fehlenden Bankleitzahl aufgefordert werden.

Im Block 112 wird entschieden, ob die Interaktion mit dem Benutzer beendet ist. Ist dies nicht der Fall, so tritt die Kontrolle wieder in Block 110 ein, um die nächste Musterein gabe des Benutzers zu verarbeiten. Ist die Interaktion mit dem Benutzer dagegen beendet, so wird ggf. (entsprechend den obigen Ausführungen zu Block 110) im Block 113 die neue bzw. veränderte Benutzergruppe für den Benutzer auf die Datenspeicher 32, 30 . . . 31 gespeichert, sofern diese Daten bisher beispielsweise nur lokal in einer der Spracherken nungsvorrichtungen 42, 40 . . . 41 gehalten wurden. Danach beendet das System im Block 114 die Bearbeitung der Benutzereingaben.

Die Beendigung der Interaktion mit dem Benutzer im Block 112 kann z. B. durch die Erkennung einer bejahenden Antwort des Benutzers im Block 110 auf eine entsprechende vorherige Systemfrage erfolgen. Alternativ oder zusätzlich kann man jedoch auch eine Abbruchtaste innerhalb der Eingabetastatur 12 des öffentlichen Benutzerterminals 10 vorsehen, die zu jedem Zeitpunkt der Mensch-Maschine-Kommunikation ausgelöst werden kann. Weitere, für den Fachmann naheliegende Variationen sind denkbar.

In den Blöcken 107 und 113 wurde die Möglichkeit vorgesehen, eine Benutzergruppen festlegung für den Benutzer während einer solchen Mensch-Maschine-Kommunikation neu zu erstellen, sowie in den Blöcken 110 und 113 eine solche Benutzergruppenfest legung zu modifizieren. Die Erstellung oder Modifikation der Benutzergruppenfestlegung muss aber nicht im Rahmen einer Benutzung des Systems z. B. zur Erledigung von Bank geschäften erfolgen, sondern kann auch separat für sich vorgenommen werden.

Diese Möglichkeit erscheint z. B. besonders interessant für eines der in Fig. 2 dargestellten Szenarien, in dem ein Benutzer in Ruhe von zu Hause aus seine Benutzergruppe festlegen lassen kann. Dabei kann er dann beispielsweise von einem Systembetreiber zur Verfügung gestellte Software lokal auf seinem Laptop 50 einsetzen und/oder die z. B. über das Inter net erreichbare Infrastruktur des Betreibers wie Prozessoren, Programme und/oder Daten speicher benutzen. Aber auch das in Fig. 4 beschriebene Szenario der Benutzergruppenfest legung direkt am öffentlichen Benutzerterminal 10 hat seine Berechtigung, da diese Fest legung besser an die Benutzungsverhältnisse dieser Maschine wie z. B. Mikrofon- oder Kameraeigenschaften oder Umgebungsgeräusche angepasst ist.

Während in Fig. 4 wesentliche Aspekte eines erfindungsgemäßen Verfahrens zur benutzer gruppenspezifischen Musterverarbeitung erläutert wurden, ist es für den Fachmann offen sichtlich, dass ein solches Verfahren in der Praxis noch weitere Mechanismen beispielsweise zur Behandlung von Fehlersituationen enthalten muss. So kann es z. B. vorkommen, dass einem System die von einem anderen System festgelegte Benutzergruppe eines Benutzers nicht bekannt ist. Dann kann das System sich zur Fehlerbehandlung beispielsweise genauso verhalten wie in dem ab Block 106 beschriebenen Fall, dass dem Benutzer seine Benutzer gruppe z. Z. nicht bekannt ist.

Claims

1. Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung, mit den Verfahrensschritten:

- Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
- Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet dass die Festlegung der Benutzergruppe für den Benutzer in einer Trainingsphase erfolgt.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Festlegung der Benutzergruppe für den Benutzer durch den Benutzer beeinflussbar ist.

4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass Benutzereingaben an einem öffentlichen Benutzerterminal (10), insbesondere einem Bankterminal, einem Fahrkartenautomaten oder einem Informationskiosk, gemacht werden.

5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass Benutzereingaben über ein Netzwerk (20), insbesondere das Internet, übermittelt werden.

6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet,
dass zu einem benutzergruppenspezifischen Musterverarbeitungsdatensatz (80 . . . 81) zur benutzergruppenspezifischen Spracherkennung
eine benutzergruppenspezifische Sprache und/oder Dialekt,
eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
ein benutzergruppenspezifsches akustisches Referenzmodell,
ein benutzergruppenspezifisches Vokabular,
ein benutzergruppenspezifisches Sprachmodell und/oder
ein benutzergruppenspezifisches Dialogmodell
gehören.

7. Verwendung eines Verfahrens nach einem der Ansprüche 1 bis 6 zur Beschaffung von Informationen und/oder zur Vergabe von Aufträgen, insbesondere zur Erledigung von Bankgeschäften.

8. Musterverarbeitungssystem, insbesondere Sprachverarbeitungssystem, das
zur Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
zur Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers vorgesehen ist.