DE60001809T2 - Sprach-Portal Host-Rechner und Verfahren - Google Patents

Sprach-Portal Host-Rechner und Verfahren Download PDF

Info

Publication number
DE60001809T2
DE60001809T2 DE60001809T DE60001809T DE60001809T2 DE 60001809 T2 DE60001809 T2 DE 60001809T2 DE 60001809 T DE60001809 T DE 60001809T DE 60001809 T DE60001809 T DE 60001809T DE 60001809 T2 DE60001809 T2 DE 60001809T2
Authority
DE
Germany
Prior art keywords
named
host system
voice
user
voice portal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60001809T
Other languages
English (en)
Other versions
DE60001809D1 (de
Inventor
Robert Van Kommer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Swisscom AG
Original Assignee
Swisscom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Swisscom AG filed Critical Swisscom AG
Application granted granted Critical
Publication of DE60001809D1 publication Critical patent/DE60001809D1/de
Publication of DE60001809T2 publication Critical patent/DE60001809T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Sprach-Portal Host-System und Verfahren. Insbesondere betrifft die vorliegende Erfindung ein Portal System und Verfahren für das Hosting einer Mehrzahl von Sprachanwendungen und -diensten von verschiedenen externen Mehrwertdienstanbietern.
  • Die Menge an Information, die in elektronischem Format verfügbar ist, ist gross und wächst weltweit mit schnellem Tempo. Diese Information kann in Computern und Servern gespeichert werden und es kann auf sie über Kommunikationsnetzwerke wie beispielsweise Internet zugegriffen werden. Ein populärer Teil des Internets ist das World Wide Web, welches die Übertragung von Multimedia-Information wie beispielsweise Textdateien, Bilder, Audiodateien usw. zwischen Servers und Klienten mit Hilfe vom Hypertext Transfer Protocol (HTTP) erlaubt.
  • Die Klienten können Desktop oder Palmtop Computer oder sogar Mobilfunktelefone sein und verwenden Softwareprogramme, beispielsweise einen Browser, um den Benutzern die geforderten Informationen anzuzeigen. Auch wenn Computer und Browser heutzutage äusserst verbreitet sind, gibt es viele Situationen, in denen, aus irgendeinem Grund, deren Verwendung nicht geeignet oder möglich ist. Insbesondere mobile Teilnehmer zögern oft, einen Computer oder sogar eine Palmtop auf Reise mitzutragen. Ferner ist der Gebrauch von Browsern für viele Leute oder für viele Anwendungen zu umständlich, beispielsweise wenn nur eine sehr kurze Information, wie beispielsweise die genaue Zeit, Sportresultate oder Wetterberichte, verlangt werden oder für einfache elektronische Transaktionen.
  • Die Benutzer fordern im Allgemeinen Informationen von einem HTTP-Server mit Hilfe einer Anfrage an, die auf einer Tastatur eingegeben und von einem Browser interpretiert wird. Die Verwendung von Tastaturen ist in vielen Situationen, beispielsweise beim Autofahren, gefährlich oder gar verboten. Viele Anfragen enthalten einen URL (Uniform Resource Locator) des Servers, an den sich die meisten Benutzer nur schwierig erinnern können.
  • Andererseits sind interaktive Sprach-Antwort-Systeme, oft IVR-Systeme oder einfach Sprach-Server benannt, bekannt, in denen Audio-Informationen gespeichert werden können, welche einer Mehrzahl von Benutzern durch gesprochene Anfragen, die durch das Telefonnetzwerk übermittelt und im Sprach-Server interpretiert werden, zugänglich sind. Sprach-Server haben gegenüber HTTP-Servern den Vorteil, dass die Information ohne vorherige Kenntnisse und ohne spezielles Gerät aus jedem Telefonendgerät auf der Welt zugänglich ist, mit einer normalen Telefonnummer, die in herkömmlichen weissen oder gelben Telefonbücher gefunden werden kann.
  • IVR-Systeme umfassen gewöhnlich ein Spracherkennungsmodul, oft Spracherkenner oder Erkenner genannt, um die vom Benutzer gesprochenen Befehle zu erkennen und auszuführen. Einige IVR enthalten ferner ein Sprecheridentifizierungs- oder -prüfmodul, um die Identität des Benutzers zu identifizieren oder zu prüfen. Diese Systeme erlauben es dem Benutzer, durch ein sogenanntes „Sprachmenü" zu navigieren und die vom Server auszuführenden Befehle und Anfragen einzugeben.
  • Im Vergleich zu herkömmlichen personenbetriebenen Telediensten, die für die Lieferung von Waren oder Dienstleistungen zweckbestimmt sind, erlauben automatisierte IVR Systeme Kosteneinsparungen zu erreichen, indem die benötigten Personalressourcen reduziert werden. Ferner bieten diese Systeme den Benutzern einen besseren Dienst an, da diese nur selten ein Besetztzeichen hören.
  • In einigen Fällen können automatisierte System auch einen benutzerspezifischeren Dienst anbieten, wie beispielsweise von US-6061433 vorgeschlagen, welches einen automatisiertes Telefonsystem veröffentlicht, das benutzerspezifische Daten aus anderen Quellen als aus der Antwort des Anrufenden auf Menüanfragen beschaffen kann, was erlaubt, den Anruf direkt an die vom Benutzer vorgezogene Anwendungen anstelle an ein Einführungsmenü zu richten.
  • Ein schneller und genauer Spracherkenner ist von beispielloser Wichtigkeit, um den Marktanteil von Sprach-Servern und sprach-basierenden E-Kommerzanwendungen zu vergrössern. In herkömmlichen IVR Implementierungen betreibt jeder Dienstanbieter sein eigenes IVR-System. IVR-Systeme, auf die von einigen Benutzern nur selten zugegriffen werden, haben keine Gelegenheit, die Spracherkennungsmodelle dieser gelegentlichen Benutzer anzupassen, so dass die meisten für sprachfähige E-Kommerzanwendungen verwendeten Sracherkenner sprecherunabhängige Spracherkennungsalgorithmen verwenden. Für eine gewöhnliche Worterkennungsaufgabe können sprecherunabhängige Spracherkennungssysteme eine zweimal höhere Fehlerquote als sprecherabhängige Systeme aufweisen. Demzufolge bleibt die Spracherkennungsleistung in bekannten Sprachservern im Allgemeinen schlecht.
  • US-A-5915001 versucht, diesen Nachteil anzugehen, indem ein System und ein Verfahren vorgeschlagen werden, um anruferspezifische Profile zu liefern, die verschiedenen Anwendungen über das Internet zugänglich sind, so dass verschiedene IVR-Systeme ihre benutzerspezifische Daten teilen können. Dieses System verlangt jedoch immer noch, dass jede Anwendung ihren eigenen Sracherkenner laufen lässt, um die gesammelten Profile zu verarbeiten.
  • Einige IVR-Systeme erreichen eine bessere Leistung, indem sie sprecherabhängige Sprachmodelle verwenden, die im Allgemeinen während einer Anmeldungssitzung gelernt werden. Jedoch akzeptieren die meisten Benutzer nicht, die für eine verschiedene Anmeldesitzung mit jedem einzelnen Dienstanbieter benötigte Zeit aufzuwenden.
  • Beispiele von Spracherkennern sind beispielsweise in Patentanmeldungen EP-A2-570082 und WO-A-9914743 veröffentlicht sowie in „Voice Response for AIX – Designing and Mapping Applications Version 2 Release 2" von März 1999 (1999-03), COREPOINT TECHNOLOGIES.
  • „Voice Response for AIX – Speech Recognition with the BBN Hark Recognizer Version 2 Release 2" von März 1999 (1999-03), COREPOINT TECHNOLOGIES, beschreibt ferner verschiedene mögliche Konfigurationen eines eigenen breiten Sprach-Antwort-Systems in welchem, damit die Rechenlast über eine Vielzahl von Computersystemen verteilt ist, die Anwendungsteile des Sprach-Antwort-Systems auf einem Computersystem installiert werden kann, das über einem Local Area Network mit einem oder mehreren Systemen kommuniziert, auf welchem ein Spracherkennen läuft. In allen dieser Konfigurationen ist jedoch das Sprach-Antwort-System über Computersystem in einem LAN verteilt. Kein externer Zugang für Fernzugriff auf die Anwendungen ist vorgesehen.
  • EP-A2-782318 beschreibt ein System, um auf ein Sprach-Antwort-System über das Internet zuzugreifen und es zu konfigurieren. Das veröffentlichte Sprach-Antwort-System ist jedoch nicht geeignet, um zwischen unabhängigen Mehrwertdienstanbietern geteilt zu werden.
  • Ferner wurde zum heutigen Zeitpunkt die direkte Erkennung der Verrechnungs- und Lieferadresse des Benutzers als ausser Reichweite der aktuellen Sracherkennungstechnologie liegend betrachtet.
  • Zusammenfassung der Erfindung
  • Ein Ziel der Erfindung ist es, ein Sprach-Portal System und Verfahren mit verbesserten Spracherkennungsleistungen gegenüber den existierenden Methoden und Systemen anzubieten.
  • Ein anderes Ziel ist es, ein Sprach-Portal System und Verfahren anzubieten, welche die Notwendigkeit für eine explizite Anmeldung des Benutzers im Fall von einfachen Dienstleistungen vermeiden, und ein System, welches eine implizite Anpassungstechnik anbietet, welche die Gewohnheiten des Benutzers, seinen Sprachakzent und, schlussendlich, das von ihm benutzte Sprachmodel lernt.
  • Ein anderes Ziel ist es, ein Sprach-Portal System und Verfahren anzubieten, welche eine sprecherabhängige Spracherkennung verwenden und welche benutzt werden können, um die Spracherkennungsleistung mit Benutzern zu verbessern, die nur ab und zu auf einen spezifischen sprachfähigen Dienst zugreifen und keine Zeit für eine Anmeldesitzung mit diesem Dienst verbringen wollen.
  • Ein anderes Ziel ist es, ein Sprach-Portal System und Verfahren anzubieten, deren Einrichtung einfacher und kostengünstiger ist, insbesondere für kleine Dienstanbieter, und welche gute Erkennungsleistungen auch mit selten benutzten Diensten bieten.
  • Gemäss einer Ausführungsform der vorliegenden Erfindung enthält ein Sprach-Portal Host-System, das dazu geeignet ist, in einem ersten Sprachtelekommunikationsnetzwerk Verbindungen von einer Vielzahl von Benutzern zu empfangen, welche eine Sprach-Vorrichtung verwenden, einen Speicher, in welchem eine Vielzahl von interaktiven Sprach-Antwort-Anwendungen gespeichert werden können. Benanntes Sprach-Portal Host-System enthält ferner Lade-Mittel für das unabhängige Laden von benannten interaktiven Sprach-Antwort-Anwendungen in benanntem Speicher über ein zweites Telekommunikationsnetzwerk durch eine Vielzahl von unabhängigen Mehrwertdienstanbietern. Benanntes System ist in der Lage, ein Spracherkennungsmodul laufen zu lassen, welches mindestens einer Mehrzahl benannter interaktiver Sprach-Antwort-Anwendungen gemeinsam ist.
  • Das Sprach-Portal Host-System kann von einem Telekombetreiber betrieben werden, welcher das intelligente IVR System an eine Vielzahl von unabhängigen Mehrwertdienstanbietern anbietet.
  • Ein Vorteil ist, dass Benutzersprache und/oder Sprachmodelle im Hosting-System gespeichert und zwischen den verschiedenen Dienstanbietern geteilt werden können. Somit kann jeder Dienstanbieter von der allgemeinen Verbesserung der Spracherkennung- und/oder Sprecheridentifizierungsleistung profitieren.
  • Indem eine Vielzahl von Diensten in einem zentralen Host angeboten wird, kann ein attraktives Sprach-Portal, das eine umfassende Auswahl an Dienstleistungen und vorgeschlagenen Waren anbietet, eingerichtet werden.
  • In einer bevorzugten Ausführungsform liefert das erfindungsgemässe Sprach-Portal hochwertige „Engagement"-Dienstleistungen, beispielsweise einen Auskunftsdienst 23, Wetterberichte, usw., um den Benutzer zu einer Rückkehr zu bewegen und um eine Beziehung mit diesem Benutzer aufzubauen.
  • Kurze Beschreibung der Zeichnungen
  • 1 zeigt ein Diagramm eines Telekommunikationssystems einschliesslich einer Ausführungsform des erfindungsgemässen Sprach-Portal Host-Systems.
  • Detaillierte Beschreibung
  • 1 zeigt ein Diagramm eines Telekommunikationssystems einschliesslich eines Sprach-Portal Host-Systems 2. Eine Vielzahl von Benutzern 1 kann eine Sprachverbindung mit diesem Sprach-Portal 2 über ein öffentliches Telekommunikationsnetzwerk 10, wie ein öffentliches Fernsprechwählnetz (public switched telecommunication network, PSTN), dienstintegrierendes digitales Fernmeldenetz (integrated services data network, ISDN), ein Mobilfunktelekommunikationsnetzwerk, beispielsweise ein GSM-Netzwerk, oder ein sprach-fähiges IP-Netzwerk (VoIP), herzustellen. Die Verbindung wird hergestellt, indem die Telefonnummer des Sprach-Portals 2 auf einem Benutzer Endgerät 11, wie ein Telefonendgerät, ausgewählt wird. Vorzugsweise ist die Sprach-Portal-Telefonnummer eine gratis Geschäftsnummer im 0800-Bereich oder, in einer alternativen Ausführungsform, eine kostenpflichtige Nummer im 0900-Bereich.
  • Das Sprach-Portal Host-system enthält einen Dialogmanager (nicht abgebildet), der einen Sprachsynthesizer (nicht abgebildet) und ein Spracherkennungsmodul 24 (Spracherkennen) verwendet, um einen gesprochenen Dialog mit dem Benutzer 1 aufzubauen. Der Dialogmanager antwortet auf Befehle oder Anfragen, die vom Benutzer gesprochen werden, mit der geforderten Information oder Dienstleistung oder indem eine neue Verbindung mit einem externen Server hergestellt wird. Das Spracherkennungsmodul verwendet vorzugsweise HMM (Hidden Markov Models), adaptative neurale Netzwerke oder hybride Netzwerke. In einer bevorzugten Ausführungsform enthält das Spracherkennungsmodul Hidden Markov Models, die mit einem Toolkit wie dem NTK-Toolkit gebaut werden.
  • Für jeden im System registrierten Benutzer wird ein Benutzerprofil vorzugsweise in einer Datenbank 22 gespeichert. Das Benutzerprofil kann benutzerspezifische Information wie Name, Adresse, Telefon- und Telefaxnummer, E-Mail-Adresse, bevorzugte Sprache, bevorzugte Lieferadresse, bevorzugte Rechnungsadresse und/oder -typ (z. B. Kreditkarte, Scheck, Rechnung, Depositenkonto usw.), Konfigurationseinstellungen, Bestellungsgewohnheiten, a-priori Entscheidungen, Interesse und Geschmack, usw. Wenn der Zugang zum Portal-System 2 gesichert ist, kann das Benutzerprofil Sicherheitsinformationen wie beispielsweise Passworte, biometrische Parameter, elektronische öffentliche Schlüssel usw. enthalten.
  • In einer bevorzugten Ausführungsform wird das Sprach-Portal Host-System 2 vom Betreiber des Telekommunikationsnetzwerkes 10 betrieben. In diesem Fall kann das Benutzerprofil andere von diesem Betreiber bekannte Informationen, wie beispielsweise Bonität, enthalten.
  • Das System 2 enthält ferner Sprache- (und Sprecher-)-Modelle und/oder Sprachmodelle für jeden registrierten Benutzer; diese Modelle können in Datenbanken 20, 21 gespeichert oder implizit im Spracherkennen 24 enthalten werden.
  • Das System 2 enthält ein Benutzeridentifizierungsmodul 25, um die Identität des Benutzers 1, der gegenwärtig auf das System zugreift, zu bestimmen. Das Modul 25 kann die Authentifizierung CLI (Anschlusserkennung, calling line identity) oder IMSI (International Mobile Subscriber Identification) des vom Benutzer gebrauchten Terminals 11 verwenden und/oder eine Benutzeridentität, die auf einer Tastatur eingegeben wird oder vom Benutzer gesprochen wird, um seine Identität zu bestimmen. Wenn das Sprach-Portal Host-System vom Betreiber des Telekommunikationsnetzwerkes 10 betrieben wird, kann die A-Anrufer-Identifikation für diesen Zweck verwendet werden, auch wenn diese Identifikation für andere Zwecke und für andere Teilnehmer versteckt wurde, ohne die Benutzerdatenschutzrechte zu verletzen. In einer bevorzugten Ausführungsform identifiziert das Benutzeridentifizierungsmodul 25 in einem ersten Schritt das Gerät 11 und benutzt, in einem zweiten Schritt, ein Benutzeridentifizierungsverfahren um zu bestimmen, welcher Benutzer aus den bekannten Benutzern des Geräts 11 gegenwärtig das System anruft. Dieses Merkmal erlaubt es, zwischen den verschiedenen Personen in einem Haushalt oder in einer Firma, welche das gleiche Endgerät 11 teilen, zu unterscheiden. In einer alternativen Ausführungsform wird der Benutzer 1 aufgefordert, seinen Benutzername einzugeben, wenn er das System anruft; die deklinierte Identität wird dann mit Hilfe von bekannten Sprecherprüfverfahren geprüft. Das Benutzeridentizierungsmodul 25 benutzt vorzugsweise bekannte HMM-Techniken und in der Datenbank 20 gespeicherte Sprechermodelle.
  • Wenn der Benutzer vom Modul 25 identifiziert wurde, können sowohl seine Sprech- und Sprachmodelle als auch sein Profil von den Datenbanken 20, 21 und 22 abgerufen werden und vom Dialogmanager (nicht abgebildet) und vom Spracherkennuner 24 benutzt werden, um den Dialog und die Spracherkennung für jeden Benutzer anzupassen. Durch die Tatsache, dass sprecherabhängige Spracherkennung verwendet wird, wird eine bessere Leistung erzielt und daher wird sich die Dienstleistungsqualität verbessern.
  • Der Fachmann wird verstehen, dass anstelle davon, die benutzerabhängigen Sprechmödellen in der Datenbank 20 zu trainieren und zu speichern, Adaptationstechniken angewandt werden können. In diesem Fall, durch den Gebrauch von nur einer geringen Datenmenge von einem neuen Benutzer, kann ein guter sprecherunabhängiger Modelsatz angepasst werden, indem eine Maximum-Wahrscheinlichkeit (Maximum Likelihood) lineare Regression verwendet wird, um sich an den Merkmalen jedes Benutzers anzupassen. Diese Adaptation kann stufenweise durchgeführt werden, wenn Adaptationsdaten erhältlich wird (inkrementelle Adaptation).
  • Das Sprach-Portal Host-System 2 enthält zudem vorzugsweise einen Auskunftsdienst 23 und/oder verschiedene andere „Engagement"-Dienstleistungen, die vom Betreiber des Systems 2 angeboten werden können, um eine grosse Anzahl Benutzer anzuziehen, sie dazu zu ermutigen, dieses System zu benutzen, und sie dessen Telefonnummer erinnern zu lassen.
  • Erfindungsgemäss enthält das Sprach-Portal Host-System 2 einen Dokumentenserver 26, der wenigstens einen Speicher umfasst, in welchem eine Vielzahl von Sprachanwendungen unabhängig voneinander durch ein Telekommunikationsnetzwerk 3 mit Hilfe einer Vielzahl von unabhängigen Mehrwertdienstanbietern 4 geladen werden können. Jede Anwendung kann z. B. einem Angebot oder einer „Sprach-Site" ("voice site") eines Anbieters entsprechen; der Benutzer 1 kann auf jede Sprachanwendung aus dem gemeinsamen Menü zugreifen, das ihm angeboten wird, wenn er das System anruft.
  • Mindestens mehrere der Sprachanwendungen im Speicher 26 benutzen den gemeinsamen Spracherkennen 24, der auf dem Sprach-Portal Host-System 2 läuft. In einer bevorzugten Ausführungsform teilen in derselben Art mehrere der Sprachanwendungen im Speicher 26 die Sprachmodelle 21 und/oder wenigstens einen Teil des Benutzerprofils 22.
  • Die Anbieter können im System 3 eine Sprachanwendung über ein Telekommunikationsnetzwerk, beispielsweise ein TCP/IP Netzwerk, ein öffentliches Fernsprechwählnetz (public switched telecommunication network, PSTN), ein dienstintegrierendes digitales Fernmeldenetz (integrated services data network, ISDN), ein X25 Netzwerk, laden. Die Sprachanwendung kann eine Sammlung von Softwareobjekten und/oder Komponenten enthalten, wie Programmdateien, Java-Beans, Corba-Komponenten usw., welche im Speicher 26 installiert und von einem geeigneten Prozessor ausgeführt werden können. Die Sprachanwendung kann nicht-kompilierte oder vorkompilierte Softwaremodule umfassen, die von einem gemeinsamen Kompilierungsmodul (nicht abgebildet) in benanntem Sprach-Portal Host-System 2 kompiliert oder interpretiert werden. In einer bevorzugten Ausführungsform umfasst die Sprachanwendung ein VoiceXML-Dokument, oder einen Satz von VoiceXML-Dokumenten, die einen endlichen Konversationsautomat bilden und die mit Hilfe der bekannten, vom VoiceXML-Forum aufgestellten Voice Extensible Markup Language (VoiceXML) geschrieben werden. Die VoiceXML ist eine Computersprache, die dazu konzipiert wurde, Informationen via Sprache und Telefon zugänglich zu machen und Audiodialoge zu kreieren, welche eine mittels Sprachsynthesizer erzeugte Sprache, digitalisierte Audio, eine Erkennung von gesprochenen Eingaben und MFV-Eingaben (Mehrfrequenzverfahren), eine Aufnahme von gesprochenen Eingaben, und interaktive Austausche aufweisen. In dieser Ausführungsform umfasst der Dokumentenserver einen VoiceXML-Interpreter, um die VoiceXML-Dokumente zu verarbeiten, die von den Benutzern 1, die das Sprach-Portal Host-System 2 anrufen, angefordert werden.
  • Gemäss der Endung verwenden der Erkennen 24 und/oder das Benutzeridentifizierungsmodul 25 ein gemeinsames online Sprachadaptationsmodul 240, um die Sprech- und/oder Sprachemodelle anzupassen, und/oder um die HMMs im Erkennen 24 und/oder im Sprecheridentifizierungsmodul 25 anzupassen. Dies erlaubt, dass eine grosse Menge an Trainingsmaterial aus all den unterliegenden Diensten 40, 41, 42, 43 usw. verwertet werden kann. Die Konsequenz davon ist, dass die Spracherkennung durch zwei mögliche Verfahren bedeutend angereichert wird: (i) die Personalisierung der Spracherkennung je nach Benutzer 1 oder (ii) einfach die Verbesserung der Qualität der sprecherunabhängigen Spracherkennung und der Sprecheridentifizierung durch periodisches Neutraining mit den kurrenten Sprachdaten. Das Ziel des ersten Verfahrens ist es, ein sprecherunabhängiges Spracherkennungssystem an einem bestimmen Benutzer 1 anzupassen und somit aus der durch die sprecherabhängigen Erkennungsmethoden gebotenen Leistungsverbesserung Nutzen zu ziehen. Zusätzlich wird das stochastische Sprachmodel in eine Datenbank 21 gespeichert und für jeden bestimmten Benutzer und Dienstzugriff aktualisiert. Demzufolge kann das Vorangegangene des Sprachmodels das gesamte Spracherkennungsresultat bereichern.
  • Daraus resultiert, dass jeder Dienstanbieter 40 für seine VoiceXML-Dokumente aus einem Erkennen Nutzen ziehen kann, der Benutzersprachmodelle verwendet, die jedesmal verbessert werden, wenn ein Benutzer auf eine der verschiedenen Dienste 23, 40, 41, 42, 43 usw. zugreift.
  • In der Spracherkennung werden das Sprachmodel und das akustische Model durch den Bayes Regel verknüpft: P(ωj|x) = p(x|ωj)P(ωj)/p(x) wo P(ωj) das Sprachmodel und p(x|ωj) das akustische Model ist: die Wahrscheinlichkeitsdensitätsfunktion der Beobachtungsfolge x je nach Lexikonwort ωj. Die Klassifikation wird auf der Basis der Schätzung der maximalen a posteriori Wahrscheinlichkeit P(ωj|x) gemacht.
  • Vorzugsweise hört das Sprach-Portal Host-System 2 die Kommunikation weiterhin mit, währen der Anruf an einen bestimmten Mehrwertdienstanbieter 4 weitergeleitet wird; der Zweck ist, die gesprochenen Elemente für die weitere Adaptation der Sprech- und Sprachmodelle 20, 21 aufzunehmen.
  • In einer bevorzugten Ausführungsform werden die Anrufe der Benutzer temporär in das Sprach-Portal Host-System 2 aufgenommen, um eine offline Adaptation der Benutzersprech- und -sprachmodelle 20, 21 zu gewährleisten. Anrufe können nach einer bestimmten Zeitspanne oder vorzugsweise, sobald sie für die Adaptation der Modelle benutzt wurden, gelöscht werden.
  • Die vom Benutzer im Sprachmenü getroffene Wahl und Auswahl werden vorzugsweise individuell und/oder statistisch gespeichert, um eine generelle und/oder benutzerspezifische Verbesserung in der Verästelung des Sprachmenüs zu gewährleisten oder um benutzerspezifische Optionen und Angebote zu bieten. Menüoptionen, die von einem bestimmten Benutzer und/oder von den meisten Benutzern oft ausgewählt werden können reorganisiert werden, um einfacher zugänglich zu sein. Ferner kann das Kennen der Wahrscheinlichkeit jeder Auswahl benutzt werden, um die Qualität der Spracherkennung für jede mögliche Option in einem Menü zu verbessern.
  • Das Sprach-Portal Host-System 2 umfasst vorzugsweise ein gemeinsames Verrechnungsmodul und ein gemeinsames Clearingzenter (nicht abgebildet), um die erhaltenen Beträge zu sammeln und an die Mehrwertdienstanbieter 4 weiterzuleiten. Daraus resultiert, dass eine Vielzahl von Dienstanbietern geteilte Module, Komponenten, Funktionen und/oder Objekte im Sprach-Portal Host-System 2 für die Verrechnung des Zugriffs auf ihre Dienste auf einer pro-Minute oder pro-Ansicht Zahlungsbasis und/oder für die Verrechnung der Transaktionen zwischen Benutzern 1 und Anbietern 4 verwenden können. Die Verrechnung kann mit einer gemeinsamen Rechnung erfolgen, die vom Betreiber des Sprach-Portal Host-Systems 2 vorbereitet wird und die alle Beträge umfasst, welche von den Benutzern dem benannten Betreiber und den Anbietern 4 geschuldet sind; wenn das System 2 vom Betreiber des Telekommunikationsnetzwerk 10 betrieben wird, kann die Verrechnung mit der an die Benutzer des Netzwerks gesandten Telefonrechnung erfolgen.
  • In einer alternativen Ausführungsform haben mindestens mehrere Benutzer 1 ein Depositenkonto mit benanntem Sprach-Portal Host-system 2, das für Transaktionen mit einer Vielzahl von Mehrwertdienstanbietern verwendet werden kann. Es ist auch möglich, die Kreditkarte oder Telefonkarte der Benutzer für jede Transaktion oder Verbindung mit irgendeinem der Anbieter 4 zu belasten. Vorzugsweise werden die Rechnungsadresse und/oder -einstellungen für jeden Benutzer in der Benutzerprofildatenbank 22 registriert.
  • Wenn das Sprach-Portal Host-System 2 einen Zugang zum Auskunftsdienst 23, wie dargestellt, integriert, kann mit diesem Auskunftsdienst die Rechnungs- und/oder Lieferadresse des Benutzers auch gefunden, geprüft oder vervollständigt werden.
  • Indem angepasste Anfragen verwendet werden, können vorzugsweise die verschiedenen Sprachanwendungen im Speicher 26 mindestens auf einen Teil des Inhalts der gemeinsamen Benutzerprofildatenbank 22 zugreifen, um beispielsweise die voreingestellte Rechnungsadresse und die Einstellungen, die voreingestellte Lieferadresse, die bevorzugte Sprache des Benutzers und so weiter abzurufen. In einer bevorzugten Ausführungsform kann mindestens ein Teil der Benutzerdaten in der Datenbank 22 von einer Vielzahl von Sprachanwendungen von verschiedenen Dienstanbietern aktualisiert werden.
  • Mindestens einige in den Speicher 26 aufgeladene Sprachanwendungen sind sprach-fähige E-Kommerzanwendungen, die dem Sprach-Portal Host-System 2 erlauben, die Beziehung mit dem Benutzer 1 finanziell zu verwerten. Das Beispiel eines automatischen Pizzabestellungssystems ist eine typische Einnahmen schaffende interaktive Sprach-Antwort-Anwendung. In diesem Beispiel ist der Dienstanbieter 4 eine Pizzafirma, die dem Telekombetreiber einen kleinen Betrag pro Anruf oder pro Bestellung sowie auch eine monatliche Gebühr für das Diensthosting bezahlt.
  • Im folgenden Dialog möchte der Benutzer 1 auf die hosted Sprachanwendung der Pizzafirma 40 zugreifen, um eine Pizza Vierjahreszeiten zu bestellen.
  • Figure 00130001
  • Figure 00140001
  • Das Sprach-Portal Host-System 2 kann einen Standard-Digitalcomputer 2 enthalten, der sowohl mit einem ersten Telekommunikationsnetzwerk 10, zum Beispiel einem PSTN-, ISDN-, GSM- oder TCP/IP-Netzwerk, wie auch mit einem zweiten Telekommunikationsnetzwerk 3, zum Beispiel einem TCP/IP-, PSTN-, ISDN- oder X25-Netzwerk, verbunden ist, und der einen internen Speicher (nicht abgebildet) enthält, in welchem ein Computersoftwareprodukt 26 direkt geladen werden kann, um die Verfahrensschritte der Erfindung auszuführen, wenn benanntes Produkt auf benanntem Computer läuft.

Claims (48)

  1. Sprach-Portal Host-System (2), dazu geeignet, in einem ersten Sprachtelekommunikationsnetzwerk (10) Verbindungen von einer Vielzahl von Benutzern (1), welche eine Sprach-Vorrichtung (11) verwenden, zu empfangen, dadurch gekennzeichnet, dass benanntes Sprach-Portal Host-System einen Speicher (26) enthält, in welchem eine Vielzahl von interaktiven Sprach-Antwort-Anwendungen gespeichert werden können, und dass benanntes Sprach-Portal Host-System ferner Lade-Mittel enthält, für das unabhängige Laden von benannten interaktiven Sprach-Antwort-Anwendungen in benannten Speicher (26) über ein zweites Telekommunikationsnetzwerk (3) durch eine Vielzahl von unabhängigen Mehrwertdienstanbietern (4), und dass benanntes System in der Lage ist, ein Spracherkennungsmodul (24) laufen zu lassen, welches mindestens einer Mehrzahl benannter interaktiver Sprach-Antwort-Anwendungen gemeinsam ist.
  2. Sprach-Portal Host-System gemäss Anspruch 1, in welchem benanntes gemeinsames Spracherkennungsmodul (24) in der Lage ist, eine gemeinsame Benutzerprofildatenbank (22) zu verwenden.
  3. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benannte gemeinsame Benutzerprofildatenbank (22) Benutzereinstellungen enthält.
  4. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benannte Benutzereinstellungen eine Lieferadresse für Waren und/oder Dienstleistungen enthält, welche bei benannten unabhängigen Mehrwertdienstanbietern (4) bestellt wurden.
  5. Sprach-Portal Host-System gemäss Anspruch 3, in welchem benannte Benutzereinstellungen eine Rechnungsadresse und/oder Einstellungen für Waren und Dienstleistungen enthalten, welche bei benannten unabhängigen Mehrwertdienstanbietern (4) bestellt wurden.
  6. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem benanntes gemeinsames Spracherkennungsmodul (24) geeignet ist, benutzerspezifische Sprachmodelle (20) zu benutzen.
  7. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, beinhaltend Mittel zur Anpassung der mit einem Benutzer (1) verbundenen gemeinsamen Sprachmodelle (20) während jedem Dialog zwischenbenannten Benutzern (1) und jedem der benannten interaktiven Sprach-Antwort-Anwendungen.
  8. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benannte Mittel zur Anpassung benannter gemeinsamer Sprachmodelle angepasst werden, um aufgezeichnete Benutzersprachbeispiele zur offline Anpassung benannter gemeinsamer Sprachmodelle anzupassen zu benutzen.
  9. Sprach-Portal Host-System gemäss einem der Ansprüche 1 bis 5, in welchem benanntes gemeinsames Spracherkennungsmodul angepasst ist, um Hidden Markov Models zu benutzen, und ferner ein Hidden Markov Models Adaptionsmodul (240) enthält, um benannte Modelle an benannten Benutzer anzupassen.
  10. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benanntes Hidden Markov Models Adaptionsmodul (240) angepasst ist, um benannte Modelle schrittweise anzupassen.
  11. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benanntes gemeinsames Spracherkennungsmodul (24) angepasst ist, um gemeinsame benutzerspezifische Sprachmodelle (21) zu benutzen.
  12. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, beinhaltend Mittel zur Anpassung der benannten, mit einem Benutzer (1) verbundenen gemeinsamen benutzerspezifischen Sprachmodelle (21) während jedem Dialog zwischen benanntem Benutzer (1) und jedem der benannten interaktiven Sprach-Antwort-Anwendungen.
  13. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem benanntes gemeinsames Spracherkennungsmodul (24) angepasst ist, um eine von benannten Benutzern früher getroffene Auswahl zu benutzen.
  14. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem benannte von benannten Benutzern früher getroffene Auswahl in benanntem Sprach-Portal Host-System gespeichert wird, um die Verästelung der Menüs zu verbessern.
  15. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem mindestens eine Vielzahl benannter interaktiver Sprach-Antwort-Anwendungen angepasst sind, um ein gemeinsames Benutzeridentifizierungsmodul (25), das auf benanntem System (2) läuft, zu benutzen.
  16. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benanntes Benutzeridentifizierungsmodul (25) angepasst ist, um eine Identifikation der von benanntem Benutzer (1) in benanntem ersten Telekommunikationsnetzwerk (10) benutzten Einrichtung (11) zu benutzen.
  17. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, das von einem Telekombetreiber von benanntem erstem Telekommunikationsnetzwerk betrieben wird, in welchem benanntes Benutzeridentifizierungsmodul (25) angepasst ist, um eine Identifikation der von benanntem Benutzer in benanntem ersten Telekommunikationsnetzwerk (10) der Einrichtung (11) zu benutzen, sogar wenn benannte Identifikation für andere B-Teilnehmer von benanntem erstem Telekommunikationsnetzwerk nicht vorhanden ist.
  18. Sprach-Portal Host-System gemäss einem der Ansprüche 15 bis 17, in welchem benanntes Benutzeridentifizierungsmodul (25) angepasst ist, um ein sprachbasiertes Benutzeridentifizierungsmodul zu benutzen.
  19. Sprach-Portal Host-System gemäss einem der Ansprüche 15 bis 18, in welchem benanntes Benutzeridentifizierungsmodul (25) angepasst ist, um ein sprecherbasierenden Spracherkennungsalgorithmus zu benutzen, in welchem benannter Sprecher durch benanntes gemeinsames Benutzeridentifizierungsmodul identifiziert wird.
  20. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem mindestens eine Vielzahl von benannten interaktiven Sprach-Antwort-Anwendungen angepasst sind, um ein bekanntes Rechnungsmodul und ein bekanntes Clearingzenter zu benutzen, um die angesammelten Beträge an benannten Mehrwertdienstanbietern (4) zu verschicken.
  21. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benanntes gemeinsames Rechnungsmodul angepasst ist, um die Transaktionen zwischen benannten Benutzern (1) und benannten Mehrwertdienstanbietern (4) auf einer gemeinsamen Rechnung zu verrechnen, welche vom Betreiber des benannten Sprach-Portal Host-System vorbereitet wird.
  22. Sprach-Portal Host-System gemäss Anspruch 20, in welchem mindestens eine Mehrzahl benannter Benutzer ein Debitorenkonto auf benanntem Sprach-Portal Host-System (2) für Transaktionen mit einer Mehrzahl von benannten Mehrwertdienstanbietern (4) besitzt.
  23. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem mindestens eine Vielzahl von benannten interaktiven Sprach-Antwort-Anwendungen angepasst sind, um ein auf einer elektro nischen Unterschrift und/oder auf biologischen Parametern von benannten Benutzern basierendes Benutzeridentifizierungsmodul zu benutzen.
  24. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem benanntes zweites Telekommunikationssystem (3) ein TCP/IP Netzwerk ist.
  25. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem mindestens einige der benannten interaktiven Sprach-Antwort-Anwendungen mit Voice Extensible Markup Language Dokumenten beschrieben werden.
  26. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem ein auf benanntem System laufendes Kompilierungsmodul benannte interaktive Sprach-Antwort-Anwendungen kompiliert.
  27. Sprach-Portal Host-System gemäss einem der vorhergehenden Ansprüche, in welchem mindestens eine kostenlose interaktive Sprach-Antwort-Anwendung (23) durch den Betreiber des benannten Systems zur Verfügung gestellt wird.
  28. Sprach-Portal Host-System gemäss dem vorhergehenden Anspruch, in welchem benannte kostenlose interaktive Sprach-Antwort-Anwendung (23) einen kostenlosen Auskunftsdienst enthält.
  29. Verfahren, um jedem einer Vielzahl von Mehrwertdienstanbietern (4) zu erlauben, eine interaktive Sprach-Antwort-Anwendung einzurichten, welche angepasst ist, um von einer Vielzahl von Benutzern (1) benutzt zu werden, dadurch gekennzeichnet, dass benannte interaktive Sprach-Antwort-Anwendung unabhängig durch ein Telekommunikationsnetzwerk (3) in ein Sprach-Portal Host-System (2) geladen wird, mit welchem benannte Vielzahl von Benutzern eine Verbindung mit Hilfe einer von benannter Vielzahl von Mehrwertdienstanbietern (4) normalerweise benutzten Spracheinrichtung (11) herstellen kann, wobei mindestens eine Vielzahl benannter Anwendungen ein auf benanntem Sprach-Portal Host-System (2) laufendes gemeinsames Modul zur Spracherkennung (24) benutzt.
  30. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benannte interaktive Sprach-Antwort-Anwendungen eine in benanntem Sprach-Portal Host-System (2) gespeicherte gemeinsame Benutzerprofildatenbank (22) benutzen.
  31. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benannte interaktive Sprach-Antwort-Anwendungen in benannter gemeinsamer Benutzerprofildatenbank (22) gespeicherte Benutzereinstellungen benutzen.
  32. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benannte Benutzereinstellungen eine Lieferadresse für Waren und/oder Dienstleistungen enthält, welche bei benannten unabhängigen Mehrwertdienstanbietern (4) bestellt wurden
  33. Verfahren gemäss dem Anspruch 32, in welchem benannte Benutzereinstellungen eine Rechnungsadresse und/oder Einstellungen für Waren und Dienstleistungen enthalten, welche bei benannten unabhängigen Mehrwertdienstanbietern (4) bestellt wurden.
  34. Verfahren gemäss einem der Ansprüche 29 bis 33, in welchem benanntes gemeinsames Spracherkennungsmodul (24) benutzerspezifische Sprachmodelle (20) benutzt.
  35. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benannte mit einem Benutzer verbundene gemeinsame Sprachmodelle (20) während jedem Dialog zwischen benannten Benutzern (1) und jedem der benannten interaktiven Sprach-Antwort-Anwendungen angepasst werden.
  36. Verfahren gemäss einem der Ansprüche 29 bis 35, in welchem benanntes gemeinsames Spracherkennungsmodul (24) gemeinsame benutzerspezifische Sprachmodelle (21) benutzt.
  37. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benannte mit einem Benutzer (1) verbundene gemeinsame benutzerspezifische Sprachmodelle (21) während jedem Dialog zwischen benanntem Benutzer (1) und jedem der benannten interaktiven Sprach-Antwort-Anwendungen angepasst werden.
  38. Verfahren gemäss einem der Ansprüche 29 bis 37, in welchem mindestens eine Vielzahl benannter interaktiver Sprach-Antwort-Anwendungen ein auf benanntem System (2) laufendes gemeinsames Benutzeridentifizierungsmodul (25) benutzt.
  39. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benanntes Benutzeridentifizierungsmodul (25) eine Identifikation der von benanntem Benutzer (1) in benanntem ersten Telekommunikationsnetzwerk (10) benutzten Einrichtung (11) benutzt.
  40. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benanntes Sprach-Portal Host-System (2) von einem Telekombetreiber von benanntem erstem Telekommunikationsnetzwerk betrieben wird, in welchem benanntes Benutzeridentifizierungsmodul (25) eine Identifikation der von benanntem Benutzer benutzten Einrichtung (11) in benanntem ersten Telekommunikationsnetzwerk (10) benutzt, sogar wenn benannte Identifikation für andere B-Teilnehmer von benanntem erstem Telekommunikationsnetzwerk nicht vorhanden ist.
  41. Verfahren gemäss einem der Ansprüche 38 bis 40, in welchem benanntes Benutzeridentifizierungsmodul (25) ein sprachbasiertes Benutzeridentifizierungsmodul benutzt.
  42. Verfahren gemäss einem der Ansprüche 38 bis 40, in welchem benanntes Benutzeridentifizierungsmodul (25) ein sprecherbasierenden Spracherkennungsalgorithmus benutzt, wobei benannter Benutzer durch benanntes gemeinsames Benutzeridentifizierungsmodul (25) identifiziert wird.
  43. Verfahren gemäss einem der Ansprüche 29 bis 42, in welchem mindestens eine Vielzahl von benannten interaktiven Sprach-Antwort-Anwendungen ein bekanntes Rechnungsmodul und ein bekanntes Clearingzenter benutzt, um die angesammelten Beträge an benannten Mehrwertdienstanbietern (4) zu verschicken.
  44. Verfahren gemäss dem vorhergehenden Anspruch, in welchem benanntes gemeinsames Rechnungsmodul angepasst ist, um die Transaktionen zwischen benannten Benutzern (1) und benannten Mehrwertdienstanbietern (4) auf einer gemeinsamen Rechnung zu verrechnen, welche vom Betreiber des benannten Sprach-Portal Host-System vorbereitet wird.
  45. Verfahren gemäss Anspruch 43, in welchem mindestens eine Mehrzahl von benannten Benutzern (1) ein Debitorenkonto auf benanntem Sprach-Portal Host-System (2) für Transaktionen mit einer Mehrzahl von benannten Mehrwertdienstanbietern (4) besitzt.
  46. Verfahren gemäss einem der Ansprüche 29 bis 45, in welchem mindestens eine Vielzahl von benannten interaktiven Sprach-Antwort-Anwendungen ein auf einer elektronischen Unterschrift und/oder auf biologischen Parametern von benannten Benutzern basierendes Benutzeridentifizierungsmodul benutzt.
  47. Verfahren gemäss einem der Ansprüche 29 bis 46, in welchem mindestens einige der benannten interaktiven Sprach-Antwort-Anwendungen mit Voice Extensible Markup Language Dokumenten beschrieben werden.
  48. Verfahren gemäss dem vorhergehenden Anspruch, in welchem ein auf benanntem Sprach-Portal Host-System (2) laufendes Kompilierungsmodul benannte interaktive Sprach-Antwort-Anwendungen kompiliert.
DE60001809T 2000-05-16 2000-05-16 Sprach-Portal Host-Rechner und Verfahren Expired - Lifetime DE60001809T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP00110430A EP1156649B1 (de) 2000-05-16 2000-05-16 Sprach-Portal Host-Rechner und Verfahren

Publications (2)

Publication Number Publication Date
DE60001809D1 DE60001809D1 (de) 2003-04-30
DE60001809T2 true DE60001809T2 (de) 2004-03-11

Family

ID=8168737

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60001809T Expired - Lifetime DE60001809T2 (de) 2000-05-16 2000-05-16 Sprach-Portal Host-Rechner und Verfahren

Country Status (4)

Country Link
US (1) US8457970B2 (de)
EP (1) EP1156649B1 (de)
AT (1) ATE235773T1 (de)
DE (1) DE60001809T2 (de)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7213027B1 (en) 2000-03-21 2007-05-01 Aol Llc System and method for the transformation and canonicalization of semantically structured data
US7334050B2 (en) * 2000-06-07 2008-02-19 Nvidia International, Inc. Voice applications and voice-based interface
US6785647B2 (en) * 2001-04-20 2004-08-31 William R. Hutchison Speech recognition system with network accessible speech processing resources
US20030120626A1 (en) * 2001-12-20 2003-06-26 Koninklijke Philips Electronics N.V. Voice-enabled, consumer transaction system
EP1337097A1 (de) * 2002-02-19 2003-08-20 Siemens Aktiengesellschaft Effiziente Ausnutzung von für Vermittlungssysteme bereitgestellten IVR-Ressourcen
KR20020035797A (ko) * 2002-04-12 2002-05-15 송진호 패킷통신을 이용한 에이알에스 제어방법
US7451207B2 (en) * 2002-06-28 2008-11-11 Intel Corporation Predictive provisioning of media resources
US20040010408A1 (en) * 2002-07-10 2004-01-15 Mani Babu V. Method and system for identifying a caller based on voice recognition
US6876727B2 (en) * 2002-07-24 2005-04-05 Sbc Properties, Lp Voice over IP method for developing interactive voice response system
US7571100B2 (en) * 2002-12-03 2009-08-04 Speechworks International, Inc. Speech recognition and speaker verification using distributed speech processing
US6996211B2 (en) * 2002-12-23 2006-02-07 Sbc Properties, L.P. Voice over IP method of determining caller identification
US7221753B2 (en) * 2003-03-04 2007-05-22 Verizon Business Global Llc Method and system for providing network interactive voice response with intelligent call routing integration
CN1762142B (zh) 2003-03-21 2012-05-23 西门子公司 提供和有效利用基于分组的网络中用于生成和输出信息的资源的方法和装置
CN1853422A (zh) * 2003-07-18 2006-10-25 西门子公司 通知和对话业务的业务提供商特定的单独的更新或改组
GB2409560B (en) * 2003-12-23 2007-07-25 Ibm Interactive speech recognition model
US7751535B2 (en) * 2004-04-28 2010-07-06 Nuance Communications, Inc. Voice browser implemented as a distributable component
US7107220B2 (en) * 2004-07-30 2006-09-12 Sbc Knowledge Ventures, L.P. Centralized biometric authentication
US7254383B2 (en) * 2004-07-30 2007-08-07 At&T Knowledge Ventures, L.P. Voice over IP based biometric authentication
US8369230B1 (en) 2004-12-22 2013-02-05 At&T Intellectual Property Ii, L.P. Method and apparatus for determining a direct measure of quality in a packet-switched network
US7440894B2 (en) * 2005-08-09 2008-10-21 International Business Machines Corporation Method and system for creation of voice training profiles with multiple methods with uniform server mechanism using heterogeneous devices
CN101449569A (zh) * 2005-12-06 2009-06-03 丹尼尔·J·辛普森 交互式自然语言呼叫系统
US8700902B2 (en) 2006-02-13 2014-04-15 At&T Intellectual Property I, L.P. Methods and apparatus to certify digital signatures
US9386151B2 (en) 2007-11-23 2016-07-05 Foncloud, Inc. System and method for replacing hold-time with a call-back in a contact center environment
US8908847B2 (en) 2007-11-23 2014-12-09 Foncloud, Inc. System and method for deep dialing phone systems
US9288316B2 (en) 2007-11-23 2016-03-15 Foncloud, Inc. System and method for eliminating hold-time in phone calls
US8515028B2 (en) 2007-11-23 2013-08-20 Foncloud, Inc. System and method for externally mapping an Interactive Voice Response menu
WO2009067719A2 (en) 2007-11-23 2009-05-28 Foncloud, Inc. Method for determining the on-hold status in a call
WO2009114498A2 (en) * 2008-03-10 2009-09-17 Foncloud, Inc. System and method for externally mapping an interactive voice response menu
US8229081B2 (en) * 2008-04-24 2012-07-24 International Business Machines Corporation Dynamically publishing directory information for a plurality of interactive voice response systems
US8073112B2 (en) * 2008-07-02 2011-12-06 International Business Machines Corporation Method and system to manage multiple IVRs

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5309355A (en) * 1984-05-24 1994-05-03 Lockwood Lawrence B Automated sales system
GB8809898D0 (en) * 1988-04-27 1988-06-02 British Telecomm Voice-operated service
US5345501A (en) * 1991-07-15 1994-09-06 Bell Atlantic Network Services, Inc. Telephone central office based method of and system for processing customer orders
US6061433A (en) * 1995-10-19 2000-05-09 Intervoice Limited Partnership Dynamically changeable menus based on externally available data
GB2308781A (en) * 1995-12-29 1997-07-02 Ibm Client-Server system
US6073101A (en) * 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
DE69603971T2 (de) * 1996-12-13 2000-03-30 Ericsson Telefon Ab L M Verfahren und System zur Durchführung von Geldtransaktionen
US6088669A (en) * 1997-01-28 2000-07-11 International Business Machines, Corporation Speech recognition with attempted speaker recognition for speaker model prefetching or alternative speech modeling
US6094635A (en) * 1997-09-17 2000-07-25 Unisys Corporation System and method for speech enabled application
US6487277B2 (en) * 1997-09-19 2002-11-26 Siemens Information And Communication Networks, Inc. Apparatus and method for improving the user interface of integrated voice response systems
US6341264B1 (en) * 1999-02-25 2002-01-22 Matsushita Electric Industrial Co., Ltd. Adaptation system and method for E-commerce and V-commerce applications
US6604075B1 (en) * 1999-05-20 2003-08-05 Lucent Technologies Inc. Web-based voice dialog interface
US6707889B1 (en) * 1999-08-24 2004-03-16 Microstrategy Incorporated Multiple voice network access provider system and method
US6792086B1 (en) * 1999-08-24 2004-09-14 Microstrategy, Inc. Voice network access provider system and method
US6873693B1 (en) * 1999-09-13 2005-03-29 Microstrategy, Incorporated System and method for real-time, personalized, dynamic, interactive voice services for entertainment-related information
US6510417B1 (en) * 2000-03-21 2003-01-21 America Online, Inc. System and method for voice access to internet-based information
US6658414B2 (en) * 2001-03-06 2003-12-02 Topic Radio, Inc. Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals

Also Published As

Publication number Publication date
EP1156649A1 (de) 2001-11-21
EP1156649B1 (de) 2003-03-26
US8457970B2 (en) 2013-06-04
US20010055370A1 (en) 2001-12-27
ATE235773T1 (de) 2003-04-15
DE60001809D1 (de) 2003-04-30

Similar Documents

Publication Publication Date Title
DE60001809T2 (de) Sprach-Portal Host-Rechner und Verfahren
US7376740B1 (en) Phone application state management mechanism
DE69837578T2 (de) Verfahren und Gerät für automatische Sprachmodusselektion
EP1956814B1 (de) Digitales Verfahren und Anordnung zur Authentifizierung eines Nutzers eines Telekommunikations- bzw. Datennetzes
DE69936362T2 (de) Verbesserte intelligente Netzwerke
DE60305458T2 (de) System und verfahren zur bereitstellung einer nachrichtengestützten kommunikationsinfrastruktur für einen automatisierten anrufzentralenbetrieb
US8265261B1 (en) Telephone channel personalization
DE60215862T2 (de) Kontinuierliche Anlage für Kunststofflaminate, einschliesslich der Mehrschichtigen, in Kaltpresse
DE102011080846A1 (de) Dienstbereitstellungsnetzwerk
DE60123544T2 (de) System und Verfahren zur Verwendung eines Fernsprechapparates für den Zugriff auf Informationen in einer Anrufzentrale
EP0944231B1 (de) Verfahren zur Bereitstellung von telekommunikationsgestützten Dienstleistungen
EP1675369A1 (de) Verfahren und Vorrichtung zum anonymen Verbindungsaufbau in einem Telekommunikationsnetz
DE69929416T2 (de) Verfahren und geeigneter Server für Ferndienste
EP1022888B1 (de) Verfahren, Telekommunikationssystem und geeignete Vorrichtung zur Sicherung von Diensten in einem Telekommunikationsnetz
WO2000014945A1 (de) Verfahren und kommunikations netz mittels spracherkennung zur gebührenabrechnung für die sprachtelefonie
DE10001079A1 (de) Verfahren, Internet-Zugangseinrichtung, Vermittlungsstelle und Gebührenerfassungseinrichtung zur individuellen Vergebührung von Internet-Diensten
DE10050360B4 (de) Verfahren Aktivierung und/oder Deaktivierung von Diensten in einem Vermittlungssystem
DE10328090B4 (de) Verfahren zur Herstellung einer Sprachkommunikationsverbindung
EP1475945B1 (de) Verfahren zur herstellung einer sprachkommunikationsverbindung mittels einer telefonbuch-datenbank
DE69916061T2 (de) Personalisierte Informationsverarbeitungsschaltung
DE10204436A1 (de) Kontinuierliche Benutzerauthentisierung mittels Spracheingabe
EP1222801A2 (de) Verfahren zum telephonischen nachladen eines gesprächsguthabens und telephonkarte mit einem chip
DE19644386A1 (de) Verfahren zur Gebührenfreien automatischen Vermittlung und Verbindung
DE102007026293B4 (de) Telefonanruf- und Telefonabrechnungsverfahren und computergestütztes Dialogsystem
DE102018123279A1 (de) Verfahren zum Aufbau und Handhabung eines Sprach- und/oder Videoanrufs zwischen mindestens zwei Benutzerendgeräten

Legal Events

Date Code Title Description
8327 Change in the person/name/address of the patent owner

Owner name: SWISSCOM FIXNET AG, BERN, CH

8327 Change in the person/name/address of the patent owner

Owner name: SWISSCOM AG, BERN, CH