WO2005011235A1

WO2005011235A1 - Verfahren und system zum bereitstellen einer freisprechfunktionalität bei mobilen telekommunikationsendeinrichtungen durch temporäres herunterladen eines sprachverarbeitungsalgorithmus

Info

Publication number: WO2005011235A1
Application number: PCT/DE2004/001253
Authority: WO
Inventors: Fred Runge; Christel Müller; Marian Trinkel; Rainer Zelinski
Original assignee: Deutsche Telecom Ag
Priority date: 2003-07-22
Filing date: 2004-06-17
Publication date: 2005-02-03
Also published as: EP1649672A1; DE10333896A1; US20060223512A1

Abstract

Die Erfindung betrifft die Freisprechkommunikation unter Nutzung einer Telekommunikationsendeinrichtung. Eine Aufgabe der Erfindung ist es, einen gegenüber dem Stand der Technik neuen und verbesserten Weg aufzuzeigen, mit welchem eine äußerst flexible Freisprechfunktionalität für Telekommunikationsendeinrichtungen insgesamt gewährleistbar ist, insbesondere jedoch für mobile Telekommunikationsendeinrichtungen, die in der Regel nur eine sehr begrenzte Festspeicherkapazität aufweisen. Die Erfindung schlägt für eine Freisprechkommunikation unter Nutzung einer Telekommunikationsendeinrichtung, insbesondere einer mobilen Telekommunikationsendeinrichtung (100), vor, wenigstens für die Dauer einer Kommunikationsverbindung wenigstens ein Programm zur Realisierung eines Sprachverarbeitungsalgorithmus von einem Dienstserver (400) wenigstens temporär in die Telekommunikationsendeinrichtung (100) zu laden und zur Anwendung zu implementieren.

Description

VERFAHREN UND SYSTEM ZUM BEREITSTELLEN EINER FREISPRECHFUNKTIONALITAT BEI MOBILEN TELEKOMMUNIKATIONSENDRICHTUNGEN DURCH TEMPORÄRES HERUNTERLADEN EINES SPRACHVERARBEITUNGSALGORITHMUS Beschreibung

Die Erfindung betrifft ein Verfahren zum Durchführen einer Freisprechkommunikation unter Nutzung einer Telekommunikationsendeinrichtung, insbesondere einer mobilen Telekommunikationsendeinrichtung, sowie ein System zum Bereitstellen einer derartigen Freisprechkommunikation und zur Nutzung innerhalb eines derartigen Systems entsprechend angepasste Vorrichtungen. Aus dem Stand der Technik sind über ein Telefon anrufbare Sprachdienste bekannt, die eine implementierte, serverbasierte Spracherkennung (Automatic Speech Recognition, ASR) aufweisen. Ein an das Telefonnetz angeschlossenes Dialogsystem ermöglicht hierbei eine Kommunikation zwischen diesen Diensten und einem Nutzer, wobei die vorstehend genannte Spracherkennung eine technische Grundlage für diese Kommunikation bildet.

Eine derartige serverbasierte Spracherkennung verfügt in der Regel über Programme zur Realisierung von Algorithmen zur Verarbeitung digitalisierter Sprachdaten und in Folge zur Erkennung gesprochener Äußerungen des Nutzers . Üblicherweise werden auf dem entsprechenden, an das Telefonnetz angeschlossene Serversystem zur Verbesserung der Erkennung in einer Vorverarbeitungsstufe der Spracherkennung Echokompensations- und Geräuschreduktionsverfahren angewendet .

Darüber hinaus sind erste Versuche durchgeführt, ähnliche SpracherkennungsSysteme mit entsprechenden Vorverarbeitungsalgorithmen auf Telekommunikationsendgeräten wie z. B. einem persönlichen digitalen Assistenten (PDA, Personal Digital Assistent) oder einem multimedialen digitalen Assistenten (MDA) zu implementieren. Da hierbei jedoch zum Bereitstellen einer umfassenden Funktionalität der Speicherplatz auf derartigen Endgeräten für die fest zu installierende Software im Allgemeinen nur unzureichend ist, wird mit den verwendeten Vorverarbeitungsalgorithmen, insbesondere hinsichtlich deren Qualität, nicht der Standard der serverbasierten Spracherkennungslösungen erzielt und darüber hinaus nur ein wesentlich kleineres Vokabular eingesetzt .

Ein weiterer Ansatz für eine Spracherkennung basiert auf der aus der Literatur bekannten verteilten Spracherkennung (Distributed Speech Recognition, DSR) . Hier erfolgt die Vorverarbeitung auf dem an das Telefonnetz angeschlossene Telekommunikationsendgerät, also wie z. B. auf einem mobilen PDA MDA o.a., wobei hierbei als Ergebnis der Vorverarbeitung entstehende Merkmalsvektoren anschließend über das

Telefonnetz mit reduzierter Datenrate an einen Server übertragen und dort den folgenden Verarbeitungsstufen eines Spracherkenners zugeleitet werden. Diese, neu zu definierende Schnittstellen im Übertragungsnetz benötigende Technologie befindet sich jedoch noch in der Entwicklung und wird voraussichtlich erst in einigen Jahren zum Tragen kommen, falls dann reduzierte Datenraten bei der Sprachdatenübertragung noch eine wesentliche Rolle spielen.

Ferner ist bei der Nutzung von Telekommunikationsendgeräten, wie einem vorstehend genannten MDA oder PDA oder auch einem Telefon, einschließlich einem schnurlosen oder mobilen Telefon, aus einem fahrenden Fahrzeug heraus, beispielsweise auch zur Nutzung von Sprachdiensten, durch den Gesetzgeber verschiedener Länder die Benutzung von Freisprechanlagen vorgeschrieben.

Derartige Freisprechanlagen verfügen in der Regel über eine sogenannte Pegelwaage, um Rückkopplungen zwischen Mikrofon und Lautsprecher zu vermeiden. Diese Pegelwaagen können bei auftretenden Nebengeräuschen Schwankungen des

Lautstärkepegels hervorrufen, was in der zwischenmenschlichen Kommunikation zwar wenig ins Gewicht fällt, jedoch bei einer Spracherkennung die Spracherkennungsrate der jeweiligen Sprachdienste extrem verschlechtert. Folglich sind insbesondere derartige Sprachdienste nicht mehr oder nur noch eingeschränkt nutzbar.

Im Gegensatz zu mobilen Anwendungen existieren für stationäre Anwendungen im Festnetz sogenannte Freisprechboxen, in denen auf einem Hardwaremodul digitale Freisprechalgorithmen implementiert sind, die die Nachteile der Pegelwaagen vermeiden und eine verbesserte Nutzung insbesondere von sprachgesteuerten Diensten ermöglichen.

Eine Aufgabe der Erfindung ist es, einen gegenüber dem vorstehend erwähnten Stand der Technik neuen und wesentlich verbesserten Weg aufzuzeigen, mit welchem eine äußerst flexible Freisprechfunktionalität für

Telekommunikationsendeinrichtungen insgesamt gewährleistbar ist, insbesondere jedoch für vorstehend genannte mobile Telekommunikationsendeinrichtungen, die in der Regel nur eine sehr begrenzte Speicherkapazität aufweisen.

Die erfindungsgemäße Lösung der Aufgabe ist auf höchst überraschende Weise bereits durch die jeweiligen Gegenstände mit den Merkmalen der anhängenden unabhängigen Ansprüche gegeben. Vorteilhafte und/oder bevorzugte Ausführungsformen bzw. Weiterbildungen sind Gegenstand der jeweiligen anhängenden abhängigen Ansprüche.

Die Erfindung schlägt somit ein Verfahren zum Durchführen einer Freisprechkommunikation unter Nutzung einer Telekommunikationsendeinrichtung, insbesondere einer mobilen Teleko munikationsendeinrichtung, vor, bei welcher wenigstens für die Dauer einer Kommunikationsverbindung wenigstens ein Programm zur Realisierung eines

Sprachverarbeitungsalgorithmus, insbesondere eines Freisprechalgorithmus, von einem Dienstserver temporär oder auf Dauer in die Kommunikationseinrichtung geladen und zur Anwendung implementiert wird.

Von wesentlichem Vorteil ist somit insbesondere, dass aufgrund des lediglich wenigstens temporär geladenen Algorithmus eine Sprachverarbeitungsfunktionalitat insbesondere auch für das Freisprechen bei

Telekommunikationsendeinrichtungen wie einem PDA, MDA oder einem Mobiltelefon nutzbar sind, die keine oder nur eine sehr geringe Speicherkapazität, insbesondere auch Festspeicherkapazität, besitzen und ferner, ähnlich einer Mensch-zu-Mensch-Kommunikation, die Übertragung von

Sprachsignalen während der Telekommunikationsverbindung ermöglicht wird.

Folglich kann auch ein Sprachdienst, beispielsweise basierend auf einer serverbasierten Spracherkennung wie bei der ASR, unter FreiSprechbedingungen bereits unter Ausnutzung der vorhandenen Schnittstellen bestehender

Telekommunikationsnetzen genutzt werden, d. h. ohne, wie es beispielsweise bei der verteilten Spracherkennung DSR der Fall ist, die Notwendigkeit einer zusätzlichen Vereinbarung bzw. Standardisierung neuer bzw. weiterer Schnittstellen.

Gemäß einer bevorzugten Weiterbildung der Erfindung ist zur Verbesserung der Qualität und/oder zur Verifizierung übertragener Sprachsignale, insbesondere für eine nachfolgende Spracherkennung ferner vorgesehen, dass das Laden das Laden von wenigstens einem Echokompensationsund/oder Geräuschreduktionsalgorithmus von dem Dienstserver umfasst. Ist zusätzlich oder alternativ wenigstens ein Sprach- und/oder Sprecherverifizierungs- (voice verification) , -erkennungs-, und/oder

-klassifizierungsalgorithmus von dem Dienstserver ladbar, ist hierüber ferner appikationsspezifisch ein Nutzer und/oder eine Sprache verifizierbar, z.B. als bei einem Dienst registriert, erkennbar, z.B. aus einer Gruppe von Personen heraus, und/oder klassifizierbar, z.B. als männlich oder weiblich. In weiterer zweckmäßiger Ausführung ist ferner vorgesehen, dass ein Programm zur Realisierung eines "Text- To-Speech"-Algorithmus, also zur automatisierten Umsetzung von Texten in Sprache ladbar ist.

Die zu übertragenden Sprachsignale werden zur Übertragung bevorzugt digitalisiert, wobei zusätzlich je nach verwendeter Telekommunikationsendeinrichtung eine Codierung der

Sprachsignale durchführbar ist, beispielsweise basierend auf einer nach dem GSM-Standard arbeitenden Endeinrichtung. Bevorzugte Ausführungsformen von entsprechend angepassten Einrichtungen umfassen somit A/D- und/oder D/A-Wandler und sind systemapplikationsspezifisch auf die Anwendung von insbesondere digitalen Algorithmen ausgebildet.

Basierend auf dem ggf. temporären Laden wenigstens eines Algorithmus von dem Dienstserver, der zweckmäßigerweise eine Vielzahl von Algorithmen zum temporären Laden gespeichert hat, ist zur weiteren Erhöhung der Flexibilität insbesondere in Bezug auf die Bereitstellungs- und Zugriffskapazitäten vorgesehen, dass dieser zentral über wenigstens ein Kommunikationsnetz zugreifbar angeordnet ist. Über das wenigstens eine Kommunikationsnetz, beispielsweise ein Funknetz, Festnetz und/oder Internet, sind folglich auf einfache Weise im Wesentlichen ortsungebunden zwischen einer oder einer Vielzahl von Telekommunikationsendeinrichtungen und dem Dienstserver jeweilige Verbindungen aufbaubar.

Eine derartige Verbindung kann gemäß einer ersten bevorzugten Ausführungsform unmittelbar zwischen dem Dienstserver und einer bestimmten Telekommunikationsendeinrichtung aufgebaut werden, wobei eine derartige Verbindung zum Laden wenigstens eines Algorithmus bzw. des Programms zur Realisierung eines Algorithmus bevorzugt auf ein automatisches oder nutzerdefiniertes Anforderungssignal durch die Telekommunikationsendeinrichtung aufgebaut wird.

Die Erfindung umfasst darüber hinaus besonders bevorzugte Ausführungsformen, bei denen ferner eine Verbindung über wenigstens ein Kommunikationsnetz zwischen der Telekommunikationsendeinrichtung und einem serverbasierten SpracherkennungsSystem aufgebaut wird.

Insbesondere bei derartigen Ausführungsformen ist ergänzend oder alternativ vorgesehen, dass der Verbindungsaufbau zum ggf. temporären Laden wenigstens eines Algorithmus zwischen dem Dienstserver und der Telekommunikationsendeinrichtung unter Ansprechen auf ein Anforderungssignal des serverbasierten Spracherkennungssystems erfolgt. Das erfindungsgemäße Verfahren sieht zur äußerst flexiblen Nutzung ferner vor, dass die Anbindung applikationsspezifisch zwischen der Telekommunikationsendeinrichtung und dem wenigstens einen Kommunikationsnetz drahtgebunden oder drahtlos erfolgt. Die Erfindung ermöglicht somit die Anbindung von im Wesentlichen jeder

Telekommunikationsendeinrichtung und die Durchführung des erfindungsgemäßen Verfahren unter Nutzung von im Wesentlichen jedem Kommunikationsnetz, insbesondere einem Mobilfunknetz, beispielsweise GSM- (Global System for Mobile communication) oder UMTS (Universal Mobile Teleco munication System) - basiert, einem (W)LAN-Netz ( (Wireless) Local Area Network) und/oder einem Festnetz, beispielsweise im Fall eines DECT (Digital Enhanced Cordless Telecommunication) -Telefons als Telekommunikationsendeinrichtung.

Auch die erfindungsgemäße Anordnung eines serverbasierten Spracherkennungssystems und/oder des Dienstservers ist äußerst flexibel und applikationsspezifisch handhabbar. Bevorzugt ist insbesondere vorgesehen, die Serversysteme unmittelbar in ein Funk- oder Festnetz einzubinden, wobei hierbei ferner ein intelligentes Netz umfasst sein kann, so dass das oder die Serversysteme beispielsweise in einem Vermittlungsknoten angeordnet sind und Zugang zu einer intelligenten Peripherie aufweisen. In ergänzender oder alternativer Ausführung ist ferner vorgesehen die Serversysteme unter Verwendung von WEB-Servern, also im Wesentlichen von Rechnern und/oder Software, die in einem Netzwerk HTTP (HyperText Transfer Protocol) und den Internetzugang bereitstellen, mit Verbindungen in das

Internet auszubilden, wobei in diesem Fall die Telekommunikationsendeinrichtungen Schnittstelleneinrichtungen zum Bereitstellen von Ko munikationsverbindungen über das Internet umfassen. Die Erfindung ermöglicht somit in besonders zweckmäßiger Weise einen Rufaufbau für eine jeweilige Verbindung zwischen der Telekommunikationsendeinrichtung und dem Dienstserver und/oder dem serverbasierten Spracherkennungssystem und/oder zwischen dem Spracherkennungssystem und dem Dienstserver unter Verwendung von jeweils zugeordneten Kennungen. Die Erfindung gewährleistet folglich in bevorzugter praktischer Ausführung die Nutzung einer Vielzahl von derartigen, insbesondere applikationsspezifisch, je nach verwendeten Telekommunikationsnetzen, Servern und/oder Telekommunikationsendeinrichtungen unterschiedlichen Kennungen vor. Solche Kennungen können beispielsweise Teilnehmeranschlussnummern und/oder Dienstnummern, IP- Adressen, Rufleitungsidentifikatoren (CLI, Calling Line Identification; ANI, Automatic Number Identification) und/oder Mobiltelefonen zugewiesene, in einem Heimatregister (HLR, Home Location Register) eines jeweils zugeordneten Kommunikationsnetzes hinterlegte Kennungsadressen umfassen.

In weiterer vorteilhafter Fortbildung ist darüber hinaus vorgesehen, dass die Telekommunikationsendeinrichtung zur mehrkanaligen Verarbeitung von Signalen ausgebildet ist. So ist hierdurch zusätzlich gewährleistbar, dass die Qualität, insbesondere einer Geräuschreduktion, beispielsweise bei

Anschluss von mehreren Mikrofonen über einen entsprechenden Audio- und/oder Stereoeingang durch die dann grundsätzlich mögliche Ortung der Sprachquelle weiter wesentlich verbessert wird. Die mehrkanalige Verarbeitung kann auch auf dem Server stattfinden, wobei dann eine mehrkanalige oder virtuell mehrkanalige (multiplex) Übertragung zwischen Server und Endgerät erforderlich ist. Weist die Telekommunikationsendeinrichtung wenigstens zwei Mikrofonkanäle, wie z.B. einen Stereoeingang auf, so ist in vorteilhafter Weise ein Freisprechalgorithmus mit mehrkanaliger Verarbeitung, insbesondere zur Ortung der Sprachquelle zur verbesserten Geräuschreduktion in die Telekommunikationsendeinrichtung ladbar. Weist die Telekommunikationsendeinrichtung zusätzlich wenigstens zwei LautSprecherkanäle auf und erfolgt die Signalübertragung mehrkanalig oder virtuell mehrkanalig (multiplex) , so ist bevorzugt ein Stereo- oder Freisprechalgorithmus und/oder eine Stereo- oder mehrkanalige Echokompensation insbesondere zur FreiSprechübertragung mit räumlicher Wahrnehmung in die Telekommunikationsendeinrichtung ladbar .

Eine mehrkanalige Übertragung bietet ferner den Vorteil, dass beispielsweise zusätzlich zu Sprachdaten weitere spezifische Parameter, Vektordaten, Test- und/oder Abgleichsignale auf einfache Weise übertragbar sind, die ansonsten zusammen mit den Sprachdaten in das Monosignal eingebettet, soweit erforderlich, übertragen werden müssen.

Insbesondere ist mittels derartiger Test- und/oder Abgleichsignale eine individuelle Überprüfung des eingesetzten Algorithmus hinsichtlich jeweils aktueller Umgebungsbedingen im Wesentlichen jederzeit durchführbar. So ist hierzu bevorzugt eine Vergleichseinheit vorgesehen, die ein auf Seiten der Telekommunikationsendeinrichtung über einen Lautsprecher ausgegebenes Testsignal mit dem daraufhin über ein Mikrofon der Telekommunikationsendeinrichtung erhältliches Empfangssignal vergleicht.

Je nach spezifischer Applikation erfolgt eine derartige Überprüfung unter Ansprechen auf ein von dem serverbasierten Spracherkennungssystem und/oder dem Dienstserver übertragenes oder durch ein von der Telekommunikationsendeinrichtung generiertes Testsignal. Ferner umfasst die Erfindung Ausführungsformen, bei denen die eigentliche Vergleichsüberprüfung der beiden Signale unmittelbar in der Telekommunikationsendeinrichtung oder erst nach Rückübertragung des Empfangssignals zu einem der serverbasierten Systeme erfolgt.

Die Aktualisierung eines Algorithmus bzw. die der jeweils aktuellen Umgebung entsprechende Anpassung, Adaption oder Auswechslung des wenigstens einen eingesetzten Algorithmus erfolgt somit unter Ansprechen auf das Überprüfungsergebnis beispielsweise durch neues Laden eines entsprechenden Programms von dem Dienstserver oder aber, wenn eine Vielzahl von Algorithmen auf der Telekommunikationsendeinrichtung wenigstens temporär geladen sind, durch entsprechendes Selektieren des geeigneten Algorithmus durch die Telekommunikationsendeinrichtung selbst .

Zur weiteren Steigerung der Spracherkennungsqualität sowie der flexiblen Nutzung unterschiedlicher Frequenzspektren und/oder -bänder sieht die Erfindung ferner bevorzugt eine Umsetzfunktionalität für die Sprachsignale zur Übertragung zwischen mit unterschiedlichen Frequenzen arbeitenden Kommunikationseinheiten vor, beispielsweise von einer auf einer 30 kHz Basis Sprachsignalverarbeitenden Telekommunikationsendeinrichtung für eine auf einer 8 kHz Basis bereitgestellten Kommunikationsverbindung eines verwendeten Kommunikationsnetzes mit gegebenenfalls anschließender erneuten Umsetzung auf 30 kHz durch eine der serverbasierten Spracherkennung entsprechend zugeordneten Umsetzeinrichtung. In weiterer vorteilhafter Ausbildung schlägt die Erfindung ferner vor, dass von der Telekommunikationsendeinrichtung spezifische Kennungsparameter und/oder Tariffierungsparameter zur Weiterbearbeitung übertragen und von einer dem Spracherkennungssystem und/oder dem DienstServer zugeordneten Vorrichtung erfasst werden.

So ist insbesondere bei Zuordnung derartiger Kennungsparameter auf dem Dienstserver und/oder dem Server des SpracherkennungsSystems zu für die entsprechende Telekommunikationsendeinrichtung besonders geeigneten Algorithmen bereits bei Neu- und/oder wiederholter Anmeldung einer Telekommunikationsendeinrichtung bei einem der Serversysteme anhand derartig übertragener Parameter eine vorteilhafte, insbesondere zeitsparende Vorauswahl von geeigneten temporär zu ladenden Algorithmen möglich.

Mittels applikationsspezifischer Tariffierungsparameter ist ferner, ggf. in Verbindung mit dem Kennungsparametern, eine der Telekommunikationsendeinrichtung und/oder dem Nutzer der

Telekommunikationsendeinrichtung zugeordnete vorzugsweise automatische Entgeldabrechnung und/oder -belastung von kostenpflichtig bereitgestellten Diensten und/oder Algorithmen mit im Wesentlichen allen an und für sich hierfür bekannten Abrechnungs- und/oder Belastungsverfahren auf eine sehr einfache Weise gegeben.

Die Erfindung sieht ferner in praktischer Weiterbildung vor, dass vor oder während der Anwendung eines temporär implementierten Algorithmus die Kalibrierung einer auf Seiten der Telekommunikationsendeinrichtung durchzuführenden Analog- Digital- und/oder Digital-Analogwandlung erfolgt. Eine solche Kalibrierung kann einmalig für eine Kommunikationsverbindung oder kontinuierlich durchgeführt werden. Insbesondere für die flexible umgebungsbasierte Anwendung oder Auswahl entsprechend angepasster Algorithmen aus einer gemeinsamen Gruppe, oder eines gemeinsamen Anbieters ist ferner eine digitale Kalibrierung, insbesondere unter Verwendung eines einen jeweiligen Algorithmus ausführenden Prozessors der Telekommunikationsendeinrichtung von Vorteil.

Als Abgleichsignal für die folglich im Wesentlichen universell einsetzbare Kalibrierung ist ferner vorgesehen, das Sprachsignal selbst und/oder entsprechend ausgebildete Testsignale, beispielsweise ein in Sprechpausen über den Lautsprecher der Telekommunikationsendeinrichtung ausgesandtes und das über das Mikrofon der Telekommunikationsendeinrichtung rückempfangene Rauschsignal, zu verwenden.

Darüber hinaus umfasst die Erfindung folglich insbesondere gemäß den anhängenden Ansprüchen ein zur Durchführung des erfindungsgemäßen Verfahrens entsprechend ausgebildetes System, welches in deren einzelnen Ausführungsformen mit, zu vorstehend aufgeführten Vorteilen gleichen und/oder vergleichbaren Vorteilen belegt ist.

Weitergehende Vorteile und Charakteristika der Erfindung werden anhand der nachfolgenden detaillierteren Beschreibung bevorzugte jedoch lediglich beispielhafte erfindungsgemäße Ausführungsformen unter Bezugnahme auf die beigefügten Zeichnungen ersichtlich.

In den Zeichnungen zeigen:

Fig. 1 eine stark vereinfachte schematische Prinzipdarstellung eines erfindungsgemäßen Systems und Fig. 2 ein vereinfachtes Blockschaltbild zur Veranschaulichung eines lokalen Verarbeitungsprinzips für die erfindungsgemäße Freisprechfunktionalität auf einer mobilen Telekommunikationsendeinrichtung gemäß der Erfindung.

Nachfolgend werden anhand der Figuren 1 und 2 , welche eine schematische Darstellung eines erfindungsgemäßen

Freisprechsystems bzw. eine Blockdarstellung zur

Veranschaulichung eines lokalen erfindungsgemäßen

Verarbeitungsprinzip für die Anwendung einer

Freisprechfunktionalität auf einer mobilen Telekommunikationsendeinrichtung zeigen, bevorzugte

Ausführungsformen der Erfindung, beispielhaft beschrieben.

In Figur 1 ist eine mobile Telekommunikationsendeinrichtung 100 dargestellt, die über eine Luftschnittstelle, z.B. mittels Funk, wie mit dem Doppelpfeil 1 angedeutet, Zugang zu einem Telekommunikationsnetz 200 hat. Wie mit dem Doppelpfeil angezeigt, wird über die Luftschnittstelle eine Duplex- Kommunikation in zweckmäßiger Weise eine Vollduplex- Kommunikation bereitgestellt. Die mobile Telekommunikationsendeinrichtung 100 ist im vorliegenden betrachteten Fall ein Mobiltelefon, ein PDA oder auch ein MDA, welches auf einem GSM-Standard basierend über ein somit im vorliegenden Fall vom Telekommunikationsnetz 200 u fasstes Mobilfunknetz kommunizieren und also Sprachdaten entsprechend einer Mensch-zu-Mensch-Kommunikation über das Netz 200 übermitteln kann.

Es sei jedoch darauf hingewiesen, dass das Mobilfunknetz und die diesem zugeordnete Telekommunikationsendeinrichtung 100 auch auf einem anderen Standard, beispielsweise einem UMTS- Standard, basieren kann. Ferner sei für die nachfolgende Beschreibung und die anhängenden Ansprüche darauf hingewiesen, dass der verwendete Begriff Telekommunikationsnetz allgemein ein einziges Kommunikationsnetz oder eine Mehrzahl von

Kommunikationsnetzen, einschließlich Sprach/Daten Netze und Daten/Daten Netze, umfassen kann.

Über wenigstens eine weitere, mit dem Doppelpfeil 2 gekennzeichnete Schnittstelle ist ein sprachgesteuerter CT- Server (Computer-Telefonie Server) mit Algorithmen zur Spracherkennung 300 dauerhaft oder bei Bedarf mit dem zur Übertragung von Sprachdaten geeigneten Telekommunikationsnetz 200 direkt über das Mobilfunknetz oder über weitere, nicht dargestellte Kommunikationsnetze verbunden.

Ferner besteht eine dauerhafte oder bei Bedarf aufbaubare Verbindung 3 zu einem Dienstserver 400, der eine Vielzahl von digitalen FreiSprechalgorithmen und ggf. weitere Audiosignale vorverarbeitende Algorithmen wie insbesondere Echokompensations- und/oder Geräuschreduktionsalgorithmen beinhaltet .

Ferner umfasst die dargestellte Systemanordnung einen dritten Server 500, welcher Teil eines Tariffierungs- bzw. Kostenentgelterfassungs- und -belastungssystems, also im Wesentlichen eines sogenannten Billing Systems oder Billing Support Systems (BSS) ist, zu welchem im vorliegenden betrachteten Fall eine Simplex-Verbindung 4 über das Telekommunikationsnetz 200 aufbaubar ist.

In bevorzugter Weise umfassen die Server 300, 400 und 500 zur Kommunikation und/oder zum Datenaustausch untereinander direkte Verbindungen 5, 6, so dass in alternativer Ausführung beispielsweise lediglich die Verbindung 2 von den Servern 300, 400 und 500 zum Telekommunikationsnetz 200 zur Durchführung des nachfolgend detailliert beschriebenen erfindungsgemäßen Verfahrens notwendig ist. In weiterer alternativer Ausführung kann auch vorgesehen sein, dass die Server 300, 400 und 500 Teil einer gemeinsamen Servervorrichtung sind.

Sind die Server 300, 400 und 500 gemäß einer bevorzugten

Ausbildung beispielsweise als WEB-Server ausgebildet, wird mit der dargestellten Systemanordnung für die mobile Telekommunikationsendeinrichtung 100 über das Telekommunikationsnetz 200 zumindest jeweils ein Programm zur Realisierung eines Freisprechalgorithmus aus dem Internet ladbar vom den Dienstserver 400 zur Verfügung gestellt und zur Nutzung eines vom Server 300 bereitgestellten Sprachdienstes auf die mobile Telekommunikationsendeinrichtung 100 temporär geladen und implementiert. Da zum temporären Laden im Allgemeinem bereits ein Arbeitsspeicher ausreichend ist, benötigt die mobile Telekommunikationsendeinrichtung 100 in diesem Fall somit im Wesentlichen keine Festplattenspeicherkapazität, welche jedoch in speziellen Anwendungsformen noch verwendet werden kann.

Je nach aktuell bestehender Umgebungsbedingung, beispielsweise bei Nutzung der mobilen Telekommunikationsendeinrichtung 100 in einem bestimmten Fahrzeug, welches eine andere Geräuschumgebung darstellt, als die Nutzung der mobilen Telekommunikationsendeinrichtung 100 im Freien oder in einem anders konzipierten Fahrzeug, kann somit auch bei einer äußerst begrenzten Speicherkapazität von der Vielzahl von im Dienstserver 400 auf einem Massenspeicher bereitgestellten Algorithmen jeweils ein entsprechend geeigneter Algorithmus temporär auf die Telekommunikationsendeinrichtung 100 geladen und implementiert werden. Nach erfolgter spezifischer Nutzung wird der Speicherplatz wieder anderen Anwendungen zur Verfügung gestellt.

Je nach entsprechender, insbesondere applikationsspezifischer Ausbildung erfolgt die Übertragung des wenigstens einen Algorithmus beispielsweise bei Erstanruf des Servers 300 und/oder 400, basierend auf einem entsprechenden Dienstabonnement oder auch durch direkte Anforderung durch den Nutzer der mobilen Telekommunikationsendeinrichtung 100.

Bei der anschließenden Kommunikation zwischen der mobilen Telekommunikationsendeinrichtung 100 und dem Spracherkennungssystem 200 und/oder auch bei Aufbau einer KommunikationsVerbindung zu einer anderen Telekommunikationsendeinrichtung werden folglich keine Merkmalsvektoren wie bei einer verteilten Spracherkennung, also wie bei DSR notwendig, sondern übliche, im betrachteten Beispiel GSM-kodierte Sprachdaten übertragen.

Wie aus Figur 2 zu sehen ist, weist die mobile Telekommunikationsendeinrichtung 100 in bevorzugter Ausbildung eine Sende- und Empfangseinheit 101, eine Kodiereinrichtung 102 sowie eine mit dem temporären Speicher verbundene Prozessoreinheit 103 auf, über welche ein auf den Speicher temporär geladener Algorithmus ausführbar ist. Die Prozessoreinheit 103 ist mit einem Digital-Analog-Wandler 105 verbunden, der mit einem internen Lautsprecher 108 verbunden ist, oder ergänzend oder alternativ beispielsweise über eine Infrarot- oder Bluetooth-Schnittstelle oder auch über eine drahtgebundene Schnittstelle zu einem externen Lautsprecher 110 verbindbar ist. Von einem internen Mikrofon 107 oder in entsprechender Weise über eine Schnittstelle von einem externen Mikrofon 109 besteht eine Verbindung zu der Prozessoreinheit 103 über einen zwischengeschalteten Analog-Digital-Wandler 104. Ferner ist eine durch die

Prozessoreinheit 103 kontrollierbare Kalibriersteuereinheit 106 zur Kalibrierung der Wandler 105 und 104 vorgesehen. Zweckmäßiger Weise stellen die Wandler 104 und 105 oder eine zugeordnete Einheit zusätzlich eine insbesondere einstellbare Signal erstärkung bereit.

Eine Kalibrierung der Wandler 104 und 105 wird je nach spezifischer Ausbildung einmalig bei jeder Inbetriebnahme der Telekommunikationsendeinrichtung 100 durchgeführt oder, beispielsweise kontinuierlich oder zeitbasiert überwacht, während des Betriebs .

Auch eine digitale Kalibrierung, beispielsweise basierend auf dem an der Prozessoreinheit 103 vorliegenden Signal, welches dem Wandler 105 zugeführt bzw. von dem Wandler 104 empfangen wird, ist durchführbar. Eine derartige Kalibrierung wird bevorzugt speziell auf eine bestimmte Gruppe von temporär ladbaren Algorithmen, insbesondere unter Verwendung eines entsprechenden Zuordnungs- und/oder -verknüpfungsSchemata, abgestimmt.

Gemäß der Ausbildung gemäß Fig. 2 werden somit über das Telekommunikationsnetz 200 von dem SpracherkennungsSystemserver 300 zur mobilen Telekommunikationsendeinrichtung 100 übertragene digitale

Sprachsignale vor Ausgabe auf den Lautsprecher 108 oder 110 dem von der Prozessoreinheit 103 aktivierten Freisprechalgorithmus digitalisiert zur Verarbeitung zugeleitet und anschließend über den Digital-Analog-Wandler 105 dem Lautsprecher 108 und/oder 110 zugeleitet. Entsprechend wird ein über das Mikrofon 107 und/oder 109 empfangenes Sprachsignal nach einer Digital-Analog-Wandlung durch den Wandler 104 bei ggf. entsprechend angepasster Verstärkung der Prozessoreinheit 103 zugeführt und durch den aktivierten Freisprechalgorithmus verarbeitet, bevor es über das Telekommunikationsnetz 200 weitergeleitet wird.

Folglich ermöglicht die Erfindung ohne zusätzliche Vereinbarung oder Standardisierung neuer Schnittstellen im Übertragungsnetz 200, wie dies ansonsten bei der DSR notwendig ist, unter Ausnutzung der vorhandenen Schnittstellen bereits unter gegenwärtigen Bedingungen die Nutzung von Sprachdiensten unter Freisprechbedingungen, also insbesondere auch innerhalb eines Fahrzeuges.

Da, wie vorstehend erwähnt, auf dem Dienstserver 400 bevorzugt zusätzlich weitere Algorithmen zum wenigstens temporären Laden bereitgestellt sind, werden in äußerst bevorzugter Weiterbildung zusätzlich zu dem wenigstens einen

Freisprechalgorithmus beispielsweise auch

Geräuschreduktionsalgorithmen auf entsprechende Weise auf die Telekommunikationsendeinrichtung 100 zur Ausführung durch die Prozessoreinheit 103 temporär geladen.

Werden beispielsweise die letztgenannten Algorithmen auf der mobilen Telekommunikationsendeinrichtung 100 im Fahrzeug ausgeführt, so besteht, wenn die mobile Telekommunikationsendeinrichtung den Anschluss mehrerer Mikrofone, z. B. über einen Stereoeingang, bietet, zusätzlich die Möglichkeit, die Qualität der Geräuschreduktion durch die dann im Prinzip mögliche Ortung der Sprachquelle, also des Sprechers bzw. des Nutzers der mobilen Telekommunikationsendeinrichtung 100 nochmals entscheidend zu verbessern. Bei Durchführung eines Geräuschreduktionsalgorithmus unmittelbar auf dem SpracherkennungsSystemserver 300 hingegen steht im Allgemeinen nur ein Monosignal zur Verfügung, welches zwar eine Geräuschreduktion, jedoch im Allgemeinen keine Ortung ermöglicht.

Für die Dauer der Nutzung des über den Server 300 bereitgestellten Spracherkennungsdienstes und/oder für die Nutzung eines Algorithmus von dem Dienstserver 400 werden bevorzugt Tariffierungs- und/oder Kennungsparameter von der Telekommunikationsendeinrichtung 100, dem Server 300 und/oder dem Dienstserver 400 zu dem TariffierungsServer 500 übertragen, mittels welcher der Dienst abrechenbar ist, wobei zur Abrechnung und/oder Kontenbelastung im Wesentlichen alle bekannten oder auch noch in der Zukunft zu entwickelnden Verfahren anwendbar sind.

Eine Überprüfung des oder der mittels der Prozessoreinheit 103 durchgeführten Algorithmen auf deren aktuelle Eignung wird bevorzugt über ein Abgleichsignal durchgeführt, welches beispielsweise in Sprachpausen in einem Rauschsignal verpackt über den Lautsprecher 108 oder 110 ausgegeben, über das Mikrofon 107 und/oder 109 wieder als Antwortsignal empfangen und mit dem ausgegebenen Signal verglichen wird.

Ein derartiges Test- oder Abgleichsignal kann bei Bereitstellung eines entsprechenden, nicht dargestellten Signalgenerators durch die mobile Telekommunikationsendeinrichtung selbstständig erzeugt werden, insbesondere wenn mehrere zur Aktivierung auswählbare Algorithmen temporär auf die mobile

Telekommunikationsendeinrichtung 100 geladen sind. Derartige Test- oder -Abgleichsignale können jedoch auch durch den Server 300 und/oder 400 zur mobilen

Telekommunikationsendeinrichtung 100 übertragen und nach Empfang des AntwortSignals mit diesem auf dem Server oder einer entsprechend zugeordneten Überprüfungseinheit auf die Tauglichkeit des aktuell aktivierten Algorithmus hin verglichen werden, so dass ggf. ein entsprechend angepasster aktualisierter Algorithmus von dem Dienstserver 400 auf die mobile Telekommunikationsendeinrichtung 100 übertragen und dort temporär geladen wird.

Ein derartiges Abgleich- oder Testsignal wird bei einkanaliger Ausführung der mobilen Telekommunikationsendeinrichtung 100 bevorzugt als Rauschsignal in das Sprachsignal eingebettet und kann bei zweikanaliger Ausführung der mobilen

Telekommunikationsendeinrichtung 100 beispielsweise über den zusätzlichen Kanal übertragen werden.

Ferner ist erfindungsgemäß vorgesehen, bei einer zweikanaligen Ausbildung der mobilen

Telekommunikationsendeinrichtung 100 über den zusätzlichen Kanal, also im Wesentlichen unabhängig von den Sprachdaten jedoch ggf. in -Abhängigkeit des jeweils verwendeten Algorithmus zusätzliche Parameter, wie z.B. die vorstehenden Kennungsparameter, weitere Daten und/oder ggf. auch

Merkmalsvektoren zu übertragen, sofern das verwendete Telekommunikationsnetz 200 bzw. die Schnittstellen 1 und 2 hierzu entsprechend ausgebildet sind.

Die Erfindung umfasst ferner Ausführungsformen, bei denen die Schnittstellen 1 und 2 zu dem Frequenzband der mobilen Telekommunikationsendeinrichtung 100 unterschiedliche Frequenzbänder aufweisen. Basiert z. B. die Signalverarbeitung der Telekommunikationsendeinrichtung 100 auf einem 30kHz Band, weist die

Telekommunikationsendeinrichtung 100 vorzugsweise eine Umsetzeinrichtung auf, um das 30kHz-umfassende Sprachsignal zur Übertragung an den sprachgesteuerten CT-Server 300 beispielsweise auf ein 8kHz-umfassendes Sprachsignal umzusetzen. Die so empfangenen Signale werden applikationsspezifisch ggf. vor der Spracherkennung von einer dem CT-Server 300 zugeordneten Umsetzeinheit wiederum auf das ursprüngliche 30kHz-umfassende Signal rückgesetzt. Zur Erkennung derartiger, ggf. umzusetzender Signale werden z.B. vorstehende, zusätzlich übertragene Daten oder Parameter verwendet .

Von der Erfindung sind ferner Ausführungsformen umfasst, bei denen anhand von die Telekommunikationsendeinrichtung 100 spezifizierenden Kennungsparametern, die bei Ruf des SpracherkennungsServers 300 durch die

Telekommunikationsendeinrichtung 100 mit übertragen und/oder angefordert werden, eine Vorauswahl von zu übertragenen Algorithmen getroffen wird. Derartige vorselektierte

Algorithmen können hierbei für die spezifizierte Telekommunikationsendeinrichtung 100 voreingestellt sein oder z.B. sich in der Vergangenheit als geeignete Algorithmen erwiesen haben, beispielsweise basierend auf einer in Bezug auf die Telekommunikationsendeinrichtung 100 in der Vergangenheit festgestellten Umgebungsbedingung. Der Dienstserver 400 wird in Folge beispielsweise über die Verbindung 5 entsprechend zur Übertragung des ausgewählten bzw. voreingestellten Algorithmus angewiesen. In entsprechender Weise ist jedoch auch eine Vorauswahl unter

Umgehung des SpracherkennungsServers 300, also über die Schnittstellen 1 und 3 gemäß Figur 1 möglich. Derartige Kennungsparameter sind applikationsspezifisch variabel und können beispielsweise je nach verwendeter Telekommunikationsendeinrichtung eine IP-Adresse, eine CLI- und/oder aus einem der Telekommunikationsendeinrichtung 100 zugeordneten HLR von dem Server 300 abgefragte Parameter umfassen.

Darüber hinaus ist es für die Erfindung nicht zwingend, dass die Telekommunikationsendeinrichtung 100 mobil ausgebildet ist. Grundsätzlich kann für die Erfindung auch eine stationäre oder eine in einem Fahrzeug fest integrierte Telekommunikationsendeinrichtung sein, die je nach zugrunde gelegtem System z.B. auch mit einer DECT-, einer Bluetooth-, einer (W)LAN oder anderen, auch drahtgebundenen Schnittstelle für den Zugang zu einem entsprechenden Netz ausgebildet ist.

Das insgesamt verwendete Telekommunikationsnetz 200 kann somit applikationsspezifisch unterschiedlich sein und beispielsweise Mobilfunknetze, (W)LAN, Festnetze und/oder das Internet umfassen.

Auch kann das verwendete Telekommunikationsnetz ein intelligentes Netz umfassen, wobei zumindest der Spracherkennungssystemserver 300 hierbei bevorzugt in einem Dienstknoten angeordnet ist und in zweckmäßiger Weise Zugang zu einer intelligenten Peripherie besitzt.

Gemäß weiteren bevorzugten Ausführungsformen ist ferner vorgesehen, dass der Dienstserver 400 beispielsweise auch direkt, unter Umgehung des Telekommunikationsnetzes 200, mit der Telekommunikationsendeinrichtung 100 zum Bereitstellen von Algorithmen ausgebildet ist. So ist beispielsweise insbesondere vorgesehen, dass der Dienstserver 400 Teil einer intelligenten, beispielsweise in einem Fahrzeug untergebrachten Einheit ist, auf der eine Vielzahl von Algorithmen zur Verfügung stehen und beispielsweise von einer zentralen, in Figur 1 nicht dargestellten Servereinheit mit aktuellen Algorithmen entsprechend über das Telekommunikationsnetz versorgt wird. Von einem solchen angeordneten Dienstserver kann folglich auch mittels einer direkten Verbindung zur Telekommunikationsendeinrichtung 100 ein entsprechend geeigneter Algorithmus auf die Telekommunikationsendeinrichtung 100 temporär geladen werden.

Mittels entsprechend den einzelnen Systemkomponenten 100, 300, 400 und/oder ggf. 500 zugewiesenen Rufkennungen können somit im Wesentlichen ortsunabhängig und bei applikationsspezifisch gewählter oder vorliegender Anordnung entsprechende gewünschte oder auch notwendige

KommunikationsVerbindungen zwischen den einzelnen Einrichtungen und/oder Systeme zur Durchführung des erfindungsgemäßen Verfahrens aufgebaut werden.

Solche Kennungen umfassen somit insbesondere

Teilnehmeranschlussnummern und/oder Dienstnummern, IP- Adressen, Rufleitungsidentifikatoren und/oder Mobiltelefonen zugewiesene, in einem Heimatregister eines jeweils zugeordneten Kommunikationsnetzes hinterlegte Kennungsadressen.

Eine fest installierte Sprachverarbeitungsfunktionalitat, insbesondere Freisprech- und/oder Geräusehreduktions- oder Spracherkennungsfunktionalität, auf einer Telekommunikationsendeinrichtung 100 ist somit durch die Erfindung nicht mehr notwendig, so dass die Erfindung insbesondere bei Telekommunikationsendeinrichtungen Anwendung findet, die keinen oder nur einen sehr geringen Speicher besitzen, keine ausreichende Kapazität auf diesem mehr bereithalten oder aber diese Kapazität anderweitig genutzt werden soll .

So kann beispielsweise auf der Telekommunikationsendeinrichtung 100 voreingestellt sein, dass bei Aufbau einer Kommunikationsverbindung automatisch zunächst eine Verbindung zu dem Dienstserver 400 aufgebaut wird zum temporären Laden und Implementieren eines oder ggf. auch mehrerer Algorithmen auf die Telekommunikationsendeinrichtung 100, aus denen anschließend durch die Telekommunikationsendeinrichtung 100 der jeweils geeignete entsprechend auswählbar ist.

Erweist sich ein implementierter Algorithmus als nicht mehr geeignet und/oder nach Beendigung der gewünschten

Kommunikationsverbindung, wird die durch den Algorithmus belegte Speicherkapazität, beispielsweise des Arbeitsspeichers, wieder für andere Anwendungen freigegeben.

Claims

Patentansprüche

1. Verfahren zum Durchführen einer Freisprechkommunikation 5 unter Nutzung einer Telekommunikationsendeinrichtung (100) , insbesondere einer mobilen Telekommunikationsendeinrichtung (100) , dadurch gekennzeichnet, dass wenigstens für die Dauer einer Kommunikationsverbindung wenigstens ein Programm zur 10. Realisierung eines Sprachverarbeitungsalgorithmus von einem Dienstserver (400) wenigstens temporär in die Telekommunikationsendeinrichtung (100) geladen und zur Anwendung implementiert wird.

15 2. Verfahren nach Anspruch 1, ferner gekennzeichnet durch das wenigstens temporäre Laden wenigstens eines Freisprech-, Echokompensations-, Sprecherverifizierungs- , -erkennungs- , -klassifizierungs-, Sprachverifizierungs- ,

20 -erkennungs-, "Text-To-Speech"- und/oder Geräuschreduktionsalgorithmus von dem Dienstserver.

3. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass Sprachsignale zur

25 Übertragung digitalisiert und/oder codiert werden.

4. Verfahren nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch das Aufbauen einer Verbindung über wenigstens ein Kommunikationsnetz zwischen der

30 Telekommunikationsendeinrichtung (100) und einem Serverbasierten Spracherkennungssystem (300) .

5. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass auf dem Dienstserver (400) eine Vielzahl von Algorithmen zum temporären Laden gespeichert werden.

6. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass zum Laden des wenigstens einen Algorithmus eine Verbindung zu dem Dienstserver (400) über wenigstens ein Kommunikationsnetz aufgebaut wird.

7. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass die Verbindung zum Laden unmittelbar zwischen dem Dienstserver (400) und der Telekommunikationsendeinrichtung (100) aufgebaut wird oder über die Zwischenschaltung eines serverbasierten SpracherkennungsSystems (300) .

8. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass die Verbindung zum Laden zwischen dem Dienstserver und der Telekommunikationsendeinrichtung (100) unter Ansprechen auf ein automatisches oder nutzerdefiniertes Anforderungssignal durch die Telekommunikationsendeinrichtung (100) oder unter Ansprechen auf ein AnforderungsSignal eines serverbasierten Spracherkennungssystem (300) erfolgt.

9. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass ein Verbindungsaufbau zwischen der Telekommunikationsendeinrichtung (100) und dem Dienstserver (400) und/oder einem Serverbasierten Spracherkennungssystem (300) unter Verwendung von jeweils zugeordneten Kennungen, beispielsweise mittels CLI, ANI oder HLR, erfolgt.

10. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass die Anbindung zwischen der Telekommunikationsendeinrichtung (100) und dem wenigstens einen Kommunikationsnetz drahtgebunden oder drahtlos erfolgt.

11. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass die Übertragung von der Telekommunikationsendeinrichtung (100) ein- oder mehrkanalig durchgeführt wird.

12. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass zusätzlich zu Sprachsignalen weitere Signale, insbesondere Test- und/oder Abgleichsignale, Tariffierungs- und/oder Kennungsparameter und/oder Vektoren umfassende Signale übertragen werden.

13. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass zur Übertragung von Sprachsignalen eine Umsetzung zwischen unterschiedlichen Frequenzbändern und/oder -Spektren durchgeführt wird.

14. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass die Auswahl eines aktuell anzuwendenden Algorithmus von der Telekommunikationsendeinrichtung (100) , einem Spracherkennungssystem (300) oder dem DienstServer (400) durchgeführt wird.

15. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass zur Überprüfung eines aktuell angewendeten oder anzuwendenden Algorithmus ein Testsignal auf Seiten der Telekommunikationsendeinrichtung (100) ausgeben und mit dem wieder empfangenen Antwortsignal verglichen wird.

16. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass für die Dauer der Kommunikationsverbindung das Laden wenigstens eines Algorithmus einmalig erfolgt oder mehrmalig, insbesondere aktualisierend erfolgt.

17. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass von der Telekommunikationsendeinrichtung (100) spezifische Kennungsparameter und/oder Tariffierungsparameter zur Weiterbearbeitung durch eine einem Spracherkennungssystem (300) und/oder dem Dienstserver (400) zugeordnete Vorrichtung übertragen werden.

18. Verfahren nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass von der Telekommunikationsendeinrichtung (100) eine Kalibrierung einer A/D und/oder D/A- Wandlung (104, 105) durchgeführt wird.

19. Verfahren nach vorstehendem Anspruch, ferner dadurch gekennzeichnet, dass die Kalibrierung einmalig für eine Kommunikationsverbindung, kontinuierlich und/oder digital durchgeführt wird.

20. Verfahren nach einem der beiden vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass als Abgleichsignal für die Kalibrierung das Sprachsignal und/oder ein Testsignal verwendet wird.

21. Verfahren nach einem der beiden vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass, insbesondere bei mehrkanaliger Verarbeitung von wenigstens zwei Mikrofonsignalen und/oder zur Geräuschreduktion, eine Ortung der Sprachquelle durchgeführt wird.

22. System zum Bereitstellen einer FreiSprechkommunikation für wenigstens eine Telekommunikationsendeinrichtung (100) , insbesondere eine mobilen Telekommunikationsendeinrichtung, insbesondere zur Durchführung des Verfahrens nach einem der vorstehenden Ansprüche, umfassend einen Dienstserver (400) mit Mitteln zum Bereitstellen von wenigstens einem Sprachverarbeitungsalgorithmus, wobei der Dienstserver ausgebildet ist, unter Ansprechen auf ein definiertes Anforderungssignal wenigstens ein Programm zur Realisierung eines Sprachverarbeitungsalgorithmus zur wenigstens temporären -Anwendungsimplementierung an wenigstens eine bestimmte der wenigstens einen Telekommunikationsendeinrichtung (100) zu übertragen.

23. System nach einem der vorstehenden Ansprüche, ferner dadurch gekennzeichnet, dass der DienstServer (400) Mittel zum Bereitstellen von wenigstens einem Freisprech-, Echokompensations-, Sprecherverifizierungs- , -erkennungs- , -klassifizierungs- , Sprachverifizierungs- , -erkennungs-, "Text-To-Speech"- und/oder Geräuschreduktionsalgorithmus zur wenigstens temporären AnwendungsImplementierung für die wenigstens eine Telekommunikationsendeinrichtung (100) umfasst.

24. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch ein serverbasiertes Spracherkennungssystem (300) und ein Tariffierungs- und/oder Billingsystem (500) .

25. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch wenigstens einen WEB-Server zum Bereitstellen des Dienstservers (400) , des serverbasierten SpracherkennungsSystems (300) und/oder des Tariffierungs- und/oder Billingsystems (500) .

26. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch Schnittstellenmittel zum Aufbauen von Kommunikationsverbindungen (1, 2, 3) zwischen der Telekommunikationsendeinrichtung (100) , dem Dienstserver (400) und/oder dem Serverbasierten Spracherkennungssystem (300) .

27. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch Schnittstellenmittel zum Aufbauen von Verbindungen (1, 2, 3, 4) zur Signalübertragung zwischen der Telekommunikationsendeinrichtung (100) , dem Dienstserver (400) , dem Serverbasierten Spracherkennungssystem (300) und/oder dem Tariffierungs- und/oder Billingsystem (500) .

28. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch Mittel zum Bereitstellen einer Kommunikationsverbindung (5, 6) zwischen dem Dienstserver (400) und/oder dem Serverbasierten Spracherkennungssystem (300) und dem Tariffierungs- und/oder Billingsystem (500) .

29. System nach einem der vorstehenden Ansprüche, ferner umfassend ein zur Übertragung von Sprachsignalen ausgebildetes Telekommunikationsnetz (200) , insbesondere wenigstens ein Mobilfunknetz, Festnetz, (W) LAN und/oder das Internet umfassend.

30. System nach einem der vorstehenden Ansprüche dadurch gekennzeichnet, dass ein Verbindungsaufbau zwischen der Telekommunikationsendeinrichtung (100) , dem Dienstserver (400), dem Serverbasierten Spracherkennungssystem (300) und/oder dem Tariffierungs- und/oder Billingsystem (500) unter Verwendung von jeweils zugeordneten Rufkennungen erfolgt.

31. System nach einem der vorstehenden Ansprüche gekennzeichnet durch Mittel zum Umsetzen eines Sprachsignal zwischen unterschiedlichen Frequenzbändern .

32. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch der Teleko munikationsendeinrichtung (100) , Spracherkennungssystem (300) und/oder dem DienstServer (400) zugeordnete Mittel zum Auswählen eines aktuell von der Telekommunikationsendeinrichtung (100) anzuwendenden Algorithmus.

33. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch der Telekommunikationsendeinrichtung (100) , Spracherkennungssystem (300) und/oder dem DienstServer (400) zugeordnete Mittel zur Überprüfung eines aktuell angewendeten oder anzuwendenden Algorithmus .

34. System nach einem der vorstehenden Ansprüche, ferner gekennzeichnet durch der Telekommunikationsendeinrichtung (100) , Spracherkennungssystem (300) und/oder dem Dienstserver (400) zugeordnete Mittel zur Generierung eines Testsignals, welches zur Überprüfung eines aktuell angewendeten oder anzuwendenden Algorithmus über wenigstens einen Lautsprecher (108, 110) der Telekommunikationsendeinrichtung (100) ausgegeben und mit einem über wenigstens ein Mikrofon (107, 109) der Telekommunikationsendeinrichtung (100) empfangenen Antwortsignal verglichen wird.

35. Serverbasiertes Spracherkennungssystem (300) für ein System nach einem der vorstehenden Ansprüche, umfassend Mittel zur Auswahl wenigstens eines auf einem Dienstserver (400) bereitgestellten Sprachverarbeitungsalgorithmus , insbesondere Freisprech-, Echokompensations-, Sprecherverifizierungs- , -erkennungs- , -klassifizierungs- , Sprachverifizierungs- , -erkennungs-, "Text-To-Speech"- und/oder Geräuschreduktionsalgorithmus, zum wenigstens temporären Laden und Implementieren auf einer bestimmten Telekommunikationsendeinrichtung (100) unter Ansprechen auf der Telekommunikationsendeinrichtung (100) zugeordneten Kennungsungsparametern.

36. Dienstserver (400) für ein System nach einem der vorstehenden Ansprüche, umfassend Mittel zur Auswahl wenigstens eines auf dem DienstServer (400) bereitgestellten Sprachverarbeitungsalgorithmus, insbesondere Freisprech-, Echokompensations-, Sprecherverifizierungs- , -erkennungs- , -klassifizierungs- , Sprachverifizierungs- , -erkennungs-, "Text-To-Speech"- und/oder Geräuschreduktionsalgorithmus zum wenigstens temporären Laden und Implementieren auf wenigstens einer bestimmten Telekommunikationsendeinrichtung (100) unter Ansprechen auf der Telekommunikationsendeinrichtung (100) zugeordneten Kennungsparameter.

37. Tariffierungs- und/oder Billingsystem (500) für ein System nach einem der vorstehenden Ansprüche, umfassend Mittel zur Tariffierung eines einer bestimmten Telekommunikationsendeinrichtung (100) von einem Serverbasierten Spracherkennungssystem (300) wenigstens temporär bereitgestellten Dienstes und/oder eines von einem Dienstserver (400) wenigstens temporär geladenen Programms zur Realisierung eines Sprachverarbeitungsalgorithmus, insbesondere Freisprech-, Echokompensations-, Sprecherverifizierungs- , -erkennungs- , -klassifizierungs- , Sprachverifizierungs- , -erkennungs-, ^wText-To-Speech"- und/oder Geräuschreduktionsalgorithmus unter Ansprechen auf der Telekommunikationsendeinrichtung (100) zugeordnete Kennungs- und/oder Tariffierungsparameter.

38. Telekommunikationsendeinrichtung (100) für ein System nach einem der vorstehenden Ansprüche, umfassend Mittel (101, 103) zum wenigstens temporären Laden wenigstens eines Sprachverarbeitungsalgorithmus von einem Dienstserver (400) und zum temporären Implementieren.

39. Telekommunikationsendeinrichtung (100) nach vorstehendem Anspruch, umfassend Mittel (101, 103) zum wenigstens temporären Laden wenigstens eines Freisprech-, Echokompensations-, Stimmen- und/oder Sprachverifizierungs- und/oder Geräuschreduktionsalgorithmus von dem Dienstserver (400) und zum temporären Implementieren.

40. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, ferner umfassend einen Prozessor zum Ausführen des implementierten Algorithmus .

41. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, welche als mobile Telekommunikationsendeinrichtung ausgebildet ist, insbesondere als PDA, MDA, Mobiltelefon oder DECT- Telefon.

42. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden -Ansprüche, welches auf einem GSM-Standard oder UMTS-Standard basiert.

43. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, ferner umfassend einen A/D- Wandler (104) und einen D/A-Wandler (105) .

44. Telekommunikationsendeinrichtung (100) nach vorstehendem Anspruch, ferner umfassend eine Einrichtung (106) zum Kalibrieren des A/D-Wandler (104) und des D/A-Wandler (105) und/oder zum Durchführen einer digitalen Kalibrierung.

45. Telekommunikationsendeinrichtung nach vorstehendem Anspruch, welche ausgebildet ist die Kalibrierung unter Verwendung eines Sprachsignals und/oder eines Testsignals als Abgleichsignal selbsttätig durchzuführen .

46. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, ferner umfassend eine Kodiereinrichtung (102) .

47. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, gekennzeichnet durch eine Einrichtung zum Umsetzen eines Sprachsignals zwischen unterschiedlichen Frequenzbändern.

48. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, ferner umfassend Schnittstellenmittel zum drahtgebundenen und/oder drahtlosen Anschalten wenigstens eines externen Mikrofons (109) und/oder Lautsprechers (110) .

49. Telekommunikationsendeinrichtung (100) nach einem der vorstehenden Ansprüche, ferner umfassend wenigstens einen Mikrofonkanal und/oder Lautsprecherkanal, insbesondere wenigstens zwei Mikrofonkanäle und/oder Lautsprecherkanäle, und/oder Mittel zur Mehrkanal- Signalübertragung.