DE69735097T2

DE69735097T2 - Verfahren und vorrichtung zur verbesserung der sprachqualität in tandem-sprachkodierern

Info

Publication number: DE69735097T2
Application number: DE69735097T
Authority: DE
Inventors: Paul Cote St. Luc MERMELSTEIN; Rafi Cote St. Luc RABIPOUR; William Navarro; Paul Nepean COVERDALE
Original assignee: Nortel Networks Ltd
Current assignee: Nortel Networks Ltd
Priority date: 1997-06-26
Filing date: 1997-11-05
Publication date: 2006-07-20
Anticipated expiration: 2017-11-06
Also published as: WO1999000791A1; EP0920693B1; CN1179324C; CN1228867A; DE69735097D1; EP0920693A1; US5995923A; CA2256329A1; JP2001500344A; JP3542610B2

Description

Gebiet der Erfindung
Diese Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Übertragung digitalisierter Sprachsignale in einer Kommunikationsumgebung, die von drahtloser Art sein kann. Insbesondere bezieht sie sich auf ein Verfahren und eine Vorrichtung zur Verbesserung der Qualität eines Audiosignals, das mit einer digitalen Signalverarbeitungstechnik komprimiert oder codiert wurde, wenn das Signal von einem Endgerät zu einem anderen Endgerät eines Kommunikationsnetzwerkes übertragen wird.
Hintergrund der Erfindung
In den letzten Jahren hat die Telekommunikationsindustrie die Entwicklung einer Vielzahl von digitalen Vocodern zur Erfüllung von Bandbreiten Anforderungen von unterschiedlichen drahtgebundenen und drahtlosen Kommunikationssystemen erlebt. Der Name „Vocoder" ruht auf der Tatsache, dass seine Anwendungen für die Codierung und Decodierung hauptsächlich von Sprachsignalen spezifisch sind. Vocoder werden üblicherweise in Mobiltelefonen und den Basisstationen des Kommunikationsnetzwerkes integriert. Sie ergeben eine Sprachkompression eines digitalisierten Sprachsignals sowie die umgekehrte Transformation. Typischerweise wird ein Sprachsignal durch eine von vielen Quantisierungstechniken digitalisiert. Beispiel dieser Techniken sind die Pulsamplituden-Modulation (PAM), die Pulscode-Modulation (PCM) und die Delta-Modulation. Für die Zwecke dieser Beschreibung beziehen wir uns auf PCM als das Eingangsformat für den Vocoder. Somit schließt ein Vocoder eine Codierstufe ein, die als Eingang ein digitalisiertes Sprachsignal empfängt und ein komprimiertes Signal abgibt, wobei ein mögliches Kompressionsverhältnis 8:1 ist. Hinsichtlich der Rücktransformation ist der Vocoder mit einer Decodiererstufe versehen, die das komprimierte Sprachsignal empfängt und ein digitalisiertes Signal, wie zum Beispiel PCM-Abtastproben, abgibt.
Der Hauptvorteil der Kompression von Sprache besteht darin, dass hierdurch eine geringere Menge der begrenzten verfügbaren Kanal-Bandbreite für die Übertragung verwendet wird. Der Hauptnachteil ist ein Verlust an Sprachqualität.
Die meisten modernen eine niedrige Bitrate aufweisenden Vocoder beruhen auf dem linearen Prädiktions- oder Vorhersage-Modell, das das Sprachsignal in einen Satz von linearen Prädiktions-Koeffizienten, ein Restsignal und verschiedene Parameter aufteilt. Im allgemeinen kann die Sprache mit guter Qualität aus diesen Komponenten rekonstruiert werden. Eine Beeinträchtigung wird jedoch eingeführt, wenn die Sprache mehrfachen Instanzen von Vocodern unterworfen wird.
Das schnelle Wachstum in der Unterschiedlichkeit von Netzwerken und der Anzahl von Benutzern derartiger Netzwerke vergrößert die Anzahl der Instanzen, in denen zwei Vocoder in Tandem angeordnet sind, um eine einzige Verbindung mit Diensten zu versorgen. In einem derartigen Fall wird ein erster Codierer zum Komprimieren der Sprache des ersten mobilen Nutzers verwendet. Die komprimierte Sprache wird an eine die örtliche Mobilstation mit Diensten versorgende Basisstation gesandt, an der sie dekomprimiert (auf Abtastproben im PCM-Format umgewandelt) wird. Die resultierenden PCM-Abtastproben erreichen eine das zweite mobile Endgerät mit Diensten versorgende Basisstation über die digitale Fernleitung des Telefonnetzwerkes, wo ein zweiter Codierer zum Komprimieren des Eingangssignals zur Übertragung an das zweite mobile Endgerät verwendet wird. Ein Sprachdecodierer an dem zweiten mobilen Endgerät führt eine Dekomprimierung der empfangenen komprimierten Sprachdaten zur Synthetisierung des ursprünglichen Sprachsignals von dem ersten mobilen Endgerät aus. Ein spezielles Beispiel eines derartigen Falls kann einen Anruf beinhalten, der von einem drahtlosen Endgerät, das gemäß dem nordamerikanischen Zeitvielfach-Zugriffs- (TDMA-) System arbeitet, zu einem Mobiltelefon nach dem europäischen genormten globalen System für Mobilkommunikation (GSM) gemacht wird.
In einem Versuch, den Zustand einer Tandem-Anordnung von Vocodern zu beseitigen, wurde in der Vergangenheit ein Verfahren vorgeschlagen, das als „Umgehung" bezeichnet wird. Die grundlegende Idee hinter dieser Lösung ist die Bereitstellung eines digitalen Signalprozessors, der einen Vocoder und einen Umgehungsmechanismus einschließt, der aufgerufen wird, wenn das ankommende Signal in einem Format vorliegt, das mit dem Vocoder kompatibel ist. Im Gebrauch stellt der digitale Signalprozessor, der der ersten Basisstation zugeordnet ist, die das Hochfrequenzsignal von einem ersten mobilen Endgerät empfängt über eine Signalisierung und Steuerung fest, dass ein identischer digitaler Signalprozessor an der zweiten Basisstation vorhanden ist, der dem mobilen Endgerät zugeordnet ist, an das der Anruf gerichtet ist. Der der ersten Basisstation zugeordnete digitale Signalprozessor ruft anstelle der Umwandlung der komprimierten Sprachsignale in PCM-Abtastproben den Umgehungsmechanismus auf und gibt die komprimierte Sprache an das Transportnetzwerk ab. Das komprimierte Sprachsignal wird bei der Ankunft an dem digitalen Signalprozessor, der der zweiten Basisstation zugeordnet ist, derart gelenkt, dass der örtliche Vocoder umgangen wird. Das Dekomprimieren des Signals erfolgt lediglich an dem zweiten mobilen Endgerät.
Diese Lösung ist jedoch lediglich für identische Vocoder gültig. Bei der schnellen Entwicklung von Netzwerken steigt die Vielzahl unterschiedlicher Vocoder sehr schnell an. Die Umgehungslösung ist daher lediglich für einen kleinen Teil von Verbindungen brauchbar, die eine Tandem-Vocoder-Anordnung beinhalten.
Die EP 0 138 073 beschreibt einen Konverter für eine Schnittstellenanpassung zwischen LPC- und Kanal-Vocodern für die Übertragung von digitalisierten Sprachsignalen über digitale Schmalband-Kommunikationssysteme. Der Wandler schließt zwei Teil-Schnittstellen ein, die parallel zueinander angeordnet sind. Eine der Teil-Schnittstellen wandelt LPC-codierte und Sprachsignal-Abschnitte, die auszusenden sind, in eine Codierung für den Kanal-Vocoder um. Die andere Teil-Schnittstelle wandelt die Codierung für den Kanal-Vocoder in eine Codierung in dem LPC-Verfahren um. Dieses Verfahren verwendet Codebücher zur Umsetzung der quantisierten LPC-codierten Parameter auf entsprechende Kanal-Vocoder-Parameter und umgekehrt.
Somit besteht ein Bedarf in der Industrie für Einrichtungen, die in der Lage sind, die Sprachqualität während Verbindungen zu verbessern, die inkompatible, in Tandem angeordnete Vocoder einschließen können.
Ziele und Angabe der Erfindung
Ein Ziel der Erfindung besteht in der Schaffung einer Vorrichtung zur Verarbeitung von Audiosignalen, die die Signalbeeinträchtigung verringern kann, die auftritt, wenn das Signal zwischen zwei Vocodern in einem Kommunikationsnetzwerk ausgetauscht wird.
Ein weiteres Ziel der Erfindung besteht in der Schaffung eines Verfahrens zur Verringerung einer Audiosignal-Beeinträchtigung, wenn das Signal von einem Vocoder zu einem anderen Vocoder in einem Kommunikationsnetzwerk übertragen wird.
Gemäß der Erfindung wird eine Vorrichtung zur Kommunikation eines Daten-Rahmens von komprimierter Audio-Information zwischen nicht-kompatiblen Vocodern geschaffen, wobei die Vorrichtung folgendes einschließt:
einen ersten Transcodierer, der einen ersten Eingang und einen ersten Ausgang einschließt, wobei der erste Transcodierer auf einen Rahmen von komprimierten Audio-Daten mit einem ersten Format anspricht, die seinem Eingang zugeführt werden, um an seinem Ausgang einen Rahmen von komprimierten Audio-Daten mit einem Zwischenformat zu erzeugen, wobei der Rahmen des ersten Formates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist, wobei der Rahmen des Zwischenformates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist;
einen zweiten Transcodierer, der einen zweiten Eingang und einen zweiten Ausgang aufweist, wobei der zweite Eingang mit dem ersten Ausgang verbunden ist, um den Rahmen von komprimierten Audio-Daten des Zwischenformates zu empfangenen, wobei der zweite Transcodierer auf einem Rahmen von komprimierten Audio-Daten mit einem Zwischenformat anspricht, der dem zweiten Eingang zugeführt wird, um an dem zweiten Ausgang einen Rahmen von komprimierten Audio-Daten eines zweiten Formates zu erzeugen, wobei der Rahmen des zweiten Formates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist.
Dieses System ist besonders vorteilhaft, wenn das Telefon-Netzwerk mit einer Vielfalt von nicht-identischen Vocodern versehen ist. Um den Austausch von Sprachsignalen von einem Vocoder zu einem anderen Vocoder unabhängig davon zu ermöglichen, ob sie identisch sind oder nicht, reicht es aus, das komprimierte von dem örtlichen Vocoder abgegebene Audio-Signal auf das gemeinsame Format umzuwandeln, das von dem Pseudo-Codierer des entfernt angeordneten Vocoders verarbeitet werden kann. Das gemeinsame Format kann als ein komprimiertes Audio-Signal einer Zwischen-Darstellung definiert werden, das zur Übertragung wichtiger parametrischer Information bestimmt ist, die von dem Pseudo-Decodierer des örtlichen Vocoders direkt an den Pseudo-Codierer des entfernt angeordneten Vocoders ausgesandt wird. Diese parametrische Information schließt ein Koeffizienten-Segment und Parameter ein, die ein Anregungs-Segment des zu übertragenden Sprach-Signals beschreiben. Ein wichtiges Element der gemeinsamen Format-Darstellung besteht darin, dass dieses die grundlegende Rahmenstruktur des Audiosignals beibehält, wie es von einem der Vocoder in dem Netzwerk codiert wird, der mit einem anderen Vocoder während eines vorgegebenen Anrufs verbunden sein kann. Im einzelnen besteht der Rahmen des gemeinsamen Formates aus einem Koeffizienten-Segment und einem Anregungs-Segment, die weiter unten definiert werden. Es ist jedoch wichtig, festzustellen, dass kein Versuch gemacht wurde, das Audiosignal auf PCM-Abtastproben oder auf eine equivalente Darstellung als gemeinsame Format-Struktur zu reduzieren. Dies ist nicht wünschenswert, weil die Transformation des komprimierte Signals auf PCM und die nachfolgende Umwandlung der PCM-Abtastproben auf eine komprimierte Form erhebliche Beeinträchtigungen der Signalqualität einführt, die soweit wie möglich vermieden werden sollten. Die Erfinder der vorliegenden Erfindung haben festgestellt, dass durch Ausbildung einer gemeinsamen Format-Konfiguration, die die grundlegende Struktur von Audiosignalen beibehält, wie sie von einem Vocoder codiert werden, diese Beeinträchtigungen wesentlich verringert werden.
In dieser Beschreibung soll der Ausdruck „Koeffizienten-Segment" irgendeinen Satz von Koeffizienten bezeichnen, die in eindeutiger Weise eine Filterfunktion definieren, die den Sprachtrakt des Menschen modelliert. Sie bezieht sich weiterhin auf irgendeine Art von Informations-Format, von dem die Koeffizienten indirekt abgeleitet werden können. In üblichen Vocodern sind verschiedene Arten von Koeffizienten bekannt, unter Einschluss von Reflexions-Koeffizienten, Arkus-Sinus-Werte der Reflexions-Koeffizienten, Leitungsspektrum-Paaren, logarithmischen Flächenverhältnissen, um nur einige zu nennen. Diese unterschiedlichen Arten von Koeffizienten stehen üblicherweise durch mathematische Transformationen zueinander in Beziehung, und sie haben unterschiedliche Eigenschaften, die sie für unterschiedliche Anwendungen geeignet machen. Somit soll der Ausdruck „Koeffizienten-Segment" irgendeine dieser Arten von Koeffizienten umfassen.
Das „Anregungs-Segment" kann als Information definiert werden, die mit dem Koeffizienten-Segment zu kombinieren ist, um ein vollständige Darstellung des Audio-Signals zu Schaffen. Die Bezeichnung bezieht sich auch auf irgendeine Art von Informations-Format, von dem die Anregung indirekt abgeleitet werden kann. Das Anregungs-Segment ergänzt das Koeffizienten-Segment bei der Synthetisierung des Signals zur Gewinnung eines Signals in einem nicht komprimierten Format, wie zum Beispiel in PCM-Abtastproben-Darstellungen. Ein derartiges Anregungs-Segment kann parametrische Information einschließen, die die Periodizität des Sprachsignals beschreibt, ein Anregungs-Signal, wie es durch den Pseudo-Decodierer berechnet wird, eine Sprache-Rahmenbildungs-Steuerinformation zur Sicherstellung einer synchronen Rahmenbildung in dem Pseudo-Codierer, die dem entfernt angeordneten Vocoder zugeordnet ist, Klangperioden, Klangverzögerungen, Verstärkungen und relative Verstärkungen einschließen, um einige zu nennen. Das Koeffizienten-Segment und das Anregungs-Segment können in unterschiedlicher Weise in dem Signal dargestellt werden, das über das Netzwerk der Telefongesellschaft übertragen wird. Eine Möglichkeit besteht darin, die Information als solche zu übertragen, das heißt mit anderen Worten, eine Folge von Bits, die die Werte der zu übertragenden Parameter darstellt. Eine weitere Möglichkeit besteht in der Übertragung einer Liste von Indizes, die als solche nicht die Parameter des ein gemeinsames Format aufweisenden Signals übertragen, sondern einfach Einträge in einer Datenbank oder einem Codebuch bilden, das es dem Pseudo-Codierer ermöglicht, in dieser Datenbank nachzuschlagen und die betreffende Information auf der Grundlage der verschiedenen empfangenen Indizes abzuleiten, um das ein gemeinsames Format aufweisende Signal zu konstruieren.
Der Ausdruck „erstes Format", „zweites Format" oder „drittes Format" bezeichnet bei seiner Verwendung zur Beschreibung des Audiosignals in komprimierter Form, entweder in der Darstellung des gemeinsamen Formates oder in dem Format eines vorgegebenen Vocoders, Signale, die allgemein gesprochen nicht kompatibel sind, obwohl sie eine gemeinsame grundlegende Struktur gemeinsam haben, mit anderen Worten, sie sind in ein Koeffizienten-Segment und ein Anregungs-Segment unterteilt. Somit ist ein Vocoder, der in der Lage ist, ein Signal unter dem ersten Format umzuwandeln, allgemein gesprochen nicht in der Lage, ein Signal zu verarbeiten, das unter irgendeinem anderen Format als dem ersten Format ausgedrückt ist.
Bei einer bevorzugten Ausführungsform wird die Transformation des Audiosignals in der komprimierten Form auf das gemeinsame Format in zwei Schritten bewirkt. Der erste Schritt besteht in der Verarbeitung des Koeffizienten-Segmentes in den komprimierten Audiosignal-Datenrahmen zur Erzeugung des Koeffizienten-Segmentes des gemeinsamen Formates. Allgemein gesprochen wird die Transformation von einer Art von Koeffizienten auf eine andere durch gut bekannte mathematische Algorithmen bewirkt. In Abhängigkeit von der Art des Vocoders, der dem Pseudo-Decodierer zugeordnet ist, kann diese Transformation einfach durch Umquantisieren der Koeffizienten von dem komprimierten Audiosignal-Daten-Rahmen in neue Werte bewirkt werden, die die Koeffizienten des ein gemeinsames Format aufweisenden Datenrahmens bilden. In dem nächsten Schritt wird das Anregungs-Segment des das gemeinsame Format aufweisenden Daten-Rahmens durch Verarbeiten der Rahmenenergie, der Verstärkungswerte, der Verzögerungswerte und der Codebuch-Information (wie dies der Decodierer-Teil eines Vocoders normalerweise machen würde) und durch Quantisieren des Anregungs-Signals vor der Bildung eines das gemeinsame Format aufweisenden Daten-Rahmens gewonnen.
Die Transformation von dem das gemeinsame Format aufweisenden Daten-Rahmen auf ein komprimiertes Audiosignal durch einen Pseudo-Codierer wird in einer ähnlichen Weise bewirkt, wie sie weiter oben beschrieben wurde. Das Koeffizienten-Segment des das gemeinsame Format aufweisenden Daten-Rahmens wird zunächst verarbeitet, um das Koeffizienten-Segment des komprimierten Audiosignal-Daten-Rahmens zu erzeugen. Das Anregungs-Segment des komprimierten Audiosignal-Daten-Rahmens wird dadurch erzielt, dass zunächst ein Sprachsignal durch Hindurchleiten des das gemeinsame Format aufweisenden Anregungs-Segments durch ein Filter gewonnen wird, für das die Koeffizienten ebenfalls aus dem gemeinsamen Format gewonnen wurden. Dieses Signal wird dem Codierer-Teil des Vocoders zugeführt, wie dies üblicherweise der Fall sein würde.
Eine weitere Möglichkeit zur Gewinnung des Anregungs-Segmentes in einem Format von einem Daten-Rahmen in einem anderen Format ohne Synthetisieren eines Audiosignals und die nachfolgende Bewirkung einer Analyse besteht in einer Neuberechnung des Anregungs-Segmentes ausschließlich von Daten, die in dem Anregungs-Segment in dem Quellen-Daten-Rahmen verfügbar sind. Die Wahl dieses Verfahrens oder des vorstehend beschriebenen Verfahrens hängt von der beabsichtigten Anwendung oder der Art der Umwandlung ab, die erforderlich ist. Im einzelnen können bestimmte Formate von komprimierten Audiosignalen sehr einfach auf den gemeinsamen Rahmen durch Neuberechnung der Segmente jedes Rahmens unabhängig voneinander umgewandelt werden. In anderen Fällen ist jedoch praktischer, eine Analyse-durch-Synthese-Lösung zur Gewinnung des Anregungs-Segmentes zu verwenden.
Die Erfindung ergibt weiterhin ein Verfahren zur Übertragung eines Daten-Rahmens zwischen nicht-kompatiblen Vocodern, wobei der Daten-Rahmen Audio-Informationen in digitalisierter und komprimierter Form darstellt, wobei der Daten-Rahmen ein Koeffizienten-Segment und ein Anregungs-Segment einschließt, wobei der Daten-Rahmen in einem ersten Format vorliegt, wobei das Verfahren die folgenden Schritte umfasst:
Verarbeiten des Daten-Rahmens in dem ersten Format an einem ersten Ort zur Erzeugung eines Daten-Rahmens eines Zwischenformates, wobei der Daten-Rahmen des Zwischenformates ein Koeffizienten-Segment und ein Anregungs-Segment einschließt;
Senden des Daten-Rahmens eines Zwischenformates an einen zweiten Ort, der von dem ersten Ort entfernt liegt;
Verarbeiten des Daten-Rahmens des Zwischenformates an dem zweiten Ort zur Erzeugung eines Daten-Rahmens des zweiten Formates, wobei der Daten-Rahmen des zweiten Formates einen Koeffizienten-Segment und ein Anregungs-Segment einschließt.
Kurze Beschreibung der Zeichnungen
1 ist ein Blockschaltbild der Codierer-Stufe eines CELP-Vocoders;
2 ist ein Blockschaltbild der Decodierer-Stufe eines CELP-Vocoders;
3a ist eine schematische Darstellung einer Kommunikations- Verbindungsstrecke zwischen einem drahtlosen mobilen Endgerät und einem festen (drahtgebundenen) Endgerät;
3b ist eine schematische Darstellung einer Kommunikations-Verbindungsstrecke zwischen zwei drahtlosen mobilen Endgeräten mit einer Ausführungsform dieser Erfindung, die zwei Transcodierer einschließt;
3c ist eine schematische Darstellung einer Kommunikations-Verbindungsstrecke zwischen zwei drahtlosen mobilen Endgeräten mit einer Ausführungsform der Erfindung, die einen Kreuz-Transcodierungs-Knoten einschließt;
4 ist ein Blockschaltbild eines Systems, das gemäß der vorliegenden Erfindung aufgebaut ist, um ein komprimiertes Sprachsignal von einem Format in ein anderes über ein gemeinsames Format ohne die Notwendigkeit einer Dekomprimierung des Signals auf eine Digitalisierungstechnik vom PCM-Typ umzusetzen;
5 ist ein ausführlicheres Blockschaltbild des in 4 gezeigten Systems;
6 ist ein Blockschaltbild eines Kreuz-Transcodierungs-Knotens, der eine Variante des in 5 gezeigten Systems bildet;
7a zeigt einen Daten-Rahmen in einem IS 54-Format;
7b zeigt einen Daten-Rahmen des gemeinsamen Formates, der von dem in 5 gezeigten Transcodierer oder dem in 6 gezeigten Transcodierer erzeugt wird;
7c zeigt einen Daten-Rahmen in dem IS 641-Format;
8 ist ein Ablaufdiagramm der Operation zur Umwandlung eines komprimierten Sprach-Daten-Rahmens in dem IS 54-Format auf das gemeinsame Format;
9 ist ein Ablaufdiagramm der Operation zur Umwandlung eines Daten-Rahmens in dem gemeinsamen Format auf das komprimierte Sprachformat IS 641;
10 ist ein Blockschaltbild einer Vorrichtung zur gerätemäßigen Ausgestaltung der Funktionalität eines Pseudo-Codierers der in 5 gezeigten Art;
11 ist ein funktionelles Blockschaltbild der in 10 gezeigten Vorrichtung; und
12 ist ein funktionales Blockschaltbild einer Variante der in 10 gezeigten Vorrichtung.
Beschreibung einer bevorzugten Ausführungsform
Es folgt eine Beschreibung der linearen prädiktiven Codierungs- (LPC-) Vocoder-Technologie, die derzeit im drahtlosen Telekommunikationen verwendet wird. Eine Anwendung von speziellem Interesse ist die drahtlose Übertragung eines Signals zwischen einem mobilen Endgerät und einer ortsfesten Basisstation. Eine weitere Anwendung ist die Übertragung von Sprache über das Internet-Kommunikationsnetzwerk, bei dem unterschiedliche Vocoder in getrennten Teilen des drahtgebundenen Netzwerkes verwendet werden können.
In Kommunikationsanwendungen, in denen die Kanalbandbreite ein wichtiger Gesichtspunkt ist, ist es wesentlich, den kleinstmöglichen Teil eines Übertragungskanals zu verwenden. Eine übliche Lösung besteht in der Quantisierung und Komprimierung des von einem Benutzer geäußerten Sprachsignals, bevor es übertragen wird.
Typischerweise wird das Sprachsignal zunächst mit Hilfe einer von vielen Quantisierungstechniken digitalisiert. Beispiele dieser Techniken sind die Pulsamplituden-Modulation (PAM), die Pulscode-Modulation (PCM) und die Delta-Modulation, wobei PCM wahrscheinlich am populärsten ist. Grundsätzlich werden bei PCM Abtastproben eines Analog-Signals mit einer festgelegten Rate (8 kHz ist üblich) gewonnen und in diskrete Werte zur Darstellung in digitalem Format quantisiert.
Codecs, die eine Codierungs- und eine Decodierungs-Stufe einschließen, werden dann zur Komprimierung (und Dekomprimierung) der digitalen Signale an der Quelle bzw. dem Empfangspunkt verwendet, um die Verwendung der Übertragungskanäle zu optimieren. Codecs, die speziell für Sprachsignale verwendet werden, werden üblicherweise als „Vocoder" (für Sprach-Codierer) bezeichnet. Durch Codieren lediglich der erforderlichen Charakteristiken eines Sprachsignals müssen weniger Bits übertragen werden, als dies zur Reproduktion der ursprünglichen Schwingungsform in einer Weise erforderlich ist, die die Sprachqualität nicht wesentlich beeinträchtigt. Wenn weniger Bits erforderlich sind, kann eine Übertragung mit niedrigerer Bit-Rate erzielt werden.
Derzeit sind die meisten eine niedrigere Bit-Rate aufweisenden Vocoder von der linearen prädiktiven Codierungs- (LPC-) Familie, die wesentliche Sprachmerkmale aus einer Schwingungsform in Zeitbereich extrahiert. Vocoder haben zwei Hauptkomponenten: einen Codierer und einen Decodierer. Der Codierer-Teil verarbeitet das digitalisierte Sprachsignal, um es zu komprimieren, während der Decodierer-Teil die komprimierte Sprache in ein digitalisiertes Audio-Signal expandiert.
Ein Vocoder vom LPC-Typ verwendet eine bewertete Summe der vergangenen p Abastproben der Sprache (s^n-k) zur Abschätzung der derzeitigen Abtastprobe (sⁿ). Die Zahl p bestimmt die Ordnung des Modells. Je höher die Ordnung ist, desto besser ist die Sprachqualität. Typischerweise reichen Modell-Ordnungen von 10 bis 15. Hieraus folgt, dass eine Gleichung für eine Sprach-Abtastprobe wie folgt geschrieben werden kann:
worin a^k ein Koeffizienten ist, der den Beitrag der letzten s^n-k-Abtastprobe bestimmt, und eⁿ das Fehlersignal für die derzeitige Abtastprobe ist.
Unter Verwendung der z-Transformation von sⁿ und eⁿ und unter Definition eines Prädiktionsfilters erhalten wir: s(z) = e(z)1A(z) worin
Das Filter 1 / A(z) hat nur Pole und wird daher als ein Allpol-Filter bezeichnet.
1 ist ein Blockschaltbild des Codierer-Teils eines generischen Modells für einen CELP-Vocoder. Wie aus dieser Figur zu erkennen ist, ist der Eingang an den Sprachtrakt-Analyseblock 100 des Codierer-Teils durch PCM-Abtastproben gebildet, und der Ausgang besteht aus einem LPC-Filter-Koeffizienten-Segment und einem Anregungs-Segment, das aus mehreren Parametern besteht, die das Prädiktions-Fehlersignal darstellen (das auch als Rest bezeichnet wird). Der Ausgang wird an einen Telekommunikationskanal weitergeleitet.
Die Anzahl der LPC-Filter-Koeffizienten in den Koeffizienten-Segment wird durch die Ordnung p des Modells bestimmt. Beispiele der Anregungs-Segment-Parameter sind wie folgt. Art der Anregung (stimmhaft oder nicht stimmhaft), Klangperiode (für die stimmhafte Anregung), Verstärkungsfaktoren, Energie, Klang, Prädiktionsgewinn, und so weiter. Code-angeregte lineare Prädiktions-(CELP-) Vocoder sind die am stärksten übliche Art von Vocodern, die derzeit in der Telefonie verwendet werden. Anstelle des Sendens der Anregungs-Parameter senden CELP-Vocoder Index-Information, die auf einen Satz von Vektoren in einem adaptiven und stochastischen Code-Buch zeigt. Das heißt, für jedes Sprachsignal durchsucht der Codierer sein Code-Buch für dasjenige, das die beste wahrnehmbare Übereinstimmung mit dem Klang ergibt, wenn es als eine Anregung für das LPC-Synthesefilter verwendet wird.
Ein diese Information einschließender Sprach-Rahmen wird alle T Sekunden neu berechnet. Ein üblicher Wert für T ist 20 ms. Ein komprimierter 20 ms-Sprach-Rahmen stellt 160 PCM-Abtastproben dar, die bei 8 kHz gewonnen werden.
2 ist ein Blockschaltbild des Decodierer-Teils eines generischen Modells für einen CELP-Vocoder. Der komprimierte Sprach-Rahmen wird von dem Telekommunikationskanal 210 empfangen und einem LPC-Synthesefilter 220 zugeführt. Das LPC-Synthesefilter 220 verwendet das LPC-Filter-Koeffizienten-Segment und das Anregungs-Segment zur Erzeugung und Ausgabe eines Sprachsignals, üblicherweise in einer PCM-Abtastproben-Form.
Eine als Interpolation bezeichnete Technik wird als eine Verbesserung von Vocodern verwendet. Sie besteht aus der Unterteilung der 20 ms-Sprach-Rahmen in Teil-Rahmen von 5 ms und die Interpolation ihrer Prädiktor-Koeffizienten. Diese Techniken sind nützlich, um unerwünschte „Knack"- oder „Klick"-Geräusche in dem erzeugten Sprachsignal zu vermeiden, die üblicherweise das Ergebnis von schnellen Änderungen in den Prädiktor-Koeffizienten von einem Signal-Rahmen zu dem anderen sind. Im einzelnen wird jeder Signal-Rahmen in vier Teil-Rahmen unterteilt, die als Teil-Rahmen (1), Teil-Rahmen (2), Teil-Rahmen (3) und Teil-Rahmen (4) zu Bezugszwecken verwendet werden können. Die Prädiktor-Koeffizienten, die für die Sprachsignal-Erzeugung über den ersten Teil-Rahmen, nämlich den Teil-Rahmen (1) verwendet werden, sind eine Kombination der Prädiktor-Koeffizienten für den vorhergehenden Rahmen mit den Koeffizienten für den derzeitigen Rahmen in einem Verhältnis von 75%/25% für den Teil-Rahmen (2) ändert sich dieses Verhältnis auf 50%/50%, für den Teil-Rahmen (3) erreicht das Verhältnis 25%/75%, während für den letzten Teil-Rahmen (Teil-Rahmen (4) das Verhältnis 0%/100% ist, das heißt mit anderen Worten, dass lediglich die Koeffizienten von dem derzeitigen Rahmen verwendet werden.
Die 3a, 3b und 3c sind schematische Darstellungen, die Telefonkommunikationen zeigen, die drahtlose Verbindungsstrecken beinhalten und die CELP-Vocoder-Technologie verwirklichen.
3a ist eine schematische Darstellung einer Kommunikations-Verbindungsstrecke zwischen einem drahtlosen mobilen Endgerät 300 und einem stationären (drahtgebundenen) Endgerät 330. Die Sprache wird durch einen Vocoder komprimiert (codiert) der sich in dem mobilen Endgerät 300 befindet, und über eine drahtlose Verbindungsstrecke (HF-Kanal) an eine Basisstation 310 gesandt, an der sie in PCM-Abtastproben durch den Decodierer eines zweiten Vocoders decodiert wird. Das Signal wird dann über verschiedene Vermittlungen in der digitalen Fernleitung des Telekommunikationsgesellschafts-Netzwerkes 315 zu dem Vermittlungsamt 320 gelenkt, mit dem das stationäre Endgerät 330 physikalisch verbunden ist. An dem Vermittlungsamt wird das digitale Signal in Analogformat umgewandelt und zu dem Endgerät 330 gelenkt. Bei einem derartigen Szenarium wird die Sprache lediglich einmal komprimiert und dekomprimiert.
3 ist eine schematische Darstellung einer Kommunikations-Verbindungsstrecke zwischen zwei drahtlosen mobilen Endgeräten 340 und 380 mit einer Ausführungsform der Erfindung, die zwei Transcodierer einschließt. Die Sprache wird durch einen sich in dem mobilen Endgerät A 340 befindenden Vocoder komprimiert (codiert) und über eine drahtlose Verbindungsstrecke (HF-Kanal A) zu einer Basisstation A 350 gesandt, an der sie in PCM-Abtastproben von dem Decodierer eines zweiten Vocoders decodiert wird. Die PCM-Abtastproben werden dann über das Netzwerk 360 der Telekommunikationsgesellschaft an die Basisstation B 370 des zweiten mobilen Endgerätes gesandt, wo sie ein zweites Mal durch den zweiten Basisstations-Vocoder komprimiert (codiert) werden. Das komprimierte Signal wird über eine drahtlose Verbindungsstrecke (HF-Kanal B) zu dem mobilen Endgerät 380 gesandt, wo es ein zweites Mal von dem Vocoder des zweiten mobilen Endgerätes decodiert wird. Hörbare Sprache steht dann an dem mobilen Endgerät 380 zur Verfügung. 3b zeigt weiterhin eine Ausführungsform der Erfindung die zwei Transcodierer 392 und 394 einschließt, die weiter unten ausführlich beschrieben werden.
3c ist eine schematische Darstellung einer Kommunikations-Verbindungsstrecke zwischen zwei drahtlosen mobilen Endgeräten mit einer Ausführungsform dieser Erfindung, die einen Kreuz-Transcodierungs-Knoten 390 einschließt. Der Kreuz-Transcodierungs-Knoten wird weiter unten ausführlich beschrieben.
Diese Anordnung von Vocodern ist ein Beispiel von dem, was als Tandem- Vocoder-Anordnung bezeichnet wird. Andere Beispiele von Tandem-Vocoder-Anordnungen sind Fälle, in denen ein drahtloses mobiles Endgerät mit einem stationären drahtlosen Endgerät kommuniziert, und wenn irgendeine Art von drahtlosem Endgerät Mitteilungen von einem zentralen Sprachpost-System erhält, das Vocoder zum Komprimieren von Sprache vor dem Speichern der Daten verwendet. In solchen Fällen wird die Sprache durch die Kompressions- und Dekompressions-Algorithmen von Vocodern mehr als einmal hindurchgeleitet. Wenn Vocoder in einer derartigen Weise in Tandem angeordnet sind, so wird die Qualität der Sprache üblicherweise beeinträchtigt.
Um Beeinträchtigungen des Sprachsignals zu kompensieren, die durch Tandem-Verbindungen von eine niedrige Bit-Rate aufweisenden Codecs (Vocodern) hervorgerufen werden, wurde ein Verfahren entwickelt, das als „Umgehung" bezeichnet wird, um die doppelte Decodierung/Codierung zu beseitigen, die von Vocodern in Basisstationen 350 und 370 durchgeführt wird. Die grundlegende Idee hinter diesem Verfahren besteht darin, dass die Basisstation A 350, die über Signalisierung und Steuerung weiß, dass der Vocoder in dem mobilen Endgerät B 380 identisch zu dem Vocoder in dem mobilen Endgerät A 340 ist, den Vocoder umgeht, was es ermöglicht, dass die Signal-Datenrahmen direkt in die digitale Fernleitung 30 gefangen, ohne geändert zu werden. In ähnlicher Weise sendet die Basisstation 370 in Kenntnis darüber, dass sie komprimierte Sprach-Datenrahmen empfängt, das Signal einfach an das mobile Endgerät B 380 ohne irgendeine Codierung. Das Umgehungsverfahren ist vollständig in der weiter oben in dieser Beschreibung genannten internationalen Anmeldung beschrieben.
Diese Lösung ist jedoch nur für identische Vocoder gültig. Mit der schnellen Erweiterung von Netzwerken nimmt die Vielfalt von Vocodern sehr schnell zu. Die Umgehungslösung ist daher lediglich für einen kleinen Teil von Verbindungen brauchbar, die die Tandem-Vocoder-Anordnung beinhalten.
Die vorliegende Erfindung ergibt ein Verfahren und ein System zur Verringerung der Signal-Beeinträchtigung, die auftritt, wenn Vocoder während eines Anrufs in Tandem verbunden sind. Das System weist Mechanismen und Protokolle für die Umwandlung von komprimierten Sprach-Datenrahmen in eine gemeinsame Zwischen-Darstellung während einer Verbindung auf, unabhängig davon, ob diese Verbindung zwischen zwei mobilen Endgeräten oder zwischen einem mobilen Endgerät und einem ortsfesten drahtlosen Endgerät besteht.
4 zeigt ein Blockschaltbild eines Systems das gemäß der vorliegenden Erfindung aufgebaut ist, um ein komprimiertes Sprachsignal von einem Format zu einem anderen über ein gemeinsames Format ohne die Notwendigkeit einer Dekomprimierung des Signals auf eine Digitalisierungstechnik von PCM-Typ umzusetzen.
Eine spezielle Ausführungsform diese Systems ist in 5 gezeigt, die ein Blockschaltbild ist, das ein modulares Kreuz-Transcodierungssystem 510 mit zwei Transcodierern zeigt, die die gleichen Funktionsblöcke haben, die vorgesehen sind, um das Verfahren gemäß der Erfindung gerätemäßig auszuführen. Die Transcodierer sind getrennte Geräte, die an den Enden des Kommunikationspfades installiert sind, um Signalumwandlungsfunktionen bereitzustellen. Diese Signalumwandlungsfunktionen können unterschiedlich sein, in Abhängigkeit davon, welche Kommunikations-Norm das Netzwerk verwendet. In einer typischen Anwendung ist jeder Transcodierer einer Basisstation des Netzwerkes zugeordnet. Somit wird ein von einem Transcodierer abgegebenes Signal über das Telefon-Netzwerk in Richtung auf den zweiten Transcodierer transportiert, wo es verarbeitet wird, wie dies weiter unten ausführlich beschrieben wird. Beide Transcodierer haben die gleichen Funktionsblöcke. Aus Vereinfachungsgründen wird hier ein Transcodierer beschrieben und die Beschreibung gilt genauso für die andere Einheit.
Der Transcodierer 510 schließt einen Signalisierungs- und Steuerblock 520, einen Codierer-Block 530 und einen Decodierer-Block 540 ein. Die Hauptfunktion des Signalisierungs- und Steuerblockes 520 besteht in einer Kommunikation (oder dem Versuch einer Kommunikation) über PCM-Bit-Stehlen (In-Band-Signalisierung) oder direkte Kommunikationen von einer zentralen Datenbank (Außer-Band-Signalisierung) mit der Einheit an dem anderen Ende der Verbindungsstrecke, um festzustellen, ob:

a) die Verbindung an einem identischen Vocoder vom LPC-Typ endet,
b) die Verbindung an einem Vocoder von einem unterschiedlichen LPC-Typ endet,
c) die Verbindung an einer Einheit endet, die nicht durch die vorstehen den Punkte a) oder b) abgedeckt ist (das heißt Vocoder eines anderen Familien-Typs, neuer Art von LPC-Vocoder, drahtgebundenes Endgerät usw.).

Der Decodierer-Block 540 umfasst einen Decodierer 542, eine Pseudo-Decodierer 544 und einen Umgehungsabschnitt 546. Unter der Steuerung des Signalisierungs- und Steuerblockes 520 führt der Decodierer-Block 540 eine der folgenden Aufgaben aus:

a) wenn die Verbindung an einem Vocoder von einem identischen LPC-Typ endet, sende das komprimierte Sprachsignal von dem mobilen Endgerät A über den Umgehungsabschnitt 546, der die komprimierten Sprachdaten möglicherweise nach einer Neuformatierung zur Übertragung an den Umgehungsabschnitt 586 des Transcodierers 550 zum mobilen Endgerät B weiterleitet,
b) wenn die Verbindung an einem Vocoder von einem anderen LPC-Typ endet, für den ein Transcodierungs-Modul zur Verfügung steht, wende den Pseudo-Decodierer 544 an, um komprimierte Sprachdaten von dem mobilen Endgerät A auf ein Signal mit einem gemeinsamen Format zur Übertragung an den Pseudo-Codierer 584 des Transcdierers 550 umzuwandeln, oder
c) wenn die Verbindung an einer Einheit endet, die nicht durch a) oder b) abgedeckt ist (das heißt Vocoder eines anderen Familien-Typs, neue Art von LPC-Vocoder, drahtgebundenes Endgerät usw.), wende den Sprach-Decodierer 542 an, um komprimierte Sprachdaten von dem mobilen Endgerät A in PCM-Abtastproben zur Aussendung an den Codierer 582 des Transcodierers 550 oder des Vermittlungsamts 590 umzuwandeln.

Der Codierungsblock 530 umfasst einen Codierer 532, einen Pseudo-Codierer 534 und einen Umgehungsabschnitt 536. Unter der Steuerung des Signalisierungs- und Steuerblockes 520 führt der Codierungsblock 530 eine der folgenden Aufgaben aus:

a) wenn die Verbindungsquelle einen Vocoder vom identischen LPC-Typ hat, sende das Sprachsignal, das von dem Umgehungsabschnitt 576 des Transcodierers 550 empfangen wird, an den Umgehungsab schnitt 536, der komprimierte Sprachdaten, möglicherweise nach einer Umformatierung, zum Weiterleitung an das mobile Endgerät A hindurchleitet, mit dem der Transcodierer 510 verbunden ist.
b) wenn die Verbindungsquelle einen Vocoder von einem anderen LPC-Typ hat, für den ein Transcodier-Modul verfügbar ist, rufe den Pseudo-Codierer 534 auf, um ein ein gemeinsames Format aufweisendes Signal, das von dem Pseudo-Decodierer-Abschnitt 574 des Transscodierers 550 empfangen wird, in komprimierte Sprachdaten umzuwandeln und das Signal an das mobile Endgerät A weiterzuleiten,
c) wenn die Verbindung an einer Einheit endet, die nicht durch die vorstehenden Punkte a) oder b) abgedeckt ist (das heißt Vocoder eines anderen Familien-Typs, neue Art von LPC-Vocoder, drahtgebundenes Endgerät usw.), wende den Sprachcodierer 532 an, um PCM-Format-Abtastproben, die von dem Decodierer 572 des Transcodierers 550 oder von dem Vermittlungsamt 590 empfangen wurden, in komprimierte Sprach-Daten umzuwandeln und die komprimierten Sprach-Daten an das mobile Endgerät A weiterzuleiten.

Der Signalisierungs- und Steuerblock 520 in dem Transcodierer 510 ist so ausgelegt, dass er Mitteilungen in Richtung an den Transcodierer 550 sendet und weiterhin Mitteilungen von dem Transcodierer 550 empfängt, um auf diese Weise die Transcodierer-Operationen entsprechend den Daten richtig einzustellen, die von dem Transcodierer 550 empfangen oder in Richtung auf diesen ausgesandt werden. Die Kommunikation zwischen den zwei Transcodierern wird über einen Kommunikationskanal bewirkt, der zwischen diesen ausgebildet ist. Der Kommunikationskanal kann entweder im Band oder außerhalb des Bandes liegen.
Während der PCM-Übertragung wird der Prozess des Bit-Stehlens verwendet. Dieser Prozess besteht in der Verwendung bestimmter Bits von bestimmten Sprach-Abtastproben zur Übertragung von Signalisierungs-Information. Die Position der Signalisierungs-Bits und die Bit-Stehlrate werden so ausgewählt, dass die wahrnehmbare Wirkung der Bit-Ersetzung verringert wird, so dass das hörbare Signal an jedem der mobilen Endgeräte nicht wesentlich beeinträchtigt wird. Der empfangende Transcodierer kennt die Position der Signalisierungs-Bits in den Sprach-Abtastproben und ist somit in der Lage, die Mitteilung decodieren.
Das Quittungsaustausch-Verfahren zwischen den Transcodierern 510 und 550 beinhaltet den Austausch von unterschiedlichen Mitteilungen, die es einem Transcodierer ermöglichen, den Partner-Transcodierer zu identifizieren, so dass jede Einheit auf ein Betriebsart eingestellt werden kann, die es ermöglicht, die bestmögliche Sprachqualität zu erzeugen. Die Quittungsaustausch-Prozedur beinhaltet den Austausch der folgenden Mitteilungen:

a) der Sender des Signalisierungs- und Steuerblockes 520 bettet eine Identifikation in das PCM-Sprachsignal ein, das von dem Transcodierer 510 abgegeben wird. Diese Identifikation ermöglicht es irgendeinem entfernt angeordneten Transcodierer, präzise die Art des Vocoders zu bestimmen, der mit dem Ursprungs-Transcodierer verbunden ist, nämlich dem Transcodierer 510. Die Identifikation wird durch eine Datenbank-Suchoperation bewirkt, wie dies weiter unten beschrieben wird.
b) der Signalisierungs- und Steuerblock 560 überprüft die Daten-Rahmen, die von dem Transcodierer 550 empfangen werden, und leitet irgendeine Inband-Signalisierungsinformation ab. Dies wird durch Beobachten der Bit-Werte an den vorgegebenen Positionen in dem Daten-Rahmen bewirkt. Wenn die Mitteilung eine Transcodierer-Identifikation ist, so wird eine (in den Zeichnungen nicht gezeigte) Datenbank befragt, um die Art des Vocoders zu bestimmen, der mit dem Transcodierer verbunden ist, der die Mitteilung abgibt. In Abhängigkeit von den Inhalten der Mitteilung ergeben sich die folgenden Möglichkeiten:
1) die Vorgabe-Betriebsart für die Codierungsblöcke 530 und 580 und die Decodierungsblöcke 540 und 570 ist derart, dass die Codierer 532 und 582 und die Decodierer 542 und 572 aktiv sind, während die verbleibenden Funktions Module, nämlich die Pseudo-Codierer 534 und 584, die Pseudo-Decodierer 544 und 574 und die Umgehungsabschnitte 536, 546, 576 und 586 inaktiv sind. Dies bedeutet, dass wenn der Transcodierer 510 (oder 550) die Existenz eines Partner-Transcodierers in dem Netzwerk nicht erkannt hat, der Transcodierer sich als normaler Vocoder verhält, das heißt, er wird komprimierte Sprach-Daten, die von dem mobilen Endgerät A empfangen werden, in PCM-Abtastproben umwandeln, die in das Transportnetzwerk eingegeben werden. In gleicher Weise erwartet der Transcodierer, PCM-Abtastproben von dem Transportnetzwerk zu empfangen und wandelt diese Abtastproben in ein komprimiertes Format um, das mit dem Vocoder des mobilen Endgerätes kompatibel ist, das von diesem Transcodierer mit Diensten versorgt wird;
2) wenn der Signalisierungs- und Steuerblock 510 das Vorhandensein eines entfernt angeordneten Transcodierers identifiziert hat, wird die Identifikation des Transcodierers in der örtlichen Datenbank überprüft, um die Art des Transcodierers zu bestimmen, der die Mitteilungen sendet. wenn
i) der Transcodierer identisch ist, das heißt mit anderen Worten, dass der Vocoder, der mit dem entfernt angeordneten Transcodierer entsprechend dem gleichen Rahmenformat oder der gleichen Norm wie der Vocoder arbeitet, der mit dem Transcodierer 510 verbunden ist, so bewirkt der Signal- und Steuerblock 520, dass der Decodierungsblock die Umgehungsstufe 546 aktiviert, während der Decodierer 542 und der Pseudo-Decodierer 544 abgeschaltet werden. Somit werden irgendwelche komprimierten Sprachdaten, die von dem entfernt angeordneten Transcodierer empfangen werden, an das mobile Endgerät A ohne Decodierung gelenkt. Diese Betriebsart ist diejenige, die die Erzielung der bestmöglichen Sprachqualität ermöglicht, weil keine Vocoder-Tandem-Anordnung auftritt. Der Signal- und Steuerblock 520 schaltet weiterhin den Codierer-Block 530 auf einen Zustand um, in dem die Umgehung 536 aktiv ist, während der Codierer 532 und der Pseudo-Codierer 534 inaktiv sind. Somit werden komprimierte Sprachdaten, die von dem mobilen Endgerät A empfangen werden, ohne jede Decodierung durch den Transcodierer 510 geleitet. Es sei beachtet, dass die Entscheidung zum Umschalten des Codierungs-Blockes 530 auf die Umgehungs-Betriebsart auf der Annahme beruht, das der Signalisierungs- und Steuerblock 560 des entfernt angeordneten Transcodierers 550 die Identifikation des Transcodierers 510 empfangen hat und ebenfalls den Decodierungs-Block 570 und den Codierungs-Block 580 auf die Umgehungs-Betriebsart eingestellt hat. In diesem Fall wird eine Vollduplex-Verbindung zwischen den Transcodierern ausgebildet, die komprimierte Sprachsignale austauschen.
ii) der Transcodierer unterschiedlich ist, das heißt, dass der entfernt angeordnete Transcodierer anzeigt, dass der dem mobilen Endgerät B zugeordnete Vocoder einen unterschiedlichen LPC-Typ hat, so aktiviert der Signalisierungs- und Steuerblock 520 den Decodierungs-Block 540 zur Aktivierung des Pseudo-Decodierers 544, während der Decodierer 542 und die Umgehung 546 abgeschaltet werden. In dieser Betriebsart erwartet der Signalisierungs- und Steuerblock 520 den Empfang von Sprachsignalen, die in einem gemeinsamen Format codiert sind, das der Pseudo-Decodierer 544 in das Format des Vocoders umwandelt, der der mobilen Station A zugeordnet ist. Weiterhin schaltet der Signalisierungs- und Steuerblock 520 den Codierungs-Block 530 auf eine Betriebsart, in der der Pseudo-Codierer 534 aktiv ist, während der Codierer 532 und die Umgehung 536 inaktiv sind. Somit weisen die von dem Transcodierer 510 abgegebenen Daten ein gemeinsames Format auf, das der Pseudo-Codierer 584 in das Format des Vocoders codiert, der dem mobilen Endgerät B zugordnet ist.

Ein Kreuz-Transcodierungs-Knoten, wie er in 6 gezeigt ist, ist eine weitere Ausführungsform dieser Erfindung. Es sei bemerkt, dass aus Gründen der Klarheit lediglich eine Hälfte des gesamten Kreuz-Transcodierungs-Knotens gezeigt ist. Die andere Hälfte des Kreuz-Transcodierungs-Knotens ist identisch und ergibt Kommunikationsfähigkeiten in der entgegengesetzten Richtung. Der Kreuz-Transcodierungs-Knoten wirkt als eine zentralisierte Schnittstelle zwischen Sprach-Codecs, die unterschiedlich sind. Im Wesentlichen kann der Transcodierungs-Knoten 600 als zwei Paare von Transcodierern betrachtet werden, die physikalisch miteinander verbunden sind, statt dass sie voneinander getrennt sind, wie dies in der früheren Ausführungsform beschrieben wurde. Anstelle der Verwendung eines getrennten Signalisierungs- und Steuerblockes für jeden Transcodierer wird eine einzige Signalisierungs- und Steuerstufe verwendet. Der Kreuz-Transcodierungs-Knoten 600 schließt weiterhin einen Decodierungs-Block 620, einen Codierungs-Block 630 und einen Schalter 640 ein.
Die Hauptfunktion des Signalisierungs- und Steuerblockes 610 besteht in der Kommunikation (oder dem Versuch der Kommunikation) mit der Einheit an dem anderen Ende der Verbindungsstrecke, um festzustellen, ob:

a) die Verbindung an einem Vocoder von einem identischen LPC-Typ endet,
b) die Verbindung an einem Vocoder eines anderen LPC-Typs endet, für den ein Transcodierungs-Modul zur Verfügung steht,
c) die Verbindung an einer Einheit endet, die nicht durch den vorstehenden Fall a) oder b) abgedeckt ist (das heißt ein Vocoder eines anderen Familientyps, eine neue Art von LPC-Vocoder, ein drahtgebundenes Endgerät, usw.).

Zeitsteuer- und Synchronisationsinformationen werden zur Steuerung des Decodierungs-Blockes 620 und des Codierungs-Blockes 630 verwendet. Steuerinformationen werden zur Auswahl der richtigen Position des Schalters 640 verwendet, um das richtige Signal hindurchzulenken.
Der Decodierungs-Block 620 umfasst einen Decodierer 622, Pseudo-Decodierer 624 und Umgehungsabschnitt 626. Der Codierungs-Block 630 umfasst einen Umgehungsabschnitt 632, Pseudo-Codierer 634 und Codierer 636.
Wenn zwei Vocoder miteinander verbunden sind, arbeitet der Kreuz-Transcodierungs-Knoten in der nachstehend beschriebenen Weise. Unter der Steuerung des Signalisierungs- und Steuerblockes 610 führt der Decodierungs-Block 620 eine der folgenden Aufgaben aus:

a) wenn die Verbindung an einem Vocoder von einem identischen LPC-Typ endet, sendet er das komprimierte Sprachsignal an den Umgehungsabschnitt 626, der die Sprachdaten über den Umgehungsabschnitt 632 hindurch leitet, möglicherweise nach einer Umformatierung, zur Aussendung an den Vocoder vom identischen LPC-Typ,
b) wenn die Verbindung an einem Vocoder von einem unterschiedlichen LPC-Typ endet, für den ein Transcodierungs-Modul verfügbar ist, wendet er den Pseudo-Decodierer 624 an, um komprimierte Sprachdaten auf ein ein gemeinsames Format aufweisendes Signal umzuwandeln und lenkt dann das Signal an den Pseudo-Codierer 434, um das gemeinsame Format zurück auf ein komprimiertes Signal umzuwandeln, und schließlich sendet er das komprimierte Sprachsignal an den Vocoder von einem unterschiedlichen LPC-Typ aus, oder
c) wenn die Verbindung an einer Einheit endet, die nicht durch den vorstehenden Fall a) oder b) abgedeckt ist (das heißt Vocoder von einem anderen Familien-Typ, neue Art von LPC-Vocoder, drahtgebundenes Endgerät, usw.) wendet er den Sprach-Decodierer 622 an, um komprimierte Sprachdaten auf PCM-Abtastproben umzuwandeln und lenkt dann das Signal an den Codierer 636, um die PCM-Abtastproben zurück auf ein komprimiertes Sprachsignal umzuwandeln, und schließlich sendet er das komprimierte Sprachsignal an die am Ende angeordnete Einheit.

Wenn er mit einem drahtgebundenen Endgerät verbunden ist, arbeitet der Kreuz-Transcodierungs-Knoten so, wie dies nachfolgend beschrieben wird. Wenn ein PCM-Signal ankommt, wird es zu dem Schalter 640 gelenkt, der Signalisierungs- und Steuerblock 610 wählt ein Schalten zum Weiterleiten des Signals an den Codierer 636 aus, an dem das Signal in komprimierte Sprache umgewandelt wird, und schließlich wird die komprimierte Sprache an den externen Vocoder gesandt. Wenn sich ein drahtgebundenes Endgerät an dem empfangenden Ende der Kommunikation befindet und ein komprimiertes Sprachsignal ankommt, so wird das Signal zu dem Decodierer 622 gelenkt, wo es in ein PCM-Format umgewandelt wird, und dann wählt der Signalisierungs- und Steuerblock ein Schalten derart aus, dass das Signal an das drahtgebundene Endgerät weitergeleitet wird.
Die folgende Beschreibung liefert nunmehr ein spezielles Beispiel dafür, wie die Pseudo-Codierer-Einheiten die Transformation von einem komprimierten Signal zu einem Signal in einem gemeinsamen Format sowie die umgekehrte Transformation bewirken, nämlich eine Umwandelung von dem gemeinsamen Format auf ein komprimiertes Signal. Insbesondere sei der Fall betrachtet, wenn ein Sprachsignal transformiert wird, wenn es von einem mobilen Endgerät (MT) A 340 zu MT B 380 gesandt wird. In diesem Beispiel verwendet das MT A einen Vektorsummenverbesserten linearen Prädiktions- (VSELP-) Vocoder in dem drahtlosen IS 54-Telefonie-Kommunikationsstandard. 7a beschreibt das Rahmenformat für IS 54. Das Signal wird in ein gemeinsames Format gemäß 7b umgewandelt, und an dem empfangenden Ende verwendet das MT B einen verbesserten Voll-Raten-Codierer (EFRC) in der IS 641-Norm. 7c zeigt das Rahmenformat für IS 641.
Gemäß den 3b und 5 wird für die Transformation in diesem Beispiel ein Sprachsignal in der IS 54-Norm durch einen VSELP-Vocoder, der sich in dem MT A 340 befindet, komprimiert (codiert) und über eine drahtlose Verbindungsstrecke (HF-Kanal A) zu der Basisstation A 350 gesandt, an der es in das gemeinsame Format durch den Pseudo-Decodierer 545 in dem Transcodierer 510 (in 5 gezeigt) in das gemeinsame Format transformiert wird. Die Datenrahmen des gemeinsamen Formates werden dann über das Netzwerk 360 der Telefongesellschaft an den Transcodierer 550 gesandt, an dem sie in komprimierte Sprache in der IS 641-Norm durch den Pseudo-Codierer 584 transformiert werden. Das komprimierte Signal wird über eine drahtlose Verbindungsstrecke (HF-Kanal B) an das MT 380 gesandt, wo es durch den EFRC-Vocoder des zweiten MT decodiert wird. Hörbare Sprache steht dann an dem MT 380 zur Verfügung.
Der Pseudo-Decodierer 544, der einen Datenrahmen der Sprache in dem IS 54-Formate gemäß 7a empfängt, wandelt ihn in der nachstehend beschriebenen Weise um, wie dies auch durch das Ablaufdiagramm nach 8 dargestellt ist.
Der Pseudo-Decodierer 544 führt eine Neuberechnung des 10-dimensionalen Vektors aus, der die LPC-Reflexions-Koeffizienten für den 20 ms-Datenrahmen darstellt, wobei sein eigener Quantisierer verwendet wird. Er verwendet dann den 10-dimensionalen Vektor zur Bestimmung der vier Sätze von interpolierten LPC-Koeffizienten-Vektoren für die vier Teilrahmen. Das Interpolationsverfahren ist das gleiche, wie es weiter oben beschrieben wurde. Dieser Teil des das gemeinsame Format aufweisendenen Datenrahmens ist bereit, und der Pseudo-Decodierer 544 speichert es für eine spätere Rückgewinnung. Der Pseudo-Decodierer 544 liest dann aus dem komprimierten Format die vier Verzögerungswerte (Klang-Verzögerung). Der Pseudo-Decodierer 544 speichert sie für eine zukünftige Einfügung in das gemeinsame Format. Der Pseudo-Decodierer 544 verwendet dann die Codebuch-Information, die Verstärkungs-Faktoren und die Klang-Verzögerungen für die vier Teilrahmen und die Rahmenenergie für den Rahmen, um ein synthetisches Anregungs-Signal (4 mal 40 Abtastproben) für das gemeinsame Format zu schaffen. Schließlich wird der Datenrahmen des gemeinsamen Formates durch Verketten des Anregungs-Signals und der gespeicherten LPC-Koeffizienten und Klang-Verzögerungen aufgebaut. Dieser Datenrahmen wird an den Pseudo-Codierer 584 der nächsten Basisstation gesandt. Es sei bemerkt, dass in 7b Vorkehrungen getroffen sind, Bits an Information in dem das gemeinsame Format aufweisenden Rahmen für die Energie- und Klang-Vorhersage-Verstärkungs-Information zu reservieren. Diese Information wurde in diesem speziellen Beispiel nicht berechnet.
Wie dies in 9 gezeigt ist, empfängt der Pseudo-Codierer 584 den das gemeinsame Format aufweisenden Sprach-Datenrahmen und muss es nunmehr auf das komprimierte IS 641-Sprachformat umwandeln, damit der EFRC am MT B ihn richtig decodieren kann. Der Pseudo-Codierer 584 liest die LPC-Koeffizienten für die vier Teilrahmen und verwirft die Koeffizienten für die ersten drei Teilrahmen, wobei lediglich die Koeffizienten des vierten Teilrahmens beibehalten werden. Es sei bemerkt, dass dies der LPC-Reflexions-Koeffizienten-Vektor ist, der für den gesamten Rahmen berechnet wurde. Die ersten drei Vektoren für die Transformation in diesem speziellen Beispiel sind nicht erforderlich, weil der EFRC-Vocoder am MT B die ersten drei Teilrahmen-Vektoren entsprechend dem IS-641-Interpolationsschema interpoliert. Alle vier Vektoren könnten jedoch für Transformationen verwendet werden, die andere Arten von Vocodern beinhalten.
An diesem Punkt führt der Pseudo-Codierer 584 eine Umquantifizierung der LPC-Reflektions-Koeffizienten des vierten Teilrahmens unter Verwendung seines eigenen Quantisierers aus. Bevor der Pseudo-Codierer die zehn LPC-Reflexions-Koeffizienten an seinen Quantisierer liefert, muss er sie zunächst in LP- (lineare Prädiktions-) Koeffizienten, dann in Leitungsspektrum-Paar- (LSP-) Koeffizienten und schließlich in Leitungs-Spektralfrequenzen (LSF-Vektor) umwandeln. Der LSF-Vektor wird dann quantisiert und in einen quantisierten LSP-Vektor umgewandelt. Dieser quantisierte LSF-Vektor ist Teil des IS 641-Formates und wird so gespeichert wie er ist. Dann transformiert der Pseudo-Codierer 584 den quantisierten LSP-Vektor in quantisierte LP-Koeffizienten und interpoliert die LP-Koeffizienten für die ersten drei Teilrahmen. Diese Satz von LP-Koeffizienten-Vektoren wird in dem nächsten Schritt verwendet.
Der Pseudo-Codierer 584 verwendet das das gemeinsame Format ausweisende Anregungs-Signal und leitet jeden der vier 40 Abtastproben umfassenden Teilrahmen durch ein Synthesefilter unter Verwendung der quantisierten und interpolierten LP-Koeffizienten als Anzapfungs-Koeffizienten, um das Sprachsignal wieder herzustellen. Aus dem Sprachsignal berechnet der Pseudo-Codierer 584 (in der gleichen Weise wie dies ein regulärer EFRC-Codierer tun würde) die Klangverzögerungs-, Verstärkungs- und Anregungswerte (algebraischer Code für das MT B-Codebuch) unter Verwendung der vorher berechneten 10 LSP-Koeffizienten. Schließlich wird der das komprimierte IS-641-Sprachformat aufweisende Rahmen unter Verwendung der quantisierten Klangverzögerungs-, Verstärkungs- und Anregungswerte und des gespeicherten LSP-Vektors aufgebaut. Dieser Sprach-Datenrahmen wird an den EFRC-Decodierer in dem MT B gesandt, an dem es in ein Sprachsignal umgewandelt wird, wie dies normalerweise der Fall sein würde.
Es sei bemerkt, dass die Klang-Verzögerungs-Information aus dem gemeinsamen Format bei diesem Beispiel nicht verwendet wird, jedoch in anderen Umwandlungen verwendet werden kann. Stattdessen wurde die Klang-Verzögerungs-Information aus dem erzeugten Sprachsignal unter Verwendung bekannter Algorithmen berechnet.
Zusammenfassend wandelt der Pseudo-Decodierer 534 das ankommende komprimierte Sprachsignal in ein gemeinsames Format um, das einen Koeffizienten-Teil und einen Anregungs-Teil hat. Dieses gemeinsame Format wird dann von dem Pseudo-Codierer verwendet, um die komprimierte Sprache erneut zu schaffen, jedoch in einem Format, das von dem Format der komprimierten Sprache abweicht, die in den Pseudo-Decodierer 544 eintritt. Im einzelnen baut der Pseudo-Codierer 584 aus dem Koeffizienten-Teil in dem das gemeinsame Format aufweisenden Signal die Koeffizienten des komprimierten Sprachsignals auf, das an den Pseudo-Codierer 584 abgegeben werden soll. Auf der Grundlage des das gemeinsame Format aufweisenden Signals wird das Sprachsignal erneut geschaffen und dazu verwendet, irgendeine Anregungs- und andere Information abzuleiten, die in Verbindung mit den für das komprimierte Sprachsignal berechneten Koeffizienten zur Darstellung der Sprachinformation verwendet wird.
Es sei bemerkt, dass der Pseudo-Codierer und der Pseudo-Decodierer des Transcodierers 510 entsprechend der Art von Vocoder ausgelegt sind, mit denen sie zusammenwirken. Das gemeinsame Element besteht darin, dass jeder Pseudo-Decodierer ein komprimiertes Sprachsignal annimmt und ein das gemeinsame Format aufweisendes Signal abgibt, das seinerseits von dem Pseudo-Codierer in ein anderes komprimiertes Sprachsignal-Format transformiert wird. Dieses Merkmal ermöglicht es dem System, sehr flexibel zu sein, insbesondere wenn neue Vocoder eingeführt werden. Es reicht aus, einen Pseudo-Codierer und einen Pseudo-Decodierer zu konstruieren, die die Transformation zwischen dem neuen Vocoder-Signal-Format und dem gemeinsamen Format und umgekehrt bereitstellen. Es besteht keine Notwendigkeit, die vorhandenen Transcodierer in irgendeiner Weise zu ändern, weil das von dem System verwendete gemeinsame Format das gleiche bleibt.
Von einem Konstruktions-Gesichtspunkt aus gesehen kann die in 10 gezeigte Vorrichtung zur gerätemäßigen Ausgestaltung der Funktion eines Pseudo-Codierers 584 verwendet werden, dessen Betriebsweise weiter oben anhand der 9 ausführlich erläutert wurde. Die Vorrichtung umfasst eine Eingangssignal-Leitung 910, eine Signal-Ausgangsleitung 912, einen Prozessor 914 und einen Speicher 916. Der Speicher 916 wird zum Speichern von Befehlen für die Betriebsweise des Prozessors 914 und außerdem zum Speichern der Daten verwendet, die von dem Prozessor 914 bei der Ausführung dieser Befehle verwendet werden. Ein Bus 918 ist für den Austausch von Informationen zwischen dem Speicher 916 und dem Prozessor 914 vorgesehen.
Die in dem Speicher 916 gespeicherten Befehle ermöglichen es der Vorrichtung, entsprechend dem funktionellen Blockschaltbild zu arbeiten, das in 11 gezeigt ist. Die Vorrichtung schließt Koeffizienten-Segment-Wandler ein, der, wie dies in Verbindung mit 9 beschrieben wurde, über bekannte mathematische Manipulationen das Koeffizienten-Segment von dem ein gemeinsames Format aufweisenden Rahmen in das Koeffizienten-Segment des komprimierten Audiosignal-Rahmen, in diesem Beispiel in das IS-641-Rahmen-Format umwandelt. Die Vorrichtung schließt weiterhin ein Synthesefilter ein, das von dem Koeffizienten-Segment-Wandler quantisierte LPC-Koeffizienten für die vier Teilrahmen empfängt. Das Synthesefilter empfängt weiterhin das Anregungs-Signal von dem Anregungs-Segment des ein gemeinsames Format aufweisenden Rahmens, um das Audiosignal zu konstruieren. Dieses Signal wird dann in einem Analyse-für-Synthese-Prozess eingegeben, der das Anregungs-Segment für das IS-641-Rahmen-Format erzeugt, indem er als Anzapfungs-Koeffizienten den quantisierten LSP-Vektor verwendet, der von dem Koeffizienten-Segment-Wandler abgegeben wird.
12 zeigt das Blockschaltbild des Pseudo-Decodierers 544, der in 5 gezeigt ist. Die Vorrichtung schließt zwei Hauptfunktionsblöcke ein, nämlich einen Koeffizienten-Segment-Wandler, der das Koeffizienten-Segment von dem Datenrahmen in dem IS-54-Format empfängt und es in das Koeffizienten-Segment des das gemeinsame Format aufweisenden Datenrahmens umwandelt. Die Vorrichtung schließt weiterhin einen Anregungs-Segment-Wandler ein, der die Elemente des Anregungs-Segmentes von dem IS-54-Datenformat dazu verwendet, es in das Anregungs-Segments des das gemeinsame Format aufweisenden Datenrahmens umzuwandeln. Die Lösung bei dieser Konstruktion besteht darin, alle Segmente des Datenrahmens des komprimierten Audio-Signals zu behandeln, um den Datenrahmen mit dem gemeinsamen Format aufzubauen.
Bei der Konstruktion eines Transcodierers für eine bestimmte Anwendung kann der Pseudo-Codierer und der Pseudo-Decodierer unter Verwendung einer der in den 11 und 12 gezeigten Geräte aufgebaut werden. Die Wahl irgendeines dieser Systeme hängt von der speziellen durchzuführenden Format-Umsetzung ab. Wenn das Format des komprimierten Audiosignals (entweder der Quellen-Datenrahmen oder der Ziel-Datenrahmen) derart ist, dass das Koeffizienten-Segment und das Anregungs-Segment von dem Quellen-Datenrahmen unabhängig bearbeitet werden können, um die Übersetzung auf den Ziel-Datenrahmen auszuführen, so ist die in 12 gezeigte Vorrichtung wahrscheinlich am besten für die Operation geeignet. Andererseits sollte, wenn eine Rekonstruktion des Audiosignals besser geeignet ist, die in 11 gezeigte Vorrichtung verwendet werden.
Die Konstruktion der Codierer- und Umgehungsstufen jedes Transcodierers kann entsprechend Systemen aufgebaut werden, die derzeit dem Fachmann bekannt sind. Im einzelnen können der Codierer und der Decodierer entsprechend dem Blockschaltbild nach den 1 und 2 aufgebaut werden.

Claims

Vorrichtung zur Übertragung eines Datenrahmens von komprimierter Audio-Information zwischen nicht-kompatiblen Vocodern, wobei die Vorrichtung folgendes einschließt: einen ersten Transcoder (392), der einen ersten Eingang und einen ersten Ausgang einschließt, wobei der erste Transcoder (392) auf einen Rahmen von komprimierten Audio-Daten mit einem ersten Format anspricht, der seinem Eingang zugeführt wird, um an seinem Ausgang einen Rahmen von komprimierten Audio-Daten mit einem Zwischenformat zu erzeugen, wobei der Rahmen des ersten Formates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist, wobei der Rahmen des Zwischenformates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist; einen zweiten Transcoder (394), der einen zweiten Eingang und einen zweiten Ausgang aufweist, wobei der zweite Eingang mit dem ersten Ausgang verbunden ist, um den Rahmen von komprimierten Audio-Daten des Zwischenformates zu empfangen, wobei der zweite Transcoder (394) auf einen Rahmen von komprimierten Audio-Daten mit einem Zwischenformat anspricht, der dem zweiten Eingang zugeführt wird, um an dem zweiten Ausgang einen Rahmen von komprimierten Audio-Daten eines zweiten Formates zu erzeugen, wobei der Rahmen des zweiten Formates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist.
Vorrichtung nach Anspruch 1, bei dem der erste Transcoder (392) folgendes einschließt: erste Verarbeitungseinrichtungen, die mit dem ersten Eingang verbunden sind, um ein Koeffizienten-Segment eines Rahmens von komprimierten Audio-Daten des ersten Formates zu empfangen und an den ersten Ausgang das Koeffizienten-Segment des Rahmens der komprimierten Audio-Daten des Zwischenformates abzugeben, zweite Verarbeitungseinrichtungen, die mit dem ersten Eingang verbunden sind, um aus dem Datenrahmen von komprimierten Audio-Daten des ersten Formates das Anregungs-Segment des Datenrahmens der komprimierten Audio-Daten des Zwischenformates zu erzeugen.
Vorrichtung nach Anspruch 2, bei dem die Verarbeitungseinrichtung das Koeffizienten-Segment des Rahmens von komprimierten Audio-Daten des Zwischenformates abgibt, ohne wesentlichen Gebrauch von dem Anregungs-Segment in dem Datenrahmen von komprimierten Audio-Daten des ersten Formates zu machen.
Vorrichtung nach Anspruch 3, bei einer oder beide der ersten Verarbeitungseinrichtungen und der zweiten Verarbeitungseinrichtungen einen Quantisierer einschließen.
Vorrichtung nach Anspruch 3, bei der die zweiten Verarbeitungseinrichtung das Anregungs-Segment des Datenrahmens von komprimierten Audio-Daten des Zwischenformates berechnet, ohne wesentlichen Gebrauch von dem Koeffizienten-Segment des Datenrahmens von komprimierten Audio-Daten des ersten Formates zu machen.
Vorrichtung nach Anspruch 5, bei dem die zweite Verarbeitungseinrichtung ein Filter einschließt.
Vorrichtung nach Anspruch 6, bei dem das Filter einen ersten Eingang zum Empfang eines rekonstruierten Audiosignals und einen zweiten Eingang zum Empfang eines Koeffizienten-Segmentes des Datenrahmens von komprimierten Audio-Daten des Zwischenformates einschließt.
Vorrichtung nach Anspruch 1, bei der der zweite Transcoder (394) folgendes einschließt: dritte Verarbeitungseinrichtungen, die mit dem zweiten Eingang verbunden sind, um ein Koeffizienten-Segment des Rahmens von komprimierten Audio-Daten des Zwischenformates zu empfangen und um an dem zweiten Ausgang das Koeffizienten-Segment des Rahmens von komprimierten Audio-Daten des zweiten Formates abzugeben; vierte Verarbeitungseinrichtungen, die mit dem zweiten Eingang verbunden sind, um aus dem Datenrahmen der komprimierten Audio-Daten des Zwischenformates das Anregungs-Segment des Datenrahmens von komprimierten Audio-Daten des zweiten Formates zu erzeugen.
Vorrichtung nach Anspruch 8, bei der die dritte Verarbeitungseinrichtung das Koeffizienten-Segment des Rahmens von komprimierten Audio-Daten des zweiten Formates abgibt, ohne wesentlichen Gebrauch von dem Anregungs-Segment in dem Datenrahmen von komprimierten Audio-Daten des Zwischenformates zu machen.
Vorrichtung nach Anspruch 9, bei der eine oder beide der dritten und vierten Verarbeitungseinrichtungen einen Quantisierer einschließen.
Vorrichtung nach Anspruch 8, bei der die vierte Verarbeitungseinrichtung das Anregungs-Segment des Datenrahmens von komprimierten Audio-Daten des zweiten Formates berechnet, ohne wesentlichen Gebrauch von dem Koeffizienten-Segment des Datenrahmens der komprimierten Audio-Daten des Zwischenformates zu machen.
Vorrichtung nach Anspruch 8, bei dem die vierte Verarbeitungseinrichtung ein Filter einschließt.
Vorrichtung nach Anspruch 12, bei das Filter einen Eingang zum Empfang eines rekonstruierten Audio-Signals und einen Eingang zum Empfang eines Koeffizienten-Segmentes des Datenrahmens von komprimierten Audio-Daten des zweiten Formates einschließt.
Verfahren zur Übertragung eines Datenrahmens zwischen nicht-kompatiblen Vocodern, wobei der Datenrahmen Audio-Information in digitalisierter und komprimierter Form darstellt, wobei der Datenrahmen ein Koeffizienten-Segment und ein Anregungs-Segment einschließt, wobei der Datenrahmen ein erstes Format aufweist, wobei das Verfahren die folgenden Schritte umfasst: Verarbeiten des Datenrahmens in dem ersten Format an einem ersten Ort zur Erzeugung eines Datenrahmens eines Zwischenformates, wobei der Datenrahmen des Zwischenformates ein Koeffizienten-Segment und ein Anregungs-Segment einschließt; Senden des Datenrahmens eines Zwischenformates an einen zweiten Ort, der von dem ersten Ort entfernt liegt; Verarbeiten des Datenrahmens des Zwischenformates an dem zweiten Ort zur Erzeugung eines Datenrahmens des zweiten Formates, wobei der Datenrahmen des zweiten Formates ein Koeffizienten-Segment und ein Anregungs-Segment einschließt.
Verfahren nach Anspruch 14, das die folgenden Schritte umfasst: a. Verarbeiten des Koeffizienten-Segmentes des Datenrahmens in dem ersten Format an dem ersten Ort zur Erzeugung eines Koeffizienten-Segmentes des Datenrahmens in dem Zwischenformat; b. Verarbeiten des Datenrahmens in dem ersten Format an dem ersten Ort zur Erzeugung eines Anregungs-Segmentes eines Datenrahmens in dem Zwischenformat; c. Kombinieren des Koeffizienten-Segmentes eines Datenrahmens in einem Zwischenformat mit dem Anregungs-Segment des Datenrahmens in dem Zwischenformat, die in den Schritten a. bzw. b. erzeugt wurden, um einen Datenrahmen des Zwischenformates zu erzeugen, der die Audio-Information darstellt, die in dem Datenrahmen des ersten Formates enthalten ist.
Verfahren nach Anspruch 15, mit den folgenden Schritten: a. Verarbeiten des Koeffizienten-Segmentes des Datenrahmens in dem Zwischenformat an dem zweiten Ort zur Erzeugung eines Koeffizienten-Segmentes eines Datenrahmens in dem zweiten Format; b. Verarbeiten des Datenrahmens in dem Zwischenformat an dem zweiten Ort zur Erzeugung eines Anregungs-Segmentes eines Datenrahmens in dem zweiten Format; c. Kombinieren des Koeffizienten-Segmentes eines Datenrahmens in dem zweiten Format mit dem Anregungs-Segment eines Datenrahmens in dem zweiten Format, der in den Schritten a. bzw. b. erzeugt wurde, um einen Datenrahmen des zweiten Formates zu erzeugen, der die Audio-Information darstellt, die in dem Datenrahmen des ersten Formates und des Zwischenformates enthalten ist.