-
Gebiet der
Erfindung
-
Diese
Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Übertragung
digitalisierter Sprachsignale in einer Kommunikationsumgebung, die
von drahtloser Art sein kann. Insbesondere bezieht sie sich auf
ein Verfahren und eine Vorrichtung zur Verbesserung der Qualität eines
Audiosignals, das mit einer digitalen Signalverarbeitungstechnik
komprimiert oder codiert wurde, wenn das Signal von einem Endgerät zu einem
anderen Endgerät
eines Kommunikationsnetzwerkes übertragen
wird.
-
Hintergrund der Erfindung
-
In
den letzten Jahren hat die Telekommunikationsindustrie die Entwicklung
einer Vielzahl von digitalen Vocodern zur Erfüllung von Bandbreiten Anforderungen
von unterschiedlichen drahtgebundenen und drahtlosen Kommunikationssystemen
erlebt. Der Name „Vocoder" ruht auf der Tatsache,
dass seine Anwendungen für
die Codierung und Decodierung hauptsächlich von Sprachsignalen spezifisch
sind. Vocoder werden üblicherweise
in Mobiltelefonen und den Basisstationen des Kommunikationsnetzwerkes integriert.
Sie ergeben eine Sprachkompression eines digitalisierten Sprachsignals
sowie die umgekehrte Transformation. Typischerweise wird ein Sprachsignal
durch eine von vielen Quantisierungstechniken digitalisiert. Beispiel
dieser Techniken sind die Pulsamplituden-Modulation (PAM), die Pulscode-Modulation
(PCM) und die Delta-Modulation. Für die Zwecke dieser Beschreibung
beziehen wir uns auf PCM als das Eingangsformat für den Vocoder.
Somit schließt
ein Vocoder eine Codierstufe ein, die als Eingang ein digitalisiertes
Sprachsignal empfängt
und ein komprimiertes Signal abgibt, wobei ein mögliches Kompressionsverhältnis 8:1
ist. Hinsichtlich der Rücktransformation
ist der Vocoder mit einer Decodiererstufe versehen, die das komprimierte Sprachsignal
empfängt
und ein digitalisiertes Signal, wie zum Beispiel PCM-Abtastproben,
abgibt.
-
Der
Hauptvorteil der Kompression von Sprache besteht darin, dass hierdurch
eine geringere Menge der begrenzten verfügbaren Kanal-Bandbreite für die Übertragung
verwendet wird. Der Hauptnachteil ist ein Verlust an Sprachqualität.
-
Die
meisten modernen eine niedrige Bitrate aufweisenden Vocoder beruhen
auf dem linearen Prädiktions-
oder Vorhersage-Modell, das das Sprachsignal in einen Satz von linearen
Prädiktions-Koeffizienten,
ein Restsignal und verschiedene Parameter aufteilt. Im allgemeinen
kann die Sprache mit guter Qualität aus diesen Komponenten rekonstruiert
werden. Eine Beeinträchtigung
wird jedoch eingeführt,
wenn die Sprache mehrfachen Instanzen von Vocodern unterworfen wird.
-
Das
schnelle Wachstum in der Unterschiedlichkeit von Netzwerken und
der Anzahl von Benutzern derartiger Netzwerke vergrößert die
Anzahl der Instanzen, in denen zwei Vocoder in Tandem angeordnet
sind, um eine einzige Verbindung mit Diensten zu versorgen. In einem
derartigen Fall wird ein erster Codierer zum Komprimieren der Sprache
des ersten mobilen Nutzers verwendet. Die komprimierte Sprache wird
an eine die örtliche
Mobilstation mit Diensten versorgende Basisstation gesandt, an der
sie dekomprimiert (auf Abtastproben im PCM-Format umgewandelt) wird.
Die resultierenden PCM-Abtastproben erreichen eine das zweite mobile
Endgerät
mit Diensten versorgende Basisstation über die digitale Fernleitung
des Telefonnetzwerkes, wo ein zweiter Codierer zum Komprimieren
des Eingangssignals zur Übertragung
an das zweite mobile Endgerät
verwendet wird. Ein Sprachdecodierer an dem zweiten mobilen Endgerät führt eine
Dekomprimierung der empfangenen komprimierten Sprachdaten zur Synthetisierung
des ursprünglichen
Sprachsignals von dem ersten mobilen Endgerät aus. Ein spezielles Beispiel
eines derartigen Falls kann einen Anruf beinhalten, der von einem
drahtlosen Endgerät,
das gemäß dem nordamerikanischen
Zeitvielfach-Zugriffs- (TDMA-) System arbeitet, zu einem Mobiltelefon
nach dem europäischen
genormten globalen System für Mobilkommunikation
(GSM) gemacht wird.
-
In
einem Versuch, den Zustand einer Tandem-Anordnung von Vocodern zu
beseitigen, wurde in der Vergangenheit ein Verfahren vorgeschlagen, das
als „Umgehung" bezeichnet wird.
Die grundlegende Idee hinter dieser Lösung ist die Bereitstellung eines
digitalen Signalprozessors, der einen Vocoder und einen Umgehungsmechanismus
einschließt,
der aufgerufen wird, wenn das ankommende Signal in einem Format
vorliegt, das mit dem Vocoder kompatibel ist. Im Gebrauch stellt
der digitale Signalprozessor, der der ersten Basisstation zugeordnet
ist, die das Hochfrequenzsignal von einem ersten mobilen Endgerät empfängt über eine
Signalisierung und Steuerung fest, dass ein identischer digitaler
Signalprozessor an der zweiten Basisstation vorhanden ist, der dem
mobilen Endgerät
zugeordnet ist, an das der Anruf gerichtet ist. Der der ersten Basisstation
zugeordnete digitale Signalprozessor ruft anstelle der Umwandlung
der komprimierten Sprachsignale in PCM-Abtastproben den Umgehungsmechanismus auf
und gibt die komprimierte Sprache an das Transportnetzwerk ab. Das
komprimierte Sprachsignal wird bei der Ankunft an dem digitalen
Signalprozessor, der der zweiten Basisstation zugeordnet ist, derart
gelenkt, dass der örtliche
Vocoder umgangen wird. Das Dekomprimieren des Signals erfolgt lediglich
an dem zweiten mobilen Endgerät.
-
Diese
Lösung
ist jedoch lediglich für
identische Vocoder gültig.
Bei der schnellen Entwicklung von Netzwerken steigt die Vielzahl
unterschiedlicher Vocoder sehr schnell an. Die Umgehungslösung ist daher
lediglich für
einen kleinen Teil von Verbindungen brauchbar, die eine Tandem-Vocoder-Anordnung beinhalten.
-
Die
EP 0 138 073 beschreibt
einen Konverter für
eine Schnittstellenanpassung zwischen LPC- und Kanal-Vocodern für die Übertragung
von digitalisierten Sprachsignalen über digitale Schmalband-Kommunikationssysteme.
Der Wandler schließt
zwei Teil-Schnittstellen ein, die parallel zueinander angeordnet
sind. Eine der Teil-Schnittstellen wandelt LPC-codierte und Sprachsignal-Abschnitte,
die auszusenden sind, in eine Codierung für den Kanal-Vocoder um. Die
andere Teil-Schnittstelle
wandelt die Codierung für
den Kanal-Vocoder in eine Codierung in dem LPC-Verfahren um. Dieses
Verfahren verwendet Codebücher
zur Umsetzung der quantisierten LPC-codierten Parameter auf entsprechende
Kanal-Vocoder-Parameter
und umgekehrt.
-
Somit
besteht ein Bedarf in der Industrie für Einrichtungen, die in der
Lage sind, die Sprachqualität
während
Verbindungen zu verbessern, die inkompatible, in Tandem angeordnete
Vocoder einschließen
können.
-
Ziele und Angabe der Erfindung
-
Ein
Ziel der Erfindung besteht in der Schaffung einer Vorrichtung zur
Verarbeitung von Audiosignalen, die die Signalbeeinträchtigung
verringern kann, die auftritt, wenn das Signal zwischen zwei Vocodern
in einem Kommunikationsnetzwerk ausgetauscht wird.
-
Ein
weiteres Ziel der Erfindung besteht in der Schaffung eines Verfahrens
zur Verringerung einer Audiosignal-Beeinträchtigung, wenn das Signal von einem
Vocoder zu einem anderen Vocoder in einem Kommunikationsnetzwerk übertragen
wird.
-
Gemäß der Erfindung
wird eine Vorrichtung zur Kommunikation eines Daten-Rahmens von komprimierter
Audio-Information zwischen nicht-kompatiblen Vocodern geschaffen,
wobei die Vorrichtung folgendes einschließt:
einen ersten Transcodierer,
der einen ersten Eingang und einen ersten Ausgang einschließt, wobei
der erste Transcodierer auf einen Rahmen von komprimierten Audio-Daten
mit einem ersten Format anspricht, die seinem Eingang zugeführt werden,
um an seinem Ausgang einen Rahmen von komprimierten Audio-Daten
mit einem Zwischenformat zu erzeugen, wobei der Rahmen des ersten
Formates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist,
wobei der Rahmen des Zwischenformates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist;
einen
zweiten Transcodierer, der einen zweiten Eingang und einen zweiten
Ausgang aufweist, wobei der zweite Eingang mit dem ersten Ausgang
verbunden ist, um den Rahmen von komprimierten Audio-Daten des Zwischenformates
zu empfangenen, wobei der zweite Transcodierer auf einem Rahmen
von komprimierten Audio-Daten mit einem Zwischenformat anspricht,
der dem zweiten Eingang zugeführt
wird, um an dem zweiten Ausgang einen Rahmen von komprimierten Audio-Daten
eines zweiten Formates zu erzeugen, wobei der Rahmen des zweiten
Formates ein Koeffizienten-Segment und ein Anregungs-Segment aufweist.
-
Dieses
System ist besonders vorteilhaft, wenn das Telefon-Netzwerk mit
einer Vielfalt von nicht-identischen Vocodern versehen ist. Um den Austausch
von Sprachsignalen von einem Vocoder zu einem anderen Vocoder unabhängig davon
zu ermöglichen,
ob sie identisch sind oder nicht, reicht es aus, das komprimierte
von dem örtlichen
Vocoder abgegebene Audio-Signal auf das gemeinsame Format umzuwandeln,
das von dem Pseudo-Codierer des entfernt angeordneten Vocoders verarbeitet
werden kann. Das gemeinsame Format kann als ein komprimiertes Audio-Signal
einer Zwischen-Darstellung definiert werden, das zur Übertragung
wichtiger parametrischer Information bestimmt ist, die von dem Pseudo-Decodierer
des örtlichen
Vocoders direkt an den Pseudo-Codierer des entfernt angeordneten
Vocoders ausgesandt wird. Diese parametrische Information schließt ein Koeffizienten-Segment
und Parameter ein, die ein Anregungs-Segment des zu übertragenden
Sprach-Signals beschreiben. Ein wichtiges Element der gemeinsamen
Format-Darstellung besteht darin, dass dieses die grundlegende Rahmenstruktur
des Audiosignals beibehält,
wie es von einem der Vocoder in dem Netzwerk codiert wird, der mit
einem anderen Vocoder während
eines vorgegebenen Anrufs verbunden sein kann. Im einzelnen besteht
der Rahmen des gemeinsamen Formates aus einem Koeffizienten-Segment
und einem Anregungs-Segment,
die weiter unten definiert werden. Es ist jedoch wichtig, festzustellen,
dass kein Versuch gemacht wurde, das Audiosignal auf PCM-Abtastproben
oder auf eine equivalente Darstellung als gemeinsame Format-Struktur
zu reduzieren. Dies ist nicht wünschenswert,
weil die Transformation des komprimierte Signals auf PCM und die
nachfolgende Umwandlung der PCM-Abtastproben auf eine komprimierte
Form erhebliche Beeinträchtigungen
der Signalqualität
einführt,
die soweit wie möglich
vermieden werden sollten. Die Erfinder der vorliegenden Erfindung
haben festgestellt, dass durch Ausbildung einer gemeinsamen Format-Konfiguration,
die die grundlegende Struktur von Audiosignalen beibehält, wie
sie von einem Vocoder codiert werden, diese Beeinträchtigungen
wesentlich verringert werden.
-
In
dieser Beschreibung soll der Ausdruck „Koeffizienten-Segment" irgendeinen Satz
von Koeffizienten bezeichnen, die in eindeutiger Weise eine Filterfunktion
definieren, die den Sprachtrakt des Menschen modelliert. Sie bezieht
sich weiterhin auf irgendeine Art von Informations-Format, von dem
die Koeffizienten indirekt abgeleitet werden können. In üblichen Vocodern sind verschiedene
Arten von Koeffizienten bekannt, unter Einschluss von Reflexions-Koeffizienten,
Arkus-Sinus-Werte
der Reflexions-Koeffizienten, Leitungsspektrum-Paaren, logarithmischen
Flächenverhältnissen,
um nur einige zu nennen. Diese unterschiedlichen Arten von Koeffizienten
stehen üblicherweise
durch mathematische Transformationen zueinander in Beziehung, und
sie haben unterschiedliche Eigenschaften, die sie für unterschiedliche
Anwendungen geeignet machen. Somit soll der Ausdruck „Koeffizienten-Segment" irgendeine dieser
Arten von Koeffizienten umfassen.
-
Das „Anregungs-Segment" kann als Information
definiert werden, die mit dem Koeffizienten-Segment zu kombinieren
ist, um ein vollständige
Darstellung des Audio-Signals zu Schaffen. Die Bezeichnung bezieht
sich auch auf irgendeine Art von Informations-Format, von dem die
Anregung indirekt abgeleitet werden kann. Das Anregungs-Segment
ergänzt
das Koeffizienten-Segment bei der Synthetisierung des Signals zur
Gewinnung eines Signals in einem nicht komprimierten Format, wie
zum Beispiel in PCM-Abtastproben-Darstellungen. Ein derartiges Anregungs-Segment
kann parametrische Information einschließen, die die Periodizität des Sprachsignals
beschreibt, ein Anregungs-Signal, wie es durch den Pseudo-Decodierer
berechnet wird, eine Sprache-Rahmenbildungs-Steuerinformation zur Sicherstellung
einer synchronen Rahmenbildung in dem Pseudo-Codierer, die dem entfernt
angeordneten Vocoder zugeordnet ist, Klangperioden, Klangverzögerungen,
Verstärkungen
und relative Verstärkungen einschließen, um
einige zu nennen. Das Koeffizienten-Segment und das Anregungs-Segment
können in
unterschiedlicher Weise in dem Signal dargestellt werden, das über das
Netzwerk der Telefongesellschaft übertragen wird. Eine Möglichkeit
besteht darin, die Information als solche zu übertragen, das heißt mit anderen
Worten, eine Folge von Bits, die die Werte der zu übertragenden
Parameter darstellt. Eine weitere Möglichkeit besteht in der Übertragung einer
Liste von Indizes, die als solche nicht die Parameter des ein gemeinsames
Format aufweisenden Signals übertragen,
sondern einfach Einträge
in einer Datenbank oder einem Codebuch bilden, das es dem Pseudo-Codierer
ermöglicht,
in dieser Datenbank nachzuschlagen und die betreffende Information
auf der Grundlage der verschiedenen empfangenen Indizes abzuleiten,
um das ein gemeinsames Format aufweisende Signal zu konstruieren.
-
Der
Ausdruck „erstes
Format", „zweites
Format" oder „drittes
Format" bezeichnet
bei seiner Verwendung zur Beschreibung des Audiosignals in komprimierter
Form, entweder in der Darstellung des gemeinsamen Formates oder
in dem Format eines vorgegebenen Vocoders, Signale, die allgemein
gesprochen nicht kompatibel sind, obwohl sie eine gemeinsame grundlegende
Struktur gemeinsam haben, mit anderen Worten, sie sind in ein Koeffizienten-Segment
und ein Anregungs-Segment
unterteilt. Somit ist ein Vocoder, der in der Lage ist, ein Signal
unter dem ersten Format umzuwandeln, allgemein gesprochen nicht
in der Lage, ein Signal zu verarbeiten, das unter irgendeinem anderen
Format als dem ersten Format ausgedrückt ist.
-
Bei
einer bevorzugten Ausführungsform
wird die Transformation des Audiosignals in der komprimierten Form
auf das gemeinsame Format in zwei Schritten bewirkt. Der erste Schritt
besteht in der Verarbeitung des Koeffizienten-Segmentes in den komprimierten
Audiosignal-Datenrahmen zur Erzeugung des Koeffizienten-Segmentes des gemeinsamen Formates.
Allgemein gesprochen wird die Transformation von einer Art von Koeffizienten
auf eine andere durch gut bekannte mathematische Algorithmen bewirkt.
In Abhängigkeit
von der Art des Vocoders, der dem Pseudo-Decodierer zugeordnet ist,
kann diese Transformation einfach durch Umquantisieren der Koeffizienten
von dem komprimierten Audiosignal-Daten-Rahmen in neue Werte bewirkt werden, die
die Koeffizienten des ein gemeinsames Format aufweisenden Datenrahmens
bilden. In dem nächsten
Schritt wird das Anregungs-Segment des das gemeinsame Format aufweisenden
Daten-Rahmens durch Verarbeiten der Rahmenenergie, der Verstärkungswerte,
der Verzögerungswerte
und der Codebuch-Information (wie dies der Decodierer-Teil eines Vocoders
normalerweise machen würde)
und durch Quantisieren des Anregungs-Signals vor der Bildung eines
das gemeinsame Format aufweisenden Daten-Rahmens gewonnen.
-
Die
Transformation von dem das gemeinsame Format aufweisenden Daten-Rahmen auf ein komprimiertes
Audiosignal durch einen Pseudo-Codierer wird in einer ähnlichen
Weise bewirkt, wie sie weiter oben beschrieben wurde. Das Koeffizienten-Segment
des das gemeinsame Format aufweisenden Daten-Rahmens wird zunächst verarbeitet, um das Koeffizienten-Segment
des komprimierten Audiosignal-Daten-Rahmens zu erzeugen. Das Anregungs-Segment
des komprimierten Audiosignal-Daten-Rahmens wird dadurch erzielt,
dass zunächst
ein Sprachsignal durch Hindurchleiten des das gemeinsame Format
aufweisenden Anregungs-Segments durch ein Filter gewonnen wird,
für das
die Koeffizienten ebenfalls aus dem gemeinsamen Format gewonnen
wurden. Dieses Signal wird dem Codierer-Teil des Vocoders zugeführt, wie
dies üblicherweise
der Fall sein würde.
-
Eine
weitere Möglichkeit
zur Gewinnung des Anregungs-Segmentes in einem Format von einem Daten-Rahmen
in einem anderen Format ohne Synthetisieren eines Audiosignals und
die nachfolgende Bewirkung einer Analyse besteht in einer Neuberechnung
des Anregungs-Segmentes ausschließlich von Daten, die in dem
Anregungs-Segment in dem Quellen-Daten-Rahmen verfügbar sind.
Die Wahl dieses Verfahrens oder des vorstehend beschriebenen Verfahrens
hängt von
der beabsichtigten Anwendung oder der Art der Umwandlung ab, die
erforderlich ist. Im einzelnen können
bestimmte Formate von komprimierten Audiosignalen sehr einfach auf
den gemeinsamen Rahmen durch Neuberechnung der Segmente jedes Rahmens
unabhängig
voneinander umgewandelt werden. In anderen Fällen ist jedoch praktischer,
eine Analyse-durch-Synthese-Lösung
zur Gewinnung des Anregungs-Segmentes zu verwenden.
-
Die
Erfindung ergibt weiterhin ein Verfahren zur Übertragung eines Daten-Rahmens zwischen nicht-kompatiblen
Vocodern, wobei der Daten-Rahmen Audio-Informationen in digitalisierter und
komprimierter Form darstellt, wobei der Daten-Rahmen ein Koeffizienten-Segment und
ein Anregungs-Segment einschließt,
wobei der Daten-Rahmen in einem ersten Format vorliegt, wobei das
Verfahren die folgenden Schritte umfasst:
Verarbeiten des Daten-Rahmens
in dem ersten Format an einem ersten Ort zur Erzeugung eines Daten-Rahmens
eines Zwischenformates, wobei der Daten-Rahmen des Zwischenformates
ein Koeffizienten-Segment und ein Anregungs-Segment einschließt;
Senden
des Daten-Rahmens eines Zwischenformates an einen zweiten Ort, der
von dem ersten Ort entfernt liegt;
Verarbeiten des Daten-Rahmens
des Zwischenformates an dem zweiten Ort zur Erzeugung eines Daten-Rahmens
des zweiten Formates, wobei der Daten-Rahmen des zweiten Formates einen Koeffizienten-Segment
und ein Anregungs-Segment
einschließt.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist ein Blockschaltbild der Codierer-Stufe
eines CELP-Vocoders;
-
2 ist
ein Blockschaltbild der Decodierer-Stufe eines CELP-Vocoders;
-
3a ist
eine schematische Darstellung einer Kommunikations- Verbindungsstrecke
zwischen einem drahtlosen mobilen Endgerät und einem festen (drahtgebundenen)
Endgerät;
-
3b ist
eine schematische Darstellung einer Kommunikations-Verbindungsstrecke
zwischen zwei drahtlosen mobilen Endgeräten mit einer Ausführungsform
dieser Erfindung, die zwei Transcodierer einschließt;
-
3c ist eine schematische Darstellung einer
Kommunikations-Verbindungsstrecke
zwischen zwei drahtlosen mobilen Endgeräten mit einer Ausführungsform
der Erfindung, die einen Kreuz-Transcodierungs-Knoten einschließt;
-
4 ist
ein Blockschaltbild eines Systems, das gemäß der vorliegenden Erfindung
aufgebaut ist, um ein komprimiertes Sprachsignal von einem Format
in ein anderes über
ein gemeinsames Format ohne die Notwendigkeit einer Dekomprimierung
des Signals auf eine Digitalisierungstechnik vom PCM-Typ umzusetzen;
-
5 ist
ein ausführlicheres
Blockschaltbild des in 4 gezeigten Systems;
-
6 ist
ein Blockschaltbild eines Kreuz-Transcodierungs-Knotens, der eine
Variante des in 5 gezeigten Systems bildet;
-
7a zeigt
einen Daten-Rahmen in einem IS 54-Format;
-
7b zeigt
einen Daten-Rahmen des gemeinsamen Formates, der von dem in 5 gezeigten
Transcodierer oder dem in 6 gezeigten Transcodierer
erzeugt wird;
-
7c zeigt
einen Daten-Rahmen in dem IS 641-Format;
-
8 ist
ein Ablaufdiagramm der Operation zur Umwandlung eines komprimierten
Sprach-Daten-Rahmens in dem IS 54-Format auf das gemeinsame Format;
-
9 ist
ein Ablaufdiagramm der Operation zur Umwandlung eines Daten-Rahmens
in dem gemeinsamen Format auf das komprimierte Sprachformat IS 641;
-
10 ist
ein Blockschaltbild einer Vorrichtung zur gerätemäßigen Ausgestaltung der Funktionalität eines
Pseudo-Codierers der in 5 gezeigten Art;
-
11 ist
ein funktionelles Blockschaltbild der in 10 gezeigten
Vorrichtung; und
-
12 ist
ein funktionales Blockschaltbild einer Variante der in 10 gezeigten
Vorrichtung.
-
Beschreibung
einer bevorzugten Ausführungsform
-
Es
folgt eine Beschreibung der linearen prädiktiven Codierungs- (LPC-)
Vocoder-Technologie, die
derzeit im drahtlosen Telekommunikationen verwendet wird. Eine Anwendung
von speziellem Interesse ist die drahtlose Übertragung eines Signals zwischen
einem mobilen Endgerät
und einer ortsfesten Basisstation. Eine weitere Anwendung ist die Übertragung
von Sprache über
das Internet-Kommunikationsnetzwerk,
bei dem unterschiedliche Vocoder in getrennten Teilen des drahtgebundenen
Netzwerkes verwendet werden können.
-
In
Kommunikationsanwendungen, in denen die Kanalbandbreite ein wichtiger
Gesichtspunkt ist, ist es wesentlich, den kleinstmöglichen
Teil eines Übertragungskanals
zu verwenden. Eine übliche
Lösung
besteht in der Quantisierung und Komprimierung des von einem Benutzer
geäußerten Sprachsignals,
bevor es übertragen
wird.
-
Typischerweise
wird das Sprachsignal zunächst
mit Hilfe einer von vielen Quantisierungstechniken digitalisiert.
Beispiele dieser Techniken sind die Pulsamplituden-Modulation (PAM),
die Pulscode-Modulation (PCM) und die Delta-Modulation, wobei PCM wahrscheinlich
am populärsten
ist. Grundsätzlich
werden bei PCM Abtastproben eines Analog-Signals mit einer festgelegten
Rate (8 kHz ist üblich) gewonnen
und in diskrete Werte zur Darstellung in digitalem Format quantisiert.
-
Codecs,
die eine Codierungs- und eine Decodierungs-Stufe einschließen, werden
dann zur Komprimierung (und Dekomprimierung) der digitalen Signale
an der Quelle bzw. dem Empfangspunkt verwendet, um die Verwendung
der Übertragungskanäle zu optimieren.
Codecs, die speziell für
Sprachsignale verwendet werden, werden üblicherweise als „Vocoder" (für Sprach-Codierer)
bezeichnet. Durch Codieren lediglich der erforderlichen Charakteristiken
eines Sprachsignals müssen
weniger Bits übertragen
werden, als dies zur Reproduktion der ursprünglichen Schwingungsform in
einer Weise erforderlich ist, die die Sprachqualität nicht
wesentlich beeinträchtigt.
Wenn weniger Bits erforderlich sind, kann eine Übertragung mit niedrigerer
Bit-Rate erzielt werden.
-
Derzeit
sind die meisten eine niedrigere Bit-Rate aufweisenden Vocoder von
der linearen prädiktiven
Codierungs- (LPC-) Familie, die wesentliche Sprachmerkmale aus einer
Schwingungsform in Zeitbereich extrahiert. Vocoder haben zwei Hauptkomponenten:
einen Codierer und einen Decodierer. Der Codierer-Teil verarbeitet
das digitalisierte Sprachsignal, um es zu komprimieren, während der
Decodierer-Teil die komprimierte Sprache in ein digitalisiertes Audio-Signal
expandiert.
-
Ein
Vocoder vom LPC-Typ verwendet eine bewertete Summe der vergangenen
p Abastproben der Sprache (s
n-k) zur Abschätzung der
derzeitigen Abtastprobe (s
n). Die Zahl p
bestimmt die Ordnung des Modells. Je höher die Ordnung ist, desto
besser ist die Sprachqualität.
Typischerweise reichen Modell-Ordnungen von 10 bis 15. Hieraus folgt,
dass eine Gleichung für
eine Sprach-Abtastprobe wie folgt geschrieben werden kann:
worin a
k ein
Koeffizienten ist, der den Beitrag der letzten s
n-k-Abtastprobe
bestimmt, und e
n das Fehlersignal für die derzeitige
Abtastprobe ist.
-
Unter
Verwendung der z-Transformation von s
n und
e
n und unter Definition eines Prädiktionsfilters erhalten
wir:
s(z) = e(z)1A(z) worin
-
Das
Filter 1 / A(z) hat nur Pole und wird daher als ein Allpol-Filter bezeichnet.
-
1 ist ein Blockschaltbild des Codierer-Teils
eines generischen Modells für
einen CELP-Vocoder. Wie aus dieser Figur zu erkennen ist, ist der
Eingang an den Sprachtrakt-Analyseblock 100 des Codierer-Teils
durch PCM-Abtastproben gebildet, und der Ausgang besteht aus einem
LPC-Filter-Koeffizienten-Segment und einem Anregungs-Segment, das
aus mehreren Parametern besteht, die das Prädiktions-Fehlersignal darstellen (das
auch als Rest bezeichnet wird). Der Ausgang wird an einen Telekommunikationskanal
weitergeleitet.
-
Die
Anzahl der LPC-Filter-Koeffizienten in den Koeffizienten-Segment
wird durch die Ordnung p des Modells bestimmt. Beispiele der Anregungs-Segment-Parameter sind wie
folgt. Art der Anregung (stimmhaft oder nicht stimmhaft), Klangperiode
(für die
stimmhafte Anregung), Verstärkungsfaktoren, Energie,
Klang, Prädiktionsgewinn,
und so weiter. Code-angeregte lineare Prädiktions-(CELP-) Vocoder sind
die am stärksten übliche Art
von Vocodern, die derzeit in der Telefonie verwendet werden. Anstelle
des Sendens der Anregungs-Parameter senden CELP-Vocoder Index-Information,
die auf einen Satz von Vektoren in einem adaptiven und stochastischen
Code-Buch zeigt. Das heißt,
für jedes
Sprachsignal durchsucht der Codierer sein Code-Buch für dasjenige,
das die beste wahrnehmbare Übereinstimmung
mit dem Klang ergibt, wenn es als eine Anregung für das LPC-Synthesefilter
verwendet wird.
-
Ein
diese Information einschließender Sprach-Rahmen
wird alle T Sekunden neu berechnet. Ein üblicher Wert für T ist
20 ms. Ein komprimierter 20 ms-Sprach-Rahmen stellt 160 PCM-Abtastproben dar,
die bei 8 kHz gewonnen werden.
-
2 ist
ein Blockschaltbild des Decodierer-Teils eines generischen Modells
für einen CELP-Vocoder.
Der komprimierte Sprach-Rahmen wird von dem Telekommunikationskanal 210 empfangen
und einem LPC-Synthesefilter 220 zugeführt. Das LPC-Synthesefilter 220 verwendet
das LPC-Filter-Koeffizienten-Segment
und das Anregungs-Segment zur Erzeugung und Ausgabe eines Sprachsignals, üblicherweise
in einer PCM-Abtastproben-Form.
-
Eine
als Interpolation bezeichnete Technik wird als eine Verbesserung
von Vocodern verwendet. Sie besteht aus der Unterteilung der 20 ms-Sprach-Rahmen
in Teil-Rahmen von 5 ms und die Interpolation ihrer Prädiktor-Koeffizienten.
Diese Techniken sind nützlich,
um unerwünschte „Knack"- oder „Klick"-Geräusche in
dem erzeugten Sprachsignal zu vermeiden, die üblicherweise das Ergebnis von
schnellen Änderungen
in den Prädiktor-Koeffizienten
von einem Signal-Rahmen zu dem anderen sind. Im einzelnen wird jeder
Signal-Rahmen in vier Teil-Rahmen unterteilt, die als Teil-Rahmen
(1), Teil-Rahmen (2), Teil-Rahmen (3) und Teil-Rahmen (4) zu Bezugszwecken verwendet
werden können. Die
Prädiktor-Koeffizienten, die
für die
Sprachsignal-Erzeugung über
den ersten Teil-Rahmen, nämlich
den Teil-Rahmen (1) verwendet werden, sind eine Kombination der
Prädiktor-Koeffizienten
für den vorhergehenden
Rahmen mit den Koeffizienten für den
derzeitigen Rahmen in einem Verhältnis
von 75%/25% für
den Teil-Rahmen (2) ändert
sich dieses Verhältnis
auf 50%/50%, für
den Teil-Rahmen (3) erreicht das Verhältnis 25%/75%, während für den letzten
Teil-Rahmen (Teil-Rahmen (4) das Verhältnis 0%/100% ist, das heißt mit anderen
Worten, dass lediglich die Koeffizienten von dem derzeitigen Rahmen
verwendet werden.
-
Die 3a, 3b und 3c sind schematische Darstellungen, die
Telefonkommunikationen zeigen, die drahtlose Verbindungsstrecken
beinhalten und die CELP-Vocoder-Technologie verwirklichen.
-
3a ist
eine schematische Darstellung einer Kommunikations-Verbindungsstrecke
zwischen einem drahtlosen mobilen Endgerät 300 und einem stationären (drahtgebundenen)
Endgerät 330.
Die Sprache wird durch einen Vocoder komprimiert (codiert) der sich
in dem mobilen Endgerät 300 befindet, und über eine
drahtlose Verbindungsstrecke (HF-Kanal) an eine Basisstation 310 gesandt,
an der sie in PCM-Abtastproben durch den Decodierer eines zweiten
Vocoders decodiert wird. Das Signal wird dann über verschiedene Vermittlungen
in der digitalen Fernleitung des Telekommunikationsgesellschafts-Netzwerkes 315 zu
dem Vermittlungsamt 320 gelenkt, mit dem das stationäre Endgerät 330 physikalisch
verbunden ist. An dem Vermittlungsamt wird das digitale Signal in
Analogformat umgewandelt und zu dem Endgerät 330 gelenkt. Bei
einem derartigen Szenarium wird die Sprache lediglich einmal komprimiert
und dekomprimiert.
-
3 ist eine schematische Darstellung einer
Kommunikations-Verbindungsstrecke
zwischen zwei drahtlosen mobilen Endgeräten 340 und 380 mit einer
Ausführungsform
der Erfindung, die zwei Transcodierer einschließt. Die Sprache wird durch
einen sich in dem mobilen Endgerät
A 340 befindenden Vocoder komprimiert (codiert) und über eine
drahtlose Verbindungsstrecke (HF-Kanal
A) zu einer Basisstation A 350 gesandt, an der sie in PCM-Abtastproben
von dem Decodierer eines zweiten Vocoders decodiert wird. Die PCM-Abtastproben
werden dann über
das Netzwerk 360 der Telekommunikationsgesellschaft an
die Basisstation B 370 des zweiten mobilen Endgerätes gesandt,
wo sie ein zweites Mal durch den zweiten Basisstations-Vocoder komprimiert
(codiert) werden. Das komprimierte Signal wird über eine drahtlose Verbindungsstrecke
(HF-Kanal B) zu dem mobilen Endgerät 380 gesandt, wo
es ein zweites Mal von dem Vocoder des zweiten mobilen Endgerätes decodiert
wird. Hörbare
Sprache steht dann an dem mobilen Endgerät 380 zur Verfügung. 3b zeigt
weiterhin eine Ausführungsform
der Erfindung die zwei Transcodierer 392 und 394 einschließt, die
weiter unten ausführlich
beschrieben werden.
-
3c ist eine schematische Darstellung einer
Kommunikations-Verbindungsstrecke
zwischen zwei drahtlosen mobilen Endgeräten mit einer Ausführungsform
dieser Erfindung, die einen Kreuz-Transcodierungs-Knoten 390 einschließt. Der Kreuz-Transcodierungs-Knoten
wird weiter unten ausführlich
beschrieben.
-
Diese
Anordnung von Vocodern ist ein Beispiel von dem, was als Tandem- Vocoder-Anordnung bezeichnet
wird. Andere Beispiele von Tandem-Vocoder-Anordnungen sind Fälle, in denen ein drahtloses
mobiles Endgerät
mit einem stationären
drahtlosen Endgerät
kommuniziert, und wenn irgendeine Art von drahtlosem Endgerät Mitteilungen
von einem zentralen Sprachpost-System erhält, das Vocoder zum Komprimieren
von Sprache vor dem Speichern der Daten verwendet. In solchen Fällen wird
die Sprache durch die Kompressions- und Dekompressions-Algorithmen
von Vocodern mehr als einmal hindurchgeleitet. Wenn Vocoder in einer
derartigen Weise in Tandem angeordnet sind, so wird die Qualität der Sprache üblicherweise
beeinträchtigt.
-
Um
Beeinträchtigungen
des Sprachsignals zu kompensieren, die durch Tandem-Verbindungen von
eine niedrige Bit-Rate aufweisenden Codecs (Vocodern) hervorgerufen
werden, wurde ein Verfahren entwickelt, das als „Umgehung" bezeichnet wird, um die doppelte Decodierung/Codierung
zu beseitigen, die von Vocodern in Basisstationen 350 und 370 durchgeführt wird.
Die grundlegende Idee hinter diesem Verfahren besteht darin, dass
die Basisstation A 350, die über Signalisierung und Steuerung
weiß, dass
der Vocoder in dem mobilen Endgerät B 380 identisch
zu dem Vocoder in dem mobilen Endgerät A 340 ist, den Vocoder
umgeht, was es ermöglicht, dass
die Signal-Datenrahmen direkt in die digitale Fernleitung 30 gefangen,
ohne geändert
zu werden. In ähnlicher
Weise sendet die Basisstation 370 in Kenntnis darüber, dass
sie komprimierte Sprach-Datenrahmen empfängt, das Signal einfach an
das mobile Endgerät
B 380 ohne irgendeine Codierung. Das Umgehungsverfahren
ist vollständig
in der weiter oben in dieser Beschreibung genannten internationalen
Anmeldung beschrieben.
-
Diese
Lösung
ist jedoch nur für
identische Vocoder gültig.
Mit der schnellen Erweiterung von Netzwerken nimmt die Vielfalt
von Vocodern sehr schnell zu. Die Umgehungslösung ist daher lediglich für einen
kleinen Teil von Verbindungen brauchbar, die die Tandem-Vocoder-Anordnung
beinhalten.
-
Die
vorliegende Erfindung ergibt ein Verfahren und ein System zur Verringerung
der Signal-Beeinträchtigung,
die auftritt, wenn Vocoder während
eines Anrufs in Tandem verbunden sind. Das System weist Mechanismen
und Protokolle für
die Umwandlung von komprimierten Sprach-Datenrahmen in eine gemeinsame
Zwischen-Darstellung während
einer Verbindung auf, unabhängig
davon, ob diese Verbindung zwischen zwei mobilen Endgeräten oder
zwischen einem mobilen Endgerät
und einem ortsfesten drahtlosen Endgerät besteht.
-
4 zeigt
ein Blockschaltbild eines Systems das gemäß der vorliegenden Erfindung
aufgebaut ist, um ein komprimiertes Sprachsignal von einem Format
zu einem anderen über
ein gemeinsames Format ohne die Notwendigkeit einer Dekomprimierung
des Signals auf eine Digitalisierungstechnik von PCM-Typ umzusetzen.
-
Eine
spezielle Ausführungsform
diese Systems ist in 5 gezeigt, die ein Blockschaltbild
ist, das ein modulares Kreuz-Transcodierungssystem 510 mit
zwei Transcodierern zeigt, die die gleichen Funktionsblöcke haben,
die vorgesehen sind, um das Verfahren gemäß der Erfindung gerätemäßig auszuführen. Die
Transcodierer sind getrennte Geräte,
die an den Enden des Kommunikationspfades installiert sind, um Signalumwandlungsfunktionen
bereitzustellen. Diese Signalumwandlungsfunktionen können unterschiedlich
sein, in Abhängigkeit
davon, welche Kommunikations-Norm das Netzwerk verwendet. In einer
typischen Anwendung ist jeder Transcodierer einer Basisstation des
Netzwerkes zugeordnet. Somit wird ein von einem Transcodierer abgegebenes Signal über das
Telefon-Netzwerk in Richtung auf den zweiten Transcodierer transportiert,
wo es verarbeitet wird, wie dies weiter unten ausführlich beschrieben
wird. Beide Transcodierer haben die gleichen Funktionsblöcke. Aus
Vereinfachungsgründen wird
hier ein Transcodierer beschrieben und die Beschreibung gilt genauso
für die
andere Einheit.
-
Der
Transcodierer 510 schließt einen Signalisierungs- und
Steuerblock 520, einen Codierer-Block 530 und
einen Decodierer-Block 540 ein. Die Hauptfunktion des Signalisierungs-
und Steuerblockes 520 besteht in einer Kommunikation (oder dem
Versuch einer Kommunikation) über PCM-Bit-Stehlen
(In-Band-Signalisierung) oder direkte Kommunikationen von einer
zentralen Datenbank (Außer-Band-Signalisierung) mit
der Einheit an dem anderen Ende der Verbindungsstrecke, um festzustellen,
ob:
- a) die Verbindung an einem identischen
Vocoder vom LPC-Typ endet,
- b) die Verbindung an einem Vocoder von einem unterschiedlichen
LPC-Typ endet,
- c) die Verbindung an einer Einheit endet, die nicht durch die
vorstehen den Punkte a) oder b) abgedeckt ist (das heißt Vocoder
eines anderen Familien-Typs, neuer Art von LPC-Vocoder, drahtgebundenes
Endgerät
usw.).
-
Der
Decodierer-Block 540 umfasst einen Decodierer 542,
eine Pseudo-Decodierer 544 und einen Umgehungsabschnitt 546.
Unter der Steuerung des Signalisierungs- und Steuerblockes 520 führt der
Decodierer-Block 540 eine der folgenden Aufgaben aus:
- a) wenn die Verbindung an einem Vocoder von
einem identischen LPC-Typ
endet, sende das komprimierte Sprachsignal von dem mobilen Endgerät A über den
Umgehungsabschnitt 546, der die komprimierten Sprachdaten
möglicherweise
nach einer Neuformatierung zur Übertragung
an den Umgehungsabschnitt 586 des Transcodierers 550 zum
mobilen Endgerät
B weiterleitet,
- b) wenn die Verbindung an einem Vocoder von einem anderen LPC-Typ
endet, für
den ein Transcodierungs-Modul zur Verfügung steht, wende den Pseudo-Decodierer 544 an,
um komprimierte Sprachdaten von dem mobilen Endgerät A auf
ein Signal mit einem gemeinsamen Format zur Übertragung an den Pseudo-Codierer 584 des
Transcdierers 550 umzuwandeln, oder
- c) wenn die Verbindung an einer Einheit endet, die nicht durch
a) oder b) abgedeckt ist (das heißt Vocoder eines anderen Familien-Typs,
neue Art von LPC-Vocoder, drahtgebundenes Endgerät usw.), wende den Sprach-Decodierer 542 an,
um komprimierte Sprachdaten von dem mobilen Endgerät A in PCM-Abtastproben
zur Aussendung an den Codierer 582 des Transcodierers 550 oder
des Vermittlungsamts 590 umzuwandeln.
-
Der
Codierungsblock 530 umfasst einen Codierer 532,
einen Pseudo-Codierer 534 und einen Umgehungsabschnitt 536.
Unter der Steuerung des Signalisierungs- und Steuerblockes 520 führt der
Codierungsblock 530 eine der folgenden Aufgaben aus:
- a) wenn die Verbindungsquelle einen Vocoder vom
identischen LPC-Typ hat, sende das Sprachsignal, das von dem Umgehungsabschnitt 576 des
Transcodierers 550 empfangen wird, an den Umgehungsab schnitt 536,
der komprimierte Sprachdaten, möglicherweise
nach einer Umformatierung, zum Weiterleitung an das mobile Endgerät A hindurchleitet,
mit dem der Transcodierer 510 verbunden ist.
- b) wenn die Verbindungsquelle einen Vocoder von einem anderen
LPC-Typ hat, für den ein
Transcodier-Modul verfügbar
ist, rufe den Pseudo-Codierer 534 auf, um ein ein gemeinsames
Format aufweisendes Signal, das von dem Pseudo-Decodierer-Abschnitt 574 des
Transscodierers 550 empfangen wird, in komprimierte Sprachdaten
umzuwandeln und das Signal an das mobile Endgerät A weiterzuleiten,
- c) wenn die Verbindung an einer Einheit endet, die nicht durch
die vorstehenden Punkte a) oder b) abgedeckt ist (das heißt Vocoder
eines anderen Familien-Typs, neue Art von LPC-Vocoder, drahtgebundenes
Endgerät
usw.), wende den Sprachcodierer 532 an, um PCM-Format-Abtastproben, die
von dem Decodierer 572 des Transcodierers 550 oder
von dem Vermittlungsamt 590 empfangen wurden, in komprimierte
Sprach-Daten umzuwandeln und die komprimierten Sprach-Daten an das mobile
Endgerät
A weiterzuleiten.
-
Der
Signalisierungs- und Steuerblock 520 in dem Transcodierer 510 ist
so ausgelegt, dass er Mitteilungen in Richtung an den Transcodierer 550 sendet
und weiterhin Mitteilungen von dem Transcodierer 550 empfängt, um
auf diese Weise die Transcodierer-Operationen entsprechend den Daten
richtig einzustellen, die von dem Transcodierer 550 empfangen
oder in Richtung auf diesen ausgesandt werden. Die Kommunikation
zwischen den zwei Transcodierern wird über einen Kommunikationskanal
bewirkt, der zwischen diesen ausgebildet ist. Der Kommunikationskanal
kann entweder im Band oder außerhalb des
Bandes liegen.
-
Während der
PCM-Übertragung
wird der Prozess des Bit-Stehlens verwendet. Dieser Prozess besteht
in der Verwendung bestimmter Bits von bestimmten Sprach-Abtastproben
zur Übertragung
von Signalisierungs-Information. Die Position der Signalisierungs-Bits
und die Bit-Stehlrate werden so ausgewählt, dass die wahrnehmbare
Wirkung der Bit-Ersetzung verringert wird, so dass das hörbare Signal an
jedem der mobilen Endgeräte
nicht wesentlich beeinträchtigt
wird. Der empfangende Transcodierer kennt die Position der Signalisierungs-Bits
in den Sprach-Abtastproben und ist somit in der Lage, die Mitteilung
decodieren.
-
Das
Quittungsaustausch-Verfahren zwischen den Transcodierern 510 und 550 beinhaltet den
Austausch von unterschiedlichen Mitteilungen, die es einem Transcodierer
ermöglichen,
den Partner-Transcodierer zu identifizieren, so dass jede Einheit
auf ein Betriebsart eingestellt werden kann, die es ermöglicht,
die bestmögliche
Sprachqualität
zu erzeugen. Die Quittungsaustausch-Prozedur beinhaltet den Austausch
der folgenden Mitteilungen:
- a) der Sender des
Signalisierungs- und Steuerblockes 520 bettet eine Identifikation
in das PCM-Sprachsignal ein, das von dem Transcodierer 510 abgegeben
wird. Diese Identifikation ermöglicht
es irgendeinem entfernt angeordneten Transcodierer, präzise die
Art des Vocoders zu bestimmen, der mit dem Ursprungs-Transcodierer verbunden
ist, nämlich
dem Transcodierer 510. Die Identifikation wird durch eine
Datenbank-Suchoperation bewirkt, wie dies weiter unten beschrieben
wird.
- b) der Signalisierungs- und Steuerblock 560 überprüft die Daten-Rahmen, die von dem
Transcodierer 550 empfangen werden, und leitet irgendeine Inband-Signalisierungsinformation
ab. Dies wird durch Beobachten der Bit-Werte an den vorgegebenen
Positionen in dem Daten-Rahmen bewirkt. Wenn die Mitteilung eine
Transcodierer-Identifikation
ist, so wird eine (in den Zeichnungen nicht gezeigte) Datenbank
befragt, um die Art des Vocoders zu bestimmen, der mit dem Transcodierer verbunden
ist, der die Mitteilung abgibt. In Abhängigkeit von den Inhalten der
Mitteilung ergeben sich die folgenden Möglichkeiten:
- 1) die Vorgabe-Betriebsart für
die Codierungsblöcke 530 und 580 und
die Decodierungsblöcke 540 und 570 ist
derart, dass die Codierer 532 und 582 und die
Decodierer 542 und 572 aktiv sind, während die
verbleibenden Funktions Module, nämlich die Pseudo-Codierer 534 und 584,
die Pseudo-Decodierer 544 und 574 und die Umgehungsabschnitte 536, 546, 576 und 586 inaktiv
sind. Dies bedeutet, dass wenn der Transcodierer 510 (oder 550)
die Existenz eines Partner-Transcodierers in dem Netzwerk nicht
erkannt hat, der Transcodierer sich als normaler Vocoder verhält, das heißt, er wird
komprimierte Sprach-Daten, die von dem mobilen Endgerät A empfangen
werden, in PCM-Abtastproben umwandeln, die in das Transportnetzwerk
eingegeben werden. In gleicher Weise erwartet der Transcodierer,
PCM-Abtastproben
von dem Transportnetzwerk zu empfangen und wandelt diese Abtastproben
in ein komprimiertes Format um, das mit dem Vocoder des mobilen
Endgerätes
kompatibel ist, das von diesem Transcodierer mit Diensten versorgt
wird;
- 2) wenn der Signalisierungs- und Steuerblock 510 das
Vorhandensein eines entfernt angeordneten Transcodierers identifiziert
hat, wird die Identifikation des Transcodierers in der örtlichen
Datenbank überprüft, um die
Art des Transcodierers zu bestimmen, der die Mitteilungen sendet.
wenn
- i) der Transcodierer identisch ist, das heißt mit anderen Worten, dass
der Vocoder, der mit dem entfernt angeordneten Transcodierer entsprechend dem
gleichen Rahmenformat oder der gleichen Norm wie der Vocoder arbeitet,
der mit dem Transcodierer 510 verbunden ist, so bewirkt
der Signal- und Steuerblock 520, dass der Decodierungsblock
die Umgehungsstufe 546 aktiviert, während der Decodierer 542 und
der Pseudo-Decodierer 544 abgeschaltet werden. Somit werden irgendwelche
komprimierten Sprachdaten, die von dem entfernt angeordneten Transcodierer empfangen
werden, an das mobile Endgerät
A ohne Decodierung gelenkt. Diese Betriebsart ist diejenige, die
die Erzielung der bestmöglichen Sprachqualität ermöglicht,
weil keine Vocoder-Tandem-Anordnung
auftritt. Der Signal- und Steuerblock 520 schaltet weiterhin
den Codierer-Block 530 auf einen Zustand um, in dem die Umgehung 536 aktiv
ist, während
der Codierer 532 und der Pseudo-Codierer 534 inaktiv
sind. Somit werden komprimierte Sprachdaten, die von dem mobilen
Endgerät
A empfangen werden, ohne jede Decodierung durch den Transcodierer 510 geleitet.
Es sei beachtet, dass die Entscheidung zum Umschalten des Codierungs-Blockes 530 auf
die Umgehungs-Betriebsart auf der Annahme beruht, das der Signalisierungs-
und Steuerblock 560 des entfernt angeordneten Transcodierers 550 die
Identifikation des Transcodierers 510 empfangen hat und
ebenfalls den Decodierungs-Block 570 und den Codierungs-Block 580 auf
die Umgehungs-Betriebsart eingestellt hat. In diesem Fall wird eine
Vollduplex-Verbindung zwischen den Transcodierern ausgebildet, die
komprimierte Sprachsignale austauschen.
- ii) der Transcodierer unterschiedlich ist, das heißt, dass
der entfernt angeordnete Transcodierer anzeigt, dass der dem mobilen
Endgerät
B zugeordnete Vocoder einen unterschiedlichen LPC-Typ hat, so aktiviert
der Signalisierungs- und Steuerblock 520 den Decodierungs-Block 540 zur
Aktivierung des Pseudo-Decodierers 544, während der
Decodierer 542 und die Umgehung 546 abgeschaltet
werden. In dieser Betriebsart erwartet der Signalisierungs- und
Steuerblock 520 den Empfang von Sprachsignalen, die in
einem gemeinsamen Format codiert sind, das der Pseudo-Decodierer 544 in
das Format des Vocoders umwandelt, der der mobilen Station A zugeordnet
ist. Weiterhin schaltet der Signalisierungs- und Steuerblock 520 den
Codierungs-Block 530 auf
eine Betriebsart, in der der Pseudo-Codierer 534 aktiv ist, während der
Codierer 532 und die Umgehung 536 inaktiv sind.
Somit weisen die von dem Transcodierer 510 abgegebenen
Daten ein gemeinsames Format auf, das der Pseudo-Codierer 584 in das
Format des Vocoders codiert, der dem mobilen Endgerät B zugordnet
ist.
-
Ein
Kreuz-Transcodierungs-Knoten, wie er in 6 gezeigt
ist, ist eine weitere Ausführungsform dieser
Erfindung. Es sei bemerkt, dass aus Gründen der Klarheit lediglich
eine Hälfte
des gesamten Kreuz-Transcodierungs-Knotens gezeigt ist. Die andere
Hälfte
des Kreuz-Transcodierungs-Knotens ist identisch und ergibt Kommunikationsfähigkeiten
in der entgegengesetzten Richtung. Der Kreuz-Transcodierungs-Knoten wirkt als eine
zentralisierte Schnittstelle zwischen Sprach-Codecs, die unterschiedlich sind. Im
Wesentlichen kann der Transcodierungs-Knoten 600 als zwei Paare von
Transcodierern betrachtet werden, die physikalisch miteinander verbunden
sind, statt dass sie voneinander getrennt sind, wie dies in der
früheren
Ausführungsform
beschrieben wurde. Anstelle der Verwendung eines getrennten Signalisierungs-
und Steuerblockes für
jeden Transcodierer wird eine einzige Signalisierungs- und Steuerstufe
verwendet. Der Kreuz-Transcodierungs-Knoten 600 schließt weiterhin
einen Decodierungs-Block 620, einen Codierungs-Block 630 und einen
Schalter 640 ein.
-
Die
Hauptfunktion des Signalisierungs- und Steuerblockes 610 besteht
in der Kommunikation (oder dem Versuch der Kommunikation) mit der
Einheit an dem anderen Ende der Verbindungsstrecke, um festzustellen,
ob:
- a) die Verbindung an einem Vocoder von
einem identischen LPC-Typ endet,
- b) die Verbindung an einem Vocoder eines anderen LPC-Typs endet,
für den
ein Transcodierungs-Modul zur Verfügung steht,
- c) die Verbindung an einer Einheit endet, die nicht durch den
vorstehenden Fall a) oder b) abgedeckt ist (das heißt ein Vocoder
eines anderen Familientyps, eine neue Art von LPC-Vocoder, ein drahtgebundenes
Endgerät,
usw.).
-
Zeitsteuer-
und Synchronisationsinformationen werden zur Steuerung des Decodierungs-Blockes 620 und
des Codierungs-Blockes 630 verwendet. Steuerinformationen
werden zur Auswahl der richtigen Position des Schalters 640 verwendet,
um das richtige Signal hindurchzulenken.
-
Der
Decodierungs-Block 620 umfasst einen Decodierer 622,
Pseudo-Decodierer 624 und Umgehungsabschnitt 626.
Der Codierungs-Block 630 umfasst einen Umgehungsabschnitt 632,
Pseudo-Codierer 634 und Codierer 636.
-
Wenn
zwei Vocoder miteinander verbunden sind, arbeitet der Kreuz-Transcodierungs-Knoten
in der nachstehend beschriebenen Weise. Unter der Steuerung des
Signalisierungs- und Steuerblockes 610 führt der
Decodierungs-Block 620 eine
der folgenden Aufgaben aus:
- a) wenn die Verbindung
an einem Vocoder von einem identischen LPC-Typ endet, sendet er das komprimierte
Sprachsignal an den Umgehungsabschnitt 626, der die Sprachdaten über den
Umgehungsabschnitt 632 hindurch leitet, möglicherweise
nach einer Umformatierung, zur Aussendung an den Vocoder vom identischen
LPC-Typ,
- b) wenn die Verbindung an einem Vocoder von einem unterschiedlichen
LPC-Typ endet, für
den ein Transcodierungs-Modul verfügbar ist, wendet er den Pseudo-Decodierer 624 an,
um komprimierte Sprachdaten auf ein ein gemeinsames Format aufweisendes
Signal umzuwandeln und lenkt dann das Signal an den Pseudo-Codierer
434, um das gemeinsame Format zurück auf ein komprimiertes Signal
umzuwandeln, und schließlich
sendet er das komprimierte Sprachsignal an den Vocoder von einem
unterschiedlichen LPC-Typ aus, oder
- c) wenn die Verbindung an einer Einheit endet, die nicht durch
den vorstehenden Fall a) oder b) abgedeckt ist (das heißt Vocoder
von einem anderen Familien-Typ, neue Art von LPC-Vocoder, drahtgebundenes
Endgerät,
usw.) wendet er den Sprach-Decodierer 622 an, um komprimierte Sprachdaten
auf PCM-Abtastproben umzuwandeln und lenkt dann das Signal an den
Codierer 636, um die PCM-Abtastproben zurück auf ein komprimiertes
Sprachsignal umzuwandeln, und schließlich sendet er das komprimierte
Sprachsignal an die am Ende angeordnete Einheit.
-
Wenn
er mit einem drahtgebundenen Endgerät verbunden ist, arbeitet der
Kreuz-Transcodierungs-Knoten
so, wie dies nachfolgend beschrieben wird. Wenn ein PCM-Signal ankommt,
wird es zu dem Schalter 640 gelenkt, der Signalisierungs- und Steuerblock 610 wählt ein
Schalten zum Weiterleiten des Signals an den Codierer 636 aus,
an dem das Signal in komprimierte Sprache umgewandelt wird, und schließlich wird
die komprimierte Sprache an den externen Vocoder gesandt. Wenn sich
ein drahtgebundenes Endgerät
an dem empfangenden Ende der Kommunikation befindet und ein komprimiertes Sprachsignal
ankommt, so wird das Signal zu dem Decodierer 622 gelenkt,
wo es in ein PCM-Format umgewandelt wird, und dann wählt der
Signalisierungs- und Steuerblock ein Schalten derart aus, dass das
Signal an das drahtgebundene Endgerät weitergeleitet wird.
-
Die
folgende Beschreibung liefert nunmehr ein spezielles Beispiel dafür, wie die
Pseudo-Codierer-Einheiten die Transformation von einem komprimierten
Signal zu einem Signal in einem gemeinsamen Format sowie die umgekehrte
Transformation bewirken, nämlich
eine Umwandelung von dem gemeinsamen Format auf ein komprimiertes
Signal. Insbesondere sei der Fall betrachtet, wenn ein Sprachsignal
transformiert wird, wenn es von einem mobilen Endgerät (MT) A 340 zu
MT B 380 gesandt wird. In diesem Beispiel verwendet das
MT A einen Vektorsummenverbesserten linearen Prädiktions- (VSELP-) Vocoder
in dem drahtlosen IS 54-Telefonie-Kommunikationsstandard. 7a beschreibt
das Rahmenformat für
IS 54. Das Signal wird in ein gemeinsames Format gemäß 7b umgewandelt, und
an dem empfangenden Ende verwendet das MT B einen verbesserten Voll-Raten-Codierer (EFRC)
in der IS 641-Norm. 7c zeigt das Rahmenformat für IS 641.
-
Gemäß den 3b und 5 wird
für die Transformation
in diesem Beispiel ein Sprachsignal in der IS 54-Norm durch einen
VSELP-Vocoder, der sich in dem MT A 340 befindet, komprimiert
(codiert) und über
eine drahtlose Verbindungsstrecke (HF-Kanal A) zu der Basisstation
A 350 gesandt, an der es in das gemeinsame Format durch
den Pseudo-Decodierer 545 in dem Transcodierer 510 (in 5 gezeigt)
in das gemeinsame Format transformiert wird. Die Datenrahmen des
gemeinsamen Formates werden dann über das Netzwerk 360 der
Telefongesellschaft an den Transcodierer 550 gesandt, an
dem sie in komprimierte Sprache in der IS 641-Norm durch den Pseudo-Codierer 584 transformiert
werden. Das komprimierte Signal wird über eine drahtlose Verbindungsstrecke
(HF-Kanal B) an das MT 380 gesandt, wo es durch den EFRC-Vocoder
des zweiten MT decodiert wird. Hörbare
Sprache steht dann an dem MT 380 zur Verfügung.
-
Der
Pseudo-Decodierer 544, der einen Datenrahmen der Sprache
in dem IS 54-Formate
gemäß 7a empfängt, wandelt
ihn in der nachstehend beschriebenen Weise um, wie dies auch durch das
Ablaufdiagramm nach 8 dargestellt ist.
-
Der
Pseudo-Decodierer 544 führt
eine Neuberechnung des 10-dimensionalen Vektors aus, der die LPC-Reflexions-Koeffizienten
für den
20 ms-Datenrahmen darstellt, wobei sein eigener Quantisierer verwendet
wird. Er verwendet dann den 10-dimensionalen Vektor zur Bestimmung
der vier Sätze
von interpolierten LPC-Koeffizienten-Vektoren
für die
vier Teilrahmen. Das Interpolationsverfahren ist das gleiche, wie
es weiter oben beschrieben wurde. Dieser Teil des das gemeinsame
Format aufweisendenen Datenrahmens ist bereit, und der Pseudo-Decodierer 544 speichert
es für
eine spätere
Rückgewinnung. Der
Pseudo-Decodierer 544 liest dann aus dem komprimierten
Format die vier Verzögerungswerte (Klang-Verzögerung).
Der Pseudo-Decodierer 544 speichert sie für eine zukünftige Einfügung in
das gemeinsame Format. Der Pseudo-Decodierer 544 verwendet
dann die Codebuch-Information, die Verstärkungs-Faktoren und die Klang-Verzögerungen
für die vier
Teilrahmen und die Rahmenenergie für den Rahmen, um ein synthetisches
Anregungs-Signal (4 mal 40 Abtastproben) für das gemeinsame Format zu schaffen.
Schließlich
wird der Datenrahmen des gemeinsamen Formates durch Verketten des
Anregungs-Signals und der gespeicherten LPC-Koeffizienten und Klang-Verzögerungen
aufgebaut. Dieser Datenrahmen wird an den Pseudo-Codierer 584 der nächsten Basisstation
gesandt. Es sei bemerkt, dass in 7b Vorkehrungen
getroffen sind, Bits an Information in dem das gemeinsame Format
aufweisenden Rahmen für
die Energie- und Klang-Vorhersage-Verstärkungs-Information zu reservieren.
Diese Information wurde in diesem speziellen Beispiel nicht berechnet.
-
Wie
dies in 9 gezeigt ist, empfängt der Pseudo-Codierer 584 den
das gemeinsame Format aufweisenden Sprach-Datenrahmen und muss es nunmehr
auf das komprimierte IS 641-Sprachformat umwandeln, damit der EFRC
am MT B ihn richtig decodieren kann. Der Pseudo-Codierer 584 liest
die LPC-Koeffizienten für
die vier Teilrahmen und verwirft die Koeffizienten für die ersten
drei Teilrahmen, wobei lediglich die Koeffizienten des vierten Teilrahmens
beibehalten werden. Es sei bemerkt, dass dies der LPC-Reflexions-Koeffizienten-Vektor
ist, der für den
gesamten Rahmen berechnet wurde. Die ersten drei Vektoren für die Transformation
in diesem speziellen Beispiel sind nicht erforderlich, weil der EFRC-Vocoder am MT B die
ersten drei Teilrahmen-Vektoren entsprechend dem IS-641-Interpolationsschema
interpoliert. Alle vier Vektoren könnten jedoch für Transformationen
verwendet werden, die andere Arten von Vocodern beinhalten.
-
An
diesem Punkt führt
der Pseudo-Codierer 584 eine Umquantifizierung der LPC-Reflektions-Koeffizienten
des vierten Teilrahmens unter Verwendung seines eigenen Quantisierers
aus. Bevor der Pseudo-Codierer die zehn LPC-Reflexions-Koeffizienten an
seinen Quantisierer liefert, muss er sie zunächst in LP- (lineare Prädiktions-)
Koeffizienten, dann in Leitungsspektrum-Paar- (LSP-) Koeffizienten und
schließlich
in Leitungs-Spektralfrequenzen (LSF-Vektor) umwandeln. Der LSF-Vektor wird dann quantisiert
und in einen quantisierten LSP-Vektor umgewandelt. Dieser quantisierte
LSF-Vektor ist Teil des IS 641-Formates und wird so gespeichert
wie er ist. Dann transformiert der Pseudo-Codierer 584 den quantisierten
LSP-Vektor in quantisierte LP-Koeffizienten und interpoliert die
LP-Koeffizienten
für die
ersten drei Teilrahmen. Diese Satz von LP-Koeffizienten-Vektoren wird in
dem nächsten
Schritt verwendet.
-
Der
Pseudo-Codierer 584 verwendet das das gemeinsame Format
ausweisende Anregungs-Signal und leitet jeden der vier 40 Abtastproben
umfassenden Teilrahmen durch ein Synthesefilter unter Verwendung
der quantisierten und interpolierten LP-Koeffizienten als Anzapfungs-Koeffizienten,
um das Sprachsignal wieder herzustellen. Aus dem Sprachsignal berechnet
der Pseudo-Codierer 584 (in der gleichen Weise wie dies
ein regulärer EFRC-Codierer
tun würde)
die Klangverzögerungs-, Verstärkungs-
und Anregungswerte (algebraischer Code für das MT B-Codebuch) unter
Verwendung der vorher berechneten 10 LSP-Koeffizienten. Schließlich wird
der das komprimierte IS-641-Sprachformat aufweisende Rahmen unter
Verwendung der quantisierten Klangverzögerungs-, Verstärkungs-
und Anregungswerte und des gespeicherten LSP-Vektors aufgebaut.
Dieser Sprach-Datenrahmen wird an den EFRC-Decodierer in dem MT
B gesandt, an dem es in ein Sprachsignal umgewandelt wird, wie dies
normalerweise der Fall sein würde.
-
Es
sei bemerkt, dass die Klang-Verzögerungs-Information
aus dem gemeinsamen Format bei diesem Beispiel nicht verwendet wird,
jedoch in anderen Umwandlungen verwendet werden kann. Stattdessen
wurde die Klang-Verzögerungs-Information
aus dem erzeugten Sprachsignal unter Verwendung bekannter Algorithmen
berechnet.
-
Zusammenfassend
wandelt der Pseudo-Decodierer 534 das ankommende komprimierte Sprachsignal
in ein gemeinsames Format um, das einen Koeffizienten-Teil und einen
Anregungs-Teil hat. Dieses gemeinsame Format wird dann von dem Pseudo-Codierer
verwendet, um die komprimierte Sprache erneut zu schaffen, jedoch
in einem Format, das von dem Format der komprimierten Sprache abweicht,
die in den Pseudo-Decodierer 544 eintritt. Im einzelnen
baut der Pseudo-Codierer 584 aus dem Koeffizienten-Teil
in dem das gemeinsame Format aufweisenden Signal die Koeffizienten
des komprimierten Sprachsignals auf, das an den Pseudo-Codierer 584 abgegeben
werden soll. Auf der Grundlage des das gemeinsame Format aufweisenden
Signals wird das Sprachsignal erneut geschaffen und dazu verwendet,
irgendeine Anregungs- und andere Information abzuleiten, die in
Verbindung mit den für das
komprimierte Sprachsignal berechneten Koeffizienten zur Darstellung
der Sprachinformation verwendet wird.
-
Es
sei bemerkt, dass der Pseudo-Codierer und der Pseudo-Decodierer
des Transcodierers 510 entsprechend der Art von Vocoder
ausgelegt sind, mit denen sie zusammenwirken. Das gemeinsame Element
besteht darin, dass jeder Pseudo-Decodierer
ein komprimiertes Sprachsignal annimmt und ein das gemeinsame Format
aufweisendes Signal abgibt, das seinerseits von dem Pseudo-Codierer
in ein anderes komprimiertes Sprachsignal-Format transformiert wird.
Dieses Merkmal ermöglicht
es dem System, sehr flexibel zu sein, insbesondere wenn neue Vocoder
eingeführt
werden. Es reicht aus, einen Pseudo-Codierer und einen Pseudo-Decodierer zu
konstruieren, die die Transformation zwischen dem neuen Vocoder-Signal-Format
und dem gemeinsamen Format und umgekehrt bereitstellen. Es besteht
keine Notwendigkeit, die vorhandenen Transcodierer in irgendeiner
Weise zu ändern,
weil das von dem System verwendete gemeinsame Format das gleiche
bleibt.
-
Von
einem Konstruktions-Gesichtspunkt aus gesehen kann die in 10 gezeigte
Vorrichtung zur gerätemäßigen Ausgestaltung
der Funktion eines Pseudo-Codierers 584 verwendet
werden, dessen Betriebsweise weiter oben anhand der 9 ausführlich erläutert wurde.
Die Vorrichtung umfasst eine Eingangssignal-Leitung 910, eine Signal-Ausgangsleitung 912,
einen Prozessor 914 und einen Speicher 916. Der
Speicher 916 wird zum Speichern von Befehlen für die Betriebsweise
des Prozessors 914 und außerdem zum Speichern der Daten
verwendet, die von dem Prozessor 914 bei der Ausführung dieser Befehle verwendet
werden. Ein Bus 918 ist für den Austausch von Informationen
zwischen dem Speicher 916 und dem Prozessor 914 vorgesehen.
-
Die
in dem Speicher 916 gespeicherten Befehle ermöglichen
es der Vorrichtung, entsprechend dem funktionellen Blockschaltbild
zu arbeiten, das in 11 gezeigt ist. Die Vorrichtung
schließt
Koeffizienten-Segment-Wandler ein, der, wie dies in Verbindung mit 9 beschrieben
wurde, über
bekannte mathematische Manipulationen das Koeffizienten-Segment
von dem ein gemeinsames Format aufweisenden Rahmen in das Koeffizienten-Segment des
komprimierten Audiosignal-Rahmen, in diesem Beispiel in das IS-641-Rahmen-Format
umwandelt. Die Vorrichtung schließt weiterhin ein Synthesefilter ein,
das von dem Koeffizienten-Segment-Wandler quantisierte LPC-Koeffizienten
für die
vier Teilrahmen empfängt.
Das Synthesefilter empfängt
weiterhin das Anregungs-Signal
von dem Anregungs-Segment des ein gemeinsames Format aufweisenden
Rahmens, um das Audiosignal zu konstruieren. Dieses Signal wird
dann in einem Analyse-für-Synthese-Prozess eingegeben,
der das Anregungs-Segment für
das IS-641-Rahmen-Format erzeugt, indem er als Anzapfungs-Koeffizienten
den quantisierten LSP-Vektor verwendet, der von dem Koeffizienten-Segment-Wandler
abgegeben wird.
-
12 zeigt
das Blockschaltbild des Pseudo-Decodierers 544, der in 5 gezeigt
ist. Die Vorrichtung schließt
zwei Hauptfunktionsblöcke
ein, nämlich
einen Koeffizienten-Segment-Wandler, der das Koeffizienten-Segment
von dem Datenrahmen in dem IS-54-Format empfängt und es in das Koeffizienten-Segment
des das gemeinsame Format aufweisenden Datenrahmens umwandelt. Die
Vorrichtung schließt
weiterhin einen Anregungs-Segment-Wandler ein, der die Elemente
des Anregungs-Segmentes von dem IS-54-Datenformat dazu verwendet,
es in das Anregungs-Segments des das gemeinsame Format aufweisenden
Datenrahmens umzuwandeln. Die Lösung
bei dieser Konstruktion besteht darin, alle Segmente des Datenrahmens
des komprimierten Audio-Signals zu behandeln, um den Datenrahmen mit
dem gemeinsamen Format aufzubauen.
-
Bei
der Konstruktion eines Transcodierers für eine bestimmte Anwendung
kann der Pseudo-Codierer und der Pseudo-Decodierer unter Verwendung einer
der in den 11 und 12 gezeigten
Geräte aufgebaut
werden. Die Wahl irgendeines dieser Systeme hängt von der speziellen durchzuführenden Format-Umsetzung
ab. Wenn das Format des komprimierten Audiosignals (entweder der
Quellen-Datenrahmen
oder der Ziel-Datenrahmen) derart ist, dass das Koeffizienten-Segment und das Anregungs-Segment
von dem Quellen-Datenrahmen unabhängig bearbeitet werden können, um
die Übersetzung
auf den Ziel-Datenrahmen
auszuführen,
so ist die in 12 gezeigte Vorrichtung wahrscheinlich am
besten für
die Operation geeignet. Andererseits sollte, wenn eine Rekonstruktion
des Audiosignals besser geeignet ist, die in 11 gezeigte
Vorrichtung verwendet werden.
-
Die
Konstruktion der Codierer- und Umgehungsstufen jedes Transcodierers
kann entsprechend Systemen aufgebaut werden, die derzeit dem Fachmann
bekannt sind. Im einzelnen können
der Codierer und der Decodierer entsprechend dem Blockschaltbild
nach den 1 und 2 aufgebaut werden.