-
Die
Erfindung betrifft allgemein das Gebiet des Codierens und Decodierens
eines Signals, das über
eine Telekommunikationsverbindung zu übertragen ist. Speziell betrifft
die Erfindung die Prozeduren zum Ändern der Signalbandbreite
eines solchen Signals im Verlauf der Telekommunikationsverbindung.
-
1 veranschaulicht
das allgemeine Prinzip des Übertragens
von Sprache von einem ersten Endgerät zu einem zweiten Endgerät in einem
digitalen Zellularfunknetz. Im ersten Endgerät 100 ist eine Reihenschaltung
eines Mikrofons 101, eines Sprachencoders 102,
eines Kanalencoders 103, eines Modulators 104 und
eines Funksenders 105 vorhanden. In einer ersten Basisstation 110 ist
eine Reihenschaltung eines Funkempfängers 111, eines Demodulators 112,
eines Kanaldecoders 113 und eines Leitungssenders 114 vorhanden.
Von der ersten Basisstation 110 zu einer zweiten Basisstation 120 ist eine
Netzverbindung 115 vorhanden. Die zweite Basisstation 120 umfasst
eine Reihenschaltung eines Leitungsempfängers 121, eines Kanalencoders 122, eines
Modulators 123 und eines Funksenders 124. In einem
zweiten Endgerät 130 ist
eine Reihenschaltung eines Funkempfängers 131, eines Demodulators 132,
eines Kanaldecoders 133, eines Sprachdecoders 134 und
eines Lautsprechers 135 vorhanden.
-
Der
Sprachencoder 102 im sendenden Endgerät 100 wandelt das
analoge Sprachsignal, welches vom Mikrofon 101 kommt, in
ein digitales Signal um, indem er ein gewisses Sprachcodierungsschema
anwendet. Der Kanalencoder 103 fügt dem digitalen Signal Redundanz
hinzu, um dessen Robustheit gegenüber verfälschenden Wirkungen an der Funkschnittstelle
zu verbessern. Der Kanaldecoder 113 entfernt die Kanalcodierung
zumindest teilweise, da Drahtverbindungen über das Netz 115 wesentlich zuverlässiger als
Funkverbindungen sind und eine übermäßige Kanalcodierung
nur Übertragungskapazität im Netz
verbrauchen würde.
Ein entsprechendes Paar von Kanalcodierung 122 und Kanaldecodierung 133 existiert
auch um die zweite Funkschnittstelle herum. Der Sprachdecoder 134 wandelt
das digitale Sprachsignal zurück
in ein analoges Signal um, indem er eine Prozedur anwendet, die
eine Umkehrung des oben erwähnten
Sprachcodierungsschemas ist. Die oben beschriebenen Prinzipien lassen sich
leicht auf die Übertragung
beliebiger Informationen zwischen Endgeräten verallgemeinern, indem das
Mikrofon 101 durch eine gattungsgemäße Datenquelle, der Sprachencoder 102 durch
einen Quellenencoder, der Sprachdecoder 134 durch einen
entsprechenden Decoder und der Lautsprecher 135 durch eine
gattungsgemäße Datensenke
ersetzt wird.
-
Eine
Codier- und Decodiereinheit wird gewöhnlich als ein Codec bezeichnet.
Die Spezifikationen herkömmlicher
digitaler Zellularfunksysteme wie des ursprünglichen GSM (Global System
for Mobile telecommunications) definieren normalerweise Sprach-
(oder Quellen-) Codecs, welche eine konstante Ausgangsbitrate aufweisen
und welche ein Sprach- (oder Quellen-) Signal verarbeiten, dessen Bandbreite
konstant ist. In Abhängigkeit
von der Bandbreite wurden die herkömmlichen Sprach-Codecs entweder
als Schmalband- oder als Breitband-Codecs konzipiert. Zum Beispiel
ist der so genannte RPE-LTP Full-rate Speech Codec, der im GSM-Standard
Nummer GSM 06.10 beschrieben ist, ein Schmalband-Sprach-Codec, dessen
Bandbreite ungefähr
3,5 kHz beträgt.
Seine Bitrate beträgt
bei der Sprachcodierung 13 kbit/s und bei der Kanalcodierung 9,8
kbit/s, was zusammen 22,8 kbit/s ergibt. Beispielhafte Breitband-Sprach-Codecs
sind jene, welche von der IFU (Internationale Fernmeldeunion) unter
den Bezeichnungen G.722-64, G.722-56 und G.722-48 standardisiert
wurden. Ihre Bitraten bei der Sprachcodierung betragen 64, 56 bzw.
48 kbit/s, und ihre Bandbreite beträgt ungefähr 7 kHz.
-
Zu
den jüngeren
Vorschlägen
für Verbesserungen
an den bekannten Anordnungen bei der Sprach- (oder Quellen-) Codierung
gehört
die Konzeption der AMR oder adaptiven Multiratencodierung (Adaptive
MultiRate Coding). Die Idee besteht darin, die Bitrate (oder Zeichengeschwindigkeit)
am Ausgang des Kanalencoders 103 konstant zu halten, jedoch
zuzulassen, dass sich die Rollen des Sprachencoders 102 und
des Kanalencoders 103 beim Erzeugen der konstanten Bitrate ändern. Die
Eingangsbandbreite des Sprachencoders ist konstant (bei GSM AMR
dieselben 3,5 kHz wie bei dem oben erwähnten Basis-GSM-Sprach-Codec),
doch wenn dem Sprachencoder ermöglicht
wird, mehr Bits pro Zeiteinheit zu verwenden, kann eine bessere
akustische Qualität
erzielt werden. Die Verwendung eines größeren Teils der verfügbaren Bitrate
für Sprachcodierung
ist nur unter der Bedingung möglich,
dass die verfälschenden
Wirkungen von Rauschen und Interferenz zu dem betreffenden Zeitpunkt
nicht zu schlecht sind. Am empfangenden Ende bedeutet die AMR Konzeption,
dass die Bitrate (oder Zeichengeschwindigkeit) am Eingang des Kanaldecoders 133 konstant
ist, jedoch die Menge an Redundanz, die im Kanaldecoder entfernt
wird, und dementsprechend die Menge an digitaler Information pro
Zeiteinheit, die zum Rekonstruieren des ursprünglichen analogen Sprachsignals
im Sprachdecoder 134 verfügbar ist, variieren kann.
-
Zum
Prioritätsdatum
der vorliegenden Patentanmeldung ist vorgesehen, beim Standardisieren eines
Breitband- oder 7-kHz-Sprachcodecs
für die zukünftige Verwendung
innerhalb der GSM-Rahmenrichtlinien das bekannte AMR Sprachcodierungsprinzip
zu wählen.
Es ist möglich,
dass in naher Zukunft Kommunikationsgeräte in Gebrauch sein werden, welche
zwei wählbare
Sprach- (oder Quellen-) Bandbreiten aufweisen: 3,5 kHz und 7 kHz.
Es ist auch möglich,
dass sogar noch mehr Sprach- (oder Quellen-) Bandbreiten definiert
werden. Die Bandbreiten können
mit der Verwendung völlig
unterschiedlicher Codecs verknüpft
sein, oder sie können
lediglich gewisse Betriebsarten repräsentieren, die als die Codec-Modi
oder einfach Modi der Sprachcodierungs- und Decodierungsanordnungen
bezeichnet werden. Die Anwendung des AMR-Prinzips bedeutet, dass ein
zukünftiger
Sprach- (oder Quellen-) Codec sowohl eine wählbare Bandbreite als auch
eine sich ändernde
Bitrate aufweisen kann, wobei die letztere mit verschiedenen Niveaus
des Fehlerschutzes durch unterschiedliche Aufteilungen der verfügbaren Gesamt-Bitrate zwischen
Sprach- (oder Quellen-) Codierung und Kanalcodierung verknüpft ist.
-
2 zeigt
detaillierter den Inhalt des Sprachencoderblockes 102 in
einer sendenden Mobilstation und des Sprachdecoderblockes 134 in
einer empfangenden Mobilstation in einem bekannten beispielhaften
Fall, in dem zwei verschiedene Sprachbandbreiten definiert worden
sind. Hier sind die Begriffe des Codierens und Decodierens in einem
weiten Sinne zu verstehen, so dass z.B. A/D- und D/A-Umsetzungen
Teile davon sind. Der A/D-Wandler 201 in
dem Encoder 102 ist sowohl direkt als auch über einen
Downsampling-Block 203 mit einem Schaltblock 202 verbunden.
Der Ausgang des Schaltblocks 203 ist mit einem Sprachencoder
im engeren Sinne 204 verbunden, welcher in der Lage ist, sowohl
ein Breitband- als auch ein Schmalband-Eingangssignal zu verarbeiten.
Der Kommunikationskanal 210 zwischen dem Ausgang des Sprachencoders im
engeren Sinne 204 und dem Eingang eines entsprechenden
Sprachdecoders im engeren Sinne 220 im Sprachdecoderblock 134 umfasst
im Allgemeinen z.B. alle Kanalcodierungs-/Decodierungs- und Sende-/Empfangs-Anordnungen. Der
Sprachdecoder im engeren Sinne 220 ist in der Lage, sowohl
Breitband- als auch Schmalband-Sprachsignale
zu decodieren, und sein Ausgang ist sowohl direkt als auch über einen
Upsampling-Block 222 mit einem Schaltblock 221 verbunden.
Der Ausgang des Schaltblockes 221 ist mit einem Sprachsynthesizer
und D/A-Wandler 223 verbunden.
-
Der
A/D-Wandler 201 im Encoderblock 102 und der D/A-Wandler 223 im
Decoderblock 134 arbeiten beide mit einer Abtastfrequenz,
welche ausreichend hoch für
die breiteste definierte Sprachbandbreite ist. Der Downsampling-Block 203 verringert
die Abtastfrequenz des von dem A/D-Wandler 201 erzeugten
Sample-Stroms durch Punktieren, Filtern oder Interpolieren auf ein
niedrigeres Niveau, und der Upsampling-Block 222 erhöht die Abtastfrequenz des
von dem Sprachdecoder im engeren Sinne 220 erzeugten Sample-Stroms durch gewisse
rechnerische Mittel auf ein höheres
Niveau. In Reaktion auf einen Bandbreitenänderungs-Befehl schalten der Sprachencoder 204 und
der Sprachdecoder 220 auf Codierungs- und Decodierungsprozeduren
um, welche der neuen Bandbreite entsprechen, und gleichzeitig wählen die
Schaltblöcke 203 und 221 entweder die
direkten Kopplungen (im Falle einer größeren Bandbreite) oder die
Kopplungen, die über
den Downsampling-Block 203 und den Upsampling-Block 222 führen (im
Falle einer schmaleren Bandbreite). Mehrere Bandbreiten können erreicht
werden, indem der Sprachencoder 204 und der Sprachdecoder 220 für mehrere Bandbreiten
programmiert werden und indem mehrere parallele Downsampling-Blöcke in der
Sendestation und Upsampling-Blöcke
in der Empfangsstation vorgesehen werden (oder indem der Downsampling-Block 203 und
der Upsampling-Block 222 für mehrere Downsampling-/Upsampling-Verhältnisse
programmiert werden).
-
Die
existierenden Definitionen der AMR-Anordnungen enthalten den Nachteil,
dass beim Wechseln von einer Quellencodierungs-Bandbreite zu einer
anderen die Tendenz vorhanden ist, dass wahrnehmbare Artefakte in
dem gesendeten Signal verursacht werden. Zum Beispiel hat das Wechseln
zwischen zwei verschiedenen Sprach-Codec-Modi mit unterschiedlichen
Bandbreiten zur Folge, dass der hörende Teilnehmer am empfangenden
Ende einen merkwürdigen
akustischen Effekt in der Stimme des Sprechers bemerkt.
-
Als
zusätzlichen
Bestandteil des allgemeinen Stands der Technik beschreiben wir kurz
die bekannte Anordnung des tandemfreien Betriebs (Tandem Free Operation,
TFO), welche verwendet wird, um eine Verbindung zwischen mobilen
Endgeräten (eine
MS-MS-Verbindung, wobei MS für
Mobilstation steht) zu vermitteln, bei der Breitband-Sprachcodierung verwendet
wird. Um der Kürze
willen werden wir ein Signal, welches Sprache transportiert, die
mit Breitband- (Schmalband-) Sprachcodierung codiert ist, einfach
als Breitband- (Schmalband-) Sprache bezeichnen.
-
Die
Verwendung von zwei kompletten Encoder-Decoder-Paaren, welche in Verbindung mit 1 beschrieben
wurde, ist als Tandembetrieb bekannt, und sie ist speziell dann
notwendig, wenn die Netzverbindung 115 über ein öffentliches Telefonwählnetz oder
PSTN von im Allgemeinen unbekannter Natur führt. In einem vorteilhafteren
Fall sind die beiden Endgeräte 100 und 130 Mobilstationen
eines digitalen Zellularfunksystems, und die Netzverbindung 115 ist
echt digital und in der Lage, transparente digitale Kanäle zwischen
gewissen Transcodierungs- und Datenratenanpassungseinheiten (Transcoder and
Rate Adaptor Units) oder TRAUs aufzubauen, welche entweder innerhalb
von Basisstationen oder unter der Kontrolle von Basisstationen betrieben
werden.
-
3 zeigt
eine Anordnung, bei der eine erste TRAU 300 funktional
mit der ersten Basisstation 110 verknüpft ist und eine zweite TRAU 310 funktional
mit der zweiten Basisstation 120 verknüpft ist. Jede TRAU 300 und 310 umfasst
einen Decoder 301, 311; eine Uplink-TFO-Einheit 302, 312;
einen Encoder 303, 313; eine Downlink-TFO-Einheit 304, 314; und
eine TFO-Protokolleinheit 305, 315. In jeder TRAU
sind der Decoder 301, 311 und die Uplink-TFO-Einheit 302, 312 parallel
geschaltet, um die Uplink-Rahmen
von der Mobilstation zu empfangen, und ihre Ausgänge sind durch die Verwendung eines
Kombinators 306, 316 kombiniert. Ähnlich sind der
Encoder 303, 313 und die Downlink-TFO-Einheit 304, 314 parallel
geschaltet, um die Übertragungsrahmen
von der anderen TRAU zu empfangen, und ihre Ausgänge laufen über einen Wahlschalter 307, 317.
Das Digitalnetz 320 besteht aus IPEs (In Path Equipment),
von denen die IPEs 321 und 322 dargestellt sind,
und ist in der Lage, transparente 64 kbit/s Kanäle in beiden Richtungen zwischen
den TRAUs aufzubauen. Die erste Basisstation 110 arbeitet
unter der Kontrolle eines ersten Basisstationscontrollers 330,
welcher wiederum Teil einer Kommunikationsdomain ist, die von einer
ersten Mobilfunkvermittlungsstelle 340 geregelt wird. Die
zweite Basisstation 120 arbeitet unter der Kontrolle eines
zweiten Basisstationscontrollers 350, welcher Teil einer Kommunikationsdomain
ist, die von einer zweiten Mobilfunkvermittlungsstelle 360 geregelt
wird. Es sind Steuerverbindungen von den Basisstationscontrollern 330 und 350 jeweils
zur entsprechenden TFO-Protokolleinheit 305 bzw. 315 vorhanden.
-
Das
Dokument "GSM 04.53
version 1.6.0 (1998-10); Digital cellular telecommunications system
(Phase 2+); Inband Tandem Free Operation (TFO) of Speech Codecs;
Service Description; Stage 3",
das vom ETSI (European Telecommunications Standards Institute) veröffentlicht
wurde, definiert ein Inbandsignalisierungsprotokoll zum Testen im
Hinblick auf die Transparenz der Kanäle, die Fähigkeit beider TRAUS zur Unterstützung von
TFO und die Identität
der Sprachcodecs an beiden Funkschnittstellen. Sofern die Tests
erfolgreich verlaufen, bauen die TFO-Protokolleinheiten 305 und 315 die TFO-Verbindung
auf, indem sie anweisen, dass die Signalpfade transparent werden
und die Decoder-/Encoder-Funktionen innerhalb der TRAUs 300 und 310 umgehen.
Die TFO-Spezifikationen definieren außerdem eine Fast-Fallback-Prozedur
für plötzliche
TFO-Unterbrechung und bieten Unterstützung zur Lösung in Situationen einer Codec-Fehlanpassung
und zur kostengünstigen Übertragung
innerhalb des festen Teils 320 des Netzes.
-
Die
erste Mobilstation 370, welche mit der ersten Basisstation 110 kommuniziert,
umfasst einen Encoder 371 und einen Decoder 372.
Entsprechend umfasst die zweite Mobilstation 380, welche
mit der zweiten Basisstation 120 kommuniziert, einen Decoder 381 und
einen Encoder 382. Die oben erwähnten TFO-Prozeduren dienen
dazu, eine virtuell transparente Verbindung vom Encoder 371 der
ersten Mobilstation 370 zum Decoder 381 der zweiten
Mobilstation 380 und vom Encoder 382 der zweiten Mobilstation 380 zum
Decoder 372 der ersten Mobilstation 370 aufzubauen.
-
Es
ist eine Aufgabe der Erfindung, die durch die beigefügten unabhängigen Ansprüche definiert ist,
ein Verfahren und eine Anordnung zum Ändern von Quellenbandbreiten
ohne die oben beschriebenen Nachteile der Anordnungen nach dem Stand
der Technik bereitzustellen. Es ist eine weitere Aufgabe der Erfindung,
ein Verfahren und eine Anordnung zum Ändern von Quellenbandbreiten
bereitzustellen, so dass die Teilnehmer an den Enden einer Telefonverbindung
im Wesentlichen keine akustischen Artefakte wahrnehmen, die auf
Bandbreitenänderung
zurückzuführen sind.
Eine andere Aufgabe der Erfindung ist es, ein Verfahren und eine
Anordnung der oben beschriebenen Art mit nur einem mäßigen Grad an
Komplexität
in der Implementierung bereitzustellen.
-
Die
Aufgaben der Erfindung werden gelöst, indem das Konzept der weichen
Bandbreitenumschaltung eingeführt
wird, bei der die akustische Bandbreite allmählich von einem ersten Niveau,
welches einem ersten Codec-Modus entspricht, zu einem zweiten Niveau,
welches einem zweiten Codec-Modus entspricht, geändert wird.
-
Das
Verfahren zum Ändern
der Bandbreite eines Sprachsignals in Verbindung mit Multimodus-Codierung
oder -Decodierung gemäß der Erfindung
ist dadurch gekennzeichnet, dass es die folgenden Schritte umfasst:
- – Empfangen
einer Anweisung zum Ändern
der Sprachsignalbandbreite und
- – allmähliches Ändern der
Bandbreite eines Sprachsignals, das in einer Multimodus-Sprachcodierungs-
oder Decodierungsanordnung verarbeitet wird, in Reaktion auf die
Anweisung zum Ändern
der Sprachsignalbandbreite.
-
Die
Erfindung betrifft außerdem
eine Sprachcodierungsanordnung, welche umfasst:
- – einen
Sprachsignaleingang und
- – einen
Multimodus-Sprachencoder zum Codieren von Sprachsignalen, die mit
dem Sprachsignaleingang gekoppelt sind, wahlweise mit einem ersten
Codierungsmodus, der mit einer ersten Bandbreite verknüpft ist,
oder einem zweiten Codierungsmodus, der mit einer zweiten Bandbreite verknüpft ist;
sie
ist dadurch gekennzeichnet, dass sie einen Block zur weichen Bandbreitenumschaltung
mit einem Eingang, der mit dem Sprachsignaleingang verbunden ist,
und einem Ausgang, der mit dem Multimodus-Sprachencoder verbunden
ist, umfasst, wobei der Block zur weichen Bandbreitenumschaltung
so beschaffen ist, dass er in Reaktion auf eine Anweisung zum Ändern der
Sprachsignalbandbreite allmählich
die Bandbreite eines Sprachsignals ändert, das mit dem Multimodus-Sprachencoder verbunden ist.
-
Die
Erfindung betrifft ferner eine Sprachdecodierungsanordnung, welche
umfasst:
- – einen
Sprachsignaleingang und
- – einen
Multimodus-Sprachdecoder zum Decodieren von Sprachsignalen, die
mit dem Sprachsignaleingang gekoppelt sind, wahlweise mit einer ersten
Decodierungsrate, die mit einer ersten Bandbreite verknüpft ist,
oder einer zweiten Decodierungsrate, die mit einer zweiten Bandbreite verknüpft ist;
sie
ist dadurch gekennzeichnet, dass sie einen Block zur weichen Bandbreitenumschaltung
mit einem Eingang, der mit dem Multimodus-Sprachdecoder verbunden
ist, und einem Ausgang umfasst, wobei der Block zur weichen Bandbreitenumschaltung
so beschaffen ist, dass er in Reaktion auf eine Anweisung zum Ändern der
Sprachsignalbandbreite allmählich die
Bandbreite eines Sprachsignals ändert,
das von dem Multimodus-Sprachdecoder
empfangen wird.
-
Außerdem betrifft
die Erfindung ein digitales Funktelefon und eine Transcodierungs-
und Datenratenanpassungseinheit eines Zellularfunksystems, welche
das charakteristische Merkmal aufweisen, dass sie eine Sprachcodierungsanordnung
und/oder eine Sprachdecodierungsanordnung der oben beschriebenen
Art umfassen.
-
Bei
einer überwiegenden
Mehrheit von Telefonanwendungen ist das über eine Verbindung transportierte
akustische Signal Sprache, so dass wir statt von allgemeiner akustischer
Bandbreite von der Sprachbandbreite sprechen können. Die Verwendung des Begriffes "Sprache" darf jedoch nicht
als eine Einschränkung
für die
Anwendbarkeit der Erfindung ausgelegt werden.
-
Ein
natürliches
Sprachsignal umfasst einen weiten Bereich von Frequenzkomponenten,
und bei einem Reduzieren der Sprachbandbreite werden unvermeidlich
einige dieser Komponenten entfernt, was unterschiedlich starke Verzerrungen
verursacht. Bei den existierenden Systemen kann während einer
aktiven Sprache ein Umschaltzeitpunkt auftreten, so dass sich die
Sprachbandbreite abrupt ändert.
Dies verursacht akustische Artefakte, da sich die Stärke und
Art der Verzerrung ebenfalls abrupt ändert. Gemäß der Erfindung wird ein Glättungszeitraum
eingeführt,
in welchem sich die Sprachbandbreite allmählich ändert. Das menschliche sensorische
System nimmt allmähliche Änderungen
der Sprachverzerrung nicht so leicht wahr wie abrupte Änderungen,
so dass der Glättungszeitraum
den akustischen Eindruck verbessert, welchen die Teilnehmer erhalten.
-
Die
Erfindung kann in einer Codiervorrichtung angewendet werden, wo
der Glättungszeitraum am
vorteilhaftesten vor dem eigentlichen Sprachencoder oder als Teil
desselben eingeführt
wird. Die Erfindung kann auch in einer Decodiervorrichtung angewendet
werden, wo der Glättungszeitraum
am vorteilhaftesten nach dem eigentlichen Sprachdecoder oder als
Teil desselben eingeführt
wird. In beiden Fällen
(Codiervorrichtung und Decodiervorrichtung) umfassen die Mittel
zum Einführen
des Glättungszeitraums
normalerweise einstellbare Verstärkungseinheiten
auf parallelen Signalpfaden, von denen jeder einen Teil des akustischen
Spektrums transportiert. Die einstellbaren Verstärkungseinheiten können durch
einstellbare Filter auf diesen Signalpfaden ersetzt oder ergänzt werden.
-
Was
größere Sprachbandbreiten
(oder akustische Bandbreiten) anbelangt, so sind die zusätzlichen
Frequenzkomponenten aufgrund der Art und des Betriebs des Kommunikationssystems,
in dem die Erfindung angewendet wird, möglicherweise nicht immer verfügbar. Daher
umfasst 5 die Anordnung gemäß der Erfindung vorteilhafterweise
einen Rauschgenerator, welcher verwendet werden kann, um fehlende
zusätzliche
Frequenzkomponenten zu ersetzen. Das Breitband-Sprachsignal (oder akustische Signal)
ist dann eine gewichtete Kombination aus Grundfrequenzkomponenten,
zusätzlichen
Frequenzkomponenten und Rauschen.
-
Die
neuen Merkmale, welche als für
die Erfindung charakteristisch angesehen werden, sind insbesondere
in den beigefügten
Ansprüchen
dargelegt. Die Erfindung selbst wird jedoch, sowohl was ihre Konstruktion
als auch was ihre Funktionsweise betrifft, zusammen mit weiteren
Aufgaben und Vorteilen der Erfindung am besten anhand der nachfolgenden Beschreibung
spezieller Ausführungsformen
verständlich,
wenn diese in Verbindung mit den beigefügten Zeichnungen studiert wird.
-
1 zeigt
das bekannte Konzept der Sprachübertragung
in einem Kommunikationssystem,
-
2 zeigt
einige beispielhafte bekannte Strukturen für Multiratencodierung,
-
3 zeigt
eine bekannte Anordnung für tandemfreien
Betrieb,
-
4 zeigt
ein Prinzip gemäß einer
Ausführungsform
der Erfindung,
-
5 zeigt
eine Anordnung zur weichen Bandbreitenumschaltung gemäß einer
Ausführungsform
der Erfindung,
-
6 zeigt
ein Verfahren gemäß einer
Ausführungsform
der Erfindung,
-
7 zeigt
ein mobiles Telekommunikationsendgerät gemäß einer Ausführungsform
der Erfindung, und
-
8 zeigt
Teile eines Basisstations-Untersystems gemäß einer Ausführungsform
der Erfindung.
-
Der
Inhalt von 1 bis 3 wurde
in der Beschreibung des Standes der Technik erläutert, so dass sich die folgende
Beschreibung der Erfindung und ihrer vorteilhaften Ausführungsformen
auf die 4 bis 8 konzentriert.
In den Zeichnungen bezeichnen gleiche Bezugszeichen ähnliche
Teile.
-
4 zeigt
ein Codier-Decodier-Vorrichtungspaar, das über einen Kommunikationskanal 210 verbunden
ist, welcher im Allgemeinen z.B. alle erforderlichen Kanalcodierungs-/Decodierungs- und
Sende-/Empfangs-Anordnungen umfasst. Die Blöcke 401 und 402 sind
Teile einer Codiervorrichtung, und die Blöcke 411 und 412 sind
Teile einer Decodiervorrichtung. Die Codier- und die Decodiervorrichtung
in 4 können
eine beliebige Kombination der Codier- und der Decodiervorrichtung
auf einem einzigen Signalpfad in z.B. einer Kommunikationsanordnung wie
jener in 3 darstellen.
-
Innerhalb
der Codiervorrichtung sind ein Block zur weichen Bandbreitenumschaltung 401 und ein
Multibandbreiten-Sprachencoder 402 vorhanden, wobei der
Letztere dem Sprachencoder im engeren Sinne 204 in 2 ähnlich sein
kann. Innerhalb der Decodiervorrichtung sind ein Multibandbreiten-Sprachdecoder 411 und
ein Block zur weichen Bandbreitenumschaltung 412 vorhanden,
wobei der Erstere dem Sprachdecoder im engeren Sinne 220 in 2 ähnlich sein
kann. Die Erfindung erfordert nicht, dass ein Block zur weichen
Bandbreitenumschaltung gleichzeitig sowohl in der Codiervorrichtung
als auch in der Decodiervorrichtung vorhanden ist; diese Blöcke erscheinen
in 4 nur deshalb beide, um die Anwendbarkeit der
Erfindung an mehreren Stellen der Signalübertragungskette zu veranschaulichen.
-
Der
Kommunikationskanal 210 umfasst unter anderem die Controller,
die dafür
verantwortlich sind, Befehle zur Bandbreitenänderung zu geben. In 4 veranschaulichen
die Steuerverbindungen 421 und 422 den Empfang
solcher Befehle sowohl an der Codiervorrichtung als auch an der
Decodiervorrichtung. Der Erfindung schränkt nicht die Form ein, in welcher
solche Befehle gegeben werden, obwohl es bei manchen Ausführungsformen
der Erfindung vorteilhaft ist, wenn wenigstens einige der Befehle
zur Bandbreitenänderung
in zwei Teilen kommen, so dass zuerst eine Warnung betreffs eines
bevorstehenden Befehls zur Bandbreitenänderung kommt und erst eine
gewisse Zeit später
der eigentliche Befehl.
-
Die
Aufgabe beider Blöcke
zur weichen Bandbreitenumschaltung 401 und 412 in 4 oder desjenigen
von diesen Blöcken,
welcher in einer praktischen Kommunikationssituation verwendet wird,
ist es, einen Glättungszeitraum
zwischen Bandbreitenänderungen
zu implementieren, so dass die Eingangs-Sprachbandbreite an der
Codiervorrichtung und/oder die Ausgangs-Sprachbandbreite an der
Decodiervorrichtung sich nicht abrupt ändert. Im Folgenden beschreiben
wir eine beispielhafte Hardwareimplementierung der Blöcke 401 und 412.
-
5 ist
ein Signalflussplan eines Blockes zur weichen Bandbreitenumschaltung,
welcher als der Block 401 in einer Codiervorrichtung oder
als der Block 412 in einer Decodiervorrichtung verwendet werden
kann, wenn einige Änderungen
im Signalfluss berücksichtigt
werden. Dicke Linien zwischen Funktionsblöcken bezeichnen Signalpfade
und dünne
Linien bezeichnen Steuerverbindungen. Ein Eingangssignal ist mit
dem Eingang eines Bandsplitters 502 verbunden. In einer
sendenden Mobilstation ist das Eingangssignal das ursprüngliche,
nicht codierte Sprachsignal, das von einem A/D-Wandler kommt, während in
einer empfangenden Mobilstation oder Uplink TRAU (wo TFO nicht verwendet
wird) das Eingangssignal der Ausgang eines Sprachdecoders ist. In
einer Downlink TRAU, wo TFO nicht verwendet wird, ist das Eingangssignal
die PCM-Abtastfolge, die über das
Netz kommt. Der Bandsplitter hat so viele Ausgänge, wie Frequenzbänder vorhanden
sind, welche separat bearbeitet werden müssen. Normalerweise ist die
Anzahl der Ausgänge
von dem Bandsplitter 502 gleich der Anzahl der Bandbreiten,
welche in der Sprachcodierungsanordnung, auf welche die Erfindung
angewendet wird, definiert worden sind. In dem beispielhaften Block
zur weichen Bandbreitenumschaltung von 5 sind zwei
Ausgänge des
Bandsplitters 502 vorhanden, und jeder von ihnen ist mit
dem Eingang einer eigenen einstellbaren Verstärkungseinheit 503 oder 504 verbunden.
Außerdem
ist eine dritte einstellbare Verstärkungseinheit 505 vorhanden,
deren Eingang über
ein erstes einstellbares Filter 507 mit dem Ausgang eines White-Noise-Generators 506 verbunden
ist.
-
Um
der Kürze
willen bezeichnen wir die Ausgänge
des Bandsplitters 502 als den Unterbandausgang und den
Oberbandausgang. Wenn wir den Block zur weichen Bandbreitenumschaltung
von 5 z.B. in den bekannten Kontext von zwei wählbaren
Sprachbandbreiten bringen, die in der Beschreibung des Standes der
Technik erwähnt
wurden, transportiert der Unterbandausgang denjenigen Teil des Eingangs-Sprachsignals,
welcher nur auf das 3,5-kHz-Frequenzband
entfällt,
und der Oberbandausgang transportiert denjenigen Teil des Eingangs-Sprachsignals,
welcher nur die Bandbreite von 3,5 kHz bis 7 kHz enthält. Der
Unterbandausgang ist mit der ersten einstellbaren Verstärkungseinheit 503 verbunden,
und der Oberbandausgang ist mit der zweiten einstellbaren Verstärkungseinheit 504 verbunden.
Die Ausgänge
der zweiten einstellbaren Verstärkungseinheit 504 und
der dritten einstellbaren Verstärkungseinheit 505 sind
mit den Eingängen
eines Kombinators 508 verbunden, während der Ausgang der ersten
einstellbaren Verstärkungseinheit 503 mit
dem Eingang eines zweiten einstellbaren Filters 509 verbunden
ist. Der Ausgang des besagten Kombinators 508 ist mit dem
Eingang eines dritten einstellbaren Filters 510 verbunden.
Die Ausgänge
des zweiten und dritten einstellbaren Filters 509 und 510 sind
beide mit den Eingängen
eines Bandkombinators 511 verbunden, welcher ein Spiegelbild
des Bandsplitters 502 ist. Der Ausgang des Bandkombinators 511 stellt
den Ausgang des gesamten Blockes zur weichen Bandbreitenumschaltung
von 5 dar.
-
In
einer sendenden Mobilstation oder einer Downlink TRAU (wo TFO nicht
verwendet wird) ist das Ausgangssignal das Eingangssignal für den eigentlichen
Sprachencoder. In einer empfangenden Mobilstation ist das Ausgangssignal
das Eingangssignal für
einen D/A-Wandler. In einer Uplink TRAU (wo TFO nicht verwendet
wird) ist das Ausgangssignal die PCM-Abtastfolge, die über das
Netz zu übertragen
ist.
-
Eine
Bandbreitenumschaltungs-Steuereinheit (Bandwidth Switching Control
Unit) oder BSCU 512 ist so geschaltet, dass sie Eingangsinformationen
vom Eingang und von den Ausgängen
des Blockes 502 empfängt,
sowie von gewissen anderen Teilen der Codier- oder Decodiervorrichtung;
die letztgenannte Art von Eingangsinformationen umfasst mindestens
die Befehle zum Ändern
der Bandbreiten, sie kann jedoch auch Sprachparameter umfassen,
welche das gesendete Sprachsignal in einer gewissen anderen Etappe
der Übertragung
charakterisieren. Die BSCU 212 ist außerdem so geschaltet, dass
sie die Funktion der Blöcke 503, 504, 505, 507, 509 und 510 steuert.
-
Die
Anordnung von 5 funktioniert wie folgt. Der
Bandsplitter 502 teilt das Eingangssignal in zwei Frequenzbänder; der
Begriff "Frequenzband" ist hier in einem
weiten Sinne zu verstehen, da im Gegensatz zu einem bestimmten zusammenhängenden Frequenzbereich
zwischen einer unteren Bandgrenze und einer oberen Bandgrenze jedes
Ausgangsfrequenzband, das von dem Bandsplitter 502 erzeugt wird,
verschiedene Frequenzkomponenten oder Unterbänder enthalten kann, die aus
verschiedenen Bereichen des Sprachspektrums entnommen sind. Eines
dieser Frequenzbänder,
das hier als Unterband bezeichnet wird, ist dasjenige, welches in
einem codierten Sprachsignal stets vorhanden sein sollte. Das andere
Frequenzband, welches hier als das Oberband bezeichnet wird, sollte
in dem codierten Sprachsignal nur dann vorhanden sein, wenn die breitere
von zwei wählbaren
Sprachbandbreiten verwendet wird.
-
Der
White-Noise-Generator 506 und das erste einstellbare Filter 507 erzeugen
zusammen ein so genanntes künstliches
Oberbandsignal, welches als ein Ersatz für ein fehlendes wirkliches
Oberbandsignal verwendet werden kann. Der Zweck des ersten einstellbaren
Filters 507 ist es, das vom White-Noise-Generator 506 kommende,
vollständig
willkürliche Rauschsignal
zu modifizieren, z.B. sein Spektrum so zu formen, dass das künstliche
Oberbandsignal einem angenommenen wirklichen Oberband-Sprachsignal ähneln würde, und/oder
jene Frequenzkomponenten zu entfernen, welche sich mit dem existierenden
Unterbandsignal überlappen
würden.
Der Prozess der Sprachcodierung, welcher nach dem Block zur weichen
Bandbreitenumschaltung von 5 in einer Codiervorrichtung
stattfindet, und der Prozess der Sprachdecodierung, welcher vor
dem Block zur weichen Bandbreitenumschaltung in einer Decodiervorrichtung
stattfindet, beruhen normalerweise auf dem Prinzip der linearen
prädiktiven
Codierung (Linear Predictive Coding, LPC), wo die Filterung auf eine
an sich bekannte Art und Weise entsprechend gewissen LPC-Koeffizienten
durchgeführt
wird. Dieselben LPC-Koeffizienten oder ein Teil davon können beim
Einstellen des ersten einstellbaren Filters 507 verwendet
werden. Stattdessen kann auch das Prinzip der LPC (oder kurz LP)
Filterexpolation angewendet werden, welches in einer ebenfalls anhängigen Patentanmeldung
Nummer FI 20000524 mit dem Titel "Speech decoder and a method for decoding speech" offenbart wird.
-
Der
Bandkombinator 511 kombiniert einfach die vom zweiten und
dritten einstellbaren Filter 509 und 510 kommenden
gefilterten Signale, um ein gemeinsames Ausgangssignal für den Block
zur weichen Bandbreitenumschaltung von 5 zu bilden.
-
Die
BSCU 512 setzt die Verstärkungsfaktoren der einstellbaren
Verstärkungseinheiten 503, 504 und 505 und
stellt die einstellbaren Filter 507, 509 und 510 ein.
Der Einfachheit halber wollen wir annehmen, dass der Verstärkungsfaktor
jeder einstellbaren Verstärkungseinheit
zwischen null und eins liegt, so dass bei einem Verstärkungsfaktor
eins das Signal unbeeinflusst durchläuft, bei einem Verstärkungsfaktor
null kein Signal durchläuft
und bei irgendeinem Verstärkungsfaktor
dazwischen die Amplitude (oder Leistung oder bestimmte andere Kennziffer)
des durchkommenden Signals der entsprechende Bruchteil von der des
unbeeinflussten Signals ist. Das zweite und das dritte einstellbare
Filter 509 und 510 filtern die Ausgänge der
ersten einstellbaren Verstärkungseinheit 503 bzw.
des Kombinators 508. Die Einstellbarkeit der Filter bedeutet,
dass der Durchlassbereich jedes Filters separat auf jeden Wert zwischen null
und der vollen Breite des Frequenzbandes, welches der höchsten Sprachcodierungsrate
entspricht, eingestellt werden kann. Die Funktionen der einstellbaren
Verstärkereinheiten 503, 504 und 505 einerseits
und die des zweiten und dritten einstellbaren Filters 509 und 510 andererseits
sind teilweise komplementär
zueinander, da beide die relativen Stärken des Unterband-, des Oberband-
und des künstlichen Oberbandsignals
am Ausgang des Blockes zur weichen Bandbreitenumschaltung 401 ändern. Es
ist nicht notwendig, sowohl einstellbare Verstärkungseinheiten als auch einstellbare
Filter zu verwenden; eines von beidem ist bereits ausreichend, um
die Funktionalität
der weichen Bandbreitenumschaltung gemäß der vorliegenden Erfindung
zu implementieren.
-
Das
Einstellen der Verstärkungsfaktoren
der einstellbaren Verstärkereinheiten 503, 504 und 505 und,
falls erforderlich, der Durchlassbereiche des zweiten und dritten
einstellbaren Filters 509 und 510 basiert auf
einer Analyse des Eingangssignals sowie der Ober- und Unterbandsignale,
welche die BSCU 512 über
die in 5 dargestellten Steuerinformations-Kopplungen
empfängt.
Die Auswirkung der Steuerinformationen auf den Einstellungsprozess wird
später
ausführlicher
erläutert.
Die BSCU einer Encoderanordnung kann auch gewisse Steuerinformationen
von dem Sprachencoder im engeren Sinne und die Sprachparameter,
die über
die in 4 mit 421 bezeichnete Verbindung kommen,
empfangen; diese Verbindungen sind in 5 durch
eine gestrichelte Linie dargestellt. Die BSCU einer Decoderanordnung
kann die Sprachparameter über
die Steuerverbindung vom Eingang des Blockes zur weichen Bandbreitenumschaltung
empfangen.
-
Eine "weiche" Änderung der Bandbreite gemäß der Erfindung
bedeutet einen allmählichen Wechsel
zwischen Codierungs- oder
Decodierungs-Modi, die durch die Verwendung unterschiedlicher Bandbreiten
gekennzeichnet sind. Ein Gegenstück
dazu ist eine "harte" oder abrupte Änderung, welche
mehr oder weniger ein charakteristisches Merkmal von Anordnungen
nach dem Stand der Technik ist. Je nachdem, ob sich der Block zur
weichen Bandbreitenumschaltung in einer sendenden Mobilstation,
einer Uplink TRAU., einer Downlink TRAU oder einer empfangenden
Mobilstation befindet, weisen die weichen und harten Änderungen
gewisse spezifische Merkmale auf. Im Folgenden erörtern wir
diese charakteristischen Merkmale für die verschiedenen Fälle.
-
1. Encoder, der von Breitband
auf Schmalband umschaltet
-
1A: Encoder in Uplink
MS oder Encoder in Downlink TRAU, harte Änderung
-
Wie
oben erwähnt,
bedeutet ein harter Wechsel von Breitband zu Schmalband, dass ein
Befehl zum Eintritt in einen Schmalband-Modus empfangen wird, bei
dem der Encoder sofort beginnen muss, Parameter zu erzeugen, welche
die Schmalband-Sprache repräsentieren.
Es können überhaupt keine
Breitbandinformationen von der Uplink MS oder Downlink TRAU gesendet
werden, nachdem sie den Befehl zur Modusumschaltung empfangen hat. Falls
gewünscht
wird, eine Glättung
durchzuführen, muss
dies im Decoder geschehen.
-
1B: Encoder in Uplink
MS, weiche Änderung
-
Dieser
Fall unterscheidet sich vom Fall 1A dadurch, dass entweder der Uplink
MS gestattet wird, die Ausführung
des Befehls zur Modusumschaltung zu verzögern, oder dass sie eine Vorwarnung
betreffs eines bevorstehenden Befehls zur Modusumschaltung empfängt, so
dass sie beginnen kann, die Änderung
zwischen den Bandbreiten zu glätten,
bevor der eigentliche Befehl eintrifft. Das Ergebnis ist ein diskreter
Glättungszeitraum,
in welchem der Block zur weichen Bandbreitenumschaltung im Encoder
der MS eine allmähliche Änderung
von Breitband zu Schmalband durchführt. Die Länge des Glättungszeitraums ist durch die
Erfindung nicht begrenzt; sie kann eine vordefinierte Konstante
oder dynamisch veränderbar
sein. Zum Prioritätsdatum
dieser Patentanmeldung wird angenommen, dass eine geeignete maximale
Länge für den Glättungszeitraum
eine Sekunde sein könnte.
Die allmähliche Änderung
wird in der Praxis auf die Weise erreicht, dass die Bandbreitenumschaltungs-Steuereinheit
oder BSCU 512 den Verstärkungsfaktor
des einstellbaren Verstärkungsblockes 504 allmählich auf
null verringert oder das einstellbare Filter 510 so einstellt,
dass es das obere Frequenzband allmählich stummschaltet. Einstellungen
der Funktionsweise der Blöcke 504 und 510 können sogar
gleichzeitig vorgenommen werden. In der Upload MS wurde der Breitband-Sprachcodierungsmodus
auf der Basis echter Codierung der Sprache in einem breiten Frequenzband
durchgeführt,
so dass die Blöcke 505, 506 und 507 nicht
verwendet wurden, und sie werden auch während des Glättungszeitraums
nicht verwendet. Während
des gesamten Glättungszeitraums
arbeitet die Sprachcodierungsanordnung in der Uplink MS weiterhin
im Breitband-Codierungsmodus, doch unmittelbar nach dem Glättungszeitraums
kann sie auf Betrieb im Schmalbandmodus umgeschaltet werden.
-
1C: Encoder in Downlink
TRAU, weiche Änderung
-
Dieser
Fall kann weiter in Unterfälle
unterteilt werden, je nachdem, ob die Downlink TRAU Breitband- oder
Schmalband-Eingangsinformationen über das Netz empfangen hat
und ob TFO verwendet wird oder nicht. In typischen existierenden
Netzen ist zum Prioritätsdatum
dieser Anmeldung das Empfangen von Breitband-Eingangsinformationen vom Netz gleichbedeutend
mit dem Verwenden von TFO, doch ist es möglich, ein Netz aufzubauen,
das Breitbandsprache sogar ohne TFO transportiert. Während der Verwendung
von TFO hat der Encoder in der Downlink TRAU keine aktive Funktion,
da das ursprüngliche
Breitband-Sprachsignal von der Uplink MS transparent über das
Netz gesendet wird. Der Encoder muss jedoch in Betrieb sein, um
eine Fast-Fallback-Position
zu garantieren, falls TFO ausfallen sollte. Der Ausgang des Breitbandencoders
in der Downlink TRAU wird nur verwendet, wenn TFO nicht funktionsfähig ist.
Gewisse Überlegungen,
die oben im Fall 1B dargelegt wurden, gelten auch hier: Der Downlink
TRAU wird entweder gestattet, die Ausführung eines Befehls zur Modusumschaltung
zu verzögern,
oder sie empfängt
eine Vorwarnung betreffs eines bevorstehenden Befehls zur Modusumschaltung,
so dass sie beginnen kann, die Änderung
zwischen den Bandbreiten zu glätten,
bevor der eigentliche Befehl eintrifft, die Länge des Glättungszeitraums kann konstant
oder dynamisch veränderbar sein,
und ein typischer maximaler Wert für die Dauer des Glättungszeitraums
wird mit einer Sekunde angenommen. Falls die Downlink TRAU Breitbandsprache
vom Netz empfangen hat, ist sogar die praktische Implementierung
des Glättungszeitraums ähnlich.
Falls die Downlink TRAU jedoch nur Schmalbandsprache vom Netz empfangen
hat, hat sie durch Verwendung der Blöcke 505, 506 und 507 ein
künstliches
Oberband erzeugt. In einem solchen Unterfall führt die BSCU 512 das
Glätten
durch, indem sie den Verstärkungsfaktor
des einstellbaren Verstärkungsblockes 505 allmählich auf
null verringert und/oder das einstellbare Filter 507 so
einstellt und/oder das einstellbare Filter 510 so einstellt,
dass das künstliche
obere Frequenzband allmählich
stummgeschaltet wird.
-
2. Encoder, der von Schmalband
auf Breitband umschaltet
-
2A: Encoder in Uplink
MS, harte oder weiche Änderung
-
Der
Sprachencoder wird auf Breitbandmodus eingestellt, unmittelbar nachdem
die Uplink MS den Befehl zur Modusumschaltung empfangen hat. Die
BSCU 512 ändert
jedoch den Verstärkungsfaktor der
einstellbaren Verstärkungseinheit 504 derart, dass
zum Zeitpunkt der Änderung
der Modi der Verstärkungsfaktor
null oder wenigstens klein ist, und dass er während des Glättungszeitraums
allmählich auf
den Wert erhöht
wird, welchen er bei aktivem Breitbandbetrieb haben sollte, z.B.
eins. Dieselbe Wirkung kann erreicht werden, indem das einstellbare
Filter 510 während
des Glättungszeitraums
allmählich
eingestellt wird, so dass zum Zeitpunkt der Änderung der Modi das Oberband
im Wesentlichen stummgeschaltet ist und am Ende des Glättungszeitraums
das Oberband eine sinnvolle Breite und Amplitude aufweist. Die Länge des
Glättungszeitraums bestimmt
die "Härte" der Änderung,
und sie kann entsprechend dem Inhalt der Eingangs-Sprachinformationen
gewählt
werden; daher ist die Steuerverbindung vom Eingang zur BSCU in 5 vorgesehen. Falls
zum Beispiel ein zeitweiliger stiller Zeitabschnitt im Sprachsignal vorhanden
ist, kann die Änderung sehr
schnell erfolgen, doch wenn ein sehr stimmloses Signal wie ein "s"-Ton in der Sprache vorhanden ist, ist
eine relativ langsame Änderung
vorteilhaft, um nicht ein deutlich hörbares Artefakt zu erzeugen.
Ein anderes oder zusätzliches
Kriterium, das bei der Wahl des Glättungszeitraums zu berücksichtigen
ist, ist die Anzahl und/oder Häufigkeit
der in letzter Zeit erfolgten Wechsel in beiden Richtungen zwischen Breitband-
und Schmalbandmodus. Eine Entsprechung, die ein subjektives Optimum
zwischen gewissen Anzahlen und/oder Häufigkeiten von in letzter Zeit
erfolgten Wechseln und jeweiligen Längen von Glättungszeiträumen darstellt, kann durch
Experimentieren gefunden werden.
-
2B: Encoder in Downlink
TRAU, harte oder weiche Änderung
-
Wie
im Fall 2A wird der Sprachencoder auf Breitbandmodus eingestellt,
unmittelbar nachdem die Downlink TRAU den Befehl zur Modusumschaltung
empfangen hat. Die BSCU 512 ändert den Verstärkungsfaktor
einer einstellbaren Verstärkungseinheit,
die das obere Frequenzband verarbeitet, derart, dass zum Zeitpunkt
der Änderung
der Modi der Verstärkungsfaktor
null oder wenigstens klein ist, und dass er während des Glättungszeitraums
allmählich auf
den Wert erhöht
wird, welchen er bei aktivem Breitbandbetrieb haben sollte, z.B.
eins. Die Wahl, ob die betreffende einstellbare Verstärkungseinheit Block 504 oder 505 ist,
hängt davon
ab, ob die Downlink TRAU Breitband- oder Schmalbandsprache vom Netz
empfängt.
Es kann auch das einstellbare Filter 510 verwendet werden,
um die allmähliche Änderung zu
implementieren, oder sogar das einstellbare Filter 507,
wenn ein künstliches
Oberband erzeugt werden soll. Die Länge des Glättungszeitraums kann entsprechend
dem Inhalt der Eingangs-Sprachinformationen und/oder der Anzahl
und/oder der Häufigkeit der
in letzter Zeit erfolgten Wechsel in beiden Richtungen zwischen
Breitband- und Schmalbandmodus gewählt werden. Die im Fall 1C
dargelegten Anmerkungen betreffs TFO gelten auch in diesem Fall.
-
3. Decoder, der von Breitband
auf Schmalband umschaltet
-
3A: Decoder in Uplink
TRAU, harte oder weiche Änderung
-
In
den existierenden Netzen kann die Uplink TRAU nur ein Breitband-Sprachsignal
während
des TFO senden, wobei der Decoder umgangen wird. Daher hat die Erfindung
in diesem Falle keine Auswirkung auf den Betrieb eines Decoders
in der Uplink TRAU, solange die Uplink TRAU den bekannten Prozeduren
im Hinblick auf TFO und Schmalbandübertragung folgt. Der Vollständigkeit
halber könnten
wir jedoch annehmen, dass es bei gewissen zukünftigen Netzlösungen möglich ist,
dass die Uplink TRAU ein Breitband-Sprachsignal auch ohne TFO sendet; in diesem
Fall müsste
der Decoder der Uplink TRAU wenigstens einige der Arbeitsgänge ausführen, die weiter
unten in Verbindung mit dem Decoder der Downlink MS beschrieben
sind.
-
3B: Decoder in Downlink
MS, harte Änderung
-
Eine
harte Änderung
bedeutet nun, dass nach einem Zeitraum des Empfangens von Breitbandsprache
der Sprachdecoder der Downlink MS plötzlich einen Befehl zum Ändern des
Decodierungsmodus erhält
und beginnt, nur ein Schmalband-Sprachsignal zu empfangen, ohne
dass ihm zuvor bekannt ist, dass die Änderung bevorsteht. Aufgrund
der Erfindung kann die Downlink MS nach wie vor das Ergebnis der Änderung
in der decodierten Sprache glätten,
indem sie ein künstliches
Oberbandsignal erzeugt, welches dann allmählich stummgeschaltet werden
kann. Unmittelbar nach der Änderung
erzeugt der Rauschgenerator 506 ein Rauschsignal, welches
in dem einstellbaren Filter 507 gefiltert wird, um sein
Spektrum korrekt zu formen. Ebenfalls unmittelbar nach der Änderung
ist der Verstärkungsfaktor
von Block 505 eins oder wenigstens relativ hoch, während der
Verstärkungsfaktor
von Block 504 null ist, da kein wirkliches Oberband-Sprachsignal vom
Bandsplitter 502 verfügbar
ist. Allmähliches Stummschalten
des künstlichen
Oberbandsignals bedeutet Verringern des Verstärkungsfaktors von Block 505 auf
null oder wenigstens auf einen relativ niedrigen Wert. Die Geschwindigkeit
der Verringerung des Verstärkungsfaktors
kann auch in diesem Fall nach vielfältigen Kriterien bestimmt werden;
z.B. dem Inhalt des Geschwindigkeitssignals oder der Anzahl und/oder
Häufigkeit
von in letzter Zeit erfolgten Änderungen
des Decodierungsmodus (siehe Fall 2A).
-
3C: Decoder in Downlink
MS, weiche Änderung
-
Dieser
Fall unterscheidet sich vom Fall 3B dadurch, dass der Decoder in
der Downlink MS eine Vorwarnung betreffs einer bevorstehenden Änderung des
Decodierungsmodus empfängt.
Wir wollen zunächst
annehmen, dass die Warnung früh
genug erfolgt, so dass die Änderung
vollständig
durchgeführt werden
kann, indem nur das eigentliche Sprachsignal bearbeitet wird. Wir
wollen ferner annehmen, dass ein Glättungszeitraum von X Millisekunden
verwendet wird, wobei X eine positive reelle Zahl ist, die der Download
MS bekannt ist. Unter diesen Annahmen kann der Verstärkungsfaktor
von Block 505 während
der gesamten Änderung
bei null (oder einem relativ niedrigen Wert) gehalten werden. Genau
X Millisekunden vor dem angekündigten
Zeitpunkt der Änderung
beginnt die BSCU 512, den Verstärkungsfaktor von Block 504 von
eins (oder einem relativ hohen Wert) in Richtung null (oder eines
relativ niedrigen Wertes) zu verringern, so dass der niedrigere
Wert zum Zeitpunkt der Änderung
erreicht wird und in den Schmalband-Decodierungsmodus eingetreten
werden kann. Wenn wir dann unsere erste Annahme abschwächen, können wir
allgemeiner definieren, dass während
der Dauer von X1 Millisekunden vor dem Zeitpunkt der Änderung
der Verstärkungsfaktor
von Block 504 verringert wird und der Verstärkungsfaktor von
Block 505 bei null (oder einem relativ niedrigen Wert)
gehalten wird, genau zum Zeitpunkt der Änderung die Rollen und Verstärkungsfaktoren
der Blöcke 504 und 505 vertauscht
werden und Block 506 beginnt, über die Blöcke 507, 505 und 508 dem
(künstlichen)
Oberband Rauschen zuzuführen,
und während
der Dauer von X2 Millisekunden nach der Änderung der Verstärkungsfaktor
von Block 505 auf null (oder einen relativ niedrigen Wert)
verringert wird. Im Einklang mit unserer zweiten Annahme ist X1
+ X2 = X, so dass sich dieser Fall auf Fall 3B reduziert, wenn X1
= 0 ist.
-
4. Decoder, der von Schmalband
auf Breitband umschaltet
-
4A: Decoder in Uplink
TRAU, harte oder weiche Änderung
-
Der
Decoder in der Uplink TRAU kann den Befehlen im Hinblick auf Breitband-
oder Schmalbandmodus gehorchen, doch in existierende Netzen muss
sein Ausgang unabhängig
vom Modus auf Schmalband (3,5 kHz) begrenzt werden, da ein breiteres
Band nicht über
ein PSTN übertragen
werden kann. Breitbandsprache kann während eines TFO übertragen
werden, doch danach wird der Decoder in der Uplink TRAU erneut umgangen.
Daher hat die Erfindung hier nicht mehr Wirkung als im Fall 3A.
Der Vollständigkeit
halber können dieselben Überlegungen
betreffs möglicher
zukünftiger
Netze angestellt werden.
-
4B: Decoder in Download
MS, harte oder weiche Änderung
-
Die Änderung
bedeutet nun, dass nach einem Zeitraum des Empfangens von Schmalbandsprache
der Sprachdecoder der Downlink MS einen Befehl zum Ändern des
Decodierungsmodus erhält und
beginnt, ein Breitband-Sprachsignal zu empfangen, wobei ihm zuvor
bekannt ist oder nicht bekannt ist, dass die Änderung bevorsteht. Die vorteilhafteste Ausführungsform
der Erfindung ist, die Änderung
des Decodierungsmodus zum Zeitpunkt der Änderung durchzuführen, jedoch
den Verstärkungsfaktor
von Block 504 zunächst
bei null (oder einem relativ niedrigen Wert) zu halten und ihn allmählich auf
eins (oder einen relativ hohen Wert) zu erhöhen. Die Geschwindigkeit der
Erhöhung
des Verstärkungsfaktors kann
vom Inhalt des Sprachsignals und/oder der Anzahl und/oder der Häufigkeit
der in letzter Zeit erfolgten Änderungen
des Decodierungsmodus abhängig gemacht
werden (siehe Fall 2A). Falls eine Vorwarnung betreffs einer bevorstehenden Änderung
eintrifft, wäre
es grundsätzlich
möglich,
das Oberband "im
Voraus hochzufahren",
indem in den Blöcken 506 und 507 ein
geformtes Rauschsignal erzeugt wird und der Verstärkungsfaktor
von Block 505 vor dem Zeitpunkt der Änderung allmählich erhöht wird,
während
der Verstärkungsfaktor
von Block 504 niedrig gehalten wird. Zum Zeitpunkt der Änderung
würden die
Rollen und Verstärkungsfaktoren
der Blöcke 504 und 505 dann
vertauscht. Jedoch besteht, wenn zuerst ein künstlich erzeugtes Oberband
und erst danach das wirkliche Oberband verwendet wird, normalerweise
eher eine Neigung zur Erzeugung akustischer Artefakte als bei Verwendung
des wirklichen Oberbandes allein.
-
6 ist
ein allgemeines Flussdiagramm, das einen Wechsel von der Verwendung
eines ersten Codierungs- oder Decodierungsmodus zu einem zweiten
Codierungs- oder Decodierungsmodus zeigt. Im Schritt 601 codiert
(decodiert) der Encoder (Decoder) unter Verwendung seines ersten
Modus, welcher in dem oben behandelten Kontext entweder der Schmalbandmodus
oder der Breitbandmodus ist. Schritt 602 ist eine Prüfung, ob
eine Vorwarnung betreffs einer bevorstehenden Änderung der Modi empfangen
worden ist. Falls eine solche Vorwarnung empfangen worden ist, wird
die allmähliche Änderung
der Bandbreiten gemäß Schritt 603 in
der mit dem Encoder (Decoder) verknüpften Einheit zur weichen Bandbreitenumschaltung
ausgelöst.
Der Schritt 604 ist eine Prüfung, ob ein Befehl zum Ändern der Modi
empfangen worden ist. Solange weder Vorwarnungen noch Befehle vorhanden
sind, durchläuft
die Codierungs- (Decodierungs-)
Anordnung zyklisch die Schritte 601, 602 und 604.
Wir nehmen hier an, dass, wenn eine Vorwarnung empfangen worden
ist, auch ein Befehl zum Ändern
der Modi empfangen wird; von Schritt 603 zu Schritt 604 zu
gelangen und zurück
zu Schritt 601 zu springen, würde offensichtlich einen Fehler
zur Folge haben.
-
Wenn
der Befehl zum Ändern
der Modi empfangen worden ist, prüft die Codierungs- (Decodierungs-)
Anordnung im Schritt 605, ob es möglich ist, die Ausführung des
Befehls zu verzögern.
Ist dies nicht möglich,
wird im Schritt 606 eine sofortige Änderung des Codierungs- (Decodierungs-)
Modus vorgenommen. Falls festgestellt wird, dass es möglich ist,
die Ausführung
des Befehls zu verzögern,
wird gemäß Schritt 607 eine
weiche Bandbreitenumschaltung oder "rampenförmige Änderung" ausgelöst, und Schritt 606 wird
erst nach der entsprechenden Verzögerung durchgeführt. Im
Schritt 608 wird geprüft,
ob eine bereits durchgeführte Änderung
des Codierungs- (Decodierungs-) Modus durch einen Schritt des "Post-Ramping" (nachträgliche rampenförmige Änderung)
ergänzt
werden kann, in dem die Einheit zur weichen Bandbreitenumschaltung
nach der Änderung
des Codierungs- (Decodierungs-)
Modus allmählich
die Bandbreite ändert.
Ist dies nicht möglich, wird
im Schritt 609 die Codierung (Decodierung) mit dem weiten
Codierungs- (Decodierungs-) Modus als solche fortgesetzt. Falls
festgestellt wird, dass ein "Post-Ramping" möglich ist,
wird es im Schritt 610 durchgeführt.
-
Die
oben beschriebenen Fälle
1A bis 4B entsprechen leicht unterschiedlichen Wegen durch dass Flussdiagramm
von 6 gemäß den folgenden
Listen von Schritten.
- 1A: 601-602-604-605-606-608-609.
- 1B und 1C, ohne Vorwarnung: 601-602-604-605-607-606-608-609.
- 1B und 1C, mit Vorwarnung: 601-602-603-604-605-606-608-609.
- 2A und 2B: 601-602-604-605-606-608-610-609.
- 3A, existierende Netze: 601-602-604-605-606-608-609.
- 3B: 601-602-604-605-606-608-610-609.
- 3C, ohne Vorwarnung: wie in 3B.
- 3C, mit Vorwarnung: 601-602-603-604-605-606-608-(610)-609.
- 4A, existierende Netze: 601-602-604-605-606-608-609.
- 4B: 601-602-604-605-606-608-610-609.
-
Das
Erscheinen von Schritt 610 in Klammern bedeutet den möglichen
Fall, in dem nicht genügend Zeit
vorhanden ist, um vor der Änderung
der Modi den Schritt der "vorausgehenden
rampenförmigen Änderung" (Pre-Ramping) abzuschließen, so
dass der unterbrochene Prozess der rampenförmigen Änderung als "Post-Ramping" fortgesetzt werden
muss.
-
Ein
Sprachencoder oder -decoder allein ist nicht ausreichend, um aus
der Idee der Erfindung Vorteile abzuleiten, die für einen
Anwender einleuchtend sind. 7 zeigt
ein digitales Funktelefon, bei dem eine Antenne 701 mit
einem Duplex-Filter 702 verbunden ist, welches wiederum
sowohl mit einem Empfangsblock 703 als auch einem Sendeblock 704 zum
Empfangen und Senden von digital codierter Sprache über eine
Funkschnittstelle verbunden ist. Der Empfangsblock 703 und
der Sendeblock 704 sind beide mit einem Steuerblock 707 zum
Transportieren empfangener Steuerinformationen bzw. zu sendender
Steuerinformationen verbunden. Außerdem sind der Empfangsblock 703 und
der Sendeblock 704 mit einem Basisbandblock 705 verbunden, welcher
die Basisbandfrequenz-Funktionen zum Verarbeiten von empfangener
Sprache bzw. zu sendender Sprache umfasst. Der Basisbandblock 705 und der
Steuerblock 707 sind mit einer Benutzerschnittstelle 706 verbunden,
welche normalerweise aus einem Mikrofon, einem Lautsprecher, einer
Tastatur und einem Display besteht (in 7 nicht
explizit dargestellt).
-
Ein
Teil des Basisbandblockes 705 ist in 7 detaillierter
dargestellt. Der letzte Teil des Empfangsblockes 703 ist
ein Kanaldecoder, dessen Ausgang aus kanaldecodierten Sprachrahmen
besteht, welche einer Sprachdecodierung, einer Sprachsynthese und
einer D/A-Umsetzung
unterzogen werden müssen.
Die vom Kanaldecoder erhaltenen Sprachrahmen werden zeitweilig in
einem Rahmenpuffer 710 gespeichert und daraus in die eigentliche
Sprachdecodierungsanordnung 711 eingelesen. Die Letztere
implementiert einen Sprachdecodierungsalgorithmus, der aus einem
Speicher 712 gelesen wird. Entsprechend einer vorteilhaften
Ausführungsform
der Erfindung umfasst die Sprachdecodierungsanordnung 711 nach
dem Sprachdecoder im engeren Sinne eine Einheit zur weichen Bandbreitenumschaltung
des in 5 dargestellten Typs, um eine weiche Bandbreitenumschaltung
zu implementieren, wenn das digitale Funktelefon von 7 als Downlink
MS fungiert.
-
Die
aufgezeichnete Sprache von dem Mikrofon wird in einem A/D-Wandler-Block 723 einer A/D-Umsetzung
unterzogen. Eine Sprachcodierungsanordnung 721 führt die
Sprachcodierung gemäß einem
Codierungsalgorithmus durch, der aus einem Speicher 722 gelesen
wird. Die codierten Sprachrahmen werden zeitweilig in einem Pufferspeicher 720 gespeichert,
aus welchem sie einem Kanalencoder im Sendeblock 704 zugeführt werden.
Gemäß einer
vorteilhaften Ausführungsform
der Erfindung umfasst die Sprachcodierungsanordnung 721 vor
dem Sprachencoder im engeren Sinne eine Einheit zur weichen Bandbreitenumschaltung
des in 5 dargestellten Typs, um eine weiche Bandbreitenumschaltung
zu implementieren, wenn das digitale Funktelefon von 7 als
Uplink MS fungiert.
-
Der
wahrnehmbare Vorteil, der mit der Erfindung verknüpft ist,
besteht in der verbesserten subjektiven Qualität von Sprache, welche von dem
digitalen Funktelefon von 7 gesendet
und/oder empfangen wird.
-
8 zeigt
eine Basisstation, bei der eine Empfangsantenne 801 mit
einem Empfangsblock 803 zum Empfangen von digital codierter
Sprache über
eine Funkschnittstelle verbunden ist und eine Sendeantenne 802 mit
einem Sendeblock 804 zum Senden von digital codierter Sprache über eine
Funkschnittstelle verbunden ist. Der Empfangsblock 803 und
der Sendeblock 804 sind beide mit einem Steuerblock 807 zum
Transportieren empfangener Steuerinformationen bzw. zu sendender
Steuerinformationen verbunden. Außerdem sind der Empfangsblock 803 und
der Sendeblock 804 mit einem Basisbandblock 805 verbunden,
welcher die Basisbandfrequenz-Funktionen zum Verarbeiten von empfangener
Sprache bzw. zu sendender Sprache umfasst. Der Basisbandblock 805 und
der Steuerblock 807 sind mit einer Netzschnittstelle 806 verbunden,
welche normalerweise einen Netz-Sendemultiplexer, einen Netz-Empfangsdemultiplexer
und eine Anzahl von Sende-, Empfangs-, Verstärkungs- und Filterkomponenten
umfasst (in 8 nicht explizit dargestellt).
-
Ein
Teil des Basisbandblockes 805 ist in 8 detaillierter
dargestellt. Der letzte Teil des Empfangsblockes 803 ist
ein Kanaldecoder, dessen Ausgang aus kanaldecodierten Sprachrahmen
besteht, welche einer Sprachdecodierung unterzogen werden müssen, bevor
sie zum Netz gesendet werden (unter der Annahme, dass TFO nicht
verwendet wird). Die vom Kanaldecoder erhaltenen Sprachrahmen werden
zeitweilig in einem Rahmenpuffer 810 gespeichert und daraus
in die eigentliche Sprachdecodierungsanordnung 811 eingelesen.
Die Letztere implementiert einen Sprachdecodierungsalgorithmus,
der aus einem Speicher 812 gelesen wird. Entsprechend einer
vorteilhaften Ausführungsform
der Erfindung umfasst die Sprachdecodierungsanordnung 811 nach
dem Sprachdecoder im engeren Sinne eine Einheit zur weichen Bandbreitenumschaltung des
in 5 dargestellten Typs, um eine weiche Bandbreitenumschaltung
zu implementieren, wenn die Basisstation von 8 als Uplink
TRAU fungiert.
-
Der
Rahmenzerlegungsblock 823 bereitet vom Netz empfangene
Sprachsignale für
die Codierung auf. Eine Sprachcodierungsanordnung 821 führt die
Sprachcodierung gemäß einem
Codierungsalgorithmus durch, der aus einem Speicher 822 gelesen wird
(unter der Annahme, dass TFO nicht verwendet wird). Die codierten
Sprachrahmen werden zeitweilig in einem Pufferspeicher 820 gespeichert,
aus welchem sie einem Kanalencoder im Sendeblock 804 zugeführt werden.
Gemäß einer
vorteilhaften Ausführungsform
der Erfindung umfasst die Sprachcodierungsanordnung 821 vor
dem Sprachencoder im engeren Sinne eine Einheit zur weichen Bandbreitenumschaltung
des in 5 dargestellten Typs, um eine weiche Bandbreitenumschaltung
zu implementieren, wenn die Basisstation von 8 als Downlink TRAU
fungiert.
-
Der
wahrnehmbare Vorteil, der mit der Erfindung verknüpft ist,
besteht in der verbesserten subjektiven Qualität von Sprache, welche von der
Basisstation von 8 verarbeitet wird.
-
Es
sind verschiedene Änderungen
und Modifikationen der oben beschriebenen Ausführungsformen möglich, ohne
den Schutzbereich der beigefügten
Ansprüche
zu verlassen. Zum Beispiel kann bei einer sehr einfachen Ausführungsform
der Erfindung der Block zur weichen Bandbreitenumschaltung völlig ohne
die einstellbare Verstärkungseinheit 503 und das
einstellbare Filter 509 in dem Verarbeitungszweig, der
das schmale (untere) Frequenzband verarbeitet, ausgeführt werden.
Dies ist möglich,
wenn die Amplitudenverhältnisse
und die relativen Spektralcharakteristiken der Signale in den verschiedenen Verarbeitungszweigen
allein mit den einstellbaren Elementen in dem Verarbeitungszweig
für das
höhere
Frequenzband mit einer akzeptablen Genauigkeit gesteuert werden
können.
Die in den abhängigen
Ansprüchen
aufgezählten
Merkmale sind frei kombinierbar, sofern nicht ausdrücklich etwas
anderes angegeben ist.