-
TECHNISCHES GEBIET
-
Die vorliegende Erfindung betrifft allgemein ein Verfahren zur Datenübertragung über ein Telekommunikationsnetzwerk und ein Verfahren zur Datenübertragung über einen Telekommunikationssprachkanal, wie beispielsweise einen CDMA- oder GSM-Sprachverkehrskanal.
-
Ein Verfahren gemäß dem Oberbegriff des Anspruchs 1 ist beispielsweise aus der
US 6 611 536 B1 bekannt geworden.
-
Ferner geht aus den Druckschriften
EP 1 096 701 A1 ,
US 2002/0 093 924 A1 und
WO 2005/088 998 A1 eine Modulation eines Datensignals mittels Modem, eine Kodierung mittels VOCODER und eine Übertragung über einen Sprachkanal eines Mobilfunknetzes hervor. Die
EP 1 096 701 A1 offenbart dabei eine Modulation im Modem mittels PSK, FSK bzw. MSK, die
US 2002/0 093 924 A1 mittels FSK und die
WO 2005/088 998 A1 mittels ASK.
-
HINTERGRUND DER ERFINDUNG
-
Verdrahtete Telefonsysteme wurden ursprünglich entworfen, um Sprache zu übertragen, um Konversationen über lange Distanzen zu ermöglichen. Später wurden Fernsprechsysteme zu einem primären Medium zum Übertragen von nicht nur Sprache, sondern auch Daten, die keine Sprache umfassen, wie beispielsweise bei einer Verwendung von Faxgeräten, die Bildinformationen über die Telefonleitungen übertragen, oder von Modems, die digitale Daten verschiedener Formen (Text, binär ausführbare Dateien, Bild- oder Videodateien) über dieselben Telefonleitungen austauschen.
-
Heutzutage werden sowohl für Sprach- als auch für Datenübertragungszwecke viel häufiger zellulare und andere drahtlose Kommunikationssysteme verwendet. Der größte Teil der heutzutage weltweit verwendeten zellularen Kommunikation verwendet entweder die GSM- (einschließlich UMTS) oder die CDMA-Kommunikationssysteme (IS-95 oder CDMA2000). Diese Systeme übertragen Sprachdaten über einen Sprachverkehrskanal unter Verwendung einer modulierten Trägerwelle. Beispielsweise verwendet 2G GSM eine GMSK-Modulation und verwendet IS-95 CDMA eine PSK-Modulation. Vor dem Modulieren der Sprachdaten für eine drahtlose Übertragung durchläuft die Spracheingabe einen Sprachkomprimierungsschaltkreis, wie beispielsweise einen Vocoder, um die Spracheingabe in eine kleinere Menge von Daten zu komprimieren. Dies reduziert die Menge von Sprachdaten, die über das drahtlose Netzwerk übertragen werden müssen, wodurch ermöglicht wird, dass eine kleinere Bitrate verwendet wird und eine größere Anzahl von Benutzern dasselbe Kommunikationssystem teilt.
-
Es wurden verschiedene Vocoder-Techniken vorgeschlagen und verwendet. Die gängigsten sind verschiedene Formen von Linear Predictive Coding (LPC); beispielsweise verwendet 2G GSM einen RPE-LPC-Sprach-Codec, während IS-95 CDMA einen CELP-Codec mit variabler Rate verwendet. Diese vorhersagenden Komprimierungstechniken sind speziell für eine Sprachcodierung entworfen und sind somit entworfen, um Geräusche und andere Komponenten, die keine Sprache umfassen, herauszufiltern. Als ein Ergebnis kann die Übertragung digitaler Daten (wie beispielsweise von ASCII-Text, Bytecodes, Binärdateien) problematisch sein, da die Vocoder-Verarbeitung die digitalen Daten beschädigen kann, sodass sie am empfangenden Ende der Übertragung nicht wiederhergestellt werden können. Beispielsweise ist der kürzlich eingeführte QualcommTM 4G Vocoder eine CDMA2000-Einrichtung, die eine zeitabhängige, nicht lineare Transferfunktion aufweist, die, während sie für eine Sprachcodierung akzeptabel ist, eine erhebliche Verzerrung bewirken kann, wenn versucht wird, digitale Daten über den Vocoder zu übertragen.
-
Der 4G Vocoder verwendet den 3gpp2-Standard-basierten EVRC-B-Codec mit einer vollen Rate von 9,6 kbps. Der Codec unterstützt auch niedrigere Bitraten, die eine halbe Rate von 4,8 kbps und eine achtel Rate von 1,2 kbps umfassen. Diese niedrigeren Raten werden verwendet, wenn der Vocoder ermittelt, dass die volle Rate nicht notwendig ist, um die Tonsignale, die er empfängt, angemessen zu übertragen. Beispielsweise wird ein Hintergrundgeräusch typischerweise mit der achtel Rate übertragen. Der EVRC-B-Vocoder verwendet diese verschiedenen Raten, um eine Zielrate zu erreichen, die durch den drahtlosen Träger gesteuert werden kann, und folglich kann dieser Gesamtcodierungsprozess es erschweren, Daten, die keine Sprache umfassen, über den Vocoder zu senden.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Die vorliegende Erfindung stellt ein Verfahren einer Datenübertragung unter Verwendung eines drahtlosen Kommunikationsnetzwerks bereit, das die Merkmale des Anspruchs 1, des Anspruchs 2 oder des Anspruchs 4 aufweist.
-
Vorzugsweise wird eine differentielle binäre Phasenumtastungs-Codierung verwendet, obwohl eine Quadratur- und andere DPSK-Codierungen in Abhängigkeit von der sich ergebenden Bitfehlerrate für eine bestimmte Anwendung verwendet werden können.
-
Gemäß einem anderen Aspekt der Erfindung wird ein Verfahren zum Übertragen digitaler Daten über ein drahtloses Telekommunikationsnetzwerk unter Verwendung eines Sprach-Codierers bereitgestellt, das die Merkmale des Anspruchs 6 oder des Anspruchs 8 aufweist.
-
Gemäß noch einem anderen Aspekt der Erfindung wird ein Verfahren zum drahtlosen Übertragen digitaler Daten unter Verwendung eines EVRC-B-Vocoders bereitgestellt, das die Merkmale des Anspruchs 9 oder des Anspruchs 10 aufweist.
-
Außerdem wird ein Verfahren zum Übertragen digitaler Daten über ein Telekommunikationsnetzwerk mit den Merkmalen des Anspruchs 12 bereitgestellt.
-
KURZBESCHREIBUNG DER ZEICHNUNGEN
-
Bevorzugte beispielhafte Ausführungsformen der Erfindung werden hierin nachfolgend in Verbindung mit den beigefügten Zeichnungen beschrieben, in denen gleiche Bezugszeichen gleiche Elemente bezeichnen, und wobei:
-
1 ein Blockdiagramm ist, das ein gemäß der Erfindung aufgebautes elektronisches Kommunikationssystem zeigt;
-
2 zwei Darstellungen bildet, die eine BPSK-Codierung eines CDMA-Daten-Frames mit einer Bitrate von 10 Bit/Frame zeigen;
-
3 eine Darstellung eines BPSK-Basisbands wie in 2 ist, jedoch mit einer Bitrate von 12 Bit/Frame;
-
4 einen abgetasteten Vocoder-Ausgang unter Verwendung der BPSK-Wellenform von 3 zeigt;
-
5 einen unter Verwendung eines Zufallsbitmusters mit 10 Bit/Frame durch eine BPSK modulierten 500 Hz-Träger zeigt;
-
6 ein abgetasteter Vocoder-Ausgang unter Verwendung der BPSK-Wellenform von 5 ist;
-
7 ein Blockdiagramm eines BPSK-Demodulators ist;
-
8 eine Konstellationsdarstellung von beispielhaften BPSK-demodulierten Daten ist;
-
9 eine Übersicht über das durch EVRC-B-Vocoder verwendete Sprachklassifizierungs- und Ratenermittlungsschema zeigt;
-
10 einen unter Verwendung eines Zufallsbitmusters mit 10 Bit/Frame durch eine DBPSK modulierten 500 Hz-Träger zeigt;
-
11 eine Konstellationsdarstellung der abgetasteten DBPSK-demodulierten Daten von 10 zeigt;
-
12 eine Konstellationsdarstellung von abgetasteten DQPSK-demodulierten Daten zeigt;
-
13 ein Blockdiagramm eines BPSK-Demodulators ist, der eine Costas-Schleife zur Phasenverfolgung verwendet;
-
14 ein Flussdiagramm eines Multi-DPSK-Modulationsschemas ist;
-
15 zwei DBPSK-modulierte Trägersignale mit verschiedenen Frequenzen und das sich ergebende zusammengesetzte modulierte Trägersignal zeigt, das durch Verwenden des Prozesses von 14 erhalten wird;
-
16 ein Blockdiagramm einer kombinierten FSK-DBPSK-Modulationstechnik ist; und
-
17 ein Flussdiagramm einer kombinierten ASK-DBPSK-Modulationstechnik ist.
-
DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
-
Bezug nehmend auf 1 ist ein elektronisches Kommunikationssystem 10 gezeigt, das gemäß der Erfindung aufgebaut ist. Das Kommunikationssystem 10 umfasst ein herkömmliches zellulares Kommunikationsnetzwerk mit einem Sprachverkehrskanal, der für eine Zweiwegeübertragung von Sprachdaten zwischen Mobiltelefonen verwendet wird. Das Kommunikationssystem 10 umfasst auch die Fähigkeit, den Sprachkanal des zellularen Systems zu verwenden, um digitale Daten auszutauschen, die eine andere Information als Sprache oder anderen Audioinhalt enthalten. Wie es später ausführlicher erläutert wird, wird diese Datenübertragung zumindest teilweise unter Verwendung einer differentiellen Phasenumtastungs-Modulation einer oder mehrerer Audiofrequenzträgerwellen unter Verwendung der digitalen Daten durchgeführt. Dieser Ansatz ermöglicht eine Datenübertragung über den gleichen Sprachkanal, der für eine Sprachübertragung verwendet wird, und ermöglicht mit einer geeigneten Auswahl von Trägerfrequenz und Bitrate, dass diese Datenübertragung mit einer Bitfehlerrate durchgeführt wird, die für die meisten Anwendungen akzeptabel ist.
-
Das Kommunikationssystem 10 umfasst allgemein ein zellulares Kommunikationsnetzwerk 12, das mit einem Bodentelephonienetzwerk 14 verbunden ist, die zusammen verwendet werden, um eine Sprach- und Datenkommunikation zwischen einem Personenkraftwagen 20 und einem Call Center 40 bereitzustellen. Das Fahrzeug 20 weist ein fahrzeugeigenes Elektroniksystem auf, von dem ein Teil bei 22 gezeigt ist. Das Elektroniksystem 22 weist eine Telematikeinheit 23, die die Komponenten umfasst, die normalerweise in einer zellularen Kommunikationseinrichtung zu finden sind, wie beispielsweise einen CDMA-kompatiblen Chipsatz 24, und eine Antenne 26 auf, die die Verwendung des zellularen Netzwerks 12 ermöglicht, um einem Fahrzeuginsassen zu ermöglichen, unter Verwendung eines Lautsprechers 28 und eines Mikrofons 30 Konversationen zu führen. Diese Komponenten der Telematikeinheit 23 können auf herkömmliche Weise realisiert werden, wie es für Fachleute ersichtlich sein wird. Abgesehen von einer Eingabe des Mikrofons 30 umfasst das fahrzeugeigene System 22 auch mindestens einen Druckknopf 32, der verwendet werden kann, um eine Sprachübertragung zu einem menschlichen Berater 42 zu initiieren, der sich an dem Call Center 40 befindet.
-
Gemäß 4G CDMA-Systemen werden Sprachdaten von sowohl dem Fahrzeuginsassen (nicht gezeigt), als auch dem menschlichen Berater 42 unter Verwendung eines Vocoders codiert, um die Sprache vor einer drahtlosen Übertragung über den Sprachverkehrskanal über den Mobilfunkturm 16 zu komprimieren. Sobald die codierte Sprache über das drahtlose Netzwerk empfangen wird, wird sie dann durch den Vocoder für den Hörer decodiert. Der Vocoder ist in dem Chipsatz 24 sowie in einem CDMA-kompatiblen Modul 18 umfasst, das sich in dem Basisgerät an dem Mobilfunkturm 16 befindet. Obwohl verschiedene Komprimierungs-Codecs verwendet werden können, ist der 4G-Vocoder bei der gezeigten Ausführungsform als ein zeitabhängiges nicht lineares Filter realisiert. Es sind solche verschiedenen Codecs weithin bekannt, die Linear Predictive-Techniken verwenden; beispielsweise ein RPE-LPC-Codec oder ein CELP-Codec mit fester oder variabler Rate. Jeder geeignete Codec (egal ob Linear Predictive oder nicht) kann in dem System 10 von 1 verwendet werden.
-
Zusätzlich zu der typischen Sprachdatenübertragung über den Sprachverkehrskanal ermöglicht das Kommunikationssystem 10 eine Datenübertragung über denselben Sprachverkehrskanal und über den Vocoder 18, 24. Dies wird erreicht, indem an jeder Vocoder-Seite ein Modem verwendet wird; d. h., es wird ein erstes Modem 34, das in dem fahrzeugeigenen Fahrzeugkommunikationssystem 22 umfasst ist, und ein zweites Modem 44 verwendet, das sich an dem Call Center 40 befindet. Diese Modems können denselben Aufbau und denselben Betrieb aufweisen, so dass nur das Modem 34 beschrieben wird, und es sei angemerkt, dass die Beschreibung des Modems 34 gleichermaßen auf das Modem 44 zutrifft. Wie in 1 gezeigt, kann die Telematikeinheit 23 den CDMA 4GV-Chipsatz 24 zwischen dem Modem 34 und den Telefonieeinrichtungen 28–32 umschalten oder multiplexen, so dass das zellulare Kommunikationsnetzwerk 12 für entweder für eine Sprach- oder eine Datenübertragung oder beides, sogar während desselben Anrufs, verwendet werden kann.
-
Ungeachtet dessen, ob der zellulare Anruf an dem Fahrzeug 20 oder dem Call Center 40 initiiert wird, kann das sendende Modem einen vordefinierten Ton (z. B. 2225 Hz) oder eine Reihe von Tönen verwenden, um das empfangende Modem auf die angeforderte Datenübertragung hinzuweisen, und die verschiedenen Attribute der Datenverbindung können dann durch die zwei Modems ausgehandelt werden. Um eine Datenübertragung über den Sprachkanal zu ermöglichen, wendet das Modem eine differentielle Phasenumtastungs-Codierung (DPSK-Codierung) an, um die digitalen Daten, die übertragen werden, in DPSK-Daten umzuwandeln, die erfolgreich über den Vocoder 18, 24 und über den Sprachverkehrskanal des zellularen Netzwerks 12 gesendet werden können. Bei den verschiedenen gezeigten Ausführungsformen wird eine oder werden mehrere bestimmte Formen einer DPSK-Codierung verwendet; beispielsweise eine differentielle binäre Phasenumtastungs-Modulation (DBPSK-Modulation). Wie es nachstehend weiter erläutert wird, wird ein Codieren der digitalen Daten durch das Modem 34 unter Verwendung eines oder mehrerer Trägersignale realisiert, die unter Verwendung eines DPSK-Codierers/Decodierers 36 mit den Daten moduliert werden.
-
Wie in 1 gezeigt, können das Modem 34 und sein Codierer/Decodierer 36 unter Verwendung von Software realisiert sein, die an dem Telematikmikroprozessor 35 läuft. Diese Software kann in dem Telematikspeicher 37 gespeichert sein. Andere alternative Realisierungen werden für Fachleute ersichtlich werden; beispielsweise könnte das Modem 34 in dem 4GV-Chipsatz 24 umfasst sein, oder das Modem kann unter Verwendung eines dedizierten IC oder einer anderen Hardwarekomponente realisiert sein, oder die Modemsoftware könnte an dem Prozessor 35 selbst oder an einem anderen nicht gezeigten Speicher gespeichert sein.
-
An dem Fahrzeug 20 können die DPSK-codierten und über das Modem 34 gesendeten digitalen Daten durch die Telematikeinheit 23 von einem oder mehreren Fahrzeugsystemmodulen (VSMs) 38 über ein Fahrzeugnetzwerk 39 erhalten werden. Diese Module 38 können jedes Fahrzeugsystem sein, für das eine Informationsübertragung zu oder von dem Call Center 40 oder einer anderen entfernten Einrichtung oder einem Computersystem gewünscht ist. Beispielsweise kann ein VSM 38 ein Diagnosesystem sein, das Diagnosefehlercodes oder andere Diagnoseinformationen an das Call Center 40 liefert. Als ein weiteres Beispiel kann das VSM 38 ein GPS-fähiges Navigationssystem sein, das Koordinaten oder andere solche Informationen, die den Ort des Fahrzeugs betreffen, in das Call Center hochlädt. Daten können auch von dem Call Center (oder einer anderen entfernten Einrichtung oder einem anderen Computersystem) an das Fahrzeug gesendet werden. Beispielsweise können, wenn das VSM 38 ein Navigationssystem ist, neue Karten oder andere Richtungsinformationen oder Informationen über Punkte von Interesse auf das Fahrzeug heruntergeladen werden. Als ein weiteres Beispiel kann ein VSM 38 ein Infotainment-System sein, auf das neue Musik oder Videos heruntergeladen und für eine spätere Wiedergabe gespeichert werden können. Ferner umfasst der Begriff ”digitale Daten”, wie er hierin verwendet wird, nicht nur Informationen, sondern auch ausführbaren Code, so dass neue Programme über den Sprachverkehrskanal von einem Server oder einem anderen Computer auf das Fahrzeug heruntergeladen werden können. Fachleute werden andere solche VSMs 38 und andere Typen von digitalen Daten kennen, für die eine Kommunikation zu und/oder von dem Fahrzeug 20 gewünscht ist.
-
Das Fahrzeugnetzwerk 39 kann als jedes geeignete Netzwerk realisiert sein, wie beispielsweise ein Controller Area Network (CAN), ein Media Oriented System Transfer (MOST), ein Local Interconnection Network (LIN), ein Ethernet, ein Local Area Network (LAN), und kann geeignete Verbindungen und Protokolle verwenden, wie beispielsweise jene, die sich nach ISO-, SAE- und IEEE-Standards und -Spezifikationen richten. Es kann auch ein separates Infotainment-Netzwerk (nicht gezeigt) für einen Zugriff durch die Telematikeinheit 23 auf ein Fahrzeugradiosystem umfasst sein, in welchem Fall der Lautsprecher 28 nicht vorhanden sein müsste und stattdessen der/die Fahrzeugradiosystemlautsprecher für eine Audioausgabe während Konversationen über das Kommunikationssystem 12 verwendet werden könnten).
-
Ein Bodennetzwerk 14 kann ein herkömmliches bodenbasiertes Telekommunikationsnetzwerk sein, das mit einem oder mehreren Festnetztelefonen verbunden ist und das drahtlose Trägernetzwerk 12 mit dem Call Center 40 verbindet. Beispielsweise kann das Bodennetzwerk 14 ein Fernsprechnetz (PSTN) und/oder ein Internetprotokoll-Netzwerk (IP-Netzwerk) umfassen, wie es von Fachleuten verstanden wird. Natürlich könnten ein oder mehrere Segmente des Bodennetzwerks 14 durch die Verwendung eines verdrahteten Standardnetzwerks, eines Faser- oder eines anderen optischen Netzwerks, eines Kabelnetzwerks, von Stromleitungen, anderen drahtlosen Netzwerken, wie beispielsweise Wireless Local Area Networks (WLANs) oder Netzwerken, die einen drahtlosen Breitbandanschluss (BWA) bereitstellen, oder jede Kombination hiervon realisiert sein. Ferner muss das Call Center 40 nicht über das Bodennetzwerk 14 verbunden sein, sondern könnte ein drahtloses Telefoniegerät umfassen, so dass es direkt mit dem drahtlosen Netzwerk 12 kommunizieren kann.
-
Das Call Center 40 umfasst nicht nur den menschlichen Berater 42 und das Modem 44, sondern auch verschiedene andere Komponenten. Es umfasst einen PBX-Schalter 46, um eingehende Anrufe entweder zu einem oder mehreren Telefonen 48 für eine Sprachkommunikation oder zu dem Modem 44 für eine Datenübertragung weiterzuleiten. Das Modem 44 kann selbst mit verschiedenen Einrichtungen, wie beispielsweise einem Server 50, der Informationsdienste und einen Datenspeicher bereitstellt, sowie einem Computer verbunden sein, der durch den menschlichen Berater 42 verwendet wird. Diese Einrichtungen können entweder über ein Netzwerk 52 mit dem Modem 44 verbunden sein, oder können alternativ mit einem spezifischen Computer verbunden sein, an dem sich das Modem 44 befindet. Die verschiedenen Komponenten von 1 umfassen einige, die herkömmlich sind, und andere, die auf der Grundlage der hierin enthaltenen Beschreibung und des Wissens von Fachleuten realisiert sein können. Beispielsweise sind, obwohl die Modems 34, 44 und ihr DPSK-Codierer/Decodierer keine herkömmlichen Komponenten sind, Techniken zum Realisieren einer DSPK-Codierung und -Decodierung bekannt und können diese durch Fachleute unter Verwendung von Komponenten wie beispielsweise DSPs und ASICs realisiert werden. Ähnlich sind die anderen Merkmale, die benötigt werden, um die Modems 34, 44 zu realisieren, Fachleuten weithin bekannt.
-
Nun auf 2–8 Bezug nehmend, werden verschiedene Phasenumtastungs-Ansätze (PSK-Ansätze) und -Ergebnisse beschrieben. Da der Vocoder, der für eine zellulare Kommunikation verwendet wird, Frequenzen herausfiltert, die über denen liegen, die für eine Sprachübertragung benötigt werden, ist eine erfolgreiche Datenübertragung über den zellularen Sprachverkehrskanal auf ein Verwenden von Frequenzen von einigen Kilohertz oder niedriger als einige Kilohertz beschränkt. Somit sollte, wenn Datenmodulationstechniken verwendet werden sollen, die Trägerfrequenz auf jene Frequenzen beschränkt sein, die innerhalb dieser oberen Frequenz liegen. 2 umfasst zwei Darstellungen eines Zufallsbitmusters, das für eine binäre Phasenumtastungs-Modulation (BPSK-Modulation) verwendet wird, wobei die erste Darstellung (a) die Basisband-BPSK ist, die das Zufallsbitmuster 0011101011 darstellt, und die zweite Darstellung (b) eine unter Verwendung der BPSK mit dem Bitmuster modulierte 500 Hz-Trägerfrequenz ist. Bei einer Abtastrate von 160 Abtastwerten mit einer Abtastfrequenz von 8 kHz stellen diese zehn Bit einen typischen 20 ms-Daten-Frame dar, wie er beispielsweise bei CDMA verwendet wird. Zum Vergleich ist 3 eine ähnliche BPSK-Basisbandwellenform, jedoch mit einer Bitrate von 12 Bit/Frame, wobei die Wellenform zweieinhalb Daten-Frames zeigt. Diese Wellenform von 3 ist in 4 gezeigt, nachdem sie durch den Vocoder gesendet wurde, ohne zuerst zum Modulieren eines Audiofrequenzträgers verwendet zu werden. Die durch den Vocoder durchgeführte Filterung bewirkt, dass die digitalen Daten von dem Ausgang des Vocoders (4) nicht wieder hergestellt werden können. Wenn eine BPSK-Modulation einer 500 Hz-Trägerfrequenz verwendet wird (5), behält der resultierende Ausgang des Vocoders (6) zumindest einen gewissen Teil der ursprünglichen Daten bei.
-
Auf 5 ausführlicher Bezug nehmend, weist die modulierte 500 Hz-Wellenform von 5 eine Bitrate von 10 Bit/Frame auf, wobei das folgende Zufallsbitmuster verwendet wird:
0100001100001001101111001.
-
Der sich ergebende Vocoder-Ausgang von 6 kann dann decodiert werden, indem die Phaseninformation extrahiert wird, um die Wellenform zurück in die ursprünglichen digitalen Daten aufzulösen. Dies kann auf eine bekannte Weise wie die, die in 7 gezeigt ist, durchgeführt werden, bei der die Vocoder-Wellenform mit einer Sinuswellenform multipliziert wird und das Ergebnis summiert wird, um I-Achsendatenpunkte zu erhalten, und auch separat mit einer Kosinuswellenform multipliziert wird, um eine Q-Ahaseninformation zu erhalten. Techniken einer digitalen Verarbeitung zum Zerlegen der Vocoder-Wellenform gemäß 7 und Erzeugen des resultierenden Bitmusters hieraus sind Fachleuten weithin bekannt. Eine beispielhafte Konstellationsdarstellung von beispielhaften Bitmustern, die den Vocoder unter Verwendung einer BPSK durchlaufen haben, ist in 8 gezeigt. Wie dieses Konstellationsdiagramm zeigt, erhält die Verwendung einer BPSK durch den Vocoder die ursprünglichen digitalen Daten nicht gut aufrecht und weist als ein Ergebnis eine Bitfehlerrate (BER) auf, die für die meisten Anwendungen inakzeptabel hoch ist. Der Informationsverlust bei der Verwendung der BPSK scheint das Ergebnis der nicht linearen, zeitabhängigen Attribute des Vocoders zu sein, die Phasendrifts in das Signal einführen können, das durch den Vocoder geführt wird.
-
Abgesehen von dem Informationsverlust als ein Ergebnis dieser ersichtlichen Phasendrift kann eine erfolgreiche Übertragung der digitalen Daten durch den Vocoder auch stark von der Codierungs- und Übertragungsrate abhängen, die durch den Vocoder verwendet wird. Für 4G-Vocoder, wie beispielsweise Qualcomm's®, die einen EVRC-B-Codec verwenden, der der 3GPP2 C.S0014-B Ver. 1.0-Spezifikation folgt (verfügbar unter www.3gpp2.org), werden verschiedene Raten für verschiedene Typen von Sprache, Tönen und Hintergrundgeräusch verwendet. Allgemein codiert und überträgt der Vocoder eingehende Daten mit einer Rate, die durch Klassifizieren des eingegebenen Signals in Kategorien ermittelt wird, die verschiedene Typen oder Teile von Sprache darstellen. Diese Kategorien umfassen stimmhaft, stimmlos und transient sowie Stille und aufwärts- und abwärtstransient. Zuerst in Abhängigkeit von dieser Klassifizierung, jedoch auch von zusätzlichen Tests, wählt der Vocoder einen bestimmten Betriebsmodus, in dem er ein bestimmtes Codierungsschema und eine bestimmte Rate verwendet, um die empfangenen Daten zu codieren und zu übertragen. Allgemein wird dieser Prozess auf einer Frame-für-Frame-Grundlage ausgeführt, wobei jeder Frame 20 ms von mit 8 kHz abgetasteten Daten entspricht. Der Prozess ist entworfen, um für Sprachkommunikationen eine genaue Wiedergabe der Sprache bereitzustellen, während andere Kommunikationsanforderungen (wie beispielsweise Rückruftöne) ermöglicht werden, und versucht wird, die Bandbreitenverwendung zu minimieren. Dieser Prozess kann Datenübertragungen über den Sprachkanal jedoch stark blockieren, da er zu einer Übertragung mit einer geringeren als der vollen Rate führen kann. Ohne eine Übertragung mit voller Rate kann es schwierig oder sogar unmöglich sein, die digitalen Daten über den EVRC-B-Vocoder mit einer Bitfehlerrate zu übertragen, die für die meisten Anwendungen akzeptabel ist.
-
Für Vocoder der früheren Generation, die EVRC-A verwenden, muss ein eingehendes Signal lediglich wie ein Sprachsignal aussehen, um eine volle Rate zu erhalten. Somit könnten Modulationstechniken, wie beispielsweise eine kontinuierliche FSK, verwendet werden, um eine volle Rate zu erhalten. Für die 4G-Vocoder ist es jedoch schwieriger, eine volle Rate zu erreichen. 9 zeigt eine Analyse des EVRC-B-Sprachklassifizierungsschemas, das in der 3GPP2 C.S0014-B Ver. 1.0-Spezifikation enthalten ist, wobei die verschiedenen Tests gezeigt sind, die verwendet werden, um die eingehenden Daten zu klassifizieren, und wobei gezeigt ist, welche jener Tests zu einer Übertragung mit voller Rate führen. EVRC-B verwendet drei Hauptanker-Arbeitspunkte (AOPs): AOP0, AOP1 und AOP2. Diese Arbeitspunkte werden beim Ermitteln der Ratenauswahl verwendet, und die Ankerarbeitspunkte werden selbst auf der Grundlage einer durchschnittlichen Zielrate ermittelt, die durch den drahtlosen Träger eingestellt werden kann. Somit kann ein Dienstanbieter, der digitale Daten über den Vocoder senden möchte, typischerweise nicht die Ankerarbeitspunktermittlung steuern. Stattdessen kann ein Erhalten der gewünschten vollen Rate erreicht werden, indem das codierte Trägersignal gemäß einem oder mehreren der Pfade von 9 moduliert oder auf andere Weise konditioniert wird, die zu der Ermittlung einer vollen Rate führen.
-
Allgemein klassifiziert der Prozess von 9 die eingehenden Daten in eine einer Anzahl von Kategorien von Sprache, wie beispielsweise transient oder stimmhaft, und ermittelt auf der Grundlage dieser Kategorisierung, ob sie mit einer vollen Rate übertragen werden sollen. Als ein Teil der EVRC-B-Vocoder-Verarbeitung wird eine Levinson-Durbin-Rekursion angewandt, und ungeachtet der Klassifizierung der Sprache als transient oder anderweitig wird ein Fehlerparameter dieser Rekursion überwacht, um zu ermitteln, ob die volle Rate zugeordnet werden sollte. Insbesondere wird ein Stoporder30-Iterationsindex berechnet, und wenn dieser Wert kleiner oder gleich Vier ist, wird eine Übertragung mit voller Rate verwendet. Dies ermöglicht, dass Rückruftöne mit einer vollen Rate übertragen werden. Wie es in 9 gezeigt ist, wird, wenn die eingehenden Daten als transiente Sprache klassifiziert werden, die volle Rate zugeordnet. Dies gilt ungeachtet dessen, ob der Vocoder in einem AOP0-Modus arbeitet (in welchem Fall die transiente Sprache als eine Sprache klassifiziert wird, der eine volle Rate zugeteilt wird), oder stattdessen in einem AOP1- oder einem AOP2-Modus arbeitet.
-
Es wurde herausgefunden, dass, um eine Kategorisierung der eingehenden Daten als transiente Sprache zu erhalten, das Signal durch Konditionieren des eingehenden Datensignals derart, dass es Diskontinuitäten und geeignete Energieeigenschaften aufweist, durch den Vocoder als transiente Sprache interpretiert wird und ihm auf diese Weise eine volle Rate zugeordnet wird. Somit kann angesichts der Eigenschaften des Codierungsschemas, das oben in Verbindung mit 2–8 erläutert wurde, und der Notwendigkeit, eine volle Rate zu erhalten, eine erfolgreiche Übertragung von Daten über den EVRC-B-Vocoder erreicht werden, indem ein Modulationsschema ausgewählt wird, das die digitalen Daten in ein oder mehrere Trägersignale auf eine Weise codiert, die (1) das verwendete bestimmte Linear Predictive-Codierungsschema (z. B. CELP) besteht und (2) dem Trägersignal/den Trägersignalen Diskontinuitäten und Energieeigenschaften auferlegt, so dass der Vocoder das eingegebene Signal als transiente Sprache klassifiziert. Diese Diskontinuitäten und Energieeigenschaften werden nachstehend in Verbindung mit bestimmten Modulationsschemas ausführlicher erläutert, von denen nun eine Anzahl erklärt wird.
-
Bezug nehmend auf 10 und 11 wird nun eine erste von verschiedenen Modulationstechniken beschrieben, die eine differentielle Phasenumtastung (DPSK) verwendet. Die Verwendung einer DPSK vermeidet die durch den Vocoder eingeführten Phasenprobleme. Die DPSK moduliert den Träger gemäß der Differenz zwischen aufeinanderfolgenden Informationsbits in dem Bitmuster, und hierbei werden die Probleme beseitigt, die durch zufällige Phasendrifts verursacht werden. Vorzugsweise wird eine differentielle binäre Phasenumtastung (DBPSK) verwendet, von der ein Beispiel in 10 und 11 gezeigt ist. In 10 wird wieder dasselbe Bitmuster wie in 5 verwendet, dieses Mal wird es jedoch verwendet, um den 500 Hz-Träger unter Verwendung einer DBPSK zu modulieren.
-
11 zeigt das Konstellationsdiagramm für den zerlegten Vocoder-Ausgang, nachdem er einer DBPSK-Decodierung unterzogen wurde. Wie diese Darstellung zeigt, sind die Demodulationsergebnisse entlang der I-Achse stark differenziert, wobei die Nullen und Einsen des Bitmusters um zwei Knoten an jeder Seite der Q-Achsenlinie zentralisiert sind, die sich durch den Ursprung erstreckt. Somit können die ursprünglichen digitalen Daten mit einer relativ niedrigen Bitfehlerrate wiederhergestellt werden. Es wurden abgetastete Daten unter Verwendung einer DBPSK, wie in 10 gezeigt, und unter Verwendung eines Qualcomm® 4G-Vocoders getestet, der in verschiedenen Betriebsmodi läuft. Die Bitfehlerrate der abgetasteten Daten unter Verwendung einer Trägerfrequenz von 500 Hz und 500 Bit/s (10 Bit/Frame) betrug etwa 1,5%. Es können andere Kombinationen von Frequenzen und Bitraten (Bit/Frame) verwendet werden, solange die resultierende Bitfehlerrate für die bestimmte umfasste Anwendung akzeptabel ist. Beispielsweise wurden unter Verwendung einer DBPSK mit 500 Bit/s gute Ergebnisse bei Trägerfrequenzen von 500 Hz, 800 Hz, 850 Hz, 900 Hz, 950 Hz, 1000 Hz, 1300 Hz, 1350 Hz und 1850 Hz erhalten, und diese Trägerfrequenzen können ohne eine wesentliche Verschlechterung der Bitfehlerrate um etwa 50 Hz nach oben und unten verändert werden. Dies liefert bevorzugte Frequenzbereiche von 450–550 Hz, 750–1050 Hz, 1250–1400 Hz und 1800–1900 Hz. Für eine Zweiwegekommunikation über den Sprachkanal werden vorzugsweise in jeder Richtung verschiedene Frequenzen mit einem ausreichenden Frequenzabstand zwischen ihnen verwendet; beispielsweise 500 Hz und 950 Hz.
-
Wie es in 10 gezeigt ist, führt die Verwendung einer DPSK zu Phasenverschiebungen, die Diskontinuitäten in dem modulierten Trägersignal liefern, die eines der Merkmale sind, die oben als beim Kategorisieren des Signals durch den Vocoder als transiente Sprache hilfreich identifiziert wurden. Der Vorteil von Diskontinuitäten in dem in den Vocoder eingegebenen modulierten Trägersignal ist der, dass dem Signal eine niedrige Periodizität verliehen wird, was einer der Faktoren ist, die durch EVRC-B-Vocoder beim Kategorisieren des eingehenden Signals verwendet werden. Die Periodizität des Eingangssignals wird ermittelt, indem der Vocoder eine berechnete normierte Autokorrelationsfunktion (NACF) des zweiten Subframes verwendet, die hierin als NACFsf2 bezeichnet wird und unter Verwendung der Gleichung berechnet werden kann, die hierfür in der 3GPP2 C.S0014-B Ver. 1.0-Spezifikation gegeben ist. Wenn NACFsf2 unterhalb eines einer stimmlosen Sprache zugehörigen Schwellenwerts liegt, wird die Periodizität des Signals als niedrig betrachtet, und dies ist ein Indikator, der durch den Vocoder verwendet wird und zeigt, dass das Signal als transiente Sprache klassifiziert werden sollte. Der Stimmlos-Schwellenwert, bezeichnet als UNVOICEDTH, wird durch den Vocoder auf der Grundlage eines Rauschabstands ermittelt. Diese Phasenverschiebungsdiskontinuitäten, die aus der DPSK-Modulation resultieren, erreichen diesen niedrigen Wert für NACFsF2.
-
Ein anderes Merkmal des eingehenden Signals, das durch den Vocoder beim Ermitteln der Sprachklassifizierung (stimmhaft, stimmlos, transient, etc.) analysiert wird, sind die Energieeigenschaften. Zwei dieser sind bER (Bandenergieverhältnis) und vER2, was ein berechneter Wert ist, der auf dem Verhältnis zwischen der momentanen Frame-Energie und einer durchschnittlichen Sprachenergie dreier Frames basiert. bER ist ein Maß des Verhältnisses zwischen der Energie, die in einem unteren Frequenzband von 0–2 kHz enthalten ist, und der Energie, die in einem höheren Frequenzband von 2–4 kHz enthalten ist. Es wird unter Verwendung der Gleichung bER = log2 EL / EH berechnet, wobei EL der Betrag an in dem 0–2 kHz-Frequenzband enthaltener Energie ist und EH der Betrag an in dem 2–4 kHz-Frequenzband enthaltener Energie ist. Um die Anforderungen für eine transiente Sprache zu erfüllen, muss der größte Teil der Energie in dem unteren Frequenzband angeordnet sein, so dass bER > 0. Gleichungen und Techniken zum Ermitteln von EL und EH für jeden Frame des eingegebenen Signals sind Fachleuten bekannt.
-
Für vER2 erfordert eine transiente Sprache, dass der berechnete Wert einen festen Schwellenwert von –15 übersteigen muss, wobei vER2 gemäß der Gleichung vER2 = MIN(20,10·log10 E / vEav) ermittelt wird, wobei E die Energie des momentanen Frames ist und vEav die Durchschnittsenergie über drei vorherigen stimmhaften Frames ist. Obwohl es ein Ziel der hierin offenbarten Modulationstechniken ist, zu vermeiden, dass irgendein Frame durch den Vocoder als stimmhaft kategorisiert wird, umfasst eine typische Telefonverbindung über das zellulare Kommunikationssystem 12 nicht nur eine Datenübertragung, sondern auch eine tatsächliche Sprache (z. B. zwischen dem Fahrzeuginsassen und dem Call Center-Personal 42), so dass es typischerweise stimmhafte Frames gibt, in denen die vEav ermittelt werden kann, und wenn dies nicht der Fall ist, verwendet der Vocoder einen Standardwert von 0,1 für vEav, wenn es als stimmlose oder inaktive Sprache klassifizierte Frames gibt.
-
Wenn alle drei der vorangehenden Tests von dem in den Vocoder eingegebenen Signal bestanden werden (d. h., NACFsF2 < UNVOICEDTH, bER > 0 und vER2 > –15), wird das Signal durch den Vocoder als transient klassifiziert und wird ihm eine volle Rate zugeteilt. Durch Experimente wurde herausgefunden, dass die DPSK-Modulationstechnik das Trägersignal für bestimmte Bitraten und Trägerfrequenzen derart konditioniert, dass es die Diskontinuitäten und Energieeigenschaften aufweist, die bewirken, dass der Vocoder ihm eine volle Rate zuordnet. Es wurde herausgefunden, dass die oben für eine DBPSK genannten Bitraten und Trägerfrequenzen bei dem Qualcomm® 4G-Vocoder gültig sind. Verschiedene Vocoder-Entwürfe (die oftmals verschiedene Sprachkomprimierungs-Codecs verwenden), können jedoch die Verwendung einer anderen Trägerfrequenz oder einer anderen Kombination von Trägerfrequenz und Bitrate erfordern, um eine akzeptable Bitfehlerrate zu erreichen. Zu jedem bestimmten Vocoder-Entwurf können die geeignete Frequenz und Bitrate durch Testen des Vocoders unter Verwendung von Beispielwellenformen ermittelt werden. Im Allgemeinen wird vorzugsweise jede Trägerfrequenz von 4.000 Hz oder kleiner (bis zu etwa 1 Hz) verwendet, und stärker bevorzugt liegt die Trägerfrequenz innerhalb des Bereichs von 400 Hz bis 2.500 Hz. Abgesehen von der Trägerfrequenz kann die Bitrate nicht nur ausgewählt werden, um eine niedrige Bitfehlerrate zu erreichen, sondern auch danach, wie es für eine bestimmte Anwendung notwendig oder erwünscht ist. Vorzugsweise weisen die digitalen Daten eine Bitrate von 250 bis 3.000 Bit/s auf. Beim Auswählen einer bestimmten Trägerfrequenz und Bitrate sollte der modulierte Träger in jedem der möglichen Betriebsmodi des Vocoder geprüft werden, um sicherzustellen, dass die Bitfehlerrate für die beabsichtigte Anwendung akzeptabel ist.
-
Neben einer DBPSK können andere Formen von differentieller Phasenumtastungs-Modulation verwendet werden, solange sie für den bestimmten verwendeten Vocoder zu einer geeigneten Bitfehlerrate führen. Beispielsweise zeigt 12 eine Konstellationsdarstellung für eine differentielle Quadraturphasenumtastung (DQPSK) unter Verwendung von 5 Bit/Frame und einem 500 Hz-Träger. Wie es aus dieser Darstellung zu sehen ist, liegt eine höhere Bitfehlerrate vor. Bei einem Testen des oben erwähnten Qualcomm® 4G-Vocoders bei denselben 500 Hz zeigte ein Eingang von 10 Bit/Frame, der für den DBPSK-Test verwendet wurde, bei allen drei Betriebsmodi des Vocoders eine Bitfehlerrate von etwa 6%. Obwohl dieser Quadraturansatz eine höhere Bitfehlerrate als eine DBPSK zeigte, kann er trotzdem bei Anwendungen verwendet werden, bei denen die höhere Bitfehlerrate toleriert werden kann. Bei 1000 Bit/s kann die DQPSK bei Frequenzen von 900 Hz, 950 Hz und 1350 Hz durchgeführt werden, wobei die Frequenz wieder um 50 Hz nach oben oder unten verändert werden kann, um bevorzugte Frequenzbereiche von 850–1000 Hz und 1300–1400 Hz zu liefern.
-
Wieder Bezug nehmend auf die BPSK-Beispiele von 2(b) und 5 und durch Vergleichen dieser modulierten Signale mit dem DBPSK-Beispiel von 10 ist zu sehen, dass die modulierten BPSK-Träger Diskontinuitäten und Energieeigenschaften umfassen, die denen der DBPSK-Modulation von 10 ähnlich sind. Somit ist das Problem einer erfolgreichen Übertragung des BPSK-modulierten Trägers nicht, dass er keinen Status einer transienten Sprache erreichen kann und keine volle Rate erhalten kann, sondern dass es, wie oben erläutert, einen Informationsverlust gibt, von dem angenommen wird, dass er aufgrund von Phasendrifts des Signals gibt. Somit kann, wenn es erwünscht ist, eine PSK (binär oder andere) und keine DPSK zu verwenden, ein Phasenverfolger oder eine PLL, wie beispielsweise die in 13 gezeigte Costas-Schleife, beim Demodulieren des empfangenen Trägersignals verwendet werden, so dass die Phasendrift keine Wiederherstellung der codierten Daten verhindert. Diese Costas-Schleife kann als ein Teil des in den Modems 34, 44 von 1 verwendeten DPSK-Codierers/Decodierers 36 verwendet werden, und kann in Software realisiert werden. Die Programmierung und Verwendung der Costas-Schleife ist Fachleuten bekannt.
-
Nun Bezug nehmend auf 14 ist ein zweiter Typ von DPSK-Modulation gezeigt, der verwendet werden kann, um digitale Daten über einen EVRC-B-Vocoder und über einen Sprachkanal des zellularen Kommunikationssystems 12 zu übertragen. Bei dieser Ausführungsform wird eine DBPSK wie oben in dem in Verbindung mit 10 und 11 erläuterten Modulationsschema verwendet, außer, dass die digitalen Daten in eine gewünschte Anzahl n von verschiedenen Strömen geteilt werden, wobei an jedem Strom eine DBPSK verwendet wird, um auf der Grundlage der Änderung zwischen den Symbolen (d. h. 0 auf 1 oder 1 auf 0) in den digitalen Daten ein Trägersignal mit anderer Frequenz zu codieren. Die modulierten Trägersignale werden dann addiert, um ein zusammengesetztes moduliertes Trägersignal zu bilden. Wenn die eingehenden digitalen Daten in die verschiedenen Ströme getrennt werden, werden für jeden Strom verschiedene Teile der Daten verwendet, so dass beispielsweise, wenn nur zwei Ströme (zwei Trägerfrequenzen) verwendet werden, wechselnde Gruppen der digitalen Daten (z. B. jeweils 10 Bytes) verwendet werden, um das Trägersignal #1 zu modulieren, und die restlichen wechselnden Gruppen von digitalen Daten verwendet werden, um das Trägersignal #2 zu modulieren. Die Größe jeder Gruppe kann ausgewählt werden, wie es für eine bestimmte Anwendung gewünscht oder geeignet ist, entweder als größere Gruppen oder nur als ein einzelnes Bit, so dass jedes nachfolgende Bit mit einer anderen Frequenz als sein Vorgänger moduliert wird. Die Größe der Gruppen muss nicht gleich sein, so dass beispielsweise größere Gruppen von Daten mit einer höheren Frequenz codiert werden könnten, während kleinere Gruppen von Daten mit einer niedrigeren Frequenz codiert werden können. 15 zeigt ein Beispiel von zwei einzelnen modulierten Trägersignalen, jedes mit einer anderen Frequenz, und zeigt das resultierende zusammengesetzte modulierte Trägersignal nach dem Addieren dieser.
-
Die Demodulation der DBPSK-Datenströme kann gemeinsam ausgeführt werden. Die Datenströme können durch Unterscheiden zwischen den verschiedenen Trägerfrequenzen getrennt werden. Nach einer frequenzmäßigen Trennung kann dann für jede der bekannten Trägerfrequenzen die korrekte differentielle Phase ermittelt werden, und können die digitalen Daten dann durch Standard-DBPSK-Demodulationstechniken wiederhergestellt werden.
-
Mit einer geeigneten Auswahl von Bitrate und Trägerfrequenzen weist das resultierende zusammengesetzte Trägersignal die Diskontinuitäten und Energieeigenschaften auf, die notwendig sind, um eine Übertragung mit voller Rate als transiente Sprache durch den EVRC-B-Vocoder zu erhalten. Obwohl dieser Modulationsansatz mit beliebigen ermittelten Bitraten und Trägerfrequenzen verwendet werden kann, wird er allgemein, um eine akzeptabel niedrige Bitfehlerrate bereitzustellen, vorzugsweise mit Bitraten von 250–3.000 Bit/s und Frequenzen von etwa 1 Hz bis 4.000 Hz und stärker bevorzugt von 400 Hz bis 2.500 Hz verwendet. Am stärksten bevorzugte Frequenzen zur Verwendung bei einer Modulation mit zwei Trägersignalen (d. h. n = 2) mit einer Rate von 1.000 Bit/s sind 650 und 1150 Hz, und 900 und 1400 Hz (oder innerhalb ±50 Hz dieser). Ein Frequenzpaar kann in einer Richtung über den Sprachkanal verwendet werden, und das andere kann in der anderen Richtung verwendet werden.
-
Nun auf 16 Bezug nehmend, ist eine weitere DPSK-Ausführungsform offenbart, bei der eine Frequenzumtastung (FSK) in Verbindung mit einer DPSK (vorzugsweise einer DBPSK) verwendet wird, um die digitalen Daten zu codieren. Bei dieser Ausführungsform werden die digitalen Daten verwendet, um eine FSK eines Trägersignals auszuführen, wobei gemäß den digitalen Daten zwischen zwei verschiedenen Frequenzen gewechselt wird. Diese Daten werden auch verwendet, um eine DBPSK des FSK-modulierten Trägersignals auszuführen. Somit werden sowohl Frequenz als auch Phase des Trägersignals moduliert und werden die Daten sowohl durch den bestimmten Ton, der gesendet wird (den FSK-Teil), als auch die bestimmte Phasenverschiebung zu Beginn des Tons (den DBPSK-Teil) dargestellt. Eine Demodulation kann gemeinsam ausgeführt werden, und, sobald die Frequenz eines bestimmten Symbols bekannt ist, kann die korrekte differentielle Phase ermittelt werden. Als ein Ergebnis dieses Schemas liefern die demodulierten Daten 2 Bit pro Symbol von eingegebenen digitalen Daten anstatt des 1 Bit des oben erläuterten Modulationsschemas. Obwohl vorzugsweise eine DBPSK verwendet wird, können eine DQPSK und andere Formen einer DPSK ausgewählt werden, wenn sie für eine bestimmte Anwendung geeignet sind. Wie bei den anderen oben erläuterten DPSK-Modulationstechniken liefern die Phasenverschiebungen in dem modulierten Trägersignal, die aus der Verwendung einer DPSK resultieren, zusammen mit einer geeigneten Frequenz- und möglicherweise Bitratenauswahl dem modulierten Trägersignal die notwendigen Diskontinuitäten und Energieeigenschaften, um zu bewirken, dass der EVRC-B-Vocoder das Signal als transiente Sprache klassifiziert und ihm eine volle Rate zuordnet. Die allgemeinen Frequenz- und Bitratenbereiche, die oben für die anderen DPSK-Techniken spezifiziert wurden, können für dieses FSK-DPSK-Modulationsschema verwendet werden. Bei einer stärker bevorzugten Ausführungsform können die folgenden Frequenzpaare bei 1000 Bit/s verwendet werden (wieder mit Frequenzen innerhalb ±50 Hz der gegebenen): 850 und 1400 Hz, 850 und 1450 Hz, 900 und 1350 Hz, 900 und 1550 Hz, 950 und 1550 Hz, 1000 und 1550 Hz, 1100 und 1800 Hz, 1150 und 1550 Hz, 1150 und 1750 Hz, 1400 und 2050 Hz, 1450 und 2000 Hz, 1500 und 2000 Hz, und 1500 und 2050 Hz.
-
Ein Ansatz, der dieser FSK-DPSK-Technik ähnlich ist, ist in 17 gezeigt, außer, dass anstatt einer FSK eine Amplitudenumtastung (ASK) verwendet wird. Die allgemeinen oben für die anderen DPSK-Techniken spezifizierten Frequenz- und Bitratenbereiche können für dieses ASK-DPSK-Modulationsschema verwendet werden. Somit kann die Bitrate von 250–3.000 Bit/s reichen und können die Frequenzen von etwa 1 Hz bis 4.000 Hz und stärker bevorzugt von 400 Hz bis 2.500 Hz reichen. Durch Anwenden der DPSK-Modulation auf das ASK-modulierte Trägersignal und durch geeignete Auswahl von Bitrate und Frequenz kann das sich ergebende modulierte Trägersignal die Diskontinuitäten (und somit eine niedrige Periodizität) und Energieeigenschaften aufweisen, die notwendig sind, um eine Übertragung mit voller Rate als transiente Sprache über den Vocoder zu erhalten.
-
Wie es oben in Verbindung mit 13 erläutert ist, können für jede dieser vorherigen Modulationstechniken (z. B. Multi-DPSK, FSK-DPSK und ASK-DPSK) unter Verwendung einer regulären PSK anstatt einer DPSK mit einer Costas-Schleife oder einem anderen geeigneten Phasenverfolger, der verwendet wird, um den Informationsverlust aufgrund von Phasendrifts zu vermeiden, Diskontinuitäten in dem Trägersignal erreicht werden.
-
Vorübergehend wieder Bezug nehmend auf 1 wird somit ersichtlich, dass gemäß einer Ausführungsform des Verfahrens der vorliegenden Erfindung digitale Daten über das drahtlose Netzwerk übertragen werden können, indem
- (a) ein oder mehrere Trägersignale mit digitalen Daten unter Verwendung einer differentiellen Phasenumtastungs-Modulation des einen oder der mehreren Trägersignale moduliert werden, wodurch ein moduliertes Trägersignal erzeugt wird;
- (b) das modulierte Trägersignal über einen Sprachkanal eines drahtlosen Telekommunikationsnetzwerks übertragen wird;
- (c) das modulierte Trägersignal über das drahtlose Telekommunikationsnetzwerk empfangen wird; und
- (d) das empfangene modulierte Trägersignal in die digitalen Daten zurück demoduliert wird.
-
Bei einem Beispiel, bei dem Daten von dem Fahrzeug 20 an das Call Center 40 gesendet werden, kann Schritt (a) durch das Modem 34 unter Verwendung von digitalen Daten ausgeführt werden, die von einem der Fahrzeugsystemmodule 38 empfangen werden. Schritt (b) kann bei diesem Beispiel erreicht werden, indem zuerst der CDMA 4GV-Chipsatz 24 verwendet wird, um das modulierte Trägersignal von dem Modem 34 zu codieren, und dies kann unter Verwendung eines Linear Predictive Codec des Typs durchgeführt werden, der eine zeitabhängige, nicht lineare Transferfunktion aufweist, die zumindest teilweise Komponenten, die keine Sprache umfassen, aus den eingegebenen Daten filtert. Der codierte Ausgang kann dann über das zellulare Netzwerk 12 über die Fahrzeugantenne 26 übertragen werden. Schritt (c) dieses Beispiels umfasst dann, dass das modulierte Trägersignal an dem Call Center 40 empfangen wird, nachdem es durch einen Sprach-Decodierer in dem CDMA 4GV-Modul 18 gelangte. Schließlich umfasst Schritt (d), dass das modulierte Trägersignal zurück in die ursprünglichen digitalen Daten von dem VSM 38 decodiert wird. Jedes der DPSK-Modulationsschemas, die oben in Verbindung mit 11–12 und 14–17 erläutert wurden, kann durch den DPSK-Codierer/Decodierer 36 verwendet werden; alternativ kann eine reguläre PSK unter Verwendung einer Costas-Schleife oder einer anderen Phasenverfolgung an dem Demodulator verwendet werden.