-
Diese
Erfindung betrifft einen Empfänger
und ein Kommunikationssystem für
die Übertragung
von Datenrastern zwischen einem Sender und einem Empfänger über einen
Kommunikationskanal, wobei der Empfänger eine Fehlerkorrekturvorrichtung
für die
Korrektur von Übertragungsfehlern
an den empfangenen Daten aufweist.
-
Sie
betrifft auch eine Fehlerkorrekturvorrichtung und ein Verfahren
für die
Korrektur von Übertragungsfehlern
an empfangenen digitalen Datenrastern.
-
Sie
findet zahlreiche Einsatzbereiche in Sprachkommunikationssystemen
und insbesondere in digitalen mobilen Telekommunikationssystemen und
Sprachübertragungssystemen
unter Verwendung des IP-Protokolls (aus dem Englischen Internet Protocole)
oder des ATM-Protokolls (aus dem Englischen Asynchronous Transfert
Mode).
-
Das
amerikanische Patent Nummer
5.432.778 beschreibt
eine Methode für
die Detektion von Übertragungsfehlern
in empfangenen Sprachrastern mit Hilfe von Neuronennetzwerke verwendenden
Techniken.
-
Die
Erfindung schlägt
weniger kostspielige und weniger komplex zu implementierende Mittel
als die in dem zitierten Dokument für die Detektion vom Empfangen
von Übertragungsfehlern
in empfangenen Datenrastern zusammen mit den Mitteln für deren
Korrektur beschriebenen vor. Hierfür setzt sie voraus, dass die
empfangenen Datenraster Informationen übermitteln, welche für die Darstellung
von Sprachelementen bezeichnet sind. Somit sieht die Erfindung einen
Empfänger,
ein System und eine Vorrichtung gemäß der Beschreibung des einleitenden
Paragraphen vor, welche bemerkenswert sind, da die Fehlerkorrekturvorrichtung
enthält:
- – Spracherkennungsmittel
für die
Erkennung der Sprachelemente in empfangenen Datenrastern,
- – Detektionsmittel
für die
Detektion der verfälschten
Partien der erkannten Sprachelemente,
- – Synthesemittel
für das
Synthetisieren derjenigen Partien der Sprachelemente, welche den
verfälschten
Partien entsprechen und
- – Ersetzungsmittel
für das
Ersetzen in den empfangenen Datenrastern der besagten verfälschten Partien
durch die synthetisierten Partien.
-
Tatsächlich ist
ungeachtet des Typs oder der Größe der betrachteten
Eemente die Anzahl an Sprachelementen, welche für die Wiederherstellung aller Wörter der
Sprache erforderlich sind, begrenzt. Allerdings kann diese Anzahl
der angestrebten Anwendung nach ein kritischer Parameter sein, besonders wenn
die Größe des Speichers
und die Rechenleistung der verwendeten Komponenten für die Umsetzung
der Erfindung begrenzt sein müssen.
Deshalb setzt die Erfindung nach einer vorgezogenen Ausführungsform
voraus, dass die Sprachelemente, welche das empfangene Signal bilden,
Phoneme und Diphone oder jede andere Spracheinheit sind, welche
es ermöglichen,
alle Wörter
der Sprache mit Hilfe einer begrenzten Anzahl Einheiten wiederherzustellen.
-
Die
folgende Beschreibung wird als nicht erschöpfendes Beispiel hinsichtlich
der beigefügten Zeichnungen
gut verständlich
machen, wie die Erfindung umgesetzt werden kann.
-
1 ist
ein Blockschema der Übertragungskette
eines Systembeispiels mit einem Sender und einem Empfänger nach
der Erfindung, welche mit einer Fehlerkorrekturvorrichtung versehen
sind.
-
2 weist
3 Kurven auf, welche das Sprachsignal unter Berücksichtigung der Zeit darstellen,
um die wichtigsten Etappen des Verfahrens nach der Erfindung zu
veranschaulichen, welche die Fehlerkorrekturvorrichtung von 1 ausführt.
-
3 stellt
ein Ausführungsbeispiel
der Fehlerkorrekturvorrichtung nach der Erfindung wie auf 1 gezeigt
dar.
-
4 zeigt
ein Beispiel eines Kommunikationssystem nach der Erfindung mit einem
Telefonsender und -empfänger.
-
1 zeigt
die Sende- und Empfangskette eines Systembeispiels mit einem Sender
und einem Empfänger
nach der Erfindung. Der Sender enthält:
- – einen
Quellblock 11, gebildet z. B. aus einem Mikrofon und einem
Analog-Digital-Wandler
für die Aufnahme
eines analogen Sprachsignals und die Ausgabe eines digitalen Sprachsignals
E(t), welches aus binären
Daten gebildet wird,
- – einen
Kodierblock 12, um einerseits eine Sprachkodierung auszuführen, um
die Anzahl an über
den Kanal zu übertragenden
Informationen zu reduzieren, indem Sequenzen mit kodierten Symbolen
A(t) übertragen
werden, welche das Sprachsignal E(t) darstellen, und andererseits eine
Kanalkodierung, um die Möglichkeiten
an Übertragungsfehlern
zu reduzieren, indem in die Sequenzen übertragener Symbole Redundanz eingebracht
wird,
- – einen
Modulationsblock 13, um die vom Kodierblock 12 gelieferten
Symbole A(t) in ein moduliertes Signal U(t) umzuwandeln, welches über einen Kommunikationskanal 14 zu
senden ist.
-
Der
Empfänger
enthält:
- – einen
Demodulationsblock 15, um die vom Kanal 14 empfangenen
Signale Û(t)
zu demodulieren, um ein demoduliertes Signal Â(t) zu erhalten, welches kanalbedingte Übertragungsfehler
aufweist,
- – einen
Dekodierblock 16, um den umgekehrten Vorgang von Kodierblock 12 auszuführen und
am Ausgang binäre
Daten Ê(t)
auszugeben, welche restliche Übertragungsfehler
enthalten, die bei der Dekodierung des Kanals nicht korrigiert werden konnten
und insbesondere auf Störungen
im Kanal 14 bei der Funkübertragung oder einen schlechten
Empfang gründen,
welcher durch einen hohen Rauschpegel im Kanal verursacht wurde,
- – einen
spezifischen Fehlerkorrekturblock 17, um die restlichen Übertragungsfehler
zu korrigieren, die im dekodierten Signal Ê(t) erkannt wurden, und um
ein korrigiertes Ausgangssignal S(t) auszugeben,
- – einen
Ausgangsblock 18, gebildet z. B. aus einem Digital-Analog-Wandler
und einem Lautsprecher/Hörer,
um ein analoges Signal an den Anwender abzugeben.
-
Die
von dem Dekodierblock 16 erbrachten Dekodierleistungen
des Kanals hängen
von den Übertragungsbedingungen
und von einem Parameter ab: die Längenbedingung, welche der Höchstanzahl
aufeinanderfolgender verfälschter
Bits entspricht, die der Kanaldekodierer noch korrigieren kann.
In einem wenig verrauschten Kanal z. B. erfahren die Daten wenig
kanalbedingte Übertragungsfehler.
Es genügt
somit eine geringe Längenbedingung, um
sehr gute Resultate auf dem Niveau der Kanaldekodierung zu erhalten.
In einem sehr verrauschten Kanal dagegen benötigen die Daten mehr Redundanz,
d. h. eine größere Längenbedingung,
um eine gute Erkennungswahrscheinlichkeit beim Dekodieren zu garantieren.
Die Redundanz birgt jedoch den großen Nachteil, die zu übertragende
Informationsmenge zu erhöhen,
was bei einer begrenzten Bandbreite des Kanals von Nachteil ist.
-
Dafür sieht
die Erfindung es vor, einen spezifischen Korrekturblock 17 hinter
den Dekodierblock 16 hinzuzufügen, um restliche kanalbedingte
Fehler zu erkennen und zu korrigieren, welche die Korrekturkapazität des Kanaldekodierers übersteigen,
ohne seine Längenbedingung
zu erhöhen.
Sie ist somit besonders in Systemen vorteilhaft, welche sehr schlechten Übertragungsbedingungen
ausgesetzt sein können,
wie Funkstörungen
oder jedem anderen Rauschphänomen
in dem Kanal.
-
Ein
Fehlerkorrekturverfahren nach der Erfindung, z. B. vom Korrekturblock 17 umgesetzt,
ist auf den 2A, 2B und 2C dargestellt.
Die Figuren zeigen unter Berücksichtigung
der Zeit respektive das zu übertragende
digitale Sprachsignal E(t) (2A), das
verfälschte
Sprachsignal Ê(t),
vom Dekodierblock 16 an den Fehlerkorrekturblock 17 abgegeben
(2B), und das korrigierte Sprachsignal S(t) am
Ausgang des Fehlerkorrekturblocks 17 (2C).
-
Nach
einem Grundprinzip der Erfindung ist das vom Dekodierer 16 gelieferte
Signal Ê(t)
ein Sprachsignal, welches aus einer begrenzten Anzahl vorbestimmter
Sprachelemente gebildet wird. Auf diese Hypothese bauend sieht die
Erfindung vor, ein Wörterbuch
zu verwenden, welches aus Sprachelementen gebildet wird, die sämtliche
Wörter
der vokalen Sprache wiederherstellen können, und vokale Erkennungsmittel,
um die Elemente des Wörterbuchs permanent
während
dem schrittweisen Empfang des Signal zu erkennen. Nach einer vorgezogenen
Ausführungsform
wird ein Phoneme-Wörterbuch
verwendet, um die Spracherkennung auszuführen, was es ermöglicht,
fehlerhafte Datenraster bis zu einer Dauer von 40 ms rückzugewinnen,
was unter der Dauer des kleinsten Phonems z. B. der Englischen Sprache (ca.
50 ms) liegt, da die meisten Phonems eine zwischen 80 und 130 ms
variierende Dauer haben.
-
Das
Verfahren nach der Erfindung für
die Korrektur von Übertragungsfehlern
in digitalen Datenrastern, welche das verfälschte Signal Ê(t) bilden, enthält folgende
Schritte:
- – einen
vokalen Erkennungsschritt für
die permanente Erkennung der Sprachelemente in den empfangenen Datenrastern,
- – einen
Detektionsschritt für
die Erkennung der verfälschten
Teile in den erkannten Sprachelementen,
- – einen
Syntheseschritt für
das Synthetisieren derjenigen Partien der Sprachelemente, welche den
verfälschten
Partien entsprechen und
- – einen
Ersetzungsschritt für
das Ersetzen in den besagten Datenrastern der besagten verfälschten Partien
durch die synthetisierten Partien.
-
Dem
Schema der 1 zufolge mit dem Dekodierungsblock 16 wird
der Detektionsschritt bereits teilweise während dem Dekodieren des Kanals
ausgeführt,
was vom Dekodierer 16 vorgenommen wird und in der Detektion
der Fehler im Signal Â(t)
am Ausgang des Demodulators besteht. Diese Detektion wird mit herkömmlichen
Fehlerdetektionsmethoden ausgeführt,
wie z. B. mit einer Methode ohne Speichereffekt mit der Bezeichnung
CRC (aus dem Englischen Cyclic Redundance Check), welche einen Indikator
für verfälschte Raster
oder BFI liefert, oder mit einer Methode mit Speichereffekt unter
Verwendung eines konvoluten Kodes und einem Viterbi-Detektor. Wie
weiter oben beschrieben sind diese Methoden bis zu einem gewissen
Verfälschungsgrad
des Sprachsignals leistungsfähig.
Darüber
hinaus wird die Anwendung des Fehlerkorrektors 17 sehr
interessant für
die Korrektur von restlichen Fehlern, die vom herkömmlichen
Kanaldekodierer belassen wurden. Nach einer Variante der Erfindung
kann eine originale zusätzliche
Detektionsmethode ergänzend
zu den spezifischen herkömmlichen,
vom Dekodierer 16 eingesetzten Detektionsmitteln angewandt
werden. Es handelt sich dabei um die Verwendung des Resultats der
Spracherkennung, die beim Erkennungs- und Synchronisationsschritt
des Signals Ê(t)
in Bezug auf die Elemente des Sprachwörterbuchs für die gleichzeitige Detektion
von Fehlern in den erkannten Sprachelementen ausgegeben wurde. Hierfür verwendet die
Erfindung direkt die vom Spracherkennungsergebnis gelieferte Information,
welche die Erkennungswahrscheinlichkeit des laufenden Elements unter
den Elementen des Wörterbuchs
anzeigt. Über einer
bestimmten Erkennungsschwelle, auf z. B. zwischen 80% und 100% festgelegt,
wird das Element ohne notwendige Korrektur als erkannt vorausgesetzt.
Unter einer zweiten festgelegten Erkennungsschwelle (unter der ersten
Schwelle), der Größenordnung
von bz 10% bis 20%, wird das Element ohne mögliche Korrektur als nicht
erkannt vorausgesetzt. Zwischen den beiden Schwellen wird das Erkennungsergebnis
verwendet, um auch einen zu korrigierenden Restfehlersatz anzuzeigen.
-
Das
Resultat der vokalen Erkennungsschritte und der Fehlerdetektion
ist auf 2B dargestellt. Das mit einer
horizontalen Akkolade unterstrichene Sprachelement 21 wird
unter den Elementen des Wörterbuchs
während
dem vokalen Erkennungsschritt erkannt, welcher permanent die Erkennung der
Datenraster im Laufe ihres Empfangs durch Vergleich mit allen Elementen
des parallelen Wörterbuchs
vornimmt. Aus für
das Verständnis
der Figur notwendiger Hypothese sind der Anfang und das Ende des
Elements 21 perfekt mit einem bestimmten Element des Wörterbuchs
synchronisiert. Die Detektion eines mit einem doppelten horizontalen
Pfeil 22 unterstrichenen fehlerhaften Teils des Sprachelements 21 fand
mit den hiervor beschriebenen Detektionsmethoden statt.
-
Das
Resultat der Synthese- und Ersetzungsschritte wird auf 2C gezeigt.
Der mit einem doppelten horizontalen Pfeil 23 unterstrichene
erkannte Teil des Sprachelements 21, welcher dem fehlerhaften
Teil 22 entspricht, wird ausgehend von den im Wörterbuch
enthaltenen Informationen synthetisiert, um den fehlerhaften Teil 22 im
Element 21 des empfangenen Datenrasters zu ersetzen.
-
3 ist
ein Blockschema, welches die wichtigsten Funktionen der der Erfindung
entsprechenden Korrekturvorrichtung darstellt. Die Vorrichtung erhält am Eingang
das verfälschte
Sprachsignal Ê(t)
ausgehend z. B. aus dem Dekodierer 16 der 1,
um am Ausgang ein korrigiertes Sprachsignal S(t) an den Lautsprecher
auszugeben. Sie enthält:
- – eine
Speicherablage TM für
die Speicherung der Informationen des Sprachelementewörterbuchs, wobei
diese Informationen Charakteristiken sind, welche die Identifizierung
jedes Sprachelements und seine Synthetisierung ermöglichen,
- – einen
Erkennungsprozessor RP für
den Erhalt des Signals Ê(t)
und für
die permanente Erkennung der Sprachelemente des Wörterbuchs,
- – eine
Steuerung der Art eines Prozessors DSP für den Erhalt vom Prozessor
RP und/oder einem spezifischen externen Fehlerdetektor der Informationen über die
Qualität
des laufenden Rasters Ê(t),
um festzustellen, ob es Übertragungsfehler enthält,
- – einen
Syntheseprozessor SP für
die Durchführung
einer Synthese auf Befehl der Steuerung DSP und mit Hilfe der Informationen über das
im Speicher TM enthaltenen Referenzelements desjenigen Teils des
Referenzelements, welches dem fehlerhaften Teil entspricht, um einen
Austausch des fehlerhaften Teils durch den Syntheseteil im erhaltenen
fehlerhaften Datenraster Ê(t)
auszuführen,
um ein korrigiertes Ausgangssignal S(t) zu erhalten,
- – einen
Digital-Analog-Wandler D/A, um das digitale Ausgangssignals (t)
aus dem Prozessor SP in ein analoges an einen Lautsprecher zu leitendes Signal
zu wandeln.
-
Je
nach der gewählten
Methode für
die Ausführung
der Fehlerdetektion im erkannten Sprachelement sind zwei Ausführungsformen
in Betracht zu ziehen. Nach der ersten Methode erhält die Steuerung
DSP vom Prozessor RP einerseits ausschließlich die Informationen in
Bezug auf das erkannte Element des Wörterbuchs und einer spezifischen externen
Detektionsvorrichtung andererseits, einem Fehlerraster-Indikator
BFI (aus dem Englischen Bad Frame Indicator) aus dem vom Dekodierer 16 ausgeführten Dekodierungsschritt
des Kanals. Der zusätzlichen
Methode zufolge erhält
sie zusätzlich
vom Prozessor RP einen vom vokalen Erkennungsergebnis abgeleiteten
Indikator.
-
4 zeigt
ein Beispiel eines Kommunikationssystems nach der Erfindung für die Übertragung von
Datenrastern zwischen mindestens einem Sender 41 und mindestens
einem Empfänger 42 über einen
Kommunikationskanal 43. Im Beispiel der 4 ist
der Sender 41 eine Basisstation eines mobilen Funktelefonsystems,
und der Empfänger 42 ist
ein Zellulartelefon. Die Basisstation und das Telefon enthalten
respektive eine Sendekette und eine Empfangskette der auf 1 dargestellten
Art. Unter Berücksichtigung
des Kommunikationstyps, insbesondere bidirektional, können die
Sender und Empfänger
invertiert werden, wenn es z. B. das Telefon ist, welches eine Meldung
an die Basisstation sendet.
-
Die
Erfindung findet auch auf viele andere Systeme mit anderen Sende-
und Empfangstypen Anwendung, wie vokale Kommunikationssysteme im Internet,
welche Sender/Empfänger
verwenden, Computer, welche mit einer Protokollschicht für Sprachübertragung
ausgerüstet
sind, wie VOIP (aus dem Englischen Voice over IP), oder VOAT (aus
dem Englischen Voice over ATM).
-
Somit
wurde anhand von Beispielen ein System beschrieben und veranschaulicht,
welches einen Sender und einen Empfänger, eine Fehlerkorrekturvorrichtung
und ein preisgünstiges
und relativ einfach umzusetzendes Verfahren für die Detektion und Korrektur
von kanalbedingten Übertragungsfehlern
umfasst, welche die Korrekturkapazität des Kanaldekodierers übersteigen.
Selbstverständlich
können
die beschriebenen Ausführungsformen
vielfältig
abgewandelt werden, ohne jedoch den Rahmen der Erfindung zu verlassen.