-
GEBIET DER
ERFINDUNG
-
Die
vorliegende Erfindung betrifft Verfahren, die dazu verwendet werden,
Kommunikationskanäle zu
charakterisieren, und in besonderen Ausführungsbeispielen betrifft sie
Verfahren, die dazu verwendet werden, nichtlineare optische Kommunikationskanäle zu charakterisieren
und Modelle dafür
zu erstellen.
-
HINTERGRUND
DER ERFINDUNG
-
Eine
Signalverzerrung in einem optischen Kanal kann durch Nichtlinearitäten verursacht
werden, die in verschiedenen Komponenten existieren, die in einem
optischen Kanal enthalten sind. Eine solche Verzerrung kann durch
mathematische Modelle des nichtlinearen Verhaltens des optischen
Kommunikationskanals charakterisiert werden. Durch die Verwendung
solcher Modelle können
kompensatorische Maßnahmen,
wie zum Beispiel Entzerrer, entworfen werden, die die Verzerrung
ausgleichen, die die Leistung des Kanals verschlechtert.
-
Eine
Quelle für
die Verzerrung ist die Dispersion. Die Dispersion kann eine Kombination
aus linearen und nichtlinearen Komponenten sein.
-
Die
Dispersion, die man in Glasfasern antrifft, vor allem in Multimodenfasern,
kann die Bandbreite in optischen Kanälen begrenzen. Das Problem der
Dispersion kann in Multimodenfasern im Allgemeinen größer sein,
aber sie kann auch ein Problem in Einmodenfasern darstellen, vor
allem bei langen Faserlängen.
Einmodenfasern weisen für
gewöhnlich eine
geringere Dispersion auf als Multimodenfasern. Die Dispersion, die
für gewöhnlich in
Einmodenfasern anzutreffen ist, kann die chromatische Dispersion
oder die Polarisationsmodendispersion sein. Die Dispersion, die
in Einmodenfasern zu sehen ist, ist im Allgemeinen um ein großes Maß geringer
pro Abschnitt als die Dispersion, die in Multimodenfasern angefunden
wird. Die Dispersion ist aber kumulativ, und so neigt sie dazu,
mit der Zunahme der Länge der
Fasern größer zu werden.
Demgemäß gelten
die Verfahren, die hier im Hinblick auf Multimodenfasern erörtert werden,
auf gleiche Weise auch für
Einmodenfasern.
-
In
Multimodenfasern bewirken die mehreren Moden der Ausbreitung innerhalb
der Faser für
gewöhnlich
eine Dispersion. Im Allgemeinen weist das Lichtsignal in den verschiedenen
Ausbreitungsmoden innerhalb einer Faser unterschiedliche Ausbreitungsgeschwindigkeiten
auf. So wird sich der Impuls dann, wenn ein Lichtimpuls von einem
Sender gesendet wird, in mehreren Moden ausbreiten, die sich mit
unterschiedlichen Geschwindigkeiten vorwärts bewegen. Der Impuls, der
sich in jedem Mode bewegt, wird den Empfänger zu unterschiedlichen Zeiten
erreichen. Die mehreren Ankunftszeiten des Eingangsimpulses, der
sich in mehreren Moden vorwärts
bewegt, erzeugt einen verzerrten Impuls, nämlich so etwas wie eine auf
verschiedene Zeitpunkte verteilte Version des übertragenen Impulses.
-
Optische
Kanäle
sind inhärent
nichtlinear. Elektromagnetische Felder können durch Maxwellsche Gleichungen
beschrieben werden, die linear sind. Da Maxwellsche Gleichungen
linear sind, trifft das Prinzip der Superposition auf das elektromagnetische
Feld zu. Was aber in optischen Kanälen moduliert wird, ist nicht
das elektromagnetische Feld per se, sondern die optische Energie.
Die Superposition trifft nicht exakt auf die optische Energie zu.
-
Ein
optischer Photodetektor ist für
gewöhnlich
eine Vorrichtung, die einer quadratischen Funktion folgt (square
law device). Der Photodetektor spricht linear auf die optische Energie
an; tatsächlich ist
der Photostrom, der von einem Photodetektor erzeugt wird, für gewöhnlich eine
sehr genaue lineare Funktion der optischen Energie, aber die Energie
ist eine quadratische Funktion des elektromagnetischen Feldes, wodurch
eine Quelle an Nichtlinearität
erzeugt wird.
-
Es
hat sich gezeigt, dass dann, wenn ein Laser eine große spektrale
Breite aufweist, anstatt ein sehr monochromatischer Laser zu sein,
die signifikante spektrale Breite dazu neigt, zu einer Linearisierung
des Kanals zu führen,
selbst wenn der Effekt der optischen Energie und die quadratische
Natur des Photodetektors in Betracht gezogen werden. Mit anderen
Worten, wenn ein Laser ein sehr monochromatisches, enges Spektrum
aufweist, dann neigt der Kanal dazu, sich weniger linear zu verhalten
als dies ein Laser tun würde,
der ein breiteres Spektrum aufweist.
-
Ein
nichtlineares Verhalten in einem optischen Kanal kann in einem variierenden
Ausmaß von den
Eigenschaften des Photodetektors und der Faser abhängen. Außerdem besteht
eine Möglichkeit der
Verzerrung von dem Laser selbst her. Wenn eine Dispersion in dem
Laser vorhanden ist, zum Beispiel deshalb, weil der Laser selbst
eine gewisse Bandbreitenbegrenzung aufweist, dann könnte die
Nichtlinearität
des Lasers auch zu der gesamten Nichtlinearität in dem optischen Kanal beitragen.
-
Wenn
die Intensität
eines optischen Signals hoch ist, kann eine Glasfaser, die das optische
Signal überträgt, selbst
Nichtlinearitäten
einführen.
Diese Nichtlinearitäten
können
sich aus der Tatsache ergeben, dass der Brechungsindex der Glasfaser
bis zu einem gewissen Grad von der Intensität des optischen Signals selbst
abhängt.
Dieser Effekt bewirkt für
gewöhnlich
Nichtlinearitäten,
die als "Vier-Wellen-Mischung", "Selbstphasenmodulation" und "Kreuzphasenmodulation" bekannt sind. Weitere Nichtlinearitäten können sich
aus den Phänomenen ergeben,
die als induzierte Raman-Streuung und induzierte Brillouin-Streuung
bekannt sind. Für
eine umfassendere Behandlung von Nichtlinearitäten siehe den Text "Fiber-Optic Communication
Systems", zweite
Ausgabe, von Govind P. Agrawal, John Wiley und Söhne, 1997, ISBN 0-471-17540-4.
-
Obwohl
die oben genannten Quellen der Nichtlinearität in einem optischen Kanal
als Beispiele präsentiert
worden sind, können
auch noch andere Quellen exis tieren. Die in dieser Offenbarung beschriebenen
Verfahren können
auf alle Arten von Nichtlinearitäten
angewendet werden, und zwar ungeachtet ihrer physischen Quelle,
was den Fachleuten auf diesem Gebiet klar sein wird.
-
In "Adaptive constellation
of non-linear inter-symbol interference for voiceband data transmission", IEEE Journal on
Selected Areas in Communications, Band SAC-2, Nr. 5, September 1984,
beschreiben Biglieri et al. ein Signalverarbeitungsverfahren zur
Abschwächung
der Effekte der Intersymbolinterferenz in Glasfaser-Weitverkehrssystemen, das
ein nichtlineares adaptives Kompensationssystem verwendet, das in "Electrical signal
processing techniques in long-haul, fiber-optic systems", Winters et al.,
IEEE International Conference on Communications ICC '90, 03.09.1990, beschrieben
ist.
-
In "Adaptive linearization
schemes for weakly non-linear systems using adaptive linear and non-linear
FIR filters" Circuits
and Systems, 1990, Proceedings of the 33rd Midwest
Symposium on Calgary, Alta., Kanada, 12.–14. August 1990, New York, NY,
USA, IEEE, beschreiben Gao et al. ebenfalls ein nichtlineares adaptives
Kompensationssystem, das nichtlineare Filter mit endlicher Impulsantwort
(finite impulse response filter; FIR-Filter) verwendet. Für die Konstruktion
dieser FIR-Filter werden abgebrochene Volterra-Reihen verwendet.
-
In "Nonlinear echo cancelling
using look-up tables and Volterra systems", Weruaga-Prieto, L.; Figueiras-Vidal,
A.R.; Vis. Image Signal Process, IEEE Proc, Band 141, Nr. 6, Dezember
1994, nutzt ein Echokompensator LMS-LUT. Der Anhang offenbart eine Äquivalenz
zwischen LMS-LUT und Volterra Reihen.
-
Es
ist eine Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren
zur Modellerstellung für
das Verhalten eines Datenkanals bereitzustellen.
-
Diese
Aufgabe wird von dem Verfahren von Anspruch 1 erreicht. Bevorzugte
Ausführungsbeispiele
sind in den Unteransprüchen
definiert.
-
In
einer Ausführungsform
der Erfindung veranschaulicht die Offenbarung ein Verfahren zur
Modellerstellung für
das Verhalten eines Datenkanals. Um dieses Modell zu erstellen,
wird die Datensequenz, welche an den Datenkanal eingegeben worden
ist, untersucht. Ein Teil der Datensequenz, welche an den Datenkanal
eingegeben worden ist, wird als ein Index für einen Kanalmodellwert verwendet. Ausgegebene
Daten von dem Kanal werden abgetastet. Ein numerischer Kanalmodellwert
wird mit dem abgetasteten Wert verglichen, und der Kanalmodellwert
wird basierend auf den Ergebnissen des Vergleichs angepasst.
-
In
einer anderen Ausführungsform
der Erfindung wird ein Verfahren zur Modellerstellung für das Verhalten
eines Datenkanals unter Verwendung von Volterra Kernels (Volterra-Kernen)
veranschaulicht. Eine Sequenz von Daten wird dem Datenkanal bereitgestellt.
Ein Teil der Datensequenz, welche an den Kanal eingegeben worden
ist, wird dem Volterra Kernel Modell des Kanals bereitgestellt.
Das Volterra Kernel (VK) Modell erzeugt einen Kanalmodellwert. Die
Datenwerte, die aus dem Kanal durch Messung erhalten werden, werden
mit dem VK-Kanalmodellwert verglichen, und die Ergebnisse werden
dazu verwendet, das Volterra Kernel Modell zu aktualisieren.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
Die
Merkmale, Ausführungsformen
und Vorteile der vorliegenden Erfindung, die in der obigen Zusammenfassung
beschrieben worden sind, werden unter Bezugnahme auf die nachfolgende
Beschreibung, die angehängten
Ansprüche
und die beigefügten
Zeichnungen besser verständlich,
in denen:
-
1 eine
graphische Veranschaulichung einer Umgebung ist, in der Ausführungsbeispiele
der vorliegenden Erfindung verwendet werden können.
-
2 eine
graphische Veranschaulichung einer Geräteanordnung ist, die verwendet
werden kann, um optische Kanäle
zu charakterisieren.
-
3 eine
Tabelle ist, die Fasern auflistet, die unter Verwendung der Messanordnung
gemessen wurden, die in 2 veranschaulicht ist.
-
4 eine
graphische Veranschaulichung eines Beispiels eines Systems ist,
das zur Kanalidentifizierung verwendet werden kann.
-
5 eine
graphische Veranschaulichung einer Kanalidentifikation basierend
auf Volterra Kernels (VK) ist.
-
6 eine
graphische Darstellung ist, die die Messung eines Kanals, der einen
850 Nanometer VCSEL (Vertical Cavity Surface Emitting Laser) und eine
Faser F0 aufweist, und den Vergleich der Signalmessungen mit linearen
und nichtlinearen Kanalmodellen veranschaulicht.
-
7 eine
graphische Darstellung ist, die die Messung eines Kanals, der einen
850 Nanometer VCSEL und eine Faser F0 aufweist, und den Vergleich
des Betrags des Fehlers veranschaulicht, der durch lineare und nichtlineare
Kanalmodelle erzeugt worden ist.
-
8 eine
graphische Darstellung ist, die eine Impulsantwort und eine Volterra
Kernel zweiter Ordnung für
einen 850 Nanometer VCSEL und eine Faser F0 repräsentiert.
-
9 eine
Tabelle der Signal-Rausch-Verhältnisse
ist, die für
lineare und nichtlineare Kanalmodelle für einen Kanal berechnet worden
sind, der bei einer Wellenlänge
von 850 Nanometer betrieben wird.
-
10 eine
graphische Darstellung ist, die ein lineares Modell, ein gemessenes
Signal und einen Fehler in einem Kanal vergleicht, der eine Faser F0
bei einer Wellenlänge
von 1310 Nanometer verwendet.
-
11 eine
graphische Darstellung der Impulsantwort und eines Volterra Kernels
zweiter Ordnung für
einen Kanal ist, der eine Faser F0 und einen Distributed Feedback
(DFB) Laser mit 1310 Nanometer Wellenlänge verwendet.
-
12 eine
Tabelle von Signal-Rausch-Verhältnissen
für ein
lineares Modell eines Kanals ist, der einen 1310 Nanometer DFB Laser
verwendet.
-
13 ein
Blockdiagramm eines nichtlinearen optischen Kanalentzerrers gemäß einem
Ausführungsbeispiel
der Erfindung ist.
-
14A ein Blockdiagramm eines nichtlinearen optischen
Kanalentzerrers gemäß einem
Ausführungsbeispiel
der Erfindung ist, der eine Volterra Kernel Schätzfunktion verwendet.
-
14B ein Blockdiagramm eines nichtlinearen optischen
Kanalentzerrers gemäß einem
Ausführungsbeispiel
der Erfindung ist, der eine Nachschlagetabellen-Kanalschätzfunktion verwendet.
-
15 ein
Viterbi Decodierer ist, der gemäß einem
Ausführungsbeispiel
der Erfindung eine nichtlineare Kanalschätzfunktion verwendet.
-
AUSFÜHRLICHE
BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
DER ERFINDUNG
-
Die
aufgelisteten Figuren beschreiben und veranschaulichen verschiedene
Aspekte der vorliegenden Erfindung.
-
Demgemäß ist 1 eine
graphische Veranschaulichung einer Umgebung, in der Ausführungsbeispiele
der vorliegenden Erfindung verwendet werden können. Die veranschaulichte
Umgebung ist ein Informationsverteilungssystem, wie man es zum Beispiel
in einem Computernetzwerk finden kann, das auf eine ferne Datenbank
zugreift.
-
In 1 sind
die Benutzer 105 mit einem Server 103 gekoppelt.
Die Benutzer können
dann mit der fernen Datenbank 107 unter Verwendung der
Faseroptik 109 kommunizieren. Die Faseroptik kann aufgrund
ihrer großen
Bandbreite verwendet werden, um große Beträge an Daten zwischen Punkten
zu kommunizieren.
-
Die
Datenrate von optischen Kanälen
ist teilweise durch Nichtlinearitäten in dem Kanal beschränkt. Der
Begriff "Kanal", wie er hier verwendet wird,
umfasst den Laser, Verstärker,
die den Laser aussteuern, die Faseroptik, den Photodetektorempfänger und
alle Elemente, die bei der Übertragung und
bei dem Empfang eines Glasfasersignals eingeschlossen sind.
-
Zur
Charakterisierung von optischen Kanälen wurde die Messanordnung
verwendet, wie sie in 2 veranschaulicht ist.
-
2 ist
eine graphische Veranschaulichung einer Geräteanordnung, die verwendet
wird, um optische Kanäle
zu charakterisieren. Ein Signal wird durch Modulation eines Lasers 219 erzeugt.
Das modulierte Lasersignal wird einer Faseroptik 215 bereitgestellt.
In dem Ausführungsbeispiel,
das in 2 veranschaulicht ist, war das Signal, das dem
optischen Kanal bereitgestellt wurde, eine pseudozufällige binäre 1 Gigahertz
(GHz) 127 Bit Sequenz, die von einem Bitfehlerratentester 201 bereitgestellt
worden war. Das sich ergebende empfangene Signal wurde von einem
Photodetektor 207 erkannt, unter Verwendung eines Oszilloskops 205 erfasst
und als eine Datei in dem Computer 209 gespeichert. Unter Verwendung
des Computers 209 kann das empfangene Signal verarbeitet
werden, und die Nichtlinearität,
die in dem empfangenen Signal existiert, kann identifiziert werden.
Der ergriffene Lösungsweg
ist, dass kein Versuch unternommen wird, die Quelle der Nichtlinearität als zu
einer spezifischen Kanalkomponente wie etwa einem Photodetektor
oder Laser oder irgendeiner anderen Quelle zugehörig zu identifizieren. Stattdessen
wurde die Nichtlinearität
in dem empfangenen Signal untersucht, ohne sich Gedanken um die
physische Quelle der Nichtlinearität zu machen.
-
Es
wurden zwei Typen von Lasern getestet. Der erste Typ war ein 850
Nanometer VCSEL (Vertical Cavity Surface Emitting Laser), und der
zweite Typ von Laser war ein 1310 Nanometer DFB (Distributed Feedback)
Laser. Alle Messungen wurden bei einer Datenrate von 1 Gigabit pro
Sekunde durchgeführt.
-
Der
Bitfehlerraten-Datentester 201 erzeugte eine pseudozufällige binäre Sequenz,
die periodisch wiederholt wurde. Die Kanalmessungen wurden mit einer
Datenrate von 1 Gigabit pro Sekunde durchgeführt, aber das Verfahren kann
bei jeder Datenrate angewendet werden.
-
In
der Anordnung, die in 2 veranschaulicht ist, wurden
eine Freiraumoptik und eine optische Bank 221 verwendet.
Der Laser wurde unter Verwendung von Ausrichtungsschrauben ausgerichtet,
so dass der Laser 219, die Faser 215 und die Linsen
so angeordnet wurden, dass das Licht in die Faser 215 fokussiert
war. Der Laser 219 benötigt
einen DC-Bias-Strom, der von der Bias-Stromzufuhr 203 bereitgestellt
wird. Ein Bias-T 211 erlaubt die Kombination des Datensignals
mit einem Bias, um ein korrekt mit einem Bias versehenes Datensignal
an den Laser 219 anzulegen.
-
Ein
Abschnitt der Faser 215 ist in einer Spule enthalten, so
dass lange Fasern bis zu mehr als 1 Kilometer verwendet werden können. In
dem Falle von Einmodenfasern könnte
die Länge
der Spule 700 km überschreiten.
Der Photodetektor 207 ist ein handelsübliches Element, das eine Bandbreite
von 10 Gigahertz aufweist. Das Oszilloskop 205 ist ein
Echtzeitabtastungsoszilloskop, das eine Abtastung bei 8 Gigahertz
durchführt.
Da die Datenrate, die verwendet wurde, 1 Gigabit pro Sekunde betrug,
wurde das empfangene Signal durchschnittlich 8-mal pro Bit abgetastet.
Abtastwerte des empfangenen Signals wurden in dem Speicher des Oszilloskops
erfasst und dann in den Computer 209 in der Form einer
Datei heruntergeladen. Typische empfangene Signaldatendateien enthielten
etwa 65.000 Datenpunkte, die empfangene Abtastwerte der pseudozufälligen Eingabesequenzen
von 127 Bits repräsentierten.
-
Wenn
die Datenpunkte akkumuliert worden sind, können sie verarbeitet werden,
und Informationen über
das Verhalten des optischen Kanals, vor allem die Nichtlinearität, können extrahiert
werden. Außerdem
kann jede mögliche
Nichtsta tionärität des Kanals
identifiziert werden. Mit anderen Worten, wenn der Kanal zeitliche Änderungen
erfährt,
kann eine solche Nichtstationärität erfasst
werden. In den gemessenen Messwerten war aber keine signifikante Nichtstationärität beobachtet
worden.
-
3 ist
eine Tabelle, die Fasern auflistet, die unter Verwendung der Messanordnung
gemessen wurden, die in 2 veranschaulicht ist. Sechs unterschiedliche
Fasern mit Kerndurchmessern von 50 bis 62-1/2 Mikron und den Längen von
270 Meter bis etwa 2,2 Kilometer wurden getestet. Alle Fasern zeigten
in einem variierenden Ausmaß ein
gewisses Dispersionsphänomen
und eine Bandbreitenbegrenzung.
-
Zur
Modellerstellung der Kanal-Nichtlinearität wurden zwei unterschiedliche
mathematische Methoden ausgewählt,
die eine nichtlineare Funktion mit einem Gedächtnis repräsentierten. Da die Dispersion inhärent eine
Funktion mit einem Gedächtnis
ist, ist die sich ergebende Kanal-Nichtlinearität eine nichtlineare Funktion
mit einem Gedächtnis,
im Gegensatz zu einer gedächtnislosen
Nichtlinearität.
Eine gedächtnislose
Nichtlinearität
kann durch eine Funktion in der Form von Y = F(X) dargestellt werden,
wobei die Nichtlinearität
eine willkürliche
nichtlineare Funktion F einer einzigen Variablen ist. Eine Nichtlinearität mit einem
Gedächtnis
kann als eine nichtlineare Funktion einer Anzahl von aufeinander
folgenden Abtastwerten der übertragenen
Daten beschrieben werden, so dass die nichtlineare Funktion mit
Gedächtnis die
Form Y = F(X, Xn-1, Xn-2,
...) aufweist. Mit anderen Worten, eine Nichtlinearität mit Gedächtnis ist
eine Funktion von mehreren Variablen, wobei die Variablen beispielhafte
Abtastwerte der übertragenen
Bitsequenz sind. Eine Nichtlinearität mit Gedächtnis ist eine allgemeinere
Art von Nichtlinearität,
die in optischen Kanälen
zu finden ist. Mit anderen Worten, die Charakteristik eines optischen
Kanals ist nicht nur eine Funktion des aktuellen Bits, sondern hängt auch von
vorher übertragenen
Bits ab.
-
Ein
Modell der Nichtlinearität
in einem optischen Kanal kann als eine Nachschlagetabelle erstellt
werden, zum Beispiel als eine nichtlineare Funktion der fünf zuletzt übertragenen
Bits. In einem digitalen Übertragungssystem
weisen die übertragenen
Bits 2 Levels auf, nämlich
0 und 1 (oder +1 und –1,
je nach der Konvention, die verwendet wird). Aufgrund der diskreten
Natur der übertragenen
Bits kann die Funktion, die einen Kanal in Abhängigkeit von den fünf zuletzt übertragenen
Bits charakterisiert, nur 25 = 32 Werte
aufweisen. Demgemäß gibt es
32 mögliche
Werte, die den Kanal modellieren, indem alle Werte für alle der
möglichen
Sequenzen der letzten 5 eingegebenen Bits aufgelistet werden. Ein
solches Modell kann als eine Nachschlagetabelle implementiert werden.
Die Nachschlagetabelle ist ein Modell mit einem Gedächtnis zur
Charakterisierung eines optischen Kanals, der eine Nichtlinearität aufweist.
-
Ein
zweites optisches Kanalmodell basiert auf einer Volterra Reihe.
Volterra Reihen sind auf dem Gebiet der Mathematik schon eine beträchtliche Zeit
lang eingehend untersucht worden. Volterra Reihen sind eine Art
und Weise, nichtlineare Funktionen darzustellen. Im Allgemeinen
sind Volterra Reihen unendliche Reihen, d.h., eine Reihe mit einer
unendlichen Zahl von Termen. In dem vorliegenden Fall aber ist die
Anzahl an Termen endlich, da die übertragenen Daten binär sind.
Die Anzahl an Termen in der Reihe, die zur Modellerstellung für einen
binären
optischen Kanal verwendet wird, ist 2 hoch N, wobei N die Anzahl
der zuletzt übertragenen
Bits ist, die in Betracht gezogen werden. Das ist die gleiche Anzahl
an Termen wie die Anzahl an Einträgen in einer Nachschlagetabelle.
Folglich ist, ganz gleich, welche Beschreibung verwendet wird, ob
nun der Nachschlagetabellen-Lösungsweg
oder der Volterra Reihen Lösungsweg,
die Anzahl an benötigten
Elementen in jedem Modell 2 hoch N, wobei N die Anzahl der zu allerletzt übertragenen
Bits ist, die in Betracht gezogen werden. In dem Lösungsweg
der Nachschlagetabelle sind die 2 hoch N Parameter die Werte des
Kanals für alle
möglichen
Werte der letzten N Eingabebits.
-
Für die Volterra
Reihen sind die Parameter die Koeffizienten der Reihe, und weil
die Reihe 2N Terme aufweist, gibt es 2N Koeffizienten. 2N ist
die gleiche Anzahl an Parametern, die für das Nachschlagetabellenmodell
benötigt
wird. Folglich ist die maximale Anzahl an Parametern, die benötigt wird, um
die nichtlineare Funktion vollständig
zu spezifizieren, die gleiche, nämlich
2N, ungeachtet dessen, welche Beschreibung
ausgewählt
wird. Es kann gezeigt werden, dass die Volterra Kernel Darstellung
mathematisch äquivalent
zu der Nachschlagetabelle ist. Tatsächlich kann eine mathematische
Transformation, die als die Hadamard Transformation bekannt ist, das
Nachschlagetabellenmodell in das Volterra Kernel Modell und das
Volterra Kernel Modell in das Nachschlagetabellenmodel umformen.
-
N
ist im Allgemeinen ein empirisch bestimmter Wert, wobei der beispielhafte
Wert von N = 5 in dem vorliegenden Ausführungsbeispiel sehr gut zu funktionieren
scheint. Der Wert von N könnte
natürlich
von den Fasern, der Wellenlänge
des Lasers und der Rate der Daten, die übertragen werden, abhängen. Im
Prinzip ist es möglich,
Fasern zu finden, bei denen N größer oder
kleiner ist, aber in den vorliegenden Ausführungsbeispielen ist N = 5
ausreichend.
-
Ein
Vorteil bei der Auswahl der Volterra Reihen Beschreibung liegt darin,
dass es eine Art und Weise gibt, die Beschreibung etwas kompakter
zu machen, indem Terme gruppiert werden. Durch das Gruppieren der
Terme werden 2N Terme in 2(N-1) faltungsähnliche
Terme umgewandelt, die eine Sequenz des Schieberegistertyps aufweisen.
Das bedeutet, dass zum Beispiel die Terme, die in die Sequenz von
gruppierten Termen gehen, Produkte aus Bits sind. So würde zum
Beispiel ein Xn Term mit einem XN-1, Term multipliziert und so weiter. Die
Schieberegistersequenz der gruppierten Terme bedeutet verschobene
Versionen des Produkts. So würde
diese Schieberegistersequenz zum Beispiel in der Form XN·XN-1, XN-1·XN-2, XN-2·XN-3 und so weiter vorliegen. Diese Sequenz
vom Schieberegistertyp ist eine, die Terme der Volterra Reihen als
eine Faltung dieser Art von Sequenz vom Schieberegistertyp mit einem
bestimmten Kernel beschreiben kann. Ein Kernel ist ein Element,
das einer Impulsantwort ähnelt.
Ein Kernel ist keine Impulsantwort im traditionellen Sinn, sondern
eine traditionelle Impulsantwort wird als ein linearer Teil der
nichtlinearen Kernelfunktion verwendet.
-
Terme,
die eine Faltung einer Sequenz vom Schieberegistertyp mit einem
bestimmten Kernel einschließen,
werden als Volterra Kernels (Volterra-Kerne) bezeichnet. Es gibt
mehrere Volterra Kernels, die unterschiedlichen Arten von Produkten
aus Bits entsprechen. Die maximale Anzahl von Volterra Kernels, die
benötigt
wird, um eine N-Bit-Sequenz darzustellen, ist 2N-1.
So ist zum Beispiel in dem Fall, in dem N = 5 ist, die gesamte Anzahl
an Termen in der Volterra Reihe 2N oder
32 Terme. Aber diese 32 Terme können
in 16 Volterra Kernels abgebildet werden. Sechzehn Volterra Kernels
reichen aus, und die Anzahl an Volterra Kernels ist gleich 2(N-1), oder in dem vorliegenden Beispiel
24 oder 16. So gibt es 16 Volterra Kernels,
und die Volterra Kernels können
eine praktischere und kompaktere Beschreibung einer Nichtlinearität bereitstellen,
vor allem deshalb, weil allgemein in vielen Anwendungen die Anzahl
an Volterra Kernels in der Tat weniger als 2(N-1) beträgt. Obwohl die
Anzahl an Volterra Kernels zur theoretischen Definition eines Volterra
Kernel Modells 2(N-1) ist, sind einige der
Kernels sehr klein und können
vernachlässigt
werden. In einigen Situationen kann das Modell für den Kanal effektiv mit einem
oder zwei Volterra Kernels erstellt werden. Das ist die Situation
in den optischen Kanälen
der vorliegenden Erfindung. In den vorliegenden Ausführungsbeispielen
ist die Nichtlinearität
einfach genug, so dass sie vollständig durch einen linearen Term
und ein einziges Volterra Kernel beschrieben werden kann, was anzeigt,
dass eine ziemlich einfache Art von Nichtlinearität vorhanden
ist.
-
Die
Tatsache, dass die Nichtlinearität
einfach ist, bedeutet nicht, dass sie vernachlässigbar ist. Tatsächlich ist
die Nichtlinearität
in den vorliegenden Ausführungsbeispielen
zwar einfach, aber sehr stark. Da die Nichtlinearität eine einfache
Beschreibung aufweist, können
einfache Entzerrer gebaut werden. Mit anderen Worten, es können nichtlineare
Entzerrer mit Gedächtnis,
die relativ einfach, aber sehr leistungsstark sind, gebaut werden.
Solche Entzerrer können
sehr effektiv sein, da sie mit der Nichtlinearität fertig werden können, die
stark ist, wohingegen eine traditionelle Art von linearem Entzerrer
komplett versagen könnte.
-
4 ist
eine graphische Veranschaulichung eines Beispiels eines Systems,
das für
die Kanalidentifikation verwendet werden kann. Das System wird in
Software implementiert.
-
Eingabebits 401 werden
einem Kanal 403 bereitgestellt. Für den Kanal 403 werden
die Messwerte verwendet, die mit der Anordnung gemessen wurden,
die in 2 veranschaulicht ist. So sind die Kanaleingabe
und die Kanalantwort tatsächlich
gemessene Werte.
-
In
dem vorliegenden Ausführungsbeispiel werden
die Messwerte in einer Datei gespeichert und dann offline in einem
Computer unter Verwendung eines Software-Programms verarbeitet,
das den Rest des Systems implementiert, das in 4 veranschaulicht
ist. Dies wurde aus praktischen Gründen so durchgeführt, weil
die Geräte
für die
Anordnung, die in 2 veranschaulicht ist, ohne
weiteres verfügbar
waren. Es besteht aber keine Beschränkung dahingehend, zu verhindern,
dass die vorliegenden offenbarten Verfahren als ein Teil eines Echtzeitsystems
oder eines eingebetteten Systems implementiert werden.
-
Die
Nachschlagetabelle 409 ist adaptiv. Das heißt, der
Wert in ihr kann unter Verwendung des LMS-(Least-Mean-Squared)-Algorithmus
angepasst werden. Was grundsätzlich
getan wird, ist, die gemessene Sequenz aus dem Kanal 403 (die
Datei der empfangenen Werte, die von dem Computer 209 gespeichert
worden ist) mit der Ausgabe der Nachschlagetabelle zu vergleichen.
Die Adressen in der Nachschlagetabelle 409 werden von einem
Schieberegister 407 empfangen, das die Werte der 5 zuletzt eingegebenen
Bits repräsentiert,
die als eine Eingabe an den Kanal bereitgestellt wurden. Zu anfangs werden
die Nachschlagetabellenwerte alle auf Nullen initialisiert, ausgehend
von den Situationen, in denen keine Kenntnis der Nichtlinearität besteht.
In einem solchen Fall wird der Fehler gleich dem Eingangssignal
sein. So wird der Fehler anfänglich
groß sein.
Die Werte in der Nachschlagetabelle können unter Verwendung eines
LMS-Algorithmus angepasst werden, um die Nachschlagetabelle gemäß dem beobachteten
Fehler 405 zu aktualisieren. Der LMS-Algorithmus wird konvergieren,
so dass er danach strebt, den Fehler auf Null oder so nahe wie möglich auf
Null zu steuern.
-
Wenn
die Nachschlagetabelle konvergiert, wird der Fehler klein oder Null
sein. In der tatsächlichen
Praxis kann es sein, dass der Fehler nicht exakt Null ist, weil
das Eingangssignal einen gewissen Grad an weißem Rauschen enthalten kann.
Außerdem
ist es auch möglich,
dass die Nachschlagetabelle nicht die gesamte Nichtlinearität perfekt
modelliert. Es kann einen gewissen Rest nicht ausgewiesener Nichtlinearität geben,
weil N gleich 5 ausgewählt
worden war, aber in der Praxis ein N von 8 oder 10 notwendig gewesen
wäre, um
ein genaueres Modell für die
Faser zu erstellen. Die Auswahl von N ist ein Implementierungsdetail,
das von dem Typ der Faser, der Datenrate und einer Vielfalt anderer
Faktoren abhängt.
-
Außerdem ist
die Nachschlagetabelle in 4 gewissermaßen, wie
wenn sie eine Array hätte,
in der die Adresse geschaffen wird, indem 5 aufeinander folgende
Bits betrachtet werden, aber die Anzahl, auf die zugegriffen wird,
ist eine einzige Zahl, die von mehreren Bits dargestellt werden
könnte,
die 16 Bits oder 24 Bits sein könnten
und als solche einen gewissen Quantisierungsfehler enthalten könnten.
-
5 ist
ein graphisches Beispiel für
eine Kanalidentifikation basierend auf Volterra Kernels. Der Lösungsweg
mit Volterra Kernels ist ein Lösungsweg,
der mathematisch äquivalent
zu der Verwendung einer Nachschlagetabelle ist, wie sie in 4 veranschaulicht
ist. In 5 werden vier Volterra Kernels
verwendet. Normalerweise wären
16 Volterra Kernels in einem Fall vorhanden, bei dem N gleich 5 ist.
In einigen Fällen
können
einige der Volterra Kernels vernachlässigbar sein, und in Abhängigkeit
von der Bitfehlerrate (BER), die benötigt wird, kann es sein, dass
nur die wichtigsten davon in dem Modell berücksichtigt werden müssen, wie
dies zum Beispiel in 5 veranschaulicht ist. In 5 gibt
es zum Beispiel einen linearen Term, der von dem Kernel mit der
Bezeichnung FIR 511 repräsentiert wird. "FIR" zeigt an, dass jeder
Kernel von einem Filter mit endlicher Impulsantwort (FIR; finite
impulse response) repräsentiert
wird. In 5 nimmt das FIR 511 direkt
eine Sequenz von Eingabebits und erzeugt eine Faltung der Eingabesequenz
mit einer Impulsantwort des FIR-Filters 511. Folglich ist
das FIR 511 ein linearer Term, d.h., eine traditionelle
Faltung. Deshalb ist der Kanal essentiell linear, wenn nur ein Term,
der durch FIR 511 repräsentiert
wird, für
das Kanalmodell benötigt
wird. Wenn zusätzlich
zu dem FIR 511 andere Terme vorhanden sind, dann ist das Modell
nichtlinear.
-
Das
FIR 513 ist ein Volterra Kernel, das mit Produkten aus
zwei aufeinander folgenden Bits assoziiert ist, d.h. ein Volterra
Kernel zweiter Ordnung. Das FIR 513 ist ein Volterra Kernel
zweiter Ordnung, weil es einen Term 505 akzeptiert, der
ein Produkt aus dem letzten Eingabebit und dem Bit ist, das dem letzten
Eingabebit vorausgegangen ist. Das letzte eingegebene Bit wird als
AN bezeichnet, und das Bit, das dem letzten
Bit vorausgegangen ist, wird als AN-1, bezeichnet.
-
Das
Volterra Kernel FIR 513 zweiter Ordnung ist mit zwei (aufeinander
folgenden) Bits assoziiert, d.h., Bits, die nur eine Laufzeit (Time
Delay) auseinander liegen, es nimmt das Produkt aus zwei (aufeinander
folgenden) Bits an. Ein anderes Volterra Kernel 515 zweiter
Ordnung wird erzeugt, indem das Produkt aus Bits genommen wird,
die zwei Laufzeiten auseinander liegen, wobei 501 und 503 die
Laufzeiten repräsentieren.
Das allerjüngste
Bit und das Bit vor dem zweitjüngsten
Bit werden multipliziert und resultieren in der Ausgabe 507,
die von dem FIR 515 angenommen wird. Mit anderen Worten,
AN wird hier mit AN-2 multipliziert,
weil dieses um 2 Einheiten verzögert
ist. Das FIR 515 ist ein Filter mit endlicher Impulsantwort
(genauso wie auch das FIR 511 und das FIR 513),
aber die Eingabe ist das Pro dukt aus 2 Bits anstatt nur Bits, und
so ist es ein Volterra Kernel zweiter Ordnung. Das FIR 515 akzeptiert
das Produkt aus den Bits AN und AN-2, so dass es eine andere Art von Volterra
Kernel ist als FIR 513, das sequentielle Bits akzeptiert.
Sowohl das FIR 515 als auch das FIR 513 sind zweiter
Ordnung.
-
Ein
Volterra Kernel FIR 517 dritter Ordnung wird durch das
Produkt (509) aus 3 Bits bestimmt. 509 ist ein
Produkt aus 3 aufeinander folgenden Bits AN,
AN-1, und AN-2.
Demgemäß ist das
FIR 518 ein Volterra Kernel dritter Ordnung.
-
In
dem vereinfachten Modell, das in 5 veranschaulicht
ist, sind nur die oben erwähnten
4 Kernels, nämlich
das lineare Kerne, zwei Kernels zweiter Ordnung und ein Kernel dritter
Ordnung, vorhanden. In der Praxis könnte das Volterra Kernel Modell,
wenn eine Nichtlinearität
sehr stark wäre,
16 Kernels oder mehr aufweisen, wenn N größer als 5 wäre (wobei N die Anzahl der
zu allerletzt übertragenen
Bits ist, die in Betracht gezogen werden sollen). In dem vorliegenden
Ausführungsbeispiel
sind von den 16 Volterra Kernels nur die vier, die in 5 veranschaulicht
sind, wichtig, die anderen sind vernachlässigbar.
-
In
dem vorliegenden Ausführungsbeispiel
ist das FIR 511 und das FIR 513 viel wichtiger
als das FIR 515 und das FIR 517, und tatsächlich könnten das
FIR 515 und das FIR 517 komplett vernachlässigt werden.
-
Das
Volterra Kernel Modell strebt danach, die Beschreibung des Kanals
zu vereinfachen, weil es die Anzahl an unabhängigen Termen reduziert, die in
Betracht gezogen werden müssen.
Die Volterra Kernels können
alle diejenigen Terme zusammen gruppieren, die zeitverschobene Versionen
voneinander sind. In der allgemeineren Volterra-Reihen-Beschreibung
sind alle diese Terme unabhängig
voneinander repräsentiert.
Wenn Gruppen von Termen einer Volterra Reihe zeitverschobene Versionen
von einander sind, können
sie miteinander assoziiert werden, und alle diejenigen, die zeitverschobene
Versionen voneinander sind, können
als ein einziges Volterra Kernel gruppiert werden.
-
Die
beiden äquivalenten
Darstellungen – das Nachschlagetabellenmodell
und das Volterra Kernel Modell – sind
mathematisch äquivalent,
da die Hadamard-Transformation
eines in das andere umformen kann. Der Grund dafür, das eine oder das andere auszuwählen, ist
im Wesentlichen die Leichtigkeit der Implementierung. Das Modell,
welches einfacher ist, ist für
gewöhnlich
von dem bestimmten Problem abhängig,
das zu lösen
versucht wird. Wenn zum Beispiel eine starke lineare Funktion mit
einem kurzen Gedächtnis
vorhanden ist (was kleine Beträge
an Dispersion bedeutet), dann stellt die Nachschlagetabelle wahrscheinlich
ein einfacheres Modell bereit. Die Nachschlagetabelle ist wahrscheinlich
einfacher, weil dann, wenn die Dispersion nicht groß ist, N
nicht groß sein
wird. Wenn N nicht groß ist,
dann bedeutet 2N keine sehr große Anzahl
an Koeffizienten. Aber wenn die Gedächtnisspanne der Nichtlinearität (d.h., N)
wächst,
dann wächst
die Nachschlagetabelle exponentiell, weil die Größe der Nachschlagetabelle 2N ist. Die Größe der Nachschlagetabelle kann
für ein großes N untragbar
komplex werden. In einigen Fällen
können
die Volterra Kernels ein einfacheres Modell bereitstellen, wenn
N groß ist
und die Nichtlinearität
eine einfache Form aufweist, die mit wenigen Kernels beschrieben
werden kann, wie etwa das vorhergehende Beispiel, das auf zwei Kernels
beschränkt
werden konnte.
-
Wenn
N groß ist,
so wird dies generell anzeigen, dass es eine Menge an Dispersion
in dem Kanal gibt, aber die Form der nichtlinearen Funktion könnte sehr
einfach sein. Die Funktion kann einfach genug sein, dass sie wie
bei dem vorhergehenden Beispiel mit nur zwei Volterra Kernels beschrieben
werden kann. Wenn N groß ist
und das Volterra Modell einfacher ist, dann kann die Nichtlinearität vollständig mit zwei
Kernels modelliert werden, obwohl N sehr groß ist. Demgemäß ist die
Volterra Kernel Beschreibung in einigen Fällen einfacher. In anderen
Fällen
ist die Nachschlagetabellen-Beschreibung einfacher.
-
In
den durchgeführten
Untersuchungen benötigte
der Betrag an Dispersion ein N der Größenordnung von 5, aber im Prinzip
könnte
N für bandbreitenmäßig stark
begrenzte Fasern größer sein.
In dem Fall, wenn zwei Volterra Kernels genügen, um ein genaues Kanalmodell
zu schaffen, ungeachtet dessen, wie groß N ist, ist die Volterra Kernel
Beschreibung im Allgemeinen einfacher.
-
6 ist
eine graphische Darstellung, die eine Kanalmessung eines Kanals,
der einen 850 Nanometer VCSEL Laser und eine Faser F0 aufweist, und
das Vergleichen der Signalmessung mit linearen und nichtlinearen
Fasermodellen veranschaulicht. In 6 entspricht
die durchgehende Linie den Beobachtungen, die gestrichelte Linie
stellt das lineare Modell dar, und die strichpunktierte Linie stellt
das nichtlineare Modell dar. Wie aus 601, 603 und 605 ersichtlich
wird, nähert
sich das nichtlineare Modell den Messwerten des Kanals in einem
größeren Grad
an als das lineare Modell. Demgemäß würde, wenn das Kanalmodell auf
ein lineares Modell begrenzt sein würde, keine gute Passung für die übertragenen
Daten erzielt werden. Im Gegensatz dazu kann durch die Verwendung
des nichtlinearen Modells ein beträchtlich feinere Passung erzielt
werden.
-
7 ist
eine graphische Darstellung, die eine Kanalmessung eines Kanals,
der einen 850 Nanometer VCSEL Laser und eine Faser F0 aufweist, und
das Vergleichen der Signalmessung mit einem Betrag an Fehler veranschaulicht,
der durch lineare und nichtlineare Kanalmodelle erzeugt wird. 7 ist eine
graphische Darstellung, die die gleiche Zeit wie die graphische
Darstellung von 6 darstellt, mit der Ausnahme,
dass die Fehler anstatt der Signale selbst gezeigt sind. In 7 ist
der Fehler des linearen Modells durch die Linien mit Kreisen repräsentiert,
und das nichtlineare Modell ist durch die gestrichelte Linie repräsentiert.
Wie ohne weiteres aus der Beobachtung der nichtlinearen Modellpunkte
bei 701 A, B und C und dem Vergleich davon mit den linearen Modellpunkten
bei 703 A, B und C ersichtlich ist, erzielt das nichtlineare
Modell einen wesentlich kleineren Fehler.
-
8 ist
eine graphische Darstellung, die die Impulsantwort und ein Volterra
Kernel zweiter Ordnung für
einen Kanal darstellt, der einen VCSEL Laser mit einer Wellenlänge von
850 Nanometer aufweist und eine Faser F0 verwendet. 8 veranschaulicht
eine Impulsantwort (den linearen Term der Gesamtantwort) bei 801. 8 veranschaulicht
auch die Antwort des Volterra Kernels zweiter Ordnung bei 803.
In dem vorliegenden Ausführungsbeispiel
ist das Volterra Kernel zweiter Ordnung, das mit Produkten aus zwei
aufeinander folgenden Bits assoziiert ist, das einzige signifikante
nichtlineare Kernel. So wird die Antwort des Volterra Kernels zweiter
Ordnung aus dem Produkt aus AN × AN-1, erzeugt, d.h., FIR 513 in 5.
Das FIR 511 entspricht der linearen Kernel-Antwort 801,
und das FIR 513 entspricht der Antwort 803 zweiter
Ordnung. Unter Verwendung nur der Volterra Kernels von FIR 511 und
FIR 513 erhielt man eine nahe Approximation des Kanals,
der nichtlineare Elemente und ein Gedächtnis umfasst. Die gleiche
Methode wurde verwendet, um die restlichen Fasern in der Tabelle
von 3 zu prüfen.
Das Signal-Rausch-Verhältnis
für das
lineare Modell und für das
nichtlineare Modell (welches ein lineares Modell mit nichtlinearer
Addition war) wurde für
jede Faser berechnet.
-
Das
Signal-Rausch-Verhältnis
ist als 10-mal der Logarithmus zur Basis 10 der Signalstärke geteilt durch
die Fehlerstärke
definiert. Zur Berechnung des Signal-Rausch-Verhältnisses wurde die Stärke für das Signal
berechnet. Die Summe der Quadrate der Abtastwerte des Signals ergibt
die gesamte Stärke des
Signals, und die Summe der Quadrate der Abtastwerte des Fehlers
ergibt die Fehlerstärke.
-
Es
gibt zwei Versionen der Fehlerstärke,
eine davon für
das lineare Modell, das ein Volterra Kernel enthält, und das andere für das nichtlineare
Modell, das die weiteren nichtlinearen Volterra Kernels enthält. Das
Ergebnis der Fehlerberechnungen für das lineare Modell und das
nichtlineare Modell wird in der Tabelle von 9 veranschaulicht.
Wie aus der Tabelle von 9 ersichtlich wird, befindet sich
das Signal-Rausch-Verhältnis
für das
lineare Modell in dem Bereich von 12 bis 13 dB. In dem nichtlinearen
Modell ist der Fehler beträchtlich
kleiner, und entsprechend ist das Signal-Rausch-Verhältnis in
dem Bereich von 23 bis 25 dB wesentlich höher. Das nichtlineare Modell
erzeugt ein Modell, das ein um 10 bis 13 dB besseres Signal-Rausch-Verhältnis aufweist, was
eine wesentliche Verbesserung ist.
-
Die
vorher beschriebenen Messungen wurden alle bei einer Wellenlänge von
850 Nanometer durchgeführt.
In den gemessenen Messwerten war die Nichtlinearität bei 850
Nanometer viel größer als bei
1310 Nanometer. Wenn die gleichen Messungen bei 1310 Nanometer wiederholt
werden, scheint das lineare Modell sehr adäquat zu sein.
-
10 ist
eine graphische Darstellung von gemessenen Signalen gegenüber einem
linearem Modell und dem Fehler zwischen dem gemessenen Signal und
dem linearen Modell. Demgemäß erscheint
das lineare Kanalmodell mit der vorliegenden Datenrate und den vorliegenden
Fasern bei 1310 Nanometer ziemlich genau zu sein. Die graphische
Darstellung von 10 veranschaulicht das gemessene Signal
als eine durchgehende Linie. Die graphische Darstellung von 10 ist
das Ergebnis eines linearen Modells, das als die Linie mit Kreisen
gezeigt ist. Die Linie mit Kreuzen stellt den Fehler dar.
-
11 ist
eine graphische Darstellung der Impulsantwort und eines Volterra
Kernels zweiter Ordnung für
den Kanal, der die Faser F0 und einen DFB Laser umfasst, der eine
Wellenlänge
von 1310 Nanometer aufweist. Die Impulsantwort ist bei 1101 veranschaulicht,
und das Volterra Kernel zweiter Ordnung ist bei 1103 veranschaulicht.
Das Volterra Kernel zweiter Ordnung ist beinahe Null und müsste aller
Wahrscheinlichkeit nach in einem Modell des Kanals nicht in Betracht
gezogen werden.
-
12 ist
eine Tabelle von Signal-Rausch-Verhältnissen für ein lineares Kanalmodell,
das einen DFB Laser aufweist, der bei einer Wellenlänge von
1310 Nanometer arbeitet. Alle Kanal-Signal-Rausch-Verhältnisse
aller gemessenen Kanäle, die
bei einer Wellenlänge
von 1310 Nanometer arbeiten, lagen in dem Bereich von 26 bis 28
dB, was anzeigt, dass ein nichtlinearer Term bei einer Wellenlänge von
1310 Nanometer für
eine Datenrate von einem Gigahertz nicht unbedingt benötigt wird.
-
Zusätzliche
Messungen wurden durchgeführt,
die Fälle
einschlossen, bei denen eine mechanische Bewegung einer Faser während des
Messprozesses eingeführt
wurde, um die bewegungsinduzierte Nichtstationärität der allgemeinen Antwort bzw. Reaktion
zu untersuchen. Diese Beobachtungen bezüglich der Nichtstationärität wurden
durchgeführt, weil
bis zu einem gewissen Grad geglaubt wird, dass der optische Kanal
zeitlich gesehen nicht stationär ist,
und wenn eine Vibration in die Faser eingeführt wird, kann eine gewisse
Neuverteilung der Moden in den Fasern die Antwort bzw. Reaktion
der Faser ändern,
und folglich kann der Kanal zeitabhängig sein. Es wurde kein Beweis
für eine
signifikante Änderung in
der Faserantwort als ein Ergebnis der Bewegung beobachtet.
-
Langsame Änderungen
in dem Kanal können
durch den LMS-Algorithmus kompensiert werden, der das Kanalmodell
anpasst, um diese Arten von Änderungen
zu verfolgen.
-
Ein
Computerprogramm wurde für
die Kanaluntersuchungen verwendet. Im Wesentlichen nimmt das Programm
einen Eingabeblock an Daten aus den Messungen, verarbeitet ihn und
trainiert dann den Canceller (Kompensator). Dann berechnet es die Volterra
Kernel Koeffizienten des Modells unter Verwendung des linearen Modells
oder des nichtlinearen Modells. Das Programm berechnet ein Signal-Rausch-Verhältnis und
druckt die Ergebnisse aus.
-
13 ist
ein Blockdiagramm eines optischen Empfängers, der einen nichtlinearen
optischen Kanalentzerrer umfasst. Der nichtlineare optische Kanalentzerrer 1300 nimmt
ein Signal an, das lineare und nichtlineare Komponenten enthält.
-
Das
elektrische Signal ergibt sich allgemein aus der Umwandlung eines
optischen Signals in den elektrischen Bereich unter Verwendung eines
optisch-elektrischen
Wandlers 1307, wie etwa zum Beispiel eine PIN-Diode, ein
Avalanche Photodetektor (APD) oder ein anderer Detektor. Das Signal
von dem optisch-elektrischen
Wandler wird unter Verwendung eines Transimpedanzverstärkers (TIA) 1309 und
eines Nachverstärkers 1311 verstärkt. Der Nachverstärker 1311 sollte
ein Signal, das ihm bereitgestellt wird, im Allgemeinen nicht hart
begrenzen, da die harte Begrenzung eine Nichtlinearität einführen kann.
-
Nach
dem Verarbeiten des Signals, das ihm zugeführt worden ist, kann der Nachverstärker 1311 ein
verarbeitetes Signal einem optionalen Analogverarbeitungsblock 1313 bereitstellen.
Der Analogverarbeitungsblock 1313 kann eine solche analoge
Verarbeitung wie eine Filterung und eine automatische Verstärkungsregelung
bereitstellen, bevor ein Ausgangssignal einem Analog-Digital-Wandler 1315 bereitgestellt
wird. Das Ausgangssignal von dem Analog-Digital-Wandler wandelt
das elektrische Signal, das von dem optionalen Analogverarbeitungsblock 131 bereitgestellt
worden ist, in eine digitale Multibitdarstellung um, bevor die digitale
Multibitdarstellung einem nichtlinearen optischen Kanalentzerrer 1300 bereitgestellt
wird. Der nichtlineare optische Entzerrer 1300 arbeitet
in dem digitalen Bereich und kann unter Verwendung einer digitalen
Speziallogik oder eines programmierbaren digitalen Universal-Signalprozessors
implementiert werden. Vor dem Eintritt in den nichtlinearen optischen
Entzerrer 1300 kann das Multibitsignal zusätzliche
Vorverarbeitungsschritte wie zum Beispiel Filtern, lineare Entzerrung,
Interferenzauslöschung,
etc. in einem optionalen digitalen Verarbeitungsblock 1317 durchlaufen.
Der Entzerrer 1300 ist ein entscheidungsrückgekoppelter
Entzerrer, der einen Detektor wie zum Beispiel einen Slicer 1303,
einen Kompensator wie zum Beispiel ein Subtrahierglied 1301 und
einen Rückkopplungsblock 1305 umfasst.
Der Rückkopplungsblock 1305 umfasst
eine nichtlineare Kanalschätzfunktion,
die eine Nachschlagetabelle, wie sie in 4 veranschaulicht ist,
oder den Volterra Kernel Lösungsweg
verwendet, wie er in 5 veranschaulicht ist. Eine
Schwierigkeit bei der Benutzung des Nachschlagetabellen-Lösungswegs
von 4 oder des Volterra Kernel Lösungswegs, wie er in 5 veranschaulicht
ist, liegt darin, dass in beiden Fällen die Volterra Kernel Koeffizienten
oder die Nachschlagetabellenkoeffizienten identifiziert werden müssen. Eine
Lösung
für dieses Problem
der Koeffizientenidentifikation liegt darin, dass der Sender eine
Trainingssequenz sendet, die dem Empfänger a priori bekannt ist.
Die nichtlineare Kanalschätzfunktion 1305 kann
dann unter Verwendung der bekannten Trainingssequenz trainiert werden.
In einem solchen Fall würde
der Funktionsablauf der nichtlinearen Kanalschätzfunktion 1305 fortschreiten,
wie dies in 4 oder 5 dargestellt
ist, da die Bitsequenz bekannt wäre
und Unterschiede, die von dem Kanal erzeugt würden, ohne weiteres identifiziert
werden könnten.
-
In
der Praxis kann es sein, dass keine Trainingssequenz benötigt wird,
da die Entscheidungen 1307 des entscheidungsrückgekoppelten
Entzerrers 1300 und der nichtlinearen Kanalschätzfunktion 1305 immer
noch konvergieren können.
Zu anfangs werden die Entscheidungen 1307 aufgrund der
Tatsache, dass die Kanalschätzfunktion 1305 nicht
trainiert ist, viele Fehler aufweisen. Aber in den meisten Kanälen geht
die Neigung in Richtung auf gute Entscheidungen. Die meisten entscheidungsrückgekoppelten
Entzerrer werden konvergieren, wenn die Kanäle keine exzessiven Intersymbolinterferenzen
(ISI) zeigen. Folglich gibt es sowohl gute wie auch schlechte Entscheidungen,
wenn die Koeffizienten in der nichtlinearen Kanalschätzfunktion 1305 zu
anfangs inkorrekt sind. Solange die guten Entscheidungen den schlechten
Entscheidungen zahlenmäßig überlegen
sind, wird es einen konvergierenden Trend geben, und die nichtlineare
Kanalschätzfunktion 1305 wird
schließlich
dazu tendieren, zu konvergieren.
-
Die
nichtlineare Kanalschätzfunktion 1305 kann
auch unter Verwendung eines LMS-Algorithmus trainiert werden, wie
dies in der 4 oder 5 veranschaulicht
ist. Wenn die Koeffizienten beginnen, sich in der nichtlinearen
Kanalschätzfunktion 1305 zu
verbessern, hilft die Verbesserung dabei, einen größeren Prozentsatz
an richtigen Entscheidungen zu treffen, was die Konvergenz des nichtlinearen Kanalschätzungsfilters 1305 weiter
unterstützt. Wenn
die Werte in dem Schätzungsfilter
schließlich konvergieren,
dann wird die nichtlineare Kanalschätzfunktion 1305 die
Koeffizienten so modifiziert haben, dass im Wesentlichen alle korrekten
Entscheidungen getroffen werden. Jede inkorrekte Entscheidung, die
von dem System getroffen wird, neigt dazu, die Werte in der nichtlinearen
Kanalschätzfunktion 1305 zu
verfälschen,
aber solange die korrekten Entscheidungen den inkorrekten Entscheidungen zahlenmäßig überlegen
sind, wird die nichtlineare Kanalschätzfunktion auf eine im Wesentlichen
korrekte Lösung
hin konvergieren. Mit anderen Worten, solange die Mehrzahl der Entscheidungen
korrekt ist, werden die Koeffizienten der nichtlinearen Kanalschätzfunktion 1305 eine
Nettobewegung in der richtigen Richtung aufweisen und konvergieren.
-
Wenn
einmal eine anfängliche
Konvergenz in der nichtlinearen Kanalschätzfunktion 1305 vorliegt,
wird das Signal zu dem Slicer 1303 verbessert, da wenigstens
ein Teil der Intersymbolinterferenz in der Summierungseinheit 1301 ausgelöscht bzw. kompensiert
wird. Als eine Folge davon steigt die Anzahl an korrekten Entscheidungen 1307 an,
was zu einer besseren Kanalschätzung
führt.
Frühere
Entscheidungen werden in der nichtlinearen Kanalschätzfunktion 1305 gespeichert
und werden verwendet, um eine Reproduktion der Intersymbolinterferenz
zu berechnen, um diese der Summierungseinheit 1301 bereitzustellen.
-
Wenn
eine Volterra Kernel Struktur ähnlich wie
in 5 für
die nichtlineare Kanalschätzfunktion verwendet
wird, dann wird das Gedächtnis
der vergangenen Entscheidungen in den FIR-Filtern 511 bis 517 gespeichert,
die jeweils nominell eine FIR-Verzögerungsleitungsstruktur enthalten.
Wenn der Lösungsweg
der Nach schlagetabelle verwendet wird, dann wird das Gedächtnis für die früheren Entscheidungen
in einem Schieberegister gespeichert, wie dasjenige, das bei 407 in
der 4 veranschaulicht ist.
-
14A ist ein Blockdiagramm eines beispielhaften
nichtlinearen Kanalentzerrers, wie er in dem nichtlinearen entscheidungsrückgekoppelten Entzerrer
von 13 verwendet werden kann. Die nichtlineare Kanalschätzfunktion
von 14 ist dem Volterra Kernel Modell ähnlich,
das in 5 veranschaulicht ist. Das Volterra Kernel Modell
von 5 wurde als eine Veranschaulichung der Charakterisierung
des Kanals verwendet. Die nichtlineare Kanalschätzfunktion, die in 14 veranschaulicht ist, weist eine LMS-Aktualisierungsschleife ähnlich der 5 auf.
Außerdem
würde ähnlich wie
bei der 5 die Anzahl der verwendeten
Volterra Kernels von den Charakteristiken des Kanals und des Lasers abhängen, der
zum Steuern des Kanals verwendet wird.
-
In 14A wird ein Signal 1427, das von einem
optischen Kanal bereitgestellt und in ein elektrisches Signal umgewandelt
worden ist, von einem optischen Kanalentzerrer angenommen, der allgemein bei 1400 gezeigt
ist. Der Entzerrer 1400 nimmt das Signal 1427 in
eine Summierungseinheit 1301 auf, in der ein (negiertes)
Korrektursignal 1429 hinzugefügt wird, das die vorausgesagte
Intersymbolinterferenz repräsentiert.
Vor dem Training und der Konvergenz der Volterra Kernel Schätzfunktion
ist das Korrektursignal Null oder ein willkürlicher Wert. Der Slicer 1303 trifft
Entscheidungen 1307 bezüglich
der Werte des übertragenen
Signals. Die Entscheidungen 1307 werden von der Volterra
Kernel Schätzfunktion 1401 akzeptiert,
die die Nichtlinearitäten
des Kanals modelliert, der das Signal dem Entzerrer 1400 bereitstellt.
Die Ausgabe der Volterra Kernel Schätzfunktion stellt einen Wert
einer vorausgesagten Intersymbolinterferenz 1429 bereit,
der dann von dem akzeptierten Signal subtrahiert werden kann, um
ein übertragenes
Signal, das übertragen
worden ist, genau wiederzuerschaffen.
-
Der
Fehler in der vorausgesagten Intersymbolinterferenz 1429 wird
durch das Vergleichen von Entscheidungen 1307 von dem Slicer 1303 mit
dem Eingangssignal 1422 geschätzt, das in der Summierungseinheit 1301 durch
das Entfernen der vorausgesagten Intersymbolinterferenz ISI 1429 angepasst worden
ist. Die Entscheidungen 1307 und der Fehler 1425 werden
verwendet, um die FIR-Filter 511, 513, 515 und 517 anzupassen,
die beispielhaft die FIR-Filter veranschaulichen, die die Volterra
Kernel Schätzfunktion 1401 enthalten.
Auf eine solche Art und Weise kann die Volterra Kernel Schätzfunktion
trainiert werden und können
Nichtlinearitäten
in dem Kanal kompensiert werden, der das Signal dem Entzerrer 1400 bereitstellt.
-
14B ist ein beispielhaftes Blockdiagramm eines
nichtlinearen optischen Kanalentzerrers gemäß dem Ausführungsbeispiel der Erfindung, der
eine Nachschlagetabellen-Kanalschätzfunktion verwendet. In 14B kann ein LMS-Algorithmus zur Anpassung der Werte
in der Nachschlagetabelle 1435 verwendet werden. Das System 14B kann
so betrieben werden, dass das Training des Entzerrers erreicht wird,
indem ein Signal verarbeitet wird, das von einem optischen Kanal
bereitgestellt wird, Fehlersignale bestimmt werden und der Entzerrer 1401 angepasst
wird. Auf eine solche Art und Weise kann der Entzerrer trainiert
werden, um die Kanalparameter zu modellieren. Die Fachleute auf
diesem Gebiet werden erkennen, dass die Entzerrer trainiert werden können, indem
eine bekannte Sequenz verwendet wird. Da eine solche Sequenz a priori
bekannt ist, kann der Unterschied zwischen der Antwort des Kanals
und der gewünschten
Antwort des Kanals, d.h., der bekannten Sequenz, problemlos bestimmt
werden. Solche Sequenzen können
die Zeit verkürzen, die
notwendig ist, um einen nichtlinearen optischen Kanalentzerrer zu
trainieren.
-
Eine
nichtlineare Kanalschätzfunktion
könnte
auch basierend auf dem Nachschlagetabellen-Lösungsweg aufgebaut werden,
wie er in 4 veranschaulicht ist. Die Implementierung
einer solchen Nachschlagetabellen-Version ist eine direkte Anpassung
der Kanalcharakterisierungsschaltung, die in 4 veranschaulicht
ist.
-
15 ist
ein Blockdiagramm einer nichtlinearen Kanalschätzfunktion, die mit einem Viterbi Decodierer
kombiniert ist. Anstelle eines entscheidungsrückgekoppelten Entzerrers kann
ein Viterbi Decodierer verwendet werden. Eine nichtlineare Kanalschätzfunktion 1501 würde verwendet
werden, um das erwartete Signal zu berechnen, das zu den Zweigmetrikberechnungen 1503 geht.
Der Rest des Viterbi Decodierer-Systems, der den eigentlichen Viterbi
Decodierer selbst einschließt,
nämlich
der Block 1505, ist dem linearen Fall ähnlich. Die nichtlineare Kanalschätzfunktion 1501 erzeugt
ein Modell des empfangenen Signals. Wenn die nichtlineare Kanalschätzfunktion 1501 ein
Gedächtnis
aufweist, das k Bits umfasst, das heißt, dass sie sich an die letzten
k Eingänge
erinnert, dann hätte
der Viterbi Decodierer 1505 2(k-1) Zustände. Deshalb
wäre der
Viterbi Decodierer 1505 dann, wenn k = 3 wäre, ein
4-Zustands-Viterbi Decodierer. Wenn die nichtlineare Kanalschätzfunktion 1501 ein
Gedächtnis
von 3 Bits aufweist, dann kann sie acht unterschiedliche erwartete
Werte des empfangenen Signals unterstützen. Dies würde mit
einer Nachschlagetabelle mit acht Stellen implementiert. Die erwarteten
Werte des empfangenen Signals werden von den Zweigmetrikberechnungen 1503 verwendet,
um die gesamten Zweigmetriken in dem Viterbi Decodierer zu berechnen.
-
Der
Viterbi Decodierer, der in 15 veranschaulicht
ist, ist der gleiche wie ein Viterbi Decodierer des Standardtyps,
mit Ausnahme der Tatsache, dass die Kanalschätzfunktion eine nichtlineare
Kanalschätzfunktion
mit Gedächtnis
ist. Die Nichtlinearität
wird entweder in der Form einer Nachschlagetabelle oder in der Form
eines Volterra Kernels ausgedrückt.
-
Der
Viterbi Decodierer umfasst einen Empfänger zum Empfangen eines Signals,
das lineare und nichtlineare Komponenten einschließt. Eine nichtlineare
Kanalschätzfunktion
berechnet die erwarteten Werte des empfangenen Signals. Ein Zweigmetrik-Rechner
berechnet die Zweigmetriken basierend auf den erwarteten Werten
des empfangenen Signals. Ein Standard-Viterbi-Decodierer akzeptiert
die berechneten Zweigmetriken und decodiert das empfangene Signal.
Die nichtlineare Kanalschätzfunktion
kann unter Verwendung einer Volterra Kernel Schätzfunktion, wie dies bei 1401 in 14A veranschaulicht ist, oder unter Verwendung
einer Nachschlagetabellen-Implementierung hergestellt werden, wie
dies bei 1433 in 14B veranschaulicht
ist.