DE60126656T2

DE60126656T2 - Verfahren zur Identifizierung und Charakteriesierung von Nichtlinearitäten in optischen Nachrichtenübertragungskanälen

Info

Publication number: DE60126656T2
Application number: DE60126656T
Authority: DE
Inventors: E. Oscar Irvine AGAZZI
Original assignee: Broadcom Corp
Current assignee: Broadcom Corp
Priority date: 2000-11-22
Filing date: 2001-11-21
Publication date: 2007-11-08
Anticipated expiration: 2021-11-22
Also published as: US20020060827A1; DE60141183D1; EP1344361B1; WO2002043340A9; EP1344361A2; WO2002043340A2; US7251297B2; DE60126656D1; WO2002043340A3; AU2002226933A1

Description

GEBIET DER ERFINDUNG
Die vorliegende Erfindung betrifft Verfahren, die dazu verwendet werden, Kommunikationskanäle zu charakterisieren, und in besonderen Ausführungsbeispielen betrifft sie Verfahren, die dazu verwendet werden, nichtlineare optische Kommunikationskanäle zu charakterisieren und Modelle dafür zu erstellen.
HINTERGRUND DER ERFINDUNG
Eine Signalverzerrung in einem optischen Kanal kann durch Nichtlinearitäten verursacht werden, die in verschiedenen Komponenten existieren, die in einem optischen Kanal enthalten sind. Eine solche Verzerrung kann durch mathematische Modelle des nichtlinearen Verhaltens des optischen Kommunikationskanals charakterisiert werden. Durch die Verwendung solcher Modelle können kompensatorische Maßnahmen, wie zum Beispiel Entzerrer, entworfen werden, die die Verzerrung ausgleichen, die die Leistung des Kanals verschlechtert.
Eine Quelle für die Verzerrung ist die Dispersion. Die Dispersion kann eine Kombination aus linearen und nichtlinearen Komponenten sein.
Die Dispersion, die man in Glasfasern antrifft, vor allem in Multimodenfasern, kann die Bandbreite in optischen Kanälen begrenzen. Das Problem der Dispersion kann in Multimodenfasern im Allgemeinen größer sein, aber sie kann auch ein Problem in Einmodenfasern darstellen, vor allem bei langen Faserlängen. Einmodenfasern weisen für gewöhnlich eine geringere Dispersion auf als Multimodenfasern. Die Dispersion, die für gewöhnlich in Einmodenfasern anzutreffen ist, kann die chromatische Dispersion oder die Polarisationsmodendispersion sein. Die Dispersion, die in Einmodenfasern zu sehen ist, ist im Allgemeinen um ein großes Maß geringer pro Abschnitt als die Dispersion, die in Multimodenfasern angefunden wird. Die Dispersion ist aber kumulativ, und so neigt sie dazu, mit der Zunahme der Länge der Fasern größer zu werden. Demgemäß gelten die Verfahren, die hier im Hinblick auf Multimodenfasern erörtert werden, auf gleiche Weise auch für Einmodenfasern.
In Multimodenfasern bewirken die mehreren Moden der Ausbreitung innerhalb der Faser für gewöhnlich eine Dispersion. Im Allgemeinen weist das Lichtsignal in den verschiedenen Ausbreitungsmoden innerhalb einer Faser unterschiedliche Ausbreitungsgeschwindigkeiten auf. So wird sich der Impuls dann, wenn ein Lichtimpuls von einem Sender gesendet wird, in mehreren Moden ausbreiten, die sich mit unterschiedlichen Geschwindigkeiten vorwärts bewegen. Der Impuls, der sich in jedem Mode bewegt, wird den Empfänger zu unterschiedlichen Zeiten erreichen. Die mehreren Ankunftszeiten des Eingangsimpulses, der sich in mehreren Moden vorwärts bewegt, erzeugt einen verzerrten Impuls, nämlich so etwas wie eine auf verschiedene Zeitpunkte verteilte Version des übertragenen Impulses.
Optische Kanäle sind inhärent nichtlinear. Elektromagnetische Felder können durch Maxwellsche Gleichungen beschrieben werden, die linear sind. Da Maxwellsche Gleichungen linear sind, trifft das Prinzip der Superposition auf das elektromagnetische Feld zu. Was aber in optischen Kanälen moduliert wird, ist nicht das elektromagnetische Feld per se, sondern die optische Energie. Die Superposition trifft nicht exakt auf die optische Energie zu.
Ein optischer Photodetektor ist für gewöhnlich eine Vorrichtung, die einer quadratischen Funktion folgt (square law device). Der Photodetektor spricht linear auf die optische Energie an; tatsächlich ist der Photostrom, der von einem Photodetektor erzeugt wird, für gewöhnlich eine sehr genaue lineare Funktion der optischen Energie, aber die Energie ist eine quadratische Funktion des elektromagnetischen Feldes, wodurch eine Quelle an Nichtlinearität erzeugt wird.
Es hat sich gezeigt, dass dann, wenn ein Laser eine große spektrale Breite aufweist, anstatt ein sehr monochromatischer Laser zu sein, die signifikante spektrale Breite dazu neigt, zu einer Linearisierung des Kanals zu führen, selbst wenn der Effekt der optischen Energie und die quadratische Natur des Photodetektors in Betracht gezogen werden. Mit anderen Worten, wenn ein Laser ein sehr monochromatisches, enges Spektrum aufweist, dann neigt der Kanal dazu, sich weniger linear zu verhalten als dies ein Laser tun würde, der ein breiteres Spektrum aufweist.
Ein nichtlineares Verhalten in einem optischen Kanal kann in einem variierenden Ausmaß von den Eigenschaften des Photodetektors und der Faser abhängen. Außerdem besteht eine Möglichkeit der Verzerrung von dem Laser selbst her. Wenn eine Dispersion in dem Laser vorhanden ist, zum Beispiel deshalb, weil der Laser selbst eine gewisse Bandbreitenbegrenzung aufweist, dann könnte die Nichtlinearität des Lasers auch zu der gesamten Nichtlinearität in dem optischen Kanal beitragen.
Wenn die Intensität eines optischen Signals hoch ist, kann eine Glasfaser, die das optische Signal überträgt, selbst Nichtlinearitäten einführen. Diese Nichtlinearitäten können sich aus der Tatsache ergeben, dass der Brechungsindex der Glasfaser bis zu einem gewissen Grad von der Intensität des optischen Signals selbst abhängt. Dieser Effekt bewirkt für gewöhnlich Nichtlinearitäten, die als "Vier-Wellen-Mischung", "Selbstphasenmodulation" und "Kreuzphasenmodulation" bekannt sind. Weitere Nichtlinearitäten können sich aus den Phänomenen ergeben, die als induzierte Raman-Streuung und induzierte Brillouin-Streuung bekannt sind. Für eine umfassendere Behandlung von Nichtlinearitäten siehe den Text "Fiber-Optic Communication Systems", zweite Ausgabe, von Govind P. Agrawal, John Wiley und Söhne, 1997, ISBN 0-471-17540-4.
Obwohl die oben genannten Quellen der Nichtlinearität in einem optischen Kanal als Beispiele präsentiert worden sind, können auch noch andere Quellen exis tieren. Die in dieser Offenbarung beschriebenen Verfahren können auf alle Arten von Nichtlinearitäten angewendet werden, und zwar ungeachtet ihrer physischen Quelle, was den Fachleuten auf diesem Gebiet klar sein wird.
In "Adaptive constellation of non-linear inter-symbol interference for voiceband data transmission", IEEE Journal on Selected Areas in Communications, Band SAC-2, Nr. 5, September 1984, beschreiben Biglieri et al. ein Signalverarbeitungsverfahren zur Abschwächung der Effekte der Intersymbolinterferenz in Glasfaser-Weitverkehrssystemen, das ein nichtlineares adaptives Kompensationssystem verwendet, das in "Electrical signal processing techniques in long-haul, fiber-optic systems", Winters et al., IEEE International Conference on Communications ICC '90, 03.09.1990, beschrieben ist.
In "Adaptive linearization schemes for weakly non-linear systems using adaptive linear and non-linear FIR filters" Circuits and Systems, 1990, Proceedings of the 33^rd Midwest Symposium on Calgary, Alta., Kanada, 12.–14. August 1990, New York, NY, USA, IEEE, beschreiben Gao et al. ebenfalls ein nichtlineares adaptives Kompensationssystem, das nichtlineare Filter mit endlicher Impulsantwort (finite impulse response filter; FIR-Filter) verwendet. Für die Konstruktion dieser FIR-Filter werden abgebrochene Volterra-Reihen verwendet.
In "Nonlinear echo cancelling using look-up tables and Volterra systems", Weruaga-Prieto, L.; Figueiras-Vidal, A.R.; Vis. Image Signal Process, IEEE Proc, Band 141, Nr. 6, Dezember 1994, nutzt ein Echokompensator LMS-LUT. Der Anhang offenbart eine Äquivalenz zwischen LMS-LUT und Volterra Reihen.
Es ist eine Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zur Modellerstellung für das Verhalten eines Datenkanals bereitzustellen.
Diese Aufgabe wird von dem Verfahren von Anspruch 1 erreicht. Bevorzugte Ausführungsbeispiele sind in den Unteransprüchen definiert.
In einer Ausführungsform der Erfindung veranschaulicht die Offenbarung ein Verfahren zur Modellerstellung für das Verhalten eines Datenkanals. Um dieses Modell zu erstellen, wird die Datensequenz, welche an den Datenkanal eingegeben worden ist, untersucht. Ein Teil der Datensequenz, welche an den Datenkanal eingegeben worden ist, wird als ein Index für einen Kanalmodellwert verwendet. Ausgegebene Daten von dem Kanal werden abgetastet. Ein numerischer Kanalmodellwert wird mit dem abgetasteten Wert verglichen, und der Kanalmodellwert wird basierend auf den Ergebnissen des Vergleichs angepasst.
In einer anderen Ausführungsform der Erfindung wird ein Verfahren zur Modellerstellung für das Verhalten eines Datenkanals unter Verwendung von Volterra Kernels (Volterra-Kernen) veranschaulicht. Eine Sequenz von Daten wird dem Datenkanal bereitgestellt. Ein Teil der Datensequenz, welche an den Kanal eingegeben worden ist, wird dem Volterra Kernel Modell des Kanals bereitgestellt. Das Volterra Kernel (VK) Modell erzeugt einen Kanalmodellwert. Die Datenwerte, die aus dem Kanal durch Messung erhalten werden, werden mit dem VK-Kanalmodellwert verglichen, und die Ergebnisse werden dazu verwendet, das Volterra Kernel Modell zu aktualisieren.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Die Merkmale, Ausführungsformen und Vorteile der vorliegenden Erfindung, die in der obigen Zusammenfassung beschrieben worden sind, werden unter Bezugnahme auf die nachfolgende Beschreibung, die angehängten Ansprüche und die beigefügten Zeichnungen besser verständlich, in denen:
1 eine graphische Veranschaulichung einer Umgebung ist, in der Ausführungsbeispiele der vorliegenden Erfindung verwendet werden können.
2 eine graphische Veranschaulichung einer Geräteanordnung ist, die verwendet werden kann, um optische Kanäle zu charakterisieren.
3 eine Tabelle ist, die Fasern auflistet, die unter Verwendung der Messanordnung gemessen wurden, die in 2 veranschaulicht ist.
4 eine graphische Veranschaulichung eines Beispiels eines Systems ist, das zur Kanalidentifizierung verwendet werden kann.
5 eine graphische Veranschaulichung einer Kanalidentifikation basierend auf Volterra Kernels (VK) ist.
6 eine graphische Darstellung ist, die die Messung eines Kanals, der einen 850 Nanometer VCSEL (Vertical Cavity Surface Emitting Laser) und eine Faser F0 aufweist, und den Vergleich der Signalmessungen mit linearen und nichtlinearen Kanalmodellen veranschaulicht.
7 eine graphische Darstellung ist, die die Messung eines Kanals, der einen 850 Nanometer VCSEL und eine Faser F0 aufweist, und den Vergleich des Betrags des Fehlers veranschaulicht, der durch lineare und nichtlineare Kanalmodelle erzeugt worden ist.
8 eine graphische Darstellung ist, die eine Impulsantwort und eine Volterra Kernel zweiter Ordnung für einen 850 Nanometer VCSEL und eine Faser F0 repräsentiert.
9 eine Tabelle der Signal-Rausch-Verhältnisse ist, die für lineare und nichtlineare Kanalmodelle für einen Kanal berechnet worden sind, der bei einer Wellenlänge von 850 Nanometer betrieben wird.
10 eine graphische Darstellung ist, die ein lineares Modell, ein gemessenes Signal und einen Fehler in einem Kanal vergleicht, der eine Faser F0 bei einer Wellenlänge von 1310 Nanometer verwendet.
11 eine graphische Darstellung der Impulsantwort und eines Volterra Kernels zweiter Ordnung für einen Kanal ist, der eine Faser F0 und einen Distributed Feedback (DFB) Laser mit 1310 Nanometer Wellenlänge verwendet.
12 eine Tabelle von Signal-Rausch-Verhältnissen für ein lineares Modell eines Kanals ist, der einen 1310 Nanometer DFB Laser verwendet.
13 ein Blockdiagramm eines nichtlinearen optischen Kanalentzerrers gemäß einem Ausführungsbeispiel der Erfindung ist.
14A ein Blockdiagramm eines nichtlinearen optischen Kanalentzerrers gemäß einem Ausführungsbeispiel der Erfindung ist, der eine Volterra Kernel Schätzfunktion verwendet.
14B ein Blockdiagramm eines nichtlinearen optischen Kanalentzerrers gemäß einem Ausführungsbeispiel der Erfindung ist, der eine Nachschlagetabellen-Kanalschätzfunktion verwendet.
15 ein Viterbi Decodierer ist, der gemäß einem Ausführungsbeispiel der Erfindung eine nichtlineare Kanalschätzfunktion verwendet.
AUSFÜHRLICHE BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN DER ERFINDUNG
Die aufgelisteten Figuren beschreiben und veranschaulichen verschiedene Aspekte der vorliegenden Erfindung.
Demgemäß ist 1 eine graphische Veranschaulichung einer Umgebung, in der Ausführungsbeispiele der vorliegenden Erfindung verwendet werden können. Die veranschaulichte Umgebung ist ein Informationsverteilungssystem, wie man es zum Beispiel in einem Computernetzwerk finden kann, das auf eine ferne Datenbank zugreift.
In 1 sind die Benutzer 105 mit einem Server 103 gekoppelt. Die Benutzer können dann mit der fernen Datenbank 107 unter Verwendung der Faseroptik 109 kommunizieren. Die Faseroptik kann aufgrund ihrer großen Bandbreite verwendet werden, um große Beträge an Daten zwischen Punkten zu kommunizieren.
Die Datenrate von optischen Kanälen ist teilweise durch Nichtlinearitäten in dem Kanal beschränkt. Der Begriff "Kanal", wie er hier verwendet wird, umfasst den Laser, Verstärker, die den Laser aussteuern, die Faseroptik, den Photodetektorempfänger und alle Elemente, die bei der Übertragung und bei dem Empfang eines Glasfasersignals eingeschlossen sind.
Zur Charakterisierung von optischen Kanälen wurde die Messanordnung verwendet, wie sie in 2 veranschaulicht ist.
2 ist eine graphische Veranschaulichung einer Geräteanordnung, die verwendet wird, um optische Kanäle zu charakterisieren. Ein Signal wird durch Modulation eines Lasers 219 erzeugt. Das modulierte Lasersignal wird einer Faseroptik 215 bereitgestellt. In dem Ausführungsbeispiel, das in 2 veranschaulicht ist, war das Signal, das dem optischen Kanal bereitgestellt wurde, eine pseudozufällige binäre 1 Gigahertz (GHz) 127 Bit Sequenz, die von einem Bitfehlerratentester 201 bereitgestellt worden war. Das sich ergebende empfangene Signal wurde von einem Photodetektor 207 erkannt, unter Verwendung eines Oszilloskops 205 erfasst und als eine Datei in dem Computer 209 gespeichert. Unter Verwendung des Computers 209 kann das empfangene Signal verarbeitet werden, und die Nichtlinearität, die in dem empfangenen Signal existiert, kann identifiziert werden. Der ergriffene Lösungsweg ist, dass kein Versuch unternommen wird, die Quelle der Nichtlinearität als zu einer spezifischen Kanalkomponente wie etwa einem Photodetektor oder Laser oder irgendeiner anderen Quelle zugehörig zu identifizieren. Stattdessen wurde die Nichtlinearität in dem empfangenen Signal untersucht, ohne sich Gedanken um die physische Quelle der Nichtlinearität zu machen.
Es wurden zwei Typen von Lasern getestet. Der erste Typ war ein 850 Nanometer VCSEL (Vertical Cavity Surface Emitting Laser), und der zweite Typ von Laser war ein 1310 Nanometer DFB (Distributed Feedback) Laser. Alle Messungen wurden bei einer Datenrate von 1 Gigabit pro Sekunde durchgeführt.
Der Bitfehlerraten-Datentester 201 erzeugte eine pseudozufällige binäre Sequenz, die periodisch wiederholt wurde. Die Kanalmessungen wurden mit einer Datenrate von 1 Gigabit pro Sekunde durchgeführt, aber das Verfahren kann bei jeder Datenrate angewendet werden.
In der Anordnung, die in 2 veranschaulicht ist, wurden eine Freiraumoptik und eine optische Bank 221 verwendet. Der Laser wurde unter Verwendung von Ausrichtungsschrauben ausgerichtet, so dass der Laser 219, die Faser 215 und die Linsen so angeordnet wurden, dass das Licht in die Faser 215 fokussiert war. Der Laser 219 benötigt einen DC-Bias-Strom, der von der Bias-Stromzufuhr 203 bereitgestellt wird. Ein Bias-T 211 erlaubt die Kombination des Datensignals mit einem Bias, um ein korrekt mit einem Bias versehenes Datensignal an den Laser 219 anzulegen.
Ein Abschnitt der Faser 215 ist in einer Spule enthalten, so dass lange Fasern bis zu mehr als 1 Kilometer verwendet werden können. In dem Falle von Einmodenfasern könnte die Länge der Spule 700 km überschreiten. Der Photodetektor 207 ist ein handelsübliches Element, das eine Bandbreite von 10 Gigahertz aufweist. Das Oszilloskop 205 ist ein Echtzeitabtastungsoszilloskop, das eine Abtastung bei 8 Gigahertz durchführt. Da die Datenrate, die verwendet wurde, 1 Gigabit pro Sekunde betrug, wurde das empfangene Signal durchschnittlich 8-mal pro Bit abgetastet. Abtastwerte des empfangenen Signals wurden in dem Speicher des Oszilloskops erfasst und dann in den Computer 209 in der Form einer Datei heruntergeladen. Typische empfangene Signaldatendateien enthielten etwa 65.000 Datenpunkte, die empfangene Abtastwerte der pseudozufälligen Eingabesequenzen von 127 Bits repräsentierten.
Wenn die Datenpunkte akkumuliert worden sind, können sie verarbeitet werden, und Informationen über das Verhalten des optischen Kanals, vor allem die Nichtlinearität, können extrahiert werden. Außerdem kann jede mögliche Nichtsta tionärität des Kanals identifiziert werden. Mit anderen Worten, wenn der Kanal zeitliche Änderungen erfährt, kann eine solche Nichtstationärität erfasst werden. In den gemessenen Messwerten war aber keine signifikante Nichtstationärität beobachtet worden.
3 ist eine Tabelle, die Fasern auflistet, die unter Verwendung der Messanordnung gemessen wurden, die in 2 veranschaulicht ist. Sechs unterschiedliche Fasern mit Kerndurchmessern von 50 bis 62-1/2 Mikron und den Längen von 270 Meter bis etwa 2,2 Kilometer wurden getestet. Alle Fasern zeigten in einem variierenden Ausmaß ein gewisses Dispersionsphänomen und eine Bandbreitenbegrenzung.
Zur Modellerstellung der Kanal-Nichtlinearität wurden zwei unterschiedliche mathematische Methoden ausgewählt, die eine nichtlineare Funktion mit einem Gedächtnis repräsentierten. Da die Dispersion inhärent eine Funktion mit einem Gedächtnis ist, ist die sich ergebende Kanal-Nichtlinearität eine nichtlineare Funktion mit einem Gedächtnis, im Gegensatz zu einer gedächtnislosen Nichtlinearität. Eine gedächtnislose Nichtlinearität kann durch eine Funktion in der Form von Y = F(X) dargestellt werden, wobei die Nichtlinearität eine willkürliche nichtlineare Funktion F einer einzigen Variablen ist. Eine Nichtlinearität mit einem Gedächtnis kann als eine nichtlineare Funktion einer Anzahl von aufeinander folgenden Abtastwerten der übertragenen Daten beschrieben werden, so dass die nichtlineare Funktion mit Gedächtnis die Form Y = F(X, X_n-1, X_n-2, ...) aufweist. Mit anderen Worten, eine Nichtlinearität mit Gedächtnis ist eine Funktion von mehreren Variablen, wobei die Variablen beispielhafte Abtastwerte der übertragenen Bitsequenz sind. Eine Nichtlinearität mit Gedächtnis ist eine allgemeinere Art von Nichtlinearität, die in optischen Kanälen zu finden ist. Mit anderen Worten, die Charakteristik eines optischen Kanals ist nicht nur eine Funktion des aktuellen Bits, sondern hängt auch von vorher übertragenen Bits ab.
Ein Modell der Nichtlinearität in einem optischen Kanal kann als eine Nachschlagetabelle erstellt werden, zum Beispiel als eine nichtlineare Funktion der fünf zuletzt übertragenen Bits. In einem digitalen Übertragungssystem weisen die übertragenen Bits 2 Levels auf, nämlich 0 und 1 (oder +1 und –1, je nach der Konvention, die verwendet wird). Aufgrund der diskreten Natur der übertragenen Bits kann die Funktion, die einen Kanal in Abhängigkeit von den fünf zuletzt übertragenen Bits charakterisiert, nur 2⁵ = 32 Werte aufweisen. Demgemäß gibt es 32 mögliche Werte, die den Kanal modellieren, indem alle Werte für alle der möglichen Sequenzen der letzten 5 eingegebenen Bits aufgelistet werden. Ein solches Modell kann als eine Nachschlagetabelle implementiert werden. Die Nachschlagetabelle ist ein Modell mit einem Gedächtnis zur Charakterisierung eines optischen Kanals, der eine Nichtlinearität aufweist.
Ein zweites optisches Kanalmodell basiert auf einer Volterra Reihe. Volterra Reihen sind auf dem Gebiet der Mathematik schon eine beträchtliche Zeit lang eingehend untersucht worden. Volterra Reihen sind eine Art und Weise, nichtlineare Funktionen darzustellen. Im Allgemeinen sind Volterra Reihen unendliche Reihen, d.h., eine Reihe mit einer unendlichen Zahl von Termen. In dem vorliegenden Fall aber ist die Anzahl an Termen endlich, da die übertragenen Daten binär sind. Die Anzahl an Termen in der Reihe, die zur Modellerstellung für einen binären optischen Kanal verwendet wird, ist 2 hoch N, wobei N die Anzahl der zuletzt übertragenen Bits ist, die in Betracht gezogen werden. Das ist die gleiche Anzahl an Termen wie die Anzahl an Einträgen in einer Nachschlagetabelle. Folglich ist, ganz gleich, welche Beschreibung verwendet wird, ob nun der Nachschlagetabellen-Lösungsweg oder der Volterra Reihen Lösungsweg, die Anzahl an benötigten Elementen in jedem Modell 2 hoch N, wobei N die Anzahl der zu allerletzt übertragenen Bits ist, die in Betracht gezogen werden. In dem Lösungsweg der Nachschlagetabelle sind die 2 hoch N Parameter die Werte des Kanals für alle möglichen Werte der letzten N Eingabebits.
Für die Volterra Reihen sind die Parameter die Koeffizienten der Reihe, und weil die Reihe 2^N Terme aufweist, gibt es 2^N Koeffizienten. 2^N ist die gleiche Anzahl an Parametern, die für das Nachschlagetabellenmodell benötigt wird. Folglich ist die maximale Anzahl an Parametern, die benötigt wird, um die nichtlineare Funktion vollständig zu spezifizieren, die gleiche, nämlich 2^N, ungeachtet dessen, welche Beschreibung ausgewählt wird. Es kann gezeigt werden, dass die Volterra Kernel Darstellung mathematisch äquivalent zu der Nachschlagetabelle ist. Tatsächlich kann eine mathematische Transformation, die als die Hadamard Transformation bekannt ist, das Nachschlagetabellenmodell in das Volterra Kernel Modell und das Volterra Kernel Modell in das Nachschlagetabellenmodel umformen.
N ist im Allgemeinen ein empirisch bestimmter Wert, wobei der beispielhafte Wert von N = 5 in dem vorliegenden Ausführungsbeispiel sehr gut zu funktionieren scheint. Der Wert von N könnte natürlich von den Fasern, der Wellenlänge des Lasers und der Rate der Daten, die übertragen werden, abhängen. Im Prinzip ist es möglich, Fasern zu finden, bei denen N größer oder kleiner ist, aber in den vorliegenden Ausführungsbeispielen ist N = 5 ausreichend.
Ein Vorteil bei der Auswahl der Volterra Reihen Beschreibung liegt darin, dass es eine Art und Weise gibt, die Beschreibung etwas kompakter zu machen, indem Terme gruppiert werden. Durch das Gruppieren der Terme werden 2^N Terme in 2^(N-1) faltungsähnliche Terme umgewandelt, die eine Sequenz des Schieberegistertyps aufweisen. Das bedeutet, dass zum Beispiel die Terme, die in die Sequenz von gruppierten Termen gehen, Produkte aus Bits sind. So würde zum Beispiel ein X_n Term mit einem X_N-1, Term multipliziert und so weiter. Die Schieberegistersequenz der gruppierten Terme bedeutet verschobene Versionen des Produkts. So würde diese Schieberegistersequenz zum Beispiel in der Form X_N·X_N-1, X_N-1·X_N-2, X_N-2·X_N-3 und so weiter vorliegen. Diese Sequenz vom Schieberegistertyp ist eine, die Terme der Volterra Reihen als eine Faltung dieser Art von Sequenz vom Schieberegistertyp mit einem bestimmten Kernel beschreiben kann. Ein Kernel ist ein Element, das einer Impulsantwort ähnelt. Ein Kernel ist keine Impulsantwort im traditionellen Sinn, sondern eine traditionelle Impulsantwort wird als ein linearer Teil der nichtlinearen Kernelfunktion verwendet.
Terme, die eine Faltung einer Sequenz vom Schieberegistertyp mit einem bestimmten Kernel einschließen, werden als Volterra Kernels (Volterra-Kerne) bezeichnet. Es gibt mehrere Volterra Kernels, die unterschiedlichen Arten von Produkten aus Bits entsprechen. Die maximale Anzahl von Volterra Kernels, die benötigt wird, um eine N-Bit-Sequenz darzustellen, ist 2^N-1. So ist zum Beispiel in dem Fall, in dem N = 5 ist, die gesamte Anzahl an Termen in der Volterra Reihe 2^N oder 32 Terme. Aber diese 32 Terme können in 16 Volterra Kernels abgebildet werden. Sechzehn Volterra Kernels reichen aus, und die Anzahl an Volterra Kernels ist gleich 2^(N-1), oder in dem vorliegenden Beispiel 2⁴ oder 16. So gibt es 16 Volterra Kernels, und die Volterra Kernels können eine praktischere und kompaktere Beschreibung einer Nichtlinearität bereitstellen, vor allem deshalb, weil allgemein in vielen Anwendungen die Anzahl an Volterra Kernels in der Tat weniger als 2^(N-1) beträgt. Obwohl die Anzahl an Volterra Kernels zur theoretischen Definition eines Volterra Kernel Modells 2^(N-1) ist, sind einige der Kernels sehr klein und können vernachlässigt werden. In einigen Situationen kann das Modell für den Kanal effektiv mit einem oder zwei Volterra Kernels erstellt werden. Das ist die Situation in den optischen Kanälen der vorliegenden Erfindung. In den vorliegenden Ausführungsbeispielen ist die Nichtlinearität einfach genug, so dass sie vollständig durch einen linearen Term und ein einziges Volterra Kernel beschrieben werden kann, was anzeigt, dass eine ziemlich einfache Art von Nichtlinearität vorhanden ist.
Die Tatsache, dass die Nichtlinearität einfach ist, bedeutet nicht, dass sie vernachlässigbar ist. Tatsächlich ist die Nichtlinearität in den vorliegenden Ausführungsbeispielen zwar einfach, aber sehr stark. Da die Nichtlinearität eine einfache Beschreibung aufweist, können einfache Entzerrer gebaut werden. Mit anderen Worten, es können nichtlineare Entzerrer mit Gedächtnis, die relativ einfach, aber sehr leistungsstark sind, gebaut werden. Solche Entzerrer können sehr effektiv sein, da sie mit der Nichtlinearität fertig werden können, die stark ist, wohingegen eine traditionelle Art von linearem Entzerrer komplett versagen könnte.
4 ist eine graphische Veranschaulichung eines Beispiels eines Systems, das für die Kanalidentifikation verwendet werden kann. Das System wird in Software implementiert.
Eingabebits 401 werden einem Kanal 403 bereitgestellt. Für den Kanal 403 werden die Messwerte verwendet, die mit der Anordnung gemessen wurden, die in 2 veranschaulicht ist. So sind die Kanaleingabe und die Kanalantwort tatsächlich gemessene Werte.
In dem vorliegenden Ausführungsbeispiel werden die Messwerte in einer Datei gespeichert und dann offline in einem Computer unter Verwendung eines Software-Programms verarbeitet, das den Rest des Systems implementiert, das in 4 veranschaulicht ist. Dies wurde aus praktischen Gründen so durchgeführt, weil die Geräte für die Anordnung, die in 2 veranschaulicht ist, ohne weiteres verfügbar waren. Es besteht aber keine Beschränkung dahingehend, zu verhindern, dass die vorliegenden offenbarten Verfahren als ein Teil eines Echtzeitsystems oder eines eingebetteten Systems implementiert werden.
Die Nachschlagetabelle 409 ist adaptiv. Das heißt, der Wert in ihr kann unter Verwendung des LMS-(Least-Mean-Squared)-Algorithmus angepasst werden. Was grundsätzlich getan wird, ist, die gemessene Sequenz aus dem Kanal 403 (die Datei der empfangenen Werte, die von dem Computer 209 gespeichert worden ist) mit der Ausgabe der Nachschlagetabelle zu vergleichen. Die Adressen in der Nachschlagetabelle 409 werden von einem Schieberegister 407 empfangen, das die Werte der 5 zuletzt eingegebenen Bits repräsentiert, die als eine Eingabe an den Kanal bereitgestellt wurden. Zu anfangs werden die Nachschlagetabellenwerte alle auf Nullen initialisiert, ausgehend von den Situationen, in denen keine Kenntnis der Nichtlinearität besteht. In einem solchen Fall wird der Fehler gleich dem Eingangssignal sein. So wird der Fehler anfänglich groß sein. Die Werte in der Nachschlagetabelle können unter Verwendung eines LMS-Algorithmus angepasst werden, um die Nachschlagetabelle gemäß dem beobachteten Fehler 405 zu aktualisieren. Der LMS-Algorithmus wird konvergieren, so dass er danach strebt, den Fehler auf Null oder so nahe wie möglich auf Null zu steuern.
Wenn die Nachschlagetabelle konvergiert, wird der Fehler klein oder Null sein. In der tatsächlichen Praxis kann es sein, dass der Fehler nicht exakt Null ist, weil das Eingangssignal einen gewissen Grad an weißem Rauschen enthalten kann. Außerdem ist es auch möglich, dass die Nachschlagetabelle nicht die gesamte Nichtlinearität perfekt modelliert. Es kann einen gewissen Rest nicht ausgewiesener Nichtlinearität geben, weil N gleich 5 ausgewählt worden war, aber in der Praxis ein N von 8 oder 10 notwendig gewesen wäre, um ein genaueres Modell für die Faser zu erstellen. Die Auswahl von N ist ein Implementierungsdetail, das von dem Typ der Faser, der Datenrate und einer Vielfalt anderer Faktoren abhängt.
Außerdem ist die Nachschlagetabelle in 4 gewissermaßen, wie wenn sie eine Array hätte, in der die Adresse geschaffen wird, indem 5 aufeinander folgende Bits betrachtet werden, aber die Anzahl, auf die zugegriffen wird, ist eine einzige Zahl, die von mehreren Bits dargestellt werden könnte, die 16 Bits oder 24 Bits sein könnten und als solche einen gewissen Quantisierungsfehler enthalten könnten.
5 ist ein graphisches Beispiel für eine Kanalidentifikation basierend auf Volterra Kernels. Der Lösungsweg mit Volterra Kernels ist ein Lösungsweg, der mathematisch äquivalent zu der Verwendung einer Nachschlagetabelle ist, wie sie in 4 veranschaulicht ist. In 5 werden vier Volterra Kernels verwendet. Normalerweise wären 16 Volterra Kernels in einem Fall vorhanden, bei dem N gleich 5 ist. In einigen Fällen können einige der Volterra Kernels vernachlässigbar sein, und in Abhängigkeit von der Bitfehlerrate (BER), die benötigt wird, kann es sein, dass nur die wichtigsten davon in dem Modell berücksichtigt werden müssen, wie dies zum Beispiel in 5 veranschaulicht ist. In 5 gibt es zum Beispiel einen linearen Term, der von dem Kernel mit der Bezeichnung FIR 511 repräsentiert wird. "FIR" zeigt an, dass jeder Kernel von einem Filter mit endlicher Impulsantwort (FIR; finite impulse response) repräsentiert wird. In 5 nimmt das FIR 511 direkt eine Sequenz von Eingabebits und erzeugt eine Faltung der Eingabesequenz mit einer Impulsantwort des FIR-Filters 511. Folglich ist das FIR 511 ein linearer Term, d.h., eine traditionelle Faltung. Deshalb ist der Kanal essentiell linear, wenn nur ein Term, der durch FIR 511 repräsentiert wird, für das Kanalmodell benötigt wird. Wenn zusätzlich zu dem FIR 511 andere Terme vorhanden sind, dann ist das Modell nichtlinear.
Das FIR 513 ist ein Volterra Kernel, das mit Produkten aus zwei aufeinander folgenden Bits assoziiert ist, d.h. ein Volterra Kernel zweiter Ordnung. Das FIR 513 ist ein Volterra Kernel zweiter Ordnung, weil es einen Term 505 akzeptiert, der ein Produkt aus dem letzten Eingabebit und dem Bit ist, das dem letzten Eingabebit vorausgegangen ist. Das letzte eingegebene Bit wird als A_N bezeichnet, und das Bit, das dem letzten Bit vorausgegangen ist, wird als A_N-1, bezeichnet.
Das Volterra Kernel FIR 513 zweiter Ordnung ist mit zwei (aufeinander folgenden) Bits assoziiert, d.h., Bits, die nur eine Laufzeit (Time Delay) auseinander liegen, es nimmt das Produkt aus zwei (aufeinander folgenden) Bits an. Ein anderes Volterra Kernel 515 zweiter Ordnung wird erzeugt, indem das Produkt aus Bits genommen wird, die zwei Laufzeiten auseinander liegen, wobei 501 und 503 die Laufzeiten repräsentieren. Das allerjüngste Bit und das Bit vor dem zweitjüngsten Bit werden multipliziert und resultieren in der Ausgabe 507, die von dem FIR 515 angenommen wird. Mit anderen Worten, A_N wird hier mit A_N-2 multipliziert, weil dieses um 2 Einheiten verzögert ist. Das FIR 515 ist ein Filter mit endlicher Impulsantwort (genauso wie auch das FIR 511 und das FIR 513), aber die Eingabe ist das Pro dukt aus 2 Bits anstatt nur Bits, und so ist es ein Volterra Kernel zweiter Ordnung. Das FIR 515 akzeptiert das Produkt aus den Bits A_N und A_N-2, so dass es eine andere Art von Volterra Kernel ist als FIR 513, das sequentielle Bits akzeptiert. Sowohl das FIR 515 als auch das FIR 513 sind zweiter Ordnung.
Ein Volterra Kernel FIR 517 dritter Ordnung wird durch das Produkt (509) aus 3 Bits bestimmt. 509 ist ein Produkt aus 3 aufeinander folgenden Bits A_N, A_N-1, und A_N-2. Demgemäß ist das FIR 518 ein Volterra Kernel dritter Ordnung.
In dem vereinfachten Modell, das in 5 veranschaulicht ist, sind nur die oben erwähnten 4 Kernels, nämlich das lineare Kerne, zwei Kernels zweiter Ordnung und ein Kernel dritter Ordnung, vorhanden. In der Praxis könnte das Volterra Kernel Modell, wenn eine Nichtlinearität sehr stark wäre, 16 Kernels oder mehr aufweisen, wenn N größer als 5 wäre (wobei N die Anzahl der zu allerletzt übertragenen Bits ist, die in Betracht gezogen werden sollen). In dem vorliegenden Ausführungsbeispiel sind von den 16 Volterra Kernels nur die vier, die in 5 veranschaulicht sind, wichtig, die anderen sind vernachlässigbar.
In dem vorliegenden Ausführungsbeispiel ist das FIR 511 und das FIR 513 viel wichtiger als das FIR 515 und das FIR 517, und tatsächlich könnten das FIR 515 und das FIR 517 komplett vernachlässigt werden.
Das Volterra Kernel Modell strebt danach, die Beschreibung des Kanals zu vereinfachen, weil es die Anzahl an unabhängigen Termen reduziert, die in Betracht gezogen werden müssen. Die Volterra Kernels können alle diejenigen Terme zusammen gruppieren, die zeitverschobene Versionen voneinander sind. In der allgemeineren Volterra-Reihen-Beschreibung sind alle diese Terme unabhängig voneinander repräsentiert. Wenn Gruppen von Termen einer Volterra Reihe zeitverschobene Versionen von einander sind, können sie miteinander assoziiert werden, und alle diejenigen, die zeitverschobene Versionen voneinander sind, können als ein einziges Volterra Kernel gruppiert werden.
Die beiden äquivalenten Darstellungen – das Nachschlagetabellenmodell und das Volterra Kernel Modell – sind mathematisch äquivalent, da die Hadamard-Transformation eines in das andere umformen kann. Der Grund dafür, das eine oder das andere auszuwählen, ist im Wesentlichen die Leichtigkeit der Implementierung. Das Modell, welches einfacher ist, ist für gewöhnlich von dem bestimmten Problem abhängig, das zu lösen versucht wird. Wenn zum Beispiel eine starke lineare Funktion mit einem kurzen Gedächtnis vorhanden ist (was kleine Beträge an Dispersion bedeutet), dann stellt die Nachschlagetabelle wahrscheinlich ein einfacheres Modell bereit. Die Nachschlagetabelle ist wahrscheinlich einfacher, weil dann, wenn die Dispersion nicht groß ist, N nicht groß sein wird. Wenn N nicht groß ist, dann bedeutet 2^N keine sehr große Anzahl an Koeffizienten. Aber wenn die Gedächtnisspanne der Nichtlinearität (d.h., N) wächst, dann wächst die Nachschlagetabelle exponentiell, weil die Größe der Nachschlagetabelle 2^N ist. Die Größe der Nachschlagetabelle kann für ein großes N untragbar komplex werden. In einigen Fällen können die Volterra Kernels ein einfacheres Modell bereitstellen, wenn N groß ist und die Nichtlinearität eine einfache Form aufweist, die mit wenigen Kernels beschrieben werden kann, wie etwa das vorhergehende Beispiel, das auf zwei Kernels beschränkt werden konnte.
Wenn N groß ist, so wird dies generell anzeigen, dass es eine Menge an Dispersion in dem Kanal gibt, aber die Form der nichtlinearen Funktion könnte sehr einfach sein. Die Funktion kann einfach genug sein, dass sie wie bei dem vorhergehenden Beispiel mit nur zwei Volterra Kernels beschrieben werden kann. Wenn N groß ist und das Volterra Modell einfacher ist, dann kann die Nichtlinearität vollständig mit zwei Kernels modelliert werden, obwohl N sehr groß ist. Demgemäß ist die Volterra Kernel Beschreibung in einigen Fällen einfacher. In anderen Fällen ist die Nachschlagetabellen-Beschreibung einfacher.
In den durchgeführten Untersuchungen benötigte der Betrag an Dispersion ein N der Größenordnung von 5, aber im Prinzip könnte N für bandbreitenmäßig stark begrenzte Fasern größer sein. In dem Fall, wenn zwei Volterra Kernels genügen, um ein genaues Kanalmodell zu schaffen, ungeachtet dessen, wie groß N ist, ist die Volterra Kernel Beschreibung im Allgemeinen einfacher.
6 ist eine graphische Darstellung, die eine Kanalmessung eines Kanals, der einen 850 Nanometer VCSEL Laser und eine Faser F0 aufweist, und das Vergleichen der Signalmessung mit linearen und nichtlinearen Fasermodellen veranschaulicht. In 6 entspricht die durchgehende Linie den Beobachtungen, die gestrichelte Linie stellt das lineare Modell dar, und die strichpunktierte Linie stellt das nichtlineare Modell dar. Wie aus 601, 603 und 605 ersichtlich wird, nähert sich das nichtlineare Modell den Messwerten des Kanals in einem größeren Grad an als das lineare Modell. Demgemäß würde, wenn das Kanalmodell auf ein lineares Modell begrenzt sein würde, keine gute Passung für die übertragenen Daten erzielt werden. Im Gegensatz dazu kann durch die Verwendung des nichtlinearen Modells ein beträchtlich feinere Passung erzielt werden.
7 ist eine graphische Darstellung, die eine Kanalmessung eines Kanals, der einen 850 Nanometer VCSEL Laser und eine Faser F0 aufweist, und das Vergleichen der Signalmessung mit einem Betrag an Fehler veranschaulicht, der durch lineare und nichtlineare Kanalmodelle erzeugt wird. 7 ist eine graphische Darstellung, die die gleiche Zeit wie die graphische Darstellung von 6 darstellt, mit der Ausnahme, dass die Fehler anstatt der Signale selbst gezeigt sind. In 7 ist der Fehler des linearen Modells durch die Linien mit Kreisen repräsentiert, und das nichtlineare Modell ist durch die gestrichelte Linie repräsentiert. Wie ohne weiteres aus der Beobachtung der nichtlinearen Modellpunkte bei 701 A, B und C und dem Vergleich davon mit den linearen Modellpunkten bei 703 A, B und C ersichtlich ist, erzielt das nichtlineare Modell einen wesentlich kleineren Fehler.
8 ist eine graphische Darstellung, die die Impulsantwort und ein Volterra Kernel zweiter Ordnung für einen Kanal darstellt, der einen VCSEL Laser mit einer Wellenlänge von 850 Nanometer aufweist und eine Faser F0 verwendet. 8 veranschaulicht eine Impulsantwort (den linearen Term der Gesamtantwort) bei 801. 8 veranschaulicht auch die Antwort des Volterra Kernels zweiter Ordnung bei 803. In dem vorliegenden Ausführungsbeispiel ist das Volterra Kernel zweiter Ordnung, das mit Produkten aus zwei aufeinander folgenden Bits assoziiert ist, das einzige signifikante nichtlineare Kernel. So wird die Antwort des Volterra Kernels zweiter Ordnung aus dem Produkt aus A_N × A_N-1, erzeugt, d.h., FIR 513 in 5. Das FIR 511 entspricht der linearen Kernel-Antwort 801, und das FIR 513 entspricht der Antwort 803 zweiter Ordnung. Unter Verwendung nur der Volterra Kernels von FIR 511 und FIR 513 erhielt man eine nahe Approximation des Kanals, der nichtlineare Elemente und ein Gedächtnis umfasst. Die gleiche Methode wurde verwendet, um die restlichen Fasern in der Tabelle von 3 zu prüfen. Das Signal-Rausch-Verhältnis für das lineare Modell und für das nichtlineare Modell (welches ein lineares Modell mit nichtlinearer Addition war) wurde für jede Faser berechnet.
Das Signal-Rausch-Verhältnis ist als 10-mal der Logarithmus zur Basis 10 der Signalstärke geteilt durch die Fehlerstärke definiert. Zur Berechnung des Signal-Rausch-Verhältnisses wurde die Stärke für das Signal berechnet. Die Summe der Quadrate der Abtastwerte des Signals ergibt die gesamte Stärke des Signals, und die Summe der Quadrate der Abtastwerte des Fehlers ergibt die Fehlerstärke.
Es gibt zwei Versionen der Fehlerstärke, eine davon für das lineare Modell, das ein Volterra Kernel enthält, und das andere für das nichtlineare Modell, das die weiteren nichtlinearen Volterra Kernels enthält. Das Ergebnis der Fehlerberechnungen für das lineare Modell und das nichtlineare Modell wird in der Tabelle von 9 veranschaulicht. Wie aus der Tabelle von 9 ersichtlich wird, befindet sich das Signal-Rausch-Verhältnis für das lineare Modell in dem Bereich von 12 bis 13 dB. In dem nichtlinearen Modell ist der Fehler beträchtlich kleiner, und entsprechend ist das Signal-Rausch-Verhältnis in dem Bereich von 23 bis 25 dB wesentlich höher. Das nichtlineare Modell erzeugt ein Modell, das ein um 10 bis 13 dB besseres Signal-Rausch-Verhältnis aufweist, was eine wesentliche Verbesserung ist.
Die vorher beschriebenen Messungen wurden alle bei einer Wellenlänge von 850 Nanometer durchgeführt. In den gemessenen Messwerten war die Nichtlinearität bei 850 Nanometer viel größer als bei 1310 Nanometer. Wenn die gleichen Messungen bei 1310 Nanometer wiederholt werden, scheint das lineare Modell sehr adäquat zu sein.
10 ist eine graphische Darstellung von gemessenen Signalen gegenüber einem linearem Modell und dem Fehler zwischen dem gemessenen Signal und dem linearen Modell. Demgemäß erscheint das lineare Kanalmodell mit der vorliegenden Datenrate und den vorliegenden Fasern bei 1310 Nanometer ziemlich genau zu sein. Die graphische Darstellung von 10 veranschaulicht das gemessene Signal als eine durchgehende Linie. Die graphische Darstellung von 10 ist das Ergebnis eines linearen Modells, das als die Linie mit Kreisen gezeigt ist. Die Linie mit Kreuzen stellt den Fehler dar.
11 ist eine graphische Darstellung der Impulsantwort und eines Volterra Kernels zweiter Ordnung für den Kanal, der die Faser F0 und einen DFB Laser umfasst, der eine Wellenlänge von 1310 Nanometer aufweist. Die Impulsantwort ist bei 1101 veranschaulicht, und das Volterra Kernel zweiter Ordnung ist bei 1103 veranschaulicht. Das Volterra Kernel zweiter Ordnung ist beinahe Null und müsste aller Wahrscheinlichkeit nach in einem Modell des Kanals nicht in Betracht gezogen werden.
12 ist eine Tabelle von Signal-Rausch-Verhältnissen für ein lineares Kanalmodell, das einen DFB Laser aufweist, der bei einer Wellenlänge von 1310 Nanometer arbeitet. Alle Kanal-Signal-Rausch-Verhältnisse aller gemessenen Kanäle, die bei einer Wellenlänge von 1310 Nanometer arbeiten, lagen in dem Bereich von 26 bis 28 dB, was anzeigt, dass ein nichtlinearer Term bei einer Wellenlänge von 1310 Nanometer für eine Datenrate von einem Gigahertz nicht unbedingt benötigt wird.
Zusätzliche Messungen wurden durchgeführt, die Fälle einschlossen, bei denen eine mechanische Bewegung einer Faser während des Messprozesses eingeführt wurde, um die bewegungsinduzierte Nichtstationärität der allgemeinen Antwort bzw. Reaktion zu untersuchen. Diese Beobachtungen bezüglich der Nichtstationärität wurden durchgeführt, weil bis zu einem gewissen Grad geglaubt wird, dass der optische Kanal zeitlich gesehen nicht stationär ist, und wenn eine Vibration in die Faser eingeführt wird, kann eine gewisse Neuverteilung der Moden in den Fasern die Antwort bzw. Reaktion der Faser ändern, und folglich kann der Kanal zeitabhängig sein. Es wurde kein Beweis für eine signifikante Änderung in der Faserantwort als ein Ergebnis der Bewegung beobachtet.
Langsame Änderungen in dem Kanal können durch den LMS-Algorithmus kompensiert werden, der das Kanalmodell anpasst, um diese Arten von Änderungen zu verfolgen.
Ein Computerprogramm wurde für die Kanaluntersuchungen verwendet. Im Wesentlichen nimmt das Programm einen Eingabeblock an Daten aus den Messungen, verarbeitet ihn und trainiert dann den Canceller (Kompensator). Dann berechnet es die Volterra Kernel Koeffizienten des Modells unter Verwendung des linearen Modells oder des nichtlinearen Modells. Das Programm berechnet ein Signal-Rausch-Verhältnis und druckt die Ergebnisse aus.
13 ist ein Blockdiagramm eines optischen Empfängers, der einen nichtlinearen optischen Kanalentzerrer umfasst. Der nichtlineare optische Kanalentzerrer 1300 nimmt ein Signal an, das lineare und nichtlineare Komponenten enthält.
Das elektrische Signal ergibt sich allgemein aus der Umwandlung eines optischen Signals in den elektrischen Bereich unter Verwendung eines optisch-elektrischen Wandlers 1307, wie etwa zum Beispiel eine PIN-Diode, ein Avalanche Photodetektor (APD) oder ein anderer Detektor. Das Signal von dem optisch-elektrischen Wandler wird unter Verwendung eines Transimpedanzverstärkers (TIA) 1309 und eines Nachverstärkers 1311 verstärkt. Der Nachverstärker 1311 sollte ein Signal, das ihm bereitgestellt wird, im Allgemeinen nicht hart begrenzen, da die harte Begrenzung eine Nichtlinearität einführen kann.
Nach dem Verarbeiten des Signals, das ihm zugeführt worden ist, kann der Nachverstärker 1311 ein verarbeitetes Signal einem optionalen Analogverarbeitungsblock 1313 bereitstellen. Der Analogverarbeitungsblock 1313 kann eine solche analoge Verarbeitung wie eine Filterung und eine automatische Verstärkungsregelung bereitstellen, bevor ein Ausgangssignal einem Analog-Digital-Wandler 1315 bereitgestellt wird. Das Ausgangssignal von dem Analog-Digital-Wandler wandelt das elektrische Signal, das von dem optionalen Analogverarbeitungsblock 131 bereitgestellt worden ist, in eine digitale Multibitdarstellung um, bevor die digitale Multibitdarstellung einem nichtlinearen optischen Kanalentzerrer 1300 bereitgestellt wird. Der nichtlineare optische Entzerrer 1300 arbeitet in dem digitalen Bereich und kann unter Verwendung einer digitalen Speziallogik oder eines programmierbaren digitalen Universal-Signalprozessors implementiert werden. Vor dem Eintritt in den nichtlinearen optischen Entzerrer 1300 kann das Multibitsignal zusätzliche Vorverarbeitungsschritte wie zum Beispiel Filtern, lineare Entzerrung, Interferenzauslöschung, etc. in einem optionalen digitalen Verarbeitungsblock 1317 durchlaufen. Der Entzerrer 1300 ist ein entscheidungsrückgekoppelter Entzerrer, der einen Detektor wie zum Beispiel einen Slicer 1303, einen Kompensator wie zum Beispiel ein Subtrahierglied 1301 und einen Rückkopplungsblock 1305 umfasst. Der Rückkopplungsblock 1305 umfasst eine nichtlineare Kanalschätzfunktion, die eine Nachschlagetabelle, wie sie in 4 veranschaulicht ist, oder den Volterra Kernel Lösungsweg verwendet, wie er in 5 veranschaulicht ist. Eine Schwierigkeit bei der Benutzung des Nachschlagetabellen-Lösungswegs von 4 oder des Volterra Kernel Lösungswegs, wie er in 5 veranschaulicht ist, liegt darin, dass in beiden Fällen die Volterra Kernel Koeffizienten oder die Nachschlagetabellenkoeffizienten identifiziert werden müssen. Eine Lösung für dieses Problem der Koeffizientenidentifikation liegt darin, dass der Sender eine Trainingssequenz sendet, die dem Empfänger a priori bekannt ist. Die nichtlineare Kanalschätzfunktion 1305 kann dann unter Verwendung der bekannten Trainingssequenz trainiert werden. In einem solchen Fall würde der Funktionsablauf der nichtlinearen Kanalschätzfunktion 1305 fortschreiten, wie dies in 4 oder 5 dargestellt ist, da die Bitsequenz bekannt wäre und Unterschiede, die von dem Kanal erzeugt würden, ohne weiteres identifiziert werden könnten.
In der Praxis kann es sein, dass keine Trainingssequenz benötigt wird, da die Entscheidungen 1307 des entscheidungsrückgekoppelten Entzerrers 1300 und der nichtlinearen Kanalschätzfunktion 1305 immer noch konvergieren können. Zu anfangs werden die Entscheidungen 1307 aufgrund der Tatsache, dass die Kanalschätzfunktion 1305 nicht trainiert ist, viele Fehler aufweisen. Aber in den meisten Kanälen geht die Neigung in Richtung auf gute Entscheidungen. Die meisten entscheidungsrückgekoppelten Entzerrer werden konvergieren, wenn die Kanäle keine exzessiven Intersymbolinterferenzen (ISI) zeigen. Folglich gibt es sowohl gute wie auch schlechte Entscheidungen, wenn die Koeffizienten in der nichtlinearen Kanalschätzfunktion 1305 zu anfangs inkorrekt sind. Solange die guten Entscheidungen den schlechten Entscheidungen zahlenmäßig überlegen sind, wird es einen konvergierenden Trend geben, und die nichtlineare Kanalschätzfunktion 1305 wird schließlich dazu tendieren, zu konvergieren.
Die nichtlineare Kanalschätzfunktion 1305 kann auch unter Verwendung eines LMS-Algorithmus trainiert werden, wie dies in der 4 oder 5 veranschaulicht ist. Wenn die Koeffizienten beginnen, sich in der nichtlinearen Kanalschätzfunktion 1305 zu verbessern, hilft die Verbesserung dabei, einen größeren Prozentsatz an richtigen Entscheidungen zu treffen, was die Konvergenz des nichtlinearen Kanalschätzungsfilters 1305 weiter unterstützt. Wenn die Werte in dem Schätzungsfilter schließlich konvergieren, dann wird die nichtlineare Kanalschätzfunktion 1305 die Koeffizienten so modifiziert haben, dass im Wesentlichen alle korrekten Entscheidungen getroffen werden. Jede inkorrekte Entscheidung, die von dem System getroffen wird, neigt dazu, die Werte in der nichtlinearen Kanalschätzfunktion 1305 zu verfälschen, aber solange die korrekten Entscheidungen den inkorrekten Entscheidungen zahlenmäßig überlegen sind, wird die nichtlineare Kanalschätzfunktion auf eine im Wesentlichen korrekte Lösung hin konvergieren. Mit anderen Worten, solange die Mehrzahl der Entscheidungen korrekt ist, werden die Koeffizienten der nichtlinearen Kanalschätzfunktion 1305 eine Nettobewegung in der richtigen Richtung aufweisen und konvergieren.
Wenn einmal eine anfängliche Konvergenz in der nichtlinearen Kanalschätzfunktion 1305 vorliegt, wird das Signal zu dem Slicer 1303 verbessert, da wenigstens ein Teil der Intersymbolinterferenz in der Summierungseinheit 1301 ausgelöscht bzw. kompensiert wird. Als eine Folge davon steigt die Anzahl an korrekten Entscheidungen 1307 an, was zu einer besseren Kanalschätzung führt. Frühere Entscheidungen werden in der nichtlinearen Kanalschätzfunktion 1305 gespeichert und werden verwendet, um eine Reproduktion der Intersymbolinterferenz zu berechnen, um diese der Summierungseinheit 1301 bereitzustellen.
Wenn eine Volterra Kernel Struktur ähnlich wie in 5 für die nichtlineare Kanalschätzfunktion verwendet wird, dann wird das Gedächtnis der vergangenen Entscheidungen in den FIR-Filtern 511 bis 517 gespeichert, die jeweils nominell eine FIR-Verzögerungsleitungsstruktur enthalten. Wenn der Lösungsweg der Nach schlagetabelle verwendet wird, dann wird das Gedächtnis für die früheren Entscheidungen in einem Schieberegister gespeichert, wie dasjenige, das bei 407 in der 4 veranschaulicht ist.
14A ist ein Blockdiagramm eines beispielhaften nichtlinearen Kanalentzerrers, wie er in dem nichtlinearen entscheidungsrückgekoppelten Entzerrer von 13 verwendet werden kann. Die nichtlineare Kanalschätzfunktion von 14 ist dem Volterra Kernel Modell ähnlich, das in 5 veranschaulicht ist. Das Volterra Kernel Modell von 5 wurde als eine Veranschaulichung der Charakterisierung des Kanals verwendet. Die nichtlineare Kanalschätzfunktion, die in 14 veranschaulicht ist, weist eine LMS-Aktualisierungsschleife ähnlich der 5 auf. Außerdem würde ähnlich wie bei der 5 die Anzahl der verwendeten Volterra Kernels von den Charakteristiken des Kanals und des Lasers abhängen, der zum Steuern des Kanals verwendet wird.
In 14A wird ein Signal 1427, das von einem optischen Kanal bereitgestellt und in ein elektrisches Signal umgewandelt worden ist, von einem optischen Kanalentzerrer angenommen, der allgemein bei 1400 gezeigt ist. Der Entzerrer 1400 nimmt das Signal 1427 in eine Summierungseinheit 1301 auf, in der ein (negiertes) Korrektursignal 1429 hinzugefügt wird, das die vorausgesagte Intersymbolinterferenz repräsentiert. Vor dem Training und der Konvergenz der Volterra Kernel Schätzfunktion ist das Korrektursignal Null oder ein willkürlicher Wert. Der Slicer 1303 trifft Entscheidungen 1307 bezüglich der Werte des übertragenen Signals. Die Entscheidungen 1307 werden von der Volterra Kernel Schätzfunktion 1401 akzeptiert, die die Nichtlinearitäten des Kanals modelliert, der das Signal dem Entzerrer 1400 bereitstellt. Die Ausgabe der Volterra Kernel Schätzfunktion stellt einen Wert einer vorausgesagten Intersymbolinterferenz 1429 bereit, der dann von dem akzeptierten Signal subtrahiert werden kann, um ein übertragenes Signal, das übertragen worden ist, genau wiederzuerschaffen.
Der Fehler in der vorausgesagten Intersymbolinterferenz 1429 wird durch das Vergleichen von Entscheidungen 1307 von dem Slicer 1303 mit dem Eingangssignal 1422 geschätzt, das in der Summierungseinheit 1301 durch das Entfernen der vorausgesagten Intersymbolinterferenz ISI 1429 angepasst worden ist. Die Entscheidungen 1307 und der Fehler 1425 werden verwendet, um die FIR-Filter 511, 513, 515 und 517 anzupassen, die beispielhaft die FIR-Filter veranschaulichen, die die Volterra Kernel Schätzfunktion 1401 enthalten. Auf eine solche Art und Weise kann die Volterra Kernel Schätzfunktion trainiert werden und können Nichtlinearitäten in dem Kanal kompensiert werden, der das Signal dem Entzerrer 1400 bereitstellt.
14B ist ein beispielhaftes Blockdiagramm eines nichtlinearen optischen Kanalentzerrers gemäß dem Ausführungsbeispiel der Erfindung, der eine Nachschlagetabellen-Kanalschätzfunktion verwendet. In 14B kann ein LMS-Algorithmus zur Anpassung der Werte in der Nachschlagetabelle 1435 verwendet werden. Das System 14B kann so betrieben werden, dass das Training des Entzerrers erreicht wird, indem ein Signal verarbeitet wird, das von einem optischen Kanal bereitgestellt wird, Fehlersignale bestimmt werden und der Entzerrer 1401 angepasst wird. Auf eine solche Art und Weise kann der Entzerrer trainiert werden, um die Kanalparameter zu modellieren. Die Fachleute auf diesem Gebiet werden erkennen, dass die Entzerrer trainiert werden können, indem eine bekannte Sequenz verwendet wird. Da eine solche Sequenz a priori bekannt ist, kann der Unterschied zwischen der Antwort des Kanals und der gewünschten Antwort des Kanals, d.h., der bekannten Sequenz, problemlos bestimmt werden. Solche Sequenzen können die Zeit verkürzen, die notwendig ist, um einen nichtlinearen optischen Kanalentzerrer zu trainieren.
Eine nichtlineare Kanalschätzfunktion könnte auch basierend auf dem Nachschlagetabellen-Lösungsweg aufgebaut werden, wie er in 4 veranschaulicht ist. Die Implementierung einer solchen Nachschlagetabellen-Version ist eine direkte Anpassung der Kanalcharakterisierungsschaltung, die in 4 veranschaulicht ist.
15 ist ein Blockdiagramm einer nichtlinearen Kanalschätzfunktion, die mit einem Viterbi Decodierer kombiniert ist. Anstelle eines entscheidungsrückgekoppelten Entzerrers kann ein Viterbi Decodierer verwendet werden. Eine nichtlineare Kanalschätzfunktion 1501 würde verwendet werden, um das erwartete Signal zu berechnen, das zu den Zweigmetrikberechnungen 1503 geht. Der Rest des Viterbi Decodierer-Systems, der den eigentlichen Viterbi Decodierer selbst einschließt, nämlich der Block 1505, ist dem linearen Fall ähnlich. Die nichtlineare Kanalschätzfunktion 1501 erzeugt ein Modell des empfangenen Signals. Wenn die nichtlineare Kanalschätzfunktion 1501 ein Gedächtnis aufweist, das k Bits umfasst, das heißt, dass sie sich an die letzten k Eingänge erinnert, dann hätte der Viterbi Decodierer 1505 2^(k-1) Zustände. Deshalb wäre der Viterbi Decodierer 1505 dann, wenn k = 3 wäre, ein 4-Zustands-Viterbi Decodierer. Wenn die nichtlineare Kanalschätzfunktion 1501 ein Gedächtnis von 3 Bits aufweist, dann kann sie acht unterschiedliche erwartete Werte des empfangenen Signals unterstützen. Dies würde mit einer Nachschlagetabelle mit acht Stellen implementiert. Die erwarteten Werte des empfangenen Signals werden von den Zweigmetrikberechnungen 1503 verwendet, um die gesamten Zweigmetriken in dem Viterbi Decodierer zu berechnen.
Der Viterbi Decodierer, der in 15 veranschaulicht ist, ist der gleiche wie ein Viterbi Decodierer des Standardtyps, mit Ausnahme der Tatsache, dass die Kanalschätzfunktion eine nichtlineare Kanalschätzfunktion mit Gedächtnis ist. Die Nichtlinearität wird entweder in der Form einer Nachschlagetabelle oder in der Form eines Volterra Kernels ausgedrückt.
Der Viterbi Decodierer umfasst einen Empfänger zum Empfangen eines Signals, das lineare und nichtlineare Komponenten einschließt. Eine nichtlineare Kanalschätzfunktion berechnet die erwarteten Werte des empfangenen Signals. Ein Zweigmetrik-Rechner berechnet die Zweigmetriken basierend auf den erwarteten Werten des empfangenen Signals. Ein Standard-Viterbi-Decodierer akzeptiert die berechneten Zweigmetriken und decodiert das empfangene Signal. Die nichtlineare Kanalschätzfunktion kann unter Verwendung einer Volterra Kernel Schätzfunktion, wie dies bei 1401 in 14A veranschaulicht ist, oder unter Verwendung einer Nachschlagetabellen-Implementierung hergestellt werden, wie dies bei 1433 in 14B veranschaulicht ist.

Claims

Verfahren zur Modellerstellung für das Verhalten eines Datenkanals (403), aufweisend: Ermitteln einer Datensequenz (401), welche an den Datenkanal (403) eingegeben worden ist; Verwenden von mindestens einem Teil der Datensequenz (407), welche an den Datenkanal (403) eingegeben worden ist, um einen Ausgabewert eines Kanalmodells von einer Nachschlagetabelle (409) zu erhalten; und Abtasten der Daten nachdem sie den Kanal durchlaufen haben, um abgetastete Daten zu erzeugen; Vergleichen (405) des Ausgabewertes eines Kanalmodells mit den abgetasteten Daten, und Anpassen des Ausgabewertes eines Kanalmodells basierend auf den Ergebnissen des Vergleichs zwischen dem Ausgabewert eines Kanalmodells und den abgetasteten Daten; dadurch gekennzeichnet, dass das Verfahren ferner aufweist: Umwandeln der Nachschlagetabelle (409) in Volterra Kernels (511, 513, 515, 517) unter Verwendung einer Hadamard Transformation; und dadurch, dass das Anpassen des Ausgabewertes eines Kanalmodells ein Anpassen der Volterra Kernels (511, 513, 515, 517) basierend auf den Ergebnissen des Vergleichs zwischen dem Ausgabewert eines Kanalmodells und den abgetasteten Daten aufweist.
Verfahren gemäß Anspruch 1, weiter aufweisend ein Aussondern von Volterra Kernels mit keinem wesentlichen Beitrag zu dem Kanalmodell.
Verfahren gemäß Anspruch 1 oder 2, wobei das Verwenden von mindestens einem Teil der Datensequenz (401), welche an den Datenkanal (403) eingegeben worden ist, ein Ermitteln der letzten N Bits (407) aufweist, welche an den Kanal eingegeben worden sind.
Verfahren gemäß Anspruch 3 wobei N = 5.
Verfahren gemäß Anspruch 1 oder 2, wobei das Abtasten der Daten nachdem sie den Kanal durchlaufen haben, um abgetastete Daten zu erzeugen, ein Erzeugen eines numerischen Werts aufweist, welcher die abgetasteten Daten repräsentiert.
Verfahren gemäß Anspruch 1, wobei das Anpassen des Ausgabewertes eines Kanalmodells ferner ein Anpassen des Ausgabewertes eines Kanalmodells gemäß einem Least Means Squared Algorithmus aufweist.
Verfahren gemäß Anspruch 1, wobei das Anpassen des Ausgabewertes eines Kanalmodells ferner ein Anpassen des Ausgabewertes eines Kanalmodells bis es konvergiert aufweist.