-
QUERVERWEIS AUF VERWANDTE ANMELDUNGEN
-
Diese Anmeldung beansprucht die Priorität der vorläufigen
US-Patentanmeldung, laufende Nummer 62/688.465 , eingereicht am 22. Juni 2018, und der
US-Gebrauchsmusteranmeldung, laufende Nummer 16/449.319 , eingereicht am 21. Juni 2019, deren Inhalt hier durch Bezugnahme vollständig mit aufgenommen ist.
-
TECHNISCHES GEBIET
-
Diese Offenbarung bezieht sich auf Systeme, Verfahren und Strukturen der optischen Kommunikation. Sie beschreibt insbesondere ein oder mehrere Verfahren der Nichtlinearitätskompensation (NLC) optischer Fasern unter Verwendung eines neuronalen Netzes (NN).
-
HINTERGRUND
-
Wie in der Technik der optischen Kommunikation bekannt ist, wirkt die Nichtlinearität von optischen Fasern als eine signifikante Beeinträchtigung der Kommunikation über optische Fasern, wobei sie die maximale optische Leistung, die in die optische Faser eingespeist wird, begrenzt. In Reaktion hat die Technik digitale Rückübertragungsverfahren (DBP) und Algorithmen entwickelt, die die Kerr-Nichtlinearität der Faser durch das Emulieren der Signalübertragung entlang einer Faserübertragungsstrecke mit mehreren DBP-Schritten pro Spanne abschwächen. Um die Berechnungskomplexität der DBP zu vereinfachen, hat die Technik Schemata entwickelt, bei denen die Signalrückübertragungen über mehrere Spannen in einem einzigen DBP-Schritt zusammengefasst sind. In jüngerer Zeit ist in der Technik eine Herangehensweise des tiefen Lernens beschrieben worden, die versucht, die Anzahl der Schritte im DBP-Algorithmus zu optimieren, um weniger DBP-Schritte/Spanne zu ermöglichen. Ungeachtet derartiger Entwicklungen erfordern DBP-Algorithmen und darauf aufbauende Verfahren eine genaue Kenntnis der Übertragungsstreckenparameter - wie z. B. der Dispersion, der Fasernichtlinearität und der Spannenlänge - die in einem software-definierten Maschennetz nicht ohne Weiteres verfügbar sein können.
-
ZUSAMMENFASSUNG
-
Ein Fortschritt in der Technik wird gemäß den Aspekten der vorliegenden Offenbarung gemacht, die auf ein verbessertes Verfahren zur Nichtlinearitätskompensation (NLC) gerichtet sind. In scharfem Gegensatz zum Stand der Technik bietet ein solches Verfahren gemäß der vorliegenden Offenbarung vorteilhaft eine Nichtlinearitätskompensation mit geringerer Komplexität unter Verwendung von Algorithmen des maschinellen Lernens, die vorteilhaft ein systemunabhängiges Modell - unabhängig von Übertragungsstreckenparametern - bereitstellen und dennoch eine ähnliche oder bessere Leistung bei geringerer Komplexität im Vergleich zum Stand der Technik erreichen.
-
Weiterhin enthalten die Systeme, Verfahren und Strukturen gemäß den Aspekten der vorliegenden Offenbarung ein datengetriebenes Modell unter Verwendung des neuronalen Netzes (NN), um die empfangene Signalnichtlinearität ohne vorherige Kenntnis der Übertragungsstreckenparameter vorherzusagen.
-
Betriebstechnisch wird das NN mit Tripletts einer Intrakanal-Kreuzphasenmodulation (IXPM-Triplett) und einer Intrakanal-Vierwellenmischung (IFWM-Triplett) bereitgestellt, die vorteilhaft einen direkteren Weg zu den zugrundeliegenden nichtlinearen Wechselwirkungen bereitstellen.
-
Im weiteren Gegensatz zu der Technik kann die NN-Architektur gemäß der vorliegenden Offenbarung, teilweise aufgrund einer nichtlinearen Aktivierungsfunktion in den Neuronen und den mehreren verborgenen Schichten, die Korrelation der Tripletts vorteilhaft untersuchen und folglich eine bessere Wechselwirkung zwischen den Tripletts konstruieren, um eine äquivalente Korrelation 6. Ordnung und/oder sogar 9. Ordnung aufzuweisen.
-
Schließlich wird demonstriert, dass die Nichtlinearitätskompensation mit neuronalen Netzen mit geringer Komplexität (NN-NLC mit geringer Komplexität) gemäß der vorliegenden Offenbarung am Sender unter Verwendung von Nachschlagetabellen (LUT) implementiert sein kann, die eine Q-Verbesserung von > 0,5 dB unter Verwendung der Einkanal-32-Gbaud-Dualpolarisation-16QAM (Einkanal-32-Gbaud-DP-16QAM) über 2800 km nicht dispersions-gemanagter Übertragung bereitstellen kann, ohne die Tripletts online zu berechnen. Bei einer ähnlichen Komplexität auf der Empfängerseite wie einer gefilterten DBP - wird ferner experimentell gezeigt, dass die NN-NLC erst nach 11.000 km Feldfaserübertragung unter Verwendung probabilistisch geformter (PS) 64-Quadratur-Amplitudenmodulation (64QAM) eine Verbesserung der verallgemeinerten wechselseitigen Informationen (GMI) der 0,15-b/s/2-Polarisation gegenüber der CDC erreicht.
-
Figurenliste
-
Ein vollständigeres Verständnis der vorliegenden Offenbarung kann unter Bezugnahme auf die beigefügte Zeichnung erzielt werden, wobei:
- 1(A) ein schematischer Ablaufplan ist, der die Schritte der digitalen Signalverarbeitung (DSP) an einem Empfänger gemäß den Aspekten der vorliegenden Offenbarung veranschaulicht;
- 1(B) ein schematischer Ablaufplan ist, der die Schritte der digitalen Signalverarbeitung (DSP) an einem Sender gemäß den Aspekten der vorliegenden Offenbarung veranschaulicht;
- 1(C) eine schematische graphische Darstellung ist, die einen Systemaufbau einer Sender- und Übertragungsschleife gemäß den Aspekten der vorliegenden Offenbarung veranschaulicht;
- 2(A), 2(B) und 2(C) Diagramme sind, die die Rauschunterdrückungsmittelung von Trainingsdatensätzen am SNR veranschaulichen - 18,4 dB nach 2800 km, wobei: 2(A) ein Diagramm des Q-Faktors gegen die Anzahl der Mittelungen eines Trainingsdatensatzes am SNR ist, das den Einfluss der Anzahl der erfassten Signalformen auf den Q-Faktor und die Konstellation des Trainingsdatensatzes angibt, der bei einer um ~2 dB höheren Kanalleistung als dem Optimum nach 2800 empfangen wurde; 2(B) eine Sättigungskurve ist und 2(C) eine Sättigungskurve ist, die eine sauberere Konstellation gemäß den Aspekten der vorliegenden Offenbarung zeigt;
- 3(A), 3(B), 3(C) und 3(D) das Dichtediagramm der Gewichte einer Eingangsschicht des Modells des neuronalen Netzes bei anfänglichen Nt-1929 veranschaulichen und: 3(A) Nt = 615; und 3(B) nach dem iterativem Beschneiden (k = -22 dB); wobei 3(C) eine optimierte NN-Architektur mit 2 verborgenen Schichten und 3(D) einen Blockschaltplan einer NN-NLC für pol-H nur gemäß den Aspekten der vorliegenden Offenbarung zeigt;
- 4(A), 4(B), 4(C), 4(D) und 4(E) Diagramme sind, die veranschaulichen: 4(A) die Auswirkung des Beschneidungsschwellenwerts k auf die NN-NLC auf einer Empfängerseite nach einer 2800-km-Übertragung; 4(B) den Leistungsvergleich zwischen der NN-NLC auf der Sender- und der Empfängerseite und der gefilterten DBP bei verschiedenen Spannen pro Schritt; 4(C) die wiedergewonnene Konstellation auf der Empfängerseite mit 4(D); und ohne 4(E) den empfangenen SNR = 18,4 dB bei einer 2800-km-Übertragung bei senderseitiger NN-NLC gemäß den Aspekten der vorliegenden Offenbarung;
- 5 ein Diagramm ist, das Delta-Q (dB) gegen die tatsächlichen Multiplikationen pro Symbol gemäß den Aspekten der vorliegenden Offenbarung veranschaulicht;
- 6(A), 6(B), 6(C) und 6(D) Diagramme sind, die veranschaulichen: 6(A) die Sender- und Empfängerspektren; 6(B) die empfangene PS-64QAM-Konstellation; 6(C) die Leistung der NN-NLC und der gefilterten DBP bezüglich der CDC nur als eine Funktion der Berechnungskomplexität vergleicht; und 6(D) eine Dichtekarte der Eingangsschichtknoten mit den Gewichten nach dem Training mit 240 Tripletts gemäß den Aspekten der vorliegenden Offenbarung ist;
-
Die veranschaulichenden Ausführungsformen werden durch die Figuren und die ausführliche Beschreibung vollständiger beschrieben. Die Ausführungsformen gemäß dieser Offenbarung können jedoch in verschiedenen Formen verkörpert sein und sind nicht auf die spezifischen oder veranschaulichenden Ausführungsformen eingeschränkt, die in der Zeichnung und der ausführlichen Beschreibung beschrieben sind.
-
BESCHREIBUNG
-
Das Folgende veranschaulicht lediglich die Prinzipien der Offenbarung. Es wird folglich erkannt, dass die Fachleute auf dem Gebiet verschiedene Anordnungen entwickeln können, die, obwohl sie hier nicht explizit beschrieben oder gezeigt sind, die Prinzipien der Offenbarung verkörpern und innerhalb ihres Erfindungsgedankens und Schutzumfangs enthalten sind.
-
Weiterhin sind alle hier aufgeführten Beispiele und die bedingte Terminologie nur für pädagogische Zwecke vorgesehen, um dem Leser zu helfen, die Prinzipien der Offenbarung und die durch den/die Erfinder(n) zum Fördern der Technik beigetragenen Konzepte zu verstehen, wobei sie so ausgelegt werden sollen, dass sie ohne Einschränkung auf derartige spezifisch aufgeführte Beispiele und Bedingungen sind.
-
Überdies ist vorgesehen, dass hier alle Aussagen, die sowohl die Prinzipien, Aspekte und Ausführungsformen der Offenbarung als auch deren spezifische Beispiele aufführen, sowohl deren strukturelle als auch deren funktionale Äquivalente umfassen. Zusätzlich ist vorgesehen, dass derartige Äquivalente sowohl die gegenwärtig bekannten Äquivalente als auch die in der Zukunft entwickelte Äquivalente enthalten, d. h., alle entwickelten Elemente, die ungeachtet der Struktur die gleiche Funktion erfüllen.
-
Folglich wird z. B. durch die Fachleute auf dem Gebiet erkannt, dass hier alle Blockschaltpläne konzeptuelle Ansichten einer veranschaulichenden Schaltungsanordnung darstellen, die die Prinzipien der Ausführungsform verkörpert.
-
Wenn es hier nicht ausdrücklich anders angegeben ist, sind die Figuren, die die Zeichnung umfasst, nicht maßstäblich gezeichnet.
-
Als zusätzlichen Hintergrund wird durch das Bemerken begonnen, dass die Fortschritte bei den Algorithmen des tiefen Lernens ein überwältigendes Interesse an der künstlichen Intelligenz (KI) und der Schaffung praktischer und innovativer Anwendungen in unzähligen verschiedenen Gebieten revitalisiert haben. Es ist von besonderem Interesse, dass eine Anzahl von Forschern die Standardmodelle des maschinellen Lernens (ML) direkt auf die Vernetzung und insbesondere auf die Nichtlinearitätskompensation (NLC) der optischen Übertragung, die Leistungsüberwachung optischer Netze und die Planung optischer Netze angewandt haben.
-
Wie den Fachleuten bekannt ist, ist die Kerr-Nichtlinearität der Fasern die grundlegendste Grenze für die maximal erreichbare Informationsrate irgendeines Übertragungssystems mit optischen Fasern, wobei es wohlbekannt ist, dass sie durch die nichtlineare Schrödingergleichung (NLSE) beschrieben wird. Als solcher ist ein digitaler Rückübertragungs- (DBP-) Algorithmus offenbart worden, um die Kerr-Nichtlinearität der Fasern durch das Emulieren der optischen Signalübertragung entlang einer konzeptionellen Übertragungsstrecke mit optischen Fasern mit mehreren DBP-Schritten pro Spanne abzuschwächen. Wie ferner bekannt ist - um die Berechnungskomplexität der DBP signifikant zu vereinfachen - wird die Signalrückübertragung über mehrere Spannen in einem gefilterten DBP-Schema aufgrund der Tiefpassfilterung der Signalintensität in einem einzigen DBP-Schritt zusammengefasst.
-
Kürzlich ist ein Algorithmus des tiefen Lernens durch die Technik in Simulationen in einem Versuch eingeführt worden, die Anzahl der Schritte des DBP-AIgorithmus zu optimieren und weniger DBP-Schritte pro Spanne zu ermöglichen. Leider erfordern der DBP-Algorithmus und seine Varianten jedoch eine genaue Kenntnis der Übertragungsstreckenparameter, wie z. B. der Dispersion, der Fasernichtlinearität und der Spannenlänge, die in einem gegenwärtigen software-definierten Maschennetz nicht verfügbar sein können.
-
Mit diesem vorhandenen Hintergrund werden hier Systeme, Verfahren und Strukturen zur Kompensation der optischen Nichtlinearität unter Verwendung von ML-Algorithmen gemäß den Aspekten der vorliegenden Offenbarung offenbart. Wie gezeigt und beschrieben wird, sind es die besonderen Vorteile des Verwendens von ML-Algorithmen für die NLC anstelle des Verwendens vorhandener DBP-Verfahren, dass sie vorteilhaft ein systemunabhängiges Modell bereitstellen können, das unabhängig von den Übertragungsstreckenparametern ist, und dass sie eine ähnliche oder bessere Leistung bei einer geringeren Komplexität erreichen können.
-
Wie beschrieben wird, enthält die Offenbarung ein datengetriebenes Modell unter Verwendung eines neuronalen Netzes (NN), um ohne vorherige Kenntnis der Übertragungsstreckenparameter die empfangene Signalnichtlinearität vorherzusagen. Das NN wird mit Intra-Kanal-Kreuzphasenmodulations- (IXPM-) und Intra-Kanal-Vierwellenmischungs- (IFWM-) Triplets versorgt, die einen direkteren Weg zu den zugrundeliegenden nichtlinearen Wechselwirkungen bereitstellen können.
-
Es wird ferner angegeben, dass die IXPM- und IFWM-Tripletts anfänglich für die Verwendung in einem Störungs-Vor-/Nachverzerrungs-Algorithmus (-Algorithmen) im Zeitbereich (Störungs-PPD-Algorithmus (-Algorithmen) im Zeitbereich) vorgeschlagen wurden, der immer noch eine spezifische Übertragungsstreckenbedingung und eine Signalformung/Baud-Raten erfordert, um die jedem Triplet zugeordneten Koeffizienten analytisch zu berechnen.
-
Im Gegensatz dazu kann die hier offenbarte NN-Architektur aufgrund der nichtlinearen Aktivierungsfunktion in den Neuronen und der mehreren verborgenen Schichten die Korrelation der Tripletts vorteilhaft untersuchen und folglich eine bessere Wechselwirkung zwischen diesen Tripletts konstruieren, um eine äquivalente Korrelation 6. Ordnung und/oder sogar 9. Ordnung aufzuweisen.
-
Ohne die Triplets online zu berechnen, wird abermals angegeben, dass demonstriert wird, dass die NN-NLC mit geringer Komplexität am Sender unter Verwendung von Nachschlagetabellen (LUT) implementiert sein kann, die eine Q-Verbesserung von > 0,5 dB unter Verwendung der Einkanal-32-Gbaud-Dualpolarisation-16QAM (Einkanal-32-Gbaud-DP-16QAM) über 2800 km nicht dispersions-gemanagter Übertragung bereitstellen kann. Bei einer ähnlichen Komplexität auf der Empfängerseite wie der gefilterten DBP wird ferner experimentell gezeigt, dass die NN-NLC erst nach einer 11.000 km Feldfaserübertragung unter Verwendung der probabilistisch geformten (PS) 64-Quadratur-Amplitudenmodulation (64QAM) eine Verbesserung der verallgemeinerten wechselseitigen Informationen (GMI) der 0,15-b/s/2-Polarisation gegenüber der CDC erreicht.
-
Grundprinzip
-
Wie durch die Fachleute auf dem Gebiet erkannt wird, kann die Entwicklung des optischen Feldes entlang der Faser durch die NLSE beschrieben werden:
wobei u
x/y(t, z) das optische Feld der x- bzw. y-Polarisation ist, β
2 die Gruppengeschwindigkeitsdispersion ist und γ der nichtlineare Koeffizient ist.
-
In der Störungstheorie erster Ordnung enthält die Lösung von Gl. (1) sowohl lineare u
0,
x/y(t, z) als auch nichtlineare Δu
x/y(t, z) Störungsterme. Unter der Annahme, dass die akkumulierte Dispersion viel größer als die Symboldauer ist, können die nichtlinearen Störungsterme für das Symbol bei t = 0 wie folgt approximiert werden:
wobei P
0, H
m und V
m bzw. C
m,n die Einspeiseleistung, die Symbolfolgen für die x- und die y-Polarisation und die nichtlinearen Störungskoeffizienten sind, m und n die Symbolindizes bezüglich des interessierenden Symbols H
0 und V
0 sind. Wie durch die Fachleute erkannt wird, können die nichtlinearen Störungskoeffizienten C
m,n, die Übertragungsstreckenparameter und die Signalimpulsdauer/-formungsfaktoren vorausgesetzt, analytisch berechnet werden.
-
Diese IXPM- und IFWM-Tripletts dienen als die zugrundeliegenden nichtlinearen Wechselwirkungen zwischen den in der Faser übertragenen Symbolen. Im Ergebnis werden sie auf die NN-Modelle angewendet, um die gesamte Nichtlinearität in den empfangenen Signalen vorherzusagen. Es wird erkannt, dass diese Datenvorverarbeitung für die erfolgreiche Vorhersage der Fasernichtlinearität entscheidend ist.
-
Wie nun gezeigt und beschrieben wird, ist dieser NN-NLC-Algorithmus gemäß der vorliegenden Offenbarung in zwei Phasen unterteilt: eine Trainings- und eine Ausführungsphase. 1(A) ist ein schematischer Ablaufplan, der die Schritte der digitalen Signalverarbeitung (DSP) an einem Empfänger gemäß den Aspekten der vorliegenden Offenbarung veranschaulicht. 1(B) ist ein schematischer Ablaufplan, der die Schritte der digitalen Signalverarbeitung (DSP) an einem Sender gemäß den Aspekten der vorliegenden Offenbarung veranschaulicht.
-
Bezüglich dieser Figuren kann beobachtet werden, dass der Empfängerbetrieb beinhaltet: eine Analog-Digital-Umsetzung, gefolgt von einer Synchronisation und Neuabtastung, gefolgt von der Kompensation der chromatischen Dispersion, gefolgt von der Polarisations-Demultiplexierung, der Trägerphasenwiedergewinnung, der durch neuronale Netze erzeugten Nichtlinearitätskompensation und schließlich der Vorwärtsfehlerkorrektur- (FEC-) Decodierung.
-
Trainingsstufe
-
Aufbau der Trainingsdaten
-
Um die Fasernichtlinearität zu charakterisieren, muss die Signalnichtlinearität in den empfangenen Trainingsdaten beobachtet werden. Entsprechend kann die Einspeiseleistung P0 über die optimale Kanalleistung hinaus eingestellt werden, um zu erlauben, dass das Nichtlinearitätsrauschen gegenüber dem/den ASE-Rauschen(n) dominant ist. Zusätzlich kann für das feste Trainingsdatenmuster eine Rauschunterdrückungsmittelung ausgeführt werden, um eine datenabhängige Nichtlinearität, die aus den additiven Gaußschen ASE-Rauschen resultiert, zu isolieren. In dieser Betriebsphase wirkt der NN-NLC-Block auf weiche Daten aus dem Trägerphasen-Wiedergewinnungsblock, der im DSP-Ablaufplan des Empfängers nach 1(A) gezeigt ist. Später in der Ausführungsphase kann die NN-NLC entweder auf der Sender- oder auf der Empfängerseite implementiert sein.
-
Um diesen NN-ALC-Algorithmus mit experimentellen Daten weiter auszuarbeiten, wird eine Einkanal-32-Gbaud-DP-16QAM mit RRC-0,01-Impulsformung, wie in 1(C) gezeigt ist, unter Verwendung eines 64-Gs/s-DAC erzeugt und über einen Schleifenprüfstand mit fünf Spannen von 80 km SMF übertragen, die einen Verlust von 0,2 dB/km und eine Dispersion von 17 ps/nm/km aufweist. Ein digitaler kohärenter Empfänger, der mit 50 GSa/s mit einer analogen Bandbreite von 20 GHz arbeitet, dezimiert die optischen Signalformen für die Offline-DSP, wie in 1(A) umrissen ist, um die übertragenen Symbole wiederzugewinnen. Zusätzlich ist am Sender eine 50-%-Kompensation der chromatischen Dispersion (CDC) angewendet worden, um die Fasernichtlinearitätstoleranz zu erhöhen.
-
Für das Training, die Kreuzvalidierung (CV) und das Testen werden drei unkorrelierte Datensätze mit jeweils -115 k Symbolen erzeugt. Das in den Trainings-, CV- und Testdatensätzen verwendete Datenmuster wird gemessen, so dass es maximal 0,6 % normierte Kreuzkorrelation aufweist, um die Datenunabhängigkeit sicherzustellen.
-
Die Mehrfachsignalformerfassung wird verarbeitet, wobei die wiedergewonnenen weichen Symbole nach der Trägerphasenwiedergewinnung ausgerichtet werden, um das additive Rauschen herauszumitteln. 2 ist ein Diagramm, das den Einfluss der Anzahl der erfassten Signalformen auf den Q-Faktor und die Konstellation des Trainingsdatensatzes veranschaulicht, der bei ~2 dB höherer Kanalleistung als das Optimum nach eine 2800-km-Übertragung empfangen wurde. Wie durch Fachleuten auf dem Gebiet im hohen Maße erkannt wird, ist eine Verbesserung des Q-Faktors um etwa 1,6 dB erst nach einer Mittelung über 5 erfasste Signalformen beobachtet worden. Die Sättigungskurven zeigen, dass die resultierende sauberere Konstellation in 2(C) das nichtlineare Rauschen genauer darstellt als die in 2(B) gezeigte.
-
Auswahl der Tripletts
-
Nach dem Bereinigen der ASE-Rauschen im empfangenen Trainingsdatensatz sind diese Daten bereit, um für die Berechnung der IXPM- u. IFWM-Triplets, wie sie in Gl. (2) beschrieben ist, verwendet zu werden. Es wird angegeben, dass in einer früheren Arbeit die nichtlinearen Störungskoeffizienten Cm,n zuerst basierend auf den Übertragungsstreckenparametern und der Signalbaudrate analytisch berechnet wurden und nur jene Tripletts mit Koeffizienten über einem bestimmten Schwellenwert beibehalten wurden, d. h., 20log10|Cmn/C00| > κ. Es wird angegeben, dass die in der Technik berechneten Koeffizienten nur zum Auswählen der Tripletts zum Einspeisen in die NN-Modelle verwendet wurden.
-
Hier wurden teilweise aufgrund der Hyperbeleigenschaft der nichtlinearen Störungskoeffizienten Cm,n bei gegebenem m nur jene Tripletts basierend auf den Kriterien:
-
ausgewählt, wobei ρ ein Skalierungsfaktor ist, um die Breite der Tripletts an den Rändern
zu bestimmen, L die Symbolfensterlänge ist und
und |·| für das Aufrunden zur nächsten ganzen Zahl und die Absolutoperation steht.
-
Unter Verwendung der entrauschten Trainingsdaten mit ρ= 1, L = 151 und Nt = 1929 ist die Dichtekarte der Tensorgewichte Wm,n in der Eingangsschicht nach dem NN-Training in 3(A) graphisch dargestellt. Wie ersichtlich ist, ermöglicht das Auswahlkriterium des Tripletts in Gl. (3) diesem Algorithmus für tiefes Lernen, die wichtigen Tripletts effizient zu lokalisieren, anstatt alle L2 Tripletts zu untersuchen, wobei folglich die Berechnungskomplexität und die Trainingszeit signifikant verringert werden.
-
Modellauswahl
-
Wie durch die Fachleute auf dem Gebiet leicht verstanden und erkannt wird, gibt es verschiedene ML-Modelle von der einfachen linearen Regression bis zu hochentwickelten Modellen für das tiefe Lernen, die für das Lösen aller Arten von Problemen entworfen sind. Mehrere Modelle, wie z. B. lineare Regression, ein faltendes neuronales Faltungsnetz, ein rückgekoppeltes neuronales Netz und ein vollständig verbundenes neuronales Netz, werden unter Verwendung von TensorFlow implementiert, wobei ihre Leistung unter Verwendung der hier entwickelten Simulationsdaten schnell überprüft wird. Wie nun offenbart wird, übertrifft ein vollständig verbundenes neuronales Netz alle anderen Modelle.
-
Ein optimiertes Modell eines Vorwärtskopplungs-NN gemäß der vorliegenden Offenbarung ist in 3(C) schematisch gezeigt. Wie aus dieser Figur beobachtet werden kann, ist es aus einer Eingangsschicht mit 2 * Nt Triplettknoten, 2 verborgenen Schichten, die aus 2 bzw. 10 Knoten bestehen, und zwei Ausgangsknoten, die dem Real- und dem Imaginärteil der geschätzten Nichtlinearität entsprechen, aufgebaut. Es wird angegeben, dass die Tripletts in real und imaginär getrennt werden, bevor sie in das NN-Modell eingespeist werden.
-
Die Aktivierungsfunktion SELU() wird in den Knoten der beiden verborgenen Schichten angewendet. Eine Ausfallschicht mit einer Wahrscheinlichkeit von 0,5 wird nur während des Trainings nach der
2. verborgenen Schicht angeordnet, um eine Überanpassung zu vermeiden. Unter Anwendung eines Adam-Lernalgorithmus mit einer Lernrate von 0,001 und einer Stapelgröße von B = 100 wird das Netz trainiert, indem bekannte, aber zufällig erzeugte Muster gesendet werden und nach den besten Knotentensorparametern gesucht wird, die den mittleren quadratischen Fehler (MSE) zwischen den gesendeten und empfangenen Symbolen nach der NN-NLC minimieren, d. h.,
wobei Ĥ
i bzw. Ĥ
i,NL die empfangenen Symbole und die geschätzte Nichtlinearität für die pol-H sind. Obwohl das Modell unter Verwendung der pol-H-Daten trainiert wird, wird die ähnliche Leistungsverbesserung auch für die pol-V beobachtet. Es wird angegeben, dass das Training mit einer viel langsameren Geschwindigkeit als die Datenrate ausgeführt werden kann, um es dem Algorithmus für das tiefe Lernen zu ermöglichen, die geeigneten NN-Modelle zu lokalisieren und die optimalen Tensorgewichte vor der Ausführungsphase zu berechnen.
-
Ausführungsphase
-
Während der Trainingsphase wird die Leistung des Modells nur gegen den CV-Datensatz überprüft, um die NN-Modellparameter zu optimieren. Danach wird das erlernte Modell in der Ausführungsphase auf den unkorrelierten Testdatensatz für alle Kanalleistungen angewendet. Ein Blockschaltplan der NN-NLC gemäß der vorliegenden Offenbarung ist in 3(D) gezeigt.
-
In Anbetracht des interessierenden Symbols Ĥ
0, das in der Mitte der Symbollänge L zentriert ist, werden die IXPM- und IFWM-Terme berechnet, um sie in das NN-Modell in
3(C) einzuspeisen und die Nichtlinearität zu schätzen. Das geschätzte Ĥ
0,NL wird zuerst durch die Kanalleistung (P
ch) des Testdatensatzes bezüglich der Referenzkanalleistung (P
ref) der zum Ableiten des Modells verwendeten Trainingsdaten skaliert, d. h.,
-
Es wird angeben, dass von dem ursprünglichen interessierenden Symbol der Schätzwert Ĥ0,NL subtrahiert wird, bevor es an den nächsten DSP-Block, wie z. B. die FEC-Decodierung, gesendet wird, wie in 1(A) schematisch veranschaulicht ist.
-
Weil die Berechnung von Tripletts unter Verwendung der weichen Symbole auf der Empfängerseite ziemlich teuer sein könnte, ist es wünschenswert, den NN-NLC-Block zur Senderseite zu verschieben, um die begrenzte Alphabetgröße M für jedes Modulationsformat auszunutzen. Im Ergebnis kann eine Nachschlagetabelle (LUT) erzeugt werden, um alle M3 möglichen Triplets zu speichern. Es ist von besonderem Vorteil, dass die LUT nur 163 = 4096 Einträge für die 16QAM benötigt. Das gleiche NN-Modell, das in der Trainingsphase unter Verwendung der Symbole des Empfängers entwickelt wurde, erweist sich auf der Empfängerseite immer noch als effektiv. 1(B) zeigt den DSP-Blockschaltplan der NN-ALC auf der Senderseite.
-
Komplexität und Leistung
-
Weil die Komplexität tatsächlicher Multiplikationen 4-mal so hoch wie eine Additionsoperation sein kann, wird nur die tatsächliche Multiplikation berücksichtigt, wenn die Komplexität des NLC-Algorithmus verglichen wird. Das in
3(C) gezeigte NN-Modell gemäß der vorliegenden Offenbarung erfordert infolge von drei schichtenübergreifenden Tensorwechselwirkungen
tatsächliche Multiplikationen. Es wird angegeben, dass die Aktivierungsfunktion SELU() in den verborgenen Knoten und die Berechnung der IXPM/IFWM-Tripletts als in einer LUT implementiert angenommen werden.
-
Nach dem Skalieren des geschätzten Nichtlinearitätsterms wird die Anzahl der tatsächlichen Multiplikationen pro Symbol für diese NN-ALC gemäß den Aspekten der vorliegenden Offenbarung, die in
3(D) gezeigt ist, wie folgt zusammengefasst:
-
Deshalb ist das Verringern der Anzahl der Tripletts Nt der effektivste Weg, um die Komplexität des NN-ALC-Algorithmus in diesem Modell zu verringern.
-
Wie in 3(A) gezeigt ist, zeigen mit den anfänglichen Nt = 1929 Tripletts einige der Eingangstensorgewichte Wm,n im trainierten Modell einen viel geringeren Beitrag zur Signalnichtlinearität als die mittleren. Im Ergebnis kann die Anzahl der Tripletts Nt weiter verringert werden, indem nur jene Gewichte behalten werden, die größer als ein Schwellenwert κ sind, d. h., 20log10|Wmn/W00| > κ
-
Nach dem Abschneiden der Gewichte Wm,n, die kleiner als κ = -22 dB sind, die in 4(A) gezeigt sind, werden die verbleibenden 615 Tripletts im NN-Modell neu trainiert, wobei in 3(B) ein neues Dichtediagramm der Eingangstensorgewichte Wm,n gezeigt ist.
-
4(A) ist ein Diagramm, das den Einfluss des Beschneidungsschwellenwerts κ auf die Leistungsverbesserung der NN-NLC als eine Funktion des empfangenen SNR nach einer 2800-km-Übertragung veranschaulicht. Beim optimalen empfangenen SNR erreicht der NN-NLC-Algorithmus bei dem Beschneidungsschwellenwert κ < -15 dB eine Q-Verbesserung von > 0,5 dB gegenüber der CDC. Die weitere Q-Verbesserung beim höchsten empfangenen SNR bestätigt ferner, dass dieses NN-Modell die Signalnichtlinearität genau vorhersagt. Durch das Einstellen des Beschneidungsschwellenwerts κ von -35 dB bis -15 dB, wie in einer Zoom-Einfügung nach 4(A) gezeigt ist, kann beobachtet werden, dass der Leistungskompromiss bei einem empfangenen SNR von 16,6 dB und 18,4 dB sich innerhalb einer Q-Variation von -0,2 dB bzw. -0,4 dB befindet.
-
Wie hier vorher bezüglich der Verfahren gemäß der vorliegenden Offenbarung offenbart worden ist, weist die senderseitige NN-NLC den Vorteil auf, die Berechnung von Tripletts unter Verwendung einer LUT zu vermeiden, wodurch die Komplexität verringert wird. Weil dieses NN-Modell zusätzlich an einem sauber übertragenen Symbol arbeitet, ist die Q-Verbesserung der NN-NLC gegenüber CDC höher als eine auf der Empfängerseite. Schließlich ist es ein zusätzlicher Vorteil, dass der Empfänger-DSP-Algorithmus an Signalen mit geringer Nichtlinearität arbeitet, wobei dadurch die Zyklusschlupfrate verringert wird.
-
Unter Beachtung dessen ist, wenn das mit dem Beschneidungsschwellenwert κ = -22 dB abgeleitete NN-Modell auf der Empfängerseite auf die ursprünglichen 16QAM-Symbole im Testdatensatz angewendet wird, die vorverzerrte Symbolkonstellation in 4(C) graphisch dargestellt. Interessanterweise sind die vorverzerrten Symbole aufgrund der in 3(B) gezeigten asymmetrischen Nichtlinearitätswechselwirkung zwischen der linken Ebene und der rechten Ebene nicht gaußähnlich. Im Vergleich zu der in 4(E) gezeigten wiedergewonnenen Konstellation ohne den NN-NLC-Algorithmus kann die senderseitige NN-NLC die Qualität der Konstellation signifikant verbessern, wie in 4(D) graphisch dargestellt ist. Im Vergleich zur Rx-seitigen NN-NLC an dem Beschneidungsschwellenwert κ = -22 dB zeigt 4(B) dank der unverzerrten Sendersymbole eine Q-Verbesserung von -0,1 dB, wenn die NN-NLC zur Senderseite verschoben wird.
-
An dieser Stelle wird festgestellt, dass die gefilterte DBP eine wohlbekannte Technik ist, die in der Literatur des Standes der Technik offenbart ist, um einen Kompromiss zwischen der Leistung und der Berechnungskomplexität auszugleichen. Weil in jedem DBP-Schritt mehrere Spannen emuliert werden, müssen die Intensitätssignalformen durch ein Gaußsches Tiefpassfilter (LPF) gefiltert werden, bevor sie zum Entdrehen der Signalphase verwendet werden. Es wird festgestellt, dass seine optimale Bandbreite 5 GHz, 1 GHz, 1 GHz und 0,5 GHz für 1, 5, 7 und 35 Spannen pro Schritt (SpS) beträgt. Der optimale Skalierungsfaktor ξ, der verwendet wird, um die Phase des Signals zu entdrehen, ist für alle Fälle etwa 0,7.
-
Im Vergleich zu der einstufigen NN-NLC der vorliegenden Offenbarung wird die einstufige gefilterte DBP (35 SpS) um > 0,6 dB übertroffen. Aus den Messergebnissen benötigt die gefilterte DBP wenigstens 7 Schritte, d. h., 5 SpS, um eine Leistung der Rx-seitigen NN-NLC bei κ = -22 dB zu erreichen.
-
Die Q-Leistungsverbesserung gegenüber der CDC ist in
5 gegen die tatsächlichen Multiplikationen pro Symbol für die gefilterte DBP und beide Tx/Rxseitigen NN-NLC-Algorithmen graphisch dargestellt. Weil die gefilterte DBP die CDC und die NLC gleichzeitig ausführt, muss für einen fairen Vergleich die Anzahl der tatsächlichen Multiplikationen pro Symbol, die im Rx-seitigen CDC-Block (siehe
1 (a)) erforderlich ist, für den NN-NLC-Algorithmus einbezogen werden, die durch
gegeben ist, wobei n die FFT-Größe und n
cd die minimale Anzahl von CDC-Entzerrern ist, die erforderlich ist, um die akkumulierte CD auszugleichen. Es wird angenommen, dass die CDC im Frequenzbereich mit der FFT-Größe n = 4086 ausgeführt wird. Um die 50 % Rest-CD auf der Empfängerseite zu kompensieren, werden zusätzlich ~115 tatsächliche Multiplikationen pro Symbol über die in Gl. (7) angegebene Komplexität der NN-NLC hinaus hinzugefügt.
-
Im Allgemeinen schneidet die Rx-Seite dieser NN-NLC gemäß der vorliegenden Offenbarung erst besser als die gefilterte DBP ab, wenn die Berechnungskomplexität weniger als -1000 tatsächliche Multiplikationen pro Symbol beträgt. Wenn der NN-NLC-Algorithmus zu der Senderseite verschoben wird, gleicht oder übertrifft er die Leistung der gefilterten DBP sogar bei einer höheren Komplexität als 1000 tatsächliche Multiplikationen pro Symbol, während er bei geringerer Komplexität immer noch den Leistungsvorteil gegenüber der gefilterten DBP aufweist. Wie beobachtet worden ist, verliert die Tx-seitige NN-NLC ihren Leistungsvorteil gegenüber der Rx-Seite, wenn die Komplexität infolge fehlender Verfolgungssignalnichtlinearität zu gering ist.
-
Die Einfügung nach 5 zeigt die vorverzerrten Symbole mit nur Nt = 29 Tripletts, was sich signifikant von jenen, in 4(C) gezeigt sind, unter Verwendung von 615 Tripletts unterscheidet.
-
Die Leistung der NN-NLC wird ferner an einem 11.017 km langen kommerziehen FASTER-Unterwasserkabel zusammen mit Live-Verkehr demonstriert. Als das Sondensignal in einer 50-GHz-WDM-Konfiguration wird eine 4 x 12,25-Gbaud-PS-64QAM mit digitaler Unterträgermodulation (DSM) bei RRC 0,01 mit einem 50-MHz-Schutzband, die insgesamt eine Bitrate von 300 Gb/s überträgt, verwendet. Die Sender- und Empfängerspektren sind in 6(A) graphisch dargestellt. Nach der Anwendung einer Herangehensweise der Rauchunterdrückungsmittelung ist die empfangene PS-64QAM-Konstellation bei 2 dB-Kanalvoranhebung in 6(B) gezeigt. Es wird angegeben, dass die verallgemeinerten wechselseitigen Informationen (GMI) verwendet werden, um die Verstärkung der NN-NLC für das PS-64QAM-Format genau zu messen.
-
6(C) vergleicht die Leistung der NN-NLC und der gefilterten DBP bezüglich der CDC nur als eine Funktion der Berechnungskomplexität. Die Referenz sind die GMI nur mit der CDC. Es wird ein ähnlicher Trend gefunden, dass die NN-NLC besser abschneidet als die gefilterte DBP, wenn die Komplexität kleiner als 730 tatsächliche Multiplikationen pro Symbol ist. Es wird erwartet, dass die Tx-seitige NN-NLC den Leistungsgewinn wahrscheinlich noch weiter verbessert. 6(D) stellt die Dichtekarte der Eingangsschicht-Knotengewichte nach dem Training mit 240 Tripletts graphisch dar.
-
Wie nun durch die Fachleute auf dem Gebiet erkannt und verstanden wird, ist experimentell demonstriert worden, dass diese NN-NLC gemäß den Aspekten der vorliegenden Offenbarung sowohl im Laborprüfstand als auch in den Feldkabeln eine systemunabhängige Leistung ohne vorherige Kenntnis der Übertragungsstreckenparameter, wie z. B. der Dispersion, der Fasernichtlinearität und der Faserlänge, zeigt.
-
Während diese Offenbarung unter Verwendung einiger spezifischer Beispiele dargestellt worden ist, werden die Fachleute auf dem Gebiet an dieser Stelle erkennen, dass diese Lehren nicht so eingeschränkt sind. Entsprechend sollte diese Offenbarung nur durch den Schutzumfang der beigefügten Ansprüche eingeschränkt werden.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- US 62/688465 [0001]
- US 16/449319 [0001]