IT201800003363A1

IT201800003363A1 - Metodo per monitorare un sistema di comunicazioni ottiche

Info

Publication number: IT201800003363A1
Application number: IT102018000003363A
Authority: IT
Inventors: Francesco Musumeci; Massimo Tornatore; Achille Pattavina; Shahin Shahkarami
Original assignee: Milano Politecnico
Priority date: 2018-03-08
Filing date: 2018-03-08
Publication date: 2019-09-08
Also published as: CN111971909B; US20210058154A1; WO2019170873A1; CN111971909A; EP3763061A1

Description

DESCRIZIONE

Della Domanda di Brevetto per Invenzione dal Titolo:

"Metodo per monitorare un sistema di comunicazioni ottiche”

Il presente trovato riguarda il settore dei sistemi di comunicazioni ottiche. In particolare il presente trovato riguarda il settore dei metodi per monitorare un sistema di comunicazioni ottiche.

Come noto, in un sistema di comunicazioni ottiche, possono verificarsi diversi tipi di guasti che possono degradare la qualità del segnale al ricevitore.

Le diverse tipologie di guasti possono essere classificate in due categorie: le cosiddette "hard-failure" si verificano in maniera del tutto imprevista ed imprevedibile e sono causate da eventi improvvisi, come ad esempio interruzioni dei cavi in fibra ottica, mentre le cosiddette “ soft-failure ” corrispondono ad un graduale peggioramento della qualità del segnale e possono essere causate da, ad esempio, un disallineamento di filtri in cascata lungo il collegamento ottico, oppure da un malfunzionamento di uno o più amplificatori ottici. Il peggioramento della qualità del segnale associato ad una soft-failure può verificarsi gradualmente su una scala temporale relativamente lunga (ore o giorni). Le soft-failure in particolare possono indurre anomalie nei valori del BER al ricevitore e condurre infine alla perdita di pacchetti o all’interruzione del servizio offerto.

Poiché, come anticipato, le soft-failure possono verificarsi su una scala temporale relativamente lunga, esse si rivelano potenzialmente predicibili. In linea di principio, quindi, una soft-failure può essere anticipata adottando una misura preventiva come ad esempio una riconfigurazione degli apparati di rete di tipo "make-before-break" .

Le reti di comunicazioni ottiche odierne usano apparati di trasmissione e ricezione basati su tecnologia coerente. Questi apparati consentono di monitorare la qualità del segnale ricevuto raccogliendo dati come, ad esempio, il rapporto segnale-rumore ottico (OSNR, Optical Signal-to-Noise Ratio), il fattore Q (Q-factor) e il BER misurato prima dell'applicazione del meccanismo di decodifica secondo la tecnica di Forward Errar Correction (FEC), che viene tipicamente implementato presso il ricevitore. Il BER misurato prima della decodifica FEC viene indicato anche come "BER pre-FEC”. Nel seguito della presente descrizione, dove non diversamente specificato, il termine “BER” indicherà il BER pre-FEC.

Sono noti metodi e sistemi per la rilevazione di guasti in una rete di comunicazioni ottiche.

EP 2 533 549 A1 descrive un metodo per la rilevazione di guasti che comprende le fasi di raccogliere parametri operativi della rete ottica, raccogliere informazioni sulla struttura della rete ottica, fornire output diagnostici tramite un motore diagnostico che analizza le informazioni sulla struttura ed i parametri operativi, e derivare i guasti della rete ottica dagli output diagnostici. I parametri operativi sono relativi alle apparecchiature (tipo), alla Quality-of-Service (BER) e/o all’architettura (ID) della rete ottica. I guasti della rete ottica derivati dagli output diagnostici possono riguardare problemi degli apparati, problemi di interoperabilità e/o difetti fisici. Il motore diagnostico genera gli output diagnostici usando alberi decisionali, tecniche di reti bayesiane e/o tecniche di classificazione multivariata.

US 6,965,736 B1 descrive un metodo per monitorare la qualità di trasmissione di un sistema di trasmissione ottica come ad esempio una rete ottica a divisione di lunghezza d’onda (o WDM, Wavelength Division Multiplexing). Un istogramma d'ampiezza di un segnale ottico (segnale di trasmissione) trasmesso sul sistema di trasmissione può essere tracciato e classificato, con l’assistenza di una rete neurale, a seconda di tassi d’errore di bit e/o di cause di guasti.

Gli inventori hanno notato che il metodo descritto in EP 2 533 549 A1 trova applicazione in una rete PON (Passive Optical Network) comprendente una o più OLT (Optical Line Termination) centralizzate, ciascuna connessa ad uno o più gruppi di ONT (Optical Network Terminal) presso gli utenti della rete. La connessione degli apparati è realizzata tramite una rete ottica passiva. Il metodo di diagnosi descritto in EP 2 533 549 A1 consente di individuare una tipologia di apparati guasti (che possono essere le board presso le OLT oppure le ONT), oppure singoli apparati guasti, oppure, ancora, un problema di interoperabilità tra un certo tipo di ONT ed un certo tipo di board, oppure un difetto fisico delle ONT di un certo gruppo, insieme alla localizzazione del difetto. Gli inventori hanno quindi notato che il metodo descritto presuppone che in ingresso al motore diagnostico siano raccolte informazioni sulla struttura della rete e sulla tipologia degli apparati in essa presenti che rendono il metodo applicabile solo ad una ben determinata tipologia di rete ottica o comunque ad una rete ottica la cui struttura e composizione sia del tutto nota. Inoltre, il metodo descritto non consente di stabilire la causa del guasto presente nella rete ottica: al più, esso fornisce indicazioni sulla presunta presenza di un guasto presso un apparato o presso apparati di rete di un certo tipo senza tuttavia fornire un’indicazione del perché il guasto si stia verificando.

Per quanto riguarda il metodo descritto in US 6,965,736 B1, gli inventori hanno notato che esso sfrutta informazioni di ampiezza del segnale ottico ricevuto per stimare i valori del BER. Il metodo inoltre può fornire una classificazione in merito al fatto che tali valori siano prodotti della presenza di rumore, cross-talk o distorsioni del segnale. Tuttavia, il metodo descritto non fornisce un'indicazione della causa della presenza di rumore, cross-talk o distorsioni.

Infine, gli inventori hanno notato che entrambi i metodi descritti sopra consentono al più di rilevare un guasto (senza identificarne la causa) in un momento successivo all’occorrenza del guasto stesso, e che quindi nessuno dei metodi noti descritti sopra permette di prevedere in anticipo l'occorrenza di una soft-failure nella rete di comunicazioni ottiche.

Pertanto, scopo della presente invenzione è quello di fornire un metodo per monitorare un qualsiasi sistema di comunicazioni ottiche (ossia, non necessariamente noto a priori nella sua struttura e composizione) che consenta di rilevare una soft-failure nel sistema e di identificarne la causa permettendo inoltre di fornire detta rilevazione ed identificazione in anticipo rispetto all'effettiva occorrenza della soft-failure.

Secondo un primo aspetto dell'invenzione, viene fornito un metodo per monitorare un sistema di comunicazioni ottiche comprendente almeno un canale ottico che collega un trasmettitore ed un ricevitore, il metodo comprendendo:

a) misurare, presso il ricevitore, un parametro di trasmissione del canale ottico per un intervallo di tempo di misura pre-definito;

b) sulla base delle misure del parametro di trasmissione nell’intervallo di tempo, verificare la presenza di almeno un’anomalia nelle misure, l’almeno un’anomalia essendo indicativa di un susseguente guasto del sistema; e

c) in presenza dell’almeno un’anomalia, applicare un algoritmo di identificazione alle misure, l’algoritmo comprendendo un classificatore, in cui il classificatore è configurato per, sulla base delle misure, identificare una causa del guasto, il classificatore essendo basato su una tecnica di machine leaming.

Preferibilmente la fase a) del metodo comprende:

al) campionare i valori del parametro di trasmissione dell’intervallo con un periodo pre-definito e raccogliere i campioni in una finestra di misura del parametro di trasmissione avente una durata pre-definita; e

a2) determinare, a partire dei campioni, uno o più dati di input per il classificatore,

in cui i dati di input comprendono uno o più valori statistici relativi ai campioni del parametro di trasmissione nella finestra di misura.

Preferibilmente, i valori statistici comprendono uno o più dei seguenti: un valore medio dei campioni, un valore massimo dei campioni, un valore minimo dei campioni, una deviazione standard dei campioni, un valore quadratico medio dei campioni, un valore picco-picco dei campioni, uno o più valori dello spettro dei campioni.

Preferibilmente, il metodo comprende raccogliere i campioni del parametro di trasmissione in almeno due finestre di misura consecutive, in cui le almeno due finestre di misura sono disgiunte o almeno parzialmente sovrapposte, verificare la presenza di un’anomalia in ciascuna finestra di misura delle almeno due finestre di misura e, in presenza di un’anomalia in ciascuna finestra di misura, applicare l’algoritmo di identificazione.

Preferibilmente, il parametro di trasmissione è il BER pre-FEC associato al canale ottico.

Preferibilmente, la tecnica di machine learning comprende una rete neurale artificiale.

Secondo forme di realizzazione della presente invenzione, la fase b) comprende applicare un algoritmo di rilevazione alle misure, l’algoritmo di rilevazione comprendendo un ulteriore classificatore basato su una ulteriore tecnica di machine learning.

Preferibilmente, l’ulteriore tecnica di machine learning comprende una delle seguenti: macchina a vettori di supporto (SVM) binaria, foresta casuale, SVM multiclasse, rete neurale artificiale.

Preferibilmente, il metodo comprende inoltre una fase di configurazione iniziale, e detta fase di configurazione iniziale comprende applicare un algoritmo di apprendimento automatico per istruire il classificatore sulla base di un insieme di misure del parametro di trasmissione, l’insieme di misure essendo indicative di almeno due possibili cause del guasto.

Secondo un secondo aspetto dell'invenzione, viene fornita una unità di monitoraggio per un sistema di comunicazioni ottiche, il sistema comprendendo almeno un canale ottico che collega un trasmettitore ed un ricevitore, detta unità comprendendo:

un modulo di acquisizione dati configurato per raccogliere dal ricevitore misure di un parametro di trasmissione del canale ottico per un intervallo di tempo di misura pre-definito;

un modulo di rilevazione configurato per, sulla base delle misure del parametro di trasmissione nell'intervallo di tempo, verificare la presenza di almeno un’anomalia nelle misure, l’almeno un’anomalia essendo indicativa di un susseguente guasto del sistema; e

un modulo di identificazione configurato per, in presenza dell'almeno un'anomalia, applicare un algoritmo di identificazione alle misure, l’algoritmo comprendendo un classificatore, in cui il classificatore è configurato per, sulla base delle misure, identificare una causa del guasto, il classificatore essendo basato su una tecnica di machine learning.

La presente invenzione diverrà più chiara dalla seguente descrizione dettagliata, data a puro titolo esemplificativo e non limitativo, da leggersi con riferimento alle annesse figure in cui:

- la Figura 1 è uno schema esemplificativo di un sistema di comunicazioni ottiche;

- le Figure 2a e 2b illustrano, rispettivamente, dati di misura di BER in assenza ed in presenza di una soft-failure;

- la Figura 3 è un diagramma di flusso che rappresenta le fasi del metodo secondo la presente invenzione;

- la Figura 4 è un diagramma di flusso che rappresenta le fasi iniziali di configurazione per l’implementazione del metodo secondo la presente invenzione;

- la Figura 5 rappresenta schematicamente un sistema di comunicazioni ottiche esemplificativo utilizzato per testare il metodo secondo la presente invenzione; e

- le Figure 6a, 6b e 7 sono grafici che illustrano i risultati di test effettuati sul sistema di comunicazioni ottiche di Figura 5.

La Figura 1 mostra schematicamente un sistema di comunicazioni ottiche esemplificativo, indicato con il numero di riferimento 1. Il sistema ottico 1 può ad esempio essere un sistema ottico WDM. Il sistema di comunicazioni ottiche 1 comprende un primo nodo sorgente comprendente un primo trasmettitore 11 ed un secondo nodo sorgente comprendente un secondo trasmettitore 12 collegati, rispettivamente, ad un primo nodo destinazione comprendente un primo ricevitore 21 e ad un secondo nodo destinazione comprendente un secondo ricevitore 22. La connessione tra i nodi sorgente ed i nodi destinazione è realizzata tramite una rete di comunicazioni ottiche 30 comprendente uno o più nodi intermedi connessi mediante fibra ottica. Ad esempio, la rete di comunicazioni ottiche 30 di Figura 1 comprende tre nodi intermedi 31, 32, 33. Ciascun nodo intermedio può ad esempio comprendere uno switch e/o un amplificatore ottico e/o uno o più filtri.

La rete di comunicazioni ottiche 30 preferibilmente fornisce agli utenti del sistema 1 un numero di canali ottici (o lightpath) che possono essere instaurati tra i nodi sorgente ed i nodi destinazione e che comprendono ciascuno uno o più nodi intermedi 31, 32, 33 della rete di comunicazioni ottiche 30 e le tratte in fibra ottica tra i nodi intermedi considerati. Generalmente, i sistemi WDM noti possono comprendere tratte di fibra ottica di lunghezza pari a circa 80 km intervallate dalla presenza di amplificatori cosiddetti “in line”. Le tratte in fibra ottica possono inoltre comprendere altri tipi di apparati, come ad esempio attenuatori VOA (Variable Optical Attenuator), che sono tipicamente usati per equalizzare la potenza di segnale alle varie lunghezze d'onda, ed apparati di compensazione, ad esempio per la compensazione della dispersione cromatica o della dispersione dei modi di polarizzazione.

Preferibilmente, il primo ricevitore 21 ed il secondo ricevitore 22 comprendono un ricevitore ottico coerente. La struttura di un ricevitore ottico coerente è nota al tecnico del ramo e pertanto non verrà ulteriormente descritta nel seguito.

Secondo forme di realizzazione della presente invenzione, il metodo per monitorare un sistema di comunicazioni ottiche comprende misurare i valori di almeno un parametro di trasmissione relativo ad un canale ottico presso il ricevitore di un nodo del sistema di comunicazioni ottiche considerato, memorizzare ed elaborare tali valori ed infine analizzarli per rilevare la presenza in essi di anomalie e per identificare la causa di un guasto (nella presente descrizione tale termine verrà usato per indicare una soft-failure) del sistema indicato in anticipo dalla presenza di tali anomalie, ossia del guasto che è di fatto la causa di tali anomalie.

In particolare, il metodo secondo la presente invenzione preferibilmente comprende, presso uno o più ricevitori del sistema di comunicazioni ottiche considerato, misurare uno o più parametri di trasmissione associati ai canali ottici che arrivano presso il ricevitore stesso, come ad esempio il BER pre-FEC oppure il rapporto segnale-rumore ottico (OSNR). A tal scopo, ciascun ricevitore 21 , 22 del sistema 1 preferibilmente comprende uno o più moduli per la misura dei parametri di trasmissione associati ai vari canali ottici. In particolare, secondo forme di realizzazione della presente invenzione, ciascun ricevitore 21, 22 del sistema 1 comprende un modulo che implementa la decodifica FEC ed un modulo per la misura del BER sul segnale in ingresso al modulo che implementa la decodifica FEC, ossia un modulo per la misura del BER pre-FEC.

Le Figure 2a e 2b mostrano due grafici che illustrano in maniera schematica ed esemplificativa una misura del BER pre-FEC di un canale ottico presso un ricevitore di un sistema di comunicazioni ottiche esemplificativo e non mostrato nelle Figure. La misura del BER pre-FEC si riferisce ad un periodo di tempo di circa 24 ore per il grafico di Figura 2a, e di circa 1 ora per il grafico di Figura 2b. In entrambi i grafici sono rappresentati i valori di BER pre-FEC (asse delle ordinate) in funzione del tempo (asse delle ascisse). I due grafici non hanno quindi la stessa scala sia sull'asse delle ordinate che su quello delle ascisse e servono unicamente ad illustrare la differenza nell'andamento della misura del BER pre-FEC in assenza ed in presenza di una soft-failure. Il grafico di Figura 2a mostra un andamento “normale” del BER pre-FEC, ossia un andamento del BER-pre-FEC che non corrisponde ad alcuna soft-failure associata al relativo canale ottico. In questo grafico il BER pre-FEC ha un andamento sostanzialmente regolare e “quasi piatto” nell'intervallo di tempo monitorato. Il grafico di Figura 2b mostra invece un andamento del BER pre-FEC che si discosta dall'andamento cosiddetto “normale” a causa di una soft-failure e presenta un andamento anomalo, che corrisponde ad un innalzamento dei valori del BER pre-FEC dapprima graduale e poi più brusco rispetto a ai valori iniziali.

Più genericamente, nella descrizione seguente e nelle rivendicazioni, il termine “anomalia” associato all’andamento temporale del valore di un parametro di trasmissione (ad esempio, il BER pre-FEC) di un canale ottico all'interno di un certo intervallo di tempo di misura indicherà una condizione per cui i valori del parametro nell'intervallo considerato assumono un andamento che si discosta da quello corrispondente ad un andamento regolare per quel parametro (dove con “andamento regolare” si intende un andamento indicativo di una situazione di assenza di guasti), ed assume un andamento indicativo della susseguente occorrenza di un guasto (in particolare una soft-failure) nel sistema sul canale ottico considerato. NeH'ambito della presente invenzione, la presenza di una o più anomalie associate ad un parametro di trasmissione all’interno di uno o più corrispondenti intervalli di misura consecutivi (eventualmente sovrapposti) indica preferibilmente la susseguente occorrenza di una soft-failure sul canale ottico considerato. In altre parole, la presenza di una o più anomalie anticipa l'occorrenza del guasto sul canale ottico considerato. Una soft-failu può ad esempio corrispondere ad una condizione di disallineamento dei filtri del canale ottico considerato, oppure ad una condizione di eccessiva attenuazione del canale ottico, oppure ad una condizione di malfunzionamento di laser e/o fotodiodi, oppure ad una condizione di piegamento della fibra ottica (“fìber bend”), oppure ad una combinazione delle condizioni citate.

Secondo forme di realizzazione della presente invenzione ciascun ricevitore del sistema di comunicazioni ottiche 1 coopera con una unità di monitoraggio del sistema (non mostrata nei disegni). Preferibilmente, tale unità è un modulo software configurato per essere eseguito sullo stesso apparato che ospita il ricevitore oppure su uno o più apparati esterni ad esso collegati. Ad esempio, l'unità di monitoraggio può risiedere in un controllore di rete centralizzato, in particolare un controllore SDN (Software Defined Networking) in comunicazione con i ricevitori dei nodi del sistema di comunicazioni ottiche 1 .

Preferibilmente l'unità di monitoraggio del sistema comprende un modulo di acquisizione dati, un modulo di rilevazione ed un modulo di identificazione. Le funzioni di tali moduli diverranno chiare dalla descrizione dettagliata che segue, che farà riferimento al diagramma di flusso di Figura 3. In particolare, il diagramma di flusso di Figura 3 illustra il funzionamento del metodo secondo la presente invenzione quando applicato “sul campo” per la rilevazione ed identificazione di una soft-failure.

In particolare, il metodo della presente invenzione verrà nel seguito descritto facendo riferimento alla misura di un singolo parametro di trasmissione di un canale ottico presso il ricevitore considerato. Tale parametro di trasmissione può essere ad esempio il BER pre-FEC. Tuttavia, tale descrizione non costituisce una limitazione dal momento che il metodo descritto può utilizzare i valori di diversi parametri di trasmissione relativi allo stesso canale ottico (ad esempio, BER pre-FEC e OSNR) e può essere applicato per monitorare tutti i canali ottici che arrivano presso uno stesso ricevitore.

Secondo la presente invenzione, durante il suo funzionamento, il ricevitore 21 preferibilmente fornisce una misura continua del parametro di trasmissione considerato. In particolare, il ricevitore 21 campiona il valore del parametro di trasmissione con un periodo di campionamento pre-definito che può essere, ad esempio, compreso tra 3 secondi e 110 secondi.

Ad inizio procedura inoltre il ricevitore 21 preferibilmente inizializza un contatore che indica il numero di anomalie riscontrate nei campioni del parametro di trasmissione, come verrà descritto in seguito. Ad esempio, ad inizio procedura il valore del contatore è posto a zero.

Una volta acquisiti i campioni del parametro di trasmissione per un certo intervallo di tempo di misura, il ricevitore 21 preferibilmente li inoltra al modulo di acquisizione dati dell’unità di monitoraggio, che effettua una preelaborazione di tali campioni del parametro di trasmissione (ad esempio, per ridurre il rumore sui dati). Questa fase non è mostrata nel diagramma di Figura 3. Alla fase 301, il modulo di acquisizione dati preferibilmente raccoglie i campioni pre-elaborati del valore del parametro di trasmissione acquisiti dal ricevitore nell'intervallo di misura considerato e li organizza in una cosiddetta “finestra di misura” del parametro. La finestra di misura può avere, ad esempio, una durata compresa tra 5 e 300 minuti, ad esempio di 15 minuti.

Più in generale, secondo la presente invenzione, il modulo di acquisizione dati preferibilmente organizza i campioni del parametro di trasmissione acquisiti dal ricevitore in una sequenza di finestre di misura, che possono essere disgiunte o almeno parzialmente sovrapposte nel tempo. In altre parole, due finestre di misura successive possono non comprendere campioni comuni oppure comprendere uno o più campioni comuni.

Alla fase 302, il modulo di acquisizione dati preferìbilmente determina, per ciascuna finestra di misura del parametro di trasmissione, uno o più dati di input da inviare al modulo di rilevazione. Per fare questo, il modulo di acquisizione dati può anche determinare uno spettro dei valori della finestra di misura considerata, tramite applicazione del noto algoritmo di Fast Fourier Transform (FFT). Preferibilmente, i dati di input comprendono uno o più valori statistici relativi alle misure del parametro di trasmissione nella finestra di misura considerata, come ad esempio uno o più dei seguenti valori: un valore medio dei campioni, un valore massimo dei campioni, un valore minimo dei campioni, una deviazione standard dei campioni, un valore quadratico medio dei campioni, un valore picco-picco dei campioni (ossia, una differenza tra il valore minimo ed il valore massimo), uno o più valori dello spettro.

Alla fase 303 i dati di input vengono preferìbilmente inoltrati dal modulo di acquisizione al modulo di rilevazione. In particolare, tale modulo esegue un algoritmo di rilevazione che verìfica la presenza di un’anomalia nella finestra di misura. In particolare, preferibilmente, il modulo di rilevazione mappa i dati di input in una di due classi, una prima classe corrispondente alla presenza di una anomalia nella finestra di misura considerata ed una seconda classe corrispondente all'assenza di una anomalia nella stessa finestra di misura. Fintantoché il modulo di rilevazione non riscontra alcuna anomalia, le fasi 301-303 sono ripetute per finestre di misura successive dei campioni raccolti presso il ricevitore ed il valore del contatore rimane uguale al valore iniziale (ad esempio, zero). In ogni caso, se il modulo di rilevazione non rileva alcuna anomalia nella finestra di misura corrente, il valore del contatore viene preferibilmente resettato al valore iniziale.

Se il modulo di rilevazione riscontra una anomalia nella finestra di misura considerata, esso preferibilmente emette un avviso di allarme relativamente al canale ottico considerato (fasi 304 e 305) sotto forma di un messaggio di segnalazione che può essere reso disponibile ad un operatore. Inoltre il modulo di rilevazione preferìbilmente aggiorna (ossia, incrementa di una unità) il contatore che indica il numero di anomalie riscontrate.

Inoltre, il modulo di rilevazione preferìbilmente confronta il valore del contatore con una soglia AN pre-definita, dove AN è un numero intero maggiore o uguale ad 1 (fase 306). Se il valore del contatore non supera la soglia AN, le fasi 301 , 302 e 303 sono preferibilmente ripetute relativamente alla finestra di misura successiva.

Nel caso in cui il valore del contatore sia pari alla soglia pre-definita AN (ossia, nel caso in cui il modulo di rilevazione ha rilevato un numero AN di anomalie consecutive), il modulo di rilevazione preferìbilmente emette un allarme di anomalia relativamente al canale ottico considerato (fase 307). L’allarme di anomalia viene preferibilmente emesso sotto forma di un messaggio di segnalazione inviato al modulo di identificazione.

Il valore della soglia AN può essere posto ad 1, nel qual caso l’allarme di anomalia viene emesso alla rilevazione di ogni singola anomalia riscontrata nei campioni del parametro di trasmissione, oppure può essere posto ad un valore intero maggiore di 1, nel qual caso l'allarme di anomalia viene emesso alla rilevazione di una sequenza di anomalie successive riscontrate nei campioni del parametro di trasmissione. Il valore pre-definito della soglia AN può essere impostato da un operatore di rete.

In aggiunta o in alternativa rispetto a quanto descritto sopra, l’allarme di anomalia può anche essere generato ‘‘manualmente" da parte dell'operatore una volta che il modulo di rilevazione abbia generato un numero AN di avvisi di allarme in sequenza.

Il valore della soglia AN può essere pre-determinato osservando ad esempio dati storici di misure del parametro di trasmissione in assenza ed in presenza di malfunzionamenti. Nel caso in cui il parametro di trasmissione considerato sia il BER pre-FEC, il valore AN può ad esempio dipendere da un valore pre-definito di BER pre-FEC al di sopra del quale le prestazioni del ricevitore sono ritenute inaccettabili (ad esempio 0,01% o 0,1%) a causa del malfunzionamento considerato. In tal caso, il valore della soglia AN può essere determinato in base al numero di anomalie riscontrate dal primo classificatore nei dati storici di misura prima che il valore del BER pre-FEC superi il valore ritenuto inaccettabile. Il valore di AN può anche dipendere dall’anticipo temporale che si vuole ottenere per l'allarme di anomalia rispetto al momento in cui il BER pre-FEC raggiunge il valore ritenuto inaccettabile (ossia, rispetto al momento effettivo in cui si verifica il malfunzionamento). Secondo la presente invenzione, alla ricezione dell’allarme di anomalia, il modulo di identificazione preferibilmente esegue un algoritmo di identificazione che identifica la causa del susseguente guasto indicato dalla(e) anomalia(e). Preferibilmente, il modulo di identificazione usa gli stessi dati di input del modulo di rilevazione. In particolare, l'algoritmo di identificazione preferibilmente mappa i dati di input della finestra di misura corrente (ossia della finestra in cui è stata rilevata l’ultima anomalia della sequenza di AN anomalie successive) in una classe all’interno di un insieme di classi di identificazione della causa del malfunzionamento (fase 308). In alternativa, l'esecuzione dell’algoritmo di identificazione della fase 308 può prevedere di mappare in una rispettiva classe di identificazione i dati di input di ciascuna finestra di misura della sequenza di AN finestre di misura per le quali alla fase 305 è stato emesso un avviso di allarme, oppure delle ultime AN' finestre di misura della sequenza, in cui AN' è un numero intero minore maggiore o uguale a l e minore di AN. In questo caso, l'identificazione della causa del malfunzionamento può essere ad esempio eseguita in maniera automatica considerando, al termine della fase 308, la classe di identificazione più popolata dai risultati ottenuti, oppure può essere determinata da un operatore analizzando i risultati ottenuti finestra dopo finestra.

L’insieme di classi di identificazione corrisponde preferìbilmente ad un insieme di cause pre-definito che comprende, ad esempio: disallineamento dei filtri del canale ottico considerato, eccessiva attenuazione del canale ottico, malfunzionamento di laser e/o fotodiodi, piegamento della fibra ottica, o una combinazione di esse.

Grazie alla identificazione operata dal metodo secondo la presente invenzione, è possibile identificare un guasto del sistema in anticipo rispetto alla sua effettiva occorrenza. In particolare, grazie alla presente invenzione, è possibile identificare l’apparato o gli apparati di rete malfunzionanti prima che tale malfunzionamento ne provochi il guasto, con conseguente interruzione del canale ottico. In tal modo è quindi possibile garantire una tempestiva riparazione dell’apparato, riconfigurazione o, eventualmente, sostituzione. Mentre l’apparato viene riparato, riconfigurato o sostituito, è possibile effettuare una riconfigurazione del canale ottico affetto dalla soft-failure identificata in modo che non intervenga alcuna violazione del Service Level Agreement (SLA) pattuito sul servizio offerto e che quindi venga rispettata la Quality of Service (QoS) offerta all’utente finale.

Nella descrizione che segue verranno descritti più in dettaglio i moduli di rilevazione e di identificazione della presente invenzione. Tale descrizione farà riferimento al diagramma di flusso di Figura 4.

Secondo forme di realizzazione della presente invenzione, l’algoritmo di rilevazione comprende preferibilmente un primo classificatore, preferibilmente basato su una tecnica di Machine Learning (ML). La tecnica di ML del primo classificatore può essere una delle seguenti: macchina a vettori di supporto binaria (binary Support Vector Machine, SVM), foresta casuale (Random Forest, RF), SVM multiclasse, rete neurale artificiale (Neural Network, NN). Come già anticipato sopra, secondo queste forme di realizzazione, il primo classificatore è configurato per rilevare in maniera automatica la presenza o meno di una anomalia all'interno di ciascuna finestra di misura considerata, a partire da dati di input (che corrispondono alle cosiddette “features” nella terminologia tipicamente utilizzata per descrivere le tecniche di ML) ottenuti dai valori del parametro di trasmissione. In particolare, il primo classificatore preferibilmente mappa i dati di input ottenuti dai valori del parametro di trasmissione in una finestra di misura all’interno di una prima classe corrispondente alla presenza di un'anomalia oppure una seconda classe corrispondente all’assenza dell’anomalia.

Secondo altre forme di realizzazione della presente invenzione, l’algoritmo di rilevazione può essere basato su altre tecniche di rilevazione di anomalie nelle finestre di misura precedenti l’effettiva occorrenza di un guasto, ad esempio tecniche basate sul confronto tra i valori del parametro di trasmissione della finestra considerate ed opportune soglie.

Secondo il metodo della presente invenzione, l'algoritmo di identificazione comprende un secondo classificatore, preferibilmente basato su una tecnica di ML. La tecnica di ML del secondo classificatore può essere una rete neurale artificiale. Come già anticipato sopra, secondo la presente invenzione, il secondo classificatore è configurato per effettuare in maniera automatica l'identificazione della causa del guasto mediante l’analisi dell’effetto che il guasto provoca sui valori del parametro di trasmissione misurati presso il ricevitore all'interno delle finestre di misura corrispondenti alle anomalie rilevate. In particolare, il secondo classificatore preferibilmente mappa i dati di input ottenuti dai valori del parametro di trasmissione in una finestra di misura all'interno di una classe appartenente ad un insieme di classi pre-definito, ciascuna corrispondente ad una diversa causa di guasto. Secondo forme di realizzazione preferite della presente invenzione, sia il primo classificatore che il secondo classificatore sono preferìbilmente basati su una tecnica di ML. Come noto, tali tipi di classificatori vengono istruiti per mezzo di una procedura di apprendimento automatico, in particolare semisupervisionato o completamente supervisionato.

La Figura 4 mostra il diagramma di flusso della procedura utilizzata per l’apprendimento sia del primo classificatore che del secondo classificatore secondo forme di realizzazione preferite della presente invenzione.

Durante una procedura di configurazione iniziale dell'unità di monitoraggio, prima che i moduli di rilevazione e di identificazione vengano messi in funzione sul campo, il ricevitore preferibilmente misura i valori del parametro di trasmissione considerato relativamente al canale ottico preso in esame per un tempo utile a raccogliere i dati per l'apprendimento dei classificatori. Le misure del parametro di trasmissione raccolte durante questa procedura comprendono sia misure indicative dell’assenza di anomalie che misure indicative della presenza di anomalie dovute alle possibili cause del guasto sul canale ottico considerato. Come anticipato sopra, ciascuna possibile causa è infatti associata ad una rispettiva classe dell'insieme di classi di identificazione del secondo classificatore. Tale tempo di misura iniziale verrà nel seguito indicato anche come "campagna di raccolta di dati di apprendimento”. Durante questo tempo, il ricevitore preferibilmente campione il valore del parametro di trasmissione con un periodo pre-definito T, che può essere ad esempio compreso tra 3 secondi e 110 secondi (fase 401).

Alla fase 402, il modulo di acquisizione dati, dopo aver acquisito i campioni misurati dal ricevitore, preferìbilmente effettua una pre-elaborazione dei campioni stessi, ad esempio per ridurre il rumore (fase 402). In accordo a quanto già descrìtto sopra, i valori raccolti e pre-elaborati dal modulo di acquisizione dati sono organizzati in una serie di finestre di misura del parametro di trasmissione (fase 403), ciascuna finestra avendo una durata temporale W che può essere compresa tra 5 e 300 minuti, ad esempio 15 minuti. All'interno di ciascuna finestra di misura il numero di campioni del parametro di trasmissione è pari a C=W/T. Per la raccolta dei dati di apprendimento, le finestre di misura preferìbilmente contengono tutte lo stesso numero di campioni C e possono essere disgiunte (nessun campione in comune) o parzialmente sovrapposte l'una rispetto alla finestra successiva. In altre parole, ciascuna finestra di misura del parametro di trasmissione può comprendere uno o più campioni del parametro di trasmissione che sono comuni anche ad una o più finestre di misura successive: ad esempio, ciascuna finestra può contenere un numero C di campioni del parametro di trasmissione, di cui i primi C'<C campioni appartengono anche alla finestra precedente. Si assuma che N indichi il numero di finestre di misura del parametro di trasmissione che sono raccolte durante la procedura di configurazione iniziale.

Alla fase 403, preferibilmente, i dati delle finestre di misura del parametro di trasmissione raccolti durante la campagna di raccolta di dati di apprendimento vengono memorizzati in un database.

Una volta che i dati di apprendimento sono stati raccolti, alla fase 404, il modulo di acquisizione dati preferibilmente determina, a partire dai valori di ciascuna finestra di misura di questi dati, uno o più dati di input per il classificatore considerato. In particolare, secondo alcune forme di realizzazione della presente invenzione, gli stessi dati di input usati per il primo classificatore sono usati anche come dati di input per il secondo classificatore (sia durante la procedura di apprendimento che durante il funzionamento sul campo). Per determinare i dati di input, il modulo di acquisizione dati può anche determinare uno spettro dei valori della finestra di misura considerata, tramite applicazione del noto algoritmo di Fast Fourìer Transform (FFT). Ad esempio, i dati di input possono comprendere: un valore medio dei campioni, un valore massimo dei campioni, un valore minimo dei campioni, una deviazione standard dei campioni, un valore quadratico medio dei campioni, un valore picco-picco dei campioni (ossia, una differenza tra il valore minimo ed il valore massimo), uno o più valori dello spettro.

Alla medesima fase 404, il modulo di acquisizione dati preferìbilmente organizza i dati di input in corrispondenti vettori multidimensionali (vettori di input), in cui ciascun vettore di input è associato ad una relativa finestra di misura del parametro di trasmissione. Nella descrizione seguente, verrà adottata la seguente notazione per indicare un generico vettore di input:

in cui i (i=1 , .... N) è un indice intero che indica la singola finestra di misura, N è un numero intero maggiore od uguale a 1 che indica il numero totale di finestre di misura considerate, M è un numero intero, maggiore o uguale a 1, che indica il numero di dati di input di ciascun vettore di input, e x1i, x2i . XMi sono i valori dei dati di input corrispondenti alla finestra di misura i-esima. Ciascun vettore di input (e quindi i dati relativi a ciascuna finestra di misura) è poi associato ad un corrispondente vettore di output del primo classificatore. In particolare, ciascun vettore di input che corrisponde alla presenza di un'anomalia nella finestra di misura relativa è associato ad un primo vettore di output del primo classificatore a sua volta associato alla prima classe dell’algoritmo di rilevazione; analogamente, ciascun vettore di input corrispondente all’assenza di un’anomalia nella finestra di misura relativa è associato ad un secondo vettore di output del primo classificatore a sua volta associato alla prima classe dell'algoritmo di rilevazione. Nelle descrizione seguente, verrà adottata la seguente notazione per indicare un generico vettore di output del primo classificatore:

in cui yi è il valore dell’unico dato di output corrispondente alla finestra di misura i-esima. Poiché infatti il primo classificatore effettua una classificazione binaria dei dati di input, ciascun vettore di output può comprendere un solo valore yi. Ad esempio, è possibile impostare yi=1 per indicare la presenza di un’anomalia, e yi=O per indicare l’assenza di un’anomalia.

Inoltre, secondo le forme di realizzazione della presente invenzione menzionate sopra, ciascun vettore di input IVj è associato anche ad un corrispondente vettore di output del secondo classificatore. Nella descrizione seguente, verrà adottata la seguente notazione per indicare un generico vettore di output del secondo classificatore:

in cui P è un numero intero, maggiore o uguale a 1, che indica il numero di dati di output di ciascun vettore di output del secondo classificatore, e y1l, y2i, .... ypi sono i valori dei dati di output corrispondenti alla finestra di misura iesima. Il numero P preferibilmente dipende dal numero di classi del classificatore. In particolare, secondo forme di realizzazione della presente invenzione, il vettore di output è un vettore di valori binari con dimensione pari al numero di classi, in cui tutte le componenti del vettore sono uguali a zero ad eccezione della componente corrispondente alla classe identificata, che può essere posta ad 1. Ad esempio, se P=4, ossia nel caso in cui le classi siano quattro, indicate ad esempio come C1, C2, C3, C4, un vettore di output che identifica la causa associata alla classe C2 potrebbe essere il seguente: {0; 1 ; 0; 0}.

Ciascuna coppia comprendente un vettore di input ed il corrispondente vettore di output per il primo classificatore, ottenuti con i dati raccolti durante la campagna di raccolta di dati di apprendimento, forma un cosiddetto "esempio” utile per l’apprendimento dell’algoritmo di rilevazione. Analogamente, ciascuna coppia comprendente un vettore di input ed il corrispondente vettore di output per il secondo classificatore, ottenuti con i dati raccolti durante la campagna di raccolta di dati di apprendimento, forma un cosiddetto "esempio” utile per l’apprendimento dell’algoritmo di identificazione. Ciascun esempio corrisponde ad una rispettiva finestra di misura del parametro di trasmissione. Per ciascun classificatore, dall'insieme di esempi relativi viene estratto un rispettivo sotto-insieme di esempi di apprendimento (detto anche "training set”) ed un rispettivo sotto-insieme di esempi di test (detto anche "test set”).

Durante la fase 405, il modulo di rilevazione preferibilmente esegue una tecnica di apprendimento semi-supervisionato o completamente supervisionato per addestrare il primo classificatore utilizzando gli esempi del corrispondente training set. Analogamente, il modulo di identificazione preferìbilmente esegue una tecnica di apprendimento semi-supervisionato o completamente supervisionato per addestrare il secondo classificatore utilizzando gli esempi del corrispondente training set.

Inoltre, sia il modulo di rilevazione che il modulo di identificazione preferibilmente eseguono una tecnica di validazione incrociata (o “crossvalidation”) per ottimizzare in maniera iterativa l’algoritmo di rilevazione e l’algoritmo di identificazione, rispettivamente (fase non mostrata nel diagramma di flusso di Figura 4) durante l'apprendimento. La tecnica usata può essere, ad esempio, la nota tecnica "Leave-One-Out Cross Validation". Come noto, l’applicazione di una tecnica di validazione incrociata consente vantaggiosamente di evitare il cosiddetto "overfìtting" e di ridurre l'errore sugli esempi di test. Ad esempio, nel caso in cui il classificatore comprenda una rete neurale artificiale, è possibile ottimizzare il numero di strati intermedi della rete ed il numero di nodi di ciascuno strato intermedio. Se il classificatore comprende una SVM (binaria o multiclasse), è possibile ottimizzare il tipo di kernel, mentre se il classificatore comprende una foresta casuale è possibile ottimizzare il numero di alberi.

Alla fine della fase di apprendimento vero e proprio di ciascun classificatore, il modulo di rilevazione ed il modulo di identificazione preferìbilmente eseguono una procedura di test del rispettivo classificatore (fase 406) utilizzando gli esempi del corrispondente test set.

Una volta che il primo classificatore ed il secondo classificatore sono stati addestrati secondo quanto descritto sopra, il modulo di rilevazione ed il modulo di identificazione sono in grado di funzionare "sul campo” (ossia, sono in grado di operare durante il normale funzionamento del sistema 1 successivamente alla campagna di raccolta di dati di apprendimento) per, rispettivamente, rilevare le anomalie nelle finestre di misura del parametro di trasmissione ed identificarne la causa, secondo quanto già descritto sopra con riferimento al diagramma di flusso di Figura 3.

È opportuno far notare che secondo la presente invenzione la procedura di raccolta dati per la determinazione dell'insieme di esempi utilizzato per l’apprendimento e per il test degli algoritmi di rilevazione e di identificazione, che è stata descritta sopra con riferimento alla fase di configurazione iniziale dei moduli di rilevazione ed identificazione, continua ad essere eseguita anche durante il normale funzionamento del sistema di comunicazioni ottiche considerato. In tal modo, vantaggiosamente, l’insieme di esempi disponibile per l'apprendimento degli algoritmi di rilevazione e di identificazione può essere continuamente adattato alle condizioni variabili del sistema di comunicazioni ottiche ed in particolare della rete di comunicazioni ottiche. In tal modo, vantaggiosamente, i moduli di rilevazione e di identificazione possono apprendere qual è l’andamento del parametro di trasmissione considerato in presenza di guasti associati a cause non note o non osservate precedentemente.

Secondo forme di realizzazione preferite della presente invenzione, il parametro di trasmissione utilizzato per implementare sia l’algoritmo di rilevazione che l’algoritmo di identificazione è il BER pre-FEC misurato al ricevitore. Secondo una forma di realizzazione esemplificativa della presente invenzione, ciascun vettore di input IVi sia per il primo che per il secondo classificatore può comprendere i seguenti 16 dati:

x1i = valore medio del BER all'interno della finestra di misura i-esima; x2ί = valore quadratico medio del BER all’interno della finestra di misura iesima;

x3i = valore picco-picco del BER (ossia, differenza tra il valore minimo del BER ed il valore massimo) all'interno della finestra di misura i-esima; x4i = deviazione standard del BER all’interno della finestra di misura iesima;

x5i = valore massimo del BER all’interno della finestra di misura i-esima; x6i = valore minimo del BER all'interno della finestra di misura i-esima; x7i - x16i = 10 valori più alti dello spettro del BER ottenuto applicando la FFT ai campioni della finestra di misura i-esima.

La Figura 5 mostra schematicamente un sistema di comunicazioni ottiche esemplificativo utilizzato per testare il metodo secondo la presente invenzione. In particolare, il sistema mostrato in Figura 5 è uno schema di un sistema di trasmissione Ericsson lungo 380 km comprendente un trasmettitore, che per semplicità può corrispondere al primo trasmettitore 11 di Figura 1 , ed un ricevitore, che per semplicità può corrispondere al secondo ricevitore 21 di Figura 1. Il sistema utilizza una modulazione PM-QPSK ad una velocità di trasmissione di 100 Gb/s e 30,071 Gbaud. Il segnale viene amplificato attraverso una serie di 6 amplificatori 51 , 52, 53, 54, 55, 56 di tipo EDFA (Erbium Doped Fibre Amplifier) seguiti da attenuatori VOA (Variable Optical Attenuator). Il sistema comprende inoltre un primo switch BV-WSS (Bandwidth Variable - Wavelength Selective Switch) 57 che è configurato per introdurre un malfunzionamento nel sistema che emuli uno di due malfunzionamenti tipici: un disallineamento di filtri oppure una riduzione indesiderata dal guadagno di amplificatore (ossia, eccessiva attenuazione del canale ottico). Il sistema comprende anche un secondo switch BV-WSS 58 che però non introduce alcun malfunzionamento essendo utilizzato solo per ridurre il rumore al ricevitore. La tratta in fibra ottica tra il primo amplificatore 51 ed il primo switch 57 è lunga 60 km mentre le altre tratte sono lunghe 80 km.

Il metodo secondo la presente invenzione è stato testato dagli inventori considerando un insieme di esempi ottenuti durante una campagna di raccolta di dati di apprendimento misurando il BER pre-FEC presso il ricevitore per un periodo di 24 ore, considerando un periodo di campionamento del BER pari a 3 secondi.

Sono stati testati quattro diversi algoritmi di rilevazione dei guasti, basati su quattro diverse tecniche di ML, ed un algoritmo di identificazione dei guasti. Questi algoritmi (indicati come algoritmo A, algoritmo B, algoritmo C, algoritmo D ed algoritmo E) verranno schematicamente descritti qui di seguito.

Algoritmo A

- Tecnica di ML: SVM binaria

Kernel: Radial Basis Function (gamma=0, 1)

Numero di esempi di apprendimento: tra 500 e 3400 esempi con assenza di anomalia

Numero di esempi di test: tra 200 e 700 esempi con assenza di anomalia, e 2000 esempi con presenza di anomalia

Tecnica di validazione: Leave-One-Out Cross Validation

- Dati di input (esempio i-esimo): 16 dati xi - x16i come indicato sopra Dati di output (esempio i-esimo): yi1 in presenza di anomalia, y=0 in assenza di anomalia

Algoritmo B

Tecnica di ML: SVM multiclasse

Kernel: polinomio di terzo grado

Numero di esempi di apprendimento: 3000 esempi con assenza di anomalia, 2000 esempi con presenza di anomalia

- Numero di esempi di test: 1000

Tecnica di validazione: Leave-One-Out Cross Validation

Dati di input (esempio i-esimo): 16 dati xi - x16i come indicato sopra Dati di output (esempio i-esimo): y=1 in presenza di anomalia, y=0 in assenza di anomalia

Algoritmo C

- Tecnica di ML: RF

Criterio di split: Gini Impurity

Numero di esempi di test: 1000

- Tecnica di validazione: Leave-One-Out Cross Validation

Dati di input (esempio i-esimo): 16 dati x1i - x16i come indicato sopra Dati di output (esempio i-esimo): yi=1 in presenza di anomalia, yi=0 in assenza di anomalia

Algoritmo D

Tecnica di ML: rete neurale artificiale

Numero di strati nascosti: 1

Numero di nodi dello strato nascosto: 10

Funzione di attivazione: Relu (Rectified linear unit)

- Ottimizzatore: algoritmo L-BFGS (Limited-memory Broyden-Fletcher-Goldfarb-Shannon)

Numero di esempi di test: 1000

- Tecnica di validazione: Leave-One-Out Cross Validation

Mentre l’algoritmo A è un algoritmo di classificazione semi-supervisionato, gli algoritmi B, C e D sono algoritmi completamente supervisionati. Per l’algoritmo A sono quindi sufficienti meno esempi di apprendimento rispetto agli altri algoritmi ed in particolare non è necessario fornire esempi rappresentativi della situazione “anomala”, ossi esempi relativi alla presenza di anomalia, ma solo esempi rappresentativi dell'assenza di anomalia nelle finestre di misura.

Per quanto riguarda l'identificazione dei guasti, è stato testato il seguente algoritmo:

Algoritmo E

Tecnica di ML: rete neurale artificiale

Numero di strati nascosti: 2

Numero di nodi di ciascuno strato nascosto: 5

Funzione di attivazione : Relu (Rectified linear unit)

Ottimizzatore: algoritmo di discesa stocastica del gradiente (Stochastic gradient descent)

Numero di esempi di apprendimento: da 1800 a 2000 (di cui il 50% circa rappresenta esempi di disallineamento di filtri e il 50% circa rappresenta esempi di eccessiva attenuazione)

Numero di esempi di test: 600

Tecnica di validazione: Leave-One-Out Cross Validation

Dati di input (esempio i-esimo): 16 dati x1i - x16i come indicato sopra Dati di output (esempio i-esimo): {1; 0} in presenza di disallineamento di filtri, {0; 1} in presenza di eccessiva attenuazione

Le Figure 6a e 6b illustrano i risultati del test effettuato sul sistema di Figura 5 per gli algoritmi di rilevazione. In particolare, il grafico di Figura 6a mostra, sull’asse delle ordinate, l'accuratezza dei risultati di classificazione dell’algoritmo A (l’accuratezza è indicata come “Acc.” ed espressa in percentuale) in funzione della durata W della finestra di misura (mostrata sull’asse delle ascisse, espressa in minuti), per diversi valori del periodo di campionamento T del BER pre-FEC all'interno della finestra di misura. L'accuratezza è stata determinata come il rapporto tra il numero di esempi di test classificati correttamente ed il numero totale di esempi di test utilizzati. Sono stati considerati i seguenti valori per il periodo di campionamento T: 22 s, 44 s, 66 s, 88 s, 110 s. In particolare, sono stati utilizzati indicatori quadrati per il grafico relativo a T=22 s, indicatori circolari pieni per il grafico relativo a T=44 s, indicatori a croce per il grafico relativo a T=66 s, indicatori circolari vuoti per il grafico relativo a T=88 s, ed indicatori triangolari per il grafico relativo a T= 110 s.

Dal grafico è possibile osservare che per valori ridotti del periodo di campionamento, è sufficiente una finestra di durata ridotta per raccogliere un numero di campioni del BER utile ad ottimizzare l’accuratezza: l’accuratezza infatti raggiunge il 100% per una finestra di durata pari a circa 18 minuti. Per valori più alti del periodo di campionamento del BER, è invece necessaria una durata maggiore della finestra di misura, per fare in modo che vengano considerati un numero maggiore di campioni del BER da cui estrarre significativi dati di input. Ad esempio, per un periodo di campionamento T pari a 44 s, la finestra di misura deve avere una durata di circa 73 minuti per avere il 98% di accuratezza.

Il grafico di Figura 6b mostra, sull'asse sinistro delle ordinate, l'accuratezza degli algoritmi B, C e D (l'accuratezza è indicata come "Acc." ed espressa in percentuale) insieme ad una misura della loro complessità computazionale espressa in termini della durata della fase di apprendimento (riportata sull’asse destro delle ordinate ed espressa in ms). Per ciascun algoritmo, sono stati utilizzati il valore di perìodo di campionamento T e di durata W della finestra di misura corrispondenti alla massima accuratezza fornita da ciascun algoritmo al variare di tali parametri, ossia T=22 s e W=36 minuti. Come si nota dal grafico, l'algoritmo D è quello che mostra la più bassa complessità computazionale, ma che fornisce, per contro, la più ridotta accuratezza (98,2%). L'algoritmo B fornisce un'accuratezza maggiore rispetto all’algoritmo D (99%) ma richiede tempi più lunghi per l’apprendimento. L’algoritmo C fornisce un compromesso tra accuratezza e complessità: esso infatti fornisce l'accuratezza più alta (99,1%) a fronte di una complessità nettamente inferiore rispetto all'algoritmo B.

La Figura 7 mostra, sull'asse delle ordinate, l'accuratezza dei risultati dell’algoritmo E (l’accuratezza è indicata come "Acc." ed espressa in percentuale) in funzione della durata W della finestra di misura (sull’asse delle ascisse, espressa in minuti), per diversi valori del periodo di campionamento T del BER nella finestra di misura (3 s, 6 s, 9 s). In particolare, sono stati utilizzati indicatori quadrati per il grafico relativo a T=3 s, indicatori circolari pieni per il grafico relativo a T=6 s, ed indicatori a croce per il grafico relativo a T=9 s. Come si può notare, l’accuratezza migliora aH’aumentare della durata della finestra di misura. Inoltre, per una data durata della finestra di misura, l’accuratezza diminuisce all'aumentare del valore del perìodo di campionamento, poiché viene ridotta la quantità di campioni del BER da cui estrarre i dati di input. In generale, una finestra di misura della durata di 15 minuti circa è sufficiente per fornire un'accuratezza del 100% per qualsiasi valore del perìodo di campionamento del BER.

Vantaggiosamente, i risultati dei test effettuati dagli inventori dimostrano che gli algoritmi di rilevazione e di identificazione del metodo secondo la presente invenzione consentono di rilevare le anomalie presenti nelle finestre di misura e di identificarne la causa. Questo vantaggiosamente consente di individuare rapidamente una soft-failu prima che essa avvenga cosi che l’operatore di rete possa velocemente implementare specifiche procedure di riparazione del guasto in modo da garantire la QoS pattuita con i propri clienti. Questo consente anche di limitare i costi altrimenti necessari per implementare le tradizionali misure di individuazione dei guasti. Il metodo descritto garantisce una automatica individuazione della causa della softfailure che consente di ridurre il tempo medio richiesto per riparare il guasto (o Mean Time to Repair, MTTR). Inoltre, il fatto che la maggior parte dei malfunzionamenti possano essere previsti ed evitati incrementa la disponibilità del servizio offerto. Di più, il metodo descritto consente di evitare di implementare sistemi di protezione e quindi di sovradimensionare gli apparati da disporre in rete.

Dal punto di vista degli utenti finali, il metodo descritto consente di migliorare la qualità del servizio che viene loro offerto, in quanto consente di evitare che il servizio sia interrotto a causa di una soft-failure.

È opportuno inoltre notare che il metodo secondo la presente invenzione può essere adattato per identificare non solo cause di guasti pre-definite durante una fase iniziale di configurazione, secondo quanto descritto sopra, ma anche per “imparare” ad indentificare cause di guasti non ancora note o non osservate in precedenza nel sistema considerato. E’ evidente quindi che esso può essere applicato a qualsiasi sistema e rete di comunicazioni ottiche senza che siano necessariamente noti a priori nella struttura e composizione. In particolare può essere adattato a diverse tipologie di sistemi di comunicazioni ottiche aventi ad esempio diverse scale geografiche o diverso numero e tipologia di apparati. Infatti, l’utilizzo delle tecniche di ML descritte sopra permette vantaggiosamente di addestrare l'algoritmo di identificazione in maniera ad-hoc a seconda delle caratteristiche del sistema e delle possibili cause di guasti ma anche ad individuare le “nuove cause” che possono presentarsi durante il funzionamento del sistema. Questo può essere ottenuto aggiungendo nuove classi ai dati di output del classificatore ed aggiungendo nuovi esempi all'insieme di esempi utilizzato per l'apprendimento, in cui i nuovi esempi comprendano finestre di misura i cui campioni siano indicativi delle nuove tipologie di guasti.

In definitiva, l’utilizzo di tecniche di ML per gli algoritmi di rilevazione ed identificazione dei guasti secondo la presente invenzione consente di creare un metodo di monitoraggio basato su relazioni dirette tra i parametri di trasmissione, in particolare il loro andamento nelle finestre di misura, e le cause dei guasti che hanno provocato proprio quel particolare andamento, sfruttando dati rappresentativi della “storia” del sistema monitorato. Il fatto che il metodo preveda di misurare in maniera continuativa i parametri di trasmissione ai ricevitori e di raccogliere dati per l’insieme di esempi di apprendimento consente infatti, vantaggiosamente, di ottenere un metodo altamente adattativo e flessibile rispetto alle condizioni dinamiche del sistema monitorato.

Claims

RIVENDICAZIONI 1. Un metodo per monitorare un sistema di comunicazioni ottiche (1) comprendente almeno un canale ottico che collega un trasmettitore (11) ed un ricevitore (21), detto metodo comprendendo: a) misurare, presso detto ricevitore (21), un parametro di trasmissione di detto canale ottico per un intervallo di tempo di misura pre-definito; b) sulla base delle misure di detto parametro di trasmissione in detto intervallo di tempo, verificare la presenza di almeno un’anomalia in dette misure, detta almeno un’anomalia essendo indicativa di un susseguente guasto di detto sistema; e c) in presenza di detta almeno un’anomalia, applicare un algoritmo di identificazione a dette misure, detto algoritmo comprendendo un classificatore, in cui il classificatore è configurato per, sulla base di dette misure, identificare una causa di detto guasto, detto classificatore essendo basato su una tecnica di machine leaming.
2. Il metodo secondo la rivendicazione 1 , in cui detta fase a) comprende: al) campionare i valori di detto parametro di trasmissione in detto intervallo con un periodo pre-definito e raccogliere detti campioni in una finestra di misura di detto parametro di trasmissione avente una durata pre-definita; e a2) determinare, a partire da detti campioni, uno o più dati di input per detto classificatore, in cui detti dati di input comprendono uno o più valori statistici relativi ai campioni del parametro di trasmissione in detta finestra di misura.
3. Il metodo secondo la rivendicazione 2, in cui detti valori statistici comprendono uno o più dei seguenti: un valore medio dei campioni, un valore massimo dei campioni, un valore minimo dei campioni, una deviazione standard dei campioni, un valore quadratico medio dei campioni, un valore picco-picco dei campioni, uno o più valori dello spettro dei campioni.
4. Il metodo secondo la rivendicazione 2 o 3, in cui detto metodo comprende raccogliere i campioni di detto parametro di trasmissione in almeno due finestre di misura consecutive, in cui dette almeno due finestre di misura sono disgiunte o almeno parzialmente sovrapposte, verificare la presenza di un’anomalia in ciascuna finestra di misura di dette almeno due finestre di misura e, in presenza di un'anomalia in ciascuna finestra di misura, applicare detto algoritmo di identificazione.
5. Il metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detto parametro di trasmissione è il BER pre-FEC associato a detto canale ottico.
6. Il metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detta tecnica di machine leaming comprende una rete neurale artificiale.
7. Il metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detta fase b) comprende applicare un algoritmo di rilevazione a dette misure, detto algoritmo di rilevazione comprendendo un ulteriore classificatore basato su una ulteriore tecnica di machine learning.
8. Il metodo secondo la rivendicazione 7, in cui detta ulteriore tecnica di machine leaming comprende una delle seguenti: macchina a vettori di supporto binaria, foresta casuale, SVM multiclasse, rete neurale artificiale.
9. Il metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detto metodo comprende inoltre una fase di configurazione iniziale, e detta fase di configurazione iniziale comprende applicare un algoritmo di apprendimento automatico per istruire detto classificatore sulla base di un insieme di misure di detto parametro di trasmissione, detto insieme di misure essendo indicative di almeno due possibili cause di detto guasto.
10. Una unità di monitoraggio per un sistema di comunicazioni ottiche (1), detto sistema (1) comprendendo almeno un canale ottico che collega un trasmettitore (11) ed un ricevitore (21), detta unità comprendendo: - un modulo di acquisizione dati configurato per raccogliere da detto ricevitore (21) misure di un parametro di trasmissione di detto canale ottico per un intervallo di tempo di misura pre-definito; - un modulo di rilevazione configurato per, sulla base delle misure di detto parametro di trasmissione in detto intervallo di tempo, verificare la presenza di almeno un’anomalia in dette misure, detta almeno un’anomalia essendo indicativa di un susseguente guasto di detto sistema; e - un modulo di identificazione configurato per, in presenza di detta almeno un’anomalia, applicare un algoritmo di identificazione a dette misure, detto algoritmo comprendendo un classificatore, in cui il classificatore è configurato per, sulla base di dette misure, identificare una causa di detto guasto, detto classificatore essendo basato su una tecnica di machine learning.