WO2015097318A1

WO2015097318A1 - Procedimiento y sistema para restaurar degradaciones de la qos en redes de mpls

Info

Publication number: WO2015097318A1
Application number: PCT/ES2013/070929
Authority: WO
Inventors: Juan Pedro Fernandez-Palacios Gimenez; Juan RODRIGUEZ MARTINEZ
Original assignee: Telefonica, S.A
Priority date: 2013-12-26
Filing date: 2013-12-26
Publication date: 2015-07-02
Also published as: EP3089409A4; US20160308709A1; EP3089409A1

Abstract

Un sistema (10) que implementa un procedimiento para determinar degradaciones de QoS comprende: - recibir alarmas (a) desde la capa de aplicación (20), o desde los nodos (31) de red de una red de MPLS, incluyendo el Analizador de Tráfico Pasivo (32), la Monitorización de Capa Física (33) y los nodos de OAM (34) de MPLS, - según la alarma, el sistema (10) solicita pruebas (d) para la localización y los nodos (31) de red responden con la localización (e), - una vez que el fallo está localizado, el sistema (10) inicia la restauración (h) del tráfico mediante la Señalización (35) de MPLS y recibe el resultado (i), - el sistema (10) puede necesitar consultar la Base de Datos (36) del Sistema: la etapa de consulta (b) – respuesta (c) antes de solicitar la localización es optativa, mientras que la etapa de consulta (f) – respuesta (g) es obligatoria antes de la restauración (h), - una vez que el tráfico está restaurado, el sistema (10) activa (j) pruebas adicionales por los nodos (31) de red y / o la capa de aplicación (20) por para garantizar la QoS global correcta dentro de la nueva situación de red, - el sistema (10) puede activar un bucle (i) de restauración adicional hasta que se declare un comportamiento global estable no degradado.

Description

DESCRIPCIÓN

PROCEDIMIENTO Y SISTEMA PARA RESTAURAR DEGRADACIONES DE LA

QOS EN REDES DE MPLS

Campo de la invención

La presente invención tiene su aplicación dentro del sector de las telecomunicaciones y, especialmente, se refiere a la Garantía de Calidad en redes de ordenadores y, más específicamente, se refiere a un sistema y procedimiento para impedir, detectar y restaurar las degradaciones de la Calidad del Servicio (QoS) en redes de Conmutación de Etiquetas MultiProtocolo (MPLS) de Extremo-a- Extremo (E2E).

Antecedentes de la invención

Las redes del Núcleo del Protocolo de Internet (IP) se despliegan normalmente sobre la tecnología de Conmutación de Etiquetas MultiProtocolo (MPLS), debido a la amplia gama de ventajas que proporciona esta encapsulación, en términos de Ingeniería de Tráfico (TE), provisión homogénea de cualquier tipo de servicio, herramientas de restauración y mantenimiento de la Calidad del Servicio (QoS). Por esos motivos, en los últimos años pasados, la MPLS también ha experimentado una extensión a otros segmentos existentes, como las redes regionales. Sin embargo, estos dominios de la MPLS normalmente se han mantenido separados, al menos en los grandes operadores, debido, principalmente, a motivos de escalabilidad.

Muy recientemente, se ha hecho un esfuerzo para definir las denominadas redes de MPLS de Extremo-a-Extremo (E2E), lo que significa transporte ajustable a escala de MPLS sobre cualquier tipo de acceso y tecnologías de la capa 1 , en cualquier segmento de red (y entre cualquier segmento de red) y para cualquier tipo de servicio. En otras palabras, todos los encaminadores de red (encaminadores de distribución, encaminadores fronterizos y metro-encaminadores) proporcionan una única capa de transporte basada en MPLS para cualquier servicio establecido entre nodos de Acceso y nodos de Servicio. Las ventajas principales que las redes de MPLS de E2E ofrecen son la flexibilidad y homogeneidad, proporcionando a la vez servicios sobre Seudo-Cables (PW) en (y entre) todos los segmentos de red, la simplificación de la gestión de red y la existencia de mecanismos definidos de Operación, Administración y Mantenimiento (OAM) de E2E para la gestión de fallos.

El ejemplo más relevante de las arquitecturas de MPLS de E2E es la MPLS Sin Fisuras. Sin embargo, una de las cuestiones más importantes que presentan las redes de MPLS de E2E está precisamente referida a la gestión de fallos. El tiempo total de fallo (es decir, el tiempo durante el cual el servicio no está disponible) está compuesto por tres intervalos temporales. El proceso comprende las siguientes tres etapas: después de que ocurre un fallo, la primera etapa (i) es detectar que ha ocurrido, luego (ii) localizar dónde ha ocurrido y, finalmente, (iii) restaurarlo. Un objetivo de cualquier sistema de gestión de fallos debería ser reducir lo máximo posible el tiempo total de fallo.

Para ese fin, los procesos automatizados son un requisito; si cualquiera de las tres etapas anteriores, (i) detección, (ii) localización o (iii) restauración, necesita intervención humana, entonces el tiempo de respuesta aumenta, y el servicio no está disponible durante un tiempo más largo. La MPLS permite varios mecanismos automatizados de restauración, aunque vale la pena mencionar que no son rápidos en todas las ocasiones.

Además, estos no son los únicos retos: los procesos actuales de gestión de fallos (y los mecanismos de restauración) tratan principalmente con fallos de Pérdida de

Conectividad (LoC), pero existen otras averías que también afectan a la QoS, como la congestión de red, por ejemplo. Por tanto, la gestión adecuada de fallos también necesita abordar tales causas de degradación. Las actuales herramientas de monitorización de MPLS y las soluciones de restauración se describen brevemente a continuación:

- Monitorización de OAM de la MPLS

Los protocolos de OAM han sido definidos para redes de Ethernet, IP y MPLS, y también para la PWE3 (Emulación de Seudo Cables de Frontera a Frontera). En particular, para MPLS y PWE3, las herramientas como LSP Ping o la Detección de Remisión Bidireccional (BFD) han sido usadas desde hace largo tiempo para la detección de fallos: los mensajes de monitorización son intercambiados en banda entre pares de encaminadores y, cuando algunos no llegan, se detecta un fallo. Después de la detección y la localización, las redes de MPLS pueden ejecutar luego el correspondiente mecanismo de restauración. Recientemente, tales herramientas tradicionales han sido extendidas en el contexto de MPLS-TP con capacidades realzadas de MPLS de OAM, que permiten a los proveedores de redes monitorizar la disponibilidad de la red y la calidad de los servicios de clientes (QoS), y proporcionar los SLA (Acuerdos de Niveles de Servicios) requeridos. Las herramientas de OAM de MPLS-TP están siendo definidas principalmente en la IETF (Fuerza de Tareas de Ingeniería de Internet), aunque en ITU-T hay otra definición paralela basada en mecanismos similares. El juego de herramientas de OAM consiste en un conjunto exhaustivo de capacidades de monitorización de la gestión de fallos y de las prestaciones, que puede ser usado por los operadores para detectar y localizar defectos más efectivamente.

Monitorización pasiva

Las técnicas de monitorización pasiva de la QoS se dividen en dos grupos principales. Por una parte, existen técnicas de monitorización pasiva que hacen uso del tráfico de red, algoritmos complejos de procesamiento y modelos de distribución del tráfico para brindar conocimientos acerca del estado de las redes de los operadores. Los ejemplos de tales técnicas incluyen la Monitorización Remota (RMON), el Protocolo Sencillo de Monitorización de Red (SNMP) o dispositivos capacitados para NetFIow. La Monitorización Remota (RMON) es un protocolo estándar que permite a diversos monitores de red y sistemas de consola obtener e intercambiar datos de monitorización de red. El SNMP es también un protocolo estándar, orientado a la monitorización y configuración de nodos de red. Finalmente, NetFIow es un protocolo de red desarrollado por Cisco Systems para recoger información de tráfico del IP, que se ha convertido en un estándar industrial para la monitorización del tráfico, y que dispone de soporte en diversas plataformas. Por otra parte, una alternativa para la monitorización pasiva consiste en dispositivos que monitorizan el tráfico según pasa. Estos dispositivos pueden ser dispositivos de propósito especial (sondas pasivas) tales como un rastreador, o pueden estar incrustados en dispositivos tales como encaminadores, conmutadores o anfitriones (p. ej., dispositivos de soporte de la Inspección Profunda de Paquetes - DPI). - Monitorización activa

El enfoque de monitorización activa se apoya en la capacidad de inyectar paquetes de prueba en la red, o de realizar mediciones al nivel de las aplicaciones. Como tal, crea tráfico extra, tráfico que es perfectamente conocido para el sistema de monitorización, por lo que puede ser identificado. En ese sentido, es muy similar a la monitorización basada en OAM, aunque es usualmente realizada por sondas externas a los nodos de red. El enfoque activo proporciona control explícito sobre la generación de paquetes para escenarios de medición (control sobre la naturaleza de la generación del tráfico, técnicas de muestreo, tamaños de paquete, etc.) y la temporización; por tanto, implica probar lo que se requiere cuando se requiere. La clasificación mayoritariamente aceptada comprende herramientas de monitorización activa en dos grupos: PGM (Modelos de Brecha de Sondeo) que basan la estimación en la brecha de dispersión entre dos paquetes sondeadores consecutivos, y PRM (Modelos de Tasa de Sondeo), cuyas estimaciones se apoyan en enviar convoyes de paquetes de sondeo a velocidades crecientes. En la bibliografía pueden identificarse varias iniciativas y desarrollos de tales herramientas. Las herramientas de monitorización activa pueden ser ejecutadas continuamente (habitualmente, para la gestión proactiva de fallos) o bajo demanda (usualmente con propósitos reactivos, después de que alguna alarma ha sido generada por otro mecanismo).

Monitorización de la capa física

Aparte de la monitorización en las capas 2, 3 y demás, la monitorización en la capa física también es muy común en las redes de los operadores. Tal monitorización puede ser llevada a cabo mediante procedimientos de encapsulación (LAN, WAN, G.709), que permiten que la capa física proporcione alarmas como Pérdida de

Señal, Pérdida de Trama, Indicación de Defecto Remoto, etc., al correspondiente sistema de gestión.

Además de las herramientas ya descritas anteriormente, hay todavía una funcionalidad adicional que juega un papel importante una vez que un fallo es detectado y localizado: la restauración de MPLS. Los mecanismos de restauración necesitan ser activados para restaurar los flujos de tráfico de clientes, es decir, para inyectarlos sobre un trayecto alternativo que no presenta ningún fallo. En la MPLS existen varios procedimientos para lograr tal comportamiento, siendo el

Reencaminamiento Rápido (FRR) el más común. Además, por la razón que sea (p. ej., cuando se detecta congestión), los operadores de red pueden querer desplazar la carga de tráfico desde un segmento de red a otro. Tal operación necesita ser ejecutada sin ninguna pérdida del tráfico de clientes, lo que se conoce como el enfoque de "hacer antes de romper". En la MPLS es posible hacer ingeniería de tráfico (TE) usando RSVP-TE, una extensión del Protocolo de Reserva de Recursos (RSVP). Tanto la restauración como los procesos de ingeniería de tráfico pueden estar determinados como reversibles o no reversibles. Esto significa que es posible determinar si el tráfico debe revertirse al trayecto original, o no, una vez que el fallo ha sido reparado.

Además, a fin de hacer ingeniería de tráfico (TE) basada en retardos y pérdidas, hay varias propuestas de la IETF (en una fase previa a la estandarización), que incluyen la posibilidad de monitorizar las condiciones de red antes del establecimiento de cualquier servicio de conectividad, p. ej., usando el estado de red como entrada para la determinación del mejor trayecto. Esta característica es esencialmente distinta a las presentadas anteriormente, que están centradas en la monitorización de los servicios actualmente configurados. Otro ejemplo que merece la pena mencionar es el procedimiento y aparato para el soporte de gestión de redes de la funcionalidad de OAM revelada en el documento EP1 176759, que describe un sistema de gestión de red con una interfaz gráfica de usuario (GUI) que comprende varias características para facilitar el trabajo de los operadores humanos, es decir, para facilitar la configuración y la recolección de resultados de la monitorización basada en OAM. Por lo tanto, aún se requiere la intervención humana. Los únicos procesos automatizados descritos allí son (i) la configuración de funcionalidades de OAM a lo largo de los nodos que forman los trayectos (primario y de resguardo) y (ii) la recolección de los resultados de pruebas de OAM y su presentación al operador mediante la GUI. Es aún el operador humano quien determina cuáles pruebas deben ser llevadas a cabo tras la recepción de una alarma. Además, el procedimiento descrito en el documento EP1 176759 no incluye características de prevención para la degradación de la QoS.

Las soluciones previamente presentadas del estado de la técnica representan distintos enfoques para llevar a cabo la monitorización y la medición de las prestaciones en redes reales. No obstante, funcionando como características aisladas, ni están adaptadas ni resuelven todos los problemas presentados, especialmente en términos de consumo de ancho de banda y de funcionamiento automatizado en redes de MPLS de E2E. Algunas deficiencias de las soluciones existentes se describen a continuación:

Limitaciones de la monitorización actual de OAM

Dado que los mecanismos de detección de OAM están basados en monitorizar paquetes inyectados en banda, entre pares de nodos en la red, la velocidad a la que se detectan los fallos (y, por tanto, la cantidad de tráfico de clientes que se pierde antes de que se restaure el fallo) depende del intervalo temporal entre mensajes de monitorización: si este intervalo es corto, los fallos son detectados muy rápidamente, y se pierden pocos paquetes de clientes. Sin embargo, el ancho de banda consumido por estos mensajes es mayor, impidiendo a los operadores usar este ancho de banda para el tráfico de clientes. Con las actuales arquitecturas de redes, donde los dominios Central y Regional de MPLS están aislados, el número de Trayectos Conmutados de Etiquetas (LSP) que necesitan monitorización es del orden de los miles. De tal modo, el consumo de ancho de banda por la monitorización de paquetes está limitado, y la velocidad de detección puede ser rápida. Sin embargo, en la evolución hacia la MPLS de E2E, con cientos de miles (o incluso millones) de LSP, en potencia, recorriendo todos los dominios de red hasta el acceso, este consumo aumenta mucho, presentando problemas de escalabilidad si se desea la detección rápida. Ha de observarse que los mensajes de monitorización se envían en banda, es decir, por los mismos enlaces físicos según los paquetes de clientes viajan por la red. El problema del consumo del ancho de banda podría ser resuelto por medio de la monitorización fuera de banda, usando distintos enlaces físicos, pero con este enfoque solamente podrían detectarse fallos de nodo (no fallos de enlace en los enlaces de tráfico). Además del problema de consumo de ancho de banda implícito para la detección rápida de fallos, la monitorización de redes de MPLS de E2E requiere actualmente intervenciones manuales, ya que los procedimientos de ubicación pueden ser muy complejos. Las soluciones de MPLS de E2E se basan en un concepto llamado jerarquía de MPLS, lo que significa que los Trayectos Conmutados de Etiquetas (LSP) pueden ser establecidos en distintos niveles. El resultado es que los encaminadores pueden actuar al mismo tiempo como nodos 'fronterizos' o 'intermedios', según el LSP considerado, y que la información referida a algunas de estas capas puede ser ocultada a los mismos. De tal modo, cuando se genera una alarma en el sistema de monitorización, puede no ser trivial localizar en qué nodo intermedio específico ha ocurrido el fallo físico. Actualmente, este proceso es ejecutado por un operador que activa la inyección de paquetes de monitorización por sondas activas distribuidas (o nodos que presten soporte a OAM) en los distintos niveles de MPLS, hasta que se halle el fallo, proceso que consume mucho tiempo. La conclusión, entonces, es que la monitorización de OAM de las redes de MPLS de E2E no está adaptada tampoco en términos de funcionamiento automatizado. Finalmente, la detección de situaciones de congestión de red, usando herramientas de OAM de monitorización de prestaciones, no sería muy efectiva en términos de carga de red, ya que tales herramientas inyectan grandes cantidades de paquetes en la red.

Limitaciones de los protocolos de monitorización pasiva Las sondas pasivas no son usadas normalmente para la monitorización de redes, debido al alto número de puntos críticos existentes, lo que demandaría un alto número de dispositivos externos desplegados por la red. El rastreo de tráfico, o la

DPI, también son raramente usados con este fin, ya que existen alternativas (como los mismos protocolos de monitorización) que son específicos para estas características; en cambio, son usados más frecuentemente para reunir información referida a clientes en la capa de servicios. Los protocolos de monitorización pasiva, por otra parte, también presentan otras limitaciones.

La mayoría de las estimaciones de QoS de los protocolos de monitorización pasiva son afectadas no solamente por la ocupación de colas, sino también por los criterios de tráfico, definidos para los distintos tipos de tráfico (multimedios, http, etc.), en los nodos que recorre el tráfico. Así, pueden aparecer situaciones en las cuales la estimación de QoS podría estar distorsionada, debido a una muestra averiada, cuyo origen no reside en la ocupación de colas, sino en aquellos criterios de los cuales no está al tanto la herramienta de monitorización. Normalmente, los tiempos de detección son muy bajos, por dos motivos: (i) la complejidad de los algoritmos y la fase de pos-procesamiento, y (ii) el proceso de sondeo requerido para recolectar los datos y las trampas y alarmas generadas. Según el tipo de fallo y las capas que estén siendo monitorizadas, el tiempo de ubicación también podría ser alto. Si se hace la monitorización en la capa de la MPLS, y los fallos ocurren en nodos intermedios, las herramientas pasivas no pueden localizar tales fallos por su cuenta, necesitando soporte de cualquiera de las herramientas activas que han sido descritas. Y, finalmente, no hay ninguna comunicación interna directa entre estos protocolos y la capa de la MPLS en los nodos de red, por lo que la activación de los mecanismos de restauración tendría que ser hecha por medio de sistemas externos (que requieren normalmente la intervención humana).

Limitaciones de las herramientas de monitorización activa Normalmente, las herramientas de monitorización activa se basan en mediciones de retardos para proporcionar sus estimaciones sobre la QoS de la red. El retardo de los paquetes depende de muchos factores, por ejemplo, el tamaño del paquete o la clase de tráfico. Por tanto, los patrones del tráfico inyectado necesitan ser tan similares como sea posible a los patrones reales del tráfico de clientes que recorre la red. En otro caso, la medición no sería fiable. Los patrones reales son muy complejos y muy variables hoy en día, por lo que es muy difícil obtener modelos realistas. Para la monitorización en la capa de aplicación de los servicios críticos, los sistemas de monitorización solamente son conscientes de los fallos de red una vez que la capa de aplicación ha notificado que el usuario está experimentando degradaciones de QoS. Este comportamiento reactivo puede no coincidir con las expectativas de monitorización, ya que no es posible localizar el fallo de la red con mediciones en la capa de aplicación, lo que deriva en una restauración muy lenta del servicio. La monitorización activa comporta la inyección de paquetes de sondeo en la red. De tal modo, valen las mismas limitaciones que para la monitorización de OAM: el problema del consumo del ancho de banda y la falta de soluciones automatizadas para la detección de fallos. Y, finalmente, como con las herramientas pasivas, no hay ninguna comunicación interna directa entre estos sondeos y la capa de la MPLS en los nodos de red, por lo que la activación de los mecanismos de restauración debería ser hecha por medio de sistemas externos (que requieren normalmente la intervención humana). Al presentar también las mismas limitaciones que OAM, y requerir normalmente que se desplieguen sondeos externos sobre la red, las herramientas de monitorización activa no serán consideradas en esta invención, excepto las de la capa de aplicación.

Limitaciones de la monitorización de la capa física

Una es la limitación más importante para las herramientas de monitorización de la capa física: no son capaces de detectar averías que no sean las de la capa 1 . Para la Pérdida de Conectividad, por ejemplo, estas herramientas son muy adecuadas: al ser internas a los nodos de red, normalmente, los vendedores de equipos implementan la interfaz entre ellas y la capa de MPLS, por lo que las alarmas en la capa 1 pueden activar directamente los procesos de restauración basados en la

MPLS. Sin embargo, no hay ningún proceso capaz de detectar congestión de red con herramientas de la capa 1 , por ejemplo.

Limitaciones de los mecanismos de restauración

Finalmente, merece la pena mencionar una limitación para los mecanismos de restauración de la MPLS, referida a los fallos en nodos intermedios. Cuando ocurren fallos en estos nodos, en muchas ocasiones la recuperación rápida es posible mediante mecanismos locales como el FRR. Sin embargo, a veces no lo es (p. ej., cuando no hay un enlace de resguardo). En tales ocasiones, pueden usarse nuevos mecanismos, según lo definido en el marco de MPLS-TP, para informar al nodo de ingreso del LSP, el cual ejecuta a su vez el mecanismo de recuperación de extremo-a-extremo (p. ej., primario / de resguardo) con el cual puede haber sido configurado. Sin embargo, en redes basadas en la jerarquía de MPLS, como las de la MPLS de E2E, tal enfoque deriva en un proceso de restauración común para todos los LSP de servicio, que siguen el trayecto de resguardo del LSP de transporte. No hay ninguna manera, hasta donde sabemos, para que los puntos extremos de servicio sepan de tal fallo, aparte de la gestión externa, por el sencillo motivo de que los nodos de transporte no son conscientes de los LSP de servicio. Por tanto, no es posible implementar la restauración rápida y particularizada de extremo a extremo en la capa de servicio.

Para resumir, no hay ninguna herramienta única que permita la restauración rápida escalable (y, por tanto, bajas pérdidas de tráfico y, por tanto, alta disponibilidad de servicios) para todo tipo de degradación de la Calidad del Servicio (QoS) que pueda ocurrir en grandes redes de Conmutación de Etiquetas MultiProtocolo (MPLS). Además, la automatización no existe para los sistemas de monitorización a la fecha, que necesitan intervención humana para detectar, correlacionar y localizar degradaciones de QoS, lo que nuevamente aumenta el tiempo total requerido para la restauración. Las soluciones automatizadas existentes presentan o bien altos tiempos de localización de fallos, o bien una alta carga de monitorización, lo que significa que el ancho de banda consumido y asociado es muy alto, impidiendo a los operadores usar este ancho de banda para ofrecer servicios adicionales de conectividad. Por lo tanto, existe la necesidad en el estado de la técnica de un sistema para impedir, detectar y restaurar degradaciones de QoS, en base a sistemas de monitorización que hagan un uso coordinado de varias de tales herramientas existentes, sin intervención humana y con rápido tiempo de respuesta.

Resumen de la invención

La presente invención resuelve los problemas precitados y supera las limitaciones del estado de la técnica anteriormente explicadas, revelando un procedimiento y sistema que hacen uso de los mecanismos de monitorización actualmente disponibles para la detección de la degradación de la QoS, de una manera coordinada y automatizada, de modo que pueda reducirse la carga de monitorización. Esto se hace llevando a cabo una coordinación centralizada de los mecanismos de monitorización, lo que permite detectar situaciones potencialmente críticas por medio de herramientas ligeras (es decir, consumidoras de un bajo ancho de banda), y confirmando o invalidando luego la degradación, llevando a cabo mediciones más intensas solamente en aquellos segmentos donde se necesita hacerlas. Por lo tanto, la presente invención proporciona un procedimiento y un sistema para la prevención, detección y restauración automática de las degradaciones de la QoS, minimizando a la vez el ancho de banda de monitorización consumido con este fin: la invención hace uso primero de herramientas de bajo consumo de ancho de banda, y confirma que las degradaciones tienen lugar usando herramientas más potentes centradas en segmentos específicos , donde un incremento del ancho de banda no afecta el comportamiento total de la red. La determinación de segmentos críticos también permite una restauración más rápida, lo que afecta positivamente la disponibilidad de los servicios.

Dado que en el estado de la técnica anterior no hay una única herramienta de monitorización que sea adecuada para superar toda clase de degradaciones que puedan ocurrir en la redes actuales, la presente invención hace uso de los más potentes sistemas de monitorización disponibles en el mercado, coordinándolos para aumentar la velocidad a la cual son recuperados los servicios después de los fallos, y para reducir el número de paquetes de monitorización inyectados en la red. Además, los procedimientos definidos para la invención están automatizados, lo que una vez más aumenta la disponibilidad de los servicios, ya que se evita la intervención humana.

Según un primer aspecto de la presente invención, se describe un procedimiento para restaurar degradaciones de QoS en redes de MPLS, y comprende las siguientes etapas: recibir una o más alarmas desde la Capa de Aplicación, o desde un nodo de la red de MPLS,

localizar un segmento con fallos de la red de MPLS asociado a la(s) alarma(s) recibida(s);

correlacionar todas las alarmas asociadas al segmento con fallos en la misma ubicación;

determinar los servicios afectados por las alarmas correlacionadas, para cada servicio afectado, obtener de una base de datos unos trayectos de restauración a partir

restaurar todos los servicios afectados, usando los trayectos de restauración,

(com)probar/testear los servicios restaurados. Un segundo aspecto de la presente invención se refiere a un sistema para determinar degradaciones de QoS en redes de MPLS, que comprende: módulos de comunicación de la capa de servicios y de la capa de red, para recibir alarmas, respectivamente, desde la Capa de Aplicación y desde un nodo de red de MPLS,

un módulo de gestión y correlación de alarmas, para correlacionar todas las alarmas que le envían los módulos de comunicación de la capa de servicios y de la capa de red, y que están asociadas a un segmento con fallos en una misma ubicación,

uno o más módulos de cálculo para determinar los servicios afectados por las alarmas correlacionadas, recibidas desde el módulo de gestión y correlación de alarmas, con información sobre la ubicación del segmento con fallos, obtenida a partir de medios de localización de segmentos en la red de MPLS, y con acceso a una base de datos del sistema, desde la cual se obtienen los trayectos de restauración para todos los servicios afectados,

un planificador de señalización conectado con la señalización de la MPLS, para habilitar la restauración de los servicios afectados, usando los trayectos de restauración obtenidos cuando es activado por cualquiera de los módulos de cálculo,

un activador de monitorización activa que es solicitado por cualquiera de los módulos de cálculo, para obtener pruebas sobre los servicios restaurados, desde la capa de servicios hasta el módulo de comunicación de la capa de servicios, y desde la capa de red hasta el módulo de comunicación de la capa de red.

El módulo activador de monitorización activa no solamente activa pruebas de servicios restaurados, sino que también, en una realización preferida de la invención, activa las pruebas más intensas (pruebas activas) que confirman las degradaciones. De tal modo, el activador de monitorización activa puede ser solicitado por cualquiera de los módulos de cálculo para obtener pruebas activamente, con fines de confirmación de degradación, o sobre los servicios restaurados. Los medios de localización de los segmentos con fallos están un nodo de red de la red de MPLS, desde el cual un módulo de cálculo del sistema definido anteriormente recibe una alarma, y por tanto solicita la ubicación de este segmento de red. En el caso de las alarmas recibidas desde la Capa de Aplicación, los medios de localización son proporcionados por la base de datos del sistema, externa o interna al sistema, desde la cual la ubicación del segmento de red usado por la Capa de Aplicación es solicitada por un módulo de cálculo del sistema descrito anteriormente.

En un aspecto final de la presente invención, se revela un programa de ordenador, que comprende medios de código de programa de ordenador adaptados para realizar las etapas del procedimiento descrito cuando dicho programa es ejecutado en un ordenador, un procesador de señales digitales, una formación de compuertas programables en el terreno, un circuito integrado específico para la aplicación, un micro-procesador, un micro-controlador, o cualquier combinación de los precitados y / u otra forma de hardware programable.

El procedimiento y sistema de acuerdo a los aspectos descritos anteriormente de la invención tienen un buen número de ventajas con respecto al estado de la técnica anterior, centradas y orientadas para aumentar las prestaciones de las redes de MPLS de E2E, proporcionando a la vez servicios sobre los Trayectos Conmutados de Etiquetas (LSP). Estas ventajas de la invención pueden ser resumidas de la siguiente manera:

- La presente invención proporciona un Administrador de Monitorización de QoS, con automatización de la detección, ubicación y prevención o restauración de la QoS en redes de MPLS de E2E. Una entidad inteligente, que coordine distintas herramientas de monitorización a fin de preservar proactivamente la QoS en redes de MPLS de E2E, de manera automatizada y escalable, no existe a la fecha en el estado de la técnica. La inteligencia del sistema Administrador de Monitorización de QoS propuesto aquí es capaz de rastrear la red de MPLS y evaluar automáticamente cuándo, dónde y por medio de cuál técnica de monitorización debería ser monitorizada la QoS de un cierto servicio / trayecto. De tal modo, no hay ninguna necesidad de intervención humana en el proceso de monitorización.

- La escalabilidad del sistema propuesto de Administrador de Monitorización de QoS, que se centra en acciones de monitorización activa en aquellos segmentos específicos de red en los cuales la QoS es susceptible de degradación, constituye una de las características más importantes con valor añadido, dado que el tamaño de las redes de MPLS de E2E hace imposible ajusfar a escala con procesos de monitorización sobrecargados o innecesarios. - Al centrarse en la ubicación de red donde ocurren las degradaciones de QoS, la presente invención es capaz de reducir el número de paquetes totales de monitorización para confirmar estas degradaciones de QoS, realzando la escalabilidad del sistema Administrador de Monitorización de QoS (QMM). Así, puede aumentar el número de servicios simultáneamente provistos, usando el ancho de banda no usado. Además, la capacidad del sistema QMM para localizar segmentos específicos de la red de MPLS, que sean críticos para la QoS, constituye un valor añadido, no solamente en términos de recursos de monitorización, sino también en términos del tiempo requerido para la restauración y, por tanto, en términos de disponibilidad del servicio.

- Por medio de mecanismos preventivos de restauración, que son capaces de detectar e impedir automáticamente degradaciones de QoS en la red, la presente invención permite la maximización de la Calidad de Servicio (QoS) del usuario final en redes de MPLS de E2E- .

- Con respecto al documento EP1 176759, las principales diferencias ventajosas de la invención son los precitados mecanismos de restauración preventiva y la automatización de estos mecanismos, así como los mecanismos automatizados de detección y restauración de la degradación de la QoS.

Estas y otras ventajas serán evidentes a la luz de la descripción detallada de la invención.

Descripción de los dibujos Con el fin de ayudar en la comprensión de las características de la invención, según una realización práctica preferida de la misma, y a fin de complementar esta descripción, se adjuntan las siguientes figuras como una parte integral de la misma, con carácter ilustrativo y no limitador:

La Figura 1 muestra un sistema para determinar degradaciones de QoS y sus relaciones con otras entidades de red existentes en un escenario de red MPLS, según una realización preferida de la invención.

La Figura 2 muestra un diagrama de flujo de mensajes en el sistema de la Figura 1 , para determinar degradaciones de QoS, de acuerdo a una posible realización de la invención.

La Figura 3 muestra un diagrama de flujo de mensajes en el sistema de la Figura 1 , para determinar degradaciones de QoS informadas por alarmas provenientes de la Capa de Aplicación, de acuerdo a un posible caso de aplicación de uso de la invención.

La Figura 4 muestra un diagrama de flujo de mensajes en el sistema de la Figura 1 , para determinar degradaciones de QoS informadas por alarmas provenientes de la Capa Física o de un Analizador de Tráfico Pasivo, de acuerdo a otro posible caso de aplicación de uso de la invención.

La Figura 5 muestra un diagrama de flujo de mensajes en el sistema de la Figura 1 , para determinar degradaciones de QoS informadas por alarmas provenientes de herramientas de OAM de la MPLS, de acuerdo a un posible caso adicional de aplicación de uso de la invención.

La Figura 6 muestra un diagrama de flujo de mensajes en el sistema de la Figura 1 , en una modalidad de funcionamiento proactivo, para determinar degradaciones de QoS, de acuerdo a otra posible realización de la invención.

La Figura 7 muestra un diagrama de bloques de la arquitectura del sistema, para determinar degradaciones de QoS en una red de MPLS, según una realización preferida de la invención.

Realización preferida de la invención Las cuestiones definidas en esta descripción detallada se proporcionan para ayudar en una comprensión exhaustiva de la invención. En consecuencia, los medianamente expertos en la técnica reconocerán que pueden hacerse variaciones, cambios y modificaciones de las realizaciones descritas en la presente memoria sin apartarse del ámbito y el espíritu de la invención. Además, se omite la descripción de funciones y elementos bien conocidos, para mayor claridad y concisión.

Por supuesto, las realizaciones de la invención pueden ser implementadas en una gran variedad de plataformas arquitectónicas, sistemas operativos y servidores, dispositivos, sistemas o aplicaciones. Cualquier diseño arquitectónico específico o implementación presentada en la presente memoria se proporciona solamente con fines de ilustración y comprensión, y no está concebido para limitar aspectos de la invención. Es dentro de este contexto que se presentan ahora diversas realizaciones de la invención, con referencia a las FIGs. 1 a 7.

La Figura 1 presenta un Administrador de Monitorización de QoS (QMM) como un sistema (10) para determinar degradaciones de QoS en una red de MPLS (30), y también muestra las relaciones e interfaces específicas entre el sistema (10) y los módulos existentes, que son los siguientes:

• Capa de Aplicación (20): En el modelo de Internet, es la capa donde residen los servicios (aplicaciones), creando e intercambiando datos de usuario entre distintos anfitriones, por una red de ordenadores.

• Sistema de Soporte de Servicios (21 ): es el módulo encargado de recolectar los datos de monitorización de la capa de aplicación (20), obtenidos por medio de mediciones activas, y de enviarlos al sistema (10). Comparte la misma visión de la calidad experimentada con los clientes finales, y por lo tanto es capaz de detectar degradación o violaciones de los SLA suscritos por ellos.

• Analizador de Tráfico Pasivo (32): este módulo o entidad funcional incluye las mediciones pasivas que los protocolos de monitorización pueden realizar en las redes (30) de MPLS de los operadores. Por tanto, están situados en los nodos (31 ) de red, aunque también se admiten mediciones equivalentes llevadas a cabo por sondas externas. Se consideran dos posibles modalidades de funcionamiento (que pueden coexistir simultáneamente): modalidad de funcionamiento bajo demanda, en la cual el sistema (10) consulta al Analizador de Tráfico Pasivo (32) para (realizar, si es necesario, e) informar acerca de un proceso de monitorización pasiva sobre un nodo (31 ) de red específico; y modalidad de funcionamiento proactivo, en la cual el Analizador de Tráfico Pasivo (32) informa automáticamente al sistema (10) acerca de mediciones pasivas periódicas sobre ciertos nodos (31 ) de red.

• Monitorización de Capa Física (33): un módulo que consiste en el conjunto de alarmas que los nodos (31 ) de red pueden anunciar, referidas a averías físicas, como pérdida de conectividad o mala calidad de transmisión. Estas alarmas son anunciadas al sistema (10).

• Herramientas OAM (34) de MPLS: un módulo que consiste en el conjunto de capacidades que permiten a los operadores resolver problemas de las redes (30) de MPLS. Dado que la red (30) de MPLS de destino puede estar basada en la MPLS de E2E, estas herramientas son las más adecuadas para la monitorización global. Las herramientas ligeras pueden ser usadas proactivamente para detectar situaciones de congestión potencial sobre ciertas áreas de red, mientras que otras, ejecutadas bajo demanda desde el sistema (10), pueden ser válidas para confirmar o rechazar la presencia de tales averías de red, o con fines de detección cuando ocurren fallos de nodo / enlace (en caso de que no estuviera disponible ninguna herramienta más veloz). • Señalización (35) de MPLS: este módulo permite al sistema (10) iniciar procesos de restauración basados en MPLS en la red (30), en caso de que ciertos segmentos de red experimenten una falta de QoS.

• Base de Datos (36) del Sistema: este módulo almacena la información requerida, tanto de la red (30) del operador, por ejemplo, su estado, los trayectos configurados, etc., como de la capa de aplicación (20), por ejemplo, los servicios activos.

La Figura 2 muestra un diagrama de flujo de los mensajes de comunicación intercambiados en el escenario de red ilustrado anteriormente en la Figura 1 , que implica al sistema (10) QMM que hace uso de procedimientos de prevención, detección y restauración de la degradación de QoS, según se describe más adelante. Las líneas continuas en la Figura 2 se refieren a procedimientos obligatorios, mientras que las líneas discontinuas se usan para aquellos procedimientos que son optativos en el sistema (10). Este sistema (10) implementa un procedimiento para determinar degradaciones de QoS, que comprende las siguientes etapas principales:

Recibir alarmas (a) desde la capa de aplicación (20) y / o desde cualquiera de, o todos, los nodos (31 ) de red, incluyendo a los nodos del Analizador de Tráfico Pasivo (32), los nodos de Monitorización de Capa Física (33) y los nodos de OAM (34) de MPLS.

- Según la alarma específica, el sistema (10) puede solicitar (d), normalmente desde los nodos (31 ) de red, pruebas adicionales con fines de ubicación, por lo que los nodos (31 ) de red contestan con respuestas (e) de ubicación.

Una vez que está localizado el fallo, el sistema (10) inicia directamente los procedimientos (h) de restauración de tráfico, mediante la interacción con el módulo de Señalización (35) de MPLS, y recibe el resultado (i).

En cualquier etapa, el sistema (10) puede necesitar consultar la Base de Datos (36) del Sistema antes de tomar cualquier decisión adicional; esta etapa de consultar la Base de Datos (36) es optativa, antes de solicitar pruebas de localización, la etapa (b) de consulta y la correspondiente respuesta (c), mientras que la etapa (f) de consulta, con su correspondiente respuesta (g), antes de iniciar los procedimientos (h) de restauración, es obligatoria.

- Una vez que el tráfico ha sido restaurado, procedimientos adicionales de prueba son activados (j) por el sistema (10) para garantizar la QoS global correcta dentro de la nueva situación de red.

Estos procedimientos de prueba pueden ser llevados a cabo (k) por los nodos (31 ) de red y / o la capa de aplicación (20).

- Mientras el sistema (10) está aún detectando la degradación de QoS, mecanismos adicionales de restauración podrían ser activados por el sistema (10), mediante un bucle (i), hasta que el sistema (10) pueda declarar un comportamiento global estable no degradado.

Los mecanismos para recuperar la situación original del tráfico una vez que el fallo está reparado, que están fuera del ámbito de la invención, pueden ser gobernados por los mecanismos bien conocidos de "hacer antes de romper", disponibles para las redes de MPLS, y serían activados por el operador en cualquier momento conveniente para el mismo.

- Dado que distintas alarmas, desde distintos módulos, podrían llegar al sistema (10), el procedimiento incorpora la posibilidad optativa de seleccionar el criterio de correlación de alarmas, de modo que, cuando varias sean recibidas, posiblemente referidas a la misma avería de QoS, el sistema (10) sea capaz de compilar y gestionar todas ellas, correlacionarlas y ejecutar las adecuadas acciones correctivas.

En una posible realización, los criterios para la gestión de alarmas (otros son posibles) son los siguientes: - en el caso en que varias alarmas llegan al sistema (10) QMM en un breve periodo (configurable) de tiempo, el sistema (10) confiere un mayor grado de prioridad a las alarmas que presentan (en general) mecanismos más veloces de localización de errores. Cada uno de los procedimientos de monitorización, por lo tanto, ha sido etiquetado con una ponderación de prioridad.

La única excepción a la regla mencionada anteriormente es para la monitorización de la capa de aplicación (20): como esta capa comparte la experiencia con los clientes del servicio, las alarmas recibidas desde ella tendrán la más alta prioridad.

La capa física (33) y los protocolos (32) de monitorización pasiva pueden localizar rápidamente el problema experimentado en la red, ya que ambos generan alarmas en el punto exacto donde ocurre la avería. Las alarmas de la capa física (33) tendrán un mayor grado de prioridad (el segundo globalmente), sin embargo, debido a su tiempo de detección, el más veloz, y debido a la muy común necesidad operativa de superar rápidamente cualquier degradación de la capa física que pudiera ocurrir. Por lo tanto, las alarmas de monitorización del analizador de tráfico pasivo (32) serán gestionadas con el tercer nivel de prioridad cuando lleguen al sistema (10) QMM.

Finalmente, los mecanismos de monitorización de OAM (34) de MPLS comportan normalmente la rápida detección de anomalías, pero al coste del ancho de banda, según lo expresado anteriormente. Además, el tiempo para localizar el segmento afectado depende de muchas variables, por lo que a estas alarmas se dará el nivel mínimo de prioridad (cuarto globalmente).

Con este enfoque, en el caso en que lleguen varias alarmas de distintos tipos al sistema (10) QMM, este sistema (10) es capaz de gestionarlas: atendiendo primero a aquellas que localicen las averías más rápidamente, el sistema (10) es capaz luego de determinar cuáles nodos / enlaces y LSP / servicios están afectados, y es capaz de correlacionar el resto de las alarmas, de modo que no necesiten ser consideradas. Es importante mencionar que el tener un tiempo mayor de detección o localización no impide que aparezcan las alarmas de los módulos más lentos en el escenario total de red, dado que cada herramienta puede monitorizar distintos parámetros y es más adecuada para distintos fines.

Para los escenarios ejemplares de red y casos de uso descritos más adelante, y mostrados en las Figuras 3 a 6, el criterio para la gestión de alarmas a considerar es el descrito en detalle anteriormente.

Las Figuras 3 a 6 extienden el flujo básico de trabajo anteriormente descrito en la Figura 2, e incluyen las interacciones que tienen lugar entre el sistema (10) QMM y los módulos existentes en varios casos de uso. Pueden definirse dos categorías principales de casos de uso: aquellos casos, mostrados en las FIGs. 3 a 5, en los cuales el funcionamiento del sistema (10) QMM es reactivo, es decir, reacciona después de que ha ocurrido la degradación de QoS; y aquellos tales como el mostrado en la Figura 6, en los cuales el sistema (10) QMM es proactivo, es decir, reacciona intentando evitar la degradación de QoS antes de que ocurra.

La Figura 3 muestra el flujo de trabajo específico para un caso de uso en el cual la alarma es recibida desde la capa de aplicación (20), lo que significa que el cliente está al tanto de la degradación de QoS, por lo que el funcionamiento del sistema (10) QMM debe ser reactivo, para resolver rápidamente la situación de alarma. El sistema (10) recibe una alarma (a1 ) desde la capa de aplicación (20), y consulta (b1 ) la Base de Datos (36) para obtener (c1 ) el trayecto de red que está siendo usado por la capa de aplicación (20) para el servicio dado, al cual se refiere la alarma. Luego, el sistema (10) comprueba internamente otras alarmas potenciales que puedan haber sido recibidas desde nodos (31 ) de red por el sistema (10) QMM a lo largo de ese trayecto específico.

Si el sistema (10) halla alguna (lo que normalmente debería ser el caso), las agrupa según el segmento o nodo específico de red que esté afectado (si ya está identificado por las otras alarmas) y salta a una etapa (f1 ) de consultar nuevamente la Base de Datos (36), en busca de información sobre todos los servicios que podrían ser potencialmente afectados por tales sucesos. La etapa (g1 ) subsiguiente es la Respuesta dada por la Base de Datos (36). Por el contrario, si no está presente ninguna otra alarma, o las presentes no han localizado aún el segmento, o los segmentos, afectado(s), entonces el sistema (10) QMM solicita (d1 ) a los mecanismos de OAM (34) de MPLS en los nodos (31 ) de red que lleven a cabo operaciones específicas bajo demanda para localizar el fallo, según el tipo de alarma recibida desde la capa de aplicación (20). La definición completa de cuáles operaciones están asociadas a cuáles alarmas está fuera del ámbito de la invención. Para proporcionar solamente un ejemplo, si la alarma se refería a un retardo largo en un servicio de audio-conferencia, entonces las herramientas de OAM (34) de MPLS podrían ser las que midan el retardo de paquetes a lo largo del trayecto. Las pruebas llevadas a cabo por las herramientas de OAM (34) de MPLS deberían remitirse primero al trayecto de extremo a extremo. En el caso en que el resultado (e1 ) de las operaciones de los mecanismos de OAM (34) de MPLS para localizar el fallo sea el adecuado, entonces el sistema (10) declara que pueden localizarse problemas potenciales dentro de las instalaciones del cliente. La resolución de tales problemas también está fuera del ámbito de la invención. Por otra parte, si el resultado de la localización de fallos por parte de OAM (34) de MPLS es insatisfactorio, entonces se hacen pruebas segmento por segmento, para localizar el segmento o nodo específico afectado por la degradación. Las pruebas realizadas por OAM (34) de MPLS son activadas y controladas por el sistema (10) QMM, que es el que tiene la información de los segmentos.

Una vez que el fallo está localizado por OAM (34) de MPLS, y este resultado (e1 ) de localización es recibido por el sistema (10) QMM, entonces el sistema (10) continúa con las etapas (f1 ) y (g1 ) de consulta y respuesta, respectivamente, a / desde la Base de Datos (36), equivalentes a las descritas anteriormente. En esta etapa, el sistema (10) tiene una visión clara de cuáles servicios pueden ser afectados por las distintas degradaciones, por lo que activa (h1 ) la señalización (35) de MPLS para iniciar los mecanismos de protección / restauración para cada uno de los servicios afectados por la alarma. Los resultados de los procedimientos de restauración se proporcionan en la etapa (¡1 ).

El sistema (10) QMM necesita comprobar el funcionamiento correcto de todos los servicios restaurados, por lo que activa (j1 ) mecanismos de monitorización bajo demanda, ya sea en la capade aplicación (20), en lo posible, según la disponibilidad de tales herramientas en las distintas instalaciones de los clientes, o bien mediante OAM (31 ) de MPLS, que siempre está disponible. Los resultados de las pruebas se proporcionan en la etapa (k1 ). En el caso en que algunos de los resultados de las pruebas sean insatisfactorios, el sistema (10) consulta nuevamente (11 ) la Base de Datos (36) en busca de trayectos alternativos para esos servicios, y repite (en un bucle) la ejecución de etapas desde ( ) a (k1 ) para esos trayectos alternativos.

Ha de observarse que muchas redes tienen sus propios procedimientos de restauración automática, por ejemplo, cuando los enlaces están cortados. En esos casos, el sistema (10) es consciente de tal situación en las etapas (c1 ) o (g1 ), dado que la Base de Datos (36) ya proporciona la información en cuanto a que uno o varios servicios específicos han sido automáticamente restaurados a un trayecto de resguardo. Los cometidos del sistema (10) QMM ante tal suceso garantizan que otros servicios, posiblemente no capaces de ser recuperados automáticamente, tampoco sean afectados. El funcionamiento para ellos es equivalente a lo que ya se ha descrito en el caso de uso de la Figura 3.

La Figura 4 muestra el flujo de trabajo específico de otro caso de uso en el cual el funcionamiento del sistema (10) QMM es reactivo para una alarma recibida desde las herramientas de monitorización de la capa física (33). El sistema (10) QMM recibe una alarma (a2) desde las herramientas de monitorización de la capa física (33), y no necesita ejecutar las operaciones de localización, es decir, evitando las etapas desde (b) a (e) en el flujo básico de la Figura 2, dado que estas herramientas ya proporcionan tal información. Por lo tanto, el sistema (10) va directamente a la recolección de otras alarmas potenciales referidas al mismo segmento (provenientes de los nodos (31 ) de red con prioridad inferior de alarma), y salta a la etapa (f2) para consultar la Base de Datos (36) en busca de información sobre todos los servicios que podrían ser potencialmente afectados por este suceso específico. La respuesta de la Base de Datos (36) se da en la etapa (g2).

En esta etapa, el sistema (10) QMM tiene una visión clara de cuáles servicios pueden ser afectados por la degradación, por lo que activa (h2) los mecanismos de señalización (35) de MPLS para iniciar los mecanismos de protección para cada uno de esos servicios. Los resultados de los procedimientos de restauración se proporcionan en la etapa (¡2). Finalmente, el sistema (10) QMM necesita comprobar el funcionamiento correcto de todos los servicios restaurados, por lo que activa los mecanismos (j2) de monitorización bajo demanda, ya sea en la capa de aplicación (20), en lo posible, según la disponibilidad de tales herramientas en las distintas instalaciones de clientes, o bien mediante OAM (31 ) de MPLS, que siempre está disponible. Los resultados de las pruebas se proporcionan en la etapa (k2). En el caso en que algunos de ellos sean insatisfactorios, el sistema (10) QMM consulta nuevamente (¡2) la Base de Datos (36) en busca de trayectos alternativos para esos servicios, y ejecuta en un bucle, si se requiere, las etapas desde (h2) a (k2) para esos trayectos alternativos. En redes con sus propios procedimientos de restauración automática, el sistema (10) QMM solamente puede ser consciente de tal situación en la etapa (g2); para esos casos, los cometidos del sistema (10) están restringidos a aquellos servicios que no puedan ser automáticamente recuperados. La operación para ellos es equivalente a lo que ya ha sido descrito en el caso de uso de la Figura 4.

Hay otro posible caso de uso en el cual una alarma llega al sistema (10) QMM desde el analizador de tráfico pasivo (32). Entonces, el flujo de trabajo específico es equivalente al del caso anterior, ilustrado en la Figura 4. Las únicas diferencias son:

En la etapa (a2), el sistema (10) recibe la alarma desde el analizador de tráfico pasivo (32), en lugar de las herramientas de monitorización de capa física (33).

Los tipos de alarma que el sistema (10) necesita buscar en correspondencia con el segmento son los que llegan solamente desde las herramientas de OAM (34) de MPLS, dado que son las que tienen la prioridad mínima.

La Figura 5 muestra un flujo de trabajo específico de otro caso de uso, en el cual el funcionamiento del sistema (10) QMM es reactivo para una alarma recibida desde las herramientas de OAM (34) de MPLS. En las redes (30) de MPLS, la monitorización puede ser hecha en distintos niveles de MPLS, y entre distintos pares de nodos (31 ) de red de MPLS, incluso si no están directamente conectados. Por lo tanto, el funcionamiento del sistema (10) depende de cómo se hace esta monitorización.

Para las alarmas que llegan desde herramientas ejecutadas entre nodos (31 ) de red, que están directamente conectados, el funcionamiento es similar a los casos de uso mostrados en la Figura 4, donde una alarma es recibida desde la monitorización de la capa física (33), o desde el analizador de tráfico pasivo (32), dado que no se necesita ejecutar ningún procedimiento de localización, pero con las siguientes diferencias: - el sistema (10) recibe la alarma (a3) desde las herramientas de OAM (34) de

MPLS, en lugar de las herramientas de monitorización de capa física (33), o del analizador de tráfico pasivo (32),

- No hay ninguna necesidad de correlacionar otras alarmas, dado que estas son las de menor prioridad.

Para las alarmas que llegan desde herramientas ejecutadas entre nodos (31 ) de red que no están directamente conectados, el funcionamiento es muy similar al caso de uso mostrado en la Figura 3, donde una alarma es recibida desde la capade aplicación (20), dado que se requiere un procedimiento de localización entre los distintos enlaces que ha recorrido la prueba activa. El procedimiento es entonces el mostrado en la Figura 5, y según lo siguiente:

El sistema (10) QMM recibe una alarma (a3) desde las herramientas de OAM (34) de MPLS. No hay ninguna necesidad de consultar el trayecto de red en este caso, es decir, evitando etapas desde (b) a (c) en el flujo básico de la Figura 2, dado que ha sido explícitamente definido en la herramienta de monitorización y es bien conocido. Además, dado que no hay ninguna alarma adicional para correlacionar, el procedimiento de localización es obligatorio: el sistema (10) QMM solicita (d3) los mecanismos de OAM (34) de MPLS en los nodos (31 ) de red para llevar a cabo operaciones específicas bajo demanda, segmento a segmento, para localizar el fallo, y sus Respuestas son enviadas de vuelta en la etapa (e3). Después de la localización, el sistema (10) QMM avanza a la etapa (f3) para consultar la Base de Datos (36) en busca de información sobre todos los servicios que podrían ser potencialmente afectados por el suceso localizado. La respuesta de la Base de Datos (36) se da en la etapa (g3). En esta etapa, el sistema (10) QMM nuevamente tiene una visión clara de cuáles servicios pueden ser afectados por las distintas degradaciones, por lo que activa (h3) mecanismos (35) de señalización para iniciar los mecanismos de protección para cada uno de esos servicios. Los resultados de los procedimientos de restauración son proporcionados en (¡3). Finalmente, el sistema (10) QMM necesita comprobar el correcto funcionamiento de todos los servicios restaurados, por lo que activa los mecanismos (j3) de monitorización bajo demanda, ya sea en la capa de aplicación (20), en lo posible, según la disponibilidad de tales herramientas en las distintas instalaciones de clientes, o bien mediante OAM (31 ) de MPLS, que siempre está disponible. Los resultados de las pruebas son proporcionados en la etapa (k3). En el caso en que algunos de ellos sean insatisfactorios, el sistema (10) QMM consulta nuevamente (13) la Base de Datos (36) en busca de trayectos alternativos para esos servicios, y ejecuta, si se requiere, en un bucle, las etapas desde (h3) a (k3) para esos trayectos alternativos. En redes con sus propios procedimientos de restauración automática, el sistema

(10) QMM solamente puede ser consciente de tal situación en la etapa (g3). Para esos casos, los cometidos del sistema (10) QMM están restringidos a aquellos servicios que no puedan ser automáticamente recuperados. La operación para ellos es equivalente a lo que ya se ha descrito en este caso de uso de la Figura 5.

La Figura 6 muestra el sistema (10) QMM capaz de reaccionar ante degradaciones potenciales de manera proactiva, es decir, incluso antes de que ocurran. En particular, el principal suceso del cual puede proteger el sistema (10) QMM a la red (30) es la congestión de tráfico. Pueden distinguirse tres zonas de operación de la red

En una zona de "operación correcta" no hay ningún peligro de real de pérdida de paquetes debido al crecimiento repentino del tráfico. Por tanto, la monitorización del tráfico no necesita ser muy precisa o veloz. - En la zona "potencialmente conflictiva" aún no hay ningún peligro real de pérdida de paquetes, pero la monitorización del tráfico necesita ser muy precisa para evitar aumentar el tráfico e ingresar a la zona crítica.

En la zona "crítica", en caso de un repentino crecimiento del tráfico, podrían perderse paquetes, por lo que deben ejecutarse acciones para volver (al menos) a la zona "potencialmente conflictiva".

Debe observarse que el comportamiento deseado para los operadores es estar en la zona de "operación correcta", y que los crecimientos inesperados del tráfico solamente afectan a sus redes en el sentido de que ingresan temporalmente en la zona "potencialmente conflictiva". El crecimiento estable del tráfico debido, por ejemplo, a un incremento en el número de clientes o en el número de servicios ofrecidos, debería ser gestionado mediante otros procedimientos, como inversión en nuevos equipos o planificación revisada de la red. También debe observarse que la definición de los umbrales entre zonas depende del operador y está fuera del ámbito de esta invención.

Para evitar la congestión de red, el sistema (10) QMM usa inicialmente el analizador de tráfico pasivo (32) para la monitorización pasiva, sin consumir, por tanto, ancho de banda de red para detectar situaciones "potencialmente conflictivas". El protocolo SNMP, por ejemplo, puede monitorizar el ancho de banda de la red hasta que se sobrepase un cierto umbral. En ese momento, se necesita una monitorización más veloz y más precisa, y se proporciona mediante herramientas de OAM (34) de MPLS dentro del segmento de red que es "potencialmente conflictivo".

Este tipo de monitorización es para detectar y localizar situaciones "críticas" muy rápidamente: dado que el segmento de red a monitorizar ha sido muy reducido, el problema del consumo de ancho de banda está estrictamente controlado, y la cantidad de paquetes de monitorización que pueden ser inyectados puede ser lo bastante alta como para garantizar las prestaciones adecuadas.

Las herramientas de monitorización pasiva del analizador de tráfico pasivo (32) están midiendo continuamente el tráfico de red y, en el caso en que midan anchos de banda que sobrepasen el umbral especificado para situaciones "potencialmente conflictivas", generan una alarma (a4) para el sistema (10) QMM, según se muestra en el diagrama de flujo de la Figura 6. El segmento específico ya está localizado por la herramienta pasiva, por lo que el sistema (10) QMM es capaz de solicitar (d4) directamente a las herramientas de OAM (34) de MPLS que ejecuten pruebas continuas con alta demanda de ancho de banda sobre ese segmento.

Puede ocurrir que nunca se sobrepase el umbral hacia las situaciones "críticas". Entonces, eventualmente, el analizador de tráfico pasivo (32) que está ejecutándose aún puede detectar que el segmento de red ha vuelto a la zona de

"operación correcta", y lo anuncia al sistema (10) QMM, el cual, a su vez, detiene la monitorización activa de las herramientas de OAM (34) de MPLS.

En el caso en que se sobrepase el umbral hacia situaciones "críticas", las herramientas de OAM (34) de MPLS lo anuncian (e4) al sistema (10) QMM, el cual, a su vez, inicia un procedimiento similar, en las etapas entre (f4) y (14), al de otros casos de uso, por ejemplo, en el caso de uso de la recepción de alarmas desde OAM (34) de MPLS, mostrado en la Figura 5. Las únicas diferencias entre ellos son que: i) el sistema (10) QMM no necesita modificar el trayecto para todos los servicios que recorren el segmento "crítico", sino solamente para los suficientes entre ellos como para volver a la situación "potencialmente conflictiva" (eventualmente notificada mediante una nueva alarma proveniente de las herramientas de OAM (34) de MPLS) y ii) la modificación de trayectos debe ser hecha sin ninguna pérdida de tráfico. En otras palabras, el sistema (10) QMM modifica y verifica un trayecto de servicio a la vez, hasta que recibe una alarma desde las herramientas de OAM (34) de MPLS, indicando que la situación ha vuelto a ser "potencialmente conflictiva". El servicio candidato para el criterio de selección de migración está fuera del ámbito de esta invención. Finalmente, el analizador de tráfico pasivo (32), eventualmente, puede determinar la

"operación correcta" y luego es posible migrar nuevamente los servicios a los trayectos originales, nuevamente sin ninguna pérdida de tráfico.

La Figura 7 ilustra la arquitectura del propuesto sistema (10) QMM, Administrador de Monitorización de Calidad de Servicio, incluyendo los distintos módulos e interfaces. El sistema (10) no necesita ser construido sobre una única máquina física; es posible distribuir las distintas funcionalidades por distintos elementos físicos, en particular, por los mismos nodos de la red de MPLS, con el único requisito de implementar las funcionalidades requeridas de las interfaces. Para la implementación y la operación correcta, se requiere al menos un procesador y conectividad por Ethernet hacia todos los módulos externos requeridos. Sin embargo, se recomiendan múltiples procesadores para mayores prestaciones. Una descripción adicional de los distintos módulos y de las distintas interfaces, internas y externas, se proporciona más adelante, según una posible realización de la invención.

- Módulos internos del sistema (10) QMM

Módulo de Cálculo (100), CM: constituye el cerebro y la inteligencia del sistema (10) y está a cargo de coordinar todas las operaciones ejecutadas en los distintos casos de uso posibles, según lo descrito anteriormente. En particular:

• Recibe conjuntos de alarmas correlacionadas desde el módulo de Gestión y Correlación de Alarmas (106). Cada conjunto inicia un procedimiento de cálculo distinto, que puede ser cualquiera de los cinco anteriormente descritos para los casos de uso.

• Puede requerir que el módulo de Gestión y Correlación de Alarmas (106) sondee el módulo Analizador de Tráfico Pasivo (32) de los nodos (31 ) de red, mediante el módulo COMM de la Capa de Red (102) para la comunicación de la capa de red, cuando el Analizador de Tráfico Pasivo (32) está funcionando en la modalidad bajo demanda. La medición pasiva a sondear es decidida por el Módulo de Cálculo (100), según el tipo de alarma recibida.

• Puede requerir que el módulo Activador de Monitorización Activa (107) inicie procedimientos de monitorización activa, ya sea en el Sistema de Soporte de Servicio externo, mediante el módulo COMM de la Capa de Servicio (101 ), o bien en los módulos de OAM (34) de MPLS de los nodos (31 ) de red, mediante el módulo COMM de la Capa de Red (102). El tipo de medición activa a activar es decidido por el Módulo de Cálculo (100), según el tipo de alarma recibida.

• Puede solicitar al módulo externo de Base de Datos (36) del Sistema, mediante el módulo COMM de Bases de Datos (103), información con respecto al estado de la red, o los servicios, según los requisitos de cada uno de los casos de uso. También puede solicitar a la base de datos externa, o DDBB (36), nuevos trayectos sobre los cuales debería proveer servicios restaurados. Finalmente, provee a la DDBB cambios de estado que pueda haber detectado, tal como la indisponibilidad de un enlace.

• Puede solicitar al módulo Planificador de Señalización (104) llevar a cabo operaciones de restauración sobre un grupo de servicios, proporcionando el nuevo trayecto en la solicitud.

• Almacena los valores de umbral configurados por el operador para definir las zonas de operación, según lo expresado en el caso 5 de uso, valores que son recibidos desde el módulo de Configuración (109).

• Provee al módulo de Almacenamiento de Registros (1 10) información asociada a las distintas alarmas recibidas y operaciones llevadas a cabo, de modo que puedan ser consultadas por el operador mediante el módulo COMM (105) del Operador.

Capa de Servicios, Capa de Red, Base de Datos, módulos (101 , 102, 103, 105) COMM del Operador y sistemas externos de interfaz del módulo Planificador (104) de Señalización. El objetivo común de tales módulos (101 , 102, 103, 104, 105) es ocultar a los módulos de procesamiento de QMM los detalles específicos de implementaciones potencialmente distintas de las interfaces externas, unificando las comunicaciones hacia los módulos internos. Por ejemplo, la Base de Datos (36) del Sistema puede ser implementada usando distintas tecnologías y, por tanto, la interfaz (203) DDBB - DBCOMM puede presentar distintas implementaciones técnicas, dando todas soporte al mismo conjunto de requisitos. El moduloDDBB COMM (103) está luego a cargo de traducir los distintos mensajes de formato, proporcionando mensajes unificados por la interfaz (212) CM - DBCOMM.

COMM de la Capa de Servicio (101 ), SLCOMM: mantiene interfaces con el Sistema de Soporte de Servicios (21 ) para recibir alarmas o solicitar pruebas activas en la capa de servicios. Las alarmas recibidas son luego enviadas al módulo (106) de Gestión y Correlación de Alarmas, mientras que la activación de pruebas activas se hace en el módulo Activador de Monitorización Activa (107).

COMMde la Capa de Red (102), NLCOMM: mantiene interfaces con los nodos de red para recibir alarmas desde distintos sistemas externos: i) Monitorización de Capa Física (33), ii) Analizador de Tráfico Pasivo (32) y / o iii) OAM (34) de MPLS.

También puede solicitar pruebas activas de OAM de MPLS o un sondeo pasivo bajo demanda. Las alarmas recibidas son enviadas al módulo (106) de Gestión y Correlación de Alarmas, módulo que también activa el sondeo pasivo bajo demanda. Por otra parte, la activación de pruebas activas se hace en el módulo (107) Activador de Monitorización Activa.

DDBB COMM (103), DBCOMM: mantiene interfaces con la Base de Datos (36) del Sistema para recibir información con respecto al estado de redes / servicios, o con respecto a nuevos trayectos sobre los cuales proveer servicios restaurados. Esta información es solicitada por el Módulo (100) de Cálculo. El Módulo (100) de

Cálculo también puede proveer, mediante este módulo, a la Base de Datos (36) del Sistema los cambios de estado de redes / servicios que el sistema (10) QMM ha detectado. Planificador de Señalización (104), SS: mantiene interfaces con funcionalidades de

Señalización (104) de MPLS, disponibles en la red para permitir procedimientos de restauración, a petición del Módulo (100) de Cálculo. Estas funcionalidades, en la implementación más sencilla, podrían admitir el acceso mediante una red de gestión que use la Interfaz de Línea de Comando, o CLI, de los nodos de la red. Son válidas soluciones alternativas, más sofisticadas, que proporcionen características equivalentes.

COMM (105) del Operador, OCOMM: proporciona una interfaz para que el operador (700) configure tanto los niveles de prioridad de las distintas alarmas que podrían ser recibidas como los umbrales entre las zonas de operación para el caso de uso en el cual el sistema (10) QMM funciona proactivamente, valores que son almacenados en el módulo (109) de Configuración. Su interfaz externa permite al operador (700) consultar información acerca de las alarmas ocurridas y asimismo las acciones realizadas, información llegada desde el módulo (1 10) de Almacenamiento de Registros.

El resto de los módulos internos de procesamiento del sistema (10) QMM son: Gestión y Correlación de Alarmas (106), AMC: este módulo está a cargo de procesar las distintas alarmas recibidas desde los módulos externos, mediante los módulos (101 , 102) COMM de la Capa de Servicios y la Capa de Red. Tras la recepción de una alarma, determina la prioridad según los valores proporcionados por el módulo (109) de Configuración, y ejecuta el algoritmo de correlación asociado a esa prioridad (básicamente, comprueba la existencia de alarmas con menos prioridad que hacen referencia al mismo fallo). Las alarmas agrupadas son luego enviadas al Módulo (100) de Cálculo, de modo que pueda iniciar los procedimientos, según lo indicado en la descripción de los casos de uso. El proceso de correlación está gobernado por un Reloj (108) de Sincronización, con lo que se asegura que las alarmas separadas en el tiempo sean tratadas de forma diferente.

El funcionamiento de este módulo para una alarma específica puede ser retardado en caso de que llegue una alarma con una prioridad más alta, si no es capaz de tratarlas en paralelo. Finalmente, la Gestión y Correlación (106) de Alarmas también está a cargo de sondear el Analizador de Tráfico Pasivo (32) externo, mediante el módulo (102) COMM de la Capa de Red, según lo solicitado por el Módulo (100) de

Cálculo, para la modalidad de funcionamiento bajo demanda de las herramientas de monitorización pasiva.

Activador de Monitorización Activa (107), AMT: este módulo está a cargo de incentivar las pruebas activas disponibles en los sistemas externos, en particular, en el Sistema de Soporte de Servicios (21 ) para pruebas en la capa de servicios, o usando las herramientas de OAM (34) de MPLS de los nodos de la red. La comunicación con los primeros se hace a través del módulo (101 ) COMM de la Capa de Servicios, mientras que el módulo (102) COMM de la Capa de Red permite la comunicación con los segundos. La ejecución de pruebas activas externas es solicitada por el Módulo (100) de Cálculo, y los resultados son proporcionados de vuelta por el Activador de Monitorización Activa (107).

Reloj (108) de Sincronización, SC: proporciona el reloj para la sincronización de los procedimientos de correlación llevados a cabo en el módulo (106) de Gestión y Correlación de Alarmas.

Configuración (109), CONF: almacena los parámetros de configuración proporcionados por el operador para los valores de prioridad a dar a cada una de las alarmas a recibir potencialmente, y para los dos umbrales que separan las zonas de operación en el caso de uso en el cual el sistema (10) QMM funciona proactivamente. El primer conjunto de parámetros se remite luego al módulo (106) de Gestión y Correlación de Alarmas, mientras que el segundo se remite al Módulo (100) de Cálculo.

Almacenamiento (1 10) de Registros, LS: almacena información acerca de alarmas ocurridas y acciones correctivas asociadas ejecutadas, información que es proporcionada por el Módulo (100) de Cálculo, antes de su presentación al operador (700), mediante el módulo (105) COMM del Operador.

Interfaces internas del sistema (10) QMM

Interfaz SLCOMM - AMC (206) e Interfaz NLCOMM - AMC (207):

Ambas interfaces comparten el mismo procedimiento: Para remitir todas las alarmas recibidas desde sistemas de monitorización externa hacia el módulo de Gestión y Correlación de Alarmas (106). El formato de los mensajes difiere, según el módulo externo específico que genera la alarma, dado que en cada procedimiento están disponibles distintos tipos de información; en particular, toda vez que está disponible información de "localización de fallos", debería añadirse al cuerpo del mensaje. El mensaje de respuesta desde el módulo de Gestión y Correlación de Alarmas (106) es un acuse de recibo. Además, la Interfaz NLCOMM - AMC (207) también permite a otro procedimiento: el módulo de Gestión y Correlación de Alarmas (106), solicitar un cierto tipo de medición pasiva externa en los nodos de la red. El mensaje de solicitud debe incluir: i) el nodo, o interfaz, de red donde debería hacerse la medición, ii) el tipo de medición a hacer, p. ej., el ancho de banda consumido, y iii) por cuánto tiempo, o cuántas repeticiones deberían hacerse. La entrada para el último parámetro podría tener la forma de "hasta que se sobrepase un cierto umbral", según lo requerido por el caso de uso en el cual el sistema (10) QMM funciona proactivamente. El mensaje de respuesta desde el módulo COMM (102) de la Capa de Red proporciona el resultado de la medición solicitada.

Interfaz SLCOMM - AMT (208) e Interfaz NLCOMM - AMT (209): Ambas interfaces comparten el mismo procedimiento: El módulo Activador de Monitorización Activa (107), para solicitar un cierto tipo de medición activa externa, ya sea por el Sistema de Soporte de Servicios (21 ) o bien por los mecanismos de OAM (34) de MPLS de los nodos (31 ) de la red. El mensaje de solicitud debe incluir: i) el servicio específico - en el caso de monitorización de capa de servicios - o el segmento / nodo / interfaz de red - en el caso de monitorización de la capa de red - a probar, ii) el tipo de medición a hacer, p. ej., retardo experimentado, y iii) por cuánto tiempo, o cuántas repeticiones deberían hacerse. La entrada para el último parámetro puede tener la forma "hasta que se sobrepase un cierto umbral", según lo requerido por el caso de uso en el cual el sistema (10) QMM funciona proactivamente. Los mensajes de respuesta desde los módulos (101 , 102) COMM de la Capa de Servicios y de la Capa de Red proporcionan el resultado de la medición solicitada.

Interfaz CM - AMC (210): Permite dos procedimientos: al módulo de Gestión y Correlación de Alarmas (106), para enviar conjuntos de alarmas correlacionadas al Módulo (100) de Cálculo. El formato de estos mensajes difiere, según el módulo externo específico que genera la alarma, según lo indicado también para las Interfaces (206, 207) SLCOMM - AMC y NLCOMM - AMC. El mensaje de respuesta desde el Módulo (100) de Cálculo es un acuse de recibo. al Módulo de Cálculo (100), para solicitar un cierto tipo de medición pasiva externa al módulo de Gestión y Correlación de Alarmas (106). El formato de los mensajes de solicitud y respuesta debería coincidir con un esquema equivalente al segundo procedimiento en la Interfaz (207) NLCOMM - AMC. Interfaz CM - AMT (21 1 ): Permite un procedimiento. al Módulo de Cálculo (100), solicitar un cierto tipo de medición activa externa al módulo Activador de Monitorización Activa (107). El mensaje de solicitud incluye la misma información que para las Interfaces SLCOMM - AMT (208) o NLCOMM - AMC (209), con un campo adicional para especificar el elemento externo para llevar a cabo la medición, es decir, si necesita ser gestionada por las sondas de la capa de aplicación o los mecanismos de OAM (34) de MPLS. El mensaje de respuesta desde el módulo Activador de Monitorización Activa (107) proporciona el resultado de la medición solicitada.

Interfaz CM - DBCOMM (212): Permite cuatro tipos de procedimientos, tres de solicitudes desde el Módulo de Cálculo (100) al módulo DBCOMM (103), y uno informativo, en la misma dirección: i) Solicitando el trayecto que está recorriendo un servicio especificado, de modo que los procedimientos de localización puedan iniciarse después de que sea recibida una alarma desde la capa de aplicación. El mensaje de solicitud incluye un identificador de servicio, mientras que la respuesta incluye el trayecto, por ejemplo, en forma de un Objeto de Ruta Explícita, o ERO.

ii) Solicitando los servicios que recorren un trayecto específico, de modo que sean conocidos todos los servicios que necesitan ser restaurados después de que se localiza un fallo. El mensaje de solicitud incluye el trayecto, por ejemplo, en forma de un ERO, mientras que la respuesta proporciona una lista con los identificadores de servicios. iii) Solicitando un nuevo trayecto para un servicio especificado, dado que el trayecto original no está disponible. Ha de observarse que un módulo específico para el cálculo de trayectos es requerido en la Base de Datos externa del Sistema con este fin. Un ejemplo de tal módulo es el Elemento de Cálculo de Trayecto - PCE - definido por la IETF. La solicitud incluye el identificador de servicio, mientras que la respuesta incluye el nuevo ERO. iv) Informando acerca de cambios de servicios / redes, causados por situaciones de fallo, de modo que la DDBB (36) externa se mantenga actualizada. El mensaje informativo incluye distintos campos, según el suceso específico que está siendo registrado, mientras que la respuesta incluye solamente un acuse de recibo.

Interfaz CM - SS (213): Permite un procedimiento: al Módulo de Cálculo (100), para solicitar una operación de restauración al Planificador (104) de Señalización. El mensaje de solicitud debe incluir: i) el servicio, o los servicios, que necesita(n) ser restaurado(s), y ii) el trayecto de red sobre el cual deberían ser restaurados estos servicios. Debe observarse, por lo tanto, que los servicios pueden ser agrupados en una única solicitud cuando comparten el mismo nuevo trayecto. Los servicios afectados por el mismo fallo, pero restaurados sobre distintos trayectos, generan distintas solicitudes en esta interfaz. La respuesta desde el módulo SS (104) incluye el resultado de la operación de restauración (cumplida con éxito o no, y el motivo en este último caso). Interfaz OCOMM - CONF (214): Permite dos procedimientos: al módulo COMM (105) del Operador, para almacenar en el módulo de Configuración (109) los valores de prioridad fijados por el operador (700) para las distintas alarmas externas disponibles en el sistema de monitorización. El mensaje incluye un valor entero no repetido para cada uno de los tipos de alarma, y la respuesta es un acuse de recibo. al módulo COMM (105) del Operador, para almacenar en el módulo de Configuración (109) los dos valores de umbral que separan las tres zonas de operación definidas en el caso de uso en el cual el sistema (10) QMM funciona proactivamente. El mensaje incluye dos valores entre 0 y 100, correspondientes a los valores de uso de ancho de banda que separan tales zonas. La respuesta es un acuse de recibo. Interfaz CONF - AMC (215): Permite un procedimiento: al Módulo de Configuración (109), para almacenar en el módulode Gestión y Correlación de Alarmas (106) los valores de prioridad de los distintos tipos de alarmas que el sistema puede recibir, valores que son configurables por el operador

(700). En otras palabras, esto es una especie de retransmisor del primer procedimiento en la Interfaz OCOMM - CONF (214). La respuesta es un acuse de recibo. Interfaz CONF - CM (216): Permite un procedimiento: al Módulo de Configuración (109), para almacenar en el Módulo de Cálculo (100) los valores de umbral que definen las zonas de operación (caso de uso en el cual el sistema (10) QMM funciona proactivamente), valores que son configurables por el operador (700). El mensaje incluye dos valores, que separan las zonas "correcta" y

"potencialmente conflictiva" a un lado, y a la última de la zona "crítica" en el otro. Nuevamente, es una especie de retransmisor, en este caso del segundo procedimiento en la Interfaz OCOMM - CONF (214). La respuesta es un acuse de recibo.

Interfaz OCOMM - LS (217): permite un procedimiento: al módulo COMM (105) del Operador, para solicitar al módulo de Almacenamiento de Registros (1 10) la información que permita tener un conocimiento claro de qué sucesos han ocurrido, y qué acciones correctivas han sido adoptadas por el sistema

(10) QMM, ante la solicitud del operador (700). La respuesta es una lista de sucesos y acciones asociadas.

Interfaz LS - CM (218): Permite un procedimiento: al Módulo de Cálculo (100), para almacenar en el módulo (1 10) de Almacenamiento de Registros toda la información requerida por los operadores (700), según lo indicado en la Interfaz (217) OCOMM - LS. La respuesta es un acuse de recibo. Interfaz SC - AMC (219): Permite un procedimiento: al Reloj (108) de Sincronización, para proporcionar la temporización para los procedimientos de correlación en el módulo de Gestión y Correlación de Alarmas (106). Esta es una señal continua de reloj, sin ningún mensaje específico intercambiado.

Interfaces externas del sistema (10) QMM

Las interfaces externas son interfaces que permiten la comunicación con sistemas externos que pueden presentar muchas clases distintas de implementaciones de interfaces. De esta manera, para los procedimientos internos específicos del sistema (10) QMM quedan ocultos los detalles de las tecnologías de implementación de sistemas externos, y comparten formatos unificados de mensajes. De esta manera, una nueva implementación de interfaz de un módulo externo solamente requiere modificaciones en los módulos COMM y las interfaces del sistema (10) QMM.

Interfaz SSS - SLCOMM (201 ): es el origen de las alarmas de la capa de servicio, retransmitidas por la interfaz SLCOMM - AMC (206), y retransmite las solicitudes de medición de la capa de servicio activo que llegan desde la interfaz SLCOMM -

AMT (208).

Interfaz NN - NLCOMM (202): es el origen de las alarmas de la capa de red retransmitidas por la interfaz NLCOMM - AMC (207), y retransmite las solicitudes de medición de capas de red pasivas y activas, que llegan desde las interfaces

(207, 209) NLCOMM - AMC y NLCOMM - AMT.

Interfaz DDBB - DBCOMM (203): retransmite las solicitudes y mensajes informativos que llegan desde la interfaz CM - DBCOMM (212).

Interfaz MPLS Sig - SS (204): retransmite las solicitudes que llegan desde la interfaz (213) CM-SS.

Interfaz Operador - OCOMM (205): es el origen de los parámetros configurables retransmitidos a través de la interfaz OCOMM - CONF (214), y de las solicitudes del operador (700) de información de registros, retransmitidas a través la interfaz OCOMM - LS (217).

Obsérvese que en este texto, el término "comprende" y sus derivaciones (tales como "comprendiendo", etc.) no deberían ser entendidos en un sentido excluyente, es decir, estos términos no deberían ser interpretados como excluyentes de la posibilidad de que lo que se describe y define pueda incluir elementos, etapas, etc., adicionales.

Claims

REIVINDICACIONES

1. Un procedimiento para restaurar degradaciones de QoS en redes de MPLS, caracterizado por comprender:

-recibir al menos una alarma (1 ) desde la Capa de Aplicación (20) o desde un nodo (31 ) de red de una red de MPLS (30),

-localizar un segmento con fallos de la red de MPLS(30), asociado a dicha al menos una alarma recibida;

-correlacionar todas las alarmas asociadas al segmento con fallos en la misma ubicación,

-determinar los servicios afectados por las alarmas correlacionadas,

-consultar una base de datos (36) para obtener trayectos de restauración para todos los servicios afectados,

-restaurar los servicios afectados usando los trayectos de restauración, -probar los servicios restaurados.

2. El procedimiento según la reivindicación 1 , en el cual, si la alarma (1 ) es recibida desde un nodo (31 ) de red, la localización de un segmento con fallos comprende solicitar la localización al nodo (31 ) de red.

3. El procedimiento según la reivindicación 1 , en el cual, si la alarma (1 ) es recibida desde la Capa de Aplicación (20), la localización de un segmento con fallos comprende solicitar la ubicación de un trayecto de red usado por la Capa de Aplicación (20) a la base de datos (36) y solicitar de herramientas OAM (34) de MPLS la ubicación del segmento con fallos a lo largo del trayecto de red.

4. El procedimiento según cualquier reivindicación precedente, en el cual la correlación de las alarmas comprende asignar una ponderación de prioridad a la alarma (1 ) recibida.

5. El procedimiento según la reivindicación 4, en el cual la ponderación de prioridad es asignada de acuerdo a los siguientes criterios: -si la alarma (1 ) es recibida desde la Capa de Aplicación (20), la alarma (1 ) es asignada a la más alta ponderación de propiedad;

— si la alarma (1 ) es recibida desde herramientas de OAM (34) de MPLS de un nodo (31 ) de red, la alarma (1 ) es asignada a la ponderación de prioridad más baja;

-si la alarma (1 ) es recibida desde las herramientas de monitorización de la Capa Física (33) de un nodo (31 ) de red, a la alarma (1 ) es asignada una mayor ponderación de prioridad que una ponderación de prioridad asignada a la alarma (1 ) en el caso en que es recibida desde el analizador de tráfico pasivo (32) de un nodo (31 ) de red.

6. El procedimiento según cualquier reivindicación precedente, en el cual la etapa de restauración usa la señalización (35) de la MPLS.

7. El procedimiento según cualquier reivindicación precedente, en el cual la prueba de los servicios restaurados es solicitada desde la Capa de Aplicación (20) o desde las herramientas OAM (34) de MPLS.

8. El procedimiento según cualquier reivindicación precedente, que comprende adicionalmente, si hay resultados de las pruebas de los servicios restaurados que fallan, consultar la base de datos (36) para obtener trayectos de restauración alternativos para todos los servicios afectados, y repetir las etapas de restauración y prueba usando los trayectos de restauración alternativos.

9. El procedimiento según cualquier reivindicación precedente, que comprende adicionalmente definir una pluralidad de zonas de operación de red y monitorizar segmentos de red para determinar en qué zona definida de operación de red está funcionando un segmento de red y, según la zona determinada de operación de red, si la monitorización es activa o pasiva.

10. El procedimiento según la reivindicación 9, en el cual la monitorización de segmentos de red es realizada por un analizador de tráfico pasivo (32) o por las herramientas OAM (34) de MPLS.

1 1 . El procedimiento según cualquiera de las reivindicaciones 9 a 10, en el cual, si la zona determinada de operación de red es crítica, indicando potenciales degradaciones de QoS, se recibe una alarma (1 ) desde un nodo (31 ) de red de la red de MPLS (30).

12. El procedimiento según la reivindicación 1 1 , en el cual, si una alarma (1 ) es recibida desde el analizador de tráfico pasivo (32), la monitorización de los segmentos de red es continuada por las herramientas OAM (34) de MPLS.

13. El procedimiento según la reivindicación 1 1 , en el cual, si la alarma (1 ) es recibida desde las herramientas OAM (34) de MPLS, las etapas de restauración y prueba son repetidas usando trayectos de restauración para los servicios que recorren el segmento de red en la zona crítica determinada de operación de red.

14. Un sistema (10) para restaurar degradaciones de QoS, integrado en una red

(30) de MPLS, caracterizado por comprender adicionalmente:

-un módulo de comunicación de la capa de servicios (101 ), para recibir al menos una alarma (1 ) desde la Capa de Aplicación (20), y un módulo de comunicación de la capa de red (102), para recibir al menos una alarma (1 ) desde un nodo (31 ) de red de la red de MPLS (30),

-un módulo (de gestión y correlación de alarmas106), que recibe todas las alarmas asociadas a un segmento con fallos en una misma ubicación desde el módulo de comunicación de la capa de servicios (101 ), y el módulo de comunicación de la capa de red (102), y correlaciona las alarmas recibidas,

-al menos un módulo de cálculo (100), que obtiene la ubicación del segmento con fallos a partir de medios para localizar segmentos de la red de MPLS (30), configurados para determinar los servicios afectados por las alarmas correlacionadas, que el módulo de cálculo (100) recibe desde el módulo de gestión y correlación de alarmas (106), consultando una base de datos (36) de la cual se obtienen unos trayectos de restauración para todos los servicios afectados,

-un planificador (104) de señalización conectado con la señalización (35) de la MPLS para permitir la restauración de los servicios afectados cuando es activado por el módulo de cálculo (100), usando los trayectos de restauración obtenidos,

-un activador (107) de monitorización activa, que es solicitado por el módulo de cálculo (100) para obtener pruebas sobre los servicios restaurados desde la capa de servicios, a través del módulo de comunicación de la capa de servicio (101 ), y desde la capa de red, a través del módulo de comunicación de la capa de red (102).

15. Un programa de ordenador que comprende medios de código de programa de ordenador, adaptados para realizar las etapas del procedimiento según cualquier reivindicación de 1 a 13, cuando dicho programa es ejecutado en un ordenador, un procesador de señales digitales, una formación de compuertas programables en el terreno, un circuito integrado específico de la aplicación, un micro-procesador, un micro-controlador o cualquier otra forma de hardware programable.