DE10334632A1 - Verfahren zur schnellen Fehlererkennung in IP-Netzen - Google Patents

Verfahren zur schnellen Fehlererkennung in IP-Netzen Download PDF

Info

Publication number
DE10334632A1
DE10334632A1 DE10334632A DE10334632A DE10334632A1 DE 10334632 A1 DE10334632 A1 DE 10334632A1 DE 10334632 A DE10334632 A DE 10334632A DE 10334632 A DE10334632 A DE 10334632A DE 10334632 A1 DE10334632 A1 DE 10334632A1
Authority
DE
Germany
Prior art keywords
network node
messages
alive
alive messages
transmission path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10334632A
Other languages
English (en)
Inventor
Gero Dr. Schollmeier
Thomas Schwabe
Christian Dr. Winkler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10334632A priority Critical patent/DE10334632A1/de
Priority to PCT/EP2004/051488 priority patent/WO2005013563A1/de
Publication of DE10334632A1 publication Critical patent/DE10334632A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/026Details of "hello" or keep-alive messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/03Topology update or discovery by updating link state protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

In einem paketorientierten Datensatz tauschen die Netzknoten (Router) zur Erkennung von Störungen auf den Übertragungswegen zwischen den Netzknoten zusätzlich zu den Routing-Informationen alive-Messages miteinander aus, wobei der Takt, mit dem die alive-Messages ausgetauscht werden, mindestens eine Größenordnung höher ist als der Takt, mit dem die Routing-Informationen ausgetauscht werden. Durch die Trennung von Routing und Behandlung von Fehlern im IP-Netz wird eine verkürzte Fehlerreaktionszeit erzielt. Die Fehlererkennungszeit kann typisch um ca. den Faktor 1000 beschleunigt werden.

Description

  • Der Anmeldungsgegenstand betrifft ein Verfahren zur Erkennung von Störungen auf dem Übertragungsweg zwischen Netzknoten eines paketorientierten Datennetzes bei dem benachbarte Netzknoten Routing-Informationen miteinander austauschen.
  • In heutigen IP (Internet Protocol)-Netzen führen Leitungs- und Knotenausfälle in aller Regel zu längeren Unterbrechungen des Verkehrsflusses (Größenordnung zig Sekunden bis Minuten). Sollen auch Echtzeitdienste, z.B. Sprache, mit der für Telekommunikationsdienste gewohnten Qualität über diese Netze geführt werden ist dieses Fehlerverhalten nicht ausreichend. Dafür werden Rektionszeiten deutlich unterhalb einer Sekunde benötigt.
  • Leitungs- und Knotenausfälle werden in heutigen IP Netzen im allgemeinen durch die Routing Protokolle erkannt und durch netzweite Berechnung neuer Wege behoben. Dabei tauschen benachbarte Router in regelmäßigen Abständen Statusinformation aus, deren mehrmaliges Ausbleiben als Fehler gewertet wird und eine Neuberechnung der Wege anstößt. Bei heutigen Routing-Protokollen arbeitet diese "Fehlererkennung" so langsam (z.B. bei OSPF mit sog. "Hello Messages" ca. 40 Sekunden), daß trotz des folgenden Re-Routing gravierende Beeinträchtigungen des Verkehrs auftreten.
  • Eine einfache Beschleunigung dieser Hello-Messages ist nicht möglich. Die Minimalzeiten sind im Standard festgeschrieben und lassen sich in existierenden Routern daher nicht unterschreiten. Grund dafür ist, daß als Folge von ausbleibenden Hellos umfangreiche Tabellenübertragungen bzw. Berechnungen ausgelöst werden, was bereits bei den heutigen niedrigen Wiederholfrequenzen störend ist. Außerdem steigt bei Verrin gerung der Zeiten die Gefahr instabiler Betriebszustände im Netz.
  • Neben der Fehlererkennung der Routing-Protokolle bieten manche moderne Router auch eine Schnittstellen-Fehlererkennung, die das Ausbleiben des physikalischen Signals als Fehler bewertet und an den Routing Prozeß meldet. Diese Fehlererkennung reagiert zwar wesentlich schneller, kann jedoch nur Fehler des direkt an dem Router angeschlossenen Leitungsabschnitts erkennen. Liegen, was bei Netzen häufig ist, weitere übertragungstechnische Einrichtungen zwischen benachbarten Routern, so sind mit dieser Methode nur jeweils die Randabschnitte abgesichert und werden auch nur die "groben" Fehler eines völligen physikalischen Versagens erkannt.
  • Dem Anmeldungsgegenstand liegt die Aufgabe zugrunde, ein Verfahren anzugeben, das eine verkürzte Fehlerreaktionszeit bei Ausfall eines Übertragungsweges mit sich bringt.
  • Die Aufgabe wird durch die Merkmale des Anspruchs 1 gelöst.
  • Die vom Routing getrennte Behandlung von Fehlern im IP Netz, die heute in dieser Form nicht möglich ist, erlaubt die Entwicklung und den Einsatz von flexiblen Fehlererkennungsmechanismen und Fehlerreaktionen. Mit dem Alive-Mechanismus werden Fehler schnell erkannt und können im Idealfall sofort lokal behandelt werden. Eine Beeinträchtigung laufender Kommunikationsbeziehungen durch (anteilmäßig vorherrschende) Link-Ausfälle wird weitgehend vermieden.
  • Die Fehlererkennungszeit kann typisch um ca. den Faktor 1000 beschleunigt werden.
  • Vorteilhafte Weiterbildungen des Anmeldungsgegenstandes sind in den Unteransprüchen angegeben.
  • Der Anmeldungsgegenstand wird im folgenden als Ausführungsbeispiel in einem zum Verständnis erforderlichen Umfang anhand einer Figur näher erläutert.
  • Die Netzknoten NK 1.. NK9 (Router) in 1 bilden mit den sie verbindenden Übertragungswegen (links, Routen) ein paketorientiertes Datennetz (IP Netz).
  • Die Erfindung macht sich die Erkenntnis zunutze, dass für die Fehlerbehandlung in heutigen IP Netzen die enge Kopplung der "Fehlererkennung", die eigentlich als "Topologieerkennung" gedacht ist, mit dem Routing, also der Wegeberechnung problematisch ist.
  • A) Trennung Routingprozeß von Fehlererkennung/Fehlerreaktion
  • Routing und Fehlererkennung/Fehlerreaktion sind getrennt, um flexible und umfassende Fehlerbehandlungsmechanismen entwickeln und einsetzen zu können. Im Unterschied zu den eingangs beschriebenen Mechanismen, die direkt das Routing verändern, kann der separate Fehlererkennungsprozeß im Router nun gezielt auf einen erkannten Fehler reagieren. Beispielsweise kann er, sofern das Netz mit Mehrwegerouting arbeitet lokal im betreffenden Router den Verkehr umleiten, ohne die eingangs geschilderten netzweiten Reaktionen auszulösen.
  • B) Fehlererkennung auf IP Ebene
  • Durch zusätzlich einzuführende alive-Messages zwischen benachbarten Routern in Abständen Ta von wenigen ms, die auf jeder Leitung ausgetauscht werden, wird die Fehlererkennungszeit um ca. den Faktor 1000 beschleunigt. Dabei sind diese alive Messages nicht an den Router-Prozeß gekoppelt, sondern werden getrennt davon in einem Fehlerbehandlungsprozeß (der in der praktischen Realisierung im Router auch verteilt implementiert sein kann) ausgewertet.
  • Jeder Router sendet in einem netzweit einheitlichen Takt Ta auf jeder Leitung diese alive-Messages. Gleichzeitig prüft er auf jeder Leitung, ob er im Abstand Ta entsprechende Messages von seinem Nachbarn empfängt. Bei aufeinanderfolgendem Ausbleiben von N dieser Nachrichten (oder nach irgendeiner anderen z.B. statistischen Funktion ermittelt) erklärt die Fehlerbehandlung des Routers die Leitung als unterbrochen (bzw. den Nachbarn als unerreichbar) und stoppt ihrerseits das Aussenden der Alive-Messages für diese Leitung.
  • Werden diese alive-Messages als IP Pakete (mit entsprechender Kenzeichnung, z.B. durch die IP Adresse oder eine spezielle Protokollnummer) versendet, wird es möglich, den gesamten Weg zwischen den benachbarten Routern über alle übertragungstechnischen Einrichtungen hinweg, abzusichern. Darüber hinaus wird ein Teil, bei entsprechender Implementierung im Router u.U. sogar sehr weitgehend, der Router-internen IP Behandlungsfunktionen abgesichert.
  • C) Fehlerbehandlungsprozeß
  • Neben den Alive-Messages können dem Fehlerbehandlungsprozeß auch weitere Signale und Ereignisse zugeführt werden. Beispielsweise die Fehlersignale der physikalischen Schnittstellen wie eingangs beschrieben. Oder auch jegliche Fehlersignale, die der Router intern erzeugt, um seine eigene Funktion zu überwachen. Je mehr Information der Fehlerbehandlungsprozeß erhält, desto besser kann er gezielt auf den Fehler reagieren. Auch kann er mit dem Routing-Prozeß interagieren, sowohl um aus dem Routing Prozeß Informationen zu gewinnen (z.B. über die Topologie des Netzes) als auch um den Routing Prozeß zu einer Wege-Neuberechnung anzuregen.
  • In einer praktischen Implementierung in einem modernen Router würde man alive – Erzeugung und – Empfang auf den Line Cards im Datenpfad integrieren. Damit wäre mindestens dieser Teil des Fehlerbehandlungsprozesses verteilt implementiert.
  • D) Fehlerkommunikation
  • Die Fehlerbehandlungsprozesse verschiedener Router können zusätzlich zu den Alive-Messages (siehe B) optional auch weitere Informationen zur Fehlerbehandlung austauschen. Dies kann in Form gesonderter Nachrichten (zwischen Nachbar-Routern oder sogar zwischen entfernten Routern) oder eingebettet in die Alive-Messages (zwischen Nachbar-Routern) geschehen. Anwendungen könnten z.B. das Signal von einem Router NK 7 an seinen Nachbar-Router NK 6 sein, NK 6 möge keinen Verkehr mehr an NK 7 zu einem bestimmten Ziel NK 8 senden, da NK 7 eine Unterbrechung seiner Route zu NK 8 festgestellt hat.

Claims (8)

  1. Verfahren zur Erkennung von Störungen auf dem Übertragungsweg zwischen Netzknoten (NK) eines paketorientierten Datennetzes demzufolge benachbarte Netzknoten Routing-Informationen miteinander austauschen dadurch gekennzeichnet, dass – ein Netzknoten alive-Messages zu einem benachbarten Netzknoten periodisch sendet und von dem benachbarten Netzknoten periodisch ausgesendete alive-Messages empfängt – die Periode Ta, mit der die alive-Messages ausgetauscht werden, um mindestens eine Größenordnung kleiner ist als die Periode, mit der die Routing-Informationen zwischen denbenachbarten Netzknoten ausgetauscht werden – der Netzknoten bei Ausbleiben einer vorgegebenen Anzahl von alive-Messages eine Störung des Übertragungsweges zu dem benachbarten Netzknoten erkennt.
  2. Verfahren nach Anspruch 1 dadurch gekennzeichnet, dass die Periode Ta wenige Millisekunden beträgt.
  3. Verfahren nach einem der vorstehenden Ansprüche dadurch gekennzeichnet, dass die alive-Messages durch IP(Internet Protocol)-Pakete mit besonderer Kenzeichnung gegeben sind.
  4. Verfahren nach einem der vorstehenden Ansprüche dadurch gekennzeichnet, dass ein als alive-Message gekennzeichnetes IP Paket Informationen zur Fehlerbehandlung enthält.
  5. Verfahren nach einem der vorstehenden Ansprüche dadurch gekennzeichnet, dass die Erzeugung und der Empfang von alive-Messages integriert auf den Line Cards im Datenpfad ausgeführt wird.
  6. Verfahren nach einem der vorstehenden Ansprüche dadurch gekennzeichnet, dass der Netzknoten bei Erkennen einer Störung des Übertragungsweges die weiterzuleitenden Datenpakete auf einen bereitgehaltenen alternativen Übertragungsweg weiterleitet.
  7. Verfahren nach einem der vorstehenden Ansprüche dadurch gekennzeichnet dass ein Netzknoten auf jeder Leitung alive-Messages sendet und prüft ob er im Abstand Ta entsprechende Messages von seinem jeweiligen Nachbarn empfängt.
  8. Verfahren nach einem der vorstehenden Ansprüche dadurch gekennzeichnet, dass die Fehlerbehandlungsprozesse verschiedener Netzknoten, insbesondere auch nicht unmittelbar benachbarter, Informationen zur Fehlerbehandlung austauschen.
DE10334632A 2003-07-29 2003-07-29 Verfahren zur schnellen Fehlererkennung in IP-Netzen Withdrawn DE10334632A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10334632A DE10334632A1 (de) 2003-07-29 2003-07-29 Verfahren zur schnellen Fehlererkennung in IP-Netzen
PCT/EP2004/051488 WO2005013563A1 (de) 2003-07-29 2004-07-14 Verfahren zur schnellen fehlererkennung in ip-netzen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10334632A DE10334632A1 (de) 2003-07-29 2003-07-29 Verfahren zur schnellen Fehlererkennung in IP-Netzen

Publications (1)

Publication Number Publication Date
DE10334632A1 true DE10334632A1 (de) 2005-03-03

Family

ID=34111731

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10334632A Withdrawn DE10334632A1 (de) 2003-07-29 2003-07-29 Verfahren zur schnellen Fehlererkennung in IP-Netzen

Country Status (2)

Country Link
DE (1) DE10334632A1 (de)
WO (1) WO2005013563A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006108776A1 (de) * 2005-04-13 2006-10-19 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren, computerprogrammprodukt und netzknotenelement zur schnelleren erkennung von störungen auf übertragungswegen und oder in knoten

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100421393C (zh) * 2005-06-03 2008-09-24 华为技术有限公司 识别网络故障节点的方法
CN1992711B (zh) * 2005-12-27 2011-05-11 中兴通讯股份有限公司 一种sip终端对服务器进行链路检测的方法
CN101174975B (zh) * 2006-11-03 2010-05-12 华为技术有限公司 一种以太网中的链路故障定位方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148410A (en) * 1997-09-15 2000-11-14 International Business Machines Corporation Fault tolerant recoverable TCP/IP connection router
US6424629B1 (en) * 1998-11-23 2002-07-23 Nortel Networks Limited Expediting reconvergence in a routing device
US6856627B2 (en) * 1999-01-15 2005-02-15 Cisco Technology, Inc. Method for routing information over a network
US7031288B2 (en) * 2000-09-12 2006-04-18 Sri International Reduced-overhead protocol for discovering new neighbor nodes and detecting the loss of existing neighbor nodes in a network

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006108776A1 (de) * 2005-04-13 2006-10-19 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren, computerprogrammprodukt und netzknotenelement zur schnelleren erkennung von störungen auf übertragungswegen und oder in knoten
US8107358B2 (en) 2005-04-13 2012-01-31 Siemens Enterprise Communications Gmbh & Co. Kg Method, computer program product, and network node element for more quickly detecting faults on transmission paths and/or in nodes
CN101160854B (zh) * 2005-04-13 2012-02-22 西门子企业通讯有限责任两合公司 用于快速识别传输路径上和/或节点中故障的方法和网络节点元件

Also Published As

Publication number Publication date
WO2005013563A1 (de) 2005-02-10

Similar Documents

Publication Publication Date Title
DE69017193T2 (de) Automatische fehlererholung in einem paketnetz.
DE69021864T2 (de) Automatische fehlererholung in einem paketnetz.
DE60022602T2 (de) Verfahren, Vorrichtung und Computerprogramm um Topologiedaten eines Link State Routing Netzwerkes aktuell zu halten
EP2634973B1 (de) Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz und Verfahren zum Betrieb eines Kommunikationsgeräts
EP2688249B1 (de) Verfahren zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz und Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz
EP1532771B1 (de) Testverfahren f r nachrichtenpfade in kommunikationsnetzen s owie netzelement
EP2661023B1 (de) Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz und Verfahren zum Betrieb eines Kommunikationsgeräts
EP1500236B1 (de) Verfahren zur überwachung der übertragungsgüte von verbindungen in mpls-netzen
DE102007015539A1 (de) Verfahren zum Rekonfigurieren eines Kommunikationsnetzwerks
EP1502396A1 (de) Verfahren zur unterstützung von ersatzschaltungen in mpls-netzen
DE602004001231T2 (de) Verfahren zur Wiederherstellung von Zusatzverkehr unterstützenden Transportnetzwerken
DE69933919T2 (de) Filterung eines sekundären Alarms
EP1842343A1 (de) Verfahren zur bestimmung der weiterleitungsrichtung von ethernet-frames
DE102007015449B4 (de) Verfahren zum Rekonfigurieren eines Kommunikationsnetzwerks
DE10334632A1 (de) Verfahren zur schnellen Fehlererkennung in IP-Netzen
EP2704370B1 (de) Verfahren zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz und Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz
DE10334104A1 (de) Verfahren und Netzknoten zur Meldung mindestens eines ausgefallenen Verbindungsweges innerhalb eines Kommunikationsnetzes
EP2854345B1 (de) Verfahren und Koppel-Kommunikationsgerät zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz
DE60303498T2 (de) Schalten gemäss der anschlusskennzeichnung
EP3629550A1 (de) Verfahren zur datenübermittlung innerhalb eines industriellen kommunikationsnetzes und koppel-kommunikationsgerät
EP4125253B1 (de) Verfahren zur übermittlung zeitkritischer daten, kommunikationssystem und koppel-kommunikationsgerät
EP2290882B1 (de) Verfahren zur mehrfachen Fehlerredundanz in Netzwerken mit Ringtopologien
DE3620835A1 (de) Verfahren zur ueberwachung eines digitalen, hierarchisch gegliederten nachrichtenuebertragungsnetzes
EP4425875A1 (de) Verfahren zur hochverfügbaren datenübermittlung innerhalb eines kommunikationssystems, kommunikationssystem und kommunikationsgerät
WO2005034442A1 (de) Schnelle fehlerreaktion in lose vermaschten ip-netzen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8130 Withdrawal