2003 P 112732003 P 11273
Beschreibungdescription
Verfahren zur schnellen Fehlererkennung in IP-NetzenProcedure for fast error detection in IP networks
Der Anmeldungsgegenstand betrifft ein Verfahren zur Erkennung von Störungen auf dem Übertragungsweg zwischen Netzknoten eines paketorienti'erten Datennetzes bei dem benachbarte Netzknoten Routing-Informationen miteinander austauschen.The subject matter of the application relates to a method for identifying interference on the transmission path between network nodes of a packet-oriented data network in which neighboring network nodes exchange routing information with one another.
In heutigen IP (Internet Protocol) -Netzen führen Leitungsund Knotenausfälle in aller Regel zu längeren Unterbrechungen des Verkehrsflusses (Größenordnung zig Sekunden bis Minuten) . Sollen auch Echtzeitdienste, z.B. Sprache, mit der für Telekommunikationsdienste gewohnten Qualität über diese Netze geführt werden ist dieses Fehlerverhalten nicht ausreichend. Dafür werden Rektionszeiten deutlich unterhalb einer Sekunde benötigt.In today's IP (Internet Protocol) networks, line and node failures generally lead to longer interruptions in the flow of traffic (in the order of tens of seconds to minutes). Should real-time services, e.g. This error behavior is not sufficient with the language with which the usual quality for telecommunications services is routed through these networks. This requires reaction times well below one second.
Leitungs- und Knotenausfälle werden in heutigen IP Netzen im allgemeinen durch die Routing Protokolle erkannt und durch netzweite Berechnung neuer Wege behoben. Dabei tauschen benachbarte Router in regelmäßigen Abständen Statusinformation aus, deren mehrmaliges Ausbleiben als Fehler gewertet wird und eine Neuberechnung der Wege anstößt. Bei heutigen Routing-Protokollen arbeitet diese "Fehlererkennung" so langsam (z.B. bei OSPF mit sog. "Hello Messages" ca. 40 Sekunden) , daß trotz des folgenden Re-Routing gravierende Beeinträchtigungen des Verkehrs auftreten.In today's IP networks, line and node failures are generally recognized by the routing protocols and eliminated by network-wide calculation of new routes. Adjacent routers exchange status information at regular intervals, the repeated absence of which is considered an error and triggers a recalculation of the routes. With today's routing protocols, this "error detection" works so slowly (e.g. with OSPF with so-called "Hello Messages" approx. 40 seconds) that despite the following re-routing serious traffic problems occur.
Eine einfache Beschleunigung dieser Hello-Messages ist nicht möglich. Die Minimalzeiten sind im Standard festgeschrieben und lassen sich in existierenden Routern daher nicht unterschreiten. Grund dafür ist, daß als Folge von ausbleibenden Helios umfangreiche Tabellenübertragungen bzw. Berechnungen ausgelöst werden, was bereits bei den heutigen niedrigenA simple acceleration of these hello messages is not possible. The minimum times are specified in the standard and can therefore not be exceeded in existing routers. The reason for this is that as a result of missing Helios extensive table transfers or calculations are triggered, which is already the case with today's low ones
Wiederholfrequenzen störend ist. Außerdem steigt bei Verrin-
2003 P 11273Repetition frequencies is disruptive. In addition, 2003 P 11273
2 gerung der Zeiten die Gefahr instabiler Betriebszustände im2 reduction of the times the danger of unstable operating conditions in the
Netz .Network.
Neben der Fehlererkennung der Routing-Protokolle bieten man- ehe moderne Router auch eine Schnittstellen-Fehlererkennung, die das Ausbleiben des physikalischen Signals als Fehler bewertet und an den Routing Prozeß meldet. Diese Fehlererkennung reagiert zwar wesentlich schneller, kann jedoch nur Fehler des direkt an dem Router angeschlossenen Leitungsab- Schnitts erkennen. Liegen, was bei Netzen häufig ist, weitere übertragungstechnische Einrichtungen zwischen benachbarten Routern, so sind mit dieser Methode nur jeweils die Randabschnitte abgesichert und werden auch nur die "groben" Fehler eines völligen physikalischen Versagens erkannt.In addition to the error detection of the routing protocols, modern routers also offer interface error detection, which evaluates the absence of the physical signal as an error and reports it to the routing process. This error detection reacts much faster, but can only detect errors in the line section directly connected to the router. If, as is often the case with networks, there are further transmission facilities between neighboring routers, only the edge sections are secured with this method and only the "gross" errors of a complete physical failure are recognized.
Dem Anmeldungsgegenstand liegt die Aufgabe zugrunde, ein Verfahren anzugeben, das eine verkürzte Fehlerreaktionszeit bei Ausfall eines Übertragungsweges mit sich bringt.The object of the application is based on the task of specifying a method which brings about a shortened error reaction time in the event of a transmission path failure.
Die Aufgabe wird durch die Merkmale des Anspruchs 1 gelöst.The object is solved by the features of claim 1.
Die vom Routing getrennte Behandlung von Fehlern im IP Netz, die heute in dieser Form nicht möglich ist, erlaubt die Entwicklung und den Einsatz von flexiblen Fehlererkennungsmecha- nismen und Fehlerreaktionen. Mit dem Alive-Mechanismus werden Fehler schnell erkannt und können im Idealfall sofort lokal behandelt werden. Eine Beeinträchtigung laufender Ko munika- tionsbeziehungen durch (anteilmäßig vorherrschende) Link-Ausfälle wird weitgehend vermieden.The handling of errors in the IP network, which is not possible in this form today, allows the development and use of flexible error detection mechanisms and error reactions. With the Alive mechanism, errors are quickly identified and, ideally, can be dealt with locally immediately. Impairment of ongoing communication relationships through (proportionately prevalent) link failures is largely avoided.
Die Fehlererkennungszeit kann typisch um ca. den Faktor 1000 beschleunigt werden.The error detection time can typically be accelerated by a factor of around 1000.
Vorteilhafte Weiterbildungen des Anmeldungsgegenstandes sind in den Unteransprüchen angegeben.
2003 P 11273Advantageous further developments of the subject of the application are specified in the subclaims. 2003 P 11273
3 Der Anmeldungsgegenstand wird im folgenden als Ausführungsbeispiel in einem zum Verständnis erforderlichen Umfang anhand einer Figur näher erläutert.3 The subject of the application is explained in more detail below as an exemplary embodiment to the extent necessary for understanding on the basis of a figure.
Die Netzknoten NK 1.. NK9 (Router) in Fig 1 bilden mit den sie verbindenden Übertragungswegen (links, Routen) ein paket- orientiertes Datennetz (IP Netz) .The network nodes NK 1 .. NK9 (router) in FIG. 1 form a packet-oriented data network (IP network) with the transmission paths connecting them (left, routes).
Die Erfindung macht sich die Erkenntnis zunutze, dass für die Fehlerbehandlung in heutigen IP Netzen die enge Kopplung der "Fehlererkennung", die eigentlich als "Topologieerkennung" gedacht ist, mit dem Routing, also der Wegeberechnung problematisch ist.The invention makes use of the knowledge that the close coupling of "error detection", which is actually intended as "topology detection", with routing, ie route calculation, is problematic for error handling in today's IP networks.
A) Trennung Routingprozeß von Fehlererkennung/FehlerreaktionA) Separation of the routing process from error detection / error reaction
Routing und Fehlererkennung/Fehlerreaktion sind getrennt, um flexible und umfassende Fehlerbehandlungsmechanismen entwickeln und einsetzen zu können. Im Unterschied zu den eingangs beschriebenen Mechanismen, die direkt das Routing verändern, kann der separate Fehlererkennungsprozeß im Router nun gezielt auf einen erkannten Fehler reagieren. Beispielsweise kann er, sofern das Netz mit Mehrwegerouting arbeitet lokal im betreffenden Router den Verkehr umleiten, ohne die ein- gangs geschilderten netzweiten Reaktionen auszulösen.Routing and error detection / error reaction are separated in order to be able to develop and use flexible and comprehensive error handling mechanisms. In contrast to the mechanisms described at the outset, which directly change the routing, the separate error detection process in the router can now react specifically to a detected error. For example, if the network is working with multipath routing, it can redirect the traffic locally in the router in question without triggering the network-wide reactions described at the beginning.
B) Fehlererkennung auf IP EbeneB) Error detection at the IP level
Durch zusätzlich einzuführende alive-Messages zwischen benachbarten Routern in Abständen Ta von wenigen ms, die auf jeder Leitung ausgetauscht werden, wird die Fehlererkennungszeit um ca. den Faktor 1000 beschleunigt. Dabei sind diese alive Messages nicht an den Router-Prozeß gekoppelt, sondern werden getrennt davon in einem Fehlerbehandlungsprozeß (der in der praktischen Realisierung im Router auch verteilt implementiert sein kann) ausgewertet.
2003 P 11273Through additional alive messages to be introduced between neighboring routers at intervals Ta of a few ms, which are exchanged on each line, the error detection time is accelerated by a factor of about 1000. These alive messages are not linked to the router process, but are evaluated separately in an error handling process (which can also be implemented distributed in the router in practical implementation). 2003 P 11273
4 Jeder Router sendet in einem netzweit einheitlichen Takt Ta auf jeder Leitung diese alive-Messages. Gleichzeitig prüft er auf jeder Leitung, ob er im Abstand Ta entsprechende Messages von seinem Nachbarn empfängt. Bei aufeinanderfolgendem Aus- bleiben von N dieser Nachrichten (oder nach irgendeiner anderen z.B. statistischen Funktion ermittelt) erklärt die Fehlerbehandlung des Routers die Leitung als unterbrochen (bzw. den Nachbarn als unerreichbar) und stoppt ihrerseits das Aussenden der Alive-Messages für diese Leitung. Werden diese alive-Messages als IP Pakete (mit entsprechender Kenzeichnung, z.B. durch die IP Adresse oder eine spezielle Protokollnummer) versendet, wird es möglich, den gesamten Weg zwischen den benachbarten Routern über alle übertragungstechnischen Einrichtungen hinweg, abzusichern. Darüber hinaus wird ein Teil, bei entsprechender Implementierung im Router u.U. sogar sehr weitgehend, der Router-internen IP Behandlungsfunktionen abgesichert.4 Each router sends these alive messages on each line in a uniform clock Ta. At the same time, he checks on each line whether he receives corresponding messages from his neighbor at a distance Ta. If N of these messages remains in succession (or determined according to some other statistical function, for example), the router's error handling declares the line as interrupted (or as inaccessible to the neighbors) and in turn stops the transmission of the alive messages for this line. If these alive messages are sent as IP packets (with the appropriate identification, e.g. by the IP address or a special protocol number), it is possible to secure the entire route between the neighboring routers across all transmission technology facilities. In addition, a part, with appropriate implementation in the router may be even very largely, the router's internal IP treatment functions are secured.
C) Fehlerbehandlungsprozeß Neben den Alive-Messages können dem Fehlerbehandlungsprozeß auch weitere Signale und Ereignisse zugeführt werden. Beispielsweise die Fehlersignale der physikalischen Schnittstellen wie eingangs beschrieben. Oder auch jegliche Fehlersignale, die der Router intern erzeugt, um seine eigene Funktion zu überwachen. Je mehr Information der Fehlerbehandlungsprozeß erhält, desto besser kann er gezielt auf den Fehler reagieren. Auch kann er mit dem Routing-Prozeß interagieren, sowohl um aus dem Routing Prozeß Informationen zu gewinnen (z.B. über die Topologie des Netzes) als auch um den Routing Prozeß zu einer Wege-Neuberechnung anzuregen.C) Error handling process In addition to the alive messages, other signals and events can also be added to the error handling process. For example, the error signals of the physical interfaces as described at the beginning. Or any error signals that the router generates internally to monitor its own function. The more information the error handling process receives, the better it can react to the error. He can also interact with the routing process, both to obtain information from the routing process (e.g. about the topology of the network) and to stimulate the routing process to recalculate the route.
In einer praktischen Implementierung in einem modernen Router würde man alive - Erzeugung und - Empfang auf den Line Cards im Datenpfad integrieren. Damit wäre mindestens dieser Teil des Fehlerbehandlungsprozesses verteilt implementiert.In a practical implementation in a modern router, one would integrate alive generation and reception on the line cards in the data path. This would at least implement this part of the error handling process in a distributed manner.
D) Fehlerkommunikation
2003 P 11273D) Error communication 2003 P 11273
5 Die Fehlerbehandlungsprozesse verschiedener Router können zusätzlich zu den Alive-Messages (siehe B) optional auch weitere Informationen zur Fehlerbehandlung austauschen. Dies kann in Form gesonderter Nachrichten (zwischen Nachbar- Routern oder sogar zwischen entfernten Routern) oder eingebettet in die Alive-Messages (zwischen Nachbar-Routern) geschehen. Anwendungen könnten z.B. das Signal von einem Router NK 7 an seinen Nachbar-Router NK 6 sein, NK 6 möge keinen Verkehr mehr an NK 7 zu einem bestimmten Ziel NK 8 senden, da NK 7 eine Unterbrechung seiner Route zu NK 8 festgestellt hat.
5 In addition to the alive messages (see B), the error handling processes of different routers can optionally also exchange further information on error handling. This can take the form of separate messages (between neighboring routers or even between remote routers) or embedded in the alive messages (between neighboring routers). Applications could e.g. the signal from a router NK 7 to its neighboring router NK 6, NK 6 should no longer send traffic to NK 7 to a specific destination NK 8, since NK 7 has detected an interruption in its route to NK 8.