JP2013138290A - Relay device and failure processing method - Google Patents
Relay device and failure processing method Download PDFInfo
- Publication number
- JP2013138290A JP2013138290A JP2011287416A JP2011287416A JP2013138290A JP 2013138290 A JP2013138290 A JP 2013138290A JP 2011287416 A JP2011287416 A JP 2011287416A JP 2011287416 A JP2011287416 A JP 2011287416A JP 2013138290 A JP2013138290 A JP 2013138290A
- Authority
- JP
- Japan
- Prior art keywords
- entry
- packet
- buffer
- empty
- packet buffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、中継装置及び障害処理方法に係り、特に、ネットワーク中継装置と、ネットワーク中継装置に搭載されるパケットバッファの障害処理方法に関する。 The present invention relates to a relay device and a failure processing method, and more particularly to a network relay device and a failure processing method for a packet buffer mounted on the network relay device.
近年、ビジネスや家庭におけるネットワークへの依存度が高まっており、そのネットワークの構成要素であるネットワーク中継装置においてはその高信頼性が求められている。一般的にネットワーク中継装置では中継パケットを格納するバッファ(以下、パケットバッファ)が備えられている。ネットワーク中継装置に入力されたパケットは、一時的にパケットバッファへ格納され、当該装置がパケットを出力する時に、パケットバッファからパケットを取り出して、後段装置へ送出する。つまり、パケットバッファは、このようなネットワーク中継装置においては最頻で使用されるメモリであり、パケットバッファの障害率が、ネットワーク中継装置の信頼性に大きく寄与している。 In recent years, the dependence on networks in businesses and homes has increased, and high reliability is required for network relay devices that are components of the networks. In general, a network relay device is provided with a buffer (hereinafter referred to as a packet buffer) for storing relay packets. The packet input to the network relay device is temporarily stored in the packet buffer, and when the device outputs the packet, the packet is extracted from the packet buffer and sent to the subsequent device. That is, the packet buffer is a memory that is most frequently used in such a network relay device, and the failure rate of the packet buffer greatly contributes to the reliability of the network relay device.
パケットバッファは、一般に共有バッファとして管理される。複数回線から入力されるパケットは、一つのバッファシステムを、仮想的に分割して共有する。共有バッファとして管理されるパケットバッファで障害が発生した際には、全ての回線の通信に対して影響が発生する可能性があるため、安易にパケットバッファの障害によるネットワーク中継装置の障害とは判断せずに、障害を検出した際に処理していたパケットを廃棄しながら継続動作し、極力、ネットワーク中継装置の停止につながらない手法を取る。例えば単位時間あたりのパケットバッファの障害発生回数をモニタして、障害が繰り返すようであれば、ネットワーク中継装置を停止する。しかし、近年のネットワークの高速化・大容量化を受け、パケットバッファ自体の高速化・高集積化は著しく、比例してパケットバッファの障害率は上昇傾向にある。このため、パケットバッファの障害処理方法が装置の高信頼性を目指す中で重要な技術となる。 The packet buffer is generally managed as a shared buffer. Packets input from multiple lines share one buffer system virtually divided. When a failure occurs in a packet buffer managed as a shared buffer, it may affect the communication of all lines, so it is easily determined that the failure of the network relay device due to the failure of the packet buffer Instead, it continues the operation while discarding the packet that was being processed when the failure was detected, and takes a technique that does not cause the network relay device to stop as much as possible. For example, the number of packet buffer failures per unit time is monitored, and if the failure repeats, the network relay device is stopped. However, with the recent increase in the speed and capacity of networks, the speed and integration of the packet buffer itself are remarkable, and the failure rate of the packet buffer tends to increase in proportion. For this reason, the failure processing method of the packet buffer is an important technique in aiming for high reliability of the apparatus.
高速化・高集積化されたパケットバッファの故障は、ソフトエラーとハードエラーの2つのケースに分類される。ソフトエラーとは、中性子線がメモリセルに衝突するなどの理由で、一時的にメモリ内のデータが壊れる故障であり、正しいデータを書き込み直すことで、故障から復旧することができる。ハードエラーとは、物理的なメモリセルの破損などの理由で、永続的にメモリ内のデータが壊れる故障である。 High-speed and highly integrated packet buffer failures are classified into two cases: soft errors and hard errors. The soft error is a failure in which data in the memory is temporarily destroyed due to a neutron beam colliding with a memory cell, and can be recovered from the failure by rewriting correct data. A hard error is a failure in which data in a memory is permanently destroyed due to physical memory cell damage or the like.
ネットワーク中継装置において、パケットが廃棄されることは、想定の範囲内であることが多い。通信システムとしてのデータの到達保証は、ネットワーク中継装置より上位のレイヤで、廃棄されたパケットを再送することで実現される。したがって、ソフトエラーなどによる一時的なパケットバッファの故障は、故障したパケットを廃棄することで、動作を継続させても良い。 In a network relay device, discarding a packet is often within an expected range. Data arrival guarantee as a communication system is realized by retransmitting a discarded packet in a higher layer than the network relay device. Therefore, a temporary packet buffer failure due to a soft error or the like may be continued by discarding the failed packet.
また、共有バッファとして管理されるパケットバッファは、仮想的に複数の回線で共有されている。一般的に、各回線に仮想的に割り当てられたバッファ量を合計すると、パケットバッファの全体の容量よりも大きくなる。これは、全ての回線が同時にパケットバッファを多量に使用することが、統計上、極めて稀であるためである。これをパケットバッファの統計多重効果と呼ぶ。したがって、共有バッファシステムにおいて、ある程度までパケットバッファの領域が破損した場合でも、各回線が利用可能なバッファ量に変わりが無く、通信に影響は無いと想定される。 A packet buffer managed as a shared buffer is virtually shared by a plurality of lines. In general, the total amount of buffers virtually allocated to each line is larger than the entire capacity of the packet buffer. This is because it is statistically rare that all lines use a large amount of packet buffers simultaneously. This is called the statistical multiplexing effect of the packet buffer. Therefore, in the shared buffer system, even if the packet buffer area is damaged to some extent, it is assumed that there is no change in the amount of buffer that can be used by each line, and that communication is not affected.
また、ネットワーク中継装置以外のバッファ障害処理技術としては、特許文献1のような方法がある。特許文献1では、「メモリにおいて、1ビットエラーが生じても、1ビットエラーの発生した部位を含むメモリの一定単位内にあるデータを他の記憶領域に退避させ、エラーの発生したメモリの一定単位領域を無効にすることで、システムのフォルト・トレランスを向上させ、信頼性を向上させる」(要約)ようにしたものである。
As a buffer failure processing technique other than the network relay device, there is a method as described in
ネットワーク中継装置に搭載するパケットバッファの障害処理方法としては、従来はECC等のデータ保護コードを利用して、物理的なバッファ単位で障害を検出し、例えば単位時間あたりの障害発生回数を以ってネットワーク中継装置障害と判定していた。このような場合、当該バッファのある特定領域だけが故障したケースでは、その領域以外は正常動作可能であってもネットワーク中継装置障害に陥っていた。また、マルチキャストパケットのように、パケットバッファの特定領域を複数回に渡り連続で読み出すケースでは、当該領域がソフトエラーにより一時的に故障を引き起こした場合でも、連続して故障したパケットを読み出すことで、複数回の障害を検出してしまうため、ネットワーク中継装置障害に陥っていた。 Conventionally, as a method for handling a failure of a packet buffer mounted on a network relay device, a failure is detected in units of physical buffers using a data protection code such as ECC, and the number of failures occurring per unit time is used. Network relay device failure. In such a case, in the case where only a specific area of the buffer has failed, the network relay apparatus has failed even if the other area can operate normally. Also, in the case where a specific area of the packet buffer is read continuously over multiple times, such as a multicast packet, even if the area causes a temporary failure due to a soft error, The network relay device failure occurred because multiple failures were detected.
また、ネットワーク中継装置以外のバッファ障害処理技術としては、特許文献1のような方法がある。しかし、特許文献1に記載されたメモリ制御方式では、バッファの故障領域を別領域にコピーして退避する間は、当該パケットバッファへのリード・ライトアクセスを中断する必要がある。この手法をネットワーク中継装置のパケットバッファに適用した場合は、パケット中継性能が低下するため必ずしも適当ではない。
As a buffer failure processing technique other than the network relay device, there is a method as described in
本発明は、以下の点に鑑み、ネットワーク中継装置に搭載するパケットバッファにおいて、パケットバッファで発生する障害を、分割したエントリ単位で管理することで、ネットワーク中継装置の障害の発生確率を軽減し、信頼性を高めることを目的とする。 In view of the following points, the present invention reduces the occurrence probability of a failure of the network relay device by managing the failure that occurs in the packet buffer in divided packet units in the packet buffer mounted on the network relay device, The purpose is to increase reliability.
本発明で提供するパケットバッファにおける障害処理方式のひとつの態様によると、以下の構成を備える。即ち、ネットワーク中継装置が受信したパケットを一時的に格納しておくパケットバッファと、前記パケットバッファ領域を分割したエントリ単位で管理するパケットバッファのエントリ管理手段と、前記エントリ単位でパケットの格納から取り出しまでの期間に発生するデータエラーを検出できるデータエラー検出手段と、前記データエラー検出手段で検出したエラー発生回数を前記エントリ単位に記憶するカウンタを備えたエラー発生回数テーブルと、前記エラー発生回数テーブルに記憶された前記エントリ毎のエラー発生回数と予め設定された閾値を比較してエントリ毎の障害を検出する手段と、前記エントリ毎の障害検出手段により検出された障害エントリ数を数えるカウンタと、前記障害エントリ数カウンタが予め設定された閾値と比較することでパケットバッファ障害を検出し上位制御部へ報告する手段と、必要に応じて前記エラー発生回数テーブルと前記障害エントリを数えるカウンタとを出力する手段とを有する。 According to one aspect of the failure handling method in the packet buffer provided by the present invention, the following configuration is provided. That is, a packet buffer for temporarily storing packets received by the network relay device, a packet buffer entry management means for managing the packet buffer area in divided entries, and taking out from the packet storage in entries. A data error detecting means capable of detecting a data error occurring in a period up to and including an error occurrence frequency table having a counter for storing the number of error occurrences detected by the data error detection means in units of entries, and the error occurrence frequency table A means for detecting a failure for each entry by comparing the number of error occurrences for each entry stored in and a preset threshold, and a counter for counting the number of failure entries detected by the failure detection means for each entry; Threshold value in which the failure entry number counter is set in advance A means for reporting the packet buffer failure detected to the host control section by comparison, and means for outputting a counter for counting said fault entry and the error count table as needed.
本発明の第1の解決手段によると、
パケットを中継する中継装置であって、
領域を分割した複数のエントリを含み、各前記エントリに受信パケットを一時的に格納するパケットバッファと、
前記パケットバッファを前記エントリ単位で管理する空きエントリ管理部と、
前記パケットバッファからパケットを取り出し、前記エントリ単位でデータエラーを検出するパケットバッファ制御部と、
前記パケットバッファの各前記エントリに対応した複数のカウンタを含み、前記エントリ毎のデータエラーの発生回数を保持するエラー発生回数テーブルと、
使用可能な空きエントリのエントリ番号をプールするエントリ空きエントリバッファと
を備え、
前記空きエントリ管理部は、送信パケットが格納されたエントリの番号である第1のエントリ番号と、前記送信パケットのデータエラーのチェック結果を、前記パケットバッファ制御部から受け、
前記空きエントリ管理部は、データエラー無しの場合は、前記エラー発生回数テーブルの前記第1のエントリ番号に対応する第1のカウンタを減算する又は0に設定し、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、
前記空きエントリ管理部は、データエラー有りの場合は、前記第1のカウンタを加算し、前記第1のカウンタの値が予め設定されたエラー発生回数閾値未満のとき、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、前記第1のカウンタの値が前記エラー発生回数閾値以上のとき、前記空きエントリバッファに前記第1のエントリ番号がプールされていたら前記第1のエントリ番号を除外し、
前記空きエントリ管理部は、前記空きエントリバッファを参照し、プールされているエントリ番号のいずれかを前記パケットバッファ制御部に通知し、
前記パケットバッファ制御部は、通知された前記エントリ番号の前記エントリに、受信パケットを格納する
中継装置が提供される。
According to the first solution of the present invention,
A relay device for relaying packets,
A packet buffer that includes a plurality of entries divided into regions, and temporarily stores received packets in each of the entries;
A free entry management unit for managing the packet buffer in units of entries;
A packet buffer control unit that extracts a packet from the packet buffer and detects a data error in units of entries;
A plurality of counters corresponding to each of the entries of the packet buffer, and an error occurrence number table for holding the number of occurrences of data errors for each entry;
An entry free entry buffer that pools the entry numbers of available free entries,
The empty entry management unit receives from the packet buffer control unit a first entry number that is an entry number in which a transmission packet is stored and a data error check result of the transmission packet,
When there is no data error, the empty entry management unit subtracts or sets the first counter corresponding to the first entry number in the error occurrence count table to 0, and sets the first entry number as empty. Pool it in the free entry buffer as an entry,
The empty entry management unit increments the first counter when there is a data error, and sets the first entry number when the value of the first counter is less than a preset error occurrence threshold. When the first entry number is pooled in the empty entry buffer as the empty entry buffer and the first counter value is equal to or larger than the error occurrence threshold, the first entry number is pooled in the empty entry buffer. Is excluded,
The empty entry management unit refers to the empty entry buffer and notifies the packet buffer control unit of any of the pooled entry numbers,
The packet buffer control unit is provided with a relay device that stores a received packet in the entry of the notified entry number.
本発明の第2の解決手段によると、
パケットを中継する中継装置における障害処理方法であって、
前記中継装置は、
領域を分割した複数のエントリを含み、各前記エントリに受信パケットを一時的に格納するパケットバッファと、
前記パケットバッファを前記エントリ単位で管理する空きエントリ管理部と、
前記パケットバッファからパケットを取り出し、前記エントリ単位でデータエラーを検出するパケットバッファ制御部と、
前記パケットバッファの各前記エントリに対応した複数のカウンタを含み、前記エントリ毎のデータエラーの発生回数を保持するエラー発生回数テーブルと、
使用可能な空きエントリのエントリ番号をプールするエントリ空きエントリバッファと
を備え、
前記空きエントリ管理部は、送信パケットが格納されたエントリの番号である第1のエントリ番号と、前記送信パケットのデータエラーのチェック結果を、前記パケットバッファ制御部から受け、
前記空きエントリ管理部は、データエラー無しの場合は、前記エラー発生回数テーブルの前記第1のエントリ番号に対応する第1のカウンタを減算する又は0に設定し、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、
前記空きエントリ管理部は、データエラー有りの場合は、前記第1のカウンタを加算し、前記第1のカウンタの値が予め設定されたエラー発生回数閾値未満のとき、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、前記第1のカウンタの値が前記エラー発生回数閾値以上のとき、前記空きエントリバッファに前記第1のエントリ番号がプールされていたら前記第1のエントリ番号を除外し、
前記空きエントリ管理部は、前記空きエントリバッファを参照し、プールされているエントリ番号のいずれかを前記パケットバッファ制御部に通知し、
前記パケットバッファ制御部は、通知された前記エントリ番号の前記エントリに、受信パケットを格納する
障害処理方法が提供される。
According to the second solution of the present invention,
A failure processing method in a relay device that relays packets,
The relay device is
A packet buffer that includes a plurality of entries divided into regions, and temporarily stores received packets in each of the entries;
A free entry management unit for managing the packet buffer in units of entries;
A packet buffer control unit that extracts a packet from the packet buffer and detects a data error in units of entries;
A plurality of counters corresponding to each of the entries of the packet buffer, and an error occurrence number table for holding the number of occurrences of data errors for each entry;
An entry free entry buffer that pools the entry numbers of available free entries,
The empty entry management unit receives from the packet buffer control unit a first entry number that is an entry number in which a transmission packet is stored and a data error check result of the transmission packet,
When there is no data error, the empty entry management unit subtracts or sets the first counter corresponding to the first entry number in the error occurrence count table to 0, and sets the first entry number as empty. Pool it in the free entry buffer as an entry,
The empty entry management unit increments the first counter when there is a data error, and sets the first entry number when the value of the first counter is less than a preset error occurrence threshold. When the first entry number is pooled in the empty entry buffer as the empty entry buffer and the first counter value is equal to or larger than the error occurrence threshold, the first entry number is pooled in the empty entry buffer. Is excluded,
The empty entry management unit refers to the empty entry buffer and notifies the packet buffer control unit of any of the pooled entry numbers,
The packet buffer control unit is provided with a failure processing method for storing a received packet in the entry of the notified entry number.
本発明により、ネットワーク中継装置に搭載するパケットバッファにおいて、パケットバッファで発生する障害を、分割したエントリ単位で管理することで、ネットワーク中継装置の障害の発生確率を軽減することができ、信頼性を高めることができる。 According to the present invention, in the packet buffer mounted on the network relay device, the failure occurring in the packet buffer is managed in divided entry units, so that the probability of failure of the network relay device can be reduced and the reliability is improved. Can be increased.
以下に、本発明の実施形態について図面に基づいて詳細に説明する。
図1は、本発明の実施の形態を示すブロック図である。
図1において、ネットワーク中継装置1は、パケットバッファ10と、パケットバッファ制御部20と、エントリ管理部30と、ネットワーク中継装置1の各種動作を制御する制御部40を備える。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a block diagram showing an embodiment of the present invention.
In FIG. 1, the
パケットバッファ10は、ネットワーク中継装置1が受信したパケットを一時的に格納するバッファであり、そのバッファ領域をN個のエントリに分割して管理され、各エントリにはそれぞれネットワーク中継装置1が受信したパケットデータが格納される。なお以降の説明では、分割されたエントリ領域を「E(0)〜E(N−1)(Nは2以上の整数)」と表す。
パケットバッファ制御部20は、データエラー検出部201と、パケット受信部202と、パケット送信部203を有する。
The
The packet
パケット受信部202は、受信したパケットをパケットバッファ10へ格納するためのエントリ番号をエントリ管理部30から受け取り、データエラー検出部201に対して当該エントリ番号へパケットを格納する指示(パケット格納指示)を出す。データエラー検出部201は、パケット受信部202から前述のパケット格納指示を受け取り、当該パケットにデータ保護コードを付与してパケットバッファ10に格納する。ネットワーク中継装置1がパケットを送信する場合は、データエラー検出部201は、パケットバッファ10から送信パケットを取り出してパケット送信部203へ送信する。また、データエラー検出部201は、パケットバッファ10からパケットを取り出した時に、当該パケットデータに付与されているデータ保護コードを使ってデータエラーをチェックし、そのチェック結果をパケット送信部203へ送信する。パケット送信部203は、データエラー検出部201から送信パケットと、送信パケットが格納されていたパケットバッファエントリ番号と、データエラーのチェック結果を受け取り、データエラーのチェック結果がエラーであった場合には、送信パケットを廃棄し、それ以外の場合は、送信パケットを出力回線へ送信する。また、パケット送信部203は、データエラー検出部201から受け取ったエントリ番号とデータエラー検出結果をエントリ管理部30へ転送する。
The
エントリ管理部30は、空きエントリ管理部301と、エラー発生回数テーブル302と、エラー発生回数閾値レジスタ303と、障害エントリ数カウンタ304と、障害エントリ数閾値レジスタ305と、空きエントリバッファ306を有する。
空きエントリ管理部301は、ネットワーク中継装置1が受信したパケットをパケットバッファ10へ格納する時のエントリ番号をパケット受信部202へ指示する。またネットワーク中継装置1がパケットを送信する場合は、パケット送信部203から送信パケットが格納されていたエントリ番号と当該エントリからパケットを取り出した時のデータエラーチェック結果を受け取る。エラー発生回数テーブル302は、パケットバッファ10のエントリ数と同数のN個のカウンタを備えており、パケットバッファ10のエントリ毎のエラー発生回数を保持する。なお以降の説明では、このカウンタをそれぞれC(0)〜C(N−1)(Nは2以上の整数)と表す。エラー発生回数閾値レジスタ303は、制御部40によって予め閾値が設定されるレジスタであり、この閾値は、空きエントリ管理部301により、エラー発生回数テーブル302のカウンタC(0)〜C(N−1)に保持されている値と比較される。エラー発生回数テーブル302、エラー発生回数閾値レジスタ303の動作については、後述する図3の説明で詳細に記載する。障害エントリ数カウンタ304は、エラー発生回数テーブル302のカウンタ値と、エラー発生回数閾値レジスタ303に設定された閾値の比較結果、この閾値を越えたエントリ数を保持するカウンタである。カウンタは、制御部40によって予め値が設定される障害エントリ数閾値レジスタ305の閾値と比較される。障害エントリ数カウンタ304、障害エントリ数閾値レジスタ305の動作については、後述する図4の説明で詳細に記載する。
The
The empty
制御部40は、パケットバッファ10と、パケットバッファ制御部20と、エントリ管理部30に接続されており、エラー発生回数閾値レジスタ303と障害エントリ数閾値レジスタ305の各閾値を設定し、必要に応じて障害発生数カウンタ302と障害エントリ数カウンタ304の内容を読み出す機能を有する。また、制御部40は、空きエントリ管理部301からパケットバッファ10の障害通知を受けたときに、パケットバッファ10の閉塞処理を実施する。
The
図2は、ネットワーク中継処理装置1のパケット送信処理のフローチャートである。本フローチャート以降では、一例として送信パケットがパケットバッファ10のエントリ番号M(Mは、パケットバッファ10を分割したエントリ番号0〜N−1の一つ)に格納されているケースを説明する。
最初のステップS200では、データエラー検出部201が、パケットが格納されているエントリ番号Mからパケットデータを取り出し、当該パケットデータに付与されているデータ保護コードを使ってそのデータエラーをチェックする。次にステップS201で、パケット送信部203が、データエラーのチェック結果がエラーか否かを判定し、エラーを検出しなかった場合はステップS202に遷移し、送信パケットを出力回線へ送信し、一方、エラーを検出した場合はステップS203に遷移し、送信パケットを出力回線へ送信せずに廃棄する。その後、パケット送信部203は、ステップS204でエントリ番号Mとデータエラー検出結果をエントリ管理部30へ送信する。
FIG. 2 is a flowchart of packet transmission processing of the network
In the first step S200, the data
図3は、エントリ管理部30の処理について説明するフローチャートである。
最初のステップS301では、空きエントリ管理部301が、パケット送信部203から受け取ったエントリ番号Mのデータエラーチェック結果がエラーであるか否かを判定する。エラーではなかった場合はステップS302に遷移し、空きエントリ管理部301は、エラー発生回数テーブル302のエントリ番号Mに対応するカウンタC(M)を減算するか、あるいは0を設定する。なお、減算するか、又は0を設定するかは、制御部40等により、予め定めておくことができる。その後、ステップS305で、空きエントリ管理部301は、当該エントリ番号Mを空きエントリとしてプールする。なお、ステップS305でプールされた空きエントリは、空きエントリ管理部が有する空きエントリバッファ306に格納され、別パケットを格納するために再利用する。また、ステップS301の判定においてデータエラーありだった場合はステップS303に遷移し、空きエントリ管理部301は、カウンタC(M)の値に1を加えて書き戻す。その後、空きエントリ管理部301は、ステップS304で、カウンタC(M)の値と、制御部40によって予め設定されたエラー発生回数閾値レジスタ303の閾値とを比較し、カウンタC(M)の値がエラー発生回数閾値レジスタ303の閾値未満だった場合はステップS305に遷移して、当該エントリ番号Mを空きエントリとして空きエントリバッファ306にプールする。また、ステップS304の判定で、カウンタC(M)の値がエラー発生回数閾値レジスタ303の閾値以上だった場合は、空きエントリ管理部301は、ステップS306に遷移し、障害エントリ数カウンタ304に1を加算する。ステップS307では、エントリ番号Mが空きエントリバッファ306にプールされていたらそこから除外する。ここで、ステップS306及びS307に遷移した場合のエントリは空きエントリとして空きエントリバッファ306にプールされないため再利用されず、ネットワーク中継装置1としては、空きエントリ管理部301により当該エントリを除外して運用継続することができる。
FIG. 3 is a flowchart for explaining processing of the
In first step S301, the empty
再利用されるエントリでソフトエラーが発生していた場合には、再利用する際に正常なデータをライトされることで、一時的な障害から復旧する。すなわち、この場合、例えば、1回目のエラーでは、ステップS301→ステップS303→ステップS304→ステップS305という処理手順となる。また、2回目又はエラー発生回数閾値レジスタ303の閾値未満でエラーが復旧した場合は、ステップS301→ステップS302→ステップS305の処理手順となる。再利用されるエントリでハードエラーが発生していた場合には、再利用する際に正常なデータをライトしても、障害から復旧せず、最終的には、カウンタC(M)の値がエラー発生回数閾値レジスタ303の閾値以上となる。すなわち、エラー発生回数閾値レジスタ303の閾値以上の回数のエラーの際は、ステップS301→ステップS303→ステップS304→ステップS306→ステップS307の処理手順となる。
If a soft error has occurred in the entry to be reused, normal data is written when the entry is reused to recover from a temporary failure. That is, in this case, for example, in the first error, the processing procedure is step S301 → step S303 → step S304 → step S305. Further, when the error is recovered at the second time or less than the threshold value of the error occurrence
つまり、エラー発生回数閾値レジスタ303とは、ソフトエラーとハードエラーとを切り分けるための閾値とすることができる。そして、空きエントリバッファ306には、ハードエラーが発生していないエントリ番号がプールされる。
また、エラー発生回数閾値レジスタ303の閾値の回数だけパケットバッファ10を再利用するよう試行するため、エラー発生回数閾値レジスタ303の閾値の回数だけパケットを廃棄する可能性がある。しかし、エラー発生回数閾値レジスタ303の閾値を、予めネットワーク中継装置として想定しているパケット廃棄数以下に設定することで、通信システムに影響を与えないことが可能である。
In other words, the error occurrence
Further, since the
図4は、パケットバッファ10の障害判定処理のフローチャートである。
最初のステップS401では、空きエントリ管理部301は、障害エントリ数カウンタ304の値と、制御部40によって予め設定された障害エントリ数閾値レジスタ305の閾値を比較し、カウンタ304がこの閾値より少ない場合は再度ステップS401を実施し、それ以外の場合にステップS402へ遷移する。ステップS402では、空きエントリ管理部301は、制御部40にパケットバッファ障害を通知し、これを受けて制御部40がパケットバッファ10を閉塞する。
FIG. 4 is a flowchart of the failure determination process of the
In the first step S401, the empty
したがって、パケットバッファ10の障害は、その領域を分割したエントリ単位で管理されるため、例えばパケットバッファ領域の一部故障が発生した場合は、当該エントリを除外してネットワーク中継装置の運用を継続することができる。具体的には、空きエントリ管理部301は、空きエントリバッファ306を参照して、ハードエラーが発生していないエントリ・使用可能なエントリを取得することができ、パケット受信部202に取得したエントリ番号を通知する。
Accordingly, since the failure of the
共有バッファとして管理されるパケットバッファ10では複数の回線で一つの大容量バッファを共有するため、そのパケットバッファ10の一部のエントリを除外してネットワーク中継装置を運用しても、複数の回線に仮想的に割り当てられたバッファ量が変わらない限り、通信システムに影響を与えないようにすることが可能である。
また、制御部40は、ネットワーク中継装置1において、必要に応じてエラー発生回数テーブル302の内容、及び/又は、障害エントリ数カウンタ304の内容を出力する機能を備え、各内容を出力又は表示するようにしてもよい。
Since the
In addition, the
本発明は、パケット、データを中継するルータ、ノード装置等の各種中継装置に適用することができる。 The present invention can be applied to various relay devices such as routers and node devices that relay packets and data.
1:ネットワーク中継装置
10:パケットバッファ
20:パケットバッファ制御部
201:データエラー検出部
202:パケット受信部
203:パケット送信部
30:エントリ管理部
301:空きエントリ管理部
302:エラー発生回数テーブル
303:エラー発生回数閾値レジスタ
304:障害エントリ数カウンタ
305:障害エントリ数閾値レジスタ
40:制御部
1: Network relay device 10: Packet buffer 20: Packet buffer control unit 201: Data error detection unit 202: Packet reception unit 203: Packet transmission unit 30: Entry management unit 301: Empty entry management unit 302: Error occurrence count table 303: Error occurrence threshold register 304: Failure entry number counter 305: Failure entry number threshold register 40: Control unit
Claims (10)
領域を分割した複数のエントリを含み、各前記エントリに受信パケットを一時的に格納するパケットバッファと、
前記パケットバッファを前記エントリ単位で管理する空きエントリ管理部と、
前記パケットバッファからパケットを取り出し、前記エントリ単位でデータエラーを検出するパケットバッファ制御部と、
前記パケットバッファの各前記エントリに対応した複数のカウンタを含み、前記エントリ毎のデータエラーの発生回数を保持するエラー発生回数テーブルと、
使用可能な空きエントリのエントリ番号をプールするエントリ空きエントリバッファと
を備え、
前記空きエントリ管理部は、送信パケットが格納されたエントリの番号である第1のエントリ番号と、前記送信パケットのデータエラーのチェック結果を、前記パケットバッファ制御部から受け、
前記空きエントリ管理部は、データエラー無しの場合は、前記エラー発生回数テーブルの前記第1のエントリ番号に対応する第1のカウンタを減算する又は0に設定し、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、
前記空きエントリ管理部は、データエラー有りの場合は、前記第1のカウンタを加算し、前記第1のカウンタの値が予め設定されたエラー発生回数閾値未満のとき、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、前記第1のカウンタの値が前記エラー発生回数閾値以上のとき、前記空きエントリバッファに前記第1のエントリ番号がプールされていたら前記第1のエントリ番号を除外し、
前記空きエントリ管理部は、前記空きエントリバッファを参照し、プールされているエントリ番号のいずれかを前記パケットバッファ制御部に通知し、
前記パケットバッファ制御部は、通知された前記エントリ番号の前記エントリに、受信パケットを格納する
中継装置。
A relay device for relaying packets,
A packet buffer that includes a plurality of entries divided into regions, and temporarily stores received packets in each of the entries;
A free entry management unit for managing the packet buffer in units of entries;
A packet buffer control unit that extracts a packet from the packet buffer and detects a data error in units of entries;
A plurality of counters corresponding to each of the entries of the packet buffer, and an error occurrence number table for holding the number of occurrences of data errors for each entry;
An entry free entry buffer that pools the entry numbers of available free entries,
The empty entry management unit receives from the packet buffer control unit a first entry number that is an entry number in which a transmission packet is stored and a data error check result of the transmission packet,
When there is no data error, the empty entry management unit subtracts or sets the first counter corresponding to the first entry number in the error occurrence count table to 0, and sets the first entry number as empty. Pool it in the free entry buffer as an entry,
The empty entry management unit increments the first counter when there is a data error, and sets the first entry number when the value of the first counter is less than a preset error occurrence threshold. When the first entry number is pooled in the empty entry buffer as the empty entry buffer and the first counter value is equal to or larger than the error occurrence threshold, the first entry number is pooled in the empty entry buffer. Is excluded,
The empty entry management unit refers to the empty entry buffer and notifies the packet buffer control unit of any of the pooled entry numbers,
The packet buffer control unit is a relay device that stores a received packet in the entry of the notified entry number.
前記パケットバッファ制御部は、
受信パケットを前記パケットバッファへ格納するためのパケット受信部と、
前記パケットバッファに前記受信パケットを格納するデータエラー検出部と
を備え、
前記空きエントリ管理部は、前記受信パケットを前記パケットバッファへ格納する時の前記エントリ番号を前記パケット受信部へ指示し、
前記パケット受信部は、前記受信パケットを前記パケットバッファへ格納するための前記エントリ番号を前記空きエントリ管理部から受け取り、前記データエラー検出部に対して前記エントリ番号へパケットを格納する指示を出し、
前記データエラー検出部は、前記パケット受信部からパケット格納指示を受け取り、前記受信パケットにデータ保護コードを付与して前記パケットバッファに格納する
ことを特徴とする中継装置。
The relay device according to claim 1,
The packet buffer control unit
A packet receiver for storing received packets in the packet buffer;
A data error detector that stores the received packet in the packet buffer;
The empty entry management unit instructs the packet reception unit on the entry number when storing the received packet in the packet buffer,
The packet receiving unit receives the entry number for storing the received packet in the packet buffer from the empty entry management unit, and issues an instruction to store the packet to the entry number to the data error detection unit,
The relay apparatus according to claim 1, wherein the data error detection unit receives a packet storage instruction from the packet reception unit, adds a data protection code to the received packet, and stores the received packet in the packet buffer.
前記パケットバッファ制御部は、
前記パケットバッファから送信パケットを取り出すデータエラー検出部と、
前記データエラー検出部から前記送信パケットを受け取り、前記送信パケットを出力回線へ送信する又は前記送信パケットを廃棄するパケット送信部と
を備え、
前記データエラー検出部が、前記パケットバッファの前記第1のエントリ番号のエントリから送信パケットを取り出し、前記送信パケットに付与されているデータ保護コードを使ってデータエラーをチェックし、チェック結果を前記パケット送信部へ送信し、
前記パケット送信部は、前記チェック結果に基づき、データエラーを検出しなかった場合は前記送信パケットを出力回線へ送信し、データエラーを検出した場合は前記送信パケットを出力回線へ送信せずに廃棄し、
パケット送信部は、前記第1のエントリ番号とデータエラーのチェック結果を前記空きエントリ管理部へ送信する
ことを特徴とする中継装置。
The relay device according to claim 1 or 2,
The packet buffer control unit
A data error detection unit for extracting a transmission packet from the packet buffer;
A packet transmission unit that receives the transmission packet from the data error detection unit and transmits the transmission packet to an output line or discards the transmission packet;
The data error detection unit extracts a transmission packet from the entry of the first entry number in the packet buffer, checks a data error using a data protection code attached to the transmission packet, and outputs a check result to the packet Send to the transmitter,
The packet transmission unit transmits the transmission packet to the output line when no data error is detected based on the check result, and discards the transmission packet without transmitting to the output line when the data error is detected. And
The packet transmission unit transmits the first entry number and the data error check result to the empty entry management unit.
前記パケットバッファとして使用しないエントリの数を保持する障害エントリ数カウンタをさらに備え、
前記空きエントリ管理部は、前記第1のカウンタの値が前記エラー発生回数閾値以上のとき、前記障害エントリ数カウンタを加算し、
前記空きエントリ管理部は、前記障害エントリ数カウンタが予め定められた障害エントリ数閾値以上の場合に、前記パケットバッファを閉塞する障害通知を出力する
ことを特徴とする中継装置。
The relay device according to any one of claims 1 to 3,
A failure entry number counter that holds the number of entries not used as the packet buffer;
The empty entry management unit adds the failure entry number counter when the value of the first counter is equal to or greater than the error occurrence number threshold,
The relay apparatus, wherein the empty entry management unit outputs a failure notification for closing the packet buffer when the failure entry number counter is equal to or greater than a predetermined failure entry number threshold.
前記空きエントリ管理部から前記パケットバッファを閉塞する障害通知を受けたときに、前記パケットバッファの閉塞処理を実施する制御部をさらに備えたことを特徴とする中継装置。
The relay device according to claim 4,
A relay apparatus, further comprising a control unit that performs a blocking process of the packet buffer when a failure notification for blocking the packet buffer is received from the empty entry management unit.
前記障害エントリ数閾値を設定するための制御部をさらに備えたことを特徴とする中継装置。
The relay device according to claim 4,
The relay apparatus further comprising a control unit for setting the failure entry number threshold.
前記エラー発生回数閾値を設定するための制御部をさらに備えたことを特徴とする中継装置。
The relay device according to any one of claims 1 to 4,
The relay apparatus further comprising a control unit for setting the error occurrence frequency threshold.
前記エラー発生回数閾値は、ソフトエラーとハードエラーとを切り分けるための閾値が設定されることを特徴とする中継装置。
The relay device according to any one of claims 1 to 7,
The relay apparatus according to claim 1, wherein the error occurrence frequency threshold is set to a threshold for separating a soft error and a hard error.
さらに、前記エラー発生回数テーブルの内容、及び/又は、前記障害エントリ数カウンタの内容を出力又は表示する機能を備えたことを特徴とする中継装置。
A relay device according to any one of claims 1 to 8,
The relay apparatus further comprises a function of outputting or displaying the contents of the error occurrence number table and / or the contents of the failure entry number counter.
前記中継装置は、
領域を分割した複数のエントリを含み、各前記エントリに受信パケットを一時的に格納するパケットバッファと、
前記パケットバッファを前記エントリ単位で管理する空きエントリ管理部と、
前記パケットバッファからパケットを取り出し、前記エントリ単位でデータエラーを検出するパケットバッファ制御部と、
前記パケットバッファの各前記エントリに対応した複数のカウンタを含み、前記エントリ毎のデータエラーの発生回数を保持するエラー発生回数テーブルと、
使用可能な空きエントリのエントリ番号をプールするエントリ空きエントリバッファと
を備え、
前記空きエントリ管理部は、送信パケットが格納されたエントリの番号である第1のエントリ番号と、前記送信パケットのデータエラーのチェック結果を、前記パケットバッファ制御部から受け、
前記空きエントリ管理部は、データエラー無しの場合は、前記エラー発生回数テーブルの前記第1のエントリ番号に対応する第1のカウンタを減算する又は0に設定し、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、
前記空きエントリ管理部は、データエラー有りの場合は、前記第1のカウンタを加算し、前記第1のカウンタの値が予め設定されたエラー発生回数閾値未満のとき、前記第1のエントリ番号を空きエントリとして前記空きエントリバッファにプールし、前記第1のカウンタの値が前記エラー発生回数閾値以上のとき、前記空きエントリバッファに前記第1のエントリ番号がプールされていたら前記第1のエントリ番号を除外し、
前記空きエントリ管理部は、前記空きエントリバッファを参照し、プールされているエントリ番号のいずれかを前記パケットバッファ制御部に通知し、
前記パケットバッファ制御部は、通知された前記エントリ番号の前記エントリに、受信パケットを格納する
障害処理方法。 A failure processing method in a relay device that relays packets,
The relay device is
A packet buffer that includes a plurality of entries divided into regions, and temporarily stores received packets in each of the entries;
A free entry management unit for managing the packet buffer in units of entries;
A packet buffer control unit that extracts a packet from the packet buffer and detects a data error in units of entries;
A plurality of counters corresponding to each of the entries of the packet buffer, and an error occurrence number table for holding the number of occurrences of data errors for each entry;
An entry free entry buffer that pools the entry numbers of available free entries,
The empty entry management unit receives from the packet buffer control unit a first entry number that is an entry number in which a transmission packet is stored and a data error check result of the transmission packet,
When there is no data error, the empty entry management unit subtracts or sets the first counter corresponding to the first entry number in the error occurrence count table to 0, and sets the first entry number as empty. Pool it in the free entry buffer as an entry,
The empty entry management unit increments the first counter when there is a data error, and sets the first entry number when the value of the first counter is less than a preset error occurrence threshold. When the first entry number is pooled in the empty entry buffer as the empty entry buffer and the first counter value is equal to or larger than the error occurrence threshold, the first entry number is pooled in the empty entry buffer. Is excluded,
The empty entry management unit refers to the empty entry buffer and notifies the packet buffer control unit of any of the pooled entry numbers,
The packet buffer control unit is a failure processing method for storing a received packet in the entry of the notified entry number.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011287416A JP5651576B2 (en) | 2011-12-28 | 2011-12-28 | Relay device and failure processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011287416A JP5651576B2 (en) | 2011-12-28 | 2011-12-28 | Relay device and failure processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013138290A true JP2013138290A (en) | 2013-07-11 |
JP5651576B2 JP5651576B2 (en) | 2015-01-14 |
Family
ID=48913690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011287416A Active JP5651576B2 (en) | 2011-12-28 | 2011-12-28 | Relay device and failure processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5651576B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019A (en) * | 1851-04-01 | Improvement in machines for cutting screws on bedstead-rails | ||
JP2008250671A (en) * | 2007-03-30 | 2008-10-16 | Yokogawa Electric Corp | Information processor and information processing method |
JP2010170462A (en) * | 2009-01-26 | 2010-08-05 | Nec Computertechno Ltd | Fault handling device and method |
JP2011141690A (en) * | 2010-01-06 | 2011-07-21 | Fujitsu Ltd | Buffer memory device and buffering method |
JP2012108726A (en) * | 2010-11-17 | 2012-06-07 | Nec Computertechno Ltd | Failure processing device, information processing device using the same, and failure processing method for information processing device |
-
2011
- 2011-12-28 JP JP2011287416A patent/JP5651576B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019A (en) * | 1851-04-01 | Improvement in machines for cutting screws on bedstead-rails | ||
JP2008250671A (en) * | 2007-03-30 | 2008-10-16 | Yokogawa Electric Corp | Information processor and information processing method |
JP2010170462A (en) * | 2009-01-26 | 2010-08-05 | Nec Computertechno Ltd | Fault handling device and method |
JP2011141690A (en) * | 2010-01-06 | 2011-07-21 | Fujitsu Ltd | Buffer memory device and buffering method |
JP2012108726A (en) * | 2010-11-17 | 2012-06-07 | Nec Computertechno Ltd | Failure processing device, information processing device using the same, and failure processing method for information processing device |
Also Published As
Publication number | Publication date |
---|---|
JP5651576B2 (en) | 2015-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5303302A (en) | Network packet receiver with buffer logic for reassembling interleaved data packets | |
KR101334240B1 (en) | System for transferring data only in one direction | |
CN107451012B (en) | Data backup method and stream computing system | |
US20070271468A1 (en) | Method and Apparatus for Maintaining Data Integrity When Switching Between Different Data Protection Methods | |
US10862786B2 (en) | Method and device for fingerprint based status detection in a distributed processing system | |
US7864790B2 (en) | Method and apparatus for improving the management of data packets | |
JP4844632B2 (en) | Bus station and system and method for maintaining bus station synchronization | |
CN102135925B (en) | Method and device for detecting error check and correcting memory | |
US7924737B2 (en) | Signal degrade detecting method, signal restoration detecting method, devices for those methods, and traffic transmission system | |
CN104518914B (en) | Link switch-over method and equipment | |
US20070230469A1 (en) | Transmission apparatus | |
US20140107863A1 (en) | Vehicle Control Device, Vehicle Control System | |
US20060187932A1 (en) | Method and system for transmitting telegrams | |
US20120096310A1 (en) | Redundancy logic | |
US20140298148A1 (en) | Trend-analysis scheme for reliably reading data values from memory | |
JP5651576B2 (en) | Relay device and failure processing method | |
US9929899B2 (en) | Snapshot message | |
US11005609B2 (en) | Apparatus and method for avoiding deterministic blanking of secure traffic | |
JP2019176263A (en) | Transmission/reception system, data reception device, and data reception method | |
US20050083837A1 (en) | Transmission system | |
US11704180B2 (en) | Method, electronic device, and computer product for storage management | |
US7337371B2 (en) | Method and apparatus to handle parity errors in flow control channels | |
WO2014115289A1 (en) | Programmable device and electronic syst em device | |
JP3190214B2 (en) | Data transmission / reception system | |
JP2007267051A (en) | Packet receiving circuit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5651576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |