JP6022948B2 - Management device and program for control device of communication network - Google Patents
Management device and program for control device of communication network Download PDFInfo
- Publication number
- JP6022948B2 JP6022948B2 JP2013002053A JP2013002053A JP6022948B2 JP 6022948 B2 JP6022948 B2 JP 6022948B2 JP 2013002053 A JP2013002053 A JP 2013002053A JP 2013002053 A JP2013002053 A JP 2013002053A JP 6022948 B2 JP6022948 B2 JP 6022948B2
- Authority
- JP
- Japan
- Prior art keywords
- control device
- control
- devices
- management
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、ネットワークの制御技術に関する。 The present invention relates to a network control technique.
ネットワークの制御として、オープンフロー技術が注目されている。オープンフロー技術を利用したネットワークは、パケットの処理を行う通信装置であるスイッチ装置と、スイッチ装置が新たなフローに属するパケットを受信した場合、このフローの経路を決定し、決定した経路上の各通信装置に、当該パケットの出力インタフェースを通知して、フローテーブルを更新させる制御装置と、を備えている。なお、フローテーブルとは、パケットがどのフローに属するかを特定するための情報と、そのフローに属するパケットの出力インタフェースとの対応関係を示すテーブルである。 Open flow technology has attracted attention as a network control. When a network using OpenFlow technology receives a packet belonging to a new flow and a switch device that is a communication device that processes packets, the route of this flow is determined, and each route on the determined route is determined. And a control device that notifies the communication device of the output interface of the packet and updates the flow table. The flow table is a table showing the correspondence between information for specifying which flow a packet belongs to and the output interface of the packet belonging to the flow.
ここで、制御装置が障害となると、当該制御装置により出力インタフェースを通知されるスイッチ装置では、新規フローに属するパケットの転送ができなくなる。このため、特許文献1は、複数の制御装置が、それぞれ、独立してフローの経路を計算して、各経路上のスイッチ装置に対して、新規フローに属するパケットの出力インタフェースを通知する構成を開示している。特許文献1に記載の方法においては、スイッチ装置は、1つ以上の制御装置からそれぞれ出力インタフェースの指示を受け取る場合があるが、スイッチ装置は、最初に受け取った指示に従いパケットを転送する。
Here, when the control device becomes faulty, the switch device notified of the output interface by the control device cannot transfer the packet belonging to the new flow. For this reason,
特許文献1に記載の方法では、スイッチ装置は、複数の制御装置からフローテーブルの更新の指示を受け取るため、スイッチ装置の負荷が一時的に高くなってしまう。また、各制御装置が独立してフローの経路を決定するため、選択されなかった経路上のスイッチ装置においては、使用されないフローの情報がフローテーブルに残ることになる。
In the method described in
ここで、特許文献1とは異なり、複数の制御装置を設けるが、複数の制御装置が同じスイッチ装置を制御するのではなく、1つのスイッチ装置は1つの制御装置のみによって制御される構成を考える。この場合、ある制御装置が障害となった場合、この制御装置が制御していたスイッチ装置の制御を他の制御装置に速やかに引き継がせる必要がある。このとき、どの様に制御装置の障害を監視するのかと、障害となった制御装置が制御していたスイッチ装置の制御を引き継ぐ制御装置をどの様に決定するのかが問題となる。
Here, unlike
本発明は、上記問題に鑑み、制御装置の障害を監視できる管理装置と、障害となった制御装置が制御していた通信装置の制御を他の制御装置に引き継がせることができる管理装置及びプログラムを提供するものである。 In view of the above problems, the present invention provides a management device that can monitor a failure of a control device, and a management device and program that can cause another control device to take over control of a communication device controlled by the failed control device Is to provide.
本発明の一態様によると、ネットワークに属する通信装置を複数のグループにグループ化し、前記複数のグループにそれぞれ対応する複数の制御装置を設け、各制御装置は対応するグループの通信装置を制御する通信システムにおいて、前記複数の制御装置を管理する管理装置は、前記複数の制御装置の障害状態を、前記複数の制御装置が前記管理装置に送信する、送信元の制御装置が正常であることを示す第1信号に基づき判定する判定手段と、障害状態となった制御装置に対応するグループの通信装置の制御を引き継ぐ1つ以上の制御装置を、前記複数の制御装置の負荷状態を示す負荷値に基づき選択する選択手段と、前記選択手段が選択した引継先の制御装置に、前記障害状態となった制御装置に対応するグループの通信装置の制御を引き継ぐことを通知する通知手段と、を備えており、前記判定手段は、前記複数の制御装置の内の第1の制御装置から前記第1信号を受信しないと、前記複数の制御装置の内の前記第1の制御装置とは異なる第2の制御装置、或いは、前記第1の制御装置に対応するグループの通信装置に接続するホスト装置を利用して前記第1の制御装置が障害状態であるか否かを判定することを特徴とする。
According to one aspect of the present invention, communication devices belonging to a network are grouped into a plurality of groups, a plurality of control devices corresponding to the plurality of groups are provided, and each control device controls a communication device of a corresponding group. in the system, the management apparatus that manages the plurality of control devices indicates that a fault condition of said plurality of control devices, said plurality of control apparatus transmits to the management apparatus, the transmission source of the control device is normal The determination means for determining based on the first signal, and one or more control devices that take over control of the communication devices of the group corresponding to the control device in the failed state are set to load values indicating the load states of the plurality of control devices. A selection unit that selects based on the control unit that is selected by the selection unit, and controls the communication devices of the group corresponding to the control unit that has entered the failure state. And notifying means for notifying that splicing can, and wherein the determination means does not receive the first signal from the first controller of the plurality of control devices, among the plurality of control devices The first control device is in a failure state using a second control device different from the first control device or a host device connected to a communication device of a group corresponding to the first control device. It is characterized by determining whether or not there is .
本発明の一態様によると、ネットワークに属する通信装置を複数のグループにグループ化し、前記複数のグループにそれぞれ対応する複数の制御装置を設け、各制御装置は対応するグループの通信装置を制御する通信システムにおいて、前記複数の制御装置を管理する管理装置であって、前記複数の制御装置の内の第1の制御装置から正常であることを示す信号を受信しないと、前記複数の制御装置の内の第1の制御装置以外の第2の制御装置に、前記第1の制御装置の生存確認依頼を行い、前記第2の制御装置から受信する報告において示される前記第1の制御装置が正常であるとする数と、異常であるとする数に基づき、前記第1の制御装置が障害状態であるか否かを判定する判定手段を備えていることを特徴とする。
According to one aspect of the present invention, communication devices belonging to a network are grouped into a plurality of groups, a plurality of control devices corresponding to the plurality of groups are provided, and each control device controls a communication device of a corresponding group. In the system, a management device that manages the plurality of control devices, and if a signal indicating normality is not received from a first control device among the plurality of control devices, The second control device other than the first control device is requested to confirm the existence of the first control device, and the first control device indicated in the report received from the second control device is normal. It is characterized by comprising determination means for determining whether or not the first control device is in a failure state based on the number that is present and the number that is abnormal.
本発明の一態様によると、ネットワークに属する通信装置を複数のグループにグループ化し、前記複数のグループにそれぞれ対応する複数の制御装置を設け、各制御装置は対応するグループの通信装置を制御する通信システムにおいて、前記複数の制御装置を管理する管理装置であって、前記複数の制御装置の内の第1の制御装置から正常であることを示す信号を受信しないと、前記第1の制御装置に対応するグループの通信装置に接続するホスト装置に対して返答を求める生存確認信号を送信し、送信した生存確認信号と、前記生存確認信号に対する応答の数とに基づき、前記第1の制御装置が障害状態であるか否かを判定する判定手段を備えていることを特徴とする。 According to one aspect of the present invention, communication devices belonging to a network are grouped into a plurality of groups, a plurality of control devices corresponding to the plurality of groups are provided, and each control device controls a communication device of a corresponding group. In the system, if the management device manages the plurality of control devices and does not receive a normal signal from the first control device among the plurality of control devices, the first control device The first control device transmits a survival confirmation signal for requesting a response to the host device connected to the communication device of the corresponding group, and the first control device is based on the transmitted survival confirmation signal and the number of responses to the survival confirmation signal. It is characterized by comprising determination means for determining whether or not it is in a fault state.
制御装置の障害を監視でき、障害となった制御装置が制御していたスイッチ装置の制御を他の制御装置に引き継がせることができる。 The failure of the control device can be monitored, and the control of the switch device controlled by the failed control device can be taken over by another control device.
以下、本発明の例示的な実施形態について図面を参照して説明する。なお、以下の各図においては、実施形態の説明に必要ではない構成要素については図から省略する。 Hereinafter, exemplary embodiments of the present invention will be described with reference to the drawings. In the following drawings, components that are not necessary for the description of the embodiments are omitted from the drawings.
図1は、本実施形態による例示的なシステム構成図である。ネットワークは複数のスイッチ装置1を含み、各スイッチ装置1は、n個のグループ(nは2以上の整数)であるスイッチ群10−1〜10−nのいずれかに分類されている。なお、図1においては、図が煩雑となることを避けるため、スイッチ装置1は同じスイッチ群のスイッチ装置1とのみリンクを持つように表現しているが、実際には、スイッチ群を跨るリンクも存在し、スイッチ装置1のスイッチ群への分類と、各スイッチ装置1間の接続構成は無関係である。
FIG. 1 is an exemplary system configuration diagram according to the present embodiment. The network includes a plurality of
本実施形態においては、各スイッチ群10−1〜10−nに対応させて、n個の制御装置2−1〜2−nを設け、制御装置2−1〜2−nは、それぞれ、対応するスイッチ群に含まれるスイッチ装置1の制御を行う。つまり、通常時、制御装置2−1は、スイッチ群10−1内のスイッチ装置1の制御のみを行うことを認識しており、スイッチ群10−1内のスイッチ装置1も、制御装置2−1のみにより制御されることを認識している。よって、制御装置2−1は、通常時、スイッチ群10−1に属するスイッチ装置1から、新たなフローに属するパケットの受信の通知を受け取ると、当該フローの経路を判定し、スイッチ群10−1のスイッチ装置1のうち、判定した経路上にあるスイッチ装置1に対して、その出力インタフェースの通知を行い、フローテーブルを更新させる。なお、各制御装置2−1〜2−nは、障害時に備えて、総てのスイッチ装置1にアクセス可能な様に構成される。
In the present embodiment, n control devices 2-1 to 2-n are provided corresponding to the switch groups 10-1 to 10-n, and the control devices 2-1 to 2-n are respectively corresponding. The
さらに、本実施形態においては、制御装置2−1〜2−nの状態、つまり、正常状態であるか、障害状態であるかを判定し、障害状態であると判定すると、障害状態である制御装置が制御していたスイッチ装置1の制御を引き継ぐ1つ以上の制御装置を決定する管理装置3を設けている。
Furthermore, in the present embodiment, it is determined whether the control devices 2-1 to 2-n are in a normal state or a failure state. A
図2は、本実施形態による管理装置3が保持する情報の説明図である。図2の例においては、管理装置3は、通常時におけるスイッチ群10−1〜10−nと、各スイッチ群10−1〜10−n内のスイッチ装置1の数を保持している。なお、図2においては省略しているが、各スイッチ群10−1〜10−nの各スイッチ装置1を識別するための情報や、アクセスするための情報、例えば、IPアドレス等も管理装置3は保持している。図2において、"マスタ"とは、通常時において対応するスイッチ群のスイッチ装置1を制御する制御装置を示し、"スレーブ"とは、通常時においては制御しない制御装置を示している。例えば、図2では、スイッチ群10−1のスイッチ装置1は、通常時、制御装置2−1のみより制御され、スイッチ群10−2のスイッチ装置1は、制御装置2−2のみより制御されることが示されている。
FIG. 2 is an explanatory diagram of information held by the
また、本実施形態において管理装置3は、各制御装置2−1〜2−nの負荷情報を取得する。本実施形態においては、負荷情報として各制御装置2−1〜2−nのCPU負荷率を使用する。なお、管理装置3は、このCPU負荷率を、例えば、数秒から数分程度の比較的に短い周期で各制御装置から取得するが、この比較的短い周期で取得したCPU負荷率から所定期間、例えば、1週間といった数日程度の平均値を求めて記録する。なお、本実施形態は、CPU負荷率を使用する形態のみならず、メモリの使用量等や、CPU負荷率及びメモリ使用量の両方を使用して制御装置2−1〜2−nの負荷を示す負荷値を算出する等の形態とすることもできる。さらに、図2に示す様に、管理装置3は、各制御装置2−1〜2−nに対して設定した設定情報を保持している。具体的には、例えば、制御装置2−1に設定した設定情報が設定情報Aであることや、制御装置2−2に設定した設定情報が設定情報Bであることが記載されている。
Moreover, in this embodiment, the
続いて、図3を用いて、本実施形態による管理装置3が実行する引継処理について説明する。管理装置3は、例えば、制御装置2−1〜2−nに対してポーリングを行い、制御装置2−1〜2−nはポーリングに応答することで正常に動作していることを管理装置3に通知する(S1)。なお、管理装置3がポーリングするのではなく、制御装置2−1〜2−nが周期的に正常に動作していることを示す信号を管理装置3に送信する形態であっても良い。
Next, a takeover process executed by the
例えば、制御装置2−1が障害となり(S2)、管理装置3が、制御装置2−1から応答が無いこと検出したとする(S3)。この時点においては、管理装置3から見ると、制御装置2−1が障害となっているのか、管理装置3と制御装置2−1との間の通信のみが障害となっているのかを判定することができない。したがって、S4において、管理装置3は、他の制御装置2−2〜2−nに、制御装置2−1の生存確認依頼を行う。管理装置3から生存確認依頼信号を受信することに応答して、制御装置2−2〜2−nは、S5で、制御装置2−1に対して生存確認信号を送信する。なお、本実施形態において、各制御装置は、生存確認信号を受信すると、生存確認信号の送信元に対して、生存報告信号を送信する様に構成されている。制御装置2−2〜2−nは、S6において、制御装置2−1の生存確認結果を管理装置3に報告する。つまり、制御装置2−2〜2−nは、制御装置2−1から生存報告信号を受信すると、管理装置3に制御装置2−1は正常と報告し、制御装置2−1から所定の期間内に生存報告信号を受信しないと、管理装置3に制御装置2−1は異常と報告する。
For example, assume that the control device 2-1 becomes a failure (S2), and the
管理装置3は、制御装置2−2〜2−nの総てから報告を受領した場合か、S4での確認依頼から所定期間経過すると、制御装置2−1が障害であるか否かの判定を行う(S7)。具体的には、判定時点において制御装置2−2〜2−nから受信した異常又は正常を示す全報告に対する異常と報告された割合を求め、求めた割合が閾値以上である場合には、制御装置2−1が障害であると判定する。管理装置3は、制御装置2−1が障害であると判定すると、さらに、S7において、制御装置2−1が制御していたスイッチ群10−1に属する総てのスイッチ装置1の制御を、どの制御装置に引き継がせるかを決定する。
The
その後、S7での決定に従い、管理装置3は、S8で制御装置2−2〜2−nに引継指示信号を送信する。引継指示信号には、その送信先の制御装置が制御を引き継ぐスイッチ装置1を特定する情報と、当該スイッチ装置1を制御するために必要な設定情報が含まれている。なお、制御装置2−1の制御を引き継がない制御装置には、引継指示信号を送る必要はない。引継指示信号を受信した制御装置は、S9で、スイッチ群10−1のスイッチ装置1のうち、自装置がその制御を行うことになるスイッチ装置1に対して、制御を行う制御装置が変更となったことを通知する。なお、S9の処理は、例えば、オープンフローで規定されている"Roll Request"を利用することができる。S9における引継処理が終了すると、制御装置2−1の処理を引き継いだ制御装置は、S10で完了報告信号を管理装置3に送信し、管理装置3は、図2に示す情報に加えて、スイッチ群10−1に属するスイッチ装置1のそれぞれがどの制御装置により制御されているかの情報を保存する。
Thereafter, according to the determination in S7, the
図4は、他の実施形態による管理装置3が実行する引継処理のシーケンス図である。以下、図4の引継処理について、図3の引継処理との相違点を中心に説明する。S1〜S3は、図3の引継処理と同様である。図4の実施形態では、管理装置3が、制御装置2−1から応答が無いこと検出すると、管理装置3自身が、制御装置2−1の状態確認を実行する(S4−1)。具体的には、管理装置3は、スイッチ群10−1に含まれるスイッチ装置1に接続する複数のホスト装置(図示せず)に対して、生存確認信号を送信する。なお、生存確認信号を受信したホスト装置は、管理装置3に生存報告信号を送信するものとする。例えば、生存確認信号としては、ICMP(インターネット制御通知プロトコル)のエコー要求メッセージを利用することができ、この場合、生存報告信号は、ICMPのエコー応答メッセージとなる。スイッチ群10−1に含まれるスイッチ装置1に接続するホスト装置には、制御装置2−1の制御なしに信号が到達しないため、本実施形態では、生存確認信号の送信数に対する生存報告信号の受信数の割合により、制御装置2−1が障害であるか否かを判定する。以後の処理は図3における引継処理と同様であり、その説明は省略する。
FIG. 4 is a sequence diagram of the takeover process executed by the
続いて、図3の引継処理のS7で管理装置3が行う制御装置の障害判定処理について図5を用いて説明する。管理装置3は、図3のS4における確認依頼後、所定時間を経過したか、或いは、確認依頼を行った総ての制御装置から報告を受信すると(S50)、S51で異常割合を計算する。具体的には、計算時点において、制御装置から受信した報告数に対する異常と報告された割合を計算する。異常割合が閾値以上であると(S52)、管理装置3は、S53で当該制御装置は障害と判定し、そうでなければS54で正常と判定する。
Next, the control device failure determination process performed by the
続いて、図4の引継処理のS7で管理装置3が行う制御装置の障害判定処理について図6を用いて説明する。管理装置3は、図4のS4−1における確認処理後、所定時間を経過したか、或いは、生存確認信号を送信した総てのホスト装置から生存報告信号を受信すると(S60)、S61で異常割合を計算する。具体的には、送信した生存確認信号の数に対する、送信した生存確認信号の数と計算時点における生存報告信号を受信した数との差の割合を計算する。異常割合が閾値以上であると(S62)、管理装置3は、S63で当該制御装置は障害と判定し、そうでなければS64で正常と判定する。なお、送信した生存確認信号の数に対する計算時点における生存報告信号を受信した数の割合である正常割合を求め、正常割合が閾値以下であれば制御装置が障害であると判定することもできる。
Subsequently, the failure determination processing of the control device performed by the
続いて、図3及び図4の引継処理のS7で管理装置3が行う引継先決定処理について図7を用いて説明する。管理装置3は、図5又は図6を使用して説明した障害判定処理により、ある制御装置が障害と判定すると、S70で、障害と判定した制御装置の過去所定期間の負荷値、本実施形態ではCPUの負荷率の平均値n(%)を判定又は算出する。続いて、障害となった制御装置のCPUの負荷率の平均値n(%)を加えても、そのCPUの負荷率の平均値が、閾値であるX(%)以上とならない制御装置が存在するか否かをS71で判定する。
Next, the takeover destination determination process performed by the
S71で、閾値であるX(%)以上とならない制御装置が存在する場合、管理装置3は、S73で、その制御装置のうちの任意の1つの制御装置を、障害となった制御装置の引継先に決定する。これに対して、S71で、閾値であるX(%)以上とならない制御装置が存在しない場合、管理装置3は、S72で、CPU負荷率の平均値がX(%)以上とならない様に複数の制御装置を引継先として選択する。具体的には、例えば、閾値X(%)を80%として、制御装置A、B、CのCPU負荷率の平均値が、それぞれ、50%、50%、50%であり、障害となった制御装置DのCPU負荷率の平均値が60%とする。この場合、例えば、管理装置3は、制御装置DのCPU負荷率の平均値60%を、それぞれ、制御装置A、Bに30%、30%ずつ分配することができる。また、管理装置3は、制御装置DのCPU負荷率の平均値60%を、それぞれ、制御装置B、Cに30%、30%ずつ分配することができる。さらに、管理装置3は、制御装置DのCPU負荷率の平均値60%を、それぞれ、制御装置A、B、Cに20%、20%、20%ずつ分配することができる。
In S71, when there is a control device that does not exceed the threshold value X (%), the
なお、S72における複数の制御装置の選択は種々の基準により行うことができる。例えば、引継先の制御装置の数が最小となる様に選択することができる。これにより、負荷が増加する制御装置の数を最小とすることができる。一方、引継先の制御装置の数が最大となる様に選択することができる。これにより、正常に動作している制御装置の負荷の上昇を最小にすることができる。また、制御装置の設置位置を考慮することもできる。例えば、できるだけ近い位置に設置されている制御装置を選択することができる。一方、制御装置の設置位置を可能な限り分散することもできる。さらに、CPU負荷率の余裕度、つまり、閾値X(%)とCPU負荷率との差の平均値が最大のものを選択することも、最小のものを選択することもできる。 Note that the selection of a plurality of control devices in S72 can be performed according to various criteria. For example, the selection can be made so that the number of control devices of the takeover destination is minimized. As a result, the number of control devices that increase the load can be minimized. On the other hand, it is possible to select so that the number of control devices as takeover destinations is maximized. As a result, it is possible to minimize an increase in the load of the control device that is operating normally. Further, the installation position of the control device can be taken into consideration. For example, a control device installed at a position as close as possible can be selected. On the other hand, the installation positions of the control devices can be dispersed as much as possible. Further, the CPU load factor margin, that is, the average value of the difference between the threshold value X (%) and the CPU load factor can be selected as the maximum value, or the minimum value can be selected.
管理装置は、S72で複数の制御装置を引継先として決定すると、S74で、引継先の制御装置のそれぞれが制御するスイッチ装置1を決定する。なお、S73で引継先の制御装置を1つだけ選択した場合には、障害となった制御装置が制御していた総てのスイッチ装置1を、選択された1つの制御装置が制御する。
When the management device determines a plurality of control devices as takeover destinations in S72, the management device determines the
例えば、管理装置3は、S74で、CPU負荷率の余裕度の比に応じて、引継先の各制御装置が制御するスイッチ装置の数を判定する。例えば、障害となった制御装置が100台のスイッチ装置1を制御し、引継先の制御装置A、Bの余裕度が、それぞれ、30%、10%とすると、制御装置Aが75台のスイッチ装置1の制御を引き継ぎ、制御装置Bが25台のスイッチ装置1の制御を引き継ぐ。なお、端数は、四捨五入等の任意の方法で調整する。
For example, in S74, the
このとき、管理装置3は、各スイッチ装置のスイッチ容量別に引継先を決定することができる。例えば、上記障害となった制御装置が制御していた100台のスイッチ装置1のうち、100Gbpsの容量を持つスイッチが40台あり、40Gbpsの容量を持つスイッチが40台あり、10Gbpsの容量を持つスイッチが20台とする。この場合、引継先の制御装置A、Bの余裕度が、それぞれ、30%、10%とすると、制御装置Aは、100Gbpsの容量を持つスイッチ30台と、40Gbpsの容量を持つスイッチ30台と、10Gbpsの容量を持つスイッチ15台の制御を引き継ぐことになる。スイッチ容量が大きいスイッチには、多くのフローに関与し、制御装置が制御を行う頻度は、スイッチ容量に依存するため、スイッチ容量を考慮することで、スイッチ装置の制御負荷の偏りを抑えることができる。
At this time, the
図8は、本実施形態による管理装置の概略的な構成図である。記憶部34には、図2にて説明した管理情報が保持されている。判定部31は、図5や図6を用いて説明した障害判定処理を行う。選択部32は、図7を用いて説明した引継先決定処理を行う。通知部33は、図3や図4のS8で説明した様に、選択部32が選択した引継先の制御装置に、障害状態となった制御装置に対応するグループの通信装置の制御を引き継ぐことを通知する。
FIG. 8 is a schematic configuration diagram of the management apparatus according to the present embodiment. The
なお、本発明による管理装置3は、コンピュータを上記管理装置3として動作させるプログラムにより実現することができる。これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。また、管理装置3は、1つのコンピュータで実現しても、相互に通信可能な複数のコンピュータで実現しても良い。
The
Claims (15)
前記複数の制御装置の障害状態を、前記複数の制御装置が前記管理装置に送信する、送信元の制御装置が正常であることを示す第1信号に基づき判定する判定手段と、
障害状態となった制御装置に対応するグループの通信装置の制御を引き継ぐ1つ以上の制御装置を、前記複数の制御装置の負荷状態を示す負荷値に基づき選択する選択手段と、
前記選択手段が選択した引継先の制御装置に、前記障害状態となった制御装置に対応するグループの通信装置の制御を引き継ぐことを通知する通知手段と、
を備えており、
前記判定手段は、前記複数の制御装置の内の第1の制御装置から前記第1信号を受信しないと、前記複数の制御装置の内の前記第1の制御装置とは異なる第2の制御装置、或いは、前記第1の制御装置に対応するグループの通信装置に接続するホスト装置を利用して前記第1の制御装置が障害状態であるか否かを判定することを特徴とする管理装置。 In a communication system in which communication devices belonging to a network are grouped into a plurality of groups, a plurality of control devices respectively corresponding to the plurality of groups are provided, and each control device controls a communication device of a corresponding group, the plurality of control devices A management device for managing
Determining means for determining a failure state of the plurality of control devices based on a first signal transmitted from the plurality of control devices to the management device and indicating that a transmission source control device is normal ;
Selection means for selecting one or more control devices that take over control of a communication device of a group corresponding to a control device that has failed, based on a load value indicating a load state of the plurality of control devices;
A notifying means for notifying the takeover destination control device selected by the selection means that the control of the communication device of the group corresponding to the control device in the failed state is taken over;
Equipped with a,
If the determination means does not receive the first signal from the first control device of the plurality of control devices, the second control device is different from the first control device of the plurality of control devices. Alternatively, the management apparatus determines whether or not the first control apparatus is in a failure state by using a host apparatus connected to a communication apparatus of a group corresponding to the first control apparatus.
前記複数の制御装置の内の第1の制御装置から正常であることを示す信号を受信しないと、前記複数の制御装置の内の第1の制御装置以外の第2の制御装置に前記第1の制御装置の生存確認依頼を行い、前記第2の制御装置から受信する報告において示される前記第1の制御装置が正常であるとする数と、異常であるとする数に基づき、前記第1の制御装置が障害状態であるか否かを判定する判定手段を備えていることを特徴とする管理装置。 In a communication system in which communication devices belonging to a network are grouped into a plurality of groups, a plurality of control devices respectively corresponding to the plurality of groups are provided, and each control device controls a communication device of a corresponding group, the plurality of control devices A management device for managing
If a signal indicating normality is not received from a first control device among the plurality of control devices, the first control device other than the first control device among the plurality of control devices receives the first control device. Based on the number that the first control device is normal and the number that is abnormal as indicated in the report received from the second control device. A management device comprising: a determination unit that determines whether or not the control device is in a failure state.
前記複数の制御装置の内の第1の制御装置から正常であることを示す信号を受信しないと、前記第1の制御装置に対応するグループの通信装置に接続するホスト装置に対して返答を求める生存確認信号を送信し、送信した生存確認信号と、前記生存確認信号に対する応答の数とに基づき、前記第1の制御装置が障害状態であるか否かを判定する判定手段を備えていることを特徴とする管理装置。 In a communication system in which communication devices belonging to a network are grouped into a plurality of groups, a plurality of control devices respectively corresponding to the plurality of groups are provided, and each control device controls a communication device of a corresponding group, the plurality of control devices A management device for managing
If a signal indicating normality is not received from a first control device among the plurality of control devices, a response is requested to a host device connected to a communication device of a group corresponding to the first control device. A determination unit that transmits a survival confirmation signal and determines whether or not the first control device is in a failure state based on the transmitted survival confirmation signal and the number of responses to the survival confirmation signal; Management device characterized by.
前記選択手段が選択した引継先の制御装置に、前記第1の制御装置に対応するグループの通信装置の制御を引き継ぐことを通知する通知手段と、
をさらに備えていることを特徴とする請求項9から12のいずれか1項に記載の管理装置。 If the determination means determines that the first control device is in a failure state, one or more control devices that take over control of the communication devices of the group corresponding to the first control device are assigned to the plurality of control devices. Selecting means for selecting based on a load value indicating a load state;
A notification means for notifying the control device of the takeover destination selected by the selection means that the control of the communication device of the group corresponding to the first control device is taken over;
The management apparatus according to claim 9, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013002053A JP6022948B2 (en) | 2013-01-09 | 2013-01-09 | Management device and program for control device of communication network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013002053A JP6022948B2 (en) | 2013-01-09 | 2013-01-09 | Management device and program for control device of communication network |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014135614A JP2014135614A (en) | 2014-07-24 |
JP6022948B2 true JP6022948B2 (en) | 2016-11-09 |
Family
ID=51413607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013002053A Active JP6022948B2 (en) | 2013-01-09 | 2013-01-09 | Management device and program for control device of communication network |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6022948B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016208181A (en) | 2015-04-20 | 2016-12-08 | 富士通株式会社 | Switch device, control device, failure detection method and failure detection program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008097164A (en) * | 2006-10-10 | 2008-04-24 | Hitachi Ltd | Fault monitoring method for system composed of a plurality of function element |
JP4559512B2 (en) * | 2008-08-11 | 2010-10-06 | 日本電信電話株式会社 | Packet transfer system and packet transfer method |
-
2013
- 2013-01-09 JP JP2013002053A patent/JP6022948B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014135614A (en) | 2014-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9742648B2 (en) | Efficient topology failure detection in SDN networks | |
CN109344014B (en) | Main/standby switching method and device and communication equipment | |
WO2017050254A1 (en) | Hot backup method, device and system | |
US10911295B2 (en) | Server apparatus, cluster system, cluster control method and program | |
JP5530864B2 (en) | Network system, management server, and management method | |
JP2005020543A (en) | Network system, node device, redundant construction method, and redundant construction program | |
WO2018233643A1 (en) | Canopen protocol-based train network data transmission method and system, and apparatus thereof | |
WO2019033475A1 (en) | Automatic relay switching method and related product | |
US20160036654A1 (en) | Cluster system | |
CN103262046A (en) | Server management apparatus, server management method, and program | |
JP2012231223A (en) | Access system and redundancy switching method | |
JP4964666B2 (en) | Computer, program and method for switching redundant communication paths | |
EP2787699A1 (en) | Data transmission method, device, and system | |
JP6022948B2 (en) | Management device and program for control device of communication network | |
JP2018056633A (en) | Cluster system, server, operation method for server, and program | |
JP4879823B2 (en) | Supervisory control system | |
JP2013025765A (en) | Master/slave system, control device, master/slave switching method and master/slave switching program | |
US9118540B2 (en) | Method for monitoring a plurality of rack systems | |
TW201023563A (en) | Processing method of ring network redundancy checking | |
US9301232B2 (en) | Management apparatus of controller for communication network | |
JP5389591B2 (en) | Network control apparatus and method | |
JP5372978B2 (en) | Control method and radio base station apparatus | |
CN109495365B (en) | Single-ring network type SCADA system | |
JP6935819B2 (en) | Node device, recovery operation control method, and recovery operation control program | |
CN110601972A (en) | Message transmission method and device and intelligent elastic architecture system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6022948 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |