JP2013207367A - ネットワーク障害監視装置およびネットワーク障害監視方法 - Google Patents
ネットワーク障害監視装置およびネットワーク障害監視方法 Download PDFInfo
- Publication number
- JP2013207367A JP2013207367A JP2012071479A JP2012071479A JP2013207367A JP 2013207367 A JP2013207367 A JP 2013207367A JP 2012071479 A JP2012071479 A JP 2012071479A JP 2012071479 A JP2012071479 A JP 2012071479A JP 2013207367 A JP2013207367 A JP 2013207367A
- Authority
- JP
- Japan
- Prior art keywords
- reception
- transmission
- monitoring
- thread
- packet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【解決手段】ネットワーク障害監視装置1は、ネットワークの装置群を監視する複数の監視パケット送受信スレッド23(#1)〜(#n)と、その複数の監視パケット送受信スレッド23のパケットの送受信処理の開始や終了を管理する送受信スレッド群管理部22とを備える。送受信スレッド群管理部22は、監視パケット送受信スレッド23の1つが監視パケットの最終再送後の応答待ちに入った時点で、他の監視パケット送受信スレッド23の送受信処理を開始させる。また、送受信スレッド群管理部22は、送受信処理を実行中の監視パケット送受信スレッド23の数を、送信中スレッド最大数以下になるように制御する。
【選択図】図2
Description
また、送受信スレッド群管理部は、送信中スレッド最大数を超えない場合に、他の監視パケット送受信スレッドに対し送受信開始メッセージを送信することにより、ネットワーク障害監視装置内のリソースの使い切りによる処理性能の低下を防ぐことができる。
まず、本実施形態に係るネットワーク障害監視装置1が実行する処理の概要について説明する。ネットワーク障害監視装置1は、ポーリングによりネットワークの装置群を監視する複数のスレッド(後記する「監視パケット送受信スレッド23」)を備える。また、各スレッドは送信部と受信部とを分離して備える(後記する、「送信処理部231」と「受信処理部232」)。
そして、各スレッド(監視パケット送受信スレッド23)の送信部が、監視対象装置に対してパケット(以下、「監視パケット」という場合がある)を周期的に(連続して)送信し、受信部が、監視対象装置から返信されるパケット(以下、「応答パケット」という場合がある)を連続受信する。ネットワークにおいては、監視対象装置の一部が故障等することにより、応答パケットが返信されないことがある。このため、各スレッド(監視パケット送受信スレッド23)の受信部では、稼動している装置からの応答パケットの受信後、所定時間を過ぎても次の応答パケットを受信できないこと、または、送信部からの監視パケットの送信の後、所定時間を過ぎても対応する応答パケットを受信できないこと、を検知して応答パケットの受信待ちを終了する。そして、受信部が応答パケットを受信できない場合に、各スレッド(監視パケット送受信スレッド23)は、送信部による監視パケットの再送処理を所定の回数に亘って実行する。
また、一般的には、再送回数を重ねる度に、応答パケットが返信される可能性が減少するため、所定の再送回数における最終再送では、監視パケットを送信しても応答パケットを受信できる可能性は極めて低く、最終再送後の応答待ち(受信処理のみ)の時間は、リソース消費が少なくなる。このため、本実施形態に係るネットワーク障害監視装置1では、ある監視対象の装置群に対する送受信処理の最終再送後の応答待ちの入る時点で、他の監視対象の装置群に対する送受信処理を開始し、ネットワーク障害監視装置1全体としての障害監視の処理時間を短縮する。
本実施形態1に係るネットワーク障害監視装置1は、装置群をポーリングにより監視する監視パケット送受信スレッド23を「n」個立ち上げ、そのうち、ネットワーク障害監視装置1のリソースを使い切らないように予め設定された送信中スレッド最大数「M」以下の監視パケット送受信スレッド23を使用して、監視パケットおよび応答パケットの送受信処理を行う。
また、ネットワーク障害監視装置1は、各監視パケット送受信スレッド23の送受信処理の開始や終了等を制御する送受信スレッド群管理部22を備える。そして、この送受信スレッド群管理部22が、現時点で送受信処理を実行している監視パケット送受信スレッド23の数を、使用中スレッド管理用変数「D」として記憶することにより、送受信処理を実行中の監視パケット送受信スレッド23の数が、送信中スレッド最大数「M」以下となるように制御する。
以下、具体的に、ネットワーク障害監視装置1の構成および処理について説明する。
図2は、本実施形態に係るネットワーク障害監視装置1の構成例を示す機能ブロック図である。
図3に示すように、監視対象装置情報310には、ネットワーク障害監視装置1が監視対象とする装置群のネットワーク内における固有な番号である装置群番号311毎に、その装置群に含まれる各ネットワーク装置のIPアドレス312が記憶される。
具体的には、送受信スレッド群管理部22は、記憶部30内のスレッド制御情報320を参照し、監視パケット送受信スレッド23の起動スレッド数「n」、および、送信中スレッド最大数「M」を読み込む。
なお、送受信スレッド群管理部22は、監視パケット送受信スレッド23(#1〜#n)がパケットの送受信処理を行うために必要となるオプション(例えば、再送回数やタイムアウト時間等)も併せて読み込み、監視パケット送受信スレッド23(#1〜#n)に設定する。
なお、送受信スレッド群管理部22が行う処理の詳細は、図4において説明する。
具体的には、監視パケット送受信スレッド23は、送受信スレッド群管理部22から監視対象となる装置群の監視対象装置情報310(装置群番号311とIPアドレス312の組)を受け取り、監視対象の装置を監視するためのパケットの送受信を行う。このとき、監視パケット送受信スレッド23は、例えば、pingやSNMP等に基づきパケットの送受信を行うようにしてもよい。
この監視パケット送受信スレッド23は、送信処理部231および受信処理部232を備える。送信処理部231は、送受信スレッド群管理部22から、送受信開始メッセージ(MSG_START_SEND)を受信すると、監視対象の装置群に対して、監視パケットを送信する。受信処理部232は、監視対象の装置群からの監視パケットに対応する応答パケットを受信する。また、受信処理部232は、稼動している装置からの応答パケットの受信後、所定時間を過ぎても次の応答パケットを受信できないこと、または、送信処理部231からの監視パケットの送信の後、所定時間を過ぎても対応する応答パケットを受信できないこと、を検知した場合に、応答パケットの受信待ちを完了する。そして、監視パケット送受信スレッド23は、受信処理部232が応答パケットを受信できず受信待ちを完了した場合に、送信処理部231による監視パケットの再送処理を所定の回数に亘って実行する。
また、受信処理部232は、設定された所定の再送回数の最後となる最終送信を、送信処理部231が実行した場合に、最終応答待ちに入ったことを示すメッセージ(最終応答待ちメッセージ(MSG_FIN_SEND))を送受信スレッド群管理部22に送信する。また、受信処理部232は、最終応答待ちが完了した場合に、監視対象となる装置群の監視結果を、結果通知メッセージ(MSG_RESULT)として、送受信スレッド群管理部22に送信する。
なお、ネットワーク障害監視装置1をプログラム実行処理により実現する場合、記憶部30には、ネットワーク障害監視装置1の制御部20の機能を実現するためのプログラムが格納される。そして、制御部20は、記憶部30に記憶されたプログラムを、不図示のCPUが、RAM等に展開し実行することで実現される。
次に、本実施形態に係るネットワーク障害監視装置1が行うネットワーク障害監視処理について説明する。
ここで、D<Mが成り立つ場合は(ステップS13→Yes)、次のステップS14に進む。
図5は、本実施形態に係るネットワーク障害監視装置1が行う処理の具体例を示すシーケンス図である。図5においては、起動スレッド数「n」=3、送信中スレッド最大数「M」=2、監視対象となる装置群数を「3」とした場合の例を示している。
よって、図5に示すように、本実施形態に係るネットワーク障害監視装置1は、比較例と比べ、ネットワーク装置の監視に要する時間を短縮することができる。また、ネットワーク障害監視装置1の送受信スレッド群管理部22により、使用中スレッド管理用変数「D」が、送信中スレッド最大数「M」を超えないように監視パケット送受信スレッド23の使用数を制御することができる。
10 入出力部
11 情報入力部
12 結果出力部
13 装置アクセス部
20 制御部
21 監視対象装置解析部
22 送受信スレッド群管理部
23 監視パケット送受信スレッド
30 記憶部
231 送信処理部
232 受信処理部
310 監視対象装置情報
320 スレッド制御情報
Claims (4)
- 複数のネットワーク装置から構成される複数の装置群と接続され、前記装置群に対しパケットを送受信することによりネットワークに発生する障害を監視するネットワーク障害監視装置であって、
監視対象となる装置群の情報が格納される監視対象装置情報と、前記パケットを送受信する監視パケット送受信スレッドを同時に稼動可能な最大数を示す送信中スレッド最大数を含むスレッド制御情報と、を記憶する記憶部と、
前記パケットの送受信処理を実行し、前記装置群毎に障害の発生を監視する複数の前記監視パケット送受信スレッドと、
前記複数の監視パケット送受信スレッドの前記パケットの送受信処理の開始を少なくとも制御する送受信スレッド群管理部と、を備え、
前記監視パケット送受信スレッドは、
前記監視対象の装置群の1つに対し、前記監視対象装置情報に基づき、監視パケットを送信し前記監視パケットに対応する応答パケットを受信する前記パケットの送受信処理を繰り返し、前記応答パケットを受信できない場合に、前記監視パケットを所定の回数再送し、前記所定の回数の最終再送を実行したとき、最終応答待ちに入ったことを示す最終応答待ちメッセージを前記送受信スレッド群管理部に送信し、
前記送受信スレッド群管理部は、
前記最終応答待ちメッセージを受信すると、前記パケットの送受信処理を現在実行していない他の前記監視パケット送受信スレッドに実行させた場合に、前記送信中スレッド最大数を超えるか否かを判定し、前記送受信スレッド最大数を超えない場合に、前記他の監視パケット送受信スレッドに送受信開始メッセージを送信し、
前記他の監視パケット送受信スレッドは、
前記送受信開始メッセージを受信し、前記監視対象装置情報に基づき、まだ監視が実行されていない前記監視対象の装置群の1つに対し、前記パケットの送受信処理を開始すること
を特徴とするネットワーク障害監視装置。 - 前記監視パケット送受信スレッドは、送信処理部と受信処理部とを備え、
前記送信処理部が、前記監視対象の装置群に対する前記監視パケットの送信処理を実行し、
前記受信処理部が、前記応答パケットの受信処理を実行し、前記送信処理部が、前記所定の回数の前記監視パケットの最終再送を実行したとき、前記最終応答待ちメッセージを前記送受信スレッド群管理部に送信すること
を特徴とする請求項1に記載のネットワーク障害監視装置。 - 前記送受信スレッド群管理部は、
現時点で前記パケットの送受信処理を実行している前記監視パケット送受信スレッドの数を、使用中スレッド管理用変数として記憶しており、
前記監視パケット送受信スレッドから、前記最終応答待ちメッセージを受信すると、前記使用中スレッド管理用変数を1減算し、
前記他の監視パケット送受信スレッドに前記送受信開始メッセージを送信するに際し、前記使用中スレッド管理用変数を1加算し、
前記1加算した後の使用中スレッド管理用変数が、前記送受信スレッド最大数を超えない場合に、前記他の監視パケット送受信スレッドに送受信開始メッセージを送信すること
を特徴とする請求項1または請求項2に記載のネットワーク障害監視装置。 - 複数のネットワーク装置から構成される複数の装置群と接続され、前記装置群に対しパケットを送受信することによりネットワークに発生する障害を監視するネットワーク障害監視装置のネットワーク障害監視方法であって、
前記ネットワーク障害監視装置は、
監視対象となる装置群の情報が格納される監視対象装置情報と、前記パケットを送受信する監視パケット送受信スレッドを同時に稼動可能な最大数を示す送信中スレッド最大数を含むスレッド制御情報と、を記憶する記憶手段と、
前記パケットの送受信処理を実行し、前記装置群毎に障害の発生を監視する複数の前記監視パケット送受信スレッドと、
前記複数の監視パケット送受信スレッドの前記パケットの送受信処理の開始を少なくとも制御する送受信スレッド群管理手段と、を備えており、
前記監視パケット送受信スレッドは、
前記監視対象の装置群の1つに対し、前記監視対象装置情報に基づき、監視パケットを送信し前記監視パケットに対応する応答パケットを受信する前記パケットの送受信処理を繰り返し、前記応答パケットを受信できない場合に、前記監視パケットを所定の回数再送し、前記所定の回数の最終再送を実行したとき、最終応答待ちに入ったことを示す最終応答待ちメッセージを前記送受信スレッド群管理手段に送信するステップを実行し、
前記送受信スレッド群管理手段は、
前記最終応答待ちメッセージを受信すると、前記パケットの送受信処理を現在実行していない他の前記監視パケット送受信スレッドに実行させた場合に、前記送信中スレッド最大数を超えるか否かを判定し、前記送受信スレッド最大数を超えない場合に、前記他の監視パケット送受信スレッドに送受信開始メッセージを送信するステップを実行し、
前記他の監視パケット送受信スレッドは、
前記送受信開始メッセージを受信し、前記監視対象装置情報に基づき、まだ監視が実行されていない前記監視対象の装置群の1つに対し、前記パケットの送受信処理を開始するステップを実行すること
を特徴とするネットワーク障害監視方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012071479A JP5476415B2 (ja) | 2012-03-27 | 2012-03-27 | ネットワーク障害監視装置およびネットワーク障害監視方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012071479A JP5476415B2 (ja) | 2012-03-27 | 2012-03-27 | ネットワーク障害監視装置およびネットワーク障害監視方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013207367A true JP2013207367A (ja) | 2013-10-07 |
JP5476415B2 JP5476415B2 (ja) | 2014-04-23 |
Family
ID=49526090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012071479A Active JP5476415B2 (ja) | 2012-03-27 | 2012-03-27 | ネットワーク障害監視装置およびネットワーク障害監視方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5476415B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114221861A (zh) * | 2021-03-26 | 2022-03-22 | 无锡江南计算技术研究所 | 一种大规模互连网络的管理包收发方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05327749A (ja) * | 1992-05-21 | 1993-12-10 | Fujitsu Ltd | データ転送方式 |
JP2007325155A (ja) * | 2006-06-05 | 2007-12-13 | Matsushita Electric Ind Co Ltd | ネットワーク管理装置及びネットワーク管理システム |
JP2010004487A (ja) * | 2008-06-23 | 2010-01-07 | Toshiba Corp | 無線通信システム、監視装置及び交換ノード |
WO2010131608A1 (ja) * | 2009-05-12 | 2010-11-18 | 三菱電機株式会社 | 端末切り替え方法、基地局および通信システム |
-
2012
- 2012-03-27 JP JP2012071479A patent/JP5476415B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05327749A (ja) * | 1992-05-21 | 1993-12-10 | Fujitsu Ltd | データ転送方式 |
JP2007325155A (ja) * | 2006-06-05 | 2007-12-13 | Matsushita Electric Ind Co Ltd | ネットワーク管理装置及びネットワーク管理システム |
JP2010004487A (ja) * | 2008-06-23 | 2010-01-07 | Toshiba Corp | 無線通信システム、監視装置及び交換ノード |
WO2010131608A1 (ja) * | 2009-05-12 | 2010-11-18 | 三菱電機株式会社 | 端末切り替え方法、基地局および通信システム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114221861A (zh) * | 2021-03-26 | 2022-03-22 | 无锡江南计算技术研究所 | 一种大规模互连网络的管理包收发方法 |
CN114221861B (zh) * | 2021-03-26 | 2023-07-07 | 无锡江南计算技术研究所 | 一种大规模互连网络的管理包收发方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5476415B2 (ja) | 2014-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4840236B2 (ja) | ネットワークシステム及びノード装置 | |
CN104184756A (zh) | 一种数据同步方法、装置及系统 | |
JP2008077428A (ja) | 負荷分散装置、負荷分散方法及び負荷分散プログラム | |
US11144423B2 (en) | Dynamic management of monitoring tasks in a cloud environment | |
CN107135279A (zh) | 一种处理长连接建立请求的方法和装置 | |
EP1697843A2 (en) | System and method for managing protocol network failures in a cluster system | |
WO2016107424A1 (zh) | 一种链路状态检测方法、装置和系统 | |
EP3075101A1 (en) | Dynamically optimized many tree multicast networks | |
WO2014094314A1 (zh) | 一种最优路径选择方法、相关设备及通信系统 | |
WO2016177144A1 (zh) | 网元监测方法和装置 | |
CN112311896A (zh) | 健康检查方法、装置、设备及计算机可读存储介质 | |
CN108134986B (zh) | 报文传输方法及装置 | |
JP5476415B2 (ja) | ネットワーク障害監視装置およびネットワーク障害監視方法 | |
EP2736204B1 (en) | Rendezvous Point Convergence Method and Apparatus | |
CN107534917A (zh) | 一种主从型网络中的切换方法、主设备、从设备和系统 | |
JP2010239299A (ja) | ネットワークの管理システム及び管理方法 | |
WO2013131431A1 (zh) | 一种管理网络设备链路聚合组的方法及装置 | |
JP2002261767A (ja) | ノード情報管理システム及びノード | |
US20150156164A1 (en) | Communication system, communication control method, communication relay system, and communication relay control method | |
JP4891950B2 (ja) | 無線通信システム、監視装置及び交換ノード | |
WO2011048740A1 (ja) | データ伝送システム、送信速度制御方法、受信端末、送信端末 | |
CN101764737B (zh) | 基于边界网关协议的路由老化方法、装置和路由器 | |
EP3896926A1 (en) | Network device and packet processing method using same | |
JP2010182017A (ja) | 分散計算機システム、マネージャ引き継ぎ方法及びマネージャ引き継ぎプログラム | |
JP5128556B2 (ja) | トラヒック情報収集装置、トラヒック情報収集方法およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5476415 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |