JP3509847B2 - Nmsシステムにおける通信の信頼性向上方法及びnmsシステム - Google Patents

Nmsシステムにおける通信の信頼性向上方法及びnmsシステム

Info

Publication number
JP3509847B2
JP3509847B2 JP2000012311A JP2000012311A JP3509847B2 JP 3509847 B2 JP3509847 B2 JP 3509847B2 JP 2000012311 A JP2000012311 A JP 2000012311A JP 2000012311 A JP2000012311 A JP 2000012311A JP 3509847 B2 JP3509847 B2 JP 3509847B2
Authority
JP
Japan
Prior art keywords
event
agent
communication
communication path
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000012311A
Other languages
English (en)
Other versions
JP2001202305A (ja
Inventor
寛子 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000012311A priority Critical patent/JP3509847B2/ja
Publication of JP2001202305A publication Critical patent/JP2001202305A/ja
Application granted granted Critical
Publication of JP3509847B2 publication Critical patent/JP3509847B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、ネットワーク管理
システム(network management system:NMS)、特
に、NMSシステムにおける通信の信頼性向上方法及び
NSMシステムに関する。
【0002】
【従来の技術】一般にネットワークの管理においては、
管理側(管理システム)をマネジャ、管理対象側をエー
ジェントと呼び、両者の情報のやり取りにTCP/IP
(transmission control protocol/internet protoco
l)ネットワーク管理の業界標準のプロトコルであるS
NMP(simple network management protocol)が使用
されている。
【0003】SNMPは、ネットワークに接続された管
理対象であるコンピュータなどのネットワーク構成機器
であるエージェントの情報や障害時の情報収集のために
使用される。SNMPのオペレーションには、GET
(管理情報の収集)、GETNEXT(管理情報の収
集)、SET(管理情報の設定)及びTRAP(障害の
通知)の4種類があり、管理情報はMIB(management
information base)と呼ばれエージェント側に存在
し、MIBの値をマネジャにおいて監視・管理するよう
に構成されている。
【0004】
【発明が解決しようとする課題】従来のネットワーク管
理システムにおいては以下のような問題点がある。つま
り、SNMPに用いられる通信路において、通信障害が
発生してNMSとエージェント間の通信が物理的に切断
されると、NMSからエージェントへのコントロールが
不能となる。
【0005】SNMPに用いられるイベント通信の通信
路は片方向通信であるため、この通信路に障害が起きた
ときNMS側では障害を認識することができない。
【0006】SNMP通信は通信プロトコルがコネクシ
ョンレス型のUDP/IPプロトコルを使用しており、
メッセージの送受信について保証がされていない。
【0007】(発明の目的)本発明の目的は、通信に対
して信頼性を保証していないコネクションレス型のUD
P/IP、SNMP(Simple Network Management Prot
ocol)プロトコルを用いたネットワーク上における通信
の信頼性を保証できるNMSシステムにおける通信の信
頼性向上方法及びNMSシステムを提供することにあ
る。
【0008】本発明の他の目的は、NMSの二重化、通
信回線の二重化、アプリケーションレベルでの再送制御
による通信の信頼性を保証できるNMSシステムにおけ
る通信の信頼性向上方法及びNMSシステムを提供する
ことにある。
【0009】
【課題を解決するための手段】本発明のNMSシステム
における通信の信頼性向上方法は、マネージャが二重化
されたネットワーク管理装置により、コネクションレス
型のUDP/IP、SNMP(Simple Network Managem
ent Protocol)プロトコルのネットワークの二重化され
た通信路を介して、エージェントを管理するNMSシス
テムにおける通信の信頼性向上方法であって、前記マネ
ージャは、メッセージ送受信時にヘルスチェックによる
通信の正常性の判定と、ネットワーク管理装置の切り替
えによる通信の正常性の判定により、正常な通信路及び
ネットワーク管理装置の組合せでエージェントと通信を
行うとともに、エージェントからのイベント受信時には
受信イベントに付与されているシーケンシャルなメッセ
ージ識別番号の連続性を判定し、連続性の異常時にエー
ジェントへの再送要求を行い、エージェントは、再送要
求に対して再送の開始を知らせ再送するイベントの最初
のメッセージ識別番号を有するイベントを送出した後、
再送要求以降のイベントを再送し、最後に再送の終了を
知らせ再送イベントの最後のメッセージ識別番号を有す
るイベントを送出することにより、前記マネージャは、
受信した再送イベントの連続性を判定し、通信の信頼性
を向上させることを特徴とする。また、マネージャは、
イベント受信の異常時に、エージェントに対して一定周
期でイベントを繰り返し送出させてイベントの欠落をチ
ェックするハートビートチェックを行うことを特徴とす
る。
【0010】本発明のNMSシステムは、二重化された
ネットワーク管理装置を備えるマネージャとエージェン
トがコネクションレス型のUDP/IP、SNMP(Si
mple Network Management Protocol)プロトコルのネッ
トワークの二重化された通信路を介し接続されたNMS
システムであって、前記各ネットワーク管理装置は、ヘ
ルスチェックによる各通信路の正常性の判定を行い、正
常な通信路を指定する通信路の状態情報を管理する通信
路判定機能と、エージェントからのイベントを受信し、
受信イベントに付与されているシーケンシャルなメッセ
ージ識別番号の連続性を判定し、イベントの連続性チェ
ックを行う連続性チェック機能とを有し、前記マネージ
ャは、一方のネットワーク管理装置の通信路判定機能に
より使用中の通信路が異常時に他の通信路への切替と両
方の通信路の異常時に他方のネットワーク管理装置への
切替を行い、連続性判定機能により連続性チェック結果
におけるイベント受信の異常時にエージェントへの再送
要求を行い、再送要求に対してエージェントから再送の
開始を知らせ再送するイベントの最初のメッセージ識別
番号を有するイベントの送出後、再送要求以降のイベン
トの再送、及び再送の終了を知らせ再送イベントの最後
のメッセージ識別番号を有する最後のイベントの送出を
うけることにより、エージェントからのイベントの再送
による連続性チェックを行うことを特徴とする。また、
前記各ネットワーク管理装置は、イベント受信の異常時
に、エージェントから周期的なイベントを送出させてイ
ベントの欠落をチェックするハートビートチェック機能
を有することを特徴とする。
【0011】本発明のNMSシステムにおけるネットワ
ーク管理装置は、エージェントの管理処理を司る実行制
御処理部と、通信路を交互に切り替えてエージェントに
対して一定の周期で通信状態を問い合わせるヘルスチェ
ックを行い、ヘルスチェック結果を状態情報として記憶
し、エージェントとの間の有効な通信路を指定する通信
路状態判定手段と、エージェントからシーケンシャルな
メッセージ識別番号が付与されたメッセージからなるイ
ベント通知を受信し、イベント受信のそれぞれのメッセ
ージ番号の連続性をチェックして不連続を検出したとき
は、エージェントに対しメッセージの再送を要求し、再
送されたイベント受信についても不連続性を検出し、ま
た、不連続の検出等異常時にイベント受信の通信路につ
いて、エージェント側から一定周期でなるイベントを使
用するハートビートチェックの送信を受けて伝送路の異
常等によりイベントが欠落するイベント(トラップ)抜
けを検出し、通信路の監視を行い有効性を判断するメッ
セージ管理処理部と、通信路状態判定手段により、正常
な通信路を使用してメッセージを送信し、自分宛の応答
メッセージを受信し、送信元エージェントを認識してメ
ッセージ管理処理部に出力する通信制御処理部と、通信
路状態判定手段により、エージェントからのイベント
(トラップ)通知を受信し送信元エージェントを認識し
メッセージ管理処理部に出力するイベント受信処理部
と、を有する。
【0012】ネットワーク管理装置は、被管理装置であ
るエージェントの管理処理を司る実行制御処理装置にお
いて、メッセージの要求を通信制御処理装置に対して送
信する。通信制御処理装置では、メッセージ管理処理部
でメッセージを必要な形に加工し、通信制御処理部に渡
す。通信制御処理部では、通信路判定手段を用いて送信
先のエージェントに対し有効となる通信路を指定し、ネ
ットワーク上にそれを送信する。エージェント側では自
分宛のメッセージを受信し、その応答に、送り先のネッ
トワーク管理装置を指定し返信する。通信制御処理部で
は自分宛の応答メッセージを検知するとそれを受信し、
送信元エージェントを認識し、メッセージ管理処理部に
渡す。メッセージ管理処理部ではそれを必要な形に加工
し、実行制御処理部に送信する。また、ネットワーク管
理装置は、エージェントからのイベント通知を検知した
ときは、イベント受信処理部にてそれを受信し、送信元
エージェントを認識し、メッセージ管理処理部に渡す。
メッセージ管理処理部ではそれを必要な形に加工し、実
行制御処理部に送信する。
【0013】ネットワーク管理装置はActive側と
Standby側の二重化構成を採り、NMSに障害が
起きたときは自動的にそれぞれActive/Stan
dbyの状態が切り替わる。この通信制御処理装置に対
して、エージェントとの通信路は2つあり、実際にどち
らの通信路を使用してメッセージを送受信するかは、通
信制御処理部からエージェントに対して、一定の周期で
通信状態を問い合わせるヘルスチェックを行い、ヘルス
チェック結果の記憶情報を有する通信路状態判定手段を
用いて決定する。
【0014】ネットワーク管理装置からエージェントへ
のメッセージ送信、受信(応答)処理については、上記
の通信路状態判定手段を用いて有効と判断された通信路
を使用する。エージェントからのイベント受信(トラッ
プ受信)には、上記通信路状態判定手段を使用して、片
方をActive側通信路、もう一方をStandby
側通信路として認識した上で、メッセージは両方から受
信し、初めて受信したメッセージをNMSとして受理
し、2個目は破棄する。このとき、個々のメッセージに
は、シーケンシャルなメッセージ識別番号が付与されて
おり、メッセージ管理処理部がイベント受信のそれぞれ
のメッセージ番号の連続性をチェックし、不連続を検出
したときは、実行制御処理部を通じてメッセージの再送
を、エージェントに対して要求する。再送されたイベン
ト受信についても不連続性を検出する。
【0015】また、エージェントからのイベント受信の
通信路について、その通信路の状態の有効性を判断する
ために、エージェント側から一定周期でなるイベント
(ハートビートチェック)の送信を行わせることによ
り、伝送路の異常等によりイベントが欠落するイベント
(トラップ)抜けを検出することで、通信路の監視を行
い通信の正常性を保証する(図1、2)。
【0016】
【発明の実施の形態】(構成の説明)本発明のNMSシ
ステムにおける通信の信頼性向上方法及びNMSシステ
ムの一実施の形態を以下説明する。図1は、本実施の形
態のシステム構成の概略ブロックを示す図である。
【0017】本実施の形態においては、マネージャ側の
ネットワーク管理システム(NMSシステム)と、被管
理装置であるエージェント(Agent)3と、エージ
ェント側の二重化された通信路31、32との間に接続
されたルータとから構成され、ネットワーク管理システ
ムは二つのネットワーク管理装置NMS1、NMS2か
ら構成される。ここで、NMSシステムを構成する二つ
のネットワーク管理装置NMS1、NMS2は、それぞ
れネットワーク管理装置としてActive/Stan
dbyのいずれかの状態をとる。
【0018】同図ではNMS1がActive状態にあ
ることを示しており、エージェント3との通信はルータ
を介して行われ、動的ルーティングによりエージェント
側の二つの通信路31、通信路32の何れかを介して通
信が行われる。従って、何れかの通信路等に障害が発生
して通信不能になっても、通信路の切り替えを行い通信
を継続させるようにし、通信路の切り替えを行っても通
信不能の場合には、自動的にNMS2とエージェント3
との通信に切り替えることと、更に同様な通信路31、
32の切り替えを行うことにより通信の信頼性を確保す
る。
【0019】図2は、図1におけるNMSシステム内の
二つのネットワーク管理装置1、2のそれぞれの構成を
示す図である。実行制御処理装置11と、通信路に接続
された通信制御処理装置12とから構成されている。
【0020】実行制御処理装置11は、ネットワーク管
理装置の機能のうち、エージェントの管理処理を司り、
エージェントの装置管理、パフォーマンス管理及び障害
管理などを行い、各管理機能に対応する複数の実行制御
処理部11−1〜11−nに分かれている。
【0021】通信制御処理装置12は、メッセージ管理
処理部121、イベント受信処理部122、通信制御処
理部123及び通信路状態判定部124から構成され
る。通信制御処理装置12は、内部バスを介して実行制
御処理装置11と接続され、ネットワーク管理装置の機
能のうち、各実行制御処理部11−1〜11−nとのイ
ンタフェースを取り、実際にエージェント3と通信を行
うように構成されている。
【0022】本実施の形態の各部の動作ないし機能概要
は以下のとおりである。実行制御処理装置11は、NM
Sとしてエージェントを管理するための一般的な管理処
理部であり、複数の実行制御処理部11−1〜11−n
により前述のエージェントの装置管理、パフォーマンス
管理及び障害管理などを行う。本実施の形態の以下の動
作の説明に関連する動作、機能としては、前記機能を実
現するために必要な所定のメッセージの送信機能、イベ
ント通知の再送要求等、後述するメッセージ送信等の要
求機能を有することを述べるに止め、その他の前記機能
等の既知であるから詳細記述は省略する。
【0023】通信制御処理装置12のメッセージ管理処
理部121は、実行制御処理装置11からメッセージ送
信要求を受けると、送信要求された当該メッセージにメ
ッセージ識別番号を付加したうえで通信制御処理部12
3に渡す。通信制御処理部123では、通信路状態判定
手段124から有効な通信路の指定をうけ、当該通信路
に送信先のエージェント3への前記メッセージを送信す
る。
【0024】エージェント3は、通信路に自分宛のメッ
セージを検出するとそれを受信し、そのメッセージへの
応答メッセージは、受信した前記メッセージ内のメッセ
ージ識別番号をそのまま付与するとともに、受信した前
記メッセージの送信元をそのまま応答メッセージの送信
先として指定して通信路へ送信する。
【0025】通信制御処理部123では、通信路に自分
宛のメッセージを検出するとそれを受信し、メッセージ
管理処理部121に渡し、該メッセージに付与された識
別番号を元に、呼び出した実行制御処理装置11の対応
する実行制御処理部11−1〜11−nへと送出する。
【0026】また、メッセージ管理処理部121では、
一定周期で通信状態の問い合わせを行うヘルスチェック
動作を行う。このヘルスチェック動作では、ヘルスチェ
ックためのメッセージを作成し、通信制御処理部123
を介して当該メッセージの送受信を行い、その結果であ
る有効な通信路の状態情報を通信路状態判断手段124
に格納する。
【0027】また、メッセージ管理処理部121は、エ
ージェント3からのイベント通知の受信(トラップ受
信)動作を行う。イベント受信においては、イベント受
信処理部122がイベント通知の送受信動作を行う。通
信路に自分宛のイベント通知に関するメッセージを検出
すると受信し、メッセージ管理処理部121に渡す。
【0028】メッセージ管理処理部121は、メッセー
ジ内に付与されたエージェント3側がシーケンシャルに
付与するイベント番号を元に、イベント通知の連続性の
チェックを行う。このイベント通知が非連続の場合に
は、その旨を実行制御処理装置11に伝え、エージェン
トに対する再送要求を依頼する。
【0029】実行制御処理装置11からのエージェント
3への再送要求は、メッセージ管理処理部121及び通
信制御処理部123における前述のメッセージの送信動
作により行われ、再送イベントの受信はイベント受信処
理部122で行われる。ここで、再送要求の動作におい
ても、再送の始まりから終わりまでのイベント番号をエ
ージェント3から通知してもらうことにより、メッセー
ジ管理処理部121において、通常のイベント受信と同
様に、再送開始、再送中及び再送終了時の全てのイベン
ト通知に対し連続性のチェックを行う。
【0030】エージェント側から通常のイベント通知が
一定期間(周期)以上こないときに、エージェントから
の一定周期のイベントの繰り返し送出を行うようにして
障害状態を判定するハートビートチェックを行う。
【0031】(動作の説明)図1及び図2に示す本実施
の形態について、図3〜図8に示すフローチャート参照
して、前述のヘルスチェック、イベントの連続性チェッ
ク及びハートビートチェックの動作について詳細に説明
する。
【0032】まず、本実施の形態のヘルスチェック動作
について説明する。SNMPに用いられる通信路におい
て、通信障害が発生してNMSとエージェント間の通信
が物理的に切断されると、NMSからエージェントへの
コントロールが不能となる。このような障害状態の通信
路の使用を回避し、正常な通信路を判定して使用して通
信の信頼性を保証するためにセルフチェック動作が行わ
れる。
【0033】メッセージの送受信動作、例えば、GET
(管理情報の収集)、GETNEXT(管理情報の収
集)及びSET(管理情報の設定)等でのネットワーク
管理装置の動作は前述のとおりであるが、主にメッセー
ジ管理処理部121及び通信路状態判定手段124にお
ける動作手順は以下のようになる。 1、メッセージ送信要求の受付 2、メッセージ識別番号の付与 3、通信路を判定する格納エリアの参照 4、送信先のエージェントに対し有効となる通信路の指
定 5、メッセージ送信 6、応答メッセージ受信 7、送信元エージェントの識別子を確認 8、メッセージ識別子を確認 9、メッセージ送信要求元に応答メッセージの返信 通信路状態判定手段124は、上記メッセージの送受信
手順において正常な通信路を指定するため、通信路の正
常性に関する状態情報等の格納と正常性の判定動作を行
う。これはメッセージ管理処理部121からエージェン
トに対する一定周期のヘルスチェック動作により行われ
る。
【0034】図3は、通信路状態判定手段124におけ
る通信路の状態情報を格納し状態判定を行い正常な通信
路を決定する動作手順を示すフローチャートである。 (1)メッセージ管理処理部121は、所定のタイムア
ウト期間のタイマを起動し(S31)、通信路の状態判
定の動作を開始する(S32)。 (2)NMS1から通信路31、つまり、ポート(イン
ターネットアドレスポート)IPn1からポートIPa
1に対し、伝送路の導通試験用のPingコマンドを発
行し、その結果である正常か障害かの状態情報を通信路
状態判定手段124の格納エリア1に格納する(S3
3、S34)。 (3)NMS1から通信路32、つまり、ポートIPn
1からポートIPa2に対し、前記Pingコマンドを
発行し、その結果である正常か障害かの状態情報を通信
路状態判定手段124における格納エリア2に格納する
(S35、S36)。 (4)通信路状態判定手段124は、上記処理による状
態情報のそれぞれの格納エリア1、2への格納が完了し
一方でも正常であると(S37)、格納エリア1、2に
格納された状態情報に対して、図4に示す論理により正
常な通信路を決定する(S38)。なお、図4に示す論
理では、何れかの通信路の状態情報が正常の場合に当該
通信路を有効通信路として決定して記憶し、また、両方
の通信路の状態情報が正常の場合には何れかの通信路が
優先するものとして当該優先する通信路を有効通信路と
して決定して記憶する。 (5)格納エリア1、2の状態情報が共に正常でない場
合(S37)、又は状態情報が格納されずに前記タイマ
がタイムアウトした場合は、NMSをNMS1からNM
S2に切り替える(S39)。なお、以上の処理手順
(1)〜(5)の動作はNMS2においても同様に行わ
れる。
【0035】以上の動作により、NMSの二つの通信路
のうち一方をActive側として使用し、もう一方は
Standby側としてActive側で障害が起きた
ときに自動的に通信路が切り替わり動的ルーティングに
よりどちらかでの通信が可能となる。また、NMSもN
MS1とNMS2の一方がActive状態であり、N
MS自体の障害に対する切り替えが実現される。つま
り、何れかの通信路に障害が発生して通信不能になって
も、通信路の切り替えが行われることで通信が継続し、
もし通信路を切り替えても通信不能の場合には、NMS
を自動的にNMS2に切り替え、NMS2とエージェン
ト3との通信に切り替えることにより通信を継続できる
こうに制御する。
【0036】次に、メッセージ管理処理部121におけ
るイベント受信の信頼性の保証のためのメッセージ識別
番号の連続性チェックについて説明する。
【0037】SNMPに用いられるエージェントからマ
ネージャへのイベント通信は片方向通信であるため、こ
の通信路等に障害が起てもNMS側がその障害を認識す
ることができないことがある。このような片方向のメッ
セージ送信であるイベントに対する信頼性を保証するた
めに、メッセージ管理処理部121は、通常イベントの
受信及び異常時の再送イベントの受信によるメッセージ
識別番号の連続性チェックを行う。
【0038】図5は、イベント通信でのメッセージの送
受信シーケンスの一例を示す図である。NMSは、エー
ジェントから「通常イベント1」、「通常イベント2」
の順に通常イベントが受信された後に「通常イベント
5」が受信され、「通常イベント3」及び「通常イベン
ト4」が欠落する不連続が検出されたのでエージェント
への再送要求を行った例を示している。エージェント
は、再送要求に対して再送の開始を知らせる情報及び再
送するイベントの最初のメッセージ識別番号情報「3」
を有する「通常イベント6」を送出した後、再送要求以
降のイベントを再送する。最後に再送の終了を知らせる
情報及び再送イベントの最後のメッセージ識別番号情報
「6」を有する「通常イベント7」を送出して、再送イ
ベントの送受信を終了している。
【0039】図6は、通常イベントにおけるメッセージ
識別番号の連続性チェックの処理フローチャートを示す
図であり、図7は、再送イベントにおけるメッセージ識
別番号の連続性チェックの処理フローチャートを示す図
である。
【0040】連続性のチェック動作は、識別番号格納メ
モリ(格納メモリ)A、Bを設けて、受信イベントのメ
ッセージ識別番号を順次格納(上書)し、現在受信した
イベントのメッセージ識別番号と直前に格納したメッセ
ージ識別番号とを比較することにより行う。
【0041】図6に示す通常イベントの受信動作では、
通常イベント用の識別番号格納メモリAを用いて通常イ
ベントの受信に対し次の処理を行う。 (1)メッセージ管理処理部121は、エージェントか
らの最初のイベントを受信すると(S61)、格納メモ
リにAにその識別番号を格納する(S64)。 (2)2番目以降のイベントを受信すると(S61)、
受信イベントの識別番号と格納メモリAの識別番号とを
比較して連続性を判断し(S62)、連続する場合は格
納メモリAの識別番号を上書きし(S64)、不連続の
場合は再送要求を行い(S63)、格納メモリAの識別
番号を上書きする(S64)。 前記処理(2)において図5に示す通常イベント2−5
ような不連続が検出され、NMSから再送要求がされる
と、エージェントは再送要求以降のイベントを送出し、
図7に示す再送イベントの連続性のチエックが開始され
る。ここで、再送動作の開始後は再送に関連する通常イ
ベントは再送の開始及び終了のイベントのみである。図
7に示す再送イベントの受信動作では、再送イベント用
の識別番号格納メモリBを用いて、再送イベントの受信
に対し次の処理を行う。 (1)メッセージ管理処理部121は、受信したイベン
トが通常イベントか再送イベントかを判断する(S7
1)。通常のイベントの場合、受信した通常イベントが
再送開始を知らせるイベントなら(S72)、そのイベ
ントに含まれている最初の再送イベントの識別番号を格
納メモリBに格納する(S73)。 (2)受信したイベントが再送イベントの場合(S7
1、再送を開始する通常イベントの受信後は再送イベン
トが受信される)、格納メモリBの識別番号と再送イベ
ントの識別番号とを比較して連続性をチエックし(S7
6)、連続している場合は当該再送イベントの識別番号
を格納メモリBに上書きする。この動作による連続性の
チェックを繰り返し、不連続が検出された場合は再送要
求を行い(S78)、格納メモリBを上書きする(S7
8)。 (3)再送イベントに続き再送終了を知らせる通常イベ
ントが受信された場合(S71、S72)、当該イベン
トの最後の再送イベントの識別番号と格納メモリBの識
別番号との比較を行い一致した場合(S74)、再送イ
ベント動作を終了する。不連続が検出された場合(S7
4)は、再送要求を行う(S75)。
【0042】次に、エージェント側から通常のイベント
通知が一定期間(周期)以上こないときに、エージェン
トからの一定周期のイベントの繰り返し送出を行うよう
にして障害状態を判定するハートビートチェック動作に
ついて説明する。
【0043】メッセージの識別番号の連続性チェック
は、イベント通知に含まれるメッセージ識別番号と前回
のイベント通知のメッセージ識別番号との比較によって
行われるが、この動作ではイベント通知が来て初めて不
連続が検出できることから、イベント通知が途絶えた場
合には、イベント通知がエージェントから送信されてい
ないのか、イベント通知が通信路の障害等により抜けて
いるのかの判断ができないことがある。このような問題
を解決するために、エージェント側からイベント通知が
一定期間(周期)内にこないときは、エージェント側か
ら一定周期でイベントの繰り返し送出させてチェックす
るハートビートチェックのイベント通知を送信させる。
【0044】図8は、ハートビートチェックの動作フロ
ーチャートを示す図である。イベント受信毎に動作をリ
セットできるタイマを使用し、エージェント側からの一
定周期のイベント受信毎に前記タイマをリセットする動
作により、タイマがタイムアウトすることなく所定数の
イベントが受信できたときにハートビートチェックが正
常であるとする。 (1)NMSは、イベント受信毎にタイマ動作をリセッ
トできるタイマを起動し(S81)、エージェント側に
実装したハートビートチェック機能によるタイマ監視を
開始する(S82)。 (2)イベント受信に対して受信毎にタイマをリセット
する(S83)。 (3)イベント受信がタイマの設定時間(周期)内で所
定数受信された場合(S84Y)にハートビートチェッ
クを終了し(S86)、1回でも前記周期内に受信され
ずにタイマがタイムアウトした場合(S84N)は、通
信路を切り替える(S85)。
【0045】このようなイベント受信のタイマ監視によ
り、一定時間を越えてイベント通知がないときは、その
通信路等は通信不能と見なすことで、他の通信路への切
換を行う。また、他の通信路においても正常性が検出さ
れないときはネットワーク管理装置への切換を行う。
【0046】(他の実施の形態)図9は、NMSシステ
ムにおける通信の信頼性向上方法及びNMSシステムの
他の実施の形態を示す図である。本実施の形態では、そ
れぞれ二つの出力ポートを有するNMS1、2と複数の
エージェントAgent1、2間をハブ1、2を介して
接続した構成を採用するものである。NMS1、2はそ
れぞれハブ1、2を介して二重化された通信路を有し、
また、エージェントが複数のシステム構成であるが、本
実施の形態においても一方のNMSがヘルスチェック動
作により正常性を判定した結果、いずれの通信路につい
ても正常な状態情報が検出されない場合はNMSを互い
に切り替える点で前記実施の形態と同様である。それぞ
れのエージェントに対するイベントの連続性チェック及
びハーフビートチェックについても同様にして実地され
る。
【0047】また、以上説明した実施の形態において
は、イベント受信での連続性チエックの結果、異常の判
定が得られた場合にハートビートチエックでの異常の判
定結果に基づいて通信路の切換を制御するシステムを説
明したが、更に他の実施の形態として、正常な通信路及
びネットワーク管理装置の組合せを選択することが可能
なように、ハートビートチェック毎に通信路の切換とネ
ットワーク管理装置の切換を交互に実施するように構成
することができる。また、連続性チエックの結果により
通信路及びネットワーク管理装置を同様に切り替える構
成とすることができる。
【0048】
【発明の効果】本発明によれば、物理レベルの通信路断
等の障害を一定周期のヘルスチェックとイベント通知で
の連続性チェックにより、NMSシステムの系切換えを
行うことにより回避することができるから、UDP/I
Pレイヤ以下のレイヤの通信において、既存のプロトコ
ルのメッセージ仕様を変更しなくても通信に対する高い
信頼性を保証することが可能である。
【0049】また、イベント通知は片方向通信であるに
もかかわらず、イベント通知の通信路に関する通信路断
等の判断を自立的に行うことができ、特に、イベント通
知に関する再送メカニズムやハートビートチェックを実
装することで、SNMPレイヤプロトコルの枠組みの中
でイベント通知通信の高い信頼性を保証することが可能
である。
【0050】更に、本発明によれば、通信路及びネット
ワーク管理装置の何れをも二重化し、ヘルスチェック及
び連続性チェック、更にはハートビートチェックを行っ
て障害を判断するように構成しているので、通信路の異
常に加えてネットワーク管理装置自体の障害をも監視す
ることが可能となる。
【図面の簡単な説明】
【図1】本発明のNMSシステムにおける通信の信頼性
向上方法及びNMSシステムの一実施の形態の概要構成
を示す図である。
【図2】本実施の形態のネットワーク管理装置の構成例
を示す図である。
【図3】本実施の形態の通信路状態判定手段の動作フロ
ーチャートを示す図である。
【図4】本実施の形態の通信路状態判定手段に格納され
た伝送路の状態情報及び正常な伝送路の決定情報の例を
示す図である。
【図5】本実施の形態のイベント通信のメッセージの送
受信シーケンスを示す図である。
【図6】本実施の形態の通常イベントでの連続性チェッ
クの動作フローチャートを示す図である。
【図7】本実施の形態の再送イベントでの連続性チェッ
クの動作フローチャートを示す図である。
【図8】本実施の形態のハートビートチェックの動作フ
ローチャートを示す図である。
【図9】本発明のNMSシステムにおける通信の信頼性
向上方法及びNMSシステムの他の実施の形態を示す図
である。
【符号の説明】
1、2 ネットワーク管理装置 3 エージェント 31、32 通信路 11−1〜11−n 実行制御処理部 11 実行制御処理装置 12 通信制御処理装置 121 メッセージ管理処理部 122 イベント受信処理部 123 通信制御処理部 124 通信路状態判定部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04L 12/26 H04L 11/20 C 12/28 13/00 311 29/14 (56)参考文献 特開2000−4248(JP,A) 特開 平9−321789(JP,A) 特開 平11−275088(JP,A) 特開 平9−247146(JP,A) 特開 平10−51451(JP,A) 特開 平11−177552(JP,A) 特開 平3−255556(JP,A) 特開 平8−163165(JP,A) 特開 平6−197112(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 13/00 G06F 15/16 H04L 12/00 H04L 29/00

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 マネージャが二重化されたネットワーク
    管理装置により、コネクションレス型のUDP/IP、
    SNMP(Simple Network Management Protocol)プロ
    トコルのネットワークの二重化された通信路を介して、
    エージェントを管理するNMSシステムにおける通信の
    信頼性向上方法であって、 前記マネージャは、メッセージ送受信時にヘルスチェッ
    クによる通信の正常性の判定と、ネットワーク管理装置
    の切り替えによる通信の正常性の判定により、正常な通
    信路及びネットワーク管理装置の組合せでエージェント
    と通信を行うとともに、エージェントからのイベント受
    信時には受信イベントに付与されているシーケンシャル
    なメッセージ識別番号の連続性を判定し、連続性の異常
    時にエージェントへの再送要求を行い、エージェント
    は、再送要求に対して再送の開始を知らせ再送するイベ
    ントの最初のメッセージ識別番号を有するイベントを送
    出した後、再送要求以降のイベントを再送し、最後に再
    送の終了を知らせ再送イベントの最後のメッセージ識別
    番号を有するイベントを送出することにより、前記マネ
    ージャは、受信した再送イベントの連続性を判定するこ
    とを特徴とするNMSシステムにおける通信の信頼性向
    上方法。
  2. 【請求項2】 マネージャは、イベント受信の異常時
    に、エージェントに対して一定周期でイベントを繰り返
    し送出させてイベントの欠落をチェックするハートビー
    トチェックを行うことを特徴とする請求項1記載のNM
    Sシステムにおける通信の信頼性向上方法。
  3. 【請求項3】 二重化されたネットワーク管理装置を備
    えるマネージャとエージェントがコネクションレス型の
    UDP/IP、SNMP(Simple Network Management
    Protocol)プロトコルのネットワークの二重化された通
    信路を介し接続されたNMSシステムであって、 前記各ネットワーク管理装置は、ヘルスチェックによる
    各通信路の正常性の判定を行い、正常な通信路を指定す
    る通信路の状態情報を管理する通信路判定機能と、エー
    ジェントからのイベントを受信し、受信イベントに付与
    されているシーケンシャルなメッセージ識別番号の連続
    性を判定し、イベントの連続性チェックを行う連続性チ
    ェック機能とを有し、 前記マネージャは、一方のネットワーク管理装置の通信
    路判定機能により使用中の通信路が異常時に他の通信路
    への切替と両方の通信路の異常時に他方のネットワーク
    管理装置への切替を行い、連続性判定機能により連続性
    チェック結果によるイベント受信の異常時にエージェン
    トへの再送要求を行い、再送要求に対してエージェント
    から再送の開始を知らせ再送するイベントの最初のメッ
    セージ識別番号を有するイベントの送出後、再送要求以
    降のイベントの再送、及び再送の終了を知らせ再送イベ
    ントの最後のメッセージ識別番号を有する最後のイベン
    トの送出をうけることにより、エージェントからのイベ
    ントの再送による連続性チェックを行うことを特徴とす
    るNMSシステム。
  4. 【請求項4】 前記各ネットワーク管理装置は、イベン
    ト受信の異常時に、エージェントから周期的なイベント
    を送出させてイベントの欠落をチェックするハートビー
    トチェック機能を有することを特徴とする請求項3記載
    のNMSシステム。
JP2000012311A 2000-01-20 2000-01-20 Nmsシステムにおける通信の信頼性向上方法及びnmsシステム Expired - Fee Related JP3509847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000012311A JP3509847B2 (ja) 2000-01-20 2000-01-20 Nmsシステムにおける通信の信頼性向上方法及びnmsシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000012311A JP3509847B2 (ja) 2000-01-20 2000-01-20 Nmsシステムにおける通信の信頼性向上方法及びnmsシステム

Publications (2)

Publication Number Publication Date
JP2001202305A JP2001202305A (ja) 2001-07-27
JP3509847B2 true JP3509847B2 (ja) 2004-03-22

Family

ID=18540046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000012311A Expired - Fee Related JP3509847B2 (ja) 2000-01-20 2000-01-20 Nmsシステムにおける通信の信頼性向上方法及びnmsシステム

Country Status (1)

Country Link
JP (1) JP3509847B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003225360A (ja) * 2002-02-04 2003-08-12 Yamasa Kk スロットマシン
JP2010026626A (ja) * 2008-07-16 2010-02-04 Ono Sokki Co Ltd データを記録する方法、システム及びプログラム
JP5740105B2 (ja) * 2010-06-29 2015-06-24 株式会社東芝 通信システムのアプリケーション監視方法
US8745157B2 (en) 2011-09-02 2014-06-03 Trading Technologies International, Inc. Order feed message stream integrity
WO2013180146A1 (en) 2012-05-30 2013-12-05 Nec Corporation Internet protocol (ip) network device, network system, method thereof
JP6418320B2 (ja) * 2015-03-23 2018-11-07 日本電気株式会社 情報処理装置、クラウドサーバ装置、中継装置、情報処理システム及び方法、及び、プログラム

Also Published As

Publication number Publication date
JP2001202305A (ja) 2001-07-27

Similar Documents

Publication Publication Date Title
US6304546B1 (en) End-to-end bidirectional keep-alive using virtual circuits
US5859959A (en) Computer network with devices/paths having redundant links
JP3388512B2 (ja) パケット通信ネットワークにおける経路指定の管理
US7590053B2 (en) Multiple endpoint protection using SPVCs
EP1391079B1 (en) Method and system for implementing a fast recovery process in a local area network
US20060126495A1 (en) System and methods for detecting network failure
JP2001127761A (ja) Mpls通信方式における通信データ確認試験方法及びその方法を利用するルータ,交換機,通信システム
JP3509847B2 (ja) Nmsシステムにおける通信の信頼性向上方法及びnmsシステム
US6535991B1 (en) Method and apparatus for providing reliable communications in an intelligent network
JPH07264233A (ja) ルート高速切替方法及びルータ装置
Clark Fault isolation and recovery
JP3346295B2 (ja) ネットワーク管理システムにおける信頼性通信方式、通信方法、および記録媒体
KR101587332B1 (ko) 컨트롤러와 네트워크 장치 간 연결 상태 확인 방법
JP3666412B2 (ja) 通信システム
JP3226023B2 (ja) Snmpのtrap管理方法と装置
JP3080936B2 (ja) ネットワーク管理システム
JP3398461B2 (ja) ネットワーク環境で使用されるシステム及び該システムに実装される装置
JPH10262066A (ja) コネクション確立方式
KR100491882B1 (ko) 무선가입자망의 이중화 기지국운용장치 및 그 방법
KR20010084658A (ko) 망관리 시스템에서 통신망 구성요소의 동작상태 모니터링방법
JP3351866B2 (ja) 通信端末装置の伝送制御方法
Beranek Host Access Protocol specification
JPH08331206A (ja) ネットワーク管理システム
KR100405661B1 (ko) 게이트웨이에서 에이전트를 이용한 고 가용성 운용 시스템및 그 운용방법
Beranek RFC0907: Host Access Protocol specification

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031223

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080109

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090109

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100109

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees