JPH11243422A - 自律組織間診断システム - Google Patents

自律組織間診断システム

Info

Publication number
JPH11243422A
JPH11243422A JP4401598A JP4401598A JPH11243422A JP H11243422 A JPH11243422 A JP H11243422A JP 4401598 A JP4401598 A JP 4401598A JP 4401598 A JP4401598 A JP 4401598A JP H11243422 A JPH11243422 A JP H11243422A
Authority
JP
Japan
Prior art keywords
observation
agent
autonomous
diagnostic
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4401598A
Other languages
English (en)
Other versions
JP3485789B2 (ja
Inventor
Osamu Akashi
修 明石
Toshiharu Sugawara
俊治 菅原
Kenichiro Murakami
健一郎 村上
Mitsuru Maruyama
充 丸山
Naohisa Takahashi
直久 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04401598A priority Critical patent/JP3485789B2/ja
Publication of JPH11243422A publication Critical patent/JPH11243422A/ja
Application granted granted Critical
Publication of JP3485789B2 publication Critical patent/JP3485789B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【課題】 自ら管理する経路が広域網中で正しく広報さ
れているかどうかを、管理者を介さないで自動的に検証
し、障害がある場合はそれを発見し、その原因を効率的
に解析することができる自律組織間診断システムを提供
すること。 【解決手段】 観測機能を有するエージェントボディ2
0及び診断知識12cを有するエージェントヘッド10
を備えるエージェントを、各自律システムに配置し、観
測と診断とはローカルに行なう。他のエージェント6
0,70,80からのデータの要求に対しては、独自の
観測手段を用いて必要な情報を収集し、必要に応じて、
統計処理や他のエージェント60,70,80との更な
る協調動作をし、求められた結果を返す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、単一組織が管理す
る単位である自律システム(Autonomous System;A
S)が複数相互接続された広域網に設置され、自組織が
アドバタイズした経路情報が正しく意図を反映して伝わ
っているかどうかを確認する自律組織間診断システムに
関する。
【0002】
【従来の技術】広域網における多くのASを相互接続す
るインターネットにおいて、自組織がアドバタイズした
経路情報が正しく意図を反映して伝わっているかどうか
を確認することは重要である。経路情報の振舞を理解す
るには、経路情報制御自体が有する下記の性質のため、
他のASにおいて経路情報を定常観測し、その解析を行
う必要がある。
【0003】上記性質の第1番目として、あるASがア
ドバタイズした経路情報は、各ASにおいて各々のポリ
シーに基づき経路選択などの情報の加工が行われ伝搬さ
れる。そのため、同じオリジンでアドバタイズした情報
が、各AS毎に(空間的に)変化するという性質があ
る。第2番目として、経路の選択とアドバタイズには、
静的な選択規則のみでなく、動的なパラメータである物
理的な回線やルータの障害、他のプロトコルとの相互作
用が影響するため、経路情報は時間的に変動するという
性質がある。
【0004】従来は、経路情報が正しく意図を反映して
伝わっているかどうかを確認するには、WEBを用いて
広域網中の特定地点のルータの経路情報を表示させ、自
ら広報した経路情報が正しいかどうか検証したり、ネッ
トワークの到達可能性を調べるツールを実行し、その結
果を表示させて検証したり、様々なツールをネットワー
ク管理者が専門知識に基づいて使用し、その結果を総合
して障害の解析を行っていた。
【0005】
【発明が解決しようとする課題】ところで、従来のシス
テムは、上述したように種々のツールを用いて経路情報
を自AS以外の地点で観測可能とするが、これらのツー
ルは特定の情報をオペレータが取得するのを前提とした
ツールであり、トラフィックや負荷集中の観点からも定
常観測への適用は困難であるという問題を有する。ま
た、場合によっては管理者が、他のASの管理者と連絡
を取って情報を集め、解析を行うことも必要であった
が、全世界的に広がる広域網では、時差や言葉の障壁、
または管理主体の異なるネットワーク管理者が密に連係
する必要があるため、効率が非常に悪いという問題があ
った。また、これらの情報を絶えず集めて監視解析し、
異常がないことを検証することは、極めて困難であると
いう問題があった。更に、アクセス機能付きのルータを
用意し、専用サーバを用いてそのルータが有する経路情
報を集めて解析する方法もあるが、同様にトラフィック
や負荷集中の観点からも定常観測への適用は困難である
という問題があった。
【0006】本発明は、上記事情に鑑みてなされたもの
であり、自ら管理する経路が広域網中で正しく広報され
ているかどうかを、管理者を介さないで自動的に検証
し、障害がある場合はそれを発見し、その原因を効率的
に解析することができる自律組織間診断システムを提供
することを目的とする。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、複数の自律システムが相互接続され、前
記自律システムがアドバタイズした経路情報が正しく他
の自律システムに反映し伝わっているかを確認する自律
組織間診断システムにおいて、前記各自律システム毎
に、診断知識と観測機能をもつエージェントを配置し、
当該診断知識に基づいて観測を行う観測手段と、前記エ
ージェントの持つ観測戦略に基づいて、前記エージェン
トが行う観測の頻度と密度とを切替える切替手段と、診
断及び観測実行のために、タビュレーション技法を用い
た実行手段と、適応型の実行動作制御を行う制御手段
と、測定結果及び前記診断知識に基づき他のエージェン
トと協調し情報を交換し、網の障害診断を行う診断手段
とを有することを特徴とする。まず、経路情報の振舞を
理解するには、他ASにおいて経路情報を定常観測し、
その解析を行なう必要がある。また、障害原因解析のた
めには、エキスパートの診断知識をシステムが持つ必要
がある。本発明では、観測機能、診断知識を持ったエー
ジェントを各ASに配置し、観測と診断とはローカルに
行なう。他のエージェントからデータの要求に対して
は、独自の観測手段を用いて必要な情報を収集し、必要
に応じて、統計処理や他のエージェントとの更なる協調
動作をし、求められた結果を返す。このようなシステム
においては、必要に応じて協調して観測結果を交換し、
障害の通知、解析を行なうことにより、システム内のト
ラフィックを押さえることができる。また、外部のAS
で新たに別の観測が必要な時は、他のASエージェント
に依頼し、観測結果を返してもらうことで観測を行うこ
とができる。また、本発明は、前記切替手段が、観測負
荷の観点から、比較的負荷の軽い大域的なデータや統計
データから、障害の予測をし、仮説を絞り込みながら、
観測負荷の高い観測や診断を効率的に切り替えることを
特徴とする。また、本発明は、前記切替手段が、比較的
観測の負荷の軽い全経路数とその変動周期の観測、特定
のASをオリジンとする経路数の観測、及び各経路毎の
詳細な観測を効率的に切り替えることを特徴とする。更
に、本発明は、前記エージェントが有する前記診断知識
及び前記観測機能は、各々エージェントヘッド及びエー
ジェントボディとして分割されて実装されることを特徴
とする。
【0008】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態による自律組織間診断システムについて詳細に
説明する。図1は、本発明の一実施形態による自律組織
間診断システムの全体構成を示すブロック図である。図
1に示されたように、エージェントは、診断のための知
識処理を行なうエージェントヘッド10(ヘッダ部)
と、経路情報の観測や診断のためのツール22、データ
ベース28等からなるエージントボディ20(ボディ
部)とから構成される。エージェントボディ20はその
AS毎に独自のツール、実装を用いることができる。
【0009】このようにエージェントを、エージェント
ヘッダ10とエージェントボディ20とに分割した理由
は、特定のツールや観測手段の実装、得られる統計デー
タといった環境独自の値と、共通な知識を分離すること
によりヘッダ部を様々な環境で共通に用いることができ
るようにするためである。
【0010】エージェントヘッド10は、以下の(a)
〜(c)の部分からなる。 (a)推論エンジン12a…観測された事象から仮説を
取りだし、順次その検証のためのルールをプランニング
し、実行する (b)観測制御モジュール(観測戦略制御部12b)…
観測動作の実行と、その観測戦略の選択・切換えを指示
する
【0011】(c)診断知識12c,戦略の記述 −診断知識12cは、特定の事象に対する複数の仮説を
記述し、それぞれ検証するためのルールを含む。仮説
は、更に詳細なレベルの複数の仮説を含むことが可能。
−戦略は、実行する複数の観測ルールとその時間間隔、
結果の値を解釈して動作する関数から成る。−環境毎に
異常なる情報や、観測結果を統計処理した結果得られ
る、時間的に変動する変数を持つ。
【0012】上記変数は、知識の記述に使われ、値の更
新方法関してはエージェントヘッド10で記述し、エー
ジェントボディ20で値が生成される。エージェントヘ
ッド10は、予め定められたインタフェースに従って、
エージェントボディ20のツールを使用してデータを参
照する。また、必要に応じて他のエージェントと会話,
協調を行なう機能を有する。診断のための推論エンジン
12aは、オペレータ又は内部の観測制御モジュールか
らの通知イベントにより起動される。ルールは主に、外
部から必要なデータを取得するための値取得関数及びそ
の仮引数(値は実行時に束縛される)と、取得したデー
タを引数にその中味を解釈し、最終的にルール全体の真
偽を決定する評価関数とからなる。
【0013】協調動作を実現するためには検証ルールの
中で、ローカルに実行可能か、他に依頼すべきかを記述
して、実行時に他のエージェントに要求メッセージを送
信する。エージェントボディ20は、以下の要素からな
る。 ・診断ツール群22…ICMPを使ったツール,ネット
ワーク情報データベースへの問い合わせ機能 ・監視プロセス −ルータモニタ24…経路情報の変動を監視し、統計処
理したデータを提供する −アプリケーションモニタ26…DNS(Domain Name
System)やsendmailといったネットワークを用いる主な
アプリケーションの出力するログデータを監視
【0014】これらのプロセスは、観測制御モジュール
から、データ取得,観測等の処理要求を受け、統計処理
をして観測結果を返す。観測結果に対する判断、すなわ
ち特定の事象に関する警報イベントの生成等は、観測制
御モジュールで判断する。エージェントが有する診断知
識12cは、システムの提供する仮説検証フレームワー
クの中で記述し、システムの内部処理とは独立に、エキ
スパートの知識を追加、変更ができるようにする。
【0015】また、動的に変化するネットワークに関す
る診断知識を表現するために、そのAS固有のローカル
な事象や、経路数などの動的に変化する値,またそのパ
ラメータの変動の傾向を表す値を表記可能とし、システ
ムが値の生成を行なう。これらの値は、診断知識12c
にパラメータとして与え、診断知識12cに反映する。
以上説明した構成のエージェントを有するASがインタ
ーネット等の広域網50を介して相互接続されている。
【0016】各エージェントに、観測戦略に従って観測
の頻度,密度を切り換える機能を導入して、効率化をす
る。すなわち、観測負荷の観点から、比較的負荷の軽い
大域的なデータや統計データから、障害の予測をし、仮
説を絞り込みながら、観測負荷の高い観測や診断は効率
的に実行する。戦略は、以下の3段階を切り換える。
【0017】(1)比較的観測の負荷の軽い大域的なデ
ータの観測…マクロ戦略。例えば、全経路数とその変動
周期の観測 (2)ある特定の性質を持つデータの観測…メソ戦略。
例えば、特定のASをオリジンとする経路数の観測 (3)各経路毎の詳細な観測…ミクロ観測
【0018】本実施形態における自律組織間診断システ
ムは、値取得関数による値の生成をタビュレーション技
法を用いて効率化を行なう。これは、仮説検証処理の中
で実行時に値取得関数の引数に値を束縛し実行するが、
値取得関数は外部のルータやモニタへの問合せを行なう
コストの高い関数であること、その結果得られる値が仮
説検証における多くのルールに共通に含まれることか
ら、特に本実施形態におけるシステムのような診断処理
システムには有効である。
【0019】例えば、自ASのルータへの問合せにより
経路情報データのサマリを取得し、その結果得られる相
手AS中の経路制御プロセスのアドレス,状態,全経路
エントリ数などは多くのルールにおいて参照される値で
あり、その有効利用は重要である。タビュレーションで
用いる表の値は、有効時間を設定し、システムが値の消
去処理を行う。
【0020】システムは、ルールの実行時間や、タイム
アウト事象,最終的な仮説の検証結果をローカルな知識
として蓄え、これを参照することによりフィードバック
機能を実現する。変数パラメータとフィードバック機能
により、エージェントは環境に適応するように振舞を変
える。
【0021】次に、図2を参照して本発明の一実施形態
による自律組織間診断システムの動作について説明す
る。図2は、本発明の一実施形態による自律組織間診断
システムの動作を説明するための説明図である。図2に
示した例においては、ASxとASyはBGP peer
であり、ASyからアドバタイズされた経路はASzに伝
わっている。
【0022】いま、何らかの障害が発生し、ASyは障
害発生をASxに通知せず、突然AS yが自AS番号を変
えてしまった場合を例に挙げて説明する。おの場合の動
作は以下に示す通りである。
【0023】(1)ASxのルートモニタ24は、経路
エントリの突然の減少を観測する(=マクロレベル)。
この観測がなされるとルートモニタ24は、警報メッセ
ージを自ASのエージェントRxに送る。警告がルート
モニタ24から送られてくると、ASxは過去のAS毎
の経路数の記録と比較することにより、減少した経路
は、ある特定のAS(=ASy)からの経路であること
を判明する(=メソレベル)。
【0024】(2)ASx内のエージェントRxは、仮説
リストから、対応する複数の仮説を取りだし、順次検証
するためのルールをプラニング,実行する。この場合
は、最初にASyのボーダルータへの到着制を到着性を
検証するが、ASxとASyの間のTCP/IPレベルの
障害は検出されない。また、ASxにおいて、最近ルー
タの設定が変えられていないことも確認する。 この例
では、説明のため、ASyにはエージェントは存在しな
いとして説明を行なう。もし存在した場合は、このエー
ジェントとの協調により、仮説の検証は容易である。
【0025】(3)自AS内の情報のみでは、もはやこ
れ以上の解析は不可能であるため、ASx内のエージェ
ントRxは、他のAS(図2の例においてはASx)中の
エージェントRzと協調して、診断を行なう。具体的に
は、ASx中の経路Ex,ASy中の経路Eyに関するBG
P情報を調査するように依頼する。(ミクロレベルの観
測)
【0026】(4)エージェントRxは、依頼された調
査を行ない、Rxに以下の結論を送る。・ASxをオリジ
ンとし、ASyを経由して、アドバタイズされた経路Ex
はASxの経路表にはない。・経路EyはASxの経路表
に存在する。しかし、オリジンAS番号は、ASyに変
わっている。(5)ASz内のエージェントRxは、AS
z内のエージェントRxからの報告を受け取り、エージェ
ントRxはASyのAS番号がASy'に変わったのではな
いかと、推論する。
【0027】
【発明の効果】以上説明したように、本発明において
は、診断および観測実行時に、タビュレーション技法を
用いた実行機構を提供し、適応型の実行動作制御を行う
ことにより、自ら管理する経路が広域網中で正しく広報
されているかどうかを管理者を介さないで自動的に検証
し、もし障害がある場合はそれを発見し、その原因を効
率的に解析することが可能となるという効果がある。
【図面の簡単な説明】
【図1】 図1は、本発明の一実施形態による自律組織
間診断システムの全体構成を示すブロック図である。
【図2】 本発明の一実施形態による自律組織間診断シ
ステムの動作を説明するための説明図である。
【符号の説明】
10…エージェントヘッド、12a…推論エンジン、1
2b…観測戦略制御部、12c…診断知識、20…エー
ジェントボディ、22…診断ツール群、24…ルータモ
ニタ、26…アプリケーションモニタ、28…データベ
ース、ASa〜ASc,ASx〜ASz…自律システム、R
x,Rz…エージェント。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 丸山 充 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 高橋 直久 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数の自律システムが相互接続され、前
    記自律システムがアドバタイズした経路情報が正しく他
    の自律システムに反映し伝わっているかを確認する自律
    組織間診断システムにおいて、 前記各自律システム毎に、診断知識と観測機能をもつエ
    ージェントを配置し、当該診断知識に基づいて観測を行
    う観測手段と、 前記エージェントの持つ観測戦略に基づいて、前記エー
    ジェントが行う観測の頻度と密度とを切替える切替手段
    と、 診断及び観測実行のために、タビュレーション技法を用
    いた実行手段と、適応型の実行動作制御を行う制御手段
    と、 測定結果及び前記診断知識に基づき他のエージェントと
    協調し情報を交換し、網の障害診断を行う診断手段とを
    有することを特徴とする自律組織間診断システム。
  2. 【請求項2】 前記切替手段は、観測負荷の観点から、
    比較的負荷の軽い大域的なデータや統計データから、障
    害の予測をし、仮説を絞り込みながら、観測負荷の高い
    観測や診断を効率的に切り替えることを特徴とする請求
    項1記載の自律組織間診断システム。
  3. 【請求項3】 前記切替手段は、比較的観測の負荷の軽
    い全経路数とその変動周期の観測、特定のASをオリジ
    ンとする経路数の観測、及び各経路毎の詳細な観測を効
    率的に切り替えることを特徴とする請求項2記載の自律
    組織間診断システム。
  4. 【請求項4】 前記エージェントが有する前記診断知識
    及び前記観測機能は、各々エージェントヘッド及びエー
    ジェントボディとして分割されて実装されることを特徴
    とする請求項1記載の自律組織間診断システム。
JP04401598A 1998-02-25 1998-02-25 自律組織間診断システム及び自律システム Expired - Lifetime JP3485789B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04401598A JP3485789B2 (ja) 1998-02-25 1998-02-25 自律組織間診断システム及び自律システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04401598A JP3485789B2 (ja) 1998-02-25 1998-02-25 自律組織間診断システム及び自律システム

Publications (2)

Publication Number Publication Date
JPH11243422A true JPH11243422A (ja) 1999-09-07
JP3485789B2 JP3485789B2 (ja) 2004-01-13

Family

ID=12679869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04401598A Expired - Lifetime JP3485789B2 (ja) 1998-02-25 1998-02-25 自律組織間診断システム及び自律システム

Country Status (1)

Country Link
JP (1) JP3485789B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300249A (ja) * 2006-04-28 2007-11-15 Nippon Telegr & Teleph Corp <Ntt> ネットワーク管理システムおよび方法
JP2007329690A (ja) * 2006-06-08 2007-12-20 Nippon Telegr & Teleph Corp <Ntt> 経路数監視装置及び経路数監視方法並びに経路数監視プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300249A (ja) * 2006-04-28 2007-11-15 Nippon Telegr & Teleph Corp <Ntt> ネットワーク管理システムおよび方法
JP4668117B2 (ja) * 2006-04-28 2011-04-13 日本電信電話株式会社 ネットワーク管理システムおよび方法
JP2007329690A (ja) * 2006-06-08 2007-12-20 Nippon Telegr & Teleph Corp <Ntt> 経路数監視装置及び経路数監視方法並びに経路数監視プログラム
JP4648246B2 (ja) * 2006-06-08 2011-03-09 日本電信電話株式会社 経路数監視装置及び経路数監視方法並びに経路数監視プログラム

Also Published As

Publication number Publication date
JP3485789B2 (ja) 2004-01-13

Similar Documents

Publication Publication Date Title
AU2021200243B2 (en) Systems and methods for an interactive network analysis platform
EP2486706B1 (en) Network path discovery and analysis
US6205563B1 (en) Method and apparatus for inter-domain alarm correlation
EP1450511A1 (en) Device and method for simulating network traffic treatments of a network using policy rules
EP1511220B1 (en) Non-intrusive method for routing policy discovery
JP2002141905A (ja) ノード監視方法,ノード監視システム、および記録媒体
Harrington Guidelines for Considering Operations and Management of New Protocols and Protocol Extensions
Appleby et al. Yemanja-a layered event correlation engine for multi-domain server farms
Bouillard et al. Hidden anomaly detection in telecommunication networks
Appleby et al. Yemanja—A layered fault localization system for multi-domain computing utilities
JPH11243422A (ja) 自律組織間診断システム
CA2497553C (en) Procedure and system for the analysis and the evaluation of the conditions for accessing data communication networks, and relative computer program product
Harrold et al. Data flow testing of parallelized code
Yamada et al. Developing network configuration management database system and its application—data federation for network management
Wang et al. Epinoia: Intent checker for stateful networks
Akashi et al. Multiagent-based cooperative inter-as diagnosis in encore
Xia et al. Resource optimization for service chain monitoring in software-defined networks
Huang et al. Mdfm: Multi-domain fault management for internet services
Akashi et al. Detection and diagnosis of inter-AS routing anomalies by cooperative intelligent agents
Akashi et al. Agent system for inter-AS routing error diagnosis
Akashi et al. Cooperative analysis in Inter-AS diagnostic system ENCORE
Mensah et al. Connectivity extraction in cloud infrastructures
Tang et al. Community-base fault diagnosis using incremental belief revision
JP4074990B2 (ja) 統計情報処理システム及び統計情報処理制御方法
Kodeswaran et al. Enforcing secure and robust routing with declarative policies

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101024

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101024

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term