JP2005117392A - 輻輳監視システム - Google Patents

輻輳監視システム Download PDF

Info

Publication number
JP2005117392A
JP2005117392A JP2003349342A JP2003349342A JP2005117392A JP 2005117392 A JP2005117392 A JP 2005117392A JP 2003349342 A JP2003349342 A JP 2003349342A JP 2003349342 A JP2003349342 A JP 2003349342A JP 2005117392 A JP2005117392 A JP 2005117392A
Authority
JP
Japan
Prior art keywords
back pressure
transmission
pressure information
congestion
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003349342A
Other languages
English (en)
Inventor
Shiyousei Mizutani
承靖 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003349342A priority Critical patent/JP2005117392A/ja
Publication of JP2005117392A publication Critical patent/JP2005117392A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】バックプレッシャの発生を示す情報に基づいて、輻輳状態に対する切迫度を示す指標をリアルタイムで求めることが可能な輻輳監視システムを提供する。
【解決手段】複数のデバイス間におけるデータ伝送に関する輻輳状態を監視する輻輳監視システムにおいて、少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、バックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、対応する監視手段による監視によって得られた情報に基づいて、バックプレッシャの発生頻度を示す指標を算出する指標算出手段とを備える。
【選択図】 図1

Description

本発明は、ルータや交換機など伝送装置内に備えられるLSIなどの多種多様なデバイス間のデータ転送において、輻輳の発生にかかわる情報を収集して通知する輻輳監視システムに関する。
デバイス間のデータ転送における輻輳を回避するためのフロー制御技術の一つとして、受信側に蓄積された未処理データが所定の閾値を超えたときに送信側のデバイスによるデータ送出を抑制する技法がある。この技法は、バックプレッシャ制御と呼ばれており、伝送装置内のデバイス間のフロー制御技術として一般的に適用されている。
バックプレッシャ制御を利用したフロー制御技法としては、例えば、図5に示すようなバックプレッシャ制御機構を備えるものがある。
図5に示したバックプレッシャ制御機構403において、バックプレッシャ情報生成部404は、後段のデバイスに備えられた受信バッファ402におけるセルの蓄積量およびセル蓄積量微分値に基づいて、セルの送出の継続あるいは停止を指示するバックプレッシャ情報を生成、前段のデバイスに備えられた送信停止制御部405に返す。このバックプレッシャ情報に応じて、送信停止制御部405は、前段のデバイスの送信バッファ401からのセル送出を制御することにより、受信バッファ402に所定の閾値以上のセルが蓄積した場合に、前段のデバイスによるデータ送信の停止を実現している。
また、この他にも、バックプレッシャ制御を適用したフロー制御技法としては、様々な技法が提案されている(特許文献1参照)。
一方、輻輳状態を監視する方法としては、送信側のデバイスから転送されるセルの数および受信側のデバイスにおいて廃棄されたセルの数を計数し、これらの計数値に基づいて輻輳状態を監視する方法が一般的である。
また、クレジットベースのフロー制御方式では、受信側のデバイスのキューに滞留するセルの数を計数することで輻輳状態を把握する方法が適用されている。
特開2001−119419号公報(第3頁、段落「0005」から段落「0007」)
ところで、輻輳状態の監視方法として一般的なセル廃棄を計数する方法では、廃棄が発生したことによって輻輳が発生したことを検出することができるものの、セルの廃棄が発生するに至るまでの状況に関する情報は全く収集されていない。
また、上述したように、いわゆるバックプレッシャ制御は、あくまでもフロー制御の一つであるので、バックプレッシャ制御によるデータ送信停止が発生したという履歴に関する情報が残されるものの、それがどのようなタイミングでどの程度の頻度で発生しているかといった輻輳の発生状況が窺える情報を得ることはできなかった。
一方、クレジットベースのフロー制御において行われているように、キューに滞留するデータ数を監視することによって輻輳状態を把握する方法では、輻輳状態を把握するために計数すべき情報量が非常に多くなる傾向があるため、輻輳を監視するための構成が複雑になってしまう。更に、キューにデータが滞留しているか否かにかかわらず、輻輳監視のためにキュー内のデータ数を定期的に計数する必要があるので、システムの処理能力を無駄に費やしてしまうことになる。
このように、従来の輻輳監視のための一般的な技法も、フロー制御の一般的な技法も、輻輳の発生がどの程度差し迫っているかを示す定量的な指標を時間経過と併せて求めるというような思想を持っていないため、輻輳が発生する状況を分析するために活用できるような情報を得ることができなかった。
しかしながら、上述したような輻輳が発生する状況にかかわる情報こそが、伝送装置の設計者やネットワークシステムの構築担当者によって、伝送装置の内部における輻輳の発生を防ぐための対策を立てる上で必要とされている情報なのである。
ここで、上述したバックプレッシャ制御を適用したフロー制御が実装された装置において、バックプレッシャが発生する契機は、伝送装置のシステムにおいて予め設定した閾値を超えて受信側のデバイスにデータが蓄積されることであって、バックプレッシャ制御によって受信側のデバイスに滞留したデータが減少すれば、当然ながら、バックプレッシャ制御によるデータ送信の抑制は終息する。このように、バックプレッシャの発生自体は、直接的に輻輳状態の発生を示すものではないが、バックプレッシャ制御を必要とする状況が頻繁に発生することと、輻輳状態の発生とは明らかな相関があると考えられる。つまり、このバックプレッシャの発生を示す情報に基づいて、輻輳状態がどの程度差し迫っているかを知ることが可能であると考えられる。
本発明は、バックプレッシャの発生を示す情報に基づいて、輻輳状態に対する切迫度を示す指標をリアルタイムで求めることが可能な輻輳監視システムを提供することを目的とする。
本発明にかかわる第1の輻輳監視システムは、請求項1に記載したように、バックプレッシャ情報生成手段と、データ送信停止手段と、監視手段と、指標算出手段とを備えて構成される。
本発明にかかわる第1の輻輳監視システムの原理は、以下の通りである。
複数のデバイス間におけるデータ伝送に関する輻輳状態を監視する輻輳監視システムにおいて、バックプレッシャ情報生成手段は、少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成する。データ送信停止手段は、バックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させる。監視手段は、対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する。指標算出手段は、対応する監視手段による監視によって得られた情報に基づいて、バックプレッシャの発生頻度を示す指標を算出する。
このように構成された第1の輻輳監視システムの動作は、下記の通りである。
伝送装置を構成する複数のデバイスの一つに備えられたバックプレッシャ情報生成手段からその前段のデバイスに備えられたデータ送信停止手段に送られるバックプレッシャ情報は、当然ながら、後段のデバイスにおけるデータの処理状況に応じて時間的に変化する。監視手段は、このバックプレッシャ情報の時間的な変化を監視することにより、データ送信の停止を指示する旨のバックプレッシャ情報が現れる頻度やその継続時間に関する情報を収集し、指標算出手段に渡す。この情報に基づいて、指標算出手段は、例えば、データ送信の停止を指示する旨のバックプレッシャ情報が現れている時間が経過時間全体に占める割合を示す指標を算出する。このようにして求められた指標は、後段のデバイスによるデータ処理が前段のデバイスからのデータ送信に追いつかなくなる状況が発生している度合い、すなわち、そのデバイスにかかわるデータ伝送において輻輳が発生する危険性の高さを示している。つまり、上述した指標算出手段により、輻輳状態に対する切迫度を示す指標をリアルタイムで得ることが可能である。
また、上述した第1の輻輳監視システムにおいて、監視手段に情報読出手段を備え、指標算出手段にカウンタと計数読出手段とリセット手段とを備えて、第2の輻輳監視システムを構成することもできる。
この第2の輻輳監視システムの原理では、監視手段において、情報読出手段は、所定の第1周期ごとにバックプレッシャ情報を読み出して、指標算出手段に渡す。指標算出手段において、カウンタは、情報読出手段からデータ送信の停止を指示するバックプレッシャ情報が渡される回数を計数する。指標算出手段において、計数読出手段は、第1周期よりも長い所定の第2周期ごとに、カウンタによる計数を読み出し、この計数値をバックプレッシャ発生頻度を示す指標として出力する。指標算出手段において、リセット手段は、第2周期ごとに、カウンタによる計数値を初期値にリセットする。
このように構成された第2の輻輳監視システムでは、監視手段に備えられた情報読出手段は、第1周期に相当する時間ごとにバックプレッシャ情報を読み出すことにより、バックプレッシャ情報をサンプリングして、その結果をカウンタに渡す。このカウンタの計数値は、第2周期ごとにリセット手段によってリセットされ、また、データ転送の停止を指示するサンプルの到来ごとに加算される。したがって、この計数値を計数読出手段が第2周期ごとに読み出すことにより、第2周期に相当する時間のうちバックプレッシャ情報がデータ転送の停止を指示している期間の長さに相当する計数値を得ることができる。この計数値は、バックプレッシャが発生する頻度およびその継続期間をともに反映しているので、バックプレッシャの発生頻度を示す指標として十分に有用である。
本発明にかかわる第3の輻輳監視システムは、請求項2に記載したように、バックプレッシャ情報生成手段と、データ送信停止手段と、監視手段と、指標算出手段と、指標収集手段と、通知手段とを備えて構成される。
本発明にかかわる第3の輻輳監視システムの原理は、以下の通りである。
複数系統の伝送装置から構成されるネットワーク機器における輻輳監視システムにおいて、バックプレッシャ情報生成手段は、複数系統の伝送装置それぞれに備えられる少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成する。データ送信停止手段は、複数系統の伝送装置それぞれにおいてバックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させる。監視手段は、対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する。指標算出手段は、対応する監視手段による監視によって得られる情報に基づいて、所定の時間ごとにバックプレッシャの発生頻度を示す指標を算出する。指標収集手段は、複数系統の伝送装置ごとに、伝送装置に属する少なくとも一つのバックプレッシャ情報発生手段に対応する指標算出手段によってそれぞれ得られたバックプレッシャの発生頻度を示す指標を収集する。通知手段は、複数系統の伝送装置ごとに収集された指標をそれぞれの系統の伝送装置に属するデバイス間のデータ伝送における輻輳発生の危険性を示す指標として通知する。
このように構成された第3の輻輳監視システムの動作は、下記の通りである。
各系統の伝送装置を構成するデバイスに備えられたバックプレッシャ情報生成手段からその前段のデバイスに備えられたデータ送信停止手段に送られるバックプレッシャ情報について、それぞれに対応する監視手段により、その時間的な変化の監視が行われ、対応するデバイスにかかわるデータ伝送においてデータ送信の停止を指示する旨のバックプレッシャ情報が現れる頻度やその継続時間に関する情報が収集される。この情報に基づいて、指標算出手段は、対応するデバイスにかかわるデータ伝送について、例えば、データ送信の停止を指示する旨のバックプレッシャ情報が現れている時間が経過時間全体に占める割合を示す指標を算出する。このようにして求められた指標を指標収集手段によって収集し、例えば、伝送装置ごとに集計することにより、個々のデバイスにかかわるデータ伝送における輻輳状態の切迫度に関する情報に加えて、複数の系統に属する伝送装置それぞれについて、その伝送装置において処理すべきデータ伝送処理負担がその伝送装置の処理能力を超えてしまう危険性、すなわち、その伝送装置にかかわるデータ伝送において輻輳が発生する危険性の高さを示す情報を得て、通知手段を介してネットワーク管理者などに提供することができる。
本発明にかかわる第4の輻輳監視システムは、請求項3に記載したように、バックプレッシャ情報生成手段と、データ送信停止手段と、監視手段と、指標算出手段と、指標収集手段と、判別手段と、処理負担振分手段とを備えて構成される。
本発明にかかわる第4の輻輳監視システムの原理は、以下の通りである。
複数系統の伝送装置から構成されるネットワーク機器における輻輳監視システムにおいて、バックプレッシャ情報生成手段は、複数系統の伝送装置それぞれに備えられる少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成する。データ送信停止手段は、複数系統の伝送装置それぞれにおいてバックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させる。監視手段は、対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する。指標算出手段は、対応する監視手段による監視によって得られる情報に基づいて、所定の時間ごとにバックプレッシャの発生頻度を示す指標を算出する。指標収集手段は、複数系統の伝送装置ごとに、伝送装置に属する少なくとも一つのバックプレッシャ情報発生手段に対応する指標算出手段によってそれぞれ得られたバックプレッシャの発生頻度を示す指標を収集する。判別手段は、指標収集手段による収集結果に基づいて、輻輳が発生する可能性が高い伝送装置を判別する。処理負担振分手段は、判別手段によって判別された伝送装置に分担されている伝送処理負担の一部を、他の系統の伝送装置に振り分ける。
このように構成された第4の輻輳監視システムの動作は、下記の通りである。
各系統の伝送装置を構成するデバイスに備えられたバックプレッシャ情報生成手段からその前段のデバイスに備えられたデータ送信停止手段に送られるバックプレッシャ情報について、それぞれに対応する監視手段により、その時間的な変化の監視が行われ、対応するデバイスにかかわるデータ伝送においてデータ送信の停止を指示する旨のバックプレッシャ情報が現れる頻度やその継続時間に関する情報が収集される。この情報に基づいて、指標算出手段は、対応するデバイスにかかわるデータ伝送について、例えば、データ送信の停止を指示する旨のバックプレッシャ情報が現れている時間が経過時間全体に占める割合を示す指標を算出する。このようにして求められた指標を指標収集手段によって収集し、例えば、伝送装置ごとに集計することにより、個々のデバイスにかかわるデータ伝送における輻輳状態の切迫度に関する情報に加えて、複数の系統に属する伝送装置それぞれについて、その伝送装置において処理すべきデータ伝送処理負担がその伝送装置の処理能力を超えてしまう危険性、すなわち、その伝送装置にかかわるデータ伝送において輻輳が発生する危険性の高さを示す情報を得ることができる。したがって、例えば、判別手段は、指標収集手段によって収集された情報に基づいて、輻輳が発生する危険性が所定の閾値よりも高い系統の伝送装置を判別し、処理振分手段に、この伝送装置に割り当てられていた処理負担の一部を、例えば、最も危険性の低い系統の伝送装置に振り分けさせることにより、輻輳状態の発生を防ぐことができる。
請求項1に記載の発明にかかわる第1および第2の輻輳監視システムによれば、バックプレッシャ制御が実装されたデバイス間のデータ伝送にかかわる輻輳状態の切迫度をリアルタイムで評価することができるので、この評価結果に基づいて、輻輳状態に至る過程を克明に分析するために必要な情報を提供することが可能である。
このような輻輳状態に至る過程に関する情報を提供することにより、輻輳状態の発生原因を究明し、更に輻輳を解消するための作業を強力に支援することができる。また、このような情報は、伝送装置の設計において、各デバイスの処理能力の配分を決定する際にも、有効に活用することができる。
また、請求項2に記載の発明にかかわる第3の輻輳監視システムによれば、複数系統の伝送装置に備えられるそれぞれのデバイス間のデータ伝送にかかわる輻輳状態に対する切迫度を示す指標とともに、例えば、対応する指標を伝送装置ごとに集計した結果をネットワーク管理者に通知することができる。
これにより、複数系統の伝送装置を備えた大規模なネットワークシステムにおいて、ネットワーク管理者に、ネットワークな様々な構成要素にかかわる輻輳の兆候を示す情報を提供することができるので、例えば、輻輳状態に陥る危険性が高い伝送装置の負荷を他の伝送装置に振り分けるといった高度な輻輳管理を実現できる。
更に、上述したような指標を蓄積していくことにより、例えば、ネットワークシステム全体におけるデータの流れに即したネットワーク構成を立案する上で有用な情報を得ることができ、輻輳によるデータの損失を防止する対策を的確に実施できる。
また、請求項3に記載の発明にかかわる第4の輻輳監視システムによれば、複数系統の伝送装置に備えられるそれぞれのデバイス間のデータ伝送にかかわる輻輳状態に対する切迫度を示す指標に基づいて、トラフィックが逼迫している系統の伝送装置にかかわる負荷を他の系統の伝送装置に自動的に振り分けることができる。
これにより、複数系統の伝送装置を備えた大規模なネットワークシステムにおいて、例えば、特定の伝送装置への負荷の集中による輻輳状態の発生を未然に防ぎ、輻輳によるパケットの損失を確実に防止することができる。
以下、図面に基づいて、本発明の実施形態について詳細に説明する。
(第1の実施形態)
図1に、本発明にかかわる輻輳監視システムの第1の実施形態を示す。
なお、図1に示す構成要素のうち、図5に示した各部と同等のものについては、図5に示した符号を付して示し、その説明を省略する。
図1に示したデバイス1は、バックプレッシャ制御機構403に属する送信停止制御部405に加えてバックプレッシャ監視部210を備えている。
図1に示したバックプレッシャ監視部210において、バックプレッシャ情報読出部211は、割込みタイマ215からのクロック信号CLK1に同期して送信停止制御部405に入力されるバックプレッシャ情報を読み出してカウンタ212に渡す。このカウンタ212は、データ送信の停止を指示する旨を示すバックプレッシャ情報が渡されるごとに、計数値をインクリメントする。また、図1に示したレジスタ213は、割込みタイマ215から入力される別のクロック信号CLK2に同期してカウンタ212による計数値を保持する。監視制御部214は、上述したクロック信号CLK2の入力に応じて、レジスタ213に保持された計数値を読み出し、その後、リセット信号を出力して、カウンタ212の計数値を初期値「0」にリセットする。また、この監視制御部214は、レジスタ213から読み出した計数値を、図1に示したデバイス1からデバイス2へのデータ伝送が停止された頻度を示す指標(以下、停止頻度と称する)として、オペレータ端末201に通知する。
次に、バックプレッシャ監視部210によって、バックプレッシャ情報の時間的な変化を監視する動作を詳細に説明する。
図2に、バックプレッシャ情報の時間変化を監視する動作を説明する図を示す。
例えば、ナックプレッシャ情報は、図2(a)に示すように、データ送信の停止を指示している期間にわたって論理「1」が継続し、データ送信の停止を解除している期間は論理「0」となるように変化する。
このように時間的に変化するバックプレッシャ情報を、図1に示したバックプレッシャ情報読出部211は、図2(b)に示すようなクロック信号CLK1でサンプリングし、得られたサンプリング結果(図2(c)参照)をカウンタ212に渡して、このカウンタ212による計数動作に供する。
このカウンタ212が、図2(d)に示すように、カウンタ212のリセット間隔であるクロック信号CLK2の周期T(図2(e)参照)に相当する期間にわたって、サンプリング結果として論理「1」が渡された回数を計数することにより、この期間のうちデータ送信の停止が指示されていた期間が占める割合を示す計数結果を得ることができる。
例えば、図2において符号Aを付して示した期間内にサンプリング結果として論理「1」がカウンタ212に入力された回数を示す計数結果「6」は、図2(e)に示したクロック信号CLK2に同期してレジスタ213に保持され、図2(f)に示すように、この計数結果が停止頻度として監視制御部214を介してオペレータ端末201に送出される。同様に、図2において符号Bを付して示した期間内に対応する計数結果「9」も、図2(f)に示すように、停止頻度として監視制御部214を介してオペレータ端末201に送出される。
このようにして、バックプレッシャ情報の時間的な変化を監視して得られる情報から、このバックプレッシャ制御に関わるデータ伝送についての停止頻度を求めて、ネットワーク管理者に通知することができる。
このようにして得られた停止頻度は、図2(a)に示したバックプレッシャ情報をクロック信号CLK2の周期Tについて積分した値に相当するものであり、上述したように、クロック信号CLK2の周期Tに対応する時間内でデータ送信が停止させられている時間を示している。したがって、大きな値を持つ停止頻度が繰り返し得られるということは、上述した周期Tの大半において、図1に示したデバイス1からデバイス2へのデータ伝送が停止させられている状況、つまり、バックプレッシャ制御によって一旦受信バッファ401に滞留していたデータが減少しても、データ送信の再開に応じてすぐに受信バッファ401内の滞留データが増大してしまうといった状況が慢性化しているということを示している。そして、このように、デバイス2の受信バッファ401に大量のセルが慢性的に滞留すれば、遅かれ早かれデバイス1からデバイス2へのデータ伝送において輻輳が発生することは明らかである。
したがって、上述したようにして求めた停止頻度は、輻輳が発生する危険性を示す指標として極めて妥当性の高いものであると言える。
また、上述したようにしてバックプレッシャ監視部210から通知された停止頻度を、例えば、オペレータ端末201において時刻とともに記録しておけば、輻輳が発生するに至るまでの状況変化を解析する作業に供し、輻輳の原因を究明する作業を支援することができる。
また一方、上述したような停止頻度の記録と輻輳発生の記録とを付き合わせて、停止頻度の値と輻輳発生との関係を調べることにより、輻輳発生の前兆を捉えることも可能である。
なお、図1に示したバックプレッシャ監視部210は、受信側のデバイスの内部に備えてもよいし、また、監視対象のデータ伝送にかかわるデバイスの外部に備えてもよい。
(第2の実施形態)
図3に、本発明にかかわる輻輳監視システムの第2の実施形態を示す。なお、図3に示す構成要素のうち、図1および図5に示した各部と同等のものについては、図1あるいは図5に示した符号を付して示し、その説明を省略する。
図3に示したネットワークシステムにおいて、2系統の伝送装置2201、2202は、それぞれ対応するネットワークインタフェース装置2021、2022を介してネットワーク1およびネットワーク2に接続されている。また、これらの伝送装置2201、2202はともに、パケットスイッチ203に接続されており、これらの伝送装置2201、2202を経由するパスは、通信制御装置204からの指示に従ってこのパケットスイッチ203によって設定される。
図3に示した伝送装置2201、2202に備えられた受信パケット処理部221は、インタフェース回路222を介して受け取ったパケットに適切な処理を施してパケットスイッチ203に渡す。一方、図3に示した伝送装置2201、2202に備えられた送信パケット処理部223は、パケットスイッチ203から受け取ったパケットに適切な処理を施し、インタフェース回路222を介してネットワーク1またはネットワーク2に送出する。また、これらの伝送装置2201、2202にそれぞれ備えられた2つのバックプレッシャ監視部210r、210sは、インタフェース回路222から受信パケット処理部221へのデータ伝送に関するバックプレッシャ情報および送信パケット処理部223からインタフェース回路222へのデータ伝送に関するバックプレッシャ情報(図3において、符号BPを付して示した)をそれぞれ監視する。
また、図3に示した通信制御装置204において、輻輳情報収集部231は、これらのバックプレッシャ監視部210から通知される停止頻度に関する情報を収集し、収集した情報を輻輳情報蓄積部232に保持して輻輳情報解析部233の処理に供する。この通信制御装置204に備えられた管理制御部205は、パケットスイッチ203による経路設定にかかわる制御処理およびオペレータ端末201にかかわる制御処理を行うとともに、輻輳情報解析部233によって得られる解析結果に基づいて、パケットスイッチ203による経路設定処理を操作する処理およびオペレータ端末201を介してネットワーク管理者に輻輳に関する情報を提供する処理を行う。
次に、図3に示した輻輳監視システムの動作について説明する。
上述したように、バックプレッシャ監視部210は、クロック信号CLK2の周期Tごとに、その間にバックプレッシャ情報によってデータ伝送が停止された頻度を示す停止頻度情報を出力する。
したがって、輻輳情報収集部231は、上述した周期Tごとに各伝送装置220に備えられたバックプレッシャ監視部210r、210sから通知される停止頻度情報を収集し(図4に示したステップ301)、収集した停止頻度情報を輻輳情報蓄積部232に蓄積する(ステップ302)。このとき、輻輳情報蓄積部232は、例えば、各伝送装置220の受信側と送信側とについて、時刻情報とともに停止頻度情報を蓄積する。
次いで、輻輳情報解析部233は、各伝送装置220の受信側と送信側とについて、輻輳情報蓄積部232から最後のn回分の停止頻度情報をそれぞれ読み出し(ステップ303)、これらの停止頻度情報を例えば統計的な手法を用いて分析する(ステップ304)。例えば、輻輳情報解析部233において、各伝送装置220の受信側と送信側とについて、停止頻度が急激に増大していることを示す指標あるいは停止頻度が高い状態が所定の閾値以上に長く継続していることを示す指標を求め、これらの指標について予め設定した適切な閾値と新たに求めた指標の値とを比較することにより、輻輳発生の前兆があるか否かを判断することができる。
例えば、伝送装置2201のインタフェース回路222から受信パケット処理部221へのデータ伝送に関する停止頻度情報の分析結果として、輻輳の発生に先駆けて現れる停止頻度に関する現象が現れている旨の結果を得た場合に、輻輳情報解析部233は、ステップ305の肯定判定として、制御管理部205に、伝送装置2201のインタフェース回路222から受信パケット処理部221へのデータ伝送において、輻輳が発生する可能性が高い旨を通知する(ステップ306)。
この通知に応じて、管理制御部205は、通知に示された区間(例えば、伝送装置2201のインタフェース回路222と受信パケット処理部221との間)を含む伝送装置220に割り当てられている負荷の一部を、他方の伝送装置に振り分けるために必要な制御処理を実行する(ステップ307)。
このようにして、輻輳発生が懸念される一方の伝送装置220の負荷を他方の伝送装置220に振り分ける処理が完了した後、あるいは、上述したステップ305において輻輳の前兆はないと判断されたときに、この処理は終了する。
上述したように、図3に示した輻輳監視システムによれば、各伝送装置220に備えられたバックプレッシャ監視部210から通知される停止頻度情報を解析することにより、輻輳の危険性が高くなっている区間を特定し、その区間を含む伝送装置220の負荷を他の伝送装置220に振り分けることができる。
つまり、例えば、ネットワーク1に接続された伝送装置2201に集中して設定されていたパスを、伝送装置2202およびネットワーク2経由で設定し、負荷を分散させることができるので、輻輳の発生を確実に防ぐことが可能である。
このような負荷の集中は、図3に示したネットワーク1が高速伝送可能なネットワークであり、ネットワーク2が比較的低速のネットワークである場合などに、高速のネットワークに接続された伝送装置220を経由するパスが集中して設定されることによって発生する場合が多々ある。そして、この高速のネットワークに接続された伝送装置220における輻輳発生は、この伝送装置を経由して設定された多数のパスを介する通信に大きな影響を及ぼすものであり、特に、輻輳によってパケットが損失した場合には、VoIPサービスやVoDサービスのためのネットワークシステムでは致命的な障害となる。
したがって、上述したようにして、輻輳発生の前兆を捉え、その前兆が現れた伝送装置にかかる負荷を他の伝送装置に振り分ける仕組みを備えてネットワークシステムを構成することは、特に、VoIPサービスやVoDサービスのためのネットワークシステムでは極めて有用である。
また、輻輳解析部233は、上述したようにして検出した輻輳の前兆に関する情報を順次に輻輳情報蓄積部232に蓄積しておくこともできる。
このようにして輻輳の前兆検出に関する履歴情報が輻輳情報蓄積部232に蓄積されていれば、例えば、管理制御部205が、定期的にあるいはオペレータ端末201からの指示に応じて輻輳情報蓄積部232にアクセスし、この履歴情報と時刻情報とともに蓄積した停止頻度情報を読み出して、オペレータ端末201を介してネットワーク管理者やシステム設計者にこれらの情報を提供することができる。
上述したように、停止頻度情報は、各伝送装置の内部におけるデータ伝送が円滑な状態から外れている度合いを客観的に示しており、また、輻輳の前兆検出に関する履歴情報は、図3に示したような複数系統の伝送装置を備えたネットワークシステムにおける負荷の偏りを示している。
したがって、これらの情報の提供を受けることにより、ネットワーク管理者は、ネットワークシステムを効率よく運用するための適切な判断を下すことができる。また、システム設計者は、顧客に納入したネットワークシステムが実際に運用されている状態で収集された上述したような情報に基づいて、顧客が必要としているシステムと現存のシステムとの差異を分析し、その結果を踏まえて、ネットワーク機器を選定するとともに伝送装置内部のデバイスの性能を決定することにより、顧客のニーズを満足する理想に近いネットワークシステムを提案することができる。
もちろん、本発明にかかわる輻輳監視システムを、3系統以上の伝送装置を備えたネットワークシステムに適用することもできる。また、送信パケット処理部および受信パケット処理部がそれぞれ複数のデバイスから構成されており、これらのデバイス間のデータ伝送にバックプレッシャ制御が適用されている場合には、これらのデータ伝送それぞれについてバックプレッシャ監視部を設け、これらのバックプレッシャ監視部による監視結果を輻輳情報収集部によって収集することもできる。
以上の説明に関して、更に、以下の各項を開示する。
(付記1) 複数のデバイス間におけるデータ伝送に関する輻輳状態を監視する輻輳監視システムにおいて、
少なくとも一つのデバイスに備えられ、データの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、
バックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、
対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、
対応する監視手段による監視によって得られた情報に基づいて、バックプレッシャの発生頻度を示す指標を算出する指標算出手段と
を備えたことを特徴とする輻輳監視システム。
(付記2) 監視手段は、所定の第1周期ごとにバックプレッシャ情報を読み出して、指標算出手段に渡す情報読出手段を備え、
指標算出手段は、情報読出手段からデータ送信の停止を指示するバックプレッシャ情報が渡される回数を計数するカウンタと、
第1周期よりも長い所定の第2周期ごとに、カウンタによる計数を読み出し、この計数値をバックプレッシャ発生頻度を示す指標として出力する計数読出手段と、
第2周期ごとに、カウンタによる計数値を初期値にリセットするリセット手段とを備えた
ことを特徴とする付記1に記載の輻輳監視システム。
(付記3) 複数系統の伝送装置から構成されるネットワーク機器における輻輳監視システムにおいて、
複数系統の伝送装置それぞれに備えられる少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、
複数系統の伝送装置それぞれにおいてバックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、
対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、
対応する監視手段による監視によって得られる情報に基づいて、所定の時間ごとにバックプレッシャの発生頻度を示す指標を算出する指標算出手段と、
複数系統の伝送装置ごとに、伝送装置に属する少なくとも一つのバックプレッシャ情報発生手段に対応する指標算出手段によってそれぞれ得られたバックプレッシャの発生頻度を示す指標を収集する指標収集手段と、
複数系統の伝送装置ごとに収集された指標をそれぞれの系統の伝送装置に属するデバイス間のデータ伝送における輻輳発生の危険性を示す指標として通知する通知手段と
を備えたことを特徴とする輻輳監視システム。
(付記4) 複数系統の伝送装置から構成されるネットワーク機器における輻輳監視システムにおいて、
複数系統の伝送装置それぞれに備えられる少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、
複数系統の伝送装置それぞれにおいてバックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、
対応するバックプレッシャ情報生成手段からデータ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、
対応する監視手段による監視によって得られる情報に基づいて、所定の時間ごとにバックプレッシャの発生頻度を示す指標を算出する指標算出手段と、
複数系統の伝送装置ごとに、伝送装置に属する少なくとも一つのバックプレッシャ情報発生手段に対応する指標算出手段によってそれぞれ得られたバックプレッシャの発生頻度を示す指標を収集する指標収集手段と、
指標収集手段による収集結果に基づいて、輻輳が発生する可能性が高い伝送装置を判別する判別手段と、
判別手段によって判別された伝送装置に分担されている伝送処理負担の一部を、他の系統の伝送装置に振り分ける処理負担振分手段と
を備えたことを特徴とする輻輳監視システム。
輻輳によるデータ損失は、VoIPサービスを提供するネットワークシステムのように、リアルタイム性が重要視される分野では致命的な障害となるので、本発明にかかわる輻輳管理システムのように、輻輳に至る状況を詳細に分析可能な情報が得られるシステムは、極めて有用性が高いと考えられる。
また、本発明にかかわる輻輳監視システムは、運用中のネットワークシステムについて、データ伝送が円滑な状態から外れている度合いを客観的に示す情報をシステム設計者に提供することができるので、正確な現状分析が必要とされるシステム設計の分野においても非常に有用である。
本発明にかかわる輻輳監視システムの第1の実施形態を示す図である。 バックプレッシャ情報の時間変化を監視する動作を説明する図である。 本発明にかかわる輻輳監視システムの第2の実施形態を示す図である。 輻輳監視システムの動作を表す流れ図である。 従来のバックプレッシャ制御を説明する図である。
符号の説明
201 オペレータ端末
202 ネットワークインタフェース装置
203 パケットスイッチ
204 通信制御装置
205 管理制御部
210 バックプレッシャ監視部
211 バックプレッシャ情報読出部
212 カウンタ
213 レジスタ
214 監視制御部
215 割込みタイマ
220 伝送装置
221 受信パケット処理部
222 インタフェース回路
223 送信パケット処理部
231 輻輳情報収集部
232 輻輳情報蓄積部
233 輻輳情報解析部
401 送信バッファ
402 受信バッファ
403 バックプレッシャ制御機構
404 バックプレッシャ情報生成部
405 送信停止制御部

Claims (3)

  1. 複数のデバイス間におけるデータ伝送に関する輻輳状態を監視する輻輳監視システムにおいて、
    少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、
    前記バックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、前記バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、
    対応する前記バックプレッシャ情報生成手段から前記データ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、
    対応する前記監視手段による監視によって得られた情報に基づいて、バックプレッシャの発生頻度を示す指標を算出する指標算出手段と
    を備えたことを特徴とする輻輳監視システム。
  2. 複数系統の伝送装置から構成されるネットワーク機器における輻輳監視システムにおいて、
    前記複数系統の伝送装置それぞれに備えられる少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、
    前記複数系統の伝送装置それぞれにおいて前記バックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、前記バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、
    対応する前記バックプレッシャ情報生成手段から前記データ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、
    対応する前記監視手段による監視によって得られる情報に基づいて、所定の時間ごとにバックプレッシャの発生頻度を示す指標を算出する指標算出手段と、
    前記複数系統の伝送装置ごとに、前記伝送装置に属する前記少なくとも一つのバックプレッシャ情報発生手段に対応する指標算出手段によってそれぞれ得られたバックプレッシャの発生頻度を示す指標を収集する指標収集手段と、
    前記複数系統の伝送装置ごとに収集された指標をそれぞれの系統の伝送装置に属するデバイス間のデータ伝送における輻輳発生の危険性を示す指標として通知する通知手段と
    を備えたことを特徴とする輻輳監視システム。
  3. 複数系統の伝送装置から構成されるネットワーク機器における輻輳監視システムにおいて、
    前記複数系統の伝送装置それぞれに備えられる少なくとも一つのデバイスに備えられ、未処理のデータの滞留量と所定の閾値との比較結果に応じて前段のデバイスにデータ送信の停止あるいは継続を指示するバックプレッシャ情報を生成するバックプレッシャ情報生成手段と、
    前記複数系統の伝送装置それぞれにおいて前記バックプレッシャ情報生成手段を備えたデバイスの前段のデバイスに備えられ、前記バックプレッシャ情報の内容に応じてデータの送信を停止させるデータ送信停止手段と、
    対応する前記バックプレッシャ情報生成手段から前記データ送信停止手段に送られるバックプレッシャ情報の変動を時間の経過に対応して監視する監視手段と、
    対応する前記監視手段による監視によって得られる情報に基づいて、所定の時間ごとにバックプレッシャの発生頻度を示す指標を算出する指標算出手段と、
    前記複数系統の伝送装置ごとに、前記伝送装置に属する前記少なくとも一つのバックプレッシャ情報発生手段に対応する指標算出手段によってそれぞれ得られたバックプレッシャの発生頻度を示す指標を収集する指標収集手段と、
    前記指標収集手段による収集結果に基づいて、輻輳が発生する可能性が高い伝送装置を判別する判別手段と、
    前記判別手段によって判別された伝送装置に分担されている伝送処理負担の一部を、他の系統の伝送装置に振り分ける処理負担振分手段と
    を備えたことを特徴とする輻輳監視システム。
JP2003349342A 2003-10-08 2003-10-08 輻輳監視システム Withdrawn JP2005117392A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003349342A JP2005117392A (ja) 2003-10-08 2003-10-08 輻輳監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003349342A JP2005117392A (ja) 2003-10-08 2003-10-08 輻輳監視システム

Publications (1)

Publication Number Publication Date
JP2005117392A true JP2005117392A (ja) 2005-04-28

Family

ID=34541236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003349342A Withdrawn JP2005117392A (ja) 2003-10-08 2003-10-08 輻輳監視システム

Country Status (1)

Country Link
JP (1) JP2005117392A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006324729A (ja) * 2005-05-17 2006-11-30 Fujitsu Ltd 装置障害自律診断システム
CN102546376A (zh) * 2010-12-27 2012-07-04 扬智电子科技(上海)有限公司 半双工模式下的流量控制方法及其网络通讯装置
WO2012147909A1 (ja) 2011-04-27 2012-11-01 日本電気株式会社 ネットワーク装置、通信システム、異常トラヒックの検出方法およびプログラム
WO2014061529A1 (ja) * 2012-10-15 2014-04-24 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006324729A (ja) * 2005-05-17 2006-11-30 Fujitsu Ltd 装置障害自律診断システム
JP4648082B2 (ja) * 2005-05-17 2011-03-09 富士通株式会社 装置障害自律診断システム
CN102546376A (zh) * 2010-12-27 2012-07-04 扬智电子科技(上海)有限公司 半双工模式下的流量控制方法及其网络通讯装置
CN102546376B (zh) * 2010-12-27 2015-04-22 扬智电子科技(上海)有限公司 半双工模式下的流量控制方法及其网络通讯装置
WO2012147909A1 (ja) 2011-04-27 2012-11-01 日本電気株式会社 ネットワーク装置、通信システム、異常トラヒックの検出方法およびプログラム
US9306858B2 (en) 2011-04-27 2016-04-05 Nec Corporation Network apparatus, communication system, abnormal traffic detection method, and program
EP3026853A2 (en) 2011-04-27 2016-06-01 Nec Corporation Communication device, communication system, method for detecting abnormal traffic
US9992117B2 (en) 2011-04-27 2018-06-05 Nec Corporation Network apparatus, communication system, abnormal traffic detection method, and program
WO2014061529A1 (ja) * 2012-10-15 2014-04-24 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム
CN104756448A (zh) * 2012-10-15 2015-07-01 三菱电机株式会社 信息处理装置、信息处理方法和程序
JPWO2014061529A1 (ja) * 2012-10-15 2016-09-05 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム

Similar Documents

Publication Publication Date Title
US7433305B2 (en) Method and arrangement in a packet switch
CN109787833B (zh) 网络异常事件感知方法和系统
US5315580A (en) Network monitoring device and system
US10110454B2 (en) Fast detection and identification of lost packets
US8004976B2 (en) Monitoring, controlling, and preventing traffic congestion between processors
CN110505112B (zh) 一种网络性能监测方法、装置和存储介质
US11171869B2 (en) Microburst detection and management
US20130155857A1 (en) Hybrid arrival-occupancy based congestion management
JPWO2008108403A1 (ja) ノード装置、ノードシステム、該ノード装置に用いられる統計情報管理テーブルの入替え方法及びプログラム
EP3531621B1 (en) Method and apparatuses for delay measurement on a network node
JP2005117392A (ja) 輻輳監視システム
JP2006211360A (ja) 通信回線監視装置
WO2022270766A1 (ko) 자동 패킷 분석 기반의 지능형 네트워크 관리 장치 및 그 방법
JP5742343B2 (ja) 伝送装置、及び情報取得制御方法
CN115002009A (zh) 一种流量采样方法、装置、系统、电子设备及介质
WO2014061529A1 (ja) 情報処理装置及び情報処理方法及びプログラム
JPWO2011048740A1 (ja) データ伝送システム、送信速度制御方法、受信端末、送信端末
JP2022180096A (ja) ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及びプログラム
US11451998B1 (en) Systems and methods for communication system resource contention monitoring
US11303585B2 (en) Transmission device and resource allocation method
JPH07212365A (ja) Atm交換機
JP5293433B2 (ja) 通信中継装置、通信中継方法及び通信中継プログラム
CN105099932A (zh) 基于直通转发技术的调度方法及装置
CN103190117B (zh) 网络中的错误报告系统及方法
JP2011055052A (ja) 情報処理装置、伝送装置及び情報処理方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070109