WO2021234900A1

WO2021234900A1 - 測定装置、測定システム、測定方法、および、測定プログラム

Info

Publication number: WO2021234900A1
Application number: PCT/JP2020/020094
Authority: WO
Inventors: 諭士中務; 賢高橋
Original assignee: 日本電信電話株式会社
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2021-11-25
Also published as: JP7302740B2; JPWO2021234900A1

Abstract

測定装置（１）は、測定対象のルータ（２）にソフトウェア処理させるための生存監視パケットをルータ（２）に向けて送信し、そのルータ（２）から生存監視パケットの応答を受信する生存監視パケット処理部（１１）と、ルータ（２）にハードウェア処理で転送させるためのプローブパケットを、生存監視パケットの送信時刻と同時にルータ（２）に向けて送信し、そのルータ（２）からプローブパケットの応答を受信するプローブパケット処理部（１２）と、生存監視パケットの送受信時刻から往復伝搬遅延を求めるとともに、プローブパケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部（１３）と、計算された遅延時間から測定対象のルータ（２）の異常を判定する異常検知部（１４）と、を有する。

Description

測定装置、測定システム、測定方法、および、測定プログラム

　本発明は、測定装置、測定システム、測定方法、および、測定プログラムに関する。

　通信事業者等のネットワークを構成するルータのCPU使用率は、間欠故障を検知する指標の一つである。MIB（Management Information Base）は、CPU使用率などのルータ内部の状態についてまとめたデータ集合の規格である。SNMP（Simple Network Management Protocol）は、ルータの外部からMIBのデータを取得するためのプロトコルである。

　図９は、SNMPによる監視システムの構成図である。
　非特許文献１には、Cisco IOS（Internetwork Operating System）（登録商標）が稼働するルータ２００から、SNMPを使用してCPU使用率を収集する方法が記載されている。
　オペレーションシステムである管理装置３００は、測定対象であるルータ２００内のMIB取得部２０１に対して、SNMPポーリングを送信する。MIB取得部２０１は、SNMPポーリングに応じて読み込んだMIB情報２０２を管理装置３００に返信する。MIB情報２０２には、一定時間の平均CPU使用率が格納されている。

　図１０は、イベントマネージャによる検知システムの構成図である。
　イベントマネージャ２０３は、測定対象であるルータ２００内のMIB情報２０２（CPU使用率）を監視し、予め定めた閾値を超過した場合にその旨を管理装置３００に通知することで、保守者に異常を知らせる。
　非特許文献２には、イベントマネージャ２０３であるEEM（Embedded Event Manager）の設定例が記載されている。

シスコシステムズ合同会社、"SNMP を使用してCisco IOSデバイスのCPU使用率を収集する方法"、［online］、2005年10月26日、［2020年4月28日検索］、インターネット〈URL：https://www.cisco.com/c/ja_jp/support/docs/ip/simple-network-management-protocol-snmp/15215-collect-cpu-util-snmp.html〉シスコシステムズ合同会社、"CPU 使用率が上昇した場合に自動的にログを取得する EEM の設定例"、［online］、2015年4月24日、［2020年4月28日検索］、インターネット〈URL：https://community.cisco.com/t5/%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF%E3%82%A4%E3%83%B3%E3%83%95%E3%83%A9%E3%82%B9%E3%83%88%E3%83%A9%E3%82%AF%E3%83%81%E3%83%A3-%E3%83%89%E3%82%AD%E3%83%A5%E3%83%A1%E3%83%B3%E3%83%88/cpu-%E4%BD%BF%E7%94%A8%E7%8E%87%E3%81%8C%E4%B8%8A%E6%98%87%E3%81%97%E3%81%9F%E5%A0%B4%E5%90%88%E3%81%AB%E8%87%AA%E5%8B%95%E7%9A%84%E3%81%AB%E3%83%AD%E3%82%B0%E3%82%92%E5%8F%96%E5%BE%97%E3%81%99%E3%82%8B-eem-%E3%81%AE%E8%A8%AD%E5%AE%9A%E4%BE%8B/ta-p/3161101〉

　ルータのソフトウェア処理負荷は、IGP（Interior Gateway Protocol）などのルーティングプロトコルの処理に応じて上昇する。ルータの負荷超過を効果的に予防するためには、ルータが数千台規模のネットワークシステムに対しても、負荷コストを抑制するような測定手法が望まれる。しかし、非特許文献１，２などのMIBからCPU使用率を収集する方法では、負荷計測に関するコストが高い。

　非特許文献１の方式では、負荷計測中に関するコストが高くなる。つまり、SNMP MIBポーリング（データ要求）の処理負荷が管理装置に集中してしまうので、分単位よりも短い周期の監視が困難である。また、CPU使用率の平均のみが出力されるので、短い期間の負荷上昇などの把握には不向きである。
　非特許文献２の方式では、負荷計測前に関するコストが高くなる。具体的には、ネットワークシステム上の全ルータに対して、負荷計測前にイベントマネージャのデプロイ（インストール）が必要である。

　そこで、本発明は、負荷コストを抑制したソフトウェア処理負荷の測定手法を提供することを、主な課題とする。

　前記課題を解決するために、本発明の測定装置は、以下の特徴を有する。
　本発明は、測定対象のネットワーク装置にソフトウェア処理させるための第１パケットを前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第１パケットの応答を受信する第１パケット処理部と、
　前記ネットワーク装置にハードウェア処理で転送させるための第２パケットを、前記第１パケットの送信時刻と同時に前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第２パケットの応答を受信する第２パケット処理部と、
　前記第１パケットの送受信時刻から往復伝搬遅延を求めるとともに、前記第２パケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部と、
　計算された前記遅延時間から測定対象の前記ネットワーク装置の異常を判定する異常検知部と、を有することを特徴とする。

　本発明によれば、負荷コストを抑制したソフトウェア処理負荷の測定手法を提供することができる。

本実施形態に係わる測定システムの構成図である。本実施形態に係わる測定装置およびルータの機能構成図である。本実施形態に係わる測定装置のハードウェア構成図である。本実施形態に係わる生存監視パケットの通過経路を示す説明図である。本実施形態に係わるプローブパケットの通過経路を示す説明図である。本実施形態に係わる測定装置の処理を示すフローチャートである。本実施形態に係わる測定システムの実験結果を示すグラフである。本実施形態に係わる測定システムの測定結果を反映した構成図である。 SNMPによる監視システムの構成図である。イベントマネージャによる検知システムの構成図である。

　以下、本発明の一実施形態について、図面を参照して詳細に説明する。

　図１は、測定システムの構成図である。
　測定システムは、ソフトウェア処理負荷を測定する側の測定装置１と、測定される側のルータ（ネットワーク装置）２の集合（測定対象ネットワーク２ＮＷ）とを有する。各ルータ２は、生存監視パケット（第１パケット、図１では図示省略、詳細は図４）と、プローブパケット（第２パケット、図１のP1～P3）との両パケットを、それぞれのパケットヘッダが示すあて先に向けて転送する。

　生存監視パケットとは、送信先のルータ２が生存（正しく機能）しているか否かを確認するためのパケットである。生存監視パケットは、例えば、確認用にルータ２に送信される「ICMP（Internet Control Message Protocol） Echo Request」と、ルータ２から応答される「ICMP Echo Reply」との組み合わせで構成される。生存監視パケットのパケットヘッダはIGPルーティングに基づくIPヘッダであり、あて先のIPアドレスに該当するルータ２にソフトウェア処理される。
　なお、本実施形態では、ルータ２内のソフトウェア処理負荷を計測するために、CPU処理が生じる生存監視パケットを用いている。一般的なルータ２は、自装置（ループバックアドレス等）あての生存監視パケットの処理をCPU処理とするためである。一方、CPU処理が生じる生存監視パケット以外のパケットを代用してもよい。

　プローブパケット（Probe Packet）とは、送信先にデータを届けるためのデータパケットである。プローブパケットのパケットヘッダはMPLS（Multi-Protocol Label Switching）ラベル情報であり、ルータ２のハードウェア処理により転送される。プローブパケットには、SR（Segment-Routing）/MPLS拡張が適用される。これにより、プローブパケットの通過経路を明示的にMPLSラベルで指定可能なラベルスイッチングが、測定対象ネットワーク２ＮＷで利用できる。
　本実施形態では、プローブパケットは、SR/MPLSラベルをスタックするデータパケットであり、タイムスタンプを打刻する領域以外のペイロード部分に格納されるデータ内容は特に問わない。

　以下、測定装置１がルータ２Ｃを測定する例を説明する。
　測定対象ネットワーク２ＮＷの測定前の準備として、測定装置１からルータ２Ａ，２Ｂを経由して測定対象のルータ２Ｃに届く経路５Ａと、その経路５Ａとは逆方向にルータ２Ｃからルータ２Ｂ，２Ａを経由して測定装置１に届く経路５Ｂとを、両パケットに共通する経路５として設定しておく。
　生存監視パケットの経路５は、隣接ルータであるネイバ（Neighbor）間で広告されたリンクステート情報をもとに、各ルータ２内部のルーティングテーブルとして設定される。なお、リンクステート情報の広告には、OSPF（Open Shortest Path First）やIS-IS（Intermediate System to Intermediate System）などのIGPのルーティングプロトコルが使用される。
　なお、図１の測定装置１、ルータ２Ａ間の丸で囲んだ「１」などの数字は、広告されたIGPコストを示す。

　プローブパケットの経路５は、MPLSラベル情報をパケットヘッダにスタックする（複数のラベルを順に付加する）ことで、生存監視パケットの経路５と同じように測定装置１からルータ２Ｃに向かい、そのルータ２Ｃから測定装置１に戻ってくるように設定される。以下、（手順１）～（手順５）の順に、詳細を説明する。

　（手順１）測定装置１は、内側のラベルとして送信元である自身（測定装置１）のSID（Segment ID）と、外側の（先頭の）ラベルとして送信先であるルータ２ＣのSIDとを付したプローブパケットP1を送信する。測定装置１は、この送信時刻T2を示すタイムスタンプも、プローブパケットP1に付加する。
　（手順２）経路５Ａ途中のルータ２Ａ，２Ｂは、外側のラベルを参照して、送信先であるルータ２Ｃに向かう次ホップへプローブパケットP1を転送する。

　なお、プローブパケットP1には、測定対象であるルータ２Ｃのラベルだけが付されているが、測定装置１～ルータ２Ｃの途中の経路５Ａ（ルータ２Ａ，２Ｂ，２Ｄ）をどのように通過するかはラベルで指定されていない。
　よって、ルータ２Ｃに向かうプローブパケットP1の経路５Ａは、生存監視パケットと同じIGPコストに沿った経路となる。例えば、ルータ２Ａ→２Ｂ→２ＣのIGPコストは30（＝20+10）であり、ルータ２Ａ→２Ｄ→２ＣのIGPコストは40（＝10+30）なので、総コストが小さいルータ２Ｂ経由の経路５Ａが選択される。

　（手順３）ルータ２Ｃは、プローブパケットP1から自身のSIDが付されている外側のラベルをPopする（取り外す）ことで、プローブパケットP2を取得する。そして、ルータ２Ｃは、プローブパケットP2のラベルが示す測定装置１のSIDに基づき、プローブパケットP2を測定装置１に向けて返信する。
　（手順４）経路５Ｂ途中のルータ２Ｂ，２Ａは、プローブパケットP2のラベルを参照して、測定装置１に向かう次ホップへプローブパケットP2を転送する。ここでも手順２と同様に、途中の経路５Ｂ（ルータ２Ａ，２Ｂ，２Ｄ）をどのように通過するかはラベルで指定されていないので、プローブパケットP2の経路５Ｂは、生存監視パケットと同じIGPコストに沿った経路となる。
　（手順５）測定装置１は、プローブパケットP2を受信すると、その受信時刻T3を示すタイムスタンプを付加しつつ、自身のラベルを除去したプローブパケットP3を作成する。そして、測定装置１は、２つのタイムスタンプの時間差（受信時刻T3－送信時刻T2）を、プローブパケットの往復伝搬遅延（RTT：Round-Trip Time）とする。

　以上、（手順１）～（手順５）の順に説明したように、プローブパケットと生存監視パケットとは、同じ経路（行きは経路５Ａ，帰りは経路５Ｂ）を通過する。
　これにより、プローブパケットと生存監視パケットとの両パケットは、経路５途中のルータ２Ａ，２Ｂはそれぞれ同じ伝搬遅延でハードウェア転送することが期待されるので、両パケットの遅延変動要素は同じとなる。

　一方、測定対象のルータ２Ｃ内のソフトウェア処理が生存監視パケットには存在するが、そのソフトウェア処理がプローブパケットには存在しない。よって、両パケットの往復伝搬遅延の差分は、ルータ２Ｃ内のソフトウェア処理による遅延のみとなる。つまり、転送経路内の遅延変動要素に影響を受けずに、両パケットの往復伝搬遅延の差を正確に測定できる。
　なお、両パケットの遅延変動要素を同じにするために、両パケットの経路５を同じにすることに加え、両パケットの優先度（ToS：Type of Service）を同じにするなど、両パケットの通信環境を同じにすることが望ましい。

　図２は、測定装置１およびルータ２の機能構成図である。
　測定装置１は、生存監視パケット処理部（第１パケット処理部）１１と、プローブパケット処理部（第２パケット処理部）１２と、遅延計算部１３と、異常検知部１４と、通知部１５とを有する。ルータ２は、ソフトウェア処理部２１と、ハードウェア処理部２２とを有する。
　生存監視パケット処理部１１は、生存監視パケットの送受信を行うとともに、その送信時刻および受信時刻を示すタイムスタンプを生存監視パケットに打刻する。ソフトウェア処理部２１は、自身宛ての生存監視パケットや、ルーティングプロトコルの制御信号を処理する。
　プローブパケット処理部１２は、プローブパケットの送受信を行うとともに、その送信時刻および受信時刻を示すタイムスタンプをプローブパケットに打刻する。ハードウェア処理部２２は、ハードウェアの転送機構により、プローブパケットと生存監視パケットとの両パケットを転送する。

　遅延計算部１３は、生存監視パケットのタイムスタンプと、プローブパケットのタイムスタンプとから、測定対象のルータ２内のソフトウェア処理部２１の遅延時間を計算する。
　異常検知部１４は、計算された遅延時間やその変動情報をもとに、測定対象のルータ２の異常を検知する。
　通知部１５は、検知されたルータ２の異常を、管理装置３に通知することで、保守者に異常を知らせる。

　図３は、測定装置１のハードウェア構成図である。
　測定装置１は、ＣＰＵ９０１と、ＲＡＭ９０２と、ＲＯＭ９０３と、ＨＤＤ９０４と、通信Ｉ／Ｆ９０５と、入出力Ｉ／Ｆ９０６と、メディアＩ／Ｆ９０７とを有するコンピュータ９００として構成される。
　通信Ｉ／Ｆ９０５は、外部の通信装置９１５と接続される。入出力Ｉ／Ｆ９０６は、入出力装置９１６と接続される。メディアＩ／Ｆ９０７は、記録媒体９１７からデータを読み書きする。さらに、ＣＰＵ９０１は、ＲＡＭ９０２に読み込んだプログラム（アプリケーションや、その略のアプリとも呼ばれる）を実行することにより、各処理部を制御する。そして、このプログラムは、通信回線を介して配布したり、ＣＤ－ＲＯＭ等の記録媒体９１７に記録して配布したりすることも可能である。

　図４は、生存監視パケットの通過経路を示す説明図である。
　測定装置１の生存監視パケット処理部１１は、測定対象のルータ２（のループバックインタフェースのアドレス）をあて先とする生存監視パケット「ICMP Echo Request」（図４では「Echo」は省略）を作成する。そして、生存監視パケット処理部１１は、同じ測定対象のルータ２をあて先とするプローブパケットの送信と同時に（実際には生存監視パケットとプローブパケットとを連続して）、送信時刻T1のタイムスタンプを付したICMP Requestを測定対象ネットワーク２ＮＷに送信する。
　測定対象のルータ２のハードウェア処理部２２は、受信したICMP Requestが自身をあて先とすることをヘッダから読み取り、ICMP Requestをソフトウェア処理部２１に通知する。一方、測定対象以外の（経路途中の）ルータ２のハードウェア処理部２２は、生存監視パケットを自ルータのソフトウェア処理部２１に通知せずに、次ホップのルータ２に転送する。

　ソフトウェア処理部２１は、通知されたICMP Requestのヘッダから送信元である測定装置１のアドレスを読み取り、そのアドレスをあて先とする「ICMP Echo Reply」（図４では「Echo」は省略）を返信する。
　測定装置１の生存監視パケット処理部１１は、測定対象ネットワーク２ＮＷからICMP Replyを受信すると、その受信時刻T4を示すタイムスタンプをICMP Replyに付加する。そして、遅延計算部１３は、生存監視パケットのタイムスタンプ（送信時刻T1、受信時刻T4）から、生存監視パケットの往復伝搬遅延を計算する。

　図５は、プローブパケット（Probe Packet）の通過経路を示す説明図である。
　測定装置１のプローブパケット処理部１２は、測定対象のルータ２から折り返して自身の測定装置１へ戻ってくるように、MPLSラベルを２つスタックさせたProbe Packet（図１のプローブパケットP1）を作成する。
　そして、プローブパケット処理部１２は、同じ測定対象のルータ２をあて先とする生存監視パケットの送信と同時に、送信時刻T2のタイムスタンプを付したProbe Packetを測定対象ネットワーク２ＮＷに送信する。

　測定対象のルータ２のハードウェア処理部２２は、受信したProbe Packetのヘッダから自身のあて先である１つめのラベルを削除し、２つめのラベルで指定されている測定装置１あてにProbe Packetを発出する。
　測定装置１のプローブパケット処理部１２は、測定対象ネットワーク２ＮＷからProbe Packetを受信すると、その受信時刻T3を示すタイムスタンプをProbe Packetに付加する。そして、遅延計算部１３は、プローブパケットのタイムスタンプ（送信時刻T2、受信時刻T3）から、プローブパケットの往復伝搬遅延を計算する。

　図６は、測定装置１の処理を示すフローチャートである。
　測定装置１は、図４および図５で示したように、生存監視パケットを送信時刻T1で、プローブパケットを送信時刻T2で、ほぼ同時に測定対象のルータ２に送信する（Ｓ１１）。測定装置１は、ルータ２から返答されたプローブパケットを時刻T3で受信し（Ｓ１２）。ルータ２から返答された生存監視パケットを時刻T4で受信する（Ｓ１３）。

　そして、遅延計算部１３は、プローブパケットの往復伝搬遅延（＝時刻T3-時刻T2）を計算し（Ｓ１４）、生存監視パケットの往復伝搬遅延（＝時刻T4-時刻T1）を計算する（Ｓ１５）。遅延計算部１３は、ルータ２のソフトウェア処理による遅延時間＝（生存監視パケットの往復伝搬遅延）－（プローブパケットの往復伝搬遅延）を計算する（Ｓ２１）。

　ここで、異常検知部１４は、Ｓ２１で計算した遅延時間の値や、遅延時間の値の変動（上昇などのゆらぎ）を検知することにより、ルータ２のソフトウェア処理負荷による異常が発生したか否かを判定する（Ｓ２２）。Ｓ２２でYesならＳ２３に進み、NoならＳ２４に進む。
　なお、Ｓ２２の遅延時間の上昇を検知する方法は、例えば、過去n回の結果（平均遅延時間）からの差分が大きい上位k位の遅延時間を求め、その求めた遅延時間の変動量が所定閾値もよりも大きいときに異常と判定する方法（k近傍法）がある。

　また、異常検知部１４は、図９，図１０で示した従来のCPU使用率を収集する方法を実行し、取得したCPU使用率と、Ｓ２１の遅延時間（異常の有無）との組み合わせから、Ｓ２２の異常発生を判定してもよい。例えば、異常検知部１４は、CPU使用率が正常値で、遅延時間が異常値の場合、ルータ２内のCPU以外の部品（メモリなど）の異常として（異常の原因を推定して）、管理装置３に通知する。これにより、保守者は異常の有無だけでなく、異常の原因を把握できるので、メモリの交換作業などの適切な保守作業を選択できる。

　通知部１５は、Ｓ２２で検知した異常に関する情報（今回判定した遅延時間や、その遅延時間が発生したルータ２のアドレスなど）を、管理装置３に通知する（Ｓ２３）。保守者やオペレータは、Ｓ２３で通知された情報を、管理装置３の表示画面から知ることができる。
　測定装置１は今回の測定を終えたので、次回の測定までの測定間隔の経過を待ってから（Ｓ２４,No）、処理をＳ１１に戻す。測定間隔は、予め定めた定期間隔である。

　図７は、測定システムの実験結果を示すグラフである。このグラフは、測定システムを模擬した試験機を用いた第Ｘ回目（Ｘ＝１，２，…）の測定を横軸とし、縦軸でその第Ｘ回目の測定結果としての往復伝搬遅延（RTT）を示す。
　グラフ線１０１，１０２はソフトウェア処理となる生存監視パケットを送出した場合を示し、グラフ線１０３，１０４はハードウェア処理となるプローブパケットを送出した場合を示す。また、グラフ線１０１，１０３はCPU負荷が50%程度の場合の測定値であり、グラフ線１０２，１０４はCPU負荷が2%程度の場合の測定値である。
　グラフ線１０１，１０２が示すソフトウェア処理においては、CPU負荷の高低によってRTTが大きく揺らいでいる。グラフ線１０３，１０４が示すハードウェア処理においてはCPU負荷の影響を受けていない。よって、CPU負荷が50%のグラフ線１０１，１０３の測定差分と、CPU負荷が2%のグラフ線１０２，１０４の測定差分をそれぞれ計算することで、ソフトウェア処理負荷の上昇を検知および推定することができる。
　なお、通知部１５は、図７のグラフを管理装置３の表示画面に表示させてもよい。

　図８は、測定システムの測定結果を反映した構成図である。
　例えば、異常検知部１４はルータ２Ｄで異常を検知し（図６のＳ２２でYes）、通知部１５はその異常を保守者に通知する（Ｓ２３）。保守者は、ネットワーク構成の変更を伴わないにもかかわらず、ルータ２Ｄで異常が発生したことを受け、ルータ２Ｄの間欠故障の可能性やその予兆と見做す。
　その結果、保守者は、ルータ２Ｄを経由してユーザＮＷ（ネットワーク）４Ａ，４Ｂ間を接続していた現用の経路５Ｃから、ルータ２Ｄを通過しない予備の経路５Ｄへの経路変更を管理装置３に指示するなど、ネットワーク運用へのフィードバックを行うことができる。

　以上説明した本実施形態の測定装置１は、測定対象のルータ２にCPU処理が生じる生存監視パケット（例えばICMPパケット）と、ハードウェア転送されるプローブパケット（例えばSR/MPLSラベルをスタックするデータパケット）を、同じ経路を通るように送出する。そして、測定装置１は、両パケットの往復伝搬遅延の差分から、測定対象のルータ２のソフトウェア処理の負荷を示す遅延時間を算出する。
　これにより、測定装置１は、定常状態からの遅延時間の上昇を検知することで、ルータのソフトウェア処理負荷の上昇を検知できる。

　また、本実施形態の測定方式により、ソフトウェア処理にかかる遅延時間の変動を、ソフトウェア処理負荷の変動と捉えることで、ソフトウェア処理負荷の測定指標にCPU使用率以外の指標が加わる。よって、CPU使用率だけでは検知できない高範囲なソフトウェア処理負荷でも、その瞬間値や変動値を検知できる。
　例えば、MIBへ格納されるCPU使用率の値自体にバグが発生していた場合や、CPU使用率の負荷上昇を抑制する設定が入っている場合などでもソフトウェア処理負荷を検知できる。負荷上昇を抑制する設定とは、例えばソフトウェア処理となるパケットに対して、CPU処理前にハードウェア的にレート制限を設けるなどの設定である。
　これらの検知により、CPU使用率の数値として現出しないルータ２のサイレント故障でも、的確に異常として保守者に通知できる。

［効果］
　本発明の測定装置１は、測定対象のルータ２にソフトウェア処理させるための生存監視パケットをルータ２に向けて送信し、そのルータ２から生存監視パケットの応答を受信する生存監視パケット処理部１１と、
　ルータ２にハードウェア処理で転送させるためのプローブパケットを、生存監視パケットの送信時刻と同時にルータ２に向けて送信し、そのルータ２からプローブパケットの応答を受信するプローブパケット処理部１２と、
　生存監視パケットの送受信時刻から往復伝搬遅延を求めるとともに、プローブパケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部１３と、
　計算された遅延時間から測定対象のルータ２の異常を判定する異常検知部１４と、を有することを特徴とする。

　これにより、測定対象のルータ２のソフトウェア処理負荷の上昇を検知できる。さらに、生存監視パケットとプローブパケットとの２パケットのみで往復伝搬遅延を測定することで、短期間の（秒オーダ間隔での）測定ができる。
　また、SNMP MIBポーリングなどのルータ内部で特別な測定用機能を起動しなくて済むため、負荷計測中のルータ２に余分な負荷を与えずに済む。よって、負荷コストを抑制したソフトウェア処理負荷の測定手法を提供できる。

　本発明は、プローブパケット処理部１２が、プローブパケットが通過する経路を示すラベルとして、測定対象のルータ２を指定した第１ラベルと、自身の測定装置１を指定した第２ラベルとを付したプローブパケットをルータ２に向けて送信することを特徴とする。

　これにより、プローブパケットが通過する経路は、生存監視パケットが通過する経路と同じになるので、両パケットの遅延変動要素から、経路の違いによる要素は適切に除外される。

　本発明は、生存監視パケット処理部１１が、生存監視パケットとしてICMP Echo Requestを送信することで、ルータ２から生存監視パケットの応答であるICMP Echo Replyを受信することを特徴とする。

　これにより、ICMP Echoというルータ２に備わっている既存の生存監視機能を負荷測定に流用することで、監視対象のルータ２には特別な機能追加なしに異常の検知ができる。つまり、測定システムの導入コストを抑制できる。

　本発明は、生存監視パケット処理部１１が送信する生存監視パケットと、プローブパケット処理部１２が送信するプローブパケットとは、同じ優先度が付されることを特徴とする。

　これにより、プローブパケットと生存監視パケットとは、同じ転送条件で経路を通過するので、両パケットの遅延変動要素から、転送条件の違いによる要素は適切に除外される。

　本発明は、測定装置１が、さらに、保守者が使用する管理装置３に対してルータ２の異常を通知する通知部１５を有しており、
　通知部１５が、異常検知部１４が求めたルータ２の異常の有無と、そのルータ２から取得したCPU使用率との組み合わせからルータ２の異常原因を推定し、その異常原因を管理装置３に通知することを特徴とする。

　これにより、保守者は、異常の有無だけでなく、異常の原因を知ることができるので、適切な保守作業を開始できる。

　１　　　測定装置
　３　　　管理装置
　２　　　ルータ（ネットワーク装置）
　２ＮＷ　測定対象ネットワーク
　４　　　ユーザNW
　５　　　経路
　１１　　生存監視パケット処理部（第１パケット処理部）
　１２　　プローブパケット処理部（第２パケット処理部）
　１３　　遅延計算部
　１４　　異常検知部
　１５　　通知部
　２１　　ソフトウェア処理部
　２２　　ハードウェア処理部

Claims

　測定対象のネットワーク装置にソフトウェア処理させるための第１パケットを前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第１パケットの応答を受信する第１パケット処理部と、
　前記ネットワーク装置にハードウェア処理で転送させるための第２パケットを、前記第１パケットの送信時刻と同時に前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第２パケットの応答を受信する第２パケット処理部と、
　前記第１パケットの送受信時刻から往復伝搬遅延を求めるとともに、前記第２パケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部と、
　計算された前記遅延時間から測定対象の前記ネットワーク装置の異常を判定する異常検知部と、を有することを特徴とする
　測定装置。
　前記第２パケット処理部は、前記第２パケットが通過する経路を示すラベルとして、測定対象の前記ネットワーク装置を指定した第１ラベルと、自身の前記測定装置を指定した第２ラベルとを付した前記第２パケットを前記ネットワーク装置に向けて送信することを特徴とする
　請求項１に記載の測定装置。
　前記第１パケット処理部は、前記第１パケットとしてICMP（Internet Control Message Protocol） Echo Requestを送信することで、前記ネットワーク装置から前記第１パケットの応答であるICMP Echo Replyを受信することを特徴とする
　請求項１に記載の測定装置。
　前記第１パケット処理部が送信する前記第１パケットと、前記第２パケット処理部が送信する前記第２パケットとは、同じ優先度が付されることを特徴とする
　請求項１に記載の測定装置。
　前記測定装置は、さらに、保守者が使用する管理装置に対して前記ネットワーク装置の異常を通知する通知部を有しており、
　前記通知部は、前記異常検知部が求めた前記ネットワーク装置の異常の有無と、そのネットワーク装置から取得したCPU使用率との組み合わせから前記ネットワーク装置の異常原因を推定し、その異常原因を前記管理装置に通知することを特徴とする
　請求項１に記載の測定装置。
　請求項１ないし請求項５のいずれか１項に記載の測定装置と、前記ネットワーク装置とを有することを特徴とする測定システム。
　測定装置は、第１パケット処理部と、第２パケット処理部と、遅延計算部と、異常検知部とを有しており、
　前記第１パケット処理部は、測定対象のネットワーク装置にソフトウェア処理させるための第１パケットを前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第１パケットの応答を受信し、
　前記第２パケット処理部は、前記ネットワーク装置にハードウェア処理で転送させるための第２パケットを、前記第１パケットの送信時刻と同時に前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第２パケットの応答を受信し、
　前記遅延計算部は、前記第１パケットの送受信時刻から往復伝搬遅延を求めるとともに、前記第２パケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算し、
　前記異常検知部は、計算された前記遅延時間から測定対象の前記ネットワーク装置の異常を判定することを特徴とする
　測定方法。
　コンピュータを、請求項１ないし請求項５のいずれか１項に記載の測定装置として機能させるための測定プログラム。