WO2021234900A1 - 測定装置、測定システム、測定方法、および、測定プログラム - Google Patents

測定装置、測定システム、測定方法、および、測定プログラム Download PDF

Info

Publication number
WO2021234900A1
WO2021234900A1 PCT/JP2020/020094 JP2020020094W WO2021234900A1 WO 2021234900 A1 WO2021234900 A1 WO 2021234900A1 JP 2020020094 W JP2020020094 W JP 2020020094W WO 2021234900 A1 WO2021234900 A1 WO 2021234900A1
Authority
WO
WIPO (PCT)
Prior art keywords
packet
network device
router
processing unit
abnormality
Prior art date
Application number
PCT/JP2020/020094
Other languages
English (en)
French (fr)
Inventor
諭士 中務
賢 高橋
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2020/020094 priority Critical patent/WO2021234900A1/ja
Priority to JP2022524796A priority patent/JP7302740B2/ja
Publication of WO2021234900A1 publication Critical patent/WO2021234900A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/50Routing or path finding of packets in data switching networks using label swapping, e.g. multi-protocol label switch [MPLS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks

Definitions

  • the present invention relates to a measuring device, a measuring system, a measuring method, and a measuring program.
  • MIB Management Information Base
  • SNMP Simple Network Management Protocol
  • FIG. 9 is a configuration diagram of a monitoring system using SNMP.
  • Non-Patent Document 1 describes a method of collecting CPU usage using SNMP from a router 200 running Cisco IOS (Internetwork Operating System) (registered trademark).
  • the management device 300 which is an operating system, transmits SNMP polling to the MIB acquisition unit 201 in the router 200, which is the measurement target.
  • the MIB acquisition unit 201 returns the MIB information 202 read in response to the SNMP polling to the management device 300.
  • the MIB information 202 stores the average CPU usage rate for a certain period of time.
  • FIG. 10 is a configuration diagram of a detection system by the event manager.
  • the event manager 203 monitors the MIB information 202 (CPU usage rate) in the router 200 to be measured, and notifies the management device 300 when a predetermined threshold value is exceeded, thereby causing an abnormality to the maintenance person.
  • Inform. Non-Patent Document 2 describes a setting example of EEM (Embedded Event Manager) which is an event manager 203.
  • Cisco Systems GK "How to Collect CPU Utilization for Cisco IOS Devices Using SNMP", [online], October 26, 2005, [Search April 28, 2020], Internet ⁇ URL: https //www.cisco.com/c/ja_jp/support/docs/ip/simple-network-management-protocol-snmp/15215-collect-cpu-util-snmp.html> Cisco Systems GK, "Example of EEM settings that automatically acquire logs when CPU usage increases", [online], April 24, 2015, [Search on April 28, 2020], Internet ⁇ URL: https://community.cisco.com/t5/%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF % E3% 82%AF % E3% 82% A4% E3% 83% B3% E3% 83% 95% E3% 83% A9% E3% 82% B9% E3% 83% 88% E3% 83% A9% E3% 82% AF% E3
  • the software processing load of the router increases according to the processing of the routing protocol such as IGP (Interior Gateway Protocol).
  • IGP Interior Gateway Protocol
  • a measurement method that suppresses load costs is desired even for network systems with thousands of routers.
  • the method of collecting the CPU usage rate from the MIBs such as Non-Patent Documents 1 and 2 has a high cost related to load measurement.
  • the cost during load measurement is high. That is, since the processing load of SNMP MIB polling (data request) is concentrated on the management device, it is difficult to monitor the cycle shorter than the minute unit. Moreover, since only the average CPU usage rate is output, it is not suitable for grasping the load increase in a short period of time.
  • the cost before load measurement is high. Specifically, it is necessary to deploy (install) the event manager for all routers on the network system before load measurement.
  • the main subject of the present invention is to provide a method for measuring a software processing load in which the load cost is suppressed.
  • the measuring device of the present invention has the following features.
  • the present invention comprises a first packet processing unit that transmits a first packet for software processing by a network device to be measured to the network device and receives a response of the first packet from the network device.
  • a second packet to be transferred to the network device by hardware processing is transmitted to the network device at the same time as the transmission time of the first packet, and the response of the second packet is received from the network device.
  • Packet processing unit and A delay calculation unit that obtains the round-trip propagation delay from the transmission / reception time of the first packet, obtains the round-trip propagation delay from the transmission / reception time of the second packet, and calculates the difference between the two round-trip propagation delays as the delay time. It is characterized by having an abnormality detecting unit for determining an abnormality of the network device to be measured from the calculated delay time.
  • FIG. 1 is a block diagram of a measurement system.
  • the measurement system includes a measurement device 1 on the side for measuring the software processing load and a set (measurement target network 2NW) of the router (network device) 2 on the measurement side.
  • Each router 2 uses a packet header of both a survival monitoring packet (first packet, not shown in FIG. 1, details are shown in FIG. 4) and a probe packet (second packet, P1 to P3 in FIG. 1). Forward to the destination indicated by.
  • the survival monitoring packet is a packet for confirming whether or not the destination router 2 is alive (correctly functioning).
  • the survival monitoring packet is composed of, for example, a combination of an "ICMP (Internet Control Message Protocol) Echo Request" transmitted to the router 2 for confirmation and an "ICMP Echo Reply" returned from the router 2.
  • the packet header of the survival monitoring packet is an IP header based on IGP routing, and is processed by software by the router 2 corresponding to the destination IP address.
  • a survival monitoring packet in which CPU processing occurs is used in order to measure the software processing load in the router 2. This is because the general router 2 processes the survival monitoring packet addressed to its own device (loopback address, etc.) as CPU processing.
  • a packet other than the survival monitoring packet in which CPU processing occurs may be substituted.
  • a probe packet is a data packet for delivering data to a destination.
  • the packet header of the probe packet is MPLS (Multi-Protocol Label Switching) label information, and is transferred by the hardware processing of the router 2.
  • SR Segment-Routing
  • MPLS Multi-Protocol Label Switching
  • MPLS extension is applied to the probe packet.
  • label switching in which the passage path of the probe packet can be explicitly specified by the MPLS label can be used in the measurement target network 2NW.
  • the probe packet is a data packet for stacking SR / MPLS labels, and the data content stored in the payload portion other than the area where the time stamp is stamped is not particularly limited.
  • the route 5B that reaches the measuring device 1 via the route 5B is set as the route 5 common to both packets.
  • the route 5 of the survival monitoring packet is set as a routing table inside each router 2 based on the link state information advertised between neighbors which are neighboring routers. IGP routing protocols such as OSPF (Open Shortest Path First) and IS-IS (Intermediate System to Intermediate System) are used for link-state information advertising.
  • the circled numbers such as "1" between the measuring device 1 and the router 2A in FIG. 1 indicate the advertised IGP cost.
  • the route 5 of the probe packet heads from the measuring device 1 to the router 2C in the same manner as the route 5 of the survival monitoring packet, and the router 2C thereof. It is set to return to the measuring device 1 from.
  • details will be described in the order of (Procedure 1) to (Procedure 5).
  • the measuring device 1 has a SID (Segment ID) of itself (measuring device 1) as a source as an inner label and a SID of a router 2C as a destination as an outer (head) label.
  • the probe packet P1 is sent.
  • the measuring device 1 also adds a time stamp indicating the transmission time T2 to the probe packet P1.
  • the routers 2A and 2B in the middle of the route 5A refer to the outer label and transfer the probe packet P1 to the next hop toward the destination router 2C.
  • the route 5A of the probe packet P1 toward the router 2C is a route along the same IGP cost as the survival monitoring packet.
  • the router 2C acquires the probe packet P2 by popping (removing) the outer label to which its own SID is attached from the probe packet P1. Then, the router 2C returns the probe packet P2 to the measuring device 1 based on the SID of the measuring device 1 indicated by the label of the probe packet P2.
  • the routers 2B and 2A in the middle of the route 5B refer to the label of the probe packet P2 and transfer the probe packet P2 to the next hop toward the measuring device 1. Again, as in step 2, the label does not specify how to pass through the route 5B (routers 2A, 2B, 2D) on the way, so the route 5B of the probe packet P2 is the same IGP as the survival monitoring packet.
  • the measuring device 1 receives the probe packet P2, it creates a probe packet P3 from which its label has been removed while adding a time stamp indicating the reception time T3. Then, the measuring device 1 sets the time difference between the two time stamps (reception time T3-transmission time T2) as the round-trip propagation delay (RTT: Round-Trip Time) of the probe packet.
  • RTT Round-Trip Time
  • the probe packet and the survival monitoring packet pass through the same route (route 5A on the way and route 5B on the way back).
  • both the probe packet and the survival monitoring packet are expected to be hardware-forwarded by the routers 2A and 2B in the middle of the route 5 with the same propagation delay, so that the delay fluctuation factors of both packets are the same. ..
  • the software processing in the router 2C to be measured exists in the survival monitoring packet, but the software processing does not exist in the probe packet. Therefore, the difference between the round-trip propagation delays of both packets is only the delay due to software processing in the router 2C. That is, the difference between the round-trip propagation delays of both packets can be accurately measured without being affected by the delay fluctuation factor in the forwarding path.
  • the priority (ToS: Type of Service) of both packets is made the same, and the communication of both packets is made. It is desirable to have the same environment.
  • FIG. 2 is a functional configuration diagram of the measuring device 1 and the router 2.
  • the measuring device 1 includes a survival monitoring packet processing unit (first packet processing unit) 11, a probe packet processing unit (second packet processing unit) 12, a delay calculation unit 13, an abnormality detection unit 14, and a notification unit 15.
  • the router 2 has a software processing unit 21 and a hardware processing unit 22.
  • the survival monitoring packet processing unit 11 transmits and receives the survival monitoring packet, and stamps the transmission time and the time stamp indicating the reception time on the survival monitoring packet.
  • the software processing unit 21 processes a survival monitoring packet addressed to itself and a control signal of a routing protocol.
  • the probe packet processing unit 12 transmits and receives the probe packet, and stamps a time stamp indicating the transmission time and the reception time on the probe packet.
  • the hardware processing unit 22 transfers both the probe packet and the survival monitoring packet by the hardware transfer mechanism.
  • the delay calculation unit 13 calculates the delay time of the software processing unit 21 in the router 2 to be measured from the time stamp of the survival monitoring packet and the time stamp of the probe packet.
  • the abnormality detection unit 14 detects an abnormality in the router 2 to be measured based on the calculated delay time and its fluctuation information.
  • the notification unit 15 notifies the maintenance person of the detected abnormality of the router 2 by notifying the management device 3.
  • FIG. 3 is a hardware configuration diagram of the measuring device 1.
  • the measuring device 1 is configured as a computer 900 having a CPU 901, a RAM 902, a ROM 903, an HDD 904, a communication I / F 905, an input / output I / F 906, and a media I / F 907.
  • the communication I / F 905 is connected to an external communication device 915.
  • the input / output I / F 906 is connected to the input / output device 916.
  • the media I / F907 reads / writes data from the recording medium 917.
  • the CPU 901 controls each processing unit by executing a program (also referred to as an application or an abbreviation thereof) read into the RAM 902.
  • the program can also be distributed via a communication line, or recorded and distributed on a recording medium 917 such as a CD-ROM.
  • FIG. 4 is an explanatory diagram showing a passage route of the survival monitoring packet.
  • the survival monitoring packet processing unit 11 of the measuring device 1 creates a survival monitoring packet “ICMP Echo Request” (“Echo” is omitted in FIG. 4) addressed to the router 2 (the address of the loopback interface) to be measured. .. Then, the survival monitoring packet processing unit 11 simultaneously transmits a probe packet destined for the router 2 to be measured (actually, the survival monitoring packet and the probe packet are continuously transmitted), and at the same time, sets a time stamp of the transmission time T1.
  • the attached ICMP Request is sent to the measurement target network 2NW.
  • the hardware processing unit 22 of the router 2 to be measured reads from the header that the received ICMP Request is the destination, and notifies the software processing unit 21 of the ICMP Request.
  • the hardware processing unit 22 of the router 2 other than the measurement target transfers the survival monitoring packet to the router 2 of the next hop without notifying the software processing unit 21 of the own router.
  • the software processing unit 21 reads the address of the measuring device 1 which is the transmission source from the header of the notified ICMP Request, and returns an "ICMP Echo Reply"("Echo” is omitted in FIG. 4) to the address. ..
  • the survival monitoring packet processing unit 11 of the measuring device 1 receives the ICMP Reply from the measurement target network 2NW, the time stamp indicating the reception time T4 is added to the ICMP Reply. Then, the delay calculation unit 13 calculates the round-trip propagation delay of the survival monitoring packet from the time stamps (transmission time T1, reception time T4) of the survival monitoring packet.
  • FIG. 5 is an explanatory diagram showing a passage path of a probe packet.
  • the probe packet processing unit 12 of the measuring device 1 stacks two MPLS labels (probe packet P1 in FIG. 1) so as to return from the router 2 to be measured and return to its own measuring device 1. create. Then, the probe packet processing unit 12 transmits the Probe Packet with the time stamp of the transmission time T2 to the measurement target network 2NW at the same time as the transmission of the survival monitoring packet addressed to the router 2 of the same measurement target.
  • the hardware processing unit 22 of the router 2 to be measured deletes the first label, which is its destination, from the header of the received Probe Packet, and sends the Probe Packet to the measuring device 1 specified by the second label. Issue.
  • the probe packet processing unit 12 of the measuring device 1 receives the probe packet from the measurement target network 2NW
  • the probe packet processing unit 12 adds a time stamp indicating the reception time T3 to the probe packet.
  • the delay calculation unit 13 calculates the round-trip propagation delay of the probe packet from the time stamps of the probe packet (transmission time T2, reception time T3).
  • FIG. 6 is a flowchart showing the processing of the measuring device 1.
  • the measuring device 1 transmits the survival monitoring packet at the transmission time T1 and the probe packet at the transmission time T2 to the router 2 to be measured at almost the same time (S11).
  • the measuring device 1 receives the probe packet returned from the router 2 at time T3 (S12).
  • the survival monitoring packet returned from the router 2 is received at time T4 (S13).
  • the abnormality detection unit 14 detects whether the delay time value calculated in S21 or the fluctuation (fluctuation such as increase) of the delay time value causes an abnormality due to the software processing load of the router 2. (S22). If Yes in S22, proceed to S23, and if No, proceed to S24.
  • a method of detecting an increase in the delay time of S22 for example, a delay time of the upper k position having a large difference from the result (average delay time) of the past n times is obtained, and the amount of fluctuation of the obtained delay time is predetermined.
  • the abnormality detection unit 14 executes the conventional method of collecting the CPU usage rate shown in FIGS. 9 and 10, and uses the combination of the acquired CPU usage rate and the delay time (presence / absence of abnormality) of S21.
  • the occurrence of an abnormality in S22 may be determined.
  • the abnormality detection unit 14 manages the parts (memory, etc.) other than the CPU in the router 2 as an abnormality (estimating the cause of the abnormality).
  • the maintenance person can grasp not only the presence or absence of the abnormality but also the cause of the abnormality, and can select an appropriate maintenance work such as a memory replacement work.
  • the notification unit 15 notifies the management device 3 of information regarding the abnormality detected in S22 (the delay time determined this time, the address of the router 2 in which the delay time has occurred, and the like) (S23).
  • the maintenance person and the operator can know the information notified in S23 from the display screen of the management device 3. Since the measuring device 1 has completed the current measurement, the process is returned to S11 after waiting for the elapse of the measurement interval until the next measurement (S24, No).
  • the measurement interval is a predetermined periodic interval.
  • FIG. 7 is a graph showing the experimental results of the measurement system.
  • the vertical axis is the round-trip propagation delay (RTT) as the Xth measurement result. ) Is shown.
  • Graph lines 101 and 102 show the case where a survival monitoring packet for software processing is sent, and graph lines 103 and 104 show the case where a probe packet for hardware processing is sent.
  • the graph lines 101 and 103 are measured values when the CPU load is about 50%
  • the graph lines 102 and 104 are measured values when the CPU load is about 2%.
  • the RTT fluctuates greatly depending on the level of the CPU load.
  • the hardware processing shown by graph lines 103 and 104 is not affected by the CPU load. Therefore, the increase in software processing load can be detected and estimated by calculating the measurement difference of the graph lines 101 and 103 with a CPU load of 50% and the measurement difference of the graph lines 102 and 104 with a CPU load of 2%, respectively. Can be done.
  • the notification unit 15 may display the graph of FIG. 7 on the display screen of the management device 3.
  • FIG. 8 is a configuration diagram reflecting the measurement results of the measurement system.
  • the abnormality detection unit 14 detects an abnormality in the router 2D (Yes in S22 in FIG. 6), and the notification unit 15 notifies the maintenance person of the abnormality (S23).
  • the maintenance person considers the possibility of an intermittent failure of the router 2D or a sign thereof in response to the occurrence of an abnormality in the router 2D even though the network configuration is not changed.
  • the maintenance person changes the route from the current route 5C connecting the users NW (network) 4A and 4B via the router 2D to the spare route 5D that does not pass through the router 2D. You can give feedback to the network operation, such as instructing.
  • a survival monitoring packet for example, an ICMP packet
  • a probe packet for example, a data packet for stacking SR / MPLS labels
  • the measuring device 1 calculates the delay time indicating the load of software processing of the router 2 to be measured from the difference between the round-trip propagation delays of both packets.
  • the measuring device 1 can detect an increase in the software processing load of the router by detecting an increase in the delay time from the steady state.
  • the fluctuation of the delay time required for software processing is regarded as the fluctuation of the software processing load, so that an index other than the CPU usage rate is added to the measurement index of the software processing load. Therefore, even in a high range of software processing load that cannot be detected only by the CPU usage rate, the instantaneous value and the fluctuation value can be detected.
  • software processing load can be detected even when there is a bug in the CPU usage value itself stored in the MIB, or when there is a setting to suppress the load increase of the CPU usage rate.
  • the setting for suppressing the load increase is, for example, a setting for setting a rate limit in terms of hardware before CPU processing for a packet to be processed by software.
  • the measuring device 1 of the present invention is a survival monitoring packet processing unit 11 that transmits a survival monitoring packet for causing the router 2 to be measured to perform software processing to the router 2 and receives a response of the survival monitoring packet from the router 2.
  • a probe packet processing unit 12 that transmits a probe packet to be transferred to the router 2 by hardware processing toward the router 2 at the same time as the transmission time of the survival monitoring packet, and receives a response of the probe packet from the router 2.
  • a delay calculation unit 13 that obtains the round-trip propagation delay from the transmission / reception time of the survival monitoring packet, obtains the round-trip propagation delay from the transmission / reception time of the probe packet, and calculates the difference between the two round-trip propagation delays as the delay time. It is characterized by having an abnormality detecting unit 14 for determining an abnormality of the router 2 to be measured from the calculated delay time.
  • the probe packet processing unit 12 has attached a first label designating the router 2 to be measured and a second label designating its own measuring device 1 as labels indicating the route through which the probe packet passes. It is characterized in that a probe packet is transmitted to the router 2.
  • the route through which the probe packet passes becomes the same as the route through which the survival monitoring packet passes, so the element due to the difference in route is appropriately excluded from the delay fluctuation elements of both packets.
  • the present invention is characterized in that the survival monitoring packet processing unit 11 transmits an ICMP Echo Request as a survival monitoring packet, and thus receives an ICMP Echo Reply, which is a response of the survival monitoring packet, from the router 2.
  • the present invention is characterized in that the survival monitoring packet transmitted by the survival monitoring packet processing unit 11 and the probe packet transmitted by the probe packet processing unit 12 have the same priority.
  • the measuring device 1 further has a notification unit 15 for notifying the management device 3 used by the maintenance person of the abnormality of the router 2.
  • the notification unit 15 estimates the cause of the abnormality in the router 2 from the combination of the presence / absence of the abnormality in the router 2 obtained by the abnormality detection unit 14 and the CPU usage rate acquired from the router 2, and informs the management device 3 of the cause of the abnormality. It is characterized by notifying.
  • the maintenance person can know not only the presence or absence of the abnormality but also the cause of the abnormality, so that appropriate maintenance work can be started.
  • Measuring device 3 Management device 2 Router (network device) 2NW measurement target network 4 User NW 5 Route 11 Survival monitoring packet processing unit (1st packet processing unit) 12 Probe packet processing unit (second packet processing unit) 13 Delay calculation unit 14 Abnormality detection unit 15 Notification unit 21 Software processing unit 22 Hardware processing unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

測定装置(1)は、測定対象のルータ(2)にソフトウェア処理させるための生存監視パケットをルータ(2)に向けて送信し、そのルータ(2)から生存監視パケットの応答を受信する生存監視パケット処理部(11)と、ルータ(2)にハードウェア処理で転送させるためのプローブパケットを、生存監視パケットの送信時刻と同時にルータ(2)に向けて送信し、そのルータ(2)からプローブパケットの応答を受信するプローブパケット処理部(12)と、生存監視パケットの送受信時刻から往復伝搬遅延を求めるとともに、プローブパケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部(13)と、計算された遅延時間から測定対象のルータ(2)の異常を判定する異常検知部(14)と、を有する。

Description

測定装置、測定システム、測定方法、および、測定プログラム
 本発明は、測定装置、測定システム、測定方法、および、測定プログラムに関する。
 通信事業者等のネットワークを構成するルータのCPU使用率は、間欠故障を検知する指標の一つである。MIB(Management Information Base)は、CPU使用率などのルータ内部の状態についてまとめたデータ集合の規格である。SNMP(Simple Network Management Protocol)は、ルータの外部からMIBのデータを取得するためのプロトコルである。
 図9は、SNMPによる監視システムの構成図である。
 非特許文献1には、Cisco IOS(Internetwork Operating System)(登録商標)が稼働するルータ200から、SNMPを使用してCPU使用率を収集する方法が記載されている。
 オペレーションシステムである管理装置300は、測定対象であるルータ200内のMIB取得部201に対して、SNMPポーリングを送信する。MIB取得部201は、SNMPポーリングに応じて読み込んだMIB情報202を管理装置300に返信する。MIB情報202には、一定時間の平均CPU使用率が格納されている。
 図10は、イベントマネージャによる検知システムの構成図である。
 イベントマネージャ203は、測定対象であるルータ200内のMIB情報202(CPU使用率)を監視し、予め定めた閾値を超過した場合にその旨を管理装置300に通知することで、保守者に異常を知らせる。
 非特許文献2には、イベントマネージャ203であるEEM(Embedded Event Manager)の設定例が記載されている。
シスコシステムズ合同会社、"SNMP を使用してCisco IOSデバイスのCPU使用率を収集する方法"、[online]、2005年10月26日、[2020年4月28日検索]、インターネット〈URL:https://www.cisco.com/c/ja_jp/support/docs/ip/simple-network-management-protocol-snmp/15215-collect-cpu-util-snmp.html〉 シスコシステムズ合同会社、"CPU 使用率が上昇した場合に自動的にログを取得する EEM の設定例"、[online]、2015年4月24日、[2020年4月28日検索]、インターネット〈URL:https://community.cisco.com/t5/%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF%E3%82%A4%E3%83%B3%E3%83%95%E3%83%A9%E3%82%B9%E3%83%88%E3%83%A9%E3%82%AF%E3%83%81%E3%83%A3-%E3%83%89%E3%82%AD%E3%83%A5%E3%83%A1%E3%83%B3%E3%83%88/cpu-%E4%BD%BF%E7%94%A8%E7%8E%87%E3%81%8C%E4%B8%8A%E6%98%87%E3%81%97%E3%81%9F%E5%A0%B4%E5%90%88%E3%81%AB%E8%87%AA%E5%8B%95%E7%9A%84%E3%81%AB%E3%83%AD%E3%82%B0%E3%82%92%E5%8F%96%E5%BE%97%E3%81%99%E3%82%8B-eem-%E3%81%AE%E8%A8%AD%E5%AE%9A%E4%BE%8B/ta-p/3161101〉
 ルータのソフトウェア処理負荷は、IGP(Interior Gateway Protocol)などのルーティングプロトコルの処理に応じて上昇する。ルータの負荷超過を効果的に予防するためには、ルータが数千台規模のネットワークシステムに対しても、負荷コストを抑制するような測定手法が望まれる。しかし、非特許文献1,2などのMIBからCPU使用率を収集する方法では、負荷計測に関するコストが高い。
 非特許文献1の方式では、負荷計測中に関するコストが高くなる。つまり、SNMP MIBポーリング(データ要求)の処理負荷が管理装置に集中してしまうので、分単位よりも短い周期の監視が困難である。また、CPU使用率の平均のみが出力されるので、短い期間の負荷上昇などの把握には不向きである。
 非特許文献2の方式では、負荷計測前に関するコストが高くなる。具体的には、ネットワークシステム上の全ルータに対して、負荷計測前にイベントマネージャのデプロイ(インストール)が必要である。
 そこで、本発明は、負荷コストを抑制したソフトウェア処理負荷の測定手法を提供することを、主な課題とする。
 前記課題を解決するために、本発明の測定装置は、以下の特徴を有する。
 本発明は、測定対象のネットワーク装置にソフトウェア処理させるための第1パケットを前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第1パケットの応答を受信する第1パケット処理部と、
 前記ネットワーク装置にハードウェア処理で転送させるための第2パケットを、前記第1パケットの送信時刻と同時に前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第2パケットの応答を受信する第2パケット処理部と、
 前記第1パケットの送受信時刻から往復伝搬遅延を求めるとともに、前記第2パケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部と、
 計算された前記遅延時間から測定対象の前記ネットワーク装置の異常を判定する異常検知部と、を有することを特徴とする。
 本発明によれば、負荷コストを抑制したソフトウェア処理負荷の測定手法を提供することができる。
本実施形態に係わる測定システムの構成図である。 本実施形態に係わる測定装置およびルータの機能構成図である。 本実施形態に係わる測定装置のハードウェア構成図である。 本実施形態に係わる生存監視パケットの通過経路を示す説明図である。 本実施形態に係わるプローブパケットの通過経路を示す説明図である。 本実施形態に係わる測定装置の処理を示すフローチャートである。 本実施形態に係わる測定システムの実験結果を示すグラフである。 本実施形態に係わる測定システムの測定結果を反映した構成図である。 SNMPによる監視システムの構成図である。 イベントマネージャによる検知システムの構成図である。
 以下、本発明の一実施形態について、図面を参照して詳細に説明する。
 図1は、測定システムの構成図である。
 測定システムは、ソフトウェア処理負荷を測定する側の測定装置1と、測定される側のルータ(ネットワーク装置)2の集合(測定対象ネットワーク2NW)とを有する。各ルータ2は、生存監視パケット(第1パケット、図1では図示省略、詳細は図4)と、プローブパケット(第2パケット、図1のP1~P3)との両パケットを、それぞれのパケットヘッダが示すあて先に向けて転送する。
 生存監視パケットとは、送信先のルータ2が生存(正しく機能)しているか否かを確認するためのパケットである。生存監視パケットは、例えば、確認用にルータ2に送信される「ICMP(Internet Control Message Protocol) Echo Request」と、ルータ2から応答される「ICMP Echo Reply」との組み合わせで構成される。生存監視パケットのパケットヘッダはIGPルーティングに基づくIPヘッダであり、あて先のIPアドレスに該当するルータ2にソフトウェア処理される。
 なお、本実施形態では、ルータ2内のソフトウェア処理負荷を計測するために、CPU処理が生じる生存監視パケットを用いている。一般的なルータ2は、自装置(ループバックアドレス等)あての生存監視パケットの処理をCPU処理とするためである。一方、CPU処理が生じる生存監視パケット以外のパケットを代用してもよい。
 プローブパケット(Probe Packet)とは、送信先にデータを届けるためのデータパケットである。プローブパケットのパケットヘッダはMPLS(Multi-Protocol Label Switching)ラベル情報であり、ルータ2のハードウェア処理により転送される。プローブパケットには、SR(Segment-Routing)/MPLS拡張が適用される。これにより、プローブパケットの通過経路を明示的にMPLSラベルで指定可能なラベルスイッチングが、測定対象ネットワーク2NWで利用できる。
 本実施形態では、プローブパケットは、SR/MPLSラベルをスタックするデータパケットであり、タイムスタンプを打刻する領域以外のペイロード部分に格納されるデータ内容は特に問わない。
 以下、測定装置1がルータ2Cを測定する例を説明する。
 測定対象ネットワーク2NWの測定前の準備として、測定装置1からルータ2A,2Bを経由して測定対象のルータ2Cに届く経路5Aと、その経路5Aとは逆方向にルータ2Cからルータ2B,2Aを経由して測定装置1に届く経路5Bとを、両パケットに共通する経路5として設定しておく。
 生存監視パケットの経路5は、隣接ルータであるネイバ(Neighbor)間で広告されたリンクステート情報をもとに、各ルータ2内部のルーティングテーブルとして設定される。なお、リンクステート情報の広告には、OSPF(Open Shortest Path First)やIS-IS(Intermediate System to Intermediate System)などのIGPのルーティングプロトコルが使用される。
 なお、図1の測定装置1、ルータ2A間の丸で囲んだ「1」などの数字は、広告されたIGPコストを示す。
 プローブパケットの経路5は、MPLSラベル情報をパケットヘッダにスタックする(複数のラベルを順に付加する)ことで、生存監視パケットの経路5と同じように測定装置1からルータ2Cに向かい、そのルータ2Cから測定装置1に戻ってくるように設定される。以下、(手順1)~(手順5)の順に、詳細を説明する。
 (手順1)測定装置1は、内側のラベルとして送信元である自身(測定装置1)のSID(Segment ID)と、外側の(先頭の)ラベルとして送信先であるルータ2CのSIDとを付したプローブパケットP1を送信する。測定装置1は、この送信時刻T2を示すタイムスタンプも、プローブパケットP1に付加する。
 (手順2)経路5A途中のルータ2A,2Bは、外側のラベルを参照して、送信先であるルータ2Cに向かう次ホップへプローブパケットP1を転送する。
 なお、プローブパケットP1には、測定対象であるルータ2Cのラベルだけが付されているが、測定装置1~ルータ2Cの途中の経路5A(ルータ2A,2B,2D)をどのように通過するかはラベルで指定されていない。
 よって、ルータ2Cに向かうプローブパケットP1の経路5Aは、生存監視パケットと同じIGPコストに沿った経路となる。例えば、ルータ2A→2B→2CのIGPコストは30(=20+10)であり、ルータ2A→2D→2CのIGPコストは40(=10+30)なので、総コストが小さいルータ2B経由の経路5Aが選択される。
 (手順3)ルータ2Cは、プローブパケットP1から自身のSIDが付されている外側のラベルをPopする(取り外す)ことで、プローブパケットP2を取得する。そして、ルータ2Cは、プローブパケットP2のラベルが示す測定装置1のSIDに基づき、プローブパケットP2を測定装置1に向けて返信する。
 (手順4)経路5B途中のルータ2B,2Aは、プローブパケットP2のラベルを参照して、測定装置1に向かう次ホップへプローブパケットP2を転送する。ここでも手順2と同様に、途中の経路5B(ルータ2A,2B,2D)をどのように通過するかはラベルで指定されていないので、プローブパケットP2の経路5Bは、生存監視パケットと同じIGPコストに沿った経路となる。
 (手順5)測定装置1は、プローブパケットP2を受信すると、その受信時刻T3を示すタイムスタンプを付加しつつ、自身のラベルを除去したプローブパケットP3を作成する。そして、測定装置1は、2つのタイムスタンプの時間差(受信時刻T3-送信時刻T2)を、プローブパケットの往復伝搬遅延(RTT:Round-Trip Time)とする。
 以上、(手順1)~(手順5)の順に説明したように、プローブパケットと生存監視パケットとは、同じ経路(行きは経路5A,帰りは経路5B)を通過する。
 これにより、プローブパケットと生存監視パケットとの両パケットは、経路5途中のルータ2A,2Bはそれぞれ同じ伝搬遅延でハードウェア転送することが期待されるので、両パケットの遅延変動要素は同じとなる。
 一方、測定対象のルータ2C内のソフトウェア処理が生存監視パケットには存在するが、そのソフトウェア処理がプローブパケットには存在しない。よって、両パケットの往復伝搬遅延の差分は、ルータ2C内のソフトウェア処理による遅延のみとなる。つまり、転送経路内の遅延変動要素に影響を受けずに、両パケットの往復伝搬遅延の差を正確に測定できる。
 なお、両パケットの遅延変動要素を同じにするために、両パケットの経路5を同じにすることに加え、両パケットの優先度(ToS:Type of Service)を同じにするなど、両パケットの通信環境を同じにすることが望ましい。
 図2は、測定装置1およびルータ2の機能構成図である。
 測定装置1は、生存監視パケット処理部(第1パケット処理部)11と、プローブパケット処理部(第2パケット処理部)12と、遅延計算部13と、異常検知部14と、通知部15とを有する。ルータ2は、ソフトウェア処理部21と、ハードウェア処理部22とを有する。
 生存監視パケット処理部11は、生存監視パケットの送受信を行うとともに、その送信時刻および受信時刻を示すタイムスタンプを生存監視パケットに打刻する。ソフトウェア処理部21は、自身宛ての生存監視パケットや、ルーティングプロトコルの制御信号を処理する。
 プローブパケット処理部12は、プローブパケットの送受信を行うとともに、その送信時刻および受信時刻を示すタイムスタンプをプローブパケットに打刻する。ハードウェア処理部22は、ハードウェアの転送機構により、プローブパケットと生存監視パケットとの両パケットを転送する。
 遅延計算部13は、生存監視パケットのタイムスタンプと、プローブパケットのタイムスタンプとから、測定対象のルータ2内のソフトウェア処理部21の遅延時間を計算する。
 異常検知部14は、計算された遅延時間やその変動情報をもとに、測定対象のルータ2の異常を検知する。
 通知部15は、検知されたルータ2の異常を、管理装置3に通知することで、保守者に異常を知らせる。
 図3は、測定装置1のハードウェア構成図である。
 測定装置1は、CPU901と、RAM902と、ROM903と、HDD904と、通信I/F905と、入出力I/F906と、メディアI/F907とを有するコンピュータ900として構成される。
 通信I/F905は、外部の通信装置915と接続される。入出力I/F906は、入出力装置916と接続される。メディアI/F907は、記録媒体917からデータを読み書きする。さらに、CPU901は、RAM902に読み込んだプログラム(アプリケーションや、その略のアプリとも呼ばれる)を実行することにより、各処理部を制御する。そして、このプログラムは、通信回線を介して配布したり、CD-ROM等の記録媒体917に記録して配布したりすることも可能である。
 図4は、生存監視パケットの通過経路を示す説明図である。
 測定装置1の生存監視パケット処理部11は、測定対象のルータ2(のループバックインタフェースのアドレス)をあて先とする生存監視パケット「ICMP Echo Request」(図4では「Echo」は省略)を作成する。そして、生存監視パケット処理部11は、同じ測定対象のルータ2をあて先とするプローブパケットの送信と同時に(実際には生存監視パケットとプローブパケットとを連続して)、送信時刻T1のタイムスタンプを付したICMP Requestを測定対象ネットワーク2NWに送信する。
 測定対象のルータ2のハードウェア処理部22は、受信したICMP Requestが自身をあて先とすることをヘッダから読み取り、ICMP Requestをソフトウェア処理部21に通知する。一方、測定対象以外の(経路途中の)ルータ2のハードウェア処理部22は、生存監視パケットを自ルータのソフトウェア処理部21に通知せずに、次ホップのルータ2に転送する。
 ソフトウェア処理部21は、通知されたICMP Requestのヘッダから送信元である測定装置1のアドレスを読み取り、そのアドレスをあて先とする「ICMP Echo Reply」(図4では「Echo」は省略)を返信する。
 測定装置1の生存監視パケット処理部11は、測定対象ネットワーク2NWからICMP Replyを受信すると、その受信時刻T4を示すタイムスタンプをICMP Replyに付加する。そして、遅延計算部13は、生存監視パケットのタイムスタンプ(送信時刻T1、受信時刻T4)から、生存監視パケットの往復伝搬遅延を計算する。
 図5は、プローブパケット(Probe Packet)の通過経路を示す説明図である。
 測定装置1のプローブパケット処理部12は、測定対象のルータ2から折り返して自身の測定装置1へ戻ってくるように、MPLSラベルを2つスタックさせたProbe Packet(図1のプローブパケットP1)を作成する。
 そして、プローブパケット処理部12は、同じ測定対象のルータ2をあて先とする生存監視パケットの送信と同時に、送信時刻T2のタイムスタンプを付したProbe Packetを測定対象ネットワーク2NWに送信する。
 測定対象のルータ2のハードウェア処理部22は、受信したProbe Packetのヘッダから自身のあて先である1つめのラベルを削除し、2つめのラベルで指定されている測定装置1あてにProbe Packetを発出する。
 測定装置1のプローブパケット処理部12は、測定対象ネットワーク2NWからProbe Packetを受信すると、その受信時刻T3を示すタイムスタンプをProbe Packetに付加する。そして、遅延計算部13は、プローブパケットのタイムスタンプ(送信時刻T2、受信時刻T3)から、プローブパケットの往復伝搬遅延を計算する。
 図6は、測定装置1の処理を示すフローチャートである。
 測定装置1は、図4および図5で示したように、生存監視パケットを送信時刻T1で、プローブパケットを送信時刻T2で、ほぼ同時に測定対象のルータ2に送信する(S11)。測定装置1は、ルータ2から返答されたプローブパケットを時刻T3で受信し(S12)。ルータ2から返答された生存監視パケットを時刻T4で受信する(S13)。
 そして、遅延計算部13は、プローブパケットの往復伝搬遅延(=時刻T3-時刻T2)を計算し(S14)、生存監視パケットの往復伝搬遅延(=時刻T4-時刻T1)を計算する(S15)。遅延計算部13は、ルータ2のソフトウェア処理による遅延時間=(生存監視パケットの往復伝搬遅延)-(プローブパケットの往復伝搬遅延)を計算する(S21)。
 ここで、異常検知部14は、S21で計算した遅延時間の値や、遅延時間の値の変動(上昇などのゆらぎ)を検知することにより、ルータ2のソフトウェア処理負荷による異常が発生したか否かを判定する(S22)。S22でYesならS23に進み、NoならS24に進む。
 なお、S22の遅延時間の上昇を検知する方法は、例えば、過去n回の結果(平均遅延時間)からの差分が大きい上位k位の遅延時間を求め、その求めた遅延時間の変動量が所定閾値もよりも大きいときに異常と判定する方法(k近傍法)がある。
 また、異常検知部14は、図9,図10で示した従来のCPU使用率を収集する方法を実行し、取得したCPU使用率と、S21の遅延時間(異常の有無)との組み合わせから、S22の異常発生を判定してもよい。例えば、異常検知部14は、CPU使用率が正常値で、遅延時間が異常値の場合、ルータ2内のCPU以外の部品(メモリなど)の異常として(異常の原因を推定して)、管理装置3に通知する。これにより、保守者は異常の有無だけでなく、異常の原因を把握できるので、メモリの交換作業などの適切な保守作業を選択できる。
 通知部15は、S22で検知した異常に関する情報(今回判定した遅延時間や、その遅延時間が発生したルータ2のアドレスなど)を、管理装置3に通知する(S23)。保守者やオペレータは、S23で通知された情報を、管理装置3の表示画面から知ることができる。
 測定装置1は今回の測定を終えたので、次回の測定までの測定間隔の経過を待ってから(S24,No)、処理をS11に戻す。測定間隔は、予め定めた定期間隔である。
 図7は、測定システムの実験結果を示すグラフである。このグラフは、測定システムを模擬した試験機を用いた第X回目(X=1,2,…)の測定を横軸とし、縦軸でその第X回目の測定結果としての往復伝搬遅延(RTT)を示す。
 グラフ線101,102はソフトウェア処理となる生存監視パケットを送出した場合を示し、グラフ線103,104はハードウェア処理となるプローブパケットを送出した場合を示す。また、グラフ線101,103はCPU負荷が50%程度の場合の測定値であり、グラフ線102,104はCPU負荷が2%程度の場合の測定値である。
 グラフ線101,102が示すソフトウェア処理においては、CPU負荷の高低によってRTTが大きく揺らいでいる。グラフ線103,104が示すハードウェア処理においてはCPU負荷の影響を受けていない。よって、CPU負荷が50%のグラフ線101,103の測定差分と、CPU負荷が2%のグラフ線102,104の測定差分をそれぞれ計算することで、ソフトウェア処理負荷の上昇を検知および推定することができる。
 なお、通知部15は、図7のグラフを管理装置3の表示画面に表示させてもよい。
 図8は、測定システムの測定結果を反映した構成図である。
 例えば、異常検知部14はルータ2Dで異常を検知し(図6のS22でYes)、通知部15はその異常を保守者に通知する(S23)。保守者は、ネットワーク構成の変更を伴わないにもかかわらず、ルータ2Dで異常が発生したことを受け、ルータ2Dの間欠故障の可能性やその予兆と見做す。
 その結果、保守者は、ルータ2Dを経由してユーザNW(ネットワーク)4A,4B間を接続していた現用の経路5Cから、ルータ2Dを通過しない予備の経路5Dへの経路変更を管理装置3に指示するなど、ネットワーク運用へのフィードバックを行うことができる。
 以上説明した本実施形態の測定装置1は、測定対象のルータ2にCPU処理が生じる生存監視パケット(例えばICMPパケット)と、ハードウェア転送されるプローブパケット(例えばSR/MPLSラベルをスタックするデータパケット)を、同じ経路を通るように送出する。そして、測定装置1は、両パケットの往復伝搬遅延の差分から、測定対象のルータ2のソフトウェア処理の負荷を示す遅延時間を算出する。
 これにより、測定装置1は、定常状態からの遅延時間の上昇を検知することで、ルータのソフトウェア処理負荷の上昇を検知できる。
 また、本実施形態の測定方式により、ソフトウェア処理にかかる遅延時間の変動を、ソフトウェア処理負荷の変動と捉えることで、ソフトウェア処理負荷の測定指標にCPU使用率以外の指標が加わる。よって、CPU使用率だけでは検知できない高範囲なソフトウェア処理負荷でも、その瞬間値や変動値を検知できる。
 例えば、MIBへ格納されるCPU使用率の値自体にバグが発生していた場合や、CPU使用率の負荷上昇を抑制する設定が入っている場合などでもソフトウェア処理負荷を検知できる。負荷上昇を抑制する設定とは、例えばソフトウェア処理となるパケットに対して、CPU処理前にハードウェア的にレート制限を設けるなどの設定である。
 これらの検知により、CPU使用率の数値として現出しないルータ2のサイレント故障でも、的確に異常として保守者に通知できる。
[効果]
 本発明の測定装置1は、測定対象のルータ2にソフトウェア処理させるための生存監視パケットをルータ2に向けて送信し、そのルータ2から生存監視パケットの応答を受信する生存監視パケット処理部11と、
 ルータ2にハードウェア処理で転送させるためのプローブパケットを、生存監視パケットの送信時刻と同時にルータ2に向けて送信し、そのルータ2からプローブパケットの応答を受信するプローブパケット処理部12と、
 生存監視パケットの送受信時刻から往復伝搬遅延を求めるとともに、プローブパケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部13と、
 計算された遅延時間から測定対象のルータ2の異常を判定する異常検知部14と、を有することを特徴とする。
 これにより、測定対象のルータ2のソフトウェア処理負荷の上昇を検知できる。さらに、生存監視パケットとプローブパケットとの2パケットのみで往復伝搬遅延を測定することで、短期間の(秒オーダ間隔での)測定ができる。
 また、SNMP MIBポーリングなどのルータ内部で特別な測定用機能を起動しなくて済むため、負荷計測中のルータ2に余分な負荷を与えずに済む。よって、負荷コストを抑制したソフトウェア処理負荷の測定手法を提供できる。
 本発明は、プローブパケット処理部12が、プローブパケットが通過する経路を示すラベルとして、測定対象のルータ2を指定した第1ラベルと、自身の測定装置1を指定した第2ラベルとを付したプローブパケットをルータ2に向けて送信することを特徴とする。
 これにより、プローブパケットが通過する経路は、生存監視パケットが通過する経路と同じになるので、両パケットの遅延変動要素から、経路の違いによる要素は適切に除外される。
 本発明は、生存監視パケット処理部11が、生存監視パケットとしてICMP Echo Requestを送信することで、ルータ2から生存監視パケットの応答であるICMP Echo Replyを受信することを特徴とする。
 これにより、ICMP Echoというルータ2に備わっている既存の生存監視機能を負荷測定に流用することで、監視対象のルータ2には特別な機能追加なしに異常の検知ができる。つまり、測定システムの導入コストを抑制できる。
 本発明は、生存監視パケット処理部11が送信する生存監視パケットと、プローブパケット処理部12が送信するプローブパケットとは、同じ優先度が付されることを特徴とする。
 これにより、プローブパケットと生存監視パケットとは、同じ転送条件で経路を通過するので、両パケットの遅延変動要素から、転送条件の違いによる要素は適切に除外される。
 本発明は、測定装置1が、さらに、保守者が使用する管理装置3に対してルータ2の異常を通知する通知部15を有しており、
 通知部15が、異常検知部14が求めたルータ2の異常の有無と、そのルータ2から取得したCPU使用率との組み合わせからルータ2の異常原因を推定し、その異常原因を管理装置3に通知することを特徴とする。
 これにより、保守者は、異常の有無だけでなく、異常の原因を知ることができるので、適切な保守作業を開始できる。
 1   測定装置
 3   管理装置
 2   ルータ(ネットワーク装置)
 2NW 測定対象ネットワーク
 4   ユーザNW
 5   経路
 11  生存監視パケット処理部(第1パケット処理部)
 12  プローブパケット処理部(第2パケット処理部)
 13  遅延計算部
 14  異常検知部
 15  通知部
 21  ソフトウェア処理部
 22  ハードウェア処理部

Claims (8)

  1.  測定対象のネットワーク装置にソフトウェア処理させるための第1パケットを前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第1パケットの応答を受信する第1パケット処理部と、
     前記ネットワーク装置にハードウェア処理で転送させるための第2パケットを、前記第1パケットの送信時刻と同時に前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第2パケットの応答を受信する第2パケット処理部と、
     前記第1パケットの送受信時刻から往復伝搬遅延を求めるとともに、前記第2パケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算する遅延計算部と、
     計算された前記遅延時間から測定対象の前記ネットワーク装置の異常を判定する異常検知部と、を有することを特徴とする
     測定装置。
  2.  前記第2パケット処理部は、前記第2パケットが通過する経路を示すラベルとして、測定対象の前記ネットワーク装置を指定した第1ラベルと、自身の前記測定装置を指定した第2ラベルとを付した前記第2パケットを前記ネットワーク装置に向けて送信することを特徴とする
     請求項1に記載の測定装置。
  3.  前記第1パケット処理部は、前記第1パケットとしてICMP(Internet Control Message Protocol) Echo Requestを送信することで、前記ネットワーク装置から前記第1パケットの応答であるICMP Echo Replyを受信することを特徴とする
     請求項1に記載の測定装置。
  4.  前記第1パケット処理部が送信する前記第1パケットと、前記第2パケット処理部が送信する前記第2パケットとは、同じ優先度が付されることを特徴とする
     請求項1に記載の測定装置。
  5.  前記測定装置は、さらに、保守者が使用する管理装置に対して前記ネットワーク装置の異常を通知する通知部を有しており、
     前記通知部は、前記異常検知部が求めた前記ネットワーク装置の異常の有無と、そのネットワーク装置から取得したCPU使用率との組み合わせから前記ネットワーク装置の異常原因を推定し、その異常原因を前記管理装置に通知することを特徴とする
     請求項1に記載の測定装置。
  6.  請求項1ないし請求項5のいずれか1項に記載の測定装置と、前記ネットワーク装置とを有することを特徴とする測定システム。
  7.  測定装置は、第1パケット処理部と、第2パケット処理部と、遅延計算部と、異常検知部とを有しており、
     前記第1パケット処理部は、測定対象のネットワーク装置にソフトウェア処理させるための第1パケットを前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第1パケットの応答を受信し、
     前記第2パケット処理部は、前記ネットワーク装置にハードウェア処理で転送させるための第2パケットを、前記第1パケットの送信時刻と同時に前記ネットワーク装置に向けて送信し、そのネットワーク装置から前記第2パケットの応答を受信し、
     前記遅延計算部は、前記第1パケットの送受信時刻から往復伝搬遅延を求めるとともに、前記第2パケットの送受信時刻から往復伝搬遅延を求め、双方の往復伝搬遅延の差分を遅延時間として計算し、
     前記異常検知部は、計算された前記遅延時間から測定対象の前記ネットワーク装置の異常を判定することを特徴とする
     測定方法。
  8.  コンピュータを、請求項1ないし請求項5のいずれか1項に記載の測定装置として機能させるための測定プログラム。
PCT/JP2020/020094 2020-05-21 2020-05-21 測定装置、測定システム、測定方法、および、測定プログラム WO2021234900A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2020/020094 WO2021234900A1 (ja) 2020-05-21 2020-05-21 測定装置、測定システム、測定方法、および、測定プログラム
JP2022524796A JP7302740B2 (ja) 2020-05-21 2020-05-21 測定装置、測定システム、測定方法、および、測定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/020094 WO2021234900A1 (ja) 2020-05-21 2020-05-21 測定装置、測定システム、測定方法、および、測定プログラム

Publications (1)

Publication Number Publication Date
WO2021234900A1 true WO2021234900A1 (ja) 2021-11-25

Family

ID=78707905

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/020094 WO2021234900A1 (ja) 2020-05-21 2020-05-21 測定装置、測定システム、測定方法、および、測定プログラム

Country Status (2)

Country Link
JP (1) JP7302740B2 (ja)
WO (1) WO2021234900A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130086250A1 (en) * 2011-09-30 2013-04-04 Suat R. Eskicioglu Method and apparatus for round trip delay kpi monitoring in live network using user plane probe session
US20170155566A1 (en) * 2015-11-30 2017-06-01 Cisco Technology, Inc. Performing network topology traces with minimal data collection
JP2017121057A (ja) * 2015-12-30 2017-07-06 華為技術有限公司Huawei Technologies Co.,Ltd. 遅延測定を実装するための方法、装置、およびシステム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7355209B2 (ja) 2020-02-21 2023-10-03 日本電信電話株式会社 通信遅延測定装置、通信遅延測定方法及びプログラム
WO2021166266A1 (ja) 2020-02-21 2021-08-26 日本電信電話株式会社 遅延測定装置、遅延測定方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130086250A1 (en) * 2011-09-30 2013-04-04 Suat R. Eskicioglu Method and apparatus for round trip delay kpi monitoring in live network using user plane probe session
US20170155566A1 (en) * 2015-11-30 2017-06-01 Cisco Technology, Inc. Performing network topology traces with minimal data collection
JP2017121057A (ja) * 2015-12-30 2017-07-06 華為技術有限公司Huawei Technologies Co.,Ltd. 遅延測定を実装するための方法、装置、およびシステム

Also Published As

Publication number Publication date
JP7302740B2 (ja) 2023-07-04
JPWO2021234900A1 (ja) 2021-11-25

Similar Documents

Publication Publication Date Title
US9692679B2 (en) Event triggered traceroute for optimized routing in a computer network
US8036121B2 (en) Method of estimating quality degradation on network in communication network system
US8631115B2 (en) Connectivity outage detection: network/IP SLA probes reporting business impact information
US8811395B2 (en) System and method for determination of routing information in a network
US8028088B2 (en) System and method for service assurance in IP networks
US20070064611A1 (en) Method for monitoring packet loss ratio
JP5506801B2 (ja) 転送ネットワークの障害検出
WO2021093465A1 (zh) 发送报文、接收报文以进行oam的方法、装置及系统
US20030033404A1 (en) Method for automatically monitoring a network
US20080298258A1 (en) Information transfer capability discovery apparatus and techniques
JP5042095B2 (ja) 通信装置および障害監視方法
WO2011124178A2 (zh) 故障检测方法、路由节点及系统
Paolucci et al. Interoperable multi-domain delay-aware provisioning using segment routing monitoring and BGP-LS advertisement
WO2021234900A1 (ja) 測定装置、測定システム、測定方法、および、測定プログラム
WO2010001795A1 (ja) 品質劣化箇所推定装置、方法、及び通信ネットワークシステム
JP2011114743A (ja) ネットワーク監視方法及びネットワーク監視装置
JP2008172655A (ja) ネットワークシステム、通信品質劣化区間の推定方法およびプログラム
US8848518B2 (en) System and method for providing notification of a change in path condition
US20090158098A1 (en) Method and apparatus for providing a reliable fault management for a network
JP2006311406A (ja) ネットワーク品質計測方法
JP5201021B2 (ja) ネットワーク輻輳監視システム及びネットワーク輻輳監視方法
Papneja et al. Methodology for Benchmarking MPLS Traffic Engineered (MPLS-TE) Fast Reroute Protection
US12003397B2 (en) Delay measurement device, delay measurement method, and delay measurement program
US20230318978A1 (en) Tunnel Management Method, Apparatus, and System
JP6760895B2 (ja) ネットワーク計測システム、および、ネットワーク計測方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20936111

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022524796

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20936111

Country of ref document: EP

Kind code of ref document: A1