JP2011244164A - Server abnormality determination program, server abnormality determination device and server abnormality determination method - Google Patents

Server abnormality determination program, server abnormality determination device and server abnormality determination method Download PDF

Info

Publication number
JP2011244164A
JP2011244164A JP2010113847A JP2010113847A JP2011244164A JP 2011244164 A JP2011244164 A JP 2011244164A JP 2010113847 A JP2010113847 A JP 2010113847A JP 2010113847 A JP2010113847 A JP 2010113847A JP 2011244164 A JP2011244164 A JP 2011244164A
Authority
JP
Japan
Prior art keywords
server
route
response
message data
average
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010113847A
Other languages
Japanese (ja)
Inventor
Yuji Hotta
勇次 堀田
Motoyuki Kawaba
基行 河場
Hidekazu Takahashi
秀和 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010113847A priority Critical patent/JP2011244164A/en
Publication of JP2011244164A publication Critical patent/JP2011244164A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PROBLEM TO BE SOLVED: To identify a server that is the cause of a fault.SOLUTION: A server abnormality determination device stores information identifying a server, routing information showing a route including the server regarding message data of a transaction, and information associated with a server response average that is an average of response values, each of which represents a time from sending of a request message for the transaction to reception of an answer message in the server. When the server response average is greater than a threshold, the server abnormality determination device determines that an abnormality has occurred in the route, and records the information identifying the server and the routing information.

Description

本発明は、異常のあるサーバを特定するサーバ異常判定プログラム、サーバ異常判定装置、およびサーバ異常判定方法に関する。   The present invention relates to a server abnormality determination program, a server abnormality determination device, and a server abnormality determination method for identifying a server having an abnormality.

インターネット上でピア・ツー・ピアで通信を行うサービスでは、音声や映像、テキスト等のメディア情報をインターネットプロトコル(IP)パケットを使ってリアルタイムに伝送するための技術が必要である。これに加えて、インターネット上でピア・ツー・ピアのセッション(呼)の確立・変更・切断(終了)を制御するためのシグナリング技術が重要である。ピア・ツー・ピア通信のサービスとしては、IP電話やテレビ電話、インスタントメッセンジャー等がある。   Services that perform peer-to-peer communication on the Internet require technology for transmitting media information such as voice, video, and text in real time using Internet Protocol (IP) packets. In addition to this, a signaling technique for controlling establishment, change, and disconnection (termination) of a peer-to-peer session (call) on the Internet is important. Peer-to-peer communication services include IP phones, videophones, and instant messengers.

特に、近年普及の著しいIP電話は、音声信号をIPパケットでリアルタイム伝送するためのVoice Over IP(VoIP)技術と、シグナリング技術とを組み合わせて実現されている。
IP電話で利用可能なシグナリングプロトコルには、国際電気通信連合電気通信標準化セクタ:International Telecommunication Union-Telecommunication sector(ITU-T)が1997年に勧告したH.323方式が実現されている。また、Internet Engineering Task Force(IETF)にて標準化され2002年に発行されたRequest for Comments (RFC)3261でスタンダードトラックとして規定された、Session Initiation Protocol(SIP)が実現されている。特に、SIPは、メッセージがテキストで記述される。また、SIPは、WebのためのHyper Text Transfer Protocol(HTTP)や電子メールのためのSimple Message Transfer Protocol(SMTP)を模範に設計された。このため、SIPは、シンプルで拡張性が高くインターネットと親和性が高く、IP電話で用いられるシグナリングプロトコルの標準となりつつある。
In particular, IP telephones that have been remarkably popular in recent years have been realized by combining Voice Over IP (VoIP) technology for transmitting voice signals in IP packets in real time and signaling technology.
The H.323 system recommended by the International Telecommunication Union-Telecommunication sector (ITU-T) in 1997 is realized as a signaling protocol that can be used for IP telephones. Further, Session Initiation Protocol (SIP), which is standardized by the Internet Engineering Task Force (IETF) and specified as a standard track in Request for Comments (RFC) 3261 issued in 2002, is realized. In particular, in SIP, messages are written in text. SIP was designed around the Hyper Text Transfer Protocol (HTTP) for the Web and the Simple Message Transfer Protocol (SMTP) for email. For this reason, SIP is simple, scalable, and highly compatible with the Internet, and is becoming the standard for signaling protocols used in IP phones.

SIPは、アプリケーション層で、端末間において、セッション(呼)の確立・変更・切断(終了)を制御するためのシグナリングプロトコルである。
インターネット上に配置されるSIPサーバと呼ばれる中継用のサーバを介して端末間で、メソッド(SIPリクエストメッセージ)とレスポンス(SIPレスポンスメッセージ)が所定の手順に従って交換される。これにより、セッションの確立・変更・切断(終了)が制御される。
SIP is a signaling protocol for controlling the establishment / change / disconnection (termination) of a session (call) between terminals in an application layer.
A method (SIP request message) and a response (SIP response message) are exchanged between terminals via a relay server called a SIP server arranged on the Internet according to a predetermined procedure. Thereby, establishment / change / disconnection (termination) of the session is controlled.

電話サービス全般において、ネットワーク障害発生時の対応とすばやいサービスの回復は、顧客満足度及びサービスへの信頼性を確保するための要である。障害発生時においては、想定される顧客問合せへの適切な対応のため、また、影響の拡大抑止とサービス復旧のために、迅速にネットワーク品質と影響範囲(影響ユーザ)を把握することが求められている。   In general telephone service, response to network failures and quick service recovery are key to ensuring customer satisfaction and service reliability. In the event of a failure, it is necessary to quickly grasp the network quality and the scope of impact (affected users) in order to appropriately respond to possible customer inquiries, to prevent the expansion of the impact, and to restore the service. ing.

複数のサーバを経由してデータを交換するシステムでは、データ伝達の遅延やエラーといった障害が発生した場合にその原因がどの中間サーバまたは周辺機器にあるかを調査するのに多大な時間と労力を要する。特にSIPサーバのメッセージ交換のように、データが経由するサーバの組み合わせが無数に存在する場合は、障害箇所の特定が容易ではない。   In a system that exchanges data via multiple servers, it takes a lot of time and effort to investigate which intermediate server or peripheral device is the cause of a failure such as a data transmission delay or error. Cost. In particular, when there are an infinite number of server combinations through which data passes, as in the case of SIP server message exchange, it is not easy to identify the fault location.

従来は、データの伝達に要するレスポンス時間などの統計値を、各サーバ毎に計算して保持する。複数のサーバを経由してデータが到達する場合に、ある端点のサーバへの到達に遅延が生じている場合、その原因となるサーバまたは機器を特定する必要がある。この時、サーバ毎の平均レスポンス時間の集計値で異常を発見する方法が一般的である   Conventionally, statistical values such as response time required for data transmission are calculated and held for each server. When data arrives via a plurality of servers, if there is a delay in reaching the server at a certain end point, it is necessary to identify the server or device that causes the delay. At this time, it is common to find anomalies using the aggregate value of the average response time for each server.

特開2009−238069号公報JP 2009-238069 A

しかしながら、経路固有の問題がある場合、例えばサーバSを経由するある特定の経路R1ではデータの伝達時間が長く、サーバSを経由する他の全ての経路R2〜Rnを通るデータの伝達時間は正常で短い場合がある。この場合は、サーバSでデータの伝達時間を集計し、平均を算出すると、経路R2〜Rnの短い処理時間によって経路R1の長い処理時間が埋もれてしまい、サーバS(の経路R1)で発生している障害が発見できないという問題があった。   However, when there is a problem specific to the route, for example, the data transmission time is long in a specific route R1 passing through the server S, and the data transmission time passing through all other routes R2 to Rn passing through the server S is normal. It may be short. In this case, if the transmission time of data is totaled by the server S and the average is calculated, the long processing time of the route R1 is buried by the short processing time of the routes R2 to Rn, which occurs in the server S (the route R1). There was a problem that it was not possible to find the fault.

同様に、エラー発生率といった観点で集計した場合も、他の経路の低発生率のエラーにより、ある経路の高発生率のエラーが発見できないという問題があった。
このような状況において、異常個所を見つけるには、メッセージが伝播してきたサーバを一つ一つ追いかけてメッセージのサーバ経路を見つけ出し、遅延の有無を見つけるという効率の悪い作業を行わなければならないという問題があった。これまでもメッセージから経路情報を取り出す方法は使われてきたが、サーバ経路の組合せは膨大な数になるため、経路ごとに統計情報を残すことは実質的に不可能であった。
Similarly, when the tabulation is performed from the viewpoint of the error occurrence rate, there is a problem that a high occurrence rate error of a certain route cannot be found due to a low occurrence rate error of another route.
In such a situation, in order to find the abnormal part, it is necessary to perform the inefficient work of finding the server path of the message by following the server that the message has propagated one by one and finding the presence or absence of the delay. was there. In the past, methods for extracting route information from messages have been used, but since there are a large number of combinations of server routes, it is virtually impossible to leave statistical information for each route.

本発明の課題は、障害の原因となっているサーバを容易に特定することが可能な装置を提供することである。   An object of the present invention is to provide an apparatus that can easily identify a server causing a failure.

実施の形態のサーバ異常判定装置は、記憶部と、異常判定部と、を備える。
記憶部は、サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報を記憶する。
The server abnormality determination device according to the embodiment includes a storage unit and an abnormality determination unit.
The storage unit is information for specifying a server, route information indicating a route including the server for transaction message data, and a time from when the server sends a request message for the transaction to when a response message is received. Information associated with a server response average that is an average of response values is stored.

異常判定部は、前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する。   The abnormality determination unit determines that an abnormality has occurred in the route when the server response average exceeds a threshold, and records information for specifying the server and the route information.

実施の形態の装置によれば、障害の原因となっているサーバを容易に特定することが可能となる。   According to the apparatus of the embodiment, it is possible to easily identify the server that is causing the failure.

実施の形態に係るネットワーク構成図である。It is a network block diagram concerning embodiment. 実施の形態係る異常診断装置の構成図である。It is a block diagram of the abnormality diagnosis apparatus which concerns on embodiment. 実施の形態に係るサーバテーブルの例である。It is an example of the server table which concerns on embodiment. 実施の形態に係る部分経路IDテーブルの例である。It is an example of the partial path | route ID table which concerns on embodiment. 実施の形態に係る経路IDテーブルの例である。It is an example of the path | route ID table which concerns on embodiment. 実施の形態に係る学習値テーブルの例である。It is an example of the learning value table which concerns on embodiment. 実施の形態に係る保存経路テーブルの例である。It is an example of the preservation | save path | route table which concerns on embodiment. メッセージデータの流れを示す図である。It is a figure which shows the flow of message data. 実施の形態の経路情報集計処理のフローチャートである。It is a flowchart of the route information totaling process of an embodiment. メッセージデータの例である。It is an example of message data. メッセージデータの例である。It is an example of message data. メッセージデータの例である。It is an example of message data. メッセージデータの例である。It is an example of message data. ステップS308の詳細なフローチャートである。It is a detailed flowchart of step S308. 部分経路の短縮処理のフローチャートである。It is a flowchart of the shortening process of a partial path | route. 部分経路の短縮処理の具体例におけるネットワーク構成図である。It is a network block diagram in the specific example of the shortening process of a partial path | route. 部分経路の伸長処理のフローチャートである。It is a flowchart of the expansion process of a partial path | route. 部分経路の伸長処理の具体例におけるネットワーク構成図である。It is a network block diagram in the specific example of the expansion | extension process of a partial path | route. 部分経路の有効化処理のフローチャートである。It is a flowchart of the validation process of a partial path | route. サーバ異常判定処理のフローチャートである。It is a flowchart of a server abnormality determination process.

以下、図面を参照しながら本発明の実施の形態を説明する。
図1は、本実施の形態に係るネットワーク構成図である。
ネットワークは、異常診断装置101、サーバ102−m(m=1〜11)、およびキャプチャ装置103−mを備える。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a network configuration diagram according to the present embodiment.
The network includes an abnormality diagnosis apparatus 101, a server 102-m (m = 1 to 11), and a capture apparatus 103-m.

サーバ102−1は、端末104−1、サーバ102−3、102−4、キャプチャ装置103−1に接続している。
サーバ102−2は、端末104−2、サーバ102−3、102−4、キャプチャ装置103−2に接続している。
The server 102-1 is connected to the terminal 104-1, servers 102-3 and 102-4, and the capture device 103-1.
The server 102-2 is connected to the terminal 104-2, the servers 102-3 and 102-4, and the capture device 103-2.

サーバ102−3は、サーバ102−1、102−2、102−5、102−6、キャプチャ装置103−3に接続している。
サーバ102−4は、サーバ102−1、102−2、102−5、102−6、キャプチャ装置103−4に接続している。
The server 102-3 is connected to the servers 102-1, 102-2, 102-5, 102-6, and the capture device 103-3.
The server 102-4 is connected to the servers 102-1, 102-2, 102-5, 102-6, and the capture device 103-4.

サーバ102−5は、サーバ102−3、102−4、102−7、102−8、キャプチャ装置103−5に接続している。
サーバ102−6は、サーバ102−3、102−4、102−8、102−9、キャプチャ装置103−6に接続している。
The server 102-5 is connected to the servers 102-3, 102-4, 102-7, 102-8, and the capture device 103-5.
The server 102-6 is connected to the servers 102-3, 102-4, 102-8, 102-9, and the capture device 103-6.

サーバ102−7は、サーバ102−5、102−10、キャプチャ装置103−7に接続している。
サーバ102−8は、サーバ102−5、102−6、102−10、102−11、キャプチャ装置103−8に接続している。
The server 102-7 is connected to the servers 102-5 and 102-10 and the capture device 103-7.
The server 102-8 is connected to the servers 102-5, 102-6, 102-10, 102-11, and the capture device 103-8.

サーバ102−9は、サーバ102−6、102−11、キャプチャ装置103−9に接続している。
サーバ102−10は、端末104−3、104−4、サーバ102−3、102−4、キャプチャ装置103−10に接続している。
The server 102-9 is connected to the servers 102-6 and 102-11 and the capture device 103-9.
The server 102-10 is connected to the terminals 104-3 and 104-4, the servers 102-3 and 102-4, and the capture device 103-10.

サーバ102−11は、端末104−5、サーバ102−8、102−9、キャプチャ装置103−11に接続している。
サーバ102は、メッセージデータを隣接するサーバ102または端末104に転送する。
また、サーバ102−1〜102−11は、それぞれサーバS1〜S11と表すこともある。
The server 102-11 is connected to the terminal 104-5, the servers 102-8 and 102-9, and the capture device 103-11.
The server 102 transfers the message data to the adjacent server 102 or terminal 104.
The servers 102-1 to 102-11 may be represented as servers S1 to S11, respectively.

キャプチャ装置103−mは、サーバ102−mに接続しており、サーバ102−mが送信するメッセージデータをキャプチャする。また、キャプチャ装置103−mは、異常診断装置101に接続しており、キャプチャしたメッセージデータを異常診断装置101に送信する。   The capture device 103-m is connected to the server 102-m, and captures message data transmitted by the server 102-m. The capture device 103-m is connected to the abnormality diagnosis device 101 and transmits the captured message data to the abnormality diagnosis device 101.

異常診断装置101は、メッセージデータを収集し、メッセージデータに対して紐付け処理を行う。そして、紐付け結果からメッセージデータの経路を生成し、サーバ毎の経路情報の統計情報を生成し、経路毎のサーバ異常を発見する。
端末104は、例えばIP電話である。
The abnormality diagnosis apparatus 101 collects message data and performs a linking process on the message data. Then, a route of message data is generated from the association result, statistical information of route information for each server is generated, and a server abnormality for each route is discovered.
The terminal 104 is an IP phone, for example.

図2は、実施の形態に係る異常診断装置の構成図である。
異常診断装置101は、処理部110、メモリ117、および記憶部118を備える。
処理部110は、経路の生成やサーバの異常診断を行う。
FIG. 2 is a configuration diagram of the abnormality diagnosis apparatus according to the embodiment.
The abnormality diagnosis apparatus 101 includes a processing unit 110, a memory 117, and a storage unit 118.
The processing unit 110 performs path generation and server abnormality diagnosis.

メモリ117は、処理部110での処理で用いられるデータが格納される。
処理部110は、メッセージデータ収集部111、紐付け部112、経路情報生成部113、保存経路選択部114、統計情報管理部115、および異常診断部116を備える。
The memory 117 stores data used for processing in the processing unit 110.
The processing unit 110 includes a message data collection unit 111, a linking unit 112, a route information generation unit 113, a storage route selection unit 114, a statistical information management unit 115, and an abnormality diagnosis unit 116.

メッセージデータ収集部111は、キャプチャ装置103から送信された複数のメッセージデータを受信し、紐付け部112に送信する。
紐付け部112は、複数のメッセージデータを共通する属性(例えば、Call-ID)に基づいて紐付けする。尚、紐付けされたメッセージデータの集合は、トランザクションと呼ぶ。一連の通信における複数のメッセージデータは共通する属性を有するため、これらメッセージデータは紐付けされる。
The message data collection unit 111 receives a plurality of message data transmitted from the capture device 103 and transmits it to the association unit 112.
The associating unit 112 associates a plurality of message data based on a common attribute (for example, Call-ID). A set of linked message data is called a transaction. Since a plurality of message data in a series of communications have common attributes, these message data are linked.

経路情報生成部113は、メッセージデータから経路を生成する。
保存経路選択部114は、生成された経路を保存するか判定する。
統計情報管理部115は、保存対象経路やサーバの各種情報を記憶部118に保存する。
The route information generation unit 113 generates a route from the message data.
The save route selection unit 114 determines whether to save the generated route.
The statistical information management unit 115 stores various information on the storage target route and the server in the storage unit 118.

異常診断部116は、サーバ及び経路に異常があるか判定する。
記憶部118は、サーバテーブル201、部分経路IDテーブル202、経路IDテーブル203、学習値テーブル204、および保存経路テーブル205を有する。
The abnormality diagnosis unit 116 determines whether there is an abnormality in the server and the route.
The storage unit 118 includes a server table 201, a partial route ID table 202, a route ID table 203, a learned value table 204, and a storage route table 205.

図3は、実施の形態に係るサーバテーブルの例である。
サーバテーブル201は、項目として、サーバIDおよびIPアドレスを有する。
サーバIDはサーバに割り当てられたIDであり、IPアドレスはサーバのIPアドレスである。サーバテーブルには、サーバIDおよびIPアドレスが対応付けられて記述されている。
FIG. 3 is an example of a server table according to the embodiment.
The server table 201 has a server ID and an IP address as items.
The server ID is an ID assigned to the server, and the IP address is the IP address of the server. In the server table, a server ID and an IP address are described in association with each other.

例えば、サーバ102−5のサーバIDはS5であり、IPアドレスは192.168.1.2である。
尚、本実施の形態では、サーバ102−1〜102−11に対して、それぞれサーバIDとしてS1〜S11が割り当てられている。
For example, the server ID of the server 102-5 is S5, and the IP address is 192.168.1.2.
In the present embodiment, S1 to S11 are assigned as server IDs to the servers 102-1 to 102-11, respectively.

また、図3では、サーバテーブルの一部(3つのサーバIDとIPアドレスの組)のみを表示している。
図4は、実施の形態に係る部分経路IDテーブルの例である。
In FIG. 3, only a part of the server table (a set of three server IDs and IP addresses) is displayed.
FIG. 4 is an example of a partial path ID table according to the embodiment.

部分経路IDテーブル202は、項目として、部分経路IDおよび部分経路を有する。
部分経路IDは、部分経路ごとに割り当てられたIDである。
部分経路は、経路の一部を示す。部分経路には、所定数のサーバIDが並べて記述される。実施の形態において、部分経路の長さ(部分経路長)は、3としている。すなわち、各部分経路に記述されるサーバIDの数は、3となる。例えば、S3-S5-S7は、サーバS3からサーバS5を経由してサーバS7への経路を示す。
The partial route ID table 202 includes a partial route ID and a partial route as items.
The partial route ID is an ID assigned to each partial route.
The partial path indicates a part of the path. In the partial path, a predetermined number of server IDs are described side by side. In the embodiment, the length of the partial path (partial path length) is 3. That is, the number of server IDs described in each partial path is 3. For example, S3-S5-S7 indicates a route from the server S3 to the server S7 via the server S5.

図5は、実施の形態に係る経路IDテーブルの例である。
経路IDテーブル203は、項目として、経路IDおよび経路を有する。
経路IDは、経路ごとに割り当てられたIDである。
FIG. 5 is an example of a route ID table according to the embodiment.
The route ID table 203 includes a route ID and a route as items.
The route ID is an ID assigned to each route.

経路は、ネットワーク上の経路を示す。経路には、所定数のサーバIDが並べて記述される。実施の形態において、部分経路長が3の部分経路の前後にそれぞれ1個のサーバを足したものを経路としている。すなわち、各経路に記述されるサーバIDの数は、5となる。例えば、S2-S4-S5-S8-S10は、サーバS2からサーバS4、S5、S8を経由してサーバS10への経路を示す。   The route indicates a route on the network. A predetermined number of server IDs are described side by side in the route. In the embodiment, a route is obtained by adding one server before and after a partial route having a partial route length of 3. That is, the number of server IDs described in each route is 5. For example, S2-S4-S5-S8-S10 indicates a route from the server S2 to the server S10 via the servers S4, S5, and S8.

図6は、実施の形態に係る学習値テーブルの例である。
学習値テーブル204は、項目として、サーバID、部分経路ID、サーバレスポンス平均、全体レスポンス平均、頻度、TimeWin、および有効フラグを有する。
FIG. 6 is an example of a learning value table according to the embodiment.
The learning value table 204 includes, as items, a server ID, a partial path ID, a server response average, an overall response average, a frequency, TimeWin, and a valid flag.

サーバIDには、対象のサーバIDが記述される。
部分経路IDには、対象の部分経路IDが記載される。
サーバレスポンス平均には、対象のサーバの部分経路におけるTimeWin前から現在までの平均レスポンス値が記述される。尚、レスポンス値とは、サーバがリクエストメッセージを送信してから応答メッセージを受信するまでの時間であり、平均レスポンス値はレスポンス値の平均である。後述のように図6において、TimeWinはTwin3(3分)であるので、サーバレスポンス平均には、3分前から現在までのレスポンス値の平均が記述される。
The server ID describes the target server ID.
The partial path ID describes the target partial path ID.
In the server response average, an average response value from before TimeWin to the present in the partial path of the target server is described. The response value is the time from when the server sends a request message until it receives the response message, and the average response value is the average of the response values. As will be described later, since TimeWin is Twin3 (3 minutes) in FIG. 6, the average of response values from 3 minutes before to the present is described in the server response average.

全体レスポンス平均には、対象のサーバの部分経路における全体レスポンス平均が記述される。
尚、サーバレスポンス平均および全体レスポンス平均の詳細については後述する。
The overall response average describes the overall response average in the partial path of the target server.
Details of the server response average and the overall response average will be described later.

頻度には、TimeWinの時間幅の中に現れたデータの回数が記述される。
TimeWinは、タイムウィンドウを示し、TimeWinには例えば3分、30秒など所定の時間が記述される。尚、図6のTwin3は、3分であることを示す。有効フラグは、学習値テーブルの値を用いるか否かを示すフラグであり、1または0が記述される。1は有効(真)を示し、0は無効(偽)を示す。
The frequency describes the number of times the data appears within the time width of TimeWin.
TimeWin indicates a time window, and a predetermined time such as 3 minutes or 30 seconds is described in TimeWin. In addition, Twin3 of FIG. 6 shows that it is 3 minutes. The valid flag is a flag indicating whether or not the value of the learning value table is used, and 1 or 0 is described. 1 indicates valid (true) and 0 indicates invalid (false).

図7は、実施の形態に係る保存経路テーブルの例である。
保存経路テーブル205は、項目として、サーバID、経路ID、サーバレスポンス平均(現在)、サーバレスポンス平均(過去1)、およびサーバレスポンス平均(過去2)、全体レスポンス平均、頻度、およびTimeWinを有する。
FIG. 7 is an example of a storage path table according to the embodiment.
The storage route table 205 includes, as items, server ID, route ID, server response average (current), server response average (past 1), server response average (past 2), overall response average, frequency, and TimeWin.

経路IDには、対象の経路IDが記述される。
サーバレスポンス平均(現在)は、図6のサーバレスポンス平均に対応する。
サーバレスポンス平均(過去1)は、対象のサーバの部分経路における2*TimeWin前からTimeWin前までの平均レスポンス値が記述される。例えば、図7においては、6分前から3分前までの平均レスポンス値が記述される。
In the route ID, the target route ID is described.
The server response average (current) corresponds to the server response average of FIG.
The server response average (past 1) describes an average response value from 2 * TimeWin before TimeWin in the partial path of the target server. For example, in FIG. 7, an average response value from 6 minutes before to 3 minutes before is described.

サーバレスポンス平均(過去2)は、対象のサーバの部分経路における3*TimeWin前から2*TimeWin前までの平均レスポンス値が記述される。例えば、図7においては、9分前から6分前までの平均レスポンス値が記述される。   The server response average (past 2) describes the average response value from 3 * TimeWin before 2 * TimeWin in the partial path of the target server. For example, in FIG. 7, the average response value from 9 minutes before to 6 minutes before is described.

サーバID、サーバレスポンス平均、全体レスポンス平均、頻度、およびTimeWinは、上述の説明と同様であるので説明は省略する。
ここで、実施の形態で用いられるサーバレスポンス平均および全体レスポンス平均について説明する。
Since the server ID, server response average, overall response average, frequency, and TimeWin are the same as described above, the description thereof is omitted.
Here, the server response average and the overall response average used in the embodiment will be described.

図8は、メッセージデータの流れを示す図である。
図8において、INVITEメッセージがサーバS1からサーバS3、S5、S7を経由してサーバS10に転送されている。また、RINGINGメッセージがサーバS10からサーバS7、S5、S3を経由してサーバS1に転送されている。
・サーバレスポンス平均
サーバXの部分経路Yにおけるサーバレスポンス平均は、部分経路Yを含む全経路において、サーバXのレスポンス値を平均したものとなる。
FIG. 8 is a diagram showing the flow of message data.
In FIG. 8, the INVITE message is transferred from the server S1 to the server S10 via the servers S3, S5, and S7. Further, the RINGING message is transferred from the server S10 to the server S1 via the servers S7, S5, and S3.
Server response average The server response average in the partial path Y of the server X is an average of the response values of the server X in all paths including the partial path Y.

尚、レスポンス値とは、INVITEメッセージを送信してからRingingメッセージを受信するまでの時間である。例えば、図8に示す経路におけるサーバS5のレスポンス値は、INVITEメッセージをサーバS7に送信してから、サーバS7からRINGINGメッセージを受信するまでの時間である。   The response value is the time from when the INVITE message is transmitted until the Ringing message is received. For example, the response value of the server S5 on the route shown in FIG. 8 is the time from when the INVITE message is transmitted to the server S7 until the RINGING message is received from the server S7.

サーバS5を通る経路は、図8に示した経路S1-S3-S5-S7-S10だけでなく、図1に示すようにS2-S3-S5-S8-S10やS1-S4-S5-S7-S10など複数存在する。
例えば、サーバS5の部分経路S3-S5-S7におけるサーバレスポンス平均を求める。図1において、部分経路S3-S5-S7を含む経路は、S1-S3-S5-S7-S10とS2-S3-S5-S7-S10である。従って、サーバS5の部分経路S3-S5-S7におけるサーバレスポンス平均は、経路S1-S3-S5-S7-S10とS2-S3-S5-S7-S10のトランザクションにおいて、サーバS5のレスポンス値の平均となる。
・全体レスポンス平均
サーバXの部分経路Yにおける全体レスポンス平均は、部分経路Yを含む全経路において、始端Zでのレスポンス値の平均となる。始端は、INVITEメッセージを送信する始点のサーバである。例えば、図8において、始端ZはサーバS1である。
The route passing through the server S5 is not only the route S1-S3-S5-S7-S10 shown in FIG. 8, but also S2-S3-S5-S8-S10 and S1-S4-S5-S7- as shown in FIG. There are several such as S10.
For example, the server response average in the partial path S3-S5-S7 of the server S5 is obtained. In FIG. 1, the paths including the partial paths S3-S5-S7 are S1-S3-S5-S7-S10 and S2-S3-S5-S7-S10. Therefore, the server response average in the partial path S3-S5-S7 of the server S5 is the average of the response values of the server S5 in the transactions of the paths S1-S3-S5-S7-S10 and S2-S3-S5-S7-S10. Become.
Overall Response Average The overall response average of the partial path Y of the server X is the average of the response values at the starting end Z in all paths including the partial path Y. The starting point is the starting server that transmits the INVITE message. For example, in FIG. 8, the starting end Z is the server S1.

例えば、サーバS5の部分経路S3-S5-S7における全体レスポンス平均を求める。図1において、部分経路S3-S5-S7を含む経路は、S1-S3-S5-S7-S10とS2-S3-S5-S7-S10である。始端Zは、サーバS1およびS2となる。従って、サーバS5の部分経路S3-S5-S7における全体レスポンス平均は、経路S1-S3-S5-S7-S10とS2-S3-S5-S7-S10のトランザクションにおいて、サーバS1およびS2のレスポンス値の平均となる。   For example, the overall response average in the partial path S3-S5-S7 of the server S5 is obtained. In FIG. 1, the paths including the partial paths S3-S5-S7 are S1-S3-S5-S7-S10 and S2-S3-S5-S7-S10. The starting end Z is the servers S1 and S2. Therefore, the total response average in the partial path S3-S5-S7 of the server S5 is the response value of the servers S1 and S2 in the transactions of the paths S1-S3-S5-S7-S10 and S2-S3-S5-S7-S10. Average.

図9は、実施の形態の経路情報集計処理のフローチャートである。
ステップS301において、メッセージデータ収集部は、メッセージデータを収集する。
FIG. 9 is a flowchart of route information aggregation processing according to the embodiment.
In step S301, the message data collection unit collects message data.

図10A〜10Dは、メッセージデータの例である。
メッセージデータは、例えば、SIPで用いられるリクエストメッセージや応答メッセージである。
10A to 10D are examples of message data.
The message data is, for example, a request message or a response message used in SIP.

Request-Lineには、リクエストの種類や宛先、SIPのバージョンが記述される。
Status-Lineには、SIPのバージョンやStatus-Code、Reason-Phraseが記述される
Fromには送信元、Toには宛先が記述される。
Request-Line describes the request type, destination, and SIP version.
Status-Line describes the SIP version, Status-Code, and Reason-Phrase
From is the source and To is the destination.

Call-IDには、一連の通信(呼)で発生するリクエストおよびレスポンスを他の呼のリクエストおよびレスポンスと識別するためのIDが記述される。
Dateには、メッセージデータの送信日時が記述される。
X-MMMには、特定のキャリアで用いられる属性を表すIDである。
In Call-ID, an ID for identifying a request and a response generated in a series of communications (calls) from a request and a response of another call is described.
In Date, the transmission date and time of the message data is described.
X-MMM is an ID representing an attribute used in a specific carrier.

図9に戻り、ステップS302において、紐付け部は、収集したメッセージデータを紐付け処理する。すなわち、メッセージデータを属性値に基づいて関連付ける。
ここで、紐付け処理の例として図10A〜10Dのメッセージデータ401〜404に対する紐付け処理について説明する。
Returning to FIG. 9, in step S302, the linking unit performs linking processing on the collected message data. That is, the message data is associated based on the attribute value.
Here, as an example of the linking process, the linking process for the message data 401 to 404 in FIGS. 10A to 10D will be described.

紐付け処理部112は、メッセージデータのCall-IDに基づいてメッセージデータを分類する。
メッセージデータ401とメッセージデータ404のCall-IDは、同じである。従って、メッセージデータ401とメッセージデータ404は、紐付けされる。ここで、紐付けされたメッセージデータ401とメッセージデータ404は、グループ1とする。
The association processing unit 112 classifies the message data based on the Call-ID of the message data.
The Call-ID of the message data 401 and the message data 404 is the same. Therefore, the message data 401 and the message data 404 are linked. Here, the associated message data 401 and message data 404 are group 1.

また、メッセージデータ402とメッセージデータ403のCall-IDは、同じである。従って、メッセージデータ402とメッセージデータ403は、紐付けされる。ここで、紐付けされたメッセージデータ402とメッセージデータ403は、グループ2とする
紐付け処理部112は、メッセージデータのX-MMMに基づいてグループを分類する。
Further, the Call-ID of the message data 402 and the message data 403 is the same. Therefore, the message data 402 and the message data 403 are linked. Here, the associated message data 402 and message data 403 are group 2. The association processing unit 112 classifies groups based on the X-MMM of the message data.

グループ1に属するメッセージデータ401のX-MMMとグループ2に属するメッセージデータ402のX-MMMは、同じである。従って、グループ1とグループ2が紐付けされる。   The X-MMM of message data 401 belonging to group 1 and the X-MMM of message data 402 belonging to group 2 are the same. Therefore, group 1 and group 2 are linked.

以上の処理により、メッセージデータ401、メッセージデータ402、メッセージデータ403、およびメッセージデータ404が紐付けされる。
上述の例では、Call-IDおよびX-MMMに基づいて、紐付けを行っているが、これに限るものではなく、他の属性に基づいて紐付けを行っても良い。
Through the above processing, the message data 401, message data 402, message data 403, and message data 404 are linked.
In the above example, the association is performed based on the Call-ID and the X-MMM. However, the association is not limited to this, and the association may be performed based on other attributes.

図9に戻り、ステップS303において、経路情報生成部113は、トランザクションからメッセージデータの経路(経由したサーバの順序)を算出する。
メッセージデータの経路は、メッセージデータの内、特定のリクエストメッセージ(例えばINVITEメッセージ)を抜き出し、抜き出したメッセージ間を送信元アドレスと宛先アドレスで結びつけることにより経路を生成する。例えば、第1のメッセージデータの宛先アドレスと第2のメッセージデータの送信元アドレスが同じであれば、第1および第2のメッセージは結び付けられ、第1のメッセージデータの宛先アドレスから第2のメッセージデータの宛先アドレスへの経路が生成される。また、経路情報生成部113は、生成した経路におけるサーバのレスポンスおよび全体レスポンスを算出する。
Returning to FIG. 9, in step S <b> 303, the path information generation unit 113 calculates the path of message data (the order of servers that have passed through) from the transaction.
The message data path is generated by extracting a specific request message (for example, an INVITE message) from the message data and connecting the extracted messages with a source address and a destination address. For example, if the destination address of the first message data is the same as the transmission source address of the second message data, the first and second messages are linked and the second message is sent from the destination address of the first message data. A route to the destination address of the data is generated. Further, the route information generation unit 113 calculates a server response and an overall response in the generated route.

ステップS304において、保存経路選択部114は、生成した経路が保存対象経路であるか判定し、保存対象経路である場合ステップS305に制御は進み、保存対象経路で無い場合ステップS308に制御は進む。   In step S304, the saving route selection unit 114 determines whether the generated route is a saving target route. If the saving route is a saving target route, the control proceeds to step S305, and if not, the control proceeds to step S308.

保存対象経路であるかの判定は、以下のように行う。
(1)生成した経路の経由するサーバを順に一つ選択する。例えば、生成した経路がS2-S4-S5-S7-S10である場合、サーバS2、S4、S5、S7、S10の順に処理対象として選択する。
(2)対象サーバのサーバIDと生成した経路の経路IDの組が保存経路テーブルに格納されているかチェックし、格納されている場合は、保存対象と判定する。尚、保存対象と判定された経路は保存対象経路と呼ぶ。
(3)未選択のサーバがあるかチェックし、未選択のサーバがある場合は(1)に戻る。
The determination as to whether the route is a storage target route is performed as follows.
(1) Select one server through the generated route in order. For example, when the generated route is S2-S4-S5-S7-S10, the servers S2, S4, S5, S7, and S10 are selected as processing targets in order.
(2) It is checked whether the combination of the server ID of the target server and the route ID of the generated route is stored in the storage route table, and if it is stored, it is determined as the storage target. Note that a path determined to be a storage target is called a storage target path.
(3) Check whether there is an unselected server. If there is an unselected server, return to (1).

ステップS305において、保存経路選択部114は、保存対象経路が保存対象から外れるかチェックする。
例えば、保存経路選択部114は、対象の経路が保存対象となってから所定の時間が経過した場合や、異常な値をとらなくなってからの経過時間により、保存対象から外れると判定する。
In step S305, the storage route selection unit 114 checks whether the storage target route is excluded from the storage target.
For example, the storage route selection unit 114 determines that the target route is excluded from the storage target when a predetermined time has elapsed since the target route became the storage target, or when the predetermined time has passed since the abnormal value is not taken.

また、例えば、保存経路選択部114は、直近の所定回(例えば、3回)のタイムウィンドウ分の全てのサーバレスポンス平均(図7におけるサーバレスポンス平均(現在)、サーバレスポンス平均(過去1)、およびサーバレスポンス平均(過去2))が閾値よりも小さい場合は、経路情報の保存対象から外れると判定する。   In addition, for example, the storage path selection unit 114 performs an average of all server responses for the most recent predetermined time (for example, three times) time window (server response average (current), server response average (past 1) in FIG. 7), When the server response average (past 2) is smaller than the threshold value, it is determined that the route information is not stored.

保存対象経路が保存対象から外れる場合、制御はステップS306に進み、保存対象経路が保存対象から外れない場合、制御はステップS307に進む。
ステップS306において、統計情報管理部115は、対象の経路を保存経路テーブルから削除する。
If the save target route is not the save target, the control proceeds to step S306. If the save target route is not the save target, the control proceeds to step S307.
In step S306, the statistical information management unit 115 deletes the target route from the saved route table.

ステップS307において、統計情報管理部115は、経路ごとの統計値としてトランザクションの各種データ、サーバレスポンス平均、全体レスポンス平均などの情報を学習値テーブル204および保存経路テーブル205に格納する。尚、統計情報管理部115は、生成した経路におけるサーバレスポンスおよび全体レスポンスを新たに追加したときのサーバレスポンス平均および全体レスポンス平均を算出する。   In step S <b> 307, the statistical information management unit 115 stores information such as various transaction data, server response average, and overall response average as statistical values for each path in the learned value table 204 and the storage path table 205. The statistical information management unit 115 calculates the server response average and the overall response average when the server response and the overall response in the generated route are newly added.

ステップS308において、保存経路選択部114は、生成した経路が新規の保存対象経路となるか判定する。新規の保存対象経路となる場合はステップS309に制御は進み、新規の保存対象経路とならない場合は処理を終了する。尚、生成した経路が新規の保存対象経路となるかの判定処理の詳細は後述する。   In step S308, the storage route selection unit 114 determines whether the generated route is a new storage target route. If it becomes a new saving target route, the control proceeds to step S309, and if it is not a new saving target route, the process is terminated. Details of the process for determining whether the generated route is a new route to be saved will be described later.

ステップS309において、統計情報管理部115は、保存対象経路の情報を格納するための領域を記憶部118に確保し、保存対象経路に対応する経路IDやサーバレスポンス平均、全体レスポンス平均などの情報を学習値テーブル204および保存経路テーブル205に格納する。尚、統計情報管理部115は、生成した経路におけるサーバレスポンスおよび全体レスポンスを新たに追加したときのサーバレスポンス平均および全体レスポンス平均を算出する。   In step S309, the statistical information management unit 115 secures an area for storing information on the storage target route in the storage unit 118, and stores information such as a route ID corresponding to the storage target route, a server response average, and an overall response average. They are stored in the learning value table 204 and the storage route table 205. The statistical information management unit 115 calculates the server response average and the overall response average when the server response and the overall response in the generated route are newly added.

図11は、ステップS308の詳細なフローチャートである。
ステップS501において、保存経路選択部114は、生成した経路中のサーバのうち、未選択のサーバを順に一つ選択する。ここでは、生成した経路はS2-S4-S5-S7-S10とする。その場合、最初にサーバS2、以下、順にサーバS4、S5、S7、S10が処理対象として選択される。
FIG. 11 is a detailed flowchart of step S308.
In step S501, the storage path selection unit 114 sequentially selects one unselected server among the servers in the generated path. Here, the generated route is S2-S4-S5-S7-S10. In this case, the server S2 is selected as the processing target first, and then the servers S4, S5, S7, and S10 are sequentially selected.

ステップS502において、保存経路選択部114は、選択したサーバの部分経路を生成する。ここでは、対象サーバに前後1つずつサーバを加えた経路を部分経路とする。例えば、対象サーバがS5のとき、部分経路はS4-S5-S7となる。   In step S502, the storage path selection unit 114 generates a partial path of the selected server. Here, a route obtained by adding a server to the target server one by one before and after is defined as a partial route. For example, when the target server is S5, the partial path is S4-S5-S7.

ステップS503において、保存経路選択部114は、部分経路IDテーブル202を参照し、生成した部分経路に対応する部分経路IDを抽出する。
ステップS504において、保存経路選択部114は、学習値テーブル204を参照し、選択したサーバのサーバIDおよび生成した部分経路の部分経路IDの組に対応するサーバレスポンス平均および全体レスポンス平均を抽出する。尚、学習値テーブル204のサーバレスポンス平均および全体レスポンス平均を学習値と呼ぶ。
In step S503, the storage path selection unit 114 refers to the partial path ID table 202 and extracts a partial path ID corresponding to the generated partial path.
In step S504, the saved route selection unit 114 refers to the learned value table 204 and extracts the server response average and the overall response average corresponding to the set of the server ID of the selected server and the partial route ID of the generated partial route. The server response average and the overall response average in the learning value table 204 are referred to as learning values.

ステップS505において、保存経路選択部114は、選択したサーバのサーバレスポンスが閾値より大きいか判定する。選択したサーバのサーバレスポンスが閾値より大きい場合、制御はステップS506に進み、閾値以下である場合、制御はステップS507に進む。尚、閾値は、ステップS504で抽出したサーバレスポンス平均のN(正の実数)倍とする。   In step S505, the storage path selection unit 114 determines whether the server response of the selected server is greater than the threshold value. If the server response of the selected server is greater than the threshold value, control proceeds to step S506, and if it is equal to or less than the threshold value, control proceeds to step S507. The threshold is N (positive real number) times the server response average extracted in step S504.

ステップS506において、保存経路選択部114は、ステップS303で生成した経路を保存対象とする。
ステップS507において、保存経路選択部114は、未選択サーバが存在するか判定する。未選択サーバが存在する場合、制御はステップS501に戻り、未選択サーバが存在しない場合、処理を終了する。
In step S506, the save route selection unit 114 sets the route generated in step S303 as a save target.
In step S507, the storage path selection unit 114 determines whether there is an unselected server. If there is an unselected server, the control returns to step S501. If there is no unselected server, the process ends.

次に生成した経路が新規の保存対象経路となるかの判定処理の具体例について説明する。
ここでは、ネットワーク構成は図1と同様とする。
サーバS5の部分経路S3-S5-S7におけるサーバレスポンス平均は7msとする。
サーバS5の部分経路S3-S5-S8におけるサーバレスポンス平均は3msとする。
サーバS5の部分経路S4-S5-S7におけるサーバレスポンス平均は4msとする。
サーバS5の部分経路S4-S5-S8におけるサーバレスポンス平均は9msとする。
Next, a specific example of the process for determining whether the generated route becomes a new storage target route will be described.
Here, the network configuration is the same as in FIG.
The average server response in the partial path S3-S5-S7 of the server S5 is 7 ms.
The server response average in the partial path S3-S5-S8 of the server S5 is 3 ms.
The server response average in the partial path S4-S5-S7 of the server S5 is 4 ms.
The average server response in the partial path S4-S5-S8 of the server S5 is 9 ms.

新規の保存対象経路となるかの判定対象の経路は、S2-S4-S5-S7-S10とする。経路S2-S4-S5-S7-S10において、サーバS5のレスポンス値は9msだったとする。
また、Nは2とする。
The route to be determined as a new storage target route is S2-S4-S5-S7-S10. Assume that the response value of the server S5 is 9 ms on the route S2-S4-S5-S7-S10.
N is 2.

例えば、サーバS5に関して、経路S2-S4-S5-S7-S10の部分経路はS4-S5-S7である。サーバS5の部分経路S4-S5-S7におけるサーバレスポンス平均は4msであり、新規の保存対象経路となるかの判定対象の経路S2-S4-S5-S7-S10におけるサーバS5のレスポンス値である9msは8ms(4msの2倍)より大きいので、経路S2-S4-S5-S7-S10は、新規の保存対象経路と判定される。   For example, for the server S5, the partial route of the route S2-S4-S5-S7-S10 is S4-S5-S7. The server response average in the partial path S4-S5-S7 of the server S5 is 4 ms, and 9 ms which is the response value of the server S5 in the path S2-S4-S5-S7-S10 to be determined as a new storage target path Is larger than 8 ms (twice 4 ms), the path S2-S4-S5-S7-S10 is determined to be a new storage target path.

次にメモリ使用量の削減に関して説明する。
上述のようにサーバのレスポンス値等の統計値を部分経路毎に分類して集計することにより、どの経路を保存するかの判定の精度を高めることができる。一方で、経路情報の統計を処理する場合と同様に、部分経路を処理する場合にもサーバの組み合わせによる、取り扱う部分経路数増加の問題が発生する。
Next, a reduction in memory usage will be described.
As described above, by classifying and summing statistical values such as response values of the server for each partial route, it is possible to improve the accuracy of determining which route is stored. On the other hand, as in the case of processing the statistics of route information, the problem of an increase in the number of partial routes handled due to the combination of servers also occurs when processing partial routes.

この問題に対応するため、メモリ使用量に余裕がない場合は部分経路長の縮小、または分岐した経路の統合により、メモリ使用量を削減する。
図12は、メモリ領域が足りなくなってきた場合の部分経路の短縮処理のフローチャートである。
In order to cope with this problem, when there is not enough memory usage, the memory usage is reduced by reducing the partial path length or integrating the branched paths.
FIG. 12 is a flowchart of the partial path shortening process when the memory area is insufficient.

図13は、部分経路の短縮処理の具体例におけるネットワーク構成図である。
部分経路の短縮処理の具体例について、適宜、図13のネットワーク構成図を用いて説明する。
FIG. 13 is a network configuration diagram in a specific example of partial path shortening processing.
A specific example of the partial path shortening process will be described with reference to the network configuration diagram of FIG. 13 as appropriate.

ノード700は、ノード701、702、703に接続している。
ノード701は、ノード711、712に接続している。
ノード702は、ノード721、722に接続している。
ノード703は、ノード731、732に接続している。
The node 700 is connected to the nodes 701, 702, and 703.
The node 701 is connected to the nodes 711 and 712.
The node 702 is connected to the nodes 721 and 722.
The node 703 is connected to the nodes 731 and 732.

尚、ノード700はn0、ノード701はn1、ノード702はn2、ノード703はn3、ノード711はn11、ノード712はn12、ノード721はn21、ノード722はn22、ノード731はn31、ノード732はn32と表すこともある。   Node 700 is n0, node 701 is n1, node 702 is n2, node 703 is n3, node 711 is n11, node 712 is n12, node 721 is n21, node 722 is n22, node 731 is n31, and node 732 is It may be expressed as n32.

部分経路n0-n1-n11における、n0のレスポンス値は、50msである。
部分経路n0-n1-n12における、n0のレスポンス値は、40msである。
部分経路n0-n2-n21における、n0のレスポンス値は、60msである。
部分経路n0-n2-n22における、n0のレスポンス値は、45msである。
部分経路n0-n3-n31における、n0のレスポンス値は、30msである。
部分経路n0-n3-n32における、n0のレスポンス値は、50msである。
The response value of n0 in the partial path n0-n1-n11 is 50 ms.
The response value of n0 in the partial path n0-n1-n12 is 40 ms.
The response value of n0 in the partial path n0-n2-n21 is 60 ms.
The response value of n0 in the partial path n0-n2-n22 is 45 ms.
The response value of n0 in the partial path n0-n3-n31 is 30 ms.
The response value of n0 in the partial path n0-n3-n32 is 50 ms.

ステップS601において、統計情報管理部115は、メモリの全体容量および空き容量(残量)を確認する。
ステップS602において、統計情報管理部115は、メモリの空き容量が所定の割合未満であるかチェックする。メモリの空き容量が所定の割合未満である場合、制御はステップS603に進み、メモリの空き容量が所定の割合以上の場合、処理は終了する。
In step S601, the statistical information management unit 115 checks the total memory capacity and the free capacity (remaining capacity).
In step S602, the statistical information management unit 115 checks whether the free space of the memory is less than a predetermined ratio. If the free space of the memory is less than the predetermined rate, the control proceeds to step S603, and if the free space of the memory is equal to or greater than the predetermined rate, the process ends.

ステップS603において、統計情報管理部115は、縮小できる部分経路が存在するかチェックする。縮小できる部分経路が存在する場合、制御はステップS604に進み、縮小できる部分経路が存在しない場合、処理を終了する。縮小できる部分経路が存在するかは、例えば、ネットワークの構成図を保持し、ネットワーク内のノードで端点でないノード(例えば、図13のn1)があるかによって判定する。   In step S603, the statistical information management unit 115 checks whether there is a partial path that can be reduced. If there is a partial path that can be reduced, control proceeds to step S604. If there is no partial path that can be reduced, the process ends. Whether there is a partial path that can be reduced is determined by, for example, holding a network configuration diagram and determining whether there is a node that is not an end point (for example, n1 in FIG. 13) in the network.

ステップS604において、統計情報管理部115は、未処理の部分経路があるかチェックする。未処理の部分経路がある場合、制御はステップS605に進み、未処理の部分経路が無い場合、制御はステップS607に進む。   In step S604, the statistical information management unit 115 checks whether there is an unprocessed partial path. If there is an unprocessed partial path, control proceeds to step S605, and if there is no unprocessed partial path, control proceeds to step S607.

ステップS605において、統計情報管理部115は、未処理の部分経路を一つ選択する。図13において、部分経路は、n0-n1-n11、n0-n1-n12、n0-n2-n21、n0-n2-n22、 n0-n3-n31、n0-n3-n32である。従って、これらの部分経路のうち、未処理の部分経路を一つ選択する。   In step S605, the statistical information management unit 115 selects one unprocessed partial path. In FIG. 13, the partial paths are n0-n1-n11, n0-n1-n12, n0-n2-n21, n0-n2-n22, n0-n3-n31, and n0-n3-n32. Therefore, one unprocessed partial path is selected from these partial paths.

ステップS606において、統計情報管理部115は、末端の一個手前のノードから分岐する経路毎に、ルートノードでのレスポンス値の差を一個手前のノードの属性値として記録する。   In step S606, the statistical information management unit 115 records the difference in response value at the root node as the attribute value of the immediately preceding node for each path that branches from the immediately preceding node.

部分経路n0-n1-n11、n0-n1-n12において、末端(n11,n12)の一個手前のノード(n1)の属性値として、部分経路毎のルートノード(n0)のレスポンス値の差を記録する。n1の場合は部分経路n0-n1-n11でのルートノード(n0)のレスポンス値は50ms、部分経路n0-n1-n12でのルートノード(n0)のレスポンス値は40msである。したがって、その差50ms-40ms=10msをn1の属性値(レスポンス差)として記録する。   Record the difference in the response value of the root node (n0) for each partial path as the attribute value of the node (n1) immediately before the end (n11, n12) in the partial paths n0-n1-n11, n0-n1-n12 To do. In the case of n1, the response value of the root node (n0) in the partial path n0-n1-n11 is 50 ms, and the response value of the root node (n0) in the partial path n0-n1-n12 is 40 ms. Therefore, the difference 50 ms-40 ms = 10 ms is recorded as the attribute value (response difference) of n1.

同様に、n2の属性値(レスポンス差)は15ms、n3の属性値(レスポンス差)は20msという値を記録する。
ステップS607において、統計情報管理部115は、未処理のノードがあるかチェックする。未処理のノードがある場合、制御はステップS608に進み、未処理の部分経路が無い場合、制御はステップS601に戻る。
Similarly, the attribute value (response difference) of n2 is 15 ms, and the attribute value (response difference) of n3 is 20 ms.
In step S607, the statistical information management unit 115 checks whether there is an unprocessed node. If there is an unprocessed node, control proceeds to step S608, and if there is no unprocessed partial path, control returns to step S601.

ステップS608において、統計情報管理部115は、ノードの属性値として記録した
レスポンス差が小さい順にノードを一つ選択する。
図13の具体例において、n1、n2、n3のレスポンス差は、それぞれ10ms、15ms、20msである。したがって、n1、n2、n3の順に選択される。
In step S608, the statistical information management unit 115 selects one node in ascending order of the response difference recorded as the node attribute value.
In the specific example of FIG. 13, the response differences of n1, n2, and n3 are 10 ms, 15 ms, and 20 ms, respectively. Therefore, n1, n2, and n3 are selected in this order.

ステップS609において、統計情報管理部115は、選択したノードの末端のノードを縮小対象として、部分経路を縮める。
選択したノードがn1の場合、末端のノードはn11、n12である。従って、部分経路からn11、n12を削除する。
In step S609, the statistical information management unit 115 shortens the partial path by using the terminal node of the selected node as a reduction target.
When the selected node is n1, the end nodes are n11 and n12. Therefore, n11 and n12 are deleted from the partial path.

ステップS610において、統計情報管理部115は、メモリの空き容量が規定値を上回るかチェックする。メモリの空き容量が規定値を上回る場合、処理を終了し、メモリの空き容量が規定値を上回らない場合、ステップS607に制御は戻る。   In step S610, the statistical information management unit 115 checks whether the free capacity of the memory exceeds a specified value. If the free memory capacity exceeds the specified value, the process is terminated. If the free memory capacity does not exceed the specified value, the control returns to step S607.

次に部分経路の伸長について説明する。
通過経路数の減少(これまで通過していた経路を通らなくなった事)によりメモリ使用量に余裕ができた場合には、部分経路を伸長することで、どの経路を保存すべきかの判定精度を高める。
Next, the extension of the partial path will be described.
If there is a margin in memory usage due to a decrease in the number of passing routes (because it no longer passes through the route that has been passed so far), it is possible to increase the accuracy of determining which route should be saved by expanding the partial route. Increase.

図14は、メモリに余裕がある場合の部分経路の伸長処理のフローチャートである。
図15は、部分経路の伸長処理の具体例におけるネットワーク構成図である。
部分経路の伸長処理の具体例について、適宜、図15のネットワーク構成図を用いて説明する。
FIG. 14 is a flowchart of the partial path decompression process when there is room in the memory.
FIG. 15 is a network configuration diagram in a specific example of the partial path expansion processing.
A specific example of the partial path expansion process will be described with reference to the network configuration diagram of FIG.

ノード900は、ノード901、902、903、904に接続している。
ノード901は、ノード911、912に接続している。
尚、ノード900はn0、ノード901はn1、ノード902はn2、ノード903はn3、ノード904はn4、ノード911はn11、ノード912はn12と表すこともある。
The node 900 is connected to the nodes 901, 902, 903, and 904.
The node 901 is connected to the nodes 911 and 912.
The node 900 may be represented as n0, the node 901 as n1, the node 902 as n2, the node 903 as n3, the node 904 as n4, the node 911 as n11, and the node 912 as n12.

部分経路n0-n2における、n0のレスポンス値は、35msである。
部分経路n0-n3における、n0のレスポンス値は、55msである。
部分経路n0-n4における、n0のレスポンス値は、40msである。
The response value of n0 in the partial path n0-n2 is 35 ms.
The response value of n0 in the partial path n0-n3 is 55 ms.
The response value of n0 in the partial path n0-n4 is 40 ms.

ステップS801において、統計情報管理部115は、メモリの全体容量および空き容量(残量)を確認する。
ステップS802において、統計情報管理部115は、メモリの空き容量が規定値を上回るかチェックする。メモリの空き容量が規定値を上回る場合、ステップS803に制御は進み、メモリの空き容量が規定値を上回らない場合、処理は終了する。
In step S801, the statistical information management unit 115 checks the total memory capacity and the free capacity (remaining capacity).
In step S802, the statistical information management unit 115 checks whether the free space of the memory exceeds a specified value. If the free space of the memory exceeds the specified value, the control proceeds to step S803. If the free space of the memory does not exceed the specified value, the process ends.

ステップS803において、統計情報管理部115は、未処理の部分経路があるかチェックする。未処理の部分経路がある場合、制御はステップS804に進み、未処理の部分経路が無い場合、処理は終了する。   In step S803, the statistical information management unit 115 checks whether there is an unprocessed partial path. If there is an unprocessed partial path, control proceeds to step S804. If there is no unprocessed partial path, the process ends.

ステップS804において、統計情報管理部115は、最長の部分経路より短い未処理の部分経路について、末端ノードに対するルートノードのレスポンス値の長い順に一つ選択する。   In step S804, the statistical information management unit 115 selects one unprocessed partial path that is shorter than the longest partial path in order of increasing response value of the root node with respect to the terminal node.

図13において、最長の部分経路はn0-n1-n11、n0-n1-n12であり、最長の部分経路より短い部分経路は、n0-n2、n0-n3、n0-n3である。部分経路n0-n2、n0-n3、n0-n4のルートノード(n0)のレスポンス値は、それぞれ35ms、55ms、40msである。したがって、n0-n3、n0-n4、n0-n2の順に選択される。   In FIG. 13, the longest partial paths are n0-n1-n11 and n0-n1-n12, and the partial paths shorter than the longest partial path are n0-n2, n0-n3, and n0-n3. The response values of the route nodes (n0) of the partial paths n0-n2, n0-n3, n0-n4 are 35 ms, 55 ms, and 40 ms, respectively. Therefore, n0-n3, n0-n4, and n0-n2 are selected in this order.

ステップS805において、統計情報管理部115は、選択された部分経路を経路伸長対象として、部分経路を伸ばす(ノードを追加する)処理を行う。
例えば、部分経路n0-n3において、ノードn31、32を追加して、部分経路をn0-n3-n31、n0-n3-n32とする。
In step S805, the statistical information management unit 115 performs a process of extending a partial path (adding a node) using the selected partial path as a path extension target.
For example, in the partial route n0-n3, nodes n31 and 32 are added to make the partial route n0-n3-n31 and n0-n3-n32.

ステップS806において、統計情報管理部115は、伸長処理で使用したメモリ容量をメモリ残量から差し引く。
次に部分経路の有効化について説明する。
In step S806, the statistical information management unit 115 subtracts the memory capacity used in the decompression process from the remaining memory capacity.
Next, validation of the partial path will be described.

上述のように、部分経路を長くした場合、その直後からしばらくの間は伸長した部分経路を通るメッセージが少ないため、学習値としての信頼度が低くなる。従って、伸長した直後の部分経路を経路保存対象かどうかの判断に使うのは望ましくない。したがって、伸長した直後は、学習値テーブル204の有効フラグを偽(0)にしておくことにより、伸長した部分経路を無効にしておく。そして、以下のような手順により、伸張した部分経路を経路保存対象の判断材料として有効化する。   As described above, when the partial route is lengthened, since there are few messages passing through the extended partial route for a while after that, the reliability as the learning value is low. Therefore, it is not desirable to use the partial path immediately after decompression to determine whether or not it is a path storage target. Therefore, immediately after decompression, the decompressed partial path is invalidated by setting the valid flag of the learning value table 204 to false (0). Then, the expanded partial route is validated as a route storage target determination material by the following procedure.

図16は、部分経路の有効化処理のフローチャートである。
最初、学習値テーブル204の伸長した部分経路の有効フラグは、偽(0)となっているものとする。
FIG. 16 is a flowchart of the partial path validation process.
First, it is assumed that the validity flag of the expanded partial path in the learning value table 204 is false (0).

ステップS1001において、統計情報管理部115は、有効可判定中の部分経路が存在するかチェックする。存在する場合、ステップS1002に制御は進み、存在しない場合、処理を終了する。有効可判定中の部分経路が存在するかの判定は、例えば、ステップS805において、統計情報管理部115が、経路を伸張したことを示すフラグを記録しておき、当該フラグの有無で有効可判定中の部分経路が存在するか判定するようにする。   In step S1001, the statistical information management unit 115 checks whether there is a partial path for which validity is determined. If it exists, the control proceeds to step S1002, and if it does not exist, the process ends. For example, in step S805, the statistical information management unit 115 records a flag indicating that the route has been expanded, and determines whether the partial route is valid or not based on the presence or absence of the flag. It is determined whether or not there is a partial path inside.

ステップS1002において、統計情報管理部115は、判定対象の経路の規定時間あたりのルートノードを通るトランザクション数が規定の数を超えるかチェックする。規定の数を超えた場合、制御はステップS1004に進み、超えていない場合は処理を終了する。   In step S <b> 1002, the statistical information management unit 115 checks whether the number of transactions passing through the root node per prescribed time of the route to be determined exceeds the prescribed number. If the specified number has been exceeded, control proceeds to step S1004, and if not, the process ends.

ステップS1003において、統計情報管理部115は、判定対象の経路が伸長されてから規定時間を経過しているかチェックする。規定時間を経過している場合、制御はステップS1004に進み、経過していない場合は処理を終了する。   In step S <b> 1003, the statistical information management unit 115 checks whether a specified time has elapsed since the determination target route has been expanded. If the specified time has elapsed, the control proceeds to step S1004, and if not, the process ends.

ステップS1004において、統計情報管理部115は、学習値テーブル204の「有効化フラグ」を真(例えば、1)に設定する。これにより、有効になった部分経路は、図9のステップS304の保存対象経路であるかの判定で用いられる。   In step S1004, the statistical information management unit 115 sets the “validation flag” in the learning value table 204 to true (eg, 1). Thereby, the validated partial route is used in determining whether it is a route to be stored in step S304 in FIG.

実施の形態の異常診断装置によれば、メモリに余裕が生じたときに、部分経路を伸長することで、どの経路を保存すべきかの判定精度を高めることが出来る。
次にサーバ異常があるかの判定処理について説明する。
According to the abnormality diagnosis apparatus of the embodiment, when a margin is generated in the memory, it is possible to increase the accuracy of determining which route should be saved by expanding the partial route.
Next, a process for determining whether there is a server abnormality will be described.

図17は、サーバ異常判定処理のフローチャートである。
ステップS1101において、異常診断部116は、保存経路テーブル205の内、未処理のサーバがあるかチェックする。未処理のサーバがある場合、制御はステップS1102に進み、未処理のサーバが無い場合、制御はステップS1109に進む。
FIG. 17 is a flowchart of the server abnormality determination process.
In step S1101, the abnormality diagnosis unit 116 checks whether there is an unprocessed server in the storage path table 205. If there is an unprocessed server, control proceeds to step S1102, and if there is no unprocessed server, control proceeds to step S1109.

ステップS1102において、異常診断部116は、保存経路テーブル205の内、未処理のサーバ(サーバID)を一つ選択する。
ステップS1103において、異常診断部116は、選択したサーバの所定の期間におけるサーバレスポンス平均が閾値を超えているかチェックする。閾値を超えている場合、ステップS1104に制御は進み、閾値を超えていない場合、ステップS1105に制御は進む。
In step S1102, the abnormality diagnosis unit 116 selects one unprocessed server (server ID) from the storage path table 205.
In step S1103, the abnormality diagnosis unit 116 checks whether the server response average over a predetermined period of the selected server exceeds the threshold value. If the threshold is exceeded, control proceeds to step S1104, and if the threshold is not exceeded, control proceeds to step S1105.

具体的には、図7の保存経路テーブル205において、サーバS5が選択された場合、S5のサーバレスポンス平均は、保存経路テーブル205に記録されているサーバS5の全ての経路の加重平均から求める。   Specifically, when the server S5 is selected in the storage path table 205 of FIG. 7, the server response average of S5 is obtained from the weighted average of all paths of the server S5 recorded in the storage path table 205.

図7において、S5の経路ID1におけるサーバレスポンス平均は8ms、頻度は26である。また、S5の経路ID2におけるサーバレスポンス平均は5ms、頻度は20である。
従って、S5のサーバレスポンス平均は、これらの加重平均であるので、S5のサーバレスポンス平均=(8*26+5*20)/(26+20)=6.7msとなる。
In FIG. 7, the server response average in the route ID 1 of S5 is 8 ms, and the frequency is 26. Further, the server response average in the route ID 2 of S5 is 5 ms, and the frequency is 20.
Accordingly, since the server response average of S5 is a weighted average of these, the server response average of S5 = (8 * 26 + 5 * 20) / (26 + 20) = 6.7 ms.

ステップS1104において、異常診断部116は、選択したサーバに異常がある旨を記憶部118に記録する。
ステップS1105において、異常診断部116は、選択したサーバを含む保存経路テーブル205内の全経路に関して、未処理の経路があるかチェックする。未処理の経路がある場合、ステップS1106に制御は進み、未処理の経路が無い場合ステップS1101に制御は戻る。
In step S1104, the abnormality diagnosis unit 116 records in the storage unit 118 that there is an abnormality in the selected server.
In step S1105, the abnormality diagnosis unit 116 checks whether there is an unprocessed path for all paths in the storage path table 205 including the selected server. If there is an unprocessed path, control proceeds to step S1106, and if there is no unprocessed path, control returns to step S1101.

ステップS1106において、異常診断部116は、未処理の経路を1つ選択する。
ステップS1107において、異常診断部116は、選択したサーバ及び経路の組のサーバレスポンス平均が閾値を超えているかチェックする。閾値を超えている場合、制御はステップS1108に進み、閾値を超えていない場合、制御はステップS1105に戻る。
In step S1106, the abnormality diagnosis unit 116 selects one unprocessed route.
In step S1107, the abnormality diagnosis unit 116 checks whether the server response average of the selected server and route pair exceeds the threshold value. If the threshold is exceeded, control proceeds to step S1108, and if the threshold is not exceeded, control returns to step S1105.

ステップS1108において、異常診断部116は、選択したサーバおよび経路に異常がある旨を記憶部118に記録する。
ステップS1109において、異常診断部116は、ステップS1104で記録したサーバ、ステップS1108で記録したサーバおよび経路をユーザに通知する。
In step S1108, the abnormality diagnosis unit 116 records in the storage unit 118 that there is an abnormality in the selected server and route.
In step S1109, the abnormality diagnosis unit 116 notifies the user of the server recorded in step S1104, the server recorded in step S1108, and the route.

本実施の形態の異常診断装置によれば、障害の要因であるサーバおよび経路を容易に特定することが可能となる。特に、特定の経路で発生するサーバの異常を発見することが容易になる。   According to the abnormality diagnosis apparatus of the present embodiment, it is possible to easily identify the server and the path that are the cause of the failure. In particular, it becomes easy to discover server abnormalities that occur on a specific route.

以上の実施の形態に関し、さらに以下の付記を開示する。
(付記1)
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部を有するコンピュータに、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する処理と、
を実行させるサーバ異常判定プログラム。
(付記2)
複数のメッセージデータを所定の属性に基づいて関連付ける紐付ける処理と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する処理と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する処理と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する処理と、
をさらに実行させる付記1記載のサーバ異常判定プログラム。
(付記3)
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するか否かを決定する処理をさらに実行することを特徴とする付記2記載のサーバ異常判定プログラム。
(付記4)
生成した前記経路情報が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するかを決定する処理をさらに実行することを特徴とする付記2または3記載のサーバ異常判定プログラム。
(付記5)
コンピュータに
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報を記憶する工程と、
前記サーバレスポンス平均が閾値を超えているか判定し、超えていれば前記サーバを特定する情報と前記経路情報とを記録する工程と、
を実行させるサーバ異常判定方法。
(付記6)
複数のメッセージデータを所定の属性に基づいて関連付ける工程と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する工程と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する工程と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する工程と、
をさらに実行させることを特徴とする付記5記載のサーバ異常判定方法。
(付記7)
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するかを決定する工程をさらに実行させることを特徴とする付記6記載のサーバ異常判定方法。
(付記8)
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するか否かを決定する工程をさらに実行させることを特徴とする付記6記載のサーバ異常判定方法。
(付記9)
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部と、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する異常判定部と、
を備えるサーバ異常判定装置
(付記10)
複数のメッセージデータを所定の属性に基づいて関連付ける紐付け処理部と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する経路情報生成部と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する保存経路選択部と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する統計情報管理部と、
をさらに備える付記9記載のサーバ異常診断装置。
(付記11)
前記保存経路選択部は、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するかを決定することを特徴とする付記10記載のサーバ異常判定装置。
(付記12)
前記保存経路選択部は、生成した前記経路情報が保存対象であると判定された場合、 生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するかを決定することを特徴とする付記10記載のサーバ異常判定装置。
Regarding the above embodiment, the following additional notes are disclosed.
(Appendix 1)
Information specifying a server, route information indicating a route including the server with respect to message data of a transaction, and an average of response values that are times from when the server sends a request message of the transaction to when a response message is received And a computer having a storage unit that stores information associated with the server response average,
When the server response average exceeds a threshold, it is determined that an abnormality has occurred in the route, and processing for recording the information for specifying the server and the route information;
Server abnormality determination program that executes
(Appendix 2)
A process of associating a plurality of message data based on a predetermined attribute,
The route information indicating the route through which the associated message data passes is generated from the associated message data, and the response value of the server in the route through which the associated message data has passed is calculated. Processing to
Based on whether the generated route information is stored in the storage unit, a process of determining whether the response value of the server in the route through which the associated message data passes is a storage target;
When the response value of the server in the route through which the plurality of associated message data has passed is a storage target, the server response including the response value of the server in the route through which the associated plurality of message data has passed The process of recording the average;
The server abnormality determination program according to appendix 1, further executing
(Appendix 3)
When it is determined that the response value of the server in the route through which the associated message data has passed is not a storage target, partial route information indicating a partial route that is a part of the route is generated from the route information. And further executing a process of determining whether to save the response values of the servers in the path through which the associated message data passes based on whether the response values of the servers in the partial path are greater than a threshold value The server abnormality determination program according to supplementary note 2, characterized by:
(Appendix 4)
If it is determined that the generated route information is a storage target, the associated message data passes based on whether the server response average for a predetermined period corresponding to the generated route is smaller than a threshold value. The server abnormality determination program according to appendix 2 or 3, further comprising a process of determining whether to record a server response average including the response value of the server in the route.
(Appendix 5)
Information identifying the server to the computer, route information indicating the route including the server with respect to transaction message data, and a response value that is a time from when the server sends a request message for the transaction to when a response message is received Storing information associated with a server response average that is an average of
Determining whether the server response average exceeds a threshold, and if exceeding, recording the information identifying the server and the route information;
Server failure determination method for executing
(Appendix 6)
Associating a plurality of message data based on predetermined attributes;
The route information indicating the route through which the associated message data passes is generated from the associated message data, and the response value of the server in the route through which the associated message data has passed is calculated. And a process of
Determining whether the response value of the server in the path through which the plurality of associated message data has passed is a storage target, based on whether the generated path information is stored in the storage unit;
When the response value of the server in the route through which the plurality of associated message data has passed is a storage target, the server response including the response value of the server in the route through which the associated plurality of message data has passed Recording the average;
The server abnormality determination method according to appendix 5, further comprising:
(Appendix 7)
When it is determined that the response value of the server in the route through which the associated message data has passed is not a storage target, partial route information indicating a partial route that is a part of the route is generated from the route information. Determining whether to store the response values of the servers in the path through which the associated message data passes based on whether the response values of the servers in the partial path are greater than a threshold value. The server abnormality determination method according to appendix 6, characterized by:
(Appendix 8)
If it is determined that the response value of the server in the path through which the plurality of associated message data has passed is a storage target, is the server response average for a predetermined period corresponding to the generated path smaller than a threshold? The method further includes the step of determining whether or not to record a server response average including the response value of the server in the path through which the plurality of associated message data passes based on The server abnormality determination method described.
(Appendix 9)
Information specifying a server, route information indicating a route including the server with respect to message data of a transaction, and an average of response values that are times from when the server sends a request message of the transaction to when a response message is received A storage unit that stores information associated with the server response average,
When the server response average exceeds a threshold, it is determined that an abnormality has occurred in the route, and an abnormality determination unit that records information identifying the server and the route information;
Server abnormality determination device (Appendix 10)
An association processing unit for associating a plurality of message data based on predetermined attributes;
The route information indicating the route through which the associated message data passes is generated from the associated message data, and the response value of the server in the route through which the associated message data has passed is calculated. A route information generator to
A storage path selection unit that determines whether the response value of the server in the path through which the plurality of associated message data has passed is a storage target based on whether the generated path information is stored in the storage unit; ,
When the response value of the server in the route through which the plurality of associated message data has passed is a storage target, the server response including the response value of the server in the route through which the associated plurality of message data has passed A statistical information management unit that records the average;
The server abnormality diagnosis device according to appendix 9, further comprising:
(Appendix 11)
When the response value of the server in the route through which the plurality of associated message data passes is determined not to be stored, the storage route selection unit selects a partial route that is a part of the route from the route information. The partial route information is generated, and based on whether the response value of the server in the partial route is larger than the threshold value, the response value of the server in the route through which the associated message data passes is stored. The server abnormality determination device according to supplementary note 10, wherein:
(Appendix 12)
When it is determined that the generated route information is a storage target, the storage route selection unit is associated based on whether the server response average for a predetermined period corresponding to the generated route is smaller than a threshold value. 11. The server abnormality determination device according to appendix 10, wherein it is determined whether to record an average server response including the response value of the server in the path through which the plurality of message data passes.

101 異常診断装置
102 サーバ
103 キャプチャ装置
104 端末
111 メッセージデータ収集部
112 紐付け部
113 経路情報生成部
114 保存経路選択部
115 統計情報管理部
116 異常診断部
117 記憶部
201 サーバテーブル
202 部分経路IDテーブル
203 経路IDテーブル
204 学習値テーブル
205 保存経路テーブル
401〜404 メッセージデータ
DESCRIPTION OF SYMBOLS 101 Abnormality diagnosis apparatus 102 Server 103 Capture apparatus 104 Terminal 111 Message data collection part 112 Linking part 113 Path information generation part 114 Storage path selection part 115 Statistical information management part 116 Abnormality diagnosis part 117 Storage part 201 Server table 202 Partial path ID table 203 Route ID Table 204 Learning Value Table 205 Saved Route Table 401-404 Message Data

Claims (6)

サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部を有するコンピュータに、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する処理と、
を実行させるサーバ異常判定プログラム。
Information specifying a server, route information indicating a route including the server with respect to message data of a transaction, and an average of response values that are times from when the server sends a request message of the transaction to when a response message is received And a computer having a storage unit that stores information associated with the server response average,
When the server response average exceeds a threshold, it is determined that an abnormality has occurred in the route, and processing for recording the information for specifying the server and the route information;
Server abnormality determination program that executes
複数のメッセージデータを所定の属性に基づいて関連付ける紐付ける処理と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する処理と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する処理と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する処理と、
をさらに実行させる請求項1記載のサーバ異常判定プログラム。
A process of associating a plurality of message data based on a predetermined attribute,
The route information indicating the route through which the associated message data passes is generated from the associated message data, and the response value of the server in the route through which the associated message data has passed is calculated. Processing to
Based on whether the generated route information is stored in the storage unit, a process of determining whether the response value of the server in the route through which the associated message data passes is a storage target;
When the response value of the server in the route through which the plurality of associated message data has passed is a storage target, the server response including the response value of the server in the route through which the associated plurality of message data has passed The process of recording the average;
The server abnormality determination program according to claim 1, further comprising:
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するか否かを決定する処理をさらに実行することを特徴とする請求項2記載のサーバ異常判定プログラム。   When it is determined that the response value of the server in the route through which the associated message data has passed is not a storage target, partial route information indicating a partial route that is a part of the route is generated from the route information. And further executing a process of determining whether to save the response values of the servers in the path through which the associated message data passes based on whether the response values of the servers in the partial path are greater than a threshold value The server abnormality determination program according to claim 2, wherein: 生成した前記経路情報が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するかを決定する処理をさらに実行することを特徴とする請求項2または3記載のサーバ異常判定プログラム。   If it is determined that the generated route information is a storage target, the associated message data passes based on whether the server response average for a predetermined period corresponding to the generated route is smaller than a threshold value. The server abnormality determination program according to claim 2 or 3, further comprising a process of determining whether to record a server response average including the response value of the server in the route. コンピュータに
サーバを特定する情報、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する工程と、
前記サーバレスポンス平均が閾値を超えているか判定し、超えていれば前記サーバを特定する情報と前記経路情報とを記録する工程と、
を実行させるサーバ異常判定方法。
Information identifying the server to the computer, route information indicating the route including the server for transaction message data, and a response value that is a time from when the server sends a request message for the transaction to when a response message is received. Storing information associated with an average server response average;
Determining whether the server response average exceeds a threshold, and if exceeding, recording the information identifying the server and the route information;
Server failure determination method for executing
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部と、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する異常判定部と、
を備えるサーバ異常判定装置。
Information specifying a server, route information indicating a route including the server with respect to message data of a transaction, and an average of response values that are times from when the server sends a request message of the transaction to when a response message is received A storage unit that stores information associated with the server response average,
When the server response average exceeds a threshold, it is determined that an abnormality has occurred in the route, and an abnormality determination unit that records information identifying the server and the route information;
A server abnormality determination device comprising:
JP2010113847A 2010-05-18 2010-05-18 Server abnormality determination program, server abnormality determination device and server abnormality determination method Pending JP2011244164A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010113847A JP2011244164A (en) 2010-05-18 2010-05-18 Server abnormality determination program, server abnormality determination device and server abnormality determination method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010113847A JP2011244164A (en) 2010-05-18 2010-05-18 Server abnormality determination program, server abnormality determination device and server abnormality determination method

Publications (1)

Publication Number Publication Date
JP2011244164A true JP2011244164A (en) 2011-12-01

Family

ID=45410374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010113847A Pending JP2011244164A (en) 2010-05-18 2010-05-18 Server abnormality determination program, server abnormality determination device and server abnormality determination method

Country Status (1)

Country Link
JP (1) JP2011244164A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012129930A (en) * 2010-12-17 2012-07-05 Ntt Comware Corp Monitoring system, monitoring method and program
JP2015171052A (en) * 2014-03-07 2015-09-28 富士通株式会社 Identification device, identification program and identification method
US9292386B2 (en) 2013-04-18 2016-03-22 International Business Machines Corporation Apparatus and method for allocating processing requests

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11346238A (en) * 1998-01-23 1999-12-14 Hewlett Packard Co <Hp> Response time measurement system
JP2003060704A (en) * 2001-07-25 2003-02-28 Hewlett Packard Co <Hp> Method and device for monitoring performance of network
JP2004228828A (en) * 2003-01-22 2004-08-12 Hitachi Ltd Network failure analysis support system
JP2010063058A (en) * 2008-09-08 2010-03-18 Hitachi Ltd Device, method and program for monitoring network
JP2011071718A (en) * 2009-09-25 2011-04-07 Fujitsu Ltd Delay time measurement apparatus, delay time measurement program, and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11346238A (en) * 1998-01-23 1999-12-14 Hewlett Packard Co <Hp> Response time measurement system
JP2003060704A (en) * 2001-07-25 2003-02-28 Hewlett Packard Co <Hp> Method and device for monitoring performance of network
JP2004228828A (en) * 2003-01-22 2004-08-12 Hitachi Ltd Network failure analysis support system
JP2010063058A (en) * 2008-09-08 2010-03-18 Hitachi Ltd Device, method and program for monitoring network
JP2011071718A (en) * 2009-09-25 2011-04-07 Fujitsu Ltd Delay time measurement apparatus, delay time measurement program, and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012129930A (en) * 2010-12-17 2012-07-05 Ntt Comware Corp Monitoring system, monitoring method and program
US9292386B2 (en) 2013-04-18 2016-03-22 International Business Machines Corporation Apparatus and method for allocating processing requests
JP2015171052A (en) * 2014-03-07 2015-09-28 富士通株式会社 Identification device, identification program and identification method

Similar Documents

Publication Publication Date Title
CN101404599B (en) Network fault detection method, primary device, slave device, control terminal and system
JP5051055B2 (en) Method, probe apparatus, and aggregation server apparatus for identifying influence range when network failure occurs in internet service with signaling
JP4244940B2 (en) Network quality degradation location estimation apparatus, quality degradation location estimation method, and quality degradation location estimation program
US7907599B2 (en) Determination of SIP transport to reduce call setup delays
CN108092853A (en) Method, apparatus, system, electronic equipment and the storage medium of monitoring server link state
CN1901484B (en) Measurement system and method of measuring a transit metric
CN101242367B (en) Method for selecting forward node end in media stream
JP4068545B2 (en) Packet receiving method and apparatus
JP2008219461A (en) Communicating history information managing system, sip client terminal, history server, and communicating history information managing method
JP2011244164A (en) Server abnormality determination program, server abnormality determination device and server abnormality determination method
US8565395B2 (en) VoIP master call detail record
JPWO2008108231A1 (en) Quality degradation location estimation method, quality degradation location estimation apparatus, and program
JP4275557B2 (en) Packet transmission quality measuring device, packet transmission quality measuring method, and program
US8649285B2 (en) Tracking packet sequence numbers
JP4387937B2 (en) Telephone system and switching system
US20080080366A1 (en) IP telephone system and telephone exchange
CN111130813B (en) Information processing method based on network and electronic equipment
JP4471703B2 (en) Communication quality analysis system, analysis apparatus, communication quality analysis method, and computer program
JP4857300B2 (en) Monitoring device, monitoring system and monitoring program
US7983176B2 (en) Method and system for monitoring communications of an individual in a packet network
Shan et al. A case study of IP network monitoring using wireless mobile devices
US20240073123A1 (en) Alternative route propogation
JP2009246687A (en) Communication system, communication analysis device and communication analysis method
JP2016165072A (en) Switching system
JP2019097007A (en) Communication failure section separation device, communication failure section separation method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140902