JP2013026841A - 障害検出装置、障害検出方法及び障害検出プログラム - Google Patents
障害検出装置、障害検出方法及び障害検出プログラム Download PDFInfo
- Publication number
- JP2013026841A JP2013026841A JP2011160009A JP2011160009A JP2013026841A JP 2013026841 A JP2013026841 A JP 2013026841A JP 2011160009 A JP2011160009 A JP 2011160009A JP 2011160009 A JP2011160009 A JP 2011160009A JP 2013026841 A JP2013026841 A JP 2013026841A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- error
- errors
- occurrence
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Monitoring And Testing Of Exchanges (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
Abstract
【解決手段】SIP信号の統計情報を取得し、該取得したSIP信号の統計情報に基づいて、SIPサーバ間の経路毎の発生エラー数を推定する発生エラー数推定部303と、推定された経路毎の発生エラー数に基づいて、障害発生を検出する障害発生検出部304と、を備える。
【選択図】図4
Description
また、特許文献1には、各SIPサーバが送受信したSIPメッセージの数に基づいて、サーバ障害を検出し、端末が接続するSIPサーバを基点としてユーザ側/非ユーザ側のどちらで障害が発生しているかを判断し、SIPサーバ間の論理障害を検出する監視装置が開示されている。
その問題に対し、特許文献1では、個々のSIPパケットではなく、各SIPサーバが送信および受信するSIP信号の数に基づいてSIP信号網における障害を監視することにより解決を図っている。
SIP信号網100は、障害箇所の切り分け対象となるネットワークである。
SIP信号網100は、SIPサーバ101、…、108までの8台のSIPサーバを備える。各SIPサーバは、他のSIPサーバと接続されている。例えば、SIPサーバ101は、SIPサーバ102、104、105及び107と接続されている。
図3(B)は、エラーの統計情報のデータ構造の一例である。図3(B)において、エラー時の統計情報のデータは、開始時刻、終了時刻、送信側アドレス、受信側アドレス、着番号帯、エラー番号及びエラー数の組で表される。
図3(A)に示された正常呼の統計情報は、単位時間毎、経路毎、着番号帯毎に、呼数を集計したものである。このとき、エラーとなった呼については、集計の対象外とする。図3(B)に示されたエラーの統計情報は、単位時間毎、経路毎、着番号帯毎、エラー番号毎に、エラーの数を集計したものである。なお、エラーの送受信の向きは、呼の送受信の方向に対して逆向きとなる。
統計情報受信部301は、SIPログ収集装置200から統計情報を受信し、受信した統計情報を統計情報記憶部302に格納する。また、統計情報受信部301は、受信した統計情報を発生エラー数推定部303に出力する。
発生エラー数推定部303は、発生エラー数を、「経路」/「エラー番号」/「着番号帯」の組み合わせ毎に算出する。発生エラー数推定部303は、算出した発生エラー数を示す発生エラー数情報を統計情報記憶部302に格納されている過去の発生エラー数情報に追記する。また、発生エラー数推定部303は、発生エラー数情報を障害発生検出部304に出力する。
続いて、発生エラー数推定処理の原理について説明する。以降、説明のため、下記の定義を用いる。なお、正常呼とエラーの送受信の向きは逆である。あるSIPサーバXが経路iから受信した正常呼の数がNI(i)である。また、あるSIPサーバXが経路iから受信したエラーの数がEI(i)である。あるSIPサーバXが経路iに対して送信したエラーの数がEO(i)である。また、あるSIPサーバXが経路iに対して送信したエラーのうち、転送エラーの数がT(i)である。また、あるSIPサーバXが経路iに対して送信したエラーのうち、発生エラーの数がG(i)である。上記のうち、正常呼の数NI(i)、受信したエラーの数EI(i)、送信したエラーの数EO(i)については、SIPログ収集装置200から受信する統計情報に含まれる。
具体的には、発生エラー数推定部303は、あるSIPサーバXが経路iに対して送信した転送エラーの数T(i)を、経路毎に、以下の式(1)に従って算出する。
なお、式(1)は確率的に確からしい値として算出しているため、統計情報によっては式(1)の計算結果において転送エラーの数が送信エラーの数より大きくなる(すなわちT(i)>EO(i))となる経路が発生しうる。この場合には、発生エラー数推定部303は、該経路においてT(i)の値をEO(i)とする。
具体的には、例えば、発生エラー数推定部303は、各経路に分配される転送エラーの数をT´(i)とすると、T´(i)を以下の式に従って、算出する。
図5は、SIPサーバ54が経路iに対して送信した転送エラーの数T(i)の算出方法を説明するための図である。同図において、SIPサーバ51、52、53、54、55、56及び57の7つのSIPサーバが示されている。ここで、実線は正常呼を表し、破線はエラーを表す。以後、SIPサーバXからSIPサーバZへの経路を経路X→Zと記載する。
また、同図において、経路55→54の正常呼の数NI(55→54)は4個であり、経路56→54の正常呼の数NI(56→54)は4個であり、経路57→54の正常呼の数NI(57→54)は12個であることが示されている。
発生エラー数推定部303は、SIPサーバ54が受信したエラーの合計数20とSIPサーバ54が送信した転送エラーの合計数18に差分2が発生するため、発生エラー数推定部303は、その差分2をT(i)がEO(i)より小さい経路である経路54→55と経路54→56に対して分配する。
ゆえに、発生エラー数推定部303は、経路54→55の経路に分配される転送エラーの数T´(54→55)を1(=(20−18)×4/8)と算出する。発生エラー数推定部303は、経路54→55の転送エラーの数T(54→55)の値4に経路54→55の経路に分配される転送エラーの数T´(54→55)の値1を加算した値5を、新たに経路54→55の転送エラーの数T(54→55)の値とする。
続いて、発生エラー数推定処理について、具体例を用いて説明する。発生エラー数推定部303は、繰り返しにより、以下の処理を、SIP信号網100内に存在する全てのSIPサーバについてそれぞれ実施する。まず、発生エラー数推定部303が、予め決められた単位時間毎にSIP信号網100内のあるSIPサーバであるSIPサーバXに関連する統計情報を抽出する。具体的には、発生エラー数推定部303は、送信側アドレス又は受信側アドレスのいずれかが「X」である統計情報を抽出する。その場合、例えば図6に示された統計情報が抽出される。ここで、障害検出装置300が処理中の統計情報が生成された単位時間のことを現時刻と称す。
図7は、図6の統計情報から着番号帯が「03」であるものが抽出された後の統計情報である。図7(A)は、予め決められた単位時間における着番号帯が「03」の正常呼の統計情報の一例である。同図において、送信側アドレス、受信側アドレス、着番号帯及び呼数(正常呼の数)の組が示されている。例えば、同図の1行目には、送信側アドレスが「C」で、受信側アドレスが「X」で、着番号帯が「03」で、呼数が「300」であることが示されている。
図8は、図7の統計情報からエラー番号が「400」であるものが抽出された後の統計情報である。図8(A)は、予め決められた単位時間におけるエラー番号が「400」の正常呼の統計情報の一例である。図8(A)は、図7(A)と同一である。
図8の例では、SIPサーバXはSIPサーバAから35個のエラーを受信し、SIPサーバC、SIPサーバD及びSIPサーバEに対して合計55個のエラーを送信していることから、発生エラー数推定部303は、転送エラー数の合計を35個、発生エラー数の合計を20個と算出する。
具体的には、発生エラー数推定部303は、図8(A)の統計情報から、経路C→Xの正常呼の数NI(C→X)を300に、経路D→Xの正常呼の数NI(D→X)を240に、経路E→Xの正常呼の数NI(E→X)を160と設定する。また、発生エラー数推定部303は、図8(B)の統計情報から、経路A→Xのエラーの数EI(A→X)を35に、経路X→Cのエラーの数EO(X→C)を16に、経路X→Dのエラーの数EO(X→D)を10に、経路X→Eのエラーの数EO(X→E)を29に設定する。
発生エラー数推定部303による発生エラー数の推定により、図9に示す発生エラーが推定された場合を例に、障害発生検出処理について説明する。
図9は、発生エラーが推定された後の統計情報の一例である。同図において、送信側アドレス、受信側アドレス、着番号帯、エラー番号及び発生エラー数の組が示されている。例えば、同図の第1行目には、送信側アドレスが「X」で、受信側アドレスが「A」で、着番号帯が「02」で、エラー番号が「400」で、発生エラー数が「20」であることが示されている。
図10は、図9の例において送信側アドレス/エラー番号の組み合わせ毎に集計された発生エラー数を示した図である。同図において、送信側アドレス、エラー番号及び発生エラー数の組が示されている。例えば、同図の1行目には、送信側アドレスが「X」で、エラー番号が「400」で、発生エラー数が「61」であることが示されている。
障害発生検出部304は、送信側アドレス/エラー番号の組み合わせ毎に、過去一定期間の平均発生エラー数を、統計情報記憶部302から取得する。そして、障害発生検出部304は、送信側アドレス/エラー番号の組み合わせ毎に、過去一定期間の平均発生エラー数に対する現時刻における発生エラー数の比率を算出する。
例えば、障害発生検出部304は、図10の1行目の発生エラー数と図11の1行目の過去一定期間の平均発生エラー数とを用いて、送信側アドレス/エラー番号の組み合わせが「X」/「400」の発生エラーについて、過去一定期間の平均発生エラー数に対する現時刻の発生エラー数の比率7.625(=61/8)を算出する。
ここで、例えば閾値が3.0の場合、送信側アドレス/エラー番号の組み合わせが「X」/「400」の発生エラーは、過去一定期間の平均発生エラー数に対する現時刻の発生エラー数の比率7.625が閾値3.0を超えているため、障害発生検出部304は、障害が発生したと判定する。
また、送信側アドレス/エラー番号の組み合わせが「A」/「500」の発生エラーは、過去一定期間の平均が0であるため、障害発生検出部304は、前述の比率が計算できない(比率が+∞となる)。この場合、障害発生検出部304は、現時刻の発生エラー数が予め決められた一定数以上である場合に、障害が発生したと判定する。
続いて、障害箇所特定処理の詳細を、具体例を用いて説明する。
障害箇所特定部305は、繰り返しにより、下記の処理を、障害発生検出部304により障害が発生したと判定された全ての送信側アドレス/エラー番号の組み合わせ、及び障害発生検出部304により障害発生と判定された全ての受信側アドレス/エラー番号の組み合わせのそれぞれに対して実施する。ここでは、送信側アドレス/エラー番号が「X」/「400」の場合を例に、以降の処理を説明する。
まず、障害箇所特定部305は、障害発生と判定された「送信側アドレス」と「エラー番号」の組み合わせ又は障害発生と判定された「受信側アドレス」と「エラー番号」の組み合わせ毎に発生エラー数を経路毎に分計する。
障害箇所特定部305は、障害発生検出部304により障害発生が検出された送信側サーバ及び該送信側サーバが送信する発生エラーが含まれる経路、又は障害発生検出部304により障害発生が検出された受信側サーバ及び該受信側サーバが受信する発生エラーが含まれる経路に基づいて、障害箇所を特定すればよい。
以上、本実施形態の障害検出装置300は、統計情報を用いてSIP信号網の障害を検出するので、分析対象となるデータ量を削減して大規模網をリアルタイムに監視することができる。
また、本実施形態の障害検出装置300は、分析対象となるデータから個人情報を排除し、統計情報のみに基づいて障害を検出するので、セキュリティ面でも安全に運用することができる。
これにより、障害検出装置300は、エラーが発生しているSIPサーバを検出するだけでなく、サーバ型エラーの障害箇所かクライアント型エラーの障害箇所かを区分けして、障害箇所を特定することができる。
そのため、SIPサーバやエラー番号などにより異なる発生エラー数の特性が多様に混在している場合でも、障害検出装置300は、精度高く障害の発生を検出することができる。
そのため、SIPサーバやエラー番号などにより異なる発生エラー数の特性が多様に混在している場合でも、障害検出装置300は、精度高く障害箇所を特定することができる。
これによれば、障害発生検出部304は、エラー番号が混在した発生エラー数が時間的に変化しない場合でも、エラー番号毎に発生エラー数を集計することにより、障害発生を検出することができる。
これによれば、障害発生検出部304は、着番号が混在した発生エラー数が時間的に変化しない場合でも、着番号毎に発生エラー数を集計することにより、障害発生を検出することができる。
これによれば、障害発生検出部304は、該項目が混在した発生エラー数が時間的に変化しない場合でも、項目毎に発生エラー数を集計することにより、障害発生を検出することができる。
100 SIP信号網
200 SIP信号収集装置
300 障害検出装置
301 統計情報受信部
302 統計情報記憶部
303 発生エラー数推定部
304 障害発生検出部
305 障害箇所特定部
Claims (7)
- SIP信号の通信に関する統計情報に基づいて、SIPサーバ間の経路毎の発生エラー数を推定する発生エラー数推定部と、
前記推定された発生エラーを送信又は受信している経路数に基づいて、障害箇所を特定する障害箇所特定部と、
を備えることを特徴とする障害検出装置。 - 前記発生エラー数推定部は、あるSIPサーバが経路毎に受信及び送信したエラーの数と、該SIPサーバが経路毎に受信した正常呼の数とに基づいて、該SIPサーバが経路毎に送信した転送エラー数を算出し、該算出した転送エラー数と該SIPサーバが経路毎に送信したエラーの数とに基づいて、該SIPサーバが送信する前記発生エラー数を経路毎に推定することを特徴とする請求項1に記載の障害検出装置。
- 前記障害箇所特定部は、前記発生エラーを送信又は受信している経路数と該発生エラーの経路毎の送信数又は受信数とに基づいて、障害箇所を特定することを特徴とする請求項1又は請求項2に記載の障害検出装置。
- 前記推定された経路毎の発生エラー数に基づいて、SIP信号網における障害発生を検出する障害発生検出部を更に備えることを特徴とする請求項1から請求項3のいずれか一項に記載の障害検出装置。
- 前記障害発生検出部は、前記発生エラーに関連する項目毎に過去の発生エラー数を取得し、
前記障害発生検出部による障害発生の検出は、前記項目毎に現時刻の発生エラー数を集計し、該集計した項目毎の発生エラー数を対応する前記項目毎の過去の発生エラー数と比較することにより行われることを特徴とする請求項4に記載の障害検出装置。 - 障害検出装置が実行する障害検出方法であって、
SIP信号の通信に関する統計情報に基づいて、SIPサーバ間の経路毎の発生エラー数を推定する発生エラー数推定手順と、
前記推定された経路毎の発生エラー数に基づいて、SIP信号網における障害発生を検出する障害発生検出手順と、
を有することを特徴とする障害検出方法。 - コンピュータに、
SIP信号の通信に関する統計情報に基づいて、SIPサーバ間の経路毎の発生エラー数を推定する発生エラー数推定ステップと、
前記推定された経路毎の発生エラー数に基づいて、SIP信号網における障害発生を検出する障害発生検出ステップと、
を実行させることを特徴とする障害検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011160009A JP5624954B2 (ja) | 2011-07-21 | 2011-07-21 | 障害検出装置、障害検出方法及び障害検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011160009A JP5624954B2 (ja) | 2011-07-21 | 2011-07-21 | 障害検出装置、障害検出方法及び障害検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013026841A true JP2013026841A (ja) | 2013-02-04 |
JP5624954B2 JP5624954B2 (ja) | 2014-11-12 |
Family
ID=47784708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011160009A Expired - Fee Related JP5624954B2 (ja) | 2011-07-21 | 2011-07-21 | 障害検出装置、障害検出方法及び障害検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5624954B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015165636A (ja) * | 2014-03-03 | 2015-09-17 | 株式会社日立製作所 | 検出装置、検出方法、および検出プログラム |
CN111751705A (zh) * | 2020-06-18 | 2020-10-09 | 捷普电子(广州)有限公司 | 测试结果展示方法、装置及电子设备、存储介质 |
WO2020234992A1 (ja) * | 2019-05-21 | 2020-11-26 | 日本電信電話株式会社 | 呼制御システム、端末装置、呼制御装置、呼制御方法及び呼制御プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003115806A (ja) * | 2001-10-09 | 2003-04-18 | Kddi Corp | 障害リソース推定方法 |
JP2005149281A (ja) * | 2003-11-18 | 2005-06-09 | Hitachi Ltd | 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム |
WO2011058135A1 (en) * | 2009-11-12 | 2011-05-19 | Intune Networks Limited | Switch system and method for the monitoring of virtual optical paths in an optical burst switched (obs) communication network |
-
2011
- 2011-07-21 JP JP2011160009A patent/JP5624954B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003115806A (ja) * | 2001-10-09 | 2003-04-18 | Kddi Corp | 障害リソース推定方法 |
JP2005149281A (ja) * | 2003-11-18 | 2005-06-09 | Hitachi Ltd | 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム |
WO2011058135A1 (en) * | 2009-11-12 | 2011-05-19 | Intune Networks Limited | Switch system and method for the monitoring of virtual optical paths in an optical burst switched (obs) communication network |
JP2013511181A (ja) * | 2009-11-12 | 2013-03-28 | インチューン ネットワークス リミテッド | 光バースト交換式(OpticalBurstSwitched:OBS)通信ネットワークにおける仮想的光学経路の監視のためのスイッチシステム及び方法 |
Non-Patent Citations (1)
Title |
---|
CSNG201100769001; 山崎 公義 他: 'SIP信号の統計情報を用いた障害箇所切り分け手法' 電子情報通信学会技術研究報告 Vol.111 No.279, 20111103, p.1〜6, 社団法人電子情報通信学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015165636A (ja) * | 2014-03-03 | 2015-09-17 | 株式会社日立製作所 | 検出装置、検出方法、および検出プログラム |
WO2020234992A1 (ja) * | 2019-05-21 | 2020-11-26 | 日本電信電話株式会社 | 呼制御システム、端末装置、呼制御装置、呼制御方法及び呼制御プログラム |
CN111751705A (zh) * | 2020-06-18 | 2020-10-09 | 捷普电子(广州)有限公司 | 测试结果展示方法、装置及电子设备、存储介质 |
CN111751705B (zh) * | 2020-06-18 | 2023-04-07 | 捷普电子(广州)有限公司 | 测试结果展示方法、装置及电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5624954B2 (ja) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5430744B2 (ja) | 通信システムのリアルタイムの性能および負荷統計のためのシステムならびに方法 | |
US8243599B2 (en) | Method and apparatus for high resolution passive network latency measurement | |
US10616088B2 (en) | Apparatus and method for measurements at intermediate nodes in end-to-end performance test | |
US20080080390A1 (en) | Packet loss rate calculation system | |
JP5104738B2 (ja) | パケットロス率計測方法、パケットロス率計測装置、およびコンピュータプログラム | |
US9935861B2 (en) | Method, system and apparatus for detecting instant message spam | |
JP2002271833A (ja) | 移動通信システムにおけるサービスエリアの通信品質維持方法ならびにその移動通信端末装置、管理サーバシステム | |
CN103609160A (zh) | 用于自动自扰网络元件的消息流重新路由 | |
CN111034251A (zh) | 通过从通信会话中提取地理坐标来提高无线电网络中的服务质量 | |
CN108093427A (zh) | 一种VoLTE业务质量评估方法及系统 | |
CN110401965A (zh) | VoLTE语音质量拨测分析方法及系统 | |
JP5593944B2 (ja) | 判定装置、判定方法及びコンピュータプログラム | |
JP5624954B2 (ja) | 障害検出装置、障害検出方法及び障害検出プログラム | |
JP4761078B2 (ja) | マルチキャストノード装置とマルチキャスト転送方法ならびにプログラム | |
CN109963292B (zh) | 投诉预测的方法、装置、电子设备和存储介质 | |
US20140200041A1 (en) | Evaluation of overall performance of interactive application service | |
JP2015195530A (ja) | 通信行動分析装置 | |
TW201640867A (zh) | 通信裝置、可用頻寬計算系統、可用頻寬計算方法及程式 | |
WO2010052695A1 (en) | Method and apparatus for assessing communication quality | |
US8228813B2 (en) | Network quality measurement based on quality measurement packet | |
JP5008337B2 (ja) | コール制御サーバおよびその方法 | |
CN114710801A (zh) | 网络性能的测评参数的处理方法、装置、存储介质及设备 | |
CN110972199A (zh) | 一种流量拥塞监测方法及装置 | |
JP2016092656A (ja) | 品質劣化分析方法、品質劣化分析装置、及びネットワークシステム | |
JP2011188450A (ja) | ネットワーク監視装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140708 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5624954 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |