JP6586067B2 - Fault location device, fault location method, and fault location program - Google Patents

Fault location device, fault location method, and fault location program Download PDF

Info

Publication number
JP6586067B2
JP6586067B2 JP2016200537A JP2016200537A JP6586067B2 JP 6586067 B2 JP6586067 B2 JP 6586067B2 JP 2016200537 A JP2016200537 A JP 2016200537A JP 2016200537 A JP2016200537 A JP 2016200537A JP 6586067 B2 JP6586067 B2 JP 6586067B2
Authority
JP
Japan
Prior art keywords
oms
failure
component
detection
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016200537A
Other languages
Japanese (ja)
Other versions
JP2018064160A (en
Inventor
拓紀 伊達
拓紀 伊達
山本 宏
宏 山本
福田 亜紀
亜紀 福田
星平 鎌村
星平 鎌村
理恵 林
理恵 林
植松 芳彦
芳彦 植松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016200537A priority Critical patent/JP6586067B2/en
Publication of JP2018064160A publication Critical patent/JP2018064160A/en
Application granted granted Critical
Publication of JP6586067B2 publication Critical patent/JP6586067B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、故障位置特定装置、故障位置特定方法、および、故障位置特定プログラムに関する。   The present invention relates to a failure location specifying device, a failure location specifying method, and a failure location specifying program.

光伝送装置やルータなどの通信機器の大容量化、汎用部品の活用の増加、FPGA(field-programmable gate array)などのプロセス微細化により、ソフトエラーが発生しやすいメモリ(SRAM(Static Random Access Memory)など)を大量に搭載するプログラマブルデバイスなどが多く活用されている。その結果、通信機器、および、通信機器の接続からなるネットワークの監視の技術において、通信機器の故障要因の多様化と故障時の影響の大規模化が進む傾向にある。   Memory (SRAM (Static Random Access Memory)) is prone to soft errors due to increased capacity of communication equipment such as optical transmission devices and routers, increased use of general-purpose components, and process miniaturization such as field-programmable gate arrays (FPGAs). ) Etc.) are widely used. As a result, communication technology and network monitoring technology consisting of connection of communication devices tend to diversify the failure factors of communication devices and increase the scale of the impact at the time of failure.

この傾向により、光伝送装置からなる光トランスポートレイヤなどの下位レイヤにおいていわゆる間欠故障やサイレント故障といった故障が発現するケースが増加することが見込まれる。つまり、下位レイヤ上の故障は明確な警報として検出されないが、光トランスポートレイヤに収容されるルータからなるL3レイヤや、更にそのL3レイヤに収容される各ユーザのサービスレイヤなどの上位レイヤにおいて断続的に通信品質やスループットが低下するケースが増加することが見込まれる。   Due to this tendency, it is expected that cases such as so-called intermittent failures and silent failures will appear in lower layers such as an optical transport layer composed of an optical transmission apparatus. In other words, a failure on the lower layer is not detected as a clear alarm, but is intermittent in the upper layer such as the L3 layer composed of routers accommodated in the optical transport layer and the service layer of each user accommodated in the L3 layer. In particular, it is expected that cases in which communication quality and throughput will decrease will increase.

上記のケースに対して、例えば、各レイヤの通信機器から取得する性能情報の種別や、取得の頻度を増やし、きめ細かに状態を監視することで監視機能自体を強化する対策が考えられる。しかし、先述した故障要因の多様化のために、このような対策は、全てのケースに対処することは難しく、明確な警報として検出できずに上位レイヤの通信品質に影響を及ぼすケースは依然として残る。そのため、上位レイヤに発現する通信品質やスループットの低下を契機に故障または故障予兆の位置を特定し早期の対処を可能とする技術の必要性が高まっている。   For the above case, for example, a measure for enhancing the monitoring function itself by increasing the type of performance information acquired from the communication devices of each layer and the frequency of acquisition and monitoring the state in detail. However, due to the diversification of the failure factors described above, it is difficult to deal with all such cases, and there are still cases in which the upper layer communication quality cannot be detected as a clear alarm. . For this reason, there is an increasing need for a technology that can identify the location of a failure or a failure sign and enable early countermeasures in response to a decrease in communication quality and throughput that appears in the upper layer.

また、下位レイヤの間欠故障やサイレント故障を検出する方法として、例えば、L3レイヤに対するMIB(Management Information Base)トラヒック監視によって、急激なトラヒックの減少(または増加)を判定する閾値を設定する方法が知られている。しかし、非特許文献1によれば、故障の検出漏れや誤検出を極力抑えるように閾値を設定することは困難であるとされている。   In addition, as a method for detecting an intermittent failure or a silent failure in a lower layer, for example, a method for setting a threshold value for determining a sudden decrease (or increase) in traffic by monitoring MIB (Management Information Base) traffic for the L3 layer is known. It has been. However, according to Non-Patent Document 1, it is difficult to set a threshold value so as to suppress failure detection failure and false detection as much as possible.

一般的には、故障の影響が上位レイヤの通信品質に漏れ出た状態においては、その上位レイヤが収容される通信路上の通信機器の全てが、故障の被疑箇所となることから広範に亘る。また、通信品質やスループットの低下は検出漏れや誤検出を伴う確率的な情報である。非特許文献2によれば、3割程度の高確率で検出漏れが発生し得るとされている。これらの事情から、一意に故障箇所を特定することは難しい。   In general, in a state where the influence of the failure leaks to the communication quality of the upper layer, all communication devices on the communication path in which the upper layer is accommodated are widespread because they become suspected locations of the failure. In addition, a decrease in communication quality and throughput is probabilistic information accompanied by a detection failure or erroneous detection. According to Non-Patent Document 2, it is assumed that detection failure can occur with a high probability of about 30%. From these circumstances, it is difficult to uniquely identify the failure location.

そこで、収容関係にある複数のレイヤ間での情報流通や連携動作を可能とすることで、上位レイヤの通信品質低下情報から、下位レイヤの被疑範囲内にある通信機器の状態を順次確認して故障箇所を一意に特定する方法が考えられる。しかし、このような方法は、通信機器の性能情報を過去にまで遡り時間経過とともに確認する必要があることから、故障位置を特定するために多大な稼働および時間を要する。   Therefore, by enabling information distribution and collaborative operation between multiple layers in the accommodation relationship, the status of communication devices within the suspected range of the lower layer is sequentially confirmed from the communication quality degradation information of the upper layer. A method for uniquely identifying the failure location is conceivable. However, such a method requires a great amount of operation and time to identify the fault location because it is necessary to check the performance information of the communication device in the past and confirm it over time.

石橋 圭介、林 孝典、塩本 公平、“機械学習・データ分析によるネットワーク設計・運用高度化” NTT技術ジャーナル 2015.12Keisuke Ishibashi, Takanori Hayashi, Hiroshi Shiomoto, “Advanced Network Design and Operation by Machine Learning and Data Analysis” NTT Technical Journal 2015.12 Yongning Tang, Ehab Al-Shaer, Kaustubh Joshi, "Reasoning under Uncertainty for Overlay Fault Diagnosis," IEEE Trans. on Network and Service Management, Volume 9, Issue 1, March 2012.Yongning Tang, Ehab Al-Shaer, Kaustubh Joshi, "Reasoning under Uncertainty for Overlay Fault Diagnosis," IEEE Trans. On Network and Service Management, Volume 9, Issue 1, March 2012.

このような事情に鑑みて、本発明は、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定するための稼働を削減することを課題にする。   In view of such circumstances, it is an object of the present invention to reduce the operation for specifying the position of a failure that has occurred in a lower layer with respect to abnormality detection in an upper layer.

前記した課題を解決するため、請求項1に記載の発明は、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定する故障位置特定装置であって、前記下位レイヤの機器がコンポーネント単位に分類されており、前記下位レイヤのコンポーネントごとに、前記上位レイヤの異常検出を、1または複数種類のパラメータに換算し、前記換算したパラメータを用いて故障が発生したコンポーネントを推定する制御部、を備える、ことを特徴とする。   In order to solve the above-described problem, the invention according to claim 1 is a failure location identifying device that identifies a location of a failure that has occurred in a lower layer with respect to abnormality detection in an upper layer, wherein the lower layer device is a component A control unit that is classified into units, converts the abnormality detection of the upper layer into one or more types of parameters for each component of the lower layer, and estimates a component in which a failure has occurred using the converted parameters , Comprising.

また、請求項7に記載の発明は、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定する故障位置特定装置における故障位置特定方法であって、前記下位レイヤの機器がコンポーネント単位に分類されており、前記故障位置特定装置が、前記下位レイヤのコンポーネントごとに、前記上位レイヤの異常検出を、1または複数種類のパラメータに換算するステップと、前記換算したパラメータを用いて故障が発生したコンポーネントを推定するステップと、を実行する、ことを特徴とする。   The invention according to claim 7 is a failure location specifying method in a failure location specifying device for specifying a location of a failure that has occurred in a lower layer with respect to abnormality detection in an upper layer, wherein the lower layer device is a component unit The failure location device converts the upper layer abnormality detection into one or more types of parameters for each component of the lower layer, and a failure is detected using the converted parameters. Performing the step of estimating the generated component.

また、請求項8に記載の発明は、コンピュータを、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定する故障位置特定装置として機能させるための故障位置特定プログラムであって、前記下位レイヤの機器がコンポーネント単位に分類されており、前記コンピュータを、前記下位レイヤのコンポーネントごとに、前記上位レイヤの異常検出を、1または複数種類のパラメータに換算し、前記換算したパラメータを用いて故障が発生したコンポーネントを推定する制御手段、として機能させるための故障位置特定プログラムである。   The invention according to claim 8 is a failure location specifying program for causing a computer to function as a failure location specifying device for specifying a location of a failure that has occurred in a lower layer with respect to abnormality detection in an upper layer, Lower layer devices are classified into components, and the computer converts the upper layer abnormality detection into one or more types of parameters for each lower layer component, and uses the converted parameters. It is a fault location specifying program for functioning as a control means for estimating a component in which a fault has occurred.

請求項1,7,8に記載の発明によれば、確率的に発現し、下位レイヤの故障位置の特定を元々困難にしている上位レイヤの異常検出から、下位レイヤのコンポーネント単位でのパラメータの分布を求めることができる。このような分布でパラメータが極端な値を示すコンポーネントを見つけることができ、見つけたコンポーネントを故障が発生したコンポーネントと推定することができる。これにより、下位レイヤの故障の被疑範囲を絞り込むことができる。換言すれば、下位レイヤの故障の位置を最終的に特定するために多大な負担を伴う詳細分析を行う対象を効率的に絞り込むことができる。
したがって、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定するための稼働を削減することができる。
According to the first, seventh, and eighth aspects of the present invention, it is possible to detect the parameter in the component unit of the lower layer from the abnormality detection of the upper layer that is stochastically expressed and originally makes it difficult to identify the failure position of the lower layer. Distribution can be obtained. A component having an extreme value in the parameter can be found in such a distribution, and the found component can be estimated as a component in which a failure has occurred. Thereby, the suspected range of the failure of the lower layer can be narrowed down. In other words, it is possible to efficiently narrow down the target for performing detailed analysis with a great burden in order to finally specify the position of the failure in the lower layer.
Therefore, it is possible to reduce the operation for specifying the position of the failure that has occurred in the lower layer with respect to the abnormality detection of the upper layer.

また、請求項2に記載の発明は、請求項1に記載の故障位置特定装置であって、前記制御部は、前記故障の位置特定に関して、前記パラメータの値に応じて前記下位レイヤのコンポーネントの各々を順位付けする、ことを特徴とする。   The invention according to claim 2 is the fault location apparatus according to claim 1, wherein the control unit is configured to determine a component of the lower layer according to a value of the parameter regarding the location of the fault. Each is ranked.

請求項2に記載の発明によれば、複数のコンポーネントを対象にして、詳細分析を優先的に行うコンポーネントを決定することができる。このため、優先順位の高いコンポーネントから順に詳細分析を行うことで、下位レイヤの故障の位置の特定するための稼働をさらに削減することができる。   According to the second aspect of the present invention, it is possible to determine a component for which a detailed analysis is preferentially performed for a plurality of components. For this reason, by performing detailed analysis in order from the component with the highest priority, it is possible to further reduce the operation for specifying the position of the failure in the lower layer.

また、請求項3に記載の発明は、請求項1または請求項2に記載の故障位置特定装置であって、前記パラメータは、(1)前記コンポーネントの各々が収容する前記上位レイヤの機器を経由するパスのうち、前記異常検出があったパスの数となる、コンポーネント単位の検出数、(2)前記コンポーネントの各々が収容する前記上位レイヤの機器を経由するパスの数である収容数と、前記検出数との比となる、コンポーネント単位の検出率、(3)前記コンポーネントの各々に属する前記下位レイヤの機器の過去の故障から求められる、コンポーネント単位の故障率、(4)前記故障率に基づいて、前記異常検出に対し、前記コンポーネントの各々に属する前記下位レイヤの機器の故障していない確率である、コンポーネント単位の故障していない率、(5)前記上位レイヤのパスの各々に対応するコンポーネント数の逆数を用いて前記検出数の重み付けした、コンポーネント単位の重み付け検出数、のいずれかである、ことを特徴とする。   The invention according to claim 3 is the fault location apparatus according to claim 1 or 2, wherein the parameter is (1) routed through the upper layer device accommodated by each of the components. Among the paths to be detected, the number of detections in component units, which is the number of paths in which the anomaly has been detected, (2) the number of accommodations that is the number of paths that pass through the higher-layer equipment that each of the components accommodates, The detection rate in component units, which is a ratio to the number of detections, (3) the failure rate in component units determined from past failures in the lower layer devices belonging to each of the components, and (4) the failure rate On the basis of the abnormality detection, the failure of the component unit, which is the probability that the lower layer device belonging to each of the components has not failed No rate, (5) said corresponding to each of the upper layer of paths using the reciprocal of the number of components and weight of the detection number, weighting the number of detected per component, is either, characterized in that.

請求項3に記載の発明によれば、下位レイヤのコンポーネント単位での各種類のパラメータの分布を数値化することができる。よって、パラメータが極端な値を示すコンポーネントを容易に見つけることができる。   According to the third aspect of the present invention, the distribution of each type of parameter in the component unit of the lower layer can be quantified. Therefore, it is possible to easily find a component whose parameter shows an extreme value.

また、請求項4に記載の発明は、請求項1から請求項3のいずれか1項に記載の故障位置特定装置であって、前記パラメータが複数種類あり、前記制御部は、前記パラメータを複数種類組み合わせて故障が発生したコンポーネントを推定する場合、前記組み合わせた複数種類のパラメータの各々に優先度を付与し、前記優先度の高いパラメータから前記推定を実行する、ことを特徴とする。   The invention according to claim 4 is the fault location device according to any one of claims 1 to 3, wherein there are a plurality of types of the parameters, and the control unit sets the parameters to a plurality of types. When estimating a component in which a failure has occurred by combining types, a priority is given to each of the plurality of types of combined parameters, and the estimation is executed from the parameters having a high priority.

請求項4に記載の発明によれば、複数種類のパラメータを用いて、故障が発生したコンポーネントの推定を実現することができる。   According to the invention described in claim 4, it is possible to realize estimation of a component in which a failure has occurred using a plurality of types of parameters.

また、請求項5に記載の発明は、請求項1から4のいずれか1項に記載の故障位置特定装置であって、前記制御部は、前記推定したコンポーネントに故障が無かった場合、当該推定したコンポーネントの近傍のコンポーネントに故障が発生したと推定する、ことを特徴とする。   The invention according to claim 5 is the fault location apparatus according to any one of claims 1 to 4, wherein the control unit estimates the estimation when there is no fault in the estimated component. It is estimated that a failure has occurred in a component in the vicinity of the selected component.

請求項5に記載の発明によれば、下位レイヤの故障が発生したと推定したコンポーネントの近傍のコンポーネントを優先して詳細分析を行うことができる。   According to the fifth aspect of the present invention, detailed analysis can be performed with priority given to components in the vicinity of the component estimated to have a failure in the lower layer.

また、請求項6に記載の発明は、請求項1から請求項5のいずれか1項に記載の故障位置特定装置であって、前記制御部は、前記異常検出があった上位レイヤのパスの各々について、当該パスの各々に対応するコンポーネントに基づいて、前記パス間の類似度を評価し、前記類似度が小さいパスでの異常検出を誤検出として除去する、ことを特徴とする。   The invention according to claim 6 is the fault location apparatus according to any one of claims 1 to 5, wherein the control unit is configured to detect a path of a higher layer where the abnormality is detected. For each, a similarity between the paths is evaluated based on a component corresponding to each of the paths, and abnormality detection in a path with a small similarity is removed as a false detection.

請求項6に記載の発明によれば、誤検出を除去した上で、下位レイヤのコンポーネント単位でのパラメータの分布を求めることができる。このため、下位レイヤの故障の被疑範囲の絞り込みの精度を向上させることができる。   According to the sixth aspect of the invention, it is possible to obtain the parameter distribution in the component unit of the lower layer after removing the false detection. For this reason, it is possible to improve the accuracy of narrowing down the suspected range of failure in the lower layer.

本発明によれば、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定するための稼働を削減することができる。   ADVANTAGE OF THE INVENTION According to this invention, the operation | movement for pinpointing the position of the failure which generate | occur | produced in the lower layer with respect to the abnormality detection of an upper layer can be reduced.

面的分析の対象となる通信システムの構成図の例である。It is an example of the block diagram of the communication system used as the object of surface analysis. (a)が、通信システムの簡略構成図であり、(b)が、OMSごとの確認順の決定に関する表である。(A) is a simplified configuration diagram of a communication system, and (b) is a table regarding determination of confirmation order for each OMS. 本実施形態における故障位置特定装置の機能構成図の例である。It is an example of a functional block diagram of the failure position specific device in this embodiment. 確認順の決定に関して、検出数が有効であるケース(a)、検出率が有効であるケース(b)、近傍情報が有効であるケース(c)、をそれぞれ説明する図である。It is a figure explaining the case (a) where the number of detection is effective, the case (b) where the detection rate is effective, and the case (c) where the neighborhood information is effective regarding the determination of the confirmation order. (a)が、通信システムの簡略構成図であり、(b)が、故障率を用いた確認順の決定に関する表である。(A) is a simplified configuration diagram of a communication system, and (b) is a table relating to determination of confirmation order using a failure rate. (a)が、通信システムの簡略構成図であり、(b)が、故障していない率を用いた確認順の決定に関する表である。(A) is a simplified configuration diagram of a communication system, and (b) is a table relating to determination of a confirmation order using a non-failure rate. (a)が、通信システムの簡略構成図であり、(b)が、重みづけされた検出数を用いた確認順の決定に関する表である。(A) is a simplified configuration diagram of a communication system, and (b) is a table relating to determination of confirmation order using weighted detection numbers. (a)が、通信システムの簡略構成図であり、(b)が、複数種類のパラメータの組み合わせを用いた確認順の決定に関する表である。(A) is a simplified configuration diagram of a communication system, and (b) is a table relating to determination of confirmation order using a combination of a plurality of types of parameters. (a)が、通信システムの簡略構成図であり、(b)が、誤検出の判定に関する表であり、(c)が、誤検出と判定したOMSの除去を反映させたときの確認順の決定に関する表である。(A) is a simplified configuration diagram of the communication system, (b) is a table relating to determination of erroneous detection, and (c) is a confirmation order when reflecting the removal of OMS determined to be erroneous detection. It is a table about a decision.

≪概要≫
本発明の実施形態について、図面を参照しながら詳細に説明する。
本実施形態では、監視対象のネットワークの下位レイヤに配置されている機器のうち1または複数をまとめて扱うコンポーネントを複数用意し、下位レイヤの機器をコンポーネント単位で予め分類する。そして、本実施形態では、通信品質低下やスループット低下など、といった上位レイヤでの異常の検出を、下位レイヤのコンポーネントごとの検出に換算し、コンポーネント単位の検出の分布を分析する面的分析を採用する。この面的分析によって、検出数または検出率が極端に多いコンポーネントを特定して被疑範囲を絞り込む。
≪Overview≫
Embodiments of the present invention will be described in detail with reference to the drawings.
In the present embodiment, a plurality of components that collectively handle one or a plurality of devices arranged in a lower layer of a monitoring target network are prepared, and lower layer devices are classified in advance in units of components. In this embodiment, an area analysis that analyzes the distribution of detection in units of components by converting the detection of abnormalities such as communication quality degradation and throughput degradation into detection for each component in the lower layer is adopted. To do. This area analysis narrows down the suspicion range by identifying components with extremely high detection counts or detection rates.

その後、特定したコンポーネントに属する機器について詳細分析を行うことで、異常を引き起こす故障の位置を最終的に特定する。本発明は、面的分析による被疑範囲の絞り込みの効率化を図るものである。機器ごとの詳細分析は、周知の分析を採用することができ、その説明は省略する。   After that, a detailed analysis is performed on the devices belonging to the identified component, thereby finally identifying the position of the failure that causes the abnormality. The present invention is intended to improve the efficiency of narrowing down the suspected range by area analysis. As the detailed analysis for each device, a well-known analysis can be adopted, and the description thereof is omitted.

コンポーネントの定め方は任意であり、例えば、下位レイヤの機器1つとしてもよいし、すべてとしてもよいが、本実施形態では、コンポーネントをOMS(Optical Multiplex Section)とし、OMS単位の面的分析について説明する。OMSは、波長多重化された光信号の論理的な通信路(パスまたはコネクション)を表す。OMSは、OXC(Optical Cross Connect)ノードやAdd/Dropノードにおいて、波長多重信号が合分波し終端されるという性質を持つ。   The method of determining the component is arbitrary. For example, the component may be one lower layer device or all of the devices. However, in this embodiment, the component is an OMS (Optical Multiplex Section) and the area analysis is performed in units of OMS. explain. OMS represents a logical communication path (path or connection) of a wavelength-multiplexed optical signal. OMS has the property that wavelength multiplexed signals are multiplexed / demultiplexed and terminated at an OXC (Optical Cross Connect) node or an Add / Drop node.

1つのOMSの区間内で収容している上位レイヤの機器は同じとなり、収容関係は変化しない。一方、複数のOMS間では、各OMSの区間内で収容している上位レイヤの機器が異なり、収容関係が変化する。このようなOMSは、収容関係が変化しない最大の単位として扱うことができるとともに、収容関係を把握すべき最小の単位として扱うことができる。このような扱いが可能なため、コンポーネントをOMSとすることが好ましい。   The upper layer devices accommodated in one OMS section are the same, and the accommodation relationship does not change. On the other hand, between a plurality of OMSs, upper layer devices accommodated in each OMS section differ, and the accommodation relationship changes. Such an OMS can be handled as the maximum unit in which the accommodation relationship does not change, and can be handled as the minimum unit for which the accommodation relationship should be grasped. Since such a handling is possible, the component is preferably an OMS.

本実施形態の面的分析の対象となる通信システムの構成は、図1に示す通りである。この構成は1例であって、面的分析が適用される構成は図1のものに限定されない。
図1の通信システムは、L0/L1網、L2/L1.5網、L3網、および、サービス網の各々に配置される機器群から構成されている。L0/L1網は、下位レイヤである。L2/L1.5網、L3網、および、サービス網は、上位レイヤであり、この順番でより上位となる。
The configuration of the communication system that is the subject of the area analysis of the present embodiment is as shown in FIG. This configuration is an example, and the configuration to which the area analysis is applied is not limited to that shown in FIG.
The communication system shown in FIG. 1 is composed of a group of devices arranged in each of the L0 / L1 network, the L2 / L1.5 network, the L3 network, and the service network. The L0 / L1 network is a lower layer. The L2 / L1.5 network, the L3 network, and the service network are upper layers, and are higher in this order.

L0/L1網に配置されている機器について説明する。符号11〜14は、例えば、OXC(OXCノード)である。符号51〜54は、例えば、REP(Repeater:リピータ)である。符号61〜64は、例えば、トラポン(トランスポンダ)である。符号1a〜1dは、例えば、MUX(Multiplexer)/DMUX(Demultiplexer)であるが、CDC(Colorless Directionless Contentionless)機器としてもよい。符号2a〜2hは、例えば、WSS(Wavelength Selective Switch)である。符号3a〜3pは、例えば、AMP(Amplifier)である。MUX(Multiplexer)/DMUX(1a〜1d)と、WSS(2a〜2h)と、AMP(3a〜3p)とは、光ファイバで接続されている。   A device arranged in the L0 / L1 network will be described. Reference numerals 11 to 14 are, for example, OXC (OXC node). Reference numerals 51 to 54 are, for example, REP (Repeater). Reference numerals 61 to 64 are, for example, trapons (transponders). Reference numerals 1a to 1d are, for example, MUX (Multiplexer) / DMUX (Demultiplexer), but may be a CDC (Colorless Directionless Contentionless) device. Reference numerals 2a to 2h are, for example, WSS (Wavelength Selective Switch). Reference numerals 3a to 3p are, for example, AMP (Amplifier). MUX (Multiplexer) / DMUX (1a-1d), WSS (2a-2h), and AMP (3a-3p) are connected by an optical fiber.

L2/L1.5網に配置されている機器について説明する。符号21〜24は、例えば、MPLS−TP(Multi-Protocol Label Switching-Transport Profile)装置である。
L3網に配置されている機器について説明する。符号31〜34は、例えば、ルータである。ルータ31〜34は、トラヒック監視用のトラヒックMIBを記憶している。
サービス網に配置されている機器について説明する。符号41〜46は、例えば、サーバである。
A device arranged in the L2 / L1.5 network will be described. Reference numerals 21 to 24 are, for example, MPLS-TP (Multi-Protocol Label Switching-Transport Profile) devices.
A device arranged in the L3 network will be described. Reference numerals 31 to 34 are routers, for example. The routers 31 to 34 store a traffic MIB for traffic monitoring.
A device arranged in the service network will be described. Reference numerals 41 to 46 are servers, for example.

図1の構成において、OXC11,12間の機器は、1つのコンポーネントを形成し、OMS A(または、単に「A」)と呼ぶことにする。OXC12,13間の機器は、1つのコンポーネントを形成し、OMS B(または、単に「B」)と呼ぶことにする。OXC13,14間の機器は、1つのコンポーネントを形成し、OMS C(または、単に「C」)と呼ぶことにする。OXC12,14間の機器は、1つのコンポーネントを形成し、OMS D(または、単に「D」)と呼ぶことにする。   In the configuration of FIG. 1, the device between the OXCs 11 and 12 forms one component and is referred to as OMS A (or simply “A”). The equipment between OXCs 12 and 13 forms one component and will be referred to as OMS B (or simply “B”). The equipment between OXCs 13 and 14 forms one component and will be referred to as OMS C (or simply “C”). The equipment between OXCs 12 and 14 forms one component and will be referred to as OMS D (or simply “D”).

図1に示すように、L3網上にパス[1]〜[3]が設定されている。パス[1]〜[3]は、通信システムの管理者が適宜設定したものであり、設定態様はこれに限定されない。パス[1]は、ルータ31〜34を経由する論理的な通信路である。パス[2]は、ルータ32〜34を経由する論理的な通信路である。パス[3]は、ルータ31〜33を経由する論理的な通信路である。   As shown in FIG. 1, paths [1] to [3] are set on the L3 network. The paths [1] to [3] are appropriately set by the administrator of the communication system, and the setting mode is not limited to this. The path [1] is a logical communication path that passes through the routers 31 to 34. The path [2] is a logical communication path that passes through the routers 32 to 34. The path [3] is a logical communication path that passes through the routers 31 to 33.

L3網上のパス[1]〜[3]の各々に対して、パス[1]〜[3]が経由する機器を収容するL0/L1網上の機器を経由するパス(下位レイヤパス)が設定される。図1には、L0/L1網上に設定されている3つのパスが、L2/L1.5網上の該当の機器を介在して図示されている。図1にて、L3網上のパス[1]〜[3]に対応するL0/L1網上のパスはそれぞれ、L3網上のパス[1]〜[3]を描く線の線種(太実線、太破線、太い一点鎖線)と同じ線種で描かれている。   For each of the paths [1] to [3] on the L3 network, a path (lower layer path) that passes through the device on the L0 / L1 network that accommodates the device through which the paths [1] to [3] pass is set. Is done. In FIG. 1, three paths set on the L0 / L1 network are illustrated with the corresponding devices on the L2 / L1.5 network interposed. In FIG. 1, the paths on the L0 / L1 network corresponding to the paths [1] to [3] on the L3 network are line types (thick lines) for drawing the paths [1] to [3] on the L3 network, respectively. It is drawn with the same line type as a solid line, a thick broken line, and a thick dashed line.

同様に、L3網上のパス[1]〜[3]の各々に対して、パス[1]〜[3]が経由する機器が収容するサービス網上の機器を経由するパスが設定される。図1には、サービス網上に設定されている3つのパスが図示されている。図1にて、L3網上のパス[1]〜[3]に対応するサービス網上のパスはそれぞれ、L3網上のパス[1]〜[3]を描く線の線種(太実線、太破線、太い一点鎖線)と同じ線種で描かれている。   Similarly, for each of the paths [1] to [3] on the L3 network, a path passing through a device on the service network accommodated by a device via which the paths [1] to [3] pass is set. FIG. 1 shows three paths set on the service network. In FIG. 1, the paths on the service network corresponding to the paths [1] to [3] on the L3 network are the line types (thick solid lines and lines) for drawing the paths [1] to [3] on the L3 network, respectively. It is drawn with the same line type as a thick broken line and a thick dashed line).

図1の構成によれば、パス[1]を収容するコンポーネントは、OMS A,B,Cである。パス[2]を収容するコンポーネントは、OMS B,Cである。パス[3]を収容するコンポーネントは、OMS A,Bである。このように、L3網上のパスの各々を収容するOMS(群)は、一意に定まる。   According to the configuration of FIG. 1, the components that accommodate the path [1] are OMS A, B, and C. Components that contain the path [2] are OMS B and C. Components that contain the path [3] are OMS A and B. Thus, the OMS (group) that accommodates each path on the L3 network is uniquely determined.

下位レイヤ、つまり、L0/L1網上で、間欠故障やサイレント故障などの故障が発生した場合、上位レイヤのL3網上に設定されたパス[1]〜[3]にて、例えば、MIB閾値監視によるトラヒック減などの異常が確率的に検出される。また、故障が発生した場合、上位レイヤのサービス網上に設定されたパスにて、例えば、トラヒック減を示唆するユーザ申告によって異常が検出される。ユーザ申告は、トラヒック減があったときに確実になされるものではなく、また、意図的であるか否かに関わらず誤申告となる場合もある。このため、ユーザ申告による異常検出も確率的であるといえる。   When a failure such as an intermittent failure or a silent failure occurs on the lower layer, that is, the L0 / L1 network, for example, the MIB threshold is set on the paths [1] to [3] set on the L3 network of the upper layer. Abnormalities such as traffic reduction due to monitoring are detected probabilistically. Further, when a failure occurs, an abnormality is detected by, for example, a user report that suggests a decrease in traffic on a path set on the upper layer service network. The user report is not surely made when there is a decrease in traffic, and may be erroneously reported regardless of whether it is intentional or not. For this reason, it can be said that the abnormality detection by a user report is also probabilistic.

このように検出された上位レイヤ上の異常は、OMS単位に換算した異常の検出数、検出率などの分布として表現することができる。本実施形態の故障位置特定装置は、この検出数、検出率などが高い値を示すOMSを特定し優先的に詳細分析を行う。   The anomalies on the upper layer detected in this way can be expressed as a distribution of the number of detected anomalies converted to OMS units, a detection rate, and the like. The fault location apparatus of this embodiment specifies an OMS that shows a high value for the number of detections, detection rate, etc., and performs detailed analysis with priority.

検出数、検出率などが高い値を示すOMSを特定する方法について、図2を参照して、詳細に説明する。図2(a)に示すように、OMS B(に属する特定の機器)に故障が発生したとする。この場合、MIB閾値監視によって、OMS Bが収容するL3網上の機器(つまり、ルータ32,33)を経由するパス[1]〜[3]に、トラヒック減などの異常が検出される。   A method for identifying an OMS that shows a high value such as the number of detections and a detection rate will be described in detail with reference to FIG. As shown in FIG. 2A, it is assumed that a failure has occurred in OMS B (a specific device belonging to OMS B). In this case, the MIB threshold value monitoring detects an abnormality such as a decrease in traffic in the paths [1] to [3] passing through the devices (that is, the routers 32 and 33) on the L3 network accommodated by the OMS B.

本実施形態の故障位置特定装置は、パス[1]〜[3]での異常検出を、各OMS単位に換算する。具体的には、パス[1]の異常検出は、当該パス[1]が経由する機器を収容するOMS A,B,Cの各々で発生したと疑われる故障に起因する異常検出としてカウントする。同様に、パス[2]の異常検出は、当該パス[2]が経由する機器を収容するOMS B,Cの各々で発生したと疑われる故障に起因する異常検出としてカウントする。パス[3]の異常検出は、当該パス[3]が経由する機器を収容するOMS A,Bの各々で発生したと疑われる故障に起因する異常検出としてカウントする。   The failure location device of this embodiment converts the abnormality detection in the paths [1] to [3] into each OMS unit. Specifically, the abnormality detection of the path [1] is counted as an abnormality detection caused by a failure suspected to have occurred in each of the OMS A, B, and C that accommodates the device through which the path [1] passes. Similarly, the abnormality detection of the path [2] is counted as an abnormality detection caused by a failure suspected to have occurred in each of the OMS B and C that accommodate the device through which the path [2] passes. The abnormality detection of the path [3] is counted as an abnormality detection caused by a failure suspected to have occurred in each of the OMSs A and B that accommodate the devices through which the path [3] passes.

パス[1]〜[3]でカウントした異常検出から、コンポーネント単位の検出数を求める。つまり、各OMS A〜Dで、異常検出のカウントが何回なされたかを集計する。OMS Aについては、パス[1]、[3]の2つの異常検出をカウントするため、OMS Aの検出数は2である。OMS Bについては、パス[1]〜[3]の3つの異常検出をカウントするため、OMS Bの検出数は3である。OMS Cについては、パス[1]、[2]の2つの異常検出をカウントするため、OMS Bの検出数は2である。なお、L3網上には、OMS Dが収容する機器にパスが元々設定されていないため、異常検出のカウントはされず、OMS Dの検出数は0である。   From the abnormality detection counted in the paths [1] to [3], the number of detected components is obtained. That is, how many times the abnormality detection is counted in each OMS A to D is totalized. For OMS A, the number of detections of OMS A is 2 because the two abnormal detections of paths [1] and [3] are counted. For OMS B, the number of detections of OMS B is 3 because the three abnormal detections of paths [1] to [3] are counted. For OMS C, the number of detections of OMS B is 2 in order to count the two abnormal detections of paths [1] and [2]. On the L3 network, since no path is originally set for the device accommodated by OMS D, abnormality detection is not counted, and the number of detected OMS D is zero.

OMSごとの異常検出の集計結果は、図2(b)の表(後記の確認順情報3b(図3)に相当)に示されている。図2(b)の表には、「コンポーネント」、「収容数」、「検出数」、「検出率」、「近傍コンポーネント」、「故障率」、「確認順」といった項目が設けられている。   The tabulated results of abnormality detection for each OMS are shown in the table of FIG. 2B (corresponding to confirmation order information 3b (FIG. 3) described later). In the table of FIG. 2B, items such as “component”, “accommodation number”, “detection number”, “detection rate”, “neighboring component”, “failure rate”, and “confirmation order” are provided. .

「コンポーネント」は、故障発生の被疑範囲を示す単位であり、本実施形態ではOMSごとに用意される。
「収容数」は、対象のコンポーネントが収容するL3網上の機器を経由するパス(全体でもよいし一部でもよい)の数である。各コンポーネントが収容するL3網上の機器に設定されている接続(コネクション)の数(収容L3接続数)ともいえる。図2(a)に描かれている矢印は、L3網上のパスと、当該パスが経由する機器を収容するOMSとの関係を示す。各OMSの収容数は、自身のOMSに到達する矢印の本数に等しい。
The “component” is a unit indicating a suspected range of occurrence of a failure, and is prepared for each OMS in the present embodiment.
The “accommodation number” is the number of paths (all or part of the paths) that pass through the devices on the L3 network accommodated by the target component. It can also be said that the number of connections (the number of accommodated L3 connections) set in the devices on the L3 network accommodated by each component. The arrows depicted in FIG. 2A indicate the relationship between the path on the L3 network and the OMS that accommodates the device through which the path passes. The accommodation number of each OMS is equal to the number of arrows that reach its own OMS.

「検出数」は、対象のコンポーネントが収容するL3網上の機器を経由するパス(全体でもよいし一部でもよい)のうち異常が検出されたパスの数である。
「検出率」は、対象のコンポーネントについて、検出数を収容数で除算した値(パーセント表示)である。
The “number of detections” is the number of paths in which an abnormality is detected among paths (may be all or part) that pass through devices on the L3 network accommodated by the target component.
The “detection rate” is a value (percent display) obtained by dividing the number of detections by the number of accommodations for the target component.

「近傍コンポーネント」は、対象のコンポーネントに隣接するコンポーネントをいう。隣接コンポーネントについては後記する。
「故障率」は、対象のコンポーネントに属する(下位レイヤの)機器にて故障が発生する確率である。コンポーネントの各々に属する下位レイヤの機器の過去の故障から求められる、コンポーネント単位の確率であるともいえる。コンポーネント単位の「故障率」については後記するが、所定の計算式で適宜求めることができる。機器に故障が発生するたびに故障率が更新される。故障が多いほど、故障率の値は大きくなるとする。
“Neighboring components” refers to components adjacent to the target component. The adjacent components will be described later.
The “failure rate” is a probability that a failure will occur in a device (lower layer) belonging to the target component. It can also be said that the probability is a unit of component obtained from a past failure of a lower layer device belonging to each component. The “failure rate” in component units will be described later, but can be determined as appropriate using a predetermined calculation formula. The failure rate is updated each time a failure occurs in the device. It is assumed that the failure rate increases as the number of failures increases.

「検出数」、「検出率」、「近傍コンポーネント」、「故障率」は、面的分析のパラメータとなる。
「確認順」は、面的分析のパラメータの全部または一部に基づいて、どのコンポーネントから優先的に詳細分析を行うかを示す優先順位である。被疑箇所の確度が高いほど優先順位が高くなる。例えば、検出数が多いOMSを優先し、検出数が同じOMSについては、検出率が大きいOMSを優先し、検出率も同じとなるOMSについては、故障率が高いOMSを優先する、という確認順決定ルールを採用したとする。この場合、図2(b)によれば、OMS Bが、各OMS間で検出数が最も多くなり(検出数が3)、確認順が1位となる。また、OMS Dが、各OMS間で検出数が最少となり(検出数が0)、確認順が4位となる。
The “number of detections”, “detection rate”, “neighboring components”, and “failure rate” are parameters for area analysis.
The “confirmation order” is a priority indicating which component is to be preferentially analyzed in detail based on all or part of the parameters of the area analysis. The higher the accuracy of the suspected place, the higher the priority. For example, an OMS with a high number of detections is given priority, an OMS with the same number of detections is given priority to an OMS with a high detection rate, and an OMS with the same detection rate is given priority to an OMS with a high failure rate. Assume that a decision rule is adopted. In this case, according to FIG. 2B, OMS B has the largest number of detections between the OMSs (the number of detections is 3), and the confirmation order is first. In addition, OMS D has the smallest number of detections between the OMSs (the number of detections is 0), and the confirmation order is fourth.

次に、OMS A,Cについては、検出数がともに2であり優劣がなく、さらに、検出率がともに100%(2/2)であり優劣が無い。しかし、故障率は、OMS Aの方が高いため、OMS Aが優先される。その結果、OMS Aの確認順が2位となり、OMS Cの確認順が3位となる。   Next, for OMS A and C, the number of detections is 2 and there is no superiority, and further, the detection rates are both 100% (2/2) and there is no superiority or inferiority. However, since OMS A has a higher failure rate, OMS A is given priority. As a result, the confirmation order of OMS A is second and the confirmation order of OMS C is third.

本実施形態の故障位置特定装置は、図2(b)の表で決定した確認順にしたがって、B→A→C→Dの順に詳細分析を行う。このように、実際に故障が発生したOMS Bを最有力の被疑箇所候補とすることができ、下位レイヤの機器のすべてを被疑箇所とすることは無い。したがって、下位レイヤにて発現される故障の位置を特定するための稼働を削減することができる。   The failure location device of the present embodiment performs detailed analysis in the order of B → A → C → D according to the confirmation order determined in the table of FIG. As described above, the OMS B in which a failure actually occurs can be the most likely suspected place candidate, and not all the devices in the lower layer are considered suspected places. Therefore, it is possible to reduce the operation for specifying the position of the failure that appears in the lower layer.

≪構成≫
本実施形態の故障位置特定装置の機能構成について説明する。図3に示すように、故障位置特定装置100は、網構成管理部1−1〜1−4と、性能情報管理部2−1〜2−3と、ユーザ申告管理部2−4と、確認順決定部3と、故障位置特定部4といった機能部を制御部に備える。また、故障位置特定装置100は、網構成情報1a〜1dと、性能情報2a〜2cと、申告情報2dと、レイヤ間収容情報3aと、確認順情報3bとを記憶部に記憶する。
≪Configuration≫
A functional configuration of the failure location device of this embodiment will be described. As illustrated in FIG. 3, the failure location device 100 includes a network configuration management unit 1-1 to 1-4, a performance information management unit 2-1 to 2-3, a user report management unit 2-4, and a confirmation. The control unit includes functional units such as the order determination unit 3 and the failure position specifying unit 4. The failure location device 100 also stores network configuration information 1a to 1d, performance information 2a to 2c, reporting information 2d, inter-layer accommodation information 3a, and confirmation order information 3b in the storage unit.

なお、故障位置特定装置100は、CPU(Central Processing Unit)と、記憶手段(記憶部)と、ネットワークインタフェースとを有するコンピュータとして構成される。このコンピュータは、CPUが、記憶部上に読み込んだプログラム(故障位置特定プログラムを含む。)を実行することで、各機能部により構成される制御部(制御手段)を動作させる。   The failure location device 100 is configured as a computer having a CPU (Central Processing Unit), storage means (storage unit), and a network interface. In this computer, the CPU executes a program (including a failure location specifying program) read on the storage unit, thereby operating a control unit (control means) configured by each functional unit.

網構成管理部1−1は、L0/L1網の網構成を管理する。L0/L1網の網構成には、例えば、L0/L1網上に配置されている機器間のトポロジ情報や、L0/L1網上に配置されている機器に設定されているパスの設定情報が含まれる。網構成管理部1−1は、L0/L1網の網構成の管理結果を網構成情報1aとして出力する。   The network configuration management unit 1-1 manages the network configuration of the L0 / L1 network. The network configuration of the L0 / L1 network includes, for example, topology information between devices arranged on the L0 / L1 network and path setting information set on devices arranged on the L0 / L1 network. included. The network configuration management unit 1-1 outputs the network configuration management result of the L0 / L1 network as network configuration information 1a.

網構成管理部1−2は、L2/L1.5網の網構成を管理する。L2/L1.5網の網構成には、例えば、L2/L1.5網上に配置されている機器間のトポロジ情報や、L2/L1.5網上に配置されている機器に設定されているパスの設定情報が含まれる。網構成管理部1−2は、L2/L1.5網の網構成の管理結果を網構成情報1bとして出力する。   The network configuration management unit 1-2 manages the network configuration of the L2 / L1.5 network. In the network configuration of the L2 / L1.5 network, for example, topology information between devices arranged on the L2 / L1.5 network or devices arranged on the L2 / L1.5 network are set. The setting information of the existing path is included. The network configuration management unit 1-2 outputs the network configuration management result of the L2 / L1.5 network as network configuration information 1b.

網構成管理部1−3は、L3網の網構成を管理する。L3網の網構成には、例えば、L3網上に配置されている機器間のトポロジ情報や、L3網上に配置されている機器に設定されているパスの設定情報が含まれる。網構成管理部1−3は、L3網の網構成の管理結果を網構成情報1cとして出力する。   The network configuration management unit 1-3 manages the network configuration of the L3 network. The network configuration of the L3 network includes, for example, topology information between devices arranged on the L3 network, and path setting information set for devices arranged on the L3 network. The network configuration management unit 1-3 outputs the network configuration management result of the L3 network as network configuration information 1c.

網構成管理部1−4は、サービス網の網構成を管理する。サービス網の網構成には、例えば、サービス網上に配置されている機器間のトポロジ情報や、サービス網上に配置されている機器に設定されているパスの設定情報が含まれる。網構成管理部1−4は、サービス網の網構成の管理結果を網構成情報1dとして出力する。   The network configuration management unit 1-4 manages the network configuration of the service network. The network configuration of the service network includes, for example, topology information between devices arranged on the service network and path setting information set for the devices arranged on the service network. The network configuration manager 1-4 outputs the network configuration management result of the service network as network configuration information 1d.

性能情報管理部2−1は、L0/L1網の性能を管理する。L0/L1網の性能には、例えば、L0/L1網に配置されている機器の各々の性能値(例:CPU周波数、メモリ量、処理トラヒック量)の履歴が含まれる。性能情報管理部2−1は、L0/L1網の性能の管理結果を性能情報2aとして出力する。性能情報2aには、間欠故障やサイレント故障とは異なり明確に確認可能な故障が発生したことを示す警報情報が含まれる。   The performance information management unit 2-1 manages the performance of the L0 / L1 network. The performance of the L0 / L1 network includes, for example, a history of performance values (eg, CPU frequency, memory amount, processing traffic amount) of devices arranged in the L0 / L1 network. The performance information management unit 2-1 outputs the performance management result of the L0 / L1 network as performance information 2a. The performance information 2a includes alarm information indicating that a fault that can be clearly confirmed has occurred unlike an intermittent fault or a silent fault.

性能情報管理部2−2は、L2/L1.5網の性能を管理する。L2/L1.5網の性能には、例えば、L2/L1.5網に配置されている機器の各々の性能値(例:CPU周波数、メモリ量、処理トラヒック量)の履歴が含まれる。性能情報管理部2−2は、L2/L1.5網の性能の管理結果を性能情報2bとして出力する。性能情報2bには、現在の性能値が過去の性能値よりも所定の閾値以上に低下したことを示す、上位レイヤの警報情報が含まれる。   The performance information management unit 2-2 manages the performance of the L2 / L1.5 network. The performance of the L2 / L1.5 network includes, for example, a history of performance values (eg, CPU frequency, memory amount, processing traffic amount) of devices arranged in the L2 / L1.5 network. The performance information management unit 2-2 outputs the performance management result of the L2 / L1.5 network as performance information 2b. The performance information 2b includes upper layer alarm information indicating that the current performance value has decreased to a predetermined threshold value or more than the past performance value.

性能情報管理部2−3は、L3網の性能を管理する。L3網の性能には、例えば、L3網に配置されている機器の各々の性能値(例:CPU周波数、メモリ量、処理トラヒック量)の履歴が含まれる。性能情報管理部2−3は、L3網の性能の管理結果を性能情報2cとして出力する。性能情報2cには、MIBトラヒック監視によって、現在の性能値が過去の性能値よりも所定の閾値以上に低下したことを示す、上位レイヤの警報情報が含まれる。   The performance information management unit 2-3 manages the performance of the L3 network. The performance of the L3 network includes, for example, a history of performance values (eg, CPU frequency, memory amount, processing traffic amount) of devices arranged in the L3 network. The performance information management unit 2-3 outputs the performance management result of the L3 network as performance information 2c. The performance information 2c includes upper layer alarm information indicating that the current performance value has decreased to a predetermined threshold value or more than the past performance value due to the MIB traffic monitoring.

ユーザ申告管理部2−4は、サービス網上に発生したユーザ申告を管理する。ユーザ申告は、所定のサービスを利用するユーザのユーザ端末(図示せず)から出力される申告であって、例えば、所定の閾値を超えるトラヒック減を示唆する申告を含む。ユーザ申告管理部2−4は、ユーザ申告の管理結果を、申告情報2dとして出力する。申告情報2dは、例えば、ユーザ申告の内容と、申告がなされたタイミング、申告をしたユーザ端末の識別子が関連付けられた情報とすることができる。ユーザ申告の内容には、上位レイヤの警報情報が含まれる。   The user report management unit 2-4 manages user reports generated on the service network. The user report is a report output from a user terminal (not shown) of a user who uses a predetermined service, and includes, for example, a report that suggests a decrease in traffic exceeding a predetermined threshold. The user report management unit 2-4 outputs the management result of the user report as report information 2d. The report information 2d can be, for example, information in which the content of the user report, the timing when the report is made, and the identifier of the user terminal that made the report are associated. The content of the user report includes upper layer alarm information.

レイヤ間収容情報3aは、L0/L1網、L2/L1.5網、L3網、および、サービス網といったレイヤに配置される機器について、異なるレイヤ間に配置されている機器間の収容関係を示す情報である。   The inter-layer accommodation information 3a indicates the accommodation relationship between devices arranged between different layers with respect to the devices arranged in layers such as the L0 / L1 network, the L2 / L1.5 network, the L3 network, and the service network. Information.

確認順決定部3は、網構成情報1a〜1dと、性能情報2b、2c、申告情報2dに含まれる上位レイヤの警告情報と、レイヤ間収容情報3aとに基づいて、下位レイヤのコンポーネント群を対象にして、どのコンポーネントから詳細分析を行って確認するか、という確認順を決定する(コンポーネントの順位付け)。確認順決定部3は、確認順の決定に関する処理結果を確認順情報3b(図2(b)参照)として出力する。確認順決定部3は、確認順の決定に関して、面的分析のパラメータを用いた確認順決定ルールに従う。確認順決定ルールは、例えば、通信システムの管理者が適宜決定することができ、故障位置特定装置100の記憶部に記憶されている。   The confirmation order determining unit 3 determines the lower layer component group based on the network configuration information 1a to 1d, the performance information 2b, 2c, the upper layer warning information included in the declaration information 2d, and the interlayer accommodation information 3a. The order of confirmation of which component is to be subjected to detailed analysis and confirmation is determined (ranking of components). The confirmation order determination unit 3 outputs the processing result related to the determination of the confirmation order as confirmation order information 3b (see FIG. 2B). The confirmation order determination unit 3 follows the confirmation order determination rule using the parameters of the area analysis regarding the determination of the confirmation order. The confirmation order determination rule can be appropriately determined by the administrator of the communication system, for example, and is stored in the storage unit of the failure location device 100.

故障位置特定部4は、確認順情報3bに示されている、コンポーネントの確認順に沿って詳細分析を行う。具体的には、故障位置特定部4は、異なる時点の性能情報2a〜2cを取得して、被疑箇所のコンポーネントに属する機器について、過去の性能と現在の性能とを分析することで最終的な故障位置を特定する。この分析の詳細は周知であり、説明は省略する。   The failure location specifying unit 4 performs detailed analysis along the component confirmation order indicated in the confirmation order information 3b. Specifically, the failure location specifying unit 4 acquires the performance information 2a to 2c at different points in time, and analyzes the past performance and the current performance for the devices belonging to the component at the suspected place, thereby finally Identify the fault location. The details of this analysis are well known and will not be described.

≪各パラメータの詳細≫
面的分析のパラメータの各々について詳細に説明する。
≪Details of each parameter≫
Each of the area analysis parameters will be described in detail.

<検出数>
すでに説明した通り、異常の検出数の多いコンポーネントを優先的に確認するという確認順を採用することができる。図4(a)の上段に示す簡略構成図は、図2(a)のものと同じである。図4(a)の上段に描かれているパス[1]〜[3]は、図2(a)に描かれているパス[1]〜[3]と同じである。また、OMS Bにて故障(×で図示)が発生したとする。
<Number of detections>
As already described, it is possible to adopt a confirmation order in which components with a large number of detected abnormalities are preferentially confirmed. The simplified configuration diagram shown in the upper part of FIG. 4A is the same as that of FIG. The paths [1] to [3] drawn in the upper part of FIG. 4A are the same as the paths [1] to [3] drawn in FIG. Further, it is assumed that a failure (shown by x) occurs in OMS B.

図4(a)の上段に示すように、検出漏れが無い場合には、OMS A〜CのなかでOMS Bの検出数が最大となり、OMS Bを被疑箇所として優先する(OMS DについてはL3網上にパスが設定されていないので無視する)。
例えば、パス[1]での検出漏れが生じる場合がある。この場合、パス[1]が経由する機器を収容するOMS A〜Cの検出数はそれぞれ、検出漏れが無い場合と比較して1減る(図4(a)下段参照)。なお、検出漏れのケースには、例えば、間欠故障やサイレント故障の発生時にサービス網においてユーザ申告が漏れるケース、または、L3網においてトラヒックMIB監視時に異常検出用のトラヒック変動閾値に達しないケースがある。
As shown in the upper part of FIG. 4A, when there is no detection omission, the number of detections of OMS B is maximum among OMS A to C, and OMS B is given priority as a suspected place (for OMS D, L3 Ignore it because no path is set on the network).
For example, a detection omission in path [1] may occur. In this case, the number of detections of the OMS A to C that accommodate the devices through which the path [1] passes is reduced by 1 as compared with the case where there is no detection omission (see the lower part of FIG. 4A). In addition, for example, there are cases where a user report is leaked in the service network when an intermittent failure or a silent failure occurs, or a case where the traffic fluctuation threshold for detecting an abnormality is not reached when monitoring a traffic MIB in the L3 network. .

パス[1]での検出漏れがあった場合でも、OMS A〜CのなかでOMS Bの検出数が最大となるため、OMS Bを被疑箇所として優先することができる。このように、面的分析のパラメータとして検出数を用いることは有用である。
なお、図4(a)下段に示すように、パス[1]での検出漏れがあった場合、検出率についてもOMS Bが最大(66%)となり、検出率を用いて、OMS Bを被疑箇所として優先することができる。
Even when there is a detection failure in the path [1], the number of detections of OMS B is the maximum among OMS A to C, and therefore OMS B can be prioritized as a suspected place. Thus, it is useful to use the number of detections as a parameter for area analysis.
As shown in the lower part of FIG. 4 (a), when there is a detection failure in path [1], OMS B is also the maximum (66%) for the detection rate, and OMS B is suspected using the detection rate. It can be given priority as a location.

<検出率>
すでに説明した通り、異常の検出率の多いコンポーネントを優先的に確認するという確認順を採用することができる。図4(b)の上段に示す簡略構成図は、図4(a)の上段に示す簡略構成図と比較して、パス[1]〜[3]は同じであるが、実際の故障発生箇所(×で図示)がOMS BからOMS Cに変更されている点で異なる。
<Detection rate>
As already described, it is possible to adopt a confirmation order in which components with a high abnormality detection rate are preferentially confirmed. The simplified configuration diagram shown in the upper part of FIG. 4B has the same paths [1] to [3] as compared to the simplified configuration diagram shown in the upper part of FIG. The difference is that OMS B is changed to OMS C.

図4(b)の上段に示すように、OMS Cの実際の故障に対して、原則的には、パス[3]での検出は無い。このため、検出漏れが無い場合には、OMS A〜Cのなかで、OMS B,Cの検出数は同数(2)となる。そこで、検出率に着目すると、OMS B,Cの各々の収容数(矢印の数)の違いに起因して、OMS Bの検出率よりもOMS Cの検出率の方が大きい。よって、OMS Cを被疑箇所として優先することができる。このように、面的分析のパラメータとして検出数を用いることは有用である。   As shown in the upper part of FIG. 4B, in principle, there is no detection in the path [3] for the actual failure of the OMS C. For this reason, when there is no detection omission, the number of detections of OMS B and C among OMS A to C is the same number (2). Therefore, focusing on the detection rate, the detection rate of OMS C is larger than the detection rate of OMS B due to the difference in the number of accommodated OMS B and C (number of arrows). Therefore, OMS C can be prioritized as a suspected place. Thus, it is useful to use the number of detections as a parameter for area analysis.

なお、図4(b)下段に示すように、パス[1]での検出漏れがあった場合、パス[1]での検出のカウントが無くなるが、検出率については、OMS Cが最大(50%)となり、検出率を用いて、OMS Cを被疑箇所として優先することができる。   As shown in the lower part of FIG. 4B, when there is a detection failure in the path [1], the detection in the path [1] is not counted, but the OMS C is the maximum (50 %), And OMS C can be prioritized as a suspected location using the detection rate.

<近傍情報>
コンポーネントの隣接関係を表す近傍情報を用いて、他のパラメータで判断した優先コンポーネントに隣接する(近傍の)コンポーネントを優先的に確認するという確認順を採用することができる。近傍情報は、具体的には、図2(b)の近傍コンポーネントとして表すことができる。図4(c)の上段に示す簡略構成図は、図4(a)の上段に示す簡略構成図と比較して、パス[1]〜[3]に加えて、パス[4]が追加されている点が異なる。パス[4]は、ルータ31〜33を経由する論理的な通信路であるがパス[3]とは別である。図4(c)の上段に示す簡略構成図にて、実際の故障発生箇所は、OMS Bである(×印で図示)。
<Nearby information>
A confirmation order of preferentially confirming (adjacent) components adjacent to the priority component determined by other parameters using the neighborhood information representing the adjacent relationship between the components can be employed. Specifically, the neighborhood information can be expressed as a neighborhood component in FIG. Compared to the simplified configuration diagram shown in the upper part of FIG. 4A, the simplified configuration diagram shown in the upper part of FIG. 4C has a path [4] added in addition to the paths [1] to [3]. Is different. The path [4] is a logical communication path that passes through the routers 31 to 33, but is different from the path [3]. In the simplified configuration diagram shown in the upper part of FIG. 4C, the actual failure occurrence location is OMS B (illustrated by x).

図4(c)の上段に示すように、検出漏れが無い場合には、OMS A〜CのなかでOMS Bの検出数が最大(4)となり、OMS Bを被疑箇所として優先する。   As shown in the upper part of FIG. 4C, when there is no detection omission, the number of detections of OMS B is the maximum (4) among OMS A to C, and OMS B is given priority as a suspected location.

パス[2]での検出漏れが生じた場合、パス[2]が経由する機器を収容するOMS B,Cの検出数はそれぞれ、検出漏れが無い場合と比較して1減る(図4(c)下段参照)。その結果、OMS Aの検出数と、OMS Cの検出数とが同数となり、検出数に関しては、OMS A,C間で優劣が無い。そこで、次点パラメータとして、検出率に注目すると、OMS Aがパス[2]での検出漏れの影響を受けないため、OMS Bの検出率(75%)よりもOMS Aの検出率(100%)の方が大きくなる。よって、OMS Aを最優先の被疑箇所として選定してしまうが、このような選定は、実際の故障発生箇所(OMS B)と異なる。   When a detection failure occurs in the path [2], the number of detections of the OMS B and C that accommodate the device through which the path [2] passes is reduced by 1 as compared with the case where there is no detection failure (FIG. 4C ) See below). As a result, the number of detections of OMS A is the same as the number of detections of OMS C, and there is no superiority or inferiority between OMS A and C with respect to the number of detections. Therefore, when attention is paid to the detection rate as the second parameter, since OMS A is not affected by detection omission in path [2], the detection rate of OMS A (100%) is higher than the detection rate of OMS B (75%). ) Is larger. Therefore, although OMS A is selected as the highest priority suspected location, such selection is different from the actual failure occurrence location (OMS B).

このように、いずれかのパラメータにより選定したコンポーネントに故障が無かった場合、選定したコンポーネントの近傍を優先的に確認するという確認順を採用することができる。パス[2]での検出漏れが生じた場合に選定したコンポーネントであるOMS Aの近傍コンポーネント(図2(b)、および、図2(b)を参照した説明部分を参照)は、OMS B,Dである。OMS Dは、当該OMS Dが収容する機器にパスが設定されていないため除外する。結果として、残ったOMS B(実際の故障発生箇所)を、OMS Aに代えて、最優先の被疑箇所として選定する。検出数や検出率といったパラメータを用いて選定したコンポーネント(図4(c)ではOMS A)に故障が無かった場合、選定したコンポーネントの近傍に故障が発生している可能性が高い。よって、面的分析のパラメータとして近傍情報を用いることは有用である。   As described above, when there is no failure in the component selected by any of the parameters, a confirmation order of preferentially confirming the vicinity of the selected component can be adopted. A component in the vicinity of OMS A, which is a component selected when a detection failure in path [2] occurs (see FIG. 2 (b) and the explanation with reference to FIG. 2 (b)), OMS B, D. OMS D is excluded because no path is set for the device accommodated by the OMS D. As a result, the remaining OMS B (actual failure occurrence location) is selected as the highest priority suspect location in place of OMS A. When there is no failure in the component selected using parameters such as the number of detections and the detection rate (OMS A in FIG. 4C), there is a high possibility that a failure has occurred in the vicinity of the selected component. Therefore, it is useful to use neighborhood information as a parameter for area analysis.

なお、一般的には、検出数や検出率を用いた場合には、故障個所と同じ収容接続を誤って被疑箇所として選定する可能性が高い。図4(c)の例によれば、OMS A,B間では、パス[1],[3],[4]の3つで同じ収容接続を持つため、OMS B(実際の故障発生箇所)の代わりにOMS A(検出率が最大のコンポーネント)を選定しまう可能性が高い。OMS A,Bのように、同じ接続を多く収容するコンポーネント同士は、トポロジが類似するため、検出数や検出率よりも近傍情報の方が有効である。   In general, when the number of detections and the detection rate are used, there is a high possibility that the same accommodation connection as the failed part is erroneously selected as the suspected part. According to the example of FIG. 4C, since OMS A and B have the same accommodation connection in three paths [1], [3], and [4], OMS B (actual failure occurrence location) There is a high possibility that OMS A (the component with the highest detection rate) is selected instead of. Like OMS A and B, components that accommodate many of the same connections have similar topologies, and therefore the neighborhood information is more effective than the number of detections and the detection rate.

<故障率>
故障率の大きいコンポーネントを優先的に確認するという確認順を採用することができる。図5(a)に示す簡略構成図は、図2(a)のものと同じである。図5(a)に描かれているパス[1]〜[3]は、図2(a)に描かれているパス[1]〜[3]と同じである。図2(a)と比較して、図5(a)では、OMS Aにて故障(×で図示)が発生したとする。
<Failure rate>
A confirmation order in which components with a high failure rate are preferentially confirmed can be adopted. The simplified configuration diagram shown in FIG. 5A is the same as that in FIG. The paths [1] to [3] depicted in FIG. 5A are the same as the paths [1] to [3] depicted in FIG. As compared with FIG. 2A, in FIG. 5A, it is assumed that a failure (indicated by x) occurs in OMS A.

パス[1]〜[3]すべてで異常が検出されたとする。よって、OMS Aが収容しない機器を経由しないパス[2]での異常検出は、誤検出となる。また、図5(a)に対し、OMSごとの確認順の決定に関する表は、図5(b)に示す通りである。   It is assumed that an abnormality is detected in all the paths [1] to [3]. Therefore, the abnormality detection in the path [2] that does not pass through the device that is not accommodated by the OMS A is a false detection. Further, with respect to FIG. 5A, a table relating to determination of the confirmation order for each OMS is as shown in FIG. 5B.

例えば、検出数が多いOMSを優先し、検出数が同じOMSについては、検出率が大きいOMSを優先し、検出率も同じとなるOMSについては、故障率が高いOMSを優先する、という確認順決定ルールを採用したとする。この場合、図5(b)に示すように、検出数が最大(3)となるOMS Bの確認順が1位となり、検出数が最少(0)となるOMS Dの確認順が4位となる。   For example, an OMS with a high number of detections is given priority, an OMS with the same number of detections is given priority to an OMS with a high detection rate, and an OMS with the same detection rate is given priority to an OMS with a high failure rate. Assume that a decision rule is adopted. In this case, as shown in FIG. 5B, the confirmation order of OMS B with the maximum number of detections (3) is first, and the confirmation order of OMS D with the minimum number of detections (0) is fourth. Become.

OMS A,Cは、検出数、検出率が同じである(検出数:2、検出率100%)。そこで、故障率に注目すると、OMS Aの方が、故障率が大きい(0.2)ため、OMS AをOMS Cよりも優先する。結果として、B→A→C→Dの順に詳細分析を行う。   OMS A and C have the same detection number and detection rate (detection number: 2, detection rate 100%). Therefore, paying attention to the failure rate, OMS A has a higher failure rate (0.2), so OMS A is given priority over OMS C. As a result, detailed analysis is performed in the order of B → A → C → D.

故障率を重視する確認順決定ルールを採用することもできる。例えば、故障率が高いOMSを優先し、故障率が同じOMSについては、検出数、検出率の順にパラメータが大きいOMSを優先する、という確認順決定ルールを採用することができる。このルールに従えば、故障率が最大となるOMS Aを最優先の被疑箇所と判定することができる。   It is also possible to adopt a confirmation order decision rule that places importance on the failure rate. For example, an OMS with a high failure rate may be prioritized, and for an OMS with the same failure rate, a confirmation order determination rule that prioritizes an OMS with a larger parameter in the order of the number of detections and the detection rate may be employed. If this rule is followed, it is possible to determine the OMS A with the highest failure rate as the suspected place with the highest priority.

<故障していない率>
故障していない率の小さいコンポーネントを優先的に確認するという確認順を採用することができる。「着目するコンポーネントの故障していない率」とは、各コンポーネントの故障率(予め取得済み)から、着目するコンポーネント以外のコンポーネントが故障している確率をいう。または、故障率に基づいて、異常検出に対し、コンポーネントの各々に属する下位レイヤの機器の故障していない確率ともいえる。すべての異常検出に対してコンポーネントごとに故障していない率を求め、故障していない率の小さいコンポーネントを決定する。
<Rate of no failure>
A confirmation order of preferentially confirming components with a low rate of not failing can be adopted. The “rate of failure of the component of interest” refers to the probability that a component other than the component of interest has failed from the failure rate of each component (obtained in advance). Or, based on the failure rate, it can be said that it is the probability that a lower layer device belonging to each of the components has not failed for abnormality detection. A rate of failure for each component is obtained for all abnormality detections, and a component having a small rate of failure is determined.

故障していない率の説明を、図6(a)に示す簡略構成図を用いて行う。図6(a)において、L3網上には、パス[1]、[2]が設定されているとする。
パス[1]は、ルータ31〜34を経由する論理的な通信路である。よって、パス[1]が経由するL3網上の機器を収容するOMSは、OMS A,B,Cとなる。
パス[2]は、ルータ33、32、34をこの順(またはこの逆の順)で経由する論理的な通信路である。よって、パス[2]が経由するL3網上の機器を収容するOMSは、OMS B,Dとなる。
The non-failure rate will be described using the simplified configuration diagram shown in FIG. In FIG. 6A, it is assumed that paths [1] and [2] are set on the L3 network.
The path [1] is a logical communication path that passes through the routers 31 to 34. Therefore, OMSs that accommodate devices on the L3 network through which the path [1] passes are OMS A, B, and C.
The path [2] is a logical communication path that passes through the routers 33, 32, and 34 in this order (or the reverse order). Therefore, the OMSs that accommodate the devices on the L3 network through which the path [2] passes are OMS B and D.

OMS Aにて故障(×で図示)が発生したとする。また、パス[1]、[2]すべてで異常が検出されたとする。よって、OMS Aが収容する機器を経由しないパス[2]での異常検出は、誤検出となる。また、図6(a)に対し、OMSごとの確認順の決定に関する表は、図6(b)に示す通りである。   Assume that a failure (indicated by x) occurs in OMS A. Further, it is assumed that an abnormality is detected in all the paths [1] and [2]. Therefore, the abnormality detection in the path [2] that does not pass through the device accommodated by the OMS A is a false detection. Also, with respect to FIG. 6A, a table relating to determination of the confirmation order for each OMS is as shown in FIG. 6B.

OMS A〜Dの故障率をぞれぞれ、PA,PB,PC,PDとする。本実施形態の故障位置特定装置100は、故障率PA,PB,PC,PDに対して、コンポーネントごとに故障していない率を求めることができる。例えば、OMS Bについて説明すると、「パス[1]での異常検出に対してBが故障していない率」、「パス[2]での異常検出に対してBが故障していない率」、および、「パス[1][2]での異常検出に対してBが故障していない率」の3種類を求めることができる。3種類のBの故障していない率の計算式は以下の通りである。
・パス[1]での異常検出に対してBが故障していない率
=(1−PB)[1−(1−PA)(1−PC)]
・パス[2]での異常検出に対してBが故障していない率
=(1−PB)[1−(1−PD)]=(1−PB)PD
・パス[1][2]での異常検出に対してBが故障していない率
=(1−PB)[1−(1−PA)(1−PC)]PD
The failure rates of OMS A to D are PA, PB, PC, and PD, respectively. The failure location device 100 of the present embodiment can determine the failure rate for each component with respect to the failure rates PA, PB, PC, and PD. For example, when OMS B is described, “a rate at which B does not fail with respect to abnormality detection on path [1]”, “a rate at which B does not fail with respect to abnormality detection on path [2]”, In addition, three types of “rate that B does not fail with respect to anomaly detection on paths [1] and [2]” can be obtained. The calculation formulas for the three types of B non-failure rates are as follows.
The rate at which B does not fail with respect to anomaly detection on path [1] = (1-PB) [1- (1-PA) (1-PC)]
The rate at which B does not fail with respect to anomaly detection on path [2] = (1-PB) [1- (1-PD)] = (1-PB) PD
The rate at which B does not fail with respect to anomaly detection on path [1] [2] = (1-PB) [1- (1-PA) (1-PC)] PD

例えば、図6(b)の表の「故障していない率」には、パス[1][2]での異常検出に対して各OMSが故障していない率の値を登録することができ、OMS A〜Dの故障していない率が登録される。登録された故障していない率のうち最小となるOMSを最優先の被疑箇所と判定することができる。   For example, the value of the rate at which each OMS does not fail can be registered in the “non-failed rate” in the table of FIG. , OMS A to D non-failed rate is registered. Of the registered non-failure rates, the smallest OMS can be determined as the highest priority suspected place.

<拡張された検出数(重み付け検出数)>
すでに説明した検出数の概念を拡張させ、拡張された検出数の多いコンポーネントを優先的に確認するという確認順を採用することができる。異常が検出されるパスが経由する機器を収容するコンポーネントの数が少ないほど、当該コンポーネントから見たときの故障の重要度は高い。そこで、対応するコンポーネントの数が少ないパスには大きな重みを付与してコンポーネント単位の検出数を計算する。重みには、1つのパスが経由する機器を収容するコンポーネントの数の逆数を利用することができるが、これに限定されない。
<Extended detection number (weighted detection number)>
It is possible to adopt a confirmation order in which the concept of the number of detections already described is expanded and the expanded components with a large number of detections are preferentially confirmed. The smaller the number of components that accommodate the device through which the path where the abnormality is detected is, the higher the importance of the failure when viewed from the component. Therefore, a path with a small number of corresponding components is given a large weight, and the number of detections for each component is calculated. For the weight, the reciprocal of the number of components accommodating the device through which one path passes can be used, but the weight is not limited to this.

拡張された検出数の説明を、図7(a)に示す簡略構成図を用いて行う。図7(a)において、L3網上には、パス[1]〜[3]が設定されているとする。
パス[1]は、ルータ31〜34を経由する論理的な通信路である。よって、パス[1]が経由するL3網上の機器を収容するOMSは、OMS A,B,Cとなる。
パス[2]は、ルータ32〜34を経由する論理的な通信路である。よって、パス[2]が経由するL3網上の機器を収容するOMSは、OMS B,Cとなる。
パス[3]は、ルータ35,31〜33を経由する論理的な通信路である。なお、図7(a)中、ルータ35は、L3網上の機器である。符号25は、例えば、L2/L1.5網上のMPLS−TP装置である。符号15は、例えば、OXCである。OXC11,15間にOMS Eが形成される。パス[3]が経由するL3網上の機器を収容するOMSは、OMS E,A,Bとなる。
The extended number of detections will be described using the simplified configuration diagram shown in FIG. In FIG. 7A, it is assumed that paths [1] to [3] are set on the L3 network.
The path [1] is a logical communication path that passes through the routers 31 to 34. Therefore, OMSs that accommodate devices on the L3 network through which the path [1] passes are OMS A, B, and C.
The path [2] is a logical communication path that passes through the routers 32 to 34. Therefore, the OMSs that accommodate the devices on the L3 network through which the path [2] passes are OMS B and C.
The path [3] is a logical communication path that passes through the routers 35 and 31 to 33. In FIG. 7A, the router 35 is a device on the L3 network. Reference numeral 25 is, for example, an MPLS-TP device on an L2 / L1.5 network. Reference numeral 15 is, for example, OXC. OMS E is formed between OXCs 11 and 15. OMSs that accommodate devices on the L3 network through which the path [3] passes are OMS E, A, and B.

OMS Cにて故障(×で図示)が発生したとする。また、パス[1]〜[3]すべてで異常が検出されたとする。よって、OMS Cが収容する機器を経由しないパス[3]での異常検出は、誤検出となる。また、図7(a)に対し、OMSごとの確認順の決定に関する表は、図7(b)に示す通りである。   Assume that a failure (indicated by x) occurs in OMSC. Further, it is assumed that an abnormality is detected in all the paths [1] to [3]. Therefore, the abnormality detection in the path [3] that does not pass through the device accommodated by the OMS C is a false detection. Also, with respect to FIG. 7A, a table relating to determination of the confirmation order for each OMS is as shown in FIG. 7B.

図7(a)において、パス[1]に対応するコンポーネント数は3である。よって、3の逆数1/3(=2/6)を、パス[1]に対する重みとする。また、パス[2]に対応するコンポーネント数は2である。よって、2の逆数1/2(=3/6)を、パス[2]に対する重みとする。また、パス[3]に対応するコンポーネント数は3である。よって、3の逆数1/3(=2/6)を、パス[3]に対する重みとする。   In FIG. 7A, the number of components corresponding to the path [1] is three. Therefore, the reciprocal 1/3 (= 2/6) of 3 is set as a weight for the path [1]. The number of components corresponding to the path [2] is two. Therefore, the reciprocal 1/2 of 2 (= 3/6) is set as a weight for the path [2]. The number of components corresponding to path [3] is three. Therefore, the reciprocal 1/3 (= 2/6) of 3 is set as a weight for the path [3].

拡張した検出数、検出率、故障率という優先度で確認順を決定する(近傍情報は使用しない)確認順決定ルールを採用したとする。図7(b)の表を参照すると、OMS Aの(拡張しない)検出数は2であるが、拡張した検出数は、OMS Aに収容されるパス[1]に対する重み(2/6)+OMS Aに収容されるパス[3]に対する重み(2/6)=4/6となる。   It is assumed that a confirmation order determination rule is adopted that determines the confirmation order based on the priorities of the expanded number of detections, the detection rate, and the failure rate (neighbor information is not used). Referring to the table of FIG. 7B, the number of detections of OMS A (not expanded) is 2, but the expanded number of detections is the weight (2/6) + OMS for the path [1] accommodated in OMS A The weight (2/6) = 4/6 for the path [3] accommodated in A.

また、OMS Bの(拡張しない)検出数は3であるが、拡張した検出数は、OMS Bに収容されるパス[1]に対する重み(2/6)+OMS Bに収容されるパス[2]に対する重み(3/6)+OMS Bに収容されるパス[3]に対する重み(2/6)=7/6となる。
同様にして、OMS Cの(拡張しない)検出数は2であるが、拡張した検出数は、OMS Cに収容されるパス[1]に対する重み(2/6)+OMS Bに収容されるパス[2]に対する重み(3/6)=5/6となる。
同様にして、OMS Eの(拡張しない)検出数は1(誤検出)であるが、拡張した検出数は、OMS Eに収容されるパス[3]に対する重み=2/6となる。
In addition, the number of detections of OMS B (not expanded) is 3, but the expanded number of detections is the weight (2/6) for path [1] accommodated in OMS B + path [2] accommodated in OMS B Weight (3/6) + weight (2/6) = 7/6 for path [3] accommodated in OMS B.
Similarly, the number of detections of OMS C (not expanded) is 2, but the expanded number of detections is the weight (2/6) for the path [1] accommodated in OMS C + the path accommodated in OMS B [ 2] (3/6) = 5/6.
Similarly, the number of detections of OMS E (not expanded) is 1 (false detection), but the expanded number of detections is weight = 2/6 for path [3] accommodated in OMS E.

図7(b)の表によれば、(拡張しない)検出数を用いた場合、OMS A,Cに関して、(拡張しない)検出数、および、検出率が同じであるが、故障率の違いから、OMS Aの確認順(2位)がOMS Cの確認順(3位)を上回っている。しかし、拡張した検出数を用いた場合、OMS Aの拡張した検出数(4/6)よりも、OMS Cの拡張した検出数(5/6)が上回る。このため、OMS Aの確認順(3位)よりも、OMS Cの確認順(2位)が上回る、という結果が得られる。このことは、拡張された検出数を用いることで、実際の故障個所(OMS C)を被疑箇所とする推定の精度を向上させることができることを意味する。   According to the table of FIG. 7B, when the number of detections (not expanded) is used, the number of detections (not expanded) and the detection rate are the same for OMS A and C. , OMS A confirmation order (2nd place) exceeds OMS C confirmation order (3rd place). However, when the extended detection number is used, the extended detection number (5/6) of OMS C exceeds the extended detection number (4/6) of OMS A. For this reason, the result that the confirmation order (2nd place) of OMS C is higher than the confirmation order (3rd place) of OMS A is obtained. This means that by using the expanded number of detections, it is possible to improve the accuracy of estimation using an actual failure location (OMSC) as a suspect location.

<面的分析のパラメータの組み合わせ>
これまでに説明したパラメータ(検出数、検出率、近傍情報(近傍コンポーネント)、故障率(または故障していない率))を組み合わせて、コンポーネントの確認順を決定することができる。なお、全種類のパラメータを用いる必要はない。
パラメータの組み合わせの説明を、図8(a)に示す簡略構成図を用いて行う。図8(a)において、L3網上には、パス[1]〜[4]が設定されているとする。
パス[1]は、ルータ31〜34を経由する論理的な通信路である。よって、パス[1]が経由するL3網上の機器を収容するOMSは、OMS A,B,Cとなる。
パス[2]は、ルータ32〜34をこの順(またはこの逆の順)で経由する論理的な通信路である。よって、パス[2]が経由するL3網上の機器を収容するOMSは、OMS B,Cとなる。
パス[3]は、ルータ35,31〜33を経由する論理的な通信路である。よって、パス[3]が経由するL3網上の機器を収容するOMSは、OMS E,A,Bとなる。
パス[4]は、ルータ35,31を経由する論理的な通信路である。よって、パス[4]が経由するL3網上の機器を収容するOMSは、OMS Eとなる。
<Combination of area analysis parameters>
By combining the parameters described above (number of detections, detection rate, proximity information (neighboring components), failure rate (or failure rate)), the component confirmation order can be determined. Note that it is not necessary to use all types of parameters.
The combination of parameters will be described with reference to the simplified configuration diagram shown in FIG. In FIG. 8A, it is assumed that paths [1] to [4] are set on the L3 network.
The path [1] is a logical communication path that passes through the routers 31 to 34. Therefore, OMSs that accommodate devices on the L3 network through which the path [1] passes are OMS A, B, and C.
The path [2] is a logical communication path that passes through the routers 32 to 34 in this order (or the reverse order). Therefore, the OMSs that accommodate the devices on the L3 network through which the path [2] passes are OMS B and C.
The path [3] is a logical communication path that passes through the routers 35 and 31 to 33. Therefore, the OMSs that accommodate the devices on the L3 network through which the path [3] passes are OMS E, A, and B.
The path [4] is a logical communication path that passes through the routers 35 and 31. Therefore, the OMS that accommodates the device on the L3 network through which the path [4] passes is OMS E.

OMS Bにて故障(×で図示)が発生したとする。また、パス[1],[2],[4]で異常が検出されたとする。よって、OMS Bが収容する機器を経由しないパス[4]での異常検出は、誤検出となる。また、OMS Bが収容する機器を経由するパス[3]での異常検出はなく、パス[3]では検出漏れがある。図8(a)中の破線矢印は、L3網上のパスと、当該パスが経由する機器を収容するOMSとの関係を示すとともに、当該パスで検出漏れがあったことを示す。また、図8(a)に対し、OMSごとの確認順の決定に関する表は、図8(b)に示す通りである。   Assume that a failure (illustrated by x) occurs in OMS B. Further, it is assumed that an abnormality is detected in the paths [1], [2], and [4]. Therefore, the abnormality detection in the path [4] that does not pass through the device accommodated in the OMS B is a false detection. Further, there is no abnormality detection in the path [3] via the device accommodated by the OMS B, and there is a detection failure in the path [3]. A broken-line arrow in FIG. 8A indicates the relationship between the path on the L3 network and the OMS that accommodates the device through which the path passes, and indicates that there was a detection omission in the path. Also, with respect to FIG. 8A, a table relating to determination of the confirmation order for each OMS is as shown in FIG.

(組み合わせ方法1)
パラメータの組み合わせを使用する場合、例えば、パラメータごとに優先度を付与し、優先度の高いパラメータからコンポーネントの確認順を決定する方法がある。この方法において、優先度の高いパラメータにて同値をとるコンポーネントについては、次に優先度の高いパラメータで判断する。この方法は、先述した確認順決定ルールと同様である。故障位置特定装置100は、パラメータに付与する優先度を優先度情報として記憶部に記憶している。優先度情報は、例えば、故障位置特定装置100のオペレータが決定することができる。
(Combination method 1)
When using a combination of parameters, for example, there is a method in which a priority is assigned to each parameter, and a component confirmation order is determined from a parameter having a high priority. In this method, components having the same value in a parameter having a high priority are determined using the parameter having the next highest priority. This method is the same as the confirmation order determination rule described above. The failure location device 100 stores the priority assigned to the parameter as priority information in the storage unit. The priority information can be determined by, for example, an operator of the failure location device 100.

図8(b)に示すように、例えば、検出数、検出率、近傍コンポーネント、故障率といったパラメータに対してそれぞれ、優先度1,2,4,3といった優先度情報を付与することができる。優先度1,2,3,4の順に優先度が高い。この場合、検出数、検出率、故障率、近傍コンポーネントという優先度で確認順を決定する。   As shown in FIG. 8B, for example, priority information such as priorities 1, 2, 4, and 3 can be assigned to parameters such as the number of detections, detection rates, neighboring components, and failure rates. The priority is higher in the order of priorities 1, 2, 3 and 4. In this case, the order of confirmation is determined by the priority of the number of detections, detection rate, failure rate, and neighboring components.

近傍情報(近傍コンポーネント)については、利用するか否かを適宜決定することができる。近傍情報を利用する場合、近傍情報より優先するパラメータ(近傍情報に付与した優先度よりも高い優先度が付与されたパラメータ)で判定した最優先コンポーネントの近傍と、近傍情報より優先する同一パラメータの次点優先コンポーネントとの間でどちらの詳細分析を優先するかという問題がある。この場合は、例えば、最優先コンポーネントの近傍の詳細分析を優先し、その後、次点優先コンポーネントの詳細分析を行う、という確認順を採用するとよい。
一方、近傍情報を利用しない場合、近傍探索は行わないことを意味し、近傍情報に優先度を付与しないこととして処理することができる。
Whether or not to use the neighborhood information (neighbor component) can be appropriately determined. When using neighborhood information, the neighborhood of the highest-priority component determined by a parameter that has priority over neighborhood information (a parameter that has a higher priority than that assigned to neighborhood information) and the same parameter that takes precedence over neighborhood information There is a problem of which detailed analysis should be given priority with the runner-up priority component. In this case, for example, a confirmation order may be adopted in which priority is given to the detailed analysis of the vicinity of the highest priority component, and then the detailed analysis of the next priority component is performed.
On the other hand, when the neighborhood information is not used, it means that the neighborhood search is not performed, and can be processed as not giving priority to the neighborhood information.

図8(b)の表によれば、検出数(優先度1)→検出率(優先度2)→故障率(優先度3)の順に確認順を決定する(図8(b)の最右欄のカッコ無の数値参照)。そのため、検出数(2)および検出率(100%)が最大となるOMS Cが、確認順が1位となる。近傍情報を利用する場合(近傍コンポーネントに優先度4を付与する場合)、次点(つまり、OMS B)に移る前に、OMS Cの近傍を優先的に探索する。つまり、OMS Cの近傍となるOMS B,Dを優先的に探索する。OMS Dは検出数0なので、OMS BがOMS Dよりも優先する。その結果、OMS Bの確認順が2位となり、OMS Dの確認順が3位となる。なお、OMS A,Eについては、最優先のOMS Cに対して、OMS B,Dの次に近傍となるOMS Aが、OMS Cから最も遠いOMS Eよりも優先される。その結果、OMS Aの確認順が4位となり、OMS Eの確認順が5位となる。   According to the table of FIG. 8B, the confirmation order is determined in the order of the number of detections (priority 1) → detection rate (priority 2) → failure rate (priority 3) (rightmost in FIG. 8B). (See the parenthesized numbers in the column). Therefore, the OMS C that maximizes the number of detections (2) and the detection rate (100%) is ranked first. When using the neighborhood information (when priority 4 is given to the neighborhood component), the neighborhood of OMS C is preferentially searched before moving to the next point (that is, OMS B). That is, OMS B and D that are in the vicinity of OMS C are preferentially searched. Since OMS D has a detection number of 0, OMS B has priority over OMS D. As a result, the confirmation order of OMS B is second, and the confirmation order of OMS D is third. As for OMS A and E, OMS A that is next to OMS B and D is given priority over OMS E that is farthest from OMS C over OMS C that has the highest priority. As a result, the confirmation order of OMS A is fourth, and the confirmation order of OMS E is fifth.

近傍情報を利用しない場合(近傍コンポーネントに優先度を付与しない場合)、近傍探索を行わないため、OMS Cの次点となるOMS Bの確認順が2位となる(図8(b)の最右欄のカッコ内の数値参照)。なお、残りのOMS A,D,Eについては、まず、検出数が0となるOMS Dの確認順が5位となる。OMS A,Eについては、検出数(1)および検出率(50%)がともに同じであり、故障率において、OMS E(故障率0.3)のほうがOMS A(故障率0.2)よりも大きいため優先される。結果として、OMS Eの確認順が3位となり、OMS Aの確認順が4位となる。   When the neighborhood information is not used (when the priority is not given to the neighborhood component), the neighborhood search is not performed, and therefore, the confirmation order of OMS B which is the next point of OMS C is the second place (the highest in FIG. 8B). (See the value in parentheses on the right column). For the remaining OMS A, D and E, the confirmation order of OMS D where the number of detections is 0 is first. For OMS A and E, the number of detections (1) and the detection rate (50%) are both the same, and in terms of failure rate, OMS E (failure rate 0.3) is better than OMS A (failure rate 0.2). Is also given priority. As a result, the confirmation order of OMS E is third, and the confirmation order of OMS A is fourth.

(組み合わせ方法2)
パラメータの組み合わせを使用する場合、例えば、各パラメータを数値化して合算し、合算値の大きいコンポーネントを優先するようにコンポーネントの確認順を決定する方法がある。パラメータの数値化は、例えば、各パラメータ値に所定の係数を乗じて合算するという方法をとることができる。図8(b)の表には、OMSごとの合算値(a〜e)が登録される。
(Combination method 2)
When using a combination of parameters, for example, there is a method of quantifying and summing up each parameter and determining a component confirmation order so that a component with a large sum is given priority. For example, the parameter can be digitized by multiplying each parameter value by a predetermined coefficient and adding up the values. In the table of FIG. 8B, the total values (a to e) for each OMS are registered.

近傍情報を利用する場合、例えば、近傍コンポーネントを用いない暫定的な合算値を計算した後、暫定的な合算値の高いコンポーネントの近傍コンポーネントに対して、所定値を加算し、最終的な合算値を計算するとよい。図8(b)の表には、OMSごとの最終的な合算値(a〜e)が登録される。最終的な合算値の大きいコンポーネントを優先するようにコンポーネントの確認順を決定する。
上記のようにパラメータを組み合わせることで、被疑箇所の特定の精度をより向上させることができる。
When using neighborhood information, for example, after calculating a provisional summation value that does not use neighboring components, add a predetermined value to the neighboring component of a component with a high provisional summation value, and obtain a final summation value. It is good to calculate. In the table of FIG. 8B, final combined values (a to e) for each OMS are registered. The order in which the components are confirmed is determined so as to give priority to the component having a large final sum.
By combining the parameters as described above, the specific accuracy of the suspected place can be further improved.

<誤検出の除去>
L3網上のパス(群)での異常検出に、誤検出が含まれていると判定した場合には、その誤検出を除去した残りの異常検出からコンポーネントの確認順を決定することができる。例えば、各異常検出に対応するコンポーネントを特定して、特定したコンポーネントから異常検出があったパス間の類似度を評価し、類似度の小さなパスでの異常検出を誤検出とすることができる。
<Removal of false detection>
When it is determined that the detection of an abnormality in the path (group) on the L3 network includes an erroneous detection, the component confirmation order can be determined from the remaining abnormal detections from which the erroneous detection has been removed. For example, it is possible to identify a component corresponding to each abnormality detection, evaluate the similarity between paths in which an abnormality is detected from the identified component, and detect abnormality detection in a path with a small similarity.

誤検出の除去の説明を、図9(a)に示す簡略構成図を用いて行う。図9(a)において、L3網上には、パス[1]〜[4]が設定されているとする。
パス[1]は、ルータ31〜34を経由する論理的な通信路である。よって、パス[1]が経由するL3網上の機器を収容するOMSは、OMS A,B,Cとなる。
パス[2]は、ルータ32〜34をこの順(またはこの逆の順)で経由する論理的な通信路である。よって、パス[2]が経由するL3網上の機器を収容するOMSは、OMS B,Cとなる。
パス[3]は、ルータ31,32を経由する論理的な通信路である。よって、パス[3]が経由するL3網上の機器を収容するOMSは、OMS Aとなる。
パス[4]は、ルータ33,32,34をこの順(またはこの逆の順)で経由する論理的な通信路である。よって、パス[4]が経由するL3網上の機器を収容するOMSは、OMS B,Dとなる。
The removal of erroneous detection will be described with reference to the simplified configuration diagram shown in FIG. In FIG. 9A, it is assumed that paths [1] to [4] are set on the L3 network.
The path [1] is a logical communication path that passes through the routers 31 to 34. Therefore, OMSs that accommodate devices on the L3 network through which the path [1] passes are OMS A, B, and C.
The path [2] is a logical communication path that passes through the routers 32 to 34 in this order (or the reverse order). Therefore, the OMSs that accommodate the devices on the L3 network through which the path [2] passes are OMS B and C.
The path [3] is a logical communication path that passes through the routers 31 and 32. Therefore, the OMS that accommodates the device on the L3 network through which the path [3] passes is OMS A.
The path [4] is a logical communication path that passes through the routers 33, 32, and 34 in this order (or the reverse order). Accordingly, the OMSs that accommodate the devices on the L3 network through which the path [4] passes are OMS B and D.

OMS Cにて故障(×で図示)が発生したとする。また、パス[1]〜[4]で異常が検出されたとする。よって、OMS Cが収容する機器を経由しないパス[3],[4]での異常検出は、誤検出となる。   Assume that a failure (indicated by x) occurs in OMSC. Further, it is assumed that an abnormality is detected in the paths [1] to [4]. Therefore, the abnormality detection in the paths [3] and [4] that do not pass through the device accommodated by the OMS C is a false detection.

図9(b)は、誤検出の判定に関する表である。故障位置特定装置100は、図9(b)の表に相当する情報を記憶部に記憶している。また、図9(a)に対し、OMSごとの確認順の決定に関する表は、図9(c)に示す通りである。検出数、検出率、故障率の順に優先する確認順決定ルールを採用する。   FIG. 9B is a table relating to determination of erroneous detection. The failure location device 100 stores information corresponding to the table in FIG. 9B in the storage unit. Also, with respect to FIG. 9 (a), a table relating to determination of the confirmation order for each OMS is as shown in FIG. 9 (c). A confirmation order decision rule that prioritizes the order of detection number, detection rate, and failure rate is adopted.

図9(b)の表には、「異常検出パス」、「通過コンポーネント(OMS)」、「類似度メトリック」といった項目が設けられている。
「異常検出パス」は、L3網上に設定されたパスのうち、異常が検出されたパスである。
「通過コンポーネント」は、対象の異常検出パスが設定されているL3網上の機器を収容するコンポーネントをOMS単位で示す。
「類似度メトリック」は、対象の異常検出パスで発生した異常検出と、対応の通過コンポーネントに発生した他の異常検出との間の類似度を評価する評価値である。評価値の決定には以下の例1,2がある。
In the table of FIG. 9B, items such as “abnormality detection path”, “passing component (OMS)”, and “similarity metric” are provided.
The “abnormality detection path” is a path in which an abnormality is detected among the paths set on the L3 network.
The “passing component” indicates a component that accommodates a device on the L3 network in which the target abnormality detection path is set, in OMS units.
The “similarity metric” is an evaluation value for evaluating the similarity between the abnormality detection that has occurred in the target abnormality detection path and the other abnormality detection that has occurred in the corresponding passing component. There are the following examples 1 and 2 in determining the evaluation value.

(例1)
評価値として、異常検出パスに対応する通過コンポーネントの各々について、当該通過コンポーネントに対応する他の異常検出パスの数の最大数とする方式である。換言すれば、例1の評価値は、同一のコンポーネントで共有する異常検出の数の最大数ともいえる。
(Example 1)
As the evaluation value, for each passing component corresponding to the abnormality detection path, the maximum number of other abnormality detection paths corresponding to the passage component is used. In other words, the evaluation value of Example 1 can be said to be the maximum number of abnormality detections shared by the same component.

例えば、図9(b)の表のうち異常検出パス[1]に注目すると、対応する通過コンポーネントはOMS A,B,Cである。
OMS Aは、注目する異常検出パス[1]の異常検出の他に、異常検出パス[3]の異常検出を共有している。よって、OMS Aで共有する異常検出の数は1である。
また、OMS Bは、注目する異常検出パス[1]の異常検出の他に、異常検出パス[2],[4]の異常検出を共有している。よって、OMS Bで共有する異常検出の数は2である。
また、OMS Cは、注目する異常検出パス[1]の異常検出の他に、異常検出パス[2]の異常検出を共有している。よって、OMS Cで共有する異常検出の数は1である。
上記によれば、OMS Bで共有する異常検出の数である2が最大数となるので、評価値として2が「類似度メトリック」に登録される。
For example, when attention is paid to the abnormality detection path [1] in the table of FIG. 9B, the corresponding passing components are OMS A, B, and C.
OMS A shares the abnormality detection of the abnormality detection path [3] in addition to the abnormality detection of the abnormality detection path [1] of interest. Therefore, the number of abnormality detections shared by OMS A is 1.
The OMS B shares the abnormality detection of the abnormality detection paths [2] and [4] in addition to the abnormality detection of the abnormality detection path [1] of interest. Therefore, the number of abnormality detections shared by OMS B is two.
Further, the OMS C shares the abnormality detection of the abnormality detection path [2] in addition to the abnormality detection of the abnormality detection path [1] of interest. Therefore, the number of abnormality detections shared by OMS C is 1.
According to the above, since 2 which is the number of abnormality detections shared by OMS B is the maximum number, 2 is registered in the “similarity metric” as the evaluation value.

図9(b)の表の他の異常検出パス[2]〜[4]についても上記と同様にして評価値を求めることができる。
異常検出パス[2]については、OMS Bで共有する異常検出の数(2)が最大数となるので、評価値として2が「類似度メトリック」に登録される。
異常検出パス[3]については、OMS Aで共有する異常検出の数(1)が最大数となるので、評価値として1が「類似度メトリック」に登録される。
異常検出パス[4]については、OMS Bで共有する異常検出の数(2)が最大数となるので、評価値として2が「類似度メトリック」に登録される。
Evaluation values can be obtained for the other abnormality detection paths [2] to [4] in the table of FIG.
For the abnormality detection path [2], the number (2) of abnormality detections shared by the OMS B is the maximum number, so 2 is registered in the “similarity metric” as the evaluation value.
For the abnormality detection path [3], the number (1) of abnormality detections shared by OMS A is the maximum number, so 1 is registered as the evaluation value in the “similarity metric”.
For the abnormality detection path [4], the number (2) of abnormality detections shared by the OMS B is the maximum number, so 2 is registered as the evaluation value in the “similarity metric”.

他のコンポーネントのいずれとも異常検出を共有していない異常検出、または、他のコンポーネントと共有している異常検出の数が相対的に少ない異常検出は、(2重故障がない場合)誤検出である可能性が高いと考えることができる。よって、例1において、評価値が最小である異常検出パス[3]は誤検出として除去する候補とすることができる。   Anomaly detection that does not share anomaly detection with any of the other components, or anomaly detection with a relatively small number of anomaly detections shared with other components, is a false detection (when there is no double failure). It can be considered that there is a high possibility. Therefore, in Example 1, the abnormality detection path [3] having the smallest evaluation value can be a candidate to be removed as an erroneous detection.

(例2)
評価値として、異常検出パスに対応する通過コンポーネントの少なくとも1つに対応する他の異常検出パスの数とする方式である。換言すれば、例2の評価値は、任意のコンポーネントで共有する異常検出の数ともいえる。
(Example 2)
In this method, the evaluation value is the number of other abnormality detection paths corresponding to at least one passing component corresponding to the abnormality detection path. In other words, the evaluation value of Example 2 can be said to be the number of abnormality detections shared by any component.

例えば、図9(b)の表のうち異常検出パス[1]に注目すると、対応する通過コンポーネントはOMS A,B,Cである。OMS A,B,Cの少なくとも1つが、異常検出パス[2][3][4]の3つの異常検出を共有している。よって、評価値として3が「類似度メトリック」に登録される。
図9(b)の表の他の異常検出パス[2]〜[4]についても上記と同様にして評価値を求めることができる。
異常検出パス[2]については、OMS B,Cの少なくとも1つが異常検出パス[1][4]の2つの異常検出を共有している。よって、評価値として2が「類似度メトリック」に登録される。
異常検出パス[3]については、OMS Aが異常検出パス[1]の1つの異常検出を共有している。よって、評価値として1が「類似度メトリック」に登録される。
異常検出パス[4]については、OMS B,Dの少なくとも1つ(図9(a)によればBのみ)が異常検出パス[1][2]の2つの異常検出を共有している。よって、評価値として2が「類似度メトリック」に登録される。
For example, when attention is paid to the abnormality detection path [1] in the table of FIG. 9B, the corresponding passing components are OMS A, B, and C. At least one of the OMSs A, B, and C shares three abnormality detections of the abnormality detection paths [2] [3] [4]. Therefore, 3 is registered in the “similarity metric” as the evaluation value.
Evaluation values can be obtained for the other abnormality detection paths [2] to [4] in the table of FIG.
For the abnormality detection path [2], at least one of the OMS B and C shares the two abnormality detections of the abnormality detection path [1] [4]. Therefore, 2 is registered in the “similarity metric” as the evaluation value.
For the abnormality detection path [3], OMS A shares one abnormality detection of the abnormality detection path [1]. Therefore, 1 is registered in the “similarity metric” as the evaluation value.
For the abnormality detection path [4], at least one of OMS B and D (only B according to FIG. 9A) shares the two abnormality detections of the abnormality detection path [1] [2]. Therefore, 2 is registered in the “similarity metric” as the evaluation value.

例1と同様、他のコンポーネントのいずれとも異常検出を共有していない異常検出、または、他のコンポーネントと共有している異常検出の数が相対的に少ない異常検出は、(2重故障がない場合)誤検出である可能性が高いと考えたとき、評価値が最小である異常検出パス[3]は誤検出として除去する候補とすることができる。   As in Example 1, an anomaly detection that does not share an anomaly detection with any of the other components, or an anomaly detection that has a relatively small number of anomaly detections shared with other components (no double failure) Case) When the possibility of erroneous detection is considered high, the abnormality detection path [3] having the smallest evaluation value can be a candidate to be removed as erroneous detection.

図9(c)の表において、異常検出パス[3]を誤検出として除去しないときは、OMS Aと、OMS Cとの間で検出数が同じである。しかし、故障率の違いのため、OMS Aの確認順の順位(2位)が、OMS Cの順位(3位)を上回る。ここで、異常検出パス[3]を誤検出として除去した場合、OMS Aの検出数が「2」から「1」に減じられる。これに伴い、OMS Aの検出率は「50%」になる。よって、OMS Aの検出数の減少により、OMS Cが優先され、確認順は2位となる。これに伴い、検出率の関係で、OMS Dの順位(3位)、OMS Aの順位(4位)が決定される。結果として、実際の故障個所であるOMS Cの確認順(3位→2位)を向上させることができる。   In the table of FIG. 9C, when the abnormality detection path [3] is not removed as a false detection, the number of detections is the same between OMS A and OMS C. However, due to the difference in failure rate, the order of confirmation of OMS A (second place) exceeds that of OMS C (third place). Here, when the abnormality detection path [3] is removed as an erroneous detection, the number of detected OMS A is reduced from “2” to “1”. Accordingly, the detection rate of OMS A becomes “50%”. Therefore, OMS C is given priority due to a decrease in the number of detected OMS A, and the confirmation order is second. Accordingly, the rank of OMS D (third place) and the rank of OMS A (fourth place) are determined based on the detection rate. As a result, it is possible to improve the confirmation order (third place → second place) of OMSC which is an actual failure location.

図9の例のように、誤検出と判定することができれば、除去することで、対応するコンポーネントの確認順の順位を下げることができ、被疑箇所の推定精度をさらに向上させることができる。   If it can be determined that there is a false detection as in the example of FIG. 9, by removing it, the order of confirmation of the corresponding components can be lowered, and the estimation accuracy of the suspected place can be further improved.

<レイヤ間判定>
上位レイヤの異常検出(例:ユーザ申告、トラヒック減)から下位レイヤの被疑箇所をコンポーネント単位で推定する場合、上位レイヤの正常性確認の確認結果を用いて、下位レイヤの被疑箇所を絞り込むことができる場合がある。この絞り込みの効果が、上位レイヤの正常性確認に伴う時間ロスを補って余りあれば、下位レイヤの面的分析を、上位レイヤの正常性確認の確認結果で補強することが有用である。
<Determination between layers>
When estimating the suspicious location of the lower layer on a component basis from the upper layer anomaly detection (eg, user declaration, traffic reduction), it is possible to narrow down the suspicious location of the lower layer using the confirmation result of the upper layer normality confirmation There are cases where it is possible. If this narrowing effect is sufficient to compensate for the time loss associated with the higher layer normality confirmation, it is useful to reinforce the area analysis of the lower layer with the confirmation result of the higher layer normality confirmation.

例えば、図1の通信システムの構成図において、L3網上には、パス[2],[3]のみが設定されており、パス[1]が設定されていないものを対象にした具体例を説明する。サービス網上でなされたユーザ申告(サーバ41,43間のパス(一点鎖線))によって、OMS A,Bの2区間が被疑候補となったとする。この場合、以下の2通りの対処が考えられる。
対処1:OMS A,Bの2区間を対象にして面的分析を行う。
対処2:L3網の正常性確認によって情報を補強してから面的分析を行う。
For example, in the configuration diagram of the communication system of FIG. 1, a specific example for a case where only the paths [2] and [3] are set on the L3 network and the path [1] is not set. explain. It is assumed that two sections of OMS A and B are suspected candidates due to a user declaration made on the service network (path between the servers 41 and 43 (dashed line)). In this case, the following two measures can be considered.
Solution 1: Perform a two-dimensional analysis of the two sections of OMS A and B.
Countermeasure 2: A surface analysis is performed after reinforcing the information by checking the normality of the L3 network.

サービス網に対するユーザ申告に対し、被疑OMS A,Bが収容するL3網上の機器を経由する2つのパス[2],[3]の正常性を確認する。L3網上のパスの正常性確認の方法は周知であり、説明は省略する。結果として、L3網上のパスの正常性確認によって、被疑候補をOMS Bの1区間に絞り込むことができるとする。なお、この1区間への絞り込みは、被疑候補の範囲に属する下位レイヤの機器の各々で故障していると見積もられる確率が一様に分布していると予想される最悪ケースであっても実現することができるとする。   In response to the user declaration to the service network, the normality of the two paths [2] and [3] passing through the devices on the L3 network accommodated by the suspected OMS A and B is confirmed. The method for confirming the normality of the path on the L3 network is well known and will not be described. As a result, it is assumed that the suspect candidates can be narrowed down to one section of OMS B by checking the normality of the path on the L3 network. This narrowing down to one section is realized even in the worst case where it is expected that the probability of failure of each of the lower layer devices belonging to the range of the suspected candidate is uniformly distributed. Suppose you can.

例えば、L3網上のパスの正常性確認に要する時間が時間オーダであり、1区間ごとのOMSの面的分析に要する時間が日オーダである場合には、最悪ケースでもOMS1区間に絞り込むことができるため、対処2を選択するほうが故障位置特定を短時間で済ませることができ有用であるといえる。   For example, if the time required for checking the normality of the path on the L3 network is in the time order and the time required for the area analysis of the OMS for each section is in the day order, the section can be narrowed down to the OMS1 section even in the worst case. Therefore, it can be said that it is more useful to select the countermeasure 2 because the failure position can be specified in a short time.

1コンポーネントの面的分析に要する稼働時間である分析オーバヘッド情報を活用する。故障位置特定装置100は、分析オーバヘッド情報を記憶部に記憶している。分析オーバヘッド情報の内容、つまり分析対象の稼働時間は、オペレータには既知であるとする。   Utilize analysis overhead information, which is the operating time required for one-component area analysis. The failure location device 100 stores analysis overhead information in a storage unit. It is assumed that the content of the analysis overhead information, that is, the operation time of the analysis target is known to the operator.

一般的には、「故障箇所の推定確度向上による下位レイヤの分析オーバヘッドの削減効果」>「故障箇所の推定確度向上のための上位レイヤの分析オーバヘッド」という関係式を満たす場合、故障箇所の推定確度の向上、つまり、上位レイヤのパスの正常性確認を優先する。
ここで、推定確度は、最悪ケースの手順数、つまり、被疑候補のコンポーネントの数(被疑候補の範囲に属する下位レイヤの機器の各々で故障していると見積もられる確率が一様に分布している場合の期待値として表現することができたときの分析の手順数)をいう。
また、「下位レイヤの分析オーバヘッド」とは、下位レイヤの被疑候補に該当する下位レイヤの機器それぞれの分析オーバヘッドの合計をいう。
また、「下位レイヤの分析オーバヘッドの削減効果」は、被疑候補の絞り込みによって排除される下位レイヤの機器それぞれの分析オーバヘッドの合計に相当する。
また、「上位レイヤの分析オーバヘッド」とは、下位レイヤの被疑候補が収容する上位レイヤの機器それぞれの分析オーバヘッドの合計をいう。
In general, if the relational expression "the lower layer analysis overhead is reduced by improving the failure location estimation accuracy">"the higher layer analysis overhead for improving the failure location estimation accuracy" is satisfied, the failure location estimation Priority is given to improving accuracy, that is, checking the normality of higher-layer paths.
Here, the estimated accuracy is the number of worst-case procedures, that is, the number of suspected candidate components (the probability that the failure is estimated in each of the lower layer devices belonging to the suspected candidate range is uniformly distributed. The number of analysis procedures when it can be expressed as an expected value.
The “lower layer analysis overhead” refers to the total analysis overhead of each lower layer device corresponding to the suspected candidate for the lower layer.
The “lower layer analysis overhead reduction effect” corresponds to the total analysis overhead of each lower layer device excluded by narrowing down the suspect candidates.
The “upper layer analysis overhead” refers to the total analysis overhead of the upper layer devices accommodated by the lower layer suspect candidates.

上記の具体例(最悪ケースでの計算の場合)でいえば、「故障箇所の推定確度向上による下位レイヤの分析オーバヘッドの削減効果」は、(L3網の正常性未確認時での2区間のOMS − L3網の正常性確認後の1区間のOMS) × 日オーダ = 1×日オーダの削減と表すことができる。
また、「故障箇所の推定確度向上のための上位レイヤの分析オーバヘッド」は、L3網状に設定されたパス2つ × 時間オーダ = 2×時間オーダと表すことができる。上記関係式によれば、いくつか分の時間オーダの時間短縮が見込まれるため、L3網の正常性を行うことが有用であるといえる。
Speaking of the above specific example (in the case of the worst case calculation), “the effect of reducing the analysis overhead of the lower layer by improving the estimation accuracy of the fault location” is (the OMS of two sections when the normality of the L3 network is not confirmed) -OMS of one section after normality check of L3 network) × Daily order = 1 × Reduction in daily order.
The “upper layer analysis overhead for improving the estimated accuracy of the fault location” can be expressed as 2 paths set in L3 network × time order = 2 × time order. According to the above relational expression, it can be said that it is useful to perform normality of the L3 network because time reduction of several minutes is expected.

≪まとめ≫
本実施形態によれば、確率的に発現し、下位レイヤの故障位置の特定を元々困難にしている上位レイヤの異常検出から、下位レイヤのコンポーネント単位でのパラメータの分布を求めることができる。このような分布でパラメータが極端な値を示すコンポーネントを見つけることができ、見つけたコンポーネントを故障が発生したコンポーネントと推定することができる。これにより、下位レイヤの故障の被疑範囲を絞り込むことができる。換言すれば、下位レイヤの故障の位置を最終的に特定するために多大な負担を伴う詳細分析を行う対象を効率的に絞り込むことができる。
したがって、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定するための稼働を削減することができる。
≪Summary≫
According to this embodiment, it is possible to obtain the parameter distribution in the component unit of the lower layer from the abnormality detection of the upper layer that appears stochastically and makes it difficult to identify the failure position of the lower layer. A component having an extreme value in the parameter can be found in such a distribution, and the found component can be estimated as a component in which a failure has occurred. Thereby, the suspected range of the failure of the lower layer can be narrowed down. In other words, it is possible to efficiently narrow down the target for performing detailed analysis with a great burden in order to finally specify the position of the failure in the lower layer.
Therefore, it is possible to reduce the operation for specifying the position of the failure that has occurred in the lower layer with respect to the abnormality detection of the upper layer.

また、複数のコンポーネントを対象にして、パラメータの値に応じた順位付けを行うことで、詳細分析を優先的に行うコンポーネントを決定することができる。このため、優先順位の高いコンポーネントから順に詳細分析を行うことで、下位レイヤの故障の位置の特定するための稼働をさらに削減することができる。   In addition, by performing ranking according to the parameter values for a plurality of components, it is possible to determine a component for which detailed analysis is preferentially performed. For this reason, by performing detailed analysis in order from the component with the highest priority, it is possible to further reduce the operation for specifying the position of the failure in the lower layer.

また、パラメータを、コンポーネント単位の検出数、検出率、故障率、故障していない率、重み付け検出数のいずれかとすることで、下位レイヤのコンポーネント単位での各種類のパラメータの分布を数値化することができる。よって、パラメータが極端な値を示すコンポーネントを容易に見つけることができる。   In addition, the parameter is any one of the number of detected components, the detection rate, the failure rate, the non-failure rate, and the number of weighted detections, thereby quantifying the distribution of each type of parameter in the lower layer component units. be able to. Therefore, it is possible to easily find a component whose parameter shows an extreme value.

また、パラメータが複数種類ある場合、それらの複数種類のパラメータを用いて、故障が発生したコンポーネントの推定を実現することができる。   Further, when there are a plurality of types of parameters, it is possible to realize the estimation of the component in which the failure has occurred using the plurality of types of parameters.

また、パラメータの値にしたがった故障の推定ではなく、下位レイヤの故障が発生したと推定したコンポーネントの近傍のコンポーネントを優先して詳細分析を行うことができる。   Further, the detailed analysis can be performed with priority given to the component in the vicinity of the component that is estimated to have a failure in the lower layer, not the failure estimation according to the parameter value.

また、パス間の類似度を評価し、誤検出を除去した上で、下位レイヤのコンポーネント単位でのパラメータの分布を求めることができる。このため、下位レイヤの故障の被疑範囲の絞り込みの精度を向上させることができる。   In addition, it is possible to obtain the parameter distribution in the component unit of the lower layer after evaluating the similarity between paths and removing the false detection. For this reason, it is possible to improve the accuracy of narrowing down the suspected range of failure in the lower layer.

本発明は、上記実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で、変更実施が可能である。例えば、下位レイヤ(L0/L1網)のコンポーネント単位をOMSとしたが、コンポーネントとして、OMSよりも大きな単位となるOCh(Optical Channel)、OTU(Optical Transport Unit)などとしてもよいし、OMSよりも小さな単位となるOTS(Optical Transmission Section)などとしてもよい。   The present invention is not limited to the above embodiment, and can be modified without departing from the spirit of the present invention. For example, although the component unit of the lower layer (L0 / L1 network) is OMS, the component may be OCh (Optical Channel), OTU (Optical Transport Unit), etc., which are larger than OMS, or more than OMS. It may be an OTS (Optical Transmission Section) that is a small unit.

また、本実施形態では、確認順決定部3によって、被疑範囲となるコンポーネントごとの順位付けを行ったが、最も疑わしい(確認順が1位の)コンポーネントだけを特定してもよい。このような特定により、面的分析の処理を高速化することができる。   In this embodiment, the confirmation order determination unit 3 ranks the components that are in the suspicious range. However, only the most suspicious component (the confirmation order is first) may be specified. Such identification can speed up the area analysis process.

また、本実施形態で説明した種々の技術を適宜組み合わせた技術を実現することもできる。
また、本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
その他、ハードウェア、ソフトウェア、処理手順などについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
In addition, it is possible to realize a technique in which various techniques described in this embodiment are appropriately combined.
Further, the software described in the present embodiment can be realized as hardware, and the hardware can also be realized as software.
In addition, hardware, software, processing procedures, and the like can be changed as appropriate without departing from the spirit of the present invention.

100 故障位置特定装置
1−1〜1−4 網構成管理部
1a〜1d 網構成情報
2−1〜2−3 性能情報管理部
2−4 ユーザ申告管理部
2a〜2c 性能情報
2d 申告情報
3 確認順決定部(制御部:制御手段)
3a レイヤ間収容情報
3b 確認順情報
4 故障位置特定部
DESCRIPTION OF SYMBOLS 100 Failure location device 1-1 to 1-4 Network configuration management unit 1a to 1d Network configuration information 2-1 to 2-3 Performance information management unit 2-4 User report management unit 2a to 2c Performance information 2d Report information 3 Confirmation Order determination unit (control unit: control means)
3a Inter-layer accommodation information 3b Confirmation order information 4 Fault location specifying part

Claims (8)

上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定する故障位置特定装置であって、
前記下位レイヤの機器がコンポーネント単位に分類されており、
前記下位レイヤのコンポーネントごとに、前記上位レイヤの異常検出を、1または複数種類のパラメータに換算し、
前記換算したパラメータを用いて故障が発生したコンポーネントを推定する制御部、を備える、
ことを特徴とする故障位置特定装置。
A fault location device that identifies the location of a fault that has occurred in a lower layer for anomaly detection in an upper layer,
The lower layer devices are classified into component units,
For each component of the lower layer, the abnormality detection of the upper layer is converted into one or more types of parameters,
A control unit that estimates a component in which a failure has occurred using the converted parameter,
A fault location apparatus characterized by that.
前記制御部は、
前記故障の位置特定に関して、前記パラメータの値に応じて前記下位レイヤのコンポーネントの各々を順位付けする、
ことを特徴とする請求項1に記載の故障位置特定装置。
The controller is
With respect to locating the fault, each of the lower layer components is ranked according to the value of the parameter;
The fault location device according to claim 1.
前記パラメータは、
(1)前記コンポーネントの各々が収容する前記上位レイヤの機器を経由するパスのうち、前記異常検出があったパスの数となる、コンポーネント単位の検出数、
(2)前記コンポーネントの各々が収容する前記上位レイヤの機器を経由するパスの数である収容数と、前記検出数との比となる、コンポーネント単位の検出率、
(3)前記コンポーネントの各々に属する前記下位レイヤの機器の過去の故障から求められる、コンポーネント単位の故障率、
(4)前記故障率に基づいて、前記異常検出に対し、前記コンポーネントの各々に属する前記下位レイヤの機器の故障していない確率である、コンポーネント単位の故障していない率、
(5)前記上位レイヤのパスの各々に対応するコンポーネント数の逆数を用いて前記検出数の重み付けした、コンポーネント単位の重み付け検出数、のいずれかである、
ことを特徴とする請求項1または請求項2に記載の故障位置特定装置。
The parameter is
(1) The number of detections in component units, which is the number of paths in which the abnormality is detected, among paths passing through the upper layer devices accommodated by each of the components,
(2) A detection rate in units of components, which is a ratio between the number of accommodations that is the number of paths that pass through the higher-layer device accommodated by each of the components and the number of detections,
(3) a failure rate in units of components determined from past failures of the lower layer devices belonging to each of the components;
(4) Based on the failure rate, a failure rate of component units, which is a probability that the lower layer device belonging to each of the components does not fail for the abnormality detection,
(5) One of the weighted detection numbers in component units, wherein the number of detections is weighted using the reciprocal of the number of components corresponding to each path of the upper layer.
The fault location apparatus according to claim 1 or 2, characterized by the above.
前記パラメータが複数種類あり、
前記制御部は、
前記パラメータを複数種類組み合わせて故障が発生したコンポーネントを推定する場合、
前記組み合わせた複数種類のパラメータの各々に優先度を付与し、前記優先度の高いパラメータから前記推定を実行する、
ことを特徴とする請求項1から請求項3のいずれか1項に記載の故障位置特定装置。
There are multiple types of parameters,
The controller is
When estimating a component in which a failure has occurred by combining a plurality of types of the parameters,
Giving priority to each of the plurality of types of combined parameters, and performing the estimation from the high priority parameters,
The fault location apparatus according to any one of claims 1 to 3, wherein
前記制御部は、
前記推定したコンポーネントに故障が無かった場合、当該推定したコンポーネントの近傍のコンポーネントに故障が発生したと推定する、
ことを特徴とする請求項1から4のいずれか1項に記載の故障位置特定装置。
The controller is
When there is no failure in the estimated component, it is estimated that a failure has occurred in a component in the vicinity of the estimated component.
The fault location apparatus according to any one of claims 1 to 4, wherein
前記制御部は、
前記異常検出があった上位レイヤのパスの各々について、当該パスの各々に対応するコンポーネントに基づいて、前記パス間の類似度を評価し、
前記類似度が小さいパスでの異常検出を誤検出として除去する、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の故障位置特定装置。
The controller is
For each path of the upper layer where the abnormality was detected, the similarity between the paths is evaluated based on the component corresponding to each of the paths,
Anomaly detection in a path with a small similarity is removed as a false detection,
The fault location apparatus according to any one of claims 1 to 5, wherein
上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定する故障位置特定装置における故障位置特定方法であって、
前記下位レイヤの機器がコンポーネント単位に分類されており、
前記故障位置特定装置が、
前記下位レイヤのコンポーネントごとに、前記上位レイヤの異常検出を、1または複数種類のパラメータに換算するステップと、
前記換算したパラメータを用いて故障が発生したコンポーネントを推定するステップと、を実行する、
ことを特徴とする故障位置特定方法。
A fault location specifying method in a fault location device for identifying the location of a fault that has occurred in a lower layer with respect to abnormality detection in an upper layer,
The lower layer devices are classified into component units,
The fault location device is
For each lower layer component, converting the upper layer anomaly detection to one or more types of parameters;
Performing a step of estimating a component in which a failure has occurred using the converted parameters;
The fault location method characterized by the above-mentioned.
コンピュータを、上位レイヤの異常検出に対し下位レイヤで発生した故障の位置を特定する故障位置特定装置として機能させるための故障位置特定プログラムであって、
前記下位レイヤの機器がコンポーネント単位に分類されており、
前記コンピュータを、
前記下位レイヤのコンポーネントごとに、前記上位レイヤの異常検出を、1または複数種類のパラメータに換算し、
前記換算したパラメータを用いて故障が発生したコンポーネントを推定する制御手段、
として機能させるための故障位置特定プログラム。
A failure location specifying program for causing a computer to function as a failure location specifying device for specifying a location of a failure that has occurred in a lower layer for abnormality detection of an upper layer,
The lower layer devices are classified into component units,
The computer,
For each component of the lower layer, the abnormality detection of the upper layer is converted into one or more types of parameters,
Control means for estimating a component in which a failure has occurred using the converted parameter;
Fault location program to function as
JP2016200537A 2016-10-12 2016-10-12 Fault location device, fault location method, and fault location program Active JP6586067B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016200537A JP6586067B2 (en) 2016-10-12 2016-10-12 Fault location device, fault location method, and fault location program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016200537A JP6586067B2 (en) 2016-10-12 2016-10-12 Fault location device, fault location method, and fault location program

Publications (2)

Publication Number Publication Date
JP2018064160A JP2018064160A (en) 2018-04-19
JP6586067B2 true JP6586067B2 (en) 2019-10-02

Family

ID=61968054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016200537A Active JP6586067B2 (en) 2016-10-12 2016-10-12 Fault location device, fault location method, and fault location program

Country Status (1)

Country Link
JP (1) JP6586067B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7135969B2 (en) * 2019-03-27 2022-09-13 富士通株式会社 Information processing method and information processing apparatus
WO2021192316A1 (en) * 2020-03-27 2021-09-30 日本電気株式会社 Optical communication system, failure probability estimating device, failure analyzing device, and optical communication system failure analyzing method
WO2023162187A1 (en) * 2022-02-25 2023-08-31 日本電信電話株式会社 Optical transmission system and failure site identification method

Also Published As

Publication number Publication date
JP2018064160A (en) 2018-04-19

Similar Documents

Publication Publication Date Title
EP2795841B1 (en) Method and arrangement for fault analysis in a multi-layer network
US9712290B2 (en) Network link monitoring and testing
JP6586067B2 (en) Fault location device, fault location method, and fault location program
US11316728B2 (en) Method and system for assessing network resource failures using passive shared risk resource groups
EP1768045A2 (en) Application of cut-sets to network interdependency security risk assessment
CN107870832B (en) Multi-path storage device based on multi-dimensional health diagnosis method
US9030928B2 (en) Communication system, communication method and network management apparatus
CN108933694A (en) Data center network Fault Node Diagnosis method and system based on testing data
CN104471902A (en) Deterministic network failure detection
CN111600805B (en) Bayes-based power data network congestion link inference method
JPWO2008108231A1 (en) Quality degradation location estimation method, quality degradation location estimation apparatus, and program
Oi et al. Method for estimating locations of service problem causes in service function chaining
EP1653662A2 (en) Protection switch logging methods and systems
JP2009267858A (en) Wavelength route selection system and wavelength route selection method
CN111865667A (en) Network connectivity fault root cause positioning method and device
US10656988B1 (en) Active monitoring of packet loss in networks using multiple statistical models
JP5722167B2 (en) Fault monitoring determination apparatus, fault monitoring determination method, and program
JP6378653B2 (en) Service impact cause estimation apparatus, service impact cause estimation program, and service impact cause estimation method
Dusia et al. Probe generation for active probing
JP5130968B2 (en) Fault location identification method
US8284044B2 (en) Poll-based alarm handling system and method
CN106713035B (en) Congestion link positioning method based on grouping test
CN115733726A (en) Network group fault determination method and device, storage medium and electronic device
CN115150253B (en) Fault root cause determining method and device and electronic equipment
JP2010147595A (en) Apparatus and method for management of network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190906

R150 Certificate of patent or registration of utility model

Ref document number: 6586067

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150