CN101218786B - 通信网络故障检测系统、通信网络故障检测方法 - Google Patents
通信网络故障检测系统、通信网络故障检测方法 Download PDFInfo
- Publication number
- CN101218786B CN101218786B CN2006800253530A CN200680025353A CN101218786B CN 101218786 B CN101218786 B CN 101218786B CN 2006800253530 A CN2006800253530 A CN 2006800253530A CN 200680025353 A CN200680025353 A CN 200680025353A CN 101218786 B CN101218786 B CN 101218786B
- Authority
- CN
- China
- Prior art keywords
- key factor
- generation intensity
- communication network
- parameter
- alarm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/064—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/02—Capturing of monitoring data
- H04L43/022—Capturing of monitoring data by sampling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
Abstract
一种系统,通过通信网络的管理服务器分析警报日志输出以及评估追溯回引起警报的较重要因素的通信网络的异常度,根据客观基础来检测通信网络上的故障,所述系统根据警报的记录内容来计算引起警报的较重要因素500的发生强度,以及根据所述较重要因素500所计算的发生强度来检测通信网络中源自较重要因素的故障。
Description
技术领域
本发明涉及一种通信网络故障检测系统,以及更具体地涉及一种通信网络故障检测系统、一种通信网络故障检测方法及一种故障检测程序,用于通过分析从通信网络的警报日志中获得的信息来检测通信网络的故障。
背景技术
一般惯例,当通信网络的组件发生异常时,将该异常作为警报向通信网络的管理系统通知,并将其记录在日志中。通信网络的维护人员根据在日志中所记录的警报的时间顺序信息及其他/她的自身经验来估计异常的根本因素以便评估对通信服务所施加的影响等级,以及在通信网络需要改进或其它情况下,确定故障发生。
通常,因为大规模通信系统的管理系统每天都要被通知大量警报,所以手动分析日志的维护人员需要大量劳动。此外,由于在通信网络上出现异常时,大量的相关警报可能出现连锁反应从而隐藏了提示了异常的根本因素的关键警报,需要大量经验来从日志中估计异常的根本因素。在这些情况下,建议了支持这种类型的日志分析的系统以及用于聚集冗余警报的系统。
在日本专利公开No.2004-318552(文献1)中列举了与支持日志分析的系统相关的技术的一个示例。在文献1中所列举的日志分析支持系统是这样一种系统:监控连接到通信网络的侵入感测系统的日志,以便分别观测每单位时间的事件发生(访问动作)数目,计算并呈现出异常度,以便向管理者通知具有观测量异常变化的事件。日志分析支持系统具有以下功能:比较多个侵入感测系统的日志的观测量,以便在比较结果具有大于预定值的差异时确定该观测量是异常的。
在日本专利公开No.3082548(文献2)中列举了与用于聚集冗余警报的系统相关的技术的一个示例。文献2中所列举的警报选择系统检查警报发生次数之中的统计相关性,以便将警报分成其中的每个都具有同步性的单元,其中警报同时发生或者以固定时间延迟发生,由此产生了多组警报。其后,通过选择与发生的事件最接近的一组警报,将大量冗余警报聚集到关键警报内。
文献1:日本专利公开No.2004-318552。
文献2:日本专利No.3082548。
文献3:Noboru Murata,*Introduction:Independent ComponentAnalysis,*Tokyo Electric University Publishing,2004。
然而,上述相关领域存在问题:无法在全面考虑到通过通信网络的管理服务器进行多个警报输出的同时,根据客观基础检测通信网络的故障。
其原因在于,尽管相关技术提供了用于呈现各个警报的异常的单元,但仍然无法提供用于根据通过结合这些信息的客观基础来确定通信网络的状态是否具有故障的单元。在所有警报中的每个的发生次数接近正常范围的界限而将在总体上将网络带入异常状态时,例如,由于各个警报的发生次数处于正常范围内,所以相关技术无法检测到异常。
根据本发明,通过警报系统将导致单个警报的输出状态的因素定义为较不重要的因素,而将导致连锁反应中的多个警报的输出状态的因素定义了较重要的因素。在这种情况下,上述相关技术存在问题:通过追溯较重要因素无法评估通信网络的异常度。
其原因在于,尽管相关技术提供了用于呈现出由较不重要因素所导致的单个警报的异常度的单元、以及用于根据与发生时间相关的时间相关性将警报分成具有同步性的单元并提取较重要因素的单元,但是该相关技术无法提供用于根据较重要因素来估计网络的异常度的单元。在多个不同的较重要因素导致同一警报时,例如其对所讨论的警报的发生次数的变化所施加的作用较弱的较重要因素被作用较强的其它较重要因素的改变所淹没,因此仅通过监控所讨论的警报的发生次 数的改变或者如相关技术所执行的对警报进行分类,无法检测到作用较弱的较重要因素。在由于导致重大故障的较重要因素的警报的发生频率较低时,这尤其是严重的问题。
上述相关技术还存在问题:无法根据各个方面评估在监控时段期间所要监控的通信网络的状态。
其原因在于,该相关技术无法提供用于明确地实现将从多个管理目标处获得的警报数目进行比较以检测其异常的功能的单元,并且只能检测个别警报的异常,因此不可能为了全面地确定该通信网络的状态而同时将地理上相邻的通信网络在监控时段期间的状态与所讨论的通信网络到监控时段为止的状态进行比较。
本发明的目的是提供一种系统,该系统用于分析通信网络的警报,以便全面地考虑多个警报的发生状态,并根据目标基础,通过追溯引起警报的较重要因素来评估通信网络的异常度,以检测通信网络的故障。
本发明的另一目的是提供一种系统,用于通过同时将要在监控时段期间监控的通信网络的状态与监控时段期间地理上相邻的通信网络的状态和所讨论的通信网络到监控时段为止的状态进行比较来检测通信网络的故障,以便根据各个方面来评估通信网络的状态。
发明内容
根据本发明的第一示例性方面,在通信故障时针对其记录了所发出的警报的内容的通信网络中,通信网络故障检测系统根据警报的记录内容来计算引起警报的较重要因素的发生强度(intensity),并根据所计算的较重要因素的发生强度来检测通信网络中源自较重要因素的故障。
根据本发明的第二示例性方面,通信网络故障检测系统包括:较重要因素的发生强度计算单元,用于通过分析警报的记录内容来计算引起警报的较重要因素的发生强度;发生强度概率分布计算单元,用于计算处于正常状态的通信网络中的较重要因素的发生强度的概率分布;异常度计算单元,用于相对于计算得到的较重要因素的发生强度, 将偏离处于正常状态的较重要因素的发生强度概率分布的概率度计算为异常度;以及故障检测单元,用于通过将异常度与预先施加的阈值进行比较来检测通信网络中源自较重要因素的故障。
根据本发明的第三示例性方面,针对较重要因素的发生强度计算单元包括:时间变化参数提取单元,用于从警报的记录内容中提取表示警报发生频率的时间变化的参数,以便将表示时间变化的参数的值看作较重要因素的发生强度;空间变化参数提取单元,用于从警报的记录内容中提取表示警报发生频率的空间变化的参数的值作为较重要因素的发生强度。
本发明实现了以下效果。
第一效果在于:实现了一种故障检测,其精度高于通过简单地监控由多个较重要因素的共存所引起的警报的发生次数的变化所获得的精度。
其原因在于,在记录了通信异常时所产生的警报内容的通信网络中,根据警报的记录内容,计算引起警报的较重要因素的发生强度,以便根据计算得到的较重要因素的发生强度来检测通信网络中源自较重要因素的故障。
第二效果在于:实现了一种故障检测,其客观性高于通过由维护人员在监控各个警报的异常度的同时确定通信网络的状态所获得的客观性。
其原因在于,通信网络的故障是通过以下操作来检测的:分析警报记录内容,以便计算引起警报的较重要因素的发生强度,并在通信网络的正常状态下计算较重要因素的发生强度的概率分布;相对于所计算的较重要因素的发生强度,将偏离正常状态下的较重要因素的发生强度概率分布的概率度计算为异常度,以便将该异常度与预定阈值进行比较。
第三效果在于:从比仅通过监控要监控的通信网络中的警报数目的时间变化所获得的那些更多的方面来实现故障检测。
其原因在于,通信网络的故障是通过以下操作来检测的:从警报记录内容中提取表示警报发生频率的时间变化的参数以及表示发生频 率的空间变化的参数;通过将表示时间变化的参数以及表示空间变化的参数作为较重要因素的发生强度,计算正常状态下的通信网络中较重要因素的发生强度;以及相对于所计算的较重要因素的发生强度,将偏离正常状态下的较重要因素的发生强度概率分布的概率度计算为异常度,以便将该异常度与预定阈值进行比较。
附图说明
图1是根据本发明的第一示例性实施例的表示警报的发生因素与警报之间的关系的概念图;
图2是示出了根据本发明的第一和第二示例性实施例的通信网络故障检测系统1的结构图;
图3是根据本发明的第一和第二示例性实施例的观测量提取单元101的结构图;
图4是根据本发明的第一至第三示例性实施例的较重要因素发生强度计算单元102的结构图;
图5是根据本发明的第一和第二示例性实施例的异常度计算单元103的结构图;
图6是根据本发明的第一示例性实施例的存储在网络特性数据库106中的信息的结构图;
图7是根据本发明的第一示例性实施例的故障检测系统1的硬件的结构图;
图8是用于说明根据本发明的第一示例性实施例的故障检测系统1的操作的图示;
图9是示出了说明本发明的第一示例性实施例的观测量提取单元101的提取处理的操作的图示;
图10是用于说明根据本发明的第一至第三示例性实施例的网络特性数据库106的配置处理的操作的图示;
图11是示出了根据本发明的第一至第三示例性实施例的用于根据正常状态下对独立分量的一组采样来计算独立分量值概率分布的方法的一个示例的图示;
图12是根据本发明的第一至第三示例性实施例的用于使用统计方式来解释异常度计算方法的图示;
图13是根据本发明的第二示例性实施例的表示警报的发生因素与警报之间的关系的概念图;
图14是根据本发明的第二示例性实施例的网络特性数据库106的信息的结构图;
图15是用于说明根据本发明的第二示例性实施例的故障检测系统1的操作的图示;
图16是示出了根据本发明的第二示例性实施例的观测量提取单元101的提取处理的操作的图示;
图17是用于说明根据本发明的第一至第三示例性实施例的特性的图示;
图18是根据本发明的第三示例性实施例的通信网络故障检测系统1的结构图;
图19是根据本发明的第三示例性实施例的异常度计算单元103a和103b以及故障检测单元107的结构图;
图20是根据本发明的第三示例性实施例的网络特性数据库106的信息的结构图;
图21是用于说明根据本发明的第三示例性实施例的故障检测系统1的操作的图示。
具体实施方式
接下来,将参考附图描述用于实现本发明的最佳模式。
(第一示例性实施例)
图1是示出了根据本发明的第一示例性实施例的警报的发生因素与警报之间的关系的概念图。
在本发明中,将引起警报系统502输出单个警报的状态的因素定义为较不重要因素501,而将引起在连锁反应中输出多个警报的状态因素定义为较重要因素500。此时,引起警报的较重要因素500包括直接引起个别警报的单个或多个较不重要因素501,并且警报系统502感测到由这些较不重要因素501所引起的异常,以输出警报503。
更具体地,较重要因素500中的示例是干扰波的出现、通信用户数量的暂时增加、通信路径的切断、以及通信设备的故障,在较不重要因素501的示例是拥塞的产生、呼叫接受规则的产生、通信带宽的不足、通信路径建立的失败以及终端的丢失。
具体地,在本示例性实施例中,在较重要因素500的上述特定示例之中,较重要因素500是要监控的通信区域所特有的并且与发生时间统计独立地引起警报的时间变化的较重要因素。
这里,警报系统502具有检测通信网络上的异常并输出警报的功能。例如,位于警报系统502处的是管理服务器。
在本发明中,通过以下操作检测故障:根据出现在与要监控的通信区域相关的日志中的个别警报503的发生次数的时间变化,计算与较重要因素500的发生频率成比例的值;以及通过使用该值作为较重要因素500的发生强度,监控该发生强度的变化。具体地,在本发明的第一示例性实施例中,在引入要监控的通信区域中的警报503的发生次数的变化的因素之中,将与发生时间统独立的因素看作较重要因素500。
(第一示例性实施例的结构)
图2是用于实现本发明的通信网络故障检测系统1的结构图。
根据本发明的故障检测系统1包括:日志收集单元100,用于通过通信网络的管理服务器(未示出)来收集输出的日志;观测量提取单元101,用于从所收集的日志中提取用于监控通信网络的状态所必需的观测量;较重要因素发生强度计算单元102,用于将所提取的观测量转换成较重要因素500的发生强度;发生强度概率分布计算单元108,用于计算正常状态下的较重要因素500的发生强度的概率发布,并将其存储在网络特性数据库106中;异常度计算单元103,用于将单个较重要因素500的发生强度的值与存储在网络特性数据库106中的处于正常状态下的较重要因素500的发生强度的概率分布进行比较,以计算发生强度如何异常(异常度),并且进一步积分多个发生强 度的异常度,以计算通信网络的异常度;故障检测单元104,用于将通信网络的异常度与存储在网络特性数据库106中的异常度的阈值进行比较,并确定通信网络的状态,以检测故障;结果显示单元105,用于在诸如CRT以及输入单元109的显示设备上显示故障检测结果。
图3是观测量提取单元101的结构图。
观测量提取单元101包括:特定空间日志提取单元120,用于从由日志收集单元100所收集的警报日志10中提取与特定通信区域相关的日志;特定时间日志提取单元121,用于从特定通信区域的提取日志中提取与特定时间段相关的日志;以及多个警报计算单元122,用于根据由特定空间日志提取单元120和特定时间日志提取单元121所提取的日志来计算每种警报的发生次数,观测量提取单元101输出特定空间和特定时间(特定时间和特定区域)中的警报11的数目作为观测量。
图4是较重要因素发生强度计算单元102的结构图。
一些方法可以作为用于通过较重要因素发生强度计算单元102将多个或单个观测量(警报的数目为11)的值转换成其较重要因素500的发生强度的方法,例如:从观测量中提取统计不相关变化分量以便将其值与较重要因素500的发生强度相关联的方法;从观测量中提取统计独立变化分量,以将该值与较重要因素500的发生强度相关联的方法;以及从观测量中提取统计上完全不相关或独立但在实验上与较重要因素500相关的变化分量以便将其值与较重要因素500的发生强度相关联的方法。
在本示例性实施例中被看作通过较重要因素发生强度计算单元102将观测量转换为其较重要因素500的发生强度的功能的一种形式是将观测量解析为统计独立的变化分量并将所获得的发生强度作为较重要因素500的发生强度的方法。
在这种情况下,较重要因素发生强度计算单元102包括:矩阵W计算单元130,用于计算针对根据特定时间和特定区域中的警报11的数目来解析独立分量的处理所必需的矩阵;以及独立分量解析单元131,用于执行对独立分量的解析操作处理,较重要因素发生强度计算 单元102输出独立分量的发生强度,即警报的较重要因素发生强度12。
将在矩阵W计算单元130处所计算的矩阵W存储在网络特性数据库106中,并响应于来自独立分量解析单元131的请求取出该矩阵。
图5是异常度计算单元103的结构图。
异常度计算单元103包括:发生强度异常度计算单元140,用于根据其较重要因素发生强度12计算警报的异常度;以及异常度积分单元141,用于积分每个较重要因素500的发生强度的异常度,来计算通信网络的异常度。
在计算较重要因素500的发生强度的异常度时,使用存储在网络特性数据库106中的较重要因素500的发生强度,即正常状态下的独立分量的概率分布。
故障检测单元104通过将在异常度计算单元103处所获得的异常度与存储于网络特性数据库106中的阈值进行比较来检测通信网络的故障,并最终输出检测结果13。
图6是存储在网络特性数据库106中的信息的结构图。
网络特性数据库106存储特性参数,该特性参数表示要监控的每个通信区域J的通信网络的特性。该通信网络特性参数由以下组成:用于独立分量解析处理的预处理中的每一时间段中的各个警报的发生次数的平均值;用于独立分量解析处理的矩阵W的计算值;用于计算异常度的正常状态下的每个独立分量的值的概率分布;以及用于故障检测的异常度的阈值。
输入单元109通过键盘、网络等接收到其故障要被监控的通信区域J以及应在其中开始监控的时间段的输入,以便将该输入发送到观测量提取单元101,上述通信区域J和时间段是维护人员指定的。
这里,将对根据本示例性实施例的故障检测系统1的硬件结构进行描述。
图7是示出了根据本示例性实施例的故障检测系统1的硬件结构的方框图。
参考图7,根据本示例性实施例的故障检测系统1可以实现为与普通计算机设备相同的硬件结构,故障检测系统1包括:CPU(中央 处理单元)701;诸如RAM(随机存取存储器)之类的主存储器的主存储单元702,作为用作数据工作区域或数据暂存区域;用于通过网络800发送和接收数据的通信单元703;诸如液晶显示器、打印机、或扬声器之类的显示单元704;诸如键盘或鼠标之类的输入单元705;连接到用于发送并接收数据的外围设备的接口单元706;作为由诸如ROM(只读存储器)、磁盘或半导体存储器之类的非易失存储器组成的硬盘设备的辅存储单元707;以及用于将现有信息处理设备中的上述组件彼此连接的系统总线708。
根据本示例性实施例的故障检测系统1具有实现如下的操作:不仅实现为具有由诸如LSI(大规模集成)(具有用于实现如上所述合并安装在故障检测系统1上的功能的程序)之类的硬件部分组成的电路部分的硬件,而且实现为通过执行通过CPU 701在计算处理设备上提供了上述各个组件的每个功能的程序的软件。
更具体地,CPU 701通过将存储在辅存储单元707中的程序加载到主存储单元702内并执行该程序来控制故障检测系统1的操作,利用软件来实现上述各个功能。
(第一示例性实施例的操作)
接下来,将参考图2至图12,详细描述根据本发明的第一示例性实施例的操作。
图8是用于说明根据本示例性实施例的故障检测系统1的操作的图示。
提供由通信网络的管理服务器所输出的警报日志10作为记录在电子介质中的二进制数或文本数据。该数据至少包括表示警报何时发生的时间和日期的时间信息、识别警报所发生的通信区域的识别信息、以及与所发生的警报类型相关的信息。
首先,施加到输入单元109的是其故障要被监控的通信区域以及在其中开始监控的时间段(初始值),这二者都是由维护人员指定的(步骤S801、S802)。
然后,观测量提取单元101提取在指定通信区域中的时间段处发生的一种警报及该警报的发生次数作为观测量(步骤S803)。
图9是示出了上述步骤S803处的观测量提取单元101的提取处理的操作。
如图9所示,在此处理中,首先,观测量提取单元101中的特定空间日志提取单元120根据在其中发生警报的通信区域的识别信息,从接收自日志收集单元100的警报日志中只提取与要监控的通信区域相关的日志(步骤S901)。
接下来,观测量提取单元101中的特定时间日志提取单元121根据表示警报何时发生的时间和日期的时间信息将由特定空间日志提取单元120所提取的日志缩小为与要监控的时间段相关的日志(步骤902)。
其后,观测量提取单元101中的警报次数计算单元122关于通过特定时间日志提取单元121缩小的日志来计算每种警报的发生次数(步骤S903)。
将由此所计算的发生次数提取作为上述步骤S803处的观测量。
返回对根据本示例性实施例的故障检测系统1的操作的描述,接下来,较重要因素发生强度计算单元102将出现在日志中的各个警报的发生次数解析为统计独立于发生次数的变化分量,以计算较重要因素500的发生强度(步骤S804)。
在本示例性实施例中,使用独立分量分析方法作为将警报的发生次数解析为统计独立的变化分量的方法。
该独立分量分析方法是这样一种方法:通过使用如数学表达式(3)中所示的N×M行矩阵W来将通过如数学表达式(1)所示地在时间t处产生M个观测量所获得的观测信号向量x(t)转换为如数学表达式(2)中所示的由N个统计独立分量组成的单个向量y(t)。
x(t)=(x1(t),x2(t),....,xM(t))T 表达式(1)
y(t)=(y1(t),y2(t),....,yN(t))T 表达式(2)
y(t)=WX(t) 表达式(3)
矩阵W的值由学习算法通过使用观测信号向量的采样确定,因此信号向量y(t)满足独立性索引。在文献3中详细描述了独立性索引和学习算法,其中的一个示例将在稍后在本发明中所描述的特定示例 中描述。
在本示例性实施例中,将通过将指定区域的时间段中的各个警报的发生次数转换为向量所获得的值看作观测信号向量。预先从向量的每个元素中减去各个警报的平均发生次数,使得观测向量的平均值变成零。
这里,在要建立网络特性数据库106时,在步骤S821处确定要更新网络特性数据库106,并在步骤S822处在对通信网络的实际故障监控之前建立网络特性数据库106。
图10是用于说明步骤822处的网络特性数据库106的建立过程的操作的图示。
首先,在步骤S1001处,利用针对在要作为采样监控的通信区域(通信区域J)的每个时间段中所获得的观测信号向量,产生包括处于正常状态以及处理故障时间处的采样的采样集合。
接下来,在步骤S1002处,获得采样集合内的观测信号向量的均值,以便将通过减去采样集合中的每个采样向量的均值向量所获得的向量看作新的采样向量,并将每个警报的发生的平均次数作为所指的均值向量中的元素存储在网络特性数据库106中。
此外,在步骤S1003处,根据采样集合计算矩阵W,以便将其存储在网络特性数据库106中。
其后,在步骤S1004处,从采样集合中选择在要监控的通信区域J处于正常状态时所获得的观测信号向量的采样。
然后在步骤S1005处,将在步骤S1004处所选的采样解析为独立分量。
随后,在步骤S1006处,根据在步骤S1005处所产生的处于正常状态的独立分量采样,计算独立分量的值的概率分布,并将其存储在网络特性数据库106中。
在步骤S1007处,从采样集合中选择在要监控的通信区域J处于故障状态时所获得的观测信号向量的采样。
然后,在步骤S1008处,将在步骤S1007处所选的每个采样解析为独立分量。
其后,在步骤S1009处,获得作为独立分量值的异常度的积分的通信网络的异常度。
在步骤S1010处,将根据故障时间处的通信网络的异常度的分布或根据操作策略所确定的异常度的阈值存储在网络特性数据库106中。
图11是示出了根据用于根据作为正常状态的独立分量采样集合计算独立分量值概率分布的方法的一个示例的图示。
首先,根据正常状态的独立分量采样集合,产生以y轴作为独立分量值并且以f(y)轴作为独立分量发生频率的独立分量值的柱状图1101,然后从柱状图1101中获得近似曲线1102,最后认为该曲线是通过将近似曲线1102乘以常数获得的,因此以变量作为x,近似曲线的积分以1作为独立分量概率分布1103。
在本示例性实施例中,观测信号解析处理将相同的矩阵W用于要监控的通信区域的所有时间段。当确定了在计算了矩阵W的长时间推移之后通信区域的特性可能发生剧烈的变化时,确定在步骤S821处更新网络特性数据库106,并重新计算警报的平均发生次数、矩阵W、正常状态下的独立分量概率分量、以及异常度的阈值,以更新更新网络特性数据库106(步骤S822)。
还是在本示例性实施例中,对于要监控的不同通信区域,取出存储在网络特性数据库106中的矩阵W。
本发明通过以下操作来检测通信网络的故障:监控将使用这种为上述通信区域所特有的矩阵W所获得的观测量的各个独立分量的值。更具体地,获得相对于各个独立分量的值得异常度(步骤S805)。此外,通过对上述进行积分,获得指定通信区域和时间及空间的通信网络的异常度(步骤S806),并将该通信网络的异常度与预先准备的阈值进行比较,以检测故障(步骤S807)。
关于独立分量值对异常度的计算采用统计方法。
图12是用于说明使用统计方法的异常度计算方法。
该独立分量异常度计算单元140使用上侧概率1201或较低侧概率1202或这两侧概率的和作为索引,用于对来自由函数f(y)所表示的 概率分布1103的独立分量值的偏差度进行量化,以便输出所获得的值作为独立分量值的异常度。例如,在使用两侧概率时,通过数学表达式(4)获得独立分量y0的异常度g(y0)。因此,所获得的异常度越大,则它所表示的值越小。
通信网络的异常度(即,在要监控的特定通信网络中的特定时间段的异常度)是通过积分相关时间段中的各个独立分量值的异常度获得的。
由于异常度是作为通过积分各个独立分量值的异常度所获得的异常度的独立事件发生概率,因此本发明中使用各个独立分量值的异常度的积。在这种情况下,所获得的异常度相当于独立事件的积事件的发生概率。
可以将各个独立分量值的异常度的乘积看作是:在时间上独立地引起通信区域中的警报的多个较重要因素500以高于特定频率的频率同时发生的概率。
因此,在该概率小于预先设置的阈值时,因为极少在正常状态下发生的事件发生了,所以在步骤S807处确定了要监控的通信区域的时间段处于检测故障的故障状态。
在步骤S808处,将在步骤S807处获得的故障检测结果显示在诸如CRT之类的结果显示单元105上。
除了上述以外,结果显示单元105还显示了通信网络在要监控的通信区域以及时间段中的异常度列表、处于正常状态的通信网络的异常度的均值和方差值、计算上述异常度所根据的每个独立分量值的异常度、处于正常状态的每个独立分量值的异常度的均值和方差值、以及通过对每个独立分量进行逆变换所获得的每个警报的发生次数。
可以通过乘以来自数学表达式(3)的左边的矩阵W的逆矩阵W-1来实现对独立分量的逆变换。
在步骤S809处,确认是否结束监控以及何时结束,在步骤S810处将要监控的时间段更新为后续时间段,并返回步骤S803处对观测 量的提取,以便其后在顺序提出时间段的同时继续监控,直到指示结束为止。
(第一示例性实施例的效果)
接下来,将描述本示例性实施例的效果。
在本示例性实施例中,因为将由多个混合因素所引起的警报的发生次数分成了针对多个较重要因素500中的每个较重要因素的多次发生,以便将所分开的多个警报发生次数转换为每个较重要因素500的发生强度并全面地监控多个发生强度,从而检测故障,与通过简单地监控由多个混合因素所引起的警报的发生次数所获得的相比,可以实现更高精度的故障检测。
此外,由于通过将通过统计方法转变成数值的较重要因素500的发生强度的异常度与阈值相比来执行故障确定,因此该确定的客观性较高。
此外,由于通过监控要监控的通信区域内的警报数目的时间变化的分量来检测故障,因此与处于正常状态下的每个时间段中的相比,可以检测到指示相同通信区域内的警报数量的更多异常事件变化的故障。
(第二示例性实施例)
(第二示例性实施例的结构)
本第二示例性实施例与图2中所示的第一示例性实施例相对应,并采用与第一示例性实施例相同的基本结构。
因此,将主要描述不同于上述第一示例性实施例的地方,此外将适当地省略对与第一示例性实施例所共有的分量的描述。
图13是根据本发明的第二示例性实施例示出了警报的发生因素与故障检测系统中的警报之间的关系。
在本示例性实施例中,引起警报发生次数在要监控的通信区域内变化的较重要因素包括限于位置(空间)且随时间变化的较重要因素500以及限于时间且随空间变化的较重要因素504。
具体地,在本示例性实施例中,较重要因素500与第一示例性实 施例中的时间变化的较重要因素500相同,此外在第一示例性实施例的较重要因素500的特定示例之中,较重要因素504是限于要监控的时间并沿着通信区域变化的空间变化的较重要因素。
通过输入单元109输入其故障要被监控的通信区域以及要在其中开始监控的时间段(这二者由维护人员指定),第一示例性实施例检测了由时间变化的较重要因素500所引起的故障,所述时间变化限于要监控的通信区域,并与引起要监控的通信区域中的警报发生次数变化的因素中的发生时间统计独立,而本示例性实施例检测由空间变化的较重要因素504所引起的故障,所述空间变化限于要监控的时间段,并与引起要监控的通信区域中的警报发生次数变化的因素中,由地理上与要监控的通信区域相邻的周边通信区域所形成的区域中的发生位置统计独立。
在本示例性实施例中,与第一示例性实施例类似地,假设观测信号向量是通过使各个警报的发生次数转变为向量所获得的值。然而,该观测信号向量与第一示例性实施例中的观测信号向量的不同之处在于:如数学表达式(5)所示,本示例性实施例中的向量是作为要监控的时间段中的位置s的函数的观测信号向量x(s),而且如数学表达式(6)所示,其相应的信号向量类似地为位置s的函数y(s)。此外,在本示例性实施例中,针对要监控的每个不同的时间段计算矩阵W和独立分量概率分布,并将其存储在网络特性数据库106中。
x(s)=(x1(s),x2(s),....,xM(s))T …表达式(5)
y(s)=(y1(s),y2(s),....,yN(s))T …表达式(6)
图14是根据本示例性实施例存储在网络特性数据库106中的用于实现故障检测系统1的信息的结构图。
根据本示例性实施例的网络特性数据库106与第一示例性实施例的不同之处在于:在本示例性实施例,针对要监控的每个时间段K存储表示通信网络的特性的特性参数;而在第一示例性实施例中,针对要监控的每个通信区域J存储参数。
根据本示例性实施例的网路特性数据库106中的通信网络的特性 参数由以下组成:各个警报在每一通信区域内的发生次数的平均值,用于独立分量解析处理的预处理中;用于独立分量解析处理的矩阵W的计算值;用于计算异常度的正常状态下的每个独立分量的值的概率分布;以及用于故障检测的异常度的阈值。
在根据本示例性实施例的网路特性数据库106的配置处理中,与图10中所示的步骤S1001类似的,针对要监控的每个不同的时间段K,首先产生包括处于正常状态以及故障状态的采样的采样集合,该采样集合以从在地理上与要监控的通信区域相邻的周边通信区域处获得相关时间段K内的观测信号向量作为采样。
其后,根据如图10所示的更新处理,获得针对要监控的每个时间段K要存储在网路特性数据库106中的特性参数,并与第一示例性实施例类似地将该特性参数存储在网路特性数据库106中。
(第二示例性实施例的操作)
图15是用于说明根据本示例性实施例的故障检测系统1的操作的图示。
根据本示例性实施例的故障检测系统1与如图8所示的第一示例性实施例的步骤S803的不同之处在于在步骤S1503处的观测量提取方法。
图16是示出了根据本示例性实施例的在步骤S1503处的观测量提取处理的操作的图示。
根据本示例性实施例的观测量提取处理的操作与根据第一示例性实施例的观测量提取处理操作的不同之处在于:本实施例的观测量提取处理是提取与要监控的时间段相关的日志(步骤S1601),将所提取的日志缩小为与包括要监控的通信区域的多个周边通信区域相关的日志(步骤S1602),并计算每种警报的发生次数(步骤S1603);而在根据第一示例性实施例的观测量提取处理操作中,在提取了与要监控的通信区域相关的日志(步骤S901)之后,执行将所提取的日志缩小为与要监控的时间段相关的日志(步骤S902),以计算每种警报的发生次数(步骤S903)。
此外,本示例性实施例的操作与第一示例性实施例的操作的不同 之处在于:在本示例性实施例的操作中,不是将观测量解析为时间变化的独立分量,而是将其解析为空间变化的独立分量(步骤S1504);在第一示例性实施例的操作中,不是将观测量解析为空间变化的独立分量,而是将其解析为时间变化的独立分量(如图8所示的步骤S804)。
此外,本示例性实施例的操作与第一示例性实施例的操作的不同之处在于:在本示例性实施例的操作中,在步骤S1504,针对要监控的每个不同的时间段,提取存储在网路特性数据库106中的矩阵W;在第一示例性实施例的操作中,针对要监控的每个不同的通信区域,提取存储在网路特性数据库106中的矩阵W(如图8所示的步骤S804)。
此外,本示例性实施例的操作与第一示例性实施例的操作的不同之处在于在计算异常度时:在本示例性实施例的操作中,在步骤S1506,针对要监控的每个不同的时间段,提取存储在网路特性数据库106中的独立分量的概率分布;在第一示例性实施例的操作中,针对要监控的每个不同的通信区域,提取存储在网路特性数据库106中的独立分量的概率分布(如图8所示的步骤S806)。
此外,本示例性实施例的操作与第一示例性实施例的操作的不同之处在于在检测故障时:在本示例性实施例的操作中,针对要监控的每个不同的时间段,提取存储在网路特性数据库106中的异常度的阈值(步骤S1507);在第一示例性实施例的操作中,针对要监控的每个不同的通信区域,提取存储在网路特性数据库106中的异常度的阈值(如图8所示的步骤S807)。
在本示例性实施例中,在矩阵W选择性地用于要监控的每个时间段的时候,即使要监控的通信区域不同,只要要监控的时间段相同,则使用与该时间段相对应的同一矩阵W。
此时,利用松散时间段之间的等同性作为确定基础,可以使用同一矩阵W来确定属于一天当中的同一时区的时间段为甚至另一天的相同的时间段。
在确定了存在以下可能性的情况下:包括要监控的通信区域的多个周边通信区域的特性由于计算了矩阵W之后的长时间推移而剧烈 变化,则在步骤S821处更新网络特性数据库106,并重新估计警报的平均发生次数、矩阵W、独立分量的概率分布以及异常度的阈值,来更新网路特性数据库106(步骤S822)。
根据本示例性实施例的故障检测系统1的其它操作与根据如图8所示第一示例性实施例的故障检测系统1的相应操作相同。
(第二示例性实施例的效果)
接下来,将描述第二示例性实施例的效果。
由于通过检测要监控的时间段(时间段K)中的警报次数的空间变化的分量来检测故障,因此本示例性实施例使能了对要监控的通信区域(其中的警报次数显示出比相同时间段内的处于正常状态下的周边通信区域中的更多的异常空间变化)中的故障检测。
(第三示例性实施例)
图17是用于说明根据本发明的第一至第三示例性实施例的特性的图示。
在第一和第二示例性实施例中,故障或是由与在其中监控警报的发生次数的通信区域中的发生时间统计独立的时间变化的较重要因素500引起的,或是由在地理上与要监控的通信区域相邻的周边通信区域所组成的区域内的发生位置统计独立的空间变化的因素504引起的。
另一方面,本示例性实施例检测由时间变化的较重要因素500引起的故障以及由空间变化的较重要因素504(时间和空间变化的较重要因素)引起的故障。
具体地,在示例性实施例中,较重要因素500与第一示例性实施例中的时间变化的较重要因素500相同,以及较重要因素504与第二示例性实施例中的空间变化的较重要因素504相同。
在下文中,将主要描述不同于上述第一和第二示例性实施例的地方,此外将适当地省略对与第一和第二示例性实施例所共有的分量的描述。
(第三示例性实施例的结构)
图18是根据本发明的第三示例性实施例的通信网络故障检测系统1的结构图。
根据本示例性实施例的通信网络故障检测系统1的结构与根据第一和第二示例性实施例的通信网络故障检测系统1的结构的不同之处在于:将第一和第二示例性实施例中用于将观测量转换成其较重要因素的发生强度的较重要因素发生强度计算单元102,分别形成为用于将观测量转换成时间变化的较重要因素500的发生强度的较重要因素发生强度计算单元102a与用于将观测量转换成空间变化的较重要因素504的发生强度的较重要因素发生强度计算单元102b;将用于计算正常状态下的较重要因素的发生强度的概率发布并将其存储在网络特性数据库106中的发生强度概率分布计算单元108,分别形成为用于时间变化的较重要因素500的发生强度概率分布计算单元108a和用于空间变化的较重要因素504的发生强度概率分布计算单元108b;将异常度计算单元103,分别形成用于根据时间变化的较重要因素500的发生强度的异常度来计算通信网络的异常度的异常度计算单元103a和用于根据空间变化的较重要因素504的发生强度的异常度来计算通信网络的异常度的异常度计算单元103b;以及故障检测单元104由通过根据由异常度计算单元103a和103b所计算的上述两种通信网络的异常度执行故障确定来检测故障的故障检测单元107取代。
图19是根据本示例性实施例的异常度计算单元103a和103b以及故障检测单元107的结构图。
在警报的较重要因素的发生强度中,分别将时间变化的较重要因素500的较重要因素发生强度12a和空间变化的较重要因素504的较重要因素发生强度12b并行地施加到异常度计算单元103a和103b,此外这些异常度由发生强度异常度计算单元140a和104b计算,并由异常度积分单元141a和141b积分。
将所积分的异常度施加到时间变化故障检测单元142a和空间变化故障检测单元142b,以便通过与存储在网路特性数据库106中的阈值的比较处理而输出故障检测结果,该结果由故障结果积分单元143进行积分,并作为最终检测结果13示出至结果显示单元105。
图20是存储在本示例性实施例的网络特性数据库106中的信息的结构图。
本示例性实施例中的网络特性数据库106包括存储于第一和第二示例性实施例的网络特性数据库106中的信息。
在根据本示例性实施例的网路特性数据库106的配置处理中,将根据本示例性实施例的网路特性数据库106的配置处理分别应用于产生要存储在网络特性数据库106中的信息。
(第三示例性实施例的操作)
图21是用于说明根据本示例性实施例的故障检测系统1的操作的图示。
根据第一和第二示例性实施例的故障检测系统1在提取出指定通信区域、时间及空间的观测量(步骤S803、S1503)之后,将该观测量解析为时间变化的独立分量(步骤S804),或将该观测量解析为空间变化的独立分量(步骤S1504)。本示例性实施例中的故障检测系统1与第一和第二示例性实施例中的故障检测系统1之间的差别在于:在提取出指定通信区域、时间及空间的观测量(步骤S2103)之后,根据本示例性实施例的故障检测系统1并行于与将该观测量解析为时间变化的独立分量(步骤S2104a),将该观测量解析为空间变化的独立分量(步骤S2104b),并执行在步骤S2105a和步骤S2105b处并行地执行关于时间和空间变化分量中的每一个的异常度计算的处理,在步骤S2106a和步骤S2106b处执行将异常度积分的处理,以及在步骤S2107a和步骤S2107b处执行故障检测处理,以便在步骤S2108处结合时间和空间的故障检测结果。
在步骤S841的积分之后,在步骤S807a或步骤S807b处检测到故障时,通知故障检测。
由于本示例性实施例中的故障检测系统1的其它操作与根据第一和第二示例性实施例的上述故障检测系统1的相应操作相同,则选择性地使用矩阵W或概率分布的方法也与第一和第二示例性实施例中的相应方法相同。
(第三示例性实施例的效果)
接下来,将描述本示例性实施例的效果。
由于本示例性实施例通过同时监控要监控的通信区域中的警报次数的时间变化和要监控的时间段中的警报次数的空间变化,可以检测到以下两种故障:一种故障是其警报次数指示了与同一通信区域内的处于正常状态下的预定时间段中的时间变化相比的异常时间变化;另一种故障是其警报次数指示了与同一时间段内的处于正常状态下的预定通信区域中的空间变化相比的异常空间变化(见图17)。
(第一特定示例)
接下来,将描述根据本发明的故障检测系统的特定示例1。特定示例1对应于本发明的第一和第三示例性实施例。
在本特定示例中,在矩阵W计算单元130处,通过使用互矩(mutual moment)作为独立性指标以及使用斜率法作为学习算法获得矩阵W的值。
当概率变量Yi和Yj相互独立时,如表达式(7)所示,可以将针对信号向量y(t)的元素yi(t)和yj(t)的概率变量Yi和Yj的四阶互矩解析为其矩的乘积,并且在E[Yi 3]或E[Yj]为零时,该四阶矩也将为零。
在这些情况下,例如,在通过预先从观测信号向量x(t)中减去采样平均来提供如表达式(8)所示的评估函数(W)以使得E[Yj]为零时,可以发现最小化了数学表达式(8)的矩阵W返回其独立性最高的信号向量y(t)。
W←W+εd W …表达式(9)
(第二特定示例)
接下来,将描述本发明的故障检测系统1的特定示例2。特定示例2对应于本发明的第一和第二示例性实施例。
尽管本特定示例与特定示例1的不同之处在于:在本示例中,通过使用信号向量y(s)在位置s=s1,s2,…,sn处的采样根据数学表达式(13)来计算四阶互矩;而在特定示例1中,通过使用信号向量y(s)在时间t=t1,t2,…,tn处的采样根据数学表达式(12)来计算四阶互矩,剩余部分与上述特定示例性1中的相同。
尽管在前述中已经就多个优选示例性实施例和特定示例对本发明进行了描述,本发明不必局限于上述示例性实施例和特定示例,并且可以以其技术思想范围内的各种形式来实现本发明。
尽管已经参考本发明的示例性实施例对本发明进行了具体说明和描述,本发明不局限于这些实施例。本领域的技术人员将理解,可以在不背离由权利要求所限定的本发明的精神和范围的前提下,对本发明进行形式和细节方面的各种改变。
作为参考的合并
本申请根据并声明了2005年7月11日所提交的日本专利申请No.2005-202134的优先权益,其公开完全合并与此作为参考。
工业实用性
本发明适用于故障检测系统,该故障检测系统用于检测通常由管理系统所管理的对象的故障,该管理系统输出了在其中以时间顺序列举警报的警报日志。
Claims (14)
1.一种通信网络中的通信网络故障检测系统,其中记录在通信故障时所发出的针对所述通信网络的警报的内容,所述通信网络故障系统,包括:
针对较重要因素的发生强度计算单元,用于通过分析警报的记录内容来计算引起在连锁反应中输出多个警报的状态的较重要因素的发生强度;
发生强度概率分布计算单元,用于计算处于正常状态的通信网络中的较重要因素的发生强度的概率分布;所述发生强度概率分布计算单元根据由针对较重要因素的发生强度计算单元在通信设备已经发出了正常操作的警报的过去时段期间所获得的估计结果以及/或者根据由针对较重要因素的发生强度计算单元在地理上与已经发出了警报的通信设备相邻的另一通信设备内所获得的估计结果,计算处于正常状态的所述通信网络中所述较重要因素的发生强度的概率分布;
异常度计算单元,相对于计算得到的所述较重要因素的发生强度,将偏离处于正常状态的所述较重要因素的发生强度概率分布的概率度计算为异常度;以及
故障检测单元,用于通过将所述异常度与预先施加的阈值进行比较来检测通信网络中源自较重要因素的故障;
其中,所述针对较重要因素的发生强度计算单元包括:
时间变化参数提取单元,用于从所述警报的记录内容中提取表示警报发生频率的时间变化的参数,以便将所述表示时间变化的所述参数的值转换为所述较重要因素的发生强度;或者
空间变化参数提取单元,用于从所述警报的记录内容中提取表示警报发生频率的空间变化的参数,以便将所述表示空间变化的所述参数的值转换为所述较重要因素的发生强度。
2.根据权利要求1所述的通信网络故障检测系统,其中,所述时间变化参数提取单元或所述空间变化参数提取单元通过使用独立分量分析方法,从警报发生频率中获得统计独立的时间变化分量或空间变化分量,以便将所述分量分别看作表示时间变化的参数或表示空间变化的参数。
3.根据权利要求1所述的通信网络故障检测系统,其中,利用发生强度概率分布的上侧概率或下侧概率或双侧概率作为异常度,分别针对从表示时间变化的所述参数中获得的所述较重要因素的发生强度或从表示空间变化的所述参数中获得的所述较重要因素的发生强度,所述异常度计算单元将多个较重要因素的发生强度乘以所获得的各个异常度,以便将结果看作总体上的异常度。
4.一种通信网络故障检测系统,包括:
针对较重要因素的发生强度计算单元,用于通过分析警报的记录内容来计算引起在连锁反应中输出多个警报的状态的较重要因素的发生强度;
发生强度概率分布计算单元,用于计算处于正常状态的通信网络中较重要因素的发生强度的概率分布;所述发生强度概率分布计算单元根据由针对较重要因素的所述发生强度计算单元在通信设备已经发出了正常操作的警报的过去时段期间所获得的估计结果以及/或者由针对较重要因素的发生强度计算单元在地理上与已经发出了警报的通信设备相邻的另一通信设备内所获得的估计结果,计算所述处于正常状态下的通信网络中所述较重要因素的发生强度的概率分布;
异常度计算单元,用于相对于计算得到的较重要因素的发生强度,将偏离处于正常状态的所述较重要因素的发生强度概率分布的概率度计算为异常度;以及
故障检测单元,用于通过将异常度与预先施加的阈值进行比较来检测通信网络中的故障,
其中,针对较重要因素的所述发生强度计算单元包括:时间变化参数提取单元和空间变化参数提取单元,所述时间变化参数提取单元用于从所述警报的记录内容中提取表示警报发生频率的时间变化的参数,所述空间变化参数提取单元用于提取表示警报发生频率的空间变化的参数,
其中,所述发生强度计算单元将表示时间变化的所述参数的值和表示空间变化的所述参数的值中的至少一个转换为所述较重要因素的发生强度。
5.根据权利要求4所述的通信网络故障检测系统,其中,所述时间变化参数提取单元和所述空间变化参数提取单元通过使用独立分量分析方法,从警报发生频率中获得统计独立的时间变化分量和空间变化分量,以便将所述分量分别看作表示时间变化的参数和表示空间变化的参数。
6.根据权利要求4所述的通信网络故障检测系统,其中,利用发生强度概率分布的上侧概率或下侧概率或双侧概率作为异常度,分别针对从表示时间变化的所述参数中获得的所述较重要因素的发生强度以及从表示空间变化的所述参数中获得的所述较重要因素的发生强度,所述异常度计算单元将多个较重要因素的发生强度乘以所获得的各个异常度,以便将结果看作总体上的异常度。
7.根据权利要求4所述的通信网络故障检测系统,其中,所述故障检测单元通过使用从表示时间变化的所述参数获得的所述异常度和从表示空间变化的所述参数获得的所述异常度来检测故障。
8.一种通信网络中的通信网络故障检测方法,其中记录在通信故障时所发出的针对所述通信网络的警报的内容,所述通信网络故障检测方法包括以下步骤:
针对较重要因素的发生强度计算步骤,用于通过分析记录的警报内容来计算引起在连锁反应中输出多个警报的状态的较重要因素的发生强度;
发生强度概率分布计算步骤,用于计算处于正常状态的所述通信网络中的所述较重要因素的发生强度的概率分布;其中,在所述发生强度概率分布计算步骤中,根据由针对较重要因素的发生强度计算步骤在通信设备已经发出了正常操作的警报的过去时段期间所获得的估计结果和/或根据由针对较重要因素的发生强度计算步骤在地理上与已经发出了警报的通信设备相邻的另一通信设备内所获得的估计结果,计算处于正常状态的所述通信网络中所述较重要因素的发生强度的概率分布;
异常度计算步骤,相对于计算得到的所述较重要因素的发生强度,将偏离处于正常状态的所述较重要因素的发生强度概率分布的概率度计算为异常度;以及
故障检测步骤,用于通过将所述异常度与预先施加的阈值进行比较来检测所述通信网络中源自较重要因素的故障;
其中,所述针对较重要因素的发生强度计算步骤包括时间变化参数提取步骤,用于从所述警报的记录内容中提取表示警报发生频率的时间变化的参数,以便将表示时间变化的所述参数的值转换为所述较重要因素的发生强度;或者
包括空间变化参数提取步骤,用于从所述警报的记录内容中提取警报发生频率的空间变化,以便将表示空间变化的所述参数的值转换为所述较重要因素的发生强度。
9.根据权利要求8所述的通信网络故障检测方法,其中,在所述时间变化参数提取步骤和所述空间变化参数提取步骤中,通过使用独立分量分析方法,从警报发生频率中获得统计独立的时间变化分量或空间变化分量,以便将所述分量分别看作表示时间变化的参数或表示空间变化的参数。
10.根据权利要求8所述的通信网络故障检测方法,其中,在所述异常度计算步骤中,其中,利用发生强度概率分布的上侧概率或下侧概率或双侧概率作为异常度,分别针对从表示时间变化的所述参数中获得的所述较重要因素的发生强度或从表示空间变化的所述参数中获得的所述较重要因素的发生强度,所述异常度计算步骤将多个较重要因素的发生强度乘以所获得的各个异常度,以便将结果看作总体上的异常度。
11.一种通信网络故障检测方法,包括以下步骤:
针对较重要因素的发生强度计算步骤,用于通过分析警报的记录内容来计算引起在连锁反应中输出多个警报的状态的较重要因素的发生强度;
发生强度概率分布计算步骤,用于计算处于正常状态的所述通信网络中的所述较重要因素的发生强度的概率分布;在所述发生强度概率分布计算步骤中,根据由针对较重要因素的发生强度计算步骤在通信设备已经发出了正常操作的警报的过去时段期间所获得的估计结果以及由针对较重要因素的发生强度计算步骤在地理上与已经发出了警报的通信设备相邻的另一通信设备内所获得的估计结果,计算处于正常状态的所述通信网络中所述较重要因素的发生强度的概率分布;
异常度计算步骤,用于相对于计算得到的所述较重要因素的发生强度,将偏离处于正常状态的所述较重要因素的发生强度概率分布的概率度计算为异常度;以及
故障检测步骤,用于通过将所述异常度与预先施加的阈值进行比较来检测所述通信网络中源自较重要因素的故障,
其中,所述针对较重要因素的发生强度计算步骤包括:
时间变化参数提取步骤和空间变化参数提取步骤,时间变化参数提取步骤用于从所述警报的记录内容中提取表示警报发生频率的时间变化的参数,所述空间变化参数提取步骤用于从所述警报的记录内容中提取表示警报发生频率的空间变化的参数,以及
将表示时间变化的所述参数的值和表示空间变化的所述参数的值中的至少一个转换为所述较重要因素的发生强度。
12.根据权利要求11所述的通信网络故障检测方法,其中,在所述时间变化参数提取步骤和所述空间变化参数提取步骤中,通过使用独立分量分析方法,从警报发生频率中获得统计独立的时间变化分量和空间变化分量,以便将所述分量分别看作表示时间变化的参数和表示空间变化的参数。
13.根据权利要求11所述的通信网络故障检测方法,其中,在所述异常度计算步骤中,其中,利用发生强度概率分布的上侧概率或下侧概率或双侧概率作为异常度,分别针对从表示时间变化的所述参数中获得的所述较重要因素的发生强度以及从表示空间变化的所述参数中获得的所述较重要因素的发生强度,所述异常度计算步骤将多个较重要因素的发生强度乘以所获得的各个异常度,以便将结果看作总体上的异常度。
14.根据权利要求11所述的通信网络故障检测方法,其中,在所述故障检测步骤中,通过使用从表示时间变化的所述参数获得的所述异常度和从表示空间变化的所述参数获得的所述异常度来检测故障。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP202134/2005 | 2005-07-11 | ||
JP2005202134A JP4626852B2 (ja) | 2005-07-11 | 2005-07-11 | 通信網の障害検出システム、通信網の障害検出方法及び障害検出プログラム |
PCT/JP2006/314130 WO2007007895A1 (ja) | 2005-07-11 | 2006-07-11 | 通信網の障害検出システム、通信網の障害検出方法及び障害検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101218786A CN101218786A (zh) | 2008-07-09 |
CN101218786B true CN101218786B (zh) | 2012-10-24 |
Family
ID=37637264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800253530A Expired - Fee Related CN101218786B (zh) | 2005-07-11 | 2006-07-11 | 通信网络故障检测系统、通信网络故障检测方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8065568B2 (zh) |
EP (1) | EP1903717B1 (zh) |
JP (1) | JP4626852B2 (zh) |
CN (1) | CN101218786B (zh) |
WO (1) | WO2007007895A1 (zh) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008149975A1 (ja) * | 2007-06-06 | 2008-12-11 | Nec Corporation | 通信網の障害原因分析システムと障害原因分析方法、及び障害原因分析用プログラム |
US8682612B2 (en) * | 2008-12-18 | 2014-03-25 | Abb Research Ltd | Trend analysis methods and system for incipient fault prediction |
JP5378847B2 (ja) * | 2009-03-26 | 2013-12-25 | 株式会社野村総合研究所 | 監視装置 |
US9104777B2 (en) * | 2009-04-03 | 2015-08-11 | International Business Machines Corporation | Method for improving accessibility to rich internet applications through collaborative crawling and computer program for the same |
CN103370904B (zh) * | 2010-09-30 | 2018-01-12 | 瑞典爱立信有限公司 | 用于确定网络意外事件的严重性的方法、网络实体 |
CN102164043A (zh) * | 2010-10-27 | 2011-08-24 | 青岛海信传媒网络技术有限公司 | 日志上报方法及终端 |
US9015536B1 (en) | 2011-08-31 | 2015-04-21 | Amazon Technologies, Inc. | Integration based anomaly detection service |
JP5556801B2 (ja) * | 2011-12-19 | 2014-07-23 | 株式会社デンソー | 車載電子制御装置および診断システム |
JP5883770B2 (ja) * | 2012-11-15 | 2016-03-15 | 株式会社日立製作所 | ネットワーク異常検知システム、および、分析装置 |
JP5968829B2 (ja) * | 2013-05-23 | 2016-08-10 | 日本電信電話株式会社 | 評価方法、評価装置及び評価プログラム |
US9544207B2 (en) | 2013-06-21 | 2017-01-10 | Microsoft Technology Licensing, Llc | Using different connectivity checks to determine causes of connectivity issues |
CN103650569B (zh) * | 2013-07-22 | 2018-02-02 | 华为技术有限公司 | 无线网络故障诊断方法和设备 |
CN105981314A (zh) * | 2014-02-05 | 2016-09-28 | 日本电气株式会社 | 监视设备、无线通信系统、故障原因判别方法以及存储程序的非瞬时计算机可读介质 |
US10263836B2 (en) * | 2014-03-24 | 2019-04-16 | Microsoft Technology Licensing, Llc | Identifying troubleshooting options for resolving network failures |
WO2015182831A1 (ko) * | 2014-05-30 | 2015-12-03 | 삼성에스디에스 주식회사 | 시스템 모니터링 장치 및 방법 |
JP6459345B2 (ja) * | 2014-09-26 | 2019-01-30 | 大日本印刷株式会社 | 変動データ管理システム及びその特異性検出方法 |
US9960956B1 (en) * | 2014-10-15 | 2018-05-01 | The United States Of America, As Represented By The Secretary Of The Navy | Network monitoring method using phantom nodes |
KR101594701B1 (ko) * | 2014-10-20 | 2016-02-16 | 삼성에스디에스 주식회사 | 이상 접속 검출 장치 및 방법 |
KR102292990B1 (ko) | 2015-11-20 | 2021-08-26 | 삼성전자 주식회사 | 상태 관련 정보 공유 방법 및 장치 |
CN109074453B (zh) | 2016-04-26 | 2021-10-26 | 三菱电机株式会社 | 入侵检测装置、入侵检测方法以及计算机能读取的存储介质 |
CN105931438B (zh) * | 2016-06-27 | 2017-11-28 | 北京协同创新研究院 | 一种判别报警持续时间统计分布稳定性的方法和系统 |
CN106293976A (zh) * | 2016-08-15 | 2017-01-04 | 东软集团股份有限公司 | 应用性能风险预测方法、装置和系统 |
US10432652B1 (en) * | 2016-09-20 | 2019-10-01 | F5 Networks, Inc. | Methods for detecting and mitigating malicious network behavior and devices thereof |
US10333996B2 (en) * | 2016-10-14 | 2019-06-25 | CALLSTATS I/O Oy | Methods and systems for analyzing streaming media sessions |
US10979480B2 (en) * | 2016-10-14 | 2021-04-13 | 8X8, Inc. | Methods and systems for communicating information concerning streaming media sessions |
US10462170B1 (en) * | 2016-11-21 | 2019-10-29 | Alert Logic, Inc. | Systems and methods for log and snort synchronized threat detection |
WO2018134939A1 (ja) * | 2017-01-19 | 2018-07-26 | 三菱電機株式会社 | 攻撃検知装置、攻撃検知方法および攻撃検知プログラム |
US11038869B1 (en) | 2017-05-12 | 2021-06-15 | F5 Networks, Inc. | Methods for managing a federated identity environment based on application availability and devices thereof |
JP6571131B2 (ja) * | 2017-06-14 | 2019-09-04 | 株式会社toor | パケット監視装置、パケット監視システム、パケット監視方法、及びパケット監視プログラム |
CN109981328B (zh) * | 2017-12-28 | 2022-02-25 | 中国移动通信集团陕西有限公司 | 一种故障预警方法及装置 |
CN109614340A (zh) * | 2018-12-28 | 2019-04-12 | 北京微播视界科技有限公司 | 应用程序的开发调试方法、装置、电子设备及存储介质 |
CN109978038B (zh) * | 2019-03-19 | 2023-04-18 | 中国银联股份有限公司 | 一种集群异常判定方法及装置 |
JP7298343B2 (ja) * | 2019-07-01 | 2023-06-27 | 日本電信電話株式会社 | 故障影響推定装置、故障影響推定方法、及びプログラム |
US11349981B1 (en) | 2019-10-30 | 2022-05-31 | F5, Inc. | Methods for optimizing multimedia communication and devices thereof |
CN114419870B (zh) * | 2022-03-31 | 2022-07-15 | 长园共创电力安全技术股份有限公司 | 基于低功耗无线通信的传感采集系统的通信方法 |
CN115022908B (zh) * | 2022-05-11 | 2023-05-12 | 中电信数智科技有限公司 | 一种核心网与基站传输网络异常预测及定位的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020019870A1 (en) * | 2000-06-29 | 2002-02-14 | International Business Machines Corporation | Proactive on-line diagnostics in a manageable network |
CN1499749A (zh) * | 2002-11-06 | 2004-05-26 | 天津工程机械研究院 | 基于网络的移动作业机群设备状态监测与故障诊断系统 |
US20040230868A1 (en) * | 2003-03-17 | 2004-11-18 | Sabet Sameh A. | System and method for fault diagnosis using distributed alarm correlation |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3182169B2 (ja) * | 1991-07-26 | 2001-07-03 | 株式会社リコー | 故障診断方法 |
JPH0824291B2 (ja) * | 1993-03-25 | 1996-03-06 | 日本電気株式会社 | ネットワーク管理システム |
JP3082548B2 (ja) | 1993-12-27 | 2000-08-28 | 株式会社日立製作所 | 設備管理システム |
US5528516A (en) * | 1994-05-25 | 1996-06-18 | System Management Arts, Inc. | Apparatus and method for event correlation and problem reporting |
JPH08288944A (ja) * | 1995-04-18 | 1996-11-01 | Hitachi Ltd | 通信設備管理システム |
US5761502A (en) * | 1995-12-29 | 1998-06-02 | Mci Corporation | System and method for managing a telecommunications network by associating and correlating network events |
FI114749B (fi) * | 2000-09-11 | 2004-12-15 | Nokia Corp | Poikkeamien ilmaisujärjestelmä ja menetelmä sen opettamiseksi |
US7383191B1 (en) | 2000-11-28 | 2008-06-03 | International Business Machines Corporation | Method and system for predicting causes of network service outages using time domain correlation |
JP3579834B2 (ja) * | 2001-06-29 | 2004-10-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 管理可能なネットワークにおける事前対策オンライン診断 |
US7076695B2 (en) * | 2001-07-20 | 2006-07-11 | Opnet Technologies, Inc. | System and methods for adaptive threshold determination for performance metrics |
US7437762B2 (en) * | 2001-11-29 | 2008-10-14 | International Business Machines Corporation | Method, computer program element and a system for processing alarms triggered by a monitoring system |
JP2004309998A (ja) | 2003-02-18 | 2004-11-04 | Nec Corp | 確率分布推定装置および異常行動検出装置,ならびにその確率分布推定方法および異常行動検出方法 |
JP2004318552A (ja) | 2003-04-17 | 2004-11-11 | Kddi Corp | Idsログ分析支援装置、idsログ分析支援方法及びidsログ分析支援プログラム |
US7313573B2 (en) * | 2003-09-17 | 2007-12-25 | International Business Machines Corporation | Diagnosis of equipment failures using an integrated approach of case based reasoning and reliability analysis |
JP3922375B2 (ja) * | 2004-01-30 | 2007-05-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 異常検出システム及びその方法 |
JP2006033315A (ja) * | 2004-07-15 | 2006-02-02 | Evolium Sas | ネットワーク監視システム |
JP4560367B2 (ja) * | 2004-10-05 | 2010-10-13 | 株式会社日立製作所 | ストレージネットワーク性能情報の収集・保存方法及び計算機システム並びにプログラム |
US7698417B2 (en) * | 2005-06-15 | 2010-04-13 | Microsoft Corporation | Optimized performance counter monitoring |
JP4527642B2 (ja) * | 2005-09-29 | 2010-08-18 | 富士通株式会社 | ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム |
US7484132B2 (en) * | 2005-10-28 | 2009-01-27 | International Business Machines Corporation | Clustering process for software server failure prediction |
-
2005
- 2005-07-11 JP JP2005202134A patent/JP4626852B2/ja not_active Expired - Fee Related
-
2006
- 2006-07-11 CN CN2006800253530A patent/CN101218786B/zh not_active Expired - Fee Related
- 2006-07-11 EP EP06781153.9A patent/EP1903717B1/en not_active Ceased
- 2006-07-11 US US11/994,954 patent/US8065568B2/en active Active
- 2006-07-11 WO PCT/JP2006/314130 patent/WO2007007895A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020019870A1 (en) * | 2000-06-29 | 2002-02-14 | International Business Machines Corporation | Proactive on-line diagnostics in a manageable network |
CN1499749A (zh) * | 2002-11-06 | 2004-05-26 | 天津工程机械研究院 | 基于网络的移动作业机群设备状态监测与故障诊断系统 |
US20040230868A1 (en) * | 2003-03-17 | 2004-11-18 | Sabet Sameh A. | System and method for fault diagnosis using distributed alarm correlation |
Also Published As
Publication number | Publication date |
---|---|
CN101218786A (zh) | 2008-07-09 |
US20090167520A1 (en) | 2009-07-02 |
EP1903717A1 (en) | 2008-03-26 |
EP1903717B1 (en) | 2015-12-30 |
JP2007020115A (ja) | 2007-01-25 |
US8065568B2 (en) | 2011-11-22 |
JP4626852B2 (ja) | 2011-02-09 |
WO2007007895A1 (ja) | 2007-01-18 |
EP1903717A4 (en) | 2013-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101218786B (zh) | 通信网络故障检测系统、通信网络故障检测方法 | |
Yi et al. | Development of sensor validation methodologies for structural health monitoring: A comprehensive review | |
Entezami et al. | Data-driven damage diagnosis under environmental and operational variability by novel statistical pattern recognition methods | |
Chen et al. | The application of principal component analysis and kernel density estimation to enhance process monitoring | |
Han et al. | Wavelet packet based damage identification of beam structures | |
Hu et al. | Framework for a smart data analytics platform towards process monitoring and alarm management | |
Baraldi et al. | Robust signal reconstruction for condition monitoring of industrial components via a modified Auto Associative Kernel Regression method | |
US7089250B2 (en) | Method and system for associating events | |
Kruger et al. | Improved principal component monitoring of large-scale processes | |
He et al. | A three-stage automated modal identification framework for bridge parameters based on frequency uncertainty and density clustering | |
Pavlovski et al. | Hierarchical convolutional neural networks for event classification on PMU measurements | |
EP2963552B1 (en) | System analysis device and system analysis method | |
Zhao et al. | Subspace decomposition approach of fault deviations and its application to fault reconstruction | |
Pitakrat et al. | A framework for system event classification and prediction by means of machine learning | |
Zhao et al. | A multiple-time-region (MTR)-based fault subspace decomposition and reconstruction modeling strategy for online fault diagnosis | |
Niaki et al. | Statistical monitoring of autocorrelated simple linear profiles based on principal components analysis | |
Lee et al. | Early failure detection of paper manufacturing machinery using nearest neighbor‐based feature extraction | |
Khedmati et al. | Phase-I monitoring of general linear profiles in multistage processes | |
Snoussi et al. | On SPC for short run autocorrelated data | |
Dervilis et al. | A non‐linear manifold strategy for SHM approaches | |
Anaissi et al. | Online tensor decomposition with optimized stochastic gradient descent: an application in structural damage identification | |
Zhou et al. | Effects of model accuracy on residual control charts | |
Lambert | What use is statistics for massive data? | |
Wang et al. | Bubble testing under deterministic trends | |
Saini et al. | Improved Facebook Prophet Model Using Singular Spectrum Analysis for Short-Term Load Forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121024 Termination date: 20190711 |
|
CF01 | Termination of patent right due to non-payment of annual fee |