CN107342878A - 一种故障处理方法及装置 - Google Patents

一种故障处理方法及装置 Download PDF

Info

Publication number
CN107342878A
CN107342878A CN201610279127.0A CN201610279127A CN107342878A CN 107342878 A CN107342878 A CN 107342878A CN 201610279127 A CN201610279127 A CN 201610279127A CN 107342878 A CN107342878 A CN 107342878A
Authority
CN
China
Prior art keywords
failure
reason
phenomenon
suspected malfunctions
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610279127.0A
Other languages
English (en)
Inventor
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610279127.0A priority Critical patent/CN107342878A/zh
Priority to PCT/CN2017/078938 priority patent/WO2017185945A1/zh
Publication of CN107342878A publication Critical patent/CN107342878A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种故障处理方法及装置,该故障处理方法包括:根据故障现象,获取产生所述故障现象的疑似故障原因;对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。本发明实施例基于发生故障时的故障现象及产生该故障现象的疑似故障原因模拟人工排查故障的流程,对疑似故障原因对应的检查点进行逐一排查,从而确定产生该故障现象的原因,运维人员可直接对利用该方法确定的原因进行维修,从而实现故障智能定位,全面支持运维人员实现故障处理的智能化。

Description

一种故障处理方法及装置
技术领域
本发明涉及通信技术领域,特别是指一种故障处理方法及装置。
背景技术
在IPTV(交互式网络电视)系统中,对于用户投诉的故障,通常没有明确的错误提示,故障发生的边界模糊,跨越多个网络和网元,引起故障的原因多样。对于这类故障,目前故障定位的手段单一,需要人工去查看网元的日志、告警、性能指示、抓包数据,逐一的进行排查,这种定位方式复杂、低效,愈来愈不适应用户快速解决故障的要求。
随着IPTV业务的发展,一线运维人员的精力大部分投入到了解决用户故障的任务当中,网络优化、平台优化等工作自然就提不上日程,这样又导致用户体验得不到提升,形成了一个恶性循环,从而限制IPTV业务的进一步发展。
发明内容
本发明的目的在于提供一种故障处理方法及装置,解决了现有技术中故障需要人工逐一排查,耗费大量人力而限制业务进一步发展的问题。
为了达到上述目的,本发明实施例提供一种故障处理方法,包括:
根据故障现象,获取产生所述故障现象的疑似故障原因;
对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;
根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。
其中,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因的步骤包括:
若所述检查结果显示所述检查点的相关数据在预设范围内,确定所述检查点对应的疑似故障原因不是产生所述故障现象的目标故障原因;
若所述检查结果显示所述检查点的相关数据超出所述预设范围,确定所述检查点对应的疑似故障原因是产生所述故障现象的目标故障原因。
其中,对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果的步骤包括:
获取每一个所述疑似故障原因对应的一个或多个疑似故障模块;
对一个或多个所述疑似故障模块分别对应的检查点进行逐一检查,得到检查结果。
其中,对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果的步骤包括:
按照预先存储的疑似故障原因成为目标故障原因的概率从大到小的顺序对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果。
其中,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因之后,所述方法还包括:
生成针对所述目标故障原因的诊断结论和处理建议。
其中,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因之后,所述方法还包括:
获取导致预设故障的故障特征信息;
根据所述故障特征信息,从历史数据库中查找第一预设时间段内具有所述故障特征信息的用户数据;
根据所述用户数据,确定预设故障发生的用户段和位置区域。
其中,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因之后,所述方法还包括:
获取第二预设时间段内预设故障现象的数据信息;
根据预设故障现象的数据信息,确定所述预设故障现象的每个疑似故障原因成为目标故障原因的概率。
其中,根据预设故障现象的数据信息,确定所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率的步骤包括:
根据所述预设故障现象的数据信息,确定第二预设时间段内产生预设故障现象的总次数;
获取第二预设时间段内所述预设故障现象的每一个疑似故障原因成为目标故障原因的次数;
所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率为每一个疑似故障原因成为目标故障原因的次数与产生预设故障现象的总次数的比值。
其中,若故障为错误类故障,根据故障现象,获取产生所述故障现象的疑似故障原因的步骤包括:
获取所述故障的错误码及错误描述;所述错误码及错误描述为所述故障现象;
根据所述错误码及错误描述,获取产生所述故障现象的疑似故障原因。
其中,若故障为感知类故障,根据故障现象,获取产生所述故障现象的疑似故障原因的步骤包括:
利用聚类算法从用户的行为记录信息中对影响用户感知的关键绩效指标进行聚类;
根据聚类的结果和产生故障时操作信息,确定属于故障类的记录信息;所述故障类的记录信息为所述故障现象;
根据所述故障类的记录信息,获取产生所述故障现象的疑似故障原因。
本发明实施例还提供一种故障处理装置,包括:
获取模块,用于根据故障现象,获取产生所述故障现象的疑似故障原因;
检查模块,用于对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;
选择模块,用于根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。
其中,所述检查模块包括:
模块获取单元,用于获取每一个所述疑似故障原因对应的一个或多个疑似故障模块;
模块检查单元,用于对一个或多个所述疑似故障模块分别对应的检查点进行逐一检查,得到检查结果。
其中,所述选择模块包括:
第一确定单元,用于若所述检查结果显示所述检查点的相关数据在预设范围内,确定所述检查点对应的疑似故障原因不是产生所述故障现象的目标故障原因;
第二确定单元,用于若所述检查结果显示所述检查点的相关数据超出所述预设范围,确定所述检查点对应的疑似故障原因是产生所述故障现象的目标故障原因。
其中,所述检查模块包括:
检查单元,用于按照预先存储的疑似故障原因成为目标故障原因的概率从大到小的顺序对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果。
其中,所述故障处理装置还包括:
生成模块,用于生成针对所述目标故障原因的诊断结论和处理建议。
其中,所述故障处理装置还包括:
第一信息获取模块,用于获取导致预设故障的故障特征信息;
数据查找模块,用于根据所述故障特征信息,从历史数据库中查找第一预设时间段内具有所述故障特征信息的用户数据;
确定模块,用于根据所述用户数据,确定预设故障发生的用户段和位置区域。
其中,所述故障处理装置还包括:
第二信息获取模块,用于获取第二预设时间段内预设故障现象的数据信息;
概率确定模块,用于根据预设故障现象的数据信息,确定所述预设故障现象的每个疑似故障原因成为目标故障原因的概率。
其中,所述概率确定模块包括:
次数确定单元,用于根据所述预设故障现象的数据信息,确定第二预设时间段内产生预设故障现象的总次数;
次数获取单元,用于获取第二预设时间段内所述预设故障现象的每一个疑似故障原因成为目标故障原因的次数;
概率确定单元,用于所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率为每一个疑似故障原因成为目标故障原因的次数与产生预设故障现象的总次数的比值。
其中,所述获取模块包括:
第一获取单元,用于若故障为错误类故障,获取所述故障的错误码及错误描述;所述错误码及错误描述为所述故障现象;
第二获取单元,用于根据所述错误码及错误描述,获取产生所述故障现象的疑似故障原因。
其中,所述获取模块包括:
聚类单元,用于若故障为感知类故障,利用聚类算法从用户的行为记录信息中对影响用户感知的关键绩效指标进行聚类;
第三获取单元,用于根据聚类的结果和产生故障时操作信息,确定属于故障类的记录信息;所述故障类的记录信息为所述故障现象;
第四获取单元,用于根据所述故障类的记录信息,获取产生所述故障现象的疑似故障原因。
本发明的上述技术方案至少具有如下有益效果:
本发明实施例的故障处理方法及装置,根据发生故障时的故障现象及产生该故障现象的疑似故障原因,然后模拟人工排查故障的流程,对疑似故障原因对应的检查点进行逐一排查,从而确定产生该故障现象的原因,运维人员可直接对利用该方法确定的原因进行维修,从而实现故障智能定位,全面支持运维人员实现故障处理的智能化。
附图说明
图1表示本发明实施例提供的故障处理方法的基本步骤流程图;
图2表示本发明实施例提供的故障处理方法的故障树的逻辑视图;
图3表示本发明实施例提供的故障处理方法中故障数据分析流程图;
图4表示本发明实施例提供的故障处理方法中的故障定位流程图;
图5表示本发明实施例提供的故障处理方法中的故障影响范围推导流程图;
图6表示本发明实施例提供的故障处理装置的结构图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,本发明实施例提供一种故障处理方法,其特征在于,包括:
步骤11,根据故障现象,获取产生所述故障现象的疑似故障原因;
步骤12,对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;
步骤13,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。
本发明的上述实施例中,故障现象可以由用户输入也可以由系统根据当前的故障自动获取;具体的,在故障定位过程中首先需要知道故障的产生的时间、触发的位置、观看的节目等等信息,如果是错误类故障,由于交互式网络电视IPTV的机顶盒提示了具体的错误码和错误描述,可以快速确定该故障的疑似故障原因,从而可以快速定位到某个模块或网元的问题;即若故障为错误类故障,步骤11包括:
步骤111,获取所述故障的错误码及错误描述;所述错误码及错误描述为所述故障现象;
步骤112,根据所述错误码及错误描述,获取产生所述故障现象的疑似故障原因。
但是对于用户感知类的故障,用户在报障时对这些信息记忆模糊不清,解决这个问题的方法是采用从用户的行为记录里筛选出故障记录。这个筛选的过程是采用聚类算法,对影响用户感知的关键绩效指标KPI进行聚类,对聚类结果根据信息关联匹配(用户操作信息:发生故障时用户操作行为习惯,比如退出、播放快进等)的规则判断出属于故障类的记录,如果同一类故障有多条故障记录,任选一条故障记录进行定位。即若故障为感知类故障,步骤11包括:
步骤113,利用聚类算法从用户的行为记录信息中对影响用户感知的关键绩效指标进行聚类;
步骤114,根据聚类的结果和产生故障时操作信息,确定属于故障类的记录信息;所述故障类的记录信息为所述故障现象;
步骤115,根据所述故障类的记录信息,获取产生所述故障现象的疑似故障原因。
需要说明的是,本发明实施例中将引起故障的疑似故障原因构建成一颗故障树;如图2所示,树的根节点是故障现象;树的子节点是故障原因,该故障原因与IPTV的业务或设备故障对应,可以进一步分析导致故障的原因;树的叶子节点是可以明确故障原因,具体到内部定义的故障码,具体到代码级别等。每个疑似故障原因对应一个检查点,一个检查点可以对应多个故障现象中的疑似故障原因,即检查点可以复用。
需要说明的是,对于故障原因跨越多个模块的故障,把各个模块作为节点配置到故障树中,模块节点下再配置故障原因检查点。即针对跨越多个疑似故障模块的疑似故障原因,本发明实施例中步骤12包括:
步骤121,获取每一个所述疑似故障原因对应的一个或多个疑似故障模块;
步骤122,对一个或多个所述疑似故障模块分别对应的检查点进行逐一检查,得到检查结果。
进一步需要说明的是,每个疑似故障原因可对应多个疑似故障模块,也可对应一个疑似故障模块;每个疑似故障模块可对应多个检查点,也可对应一个检查点,在此不对其进行具体限定。本发明实施例中为了提高故障定位的准确性,对所有疑似故障原因对应的所有疑似故障模块的所有检查点进行逐一检查,确保不遗漏任何疑似故障原因。
具体的,本发明的上述实施例中步骤13包括:
步骤131,若所述检查结果显示所述检查点的相关数据在预设范围内,确定所述检查点对应的疑似故障原因不是产生所述故障现象的目标故障原因;
步骤132,若所述检查结果显示所述检查点的相关数据超出所述预设范围,确定所述检查点对应的疑似故障原因是产生所述故障现象的目标故障原因。
本发明具体实施例中模拟人工排查故障的流程,对可疑的故障检查点(即疑似故障原因对应的检查点)进行逐一排查。通过采集各业务模块的告警、性能指标、错误和异常日志,组织生成故障定位的基础数据,针对故障现象配置对应的检查点及处理建议,检查点可以是应用程序编程接口API接口(restful、sql)、执行命令(实时获取结果),根据异常值对查询结果进行判断,是异常值或在异常值范围内则不通过检查,否则通过检查;不通过检查的检查点对应的疑似故障原因为该故障的目标故障原因。
进一步的,为了提高确定目标故障原因的速率,本发明上述实施例中步骤12包括:
步骤123,按照预先存储的疑似故障原因成为目标故障原因的概率从大到小的顺序对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果。
本发明的上述实施例优先检查成为目标故障原因的概率较高的疑似故障原因,从而提高确定目标故障原因的速率。同时也可以将成为目标故障原因的概率较高的疑似故障原因提供给业务平台做重点优化。
需要说明的是,疑似故障原因成为目标故障原因的概率的确定方法为:系统把定位的每一个步骤记录下来保存到跟踪表中,经过一段时间的积累,系统对定位数据进行分析,对每个故障现象,统计出现概率较高的故障原因;提升这些故障原因的权重值,在后面的故障定位流程中优先检查权重值高的故障原因。即本发明实施例提供的故障处理方法还包括:
步骤14,获取第二预设时间段内预设故障现象的数据信息;
步骤15,根据预设故障现象的数据信息,确定所述预设故障现象的每个疑似故障原因成为目标故障原因的概率。
进一步的,步骤15包括:
步骤151,根据所述预设故障现象的数据信息,确定第二预设时间段内产生预设故障现象的总次数;
步骤152,获取第二预设时间段内所述预设故障现象的每一个疑似故障原因成为目标故障原因的次数;
步骤153,所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率为每一个疑似故障原因成为目标故障原因的次数与产生预设故障现象的总次数的比值。
如图3所示为本发明实施例中对故障数据进行分析从而确定概率的流程图,具体为:
步骤31,遍历一段时间的故障记录数据。
步骤32,聚合同一个故障现象的数据。
步骤33,故障原因对应的检查点检查不通过时,该故障原因的成为目标故障原因的次数累计加1。
步骤34,遍历结束后,计算成为目标故障原因累计次数占同一个故障现象的总累计数的比值,该比值即为疑似故障原因成为目标故障原因的概率,设为权重值。
步骤35,把权重值写入到故障原因表中。
进一步的本发明的上述实施例中,确定产生所述故障现象的目标故障原因之后,所述方法还包括:
步骤16,生成针对所述目标故障原因的诊断结论和处理建议。即本发明具体实施例中,需综合不通过检查的检查点的处理建议给出故障原因的分析,并自动生成故障诊断结论和处理建议,即在故障定位时从故障现象触发,通过中序遍历方式遍历整个故障树。遍历节点时,前一个节点的出参是后一个节点的入参,调用应用程序编程接口API检查本节点的故障是否存在,遍历结束后综合各个节点的检查结果形成本次故障定位的诊断结论。
具体的,如图4所示为故障定位的流程,包括:
步骤41,由故障现象/故障原因得到子节点列表,并遍历所有子节点。
步骤42,判断是否存在未遍历的子节点,如果是跳转到步骤44,否则跳转到步骤43。
步骤43,生成诊断结论和处理建议,精准定位到某一模块出现故障。
步骤44,找到该子节点对应的检查点,调用该检查点对应的接口。
步骤45,判断出参是否含有“result字段”,没有“result字段”则说明配置的是模块节点跳转到步骤41,有“result字段”则跳转到步骤46;
步骤46,调取API获取指标值。
步骤47,判断结果是否在正常范围。
步骤48,在正常范围内则记录步骤信息后跳转到步骤42。
步骤49,不在正常范围则检查不通过,记录处理建议后及步骤信息后跳转到步骤42。
进一步的,本发明的上述实施例提供的方法还包括:
步骤17,获取导致预设故障的故障特征信息;
步骤18,根据所述故障特征信息,从历史数据库中查找第一预设时间段内具有所述故障特征信息的用户数据;
步骤19,根据所述用户数据,确定预设故障发生的用户段和位置区域。
本发明的上述实施例可以总结历史数据从而判断出同一故障的发生用户段和位置区域,便于业务平台进行业务优化。具体的,可利用其位置区域的所有用户及发生故障的用户的比例,判断该区域是否出现大面积故障。例如,如图5所示为故障影响范围推导流程包括:
步骤51,获取导致用户故障的特征;
步骤52,根据特征在全网设备中的日志、告警、性能指标中以发生故障的时间为条件进行查询;
步骤53,获取发生故障的用户数据;
步骤54,根据故障用户占本区域在线用户数的比例确认本区域出现大面积故障。
综上,本发明实施例中故障现象定义包含的字段为:故障现象id、故障现象描述、故障输入条件、查询接口、筛选算法、出参。故障原因包含的字段为:节点id、父节点类型、父节点id、检查点id、权重。故障检查点定义包含的字段为:检查点id、检查点描述、业务模块、接口类型、入参、接口、出参、异常值、诊断结论、处理建议。故障处理跟踪定义包含的字段为:跟踪id、时间、故障现象id、节点id、故障原因检查记录。
综上,本发明实施例提供一种故障智能处理的方法,提供快速解决故障的手段,解决一线运维人员面临的困境。通过智能筛选故障行为记录、智能生成故障诊断结论及处理建议、智能推导故障影响范围,智能优化故障处理流程等技术,实现故障智能定位、精准定位,全面支持运维人员实现故障处理的智能化。
为了更好的实现上述目的,如图6所示,本发明实施例还提供一种故障处理装置,包括:
获取模块61,用于根据故障现象,获取产生所述故障现象的疑似故障原因;
检查模块62,用于对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;
选择模块63,用于根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。
具体的,本发明的上述实施例中所述选择模块包括:
第一确定单元,用于若所述检查结果显示所述检查点的相关数据在预设范围内,确定所述检查点对应的疑似故障原因不是产生所述故障现象的目标故障原因;
第二确定单元,用于若所述检查结果显示所述检查点的相关数据超出所述预设范围,确定所述检查点对应的疑似故障原因是产生所述故障现象的目标故障原因。
具体的,本发明的上述实施例中所述检查模块包括:
模块获取单元,用于获取每一个所述疑似故障原因对应的一个或多个疑似故障模块;
模块检查单元,用于对一个或多个所述疑似故障模块分别对应的检查点进行逐一检查,得到检查结果。
具体的,本发明的上述实施例中所述检查模块包括:
检查单元,用于按照预先存储的疑似故障原因成为目标故障原因的概率从大到小的顺序对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果。
具体的,本发明的上述实施例中所述故障处理装置还包括:
生成模块,用于生成针对所述目标故障原因的诊断结论和处理建议。
具体的,本发明的上述实施例中所述故障处理装置还包括:
第一信息获取模块,用于获取导致预设故障的故障特征信息;
数据查找模块,用于根据所述故障特征信息,从历史数据库中查找第一预设时间段内具有所述故障特征信息的用户数据;
确定模块,用于根据所述用户数据,确定预设故障发生的用户段和位置区域。
具体的,本发明的上述实施例中所述故障处理装置还包括:
第二信息获取模块,用于获取第二预设时间段内预设故障现象的数据信息;
概率确定模块,用于根据预设故障现象的数据信息,确定所述预设故障现象的每个疑似故障原因成为目标故障原因的概率。
具体的,本发明的上述实施例中所述概率确定模块包括:
次数确定单元,用于根据所述预设故障现象的数据信息,确定第二预设时间段内产生预设故障现象的总次数;
次数获取单元,用于获取第二预设时间段内所述预设故障现象的每一个疑似故障原因成为目标故障原因的次数;
概率确定单元,用于所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率为每一个疑似故障原因成为目标故障原因的次数与产生预设故障现象的总次数的比值。
具体的,本发明的上述实施例中所述获取模块包括:
第一获取单元,用于若故障为错误类故障,获取所述故障的错误码及错误描述;所述错误码及错误描述为所述故障现象;
第二获取单元,用于根据所述错误码及错误描述,获取产生所述故障现象的疑似故障原因。
具体的,本发明的上述实施例中所述获取模块包括:
聚类单元,用于若故障为感知类故障,利用聚类算法从用户的行为记录信息中对影响用户感知的关键绩效指标进行聚类;
第三获取单元,用于根据聚类的结果和产生故障时操作信息,确定属于故障类的记录信息;所述故障类的记录信息为所述故障现象;
第四获取单元,用于根据所述故障类的记录信息,获取产生所述故障现象的疑似故障原因。
需要说明的是,本发明实施例提供的故障处理装置是应用上述故障处理方法的故障处理装置,则上述故障处理方法的所有实施例均适用于该故障处理装置,且均能达到相同或相似的有益效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (20)

1.一种故障处理方法,其特征在于,包括:
根据故障现象,获取产生所述故障现象的疑似故障原因;
对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;
根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。
2.如权利要求1所述的故障处理方法,其特征在于,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因的步骤包括:
若所述检查结果显示所述检查点的相关数据在预设范围内,确定所述检查点对应的疑似故障原因不是产生所述故障现象的目标故障原因;
若所述检查结果显示所述检查点的相关数据超出所述预设范围,确定所述检查点对应的疑似故障原因是产生所述故障现象的目标故障原因。
3.如权利要求1所述的故障处理方法,其特征在于,对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果的步骤包括:
获取每一个所述疑似故障原因对应的一个或多个疑似故障模块;
对一个或多个所述疑似故障模块分别对应的检查点进行逐一检查,得到检查结果。
4.如权利要求1所述的故障处理方法,其特征在于,对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果的步骤包括:
按照预先存储的疑似故障原因成为目标故障原因的概率从大到小的顺序对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果。
5.如权利要求1所述的故障处理方法,其特征在于,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因之后,所述方法还包括:
生成针对所述目标故障原因的诊断结论和处理建议。
6.如权利要求1所述的故障处理方法,其特征在于,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因之后,所述方法还包括:
获取导致预设故障的故障特征信息;
根据所述故障特征信息,从历史数据库中查找第一预设时间段内具有所述故障特征信息的用户数据;
根据所述用户数据,确定预设故障发生的用户段和位置区域。
7.如权利要求1所述的故障处理方法,其特征在于,根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因之后,所述方法还包括:
获取第二预设时间段内预设故障现象的数据信息;
根据预设故障现象的数据信息,确定所述预设故障现象的每个疑似故障原因成为目标故障原因的概率。
8.如权利要求7所述的故障处理方法,其特征在于,根据预设故障现象的数据信息,确定所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率的步骤包括:
根据所述预设故障现象的数据信息,确定第二预设时间段内产生预设故障现象的总次数;
获取第二预设时间段内所述预设故障现象的每一个疑似故障原因成为目标故障原因的次数;
所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率为每一个疑似故障原因成为目标故障原因的次数与产生预设故障现象的总次数的比值。
9.如权利要求1所述的故障处理方法,其特征在于,若故障为错误类故障,根据故障现象,获取产生所述故障现象的疑似故障原因的步骤包括:
获取所述故障的错误码及错误描述;所述错误码及错误描述为所述故障现象;
根据所述错误码及错误描述,获取产生所述故障现象的疑似故障原因。
10.如权利要求1所述的故障处理方法,其特征在于,若故障为感知类故障,根据故障现象,获取产生所述故障现象的疑似故障原因的步骤包括:
利用聚类算法从用户的行为记录信息中对影响用户感知的关键绩效指标进行聚类;
根据聚类的结果和产生故障时操作信息,确定属于故障类的记录信息;所述故障类的记录信息为所述故障现象;
根据所述故障类的记录信息,获取产生所述故障现象的疑似故障原因。
11.一种故障处理装置,其特征在于,包括:
获取模块,用于根据故障现象,获取产生所述故障现象的疑似故障原因;
检查模块,用于对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果;
选择模块,用于根据所述检查结果,从所述疑似故障原因中选择产生所述故障现象的目标故障原因。
12.如权利要求11所述的故障处理装置,其特征在于,所述选择模块包括:
第一确定单元,用于若所述检查结果显示所述检查点的相关数据在预设范围内,确定所述检查点对应的疑似故障原因不是产生所述故障现象的目标故障原因;
第二确定单元,用于若所述检查结果显示所述检查点的相关数据超出所述预设范围,确定所述检查点对应的疑似故障原因是产生所述故障现象的目标故障原因。
13.如权利要求11所述的故障处理装置,其特征在于,所述检查模块包括:
模块获取单元,用于获取每一个所述疑似故障原因对应的一个或多个疑似故障模块;
模块检查单元,用于对一个或多个所述疑似故障模块分别对应的检查点进行逐一检查,得到检查结果。
14.如权利要求11所述的故障处理装置,其特征在于,所述检查模块包括:
检查单元,用于按照预先存储的疑似故障原因成为目标故障原因的概率从大到小的顺序对每一个所述疑似故障原因对应的检查点进行逐一检查,得到检查结果。
15.如权利要求11所述的故障处理装置,其特征在于,所述故障处理装置还包括:
生成模块,用于生成针对所述目标故障原因的诊断结论和处理建议。
16.如权利要求11所述的故障处理装置,其特征在于,所述故障处理装置还包括:
第一信息获取模块,用于获取导致预设故障的故障特征信息;
数据查找模块,用于根据所述故障特征信息,从历史数据库中查找第一预设时间段内具有所述故障特征信息的用户数据;
确定模块,用于根据所述用户数据,确定预设故障发生的用户段和位置区域。
17.如权利要求11所述的故障处理装置,其特征在于,所述故障处理装置还包括:
第二信息获取模块,用于获取第二预设时间段内预设故障现象的数据信息;
概率确定模块,用于根据预设故障现象的数据信息,确定所述预设故障现象的每个疑似故障原因成为目标故障原因的概率。
18.如权利要求17所述的故障处理装置,其特征在于,所述概率确定模块包括:
次数确定单元,用于根据所述预设故障现象的数据信息,确定第二预设时间段内产生预设故障现象的总次数;
次数获取单元,用于获取第二预设时间段内所述预设故障现象的每一个疑似故障原因成为目标故障原因的次数;
概率确定单元,用于所述预设故障现象的每一个疑似故障原因成为目标故障原因的概率为每一个疑似故障原因成为目标故障原因的次数与产生预设故障现象的总次数的比值。
19.如权利要求11所述的故障处理装置,其特征在于,所述获取模块包括:
第一获取单元,用于若故障为错误类故障,获取所述故障的错误码及错误描述;所述错误码及错误描述为所述故障现象;
第二获取单元,用于根据所述错误码及错误描述,获取产生所述故障现象的疑似故障原因。
20.如权利要求11所述的故障处理装置,其特征在于,所述获取模块包括:
聚类单元,用于若故障为感知类故障,利用聚类算法从用户的行为记录信息中对影响用户感知的关键绩效指标进行聚类;
第三获取单元,用于根据聚类的结果和产生故障时操作信息,确定属于故障类的记录信息;所述故障类的记录信息为所述故障现象;
第四获取单元,用于根据所述故障类的记录信息,获取产生所述故障现象的疑似故障原因。
CN201610279127.0A 2016-04-29 2016-04-29 一种故障处理方法及装置 Pending CN107342878A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610279127.0A CN107342878A (zh) 2016-04-29 2016-04-29 一种故障处理方法及装置
PCT/CN2017/078938 WO2017185945A1 (zh) 2016-04-29 2017-03-31 一种故障处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610279127.0A CN107342878A (zh) 2016-04-29 2016-04-29 一种故障处理方法及装置

Publications (1)

Publication Number Publication Date
CN107342878A true CN107342878A (zh) 2017-11-10

Family

ID=60160724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610279127.0A Pending CN107342878A (zh) 2016-04-29 2016-04-29 一种故障处理方法及装置

Country Status (2)

Country Link
CN (1) CN107342878A (zh)
WO (1) WO2017185945A1 (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107786897A (zh) * 2016-08-31 2018-03-09 南京中兴新软件有限责任公司 Iptv系统故障定位方法及系统
CN107948636A (zh) * 2017-12-13 2018-04-20 中邮科通信技术股份有限公司 一种基于iptv机顶盒错误码的故障自检测定位方法
CN108401164A (zh) * 2018-02-12 2018-08-14 中国联合网络通信集团有限公司 故障处理方法及装置
CN109190716A (zh) * 2018-10-23 2019-01-11 深圳增强现实技术有限公司 低压集抄故障的处理方法、装置及电子设备
CN109274533A (zh) * 2018-09-28 2019-01-25 中国电子科技集团公司第十五研究所 一种基于规则引擎的Web服务故障的定位装置和方法
CN109377039A (zh) * 2018-10-12 2019-02-22 中国人民解放军92942部队 一种系统任务可靠性关键故障因素分析方法
CN109818764A (zh) * 2017-11-21 2019-05-28 中国电信股份有限公司 Iptv网络设备故障检测方法和装置
CN109934268A (zh) * 2019-02-20 2019-06-25 中国工商银行股份有限公司 异常交易检测方法及系统
CN109981328A (zh) * 2017-12-28 2019-07-05 中国移动通信集团陕西有限公司 一种故障预警方法及装置
CN109992477A (zh) * 2019-03-27 2019-07-09 联想(北京)有限公司 用于电子设备的信息处理方法、系统以及电子设备
CN110658798A (zh) * 2018-06-29 2020-01-07 株洲中车时代电气股份有限公司 轨道交通车辆传动控制单元的同步测试系统及方法
CN111082951A (zh) * 2019-12-30 2020-04-28 中国联合网络通信集团有限公司 故障诊断方法、装置、设备及存储介质
CN111182291A (zh) * 2020-01-02 2020-05-19 北京京东振世信息技术有限公司 一种视频检修方法、维修端、服务器、系统及存储介质
WO2020119369A1 (zh) * 2018-12-13 2020-06-18 平安普惠企业管理有限公司 智能it运维故障定位方法、装置、设备及可读存储介质
CN113645385A (zh) * 2021-08-07 2021-11-12 深圳丰汇汽车电子有限公司 一种汽车故障内窥镜诊断的方法和装置
WO2021237729A1 (zh) * 2020-05-29 2021-12-02 西门子股份公司 故障检测方法及其装置
CN113766444A (zh) * 2021-09-23 2021-12-07 中国联合网络通信集团有限公司 故障定位方法、装置及设备
CN114598904A (zh) * 2020-11-20 2022-06-07 中国移动通信集团广东有限公司 交互式网络电视iptv业务的故障定位方法和装置
CN115374658A (zh) * 2022-10-25 2022-11-22 中国人民解放军海军工程大学 一种电子设备最少耗时故障排查次序优化方法和系统
WO2023011160A1 (zh) * 2021-08-06 2023-02-09 北京百度网讯科技有限公司 一种故障处理方法、装置、设备及存储介质

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107968727A (zh) * 2017-11-29 2018-04-27 郑州云海信息技术有限公司 一种cifs服务的检测方法、装置及介质
CN110532122B (zh) * 2019-08-26 2023-05-30 东软医疗系统股份有限公司 故障分析方法及系统、电子设备、存储介质
CN111106962B (zh) * 2019-12-24 2022-07-08 北京达佳互联信息技术有限公司 流媒体故障监测方法、装置、电子设备及存储介质
CN111179115A (zh) * 2019-12-25 2020-05-19 东软集团股份有限公司 故障处理辅助决策方法、装置、存储介质及电子设备
CN113556671B (zh) * 2020-04-22 2022-10-14 中国联合网络通信集团有限公司 故障定位方法、装置和存储介质
CN112367191B (zh) * 2020-10-22 2023-04-07 深圳供电局有限公司 一种5g网络切片下服务故障定位方法
CN112380042B (zh) * 2020-11-17 2024-04-12 北京中亦安图科技股份有限公司 数据库软件的故障定位与分析方法、装置及存储介质
CN113407374A (zh) * 2021-06-22 2021-09-17 未鲲(上海)科技服务有限公司 故障处理方法、装置、故障处理设备及存储介质
CN114676860A (zh) * 2022-03-29 2022-06-28 东风汽车集团股份有限公司 一种发动机故障分析方法及装置、存储介质
CN115454697B (zh) * 2022-09-15 2023-04-07 中航信移动科技有限公司 服务异常的信息处理方法、装置、电子设备及存储介质
CN115759479B (zh) * 2022-12-12 2023-09-19 中国人民解放军海军工程大学 一种基于综合值的复杂设备故障定位优化方法和系统
CN117193252A (zh) * 2023-09-28 2023-12-08 广东百德朗科技有限公司 基于数据平台的智慧楼宇远程运维方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101060436A (zh) * 2007-06-05 2007-10-24 杭州华三通信技术有限公司 一种用于通信设备的故障分析方法及装置
CN101399694A (zh) * 2007-09-29 2009-04-01 上海市闵行中学 一种依据路由器的测试方法
EP2680494A1 (en) * 2012-06-29 2014-01-01 Alcatel-Lucent Home network trouble shooting
CN104376033A (zh) * 2014-08-01 2015-02-25 中国人民解放军装甲兵工程学院 一种基于故障树和数据库技术的故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101060436A (zh) * 2007-06-05 2007-10-24 杭州华三通信技术有限公司 一种用于通信设备的故障分析方法及装置
CN101399694A (zh) * 2007-09-29 2009-04-01 上海市闵行中学 一种依据路由器的测试方法
EP2680494A1 (en) * 2012-06-29 2014-01-01 Alcatel-Lucent Home network trouble shooting
CN104376033A (zh) * 2014-08-01 2015-02-25 中国人民解放军装甲兵工程学院 一种基于故障树和数据库技术的故障诊断方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107786897A (zh) * 2016-08-31 2018-03-09 南京中兴新软件有限责任公司 Iptv系统故障定位方法及系统
CN109818764A (zh) * 2017-11-21 2019-05-28 中国电信股份有限公司 Iptv网络设备故障检测方法和装置
CN107948636A (zh) * 2017-12-13 2018-04-20 中邮科通信技术股份有限公司 一种基于iptv机顶盒错误码的故障自检测定位方法
CN109981328A (zh) * 2017-12-28 2019-07-05 中国移动通信集团陕西有限公司 一种故障预警方法及装置
CN109981328B (zh) * 2017-12-28 2022-02-25 中国移动通信集团陕西有限公司 一种故障预警方法及装置
CN108401164A (zh) * 2018-02-12 2018-08-14 中国联合网络通信集团有限公司 故障处理方法及装置
CN110658798A (zh) * 2018-06-29 2020-01-07 株洲中车时代电气股份有限公司 轨道交通车辆传动控制单元的同步测试系统及方法
CN109274533A (zh) * 2018-09-28 2019-01-25 中国电子科技集团公司第十五研究所 一种基于规则引擎的Web服务故障的定位装置和方法
CN109274533B (zh) * 2018-09-28 2022-02-25 中国电子科技集团公司第十五研究所 一种基于规则引擎的Web服务故障的定位装置和方法
CN109377039A (zh) * 2018-10-12 2019-02-22 中国人民解放军92942部队 一种系统任务可靠性关键故障因素分析方法
CN109190716A (zh) * 2018-10-23 2019-01-11 深圳增强现实技术有限公司 低压集抄故障的处理方法、装置及电子设备
WO2020119369A1 (zh) * 2018-12-13 2020-06-18 平安普惠企业管理有限公司 智能it运维故障定位方法、装置、设备及可读存储介质
CN109934268B (zh) * 2019-02-20 2021-01-22 中国工商银行股份有限公司 异常交易检测方法及系统
CN109934268A (zh) * 2019-02-20 2019-06-25 中国工商银行股份有限公司 异常交易检测方法及系统
CN109992477B (zh) * 2019-03-27 2021-07-16 联想(北京)有限公司 用于电子设备的信息处理方法、系统以及电子设备
CN109992477A (zh) * 2019-03-27 2019-07-09 联想(北京)有限公司 用于电子设备的信息处理方法、系统以及电子设备
CN111082951A (zh) * 2019-12-30 2020-04-28 中国联合网络通信集团有限公司 故障诊断方法、装置、设备及存储介质
CN111182291A (zh) * 2020-01-02 2020-05-19 北京京东振世信息技术有限公司 一种视频检修方法、维修端、服务器、系统及存储介质
US11777787B2 (en) 2020-01-02 2023-10-03 Beijing Jingdong Zhenshi Information Technology Co., Ltd. Video-based maintenance method, maintenance terminal, server, system and storage medium
WO2021237729A1 (zh) * 2020-05-29 2021-12-02 西门子股份公司 故障检测方法及其装置
CN114598904A (zh) * 2020-11-20 2022-06-07 中国移动通信集团广东有限公司 交互式网络电视iptv业务的故障定位方法和装置
CN114598904B (zh) * 2020-11-20 2023-06-30 中国移动通信集团广东有限公司 交互式网络电视iptv业务的故障定位方法和装置
WO2023011160A1 (zh) * 2021-08-06 2023-02-09 北京百度网讯科技有限公司 一种故障处理方法、装置、设备及存储介质
CN113645385A (zh) * 2021-08-07 2021-11-12 深圳丰汇汽车电子有限公司 一种汽车故障内窥镜诊断的方法和装置
CN113766444B (zh) * 2021-09-23 2023-07-04 中国联合网络通信集团有限公司 故障定位方法、装置及设备
CN113766444A (zh) * 2021-09-23 2021-12-07 中国联合网络通信集团有限公司 故障定位方法、装置及设备
CN115374658B (zh) * 2022-10-25 2023-02-14 中国人民解放军海军工程大学 一种电子设备最少耗时故障排查次序优化方法和系统
CN115374658A (zh) * 2022-10-25 2022-11-22 中国人民解放军海军工程大学 一种电子设备最少耗时故障排查次序优化方法和系统

Also Published As

Publication number Publication date
WO2017185945A1 (zh) 2017-11-02

Similar Documents

Publication Publication Date Title
CN107342878A (zh) 一种故障处理方法及装置
Bustamante et al. Toward an integrated monitoring framework to assess the effects of tropical forest degradation and recovery on carbon stocks and biodiversity
US7401263B2 (en) System and method for early detection of system component failure
EP2359204B1 (de) Adaptives zentrales wartungssystem und verfahren zum planen von wartungsvorgängen von systemen
CN106961362B (zh) 自动化测试方法及移动云测试系统
US9384453B2 (en) Engine diagnostic system for high volume feedback processing
CN109714187A (zh) 基于机器学习的日志分析方法、装置、设备及存储介质
CN107018023A (zh) 一种服务器诊断方法、装置及系统
DE60314025T2 (de) System und Verfahren zur Identifizierung einer fehlerhaften Komponente in einem Netzwerkelement
CN108170580A (zh) 一种基于规则的日志报警方法、装置及系统
CN105160724A (zh) 一种基于手机app的危险化学品企业关键设备巡检系统
WO2002013015A1 (de) System zur ermittlung von fehlerursachen
CN110866664A (zh) 石化生产工艺的风险量化管控方法及系统
DE102015225144A1 (de) System und Verfahren zur Diagnose von zumindest einer wartungsbedürftigen Komponente eines Geräts und/oder Anlage
DE112016006842T5 (de) Aufzug-Fernwartungsunterstützungssystem und Aufzug-Fernwartungsunterstützungsverfahren
DE69730130T2 (de) Betrugsüberwachung in einem fernmeldenetz
CN101715203A (zh) 一种自动定位故障点的方法和设备
DE112016006796T5 (de) Aufzugfernwartungs-assistenzsytem und aufzugfernwartungs-assistenzverfahren
CN110471395A (zh) 一种故障检测方法、装置、设备及存储介质
CN110866662A (zh) 石化生产工艺的风险定量管理方法及系统
DE102010012693A1 (de) Anordnung und Verfahren zur automatisierten Erfassung und nachfolgenden Verfügbarkeitsberechnung einer Netzwerkstruktur mit aktiven Vermittlungsknoten für industrielle Anwendungen
CA2444609A1 (en) Diagnostics using information specific to a subsystem
CN107911762A (zh) 一种基于决策树的onu故障诊断方法
CN107291616A (zh) 一种项目报告在线生成平台
DE102011086352A1 (de) Verfahren und Diagnosesystem zur Unterstützung der geführten Fehlersuche in technischen Systemen

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171110

WD01 Invention patent application deemed withdrawn after publication