CN107786897A - Iptv系统故障定位方法及系统 - Google Patents

Iptv系统故障定位方法及系统 Download PDF

Info

Publication number
CN107786897A
CN107786897A CN201610792308.3A CN201610792308A CN107786897A CN 107786897 A CN107786897 A CN 107786897A CN 201610792308 A CN201610792308 A CN 201610792308A CN 107786897 A CN107786897 A CN 107786897A
Authority
CN
China
Prior art keywords
failure
root node
phenomenon
fault tree
failure cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201610792308.3A
Other languages
English (en)
Inventor
罗方方
陈斌
徐淑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
Nanjing ZTE New Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing ZTE New Software Co Ltd filed Critical Nanjing ZTE New Software Co Ltd
Priority to CN201610792308.3A priority Critical patent/CN107786897A/zh
Publication of CN107786897A publication Critical patent/CN107786897A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4425Monitoring of client processing errors or hardware failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2404Monitoring of server processing errors or hardware failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • H04N21/6473Monitoring network processes errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种IPTV系统故障定位方法及系统,所述方法包括:获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。本发明中方法和系统通过获取待定位故障现象对应的故障树,遍历该故障树对多个故障原因进行检测,从而定位出导致所述待定位故障现象的故障原因,有效提高了IPTV系统中故障定位效率。

Description

IPTV系统故障定位方法及系统
技术领域
本发明涉及网络电视领域,特别是涉及一种IPTV系统故障定位方法及系统。
背景技术
IPTV(Internet Protocol Television,交互式网络电视)是一种集互联网、多媒体、通讯等技术于一体,向家庭用户提供包括数字电视在内的多种交互式服务的崭新技术。
由于IPTV网络结构复杂,故障原因多种多样,当发生故障或服务质量差时,如何快速、准确的定位,以及缩短故障处理时间,对提高用户体验尤为重要。
现有故障检测方法对IPTV网络中各模块依次进行检测,使用模拟测试等手段确定故障点,因此针对性不强,对所有故障执行相同的检测过程,从而导致故障定位效率低。
发明内容
为了克服上述现有技术的缺陷,本发明要解决的技术问题是提供一种IPTV系统故障定位方法及系统,用以解决IPTV系统中故障定位效率低的问题。
为解决上述技术问题,本发明提供一种IPTV系统故障定位方法,所述方法包括:
获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;
遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。
作为本发明的方法的改进,所述获取待定位故障现象对应的故障树的步骤之前,还包括:
针对预设的每种故障现象,获取可能导致该故障现象对应的多个故障原因;
按照预设检测顺序确定各故障原因之间的层次关系;
基于所述层次关系构造所述故障树的层级关系;
将各故障原因按照所述层级关系分别置于所述故障树的非根节点处,将该故障现象置于所述故障树的根节点处,完成构建具有树形结构的每种故障现象的故障树。
作为本发明的方法的进一步改进,所述遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因的步骤,包括:
按照所述层级关系,遍历所述待定位故障现象的故障树的非根节点,在遍历时对每个非根节点处的故障原因进行检测;
遍历完成后,根据检测结果从所述非根节点中定位出导致所述待定位故障现象的故障原因。
作为本发明的方法的再进一步改进,对任意一个非根节点的故障原因进行检测的步骤,包括:
判断该非根节点处的故障原因所对应的检查点的类型;
若判定为信息型检查点时,调用所述信息型检查点获取该非根节点的故障原因对应的预设参数信息,并将获取的所述参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为判定型检查点时,调用所述判定型检查点采用预设判定方式判断是否对该非根节点下一层级的故障原因进行检测;并且在判定为是的情况下,将该非根节点上一层级检查点提供的参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为分析型检查点时,调用所述分析型检查点根据该非根节点上一层级检查点提供的参数信息,从预设基础数据中获取预设目标数据,并基于所述目标数据判断出该非根节点的故障原因是否导致了所述待定位故障现象。
作为本发明的方法的更进一步改进,所述基础数据的获取方式包括:
接收所述IPTV系统中探针上报的业务监控数据,以及采集IPTV系统的业务模块上的日志数据;
从所述业务监控数据和/或所述日志数据中获取所述基础数据。
作为本发明的方法的另一种改进,所述遍历获取的故障树,对各非根节点对应的故障原因进行检测的步骤,还包括:
并行检测处于同一层级的故障原因。
为解决上述技术问题,本发明提供一种IPTV系统故障定位系统,所述系统包括:
故障树获取单元,用于获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;
故障定位单元,用于遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。
作为本发明的系统的改进,所述系统还包括:
故障树构建单元,用于针对预设的每种故障现象,获取可能导致该故障现象对应的多个故障原因;
按照预设检测顺序确定各故障原因之间的层次关系;
基于所述层次关系构造所述故障树的层级关系;
将各故障原因按照所述层级关系分别置于所述故障树的非根节点处,将该故障现象置于所述故障树的根节点处,完成构建具有树形结构的每种故障现象的故障树。
作为本发明的系统的进一步改进,所述故障定位单元,具体用于按照所述层级关系,遍历所述待定位故障现象的故障树的非根节点,在遍历时对每个非根节点处的故障原因进行检测;
遍历完成后,根据检测结果从所述非根节点中定位出导致所述待定位故障现象的故障原因。
作为本发明的系统的更进一步改进,所述故障定位单元对任意一个非根节点的故障原因进行检测时,具体用于判断该非根节点处的故障原因所对应的检查点的类型;
若判定为信息型检查点时,调用所述信息型检查点获取该非根节点的故障原因对应的预设参数信息,并将获取的所述参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为判定型检查点时,调用所述判定型检查点采用预设判定方式判断是否对该非根节点下一层级的故障原因进行检测;并且在判定为是的情况下,将该非根节点上一层级检查点提供的参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为分析型检查点时,调用所述分析型检查点根据该非根节点上一层级检查点提供的参数信息,从预设基础数据中获取预设目标数据,并基于所述目标数据判断出该非根节点的故障原因是否导致了所述待定位故障现象。
本发明有益效果如下:
本发明中方法和系统通过获取待定位故障现象对应的故障树,遍历该故障树对多个故障原因进行检测,从而定位出导致所述待定位故障现象的故障原因,有效提高了IPTV系统中故障定位效率。
附图说明
图1是本发明实施例中一种IPTV系统故障定位方法的流程图;
图2是本发明实施例中故障树的结构示意图;
图3是本发明实施例中黑屏故障现象故障树示意图;
图4是本发明实施例中质差故障现象故障树示意图;
图5是本发明实施例中基于故障树的故障定位方法的流程图;
图6是本发明实施例中一种IPTV系统故障定位系统的结构示意图。
具体实施方式
为了解决现有技术解决IPTV系统中故障定位效率低的问题,本发明提供了一种IPTV系统故障定位方法及系统,以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不限定本发明。
方法实施例
如图1所示,本发明实施例中一种IPTV系统故障定位方法,包括:
S101,获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;
S102,遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。
其中,待定位故障现象指代需要诊断定位的故障现象。
其中,故障树具有树形结构;如图2所示,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的所述多个故障原因分别位于所述故障树的非根节点;也就是说,故障现象根节点是用户感知类的故障,如播放卡顿、黑屏、频道切换速度慢、机顶盒报错或播放质量差等。一级故障原因子节点(对应故障原因A、B和C)可以是业务内部定义的故障原因,可以进一步分析导致故障现象的二级故障原因节点(对应故障原因A1、B1、B2和B3),如节目不存在、EPG服务进程重启、CDN节点cc进程重启等。
本发明实施例通过获取待定位故障现象对应的故障树,遍历该故障树对多个故障原因进行检测,从而实现定位出导致所述待定位故障现象的故障原因,有效提高了IPTV系统中故障定位效率。
在上述实施例的基础上,进一步提出上述实施例的变型实施方式,在此需要说明的是,为了使描述简要,在各变型实施方式中仅描述与上述实施例的不同之处。
在本发明的一个实施方式中,对所述待定位故障现象的定位触发方式,可分为两种:一种人工干预触发,当有用户报障,根据用户帐号、时间、观看节目等信息查询过滤出故障播放记录,对故障播放记录进行故障定位定界。另一种为主动触发,当监控或告警功能发现用户或频道播放故障率超过设定阈值,触发故障定位定界功能。
因此,在S101前还可以包括:
S1011,接收用户的定位触发,或者,监测播放故障率;
S1012,在接收到用户的定位触发时,或者,在监测播放故障率超高设定阈值时,获取待定位故障现象对应的故障树。
在本发明的另一个实施方式中,所述获取待定位故障现象对应的故障树的步骤之前,还包括:
针对预设的每种故障现象,获取可能导致该故障现象对应的多个故障原因;
按照预设检测顺序确定各故障原因之间的层次关系;
基于所述层次关系构造所述故障树的层级关系;
将各故障原因按照所述层级关系分别置于所述故障树的非根节点处,将该故障现象置于所述故障树的根节点处,完成构建具有树形结构的每种故障现象的故障树。
本发明实施例通过预先获取待定位故障现象的多个故障原因,并按照层次关系设置故障树的层级关系,使得本发明实施例根据故障树对多个故障原因进行检测时,使得故障定位更有针对性,可以高效地定位出导致所述待定位故障现象的故障原因,有效提高了IPTV系统中故障定位效率。
在本发明实施方式中可以采用如下方式获取可能导致IPTV系统中待定位故障现象的多个故障原因:
针对该故障现象,基于训练样本数据,训练学习出可能导致该故障现象的可能故障原因。
当然也可以采用其他现有技术,例如基于技术人员经验获得。
在本发明实施方式中预设检测顺序可以根据导致所述待定位故障现象的多个故障原因的层次关系设置。
例如,多个可能的故障原因为业务模块层次的原因(EPG模块、CDN模块、节目源、接入网络、业务平台、终端等)、业务类型层次的原因(点播、直播、点播/回看/时移等)以及各业务类型下的具体故障原因(网络链接错误等);此时预设检测顺序可以按照以下顺序设置:业务模块、业务类型和各业务类型下的具体故障原因。
如图3所示黑屏故障现象中,预设检测顺序为第一级EPG模块和CDN模块,第二级为EPG模块下的点播、CDN模块下的直播和点播/回看/时移,第三级为点播、直播和点播/回看/时移下的具体故障原因;因此黑屏故障树的根节点为黑屏,第一层非根节点(即一级故障原因节点)有两个,分别为EPG模块和CDN模块;第二层非根节点有三个,分别为EPG模块下的点播、CDN模块下的直播和点播/回看/时移;第三层非根节点为具体故障原因。
比如,如图4所示质差故障现象中,预设检测顺序为第一级节目源、接入网络、业务平台和终端;第二级为节目源下的直播单播、直播组播和点播,接入网络下的直播单播、直播组播和点播,业务平台下的直播单播、直播组播和点播;第三级为具体的故障原因;因此质差故障树的根节点为质差,第一层非根节点有4个分别为节目源、接入网络、业务平台和终端;第二层非根节点为节目源下的直播单播、直播组播和点播,接入网络下的直播单播、直播组播和点播,业务平台下的直播单播、直播组播和点播;第三层为具体故障原因。
进一步说,所述遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因的步骤,包括:
按照所述层级关系,遍历所述待定位故障现象的故障树的非根节点,在遍历时对每个非根节点处的故障原因进行检测;
遍历完成后,根据检测结果从所述非根节点中定位出导致所述待定位故障现象的故障原因。
再进一步说,对任意一个非根节点的故障原因进行检测的步骤,包括:
判断该非根节点处的故障原因所对应的检查点的类型;
若判定为信息型检查点时,调用所述信息型检查点获取该非根节点的故障原因对应的预设参数信息(ip或id之类的参数信息),并将获取的所述参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为判定型检查点时,调用所述判定型检查点采用预设判定方式判断是否对该非根节点下一层级的故障原因进行检测;并且在判定为是的情况下,将该非根节点上一层级检查点提供的参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为分析型检查点时,调用所述分析型检查点根据该非根节点上一层级检查点提供的参数信息,从基础数据中获取预设目标数据,并基于所述目标数据判断出该非根节点的故障原因是否导致了所述待定位故障现象。例如,根据上一级提供的基本信息(可能是ip或id之类的),从大量基础数据中获取目标数据(可能是故障率或者其它关键指标),然后和该检查点设定的阈值比较判断是否故障。
也就是说,每个可能的故障原因对应一个检查点,一个检查点可以对应多个故障现象中的可能的故障原因,即检查点可以复用。故障树建模时可根据不同的故障现象选择可能的故障的原因构建故障树。检查点根据实际作用,可分为三种类型:1信息型检查点,获取相关参数供下级故障原因检查点使用;2判定型检查点,根据入参判断是否进入该故障原因分支进行定位定界;3分析型检查点,对基础数据进行相关分析,给出定位定界结果,结果异常时给出处理建议。
具体说,如图3所示,黑屏故障主要涉及到EPG模块和CDN模块,故障树的一级故障原因节点由这两个组成,检查点类型为信息型检查点,返回使用的EPG、CDN的IP等相关信息,供下级节点使用。
EPG模块节点下有点播节点,对应检查点为判断型检查点,当待定位故障的服务类型为点播时进入该检查点,对网络不存在、节目不存在、KEY_OF_EPG_CDN配置错误三个具体故障原因分别进行分析定位;
这三个故障原因对应的检查点为分析型检查点,通过对基础数据的分析给出定位结果。
类似的,CDN模块节点下根据其作用,有直播、点播/回看/时移两个判定型检查点。直播、点播/回看/时移两个节点下又有多个分析型的故障原因节点。
当对黑屏故障进行定位定界时,遍历故障树,给出故障定位结果和建议。
如图4所示,播放质量差故障现象为一种用户感受,故障原因可能为业务网络的任何一个环节,对这种类型的故障进行定界时,要对全网基础数据进行对比分析,给出相关业务节点的故障概率处理建议。
也就是说故障现象为质差,节目源、接入网络、业务平台、终端为四个一级故障原因,对应检查点类型为信息型检查点。这四个节点下面可根据实际情况建直播单播、直播组播,点播三个故障原因,对应判断型为检查点。三级为相关的故障原因节点,对应分析型检查点,下面对部分检查点检测具体故障原因给出说明。
全网终端质差率为对待定位的频道或节目全网的质差率进行统计,根据全网终端质差率所属的区间进行定界,给出故障概率,质差率越高,故障概率越大。
源监控为对节目源进行抓包分析,判断节目源是否故障。
所在分组路径质差率为对待定位用户所属的网络分组拓扑,如某省-某市-某区-某宽带接入服务器-某OLT,计算分析路径中各分组的质差率,给出最差分组的质差率,根据质差率区进行定界,给出分组故障概率。
所在区域质差率为计算分析用户所属的区域如某市或某区的质差率,根据质差率区间输出故障概率。
所在流媒体质差率为计算分析用户所属流媒体服务器质差率,并进行定位定界。
所在CDN质差率为计算分析用户所属CDN节点质差率,并进行定位定界。
因此可以按照节目源、接入网络、业务平台、终端四个方面根据各故障原因进行多维度的基于大数据计算、对比、分析,并根据设置的阈值条件进行定界给出故障概率,及处理建议。
更进一步说,所述基础数据的获取方式包括:
接收所述IPTV系统中探针上报的业务监控数据,以及采集IPTV系统的业务模块上的日志数据;
从所述业务监控数据和/或所述日志数据中获取所述基础数据。
也就是说业务数据来源主要有部署在IPTV网络结构中探针上报的业务监控数据,及采集的CDN、EPG等业务模块节点上的告警、性能指标、错误和异常日志。
本发明实施例在处理业务监控数据和日志数据过程中可以使用大数据处理方案,保证数据的实时性。处理后数据入ElasticSearch,以便达到实时、稳定、可靠、快速的搜索于分析。
在本发明的又一个实施方式中,所述遍历获取的故障树,对各非根节点对应的故障原因进行检测的步骤,还包括:
并行检测处于同一层级的故障原因。
本发明实施方式更进一步提高了故障定位效率。
以下举一具体应用例详细描述基于故障树进行故障定位。
如图5所示,触发故障定位定界后,处理流程为:
步骤1:根据故障现象获取一级故障原因列表。
步骤2:并行检测同级故障原因,即对同一父节点下的多个同级故障原因并行处理,提高处理效率。
步骤3:调用故障原因对应的检查点接口,检查点接口用REST实现,在接口设计中定义好输入参数、输出参数及用于判断是否出现故障的阈值。
步骤4:判断输出参数是否包含bool属性。检查点的类型可以根据输出参数进行判断,如果输出参数中包括bool属性,则为判断型检查点;当包含bool属性,进入步骤5。当输出参数不包含bool属性,进入步骤9。
步骤5:判断bool属性值是否为true。属性值为true,进入步骤6,否则进入步骤7。
步骤6:判断该故障原因是否有下级故障原因,如果有,进入步骤一继续循环;如果没有下级故障原因则进入步骤7。
步骤7:判断是否检测完所有故障原因节点,如果未检测完,则进入等待,直到检测完所有故障原因节点,结束等待,进入步骤8。如果检测完所有故障原因节点,直接进入步骤8。
步骤8:给出故障定位定界的结论及处理建议,结束本次定位定界。
步骤9:判断输出参数是否包含result属性,类似于步骤4,如果输出参数中包括result属性,则为信息型检查点,否则为分析型检查点。当输出参数包含result属性进入步骤10,否则进入步骤11。
步骤10:记录出参,即记录信息型检查点的返回相关参数,供下级故障原因使用。记录后,进入步骤6,继续检测下级故障原因。
步骤11:判断返回结果是否超过阈值,即对分析型检查点的输出结果和该检查点设定的阈值进行比较,如果超过阈值,则命中该故障原因,进入步骤12。未超过阈值进入步骤13。
步骤12:记录故障定位定界处理建议。记录后进入步骤13。
步骤13:记录检查结果,记录后进入步骤6。
本具体应用例中,数据来源主要有部署在IPTV网络结构中探针上报的业务监控数据,及采集的CDN、EPG等节点上的告警、性能指标、错误和异常日志。在处业务监控数据和日志数据过程中使用大数据处理方案,保证数据的实时性。处理后数据入ElasticSearch,以便达到实时、稳定、可靠、快速的搜索于分析。
预先进行故障树建模,即针特定的故障现象,训练学习出该故障现象的可能原因、各原因的层次关系,构建故障树。故障树的存在使得故障定位更有针对性,达到快速定位故障的目的。
其中,故障定位的触发,可分为两种触发方式。一种人工干预触发,当有用户报障,根据用户帐号、时间、观看节目等信息查询过滤出故障播放记录,对故障播放记录进行故障定位定界。另一种为主动触发,当监控或告警功能发现用户或频道播放故障率超过设定阈值,触发故障定位定界功能。
在进行故障定位时,对故障树中的各故障原因进行检测,定位出故障产生的原因,并给出处理建议。在处理过程中充分考虑定位效率,对父节点相同的同级故障原因使用并发处理,以提高处理效率。
本具体应用例中,业务数据处理采用大数据处理技术,实现对大量业务监控数据,及个业务节点的日志文件的实时处理,提高数据的处理速度及实时性,通过对大量数据对比分析,快速有效的对故障进行定位。针对不同的故障现象,训练学习出不同的故障树,故障定位更具有针对性,并对故障树同级子节点使用并行处理,提高故障定位的效率。
系统实施例
如图6所示,本发明实施例中一种IPTV系统故障定位系统,所述系统包括:
故障树获取单元60,用于用于获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;
故障定位单元62,用于遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。
在本发明的一个实施方式中,所述系统还可以包括:
故障树构建单元,用于用于针对预设的每种故障现象,获取可能导致该故障现象对应的多个故障原因;
按照预设检测顺序确定各故障原因之间的层次关系;
基于所述层次关系构造所述故障树的层级关系;
将各故障原因按照所述层级关系分别置于所述故障树的非根节点处,将该故障现象置于所述故障树的根节点处,完成构建具有树形结构的每种故障现象的故障树。
进一步说,所述故障定位单元62,具体用于按照所述层级关系,遍历所述待定位故障现象的故障树的非根节点,在遍历时对每个非根节点处的故障原因进行检测;
遍历完成后,根据检测结果从所述非根节点中定位出导致所述待定位故障现象的故障原因。
具体说,所述故障定位单元62对任意一个非根节点的故障原因进行检测时,具体用于判断该非根节点处的故障原因所对应的检查点的类型;
若判定为信息型检查点时,调用所述信息型检查点获取该非根节点的故障原因对应的预设参数信息,并将获取的所述参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为判定型检查点时,调用所述判定型检查点采用预设判定方式判断是否对该非根节点下一层级的故障原因进行检测;并且在判定为是的情况下,将该非根节点上一层级检查点提供的参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为分析型检查点时,调用所述分析型检查点根据该非根节点上一层级检查点提供的参数信息,从基础数据中获取预设目标数据,并基于所述目标数据判断出该非根节点的故障原因是否导致了所述待定位故障现象。
再进一步说,所述系统还可以包括数据获取模块,用于接收所述IPTV系统中探针上报的业务监控数据,以及采集IPTV系统的业务模块上的日志数据;
从所述业务监控数据和/或所述日志数据中获取所述基础数据。
在本发明的又一个实施方式中,故障定位单元62还用于并行检测处于同一层级的故障原因。
本发明实施例中,业务数据处理采用大数据处理技术,实现对大量业务监控数据,及个业务节点的日志文件的实时处理,提高数据的处理速度及实时性,通过对大量数据对比分析,快速有效的对故障进行定位。针对不同的故障现象,训练学习出不同的故障树,故障定位更具有针对性,并对故障树同级子节点使用并行处理,提高故障定位的效率。
结合本申请所公开示例描述的IPTV系统故障定位方法,可直接体现为硬件、由处理器执行的软件模块或者二者结合。例如,图6中所示功能框图中的一个或多个功能框图和/或功能框图的一个和/或多个组合(例如,故障定位模块),既可以对应于计算机程序流程的各个软件模块,亦可以对应于各个硬件模块。这些软件模块,可以分别对应于图1和图5所示的各个步骤。这些硬件模块例如可利用现场可编程门阵列(FPGA)将这些软件模块固化而实现。
软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域已知的任何其他形式的存储介质。可以将一种存储介质藕接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息;或者该存储介质可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路中。该软件模块可以存储在移动终端的存储器中,也可以存储在可插入移动终端的存储卡中。例如,若移动终端采用的是较大容量的MEGA-SIM卡或者大容量的闪存装置,则该软件模块可存储在该MEGA-SIM卡或者大容量的闪存装置中。
针对图6描述的功能框图中的一个或多个和/或功能框图的一个或多个组合(例如,故障定位模块),可以实现为用于执行本申请所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件或者其任意适当组合。针对图6描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,还可以实现为计算机设备的组合,例如,DSP和微处理器的组合、多个微处理器、与DSP通信结合的一个或多个微处理器或者任何其他这种配置。
虽然本申请描述了本发明的特定示例,但本领域技术人员可以在不脱离本发明概念的基础上设计出来本发明的变型。
本领域技术人员在本发明技术构思的启发下,在不脱离本发明内容的基础上,还可以对本发明的方法做出各种改进,这仍落在本发明的保护范围之内。

Claims (10)

1.一种IPTV系统故障定位方法,其特征在于,所述方法包括:
获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;
遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。
2.如权利要求1所述的方法,其特征在于,所述获取待定位故障现象对应的故障树的步骤之前,还包括:
针对预设的每种故障现象,获取可能导致该故障现象对应的多个故障原因;
按照预设检测顺序确定各故障原因之间的层次关系;
基于所述层次关系构造所述故障树的层级关系;
将各故障原因按照所述层级关系分别置于所述故障树的非根节点处,将该故障现象置于所述故障树的根节点处,完成构建具有树形结构的每种故障现象的故障树。
3.如权利要求2所述的方法,其特征在于,所述遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因的步骤,包括:
按照所述层级关系,遍历所述待定位故障现象的故障树的非根节点,在遍历时对每个非根节点处的故障原因进行检测;
遍历完成后,根据检测结果从所述非根节点中定位出导致所述待定位故障现象的故障原因。
4.如权利要求3所述的方法,其特征在于,对任意一个非根节点的故障原因进行检测的步骤,包括:
判断该非根节点处的故障原因所对应的检查点的类型;
若判定为信息型检查点时,调用所述信息型检查点获取该非根节点的故障原因对应的预设参数信息,并将获取的所述参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为判定型检查点时,调用所述判定型检查点采用预设判定方式判断是否对该非根节点下一层级的故障原因进行检测;并且在判定为是的情况下,将该非根节点上一层级检查点提供的参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为分析型检查点时,调用所述分析型检查点根据该非根节点上一层级检查点提供的参数信息,从预设基础数据中获取预设目标数据,并基于所述目标数据判断出该非根节点的故障原因是否导致了所述待定位故障现象。
5.如权利要求4所述的方法,其特征在于,所述基础数据的获取方式包括:
接收所述IPTV系统中探针上报的业务监控数据,以及采集IPTV系统的业务模块上的日志数据;
从所述业务监控数据和/或所述日志数据中获取所述基础数据。
6.如权利要求2-5中任一项所述的方法,其特征在于,所述遍历获取的故障树,对各非根节点对应的故障原因进行检测的步骤,还包括:
并行检测处于同一层级的故障原因。
7.一种IPTV系统故障定位系统,其特征在于,所述系统包括:
故障树获取单元,用于获取待定位故障现象对应的故障树;其中,在每种故障现象的故障树中所述故障现象位于所述故障树的根节点,可能导致该故障现象的多个故障原因分别位于所述故障树的非根节点;
故障定位单元,用于遍历获取的故障树,对各非根节点对应的故障原因进行检测,并从中定位出导致所述待定位故障现象的故障原因。
8.如权利要求7所述的系统,其特征在于,所述系统还包括:
故障树构建单元,用于针对预设的每种故障现象,获取可能导致该故障现象对应的多个故障原因;
按照预设检测顺序确定各故障原因之间的层次关系;
基于所述层次关系构造所述故障树的层级关系;
将各故障原因按照所述层级关系分别置于所述故障树的非根节点处,将该故障现象置于所述故障树的根节点处,完成构建具有树形结构的每种故障现象的故障树。
9.如权利要求8所述的系统,其特征在于,所述故障定位单元,具体用于按照所述层级关系,遍历所述待定位故障现象的故障树的非根节点,在遍历时对每个非根节点处的故障原因进行检测;
遍历完成后,根据检测结果从所述非根节点中定位出导致所述待定位故障现象的故障原因。
10.如权利要求9所述的系统,其特征在于,所述故障定位单元对任意一个非根节点的故障原因进行检测时,具体用于判断该非根节点处的故障原因所对应的检查点的类型;
若判定为信息型检查点时,调用所述信息型检查点获取该非根节点的故障原因对应的预设参数信息,并将获取的所述参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为判定型检查点时,调用所述判定型检查点采用预设判定方式判断是否对该非根节点下一层级的故障原因进行检测;并且在判定为是的情况下,将该非根节点上一层级检查点提供的参数信息提供给该非根节点下一层级各故障原因对应检查点;
若判定为分析型检查点时,调用所述分析型检查点根据该非根节点上一层级检查点提供的参数信息,从预设基础数据中获取预设目标数据,并基于所述目标数据判断出该非根节点的故障原因是否导致了所述待定位故障现象。
CN201610792308.3A 2016-08-31 2016-08-31 Iptv系统故障定位方法及系统 Withdrawn CN107786897A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610792308.3A CN107786897A (zh) 2016-08-31 2016-08-31 Iptv系统故障定位方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610792308.3A CN107786897A (zh) 2016-08-31 2016-08-31 Iptv系统故障定位方法及系统

Publications (1)

Publication Number Publication Date
CN107786897A true CN107786897A (zh) 2018-03-09

Family

ID=61451405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610792308.3A Withdrawn CN107786897A (zh) 2016-08-31 2016-08-31 Iptv系统故障定位方法及系统

Country Status (1)

Country Link
CN (1) CN107786897A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862379A (zh) * 2018-12-29 2019-06-07 北京奇艺世纪科技有限公司 一种日志处理方法、装置、移动终端及存储介质
CN110262937A (zh) * 2019-05-06 2019-09-20 阿里巴巴集团控股有限公司 一种指标异常原因的识别方法及装置
CN111918103A (zh) * 2019-05-08 2020-11-10 中国移动通信集团福建有限公司 互联网电视业务故障确定方法、设备及互联网电视业务架构
CN112019932A (zh) * 2020-08-27 2020-12-01 广州华多网络科技有限公司 网络故障根因定位方法、装置、计算机设备及存储介质
CN112073755A (zh) * 2020-09-04 2020-12-11 中邮科通信技术股份有限公司 一种基于iptv业务日志实现认证模式智能切换的方法
CN113220796A (zh) * 2020-01-21 2021-08-06 北京达佳互联信息技术有限公司 一种异常业务指标分析方法及装置
CN113296485A (zh) * 2020-02-24 2021-08-24 北京国电智深控制技术有限公司 一种故障根源获取方法及装置
CN113672420A (zh) * 2021-08-10 2021-11-19 荣耀终端有限公司 故障检测方法及电子设备
CN114443205A (zh) * 2020-10-30 2022-05-06 中国电信股份有限公司 故障分析方法、装置及非瞬时性计算机可读存储介质
CN115134212A (zh) * 2022-06-29 2022-09-30 中国工商银行股份有限公司 策略推送方法、装置、计算机设备和存储介质
CN116069544A (zh) * 2023-04-06 2023-05-05 卡斯柯信号(北京)有限公司 一种信号设备故障智能诊断的验证方法及装置
CN116520790A (zh) * 2022-12-06 2023-08-01 杭州和利时自动化有限公司 一种分散控制系统的故障根因分析方法、装置及介质
CN117290149A (zh) * 2023-11-27 2023-12-26 宁德时代新能源科技股份有限公司 主控模块的复位故障定位方法、装置、设备、系统和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1553328A (zh) * 2003-06-08 2004-12-08 华为技术有限公司 基于故障树分析的系统故障定位方法及装置
US20090295559A1 (en) * 2008-06-02 2009-12-03 Gm Global Technology Operations, Inc. Integrated hierarchical process for fault detection and isolation
CN101605073A (zh) * 2009-07-01 2009-12-16 中兴通讯股份有限公司 一种对iptv用户终端进行测试的方法、装置及系统
CN101715203A (zh) * 2009-11-30 2010-05-26 中国移动通信集团浙江有限公司 一种自动定位故障点的方法和设备
CN102291617A (zh) * 2011-09-03 2011-12-21 四川公用信息产业有限责任公司 Iptv业务端到端故障诊断与定位平台
CN102457390A (zh) * 2010-10-15 2012-05-16 中兴通讯股份有限公司 一种基于qoe的故障定位方法和系统
CN105488610A (zh) * 2015-11-23 2016-04-13 国网山东省电力公司信息通信公司 一种电力应用系统故障实时分析诊断系统及方法
CN107342878A (zh) * 2016-04-29 2017-11-10 中兴通讯股份有限公司 一种故障处理方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1553328A (zh) * 2003-06-08 2004-12-08 华为技术有限公司 基于故障树分析的系统故障定位方法及装置
US20090295559A1 (en) * 2008-06-02 2009-12-03 Gm Global Technology Operations, Inc. Integrated hierarchical process for fault detection and isolation
CN101605073A (zh) * 2009-07-01 2009-12-16 中兴通讯股份有限公司 一种对iptv用户终端进行测试的方法、装置及系统
CN101715203A (zh) * 2009-11-30 2010-05-26 中国移动通信集团浙江有限公司 一种自动定位故障点的方法和设备
CN102457390A (zh) * 2010-10-15 2012-05-16 中兴通讯股份有限公司 一种基于qoe的故障定位方法和系统
CN102291617A (zh) * 2011-09-03 2011-12-21 四川公用信息产业有限责任公司 Iptv业务端到端故障诊断与定位平台
CN105488610A (zh) * 2015-11-23 2016-04-13 国网山东省电力公司信息通信公司 一种电力应用系统故障实时分析诊断系统及方法
CN107342878A (zh) * 2016-04-29 2017-11-10 中兴通讯股份有限公司 一种故障处理方法及装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862379A (zh) * 2018-12-29 2019-06-07 北京奇艺世纪科技有限公司 一种日志处理方法、装置、移动终端及存储介质
CN109862379B (zh) * 2018-12-29 2021-10-15 北京奇艺世纪科技有限公司 一种日志处理方法、装置、移动终端及存储介质
CN110262937B (zh) * 2019-05-06 2023-07-18 创新先进技术有限公司 一种指标异常原因的识别方法及装置
CN110262937A (zh) * 2019-05-06 2019-09-20 阿里巴巴集团控股有限公司 一种指标异常原因的识别方法及装置
CN111918103A (zh) * 2019-05-08 2020-11-10 中国移动通信集团福建有限公司 互联网电视业务故障确定方法、设备及互联网电视业务架构
CN113220796A (zh) * 2020-01-21 2021-08-06 北京达佳互联信息技术有限公司 一种异常业务指标分析方法及装置
CN113296485A (zh) * 2020-02-24 2021-08-24 北京国电智深控制技术有限公司 一种故障根源获取方法及装置
CN112019932A (zh) * 2020-08-27 2020-12-01 广州华多网络科技有限公司 网络故障根因定位方法、装置、计算机设备及存储介质
CN112073755A (zh) * 2020-09-04 2020-12-11 中邮科通信技术股份有限公司 一种基于iptv业务日志实现认证模式智能切换的方法
CN114443205A (zh) * 2020-10-30 2022-05-06 中国电信股份有限公司 故障分析方法、装置及非瞬时性计算机可读存储介质
CN114443205B (zh) * 2020-10-30 2023-11-10 中国电信股份有限公司 故障分析方法、装置及非瞬时性计算机可读存储介质
CN113672420A (zh) * 2021-08-10 2021-11-19 荣耀终端有限公司 故障检测方法及电子设备
CN115134212A (zh) * 2022-06-29 2022-09-30 中国工商银行股份有限公司 策略推送方法、装置、计算机设备和存储介质
CN115134212B (zh) * 2022-06-29 2024-04-19 中国工商银行股份有限公司 策略推送方法、装置、计算机设备和存储介质
CN116520790A (zh) * 2022-12-06 2023-08-01 杭州和利时自动化有限公司 一种分散控制系统的故障根因分析方法、装置及介质
CN116520790B (zh) * 2022-12-06 2024-05-28 杭州和利时自动化有限公司 一种分散控制系统的故障根因分析方法、装置及介质
CN116069544A (zh) * 2023-04-06 2023-05-05 卡斯柯信号(北京)有限公司 一种信号设备故障智能诊断的验证方法及装置
CN117290149A (zh) * 2023-11-27 2023-12-26 宁德时代新能源科技股份有限公司 主控模块的复位故障定位方法、装置、设备、系统和介质
CN117290149B (zh) * 2023-11-27 2024-07-26 宁德时代新能源科技股份有限公司 主控模块的复位故障定位方法、装置、设备、系统和介质

Similar Documents

Publication Publication Date Title
CN107786897A (zh) Iptv系统故障定位方法及系统
CN102710453B (zh) Iptv网络中实现业务故障诊断定位的方法
CN109787817A (zh) 网络故障诊断方法、装置和计算机可读存储介质
CN110493042A (zh) 故障诊断方法、装置及服务器
CN111817911B (zh) 一种探测网络质量的方法、装置、计算设备及存储介质
CN109783552A (zh) 一种数据清洗修复方法
CN104065532B (zh) 一种基于多路数据接入方式的未备案网站探寻方法及系统
US11252052B1 (en) Intelligent node failure prediction and ticket triage solution
CN109327320A (zh) 一种故障定界方法及设备
CN102035667A (zh) 网络可靠性评估方法、装置和系统
CN111934954A (zh) 宽带的检测方法、装置、电子设备及存储介质
CN106506226A (zh) 一种故障检测的启动方法及装置
CN116800586A (zh) 一种电信网络数据通信故障诊断方法
CN108628279A (zh) 一种基于云计算汽车异常数据流的分析方法
CN110475161B (zh) 一种iptv业务直播链路的自动故障定位方法及其系统
CN109587520A (zh) 一种定位视频业务故障的方法和设备
Rajagopal et al. Health of California’s loop detector system
CN107769957A (zh) 一种域名系统故障原因分析方法和装置
CN114827951B (zh) 一种基于车辆终端的车辆网络质量分析方法、系统及存储介质
CN115801538A (zh) 场站服务器应用资产深度识别方法、系统及设备
CN106937170B (zh) 一种户外媒体播出监测方法及系统
CN113454950A (zh) 基于流量统计的网络设备及链路实时故障检测方法和系统
CN112312209B (zh) 综合告警生成方法、装置、服务器、存储介质
CN112416761B (zh) 一种基于广度优先搜索的测试用例生成方法及装置
CN113765738A (zh) 基于多任务学习和层次分类的加密流量QoE检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180425

Address after: 518057 five floor, block A, ZTE communication tower, Nanshan District science and Technology Park, Shenzhen, Guangdong.

Applicant after: ZTE Corporation

Address before: 210000 68 Bauhinia Road, Yuhuatai District, Nanjing, Jiangsu

Applicant before: Nanjing Zhongxing New Software Co., Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180309