CN110943874B - 一种家庭宽带网络的故障检测方法、装置和可读介质 - Google Patents

一种家庭宽带网络的故障检测方法、装置和可读介质 Download PDF

Info

Publication number
CN110943874B
CN110943874B CN201811106702.2A CN201811106702A CN110943874B CN 110943874 B CN110943874 B CN 110943874B CN 201811106702 A CN201811106702 A CN 201811106702A CN 110943874 B CN110943874 B CN 110943874B
Authority
CN
China
Prior art keywords
event
fault
broadband network
fault detection
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811106702.2A
Other languages
English (en)
Other versions
CN110943874A (zh
Inventor
邢辉峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811106702.2A priority Critical patent/CN110943874B/zh
Publication of CN110943874A publication Critical patent/CN110943874A/zh
Application granted granted Critical
Publication of CN110943874B publication Critical patent/CN110943874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors

Abstract

本发明公开了一种家庭宽带网络的故障检测方法、装置和可读介质,涉及业务支撑技术领域。本发明提供的方法中,获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;对各个疑似故障事件分别进行特征提取;并根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。通过采用上述方法,可以客观且准确地确定出家庭宽带网络中存在的故障,由于无需逐层级进行故障识别,有效提高了家庭宽带网络的故障检测效率。

Description

一种家庭宽带网络的故障检测方法、装置和可读介质
技术领域
本发明涉及业务支撑技术领域,尤其涉及一种家庭宽带网络的故障检测方法、装置和可读介质。
背景技术
我国的固定宽带接入用户快速增长。截至2018年3月末,我国固定宽带接入用户总数达3.61亿户,100Mbps及以上固定宽带接入用户数达1.63亿,50Mbps及以上固定宽带接入用户占总用户数的75.2%。面对现网和未来几年将进一步发展的上亿的宽带接入用户,如何有效保障用户业务正常进行同时降低运维的成本,成为了运营商工作的重中之重。
而部署在机顶盒和家庭网关的探针数据采集系统,为智能故障检测及定位打下了坚实的数据基础。传统的针对家庭宽带业务的播放视频的运维系统面对大规模系统故障时有以下几个问题:1、对于单个故障精细分析定位受限于人工分析速率,需要查看大量的各个维度的日志及统计分析数据,通常在分钟级;2、大规模复杂异常时,抽样个别故障的定位结论,容易以偏概全,缺少汇聚回归;3、依赖于人的经验。例如M3U8故障事件,传统的是从多维度及下属各级子维度上进行计数分布统计,逐级分析,不仅耗费时间长而且主观性成分较高。
因此,如何客观且快捷地检测出家庭宽带网络中的故障是首要考虑的问题之一。
发明内容
本发明实施例提供一种家庭宽带网络的故障检测方法、装置和可读介质,用以客观且快捷地检测出家庭宽带网络中的故障。
第一方面,本发明实施例提供一种家庭宽带网络的故障检测方法,包括:
获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;
确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;
对各个疑似故障事件分别进行特征提取;并
根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
通过采用上述方法,不仅可以客观地确定出家庭宽带网络中的故障,而且由于无需逐层级分析,有效提高了故障检测效率。
第二方面,本发明实施例提供一种家庭宽带网络的故障检测装置,包括:
获取单元,用于获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;
第一确定单元,用于确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;
特征提取单元,用于对各个疑似故障事件分别进行特征提取;并
第二确定单元,用于根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
第三方面,本发明实施例提供一种通信设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述程序时实现如本申请提供的任一项所述的家庭宽带网络的故障检测方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请提供的任一项所述的家庭宽带网络的故障检测方法中的步骤。
本发明有益效果:
本发明实施例提供的家庭宽带网络的故障检测方法、装置和可读介质,获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;对各个疑似故障事件分别进行特征提取;并根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。通过采用上述方法,可以客观且准确地确定出家庭宽带网络中存在的故障,由于无需逐层级进行故障识别,有效提高了家庭宽带网络的故障检测效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的家庭宽带网络的故障检测方法的流程示意图;
图2为本发明实施例提供的确定家庭宽带网络中存在的故障的流程示意图;
图3为本发明实施例提供的基于步骤S21和S22得到的在各个特征下的特征向量的示意图;
图4为本发明实施例提供的家庭宽带网络的故障检测装置的结构示意图;
图5为本发明实施例提供的实施家庭宽带网络的故障检测方法的计算装置的结构示意图。
具体实施方式
本发明实施例提供的家庭宽带网络的故障检测方法、装置和可读介质,用以客观且快捷地检测出家庭宽带网络中的故障。
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
便于理解本发明,本发明涉及的技术术语中:
1、长短期记忆模型,(Long Short Term Memory,LSTM),一种改进之后的循环神经网络,可以解决RNN无法处理长距离的依赖问题。
2、牌照方,是指互联网电视牌照商,只有拥有牌照,才拥有播控权,才有资格开展IPTV和网络机顶盒自主内容发布业务,由此得以将互联网电视及盒子从内容源上加以管控。也就意味着,要做互联网电视,就必须要拥有牌照资源。
3、在本发明实施例的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
现有技术中采用的家庭宽带网络的故障检测方法为:先进行数据异常筛查运算,然后再逐层级检查是否有发生数据异常问题的维度,最后再结合经验判断疑似故障。而数据异常筛查运算方法为:在某一维度的元素分布统计计算中,若该维度下属某一元素的告警用户数偏高,则认为该维度存在较明显的聚集分布特征,推测该元素或其下级元素出现故障的几率较大,需分析是否有下级维度;同时,将该维度标记为存在“数据异常问题”。而逐层级检查是否有发生数据异常问题的维度大致过程为:针对有异常的维度,按照数据异常筛查运算方法计算该维度的下一层级,根据下一层级是否有“数据异常问题”,在递归到检测是否有发生数据异常问题的维度,直至计算到该维度的最深层级。易得出,现有技术中需要逐层级分析,而且还依赖于人的经验,不仅耗时长而且效率低。
为了解决现有技术中存在的上述问题,本发明提出给出了解决方案,将本发明提供的家庭宽带网络的故障检测方法应用到故障检测平台中,该故障检测平台可以设置在各种需要故障检测的设备中,例如,该故障检测平台可以为软探针监测平台。故障检测平台在接收到接入家庭宽带网络智能家庭网关和机顶盒采集到的业务数据;确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;对各个疑似故障事件分别进行特征提取;并根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。通过采用上述方法,不仅可以客观地确定出家庭宽带网络中的故障,而且由于无需逐层级分析,有效提高了故障检测效率。
基于上述描述,参考图1-图5来描述本发明示例性实施方式提供的家庭宽带网络的故障检测方法。
如图1所示,为本发明实施例提供的家庭宽带网络的故障检测方法的流程示意图,可以包括以下步骤:
S11、获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据。
较佳地,所述业务数据包括机顶盒监测数据和智能家庭网关监测数据;所述机顶盒监测数据包括第一业务质量监测数据和用户行为数据,以及所述智能家庭网关监测数据包括第二业务质量监测数据和用户偏好监测数据,其中:
所述第一业务质量监测数据至少包括以下一项:用户观看视频加载时长、卡顿数据和告警数据;
所述用户行为数据至少包括以下一项:用户使用机顶盒的时间、用户使用机顶盒的使用时长和用户观看视频内容;
所述第二业务质量监测数据至少包括以下一项:用户访问业务时的网关状态数据和下挂设备状态数据;
所述用偏好监测数据至少包括以下一项:用户访问业务的业务类型、访问时间和访问设备的标识。
具体实施时,机顶盒中的软探针采集的数据主要来源于网络接口、底层播放器和机顶盒的操作系统。其中与网络相关的有:通过实时抓取和分析网络报文,获取TCP、UDP、HTTP、RTP等网络环境数据;通过机顶盒系统提供的相关接口,采集到系统内存、CPU、网络连接方式等机顶盒系统数据;通过平台主动下发网络诊断任务,采集到相应的任务执行结果,即网络探测数据。软探针按平台需求对视频播放数据、网络环境数据、机顶盒系统数据和网络探测数据进行预处理后,得到用于检测家庭宽带网络的业务质量的机顶盒检测数据。然后将其上报到软探针监测平台,为软探针监测平台定位业务质量问题提供依据。
智能家庭网关的软探针可截获经过网关的各种流数据包,利用报文检测技术过滤出需要采集的信息,包括系统参数、网络环境和用户行为数据等数据,对该数据进行分析处理,得到用于检测家庭宽带网络服务质量的智能家庭网关检测数据。
S12、确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件。
具体地,不同的事件检测器配置的故障检测条件不同。
较佳地,所述事件检测器可以但不限于至少包括以下一种:网络状况时间检测器、M3U8事件检测器、传输流TS事件检测器、卡顿事件检测器、电子节目指南EPG事件检测器、花屏告警事件检测器、加载时长事件检测器和播放成功率事件检测器等。
通过利用上述各种类型的事件检测器,针对每一事件检测器,可以从业务数据中提取出满足该事件检测器中配置的故障检测条件的数据,并将提取出的数据构成疑似故障事件。由于每个事件检测器的故障检测条件不同,故其内构成的故障检测条件的参数也不同,以下详细介绍之:
具体地,本发明中的卡顿事件检测器中配置的故障检测条件为以下至少一种:
在第一预设时间段内单次卡顿超过第一设定时间阈值;
在第一预设时间段内累计卡顿时长超过第二设定时间阈值,其中,第二设定时间阈值不小于第一设定时间阈值;
在第一预设时间段内出现卡顿的次数超过第一设定值。
具体实施时,本发明中的第一预设时间段、第一设定时间阈值、第二设定时间阈值和第一设定值均可配置,具体可以根据实际情况而定。例如可以将第一预设时间段设置为2分钟,第一设定时间阈值设置为5秒,第二设定时间阈值设置为15秒,第一设定值可以设置为10次等。
本发明中的花屏告警事件检测器中配置的故障检测条件为以下至少一种:
在第二预设时间段内单次出现花屏超过第三设定时间阈值;
在第二预设时间段内累计出现花屏时长超过第四设定时间阈值;
在第二预设时间段内出现花屏的次数超过第二设定值。
具体实施时,本发明中的第二预设时间段、第三设定时间阈值、第四设定时间阈值和第二设定值均可配置,具体可以根据实际情况而定。例如可以将第二预设时间段设置为2分钟,第三设定时间阈值设置为5秒,第四设定时间阈值设置为15秒,第二设定值可以设置为10次等。
可选地,本发明中的M3U8事件检测器中配置的故障检测条件为:
M3U8文件的超文本传输协议HTTP响应消息的返回码小于第一数值;或者
M3U8文件的超文本传输协议HTTP响应消息的返回码不小于第二数值,其中,所述第二数值大于所述第一数值。
具体实施时,本发明中的第一数值、第二数值均可配置,具体可以根据实际情况而定。例如,可以将第一数值设置为200,第二数值设置为400等。
可选地,本发明中的TS事件检测器中配置的故障检测条件为:
TS媒体文件的超文本传输协议HTTP响应消息的返回码小于第三数值;或者
TS媒体文件的超文本传输协议HTTP响应消息的返回码不小于第四数值,其中,所述第四数值大于所述第三数值。
具体地,本发明中的第三数值和第四设置均可配置,具体可以根据实际情况而定。例如,可以将第三数值设置为200,第四数值设置为400等。
可选地,本发明中的EPG事件检测器中配置的故障检测条件为:
EPG的响应消息的返回码小于第五数值;或者
EPG的响应消息的返回码不小于第六数值,其中,所述第六数值大于所述第五数值。
具体地,本发明中的第五数值和第六数值均可配置,具体可以根据实际情况而定。例如可以将第五数值设置为200,第六数值设置为400等。
较佳地,在确定出疑似故障事件后,可以对这些疑似故障事件进行去重处理,即去除重复的事件,然后可以将去重后的疑似故障事件构成一组序列事件,即该组序列中包含若干唯一的疑似故障事件。
此外,在确定疑似故障事件时,相同的类别使用同一组事件来区分。
S13、对各个疑似故障事件分别进行特征提取。
具体地,可以按照下述过程执行步骤S13:
针对每一疑似故障事件,分别从该疑似故障事件中提取出内容特征、服务器维度特征、地域维度特征、终端维度特征、频率特征、周期性特征、序列特征和爆发性特征。
具体地,可以利用常规的特征提取模型从各个疑似故障事件中提取上述各个特征。
较佳地,本发明中的内容特征是指机顶盒和网关所属的模式以及牌照方,业务类型和内容标示,其中,上述业务类型包括点播和直播,上述内容标示包括直播频道ID,记为Channel ID,点播节目ID,记为Content ID。
优选地,本发明中的服务器维度特征,用于指示为该家庭宽带网络提供服务的服务器的标识,例如,服务器维度特征可以包括上级的调度中心标识、下级的CDN服务节点标识或下属的内容分发网络(Content Delivery Network,CDN)服务器IP地址,错误码等等特征。若从疑似故障事件中提取到调度中心标识,则可以确定出家庭宽带网络的故障可能出现在调度中心。
可选地,本发明中的地域维度特征,用于指示为家庭宽带网络提供服务的管辖信息,地域维度特征可以为省、地市,或者下属的宽带接入器(BroadbandRemote AccessServer,BRAS)的标识信息,或者家庭宽带网络接入的光线路终端(Optical LineTerminal,OLT)的标识信息。若从疑似故障事件中提取出的地域维度特征为BRAS的标识信息,则表明导致家庭宽带网络故障的根源在于BRAS对家庭宽带网络的鉴权未通过。
可选地,本发明中的终端维度特征包括终端厂商标识信息和机顶盒ID。
可选地,本发明中的频率特征,是指设定时间段内各个疑似故障事件的发生频率。具体地,系统可以构建一个维度大小与疑似故障事件数量相同的向量,向量中每一元素表示每一疑似故障事件出现的次数,基于此可以实现提取出疑似故障事件构成的序列中每一疑似故障事件的频率的目的。优选地,可以将设定时间段内,统计的每一个日志事件出现的次数,作为该日志事件的频率特征。
可选地,本发明中的周期性特征,用于衡量事件周期性的数值,可以用aj表示第j个事件的周期,具体可以基于所有匹配到第j个事件Tj的系统日志的时间跨度来确定第j个事件的周期aj。基于上述描述,对于同一个事件,其周期保持恒定。
本发明中的序列特征,是指多个交换机/CDN故障前的机顶盒和智能家庭网关共享了某些共同的特征,从征兆事件序列中提取出有用的事件序列特征,并过滤掉噪声事件,就可以得到用于衡量疑似故障事件的有用的特征,而这些特征构成了序列特征。
可选地,本发明中的爆发性特征,是指尽管某些单独出现的特征事件对故障的预测并没有什么帮助,但是当它们突然出现的时候,就往往意味着故障。对于一个给定的事件Tj,如果Tj出现的次数在一段时间中存在一个或多个突然的增长,意味着爆发。在第i个时间段内,可以得到各个事件出现的次数,记为:Oj=(O1,O2...,On),其中,On是事件Tn出现的次数,然后将该次数作为该事件的爆发性特征。
S14、根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
具体地,可以按照图2所示的流程执行步骤S14,可以包括以下步骤:
S21、针对每一疑似故障事件,确定该疑似故障事件在各个特征下的权重。
S22、将基于各个疑似故障事件在同一特征下的权重构成该特征的特征向量。
具体地,可以确定出疑似故障事件构成的事件序列转化为在各个特征下的N维向量形式,N为事件的种类数。针对任一特征对应的N维向量中的元素为该疑似故障事件在该特征下的权重,即步骤S21确定出的权重,参考图3所示,图3中以N=4为例进行说明,为基于步骤S21和S22得到的在各个特征下的特征向量的示意图,图3中特征向量2未列出疑似故障事件2---Event2的权重,其权重记为0;同理,图3中特征向量m未列出疑似故障事件4---Event4的权重,其权重也记为0,从而可以得出图3中三个特征向量分别为[0.07,0.80,0.02,0.35],[0.07,0.0,0.02,0.35]和[0.07,0.80,0.02,0.0]。
S23、将基于各个特征确定出特征向量输入到预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
具体地,在步骤S22得到特征向量后,将确定出的各个特征的特征向量输入到预先训练的故障检测模型中,可以确定出特征向量对应的疑似故障事件是否为异常点,从而可以确定出家庭宽带网络中的故障。
本发明中的故障检测模型为利用训练样本对LSTM模型进行训练得到的。具体实施时,对正常的事件进行特征提取,然后再执行步骤S21和S22得到正常的事件在各个特征下的特征向量,然后将其作为训练样本输入到LSTM模型中,对LSTM模型进行训练从而得到本发明中的故障检测模型。LSTM模型可以增量式地调整模型参数,以适应随着时间推移而出现的新事件。
具体地,本发明中的故障检测模型包括基于路径异常检测的LSTM模型和基于参数和性能异常检测的LSTM模型,其中:基于路径异常检测的LSTM模型的训练过程参加上述描述,例如,获取到一段时间内正常事件构成的序列为{k1,k2,k3,k4,k5,k6},LSTM模型读取采集数据的窗口h为3,则LSTM的输入序列和输出分别为{k1,k2,k3–>k4},{k2,k3,k4–>k5}和{k3,k4,k5–>k6},以此对LSTM模型进行训练。
一般地,软探针抓取的数据会按照一定的顺序输出,分步记录了网络系统的状态,即执行路径。在上述阶段将执行路径异常检测的问题转换为事件的多分类问题,使用LSTM网络对事件序列建模,即本发明中的基于路径异常检测的LSTM模型。假设事件集共有L个事件,LSTM的输入为一个时间窗口内的事件序列,输出为所有的事件集在该事件序列之后出现的概率的向量。也就是说,如果新来的一条采集数据对应的事件不是接下来出现概率较大的事件,则视为异常。
在对参数和性能异常进行检测时,有些系统异常发生时,采集数据不会偏离正常的执行路径,但是采集的参数会与正常情况下的参数有较大差异。系统将每一个事件对应的参数保存下来,作为异常检测的数据源。与执行路径异常检测的方法类似,参数和性能异常检测也会使用LSTM网络建模,即本发明中基于参数和性能异常的LSTM模型。该模型的输入为某个事件对应日志中近期历史的参数值向量,输出为下一个参数值的预测值。在实际应用中,如果预测值和观测值之间的误差在高斯分布的高置信区间内,则输入的日志参数被认为是正常,否则认为是异常事件。
本发明提供的家庭宽带网络的故障检测方法,获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;对各个疑似故障事件分别进行特征提取;并根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。通过采用上述方法,可以客观且准确地确定出家庭宽带网络中存在的故障,由于无需逐层级进行故障识别,有效提高了家庭宽带网络的故障检测效率。
基于同一发明构思,本发明实施例中还提供了一种家庭宽带网络的故障检测装置,由于上述装置解决问题的原理与家庭宽带网络的故障检测方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图4所示,为本发明实施例提供的家庭宽带网络的故障检测装置的结构示意图,包括:
获取单元41,用于获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;
第一确定单元42,用于确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件;
特征提取单元43,用于对各个疑似故障事件分别进行特征提取;并
第二确定单元44,用于根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
较佳地,所述业务数据包括机顶盒监测数据和智能家庭网关监测数据;所述机顶盒监测数据包括第一业务质量监测数据和用户行为数据,以及所述智能家庭网关监测数据包括第二业务质量监测数据和用户偏好监测数据,其中:
所述第一业务质量监测数据至少包括以下一项:用户观看视频加载时长、卡顿数据和告警数据;
所述用户行为数据至少包括以下一项:用户使用机顶盒的时间、用户使用机顶盒的使用时长和用户观看视频内容;
所述第二业务质量监测数据至少包括以下一项:用户访问业务时的网关状态数据和下挂设备状态数据;
所述用偏好监测数据至少包括以下一项:用户访问业务的业务类型、访问时间和访问设备的标识。
优选地,所述事件检测器至少包括以下一种:网络状况时间检测器、M3U8事件检测器、传输流TS事件检测器、卡顿事件检测器、电子节目指南EPG事件检测器、花屏告警事件检测器、加载时长事件检测器和播放成功率事件检测器。
可选地,所述卡顿事件检测器中配置的故障检测条件为以下至少一种:
在第一预设时间段内单次卡顿超过第一设定时间阈值;
在第一预设时间段内累计卡顿时长超过第二设定时间阈值,其中,第二设定时间阈值不小于第一设定时间阈值;
在第一预设时间段内出现卡顿的次数超过第一设定值。
可选地,所述花屏告警事件检测器中配置的故障检测条件为以下至少一种:
在第二预设时间段内单次出现花屏超过第三设定时间阈值;
在第二预设时间段内累计出现花屏时长超过第四设定时间阈值;
在第二预设时间段内出现花屏的次数超过第二设定值。
可选地,所述M3U8事件检测器中配置的故障检测条件为:
M3U8文件的超文本传输协议HTTP响应消息的返回码小于第一数值;或者
M3U8文件的超文本传输协议HTTP响应消息的返回码不小于第二数值,其中,所述第二数值大于所述第一数值。
可选地,所述TS事件检测器中配置的故障检测条件为:
TS媒体文件的超文本传输协议HTTP响应消息的返回码小于第三数值;或者
TS媒体文件的超文本传输协议HTTP响应消息的返回码不小于第四数值,其中,所述第四数值大于所述第三数值。
可选地,所述EPG事件检测器中配置的故障检测条件为:
EPG的响应消息的返回码小于第五数值;或者
EPG的响应消息的返回码不小于第六数值,其中,所述第六数值大于所述第五数值。
优选地,所述特征提取单元43,具体用于针对每一疑似故障事件,分别从该疑似故障事件中提取出内容特征、服务器维度特征、地域维度特征、终端维度特征、频率特征、周期性特征、序列特征和爆发性特征。
进一步地,所述第二确定单元44,具体用于针对每一疑似故障事件,确定该疑似故障事件在各个特征下的权重;并将基于各个疑似故障事件在同一特征下的权重构成该特征的特征向量;将基于各个特征确定出特征向量输入到预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本发明示例性实施方式的家庭宽带网络的故障检测方法、装置和可读介质之后,接下来,介绍根据本发明的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的计算装置可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述描述的根据本发明各种示例性实施方式的家庭宽带网络的故障检测方法中的步骤。例如,所述处理单元可以执行如图1所示的步骤S11~S13中家庭宽带网络的故障检测流程。
下面参照图5来描述根据本发明的这种实施方式的计算装置50。图5显示的计算装置50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算装置50以通用计算设备的形式表现。计算装置50的组件可以包括但不限于:上述至少一个处理单元51、上述至少一个存储单元52、连接不同系统组件(包括存储单元52和处理单元51)的总线53。
总线53表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元52可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)521和/或高速缓存存储器522,还可以进一步包括只读存储器(ROM)523。
存储单元52还可以包括具有一组(至少一个)程序模块524的程序/实用工具525,这样的程序模块524包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置50也可以与一个或多个外部设备54(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置50交互的设备通信,和/或与使得该计算装置50能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口55进行。并且,计算装置50还可以通过网络适配器56与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器56通过总线53与用于计算装置50的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本发明提供的家庭宽带网络的故障检测方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的家庭宽带网络的故障检测方法中的步骤,例如,所述计算机设备可以执行如图1所示的步骤S11~S13中家庭宽带网络的故障检测流程。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的用于家庭宽带网络的故障检测方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (13)

1.一种家庭宽带网络的故障检测方法,其特征在于,包括:
获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;
确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件,所述疑似故障事件包括网络状况事件、M3U8事件、传输流TS事件、卡顿事件、电子节目指南EPG事件、花屏告警事件、加载时长事件和播放成功率事件;
对各个疑似故障事件分别进行特征提取;并
根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障;
对所述疑似故障事件进行特征提取,具体包括:
针对每一疑似故障事件,分别从该疑似故障事件中提取出内容特征、服务器维度特征、地域维度特征、终端维度特征、频率特征、周期性特征、序列特征和爆发性特征。
2.如权利要求1所述的方法,其特征在于,所述业务数据包括机顶盒监测数据和智能家庭网关监测数据;所述机顶盒监测数据包括第一业务质量监测数据和用户行为数据,以及所述智能家庭网关监测数据包括第二业务质量监测数据和用户偏好监测数据,其中:
所述第一业务质量监测数据至少包括以下一项:用户观看视频加载时长、卡顿数据和告警数据;
所述用户行为数据至少包括以下一项:用户使用机顶盒的时间、用户使用机顶盒的使用时长和用户观看视频内容;
所述第二业务质量监测数据至少包括以下一项:用户访问业务时的网关状态数据和下挂设备状态数据;
所述用户偏好监测数据至少包括以下一项:用户访问业务的业务类型、访问时间和访问设备的标识。
3.如权利要求1所述的方法,其特征在于,所述事件检测器至少包括以下一种:网络状况时间检测器、M3U8事件检测器、传输流TS事件检测器、卡顿事件检测器、电子节目指南EPG事件检测器、花屏告警事件检测器、加载时长事件检测器和播放成功率事件检测器。
4.如权利要求3所述的方法,其特征在于,所述卡顿事件检测器中配置的故障检测条件为以下至少一种:
在第一预设时间段内单次卡顿超过第一设定时间阈值;
在第一预设时间段内累计卡顿时长超过第二设定时间阈值,其中,第二设定时间阈值不小于第一设定时间阈值;
在第一预设时间段内出现卡顿的次数超过第一设定值。
5.如权利要求3所述的方法,其特征在于,所述花屏告警事件检测器中配置的故障检测条件为以下至少一种:
在第二预设时间段内单次出现花屏超过第三设定时间阈值;
在第二预设时间段内累计出现花屏时长超过第四设定时间阈值;
在第二预设时间段内出现花屏的次数超过第二设定值。
6.如权利要求3所述的方法,其特征在于,所述M3U8事件检测器中配置的故障检测条件为:
M3U8文件的超文本传输协议HTTP响应消息的返回码小于第一数值;或者
M3U8文件的超文本传输协议HTTP响应消息的返回码不小于第二数值,其中,所述第二数值大于所述第一数值。
7.如权利要求3所述的方法,其特征在于,所述TS事件检测器中配置的故障检测条件为:
TS媒体文件的超文本传输协议HTTP响应消息的返回码小于第三数值;或者
TS媒体文件的超文本传输协议HTTP响应消息的返回码不小于第四数值,其中,所述第四数值大于所述第三数值。
8.如权利要求3所述的方法,其特征在于,所述EPG事件检测器中配置的故障检测条件为:
EPG的响应消息的返回码小于第五数值;或者
EPG的响应消息的返回码不小于第六数值,其中,所述第六数值大于所述第五数值。
9.如权利要求1所述的方法,其特征在于,根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障,具体包括:
针对每一疑似故障事件,确定该疑似故障事件在各个特征下的权重;并
将基于各个疑似故障事件在同一特征下的权重构成该特征的特征向量;
将基于各个特征确定出特征向量输入到预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
10.一种家庭宽带网络的故障检测装置,其特征在于,包括:
获取单元,用于获取接入家庭宽带网络的智能家庭网关和机顶盒采集到的业务数据;
第一确定单元,用于确定所述业务数据中满足预设的事件检测器中配置的故障检测条件的数据构成的疑似故障事件,所述疑似故障事件包括网络状况事件、M3U8事件、传输流TS事件、卡顿事件、电子节目指南EPG事件、花屏告警事件、加载时长事件和播放成功率事件;
特征提取单元,用于对各个疑似故障事件分别进行特征提取;并
第二确定单元,用于根据分别提取出的特征和预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障;
所述特征提取单元,具体用于针对每一疑似故障事件,分别从该疑似故障事件中提取出内容特征、服务器维度特征、地域维度特征、终端维度特征、频率特征、周期性特征、序列特征和爆发性特征。
11.如权利要求10所述的装置,其特征在于,
所述第二确定单元,具体用于针对每一疑似故障事件,确定该疑似故障事件在各个特征下的权重;并将基于各个疑似故障事件在同一特征下的权重构成该特征的特征向量;将基于各个特征确定出特征向量输入到预先训练得到的故障检测模型中,确定家庭宽带网络中存在的故障。
12.一种通信设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述程序时实现如权利要求1~9任一项所述的家庭宽带网络的故障检测方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~9任一项所述的家庭宽带网络的故障检测方法中的步骤。
CN201811106702.2A 2018-09-21 2018-09-21 一种家庭宽带网络的故障检测方法、装置和可读介质 Active CN110943874B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811106702.2A CN110943874B (zh) 2018-09-21 2018-09-21 一种家庭宽带网络的故障检测方法、装置和可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811106702.2A CN110943874B (zh) 2018-09-21 2018-09-21 一种家庭宽带网络的故障检测方法、装置和可读介质

Publications (2)

Publication Number Publication Date
CN110943874A CN110943874A (zh) 2020-03-31
CN110943874B true CN110943874B (zh) 2021-11-19

Family

ID=69904338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811106702.2A Active CN110943874B (zh) 2018-09-21 2018-09-21 一种家庭宽带网络的故障检测方法、装置和可读介质

Country Status (1)

Country Link
CN (1) CN110943874B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111865665B (zh) * 2020-06-23 2023-10-13 广州衡昊数据科技有限公司 一种网络设备故障自愈方法和装置
CN113965446B (zh) * 2020-07-06 2023-10-27 中国移动通信集团湖南有限公司 家庭宽带网络的故障检测方法、系统及电子设备
CN111817935B (zh) * 2020-07-24 2021-12-24 浙江超人科技股份有限公司 一种互联网智能家居数据处理方法及系统
CN114374597A (zh) * 2021-12-27 2022-04-19 浪潮通信信息系统有限公司 一种网络事件的故障处理方法、装置、设备及产品
CN114726592B (zh) * 2022-03-21 2024-04-05 中国电信股份有限公司广州分公司 宽带属性的检测方法、装置、设备及存储介质
CN116248959B (zh) * 2023-05-12 2023-07-28 深圳市橙视科技发展有限公司 网络播放器故障检测方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158682A (zh) * 2014-08-08 2014-11-19 深圳供电局有限公司 一种基于贡献度的同步数字体系sdh故障定位方法
CN107493183A (zh) * 2016-06-13 2017-12-19 中国移动通信集团北京有限公司 一种故障定位方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103780588A (zh) * 2012-10-24 2014-05-07 北京邮电大学 数字家庭网络中用户异常行为检测方法
CN203457171U (zh) * 2013-07-24 2014-02-26 上海电信工程有限公司 一种具有自动排障指示的家庭网关
CN107888397B (zh) * 2016-09-30 2020-12-25 华为技术有限公司 确定故障类型的方法和装置
CN107690068B (zh) * 2017-10-10 2024-02-20 飞思达技术(北京)有限公司 机顶盒的嵌入式探针视频流量和质量汇聚分析方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158682A (zh) * 2014-08-08 2014-11-19 深圳供电局有限公司 一种基于贡献度的同步数字体系sdh故障定位方法
CN107493183A (zh) * 2016-06-13 2017-12-19 中国移动通信集团北京有限公司 一种故障定位方法及装置

Also Published As

Publication number Publication date
CN110943874A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN110943874B (zh) 一种家庭宽带网络的故障检测方法、装置和可读介质
CN107040816B (zh) 一种客户端应用运行异常分析方法与装置
US9529777B2 (en) User behavior analyzer
CN109905696B (zh) 一种基于加密流量数据的视频服务体验质量的识别方法
CN103856789B (zh) 基于用户行为分析实现ott业务质量保障的系统及方法
US9509710B1 (en) Analyzing real-time streams of time-series data
KR102399787B1 (ko) 온라인 서비스의 거동 변화의 인식 기법
US11765437B2 (en) Automatic diagnostics alerts
CN111309539A (zh) 一种异常监测方法、装置和电子设备
KR102148346B1 (ko) 서비스 장애 진단 장치 및 고객 단말
CN112583642B (zh) 异常检测方法、模型、电子设备及计算机可读存储介质
US20110090346A1 (en) Remote video device monitoring
EP2916555A1 (en) Method to determine re-buffering events in video sessions
WO2023200597A1 (en) Automated positive train control event data extraction and analysis engine for performing root cause analysis of unstructured data
CN109756358B (zh) 采样频率推荐方法、装置、设备与存储介质
CN116016468A (zh) 会话问题诊断方法、装置、介质和电子设备
US11243833B2 (en) Performance event troubleshooting system
CN114915845A (zh) 预测iptv用户申告的系统和方法
CN104469495A (zh) 用于视频播放的点击行为监测方法和装置
TW201701615A (zh) 障礙診斷架構及其方法
US11245963B2 (en) Methods and apparatus to determine when a smart device is out-of-tab
CN113207000B (zh) 机顶盒模拟登录方法、装置、设备及介质
CN117241071B (zh) 一种基于机器学习算法感知视频卡顿质差的方法
CN112835780B (zh) 一种业务检测方法及装置
US20230137103A1 (en) Quantization of data streams of instrumented software and handling of delayed or late data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant