CN109818764A - Iptv网络设备故障检测方法和装置 - Google Patents
Iptv网络设备故障检测方法和装置 Download PDFInfo
- Publication number
- CN109818764A CN109818764A CN201711161219.XA CN201711161219A CN109818764A CN 109818764 A CN109818764 A CN 109818764A CN 201711161219 A CN201711161219 A CN 201711161219A CN 109818764 A CN109818764 A CN 109818764A
- Authority
- CN
- China
- Prior art keywords
- arq
- user
- network equipment
- failure
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种IPTV网络设备故障检测方法和装置,其中的方法包括:基于数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号,根据业务账号并基于数据重传日志信息、用户收视记录信息以及设备信息,获得与网络设备相对应的用于确定故障的指标数值,基于判断指标数值是否符合预设的故障判决规则的结果确定网络设备是否出现故障。本发明的方法和装置,能够有效解决IPTV运营商对于网络丢包带来的卡顿问题无有效支撑手段的现状;投入成本低,不需要在网络设备部署监测点,仅通过对ARQ日志、资源树、用户收视记录进行关联、汇聚、计算等便可发现与定位设备的隐患;可以主动发现网络设备隐患,避免对用户感知造成影响。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种IPTV网络设备故障检测方法和装置。
背景技术
最新数据显示,中国三大运营商IPTV用户数已经突破1亿,国内IPTV业务发展很快。据调查,卡顿是影响用户收视感知的最重要因素之一,而网络丢包则是造成视频卡顿的最主要原因。为了提升用户对网络丢包的容忍,IPTV运营商往往会引入各种差错控制技术。对于单播业务,针对丢包恢复的机制是ARQ(Automatic Repeat Request,自动重传请求)。ARQ技术需要IPTV平台的CDN节点和机顶盒的支持,是指网络传输发生丢包时,机顶盒本地根据RTP包序号可以检测到丢包,并向CDN节点重新发起RTP请求。CDN节点收到请求后,会将对应序号的数据包重传给机顶盒。
ARQ技术在一定程度上,提升了用户的体验,尤其是在网络只是偶尔的抖动或者设备发生故障。ARQ技术只是一种弥补手段,设备仍然存在缺陷,主要有两方面的问题:1)设备隐患仍然存在,而且随着时间的推移可能会加重,最终导致丢包超过最大阈值;2)丢包如果超过最大阈值无法纠错,用户感知无法提升。对现网数据进行分析的结果显示:1)离网用户往往并不主动申告;2)主动申告的用户,其用户粘性相对更大。因此,为了形成更好的用户质态,运营商需要通过主动运维提前/主动发现设备的隐患和故障,在设备进一步劣化之前彻底根除问题,避免设备隐患长时间对用户造成卡顿。
发明内容
本发明的一个或多个实施例提供一种IPTV网络设备故障检测方法和装置。
根据本公开的一个方面,提供一种IPTV网络设备故障检测方法,包括:采集IPTV网络的日志信息和设备信息,其中,所述日志信息包括:数据重传日志信息、用户收视记录信息;基于所述数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号;根据所述业务账号并基于所述数据重传日志信息、所述用户收视记录信息以及所述设备信息,获得与网络设备相对应的用于确定故障的指标数值;判断所述指标数值是否符合预设的故障判决规则,基于判断结果确定所述网络设备是否出现故障。
可选地,所述数据重传日志信息包括:记录网络设备基于ARQ协议进行数据重传的ARQ日志信息;所述基于所述数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号包括:获取所述ARQ日志信息中的第一IP地址和第一时间信息、所述用户收视记录信息中的业务账号、第二IP地址和第二时间信息;基于所述第一IP地址和所述第一时间信息以及所述第二IP地址和所述第二时间信息建立所述ARQ日志信息和所述用户收视记录信息之间的匹配关系;根据所述匹配关系确定与所述ARQ日志信息相对应的所述业务账号。
可选地,所述用于确定故障的指标数值包括:与进行数据重传的网络设备相对应的单用户ARQ请求次数、ARQ用户占比、ARQ用户数。
可选地,所述设备信息包括:IPTV资源树,所述方法还包括:根据所述业务账号将所述IPTV资源树和所述用户收视记录信息进行关联,获得与所述进行数据重传的网络设备相对应的收视用户数;根据所述业务账号将所述IPTV资源树和所述ARQ日志信息进行关联,获得与所述进行数据重传的网络设备相对应的ARQ用户数、ARQ请求总数;基于所述收视用户数、所述ARQ用户数和所述ARQ请求总数计算与此进行数据重传的网络设备相对应的ARQ用户占比、单用户ARQ请求次数。
可选地,所述判断所述指标数值是否符合预设的故障判决规则、基于判断结果确定所述网络设备是否出现故障包括:依次判断所述单用户ARQ请求次数、所述ARQ用户占比和所述ARQ用户数是否符合所述故障判决规则,基于判断结果确定所述网络设备是否出现故障。
可选地,如果确定所述单用户ARQ请求次数大于ARQ敏感程度阈值、所述ARQ用户占比大于ARQ用户占比阈值并且所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患。
可选地,判断所述单用户ARQ请求次数是否大于ARQ敏感程度阈值,如果是,则判断所述ARQ用户占比是否大于ARQ用户占比阈值,如果否,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
可选地,如果确定所述ARQ用户占比大于ARQ用户占比阈值,则判断所述ARQ用户数是否大于ARQ用户数阈值;如果确定所述ARQ用户占比小于或等于ARQ用户占比阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
可选地,如果确定所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患;如果确定所述ARQ用户数小于或等于ARQ用户数阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
可选地,所述根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障包括:计算所述单用户ARQ请求次数的至少一个同比增长率,所述同比增长率包括:所述单用户ARQ请求次数相较昨天、上周同一天的同比增长率;如果确定任何一个所述同比增长率大于容忍突变阈值,则确定所述网络设备出现故障。
根据本公开的另一方面,提供一种IPTV网络设备故障检测装置,包括:数据采集模块,用于采集IPTV网络的日志信息和设备信息,其中,所述日志信息包括:数据重传日志信息、用户收视记录信息;账号关联模块,用于基于所述数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号;指标计算模块,用于根据所述业务账号并基于所述数据重传日志信息、所述用户收视记录信息以及所述设备信息,获得与网络设备相对应的用于确定故障的指标数值;故障定界模块,用于判断所述指标数值是否符合预设的故障判决规则,基于判断结果确定所述网络设备是否出现故障。
可选地,所述账号关联模块,用于获取所述ARQ日志信息中的第一IP地址和第一时间信息、所述用户收视记录信息中的业务账号、第二IP地址和第二时间信息;基于所述第一IP地址和所述第一时间信息以及所述第二IP地址和所述第二时间信息建立所述ARQ日志信息和所述用户收视记录信息之间的匹配关系;根据所述匹配关系确定与所述ARQ日志信息相对应的所述业务账号。
可选地,所述用于确定故障的指标数值包括:与进行数据重传的网络设备相对应的单用户ARQ请求次数、ARQ用户占比、ARQ用户数。
可选地,所述设备信息包括:IPTV资源树,所述指标计算模块,用于根据所述业务账号将所述IPTV资源树和所述用户收视记录信息进行关联,获得与所述进行数据重传的网络设备相对应的收视用户数;根据所述业务账号将所述IPTV资源树和所述ARQ日志信息进行关联,获得与所述进行数据重传的网络设备相对应的ARQ用户数、ARQ请求总数;基于所述收视用户数、所述ARQ用户数和所述ARQ请求总数计算与此进行数据重传的网络设备相对应的ARQ用户占比、单用户ARQ请求次数。
可选地,所述故障定界模块,用于依次判断所述单用户ARQ请求次数、所述ARQ用户占比和所述ARQ用户数是否符合所述故障判决规则,基于判断结果确定所述网络设备是否出现故障。
可选地,所述故障定界模块,用于如果确定所述单用户ARQ请求次数大于ARQ敏感程度阈值、所述ARQ用户占比大于ARQ用户占比阈值并且所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患。
可选地,所述故障定界模块,用于判断所述单用户ARQ请求次数是否大于ARQ敏感程度阈值,如果是,则判断所述ARQ用户占比是否大于ARQ用户占比阈值,如果否,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
可选地,所述故障定界模块,用于如果确定所述ARQ用户占比大于ARQ用户占比阈值,则判断所述ARQ用户数是否大于ARQ用户数阈值;如果确定所述ARQ用户占比小于或等于ARQ用户占比阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
可选地,所述故障定界模块,用于如果确定所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患;如果确定所述ARQ用户数小于或等于ARQ用户数阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
可选地,所述故障定界模块,用于计算所述单用户ARQ请求次数的至少一个同比增长率,所述同比增长率包括:所述单用户ARQ请求次数相较昨天、上周同一天的同比增长率;如果确定任何一个所述同比增长率大于容忍突变阈值,则确定所述网络设备出现故障。
根据本公开的又一方面,提供一种IPTV网络设备故障检测装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的IPTV网络设备故障检测方法。
根据本公开的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该指令被一个或多个处理器执行时实现如上所述的方法的步骤。
本公开的IPTV网络设备故障检测方法和装置,基于数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号,根据业务账号并基于数据重传日志信息、用户收视记录信息以及设备信息,获得与网络设备相对应的用于确定故障的指标数值,基于判断指标数值是否符合预设的故障判决规则的结果确定网络设备是否出现故障;不需要在网络设备部署监测点,仅通过对ARQ日志、资源树、用户收视记录进行关联、汇聚、计算等过程便可发现与定位设备的隐患;可以主动发现网络设备隐患,在设备进一步劣化之前标记设备,避免对用户感知造成影响。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本公开的IPTV网络设备故障检测方法的一个实施例的流程示意图;
图2为根据本公开的IPTV网络设备故障检测方法的另一个实施例的流程示意图;
图3为根据本公开的IPTV网络设备故障检测装置的一个实施例的模块示意图;
图4为根据本公开的IPTV网络设备故障检测装置的一个实施例的构架示意图;
图5为根据本公开的IPTV网络设备故障检测装置的另一个实施例的模块示意图。
具体实施方式
下面参照附图对本公开进行更全面的描述,其中说明本公开的示例性实施例。下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
下文中的“第一”、“第二”等仅用于描述上相区别,并没有其它特殊的含义。
图1为根据本公开的IPTV网络设备故障检测方法的一个实施例的流程示意图,如图1所示:
步骤101,采集IPTV网络的日志信息和设备信息。日志信息包括数据重传日志信息、用户收视记录信息等。数据重传日志信息包括记录网络设备基于ARQ协议进行数据重传的ARQ日志信息等。设备信息包括IPTV资源树等。
步骤102,基于数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号。
步骤103,根据业务账号并基于数据重传日志信息、用户收视记录信息以及设备信息,获得与网络设备相对应的用于确定故障的指标数值。
用于确定故障的指标数值包括与进行数据重传的网络设备相对应的单用户ARQ请求次数、ARQ用户占比、ARQ用户数等。网络设备可以为IPTV网络中的CDN节点等。ARQ用户是指与网络设备基于ARQ协议进行数据重传的用户。
步骤104,判断指标数值是否符合预设的故障判决规则,基于判断结果确定网络设备是否出现故障。故障判决规则可以有多种,可以基于具体的设备以及网络进行设置。
在一个实施例中,可以通过对平台CDN节点的ARQ日志和用户收视记录进行关联,从而匹配出业务账号。以业务账号为主键,通过IPTV资源树打通业务层和网络层各个环节,最后通过系统定义的指标和预先设置的阈值进行判定来发现网络设备隐患。
获取ARQ日志信息中的第一IP地址和第一时间信息、用户收视记录信息中的业务账号、第二IP地址和第二时间信息。基于第一IP地址和第一时间信息以及第二IP地址和第二时间信息建立ARQ日志信息和用户收视记录信息之间的匹配关系。根据匹配关系确定与ARQ日志信息相对应的业务账号。例如,根据ARQ日志信息中的IP+时间戳,以及用户收视记录中的业务账号+IP+时间段,实现ARQ用户对应的业务账号的关联匹配。
根据业务账号将IPTV资源树和用户收视记录信息进行关联,获得与进行数据重传的网络设备相对应的收视用户数。例如,以业务账号为主键,关联IPTV资源树和用户收视记录并按照设备ID分组,计算出设备对应的收视用户数。根据业务账号将IPTV资源树和ARQ日志信息进行关联,获得与进行数据重传的网络设备相对应的ARQ用户数、ARQ请求总数。例如,以业务账号为主键,关联IPTV资源树和ARQ日志并按照设备ID分组,计算出设备对应的ARQ用户数、ARQ请求总数。基于收视用户数、ARQ用户数和ARQ请求总数计算与此进行数据重传的网络设备相对应的ARQ用户占比、单用户ARQ请求次数。例如,单用户ARQ请求次数=ARQ请求总数/ARQ用户数,ARQ用户占比=ARQ用户数/收视用户数。
判断指标数值是否符合预设的故障判决规则、基于判断结果确定网络设备是否出现故障可以有多种方法。例如,依次判断单用户ARQ请求次数、ARQ用户占比和ARQ用户数是否符合故障判决规则,基于判断结果确定网络设备是否出现故障。
如果确定单用户ARQ请求次数大于ARQ敏感程度阈值、ARQ用户占比大于ARQ用户占比阈值并且ARQ用户数大于ARQ用户数阈值,则确定进行数据重传的网络设备存在故障或故障隐患。判断单用户ARQ请求次数是否大于ARQ敏感程度阈值,如果是,则判断ARQ用户占比是否大于ARQ用户占比阈值,如果否,则根据单用户ARQ请求次数的同比增长率确定网络设备是否出现故障。
如果确定ARQ用户占比大于ARQ用户占比阈值,则判断ARQ用户数是否大于ARQ用户数阈值;如果确定ARQ用户占比小于或等于ARQ用户占比阈值,则根据单用户ARQ请求次数的同比增长率确定网络设备是否出现故障。如果确定ARQ用户数大于ARQ用户数阈值,则确定进行数据重传的网络设备存在故障或故障隐患;如果确定ARQ用户数小于或等于ARQ用户数阈值,则根据单用户ARQ请求次数的同比增长率确定网络设备是否出现故障。
计算单用户ARQ请求次数的至少一个同比增长率,同比增长率包括:单用户ARQ请求次数相较昨天、上周同一天等的同比增长率。如果确定任何一个同比增长率大于容忍突变阈值,则确定网络设备出现故障。
图2为根据本公开的IPTV网络设备故障检测方法的另一个实施例的流程示意图,如图2所示:
步骤201,根据ARQ日志中的IP地址+时间戳,以及用户收视记录中的业务账号+IP地址+开始时间+结束时间,实现ARQ用户对应的业务账号的关联匹配,确定进行ARQ的业务账号。
步骤202,以业务账号为主键,关联IPTV资源树和用户收视记录,并按照设备ID分组,计算出设备对应的收视用户数。
步骤203,以业务账号为主键,关联IPTV资源树和ARQ日志,并按照设备ID分组,计算设备对应的ARQ用户数、ARQ请求总数。
步骤204,基于步骤202和步骤203的计算结果,以设备ID作为主键,计算设备对应的ARQ用户占比、单用户ARQ请求次数。
步骤205,判断单用户ARQ请求次数是否大于参数Pa,如果是,则进入步骤206,如果否,则进入步骤208。Pa为设定的设备ARQ敏感程度阈值,实际阈值可能因设备种类而不同。
步骤206,判断ARQ用户占比是否大于参数Ra,如果是,则进入步骤207,如果否,则进入步骤208。Ra为设定的ARQ用户占比阈值,实际阈值可能因设备种类而不同。
步骤207,判断ARQ用户数是否大于参数Cr,如果是,则进入步骤209,如果否,则进入步骤208。Cr为设定的ARQ用户数阈值,实际阈值可能因设备种类而不同。
步骤208,进入步骤208表示当前的所有指标都不能标记设备是否故障,需要计算当前单用户ARQ请求次数相较昨天以及上周同一天等的同比增长率。判断其中任何一个同比增长率是否大于Ia,如果是,则进入步骤210,如果否,则进入步骤211。
步骤209,标记该设备ID对应的设备存在隐患并结束。
步骤210,标记该设备ID对应的设备存在隐患并结束。
步骤211,标记该设备ID对应的设备正常并结束。
上述实施例中的IPTV网络设备故障检测方法,通过对ARQ日志、资源树、用户收视记录进行关联、汇聚、计算等过程便可发现与定位设备的隐患;可以主动发现网络设备隐患,在设备进一步劣化之前标记设备,避免对用户感知造成影响。
在一个实施例中,如图3所示,本公开提供一种IPTV网络设备故障检测装置30,包括:数据采集模块31、账号关联模块32、指标计算模块33和故障定界模块34。
数据采集模块31采集IPTV网络的日志信息和设备信息,日志信息包括:数据重传日志信息、用户收视记录信息等。账号关联模块32基于数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号。指标计算模块33根据业务账号并基于数据重传日志信息、用户收视记录信息以及设备信息,获得与网络设备相对应的用于确定故障的指标数值。用于确定故障的指标数值包括与进行数据重传的网络设备相对应的单用户ARQ请求次数、ARQ用户占比、ARQ用户数等。故障定界模块34判断指标数值是否符合预设的故障判决规则,基于判断结果确定网络设备是否出现故障。
账号关联模块32获取ARQ日志信息中的第一IP地址和第一时间信息、用户收视记录信息中的业务账号、第二IP地址和第二时间信息。账号关联模块32基于第一IP地址和第一时间信息以及第二IP地址和第二时间信息建立ARQ日志信息和用户收视记录信息之间的匹配关系,根据匹配关系确定与ARQ日志信息相对应的业务账号。
设备信息包括IPTV资源树等。指标计算模块33根据业务账号将IPTV资源树和用户收视记录信息进行关联,获得与进行数据重传的网络设备相对应的收视用户数。指标计算模块33根据业务账号将IPTV资源树和ARQ日志信息进行关联,获得与进行数据重传的网络设备相对应的ARQ用户数、ARQ请求总数。指标计算模块33基于收视用户数、ARQ用户数和ARQ请求总数计算与此进行数据重传的网络设备相对应的ARQ用户占比、单用户ARQ请求次数。
故障定界模块34依次判断单用户ARQ请求次数、ARQ用户占比和ARQ用户数是否符合故障判决规则,基于判断结果确定网络设备是否出现故障。如果确定单用户ARQ请求次数大于ARQ敏感程度阈值、ARQ用户占比大于ARQ用户占比阈值并且ARQ用户数大于ARQ用户数阈值,则故障定界模块34确定进行数据重传的网络设备存在故障或故障隐患。
故障定界模块34判断单用户ARQ请求次数是否大于ARQ敏感程度阈值,如果是,则判断ARQ用户占比是否大于ARQ用户占比阈值,如果否,则根据单用户ARQ请求次数的同比增长率确定网络设备是否出现故障。
如果确定ARQ用户占比大于ARQ用户占比阈值,则故障定界模块34判断ARQ用户数是否大于ARQ用户数阈值;如果确定ARQ用户占比小于或等于ARQ用户占比阈值,则故障定界模块34根据单用户ARQ请求次数的同比增长率确定网络设备是否出现故障。
如果确定ARQ用户数大于ARQ用户数阈值,则故障定界模块34确定进行数据重传的网络设备存在故障或故障隐患。如果确定ARQ用户数小于或等于ARQ用户数阈值,则故障定界模块34根据单用户ARQ请求次数的同比增长率确定网络设备是否出现故障。
故障定界模块34计算单用户ARQ请求次数的至少一个同比增长率,同比增长率包括:单用户ARQ请求次数相较昨天、上周同一天的同比增长率。如果确定任何一个同比增长率大于容忍突变阈值,则故障定界模块34确定网络设备出现故障。
如图4所示,本发明计算过程共涉及三类数据,即服务器ARQ请求日志、用户收视记录、IPTV资源树。这三类数据可以分别由CDN集群、统计服务器、统一网元库生成并存储在本地的磁盘或者数据库。数据采集模块31实现与IPTV平台CDN节点的ARQ日志、用户收视记录及IPTV资源树等三类外围数据源的对接,统一获取对应日志后,将数据入库到业务数据库。业务数据库主要用于存储对应的数据原始表、关联汇聚产生的临时表以及最终生成的定界结果表。
数据采集模块31通过FTP定时去上述三个数据源拉取数据到本地磁盘,数据采集模块31可以同时是大数据平台Hadoop集群对外的接口机,通过HDFS和HIVE命令可将数据写入HDFS文件系统和HIVE数据仓库。
ARQ日志一般只携带了机顶盒的IP地址,由于同一时间IP地址具有唯一性,账号关联模块32负责根据ARQ日志中的IP地址与收视记录的IP地址进行匹配,同时确保ARQ请求的时间戳位于用户收视时间段内,可精确匹配业务账号。业务账号是后续三类数据实现关联汇聚的唯一索引。
可以关联汇聚与定界模块读取HIVE数据仓库,首先对ARQ请求日志和用户收视话单按照IP进行关联,然后限制ARQ请求上报的时间在用户收视的开始时间和结束时间对应的时间段内,据此可精确匹配用户的业务账号。
指标计算模块33针对每条ARQ请求记录,关联IPTV资源树,实现每台网络设备对应的ARQ指标计算。指标计算模块33针对每条用户收视记录,关联IPTV资源树,实现针每台网络设备对应收视用户数的计算。数据计算完成后,按照设备ID进行合并计算,形成最终的指标宽表。对于每台网络设备,主要包括以下五项指标:ARQ请求用户数、ARQ总请求次数、收视用户数、单用户请求次数、ARQ用户占比等。
IPTV资源树包含用户的网络拓扑信息,主要包括:业务账号、CDN名称、CDN IP地址、Bras/SR名称、Bras/SR ID、Bras/SR IP地址、汇聚交换机名称、汇聚交换机ID、汇聚交换机IP、OLT名称、OLT ID、OLT IP、PON口、分光器、ONU名称等。由于IPTV资源树包含每个业务账号对应的网络设备信息,故可根据业务账号关联IPTV资源树和ARQ请求日志,并计算每台网络设备对应的ARQ用户数、ARQ请求包数、总请求数等指标。根据业务账号关联IPTV资源树和用户收视记录,并计算每台网络设备对应的收视用户数。
由于设备ID全局唯一,可按照设备ID将ARQ相关指标和收视用户数进行关联形成宽表,并计算出ARQ用户占比和单用户ARQ请求次数。ARQ用户占比表示该台设备实际承载用户中有多少比例用户发生丢包,单用户ARQ请求次数表示该台设备实际承载的用户发生丢包的程度,这两项指标直接反映出了设备的健康程度。根据设置的各项指标阈值来决策网络设备是否存在隐患,对于存在隐患的设备在WEB页面通过告警形式进行展现。
故障定界模块34读取系统预先设置的各项指标对应的阈值参数,依次遍历每台网络设备,并按照单用户ARQ请求次数、ARQ用户占比、ARQ用户数顺序依次与阈值进行比较,根据实际的比较结果对设备是否存在故障和隐患进行界定。
图5为根据本发明公开的IPTV网络设备故障检测装置的另一个实施例的模块示意图。如图5所示,该装置可包括存储器51、处理器52、通信接口53以及总线54。存储器51用于存储指令,处理器52耦合到存储器51,处理器52被配置为基于存储器51存储的指令执行实现上述的IPTV网络设备故障检测方法。
存储器51可以为高速RAM存储器、非易失性存储器(NoN-volatile memory)等,存储器51也可以是存储器阵列。存储器51还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器52可以为中央处理器CPU,或专用集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明公开的IPTV网络设备故障检测方法的一个或多个集成电路。
在一个实施例中,本公开还提供一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上任一实施例涉及的IPTV网络设备故障检测方法。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
上述实施例中的IPTV网络设备故障检测方法和装置,基于数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号,根据业务账号并基于数据重传日志信息、用户收视记录信息以及设备信息,获得与网络设备相对应的用于确定故障的指标数值,基于判断指标数值是否符合预设的故障判决规则的结果确定网络设备是否出现故障;能够有效解决目前IPTV运营商对于网络丢包带来的卡顿问题无有效支撑手段的现状;投入成本低,不需要在网络设备部署监测点,仅通过对ARQ日志、资源树、用户收视记录进行关联、汇聚、计算等过程便可发现与定位设备的隐患;可以主动发现网络设备隐患,在设备进一步劣化之前标记设备,避免对用户感知造成影响;帮助运营商实现从被动运维向主动运维的方式转变,是诊治和排查卡顿问题的有力抓手。
目前,本公开的方法及对应的装置已经在江苏电信进行试点,并成功发现三个案例共30余台设备隐患,极大地提升了江苏电信IPTV业务的用户感知。
可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。
Claims (22)
1.一种IPTV网络设备故障检测方法,包括:
采集IPTV网络的日志信息和设备信息,其中,所述日志信息包括:数据重传日志信息、用户收视记录信息;
基于所述数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号;
根据所述业务账号并基于所述数据重传日志信息、所述用户收视记录信息以及所述设备信息,获得与网络设备相对应的用于确定故障的指标数值;
判断所述指标数值是否符合预设的故障判决规则,基于判断结果确定所述网络设备是否出现故障。
2.如权利要求1所述的方法,其中,所述数据重传日志信息包括:记录网络设备基于ARQ协议进行数据重传的ARQ日志信息;
所述基于所述数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号包括:
获取所述ARQ日志信息中的第一IP地址和第一时间信息、所述用户收视记录信息中的业务账号、第二IP地址和第二时间信息;
基于所述第一IP地址和所述第一时间信息以及所述第二IP地址和所述第二时间信息建立所述ARQ日志信息和所述用户收视记录信息之间的匹配关系;
根据所述匹配关系确定与所述ARQ日志信息相对应的所述业务账号。
3.如权利要求2所述的方法,其中,
所述用于确定故障的指标数值包括:与进行数据重传的网络设备相对应的单用户ARQ请求次数、ARQ用户占比、ARQ用户数。
4.如权利要求3所述的方法,其中,所述设备信息包括:IPTV资源树,所述方法还包括:
根据所述业务账号将所述IPTV资源树和所述用户收视记录信息进行关联,获得与所述进行数据重传的网络设备相对应的收视用户数;
根据所述业务账号将所述IPTV资源树和所述ARQ日志信息进行关联,获得与所述进行数据重传的网络设备相对应的ARQ用户数、ARQ请求总数;
基于所述收视用户数、所述ARQ用户数和所述ARQ请求总数计算与此进行数据重传的网络设备相对应的ARQ用户占比、单用户ARQ请求次数。
5.如权利要求4所述的方法,其中,所述判断所述指标数值是否符合预设的故障判决规则、基于判断结果确定所述网络设备是否出现故障包括:
依次判断所述单用户ARQ请求次数、所述ARQ用户占比和所述ARQ用户数是否符合所述故障判决规则,基于判断结果确定所述网络设备是否出现故障。
6.如权利要求5所述的方法,其中,还包括:
如果确定所述单用户ARQ请求次数大于ARQ敏感程度阈值、所述ARQ用户占比大于ARQ用户占比阈值并且所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患。
7.如权利要求6所述的方法,其中,还包括:
判断所述单用户ARQ请求次数是否大于ARQ敏感程度阈值,如果是,则判断所述ARQ用户占比是否大于ARQ用户占比阈值,如果否,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
8.如权利要求7所述的方法,其中,还包括:
如果确定所述ARQ用户占比大于ARQ用户占比阈值,则判断所述ARQ用户数是否大于ARQ用户数阈值;
如果确定所述ARQ用户占比小于或等于ARQ用户占比阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
9.如权利要求8所述的方法,其中,还包括:
如果确定所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患;
如果确定所述ARQ用户数小于或等于ARQ用户数阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
10.如权利要求9所述的方法,其中,所述根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障包括:
计算所述单用户ARQ请求次数的至少一个同比增长率,所述同比增长率包括:所述单用户ARQ请求次数相较昨天、上周同一天的同比增长率;
如果确定任何一个所述同比增长率大于容忍突变阈值,则确定所述网络设备出现故障。
11.一种IPTV网络设备故障检测装置,包括:
数据采集模块,用于采集IPTV网络的日志信息和设备信息,其中,所述日志信息包括:数据重传日志信息、用户收视记录信息;
账号关联模块,用于基于所述数据重传日志信息和用户收视记录信息确定进行数据重传的业务账号;
指标计算模块,用于根据所述业务账号并基于所述数据重传日志信息、所述用户收视记录信息以及所述设备信息,获得与网络设备相对应的用于确定故障的指标数值;
故障定界模块,用于判断所述指标数值是否符合预设的故障判决规则,基于判断结果确定所述网络设备是否出现故障。
12.如权利要求11所述的装置,其中,
所述账号关联模块,用于获取所述ARQ日志信息中的第一IP地址和第一时间信息、所述用户收视记录信息中的业务账号、第二IP地址和第二时间信息;基于所述第一IP地址和所述第一时间信息以及所述第二IP地址和所述第二时间信息建立所述ARQ日志信息和所述用户收视记录信息之间的匹配关系;根据所述匹配关系确定与所述ARQ日志信息相对应的所述业务账号。
13.如权利要求12所述的装置,其中,
所述用于确定故障的指标数值包括:与进行数据重传的网络设备相对应的单用户ARQ请求次数、ARQ用户占比、ARQ用户数。
14.如权利要求13所述的装置,其中,所述设备信息包括:IPTV资源树,
所述指标计算模块,用于根据所述业务账号将所述IPTV资源树和所述用户收视记录信息进行关联,获得与所述进行数据重传的网络设备相对应的收视用户数;根据所述业务账号将所述IPTV资源树和所述ARQ日志信息进行关联,获得与所述进行数据重传的网络设备相对应的ARQ用户数、ARQ请求总数;基于所述收视用户数、所述ARQ用户数和所述ARQ请求总数计算与此进行数据重传的网络设备相对应的ARQ用户占比、单用户ARQ请求次数。
15.如权利要求14所述的装置,其中,
所述故障定界模块,用于依次判断所述单用户ARQ请求次数、所述ARQ用户占比和所述ARQ用户数是否符合所述故障判决规则,基于判断结果确定所述网络设备是否出现故障。
16.如权利要求15所述的装置,其中,
所述故障定界模块,用于如果确定所述单用户ARQ请求次数大于ARQ敏感程度阈值、所述ARQ用户占比大于ARQ用户占比阈值并且所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患。
17.如权利要求16所述的装置,其中,
所述故障定界模块,用于判断所述单用户ARQ请求次数是否大于ARQ敏感程度阈值,如果是,则判断所述ARQ用户占比是否大于ARQ用户占比阈值,如果否,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
18.如权利要求17所述的装置,其中,
所述故障定界模块,用于如果确定所述ARQ用户占比大于ARQ用户占比阈值,则判断所述ARQ用户数是否大于ARQ用户数阈值;如果确定所述ARQ用户占比小于或等于ARQ用户占比阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
19.如权利要求18所述的装置,其中,
所述故障定界模块,用于如果确定所述ARQ用户数大于ARQ用户数阈值,则确定所述进行数据重传的网络设备存在故障或故障隐患;如果确定所述ARQ用户数小于或等于ARQ用户数阈值,则根据所述单用户ARQ请求次数的同比增长率确定所述网络设备是否出现故障。
20.如权利要求19所述的装置,其中,
所述故障定界模块,用于计算所述单用户ARQ请求次数的至少一个同比增长率,所述同比增长率包括:所述单用户ARQ请求次数相较昨天、上周同一天的同比增长率;如果确定任何一个所述同比增长率大于容忍突变阈值,则确定所述网络设备出现故障。
21.一种IPTV网络设备故障检测装置,其中,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至10中任一项所述的IPTV网络设备故障检测方法。
22.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被一个或多个处理器执行时实现权利要求1至10任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711161219.XA CN109818764B (zh) | 2017-11-21 | 2017-11-21 | Iptv网络设备故障检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711161219.XA CN109818764B (zh) | 2017-11-21 | 2017-11-21 | Iptv网络设备故障检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109818764A true CN109818764A (zh) | 2019-05-28 |
CN109818764B CN109818764B (zh) | 2022-02-08 |
Family
ID=66599219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711161219.XA Active CN109818764B (zh) | 2017-11-21 | 2017-11-21 | Iptv网络设备故障检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109818764B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112449371A (zh) * | 2019-08-30 | 2021-03-05 | 中国移动通信集团广东有限公司 | 一种无线路由器的性能评测方法及电子设备 |
CN112994787A (zh) * | 2019-12-12 | 2021-06-18 | 中盈优创资讯科技有限公司 | 一种光网络故障判断方法及装置 |
CN113014907A (zh) * | 2019-12-19 | 2021-06-22 | 中国电信股份有限公司 | 网络协议电视故障预警方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984583A (zh) * | 2010-11-23 | 2011-03-09 | 中兴通讯股份有限公司 | 一种对单播类节目播放异常进行故障定位的方法及系统 |
CN107210868A (zh) * | 2015-01-30 | 2017-09-26 | 华为技术有限公司 | 一种数据重传的系统和方法 |
CN107342878A (zh) * | 2016-04-29 | 2017-11-10 | 中兴通讯股份有限公司 | 一种故障处理方法及装置 |
US20170331670A1 (en) * | 2016-05-13 | 2017-11-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Network Architecture, Methods, and Devices for a Wireless Communications Network |
-
2017
- 2017-11-21 CN CN201711161219.XA patent/CN109818764B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984583A (zh) * | 2010-11-23 | 2011-03-09 | 中兴通讯股份有限公司 | 一种对单播类节目播放异常进行故障定位的方法及系统 |
CN107210868A (zh) * | 2015-01-30 | 2017-09-26 | 华为技术有限公司 | 一种数据重传的系统和方法 |
CN107342878A (zh) * | 2016-04-29 | 2017-11-10 | 中兴通讯股份有限公司 | 一种故障处理方法及装置 |
US20170331670A1 (en) * | 2016-05-13 | 2017-11-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Network Architecture, Methods, and Devices for a Wireless Communications Network |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112449371A (zh) * | 2019-08-30 | 2021-03-05 | 中国移动通信集团广东有限公司 | 一种无线路由器的性能评测方法及电子设备 |
CN112449371B (zh) * | 2019-08-30 | 2023-08-15 | 中国移动通信集团广东有限公司 | 一种无线路由器的性能评测方法及电子设备 |
CN112994787A (zh) * | 2019-12-12 | 2021-06-18 | 中盈优创资讯科技有限公司 | 一种光网络故障判断方法及装置 |
CN113014907A (zh) * | 2019-12-19 | 2021-06-22 | 中国电信股份有限公司 | 网络协议电视故障预警方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109818764B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10289473B2 (en) | Situation analysis | |
CN106789223B (zh) | 一种交互式网络电视iptv业务质量检测方法及系统 | |
CN103257989B (zh) | 网页下载时间分析 | |
US9692671B2 (en) | Method and apparatus for automatically determining causes of service quality degradation | |
CN109818764A (zh) | Iptv网络设备故障检测方法和装置 | |
US20170208487A1 (en) | Multi kpi correlation in wireless protocols | |
CN104994133B (zh) | 一种基于网络KPI的移动Web网页访问用户体验感知评测方法 | |
US9998500B2 (en) | Methods and systems for performing lawful interception (LI) in communication networks involving content adulteration with colluding agents | |
EP0996254A2 (en) | A method for quantifying communication performance | |
CN103856789A (zh) | 基于用户行为分析实现ott业务质量保障的系统及方法 | |
CN109241733A (zh) | 基于Web访问日志的爬虫行为识别方法及装置 | |
CN106411629B (zh) | 一种用于监控cdn节点的状态的方法和设备 | |
CN109714221A (zh) | 网络数据包的确定方法、装置及系统 | |
CN107924345A (zh) | 用于度量的聚合测量结果的数据存储区 | |
CN105827473A (zh) | 一种网络质量评估方法及装置 | |
CN109873734B (zh) | 一种底层数据监控方法、介质、设备及装置 | |
CN111064780A (zh) | 一种多任务内容更新方法、装置、设备及介质 | |
WO2023040259A1 (zh) | 资源告警分析方法、装置、电子设备和存储介质 | |
CN104883705B (zh) | 一种数据业务投诉的问题定位方法及装置 | |
CN112562827B (zh) | 基于dicom传输的地址来区分设备的管理系统及方法 | |
US20210158217A1 (en) | Method and Apparatus for Generating Application Identification Model | |
CN108268370B (zh) | 基于Referer和模板库匹配的网站质量分析方法、装置和系统 | |
CN108650123A (zh) | 故障信息记录方法、装置、设备和存储介质 | |
CN112911272B (zh) | Iptv群障预警方法和系统 | |
CN110475161B (zh) | 一种iptv业务直播链路的自动故障定位方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |