CN110475161B - 一种iptv业务直播链路的自动故障定位方法及其系统 - Google Patents

一种iptv业务直播链路的自动故障定位方法及其系统 Download PDF

Info

Publication number
CN110475161B
CN110475161B CN201910804122.9A CN201910804122A CN110475161B CN 110475161 B CN110475161 B CN 110475161B CN 201910804122 A CN201910804122 A CN 201910804122A CN 110475161 B CN110475161 B CN 110475161B
Authority
CN
China
Prior art keywords
data
top box
fault
router
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910804122.9A
Other languages
English (en)
Other versions
CN110475161A (zh
Inventor
林桂云
马学嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vixtel Technologies Beijing Co ltd
Original Assignee
Vixtel Technologies Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vixtel Technologies Beijing Co ltd filed Critical Vixtel Technologies Beijing Co ltd
Priority to CN201910804122.9A priority Critical patent/CN110475161B/zh
Publication of CN110475161A publication Critical patent/CN110475161A/zh
Application granted granted Critical
Publication of CN110475161B publication Critical patent/CN110475161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2404Monitoring of server processing errors or hardware failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • H04N21/64738Monitoring network characteristics, e.g. bandwidth, congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64784Data processing by the network
    • H04N21/64792Controlling the complexity of the content stream, e.g. by dropping packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出了一种IPTV业务直播链路的自动故障定位方法及其系统,所述方法步骤如下S1、建立IPTV业务中机顶盒到节目源的全路径拓扑结构;S2、采集全路径拓扑结构中每个设备的数据;S3、根据每个设备的数据与全路径拓扑结构得到全路径拓扑数据表;S4、计算视频MOS值;S5、计算设备数据与视频MOS值的线性关系,并建立故障逻辑判断知识库;S6、根据全路径拓扑数据表和故障逻辑判断知识库定位故障点并得出故障分析结果。所述系统包括数据采集模块、数据输入输出模块、数据存储模块、数据处理模块和数据展示模块。本发明方法和系统可以自动定位故障节点、分析故障原因,提高故障定位效率,降低运维成本。

Description

一种IPTV业务直播链路的自动故障定位方法及其系统
技术领域
本发明涉及一种用于IPTV直播业务的自动定位故障设备的方法及其系统,属于网络故障定位技术领域。
背景技术
IPTV业务能够很好地适应当今网络飞速发展的趋势,充分有效地利用网络资源,为用户提供了包括数字电视在内的交互式服务。由于IPTV业务的实时性要求高、网络流量大、影响质量因素众多,所以很难准确和及时的发现IPTV业务的故障问题,IPTV业务从用户终端到节目视频源需要经过多级的网络设备和链路,链路中的某个设备、设备端口、链路出现异常都会导致用户播放视频质量劣化或完全无法播放视频,严重影响IPTV业务用户感知。
现有技术中针对IPTV业务的故障定位方法,一般都是从用户终端侧或视频节目源侧进行监测,这样的方法可以发现单个用户质量劣化情况或影响全量用户的批量故障,但是无法准确定位故障节点和原因,每次出现用户投诉时,往往需要逐级排查,耗费大量的人工处理时间,如果同时出现N个用户投诉,则排查工作量需要增加N倍,同时对运维人员排查故障、定位故障原因的能力要求也较高,这样的故障定位方法不仅成本较高,而且耗时耗力,对故障的定位和处理效率较慢,无法很好的适应市场要求。
发明内容
为了解决目前IPTV业务故障定位难度大、定位效率低、成本高的问题,本发明提出了一种IPTV业务直播链路的自动故障定位方法及其系统,采集IPTV业务直播链路的数据,构建全路径拓扑结构和全路径拓扑数据表,根据全路径拓扑结构自动计算直播链路中每个设备与视频MOS值的线性关系,并根据故障逻辑判断故障节点,自动的实现故障定位、输出故障原因。
为解决上述技术问题,本发明采用了如下技术手段:
一种IPTV业务直播链路的自动故障定位方法,具体包括以下步骤:
S1、采集IPTV业务全网路由器设备数据和端口数据,建立IPTV业务直播链路中机顶盒到节目源的全路径拓扑结构;
S2、周期性的采集全路径拓扑结构中每个路由器设备的性能状态、网络状态和设备端口数据;
S3、将每个路由器设备的性能状态、网络状态和设备端口数据与全路径拓扑结构对应,得到全路径拓扑数据表,并将全路径拓扑数据表存储在数据库中;
S4、利用视频直播时的网络和业务质量指标计算视频MOS值;
S5、分别计算路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,并根据线性关系建立故障逻辑判断知识库;
S6、输入任意一个或多个直播链路故障的机顶盒信息,根据全路径拓扑数据表和故障逻辑判断知识库定位故障点并得出故障分析结果。
进一步的,所述步骤S1的具体操作如下:
S11、任意选取IPTV业务直播链路中的一个机顶盒,通过业务方存储的机顶盒上联设备信息查找该机顶盒的上联路由器设备,即一级路由器;
S12、登录一级路由器查询一级路由器的路由数据,通过频道IP和频道端口获得一级路由器上联的二级路由器名称和二级路由器端口,以此类推,得到该机顶盒到节目源的全路径数据;
S13、重复步骤S11、S12,遍历IPTV业务直播链路中的每个机顶盒,利用每个机顶盒到节目源的全路径数据,建立IPTV业务直播链路中机顶盒到节目源的全路径拓扑结构。
进一步的,所述全路径数据包括机顶盒名称、频道IP、频道端口、一级路由器名称、一级路由器端口、二级路由器名称、二级路由器端口、……、N级路由器名称、N级路由器端口和节目源地址。
进一步的,所述性能状态包括CPU占比值、内存占比值;所述网络状态包括网络吞吐量和网络丢包率;所述设备端口数据包括端口状态、端口光功率,所述端口状态包括端口运行和端口关闭两种状态。
进一步的,所述步骤S4的具体操作如下:
S41、利用监测软件抓取机顶盒播放数据,计算机顶盒播放直播频道时的网络和业务质量指标,所述网络和业务质量指标包括:MDI-LR、MDI-DF、PCR抖动、视频码率;
S42、根据网络和业务质量指标计算视频MOS值,具体公式如下:
MOS=0.3*BR-0.005*PCR-0.001*MDIDF-0.057*MDILR+3.02 (1)
其中,BR为视频码率值,PCR为PCR抖动指标值,MDIDF为MDI-DF指标值,MDILR为MDI-LR指标值。
进一步的,所述步骤S5的具体操作如下:
S51、提取每次机顶盒播放直播视频时的MOS值,以及同一时间该机顶盒关联的每个路由器设备的性能状态、网络状态、设备端口数据;
S52、连续获取多组数据,根据相关系数公式分别计算每个路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,相关系数公式如下:
Figure BDA0002183141150000031
其中,r(X,Y)为参数X和Y的线性关系值,Cov(X,Y)为参数X和Y的协方差,Var[X]为参数X的方差,Var[Y]为参数Y的方差,参数X为某次机顶盒播放直播视频时某个路由器设备的性能状态、网络状态或设备端口数据,参数Y为某次机顶盒播放直播视频时的视频MOS值;
S53、根据S52计算的线性关系值,分别计算每个路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系均值;
S54、根据S53的线性关系均值,设置性能状态、网络状态和设备端口数据对应的门限值,建立故障逻辑判断知识库。
进一步的,所述故障逻辑判断知识库中包括设备指标名称、设备指标门限值、设备指标不达标的故障现象、设备指标不达标的优化处理操作。
进一步的,所述设备指标包括路由器设备的性能状态、网络状态和设备端口数据。
进一步的,步骤S6的具体操作如下:
S61、当机顶盒播放直播视频出现故障时,计算该机顶盒故障时刻的MOS值;
S62、输入任意一个或多个直播链路故障的机顶盒信息,通过全路径拓扑结构获取该机顶盒到节目源的全路径数据;
S63、通过全路径拓扑数据表获取该机顶盒的全路径数据中的每个路由器设备的性能状态、网络状态、设备端口数据;
S63、计算该机顶盒的全路径数据中的每个路由器设备的每个设备指标与MOS值的线性关系均值,利用故障逻辑判断知识库定位故障的设备,并得出故障分析结果。
一种IPTV业务直播链路的自动故障定位系统,包括数据采集模块、数据输入输出模块、数据存储模块、数据处理模块和数据展示模块。
所述数据采集模块,用于采集机顶盒的全路径数据、路由器设备的性能状态、网络状态和设备端口数据;所述数据输入输出模块,用于输入出现故障的机顶盒信息,并输出直播链路中故障的设备和故障分析结果;所述数据存储模块,用于保存全路径拓扑结构、全路径拓扑数据表、路由器设备的性能状态、网络状态、设备端口数据、故障判断逻辑知识库、输入的机顶盒信息、输出的故障设备和故障分析结果;所述数据处理模块,用于根据机顶盒的全路径数据逐级判断故障设备,生成故障判断逻辑知识库,并得到故障分析结果;所述数据展示模块,用于展示机顶盒的全路径拓扑视图,并在全路径拓扑视图中标记故障设备、显示故障设备的数据明细表和故障分析结果。
采用以上技术手段后可以获得以下优势:
本发明提出了一种IPTV业务直播链路的自动故障定位方法及其系统,本发明方法和系统充分利用机顶盒和路由器设备的数据采集功能,逐级采集机顶盒和路由器设备的数据,构建全路径拓扑数据表,通过MOS值反应机顶盒播放的视频质量,利用每个设备的数据与MOS值的线性关系均值,结合故障判断逻辑知识库判断设备指标是否达标,进而实现故障判断,本发明系统还提供数据展示模块,可以直观显示机顶盒的全路径拓扑结构图,并在图中标记故障设备,显示故障设备的数据和故障分析结果,帮助运维人员直观的了解故障情况。本发明方法和系统能够自动化的、快速的定位IPTV业务直播链路中的故障设备,与传统方法相比,有效的提升了故障处理效率,尤其是当批量用户播放直播频道出现故障时,可以有效减少用户的等待时间,从IPTV业务市场发展的角度,可以提升用户质量感知、保障IPTV业务使用率和续费率、提高IPTV业务市场竞争力。同时,本发明方法和系统将IPTV业务故障定位中所有的排查步骤和处理逻辑固化到程序,可以自动的定位故障节点、分析故障原因,降低对运维人员专业水平的要求,较少了人工的工作量,运维人员可以快速入门,从IPTV业务运维的角度,可以提高运维效率、降低运维成本。
附图说明
图1为本发明一种IPTV业务直播链路的自动故障定位方法的步骤流程图。
图2为本发明一种IPTV业务直播链路的自动故障定位系统的结构示意图。
图3为本发明系统中机顶盒的全路径拓扑视图。
图中,1是数据采集模块,2是数据输入输出模块,3是数据存储模块,4是数据处理模块,5是数据展示模块。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明:
某一个机顶盒要获取到节目源数据需要经过多级路由器设备和端口,播放不同的直播节目时,所经的路由器设备和端口也会有差异,单个运营商省公司业务承载设备多达几千台,每台设备上有基本都有100个以上的端口,组合而成的链路数量多达几十万条,当某一个机顶盒播放的直播视频出现故障时,传统方法需要运维人员在发生故障时登录每级设备查看从该机顶盒到节目源经过的上联设备和端口,确认该机顶盒播放该频道的具体链路信息,再人工将设备性能状态、网络状态、业务状态、端口状态、端口光功率等数据一一查询和记录,操作繁琐、效率低。
本发明提出了一种IPTV业务直播链路的自动故障定位方法,具体包括以下步骤:
S1、为了自动化的进行故障定位和分析,首选需要采集IPTV业务全网路由器设备数据和端口数据,建立IPTV业务直播链路中机顶盒到节目源的全路径拓扑结构;具体操作如下:
S11、任意选取IPTV业务直播链路中的一个机顶盒,通过业务方存储的机顶盒上联设备信息查找该机顶盒的上联路由器,即一级路由器,得到一级路由器的名称。
S12、通过编写的代码自动登录一级路由器,查询一级路由器的路由数据,市面上常见的路由器设备都具有查询自身路由数据的能力,比如华为的ME60设备,登录后输入display pim routing-table即可得到ME60设备数据。本发明方法在访问一路频道时,可以根据给定的频道IP和频道端口从一级路由器的路由数据中获得一级路由器上联的二级路由器名称和二级路由器端口。频道端口是IP网络的协议端口,路由器端口指的是路由器的网卡物理端口,一个路由器设备上有多个网卡,用来连接不同的设备,本发明中采集的设备端口数据就是指路由器端口的数据。
在本发明中,将直接与机顶盒关联的路由器称为一级路由器,一级路由器上联的路由器称为二级路由器,以此类推,此外,我们将当前设备和当前设备的上联设备的数据称为单条链路数据,单条链路数据中包括当前设备名称、频道IP、频道端口、上联设备名称和上联设备端口。
不断的登录当前路由器查询路由数据,获得多个单条链路数据,将单条链路数据组合起来得到该机顶盒到节目源的全路径数据,全路径数据包括机顶盒名称、频道IP、频道端口、一级路由器名称、一级路由器端口、二级路由器名称、二级路由器端口、……、N级路由器名称、N级路由器端口和节目源地址。
S13、重复步骤S11、S12,遍历IPTV业务直播链路中的每个机顶盒,利用每个机顶盒到节目源的全路径数据,建立IPTV业务直播链路中机顶盒到节目源的全路径拓扑结构。全路径数据指一个机顶盒播放一个频道的时候经过的每一级路由器信息,全路径拓扑结构指IPTV业务中每个机顶盒播放每个频道的时候经过的每一级路由器信息。因为同一个机顶盒在同一时间只能播放一个频道,但是多个机顶盒可以同时播放一个频道,为了避免数据混乱,可以根据节目源建立全路径拓扑结构,即构建IPTV业务中每个机顶盒播放一个频道的时候的全路径拓扑结构,有多少个节目源就构建多少个全路径拓扑结构。
S2、市面上主流的路由器一般都具有网管系统,路由器的网管系统可以周期性的采集路由器设备的性能状态、网络状态和设备端口数据,采集周期一般为每分钟、每五分钟等,利用这些路由器设备的网管系统可以获取到全路径拓扑结构中每个路由器设备的性能状态、网络状态和设备端口数据。路由器设备的性能状态包括CPU占比值、内存占比值等,网络状态包括网络吞吐量和网络丢包率等,设备端口数据包括端口状态、端口光功率等,端口状态一般包括端口运行状态和端口关闭状态。
S3、将每个路由器设备的性能状态、网络状态和设备端口数据与全路径拓扑结构对应得到全路径拓扑数据表,全路径拓扑结构给出了IPTV业务中所有设备的连接关系,根据这个连接关系建立全路径拓扑数据表,并将对应位置的设备的数据填充到表格中,然后将全路径拓扑数据表存储在数据库中,方便后续调取和处理。
S4、利用视频直播时的网络和业务质量指标计算视频MOS值;具体操作如下:
S41、本发明方法利用安装在机顶盒设备上的监测软件直接抓取机顶盒播放数据,也可以获取机顶盒自身发送的事件数据,用于抓取数据的监管软件名称为tcpdump,计算机顶盒播放直播频道时的网络和业务质量指标,本发明用到的网络和业务质量指标主要包括:MDI-LR、MDI-DF、PCR抖动和视频码率。
S42、根据S41的网络和业务质量指标计算视频MOS值,视频MOS值是视频质量主观评分指标,MOS值越高表示视频质量越好。本发明结合ITU-T Rec.P.800.1对MOS的规范要求和在实验环境下测试的视频客观指标数据与主观播放体验感知建立了MOS值计算模式,具体公式如下:
MOS=0.3*BR-0.005*PCR-0.001*MDIDF-0.057*MDILR+3.02 (3)
其中,BR为视频码率值,PCR为PCR抖动指标值,MDIDF为MDI-DF指标值,MDILR为MDI-LR指标值。
S5、分别计算路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,并根据线性关系建立故障逻辑判断知识库;具体操作如下:
S51、IPTV业务的MOS值可以判断一个机顶盒用户观看一个直播视频的质量,提取每次机顶盒播放直播视频时的MOS值,以及同一时间该机顶盒关联的每个路由器设备的性能状态、网络状态、设备端口数据。
S52、以一个时间点一个机顶盒播放视频时的MOS值、对应的性能状态、网络状态、设备端口数据作为一组数据,连续获取多组数据,作为计算样本,为了判断具体是哪个设备的哪个数据出现问题,本发明方法根据相关系数公式分别计算设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,相关系数公式如下:
Figure BDA0002183141150000071
其中,r(X,Y)为参数X和Y的线性关系值,Cov(X,Y)为参数X和Y的协方差,Var[X]为参数X的方差,Var[Y]为参数Y的方差,参数X为某次机顶盒播放直播视频时某个路由器设备的性能状态、网络状态或设备端口数据,参数Y为某次机顶盒播放直播视频时的视频MOS值。
为了保证线性关系值计算的准确性,本发明方法具体实施例中会获取一个月内该机顶盒观看该节目源的MOS值和每级设备数据来构建MOS值和设备数据的全体样本,然后计算该次MOS值的方差和设备数据的方差。
S53、根据S52计算一个月内每次机顶盒观看视频时设备数据与MOS值的线性关系值,然后分别计算路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系均值,每次计算的时候都是获取该次播放时间的前一个月内的数据,所以本发明方法的线性关系均值会根据实际业务数据滚动更新,保障线性关系均值的可靠性。
S54、本发明中将设备的性能状态、网络状态和设备端口数据统称为设备指标,即设备指标包括设备的CPU占比值、内存占比值、网络吞吐量、网络丢包率、端口状态和端口光功率等,根据具体实验时计算的线性关系均值与直播故障情况,为IPTV业务中每个路由器设备的每个设备指标设置对应的门限值,建立故障逻辑判断知识库。故障逻辑判断知识库中包含多条用于判断故障的逻辑数据,每条逻辑数据中包括至少一个设备指标名称、该设备指标门限值、该设备指标不达标的故障现象和该设备指标不达标的优化处理操作。以设备端口光功率为例,当端口光功率低于设置的门限值时,容易导致所有经过该端口的业务出现丢包率上升、时延变大、甚至网络不通的情况;丢包率上升、时延变大或网络不通就是端口光功率不达标的故障现象,端口光功率不达标的优化处理操作则包括更换尾纤、更换光模块等。
S6、输入任意一个或多个直播链路故障的机顶盒信息,根据全路径拓扑数据表和故障逻辑判断知识库定位故障点并得出故障分析结果;具体操作如下:
S61、当某一个或多个机顶盒播放直播视频出现故障时,自动计算该机顶盒故障时刻的MOS值。
S62、输入任意一个或多个直播链路故障的机顶盒信息,通过步骤S1建立的全路径拓扑结构获取该机顶盒到节目源的全路径数据,得到需要排查的每一级路由器设备的名称和端口等信息。
S63、通过全路径拓扑数据表获取该机顶盒的全路径数据中的每个路由器设备的性能状态、网络状态、设备端口数据。
S63、计算该机顶盒的全路径数据中的每个路由器设备的每个设备指标与MOS值的线性关系均值,先列出每个设备或端口与MOS值线性关系均值最大的设备指标,根据故障逻辑判断知识库筛选出线性关系均值最大的设备指标中不达标的设备或端口,输出该设备或端口名称、该指标值、以及该指标可能导致的故障现象、处理方法等数据;如果线性关系最大均值的设备指标中没有出现不达标的情况,则查找所有设备或端口中线性关系均值第二大的指标,以此类推,定位故障点并给出故障分析结果;如果遍历所有设备和端口的所有设备指标,都未找到均达标的设备指标,则判断该IPTV业务直播链路故障的原因非业务承载网络造成,需要进一步排查家庭网络和视频节目源。
本发明还提出了一种IPTV业务直播链路的自动故障定位系统,如图2所示,包括数据采集模块1、数据输入输出模块2、数据存储模块3、数据处理模块4和数据展示模块5。数据采集模块主要用于采集机顶盒的全路径数据、路由器设备的性能状态、网络状态和设备端口数据,建立IPTV业务中机顶盒到节目源的全路径拓扑数据表。数据输入输出模块,一方面用来在IPTV业务发生故障的时候,给系统输入出现故障的机顶盒信息,另一方面用来在系统完成故障定位和分析后输出直播链路中故障的路由器设备和故障分析结果。数据存储模块主要用于保存全路径拓扑结构、全路径拓扑数据表、路由器设备的性能状态、网络状态、设备端口数据、故障判断逻辑知识库、输入的机顶盒信息、输出的故障设备和故障分析结果等信息,数据存储模块一般选用关系型数据库。数据处理模块主要用于根据机顶盒的全路径数据逐级判断故障设备,生成故障判断逻辑知识库,并得到故障分析结果。数据展示模块可以选用手机端、电脑端等,可以采用网页也可以采用APP,主要用于展示发生故障的机顶盒的全路径拓扑视图,全路径拓扑视图中可以显示该机顶盒关联的每一级路由器设备以及设备的名称、端口等,如图3所示。同时在全路径拓扑视图中还会标记出故障设备、显示故障设备的数据明细表和故障分析结果,标记故障设备采用在故障设备处设置闪烁点的方式,故障设备的数据明细表根据数据展示模块展示界面的大小不同,可以是直接显示的表格,也可以是一个链接,用户点击后跳转具体的数据明细表,同理,故障分析结果也可以直接显示在故障设备附近或者通过链接跳转。
IPTV直播业务从业务总体结构上可以简单分为3部分:第一部分是家庭网络,第二部分是业务承载网络,第三部分是视频源管理平台,第二部分,也就是运营商承载网络一般都是多设备、多链路冗余的,一个机顶盒设备接入家庭网络后,向视频源/节目源地址发起播放请求时,直播数据需要经过多级的承载网络设备才能传到机顶盒中。在IPTV业务故障查询、定位中,家庭网络和业务视频源都比较好查询,因为一般一个用户故障只涉及一个机顶盒或一个视频源,但是业务承载网络涉及到的设备非常多,查询起来困难也最大,本发明方法和系统就是用来定位运营商承载网络中的故障设备和故障原因,利用机顶盒和路由器设备的功能,逐级采集机顶盒和路由器设备的数据,构建全路径拓扑数据表,通过MOS值反应机顶盒播放的视频质量,利用每个设备的数据与MOS值的线性关系,结合故障判断逻辑知识库判断设备指标是否达标,进而实现故障定位和故障分析,本发明方法和系统可以自动化的、快速的定位IPTV业务直播链路中的故障设备,提高IPTV业务故障定位的效率和准确度,减少人力投入,降低用户等待时间和企业运维成本,本发明系统还提供数据展示模块,可以直观显示机顶盒的全路径拓扑结构图,并在图中标记故障设备,显示故障设备的数据和故障分析结果,帮助运维人员直观的了解故障情况。
上面结合附图对本发明的实施方式作了详细地说明,但是本发明并不局限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (9)

1.一种IPTV业务直播链路的自动故障定位方法,其特征在于,包括以下步骤:
S1、采集IPTV业务全网路由器设备数据和端口数据,建立IPTV业务直播链路中机顶盒到节目源的全路径拓扑结构;
S2、周期性的采集全路径拓扑结构中每个路由器设备的性能状态、网络状态和设备端口数据;
S3、将每个路由器设备的性能状态、网络状态和设备端口数据与全路径拓扑结构对应,得到全路径拓扑数据表,并将全路径拓扑数据表存储在数据库中;
S4、利用视频直播时的网络和业务质量指标计算视频MOS值;
S5、分别计算路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,并根据线性关系建立故障逻辑判断知识库;
所述步骤S5的具体操作如下:
S51、提取每次机顶盒播放直播视频时的MOS值,以及同一时间该机顶盒关联的每个路由器设备的性能状态、网络状态、设备端口数据;
S52、连续获取多组数据,根据相关系数公式分别计算每个路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,相关系数公式如下:
Figure FDA0002879960380000011
其中,r(X,Y)为参数X和Y的线性关系值,Cov(X,Y)为参数X和Y的协方差,Var[X]为参数X的方差,Var[Y]为参数Y的方差,参数X为某次机顶盒播放直播视频时某个路由器设备的性能状态、网络状态或设备端口数据,参数Y为某次机顶盒播放直播视频时的视频MOS值;
S53、根据S52计算的线性关系值,分别计算每个路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系均值;
S54、根据S53的线性关系均值,设置性能状态、网络状态和设备端口数据对应的门限值,建立故障逻辑判断知识库;
S6、输入任意一个或多个直播链路故障的机顶盒信息,根据全路径拓扑数据表和故障逻辑判断知识库定位故障点并得出故障分析结果。
2.根据权利要求1所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,所述步骤S1的具体操作如下:
S11、任意选取IPTV业务直播链路中的一个机顶盒,通过业务方存储的机顶盒上联设备信息查找该机顶盒的上联路由器设备,即一级路由器;
S12、登录一级路由器查询一级路由器的路由数据,通过频道IP和频道端口获得一级路由器上联的二级路由器名称和二级路由器端口,以此类推,得到该机顶盒到节目源的全路径数据;
S13、重复步骤S11、S12,遍历IPTV业务直播链路中的每个机顶盒,利用每个机顶盒到节目源的全路径数据,建立IPTV业务直播链路中机顶盒到节目源的全路径拓扑结构。
3.根据权利要求2所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,所述全路径数据包括机顶盒名称、频道IP、频道端口、一级路由器名称、一级路由器端口、二级路由器名称、二级路由器端口、……、N级路由器名称、N级路由器端口和节目源地址。
4.根据权利要求1所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,所述性能状态包括CPU占比值、内存占比值;所述网络状态包括网络吞吐量和网络丢包率;所述设备端口数据包括端口状态、端口光功率,所述端口状态包括端口运行和端口关闭两种状态。
5.根据权利要求1所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,所述步骤S4的具体操作如下:
S41、利用监测软件抓取机顶盒播放数据,计算机顶盒播放直播频道时的网络和业务质量指标,所述网络和业务质量指标包括:MDI-LR、MDI-DF、PCR抖动、视频码率;
S42、根据网络和业务质量指标计算视频MOS值,具体公式如下:
MOS=0.3*BR-0.005*PCR-0.001*MDIDF-0.057*MDILR+3.02
其中,BR为视频码率值,PCR为PCR抖动指标值,MDIDF为MDI-DF指标值,MDILR为MDI-LR指标值。
6.根据权利要求1所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,所述故障逻辑判断知识库中包括设备指标名称、设备指标门限值、设备指标不达标的故障现象、设备指标不达标的优化处理操作。
7.根据权利要求6所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,所述设备指标包括路由器设备的性能状态、网络状态和设备端口数据。
8.根据权利要求1所述的一种IPTV业务直播链路的自动故障定位方法,其特征在于,步骤S6的具体操作如下:
S61、当机顶盒播放直播视频出现故障时,计算该机顶盒故障时刻的MOS值;
S62、输入任意一个或多个直播链路故障的机顶盒信息,通过全路径拓扑结构获取该机顶盒到节目源的全路径数据;
S63、通过全路径拓扑数据表获取该机顶盒的全路径数据中的每个路由器设备的性能状态、网络状态、设备端口数据;
S63、计算该机顶盒的全路径数据中的每个路由器设备的每个设备指标与MOS值的线性关系均值,利用故障逻辑判断知识库定位故障的设备,并得出故障分析结果。
9.一种IPTV业务直播链路的自动故障定位系统,其特征在于,包括数据采集模块、数据输入输出模块、数据存储模块、数据处理模块和数据展示模块;
所述数据采集模块,用于采集机顶盒的全路径数据、路由器设备的性能状态、网络状态和设备端口数据;
所述数据输入输出模块,用于输入出现故障的机顶盒信息,并输出直播链路中故障的设备和故障分析结果;
所述数据存储模块,用于保存全路径拓扑结构、全路径拓扑数据表、路由器设备的性能状态、网络状态、设备端口数据、故障判断逻辑知识库、输入的机顶盒信息、输出的故障设备和故障分析结果;
所述数据处理模块,用于根据机顶盒的全路径数据逐级判断故障设备,生成故障判断逻辑知识库,并得到故障分析结果;
所述数据处理模块提取每次机顶盒播放直播视频时的MOS值,以及同一时间该机顶盒关联的每个路由器设备的性能状态、网络状态、设备端口数据;连续获取多组数据,根据相关系数公式分别计算每个路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系,相关系数公式如下:
Figure FDA0002879960380000031
其中,r(X,Y)为参数X和Y的线性关系值,Cov(X,Y)为参数X和Y的协方差,Var[X]为参数X的方差,Var[Y]为参数Y的方差,参数X为某次机顶盒播放直播视频时某个路由器设备的性能状态、网络状态或设备端口数据,参数Y为某次机顶盒播放直播视频时的视频MOS值;
根据计算的线性关系值,分别计算每个路由器设备的性能状态、网络状态、设备端口数据与视频MOS值的线性关系均值;
根据计算的线性关系均值,设置性能状态、网络状态和设备端口数据对应的门限值,建立故障逻辑判断知识库;
所述数据展示模块,用于展示机顶盒的全路径拓扑视图,并在全路径拓扑视图中标记故障设备、显示故障设备的数据明细表和故障分析结果。
CN201910804122.9A 2019-08-28 2019-08-28 一种iptv业务直播链路的自动故障定位方法及其系统 Active CN110475161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910804122.9A CN110475161B (zh) 2019-08-28 2019-08-28 一种iptv业务直播链路的自动故障定位方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910804122.9A CN110475161B (zh) 2019-08-28 2019-08-28 一种iptv业务直播链路的自动故障定位方法及其系统

Publications (2)

Publication Number Publication Date
CN110475161A CN110475161A (zh) 2019-11-19
CN110475161B true CN110475161B (zh) 2021-03-09

Family

ID=68513836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910804122.9A Active CN110475161B (zh) 2019-08-28 2019-08-28 一种iptv业务直播链路的自动故障定位方法及其系统

Country Status (1)

Country Link
CN (1) CN110475161B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113014907B (zh) * 2019-12-19 2023-03-21 中国电信股份有限公司 网络协议电视故障预警方法、装置和存储介质
CN111786887A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 由控制设备执行的数据转发方法、装置、计算设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741641A (zh) * 2009-11-30 2010-06-16 北京航空航天大学 基于链路的通信网络业务可靠性试验方法
WO2010090561A1 (en) * 2009-02-05 2010-08-12 Telefonaktiebolaget L M Ericsson (Publ) Topological location discovery in an ethernet network
CN102449957A (zh) * 2011-07-25 2012-05-09 华为技术有限公司 Ip网络故障定位方法、装置及系统
CN103001811A (zh) * 2012-12-31 2013-03-27 北京启明星辰信息技术股份有限公司 故障定位方法和装置
CN104202196A (zh) * 2014-09-11 2014-12-10 德科仕通信(上海)有限公司 检测网络性能问题并定位故障节点的方法
CN104243331A (zh) * 2014-09-24 2014-12-24 国家电网公司 一种智能采集路由器及其实现方法
CN107318046A (zh) * 2016-04-27 2017-11-03 中国移动通信集团福建有限公司 一种互联网电视业务传输质量监测方法及系统
CN107659423A (zh) * 2016-07-25 2018-02-02 南京中兴新软件有限责任公司 业务处理方法及装置
CN108833202A (zh) * 2018-05-22 2018-11-16 华为技术有限公司 故障链路检测方法、装置和计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289674A (ja) * 2003-03-24 2004-10-14 Ntt Docomo Inc Ipネットワークにおけるサービス品質制御装置及びその方法並びにル−タ、サービス品質制御システム
CN107171883B (zh) * 2016-03-08 2020-04-28 华为技术有限公司 检测转发表的方法、装置和设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010090561A1 (en) * 2009-02-05 2010-08-12 Telefonaktiebolaget L M Ericsson (Publ) Topological location discovery in an ethernet network
CN101741641A (zh) * 2009-11-30 2010-06-16 北京航空航天大学 基于链路的通信网络业务可靠性试验方法
CN102449957A (zh) * 2011-07-25 2012-05-09 华为技术有限公司 Ip网络故障定位方法、装置及系统
CN103001811A (zh) * 2012-12-31 2013-03-27 北京启明星辰信息技术股份有限公司 故障定位方法和装置
CN104202196A (zh) * 2014-09-11 2014-12-10 德科仕通信(上海)有限公司 检测网络性能问题并定位故障节点的方法
CN104243331A (zh) * 2014-09-24 2014-12-24 国家电网公司 一种智能采集路由器及其实现方法
CN107318046A (zh) * 2016-04-27 2017-11-03 中国移动通信集团福建有限公司 一种互联网电视业务传输质量监测方法及系统
CN107659423A (zh) * 2016-07-25 2018-02-02 南京中兴新软件有限责任公司 业务处理方法及装置
CN108833202A (zh) * 2018-05-22 2018-11-16 华为技术有限公司 故障链路检测方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN110475161A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN101984583B (zh) 一种对单播类节目播放异常进行故障定位的方法及系统
US8867371B2 (en) Estimating physical locations of network faults
US9003460B2 (en) Network monitoring with estimation of network path to network element location
US8837302B2 (en) Mapping a network fault
US20130290783A1 (en) Estimating a Severity Level of a Network Fault
WO2017041406A1 (zh) 一种故障定位方法及装置
EP2026503A1 (en) System, apparatus and method for tracking device
CN110475161B (zh) 一种iptv业务直播链路的自动故障定位方法及其系统
CN102457390A (zh) 一种基于qoe的故障定位方法和系统
US20120188879A1 (en) Service Monitoring and Service Problem Diagnosing in Communications Network
US20150095960A1 (en) Cable Network Data Analytics System
CN102291267A (zh) 故障定位方法及装置
CN106209472A (zh) 一种宽带用户数据挖掘和预警的方法
CN104469540A (zh) 实现iptv单播业务端到端质量保障的系统
CN115277510A (zh) 自动识别网络会话中设备、设备接口、设备路径的方法
CN107846310B (zh) 一种基于客户资源树的iptv视频质差联动拨测定界方法
CN109587520A (zh) 一种定位视频业务故障的方法和设备
CN112203166A (zh) 一种多模型用户健康档案评分方法及装置
CN102123092B (zh) 一种组播性能分析方法及系统
CN109088877A (zh) 一种适用于攻击监测环境下的溯源排序算法
US8194639B2 (en) Method and apparatus for providing automated processing of a multicast service alarm
CN114124762B (zh) 一种云网超宽带质量监测方法、装置、计算机设备及存储介质
CN107317692A (zh) 故障上报方法及装置
CN109088769B (zh) 一种诊断mpls-vpn数据报文的装置
Deng et al. Online Machine Learning-Based Quality Difference Identification and Prediction Prevention for Broadband Users

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant