CN109587520B - 一种定位视频业务故障的方法和设备 - Google Patents

一种定位视频业务故障的方法和设备 Download PDF

Info

Publication number
CN109587520B
CN109587520B CN201710906813.0A CN201710906813A CN109587520B CN 109587520 B CN109587520 B CN 109587520B CN 201710906813 A CN201710906813 A CN 201710906813A CN 109587520 B CN109587520 B CN 109587520B
Authority
CN
China
Prior art keywords
index data
acquisition
fault
cluster set
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710906813.0A
Other languages
English (en)
Other versions
CN109587520A (zh
Inventor
沈爱华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201710906813.0A priority Critical patent/CN109587520B/zh
Priority to PCT/CN2018/108592 priority patent/WO2019062898A1/zh
Priority to EP18861383.0A priority patent/EP3691261A4/en
Publication of CN109587520A publication Critical patent/CN109587520A/zh
Application granted granted Critical
Publication of CN109587520B publication Critical patent/CN109587520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2404Monitoring of server processing errors or hardware failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • H04N21/6473Monitoring network processes errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4425Monitoring of client processing errors or hardware failure

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明介绍了一种定位视频业务故障的方法和设备,该方法包括:在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点;基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置。本发明解决了视频业务出现故障时无法进行定位的难题。

Description

一种定位视频业务故障的方法和设备
技术领域
本发明涉及通信技术领域,尤其涉及一种定位视频业务故障的方法和设备。
背景技术
随着通信技术和互联网技术应用不断的发展,基于IP网络的视频业务因为片源丰富、观看方便、资费灵活等特点得到蓬勃发展并被众多的家庭和个人接受与使用。基于IP网络的视频业务提供商为了要扩大市场获得更多的利润,需要大规模发展用户,要提供优质的用户视频体验和有竞争力的差异化服务。提升用户视频体验,一个重要的手段就是在视频业务出现故障时能够进行问题定位和解决问题。基于IP网络的视频业务由于视频业务链路长,中间跨越视频节目源、节目内容分发设备、骨干网、城域网、接入网、用户终端等多个节点和链路,当用户观看直播或点播视频业务出现故障时(如卡顿、时延),当前通常有下述几种方法进行故障定位:
第一种方法是在各个视频设备或链路位置部署监测设备,通过监测设备来检测归属位置的视频码流或者节点指标或者网络指标是否存在问题。该方法能够检测所监测码流或指标所在的监测点是否存在问题,但如果监测点是问题衍生监测点,则无法对问题的根源位置进行定位。
第二种方法是在用户的播放终端(如机顶盒或其他移动终端)页面预先设置频道测试页面,在出现问题时用户终端启动播放测试频道来判断测试频道所在的位置是否存在问题。该方法存在的问题有:在实际系统下可能存在上百个提供视频业务的节点位置,用户的播放终端不可能显示几百个测试频道,也不可能将所有的测试频道都执行一遍。如果是视频内容导致的问题,则通过测试频道的仿真码流或固定节目无法检测出这类故障。
第三种方法是通过对用户播放终端(如机顶盒或其他移动终端)中有问题的大量数据进行统计,再根据终端用户的网络拓扑信息,关联出故障发生集中的位置,从而实现故障定位。这个方法首先要人为确定故障阈值指标,然后才能将有故障的数据过滤出来,但实际上这个阈值是一个经验值,是一个人为确定的分类标准,事实上在有些场景下有些指标的阈值是很难准确给出的。
发明内容
本发明的主要目的在于提出一种定位视频业务故障的方法和设备,解决了视频业务出现故障时无法进行定位的难题。
为实现上述目的,本发明提供了一种定位视频业务故障的方法,所述方法包括:
在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点;
基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;
根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置。
可选的,所述根据每个采集节点的指标数据,确定出故障采集节点,包括:
根据每个采集节点的指标数据,利用K均值聚类算法,将所述多个采集节点归类到K个聚类集合中;
根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合;其中,处于所述故障聚类集合中的采集节点为故障采集节点。
可选的,所述根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合,包括:
根据每个聚类集合中的采集节点的指标数据,计算每个聚类集合的平均指标数据;
若所述指标数据为正向指标,则将平均指标数据值最大的聚类集合设置为故障聚类集合;
若所述指标数据为逆向指标,则将平均指标数据值最小的聚类集合设置为故障聚类集合。
可选的,在分别从多个采集节点中获取指标数据之前,所述方法还包括:
向所述多个采集节点发送指标数据采集任务,以供每个采集节点根据所述指标数据采集任务从所归属位置的设备中采集指标数据。
可选的,所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
此外,为实现上述目的,本发明还提出一种定位视频业务故障的设备,所述设备包括:处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的定位视频业务故障的程序,以实现以下步骤:
在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点;
基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;
根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置。
可选的,所述处理器在执行根据每个采集节点的指标数据,确定出故障采集节点的步骤时,具体包括:
根据每个采集节点的指标数据,利用K均值聚类算法,将所述多个采集节点归类到K个聚类集合中;
根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合;其中,处于所述故障聚类集合中的采集节点为故障采集节点。
可选的,所述处理器在执行根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合的步骤时,具体包括:
根据每个聚类集合中的采集节点的指标数据,计算每个聚类集合的平均指标数据;
若所述指标数据为正向指标,则将平均指标数据值最大的聚类集合设置为故障聚类集合;
若所述指标数据为逆向指标,则将平均指标数据值最小的聚类集合设置为故障聚类集合。
可选的,所述处理器还用于执行所述存储器中存储的定位视频业务故障的程序,以实现以下步骤:
在分别从多个采集节点中获取指标数据之前,向所述多个采集节点发送指标数据采集任务,以供每个采集节点根据所述指标数据采集任务从所归属位置的设备中采集指标数据。
可选的,所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
本发明提出的定位视频业务故障的方法和设备,采集视频服务指标数据,并对所采集的视频服务指标数据进行处理和分析,从而对视频业务的故障进行定位。本发明直接获取实际的节目视频指标数据并进行分析,通过对不同指标数据的分析,不仅可以定位视频节目内容本身的故障,还可以定位因为网络传输引起的故障;其次,本发明中的采集节点可以是终端(含移动终端)或者系统设备(或系统设备内部组成),采集节点每次只需要对一个视频节目进行检测,系统和网络资源占用少,可以在全网灵活经济部署。最后,本发明不依赖常规的阈值判断方法对是否为故障数据进行判断,而是通过K均值聚类算法和统计算法获取故障特征数据,最终实现故障定位。
附图说明
图1是本发明第一实施例的定位视频业务故障的方法的流程图;
图2是本发明第二实施例的定位视频业务故障的方法的流程图;
图3是本发明第三实施例的定位视频业务故障的系统的组成结构示意图;
图4是本发明第四实施例的定位视频业务故障的设备的组成结构示意图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明第一实施例,提出了一种定位视频业务故障的方法,如图1所示,所述方法具体包括以下步骤:
步骤S101:在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点。
具体的,在分别从多个采集节点中获取指标数据之前,所述方法还包括:
向所述多个采集节点发送指标数据采集任务,以供每个采集节点根据所述指标数据采集任务从所归属位置的设备中采集指标数据。
针对不同的采集任务,指标数据实际可以是一个指标或具有线性关系的多个指标;指标数据可以是视频指标,用来检测节目内容本身是否存在问题;指标数据也可以是网络指标,用来检测网络本身是否存在问题;指标数据还可以是其他类型指标,用来检测其他类型的指标是否存在问题。
所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
进一步的,所述根据每个采集节点的指标数据,确定出故障采集节点,包括:
根据每个采集节点的指标数据,利用K均值聚类算法,将所述多个采集节点归类到K个聚类集合中;其中,K为正整数。
根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合;其中,处于所述故障聚类集合中的采集节点为故障采集节点。
更进一步的,所述根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合,包括:
根据每个聚类集合中的采集节点的指标数据,计算每个聚类集合的平均指标数据;
若所述指标数据为正向指标,则将平均指标数据值最大的聚类集合设置为故障聚类集合;
若所述指标数据为逆向指标,则将平均指标数据值最小的聚类集合设置为故障聚类集合。
若指标数据为正向指标,则表示指标数据的值越小,指标数据的质量越优,指标数据的值越大,指标数据的质量越差;若指标数据为逆向指标,则表示指标数据的值越大,指标数据的质量越优,指标数据的值越小,指标数据的质量越差。
步骤S102:基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;其中,L为正整数。
步骤S103:根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置。
数量占比最多的一个或多个采集节点即为故障发生概率最大的采集节点,获取所述一个或多个采集节点所归属的位置信息,该位置即为故障发生点,即完成视频业务故障的定位。
所述位置信息包括:用户住址(地市-行政区-地名或小区)信息、或用户网络拓扑信息、或移动终端的定位信息。
优选的,根据各个采集节点的数量占比情况,可以判断故障所涉范围。如果各个采集节点的数量占比分布均匀,则为各个采集节点所属区域群体故障,如果数量占比高集中在某个采集节点,则为某个采集节点所属区域的局部故障。
本发明第二实施例,提出了一种定位视频业务故障的方法,如图2所示,所述方法具体包括以下步骤:
步骤S201:向指定的采集节点发送视频指标数据采集任务,以供采集节点根据所述视频指标数据采集任务从所归属位置的设备中采集指标数据。
具体的,在向指定的采集节点发送视频指标数据采集任务之前,所述方法还包括:
确定需要采集的采集节点、指标数据类型、采集周期和任务时间。
进一步的,所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
针对不同的采集任务,指标数据实际可以是一个指标或具有线性关系的多个指标;指标数据可以是视频指标,用来检测节目内容本身是否存在问题;指标数据也可以是网络指标,用来检测网络本身是否存在问题;指标数据还可以是其他类型指标,用来检测其他类型的指标是否存在问题。
若需要采集的节目视频是组播节目,需要设定组播地址和端口;若需要采集的节目视频是单播节目,需要设定单播节目的URL。
一个任务时间包括多个采集周期,在每个采集周期内接受采集节点发送来的指标数据,直至任务时间结束。
步骤S202:获取采集节点发送来的指标数据。
具体的,步骤S202,包括:
步骤A1:当向采集节点发送视频指标数据采集任务时,启动一个主程序,以监听各个采集节点上报的指标数据;所述主程序可以并行的处理各个采集节点上报的指标数据;
步骤A2:当主程序接收到任一采集节点上报的指标数据时,为所述采集节点设置一个子程序,以接收所述采集节点上报的指标数据,所述子程序并对接收到的指标数据进行存储;优选的,指标数据的存储结构如下所示:
采集节点N,采集时间,指标数据;
步骤A3:当所述子程序存储完指标数据后,所述子程序退出并结束;主程序继续监听所述采集节点在下个采集周期内上报的指标数据;
步骤A4:当主程序接收到所述采集节点上报的采集任务结束信息时,将所述采集节点的任务状态设置为任务结束;
步骤A5:主程序判断是否所有的采集节点的任务状态均为任务结束,若是,则主程序退出并结束,若否,则主程序继续监听其他采集节点上报的指标数据。
步骤S203:利用K均值聚类算法和统计算法对获取到的指标数据进行处理和分析,得到故障位置信息。
具体的,步骤S203,包括:
在一个采集周期内,根据获取到的各个采集节点的指标数据,利用K均值聚类算法,将各个采集节点归类到预设数量的聚类集合中,并确定出在一个采集周期内的故障聚类集合;
当任务时间结束时,根据每个采集周期的故障聚类集合,利用统计算法,统计出在各个故障聚类集合中出现次数最多的一个或多个采集节点;
根据所述一个或多个采集节点所归属的视频设备,确定出故障位置。
进一步的,所述在一个采集周期内,根据获取到的各个采集节点的指标数据,利用K均值聚类算法,将各个采集节点归类到预设数量的聚类集合中,并确定出在一个采集周期内的故障聚类集合,具体包括以下步骤:
步骤B1:设置K值,以及与K值对应数量的聚类集合;其中,K为正整数。
K值的设定取决于聚类集合的数量,K值小于等于采集任务中的采集节点的数量。
优选的,根据不同的任务需求,设置所述K值。当K=2时,所采集指标数据的质量被分为差质量和优质量两类,即设置了两个聚类集合;当K=3时,所采集指标数据的质量被分为差质量、中质量和优质量三类,即设置了三个聚类集合;当K=4时,所采集指标数据的质量被分为差质量、中质量、良质量和优质量四类,即设置了四个聚类集合。
在本实施例中,K=3,即采集节点需要划分到聚类集合A1_1{}、A2_1{}、A3_1{}中,且三个聚类集合的中心点分别为P1_1、P2_1、P3_1。
步骤B2:确定指标数据的方向属性。指标数据的方向属性包括:正向指标和逆向指标。
为了表示指标数据的大小与指标优劣的关系,需要确定指标数据的方向属性;若方向属性为正向指标,则表示指标数据的值越小,指标数据的质量越优,指标数据的值越大,指标数据的质量越差;若方向属性为逆向指标,则表示指标数据的值越大,指标数据的质量越优,指标数据的值越小,指标数据的质量越差。
步骤B3:设置结果集合D_all{},用于存放差质量的采集节点。
步骤B4:获取在一个采集周期内的各个采集节点的指标数据,计算每个采集节点的指标数据分别与各个聚类集合A1_1{}、A2_1{}、A3_1{}的中心点P1_1、P2_1、P3_1的距离D1_1、D2_1、D3_1,并将采集节点归类到与最小距离对应的聚类集合中。
将离中心点P1_1的距离D1_1最小的采集节点归类到集合A1_1{}中,将离中心点P2_1的距离D2_1最小的采集节点归类到集合A2_1{}中,离中心点P3_1的距离D3_1最小的采集节点归类到集合A3_1{}中。
优选的,可任选三个采集节点的指标数据作为聚类集合A1_1{}、A2_1{}、A3_1{}的初始中心点P1_1、P2_1、P3_1。
如果指标数据是单个指标,则指标数据的值可以看做是数轴上的点;如果指标数据是m个指标集合,则指标数据的值可以看做是m维空间上的一个点。
计算各个指标数据与中心点的距离的算法可采用以下任意一种:欧几里得距离算法、曼哈顿距离算法、闵可夫斯基距离算法或其他距离算法。
步骤B5:在各个采集节点均被归类到三个聚类集合之后,根据每个聚类集合中的采集节点的指标数据,按照算术平均算法,计算出三个聚类集合的新的中心点,并赋予P1_1、P2_1、P3_1。
即,对聚类集合A1_1{}中的采集节点的指标数据求平均数,得到新的P1_1的值;对聚类集合A2_1{}中的采集节点的指标数据求平均数,得到新的P2_1的值;对聚类集合A3_1{}中的采集节点的指标数据求平均数,得到新的P3_1的值。
步骤B6:设置聚类集合A1_2{}、A2_2{}、A3_2{},并将聚类集合A1_1{}中的采集节点列表复制到聚类集合A1_2{}中,将聚类集合A2_1{}中的采集节点列表复制到聚类集合A2_2{}中,将聚类集合A3_1{}中的采集节点列表复制到聚类集合A3_2{}中,并清空聚类集合A1_1{}、A2_1{}、A3_1{}。
步骤B7:计算每个采集节点的指标数据分别与各个聚类集合A1_1{}、A2_1{}、A3_1{}的新的中心点P1_1、P2_1、P3_1的距离D1_2、D2_2、D3_2,并将采集节点归类到与最小距离对应的集合中。
将离新的中心点P1_1距离D1_2最小的采集节点归类到集合A1_1{}中,将离新的中心点P2_1的距离D2_2最小的采集节点归类到集合A2_1{}中,离新的中心点P3_1距离D3_2最小的采集节点归类到集合A3_1{}中。
步骤B8:若A1_1{}与A1_2{}中的采集节点不一致,或者A2_1{}与A2_2{}中的采集节点不一致,或者A3_1{}与A3_2{}中的采集节点不一致,则重复执行步骤B5至步骤B7,直至A1_1{}与A1_2{}中的采集节点一致,且A2_1{}与A2_2{}中的采集节点一致,且A3_1{}与A3_2{}中的采集节点一致。
步骤B9:若指标数据的方向属性为正向指标,则比较P1_1和P3_1的大小,值较大所对应的聚类集合为故障聚类集合,并将故障聚类集合中的采集节点添加到结果集合D_all{}中;
若指标数据的方向属性为逆向指标,则比较P1_1和P3_1的大小,值较小所对应的聚类集合为故障聚类集合,并将故障聚类集合中的采集节点添加到结果集合D_all{}中;
D_all{}中存储的是本次采集周期内指标数据差质量的采集节点。
更进一步的,所述当任务时间结束时,根据每个采集周期的故障聚类集合,利用统计算法,统计出在各个故障聚类集合中出现次数最多的一个或多个采集节点,具体包括:
统计结果集合D_all{}中出现次数最多的一个或多个采集节点。出现次数最多的一个或多个采集节点即为故障发生概率最大的采集节点,获取所述一个或多个采集节点所归属的位置信息,该位置即为故障发生点,即完成视频业务故障的定位。
所述位置信息包括:用户住址(地市-行政区-地名或小区)信息、或用户网络拓扑信息、或移动终端的定位信息。
优选的,根据各个采集节点的数量占比情况,可以判断故障所涉范围。如果各个采集节点的数量占比分布均匀,则为各个采集节点所属区域群体故障,如果数量占比高集中在某个采集节点,则为某个采集节点所属区域的局部故障。
本发明第三实施例,提出了一种定位视频业务故障的系统,如图3所示,所述系统具体包括以下组成部分:管理模块301、采集模块302、获取模块303和处理模块304。
其中,管理模块301,用于管理多个采集模块302,并同时向多个指定的采集模块302发送视频指标数据采集任务。
采集模块302,用于根据所述视频指标数据采集任务从所归属位置的视频设备中采集指标数据。优选的,采集模块302向所归属位置的视频设备发送视频播放请求,并在所归属位置的视频设备播放视频的过程中采集节目的指标数据,并将采集到的指标数据上报给获取模块303。
获取模块303,用于获取采集模块302发送来的指标数据。
处理模块304,用于利用K均值聚类算法和统计算法对获取到的指标数据进行处理和分析,得到故障位置信息。
优选的,管理模块301、获取模块303和处理模块304为通用服务器,组成一个服务器集群,服务器集群可以支持平滑增加服务器,以增加获取模块或处理模块的处理能力。
采集模块302根据服务器集群中的管理模块301下发的视频指标数据采集任务获取指标数据,然后将获取到的指标数据上报到服务器集群。服务器集群中的获取模块303接收采集模块302上报的指标数据;处理模块304对取模块303获取到的指标数据进行聚类分析处理,并最终实现故障定位。
具体的,管理模块301包括:维护单元和任务模块;
1)所述维护单元,用于新增、删除、修改和控制采集模块,并显示采集模块的当前任务状态。
其中,新增采集模块包括:新增采集模块的名称、IP地址和归属位置;可通过所述维护单元对新增采集模块的名称、IP地址和归属位置进行配置,也可通过所述维护单元从采集模块中自动获取新增采集模块的名称、IP地址和归属位置进行配置。
控制采集模块包括:禁用、启动和停止采集模块。
任务状态包括:无任务、预约任务、例行任务、任务执行中和任务结束。当采集模块启动时,采集模块的当前任务状态为“例行任务”。
2)所述任务模块,用于确定参与本次采集任务的采集模块、确定需要采集的节目视频、确定需要采集的指标数据类型、并确定本次采集任务的任务启动模式、采集周期和任务时间。
优选的,针对不同的采集任务,指标数据实际可以是一个指标或具有线性关系的多个指标;指标数据可以是视频指标,用来检测节目内容本身是否存在问题;指标数据也可以是网络指标,用来检测网络本身是否存在问题;指标数据还可以是其他类型指标,用来检测其他类型的指标是否存在问题。
若需要采集的节目视频是组播节目,任务模块需要设定组播地址和端口;若需要采集的节目视频是单播节目,任务模块需要设定单播节目的URL。
任务启动模式包括:立即启动、预约启动和例行任务。立即启动是指,任务模块立即向设定的一个或多个采集模块同时发送采集任务;预约启动是指,任务模块在预约的时间向设定的一个或多个采集模块同时发送采集任务;例行任务是指,采集模块不需要任务模块发送采集任务而例行采集指标数据。
当管理模块发送采集任务后,管理模块显示采集模块的当前任务状态为“任务中”;当所有采集模块的采集任务完成后,管理模块显示采集模块的当前任务状态为“任务结束”;当采集模块的任务状态设置为“任务结束”时,处理模块开始对采集到的指标数据进行处理和分析。
进一步的,采集模块302具体用于:
采集模块302在接收到管理模块301发送来的视频指标数据采集任务后,获取管理模块301配置的节目视频、指标数据类型、采集周期和任务时间;并在一个采集周期内,获取节目视频的视频码流,并对获取到的视频码流进行实时解码和计算,以得到指标数据。
优选的,若节目视频为组播节目,则采集模块302加入组播组以获取组播视频码流;若节目视频为单播节目,则采集模块302访问单播节目URL以获取单播视频码流。
其中,一个任务时间包含多个采集周期,采集模块302在进入下一个采样周期之前,判断是否已到达任务时间,若是,则将任务结束消息上报到管理模块301,若否,则进入下一个采集周期。
优选的,采集模块302为外置的通用服务器,可以部署在任何需要采集视频码流数据的位置,如流媒体节点设备位置、网络设备位置或者视频码流经过的网路路径。其中,流媒体节点设备可以提供点播或直播(组播或单播)视频业务服务,网络设备可以提供组播直播服务。
采集模块302可以是流媒体节点设备的一个组成模块,也可以是流媒体节点设备外部独立部署的服务器;也可以是网络设备的一个组成模块,也可以是网络设备外部独立部署的计算机设备。此外,采集模块302还可以是终端设备(含移动设备),如机顶盒、电脑、手机、平板以及其他终端设备。
进一步的,获取模块303具体用于:
当管理模块301向采集模块302发送视频指标数据采集任务时,启动一个主程序,以监听各个采集模块上报的指标数据;所述主程序可以并行的处理各个采集模块上报的指标数据;
当主程序接收到任一采集模块上报的指标数据时,为所述采集模块设置一个子程序,以接收所述采集模块上报的指标数据,所述子程序并对接收到的指标数据进行存储;优选的,指标数据的存储结构如下所示:
采集模块N,采集时间,指标数据;
当所述子程序存储完指标数据后,所述子程序退出并结束;主程序继续监听所述采集模块在下个采集周期内上报的指标数据;
当主程序接收到所述采集模块上报的采集任务结束信息时,将所述采集模块的任务状态设置为任务结束;
主程序判断是否所有的采集模块的任务状态均为任务结束,若是,则主程序退出并结束,若否,则主程序继续监听其他采集模块上报的指标数据。
进一步的,处理模块304具体包括:
归类单元,用于在一个采集周期内,根据获取到的各个采集模块的指标数据,利用K均值聚类算法,将各个采集模块归类到预设数量的聚类集合中,并确定出在一个采集周期内的故障聚类集合;
统计单元,用于当任务时间结束时,根据每个采集周期的故障聚类集合,利用统计算法,统计出在各个故障聚类集合中出现次数最多的一个或多个采集模块;
确定单元,用于根据所述一个或多个采集模块所归属的视频设备,确定出故障位置。
更进一步的,所述归类单元,具体包括:
第一归类子单元,用于计算每个采集模块的指标数据与各个聚类集合的中心点的距离,并将所述采集模块归类到与最小距离所对应的聚类集合中;
计算子单元,用于在将所有采集模块归类到不同的聚类集合之后,根据每个聚类集合中的采集模块的指标数据,按照算术平均算法计算出每个聚类集合的新的中心点;
第二归类子单元,用于计算每个采集模块的指标数据与各个聚类集合的新的中心点的距离,并将所述采集模块重新归类到与最小距离所对应的聚类集合中;
判断子单元,用于判断两次归类的结果是否相同,若否,则重复调用计算子单元和第二归类子单元,直至连续两次归类的结果相同;
确定子单元,用于根据指标数据的方向属性以及各个聚类集合的中心点,确定出故障聚类集合。
本发明第四实施例,提出了一种定位视频业务故障的设备,如图4所示,所述设备具体包括:处理器401、存储器402及通信总线;
所述通信总线用于实现处理器401和存储器402之间的连接通信;
处理器401用于执行存储器402中存储的定位视频业务故障的程序,以实现以下步骤:
在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点;
基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;
根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置。
具体的,处理器401在执行根据每个采集节点的指标数据,确定出故障采集节点的步骤时,具体包括:
根据每个采集节点的指标数据,利用K均值聚类算法,将所述多个采集节点归类到K个聚类集合中;
根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合;其中,处于所述故障聚类集合中的采集节点为故障采集节点。
进一步的,处理器401在执行根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合的步骤时,具体包括:
根据每个聚类集合中的采集节点的指标数据,计算每个聚类集合的平均指标数据;
若所述指标数据为正向指标,则将平均指标数据值最大的聚类集合设置为故障聚类集合;
若所述指标数据为逆向指标,则将平均指标数据值最小的聚类集合设置为故障聚类集合。
进一步的,处理器401还用于执行存储器402中存储的定位视频业务故障的程序,以实现以下步骤:
在分别从多个采集节点中获取指标数据之前,向所述多个采集节点发送指标数据采集任务,以供每个采集节点根据所述指标数据采集任务从所归属位置的设备中采集指标数据。
更进一步的,所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
上述流程,是实现本发明的实施例,并不是限定只能用上述实施例来实现,本方实施例中也不限定具体流程执行的方法,本发明实施例还可以用类似的方式实现,例如将单元替换为设备、软件、模块、组件。更改本发明实施例中记载的各种消息的名称、类型等,这仅仅是命名形式的变化,仍然属于本发明的保护范围。
上述实施例,网络相关的,可适用于基于IEEE 802.3、IEEE 802.11b/g/n、电力线网路(POWELINE)、电缆(CABLE)、公共交换电话网络(PSTN,PublicSwitched TelephoneNetwork)、第三代合作伙伴计划(3GPP,3rd GenerationPartnership Project,)网络、3GPP2网络等通讯网络所支持的IP网络,各装置的操作系统可适用于UNIX类操作系统、WINDOWS类操作系统、ANDROID类操作系统、IOS操作系统,对消费者接口可适用于JAVA语言接口等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
当然,本发明还可有其他多种实施,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明,做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (8)

1.一种定位视频业务故障的方法,其特征在于,所述方法包括:
在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点;
基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;
根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置;
其中,所述根据每个采集节点的指标数据,确定出故障采集节点,包括:
根据每个采集节点的指标数据,利用K均值聚类算法,将所述多个采集节点归类到K个聚类集合中;
根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合;其中,处于所述故障聚类集合中的采集节点为故障采集节点。
2.根据权利要求1所述的定位视频业务故障的方法,其特征在于,所述根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合,包括:
根据每个聚类集合中的采集节点的指标数据,计算每个聚类集合的平均指标数据;
若所述指标数据为正向指标,则将平均指标数据值最大的聚类集合设置为故障聚类集合;
若所述指标数据为逆向指标,则将平均指标数据值最小的聚类集合设置为故障聚类集合。
3.根据权利要求1所述的定位视频业务故障的方法,其特征在于,在分别从多个采集节点中获取指标数据之前,所述方法还包括:
向所述多个采集节点发送指标数据采集任务,以供每个采集节点根据所述指标数据采集任务从所归属位置的设备中采集指标数据。
4.根据权利要求1~3中任一项所述的定位视频业务故障的方法,其特征在于,所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
5.一种定位视频业务故障的设备,其特征在于,所述设备包括:处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的定位视频业务故障的程序,以实现以下步骤:
在每个采集周期内,分别从多个采集节点中获取指标数据,并根据每个采集节点的指标数据,确定出故障采集节点;
基于在连续的L个采集周期中确定出的故障采集节点,统计数量占比最多的故障采集节点;
根据统计出的数量占比最多的故障采集节点的位置信息,确定出视频业务故障位置;
其中,所述根据每个采集节点的指标数据,确定出故障采集节点,包括:
根据每个采集节点的指标数据,利用K均值聚类算法,将所述多个采集节点归类到K个聚类集合中;
根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合;其中,处于所述故障聚类集合中的采集节点为故障采集节点。
6.根据权利要求5所述的定位视频业务故障的设备,其特征在于,所述处理器在执行根据每个聚类集合中的采集节点的指标数据,从K个聚类集合中确定一个为故障聚类集合的步骤时,具体包括:
根据每个聚类集合中的采集节点的指标数据,计算每个聚类集合的平均指标数据;
若所述指标数据为正向指标,则将平均指标数据值最大的聚类集合设置为故障聚类集合;
若所述指标数据为逆向指标,则将平均指标数据值最小的聚类集合设置为故障聚类集合。
7.根据权利要求5所述的定位视频业务故障的设备,其特征在于,所述处理器还用于执行所述存储器中存储的定位视频业务故障的程序,以实现以下步骤:
在分别从多个采集节点中获取指标数据之前,向所述多个采集节点发送指标数据采集任务,以供每个采集节点根据所述指标数据采集任务从所归属位置的设备中采集指标数据。
8.根据权利要求5~7中任一项所述的定位视频业务故障的设备,其特征在于,所述采集节点设置在流媒体节点设备位置、网络设备位置和视频码流经过的网络路径上。
CN201710906813.0A 2017-09-29 2017-09-29 一种定位视频业务故障的方法和设备 Active CN109587520B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201710906813.0A CN109587520B (zh) 2017-09-29 2017-09-29 一种定位视频业务故障的方法和设备
PCT/CN2018/108592 WO2019062898A1 (zh) 2017-09-29 2018-09-29 一种定位视频业务故障的方法、设备及存储介质
EP18861383.0A EP3691261A4 (en) 2017-09-29 2018-09-29 METHOD AND DEVICE FOR LOCATING VIDEO SERVICE FAULT, AND STORAGE MEDIA

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710906813.0A CN109587520B (zh) 2017-09-29 2017-09-29 一种定位视频业务故障的方法和设备

Publications (2)

Publication Number Publication Date
CN109587520A CN109587520A (zh) 2019-04-05
CN109587520B true CN109587520B (zh) 2021-06-22

Family

ID=65900555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710906813.0A Active CN109587520B (zh) 2017-09-29 2017-09-29 一种定位视频业务故障的方法和设备

Country Status (3)

Country Link
EP (1) EP3691261A4 (zh)
CN (1) CN109587520B (zh)
WO (1) WO2019062898A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112583642B (zh) * 2020-12-10 2023-05-05 广州虎牙科技有限公司 异常检测方法、模型、电子设备及计算机可读存储介质
CN114071123A (zh) * 2021-11-05 2022-02-18 中国人民解放军63856部队 基于仿真测试环境的信息化装备视频调度故障检测方法
CN115412430B (zh) * 2022-08-08 2024-06-07 中国电信股份有限公司 异常节点的定位方法、装置、电子设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7287180B1 (en) * 2003-03-20 2007-10-23 Info Value Computing, Inc. Hardware independent hierarchical cluster of heterogeneous media servers using a hierarchical command beat protocol to synchronize distributed parallel computing systems and employing a virtual dynamic network topology for distributed parallel computing system
CN102137282A (zh) * 2010-12-15 2011-07-27 华为技术有限公司 一种检测故障链路的方法、装置、节点和系统
CN102137414A (zh) * 2010-06-25 2011-07-27 华为技术有限公司 一种移动视频业务时延的评估方法和装置
CN102143389A (zh) * 2011-04-22 2011-08-03 赛特斯网络科技(南京)有限责任公司 Iptv服务质量保障系统及质量保障方法
CN102291594A (zh) * 2011-08-25 2011-12-21 中国电信股份有限公司上海信息网络部 一种ip网络视频质量的检测评估系统与方法
CN106789223A (zh) * 2016-12-13 2017-05-31 中国联合网络通信集团有限公司 一种交互式网络电视iptv业务质量检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106443332A (zh) * 2016-09-09 2017-02-22 长春工程学院 小电流接地系统故障定位方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7287180B1 (en) * 2003-03-20 2007-10-23 Info Value Computing, Inc. Hardware independent hierarchical cluster of heterogeneous media servers using a hierarchical command beat protocol to synchronize distributed parallel computing systems and employing a virtual dynamic network topology for distributed parallel computing system
CN102137414A (zh) * 2010-06-25 2011-07-27 华为技术有限公司 一种移动视频业务时延的评估方法和装置
CN102137282A (zh) * 2010-12-15 2011-07-27 华为技术有限公司 一种检测故障链路的方法、装置、节点和系统
CN102143389A (zh) * 2011-04-22 2011-08-03 赛特斯网络科技(南京)有限责任公司 Iptv服务质量保障系统及质量保障方法
CN102291594A (zh) * 2011-08-25 2011-12-21 中国电信股份有限公司上海信息网络部 一种ip网络视频质量的检测评估系统与方法
CN106789223A (zh) * 2016-12-13 2017-05-31 中国联合网络通信集团有限公司 一种交互式网络电视iptv业务质量检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Fault Identification of Power Grid Based on Wide-Area Differential Current and K-Means Clustering;Hao Wu, Qunzhan Li;《Energy and Power Engineering》;20170406;19-29 *
基于广域状态信息和模糊C均值聚类的电网故障区域判别;吴浩;《电力自动化设备》;20130731;39-45 *

Also Published As

Publication number Publication date
EP3691261A4 (en) 2021-02-17
CN109587520A (zh) 2019-04-05
WO2019062898A1 (zh) 2019-04-04
EP3691261A1 (en) 2020-08-05

Similar Documents

Publication Publication Date Title
JP2022511748A (ja) ネットワーク性能ボトルネック値を決定するための方法および装置
CN107277160A (zh) 一种内容分发网络节点切换方法与装置
CN109587520B (zh) 一种定位视频业务故障的方法和设备
CN101984583A (zh) 一种对单播类节目播放异常进行故障定位的方法及系统
US9641405B2 (en) System and method for sequencing per-hop data in performance-monitored network environments
CN107704387B (zh) 用于系统预警的方法、装置、电子设备及计算机可读介质
US9497451B2 (en) Cable network data analytics system
CN103493433A (zh) 通信网络中服务的服务质量监测的方法和设备
US9104565B2 (en) Fault tracing system and method for remote maintenance
CN110620699B (zh) 消息到达率确定方法、装置、设备和计算机可读存储介质
CN112491719A (zh) 网络节点的选择方法、设备及存储介质
CN114679592A (zh) 边缘集群调度方法及装置
CN114430383B (zh) 探测节点筛选方法、装置、电子设备和存储介质
CN111585819A (zh) 一种配网通信设备故障分析方法和系统
CN110943877B (zh) 网络状态测量方法、设备及系统
CN112911272B (zh) Iptv群障预警方法和系统
CN109831335B (zh) 一种数据监控方法、监控终端、存储介质及数据监控系统
CN108667873B (zh) 一种分流方法、分流装置、电子设备和可读存储介质
CN112312209B (zh) 综合告警生成方法、装置、服务器、存储介质
KR20190004970A (ko) 네트워크품질 데이터 기반 실시간 고장원인분석 시스템 및 방법
CN113515425A (zh) 数据动态上报的方法和装置
CN113727092A (zh) 基于决策树的视频监控质量巡检方法及装置
CN115114316A (zh) 一种高并发数据的处理方法、装置、集群和存储介质
WO2021056435A1 (zh) 用于异常检测的方法和装置
CN112104470A (zh) 一种网络设备故障定位方法及数字家庭业务分析平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant