CN107493183A - 一种故障定位方法及装置 - Google Patents

一种故障定位方法及装置 Download PDF

Info

Publication number
CN107493183A
CN107493183A CN201610412816.4A CN201610412816A CN107493183A CN 107493183 A CN107493183 A CN 107493183A CN 201610412816 A CN201610412816 A CN 201610412816A CN 107493183 A CN107493183 A CN 107493183A
Authority
CN
China
Prior art keywords
terminal device
failure
information
status
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610412816.4A
Other languages
English (en)
Other versions
CN107493183B (zh
Inventor
彭勇
李新明
陈芳
季海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Beijing Co Ltd
Original Assignee
China Mobile Group Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Beijing Co Ltd filed Critical China Mobile Group Beijing Co Ltd
Priority to CN201610412816.4A priority Critical patent/CN107493183B/zh
Publication of CN107493183A publication Critical patent/CN107493183A/zh
Application granted granted Critical
Publication of CN107493183B publication Critical patent/CN107493183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种故障定位方法及装置,可获取用于表示终端设备的服务质量的状态信息,所述状态信息包括播放状态信息、通信状态信息以及运行状态信息,并根据获取到的所述状态信息,确定所述终端设备对应的故障类型,而无需通过询问用户、上门检测等方式到现场进行抓包检查,从而解决了现有的互联网电视业务故障定位方法所存在的故障定位困难、耗时较长以及效率较低等的问题,节省了故障定位的时间、提高了故障定位的效率以及用户的体验。

Description

一种故障定位方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种故障定位方法及装置。
背景技术
互联网电视业务是通过互联网电视机顶盒接入网络、从视频CDN(ContentDelivery Network,内容分发网络)服务器中获取点播或直播内容,并通过电视终端显示给用户的业务。与传统的家庭宽带互联网业务相比,互联网电视业务具有数字媒体服务质量高(接近DVD水平)、功能广泛的特点。但是,由于互联网电视业务的涉及面较广(如各级内容的提供商、网络的运营商以及电视机顶盒等),因而可能会出现的故障种类也较多,这就无疑给互联网电视业务的故障定位及处理带来了困难和挑战。
目前,业内对于互联网电视业务的故障处理方式还沿袭着对家庭宽带互联网业务的处理思路,即,一方面通过简单的ping、trace等操作,检查网络中是否存在丢包,另一方面通过对网络链路的检查,确定网络链路中是否存在告警信息或异常信息,以判断是否发生故障。
但是,传统的家庭宽带互联网业务是通过PC接入网络的,通常可实现基础的网络测试,而互联网电视业务是通过终端机顶盒接入网络的,即,一旦出现播放故障,往往涉及到机顶盒本身性能、运营商接入网络以及视频CDN服务器性能等多个方面,需要故障定位人员通过询问用户、上门检测等方式到现场进行抓包检查,从而导致会出现故障定位困难、处理时间较长以及效率较低等的问题。
也就是说,现有的互联网电视业务故障定位方法存在定位困难、耗时较长以及效率较低等的问题。
发明内容
本发明实施例提供了一种故障定位方法,用以解决现有的互联网电视业务故障定位方法所存在的定位困难、耗时较长以及效率较低等的问题。
本发明实施例提供了一种故障定位方法,包括:
获取用于表示终端设备的服务质量的状态信息;所述状态信息包括播放状态信息、通信状态信息以及运行状态信息;
若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障;
若根据获取到的所述状态信息,确定所述终端设备的播放状态以及运行状态不正常、但通信状态正常,则确定所述终端设备对应的故障为终端型故障。
本发明实施例还提供了一种故障定位装置,包括:
状态信息获取模块,用于获取用于表示终端设备的服务质量的状态信息;所述状态信息包括播放状态信息、通信状态信息以及运行状态信息;
故障类型定位模块,用于若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障;以及,若根据获取到的所述状态信息,确定所述终端设备的播放状态以及运行状态不正常、但通信状态正常,则确定所述终端设备对应的故障为终端型故障。
本发明有益效果如下:
本发明实施例提供了一种故障定位方法及装置,可获取用于表示终端设备的服务质量的状态信息,所述状态信息包括播放状态信息、通信状态信息以及运行状态信息,并根据获取到的所述状态信息,确定所述终端设备对应的故障类型,而无需通过询问用户、上门检测等方式到现场进行抓包检查,从而解决了现有的互联网电视业务故障定位方法所存在的故障定位困难、耗时较长以及效率较低等的问题,节省了故障定位的时间、提高了故障定位的效率以及用户的体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示为本发明实施例一中的故障定位方法的流程示意图;
图2所示为终端设备与故障定位装置之间的状态报文的传输示意图;
图3所示为本发明实施例一中的故障定位方法的另一种可能的流程示意图;
图4所示为获取终端设备的位置信息的流程示意图;
图5所示为本发明实施例二中的故障定位装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一:
为了解决现有的故障定位方法所存在的定位困难、耗时较长以及效率较低等的问题,本发明实施例一提供了一种故障定位方法,所述故障定位方法可适用于互联网电视业务的故障定位,如图1所示,其为本发明实施例一中所述的故障定位方法的流程示意图。具体地,由图1所示,所述故障定位方法可包括以下步骤:
步骤101:获取用于表示终端设备的服务质量的状态信息;所述状态信息包括播放状态信息、通信状态信息以及运行状态信息;
步骤102:若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障;若根据获取到的所述状态信息,确定所述终端设备的播放状态以及运行状态不正常、但通信状态正常,则确定所述终端设备对应的故障为终端型故障。
也就是说,可获取用于表示终端设备的服务质量的状态信息,所述状态信息包括播放状态信息、通信状态信息以及运行状态信息,并根据获取到的所述状态信息,确定所述终端设备对应的故障类型,而无需通过询问用户、上门检测等方式到现场进行抓包检查,从而解决了现有的互联网电视业务故障定位方法所存在的故障定位困难、耗时较长以及效率较低等的问题,节省了故障定位的时间、提高了故障定位的效率以及用户的体验。
下面,将对本发明实施例中的各步骤进行详细说明:
需要说明的是,本发明实施例一中所述故障定位方法的执行主体可为故障定位装置,所述故障定位装置可为独立于所述终端设备的独立装置,也可为集成在所述终端设备中的集成装置;另外,所述终端设备可为机顶盒等互联网电视业务终端,对此不作任何限定。
可选地,所述播放状态信息至少可包括播放、卡顿、缓冲、暂停、快进以及快退中的任意一种或多种,当所述播放状态信息为卡顿、缓冲、暂停、快进以及快退等时,可认为播放状态不正常,当所述播放状态信息为播放时,可认为播放状态正常,对此不作赘述。
进一步地,所述播放状态信息通常可通过所述终端设备发送的状态报文获取,所述状态报文是所述终端设备在播放事件发生的时间点,向所述故障定位装置发送的报文,其书写格式通常可为XML(Extensible Markup Language,可扩展标记语言)格式。
需要说明的是,为了使得所述状态报文能够在非ASCII(American Standard Codefor Information Interchange,美国标准信息交换代码)编码系统中正常传输,所述状态报文通常可按照UTF-8(8-bit Unicode Transformation Format,可变长度字符编码)格式进行编码,对此不作赘述。
例如,所述状态报文可为:
<videoplayer_state>
<type>Play</type>
<contentid>4890526699577299046</contented>
<utcsecond>1420699684</utcsecond>
<name>大清帝国</name>
<url>http://221.181.100.149:107/000000001000/4890526699577299046/3000356495.m3u8</url>
<bitrate>4000000</bitrate>
<width>1920</width>
<height>1080</height>
<videocodec>H264</videocodec>
<audiocodec>AAC</audiocodec>
</videoplayer_state>
需要说明的是,所述终端设备可在播放事件发生的时间点立刻将相应的状态报文发送给所述故障定位装置,而无需等待所述故障定位装置下发的状态报文获取指示,对此不作赘述。
另外,所述终端设备可通过创建的套接字将所述状态报文发送至所述故障定位装置,即,所述终端设备可相当于客户端、所述故障定位装置可相当于服务器端,对此不作任何赘述。
其中,所述终端设备创建的套接字可为:
sock=socket(PF_LOCAL,SOCK_DGRAM,0);
name.sun_family=AF_LOCAL;
name.sun_path=″/data/video_player_states.sock″。
进一步地,所述终端设备可采用无连接的UDP(User Datagram Protocol,用户数据报协议)套接字的方式实现所述终端设备与所述故障定位装置之间的信息传输,具体的传输方式可如图2所示,对此不作赘述。
可选地,所述通信状态信息至少可包括TCP(Transmission Control Protocol,传输控制协议)连接时延、HTTP(HyperText Transfer Protocol,超文本传输协议)响应时延、TCP重传率、TCP低窗口数据包个数、HLS(HTTP Live Streaming,流媒体网络传输协议)分片下载时长以及M3U8请求次数中的任意一种或多种。
需要说明的是,可通过网络抓包和协议解析,对所述终端设备的各个通信端口进行实时侦听,以获取表征所述终端的通信状态的各项网络协议KPI(Key PerformanceIndicators,关键绩效指标)。例如,通过对所述终端设备的各个通信端口的实施侦听,获取所述终端设备与视频CDN服务器之间的TCP连接时延、HTTP响应时延、TCP重传率、TCP低窗口数据包个数、视频流中HLS分片下载时长、以及播放列表M3U8的请求次数等,本发明实施例对此不作赘述。
具体地,当表征所述终端设备的通信状态的多个通信状态信息中的任意一个或多个通信状态信息(即网络协议KPI)不在正常范围内时(如不小于其所对应的阈值时),则可认为所述终端设备的通信状态为不正常状态,例如TCP连接时延不小于设定的TCP重传率阈值、HTTP响应时延不小于设定的HTTP响应时延阈值、TCP重传率不小于设定的TCP重传率阈值、TCP低窗口数据包个数不小于设定的TCP低窗口数据包个数、HLS分片下载时长不小于设定的HLS分片下载时长(即,HLS分片下载时长超过HLS分片播放时长)或者M3U8请求次数不小于设定的M3U8请求次数阈值等;
当表征所述终端设备的通信状态的各通信状态信息(即网络协议KPI)均在正常范围内时(如均小于其所对应的阈值时),则可认为所述终端设备的通信状态为正常状态,例如,TCP连接时延小于设定的TCP重传率阈值、HTTP响应时延小于设定的HTTP响应时延阈值、TCP重传率小于设定的TCP重传率阈值、TCP低窗口数据包个数小于设定的TCP低窗口数据包个数、HLS分片下载时长小于设定的HLS分片下载时长(即,HLS分片下载时长不超过HLS分片播放时长)以及M3U8请求次数小于设定的M3U8请求次数阈值等。
可选地,所述运行状态信息可包括内存占用率和/或CPU(Central ProcessingUnit,中央处理器)使用率。
具体地,当内存占用率小于设定的内存占用率阈值、且CPU占用率小于设定的CPU占用率阈值时,则可认为所述终端设备的运行状态为正常状态,当内存占用率不小于设定的内存占用率阈值、或者CPU占用率不小于设定的CPU占用率阈值时,则可认为所述终端设备的运行状态为不正常状态。
可选地,以所述终端设备为基于Android系统的安卓设备为例,可通过安卓命令读取所述终端设备的运行状态信息,来确定所述终端设备的内存占用状态以及CPU占用状态。具体地,由于安卓设备的内存/CPU信息通常可存放在系统的/proc/meminfo文件夹中,因而,可通过安卓命令读取系统的/proc/meminfo文件夹中的信息,来确定所述终端设备的内存占用状态以及CPU占用状态。
例如,可通过如下方式获取所述终端设备的内存大小:
public void getTotalMemory(){
String str1=″/proc/meminfo″;
String str2=″″;
try{
FileReader fr=new FileReader(str1);
BufferedReader localBufferedReader=new BufferedReader(fr,8192);
while((str2=localBufferedReader.readLine())!=null){
Log.i(TAG,″---″+str2);
}
}catch(IOException e){
}
}
相应地,还可通过如下方式获取所述终端设备的剩余内存大小:
public long get AvailMemory(){
ActivityManager am=(ActivityManager)mContext.getSystemService(Context.ACTIVITY_SERVICE);
ActivityManager.MemoryInfo mi=new ActivityManager.MemoryInfo();
am.getMemoryInfo(mi);
return mi.availMem;
}
类似地,可通过如下方式获取所述终端设备的CPU信息:
public String[]getCpuInfo(){
String str1=″/proc/cpuinfo″;
String str2=″″;
String[]cpuInfo={″″,″″};
String[]arrayOfString;
try{
FileReader fr=new FileReader(str1);
BufferedReader localBufferedReader=new BufferedReader(fr,8192);
str2=localBufferedReader.readLine();
arrayOfString=str2.split(″\\s+″);
for(int i=2;i<arrayOfString.length;i++){
cpuInfo[0]=cpuInfo[0]+arrayOfString[i]+″″;
}
str2=localBufferedReader.readLine();
arrayOfString=str2.split(″\\s+″);
cpuInfo[1]+=arrayOfString[2];
localBufferedReader.close();
}catch(IOException e){
}
return cpuInfo;
}
进一步地,为了使得定位的故障类型更为精确,提高故障处理的效率,还可对故障类型进行细分,如所述业务型故障还可细分为网络型故障以及服务型故障等。其中,需要说明的是,所述网络型故障主要可包括在传输过程中出现的各种网络故障,如带宽不足、TCP重传率较低、TCP低窗口数据包个数较多等,服务型故障主要可包括视频提供源出现的故障,如CDN服务器故障,视频资源平台故障等。
进一步地,为了更清楚地说明本实施例中所涉及的各种故障类型,下面可结合表1对本发明实施例中所述终端设备的各种常见故障进行详细地说明。
表1终端设备的常见故障汇总表
具体地,由表1可知,常见的互联网电视业务的故障类型可分为服务型故障、网络型故障以及终端型故障,故障的原因有来自视频服务器的、网络传输的、以及终端设备自身的。其中,TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长均是用于表征网络性能状态的指标,若其中的一个或多个不小于其所对应的阈值时,即可认为所述终端设备所在的网络存在问题;HTTP响应时延以及M3U8请求次数均是用于表征服务器性能状态的指标,若其中的一个或全部不小于其所对应的阈值时,即可认为所述终端设备所对应的服务器存在问题。因此,在进行终端设备的故障定位与处理时,通常需要首先确定所述终端设备的播放状态、通信状态(服务器状态以及IP网络状态)以及运行状态,且,在确定所述终端设备对应的故障为业务型故障时,还可结合表1,进一步确定所述终端设备对应的故障类型,以提高故障定位的准确性。
也就是说,若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障,可包括:
若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长中的任意一种或多种不小于其所对应的阈值、且HTTP响应时延以及M3U8请求次数均小于其所对应的阈值,则确定所述终端设备对应的故障为网络型故障;
若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长均小于其所对应的阈值,且HTTP响应时延和/或M3U8请求次数不小于其所对应的阈值,则确定所述终端设备对应的故障为服务型故障。
需要说明的是,由于通常情况下,终端设备的各种故障状态均会体现在终端设备的播放状态上面,因而,可仅在播放状态出现故障警告时,对互联网电视进行故障定位即可。
例如,假设根据获取到的所述状态信息,确定所述终端设备的播放状态正常,则可说明所述终端设备的通信状态以及运行状态均正常,即无需对所述终端设备进行故障定位;或者,假设根据获取到的所述状态信息,确定所述所述终端设备的播放状态不正常,但是通信状态以及运行状态均正常,则可说明所述终端设备当前的播放状态为用户行为,如可为用户点击的快进、暂停、快退等,即无需对所述终端设备进行故障的定位。也就是说,在上述情况下,终端设备并未处于故障状态,从而还能节省定位的成本。
进一步地,由于故障类型还可包括个体型故障以及区域型故障,若仅仅根据播放状态信息、通信状态信息以及运行状态信息对终端设备的故障进行定位时,可能会存在定位出的故障位置不够精确的问题,因此,在确定所述终端设备对应的故障为业务型故障后,所述方法还可包括:
获取所述终端设备的位置信息;
根据获取到的所述位置信息,确定与所述终端设备位于同一地理区域内的各终端设备;
若根据确定出的各终端设备所上报的故障信息,确定对应的故障为业务型故障的终端设备的个数不小于设定的数量阈值,则确定所述终端设备对应的故障为区域型故障,否则,确定所述终端设备对应的故障为个体型故障。
其中,需要说明的是,所述数量阈值可根据实际情况灵活设置,如可设置为20、50以及100等,只要能够保证最后确定出的故障类型正确即可,本实施例对此不作任何限定。
另外,此处所述的同一地理区域可根据行政区划进行划分,如可为同一小区、同一区县、以及同一城市等,本实施例对此不作任何限定。
由上述内容可知,在确定所述终端设备当前故障为业务型故障时,还可进一步获取所述终端设备所在的地理位置信息,并根据所述地理位置信息,确定与所述终端设备位于同一地理区域的各终端设备,并从确定出的各终端设备中选择出上报的故障类型与所述终端设备相同的各终端设备,并确定选择出的各终端设备的个数,以进一步确定所述故障为区域型故障还是为个体型故障,为小区级故障还是片区级故障等。
例如,如图3所示,在确定了所述终端设备所对应的故障为服务型故障时,还可进一步获取所述终端设备所在的地理区域内与所述终端设备的故障相同的各终端设备的个数,并根据所述个数确定所述终端设备的故障为个体型故障还是区域型故障,若确定所述服务型故障为区域型故障,则可确定故障位置为视频CDN平台,若确定所述服务型故障为个体型故障,则可确定故障位置为单台视频服务器。
类似地,在确定了终端设备所对应的故障为网络型故障时,还可进一步获取所述终端设备所在地理区域内与所述终端设备的故障相同的各终端设备的个数,并根据所述个数确定所述终端设备的故障为个体型故障还是区域型故障,若确定所述网络型故障为区域型故障,则可确定故障位置为所述终端设备所对应的用户家庭网络,若确定所述网络型故障为个体型故障,则可确定故障位置为该地理区域内的接入网络等,对此不作赘述。
另外,需要说明的是,还可将上述各类故障进行进一步地细化,以进一步地提高故障定位的灵活性和精确性,提高故障处理的高效性以及准确性,如可将区域型故障进一步细分为小区级故障、片区级故障以及城市级故障,还可将网络型故障进一步细分为运营商汇聚网络故障、城域网故障等,只要能够尽可能将故障位置精准到较小的范围即可,此处不再一一赘述。
进一步地,针对公网IP(Internet Protocol,网络互联协议)数量受限的家庭宽带网络来说,运营商可通过向家庭网关分配动态私网IP地址,以进行不同用户的识别。具体地,当机顶盒等互联网电视业务终端开机上线后,系统中会存在以下3个IP地址信息:
1、家庭网关为终端设备分配的私网IP地址(如192.168.X.X);
2、BRAS(Broadband Remote Access Server,宽带远程接入服务器)为终端设备所在家庭网关分配的唯一私网IP地址(如172.168.X.X);
3、家庭网关访问公网资源时经上层路由设备NAT(Network AddressTranslation,网络地址转换)转换后的公网IP地址(如221.179.X.X)。
其中,BRAS为终端设备所在家庭网关分配的唯一私网IP地址可为运营商网络的唯一IP地址,因此,可通过此IP地址在AAA(Authentication、Authorization、Accounting,鉴别、授权、计费)系统中查询该IP地址对应的终端设备所在家庭网关的宽带账号信息,并基于该宽带账号信息确定该IP地址对应的终端设备所在的街道、小区等详细的位置信息。
也就是说,本实施例中,可首先获取BRAS为终端设备所在家庭网关分配的唯一私网IP地址,进而根据该私网IP地址获取终端设备的位置信息。
具体地,本实施例中,可通过以下方式获取终端设备的位置信息:
指示与所述终端设备位于同一宽带远程接入服务器BRAS下的测试探针将BRAS为所述终端设备所在家庭网关分配的私网网络互联协议IP发送至所述中心服务器,由所述中心服务器基于所述私网IP从认证授权计费AAA系统查询到所述终端设备所在家庭网关的宽带账号信息;
接收所述中心服务器基于所述宽带账号信息从宽带综资系统所获取到的与所述宽带账号信息相对应的位置信息;
将与所述宽带账号信息相对应的位置信息作为所述终端设备的位置信息。
也就是说,可通过如图4所示的获取方式,获取所述终端设备的位置信息,即:
S1、向所述测试探针发起连接请求(如TCP连接请求);
这是因为在同一BRAS下的所有设备通常处于同一网段,因而,在同一BRAS下的各设备之间可相互通信。
S2、测试探针将BRAS为所述终端设备所在家庭网关分配的私网IP上传至中心服务器;
另外,需要说明的是,所述测试探针除了可将所述终端设备的私网IP发送至所述中心服务器之外,还可将所述终端设备的时间戳等信息发送至中心服务器,对此不作赘述。
S3、中心服务器基于BRAS为所述终端设备所在家庭网关分配的私网IP,向AAA系统查询所述终端设备所在家庭网关的宽带账号信息;
S4、AAA系统向中心服务器返回所述终端设备所在家庭网关的宽带账号信息;
S5、中心服务器向宽带综资系统发送查询所述宽带账号信息的位置信息的请求;
S6、宽带综资系统向中心服务器返回所述宽带账号信息对应的位置信息;
S7、中心服务器向所述故障定位装置返回所述位置信息。
具体地,所述中心服务器还可基于终端设备的唯一标识信息、物理位置等信息对所述终端设备进行标注,以使得后续能够根据所述标注进行快速的定位,对此不作赘述。
可选地,所述终端设备的唯一标识信息可包括所述终端设备的序列号、或所述终端设备的MAC(Media Access Control,媒体访问控制)地址,当然,所述标识信息还可包括其它信息,只要能够唯一标识所述终端设备即可,本实施例对此不作任何限定。
本发明实施例一提供了一种故障定位方法,可获取用于表示终端设备的服务质量的状态信息,所述状态信息包括播放状态信息、通信状态信息以及运行状态信息,并根据获取到的所述状态信息,确定所述终端设备对应的故障类型,而无需通过询问用户、上门检测等方式到现场进行抓包检查,从而解决了现有的互联网电视业务故障定位方法所存在的故障定位困难、耗时较长以及效率较低等的问题,节省了故障定位的时间、提高了故障定位的效率以及用户的体验。另外,在确定所述终端设备对应的故障类型为业务型故障时,还可进一步根据所述通信状态信息确定所述终端设备对应的业务型故障为服务型故障还是网络型故障,以及,还可获取所述终端设备的位置信息,并根据获取到的所述位置信息,确定所述终端设备对应的业务型故障为个体型故障还是区域型故障,以进一步提高故障定位的准确性及用户的满意度。
实施例二:
基于与本发明实施例一相同的发明构思,本发明实施例二提供了一种故障定位装置,如图5所示,其为本发明实施例二中所述的故障定位装置的结构示意图。具体地,由图5所示,所述故障定位装置可包括:
状态信息获取模块51,可用于获取用于表示终端设备的服务质量的状态信息;所述状态信息包括播放状态信息、通信状态信息以及运行状态信息;
故障类型定位模块52,可用于若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障;以及,若根据获取到的所述状态信息,确定所述终端设备的播放状态以及运行状态不正常、但通信状态正常,则确定所述终端设备对应的故障为终端型故障。
具体地,所述播放状态信息至少可包括播放、卡顿、缓冲、暂停、快进以及快退中的任意一种或多种。
具体地,所述通信状态信息至少可包括TCP连接时延、HTTP响应时延、TCP重传率、TCP低窗口数据包个数、HLS分片下载时长以及M3U8请求次数中的任意一种或多种。
具体地,所述运行状态信息可包括内存占用率和/或CPU使用率。
可选地,所述业务型故障可包括网络型故障以及服务型故障。
具体地,所述故障类型定位模块52,具体可用于若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长中的任意一种或多种不小于其所对应的阈值、且HTTP响应时延以及M3U8请求次数均小于其所对应的阈值,则确定所述终端设备对应的故障为网络型故障;以及,
若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长均小于其所对应的阈值,且HTTP响应时延和/或M3U8请求次数不小于其所对应的阈值,则确定所述终端设备对应的故障为服务型故障。
进一步地,所述装置还可包括:
位置信息获取模块53,可用于在确定所述终端设备对应的故障为业务型故障后,获取所述终端设备的位置信息;
所述故障定位模块52,还可用于根据获取到的所述位置信息,确定与所述终端设备位于同一地理区域内的各终端设备,并若根据确定出的各终端设备所上报的故障信息,确定对应的故障为业务型故障的终端设备的个数不小于设定的数量阈值,则确定所述终端设备对应的故障为区域型故障,否则,确定所述终端设备对应的故障为个体型故障。
具体地,所述位置信息获取模块53,具体可用于指示与所述终端设备位于同一宽带远程接入服务器BRAS下的测试探针将BRAS为所述终端设备所在家庭网关分配的私网网络互联协议IP发送至所述中心服务器,由所述中心服务器基于所述私网IP从认证授权计费AAA系统查询到所述终端设备所在家庭网关的宽带账号信息;并,接收所述中心服务器基于所述宽带账号信息从宽带综资系统所获取到的与所述宽带账号信息相对应的位置信息;以及,将与所述宽带账号信息相对应的位置信息作为所述终端设备的位置信息。
需要说明的是,本实施例中所述终端设备可为机顶盒等互联网电视业务终端,对此不作任何限定。
本领域技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (16)

1.一种故障定位方法,其特征在于,包括:
获取用于表示终端设备的服务质量的状态信息;所述状态信息包括播放状态信息、通信状态信息以及运行状态信息;
若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障;
若根据获取到的所述状态信息,确定所述终端设备的播放状态以及运行状态不正常、但通信状态正常,则确定所述终端设备对应的故障为终端型故障。
2.如权利要求1所述的方法,其特征在于,所述播放状态信息至少包括播放、卡顿、缓冲、暂停、快进以及快退中的任意一种或多种。
3.如权利要求1所述的方法,其特征在于,所述通信状态信息至少包括传输控制协议TCP连接时延、超文本传输协议HTTP响应时延、TCP重传率、TCP低窗口数据包个数、流媒体网络传输协议HLS分片下载时长以及M3U8请求次数中的任意一种或多种。
4.如权利要求1所述的方法,其特征在于,所述运行状态信息包括内存占用率和/或中央处理器CPU使用率。
5.如权利要求1所述的方法,其特征在于,所述业务型故障包括网络型故障以及服务型故障。
6.如权利要求1~5任一项所述的方法,其特征在于,若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障,包括:
若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长中的任意一种或多种不小于其所对应的阈值、且HTTP响应时延以及M3U8请求次数均小于其所对应的阈值,则确定所述终端设备对应的故障为网络型故障;
若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长均小于其所对应的阈值,且HTTP响应时延和/或M3U8请求次数不小于其所对应的阈值,则确定所述终端设备对应的故障为服务型故障。
7.如权利要求1所述的方法,其特征在于,在确定所述终端设备对应的故障为业务型故障后,所述方法还包括:
获取所述终端设备的位置信息;
根据获取到的所述位置信息,确定与所述终端设备位于同一地理区域内的各终端设备;
若根据确定出的各终端设备所上报的故障信息,确定对应的故障为业务型故障的终端设备的个数不小于设定的数量阈值,则确定所述终端设备对应的故障为区域型故障,否则,确定所述终端设备对应的故障为个体型故障。
8.如权利要求7所述的方法,其特征在于,获取所述终端设备的位置信息,具体包括:
指示与所述终端设备位于同一宽带远程接入服务器BRAS下的测试探针将BRAS为所述终端设备所在家庭网关分配的私网网络互联协议IP发送至所述中心服务器,由所述中心服务器基于所述私网IP从认证授权计费AAA系统查询到所述终端设备所在家庭网关的宽带账号信息;
接收所述中心服务器基于所述宽带账号信息从宽带综资系统所获取到的与所述宽带账号信息相对应的位置信息;
将与所述宽带账号信息相对应的位置信息作为所述终端设备的位置信息。
9.一种故障定位装置,其特征在于,包括:
状态信息获取模块,用于获取用于表示终端设备的服务质量的状态信息;所述状态信息包括播放状态信息、通信状态信息以及运行状态信息;
故障类型定位模块,用于若根据获取到的所述状态信息,确定所述终端设备的播放状态以及通信状态不正常、但运行状态正常,则确定所述终端设备对应的故障为业务型故障;以及,若根据获取到的所述状态信息,确定所述终端设备的播放状态以及运行状态不正常、但通信状态正常,则确定所述终端设备对应的故障为终端型故障。
10.如权利要求9所述的装置,其特征在于,所述播放状态信息至少包括播放、卡顿、缓冲、暂停、快进以及快退中的任意一种或多种。
11.如权利要求9所述的装置,其特征在于,所述通信状态信息至少包括传输控制协议TCP连接时延、超文本传输协议HTTP响应时延、TCP重传率、TCP低窗口数据包个数、流媒体网络传输协议HLS分片下载时长以及M3U8请求次数中的任意一种或多种。
12.如权利要求9所述的装置,其特征在于,所述运行状态信息包括内存占用率和/或中央处理器CPU使用率。
13.如权利要求9所述的装置,其特征在于,所述业务型故障包括网络型故障以及服务型故障。
14.如权利要求9~13任一项所述的装置,其特征在于,
所述故障类型定位模块,具体用于若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长中的任意一种或多种不小于其所对应的阈值、且HTTP响应时延以及M3U8请求次数均小于其所对应的阈值,则确定所述终端设备对应的故障为网络型故障;以及,
若根据获取到的所述状态信息,确定所述终端设备的播放状态为卡顿,运行状态为正常,通信状态中的TCP连接时延、TCP重传率、TCP低窗口数据包个数以及HLS分片下载时长均小于其所对应的阈值,且HTTP响应时延和/或M3U8请求次数不小于其所对应的阈值,则确定所述终端设备对应的故障为服务型故障。
15.如权利要求9所述的装置,其特征在于,所述装置还包括:
位置信息获取模块,用于在确定所述终端设备对应的故障为业务型故障后,获取所述终端设备的位置信息;
所述故障定位模块,还用于根据获取到的所述位置信息,确定与所述终端设备位于同一地理区域内的各终端设备,并若根据确定出的各终端设备所上报的故障信息,确定对应的故障为业务型故障的终端设备的个数不小于设定的数量阈值,则确定所述终端设备对应的故障为区域型故障,否则,确定所述终端设备对应的故障为个体型故障。
16.如权利要求9所述的装置,其特征在于,
所述位置信息获取模块,具体用于指示与所述终端设备位于同一宽带远程接入服务器BRAS下的测试探针将BRAS为所述终端设备所在家庭网关分配的私网网络互联协议IP发送至所述中心服务器,由所述中心服务器基于所述私网IP从认证授权计费AAA系统查询到所述终端设备所在家庭网关的宽带账号信息;并,接收所述中心服务器基于所述宽带账号信息从宽带综资系统所获取到的与所述宽带账号信息相对应的位置信息;以及,将与所述宽带账号信息相对应的位置信息作为所述终端设备的位置信息。
CN201610412816.4A 2016-06-13 2016-06-13 一种故障定位方法及装置 Active CN107493183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610412816.4A CN107493183B (zh) 2016-06-13 2016-06-13 一种故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610412816.4A CN107493183B (zh) 2016-06-13 2016-06-13 一种故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN107493183A true CN107493183A (zh) 2017-12-19
CN107493183B CN107493183B (zh) 2020-06-05

Family

ID=60642135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610412816.4A Active CN107493183B (zh) 2016-06-13 2016-06-13 一种故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN107493183B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108173678A (zh) * 2017-12-20 2018-06-15 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN108900508A (zh) * 2018-06-29 2018-11-27 亚信科技(成都)有限公司 高级威胁检测方法及智能探针装置和高级威胁检测系统
CN109510727A (zh) * 2018-12-24 2019-03-22 深圳市友华通信技术有限公司 一种自动定位onu故障的方法和系统
CN109640127A (zh) * 2018-12-30 2019-04-16 北京奇艺世纪科技有限公司 内容分发网络的故障定位方法及装置
CN109756762A (zh) * 2019-01-29 2019-05-14 北京奇艺世纪科技有限公司 一种终端类别的确定方法及装置
CN110875825A (zh) * 2018-08-30 2020-03-10 中国移动通信集团广东有限公司 故障判决方法及装置
CN110896544A (zh) * 2018-09-13 2020-03-20 中国移动通信集团山东有限公司 故障定界方法及装置
CN110943874A (zh) * 2018-09-21 2020-03-31 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN111225405A (zh) * 2018-11-27 2020-06-02 中国移动通信集团福建有限公司 视频质量问题定界方法、装置、设备及介质
CN111404762A (zh) * 2019-01-02 2020-07-10 中国移动通信有限公司研究院 用户视频质差定位方法及装置
CN111988170A (zh) * 2020-08-07 2020-11-24 锐捷网络股份有限公司 一种终端故障定位方法及装置
CN112040328A (zh) * 2020-08-04 2020-12-04 北京字节跳动网络技术有限公司 数据交互方法、装置和电子设备
CN112243138A (zh) * 2019-07-16 2021-01-19 中国移动通信集团浙江有限公司 Cdn网络故障诊断方法、装置、设备和存储介质
CN113300816A (zh) * 2020-07-15 2021-08-24 阿里巴巴集团控股有限公司 节点定位方法、网络传输方法、装置及设备
CN114338131A (zh) * 2021-12-24 2022-04-12 北京京东振世信息技术有限公司 终端的离线使用方法、管理方法、终端、管理端及系统
WO2022089234A1 (zh) * 2020-10-27 2022-05-05 中兴通讯股份有限公司 故障处理方法、服务器、电子设备和可读存储介质
CN114598929A (zh) * 2020-12-07 2022-06-07 中移物联网有限公司 一种信息处理方法、装置和终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007128097A1 (en) * 2006-05-05 2007-11-15 Mariner Partners, Inc. Transient video anomaly analysis and reporting system
CN104349220A (zh) * 2014-11-25 2015-02-11 复旦大学 一种用于智能电视终端的服务质量监测系统
US20150326939A1 (en) * 2014-05-09 2015-11-12 Adtran Inc. Diagnosing and optimizing network-wide iptv configurations
CN105141661A (zh) * 2015-07-24 2015-12-09 易视腾科技有限公司 基于xmpp技术的ott终端远程控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007128097A1 (en) * 2006-05-05 2007-11-15 Mariner Partners, Inc. Transient video anomaly analysis and reporting system
US20150326939A1 (en) * 2014-05-09 2015-11-12 Adtran Inc. Diagnosing and optimizing network-wide iptv configurations
CN104349220A (zh) * 2014-11-25 2015-02-11 复旦大学 一种用于智能电视终端的服务质量监测系统
CN105141661A (zh) * 2015-07-24 2015-12-09 易视腾科技有限公司 基于xmpp技术的ott终端远程控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄晓波,黄志武: ""IPTV视频质量故障定位及处理方法"", 《信息通信》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108173678B (zh) * 2017-12-20 2021-03-12 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN108173678A (zh) * 2017-12-20 2018-06-15 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN108900508B (zh) * 2018-06-29 2021-09-14 亚信科技(成都)有限公司 高级威胁检测方法及智能探针装置和高级威胁检测系统
CN108900508A (zh) * 2018-06-29 2018-11-27 亚信科技(成都)有限公司 高级威胁检测方法及智能探针装置和高级威胁检测系统
CN110875825A (zh) * 2018-08-30 2020-03-10 中国移动通信集团广东有限公司 故障判决方法及装置
CN110896544A (zh) * 2018-09-13 2020-03-20 中国移动通信集团山东有限公司 故障定界方法及装置
CN110943874B (zh) * 2018-09-21 2021-11-19 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN110943874A (zh) * 2018-09-21 2020-03-31 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN111225405A (zh) * 2018-11-27 2020-06-02 中国移动通信集团福建有限公司 视频质量问题定界方法、装置、设备及介质
CN111225405B (zh) * 2018-11-27 2022-06-14 中国移动通信集团福建有限公司 视频质量问题定界方法、装置、设备及介质
CN109510727A (zh) * 2018-12-24 2019-03-22 深圳市友华通信技术有限公司 一种自动定位onu故障的方法和系统
CN109640127A (zh) * 2018-12-30 2019-04-16 北京奇艺世纪科技有限公司 内容分发网络的故障定位方法及装置
CN111404762A (zh) * 2019-01-02 2020-07-10 中国移动通信有限公司研究院 用户视频质差定位方法及装置
CN109756762B (zh) * 2019-01-29 2020-10-02 北京奇艺世纪科技有限公司 一种终端类别的确定方法及装置
CN109756762A (zh) * 2019-01-29 2019-05-14 北京奇艺世纪科技有限公司 一种终端类别的确定方法及装置
CN112243138A (zh) * 2019-07-16 2021-01-19 中国移动通信集团浙江有限公司 Cdn网络故障诊断方法、装置、设备和存储介质
CN113300816B (zh) * 2020-07-15 2022-04-12 阿里巴巴集团控股有限公司 节点定位方法、网络传输方法、装置及设备
CN113300816A (zh) * 2020-07-15 2021-08-24 阿里巴巴集团控股有限公司 节点定位方法、网络传输方法、装置及设备
CN112040328A (zh) * 2020-08-04 2020-12-04 北京字节跳动网络技术有限公司 数据交互方法、装置和电子设备
CN112040328B (zh) * 2020-08-04 2023-03-10 北京字节跳动网络技术有限公司 数据交互方法、装置和电子设备
CN111988170A (zh) * 2020-08-07 2020-11-24 锐捷网络股份有限公司 一种终端故障定位方法及装置
CN111988170B (zh) * 2020-08-07 2023-04-28 锐捷网络股份有限公司 一种终端故障定位方法及装置
WO2022089234A1 (zh) * 2020-10-27 2022-05-05 中兴通讯股份有限公司 故障处理方法、服务器、电子设备和可读存储介质
CN114598929A (zh) * 2020-12-07 2022-06-07 中移物联网有限公司 一种信息处理方法、装置和终端
CN114598929B (zh) * 2020-12-07 2023-10-27 中移物联网有限公司 一种信息处理方法、装置和终端
CN114338131A (zh) * 2021-12-24 2022-04-12 北京京东振世信息技术有限公司 终端的离线使用方法、管理方法、终端、管理端及系统

Also Published As

Publication number Publication date
CN107493183B (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN107493183A (zh) 一种故障定位方法及装置
CN109348171B (zh) 一种视联网监控视频获取方法及装置
CN110121059B (zh) 监控视频处理方法、装置及存储介质
CN101505317B (zh) 流式媒体中断与恢复系统
CN108965912B (zh) 一种视频数据处理的方法、客户端以及服务器
CN108989264A (zh) 一种直播方法、系统以及相关设备
CN107566786A (zh) 一种获取监控视频的方法、装置及终端设备
CN103873497B (zh) 用于调度信息的方法、装置和系统
CN108881797B (zh) 一种视联网的数据处理方法和装置
CN110572433B (zh) 一种视频调度方法、系统及装置
CN110087040B (zh) 一种监控视频调取方法及系统
CN109413138B (zh) 文件上传方法和装置
CN102420868B (zh) 服务的提供方法、装置及系统
CN108243026A (zh) 局域网设备通信管理方法、系统及网关设备
WO2015054336A2 (en) System and method of delivering data that provides service differentiation and monetization in mobile data networks
CN110460469B (zh) 一种系统升级方法、装置和存储介质
CN103581338A (zh) 一种污染源在线监控数据监听系统
CN107040615A (zh) 媒体分片的下载方法、终端和计算机可读存储介质
CN111212263B (zh) 一种监控资源数据的过滤方法和装置
CN108924595A (zh) 实现ts切片防盗链的方法及系统
CN109857419B (zh) 一种调度系统自动升级的方法和装置
CN106162242B (zh) 应用于电视节目信息分享网络的管理方法及管理装置及非瞬时计算机可读取储存媒体
CN111245733A (zh) 一种数据传输的方法和装置
CN111478883A (zh) 一种终端检测的方法和装置
CN108881148B (zh) 一种数据获取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant