发明内容
本发明的目的是克服了上述现有技术中的缺点,提供一种通过用户业务账号对保障用户进行故障定位,可以及时在IPTV网络中准确定位所有故障发生点,并且提供故障建议,供设备抢修人员根据提示进行相关设备维护,极大简化了维护人员工作复杂性,提高了工作效率,进而有效提升IPTV用户体验的,实现方式简单,实现成本低廉,应用范围较为广泛的IPTV网络中实现业务故障诊断定位的方法。
为了实现上述的目的,IPTV网络中设置有故障定位系统,本发明的IPTV网络中实现业务故障诊断定位的方法包括以下步骤:
(0)故障定位系统获知IPTV网络中报修的线路信息;
(1)故障定位系统对报修线路的机顶盒所连接的电子节目菜单服务器进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(2)故障定位系统对报修线路的机顶盒进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(3)故障定位系统对报修线路的视频源进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(4)故障定位系统对报修线路终端最后一公里进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(5)故障定位系统对报修线路中的数字用户线路接入复用器进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(6)故障定位系统对报修线路中的交换机进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(7)故障定位系统对报修线路中的宽带远程接入服务器进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(8)故障定位系统提示疑似故障点信息,结束定位;
(9)故障定位系统提示确定故障点信息,结束定位。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(0)具体包括以下步骤:
(01)所述的故障定位系统判断机顶盒当前是否在线,并给出提示;
(02)所述的故障定位系统获取机顶盒告警信息,并进行初步分段定位。
该IPTV网络中实现业务故障诊断定位的方法中,所述的故障定位系统包括电子节目菜单采集器,所述的步骤(1)具体包括以下步骤:
(11)所述的故障定位系统将所述的电子节目菜单采集器模拟为机顶盒与所述的电子节目菜单服务器进行交互;
(12)所述的故障定位系统判断所述的电子节目菜单服务器是否有交互故障,若有,则进入步骤(14),若无,则进入步骤(13);
(13)所述的故障定位系统判断所述的电子节目菜单服务器是否有页面相关故障,若有,则将所述的页面相关故障定位为疑似故障点,并进入步骤(2),若无,则直接进入步骤(2);
(14)所述的故障定位系统将电子节目菜单服务器定位为确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的交互故障包括电子节目菜单服务器不可用、电子节目菜单服务器返回入口地址和电子节目菜单服务器鉴权失败。
该IPTV网络中实现业务故障诊断定位的方法中,所述的页面相关故障为页面解析错误、电子节目菜单服务器异常和统一资源定位符转换出现错误位。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(2)具体包括以下步骤:
(21)故障定位系统判断交互服务架构系统是否发出机顶盒告警,若有,则进入步骤(22),若没有,则进入步骤(3);
(22)所述的定位系统判断交互服务架构系统的机顶盒告警位置,若为终端侧或视频源侧,则进入步骤(23);若为网络侧,则进入步骤(3);
(23)所述的故障定位系统将机顶盒定位为确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的故障定位系统包括视频分析设备,所述的视频分析设备包括设置于片源服务器的视频分析探针、设置于IPTV核心平台出口和宽带远程接入服务器的便携式视频分析仪和设置于各边缘节点出口的视频分析仪,所述的步骤(3)具体包括以下步骤:
(31)所述的视频分析探针分析片源服务器的片源是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(32);
(32)所述的便携式视频分析仪分析IPTV核心平台出口是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(33);
(33)所述的视频分析仪分析各边缘节点出口是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(34);
(34)所述的便携式视频分析仪分析宽带远程接入服务器是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(4);
(35)所述的故障定位系统将视频源定位为确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的视频故障为马赛克、静帧、黑屏、清晰度模糊、色彩异常、语法错误和亮度异常中的一种。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(4)具体包括以下步骤:
(41)所述的故障定位系统判断机顶盒端口配置速率是否低于3M,若是,则提示端口配置速率不符合要求,需重新配置;若否,则进入步骤(42);
(42)所述的故障定位系统判断端口线路质量是否达到预设的标准,若是,则进入步骤(5),若否,则进入步骤(43);
(43)所述的故障定位系统将终端最后一公里为确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的预设的标准为:端口实际速率/端口配置速率≥90%,上行或下行端口的衰减≤45dB,且上行或下行端口的容限≥10dB。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(5)具体包括以下步骤:
(51)所述的故障定位系统判断数字用户线路接入复用器是否存在下联链路质量超过阀值告警或机顶盒直连端口下行告警,若有,则进入步骤(54),若无,则进入步骤(52);
(52)所述的故障定位系统判断数字用户线路接入复用器是否存在性能告警,若有,则进入步骤(53),若无,则进入步骤(6);
(53)所述的故障定位系统判断数字用户线路接入复用器的下挂机顶盒告警比例是否超过预设值,若是,则进入步骤(54),若否,则将数字用户线路接入复用器定位为疑似故障点,并进入步骤(6);
(54)所述的故障定位系统将数字用户线路接入复用器确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的数字用户线路接入复用器的下挂机顶盒的数量从交互服务架构系统的数据库中读取。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(6)具体包括以下步骤:
(61)所述的故障定位系统通过拓扑关系获取所述的报修线路中的数字用户线路接入复用器的链路列表;
(62)所述的故障定位系统遍历所述的链路列表中网络设备,并通过分支定界对网络设备中的交换机进行故障判断,若定位为确定故障点,则进入步骤(63);未不为确定故障点,则进入步骤(7)。
(63)所述的故障定位系统将交换机确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(62)具体包括以下步骤:
(62-1)所述的故障定位系统通过交换机下级设备故障比例判断所述的交换机是否为可疑交换机,若为可疑交换机,则进入步骤(62-2),若不为可疑交换机,则进入步骤(7);
(62-2)所述的故障定位系统获取所述的可疑交换机的告警信息、性能信息和下级设备列表的相关报警信息,并构建拓扑信息共享树;
(62-3)所述的故障定位系统在所述的拓扑信息共享树中查找交换机在故障时间段内的告警信息,若找到,则进入步骤(62-4),若未找到则进入步骤(7)
(62-4)所述的故障定位系统将查找到的告警信息的告警类型、等级、告警参数以及性能数据输入专家知识分析库,并得到该告警信息对应的故障影响;
(62-5)所述的故障定位系统将所述的故障影响与下联设备的故障和性能参数进行匹配,若能匹配,则进入步骤(63),若不能匹配,则进入步骤(62-6)
(62-6)所述的故障定位系统将所述的交换机定位为疑似故障点。
该IPTV网络中实现业务故障诊断定位的方法中,所述的交换机下级设备故障比例通过以下公式确定:
(故障的数字用户线路接入复用器数+其他设备故障数)/(所有直接相连的数字用户线路接入复用器数+所有直接相连的其他设备数)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(7)具体包括以下步骤:
(71)所述的故障定位系统通过拓扑关系获取所述的报修线路中的数字用户线路接入复用器的链路列表;
(72)所述的故障定位系统遍历所述的链路列表中网络设备,并通过分支定界对网络设备中的宽带远程接入服务器进行故障判断,若定位为确定故障点,则进入步骤(73);未不为确定故障点,则进入步骤(8)。
(73)所述的故障定位系统将宽带远程接入服务器确认故障点,并进入步骤(9)。
该IPTV网络中实现业务故障诊断定位的方法中,所述的步骤(62)具体包括以下步骤:
(72-1)所述的故障定位系统通过宽带远程接入服务器下级设备故障比例判断所述的宽带远程接入服务器是否为可疑宽带远程接入服务器,若为可疑宽带远程接入服务器,则进入步骤(72-2),若不为可疑宽带远程接入服务器,则进入步骤(8);
(72-2)所述的故障定位系统获取所述的可疑宽带远程接入服务器的告警信息、性能信息和下级设备列表的相关报警信息,并构建第二拓扑信息共享树;
(72-3)所述的故障定位系统在所述的第二拓扑信息共享树中查找宽带远程接入服务器在故障时间段内的告警信息,若找到,则进入步骤(72-4),若未找到则进入步骤(8)
(72-4)所述的故障定位系统将查找到的告警信息的告警类型、等级、告警参数以及性能数据输入专家知识分析库,并得到该告警信息对应的故障影响;
(72-5)所述的故障定位系统将所述的故障影响与下联设备的故障和性能参数进行匹配,若能匹配,则进入步骤(73),若不能匹配,则进入步骤(72-6)
(72-6)所述的故障定位系统将所述的宽带远程接入服务器定位为疑似故障点。
该IPTV网络中实现业务故障诊断定位的方法中,所述的宽带远程接入服务器下级设备故障比例通过以下公式确定:
(故障的交换机数+故障的数字用户线路接入复用器数)/(所有直接相连的数字用户线路接入复用器数+所有直接相连的交换机数)。
采用了该发明的IPTV网络中实现业务故障诊断定位的方法,其故障定位系统依次对报修线路的电子节目菜单服务器、机顶盒、视频源、终端最后一公里、数字用户线路接入复用器、交换机和宽带远程接入服务器进行故障检测,确定故障点或疑似故障点,并最终给出故障点或疑似故障点信息,以此可及时在IPTV网络中准确定位所有故障发生点,并且提供故障建议,供设备抢修人员根据提示进行相关设备维护,极大简化了维护人员工作复杂性,提高了工作效率,进而有效提升IPTV用户体验的,且本发明的IPTV网络中实现业务故障诊断定位的方法实现方式简单,实现成本低廉,应用范围也较为广泛。
具体实施方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。
请参阅图1所示,为本发明的IPTV网络中实现业务故障诊断定位的方法的流程示意图。
在一种实施方式中,IPTV网络中设置有故障定位系统,所述的IPTV网络中实现业务故障诊断定位的方法包括以下步骤:
(0)故障定位系统获知IPTV网络中报修的线路信息;
(1)故障定位系统对报修线路的机顶盒所连接的电子节目菜单服务器进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(2)故障定位系统对报修线路的机顶盒进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(3)故障定位系统对报修线路的视频源进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(4)故障定位系统对报修线路终端最后一公里进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(5)故障定位系统对报修线路中的数字用户线路接入复用器进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(6)故障定位系统对报修线路中的交换机进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(7)故障定位系统对报修线路中的宽带远程接入服务器进行故障检测,若确定故障点,则进入步骤(9),若未确定则进入下一步骤;
(8)故障定位系统提示疑似故障点信息,结束定位;
(9)故障定位系统提示确定故障点信息,结束定位。
在一种较优选的实施方式中,所述的步骤(0)具体包括以下步骤:
(01)所述的故障定位系统判断机顶盒当前是否在线,并给出提示;
(02)所述的故障定位系统获取机顶盒告警信息,并进行初步分段定位。
在另一种较优选的实施方式中,所述的故障定位系统包括电子节目菜单采集器,所述的步骤(1)具体包括以下步骤:
(11)所述的故障定位系统将所述的电子节目菜单采集器模拟为机顶盒与所述的电子节目菜单服务器进行交互;
(12)所述的故障定位系统判断所述的电子节目菜单服务器是否有交互故障,若有,则进入步骤(14),若无,则进入步骤(13);
(13)所述的故障定位系统判断所述的电子节目菜单服务器是否有页面相关故障,若有,则将所述的页面相关故障定位为疑似故障点,并进入步骤(2),若无,则直接进入步骤(2);
(14)所述的故障定位系统将电子节目菜单服务器定位为确认故障点,并进入步骤(9)。
在一种进一步优选的实施方式中,所述的交互故障包括电子节目菜单服务器不可用、电子节目菜单服务器返回入口地址和电子节目菜单服务器鉴权失败等故障。所述的页面相关故障为页面解析错误、电子节目菜单服务器异常和统一资源定位符转换出现错误位等故障。
在又一种较优选的实施方式中,所述的步骤(2)具体包括以下步骤:
(21)故障定位系统判断交互服务架构系统是否发出机顶盒告警,若有,则进入步骤(22),若没有,则进入步骤(3);
(22)所述的定位系统判断交互服务架构系统的机顶盒告警位置,若为终端侧或视频源侧,则进入步骤(23);若为网络侧,则进入步骤(3);
(23)所述的故障定位系统将机顶盒定位为确认故障点,并进入步骤(9)。
在又另一种较优选的实施方式中,所述的故障定位系统包括视频分析设备,所述的视频分析设备包括设置于片源服务器的视频分析探针、设置于IPTV核心平台出口和宽带远程接入服务器的便携式视频分析仪和设置于各边缘节点出口的视频分析仪,所述的步骤(3)具体包括以下步骤:
(31)所述的视频分析探针分析片源服务器的片源是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(32);
(32)所述的便携式视频分析仪分析IPTV核心平台出口是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(33);
(33)所述的视频分析仪分析各边缘节点出口是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(34);
(34)所述的便携式视频分析仪分析宽带远程接入服务器是否存在视频或音频故障,若有,则进入步骤(35),若无,则进入步骤(4);
(35)所述的故障定位系统将视频源定位为确认故障点,并进入步骤(9)。
在另一种进一步优选的实施方式中,所述的视频故障为马赛克、静帧、黑屏、清晰度模糊、色彩异常、语法错误和亮度异常中的一种。
在又一种较优选的实施方式中,所述的步骤(4)具体包括以下步骤:
(41)所述的故障定位系统判断机顶盒端口配置速率是否低于3M,若是,则提示端口配置速率不符合要求,需重新配置;若否,则进入步骤(42);
(42)所述的故障定位系统判断端口线路质量是否达到预设的标准,若是,则进入步骤(5),若否,则进入步骤(43);
(43)所述的故障定位系统将终端最后一公里为确认故障点,并进入步骤(9)。
在再一种进一步优选的实施方式中,所述的预设的标准为:端口实际速率/端口配置速率≥90%,上行或下行端口的衰减≤45dB,且上行或下行端口的容限≥10dB。
在又另一种较优选的实施方式中,所述的步骤(5)具体包括以下步骤:
(51)所述的故障定位系统判断数字用户线路接入复用器是否存在下联链路质量超过阀值告警或机顶盒直连端口下行告警,若有,则进入步骤(54),若无,则进入步骤(52);
(52)所述的故障定位系统判断数字用户线路接入复用器是否存在性能告警,若有,则进入步骤(53),若无,则进入步骤(6);
(53)所述的故障定位系统判断数字用户线路接入复用器的下挂机顶盒告警比例是否超过预设值,若是,则进入步骤(54),若否,则将数字用户线路接入复用器定位为疑似故障点,并进入步骤(6);
(54)所述的故障定位系统将数字用户线路接入复用器确认故障点,并进入步骤(9)。
在另一种进一步优选的实施方式中,所述的数字用户线路接入复用器的下挂机顶盒的数量从交互服务架构系统的数据库中读取。
在又再一种较优选的实施方式中,所述的步骤(6)具体包括以下步骤:
(61)所述的故障定位系统通过拓扑关系获取所述的报修线路中的数字用户线路接入复用器的链路列表;
(62)所述的故障定位系统遍历所述的链路列表中网络设备,并通过分支定界对网络设备中的交换机进行故障判断,若定位为确定故障点,则进入步骤(63);未不为确定故障点,则进入步骤(7)。
(63)所述的故障定位系统将交换机确认故障点,并进入步骤(9)。
在又一种进一步优选的实施方式中,所述的步骤(62)具体包括以下步骤:
(62-1)所述的故障定位系统通过交换机下级设备故障比例判断所述的交换机是否为可疑交换机,若为可疑交换机,则进入步骤(62-2),若不为可疑交换机,则进入步骤(7);
(62-2)所述的故障定位系统获取所述的可疑交换机的告警信息、性能信息和下级设备列表的相关报警信息,并构建拓扑信息共享树;
(62-3)所述的故障定位系统在所述的拓扑信息共享树中查找交换机在故障时间段内的告警信息,若找到,则进入步骤(62-4),若未找到则进入步骤(7)
(62-4)所述的故障定位系统将查找到的告警信息的告警类型、等级、告警参数以及性能数据输入专家知识分析库,并得到该告警信息对应的故障影响;
(62-5)所述的故障定位系统将所述的故障影响与下联设备的故障和性能参数进行匹配,若能匹配,则进入步骤(63),若不能匹配,则进入步骤(62-6)
(62-6)所述的故障定位系统将所述的交换机定位为疑似故障点。
在一种更优选的实施方式中,所述的交换机下级设备故障比例通过以下公式确定:(故障的数字用户线路接入复用器数+其他设备故障数)/(所有直接相连的数字用户线路接入复用器数+所有直接相连的其他设备数)。
在又另一种较优选的实施方式中,所述的步骤(7)具体包括以下步骤:
(71)所述的故障定位系统通过拓扑关系获取所述的报修线路中的数字用户线路接入复用器的链路列表;
(72)所述的故障定位系统遍历所述的链路列表中网络设备,并通过分支定界对网络设备中的宽带远程接入服务器进行故障判断,若定位为确定故障点,则进入步骤(73);未不为确定故障点,则进入步骤(8)。
(73)所述的故障定位系统将宽带远程接入服务器确认故障点,并进入步骤(9)。
在又另一种进一步优选的实施方式中,所述的步骤(62)具体包括以下步骤:
(72-1)所述的故障定位系统通过宽带远程接入服务器下级设备故障比例判断所述的宽带远程接入服务器是否为可疑宽带远程接入服务器,若为可疑宽带远程接入服务器,则进入步骤(72-2),若不为可疑宽带远程接入服务器,则进入步骤(8);
(72-2)所述的故障定位系统获取所述的可疑宽带远程接入服务器的告警信息、性能信息和下级设备列表的相关报警信息,并构建第二拓扑信息共享树;
(72-3)所述的故障定位系统在所述的第二拓扑信息共享树中查找宽带远程接入服务器在故障时间段内的告警信息,若找到,则进入步骤(72-4),若未找到则进入步骤(8)
(72-4)所述的故障定位系统将查找到的告警信息的告警类型、等级、告警参数以及性能数据输入专家知识分析库,并得到该告警信息对应的故障影响;
(72-5)所述的故障定位系统将所述的故障影响与下联设备的故障和性能参数进行匹配,若能匹配,则进入步骤(73),若不能匹配,则进入步骤(72-6)
(72-6)所述的故障定位系统将所述的宽带远程接入服务器定位为疑似故障点。
在另一种更优选的实施方式中,所述的宽带远程接入服务器下级设备故障比例通过以下公式确定:(故障的交换机数+故障的数字用户线路接入复用器数)/(所有直接相连的数字用户线路接入复用器数+所有直接相连的交换机数)。
在实际应用中,本发明的IPTV网络中实现业务故障诊断定位的方法,采取逐层定位的方法,具体包括以下内容:
1.1EPG(电子节目菜单)侧:
1、EPG采集器功能:如图2所示,EPG采集器会通过模拟机顶盒,与运营商的EPG服务器进行交互,实时模拟出故障当时,机顶盒与EPG服务器是否有交互故障;EPG采集机会遍历EPG页面,对每个URL进行逐层分析,并且生成相应的EPG页面相关的故障提示。
2、首先用户进行报障,故障定位功能会判断是否有EPG服务器相关的告警。
3、如果是与EPG服务器交互故障(EPG服务器不可用,EPG服务器由于某种原因未返回入口地址,EPG服务器鉴权失败等),则直接定位为故障点,故障定位结束。
4、如果是EPG页面相关故障(页面解析错误或EPG服务器异常、url转换出现错误等),定位为可疑故障点,继续进行故障定位。
1.2STB(机顶盒)侧:机顶盒节点处理流程如图9所示。
1、故障机顶盒的定义:如果机顶盒处于开机状态并且机顶盒的故障仍然没有结束,则认为该机顶盒处于故障状态。
2、先判断是否有ISA系统(交互服务架构系统)发出的机顶盒的告警,如没有,则直接判断此机顶盒状态正常,直接返回,不对其进行故障判断。
3、如果ISA系统出现终端故障中故障位置为终端侧或者视频源侧,则直接机顶盒可以定位为故障点。定位结束。
4、如发现机顶盒网络侧的故障,则通过拓扑,找出上联DSLAM(数字用户线路接入复用器)设备以及相关信息,继续进行下一层DSLAM分析。
1.3视频源侧:
1、视频源侧的故障定位需要部署视频分析仪,如图3所示,其可具体部署在系统核心平台出口、边缘节点出口,IPTV承载网等,协助IPTV平台及网络运维部门监控网络运行中的质量状态,帮助定位故障,可以直接引流观看用户当前正在看的频道。
2、便携式视频分析仪(PVA)会分别在省中心平台出口,地市平台出口以及BRAS(宽带远程接入服务器)上部署,并且实时监控视频流。在实际故障定位中,在判断iSA系统出现终端故障中故障位置视频源侧后,程序会查找目前在此机顶盒链路上相关的视频分析仪所监控的网络设备上或者片源质量是否有相关告警,如果有,精确定位故障点,定位结束。
3、视频分析仪(VA2.0)可部署在系统核心平台出口、边缘节点出口等,协助IPTV平台及网络运维部门监控网络运行中的质量状态,帮助定位故障。
4、视频分析探针(BA)可在VOD片源上线进行诊断。
5、离线片源测试仪。检测基于文件的数字视频音频内容,检查文件的正确性;可以检查出各种视频/音频故障(马赛克、静帧、黑屏、清晰度模糊、色彩异常、语法错误、亮度异常、音频异常等);可以给出准确的故障时间点报警功能;视频文件监测结果呈现。
6、维护人员可以根据用户观看的频道,从相关视频分析仪上引流,实时观看用户当前正在看的片源。
1.4最近一公里侧:
1、如果端口配置速率低于3M,则故障建议提示“用户端口配置速率不符合要求,请检查”这个字段必须要比对,如果当前接口没有值,不能影响下面的流程。
2、进行端口线路质量不达标的判断,标准是:
(1)、端口实际速率/端口配置速率<90%,则认为不达标;
(2)、(上or下行)端口的衰减>45dB,则认为不达标;
(3)、(上or下行)端口的容限<10dB,则认为不达标;
上述标准可以根据实际需要进行配置。
1.5DSLAM侧:
1、在DSLAM中,如果发现下联链路质量超过阀值,或者有机顶盒直连端口DOWN的告警,则可以直接定位为故障点。定位结束。
2、如果DSLAM产生相关性能告警(CPU、内存等),则通过此DSLAM,找出下挂所有机顶盒,算出下挂机顶盒的告警占比(故障机顶盒数量/所有该DSLAM相连(开机)机顶盒数),如占比过高,则此DSLAM可以定位为故障点;如占比过低,则暂不作为故障点。其中,所有该DSLAM相连(开机)机顶盒数根据iSA数据库中获取故障机顶盒数量isimp自行计算获取。
3、分析结束后,如图4所示,通过拓扑找出上联SWITCH(交换机)设备,继续进行分析。
4、根据不同的告警类型给出相对应的告警建议,主要针对相关的设备端口DOWN,设备DOWN、设备流量信息、设备性能信息,SNMP(简单网络管理协议)不可管理。
1.6SWITCH侧:
1、先通过拓扑关系,获取与故障机顶盒相连的DSLAM设备的链路列表。
2、遍历链路列表中网络设备,如果设备是SWITCH,通过分支定界判断该SWITCH是否可疑。
3、是否可疑可通过故障比进行判断,逻辑为:SWITCH的下级设备故障比例=(故障的DSLAM数+其他设备故障数)/(所有直接相连的DSLAM数+所有直接相连的其他设备数)。
4、如果某个SWITCH可疑,则获取该点的告警信息,性能信息(包括前面提到的设备丢包率),下级设备列表的相关报警信息构建拓扑信息共享树。
5、从拓扑信息共享树中查找该可疑的SWITCH是否在故障时间段内有告警,比如,直连的DSLAM端口相关告警,如端口DOWN等。
6、如有告警,则将该点的告警类型,等级,告警参数以及性能数据输入专家知识分析库以得到该点故障影响(比如,出现丢包,产生拥塞等方面)。
7、将此故障影响和该点下联设备的故障和性能参数进行匹配,如果匹配上则可定位为故障点;如没有,则暂不作为故障点。
8、针对可疑的故障点,根据机顶盒历史TRACE结果,进行概率判断,如某SWITCH被定为可疑的故障点,而链路经过该SWITCH的次数较多,则该SWITCH是故障点的可能性要大于其它的故障点。
9分析结束后,如图5所示,通过与故障机顶盒相连的DSLAM设备的链路列表找出上联BRAS设备,继续进行分析。
10根据不同的告警类型给出相对应的告警建议,主要针对相关的设备端口DOWN、设备DOWN、设备流量信息、设备性能信息、SNMP不可管理。
1.7BRAS侧:
1、遍历链路列表中网络设备,如果设备是BRAS,如图6所示,通过分支定界找出下联所有SWITCH设备,判断该BRAS是否可疑。
2、是否可疑可通过故障比进行判断,逻辑为:(故障的SWITCH数+故障的DSLAM数)/(所有直接相连的DSLAM数+所有直接相连的SWITCH数)
3、如果某个BRAS可疑,则获取该点的告警信息,性能信息(包括前面提到的丢包率),下级设备列表的相关报警信息构建拓扑信息共享树。
4、从拓扑信息共享树中查找该可疑的BRAS是否在故障时间段内有告警,比如,直连的SWITCH端口相关告警,如端口DOWN等。
5、如有告警,则将该点的告警类型,等级,告警参数以及性能数据输入专家知识分析库以得到该点故障影响(比如,出现丢包,产生拥塞等方面)。
6、将此故障影响和该点下联设备的故障和性能参数进行匹配,如果匹配上则可定位为故障点;如没有,则暂不作为故障点。
7、针对可疑的故障点,根据机顶盒历史TRACE结果,进行概率判断,如某BRAS被定为可疑的故障点,而链路经过该BRAS的次数较多,则该BRAS是故障点的可能性要大于其它的故障点。
8、根据不同的告警类型给出相对应的告警建议,主要针对相关的设备端口DOWN、设备DOWN、设备流量信息、设备性能信息、SNMP不可管理。
本发明的方法中,ONU、OLT或DSLAM节点故障定位流程如图10所示。
其节点故障定位,有端口down故障的判断条件为:
告警标题或者告警内容里,有下面的信息时为端口down:“端口down”或“NODE_DOWN",或"LINK_DOWN"或"PORTDOWN"或"PORT_DOWN";
有性能故障的判断条件为:
告警标题或者告警内容里有“阀值性能”或“流量拥塞”;
如果NODE_DOWN,给建议:网元中断;如果SNMP_DOWN,给建议:网元不可管理;
线路质量是否正常的判断条件为:
如果端口配置速率低于3M,则故障建议提示“用户端口配置速率不符合要求,请检查”。
而其它节点故障定位流程如图11所示。
本发明的IPTV网络中实现业务故障诊断定位的方法在实际应用中的总体流程图如图7所示,总体系统结构示意图如图8所示。
具体而言,本发明的方法中,对每个设备计算下属设备故障率,算法为:下属设备故障数/下属总设备数。(若下属设备为机顶盒,则下属总设备是指开机的机顶盒)。对各个网络设备所连接的机顶盒告警信息进行定期汇总。网络设备告警信息基于机顶盒上报的告警信息,在全流程拓扑和终到终网络拓扑按照拓扑上展现最近一个告警抑制周期的下属告警设备数量和比例,汇总时按照层级一级一级向上汇总,先汇总DSLAM,再汇总SWITCH以及BRAS,汇总SWITCH时,以下挂DSLAM故障数据进行汇总。汇总SWITCH时,以下挂SWITCH故障数据进行汇总。
故障汇总算法细节如下:
1、故障机顶盒的确认,如果机顶盒处于开机状态并且机顶盒的故障仍然没有结束,则认为该机顶盒处于故障状态。开机状态是指RES_STBDEVICESTATUS表中的机顶盒ONLINESTATUS字段不为空,并且等于1:在线),故障仍然没有结束是指TA_ACTIVEALARM表中的CLEARTIME为空。机顶盒故障等级的定义了六级:一级告警二级告警三级告警四级告警五级告警六级告警,一级告警级别最高,也是最严重的,六级告警为告警等级最低的告警
2、故障阈值,这里存在两个故障阈值,一个是DSLAM故障阈值,如果DSLAM的故障得分超过该阈值则认为是该DSLAM是故障的;另外一个是SWITCH故障阈值,如果SWITCH直接相连的DSLAM故障的百分比超过故障阈值,则认为该SWITCH是故障的。当前直接默认值都为20%。例如一个SWITCH下20%的DSLAM出现故障,则该SWITCH也是故障的。
3、网络设备故障等级的规定,
等级4: 0<下级设备故障比例<=10%,
等级3: 10%<下级设备故障比例<=25%
等级2: 25%<下级设备故障比例<=50%
等级1: 50%<下级设备故障比例
4、机顶盒故障汇总,后台程序会定期(可以设定为2分钟或其它预设时间)汇总故障的机顶盒数据,以map形式保存于内存中
5、网络拓扑关系的获取,读取设备连接表RES_DEVICERELATION中的所有数据,根据记录,构建,拓扑树状结构,对于每个节点,都会分析得出所有直接相连的设备,保存于节点对象(EntityNodeStatus)中。比如节点对象中会保存所有直接上级的SWITCH和DSLAM设备的节点对象
6、DSLAM设备故障等级计算:
A、找出DSLAM直接连接的所有机顶盒,即RES_DEVICERELATION表中的DST_MOID是DSLAM设备的id,再找出所有故障的机顶盒,及采用1中的故障确定方法获得故障的机顶盒数量,DSLAM的下级设备故障比例=故障机顶盒数量/所有该DSLAM相连(开机)机顶盒数。
7、SWITCH设备故障等级计算。
A、如果不存在该拓扑节点或者该设备没有和任何DSLAM设备相连,则认为没有故障;
B、如果该设备存在相连的DSLAM,则如果该DSLAM的故障得分超过了DSLAM的故障阈值(2种定义),则该DSLAM是故障的。
C、SWITCH的下级设备故障比例=(故障的DSLAM数+其他设备故障数)/(所有直接相连的DSLAM数+所有直接相连的其他设备数)。
8、BRAS设备故障等级计算。
A、如果不存在该拓扑节点或者该设备没有和任何SWITCH或者DSLAM设备相连,则认为没有故障。
B、如果该设备存在相连的DSLAM,则如果该DSLAM的故障得分超过了DSLAM的故障阈值(2种定义),则该DSLAM是故障的。
C、如果该设备存在相连的SWITCH,则如果该SWITCH的故障得分超过了SWITCH的故障阈值(2种定义),则该SWITCH是故障的。
D、BRAS的下级设备故障比例=(故障的SWITCH数+故障的DSLAM数)/(所有直接相连的DSLAM数+所有直接相连的SWITCH数)。
接口设计接口类
2.获取节点设备状态接口
根据故障定位的结果,将各设备的状态返回给页面。
在故障定位过程中,根据分支定界的结果判断一个节点是否可疑,分支定界流程提供给故障定位的接口为:
Java类OutageLocationProvider中,
public VoNodeStatus getDevOutage(Long moid);
分界定位的总流程如图12所示。
其中,方法名initActiveStbUnderDev的分界定位如下:
1、isa定期汇总(5分钟一次)各个dslam下的开机用户数:
sql如下:
2)isimp从isa的数据库中直接读取,保存到内存中:
如果该条数据的insert_time和当前时间的差距超过5分钟,则认为是无效的开机用户数(eg.一个设备下开机用户数之前为5,isa的数据库里存放为5;随后开机用户数变成了0,数据库里的开机用户数和时间都保留之前的,不会更新为0)
其中,方法名initAlarmStbUnderDev的分界定位如下:
从告警表里统计各设备下发生网络侧告警的机顶盒数:
方法名为ProcessDslam的计算adsl/onu/dslam节点是否告警的方法的流程具体如图13所示。而其它节点的流程则如图14所示。
本发明的IPTV网络中实现业务故障诊断定位的方法的主要特点在于:
1、自学习的专家知识库:用于对故障严重等级以及故障现象进行智能判断。通过对不断更新的故障分析训练集合的分析,不断优化专家知识库的规则库,从而使得故障严重等级以及故障现象的判断逐步逼近用户实际感受。
2、基于决策树的分支定界故障定位算法:分析故障点以及故障原因。从全IPTV业务网络中各节点获取到大量性能和故障信息,后通过将这些信息汇总构建共享决策树进行关联性分类以及分支定界,从而精确得到出故障可能性最大的故障节点以及产生故障的可能性最大的原因。
3、IPTV业务覆盖的全面性和伸缩性:可以根据整体质量状况,对海量设备中经常出故障的节点用各种固定式或移动式探针进行有针对性排查,无需全网部署探针,从而使得大大降低IPTV业务故障诊断成本,提高诊断效率。
采用了该发明的IPTV网络中实现业务故障诊断定位的方法,其故障定位系统依次对报修线路的电子节目菜单服务器、机顶盒、视频源、终端最后一公里、数字用户线路接入复用器、交换机和宽带远程接入服务器进行故障检测,确定故障点或疑似故障点,并最终给出故障点或疑似故障点信息,以此可及时在IPTV网络中准确定位所有故障发生点,并且提供故障建议,供设备抢修人员根据提示进行相关设备维护,极大简化了维护人员工作复杂性,提高了工作效率,进而有效提升IPTV用户体验的,且本发明的IPTV网络中实现业务故障诊断定位的方法实现方式简单,实现成本低廉,应用范围也较为广泛。
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。