CN113541982A - 网元的健康预警方法、装置、计算设备及计算机存储介质 - Google Patents

网元的健康预警方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN113541982A
CN113541982A CN202010292089.9A CN202010292089A CN113541982A CN 113541982 A CN113541982 A CN 113541982A CN 202010292089 A CN202010292089 A CN 202010292089A CN 113541982 A CN113541982 A CN 113541982A
Authority
CN
China
Prior art keywords
health degree
network element
health
degree loss
loss factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010292089.9A
Other languages
English (en)
Other versions
CN113541982B (zh
Inventor
亓玉娇
阮一荻
张卷卷
杨川
王巍
闫宇
郑治昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010292089.9A priority Critical patent/CN113541982B/zh
Publication of CN113541982A publication Critical patent/CN113541982A/zh
Application granted granted Critical
Publication of CN113541982B publication Critical patent/CN113541982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例涉及通信技术领域,公开了一种网元的健康预警方法、装置、计算设备及计算机存储介质,该方法包括:获取目标网元在各监控维度下的监控数据;根据监控数据确定目标网元在各监控维度下对应的健康度损失因子;根据健康度损失因子计算目标网元的健康度分值;根据健康度分值所在的区间确定目标网元的健康预警等级;根据健康预警等级发出预警信息。通过上述方式,本发明实施例实现了对网元的健康预警。

Description

网元的健康预警方法、装置、计算设备及计算机存储介质
技术领域
本发明实施例涉及通信技术领域,具体涉及一种网元的健康预警方法、装置、计算设备及计算机存储介质。
背景技术
网元设备的健康是通信网络正常运行的基础。
现有的网络监控方式是基于网元设备告警和性能告警的独立监控模式。某一网元产生设备告警或性能告警时,网络监控系统基于告警将工单派发给责任部门进行处理。同时,根据专家运维经验,选择重要的设备告警或性能告警进行重点监控,及时人工通知责任部门进行故障处理。
现有的网络监控方式仅能够对发生告警的网元进行处理,无法发现未发生告警的网元存在的问题,影响业务体验。
发明内容
鉴于上述问题,本发明实施例提供了一种网元的健康预警方法、装置、计算设备及计算机存储介质,用于解决现有技术中存在的无法对未发生告警的网元的健康状况进行预警的问题。
根据本发明实施例的一个方面,提供了一种网元的健康预警方法,所述方法包括:
获取目标网元在各监控维度的监控数据;
根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子;
根据所述健康度损失因子计算所述目标网元的健康度分值;
根据所述健康度分值所在的区间确定所述目标网元的健康预警等级;
根据所述健康预警等级发出预警信息。
在一种可选的方式中,所述监控维度包括设备告警,所述设备告警的监控数据包括所述目标网元的设备告警类型以及设备告警持续时间;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
获取所述设备告警类型以及所述设备告警持续时间;
如果所述设备告警持续时间大于时间阈值,则根据所述设备告警类型与健康度损失值之间的对应关系确定所述设备告警对应健康度损失值;
计算所述健康度损失值与所述设备告警对应的健康度损失因子初值之和,得到所述设备告警对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括性能指标;所述性能指标的监控数据包括所述目标网元的性能指标类别及相应的性能下降值;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
如果第一性能指标的性能下降值达到相应的阈值,则根据性能指标类别与健康度损失值之间的对应关系确定所述第一性能指标对应的健康度损失值;
计算所述健康度损失值与性能指标对应的健康度损失因子初值之和,得到性能指标对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括操作日志,所述操作日志的监控数据包括所述目标网元是否存在高危操作;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
根据所述目标网元是否存在高危操作确定相应的健康度损失因子,将确定的健康度损失因子作为所述操作日志对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括割接操作,所述割接操作的监控数据包括所述目标网元的割接操作类型;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
根据所述目标网元的割接操作类型确定相应的健康度损失因子,将确定的健康度损失因子作为所述操作日志对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括拨测维度,所述拨测维度的监控数据包括拨测失败次数和拨测告警类型;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
在未出现拨测告警时,在预设时间窗口内,每出现一次拨测失败,则在拨测告警对应的健康度损失因子初值的基础上累加一次拨测失败对应的健康度损失值;
在出现拨测告警时,根据拨测告警类型与健康度损失值之间的对应关系确定所述拨测告警类型对应的健康度损失值;
计算所述健康度损失值与拨测告警对应的健康度损失因子初值之和,得到拨测告警对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括业务投诉量,所述业务投诉量的监控数据包括业务投诉量增加百分比;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
根据所述业务投诉量增加百分比确定相应的健康损失因子,将确定的健康度损失因子作为所述业务投诉量对应的健康度损失因子。
在一种可选的方式中,在确定所述健康度损失因子之后,所述方法还包括:
如果预设时间段内各监控维度下的监控数据恢复至相应的正常值,则将各监控维度下的健康度损失因子恢复为相应的健康度损失因子初值。
根据本发明实施例的另一方面,提供了一种网元的健康预警装置,所述装置包括:
获取模块,用于获取目标网元在各监控维度的监控数据;
第一确定模块,用于根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子;
计算模块,用于根据所述健康度损失因子计算所述目标网元的健康度分值;
第二确定模块,用于根据所述健康度分值所在的区间确定所述目标网元的健康预警等级;
预警模块,用于根据所述健康预警等级发出预警信息。
根据本发明实施例的另一方面,提供了一种计算设备,所述计算设备包括处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的一种网元的健康预警方法的操作。
本发明实施例综合各监控维度下的健康度损失因子计算目标网元的健康度分值,根据健康度分值所在的区间确定目标网元的健康预警等级,并根据健康预警等级发出预警信息。通过上述方式,本发明实施例中对目标网元的健康预警综合了各个监控维度的信息,因此对目标网元的健康预警更加可靠。此外,通信网络中的各个网元对应的健康预警等级越高说明该网元存在故障隐患的可能性更高,根据健康预警等级更容易定位故障网元,便于运维人员进行故障排除,从而提高用户体验。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网元的健康预警方法的流程示意图;
图2示出了本发明实施例提供的一种网元的健康预警装置的结构示意图;
图3示出了本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
本发明实施例的应用场景是通信系统中各网元的健康预警。本发明实施例中的通信系统包括4G通信系统、5G通信系统等。在现有的通信系统中,监控系统对各网元进行监控,基于网元设备告警和性能告警等独立监控模式监控各网元的故障。但是一些网元的故障问题无法通过告警发现。这些网元的故障会影响业务体验,从而引起批量用户投诉。为了解决这一问题,本发明实施例通过多个维度的监控数据对各网元进行健康评估,根据各网元的健康预警等级发出预警信息,从而对于通信网络中的各个网元实现全面评估,以主动发现各网元存在的隐患。下面通过各具体实施方式对本发明各具体实施方式进行说明。
图1示出了本发明实施例的一种网元的健康预警方法的流程图。如图1所示,该方法包括以下步骤:
步骤110:获取目标网元在各监控维度的监控数据。
本发明实施例的执行主体是计算设备,例如,计算机。
在本步骤中,目标网元是通信网络中的任意一个网元。通信网络中的每一个网元均可以根据本发明实施例进行健康预警。以4G核心网络EPC为例,目标网元可以是MME网元、SGW网元、PGW网元、PCRF网元等。监控维度由各支撑系统的监控数据类别确定。各监控维度的监控数据是从各支撑系统获取的关于目标网元的多维监控数据。在一个具体实施方式中,监控维度共有六维,分别为:由故障管理系统接入的目标网元的设备告警;由运维监控系统接入的目标网元的性能指标;由综合管制系统引入的网元的操作日志;由电子运维系统(electric operation maintenance system,EMOS)引入的割接操作;由拨测系统接入的目标网元的拨测信息;由网投平台接入手机上网业务投诉量数据。
步骤120:根据监控数据确定目标网元在各监控维度下对应的健康度损失因子。
在本步骤中,健康度损失因子是由于各监控维度下的数据异常所造成的健康度损失分值。
设备告警下的监控数据包括目标网元的设备告警类型以及设备告警持续时间。其中,设备告警类型是目标网元发生告警的原因。例如,内部链路断开、单元重启等告警类型。设备告警持续时间用于表征设备告警在该时间段内是否自恢复。只有在设备告警持续时间大于时间阈值时,才会计算设备告警造成的健康度损失值。例如,时间阈值设置为30秒,如果设备告警持续时间大于30秒设备告警仍未恢复,则根据设备告警类型计算设备告警对应的健康度损失值。设备告警类型所表征的目标网元的健康问题越严重,健康度损失值越高。本发明实施例并不限定各设备告警类型对应的健康度损失值。例如,内部链路断开对应的健康度损失值为5分,单元重启对应的健康度损失值为2分。当发生内部链路断开的设备告警时,设备告警对应的健康度损失值在健康度损失值初值的基础上加5分。例如,设备告警对应的健康度损失值初值为0,则发生一次内部链路断开的设备告警后,设备告警对应的健康度损失值为5分。
可以理解的,在时间阈值内如果发生多种类型的设备告警,或者,同一种类型的设备告警反复发生,则将设备告警对应的健康度损失值叠加。例如,时间阈值内发生了两次内部链路断开和一次单元重启,则设备告警对应的健康度损失值为12分。假设设备告警对应的健康度损失值初值为0,则设备告警对应的健康度损失值为12分。
在目标网元的设备告警清除后,对目标网元进行观察,如果预设时间段内目标网元没有再次发生同一种设备告警,则健康度损失值恢复为健康度损失值初值。如果在预设时间段内再次发生同一种设备告警,则健康度损失值不再叠加相应的分值,但是预设时间段重新开始计算。如果预设时间段内目标网元发生其他类型的设备告警,则健康度损失值在恢复为健康度损失值初值之后,再根据预设时间段内发生的设备告警的类型重新计算健康度损失值。
性能指标的监控数据包括目标网元的性能指标类别以及各性能指标类别对应的性能下降值。其中,性能指标用于表征网元的性能。性能指标类别包括:PGW最大同时在线的用户数、寻呼成功率等。本发明实施例并不限定各性能指标类别对应的性能下降值。例如,对于PGW最大同时在线的用户数,其性能下降值为连续两个周期环比波动值。如果连续两个周期PGW最大同时在线的用户数环比波动5%,则根据PGW最大同时在线的用户数与健康度损失值之间的对应关系确定PGW最大同时在线的用户数对应的健康度损失值。寻呼成功率的性能下降值为寻呼成功率的比值,如果寻呼成功率小于80%,则根据寻呼成功率对应的健康度损失值确定寻呼成功率对应的健康度损失值。本发明实施例并不限定各性能指标对应的健康度损失值。例如,在一个具体的实施方式中,PGW最大同时在线的用户数对应的健康度损失值为5分,寻呼成功率对应的健康度损失值为10分。即,如果PGW最大同时在线用户数连续两个周期环比波动5%,则健康度损失因子为在健康度损失因子初值上加5分。如果寻呼成功率小于80%,则健康度损失因子为在健康度损失因子初值上加10分。假设性能指标对应的健康度损失因子初值为0分,则当目标网元的PGW最大同时在线用户数连续两个周期环比波动5%时,健康度损失因子更新为5分。
可以理解的,如果同时出现多个性能指标的性能下降值达到相应的阈值,则健康度损失因子在健康度损失因子初值的基础上加上对应的健康度损失值。例如,如果同时出现PGW最大同时在线的用户数连续两个周期环比波动5%,寻呼成功率小于80%,则健康度损失因子在健康度损失因子初值的基础上加15分。
对目标网元的性能指标实时计算,如果同一个性能指标未恢复正常,则健康度损失值不再叠加相应的分值。如果出现新的性能指标的性能下降值达到相应的阈值,则健康度损失值叠加相应的分值,同样的,健康度损失因子也增加相应的分值。如果性能指标恢复正常,则健康度损失值恢复为健康度损失值初值。
操作日志的监控数据包括目标网元是否存在高危操作。高危操作包括影响到业务的升级的打补丁、扩容等高危险性的操作。如果目标网元存在高危操作,则操作日志对应的健康度损失因子为第一数值;如果目标网元不存在高危操作,则操作日志对应的健康损失因子为第二数值。本发明实施例并不限定第一数值和第二数值的具体值。例如,在一种具体的实施方式中,第一数值为2,第一数值为1。即,如果目标网元存在高危操作,则操作日志对应的健康度损失因子为2,如果目标网元不存在高危操作,则操作日志对应的健康度损失因子为1。
在一些实施例中,如果目标网元的操作日志在一定时间窗口内的监控数据表征高危操作消失,则操作日志对应的健康度损失因子为1。
割接操作的监控数据包括目标网元的割接操作类型。割接操作类型包括设备入网、业务上线、硬件扩容、版本升级等。每一种割接操作类型对应于一个健康度损失因子。各种割接操作类型按照割接操作对目标网元的影响程度用A-F类表示,A-D类割接操作对网元的影响程度最大,E类割接操作对网元的影响程度次之,F类对网元的影响程度最小。例如,在一个具体的实施方式中,无割接操作或者F类割接操作对应的健康度损失因子为1;A—D类割接操作对应的健康度损失因子为2;E类工程操作对应的健康度损失因子为1.5。各类割接操作对应的健康度损失因子可以由本领域技术人员进行设定,本发明实施例并不以此为限。
在一些实施例中,如果割接操作结束,则割接操作对应的健康度损失因子恢复为无割接操作时对应的健康度损失因子。
在未出现拨测告警时,拨测维度的监控数据包括拨测失败次数,在预设时间窗口内每出现一次拨测失败,则在拨测维度对应的健康度损失因子初值的基础上累加一次拨测失败对应的健康度损失值。例如,一次拨测失败对应的健康度损失值为1分,拨测维度对应的健康度损失因子初值为0,预设时间窗口为30分钟,如果30分钟内发生了5次拨测失败,则拨测维度对应的健康度损失因子变为5分。
如果在该时间窗口内出现拨测告警,则拨测维度对应的健康度损失因子恢复为拨测告警对应的健康度损失因子初值,并根据拨测告警类型与健康度损失因子之间的对应关系确定拨测告警类型对应的健康度损失值。将确定的健康度损失值与拨测告警对应的健康度损失因子加和,得到拨测告警对应的健康度损失因子。其中,拨测告警类别包括PCU全阻拨测告警、仿真enodeB全阻拨测告警等。拨测告警越严重,健康度损失值越高。本发明实施例并不限定各拨测告警类别对应的健康度损失值。一些拨测告警类别对应的健康度损失值可以相同。例如,PCU全阻拨测告警对应的健康度损失值为10分,仿真enodeB全阻拨测告警对应的健康度损失值为20分,其余类型的拨测告警对应的健康度损失值为5分。假设拨测维度对应的健康度损失因子初值为0,在时间窗口内发生PCU全阻拨测告警时,健康度损失因子变为10分。
如果在一定时间拨测告警消除,则拨测告警对应的健康度损失因子恢复为拨测维度对应的健康度损失因子初值。
业务投诉量维度的健康数据包括业务投诉量增加百分比。目标网元在特定的投诉量增加百分比时对应一个健康度损失因子。例如,目标网元的业务投诉量较日常增加40%、60%、75%时,对应的健康度损失因子分别为1.5、3、5。
如果目标网元为SAEGW网元,则根据SAEGW网元的设备厂商组网方式,如果某一设备厂家的至少两个地区同时出现业务投诉量增加百分比达到相应的数值时,对应的健康度损失因子更新为相应的数值。例如,至少两个地区的业务投诉量增加百分比达到60%,对应的健康度损失因子为3。
如果业务投诉量恢复至正常值,则健康度损失因子恢复至健康度损失因子初值。
步骤130:根据健康度损失因子计算目标网元的健康度分值。
在本发明实施例中,健康度分值的计算方法是在满分的基础上减去所有监控维度的总健康度损失因子。在本发明实施例中,目标网元的各监控维度并非完全独立的,当其中某一个监控维度异常时,其他监控维度的监控数据会受到影响。例如,当存在高危操作或者割接操作时,对其他监控维度会产生影响。在一个具体的实施方式中,所有监控维度的总健康度损失因子的计算方法为:高危操作或者割接操作对应的健康度损失因子的最大值与其余监控维度之和的乘积。用A、B、C、D、E、F分别表示设备告警、性能指标、操作日志、割接操作、拨测维度和业务投诉量对应的健康度损失因子,则所有健康维度的总健康度损失因子可以表示为:max(C,D)×(A+B+E+F)。假设监控度分值满分为100分,则综合六个维度得到的目标网元的健康度分值为:100-max(C,D)×(A+B+E+F)。
在一些实施例中,各监控维度对应的健康度损失因子的比重不同,比如,A、B、E、F对应的健康度损失因子的比重分别为α、β、∈和ф,则目标网元的健康度分值为:100-max(C,D)×(αA+βB+εE+φF)。
步骤140:根据健康度分值所在的区间确定目标网元的健康预警等级。
在本步骤中,健康度分值越高表示目标网元越健康,目标网元的健康预警等级越低。例如,在一个具体的实施方式中,健康度分值小于60分时,对应的目标网元的健康预警等级为一级;健康度分值大于或等于60分小于70分时,对应的目标网元的健康预警等级为二级;健康度分值大于或等于70分小于80分时,对应的目标网元的健康预警等级为三级;健康度分值大于或等于80分小于90分时,对应的目标网元的健康预警等级为四级。健康度分值在90分以上时,对应的目标网元不会发出健康预警。
步骤150:根据健康等级发出预警信息。
在本步骤中,一个健康等级对应一种预警信息。本发明实施例并不限定各健康等级对应的预警信息的具体类别。例如,各健康等级以不同颜色的光作为预警信息,或者,各健康等级以不同频率的声响作为预警信息。
本发明实施例综合各监控维度下的健康度损失因子计算目标网元的健康度分值,根据健康度分值所在的区间确定目标网元的健康预警等级,并根据健康预警等级发出预警信息。通过上述方式,本发明实施例中对目标网元的健康预警综合了各个监控维度的信息,因此对目标网元的健康预警更加可靠。此外,通信网络中的各个网元对应的健康预警等级越高说明该网元存在故障隐患的可能性更高,根据健康预警等级更容易定位故障网元,便于运维人员进行故障排除,从而提高用户体验。
图2示出了本发明另一个实施例的一种网元的健康预警装置的功能框图。如图2所示,该装置包括:获取模块210、第一确定模块220、计算模块230、第二确定模块240和预警模块250。其中,获取模块210用于获取目标网元在各监控维度的监控数据。第一确定模块220用于根据监控数据确定目标网元在各监控维度下对应的健康度损失因子。计算模块230用于根据健康度损失因子计算目标网元的健康度分值。第二确定模块240用于根据所述健康度分值所在的区间确定所述目标网元的健康预警等级。预警模块250用于根据健康预警等级发出预警信息。
在一种可选的方式中,所述监控维度包括设备告警,所述设备告警的监控数据包括所述目标网元的设备告警类型以及设备告警持续时间;所述第一确定模块220具体用于:
获取所述设备告警类型以及所述设备告警持续时间;
如果所述设备告警持续时间大于时间阈值,则根据所述设备告警类型与健康度损失值之间的对应关系确定所述设备告警对应健康度损失值;
计算所述健康度损失值与所述设备告警对应的健康度损失因子初值之和,得到所述设备告警对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括性能指标;所述性能指标的监控数据包括所述目标网元的性能指标类别及相应的性能下降值;所述第一确定模块220具体用于:
如果第一性能指标的性能下降值达到相应的阈值,则根据性能指标类别与健康度损失值之间的对应关系确定所述第一性能指标对应的健康度损失值;
计算所述健康度损失值与性能指标对应的健康度损失因子初值之和,得到性能指标对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括操作日志,所述操作日志的监控数据包括所述目标网元是否存在高危操作;所述第一确定模块220具体用于:
根据所述目标网元是否存在高危操作确定相应的健康度损失因子,将确定的健康度损失因子作为所述操作日志对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括割接操作,所述割接操作的监控数据包括所述目标网元的割接操作类型;所述第一确定模块220具体用于:
根据所述目标网元的割接操作类型确定相应的健康度损失因子,将确定的健康度损失因子作为所述操作日志对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括拨测维度,所述拨测维度的监控数据包括拨测失败次数和拨测告警类型;所述第一确定模块220具体用于:
在未出现拨测告警时,在预设时间窗口内,每出现一次拨测失败,则在拨测告警对应的健康度损失因子初值的基础上累加一次拨测失败对应的健康度损失值;
在出现拨测告警时,根据拨测告警类型与健康度损失值之间的对应关系确定所述拨测告警类型对应的健康度损失值;
计算所述健康度损失值与拨测告警对应的健康度损失因子初值之和,得到拨测告警对应的健康度损失因子。
在一种可选的方式中,所述监控维度包括业务投诉量,所述业务投诉量的监控数据包括业务投诉量增加百分比;所述第一确定模块220具体用于:
根据所述业务投诉量增加百分比确定相应的健康损失因子,将确定的健康度损失因子作为所述业务投诉量对应的健康度损失因子。
在一种可选的方式中,上述装置还包括恢复模块260,用于在预设时间段内各监控维度下的监控数据恢复至相应的正常值时,将各监控维度下的健康度损失因子恢复为相应的健康度损失因子初值。
本发明实施例综合各监控维度下的健康度损失因子计算目标网元的健康度分值,根据健康度分值所在的区间确定目标网元的健康预警等级,并根据健康预警等级发出预警信息。通过上述方式,本发明实施例中对目标网元的健康预警综合了各个监控维度的信息,因此对目标网元的健康预警更加可靠。此外,通信网络中的各个网元对应的健康预警等级越高说明该网元存在故障隐患的可能性更高,根据健康预警等级更容易定位故障网元,便于运维人员进行故障排除,从而提高用户体验。
图3示出了本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图3所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于网元的健康预警方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机可执行指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以被处理器402调用使计算设备执行图1中的步骤110~步骤150以及实现图2中的模块110~模块160的功能。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在计算上运行时,使得所述计算执行上述任意方法实施例中的网元的健康预警方法。
可执行指令具体可以用于使得计算设备执行图1中的步骤110~步骤150以及实现图2中的模块110~模块160的功能。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使计算设备执行上述任意方法实施例中的网元的健康预警方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的网元的健康预警方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种网元的健康预警方法,其特征在于,所述方法包括:
获取目标网元在各监控维度的监控数据;
根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子;
根据所述健康度损失因子计算所述目标网元的健康度分值;
根据所述健康度分值所在的区间确定所述目标网元的健康预警等级;
根据所述健康预警等级发出预警信息。
2.根据权利要求1所述的方法,其特征在于,所述监控维度包括设备告警,所述设备告警的监控数据包括所述目标网元的设备告警类型以及设备告警持续时间;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
如果所述设备告警持续时间大于时间阈值,则根据所述设备告警类型与健康度损失值之间的对应关系确定所述设备告警对应健康度损失值;
计算所述健康度损失值与所述设备告警对应的健康度损失因子初值之和,得到所述设备告警对应的健康度损失因子。
3.根据权利要求1所述的方法,其特征在于,所述监控维度包括性能指标;所述性能指标的监控数据包括所述目标网元的性能指标类别以及各性能指标类别对应的性能下降值;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
如果第一性能指标的性能下降值达到相应的阈值,则根据性能指标类别与健康度损失值之间的对应关系确定所述第一性能指标对应的健康度损失值;
计算所述健康度损失值与性能指标对应的健康度损失因子初值之和,得到性能指标对应的健康度损失因子。
4.根据权利要求1所述的方法,其特征在于,所述监控维度包括操作日志,所述操作日志的监控数据包括所述目标网元是否存在高危操作;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
根据所述目标网元是否存在高危操作确定相应的健康度损失因子;
将确定的健康度损失因子作为所述操作日志对应的健康度损失因子。
5.根据权利要求1所述的方法,其特征在于,所述监控维度包括割接操作,所述割接操作的监控数据包括所述目标网元的割接操作类型;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
根据所述目标网元的割接操作类型确定相应的健康度损失因子,将确定的健康度损失因子作为所述操作日志对应的健康度损失因子。
6.根据权利要求1所述的方法,其特征在于,所述监控维度包括拨测维度,所述拨测维度的监控数据包括拨测失败次数和拨测告警类型;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
如果预设时间窗口内未出现拨测告警,则每出现一次拨测失败,在拨测告警对应的健康度损失因子初值的基础上累加一次拨测失败对应的健康度损失值;
Figure FDA0002450790860000021
预设时间窗口内出现拨测告警,则根据所述拨测告警类型与健康度损失值之间的对应关系确定所述拨测告警类型对应的健康度损失值;
计算所述健康度损失值与所述拨测告警对应的健康度损失因子初值之和,得到所述拨测告警对应的健康度损失因子。
7.根据权利要求1所述的方法,其特征在于,所述监控维度包括业务投诉量,所述业务投诉量的监控数据包括业务投诉量增加百分比;所述根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子,包括:
根据所述业务投诉量增加百分比确定相应的健康度损失因子;
将确定的健康度损失因子作为所述业务投诉量对应的健康度损失因子。
8.根据权利要求2-7任一项所述的方法,其特征在于,在确定所述健康度损失因子之后,所述方法还包括:
如果预设时间段内各监控维度下的监控数据恢复至相应的正常值,则将各监控维度下的健康度损失因子恢复为相应的健康度损失因子初值。
9.一种网元的健康预警装置,其特征在于,所述装置包括:
获取模块,用于获取目标网元在各监控维度的监控数据;
第一确定模块,用于根据所述监控数据确定所述目标网元在各监控维度下对应的健康度损失因子;
计算模块,用于根据所述健康度损失因子计算所述目标网元的健康度分值;
第二确定模块,用于根据所述健康度分值所在的区间确定所述目标网元的健康预警等级;
预警模块,用于根据所述健康预警等级发出预警信息。
10.一种计算设备,其特征在于,所述计算设备包括处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-8任意一项所述的一种网元的健康预警方法的操作。
CN202010292089.9A 2020-04-14 2020-04-14 网元的健康预警方法、装置、计算设备及计算机存储介质 Active CN113541982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010292089.9A CN113541982B (zh) 2020-04-14 2020-04-14 网元的健康预警方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010292089.9A CN113541982B (zh) 2020-04-14 2020-04-14 网元的健康预警方法、装置、计算设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN113541982A true CN113541982A (zh) 2021-10-22
CN113541982B CN113541982B (zh) 2023-04-28

Family

ID=78119999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010292089.9A Active CN113541982B (zh) 2020-04-14 2020-04-14 网元的健康预警方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113541982B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114465908A (zh) * 2021-12-20 2022-05-10 中盈优创资讯科技有限公司 一种5gc网络割接事件异常影响分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN106209920A (zh) * 2016-09-19 2016-12-07 贵州白山云科技有限公司 一种dns服务器的安全防护方法以及装置
CN109376877A (zh) * 2018-10-11 2019-02-22 华自科技股份有限公司 设备运维预警方法、装置、计算机设备和存储介质
CN110659832A (zh) * 2019-09-26 2020-01-07 北京市天元网络技术股份有限公司 检测5g网元健康度的方法和设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN106209920A (zh) * 2016-09-19 2016-12-07 贵州白山云科技有限公司 一种dns服务器的安全防护方法以及装置
CN110798469A (zh) * 2016-09-19 2020-02-14 贵州白山云科技股份有限公司 一种dns服务器的安全防护方法以及装置
CN109376877A (zh) * 2018-10-11 2019-02-22 华自科技股份有限公司 设备运维预警方法、装置、计算机设备和存储介质
CN110659832A (zh) * 2019-09-26 2020-01-07 北京市天元网络技术股份有限公司 检测5g网元健康度的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114465908A (zh) * 2021-12-20 2022-05-10 中盈优创资讯科技有限公司 一种5gc网络割接事件异常影响分析方法
CN114465908B (zh) * 2021-12-20 2023-08-08 中盈优创资讯科技有限公司 一种5gc网络割接事件异常影响分析方法

Also Published As

Publication number Publication date
CN113541982B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN112162907A (zh) 基于监控指标数据的健康度评估方法
CN109308252B (zh) 一种故障定位处理方法及装置
CN108989132A (zh) 故障告警处理方法、系统及计算机可读存储介质
CN116049146B (zh) 一种数据库故障处理方法、装置、设备及存储介质
CN110727533A (zh) 一种告警的方法、装置、设备和介质
CN113792554A (zh) 一种基于知识图谱的变更影响评估方法和装置
CN115396289A (zh) 一种故障告警确定方法、装置、电子设备及存储介质
CN113157536A (zh) 一种告警分析方法、装置、设备和存储介质
CN114816917A (zh) 监测数据处理方法、装置、设备及存储介质
CN113541982A (zh) 网元的健康预警方法、装置、计算设备及计算机存储介质
CN114338372A (zh) 网络信息安全监控方法及系统
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN114116391A (zh) Redis实例的健康检测方法、装置、设备及存储介质
CN114238020A (zh) 多维度的高精度智能业务监控方法及系统
CN112256470A (zh) 故障服务器定位方法及装置、存储介质及电子设备
CN116668264A (zh) 一种告警聚类的根因分析方法、装置、设备及存储介质
CN108809673A (zh) 一种故障报警的方法及装置
CN116226644A (zh) 设备故障类型的确定方法、装置、电子设备及存储介质
CN115580528A (zh) 故障根因定位方法、装置、设备及可读存储介质
CN112491584B (zh) 服务运行安全状况判定方法、装置、电子介质及存储介质
CN114760190A (zh) 一种面向服务的融合网络性能异常检测方法
CN113408642A (zh) 基于知识库专家规则的故障触发匹配方法、系统和介质
CN115209452A (zh) 核心网隐患排查方法、装置、电子设备和存储介质
CN104852810A (zh) 一种业务平台异常的确定方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant