CN112003765B - 网关故障诊断方法、系统、服务器及存储介质 - Google Patents

网关故障诊断方法、系统、服务器及存储介质 Download PDF

Info

Publication number
CN112003765B
CN112003765B CN202010811434.5A CN202010811434A CN112003765B CN 112003765 B CN112003765 B CN 112003765B CN 202010811434 A CN202010811434 A CN 202010811434A CN 112003765 B CN112003765 B CN 112003765B
Authority
CN
China
Prior art keywords
gateway
condition
index
fault diagnosis
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010811434.5A
Other languages
English (en)
Other versions
CN112003765A (zh
Inventor
程哲欣
余贤雷
方祥
吕书瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010811434.5A priority Critical patent/CN112003765B/zh
Publication of CN112003765A publication Critical patent/CN112003765A/zh
Application granted granted Critical
Publication of CN112003765B publication Critical patent/CN112003765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例涉及网络通讯技术领域,公开了一种网关故障诊断方法、系统、服务器及存储介质。网关故障诊断方法包括:以收集到的网关的多个运行指标的检测值,作为判断网关性能劣化是否处于劣化状态的动态依据;从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则,作为个性化判断标准。本发明中,由于不同的网关可以对应不同的故障诊断规则,即对于每个网关而言,其对应的故障诊断规则是与其属性匹配的,因此,可以提高网关故障诊断的准确度。

Description

网关故障诊断方法、系统、服务器及存储介质
技术领域
本发明实施例涉及网络通讯领域,特别涉及网关故障诊断方法、系统、服务器及存储介质。
背景技术
家庭网关在实际使用中,由于网关系统程序进程占用系统资源未回收、网关系统程序出现内存泄漏或句柄泄漏、网关因固件老化长时间持续运行等原因,使得系统资源使用率居高不下,从而导致网关运行性能持续降低甚至断开与网络端的连接。
性能劣化网关直接影响用户上网体验,对运营商宽带网络服务质量造成负面影响,现有技术中判断性能劣化的规范,可能对家庭网关性能状态存在误判。
发明内容
本发明实施方式的目的在于提供网关故障诊断方法,用以提升网关故障诊断方法准确度。
为解决上述技术问题,本发明的实施方式提供了一种网关故障诊断方法,包括以下步骤:收集网关的多个运行指标的检测值;从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则;根据所述多个运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况。
本发明的实施方式还提供了一种网关故障诊断系统,包括:收集模块:收集网关的多个运行指标的检测值;匹配模块:从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则;诊断模块:根据所述多个运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况。
本发明的实施方式还提供了一种服务器,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一网关故障诊断方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述的网关故障诊断方法。
本发明实施方式相对于现有技术而言,以收集到的网关运行数据作为判断网关性能劣化的动态依据,从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则,作为个性化判断标准;由于不同的网关可以对应不同的故障诊断规则,即对于每个网关而言,其对应的故障诊断规则是与其属性匹配的,因此,可以提高网关故障诊断的准确度。
另外,根据所述运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况,包括:若所述多个运行指标中存在至少一运行指标的检测值满足预设的边界条件,对满足所述边界条件的运行指标的检测值进行预处理;其中,所述边界条件是指所述运行指标的检测值位于所述运行指标对应的指标阈值的边界范围内;根据预处理后的运行指标的检测值、所述多个运行指标中未预处理的运行指标的检测值,以及所述故障诊断规则,确定所述网关的劣化情况。本实施例中,为了提高网关故障诊断在指标阈值的边界范围的准确性,对满足边界条件的检测值进行预处理。
另外,预处理为加权处理,所述加权处理的公式为:
Figure BDA0002631089970000021
x为所述运行指标的检测值,θ为所述故障诊断规则对应的指标阈值,f(x)为预处理后的运行指标的检测值。
另外,判断方式包括:若所述多个运行指标中的M个运行指标满足第一条件且所述多个运行指标中的N个运行指标满足第二条件,所述网关处于劣化状态;其中,M、N均为自然数。
另外,判断方式还包括第三条件;所述根据所述运行指标的检测值和所述故障诊断规则,选择对应的判断方式,确定所述网关的劣化情况,包括:若所述M个运行指标中至少一个所述运行指标的检测值位于所述运行指标对应的指标阈值的边界范围内,且满足以下条件,确定所属网关处于劣化状态;所述条件包括:所述M个运行指标的指标值满足所述第三条件和或所述N个运行指标满足所述第二条件;若任一所述运行指标的检测值非位于所述运行指标对应的指标阈值的边界范围内,所述M个运行指标的指标值满足所述第一条件、所述N个运行指标的指标值满足所述第二条件,确定所述网关处于劣化状态。本实施例中,对于存在满足边界条件的检测值和不存在满足边界条件的检测值这两种情况,采用不同的条件组合方式进行故障诊断;即基于运行指标的检测值本身的特性来选择用于故障诊断的条件,从而可以提高对家庭网关状态诊断的准确率。
另外,所述第一条件包括:所述M个运行指标中至少存在一个运行指标的检测值,大于所述运行指标对应的指标阈值;所述第二条件包括:所述N个运行指标的检测值分别大于所述N个运行指标对应的指标阈值;所述第三条件包括:对所述M个运行指标的检测值进行加权运算得到的运算值大于预设的运算值阈值。本实施例中提供了第一条件、第二条件、第三条件的具体内容;第三条件中对不同运行指标的指标值进行了不同加权,可以体现出不同运行指标的重要程度以及对于故障判断的影响程度;由于满足边界条件的检测值实际上反映出网关的劣化情况,处于边界条件的检测值对故障判断的影响程度无法准确判断,在进行预处理后可以更好地区分网关的劣化情况,所以当存在满足边界条件的检测值时,采用第三条件代替第一条件。例如,设置CPU使用率的阈值为30%、内存使用率的阈值为70%,边界范围为±3%,若收集到CPU使用率的检测值位于27%至33%间或内存使用率的检测值为67%至73%间,使用第二和第三条件判断网关的劣化情况;若收集到CPU使用率的检测值位于27%至33%之外且内存使用率的检测值位于67%至73%之外,则采用第一和第二条件判断网关的劣化情况。
另外,从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则之前,还包括:若所述运行指标的检测值出现异常,从所述网关获取所述网关的关键进程的运行情况;其中,所述关键进程是指运行情况能够反映所述网关联网是否正常的进程;根据所述关键进程的运行情况确定所述网关的劣化情况;其中,所述关键进程的运行情况表征所述网关联网异常时,所述网关的劣化情况为处于劣化状态。考虑了可能会出现数据溢出或系统错误,此时所采集到的运行指标的检测值无法作为判断网关是否劣化的可靠依据,因此,利用网关的关键进程的运行情况来判断网关是否处于劣化状态,其中,关键进程运行情况表征为联网异常时,该网关判定为性能劣化网关。本实施例的方案,考虑到了网关处于劣化状态的不同原因,从而针对不同原因制定了不同的判断方式,提高了对于家庭网关的故障诊断的准确性。
另外,根据所述运行数据和所述故障诊断规则,选择对应的判断方式,确定所述网关的劣化情况中,若所述劣化情况为所述网关处于劣化状态,记录所述网关处于劣化状态的判断依据,制定所述网关的重启策略,包括:若所述判断依据为所述网关的关键进程的运行情况,将所述网关的重启策略制定为立即重启;若所述判断依据为所述网关的多个运行指标的检测值,将所述网关的重启策略制定为定时重启或达到指定条件重启。由于不同的判断依据对应不同的劣化原因,因此,本实施例中对由不同原因导致性能劣化网关采用不同重启策略,使得对性能劣化网关的修复过程更具有针对性和及时也使得网关修复过程更智能和人性化,提升用户体验。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明第一实施方式的网关故障诊断方法的示意图;
图2是根据本发明第二实施方式的网关故障诊断方法的示意图;
图3是根据本发明第三实施方式的网关故障诊断方法的示意图;
图4是根据本发明第四实施方式的网关故障诊断方法的示意图;
图5是根据本发明第五实施方式的网关故障诊断方法的示意图;
图6是根据本发明第六实施方式的网关故障诊断方法的示意图;
图7是根据本发明第七实施方式的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明实施例主要由服务器端收集网关的多个运行指标的检测值;从而在从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则;最终根据多个运行指标的检测值和故障诊断规则,确定网关的劣化情况。
本发明的第一实施方式涉及一种网关故障诊断方法。具体流程如图1所示:
步骤101,收集网关的多个运行指标的检测值。
步骤102,从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则。
步骤103,根据多个运行指标的检测值和故障诊断规则,确定网关的劣化情况。
本实施方式以收集到的网关运行数据作为判断网关是否处于劣化状态的动态依据,从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则,作为个性化判断标准;由于不同的网关可以对应不同的故障诊断规则,即对于每个网关而言,其对应的故障诊断规则是与其属性匹配的,因此,可以提高网关故障诊断的准确度。
下面对本实施方式的网关故障诊断方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
步骤101在一个例子中,系统可定期收集网关的多个运行指标的检测值,为了动态化更新待检测网关的实时状态,使得网关故障诊断方法的结果的准确性提高。
步骤102在一个例子中,网关属性信息包括以下其中之一或任意组合:网关所属的地理区域、网关的生产厂商、网关的型号。由于不同型号的网关生产标准不同,不同生产厂商的网关的出厂标准不同,不同地理区域的网关所处的自身网络环境不同,从而,不同网关的性能的评估方式应当是不同的,所以选择对不同网关属性信息制定对应的故障诊断规则。然而,本实施例对该网关属性信息具体包含的内容不作任何限定,凡是会影响网关性能评估方式的属性信息,都可以用来参与对该种网关的故障诊断规则的制定。
步骤103在一个例子中,使用不同条件对运行指标检测值进行判断处理,可选的第一条件包括:M个运行指标中至少存在一个运行指标的检测值大于运行指标对应的指标阈值;第二条件包括:N个运行指标的检测值分别大于N个运行指标对应的指标阈值。可以设定M为2,M个运行指标包括CPU使用率、内存使用率;N为1,N个运行指标包括持续运行时长。若多个运行指标中的M个运行指标满足第一条件且多个运行指标中的N个运行指标满足第二条件,网关处于劣化状态;即若CPU使用率、内存使用率至少一检测值大于运行指标对应的阈值,且持续运行时长检测值大于运行指标对应的阈值,则网关处于劣化状态。
在一个例子中,M个运行指标包括,CPU使用率、内存使用率和持续运行时长;N为0.即若CPU使用率、内存使用率和持续运行时长,至少一检测值大于运行指标对应的阈值,则网关处于劣化状态。
在一个例子中,M个运行指标包括,持续运行时长和内存使用率;N个运行指标包括CPU使用率。即若持续运行时长和内存使用率,至少一检测值大于运行指标对应的阈值,且CPU使用率检测值大于运行指标对应的阈值,则网关处于劣化状态。
另外,运行指标还包括:主芯片温度;由于CPU使用率大于对应的指标阈值而产生的上报次数,占预设周期内总上报次数的比例;由于内存使用率大于对应的指标阈值而产生的上报次数,占预设周期内总上报次数的比例;网关发射/接收光功率;发射/接收光功率小于对应指标阈值而产生的上报次数,占预设周期内总上报次数比例;预设周期内设备掉线的次数;预设周期内拨号失败的次数;TCP连接状态,例如TCP连接时延超限率=平均TCP连接时延>300ms的上报周期数/统计总周期数;丢包重传超限率,例如丢包或重传率>5%的上报周期数/统计总周期数;端口速率;指定网页访问时延;进程数;无线信号强度。
在一个例子中,M个运行指标包括,由于CPU使用率大于对应的指标阈值而产生的上报次数占预设周期内总上报次数的比例,和由于内存使用率大于对应的指标阈值而产生的上报次数占预设周期内总上报次数比例;N个运行指标包括持续运行时长。即若由于CPU使用率大于对应的指标阈值而产生的上报次数占预设周期内总上报次数的比例,和由于内存使用率大于对应的指标阈值而产生的上报次数占预设周期内总上报次数比例,至少一检测值大于对应的指标阈值,且持续运行时长检测值大于运行指标对应的阈值,则网关处于劣化状态。
在一个例子中,M个运行指标包括,CPU使用率、内存使用率和主芯片温度;N个运行指标包括持续运行时长。即若CPU使用率、内存使用率和主芯片温度,至少一检测值大于对应的指标阈值,且持续运行时长检测值大于运行指标对应的阈值,则网关处于劣化状态。
本发明的第二实施方式是涉及一种网关故障诊断方法,具体流程如图2所示:
步骤201,收集网关的多个运行指标的检测值。
步骤202,从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则。
步骤203,判断多个运行指标的检测值中是否存在至少一检测值满足预设的边界条件;若是,则先进入步骤204,再进入步骤205;若否,则直接进入步骤205。
步骤204,对满足边界条件的运行指标的检测值进行预处理。
步骤205,根据上一步骤所得到的运行指标的检测值,以及故障诊断规则,确定网关的劣化情况。
本实施方式中,步骤201至步骤202与第一实施方式中大致相同,不再赘述;不同之处在于本实施方式对于收集到的运行指标的检测值进行判断和预处理,有利于提升最终判断的准确度。
下面对本实施方式的网关故障诊断方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
步骤203在一个例子中,预设边界条件是指运行指标的检测值位于故障诊断规则对应的指标阈值的边界范围内,例如可设阈值±3%内数据为边界范围。即若存在收集网关的运行指标的检测值,处于该故障诊断规则所对应的阈值边界范围内,则对该运行指标的检测值进行预处理。
在一个例子中,预处理为加权处理,该加权处理方式可以用如下公式表示:
Figure BDA0002631089970000061
x为运行指标的检测值,θ为该故障诊断规则的对应阈值,f(x)为预处理后的运行指标的检测值。例如:对CPU使用率设置阈值为30%,阈值的边界范围设定为±3%,则若检测值为27%,经过该预处理后的检测值为29.9991%k,k为非0的实数。
步骤205中依据上一步骤得到的运行指标的检测值可以分为两种情况。若上一步为步骤203,则上一步骤得到的运行指标的检测值,为步骤201所收集网关的多个运行指标的检测值;若上一步骤为步骤204,则上一步骤所得到的运行指标的检测值,包括预处理后的运行指标的检测值和多个运行指标中未预处理的检测值。
其中,步骤203至步骤205可以理解为是根据多个运行指标的检测值和故障诊断规则,确定网关的劣化情况这一步骤的一种具体实现方式。
本发明的第三实施方式是涉及一种网关故障诊断方法,具体流程如图3所示:
步骤301,收集网关的多个运行指标的检测值。
步骤302,从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则。
步骤303,判断M个运行指标中,是否至少一个运行指标的检测值位于运行指标对应的指标阈值的边界范围内。若是,则执行步骤304;若否,则执行步骤305。
步骤304,判断M个运行指标的检测值是否满足第三条件且N个运行指标的检测值满足第二条件。
步骤305,判断M个运行指标的检测值是否满足第一条件且N个运行指标的检测值满足第二条件。
步骤306,根据多个运行指标的检测值和故障诊断规则,确定网关的劣化情况。
与第一实施方式相比,本实施方式在故障诊断中增加第三条件,考虑到的检测方式更加全面,提高了本诊断方式的可执行性和对家庭网关状态诊断的准确率。
下面对本实施方式的网关故障诊断方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
步骤301、步骤302和步骤306与第一实施方式中大致相同,为避免重复,在此不再一一赘述。
步骤303至步骤305在一个例子中,即若CPU使用率或内存使用率检测值位于阈值边界范围内,且CPU使用率、内存使用率检测值加权运算得到的运算值超过预设阈值,持续运行时长大于该指标对应的阈值,则网关处于劣化状态;若CPU使用率、内存使用率均不处于阈值边界范围,且CPU使用率或内存使用率存在一个指标检测值超过对应的指标阈值,持续运行时长大于该指标对应的阈值,则网关处于劣化状态。
在一个例子中,若CPU使用率或内存使用率检测值位于阈值边界范围内,且满足以下条件:CPU使用率、内存使用率检测值加权运算得到的运算值超过预设阈值,或持续运行时长大于该指标对应的阈值,则网关处于劣化状态。
另外,第三条件包括:对M个运行指标的指标值进行加权运算得到的运算值大于预设的运算值阈值。例如:对权重为80%的内存使用率和权重为20%的CPU使用率的加权值设置阈值为80%,同时持续运行时长设置阈值为7天。超过该阈值则认为网关处于劣化状态。
本发明的第四实施方式是涉及一种网关故障诊断方法,具体流程如图4所示:
步骤401,收集网关的多个运行指标的检测值。
步骤402,判断收集网关的多个运行指标的检测值是否异常,若是,则执行步骤403;若否,则执行步骤405。
步骤403,获取网关的关键进程的运行情况。
步骤404,根据关键进程的运行情况确定网关的劣化情况。
步骤405,从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则。
步骤406,根据多个运行指标的检测值和故障诊断规则,确定网关的劣化情况。
与第一实施方式相比,本实施方式在数据收集过程中的检测值异常情况设置了应对方式。考虑了可能会出现数据溢出或系统错误,在预设条件下判断所采集到的运行指标的检测值,超出计算范围或无法作为判断网关是否处于劣化状态的可靠依据,则将判断依据更改为网关的关键进程的运行情况。关键进程运行情况表征为联网异常时,判断该网关处于性能劣化状态,提高了本方案的故障应对能力。本领域技术人员可知,该过程也可结合上述任一实施方式进行判断,并不矛盾。
下面对本实施方式的网关故障诊断方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
步骤401、步骤405和步骤406与第一实施方式大致相同,为避免重复,在此不再一一赘述。
步骤402,在一个实例中,数据溢出或系统错误情况下,运行指标的检测值可能远低于阈值,按照故障诊断规则,得到诊断结果是网关不处于劣化状态,但实际上网关处于劣化状态。该情况下可通过预设条件判断其运行指标检测值为异常同时也是本步骤的主要目的。
步骤403和步骤404中,关键进程是指运行情况能够反映网关联网是否正常的进程,例如Lsass.exe等;以运行指标的检测值被判定为异常作为启动条件,获取网关的关键进程运行情况信息,若运行指标的检测值被判定为异常,且关键进程的运行情况信息表征为网关联网异常,则网关处于劣化状态。
本发明的第五实施方式是涉及一种网关故障诊断方法,具体流程如图5所示:
步骤501,收集网关的多个运行指标的检测值。
步骤502,从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则。
步骤503,根据多个运行指标的检测值和故障诊断规则,确定网关的劣化情况。
步骤504,若网关处于劣化状态,制定网关的重启策略。
与第一实施方式相比,本实施方式对被判断为处于劣化状态的网关具有多种可选的重启方式。在结合网关多个运行指标的检测值,和网关的关键进程运行情况两种判断依据后,对处于劣化状态的网关执行立即重启、定时重启或达到指定条件重启。丰富了现有技术中单一的重启策略,使得对性能劣化网关的修复过程更具有针对性和及时。
下面对本实施方式的网关故障诊断方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
步骤501至步骤503与第一实施方式大致相同,为避免重复,在此不再一一赘述。
步骤504中,若判断网关处于性能劣化状态,则需要对其进行修复,比如采用重启策略作为其修复方式。在一个实例中,若网关处于劣化状态,则记录判断网关处于劣化状态的判断依据,由判断依据制定网关的重启策略。若判断依据为网关的关键进程的运行情况,将网关的重启策略制定为立即重启;若判断依据为网关的多个运行指标的检测值,将网关的重启策略制定为定时重启或达到指定条件重启。由于判断依据为网关的关键进程的运行情况时,网关处于劣化状态已经严重影响到实时使用,例如已经断开网络连接,所以要立即重启;而判断依据为网关的多个运行指标的检测值时,网关处于劣化状态但不影响关键进程的状态,所以可以根据需要选择定时重启或达到指定条件重启。
本发明第六实施方式涉及一种网关故障诊断系统,如图6所示,包括:
收集模块601:收集网关的多个运行指标的检测值。
匹配模块602:从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则。
诊断模块603:根据多个运行指标的检测值和故障诊断规则,确定网关的性能劣化情况。
具体来说,收集模块601执行收集网关的多个运行指标的检测值功能,作为本诊断方法的动态输入待测数据,同时可以查询网关的运行指标的检测值是否异常,从而是否将检测指标更改为关键进程运行情况。匹配模块602主要执行从预设的网关属性信息和故障诊断规则的对应关系中,查询网关属性信息对应的故障诊断规则功能;其中,属性信息包括以下其中之一或任意组合网关所属的地理区域、网关的生产厂商、网关的型号。诊断模块603主要执行根据多个运行指标的检测值和故障诊断规则,确定网关的性能劣化情况功能。
其中若多个运行指标的检测值中存在至少一运行指标的检测值满足预设的边界条件,对满足边界条件的运行指标的检测值进行预处理;其中,边界条件是指运行指标的检测值位于运行指标对应的指标阈值的边界范围内;根据预处理后的运行指标的检测值、多个运行指标中未预处理的运行指标的指标值,以及故障诊断规则,确定网关的劣化情况。预处理为加权处理,加权处理的公式为:
Figure BDA0002631089970000101
x为运行指标的检测值,θ为运行指标对应的阈值,f(x)为预处理后的运行指标的检测值。其中,故障诊断规则包括:若多个运行指标中的M个运行指标满足第一条件且多个运行指标中的N个运行指标满足第二条件,网关处于劣化状态;其中,M、N均为自然数。故障诊断规则还包括第三条件;若M个运行指标中至少一个运行指标的检测值位于运行指标对应的指标阈值的边界范围内,且满足以下条件,确定所属网关处于劣化状态;条件包括:M个运行指标的指标值满足第三条件和或N个运行指标满足第二条件;;若任一运行指标的检测值非位于运行指标对应的指标阈值的边界范围内,M个运行指标的指标值满足第一条件、N个运行指标的指标值满足第二条件,确定网关处于劣化状态。第一条件包括:M个运行指标中至少存在一个运行指标的检测值,大于运行指标对应的指标阈值;第二条件包括:N个运行指标的检测值分别大于N个运行指标对应的指标阈值;第三条件包括:对M个运行指标的指标值进行加权运算得到的运算值大于预设的运算值阈值。M个运行指标包括CPU使用率、内存使用率;N个运行指标包括持续运行时长。
同时,该模块还可执行制定网关的重启策略功能,即若劣化情况为网关处于劣化状态,记录劣化状态的判断依据;若判断依据为网关的关键进程的运行情况,将网关的重启策略制定为立即重启;若判断依据为网关的多个运行指标的检测值,将网关的重启策略制定为定时重启或达到指定条件重启。
不难发现,本实施方式为与第一实施方式相对应的系统实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第七实施方式涉及一种服务器,如图7所示,包括:至少一个处理器701;以及与至少一个处理器通信连接的存储器702;其中,存储器存储702有可被至少一个处理器701执行的指令,指令被至少一个处理器701执行,以使至少一个处理器701能够执行上述的网关故障诊断方法。
其中,存储器702和处理器701采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器701处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器701。
处理器701负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器702可以被用于存储处理器在执行操作时所使用的数据。
本发明第八实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (8)

1.一种网关故障诊断方法,其特征在于,包括:
收集网关的多个运行指标的检测值;
从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则;
根据所述多个运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况;
若所述劣化情况为所述网关处于劣化状态,制定所述网关的重启策略;
其中,所述根据所述运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况中,若所述劣化情况为所述网关处于劣化状态,记录所述劣化状态的判断依据;
若所述劣化情况为所述网关处于劣化状态,制定所述网关的重启策略,包括:根据判断依据制定所述网关的重启策略;若所述判断依据为所述网关的关键进程的运行情况,所述网关的重启策略为立即重启;若所述判断依据为所述网关的多个运行指标的检测值,所述网关的重启策略为定时重启或达到指定条件重启;
所述故障诊断规则包括:若所述多个运行指标中的M个运行指标满足第一条件且所述多个运行指标中的N个运行指标满足第二条件,所述网关处于劣化状态;M、N均为自然数;
其中,所述故障诊断规则还包括第三条件;
所述根据所述运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况,包括:
若所述M个运行指标中至少一个所述运行指标的检测值位于所述运行指标对应的指标阈值的边界范围内,且满足以下条件,确定所属网关处于劣化状态;所述条件包括:所述M个运行指标的指标值满足所述第三条件和/或所述N个运行指标满足所述第二条件;
若所有所述运行指标的检测值均非位于所述运行指标对应的指标阈值的边界范围内,所述M个运行指标的指标值满足所述第一条件、所述N个运行指标的指标值满足所述第二条件,确定所述网关处于劣化状态;
所述第一条件包括:所述M个运行指标中至少存在一个运行指标的检测值,大于所述运行指标对应的指标阈值;所述第二条件包括:所述N个运行指标的检测值分别大于所述N个运行指标对应的指标阈值;所述第三条件包括:对所述M个运行指标的检测值进行加权运算得到的运算值大于预设的运算值阈值;
在所述从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则之前,还包括:若所述运行指标的检测值出现异常,从所述网关获取所述网关的关键进程的运行情况;其中,在所述运行指标的检测值出现异常的情况下,所述运行指标不能作为确定所述网关的劣化情况的依据;所述关键进程是指运行情况能够反映所述网关联网是否正常的进程;根据所述关键进程的运行情况确定所述网关的劣化情况;其中,所述关键进程的运行情况表征所述网关联网异常时,所述网关的劣化情况为处于劣化状态。
2.根据权利要求1所述的网关故障诊断方法,其特征在于,所述根据所述运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况,包括:
若所述多个运行指标中的检测值中存在至少一检测值满足预设的边界条件,对满足所述边界条件的运行指标的检测值进行预处理;其中,所述边界条件是指所述运行指标的检测值位于所述运行指标对应的阈值的边界范围内;
根据预处理后的运行指标的检测值、所述多个运行指标中未预处理的运行指标的指标值,以及所述故障诊断规则,确定所述网关的劣化情况。
3.根据权利要求2所述的网关故障诊断方法,其特征在于,所述预处理为加权处理,所述加权处理的公式为:
Figure FDA0003903808910000021
x为所述运行指标的检测值,θ为所述运行指标对应的阈值,f(x)为所述预处理后的运行指标的检测值,k为非0的实数。
4.根据权利要求1所述的网关故障诊断方法,其特征在于,所述M个运行指标包括CPU使用率、内存使用率;所述N个运行指标包括持续运行时长。
5.根据权利要求1所述的网关故障诊断方法,其特征在于,所述网关属性信息包括以下其中之一或任意组合所述网关所属的地理区域、所述网关的生产厂商、所述网关的型号。
6.一种网关故障诊断系统,其特征在于,包括:
收集模块:收集网关的多个运行指标的检测值;
匹配模块:从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则;
在所述从预设的网关属性信息和故障诊断规则的对应关系中,查询所述网关属性信息对应的故障诊断规则之前,还包括:若所述运行指标的检测值出现异常,从所述网关获取所述网关的关键进程的运行情况;其中,在所述运行指标的检测值出现异常的情况下,所述运行指标不能作为确定所述网关的劣化情况的依据;所述关键进程是指运行情况能够反映所述网关联网是否正常的进程;根据所述关键进程的运行情况确定所述网关的劣化情况;其中,所述关键进程的运行情况表征所述网关联网异常时,所述网关的劣化情况为处于劣化状态;
诊断模块:根据所述多个运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况;
若所述劣化情况为所述网关处于劣化状态,制定所述网关的重启策略;
其中,所述根据所述运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况中,若所述劣化情况为所述网关处于劣化状态,记录所述劣化状态的判断依据;
若所述劣化情况为所述网关处于劣化状态,制定所述网关的重启策略,包括:根据判断依据制定所述网关的重启策略;若所述判断依据为所述网关的关键进程的运行情况,所述网关的重启策略为立即重启;若所述判断依据为所述网关的多个运行指标的检测值,所述网关的重启策略为定时重启或达到指定条件重启;
所述故障诊断规则包括:若所述多个运行指标中的M个运行指标满足第一条件且所述多个运行指标中的N个运行指标满足第二条件,所述网关处于劣化状态;M、N均为自然数;
其中,所述故障诊断规则还包括第三条件;
所述根据所述运行指标的检测值和所述故障诊断规则,确定所述网关的劣化情况,包括:
若所述M个运行指标中至少一个所述运行指标的检测值位于所述运行指标对应的指标阈值的边界范围内,且满足以下条件,确定所属网关处于劣化状态;所述条件包括:所述M个运行指标的指标值满足所述第三条件和/或所述N个运行指标满足所述第二条件;
若所有所述运行指标的检测值均非位于所述运行指标对应的指标阈值的边界范围内,所述M个运行指标的指标值满足所述第一条件、所述N个运行指标的指标值满足所述第二条件,确定所述网关处于劣化状态;
所述第一条件包括:所述M个运行指标中至少存在一个运行指标的检测值,大于所述运行指标对应的指标阈值;所述第二条件包括:所述N个运行指标的检测值分别大于所述N个运行指标对应的指标阈值;所述第三条件包括:对所述M个运行指标的检测值进行加权运算得到的运算值大于预设的运算值阈值。
7.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任一所述的网关故障诊断方法。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的网关故障诊断方法。
CN202010811434.5A 2020-08-13 2020-08-13 网关故障诊断方法、系统、服务器及存储介质 Active CN112003765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010811434.5A CN112003765B (zh) 2020-08-13 2020-08-13 网关故障诊断方法、系统、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010811434.5A CN112003765B (zh) 2020-08-13 2020-08-13 网关故障诊断方法、系统、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN112003765A CN112003765A (zh) 2020-11-27
CN112003765B true CN112003765B (zh) 2022-12-27

Family

ID=73463203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010811434.5A Active CN112003765B (zh) 2020-08-13 2020-08-13 网关故障诊断方法、系统、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN112003765B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113037562A (zh) * 2021-03-24 2021-06-25 中国建设银行股份有限公司 一种网关故障评估方法、装置及服务器
CN113765743B (zh) * 2021-08-09 2022-08-19 中标慧安信息技术股份有限公司 智能网关工作状态监控方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179448A (zh) * 2006-11-06 2008-05-14 华为技术有限公司 误入平滑重启状态的检测方法及路由器
CN102769571A (zh) * 2012-07-30 2012-11-07 杭州华三通信技术有限公司 一种平滑重启实现方法及设备
CN107465453A (zh) * 2016-06-02 2017-12-12 中兴通讯股份有限公司 一种光网络终端及其工作方法、及通信系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3032074B1 (fr) * 2015-01-27 2017-02-17 Sagemcom Broadband Sas Procede de test d'un dispositif de radiocommunication a tester d'une passerelle d'un parc de passerelles
CN105406987B (zh) * 2015-10-22 2016-12-21 广州云晫信息科技有限公司 一种外网客户端接入私有云云桌面方法
US10187473B2 (en) * 2016-04-29 2019-01-22 Intuit Inc. Gateway policy enforcement and service metadata binding
CN107547309B (zh) * 2017-08-21 2020-09-04 奇安信科技集团股份有限公司 一种安全网关性能的自动化测试方法及装置
CN109257770B (zh) * 2018-10-10 2022-05-06 京信网络系统股份有限公司 过载控制方法、装置、系统及设备
CN109587001B (zh) * 2018-11-15 2020-11-27 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN111277610B (zh) * 2020-02-24 2022-09-06 中移(杭州)信息技术有限公司 网关控制系统、方法、智能设备、智能设备服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179448A (zh) * 2006-11-06 2008-05-14 华为技术有限公司 误入平滑重启状态的检测方法及路由器
CN102769571A (zh) * 2012-07-30 2012-11-07 杭州华三通信技术有限公司 一种平滑重启实现方法及设备
CN107465453A (zh) * 2016-06-02 2017-12-12 中兴通讯股份有限公司 一种光网络终端及其工作方法、及通信系统

Also Published As

Publication number Publication date
CN112003765A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112003765B (zh) 网关故障诊断方法、系统、服务器及存储介质
CN110971444B (zh) 告警管理方法、装置、服务器及存储介质
CN111130912B (zh) 内容分发网络的异常定位方法、服务器及存储介质
US20180102951A1 (en) BFD Method and Apparatus
CN113848015A (zh) 基于ZigBee的压力传感器在线校准系统
CN112566170B (zh) 网络质量评估方法、装置、服务器及存储介质
CN113452576A (zh) 网络环境的监控方法及装置、存储介质、电子装置
CN112888007A (zh) 设备离线原因诊断方法、设备及存储介质
CN110896544B (zh) 故障定界方法及装置
CN116972910A (zh) 一种火电厂电气设备的监测方法及系统
CN115619370A (zh) 一种车辆故障诊断方法及装置
CN116347423A (zh) 一种通过多指标参数智能切换sim卡的方法
CN114143822B (zh) 流量管理方法、运营管理平台、充电桩及存储介质
CN115249126A (zh) 基于特征向量空间的核电站设备综合状态评估方法和装置
CN114641045A (zh) 基于通信质量感知的输电线路通信通道切换方法及系统
US11002211B2 (en) Engine diagnostic system and engine diagnosing method
JP5314586B2 (ja) 無線エリア評価装置、無線通信システムおよび無線エリア評価装置の制御プログラム
CN111260133A (zh) 用于监测研发质量的质量监测模型的优化方法及装置
CN112637960B (zh) 一种基于gnss的网络节点的功率控制方法
CN118042507A (zh) 轨道交通数据通信系统健康诊断方法及装置
CN112217605B (zh) 传输策略的选择方法、设备及存储介质
CN116847224B (zh) 一种电表数据传输方法、系统、设备及存储介质
CN117715137B (zh) 水下机器人自适应通信方法、装置及系统
CN113433503B (zh) 一种居民用户负荷辨识模块的自诊断方法
WO2022121513A1 (zh) 性能指标至差值的生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant