CN113965486A - 一种垂直定位故障的线路探测方法及装置 - Google Patents

一种垂直定位故障的线路探测方法及装置 Download PDF

Info

Publication number
CN113965486A
CN113965486A CN202111219127.9A CN202111219127A CN113965486A CN 113965486 A CN113965486 A CN 113965486A CN 202111219127 A CN202111219127 A CN 202111219127A CN 113965486 A CN113965486 A CN 113965486A
Authority
CN
China
Prior art keywords
task
line
detection
probing
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111219127.9A
Other languages
English (en)
Other versions
CN113965486B (zh
Inventor
金咏诗
曾繁雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202111219127.9A priority Critical patent/CN113965486B/zh
Publication of CN113965486A publication Critical patent/CN113965486A/zh
Application granted granted Critical
Publication of CN113965486B publication Critical patent/CN113965486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Abstract

本文涉及信息安全技术领域,尤其涉及垂直定位故障的线路探测方法及装置。该方法包括获取线路的初始探测任务;根据任务发送条件在所述初始探测任务中确定第一探测任务;发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果;通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果;根据所述监控结果及其他线路监控指标,确定线路异常状态;根据所述线路异常状态及预设告警阶梯阈值发送告警信息。本文对全量线路错峰执行探测任务,根据监控指标自动检查线路异常状况,并根据线路异常状况实现阶梯式告警、故障申告,实现运维部门、业务部门与运营商的快速耦合。

Description

一种垂直定位故障的线路探测方法及装置
技术领域
本文涉及信息安全技术领域,可用于金融领域,尤其是垂直定位故障的线路探测方法及装置。
背景技术
随着银行业务种类的增多,连接银行网络设备之间的线路数量不断增加,已达到千条级别。银行网络设备上的线路涉及上百家业务机构、合作机构及运行商的耦合,银行网络设备的线路一方面与数量较大的机构交互连接,另一方面也与线路运营商紧密联系。体量庞大的线路的日常运维工作复杂度高,涉及线路状态监控、线路故障追踪、故障告警等多个方面,并且涉及多方机构之间的通讯交互,条目繁杂、种类繁多。
现有技术中解决线路故障探测方法通常为人工监控线路状态,当发现线路故障后,人工处理故障。这种线路故障探测方法需要专门的人工监控,耗费时间长、人力资源要求高、效率低,无法以最大效率探测线路故障,对银行系统的日常运行提出了严峻的考验。
针对上述提出的问题,需要研究一种垂直定位故障的线路探测模型,对单条线路状态进行探测和预警,且对多种类型的数量较大的多条线路错峰执行探测任务,高频度监控线路的运行状态,根据监控指标实现自动检查线路异常状况,并根据检测到的线路异常状况实现阶梯式告警,快速联动各方管理人员,实现线路的全面化、高效能化的管理,有效缓解业务压力,实现运维部门、业务部门与运营商的快速耦合。
发明内容
为解决上述现有技术的问题,本文实施例提供了一种垂直定位故障的线路探测方法、装置、计算机设备及存储介质,解决了现有技术中线的日常运维工作复杂度高、人工处理效率低的问题。
本文实施例提供了一种垂直定位故障的线路探测方法,包括:
获取线路的初始探测任务;
根据任务发送条件在所述初始探测任务中确定第一探测任务,所述第一探测任务为待下发的探测任务;
发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果,所述探测任务解析结果中包括多个线路监控指标;
通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果;
根据所述监控结果及其他线路监控指标,确定线路异常状态;
根据所述线路异常状态及预设告警阶梯阈值发送告警信息。
根据本实施例的一个方面,所述初始探测任务包括多条线路的探测任务,所述多条不同的线路对应不同的探测周期和探测起始时间。
根据本实施例的一个方面,所述根据任务发送条件在所述初始探测任务中确定第一探测任务包括:当所述初始探测任务中的线路达到各自的探测起始时间,将所述初始探测任务确定为所述第一探测任务。
根据本实施例的一个方面,所述根据任务发送条件在所述初始探测任务中确定所述第一探测任务进一步包括:
对所述初始探测任务中所有线路设置初始时间,所述初始时间随时间递增;
根据所述线路对应的探测周期确定所述线路的探测起始时间;
当所述初始时间递增达到所述探测起始时间时,执行所述探测任务。
根据本实施例的一个方面,所述根据任务发送条件在所述初始探测任务中确定第一探测任务后还包括更新所述第一探测任务,包括:
将所述第一探测任务达到所述探测起始时间的初始时间清零;
当所述线路历经所述线路的探测周期,并递增达到所述探测起始时间时,执行下一次探测任务。
根据本实施例的一个方面,所述发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果包括:发送所述第一探测任务至第一任务执行端,获取由第一任务执行端处理得到的探测结果;发送所述探测结果至第二任务执行端,获取由第二任务执行端处理得到的解析结果。
根据本实施例的一个方面,所述获取由第一任务执行端处理得到的探测结果包括:从消息队列中获取由所述第一任务执行端处理得到的探测结果。
根据本实施例的一个方面,所述获取由所述第二任务执行端处理得到的解析结果包括:根据所述第二任务执行端的空闲状态向所述第二任务执行端发送所述解析任务;从消息队列中获取由第二任务执行端经过解析、提取、整合处理获得的解析结果。
根据本实施例的一个方面,所述解析结果中的线路监控指标包括:探测成功率、平均时延、最大时延、最小时延。
根据本实施例的一个方面,所述对所述线路监控指标中的至少一个监控指标作滑动平均处理包括:采集一定时间周期内线路的探测任务解析结果,所述探测任务解析结果中包括线路探测成功率;根据加权递推平均滤波算法对所述时间周期内不同时间点的线路赋权重;通过计算对所述不同时间点的线路探测成功率及所述权重的乘积,确定所述线路的最终探测成功率。
根据本实施例的一个方面,所述根据所述线路异常状态及预设告警阶梯阈值发送告警信息包括:根据线路异常状态确定告警维护期,以发送阶梯告警。
本文实施例还提供了一种垂直定位故障的线路探测装置,包括:
初始探测任务获取单元,用于根据监控周期获取初始探测任务;
第一探测任务确定单元,用于根据任务发送条件在所述初始探测任务中确定第一探测任务;
第一探测任务发送单元,用于发送所述第一探测任务至任务执行端;
探测任务解析结果获取单元,用于获取由所述任务执行端处理得到的探测任务解析结果;
监控处理结果获取单元,用于通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果;
线路异常状态确定单元,用于根据所述监控结果及其他线路监控指标,确定线路异常状态;
告警信息发送单元,用于根据所述线路异常状态及预设告警阶梯阈值发送告警信息。
本文实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本文实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述的方法。
利用本文实施例,可以对单条线路状态进行探测和预警,且可以对多种类型的数量较大的多条线路错峰执行探测任务,可以高频度监控线路的运行状态,根据监控指标实现自动检查线路异常状况,并根据检测到的线路异常状况实现阶梯式告警,有效缓解业务压力,实现运维部门、业务部门与运营商的快速耦合,精准定位故障,提高业务效率,进一步优化用户体验。
附图说明
为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示为本文实施例垂直定位故障的线路探测系统的网络结构示意图;
图2所示为本文实施例垂直定位故障的线路探测方法的流程图;
图3所示为本文实施例垂直定位故障的线路探测装置的结构示意图;
图4所示为本文实施例垂直定位故障的线路探测装置的具体结构示意图;
图5所示为本文实施例一种确定第一探测任务的方法流程图;
图6所述为本文实施例一种对线路监控指标作滑动平均处理的流程图;
图7所示为本文实施例一种计算机设备的结构示意图。
附图符号说明:
101、服务器;
102、网络;
103、存储器;
104、任务执行端;
1041、第一任务执行端;
1042、第二任务执行端;
301、初始探测任务获取单元;
3011、监测周期确定模块;
302、第一探测任务确定单元;
3021、任务发送条件确定模块;
303、第一探测任务发送单元;
304、探测任务解析结果获取单元;
3041、解析模块;
305、监控处理结果获取单元;
3051、采集模块;
3052、计算模块;
306、线路异常状态确定单元;
307、告警信息发送单元;
3071、告警维护期确定模块;
702、计算机设备;
704、处理器;
706、存储器;
708、驱动机构;
710、输入/输出模块;
712、输入设备;
714、输出设备;
716、呈现设备;
718、图形用户接口;
720、网络接口;
722、通信链路;
724、通信总线。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。
需要说明的是,本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。
需要说明的是,本文的垂直定位故障的线路探测方法和装置可用于金融领域,也可用于除金融领域之外的任意领域,本文的垂直定位故障的线路探测方法和装置的应用领域不做限定。
如图1所示为本文实施例一种垂直定位故障的线路探测系统的网络结构示意图,在本图中描述了通过服务器101、网络102、存储器103、任务执行端104相结合的垂直定位故障的线路探测方法。其中,服务器101、网络102、存储器103和任务执行端104之间可以进行数据交互。
在本说明书一些实施例中,服务器可以为具有网络交互功能的电子设备,也可以为运行于该电子设备中,为数据处理和网络交互提供业务逻辑的软件。其中,服务器101可以按照一定监控频率从存储器103中获取所有需要探测的任务,所述探测任务包括线路信息、探测方式、探测周期等。或者,服务器101也可以按照一定监控频率随机生成线路探测任务。在本文的一些实施例中,线路信息包括线路编号、线路所述业务部分、线路功能、线路数量、线路两端所连接的设备及所述设备的地址;探测周期表示对一条线路执行一次探测任务的周期。在本文的一些实施例中,所述服务器的获取探测任务的监控频率可以是10秒、15秒、20秒、1分钟等。所述服务器的检测周期可以是预先设定的,也可以根据业务实际需求调整。所述线路的探测周期可以是1分钟、2分钟、5分钟、10分钟等。所述探测周期可以是预先设定的,也可以根据业务实际情况调整。
在本说明书一些实施例中,服务器101可以根据任务发送条件将需要下发的探测任务发送至任务执行端104。在下发探测任务后,服务器101还可以更新下发完毕的探测任务,使得该类任务下发后,经过一个探测周期后执行新的探测任务。服务器101可以获取任务执行端104处理得到的任务探测结果,并根据该任务探测结果生成解析任务。服务器101将所述解析任务下发至任务执行端,获取所述任务执行端处理得到的任务解析结果,并根据任务解析结果中的监控数据的状态确定线路的工作状态。在本说明书的一些实施例中,服务器101还可以根据确定得到的线路工作状态及预设告警阈值确定是否发送告警信息。
在本说明书一些实施例中,网络102可以促进信息和/或数据的交换。在一些实施例中,垂直定位故障的探测系统中的一个或多个组件(例如,服务器101、存储器103、任务执行端104)可通过网络120发送数据和/或信息给垂直定位故障的探测系统中的其他组件。在一些实施例中,网络102可以为任意形式的有线或无线网络,或其任意组合。仅作为实例,网络102可以包括缆线网络、有线网络、光纤网络、远程通信网络、内部网络、互联网、局域网络(LAN)、广域网络(WAN)、无线局域网络(WLAN)、城域网(MAN)、公共开关电话网络(PSTN)、蓝牙网络、ZigBee网络、近场通讯(NFC)网络等或其任意组合。在一些实施例中,网络102可以包括至少一个网络接入点。例如,网络102可以包括有线或无线网络接入点,如基站和/或互联网交换点,通过这些网络接入点,任务执行端中的至少一个端口可以连接到网络102以交换数据和/或信息。
在本说明书一些实施例中,存储器103可与网络102连接以与垂直定位故障的线路探测系统的一个或多个组件(例如,服务器101、任务执行端104等)通讯。垂直定位故障的线路探测系统的一个或多个组件可通过网络102访问存储于存储器103中的资料或指令。在一些实施例中,存储器103可直接与垂直定位故障的线路探测系统中的一个或多个组件(如,服务器101、任务执行端104等)连接或通讯。在一些实施例中,存储器103可以是服务器101的一部分。在本说明书一些实施例中,存储器103可以存储所有线路信息、线路探测任务;存储器103可以存储任务执行端处理得到的任务探测结果;存储103可以存储任务执行端处理得到的任务解析结果。存储器103还可以存储处理线路监控指标的算法指令、线路监控指标的阈值、告警阶梯阈值等可以预先设定的参数,存储器103也可以存储计算得到的线路监控指标、线路状态等多类数据处理结果。
在本说明书一些实施例中,任务执行端104可以为具有网络交互功能的电子设备,也可以为运行于该电子设备中,为数据处理和网络交互提供业务逻辑的软件。所述任务执行端104包括第一任务执行端1041(附图标记说明中没有这个编号),第二任务执行端1042,用于处理服务器101下达的线路探测任务。所述第一任务执行端1041和所述第二任务执行端1042均为分布式架构。其中,所述第一任务执行端1041为Client A端;所述第二任务执行端1042为Client B端。所述第一任务执行端和所述第二任务执行端均包括多个Client端,用于在业务繁忙时实现多机冗余。在本说明书一些实施例中,第一任务执行端1041用于获取由服务器101根据任务发送条件下发的第一探测任务,并处理所述探测任务得到任务探测结果。第一任务执行端1041用于将所述任务探测结果发送至消息队列。第二任务执行端1042用于获取由服务器101从消息队列中获取并处理得到的解析任务,并从所述解析任务中解析、提取、整合相关信息处理得到所述探测任务的解析结果。第二任务执行端1042将所述探测任务的解析结果发送至消息队列作为单条线路的单词探测任务的探测结果,以便服务器101后续采集所述探测任务的探测结果中的数据。
如图2所示为本文实施例一种处置定位故障的线路探测方法的流程图,在本图中描述了利用线路监控指标确定线路异常状态的流程方法,其中具体包括如下步骤:
步骤201,获取线路的初始探测任务;
步骤202,根据任务发送条件在所述初始探测任务中确定第一探测任务,所述第一探测任务为待下发的探测任务;
步骤203,发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果,所述探测任务解析结果中包括多个线路监控指标;
步骤204,通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果。
步骤205,根据所述监控结果及其他线路监控指标,确定线路异常状态;
步骤206,根据所述线路异常状态及预设告警阶梯阈值发送告警信息。
作为本文的一个实施例,所述初始探测任务包括多条线路的探测任务,所述多条不同的线路对应不同的探测周期和探测起始时间。
在本发明的一些实施例中,线路的探测任务包括但不限于线路信息、线路探测方式、线路探测周期等中的一种或其任意组合。关于线路探测任务的具体内容可参考图1中的具体描述,此处不再赘述。其中,因银行不同的业务设置,多条线路具有不同的业务功能。基于此,多条不同业务功能的线路可能具有不同的线路探测任务,包括不同的线路信息、线路探测方式、线路探测周期等。
在本步骤中,线路通常连接在网络设备之间。在本说明书一些实施例中,所述网络设备可以为交换机,用于为接入交换机的任意两个网络节点提供电信号通路,所述电信号通路即为本文实施例所述的通讯线路。每台交换机上设有多个端口,多条线路通过多个端口连接到对应的交换机以实现相应的业务功能。在一些实施例中,交换机的端口包括普通常用端口(例如,RJ-45端口)、Uplink端口等中的一种或其任意组合。
在本步骤中,至少两台交换机之间通过至少一条线路连接,连接在不同交换机之间的多条线路承载不同的业务功能。即,承载相同或相似业务功能的线路连接在同一类交换机之间,承载不同业务功能的线路连接在不同种类的交换机之间。例如,有20条线路承载银行对公业务,连接在两台交换机之间,或者,该20条承载银行对公业务的线路中有10条线路连接在两台交换机之间;另外10条线路连接在另外两台交换机之间。又例如,有50条线路承载银行对私业务,连接在四台交换机之间等。
在本说明书一些实施例中,初始探测任务包括发送因特网包探索(Ping,PacketInternet Groper)指令,用于检测网络设备之间线路的连通情况和线路运行速度。具体为,通过计算Ping指令中发送的包数与接收到的回包数的比值确定探测任务中的线路及所述线路连接设备的链接是否连正常。
以单条线路的初始探测任务为例展开描述:承载银行对公业务的线路001的初始探测任务为发送Ping指令测试该线路连通状况,该线路连接的交换机的IP地址为“115.67.68.36”,该线路的初始探测任务的Ping指令可以是“Pinging115.23.28.36with32bytes of data:”。在本说明书一些实施例中,线路的初始探测任务不仅限于上述的一种,还可以是其他多种形式,本说明书在此不做限定。
在本步骤中,线路的初始探测任务中包括至少一条线路的探测任务,所述初始探测任务包括但不限于:承载银行所有业务的全部线路的探测任务、承载银行相同业务的所有线路的探测任务、承载银行不同业务的所有线路的探测任务、承载银行相同业务的部分线路的探测任务、承载银行相同业务的部分线路的探测任务等中的一种或其任意组合。
在本步骤中,系统服务器将按照一定监测周期随机获取初始探测任务,所述初始探测任务可以是系统服务器自身生成的,也可以是服务器或系统中其他组件生成的。所述监测周期可以理解为服务器按照一定监测时间间隔,获取一次线路的探测任务。监测周期的具体时间可以由系统预先设定,也可以根据业务实际情况设定。监测周期可以为10秒/次、20秒/次等,表明系统服务器将10秒或20秒获取一次线路的探测任务。其中,服务器的监测周期与线路的探测周期不同。
在本步骤中,承载不同业务功能的线路通常具有不同的探测周期。例如,银行对私业务的20条线路的探测周期为2分钟/次,表示服务器将每2分钟对该20条线路探测一次线路状况;又例如,银行对公业务的50条线路的探测周期为1分钟/次,表示服务器将每1分钟对该20条线路探测一次线路状况。其中,承载不同业务功能的线路的探测周期可以根据业务需求设定。例如,当上线一款新型贷款业务时,业务功能不够稳定,需要经常调整并增强人工关注,则可以将该业务对应的线路的探测周期设置成较短的探测周期;又例如,当某传统业务历史运行稳定,线路出现故障的情况较少时,可以将该业务对应的线路的探测周期设置成相对较长的探测周期。
作为本文的一个实施例,所述根据任务发送条件在所述初始探测任务中确定第一探测任务包括:当所述初始探测任务中的线路达到各自的探测起始时间,将所述初始探测任务确定为所述第一探测任务。
在本步骤中,实际业务中两台网络设备之间连接的线路可能有几十条、上百条,需要执行探测任务的线路数量较大,可能达到千条级别。如果同时对较大数量的线路执行线路探测任务,系统及系统中的设备均会面对较大的业务压力。为了更好地执行线路故障探测任务,可以将初始探测任务中多条线路的探测任务错峰发送。因此,对所有下路设置任务发送条件,当线路满足任务发送条件时,将初始探测任务确定为第一探测任务。在本步骤中,任务发送条件为可以将初始探测任务下发至任务执行端执行探测任务的条件。具体的,对不同类型的线路设置不同的探测起始时间,当每条线路达到其线路发送条件中设定的探测起始时间时,将所述线路的探测任务作为第一探测任务发送。其中,不同类型的线路具有不同的发送条件及不同的探测起始时间;相同类型的线路具有相同的发送条件和相同的探测起始时间。
如上述步骤所述,为了错峰发送多条线路对应的第一探测任务,对不同的线路设置不同的探测起始时间。在本步骤中,可以根据线路的探测周期确定线路的探测起始时间。例如,设置承载银行对公业务的20条线路的探测起始时间为120s;设置承载银行对私业务的50条线路的探测起始时间为60s。当线路达到探测起始时间时,线路的初始探测任务即为第一探测任务,服务器可以将该线路的第一探测任务下发至任务执行端执行后续操作。当线路还未达到探测起始时间时,线路需要继续等待一段时间,直到达到该探测起始时间,才能由服务器将线路的探测任务下发。
基于此,连接在两台交换机之间承载银行对公业务功能的线路的探测周期和探测起始时间趋于一致;连接在两台交换机之间承载不同银行业务功的线路的探测周期和探测起始时间并不相同。例如,同一类型的线路的探测周期为2分钟/次,该类型线路的探测起始时间为120,该类型线路均连接在交换机A和交换机B之间;另一类的线路的探测周期为5分钟/次,该类型线路的探测起始时间为300,该类型线路均连接在交换机C和交换机D,交换机E和交换机F之间。
作为本文的一个实施例,所述根据任务发送条件在所述初始探测任务中确定所述第一探测任务进一步包括:对所述初始探测任务中所有线路设置初始时间,所述初始时间随时间递增;根据所述线路对应的探测周期确定所述线路的探测起始时间;当所述初始时间递增达到所述探测起始时间时,执行所述探测任务。
在本步骤中,所述初始时间值随时间累积的规律与系统服务器的监测周期相关。例如,监测周期为10秒/次,则确定线路的初始时间值每10秒累加10、每10秒加5等。又例如,监测周期为20秒/次,则可以确定线路的初始时间值为每20秒加10、每20秒加20等。
当每条线路的初始时间随时间递增达到预先设定的线路的探测起始时间值时,所述线路满足任务发送条件,可以将该初始探测任务中的线路确定为第一探测任务,服务器可以将所述第一探测任务下发至任务执行端执行探测任务。
基于此种的线路探测时间设置方法,可以将同一类型的不同线路的探测任务错开进行,或将不同类型的不同线路的探测任务错开进行,有效缓解设备上的线路探测压力,保证探测准确率和探测效率。
作为本文的一个实施例,所述根据任务发送条件在所述初始探测任务中确定第一探测任务后还包括更新所述第一探测任务,包括:将所述第一探测任务达到所述探测起始时间的初始时间清零;当所述线路历经所述线路的探测周期,并递增达到所述探测起始时间时,执行下一次探测任务。
在本步骤中,当初始探测任务中的探测任务满足探测任务发送条件变为第一探测任务后,将第一探测任务发送至任务执行端执行探测任务。同时更新所述第一探测任务,也需要将该第一探测任务对应的线路上超过探测起始时间的时间值清零。从当前时刻开始,该线路的探测初始时间重新随时间累加,当该初始时间值累加再次达到探测起始时间值时,执行一次新的探测任务。例如,一条探测周期为2分钟/次的银行对公业务线路的探测起始时间为120s。系统服务器对该类型该条线路随机赋初值65,该初值随时间每10秒累加10,当该初值累积到125时,初值超过120,可以确定该线路对应的探测任务为第一探测任务。此时将初值125清零作为该线路新的初值,以后的线路初值将从0开始随时间累加,当处置超过探测起始时间后,执行新的探测任务。
在本说明书一些实施例中,所述更新的第一探测任务可以存储在存储器中。
作为本文的一个实施例,所述发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果包括:发送所述第一探测任务至第一任务执行端,获取由第一任务执行端处理得到的探测结果;发送所述探测结果至第二任务执行端,获取由第二任务执行端处理得到的解析结果。
在本步骤中,所述任务执行端包括第一任务执行端和第二任务执行端。所述第一任务执行端和第二任务执行端负责不同的业务分工,每个任务执行端包括至少一个任务执行机器。在本文的一些实施例中,第一任务执行端包括多个Client A端,第二任务执行端包括多个Client B端。
本步骤具体包括:系统服务器将第一探测任务发送至第一任务执行端,第一任务执行端处理得到第一探测任务的探测结果,并将该探测结果发送到消息队列(MQ,MessageQueue)中,系统服务器从消息队列中拿取第一探测任务的探测结果,生成解析任务,并将该解析任务发送至第二任务执行端。其中,系统服务器将会根据第二任务执行端中多个Client B的工作空闲状态发送解析任务。第二任务执行端中多个Client B通过对解析任务进行整合、提取数据,生成解析结果,第二任务执行端将解析结果发送至另一个消息队列中,至此,任务执行端完成探测任务的解析处理。
在本步骤中,第一任务执行端执行的第一探测任务包括发送Ping指令,用于探测该第一探测任务对应的线路是否畅通。发送Ping指令后,可以根据回显中的数据确定该第一探测任务是否正常,具体为,通过计算Ping指令中发送的包数与接收到的回包数的比值确定该第一探测任务中的线路及所述线路连接设备的链接是否连正常。
在本步骤中,第二任务执行端执行的解析任务从第一探测结果中获取系统所需的数据。其中,第一探测任务中包括多种数据信息,第二任务执行端将对所述多种数据信息中对解析任务有益的数据进行提取、整合,第二任务执行端获取得到的数据可以映射到本发明的线路监控指标。
作为本文的一个实施例,所述获取由第一任务执行端处理得到的探测结果包括:从消息队列中获取由所述第一任务执行端处理得到的探测结果。
在本步骤中,所述消息队列用于暂存第一任务执行端处理得到的探测结果。所述消息队列可以与第一任务执行端及本说明书中的第二任务执行端异步通信,无需与任务执行端实时通信,缓解业务压力。
作为本文的一个实施例,所述获取由所述第二任务执行端处理得到的解析结果包括:根据所述第二任务执行端的空闲状态向所述第二任务执行端发送所述解析任务;从消息队列中获取由第二任务执行端经过解析、提取、整合处理获得的解析结果。
在本步骤中,第二任务执行端获取系统服务器发送的解析任务,所述解析任务是系统服务器根据第一任务执行端发送到消息队列中的探测结果处理得到的。其中,根据业务需求,需要从第一任务执行端处理得到的探测结果中解析、提取业务需要的信息,对业务不需要的信息则无需处理。其中,第二任务执行端解析得到的数据包括探测回包数、平均时延、最大时延、最小时延等。
在本步骤中,所述消息队列用于暂存第二任务执行端处理得到的探测任务的解析结果。
作为本文的一个实施例,所述解析结果中的线路监控指标包括:探测成功率、平均时延、最大时延、最小时延。
在本步骤中,系统服务器根据探测任务的解析结果提取对应的数据,提取出的数据可以映射至监控指标。
以探测成功率为例,基于探测(发送Ping指令)时发送的数据包个数与接收得到的对应回包数的比值,确定探测成功率为线路监控指标中的一种。例如,线路畅通情况下发送Ping指令的发送包数与回包数的比值为1,确定该线路的探测成功率为100%,线路拥堵情况下发送Ping指令的发送包数与回包数的比值为0.7,确定该线路的探测成功率为70%。在实际业务工作中,一条线路在正常工作状态下的线路探测成功率为100%,当线路工作异常,探测成功率即达不到100%,可能为90%、80%、50%等数值。因此本发明中,可以根据探测成功率的具体数值分析确定该线路的畅通状态,进一步确定该线路出现异常状态的紧急程度、严重程度等。
在本文的一些实施例中,平均时延是发送Ping指令后,回显中的一个返回值的参数。本发明中,可以根据该返回值参数的具体数值分析确定该线路发送报文的时延,进一步确定该线路出现异常状态的紧急程度、严重程度等。
在本步骤中,平均时延指一条线路将一个完整报文的所有比特发送到网路链路中所需要的时间。在本步骤中,最大时延表示线路将一个完整报文的所有字节发送至网路链路所需要的最长时间;最小时延表示线路将一个完整报文的所有字节发送至网络链路所需要的最短时间。通常情况下,时延与线路所发送的报文大小和发送速率有关。
作为本文的一个实施例,所述对所述线路监控指标中的至少一个监控指标作滑动平均处理包括:采集一定时间周期内线路的探测任务解析结果,所述探测任务解析结果中包括线路探测成功率;根据加权递推平均滤波算法对所述时间周期内不同时间点的线路赋权重;通过计算对所述不同时间点的线路探测成功率及所述权重的乘积,确定所述线路的最终探测成功率。
在本步骤中,考虑到系统服务器采集到的数据的有效性可能会随着时间的推移而衰减,且针对单次采集得到的探测任务解析结果中的数据无法精确确定线路的运行状况。因此对单条线路,采集一段时间窗口内的多个时间的数据,并对多个时间点采集的多组数据使用加权递推平均滤波法对求加权平均作为单次数据的有效值。可以解决数据的实时性问题。通过对不同采集时刻的线路数据赋予不同的权重,提高采集周期内的数据灵敏度。
作为本文的一个实施例,所述根据所述线路异常状态及预设告警阶梯阈值发送告警信息包括:根据线路异常状态确定告警维护期,以发送阶梯告警。
在本步骤中,预设告警阶梯阈值为系统针对不同线路监控指标预设的告警阈值,以针对不同紧急程度、严重程度的线路故障,执行对应不同等级的告警。其中,所述预设告警阈值可以是一个具体的数值,也可以是一个数值范围。以线路探测成功率为例,当线路的探测成功率为95%或者当线路的探测成功率在81%-95%之间,表示该线路故障程度较低、严重程度较低,可能只是线路发生抖动,无需人工处理,可以设置告警程度为1级;当线路的探测成功率为80%或者当线路的探测成功率在60%-80%之间,表明该线路有一定的故障程度,可能需要人工检测故障情况,设置告警程度为3级;当线路的探测成功率为50%或者当线路的探测成功率在30%-50%之间,表明该线路故障程度较高、紧急程度较高,急需人工干预,设置告警程度为5级。
在本步骤中,告警维护期表示告警持续时间。在实际业务中,线路的运营维护可能涉及多方机构,包括运营商、合作机构、研发人员、值班人员等,当线路发生故障且生成告警时,如果线路的故障严重程度并不是很高,可以将其放置一段时间以后再去处理,则可以对此种类故障的告警维护期设置较长。当故障严重程度较高时,需要人工立刻干预,可以将告警维护期的事件设置较短。
在本步骤中,发送阶梯告警的方法包括:向值班人员发送告警信息、向运营商发送告警邮件等。本发明对发送阶梯告警的方式在此不做限定。
如图3所示为本文实施例一种垂直定位故障的线路探测装置的结构示意图,在本图中描述了垂直定位故障的线路探测装置的基本结构,其中的功能单元、模块可以采用软件方式实现,也可以采用通用芯片或者特定芯片实现,所述的功能单元、模块一部分或者全部可以在服务器上,或者其中的一部分也可以在任务执行端上,通过与服务器的配合来实现线路故障探测,该装置具体包括:
初始探测任务获取单元301,用于获取初始探测任务;
第一探测任务确定单元302,用于根据任务发送条件在所述初始探测任务中确定第一探测任务,所述第一探测任务为待下发的探测任务;
第一探测任务发送单元303,用于发送所述第一探测任务至任务执行端;
探测任务解析结果获取单元304,用于获取由所述任务执行端处理得到的探测任务解析结果,所述探测任务解析结果中包括多个线路监控指标;
监控处理结果获取单元305,用于通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果;
线路异常状态确定单元306,用于根据所述监控处理结果及其他线路监控指标,确定线路异常状态;
告警信息发送单元307,用于根据所述线路异常状态及预设告警阶梯阈值发送告警信息。
通过本文实施例的设置,可以对单条线路状态进行探测和预警,且可以对多种类型的数量较大的多条线路错峰执行探测任务,可以高频度监控线路的运行状态,根据监控指标实现自动检查线路异常状况,并根据检测到的线路异常状况实现阶梯式告警,有效缓解业务压力,实现运维部门、业务部门与运营商的快速耦合,精准定位故障,提高业务效率,进一步优化用户体验。
作为本文的一个实施例,还可以参考如图4所示为本实施例垂直定位故障的线路探测装置的具体结构示意图,所述初始探测任务获取单元301还用于,根据监测周期获取初始探测任务。
作为本文的一个实施例,所述初始探测任务获取单元301进一步包括:
监测周期确定模块3011,用于确定服务器获取线路探测任务的周期。
作为本文的一个实施例,所述第一探测任务确定单元302进一步包括:
任务发送条件确定模块3021,用于根据线路的探测周期确定下发第一探测任务满足的发送条件。
作为本文的一个实施例,所述探测任务解析结果获取单元304进一步包括:
解析模块3041,用于解析、提取、整合获得的解析结果。
作为本文的一个实施例,所述监控处理结果获取单元305进一步包括:
采集模块3051,用于采集一定时间周期内线路的探测任务解析结果;
计算模块3052,用于计算不同时间点的线路探测成功率及权重的乘积。
作为本文的一个实施例,所述告警信息发送单元307进一步包括:
告警维护期确定模块3071,用于根据线路异常状态确定告警维护期。
如图5所示为本文实施例一种确定第一探测任务的方法流程图。
步骤501,对初始探测任务中所有线路设置初始时间,所述初始时间随时间递增。
在本步骤中,系统服务器对初始探测任务中的所有线路设置初始时间,即:对所有线路随机赋予一个初始时间值,例如,随机赋予的初始时间值为20、35、55、60、65等任意大于0的整数。随着时间的增加,所有线路的初始时间值也随之递增。在本说明书一些实施例中,线路的初始时间值随时间递增的规律可以是一致的。例如,所有线路的初始时间值随时间每秒累加1、每秒累加2、每10秒累加10等。在本说明书的另外一些实施例中,线路的初始时间值随时间递增的规律可以是不同的,具体的,不同类型线路的初始时间值随时间递增的规律不同。例如,探测周期为2分钟的线路的初始时间值随时间每秒累加10,而探测周期为5分钟/次的线路的初始时间值随时间每秒累加20等。本发明对线路的初始时间值随时间递增的规律在此不做限定。
步骤502,根据所述线路对应的探测周期确定所述线路的探测起始时间。
在本步骤中,线路的探测起始时间表示对一条线路执行探测任务的触发时间,即:将一条线路的探测任务下发至任务执行端执行探测任务的触发时间。当线路的初始时间值达到所述探测起始时间,即可以将该线路的探测任务确定为第一探测任务。在本步骤中,每条线路的起始探测时间可以根据线路的探测周期确定。其中,线路的探测起始时间可以是一个数值。例如,探测周期为1分钟/次的线路,其探测起始时间值为60;探测周期为2分钟/次的线路,其探测起始时间值为120;探测周期为5分钟/次的线路,其探测起始时间值为300。
步骤503,当所述初始时间递增达到所述探测起始时间时,执行所述探测任务。
在本步骤中,以一条探测周期为2分钟/次的银行对公业务线路为例,根据线路的探测周期确定线路的探测起始时间为120s。系统服务器对该类型该条线路随机赋初值65,该初值随时间累加,具体为:每10秒累加10,当该初值超过120时,确定该线路对应的探测任务为第一探测任务。该线路从当前时刻开始,经过60秒达到探测起始时间。由此将在下一步骤中发送该线路对应的探测任务。在该类型线路的其他线路中,系统服务器对某线路随机赋值30,该初值随时间累加,每10秒累加10,当该初值超过120时,确定该线路对应的探测任务为第一探测任务。该线路从当前时刻开始,经过90秒达到探测起始时间,由此将在下一步骤中发送该线路对应的探测任务。
如图6所示为本文实施例一种对线路监控指标作滑动平均处理的流程图。
步骤601,采集一定时间周期内线路的探测任务解析结果,所述探测任务解析结果中包括线路探测成功率。
在本步骤中,为了减少线路单次异常引起的告警或误报,可以对一段时间窗口内对同一条线路采集到的多次数据进行分析判断,以确定是否进行报警,进一步减少突发告警量。在本步骤中,根据业务需求设置采集周期用于采集一段时间内,同一条线路已执行完毕的探测任务的解析结果。通过采集一定时间内一条线路的探测任务解析结果,可以获取该线路在一段时间内连续多次的线路状况,可以较为全面地获取该线路最近时间内的状况。在本文的一些实施例中,采集周期可以根据该线路的探测周期设置,设置采集周期后可以确定采集数据的个数。在本文的一些实施例中,采集周期可以是2分钟、5分钟、10分钟、15分钟、20分钟等。对于探测周期为2分钟的线路而言,当采集周期为10分钟时,可以采集5次线路状态;对探测周期为1分钟的线路而言,当采集周期为10分钟时,可以采集10次线路状态。
步骤602,根据加权递推平均滤波算法对所述时间周期内不同时间点的线路赋权重。
考虑到数据的有效性可能会随着时间的增加而衰减,因此对不同时间下的数据设置不同的权重。在本发明的一些实施例中,权重反映了当前数据的相对重要性。在本步骤中,不同采样点的权重可以是预先设定的,也可以是根据业务需求更新调整。
在本文的一些实施例中,使用加权递推平均滤波法对采集的多组数据求加权平均作为单次数据的有效值。可以解决实时性问题:对不同采集时刻的线路数据赋予不同的权重。具体的,对越接近当前时刻的采集数据,赋予的权重越大,则该采集周期内的数据灵敏度越高。
在本步骤中,对同一条线路在采集周期内不同时间点采集到的线路数据赋值。
以采集周期为10分钟为例,权重(Base Weight)为采集周期/采样间隔,即:b=10分钟/采样间隔。在本文的一些实施例中,第一个采样点的权重为2*b;第二个采样点的权重为1*b;其他采样点的权重均为1。
以采样间隔为1分钟为例,权重b=10分钟/1分钟=10,采样点个数为10,总权重为2*10+1*10+8*1=38;其中,第一个采样点的权重为2*10=10,第二个采样点的权重为1*10=10;其他八个采样点的权重均为1。因此第一个采样点的占比为20/38=52.6%;第二个采样点的占比为10/38=26.3%,其他八个点的总占比为21.1%。
若采样周期为10分钟,采样间隔为2分钟时,可以确定权重b=10分钟/2分钟=5,采样点个数为5,总权重为2*5+1*5+3*1=18;其中,第一个采样点的权重为2*5=10,第二个采样点的权重为1*5=5;其他三个采样点的权重均为1。因此第一个采样点的占比为10/18=55.6%,第二个采样的占比为5/18=27.6%,其他三个点的总占比为16.7%。
若采样间隔为5分钟,可以确定权重b=10分钟/5分钟=2,采样点个数为2,总权重为2*2+2=6;其中,第一个采样点的权重为2*2=4,第二个采样点的权重为1*2=2。因此第一个采样点的占比为4/6=66.7%,第二个采样点的占比为33.3%。
步骤603,通过计算对所述不同时间点的线路探测成功率及所述权重的乘积,确定所述线路的最终探测成功率。
例如,采样周期为10分钟,采样间隔为2分钟/次,则一次采集可以采集得到5个采样点。5个采样点的总权重为2*5+1*5+3*1=18;其中,第一个采样点的权重为10,第二个采样点的权重为5;其他三个采样点的权重均为1。第一个采样点的占比为55.6%,第二个采样的占比为27.6%,其他三个点的总占比为16.7%。
例如,假设第一个采样点的探测成功率为100%,第二个采样点的探测成功率为90%,其余三个采样点的探测成功率均为100%,则按照加权递推平均滤波算法,可以确定采样得到的五个点整体的探测成功率为:
55.6%*100%+27.6%*90%+16.7%*100%=97.14%。可以看出第二个采样点的
再例如,假设第一个采样点的探测成功率为80%,其余四个采样点的探测成功率均为100%,则按照加权递推平均滤波算法,可以确定采样得到的五个点整体的探测成功率为:55.6%*80%+27.6%*100%+16.7%*100%=88.78%。
又例如,假设第一、第二个采样点的探测成功率为100%,第三个采样点的探测成功率为70%,其余两个采样点的探测成功率均为100%,将第三、第四、第五个采样点的权重占比视为相同,均为5.56%,则按照加权递推平均滤波算法,可以确定采样得到的五个点整体的探测成功率为:
55.6%*100%+27.6%*100%+5.56%*70%+5.56%*100%+5.56%*100%=98.212%。
综上,根据单条线路的探测成功率,可以确定该线路在采集周期内的线路状况。具体的,根据单条线路在采集周期内探测成功率为100%的情况,可以确定监控正常;对单条线路在采集周期内探测成功率不足100%的情况,可以确定监控失败。对单条线路的探测成功率的滑动平均处理可以将采集周期内多个采集点的数据加权平均处理,降低了数据毛刺,减少线路的突发告警量。
在本说明书一些实施例中,监线路状态包括监控开启中、监控未开启、监控失败、监控正常、延时、丢包、邻居关系down、Ping终端、端口down等多种线路状态。根据线路监控指标可以判断线路状态是否异常。具体的,基于单条线路在采集周期内没有接收到数据包的情况,可以确定监控未开启;基于单条线路在采集周期内接收到数据包数量少于预设阈值的情况,可以确定线路丢包;根据单条线路在采集周期内发送接收数据延时的情况,可以确定线路延时等。
如图7所示为本文实施例提供的一种计算机设备的机构示意图。所述计算机设备702可以包括一个或多个处理器704,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备702还可以包括任何存储器706,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储器706可以包括以下任一项或多种组合:任何类型的随机存取存储器(RAM,Random Access Memory),任何类型的只读存储器(ROM,Read-Only Memory),闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备702的固定或可移除部件。在一种情况下,当处理器704执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备702可以执行相关联指令的任一操作。计算机设备702还包括用于与任何存储器交互的一个或多个驱动机构708,诸如硬盘驱动机构、光盘驱动机构等。
计算机设备702还可以包括输入/输出模块710(I/O),其用于接收各种输入(经由输入设备712)和用于提供各种输出(经由输出设备714))。一个具体输出机构可以包括呈现设备716和相关联的图形用户接口(GUI)718。在其他实施例中,还可以不包括输入/输出模块710(I/O)、输入设备712以及输出设备714,仅作为网络中的一台计算机设备。计算机设备702还可以包括一个或多个网络接口720,其用于经由一个或多个通信链路722与其他设备交换数据。一个或多个通信总线724将上文所描述的部件耦合在一起。
通信链路722可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路722可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
本文实施例中的服务器101、任务执行端104都可以是图7所述的计算机设备。
对应于图1-图6中的方法,本文实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
本文实施例还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行如图1至图6所示的方法。
应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。
还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。

Claims (14)

1.一种垂直定位故障的线路探测方法,其特征在于,所述方法包括:
获取线路的初始探测任务;
根据任务发送条件在所述初始探测任务中确定第一探测任务,所述第一探测任务为待下发的探测任务;
发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果,所述探测任务解析结果中包括多个线路监控指标;
通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果;
根据所述监控处理结果及其他线路监控指标,确定线路异常状态;
根据所述线路异常状态及预设告警阶梯阈值发送告警信息。
2.如权利要求1所述的线路探测方法,其特征在于,所述初始探测任务包括多条线路的探测任务,所述多条线路对应不同的探测周期和探测起始时间。
3.如权利要求2所述的线路探测方法,其特征在于,所述根据任务发送条件在所述初始探测任务中确定第一探测任务包括:当所述初始探测任务中的线路达到各自的探测起始时间,将所述初始探测任务确定为所述第一探测任务。
4.如权利要求3所述的线路探测方法,其特征在于,所述根据任务发送条件在所述初始探测任务中确定所述第一探测任务进一步包括:
对所述初始探测任务中所有线路设置初始时间,所述初始时间随时间递增;
根据所述线路对应的探测周期确定所述线路的探测起始时间;
当所述初始时间递增达到所述探测起始时间时,执行所述探测任务。
5.如权利要求4所述的线路探测方法,其特征在于,所述根据任务发送条件在所述初始探测任务中确定第一探测任务后还包括更新所述第一探测任务,包括:
将所述第一探测任务达到所述探测起始时间的初始时间清零;
当所述线路历经所述线路的探测周期,并递增达到所述探测起始时间时,执行下一次探测任务。
6.如权利要求1所述的线路探测方法,其特征在于,所述发送所述第一探测任务至任务执行端,获取由所述任务执行端处理得到的探测任务解析结果包括:
发送所述第一探测任务至第一任务执行端,获取由第一任务执行端处理得到的探测结果;
发送所述探测结果至第二任务执行端,获取由第二任务执行端处理得到的解析结果。
7.如权利要求6所述的线路探测方法,其特征在于,所述获取由第一任务执行端处理得到的探测结果包括:从消息队列中获取由所述第一任务执行端处理得到的探测结果。
8.如权利要求6所述的线路探测方法,其特征在于,所述获取由所述第二任务执行端处理得到的解析结果包括:
根据所述第二任务执行端的空闲状态向所述第二任务执行端发送解析任务;
从消息队列中获取由第二任务执行端经过解析、提取、整合处理获得的解析结果。
9.如权利要求1所述的线路探测方法,其特征在于,所述解析结果中的线路监控指标包括:探测成功率、平均时延、最大时延、最小时延。
10.如权利要求9所述的线路探测方法,其特征在于,所述对所述线路监控指标中的至少一个监控指标作滑动平均处理包括:
采集一定时间周期内线路的探测任务解析结果,所述探测任务解析结果中包括线路探测成功率;
根据加权递推平均滤波算法对所述时间周期内不同时间点的线路赋权重;
通过计算对所述不同时间点的线路探测成功率及所述权重的乘积,确定所述线路的最终探测成功率。
11.如权利要求1所述的线路探测方法,其特征在于,所述根据所述线路异常状态及预设告警阶梯阈值发送告警信息包括:根据线路异常状态确定告警维护期,以发送阶梯告警。
12.一种垂直定位故障的线路探测装置,其特征在于,所述装置包括:
初始探测任务获取单元,用于根据监控周期获取初始探测任务;
第一探测任务确定单元,用于根据任务发送条件在所述初始探测任务中确定第一探测任务,所述第一探测任务为待下发的探测任务;
第一探测任务发送单元,用于发送所述第一探测任务至任务执行端;
探测任务解析结果获取单元,用于获取由所述任务执行端处理得到的探测任务解析结果,所述探测任务解析结果中包括多个线路监控指标;
监控处理结果获取单元,用于通过对所述多个线路监控指标中的至少一个监控指标作滑动平均处理,获取监控处理结果;
线路异常状态确定单元,用于根据所述监控处理结果及其他线路监控指标,确定线路异常状态;
告警信息发送单元,用于根据所述线路异常状态及预设告警阶梯阈值发送告警信息。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-11的任意一项垂直定位故障的线路探测方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-11的任意一项垂直定位故障的线路探测方法。
CN202111219127.9A 2021-10-20 2021-10-20 一种垂直定位故障的线路探测方法及装置 Active CN113965486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111219127.9A CN113965486B (zh) 2021-10-20 2021-10-20 一种垂直定位故障的线路探测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111219127.9A CN113965486B (zh) 2021-10-20 2021-10-20 一种垂直定位故障的线路探测方法及装置

Publications (2)

Publication Number Publication Date
CN113965486A true CN113965486A (zh) 2022-01-21
CN113965486B CN113965486B (zh) 2023-04-21

Family

ID=79464812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111219127.9A Active CN113965486B (zh) 2021-10-20 2021-10-20 一种垂直定位故障的线路探测方法及装置

Country Status (1)

Country Link
CN (1) CN113965486B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060072707A1 (en) * 2004-09-30 2006-04-06 International Business Machines Corporation Method and apparatus for determining impact of faults on network service
CN102055626A (zh) * 2010-12-31 2011-05-11 北京中创信测科技股份有限公司 一种ip网络质量检测方法及系统
CN102624570A (zh) * 2012-04-27 2012-08-01 杭州东信北邮信息技术有限公司 实现对web服务器可用性进行检测的监控系统和方法
CN107743079A (zh) * 2017-09-29 2018-02-27 网宿科技股份有限公司 线路探测方法、设备及计算机可读存储介质
CN111510349A (zh) * 2020-04-09 2020-08-07 上海东普信息科技有限公司 业务异常检测和告警方法、装置、设备及存储介质
CN112052111A (zh) * 2020-09-08 2020-12-08 中国平安人寿保险股份有限公司 服务器异常预警的处理方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060072707A1 (en) * 2004-09-30 2006-04-06 International Business Machines Corporation Method and apparatus for determining impact of faults on network service
CN102055626A (zh) * 2010-12-31 2011-05-11 北京中创信测科技股份有限公司 一种ip网络质量检测方法及系统
CN102624570A (zh) * 2012-04-27 2012-08-01 杭州东信北邮信息技术有限公司 实现对web服务器可用性进行检测的监控系统和方法
CN107743079A (zh) * 2017-09-29 2018-02-27 网宿科技股份有限公司 线路探测方法、设备及计算机可读存储介质
CN111510349A (zh) * 2020-04-09 2020-08-07 上海东普信息科技有限公司 业务异常检测和告警方法、装置、设备及存储介质
CN112052111A (zh) * 2020-09-08 2020-12-08 中国平安人寿保险股份有限公司 服务器异常预警的处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113965486B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN102447570B (zh) 一种基于健康度分析的监控装置及方法
US8144599B2 (en) Binary class based analysis and monitoring
CN108989136B (zh) 业务端到端性能监控方法及装置
CN113190423B (zh) 业务数据的监控方法、装置及系统
CN111010291A (zh) 业务流程异常告警方法、装置、电子设备及存储介质
CN102882701A (zh) 一种电网核心业务数据智能化监控告警系统及方法
CN112699007A (zh) 监控机器性能的方法、系统、网络设备及存储介质
CN113271224A (zh) 节点的定位方法、装置、存储介质及电子装置
CN112350854A (zh) 一种流量故障定位方法、装置、设备及存储介质
CN107317708B (zh) 一种法院业务应用系统的监测方法及装置
CN110808856A (zh) 一种基于数据中心的大数据运维方法及系统
CN113656252A (zh) 故障定位方法、装置、电子设备以及存储介质
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN113760634A (zh) 一种数据处理方法和装置
CN113965486B (zh) 一种垂直定位故障的线路探测方法及装置
CN116645082A (zh) 一种系统巡检方法、装置、设备以及存储介质
KR100323747B1 (ko) 교환망에 대한 지능형 서비스 감시 방법
CN109450103A (zh) 压板的状态检测方法、装置及智能终端
CN116166499A (zh) 数据监测方法、装置、电子设备及非易失性存储介质
CN114257414A (zh) 一种网络安全智能值班方法及系统
JP2000041039A (ja) ネットワーク監視装置および方法
CN102567470A (zh) 系统级性能数据的处理方法及设备
CN113821403A (zh) 一种服务器监控方法、装置、电子设备及存储介质
CN111585819A (zh) 一种配网通信设备故障分析方法和系统
CN112134760A (zh) 链路状态监控方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant