CN116775359A - 故障业务的告警方法、装置、存储介质及电子装置 - Google Patents

故障业务的告警方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN116775359A
CN116775359A CN202310729775.1A CN202310729775A CN116775359A CN 116775359 A CN116775359 A CN 116775359A CN 202310729775 A CN202310729775 A CN 202310729775A CN 116775359 A CN116775359 A CN 116775359A
Authority
CN
China
Prior art keywords
service
fault
storage space
fault service
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310729775.1A
Other languages
English (en)
Inventor
黄镜澄
王鹏培
陈巧燕
李兰彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310729775.1A priority Critical patent/CN116775359A/zh
Publication of CN116775359A publication Critical patent/CN116775359A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种故障业务的告警方法、装置、存储介质及电子装置。涉及金融科技领域,该方法包括:在检测到出现第一故障业务的情况下,将第一故障业务分别存储至第一存储空间和第二存储空间,其中,第一存储空间用于记录故障业务以及故障业务对应的修复状态,第二存储空间用于记录待告警的故障业务;根据第一存储空间中记录的修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,第二故障业务是第二存储空间中在第一故障业务之前存储的故障业务;通过与客户端之间建立的长连接发送第一告警信息至客户端,其中,第一告警信息用于向客户端告警第一故障业务和第三故障业务的故障情况。通过本申请,解决了相关技术中业务告警的准确度较低的问题。

Description

故障业务的告警方法、装置、存储介质及电子装置
技术领域
本申请涉及金融科技领域,具体而言,涉及一种故障业务的告警方法、装置、存储介质及电子装置。
背景技术
目前,大量应用的采用分布式架构和云计算平台,使得系统的逻辑复杂度增加,部署规模增大。在面对大量例如快捷支付、手机银行等等复杂业务场景时,不同服务类型节点间的调用关系错综复杂,现有技术中,一般通过业务拓扑展示装置,在前端生成针对业务场景的业务拓扑图,每分钟刷新节点的业务状态检测是否发生业务告警,但由于动态页面频繁渲染造成浏览器的压力过大,可能发生用户操作被重置导致业务告警产生偏差的情况,使得系统在易用性上产生缺陷。
针对相关技术中业务告警的准确度较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种故障业务的告警方法、装置、存储介质及电子装置,以解决相关技术中业务告警的准确度较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种故障业务的告警方法。
该方法包括:
在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
可选的,所述根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,包括:
从所述第二存储空间中提取在所述第一故障业务之前存储的所述第二故障业务;
从所述第一存储空间中查询所述第二故障业务对应的目标修复状态;
从所述第二故障业务中获取所述目标修复状态为未修复的故障业务作为所述第三故障业务。
可选的,在所述从所述第一存储空间中查询所述第二故障业务对应的目标修复状态之后,所述方法还包括:
确定所述目标修复状态为已修复的第四故障业务;
从所述第二存储空间中删除所述第四故障业务。
可选的,在所述将所述第一故障业务分别存储至第一存储空间和第二存储空间之前,所述方法还包括:
检测所述客户端上运行的业务的业务状态;
将所述业务状态为异常状态的业务确定为所述第一故障业务。
可选的,所述检测所述客户端上运行的业务的业务状态,包括:
获取目标业务的业务数据,其中,所述目标业务是所述客户端上处于操作状态的业务,所述业务数据包括所述目标业务的多项指标参数;
根据所述多项指标参数计算所述目标业务的业务成功率;
在所述业务成功率小于目标阈值的情况下,确定所述目标业务的业务状态为异常状态。
可选的,在所述通过与客户端之间建立的长连接发送第一告警信息至所述客户端之后,所述方法还包括:
在到达目标时间段的结束时间点的情况下,获取所述第一存储空间中所述修复状态仍为未修复的第五故障业务,其中,所述第一存储空间中存储了所述目标时间段内的全部故障业务;
通过所述长连接发送第二告警信息至所述客户端,其中,所述第二告警信息用于向所述客户端告警所述第五故障业务的故障情况。
可选的,所述将所述第一故障业务分别存储至第一存储空间和第二存储空间,包括:将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间,并将所述第一故障业务存储至所述第二存储空间;
在所述将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间之后,所述方法还包括:检测所述第一故障业务的当前修复状态;在所述当前修复状态为已修复状态的情况下,将所述第一存储空间中存储的所述第一故障业务对应的未修复状态更新为所述第一故障业务对应的已修复状态。
为了实现上述目的,根据本申请的另一方面,提供了一种故障业务的告警装置。
该装置包括:
存储模块,用于在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
筛选模块,用于根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
第一发送模块,用于通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
通过本申请,采用以下步骤:在检测到出现第一故障业务的情况下,将第一故障业务分别存储至用于记录故障业务以及故障业务对应的修复状态的第一存储空间和用于记录待告警的故障业务的第二存储空间;根据第一存储空间中记录的修复状态,从第二存储空间中在第一故障业务之前存储的故障业务中筛选尚未修复的第三故障业务;通过与客户端之间建立的长连接发送用于向客户端告警第一故障业务和第三故障业务的故障情况的第一告警信息至客户端。也就是说,根据第一存储空间中存储的故障业务的修复状态确定第二存储空间中尚未修复的第三故障业务,再将第三故障业务通过与客户端之间建立的长连接进行告警。即在将第二存储空间中的存储的故障业务进行告警前,对第二存储空间中的存储的故障业务进行修复状态的确定,只需将未修复的第三故障业务进行告警,避免将已修复的业务进行错误告警,解决了相关技术中业务告警的准确度较低的问题。进而达到了提高了业务告警的准确度的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的故障业务的告警方法的流程图;
图2是根据本申请实施例提供的第一故障业务的检测的流程图;
图3是根据本申请实施例提供的第一存储空间的示意图;
图4是根据本申请实施例提供的第三故障业务的告警的示意图;
图5是根据本申请实施例提供的第五故障业务的告警的示意图;
图6是根据本申请实施例提供的目标时间段的结束时间点的示意图;
图7是根据本申请实施例的故障业务的告警装置的示意图;
图8是根据本申请实施例的电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的故障业务的告警方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
步骤S102,根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
步骤S103,通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
通过上述步骤,在检测到出现第一故障业务的情况下,将第一故障业务分别存储至用于记录故障业务以及故障业务对应的修复状态的第一存储空间和用于记录待告警的故障业务的第二存储空间;根据第一存储空间中记录的修复状态,从第二存储空间中在第一故障业务之前存储的故障业务中筛选尚未修复的第三故障业务;通过与客户端之间建立的长连接发送用于向客户端告警第一故障业务和第三故障业务的故障情况的第一告警信息至客户端。也就是说,根据第一存储空间中存储的故障业务的修复状态确定第二存储空间中尚未修复的第三故障业务,再将第三故障业务通过与客户端之间建立的长连接进行告警。即在将第二存储空间中的存储的故障业务进行告警前,对第二存储空间中的存储的故障业务进行修复状态的确定,只需将未修复的第三故障业务进行告警,避免将已修复的业务进行错误告警,解决了相关技术中业务告警的准确度较低的问题。进而达到了提高了业务告警的准确度的效果。
在上述步骤S101提供的技术方案中,本申请提出的故障业务的告警方法适用的场景广泛,可以应用至多种需要进行业务监控的场景中,可以但不限于包括:快捷支付场景中的支付业务、存款业务、取款业务、退款业务等等,程序监控场景中的页面响应业务、程序交互业务、数据库的交互业务等等。在不同的场景中,确定故障业务的条件可以不同,上述故障业务的告警方法可以迁移至各种故障业务的告警需求中。
可选地,在本实施例中,可以但不限于通过系统中的异常探测节点进行故障业务的检测,将探测到的每个故障业务依次确定为第一故障业务并分别存储至第一存储空间和第二存储空间,比如:通过异常探测节点获取每个业务的状态,在检测到出现第一故障业务的情况下,将第一故障业务以及第一故障业务对应的修复状态存储至第一存储空间,将第一故障业务存储至第二存储空间。
可选地,在本实施例中,可以但不限于将每个发生故障的故障业务以及故障业务对应的修复状态存储至第一存储空间实现对每个故障业务的记录,第一存储空间可以但不限于是具有持久化存储功能的数据管理工具,比如:数据库、内存、分布式文件系统等等。
可选地,在本实施例中,可以但不限于使用第一存储空间记录每个发生故障的故障业务以及故障业务对应的修复状态,比如:在需要查询系统在历史故障业务的情况下,从第一存储空间中获取历史时刻发生的故障业务以及故障业务的修复状态。
可选地,在本实施例中,可以但不限于将检测到的故障业务存储至第二存储空间,第二存储空间可以但不限于是访问速度较高的存储设备,比如:缓存、存储器、高速缓冲区域等等。
可选地,在本实施例中,可以但不限于将新检测到的故障业务存储至第二存储空间,由于第二存储空间的访问速度较高使得故障业务从第二存储空间推送至客户端的速率高于从第一存储空间推送至客户端的速率,使得故障业务的告警速率增高。
可选地,在本实施例中,可以但不限于将使用异步写入的策略将第一故障业务存储至第一存储空间和第二存储空间,减少对正常业务的处理,比如:在检测到出现第一故障业务的情况下,就将第一故障业务写入至一个缓冲队列,并启动一个后台任务用于从缓冲队列中读取第一故障业务,并将第一故障业务写入第一存储空间。或者,在检测到出现第一故障业务的情况下,就将第一故障业务写入至一个缓冲队列,并启动一个线程用于从缓冲队列中读取第一故障业务,并将第一故障业务写入第一存储空间。
在一个示例性实施例中,在所述将所述第一故障业务分别存储至第一存储空间和第二存储空间之前,可以但不限于还包括一下方式:检测所述客户端上运行的业务的业务状态;将所述业务状态为异常状态的业务确定为所述第一故障业务。
可选地,在本实施例中,上述客户端可以但不限于是运行了多个业务,可以但不限于通过检测客户端上运行的每个业务的业务状态从客户端上运行的全部业务中确定第一故障业务。
可选地,在本实施例中,上述第一故障业务是客户端上运行的业务中业务状态处于异常的业务,可以但不限于为客户端上运行的业务设定告警参数,告警参数用于指示客户端上运行的业务的业务状态,告警参数可以但不限于包括:业务执行的成功率、业务的耗时等等参数。
可选地,在本实施例中,可以但不限于通过告警参数确定客户端上运行的业务的业务状态,比如:启动异常探测节点与客户端连接,异常探测节点获取客户端上运行的业务的数据,异常探测节点定期检查客户端上运行的业务的数据是否超出告警参数指示的数值范围,在客户端上运行的业务的数据超出告警参数指示的数值范围的情况下,确定业务状态为异常状态。或者,通过定时任务,一段时间内收集一次客户端上运行的业务的成功率以及业务的生死指标,并根据预先设定的告警参数确定各个业务的状态,在客户端上运行的业务的数据超出告警参数指示的数值范围的情况下,确定业务状态为异常状态。
在一个示例性实施例中,可以但不限于采用以下方式检测所述客户端上运行的业务的业务状态:获取目标业务的业务数据,其中,所述目标业务是所述客户端上处于操作状态的业务,所述业务数据包括所述目标业务的多项指标参数;根据所述多项指标参数计算所述目标业务的业务成功率;在所述业务成功率小于目标阈值的情况下,确定所述目标业务的业务状态为异常状态。
可选地,在本实施例中,上述目标业务是客户端上处于操作状态的业务,比如:快捷支付场景中的支付业务、存款业务、取款业务、退款业务等等,程序监控场景中的页面响应业务、程序交互业务、数据库的交互业务等等。
可选地,在本实施例中,上述业务数据是客户端上处于操作状态的业务的多项指标参数,比如:业务的刷新率、业务的响应时间等等。
可选地,在本实施例中,可以但不限于根据客户端上处于操作状态的业务的多项指标参数计算出每个业务对应的业务成功率,比如:根据计算客户端上页面切换时的响应时间得到客户端响应业务的业务成功率。
可选地,在本实施例中,上述目标阈值可以但不限于是预先确定的,用于确定业务的业务状态。或者,上述目标阈值可以但不限于是根据当前网络状态进行实时更新的,比如:在网络状态较差的情况下,减小阈值所指示的异常数值的范围;在网络状态优秀的情况下,适当扩大阈值所指示的异常数值的范围。
在一个示例性实施例中,将所述第一故障业务分别存储至第一存储空间和第二存储空间可以但不限于还包括以下方式:将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间,并将所述第一故障业务存储至所述第二存储空间;在所述将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间之后,可以但不限于还包括以下方式:检测所述第一故障业务的当前修复状态;在所述当前修复状态为已修复状态的情况下,将所述第一存储空间中存储的所述第一故障业务对应的未修复状态更新为所述第一故障业务对应的已修复状态。
可选地,在本实施例中,在检测到第一故障业务的情况下,可以但不限于将第一故障业务以及第一故障业务对应的未修复状态存储至第一存储空间,第一存储空间可以但不限于用于存储所有发生过的故障业务的业务数据以及每个业务的修复状态。
可选地,在本实施例中,第一存储空间中每个业务的修复状态可以但不限于是可以更新的,比如:在检测到故障业务后,可以对故障业务进行修复,在故障业务被修复的情况下,将第一存储空间中被修复的故障业务的修复状态更新为已修复状态。
可选地,在本实施例中,可以但不限于通过以下方式更新第一存储空间中故障业务的当前修复状态:通过与客户端之间建立的长连接,实时获取客户端的业务的业务成功率,与第一存储空间中记录的业务成功率进行比对,确定业务状态与历史记录中的是否一致,一致则不更新;不一致,则传递标志信息以及最新业务状态到客户端请求重新渲染,其中,负载均衡使用会话保持策略,客户端通过标志信息关联到对应的拓扑节点,展示新的状态属性。
图2是根据本申请实施例提供的第一故障业务的检测的流程图,如图2所示,
步骤S202:获取客户端上运行的业务的多项指标参数;
步骤S204:根据多项指标参数计算业务的业务成功率;
步骤S206:在业务成功率小于目标阈值的情况下,确定业务的业务状态为异常状态;或者,在业务成功率大于或者等于目标阈值的情况下,确定业务的业务状态为正常状态;
步骤S208:将业务状态为异常状态的业务确定为第一故障业务。
在上述步骤S102提供的技术方案中,第二存储空间中可以但不限于存储了多个故障业务,可以但不限于将第二存储空间中存储的全部业务确定为第二故障业务。第二故障业务可以但不限于包括已经被修复的故障业务和尚未修复的故障业务。
可选地,在本实施例中,上述第二故障业务是第二存储空间在第一故障业务之前存储的故障业务。
可选地,在本实施例中,第一存储空间中可以但不限于记录了包括第二故障业务的故障业务的修复状态,可以但不限于从第一存储空间中获取第二故障业务的修复状态实现从第二故障业务中筛选尚未修复的第三故障业务。
可选地,在本实施例中,上述第三故障业务是第二存储空间中存储的处于尚未修复的故障业务。可以但不限于根据第一存储空间中记录的修复状态,确定第二故障业务中的第三故障业务。
在一个示例性实施例中,可以但不限于采用以下方式根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务:从所述第二存储空间中提取在所述第一故障业务之前存储的所述第二故障业务;从所述第一存储空间中查询所述第二故障业务对应的目标修复状态;从所述第二故障业务中获取所述目标修复状态为未修复的故障业务作为所述第三故障业务。
可选地,在本实施例中,上述目标修复状态用于指示第二存储空间中每个故障业务的修复状态,第二存储空间中的故障业务可以但不限于处于未修复状态或者已修复状态。
在一个示例性实施例中,在所述从所述第一存储空间中查询所述第二故障业务对应的目标修复状态之后,可以但不限于还包括以下方式:确定所述目标修复状态为已修复的第四故障业务;从所述第二存储空间中删除所述第四故障业务。
可选地,在本实施例中,可以但不限于从第一存储空间中查询第二故障业务对应的目标修复状态,将处于尚未修复的故障业务确定为第三故障业务,将已修复的故障业务确定为第四故障业务。
可选地,在本实施例中,可以但不限于将第二存储空间中的第一故障业务和第三故障业务进行告警,并将第四故障业务从第二存储空间中删除。
图3是根据本申请实施例提供的第一存储空间的示意图,如图3所示,第一存储空间中可以但不限于包括以下内容:可以但不限于通过第一存储空间节点接收故障业务并处理服务器发出的请求。
第一存储空间中存储的故障业务可以但不限于包含用于指示故障业务发生时间的时间戳、故障业务类型、故障业务指标、故障业务级别、故障业务数据等等信息。
以第一存储空间为Clickhouse(Click Stream,Data WareHouse,一个完全的列式数据库管理系统)时序数据库为例,将故障业务根据故障业务发生的时间进行分区,比如:在需要查询最近一小时的故障业务的情况下,可以但不限于通过时间查询,大幅度提高查询效率。或者,将故障业务根据故障业务告警的时间进行分区,比如:在需要查询最近一小时告警的故障业务的情况下,可以但不限于通过时间查询,大幅度提高查询效率。
可以但不限于通过对第一存储空间中存储的故障业务创建bitmap(位图)索引,通过bitmap索引进行查询,保证查询的效率,比如:以对查询频率较高的字段:告警类型和告警级别分别创建Bitmap索引,每个索引都是一个位图,每个位对应一个报警信息,位为1时表示该故障业务属于该告警类型或告警级别,位为0则指示该故障业务不属于该告警类型或告警级别,比如:业务A的告警类型为告警类型1,告警级别为高级别;业务B的告警类型为告警类型2,告警级别为低级别。
以查询所有告警类型为网络故障类型的故障业务为例,可以但不限于通过以下方法进行查询:将Bitmap索引中告警类型设定为网络故障类型,即可获取到历史故障业务中所有告警类型为网络故障类型的故障业务的位置,通过位置即可访问对应的故障业务,无需浏览第一存储空间中存储的全部故障业务,提高了查询的效率。
以查询所有报警级别为高级别的故障业务为例,可以但不限于通过以下方法进行查询:将Bitmap索引中告警级别设定为高级别,即可获取到历史故障业务中所有告警级别为高级别的故障业务的位置,通过位置即可访问对应的故障业务,无需浏览第一存储空间中存储的全部故障业务,提高了查询的效率。
图4是根据本申请实施例提供的第三故障业务的告警的示意图,如图4所示,以第一存储空间为数据库,第二存储空间为缓存为例,可以但不限于通过以下方式,从第二故障业务中筛选尚未修复的第三故障业务:
通过websocket(一种在单个TCP连接上进行全双工通信的协议)技术建立异常节点检测装置与客户端之间的长连接,定时收集客户端上处于操作状态的目标业务的多项指标参数确定目标业务的业务成功率从而判定各个业务的业务状态,在业务成功率小于阈值的情况下,可以但不限于将业务状态确定为异常状态,异步写入数据库记录异常业务。
在检测到出现第一故障业务的情况下,将第一故障业务分别存储至数据库和缓存中,次数,缓存中可以但不限于包括多个待告警的故障业务(第二故障业务);从数据库中获取缓存中多个待告警的故障业务的修复状态,确定未修复的故障业务为第三故障业务。可以但不限于通过以下方式确定故障业务的修复状态:
再次获取待告警的故障业务的相关数据(可以但不限于包括业务成功率),若故障业务的当下的相关数据指示该故障业务已修复,则从缓存中删除。
若故障业务的当下的相关数据指示该故障业务仍为未修复,则将该故障业务确定尚未修复的第三故障业务通过与客户端之间的长连接进行告警。
避免对已修复故障业务的错误告警,避免向客户端发送重复的告警,减少了冗余信息的传递。
在上述步骤S103提供的技术方案中,上述长连接可以但不限于是在检测第一故障业务时建立的。或者,在向客户端发送第一告警信息时建立的。
可选地,在本实施例中,客户端可以但不限于通过获取第一告警信息实现对第二存储空间中未修复的第三故障业务和检测到的第一故障业务的获取,再将第一故障业务和第三故障业务的故障情况进行推送。
可选地,在本实施例中,上述长连接可以但不限于用于与客户端进行数据交换,可以但不限于通过接口建立与客户端的长连接,比如:websocket等等。
可选地,在本实施例中,可以但不限于将第一告警信息封装成JSON格式(JavaScript Object Notation,一种轻量级的数据交换格式)使用非阻塞的异步通信方式通过已建立的websocket推送到客户端,处理多个告警业务。
可选地,在本实施例中,上述客户端可以但不限于根据接收到的第一告警信息更新拓扑第一告警信息对应的第三故障业务和第一故障业务的状态属性、样式等等。可以但不限于使用差异渲染策略,只重新渲染变化的部分,提高渲染效率和用户体验。
在一个示例性实施例中,在所述通过与客户端之间建立的长连接发送第一告警信息至所述客户端之后,可以但不限于还包括以下方式:在到达目标时间段的结束时间点的情况下,获取所述第一存储空间中所述修复状态仍为未修复的第五故障业务,其中,所述第一存储空间中存储了所述目标时间段内的全部故障业务;通过所述长连接发送第二告警信息至所述客户端,其中,所述第二告警信息用于向所述客户端告警所述第五故障业务的故障情况。
可选地,在本实施例中,上述目标时间段可以但不限于是一个周期,用于指示第二存储空间存储目标时间段内发生的故障业务。
可选地,在本实施例中,上述目标时间段的结束时间点可以但不限于是当前目标时间段与下一时间段切换的时刻,用于指示第二存储空间记录下一时间段内发生的故障业务。
可选地,在本实施例中,可以但不限于将第一存储空间内记录的全部处于未修复状态的故障业务确定为第五故障业务,第五故障业务可以但不限于包括目标时间段内发生的处于未修复状态的故障业务和目标时间段前发生的在结束时间点仍处于未修复状态的故障业务。
可选地,在本实施例中,可以但不限于通过与客户端建立的长连接对第五故障业务进行告警,上述第二告警信息可以但不限于包括第五故障业务以及第五故障业务对应的故障情况。
可选地,在本实施例中,上述长连接可以但不限于用于与客户端进行数据交换,可以但不限于通过接口建立与客户端的长连接,比如:websocket等等。
可选地,在本实施例中,可以但不限于将第二告警信息封装成JSON格式,使用非阻塞的异步通信方式通过已建立的websocket推送到客户端,处理多个告警业务。
可选地,在本实施例中,上述客户端可以但不限于根据接收到的第二告警信息更新拓扑第二告警信息对应的第五故障业务的状态属性、样式等等。可以但不限于使用差异渲染策略,只重新渲染变化的部分,提高渲染效率和用户体验。
图5是根据本申请实施例提供的第五故障业务的告警的示意图,如图5所示,以第一存储空间为数据库为例,可以但不限于通过以下方法实现第五故障业务的告警:
通过websocket技术建立异常节点检测装置与客户端之间的长连接,定时收集客户端上处于操作状态的目标业务的多项指标参数确定目标业务的业务成功率从而判定各个业务的业务状态,在业务成功率小于阈值的情况下,可以但不限于将业务状态确定为异常状态,异步写入数据库记录异常业务。
在到达目标时间段的结束时间点的情况下,从数据库的全部历史故障业务中获取仍旧处于未修复状态的故障业务并将其确定为第五故障业务;
通过与客户端之间的长连接将用于指示第五故障业务的故障情况的第二告警信息发送至客户端进行告警操作。
图6是根据本申请实施例提供的目标时间段的结束时间点的示意图,如图6所示,在目标时间段内在故障发生点1和故障发生点2依次检测到了故障业务的出现,到达目标时间段的结束时间点前可以但不限于通过以下方法实现每个故障业务的告警:
在故障发生点1检测到了故障业务1,将故障业务1分别存储至第一存储空间和第二存储空间,此时,第一存储空间内记录了包括故障业务1以及检测到故障业务1之间的每个故障业务以及故障业务对应的修复状态,第二存储空间内只记录了待告警的故障业务1;通过与客户端之间建立的长连接发送用于向客户端告警故障业务1的故障情况的第一告警信息至客户端。
在故障发生点2检测到了故障业务2,将故障业务2分别存储至第一存储空间和第二存储空间,此时,第一存储空间内记录了包括故障业务1、故障业务2以及检测到故障业务1之间的每个故障业务以及故障业务对应的修复状态,第二存储空间内记录了故障业务1和待告警的故障业务2;从第一存储空间中查询故障业务1的修复状态;
在故障业务1为未修复的情况下,将故障业务1作为第三故障业务,通过与客户端之间建立的长连接发送用于向客户端告警故障业务1和故障业务2的故障情况的第一告警信息至客户端。
在故障业务1为已修复的情况下,将故障业务1作为第四故障业务,从第二存储空间中删除故障业务1,通过与客户端之间建立的长连接发送用于向客户端告警故障业务1的故障情况的第一告警信息至客户端。
在到达目标时间段的结束时间点的情况下,从第一存储空间中获取修复状态仍为未修复的第五故障业务,通过与客户端之间建立的长连接发送用于向客户端告警第五故障业务的故障情况的第二告警信息至客户端。
本申请实施例提供的故障业务的告警方法,在检测到出现第一故障业务的情况下,将第一故障业务分别存储至用于记录故障业务以及故障业务对应的修复状态的第一存储空间和用于记录待告警的故障业务的第二存储空间;根据第一存储空间中记录的修复状态,从第二存储空间中在第一故障业务之前存储的故障业务中筛选尚未修复的第三故障业务;通过与客户端之间建立的长连接发送用于向客户端告警第一故障业务和第三故障业务的故障情况的第一告警信息至客户端。也就是说,根据第一存储空间中存储的故障业务的修复状态确定第二存储空间中尚未修复的第三故障业务,再将第三故障业务通过与客户端之间建立的长连接进行告警。即在将第二存储空间中的存储的故障业务进行告警前,对第二存储空间中的存储的故障业务进行修复状态的确定,只需将未修复的第三故障业务进行告警,避免将已修复的业务进行错误告警,解决了相关技术中业务告警的准确度较低的问题。进而达到了提高了业务告警的准确度的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种故障业务的告警装置,需要说明的是,本申请实施例的故障业务的告警装置可以用于执行本申请实施例所提供的用于故障业务的告警方法。以下对本申请实施例提供的故障业务的告警装置进行介绍。
图7是根据本申请实施例的故障业务的告警装置的示意图。如图7所示,该装置包括:
存储模块702,用于在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
筛选模块704,用于根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
第一发送模块706,用于通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
本申请实施例提供的故障业务的告警装置,在检测到出现第一故障业务的情况下,将第一故障业务分别存储至用于记录故障业务以及故障业务对应的修复状态的第一存储空间和用于记录待告警的故障业务的第二存储空间;根据第一存储空间中记录的修复状态,从第二存储空间中在第一故障业务之前存储的故障业务中筛选尚未修复的第三故障业务;通过与客户端之间建立的长连接发送用于向客户端告警第一故障业务和第三故障业务的故障情况的第一告警信息至客户端。也就是说,根据第一存储空间中存储的故障业务的修复状态确定第二存储空间中尚未修复的第三故障业务,再将第三故障业务通过与客户端之间建立的长连接进行告警。即在将第二存储空间中的存储的故障业务进行告警前,对第二存储空间中的存储的故障业务进行修复状态的确定,只需将未修复的第三故障业务进行告警,避免将已修复的业务进行错误告警,解决了相关技术中业务告警的准确度较低的问题。进而达到了提高了业务告警的准确度的效果。
可选地,在本申请实施例提供的故障业务的告警装置中,所述筛选模块,包括:
提取单元,用于从所述第二存储空间中提取在所述第一故障业务之前存储的所述第二故障业务;
查询单元,用于从所述第一存储空间中查询所述第二故障业务对应的目标修复状态;
第一获取单元,用于从所述第二故障业务中获取所述目标修复状态为未修复的故障业务作为所述第三故障业务。
可选地,在本申请实施例提供的故障业务的告警装置中,所述装置还包括:
第一确定模块,用于确定所述目标修复状态为已修复的第四故障业务;
删除模块,用于从所述第二存储空间中删除所述第四故障业务。
可选地,在本申请实施例提供的故障业务的告警装置中,所述装置还包括:
检测模块,用于检测所述客户端上运行的业务的业务状态;
第二确定模块,用于将所述业务状态为异常状态的业务确定为所述第一故障业务。
可选地,在本申请实施例提供的故障业务的告警装置中,所述检测模块,包括:
第二获取单元,用于获取目标业务的业务数据,其中,所述目标业务是所述客户端上处于操作状态的业务,所述业务数据包括所述目标业务的多项指标参数;
计算单元,用于根据所述多项指标参数计算所述目标业务的业务成功率;
第三确定单元,用于在所述业务成功率小于目标阈值的情况下,确定所述目标业务的业务状态为异常状态。
可选地,在本申请实施例提供的故障业务的告警装置中,所述装置还包括:
获取模块,用于在到达目标时间段的结束时间点的情况下,获取所述第一存储空间中所述修复状态仍为未修复的第五故障业务,其中,所述第一存储空间中存储了所述目标时间段内的全部故障业务;
第二发送模块,用于通过所述长连接发送第二告警信息至所述客户端,其中,所述第二告警信息用于向所述客户端告警所述第五故障业务的故障情况。
可选地,在本申请实施例提供的故障业务的告警装置中,所述存储模块,用于:
将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间,并将所述第一故障业务存储至所述第二存储空间;
在所述将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间之后:检测所述第一故障业务的当前修复状态;在所述当前修复状态为已修复状态的情况下,将所述第一存储空间中存储的所述第一故障业务对应的未修复状态更新为所述第一故障业务对应的已修复状态。
所述故障业务的告警装置包括处理器和存储器,上述模块和单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高业务告警的准确度。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述故障业务的告警方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述故障业务的告警方法。
如图8所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
可选的,所述根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,包括:
从所述第二存储空间中提取在所述第一故障业务之前存储的所述第二故障业务;
从所述第一存储空间中查询所述第二故障业务对应的目标修复状态;
从所述第二故障业务中获取所述目标修复状态为未修复的故障业务作为所述第三故障业务。
可选的,在所述从所述第一存储空间中查询所述第二故障业务对应的目标修复状态之后,所述方法还包括:
确定所述目标修复状态为已修复的第四故障业务;
从所述第二存储空间中删除所述第四故障业务。
可选的,在所述将所述第一故障业务分别存储至第一存储空间和第二存储空间之前,所述方法还包括:
检测所述客户端上运行的业务的业务状态;
将所述业务状态为异常状态的业务确定为所述第一故障业务。
可选的,所述检测所述客户端上运行的业务的业务状态,包括:
获取目标业务的业务数据,其中,所述目标业务是所述客户端上处于操作状态的业务,所述业务数据包括所述目标业务的多项指标参数;
根据所述多项指标参数计算所述目标业务的业务成功率;
在所述业务成功率小于目标阈值的情况下,确定所述目标业务的业务状态为异常状态。
可选的,在所述通过与客户端之间建立的长连接发送第一告警信息至所述客户端之后,所述方法还包括:
在到达目标时间段的结束时间点的情况下,获取所述第一存储空间中所述修复状态仍为未修复的第五故障业务,其中,所述第一存储空间中存储了所述目标时间段内的全部故障业务;
通过所述长连接发送第二告警信息至所述客户端,其中,所述第二告警信息用于向所述客户端告警所述第五故障业务的故障情况。
可选的,所述将所述第一故障业务分别存储至第一存储空间和第二存储空间,包括:将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间,并将所述第一故障业务存储至所述第二存储空间;
在所述将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间之后,所述方法还包括:检测所述第一故障业务的当前修复状态;在所述当前修复状态为已修复状态的情况下,将所述第一存储空间中存储的所述第一故障业务对应的未修复状态更新为所述第一故障业务对应的已修复状态。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
可选的,所述根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,包括:
从所述第二存储空间中提取在所述第一故障业务之前存储的所述第二故障业务;
从所述第一存储空间中查询所述第二故障业务对应的目标修复状态;
从所述第二故障业务中获取所述目标修复状态为未修复的故障业务作为所述第三故障业务。
可选的,在所述从所述第一存储空间中查询所述第二故障业务对应的目标修复状态之后,所述方法还包括:
确定所述目标修复状态为已修复的第四故障业务;
从所述第二存储空间中删除所述第四故障业务。
可选的,在所述将所述第一故障业务分别存储至第一存储空间和第二存储空间之前,所述方法还包括:
检测所述客户端上运行的业务的业务状态;
将所述业务状态为异常状态的业务确定为所述第一故障业务。
可选的,所述检测所述客户端上运行的业务的业务状态,包括:
获取目标业务的业务数据,其中,所述目标业务是所述客户端上处于操作状态的业务,所述业务数据包括所述目标业务的多项指标参数;
根据所述多项指标参数计算所述目标业务的业务成功率;
在所述业务成功率小于目标阈值的情况下,确定所述目标业务的业务状态为异常状态。
可选的,在所述通过与客户端之间建立的长连接发送第一告警信息至所述客户端之后,所述方法还包括:
在到达目标时间段的结束时间点的情况下,获取所述第一存储空间中所述修复状态仍为未修复的第五故障业务,其中,所述第一存储空间中存储了所述目标时间段内的全部故障业务;
通过所述长连接发送第二告警信息至所述客户端,其中,所述第二告警信息用于向所述客户端告警所述第五故障业务的故障情况。
可选的,所述将所述第一故障业务分别存储至第一存储空间和第二存储空间,包括:将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间,并将所述第一故障业务存储至所述第二存储空间;
在所述将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间之后,所述方法还包括:检测所述第一故障业务的当前修复状态;在所述当前修复状态为已修复状态的情况下,将所述第一存储空间中存储的所述第一故障业务对应的未修复状态更新为所述第一故障业务对应的已修复状态。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种故障业务的告警方法,其特征在于,包括:
在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,包括:
从所述第二存储空间中提取在所述第一故障业务之前存储的所述第二故障业务;
从所述第一存储空间中查询所述第二故障业务对应的目标修复状态;
从所述第二故障业务中获取所述目标修复状态为未修复的故障业务作为所述第三故障业务。
3.根据权利要求2所述的方法,其特征在于,在所述从所述第一存储空间中查询所述第二故障业务对应的目标修复状态之后,所述方法还包括:
确定所述目标修复状态为已修复的第四故障业务;
从所述第二存储空间中删除所述第四故障业务。
4.根据权利要求1所述的方法,其特征在于,在所述将所述第一故障业务分别存储至第一存储空间和第二存储空间之前,所述方法还包括:
检测所述客户端上运行的业务的业务状态;
将所述业务状态为异常状态的业务确定为所述第一故障业务。
5.根据权利要求4所述的方法,其特征在于,所述检测所述客户端上运行的业务的业务状态,包括:
获取目标业务的业务数据,其中,所述目标业务是所述客户端上处于操作状态的业务,所述业务数据包括所述目标业务的多项指标参数;
根据所述多项指标参数计算所述目标业务的业务成功率;
在所述业务成功率小于目标阈值的情况下,确定所述目标业务的业务状态为异常状态。
6.根据权利要求1所述的方法,其特征在于,在所述通过与客户端之间建立的长连接发送第一告警信息至所述客户端之后,所述方法还包括:
在到达目标时间段的结束时间点的情况下,获取所述第一存储空间中所述修复状态仍为未修复的第五故障业务,其中,所述第一存储空间中存储了所述目标时间段内的全部故障业务;
通过所述长连接发送第二告警信息至所述客户端,其中,所述第二告警信息用于向所述客户端告警所述第五故障业务的故障情况。
7.根据权利要求1所述的方法,其特征在于,
所述将所述第一故障业务分别存储至第一存储空间和第二存储空间,包括:
将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间,并将所述第一故障业务存储至所述第二存储空间;
在所述将所述第一故障业务以及所述第一故障业务对应的未修复状态存储至所述第一存储空间之后,所述方法还包括:检测所述第一故障业务的当前修复状态;在所述当前修复状态为已修复状态的情况下,将所述第一存储空间中存储的所述第一故障业务对应的未修复状态更新为所述第一故障业务对应的已修复状态。
8.一种故障业务的告警装置,其特征在于,包括:
存储模块,用于在检测到出现第一故障业务的情况下,将所述第一故障业务分别存储至第一存储空间和第二存储空间,其中,所述第一存储空间用于记录故障业务以及故障业务对应的修复状态,所述第二存储空间用于记录待告警的故障业务;
筛选模块,用于根据所述第一存储空间中记录的所述修复状态,从第二故障业务中筛选尚未修复的第三故障业务,其中,所述第二故障业务是所述第二存储空间中在所述第一故障业务之前存储的故障业务;
第一发送模块,用于通过与客户端之间建立的长连接发送第一告警信息至所述客户端,其中,所述第一告警信息用于向所述客户端告警所述第一故障业务和所述第三故障业务的故障情况。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的故障业务的告警方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。
CN202310729775.1A 2023-06-19 2023-06-19 故障业务的告警方法、装置、存储介质及电子装置 Pending CN116775359A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310729775.1A CN116775359A (zh) 2023-06-19 2023-06-19 故障业务的告警方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310729775.1A CN116775359A (zh) 2023-06-19 2023-06-19 故障业务的告警方法、装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN116775359A true CN116775359A (zh) 2023-09-19

Family

ID=88007517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310729775.1A Pending CN116775359A (zh) 2023-06-19 2023-06-19 故障业务的告警方法、装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN116775359A (zh)

Similar Documents

Publication Publication Date Title
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
US10560465B2 (en) Real time anomaly detection for data streams
US10439937B2 (en) Service addressing in distributed environment
US20180365085A1 (en) Method and apparatus for monitoring client applications
CN111600746B (zh) 网络故障定位方法、装置及设备
US11176170B2 (en) Blockchain-based data processing methods and apparatuses and computer devices
CN105243001A (zh) 业务对象的异常告警方法和装置
CN113641526A (zh) 告警根因定位方法、装置、电子设备及计算机存储介质
CN113595773B (zh) 信息处理方法、装置、电子设备和存储介质
CN111506580A (zh) 一种基于中心化块链式账本的交易存储方法
CN113806155B (zh) 一种基于物联网的工业设备管理方法和系统
CN108920326A (zh) 确定系统耗时异常的方法、装置及电子设备
CN112597151A (zh) 数据处理方法、装置、设备和存储介质
CN109039695B (zh) 业务故障处理方法、装置及设备
CN107154960B (zh) 用于确定分布式存储系统的服务可用性信息的方法与设备
CN116775359A (zh) 故障业务的告警方法、装置、存储介质及电子装置
CN114138615A (zh) 一种业务告警处理方法、装置、设备及存储介质
CN114510495B (zh) 一种数据库业务数据一致性处理方法和系统
CN113377757B (zh) 数据对账方法、装置、电子设备及机器可读存储介质
CN110264211B (zh) 风控方法、系统、装置及设备
CN115827647A (zh) 数据存储方法、装置、存储介质以及电子设备
CN110879774B (zh) 一种网元性能数据告警方法及装置
CN117112355A (zh) 日志文件的监控方法、装置、设备、存储介质及程序产品
CN116738097A (zh) 多系统页面访问方法、装置、处理器及存储介质
CN117493450A (zh) 数据处理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination