CN111897701B - 针对应用的告警处理方法、装置、计算机系统和介质 - Google Patents

针对应用的告警处理方法、装置、计算机系统和介质 Download PDF

Info

Publication number
CN111897701B
CN111897701B CN202010683520.2A CN202010683520A CN111897701B CN 111897701 B CN111897701 B CN 111897701B CN 202010683520 A CN202010683520 A CN 202010683520A CN 111897701 B CN111897701 B CN 111897701B
Authority
CN
China
Prior art keywords
server
identification information
application
alarm
servers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010683520.2A
Other languages
English (en)
Other versions
CN111897701A (zh
Inventor
李保昌
骆更
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010683520.2A priority Critical patent/CN111897701B/zh
Publication of CN111897701A publication Critical patent/CN111897701A/zh
Application granted granted Critical
Publication of CN111897701B publication Critical patent/CN111897701B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种针对应用的告警处理方法,包括:接收来自服务器的性能数据,其中,性能数据包括服务器的当前访问连接数、服务器的标识信息和与服务器关联的应用标识信息;在确定服务器的当前访问连接数满足第一预设条件的情况下,将服务器的标识信息添加到告警列表中,其中,告警列表包括与应用标识信息关联的多个服务器的标识信息;以及在告警列表中服务器的标识信息的数量满足第二预设条件的情况下,发出包括应用标识信息的告警信息。本公开还提供了一种针对应用的告警处理装置、计算机系统和存储介质。

Description

针对应用的告警处理方法、装置、计算机系统和介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种针对应用的告警处理方法、装置、计算机系统和存储介质。
背景技术
随着计算机技术的快速发展,数据服务中心可以部署大量的服务器以提供各种应用服务。服务器在实际的运行过程中面对的情况是非常复杂的,为了保证业务的正常运行,监控服务器的性能压力,以便及早发现应用服务是否发生异常是尤为重要的。
在实现本公开构思的过程中,发明人发现可以通过监控CPU使用率、内存使用率、IO使用率、线程池使用率等指标,来监控服务器的性能压力,以判断服务器是否异常。但是,这存在一定的滞后性,无法及时发现服务器性能压力的变化,或者影响不太大的情况被掩盖,无法早期发现,最终引起较大生产运行问题,降低了应用系统的可靠性。
发明内容
有鉴于此,本公开提供了一种针对应用的告警处理方法、装置、计算机系统和存储介质。
本公开的一个方面提供了一种针对应用的告警处理方法,包括:接收来自服务器的性能数据,其中,所述性能数据包括所述服务器的当前访问连接数、所述服务器的标识信息和与所述服务器关联的应用标识信息;在确定所述服务器的当前访问连接数满足第一预设条件的情况下,将所述服务器的标识信息添加到告警列表中,其中,所述告警列表包括与所述应用标识信息关联的多个服务器的标识信息;以及在所述告警列表中所述服务器的标识信息的数量满足第二预设条件的情况下,发出包括所述应用标识信息的告警信息。
根据本公开的实施例,该方法还包括,在确定所述服务器的访问连接数满足第一预设条件之前,确定所述访问连接数是否大于第一预设阈值;以及在确定所述访问连接数大于所述第一预设阈值的情况下,向所述服务器发送采集指令,以使所述服务器返回新的访问连接数。
根据本公开的实施例,所述服务器的访问连接数满足第一预设条件包括:连续M次接收到的所述服务器的访问连接数均大于所述第一预设阈值,其中,M为大于1的整数。
根据本公开的实施例,该方法还包括:记录预设时间段内所述服务器发送的历史性能数据,以根据记录的历史性能数据计算所述第一预设阈值。
根据本公开的实施例,所述告警列表中所述服务器的标识信息的数量满足第二预设条件包括:所述告警列表中所述服务器的标识信息的数量与应用服务器群中的服务器的数量的比例大于第二预设阈值,其中,所述应用服务器群为归属于同一应用的服务器的集合。
根据本公开的实施例,发出包括所述应用标识信息的告警信息包括:通过邮件发出包括所述应用标识信息的告警信息;或者通过日志发出包括所述应用标识信息的告警信息。
根据本公开的实施例,该方法还包括根据所述告警列表中每个所述服务器的标识信息,发出包括服务器的标识信息的告警信息。
本公开的另一个方面提供了一种针对应用的告警处理装置,包括:接收模块,用于接收来自服务器的性能数据,其中,所述性能数据包括所述服务器的当前访问连接数、所述服务器的标识信息和与所述服务器关联的应用标识信息;添加模块,用于在确定所述服务器的当前访问连接数满足第一预设条件的情况下,将所述服务器的标识信息添加到告警列表中,其中,所述告警列表包括与所述应用标识信息关联的多个服务器的标识信息;以及告警模块,用于在所述告警列表中所述服务器的标识信息的数量满足第二预设条件的情况下,发出包括所述应用标识信息的告警信息。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
根据本公开的实施例,采用了接收来自服务器的性能数据,该性能数据包括当前访问连接数、服务器标识和服务器归属应用的标识,如果服务器的当前访问连接数满足第一预设条件,将服务器标识添加到告警列表中,如果告警列表中服务器标识数量满足第二条件,发出告警信息的技术手段。由于访问连接数在服务器性能压力变化或响应时间出现波动的情况下会快速增长,对性能或压力变化的敏感度高,因此检测服务器压力异常的灵敏度高,所以至少部分地克服了相关技术中无法及早发现性能压力变化造成安全隐患的技术问题,进而达到了及早发现隐患,提高应用系统的可靠性的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开实施例的针对应用的告警处理方法和装置的示例性系统架构;
图2示意性示出了根据本公开实施例的针对应用的告警处理方法的流程图;
图3示意性示出了根据本公开实施例的采集访问连接数的方法的流程图;
图4示意性示出了根据本公开的实施例的针对应用的告警处理装置的框图;以及
图5示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机系统的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
在实现本公开构思的过程中,可以监控CPU使用率、内存使用率、IO使用率、线程池使用率等指标,在监控到某一指标超过预设阈值时,可以触发报警。但是,这些指标的报警阈值通常设置较高,只有在服务器性能压力变化较大或者经过足够长的时间才会触发报警。而针对服务器运行过程中出现的性能压力波动,无法做出判断,导致无法及早发现性能压力的变化,不能保证系统的可靠性运行。
基于此,本公开的实施例提供了一种针对应用的告警处理方法,包括:接收来自服务器的性能数据,其中,性能数据包括服务器的当前访问连接数、服务器的标识信息和与服务器关联的应用标识信息;在确定服务器的当前访问连接数满足第一预设条件的情况下,将服务器的标识信息添加到告警列表中,其中,告警列表包括与应用标识信息关联的多个服务器的标识信息;以及在告警列表中服务器的标识信息的数量满足第二预设条件的情况下,发出包括应用标识信息的告警信息。
图1示意性示出了可以应用本公开实施例的针对应用的告警处理方法和装置的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括应用服务器集群101、网络102和电子设备103。网络102用以在应用服务器集群101和电子设备103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线和/或无线通信链路等等。
应用服务器集群101可以包括服务器1、服务器2、服务器3……服务器n。其中,应用服务器集群101中的服务器可以按照应用划分为不同的服务器子集群,例如,服务器子集群A中的服务器可以归属于同一应用A,并且,归属于同一应用A的服务器子集群A中的服务器均可以提供应用A的服务。
应用服务器集群101中每个服务器中可以部署有用于采集访问连接数的脚本文件,该脚本文件执行时可以获取自身所在的服务器的被访连接数。然后,可以通过网络102将获取到的被访连接数以及服务器IP地址、采集时间等信息发送给电子设备103。
电子设备103可以是膝上型便携计算机、台式计算机等,也可以是服务器。电子设备103可以接收来自应用服务器集群101中各个服务器发送的信息,并可以根据接收到的信息确定是否发出告警。
例如,电子设备103可以接收来自应用服务器集群101中的服务器发送的该服务器的被访连接数和IP地址,然后可以判断该连接数是否大于预设阈值,如果大于预设阈值,可以针对该服务器发出告警信息,告警信息中可以包括该服务器的IP地址,以便工作人员快速定位到该服务器。告警信息中还可以包括该服务器所归属的应用的标识,以便工作人员有针对性地进行处理。
需要说明的是,本公开实施例所提供的针对应用的告警处理方法一般可以由电子设备103执行。相应地,本公开实施例所提供的针对应用的告警处理装置一般可以设置于电子设备103中。本公开实施例所提供的针对应用的告警处理方法也可以由不同于电子设备103且能够与应用服务器集群101和/或电子设备103通信的服务器或服务器集群执行。相应地,本公开实施例所提供的针对应用的告警处理装置也可以设置于不同于电子设备103且能够与应用服务器集群101和/或电子设备103通信通信的服务器或服务器集群中。
应该理解,图1中的应用服务器集群、网络、服务器和电子设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的应用服务器集群、网络、服务器和电子设备。
图2示意性示出了根据本公开实施例的针对应用的告警处理方法的流程图。
如图2所示,该方法包括操作S201~S203。
在操作S201,接收来自服务器的性能数据,其中,性能数据包括服务器的当前访问连接数、服务器的标识信息和与服务器关联的应用标识信息。
根据本公开实施例,应用服务器集群101中每个服务器可以采集自身的访问连接数。然后可以将采集到的访问连接数以及自身IP地址、采集时间等信息发送给电子设备103。其中,访问连接数例如可以是TCP(Transmission Control Protocol,传输控制协议)连接数,TCP连接数可以作为监控服务器负载压力的指标。TCP连接数在服务器性能压力出现波动或响应时间发生变化的情况下,会快速增长,因此,TCP连接数相较于CPU使用率、内存使用率、IO使用率、线程池使用率等指标,对性能或压力变化更敏感。
根据本公开实施例,可以在服务器本身设置脚本文件,并设置每隔预设时间(例如5分钟)执行一次脚本文件,脚本文件在执行过程中可以采集自身服务器的访问连接数。采用上述方式采集服务器自身的访问连接数,对服务器性能影响小。
根据本公开实施例,服务器还可以将采集时间、服务器所归属的应用的标识信息发送给电子设备103。
在操作S202,在确定服务器的当前访问连接数满足第一预设条件的情况下,将服务器的标识信息添加到告警列表中,其中,告警列表包括与应用标识信息关联的多个服务器的标识信息。
根据本公开实施例,电子设备103可以针对不同应用设置一个告警列表,每个告警列表中可以包括归属于该应用的服务器标识,且告警列表中的服务器标识是根据该服务器的访问连接数满足预设条件的情况下添加进来的。
根据本公开实施例,该预设条件可以是该服务器的访问连接数大于预设阈值,针对不同的应用,可以设置不同的阈值。具体地,可以记录预设时间段内服务器发送的历史性能数据,以根据记录的历史性能数据计算第一预设阈值。
例如,针对应用A,可以根据每月或每周采集到的属于该应用的每个服务器的历史TCP连接数,进行方差拟合计算,得出每月或每周的TCP连接数的拟合值,然后可以根据该拟合值设置阈值。
根据本公开实施例,针对应用A,根据计算出的拟合值可以设置阈值例如可以为1000。针对应用A的告警列表可以是告警列表A,告警列表A中的服务器均归属于应用A,且告警列表A中的服务器的访问连接数均大于1000。
在操作S203,在告警列表中服务器的标识信息的数量满足第二预设条件的情况下,发出包括应用标识信息的告警信息。
其中,告警列表中服务器的标识信息的数量满足第二预设条件包括:告警列表中服务器的标识信息的数量与应用服务器群中的服务器的数量的比例大于第二预设阈值。
根据本公开实施例,沿用上述示例,告警列表A中的服务器可以是性能出现异常的服务器,针对应用A,如果出现性能异常的服务器的数量过多,则应用A提供服务的能力将会受到影响,此时,可以发出告警。例如,可以设置第二预设阈值为50%,在告警列表A中服务器数量与服务器子集群A中所有服务器数量的比例大于50%的情况下,可以发出告警信息,该告警信息中可以包括应用A的标识,以便工作人员有针对性的处理。
根据本公开实施例,接收来自服务器的性能数据,其中,性能数据包括服务器的当前访问连接数、服务器的标识信息和与服务器关联的应用标识信息;在确定服务器的当前访问连接数满足第一预设条件的情况下,将服务器的标识信息添加到告警列表中,其中,告警列表包括与应用标识信息关联的多个服务器的标识信息,以及在告警列表中服务器的标识信息的数量满足第二预设条件的情况下,发出包括应用标识信息的告警信息。能够根据服务器的访问连接数确定服务器是否出现性能异常,操作简单,并且由于访问连接数在服务器性能压力变化或响应时间出现波动的情况下会快速增长,对性能或压力变化的敏感度高,因此检测服务器压力异常的灵敏度更高,能够及早发现隐患,避免引起较大的生产运行问题,保障应用系统的可靠运行。
根据本公开实施例,还可以根据同一应用中出现性能异常的服务器数量进一步确定该应用是否出现异常,能够在确定应用出现异常的情况下自动报警,以提醒工作人员进行处理。
图3示意性示出了根据本公开实施例的采集访问连接数的方法的流程图。
如图3所示,该方法包括操作S301~S303。
在操作S301,接收来自服务器发送的访问连接数。
在操作S302,确定访问连接数是否大于第一预设阈值。
在操作S303,在确定访问连接数大于第一预设阈值的情况下,向服务器发送采集指令,以使服务器返回新的访问连接数。
根据本公开实施例,例如,针对应用A的服务器,可以判断采集到的访问连接数是否大于1000,在大于1000的情况下,可以再次向该服务器发送采集访问连接数的指令,以获取新的访问连接数。
根据本公开实施例,服务器的访问连接数满足第一预设条件包括:连续M次接收到的服务器的访问连接数均大于第一预设阈值,其中,M为大于1的整数。
根据本公开实施例,可以设置最大采集次数,例如可以是4次。在连续4次采集到的访问连接数均大于1000的情况下,可以确定服务器性能出现异常。
根据本公开实施例,如果访问连接数为TCP连接数,由于TCP连接数对服务器性能压力的波动很敏感,而服务器的性能压力在短时间内出现波动属于正常情况,因此,可以通过多次采集判断当前服务器的访问连接数超过阈值是属于正常的性能压力波动还是由于性能出现异常,提高判断准确度。
根据本公开实施例,可以通过邮件发出告警信息,例如利用邮件服务器向工作人员发出告警邮件。还可以通过日志的方式发出告警信息,例如,采集到的TCP连接数均可以保存在数据库中,可以根据数据库的日志报警系统监控数据并发出报警。
根据本公开实施例,针对告警列表中的服务器,也可利用邮件报警系统或日志报警系统以发出包括该服务器标识的报警信息。在工作人员针对服务器的报警信息进行处理后,如果服务器恢复正常运行,可以将该服务器标识从报警列表中删除。
图4示意性示出了根据本公开的实施例的针对应用的告警处理装置的框图。
如图4所示,针对应用的告警处理装置400包括接收模块410、添加模块420和告警模块430。
接收模块410用于接收来自服务器的性能数据,其中,性能数据包括服务器的当前访问连接数、服务器的标识信息和与服务器关联的应用标识信息。
添加模块420用于在确定服务器的当前访问连接数满足第一预设条件的情况下,将服务器的标识信息添加到告警列表中,其中,告警列表包括与应用标识信息关联的多个服务器的标识信息。
告警模块430用于在告警列表中服务器的标识信息的数量满足第二预设条件的情况下,发出包括应用标识信息的告警信息。
根据本公开实施例,针对应用的告警处理装置400还包括确定模块和发送模块。
确定模块用于确定访问连接数是否大于第一预设阈值。
发送模块用于在确定访问连接数大于第一预设阈值的情况下,向服务器发送采集指令,以使服务器返回新的访问连接数。
根据本公开实施例,服务器的访问连接数满足第一预设条件包括:连续M次接收到的服务器的访问连接数均大于第一预设阈值,其中,M为大于1的整数。
根据本公开实施例,针对应用的告警处理装置400还包括记录模块。
记录模块用于记录预设时间段内服务器发送的历史性能数据,以根据记录的历史性能数据计算第一预设阈值。
根据本公开实施例,告警列表中服务器的标识信息的数量满足第二预设条件包括:告警列表中服务器的标识信息的数量与应用服务器群中的服务器的数量的比例大于第二预设阈值,其中,应用服务器群为归属于同一应用的服务器的集合。
根据本公开实施例,告警模块包括第一告警单元、第二告警单元和第三告警单元。
第一告警单元用于通过邮件发出包括应用标识信息的告警信息。
第二告警单元用于通过日志发出包括应用标识信息的告警信息。
第三告警单元用于根据告警列表中每个服务器的标识信息,发出包括服务器的标识信息的告警信息。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,接收模块410、添加模块420和告警模块430中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,接收模块410、添加模块420和告警模块430中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,接收模块410、添加模块420和告警模块430中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中针对应用的告警处理装置部分与本公开的实施例中针对应用的告警处理方法部分是相对应的,针对应用的告警处理装置部分的描述具体参考针对应用的告警处理方法部分,在此不再赘述。
图5示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机系统的框图。图5示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,根据本公开实施例的计算机系统500包括处理器501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 503中,存储有系统500操作所需的各种程序和数据。处理器501、ROM 502以及RAM 503通过总线504彼此相连。处理器501通过执行ROM 502和/或RAM 503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 502和RAM 503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统500还可以包括输入/输出(I/O)接口505,输入/输出(I/O)接口505也连接至总线504。系统500还可以包括连接至I/O接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 502和/或RAM 503和/或ROM 502和RAM 503以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (9)

1.一种针对应用的告警处理方法,包括:
接收来自服务器的性能数据,其中,所述性能数据包括所述服务器的当前访问连接数、所述服务器的标识信息和与所述服务器关联的应用标识信息;
在确定所述服务器的当前访问连接数满足第一预设条件的情况下,将所述服务器的标识信息添加到告警列表中,其中,所述告警列表包括与所述应用标识信息关联的多个服务器的标识信息;以及
在所述告警列表中所述服务器的标识信息的数量满足第二预设条件的情况下,发出包括所述应用标识信息的告警信息;
其中,所述告警列表中所述服务器的标识信息的数量满足所述第二预设条件包括:
所述告警列表中所述服务器的标识信息的数量与应用服务器群中的服务器的数量的比例大于第二预设阈值,其中,所述应用服务器群为归属于同一应用的服务器的集合。
2.根据权利要求1所述的方法,还包括,在确定所述服务器的访问连接数满足第一预设条件之前:
确定所述访问连接数是否大于第一预设阈值;以及
在确定所述访问连接数大于所述第一预设阈值的情况下,向所述服务器发送采集指令,以使所述服务器返回新的访问连接数。
3.根据权利要求2所述的方法,其中,所述服务器的访问连接数满足第一预设条件包括:
连续M次接收到的所述服务器的访问连接数均大于所述第一预设阈值,其中,M为大于1的整数。
4.根据权利要求2所述的方法,还包括:
记录预设时间段内所述服务器发送的历史性能数据,以根据记录的历史性能数据计算所述第一预设阈值。
5.根据权利要求1所述的方法,其中,发出包括所述应用标识信息的告警信息包括:
通过邮件发出包括所述应用标识信息的告警信息;或者
通过日志发出包括所述应用标识信息的告警信息。
6.根据权利要求1所述的方法,还包括:
根据所述告警列表中每个所述服务器的标识信息,发出包括所述服务器的标识信息的告警信息。
7.一种针对应用的告警处理装置,包括:
接收模块,用于接收来自服务器的性能数据,其中,所述性能数据包括所述服务器的当前访问连接数、所述服务器的标识信息和与所述服务器关联的应用标识信息;
添加模块,用于在确定所述服务器的当前访问连接数满足第一预设条件的情况下,将所述服务器的标识信息添加到告警列表中,其中,所述告警列表包括与所述应用标识信息关联的多个服务器的标识信息;以及
告警模块,用于在所述告警列表中所述服务器的标识信息的数量满足第二预设条件的情况下,发出包括所述应用标识信息的告警信息;
其中,所述告警列表中所述服务器的标识信息的数量满足所述第二预设条件包括:
所述告警列表中所述服务器的标识信息的数量与应用服务器群中的服务器的数量的比例大于第二预设阈值,其中,所述应用服务器群为归属于同一应用的服务器的集合。
8.一种计算机系统,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至6中任一项所述的方法。
9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至6中任一项所述的方法。
CN202010683520.2A 2020-07-15 2020-07-15 针对应用的告警处理方法、装置、计算机系统和介质 Active CN111897701B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010683520.2A CN111897701B (zh) 2020-07-15 2020-07-15 针对应用的告警处理方法、装置、计算机系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010683520.2A CN111897701B (zh) 2020-07-15 2020-07-15 针对应用的告警处理方法、装置、计算机系统和介质

Publications (2)

Publication Number Publication Date
CN111897701A CN111897701A (zh) 2020-11-06
CN111897701B true CN111897701B (zh) 2023-08-11

Family

ID=73191265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010683520.2A Active CN111897701B (zh) 2020-07-15 2020-07-15 针对应用的告警处理方法、装置、计算机系统和介质

Country Status (1)

Country Link
CN (1) CN111897701B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116795650B (zh) * 2023-06-29 2024-05-03 浙江海得智慧能源有限公司 一种储能系统运行状态监测方法、系统及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073465A (zh) * 2017-12-29 2018-05-25 中国平安人寿保险股份有限公司 动态限流方法、Nginx服务器、存储介质及装置
CN108173678A (zh) * 2017-12-20 2018-06-15 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN110287694A (zh) * 2019-06-26 2019-09-27 维沃移动通信有限公司 应用程序管理方法、移动终端及存储介质
CN111212028A (zh) * 2019-11-29 2020-05-29 云深互联(北京)科技有限公司 一种预警方法、装置、设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110943961B (zh) * 2018-09-21 2022-06-21 阿里巴巴集团控股有限公司 数据处理方法、设备以及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108173678A (zh) * 2017-12-20 2018-06-15 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN108073465A (zh) * 2017-12-29 2018-05-25 中国平安人寿保险股份有限公司 动态限流方法、Nginx服务器、存储介质及装置
CN110287694A (zh) * 2019-06-26 2019-09-27 维沃移动通信有限公司 应用程序管理方法、移动终端及存储介质
CN111212028A (zh) * 2019-11-29 2020-05-29 云深互联(北京)科技有限公司 一种预警方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN111897701A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN110888783A (zh) 微服务系统的监测方法、装置以及电子设备
US10848839B2 (en) Out-of-band telemetry data collection
US10127093B1 (en) Method and apparatus for monitoring a message transmission frequency in a robot operating system
CN109960635B (zh) 实时计算平台的监控和报警方法、系统、设备及存储介质
CN108900319B (zh) 故障检测方法和装置
CN109218407B (zh) 基于日志监控技术的代码管控方法及终端设备
US11038587B2 (en) Method and apparatus for locating fault cause, and storage medium
CN110336742B (zh) 信息发送方法、装置、计算机设备和存储介质
CN113127201B (zh) 故障应用服务器隔离方法及装置、电子设备和存储介质
CN111581055B (zh) 业务系统的控制方法及装置、电子设备和可读存储介质
CN111897701B (zh) 针对应用的告警处理方法、装置、计算机系统和介质
CN110554929A (zh) 数据校验方法、装置、计算机设备及存储介质
US10324778B2 (en) Utilizing an error prediction and avoidance component for a transaction processing system
CN115499302A (zh) 业务系统的监测方法、装置、可读存储介质及电子设备
US20160028606A1 (en) Scalable Extendable Probe for Monitoring Host Devices
US11113364B2 (en) Time series data analysis control method and analysis control device
CN111159009B (zh) 一种日志服务系统的压力测试方法及装置
US20160050101A1 (en) Real-Time Network Monitoring and Alerting
CN112256548A (zh) 异常数据的监听方法、装置、服务器及存储介质
CN116701123A (zh) 任务预警方法、装置、设备、介质及程序产品
CN110083470B (zh) 磁盘分析方法、装置及计算机可读存储介质
CN107238754B (zh) 一种检测电量的方法和装置
CN115934453A (zh) 一种故障排查方法、装置及存储介质
CN114003480A (zh) 一种app启动时长监控系统及方法
CN114024867A (zh) 网络异常检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant