CN109660426B - 监控方法及系统、计算机可读介质和电子设备 - Google Patents

监控方法及系统、计算机可读介质和电子设备 Download PDF

Info

Publication number
CN109660426B
CN109660426B CN201811530240.7A CN201811530240A CN109660426B CN 109660426 B CN109660426 B CN 109660426B CN 201811530240 A CN201811530240 A CN 201811530240A CN 109660426 B CN109660426 B CN 109660426B
Authority
CN
China
Prior art keywords
current
information
server
alarm information
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811530240.7A
Other languages
English (en)
Other versions
CN109660426A (zh
Inventor
崔健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201811530240.7A priority Critical patent/CN109660426B/zh
Publication of CN109660426A publication Critical patent/CN109660426A/zh
Application granted granted Critical
Publication of CN109660426B publication Critical patent/CN109660426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Alarm Systems (AREA)

Abstract

本发明实施例提供了一种监控方法及系统、计算机可读介质和电子设备。该监控方法应用于监控服务器,所述监控服务器包括心跳检测装置;所述方法包括:接收所述监控服务器监控的主机发送的当前主机信息;获取所述监控服务器的当前服务器信息;分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息;若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息。本发明实施例的技术方案能够通过监控服务器中设置的心跳检测装置检测监控服务器的运行状态,与此同时,还能采用所述监控服务器监控主机及其自身的安全状况。

Description

监控方法及系统、计算机可读介质和电子设备
技术领域
本发明涉及网络通信技术领域,具体而言,涉及一种监控方法、监控系统、计算机可读介质和电子设备。
背景技术
随着信息技术的飞速发展,不同企业更多地使用各类主机(例如文件服务器、数据库服务器和应用程序服务器等)来管理企业的资源并为用户提供各种服务。目前,企业内部所使用的主机种类以及数量越来越多,以满足企业正常运营的需求,对于数量庞大、种类繁多的主机的管理和监控已成为企业系统管理员的业务重心。
主机监控是指利用监控服务器将远程主机运行得到的数据通过各种方式记录下来,并在需要时可以随时调用监控记录以便进行查看。面对成千上百台的主机以及主机上的各种应用信息,系统管理员很难做到全面,实时的监控。
与此同时,随着网络安全技术的不断发展,监控服务器自身的安全监控也变得日益重要。随着需求的不断增加,监控服务器和主机的数量也相应的与日俱增,同时也就存在了大型企业监控服务器的多地区集群分布的情况。在这种情况下,监控服务器和主机的统一安全监控和管理就面临了更大的挑战。因此,确认监控服务器是否正常运行,以及告警信息是否正常传输就显得至关重要。
然而实际情况是,大多数对于运行状态的监控都仅限于主机,而不涉及集群式多地区分布的负责安全监控以及扫描的监控服务器。
因此,需要一种新的监控方法、监控系统、计算机可读介质和电子设备。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种监控方法、监控系统、计算机可读介质及电子设备,进而至少在一定程度上克服相关技术中存在的至少一个或者全部的技术问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本公开的一个方面,提供一种监控方法,应用于监控服务器,所述监控服务器包括心跳检测装置;所述方法包括:接收所述监控服务器监控的主机发送的当前主机信息;获取所述监控服务器的当前服务器信息;分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息;若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息。
在本公开的一种示例性实施例中,所述监控服务器包括多台,不同监控服务器设置于不同地区,各监控服务器分别连接至数据中心。
在本公开的一种示例性实施例中,所述监控服务器还包括logstash框架,所述logstash框架包括数据输入模块和数据输出模块,所述当前安全告警信息存储于所述数据输入模块;若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息,包括:通过所述心跳检测装置中设置的定时任务,每间隔预定时间向本地时间文件中写入当前时间;
若所述当前时间写入成功,则读取所述本地时间文件中的当前时间至所述数据输入模块,并将所述当前时间作为所述当前心跳数据;打包所述当前时间、所述当前安全告警信息和所述监控服务器的标识信息和地址信息并通过所述数据输出模块发送至所述数据中心。
在本公开的一种示例性实施例中,所述当前主机信息包括当前主机扫描信息和当前主机告警信息;所述当前服务器信息包括当前服务器扫描信息和当前服务器告警信息;所述当前安全告警信息包括当前主机安全告警信息、当前主机异常运行告警信息以及当前服务器安全告警信息;分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息,包括:根据所述当前主机扫描信息和所述当前主机告警信息获得所述当前主机安全告警信息和所述当前主机异常运行告警信息;根据所述当前服务器扫描信息和所述当前服务器告警信息获得所述当前服务器安全告警信息。
在本公开的一种示例性实施例中,所述方法还包括:若所述心跳检测装置判定所述监控服务器处于非正常运行状态,则所述监控服务器开启自启动功能,完成所述监控服务器的配置重加载操作。
根据本公开的一个方面,提供一种监控方法,应用于数据中心;所述方法包括:接收并缓存监控服务器发送的当前心跳数据和当前安全告警信息;定时将接收到的所述当前心跳数据和所述当前安全告警信息存储至数据库中;定时读取所述当前心跳数据和所述当前安全告警信息进行展示;其中,所述当前心跳数据用于确认所述监控服务器处于正常运行状态,所述当前安全告警信息用于提示所述监控服务器或者所述监控服务器监控的主机中存在的安全告警。
根据本公开的一个方面,提供监控系统,包括:监控服务器,用于监控至少一台主机并产生当前安全告警信息;所述监控服务器包括心跳检测装置,所述心跳检测装置用于检测所述监控服务器的运行状态并在所述监控服务器处于正常运行状态时,产生当前心跳数据;数据中心,用于接收所述监控服务器发送的所述当前心跳数据和所述当前安全告警信息。
在本公开的一种示例性实施例中,所述数据中心包括:redis服务器,用于接收并缓存所述监控服务器发送的所述当前心跳数据和所述当前安全告警信息;数据库服务器,用于定时将所述redis服务器中缓存的所述当前心跳数据和所述当前安全告警信息存储至数据库中;网络服务器,用于定时读取所述当前心跳数据和所述当前安全告警信息进行展示。
根据本公开的一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的监控方法。
根据本公开的一个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任一实施例所述的监控方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,一方面,通过在监控服务器中设置心跳检测装置,可以检测所述监控服务器是否处于正常运行状态;另一方面,还可以应用所述监控服务器同时分析处理获取被其监控的主机及监控服务器自身的当前安全告警信息,由于分析处理工作由监控服务器完成,可以减轻直接服务于用户的各类主机的运算量,从而可以不影响到主机的业务处理能力,同时由于监控服务器对主机发送的数据量较大的当前主机信息以及其自身的当前服务器信息进行了处理,获得当前安全告警信息,所述监控服务器在将所述当前安全告警信息上传至数据中心时,可以减少向所述数据中心传输的数据量,从而降低了对网络带宽的要求。此外,本技术方案还可以在确认所述监控服务器正常运行的同时,保证当前心跳数据和当前安全告警信息的正常回传至数据中心。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本发明的一个实施例的监控系统的架构图。
图2示意性示出了根据本发明的一个实施例的监控方法的流程图。
图3示意性示出了根据本发明的另一个实施例的监控系统的架构图。
图4示意性示出了根据本发明的另一个实施例的监控方法的流程图。
图5示意性示出了根据本发明的又一个实施例的监控方法的流程图。
图6示意性示出了根据本发明的再一个实施例的监控方法的流程图。
图7示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
相关技术中,心跳检测装置多用于分布式系统,其中这里的分布式系统是指系统中的各个节点之间是互联互通的,是一个网状分布,其中系统中的任意一台监控服务器或者主机都是一个节点,在每个节点上均会部署一个心跳检测装置,在监控过程中,心跳检测装置会逐一对各个节点进行监控,同时各个节点针对其自身进行安全告警的诊断,这样至少会带来如下所述的弊端:
首先,在各个节点逐一部署心跳检测装置会增加部署成本。
其次,对于需要对大量节点进行统一监控的系统来说,若进行了心跳检测装置的大范围部署,则各个节点向同一个中心点上传数据时,数据传输量巨大,会占用极高的带宽。
再次,上述相关技术方案中,各个节点的问题检测需要各个节点针对其自身的作用和功能来进行诊断,因此,对于主机来说,需要进行大量运算,而主机是直接服务于用户的,若大量计算性能用于其自身问题的诊断,会显得主机不够轻便,影响到主机的业务处理能力,从而会降低用户体验。
图1示意性示出了根据本发明的一个实施例的监控系统的架构图。
本发明实施例提供了一种监控系统,所述监控系统可以包括监控服务器和数据中心。其中,所述监控服务器可以用于监控至少一台主机并产生当前安全告警信息。所述监控服务器可以包括心跳检测装置,所述心跳检测装置可以用于检测所述监控服务器的运行状态并在所述监控服务器处于正常运行状态时,产生当前心跳数据。所述数据中心,用于接收所述监控服务器发送的所述当前心跳数据和所述当前安全告警信息。下面结合图1对其进行说明。
如图1所示,本发明实施例提供的监控系统可以包括多台监控服务器,且该多台监控服务器可以分布于不同的地区,即是多地区集群式分布的。在图1的实施例中,以四台监控服务器为例进行举例说明,但实际上,监控系统可以根据实际需求进行监控服务器数量和位置的合理设置,本发明对此不作限定。
例如,监控系统可以包括监控服务器1(其上部署有心跳检测装置1)、监控服务器2(其上部署有心跳检测装置2)、监控服务器3(其上部署有心跳检测装置3)以及监控服务器4(其上部署有心跳检测装置4),且这里还假设监控服务器1负责监控主机11和主机12,监控服务器2负责监控主机21和主机22,监控服务器3负责监控主机31和主机32,监控服务器4负责监控主机41和主机42。各监控服务器分别与数据中心通信连接。
其中,所述数据中心可以作为安全告警信息的统一处理中心。所述监控服务器可以用于接收来自于被其监控的主机的扫描信息和告警信息,并对其进行分析诊断处理,同时将处理后的信息传回所述数据中心。本发明实施例中,因为不同的监控服务器位于多地区,因此,需要心跳检测装置检测监控服务器的存活状态或者运行状态。
需要说明的是,每台监控服务器监控的主机数量同样可以根据具体的应用场景进行合理设计的,本发明对此不作限定,并不限于上述举例说明。
本发明实施例中,被监控服务器监控的主机可以为各种PC(Personal Computer,个人计算机)机、交换机、应用服务器等中的任意一种或者多种。所述主机在对外开放的过程中会面临各种网络安全风险。
具体的,图1所示的监控服务器可以是用于实现OSSEC(一款开源的多平台的入侵检测系统)这类HIDS(Host-based Intrusion Detection System,即基于主机型入侵检测系统)平台集群式部署后的监控服务器。
其中,OSSEC包括了日志分析、全面检测和root-kit检测。如果有多台主机都安装了OSSEC,那么就可以采用客户端/服务器模式来运行。主机通过客户端程序将数据发回到监控服务器端进行分析。
图2示意性示出了根据本发明的一个实施例的监控方法的流程图。本发明实施例提供的监控方法可以应用于监控服务器,所述监控服务器可以包括心跳检测装置。
如图2所示,本发明实施例提供的监控方法可以包括以下步骤。
在步骤S210中,接收所述监控服务器监控的主机发送的当前主机信息。
例如,监控服务器1可以接收主机11和主机12分别上传的扫描信息和告警信息。其中,所述扫描信息括例如可以包括本主机的磁盘状态、内存的使用情况,CPU(CentralProcessing Unit,中央处理器)的利用率,操作系统日志等。所述告警信息例如可以包括本主机是否感染了网络病毒,是否存在网络安全风险等。
在步骤S220中,获取所述监控服务器的当前服务器信息。
本发明实施例中,所述监控服务器还可以获取其自身的扫描信息和告警信息。
在步骤S230中,分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息。
本发明实施例中,所述监控服务器可以根据被其监控的主机的作用和功能,对接收到的主机的扫描信息和告警信息进行进一步的分析处理,例如,根据所述主机的扫描信息判断该主机当前是否处于异常运行状态,再例如,还可以对接收到的主机上传的告警信息进行进一步的分析诊断,判断其是否存在误报的可能性,并根据诊断结果来决定最后是否将该主机上传的告警信息作为一个真正的安全告警信息上传至数据中心。
本发明实施例中,所述监控服务器还可以根据其自身的扫描信息和告警信息,并结合其自身的作用和功能,分析诊断其自身是否存在异常运行状态,例如发生故障宕机,或者诊断其自身是否存在安全风险或者是否被网络病毒感染。
本发明实施例中,所述监控服务器还可以通过文字识别技术手段,提取主机上传的告警信息中的关键字,达到缩减最终形成的当前安全告警信息数据量的目的,并形成规范化的数据表达格式。
在步骤S240中,若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息。
在示例性实施例中,所述监控服务器可以包括多台,不同监控服务器可以设置于不同地区,各监控服务器分别连接至数据中心,这里的连接可以是有线或者无线的通信连接方式。
在示例性实施例中,所述监控服务器还可以包括logstash框架,所述logstash框架可以包括数据输入(input)模块和数据输出(ouput)模块,所述当前安全告警信息可以存储于所述数据输入模块。
在示例性实施例中,若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息,可以包括:通过所述心跳检测装置中设置的定时任务,每间隔预定时间向本地时间文件中写入当前时间;若所述当前时间写入成功,则读取所述本地时间文件中的当前时间至所述数据输入模块,并将所述当前时间作为所述当前心跳数据;打包所述当前时间、所述当前安全告警信息和所述监控服务器的标识信息和地址信息并通过所述数据输出模块发送至所述数据中心。
在示例性实施例中,所述当前主机信息可以包括当前主机扫描信息和当前主机告警信息;所述当前服务器信息可以包括当前服务器扫描信息和当前服务器告警信息;所述当前安全告警信息可以包括当前主机安全告警信息、当前主机异常运行告警信息以及当前服务器安全告警信息。
在示例性实施例中,分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息,可以包括:根据所述当前主机扫描信息和所述当前主机告警信息获得所述当前主机安全告警信息和所述当前主机异常运行告警信息;根据所述当前服务器扫描信息和所述当前服务器告警信息获得所述当前服务器安全告警信息。
在示例性实施例中,所述方法还可以包括:若所述心跳检测装置判定所述监控服务器处于非正常运行状态,则所述监控服务器开启自启动功能,完成所述监控服务器的配置重加载操作。
本发明实施方式提供的监控方法,一方面,通过在监控服务器中设置心跳检测装置,可以检测所述监控服务器是否处于正常运行状态;另一方面,还可以应用所述监控服务器同时分析处理获取被其监控的主机及监控服务器自身的当前安全告警信息,由于分析处理工作由监控服务器完成,可以减轻直接服务于用户的各类主机的运算量,从而可以不影响到主机的业务处理能力,同时由于监控服务器对主机发送的数据量较大的当前主机信息以及其自身的当前服务器信息进行了处理,获得当前安全告警信息,所述监控服务器在将所述当前安全告警信息上传至数据中心时,可以减少向所述数据中心传输的数据量,从而降低了对网络带宽的要求。此外,本技术方案还可以在确认所述监控服务器正常运行的同时,保证当前心跳数据和当前安全告警信息的正常回传至数据中心。
下面结合图3-6对上述实施例提供的监控方法和监控系统进行示例说明。
图3示意性示出了根据本发明的另一个实施例的监控系统的架构图。
如图3所示,以上述图1中的任意一个监控服务器为例进行举例说明。
如图3所示,监控系统包括监控服务器端和数据中心端。其中,监控服务器上部署有心跳检测装置,所述心跳检测装置中设置了定时任务,例如可以为crontab定时任务,但本发明并不限定于此。通过监控服务器的crontab定时任务,每间隔预定时间(例如这里可以设置为1小时,但本发明并不限定于此,间隔时间可以根据实际应用场景进行自主设置)向所述监控服务器的本地时间文件(该文件可以是自己创建的,可以只用于存储时间数据)写入当前时间。
其中,crontab命令可见于Unix和类Unix的操作系统之中,用于设置周期性被执行的指令。该命令从标准输入设备读取指令,并将其存放于“crontab”文件中,以供之后读取和执行。
本发明实施例中,可以对当前时间的输入格式进行限定,设置为只读取固定格式的时间,例如可以设置其格式为2018-10-10:08:04:53,但本发明并不限定于此。
本发明实施例中,心跳检测装置检测监控服务器的各部分运行状态,在确保了定时任务正常运行的同时,也确保了监控服务器的配置文件的正常加载和数据能够正常读取。即若能够定时将当前时间写入所述本地时间文件,则说明所述监控服务器运行正常,在成功向本地时间文件写入一个当前时间后,则正常去读取数据,并打包上传至数据中心。
本发明实施例中,若写入所述当前时间至所述本地时间文件失败,则所述心跳检测装置判定所述监控服务器的当前运行状态是非正常的,此时可以通过所述监控服务器中的自启动模块开启自启动功能。其中,所述自启动模块是为了防止监控服务器因特殊情况(例如断电)进行重启后引发配置不生效的问题,特加入了自启动模块,在启动的同时完成配置重加载的操作,中断logstach服务进程,重新加载配置文件,然后重新运行logstach服务进程,让监控服务器发生异常后通过自启动仍然能够正常运行。
本发明实施例中,logstash可以包括数据输入模块和数据输出模块,所述数据输入模块包括file(文件)及其类型(type,file中存储的信息类型)。所述数据输出模块可以包括所述监控服务器的标识信息(host,监控服务器的主机名,例如监控服务器的IP地址(Internet Protocol Address,互联网协议地址))、地址信息(key)和数据类型(data_type)。其中,key是监控服务器的唯一标识符。
其中,logstash是一款轻量级的日志搜集处理框架,可以方便的把分散的、多样化的日志搜集起来,并进行自定义的处理,然后传输到指定的位置,比如某个服务器或者文件。logstash可以为自动为数据添加几个字段,例如host、key和data_type。
需要说明的是,logstash的数据输入模块中的file可以包括从所述本地时间文件读取的当前时间、所述当前安全告警信息等各类信息。数据输出模块中的data_type包括打包后的数据及其数据类型。
本发明实施例中,监控服务器中的数据采用了logstash开源底层框架进行传输,一方面可以指定数据的类型方便过滤,另一方面logstash的数据输入模块可以直接对所述本地时间文件提供input接口,所述数据输出模块可以对数据中心端提供output接口。
本发明实施例中,由于随着时间的不断推移,定时任务会不断地向所述本地时间文件中写入时间数据,logstash中的数据也会越来越多,在长时间运行后对监控服务器的磁盘空间的占用量也会越来越大,因此,可以定期对所述本地时间文件和logstash中的垃圾数据和过时数据进行清理,这部分功能的实现可以由文件清理模块来完成。
继续参考图3实施例,所述数据中心可以包括redis服务器、数据库服务器(这里以mysql为例进行说明,但本发明并不限定于此)和网络服务器(web服务器)。
其中,所述redis服务器可以用于接收并缓存所述监控服务器发送的所述当前心跳数据和所述当前安全告警信息。所述数据库服务器可以用于定时将所述redis服务器中缓存的所述当前心跳数据和所述当前安全告警信息存储至数据库中。所述网络服务器可以用于定时读取所述当前心跳数据和所述当前安全告警信息进行展示。
具体的,数据中心端使用redis服务器接收监控服务器端数据输出模块的数据,之后同样使用定时任务执行脚本来对redis中的数据进行读取,同时脚本还具有将数据导入数据库的功能,最终可以通过web服务器来展示监控服务器和被该监控服务器监控的各主机的状态,即最终可以通过同一台web服务器将所有主机和所有监控服务器的运行状态、安全告警信息用适当的方式展示出来,例如可以通过短信、邮件或者可视化的方式进行展示。
本发明实施例中,由于各监控服务器并行向数据中心上传数据,导致数据上传量比较大,可以先通过redis进行缓存,然后redis进行一些整合处理,例如可以将相同监控服务器的数据(可以根据key值进行识别)上传至mysql的同一表格中。
具体的,在进行接口对接后,redis服务器收到数据输出模块的数据,该数据可以包括redis所需的不同地区的监控服务器的key值,以及不同地区的监控服务器对应的host以及当前时间和当前安全告警信息,然后redis服务器会将这部分数据存入redis中,如此便可以进行进一步的数据调用和转存。
在redis服务器中,配置定时任务来定时执行对监控服务器端传来的数据进行处理的脚本,此处利用脚本处理了时间数据和安全告警信息,同时将这两部分数据连同监控服务器所处的地址信息和标识信息也分别存入了数据库服务器mysql的不同表中,如此便使得心跳数据即时间数据全程跟随当前安全告警信息进入数据中心进行统一处理。
数据库服务器实时调用数据库中的时间信息,并将时间信息传输至web服务器中,在统一安全监控系统中进行分析处理和UI(User Interface,用户界面)展示,最终实现使用心跳检测装置来实时确认各地区的监控服务器处于正常运行状态,同时又确保了当前安全告警信息也伴随着当前心跳数据正常回传。
图4示意性示出了根据本发明的另一个实施例的监控方法的流程图。
如图4所示,本发明实施例提供的监控方法可以包括以下步骤。
在步骤S401中,通过所述心跳检测装置中设置的定时任务,每间隔预定时间向本地时间文件中写入当前时间。
在步骤S402中,判断所述当前时间是否成功写入;若所述当前时间成功写入所述本地时间文件中,则进入步骤S403;若所述当前时间未成功写入所述本地时间文件中,则进入步骤S406。
在步骤S403中,所述心跳检测装置判定所述监控服务器处于正常运行状态。
在步骤S404中,读取所述本地时间文件中的当前时间至logstash框架中的所述数据输入模块,并将所述当前时间作为所述当前心跳数据。
本发明实施例中,监控服务器中的心跳检测装置中的定时任务定时所述监控服务器的本地时间文件发送当前时间,若所述本地时间文件能够正常接收到所述当前时间,则说明该监控服务器处于正常运行状态,然后就可以将所述本地时间文件中的当前时间写入logstash的数据输入模块中的文件。
在步骤S405中,打包所述当前时间、所述当前安全告警信息和所述监控服务器的标识信息和地址信息并通过所述数据输出模块发送至所述数据中心。
在步骤S406中,所述心跳检测装置判定所述监控服务器处于非正常运行状态。
在步骤S407中,所述监控服务器开启自启动功能,完成所述监控服务器的配置重加载操作。
图5示意性示出了根据本发明的又一个实施例的监控方法的流程图。
如图5所示,本发明实施例提供的监控方法可以包括以下步骤。
在步骤S501中,监控服务器接收其监控的主机发送的当前主机扫描信息和当前主机告警信息。
在步骤S502中,所述监控服务器获取其自身的当前服务器扫描信息和当前服务器告警信息。
在步骤S503中,所述监控服务器根据所述当前主机扫描信息和所述当前主机告警信息获得所述当前主机安全告警信息和所述当前主机异常运行告警信息
在步骤S504中,所述监控服务器根据所述当前服务器扫描信息和所述当前服务器告警信息获得所述当前服务器安全告警信息
在步骤S505中,将所述当前主机安全告警信息和所述当前主机异常运行告警信息、所述当前服务器安全告警信息存储至logstash的数据输入模块,获得所述当前安全告警信息。
图6示意性示出了根据本发明的又一个实施例的监控方法的流程图。应用于数据中心
如图6所示,本发明实施例提供的监控方法可以包括以下步骤。
在步骤S610中,接收并缓存监控服务器发送的当前心跳数据和当前安全告警信息。
在步骤S620中,定时将接收到的所述当前心跳数据和所述当前安全告警信息存储至数据库中。
在步骤S630中,定时读取所述当前心跳数据和所述当前安全告警信息进行展示。
其中,所述当前心跳数据可以用于确认所述监控服务器处于正常运行状态,所述当前安全告警信息可以用于提示所述监控服务器或者所述监控服务器监控的主机中存在的安全告警。
本发明实施例提供的监控方法的具体实现可以参照上述其他实施例的描述,在此不再赘述,
本发明实施例提供的监控方法和监控系统,解决了相关技术中存在的心跳检测装置是针对于任务节点进行检测,从而无法满足大范围多地区集群式监控服务器整体数据传输流程的监控的技术问题。并且相关技术针对于节点的心跳检测装置是不利于进行统一监控工作的,同时在部署过程中也会耗费大量的资源。而本发明实施例提供的对于多地区集群式安全监控服务器心跳检测装置的设计,同时针对大量心跳数据结合安全告警信息采用logstash和redis组合进行实时回传,一方面,可以实现多地区监控服务器在进行安全监控的过程中,其自身是否正常运行的检测功能;另一方面,将所有主机和所有监控服务器的监控信息均上传至数据中心进行展示,可以达到实时、统一、全面的监控效果。同时,本发明实施例提供的技术方案灵活方便,对主机资源占用率低,通过引进监控服务器进行分析,可以减轻主机的资源利用,同时大大降低了网络带宽。
下面参考图7,其示出了适于用来实现本发明实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备的计算机系统700仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分707加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统操作所需的各种程序和数据。CPU701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分707。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的模块也可以设置在处理器中。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的监控方法。
例如,所述的电子设备可以实现如图1中所示的:步骤S110,接收监控服务器监控的主机发送的当前主机信息;步骤S120,获取所述监控服务器的当前服务器信息;步骤S130,分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息;步骤S140,若所述监控服务器的心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息。
又如,所述的电子设备可以实现如图4至图5所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (9)

1.一种监控方法,其特征在于,应用于监控服务器,所述监控服务器包括心跳检测装置;所述方法包括:
接收所述监控服务器监控的主机发送的当前主机信息;
获取所述监控服务器的当前服务器信息;
分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息;
若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息;
其中,所述当前主机信息包括当前主机扫描信息和当前主机告警信息;所述当前服务器信息包括当前服务器扫描信息和当前服务器告警信息;所述当前安全告警信息包括当前主机安全告警信息、当前主机异常运行告警信息以及当前服务器安全告警信息;
分析所述当前主机信息和所述当前服务器信息,获得当前安全告警信息,包括:
对所述当前主机扫描信息进行判断,获得所述当前主机异常运行告警信息;
对所述当前主机告警信息进行分析诊断,根据分析诊断结果剔除误报信息获得所述当前主机安全告警信息;
根据所述当前服务器扫描信息和所述当前服务器告警信息获得所述当前服务器安全告警信息。
2.根据权利要求1所述的监控方法,其特征在于,所述监控服务器包括多台,不同监控服务器设置于不同地区,各监控服务器分别连接至数据中心。
3.根据权利要求2所述的监控方法,其特征在于,所述监控服务器还包括logstash框架,所述logstash框架包括数据输入模块和数据输出模块,所述当前安全告警信息存储于所述数据输入模块;
若所述心跳检测装置判定所述监控服务器处于正常运行状态,则打包发送所述心跳检测装置采集的当前心跳数据和所述当前安全告警信息,包括:
通过所述心跳检测装置中设置的定时任务,每间隔预定时间向本地时间文件中写入预定格式的当前时间;
若所述当前时间写入成功,则读取所述本地时间文件中的当前时间至所述数据输入模块,并将所述当前时间作为所述当前心跳数据;
打包所述当前时间、所述当前安全告警信息和所述监控服务器的标识信息和地址信息并通过所述数据输出模块发送至所述数据中心。
4.根据权利要求1所述的监控方法,其特征在于,还包括:
若所述心跳检测装置判定所述监控服务器处于非正常运行状态,则所述监控服务器开启自启动功能,完成所述监控服务器的配置重加载操作。
5.一种监控方法,其特征在于,应用于数据中心;所述方法包括:
接收并缓存监控服务器发送的当前心跳数据和当前安全告警信息;
定时将接收到的所述当前心跳数据和所述当前安全告警信息存储至数据库中;
定时读取所述当前心跳数据和所述当前安全告警信息进行展示;
其中,所述当前心跳数据用于确认所述监控服务器处于正常运行状态,所述当前安全告警信息用于提示所述监控服务器或者所述监控服务器监控的主机中存在的安全告警;
其中,所述当前主机信息包括当前主机扫描信息和当前主机告警信息;所述当前服务器信息包括当前服务器扫描信息和当前服务器告警信息;所述当前安全告警信息包括当前主机安全告警信息、当前主机异常运行告警信息以及当前服务器安全告警信息;
所述当前主机异常运行告警信息是对所述当前主机扫描信息进行判断获得;
所述当前主机安全告警信息是对当前主机告警信息进行分析诊断,根据分析诊断结果剔除误报信息后获得;
所述当前服务器安全告警信息是根据当前服务器扫描信息和当前服务器告警信息获得。
6.一种监控系统,其特征在于,包括:
监控服务器,用于监控至少一台主机并产生当前安全告警信息;所述监控服务器包括心跳检测装置,所述心跳检测装置用于检测所述监控服务器的运行状态并在所述监控服务器处于正常运行状态时,产生当前心跳数据;
数据中心,用于接收所述监控服务器发送的所述当前心跳数据和所述当前安全告警信息;
其中,所述监控服务器用于分析所述至少一台主机的当前主机信息和所述监控服务器的当前服务器信息,获得所述当前安全告警信息;
所述当前主机信息包括当前主机扫描信息和当前主机告警信息;所述当前服务器信息包括当前服务器扫描信息和当前服务器告警信息;所述当前安全告警信息包括当前主机安全告警信息、当前主机异常运行告警信息以及当前服务器安全告警信息;
分析所述至少一台主机的当前主机信息和所述当前服务器信息,获得当前安全告警信息,包括:
对所述当前主机扫描信息进行判断,获得所述当前主机异常运行告警信息;
对所述当前主机告警信息进行分析诊断,根据分析诊断结果剔除误报信息获得所述当前主机安全告警信息;
根据所述当前服务器扫描信息和所述当前服务器告警信息获得所述当前服务器安全告警信息。
7.根据权利要求6所述的监控系统,其特征在于,所述数据中心包括:
redis服务器,用于接收并缓存所述监控服务器发送的所述当前心跳数据和所述当前安全告警信息;
数据库服务器,用于定时将所述redis服务器中缓存的所述当前心跳数据和所述当前安全告警信息存储至数据库中;
网络服务器,用于定时读取所述当前心跳数据和所述当前安全告警信息进行展示。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至4中任一项所述的监控方法。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至4中任一项所述的监控方法。
CN201811530240.7A 2018-12-14 2018-12-14 监控方法及系统、计算机可读介质和电子设备 Active CN109660426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811530240.7A CN109660426B (zh) 2018-12-14 2018-12-14 监控方法及系统、计算机可读介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811530240.7A CN109660426B (zh) 2018-12-14 2018-12-14 监控方法及系统、计算机可读介质和电子设备

Publications (2)

Publication Number Publication Date
CN109660426A CN109660426A (zh) 2019-04-19
CN109660426B true CN109660426B (zh) 2021-03-05

Family

ID=66114126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811530240.7A Active CN109660426B (zh) 2018-12-14 2018-12-14 监控方法及系统、计算机可读介质和电子设备

Country Status (1)

Country Link
CN (1) CN109660426B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110808873B (zh) * 2019-10-21 2022-02-22 锐捷网络股份有限公司 一种检测链路故障的方法及装置
CN112311878A (zh) * 2020-10-30 2021-02-02 杭州迪普科技股份有限公司 集控探针断线重连方法、装置及系统
CN113438122B (zh) * 2021-05-14 2022-05-17 济南浪潮数据技术有限公司 一种服务器的心跳管理方法、装置、计算机设备及介质
CN113923131B (zh) * 2021-09-10 2023-08-22 北京世纪互联宽带数据中心有限公司 一种监控信息确定方法、装置、计算设备及存储介质
CN114816898B (zh) * 2021-12-27 2023-03-24 深圳海兰云数据中心科技有限公司 一种海底数据中心监控系统、方法、装置及计算机设备
CN114598624B (zh) * 2022-03-15 2023-11-07 平安科技(深圳)有限公司 集群监控方法、装置、电子设备及可读存储介质
CN114815641A (zh) * 2022-03-29 2022-07-29 青岛海尔科技有限公司 智能设备的监控方法和装置、存储介质及电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1933427A (zh) * 2005-09-12 2007-03-21 上海新纳广告传媒有限公司 基于udp协议的网络心跳监控系统及其方法
CN102263674A (zh) * 2010-05-26 2011-11-30 大唐移动通信设备有限公司 告警上报方法、系统和设备
FR2964280B1 (fr) * 2010-08-27 2012-09-28 Eads Defence & Security Sys Procede de centralisation d?evenements pour systeme d?information hierarchique multi-niveaux
CN104407964B (zh) * 2014-12-08 2017-10-27 国家电网公司 一种基于数据中心的集中监控系统及方法
CN105490868B (zh) * 2015-11-17 2019-11-01 世纪龙信息网络有限责任公司 异地机房数据双向同步监控方法与系统
CN105915405A (zh) * 2016-03-29 2016-08-31 深圳市中博科创信息技术有限公司 一种大型集群节点性能监控系统
CN108039956A (zh) * 2017-10-30 2018-05-15 深圳前海微众银行股份有限公司 应用监控方法、系统和计算机可读存储介质
CN109660380B (zh) * 2018-09-28 2022-09-06 深圳壹账通智能科技有限公司 服务器运行状态的监控方法、平台、系统及可读存储介质

Also Published As

Publication number Publication date
CN109660426A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
CN109660426B (zh) 监控方法及系统、计算机可读介质和电子设备
CN109714192B (zh) 一种监控云平台的监控方法及系统
CN108768791B (zh) 一种信息采集配置管理系统及方法
CN105357038B (zh) 监控虚拟机集群的方法和系统
CA2780013C (en) Cloud computing monitoring and management system
CN104731580A (zh) 基于Karaf与ActiveMQ的自动化运维系统及其实现方法
WO2017131774A1 (en) Log event summarization for distributed server system
CN108769124B (zh) PaaS平台的应用部署方法、装置、服务器及存储介质
US20170126789A1 (en) Automatic Software Controller Configuration based on Application and Network Data
CN110727560A (zh) 云服务报警方法及装置
CN110784374A (zh) 业务系统运行状态的监控方法、装置、设备和系统
CN109684038B (zh) Docker服务容器日志的处理方法、装置和电子设备
CN110659109A (zh) 一种openstack集群虚拟机监控系统及方法
CN109710490A (zh) 客户端日志的采集方法、装置、存储介质和电子设备
US20170126580A1 (en) Tracking Contention in a Distributed Business Transaction
US10775751B2 (en) Automatic generation of regular expression based on log line data
CN110896362B (zh) 一种故障检测方法和装置
CN110534136B (zh) 录音的方法和装置
CN112860504A (zh) 监控方法及装置、计算机存储介质、电子设备
US20170223136A1 (en) Any Web Page Reporting and Capture
US10432490B2 (en) Monitoring single content page application transitions
CN116260747A (zh) 终端测试设备的监测方法、装置及电子设备
US10216926B2 (en) Isolation of untrusted code in operating system without isolation capability
CN108880994B (zh) 一种重发邮件的方法和装置
CN113760447A (zh) 服务管理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant