CN106385343B - 一种分布式系统下监控客户端的方法及装置、分布式系统 - Google Patents

一种分布式系统下监控客户端的方法及装置、分布式系统 Download PDF

Info

Publication number
CN106385343B
CN106385343B CN201610802798.0A CN201610802798A CN106385343B CN 106385343 B CN106385343 B CN 106385343B CN 201610802798 A CN201610802798 A CN 201610802798A CN 106385343 B CN106385343 B CN 106385343B
Authority
CN
China
Prior art keywords
self
checking data
client
sending
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610802798.0A
Other languages
English (en)
Other versions
CN106385343A (zh
Inventor
董延平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Technology Group Co Ltd
Original Assignee
TCL Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Technology Group Co Ltd filed Critical TCL Technology Group Co Ltd
Priority to CN201610802798.0A priority Critical patent/CN106385343B/zh
Publication of CN106385343A publication Critical patent/CN106385343A/zh
Application granted granted Critical
Publication of CN106385343B publication Critical patent/CN106385343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Abstract

本发明适用于软件领域,提供了一种分布式系统下监控客户端的方法及装置、分布式系统,其所述方法包括:遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;当判断为是时,对所述数据库存储的对应自检数据设定标识位;将设定标识位后的自检数据发送给维稳中心。本发明的实施例中,客户端定时自检,将自检数据周期性地发送给服务器,服务器定时检测数据库的数据发现该客户端当前处于异常状态,将自检数据设定标志位,并将设定标识位的自检数据发送给维稳中心。服务器与多个客户端连接,及时监控客户端的运行状况,当客户端出现异常时,及时将信息反馈给维稳中心,提高监控效率。

Description

一种分布式系统下监控客户端的方法及装置、分布式系统
技术领域
本发明实施例属于通信领域,尤其涉及一种分布式系统下监控客户端的方法及装置、分布式系统。
背景技术
随着信息技术的发展,为满足信息化的需求,各行各业需要用到的服务器的数量与日俱增。多台服务器长时间进行大量的运算,其中一台或者多台可能会出现温度过高、死机、重启以及应用软件无法响应等故障。一旦服务器出现故障,如果对故障的处理不够及时,基于该服务器的系统会受到影响,同时对信息的传输以及存储都会造成影响。此外,若服务器不能及时恢复正常状态,还可能造成硬件设备的损坏以及其它方面的损失。
基于以上问题,需要服务器管理人员及时了解所有服务器的运行状态,甚至需要安排专人24小时值守并定时检查。但通过人工对服务器的运行状态进行监控,很难做到对故障发生的时间以及原因等做到科学的管理,还加重了管理人员的负担。
现有技术中,提出一种多级管理的分布式系统,如一个主系统和多个或多级子系统,因为各个系统/子系统各自独立运行,分布较为分散,每个系统/子系统都需要投入大量人员进行自动化系统运行维护工作。而不同层次的自动化系统运行维护人员的技术水平参差不齐,难以保证各个系统运行状况产生的告警信息处理的及时性和正确性,这影响了分布式系统的稳定运行,也影响监控效率。
发明内容
本发明实施例提供了一种服务器集群管理方法及系统,旨在解决现有的监控效率较低的问题。
本发明实施例是这样实现的,一种分布式系统下监控客户端的方法,所述方法包括:
遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;
当判断为是时,对所述数据库存储的对应自检数据设定标识位;
将设定标识位后的自检数据发送给维稳中心。
优选地,所述遍历数据库的数据,判断是否有客户端超期未发送自检数据具体包括:
获取自检数据的接收时间及发送时间周期;
计算当前时间与所述接收时间之间的差值,并将所计算的差值与所述发送时间周期进行比较;
当所述差值大于所述发送时间周期时,确认对应的客户端超期未发送自检数据。
优选地,所述遍历数据库的数据,判断是否有客户端超期未发送自检数据还包括:
当所述差值不大于所述时间周期时,检测所述自检数据是否携带error标识;
当携带所述error标识时,转到对所述自检数据设定标志位的步骤;
当不携带所述error标识时,等待客户端发送的自检数据。
优选地,所述对所述数据库存储的对应自检数据设定标识位之后、所述将设定标识位的自检数据发送给维稳中心之前还包括:
向对应的客户端发送应答请求,并等待对应客户端的应答;
当在预设时间未接收到所述对应客户端的应答时,确认所述对应客户端当前处于异常状态。
优选地,所述遍历数据库的数据,判断是否有客户端超期未发送自检数据之前还包括:
接收客户端发送的自检数据;
对所接收的自检数据进行解析,获得解析数据并存储在所述数据库中。
优选地,所述自检数据的形成过程如下:
客户端定时检测自身运行状态,获得自检数据;
设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期。
本发明实施例的另一目的在于提供一种分布式系统下监控客户端的装置,包括:
遍历判断模块,用于遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;
标识位设定模块,用于对所述数据库存储的对应自检数据设定标识位;
发送模块,用于将设定标识位后的自检数据发送给维稳中心。
优选地,所述遍历判断模块具体包括:
获取单元,用于获取自检数据的接收时间及发送时间周期;
计算比较单元,用于计算当前时间与所述接收时间之间的差值,并将所计算的差值与所述发送时间周期进行比较;
确认单元,用于当所述差值大于所述发送时间周期时,确认对应的客户端超期未发送自检数据。
本发明实施例的另一目的在于提供一种分布式系统,包括至少一个客户端及服务器,所述服务器包括:
接收模块,用于接收所述至少一个客户端发送的自检数据,并存储在数据库中;
遍历判断模块,用于遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;
标识位设定模块,用于对所述数据库存储的对应自检数据设定标识位;
发送模块,用于将设定标识位后的自检数据发送给维稳中心;
所述客户端包括:
发送模块,用于给所述服务器发送自检数据。
优选地,所述客户端还包括:
自检模块,用于检测自身运行状态,获得自检数据;
设定模块,用于设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期。
本发明的实施例中,遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;当判断为是时,对所述数据库存储的对应自检数据设定标识位;将设定标识位后的自检数据发送给维稳中心,只需一台服务器即可实现对多个客户端的监控,有效地提高监控效率。
附图说明
图1是本发明第一实施例提供的一种Android系统电视的关机控制方法的流程图;
图2是本发明第一实施例提供的一种Android系统电视的关机控制方法的步骤S1的具体流程图;
图3是本发明第二实施例提供的一种分布式系统下监控客户端的装置的结构图;
图4是本发明第二实施例提供的一种分布式系统下监控客户端的装置的遍历判断模块1的具体结构图;
图5是本发明第三实施例提供的一种分布式系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例中,遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;当判断为是时,对所述数据库存储的对应自检数据设定标识位;将设定标识位后的自检数据发送给维稳中心。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了本发明第一实施例提供的一种Android系统电视的关机控制方法的流程图,详述如下:
步骤S1,遍历数据库的数据,判断是否有客户端超期未发送自检数据;
其中,该数据库用于存储每一个客户端发送的自检数据,该数据库分区设置,每一区存储一个客户端发送的自检数据,优选地,该数据库可至少存储有一个客户端发送的自检数据,还可以不一定存储有自检数据,如第一次遍历某个区时,可能该区当前并未存储有自检数据。对每一区的自检数据进行检测,判断对应的客户端是否超期未发送自检数据,具体地,存储的自检数据中包括有接收时间、发送时间周期、自检数据主体等,根据发送时间及发送时间周期判断对应的客户端是否超期未发送自检数据(即是否超期未接收到对应客户端发送的自检数据)。该自检数据是客户端定期扫描自身系统获得的,并在获得自检数据后发送给服务器。而服务器也会定期扫描数据库的自检数据,定期检查客户端的状况。当判断客户端超期未发送自检数据时,转到步骤S2,否则转到步骤S4;
在本实施例的一个优选方案中,如图2所示,为本发明第一实施例提供的一种Android系统电视的关机控制方法的步骤S1的具体流程图,该步骤S1具体包括:
步骤S11,获取自检数据的接收时间及发送时间周期;
步骤S12,计算当前时间与接收时间之间的差值,并将所计算的差值与发送时间周期进行比较;当差值大于发送时间周期时,转到步骤S13,否则转到步骤S4;
步骤S13,当差值大于发送时间周期时,确认对应的客户端超期未发送自检数据。
其中,首先获取自检数据中的接收时间及发送时间周期,计算当前时间与接收时间的差值,并将该差值与发送时间周期进行比较,当差值大于发送时间周期时,说明对应的客户端超期未发送自检数据,转到步骤S2,当差值不大于发送时间周期时,说明对应客户端定期发送自检数据,转到步骤S4,具体地,该发送时间周期可根据实际情况而设,可为2s、5s或者其他,此处对此不作限制。
步骤S2,当判断客户端超期未发送自检数据时,对对应的自检数据设定标识位;
具体地,当客户端超期未发送自检数据时,此时存储在服务器的自检数据已经过期,需要对该自检数据设置标志位,以在屏幕上显示时进行提示,例如将该自检数据标识为0,还可以进行其他标志位设置,服务器根据该标志位进行对应的提示显示,以区别其他自检数据。
步骤S3,将设定标识位后的自检数据发送给维稳中心。
具体地,对自检数据设置标志位后,将该自检数据发送给维稳中心,以供该维稳中心进行相应的数据维护。该自检数据包括客户端发送的数据主体、设定的标志位、客户端识别码等,还可以包括其他信息,此处对此不作限制。
步骤S4,检测自检数据是否携带error标识;当携带error标识时,转到步骤S2对自检数据设定标志位的步骤;当不携带error标识时,继续等待客户端发送的自检数据。
在本实施例的一个优选方案中,上述步骤S2之后、步骤S3之前还可包括:
步骤S5,向对应的客户端发送应答请求,并等待对应客户端的应答;
具体地,向对应的客户端发送应答请求,当在预设时间未接收到对应客户端的应答时,确认对应客户端当前处于异常状态,转到步骤S3,当在预设时间接收到对应客户端的应答时,确认对应客户端当前处于正常状态,也转到步骤S3,当客户端处于异常状态时,该步骤S3中发送的自检数据包括对应客户端当前处于异常状态的信息,当客户端处于正常状态时,自检数据可包括对应客户端当前处于正常状态的信息。
在本实施例的一个优选方案中,步骤S1之前还可包括:
步骤S01,接收客户端发送的自检数据;
步骤S02,对所接收的自检数据进行解析,获得解析数据并将其存储在所述数据库中。
优选地,该步骤S02具体包括:
获取所接收的自检数据的消息头;
基于消息头对自检数据进行解析,获得解析数据,例如根据消息头携带的数据格式来对自检数据进行解析,获得解析数据;
将解析数据写入所述数据库的对应区域,并覆盖对应区域之前存储的自检数据。
需要说明的是,客户端是定期扫描自身运行状况,获得自检数据,并将自检数据发送给服务器,上述步骤S01及步骤S02不局限于在步骤S1之前,还可以是与步骤S1同步,或者在步骤S1之后的任意时间,此处对此不作限制。
在本实施例的一个优选方案中,上述自检数据是由客户端自检获得,具体过程如下:
客户端开机,检索配置文件;
对配置文件进行解析;
基于解析的配置文件设定定时任务。
具体地,基于解析的配置文件设定定时任务的具体过程如下:
定时检测自身运行状态,获得自检数据;
设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期,还可包括服务器异常状态反馈地址等,此处对此不作限制。
基于http协议对自检数据进行封装;
具体地,可根据hattp协议设定消息头(优选为http消息头)、数据主体。
配置文件具体如下:
monitor.url=http://localhost:8080(消息头)monitor.url:监控服务器地址,自检数据转发位置;
data.formart:数据协议封装格式,可以为json或者xml
data.transfer.interval:传递时间间隔,以秒为单位
monitor.server.connect.error.notification.email:当不能连接到监控服务器后将错误消息发送至该邮箱。
客户端将自检数据发送给服务器还可包括:
向服务器发送自检数据,当接收到发送超时反馈时,确认服务器当前处于异常状态,无法接收客户端发送的自检数据,客户端向异常状态反馈地址发送服务器当前处于异常状态的信息,该反馈地址可以是上述维稳中心,还可以是其他地方,此处对此不作限制。
在本实施例的一个优选方案中,上述分布式系统下监控客户端的方法还可包括:
将所接收的自检数据以列表形式显示出来,例如可按照接收时间先后、按照客户端的型号或者序列号来对自检数据进行排序,并形成列表显示出来,当遍历数据库时,发现某个客户端超期未发送自检数据,可对存储的对应自检数据进行标志位设置,服务器根据该标志位在列表中突出显示对应的自检数据,例如用不同的颜色显示出来。
本发明的实施例中,客户端定时自检,将自检数据周期性地发送给服务器,服务器定时检测数据库的数据,当客户端未周期发送自检数据时,表示该客户端当前处于异常状态,将自检数据设定标志位,并将设定标识位的自检数据发送给维稳中心。服务器与多个客户端连接,及时监控客户端的运行状况,当客户端出现异常时,及时将信息反馈给维稳中心,提高监控效率。
此外,客户端在发送自检数据前会检测服务器是否正常,当发现服务器异常时,发送提示信息,便于维护人员及时处理,进一步提高监控效率。
应理解,在本发明实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二:
图3示出了本发明第二实施例提供的一种分布式系统下监控客户端的装置的结构图,该装置包括:遍历判断模块1、与该遍历判断模块1连接的标志位设定模块2、与该标志位设定模块2连接的发送模块3,其中:
遍历判断模块1,用于遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;
其中,该数据库用于存储每一个客户端发送的自检数据,该数据库分区设置,每一区存储一个客户端发送的自检数据,优选地,该数据库至少存储有一个客户端发送的自检数据(即是否超期未接收到对应客户端发送的自检数据)。遍历判断模块1对每一区的自检数据进行检测,判断对应的客户端是否超期未发送自检数据,具体地,存储的自检数据中包括有接收时间、发送时间周期、自检数据主体等,根据发送时间及发送时间周期判断对应的客户端是否超期未发送自检数据。该自检数据是客户端定期扫描自身系统获得的,并在获得自检数据后发送给服务器。而服务器也会定期扫描数据库的自检数据,定期检查客户端的状况。当判断客户端超期未发送自检数据时,向标志位设定模块2反馈。
标识位设定模块2,用于对数据库存储的对应自检数据设定标识位;
具体地,当客户端超期未发送自检数据时,此时存储在服务器的自检数据已经过期,需要对该自检数据设置标志位,以在屏幕上显示时进行提示,例如将该自检数据标识为0,还可以进行其他标志位设置,服务器根据该标志位进行对应的提示显示,以区别其他自检数据。
发送模块3,用于将设定标识位后的自检数据发送给维稳中心。
具体地,对自检数据设置标志位后,将该自检数据发送给维稳中心,以供该维稳中心进行相应的数据维护。该自检数据包括客户端发送的数据主体、设定的标志位、客户端识别码等,还可以包括其他信息,此处对此不作限制。
在本实施例中,该分布式系统下监控客户端的装置还可包括:
接收模块4,用于接收客户端周期发送的自检数据。
在本实施例的一个优选方案中,上述装置还可包括:
检测模块5,用于检测自检数据是否携带error标识;当携带error标识时,将检测结果反馈给标志位设定模块2;当不携带error标识时,将反馈结果反馈给接收模块,继续等待客户端发送的自检数据。
进一步地,上述遍历判断模块1判断客户端正常发送自检数据时,向该检测模块5反馈,该检测模块5基于该反馈检测该自检数据是否携带error标识。
在在本实施例的又一个优选方案中,上述装置还可包括:
测试模块6,用于向对应的客户端发送应答请求,并等待对应客户端的应答;
具体的,向对应的客户端发送应答请求,当在预设时间未接收到对应客户端的应答时,确认对应客户端当前处于异常状态,向发送模块3反馈对应客户端当前处于异常状态的信息;当在预设时间接收到对应客户端的应答时,确认对应客户端当前处于正常状态,将对应客户端当前处于正常状态的信息反馈给发送模块3,当客户端处于异常状态时,该发送模块3发送的自检数据包括对应客户端当前处于异常状态的信息,当客户端处于正常状态时,自检数据可包括对应客户端当前处于正常状态的信息。
在本实施例的另一个优选方案中,上述装置还可包括:
解析模块7,用于对所接收的自检数据进行解析,获得解析数据并存储在所述数据库中。
具体地,该解析模块7具体用于:获取所接收的自检数据的消息头;基于消息头对自检数据进行解析,获得解析数据,例如根据消息头携带的数据格式来对自检数据进行解析,获得解析数据;将解析数据写入所述数据库的对应区域,并覆盖对应区域之前存储的自检数据。
需要说明的是,客户端是定期扫描自身运行状况,获得自检数据,并将自检数据发送给服务器,接收模块4可在任意时间接收客户端发送的自检数据,此处对此不作限制。
优选地,如图4所示,为本发明第二实施例提供的一种分布式系统下监控客户端的装置的遍历判断模块1的具体结构图,该遍历判断模块1具体包括:获取单元11、与获取单元11连接的计算比较单元12、与计算比较单元12连接的确认单元13,其中:
获取单元11,用于获取自检数据的接收时间及发送时间周期;
计算比较单元12,用于计算当前时间与接收时间之间的差值,并将所计算的差值与发送时间周期进行比较;当差值大于发送时间周期时,向该确认单元13反馈,否则向检测模块4反馈。
其中,首先获取自检数据中的接收时间及发送时间周期,计算当前时间与接收时间的差值,并将该差值与发送时间周期进行比较,当差值大于发送时间周期时,说明对应的客户端超期未发送自检数据,将此结果反馈给标志位设定模块2,当差值不大于发送时间周期时,说明对应客户端定期发送自检数据,将此结果反馈给判断模块5,具体地,该发送时间周期可根据实际情况而设,可为2s、5s或者其他,此处对此不作限制。
在本实施例的一个优选方案中,上述装置还可包括:
显示控制模块,用于将所接收的自检数据以列表形式显示出来,例如可按照接收时间先后、按照客户端的型号或者序列号来对自检数据进行排序,并形成列表显示出来,当遍历数据库时,发现某个客户端超期未发送自检数据,可对存储的对应自检数据进行标志位设置,服务器根据该标志位在列表中突出显示对应的自检数据,例如用不同的颜色显示出来。
需要说明的是,本实施例的一种分布式系统下监控客户端的装置优选为服务器。
本发明的实施例中,客户端定时自检,将自检数据周期性地发送给服务器,服务器定时检测数据库的数据,当客户端未周期发送自检数据时,表示该客户端当前处于异常状态,将自检数据设定标志位,并将设定标识位的自检数据发送给维稳中心。服务器与多个客户端连接,及时监控客户端的运行状况,当客户端出现异常时,及时将信息反馈给维稳中心,提高监控效率。
此外,客户端在发送自检数据前会检测服务器是否正常,当发现服务器异常时,发送提示信息,便于维护人员及时处理,进一步提高监控效率。
实施例三
图5示出了本发明第三实施例提供的一种分布式系统的结构图,包括至少一个客户端及服务器,该服务器即为实施例二所述的分布式系统下监控客户端的装置,该服务器的具体结构及工作原理与上述实施例二的分布式系统下监控客户端的装置的描述基本一致,此处不再赘述。上述客户端具体包括:自检模块、与自检模块连接的设定模块、与设定模块连接的发送模块,其中:
自检模块,用于形式检测自身运行状态,获得自检数据;
设定模块,用于设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期。
发送模块,用于给服务器发送自检数据。
在本实施例的一个优选方案中,该客户端还可包括:
开机检索模块,用于根据用户指示执行开机动作,并检索配置文件。
配置文件解析模块,用于对配置文件进行解析;
具体地,上述设定模块具体用于:
定时检测自身运行状态,获得自检数据;
设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期,还可包括服务器异常状态反馈地址等,此处对此不作限制。
基于http协议对自检数据进行封装;
具体地,可根据hattp协议设定消息头(优选为http消息头)、数据主体。
配置文件具体如下:
monitor.url=http://localhost:8080(消息头)monitor.url:监控服务器地址,自检数据转发位置;
data.formart:数据协议封装格式,可以为json或者xml
data.transfer.interval:传递时间间隔,以秒为单位
monitor.server.connect.error.notification.email:当不能连接到监控服务器后将错误消息发送至该邮箱。
在本实施例的另一个优选方案中,发送模块还可用于:向服务器发送自检数据,当接收到发送超时反馈时,确认服务器当前处于异常状态,无法接收客户端发送的自检数据,客户端向异常状态反馈地址发送服务器当前处于异常状态的信息,该反馈地址可以是上述维稳中心,还可以是其他地方,此处对此不作限制。
本发明的实施例中,客户端定时自检,将自检数据周期性地发送给服务器,服务器定时检测数据库的数据,当客户端未周期发送自检数据时,表示该客户端当前处于异常状态,将自检数据设定标志位,并将设定标识位的自检数据发送给维稳中心。服务器与多个客户端连接,及时监控客户端的运行状况,当客户端出现异常时,及时将信息反馈给维稳中心,提高监控效率。
此外,客户端在发送自检数据前会检测服务器是否正常,当发现服务器异常时,发送提示信息,便于维护人员及时处理,进一步提高监控效率。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种分布式系统下监控客户端的方法,其特征在于,所述方法包括:
遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;其中,所述数据库设置分区,每一分区存储一个客户端发送的自检数据;
当判断为是时,对所述数据库存储的对应自检数据设定标识位;
将设定标识位后的自检数据发送给维稳中心;
所述客户端向服务器发送所述自检数据后,若接收到发送超时反馈,则所述客户端向所述维稳中心发送所述服务器当前处于异常状态的信息;
所述遍历数据库的数据,判断是否有客户端超期未发送自检数据具体包括:
获取自检数据的接收时间及发送时间周期;
计算当前时间与所述接收时间之间的差值,并将所计算的差值与所述发送时间周期进行比较;
当所述差值大于所述发送时间周期时,确认对应的客户端超期未发送自检数据;
当所述差值不大于所述时间周期时,检测所述自检数据是否携带error标识;
当携带所述error标识时,转到对所述自检数据设定标识位的步骤;
当不携带所述error标识时,等待客户端发送的自检数据。
2.根据权利要求1所述的方法,其特征在于,所述对所述数据库存储的对应自检数据设定标识位之后、所述将设定标识位的自检数据发送给维稳中心之前还包括:
向对应的客户端发送应答请求,并等待对应客户端的应答;
当在预设时间未接收到所述对应客户端的应答时,确认所述对应客户端当前处于异常状态。
3.根据权利要求1所述的方法,其特征在于,所述遍历数据库的数据,判断是否有客户端超期未发送自检数据之前还包括:
接收客户端发送的自检数据;
对所接收的自检数据进行解析,获得解析数据并将其存储在所述数据库中。
4.根据权利要求1所述的方法,其特征在于,所述自检数据的形成过程如下:
客户端定时检测自身运行状态,获得自检数据;
设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期。
5.一种分布式系统下监控客户端的装置,其特征在于,包括:
遍历判断模块,用于遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;其中,所述数据库设置分区,每一分区存储一个客户端发送的自检数据;
标识位设定模块,用于对所述数据库存储的对应自检数据设定标识位;
发送模块,用于将设定标识位后的自检数据发送给维稳中心;
其中,所述客户端向服务器发送所述自检数据后,若接收到发送超时反馈,则所述客户端向所述维稳中心发送所述服务器当前处于异常状态的信息;
所述遍历判断模块具体包括:
获取单元,用于获取自检数据的接收时间及发送时间周期;
计算比较单元,用于计算当前时间与所述接收时间之间的差值,并将所计算的差值与所述发送时间周期进行比较;
确认单元,用于当所述差值大于所述发送时间周期时,确认对应的客户端超期未发送自检数据;
检测模块,用于检测自检数据是否携带error标识;当携带error标识时,将检测结果反馈给所述标识位设定模块;当不携带error标识时,继续等待客户端发送的自检数据。
6.一种分布式系统,其特征在于,包括至少一个客户端及服务器,所述服务器包括:
接收模块,用于接收所述至少一个客户端发送的自检数据,并存储在数据库中;其中,所述数据库设置分区,每一分区存储一个客户端发送的自检数据;
遍历判断模块,用于遍历数据库的数据,判断是否有客户端超期未发送自检数据,所述数据库存储有至少一个客户端发送的自检数据;
标识位设定模块,用于对所述数据库存储的对应自检数据设定标识位;
发送模块,用于将设定标识位后的自检数据发送给维稳中心;
所述遍历判断模块具体包括:
获取单元,用于获取自检数据的接收时间及发送时间周期;
计算比较单元,用于计算当前时间与所述接收时间之间的差值,并将所计算的差值与所述发送时间周期进行比较;
确认单元,用于当所述差值大于所述发送时间周期时,确认对应的客户端超期未发送自检数据;
检测模块,用于检测自检数据是否携带error标识;当携带error标识时,将检测结果反馈给所述标识位设定模块;当不携带error标识时,继续等待客户端发送的自检数据;
所述客户端包括:
发送模块,用于给所述服务器发送自检数据;所述客户端向服务器发送所述自检数据后,若接收到发送超时反馈,则所述客户端向所述维稳中心发送所述服务器当前处于异常状态的信息。
7.根据权利要求6所述的一种分布式系统,其特征在于,所述客户端还包括:
自检模块,用于检测自身运行状态,获得自检数据;
设定模块,用于设定所述自检数据的发送属性,所述发送属性包括发送格式、发送地址、发送时间周期。
CN201610802798.0A 2016-09-05 2016-09-05 一种分布式系统下监控客户端的方法及装置、分布式系统 Active CN106385343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610802798.0A CN106385343B (zh) 2016-09-05 2016-09-05 一种分布式系统下监控客户端的方法及装置、分布式系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610802798.0A CN106385343B (zh) 2016-09-05 2016-09-05 一种分布式系统下监控客户端的方法及装置、分布式系统

Publications (2)

Publication Number Publication Date
CN106385343A CN106385343A (zh) 2017-02-08
CN106385343B true CN106385343B (zh) 2020-12-11

Family

ID=57939133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610802798.0A Active CN106385343B (zh) 2016-09-05 2016-09-05 一种分布式系统下监控客户端的方法及装置、分布式系统

Country Status (1)

Country Link
CN (1) CN106385343B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025157B (zh) * 2017-04-21 2019-08-02 浪潮集团有限公司 一种算法自检电路及方法
CN108494621B (zh) * 2018-03-06 2021-07-20 汕头大学 智能家居自检信号传输方法、装置、移动终端及存储介质
CN111061586B (zh) * 2019-12-05 2023-09-19 深圳先进技术研究院 一种容器云平台异常检测方法、系统及电子设备
CN114722014B (zh) * 2022-06-09 2022-09-02 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101106535A (zh) * 2007-08-14 2008-01-16 华为技术有限公司 一种实现心跳机制的方法、服务器和系统
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及系统
CN102412998A (zh) * 2011-12-21 2012-04-11 上海会畅通讯科技发展有限公司 运营服务系统及其维护方法和装置
CN102970181A (zh) * 2012-11-05 2013-03-13 广州广电运通金融电子股份有限公司 自助终端状态监控系统及监控方法
CN103036719A (zh) * 2012-12-12 2013-04-10 北京星网锐捷网络技术有限公司 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN103067194A (zh) * 2011-10-24 2013-04-24 中兴通讯股份有限公司 一种终端在线状态监控方法及系统
CN103092698A (zh) * 2012-12-24 2013-05-08 中国科学院深圳先进技术研究院 云计算应用自动部署系统及方法
CN103167004A (zh) * 2011-12-15 2013-06-19 中国移动通信集团上海有限公司 云平台主机系统故障修复方法及云平台前端控制服务器

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101106535A (zh) * 2007-08-14 2008-01-16 华为技术有限公司 一种实现心跳机制的方法、服务器和系统
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及系统
CN103067194A (zh) * 2011-10-24 2013-04-24 中兴通讯股份有限公司 一种终端在线状态监控方法及系统
CN103167004A (zh) * 2011-12-15 2013-06-19 中国移动通信集团上海有限公司 云平台主机系统故障修复方法及云平台前端控制服务器
CN102412998A (zh) * 2011-12-21 2012-04-11 上海会畅通讯科技发展有限公司 运营服务系统及其维护方法和装置
CN102970181A (zh) * 2012-11-05 2013-03-13 广州广电运通金融电子股份有限公司 自助终端状态监控系统及监控方法
CN103036719A (zh) * 2012-12-12 2013-04-10 北京星网锐捷网络技术有限公司 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN103092698A (zh) * 2012-12-24 2013-05-08 中国科学院深圳先进技术研究院 云计算应用自动部署系统及方法

Also Published As

Publication number Publication date
CN106385343A (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN106385343B (zh) 一种分布式系统下监控客户端的方法及装置、分布式系统
JP5736881B2 (ja) ログ収集システム、装置、方法及びプログラム
CN105610648B (zh) 一种运维监控数据的采集方法及服务器
CN105335271A (zh) 一种状态监控装置、综合监控系统和方法
US8306782B2 (en) System for monitoring and diagnosing remote devices
JP6095140B2 (ja) 遠隔監視システム、遠隔監視方法、及びプログラム
CN112636979B (zh) 一种集群告警方法及相关装置
CN107707415B (zh) 一种基于SaltStack的服务器配置自动监控与告警方法
CN114024834A (zh) 故障定位方法、装置、电子设备及可读存储介质
CN112799909A (zh) 一种服务器自动化管理系统及方法
CN110749027B (zh) 电器设备的监控方法、装置、空调器和存储介质
CN103634166A (zh) 一种设备存活检测方法及装置
EP2882216B1 (en) Device and method for controlling, supervising and giving an alarming from a power supply of base station
JP2006268515A (ja) Pciカ−ド障害管理方式
EP3607767B1 (en) Network fault discovery
CN115168137A (zh) 针对定时任务的监控方法及系统、计算机设备及存储介质
JP2007264907A (ja) 障害通報システム、障害通報方法及び障害通報プログラム
JP2011192201A (ja) リモート保全システムおよびリモート保全方法
JP2007156869A (ja) アラーム管理装置及びアラーム管理方法
CN110505443A (zh) 一种视频监控设备替换自动检测方法和装置
CN107765123A (zh) 检测规则更新方法及用电安全监测系统
CN104581662B (zh) 一种短信报警方法、装置及系统
JP2012129664A (ja) ネットワーク通信状態監視装置
JP2012118800A (ja) 運用管理障害対応システム及び運用管理障害対応方法
CN114048098A (zh) 异常服务实例的监控方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 516006 TCL technology building, No.17, Huifeng Third Road, Zhongkai high tech Zone, Huizhou City, Guangdong Province

Applicant after: TCL Technology Group Co.,Ltd.

Address before: 516006 Guangdong province Huizhou Zhongkai hi tech Development Zone No. nineteen District

Applicant before: TCL RESEARCH AMERICA Inc.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant