CN108270634A - 一种心跳探测的方法及系统 - Google Patents

一种心跳探测的方法及系统 Download PDF

Info

Publication number
CN108270634A
CN108270634A CN201611264189.0A CN201611264189A CN108270634A CN 108270634 A CN108270634 A CN 108270634A CN 201611264189 A CN201611264189 A CN 201611264189A CN 108270634 A CN108270634 A CN 108270634A
Authority
CN
China
Prior art keywords
heartbeat
heartbeat detection
detection
service
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611264189.0A
Other languages
English (en)
Other versions
CN108270634B (zh
Inventor
王浩硕
胡建华
宁宇
滕滨
张琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201611264189.0A priority Critical patent/CN108270634B/zh
Publication of CN108270634A publication Critical patent/CN108270634A/zh
Application granted granted Critical
Publication of CN108270634B publication Critical patent/CN108270634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Abstract

本发明公开了一种心跳探测的方法,配置心跳探测任务信息;根据所述心跳探测任务信息设置全局控制节点和执行节点,所述全局控制节点按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;各个执行节点执行所述心跳探测任务,向待探测的服务发起心跳探测请求;收到所述心跳探测请求的待探测的服务反馈自身的心跳状态进行诊断,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。本发明同时还公开了一种心跳探测的系统。

Description

一种心跳探测的方法及系统
技术领域
本发明涉及网络服务业务支撑技术,尤其涉及一种心跳探测方法及系统。
背景技术
如今,随着网络技术快速发展,当用户可以享受到更多网络服务的同时,网络服务的业务支撑也越显重要。通常,衡量一个企业对用户服务质量高低的标准是通过服务接口的稳定性和性能优劣来判断,因此,各类业务支撑系统均努力通过采取各种措施来提高自身系统的稳定性。目前,各服务间的心跳探测机制则是业界普遍采用的一种保障服务系统稳定性的方法。
由于不同软件技术架构之间的差异性,不同的开发承建商针对心跳探测的解决方案也不尽相同。目前,业界众多的主流方案最终可以归纳为以下几种:
1、一次发送心跳数据
心跳发起端向所有心跳待探测端发送心跳请求数据,设定时间后,所述心跳发起端以非阻塞的方式接收数据,若未收到数据,则判定所有心跳待探测端均未正常工作,并返回初始步骤;若接收到数据,则解析接收到的数据;进一步的,若解析出的数据为心跳应答数据,则判定发送该心跳应答数据的心跳待探测端工作正常。
2、定期批量发送心跳数据包
将全部的心跳请求分为几个批次,每个批次的请求通过一个数据包发出。在探测段将数据包解析,进行实际的探测任务;探测结束后,将结果再次封装为一个数据包返回给心跳发起端,由心跳发起端判定服务的最终状态。
3、轮询发出心跳探测请求
在某些软件架构设计时,考虑到一次性或者批量的心跳请求会造成待探测端请求压力,会采用轮询发出心跳探测请求的策略。该方案一般是在每单位时间发出一个请求,直至请求全部发完为止,以非并发方式降低待探测端的请求压力。
然而,以上三种主流解决方案各自存在着弊端和场景应用缺点:
对于一次发送心跳数据方案,心跳发起端将全部的心跳请求一次性发送到待探测端;当待探测端的服务数量众多以至上千时,发起端一次性并发发出上千条心跳请求不是一件易事;同时,即使上千条请求成功发出且到达待探测端,待探测端既需要应答正常业务、又要面对如此大量的心跳数据,服务器的处理速度会受到严重影响,从而导致响应超时,造成发起端对服务心跳状态的误判,增加了正常业务的坍塌风险。
对于定期批量发送心跳数据包的方案,虽然是针对一次发送心跳数据方案的优化,在一定程度上减轻了并发的压力,降低了心跳发起端的发起难度;但是并未彻底解决问题,在待探测服务的数量很大时,同样无法解决并发造成的超时误判现象,以及并发带来的正常业务接口坍塌风险。
对于轮询发出心跳探测请求的方案,所谓的轮询是按照时间维度控制发出的心跳请求。这种方式很好地解决了并发带来的发起端和待探测端的压力问题,也不会对正常业务系统带来负面的影响;但是,该方案中发起端以轮询的方式顺序发出全部的请求,那么,如果待探测服务众多,则需要很多时间完成全部的心跳请求,无法保证心跳的整体覆盖密度;同时,只能简单地将待探测服务添加到心跳探测任务序列,无法灵活控制心跳探测任务的覆盖范围。
发明内容
为解决现有存在的技术问题,本发明实施例期望提供一种心跳探测方法及系统,能避免对服务心跳状态的误判,并能解决发起端和待探测端的并发压力。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种心跳探测的方法,配置心跳探测任务信息;所述方法还包括:
根据所述心跳探测任务信息设置全局控制节点和执行节点,所述全局控制节点按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;
各个执行节点执行分配的心跳探测任务,向待探测的服务发起心跳探测请求;
收到所述心跳探测请求的待探测的服务反馈自身的心跳状态进行诊断,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。
上述技术方案中,所述心跳探测任务信息,包括:心跳探测任务的任务清单、执行节点的数量、心跳探测任务分配的规则、任务执行间隔时间、心跳探测任务读取频率。
上述技术方案中,所述判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点,包括:
如果服务及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;
如果服务及时反馈错误的探测结果,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;并返回当前心跳探测任务到执行节点再一次执行所述服务的心跳探测任务;
如果服务超时反馈正确的探测结果,则返回当前心跳探测任务到执行节点以N倍正常频率再次执行所述心跳探测任务;若及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;若执行心跳探测任务次数达到预设的最大探测次数,反馈仍为超时,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;
其中,N为正整数。
本发明实施例还提供了一种心跳探测的系统,所述系统包括:设置部件、反馈诊断部件、全局控制节点和至少一个执行节点;其中,
所述设置部件,用于配置心跳探测任务信息,并根据所述心跳探测任务信息设置全局控制节点和执行节点;
所述全局控制节点,用于按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;
各个所述执行节点,用于执行分配的心跳探测任务,向待探测的服务发起心跳探测请求;
所述反馈诊断部件,用于接收所述待探测的服务根据所述心跳探测请求反馈的心跳状态,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。
上述技术方案中,所述心跳探测任务信息,包括:心跳探测任务的任务清单、执行节点的数量、心跳探测任务分配的规则、任务执行间隔时间、心跳探测任务读取频率。
上述技术方案中,所述反馈诊断部件,具体用于:
如果服务及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;
如果服务及时反馈错误的探测结果,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;并返回当前心跳探测任务到执行节点再一次执行所述服务的心跳探测任务;
如果服务超时反馈正确的探测结果,则返回当前心跳探测任务到执行节点以N倍正常频率再次执行此心跳探测任务;若及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;若执行心跳探测任务次数达到预设的最大探测次数,反馈仍为超时,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;
其中,N为正整数。
本发明实施例所提供的心跳探测的方法及系统,配置心跳探测任务信息;根据所述心跳探测任务信息设置全局控制节点和执行节点,所述全局控制节点按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;各个执行节点执行所述心跳探测任务,向待探测的服务发起心跳探测请求;收到所述心跳探测请求的待探测的服务反馈自身的心跳状态进行诊断,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。如此,运用服务状态判断机制能够减少待探测服务心跳状态的误判。同时,通过界面化方式设置心跳探测任务信息,将心跳探测任务分成不同批次分别执行,大大减少了任务发起端和待测端的并发压力,并且针对待探测服务的增多可以动态调整心跳探测任务集群规模,增强集群扩容的灵活性。
附图说明
图1为本发明实施例心跳探测的方法实现流程示意图;
图2为本发明实施例心跳探测任务配置的结构示意图;
图3为本发明实施例心跳探测的系统组成结构示意图。
具体实施方式
为了能够更加详尽地说明本发明实施例的特点与技术内容,下面结合附图及具体实施例对本发明再作进一步详细的阐述。
本发明实施例提供的心跳探测的方法基本实现流程如图1所示,包括以下步骤:
步骤101:配置心跳探测任务信息;
这里,可以通过界面化方式来配置心跳探测任务信息;
其中,所述心跳探测任务信息包括:心跳探测任务的任务清单、执行节点的数量、心跳探测任务分配的规则、任务执行间隔时间TOUCH_TIMEOUT、心跳探测任务读取频率Rate-Common;
具体地,网络操作人员可以通过操作界面配置心跳探测任务的心跳探测任务信息,根据待探测服务的数量确定心跳探测任务的任务清单,确定任务数量后配置任务的执行节点的数量;同时,操作人员还可以设置心跳探测任务分配的规则、任务执行间隔时间和心跳探测任务读取频率,便于将待探测的心跳探测任务分配给各个执行节点执行。
如果业务上的探测需求为10分钟进行一次心跳探测任务探测,那么,可以在操作界面上设置心跳探测任务的任务执行间隔时间TOUCH_TIMEOUT=10min,即每隔10分钟,心跳探测系统对全部服务进行一次心跳探测。
这里,网络操作人员可以通过操作界面实时增减心跳探测任务中的待探测服务,或者增减执行节点的数量。
步骤102:根据所述心跳探测任务信息设置全局控制节点和执行节点,全局控制节点按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;
这里,所述全局控制节点相当于主控节点(Master),每个执行节点相当于一个工作节点(Worker),一个Master可以为至少一个Worker分配心跳探测任务,每个Worker可以对多个服务执行心跳探测。
所述心跳探测任务分配方式如图2所示,设置全局控制节点,全局控制节点根据步骤101中配置的心跳探测任务信息,按照设定的心跳探测任务分配规则将心跳探测任务分成多个心跳探测任务集合,所述心跳探测任务分配规则可以根据心跳探测任务的数量平均分配或随机分配,然后按照心跳探测任务分配规则分发心跳探测任务集合到指定的执行节点,每个执行节点用于对多个服务执行心跳探测。
其中,全局控制节点可以分为两部分区域:一是负责存储全部心跳服务的心跳结果,可以称这部分区域为心跳状态队列Overall Status Queue;二是负责向各个执行节点分发心跳探测任务,可以称这部分区域为任务调度批次分发器(Batch Controller)。
步骤103:各个执行节点执行分配的心跳探测任务,向待探测的服务发起心跳探测请求;
这里,每个心跳探测任务的执行节点接收到心跳探测任务后,依次读取并执行心跳探测任务,向待探测心跳的目标服务发起心跳探测HTTP请求;
其中,执行节点可以分为两个组:一部分用于接收全局控制节点分配的心跳探测任务集合,为常规任务单元Common Worker Queue,这部分执行节点以较高速率读取心跳探测任务,可以设置任务读取速率Rate-Common=1次读取/秒;另一部分负责存储由于心跳探测请求超时导致心跳探测失败的心跳探测任务,为疑似探测失败单元Retry WorkerQueue,这部分任务的探测频率相比Common Worker Queue要低,可以设置该部分的频率Rate-Retry为N倍的任务读取速率Rate-Common,N为正整数;较佳的,N可以取5,设置Rate-Retry=5*Rate-Common,即1次读取/5秒。
步骤104:收到所述心跳探测请求的待探测的服务反馈自身的心跳状态进行诊断,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。
具体地,接收到心跳探测请求的待探测的服务,按照自身心跳的实际情况反馈心跳状态,心跳状态可以分为几种情况:服务及时反馈正确的探测结果;服务及时反馈错误的探测结果;服务超时反馈正确的探测结果。
为了保证探测结果的准确性,减少心跳状态的误判情况,需要先由反馈诊断功能部件判断服务反馈的心跳状态的正确性:
如果服务及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;如果服务及时反馈错误的探测结果,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;并返回当前心跳探测任务到执行节点再一次执行此服务的心跳探测任务;如果服务超时反馈正确的探测结果,则返回当前心跳探测任务到执行节点以N倍正常频率再次执行此心跳探测任务;若及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;若执行心跳探测任务次数达到预设的最大探测次数,反馈仍为超时,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;
其中,N为正整数,可以由操作人员通过操作界面进行设置。
这里,判断后得到的存活或者死亡的心跳结果返回到全局控制节点中存储心跳服务的心跳结果的区域;需要再次执行的心跳探测任务,则返回到执行节点中疑似探测失败单元Retry Worker Queue,等待再一次心跳探测任务。
其中,对于服务及时反馈错误的探测结果的服务,需要再次执行此服务的心跳探测任务,则将心跳探测任务返回到执行节点中常规任务单元Common Worker Queue的队尾,等待执行心跳探测任务,再次执行次数仅为一次;对于服务超时反馈正确的探测结果的服务,则将心跳探测任务返回到执行节点中疑似探测失败单元Retry Worker Queue,等待再一次执行心跳探测任务,执行次数最大为预设的最大探测次数Max-Retry-Time,可以通过操作界面设置。
当执行节点内的Common Worker Queue和Retry Worker Queue内的心跳探测任务都已执行,那么,全部的待探测服务都已经探测完毕,服务的心跳结果也都已保存在全局控制节点的Overall Status Queue。
此时,全局控制节点已经获得了全部心跳探测任务的心跳结果,那么,全局控制节点再次将全部心跳探测任务分配给各个执行节点,再次执行心跳探测,如此反复执行上述步骤。
当达到业务要求的任务执行间隔时间TOUCH_TIMEOUT=10min时,可以在全局控制节点中的Overall Status Queue读取最新心跳结果,全局控制节点实时反馈全部服务的状态。
为实现上述心跳探测的方法,本发明实施例还提供了一种心跳探测的系统,所述系统的组成结构如图3所示,包括:设置部件11、反馈诊断部件12、全局控制节点13和至少一个执行节点14;其中,
所述设置部件11,用于配置心跳探测任务信息,并根据所述心跳探测任务信息设置全局控制节点13和至少一个执行节点14;
所述反馈诊断部件12,用于接收所述待探测的服务根据所述心跳探测请求反馈的心跳状态,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点13和/或各个执行节点14;
所述全局控制节点13,用于按照心跳探测任务信息分配心跳探测任务到至少一个执行节点14;
各个所述执行节点14,用于执行分配的心跳探测任务,向待探测的服务发起心跳探测请求。
其中,所述心跳探测任务信息,包括:心跳探测任务的任务清单、执行节点的数量、心跳探测任务分配的规则、任务执行间隔时间、心跳探测任务读取频率;
此外,反馈诊断部件12具体用于:如果服务及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点13;如果服务及时反馈错误的探测结果,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点13;并返回当前心跳探测任务到执行节点14再一次执行此服务的心跳探测任务;如果服务超时反馈正确的探测结果,则返回当前心跳探测任务到执行节点14以N倍正常频率再次执行此心跳探测任务;若及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点13;若执行心跳探测任务次数达到预设的最大探测次数,反馈仍为超时,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点13。
具体地,网络操作人员可以通过界面化的设置部件11配置心跳探测任务的心跳探测任务信息,根据待探测服务的数量确定心跳探测任务的任务清单,确定任务数量后配置任务的执行节点的数量;同时,操作人员还可以设置心跳探测任务分配的规则、任务执行间隔时间和心跳探测任务读取频率,便于全局控制节点13将待探测的心跳探测任务分配给各个执行节点14执行。
进一步地,全局控制节点13根据设置部件11配置的心跳探测任务信息,按照设定的心跳探测任务分配规则将心跳探测任务分成多个心跳探测任务集合,按照心跳探测任务分配规则分发心跳探测任务集合到指定的执行节点14,每个执行节点14用于对多个服务执行心跳探测;
在实际应用中,全局控制节点13构成控制层,至少一个执行节点14构成执行层,若干服务构成待检测层;其中,所述全局控制节点13相当于Master,每个执行节点14相当于一个Worker,一个Master可以为至少一个Worker分配心跳探测任务,每个Worker可以对多个服务执行心跳探测。
进一步地,每个心跳探测任务的执行节点14接收到心跳探测任务后,依次读取并执行心跳探测任务,向待探测心跳的目标服务发起心跳探测HTTP请求;待探测服务接收到心跳探测请求后,按照自身心跳的实际情况反馈心跳结果到反馈诊断部件12,心跳结果可以分为几种情况:服务及时反馈正确的探测结果;服务及时反馈错误的探测结果;服务超时反馈正确的探测结果。
所述反馈诊断部件12判断服务反馈的正确性,可以在反馈诊断部件12中设置反馈分发器和失败诊断器两个子部件,反馈分发器用于将及时反馈正确的服务状态返回给全局控制节点13,并将及时反馈错误或超时反馈正确的服务送入失败诊断器,失败诊断器将及时反馈错误的服务返回到执行节点14再一次执行此服务的心跳探测任务,同时认为此服务为死亡状态,返回死亡的心跳结果给全局控制节点13;并将超时反馈正确的服务返回到任务到执行节点14以N倍正常频率再次执行此心跳探测任务。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (6)

1.一种心跳探测的方法,其特征在于,配置心跳探测任务信息;所述方法还包括:
根据所述心跳探测任务信息设置全局控制节点和执行节点,所述全局控制节点按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;
各个执行节点执行分配的心跳探测任务,向待探测的服务发起心跳探测请求;
收到所述心跳探测请求的待探测的服务反馈自身的心跳状态进行诊断,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。
2.根据权利要求1所述心跳探测的方法,其特征在于,所述心跳探测任务信息,包括:心跳探测任务的任务清单、执行节点的数量、心跳探测任务分配的规则、任务执行间隔时间、心跳探测任务读取频率。
3.根据权利要求1所述心跳探测的方法,其特征在于,所述判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点,包括:
如果服务及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;
如果服务及时反馈错误的探测结果,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;并返回当前心跳探测任务到执行节点再一次执行所述服务的心跳探测任务;
如果服务超时反馈正确的探测结果,则返回当前心跳探测任务到执行节点以N倍正常频率再次执行所述心跳探测任务;若及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;若执行心跳探测任务次数达到预设的最大探测次数,反馈仍为超时,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;
其中,N为正整数。
4.一种心跳探测的系统,其特征在于,所述系统包括:设置部件、反馈诊断部件、全局控制节点和至少一个执行节点;其中,
所述设置部件,用于配置心跳探测任务信息,并根据所述心跳探测任务信息设置全局控制节点和至少一个执行节点;
所述全局控制节点,用于按照心跳探测任务信息分配心跳探测任务到至少一个执行节点;
各个所述执行节点,用于执行分配的心跳探测任务,向待探测的服务发起心跳探测请求;
所述反馈诊断部件,用于接收所述待探测的服务根据所述心跳探测请求反馈的心跳状态,判断所述心跳状态的正确性后返回判断后的心跳结果给全局控制节点和/或各个执行节点。
5.根据权利要求4所述心跳探测的系统,其特征在于,所述心跳探测任务信息,包括:心跳探测任务的任务清单、执行节点的数量、心跳探测任务分配的规则、任务执行间隔时间、心跳探测任务读取频率。
6.根据权利要求4所述心跳探测的系统,其特征在于,所述反馈诊断部件,具体用于:
如果服务及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;
如果服务及时反馈错误的探测结果,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;并返回当前心跳探测任务到执行节点再一次执行所述服务的心跳探测任务;
如果服务超时反馈正确的探测结果,则返回当前心跳探测任务到执行节点以N倍正常频率再次执行此心跳探测任务;若及时反馈正确的探测结果,则认为服务为存活状态,返回存活的心跳结果给全局控制节点;若执行心跳探测任务次数达到预设的最大探测次数,反馈仍为超时,则认为服务为死亡状态,返回死亡的心跳结果给全局控制节点;
其中,N为正整数。
CN201611264189.0A 2016-12-30 2016-12-30 一种心跳探测的方法及系统 Active CN108270634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611264189.0A CN108270634B (zh) 2016-12-30 2016-12-30 一种心跳探测的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611264189.0A CN108270634B (zh) 2016-12-30 2016-12-30 一种心跳探测的方法及系统

Publications (2)

Publication Number Publication Date
CN108270634A true CN108270634A (zh) 2018-07-10
CN108270634B CN108270634B (zh) 2021-08-24

Family

ID=62755291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611264189.0A Active CN108270634B (zh) 2016-12-30 2016-12-30 一种心跳探测的方法及系统

Country Status (1)

Country Link
CN (1) CN108270634B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109617766A (zh) * 2019-01-11 2019-04-12 视联动力信息技术股份有限公司 一种心跳处理方法和装置
CN110808874A (zh) * 2019-10-25 2020-02-18 北京大米科技有限公司 一种跨机房服务监控方法、装置、存储介质及服务器
CN111106976A (zh) * 2018-10-26 2020-05-05 北京金山云网络技术有限公司 一种cdn网络的探测方法、装置、电子设备及可读存储介质
CN111314241A (zh) * 2020-01-17 2020-06-19 新华智云科技有限公司 一种任务调度方法及调度系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026496A (zh) * 2007-01-26 2007-08-29 华为技术有限公司 一种容灾系统、方法和网络设备
CN101605056A (zh) * 2009-06-16 2009-12-16 中兴通讯股份有限公司 一种j2ee服务器监控装置及采用该装置的监控方法
CN102130950A (zh) * 2011-03-14 2011-07-20 中国科学技术大学苏州研究院 基于Hadoop集群的分布式监控系统及其监控方法
CN102546226A (zh) * 2010-12-08 2012-07-04 中国科学院声学研究所 一种基于多节点提供网络服务的系统及方法
CN103019889A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 分布式文件系统及其故障处理方法
CN103297279A (zh) * 2013-06-20 2013-09-11 烽火通信科技股份有限公司 一种多软件进程系统上软件控制的主备单盘倒换方法
CN103617087A (zh) * 2013-11-25 2014-03-05 华中科技大学 一种适合迭代计算的MapReduce优化方法
CN103763155A (zh) * 2014-01-24 2014-04-30 国家电网公司 分布式云存储系统多服务心跳监测方法
CN105101295A (zh) * 2014-05-07 2015-11-25 中国移动通信集团公司 一种心跳报文发送方法及装置
US20160269263A1 (en) * 2012-12-28 2016-09-15 Dell Products L.P Systems and methods for reducing information loss in an aggregated information handling system
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群系统的监测方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026496A (zh) * 2007-01-26 2007-08-29 华为技术有限公司 一种容灾系统、方法和网络设备
CN101605056A (zh) * 2009-06-16 2009-12-16 中兴通讯股份有限公司 一种j2ee服务器监控装置及采用该装置的监控方法
CN102546226A (zh) * 2010-12-08 2012-07-04 中国科学院声学研究所 一种基于多节点提供网络服务的系统及方法
CN102130950A (zh) * 2011-03-14 2011-07-20 中国科学技术大学苏州研究院 基于Hadoop集群的分布式监控系统及其监控方法
CN103019889A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 分布式文件系统及其故障处理方法
US20160269263A1 (en) * 2012-12-28 2016-09-15 Dell Products L.P Systems and methods for reducing information loss in an aggregated information handling system
CN103297279A (zh) * 2013-06-20 2013-09-11 烽火通信科技股份有限公司 一种多软件进程系统上软件控制的主备单盘倒换方法
CN103617087A (zh) * 2013-11-25 2014-03-05 华中科技大学 一种适合迭代计算的MapReduce优化方法
CN103763155A (zh) * 2014-01-24 2014-04-30 国家电网公司 分布式云存储系统多服务心跳监测方法
CN105101295A (zh) * 2014-05-07 2015-11-25 中国移动通信集团公司 一种心跳报文发送方法及装置
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群系统的监测方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111106976A (zh) * 2018-10-26 2020-05-05 北京金山云网络技术有限公司 一种cdn网络的探测方法、装置、电子设备及可读存储介质
CN111106976B (zh) * 2018-10-26 2022-09-02 北京金山云网络技术有限公司 一种cdn网络的探测方法、装置、电子设备及可读存储介质
CN109617766A (zh) * 2019-01-11 2019-04-12 视联动力信息技术股份有限公司 一种心跳处理方法和装置
CN110808874A (zh) * 2019-10-25 2020-02-18 北京大米科技有限公司 一种跨机房服务监控方法、装置、存储介质及服务器
CN111314241A (zh) * 2020-01-17 2020-06-19 新华智云科技有限公司 一种任务调度方法及调度系统
CN111314241B (zh) * 2020-01-17 2024-03-29 新华智云科技有限公司 一种任务调度方法及调度系统

Also Published As

Publication number Publication date
CN108270634B (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN108270634A (zh) 一种心跳探测的方法及系统
US8078674B2 (en) Server device operating in response to received request
CN107688496A (zh) 任务分布式处理方法、装置、存储介质和服务器
US7958509B2 (en) Method and system for scheduling of jobs
US7543305B2 (en) Selective event registration
US8381216B2 (en) Dynamic thread pool management
CN103620561B (zh) 用于n路运行时互操作调试的方法和系统
CN109814998A (zh) 一种多进程任务调度的方法及装置
US20070083727A1 (en) Maximizing storage system throughput by measuring system performance metrics
CN109542718B (zh) 服务调用的监控方法、装置、存储介质及服务器
US9104486B2 (en) Apparatuses, systems, and methods for distributed workload serialization
JP2014063536A (ja) コンピュータ・ベース・システムにおける資源割当て方法
CN109728981A (zh) 一种云平台故障监测方法及装置
JP4495688B2 (ja) 検証システム
CN108958975A (zh) 一种控制数据恢复速度的方法、装置及设备
CN102165426B (zh) 选择性地使用缓解来减少错误的存储器管理技术
US8769162B2 (en) Multiple path load distribution for host communication with a tape storage device
CN106991070A (zh) 实时计算方法及装置
CN112379992A (zh) 基于角色的多智能体任务协同消息传递及异常处理方法
US7478018B1 (en) System and methods for network call load simulation
CN107277022A (zh) 进程标记方法及装置
CA2624273C (en) Next site for distributed service connections
CN104184685B (zh) 数据中心资源分配方法、装置及系统
CN106210101B (zh) 消息管理系统及消息管理方法
US10585620B2 (en) Storage monitoring system for monitoring components in a storage system in a distributed manner

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant