CN101234018B - 心跳检测方法、系统和中央处理单元 - Google Patents

心跳检测方法、系统和中央处理单元 Download PDF

Info

Publication number
CN101234018B
CN101234018B CN2008100083511A CN200810008351A CN101234018B CN 101234018 B CN101234018 B CN 101234018B CN 2008100083511 A CN2008100083511 A CN 2008100083511A CN 200810008351 A CN200810008351 A CN 200810008351A CN 101234018 B CN101234018 B CN 101234018B
Authority
CN
China
Prior art keywords
heartbeat
cpu
request message
sequence number
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008100083511A
Other languages
English (en)
Other versions
CN101234018A (zh
Inventor
杨凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2008100083511A priority Critical patent/CN101234018B/zh
Publication of CN101234018A publication Critical patent/CN101234018A/zh
Application granted granted Critical
Publication of CN101234018B publication Critical patent/CN101234018B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

本发明公开了一种心跳检测方法,包括:向被监控中央处理单元(CPU)发送携带心跳序列号的心跳请求消息;对来自被监控CPU的心跳反馈消息进行分析,得到心跳检测结果。本发明还提供了一种心跳检测系统和CPU,应用于对称多处理(SMP)系统中,实现对SMP系统中的CPU状态检测,并且本发明在进行心跳检测的消息中设置心跳序列号,利用心跳序列号对消息的可靠性进行判定,本发明的CPU在一个超时周期内可进行多个心跳检测,心跳检测的精度和效率较高。

Description

心跳检测方法、系统和中央处理单元
技术领域
本发明涉及设备状态检测技术,尤其涉及一种心跳检测方法、系统和中央处理单元。
背景技术
随着计算机技术的不断发展,在实际应用中对计算机的处理能力要求也越来越高,目前的计算机越来越多的采用基于对称多处理(SMP,Symmetric MultiProcessing)系统的组成结构,以达到高处理能力的要求。SMP系统由耦合连接在高速总线上的多个中央处理单元(CPU,Central Processing Units)组成,可进行多任务的并发处理,有利于提高计算机的性能。
由于SMP系统由多个CPU组成,在实际应用中,SMP系统需要对各个CPU的生存状态进行实时监控,而在现有的SMP系统中还没有一种较为有效的用于CPU状态检测的方法。
发明内容
有鉴于此,本发明的主要目的在于提供一种心跳检测方法、系统和中央处理单元,以解决现有技术无法实现SMP系统中CPU状态检测的问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种中央处理单元CPU的心跳检测方法,包括:
采集CPU向被监控CPU发送携带心跳序列号的心跳请求消息;
采集CPU对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果;所述对心跳反馈消息进行分析得到心跳检测结果为:
提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失。
本发明还提供了一种CPU的心跳检测方法,包括:
被监控CPU接收来自采集CPU的携带心跳序列号的心跳请求消息;
被监控CPU根据所述心跳请求消息,生成携带所述心跳序列号的心跳反馈消息向所述采集CPU发送;
采集CPU提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失。
所述接收心跳请求消息为:通过中断方式接收所述心跳请求消息;
接收到来自所述采集CPU的心跳请求消息后,进一步包括:进入中断环境对所述心跳请求消息进行处理。
所述接收心跳请求消息为:通过轮询方式接收所述心跳请求消息;
所述接收心跳请求消息包括:利用侦听进程侦听来自所述采集CPU的心跳请求消息,并将侦听到的所述心跳请求消息放入消息待处理队列中进行处理。
本发明还提供了一种采集CPU,包括:相互连接的心跳请求消息发送模块和心跳反馈消息分析模块;其中,
所述心跳请求消息发送模块,用于向被监控CPU发送携带心跳序列号的心跳请求消息;
所述心跳反馈消息分析模块,用于对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果,具体为:提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失。
本发明还提供了一种CPU的心跳检测系统,包括:相互连接的采集CPU和被监控CPU;其中,
所述采集CPU,用于向所述被监控CPU发送携带心跳序列号的心跳请求消息,并对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果;具体为:提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失;
所述被监控CPU,用于根据来自所述采集CPU的携带心跳序列号的心跳请求消息,生成携带所述心跳序列号的心跳反馈消息向所述采集CPU发送。
所述采集CPU包括:相互连接的心跳请求消息发送模块和心跳反馈消息分析模块;其中,
所述心跳请求消息发送模块,用于向所述被监控CPU发送携带心跳序列号的心跳请求消息;
所述心跳反馈消息分析模块,用于对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果。
所述被监控CPU包括:相互连接的心跳请求消息接收模块和心跳反馈消息发送模块;其中,
所述心跳请求消息接收模块,用于接收来自所述采集CPU的携带心跳序列号的心跳请求消息;
所述心跳反馈消息发送模块,用于根据所述心跳请求消息,生成携带所述心跳序列号的心跳反馈消息向所述采集CPU发送。
所述心跳请求消息接收模块包括:中断接收子模块,用于通过中断方式接收所述心跳请求消息。
所述心跳请求消息接收模块还包括:轮询接收子模块,用于通过轮询方式接收所述心跳请求消息。
本发明所提供的心跳检测方法、系统和中央处理单元,应用于SMP系统中,通过指定SMP系统中的采集CPU和被监控CPU,由采集CPU对被监控CPU的心跳消息进行采集和分析,从而实现对SMP系统中CPU状态的检测,并且,本发明在进行心跳检测的消息中设置心跳序列号,利用心跳序列号对消息的可靠性进行判定,使得CPU在一个超时周期内可进行多个心跳检测,从而提高心跳检测的精度和效率。
附图说明
图1为本发明一种心跳检测方法的采集CPU侧流程图;
图2为本发明一种心跳检测方法的被监控CPU侧流程图;
图3为本发明实施例的采集CPU侧的心跳检测方法流程图;
图4为本发明实施例的被监控CPU轮询接收心跳请求消息的流程图;
图5为本发明实施例的被监控CPU中断接收心跳请求消息的流程图;
图6为本发明一种心跳检测系统的组成结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
本发明在SMP系统中实现心跳检测的方法,用于对SMP系统中的CPU状态进行检测。心跳检测是指两个或多个独立的单元之间通过某种通信手段发送约定的心跳消息,以监控各单元的生存状态的一种方法。本发明在SMP系统中的多个CPU中指定某个CPU作为心跳请求消息的发送者,同时指定为发送者的CPU还用于承担心跳反馈信息采集的任务,本发明中将作为心跳请求消息发送者的CPU称为采集CPU;SMP系统中除了采集CPU之外的其他CPU称为被监控CPU。采集CPU向SMP系统中的所有被监控CPU或部分被监控CPU发送心跳请求消息,接收到心跳请求消息的被监控CPU向采集CPU发送心跳反馈消息,以供采集CPU对心跳反馈消息进行分析,生成心跳检测结果。
本发明的心跳检测方法由采集CPU实现的操作流程,如图1所示,主要包括以下步骤:
步骤101,采集CPU向被监控CPU发送携带心跳序列号的心跳请求消息。
在本发明的SMP系统中,采集CPU为每个被监控CPU维护一个心跳序列号,如果采集CPU需要对SMP系统中的所有被监控CPU进行状态检测,则指定SMP系统中的所有被监控CPU,并向指定的被监控CPU发送携带各自心跳序列号的心跳请求消息;如果采集CPU需要对SMP系统中的一部分被监控CPU进行状态检测,则指定所需监控部分的被监控CPU,并向指定的被监控CPU发送携带各自心跳序列号的心跳请求消息。
以包含四个CPU的SMP系统为例,四个CPU分别为CPU1、CPU2、CPU3、CPU4,其中,CPU1为采集CPU,CPU2、CPU3、CPU4为被监控CPU。CPU1维护一个数组LS,用以保存各个被监控CPU当前的心跳序列号,对应CPU2、CPU3、CPU4的心跳序列号分别为LS[1]、LS[2]、LS[3]。CPU1每成功发送一条心跳请求消息后,将对应的心跳序列号加1,例如:CPU1第一次向CPU2发送心跳请求消息时,携带的心跳序列号为021,发送成功后LS[1]中对应的心跳序列号自动加1,则CPU1再次向CPU2发送心跳请求消息时,携带的心跳序列号变为022,CPU1向CPU2进行后续的心跳请求消息发送也按同样的方法更新心跳序列号;CPU1第一次向CPU3发送心跳请求消息时,携带的心跳序列号为031,发送成功后LS[2]中对应的心跳序列号自动加1,则CPU1再次向CPU3发送心跳请求消息时,携带的心跳序列号变为032,CPU1向CPU3进行后续的心跳请求消息发送也按同样的方法更新心跳序列号。由此可知,由于心跳序列号中携带的有用于区分不同CPU的前缀,例如:LS[1]中对应序列号的前两位数字02,LS[2]中对应序列号的前两位数字03,因此,对于不同CPU的心跳序列号也是不相同的。
步骤102,采集CPU对来自被监控CPU的心跳反馈消息进行分析,得到心跳检测结果。
采集CPU向指定的被监控CPU发送心跳请求消息之后,等待被监控CPU返回心跳反馈消息,当采集CPU接收到心跳反馈消息时,提取心跳反馈消息中的心跳序列号,并将提取的心跳序列号与之前发送的心跳请求消息中携带的心跳序列号进行匹配,如果匹配成功,则对心跳反馈消息进行分析,生成心跳检测结果;否则,判定心跳反馈消息丢失。
以上述的SMP系统为例,如果CPU1向CPU2发送了携带心跳序列号为0267的心跳请求消息,CPU1对来自CPU2的心跳反馈消息进行提取心跳序列号的操作,如果能够提取到0267的序列号,则表明CPU2成功返回心跳反馈消息;如果没有提取到0267的序列号,则表明CPU2没能成功返回心跳反馈消息,判定心跳反馈消息丢失。
本发明的心跳检测方法由被监控CPU实现的操作流程,如图2所示,主要包括以下步骤:
步骤201,被监控CPU接收来自采集CPU的携带心跳序列号的心跳请求消息。
本发明中的被监控CPU可通过中断方式或轮询方式接收来自采集CPU的心跳请求消息,所谓中断方式,是指被监控CPU中配置中断接收逻辑,当接收到心跳请求消息时,立即进入中断环境对心跳请求消息进行处理;所谓轮询方式,是指被监控CPU利用侦听进程侦听来自采集CPU的心跳请求消息,并将侦听到的心跳请求消息放入消息待处理队列中,在任务层面上进行处理。由此可知,中断方式适用于对反馈实时要求较高的环境,而轮询方式则可用于对反馈实时要求较低的环境。
步骤202,被监控CPU根据心跳请求消息,生成携带与心跳请求消息相同心跳序列号的心跳反馈消息向采集CPU发送。
被监控CPU提取心跳请求消息中的心跳序列号,然后构造与所接收的心跳请求消息相对应的心跳反馈消息向采集CPU发送,该心跳反馈消息中携带与心跳请求消息相同的心跳序列号。仍以上述的SMP系统为例,CPU2接收到来自CPU1的心跳请求消息,提取心跳序列号为0267,则CPU2构造携带心跳序列号为0267的心跳反馈消息发送给采集CPU。
下面结合图3所示实施例的采集CPU侧的心跳检测方法流程图,对上述图1所示的心跳检测方法进一步详细阐述,如图3所示,主要包括以下步骤:
步骤301,采集CPU向指定的被监控CPU发送携带心跳序列号的心跳请求消息。
步骤302,采集CPU等待接收被监控CPU的心跳反馈消息。
步骤303,采集CPU判断等待是否超时,如果超时,则转到步骤305;否则,转到步骤304。
采集CPU在向指定的被监控CPU发出心跳请求消息之后的一个超时周期的时间内,如果没有接收到对应的被监控CPU返回的心跳反馈消息,则判定等待超时;如果接收到对应的被监控CPU返回的心跳反馈消息,则判定等待没有超时。例如:CPU1向CPU2先后发送了心跳序列号为0266和0267的心跳请求消息,并先后启动了两个计时器进行计时,计时时间为一个预先设定的超时周期的时间,如果对应心跳序列号为0266的心跳请求消息所启动的计时器时间到时,CPU1仍然没有接收到CPU2返回的心跳序列号为0266的心跳反馈消息,则判定对心跳序列号为0266的心跳反馈消息等待超时,并停止对应的计时器;如果对应心跳序列号为0267的心跳请求消息所启动的计时器时间到之前,CPU1接收到CPU2返回的心跳序列号为0267的心跳反馈消息,则判定对心跳序列号为0267的心跳反馈消息等待没有超时,并在接收到心跳序列号为0267的心跳反馈消息后停止对应的计时器。
采集CPU查找自身所启动的计时器中是否有计时超时的计时器,如果有,则转到步骤305;如果没有,则转到步骤304。
步骤304,采集CPU判断心跳反馈消息中的心跳序列号是否匹配,如果匹配,则转到步骤306;否则,转到步骤305。
采集CPU从接收的心跳反馈消息中提取心跳序列号,并将提取的心跳序列号与之前发送的心跳请求消息的心跳序列号进行匹配。
步骤305,采集CPU判定心跳反馈消息丢失,进行异常处理,并结束该流程。
如果有计时器超时,则表明有相应的心跳反馈消息没能在超时周期内成功返回给采集CPU,例如:采集CPU为心跳序列号为0266的心跳请求消息所启动的定时器超时,则表明序列号为0266的心跳反馈消息没能在超时周期内成功返回给采集CPU,从而判定序列号为0266的心跳反馈消息丢失。
如果采集CPU所接收的心跳反馈消息的心跳序列号匹配失败,则表明该心跳反馈消息不是采集CPU所需的消息,例如:采集CPU接收到心跳序列号为0266的心跳反馈消息,在之前发送的心跳请求消息中没能匹配到心跳序列号为0266的心跳请求消息,则判定心跳序列号为0266的心跳反馈消息丢失。
步骤306,采集CPU判断是否需要对心跳反馈消息进行内容采集,如果是,则转到步骤307;否则,结束该流程。
采集CPU通过确定心跳反馈消息的内容采集标志位是否置位,从而判断是否开放了对心跳反馈消息的内容采集功能,此处的内容采集功能是指对心跳反馈消息进行进一步解析和分析。
需要指出的是,内容采集标志位是在步骤301之前,由工作人员在采集CPU上预先进行设置的。在需要采集CPU对来自被监控CPU的心跳反馈消息进行内容采集时,工作人员将采集CPU的内容采集标志位置位;如果不需要采集CPU进行心跳反馈消息的内容采集操作,则不需将采集CPU的内容采集标志位置位。在采集CPU的内容采集标志位没有置位的情况下,即使采集CPU接收到来自被监控CPU的心跳反馈消息,也不必对接收到的心跳反馈消息进行进一步解析和分析。
步骤307,采集CPU对心跳反馈消息的内容进行解析和进一步分析,得到心跳检测结果。
根据实际检测需要,采集CPU对心跳反馈消息的内容进行相应的分析,从而得到所需的心跳检测结果。例如:采集CPU记录心跳反馈消息到达时间与心跳请求消息发送时间之间的时间差,从而分析得到链路传输状态的检测结果。
在本发明的实施例中,被监控CPU接收心跳请求消息的方式包括中断方式和轮询方式两种,并且被监控CPU支持在中断方式和轮询方式之间进行切换,下面结合图4所示的实施例对轮询方式接收心跳请求消息的流程进行详细描述,如图4所示,主要包括以下步骤:
步骤401,被监控CPU判断是否有切换接收消息方式的需求,如果有,则转到步骤402;否则,转到步骤406。
被监控CPU判断用于标识接收消息方式切换需求的标志位是否置位,如果置位,则表明被监控CPU有切换接收消息方式的需求;否则,表明被监控CPU没有切换接收消息方式的需求。
需要指出的是,用于标识接收消息切换需求的标志位是在步骤401之前,由工作人员在被监控CPU上预先进行设置的。在有切换接收消息方式的需求时,工作人员将监控CPU的用于标识接收消息切换需求的标志位置位;否则,不用置位。
步骤402,被监控CPU进行接收消息方式的切换。
步骤403,被监控CPU确定切换后的接收消息方式是否为轮询方式,如果是,则转到步骤405;否则,转到步骤404。
步骤404,被监控CPU确定切换后的接收消息方式不是轮询方式,则表明是中断方式,被监控CPU挂起侦听进程,进入中断方式的心跳请求消息接收流程。对于中断方式的心跳请求消息接收流程,在后续实施例中将进行详细描述。
步骤405,被监控CPU确定切换后的接收消息方式是轮询方式,恢复被挂起的侦听进程。
步骤406,被监控CPU通过侦听进程侦听来自采集CPU的心跳请求消息。
步骤407,被监控CPU判断是否侦听到心跳请求消息,如果是,则转到步骤408;否则结束该流程。
步骤408,被监控CPU将侦听到的心跳请求消息挂在消息待处理队列中,等待任务层对心跳请求消息进行处理。
下面结合图5所示的实施例对中断方式接收心跳请求消息的流程进行详细描述,如图5所示,主要包括以下步骤:
步骤501,被监控CPU判断是否接收到消息,如果是,则转到步骤502;否则结束该流程。
步骤502,被监控CPU判断所接收消息是否为心跳请求消息,如果是,则转到步骤503;否则,转到步骤504。
被监控CPU通过判断所接收消息中是否携带有心跳序列号,如果有,则表明所接收消息是心跳请求消息;否则,表明所接收消息不是心跳请求消息。
步骤503,被监控CPU从心跳请求消息中提取心跳序列号,并构造携带该心跳序列号的心跳反馈消息返回给采集CPU,然后结束该流程。
步骤504,将接收的消息丢弃,并结束该流程。
为实现上述本发明的心跳检测方法,本发明还提供了一种心跳检测系统,如图6所示,该系统包括:相互连接的采集CPU100和被监控CPU200。其中,采集CPU100,用于向被监控CPU200发送携带心跳序列号的心跳请求消息,并对来自被监控CPU200的心跳反馈消息进行分析,得到心跳检测结果。被监控CPU200,用于根据来自采集CPU100的携带心跳序列号的心跳请求消息,生成携带与心跳请求消息相同心跳序列号的心跳反馈消息向采集CPU100发送。心跳检测系统中CPU200可以同时有多个。
其中,采集CPU100包括:相互连接的心跳请求消息发送模块110和心跳反馈消息分析模块120。心跳请求消息发送模块110,用于向被监控CPU200发送携带心跳序列号的心跳请求消息。心跳反馈消息分析模块120,用于对来自被监控CPU200的心跳反馈消息进行分析,得到心跳检测结果。
被监控CPU200包括:相互连接的心跳请求消息接收模块210和心跳反馈消息发送模块220。心跳请求消息接收模块210,用于接收来自采集CPU100的携带心跳序列号的心跳请求消息。心跳反馈消息发送模块220,用于根据心跳请求消息,生成携带与心跳请求信息相同心跳序列号的心跳反馈消息向采集CPU100发送。其中,心跳请求消息接收模块210还包括:中断接收子模块211和轮询接收子模块212。中断接收子模块211,用于通过中断方式接收心跳请求消息,当接收到心跳请求消息时,立即进入中断环境对心跳请求消息进行处理。轮询接收子模块212,用于通过轮询方式接收心跳请求信息,利用侦听进程侦听来自采集CPU100的心跳请求消息,并将侦听到的心跳请求消息放入消息待处理队列中进行处理。
综上所述,本发明所提供的心跳检测方法、系统和CPU,应用于SMP系统中的CPU状态检测,并且本发明的CPU在一个超时周期内可连续发送多个心跳检测的消息,使得一个超时周期内可进行多个心跳检测,相比现有技术中一个超时周期内只能进行一个心跳检测的方法,本发明的心跳检测精度和效率较高。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种中央处理单元CPU的心跳检测方法,其特征在于,包括:
采集CPU向被监控CPU发送携带心跳序列号的心跳请求消息;
采集CPU对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果;所述对心跳反馈消息进行分析得到心跳检测结果为:
提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失。
2.一种CPU的心跳检测方法,其特征在于,包括:
被监控CPU接收来自采集CPU的携带心跳序列号的心跳请求消息;
被监控CPU根据所述心跳请求消息,生成携带所述心跳序列号的心跳反馈消息向所述采集CPU发送;
采集CPU提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失。
3.根据权利要求2所述CPU的心跳检测方法,其特征在于,所述接收心跳请求消息为:通过中断方式接收所述心跳请求消息;
接收到来自所述采集CPU的心跳请求消息后,进一步包括:进入中断环境对所述心跳请求消息进行处理。
4.根据权利要求2所述CPU的心跳检测方法,其特征在于,所述接收心跳请求消息为:通过轮询方式接收所述心跳请求消息;
所述接收心跳请求消息包括:利用侦听进程侦听来自所述采集CPU的心跳请求消息,并将侦听到的所述心跳请求消息放入消息待处理队列中进行处理。
5.一种采集CPU,其特征在于,包括:相互连接的心跳请求消息发送模块和心跳反馈消息分析模块;其中,
所述心跳请求消息发送模块,用于向被监控CPU发送携带心跳序列号的心跳请求消息;
所述心跳反馈消息分析模块,用于对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果,具体为:提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失。
6.一种CPU的心跳检测系统,其特征在于,包括:相互连接的采集CPU和被监控CPU;其中,
所述采集CPU,用手向所述被监控CPU发送携带心跳序列号的心跳请求消息,并对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果;具体为:提取所述心跳反馈消息中的心跳序列号,并将所述心跳序列号与所述心跳请求消息的序列号进行匹配,如果匹配成功,则对所述心跳反馈消息进行分析生成心跳检测结果;否则,判定所述心跳反馈消息丢失;
所述被监控CPU,用于根据来自所述采集CPU的携带心跳序列号的心跳请求消息,生成携带所述心跳序列号的心跳反馈消息向所述采集CPU发送。
7.根据权利要求6所述CPU的心跳检测系统,其特征在于,所述采集CPU包括:相互连接的心跳请求消息发送模块和心跳反馈消息分析模块;其中,
所述心跳请求消息发送模块,用于向所述被监控CPU发送携带心跳序列号的心跳请求消息;
所述心跳反馈消息分析模块,用于对来自所述被监控CPU的心跳反馈消息进行分析,得到心跳检测结果。
8.根据权利要求6所述CPU的心跳检测系统,其特征在于,所述被监控CPU包括:相互连接的心跳请求消息接收模块和心跳反馈消息发送模块;其中,
所述心跳请求消息接收模块,用于接收来自所述采集CPU的携带心跳序列号的心跳请求消息;
所述心跳反馈消息发送模块,用于根据所述心跳请求消息,生成携带所述心跳序列号的心跳反馈消息向所述采集CPU发送。
9.根据权利要求8所述CPU的心跳检测系统,其特征在于,所述心跳请求消息接收模块包括:中断接收子模块,用于通过中断方式接收所述心跳请求消息。
10.根据权利要求8或9所述CPU的心跳检测系统,其特征在于,所述心跳请求消息接收模块还包括:轮询接收子模块,用于通过轮询方式接收所述心跳请求消息。
CN2008100083511A 2008-02-26 2008-02-26 心跳检测方法、系统和中央处理单元 Active CN101234018B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100083511A CN101234018B (zh) 2008-02-26 2008-02-26 心跳检测方法、系统和中央处理单元

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100083511A CN101234018B (zh) 2008-02-26 2008-02-26 心跳检测方法、系统和中央处理单元

Publications (2)

Publication Number Publication Date
CN101234018A CN101234018A (zh) 2008-08-06
CN101234018B true CN101234018B (zh) 2010-07-14

Family

ID=39918104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100083511A Active CN101234018B (zh) 2008-02-26 2008-02-26 心跳检测方法、系统和中央处理单元

Country Status (1)

Country Link
CN (1) CN101234018B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063356B (zh) * 2009-11-18 2014-05-21 杭州华三通信技术有限公司 一种多中央处理单元cpu心跳检测系统及方法
CN102123024B (zh) * 2011-03-17 2015-06-03 中兴通讯股份有限公司 一种时钟源设备切换选择方法、系统及装置
CN102799394B (zh) 2012-06-29 2015-02-25 华为技术有限公司 一种实现高可用集群的心跳服务的方法及装置
CN103490943A (zh) * 2013-07-04 2014-01-01 文杰 一种基于心跳信号的工业以太网丢包检测方法
CN106502944B (zh) * 2015-09-08 2019-05-07 杭州华为数字技术有限公司 计算机、pcie设备以及pcie设备的心跳检测方法
CN110288356B (zh) * 2019-05-31 2022-03-08 威富通科技有限公司 支付业务处理的方法、装置、电子设备、存储介质及系统
CN110808874B (zh) * 2019-10-25 2021-09-17 北京大米科技有限公司 一种跨机房服务监控方法、装置、存储介质及服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1281183A (zh) * 1999-07-14 2001-01-24 Lg情报通信株式会社 复制处理器及其异常双态的控制方法
CN1717658A (zh) * 2002-11-27 2006-01-04 甲骨文国际公司 集群系统的心跳机构

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1281183A (zh) * 1999-07-14 2001-01-24 Lg情报通信株式会社 复制处理器及其异常双态的控制方法
CN1717658A (zh) * 2002-11-27 2006-01-04 甲骨文国际公司 集群系统的心跳机构

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
特别是说明书第5页第6-11行.

Also Published As

Publication number Publication date
CN101234018A (zh) 2008-08-06

Similar Documents

Publication Publication Date Title
CN101234018B (zh) 心跳检测方法、系统和中央处理单元
CN100536403C (zh) 一种通信网络智能巡检的方法及设备
CN110581852A (zh) 一种高效型拟态防御系统及方法
US6724729B1 (en) System analyzer and method for synchronizing a distributed system
Venkatesan Message-optimal incremental snapshots
CN104320311A (zh) 一种scada分布式平台下的心跳检测方法
CN106355785A (zh) 一种状态监控系统
GB2463952A (en) Analysing a service processing status in a network
JP2008217735A (ja) 障害解析システム、方法、及び、プログラム
US20200006955A1 (en) Battery pack management system and control method thereof
CN110099398B (zh) 网络故障信息收集方法、网络系统、存储介质及网络设备
CN105279651B (zh) 一种交易数据监控处理方法和系统
CN106357473B (zh) 分布式多机系统、控制方法及控制装置
JP2010198491A (ja) 仮想メシンサーバおよびこれを用いた仮想マシンネットワーク監視システム
CN108762886A (zh) 虚拟机的故障检测恢复方法及系统
Vogels et al. Scalability of the microsoft cluster service
CN107528705A (zh) 故障处理方法及装置
JP4443786B2 (ja) 管理パス切り替え方法及び管理パス切り替えが可能な高可用性ストレージシステム
KR20130063866A (ko) 엠투엠 단말기 진단시스템 및 방법
CN103326897B (zh) 一种分布式计算环境通用监测装置与失效检测方法
CN106506265A (zh) 检测fpga芯片挂死的方法及装置
CN112100019B (zh) 面向大规模系统的多源故障协同分析定位方法
CN111918236B (zh) 物联网安防传感器寻网方法、装置、设备及存储介质
CN101234017A (zh) 心跳检测方法、系统和中央处理单元
US6459706B1 (en) Message-passing communication system generating task for monitoring a specific communication path

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant