CN111866094B - 一种定时任务处理方法、节点及计算机可读存储介质 - Google Patents

一种定时任务处理方法、节点及计算机可读存储介质 Download PDF

Info

Publication number
CN111866094B
CN111866094B CN202010626203.7A CN202010626203A CN111866094B CN 111866094 B CN111866094 B CN 111866094B CN 202010626203 A CN202010626203 A CN 202010626203A CN 111866094 B CN111866094 B CN 111866094B
Authority
CN
China
Prior art keywords
master node
node
timing service
detection result
timing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010626203.7A
Other languages
English (en)
Other versions
CN111866094A (zh
Inventor
石春雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Lenovo Super Integration Technology Co ltd
Original Assignee
Tianjin Lenovo Super Integration Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Lenovo Super Integration Technology Co ltd filed Critical Tianjin Lenovo Super Integration Technology Co ltd
Priority to CN202010626203.7A priority Critical patent/CN111866094B/zh
Publication of CN111866094A publication Critical patent/CN111866094A/zh
Application granted granted Critical
Publication of CN111866094B publication Critical patent/CN111866094B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1048Departure or maintenance mechanisms

Abstract

本发明公开了一种定时任务处理方法、节点及计算机可读存储介质,所述方法应用于集群系统中的从节点,所述方法包括:检测所述集群系统中初始主节点的定时服务状态,获得第一检测结果;当所述第一检测结果表征所述初始主节点的定时服务状态为无法正常启动时,符合预设条件的从节点切换为备用主节点;所述备用主节点检测所述初始主节点的定时服务状态,获得第二检测结果;当所述第二检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,所述备用主节点切换回从节点,高效地解决了分布式定时任务的管理问题。

Description

一种定时任务处理方法、节点及计算机可读存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种定时任务处理方法、节点及计算机可读存储介质。
背景技术
在很多系统中,使用定时器执行一些定时任务是非常普遍的事情。比如,订单系统的超时状态判断、缓存数据的定时更新、定时给用户发邮件,甚至是一些定期计算的报表等等。当定时任务同时部署在多台集群机器上,到达指定的定时时间时,多台机器上的定时器可能会同时启动,造成重复数据或者程序异常等问题。为避免上述问题,通常会选择在多台机器中选择一台执行定时任务,每次执行的时候会判断当前机器和指定的机器是否一致或者启动时就指定好执行机器,这种方法可以有效避免多次执行的情况,但是存在单点故障的问题,如果指定的机器出现了宕机,定时任务无法执行。
发明内容
本发明实施例提供了一种定时任务处理方法、节点及计算机可读存储介质,具有保障任务执行的特点。
本发明一方面提供一种定时任务处理方法,所述方法应用于集群系统中的从节点,所述方法包括:检测所述集群系统中初始主节点的定时服务状态,获得第一检测结果;当所述第一检测结果表征所述初始主节点的定时服务状态为无法正常启动时,符合预设条件的从节点切换为备用主节点;所述备用主节点检测所述初始主节点的定时服务状态,获得第二检测结果;当所述第二检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,所述备用主节点切换回从节点。
在一可实施方式中,所述集群系统中包括至少两个从节点,且每个所述从节点具有对应的权重值;所述符合预设条件的从节点切换为备用主节点,包括:所述每个从节点获得所述集群系统中所有从节点的权重值;比较所述所有从节点的权重值大小,确定权重值最大的从节点;所述权重最大的从节点切换为备用主节点,并启动所述备用主节点的定时服务;非权重最大的从节点将所述备用主节点确定为当前主节点对象。
在一可实施方式中,所述启动备用主节点的定时服务,包括:所述备用主节点启动自身的定时服务;非权重最大的从节点检测所述备用主节点中的定时服务状态,获得第三检测结果;当所述第三检测结果表征所述备用主节点的定时服务停止时,指示所述备用主节点启动定时服务。
在一可实施方式中,在所述权重最大的从节点切换为备用主节点,并启动所述备用主节点的定时服务之后,所述方法还包括:非权重最大的从节点检测所述初始主节点中的定时服务状态,获得第四检测结果;当所述第四检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将所述初始主节点重新确定为当前主节点对象。
在一可实施方式中,所述方法应用于集群系统中的初始主节点,所述方法包括:检测自身的定时服务状态,获得第五检测结果;当所述第五检测结果表征所述初始主节点中的定时服务停止时,重启所述初始主节点中的定时服务;检测所述集群系统中每个从节点的定时服务状态,获得第六检测结果;当所述第六检测结果表征有所述从节点的定时服务启动时,指示相应从节点停止定时服务。
在一可实施方式中,所述方法还包括:当所述第五检测结果表征所述初始主节点的定时服务状态为无法正常启动时,将自身由初始主节点切换为从节点;在切换为从节点后,所述初始主节点检测自身的定时服务状态,获得第七检测结果;当所述第七检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将自身由从节点切换回初始主节点。
本发明另一方面提供一种集群系统中的从节点,包括:第一检测模块,用于检测所述集群系统中初始主节点的定时服务状态,获得第一检测结果;第一切换模块,用于当所述第一检测结果表征所述初始主节点的定时服务状态为无法正常启动时,将符合预设条件的从节点切换为备用主节点;所述第一检测模块,还用于所述备用主节点检测所述初始主节点的定时服务状态,获得第二检测结果;所述第一切换模块,还用于当所述第二检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将所述备用主节点切换回从节点。
在一可实施方式中,所述集群系统中包括至少两个从节点,且每个所述从节点具有对应的权重值;所述第一切换模块,包括:获得子模块,用于获得集群系统中所有从节点的权重值;比较子模块,用于比较所有从节点的权重值大小,确定权重值最大的从节点;切换子模块,用于将所述权重最大的从节点切换为备用主节点,并启动所述备用主节点的定时服务;确定子模块,用于非权重最大的从节点将所述备用主节点确定为当前主节点对象。
在一可实施方式中,所述切换子模块包括:启动单元,用于所述备用主节点启动自身的定时服务;检测单元,用于非权重最大的从节点检测所述备用主节点中的定时服务状态,获得第三检测结果;指示单元,用于当所述第三检测结果表征所述备用主节点的定时服务停止时,指示所述备用主节点启动定时服务。
在一可实施方式中,所述第一检测模块,还用于在所述权重最大的从节点切换为备用主节点之后,非权重最大的从节点检测所述初始主节点中的定时服务状态,获得第四检测结果;所述节点还包括:确定模块,用于当所述第四检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将所述初始主节点重新确定为当前主节点对象。
本发明另一方面提供一种集群系统中的主节点,包括:第二检测模块,用于检测自身的定时服务状态,获得第五检测结果;重启模块,用于当所述第五检测结果表征所述初始主节点中的定时服务停止时,重启所述初始主节点中的定时服务;所述第二检测模块,还用于检测所述集群系统中每个从节点的定时服务状态,获得第六检测结果;指示模块,用于当所述第六检测结果表征有所述从节点的定时服务启动时,指示相应从节点停止定时服务。
在一可实施方式中,还包括:第二切换模块,用于当所述第五检测结果表征所述初始主节点的定时服务状态为无法正常启动时,将自身由初始主节点切换为从节点;所述第二检测模块,还用于在切换为从节点后,检测自身的定时服务状态,获得第七检测结果;所述第二切换模块,还用于当所述第七检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将自身由从节点切换回初始主节点。
本发明另一方面提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行如上述可实施方式中任一项所述的定时任务处理方法。
本发明实施例提供的一种定时任务处理方法、节点及计算机可读存储介质的定时任务处理方法,适用于集群系统,通过执行本方法,能够高效地解决定时任务的管理问题,避免初始主节点宕机以致任务逻辑崩溃。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明实施例一种定时任务处理方法的实现流程示意图;
图2为本发明实施例一种定时任务处理方法从节点切换的实现流程示意图;
图3为本发明实施例一种定时任务处理方法定时服务启动的实现流程示意图;
图4为本发明实施例一种定时任务处理方法备用主节点切换的实现流程示意图;
图5为本发明实施例一种定时任务处理方法的实施场景示意图;
图6为本发明实施例一种定时任务处理设备的模块示意图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一种定时任务处理方法的实现流程示意图。
参见图1,本发明实施例一方面提供一种定时任务处理方法,方法应用于集群系统中的从节点,方法包括:操作101,检测集群系统中初始主节点的定时服务状态,获得第一检测结果;操作102,当第一检测结果表征初始主节点的定时服务状态为无法正常启动时,符合预设条件的从节点切换为备用主节点;操作103,备用主节点检测初始主节点的定时服务状态,获得第二检测结果;操作104,当第二检测结果表征初始主节点的定时服务状态为恢复正常启动时,备用主节点切换回从节点。
本实施例提供的定时任务处理方法适用于集群系统,通过执行本方法,能够高效地解决定时任务的管理问题,避免初始主节点宕机以致任务逻辑崩溃。其中,集群系统包括多个相互独立的、互相之间通信连接的节点,且多个节点以单一系统的模式加以管理,由此构成了集群系统,其中,多个为两个或两个以上的正整数,节点可以为计算机。本方法中的集群系统中的节点包括一个初始主节点和至少一个从节点。从节点的数量可以根据实际情况进行确定。
在本方法中,初始主节点通过预设获得,在一种情况下,初始主节点可以根据网际互连协议(Internet Protocol、IP)地址进行预设,选取第一个IP地址对应的节点作为初始主节点;在另一种情况下,初始主节点可以根据计算机的编号进行预设,选取编号为初始编号的计算机作为初始主节点。本方法初始主节点的预设方法包括但不限于上述方式。初始主节点用于控制集群系统中的节点执行定时任务。从节点用于根据初始主节点的命令执行对应的定时任务。
本方法中包括,从节点检测集群系统中初始主节点的定时服务状态,获得第一检测结果。当初始主节点的定时服务启动时,初始主节点能够控制集群系统中的节点执行定时任务,当初始主节点的定时服务未启动时,初始主节点不能够用于控制集群系统中的节点执行定时任务。进一步的,从节点可以根据预设的时间间隔定时检测初始主节点的定时服务状态,以实时获得第一检测结果。时间间隔可以根据需要进行预设,如间隔三十秒检测一次、间隔一分钟检测一次或其他时间间隔。进一步需要理解的是,当从节点的数量大于等于二时,可以提前预设一个从节点执行该检测以获得第一检测结果,也可以选为每一个从节点均执行该检测操作,以使每个从节点均能够获得第一检测结果。本实施例中,选为每一个从节点均检测集群系统中初始主节点的定时服务状态。
本方法中还包括,当第一检测结果表征初始主节点的定时服务状态为无法正常启动时,符合预设条件的从节点切换为备用主节点。
第一检测结果用于表征初始主节点定时服务状态,第一检测结果包括初始主节点的定时服务启动、初始主节点的定时服务状态无法正常启动等情况。可以理解的是,初始主节点的定时服务状态为无法正常启动意味着初始主节点无法继续进行定时服务,初始主节点无法正常启动的原因包括但不限于初始主节点故障、主节点的定时任务故障、主节点主动关闭、主节点被动关闭等其他原因,当初始主节点无法继续进行定时服务时,即可认为初始主节点的定时服务状态为无法正常启动。当第一检测结果为初始主节点的定时服务状态为无法正常启动时,将符合预设条件的从节点切换为备用主节点。预设条件可以根据需要提前预设,如随机切换、根据IP地址规律切换、根据预设编号切换、根据从节点性能切换等其他预设条件进行从节点切换。需要理解的是,当从节点的数量大于等于二时,切换为备用主节点的从节点为从节点中其中一个符合预设条件的从节点,即备用主节点的数量为一个,备用主节点开启定时服务,以用于控制集群系统中的节点执行定时任务。
本方法中还包括,备用主节点检测初始主节点的定时服务状态,获得第二检测结果。在备用主节点启动定时服务以控制节点执行定时任务时,备用主节点仍然检测初始主节点的定时服务状态。同样的,此处的检测也可以根据预设的时间间隔进行多次检测,以获得第二检测结果,定时服务状态同样包括初始主节点的定时服务启动和初始主节点的定时服务无法正常启动等。
本方法中还包括,当第二检测结果表征初始主节点的定时服务状态为恢复正常启动时,备用主节点切换回从节点。当第二检测结果表征初始主节点的定时服务状态为启动时,即可认为初始主节点的定时服务状态为恢复正常启动,此时,认为初始主节点可以继续进行定时任务的控制,备用主节点切换回从节点,接受初始主节点的控制,以避免业务逻辑混乱。此时,由初始主节点控制集群系统中的节点执行定时任务。
图2为本发明实施例一种定时任务处理方法从节点切换的实现流程示意图。
参见图2,在本发明实施例中,集群系统中包括至少两个从节点,且每个从节点具有对应的权重值;操作102,符合预设条件的从节点切换为备用主节点,包括:操作1021,每个从节点获得集群系统中所有从节点的权重值;操作1022,比较所有从节点的权重值大小,确定权重值最大的从节点;操作1023,权重最大的从节点切换为备用主节点,并启动备用主节点的定时服务;操作1024,非权重最大的从节点将备用主节点确定为当前主节点对象。
在一种情况下,预设条件可以为将权重最大的从节点切换为备用主节点。在需要确定符合预设条件的从节点以切换为备用主节点时,本方法包括,每个从节点获得集群系统中所有从节点的权重值。在集群系统中,每个从节点均预设有权重值,权重值可以根据节点性能或其他条件进行提前预设,在集群系统中包括至少两个从节点时,每个节点获取整个集群系统中所有节点的权重值,以用于后续比较。本方法还包括,比较所有从节点的权重值大小,确定权重值最大的从节点。由每个从节点均与其他从节点进行比较,可以使每个从节点都能确定集群系统中权重最大的从节点。在确定权重最大的从节点后,权重最大的从节点切换为备用主节点,并启动备用主节点的定时服务,备用主节点启动定时服务以控制其他从节点的定时任务。同时,非权重最大的从节点将备用主节点确定为当前主节点对象,以接收备用主节点的控制。在每个从节点获得集群系统中所有从节点的权重值时,权重值可以是固定权重值,也可以是浮动权重值,即在一种情况下,从节点预设的权重非固定值,权重值根据从节点的当前性能发生改变,以使确定为备用主节点的从节点始终为当前性能最好的从节点。该权重比较过程可以通过加权轮询实现。
在本发明实施例中,操作1023,启动备用主节点的定时服务,包括:首先,备用主节点启动自身的定时服务;然后,非权重最大的从节点检测备用主节点中的定时服务状态,获得第三检测结果;再后,当第三检测结果表征备用主节点的定时服务停止时,指示备用主节点启动定时服务。
在权重最大的从节点启动定时服务时,为了保证该从节点的定时服务能够顺利启动,本方法包括,备用主节点启动自身的定时服务。备用主节点的定时服务启动由自身启动完成。本方法还包括,非权重最大的从节点检测备用主节点中的定时服务状态,获得第三检测结果。其他非权重最大的从节点对备用主节点中的定时服务状态进行检测,可以在备用主节点的定时服务状态未及时启动的时候,指示备用主节点启动定时服务。需要补充的是,该检测次数可以为一次或多次,当检测次数为多次时,当多次检测获得的第三检测结果均为备用主节点的定时服务停止时,进行再次加权轮询,对其他从节点进行加权轮询处理,以从其他从节点中获得权重最大的从节点,并重新执行上述步骤,以启动备用主节点启动定时服务。检测次数可以通过预设阈值进行判断,当检测次数超过预设阈值时,在其他从节点中,通过加权轮询重新确定权重最大的从节点,并切换为备用从节点。
在本发明实施例中,在操作1023,权重最大的从节点切换为备用主节点,并启动备用主节点的定时服务之后,方法还包括:首先,非权重最大的从节点检测初始主节点中的定时服务状态,获得第四检测结果;然后,当第四检测结果表征初始主节点的定时服务状态为恢复正常启动时,将初始主节点重新确定为当前主节点对象。
当初始主节点可以正常启动时,为避免初始主节点和备用主节点同时控制定时任务,本方法还包括,非权重最大的从节点检测初始主节点中的定时服务状态,获得第四检测结果。在非权重最大的从节点受控于备用主节点时,非权重最大的从节点同时检测非权重最大的从节点。当第四检测结果表征初始主节点的定时服务状态为恢复正常启动时,将初始主节点重新确定为当前主节点对象,以使非权重最大的从节点接受初始主节点的控制。从节点接受当前主节点对象控制定时服务。
图3为本发明实施例一种定时任务处理方法定时服务启动的实现流程示意图。
参见图3,在本发明实施例中,方法应用于集群系统中的初始主节点,方法包括:步骤301,检测自身的定时服务状态,获得第五检测结果;步骤302,当第五检测结果表征初始主节点中的定时服务停止时,重启初始主节点中的定时服务;步骤303,检测集群系统中每个从节点的定时服务状态,获得第六检测结果;步骤304,当第六检测结果表征有从节点的定时服务启动时,指示相应从节点停止定时服务。
本方法包括,初始主节点检测自身的定时服务状态,获得第五检测结果。检测得到初始主节点的定时服务状态为启动、检测为初始主节点的定时服务状态为未启动两种情况,当检测为初始主节点中的定时服务未启动,即第五检测结果表征初始主节点中的定时服务停止,初始主节点重启初始主节点中的定时服务以使能够继续控制定时服务。同时,在集群系统中,初始主节点检测集群系统中每个从节点的定时服务状态,获得第六检测结果,当第六检测结果表征有从节点的定时服务启动时,为避免从节点执行非初始主节点指示的其他任务,初始主节点指示相应从节点停止定时服务。
图4为本发明实施例一种定时任务处理方法备用主节点切换的实现流程示意图。
参见图4,在本发明实施例中,方法还包括:步骤305,当第五检测结果表征初始主节点的定时服务状态为无法正常启动时,将自身由初始主节点切换为从节点;步骤306,在切换为从节点后,初始主节点检测自身的定时服务状态,获得第七检测结果;步骤307,当第七检测结果表征初始主节点的定时服务状态为恢复正常启动时,将自身由从节点切换回初始主节点。
当初始主节点检测获得的第五检测结果为初始主节点的定时服务状态为无法正常启动时,初始主节点无法自身启动定时服务,此时初始主节点将自身由初始主节点切换为从节点,以接受备用主节点的控制。在初始主节点切换为从节点后,初始主节点检测自身的定时服务状态,获得第七检测结果。当第七检测结果表征初始主节点的定时服务状态为恢复正常启动时,可以认为初始主节点的定时服务已经恢复,初始主节点将自身由从节点切换回初始主节点,以继续控制其他从节点的定时服务。
为方便上述实施例的理解,以下提供一种具体实施场景进行说明。
在该场景中,定时任务的处理方法利用linux环境的命令,以shell脚本的形式进行,实现对集群系统中的节点的定时任务进行管理。该场景中,有3台机器,每台机器为一个节点。用于处理定时服务方法的脚本在每个节点中进行设置。
首先,根据IP地址,指定默认第一台机器为初始主节点501,其余机器为从节点,默认定时服务在主节点启动。利用shell脚本检查各个节点的生命周期。初始主节点中根据预设的指定间隔时间自动检测初始主节点中的定时服务状态,如果检测为初始主节点的定时服务停止,则重新启动初始主节点的定时服务,同时,在初始主节点的定时服务启动的情况下,初始主节点根据预设的间隔时间自动检测从节点的定时服务状态,如果检测为从节点中有定时服务启动,则指示从节点停止定时服务。当初始主节点多次重启定时服务仍然无法启动,且重启次数超过阈值时,初始主节点将自身由初始主节点切换为从节点,直到初始主节点检测为初始主节点的定时服务状态为恢复正常启动时,初始主节点将自身由从节点切换回初始主节点。
在本场景中,从节点包括第一从节点502和第二从节点503,从节点根据性能预设权重,例如,将第一从节点权重设置为1,将第二从节点权重设置为2。第一从节点和第二从节点均根据预设的指定间隔时间自动检测初始主节点中的定时服务状态。如果检测为初始主节点的定时服务状态为无法正常启动时,第一从节点和第二从节点通过加权轮询确定权重最高的从节点,并且权重最高的从节点切换为备用主节点,以控制从节点。非权重最高的从节点将权重最高的从节点确定为当前主节点对象,以接受备用主节点的控制。同时,备用主节点和从节点仍然检测初始主节点的定时服务状态,当检测为初始主节点的定时服务状态为恢复正常启动时,备用主节点切换回从节点,从节点将初始主节点确定为当前主节点对象。
图6为本发明实施例一种定时任务处理设备的模块示意图。
参见图6,本发明实施例另一方面提供一种集群系统中的从节点,包括:第一检测模块601,用于检测集群系统中初始主节点的定时服务状态,获得第一检测结果;第一切换模块602,用于当第一检测结果表征初始主节点的定时服务状态为无法正常启动时,将符合预设条件的从节点切换为备用主节点;第一检测模块601,还用于备用主节点检测初始主节点的定时服务状态,获得第二检测结果;第一切换模块602,还用于当第二检测结果表征初始主节点的定时服务状态为恢复正常启动时,将备用主节点切换回从节点。
在本发明实施例中,集群系统中包括至少两个从节点,且每个从节点具有对应的权重值;第一切换模块602,包括:获得子模块6021,用于获得集群系统中所有从节点的权重值;比较子模块6022,用于比较所有从节点的权重值大小,确定权重值最大的从节点;切换子模块6023,用于将权重最大的从节点切换为备用主节点,并启动备用主节点的定时服务;确定子模块6024,用于非权重最大的从节点将备用主节点确定为当前主节点对象。
在本发明实施例中,切换子模块包括6023:启动单元60231,用于备用主节点启动自身的定时服务;检测单元60232,用于非权重最大的从节点检测备用主节点中的定时服务状态,获得第三检测结果;指示单元60233,用于当第三检测结果表征备用主节点的定时服务停止时,指示备用主节点启动定时服务。
在本发明实施例中,第一检测模块601,还用于在权重最大的从节点切换为备用主节点之后,非权重最大的从节点检测初始主节点中的定时服务状态,获得第四检测结果;节点还包括:确定模块603,用于当第四检测结果表征初始主节点的定时服务状态为恢复正常启动时,将初始主节点重新确定为当前主节点对象。
本发明实施例另一方面提供一种集群系统中的主节点,包括:第二检测模块604,用于检测自身的定时服务状态,获得第五检测结果;重启模块605,用于当第五检测结果表征初始主节点中的定时服务停止时,重启初始主节点中的定时服务;第二检测模块604,还用于检测集群系统中每个从节点的定时服务状态,获得第六检测结果;指示模块606,用于当第六检测结果表征有从节点的定时服务启动时,指示相应从节点停止定时服务。
在本发明实施例中,还包括:第二切换模块607,用于当第五检测结果表征初始主节点的定时服务状态为无法正常启动时,将自身由初始主节点切换为从节点;第二检测模块604,还用于在切换为从节点后,检测自身的定时服务状态,获得第七检测结果;第二切换模块607,还用于当第七检测结果表征初始主节点的定时服务状态为恢复正常启动时,将自身由从节点切换回初始主节点。
本发明实施例另一方面提供一种计算机可读存储介质,存储介质包括一组计算机可执行指令,当指令被执行时用于执行如上述可实施方式中任一项的定时任务处理方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (3)

1.一种定时任务处理方法,其特征在于,所述方法应用于集群系统中的初始主节点,所述方法包括:
检测自身的定时服务状态,获得第五检测结果;
当所述第五检测结果表征所述初始主节点中的定时服务停止时,重启所述初始主节点中的定时服务;
检测所述集群系统中每个从节点的定时服务状态,获得第六检测结果;
当所述第六检测结果表征有所述从节点的定时服务启动时,指示相应从节点停止定时服务;
所述方法还包括:
当所述第五检测结果表征所述初始主节点的定时服务状态为无法正常启动时,将自身由初始主节点切换为从节点;
在切换为从节点后,所述初始主节点检测自身的定时服务状态,获得第七检测结果;
当所述第七检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将自身由从节点切换回初始主节点。
2.一种集群系统中的主节点,其特征在于,包括:
第二检测模块,用于检测自身的定时服务状态,获得第五检测结果;
重启模块,用于当所述第五检测结果表征初始主节点中的定时服务停止时,重启所述初始主节点中的定时服务;
所述第二检测模块,还用于检测所述集群系统中每个从节点的定时服务状态,获得第六检测结果;
指示模块,用于当所述第六检测结果表征有所述从节点的定时服务启动时,指示相应从节点停止定时服务;
还包括:
第二切换模块,用于当所述第五检测结果表征所述初始主节点的定时服务状态为无法正常启动时,将自身由初始主节点切换为从节点;
所述第二检测模块,还用于在切换为从节点后,检测自身的定时服务状态,获得第七检测结果;
所述第二切换模块,还用于当所述第七检测结果表征所述初始主节点的定时服务状态为恢复正常启动时,将自身由从节点切换回初始主节点。
3.一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行如权利要求1所述的定时任务处理方法。
CN202010626203.7A 2020-07-01 2020-07-01 一种定时任务处理方法、节点及计算机可读存储介质 Active CN111866094B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010626203.7A CN111866094B (zh) 2020-07-01 2020-07-01 一种定时任务处理方法、节点及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010626203.7A CN111866094B (zh) 2020-07-01 2020-07-01 一种定时任务处理方法、节点及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111866094A CN111866094A (zh) 2020-10-30
CN111866094B true CN111866094B (zh) 2023-10-31

Family

ID=72989008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010626203.7A Active CN111866094B (zh) 2020-07-01 2020-07-01 一种定时任务处理方法、节点及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111866094B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277377A (zh) * 2022-05-19 2022-11-01 亿点云计算(珠海)有限公司 基于分布式云的服务获取方法、装置、终端及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4939752A (en) * 1989-05-31 1990-07-03 At&T Company Distributed timing recovery for a distributed communication system
US7260630B1 (en) * 2003-08-18 2007-08-21 At&T Intellectual Property, Inc. Method, system, and storage medium for collecting SNMP bandwidth data
CN103001798A (zh) * 2012-11-22 2013-03-27 华为技术有限公司 管理应用服务的方法、装置和系统
CN106331098A (zh) * 2016-08-23 2017-01-11 东方网力科技股份有限公司 一种服务器集群系统
CN109271280A (zh) * 2018-08-30 2019-01-25 重庆富民银行股份有限公司 存储故障快速切换处理方法
JP2019032709A (ja) * 2017-08-08 2019-02-28 東芝三菱電機産業システム株式会社 分散システム
CN110399207A (zh) * 2019-06-29 2019-11-01 苏州浪潮智能科技有限公司 分布式存储系统中定时任务处理方法、系统及存储介质
CN110912780A (zh) * 2019-12-13 2020-03-24 无锡华云数据技术服务有限公司 一种高可用集群检测方法、系统及受控终端
CN110945491A (zh) * 2017-08-04 2020-03-31 索尼半导体解决方案公司 通信设备、通信方法、程序和通信系统
CN111200532A (zh) * 2020-01-02 2020-05-26 广州虎牙科技有限公司 数据库集群节点主从切换的方法、装置、设备和介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254100B (zh) * 2016-07-27 2019-04-16 腾讯科技(深圳)有限公司 一种数据容灾方法、装置和系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4939752A (en) * 1989-05-31 1990-07-03 At&T Company Distributed timing recovery for a distributed communication system
US7260630B1 (en) * 2003-08-18 2007-08-21 At&T Intellectual Property, Inc. Method, system, and storage medium for collecting SNMP bandwidth data
CN103001798A (zh) * 2012-11-22 2013-03-27 华为技术有限公司 管理应用服务的方法、装置和系统
CN106331098A (zh) * 2016-08-23 2017-01-11 东方网力科技股份有限公司 一种服务器集群系统
CN110945491A (zh) * 2017-08-04 2020-03-31 索尼半导体解决方案公司 通信设备、通信方法、程序和通信系统
JP2019032709A (ja) * 2017-08-08 2019-02-28 東芝三菱電機産業システム株式会社 分散システム
CN109271280A (zh) * 2018-08-30 2019-01-25 重庆富民银行股份有限公司 存储故障快速切换处理方法
CN110399207A (zh) * 2019-06-29 2019-11-01 苏州浪潮智能科技有限公司 分布式存储系统中定时任务处理方法、系统及存储介质
CN110912780A (zh) * 2019-12-13 2020-03-24 无锡华云数据技术服务有限公司 一种高可用集群检测方法、系统及受控终端
CN111200532A (zh) * 2020-01-02 2020-05-26 广州虎牙科技有限公司 数据库集群节点主从切换的方法、装置、设备和介质

Also Published As

Publication number Publication date
CN111866094A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN107995029B (zh) 选举控制方法及装置、选举方法及装置
CN105933407B (zh) 一种实现Redis集群高可用的方法及系统
EP3142011A1 (en) Anomaly recovery method for virtual machine in distributed environment
CN103838593A (zh) 恢复虚拟机的方法、系统及控制器、服务器、寄宿主机
CN110417600B (zh) 分布式系统的节点切换方法、装置及计算机存储介质
CN111866094B (zh) 一种定时任务处理方法、节点及计算机可读存储介质
CN111212127A (zh) 一种存储集群及业务数据的维护方法、装置和存储介质
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN114007241A (zh) ZigBee系统及其网关设备、网关切换方法和装置
CN105515838A (zh) 一种服务配置方法及ha集群系统
CN106897128B (zh) 一种分布式应用退出方法、系统以及服务器
CN112737844A (zh) 冗余系统中主备切换的方法和装置
JP6789685B2 (ja) ネットワークの信頼性を改善するシステム又は方法
JP2012181131A (ja) 蓄電管理装置
CN115314361A (zh) 一种服务器集群管理方法及其相关组件
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统
JP2003345620A (ja) 多ノードクラスタシステムのプロセス監視方法
CN114791835A (zh) 程序重启方法及装置、存储介质及电子装置
CN112367386A (zh) 基于Ignite的自动化运维方法、装置及计算机设备
CN111934909A (zh) 主备机ip资源切换方法、装置、计算机设备和存储介质
WO2020103627A1 (zh) 一种基于虚机容灾的业务自愈方法、设备和存储介质
JPH07111685B2 (ja) システム稼動維持方式
CN107870801B (zh) 虚拟机高可用功能自动开通方法、装置和系统
CN115001956B (zh) 服务器集群的运行方法、装置、设备及存储介质
CN108874454B (zh) 一种目标驱动程序的自适应启动方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant