CN108076155B - 跨机房业务调度的方法、装置、系统及服务器 - Google Patents

跨机房业务调度的方法、装置、系统及服务器 Download PDF

Info

Publication number
CN108076155B
CN108076155B CN201711409339.7A CN201711409339A CN108076155B CN 108076155 B CN108076155 B CN 108076155B CN 201711409339 A CN201711409339 A CN 201711409339A CN 108076155 B CN108076155 B CN 108076155B
Authority
CN
China
Prior art keywords
node
fault
central control
nodes
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711409339.7A
Other languages
English (en)
Other versions
CN108076155A (zh
Inventor
张海龙
吴连朋
夏章抓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Hisense Media Network Technology Co Ltd
Original Assignee
Qingdao Hisense Media Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hisense Media Network Technology Co Ltd filed Critical Qingdao Hisense Media Network Technology Co Ltd
Priority to CN201711409339.7A priority Critical patent/CN108076155B/zh
Publication of CN108076155A publication Critical patent/CN108076155A/zh
Application granted granted Critical
Publication of CN108076155B publication Critical patent/CN108076155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

本申请实施例公开了一种跨机房业务调度的方法、装置、系统及服务器,包括:中心控制节点接收来自普通节点发送的心跳信息;如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点;根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。根据与中心控制节点建立心跳连接的普通节点的节点总数和故障节点与中心控制节点建立心跳连接的普通节点的节点总数比例的不同对故障节点上的业务网元的调度速率进行控制,从而降低业务中断的风险,提高了跨机房业务访问中业务的稳定性。

Description

跨机房业务调度的方法、装置、系统及服务器
技术领域
本申请涉及云计算技术领域,尤其涉及一种跨机房业务调度的方法、装置、系统及服务器。
背景技术
在云计算微服务架构下,为实现跨机房业务访问,如图1所示,每个机房均部署一套中心控制节点,每个中心控制节点控制所在机房的所有普通节点,机房之间的业务访问通过每个机房的中心控制节点来控制完成。但是由于每个机房都对应部署了中心控制节点,因此当任一机房业务空闲时,直接造成中心控制节点资源浪费。
为了解决上述问题,传统方法是选定任一机房部署中心控制节点,其他机房只部署普通节点。部署中心控制节点的机房为主机房,其他机房为非主机房,主机房与非主机房之间通过网络专线连接。如图2所示,机房2为主机房,机房1和3为非主机房,机房2中的中心控制节点不仅可以完成对本机房中的普通节点的控制,同时还可以控制机房1和3中的普通节点。
但是在业务访问过程中,当某一机房中部分普通节点异常时,主机房中的中心控制节点会下发指令删除并重新调度异常普通节点上的业务网元到其他正常的普通节点上,如果异常普通节点较多、调度不及时,则会导致大量业务中断,例如:如果连接主机房与非主机房的专线中断,主机房中心控制节点无法获取非主机房的普通节点及业务网元状态,则判定非主机房所有普通节点异常,下发指令删除并重新创建非主机房所有普通节点上的业务网元。当专线恢复后,删除指令会通过专线传输到非主机房,将所有业务网元会被删除并重新创建,业务网元被删除到重新创建的过程,导致非主机房业务中断。
发明内容
本申请提供了一种跨机房业务调度的方法及装置,以解决传统的跨机房业务访问中业务不稳定的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种跨机房业务调度方法,所述方法包括:中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态;如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点;根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。根据与中心控制节点建立心跳连接的普通节点的节点总数和故障节点与中心控制节点建立心跳连接的普通节点的节点总数比例的不同对故障节点上的业务网元的调度速率进行控制,从而降低业务中断的风险,提高了跨机房业务访问中业务的稳定性。
第二方面,本申请实施例提供了一种跨机房业务调度装置,所述装置包括:节点信息接收单元,用于中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态;节点管理单元,用于如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点;节点控制单元,用于根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。本实施例提供的跨机房业务调度装置中节点信息接收单元、节点管理单元和节点控制单元之间相互通信,根据节点信息接收单元和节点管理单元获取的信息,节点管理单元根据信息中的故障节点数和故障节点数与中心控制节点建立心跳连接的普通节点的节点总数的比例,实现对故障节点上的业务网元调度速率的控制,提高了跨机房业务访问中业务的稳定性。
第三方面,本申请实施例提供了一种服务器,包括:处理器,处理器内配置中心控制节点;用于存储处理器可执行指令的存储器;其中,处理器被配置为:中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态;如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点;根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。
第四方面,本申请实施例提供了一种跨机房业务调度系统,系统包括:服务器和多个子服务器,服务器与多个子服务器通信连接;子服务器内设置有普通节点;服务器中的中心控制节点执行跨机房业务调度方法控制管理多个子服务器中的普通节点。当子服务器中的普通节点发生故障时,服务器根据子服务器与中心控制节点建立心跳连接的普通节点的节点总数和子服务器中的故障节点数与中心控制节点建立心跳连接的普通节点的节点总数比例的不同对故障节点上的业务网元的调度速率进行控制,从而降低业务中断的风险,提高了跨机房业务访问中业务的稳定性。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种传统的机房节点布置构架图;
图2为另一种传统的机房节点布置构架图;
图3为本申请提供的跨机房业务调度方法的一种实施例的流程示意图;
图4为本申请提供的跨机房业务调度装置的一种实施例的示意图;
图5为本申请提供的一种服务器的结构示意图;
图6为本申请提供的一种跨机房业务调度系统的一种实施例的示意图。
具体实施方式
下面结合附图对本申请进行详细说明。
参见图3为本申请提供的跨机房业务调度方法的一种实施例的流程示意图,参加图3所述方法包括:
S101,中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态。
在云计算微服务架构中业务微服务实例、agent模块部署在普通节点中,agent模块定期向中心控制节点发送心跳信息。心跳信息是一种发送源发送到接收方的消息,这种消息可以让接收方确定发送源是否出现故障,故障出现的时间,以及故障恢复的时间等。在本实施例中,agent模块发出的心跳信息用于表征普通节点的状态。中心控制节点内部署有中心控制模块和节点管理模块,具体地,中心控制模块接收来自agent模块发送的心跳信息,同时中心控制模块将agent模块接收到心跳信息后,将agent模块的状态信息推送给节点管理模块,agent模块的状态信息包括心跳更新信息。
S102,如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点。
根据S101中所述,中心控制模块接收来自agent模块发送的心跳信息,如果中心控制模块在预设的第一预设时段内没有收到来自普通节点的agent模块发送的心跳信息,中心控制模块将上述agent模块第一状态信息发送给节点管理模块,节点管理模块初步判定普通节点处于异常状态。此时由于考虑到通信延迟或专线短暂性中断的问题,因此不会立即判定普通节点故障。
中心控制模块继续尝试接收agent模块发送的心跳信息,但是如果在第一预设时段后的第二预设时段内中心控制模块还是没有收到来自agent模块发送的心跳信息。则中心控制模块会向节点管理模块发送agent模块第二状态信息,节点管理模块接收到第二状态信息后获知agent模块状态未恢复,此时直接判定对应的普通节点为故障节点。
可选地,第一预设时段和第二预设时段之间存在一定的时间间隔,或者前述两个时段之间连续,即:第一预设时段的结束时间为第二预设时段的开始时间,其中,第一预设时段和第二预设时段的时长不同。
例如,将第一预设时段设置为4个心跳信息间隔,第二预设时段设置为30个心跳信息间隔,中心控制模块连续4个心跳信息间隔没收到agent模块发送的心跳信息,中心控制模块向节点管理模块发送agent模块状态信息为:连续4个心跳信息间隔未收到来自agent模块的心跳信息。节点管理模块接收到上述状态信息后,标记对应的普通节点为异常节点,继续接收中心控制模块发送的agent模块状态信息。如果再经过30个心跳信息间隔收到来自中心控制模块发送来的agent模块状态信息仍为未收到agent模块发送的心跳信息,则直接判定对应的普通节点故障。上述时间间隔的设置只是示意性的,具体实施过程中可以根据业务传输的需求进行调整。
可选地,前述两个预设时段的时长相同,例如:第一预设时段和第二预设时段均设置为接收10个心跳信息的时间间隔。
S103,;根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。
如果机房1内所有节点故障,中心控制模块无法接收到机房1内所有节点的心跳信息,对应的节点管理模块判断机房1内所有节点故障。此时,存在两种可能情况,第一就是机房1内所有节点确实都发生故障;主机房与机房1的专线中断导致无法接收到来自机房1所有节点的心跳信息。
上述不论何种情况,节点管理模块直接将业务网元调度速率控制为0,即对机房1内不做任何处理。如果是机房1内所有节点发生故障,也没有正常的普通节点进行业务网元调度,而且如果对故障节点上的业务网元删除并重新创建,会存在一定的风险,不仅不会解决节点故障的问题,还会导致业务中断。如果是专线中断的情况下,强制对故障节点上业务网元删除并重新创建,此时由于专线中断,节点管理模块发出的指令无法传送给机房1的普通节点。当专线恢复后,普通节点会接收到来自节点管理模块的指令,删除并重新创建上面的业务网元,直接导致业务中断。上述情况是节点管理模块误发指令,导致正常节点上的业务网元删除重新创建,因此在中心控制模块无法接收到机房1内所有节点的心跳信息时,本实施例中对机房1内的所有节点不作任何处理。
如果是机房内部分节点故障,此时由于不同机房中的总节点数是不同的,因此如果出现部分节点故障,则需要考虑所在机房节点的总数和故障节点数与中心控制节点建立心跳连接的普通节点的节点总数的比值。将故障节点上的业务网元调度到正常节点上时根据上述两个标准控制调度速率。
如果某机房内故障节点数与总节点数的比值小于预设比值,该预设比值小于1,假设该预设比值为0.2,因此故障节点占该机房中总节点数的比例是很小的,此时可以将故障节点上的业务网元按照第一调度速率调度到正常节点上,具体调度速率可以为10S一个节点,为快速调度。因为当前情况下正常节点的数量较多,完全可以承载来自故障节点的业务网元,因此可以实现快速的业务网元调度,实现业务的快速恢复。
如果故障节点数与总节点数的比值大于0.2,例如比值为0.55,此时故障节点数量较多。如果依然按照上述的快速调度,可能会导致正常节点无法承载故障节点上的业务网元数量,从而过载,导致业务中断,此时则需要根据与中心控制节点建立心跳连接的普通节点的节点总数对调度速率进行控制。
如果机房内节点总数为100,预设数值为80,机房内节点总数大于预设数值且小于1。此时故障节点数与总节点数的比值为0.55,虽然故障节点数为55个,但是正常节点的数量为45个,可以按照第二调度速率将故障节点上的业务网元调度到正常节点上,具体第二调度速率可以为100S一个节点,为慢速调度。因为每个业务网元对应一个业务微实例,当正常节点上的业务网元完成对应的业务需求后会从节点上进行删除,因此按照100S一个节点的调度速率,在正常节点满足一定数量时,可以实现承载来自更多故障节点上的业务网元。
但是如果机房内节点总数为50个,则按照上述的比值,故障节点数大约为28个,正常节点数为22个。此时如果按照100S一个节点的慢调度速率,也可能会导致正常节点无法承载来自故障节点的业务网元,因此此时将故障节点的业务网元的调度速率控制为0,并禁止向普通节点发送调度指令。当然,此时也可以按照大于100S一个节点的调度速率对异常节点上的业务网元进行调度。
在实际业务网元调度中,不论是快速调度还是慢速调度,可能会出现某个正常节点上已经承载了大量的业务网元,然而还会有新的业务网元从故障节点上调度过来。如果此时接收调度过来的业务网元,则会导致该节点业务过载,导致节点故障。此时该节点会将业务网元过载的信息反馈给节点管理模块,节点管理模块则停止向该节点调度新的业务网元。
从上述实施例可以看出,本实施例提供的一种跨机房业务调度方法,中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态;如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点;根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。如果机房内节点整体故障时,对所有故障节点的调度速率控制0,禁止发送调度指令。当部分节点故障,如果故障节点较多,而所在机房与中心控制节点建立心跳连接的普通节点的节点总数较少,则对故障节点上的业务网元不调度或低调度速率调度,防止强制调度业务网元,导致业务中断或瘫痪。故障节点较少或者占比较小时,提高调度速率,快速的恢复故障节点上的业务网元。通过上述调度机制,提高了跨机房业务访问中业务的稳定性。
与上述提供的一种跨机房业务调度方法的实施例相对应,本申请还提供了一种跨机房业务调度装置的实施例。
参见图4,跨机房业务调度装置包括:节点信息接收单元201、节点管理单元202和节点控制单元203。
节点信息接收单元201,用于中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态,心跳信息是由配置在普通节点中的agent模块发出的定期的消息。
节点管理单元202,用于如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点。节点管理单元202包括第一判定子单元和第二判定子单元,第一判定子单元用于中心控制节点在第一预设时段内没有收到普通节点发送的心跳信息,则判定普通节点的通信状态为异常状态。第二判定子单元用于如果在第一预设时段后的第二预设时段内中心控制节点没有收到异常状态普通节点的通信状态恢复信息,则判定异常状态普通节点为故障节点。
节点控制单元203,用于根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。节点控制单元203包括比较子单元和控制子单元,比较子单元用于比较故障节点数与中心控制节点建立心跳连接的普通节点的节点总数的比值和预设比值的大小。如果比值小于预设比值,则控制子单元控制故障节点上业务网元的调度速率为第一调度速率。如果比值大于或等于预设比值,则控制子单元根据机房的总节点数控制故障节点上业务网元的调度速率。
控制子单元在第二种情况,即故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间比值大于或等于预设比值时,根据与中心控制节点建立心跳连接的普通节点的节点总数控制故障节点上业务网元的调度速率具体为:预设一个节点预设数值,如果与中心控制节点建立心跳连接的普通节点的节点总数大于预设数值,则控制故障节点上业务网元的调度速率为第二调度速率,其中第二调度速率小于第一调度速率。如果与中心控制节点建立心跳连接的普通节点的节点总数小于或等于预设数值,则将故障节点上业务网元的调度速率调为0。
上述为机房内部分节点故障的情况,如果故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值为1,则机房内所有普通节点故障,控制子单元控制故障节点上业务网元的调度速率为0。
本申请提供的跨机房业务调度装置还包括反馈单元,用于正常节点接收来自故障节点的业务网元过载,则将业务网元过载信息反馈给控制子单元,控制子单元控制故障节点上业务网元的调度速率为0。
本实施例提供的跨机房业务调度装置中节点信息接收单元、节点管理单元和节点控制单元之间相互通信,根据节点信息接收单元和节点管理单元获取的信息,节点管理单元根据信息中的故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,实现对故障节点上的业务网元调度速率的控制,提高了跨机房业务访问中业务的稳定性。
本实施例还提供了一种服务器,参见图5为本申请实施例提供的一种服务器300,服务器300可以包括以下一个或多个组件:处理器301,存储器302,电源组件303,输入/输出(I/O)的接口304,以及通信组件305。
处理器301通常是控制服务器300的整体操作,例如业务处理、服务器通信,处理器301可以包括一个或多个处理器来执行指令,以完成上述的方法的全部或部分步骤。此外,处理器301可以包括一个或多个模块,处理器301和其他组件之间的交互。处理器301内配置中心控制节点。
存储器302被配置为存储各种类型的数据以支持在服务器300的操作。这些数据的示例包括用于在服务器300上操作的任何应用程序或方法的指令,消息,图片,视频等。存储器302可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件303为服务器300的各种组件提供电力。电源组件303可以包括电源管理系统,一个或多个电源,及其他与为服务器300生成、管理和分配电力相关联的组件。
I/O接口304为处理器301和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
通信组件305被配置为便于服务器300和其他设备之间有线或无线方式的通信。服务器300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件305经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件305还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,服务器300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器302,上述指令可由服务器300的处理器301执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
当存储介质中的指令由服务器300的处理器301执行时,使得服务器300能够执行一种跨机房业务调度方法,包括:中心控制节点接收来自普通节点发送的心跳信息,心跳信息用于判断普通节点与中心控制节点之间心跳连接的通信状态;如果中心控制节点在预设时间段内没有接收到普通节点发送的心跳信息,则判定通信状态为故障状态且处于故障状态的普通节点为故障节点;根据故障节点个数与中心控制节点建立心跳连接的普通节点的节点总数之间的比值,控制对故障节点上业务网元调度的调度速率。
本实施例还提供了一种跨机房业务调度系统,参见图6为本申请提供的跨机房业务调度系统,所述系统中包括上述实施例提供的服务器300和多个子服务器400。服务器300设置在主机房2中,子服务器400设置在主机房2和非主机房1和3中。
子服务器400也包括处理器和各个组件,子服务器400中的处理器内配置普通节点,多个服务器300通过业务专线与每个子服务器400进行通信。服务器300中的处理器301执行跨机房业务调度方法控制管理自服务器400中的普通节点。
本实施例中的子服务器400中普通节点发生故障时,服务器300根据子服务器400中与中心控制节点建立心跳连接的普通节点的节点总数和子服务器400中的故障节点数与中心控制节点建立心跳连接的普通节点的节点总数比例的不同对故障节点上的业务网元的调度速率进行控制,从而降低业务中断的风险,提高服务器之间通信的稳定,进而保证了跨机房业务访问中业务的稳定性。
本申请说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于装置、系统和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。

Claims (9)

1.一种跨机房业务调度方法,其特征在于,所述方法包括:
中心控制节点接收来自普通节点发送的心跳信息,所述心跳信息用于判断所述普通节点与所述中心控制节点之间心跳连接的通信状态;
如果所述中心控制节点在预设时间段内没有接收到所述普通节点发送的心跳信息,则判定所述通信状态为故障状态且处于所述故障状态的普通节点为故障节点;
根据所述故障节点个数与所述中心控制节点建立心跳连接的所述普通节点的节点总数之间的比值,控制对所述故障节点上业务网元调度的调度速率;
其中,在所述比值小于预设比值时,故障节点上业务网元的调度速率为第一调度速率;
在所述比值不小于预设比值时,故障节点上业务网元的调度速率小于所述第一调度速率。
2.根据权利要求1所述的跨机房业务调度方法,其特征在于,所述如果所述中心控制节点在预设时段内没有接收到所述普通节点发送的心跳信息,则判定所述通信状态为故障状态且处于所述故障状态的普通节点为故障节点,包括:
所述中心控制节点在第一预设时段内没有收到所述普通节点发送的心跳信息,则判定所述普通节点的通信状态为异常状态;
如果在所述第一预设时段后的第二预设时段内所述中心控制节点没有收到用于指示其与处于所述异常状态的普通节点之间通信的恢复信息,则判定处于所述异常状态的普通节点为故障节点。
3.根据权利要求1或2所述的跨机房业务调度方法,其特征在于,所述根据故障节点个数与所述中心控制节点建立心跳连接的所述普通节点的节点总数之间的比值,控制对所述故障节点上业务网元调度的调度速率,包括:
如果所述比值小于预设比值,则控制故障节点上业务网元的调度速率为第一调度速率,所述第一调度速率为快速调度速率;
如果所述比值大于或等于所述预设比值且小于1,则根据与所述中心控制节点建立心跳连接的所述普通节点的节点总数控制故障节点上业务网元的调度速率。
4.根据权利要求3所述的跨机房业务调度方法,其特征在于,所述根据与所述中心控制节点建立心跳连接的所述普通节点的节点总数控制故障节点上业务网元的调度速率,包括:
如果所述节点总数大于预设数值,则控制故障节点上业务网元的调度速率为第二调度速率,所述第二调度速率小于所述第一调度速率;
如果所述节点总数小于或等于预设数值,则将故障节点上业务网元的调度速率控制为0并禁止向普通节点发送调度指令。
5.根据权利要求1所述的跨机房业务调度方法,其特征在于,如果所述比值为1,则控制故障节点上业务网元的调度速率为0并禁止向普通节点发送调度指令。
6.根据权利要求1所述的跨机房业务调度方法,其特征在于,如果正常节点接收来自故障节点的业务网元过载,则所述正常节点将业务网元过载信息反馈给所述中心控制节点;
所述中心控制节点控制故障节点上业务网元的调度速率为0。
7.一种跨机房业务调度装置,其特征在于,所述装置包括:
节点信息接收单元,用于中心控制节点接收来自普通节点发送的心跳信息,所述心跳信息用于判断所述普通节点与所述中心控制节点之间心跳连接的通信状态;
节点管理单元,用于如果所述中心控制节点在预设时间段内没有接收到所述普通节点发送的心跳信息,则判定所述通信状态为故障状态且处于所述故障状态的普通节点为故障节点;
节点控制单元,用于根据所述故障节点个数与所述中心控制节点建立心跳连接的所述普通节点的节点总数之间的比值,控制对所述故障节点上业务网元调度的调度速率;
其中,在所述比值小于预设比值时,故障节点上业务网元的调度速率为第一调度速率;
在所述比值不小于预设比值时,故障节点上业务网元的调度速率小于所述第一调度速率。
8.一种服务器,其特征在于,包括:
处理器,所述处理器内配置有中心控制节点;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
中心控制节点接收来自普通节点发送的心跳信息,所述心跳信息用于判断所述普通节点与所述中心控制节点之间心跳连接的通信状态;
如果所述中心控制节点在预设时间段内没有接收到所述普通节点发送的心跳信息,则判定所述通信状态为故障状态且处于所述故障状态的普通节点为故障节点;
根据所述故障节点个数与所述中心控制节点建立心跳连接的所述普通节点的节点总数之间的比值,控制对所述故障节点上业务网元调度的调度速率;
其中,在所述比值小于预设比值时,故障节点上业务网元的调度速率为第一调度速率;
在所述比值不小于预设比值时,故障节点上业务网元的调度速率小于所述第一调度速率。
9.一种跨机房业务调度系统,其特征在于,所述系统包括:如权利要求8所述的服务器和多个子服务器,所述服务器与多个所述子服务器通信连接;
所述子服务器内配置有普通节点;
所述服务器中的中心控制节点执行权利要求1-6任一项中的跨机房业务调度方法控制管理多个所述子服务器中的普通节点。
CN201711409339.7A 2017-12-22 2017-12-22 跨机房业务调度的方法、装置、系统及服务器 Active CN108076155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711409339.7A CN108076155B (zh) 2017-12-22 2017-12-22 跨机房业务调度的方法、装置、系统及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711409339.7A CN108076155B (zh) 2017-12-22 2017-12-22 跨机房业务调度的方法、装置、系统及服务器

Publications (2)

Publication Number Publication Date
CN108076155A CN108076155A (zh) 2018-05-25
CN108076155B true CN108076155B (zh) 2021-05-28

Family

ID=62155471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711409339.7A Active CN108076155B (zh) 2017-12-22 2017-12-22 跨机房业务调度的方法、装置、系统及服务器

Country Status (1)

Country Link
CN (1) CN108076155B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110266747B (zh) * 2019-04-12 2022-04-08 创新先进技术有限公司 业务请求的机房转接方法和装置
CN110198346B (zh) * 2019-05-06 2020-10-27 北京三快在线科技有限公司 数据读取方法、装置、电子设备及可读存储介质
CN111680015B (zh) 2020-05-29 2023-08-11 北京百度网讯科技有限公司 文件资源处理方法、装置、设备和介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122108B2 (en) * 2006-05-16 2012-02-21 Oracle International Corporation Database-less leasing
CN101902357B (zh) * 2010-06-29 2014-07-16 中兴通讯股份有限公司 对业务服务器进行调度的方法和系统
CN103259688B (zh) * 2013-06-04 2017-03-08 北京搜狐新媒体信息技术有限公司 一种分布式存储系统的故障诊断方法与装置
CN105227374B (zh) * 2015-10-23 2018-05-29 浪潮(北京)电子信息产业有限公司 一种集群应用的故障迁移方法和系统
CN106254114A (zh) * 2016-05-13 2016-12-21 江苏云途腾科技有限责任公司 云主机故障迁移方法及系统
CN106933662A (zh) * 2017-03-03 2017-07-07 广东神马搜索科技有限公司 分布式系统及其调度方法和调度装置

Also Published As

Publication number Publication date
CN108076155A (zh) 2018-05-25

Similar Documents

Publication Publication Date Title
CN108076155B (zh) 跨机房业务调度的方法、装置、系统及服务器
CN108712501B (zh) 信息的发送方法、装置、计算设备以及存储介质
CN110275680B (zh) 一种双控双活存储系统
EP2887720A1 (en) Resource allocation method and device
CN111045745A (zh) 管理配置信息的方法和系统
CN103530193A (zh) 用于调节应用进程的方法和设备
CN103580906A (zh) 一种数据备份的方法、系统及服务器
JP7438355B2 (ja) ノード管理方法、装置、機器、記憶媒体及びシステム
CN107404509B (zh) 分布式服务配置系统及信息管理方法
CN102387042B (zh) 自动配置的方法和系统以及网络节点
CN102957623B (zh) 一种边界网关协议邻居的维护方法和设备
CN103188098B (zh) 一种容灾切换方法、系统以及装置
WO2021082733A1 (zh) 移动通信方法及装置、存储介质、电子装置
TW201835764A (zh) 監控服務設備之系統
US20190281477A1 (en) Power outage processing method and connection relationship obtaining method and device
CN113742031A (zh) 节点状态信息获取方法、装置、电子设备及可读存储介质
CN101547122A (zh) 恢复终端配置的方法、装置及系统
JP2009245248A (ja) データ伝送システム
CN112583630A (zh) 设备管理方法、装置、系统、设备及存储介质
CN104821889B (zh) 一种备份报文的处理方法和设备
EP3660679B1 (en) Data backup method, device and system
CN109391982B (zh) 信息包生成方法及编排管理方法、网元及存储介质
CN110620798A (zh) Ftp连接的控制方法、系统、设备和存储介质
CN108418863B (zh) 控制器集群的管理方法、sdn控制器及存储介质
CN113553194B (zh) 硬件资源管理方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant