集群系统及其管理和控制方法
技术领域
本发明涉及一种集群系统及其管理和控制方法,属于系统集群技术领域。
背景技术
集群系统(Cluster System)是指将多个节点通过网络互联起来,对外提供统一服务的系统,当集群系统中的某些节点故障后,可以通过集群软件的控制保证服务的连续性,从而提高系统的可靠性。
图1为现有集群系统的结构示意图,如图所示,该集群系统从逻辑上分为管理平面和控制平面,其中,管理平面用于让管理员通过图形用户界面(Graphical User Interface,简称:GUI)或者命令行界面(Command LineInterface,简称:CLI)来对集群系统进行管理,节点之间通过管理平面交换机互联;控制平面用于通过控制平面交换机将节点之间进行互联,传递心跳信息确认节点状态,同时也为业务提供控制通道;由于控制平面用于业务通信,其重要性远大于管理平面,所以控制平面通常提供双交换机,在图中表示为控制平面交换机1和控制平面交换机2。
现有技术的缺陷在于:现有集群系统中的各节点与管理平面交换机和两个控制平面交换机之间的互联均为有线互联,因此需要在节点上提供相关的有线接口,并且同时还需要在节点之间连接繁多的线缆。随着节点数量的增加,线缆的部署会越来越复杂,例如,当节点数量为100时,集群系统内部至少需要部署300根线缆。线缆部署的复杂度越高,布线难度越大,线缆维护越困难,影响了系统的可靠性。
发明内容
本发明提供一种集群系统及其管理和控制方法,用以减少线缆部署的复杂度。
本发明一方面提供一种集群系统,其中包括:
多个节点;
管理平面无线交换机,分别与所述多个节点无线连接;
控制平面无线交换机,分别与所述多个节点无线连接;
控制平面有线交换机,分别与所述多个节点有线连接
管理员终端,与所述管理平面无线交换机及所述控制平面无线交换机无线连接;
其中,所述管理平面无线交换机工作在第一频段,所述控制平面无线交换机工作在第二频段。
本发明另一方面提供一种针对集群系统的系统管理方法,其中,所述集群系统包括工作在第一频段的管理平面无线交换机和工作在第二频段的控制平面无线交换机,所述方法包括:
多个节点启动后,分别从管理平面无线交换机获取管理平面无线地址;
管理员终端启动后,从管理平面无线交换机获取管理平面终端地址;
所述管理员终端以无线方式向所述管理平面无线交换机发送第一管理请求,该第一管理请求的源地址为所述管理平面终端地址,目的地址为所述多个节点中的被管理节点的第一管理平面无线地址;
所述管理平面无线交换机根据所述第一管理平面无线地址以无线方式将所述第一管理请求转发给所述被管理节点。
本发明再一方面提供一种针集群系统的系统控制方法,其中包括:
多个节点启动后,分别从控制平面无线交换机获取控制平面无线地址并从控制平面有线交换机获取控制平面有线地址;
多个所述节点中的主控节点以有线方式向所述控制平面有线交换机发送第一控制请求,该第一控制请求的源地址为所述主控节点的第一控制平面有线地址,目的地址为多个所述节点中的被控节点的第二控制平面有线地址;
所述控制平面有线交换机根据所述第二控制平面有线地址以有线方式将所述第一控制请求转发给所述被控节点;
当所述主控节点在预设的控制等待时间内未收到由所述被控节点针对所述第一控制请求回复的第一控制响应时,以无线方式向所述控制平面无线交换机发送第二控制请求,该第二控制请求的源地址为所述主控节点的第二控制平面无线地址,目的地址为所述被控节点的第三控制平面无线地址;
所述控制平面无线交换机根据所述第三控制平面无线地址以无线方式将所述第二控制请求转发给所述被控节点;
其中,所述管理平面无线交换机工作在第一频段,所述控制平面无线交换机工作在第二频段。本发明通过采用无线连接方式代替有线连接方式减少了线缆部署的复杂度,提高了系统的可靠性和可维护性。并且,通过使管理平面无线交换机和控制平面无线交换机工作在不同的频段,可以保证所述管理平面无线交换机与控制平面无线交换机各自无线传输的信息彼此不相干扰。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有集群系统的结构示意图;
图2为本发明所述集群系统实施例的结构示意图;
图3为本发明所述系统管理方法实施例的流程意图;
图4为本发明所述系统控制方法实施例的流程意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2为本发明所述集群系统实施例的结构示意图,如图所示,该集群系统至少包括:多个节点1~N、分别与所述多个节点无线连接的管理平面无线交换机10、与所述管理平面无线交换机10无线连接的管理员终端20、分别与所述多个节点无线连接的控制平面无线交换机30以及分别与所述多个节点1~N有线连接的控制平面有线交换机50。
其中,管理平面无线交换机10是负责为管理平面数据实现无线交换的设备;
控制平面无线交换机30是负责为控制平面数据实现无线交换的设备。为了保证所述管理平面无线交换机10与控制平面无线交换机30各自无线传输的信息彼此不相干扰,可以使管理平面无线交换机10工作在第一频段,使控制平面无线交换机30工作在第二频段。
集群系统采用DHCP向管理平面无线交换机申请获取IP地址,如节点1获得管理平面无线交换机的IP地址192.168.0.100,节点2获得管理平面无线交换机的IP地址192.168.0.101,依此类推;而管理集群系统的管理员通过DHCP向管理平面无线交换机申请获取管理平面无线交换机的IP地址192.168.0.254,从而管理员可以通过无线网络实现对集群节点的管理。
本发明实施例中,可选的,第一频段为低频段,第二频段为高频段。由于高频段的传输速率较高,因此,控制平面无线交换机30占用高频段有利于保证控制平面数据的传输速率。其中,所述低频段可以基于IEEE 802.11b或者802.11g协议实现,并采用2.4GHz的载波频段;所述高频段可以基于IEEE802.11a或者802.11n协议实现,并采用5GHz的载波频段。本领域技术人员,也可以采用其他类型的无线传输协议和载波频段来实现高频段和低频段的设置,具体的不以本实施例为限。
本实施例所述集群系统通过采用无线连接方式代替有线连接方式减少了线缆部署的复杂度,提高了系统的可靠性和可维护性。具体地,与现有的有线连接方式相比,达到如下技术效果:
1、解决了现有技术中的网线、网口维护困难问题
现有技术中,有线网络需要线缆,线缆两端还需要装置网口,线缆的弯曲容易导致故障,而且网口维护时还需要考虑静电处理,随着集群节点数的增加会带来大量的维护难题。而本实施例所述集群系统在采用无线连接方式后,减少了网线使用的数量,因此也减少了上述维护难题。
2、解决了现有技术中的有线网络接口卡占用设备空间和槽位问题
现有技术中,有线网络接口卡占用节点设备空间和槽位,同时也占用节点总线带宽。而本实施例所述集群系统采用无线连接方式则更加灵活方便。
3、管理平面无线交换机和控制平面无线交换机工作在不同的频段,保证所述管理平面无线交换机与控制平面无线交换机各自无线传输的信息彼此不相干扰。
以下参照图3,说明针对图2所示系统的管理方法,如图所示,包括如下步骤:
步骤110,节点启动后,从管理平面无线交换机10获取管理平面无线地址,管理员终端20启动后,从管理平面无线交换机10获取管理平面终端地址。
其中,多个所述节点1~N的启动及所述管理员终端20的启动既包括首次上电启动,也包括上电后的重新启动;所述管理平面无线地址是管理平面无线交换机10提供的用于实现管理平面无线交换机10与各个节点1~N之间进行管理平面无线数据通信的地址,所述管理平面终端地址是管理平面无线交换机10为管理员终端20分配的管理平面无线交换机的地址。例如,管理平面无线交换机10的管理平面无线地址为192.168.0.1,分配给节点1的管理平面无线地址为192.168.0.100,分配给节点2的管理平面无线地址为192.168.0.101,分配给节点2的管理平面无线地址为192.168.0.101,分配给节点3的管理平面无线地址为192.168.0.102,分配给节点N-1的管理平面无线地址为192.168.0.103,分配给节点N的管理平面无线地址为192.168.0.104,分配给管理员终端20的管理平面无线地址为192.168.0.254。
步骤120,所述管理员终端20以无线方式向所述管理平面无线交换机10发送第一管理请求,该第一管理请求的源地址为所述管理平面终端地址,目的地址为所述多个节点中的被管理节点41的第一管理平面无线地址。
其中,所述第一管理请求是指由管理通过管理员终端20上安装的GUI或CLI输入的用于对相关节点进行管理维护的请求消息;所述被管理节点41是指在所述多个节点1~N中的将要被管理员终端20管理的节点,例如在图2中以节点3表示该被管理节点41;所述第一管理平面无线地址是由在步骤110中由管理平面无线交换机10为被管理节点41分配的管理平面无线交换机的10地址。
步骤130,所述管理平面无线交换机10根据所述第一管理平面无线地址以无线方式将所述第一管理请求转发给所述被管理节点41。
如果被管理节点41成功收到所述第一管理请求,则根据该第一管理请求的具体内容实现对被管理节点41的管理维护。
本实施例所述方法通过采用管理平面无线交换机10代替现有技术中的管理平面有线交换机以无线方式实现了管理平面的信息传输,从而减少了线缆部署的复杂度,提高了系统的可靠性和可维护性,管理平面无线交换机和控制平面无线交换机工作在不同的频段,保证所述管理平面无线交换机与控制平面无线交换机各自无线传输的信息彼此不相干扰。
另外,如果被管理节点41成功收到所述第一管理请求则可以进一步向管理员终端20回复第一管理响应,以通知管理员终端20本次管理过程成功;如果所述管理员终端20在预设的管理等待时间内没有收到由所述被管理节点41针对所述第一管理请求回复的第一管理响应时,则表明第一管理请求发送失败,为此,可以进一步包括如下步骤:
步骤140,所述节点进一步从所述控制平面无线交换机30获取控制平面无线地址;所述管理员终端20进一步从所述控制平面无线交换机30获取控制平面终端地址。
其中,所述控制平面无线地址是控制平面无线交换机30提供的用于实现控制平面无线交换机30与各个节点1~N之间进行控制平面无线数据通信的地址,所述控制平面终端地址是控制平面无线交换机提供的用于实现控制平面无线交换机30与管理员终端20之间进行控制平面无线数据通信的地址。例如,控制平面无线交换机30的控制平面无线地址为10.10.0.1,分配给节点1的控制平面无线地址为10.10.0.100,分配给节点2的控制平面无线地址为10.10.0.101,分配给节点2的控制平面无线地址为10.10.0.101,分配给节点3的控制平面无线地址为10.10.0.102,分配给节点N-1的控制平面无线地址为10.10.0.103,分配给节点N的控制平面无线地址为10.10.0.104,分配给管理员终端20的控制平面终端地址为10.10.0.254。
步骤150,所述管理员终端20以无线方式向所述控制平面无线交换机30发送第二管理请求,该第二管理请求的源地址为所述控制平面终端地址,目的地址为所述被管理节点41的第一控制平面无线地址。
其中,所述第二管理请求仍然是要对被管理节点41进行管理维护的请求消息,只是由于第一管理请求传输失败而更换了源地址和目的地址;所述第一控制平面无线地址是由在步骤140中由控制平面无线交换机30为被管理节点41分配的控制平面无线交换机的地址。
步骤160,所述控制平面无线交换机30根据所述第一控制平面无线地址以无线方式将所述第二管理请求转发给所述被管理节点41。
如果被管理节点41成功收到所述第二管理请求,则根据该第二管理请求的具体内容实现对被管理节点41的管理维护,并向控制平面无线交换机30回复针对第二管理请求的第二管理响应;如果控制平面无线交换机30在预设的管理等待时间内未收到该第二管理响应,则表明该系统无法实现正常管理,此时可以由控制平面无线交换机30发出告警信息,以提示相关维护人员进行设备排查。
本实施例所述方法通过进一步采用控制平面无线交换机30在管理平面无线交换机10不能完成管理请求的转发时代替其实现管理请求的转发,从而在不增加线缆部署复杂度的前提下,进一步提高了系统的可靠性。并且,通过使管理平面无线交换机和控制平面无线交换机分别工作在彼此不相重叠的高低频段,有利于保证所述管理平面无线交换机与控制平面无线交换机各自无线传输的信息彼此不相干扰。
以下参照图4,说明针对图2所示系统的控制方法,如图所示,包括如下步骤:
步骤210,节点启动后,从控制平面无线交换机30获取控制平面无线地址并从控制平面有线交换机50获取控制平面有线地址。
其中,多个所述节点1~N的启动既包括首次上电启动,也包括上电后的重新启动;所述控制平面无线地址是控制平面无线交换机30的为各个节点1~N分配的地址,具体举例可参见上述步骤140的相关内容;所述控制平面有线地址是控制平面有线交换机提供的用于实现控制平面有线交换机50与各个节点1~N之间进行控制平面有线数据通信的地址。
例如:控制平面有线交换机50的控制平面有线地址为172.16.0.1,分配给节点1的控制平面有线地址为172.16.0.100,分配给节点2的控制平面有线地址为172.16.0.101,分配给节点2的控制平面有线地址为172.16.0.101,分配给节点3的控制平面有线地址为172.16.0.102,分配给节点N-1的控制平面有线地址为172.16.0.103,分配给节点N的控制平面有线地址为172.16.0.104。
步骤220,多个所述节点1~N中的主控节点42以有线方式向所述控制平面有线交换机50发送第一控制请求,该第一控制请求的源地址为所述主控节点的第一控制平面有线地址,目的地址为多个所述节点1~N中的被控节点43的第二控制平面有线地址。
其中,所述主控节点42是指在所述多个节点1~N中主动发起控制请求的节点,例如在图4中以节点3表示该主控节点42;所述被控节点43是指在所述多个节点1~N中被主控节点42控制的节点,例如在图4中以节点N-1表示该被控节点43。
步骤230,所述控制平面有线交换机50根据所述第二控制平面有线地址以有线方式将所述第一控制请求转发给所述被控节点43。
如果被控节点43成功收到所述第一控制请求,则根据该第一控制请求的具体内容实现对被控节点43的控制,并且可以进一步向主控节点42回复第一控制响应,以通知主控节点42本次控制过程成功。否则,当所述主控节点42在预设的控制等待时间内未收到由所述被控节点针对所述第一控制请求回复的第一控制响应时,则可以继续执行下述步骤:
步骤240,所述主控节点42以无线方式向所述控制平面无线交换机30发送第二控制请求,该第二控制请求的源地址为所述主控节点42的第二控制平面无线地址,目的地址为所述被控节点43的第三控制平面无线地址。
其中,所述第二控制请求仍然是要对被控节点43进行控制的请求消息,只是由于第一控制请求传输失败而更换了源地址和目的地址;所述第二控制平面无线地址是在步骤210中由控制平面无线交换机30为主控节点42分配的控制平面无线交换机30的地址;所述第三控制平面无线地址是由在步骤210中由控制平面无线交换机30为被控节点43分配的控制平面无线交换机30的地址。
步骤250,所述控制平面无线交换机30根据所述第三控制平面无线地址以无线方式将所述第二控制请求转发给所述被控节点43。
如果被控节点43成功收到所述第二控制请求,则根据该第二控制请求的具体内容实现对被控节点43的控制,并向控制平面无线交换机30回复针对第二控制请求的第二控制响应;如果控制平面无线交换机30在预设的控制等待时间内未收到该第二控制响应,则表明该系统无法实现正常控制,此时可以由控制平面无线交换机30发出告警信息,以提示相关维护人员进行设备排查。
此处需要说明的是,当在步骤230中由所述主控节点42以有线方式发送所述第一控制请求时,具体可以根据预设的适用于有线传输的服务质量(Quality of Service,简称:QoS)参数以有线方式发送所述第一控制请求。其中所述QoS参数用于表示传输过程中的质量水平,例如:连接数量、宽带等。
由于有线传输方式可以提供高带宽,因此可以较高的质量水平进行传输;而在步骤240中由主控节点42以无线方式发送所述第二控制请求时,由于无线传输方式可用的带宽相对有限,而需要进行控制的业务量又很大,因此最好在进行无线传输之前,由主控节点42下调所述QoS参数,使得下调后的QoS参数适用于无线传输,然后再根据下调后的QoS参数以无线方式发送所述第二控制请求,以保证无线传输的顺利进行。
本实施例通过采用控制平面无线交换机30与控制平面有线交换机50相配合实现了信息面信息的传输,减少了线缆部署的复杂度,提高了系统的可靠性和可维护性。并且,通过使管理平面无线交换机和控制平面无线交换机工作在彼此不相重叠的高低频段,有利于保证所述管理平面无线交换机与控制平面无线交换机各自无线传输的信息彼此不相干扰。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。