CN1512371A - 一种大规模机群的机群管理系统及其信息处理方法 - Google Patents

一种大规模机群的机群管理系统及其信息处理方法 Download PDF

Info

Publication number
CN1512371A
CN1512371A CNA021599068A CN02159906A CN1512371A CN 1512371 A CN1512371 A CN 1512371A CN A021599068 A CNA021599068 A CN A021599068A CN 02159906 A CN02159906 A CN 02159906A CN 1512371 A CN1512371 A CN 1512371A
Authority
CN
China
Prior art keywords
node
sub
client
server end
next stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA021599068A
Other languages
English (en)
Other versions
CN1256684C (zh
Inventor
赵玉萍
肖利民
杨帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN 02159906 priority Critical patent/CN1256684C/zh
Publication of CN1512371A publication Critical patent/CN1512371A/zh
Application granted granted Critical
Publication of CN1256684C publication Critical patent/CN1256684C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种机群管理系统,除了一个作为最上一级结点的客户端和大于1个的作为最下一级结点的服务器端之外,该系统进一步包括大于等于1级的并且每一级包含大于1个的子服务结点,每一个子服务结点进一步包括一个子服务结点服务器端和一个子服务结点客户端,最上一级结点、各级子服务结点和最下一级结点通过上一级结点的客户端连接到下一级结点的服务器端、下一级结点的客户端连接到再下一级结点的服务器端的方式顺序连接。本发明同时还公开了这种机群管理系统的一种信息处理方法。通过本发明,可以管理更大规模的机群系统。

Description

一种大规模机群的机群管理系统及其信息处理方法
技术领域
本发明涉及计算机机群管理技术,具体涉及一种机群管理系统及其信息处理方法。
背景技术
计算机作为一种能进行快速运算和对数据进行复杂处理的工具,在当今的科学技术发展和日常生活中都发挥着重要的作用。而随着对计算机运算速度和处理能力的越来越高的要求,目前的单个计算机已经逐渐难以适应,因此,目前人们一方面在积极研制运算速度更快的巨型计算机,另一方面也想到了通过日益成熟的网络技术将大量的普通计算机连接在一起,通过共享它们各自的资源和统一利用它们各自的运算能力,从而实现更高的运算处理能力。于是,计算机机群系统应运而生。
机群系统就是由一组相互独立并通过高速网络互联的计算机所组成的网络系统。大量计算机连接在一起,但是如何集中并统一发挥它们的作用,从而实现更广泛的资源和更复杂的处理能力,这就需要一个对机群系统进行管理的机群管理系统。机群管理系统是一个逻辑概念,它通过对机群系统进行分工并在各个单独计算机上运行相应管理软件,使各个计算机在整个机群系统中协同工作,从而可以充分利用机群系统中的每一台计算机所拥有的资源和处理能力,通过并行处理实现更复杂的运算。
目前的机群管理系统大多采用分布式的软件结构,即客户端—服务器端结构。在这种结构中,客户端负责接收用户的请求并将其发送给各个服务器端,各个服务器端接受请求,在执行命令的同时将执行结果返回给客户端,客户端处理后再反馈给用户。其中,客户端和服务器端之间的通信机制有多种,例如java的RMI机制、corba通信机制和基于socket的通信机制等等。当结点数规模较大时,考虑到系统资源的占用情况、命令的响应速度、可靠性、稳定性等多方面的因素,目前一般采用基于socket的通信机制。
在这种socket通信机制中,每一台通讯的主机都有一个本网络环境中唯一的IP地址,一台主机上往往有多个通讯程序存在,每个这样的程序都要占用一个通讯端口。因此,通过一个IP地址和一个通讯端口就能确定一个通讯程序的位置,也就是某个程序是在某个IP上并占用了某个端口。在目前相互通信的socket网络程序中,一方称为客户程序(client),另一方称为服务程序(server),服务程序总是被动地等待连接。服务程序启动后,初始化完毕就进入等待连接状态;而客户程序启动后,首先向远程服务程序发出连接请求,服务程序收到请求后,按照一定的规则建立连接,连接完成后,两个程序就建立了一个虚拟的数据通讯链路。这些程序可以直接从自己打开的套接口读入和写出数据,而不用关心实际的数据链路。
如图1所示,通常的采用socket通信机制的机群管理系统的分布式结构采用单客户端—多服务器端的并发编程模式。这种结构只有一个客户端用来接收来自用户的请求,这种请求通常是在机群中的多个结点并行的执行命令。客户端接到这种多结点的并行命令请求后,为每个结点的请求生成一个socket连接,向这些结点的服务器进程请求连接服务。等待最后一个socket收到回应后,将结果处理后返回上层程序。
上述编程模式适用于结点数规模较少的情况,当结点规模很大时,这种结构由于操作系统本身允许同时打开的文件个数和socket通信机制对线程个数的限制,不能满足让多个结点并发执行命令的需要。因此这些系统管理方法仅能实现基本的系统管理,不具有可扩展性和管理大规模机群结点的能力。随着科学技术和网络的进一步发展和人们对计算机运算速度和处理能力的要求的进一步提高,需要在一个机群系统中包含更多的计算机,因此系统结点数规模也就更大,这时目前的机群管理系统在对更复杂和规模更大的机群系统的管理上就显得力不从心,严重地影响到大规模机群的应用,从而阻碍了科学技术的进一步发展。
发明内容
有鉴于此,为了解决现有技术的缺点,本发明的一个目的是提供一种可扩展的、可以管理大规模计算机机群的机群管理系统。
本发明的另一个目的是提供一种上述机群管理系统进行信息处理的方法。
本发明的上述目的是通过如下的技术方案予以解决的:
一种机群管理系统,包括一个作为最上一级结点的客户端和大于1个的作为最下一级结点的服务器端,并进一步包括大于等于1级的并且每一级包含大于1个的子服务结点,其中每一个子服务结点进一步包括一个子服务结点服务器端和一个子服务结点客户端,最上一级结点、各级子服务结点和最下一级结点通过上一级结点的客户端连接到下一级结点的服务器端、下一级结点的客户端连接到再下一级结点的服务器端的方式顺序连接。
在上述机群管理系统中,最上一级结点和最下一级结点之间的子服务结点的级数可以是1级,并且与每一个上一级结点连接的下一级结点的数量可以相等。同时每一级结点之间的连接可以是socket通信连接。
一种基于上述机群管理系统进行信息处理的方法,包括如下步骤:
a.最上一级结点的客户端接收到用户请求信息数据包后,提取该数据包所包含的目的服务器端的IP地址,并确定发送该数据包的逐级目的子服务结点;
b.最上一级结点将该数据包发送到步骤a确定的下一级结点的服务器端,下一级结点服务器端将该数据包转发到该级结点的客户端,该级结点的客户端将该数据包转发到再下一级结点的服务器端,并连续以这种方式将该数据包顺序转发到最下一级结点的服务器端;
c.最下一级结点的服务器端执行命令,通过和步骤b转发数据包的相反顺序将包含执行命令结果的数据包转发到最上一级结点的客户端。
在上述信息处理方法中,在建立机群管理系统的同时可以预先在最上一级结点的客户端建立一个最上一级结点到最下一级结点的树形映射关系表,步骤a中根据该树形映射关系表确定发送数据包的逐级目的子服务结点。
从本发明的技术方案可以看出,通过在现有的机群管理系统中设置子服务结点,这样运行在机群中的各个结点上的服务器端进程不再是独立的,这些服务器进程被分成几个小组,每个小组由一个子服务结点系列统一建立和最上一级结点的联系。这些分组的服务器进程不再和最上一级结点的客户端进程直接通信,而是与本组内的子服务结点进行通信。每组内的子服务结点在执行并行命令的通信过程中具有双重身份,它既是下一级结点的服务器端的客户端,又是上一级结点的客户端的服务器端。作为服务器端它接收来自上一级结点的客户端发来的连接请求和命令,但是它并不执行该命令,这时它又作为客户端将根据从上一级结点的客户端请求最终与组内的各个服务器进程建立连接,将请求命令最终发送到组内的各个服务器进程,由各个服务器进程真正执行命令,并返回给组内的子服务结点,子服务结点将汇总这些结果,将结果顺序返回给最上一级结点的客户端,也就是现有技术中的客户端。这样,使最上一级结点所需要建立的socket连接的数据大大减少,满足了操作系统本身允许同时打开的文件个数和socket通信机制对线程个数的限制,使更多的结点可以同时并发执行命令,极大地提高了机群管理系统对大规模机群系统的管理能力。
同时,由于本发明通过设置子服务结点的形式扩展系统功能,占用了较少的系统资源,并且基本保持了原有系统的执行命令的速度,在增强系统性能的同时并不会过分增加系统资源和降低处理速度。由于子服务结点与服务器端以及客户端的连接关系并没有变化,因此其内部改变对于客户端上层的用户以及服务器端下层的命令都是透明的,从而方便系统的维护。本发明可以设置多个层次的子服务结点,因此使管理的机群规模可以任意扩展,大大提高了系统的扩展性。
附图说明
图1是根据现有技术的单客户端—多服务器端系统的机群管理系统示意图;
图2是根据本发明的经过分组的单客户端—多服务器端系统的机群管理系统示意图;
图3是根据本发明的机群管理系统的信息处理流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细介绍。
本发明通过一种分组的结构对现有技术的机群管理系统进行了扩展。图2是根据本发明的经过分组的单客户端—多服务器端系统的机群管理系统示意图,为了易于说明,在图2中展示了只有一级子服务结点的情况。如图2所示,本发明将原有的客户端称为作为最上一级结点的客户端,也称为主服务结点的客户端,将原有的服务器端称为最下一级结点的服务器端,在保留了原有的客户端和服务器端的基础上,另外增加了子服务结点,这种子服务结点自身分别具有一个服务器端和一个客户端,它们分别被称为子服务结点的服务器端和子服务结点的客户端。在本发明中,将最下一级结点的服务器端进行分组,所分的组的个数等于子服务结点的数量,这样,将同一组的作为最下一级结点的服务器端和相应的一个子服务结点的客户端建立socket连接,而该子服务结点的服务器端和主服务结点的客户端建立socket连接。对每一组最下一级结点的服务器端、相应子服务结点和主服务结点的客户端都按照上述方法连接,即构成了本发明的机群管理系统。这样在执行用户的并发命令请求时,客户端不再是由一个结点组成,而是由包括主服务结点和子服务结点在内的多个结点共同组成,一个主服务结点、多个子服务结点和更多的服务器端之间形成了一个树形结构。
在本发明中,需要建立的子服务结点的数量以及和每一个子服务结点建立socket连接的服务器端的数量根据机群系统的规模而定。一般地,和每一个子服务结点建立socket连接的服务器端的数量应该相同或者大致相同,也就是对服务器端的分组最好按照平均原则,这样可以使来自主服务结点的数据包基本上平均分配给每一个子服务结点,从而避免子服务结点负荷不均的现象,保证系统的顺利工作。
在介绍了本发明的机群管理系统的结构之后,下面介绍根据本发明的机群管理系统是如何处理具体信息的。在如上所述增加了子服务结点从而建立根据本发明的机群管理系统后,也就是在建立了主服务结点、子服务结点和服务器端之间的树形结构后,首先在主服务结点建立一个它们之间的映射关系表,也就是每一个服务器端是通过哪一个子服务结点连接到主服务结点,这样在主服务结点接收到包含该服务器端IP地址的数据包后,可以明确将该数据包分发给哪一个子服务结点。随后的具体信息处理步骤如图3所示。
在本发明的机群管理系统中,当主服务结点在步骤S301接收到来自用户的请求信息数据包后,首先在步骤S302提取该信息数据包中所包含的目的服务器端的IP地址,然后在步骤S303根据映射关系表确定和上述IP地址相应的服务器端建立socket连接的是哪一个子服务结点,从而确定发送此信息数据包的目的子服务结点。在步骤S304,主服务结点将此信息数据包根据上述确定结果发送到相应的子服务结点的服务器端。
在子服务结点的服务器端接收到来自主服务结点的客户端发送的用户请求信息数据包后,并不像普通服务器端一样对该数据包进行处理,而是在步骤S305直接将此数据包转发给同样位于该子服务结点中的子服务结点客户端,子服务结点的客户端在步骤S306根据数据包所包含的IP地址将该数据包发送到具有相应IP地址的服务器端。
服务器端在接收到来自子服务结点的数据包后,在步骤S307中和现有技术一样执行命令,然后在步骤S308将包含执行命令结果的数据包返回到和它建立连接的子服务结点的客户端。此时,子服务结点的客户端同样不对该数据包进行处理,而是在步骤S309将其直接转发给子服务结点的服务器端,由子服务结点的服务器端在步骤S310将该数据包发送给主服务结点的客户端。
上述是本发明执行一次用户命令的过程。可以知道,作为主服务结点的客户端可以同时接收多个用户命令,在机群管理系统中可以同时进行多个同样的信息处理过程。在本发明中,由于主服务结点不再和每一个服务器端建立直接联系,而是和子服务结点建立连接,这样需要在主服务结点打开的文件数量和线程数量都大大减少,大量的文件和线程可以选择在子服务结点打开,从而和现有技术相比,根据本发明的机群管理系统使主服务结点可以接收更多的用户命令,并且可以执行更复杂的运算。
在实施例中展示的机群管理系统和方法中仅设置了一级子服务结点,但是本领域的技术人员很容易理解,如果系统结点规模较大,也可以设置两级、三级或更多级的子服务结点,此时只要将最上一级的客户端连接到下一级结点的服务器端,下一级结点的客户端连接到再下一级的服务器端即可,这样顺序连接,也就是形成了一个更大规模的树形结构。这样建立的系统可以应用于更大规模的机群系统,能同时并行处理更多更复杂的命令。因此可以理解,本发明所展示的实施例仅用于说明本发明的精神,而不用于限制本发明。

Claims (6)

1.一种机群管理系统,包括一个作为最上一级结点的客户端和大于1个的作为最下一级结点的服务器端,其特征是,该系统进一步包括大于等于1级的并且每一级包含大于1个的子服务结点,所述每一个子服务结点进一步包括一个子服务结点服务器端和一个子服务结点客户端,所述最上一级结点、各级子服务结点和最下一级结点通过上一级结点的客户端连接到下一级结点的服务器端、下一级结点的客户端连接到再下一级结点的服务器端的方式顺序连接。
2.根据权利要求1所述的机群管理系统,所述最上一级结点和最下一级结点之间的子服务结点的级数为1级。
3.根据权利要求1所述的机群管理系统,其特征是,所述与每一个上一级结点连接的下一级结点的数量相等。
4.根据权利要求1所述的机群管理系统,其特征是,所述每一级结点之间的连接是socket通信连接。
5.一种权利要求1所述的机群管理系统进行信息处理的方法,包括如下步骤:
a.最上一级结点的客户端接收到用户请求信息数据包后,提取该数据包所包含的目的服务器端的IP地址,并确定发送该数据包的逐级目的子服务结点;
b.最上一级结点将该数据包发送到步骤a确定的下一级结点的服务器端,所述下一级结点服务器端将该数据包转发到该级结点的客户端,该级结点的客户端将该数据包转发到再下一级结点的服务器端,并连续以这种方式将该数据包顺序转发到最下一级结点的服务器端;
c.最下一级结点的服务器端执行命令,通过和步骤b转发数据包的相反顺序将包含执行命令结果的数据包转发到最上一级结点的客户端。
6.根据权利要求5所述的信息处理方法,其特征是,在建立机群管理系统的同时预先在最上一级结点的客户端建立一个最上一级结点到最下一级结点的树形映射关系表,步骤a中根据所述树形映射关系表确定发送数据包的逐级目的子服务结点。
CN 02159906 2002-12-27 2002-12-27 一种大规模机群的机群管理系统及其信息处理方法 Expired - Fee Related CN1256684C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 02159906 CN1256684C (zh) 2002-12-27 2002-12-27 一种大规模机群的机群管理系统及其信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 02159906 CN1256684C (zh) 2002-12-27 2002-12-27 一种大规模机群的机群管理系统及其信息处理方法

Publications (2)

Publication Number Publication Date
CN1512371A true CN1512371A (zh) 2004-07-14
CN1256684C CN1256684C (zh) 2006-05-17

Family

ID=34237681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 02159906 Expired - Fee Related CN1256684C (zh) 2002-12-27 2002-12-27 一种大规模机群的机群管理系统及其信息处理方法

Country Status (1)

Country Link
CN (1) CN1256684C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667034B (zh) * 2009-09-21 2011-06-22 北京航空航天大学 一种易扩展的、支持异构集群的监控系统
CN102141973B (zh) * 2010-02-02 2013-12-25 联想(北京)有限公司 一种管理机群的方法、装置以及机群管理与监控系统
WO2014090070A1 (en) * 2012-12-13 2014-06-19 Tencent Technology (Shenzhen) Company Limited Method and system for managing servers
CN106598767A (zh) * 2016-11-29 2017-04-26 积成电子股份有限公司 基于看门狗技术的智能变电站监控服务控制台实现方法
CN106936927A (zh) * 2017-04-19 2017-07-07 武汉票据交易中心有限公司 一种基于PC客户端的socket通信方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667034B (zh) * 2009-09-21 2011-06-22 北京航空航天大学 一种易扩展的、支持异构集群的监控系统
CN102141973B (zh) * 2010-02-02 2013-12-25 联想(北京)有限公司 一种管理机群的方法、装置以及机群管理与监控系统
WO2014090070A1 (en) * 2012-12-13 2014-06-19 Tencent Technology (Shenzhen) Company Limited Method and system for managing servers
US9985859B2 (en) 2012-12-13 2018-05-29 Tencent Technology (Shenzhen) Company Limited Method and system for managing servers
CN106598767A (zh) * 2016-11-29 2017-04-26 积成电子股份有限公司 基于看门狗技术的智能变电站监控服务控制台实现方法
CN106598767B (zh) * 2016-11-29 2019-07-09 积成电子股份有限公司 基于看门狗技术的智能变电站监控服务控制台实现方法
CN106936927A (zh) * 2017-04-19 2017-07-07 武汉票据交易中心有限公司 一种基于PC客户端的socket通信方法

Also Published As

Publication number Publication date
CN1256684C (zh) 2006-05-17

Similar Documents

Publication Publication Date Title
US6915347B2 (en) Associating multiple display units in a grouped server environment
US9330052B2 (en) Transpose box based network scaling
US6922727B2 (en) Method and system for managing parallel data transfer through multiple sockets to provide scalability to a computer network
CN100337427C (zh) 动态改变数据处理网络中的连接的系统和方法
AU2011305575B2 (en) Transpose boxes for network interconnection
US7127701B2 (en) Computer processing and programming method using autonomous data handlers
US20030182261A1 (en) Queuing model for a plurality of servers
US20030191838A1 (en) Distributed intelligent virtual server
CN1622549A (zh) 用于使用对等网络协议共享应用程序的方法和设备
CN1323420A (zh) 通过多个虚拟通道传输分割的数据分组
CN102394929A (zh) 一种面向会话的云计算负载均衡系统及其方法
CN1367439A (zh) 多客户端互动的负载均衡方法及系统
US8539089B2 (en) System and method for vertical perimeter protection
CN1083193C (zh) 数据存储装置
CN103441937A (zh) 组播数据的发送方法和接收方法
EP1589424A2 (en) Vertical perimeter framework for providing application services in multi-CPU environments
JP2001521694A (ja) 非同期転送モード通信のリザーベーション方法及び装置
CN1893422A (zh) 一种基于因特网标准的分布式文件传输方法
CN1455347A (zh) 一种分布式并行调度宽带网络服务器系统
CN1256684C (zh) 一种大规模机群的机群管理系统及其信息处理方法
CN1620068A (zh) 链接集合装置和方法
CN1679303A (zh) 提供用于使用通信网的一组基本服务的方法
CN1791014A (zh) 用于光传输通信网络业务路由的设计方法
Aumage et al. Netibis: an efficient and dynamic communication system for heterogeneous grids
CN1271541C (zh) 一种机群管理系统及其信息处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060517

Termination date: 20201227