CN1310821A - 用于实现工作组服务器阵列的方法和装置 - Google Patents
用于实现工作组服务器阵列的方法和装置 Download PDFInfo
- Publication number
- CN1310821A CN1310821A CN00800947A CN00800947A CN1310821A CN 1310821 A CN1310821 A CN 1310821A CN 00800947 A CN00800947 A CN 00800947A CN 00800947 A CN00800947 A CN 00800947A CN 1310821 A CN1310821 A CN 1310821A
- Authority
- CN
- China
- Prior art keywords
- group
- workgroup
- processor
- server
- servers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1017—Server selection for load balancing based on a round robin mechanism
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1034—Reaction to server failures by a load balancer
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
- Multi Processors (AREA)
Abstract
一种实现理想用于基于web的内部网,外部网和因特网应用的工作组服务器阵列的方法和装置。本发明的服务器阵列包括配备有基于工作组的直接访问型服务器和模块化控制装置(1)的多个组/工作组计算机(408),产生了基于工作组的容错和故障恢复能力,提供基于控制台的监控和管理支持,并且以最优性能适应高度可能性的可升级的基于web的应用。这些工作组服务器可以用作基本构建块来构建大规模服务器群集,使得可以同时服务更多的用户。此外,产生了基于工作组服务器阵列的架构,用于构建故障高度可用性的可升级的关键任务服务器群集,从而为基于enerris的内部网,外部网和因特网关键任务应用提供分布式计算服务。
Description
本申请要求于1999年5月20日提交的临时申请No.60/135,318的优先权,该申请是1996年11月1日提交的序列号为No.08/742,741的名为“使用按请求直接访问的工作组服务器的一种多服务器交互式视频点播电视系统”的专利申请的后续部分,而No.08/742,741申请的专利号为No.6,049,823,2000年4月11日授权。
本发明通常涉及一种服务器群集,具体涉及一种用于实现工作组服务器阵列的方法和装置,及其用于构造各种不同的服务器群集以适应可升级的基于web的内部网,外部网以及因特网的重要任务应用的架构。
本发明的服务器阵列包括配备有基于工作组的直接访问型服务器和控制设备的组/工作组计算机,这一点在申请人的专利号为No.5,802,391名为“不使用网络操作系统的由组/工作组计算机共享的直接访问型组/工作组服务器”中有描述。而且,本发明的服务器阵列还创建了一种基于工作组服务器阵列的架构,可以利用它来构造各种高度可用的,可升级的和处理重要任务的服务器群集。
具有创新意义的因特网技术的爆炸性发展极大地影响了应用的开发和使用的方式。曾经是静态“手册型物品”的数以万计的因特网网站正迅速发展成为具有处理能力的高度交互式因特网应用。在大企业的内部,开发者正使用Web技术把企业应用合并成大规模的内部网。在企业之间,业务伙伴们正建立安全的外部网以简化他们的供应环节和改进通信。
由于基于web的应用正在因特网上,在企业内部网和外部网上迅速膨涨,他们所执行的功能也变得越来越重要。而且,由于企业会继续把基于web的技术应用于重要任务,他们需要更成熟的方法使其应用高度可用并可升级。
为了达到高度可升级性和高度可用性的要求,现在的趋势正向涉及到大量服务器一起工作的系统也就是服务器群集的方向发展,以提供终端用户所请求的应用。而且,大规模基于web的服务要求一种建立服务器群集的架构以便能够适应可用性,可升级性,可靠性,工作性能,管理以及安全方面的要求。
但是,现有的通过使用多个独立的服务器来建立高度可升级性,高度可用性和完成重要任务的基于web应用的服务器群集的技术倾向于产生基于单个服务器的3层架构,也就是后面所指的SS-3架构。这种SS-3架构通常需要作为负载均衡器的第一层组件,作为应用服务器的第二层组件,作为数据库和文件服务器的第三层组件。每个单独的服务器可以是基于PC机的,基于超微型机的或基于小型计算机的服务器,包括多个具有并行处理能力且使用WinNT,Solaris,Linux,和Unix操作系统的CPU。
在SS-3架构的基础上,可以建立基于web应用的高度实用性和可升级性的服务器群集。但是,该架构也会产生下面的缺点。
1.关于每层组件:
a)负载均衡器-分析所有的输入通信量并把每个单独的基于web的查询/请求重定向到所连接的可用的第二层应用服务器之一。负载均衡器根据请求的性质和被执行了负载均衡的web应用服务器的可用性以及能力向特定的第二层的基于web的应用服务器分配请求。有三种基本类型的负载均衡器:开关,软件型均衡器和应用型均衡器。但是,如果所述负载均衡器中的任一个压力过大,因特网连接都可能会发生堵塞。
b)应用服务器-从第一层负载均衡器接收分配的任务,执行基于web的应用,连接第三层数据库和文件服务器以进行面向应用的数据检索。但是,每个应用服务器可能会由于不同的硬件和软件配置而各不相同,因此会产生负载均衡器管理上的复杂性。另外,每个应用服务器既要处理基于忠实性的也要处理基于非忠实性的查询,因此就会产生具有各种不同级别安全尺度的非相干的程序组。而且,每个应用服务器都不具有远程引导能力,除非包括一个基于网络访问的辅助处理器,使得如果服务器的主处理器发生故障时,可以触发由其它基于网络的管理服务器访问的辅助处理器以重新引导主处理器。
c)数据库/文件服务器-是基于客户服务器的服务器,用于处理来自所有被认为是客户的第二层应用服务器的数据库/文件查询。因为基于忠实性和基于非忠实性的通信量之间没有差别,因此用于基于忠实性和基于非忠实性的面向应用的数据全都在一个中心文件服务器和一个数据库服务器中进行分类,因此如果太多的查询同时发生就会产生潜在的数据库/文件检索瓶颈。而且,如果这些文件和数据库服务器作为数据中心的一部分来实现,管理这样一个数据中心的复杂性就会非常高,以上的该数据中心包括链接到多个SAN(存储区网络)使能的存储设备上的多个被分配的数据库和文件服务器。正是由于这样一个事实使得以客户为中心的服务器和以服务器为中心的服务器都需要复杂的数据库软件程序。但是,把面向应用的数据和商业敏感性数据集中在一个数据中心中是不理想的,因为必须推出特别的安全措施如防火墙过滤以防基于web的浏览行为所造成的潜在破坏。
d)层间通信开关-第一层负载均衡器与第二层应用服务器之间以及该应用服务器与第三层文件和数据库服务器之间都需要这样的层间通信开关。由于每个组件都是基于网络的,因此这些服务器之间的所有通信都是通过这两个开关来处理的,因此就会造成不必要的层间通信量的瓶颈和管理上的系统开销。
e)更多的层即意味着更多的组件,这会造成更多的单点故障-在SS-3架构的基础上,所有的负载均衡器,应用服务器,文件和数据库服务器,路由器和开关都应有一个防故障(fail-over)方案,这样就会保证重要任务应用不发生故障。即使开发出全面的防故障方案,其它不会有效和有成本效益,这是因为会涉及到太多的硬件配置和软件程序。
2.服务器群集管理:
a)由于与层间通信相关的每个组件的复杂性,对基于单个服务器的服务器群集的监控和管理也会变得非常复杂。单个软件的升级倾向于产生软件的不兼容,这是由于这样一个事实,因为有太多的所涉及到的软件程序都需要由各个销售商进行升级。
b)全部的工作性能并不容易优化。一旦服务器群集在SS-3架构的基础上建立起来,它就必须满足这样的标准:至少能够平稳地处理稳态操作并适应峰值时刻的操作而不发生小故障。但是由于没有能够被测量的分布的小规模最优点,因此就会在控制稳态操作时增加不确定因素和在处理峰值时刻的操作时限制必要的测量。
c)如果由于高速web访问非常流行而造成太多的数据库为中心的请求要被同时服务,那么高度可用性以及有成本效益的线性可升级性就会很难维持。目前,基于web的查询是基于56kbps的窄带传输速率并且相关的服务都集中在网页发送。但是,如果流行的数据传输速率由于使用电缆调制解调器或ADSL而上升到1Mbps或更高并且流行的服务集中在个人数据库为中心的网页发送,那么SS-3架构在维持高可用性方面就会遇到困难。这是因为在服务器群集内产生了原来通信量的20倍的通信量,对防故障的负载均衡器的容量造成了很大压力,并且在层间通信之间产生瓶颈并且严重降低了基于SS-3的可升级性的回报。
上述的服务器群集是以单服务器架构为基础的,因此不能有效并且成本有效地为大规模的基于web的重要任务的应用提供高度可用性和可升级性的解决方案。
本发明的目的是通过解决上述不足并且在建立基于工作组的服务器阵列以及其架构方面寻求技术突破后得以实现的。经过这样的技术突破,便可以更有效和更成本有效地实现用于大规模基于web的重要任务应用的高度可用性和高度可升级的解决方案。
本发明使用了多个组/工作组计算机,下文中称之为组处理器(TeamProcessor),他们与多个基于工作组的直接访问型服务器,下文中称之为组服务器(TeamServer)一起被安置在工作组计算机机架上,下文中称之为组机架(TeamChassis),这一点在申请人的专利No.5,802,391中有述。在这些构件块的基础上可以实现各种不同的工作组服务器阵列配置。
本发明进一步包括一个独特的模块化的基于工作组的控制和监控装置,下文中称之为组控制板(TeamPanel),它提供本地和远程监控与重新引导管理,任务交换,负载均衡以及故障防止控制功能。另外,任意特定配置的工作组服务器阵列可以由单独的一个或多个级联在一起的组控制板来调节。
本发明进一步还包括多个上述的组构件块,这样可以构建用于各种配置的优选的工作组服务器阵列以提供多个独特的基础功能。在优选的数据结构和数据流的基础上,这些基础功能包括(但不局限于):内部/外部受控任务交换,基于工作组的设备共享,负载均衡,防故障,监控和管理,安全和性能检测。
本发明及其相关架构通过除去不必要的基于网络访问的组件并替换以基于工作组的直接访问型组件解决了传统的基于单个服务器的架构中的固有不足,因此也就减少了不必要的网络通信量,降低了单点故障的数量。
而且,基于特定应用的多个工作组服务器阵列可以形成为工作组服务器群集,这样就可以适应基于该特定的应用之上的高度可用和可升级的重要任务web服务。另外,可以以串行和并行方式构建多个基于不同的应用的工作组服务器群集以提供大规模的多应用的基于web的解决方案,用于适应数千用户的同时使用而保持宽带服务质量(QOS)不变。
本发明的上述方面及优点以及它的其它方面和优点通过参照下面的附图对下面的一个优选实施例的详细描述可以得到全面的理解。
图1A为一原理框图,描述了作为用于建立优选的工作组服务器阵列的装置之一的优选的工作组处理器,也就是组处理器。
图1B为一原理框图,描述了作为用于建立优选的工作组服务器阵列的装置之一的优选的工作组计算机机架,也就是组机架,该组机架用于安置多个组处理器。
图1C为一原理框图,描述了作为本发明的一个实施例的一个优选的集成结构,它包括通过多个链路被联网和形成工作组的8个优选的组处理器以及4个优选的组服务器。
图1D为一原理框图,描述了优选的模块化的基于工作组的监控和管理,也就是组控制板,它包括4个基本控制单元和1个具有双处理器的用于连接多达4个组处理器的主控制单元,并且可以封装在一个具有内置前控制板的组机架内。
图1E为一原理框图,描述了主组控制板与辅助组控制板的模块化级联,可以容纳8个组处理器的结构。
图2A为一原理框图,描述了根据本发明系统的一个实施例的一个优选的工作组服务器阵列,它包括8个组处理器,4个基于SCSI磁盘的组服务器以及2个级联的组控制板,所有以上组件都被均匀封装在2个组机架内。
图2B为一原理框图,描述了根据本发明系统的一个实施例的一个优选的工作组服务器阵列,它包括4个组处理器,2个基于SCSI磁盘的组服务器以及1个组控制板,所有以上组件都封装在1个组机架内。
图2C为一原理框图,描述了根据本发明系统的一个实施例的一个优选的工作组服务器阵列,它包括12个组处理器,6个利用双SCSI通道链接的基于SCSI磁盘的组服务器以及3个级联的组控制板,所有以上组件都被均匀封装在3个组机架内。
图3A为一原理框图,描述了一个优选的8个组处理器服务器阵列上优选的数据结构和数据流的系统化实现,在该服务器阵列中可以实现多个与内部操作,防故障,负载均衡,安全性,管理和最优性能检测一起使用的基础功能。
图3B为一原理框图,描述了包括多个单个应用工作组服务器阵列的工作组服务器群集,其中上述每个工作组服务器阵列在最优性能检测的基础上提供一个互斥的数据库存储段,这样就可以实现基于工作组间的基础功能,例如高度的可用性和可升级性。
图4为一原理框图,描述了一个优选的利用FC-AL集线器或FC开关集成在一起的基于各种安全区的面向应用的工作组服务器群集与后端数据库服务器,这样就在一个分布式的计算环境中为基于web的重要任务的应用创造出一个优选的数据中心/仓库结构。
下面将在用作优选的工作组服务器阵列的构件块的组/工作组计算机的基础上对图1-4中所描述的本发明的优选实施例进行说明。
组/工作组计算机为一组计算机,它们通过工作组对等链路而组合在一起,并且还可以通过工作组服务器链路而与大量直接访问型工作组服务器相连。这些细节在申请人的专利号为No.5,530,892的名为“具有用于工作组协调器的交叉相互连接转换的具有单独的显示器和键盘的单机架多计算机系统”中以及申请人的专利号No.5,802,391的名为“不使用网络操作系统的组/工作组计算机所共享的直接访问型组/工作组服务器”中都有详细描述。另外,工作组对等链路以及工作组服务器链路(如果使用相同的物理层电缆)可以连接在一起,能够运行基于存储的和基于通信的数据链路协议,例如改进的SCSI,这一点在上述的两个专利中都有所描述。这些进行工作组连接的计算机,后面称之为组处理器,都基于相同的或不同的CPU/OS平台,并且这些直接访问型工作组服务器,后面称之为组服务器,可以设计为由不同的操作系统所支持的相同的文件系统。组服务器可以由基于磁盘的,基于磁带的,和基于光盘的驱动器来实现,也可以由容错磁盘阵列来实现。
每个基于特定OS的组处理器都安装有以该特写OS为中心的工作组服务器链路接口卡,也就是组服务器卡,以把所有的组服务器识别为直接访问型本地驱动器。但是,每个组服务器只有一个主组处理器有绝对特权进行读,写,和创建文件。而且,一个物理硬盘驱动器和一个容错型磁盘阵列可以被分区并格式化为多个逻辑驱动器,每个逻辑驱动器由各个不同的作为主处理器的组处理器进行控制。即使所有这些组处理器都连接在内部网络链路上并且安装有网络操作系统,但是这些组服务器在组处理器中并没有被映射为可网络访问的驱动器。
而且,高度集成的组/工作组计算机,后面称之为TeamPro计算机,包括多个组处理器,它们都封装在一个工作组组机架内,这一点在申请人的专利号为5,577,205的名为“用于多计算机系统的机架”中进行了描述。TeamPro计算机进一步又配备有监控和管理装置,也就是组控制板,用来通过一个控制台监视器和一个基于RAP(远程访问端口)的设备控制和连接每个组处理器。它又包括2个串行端口,1个键盘,1个系统LED,1个蜂鸣器和1个复位按钮,这一点在专利号为No.5,530,892的名为“具有用于工作组协调器的交叉相互连接转换的具有单独的显示器和键盘的单机架多计算机系统”中进行了描述。
如图1A所示,基于PC计算平台的优选的基于组/工作组计算机的组处理器通常包括:一路,二路或四路Intel Pentium CPU,具有128MBRAM的基于WINNT PCI的主板,软盘接口模块,IDE接口模块,VGA卡模块,声卡模块,USB模块,并行接口模块,RAP模块,使用以太网的网络链路LAN模块,使用以太网的工作组对等网络链路模块,使用SCSI的工作组对等链路模块和使用SCSI的工作组服务器链路模块。组处理器进一步又配备有基于模块的外设驱动器和装置如:软盘,IDE盘和光驱,VGA显示器,基于USB的数码相机,鼠标,基于以太网的网络集线器和开关,SCSI盘和磁带驱动器,打印机和一套扬声器。
如图1B所示,优选的工作组计算机机架,也就是组机架,包含4个基于CPU卡的组处理器和大量基于模块的驱动器和设备,例如基于IDE的磁盘和光盘驱动器,SCSI驱动器和组控制板。同样的组机架还可以包含2个基于主板的组处理器,带有各种基于模块的驱动器和设备。组机架进一步还可以配备内部冗余电源,智能电源管理,可热交换磁盘和风扇,和外部UPS。
可以进行工作组连接的形成工作组服务器阵列的单独的组处理器的最大数量受内部工作组服务器链路的限制。如果工作组服务器链路使用SCSI-Ⅱ,那么能够确保正确的数据传输的有效长度为6米,可以连接的节点数为16。这就是为什么能够封装至少2个组处理器的组机架被用于支持更好的基于工作组对等链路的SCSI电缆方案,因为第一个组处理器把电缆从外部延伸而第二个组处理器延伸电缆用于外部连接。同样的组机架还可以安置4个基于CPU卡的组处理器,这样便使得SCSI电缆更短。目前,有4个不同的SCSI标准,分别为:FASTSCSI,Ultra SCSI,Ultra2,LVD SCSI和Ultra3,LVD SCSI。每个标准都有窄(8位)和宽(16位)配置。因此,优选的SCSI实现要使用Ultra-wide LVD SCSI,它具有的最大数据传输速率为160MB/秒,电缆长度可达12米。
图1C显示了一个优选的工作组链路集成,其中8个优选的组处理器由利用SCSI的工作组对等链路链接,4个基于SCSI硬盘的组服务器由利用SCSI的工作组服务器链路链接。这些组处理器和组服务器利用相同的SCSI电缆连接在一起。这样,每个组处理器就可以直接访问每个组服务器而不涉及到其它的组处理器,特别是具有绝对特权的主组处理器。如图1C所示,每个基于SCSI磁盘的组服务器具有2个逻辑驱动器,每个组处理器被分配一个逻辑驱动器并被赋予绝对特权。组服务器只能以只读的方式被其它非主组处理器访问。
图1C还描述了通过具有以太网集线器的组链路卡使用以太网的工作组对等链路,这样如果使用SCSI的工作组对等链路发生了故障,使用以太网的工作组对等链路就可以作为另一可供选择的通信链路,反之亦然。实施使用以太网的工作组对等链路的主要优点在于:工作组内的组处理器间的通信不会不利地影响网络通信量,以及其它工作组的组处理器间的通信。使用以太网的工作组对等链路可以容纳各种不同的组处理器间的通信,例如基于映像驱动器的,基于套接字的,基于安全加密和安全解密的。除了SCSI之外也可以采用其它相当的外设总线作为实际的链路把工作组对等链路和工作组服务器链路链接在一起,只要它们的数据链路层能够执行基于存储的和基于通信的标准或专有协议。但是,依赖于配置,只要建立起使用以太网的工作组服务器链路和工作组对等链路,基于任一个适用的外设总线的工作组对等链路都不是必要的。
图1D描述了优选的组控制板的样式,它包括4个基本控制单元和1个主控制单元并且还可以通过RAP,VGA,USB和音频端口连接多达4个组处理器。基本控制单元包括一个微处理器和3个开关,开关由微处理器控制以允许VGA信号,音频信号和USB信号流入到与其它基本控制单元和主控制单元相连的公共VGA,音频和USB总线。另外,还有一个使用I2C的基于组控制板的通信链路,它与其它的基本控制单元和主控制单元相连。另外,还有一组10个接口信号,它们与前控制板相连。
优选的主控制单元可以包括用于容错的双微处理器,它们提供物理层接口以连接键盘,基于串口的设备和打印机,它们可以归类为以工作组连接的组处理器之间的工作组可共享设备。主控制单元还保持各种状态表以跟踪每个以工作组连接的组处理器的重要信号,CPU负载和活动性,以及用于管理公共总线和外围设备的利用率表,以便在检测了该表中没有冲突使用后,可以顺序地执行组处理器所发出的请求。
优选的前控制板包括两个交互式按钮:一个用于选择所选择的组处理器用于外部VGA显示器的显示以及外部键盘和鼠标的控制,另一个用于重新设置所选择的组处理器。还有三组LED,它们分别表示电源开/关,主系统盘的活动性和所允许的选择。组控制板功能板和前控制板封装在组机架内以便可以更容易地安排电缆配置。
用于控制组控制板的缺省组处理器称之为组管理器(TeamManager)。对于发到组管理器的工作组通信,任一个组处理器首先把消息通过RAP的COM2传送到与其相连的控制单元,然后控制单元利用I2C协议标题对该消息重新打包并通过使用I2C的组控制板内部链路通知主控制单元。一旦主控制单元允许连接发生,基本控制单元就通过组控制板内部I2C链路与组管理器直接通信,从而例如报告与其相连的组处理器的当前状态。而且,组控制板内部链路可以用作使用SCSI和以太网的工作组对等链路的另一种可供选择的通信链路。同样为了防故障的目的,用基于USB的鼠标替换基于COM-1的鼠标。因此,如果RAP的COM2发生了故障,那么就用RAP的COM1取代并在组处理器及其相连的基本控制单元之间提供数据通信。
图1E显示了2个级联在一起的组控制板与8个优选以工作组连接的组处理器相连。第一个组控制板(也就是TP-408M)和第二个组控制板(也就是TP-408C)通过公用VGA,Audio,USB和I2C总线相连,但是由于TP-408C没有主控制单元,因此TP-408M中的主控制单元将管理TP-408C中的所有基本控制单元。控制第一个组控制板的组管理器也是第二个组控制板的组管理器。对于与组管理器的通信,第二个组控制板的任一个组处理器会通过RAP的COM2把消息传输到与其相连的控制单元,然后该控制单元利用I2C协议标题把该消息重新打包并通过内部I2C链路通知第一个组控制板中的主控制单元。一旦主控制单元允许发生连接,第二个组控制板的基本控制单元就会通过组控制板内部I2C链路直接与第一个组控制板的组管理器进行通信。根据同样的情况,任何特殊配置的工作组服务器阵列都可以由单个组控制板或多个级联在一起的组控制板来适应。每个组控制板的前控制板可以封装在每个组机架内或者也可以延伸到一个外部控制盒以便于多个组控制板的监控和控制。装有所有工作组服务器阵列的组处理器的多个组机架可以安置在一个组机柜(TeamRack)内,该组机柜还可以安置另外的组机架内的另外的组服务器并且进一步还可以配备一个电缆分线箱以安置所有的组机架之间电缆以及所有的进出电缆。
图2A为一原理框图,描述了根据本发明系统的一个实施例的一个优选的工作组服务器阵列,它包括8个组处理器,4个基于SCSI磁盘的组服务器以及2个级联的组控制板,所有以上组件都被封装在2个可被进一步安置在组机柜内的组机架内。
图2B为一原理框图,描述了根据本发明系统的一个实施例的一个优选的工作组服务器阵列,它包括4个组处理器,2个基于SCSI磁盘的组服务器以及1个组控制板,所有以上组件都封装在1个可被进一步安置在组机柜内的组机架内。
图2C为一原理框图,描述了根据本发明系统的一个实施例的一个优选的工作组服务器阵列,它包括12个组处理器,由使用双SCSI通道的两个工作组服务器链路链接的6个基于SCSI磁盘的组服务器以及3个级联的组控制板,所有以上组件都被封装在3个可被进一步安置在组机柜内的组机架内。
图3A描述了具有定义数据流的一个优选的配置,这些数据流利用图2A所示的8个组处理器工作组服务器阵列执行各种基础功能。根据该优选的配置,8个组处理器在功能上可以分为两类:1)应用/文件服务处理器(TP1-TP4),2)数据库/文件服务/负载均衡/防火墙处理器(TP5-TP8)。每个组处理器有其主SCSI磁盘组服务器,它可以作为其它7个组处理器的只读组服务器来操作,这种只读组服务器后面称之为辅助组服务器。因此,在引导过程中,每个组处理器将会识别一个基于IDE的系统驱动器和一个主组服务器以及7个辅助组服务器,这些组服务器不需使用NOS映像方案便可以用作直接访问型服务器。另外,上述由所有以工作组连接的组处理器访问的主组服务器和辅助组服务器还可以配备多个容错磁盘阵列以及双通道组服务器卡以在两个SCSI通道上分配通信量。
基于应用/文件服务的组处理器TP1-TP4中每一个都能够处理来自因特网的基于HTTP的面向应用的web查询并产生可以写入系统IDE盘及其主组服务器上的成批事务文件。基于数据库/文件服务的组处理器TP5-TP8中每一个都能够处理来自内部网和外部网的基于FTP或基于专有实时套接字端口的面向数据库的web查询并产生可以写入系统IDE盘及其主组服务器上的成批事务文件。
另外,组处理器TP5和TP7中每一个都保持一个专用工作组数据库,该数据库安装在它的主组服务器上。这两个数据库在一天的最后时间是基本相同的。TP5所控制的数据库在这一天中会在设定的时间段(t)内根据组服务器1-组服务器4所产生的每个成批事务文件进行更新。TP7所控制的数据库是在这一天的最后时间根据组服务器1-组服务器4在该天中所产生的所有成批事务文件进行更新。TP6处理大部分来自内部网的基于FTP的面向数据库的web查询,以便TP5在每个t时间段可以从组服务器6检索和更新数据库。TP5还会根据来自内部网的基于专有实时套接字端口的数据库查询对数据库进行即刻更新。TP8是缺省的组处理器,也就是控制那两个组控制板的组管理器。
在优选的服务器对配置的基础上,本发明的工作组服务器阵列,下文中称之为WSA,可以实现大量独特的功能性服务。
可以实现一种关于WSA服务器协作和监督服务的优选方法,使得组管理器(TP8)可以协调所有以工作组连接的组处理器并产生基于管理的行为。这些行为包括:监控每个组处理器的详细目录,磁盘空间以及CPU利用率,这些可以由安装在每个组处理器上的OS产生。这些行为另外还包括每个以工作组连接的组处理器上可能会发生的侵入,去除和故障警报。每个组处理器将例行地打包基于管理的状态信息并通过RAP的COM2把这些信息发送给它的控制单元,该控制单元通知主控制单元并等待OK信号以通过组控制板内部I2C链路发送来自主控制单元的指令。一旦接收到OK信号,该特定的组处理器就把来自其控制单元的通信信息向组管理器的控制单元发送,后者再把这种状态信息通过RAP的COM2向组管理器发送。组管理器将总会保持关于所有以工作组连接的组处理器的管理状态表。
可以实现一种关于WSA内部前控制板开关服务的优选方法,使得:一接收到来自其自身或任一个组处理器要求检查一个特定的组处理器是否仍在运行的请求,组管理器就把该请求向主控制单元发送,主控制单元将进一步向那个特定的组处理器的控制单元发出诊断请求。如果没有响应,主控制单元将向组管理器的控制单元发出通知,该控制单元会把该通知通过RAP的COM2发向组管理器。之后,组管理器会把该警报信息通过网络链路向基于LAN的管理控制台发送并等待操作者的响应。操作者可以通过运行管理控制台计算机上的副本或类似软件接管组管理器的控制。另外,组管理器配备有视频捕获卡并且公共VGA总线也与NTSC转换器相连,这样任一个组处理器的VGA显示都可以被重新捕获进入组管理器的VGA显示。因此,通过向主控制单元发送“选择”请求可以指示组管理器捕获发生故障的组处理器的屏幕显示,主控制单元还将允许组管理器的控制单元与发生故障的组处理器的控制单元进行后续的通信。操作者还可以向发生故障的组处理器发送键盘敲击的信息并据此而行动,而且还把诊断文件存入组管理器以备进一步分析。如果操作者决定复位发生故障的组处理器,他就指示组管理器向发生故障的组处理器的控制单元发送“复位”命令。那个特定的控制单元就会触发与发生故障的组处理器直接相连的复位线路对其进行复位。引导过程将会被捕获,显示和存储在组管理器上,以便远程管理控制台计算机处的操作者可以监视并根据引导过程一步步作出反应。而且,技术人员可以根据存储的诊断文件进一步分析以确定问题所在并推出解决办法。
可以实现一种关于WSA现场前控制板开关服务的优选方法,使得本地的现场操作者可以使用组机架上的前控制板通过基于组控制板的工作组设备如VGA监视器,一组扬声器,键盘和鼠标来观看,控制和复位任一个组处理器。一旦接收到控制板上要求“选择”和“复位”的按钮请求,这些请求信号直接与主控制单元相连,如果合适,主控制单元将首先检查利用率表以保证没有使用冲突,然后设置相关的LED闪烁。如果决定进行按钮触发,本地的操作者就再一次按下按钮进行触发,这样就开启了相关的LED。一旦操作完成,就关闭相关的LED。
可以实现一种关于WSA远程前控制板开关服务的优选方法,使得任一台远程计算机可以根据译出的专有访问密码通过与基于工作组的串行链路相连的外置调制解调器控制组管理器或任一个组处理器。一旦建立了通信,远程计算机可以执行所有与基于LAN的管理控制台计算机相同的功能。
可以实现一种关于WSA设备共享服务的优选方法,使得WSA中的外设可以由组管理器和任一个其它的组处理器访问。当特定的组处理器需要访问任一外设如打印机时,组处理器通过RAP的COM2向其控制单元发出请求消息,控制单元通过内部I2C链路向主控制单元发出请求。如果主控制单元在检测完状态和利用率表后发现可用,它就允许该特定的控制单元与主控制单元进行后续通信,主控制单元将通过内置的并行接口向所连的打印机传递数据。其它的串口设备也可以实现类似的过程。但是,对于USB设备而言,特定的组处理器通过RAP的COM2向其控制单元发送请求信号,控制单元将会把它发送给主控制单元。如果主控制单元在检测完USB设备的利用率表后发现可用,它就向该控制单元发回OK信号,该控制单元就进一步打开面板上的USB开关。这样一来,该特定的组处理器上的USB接口就会直接通过公共USB总线与基于工作组的USB设备如可携式摄像机相连。
可以实现一种关于WSA防故障方案服务的优选方法,使得WSA中的重要任务组件如:组机架,组控制板,组处理器和组服务器或者是容错的或者是防故障的,这样重要任务应用就不会被破坏。
至于组控制板,重要任务性能与其主控制单元相关,主控制单元有两个微处理器,所以如果第一个发生了故障,第二个就会取代它并向组管理器发出警报,组管理器再进一步通知管理控制台。至于组机架,它是容错的,因为它配备了双电源和外部UPS。至于组处理器,总共有4个防故障组,也就是TP1与TP2,TP3与TP4,TP5与TP6,TP7与TP8。因为每组的成员彼此具有相同的硬件配置,因此每一组中如果一个发生了故障,另一个就会取代它,反之亦然。因此,如果组管理器TP8发生了故障,TP7就会作为组管理器取而代之。而且,TP1-TP2对与TP3-TP4对都是防故障组。TP5-TP6对与TP7-TP8对也都是防故障组。如果TP1-TP2对发生了故障,TP3-TP4对就会取而代之,反之亦然。同样的情况也适用于TP5-TP6对与TP7-TP8对。
至于基于文件服务的组服务器,总共有8个防故障组,也就是:组处理器1中的IDE1与组服务器1,IDE2与组服务器2,IDE3与组服务器3,IDE4与组服务器4,IDE5与组服务器5,IDE6与组服务器6,IDE7与组服务器7,IDE8与组服务器8。因此,如果组服务器1发生了故障,其它的组处理器仍然能够从IDE1上的组处理器1获得信息。如果IDE1发生了故障,其它的组处理器可以直接从组服务器1获得信息。同样的情况也适用于其它7个防故障组。至于基于数据库服务的组服务器,组服务器5上的数据库由TP5控制,组服务器7上的数据库由TP7控制,如前所述它们基本上都是相同的专用数据库。但是,如果数据库-TP5发生了故障,根据从组服务器1至组服务器8所收集的所有相关的批处理文件,数据库-TP7将会即刻被组处理器7所更新并即刻准备好进行服务。
可以实现一种关于WSA基于应用的负载均衡服务的优选方法,使得WSA中的基于应用的组处理器可以通过使用组控制板而达到负载均衡。在基于web的环境中,基于应用的查询请求来自使用HTTP协议的因特网。输入查询通信量首先要经过路由器。然后路由器把所有的请求向组管理器TP8发送。然后组管理器通过内部FTP端口或使用以太网的工作组对等链路的专有端口把输入业务负载向TP1,TP2,TP3和TP4进行分配。在循环执行的过程中,根据每个基于应用的组处理器的CPU利用率和响应时间,组管理器(TP8)保持一个基于循环的负载均衡状态表,组控制板的主控制单元保持各种重要符号状态表。
因为任一以工作组连接的组处理器都会按程序把重要符号等等通过RAP的COM2向其连接的控制单元传输,控制单元将对数据进行重新打包并通知主控制单元。一旦主控制单元允许连接的发生,基本控制单元就可以把数据下载到主控制单元的存储缓冲器中,该缓冲器可以分配给各种重要符号状态表。根据这些实时的状态表,主控制单元可以检测到哪个组处理器可能发生了故障或过载。如果上述两种情况中任一种发生了,主控制单元就会向组管理器进行报告。如果是过载情况,组管理器将会立刻试图把该组处理器从循环序列中取出,一直到再次接收到主控制单元的通知,要求把那个特定的组处理器返回循环序列中为止。如果是发生了故障的情况,组管理器将会试图通过工作组对等链路与那个特定的组处理器建立通信。如果没有响应,那么组管理器将会通知主控制单元通过RAP的“复位”线路复位该组处理器,导致部分或全部的恢复并进行相应操作。
除了循环模式之外,还有其它类型的智能算法,如“最少开路连接”,“最快检测时间或响应时间”,“内容类型”,“开路连接的数目以及其它从应用服务器中采集的统计数字”。因为组管理器TP8可以通过工作组对等链路一个接一个地采集这些类型的信息并检测发生故障的组处理器,因此可以智能化地执行各种不同的算法而不会使一个特定的组处理器过载也不会把负载发送给发生故障的组处理器。但是,如果所有的组处理器都是同种类型的话,那么循环算法将是最好的选择,组管理器只需根据异常的情况对来自组控制板的主控制单元的指令作出响应即可。
可以实现一种关于WSA文件和数据库服务的优选方法,使得任一个特定的组服务器上的文件和数据库可以在多个组处理器之间进行直接访问和共享。要达到这一点需要在用于直接访问的辅助组服务器的多个组处理器上安装相同数目的多个只读数据库引擎,在主组处理器上安装一个全权数据库引擎,它具有适用于其主组服务器上的数据库的绝对特权。另外,组管理器(TPB)为所有所连的设备保存一系列状态和利用率表。其中一个表格保存了每个组服务器的主组处理器的同时列表,这样在任何一个组服务器上就不会有双重写入的数据完整性破坏的情况发生。但是,由于防故障,不同的时区中的不同操作需要以及用于升级的临时管理改变等因素的存在,任一个特定的组服务器的主组处理器都可能会变成另一个组处理器。组管理器将总是确保在给定时间只有一个组处理器能够更新特定的组服务器。
可以实现一种关于WSA安全服务的优选方法,使得可以检测到对WSA的任何未授权侵入。因为组管理器TP8将接收所有的输入请求并把负载在组处理器中进行分配,所以组管理器必须增强安全性,安装防火墙以避开任何可能的外部攻击。基本上,组管理器TP8可以通过以下措施过滤掉任何有问题的输入请求:执行基于SSL,基于OS或更高级别的基于应用的访问加密安全措施,通过使用以太网的工作组对等链路把那些合法请求重定向到那些基于应用的组处理器,分离成两个不同的安全区。每个基于应用的组处理器都要进行应答,这涉及到访问专用数据库并通过包括一个正确的具有内容加密安全措施的内部IP地址再把其返回给请求者。这样,组管理器能够对内容进行解密并把它重定向到处理前面请求的正确的组处理器。这种粘着端口类型的方法,被称为基于以下因素的持久会话,这些因素例如包括:包含在用户验证设备请求协议或返回的cookie中的源IP地址和特殊信息。这种粘着端口类型方法还可以安全地执行,这一点对于有效地运行基于web的电子商务是必要的。
可以实现一种关于WSA防故障服务的优选方法,使得大量基于代理的管理软件程序也就是TeamSoft能够与基于优选配置的定义数据结构和数据流的所有上述功能服务进行合并。只有当前的组管理器要安装TeamSoft的服务器部分,剩余的组处理器要安装TeamSoft的客户部分。只要有一个组处理器运行,远程管理控制台的计算机就可以控制该组处理器使其充当组管理器,这样它就能复位任何发生故障的组处理器,本发明的工作组服务器阵列就可以回复到正常运行状态。根据TeamSoft的防故障能力,每个组处理器可以通过组管理器根据其防故障对应组件是否仍在运行而开始其检测。如果没有运行,那么该组处理器就会承担起它的发生故障的对应组件所承担的任务。例如,如果TP5发生了故障,组管理器就会把组服务器5的特权和更新数据库的任务分配给TP6。如果TP6发生了故障,组管理器就会把组服务器6的特权分配给TP5并且通过把TP5的IP地址而不是TP6的IP地址与输入请求一起通知而把TP6的通信量重定向到TP5。TeamSoft还包括对内置自动更正行为的问题的工作组诊断。
可以实现一种关于WSA性能检测服务的优选方法,使得通过调整一些关键参数的值可获得WSA的最优性能。本发明的工作组服务器阵列的性能与下面三个因素密切相关:1)组管理器防火墙的操作,2)基于应用的组处理器的数量,3)专用数据库的大小。如果安装在组管理器TP8中的防火墙操作需要在执行内容解密安全性和上层访问安全性上花费太多时间,就会减少每分钟的输入请求数量。但是,这个问题可以通过连接基于防火墙的路由器而加以解决,该路由器可以执行网络层过滤以及上层过滤。
如果基于应用的组处理器的数量减少,每分钟的输出应答数目也将减少。至于数据库方面的考虑,如果以应用为中心的数据库按照非忠实性通信量构建,它倾向于只给出现成的信息,这些现成的信息可能偶然地增长以满足基于非忠实性的通信量。另一方面,如果根据忠实性通信量构建数据库,那么数据库就将会显著增长。然而从数据库中检索数据以形成应答页所需的时间并不是个问题,因为组服务器上的数据库很容易访问而不需要依赖任何其它组处理器。
因此,有两种情况:1)基于非忠实性的应用和2)基于忠实性的应用。在基于非忠实性的应用的情况下,本发明的工作组服务器阵列的最优性能取决于基于应用的组处理器的数目。根据计算能力和服务的复杂程度,一个组处理器可以处理X数量的输入请求并且减少一分钟内的输出应答而并不降低服务质量,即可接受的服务质量(QOS)。因此,四个组处理器可以以稳定状态的操作处理4X数量的输入请求。如果峰值时刻的非忠实性通信量跳升到6X,本发明的工作组服务器阵列通过把TP6和TP7分配为基于应用的组处理器并加入组管理器运行的循环负载均衡算法,仍然可以适应该峰值时刻的操作。
而且,如图2C所示,一个基于12个组处理器的工作组服务器阵列,其中12个中有8个是基于应用的组处理器,该服务器阵列可以在稳定状态操作中处理8X数量的非忠实性通信量,在峰值时刻操作中处理10X数量的通信量。如果输入通信量超过10X就需要第二个工作组服务器阵列。
在基于忠实性的情况下,本发明的工作组服务器阵列最优性能取决于基于应用的组处理器的数目以及基于忠实性的数据库的大小。如果数据库的尺寸太大而所产生的输入请求的数量超过了所有组处理器所能处理的范围,那么就需要减小数据库的尺寸以满足稳定状态的操作,超出的部分应当转移给第二个工作组服务器阵列。例如,一个基于12个组处理器的工作组服务器阵列可以处理8X数量的基于忠实性的通信量,这8X数量的通信量可以转换为以应用为中心的数据库所能容纳的Y数量的基于忠实性的用户。在峰值时刻,Y数量的用户将产生10X数量的基于忠实性的通信量,这仍然满足可接受的QOS。
本发明的工作组服务器阵列总是可以根据组管理器所收集的信息重新调整X和Y的数量以确保可接受的服务质量。因此,用于本发明的工作组服务器阵列的性能指标是参数X和Y,据此可以推算出最优操作点并预测需要增加资源的问题。
对于更高的带宽应用,服务级别也就更高,这会降低X和Y的数量。但是本发明的工作组服务器阵列的QOS仍将不受影响。
在基于忠实性的情况下,为了容纳更多的同种应用的输入请求,图3B描述了一种包括多个基于单个应用的工作组服务器阵列的工作组服务器群集,它所包括的每个服务器阵列具有彼此互斥的数据库段。因为每个工作组服务器阵列具有QOS能力,所以整个工作组服务器群集也具有QOS能力。
这样一来,工作组服务器群集可以适应高度可用的,高度可升级的重要任务的基于web的应用,该服务器群集可以包括从第一一直到第n个工作组服务器阵列。由于路由器是基于忠实性的,它可以即刻根据正确的IP地址向正确的组管理器分配正确的输入通信量,因为这种信息或者是安装在它们的浏览器的“cookies”中或者是安装在基于芯片的智能卡中,其中该智能卡可被用于网络访问和用户验证。
对于基于非忠实性的情况,路由器和能够把URL转换为IP地址的域名服务器(DNS)一起利用内置的循环能力把输入负载分配给基于非忠实性的工作组服务器群集的多个组管理器。这样一来,就执行了用于基于非忠实性的通信量的负载均衡并且QOS不受影响。这种根据基于工作组服务器群集的负载均衡的独特方法再加上基于循环的DNS,对于去除全局负载均衡器产生了明显的效益,这种负载均衡器必须足够强大以均衡负载和管理所有的web应用服务器,这样就会产生不必要的网络通信量使层间的网络开关过载。而且,如果任一个组管理器发生故障,DNS就会向该组管理器的防故障对应组件发出消息。该对应组件就会自动取代原组件并处理来自DNS的输入通信量,因为DNS既通知了组管理器的IP地址也通知了它的对应组件的IP地址。
不论是对于基于忠实性的情况还是对于基于非忠实性的情况,数据库服务器程序运行起来都应当迅速而简单,而不需要内在的复杂的智能,因为基于web的应用被定义的很好而与其相关的数据库也应当被定义的很好。检索数据所花费的时间应当尽可能短,以便X和Y可以是比较大的数以产生更好的性能。
由于来自用户/冲浪者的输入请求可能涉及到很多不同的基于web的应用,所以应当安装多个不同的基于应用的工作组服务器群集。图4显示了一个用于高度可用性的,高度可升级性的重要任务内部网,外部网和因特网应用的一个整体web服务器系统的优选实施例,它还集成了多个串行链接的和并行链接的工作组服务器群集并且创造出一个理想的,安全的分布式计算环境。
除了使用基于防火墙的工作组服务器阵列的区域安全性之外,不同工作组群集之间的相互通信也可以通过使用具有基于SSL,OS或应用的内容和访问安全措施的专有端口而被安全地执行,这样任何外部通信都不允许访问任一个工作组服务器群集。
而且,通过使用FC-AL等等把所有组管理器链接在一起,每个工作组服务器阵列的组服务器,不论是基于硬盘的,磁带的,或是光盘的都可以转换为FC设备,这些FC设备可以由任一个基于SAN(存储区域网)的后端数据库处理器访问和维护。这样做,每个工作组服务器阵列的以应用为中心的文件和数据库服务器或用于后端数据中心基于SAN的复杂文件和数据库服务器的数据高速缓存服务器都可以配备有更智能的数据库引擎。
总之,本发明包括了大量的独特的组件:1)组处理器,2)组服务器和组服务器卡,3)组控制板,4)组链路卡,5)组机架,6)组机柜。在这些独特组件的基础上,本发明还使用了大量独特的方法以建立优选的工作组服务器阵列。它们是:1)WSA服务器对方法,2)WSA多个工作组链接方法,3)WSA服务器协调和管理方法,4)WSA内部,现场和远程“前控制板”开关方法,5)WSA设备共享方法,6)WSA防故障和恢复方法,7)WSA负载均衡方法,8)WSA文件/数据库共享方法,9)WSA基于安全性的方法,10)WSA基于TeamSoft的管理方法,11)WSA最优性能检测方法。而且在这些发明的工作组服务器阵列的基础上,本发明还使用了大量独特方法以建立优选的工作组服务器群集(WSC)。它们是:1)WSC结构方法,2)WSC负载均衡方法,3)WSC以高速缓存为中心的数据库方法,4)WSC以用户验证忠实性为中心的工作组数据库方法。最后,在这些发明的工作组服务器群集的基础上,本发明使用了大量独特的方法以建立优选的“前方办公室”的基于web的服务器农场。它们是:1)多个WSC的串行链接方法,2)多个WSC的并行链接方法,3)多个串行和并行链接的WSC与存储区域网络(SAN)连接的方法。
现在应当理解的是:本发明提供了一种工作组服务器阵列及其相关的架构,以在一个安全分布式的计算环境中建立各种高度可用性的,可升级性的重要任务服务器群集。
本领域的技术人员很容易就会发现一些其它的优点和可以修改的地方。因此本发明就其更宽的范围而言并不局限于某些特定的细节,具有代表性的装置,以及所显示和描述的一些示例。因此只要不脱离申请人的一般发明概念的精神和范围,允许与这样的细节发生偏差。本发明按照下面的权利要求书进行定义。
Claims (50)
1.一种包括多个组处理器的多处理器计算机系统,每个组处理器具有一个多CPU计算平台,所述平台具有RAM和多个模块分别与监示器,音频扬声器,访问端口,USB,网络链路,工作组对等链路,外设驱动器和工作组服务器链路相连的模块;
所述的每个组处理器的所述工作组服务器链路与一组共享的工作组服务器相连。
2.权利要求1的计算机系统,其中每个所述工作组服务器都是一容错盘阵列。
3.权利要求1的计算机系统,进一步还包括至少一个机架,可以安置至少4个所述组处理器和至少2个所述工作组服务器。
4.权利要求1的计算机系统,包括至少8个所述组处理器和至少4个所述工作组服务器;所述的每个组处理器都与所述的每个工作组服务器进行通信。
5.权利要求1的计算机系统,进一步包括至少一个组控制板,该控制板具有多个控制CPU,每个CPU与一个对应的组处理器相连,每个CPU控制一组开关,这些开关用于有选择性地把相应的组处理器与USB设备,监视器,音频扬声器,键盘,鼠标,调制解调器,打印机和串行设备相连。
6.权利要求5的计算机系统,进一步包括一组级联在一起的所述组控制板,用于连接增加数目的所述组处理器。
7.权利要求5的计算机系统,进一步还包括:至少一个附加的所述控制CPU,它被指定为第一主控制单元,并提供对所述组处理器访问共享总线和设备,和所述组处理器之间的负载均衡的管理。
8.权利要求7的计算机系统,进一步包括一个第二主控制单元用于对所述第一主控制单元的故障模式后备。
9.权利要求7的计算机系统,其中一个所述的组处理器被指定为组管理器,控制所述的组控制板。
10.权利要求1的计算机系统,其中至少有一个所述工作组服务器主要用于应用文件服务,至少有另一个所述工作组服务器主要用于数据库文件服务。
11.权利要求10的计算机系统,其中所述用于应用文件服务的工作组服务器提供一种为面向应用的请求服务的能力。
12.权利要求10的计算机系统,其中所述用于数据库文件服务的工作组服务器提供一种为面向数据库的请求服务的能力。
13.权利要求10的计算机系统,其中每个所述工作组服务器用于产生可以写入外设以用于防故障操作的批处理文件。
14.权利要求10的计算机系统,包括至少另一个工作组服务器用于为防故障操作既提供应用文件服务又提供数据库文件。
15.权利要求1的计算机系统,其中每个组处理器识别一个工作组服务器为主服务器,而所有其它的工作组服务器为辅助服务器。
16.权利要求1的计算机系统,其中所述工作组对等链路是基于以太网或SCSI接口的,而所述工作组服务器链路是基于SCSI接口的。
17.权利要求1的计算机系统,其中一个所述的组处理器被指定为组管理器,监控剩余的每个组处理器的状态。
18.权利要求1的计算机系统,其中每个所述工作组服务器可以为至少一个所述的组处理器所直接访问。
19.一种工作组服务器阵列系统,包括:
多个组处理器组,每个组处理器具有一个多CPU计算平台,每个组处理器组包括多个组处理器,并且与组控制板相连,用于与VGA监视器,键盘,音频扬声器和串行总线连接;每个所述的组被连接到一个工作组服务器链路上;多个直接访问型工作组服务器通过所述工作组服务器链路与所述的组处理器组相连;所述的组通过一个工作组对等链路互连到一个工作组以太网集线器上;所述的组还通过一个工作组以太网开关被连接到一个局域网上。
20.权利要求19的工作组服务器阵列系统,其中每个所述的工作组服务器为一容错盘阵列。
21.权利要求19的工作组服务器阵列系统,进一步包括:至少一个机架,用于容纳至少四个所述组处理器和至少两个所述工作组服务器。
22.权利要求19的工作组服务器阵列系统,包括:至少8个所述组处理器和至少4个所述工作组服务器;每个所述的组处理器与每个所述的工作组服务器进行通信。
23.权利要求19的工作组服务器阵列系统,进一步包括:至少一个组控制板,该控制板具有多个控制CPU,每个CPU与一个对应的组处理器连接,每个CPU控制一组开关,这些开关用于有选择性地把相应的组处理器与USB设备,监视器,音频扬声器,键盘,鼠标,调制解调器,打印机和串行设备相连。
24.权利要求23的工作组服务器阵列系统,进一步包括一组级联在一起的所述组控制板,用于连接增加数目的所述组处理器。
25.权利要求23的工作组服务器阵列系统,进一步还包括:至少一个附加的所述控制CPU,它被指定为第一主控制单元,并提供对所述组处理器访问共享总线和设备,和所述组处理器之间的负载均衡的管理。
26.权利要求25的工作组服务器阵列系统,进一步包括一个第二主控制单元,用于对所述第一主控制单元的故障模式后备。
27.权利要求25的工作组服务器阵列系统,其中一个所述的组处理器被指定为组管理器,控制所述的组控制板。
28.权利要求19的工作组服务器阵列系统,其中至少有一个所述工作组服务器主要用于应用文件服务,至少有另一个所述工作组服务器主要用于数据库文件服务。
29.权利要求28的工作组服务器阵列系统,其中所述用于应用文件服务的工作组服务器提供一种为面向应用的请求服务的能力。
30.权利要求28的工作组服务器阵列系统,其中所述用于数据库文件服务的工作组服务器提供一种为面向数据库的请求服务的能力。
31.权利要求28的工作组服务器阵列系统,其中每个所述工作组服务器用于产生可以写入外设以用于防故障操作的批处理文件。
32.权利要求28的工作组服务器阵列系统,包括至少另一个工作组服务器,用于为防故障操作既提供应用文件服务又提供数据库文件操作。
33.权利要求19的工作组服务器阵列系统,其中每个组处理器识别一个工作组服务器为主服务器,而所有其它的工作组服务器为辅助服务器。
34.权利要求19的工作组服务器阵列系统,其中所述工作组对等链路是基于以太网或SCSI接口的,而所述工作组服务器链路是基于SCSI接口的。
35.权利要求19的工作组服务器阵列系统,其中一个所述的组处理器被指定为组管理器,监控剩余的每个组处理器的状态。
36.权利要求19的工作组服务器阵列系统,其中每个所述工作组服务器可以为至少一个所述的组处理器所直接访问。
37.在一个具有多个组处理器的多处理器计算机系统中,每个组处理器具有一个多CPU计算平台和一个工作组服务器链路,该链路用于把组处理器与共享的多个直接访问型组服务器相连,一种组服务器协调和管理方法,该方法包括以下步骤:
选择第一个所述组处理器为组管理器;
利用所述所选择的组管理器监控所有的剩余组处理器的状态;
每个组处理器把其状态信息向所述组管理器发送;
对应从所述组处理器所接收的状态信息,所述组管理器编辑一个基于管理的状态表。
38.权利要求37的方法,其中每个所述的组处理器通过VGA链路与公共监视器相连并且进一步包括以下步骤:
利用所述的组管理器监控对每个所述组处理器的诊断;
通过组管理器捕获任一发生了故障的组处理器的VGA链路;
使所述组管理器复位发生了故障的组处理器。
39.权利要求37的方法,进一步包括以下步骤:分配至少一个组处理器用于负载均衡;分配至少一个组处理器用于数据库服务;分配至少另一个组处理器用于专用服务。
40.权利要求37的方法,进一步包括步骤:把组处理器配对以通过用一个组处理器取代该对中的另一个来提供容错替代。
41.权利要求37的方法,其中所述计算机系统具有一附加装置用以监控组处理器的状态;该方法进一步包括以下步骤:
利用所述的附加装置监控所述组处理器的状态;
所述的附加装置是在所述组处理器之间进行负载均衡的最终评判;
所述的附加装置指示所述的组管理器改变在所述组处理器之间的负载分配以达到所述的负载均衡。
42.权利要求19的工作组服务器阵列系统,其中:每个组处理器与所述的作为主服务器的一个服务器相关联,并且与剩余的作为辅助服务器的服务器相关联。
43.权利要求42的工作组服务器阵列系统,其中每个用于选定的组处理器的主服务器为其选定的组处理器提供全功能的数据库访问而对所有其它的所述组处理器提供只读数据库访问。
44.权利要求19的工作组服务器阵列系统,其中一些所述的组处理器是基于应用的,一些所述的组处理器是基于数据库的,并且一些所述服务器是基于应用的服务器,一些是基于数据库的服务器;该系统进一步包括:
用于调整基于应用的组处理器和服务器的数量以优化用于执行输入通信量的质量性能的装置。
45.一种具有多个相互连接的工作组服务器阵列的工作组服务器群集,每个这样的服务器阵列包括:
多个组处理器组,每个组处理器具有一个多CPU计算平台,每个组处理器组包括多个组处理器,并且与组控制板相连,用于与VGA监视器,键盘,音频扬声器和串行总线连接;每个所述的组被连接到一个工作组服务器链路上;多个直接访问型工作组服务器通过所述工作组服务器链路与所述的组处理器组相连;所述的组通过一个工作组对等链路互连到工作组以太网集线器上;所述的组还通过一个工作组以太网开关被连接到一个局域网上。
46.权利要求45的工作组服务器群集,进一步包括一个循环服务器,用于均衡所述多个工作组服务器阵列之间的负载。
47.权利要求46的工作组服务器群集,进一步包括一个域名服务器,用于分配输入通信量。
48.权利要求45的工作组服务器群集,其中,每个所述的工作组服务器阵列都提供一个工作组数据库,这种工作组数据库在所述工作组服务器群集中每隔一个工作组服务器阵列工作组数据库是重复的。
49.权利要求45的工作组服务器群集,其中每个所述的工作组服务器阵列提供一个独特的工作组数据库。
50.权利要求45的工作组服务器群集,其中:所述群集可以通过与多个附加的工作组服务器群集进行串行和并行连接而向上升级,以获得高度可用性的重要任务应用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13531899P | 1999-05-20 | 1999-05-20 | |
US60/135,318 | 1999-05-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1310821A true CN1310821A (zh) | 2001-08-29 |
CN1173281C CN1173281C (zh) | 2004-10-27 |
Family
ID=22467552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008009473A Expired - Fee Related CN1173281C (zh) | 1999-05-20 | 2000-05-17 | 用于实现工作组服务器阵列的方法和装置 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP1114372A4 (zh) |
JP (1) | JP4864210B2 (zh) |
KR (1) | KR20010074733A (zh) |
CN (1) | CN1173281C (zh) |
AU (1) | AU5273800A (zh) |
CA (1) | CA2338025C (zh) |
WO (1) | WO2000072167A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100334546C (zh) * | 2003-07-08 | 2007-08-29 | 联想(北京)有限公司 | 实现机群监控系统使用多种数据库系统的方法和装置 |
CN100422945C (zh) * | 2004-10-22 | 2008-10-01 | 国际商业机器公司 | 在信息存储和检索系统中提供故障恢复保护的设备和方法 |
CN101495993B (zh) * | 2006-08-08 | 2011-02-16 | 瑞科网信科技有限公司 | 用于分布式多重处理安全网关的系统和方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7325030B2 (en) * | 2001-01-25 | 2008-01-29 | Yahoo, Inc. | High performance client-server communication system |
WO2003014893A2 (en) * | 2001-08-10 | 2003-02-20 | Sun Microsystems, Inc | Server blade |
WO2003027853A1 (en) * | 2001-09-21 | 2003-04-03 | Polyserve, Inc. | A system and method for synchronisation for enforcing mutual exclusion among multiple negotiators |
US6567272B1 (en) | 2001-11-09 | 2003-05-20 | Dell Products L.P. | System and method for utilizing system configurations in a modular computer system |
US7865326B2 (en) | 2004-04-20 | 2011-01-04 | National Instruments Corporation | Compact input measurement module |
KR100609082B1 (ko) * | 2004-07-16 | 2006-08-08 | 주식회사 세미라인 | 미션 크리티컬한 생산설비 관리장치 |
US20080319910A1 (en) * | 2007-06-21 | 2008-12-25 | Microsoft Corporation | Metered Pay-As-You-Go Computing Experience |
US20080319925A1 (en) * | 2007-06-21 | 2008-12-25 | Microsoft Corporation | Computer Hardware Metering |
JP5777649B2 (ja) | 2013-01-28 | 2015-09-09 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5283897A (en) * | 1990-04-30 | 1994-02-01 | International Business Machines Corporation | Semi-dynamic load balancer for periodically reassigning new transactions of a transaction type from an overload processor to an under-utilized processor based on the predicted load thereof |
JPH04148363A (ja) * | 1990-10-11 | 1992-05-21 | Toshiba Corp | マルチコンピュータシステム |
TW372294B (en) * | 1993-03-16 | 1999-10-21 | Ht Res Inc | Multiple computer system |
US5802391A (en) * | 1993-03-16 | 1998-09-01 | Ht Research, Inc. | Direct-access team/workgroup server shared by team/workgrouped computers without using a network operating system |
JPH0756838A (ja) * | 1993-08-11 | 1995-03-03 | Toshiba Corp | 分散サーバ制御装置 |
US5612865A (en) | 1995-06-01 | 1997-03-18 | Ncr Corporation | Dynamic hashing method for optimal distribution of locks within a clustered system |
US5768623A (en) * | 1995-09-19 | 1998-06-16 | International Business Machines Corporation | System and method for sharing multiple storage arrays by dedicating adapters as primary controller and secondary controller for arrays reside in different host computers |
US6049823A (en) * | 1995-10-04 | 2000-04-11 | Hwang; Ivan Chung-Shung | Multi server, interactive, video-on-demand television system utilizing a direct-access-on-demand workgroup |
JPH09160885A (ja) * | 1995-12-05 | 1997-06-20 | Hitachi Ltd | クラスタ型計算機装置の負荷分散方法 |
US5704032A (en) * | 1996-04-30 | 1997-12-30 | International Business Machines Corporation | Method for group leader recovery in a distributed computing environment |
US5748897A (en) * | 1996-07-02 | 1998-05-05 | Sun Microsystems, Inc. | Apparatus and method for operating an aggregation of server computers using a dual-role proxy server computer |
US5822531A (en) | 1996-07-22 | 1998-10-13 | International Business Machines Corporation | Method and system for dynamically reconfiguring a cluster of computer systems |
US5933596A (en) * | 1997-02-19 | 1999-08-03 | International Business Machines Corporation | Multiple server dynamic page link retargeting |
US5875290A (en) * | 1997-03-27 | 1999-02-23 | International Business Machines Corporation | Method and program product for synchronizing operator initiated commands with a failover process in a distributed processing system |
JPH1165862A (ja) * | 1997-08-14 | 1999-03-09 | Nec Corp | マルチプロセッサ資源分割管理方式 |
US6070191A (en) * | 1997-10-17 | 2000-05-30 | Lucent Technologies Inc. | Data distribution techniques for load-balanced fault-tolerant web access |
-
2000
- 2000-05-17 EP EP00937591A patent/EP1114372A4/en not_active Withdrawn
- 2000-05-17 CA CA002338025A patent/CA2338025C/en not_active Expired - Lifetime
- 2000-05-17 WO PCT/US2000/013595 patent/WO2000072167A1/en not_active Application Discontinuation
- 2000-05-17 KR KR1020017000934A patent/KR20010074733A/ko not_active Application Discontinuation
- 2000-05-17 JP JP2000620492A patent/JP4864210B2/ja not_active Expired - Fee Related
- 2000-05-17 AU AU52738/00A patent/AU5273800A/en not_active Abandoned
- 2000-05-17 CN CNB008009473A patent/CN1173281C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100334546C (zh) * | 2003-07-08 | 2007-08-29 | 联想(北京)有限公司 | 实现机群监控系统使用多种数据库系统的方法和装置 |
CN100422945C (zh) * | 2004-10-22 | 2008-10-01 | 国际商业机器公司 | 在信息存储和检索系统中提供故障恢复保护的设备和方法 |
CN101495993B (zh) * | 2006-08-08 | 2011-02-16 | 瑞科网信科技有限公司 | 用于分布式多重处理安全网关的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2000072167A1 (en) | 2000-11-30 |
AU5273800A (en) | 2000-12-12 |
CA2338025A1 (en) | 2000-11-30 |
JP4864210B2 (ja) | 2012-02-01 |
EP1114372A1 (en) | 2001-07-11 |
CA2338025C (en) | 2004-06-22 |
JP2003500742A (ja) | 2003-01-07 |
KR20010074733A (ko) | 2001-08-09 |
CN1173281C (zh) | 2004-10-27 |
EP1114372A4 (en) | 2009-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6715100B1 (en) | Method and apparatus for implementing a workgroup server array | |
US7734778B2 (en) | Distributed intelligent virtual server | |
US9237131B2 (en) | Virtual private storage array service for cloud servers | |
CN103119907B (zh) | 提供用于访问控制的智能组的系统和方法 | |
CN1173281C (zh) | 用于实现工作组服务器阵列的方法和装置 | |
US7962635B2 (en) | Systems and methods for single session management in load balanced application server clusters | |
CN1224905C (zh) | 在群集计算机系统中的执行资源动作的方法 | |
US6892316B2 (en) | Switchable resource management in clustered computer system | |
CN1713595A (zh) | 协调独立外部资源在请求网格环境中的使用的方法和系统 | |
JP2006510976A5 (zh) | ||
US20090282151A1 (en) | Semi-hierarchical system and method for administration of clusters of computer resources | |
JP4636629B2 (ja) | リモート・サーバの遠隔復旧を提供することができるシステム | |
CN109447876A (zh) | 一种市民卡系统 | |
CA2414869A1 (en) | Method and apparatus for providing computer services | |
CN1906573A (zh) | 支持多个用户的系统和方法 | |
AU2001267719A1 (en) | Method and apparatus for providing computer services | |
CN1674548A (zh) | 带连接管理的预配置拓扑结构 | |
CN1942862A (zh) | 故障转移和负载平衡 | |
EP1646944A2 (en) | System and methods of cooperatively load-balancing clustered servers | |
CN103858382A (zh) | 防火墙群集中的应用状态共享 | |
US20080181415A1 (en) | Systems and Arrangements to Adjust Resource Accessibility Based Upon Usage Modes | |
US20150089062A1 (en) | Methods and systems for dynamically specializing and re-purposing computer servers in an elastically scaling cloud computing infrastructure | |
US20110289548A1 (en) | Guard Computer and a System for Connecting an External Device to a Physical Computer Network | |
US9495257B2 (en) | Networking support for zone clusters based on virtualization of servers | |
KR101103611B1 (ko) | 데이터의 원격 중개 및 분산 제어 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |