CN100421382C - 高扩展性互联网超级服务器的维护单元结构及方法 - Google Patents

高扩展性互联网超级服务器的维护单元结构及方法 Download PDF

Info

Publication number
CN100421382C
CN100421382C CNB2004100642940A CN200410064294A CN100421382C CN 100421382 C CN100421382 C CN 100421382C CN B2004100642940 A CNB2004100642940 A CN B2004100642940A CN 200410064294 A CN200410064294 A CN 200410064294A CN 100421382 C CN100421382 C CN 100421382C
Authority
CN
China
Prior art keywords
server
adss
database
blade
internet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100642940A
Other languages
English (en)
Other versions
CN1592231A (zh
Inventor
大卫·米歇尔·考顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XIANKEXINGYING (SHENZHEN) CO Ltd
Original Assignee
XIANKEXINGYING (SHENZHEN) CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XIANKEXINGYING (SHENZHEN) CO Ltd filed Critical XIANKEXINGYING (SHENZHEN) CO Ltd
Publication of CN1592231A publication Critical patent/CN1592231A/zh
Application granted granted Critical
Publication of CN100421382C publication Critical patent/CN100421382C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种高扩展性互联网超级服务器的维护单元结构及方法,高扩展性互联网络超级服务器在动态数据存储系统(ADSS)服务器出现故障时,动态地重新分配服务器操作。第一和第二ADSS服务器互相映像,并包括具备冗余数据、域主机控制协议服务器、XML接口和监控定时器在内的对应的数据库。ADSS服务器与至少一个服务器操作系统和一台存储交换机连接;存储交换机与至少一个存储单元相连接。第二ADSS服务器通过心跳监控算法检测到第一ADSS服务器故障,自动启动故障备份将功能转换到第二ADSS服务器。本架构还包括由大量与数据管理单元星状配置阵列连接的重新配置的服务器组成的监控数据管理设置。

Description

高扩展性互联网超级服务器的维护单元结构及方法
技术领域
本发明涉及数据处理商用领域,特别是指一种高扩展性互联网超级服务器的维护单元结构及方法。
背景技术
商业化互联网服务提供商和主机服务提供商的出现在很大程度上推动了互联网的迅猛发展,例如网络服务供应商(ISPs)、应用服务供应商(ASPs),独立软件商(ISVs)、企业方案咨询开发商(ESPs)和管理咨询开发商(MSPs)等等。关于以上这些服务,这里并没有一个明确的定义,但通常来说,这些服务供应商和主机设备商所提供的服务就是要迎合一些、大多数甚至全部客户的需求,而这些需求则是关于主机应用、站点开发、电子商务管理以及服务器调配的,以赚取建设费用或周期性服务费为方式。例如,在服务器调配过程而言,费用主要产生于根据客户特别需求并为其应用及站点指定设置的硬件和软件规格上。作为本发明的目的,术语“主机服务”意图涵盖由该领域内服务供应商及主机设备商所提供的各种不同类型的服务。为方便起见,我们统称这些服务供应商及主机设备商为“主机服务提供商”(HSP)。
就像电话公司通过国际电话网络在他们的客户之间提供连线的方式一样,商用HSPs提供给用户一个可以进入网络主机应用的通道。HSPs用于提供主机应用和服务的计算机设备,通常称为服务器。以最简单的方式,该服务器可以是一个通过网络界面连接到互联网上的个人电脑,它可以运行根据该服务器的用户要求专门设计的特别软件。对于HSPs提供主机服务时所使用的各种不同的传输模型,大多数HSPs将使用一组同内部网络连接的服务器集合。这个服务器集合就是我们通常所说的“服务器群组”(server farm)。在这个“群组”中,每个服务器可完成其独特的任务,也可以由几个服务器分担多项不同的任务,例如邮箱服务器、网络服务器、认证服务器和会计及管理服务器。在为环球网站点提供主机服务时,例如单一的网络服务器通常为很多小型的环球网站点聚集及提供支持,大的站点则需要由专门的网络服务器来支持运行。
随着对互联网服务需求的日益增加,互联网产业的市场空间也就越来越大,需要更大容量来满足此类需求。满足这类市场需求的一种方法就是利用更大能力的计算机系统作为服务器。大型的主机和中型的计算机系统开始被用来做大型互联网站点和公用网络的服务器,大多数的HSPs由于考虑到这些系统的高额费用、复杂性和缺少灵活性而不倾向于使用大型计算机系统,这些HSPs反而愿意使用由许多个人电脑服务器组成的“服务器群组”(serverfarm)来支持运行,这些服务器连接到一个共用的互联网连线或调制解调器组上,有时也会进入一组磁盘驱动器中。当HSP增加一个主机服务客户时,一个或更多的个人电脑服务器被手动地增加到HSP“服务器群组”中,并且为此客户安装了特定的软件和数据,如网络内容。通过这种方式,HSP配置一定水平的硬件仅仅是为了支持它当前客户的需求。同样重要的是,HSP可向客户收取前期装置费用以支付该硬件的主要成本。
对于HSP而言,大量计费软件可用于收取这些计量服务的费用,例如rens.com的XaCCT和inovaware.com的HSP Power。已经开发出的其它软件程序用以辅助HSP网络管理,例如lightspeedsystem.com的IP Magic、resonate.com的网络服务管理和laminate.com的MAMBA。通过使用这种方式,HSP不必提前支付附带大量冗余容量的大型计算机系统的费用,而这些费用是不会立即为HSP产生收益的。和使用一个大型主机为不同的客户提供支持相比,“服务器群组”提供了一套简单易行的方法,这套方法在不同客户共存的运行环境中可以确保客户资料的安全性和数据完整性。如果服务器所装载的软件和数据仅仅为特定客户服务,客户信息的安全性则是毫无疑问的。如果为一个客户服务的服务器只装载该客户的软件,并且只连接到该客户的数据,则客户信息因而得到独立处理,其安全性得到保障。HSP的管理和操作已成为各论文和研讨会的主题,如1999年4月19日举行的网络互连研讨会的Hursti、Jani、和“访问互联网和服务提供的管理”。关于HSP每月为提供互联网访问和主机网络站点的商用级别而配置各种硬件、软件、维护和支持的典型实例可浏览网站rackspace.com。
客户需要增加或减少服务的数量时,HSP将手动添加或删除服务器到HSP服务器群组或从HSP服务器群组中添加或删除服务器,该服务器群组直接连接到客户网站的数据存储和网络互连上。添加服务时,主要步骤如下:(1)从主机服务客户处接收到变更服务的命令,(2)HSP获得新的服务器硬件以满足所需变更,(3)HSP专业人员在服务器群组所在位置安装服务器硬件,(4)添加服务器硬件连线到该站点的数据存储和网络连线上,(5)为服务器硬件装载软件,HSP专业人员通过一系列初始化步骤,按客户要求对此软件进行配置,(6)将新安装并经完整配置的服务器加入到服务器群组中,为客户提供主机服务。在任一情况下,每个服务器群组被分配给一个特定客户,且服务器群组必须配置成能够最大限度满足客户的服务需求。
最初,必须重新启动部分或全部管理群组中的现存服务器来完成上述过程,因为现存服务器中的指针和表格需要手动更新来反映新服务器添加到服务器群组中的情况。该需求规定只可以定期在定义明确的服务器窗口中对服务器硬件进行变更,例如在某个星期天晚上的深夜。近期,如MicrosoftWindows 2000,Microsoft Cluster Server,Oracle Parallel Server,WindowsNetwork Load Balancing Service(NLB)等软件及类似程序已经开发出来,并扩展到自动允许新的服务器在任一时间加入到现存群组中,而无需在这些定义明确的窗口中手动执行。
此类服务器集成具有高效性,尤其是在其中一个服务组工作量过大,而另一个服务组工作量过小时。在那种情况下,可以将服务器从一个服务组切换到另一个服务组。专利号5,951,694描述了软件在专门管理服务器上的执行路线,它使用负载均衡方案来修改映射表格以确保管理组在不同服务组中的请求更加均衡。
多个专利描述了在单个群集或管理组中的服务器之间进行工作量均衡的技术。美国专利号6,006,259描述了包括在主服务器控制下的安全和心跳设置的软件群集,群集中的所有成员都分配了共同的IP地址,负载均衡就在群集中执行。美国专利号5,537,542,5,948,065和5,974,462描述了具备共享数据空间的多系统计算机处理系统的各种工作量均衡设置。另外可在客户与服务器之间插入一个中间系统来完成服务器间的分布工作。美国专利号6,097,882描述了客户和服务器之间的复制系统,该复制系统在服务器可用性和工作量的基础上改道IP数据包。
管理服务器和计算机硬件的一个不足之处在于硬件组件出现故障的可能性。在这种情况下,众所周知,服务器系统进入故障备份模式。故障备份模式是一种备份操作模式,在此模式中,由于故障或宕机导致一级组件失效时,二级系统组件将执行一级组件(如处理器、服务器、网络或数据库)的功能。程序自动发送卸载任务到备用系统组件,以便对最终用户来说尽可能无缝。在网络内部,故障备份可以应用于任何组件或组件系统,例如连接路径、存储设备或网络服务器。
美国专利号5,615,329描述了自动排除网络内部硬件组件故障的方法,它包括设置冗余硬件来执行远程数据镜像,这通过使用专门独立的一级和二级计算机系统来实现,其中二级系统在一级系统出现故障时接替执行一级系统的功能。这些镜像设置的问题在于价格昂贵且浪费资源,特别是二级系统在等待一级系统出错时处于闲置备用模式。
美国专利号5,696,895描述了另一个解决方案,即各服务器执行其本身的任务,但每个服务器都被分配作为其它服务器中的一个服务器的备份以防其他服务器出现故障。这使得由两个服务器执行的任务能在备份服务器上得以继续,但性能会被降级。此类解决方案的其它例子有工作分配服务器节点(POD)服务器设计和USI综合网络服务(Complex Web Service)。用于提供这些服务的硬件组件是包括负载均衡软件在内的预定义计算工作分配服务器节点,这也可排除管理组内部硬件组件的故障。即便使用这种预定义计算工作分配服务器节点,也需要花上一个星期来做准备工作和安装。
所有这些解决方案都可以在基于现存硬件计算容量的管理组内部自动管理、均衡工作量及找出硬件故障;然而,很少解决方案可以自动应用额外的硬件资源到管理组。如果预先知道额外硬件资源的需求,最常见的解决方案就是在最高预测需求的基础上为管理组预先配置硬件资源,使管理组在峰期需求时做出正确的响应,而满足这种高峰需求的额外硬件资源在其它时间内未得到充分利用,因此,由于硬件资源的未充分利用,为管理组提供主机服务的成本就增加了。
图1示出了存储区域网络示意图,如图1所示,存储区域网络(SAN,Storage Area Network)中包含存储器,如磁盘或位于计算服务器外部的磁盘阵列(RAID,Redundant Array of Inexpensive Disk)。这些RAID存储器通过使用被称为光纤通道(FC,Fiber Channel)技术连接至服务器,这种光纤通道技术是一种网络技术,它包括传送器,如光纤电缆(Fiber Optic Cable);和分布式的交换方式,如光纤通道交换机;以及为服务器(主机总线匹配或HBA)提供连接的PCI卡。上述系统非常昂贵,而且主要应用在产业上来给服务器提供超出服务器机架原有存储的存储容量。
虽然已经有了为这些类型系统提供一定冗余的方法,但由于RAID仅仅是单个的、自含式的设备,仍然无法通过自由地分配和加载来平衡与RAID设备连接的服务器的数量,具体缺陷如下:每一个用户服务器必须进行手动配置才能连接到RAID设备上;传统的解决方法要求用户服务器首先从内部磁盘开始启动,然后在完成配置后,再通过存储区域网络加入外部存储,这就需要在手动配置后,将要求连接到存储区域网络的配置信息存储到用户服务器上;如果RAID设备完全故障,那么就根本没有任何方法来恢复这种故障,也没有什么方式能顺利地将服务器切换至另一存储装置;由于使用的是手动配置,因此通过远程管理来重新配置解决方法几乎不可能实现;上述这种解决方法的灵活性非常有限,而且成本很高。
尽管HSP管理方式有了一些重要的提高,并且开发了很多程序和工具来辅助HSP网络的操作,但HSP用于创建和维护服务器群组的物理资源的基本技术却改变甚微,因此,希望提供一种更为有效的方式操作HSP,以改善服务器群组的物理资源管理。
发明内容
有鉴于此,本发明的一个目的在于提供一种高扩展性互联网超级服务器的维护单元结构,本发明的另一目的在于提供一种高扩展性互联网超级服务器的维护方法,以改善服务器群组的物理资源管理。
为了达到上述目的,本发明提供了一种高扩展性互联网超级服务器的维护单元结构,包括:
至少一个连接到互联网交换装置的刀片服务器;
第一动态数据存储系统ADSS服务器通过互联网交换装置连接到一个或一个以上刀片服务器,该第一ADSS服务器包括,
第一数据库,该数据库连接到第一个适合在架构内分配IP地址的第一互联网协议地址服务器,
第一XML接口,该XML接口连接在服务器操作系统与第一ADSS服务器之间;
第二ADSS服务器,该ADSS服务器通过互联网交换装置连接到一个或一个以上刀片服务器,该第二ADSS服务器包括,
第二数据库,第一ADSS服务器出现故障时,此数据库连接到适合在架构内分配IP地址的第二互联网协议地址服务器,并与适合为用户提供目录服务的第二ADSS服务器相连接,其中第二数据库连接到第一数据库,并包括来自第一数据库的冗余信息,和
第二XML接口,该XML接口连接在服务器操作系统与第二ADSS服务器之间;
服务器操作系统与至少一个监控数据管理装置连接,第二ADSS服务器使用心跳监控算法检测第一ADSS服务器的故障,并启动故障备份转换第一ADSS服务器功能到第二ADSS服务器;
存储交换机,它与第一ADSS服务器和第二ADSS服务器相连接;和存储单元,该存储单元与存储交换机相连接。
所述第一互联网协议地址服务器和第二互联网协议地址服务器使用从包含动态主机配置协议DHCP和启动协议BOOTP组中选择的通信协议。
所述第一数据库和第二数据库用于存储接收和发起设备地址、可用容量位置和存储映射信息。
所述第一ADSS服务器和第二ADSS服务器进一步包括:监控定时器,用于重启服务器操作。
所述监控数据管理装置包括:监控管理单元SMU与一个或一个以上的数据管理单元DMU相连接,各数据管理单元与一个或一个以上重新配置的刀片服务器相连接。
所述监控数据管理装置包括:
与一个或一个以上重新配置的刀片服务器相连接的数据管理单元DMU,用于监控刀片服务器状态、控制电力功能、响应来自输入/输出装置的命令在各刀片服务器之间进行切换,并且监控各刀片服务器功能,通过管理总线和I/O总线仲裁管理通信;
监控管理单元SMU,与在管理总线和I/O总线连线上呈星状配置的数据管理单元相连接,监控管理单元通过由数据管理单元管理连线传送的命令与数据管理单元相连接。
所述各刀片服务器在接收到底板播放的以释放所有服务器的信号后从通信总线脱离,然后所选择的刀片服务器在所有刀片服务器从通信总线脱离后与通信总线接合。
本发明还公开了一种高扩展性互联网超级服务器的维护方法,该方法包含:第二ADSS服务器中的第二数据库,保存来自第一ADSS中的第一数据库的冗余信息;
第二ADSS服务器使用心跳监控算法检测第一ADSS服务器的故障,当第一ADSS服务器出现故障时,启用第二数据库到适合在架构内分配IP地址的第二互联网协议地址服务器之间的连接,并启用第二数据库与适合为用户提供目录服务的第二ADSS模块之间的连接,转换第一ADSS服务器功能到第二ADSS服务器。
所述步骤A之前包括:
A0、启动用户服务器。
所述步骤A0为:从存储区域网络引导用户服务器启动。
所述步骤A0之前进一步包括:通过启动ROM扩展在用户服务器启动前将相关配置数据送至相应用户服务器。
根据本发明提出的方案,高扩展性互联网络超级服务器在ADSS服务器出现故障时,动态地重新分配服务器操作。第一和第二ADSS服务器互相映像,并包括具备冗余数据、域主机控制协议服务器、XML接口和监控定时器在内的对应的数据库。ADSS服务器与至少一个服务器操作系统和一台存储交换机连接;存储交换机与至少一个存储单元相连接。第二ADSS服务器通过心跳监控算法检测到第一ADSS服务器故障,自动启动故障备份将功能转换到第二ADSS服务器。本架构还包括由大量与数据管理单元星状配置阵列连接的重新配置的服务器组成的监控数据管理设置,提供一种更为有效的方式操作HSP,改善了服务器群组的物理资源管理。
另外,本发明所述的系统还允许通过添加更多的RAID设备扩充已有的存储容量,也允许通过添加更多的ADSS设备增加ADSS存储虚拟带宽的容量。通过这种方式创建了一种安全灵活且可靠的存储方法。
附图说明
图1示出了存储区域网络示意图;
图2示出了使用本发明的iSCSI启动驱动器复制服务器的简易高扩展性互联网络超级服务器的结构图;
图3示出了本发明的iSCSI启动驱动器的激活和操作的流程图;
图4示出了ADSS分布式存储系统的结构示意图;
图5示出了本发明描述的服务器群组的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
本发明中,提供一种使用新方法将现有技术中的局限寻址到存储区域网络,通过分布式及冗余的方法为用户服务器提供存储容量或虚拟磁盘,用户服务器可为刀片服务器。上述方法实现的基础主要是创建一个存储区域网络,这一般可通过光纤通道技术来实现。
图2示出了使用本发明的iSCSI启动驱动器复制服务器的简易高扩展性互联网络超级服务器的结构图,如图2所示,高扩展性互联网络超级服务器的架构100由许多服务器主板定义,每个这样的主板设置为刀片服务器110。高扩展性互联网络超级服务器100内部的物理配置和计算机服务器110设置的细节和本发明的一个实施例由美国专利号6,452,809的专利提供,题为“高扩展性互联网络超级服务器”,在此可供参考,同时提交归档的申请标题为“高扩展性互联网络超级服务器的iSCSI启动驱动方法和设备”。计算机服务器110的优先软件设置在前面标题为“提供动态地主机服务管理到不同账户和站点”的参考申请中详细加以描述。
本发明的架构进一步由动态数据存储系统(ADSS,Active Data StorageSystem)硬件130定义,ADSS硬件130创建了包括ADSS模块132、域主机控制协议(DHCPD,Dynamic Host Configuration Protocol)服务器134、数据库136、XML-接口逻辑138和监控定时器140的ADSS服务器。ADSS硬件130由ADSS硬件150复制,包括ADSS模块152、DHCPD服务器154、数据库156,XML-接口逻辑158和监控定时器160。ADSS硬件130和ADSS硬件150都通过互联网交换装置120连接到刀片服务器110。组合的ADSS硬件130和ADSS硬件150被视为虚拟管理系统,这是可以选择性地连接虚拟容量到发起设备(例如,客户、主机系统或要求读取或写入数据的文件服务器)的系统。
架构100还包括服务器操作系统(Engine OS,Engine Operating System)162,它经由存储交换机166在ADSS硬件130、150和系统管理单元(SMU,System Management Unit)164之间连接,而交换机在ADSS硬件130、150和存储磁盘168之间连接。架构100的全程管理和控制由服务器存在系统162负责,而存储和驱动映射则由ADSS模块132、152负责。
ADSS模块132和152提供目录服务给分布式计算环境和本应用程序,该服务提供单一简化的界面以便用户在回避差异时从不同的网络使用目录资源;这是一个集中化和标准化的系统,它使用户数据、安全性和分布资源的网络管理自动化,并使其与其它目录互相操作。此外,网络管理员被提供网络内在分级视图和管理所有网络对象的单点时,活动目录服务(activedirectory service)允许用户使用单一的登录流程来访问网络中允许访问的资源。
DHCPD服务器134和154在服务器系统内部分配独特的IP地址到与架构100相连接的设备上,例如计算机登录后,DHCPD服务器134和154从特定网络中有效的主列表或地址库中选择独特的且未使用的IP地址分配给系统或客户端,通常这些IP地址可任意分配,客户通过广播缺少IP地址的方式搜索DHCP服务器,DHCP服务器则通过从其主列表或地址库中出租有效的IP地址给客户端做出响应。在本发明中,架构100支持专门的DHCP服务器通过将IP地址和媒介访问控制(MAC)地址相结合来为刀片服务器客户端分配特定IP地址,由于MAC地址是网络接口卡(NIC,NetworkInterface Card)物理的、不可更改的、不变的地址,从而确保刀片服务器客户端的IP地址总是一致。与MAC地址相关的IP地址在最初配置ADSS硬件时随意生成,并且生成后保持不变。另外,本发明中在DHCP标准中使用特定的扩展域来向刀片服务器客户端发送额外信息,该额外信息用于定义找到ADSS硬件所需的iSCSI参数,而这些参数将用于对服务器磁盘的请求和登录ADSS硬件所需的验证。
再回到图2,数据库136和156连接到对应的ADSS模块132和152以及DHCPD服务器134和154,用作接收端、发送端设备寻址、可用容量位置和原始存储映射信息的仓库,同时也用作对应的DHCPD服务器的信息来源。所有ADSS对列成员之间的数据库都被复制,以使主要的系统信息冗余。XML接口后台程序138和158充当服务器操作系统162和ADSS硬件130、150之间的接口,它们提供登录功能和自动操作ADSS硬件的功能。服务器在操作过程中出现死锁状态时,监控定时器140和160重启服务器操作,例如,定时器超时显示ADSS故障。存储交换机166更适宜称为光纤通道或互联网类型,它容许在磁盘168和ADSS硬件130、150之间存储和获取数据。
在架构100所描述的实施例中,除非出现故障,否则ADSS硬件130充当主要的DHCP服务器。心跳监控电路作为连线139位于ADSS硬件130和ADSS硬件150之间用来测试故障。服务器130出现故障时,服务器150将检测心跳响应并立即服务DHCP信息。在特定的大环境中,服务器硬件将通过光纤信道交换机确保所有存储可用,如磁盘168中的存储。因此其中一个服务器出现故障时,另一个服务器(在此仅显示两个服务器)可以执行故障服务器的功能。DHCPD服务器直接与对应的数据库连接,因为架构100的所有IP地址和MAC地址信息的每个服务器只有一个数据库。
在此实施例中,服务器操作系统162(或简易网络界面)通过XML接口后台程序138或158发出“活动”(action)命令来创建、变更或删除虚拟容量。XML接口逻辑138同样发出活动命令来分配和不分配或增加和缩减虚拟容量使其对发送端可用,此外还发出检测、镜像、复制和移动命令。XML界面后台程序138的逻辑部份接收包括以下命令的“活动”命令:检测有效活动命令;转换到服务器命令;执行服务器命令;确认命令执行;失败命令返回;提供反馈信息给服务器操作系统162。服务器操作系统162也通过XML接口逻辑138发出信息咨询,XML接口逻辑138核查有效咨询,转换XML咨询到数据库咨询,转换响应到XML,再返回XML数据到服务器操作系统162。此外,XML接口逻辑138发送告警到服务器操作系统162,故障告警由登录服务器或SNMP发送。
通过以上对高扩展性互联网络超级服务器架构100的描述,再参考图3描述的流程图,对登录到高扩展性互联网络超级服务器的流程做大致了解。通过使用iSCSI启动驱动器登录,在此的操作使得iSCSI启动驱动器被分为两部分:iSCSI虚拟装置(ADSS硬件130和ADSS硬件150组成虚拟装置),请参见图3所示流程图的右部分,和iSCSI启动装置,请参见图3所示流程图的左部分。通过从发起设备发送请求到iSCSI虚拟装置开始登录,经由启动模块202。iSCSI虚拟装置确定虚拟容量是否已经分配到请求发起设备,经由决策模块204。如果虚拟容量未分配发起设备,则iSCSI虚拟装置等待新的启动请求。相反,如果虚拟容量已经分配到发起设备,则登录继续进行,由此来自DHCPD服务器134的响应被发起设备的MAC地址激活,经由操作模块206。然后,ADSS模块132被告知虚拟容量的分配与MAC连接,经由操作模块208,并连接到刀片服务器110的电源,经由iSCSI启动装置的操作模块210。
然后,网络接口卡生成外部组件互连(PCI,Peripheral ComponentInterconnect)设备ID掩码,因此发送启动请求,经由操作模块212。众所周知,刀片服务器由数据库136内部的以下特征定义:(1)预定义的网络接口卡的MAC地址;(2)(分配的)发起设备的IP地址,包括(a)A级子网[255.0.0.0],(b)10.[机柜].[机架].[刀片槽];(3)iSCSI验证域(分配的)包括:(a)穿透式DHCP,(b)发起设备名称。术语“穿透式DHCP”指的是所有iSCSI验证域都通过DHCP被推向客户发送端。具体来说,所有当前iSCSI部署均要求诸如用户名、密码、iSCSI接收端的将服务于容量的IP地址等的验证信息通过操作系统实用软件手动输入客户后台。这就是为什么优先iSCSI部署不能启动的主要原因之一,因为该信息直到装入操作系统和对应的iSCSI软件驱动程序时及读取预设置参数或者由操作员手动输入该信息时才可使用。
通过经由DHCP发送此信息,本发明不仅提供了在启动过程的预OS阶段使此信息对客户发送端(发起设备)可用的方法,而且还可以创建中央权限ADSS,ADSS可以存储并且动态地更改这些设置以便于一些操作,这些操作如可选ADSS单元的自动备份,或在不干扰客户应用前提下添加或更改安装在客户机上的虚拟磁盘的数量和大小。
在题为“高扩展性互联网络超级服务器的iSCSI启动驱动方法和设备”的申请中有更为详细的描述,iSCSI启动ROM中断启动过程并发送发现请求到DHCP服务器134,经由操作模块214。DHCP服务器134基于发起设备的MAC和负载均衡规则对发现请求作出响应,经由操作模块216。具体来说,DHCP服务器134发送客户IP地址、掩码和网关,同时发送iSCSI登录信息:(1)服务器的IP地址(ADSS硬件的IP地址);(2)协议(默认为传输控制协议(TCP));(3)端口号码(默认3260);(4)初始逻辑单元号码(LUN);(5)接收端名称,如ADSS服务器的iSCSI目标名称;(6)发起设备名称。
关于DHCP服务器的负载均衡条例选项,在工作量较轻时,首先选择某些ADSS单元来满足客户的需求。ADSS系统架构中的负载均衡包括两个提供DHCP、数据库和管理资源的ADSS主服务器,并被配置成关键数据库信息和DHCP服务的容错群集。另外包括在内的是大量从属ADSS的组件,这些组件与ADSS主服务器相连并由它控制,这些从属ADSS单元仅服务于虚拟容量。通过最小连接的优先级模型,其中在服务于新的客户时ADSS总是优先服务于最小数量的客户,负载均衡由在不同ADSS单元之间分布虚拟容量服务的职责而实现。服务的级别也通过限制客户的最大数量来实现,任何ADSS都能够因此为客户创建更多的存储带宽,这些客户都使用这些上限设置的ADSS单元而非那些在标准ADSS库上操作的单元。
再回到图3,iSCSI启动ROM继续接收DHCPD服务器134信息,经由操作模块218,再使用此信息启动登录到服务器,经由操作模块220。ADSS模块132接收登录请求,并在引入登录和发起设备名称的MAC上验证该请求,经由操作模块222。接下来,ADSS模块创建登录对话并服务于分配的虚拟容量,经由操作模块224。iSCSI启动ROM模拟带虚拟容量的DOS磁盘和13号中断指针信号,经由操作模块226。iSCSI启动ROM在上端存储区域(UMB,Upper Memory Block)中存储ADSS登录信息,经由操作模块228。然后启动继续进行,经由操作模块230。
由此,服务器从iSCSI模块通过网络以16位模式启动,经由操作模块232。16位操作系统引导程序载入32位统一iSCSI驱动程序,经由操作模块234。32位统一iSCSI驱动程序从UMB中读取ADSS登录信息,再重新登录,经由操作模块236。ADSS模块132接收到登录请求,再基于MAC重新加以验证,经由操作模块238。然后,ADSS模块重建登录对话,再服务于分配的虚拟容量,经由操作模块240。最后,32位操作系统完全激活使用的iSCSI模块,就如同是本地设备一样使用自如,经由操作模块242。
根据以上描述,将本发明的实现大致总结如下:本发明中描述的方法描述了一种用户服务器中不包含内部磁盘,而是专门从一个成本低廉、灵活性高的存储区域网络启动。这就要求:
一、使用一种方法在用户服务器启动前将相关配置数据送至相应用户服务器,这一点是通过使用启动ROM扩展来实现的,而这种扩展是启动程序之前先接收数据,并使用DHCP协议来发送相关数据;
二、一种方式是从存储区域网络引导用户服务器启动,同样这一点也是通过启动ROM扩展来实现的,在这个扩展上为用户服务器安装远程虚拟磁盘(Remote Virtual Disk)并仿真一个本地磁盘;
三、使用iSCSI作为传输介质,而不使用光纤通道;
四、使用位于原始RAID存储装置与服务器之间的ADSS存储虚拟器系统(Storage Virtualizer System);
五、使用一种群组的方法来获得许多ADSS设备,从而满足用户服务器的存储需求。
图4示出了ADSS分布式存储系统的结构示意图,如图4所示,针对传统存储区域网络解决方案成本的考虑,现在采用了一种叫做iSCSI的新型传送方法。iSCSI是一种用来封装SCSI标准的方式,它是用于通过TCP/IP协议在磁盘与计算机之间进行通信的传输方法。从根本上讲,这种方法是使用了一种更为廉价和成熟的千兆以太网络来替代价格昂贵的外部光纤通道网络。然而,由于iSCSI是一种软件协议,它要求用户服务器首先导入操作系统,然后再附加外部存储,因此,目前iSCSI面临着与光纤通道同样的问题。它还要求通过手动配置将所需的信息连接到相应的外部存储上。
在本发明中建议的方法是在用户服务器之间将iSCSI用作唯一的传送方法,并通过使用ROM BIOS扩展来解决问题。这个ROM BIOS扩展被添加到用户服务器上,这样当接通电源后,它便可以控制服务器,然后再通过内装磁盘来启动并操作系统。不同的是,这个ROM BIOS扩展与一个千兆网络适配器(Gigabit Network Adapter)相连接,然后为其配置数据发出请求。这个配置数据用于通知用户服务器到何处去寻找它的“磁盘”。
这个请求使用动态主机配置协议(DHCP,Dynamic Host ConfigurationProtocol),然后在其中一个DHCP请求就被一个ADSS服务器所接收,这个请求的响应反馈给用户服务器相应的信息,即通知用户服务器应到何处去寻找供其使用的“磁盘”。由于用户服务器的配置可以迅速进行更改,这样,便允许自由地选择使用哪一个ADSS存储虚拟器为用户服务器提供服务。
根据定义,通过千兆以太网使用iSCSI将这个ADSS存储器虚拟器与用户刀片服务器进行连接,然而它们或是使用光纤通道或是使用SCSI协议附加到大量RAID存储设备上。ADSS设备还将光纤通道或是SCSI协议翻译成iSCSI,同时创建一种方式将RAID存储器分割成若干小的虚拟磁盘。
在图4中,采用许多RAID设备与ADSS设备相连这样一种方式,以便所有ADSS设备都能够“看见”全部的RAID存储器,因此,用户服务器就能够使用任何ADSS设备来满足它的存储要求。
当ADSS设备能够将这些虚拟磁盘存储到多个RAID设备上时,这个系统的灵活性就显而易见了,因此也就能够提供额外的冗余了。同样地,由于ADSS设备能够访问所有的RAID设备,因此虚拟磁盘就能够在RAID设备之间自由移动,却不会影响用户服务器的功能。
反过来,由于可以通过DHCP协议向用户服务器发送配置信息,因此便能够任意地指示用户服务器从别的ADSS设备访问它的虚拟磁盘,而不必此从原来的地方进入。例如,如果一个ADSS设备故障,便可指示用户服务器改变其路径到它的虚拟磁盘上去寻找另一个ADSS设备,同样能够运行。ADSS设备也可访问主导数据的RAID设备。
最后,此系统还允许通过添加更多的RAID设备扩充已有的存储容量,也允许通过添加更多的ADSS设备增加ADSS存储虚拟带宽的容量。通过这种方式创建了一种安全灵活且可靠的存储方法。
这个方法的重要性在于能够集中控制存储映像到用户服务器的方法。例如,如果一个用户希望使用Windows 2000启动几个用户服务器,ADSS系统便能够将这些Windows 2000的虚拟磁盘安装到用户的刀片服务器上。这样,程序就简单到只需接通刀片服务器的电源,它们便能够启动Windows2000。如果用户希望将Windows 2000改变为Linux,那么该用户只需将电源断开,重新对Linux虚拟磁盘进行映像,再重新接通电源即可。
在本发明中所述的高扩展性互联网络超级服务器中,存在一个主控制系统叫做Engine OS,它能够控制用户服务器(以刀片的形式)和ADSS系统(借助于XML协议)。这样就使得程序及其简单,因为Engine OS能够控制接通和断开用户刀片服务器的电源以及映像到用户服务器中的存储。这样,管理回路就完成了,而整个系统业能够自由地重新配置,不需要直接手动干涉用户服务器。
图5示出了本发明描述的服务器群组的结构图,即组成架构100的监控数据管理装置(Supervisory Data Management Arrangement)300,如图5所示,监控数据管理装置300包括与大量分布式管理单元(DMU,DistributedManagement Unit)332~338相连的大量重新配置的刀片服务器312、314、316和318,这些分布式管理单元又至少与一个监控管理单元(SMU,Supervisory Management Unit)360连接。SMU 360包括共享KVM/USB设备的输出362和互联网管理输出364。
在此实施例中,每一个刀片服务器机架312~318(共4个)内装8个刀片服务器,每一个DMU模块通过通信连线322A、324A、326A和328A监视刀片服务器的运行状况和机架风扇、电压以及机架温度。DMU还控制机架内刀片服务器的电源供应,并通过通信连线322B、324B、326B和328B响应来自输入和输出设备在机架内单个服务器间进行切换。此外,各个DMU模块332、334、336和338监控服务器不同的功能,并通过管理总线342A、344A、346A、348A和I/O总线342B、344B、346B、348B从SMU 360仲裁管理通信。另外,DMU模块固定KVM/USB输出和管理信号到单个DVI型电线,该电线连接到SMU 360,再存储事件循环日志。
在此实施例中,每个服务器的每个刀片包括一个嵌入式微控制器。此嵌入式微控制器监控主板,将其状态存储在循环日志中,即时报告状态,出现问题时发送告警及接受不同功能命令,例如开机、关机、复位、KVM(键盘、视频和鼠标)选择和KVM释放。这些通信功能通过连线322C、324C、326C和328C完成。
例如,SMU 360与呈星状配置的DMU模块在管理总线342A、344A、346A、348A和I/O总线342B、344B、346B、348B连线上相连,SMU 360通过经由DMU管理连线传送的命令与DMU连接。管理通信通过连接具有检测和重新传送能力的共享总线的可靠通信包处理。SMU模块与DMU外型相同,本地机架包含嵌入式DMU。SMU经由送往DMU的命令在管理连线342~348上与四个刀片服务器机架(刀片服务器单元)连接。SMU通过互联网端口为机架提供高级别用户界面。SMU切换并巩固KVM/USB总线并将其传送到共享KVM/USB输出插口。
键盘、视频、鼠标和USB(KVM/USB)在服务器之间的切换通过切换总线方式进行操作。选择第一个刀片服务器将使得底板信号播放,从而释放KVM/USB总线的所有服务器。所有的刀片服务器将接收底板信号,前一个与总线连接的刀片服务器脱离,而所选的刀片服务器将与通信总线接合。
在以上描述的各个实施例中可以看出,本发明架构优势在于ADSS系统的分布式特性。尽管另一个知名系统提供了具备故障备份能力的存储虚拟装置的容错对,但没有其他扩展可能,而本发明优先提供分布式虚拟装置,例如任意ADSS都能够服务于任意的客户刀片,因为ADSS单元能够“看到”所有的客户刀片,可以看到储存虚拟容量的所有RAID存储单元。以此方式,客户服务器可以被映射至任意ADSS单元请求自动备份或重新分布负载能力,这样就可以在任一时间添加ADSS单元来升级整个系统的混合带宽。
本发明协议受版权保护,版权所有人仅允许在专利和商标局文件或记录中出现本发明传真与复制件,否则一概保留版权。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1. 一种高扩展性互联网超级服务器的维护单元结构,其特征在于,包括:
至少一个连接到互联网交换装置的刀片服务器;
第一动态数据存储系统ADSS服务器通过互联网交换装置连接到一个或一个以上刀片服务器,该第一ADSS服务器包括,
第一数据库,该数据库连接到第一个适合在架构内分配IP地址的第一互联网协议地址服务器,
第一XML接口,该XML接口连接在服务器操作系统与第一ADSS服务器之间;
第二ADSS服务器,该ADSS服务器通过互联网交换装置连接到一个或一个以上刀片服务器,该第二ADSS服务器包括,
第二数据库,第一ADSS服务器出现故障时,此数据库连接到适合在架构内分配IP地址的第二互联网协议地址服务器,并与适合为用户提供目录服务的第二ADSS模块相连接,其中第二数据库连接到第一数据库,并包括来自第一数据库的冗余信息,和
第二XML接口,该XML接口连接在服务器操作系统与第二ADSS服务器之间;
服务器操作系统与至少一个监控数据管理装置连接,第二ADSS服务器使用心跳监控算法检测第一ADSS服务器的故障,并启动故障备份转换第一ADSS服务器功能到第二ADSS服务器;
存储交换机,它与第一ADSS服务器和第二ADSS服务器相连接;和存储单元,该存储单元与存储交换机相连接。
2. 根据权利要求1所述的维护单元结构,其特征在于:所述第一互联网协议地址服务器和第二互联网协议地址服务器使用从包含动态主机配置协议DHCP和启动协议BOOTP组中选择的通信协议。
3. 根据权利要求1所述的维护单元结构,其特征在于:所述第一数据库和第二数据库用于存储接收和发起设备地址、可用容量位置和存储映射信息。
4. 根据权利要求1所述的维护单元结构,其特征在于,所述第一ADSS服务器和第二ADSS服务器进一步包括:监控定时器,用于重启服务器操作。
5. 根据权利要求1所述的维护单元结构,其特征在于,所述监控数据管理装置包括:监控管理单元SMU与一个或一个以上的数据管理单元DMU相连接,各数据管理单元与一个或一个以上重新配置的刀片服务器相连接。
6. 根据权利要求5所述的维护单元结构,其特征在于,所述监控数据管理装置包括:
与一个或一个以上重新配置的刀片服务器相连接的数据管理单元DMU,用于监控刀片服务器状态、控制电力功能、响应来自输入/输出装置的命令在各刀片服务器之间进行切换,并且监控各刀片服务器功能,通过管理总线和I/O总线仲裁管理通信;
监控管理单元SMU,与在管理总线和I/O总线连线上呈星状配置的数据管理单元相连接,监控管理单元通过由数据管理单元管理连线传送的命令与数据管理单元相连接。
7. 根据权利要求6所述的维护单元结构,其特征在于,所述各刀片服务器在接收到底板播放的以释放所有服务器的信号后从通信总线脱离,然后所选择的刀片服务器在所有刀片服务器从通信总线脱离后与通信总线接合。
8. 一种高扩展性互联网超级服务器的维护方法,其特征在于,该方法包含以下步骤:第二ADSS服务器中的第二数据库,保存来自第一ADSS中的第一数据库的冗余信息;
第二ADSS服务器使用心跳监控算法检测第一ADSS服务器的故障,当第一ADSS服务器出现故障时,启用第二数据库到适合在架构内分配IP地址的第二互联网协议地址服务器之间的连接,并启用第二数据库与适合为用户提供目录服务的第二ADSS模块之间的连接,转换第一ADSS服务器功能到第二ADSS服务器。
9. 根据权利要求8所述的方法,其特征在于,所述步骤A之前包括:
A0、启动用户服务器。
10. 根据权利要求9所述的方法,其特征在于,所述步骤A0为:从存储区域网络引导用户服务器启动。
11. 根据权利要求9所述的方法,其特征在于,所述步骤A0之前进一步包括:通过启动ROM扩展在用户服务器启动前将相关配置数据送至相应用户服务器。
CNB2004100642940A 2003-08-28 2004-08-30 高扩展性互联网超级服务器的维护单元结构及方法 Expired - Fee Related CN100421382C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US49849303P 2003-08-28 2003-08-28
US60/498,493 2003-08-28

Publications (2)

Publication Number Publication Date
CN1592231A CN1592231A (zh) 2005-03-09
CN100421382C true CN100421382C (zh) 2008-09-24

Family

ID=34619291

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100642940A Expired - Fee Related CN100421382C (zh) 2003-08-28 2004-08-30 高扩展性互联网超级服务器的维护单元结构及方法

Country Status (1)

Country Link
CN (1) CN100421382C (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430629B2 (en) * 2005-05-12 2008-09-30 International Business Machines Corporation Internet SCSI communication via UNDI services
US7492765B2 (en) * 2005-06-15 2009-02-17 Cisco Technology Inc. Methods and devices for networking blade servers
BRPI0520719B1 (pt) * 2005-12-16 2018-02-14 Telefonaktiebolaget Lm Ericsson Publ “método e aparelho de rede para fornecer uma função de servidor de gerenciador de documento de xml para um cliente de gerenciador de documento de xml, e, entidade de rede para fornecer pelo menos parte de uma função de servidor de gerenciador de documento de xml para um cliente de gerenciador de documento de xml”
CN101212477B (zh) * 2006-12-30 2010-11-10 广达电脑股份有限公司 刀锋型服务器中的嵌入式系统间的管理接口
CN101551649B (zh) * 2008-03-31 2011-06-29 上海宝信软件股份有限公司 支持单连接的设备监控装置及其实现方法
CN101741607B (zh) * 2008-11-11 2013-06-12 大唐移动通信设备有限公司 一种电信设备及其内部资源管理方法
CN101778091B (zh) * 2009-01-08 2012-07-18 王垒 可扩充式安全服务器交替系统
CN102006190B (zh) * 2010-11-23 2012-10-31 浪潮(北京)电子信息产业有限公司 一种高可用集群备份系统及其备份方法
CN103516918B (zh) * 2012-06-28 2018-02-27 中兴通讯股份有限公司 资源故障恢复方法及装置
CN103618788A (zh) * 2013-11-26 2014-03-05 曙光信息产业股份有限公司 一种支持b/s结构系统高可用的方法
CN107710802B (zh) * 2015-06-26 2022-02-18 瑞典爱立信有限公司 在控制节点和服务无线电节点中使用的方法及相关设备
TWI546682B (zh) * 2015-07-06 2016-08-21 群暉科技股份有限公司 藉助於混和管理路徑來管理一儲存系統之方法與裝置
US10331434B2 (en) * 2016-12-21 2019-06-25 Quanta Computer Inc. System and method for remotely updating firmware
CN111752626B (zh) * 2020-06-24 2022-06-07 深圳忆联信息系统有限公司 解决布署指纹驱动缺失的实现方法、装置和计算机设备
CN112667477B (zh) * 2020-12-30 2023-05-12 湖南博匠信息科技有限公司 刀片式板卡的记录监控方法及系统
CN113961397A (zh) * 2021-10-28 2022-01-21 航天壹进制(南京)数据科技有限公司 一种基于备份容灾系统的高可用集群容灾方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889935A (en) * 1996-05-28 1999-03-30 Emc Corporation Disaster control features for remote data mirroring
CN1340928A (zh) * 2000-09-02 2002-03-20 深圳市中兴通讯股份有限公司 通讯系统备份方法和设备
US6502205B1 (en) * 1993-04-23 2002-12-31 Emc Corporation Asynchronous remote data mirroring system
US20030005350A1 (en) * 2001-06-29 2003-01-02 Maarten Koning Failover management system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502205B1 (en) * 1993-04-23 2002-12-31 Emc Corporation Asynchronous remote data mirroring system
US5889935A (en) * 1996-05-28 1999-03-30 Emc Corporation Disaster control features for remote data mirroring
CN1340928A (zh) * 2000-09-02 2002-03-20 深圳市中兴通讯股份有限公司 通讯系统备份方法和设备
US20030005350A1 (en) * 2001-06-29 2003-01-02 Maarten Koning Failover management system

Also Published As

Publication number Publication date
CN1592231A (zh) 2005-03-09

Similar Documents

Publication Publication Date Title
US20050080891A1 (en) Maintenance unit architecture for a scalable internet engine
US10824343B2 (en) Managing access of multiple executing programs to non-local block data storage
CN100421382C (zh) 高扩展性互联网超级服务器的维护单元结构及方法
US9787780B1 (en) Method and apparatus for web based storage on-demand
US6587970B1 (en) Method and apparatus for performing site failover
US6898727B1 (en) Method and apparatus for providing host resources for an electronic commerce site
US9262273B2 (en) Providing executing programs with reliable access to non-local block data storage
US9569123B2 (en) Providing executing programs with access to stored block data of others
KR100840960B1 (ko) 동적 호스트 서비스 관리를 제공하기 위한 방법 및 시스템
US7831682B2 (en) Providing a reliable backing store for block data storage
US6996502B2 (en) Remote enterprise management of high availability systems
EP2426605B1 (en) Providing executing programs with reliable access to non-local block data storage
US9288266B1 (en) Method and apparatus for web based storage on-demand
US7281031B1 (en) Method and apparatus for providing additional resources for a host computer
US8224941B2 (en) Method, apparatus, and computer product for managing operation
US8387013B2 (en) Method, apparatus, and computer product for managing operation
CN107404524A (zh) 一种分布式集群节点访问的方法及装置
US9602600B1 (en) Method and apparatus for web based storage on-demand
CN102110071A (zh) 一种虚拟机集群系统及其实现方法
CN1834912B (zh) 用于可扩展互联网引擎的iSCSI引导驱动系统及方法
Chen New Development of Storage Architectures and Network Managed PCs
GUIDE VMware View 5.1 and FlexPod
Fan et al. An Architecture of Virtual Desktop Cloud: Design and Implementation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080924

Termination date: 20150830

EXPY Termination of patent right or utility model