具体实施方式
现将参考其中相同的标号代表相似的元素的附图来描述各实施例。
一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其它类型的结构。也可使用其它计算机系统配置,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等等。也可使用在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。
图1示出了用于管理与在线服务相关联的网络的云管理系统。系统100示出了云管理器105,该云管理器105连接到并且管理可能分布在世界各地的不同网络。网络中的每个被配置成为一个或多个承租人(例如客户、顾客)提供内容服务。这些网络可以寄宿在云服务内和/或现场(on-premises)数据中心内。云管理器105用于部署、配置和管理这些网络。云管理器被配置为通过可容忍间歇性网络故障的幂等的和异步的应用web服务应用程序编程接口(API)150来接收请求。
如所示的,云管理器105包括工作管理器110、机器管理器115、应用程序专用管理器120、脚本130以及诸如数据存储140(例如数据库)的中央储存库。未包括在所示管理器之一内的功能可以驻留在云管理器的某个其他位置处。根据一个实施例,应用程序管理器120是SharePoint承租人管理器,该管理器包括SharePoint专用逻辑。
工作管理器110管理任务的执行,并且启用对较长时间运行的任务的调度和重试。工作管理器110启动存储在作业队列112中的作业并且保持跟踪运行中的作业。当已经流逝了预定的时间时,工作管理器110可以自动地取消任务并且执行与该任务相关的某些进一步处理。根据一个实施例,作业队列112中的任务由工作管理器110通过调用一个或多个脚本130来执行。例如,可以使用诸如微软的的脚本语言来对由工作管理器110执行的任务进行编程。每个脚本可以作为新进程运行。尽管将每个脚本作为新进程来执行可以具有相当高的CPU开销,但是该系统是可伸缩的,并且帮助为每次脚本执行确保干净的环境,加上在脚本完成时进行完全的清理。
机器管理器115被配置为管理网络(例如网络1、网络2、网络3)中的物理机器。一般而言,机器管理器115理解网络、物理机器、虚拟机(VM)、VM映像(VHD)等等。机器管理器不必牢固地绑定到网络内运行的特定服务,而是在“角色”方面保持跟踪网络中的各种组件。例如,可以通过API150请求机器管理器115在网络3上部署类型为“Foo”的具有版本12.34.56.78的VM。响应于对云管理器105的请求,机器管理器115对位于网络3上的合适物理机器进行定位,并且根据与VM的角色相关联的VM映像来配置VM。使用类型为Foo的具有版本12.34.56.78的VHD来配置物理机器,该VHD存储在诸如数据存储140的数据存储内。在网络内使用的映像也可以存储在其他位置处,诸如用于网络中的一个或多个的本地数据共享中。可以运行脚本来执行VHD在物理机器上的安装以及用于执行任何部署后的配置。机器管理器115保持跟踪每个网络的机器配置。例如,机器管理器115可以跟踪VM的角色(VM的类型)、VM的状态(供应、运行、停止、故障)、版本以及VM是否存在于给定场(farm)中(这隐含了其网络)。
脚本130被配置为存储将要执行以便本地地为云管理器105执行工作以及远程地在所述网络中的一个或多个上执行工作的脚本。脚本130中的一个或多个还可以存储在其他位置。例如,将要在网络(例如网络1、网络2、网络3)上执行的脚本可以本地地存储到该网络。这些脚本可用于许多不同目的。例如,所述脚本可以用于执行:对网络中的一个或多个中的机器的配置,改变之前配置的机器的设置,添加新的VM,添加新的数据库,将数据从一个机器移动到另一个,移动承租人,改变方案等。根据一个实施例,这些脚本是微软的脚本。也可以使用其他编程实施方式。例如,可以使用编译和/或前期绑定编程语言来实现该功能。然而,脚本是一种表达许多将要执行的任务的相当精确的语言。用诸如C#的编程语言对其等价物进行编程将常常需要冗长得多的实施方式。.脚本还被后期绑定,这意味着可以以底层代码库的多个版本为目标,而不必不断地链接到不同的接口DLL。使用PowerShell脚本将允许进程由云管理器105本地地启动,云管理器105进而可以启动远程机器(即,所附连的网络之一中的物理机器)上的进程。还可以使用其他技术来启动远程机器上的进程,诸如安全Shell(SSH)等。
云管理器105所管理的应用程序专用信息由应用程序管理器120来执行。根据一个实施例,应用程序专用信息与微软有关。由此,应用程序管理器120被配置为了解SharePoint承租人、站点集合等。
每个网络可以被配置成用于承租人的专用网络和/或服务于一个以上客户的多承租人网络。该网络可以包括变化数目的物理/虚拟机,物理/虚拟机的配置在部署之后也变化。一般而言,只要未超过联网极限(例如,负载平衡器和网络交换机),网络就可以继续增长。例如,网络可以从十个服务器开始,并且之后扩充为一百个或更多个服务器。可以给网络内的物理机器分配类或类型。例如,机器中的某些可以是计算机器(用于web前端和应用程序服务器),并且其他机器可以是与计算机器相比配备有更多存储的存储机器。根据实施例,云管理器105用映像文件的多个版本来配置网络内的机器。根据实施例,场常常具有映像文件的相同版本。
根据一个实施例,在网络内由云管理器系统100通过虚拟化机器并且管理该网络内部独立地行动的“场”来管理软件极限。每个网络可以包括一个或多个场(例如,参见网络1)。根据一个实施例,网络被认为是经网络负载平衡的机器的单个群集,这些机器向外部世界展示一个或多个VIP(虚拟IP)并且可以将通信路由到该网络内的任何机器。网络中的机器通常是紧密耦合的,并且具有最小等待时间(即<1ms查验(ping)等待时间)。
场是用于对需要紧密绑定关系的应用程序进行协调的机器的基本分组。例如,可以在每个网络内为诸如Microsoft的内容管理应用程序部署内容场。一般而言,场的每个中的那组机器一起提供web服务和应用程序服务器功能。通常,场内的机器运行相同构建的应用程序(即SharePoint)并且共享公共的配置数据库以服务特定的承租人和站点集合。
场可以包含异构的虚拟机组。云管理器105在数据存储140内维护“场目标”,该场目标是每个场的每种角色的机器的目标数目。某些角色包括内容前端、内容中央管理、内容计时器服务、联合中央管理、联合应用程序服务器等。例如,内容场是处理传入的顾客请求的基本SharePoint场。联合服务场包含可以跨场运行的诸如搜索和简档存储的SharePoint服务。场可以用于主存大容量公共因特网站点。某些场可以包含一组活动目录服务器和供应端口监控程序(Daemon)。云管理器105自动地部署网络中的虚拟机和/或让网络中的虚拟机退役,以帮助满足所定义的目标。这些场目标可以自动地和/或手动地来配置。例如,场目标可以响应于活动和容量需求的改变而改变。网络场—每个网络存在一个包含可以作为整个网络的资源而容易地横向扩展(scale out)的所有VM角色的网络场。
云管理器web服务API150被设计为在大规模可伸缩的全球服务的上下文中工作。该API假定:任何网络请求可能失效和/或挂起在传送中。对云管理器105的调用被配置为是幂等的。换言之,可以对云管理器105进行多次相同的调用(只要参数是相同的)而不改变结果。
云管理器105被设计为在向任何给定的请求返回响应之前进行非常少的处理(<10ms,<50ms)。云管理器105维护记录以保持跟踪当前请求。例如,云管理器105更新本地数据库中的记录,并且若需要则稍后调度“作业”以执行更长的活动。
云管理器保持跟踪作为用于在网络内部署新机器的模板的映像(诸如,虚拟盘映像)。映像引用可以存储在诸如数据库140的数据库中和/或某个其他位置。映像可以存储在对其上将部署映像的网络而言是本地的一个或多个共享的数据存储中。根据一个实施例,每个映像都包括:虚拟机(VM)角色类型,它指定映像可以部署的VM的类型;该映像应当使用的处理器的数目;将分配给该映像的RAM的数量;用于找出附近安装点的网络ID(使得它们不会通过跨数据中心链接被反复地复制);以及可以被部署代码用于访问VHD的共享路径。
一般而言,由云系统100所管理的网络中的机器不是以传统方式通过下载数据并且将该数据合并到机器上的现有软件中来升级的。相反,机器是通过用已更新的VHD替换VHD来更新的。例如,当场需要软件的新版本时,部署具有安装了该新版本的新场。当部署新场时,将承租人从旧场移动到该新场。以此方式,由于升级造成的停机时间被最小化,并且场中的每个机器具有已被测试的相同版本。当虚拟机需要升级时,机器上的VM可以被删除并且被配置为运行所需服务的VM所代替。
尽管对现有软件的升级不是最优的,但是网络内的某些服务器使用原地升级的传统更新过程。例如,活动目录域控制器是通过更新服务器上的当前软件而不是完全替换机器上的映像来升级的。在一些实例中,云管理器也可以原地升级。
图2示出了包括管理器和相关联的数据库的云管理器。如所示的,云管理器200包括工作管理器210、工作数据库215、机器管理器220、机器数据库225、承租人管理器230、承租人数据库235、私密数据库245、以及web服务API240。
一般而言,将在云管理系统(例如系统100)内使用的数据库的大小调整为实现高性能。例如,数据库(诸如,工作数据库215、机器数据库225、承租人数据库235和私密数据库245)不能超过预定义的大小限制(例如30GB、50GB、100GB等)。根据实施例,调整数据库的大小以使得其小得足以放入物理机器的存储器中。这有助于高读取I/O性能。还可以基于应用程序(诸如,与SQL服务器交互时)的性能来选择数据库的大小。还可以调整用在场中的数据库的大小以实现高性能。例如,它们的大小可以被调整为能放入主机的存储器中和/或被调整为使得备份操作、移动操作、复制操作、恢复操作一般在预定的时间段内执行。
云管理器200将云管理器数据划分成四个数据库。工作数据库215用于工作管理器。机器数据库225用于机器管理器220。承租人数据库235用于承租人管理器230,并且私密数据库245用于存储敏感信息,诸如系统账户和密码信息、凭证、证书等。数据库可以位于同一服务器上,或者跨服务器分割。根据实施例,每个数据库被镜像以获得高可用性,并且是SQL数据库。
云管理器200被配置为使用缩减的SQL特征组与数据库交互以便有助于在数据库升级期间提供云管理器200的可用性。例如,尝试避免外来密钥或已存储的过程。外来密钥可能使方案变化变得困难并且导致意料之外的故障情况。已存储的过程将应用程序中的更多个放置在数据库本身中。
尝试最小化与SQL服务器的通信,因为与底层操作的成本相比,往返可能是昂贵的。例如,如果当前SQL服务器到单个数据库的全部交互被包装在单个往返中,则常常是效率高得多的。
极少在数据库(215,225,235)内使用限制条件。一般而言,限制条件在其有助于在没有额外查询的情况下提供具有正确类型的错误处理的简单更新时是有益的。例如,完全合格的域名(FQDN)表具有对“名称”施加的限制条件,以帮助防止承租人意外地试图主张与已经被分配给不同承租人的FQDN相同的FQDN。
当添加索引时使用警告。索引通常以写入操作的额外I/O为代价来改善读取性能。由于数据库内的数据主要是驻留在RAM上的,因此即使全表扫描仍然是相对快的。根据实施例,一旦查询模式已经稳定并且所提出的索引可以确定性能改善,就可以添加索引。根据实施例,如果添加索引将可能花费长时间,则“ONLINE=ON(在线=开启)”选项可以被指定,以使得在最初构该建索引时表不被锁定。
根据实施例,可以执行对云管理器内数据库的升级而不导致云管理器系统停机。换言之,即使在云管理器升级期间,云管理器继续处理已接收的请求。由此,对方案作出的改变应与之前的方案兼容。在升级云管理器所使用的web服务器之前进行SQL方案升级。当web服务器升级时,它们可以开始使用数据库中所启用的新特性。数据库升级被限制以使得升级中所涉及的操作是快速和有效的。例如,可以添加表,并且可以向现有列添加新的可空列。可以在表的结尾处添加新的列。一般而言,避免对数据库的耗时操作。例如,在创建时间向新添加的列添加缺省值可能在存在大量数据时是非常耗时的操作。然而,添加可空列是非常快速的操作。如上面所讨论的,允许添加新的索引,但是在添加新的限制条件时应当采取警告,以帮助保证方案升级不会破坏现有数据。例如,当添加限制条件时,该限制条件可以被设置为如下状态:该限制条件不被检查并且避免对现有行和潜在的错误进行高成本的验证。旧表和不使用的列在新版本被使用并且云管理器不访问这些表和列之后被移除。
一般而言,每个数据库中的单个行用于指示任务和/或所需状态。例如,承租人数据库235为每个承租人包括单个行。给定的承租人可以包括所需版本记录。该记录用于帮助保证:该承租人被放置在运行所需版本的场上。例如,对于要停留在SharePoint14SP1上的承租人1而言,该承租人的所需版本可以被设置为“14.1”,并且包括14.1的任何版本都将匹配而任何其他版本(例如14.2.xxxx)都将不匹配。承租人记录可以包括其他项目,诸如已授权的用户数目、限额(例如所允许的总数据使用、每用户的数据使用等)、时间限制等。某个组织可能具有代表不同地理位置、组合或容量的多个承租人。根据实施例,将承租人彼此隔开而没有(经由外联网或其他特性)对用户的明确邀请。
根据一个实施例,每个承租人都被锁定到特定的网络中。承租人被保持为相对于一小组数据库而言是本地化的。承租人或者是小的(小于将填充一个数据库的程度),在这种情况下,该承租人处于与其他承租人共享的恰好一个数据库中。这意味着共享该数据库的所有承租人需要同时升级。当承租人变大时,其可被移动到其自己的专用数据库,并且现在可以具有一个以上、但是不与其他承租人共享的数据库。在一个或多个专用数据库中维护大承租人有助于减少需要在单次升级中同时升级的数据库的数目。
类似地,工作数据库215对于每个作业包括单个行。机器数据库225可以对于每个物理机器、VM、场等包括一行。例如,机器管理器数据库225可以包括版本字符串。根据实施例,网络内的每个VHD、场和VM具有相关联的版本字符串。
根据一个实施例,云管理器包括简单日志系统,该简单日志系统可以被配置为为每个web服务调用记录日志条目。可以实现包括如所期望的那样少和/或多的特性的日志系统。一般而言,日志系统被用于度量使用和性能剖析。
根据实施例,web服务API240是使用具有ASP.net的SOAP构建的。API中的各种web方法遵循两种主要模式——获取(Gets)和更新(Updates)。一般而言,更新方法将数据结构作为输入,并且返回相同的结构作为输出。输出结构返回数据库中底层对象的当前状态,其中如果验证或其他业务逻辑改变了某些性质或者以其他方式填充了附加的性质(例如记录ID或由云管理器计算出的其他值),则该底层对象可能不同于输入对象。更新方法用于初始对象创建以及随后的更新。换言之,对web服务API240的调用者可以简单地请求它们想要的配置并且它们不需要保持跟踪对象是否已经存在。另外,这意味着更新是幂等的,其中相同的更新调用可以进行两次,这与仅仅发生一次具有相同效果。根据实施例,更新方法可以包括LastUpdated(最近更新)性质。当存在LastUpdated属性时,若LastUpdated的值与当前存储在数据库中的值不匹配,则云管理器200拒绝更新。某些更新方法包括在对方法的第一次调用时被设置的并且在对方法的其他调用时未被设置的属性。
云管理器200被配置为避免使用回调。由于回调可能是不可靠的,因此与云管理器200交互的客户可以在他们想要检查更新状态时使用web服务API来检查对象状态。根据实施例,对更新方法的调用导致云管理器200将底层对象的状态设置为“供应(Provisioning)”,并且当更新完成时,状态被设置为“活动(Active)”。
图3示出了存储在数据库的行内的示例性作业记录。如所示的,记录300包括作业标识符302、类型304、数据306、所有者308、步骤310、上一次运行312、期满时间314、下次时间316、状态318以及状况320。
一般而言,针对所请求的要执行的每个任务,云管理器在数据库350(例如,图2中的工作数据库215)中创建记录。
作业标识符302用于为所请求的任务指定唯一标识符。
类型304指定要执行的任务。例如,类型可以包括将要执行的脚本的名称。例如,当任务是要运行名称为“DeployVM.ps1”的脚本时,则数据306可以包括标识符(例如“-VMID123”)。这允许将新任务类型添加到系统,而不需要对该系统的已编译或其他二进制部分进行任何改变。
数据306用于存储与任务相关联的数据。例如,数据可以被设置为将在其上执行任务的承租人、机器、网络、VM等。数据306还可以存储数据库中的值被设置成的一个或多个值。执行任务的进程可以注意作业记录以查看所需机器数目被设置为何值。脚本使用数据库中的值来执行操作。
所有者308指定进程/执行该进程的机器。例如,当云管理器机器开始执行作业时,该机器使用机器的ID来更新记录的所有者308部分。
步骤310提供对当前脚本的步骤的指示。例如,脚本可以将任务划分成任何数目的步骤。当进程完成该脚本的步骤时,步骤310被更新。进程还可以查看步骤310以确定在脚本中要执行什么步骤并且避免必须重新执行之前已完成的步骤。
上一次运行312提供上一次启动脚本的时间。每次启动脚本时,更新上一次运行时间。
期满时间314是指示该进程应当何时终止的时间。根据实施例,期满时间是在启动进程之后的预定的时间量(例如5分钟、10分钟…)。期满时间可以通过经由web服务API的请求过程来更新。
下次时间316是指示任务下次应当何时执行的时间。例如,进程可以在完成某步骤之后停止,并且被指示等待直到所指定的下次时间316以恢复处理。
状态318指示当前状态,并且状况320指示作业的状况(例如,已创建、已挂起、已恢复、执行中、已删除)。
如果数据库中的重复行具有相同的任务类型和数据值,则它们可以在执行之前被移除。例如,可以进行多个请求以执行存储在数据库的多个行中的相同的任务。
作业可以具有与其相关联的一个或多个锁355。如果锁不可用,则作业将不被调度运行,直到锁可用。这些锁可以以许多不同的方式来配置。例如,锁可以基于互斥、信号量等。一般而言,互斥防止代码被一个以上线程同时执行,并且信号量将共享资源的同时使用的数目限制在最大数目。根据实施例,锁是表示资源的字符串。该资源可以是任何类型的资源。例如,锁可以是场、机器、承租人等。一般而言,锁用于延迟一个或多个任务的执行。每个作业可以指定其在运行以前需要的一个或多个锁。作业可以在其操作期间的任何时间释放锁。当存在锁时,作业不被调度。需要一个以上锁的作业一次请求所需的全部锁。例如,已经持有锁的作业可以不请求附加的锁。这样的方案有助于防止由在多个作业间的循环锁依赖性所造成的可能的死锁情况。
图4示出了用于网络的示例系统400,该网络包括用于在线服务的前端和后端服务器。示例系统400包括客户机402和404,网络406,负载平衡器408,web请求路由器409,WFE服务器410、412、414,后端服务器416-419,以及任选的负载平衡器420。可使用更多或更少的客户机、WFE、后端服务器、负载平衡器和网络。另外,由系统400中的组件所提供的功能中的某些可以由其他组件来执行。例如,某些负载平衡可以在WFE中执行。
在示例实施例中,客户机402和404是诸如台式计算机、膝上型计算机、终端计算机、个人数字助理或蜂窝电话设备的计算设备。客户机402和404可包括输入/输出设备、中央处理单元(“CPU”)、数据存储设备和网络设备。在本申请中,术语客户机和客户机计算机互换地使用。
WFE410、412和414可由客户机402和404经由负载平衡器408和web请求路由器409通过网络406访问。如所讨论的,服务器可以在场中配置。后端服务器416对WFE410、412和414是可访问的。负载平衡器408是专用网络设备和/或一个或多个服务器计算机。负载平衡器408,web请求路由器409,负载平衡器420,WFE410、412和414以及后端服务器416可包括输入/输出设备、中央处理单元(“CPU”)、数据存储设备和网络设备。在示例实施例中,网络406是因特网,并且客户机402和404可以远程地访问WFE410、412和414以及连接到WFE410、412和414的资源。
在示例实施例中,系统400是在线的、基于浏览器的文档协作系统。在线的、基于浏览器的文档协作系统的一个示例是来自美国华盛顿州雷蒙德市的微软公司的Microsoft在系统400中,后端服务器416-419中的一个或多个是SQL服务器,例如,来自美国华盛顿州雷蒙德市的微软公司的SQL服务器。
WFE410、412和414提供客户机402和404与后端服务器416-419之间的接口。负载平衡器408、420将请求从客户机402和404定向到web请求路由器,并且从WFF定向到后端服务器416-419。web请求路由器409将请求定向到WFE410、412和414,并且使用诸如WFE利用率、到WFE的连接数目和总体WFE性能的因素来确定哪个WFE服务器接收客户机请求。类似地,负载平衡器420使用诸如后端服务器利用率、到服务器的连接数目和总体性能的因素来确定哪个后端服务器接收请求。web请求路由器409可用于从负载平衡器408卸载处理中的某些。例如,负载平衡器408可运行在较低的TCP/IP层(例如,层4)以使得它可以处理更多的请求。web请求路由器409提供可运行在较高的TCP/IP层(例如,层7)的可缩放的请求路由器。web请求路由器可以使用用于路由请求的应用程序专用逻辑。例如,可以基于文档标识符和/或包括在已接收的请求内的用户信息来路由请求。
客户机请求的示例可以是访问存储在后端服务器之一上的文档,以编辑存储在后端服务器(例如416-419)上的文档,或者将文档存储在后端服务器上。当负载平衡器408通过网络406接收客户机请求时,负载平衡器408将请求定向到可用的web请求路由器409中的一个。web请求路由器409确定WFE服务器410、412和414中的哪一个接收客户机请求。类似地,负载平衡器420确定后端服务器416-419中的哪一个从WFE服务器接收请求。后端服务器可以被配置为存储一个或多个承租人(即顾客)的数据。
现在参考图5,将描述在各实施例中利用的计算机500的说明性计算机体系结构。图5所示的计算机体系结构可被配置为服务器、台式或移动计算机,并且包括中央处理单元5(“CPU”)、包括随机存取存储器9(“RAM”)和只读存储器(“ROM”)11的系统存储器7、以及将存储器耦合至中央处理单元(“CPU”)5的系统总线12。
基本输入/输出系统存储在ROM11中,所述基本输入/输出系统包含帮助在诸如启动期间在计算机内元件之间传递信息的基本例程。计算机500还包括大容量存储设备14以用于存储操作系统16、应用程序10、数据存储24、文件、以及与云系统100的执行和同云系统100的交互相关的云程序26。
大容量存储设备14通过连接至总线12的大容量存储控制器(未示出)连接到CPU5。大容量存储设备14及其相关联的计算机可读介质为计算机500提供非易失性存储。虽然此处包含的计算机可读介质的描述针对诸如硬盘或CD-ROM驱动器等大容量存储设备,但是计算机可读介质可以是计算机100可以访问的任何可用介质。
作为示例而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以存储如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术来实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质还包括,但不限于,RAM、ROM、可擦除可编程只读存储器(“EPROM”)、电可擦可编程只读存储器(“EEPROM”)、闪存或其它固态存储器技术、CD-ROM、数字多功能盘(“DVD”)或其它光存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所需信息且可以由计算机500访问的任何其它介质。
根据各实施例,计算机500可以使用通过诸如因特网的网络18至远程计算机的逻辑连接在联网环境中操作。计算机500可以通过连接至总线12的网络接口单元20来连接到网络18。网络连接可以是无线的和/或有线的。网络接口单元20也可用于连接到其它类型的网络和远程计算机系统。计算机500还可以包括用于接收和处理来自多个其他设备的输入的输入/输出控制器22,这些设备包括键盘、鼠标或者电子指示笔(图5中未示出)。类似地,输入/输出控制器22可以向显示屏28、打印机或其它类型的输出设备提供输出。
如上面简要提到的,多个程序模块和数据文件可以存储在计算机500的大容量存储设备14和RAM9内,包括适于控制联网计算机的操作的操作系统16,比如华盛顿州雷蒙德市的微软公司的操作系统。大容量存储设备14和RAM9还可以存储一个或多个程序模块。具体而言,大容量存储设备14和RAM9可以存储诸如云程序26的执行与云系统相关的任务的一个或多个应用程序。
图6示出用于在在线服务中路由通信的系统。云管理器605用于为在线服务部署、配置、打补丁和管理网络。云管理器被配置为通过不能依靠可靠网络的幂等和异步的应用程序web服务应用程序编程接口(API)620来接收请求。
如所示的,云管理器605包括工作管理器110、机器管理器610、应用程序管理器120、脚本130、数据存储630、映像640和web服务API620。根据一个实施例,应用程序管理器120是SharePoint承租人管理器,该管理器包括SharePoint专用逻辑。
使用API620的请求可用于在跨不同网络(网络1、网络2)的各种拓扑结构中管理和部署服务器。尽管仅示出了两个网络,但是一般可以管理许多更多的网络(例如十个、一百个、一千个、一万个等)。云管理器605运行,并且可以与上面所示和所描述的云管理器系统类似地来配置。web服务API620包括用于从工作管理器110、机器管理器610和应用程序管理器120请求服务的方法。例如,可以使用API620进行请求,以便更新数据库中的承租人、添加新的SQL服务器、部署补丁、部署新的场、添加新的机器、更新VM、获得数据存储内的值等。
云系统600中的网络被设计为是高度可伸缩的,并且具有高能力。网络可包括负载平衡器(例如负载平衡器660)、web请求路由器665、高速缓存服务器670以及可被安排在为在线服务执行角色的场中的物理和虚拟机。
负载平衡器660可包括一个或多个专用硬件设备和/或被配置为执行负载平衡的通用计算设备。根据实施例,负载平衡器660是在层4TCP/IP连接处终止的专用硬件负载平衡器。当负载平衡器不必执行大量处理时,它通常可以路由许多更多的消息。例如,处理安全套接字层(SSL)连接可显著地减少负载平衡器可处理的多个请求。与较高层相比,负载平衡器可能够在较低层路由许多更多的请求(例如,比在较低层处理多达5倍的请求)。
与负载平衡器660相比,网络中的web请求路由器665用于执行更高级的处理。web请求路由器可以是可包括内置到硬件中的解密功能的通用计算设备(例如服务器)。例如,很多CPU已经内置了可被利用的解码功能。
web请求路由器通常比用于大型网络的专用负载平衡器(例如负载平衡器660)更便宜。可利用任意数目的web请求路由器665来处理请求。在在线服务运行期间,web请求路由器的数目也可以动态地改变。例如,取决于服务的负载,可以动态地部署/移除更多或更少的web请求路由器。
web请求路由器665接收由负载平衡器660转发的请求。它们解析请求,确定目的地并且将请求转发到已确定的目的地(例如,网络的场之一中的机器)。
web请求路由器可以使用用于路由请求的应用程序专用逻辑。可以基于文档标识符和/或包括在已接收的请求内的用户信息来路由请求。例如,请求可以是“...../wordviewer.aspx?id=foo.docx”形式的HTTP请求。请求与特定的应用程序相关联,并且包括文档标识符“foo.docx”作为请求的部分。不同的应用程序可以具有不同的请求结构。一般而言,与应用程序相关联的请求可以包括诸如以下各项:应用程序信息、用户信息、承租人信息、文档信息等。很多应用程序请求已经包括可用于路由的信息,而不必修改请求以包括可用于路由的附加信息。换言之,web请求路由器具有关于应用程序如何创建请求的应用程序专用知识。由此,由于应用程序可以已经包括请求内的可用信息,因此附加信息不必被创建并被存储在请求内。
对请求的路由可以基于所请求的内容的名称(例如,foo.docx)。例如,对文档foo.docx的全部请求可被定向到单个服务器以处理请求。一旦文档已经被请求,它可被高速缓存到最初处理请求的服务器上。由于可以基于文档名称来路由请求,则该文档很有可能位于已确定的服务器的高速缓存中。其他应用程序专用信息也可用于路由请求,诸如基于应用程序的特定版本、文档版本、应用程序类型等来路由。
对请求的路由还可以至少部分地基于其他因素,诸如:基于非用户发起的请求来路由(bots);请求的复制(路由到多个端点用于调试目的);地理分布(跨网络、跨数据中心路由以获得DNS传播期间的高可用性)等。
文档还可以被高速缓存在某些其它位置,诸如高速缓存服务器670内。高速缓存服务器670通过从相同客户机或其他客户机进行的先前的请求中检索已保存的内容来加速请求。高速缓存服务器670频繁地存储所请求的资源以使得它们可以被更快速地提供。
查找表可用于确定请求的目的地。例如,查找表672可被存储在网络和/或高速缓存服务器670内的数据存储中。查找表由web请求路由器665访问以确定请求的目的地。例如,查找表可包括顾客名称、文档名称以及该文档所存储的位置。web请求路由器使用来自请求的信息并在查找表内为该文档查找数据存储的位置。当在线服务内的内容位置变化时,查找表可被云管理器605更新以使得web请求路由器自动地将内容定向到已更新的位置。如所讨论的,出于很多不同的理由,内容位置可以改变,诸如机器、场、数据库的新部署,升级,分隔数据库,碎片整理操作等。当内容位置改变时,云管理器605可以使用新位置改变查找表内先前位置的名称。web请求路由器665的任何未来的查找导致请求被自动地路由到已更新的位置。
用户还可以指定将他们的请求路由到的目的地。例如,顾客可改变其内容的位置以便测试新的部署。该请求可通过API620接收并由云管理器605处理。
图7示出在在线系统中路由请求的过程。
当阅读对在此提供的例程的讨论时,应当理解,各实施例的逻辑操作被实现为(1)运行于计算系统上的一系列计算机实现的动作或程序模块,和/或(2)计算系统内互连的机器逻辑电路或电路模块。该实现是取决于实现本发明的计算系统的性能要求来选择的。因此,所例示的并且构成此处所描述的实施例的逻辑操作被不同地表示为操作、结构设备、动作或模块。这些操作、结构设备、动作和模块可用软件、固件、专用数字逻辑以及它们的任何组合来实现。
在启动操作之后,过程700行进至在其中接收请求的操作710。在被配置为将请求路由到适合的目的地的一组服务器处接收请求。请求是针对存储在网络中的一个或多个机器上的内容。所请求的内容可以在在线服务运行期间在网络内移动位置。例如,数据库可被复制到新位置、新的场可被部署等。由于网络所接收的请求从负载平衡器被路由到web请求路由器以确定目的地,因此客户机无需知道内容位置的改变。
行进至操作720,请求被解析。取决于请求类型,请求可被解析为不同类型的信息。例如,不同的应用程序可在其应用程序专用请求内包括不同的信息。每个应用程序可以具有不同的URL结构。请求可包括应用程序标识信息、文档信息、用户信息、认证信息、顾客信息等。根据实施例,请求被解析为文档名称。
移至操作730,确定请求的目的地。根据实施例,关于网络中各机器上有哪些可用内容的信息被存储在查找表中。一个或多个机器可以存储内容。例如,单个数据库可存储用于特定承租人的内容。只要内容位置改变就更新查找表,以使得查找表包含的信息准确地反映进行请求时具有可用内容的服务器。根据实施例,查找表标识处理特定文档的机器。例如,一个服务器处理某些文档,另一个服务器处理其他文档等。通过将对相同内容的请求发送到相同的机器,文档将有可能被存储在机器的高速缓存内。如果请求是针对不具有被高速缓存的文档的另一个服务器,则机器在获得该文档时必须执行更多的步骤。也可以基于包括在最初接收的请求内的用户/顾客信息来确定目的地。
转移到操作740,请求被转发到已确定的目的地。随后该过程移至结束框并返回以处理其它动作。
以上说明、示例和数据提供了对本发明的组成部分的制造和使用的全面描述。因为可以在不背离本发明的精神和范围的情况下做出本发明的许多实施例,所以本发明落在所附权利要求的范围内。