CN101689161B - 自动管理计算机网络中的系统停机时间 - Google Patents

自动管理计算机网络中的系统停机时间 Download PDF

Info

Publication number
CN101689161B
CN101689161B CN200880022519.2A CN200880022519A CN101689161B CN 101689161 B CN101689161 B CN 101689161B CN 200880022519 A CN200880022519 A CN 200880022519A CN 101689161 B CN101689161 B CN 101689161B
Authority
CN
China
Prior art keywords
web
application program
stop time
server
web server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880022519.2A
Other languages
English (en)
Other versions
CN101689161A (zh
Inventor
J·M·卡希尔
T·C·迈伦
L·N·安东诺夫
S·L·利文斯顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN101689161A publication Critical patent/CN101689161A/zh
Application granted granted Critical
Publication of CN101689161B publication Critical patent/CN101689161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/403Bus networks with centralised control, e.g. polling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1031Controlling of the operation of servers by a load balancer, e.g. adding or removing servers that serve requests

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Environmental & Geological Engineering (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Information Transfer Between Computers (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Abstract

提供了用于自动管理计算机网络中的系统停机时间的实施例。在一个实施例中,在应用服务器中创建用于为web服务器安排系统停机时间段的事件。在所安排的停机发生时,自动从网络中移除该web服务器并且自动传递指示该web服务器离线的停机时间通知消息。在另一个实施例中,可创建用于为包括网站在内的基于web的应用程序安排停机时间的事件。在所安排的停机时间之前,可自动停止到基于web的应用程序的请求并且将其重定向到指定位置。在另一个实施例中,自动监视web服务器的操作以检测故障状态的存在,并且如果存在故障状态,则可作出受影响的web服务器已停机的判定并且自动将到该已停机的web服务器的请求重定向到替换服务器。

Description

自动管理计算机网络中的系统停机时间
背景
许多计算机网络包括用于经由单个基于web的接口来向最终用户提供资源的多个计算机的共享基础结构。这些计算机网络通常包括用于将服务器场作为单个逻辑单元来控制的分布式操作系统应用程序。服务器场通常包括无状态web前端(即web服务器)、应用服务器以及由服务器共享的数据库后端。分布式操作系统使得服务器资源(即数据)能够作为一个或多个网站来呈现给最终用户。
然而,利用分布式操作系统应用程序的计算机网络具有多个缺点。一个缺点是当需要系统维护或升级时,必须使整个计算机网络离线。结果,在一段时间内用户不能访问用于访问服务器资源的网站,直到维护或升级完成。在停机时间或停运时间段期间,受影响网站的用户可被临时重定向到另一个网站,然而目前的重定向是一个完全手动的过程。具体地,必须手动配置主存临时网站的计算机并且必须手动执行域名系统(“DNS”)变更以使得重定向能够发生。然而,DNS变更通常需要专家技术经验,其可能超出系统管理员的知识范围并因此需要额外的人员。结果,手动重定向在时间、人力和资源方面通常是一项昂贵的任务。本发明的各实施例正是针对这些考虑事项和其它考虑事项而做出的。
概述
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。该概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
提供了用于自动管理计算机网络中的系统停机时间的实施例。在一个实施例中,在应用服务器中创建用于为计算机网络中的web服务器安排系统停机时间段的事件。当所安排的停机发生时,自动从管理到网络服务器的通信的网络负载平衡器中移除该web服务器,并且自动传递停机时间通知消息。该停机时间通知消息可向系统管理员指示该web服务器已停机并且已为任何所需维护做好准备。在另一个实施例中,可创建用于为计算机网络中的包括网站在内的基于web的应用程序安排停机时间的事件。在所安排的停机时间之前,可自动停止到基于web的应用程序的请求并将其重定向到指定位置。在另一个实施例中,自动监视web服务器的操作以检测故障状态的存在并且如果在一个或多个web服务器中存在故障状态,则可作出受影响的web服务器已停机的判定并且自动将到该已停机的web服务器的请求重定向到替换服务器。
通过阅读以下详细描述并查阅相关联的附图,这些和其他特征和优点将是显而易见的。可以理解,前述一般描述和以下详细描述均仅是说明性,且不限制所要求保护的本发明。
附图简述
图1是根据各实施例的被配置成自动管理计算机网络中的系统停机时间的系统的网络体系结构图;
图2是示出用于实现此处所描述的各实施例的计算环境的框图;
图3是示出根据一个实施例的用于自动管理计算机网络中的系统停机时间的例程的流程图;
图4是示出根据一替换实施例的用于自动管理计算机网络中的系统停机时间的例程的流程图;以及
图5是示出根据一替换实施例的用于自动管理计算机网络中的系统停机时间的例程的流程图。
详细描述
提供了用于自动管理计算机网络中的系统停机时间的实施例。在一个实施例中,在应用服务器中创建用于为计算机网络中的web服务器安排系统停机时间段的事件。当所安排的停机发生时,自动从管理到网络服务器的通信的网络负载平衡器中移除该web服务器,并且自动传递停机时间通知消息。该停机时间通知消息可向系统管理员指示该web服务器已停机并且已为任何所需维护做好准备。在另一个实施例中,可创建用于为计算机网络中的包括网站在内的基于web的应用程序安排停机时间的事件。在所安排的停机时间之前,可自动停止到基于web的应用程序的请求并将其重定向到指定位置。在另一个实施例中,自动监视web服务器的操作以检测故障状态的存在并且如果在一个或多个web服务器中存在故障状态,则可作出受影响的web服务器已停机的判定并且自动将到该已停机的web服务器的请求重定向到替换服务器。
现将参考其中相同的标号代表相似的元素的附图来描述各说明性实施例。图1是被配置成自动定标共享资源的计算机网络100的网络架构图。在一个实施例中,计算机网络100中的各个组件可使用用于基于web的应用程序的分布式操作系统来配置,诸如由华盛顿州雷蒙德市的微软公司开发的SHAREPOINT(共享点)服务技术中的操作系统。如本领域技术人员所公知的,SHAREPOINT服务技术使得用户能够创建、维护、并呈现用于共享信息的协作环境。通过使用这种技术,用户或组织可创建一个或多个网站以便为与网站相关联的其他用户提供信息(例如,web服务器或web文件夹上的文档等)并共享这些信息。应当理解,此处所描述的实施例不应当被解释为限于SHAREPOINT服务技术,并且也可使用来自其他开发者和/或制造商的其他协作服务技术。计算机网络100及其组件包括用于与其他计算设备、通信设备和/或其他系统进行通信的功能,且并不旨在限于此处所描述的实施例和示例。
如图1所示,计算机网络100包括但不限于,后端服务器101、应用服务器102A和102B、web服务器112A、112B和112C、域名系统(“DNS”)服务器114、网络负载平衡器116和客户机计算机150和152。在一个实施例中,后端服务器101、应用服务器102A和102B和web服务器112A、112B和112C可被配置成利用SHAREPOINT服务技术来创建用于共享信息的协作环境。具体而言,根据一个实施例,应用服务器102A和102B可被配置成运行结合WINDOWSSHAREPOINTSERVICES(WINDOWS共享点服务)技术的WINDOWSSERVER操作系统和OFFICESHAREPOINTSERVER(OFFICE共享点服务器)应用程序以便与诸如OFFICE应用程序套件等客户机计算机生产性应用程序(例如,文字处理、个人信息管理和电子表格应用程序)协作。以上所提到的操作系统、技术和应用程序全都是由华盛顿州雷蒙德市的微软公司开发的。然而,应当理解,也可利用来自其他制造商的操作系统和应用程序来具体化此处所讨论的技术特征的各方面。
后端服务器101与应用服务器102A和102B以及web服务器112A、112B和112C进行通信(经由防火墙110)。根据一实施例,后端服务器101可包括结构化查询语言(“SQL”)数据库,其存储在网络100中利用的数据并由服务器102A、102B、112A、112B和112C共享。
应用服务器102A和102B与后端服务器101以及web服务器112A、112B和112C进行通信(通过防火墙110)。通常,应用服务器102A和102B可用于执行搜索索引操作以及传递来自活动目录的信息以便在由web服务器112A、112B和112C主存的网站中展示。应用服务器102A和102B可包括但不限于,停机时间管理应用程序104A和104B以及事件数据106A和106B。根据一个实施例,停机时间管理应用程序104A和104B可被配置成创建事件数据106A和106B(即,事件),这些事件数据用于为web服务器112A、112B和112C以及主存在web服务器112A、112B和112C上的基于web的应用程序安排停机时间。
在一个实施例中,停机时间管理应用程序104A和104B可被配置成生成包括停机时间管理超链接的中央管理网站,网络管理员可选择该停机时间管理超链接以便在图形用户界面中输入事件数据106A和106B。事件数据106A和106B可包括但不限于,所安排的停机时间的日期、停运窗口、停机时间消息、联系信息、与所安排的停机时间相关联的优先级、以及用于重定向到已停机(即离线)的web服务器和/或基于web的应用程序的服务器请求的重定向位置(URL)。例如,根据各实施例,利用停机时间管理应用程序104A和104B中的一个,网络管理员(或其它用户)可创建用于安排web服务器112A、112B或112C中的一个在预定停运时间段内离线以便进行服务器软件升级、服务器维护、软件补丁安装、用户帐户口令更新等的事件,在所安排的停机时间之前将包括所安排的停机时间的原因和用于获取关于所安排的停机时间的其它信息的联系数据发送至一个或多个客户机计算机,并且在所安排的停机时间段期间将用户重定向到替换服务器或者URL。根据一实施例,停机时间管理应用程序104A和104B还可被配置成监视关于web服务器112A、112B和112C的操作的系统健康状况。例如,可监视web服务器112A、112B和112C以检测故障状态(例如,web服务器未能连接至后端数据库,web服务器CPU上的负载太高,达到到web服务器的请求的最大阈值水平等等)的存在,并且如果存在故障状态,则将到受影响的web服务器的请求重定向到网络100中的替换服务器。下面将参考图3-5更详细地讨论可由停机时间管理应用程序104A和104B在管理网络100中的系统停机时间时执行的各个操作。
web服务器112A、112B和112C经由防火墙110与后端服务器101和应用服务器102A与102B进行通信。web服务器112A、112B和112C还经由防火墙118与DNS服务器114、网络负载平衡器116和客户机计算机150与152进行通信。web服务器112A、112B和112C可包括但不限于,网页125A和125B以及基于web的应用程序127A和127B。网页125A和125B可包括所主存的网站,客户端计算机150和152可使用这些网站来访问网络100中的共享资源。例如,网页125A和125B可包括组织中的不同部门所使用的多个网站,诸如信息技术(“IT”)网站、人力资源网站或法律网站。
DNS服务器114经由防火墙118通过网络总线120与客户机计算机150和152进行通信,并且可被配置成将域名(例如,www.ITweb.com)转换成IP地址(例如,198.105.232.4)。网络负载平衡器116经由防火墙118通过网络总线120与客户机计算机150和152进行通信,并且可被配置成对多个服务器上的网络通信量进行负载平衡并且自动将通信重新分发给操作服务器。客户机计算机150和152经由防火墙118和网络总线120与DNS服务器114、网络负载平衡器116和web服务器112A、112B与112C进行通信。客户机计算机150和152中每一个都可包括通用台式计算机、膝上型计算机、手持式计算机、图形输入板计算机或者能够执行一个或多个应用程序并且可用于向由web服务器112A、112B和112C主存的网页、网站和基于web的应用程序发送用户请求的其他类型的计算机。
示例性操作环境
现在参看图2,以下讨论旨在提供对在其中可以实现本发明实施例的合适计算环境的简要一般描述。尽管将在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的一般上下文中描述本发明,但本领域的技术人员可以认识到,本发明也可结合其它类型的计算系统和程序模块实现。
一般而言,程序模块包括执行特定任务或实现特定的抽象数据类型的例程、程序、组件、数据结构和其它类型的结构。而且,本领域的技术人员可以理解,本发明方法可以使用其它计算机系统配置来实现,包括手持式设备、多处理器、基于微处理器或可编程消费电子产品、小型机、大型计算机等。本发明也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实现。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备中。
现在参看图2,将描述用于本发明各实施例的示例性操作环境。如图2所示,应用服务器102A包括服务器计算机,该服务器计算机可包括通用台式计算机、膝上型计算机、手持式计算机、图形输入板计算机、或能执行一个或多个应用程序的其它类型的计算机。应用服务器102A包括至少一个中央处理单元8(“CPU”)、系统存储器12,包括随机存取存储器18(“RAM”)和只读存储器(“ROM”)20的、以及将存储器耦合至CPU8的系统总线10。基本输入/输出系统存储在ROM20中,它包含帮助在诸如启动期间在计算机内元件之间传递信息的基本例程。
应用服务器102A还包括大容量存储设备14,其用于存储操作系统32、停机时间管理应用程序104A、事件数据106A和服务器应用程序160。根据各实施例,操作系统32可包括结合WINDOWSSHAREPOINTSERVICES技术的WINDOWSSERVER操作系统,而服务器应用程序160可包括OFFICESHAREPOINTSERVER应用程序(以上参考图1所讨论的)。大容量存储设备14通过连接至总线10的大容量存储控制器(未示出)连接到CPU8。大容量存储设备14及其相关联的计算机可读介质为共享资源入口110提供非易失性存储。尽管此处包含的计算机可读介质的描述指的是大容量存储设备,诸如硬盘或CD-ROM驱动器,但本领域的技术人员应理解,计算机可读介质可以是可由应用服务器102A访问或利用的任何可用介质。
作为示例而非限制,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以存储如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限于,RAM、ROM、EPROM、EEPROM、闪存或其它固态存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所需信息且可以由应用服务器102A访问的任何其它介质。
根据本发明的各个实施例,应用服务器102A可通过诸如例如局域网或广域网(例如,因特网)等网络4,使用到远程计算机的逻辑连接来在联网环境中操作。应用服务器102A可以通过连接至总线10的网络接口单元16来连接到网络4。
应理解,网络接口单元16也可用于连接至其它类型的网络和远程计算机系统。应用服务器102A还可包括用于接收和处理来自包括键盘、鼠标、笔、指示笔、手指、和/或其它手段等多个输入类型的输入的输入/输出控制器22。类似地,输入/输出控制器22可以向显示器、打印机或其它类型的输出设备提供输出。另外,触摸屏可以用作输入和输出机制。
如前简述,多个程序模块和数据文件可以存储在应用服务器102A的大容量存储设备14和RAM18内,包括适于控制联网个人计算机的操作的操作系统32,如来自华盛顿州雷蒙德市的微软公司的WINDOWSSERVER操作系统。大容量存储设备14和RAM18还可以存储一个或多个程序模块。具体而言,大容量存储设备14和RAM18可存储停机时间应用程序104A、事件数据106A和服务器应用程序160。
图3是示出根据一个实施例的用于自动管理计算机网络中的系统停机时间的例程300的流程图。图3中的描述可参考图1和2的组件,但是该实施例并不限于此。当阅读对在此提供的例程的讨论时,应当理解,本发明的各实施例的逻辑操作被实现为(1)运行于计算系统上的一系列计算机实现的动作或程序模块,和/或(2)计算系统内互连的机器逻辑电路或电路模块。该实现是取决于实现本发明的计算机系统的性能要求来选择的。因此,图3-5中所例示的并且构成在此所描述的本发明的实施例的逻辑操作被不同地表示为操作、结构性设备、动作或模块。本领域技术人员将认识到,这些操作、结构设备、动作和模块可用软件、固件、专用数字逻辑、及其任意组合实现,而不背离如本文中阐述的权利要求内陈述的本发明精神和范围。
例程300开始于操作305,在那里利用在应用服务器102A或102B(下文称为应用程序102A)上执行的停机时间管理应用程序104A或104B中的任一个来根据接收到的事件数据106A创建安排好的停机时间事件。如以上在对图1的描述中所讨论的,事件数据106A可包括所安排的停机时间的日期、停运窗口、停机时间消息、联系信息、与所安排的停机时间相关联的优先级、以及用于重定向到已停机(即离线)的web服务器和/或基于web的应用程序的服务器请求的重定向位置(URL)。例如,可创建停机时间事件以使web服务器112C离线以便执行服务器维护或者进行诸如软件补丁安装等升级。
例程300从操作305继续至操作310,在那里停机时间管理应用程序104A自动从网络负载平衡器116中移除已安排好停机时间的web服务器(例如web服务器112C)。具体地,停机时间管理应用程序104A可被配置成指示应用服务器102A自动与网络负载平衡器116进行通信以便在所安排的停机时间停止路由来自客户机计算机150和152的请求。
例程300从操作310继续至操作315,在那里停机时间管理应用程序104A自动传递指示被安排离线的web服务器已停机的停机时间通知消息。根据一个实施例,停机时间通知消息包括关于所安排的停机时间的原因(例如服务器维护)、停运窗口和用于获取其它信息的联系信息(例如电话号码或电子邮件地址)的信息。停机时间通知消息可以是可在所安排的停机时间传递或者在该停机时间之前传递的电子邮件消息或者个人信息管理日程表项。根据另一实施例,停机时间通知消息可包括在所安排的停机时间之前主存在受影响web服务器上的已更新网页。在该实施例中,停机时间管理应用程序104A可被配置成在所安排的停机时间之前预定时间段与受影响的web服务器进行通信以便更新网页以包括停机时间通知消息,诸如“该网站将从...起不可用”。
例程300从操作315继续至操作320,在那里在系统停机时间段期间停机时间管理应用程序104A在所安排的停机时间段期间自动将到离线web服务器的请求重定向至指定URL。具体地,停机时间管理应用程序104A可被配置成指示应用服务器102A自动与DNS服务器114进行通信以便在所安排的停机时间期间将来自客户机计算机150和152的网页请求重定向至在线web服务器(诸如web服务器112B)。将会理解,根据一个实施例,在线web服务器可具有对于离线web服务器的冗余功能(即,主存相同的网页和/或基于web的应用程序)以使得用户体验在所安排的停机时间期间不受影响。将会理解,在所安排的停机时间结束时,可通过将离线web服务器重新添加到网络负载平衡器116并且将DNS服务器114配置成将请求重新映射回到先前的URL来使离线web服务器恢复在线。从操作320,例程300随后结束。
现在转到图4,现在将描述根据一替换实施例的用于自动管理计算机网络中的系统停机时间的例程400。应当理解,图4中所描述的操作可适用于其中在基于web的应用程序或属性离线的同时web服务器本身保持对不受影响的未安排停机时间的应用程序或属性起作用的情形。
例程400开始于操作405,在那里利用应用程序102A来根据接收到的事件数据106A创建安排好的停机时间事件。如以上对图1的描述中所讨论的,事件数据106A可包括所安排的停机时间的日期、停运窗口、停机时间消息、联系信息、与所安排的停机时间相关联的优先级、以及用于重定向到已停机(即离线)的基于web的应用程序的服务器请求的重定向位置(URL)。例如,web服务器112C可被配置成主存用于组织中的IT部门、人力资源部门和法律部门的基于web的应用程序。根据一实施例,可创建用于使用于人力资源部门的应用程序离线(例如,因为该应用程序过度使用CPU资源或者将要实现可能使该应用程序不稳定的新的定制)以使得可将其移至另一个web服务器的停机时间事件。
例程400从操作405继续至操作410,在那里停机时间管理应用程序104A在所安排的停机时间之前自动停止到基于web的应用程序或属性的请求。例如,停机时间管理应用程序104A可被配置成指示应用服务器102A自动与DNS服务器通信以便在所安排的停机时间之前三十分钟停止为从客户机计算机150和152到基于web的应用程序或属性的传入请求服务。
例程400从操作410继续至操作415,在那里停机时间管理应用程序104自动传递指示被安排离线的基于web的应用程序或属性已停机的停机时间通知消息。根据一个实施例,停机时间通知消息可包括关于所安排的停机时间的原因、停运窗口和用于获得其它信息的联系信息(例如电话号码或电子邮件地址)。停机时间通知消息可以是可在所安排的停机时间传递或者在该停机时间之前传递的电子邮件消息或者个人信息管理日程表项。应当理解,用于传递停机时间通知消息的时间段可由管理员在创建停机时间事件时指定,并且停机时间事件还可被分配一优先级分类(例如,低、正常和高)以使得对于高优先级事件,停机时间通知消息在所安排的停机时间之前预定时间段(例如,二十四小时)自动传递。
例程400从操作415继续至操作420,在那里停机时间管理应用程序104A自动重定向到离线的基于web的应用程序或属性的请求。具体地,停机时间管理应用程序104A可被配置成指示应用服务器102A自动与DNS服务器114通信以便在所安排的停机时间期间重定向来自客户机计算机150和152的、传入的基于web的应用程序请求。根据一个实施例,传入的基于web的应用程序请求可被重定向到对于指示基于web的应用程序当前不可用的网页的替换URL。根据另一实施例,传入的基于web的应用程序请求可被重定向到web服务器上的基于web的应用程序的第二版本。具体地,主存基于web的应用程序的web服务器可同时配置有基于web的应用程序的读/写版本和只读版本。当基于web的应用程序的读/写版本离线(例如为了升级)时,传入的请求可被定向到只读版本以使得用户在正在进行读/写版本升级的同时仍能够访问数据(但无法作出变更)。应当理解,根据一个实施例,基于web的应用程序的读/写和只读版本可以与同一URL相关联,由此消除了对系统管理员管理重复URL的需求。在该实施例中,主存这两个版本的应用程序的web服务器可被配置成自动检测向作出请求的用户显示哪一个版本(例如,显示新的和/或读/写版本,除非该版本正在进行升级)。例程400随后结束。
现在转到图5,现在将描述根据一替换实施例的用于自动管理计算机网络中的系统停机时间的例程500。例程500开始于操作505,在那里利用停机时间管理应用程序104来自动监视网络100中的web服务器112A、112B和112C的操作以检测故障状态。具体地,停机时间管理应用程序104A可配置有系统健康和诊断功能,该功能可周期性地监视(例如每小时或每天)web服务器112A、112B和112C以检测系统故障,诸如web服务器是否能够连接至网站的内容数据库。
如果在操作510确定在web服务器112A、112B和112C中的任一个中都不存在故障状态,则例程500返回到操作505,在那里停机时间管理应用程序104A继续监视这些web服务器以检测故障状态。然而如果在操作510,停机时间管理应用程序104A确定在web服务器112A、112B和112C中的任一个中存在故障状态,则例程510继续至操作515,在那里停机时间管理应用程序104A确定受影响的web服务器已停机(即离线)。
例程500从操作515继续至操作520,在那里停机时间管理应用程序104A自动将到受影响的web服务器的请求重定向至网络100中的替换服务器(其可在先前由管理员在停机时间管理应用程序104A中指定)。具体地,停机时间管理应用程序104A可被配置成指示应用服务器102A自动与DNS服务器114通信以将来自客户机计算机150和152的传入请求(包括基于web的应用程序和网页请求)重定向到替换服务器。
例程500从操作520继续至操作525,在那里停机时间管理应用程序104A指示应用服务器102A与替换服务器通信以便显示对应于所有传入请求的停机时间通知消息网页,该网页指示主存所请求的网页、网站或基于web的应用程序的服务器已停机。例程500从操作525继续至操作530,在那里停机时间管理应用程序104A自动将停机时间通知消息传递给可响应导致当前未经安排的停机时间的故障状态的一方。例如,停机时间管理应用程序104A可被配置成在确定web服务器由于失败的诊断而停机时自动向操作技术人员发送电子邮件。该技术人员一旦知道了故障,就可开始纠正所检测到的故障。例程500随后结束。
尽管已结合各个例示性实施例描述了本发明,但本领域普通技术人员将理解,可在所附权利要求的范围内对其作出许多修改。因此,并非旨在以任何方式将本发明的范围限于以上的说明,而是应该完全参照所附权利要求书来确定。

Claims (6)

1.一种用于自动管理计算机网络(100)中的系统停机时间的方法,所述计算机网络(100)包括支持用于基于web的应用程序(127A)的分布式操作系统的多个服务器,所述方法包括:
在应用服务器(102A)中创建(405)用于安排对于所述计算机网络(100)中的至少一个基于web的应用程序(127A)的停机时间的事件(106A),其中在创建用于安排对于所述计算机网络中的至少一个基于web的应用程序的停机时间的事件时,接收指定所述事件的优先级的优先级数据,其中所述优先级确定如何向所述基于web的应用程序的用户通知所安排的停机时间;
在所安排的停机时间之前自动停止到web服务器(112A)上的所述至少一个基于web的应用程序的请求(410);以及
自动重定向到所述至少一个基于web的应用程序(127A)的请求(420),其中在自动重定向所做出的到所述至少一个基于web的应用程序的请求时,在所述web服务器上从所述至少一个基于web的应用程序的读/写版本切换到所述至少一个基于web的应用程序的只读版本,其中在所述读/写版本的升级期间切换到所述只读版本,其中所述至少一个基于web的应用程序的所述读/写版本和所述只读版本与单个URL相关联。
2.如权利要求1所述的方法,还包括在所安排的停机时间之前自动将停机时间通知消息传递给所述至少一个基于web的应用程序的用户。
3.如权利要求2所述的方法,其特征在于,所述停机时间通知消息包括个人信息管理器中的日程表项。
4.如权利要求2所述的方法,其特征在于,所述停机时间通知消息包括电子邮件(e-mail)消息。
5.如权利要求1所述的方法,其特征在于,在创建用于安排对于所述计算机网络中的至少一个基于web的应用程序的停机时间时执行以下动作中的至少一个:接收包括安排所述停机时间开始的日期和时间的第一数据,接收包括与所述停机时间相关联的停运窗口的长度的第二数据,接收包括所述停机时间的原因的第三数据,接收包括用于获取与所述停机时间相关联的其它信息的联系信息的第四数据,或者接收包括用于在所述停机时间期间重定向到所述至少一个基于web的应用程序的请求的替换URL的第五数据。
6.如权利要求1所述的方法,其特征在于,所述至少一个基于web的应用程序是用于更新用户帐户口令的应用程序。
CN200880022519.2A 2007-06-29 2008-06-14 自动管理计算机网络中的系统停机时间 Active CN101689161B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/771,720 2007-06-29
US11/771,720 US8181071B2 (en) 2007-06-29 2007-06-29 Automatically managing system downtime in a computer network
PCT/US2008/067045 WO2009006005A2 (en) 2007-06-29 2008-06-14 Automatically managing system downtime in a computer network

Publications (2)

Publication Number Publication Date
CN101689161A CN101689161A (zh) 2010-03-31
CN101689161B true CN101689161B (zh) 2016-03-09

Family

ID=40162217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880022519.2A Active CN101689161B (zh) 2007-06-29 2008-06-14 自动管理计算机网络中的系统停机时间

Country Status (7)

Country Link
US (1) US8181071B2 (zh)
EP (1) EP2176775B1 (zh)
JP (1) JP5211160B2 (zh)
KR (1) KR101532450B1 (zh)
CN (1) CN101689161B (zh)
TW (1) TWI450530B (zh)
WO (1) WO2009006005A2 (zh)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090150872A1 (en) * 2006-07-04 2009-06-11 George Russell Dynamic code update
US8181071B2 (en) 2007-06-29 2012-05-15 Microsoft Corporation Automatically managing system downtime in a computer network
US8060585B2 (en) * 2008-02-06 2011-11-15 Qualcomm Incorporated Self service distribution configuration framework
US8832259B1 (en) * 2009-10-30 2014-09-09 Hewlett-Packard Development Company, L.P. Virtual service mode methods for network remote monitoring and managing system
JP2011138225A (ja) * 2009-12-25 2011-07-14 Canon Inc クラスタシステム、情報処理装置、制御方法、及びプログラム
US8352661B1 (en) * 2010-03-24 2013-01-08 Emc Corporation Data storage systems having seamless software upgrades
US8533337B2 (en) * 2010-05-06 2013-09-10 Citrix Systems, Inc. Continuous upgrading of computers in a load balanced environment
US8693035B2 (en) * 2010-06-28 2014-04-08 Kabushiki Kaisha Toshiba Data processing apparatus and data processing method for performing predetermined process at a different processing node
US8484503B2 (en) * 2010-08-18 2013-07-09 International Business Machines Corporation Disaster recovery replication throttling in deduplication systems
US20120072323A1 (en) * 2010-09-17 2012-03-22 Bank Of America Corporation Maintaining online functionality during an outage
US8539086B2 (en) 2011-03-23 2013-09-17 Color Labs, Inc. User device group formation
US9077627B2 (en) * 2011-03-28 2015-07-07 Hewlett-Packard Development Company, L.P. Reducing impact of resource downtime
US20120259956A1 (en) * 2011-04-07 2012-10-11 Infosys Technologies, Ltd. System and method for implementing a dynamic change in server operating condition in a secured server network
US20120311375A1 (en) * 2011-06-01 2012-12-06 Microsoft Corporation Redirecting requests to secondary location during temporary outage
US8850261B2 (en) 2011-06-01 2014-09-30 Microsoft Corporation Replaying jobs at a secondary location of a service
US10585766B2 (en) 2011-06-06 2020-03-10 Microsoft Technology Licensing, Llc Automatic configuration of a recovery service
US8412772B1 (en) 2011-09-21 2013-04-02 Color Labs, Inc. Content sharing via social networking
US9152487B2 (en) * 2011-09-30 2015-10-06 Microsoft Technology Licensing, Llc Service outage details in an error message
CN102387211B (zh) * 2011-10-24 2014-07-30 浪潮(北京)电子信息产业有限公司 实现网络应用软件web服务使用的方法及系统
US9648138B1 (en) * 2012-03-27 2017-05-09 Open Text Corporation Method and system for virtual server dormancy
US9319274B1 (en) * 2012-03-29 2016-04-19 Emc Corporation Method and system for dynamic provisioning using server dormant mode for virtual server dormancy
US10237341B1 (en) * 2012-03-29 2019-03-19 Emc Corporation Method and system for load balancing using server dormant mode
US9262253B2 (en) 2012-06-28 2016-02-16 Microsoft Technology Licensing, Llc Middlebox reliability
US9229800B2 (en) 2012-06-28 2016-01-05 Microsoft Technology Licensing, Llc Problem inference from support tickets
US9184994B2 (en) * 2012-08-01 2015-11-10 Sap Se Downtime calculator
US9448784B2 (en) 2012-09-28 2016-09-20 Oracle International Corporation Reducing downtime during upgrades of interrelated components in a database system
US9565080B2 (en) 2012-11-15 2017-02-07 Microsoft Technology Licensing, Llc Evaluating electronic network devices in view of cost and service level considerations
US20140164477A1 (en) * 2012-12-06 2014-06-12 Gary M. Springer System and method for providing horizontal scaling of stateful applications
US9154540B2 (en) * 2012-12-11 2015-10-06 Microsoft Technology Licensing, Llc Smart redirection and loop detection mechanism for live upgrade large-scale web clusters
US9497079B2 (en) * 2013-06-13 2016-11-15 Sap Se Method and system for establishing, by an upgrading acceleration node, a bypass link to another acceleration node
US9350601B2 (en) 2013-06-21 2016-05-24 Microsoft Technology Licensing, Llc Network event processing and prioritization
US9372734B2 (en) 2013-08-27 2016-06-21 Bank Of America Corporation Outage window scheduler tool
CN104951852A (zh) * 2014-03-24 2015-09-30 阿里巴巴集团控股有限公司 周期性订单信息的处理方法及系统
US11455590B2 (en) * 2014-10-09 2022-09-27 Splunk Inc. Service monitoring adaptation for maintenance downtime
JP6306499B2 (ja) * 2014-12-25 2018-04-04 クラリオン株式会社 障害情報提供サーバ、障害情報提供方法
US10320892B2 (en) 2015-01-02 2019-06-11 Microsoft Technology Licensing, Llc Rolling capacity upgrade control
CN106302595B (zh) 2015-06-02 2020-03-17 阿里巴巴集团控股有限公司 一种对服务器进行健康检查的方法及设备
US10409579B1 (en) * 2016-04-19 2019-09-10 Wells Fargo Bank, N.A. Application healthcheck communicator
US10512053B2 (en) * 2016-05-10 2019-12-17 Servicenow, Inc. System and method for selectively hibernating and restarting a node of an application instance
US10587673B2 (en) 2016-06-29 2020-03-10 Nicira, Inc. Decoupling network connections from an application while the application is temporarily down
US10868883B2 (en) * 2016-06-29 2020-12-15 Nicira, Inc. Upgrading a proxy that decouples network connections from an application during application's downtime
US10896070B2 (en) 2017-09-22 2021-01-19 Open Text Corporation Stateless content management system
KR101862000B1 (ko) * 2017-11-22 2018-05-29 팝펀딩 주식회사 다중 거래소를 사용하는 암호화폐 리스크 관리시스템
US10628512B2 (en) 2018-05-04 2020-04-21 International Business Machines Corporation Callback notification for unavailable websites
US10904124B2 (en) 2018-11-07 2021-01-26 International Business Machines Corporation System and method for dynamic stopping of cloud-based provisioning requests
US11516286B2 (en) 2019-03-28 2022-11-29 Comcast Cable Communications, Llc Managing service capacity
US11195155B2 (en) * 2019-12-19 2021-12-07 Ripple Labs Inc. Network computing system executing failover state upon detection of a downed exchange
US11570246B1 (en) 2021-11-17 2023-01-31 Saudi Arabian Oil Company Layer 7 health check automated execution framework
US11922161B2 (en) * 2022-03-07 2024-03-05 Bank Of America Corporation Scheduling a pausable automated process in a computer network

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1614928A (zh) * 2003-11-06 2005-05-11 国际商业机器公司 操作服务器群集的方法和系统
CN1620653A (zh) * 2001-05-23 2005-05-25 国际商业机器公司 计算网络中服务的动态部署

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790431A (en) * 1995-11-20 1998-08-04 International Business Machines Corporation Method and system for measuring availability in a distributed network
US6021262A (en) * 1996-07-12 2000-02-01 Microsoft Corporation System and method for detection of, notification of, and automated repair of problem conditions in a messaging system
US5987513A (en) * 1997-02-19 1999-11-16 Wipro Limited Network management using browser-based technology
US6052803A (en) * 1997-09-26 2000-04-18 3Com Corporation Key-based technique for assuring and maintaining integrity of firmware stored in both volatile and non-volatile memory
US6167379A (en) * 1998-03-24 2000-12-26 Siemens Information And Communication Networks, Inc. System for user to accept or decline updating a calendar remotely with a proposed schedule update that may have schedule confliction
US6565608B1 (en) * 1998-12-16 2003-05-20 Microsoft Corporation Method and system for customizing alert messages
US6625636B1 (en) * 1999-05-13 2003-09-23 International Business Machines Corporation Job protection within a distributed processing system having subsystem downtime
US7441045B2 (en) * 1999-12-13 2008-10-21 F5 Networks, Inc. Method and system for balancing load distribution on a wide area network
US6738811B1 (en) * 2000-03-31 2004-05-18 Supermicro Computer, Inc. Method and architecture for monitoring the health of servers across data networks
US7099933B1 (en) * 2000-07-11 2006-08-29 Nortel Networks Limited System and method for regulating web site access
JP3654151B2 (ja) * 2000-07-17 2005-06-02 日本電気株式会社 携帯端末を利用した保守情報通知方法及びシステム並びに記録媒体
US7467193B2 (en) * 2000-08-01 2008-12-16 Qwest Communications International Inc Management of virtual and physical network inventories
JP2002108728A (ja) * 2000-10-02 2002-04-12 Ntt Docomo Inc 障害情報の掲載方法およびプロバイダ設備
US7035921B1 (en) * 2000-11-14 2006-04-25 Hewlett-Packard Development Company, L.P. Method of and apparatus for providing web service using a network of servers
US7296268B2 (en) * 2000-12-18 2007-11-13 Microsoft Corporation Dynamic monitor and controller of availability of a load-balancing cluster
US6820215B2 (en) * 2000-12-28 2004-11-16 International Business Machines Corporation System and method for performing automatic rejuvenation at the optimal time based on work load history in a distributed data processing environment
US6978398B2 (en) * 2001-08-15 2005-12-20 International Business Machines Corporation Method and system for proactively reducing the outage time of a computer system
US7155462B1 (en) * 2002-02-01 2006-12-26 Microsoft Corporation Method and apparatus enabling migration of clients to a specific version of a server-hosted application, where multiple software versions of the server-hosted application are installed on a network
US7039828B1 (en) * 2002-02-28 2006-05-02 Network Appliance, Inc. System and method for clustered failover without network support
US7250846B2 (en) * 2002-03-05 2007-07-31 International Business Machines Corporation Method and apparatus for providing dynamic user alert
US7149917B2 (en) * 2002-07-30 2006-12-12 Cisco Technology, Inc. Method and apparatus for outage measurement
US20040163007A1 (en) * 2003-02-19 2004-08-19 Kazem Mirkhani Determining a quantity of lost units resulting from a downtime of a software application or other computer-implemented system
US7516362B2 (en) * 2004-03-19 2009-04-07 Hewlett-Packard Development Company, L.P. Method and apparatus for automating the root cause analysis of system failures
JP4571937B2 (ja) 2004-03-25 2010-10-27 ソフトバンクBb株式会社 アクセスシステム及びアクセス方法
US20060224720A1 (en) * 2005-03-10 2006-10-05 Bhogal Kulvir S Method, computer program product, and system for mapping users to different application versions
US8910689B2 (en) * 2005-03-15 2014-12-16 The Procter & Gamble Company Apparatus for reducing downtime in web processes
US7308370B2 (en) * 2005-03-22 2007-12-11 Elster Electricity Llc Using a fixed network wireless data collection system to improve utility responsiveness to power outages
JP2006285315A (ja) 2005-03-31 2006-10-19 Hitachi Ltd ソフトウェア構成変更方式
US7310592B2 (en) * 2005-04-22 2007-12-18 Microsoft Corporation Method and apparatus to group sets of computers into classes for statistical analysis
US7873505B2 (en) * 2005-06-27 2011-01-18 Alcatel-Lucent Usa Inc. Method and apparatus for predicting scheduled system downtime
DE602005014992D1 (de) 2005-10-31 2009-07-30 Packetfront Systems Ab Hochverfügbarkeitsnetzwerksystem
US7549079B2 (en) * 2005-11-30 2009-06-16 Oracle International Corporation System and method of configuring a database system with replicated data and automatic failover and recovery
US7676702B2 (en) * 2006-08-14 2010-03-09 International Business Machines Corporation Preemptive data protection for copy services in storage systems and applications
US8181071B2 (en) 2007-06-29 2012-05-15 Microsoft Corporation Automatically managing system downtime in a computer network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1620653A (zh) * 2001-05-23 2005-05-25 国际商业机器公司 计算网络中服务的动态部署
CN1614928A (zh) * 2003-11-06 2005-05-11 国际商业机器公司 操作服务器群集的方法和系统

Also Published As

Publication number Publication date
EP2176775B1 (en) 2018-02-28
TWI450530B (zh) 2014-08-21
TW200908608A (en) 2009-02-16
WO2009006005A3 (en) 2009-02-12
EP2176775A4 (en) 2015-01-28
US8181071B2 (en) 2012-05-15
CN101689161A (zh) 2010-03-31
WO2009006005A2 (en) 2009-01-08
JP5211160B2 (ja) 2013-06-12
EP2176775A2 (en) 2010-04-21
US20090006884A1 (en) 2009-01-01
KR101532450B1 (ko) 2015-06-29
JP2010533905A (ja) 2010-10-28
KR20100031574A (ko) 2010-03-23

Similar Documents

Publication Publication Date Title
CN101689161B (zh) 自动管理计算机网络中的系统停机时间
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
US20090063175A1 (en) Methods and systems for providing multiple support options
US20090043669A1 (en) Systems and methods for collaborative federation of support
US11329869B2 (en) Self-monitoring
US10354208B2 (en) System and method for defining run books
CN101535978A (zh) 分布式服务器系统中的消息转发备份管理器
US20090043882A1 (en) Systems and methods for consolidated service level agreements
US10769641B2 (en) Service request management in cloud computing systems
CN103946799A (zh) 基于应用程序对其他应用程序的依赖性对其自动执行操作
JP2015506112A (ja) 一時的障害中における第2場所へのリクエストのリダイレクト
CN116302561A (zh) 用于应用实例的状态控制方法、装置、设备及存储介质
JP2007265244A (ja) ウェブシステムの性能監視装置
CN114240392A (zh) 信息处理方法、任务审批方法和信息处理装置
CN113238736A (zh) 一种生成集成平台的方法
US9448858B2 (en) Environment manager
CN117389689A (zh) 容器运维方法、装置、设备、介质和程序产品
US20230206144A1 (en) Methods, apparatuses and computer program products for generating an incident and change management user interface
US20220414524A1 (en) Incident Paging System
Leach et al. Automated service monitoring in the deployment of ARCHER2
Miró Blanco Implementing a Kubernetes cluster with IBM Cloud
CN117235043A (zh) 数据库迁移方法、装置、电子设备及介质
CN118118346A (zh) 用于数据采集器集群管理的方法、装置、电子设备及介质
CN116166465A (zh) 基于管理面集群的集群运维方法及装置
CN116737464A (zh) 备份失效处置方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150729

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150729

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C14 Grant of patent or utility model
GR01 Patent grant