JP2014506342A5 - - Google Patents

Download PDF

Info

Publication number
JP2014506342A5
JP2014506342A5 JP2013528254A JP2013528254A JP2014506342A5 JP 2014506342 A5 JP2014506342 A5 JP 2014506342A5 JP 2013528254 A JP2013528254 A JP 2013528254A JP 2013528254 A JP2013528254 A JP 2013528254A JP 2014506342 A5 JP2014506342 A5 JP 2014506342A5
Authority
JP
Japan
Prior art keywords
application
data center
component
resource
application component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013528254A
Other languages
English (en)
Other versions
JP2014506342A (ja
JP6132766B2 (ja
Filing date
Publication date
Priority claimed from US12/879,412 external-priority patent/US8365009B2/en
Application filed filed Critical
Publication of JP2014506342A publication Critical patent/JP2014506342A/ja
Publication of JP2014506342A5 publication Critical patent/JP2014506342A5/ja
Application granted granted Critical
Publication of JP6132766B2 publication Critical patent/JP6132766B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (13)

  1. アプリケーションコンポーネントを、障害のあるデータセンタリソースから障害のないデータセンタリソースへ再割り当てする方法であって、
    前記アプリケーションコンポーネントが配置されている前記障害のあるデータセンタリソースを識別するステップと、
    所与の期間内で前記アプリケーションコンポーネントが再割り当てされた機会の数を示すアプリケション履歴をデータストアで参照するステップ
    前記機会の数がしきい値数を超えるか判断するステップと、
    前記機会の数が前記しきい値数を超えない場合、前記アプリケーションコンポーネントを再割り当てするステップであって、前記再割り当てするステップは、
    サービス復旧タスクを生成するステップであって、前記サービス復旧タスクは、前記アプリケーションコンポーネントを、前記障害のあるデータセンタリソースから移動するタスクである、ステップと、
    コンポーネント再配置バックグラウンドモニタを実行するステップであって、前記コンポーネント再配置バックグラウンドモニタが前記サービス復旧タスクを使用して、前記アプリケーションコンポーネントを受け入れるために使用可能な前記障害のないデータセンタリソースを識別する、ステップと、
    ローリングアップグレードタスクを生成するステップであって、前記ローリングアップグレードタスクは前記アプリケーションコンポーネントを、前記障害のないデータセンタリソースへ移動することになることを命令するタスクである、ステップと、
    ローリングアップグレードバックグラウンドモニタを実行するステップであって、前記ローリングアップグレードバックグラウンドモニタが前記ローリングアップグレードタスクを使用して、前記アプリケーションコンポーネントを前記障害のないデータセンタリソースへ再割り当てする、ステップとにより行われるステップと、
    前記機会の数が前記しきい値数を超える場合、サービス復旧タスクを中断するステップと
    を備えることを特徴とする方法。
  2. 前記アプリケーションコンポーネントは、アプリケーションコンポーネントのセットのうちの1つのコンポーネントであり、
    前記セットが、2つ以上の仮想グループの間で分割され、前記アプリケーションコンポーネントは1つの仮想グループ内にあり、前記セットの別のアプリケーションコンポーネントは別の仮想グループ内にあるようにすることを特徴とする請求項1に記載の方法。
  3. 前記1つの仮想グループおよび前記別の仮想グループが、それぞれ障害のあるデータセンタリソース上で割り当てられており、
    前記ローリングアップグレードタスクに従った、前記アプリケーションコンポーネントの再割り当ての開始は、前記別の仮想グループ内の前記別のアプリケーションコンポーネントの再割り当ての完了を条件とすることを特徴とする請求項2に記載の方法。
  4. 前記障害のないデータセンタリソースを識別するために、前記コンポーネント再配置バックグラウンドモニタは、ネットワーク化されたコンピュータリソースコントローラによって維持されるリソースのインベントリを参照することを特徴とする請求項1に記載の方法。
  5. 前記障害のあるデータセンタリソースが、複数のデータセンタリソースのネットワーク内に含まれ、
    前記障害のあるデータセンタリソースを識別するステップに先立って、前記複数のうち、障害のあるデータセンタリソースを含む部分が識別され、
    前記部分がしきい値部分を超える場合、前記サービス復旧タスクが生成されないことを特徴とする請求項1に記載の方法。
  6. コンピュータ記憶メディア上で実施され、アプリケーションコンポーネントを、障害のあるデータセンタリソースから障害のないデータセンタリソースへ再割り当てするシステムであって、
    前記障害のあるデータセンタリソースを識別し、アプリケーション復旧レート依存ディスエイブラを含むリソース状況バックグラウンドモニタであって、
    アプリケーションのアプリケーションコンポーネントが、前記障害のあるデータセンタリソース上で配置され、
    前記アプリケーション復旧レート依存ディスエイブラは、前記アプリケーションが復旧された回数がアプリケーションごとの復旧頻度しきい値を超えないか判断し、
    前記アプリケーションが復旧された回数がアプリケーションごとの復旧頻度しきい値を超えないとき、前記リソース状況バックグラウンドモニタは、前記アプリケーションコンポーネントを前記障害のあるデータセンタリソースから再割り当てするための命令を含む、サービス復旧タスクを生成する、リソース状況バックグラウンドモニタと、
    前記サービス復旧タスクを受け入れ、前記アプリケーションコンポーネントを受け入れるために使用可能な前記障害のないデータセンタリソースを識別する、コンポーネント再配置バックグラウンドモニタであって、前記コンポーネント再配置バックグラウンドモニタは、前記アプリケーションコンポーネントを前記障害のないデータセンタリソースへ移動させるための命令を含む、アップグレードタスクを生成するコンポーネント再配置バックグラウンドモニタと、
    前記アップグレードタスクを受け入れ、前記アプリケーションコンポーネントを移動させるローリングアップグレードバックグラウンドモニタと
    を備えることを特徴とするシステム。
  7. データセンタリソースのグループの中で障害のあるデータセンタリソースの割合を決定するグループ正常性依存ディスエイブラさらに備え、
    前記割合がしきい値の割合を超える場合、前記リソース状況バックグラウンドモニタが無効化されることを特徴とする請求項に記載のシステム。
  8. 前記アプリケーションを所与の期間内で復旧する回数を追跡するアプリケーション復旧レート依存ディスエイブラをさらに備え、
    前記回数がアプリケーションごとの復旧頻度しきい値を超える場合、前記アプリケーションを復旧することを目的とする動作が無効化されることを特徴とする請求項に記載のシステム。
  9. セッションごとのスロットルをさらに備え、当該セッションごとのスロットルが、
    前記リソース状況バックグラウンドモニタが、単一の再割り当てセッション内で処理可能なアプリケーションコンポーネントの数、
    前記コンポーネント再配置バックグラウンドモニタが、単一の再割り当てセッション内で処理可能なアプリケーションコンポーネントの数、
    アップグレードバックグラウンドモニタが、単一の再割り当てセッション内で処理可能なアプリケーションコンポーネントの数、または、
    それらの組み合わせを
    制御することを特徴とする請求項に記載のシステム。
  10. コンピュータ実行可能命令を有するコンピュータ記憶メディアであって、前記命令は、実行される場合、アプリケーションコンポーネントを、障害のあるデータセンタリソースから障害のないデータセンタリソース220へ再割り当てする方法を実施し、前記方法は、
    データセンタリソースのグループの中で、前記グループの部分であって、障害のあるデータセンタリソースを含む部分を決定するステップと、
    前記部分を、グループ正常性しきい値と比較するステップと、
    前記部分が前記グループ正常性しきい値未満である場合、その上で前記アプリケーションコンポーネントが配置されている前記障害のあるデータセンタリソースを識別するステップであって、前記アプリケーションコンポーネントが、所与の期間内である回数の量だけ再割り当てされているステップと、
    前記回数の量を別のしきい値と比較するステップと、
    前記量が前記別のしきい値未満である場合、前記アプリケーションコンポーネントを、前記障害のあるデータセンタリソースから前記障害のないデータセンタリソースへ再割り当てするステップと
    を備えることを特徴とするコンピュータ記憶メディア。
  11. 前記別のしきい値は、アプリケーション復旧レートしきい値、コンポーネント復旧レートしきい値、または、それらの組み合わせを含むことを特徴とする請求項10に記載のコンピュータ記憶メディア。
  12. 前記アプリケーションコンポーネントは、アプリケーションコンポーネントのセットのうちの1つのコンポーネントであり、
    前記セットが、2つ以上の仮想グループの間で分割され、前記アプリケーションコンポーネントは1つの仮想グループ内にあり、前記セットの別のアプリケーションコンポーネントは別の仮想グループ内にあるようにすることを特徴とする請求項10に記載のコンピュータ記憶メディア。
  13. 前記1つの仮想グループおよび前記別の仮想グループが、それぞれ障害のあるデータセンタリソース上で割り当てられ、
    前記アプリケーションコンポーネントを再割り当てするステップは、前記別の仮想グループ内の前記別のアプリケーションコンポーネントの再割り当ての完了を条件とすることを特徴とする請求項12に記載のコンピュータ記憶メディア。
JP2013528254A 2010-09-10 2011-09-06 データセンタサービスの制御された自動復旧 Active JP6132766B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/879,412 US8365009B2 (en) 2010-09-10 2010-09-10 Controlled automatic healing of data-center services
US12/879,412 2010-09-10
PCT/US2011/050572 WO2012033773A2 (en) 2010-09-10 2011-09-06 Controlled automatic healing of data-center services

Publications (3)

Publication Number Publication Date
JP2014506342A JP2014506342A (ja) 2014-03-13
JP2014506342A5 true JP2014506342A5 (ja) 2014-09-25
JP6132766B2 JP6132766B2 (ja) 2017-05-24

Family

ID=45807841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013528254A Active JP6132766B2 (ja) 2010-09-10 2011-09-06 データセンタサービスの制御された自動復旧

Country Status (7)

Country Link
US (1) US8365009B2 (ja)
EP (1) EP2614436B1 (ja)
JP (1) JP6132766B2 (ja)
KR (1) KR101804605B1 (ja)
CN (1) CN102385541B (ja)
AU (1) AU2011299337B2 (ja)
WO (1) WO2012033773A2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120263191A1 (en) * 2011-04-12 2012-10-18 Red Hat Israel, Inc. Mechanism For Managing Quotas In a Distributed Virtualization Environment
US8832687B2 (en) * 2011-04-20 2014-09-09 Red Hat Israel, Ltd. Managing quotas in a distributed virtualization environment
US8984325B2 (en) * 2012-05-30 2015-03-17 Symantec Corporation Systems and methods for disaster recovery of multi-tier applications
EP2862077A4 (en) 2012-06-15 2016-03-02 Cycle Computing Llc METHOD AND SYSTEM FOR AUTOMATIC DETECTION AND RESOLUTION OF INFRASTRUCTURE DEFECTS IN CLOUD INFRASTRUCTURE
US8756689B2 (en) 2012-06-29 2014-06-17 Intel Corporation Method, system, and device for securely handling virtual function driver communications with a physical function driver
US20140115151A1 (en) * 2012-10-14 2014-04-24 Empire Technology Development Llc Error-capturing service replacement in datacenter environment for simplified application restructuring
US9201896B2 (en) 2012-11-26 2015-12-01 Red Hat, Inc. Managing distributed storage quotas
US9141487B2 (en) * 2013-01-15 2015-09-22 Microsoft Technology Licensing, Llc Healing cloud services during upgrades
US9317350B2 (en) 2013-09-09 2016-04-19 International Business Machines Corporation Method and apparatus for faulty memory utilization
US9807014B2 (en) 2013-09-27 2017-10-31 International Business Machines Corporation Reactive throttling of heterogeneous migration sessions in a virtualized cloud environment
US9578091B2 (en) * 2013-12-30 2017-02-21 Microsoft Technology Licensing, Llc Seamless cluster servicing
US9430318B2 (en) 2014-01-27 2016-08-30 Microsoft Technology Licensing, Llc Health monitoring and recovery for infrastructure devices
US10263836B2 (en) 2014-03-24 2019-04-16 Microsoft Technology Licensing, Llc Identifying troubleshooting options for resolving network failures
US9665432B2 (en) * 2014-08-07 2017-05-30 Microsoft Technology Licensing, Llc Safe data access following storage failure
US10110445B2 (en) 2014-09-27 2018-10-23 At&T Global Network Services France, Sas Closed control loops for data centers
US20160092801A1 (en) * 2014-09-30 2016-03-31 International Business Machines Corporation Using complexity probability to plan a physical data center relocation
US9513835B2 (en) 2015-01-09 2016-12-06 International Business Machines Corporation Impact-based migration scheduling from a first tier at a source to a second tier at a destination
US10721181B1 (en) 2015-03-10 2020-07-21 Amazon Technologies, Inc. Network locality-based throttling for automated resource migration
US9952932B2 (en) 2015-11-02 2018-04-24 Chicago Mercantile Exchange Inc. Clustered fault tolerance systems and methods using load-based failover
US10025654B2 (en) * 2016-04-01 2018-07-17 T-Mobile Usa, Inc. Diagnostic and workflow engine with system integration
CN105975047B (zh) * 2016-04-29 2019-03-01 北京百度网讯科技有限公司 云数据中心功耗调节方法和系统
US10944645B2 (en) * 2016-06-01 2021-03-09 Telefonaktiebolaget Lm Ericsson (Publ) Node of a network and a method of operating the same for resource distribution
US10334334B2 (en) * 2016-07-22 2019-06-25 Intel Corporation Storage sled and techniques for a data center
US9785497B1 (en) * 2016-09-26 2017-10-10 International Business Machines Corporation Performing self-healing tasks using information technology management data
JP6792409B2 (ja) 2016-10-25 2020-11-25 キヤノン株式会社 プログラム、システム及び情報処理方法
JP6942458B2 (ja) * 2016-10-25 2021-09-29 キヤノン株式会社 プログラム、システム及び情報処理方法
CN109697115B (zh) * 2017-10-20 2023-06-06 伊姆西Ip控股有限责任公司 用于调度应用的方法、装置以及计算机可读介质
CN109697121B (zh) * 2017-10-20 2023-05-05 伊姆西Ip控股有限责任公司 用于向应用分配处理资源的方法、设备和计算机可读介质
CN109697120B (zh) * 2017-10-20 2023-06-27 伊姆西Ip控股有限责任公司 用于应用迁移的方法、电子设备
US11150886B2 (en) 2019-09-03 2021-10-19 Microsoft Technology Licensing, Llc Automatic probabilistic upgrade of tenant devices
US20230319080A1 (en) * 2022-03-31 2023-10-05 Fortinet, Inc. Ai (artificial intelligence) driven dynamic self-remediation for wireless networks by dispatching robots

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0250737A (ja) * 1988-08-12 1990-02-20 Fuji Electric Co Ltd 二重化システム
US7165108B2 (en) * 2001-03-19 2007-01-16 Sun Microsystems, Inc. Method and apparatus for providing application specific strategies to a JAVA platform including load balancing policies
US6918051B2 (en) * 2001-04-06 2005-07-12 International Business Machines Corporation Node shutdown in clustered computer system
US7594230B2 (en) * 2001-06-11 2009-09-22 Microsoft Corporation Web server architecture
US6944785B2 (en) 2001-07-23 2005-09-13 Network Appliance, Inc. High-availability cluster virtual server system
US7403996B2 (en) * 2002-02-21 2008-07-22 Bea Systems, Inc. Systems and methods for migratable services
CN1326035C (zh) * 2002-06-24 2007-07-11 株式会社Ntt都科摩 在移动应用程序环境中使用的产品
US7356613B2 (en) 2004-08-17 2008-04-08 International Business Machines Corporation Routable application partitioning
WO2006026402A2 (en) 2004-08-26 2006-03-09 Availigent, Inc. Method and system for providing high availability to computer applications
US7730486B2 (en) * 2005-02-28 2010-06-01 Hewlett-Packard Development Company, L.P. System and method for migrating virtual machines on cluster systems
US7877755B2 (en) 2005-07-25 2011-01-25 International Business Machines Corporation Dynamic application placement with allocation restrictions and even load distribution
US7681075B2 (en) * 2006-05-02 2010-03-16 Open Invention Network Llc Method and system for providing high availability to distributed computer applications
US7454661B2 (en) * 2005-10-06 2008-11-18 International Business Machines Corporation Minimizing software downtime associated with software rejuvenation in a single computer system
KR100672313B1 (ko) * 2005-12-12 2007-01-24 엘지전자 주식회사 전자앨범 기능을 갖는 디스플레이 장치 및 그 방법
JP4821426B2 (ja) * 2006-05-11 2011-11-24 富士ゼロックス株式会社 エラー回復プログラム、エラー回復装置及びコンピュータシステム
CN100451967C (zh) * 2007-02-14 2009-01-14 威盛电子股份有限公司 基本输入输出系统文件切换方法及可支持其切换的控制器
US8122281B2 (en) 2007-04-13 2012-02-21 International Business Machines Corporation System and method for dependent failure-aware allocation of distributed data-processing systems
US7966516B2 (en) 2007-04-27 2011-06-21 Oracle International Corporation Automatic JTA migration
JP2009059084A (ja) 2007-08-30 2009-03-19 Denso Corp 制御システム,電子機器およびプログラム
US8112758B2 (en) 2008-01-08 2012-02-07 International Business Machines Corporation Methods and apparatus for resource allocation in partial fault tolerant applications
US7886183B2 (en) 2008-08-07 2011-02-08 Symantec Operating Corporation Providing fault tolerant storage system to a cluster
JP5232602B2 (ja) * 2008-10-30 2013-07-10 株式会社日立製作所 ストレージ装置、及びストレージコントローラ内部ネットワークのデータ経路フェイルオーバー方法
CN101715001A (zh) * 2009-10-21 2010-05-26 南京邮电大学 一种控制网格任务执行的方法

Similar Documents

Publication Publication Date Title
JP2014506342A5 (ja)
JP6132766B2 (ja) データセンタサービスの制御された自動復旧
US8635493B2 (en) High availability system allowing conditionally reserved computing resource use and reclamation upon a failover
TWI493331B (zh) 經由虛擬化機會之電力最佳化
JP4934642B2 (ja) 計算機システム
WO2013145288A1 (ja) 情報処理装置、仮想マシン停止方法およびプログラム
CN106776113B (zh) 一种虚拟机备份方法及装置
JP2013527529A5 (ja)
RU2019101794A (ru) Способы, системы и устройство для динамического обеспечения безграничного администрирования системы высокой доступности
CN104750596B (zh) 一种告警信息处理方法及服务子系统
TW201535266A (zh) 虛擬機器之資源調整方法及系統
EP2819010A3 (en) Performance-driven resource management in a distributed computer system
CN103559124B (zh) 故障快速检测方法及装置
JPWO2014091580A1 (ja) クラウドシステム管理装置、クラウドシステム、再配置方法、及びプログラム
CN103229487A (zh) 分布式存储系统中的分区平衡方法、装置及服务器
CN105681077A (zh) 故障处理方法、装置及系统
CN111953732B (zh) 一种云计算系统中的资源调度方法及装置
CN105574008A (zh) 应用于分布式文件系统的任务调度方法和设备
CN105487946A (zh) 一种故障计算机自动切换方法及装置
CN108320048A (zh) 一种车轮镟修策略优化方法及装置
WO2016151584A3 (en) Distributed large scale storage system
KR20100022171A (ko) 스레드 지향 로깅 시스템에서 로그 저장 방법 및 장치
CN108055321A (zh) 基于国产化平台的高可靠集群构建方法
CN104699787B (zh) 一种用户活动状态记录的更新方法及装置
US9778994B1 (en) Parallel node backup for CSV