JP6123626B2 - 処理再開方法、処理再開プログラムおよび情報処理システム - Google Patents
処理再開方法、処理再開プログラムおよび情報処理システム Download PDFInfo
- Publication number
- JP6123626B2 JP6123626B2 JP2013211348A JP2013211348A JP6123626B2 JP 6123626 B2 JP6123626 B2 JP 6123626B2 JP 2013211348 A JP2013211348 A JP 2013211348A JP 2013211348 A JP2013211348 A JP 2013211348A JP 6123626 B2 JP6123626 B2 JP 6123626B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- host
- guest
- computer
- migration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/485—Task life-cycle, e.g. stopping, restarting, resuming execution
- G06F9/4856—Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
- G06F9/5088—Techniques for rebalancing the load in a distributed system involving task migration
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
Description
図1は、実施例1に係るシステムの全体構成例を示す図である。図1に示すように、このシステムは、ストレージ装置2、ストレージ装置3、クラウド管理サーバ10、VMホスト30、VMホスト60を有する。各VMホストは、仮想マシンであるVMゲストを動作させる。また、各装置は、ネットワーク5を介して接続される。
図2は、実施例1に係るクラウド管理サーバの機能構成を示す機能ブロック図である。図2に示すように、クラウド管理サーバ10は、通信制御部11、記憶部12、制御部20を有する。
図9は、VMホストの階層構造の例を示す図である。なお、ここでは、一例として1台のVMホストでVMを動作させる例を説明する。また、ここでは、一例としてVMホスト30を例にして説明する。
図10は、実施例1に係るVMホストの機能構成を示す機能ブロック図である。なお、VMホスト30とVMホスト60とは同様の構成を有するので、ここでは、VMホスト30を例にして説明する。図10に示すように、VMホスト30は、通信制御部31、記憶部32、制御部33を有する。
図11は、実施例1に係るVMゲストの機能構成を示す機能ブロック図である。なお、各VMゲストは同様の構成を有するので、ここでは、VMゲスト40として説明する。図11に示すように、VMゲスト40は、通信制御部41、記憶部42、制御部44を有する。
次に、各装置が実行する処理の流れを説明する。ここでは、システム全体の処理シーケンス、クラウド管理サーバの処理、移動元のVMホストの処理、移動先のVMホストの処理、VMゲストの処理について説明する。なお、ここでは、VMホスト30で動作するVMゲスト40をVMホスト60へマイグレーションさせる例で説明する。
図14は、実施例1に係る処理のシーケンス図である。図14に示すように、クラウド管理サーバ10は、管理者等からマイグレーション指示を受信する(S101)。すると、クラウド管理サーバ10は、マイグレーション対象のVMゲストを動作させる移動元のVMホスト30に対して、マイグレーション指示を送信する(S102とS103)。
図15は、実施例1に係るクラウド管理サーバが実行する処理の流れを示すフローチャートである。図15に示すように、クラウド管理サーバ10のマイグレーション実行部22は、管理者等からVMゲスト40のマイグレーション指示を受信する(S201)。例えば、マイグレーション実行部22は、マイグレーションさせるVMゲスト40のIDと移動先のVMホスト60のIDとを受信する。
図16は、実施例1に係る移動元のVMホストが実行する処理の流れを示すフローチャートである。図16に示すように、移動元のVMホスト30のリソース割当部34は、自装置上で動作するVMゲスト40のマイグレーション指示を受信する(S301)。例えば、リソース割当部34は、マイグレーション対象のVMゲスト40のIDと移動先のVMホスト60のIDとを、クラウド管理サーバ10から受信する。
図17は、実施例1に係る移動先のVMホストが実行するマイグレーション処理の流れを示すフローチャートである。
図18は、実施例1に係る移動先のVMホストが実行するI/O要求処理の流れを示すフローチャートである。図18に示すように、移動先のVMホスト60の通知部65は、マイグレーションしてきたVMゲスト40から仮想ディスクへのI/O要求を受信する(S501)。
図19は、実施例1に係る移動対象のVMゲストが実行する処理の流れを示すフローチャートである。図19に示すように、VMゲスト40のアプリ実行部45は、アプリケーションを実行し、実行時間であるCPU Timeを計測して仮想メモリ等に記録する(S601)。ここで記録された時間を「Texe」とする。
次に、VMゲスト「Guest_02」をVMホスト「Host_102」にマイグレーションする例で説明する。なお、VMゲスト「Guest_02」は、アプリAを実行しているものとする。
ここで、VMゲスト「Guest_02」は、ジョブを開始してから、CPU時間(処理時間)が5分の時に、マイグレーションしたことの通知を受けたとする。そして、VMゲスト「Guest_02」は、「Tdata=7分」であることから、このまま中断点からジョブを継続するには、仮想ディスクの中身の転送完了を7分待つことになる。
ここで、VMゲスト「Guest_02」は、ジョブを開始して、CPU時間(処理時間)が10分の時に、マイグレーションしたことの通知を受けたとする。そして、VMゲスト「Guest_02」は、「Tdata=7分」であることから、このまま中断点からジョブを継続するには、仮想ディスクの中身の転送完了を7分待つことになる。
このように、VMゲストが、マイクレーション先で、マイグレーションで中断した途中データを転送して処理再開するまでの時間と、最初からやり直すまでにかかる時間を算出し、時間が早い方を選択することができる。つまり、VMゲストは、マイグレーション時に中断した処理をマイグレーション先で再開する際に、未実行の部分を再開するまでにかかる時間を計算する。そして、VMゲストは、より早く再開できる方式で中断した処理を実行できる。
図20は、実施例2に係る処理のシーケンス図である。図20に示すように、クラウド管理サーバ10は、管理者等からマイグレーション指示を受信する(S701)。すると、クラウド管理サーバ10は、マイグレーション対象のVMゲストが使用する仮想ディスクの転送要否を判定する(S702)。続いて、クラウド管理サーバ10は、仮想ディスクの転送要否とマイグレーション指示とを移動元のVMホスト30に送信する(S703とS704)。
図21は、実施例2に係るクラウド管理サーバが実行する処理の流れを示すフローチャートである。図21に示すように、クラウド管理サーバ10のマイグレーション実行部22は、管理者等からVMゲスト40のマイグレーション指示を受信する(S801)。
図22は、実施例2に係る移動元のVMホストが実行する処理の流れを示すフローチャートである。
図23は、実施例2に係る移動対象のVMゲストが実行する処理の流れを示すフローチャートである。図23に示すように、VMゲスト40のアプリ実行部45は、アプリケーションを実行し、実行時間であるCPU Timeを計測して仮想メモリ等に記録する(S1001)。ここで記録された時間を「Texe」とする。
このように、実施例2に係るVMゲスト40は、マイグレーション前に移動元のVMホスト30から通知を受信して、再開方式を判定することができる。したがって、VMゲスト40は、マイグレーションが完了するとすぐに、ジョブの再開を実行することができる。この結果、実施例1に比べて、アプリケーション全体の処理時間の短縮が期待できる。
上記実施例1や2では、移動元のVMホストと移動先のVMホストがストレージを共有していない例を説明したが、これに限定されるものではない。例えば、移動元のVMホストと移動先のVMホストがストレージを共有している場合、VMゲストは、中断点から再開する方式を選択することができる。なお、ストレージを共有していることを条件にマイグレーション先を選択することは、マイグレーション先が限定的になる可能性もある。
実施例1や2では、VMゲストがいずれの再開方式を用いる決定した場合であっても、移動元の仮想ディスクの情報を移動先に転送する例を説明したが、これに限定されるものではない。例えば、VMゲストが、最初からやり直すと決定したタイミングで、仮想ディスクのコピーが実行中である場合には、当該コピーを中止してもよい。また、VMゲストが、移動前に最初からやり直すと決定した場合、仮想ディスクのコピーを実行しないようにすることもできる。このようにすることで、無用な処理を抑制できるので、仮想ゲストのCPUの負荷を軽減でき、再開するジョブの実行時間の短縮にも繋がる。また、ネットワーク帯域の浪費を抑制できる。
例えば、VMゲストの処理を中断点からそのまま継続するために用いるデータまたはファイルが、仮想ディスクのどの部分にあるかの情報を特定できる場合は、再開方式の判断をより細かく実施することもできる。例えば、仮想ディスクの中身のデータの転送が、仮想ディスクの先頭から実施され、仮想ディスクの先頭近くにデータまたはファイルあることを想定する。この場合、データが転送されるのを待った方が、処理を最初からやり直すよりも有利になる場合がある。つまり、このような場合には、VMゲストは、最初からやり直す方式を用いると決定した場合であっても、データ転送を待って中断点からやり直す方式を採用する。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
次に、VMホストやクラウド管理サーバのハードウェア構成例を説明するが、各サーバは同様の構成を有するので、ここでは一例を説明する。図24は、ハードウェア構成例を示す図である。図24に示すように、サーバ100は、NIC(Network Interface Card)100a、入力装置100b、表示装置100c、記憶装置100d、CPU100eがバス100fで接続される。
11 通信制御部
12 記憶部
13 VMホスト管理テーブル
14 VMゲスト管理テーブル
15 物理ストレージ管理テーブル
16 仮想ストレージ管理テーブル
17 仮想ディスク管理テーブル
18 帯域管理テーブル
20 制御部
21 クラウド管理部
22 マイグレーション実行部
30 VMホスト
31 通信制御部
32 記憶部
33 制御部
34 リソース割当部
35 通知部
40 VMゲスト
41 通信制御部
42 記憶部
43 アプリ特性テーブル
44 制御部
45 アプリ実行部
46 通知受信部
47 第1時間算出部
48 第2時間算出部
49 判定部
Claims (6)
- 第1のコンピュータが、
前記第1のコンピュータと異なる第2のコンピュータで実行される処理を中断させて前記第1のコンピュータで実行する場合に、前記処理が中断するまでに前記第2のコンピュータの記憶領域に格納したデータを前記第1のコンピュータへ転送する際にかかる第1の時間と、前記中断した処理を最初から実行する際に用いるデータを該データが格納される領域から前記第1のコンピュータへ転送する際にかかる転送時間および前記中断するまでにかかった処理時間から第2の時間とを算出し、
前記第1の時間が前記第2の時間より早い場合には、前記中断した処理を中断した時点から再開し、前記第2の時間が前記第1の時間より早い場合には、前記中断した処理を最初から実行する、
処理を含むことを特徴とする処理再開方法。 - 前記実行する処理は、前記第2の時間が前記第1の時間より早いにも関らず、前記中断した処理に対応するアプリケーションが処理を最初から再実行できないアプリケーションである場合には、前記中断した処理を中断した時点から再開することを特徴とする請求項1に記載の処理再開方法。
- 前記実行する処理は、移動元の前記第2のコンピュータと移動先の前記第1のコンピュータとがストレージ装置を共有している場合には、前記中断した処理を中断した時点から再開することを特徴とする請求項1に記載の処理再開方法。
- 前記算出する処理は、前記第2のコンピュータまたは前記第1のコンピュータから、前記処理が中断したことまたは前記処理を再開することが通知された場合に、前記第1の時間と前記第2の時間とを算出することを特徴とする請求項1に記載の処理再開方法。
- 第1のコンピュータに、
前記第1のコンピュータと異なる第2のコンピュータで実行される処理を中断させて前記第1のコンピュータで実行する場合に、前記処理が中断するまでに前記第2のコンピュータの記憶領域に格納したデータを前記第1のコンピュータへ転送する際にかかる第1の時間と、前記中断した処理を最初から実行する際に用いるデータを該データが格納される領域から前記第1のコンピュータへ転送する際にかかる転送時間および前記中断するまでにかかった処理時間から第2の時間とを算出し、
前記第1の時間が前記第2の時間より早い場合には、前記中断した処理を中断した時点から再開し、前記第2の時間が前記第1の時間より早い場合には、前記中断した処理を最初から実行する、
処理をさせることを特徴とする処理再開プログラム。 - 第1のコンピュータと第2のコンピュータとを有する情報処理システムにおいて、
前記第1のコンピュータは、
前記第1のコンピュータで動作させる仮想マシンを前記第2のコンピュータにマイグレーションさせる移動制御部を有し、
前記第2のコンピュータは、
前記第1のコンピュータから前記第2のコンピュータに移動する仮想マシンが移動に伴って中断するまでに格納したデータを、前記第1のコンピュータに転送する際にかかる第1の時間を算出する第1算出部と、
前記中断した処理を最初から実行する際に用いるデータを当該データが格納される領域から前記第1のコンピュータへ転送する際にかかる転送時間および前記中断するまでにかかった処理時間から、第2の時間を算出する第2算出部と、
前記第1の時間が前記第2の時間より早い場合には、前記中断した処理を中断した時点から再開し、前記第2の時間が前記第1の時間より早い場合には、前記中断した処理を最初から実行する再開実行部と
を有することを特徴とする情報処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013211348A JP6123626B2 (ja) | 2013-10-08 | 2013-10-08 | 処理再開方法、処理再開プログラムおよび情報処理システム |
US14/458,382 US9571584B2 (en) | 2013-10-08 | 2014-08-13 | Method for resuming process and information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013211348A JP6123626B2 (ja) | 2013-10-08 | 2013-10-08 | 処理再開方法、処理再開プログラムおよび情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015075898A JP2015075898A (ja) | 2015-04-20 |
JP6123626B2 true JP6123626B2 (ja) | 2017-05-10 |
Family
ID=52778028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013211348A Active JP6123626B2 (ja) | 2013-10-08 | 2013-10-08 | 処理再開方法、処理再開プログラムおよび情報処理システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9571584B2 (ja) |
JP (1) | JP6123626B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9760398B1 (en) | 2015-06-29 | 2017-09-12 | Amazon Technologies, Inc. | Automatic placement of virtual machine instances |
US10628195B2 (en) | 2015-10-22 | 2020-04-21 | Genband Us Llc | High availability for virtual network functions |
CN106331150B (zh) * | 2016-09-18 | 2018-05-18 | 北京百度网讯科技有限公司 | 用于调度云服务器的方法和装置 |
JP6866724B2 (ja) * | 2017-03-28 | 2021-04-28 | 日本電気株式会社 | 分散コンピューティングシステム、処理選択装置、処理選択方法及びプログラム |
US11093272B2 (en) * | 2018-06-27 | 2021-08-17 | International Business Machines Corporation | Virtual machine allocation and migration between hardware devices by destroying and generating enclaves using transmitted datafiles and cryptographic keys |
CN108880898B (zh) * | 2018-06-29 | 2020-09-08 | 新华三技术有限公司 | 主备容器系统切换方法及装置 |
JP7124670B2 (ja) * | 2018-11-26 | 2022-08-24 | 富士通株式会社 | 演算処理装置及び演算処理装置の制御方法 |
JP2021012464A (ja) * | 2019-07-04 | 2021-02-04 | 富士通株式会社 | 切替プログラム、装置、および方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3163196B2 (ja) * | 1993-04-07 | 2001-05-08 | 富士通株式会社 | 仮想記憶制御における命令中断情報格納制御方法 |
JP4034312B2 (ja) | 2003-03-24 | 2008-01-16 | 富士通株式会社 | 分散処理制御装置、分散処理制御方法および分散処理制御プログラム |
JP2007179100A (ja) * | 2005-12-26 | 2007-07-12 | Sharp Corp | ジョブキューシステムおよびジョブ管理方法、制御プログラム、可読記録媒体 |
WO2012066640A1 (ja) * | 2010-11-16 | 2012-05-24 | 株式会社日立製作所 | 計算機システム、マイグレーション方法及び管理サーバ |
WO2014002213A1 (ja) * | 2012-06-27 | 2014-01-03 | 株式会社日立製作所 | 管理システム及び管理方法 |
-
2013
- 2013-10-08 JP JP2013211348A patent/JP6123626B2/ja active Active
-
2014
- 2014-08-13 US US14/458,382 patent/US9571584B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9571584B2 (en) | 2017-02-14 |
JP2015075898A (ja) | 2015-04-20 |
US20150100960A1 (en) | 2015-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6123626B2 (ja) | 処理再開方法、処理再開プログラムおよび情報処理システム | |
US9183099B2 (en) | Replication of a write-back cache using a placeholder virtual machine for resource management | |
US10963356B2 (en) | Dynamic allocation of compute resources at a recovery site | |
US10628273B2 (en) | Node system, server apparatus, scaling control method, and program | |
JP5032191B2 (ja) | サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム | |
US10838829B2 (en) | Method and apparatus for loading data from a mirror server and a non-transitory computer readable storage medium | |
US8473692B2 (en) | Operating system image management | |
US9354907B1 (en) | Optimized restore of virtual machine and virtual disk data | |
US9792150B1 (en) | Detecting site change for migrated virtual machines | |
US10846079B2 (en) | System and method for the dynamic expansion of a cluster with co nodes before upgrade | |
US20120144391A1 (en) | Provisioning a virtual machine | |
US11436042B2 (en) | Migrating the runtime state of a container between two nodes | |
JP2011128967A (ja) | 仮想計算機の移動方法、仮想計算機システム及びプログラム | |
JP2013148984A (ja) | プログラム、仮想マシン制御方法、情報処理装置および情報処理システム | |
US11604705B2 (en) | System and method for cloning as SQL server AG databases in a hyperconverged system | |
US11604806B2 (en) | System and method for highly available database service | |
JP6421470B2 (ja) | 仮想マシンマイグレーションプログラム、仮想マシンマイグレーションシステムおよび仮想マシンマイグレーション方法 | |
WO2024213056A1 (zh) | 高性能计算集群的控制方法、电子设备以及存储介质 | |
US8621260B1 (en) | Site-level sub-cluster dependencies | |
CN106775846B (zh) | 用于物理服务器的在线迁移的方法及装置 | |
JP2013205946A (ja) | 移動制御プログラム、移動制御方法および制御装置 | |
US10747567B2 (en) | Cluster check services for computing clusters | |
US20190243550A1 (en) | System and method for migrating storage while in use | |
JP5557612B2 (ja) | 計算機及び転送プログラム | |
US10540112B2 (en) | System and method for migrating virtual machines with storage while in use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6123626 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |