JP5742387B2 - 情報処理システム、及びi/oスイッチ装置 - Google Patents
情報処理システム、及びi/oスイッチ装置 Download PDFInfo
- Publication number
- JP5742387B2 JP5742387B2 JP2011079786A JP2011079786A JP5742387B2 JP 5742387 B2 JP5742387 B2 JP 5742387B2 JP 2011079786 A JP2011079786 A JP 2011079786A JP 2011079786 A JP2011079786 A JP 2011079786A JP 5742387 B2 JP5742387 B2 JP 5742387B2
- Authority
- JP
- Japan
- Prior art keywords
- virtual machine
- pci
- information processing
- computer
- switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2017—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/10—Program control for peripheral devices
- G06F13/12—Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor
- G06F13/122—Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor where hardware performs an I/O function other than control of data transfer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/485—Task life-cycle, e.g. stopping, restarting, resuming execution
- G06F9/4856—Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Stored Programmes (AREA)
Description
仮想マシンは、コンピュータ上で動作する仮想マシンモニタにより作成され、その仮想マシンモニタによってハードウェアが割り当てられる。仮想マシンのI/O(Input/Output)、つまりハードウェアへのアクセスは、仮想マシンモニタを介して行われる。仮想マシンモニタを介することにより、ハードウェアへのアクセス速度、特にコンピュータに接続された、そのコンピュータとの間でデータの入出力を行うI/Oデバイスへのアクセス速度は低下する。このことから、最近では、I/O性能を向上させる手段として、I/Oデバイスを仮想マシンに対して直接割り当てる直接I/O(Direct I/O)と呼ばれる技術がハードウェア機能として実装されてきている。このI/Oデバイスは以降「PCI(Peripheral Component Interconnect)デバイス」と呼ぶことにする。
・Pre-Copyフェーズ
移行先のコンピュータ上に停止した状態の仮想マシンを作成し、移行元のコンピュータ上で稼働中の仮想マシンのメモリ内容を移行先のコンピュータに転送し、作成した仮想マシンにコピーする。
・Stop-and-Copyフェーズ
メモリ内容の転送量がある閾値を超えたら、移行元コンピュータ上で仮想マシンを一時停止する。一時停止中に、残りのメモリ内容及び転送開始後に変更されたメモリ内容、CPU状態、エミュレーションしているハードウェアの状態などを移行先コンピュータに転送する。PCIスイッチにおいて、移行元コンピュータから直接I/Oで使用中のPCIデバイスとの接続を切断し、移行先コンピュータに接続し、直接I/Oで使用可能にする。
・Activationフェーズ
移行先コンピュータにおいて、Stop-and-Copyフェーズで転送された内容を、作成した仮想マシンに反映して、その仮想マシンを再開させる。移動元の仮想マシンは破棄される。
この停止期間内では、移行元のコンピュータ及び移行先のコンピュータにおけるPCIデバイスの切断、接続のホットプラグ処理、PCIスイッチからの接続、切断通知後は、BIOSなどのファームウェアによるPCIデバイスのコンフィグレーション処理、仮想マシンモニタによる直接I/Oの設定処理、などが行われる。このため、直接I/Oを使用しない仮想マシンのライブマイグレーションでは仮想マシンの停止時間は数10msから200ms程度であるのに対し、直接I/Oを使用する仮想マシンのライブマイグレーションでは停止時間はさらに数100ms程度、長くなる。
図1は、本実施形態によるコンピュータシステムの構成を説明する図である。この図1に表す構成例は、本実施形態によるコンピュータシステムに必要な最小限の構成要素を用いて構築されたものである。そのコンピュータシステムは、2台のコンピュータ(物理的な計算機)1(1−1〜1−2)、I/OデバイスであるPCIデバイス2、2台のコンピュータ1とPCIデバイス2間のデータの入出力を中継するI/OスイッチであるPCIスイッチ3を備えている。
2 PCIデバイス
3 PCIスイッチ
11、11−1〜11−n 仮想マシン
12 仮想マシンモニタ
12a 移行プログラム
12d スイッチ管理機能
13 ハードウェア群
34 切替回路
34a スイッチ
34c 切替スイッチ
35 デバイスエミュレータ
36 接続管理部
36a 接続切替部
36b エミュレータ制御部
Claims (4)
- 仮想マシンが作成される第1の情報処理装置と、
前記第1の情報処理装置上で作成された仮想マシンを移行可能な第2の情報処理装置と、
前記第1の情報処理装置、及び前記第2の情報処理装置との間でデータの入出力を行うことが可能なI/Oデバイスと、
前記I/Oデバイスと前記第1の情報処理装置、或いは前記第2の情報処理装置との間でデータの入出力を中継するI/Oスイッチ装置と、
前記I/Oデバイスのエミュレーションを行うエミュレーション部と、
前記第1の情報処理装置上で稼働中の前記仮想マシンを停止させるまでの間、前記第1の情報処理装置を前記I/Oデバイスに接続させ、且つ前記第2の情報処理装置を前記エミュレーション部に接続させると共に、前記第1の情報処理装置上の前記仮想マシンを停止させた後、前記第2の情報処理装置を前記I/Oデバイスに接続させる接続切替部と、
前記I/Oスイッチ装置に設けられており、前記エミュレーション部がエミュレーションを行っているI/Oデバイスのコンフィグレーション空間情報を該I/Oデバイスから取得して前記エミュレーション部へ転送する転送部と、
を具備することを特徴とする情報処理システム。 - 前記エミュレーション部、及び前記接続切替部は、前記第1の情報処理装置からの指示により、前記I/Oスイッチ装置を用いて実現される、
ことを特徴とする請求項1記載の情報処理システム。 - 前記第1の情報処理装置は、前記I/Oスイッチ装置を用いて前記エミュレーション部、及び前記接続切替部を実現させた後、前記接続切替部により、前記仮想マシンを作成して停止させた後の前記第2の情報処理装置を前記エミュレーション部に接続させる、
ことを特徴とする請求項2記載の情報処理システム。 - 複数の情報処理装置、及び複数のI/Oデバイスを接続可能なI/Oスイッチ装置において、
前記複数のI/Oデバイスのなかで指定されたI/Oデバイスのエミュレーションを行うエミュレーション部と、
前記複数の情報処理装置の接続先を、前記エミュレーション部と、該エミュレーション部がエミュレーションを行っているI/Oデバイスとの間で切り替え可能な接続切替部と、
前記エミュレーション部がエミュレーションを行っているI/Oデバイスのコンフィグレーション空間情報を該I/Oデバイスから取得して前記エミュレーション部へ転送する転送部と、
を具備することを特徴とするI/Oスイッチ装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011079786A JP5742387B2 (ja) | 2011-03-31 | 2011-03-31 | 情報処理システム、及びi/oスイッチ装置 |
US13/431,017 US8966480B2 (en) | 2011-03-31 | 2012-03-27 | System for migrating a virtual machine between computers |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011079786A JP5742387B2 (ja) | 2011-03-31 | 2011-03-31 | 情報処理システム、及びi/oスイッチ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012215987A JP2012215987A (ja) | 2012-11-08 |
JP5742387B2 true JP5742387B2 (ja) | 2015-07-01 |
Family
ID=46929056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011079786A Expired - Fee Related JP5742387B2 (ja) | 2011-03-31 | 2011-03-31 | 情報処理システム、及びi/oスイッチ装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8966480B2 (ja) |
JP (1) | JP5742387B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5401679B2 (ja) * | 2009-02-19 | 2014-01-29 | 株式会社日立製作所 | 計算機システム、管理方法及び管理サーバ |
JP6089835B2 (ja) * | 2013-03-19 | 2017-03-08 | 富士通株式会社 | 情報処理装置及び制御方法 |
US9720712B2 (en) * | 2013-06-03 | 2017-08-01 | Red Hat Israel, Ltd. | Physical/virtual device failover with a shared backend |
US9699093B2 (en) * | 2013-06-12 | 2017-07-04 | Dell Products L.P. | Migration of virtual machine based on proximity to peripheral device in NUMA environment |
US9448827B1 (en) * | 2013-12-13 | 2016-09-20 | Amazon Technologies, Inc. | Stub domain for request servicing |
US9411765B2 (en) * | 2013-12-20 | 2016-08-09 | Qualcomm Incorporated | Methods of using a peripheral component interconnect express (PCIE) device in a virtual environment |
US11487566B2 (en) * | 2016-06-28 | 2022-11-01 | Vmware, Inc. | Cross-cloud provider virtual machine migration |
US10162770B2 (en) * | 2016-06-30 | 2018-12-25 | Intel Corporation | Virtual machine migration in rack scale systems |
US11044175B2 (en) * | 2016-10-25 | 2021-06-22 | International Business Machines Corporation | Hybrid cloud broker with static and dynamic capability matching |
US10509758B1 (en) * | 2017-09-28 | 2019-12-17 | Amazon Technologies, Inc. | Emulated switch with hot-plugging |
US11922211B2 (en) * | 2020-12-16 | 2024-03-05 | Vmware, Inc. | System and method for cross-architecture trusted execution environment migration |
US11775329B1 (en) * | 2020-12-30 | 2023-10-03 | Virtuozzo International Gmbh | System and method for reducing virtual machine live migration downtime |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4810349B2 (ja) | 2006-08-11 | 2011-11-09 | 日本電気株式会社 | I/o装置及び方法 |
US7743389B2 (en) * | 2007-11-06 | 2010-06-22 | Vmware, Inc. | Selecting between pass-through and emulation in a virtual machine environment |
JP5116497B2 (ja) * | 2008-01-31 | 2013-01-09 | 株式会社日立製作所 | 情報処理システム、i/oスイッチ及びi/oパスの交替処理方法 |
JP5028304B2 (ja) | 2008-03-11 | 2012-09-19 | 株式会社日立製作所 | 仮想計算機システム及びその制御方法 |
JP5251188B2 (ja) * | 2008-03-18 | 2013-07-31 | 富士通株式会社 | 情報処理装置、情報処理装置の制御方法及びコンピュータプログラム |
JP5262404B2 (ja) | 2008-08-04 | 2013-08-14 | 株式会社日立製作所 | 複合型計算機及び複合型計算機の制御方法 |
WO2010116402A1 (ja) | 2009-03-30 | 2010-10-14 | 富士通株式会社 | 情報処理装置 |
JP5218252B2 (ja) * | 2009-04-24 | 2013-06-26 | 富士通株式会社 | バススイッチ,コンピュータシステム及びコンピュータシステムの管理方法 |
US8271704B2 (en) * | 2009-06-16 | 2012-09-18 | International Business Machines Corporation | Status information saving among multiple computers |
JP5541117B2 (ja) * | 2010-11-26 | 2014-07-09 | 富士通株式会社 | 仮想マシン移行システム、仮想マシン移行プログラム、及び仮想マシン移行方法 |
-
2011
- 2011-03-31 JP JP2011079786A patent/JP5742387B2/ja not_active Expired - Fee Related
-
2012
- 2012-03-27 US US13/431,017 patent/US8966480B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20120254866A1 (en) | 2012-10-04 |
US8966480B2 (en) | 2015-02-24 |
JP2012215987A (ja) | 2012-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5742387B2 (ja) | 情報処理システム、及びi/oスイッチ装置 | |
JP5018252B2 (ja) | デバイス割り当て変更方法 | |
TWI511048B (zh) | 多主機上單根輸入/輸出虛擬化虛擬功能共享的方法及系統 | |
EP3985504B1 (en) | Virtual machine migration | |
JP4995015B2 (ja) | 仮想計算機の実行可否検査方法 | |
US7484029B2 (en) | Method, apparatus, and computer usable program code for migrating virtual adapters from source physical adapters to destination physical adapters | |
JP5222651B2 (ja) | 仮想計算機システムおよび仮想計算機システムの制御方法 | |
CN110858157A (zh) | 在可扩展i/o虚拟化(s-iov)架构中的虚拟设备的实时迁移 | |
US9804873B2 (en) | Guest management of devices assigned to a virtual machine | |
US8739156B2 (en) | Method for securing the execution of virtual machines | |
CN113312143B (zh) | 云计算系统、命令处理方法及虚拟化仿真装置 | |
GB2525003A (en) | Data Processing Systems | |
EP4053706A1 (en) | Cross address-space bridging | |
US8402461B2 (en) | Switching between direct mode and indirect mode for virtual machine I/O requests | |
US11467776B1 (en) | System supporting virtualization of SR-IOV capable devices | |
CN113312141B (zh) | 用于卸载串行端口模拟的计算机系统、存储介质和方法 | |
JP2023532077A (ja) | システム及び割り込み処理方法 | |
Guay et al. | Early experiences with live migration of SR-IOV enabled InfiniBand | |
US20120066676A1 (en) | Disabling circuitry from initiating modification, at least in part, of state-associated information | |
WO2017026931A1 (en) | Implementing input/output in a virtualized environment | |
CN118331687B (zh) | 用户态半虚拟化数据路径加速方法、设备、集群以及介质 | |
Gordon et al. | Lifting and Dropping VMs to Dynamically Transition Between Time-and Space-sharing for Large-Scale HPC Systems | |
CN117520215A (zh) | 一种缺页处理方法和相关设备 | |
CN116263691A (zh) | 裸金属服务器云服务热迁移方法和装置 | |
Pfefferle | vVerbs: a paravirtual subsystem for RDMA-capable network interfaces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141014 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5742387 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |