JP6354901B2 - 仮想マシンの故障検知および回復用管理システム - Google Patents
仮想マシンの故障検知および回復用管理システム Download PDFInfo
- Publication number
- JP6354901B2 JP6354901B2 JP2017518275A JP2017518275A JP6354901B2 JP 6354901 B2 JP6354901 B2 JP 6354901B2 JP 2017518275 A JP2017518275 A JP 2017518275A JP 2017518275 A JP2017518275 A JP 2017518275A JP 6354901 B2 JP6354901 B2 JP 6354901B2
- Authority
- JP
- Japan
- Prior art keywords
- virtual machine
- traffic
- heartbeat
- failure
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000011084 recovery Methods 0.000 title claims description 6
- 238000001514 detection method Methods 0.000 title description 9
- 238000004458 analytical method Methods 0.000 claims description 44
- 230000000875 corresponding effect Effects 0.000 claims description 43
- 238000007726 management method Methods 0.000 claims description 28
- 238000013461 design Methods 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 20
- 238000003745 diagnosis Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 14
- 230000003111 delayed effect Effects 0.000 claims description 11
- 230000001939 inductive effect Effects 0.000 claims description 5
- 230000009471 action Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 13
- 238000012544 monitoring process Methods 0.000 description 11
- 230000007704 transition Effects 0.000 description 11
- 230000036541 health Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000001960 triggered effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000004718 Panda Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
- G06F11/1484—Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/10—Program control for peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/815—Virtual
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/508—Monitor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
Description
非特許文献5に記載されている最大配置マニュアルでは、高可用性の機能が有効にされると、36%のオーバヘッドがクラスタシステム全体に導入されると結論付けられている。その理由は主に、VMMのシステムパフォーマンスがボトルネックとなるためである。各ノードのHAエージェントは監視対象の仮想マシンが稼働している同じノードで実行されるソフトウェアとして実装されているため、HAエージェントの稼働はノードのCPUリソースも消費させる。すなわち、高可用性のオプションが有効にされると、HAエージェントはノードのCPUリソースを消費するため、結果的に設定可能な仮想マシンの最大値が100から64に減少する。
VMM層における高可用性の機能の実装は、設計概念における拡張性も縮小させる。ノードの数が増えると、HAエージェントがシステムパフォーマンスのボトルネックになる。さらに、HAエージェントが仮想マシンと同じノードで稼働しているため、HAエージェントと仮想マシンは同じCPUリソースを消費する。
仮想マシンはMAC(Media Access Control)アドレスで識別されるため、Ethernetヘッダにおける送信元アドレス(Source Address;SA)や送信先アドレス(Destination Address;DA)のデータ領域のデータで識別される。VLANの情報はTPID(Tag Protocol Identifier)に提示されており、デバイスは図8に示すFLOWID_DAやFLOWID_SAで識別される。
PCI-over-Ethernetパケットには多くの種類が存在する。EFE_SUB_TYPEは、ペイロード(TLP)がデータフレームであるか他の種類であるかを示す。
データフレームに関して、タイプおよびデータのフォーマットは拡張される。データフレームのタイプはハートビート、診断、またはI/Oトラヒックのいずれかであるが、タイプの種類は限定されずどのような種類でもよい。また、ペイロードのレイアウトは、ペイロードのタイプに依存する。ペイロードのタイプがハートビートのタイプである場合、データはハートビートのタイムスタンプを参照する。また、ペイロードのタイプが診断のタイプである場合、システムリソースの有用性が提供される。例えば、CPUの有用性や、ネットワークインタフェースの有用性や、メモリの有用性が提供される。また、ペイロードのタイプがI/Oトラヒックのタイプである場合、データはTLPのデータおよびそのタイムスタンプを参照する。
図9は、仮想化システム1000の使用例を示す説明図である。図9は、対象の仮想マシンの故障が検知され、同じ仮想マシンの新たなインスタンスが他のノードで起動される時の使用事例を示す。
図10は、仮想化システム1100の他の使用例を示す説明図である。図10は、対象の仮想マシンのハートビートの遅延が検知され、ハートビートメッセージが有効にされている時と同様に情報をより収集するためにHAマネージャが診断行動を誘発する時の使用事例を示す。
111〜114 リソースプール
12、500 相互接続ネットワーク
13、400、4000、4100 高可用(HA)マネージャ
100、1000、1100 仮想化システム
200 CPUプール
201、202、600、2001、2002、2101、2102 コンピュータデバイス
211、212、2011、2012、2111、2112 VM-mgr
300 I/Oデバイスプール
301、302、3001、3002、3101、3102 I/Oデバイス
402、4002、4102 パケット(Pkt)詮索モジュール
403、4003、4103 高可用(HA)データベース
404 仮想マシン(VM)マネージャ
405、4005、4105 ヘルスチェックモジュール
406 アクションモジュール
409、4009、4109 パケット(Pkt)解析モジュール
410、4010、4110 パケット(Pkt)分析モジュール
4006 アクション:リセットモジュール
4106 アクション:診断モジュール
Claims (8)
- リソースを分散させるという設計概念に基づいたデータセンタにおいて故障が発見された時に仮想マシンの故障を検知し対応する動作を誘発する管理システムであって、
複数の仮想マシンが稼働しているハードウェアの要素として動作するリソースプールと、
様々なリソースプール同士を接続する相互接続ネットワークと、
対象の仮想マシンの故障を検知するために前記相互接続ネットワークの全てのトラヒックを詮索し故障が検知された時に対応する動作を誘発する高可用マネージャとを含む
ことを特徴とする管理システム。 - 高可用マネージャは、
相互接続ネットワークの全てのトラヒックを詮索する詮索モジュールと、
詮索されたパケットを解析しヘッダおよびペイロードから情報を抽出するパケット解析モジュールと、
同一のコンピュータデバイスにおける仮想マシンに対する基本的な操作を提供する仮想マシンマネージャと、
局所の仮想マシンマネージャに所定のコマンドを送信する動作モジュールと、
全ての対象の仮想マシンの記録を保存する高可用データベースとを有し、
前記パケット解析モジュールは、
仮想マシンからのハートビートメッセージを時間通りに到達、遅延、または消失のいずれかに決定し、
仮想マシンからのI/Oトラヒックが存在するか否かを決定し、
仮想マシンの現在の状態が所定の通常パターンであるか否かを決定し、
前記仮想マシンマネージャは、
特定の仮想マシンの新たなインスタンスを開始し、
システムリソースの有用性およびシステムの能力である特定の仮想マシンの情報をさらに収集し、
前記動作モジュールは、
利用不可能であると確信されている対象の仮想マシンの新たなインスタンスを開始し、
前記対象の仮想マシンの情報をより収集するために診断コマンドを送信する
請求項1記載の管理システム。 - 高可用データベースに保存されている記録には、少なくとも
CPUプールのIDであるNode_Idと、
仮想マシンのIDであるVM_Idと、
デバイスのIDであるDevice_Idと、
仮想マシンによって使用される画像のIDであるImage_Idと、
仮想マシンによって使用されるネットワークアドレスであるNW_Addressと、
仮想マシンによって使用されるネットワークのIDであるNW_Idと、
ハートビートメッセージの状態であるHeartbeat_stateと、
I/Oトラヒックの状態であるTraffic_stateと、
ハートビートのタイムアウトの既定値であるHeartbeat_timeoutと、
I/Oトラヒックのタイムアウトの既定値であるTraffic_timeoutとが含まれ、
前記NW_Addressは、ExpEtherが使用される時はMACアドレスであり、
前記Heartbeat_stateは、正常か遅延のいずれかであり、
前記Traffic_stateは、正常か遅延のいずれかである
請求項2記載の管理システム。 - パケット解析モジュールは、
ハートビートメッセージから対応する情報を抽出し、
通常のI/Oトラヒックのメッセージから対応する情報を抽出し、
システムリソースの有用性のメッセージから対応する情報を抽出する
請求項2または請求項3記載の管理システム。 - パケット解析モジュールは、
ハートビートがタイムアウトしているか否かを決定し、
I/Oトラヒックがタイムアウトしているか否かを決定する
請求項3記載の管理システム。 - 動作モジュールは、
ハートビートのタイムアウトもI/Oトラヒックのタイムアウトも存在しない場合対応するタイマを単に更新し、
I/Oトラヒックがタイムアウトした時に更なる診断のためにシステムリソースの情報を要求し、
ハートビートとI/Oトラヒックの両方がタイムアウトした時に回復動作を誘発する
請求項5記載の管理システム。 - リソースを分散させるという設計概念に基づいたデータセンタにおいて故障が発見された時に仮想マシンの故障を検知し対応する動作を誘発する、複数の仮想マシンが稼働しているハードウェアの要素として動作するリソースプールと、様々なリソースプール同士を接続する相互接続ネットワークとを含む仮想化システムに含まれているデバイスにおいて実行される管理方法であって、
対象の仮想マシンの故障を検知するために前記相互接続ネットワークの全てのトラヒックを詮索し、
故障が検知された時に対応する動作を誘発する
ことを特徴とする管理方法。 - リソースを分散させるという設計概念に基づいたデータセンタにおいて故障が発見された時に仮想マシンの故障を検知し対応する動作を誘発する、複数の仮想マシンが稼働しているハードウェアの要素として動作するリソースプールと、様々なリソースプール同士を接続する相互接続ネットワークとを含む仮想化システムに含まれているコンピュータにおいて実行される管理プログラムであって、
前記コンピュータに、
対象の仮想マシンの故障を検知するために前記相互接続ネットワークの全てのトラヒックを詮索する詮索処理、および
故障が検知された時に対応する動作を誘発する誘発処理
を実行させるための管理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/005078 WO2016056035A1 (en) | 2014-10-06 | 2014-10-06 | Management system for virtual machine failure detection and recovery |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017532682A JP2017532682A (ja) | 2017-11-02 |
JP6354901B2 true JP6354901B2 (ja) | 2018-07-11 |
Family
ID=55652699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017518275A Expired - Fee Related JP6354901B2 (ja) | 2014-10-06 | 2014-10-06 | 仮想マシンの故障検知および回復用管理システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10318392B2 (ja) |
JP (1) | JP6354901B2 (ja) |
WO (1) | WO2016056035A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10133619B1 (en) * | 2015-06-08 | 2018-11-20 | Nutanix, Inc. | Cluster-wide virtual machine health monitoring |
US11368372B2 (en) | 2016-06-03 | 2022-06-21 | Nutanix, Inc. | Detection of outlier nodes in a cluster |
CN107133131A (zh) * | 2017-05-31 | 2017-09-05 | 广州鼎甲计算机科技有限公司 | 一种基于VMware的虚拟机合成备份方法 |
US10949306B2 (en) * | 2018-01-17 | 2021-03-16 | Arista Networks, Inc. | System and method of a cloud service provider virtual machine recovery |
CN108958219A (zh) * | 2018-06-29 | 2018-12-07 | 西安航空学院 | 用于虚拟仪器设备的保障系统 |
CN113220462B (zh) * | 2021-05-28 | 2024-02-06 | 赵庆林 | 一种基于边缘计算的集中式故障检测方法 |
CN114095394B (zh) * | 2021-11-25 | 2023-09-19 | 北京百度网讯科技有限公司 | 网络节点故障检测方法、装置、电子设备及存储介质 |
CN114090184B (zh) * | 2021-11-26 | 2022-11-29 | 中电信数智科技有限公司 | 一种虚拟化集群高可用性的实现方法和设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7747898B1 (en) * | 2006-09-19 | 2010-06-29 | United Services Automobile Association (Usaa) | High-availability data center |
JP2008181387A (ja) | 2007-01-25 | 2008-08-07 | Nec Corp | I/oバスシステム及びその管理方法 |
JP2010198491A (ja) * | 2009-02-26 | 2010-09-09 | Yokogawa Electric Corp | 仮想メシンサーバおよびこれを用いた仮想マシンネットワーク監視システム |
JP5560936B2 (ja) * | 2010-06-16 | 2014-07-30 | 富士通株式会社 | 構成情報取得方法、仮想プローブおよび構成情報取得制御装置 |
US9329947B2 (en) * | 2010-06-22 | 2016-05-03 | Red Hat Israel, Ltd. | Resuming a paused virtual machine without restarting the virtual machine |
US9292329B2 (en) * | 2011-02-10 | 2016-03-22 | Microsoft Technology Licensing, Llc | Virtual switch interceptor |
JP5803502B2 (ja) * | 2011-09-27 | 2015-11-04 | 富士通株式会社 | 監視装置、制御方法及び制御プログラム |
US9497136B1 (en) * | 2011-09-28 | 2016-11-15 | Emc Corporation | Method and system for providing usage metrics to manage utilzation of cloud computing resources |
US9647909B2 (en) * | 2014-09-23 | 2017-05-09 | Uila Networks, Inc. | Monitor a data center infrastructure |
-
2014
- 2014-10-06 JP JP2017518275A patent/JP6354901B2/ja not_active Expired - Fee Related
- 2014-10-06 US US15/517,031 patent/US10318392B2/en not_active Expired - Fee Related
- 2014-10-06 WO PCT/JP2014/005078 patent/WO2016056035A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US10318392B2 (en) | 2019-06-11 |
WO2016056035A1 (en) | 2016-04-14 |
US20170293537A1 (en) | 2017-10-12 |
JP2017532682A (ja) | 2017-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6354901B2 (ja) | 仮想マシンの故障検知および回復用管理システム | |
JP7362650B2 (ja) | タスク処理方法、装置及びシステム | |
CN108430116B (zh) | 断网重连方法、介质、装置和计算设备 | |
CN108039964B (zh) | 基于网络功能虚拟化的故障处理方法及装置、系统 | |
US20200104222A1 (en) | Systems and methods for managing server cluster environments and providing failure recovery therein | |
EP2972870B1 (en) | Coordinating fault recovery in a distributed system | |
US11093296B2 (en) | System, virtualization control apparatus, method for controlling a virtualization control apparatus, and program | |
US10541862B2 (en) | VNF processing policy determining method, apparatus, and system | |
US20140032753A1 (en) | Computer system and node search method | |
EP3472971B1 (en) | Technique for resolving a link failure | |
WO2018095414A1 (zh) | 虚拟机故障的检测和恢复方法及装置 | |
WO2015058711A1 (zh) | 故障快速检测方法及装置 | |
US10353786B2 (en) | Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program | |
CN103607296A (zh) | 一种虚拟机故障处理方法和设备 | |
US20200036576A1 (en) | Two-channel-based high-availability | |
JP2016536920A (ja) | ネットワークパフォーマンス監視のための機器および方法 | |
US9183092B1 (en) | Avoidance of dependency issues in network-based service startup workflows | |
US11272024B2 (en) | Persisting an HTTP connection between application components | |
CN103731290A (zh) | 一种服务器故障切换方法 | |
JP6421516B2 (ja) | サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法 | |
CN103731315A (zh) | 一种服务器故障检测方法 | |
US8036105B2 (en) | Monitoring a problem condition in a communications system | |
WO2017018435A1 (ja) | リソース監視装置、仮想ネットワークファンクション管理システム、リソース監視方法及びプログラム | |
WO2013097176A1 (zh) | 一种用户体验指标监控方法及监控虚拟机 | |
JP6364203B2 (ja) | システムの稼働状態を監視する監視サーバ及び監視サーバの制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180515 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180528 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6354901 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |