JP2022170005A - Virtualization system and method of monitoring the same - Google Patents
Virtualization system and method of monitoring the same Download PDFInfo
- Publication number
- JP2022170005A JP2022170005A JP2021075813A JP2021075813A JP2022170005A JP 2022170005 A JP2022170005 A JP 2022170005A JP 2021075813 A JP2021075813 A JP 2021075813A JP 2021075813 A JP2021075813 A JP 2021075813A JP 2022170005 A JP2022170005 A JP 2022170005A
- Authority
- JP
- Japan
- Prior art keywords
- virtualization
- virtual machine
- hardware
- failure
- monitoring unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims description 10
- 238000001514 detection method Methods 0.000 abstract description 8
- 238000012545 processing Methods 0.000 description 20
- 230000006866 deterioration Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004092 self-diagnosis Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
本開示は、仮想化システム、及び、仮想化システムの監視方法に関する。 The present disclosure relates to a virtualization system and a method of monitoring the virtualization system.
例えば各種機器を含むプラントを制御対象とする制御システムとして、制御機能を各機器に対応して複数の制御盤に分散させた分散型制御システム(DCS:Distributed Control System)が知られている。分散型制御システムでは、構成の規模が複数の制御盤にわたるため、大きな製造コストが課題となっている。また制御盤のような制御コントローラはソフトウェアとハードウェアとが一体的に構成されているため、ハードウェアが更新されると、それに伴ってソフトウェアの更新も必要になり、これもまたコストがかかる一因となっている。このような課題を解決するために、仮想化技術を利用することで、単一の物理コントローラ上に複数の仮想機械(VM:Vertural Machine)を搭載した仮想化装置において、各仮想機械で独立的にアプリケーションを実行することで、製造コストを抑えた分散型制御システム(仮想化システム)が実現できる。 For example, a distributed control system (DCS) in which control functions are distributed to a plurality of control panels corresponding to each device is known as a control system for controlling a plant including various devices. Distributed control systems suffer from high manufacturing costs due to the scale of the configuration across multiple control panels. In addition, a controller such as a control panel consists of software and hardware, so when the hardware is updated, the software must be updated accordingly, which is also costly. It is the cause. In order to solve such problems, virtualization technology is used to enable each virtual machine to operate independently in a virtualization device in which a plurality of virtual machines (VMs) are installed on a single physical controller. By running the application on the virtual machine, a distributed control system (virtualized system) with reduced manufacturing costs can be realized.
この種の仮想化装置を含む仮想化システムでは、リアルタイム性が必要であり、更に障害発生時においても制御機能を安定的に維持できる可用性が要求される。リアルタイム性は、仮想化ソフトウェア(ハイパーバイザ)をリアルタイム化し、仮想機械上のOS(Operating System)としてリアルタイムOSを搭載することで実現可能である。一方で高可用性は、ハードウェアのランダムな障害発生に備え、物理コントローラを冗長化させることが一般的である。冗長化された構成では、制御対象に対して実際に制御信号を出力する稼働側装置と、稼働側装置と同等の構成を有する待機側装置とを含み、稼働側装置に障害が発生した場合に、制御周期(例えばミリ秒)単位で待機側装置に切り替えることで、制御機能が維持される。 A virtualization system including this type of virtualization device requires real-time performance, and also requires availability to stably maintain control functions even when a failure occurs. Real-time performance can be realized by making virtualization software (hypervisor) real-time and installing a real-time OS as an OS (Operating System) on the virtual machine. High availability, on the other hand, generally involves redundant physical controllers in case of random hardware failures. The redundant configuration includes an active device that actually outputs control signals to the control target, and a standby device that has the same configuration as the active device, and if a failure occurs in the active device , the control function is maintained by switching to the standby device in control cycle (for example, millisecond) units.
このように仮想化技術を利用した仮想化装置を含む制御システムとして、例えば特許文献1がある。特許文献1では、仮想化されたハードウェア資源のうち仮想機械を稼働させる物理機器に障害が検出された場合に、当該物理機器と仮想機械との対応付けを削除するとともに、新たな物理機器を仮想機械と対応付けることで、制御システムの機能を維持することが開示されている。
As a control system including a virtualization device using such a virtualization technology, there is
仮想化システムが備える仮想化装置では、ハードウェア資源上に複数の仮想機械が構築される場合、各仮想機械に対応するようにハードウェア資源は複数のハードウェア要素に分割して割り当てられる。従来の仮想化システムでは、このような複数のハードウェア要素の動作状態は仮想化環境(例えばハイパーバイザ―)によって監視され、いずれか1つのハードウェア要素に障害が発生した場合には、仮想化装置の全体を停止させるため可用性が低下してしまうおそれがある。また、仮想化環境によって障害が検知されてから、仮想機械に通知され、その後稼働側装置と待機側装置の切り替えが発生するため、リアルタイム性の低下や、処置が間に合わないことによる稼働停止期間の増加が考えられる。 In a virtualization device included in a virtualization system, when a plurality of virtual machines are constructed on a hardware resource, the hardware resource is divided and assigned to a plurality of hardware elements so as to correspond to each virtual machine. In a conventional virtualization system, the operating states of multiple hardware elements are monitored by a virtualization environment (for example, a hypervisor), and if any one of the hardware elements fails, the virtualization There is a possibility that the availability will be reduced because the entire device will be stopped. In addition, after a failure is detected by the virtualization environment, it is notified to the virtual machine, and then switching between the active device and the standby device occurs. An increase is possible.
また、このような各ハードウェア要素の動作状態の監視は外部の管理システムによって行われることもある。この場合は、管理システムで障害が検知されると、その旨の警告やメールによって通知が行われていた。しかしながら、このような障害検知の警告やメールの通知を受信してから処置が実施される場合、障害検知から処置が実施されるまでに時間がかかってしまい、リアルタイム性の低下や、処置が間に合わないことによる稼働停止期間の増加が考えられる。また外部の管理システムの設置は、コストの増加要因ともなる。また、複数の仮想化環境をひとつの管理システムで異常検出させる構成とした場合、管理システムが故障した場合に全ての仮想化環境の故障検出が不能となることも考えられる。 Also, such monitoring of the operational status of each hardware element may be performed by an external management system. In this case, when a failure is detected in the management system, a warning or e-mail to that effect is sent. However, if measures are taken after receiving such warnings or e-mail notifications for failure detection, it takes time from failure detection to the implementation of measures. It is conceivable that the operation stoppage period will increase due to the lack of Installation of an external management system also increases costs. Further, if a single management system is configured to detect anomalies in a plurality of virtual environments, it may be impossible to detect failures in all of the virtual environments when the management system fails.
本開示の少なくとも一実施形態は上述の事情に鑑みなされたものであり、ハードウェアにおける障害を早期に検知することで、優れたリアルタイム性や可用性を実現可能な仮想化システム、及び、仮想化システムの監視方法を提供することを目的とする。 At least one embodiment of the present disclosure has been made in view of the above circumstances, and a virtualization system capable of realizing excellent real-time performance and availability by detecting failures in hardware at an early stage, and a virtualization system The purpose is to provide a monitoring method for
本開示の少なくとも一実施形態に係る仮想化システムは、上記課題を解決するために、
複数の仮想機械と、
前記複数の仮想機械にそれぞれ対応するように仮想的に割り当てられた複数のハードウェア要素を含むハードウェア資源と、
を備える少なくとも1つの仮想化装置を有する仮想化システムであって、
前記複数の仮想機械の各々は、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視するための監視部を備える。
A virtualization system according to at least one embodiment of the present disclosure, in order to solve the above problems,
a plurality of virtual machines;
a hardware resource including a plurality of hardware elements virtually allocated to correspond respectively to the plurality of virtual machines;
A virtualization system having at least one virtualization device comprising:
Each of the plurality of virtual machines has a monitoring unit for monitoring the operating state of the hardware element corresponding to the virtual machine.
本開示の少なくとも一実施形態に係る仮想化システムの監視方法は、上記課題を解決するために、
複数の仮想機械と、
前記複数の仮想機械にそれぞれ対応するように仮想的に割り当てられた複数のハードウェア要素を含むハードウェア資源と、
を備える少なくとも1つの仮想化装置を有する仮想化システムの監視方法であって、
前記複数の仮想機械の各々によって、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視する。
In order to solve the above problems, a virtualization system monitoring method according to at least one embodiment of the present disclosure includes:
a plurality of virtual machines;
a hardware resource including a plurality of hardware elements virtually allocated to correspond respectively to the plurality of virtual machines;
A method of monitoring a virtualization system having at least one virtualization device comprising:
Each of the plurality of virtual machines monitors the operating state of the hardware element corresponding to the virtual machine.
本開示の少なくとも一実施形態によれば、ハードウェアにおける障害を早期に検知することで、優れたリアルタイム性や可用性を実現可能な仮想化システム、及び、仮想化システムの監視方法を提供できる。 According to at least one embodiment of the present disclosure, it is possible to provide a virtualization system capable of achieving excellent real-time performance and availability by detecting failures in hardware at an early stage, and a method of monitoring the virtualization system.
以下、添付図面を参照して本開示の幾つかの実施形態について説明する。ただし、実施形態として記載されている又は図面に示されている構成部品の寸法、材質、形状、その相対的配置等は、本開示の範囲をこれに限定する趣旨ではなく、単なる説明例にすぎない。 Several embodiments of the present disclosure will now be described with reference to the accompanying drawings. However, the dimensions, materials, shapes, relative arrangements, etc. of the components described as the embodiment or shown in the drawings are not meant to limit the scope of the present disclosure, but are merely illustrative examples. do not have.
図1は第1実施形態に係る仮想化システム100Aの構成図である。仮想化システム100Aは、制御対象(不図示)を制御するための仮想化された制御システムである。仮想化システム100Aは、制御システムとして機能することで、制御対象を制御するための制御信号を出力する。制御対象は、仮想化システム100Aから出力される制御信号に基づいて制御可能な任意の機器を含むことができるが、本実施形態では、各種機器から構成されるプラントを一例に説明する。プラントは、例えば発電プラント(火力発電プラント、原子力発電プラント、水力発電プラント又は風力発電プラント等)である。
FIG. 1 is a configuration diagram of a
仮想化システム100Aは、少なくとも1つの仮想化装置1を含む。図1では、仮想化システム100Aが1つの仮想化装置1を備える場合について例示している。仮想化装置1は、ハードウェア資源2として、中央処理装置4(CPU:Central Processing Unit)をはじめ、記憶装置6(Memory)、ディスク8、デバイス10等の電子部品を有しており、仮想化装置1が備えるハイパーバイザー12において仮想化ソフトウェアを実行することにより複数の仮想機械VM1、VM2、・・・を搭載している。仮想機械VM1、VM2、・・・は仮想化ソフトウェアの実行によって構築され、例えば、仮想化システム100Aが制御対象の分散型制御システムとして構成される場合には、制御対象を構成する各機器に対応する各制御盤を仮想的に模擬するように構築される。尚、仮想化装置1に構築される仮想機械VM1、VM2、・・・の数は任意でよい。
A
仮想化装置1が有するハードウェア資源2は、仮想化ソフトウェアによって複数の仮想機械VM1、VM2にそれぞれ対応するハードウェア要素2-1、2-2、・・・に分割されている。具体的に説明すると、ハードウェア要素2-1は、仮想機械VM1に割り当てられた中央処理装置4-1、記憶装置6-1、ディスク8-1、デバイス10-1を含み、ハードウェア要素2-2は、仮想機械VM2に対応する中央処理装置4-2、記憶装置6-2、ディスク8-2、デバイス10-2を含む。言い換えると、中央処理装置4は、仮想化ソフトウェアによって、仮想機械VM1、VM2、・・・にそれぞれ対応する中央処理装置4-1、4-2、・・・に分割され、記憶装置6は、仮想化ソフトウェアによって、仮想機械VM1、VM2、・・・にそれぞれ対応する記憶装置6-1、6-2、・・・に分割され、ディスク8は、仮想化ソフトウェアによって、仮想機械VM1、VM2、・・・にそれぞれ対応するディスク8-1、8-2、・・・に分割され、デバイス10は、仮想化ソフトウェアによって、仮想機械VM1、VM2、・・・にそれぞれ対応するデバイス10-1、10-2、・・・に分割される。
A
仮想化装置1が備える各仮想機械VM1、VM2、・・・は、監視部14-1、14-2、・・・をそれぞれ備える。監視部14-1、14-2、・・・は、仮想機械VM1、VM2、・・・に対応するハードウェア要素2-1、2-2、・・・の動作状態をそれぞれ監視するための構成であり、ハードウェア要素2-1、2-2、・・・に障害が発生したか否かを判定する。このような監視部14-1、14-2、・・・による監視動作は、例えば、仮想機械VM1、VM2、・・・が所定のアプリケーションを実行することにより行われてもよい。 Each of the virtual machines VM1, VM2, . The monitoring units 14-1, 14-2, . . . monitor the operating states of the hardware elements 2-1, 2-2, . It determines whether or not a failure has occurred in the hardware elements 2-1, 2-2, . . . Such monitoring operations by the monitoring units 14-1, 14-2, . . . may be performed, for example, by the virtual machines VM1, VM2, .
ここで監視部14-1、14-2、・・・の監視動作による障害の検知態様について、障害の発生箇所ごとに具体的に説明する。 Here, the mode of fault detection by the monitoring operations of the monitoring units 14-1, 14-2, .
まずハードウェア要素2-1、2-2、・・・のうち中央処理装置4-1、4-2、・・・における障害発生は、例えば監視部14-1、14-2、・・・によって、中央処理装置4-1、4-2、・・・の処理負荷を仮想機械VM1、VM2、・・・内のアプリケーションソフトウェアで定期的に計測し、一定期間にわたって高負荷状態が継続した場合に、中央処理装置4-1、4-2、・・・が暴走に至る可能性があるとして障害検知判定を行う。また監視部14-1、14-2、・・・は、ハイパーバイザー12のファンクションコールを拡張することによって、仮想機械VM1、VM2、・・・に予め割り当てられた中央処理装置4-1、4-2、・・・のコア内部温度を計測し、一定期間にわたって高温状態が継続した場合に、中央処理装置4-1、4-2、・・・が熱暴走に至る可能性があるとして障害検知判定を行ってもよい。また監視部14-1、14-2、・・・は、ハイパーバイザー12のファンクションコールを拡張することによって、仮想機械VM1、VM2、・・・ごとにWDT(ウォッチ・ドック・タイマ)機能をハイパーバイザー12に持たせ、仮想機械VM1、VM2、・・・内のアプリケーションソフトウェアで定期的にWDTクリアを動作させることにより、中央処理装置4-1、4-2、・・・の停止を検知することで障害検知判定を行ってもよい。
Of the hardware elements 2-1, 2-2, . , the processing loads of the central processing units 4-1, 4-2, . . . are periodically measured by the application software in the virtual machines VM1, VM2, . Then, the central processing units 4-1, 4-2, . By extending the function calls of the
またハードウェア要素2-1、2-2、・・・のうち記憶装置6-1、6-2、・・・における障害発生は、例えば仮想機械VM1、VM2、・・・にMMU(Memory Management Unit)によるメモリ保護機能が搭載されている場合には、監視部14-1、14-2、・・・によって、記憶装置6-1、6-2、・・・の故障や、一過性ビット化け(ソフトエラー)によってページテーブル上に無い仮想アドレスへのアクセスが発生した場合に障害検知判定を行うことができる。また仮想機械VM1、VM2、・・・にECC機能付きのメモリコントローラ及びECC付のメモリが搭載されている場合には、監視部14-1、14-2、・・・によって、記憶装置6-1、6-2、・・・に2ビット化けが発生した時点で、記憶装置6-1、6-2、・・・に不正アクセスが発生したとして障害検知判定を行ってもよい。またMMUを持たない記憶装置6-1、6-2、・・・を用いる場合には、監視部14-1、14-2、・・・は、記憶装置6-1、6-2、・・・のビットウォークテスト等のメモリ自己診断を仮想機械VM1、VM2、・・・内のアプリケーションソフトウェアで定期的に動作させることにより、記憶装置6-1、6-2、・・・における障害検知判定を行うようにしてもよい。 If a failure occurs in the storage devices 6-1, 6-2, . . . among the hardware elements 2-1, 2-2, . Unit), the monitoring units 14-1, 14-2, . Failure detection can be performed when access to a virtual address not on the page table occurs due to garbled bits (soft error). If the virtual machines VM1, VM2, . . . , 6-2, . When the storage devices 6-1, 6-2, . . . without MMU are used, the monitoring units 14-1, 14-2, . . . periodically run memory self-diagnosis such as bit walk test by application software in virtual machines VM1, VM2, . A determination may be made.
またハードウェア要素2-1、2-2、・・・のうちディスク8-1、8-2、・・・における障害発生は、例えば監視部14-1、14-2、・・・によって、ディスク8-1、8-2、・・・に関するチェックの自己診断を仮想機械VM内のアプリケーションソフトウェアで定期的に動作させることにより、ディスク8-1、8-2、・・・における障害検知判定を行ってもよい。 Further, when a failure occurs in the disks 8-1, 8-2, . . . among the hardware elements 2-1, 2-2, . Failure detection judgment in the disks 8-1, 8-2, . . . may be performed.
またハードウェア要素2-1、2-2、・・・のうちデバイス10-1、10-2、・・・における障害発生は、例えば監視部14-1、14-2、・・・によって、ハイパーバイザー12のファンクションコールを拡張する等して、仮想機械VM1、VM2、・・・に予め割り当てられたデバイス10-1、10-2、・・・の自己診断を仮想機械VM1、VM2、・・・内のアプリケーションソフトウェアで定期的に動作させることにより、デバイス10-1、10-2、・・・における障害検知判定を行ってもよい。
When a failure occurs in the devices 10-1, 10-2, . . . among the hardware elements 2-1, 2-2, . By expanding the function calls of the
以上説明したように第1実施形態では、複数の仮想機械VM1、VM2、・・・にそれぞれ設けられた監視部14-1、14-2、・・・によって、各仮想機械VM1、VM2、・・・に対応するハードウェア要素2-1、2-2、・・・の動作状態が監視される。
このように仮想機械VM1、VM2、・・・ごとに監視部14-1、14-2、・・・によって各仮想機械VM1、VM2、・・・に属するハードウェア要素2-1、2-2、・・・の監視を行うことで、従来に比べて、より早期にハードウェア要素2-1、2-2、・・・における障害を検知でき、障害を解消又は回避するために必要な処理を実行するまでに要する時間を効果的に低減できる。その結果、リアルタイム性の低下や、障害を解消又は回避するために必要な処理の実行が間に合わないことによる稼働率の低下を抑えることができる。
As described above, in the first embodiment, each of the virtual machines VM1, VM2, . are monitored for the operating states of the hardware elements 2-1, 2-2, . . .
In this way, the hardware elements 2-1, 2-2 belonging to each virtual machine VM1, VM2, . . . , . . . , it is possible to detect failures in the hardware elements 2-1, 2-2, . can effectively reduce the time required to execute As a result, it is possible to suppress the deterioration of the real-time performance and the deterioration of the operation rate due to the delay in execution of the processing necessary for solving or avoiding the failure.
図2は図1の第1変形例である。この変形例に係る仮想化システム100A´では、ハードウェア資源2を監視するためのハードウェア資源監視部16を更に備える。ハードウェア資源監視部16は、仮想化装置1の外部にハードウェア資源2を監視するために設けられた仮想化システム100A´の一部構成である。ハードウェア資源監視部16は、ハードウェア資源2を監視し、ハードウェア資源2で障害の発生を検知した場合に、仮想化装置1に対して、その旨の信号(警告又はメールなど)を送信するように構成される。ハードウェア資源監視部16による信号の送信先は、基本的には、仮想化装置1が備える各仮想機械VM1、VM2、・・・であるが、指定した特定の仮想機械VM1、VM2、・・・に限定的に送信することも可能である。
FIG. 2 shows a first modification of FIG. The
本実施形態では、監視部14-1、14-2、・・・からの指令によって、ハードウェア資源監視部16は、障害が発生した箇所を含むハードウェア要素に対応する仮想機械のみに対して、その旨の信号が送信されるように設定される。これにより、仮想化装置1の外部に設置されたハードウェア資源監視部16で障害監視を行っている場合においても、図1の実施形態と同様に、仮想機械VM1、VM2、・・・ごとに監視部14によって各仮想機械VM1、VM2、・・・に属するハードウェア要素2-1、2-2、・・・の監視を行うことで、従来に比べて、より早期にハードウェア要素2-1、2-2、・・・における障害を検知でき、障害を解消又は回避するために必要な処理を実行するまでに要する時間を効果的に低減できる。
In this embodiment, according to commands from the monitoring units 14-1, 14-2, . , a signal to that effect is sent. As a result, even when the hardware
続いて図3は第2実施形態に係る仮想化システム100Bの構成図である。仮想化システム100Bは、基本的に前述の仮想化システム100Aと同等の構成を有しているが、仮想化装置1が有する複数の仮想機械VM1、VM2、・・・に、互いに多重化又は冗長化された第1仮想機械VM1及び第2仮想機械VM2が含まれる。仮想化装置1では、正常時には、互いに多重化又は冗長化された第1仮想機械VM1及び第2仮想機械VM2のうち、一方の第1仮想機械VM1が稼働状態にあり、第2仮想機械VM2は第1仮想機械VM1のバックアップとして待機状態(ホットスタンバイ状態)にある。
Next, FIG. 3 is a configuration diagram of a
仮想化システム100Bでは、仮想化装置1が備える各仮想機械VM1、VM2、・・・は、それぞれ仮想化環境制御部18-1、18-2、・・・を更に備える。仮想化環境制御部18-1、18-2、・・・は、監視部14-1、14-2、・・・の監視結果に基づいて仮想化装置1の仮想化環境を制御するための構成であり、具体的には、監視部14-1でハードウェア要素2-1(図3では、ハードウェア要素2-1のうち中央処理装置4-1)に障害Trが発生したと判定された場合に、稼働状態にある第1仮想機械VM1を停止させるとともに、待機状態(ホットスタンバイ状態)にある第2仮想機械VM2を稼働状態に切り替えるように、仮想化装置1の仮想化環境を制御する。
In the
これにより仮想化システム100Bでは、稼働状態にある第1仮想機械VM1に対応するハードウェア要素2-1で障害Trが検知された場合には、稼働状態にある一方の第1仮想機械VM1を停止させるとともに、待機状態にある他方の第2仮想機械VM2を稼働状態に切り替えることで、仮想化システム100B全体の稼働率の低下を抑え、高可用性を達成することができる。
As a result, in the
尚、図3では仮想化システム100Bのハードウェア資源2のうちハードウェア要素2-1に含まれる中央処理装置4-1において障害Trが発生した場合を例示しているが、記憶装置6-1、ディスク8-1、デバイス10-1において障害が発生した場合も同様である。
Note that FIG. 3 illustrates a case where a failure Tr occurs in the central processing unit 4-1 included in the hardware element 2-1 of the
続いて図4は第3実施形態に係る仮想化システム100Cの構成図である。仮想化システム100Cは、第1仮想化装置1A及び第2仮想化装置1Bを備える。第1仮想化装置1A及び第2仮想化装置1Bは、前述の仮想化システム100Bが有する仮想化装置1と同等の構成を有する。第1仮想化装置1A及び第2仮想化装置1Bは互いに多重化又は冗長化されており、正常時には、第1仮想化装置1Aが稼働状態にあり、第2仮想化装置1Bは第1仮想機械VM1のバックアップとして待機状態(ホットスタンバイ状態)にある。すなわち第1仮想化装置1Aが備える仮想機械VM1、VM2、・・・はそれぞれ稼働状態にあり、第2仮想化装置1Bが備える仮想機械VM1、VM2、・・・はそれぞれ待機状態(ホットスタンバイ状態)にある。
Next, FIG. 4 is a configuration diagram of a
第1仮想化装置1A及び第2仮想化装置1Bが備える仮想機械VM1、VM2、・・・は、図3に示す実施形態と同様に、それぞれ仮想化環境制御部18-1、18-2、・・・を備える。仮想化環境制御部18-1、18-2、・・・は、監視部14-1、14-2、・・・の監視結果に基づいて第1仮想化装置1A及び第2仮想化装置1Bにおける仮想化環境を制御するための構成であり、稼働状態にある第1仮想化装置1Aで障害Trが発生したと判定された場合に、第1仮想化装置1Aにおいて障害Trが発生したハードウェア要素に対応する仮想機械を停止させるとともに、これに対応する第2仮想化装置1Bの仮想機械を稼働状態に切り替える。図4では、第1仮想化装置1Aが備える第1仮想機械VM1に対応するハードウェア要素2-1(中央処理装置4-1)において障害Trが発生した場合が例示されており、障害が発生したハードウェア要素2-1に対応する第1仮想機械VM1が稼働状態から停止されるとともに、これに対応する第2仮想化装置1Bの第1仮想機械VM1が待機状態から起動されるように、仮想化環境が制御されている。このとき、第1仮想化装置1Aが備える他の仮想機械VM2、・・・は正常に稼働しているため、第2仮想化装置1Bが備える仮想機械VM2、・・・は待機状態のまま維持されている。
The virtual machines VM1, VM2, . prepare for virtualization environment control units 18-1, 18-2, . , and when it is determined that a failure Tr has occurred in the
このように仮想化システム100Cでは、稼働状態にある一方の第1仮想化装置1Aにおいてハードウェア資源2に障害Trが発生した場合、障害Trが発生したハードウェア要素2-1に対応する仮想機械VM1を停止させるとともに、他方の第2仮想化装置1Bで待機状態にある対応する仮想機械VM1を稼働状態に切り替えることで、仮想化システム100C全体の稼働率の低下を抑え、高可用性を達成することができる。
As described above, in the
その他、本開示の趣旨を逸脱しない範囲で、上記した実施形態における構成要素を周知の構成要素に置き換えることは適宜可能であり、また、上記した実施形態を適宜組み合わせてもよい。 In addition, it is possible to appropriately replace the components in the above-described embodiments with well-known components without departing from the scope of the present disclosure, and the above-described embodiments may be combined as appropriate.
上記各実施形態に記載の内容は、例えば以下のように把握される。 The contents described in each of the above embodiments are understood as follows, for example.
(1)一態様に係る仮想化システムは、
複数の仮想機械(例えば上記実施形態の仮想機械VM1、VM2、・・・)と、
前記複数の仮想機械にそれぞれ対応するように仮想的に割り当てられた複数のハードウェア要素(例えば上記実施形態のハードウェア要素2-1、2-2、・・・)を含むハードウェア資源(例えば上記実施形態のハードウェア資源2)と、
を備える少なくとも1つの仮想化装置(例えば上記実施形態の仮想化装置1、1A、1B)を有する仮想化システム(例えば上記実施形態の仮想化システム100A、100A´、100B、100C)であって、
前記複数の仮想機械の各々は、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視するための監視部(例えば上記実施形態の監視部14-1、14-2、・・・)を備える。
(1) A virtualization system according to one aspect includes:
a plurality of virtual machines (for example, the virtual machines VM1, VM2, . . . of the above embodiment);
Hardware resources (for example, hardware elements 2-1, 2-2, . hardware resource 2) of the above embodiment;
A virtualization system (for example, the
Each of the plurality of virtual machines has a monitoring unit (for example, the monitoring units 14-1, 14-2, . Prepare.
上記(1)の態様によれば、複数の仮想機械にそれぞれ設けられた監視部によって、各仮想機械に対応して割り当てられたハードウェア要素の動作状態が監視される。このように各仮想機械に対応するハードウェア要素を仮想機械ごとに監視することで、従来に比べて、より早期に障害を検知できる。そして、障害を解消又は回避するために必要な処理を実行するまでに要する時間を効果的に低減できる。その結果、リアルタイム性の低下や、障害を解消又は回避するために必要な処理の実行が間に合わないことによる稼働率の低下を抑えることができる。 According to the aspect (1) above, the operating states of the hardware elements assigned to the respective virtual machines are monitored by the monitoring units respectively provided in the plurality of virtual machines. By monitoring the hardware elements corresponding to each virtual machine for each virtual machine in this way, failures can be detected earlier than in the past. Then, it is possible to effectively reduce the time required to execute the processing necessary to resolve or avoid the failure. As a result, it is possible to suppress the deterioration of the real-time performance and the deterioration of the operation rate due to the delay in execution of the processing necessary for solving or avoiding the failure.
(2)他の態様では、上記(1)の態様において、
前記監視部は、前記仮想機械に対応する前記ハードウェア要素の動作状態を能動的に監視するように構成される。
(2) In another aspect, in the aspect of (1) above,
The monitoring unit is configured to actively monitor an operating state of the hardware element corresponding to the virtual machine.
上記(2)の態様によれば、仮想化装置が有する複数の仮想機械の各々が、それぞれに対応して割り当てられたハードウェア要素を能動的に監視することで、従来に比べて、より早期に障害を検知できる。尚、「能動的」とは、各仮想機械が自らに割り当てられたハードウェア要素の動作状態を監視することを意味することに加えて、各ハードウェア要素の動作状態が監視部以外の構成によって監視されている場合には、当該構成で障害があると検知された場合に、当該障害が検知されたハードウェア要素に対応する仮想機械のみに対して監視結果が送信されるように、当該構成を設定することを含む。 According to the above aspect (2), each of the plurality of virtual machines of the virtualization device actively monitors the hardware elements allocated corresponding to each, so that the failure can be detected. Note that "actively" means that each virtual machine monitors the operating state of its own assigned hardware element, and that the operating state of each hardware element is monitored by a configuration other than the monitoring unit. If monitored, configure the configuration such that if a failure is detected in the configuration, monitoring results are sent only to the virtual machine corresponding to the hardware element on which the failure was detected. including setting
(3)他の態様では、上記(1)又は(2)の態様において、
前記監視部は、前記仮想機械が実行するアプリケーションによって、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視するように構成される。
(3) In another aspect, in the above aspect (1) or (2),
The monitoring unit is configured to monitor an operating state of the hardware element corresponding to the virtual machine by an application executed by the virtual machine.
上記(3)の態様によれば、仮想機械がアプリケーションを実行することにより、仮想機械に対応するハードウェア要素の動作状態を能動的に監視できる。 According to aspect (3) above, the virtual machine can actively monitor the operating state of the hardware element corresponding to the virtual machine by executing the application.
(4)他の態様では、上記(1)又は(2)の態様において、
前記ハードウェア資源を監視するためのハードウェア資源監視部(例えば上記実施形態のハードウェア資源監視部16)を更に備え、
前記監視部は、前記ハードウェア資源監視部で障害が検知された場合、前記障害が発生した前記ハードウェア要素に対応する前記仮想機械のみで前記ハードウェア資源監視部からの信号が受信されるように、前記ハードウェア資源監視部を設定するように構成される。
(4) In another aspect, in the above aspect (1) or (2),
further comprising a hardware resource monitoring unit (for example, the hardware
The monitoring unit is arranged so that, when the hardware resource monitoring unit detects a failure, only the virtual machine corresponding to the hardware element in which the failure has occurred receives the signal from the hardware resource monitoring unit. and setting the hardware resource monitoring unit.
上記(4)の態様によれば、ハードウェア資源監視部によってハードウェア資源における障害を監視する場合、障害検知時にハードウェア資源監視部からの信号の送信先を、障害が発生したハードウェア要素に対応する仮想機械のみに限定するように、監視部によってハードウェア資源監視部が能動的に設定される。これにより、従来に比べて、より早期にハードウェア要素における障害を検知でき、障害を解消又は回避するために必要な処理を実行するまでに要する時間を効果的に低減できる。 According to aspect (4) above, when the hardware resource monitoring unit monitors a failure in a hardware resource, when a failure is detected, the destination of a signal from the hardware resource monitoring unit is set to the hardware element in which the failure has occurred. A hardware resource monitor is actively configured by the monitor to limit to only the corresponding virtual machine. This makes it possible to detect failures in hardware elements earlier than in the past, and effectively reduce the time required to execute the processing necessary to resolve or avoid the failure.
(5)他の態様では、上記(1)から(4)のいずれか一態様において、
前記複数の仮想機械は、互いに多重化又は冗長化された第1仮想機械(例えば上記実施形態の第1仮想機械VM1)及び第2仮想機械(例えば上記実施形態の第2仮想機械VM2)を含み、
前記監視部で障害が検知された場合、前記第1仮想機械及び前記第2仮想機械のうち前記障害が検知された一方を稼働状態から停止させるとともに、他方を待機状態から起動するように構成される。
(5) In another aspect, in any one aspect of (1) to (4) above,
The plurality of virtual machines includes a first virtual machine (for example, the first virtual machine VM1 in the above embodiment) and a second virtual machine (for example, the second virtual machine VM2 in the above embodiment) that are multiplexed or redundant with each other. ,
When a failure is detected by the monitoring unit, one of the first virtual machine and the second virtual machine in which the failure is detected is stopped from an operating state, and the other is started from a standby state. be.
上記(5)の態様によれば、多重化又は冗長化された複数の仮想機械を備える仮想化システムにおいて、稼働状態にある一方の仮想機械に対応するハードウェア要素で障害が検知された場合には、当該仮想機械を稼働状態から停止させるとともに、待機状態にある他方の仮想機械を起動することで、仮想化システム全体の稼働率の低下を抑え、高可用性を達成することができる。 According to aspect (5) above, in a virtualization system comprising a plurality of multiplexed or redundant virtual machines, when a failure is detected in a hardware element corresponding to one of the virtual machines in operation, By stopping the virtual machine from the operating state and activating the other virtual machine in the standby state, it is possible to suppress the decrease in the operating rate of the entire virtualization system and achieve high availability.
(6)他の態様では、上記(1)から(4)のいずれか一態様において、
前記少なくとも1つの仮想化装置は、互いに多重化又は冗長化された第1仮想化装置(例えば上記実施形態の第1仮想化装置1A)及び第2仮想化装置(例えば上記実施形態の第2仮想化装置1B)を含み、
前記監視部で障害が検知された場合、前記第1仮想化装置及び前記第2仮想化装置のうち一方において前記障害が検知された前記仮想機械を稼働状態から停止させるとともに、他方において当該仮想機械に対応する前記仮想機械を待機状態から稼働状態に切り替えるように構成される。
(6) In another aspect, in any one aspect of (1) to (4) above,
The at least one virtualization device includes a first virtualization device (for example, the
When a failure is detected by the monitoring unit, one of the first virtualization device and the second virtualization device stops the virtual machine in which the failure is detected, and the other virtualization device stops the virtual machine. is configured to switch the virtual machine corresponding to from a standby state to an active state.
上記(6)の態様によれば、多重化又は冗長化された複数の仮想化装置を備える仮想化システムにおいて、稼働状態にある一方の仮想化装置において、特定の仮想機械に対応するハードウェア要素に障害が発生した場合、当該仮想機械を稼働状態から停止させるとともに、他方の仮想化装置で対応する仮想機械を待機状態から稼働状態に切り替えることで、仮想化システム全体の稼働率の低下を抑え、高可用性を達成することができる。 According to aspect (6) above, in a virtualization system comprising a plurality of multiplexed or redundant virtualization devices, in one virtualization device in operation, a hardware element corresponding to a specific virtual machine In the event of a failure, the virtual machine in question is stopped from operating status, and the corresponding virtual machine on the other virtualization device is switched from standby status to operating status, thereby suppressing a decrease in the operating rate of the entire virtualization system. , high availability can be achieved.
(7)他の態様では、上記(1)から(6)のいずれか一態様において、
前記監視部は、前記ハードウェア要素に含まれるハードウェアの構成要素ごとに障害の有無を監視するように構成される。
(7) In another aspect, in any one aspect of (1) to (6) above,
The monitoring unit is configured to monitor whether or not there is a failure in each hardware component included in the hardware element.
上記(7)の態様によれば、監視部による監視がハードウェア要素に含まれるハードウェアの構成要素ごとに行われる。 According to the above aspect (7), the monitoring by the monitoring unit is performed for each hardware component included in the hardware component.
(8)他の態様では、上記(1)から(7)のいずれか一態様において、
前記複数の仮想機械は、制御対象に対する制御信号を生成するように構成される。
(8) In another aspect, in any one aspect of (1) to (7) above,
The plurality of virtual machines are configured to generate control signals for controlled objects.
上記(8)の態様によれば、制御対象に対する制御信号を生成する制御コントローラを仮想化した仮想化システムに適用することで、優れたリアルタイム性と可用性を有する仮想化システムを実現できる。 According to aspect (8) above, a virtualized system having excellent real-time performance and availability can be realized by applying a controller that generates a control signal for a controlled object to a virtualized system.
(9)他の態様では、上記(8)の態様において、
前記制御対象はプラント又は移動体である。
(9) In another aspect, in the aspect of (8) above,
The controlled object is a plant or a mobile object.
上記(9)の態様によれば、例えば火力プラント等のプラントを制御対象とする制御コントローラのように高度なリアルタイム性と可用性が要求される用途に適している。また制御対象が移動体である場合には、例えば地上の交通システム、洋上の水上船舶、或いは、水中航走体などに適用可能である。 According to the above aspect (9), it is suitable for applications that require high real-time performance and availability, such as a controller that controls a plant such as a thermal power plant. Moreover, when the object to be controlled is a moving object, the present invention can be applied to, for example, a ground transportation system, a watercraft on the sea, or an underwater vehicle.
(10)一態様に係る仮想化システムの監視方法は、
複数の仮想機械(例えば上記実施形態の仮想機械VM1、VM2、・・・)と、
前記複数の仮想機械にそれぞれ対応するように仮想的に割り当てられた複数のハードウェア要素(例えば上記実施形態のハードウェア要素2-1、2-2、・・・)を含むハードウェア資源(例えば上記実施形態のハードウェア資源2)と、
を備える少なくとも1つの仮想化装置(例えば上記実施形態の仮想化装置1、1A、1B)を有する仮想化システム(例えば上記実施形態の仮想化システム100A、100A´、100B、100C)の監視方法であって、
前記複数の仮想機械の各々によって、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視する。
(10) A virtualization system monitoring method according to an aspect includes:
a plurality of virtual machines (for example, the virtual machines VM1, VM2, . . . of the above embodiment);
Hardware resources (for example, hardware elements 2-1, 2-2, . hardware resource 2) of the above embodiment;
A method for monitoring a virtualization system (for example, the
Each of the plurality of virtual machines monitors the operating state of the hardware element corresponding to the virtual machine.
上記(10)の態様によれば、複数の仮想機械によって、各仮想機械に対応して割り当てられたハードウェア要素の動作状態がそれぞれ監視される。このように各仮想機械に対応するハードウェア要素を仮想機械ごとに監視することで、従来に比べて、より早期に障害を検知できる。そして、障害を解消又は回避するために必要な処理を実行するまでに要する時間を効果的に低減できる。その結果、リアルタイム性の低下や、障害を解消又は回避するために必要な処理の実行が間に合わないことによる稼働率の低下を抑えることができる。 According to aspect (10) above, the operating states of the hardware elements assigned to each virtual machine are monitored by the plurality of virtual machines. By monitoring the hardware elements corresponding to each virtual machine for each virtual machine in this way, failures can be detected earlier than in the past. Then, it is possible to effectively reduce the time required to execute the processing necessary to resolve or avoid the failure. As a result, it is possible to suppress the deterioration of the real-time performance and the deterioration of the operation rate due to the delay in execution of the processing necessary for solving or avoiding the failure.
1 仮想化装置
1A 第1仮想化装置
1B 第2仮想化装置
2 ハードウェア資源
2a、2b、・・・ ハードウェア要素
4 中央処理装置
6 記憶装置
8 ディスク
10 デバイス
12 ハイパーバイザー
14 監視部
16 ハードウェア資源監視部
18 仮想化環境制御部
100(100A、100B、100C、100A´) 仮想化システム
Tr 障害
VM1、VM2、・・・ 仮想機械
1
Claims (10)
前記複数の仮想機械にそれぞれ対応するように仮想的に割り当てられた複数のハードウェア要素を含むハードウェア資源と、
を備える少なくとも1つの仮想化装置を有する仮想化システムであって、
前記複数の仮想機械の各々は、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視するための監視部を備える、仮想化システム。 a plurality of virtual machines;
a hardware resource including a plurality of hardware elements virtually allocated to correspond respectively to the plurality of virtual machines;
A virtualization system having at least one virtualization device comprising:
A virtualization system, wherein each of the plurality of virtual machines includes a monitoring unit for monitoring an operating state of the hardware element corresponding to the virtual machine.
前記監視部は、前記ハードウェア資源監視部で障害が検知された場合、前記障害が発生した前記ハードウェア要素に対応する前記仮想機械のみで前記ハードウェア資源監視部からの信号が受信されるように、前記ハードウェア資源監視部を設定するように構成される、請求項1又は2に記載の仮想化システム。 further comprising a hardware resource monitoring unit for monitoring the hardware resources;
The monitoring unit is arranged so that, when the hardware resource monitoring unit detects a failure, only the virtual machine corresponding to the hardware element in which the failure has occurred receives the signal from the hardware resource monitoring unit. 3. The virtualization system according to claim 1 or 2, configured to set said hardware resource monitoring unit to .
前記監視部で障害が検知された場合、前記第1仮想機械及び前記第2仮想機械のうち前記障害が検知された一方を稼働状態から停止させるとともに、他方を待機状態から起動するように構成された、請求項1から4のいずれか一項に記載の仮想化システム。 the plurality of virtual machines includes a first virtual machine and a second virtual machine that are multiplexed or redundant with each other;
When a failure is detected by the monitoring unit, one of the first virtual machine and the second virtual machine in which the failure is detected is stopped from an operating state, and the other is started from a standby state. A virtualization system according to any one of claims 1 to 4.
前記監視部で障害が検知された場合、前記第1仮想化装置及び前記第2仮想化装置のうち一方において前記障害が検知された前記仮想機械を稼働状態から停止させるとともに、他方において当該仮想機械に対応する前記仮想機械を待機状態から稼働状態に切り替えるように構成された、請求項1から4のいずれか一項に記載の仮想化システム。 the at least one virtualization device includes a first virtualization device and a second virtualization device that are multiplexed or redundant with each other;
When a failure is detected by the monitoring unit, one of the first virtualization device and the second virtualization device stops the virtual machine in which the failure is detected, and the other virtualization device stops the virtual machine. 5. A virtualization system according to any one of claims 1 to 4, arranged to switch the virtual machine corresponding to a from a standby state to an active state.
前記複数の仮想機械にそれぞれ対応するように仮想的に割り当てられた複数のハードウェア要素を含むハードウェア資源と、
を備える少なくとも1つの仮想化装置を有する仮想化システムの監視方法であって、
前記複数の仮想機械の各々によって、前記仮想機械に対応する前記ハードウェア要素の動作状態を監視する、仮想化システムの監視方法。 a plurality of virtual machines;
a hardware resource including a plurality of hardware elements virtually allocated to correspond respectively to the plurality of virtual machines;
A method of monitoring a virtualization system having at least one virtualization device comprising:
A monitoring method for a virtualization system, wherein each of the plurality of virtual machines monitors the operating state of the hardware element corresponding to the virtual machine.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021075813A JP2022170005A (en) | 2021-04-28 | 2021-04-28 | Virtualization system and method of monitoring the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021075813A JP2022170005A (en) | 2021-04-28 | 2021-04-28 | Virtualization system and method of monitoring the same |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022170005A true JP2022170005A (en) | 2022-11-10 |
Family
ID=83944327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021075813A Pending JP2022170005A (en) | 2021-04-28 | 2021-04-28 | Virtualization system and method of monitoring the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022170005A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115858222A (en) * | 2022-12-19 | 2023-03-28 | 安超云软件有限公司 | Virtual machine fault processing method and system and electronic equipment |
-
2021
- 2021-04-28 JP JP2021075813A patent/JP2022170005A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115858222A (en) * | 2022-12-19 | 2023-03-28 | 安超云软件有限公司 | Virtual machine fault processing method and system and electronic equipment |
CN115858222B (en) * | 2022-12-19 | 2024-01-02 | 安超云软件有限公司 | Virtual machine fault processing method, system and electronic equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4882845B2 (en) | Virtual computer system | |
CN101876926B (en) | Asymmetric software triple-computer hot backup fault-tolerant method | |
US20090300606A1 (en) | Virtual machine migration with direct physical access control | |
US9361151B2 (en) | Controller system with peer-to-peer redundancy, and method to operate the system | |
US12013769B2 (en) | Hot-standby redundancy control system, method, control apparatus, and computer readable storage medium | |
US11281182B2 (en) | Redundant hot standby control system and control device, redundant hot standby method and computer-readable storage medium | |
JP2002259155A (en) | Multiprocessor system | |
JP2022170005A (en) | Virtualization system and method of monitoring the same | |
Breivold et al. | Virtualize for architecture sustainability in industrial automation | |
JP6278602B2 (en) | High availability system | |
JP2009069963A (en) | Multiprocessor system | |
US10963250B2 (en) | Selectively suppressing time intensive instructions based on a control value | |
JP2011243012A (en) | Memory dump acquisition method for virtual computer system | |
EP3889781A1 (en) | Process control system with different hardware architecture controller backup | |
KR20150104251A (en) | Airplane system and control method thereof | |
JP5278471B2 (en) | Cluster system | |
WO2023007209A1 (en) | Fault-tolerant distributed computing for vehicular systems | |
JP2014215622A (en) | Plant monitoring system and plant monitoring method | |
JP2009116699A (en) | Information processing system | |
JP2010237989A (en) | Ha cluster system and clustering method thereof | |
US11119461B2 (en) | Controller | |
JP2020071492A (en) | Information processing system | |
US20240136942A1 (en) | Methods And Means For Failure Handling In Process Control Systems | |
JP5502789B2 (en) | Multiprocessor device | |
JP2008269440A (en) | Virtual computer system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231227 |