JP2010237956A - Virtual disk compression device, method and program - Google Patents

Virtual disk compression device, method and program Download PDF

Info

Publication number
JP2010237956A
JP2010237956A JP2009085184A JP2009085184A JP2010237956A JP 2010237956 A JP2010237956 A JP 2010237956A JP 2009085184 A JP2009085184 A JP 2009085184A JP 2009085184 A JP2009085184 A JP 2009085184A JP 2010237956 A JP2010237956 A JP 2010237956A
Authority
JP
Japan
Prior art keywords
position information
data
file
virtual
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009085184A
Other languages
Japanese (ja)
Inventor
Yoshitaka Ikeda
吉孝 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009085184A priority Critical patent/JP2010237956A/en
Publication of JP2010237956A publication Critical patent/JP2010237956A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a difference data compression device for reducing the size of a difference data file by deleting data from difference data if remodel of a system of a guest operating system side is not needed and if a data area present in the difference data is not used, in a difference data management method. <P>SOLUTION: In the difference data compression device, an update position information file 173 records the block position information of update data when a virtual machine 110 updates data in a virtual disk 115. An update position information acquisition means 161 obtains the block position information from the update position information file 173. A use situation confirmation means 162 accesses the virtual disk 115 through a virtual environment base software 150, analyzes a file system constructed in the virtual disk 115, and checks the use situation of a block corresponding to the block position information obtained. If an unused region is recognized, a difference data deletion means 163 deletes data of a corresponding block number from the difference data file 172 and the update position information file 173. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、仮想ディスク圧縮装置、方法、及び、プログラムに関し、更に詳しくは、仮想マシンがアクセスする仮想ディスクに対応する物理ディスク上のファイルの圧縮を行う仮想ディスク圧縮装置、方法、及び、プログラムに関する。   The present invention relates to a virtual disk compression apparatus, method, and program, and more particularly, to a virtual disk compression apparatus, method, and program for compressing a file on a physical disk corresponding to a virtual disk accessed by a virtual machine. .

実コンピュータ上で仮想マシンを動作させる仮想化技術がある。実コンピュータの動作を制御するOS(オペレーティングシステム)をホストOSといい、仮想マシン上で動作するOSをゲストOSと呼ぶ。仮想マシンは、論理的な記憶装置である仮想記憶装置(仮想ディスク)にアクセスする。仮想ディスクは、ホストOSから見ると、物理記憶装置(物理ディスク)に記録されたファイルとして見える。   There is a virtualization technology that operates a virtual machine on a real computer. An OS (operating system) that controls the operation of a real computer is called a host OS, and an OS that operates on a virtual machine is called a guest OS. The virtual machine accesses a virtual storage device (virtual disk) that is a logical storage device. When viewed from the host OS, the virtual disk appears as a file recorded in a physical storage device (physical disk).

仮想マシンが仮想ディスクにアクセスし、仮想ディスクにデータを書き込むと、仮想環境を実現する仮想環境基盤は、書き込まれたデータを、物理ディスク上のファイルに記録する。ここで、物理ディスク上のファイルは、仮想ディスクとして確保された全ての領域のデータを持っているわけではなく、仮想ディスクにて書き込みがあった領域のデータを有している。未使用の領域は、そこからデータが読み出されることはないので、はじめ、物理ディスク上のファイルの未使用領域に対応する部分にはデータが存在しない。   When the virtual machine accesses the virtual disk and writes data to the virtual disk, the virtual environment infrastructure that implements the virtual environment records the written data in a file on the physical disk. Here, the file on the physical disk does not have the data of all areas reserved as the virtual disk, but has the data of the area written in the virtual disk. Since no data is read from an unused area, data does not exist in the portion corresponding to the unused area of the file on the physical disk.

仮想マシンを動作させていくと、ファイルの削除やデータの移動に伴い、過去にデータが記録されていた領域が、後に未使用領域になることがある。そのような場合でも、物理ディスク上のファイルから、未使用領域になった領域のデータが削除されることはない。これは、仮想環境基盤からは、仮想ディスクのどこが未使用領域になったかがわからないためである。従って、物理ディスク上のファイルは、仮想ディスクの使用が進むほど、ファイルサイズが大きくなっていくことになる。   When a virtual machine is operated, an area in which data has been recorded in the past may become an unused area later as a file is deleted or data is moved. Even in such a case, data in an area that has become an unused area is not deleted from the file on the physical disk. This is because the virtual environment infrastructure does not know where the virtual disk has become an unused area. Therefore, the file size of the file on the physical disk increases as the use of the virtual disk proceeds.

仮想化環境におけるディスク容量削減の手法がいくつか提案されている。仮想化環境におけるディスク容量削減の手法の一つに、ゲストOS上でデフラグメンテーションを実行した後に、デフラグメンテーションで移動され未使用になった領域に未使用を示すマークを書き込み、ホストOS上に存在する圧縮ユーティリティを用いて、未使用領域を検出し、仮想ディスクからデータを削除するという方式がある(例えば特許文献1参照)。   Several methods for reducing disk capacity in virtual environments have been proposed. One of the methods for reducing the disk capacity in a virtual environment is that after defragmentation is executed on the guest OS, a mark indicating unused is written in an area that has been moved by defragmentation and is unused, and exists on the host OS. There is a method of detecting an unused area using a compression utility that deletes data from a virtual disk (see, for example, Patent Document 1).

特開2008−234268号公報JP 2008-234268 A

仮想マシンで、仮想マシンがアクセスする仮想ディスクを差分方式で管理する技術がある。仮想化マシンのシステムにおける差分データの管理方式では、データをマスタデータと差分データとで管理する。仮想マシンがファイルを更新すると、更新データは差分データに書き込まれる。ファイル読み込み時は、要求された差分データが差分データにあれば、データは差分データから読み込まれ、要求されたデータが差分データに存在しないとき、データはマスタデータから読み込まれる。   There is a technique for managing a virtual disk accessed by a virtual machine using a differential method. In the difference data management method in the virtual machine system, data is managed by master data and difference data. When the virtual machine updates the file, the update data is written to the difference data. When reading the file, if the requested difference data is in the difference data, the data is read from the difference data. If the requested data is not present in the difference data, the data is read from the master data.

特許文献1では、デフラグメンテーション後にファイル移動に伴い未使用領域となった領域を削除している。しかし、差分データの管理方式でデフラグメンテーションを実行すると、マスタデータ領域からのデータ移動に伴って差分データへの書き込みが発生し、差分データを膨張させることになる。従って、差分データを管理する方式では、デフラグメンテーションを禁止する運用となる。   In Patent Document 1, an area that has become an unused area due to file movement after defragmentation is deleted. However, when the defragmentation is executed by the difference data management method, writing to the difference data occurs along with the data movement from the master data area, and the difference data is expanded. Therefore, in the method for managing the difference data, defragmentation is prohibited.

また、特許文献1では、データ削除時に、データ削除記録領域に対して未使用領域であることを示す情報を書き込んでいる。この方式でも、マスタデータに存在するデータの削除時に、差分データへの書き込みが発生し、ホストOS上で圧縮ユーティリティが実行されるまでの間、一時的に差分データの増加が発生する。また、未使用領域の管理は、ホストOS上に組み込まれているファイルシステムで行われており、ファイル削除時は、ファイルシステムの管理領域を書き換えるだけで、ディスク自体のクリアは行われない。このため、未使用領域のマークには、ファイルシステムの改造が必要である。更に、書き込みに起因するオーバヘッドが発生するという問題もある。   Moreover, in patent document 1, the information which shows that it is an unused area | region is written with respect to a data deletion recording area at the time of data deletion. Even in this method, when data existing in the master data is deleted, writing to the difference data occurs, and the difference data temporarily increases until the compression utility is executed on the host OS. The unused area is managed by a file system built in the host OS. When a file is deleted, only the management area of the file system is rewritten, and the disk itself is not cleared. For this reason, it is necessary to modify the file system to mark the unused area. In addition, there is a problem that overhead due to writing occurs.

本発明は、ゲストOS側のシステムに改造が必要なく、かつ、差分データ管理方式で、差分データに存在するデータ領域が未使用となったときに差分データからデータを削除して差分データファイルのサイズを削減可能な差分データ圧縮装置、方法、及び、プログラムを提供することを目的とする。   The present invention requires no modification to the system on the guest OS side, and when the data area existing in the differential data becomes unused by the differential data management method, the data is deleted from the differential data and the differential data file An object is to provide a differential data compression apparatus, method, and program capable of reducing the size.

上記目的を達成するために、本発明は、仮想マシンがアクセスする論理的な記憶装置である仮想記憶装置が、ホストOS(オペレーティングシステム)がアクセスする物理記憶装置内のマスタデータファイルと差分データファイルとで構成されており、前記仮想マシンが前記仮想記憶装置内のデータを更新する際の更新データのブロック位置情報を記録する更新位置情報ファイルから前記ブロック位置情報を取得する更新位置情報取得手段と、コンピュータ上に仮想環境を実現する仮想環境基盤ソフトウェアを通じて前記仮想記憶装置にアクセスし、該仮想記憶装置に構築されたファイルシステムを解析して、前記取得したブロック位置情報に該当するブロックの使用状況を調べる使用状況確認手段と、前記取得したブロック位置情報に該当するブロックが未使用領域であると判断されると、前記差分データファイルと、前記更新位置情報ファイルとから、該当するブロック番号のデータの削除を行うデータ削除手段とを備える差分データ圧縮装置を提供する。   In order to achieve the above object, according to the present invention, a virtual storage device, which is a logical storage device accessed by a virtual machine, has a master data file and a differential data file in a physical storage device accessed by a host OS (operating system). Update position information acquisition means for acquiring the block position information from an update position information file that records block position information of update data when the virtual machine updates data in the virtual storage device , Access to the virtual storage device through virtual environment infrastructure software for realizing a virtual environment on a computer, analyze a file system constructed in the virtual storage device, and use state of a block corresponding to the acquired block position information Corresponding to the usage status confirmation means for checking the block position information obtained above When the block is determined to be an unused area, a differential data compression apparatus is provided that includes a data deletion unit that deletes data of a corresponding block number from the differential data file and the update location information file To do.

本発明は、仮想マシンがアクセスする論理的な記憶装置である仮想記憶装置が、ホストOS(オペレーティングシステム)がアクセスする物理記憶装置内のマスタデータファイルと差分データファイルとで構成されており、コンピュータが、前記仮想マシンが前記仮想記憶装置内のデータを更新する際の更新データのブロック位置情報を記録する更新位置情報ファイルから前記ブロック位置情報を取得するステップと、前記コンピュータが、コンピュータ上に仮想環境を実現する仮想環境基盤ソフトウェアを通じて前記仮想記憶装置にアクセスし、該仮想記憶装置に構築されたファイルシステムを解析して、前記取得したブロック位置情報に該当するブロックの使用状況を調べるステップと、前記コンピュータが、前記取得したブロック位置情報に該当するブロックが未使用領域であると判断すると、前記差分データファイルと、前記更新位置情報ファイルとから、該当するブロック番号のデータの削除を行うステップとを有する差分データ圧縮方法を提供する。   In the present invention, a virtual storage device, which is a logical storage device accessed by a virtual machine, is composed of a master data file and a differential data file in a physical storage device accessed by a host OS (operating system). Acquiring the block position information from an update position information file that records block position information of update data when the virtual machine updates data in the virtual storage device; and Accessing the virtual storage device through virtual environment infrastructure software for realizing an environment, analyzing a file system constructed in the virtual storage device, and examining the use status of the block corresponding to the acquired block position information; The acquired block position by the computer When the block corresponding to the information is determined to be an unused area, a differential data compression method comprising: deleting the data of the corresponding block number from the differential data file and the update position information file is provided. .

本発明は、仮想マシンがアクセスする論理的な記憶装置である仮想記憶装置が、ホストOS(オペレーティングシステム)がアクセスする物理記憶装置内のマスタデータファイルと差分データファイルとで構成されており、コンピュータに、前記仮想マシンが前記仮想記憶装置内のデータを更新する際の更新データのブロック位置情報を記録する更新位置情報ファイルから前記ブロック位置情報を取得する処理と、コンピュータ上に仮想環境を実現する仮想環境基盤ソフトウェアを通じて前記仮想記憶装置にアクセスし、該仮想記憶装置に構築されたファイルシステムを解析して、前記取得したブロック位置情報に該当するブロックの使用状況を調べる処理と、前記取得したブロック位置情報に該当するブロックが未使用領域であると判断すると、前記差分データファイルと、前記更新位置情報ファイルとから、該当するブロック番号のデータの削除を行う処理とを実行させるプログラムを提供する。   In the present invention, a virtual storage device, which is a logical storage device accessed by a virtual machine, is composed of a master data file and a differential data file in a physical storage device accessed by a host OS (operating system). In addition, a process for obtaining the block position information from an update position information file that records block position information of update data when the virtual machine updates data in the virtual storage device, and realizing a virtual environment on the computer A process of accessing the virtual storage device through virtual environment infrastructure software, analyzing a file system constructed in the virtual storage device, and checking a usage status of a block corresponding to the acquired block position information; and the acquired block Judge that the block corresponding to the location information is an unused area When, with the differential data file, from said update position information file, to provide a program for executing the processing for deleting the data of the corresponding block number.

本発明の仮想ディスク圧縮装置、方法、及び、プログラムは、ゲストOS側のシステムに改造を伴うことなく、差分データ管理方式で、差分データに存在するデータ領域が未使用となったときに差分データからデータを削除して差分データファイルのサイズを削減することができる。   The virtual disk compression apparatus, method, and program according to the present invention provide differential data when the data area existing in the differential data becomes unused in the differential data management system without any modification to the system on the guest OS side. Data can be deleted from the file to reduce the size of the differential data file.

本発明の一実施形態の差分データ圧縮装置を含む仮想環境実行装置を示すブロック図。The block diagram which shows the virtual environment execution apparatus containing the difference data compression apparatus of one Embodiment of this invention. 仮想ディスクの構成を示すブロック図。The block diagram which shows the structure of a virtual disk. 差分データ圧縮の動作手順を示すフローチャート。The flowchart which shows the operation | movement procedure of difference data compression.

以下、図面を参照し、本発明の実施の形態を詳細に説明する。図1は、本発明の一実施形態の差分データ圧縮装置を含むコンピュータを示している。コンピュータ(ホストコンピュータ)には、コンピュータ全体の動作を制御するオペレーティングシステム(ホストOS)が組み込まれている。ホストコンピュータは、仮想環境基盤ソフトウェア150、差分データ圧縮ユーティリティ160、及び、仮想側物理ディスク170を有する。ホストコンピュータが、差分データ圧縮ユーティリティ160のプログラムに従って動作することで、差分データ圧縮装置の機能が実現する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a computer including a differential data compression apparatus according to an embodiment of the present invention. The computer (host computer) incorporates an operating system (host OS) that controls the operation of the entire computer. The host computer includes virtual environment infrastructure software 150, differential data compression utility 160, and virtual side physical disk 170. The host computer operates according to the program of the differential data compression utility 160, thereby realizing the function of the differential data compression apparatus.

仮想環境基盤ソフトウェア150は、ホストOS上で動作するソフトウェアであり、ホストコンピュータ上に仮想マシンを実現するソフトウェアである。ホストOSは、仮想環境を提供する機能を有する。ゲストOSは、仮想環境で動作するオペレーティングシステムであり、仮想マシン110に搭載される。   The virtual environment infrastructure software 150 is software that operates on the host OS, and is software that implements a virtual machine on the host computer. The host OS has a function of providing a virtual environment. The guest OS is an operating system that operates in a virtual environment, and is installed in the virtual machine 110.

仮想マシン110は、アプリケーション111、ゲストOS112、及び、仮想ディスク115を有する。ゲストOS112は、ファイルシステム113とディスクドライバ114とを有する。アプリケーション111は、ゲストOS112上で動作するユーザ空間のアプリケーションソフトウェアである。仮想ディスク115は、ゲストOSにて使用される論理的な記憶装置である。ファイルシステム113は、ファイルとデータが書き込まれるディスク上の配置とを管理するモジュールである。ディスクドライバ114は、ゲストOS112が仮想ディスク115を読み書きするためのドライバモジュールである。   The virtual machine 110 includes an application 111, a guest OS 112, and a virtual disk 115. The guest OS 112 has a file system 113 and a disk driver 114. The application 111 is user space application software that runs on the guest OS 112. The virtual disk 115 is a logical storage device used in the guest OS. The file system 113 is a module that manages a file and an arrangement on a disk where data is written. The disk driver 114 is a driver module for the guest OS 112 to read and write the virtual disk 115.

仮想マシン120の構成も、仮想マシン110と同様である。すなわち、仮想マシン120は、アプリケーション121と、ファイルシステム123及びディスクドライバ124を含むゲストOS122と、仮想ディスク125とを有する。図1では、図示を省略しているが、仮想マシン130及び140も、仮想マシン110及び120と同様な構成であり、アプリケーションと、ゲストOSと、仮想ディスクとを有する。   The configuration of the virtual machine 120 is the same as that of the virtual machine 110. That is, the virtual machine 120 includes an application 121, a guest OS 122 including a file system 123 and a disk driver 124, and a virtual disk 125. Although not shown in FIG. 1, the virtual machines 130 and 140 have the same configuration as the virtual machines 110 and 120, and include an application, a guest OS, and a virtual disk.

図2は、仮想ディスクの構成を示している。仮想マシン110の仮想ディスク115は、マスタデータファイル116と差分データファイル117とで構成される。仮想ディスク115は、仮想環境基盤ソフトウェア150が仮想化したディスクであり、ゲストOS112からは通常の記録装置として取り扱われる。仮想ディスク115は、ディスク内を複数のブロックに分割されて管理されている。   FIG. 2 shows the configuration of the virtual disk. The virtual disk 115 of the virtual machine 110 includes a master data file 116 and a difference data file 117. The virtual disk 115 is a disk virtualized by the virtual environment infrastructure software 150, and is treated as a normal recording device by the guest OS 112. The virtual disk 115 is managed by dividing the disk into a plurality of blocks.

仮想ディスク115のデータは、差分データの管理方式で管理される。マスタデータファイル116は、仮想マシンで動作するOSやアプリケーションなどがインストールされたファイルであり、データの読み込み専用として利用される。差分データファイル117は、データ更新時にデータが書き込まれる。   The data on the virtual disk 115 is managed by the difference data management method. The master data file 116 is a file in which an OS, an application, and the like that operate in a virtual machine are installed, and is used exclusively for reading data. The difference data file 117 is written with data when the data is updated.

アプリケーション111などが、マスタデータファイル116に書き込まれているブロックに対して読み出し動作を行う場合、ゲストOS112(図1)は、マスタデータファイル116からデータを読み出す。一方、差分データファイル117に書き込まれたブロックに対して読み出し動作を行う場合、ゲストOS112は、差分データファイル117からデータを読み出す。   When the application 111 or the like performs a read operation on a block written in the master data file 116, the guest OS 112 (FIG. 1) reads data from the master data file 116. On the other hand, when a read operation is performed on a block written in the differential data file 117, the guest OS 112 reads data from the differential data file 117.

仮想マシン120、130、140は、仮想マシン110から派生した仮想マシンである。仮想マシン120の仮想ディスク125は、マスタデータファイル126と差分データファイル127とで構成される。仮想マシン130の仮想ディスク135は、マスタデータファイル136と差分データファイル137とで構成される。仮想マシン140の仮想ディスク145は、マスタデータファイル146と差分データファイル147とで構成される。   The virtual machines 120, 130, and 140 are virtual machines derived from the virtual machine 110. The virtual disk 125 of the virtual machine 120 includes a master data file 126 and a difference data file 127. The virtual disk 135 of the virtual machine 130 includes a master data file 136 and a difference data file 137. The virtual disk 145 of the virtual machine 140 includes a master data file 146 and a difference data file 147.

マスタデータファイル116、126、136、146は、各仮想マシンに共通のファイルであり、実際には、マスタデータファイルは、システム内に1つ存在する。図2では、マスタデータファイル126、136、146の実体は、マスタデータファイル116である。各仮想マシンの仮想ディスクは、仮想マシンに共通のマスタデータファイルと、各仮想マシンに固有の差分データファイルとで構成される。   The master data files 116, 126, 136, and 146 are files common to the respective virtual machines. Actually, one master data file exists in the system. In FIG. 2, the master data files 126, 136, and 146 are the master data file 116. The virtual disk of each virtual machine is composed of a master data file common to the virtual machines and a differential data file unique to each virtual machine.

図1に戻り、仮想側物理ディスク170は、ホストコンピュータがアクセスする物理ディスクドライブである。マスタデータファイル171は、図2のマスタデータファイル116、126、136、146に相当する。差分データファイル172は、仮想マシン110の仮想ディスク115内の差分データファイル117に相当する。差分データファイル174は、仮想マシン120の仮想ディスク125内の差分データファイル127に相当する。   Returning to FIG. 1, the virtual physical disk 170 is a physical disk drive accessed by the host computer. The master data file 171 corresponds to the master data files 116, 126, 136, and 146 in FIG. The difference data file 172 corresponds to the difference data file 117 in the virtual disk 115 of the virtual machine 110. The difference data file 174 corresponds to the difference data file 127 in the virtual disk 125 of the virtual machine 120.

更新位置情報ファイル173は、仮想マシン110の仮想ディスク115で更新があったデータのブロック番号を記録したファイルである。仮想環境基盤ソフトウェア150は、アプリケーション111がファイルシステム上に存在するファイルを更新する際に、仮想側物理ディスク170内の差分データファイル172に更新データを書き込むと共に、更新位置情報ファイル173に更新したデータのブロック番号を記録する。更新位置情報ファイル175は、仮想マシン120に対応したファイルであり、更新位置情報ファイル173と同様に、更新したデータのブロック番号を記録するファイルである。   The update position information file 173 is a file in which block numbers of data updated in the virtual disk 115 of the virtual machine 110 are recorded. When the application 111 updates a file existing on the file system, the virtual environment infrastructure software 150 writes update data to the differential data file 172 in the virtual physical disk 170 and updates the update location information file 173. Record the block number. The update location information file 175 is a file corresponding to the virtual machine 120, and is a file that records the block number of the updated data, like the update location information file 173.

差分データ圧縮ユーティリティ160は、差分データファイルのファイルサイズを削減する(差分データファイルを圧縮する)ユーティリティソフトウェアである。差分データ圧縮ユーティリティ160は、仮想環境基盤ソフトウェア150を通じて、対象の仮想マシンに対応する、仮想側物理ディスク170に存在する差分データファイル及び更新位置情報ファイルと、仮想マシン内の仮想ディスクとにアクセスし、差分データファイルの圧縮を実行する。   The differential data compression utility 160 is utility software that reduces the file size of the differential data file (compresses the differential data file). The differential data compression utility 160 accesses the differential data file and the update location information file on the virtual physical disk 170 corresponding to the target virtual machine and the virtual disk in the virtual machine through the virtual environment infrastructure software 150. Execute compression of differential data file.

差分データ圧縮ユーティリティ160は、更新位置情報取得手段161と、使用状況確認手段162と、データ削除手段163とを有する。更新位置情報取得手段161は、更新位置情報ファイル173、175から、更新データのブロック番号を取得する。使用状況確認手段162は、仮想環境基盤ソフトウェア150を通じて仮想ディスク115、125にアクセスし、更新位置情報取得手段161が取得したブロック番号に該当する仮想ディスクの領域が使用中の領域であるか、未使用の領域であるかを判断する。データ削除手段163は、使用状況確認手段162で未使用と判断されたブロック番号のデータを、差分データファイル172から削除すると共に、当該ブロック番号を更新位置情報ファイル173、175から削除する。   The differential data compression utility 160 includes an update position information acquisition unit 161, a usage status confirmation unit 162, and a data deletion unit 163. The update position information acquisition unit 161 acquires the block number of the update data from the update position information files 173 and 175. The usage status confirmation unit 162 accesses the virtual disks 115 and 125 through the virtual environment infrastructure software 150, and whether the virtual disk area corresponding to the block number acquired by the update position information acquisition unit 161 is an in-use area or an Determine if it is an area of use. The data deletion unit 163 deletes the data of the block number determined to be unused by the usage status confirmation unit 162 from the difference data file 172 and deletes the block number from the update position information files 173 and 175.

例えば、圧縮の対象が仮想マシン110に対応した差分データファイル172であるとする。更新位置情報取得手段161は、更新位置情報が記録されている更新位置情報ファイル173から、更新データのブロック番号を取得する。使用状況確認手段162は、取得された更新データのブロック番号に該当する仮想ディスク115内のブロックの使用状況を、仮想ディスク115内に構築されたファイルシステムを解析して調べる。データ削除手段163は、ブロックの使用状況が未使用に該当する場合、差分データファイル172と更新位置情報ファイル173とから、該当するブロック番号のデータの削除を行う。   For example, assume that the compression target is the differential data file 172 corresponding to the virtual machine 110. The update position information acquisition unit 161 acquires the block number of the update data from the update position information file 173 in which the update position information is recorded. The usage status confirmation unit 162 analyzes the usage status of the block in the virtual disk 115 corresponding to the block number of the acquired update data by analyzing the file system constructed in the virtual disk 115. The data deletion unit 163 deletes the data of the corresponding block number from the difference data file 172 and the update position information file 173 when the block usage status corresponds to unused.

図3に、差分データファイル圧縮の際の動作手順を示す。以下では、仮想マシン110に対応した差分データファイル172の圧縮を例に挙げて説明するが、他の仮想マシンでも、動作手順は同様である。差分データ圧縮ユーティリティ160は、仮想環境基盤ソフトウェア150を介して、ホストOS側の仮想側物理ディスク170に存在する、仮想マシン110に対応した差分データファイル172及び更新位置情報ファイル173と、仮想ディスク115とをオープンする(ステップA1)。   FIG. 3 shows an operation procedure when the differential data file is compressed. Hereinafter, the compression of the differential data file 172 corresponding to the virtual machine 110 will be described as an example, but the operation procedure is the same for other virtual machines. The differential data compression utility 160, via the virtual environment infrastructure software 150, exists in the virtual physical disk 170 on the host OS side, the differential data file 172 and the update location information file 173 corresponding to the virtual machine 110, and the virtual disk 115. Are opened (step A1).

更新位置情報取得手段161は、更新位置情報ファイル173から、更新されたブロック番号の一覧を取得する(ステップA2)。更新位置情報取得手段161は、取得した一覧からブロック番号を一つずつ順番に取り出し、使用状況確認手段162へ渡す。使用状況確認手段162は、仮想環境基盤ソフトウェア150を通じて、仮想ディスク115にアクセスし、更新位置情報取得手段161から受け取ったブロック番号に該当するブロックのファイルシステム上での使用状況を調べる(ステップA3)。   The update position information acquisition unit 161 acquires a list of updated block numbers from the update position information file 173 (step A2). The update position information acquisition unit 161 extracts block numbers one by one from the acquired list one by one and passes them to the usage status confirmation unit 162. The usage status checking unit 162 accesses the virtual disk 115 through the virtual environment infrastructure software 150 and checks the usage status on the file system of the block corresponding to the block number received from the update location information acquisition unit 161 (step A3). .

使用状況確認手段162は、ファイルシステム上での使用状況が未使用領域であるか否かを判断する(ステップA4)。データ削除手段163は、使用状況確認手段162が未使用領域と判断すると、差分データファイル172と更新位置情報ファイル173とから、該当するブロック番号のデータをクリアする(ステップA5)。差分データ圧縮ユーティリティ160は、ステップA2で取得したブロック番号の一覧の最後に達するまで、一覧からブロック番号を一つずつ取り出して、ステップA3〜A5を実行する。   The usage status confirmation unit 162 determines whether the usage status on the file system is an unused area (step A4). When the use status confirmation unit 162 determines that the usage status confirmation unit 162 is an unused area, the data deletion unit 163 clears the data of the corresponding block number from the difference data file 172 and the update position information file 173 (step A5). The differential data compression utility 160 takes out block numbers one by one from the list and executes steps A3 to A5 until the end of the list of block numbers acquired at step A2 is reached.

本発明の最小構成について説明する。本発明の最小構成は、差分データ圧縮ユーティリティ160の部分である。差分データ圧縮ユーティリティ160は、更新位置情報取得手段161と、使用状況確認手段162と、データ削除手段163とを有する。仮想ディスクは、仮想マシンがアクセスする論理的な記憶装置であり、ホストOSがアクセスする仮想側物理ディスク170内のマスタデータファイル171と、差分データファイル172、174とで構成されている。更新位置情報ファイル173、175は、仮想マシンが仮想ディスク内のデータを更新する際の更新データのブロック位置情報を記録するファイルである。更新位置情報取得手段161は、更新位置情報ファイルから、ブロック位置情報を取得する。使用状況確認手段162は、仮想環境基盤ソフトウェア150を通じて仮想ディスクにアクセスし、仮想ディスクに構築されたファイルシステムを解析して、取得されたブロック位置情報に該当するブロックの使用状況を調べる。データ削除手段163は、使用状況確認手段162が未使用領域と判断すると、差分データファイルと更新位置情報ファイルとから、該当するブロック番号のデータを削除する。   The minimum configuration of the present invention will be described. The minimum configuration of the present invention is a portion of the differential data compression utility 160. The differential data compression utility 160 includes an update position information acquisition unit 161, a usage status confirmation unit 162, and a data deletion unit 163. The virtual disk is a logical storage device accessed by the virtual machine, and is composed of a master data file 171 and differential data files 172 and 174 in the virtual physical disk 170 accessed by the host OS. The update position information files 173 and 175 are files for recording block position information of update data when the virtual machine updates data in the virtual disk. The update position information acquisition unit 161 acquires block position information from the update position information file. The usage status checking unit 162 accesses the virtual disk through the virtual environment infrastructure software 150, analyzes the file system built on the virtual disk, and checks the usage status of the block corresponding to the acquired block position information. When the use status checking unit 162 determines that the usage status check unit 162 is an unused area, the data deletion unit 163 deletes the data of the corresponding block number from the difference data file and the update position information file.

差分データ圧縮ユーティリティ160は、ホストOS上で動くソフトウェアであり、差分データファイル圧縮の機能は、ホストOS上で動くソフトウェアで実現できる。ゲストOS側の動作は、通常通りの動作であり、差分データファイルの圧縮にあたり、ゲストOS側のシステムには改造の必要はない。本発明では、仮想ディスク115内の更新データを仮想側物理ディスク170内の差分データファイルに記録する際に、更新データのブロック位置情報を更新位置情報ファイルに記録しておく。差分データファイル圧縮の際は、仮想環境基盤ソフトウェア150を通じて仮想ディスクに構築されたファイルシステムを解析し、更新位置情報ファイルに記録されたブロック位置情報に該当する仮想ディスク内の領域の使用状況を調べる。仮想ディスクに構築されたファイルシステムにて、未使用領域となっている場合は、該当ブロック位置情報のデータを削除することで、差分データファイルの圧縮が可能である。   The differential data compression utility 160 is software that runs on the host OS, and the differential data file compression function can be realized by software that runs on the host OS. The operation on the guest OS side is a normal operation, and the system on the guest OS side does not need to be modified when compressing the differential data file. In the present invention, when the update data in the virtual disk 115 is recorded in the differential data file in the virtual physical disk 170, the block position information of the update data is recorded in the update position information file. When compressing the differential data file, the file system constructed on the virtual disk is analyzed through the virtual environment infrastructure software 150, and the usage status of the area in the virtual disk corresponding to the block position information recorded in the update position information file is examined. . If the file system built on the virtual disk is an unused area, the data of the corresponding block position information can be deleted to compress the differential data file.

以上、本発明をその好適な実施形態に基づいて説明したが、本発明の差分データ圧縮装置、方法、及び、プログラムは、上記実施形態にのみ限定されるものではなく、上記実施形態の構成から種々の修正及び変更を施したものも、本発明の範囲に含まれる。   Although the present invention has been described based on the preferred embodiment, the differential data compression apparatus, method, and program of the present invention are not limited to the above embodiment, and the configuration of the above embodiment. Various modifications and changes are also included in the scope of the present invention.

本発明は、限られたリソースで仮想環境の構築が求められるシンクライアントシステムに適用できる。また、本発明は、マスタデータと差分データとを管理する仮想化環境システムで、仮想マシンの台数が多い比較的大規模なシステムにも適用できる。   The present invention can be applied to a thin client system that requires construction of a virtual environment with limited resources. Furthermore, the present invention is a virtual environment system that manages master data and difference data, and can be applied to a relatively large-scale system having a large number of virtual machines.

110、120、130、140;仮想マシン
111、121:アプリケーション
112、122、132、142:ゲストOS
113、123:ファイルシステム
114、124:ディスクドライバ
115、125、135、145:仮想ディスク
150:仮想環境基盤ソフトウェア
160:差分データ圧縮ユーティリティ
161:更新位置情報取得手段
162:使用状況確認手段
163:データ削除手段
170:仮想側物理ディスク
171:マスタデータファイル
172、174:差分データファイル
173、175:更新位置情報ファイル
110, 120, 130, 140; virtual machine 111, 121: application 112, 122, 132, 142: guest OS
113, 123: File systems 114, 124: Disk drivers 115, 125, 135, 145: Virtual disk 150: Virtual environment infrastructure software 160: Differential data compression utility 161: Update position information acquisition means 162: Usage status confirmation means 163: Data Deletion means 170: Virtual side physical disk 171: Master data file 172, 174: Difference data file 173, 175: Update location information file

Claims (3)

仮想マシンがアクセスする論理的な記憶装置である仮想記憶装置が、ホストOS(オペレーティングシステム)がアクセスする物理記憶装置内のマスタデータファイルと差分データファイルとで構成されており、
前記仮想マシンが前記仮想記憶装置内のデータを更新する際の更新データのブロック位置情報を記録する更新位置情報ファイルから前記ブロック位置情報を取得する更新位置情報取得手段と、
コンピュータ上に仮想環境を実現する仮想環境基盤ソフトウェアを通じて前記仮想記憶装置にアクセスし、該仮想記憶装置に構築されたファイルシステムを解析して、前記取得したブロック位置情報に該当するブロックの使用状況を調べる使用状況確認手段と、
前記取得したブロック位置情報に該当するブロックが未使用領域であると判断されると、前記差分データファイルと、前記更新位置情報ファイルとから、該当するブロック番号のデータの削除を行うデータ削除手段とを備える差分データ圧縮装置。
A virtual storage device that is a logical storage device accessed by a virtual machine is composed of a master data file and a differential data file in a physical storage device accessed by a host OS (operating system),
Update position information acquisition means for acquiring the block position information from an update position information file that records block position information of update data when the virtual machine updates data in the virtual storage device;
The virtual storage device is accessed through virtual environment infrastructure software for realizing a virtual environment on the computer, the file system constructed in the virtual storage device is analyzed, and the usage status of the block corresponding to the acquired block position information is determined. Use status checking means to check;
When it is determined that the block corresponding to the acquired block position information is an unused area, data deletion means for deleting data of the corresponding block number from the difference data file and the update position information file; A differential data compression apparatus comprising:
仮想マシンがアクセスする論理的な記憶装置である仮想記憶装置が、ホストOS(オペレーティングシステム)がアクセスする物理記憶装置内のマスタデータファイルと差分データファイルとで構成されており、
コンピュータが、前記仮想マシンが前記仮想記憶装置内のデータを更新する際の更新データのブロック位置情報を記録する更新位置情報ファイルから前記ブロック位置情報を取得するステップと、
前記コンピュータが、コンピュータ上に仮想環境を実現する仮想環境基盤ソフトウェアを通じて前記仮想記憶装置にアクセスし、該仮想記憶装置に構築されたファイルシステムを解析して、前記取得したブロック位置情報に該当するブロックの使用状況を調べるステップと、
前記コンピュータが、前記取得したブロック位置情報に該当するブロックが未使用領域であると判断すると、前記差分データファイルと、前記更新位置情報ファイルとから、該当するブロック番号のデータの削除を行うステップとを有する差分データ圧縮方法。
A virtual storage device that is a logical storage device accessed by a virtual machine is composed of a master data file and a differential data file in a physical storage device accessed by a host OS (operating system),
A computer acquiring the block position information from an update position information file that records block position information of update data when the virtual machine updates data in the virtual storage device;
The computer accesses the virtual storage device through virtual environment infrastructure software that realizes a virtual environment on the computer, analyzes a file system constructed in the virtual storage device, and corresponds to the acquired block position information A step to check the usage of
When the computer determines that the block corresponding to the acquired block position information is an unused area, deleting the data of the corresponding block number from the difference data file and the update position information file; A differential data compression method.
仮想マシンがアクセスする論理的な記憶装置である仮想記憶装置が、ホストOS(オペレーティングシステム)がアクセスする物理記憶装置内のマスタデータファイルと差分データファイルとで構成されており、
コンピュータに、
前記仮想マシンが前記仮想記憶装置内のデータを更新する際の更新データのブロック位置情報を記録する更新位置情報ファイルから前記ブロック位置情報を取得する処理と、
コンピュータ上に仮想環境を実現する仮想環境基盤ソフトウェアを通じて前記仮想記憶装置にアクセスし、該仮想記憶装置に構築されたファイルシステムを解析して、前記取得したブロック位置情報に該当するブロックの使用状況を調べる処理と、
前記取得したブロック位置情報に該当するブロックが未使用領域であると判断すると、前記差分データファイルと、前記更新位置情報ファイルとから、該当するブロック番号のデータの削除を行う処理とを実行させるプログラム。
A virtual storage device that is a logical storage device accessed by a virtual machine is composed of a master data file and a differential data file in a physical storage device accessed by a host OS (operating system),
On the computer,
Processing for acquiring the block position information from an update position information file that records block position information of update data when the virtual machine updates data in the virtual storage device;
The virtual storage device is accessed through virtual environment infrastructure software for realizing a virtual environment on the computer, the file system constructed in the virtual storage device is analyzed, and the usage status of the block corresponding to the acquired block position information is determined. The process of examining,
When determining that a block corresponding to the acquired block position information is an unused area, a program for executing a process of deleting data of the corresponding block number from the difference data file and the update position information file .
JP2009085184A 2009-03-31 2009-03-31 Virtual disk compression device, method and program Pending JP2010237956A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009085184A JP2010237956A (en) 2009-03-31 2009-03-31 Virtual disk compression device, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009085184A JP2010237956A (en) 2009-03-31 2009-03-31 Virtual disk compression device, method and program

Publications (1)

Publication Number Publication Date
JP2010237956A true JP2010237956A (en) 2010-10-21

Family

ID=43092211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009085184A Pending JP2010237956A (en) 2009-03-31 2009-03-31 Virtual disk compression device, method and program

Country Status (1)

Country Link
JP (1) JP2010237956A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513338A (en) * 2011-03-15 2014-05-29 シマンテック コーポレーション Optimal compression of virtual disks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513338A (en) * 2011-03-15 2014-05-29 シマンテック コーポレーション Optimal compression of virtual disks

Similar Documents

Publication Publication Date Title
JP5090941B2 (en) Storage subsystem and storage system
US8924664B2 (en) Logical object deletion
US7895394B2 (en) Storage system
US8521986B2 (en) Allocating storage memory based on future file size or use estimates
US8161128B2 (en) Sharing of data across disjoint clusters
JP2014513338A5 (en) Method, computer readable storage medium and system for optimal compression of a virtual disk
JP5445463B2 (en) Computer system, data storage method and program
KR20060049129A (en) Using external memory devices to improve system performance
JP2007095064A (en) Computer implementation method, computer program, data processing system, equipment, and method (method and equipment for acquiring and transmitting detailed diagnostic data of file system)
US10824460B2 (en) Information processing apparatus, information processing method for reducing network traffic, and storage medium
US8433871B2 (en) Data copy management for faster reads
US9983826B2 (en) Data storage device deferred secure delete
KR20000022716A (en) Efficient volume copy using pre-configuration of log structured target storage
JP5729479B2 (en) Virtual tape device and control method of virtual tape device
WO2015198600A1 (en) Analysis device, analysis method, and storage medium in which analysis program is recorded
US8151053B2 (en) Hierarchical storage control apparatus, hierarchical storage control system, hierarchical storage control method, and program for controlling storage apparatus having hierarchical structure
Lee et al. Zombie chasing: Efficient flash management considering dirty data in the buffer cache
CN101645048A (en) Method for realizing computer virtualized evidence obtaining
JP2010237956A (en) Virtual disk compression device, method and program
JP4765967B2 (en) Information processing apparatus, information processing method, and program
JP2007249728A (en) Disk array device
Zeng et al. CosaFS: A cooperative shingle-aware file system
US10007437B2 (en) Management apparatus, storage system, method, and computer readable medium
JP4897359B2 (en) MEMORY MANAGEMENT DEVICE, MEMORY MANAGEMENT METHOD, AND PROGRAM
JP2010152781A (en) Backup server device, backup/restore program, and backup/restore method