JP2008234269A - File management system and method, and program - Google Patents

File management system and method, and program Download PDF

Info

Publication number
JP2008234269A
JP2008234269A JP2007072338A JP2007072338A JP2008234269A JP 2008234269 A JP2008234269 A JP 2008234269A JP 2007072338 A JP2007072338 A JP 2007072338A JP 2007072338 A JP2007072338 A JP 2007072338A JP 2008234269 A JP2008234269 A JP 2008234269A
Authority
JP
Japan
Prior art keywords
file
data
file data
virtual
virtual file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007072338A
Other languages
Japanese (ja)
Other versions
JP4765968B2 (en
Inventor
Hiroaki Nagano
浩明 長野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007072338A priority Critical patent/JP4765968B2/en
Publication of JP2008234269A publication Critical patent/JP2008234269A/en
Application granted granted Critical
Publication of JP4765968B2 publication Critical patent/JP4765968B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a file management system that can detect whether file data has been operated by fast and simple processing. <P>SOLUTION: The file management system comprises a summary data generation means for generating summary data depending on the data contents of file data stored in a predetermined storage device, and a virtual file management means for associatively storing the summary data and file identification data identifying the file data from which the summary data has been generated, as virtual file data corresponding to the file data. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、ファイル管理システムにかかり、特に、ファイルデータの変更を管理するシステムに関する。   The present invention relates to a file management system, and more particularly to a system for managing file data changes.

近年では、情報処理システムの普及により、種々の情報をデジタルデータにて保存・管理することが多く行われている。そして、重要なデータに関しては、電源ダウンや災害などに備えて、データ消失を防ぐべく、バックアップを行うことが必須となっている。そして、ファイルシステムのデータのバックアップなどの場合には、差分バックアップなどが使用されるが、ある時点以降の更新されたデータの判別などに多くの処理能力を必要とする、という問題があった。   In recent years, with the widespread use of information processing systems, various types of information are often stored and managed as digital data. For important data, it is indispensable to perform backup in order to prevent data loss in preparation for power down or disaster. In the case of file system data backup or the like, differential backup or the like is used. However, there is a problem that a large amount of processing power is required for discrimination of updated data after a certain point in time.

例えば、以下に示す二つのケースでは、その判別に必要な処理負担が高かったり、本来の差分とは程遠い量の多くの差分を検出したりしてしまうという問題がある。具体的に、1つ目のケースとしては、ファイルの作成時刻等のメタデータを維持した状態でファイルの内容のみを書き換える場合には、差分の検出には内容の比較が必要になるため、処理負担が増加しうる。また、2つ目のケースでは、ファイルの場所がディレクトリ中を移動した場合、実際に行われた変更は管理用メタデータの変更のみであるにもかかわらず、差分の観点からするとファイルが削除され新しい場所に生成したように見えるため、余計なバックアップ処理が生じうる。このような状況から、バックアップの効率化が大容量ファイルシステムにおいて必要とされている。   For example, in the following two cases, there is a problem that a processing load necessary for the determination is high, or many differences that are far from the original difference are detected. Specifically, in the first case, when only the contents of a file are rewritten while maintaining metadata such as the creation time of the file, the contents must be compared to detect the difference. The burden can increase. Also, in the second case, if the location of the file is moved through the directory, the file is deleted from a difference point of view, even though the actual change was only a change in the management metadata. Since it appears to have been created in a new location, extra backup processing can occur. Under such circumstances, efficient backup is required for large capacity file systems.

また、特許文献1には、それぞれファイルのハッシュ値を利用して、バックアップ元とバックアップ先のファイルの一致、不一致を検出し、一致しない場合に、バックアップ先にファイルをバックアップする、というシステムが開示されている。また、特許文献2には、時間的に前後するファイルのハッシュ値に基づいて当該ファイルの更新検出を行う、というシステムが開示されている。   Patent Document 1 discloses a system that uses a hash value of each file to detect a match or mismatch between a backup source file and a backup destination file, and backs up the file to the backup destination if they do not match. Has been. Further, Patent Document 2 discloses a system in which update detection of a file is performed based on a hash value of a file that fluctuates in time.

しかしながら、上記特許文献に開示されているシステムでは、いずれも各ファイルのハッシュ値をファイル自体に関連付けて管理している。すると、膨大なデータ量の実体ファイルシステム内を検索、比較するという処理が必要となり、依然としてバックアップが必要となる更新等が行われたファイルの検出を高速に実行することができず、また、処理負荷も高い、という問題が生じる。   However, in any of the systems disclosed in the above patent documents, the hash value of each file is managed in association with the file itself. Then, it is necessary to search and compare in the substantial file system with a huge amount of data, and it is not possible to detect a file that has been updated or the like that still needs to be backed up at high speed. The problem is that the load is high.

特開2006−268846号公報JP 2006-268846 A 特開2006−146877号公報JP 2006-146877 A

このため、本発明では、上記従来例の有する不都合を改善し、特に、迅速かつ簡易な処理にて、ファイルデータに対する操作処理の有無を検出することができるファイル管理システムを提供することをその目的とする。   Therefore, the object of the present invention is to provide a file management system that can improve the disadvantages of the above-described conventional example, and in particular, can detect the presence / absence of an operation process for file data by a quick and simple process. And

そこで、本発明の一形態であるファイル管理システムは、
所定の記憶装置に記憶されたファイルデータのデータ内容に応じた要約データを生成する要約データ生成手段と、
要約データと、当該要約データが生成されたファイルデータを特定するファイル特定データと、を関連付けて当該ファイルデータに対応する仮想ファイルデータとして記憶する仮想ファイル管理手段と、
を備えたことを特徴としている。
Therefore, a file management system according to one aspect of the present invention is:
Summary data generating means for generating summary data according to the data content of the file data stored in a predetermined storage device;
Virtual file management means for associating summary data with file specifying data for specifying file data for which the summary data is generated, and storing the file as virtual file data corresponding to the file data;
It is characterized by having.

上記発明によると、管理対象となるファイルデータのデータ内容に応じた要約データが生成され、この要約データとそのファイルデータを特定するファイル特定データとが関連付けられて仮想ファイルデータとして記憶される。これにより、仮想ファイルデータを参照することで、ファイルデータの変更等の有無を調べることができる。従って、ファイルデータ自体のデータ内容を詳細に調べる必要が無く、高速かつ低負荷にてファイル管理処理を実現することができる。   According to the above invention, summary data corresponding to the data content of the file data to be managed is generated, and the summary data and the file specifying data for specifying the file data are associated and stored as virtual file data. Thus, by referring to the virtual file data, it is possible to check whether or not the file data has been changed. Therefore, it is not necessary to examine the data contents of the file data itself in detail, and the file management process can be realized at high speed and with a low load.

また、仮想ファイル管理手段は、要約データを仮想ファイルデータのファイル名として記憶する、ことを特徴としている。これにより、仮想ファイルデータは、ファイル名である要約データとファイル特定データのみで構成することができ、仮想ファイルデータのデータ容量を抑制することができる。従って、ファイルデータの管理をより高速かつ低負荷にて実行することができる。   The virtual file management means stores the summary data as the file name of the virtual file data. Thereby, virtual file data can be comprised only with summary data which is a file name, and file specific data, and can suppress the data capacity of virtual file data. Therefore, the file data can be managed at a higher speed and with a lower load.

また、要約データ生成手段は、ファイルデータのデータ内容に基づいて算出したハッシュ値を要約データとして生成する、ことを特徴としている。このように、ファイルデータのデータ内容に基づくハッシュ値を要約データとして用いることで、かかる要約データのデータ量を低減でき、かつ、データ内容を適切に表現することができる。従って、ファイルデータの変更等の有無をより確実にかつ高速に判定することができる。   Further, the summary data generation means generates a hash value calculated based on the data content of the file data as summary data. As described above, by using the hash value based on the data content of the file data as the summary data, the data amount of the summary data can be reduced and the data content can be appropriately expressed. Accordingly, it is possible to more reliably and quickly determine whether or not file data has been changed.

また、仮想ファイル管理手段は、要約データをディレクトリ名としたディレクトリを生成すると共に、このディレクトリ内に仮想ファイルデータを記憶する、ことを特徴としている。これにより、要約データをファイル名として仮想ファイルデータを生成した場合に、当該仮想ファイルデータのファイル名が重複した場合であっても、要約データのディレクトリを生成してその中にいずれかの仮想ファイルデータを格納することで、仮想ファイルデータが重複することなく、適切に管理することができる。   The virtual file management means is characterized by generating a directory with the summary data as a directory name and storing the virtual file data in this directory. As a result, when virtual file data is generated with the summary data as the file name, even if the file name of the virtual file data is duplicated, a directory for the summary data is generated and any of the virtual files is included therein. By storing data, virtual file data can be properly managed without duplication.

また、仮想ファイル管理手段は、仮想ファイルデータに対応するファイルデータの格納先を表すパスデータをファイル特定データとして仮想ファイルデータに含める、ことを特徴としている。これにより、仮想ファイルデータからより正確にファイルデータを特定することができ、この仮想ファイルデータを参照して、対応するファイルデータに確実にアクセスすることができる。また、パスデータを比較することで、データ内容が変更されず格納場所が移動されたファイルデータをも容易に検出することができる。   Further, the virtual file management means is characterized in that path data representing a storage location of file data corresponding to the virtual file data is included in the virtual file data as file specifying data. As a result, the file data can be more accurately identified from the virtual file data, and the corresponding file data can be reliably accessed with reference to the virtual file data. Further, by comparing the path data, it is possible to easily detect the file data whose storage location has been moved without changing the data contents.

また、本発明では、上記構成に加え、ファイルデータに対する操作処理を検知するファイル操作検知手段を備え、要約データ生成手段及び仮想ファイル管理手段は、ファイル操作検知手段の検知結果に応じて作動する、ことを特徴としている。これにより、ファイルデータに対するファイル操作があったときに上述した仮想ファイルデータの登録が行われるため、ファイルデータの更新状況を仮想ファイルデータに、より正確に反映させることができる。   Further, in the present invention, in addition to the above configuration, a file operation detection unit that detects an operation process on file data is provided, and the summary data generation unit and the virtual file management unit operate according to the detection result of the file operation detection unit. It is characterized by that. Thus, since the virtual file data is registered when the file operation is performed on the file data, the update status of the file data can be more accurately reflected on the virtual file data.

また、上記構成に加え、ファイル操作検知手段にて検知したファイルデータに対する操作処理が変更又は削除である場合に、当該ファイルデータに対応する既存の仮想ファイルデータを削除する仮想ファイル削除手段を備えた、ことを特徴としている。そして、要約データ生成手段は、生成した要約データをファイルデータに含めて記憶すると共に、ファイル操作検知手段は、操作処理が行われたファイルデータに記憶されている要約データを取得し、仮想ファイル削除手段は、ファイル操作検知手段にてファイルデータから取得した要約データに基づいて仮想ファイルデータの削除を行う、ことを特徴としている。これにより、ファイルデータの変更や削除が生じた場合に、仮想ファイルデータが削除されると共に、ファイルデータが新規に生成や変更された場合には、新たな仮想ファイルデータが記憶される。従って、仮想ファイルデータにて、ファイルデータの最新の状況をより正確に記憶しておくことができる。   Further, in addition to the above configuration, when the operation processing on the file data detected by the file operation detection unit is changed or deleted, a virtual file deletion unit that deletes the existing virtual file data corresponding to the file data is provided. It is characterized by that. The summary data generation means stores the generated summary data included in the file data, and the file operation detection means acquires the summary data stored in the file data subjected to the operation process, and deletes the virtual file The means is characterized in that the virtual file data is deleted based on the summary data acquired from the file data by the file operation detection means. Thereby, when the file data is changed or deleted, the virtual file data is deleted, and when the file data is newly generated or changed, the new virtual file data is stored. Therefore, the latest status of the file data can be more accurately stored in the virtual file data.

さらに、上記構成に加え、時間的に前後する仮想ファイルデータを比較して、その比較結果に基づいて仮想ファイルデータに対応するファイルデータのバックアップ処理を行うバックアップ手段を備えた、ことを特徴としている。これにより、仮想ファイルデータのみを比較することで、全てのファイルデータにアクセスすることなく、更新等のあったファイルデータを特定することができ、必要なファイルデータに対してのみバックアップを実行することができる。従って、バックアップ処理の信頼性を確保しつつ、処理の簡素化、高速化を図ることができる。   Furthermore, in addition to the above-described configuration, it is characterized by comprising backup means for comparing virtual file data that fluctuates in time and performing backup processing of file data corresponding to virtual file data based on the comparison result. . As a result, by comparing only virtual file data, it is possible to identify updated file data without accessing all file data, and backup is performed only for the necessary file data. Can do. Accordingly, it is possible to simplify and speed up the processing while ensuring the reliability of the backup processing.

また、本発明の他の形態は、コンピュータが、所定の記憶装置に記憶されたファイルデータを管理する方法であって、ファイルデータのデータ内容に応じた要約データを生成する要約データ生成工程と、要約データと、当該要約データが生成されたファイルデータを特定するファイル特定データと、を関連付けて当該ファイルデータに対応する仮想ファイルデータとして記憶する仮想ファイル管理工程と、を有することを特徴としている。   Another aspect of the present invention is a method for a computer to manage file data stored in a predetermined storage device, and a summary data generation step for generating summary data according to the data content of the file data; A virtual file management step of associating the summary data with the file specifying data for specifying the file data in which the summary data is generated and storing the summary data as virtual file data corresponding to the file data.

そして、上記方法は、コンピュータがファイルデータに対する操作処理を検知するファイル操作検知工程を有し、このファイル操作検知工程による検知結果に応じて、要約データ生成工程及び仮想ファイル管理工程が作動する、ことを特徴としている。また、上記方法は、仮想ファイル管理工程の前に、ファイル操作検知工程にて検知したファイルデータに対する操作処理が変更又は削除である場合に、コンピュータが、当該ファイルデータに対応する既存の仮想ファイルデータを削除する仮想ファイル削除工程を有する、ことを特徴としている。さらに、上記方法は、コンピュータが、時間的に前後してそれぞれ記憶された仮想ファイルデータを比較して、その比較結果に基づいて仮想ファイルデータに対応するファイルデータのバックアップ処理を行うバックアップ工程を有する、ことを特徴としている。   The method includes a file operation detection process in which the computer detects an operation process on the file data, and the summary data generation process and the virtual file management process operate according to the detection result of the file operation detection process. It is characterized by. In the above method, when the operation processing for the file data detected in the file operation detection step is changed or deleted before the virtual file management step, the computer uses the existing virtual file data corresponding to the file data. And a virtual file deleting step of deleting. Further, the method includes a backup step in which the computer compares the virtual file data stored before and after the time, and performs a backup process of the file data corresponding to the virtual file data based on the comparison result. It is characterized by that.

また、本発明の他の形態であるプログラムは、所定の記憶装置に記憶されたファイルデータを管理するコンピュータに、ファイルデータのデータ内容に応じた要約データを生成する要約データ生成手段と、要約データと、当該要約データが生成されたファイルデータを特定するファイル特定データと、を関連付けて当該ファイルデータに対応する仮想ファイルデータとして記憶する仮想ファイル管理手段と、を実現させる、ことを特徴としている。   A program according to another aspect of the present invention includes a summary data generating unit that generates summary data corresponding to the data content of file data in a computer that manages file data stored in a predetermined storage device, and summary data And virtual file management means for associating and storing the file specifying data specifying the file data for which the summary data is generated as virtual file data corresponding to the file data.

そして、上記プログラムは、さらに、コンピュータに、ファイルデータに対する操作処理を検知するファイル操作検知手段を実現すると共に、要約データ生成手段及び仮想ファイル管理手段は、ファイル操作検知手段の検知結果に応じて作動する、ことを特徴としている。また、上記プログラムは、コンピュータに、ファイル操作検知手段にて検知したファイルデータに対する操作処理が変更又は削除である場合に、当該ファイルデータに対応する既存の仮想ファイルデータを削除する仮想ファイル削除手段、を実現させる、ことを特徴としている。さらに、上記プログラムは、コンピュータに、時間的に前後する仮想ファイルデータを比較して、その比較結果に基づいて仮想ファイルデータに対応するファイルデータのバックアップ処理を行うバックアップ手段、を実現させる、ことを特徴としている。   The program further realizes file operation detection means for detecting operation processing on file data in the computer, and the summary data generation means and virtual file management means operate according to the detection result of the file operation detection means. It is characterized by that. In addition, the program may be a virtual file deletion unit that deletes existing virtual file data corresponding to the file data when the operation processing on the file data detected by the file operation detection unit is changed or deleted on the computer. It is characterized by realizing. Further, the program causes the computer to realize a backup unit that compares virtual file data before and after time and performs a backup process of the file data corresponding to the virtual file data based on the comparison result. It is a feature.

上述した構成の方法及びプログラムの発明であっても、上記ファイル管理システムと同様の作用を有するため、上述した本発明の目的を達成することができる。   Even the method and program of the above-described configuration have the same operation as the above-described file management system, so that the above-described object of the present invention can be achieved.

本発明は、以上のように構成され機能するので、これによると、管理対象となるファイルデータのデータ内容に応じた要約データが生成され、この要約データとそのファイルデータを特定するファイル特定データとが関連付けられて仮想ファイルデータとして記憶されるため、この仮想ファイルデータを参照することで、ファイルデータの変更等の有無を判定することができる。その結果、ファイルデータ自体のデータ内容を詳細に調べる必要が無く、高速かつ低負荷にてファイル管理処理を実現することができる、という従来にない優れた効果を有する。   Since the present invention is configured and functions as described above, according to this, summary data corresponding to the data content of the file data to be managed is generated, and this summary data and file specifying data for specifying the file data Are associated and stored as virtual file data. By referring to this virtual file data, it is possible to determine whether or not the file data has been changed. As a result, there is no need to examine the data contents of the file data in detail, and the file management process can be realized at a high speed and with a low load.

本発明は、ファイルデータのデータ内容を表す要約データを生成して、この要約データとファイルデータを特定するファイル特定データと、を別途、仮想ファイルデータとして管理する点に特徴を有する。そして、時間的に前後するデータ容量の少ない仮想ファイルデータを比較することで、高速かつ簡易な処理にて、ファイルデータの変更等を効率よく検出することができる。以下、具体的な構成及び動作を、実施例にて説明する。   The present invention is characterized in that summary data representing the data content of file data is generated, and the summary data and file specifying data for specifying file data are separately managed as virtual file data. Then, by comparing virtual file data with a small data capacity that changes in time, it is possible to efficiently detect changes in file data and the like with high-speed and simple processing. Hereinafter, a specific configuration and operation will be described in Examples.

本発明の第1の実施例を、図1乃至図8を参照して説明する。図1は、本発明であるファイル管理システムを成すコンピュータの構成を示す機能ブロック図である。図2乃至図3は、コンピュータに記憶されるデータの構造を示す図であり、図4乃至図6は、仮想ファイルデータの一例を示す図である。図7乃至図8は、コンピュータの動作を示すフローチャートである。   A first embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a functional block diagram showing a configuration of a computer constituting a file management system according to the present invention. 2 to 3 are diagrams illustrating the structure of data stored in the computer, and FIGS. 4 to 6 are diagrams illustrating examples of virtual file data. 7 to 8 are flowcharts showing the operation of the computer.

[構成]
本実施例におけるコンピュータ1は、図1に示すように、CPUといった演算装置10と、ハードディスクドライブなどの記憶装置20とを備えた一般的な情報処理装置である。そして、コンピュータ1には、ファイルシステムが構築されており、所定のファイルデータの生成、変更、削除を制御し、記憶装置20に記録再生するよう制御する。なお、ファイルデータを記憶する記憶装置は、フラッシュメモリといった他の記憶装置であってもよい。また、コンピュータ1は、必ずしも内蔵された記憶装置に、後述するファイルデータや仮想ファイルデータを記録することに限定されず、外付けの記憶装置、ネットワークを介して接続された記憶装置(ネットワークストレージ装置)、ネットワーク上の他のコンピュータに装備された記憶装置に対して記録再生を行ってもよい。
[Constitution]
As shown in FIG. 1, the computer 1 in this embodiment is a general information processing apparatus including an arithmetic device 10 such as a CPU and a storage device 20 such as a hard disk drive. A file system is constructed in the computer 1, and the generation, change, and deletion of predetermined file data are controlled, and control is performed so as to record / reproduce to / from the storage device 20. The storage device that stores the file data may be another storage device such as a flash memory. Further, the computer 1 is not necessarily limited to recording file data and virtual file data, which will be described later, in a built-in storage device, but an external storage device, a storage device connected via a network (network storage device) ) Recording / reproduction may be performed on a storage device installed in another computer on the network.

そして、本実施例におけるコンピュータ1は、後述するように、所定のファイルデータを管理してバックアップする機能を有しており、例えば、ファイルサーバやウェブサーバとして作動するコンピュータである。但し、バックアップ機能は、他のコンピュータにて実現されてもよく、以下に説明するコンピュータ1自体が、複数台のコンピュータにて構成されていてもよい。   As will be described later, the computer 1 in this embodiment has a function of managing and backing up predetermined file data. For example, the computer 1 operates as a file server or a web server. However, the backup function may be realized by another computer, and the computer 1 described below may be configured by a plurality of computers.

図1に示すように、コンピュータ1の演算装置10には、まず、文書作成アプリケーションなどのファイルデータを生成したり、変更するアプリケーション11が組み込まれている。また、演算装置10には、オペレーティングシステムなどによって実現されたファイル操作処理部12が構築されており、上記アプリケーション11からの指令に応じて、記憶装置20に対するファイルデータの記録再生等の制御を行う。また、このファイル操作処理部12は、図示しない操作部や他のネットワーク上のコンピュータからの指令に応じても作動し、記憶装置20内でファイルデータの移動や削除等を行う。これに伴い、記憶装置20には、ファイルデータ自体を記憶する実ファイルデータ記憶部21が形成されており、アプリケーション11を利用したユーザによって生成されたファイルデータや、ネットワーク上の他のコンピュータから送信されたファイルデータ等を記憶する。   As shown in FIG. 1, the computing device 10 of the computer 1 first includes an application 11 that generates or changes file data such as a document creation application. In addition, a file operation processing unit 12 realized by an operating system or the like is constructed in the arithmetic device 10, and controls file data recording / reproduction with respect to the storage device 20 in response to a command from the application 11. . The file operation processing unit 12 also operates in response to a command from an operation unit (not shown) or a computer on another network, and moves or deletes file data in the storage device 20. Accordingly, an actual file data storage unit 21 for storing the file data itself is formed in the storage device 20 and is transmitted from file data generated by a user using the application 11 or from another computer on the network. Stored file data and the like are stored.

ここで、実ファイルデータ記憶部21に記憶されるファイルデータの一例を、図2に示す。この図に示すように、ファイルデータ4は、ファイル名やファイル格納位置(パス)などが格納されたメタデータと、データ内容自体を表す実データと、により構成されている。そして、このファイルデータ4が管理されることによって、後述するように当該ファイルデータ4のデータ内容に対応するシグニチャが生成されるが、このシグニチャのうち最新のものが、ファイルデータ4内に含まれて記憶されている。   Here, an example of the file data stored in the real file data storage unit 21 is shown in FIG. As shown in this figure, the file data 4 is composed of metadata storing a file name, a file storage position (path), and the like, and actual data representing the data content itself. As the file data 4 is managed, a signature corresponding to the data content of the file data 4 is generated as will be described later. The latest one of the signatures is included in the file data 4. Is remembered.

また、演算装置10には、本発明であるファイル管理用プログラムが組み込まれることによって、ファイル操作検知処理部13と、シグニチャ生成処理部14と、仮想ファイル管理処理部15と、が構築されている。さらに、バックアップ用プログラムが組み込まれることにより、バックアップアプリケーション16が構築されている。以下、これらについて詳述する。   Further, the file operation detection processing unit 13, the signature generation processing unit 14, and the virtual file management processing unit 15 are constructed in the arithmetic device 10 by incorporating the file management program according to the present invention. . Furthermore, the backup application 16 is constructed by incorporating a backup program. These will be described in detail below.

上記ファイル操作検知処理部13(ファイル操作検知手段)は、ファイル操作処理部12によって上記ファイルデータが生成・変更・削除されるなど、実ファイルデータ記憶部21内のファイルデータに対する操作が生じたことを検知するよう作動する。そして、ファイルデータの変更等を検知した場合に、その旨をシグニチャ生成処理部14に通知する。例えば、プロセスが、オペレーティングシステムカーネルに対してファイル操作系のシステムコールを発行するタイミングや、ファイルシステムから変更を受けたことを通知されるウィルススキャンソフトとの連携によって当該ウィルススキャンソフトからの通知を受けたタイミングにて、検知することができる。   The file operation detection processing unit 13 (file operation detection means) has performed an operation on the file data in the actual file data storage unit 21 such as the file operation processing unit 12 generating, changing, or deleting the file data. Act to detect. When the change of the file data or the like is detected, the fact is notified to the signature generation processing unit 14. For example, when a process issues a file operation system call to the operating system kernel, or when the process is linked with a virus scan software that is notified that a change has been received from the file system, a notification is sent from the virus scan software. It can be detected at the received timing.

具体的に、ファイル操作検知処理部13は、ファイルデータの操作があったことを検知すると、そのファイルデータの格納先情報(パス)を含むファイル名情報、新規生成・変更・削除などの操作種別を表す操作種別情報、さらには、ファイルデータ内に既に記憶されているシグニチャ、を取得して、これらの情報をシグニチャ生成処理部14に通知する。なお、操作種別は、ファイルが新たに生成された場合は「新規生成」であり、ファイルデータのデータ内容の変更やファイルデータ自体の格納先(パス)が変更された場合は「変更」、ファイルデータ自体が削除された場合は「削除」として取り扱われることとする。   Specifically, when the file operation detection processing unit 13 detects that the file data has been operated, the file type information including the storage destination information (path) of the file data, and the operation type such as new generation / change / deletion Is acquired, and signatures already stored in the file data are acquired, and these pieces of information are notified to the signature generation processing unit 14. The operation type is “new creation” when a file is newly created, “change” when the data content of the file data is changed or the storage location (path) of the file data itself is changed. When the data itself is deleted, it is handled as “deleted”.

シグニチャ生成処理部14(要約データ生成手段)は、まず、ファイル操作検知処理部13から通知を受けたファイルデータの操作種別が、新規生成・変更・削除のいずれであるかを判定する。そして、操作種別が、「新規作成」あるいは「変更」であった場合には、ファイルデータの実データ(データ内容)に基づいて、「MD5」などのハッシュ関数を用いてハッシュ値を算出する。この算出したハッシュ値は、ファイルデータのデータ内容を表す値であり、以下、「シグニチャ」(要約データ)と呼ぶ。そして、シグニチャ生成処理部14は、生成したシグニチャを、生成元となったファイルデータに含めて記憶する(図2参照)。このとき、ファイルデータに以前のシグニチャが存在している場合には、以前のものを削除して、最新のシグニチャを記憶する。また、シグニチャ生成処理部14は、上述したように新たに生成したシグニチャ、及び、上記ファイル操作検知処理部13にて取得し判定した操作種別情報、さらには、ファイルデータのファイル名情報を、仮想ファイル管理処理部15に通知する。   The signature generation processing unit 14 (summary data generation means) first determines whether the operation type of the file data received from the file operation detection processing unit 13 is new generation / change / deletion. When the operation type is “new creation” or “change”, a hash value is calculated using a hash function such as “MD5” based on the actual data (data contents) of the file data. The calculated hash value is a value representing the data content of the file data, and is hereinafter referred to as “signature” (summary data). Then, the signature generation processing unit 14 stores the generated signature in the file data that is the generation source (see FIG. 2). At this time, if the previous signature exists in the file data, the previous signature is deleted and the latest signature is stored. In addition, the signature generation processing unit 14 stores the newly generated signature, the operation type information acquired and determined by the file operation detection processing unit 13, and the file name information of the file data. The file management processing unit 15 is notified.

仮想ファイル管理処理部15(仮想ファイル管理手段、仮想ファイル削除手段)は、シグニチャ生成処理部14から通知されたシグニチャ、操作種別情報、ファイル名情報を取得し、まず、ファイルデータに対する操作種別が「変更」又は「削除」である場合に、ファイル名情報やシグニチャから特定できる仮想ファイルデータを、仮想ファイルデータ記憶部22内から削除する。つまり、ファイル操作検知処理部13にてファイルデータから取得されたシグニチャ(図2参照)と同一のファイル名である仮想ファイルデータを削除する。   The virtual file management processing unit 15 (virtual file management means, virtual file deletion means) acquires the signature, operation type information, and file name information notified from the signature generation processing unit 14, and first, the operation type for the file data is “ In the case of “change” or “deletion”, the virtual file data that can be specified from the file name information and the signature is deleted from the virtual file data storage unit 22. That is, the virtual file data having the same file name as the signature (see FIG. 2) acquired from the file data in the file operation detection processing unit 13 is deleted.

また、仮想ファイル管理処理部15は、シグニチャが生成されたファイルデータに対応して、当該生成されたシグニチャをファイル名とする仮想ファイルデータを生成して、仮想ファイルデータ記憶部22内に記憶する。この仮想ファイルデータは、そのデータ内容として、対応するファイルデータのファイル名を含む当該ファイルデータへのパスデータ(ファイル特定データ)を含んで記憶される。従って、ファイルデータが新規に生成された場合には、新たにシグニチャをファイル名とする仮想ファイルデータが記憶され、ファイルデータが変更された場合には、そのファイルデータに対応する既存の仮想ファイルデータが削除された後に、変更後の新たなシグニチャをファイル名とする仮想ファイルデータが記憶される。   In addition, the virtual file management processing unit 15 generates virtual file data having the generated signature as a file name corresponding to the file data for which the signature is generated, and stores the virtual file data in the virtual file data storage unit 22. . The virtual file data is stored as data contents including path data (file specifying data) to the file data including the file name of the corresponding file data. Therefore, when file data is newly generated, virtual file data having a signature as a new file name is stored. When file data is changed, existing virtual file data corresponding to the file data is stored. Is deleted, virtual file data with the new signature after the change as the file name is stored.

ここで、仮想ファイルデータ記憶部22に記憶されている仮想ファイルデータの構成例を、図3に示す。この図に示すように、仮想ファイルデータ5は、対応するファイルデータのシグニチャをファイル名とし、さらに、そのファイルデータへのパスデータ(ファイルデータのファイル名を含む)をデータ内容として保持している。さらに、仮想ファイルデータの具体例を、図4に示す。この図では、符号51,52,53という仮想ファイルデータが記憶されている。そして、符号51の仮想ファイルデータを一例に挙げると、仮想ファイルデータ51は、対応するファイルデータから生成されたシグニチャである「ef2484・・・」がファイル名51aとして設定されており、そのデータ内容として、実ファイルデータ記憶部21に記憶されている対応するファイルデータへのパスデータ51b「/home/user1/data/text1.txt」(格納先)が記憶されている。   Here, a configuration example of the virtual file data stored in the virtual file data storage unit 22 is shown in FIG. As shown in this figure, the virtual file data 5 uses the signature of the corresponding file data as the file name, and further holds the path data to the file data (including the file name of the file data) as the data content. . Furthermore, a specific example of virtual file data is shown in FIG. In this figure, virtual file data 51, 52, and 53 are stored. As an example, the virtual file data 51 is configured such that “ef2484...”, Which is a signature generated from the corresponding file data, is set as the file name 51 a in the virtual file data 51. As shown, path data 51b “/home/user1/data/text1.txt” (storage destination) to the corresponding file data stored in the actual file data storage unit 21 is stored.

そして、上記シグニチャ生成処理部14、仮想ファイル管理処理部15は、ファイル操作検知処理部13にてファイル操作が検知される度に、上述した処理を実行する。従って、仮想ファイルデータ記憶部22には、最新の各ファイルデータのデータ内容に対応するシグニチャをファイル名とした仮想ファイルデータが記憶され、それぞれのファイルデータへのパスデータが格納された状態となっている。   The signature generation processing unit 14 and the virtual file management processing unit 15 execute the above-described processing every time a file operation is detected by the file operation detection processing unit 13. Therefore, the virtual file data storage unit 22 stores virtual file data having a signature corresponding to the latest data content of each file data as a file name, and stores path data for each file data. ing.

また、上記バックアップアプリケーション16(バックアップ手段)は、上記仮想ファイルデータを利用して、実ファイルデータ記憶部21に記憶されているファイルデータのバックアップ処理を実行するアプリケーションである。具体的に、バックアップアプリケーション16は、ある時刻における仮想ファイルデータ記憶部22の内容を取得してバックアップ用記憶装置30に記憶しておき、また、その後のある時刻においても、同様に仮想ファイルデータ記憶部22の内容を取得してバックアップ用記憶装置30に記憶する。   The backup application 16 (backup means) is an application that performs backup processing of file data stored in the real file data storage unit 21 using the virtual file data. Specifically, the backup application 16 acquires the contents of the virtual file data storage unit 22 at a certain time and stores them in the backup storage device 30, and similarly stores the virtual file data at a certain time thereafter. The contents of the unit 22 are acquired and stored in the backup storage device 30.

そして、バックアップアプリケーション16は、時間的に前後する各仮想ファイルデータ毎に、そのファイル名(シグニチャ)、及び、そのデータ内容であるパスデータを比較する。このとき、比較している仮想ファイルデータ間で、ファイル名(シグニチャ)が一致しない仮想ファイルデータが存在する場合には、この仮想ファイルデータに対応するファイルデータは新規生成あるいは変更されたものと判断され、パスデータを参照して該当するファイルデータを吸い上げる処理を実行する。また、ファイル名(シグニチャ)は一致するが、パスデータが一致しない仮想ファイルデータが存在する場合には、対応するファイルデータのデータ内容の変更は無く、格納先のみが変更されたと判断し、当該ファイルデータの移動情報のみを吸い上げる。そして、吸い上げたデータに基づいて、バックアップ処理を実行する。なお、バックアップ処理は、従来より行われている処理を用いるため、その詳細な説明は省略する。また、バックアップ用記憶装置30は、コンピュータ1内に装備された別のドライブ領域であってもよく、あるいは、他の外部記憶装置であってもよい。さらには、コンピュータ1にネットワークを介して接続された他の記憶装置であってもよい。   Then, the backup application 16 compares the file name (signature) and the path data that is the data content for each virtual file data that fluctuates in time. At this time, if there is virtual file data whose file name (signature) does not match between the virtual file data being compared, it is determined that the file data corresponding to this virtual file data has been newly created or changed. Then, a process of referring to the path data and sucking up the corresponding file data is executed. If there is virtual file data that matches the file name (signature) but does not match the path data, the data content of the corresponding file data is not changed and it is determined that only the storage location has been changed. Only file data movement information is downloaded. Then, backup processing is executed based on the sucked data. In addition, since the backup process uses the process performed conventionally, the detailed description is abbreviate | omitted. Further, the backup storage device 30 may be another drive area equipped in the computer 1 or may be another external storage device. Furthermore, another storage device connected to the computer 1 via a network may be used.

[動作]
次に、上記構成のコンピュータ1の動作を、図4乃至図6のデータ構造図、及び、図7乃至図8のフローチャートを参照して説明する。はじめに、図4乃至図6、及び、図7を参照して、コンピュータ1による仮想ファイルデータの生成処理について説明する。
[Operation]
Next, the operation of the computer 1 having the above configuration will be described with reference to the data structure diagrams of FIGS. 4 to 6 and the flowcharts of FIGS. First, virtual file data generation processing by the computer 1 will be described with reference to FIGS. 4 to 6 and FIG. 7.

まず、アプリケーション11からの指令に応じて、実ファイルデータ記憶部21内で、ファイルデータの生成や変更、移動、削除を行う(ステップS1)。すると、ファイルデータの生成・変更・削除が検知され(ファイル操作検知工程)、当該ファイルデータの格納先情報(パス)を含むファイル名情報、操作種別情報、ファイルデータ内に記憶されている以前のシグニチャ、を取得する(ステップS2)。なお、ファイル操作を検知するタイミングとしては、ファイルシステムを扱うオペレーティングシステムへのフック(割り込み処理)が生じたタイミングや、ウィルススキャンソフトとの連携によって当該ウィルススキャンソフトからの通知を受けたタイミングで行う。   First, in response to a command from the application 11, file data is generated, changed, moved, or deleted in the actual file data storage unit 21 (step S1). Then, the generation / change / deletion of the file data is detected (file operation detection step), the file name information including the storage destination information (path) of the file data, the operation type information, and the previous data stored in the file data The signature is acquired (step S2). Note that the file operation is detected at the timing when a hook (interrupt processing) to the operating system that handles the file system occurs, or when the notification from the virus scanning software is received in cooperation with the virus scanning software. .

続いて、取得したファイルデータの操作種別情報から、新規生成・変更・削除のいずれであるかを判定する(ステップS3)。このとき、操作種別が、「新規作成」あるいは「変更」であった場合には(ステップS4でイエス)、ファイルデータの実データに基づいて、「MD5」などのハッシュ関数を用いてシグニチャを生成する(ステップS5、要約データ生成工程)。その後、生成したシグニチャをファイルデータ自体に含めて記憶する(ステップS6、図2参照)。このとき、ファイルデータに以前のシグニチャが存在している場合には、以前のものを削除して、最新のシグニチャのみを記憶する。なお、シグニチャは、必ずしもハッシュ関数を用いて算出生成されることに限定されず、ファイルデータの実データの内容を表す情報であればよい。   Subsequently, from the operation type information of the acquired file data, it is determined whether it is new generation / change / deletion (step S3). At this time, if the operation type is “create new” or “change” (Yes in step S4), a signature is generated using a hash function such as “MD5” based on the actual data of the file data. (Step S5, summary data generation step). Thereafter, the generated signature is included in the file data itself and stored (step S6, see FIG. 2). At this time, if the previous signature exists in the file data, the previous one is deleted and only the latest signature is stored. Note that the signature is not necessarily calculated and generated using a hash function, and may be information indicating the content of actual data of file data.

続いて、ファイルデータの操作種別が、ここでは、「新規生成」であるとすると(ステップS7でノー)、ファイルデータに対応する仮想ファイルデータを上記シグニチャ等に基づいて生成して、新たに仮想ファイルデータ記憶部22内に記憶する(ステップS9、仮想ファイル管理工程)。例えば、図4の符号51に示すように、ファイルデータについて生成したシグニチャをファイル名51aとし、そのデータ内容をファイルデータへのパスデータ51bとした仮想ファイルデータ51を生成して、仮想ファイルデータ記憶部22内に記憶する。そして、図4では、同様にして、実ファイルデータ記憶部20内のファイルデータに対応して、仮想ファイルデータ52,53が記憶されていることとする。   Subsequently, assuming that the operation type of the file data is “new generation” (No in step S7), virtual file data corresponding to the file data is generated based on the signature or the like, and a new virtual data is newly generated. Store in the file data storage unit 22 (step S9, virtual file management step). For example, as shown by reference numeral 51 in FIG. 4, virtual file data 51 is generated with the signature generated for the file data as the file name 51a and the data content as the path data 51b to the file data. Store in the unit 22. In FIG. 4, similarly, virtual file data 52 and 53 are stored corresponding to the file data in the real file data storage unit 20.

ここで、ファイルデータが変更されたときの動作、つまり、ステップS7で、操作種別が「変更」である場合を説明する(ステップS7でイエス)。なお、操作種別が「変更」とは、ファイルデータのデータ内容が変更された場合はもちろん、ファイルデータの内容が変更されずにデータ移動され、格納位置(パス)が変更されただけの場合も含むこととする。この場合には、まず、ファイル操作が検知されたファイルデータから取得したシグニチャと一致するファイル名の仮想ファイルデータを、仮想ファイルデータ記憶部22内から削除する(ステップS8、仮想ファイル削除工程)。例えば、変更されたファイルデータから取得された以前のシグニチャが、図5に示す仮想ファイルデータ51,52のファイル名と一致する場合には、当該仮想ファイルデータ51,52自体を削除する(図5の×印参照)。   Here, an operation when the file data is changed, that is, a case where the operation type is “change” in step S7 (Yes in step S7) will be described. Note that the operation type is “change”, not only when the data content of the file data is changed, but also when the data is moved without changing the content of the file data and the storage location (path) is only changed. To include. In this case, first, the virtual file data having the file name that matches the signature acquired from the file data in which the file operation is detected is deleted from the virtual file data storage unit 22 (step S8, virtual file deletion step). For example, if the previous signature acquired from the changed file data matches the file name of the virtual file data 51, 52 shown in FIG. 5, the virtual file data 51, 52 itself is deleted (FIG. 5). )

そして、その後は、変更されたファイルデータからステップS5で新たに生成されたシグニチャをファイル名とした仮想ファイルデータが生成され、仮想ファイルデータ記憶部22に記憶される(仮想ファイル管理工程)。その一例を図6に示す。例えば、図5において符号51に示す仮想ファイルデータに対応するファイルデータのデータ内容が変更されている場合には、図6に示す仮想ファイルデータ51’のファイル名であるシグニチャ51a’の値が異なっており、一方で、パスデータ51bは同一である。また、図5において符号52に示す仮想ファイルデータに対応するファイルデータの格納位置が移動されただけの場合には、図6に示す仮想ファイルデータ52’のファイル名であるシグニチャ52aの値が一致しており、一方で、パス51bは異なっている。   Thereafter, virtual file data with the signature newly generated in step S5 as the file name is generated from the changed file data and stored in the virtual file data storage unit 22 (virtual file management step). An example is shown in FIG. For example, when the data content of the file data corresponding to the virtual file data denoted by reference numeral 51 in FIG. 5 is changed, the value of the signature 51a ′ that is the file name of the virtual file data 51 ′ illustrated in FIG. 6 is different. On the other hand, the path data 51b is the same. Further, when the storage position of the file data corresponding to the virtual file data indicated by reference numeral 52 in FIG. 5 is merely moved, the value of the signature 52a that is the file name of the virtual file data 52 ′ shown in FIG. On the other hand, the path 51b is different.

なお、検知したファイルデータの操作種別が「削除」である場合には(ステップS4でノー、ステップS7でイエス)、そのファイルデータから取得したシグニチャと一致するファイル名の仮想ファイルデータを、仮想ファイルデータ記憶部22内から削除する(ステップS8、仮想ファイル削除工程)。その後は、このファイルデータに対してシグニチャが生成されていないため、仮想ファイルデータも新たには生成されない。   If the operation type of the detected file data is “delete” (No in step S4, yes in step S7), virtual file data having a file name that matches the signature acquired from the file data is displayed as a virtual file. It deletes from the inside of the data storage part 22 (step S8, virtual file deletion process). Thereafter, since no signature is generated for the file data, virtual file data is not newly generated.

次に、図8を参照して、バックアップアプリケーション16によるバックアップ動作を説明する。まず、ある時刻における仮想ファイルデータ記憶部22の内容として仮想ファイルデータを取得する(ステップS11)。ここでは、図4に示す仮想ファイルデータを取得したとする。その後、バックアップを行う一定時間が経過したり(ステップS12でイエス)、設定された時刻となると、その時刻における仮想ファイルデータ記憶部22の内容として仮想ファイルデータを取得する(ステップS13)。ここでは、図6に示す仮想ファイルデータを取得したこととする。   Next, the backup operation by the backup application 16 will be described with reference to FIG. First, virtual file data is acquired as the contents of the virtual file data storage unit 22 at a certain time (step S11). Here, it is assumed that the virtual file data shown in FIG. 4 is acquired. Thereafter, when a predetermined time for backup has elapsed (Yes in step S12) or when the set time is reached, virtual file data is acquired as the contents of the virtual file data storage unit 22 at that time (step S13). Here, it is assumed that the virtual file data shown in FIG. 6 has been acquired.

続いて、取得した時間的に前後する仮想ファイルデータを比較する(ステップS14)。このとき、両者に含まれない仮想ファイルデータの新規のファイル名(シグニチャ)が存在する場合には(ステップS15でイエス)、この仮想ファイルデータのパスを参照して、当該仮想ファイルデータに対応するファイルデータを吸い上げる(ステップS16)。そして、全く新規のファイルデータであれば、そのファイルデータを新たにバックアップファイルとして生成する。一方で、図4の符号51と図6の符号51’のように、ファイル名51a,51a’は異なるもののパスデータ51bは一致するファイルデータの場合には、そのファイルデータのデータ内容が変更され更新されたものであると判断して、差分バックアップを実行する(ステップS17)。また、図4の符号52と図6の符号52’のように、ファイル名52aは一致するもののパスデータ52b,52b’は異なるファイルデータの場合には(ステップS19でイエス)、このファイルデータのデータ内容に変更は無く、データ移動だけが生じたものと考えられる。かかる場合には、該当するファイルデータの移動情報のみを吸い上げ(ステップS20)、バックアップファイル内で格納先を移動するなどのバックアップ処理を実行する(ステップS17)。そして、上述したバックアップ処理を、更新された仮想ファイルデータが無くなるまで実行することで(ステップS18)、バックアップ処理が完了する(バックアップ工程)。   Subsequently, the acquired virtual file data that is mixed in time is compared (step S14). At this time, if a new file name (signature) of virtual file data not included in both exists (Yes in step S15), the virtual file data is referred to by referring to the path of the virtual file data. The file data is sucked up (step S16). If the file data is completely new, the file data is newly generated as a backup file. On the other hand, if the path data 51b is different in the file data 51a, 51a ′ but the file data 51b is the same as the code 51 ′ in FIG. 4 and the code 51 ′ in FIG. 6, the data content of the file data is changed. It is determined that it has been updated, and differential backup is executed (step S17). Also, as shown by reference numeral 52 in FIG. 4 and reference numeral 52 ′ in FIG. 6, when the file name 52 a matches but the path data 52 b and 52 b ′ are different file data (yes in step S 19), the file data There is no change in the data contents, and it is considered that only data movement has occurred. In such a case, only the transfer information of the corresponding file data is downloaded (step S20), and backup processing such as moving the storage destination in the backup file is executed (step S17). Then, the backup process described above is executed until the updated virtual file data disappears (step S18), thereby completing the backup process (backup process).

以上のように、本発明によると、ファイルデータのデータ内容に応じて生成されたシグニチャをファイル名とし、これに当該ファイルデータへのパスを含めて仮想ファイルデータとして管理することで、ファイルデータの更新等の有無を確実に判定することができる。特に、ファイルデータ自体のデータ内容を詳細に調べる必要が無く、つまり、ファイルデータ自体をスキャンする必要が無く、データ容量の少ない仮想ファイルデータを調べることでファイルデータの更新等の有無を判定でき、高速かつ低負荷、さらには、効率的なファイル管理を実現することができる。   As described above, according to the present invention, the signature generated according to the data content of the file data is used as the file name, and the file data is managed as virtual file data including the path to the file data. Whether or not there is an update or the like can be reliably determined. In particular, there is no need to examine the data content of the file data itself in detail, that is, there is no need to scan the file data itself, it is possible to determine whether or not file data is updated by examining virtual file data with a small data capacity, High speed, low load, and efficient file management can be realized.

さらに、仮想ファイルデータを通常のファイルシステムと同様に読み書きできるよう構成しているため、バックアップアプリケーションに特殊なデータベースアクセス手段を組み込む必要がなく、バックアップを実現することができる。従って、あらゆるコンピュータにて利用可能であり、汎用性の向上を図ることができる。   Furthermore, since the virtual file data is configured to be readable and writable in the same way as a normal file system, it is not necessary to incorporate special database access means in the backup application, and backup can be realized. Therefore, it can be used in any computer and the versatility can be improved.

なお、上記では、ファイルデータが変更・削除された場合には、仮想ファイルデータの削除を行うよう例示したが、当該仮想ファイルデータを削除せずに蓄積してもよい。これにより、ファイルデータの変更履歴を蓄積することができ、後のファイル復元などに利用することも可能である。   In the above description, the virtual file data is deleted when the file data is changed / deleted. However, the virtual file data may be stored without being deleted. As a result, the change history of the file data can be accumulated and can be used for later file restoration and the like.

次に、本発明の第2の実施例を、図9乃至図10を参照して説明する。図9は、本実施例における仮想ファイルデータの一例を示す図であり、図10は、本実施例におけるコンピュータ1の動作の一部を示すフローチャートである。   Next, a second embodiment of the present invention will be described with reference to FIGS. FIG. 9 is a diagram illustrating an example of virtual file data in the present embodiment, and FIG. 10 is a flowchart illustrating a part of the operation of the computer 1 in the present embodiment.

本実施例では、仮想ファイル管理処理部15が、仮想ファイルデータ記憶部22に仮想ファイルデータを記憶する際に、ファイル名つまりファイルデータから生成したシグニチャが一致する仮想ファイルデータが存在するか否かを調べる。そして、シグニチャが一致する場合には、新たなシグニチャをディレクトリ名とするディレクトリを仮想ファイルデータ記憶部22内に生成し、このディレクトリ内に、シグニチャをファイル名としてファイルデータへのパスをデータ内容に有する仮想ファイルデータを記憶するよう作動する。その動作を図10のフローチャートに示し、仮想ファイルデータの一例を、図9に示す。   In the present embodiment, when the virtual file management processing unit 15 stores virtual file data in the virtual file data storage unit 22, whether or not there is virtual file data having a matching file name, that is, a signature generated from the file data. Check out. If the signatures match, a directory having the new signature as the directory name is generated in the virtual file data storage unit 22, and the path to the file data with the signature as the file name in the directory is used as the data content. Operates to store the virtual file data it has. The operation is shown in the flowchart of FIG. 10, and an example of the virtual file data is shown in FIG.

まず、実施例1の図7のフローチャートを参照して説明したように、ファイルデータの操作が検出されると、シグニチャが生成され、このシグニチャがファイル名とされた仮想ファイルデータが仮想ファイルデータ記憶部22に記憶される(ステップS9)。このとき、本実施例では、まず、生成された仮想ファイルデータ(ステップS101)と同一のファイル名の仮想ファイルデータが既に仮想ファイルデータ記憶部22に存在するか否かを調べる(ステップS102)。例えば、図9の符号55に示す仮想ファイルデータが存在していた場合に、このファイル名55aと同一のシグニチャが生成されたとする(ステップS102でイエス)。なお、各シグニチャに対応するファイルデータは、たまたまシグニチャが一致しただけであって、ファイルデータ自体は異なるため、そのパスも異なる(符号55b,57b参照)。   First, as described with reference to the flowchart of FIG. 7 of the first embodiment, when an operation on file data is detected, a signature is generated, and virtual file data having this signature as a file name is stored in the virtual file data storage. Stored in the unit 22 (step S9). At this time, in this embodiment, first, it is checked whether or not virtual file data having the same file name as the generated virtual file data (step S101) already exists in the virtual file data storage unit 22 (step S102). For example, if the virtual file data indicated by reference numeral 55 in FIG. 9 exists, the same signature as the file name 55a is generated (Yes in step S102). Note that the file data corresponding to each signature only coincides with the signature, and the file data itself is different, so the paths are also different (see reference numerals 55b and 57b).

すると、新たに生成した仮想ファイルデータ57のファイル名57aとなったシグニチャを名称とするディレクトリ56が生成される(ステップS103)。そして、このディレクトリ56内に、シグニチャをファイル名57aとし、これに対応するファイルデータへのパス57bをデータ内容に含む仮想ファイルデータ57が記憶される(ステップS104)。これにより、各仮想ファイルデータに対応する各ファイルデータを区別することができる。なお、ディレクトリ56内には、シグニチャをファイル名として仮想ファイルデータを生成することに限定されず、少なくとも対応するファイルデータを特定する情報が含まれていればよい。   Then, a directory 56 whose name is the signature that has become the file name 57a of the newly generated virtual file data 57 is generated (step S103). In this directory 56, virtual file data 57 having the signature as the file name 57a and the path 57b to the corresponding file data in the data content is stored (step S104). Thereby, each file data corresponding to each virtual file data can be distinguished. Note that the directory 56 is not limited to generating virtual file data using a signature as a file name, but may include at least information for identifying the corresponding file data.

以上のように、本発明によると、仮に、ファイルデータが異なっているにも関わらず、各ファイルデータに基づいて算出されたシグニチャ、つまり、仮想ファイルデータのファイル名が重複した場合であっても、ディレクトリ階層を異ならせることで、各仮想ファイルデータを区別することができる。従って、より確実に、ファイルデータの更新等を管理することができる。   As described above, according to the present invention, even if the file data is different, the signature calculated based on each file data, that is, the file name of the virtual file data is duplicated. By changing the directory hierarchy, each virtual file data can be distinguished. Therefore, it is possible to manage the update of the file data more reliably.

本発明は、大容量ファイルシステムを備えるコンピュータシステム、ファイルサーバ、さらには、パーソナルコンピュータなどで利用することができ、また、ファイルの変更履歴などを残し検索するシステムにも利用することができ、産業上の利用可能性を有する。   INDUSTRIAL APPLICABILITY The present invention can be used in a computer system having a large capacity file system, a file server, a personal computer, etc., and can also be used in a system for searching while leaving a file change history. With the above applicability.

実施例1におけるコンピュータの構成を示す機能ブロック図である。FIG. 3 is a functional block diagram illustrating a configuration of a computer according to the first embodiment. 図1に開示したファイルデータのデータ構造を示す図である。It is a figure which shows the data structure of the file data disclosed in FIG. 図1に開示した仮想ファイルデータのデータ構造を示す図である。It is a figure which shows the data structure of the virtual file data disclosed in FIG. 図1に開示した仮想ファイルデータの具体的なデータ構造を示す図である。It is a figure which shows the specific data structure of the virtual file data disclosed in FIG. 図1に開示した仮想ファイルデータの具体的なデータ構造を示す図である。It is a figure which shows the specific data structure of the virtual file data disclosed in FIG. 図1に開示した仮想ファイルデータの具体的なデータ構造を示す図である。It is a figure which shows the specific data structure of the virtual file data disclosed in FIG. 図1に開示したコンピュータの動作を示すフローチャートである。2 is a flowchart illustrating an operation of the computer disclosed in FIG. 1. 図1に開示したコンピュータの動作を示すフローチャートである。2 is a flowchart illustrating an operation of the computer disclosed in FIG. 1. 実施例2における仮想ファイルデータの具体的なデータ構造を示す図である。It is a figure which shows the specific data structure of the virtual file data in Example 2. FIG. 実施例2におけるコンピュータの動作を示す図である。FIG. 10 is a diagram illustrating an operation of a computer according to a second embodiment.

符号の説明Explanation of symbols

1 コンピュータ
4 ファイルデータ
5 仮想ファイルデータ
10 演算装置
11 アプリケーション
12 ファイル操作処理部
13 ファイル操作検知処理部
14 シグニチャ生成処理部
15 仮想ファイル管理処理部
16 バックアップアプリケーション
20 記憶装置
21 実ファイルデータ記憶部
22 仮想ファイルデータ記憶部
30 バックアップ用記憶部
51,51’,52,52’,53,55,57 仮想ファイルデータ
56 ディレクトリ
51a,51a’,52a,55a,57a ファイル名
51b,52b,52b’,55b,57b パスデータ
1 Computer 4 File Data 5 Virtual File Data 10 Arithmetic Device 11 Application 12 File Operation Processing Unit 13 File Operation Detection Processing Unit 14 Signature Generation Processing Unit 15 Virtual File Management Processing Unit 16 Backup Application 20 Storage Device 21 Real File Data Storage Unit 22 Virtual File data storage unit 30 Backup storage units 51, 51 ′, 52, 52 ′, 53, 55, 57 Virtual file data 56 Directories 51a, 51a ′, 52a, 55a, 57a File names 51b, 52b, 52b ′, 55b, 57b Pass data

Claims (17)

所定の記憶装置に記憶されたファイルデータのデータ内容に応じた要約データを生成する要約データ生成手段と、
前記要約データと、当該要約データが生成された前記ファイルデータを特定するファイル特定データと、を関連付けて当該ファイルデータに対応する仮想ファイルデータとして記憶する仮想ファイル管理手段と、
を備えたことを特徴とするファイル管理システム。
Summary data generating means for generating summary data according to the data content of the file data stored in a predetermined storage device;
Virtual file management means for associating and storing the summary data and file specifying data for specifying the file data for which the summary data was generated as virtual file data corresponding to the file data;
A file management system characterized by comprising:
前記仮想ファイル管理手段は、前記要約データを前記仮想ファイルデータのファイル名として記憶する、
ことを特徴とする請求項1記載のファイル管理システム。
The virtual file management means stores the summary data as a file name of the virtual file data.
The file management system according to claim 1.
前記要約データ生成手段は、前記ファイルデータのデータ内容に基づいて算出したハッシュ値を前記要約データとして生成する、
ことを特徴とする請求項2記載のファイル管理システム。
The summary data generation means generates a hash value calculated based on the data content of the file data as the summary data.
The file management system according to claim 2, wherein:
前記仮想ファイル管理手段は、前記要約データをディレクトリ名としたディレクトリを生成すると共に、このディレクトリ内に前記仮想ファイルデータを記憶する、
ことを特徴とする請求項2又は3記載のファイル管理システム。
The virtual file management means generates a directory with the summary data as a directory name and stores the virtual file data in the directory;
The file management system according to claim 2 or 3, wherein
前記仮想ファイル管理手段は、前記仮想ファイルデータに対応する前記ファイルデータの格納先を表すパスデータを前記ファイル特定データとして前記仮想ファイルデータに含める、
ことを特徴とする請求項1,2,3又は4記載のファイル管理システム。
The virtual file management means includes path data representing a storage destination of the file data corresponding to the virtual file data in the virtual file data as the file specifying data;
5. The file management system according to claim 1, 2, 3 or 4.
前記ファイルデータに対する操作処理を検知するファイル操作検知手段を備え、
前記要約データ生成手段及び前記仮想ファイル管理手段は、前記ファイル操作検知手段の検知結果に応じて作動する、
ことを特徴とする請求項1,2,3,4又は5記載のファイル管理システム。
A file operation detecting means for detecting an operation process for the file data;
The summary data generation unit and the virtual file management unit operate according to a detection result of the file operation detection unit.
6. The file management system according to claim 1, 2, 3, 4 or 5.
前記ファイル操作検知手段にて検知した前記ファイルデータに対する操作処理が変更又は削除である場合に、当該ファイルデータに対応する既存の前記仮想ファイルデータを削除する仮想ファイル削除手段を備えた、
ことを特徴とする請求項6記載のファイル管理システム。
A virtual file deletion unit that deletes the existing virtual file data corresponding to the file data when the operation processing on the file data detected by the file operation detection unit is a change or deletion;
The file management system according to claim 6.
前記要約データ生成手段は、生成した前記要約データを前記ファイルデータに含めて記憶すると共に、
前記ファイル操作検知手段は、操作処理が行われた前記ファイルデータに記憶されている前記要約データを取得し、
前記仮想ファイル削除手段は、前記ファイル操作検知手段にて前記ファイルデータから取得した前記要約データに基づいて前記仮想ファイルデータの削除を行う、
ことを特徴とする請求項7記載のファイル管理システム。
The summary data generation means stores the generated summary data included in the file data,
The file operation detection means acquires the summary data stored in the file data on which operation processing has been performed,
The virtual file deletion means deletes the virtual file data based on the summary data acquired from the file data by the file operation detection means.
The file management system according to claim 7.
時間的に前後する前記仮想ファイルデータを比較して、その比較結果に基づいて前記仮想ファイルデータに対応する前記ファイルデータのバックアップ処理を行うバックアップ手段を備えた、
ことを特徴とする請求項1,2,3,4,5,6,7又は8記載のファイル管理システム。
Comparing the virtual file data before and after the time, comprising backup means for performing a backup process of the file data corresponding to the virtual file data based on the comparison result,
9. The file management system according to claim 1, 2, 3, 4, 5, 6, 7 or 8.
コンピュータが、所定の記憶装置に記憶されたファイルデータを管理する方法であって、
前記ファイルデータのデータ内容に応じた要約データを生成する要約データ生成工程と、
前記要約データと、当該要約データが生成された前記ファイルデータを特定するファイル特定データと、を関連付けて当該ファイルデータに対応する仮想ファイルデータとして記憶する仮想ファイル管理工程と、
を有することを特徴とするファイル管理方法。
A computer manages file data stored in a predetermined storage device,
A summary data generation step of generating summary data according to the data content of the file data;
A virtual file management step of associating and storing the summary data and file specifying data for specifying the file data from which the summary data is generated as virtual file data corresponding to the file data;
A file management method characterized by comprising:
前記コンピュータが前記ファイルデータに対する操作処理を検知するファイル操作検知工程を有し、
このファイル操作検知工程による検知結果に応じて、前記要約データ生成工程及び前記仮想ファイル管理工程が作動する、
ことを特徴とする請求項10記載のファイル管理方法。
The computer has a file operation detection step of detecting operation processing on the file data;
The summary data generation step and the virtual file management step operate according to the detection result of the file operation detection step.
The file management method according to claim 10.
前記仮想ファイル管理工程の前に、前記ファイル操作検知工程にて検知した前記ファイルデータに対する操作処理が変更又は削除である場合に、前記コンピュータが、当該ファイルデータに対応する既存の前記仮想ファイルデータを削除する仮想ファイル削除工程を有する、
ことを特徴とする請求項11記載のファイル管理方法。
Before the virtual file management step, when the operation processing for the file data detected in the file operation detection step is change or deletion, the computer deletes the existing virtual file data corresponding to the file data. Having a virtual file deletion step to delete,
12. The file management method according to claim 11, wherein:
前記コンピュータが、時間的に前後してそれぞれ記憶された前記仮想ファイルデータを比較して、その比較結果に基づいて前記仮想ファイルデータに対応する前記ファイルデータのバックアップ処理を行うバックアップ工程を有する、
ことを特徴とする請求項10,11又は12記載のファイル管理方法。
The computer has a backup step of comparing the virtual file data stored before and after the time, and performing a backup process of the file data corresponding to the virtual file data based on the comparison result,
The file management method according to claim 10, 11 or 12.
所定の記憶装置に記憶されたファイルデータを管理するコンピュータに、
前記ファイルデータのデータ内容に応じた要約データを生成する要約データ生成手段と、
前記要約データと、当該要約データが生成された前記ファイルデータを特定するファイル特定データと、を関連付けて当該ファイルデータに対応する仮想ファイルデータとして記憶する仮想ファイル管理手段と、
を実現させるためのプログラム。
In a computer that manages file data stored in a predetermined storage device,
Summary data generation means for generating summary data according to the data content of the file data;
Virtual file management means for associating and storing the summary data and file specifying data for specifying the file data for which the summary data was generated as virtual file data corresponding to the file data;
A program to realize
前記コンピュータに、前記ファイルデータに対する操作処理を検知するファイル操作検知手段を実現すると共に、
前記要約データ生成手段及び前記仮想ファイル管理手段は、前記ファイル操作検知手段の検知結果に応じて作動する、
ことを特徴とする請求項14記載のプログラム。
Realizing a file operation detecting means for detecting an operation process for the file data in the computer,
The summary data generation unit and the virtual file management unit operate according to a detection result of the file operation detection unit.
15. The program according to claim 14, wherein:
前記コンピュータに、前記ファイル操作検知手段にて検知した前記ファイルデータに対する操作処理が変更又は削除である場合に、当該ファイルデータに対応する既存の前記仮想ファイルデータを削除する仮想ファイル削除手段、を実現させるための請求項15記載のプログラム。   Realizing a virtual file deletion unit that deletes the existing virtual file data corresponding to the file data when the operation processing on the file data detected by the file operation detection unit is changed or deleted in the computer The program according to claim 15 for causing the program to occur. 前記コンピュータに、時間的に前後する前記仮想ファイルデータを比較して、その比較結果に基づいて前記仮想ファイルデータに対応する前記ファイルデータのバックアップ処理を行うバックアップ手段、を実現させるための請求項14,15又は16記載のプログラム。   15. The backup means for comparing the virtual file data that changes in time with the computer and performing backup processing of the file data corresponding to the virtual file data based on the comparison result. , 15 or 16 program.
JP2007072338A 2007-03-20 2007-03-20 File management system, method and program Expired - Fee Related JP4765968B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007072338A JP4765968B2 (en) 2007-03-20 2007-03-20 File management system, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007072338A JP4765968B2 (en) 2007-03-20 2007-03-20 File management system, method and program

Publications (2)

Publication Number Publication Date
JP2008234269A true JP2008234269A (en) 2008-10-02
JP4765968B2 JP4765968B2 (en) 2011-09-07

Family

ID=39906968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007072338A Expired - Fee Related JP4765968B2 (en) 2007-03-20 2007-03-20 File management system, method and program

Country Status (1)

Country Link
JP (1) JP4765968B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101092342B1 (en) * 2009-08-13 2011-12-09 주식회사 안철수연구소 File summary information generating, signature generating apparatus and signature pattern inspecting apparatus and method
JP7452840B2 (en) 2020-02-10 2024-03-19 Necソリューションイノベータ株式会社 Information processing method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126639A (en) * 2002-09-30 2004-04-22 Toshiba Corp Data management system, method and program
JP2005196582A (en) * 2004-01-08 2005-07-21 Nippon Joho Create Kk Data backup system, and data backup method
JP2005202918A (en) * 2003-12-15 2005-07-28 Noboru Ikuta Mobile terminal data management system utilizing network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126639A (en) * 2002-09-30 2004-04-22 Toshiba Corp Data management system, method and program
JP2005202918A (en) * 2003-12-15 2005-07-28 Noboru Ikuta Mobile terminal data management system utilizing network
JP2005196582A (en) * 2004-01-08 2005-07-21 Nippon Joho Create Kk Data backup system, and data backup method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101092342B1 (en) * 2009-08-13 2011-12-09 주식회사 안철수연구소 File summary information generating, signature generating apparatus and signature pattern inspecting apparatus and method
JP7452840B2 (en) 2020-02-10 2024-03-19 Necソリューションイノベータ株式会社 Information processing method

Also Published As

Publication number Publication date
JP4765968B2 (en) 2011-09-07

Similar Documents

Publication Publication Date Title
US11500897B2 (en) Allocation and reassignment of unique identifiers for synchronization of content items
JP5697754B2 (en) Computer system, file management method, and metadata server
US9870151B1 (en) Backup time deduplication of common virtual disks from virtual machine backup images
US8572039B2 (en) Focused backup scanning
US9864736B2 (en) Information processing apparatus, control method, and recording medium
KR102187127B1 (en) Deduplication method using data association and system thereof
JP4670968B2 (en) Information management program and information management system
US11544150B2 (en) Method of detecting source change for file level incremental backup
JP2004302505A (en) Data migration support system, program, device, removable storage device, and discrimination method of storage medium in which data migration has been completed
US11086823B2 (en) File deduplication using signature information
CN111240892B (en) Data backup method and device
US11550913B2 (en) System and method for performing an antivirus scan using file level deduplication
CN110162429A (en) System repair, server and storage medium
US11507473B2 (en) System and method for efficient backup generation
JP5720366B2 (en) File management system and backup method
JP4765968B2 (en) File management system, method and program
WO2011124101A1 (en) Method and device for moving software
JP2000020367A (en) Information storing method, information storage device and recording medium
KR100897479B1 (en) Method for file backup
US10936550B2 (en) Synchronizing different representations of content
JP2008059036A (en) Data storage device and program
US11475159B2 (en) System and method for efficient user-level based deletions of backup data
JP2010033444A (en) File name change management system and file name change management program
JP2013033342A (en) Configuration information management device, configuration information management method, configuration information management program and storage medium

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

R150 Certificate of patent or registration of utility model

Ref document number: 4765968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees