JP7452840B2 - Information processing method - Google Patents

Information processing method Download PDF

Info

Publication number
JP7452840B2
JP7452840B2 JP2020020543A JP2020020543A JP7452840B2 JP 7452840 B2 JP7452840 B2 JP 7452840B2 JP 2020020543 A JP2020020543 A JP 2020020543A JP 2020020543 A JP2020020543 A JP 2020020543A JP 7452840 B2 JP7452840 B2 JP 7452840B2
Authority
JP
Japan
Prior art keywords
information
path name
data
backup
data stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020020543A
Other languages
Japanese (ja)
Other versions
JP2021125181A (en
Inventor
政典 澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Priority to JP2020020543A priority Critical patent/JP7452840B2/en
Publication of JP2021125181A publication Critical patent/JP2021125181A/en
Application granted granted Critical
Publication of JP7452840B2 publication Critical patent/JP7452840B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理方法、情報処理装置、プログラムに関する。 The present invention relates to an information processing method, an information processing device, and a program.

ファイルシステム間においてファイル単位のバックアップを行うことがある。 File-by-file backup may be performed between file systems.

上記のようなバックアップは、例えば、UNIX(登録商標)における「rsync」コマンドやWindows(登録商標)における「robocopy」コマンドなどを用いて行うことが出来る。「rsync」コマンドや「robocopy」コマンドを用いる一例としては、例えば、特許文献1がある。また、「rsync」コマンドについて記載された文献としては、非特許文献1があり、「robocopy」コマンドについて記載された文献としては、非特許文献2がある。 The above-described backup can be performed using, for example, the "rsync" command in UNIX (registered trademark) or the "robocopy" command in Windows (registered trademark). An example of using the "rsync" command and the "robocopy" command is, for example, Patent Document 1. Additionally, there is Non-Patent Document 1 as a document describing the "rsync" command, and Non-Patent Document 2 as a document describing the "robocopy" command.

特開2012-83880号公報JP2012-83880A

rsync[online],[令和2年1月17日検索],インターネット<URL:https://rsync.samba.org/>rsync [online], [searched on January 17, 2020], Internet <URL: https://rsync.samba.org/> Microsoft[online],[令和2年1月17日検索],インターネット<URL:https://docs.microsoft.com/ja-jp/windows-server/administration/windows-commands/robocopy>Microsoft [online], [searched on January 17, 2020], Internet <URL: https://docs.microsoft.com/ja-jp/windows-server/administration/windows-commands/robocopy>

特許文献1、非特許文献1、非特許文献2に記載されているような「rsync」コマンドや「robocopy」コマンドを用いる方式では、バックアップ元ファイルのファイル名変更やディレクトリ変更のたびに、バックアップ先にファイルが存在しなくなるため、ファイルの削除と再コピーが発生していた。その結果、ファイル名やディレクトリ名を変更するだけで、バックアップ先領域のデータの削除・再コピーが発生し、バックアップ時間が無駄に遅くなる、という課題が生じていた。 In the method using the "rsync" command or "robocopy" command as described in Patent Document 1, Non-Patent Document 1, and Non-Patent Document 2, the backup destination is , the file no longer exists, causing the file to be deleted and copied again. As a result, simply changing a file name or directory name causes the data in the backup destination area to be deleted and re-copied, resulting in an unnecessary delay in backup time.

そこで、本発明の目的は、ファイル名やディレクトリ名の変更を行った際に、バックアップ時間が遅くなるおそれがある、という課題を解決する情報処理方法、情報処理装置、プログラムを提供することにある。 SUMMARY OF THE INVENTION Therefore, an object of the present invention is to provide an information processing method, an information processing device, and a program that solve the problem that backup time may be delayed when a file name or directory name is changed. .

かかる目的を達成するため本発明の一形態である情報処理方法は、
情報処理装置が、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、
バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、
取得した前記第1情報と前記第2情報とを照合し、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う
という構成をとる。
In order to achieve this purpose, an information processing method that is one form of the present invention includes:
The information processing device
Obtain first information that associates the path name of data stored in the backup destination area with unique information uniquely given to each data,
Obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data,
collating the acquired first information and the second information;
Before copying the data stored in the backup source area to the backup destination area, processing is performed based on the result of matching the path name of the data stored in the backup destination area.

また、本発明の他の形態である情報処理装置は、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部と、
前記取得部が取得した前記第1情報と前記第2情報とを照合する照合部と、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う前処理部と、
を有する
という構成をとる。
Further, an information processing device according to another embodiment of the present invention includes:
First information that associates the path name of data stored in the backup destination area with unique information uniquely given to each piece of data, and the path name of data stored in the backup source area and each piece of data. an acquisition unit that acquires unique information uniquely given to , and second information that associates the .
a collation unit that collates the first information and the second information acquired by the acquisition unit;
a preprocessing unit that performs processing based on a result of matching a path name of data stored in the backup destination area, before replicating the data stored in the backup source area to the backup destination area;
It has the following structure.

また、本発明の他の形態であるプログラムは、
情報処理装置に、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部と、
前記取得部が取得した前記第1情報と前記第2情報とを照合する照合部と、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う前処理部と、
を実現するためのプログラムである。
Further, a program which is another form of the present invention is
In the information processing device,
First information that associates the path name of data stored in the backup destination area with unique information uniquely given to each piece of data, and the path name of data stored in the backup source area and each piece of data. an acquisition unit that acquires unique information uniquely given to , and second information that associates the .
a collation unit that collates the first information and the second information acquired by the acquisition unit;
a preprocessing unit that performs processing based on a result of matching a path name of data stored in the backup destination area, before replicating the data stored in the backup source area to the backup destination area;
This is a program to achieve this.

本発明は、以上のように構成されることにより、ファイル名やディレクトリ名の変更を行った際に、バックアップ時間が遅くなるおそれがある、という課題を解決する情報処理方法、情報処理装置、プログラムを提供することが可能となる。 The present invention provides an information processing method, an information processing device, and a program configured as described above to solve the problem that backup time may be delayed when a file name or directory name is changed. It becomes possible to provide

本発明の第1の実施形態におけるシステム全体の構成の一例を示している。An example of the overall system configuration according to the first embodiment of the present invention is shown. 図1で示すバックアップ元装置の構成の一例を示すブロック図である。2 is a block diagram showing an example of the configuration of the backup source device shown in FIG. 1. FIG. インデックスLの一例を示す図である。It is a figure showing an example of index L. インデックスBの一例を示す図である。It is a figure showing an example of index B. インデックス照合部による照合処理の一例を説明するための図である。FIG. 6 is a diagram for explaining an example of matching processing by an index matching unit. 前処理部による前処理の一例を説明するための図である。FIG. 3 is a diagram for explaining an example of preprocessing by a preprocessing section. バックアップ先装置の構成の一例を示すブロック図である。FIG. 2 is a block diagram showing an example of the configuration of a backup destination device. 本発明の第1の実施形態におけるバックアップ元装置の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation of a backup source device in a 1st embodiment of the present invention. 本発明の第2の実施形態における情報処理装置のハードウェア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of the hardware configuration of an information processing device according to a second embodiment of the present invention. 本発明の第2の実施形態における情報処理装置の構成の一例を示すブロック図である。It is a block diagram showing an example of composition of an information processing device in a 2nd embodiment of the present invention.

[第1の実施形態]
本発明の第1の実施形態を図1から図8までを参照して説明する。図1は、本発明の第1の実施形態におけるシステム全体の構成の一例を示している。図2は、バックアップ元装置100の構成の一例を示しブロック図である。図3は、インデックスLの一例を示す図である。図4は、インデックスBの一例を示す図である。図5は、インデックス照合部120による照合処理の一例を説明するための図である。図6は、前処理部130による前処理の一例を説明するための図である。図7は、バックアップ先装置200の構成の一例を示すブロック図である。図8は、バックアップ元装置100の動作の一例を示すフローチャートである。
[First embodiment]
A first embodiment of the present invention will be described with reference to FIGS. 1 to 8. FIG. 1 shows an example of the overall system configuration in the first embodiment of the present invention. FIG. 2 is a block diagram showing an example of the configuration of the backup source device 100. FIG. 3 is a diagram showing an example of the index L. FIG. 4 is a diagram showing an example of index B. FIG. 5 is a diagram for explaining an example of a matching process by the index matching unit 120. FIG. 6 is a diagram for explaining an example of preprocessing by the preprocessing section 130. FIG. 7 is a block diagram showing an example of the configuration of the backup destination device 200. FIG. 8 is a flowchart illustrating an example of the operation of the backup source device 100.

本発明の第1の実施形態においては、バックアップ元からバックアップ先へファイルコピーを行うシステムについて説明する。後述するように、バックアップ元装置100は、バックアップ元領域内ファイルのパス名、チェックサムに基づいて第2情報であるインデックスLを生成するとともに、バックアップ先領域内ファイルのパス名、チェックサムに基づいて第1情報であるインデックスBを生成する。また、バックアップ元装置100は、生成したインデックスLとインデックスBとを照合する。そして、バックアップ元装置100は、照合した結果に基づいて所定の前処理を行った後、上書きなしの条件でファイルコピーを行う。このように照合結果に基づく前処理を行っておくことで、バックアップ元装置100は、ファイル名やディレクトリ名の変更により無駄な削除・再コピーが生じることなどを抑制する。これにより、例えば、RAID、スナップショット、重複排除対応のストレージなどを導入しない場合でも、ファイル名やディレクトリ名の変更を行った際のバックアップ時間の遅延を抑制することが出来る。 In the first embodiment of the present invention, a system for copying files from a backup source to a backup destination will be described. As described later, the backup source device 100 generates an index L, which is second information, based on the path name and checksum of the file in the backup source area, and also generates an index L based on the path name and checksum of the file in the backup destination area. Then, index B, which is the first information, is generated. The backup source device 100 also checks the generated index L and index B. Then, the backup source device 100 performs predetermined preprocessing based on the collated results, and then performs file copying under the condition of no overwriting. By performing preprocessing based on the verification results in this manner, the backup source device 100 prevents unnecessary deletion and re-copying due to changes in file names and directory names. As a result, even if, for example, RAID, snapshot, deduplication storage, etc. are not introduced, it is possible to suppress delays in backup time when file names or directory names are changed.

図1は、システム全体の構成の一例を示している。図1を参照すると、システムは、例えば、バックアップ元装置100とバックアップ先装置200とを有している。図1で示すように、バックアップ元装置100とバックアップ先装置200とは、例えば、互いに通信可能なように接続されている。 FIG. 1 shows an example of the overall system configuration. Referring to FIG. 1, the system includes, for example, a backup source device 100 and a backup destination device 200. As shown in FIG. 1, the backup source device 100 and the backup destination device 200 are, for example, connected so that they can communicate with each other.

バックアップ元装置100は、ファイルなどのデータを記憶する情報処理装置である。バックアップ元装置100は、例えば、パーソナルコンピュータ、タブレット、スマートフォンなどであって構わない。 The backup source device 100 is an information processing device that stores data such as files. The backup source device 100 may be, for example, a personal computer, a tablet, a smartphone, or the like.

図2は、バックアップ元装置100の構成の一例を示している。図2を参照すると、バックアップ元装置100は、例えば、インデックス生成部110と、インデックス照合部120と、前処理部130と、ファイルコピー部140と、を有している。また、バックアップ元装置100は、記憶装置150を有している。記憶装置150に形成されたバックアップ元領域内には、バックアップ元領域内ファイル151が格納されている。 FIG. 2 shows an example of the configuration of the backup source device 100. Referring to FIG. 2, the backup source device 100 includes, for example, an index generation section 110, an index comparison section 120, a preprocessing section 130, and a file copy section 140. Furthermore, the backup source device 100 has a storage device 150. In the backup source area formed in the storage device 150, a backup source area file 151 is stored.

バックアップ元装置100は、例えば、CPU(Central Processing Unit)などの演算装置と、記憶装置と、を有している。例えば、バックアップ元装置100は、記憶装置に格納されたプログラムを演算装置が実行することで、上述した処理部を実現する。 The backup source device 100 includes, for example, a calculation device such as a CPU (Central Processing Unit) and a storage device. For example, the backup source device 100 implements the above-described processing unit by having a calculation device execute a program stored in a storage device.

インデックス生成部110は、記憶装置150に格納されたバックアップ元領域内ファイル151に基づいてインデックスLを生成する。また、インデックス生成部110は、後述する記憶装置220に格納されたバックアップ先領域内ファイル221に基づいてインデックスBを生成する。 The index generation unit 110 generates an index L based on the backup source intra-area file 151 stored in the storage device 150. Furthermore, the index generation unit 110 generates an index B based on a backup destination area file 221 stored in a storage device 220, which will be described later.

例えば、インデックス生成部110は、記憶装置150に形成されたバックアップ元領域内に格納された各バックアップ元領域内ファイル151のパス名と、ファイル内容に基づいて算出されるチェックサムと、を取得する。そして、インデックス生成部110は、取得したパス名、チェックサムに基づいて、インデックスLを生成する。 For example, the index generation unit 110 acquires the path name of each backup source area file 151 stored in the backup source area formed in the storage device 150 and the checksum calculated based on the file contents. . Then, the index generation unit 110 generates an index L based on the acquired path name and checksum.

図3は、インデックス生成部110が生成するインデックスLの一例を示している。図3を参照すると、インデックス生成部110が生成するインデックスLでは、ファイルのパス名と、ファイルのチェックサムと、が対応づけられている。例えば、図3の1行目は、パス名「/directoryA/directoryC/file.text」のファイルのチェックサムが「62」であることを示している。 FIG. 3 shows an example of the index L generated by the index generation unit 110. Referring to FIG. 3, in the index L generated by the index generation unit 110, a file path name and a file checksum are associated with each other. For example, the first line in FIG. 3 indicates that the checksum of the file with the path name "/directoryA/directoryC/file.text" is "62".

また、インデックス生成部110は、バックアップ先領域内ファイル221のパス名、チェックサムをバックアップ先装置200から取得する。そして、インデックス生成部110は、取得したパス名、チェックサムに基づいて、インデックスBを生成する。 The index generation unit 110 also acquires the path name and checksum of the file 221 in the backup destination area from the backup destination device 200. Then, the index generation unit 110 generates an index B based on the acquired path name and checksum.

図4は、インデックス生成部110が生成するインデックスBの一例を示している。図4を参照すると、インデックス生成部110が生成するインデックスBでは、インデックスLと同様に、ファイルのパス名と、ファイルのチェックサムと、が対応づけられている。例えば、図4の1行目は、パス名「/directoryA/directoryB/file.text」のファイルのチェックサムが「23」であることを示している。 FIG. 4 shows an example of the index B generated by the index generation unit 110. Referring to FIG. 4, in the index B generated by the index generation unit 110, similarly to the index L, the path name of the file and the checksum of the file are associated with each other. For example, the first line in FIG. 4 indicates that the checksum of the file with the path name "/directoryA/directoryB/file.text" is "23".

なお、チェックサムは、ファイルの内容に基づいて予め算出されていても構わないし、例えば、インデックス生成部110がファイル内容に基づいて算出するよう構成しても構わない。また、インデックス生成部110は、バックアップ先装置200で生成されたインデックスBを受信するよう構成しても構わない。つまり、インデックス生成部110は、外部装置で生成されたインデックスBを受信するよう構成されていても構わない。 Note that the checksum may be calculated in advance based on the contents of the file, or may be configured such that the index generation unit 110 calculates it based on the contents of the file, for example. Furthermore, the index generation unit 110 may be configured to receive the index B generated by the backup destination device 200. That is, the index generation unit 110 may be configured to receive the index B generated by an external device.

インデックス照合部120は、インデックス生成部110が生成したインデックスLとインデックスBとを照合する。例えば、インデックス照合部120は、インデックスBに含まれるパス名、チェックサムの組み合わせごとに、同一のパス名、チェックサムがインデックスLに含まれるか否か確認することで上記照合を行う。 The index matching unit 120 matches the index L generated by the index generating unit 110 and the index B. For example, the index matching unit 120 performs the above matching by checking, for each combination of path name and checksum included in index B, whether the same path name and checksum are included in index L.

図5は、インデックス照合部120による照合処理の一例を示している。例えば、図5を参照すると、インデックス照合部120は、インデックスBに含まれる組み合わせパス名「/directoryA/directoryB/file.txt」チェックサム「23」について、同一のパス名やチェックサムがインデックスLに含まれるか否か確認する。図5で示す場合、インデックスLには、パス名「/directoryA/directoryB/file.txt」もチェックサム「23」も含まれていない。そのため、インデックス照合部120は、パス名「/directoryA/directoryB/file.txt」チェックサム「23」の組み合わせについて、チェックサム一致数が0であり、パス名一致数も0であると判断する。 FIG. 5 shows an example of a matching process by the index matching unit 120. For example, referring to FIG. 5, the index matching unit 120 determines that for the combination path name "/directoryA/directoryB/file.txt" checksum "23" included in index B, the same path name or checksum is in index L. Check whether it is included. In the case shown in FIG. 5, the index L does not include the path name "/directoryA/directoryB/file.txt" nor the checksum "23". Therefore, the index matching unit 120 determines that for the combination of path name "/directoryA/directoryB/file.txt" and checksum "23", the number of checksum matches is 0, and the number of path name matches is also 0.

同様に、インデックス照合部120は、インデックスBに含まれる組み合わせパス名「/directoryA/directoryC/file.txt」チェックサム「40」について、同一のパス名やチェックサムがインデックスLに含まれるか否か確認する。図5で示す場合、インデックスLには、パス名「/directoryA/directoryC/file.txt」が含まれており、チェックサム「40」は含まれていない。そのため、インデックス照合部120は、パス名「/directoryA/directory/file.txt」チェックサム「40」の組み合わせについて、チェックサム一致数が0であり、パス名一致数が1であると判断する。 Similarly, the index matching unit 120 determines whether or not the same path name and checksum are included in index L regarding the combination path name "/directoryA/directoryC/file.txt" checksum "40" included in index B. confirm. In the case shown in FIG. 5, index L includes the path name "/directoryA/directoryC/file.txt" and does not include the checksum "40". Therefore, the index matching unit 120 determines that the number of checksum matches is 0 and the number of path name matches is 1 for the combination of path name "/directoryA/directory/file.txt" and checksum "40".

同様に、インデックス照合部120は、インデックスBに含まれる組み合わせパス名「/directoryD/directoryE/file.txt」チェックサム「55」について、同一のパス名やチェックサムがインデックスLに含まれるか否か確認する。図5で示す場合、インデックスLには、チェックサム「55」が含まれており、パス名「/directoryD/directoryE/file.txt」は含まれていない。そのため、インデックス照合部120は、パス名「/directoryD/directoryE/file.txt」チェックサム「55」の組み合わせについて、チェックサム一致数が1であり、パス名一致数が0であると判断する。 Similarly, the index matching unit 120 determines whether or not the same path name and checksum are included in the index L for the combination path name "/directoryD/directoryE/file.txt" checksum "55" included in the index B. confirm. In the case shown in FIG. 5, the index L includes the checksum "55" and does not include the path name "/directoryD/directoryE/file.txt". Therefore, the index matching unit 120 determines that the number of checksum matches is 1 and the number of path name matches is 0 for the combination of path name "/directoryD/directoryE/file.txt" and checksum "55".

同様に、インデックス照合部120は、インデックスBに含まれる組み合わせパス名「/directoryF/directoryG/file.txt」チェックサム「77」について、同一のパス名やチェックサムがインデックスLに含まれるか否か確認する。図5で示す場合、インデックスLには、パス名「/directoryF/directoryG/file.txt」が含まれており、チェックサム「77」も含まれている。そのため、インデックス照合部120は、パス名「/directoryF/directoryG/file.txt」チェックサム「77」の組み合わせについて、チェックサム一致数が1であり、パス名一致数が1であると判断する。 Similarly, the index matching unit 120 determines whether or not the same path name and checksum are included in the index L for the combination path name "/directoryF/directoryG/file.txt" checksum "77" included in the index B. confirm. In the case shown in FIG. 5, index L includes the path name "/directoryF/directoryG/file.txt" and also includes the checksum "77". Therefore, the index matching unit 120 determines that the number of checksum matches is 1 and the number of path name matches is 1 for the combination of path name "/directoryF/directoryG/file.txt" and checksum "77".

同様に、インデックス照合部120は、インデックスBに含まれる組み合わせパス名「/directoryH/directoryI/file.txt」チェックサム「13」について、同一のパス名やチェックサムがインデックスLに含まれるか否か確認する。図5で示す場合、インデックスLには、チェックサム「13」が2つ含まれており、パス名「/directoryH/directoryI/file.txt」は含まれていない。そのため、インデックス照合部120は、パス名「/directoryH/directoryI/file.txt」チェックサム「13」の組み合わせについて、チェックサム一致数が2であり、パス名一致数が0であると判断する。 Similarly, the index matching unit 120 determines whether or not the same path name and checksum are included in the index L for the combination path name "/directoryH/directoryI/file.txt" checksum "13" included in the index B. confirm. In the case shown in FIG. 5, the index L includes two checksums "13" and does not include the path name "/directoryH/directoryI/file.txt". Therefore, the index matching unit 120 determines that the number of checksum matches is 2 and the number of path name matches is 0 for the combination of path name "/directoryH/directoryI/file.txt" and checksum "13".

同様に、インデックス照合部120は、インデックスBに含まれる組み合わせパス名「/directoryA/directoryH/file.txt」チェックサム「39」について、同一のパス名やチェックサムがインデックスLに含まれるか否か確認する。図5で示す場合、インデックスLには、パス名「/directoryA/directoryH/file.txt」が含まれており、チェックサム「39」は2つ含まれている。そのため、インデックス照合部120は、パス名「/directoryA/directoryH/file.txt」チェックサム「39」の組み合わせについて、チェックサム一致数が2であり、パス名一致数が1であると判断する。 Similarly, the index matching unit 120 determines whether or not the same path name and checksum are included in index L regarding the combination path name "/directoryA/directoryH/file.txt" checksum "39" included in index B. confirm. In the case shown in FIG. 5, index L includes a path name "/directoryA/directoryH/file.txt" and two checksums "39". Therefore, the index matching unit 120 determines that the number of checksum matches is 2 and the number of path name matches is 1 for the combination of path name "/directoryA/directoryH/file.txt" and checksum "39".

例えば、以上説明したように、インデックス照合部120は、インデックスBに含まれるパス名、チェックサムの組み合わせごとに、同一のパス名、チェックサムがインデックスLに含まれるか否か確認することで、インデックスLとインデックスBとの照合を行う。換言すると、インデックス照合部120は、インデックスBに含まれるパス名、チェックサムの組み合わせごとに、インデックスLと照合することで、パス名が一致する数を示すパス名一致数とチェックサムが一致する数を示すチェックサム一致数とを確認する。 For example, as explained above, for each combination of path name and checksum included in index B, the index matching unit 120 checks whether the same path name and checksum are included in index L. Index L and index B are compared. In other words, by comparing each combination of path name and checksum included in index B with index L, the index matching unit 120 matches the checksum with the number of path name matches indicating the number of matching path names. Check the checksum match count.

前処理部130は、インデックス照合部120による照合の結果に応じた処理を行う。例えば、前処理部130は、バックアップ先領域に格納されたバックアップ先領域内ファイル221のパス名に対する照合結果に応じた処理を行う。なお、前処理部130による処理は、ファイルコピー部140によるファイルコピーの前に行われる。 The preprocessing unit 130 performs processing according to the result of the matching by the index matching unit 120. For example, the preprocessing unit 130 performs processing according to the result of matching the path name of the file 221 in the backup destination area stored in the backup destination area. Note that the processing by the preprocessing unit 130 is performed before the file copying unit 140 copies the file.

例えば、前処理部130は、インデックス照合部120がチェックサム一致数0、パス名一致数0と判断、または、チェックサム一致数0、パス名一致数1と判断したなど、チェックサム一致数0と判断した組み合わせがある場合、当該組み合わせに対応するバックアップ先領域内ファイル221をバックアップ先領域から削除する。例えば、図5で示す場合、パス名「/directoryA/directoryB/file.txt」チェックサム「23」の組み合わせは、チェックサム一致数0、パス名一致数0の組み合わせである。また、図5で示す場合、パス名「/directoryA/directoryC/file.txt」チェックサム「40」の組み合わせは、チェックサム一致数0、パス名一致数1の組み合わせである。従って、前処理部130は、図6で示すように、パス名「/directoryA/directoryB/file.txt」チェックサム「23」の組み合わせと、「/directoryA/directoryC/file.txt」チェックサム「40」の組み合わせに対応するバックアップ先領域内ファイル221をバックアップ先領域から削除する。このように、前処理部130は、インデックス照合部120によりチェックサム一致数が0であると判断された組み合わせに対応するバックアップ先領域内ファイル221をバックアップ先領域から削除する。 For example, the preprocessing unit 130 determines that the number of checksum matches is 0, such as when the index matching unit 120 determines that the number of checksum matches is 0 and the number of path name matches is 0, or that the number of checksum matches is 0 and the number of path name matches is 1. If there is a combination determined as such, the file 221 in the backup destination area corresponding to the combination is deleted from the backup destination area. For example, in the case shown in FIG. 5, the combination of path name "/directoryA/directoryB/file.txt" and checksum "23" is a combination of 0 checksum matches and 0 path name matches. Further, in the case shown in FIG. 5, the combination of the path name "/directoryA/directoryC/file.txt" and the checksum "40" is a combination of the number of checksum matches: 0 and the number of path name matches: 1. Therefore, as shown in FIG. ” is deleted from the backup destination area. In this manner, the preprocessing unit 130 deletes the files 221 in the backup destination area that correspond to the combinations for which the number of checksum matches is determined to be 0 by the index matching unit 120 from the backup destination area.

また、例えば、前処理部130は、インデックス照合部120がチェックサム一致数1、パス名一致数0と判断した組み合わせがある場合、当該組み合わせに対応するバックアップ先領域内ファイル221を、バックアップ先領域においてインデックスLのパスにファイル移動する。例えば、図5で示す場合、パス名「/directoryD/directoryE/file.txt」チェックサム「55」の組み合わせは、チェックサム一致数1、パス名一致数0の組み合わせである。従って、前処理部130は、図6で示すように、パス名「/directoryD/directoryE/file.txt」チェックサム「55」の組み合わせに対応するバックアップ先領域内ファイル221を、対応するインデックスLのパスとなるようにファイル移動する。つまり、前処理部130は、インデックスLにおけるチェックサム「55」のパス名「/directoryD/directoryZ/file.txt」が示すパスとなるようにファイル移動する。 For example, if there is a combination in which the index matching unit 120 determines that the number of checksum matches is 1 and the number of path name matches is 0, the preprocessing unit 130 transfers the file 221 in the backup destination area corresponding to the combination to the backup destination area. , the file is moved to the path of index L. For example, in the case shown in FIG. 5, the combination of path name "/directoryD/directoryE/file.txt" and checksum "55" is a combination of 1 checksum match and 0 path name match. Therefore, as shown in FIG. 6, the preprocessing unit 130 stores the file 221 in the backup destination area corresponding to the combination of path name "/directoryD/directoryE/file.txt" and checksum "55" with the corresponding index L. Move the file to match the path. In other words, the preprocessing unit 130 moves the file to the path indicated by the path name "/directoryD/directoryZ/file.txt" of the checksum "55" in the index L.

また、例えば、前処理部130は、インデックス照合部120がチェックサム一致数1、パス名一致数1と判断した組み合わせがある場合、当該組み合わせに対応するバックアップ先領域内ファイル221に対して何らかの前処理を行わない。例えば、図5で示す場合、パス名「/directoryF/directoryG/file.txt」チェックサム「77」の組み合わせは、チェックサム一致数1、パス名一致数1の組み合わせである。従って、前処理部130は、図6で示すように、パス名「/directoryF/directoryG/file.txt」チェックサム「77」の組み合わせに対応するバックアップ先領域内ファイル221をそのままにする。 For example, if there is a combination in which the index matching unit 120 determines that the number of checksum matches is 1 and the number of path name matches is 1, the preprocessing unit 130 performs some preprocessing on the file 221 in the backup destination area corresponding to the combination. No processing is performed. For example, in the case shown in FIG. 5, the combination of path name "/directoryF/directoryG/file.txt" and checksum "77" is a combination of 1 checksum match and 1 path name match. Therefore, as shown in FIG. 6, the preprocessing unit 130 leaves the backup destination area file 221 corresponding to the combination of path name "/directoryF/directoryG/file.txt" and checksum "77" as is.

また、例えば、前処理部130は、インデックス照合部120がチェックサム一致数2、パス名一致数0と判断した組み合わせがあるなど、チェックサム一致数が複数ある組合せがある場合、当該組み合わせに対応するバックアップ先領域内ファイル221をバックアップ先領域内で閉じた処理として複製した後、パスの変更を行う。例えば、図5で示す場合、パス名「/directoryH/directoryI/file.txt」チェックサム「13」の組み合わせは、チェックサム一致数2、パス名一致数0の組み合わせである。従って、前処理部130は、図6で示すように、パス名「/directoryH/directoryI/file.txt」チェックサム「13」の組み合わせに対応するバックアップ先領域内ファイル221を、バックアップ先領域において複製する。そして、前処理部130は、複製した各バックアップ先領域内ファイル221が対応するインデックスLのパスとなるようにファイル移動する。例えば、図6で示す場合、前処理部130は、一方のバックアップ先領域内ファイル221のパス名が「/directoryA/directoryZ/file.txt」となるようにファイル移動するとともに、他方のバックアップ先領域内ファイル221のパス名が「/directoryA/directoryY/file.txt」となるようにファイル移動する。このように、前処理部130は、チェックサム一致数が複数ありパス名一致数が0である場合、チェックサム一致数に応じた複製処理を行うとともに、インデックスLに含まれる複数のパス名に応じたファイル移動処理を行う。 For example, if there is a combination in which there is a plurality of checksum matches, such as a combination in which the index matching unit 120 determines that the number of checksum matches is 2 and the number of path name matches is 0, the preprocessing unit 130 handles the combination. After copying the file 221 in the backup destination area as a closed process within the backup destination area, the path is changed. For example, in the case shown in FIG. 5, the combination of path name "/directoryH/directoryI/file.txt" and checksum "13" is a combination of 2 checksum matches and 0 path name matches. Therefore, as shown in FIG. 6, the preprocessing unit 130 copies the file 221 in the backup destination area corresponding to the combination of path name "/directoryH/directoryI/file.txt" and checksum "13" in the backup destination area. do. Then, the preprocessing unit 130 moves the files so that each replicated file 221 in the backup destination area becomes the path of the corresponding index L. For example, in the case shown in FIG. 6, the preprocessing unit 130 moves the file 221 in one backup destination area so that the path name becomes "/directoryA/directoryZ/file.txt", and moves the file 221 in the other backup destination area. The file is moved so that the path name of the internal file 221 becomes "/directoryA/directoryY/file.txt". In this way, if there is a plurality of checksum matches and the number of path name matches is 0, the preprocessing unit 130 performs the duplication process according to the number of checksum matches, and also performs duplication processing on the multiple path names included in the index L. Perform file movement processing accordingly.

また、例えば、前処理部130は、インデックス照合部120がチェックサム一致数2、パス名一致数1と判断した組み合わせがある場合、当該組み合わせに対応するバックアップ先領域内ファイル221を、バックアップ先領域内で閉じた処理として複製した後、パスの変更を行う。例えば、図5で示す場合、パス名「/directoryA/directoryH/file.txt」チェックサム「39」の組み合わせは、チェックサム一致数2、パス名一致数1の組み合わせである。従って、前処理部130は、図6で示すように、パス名「/directoryA/directoryH/file.txt」チェックサム「39」の組み合わせに対応するバックアップ先領域内ファイル221を、バックアップ先領域において複製する。そして、前処理部130は、複製したバックアップ先領域内ファイル221が対応するインデックスLのパスとなるようにファイル移動する。例えば、図6で示す場合、前処理部130は、複製の後、一方のバックアップ先領域内ファイル221のパス名が「/directoryJ/directoryJ/file.txt」となるようにファイル移動する。また、前処理部130は、パス名が一致しているバックアップ先領域内ファイル221についてはファイル移動しない。このように、前処理部130は、チェックサム一致数が複数ありパス名が一致するものもある場合、チェックサム一致数に応じた複製処理を行うとともに、インデックスLに含まれるパス名に応じたファイル移動処理をパス名が一致しないファイルに対して行う。 For example, if there is a combination in which the index matching unit 120 determines that the number of checksum matches is 2 and the number of path name matches is 1, the preprocessing unit 130 transfers the file 221 in the backup destination area corresponding to the combination to the backup destination area. After duplicating it as a closed process inside, change the path. For example, in the case shown in FIG. 5, the combination of path name "/directoryA/directoryH/file.txt" and checksum "39" is a combination of two checksum matches and one path name match. Therefore, as shown in FIG. 6, the preprocessing unit 130 copies the file 221 in the backup destination area corresponding to the combination of path name "/directoryA/directoryH/file.txt" and checksum "39" in the backup destination area. do. Then, the preprocessing unit 130 moves the file so that the copied file 221 in the backup destination area becomes the path of the corresponding index L. For example, in the case shown in FIG. 6, after duplication, the preprocessing unit 130 moves the file so that the path name of one of the files 221 in the backup destination area becomes "/directoryJ/directoryJ/file.txt." Furthermore, the preprocessing unit 130 does not move files 221 in the backup destination area that have matching path names. In this way, if there is a plurality of checksum matches and some of the path names match, the preprocessing unit 130 performs the duplication process according to the checksum match number, and also performs the duplication process according to the path name included in the index L. Perform file movement processing on files whose path names do not match.

例えば、前処理部130は、以上説明したように、インデックス照合部120による照合の結果に応じた処理を行う。つまり、前処理部130は、チェックサム一致数の方がパス名一致数よりも多い場合、照合結果に応じた処理として、少なくともパス名を変更するためのファイル移動処理を行う。また、前処理部130は、チェックサム一致数が複数ある場合、照合結果に応じた処理として、バックアップ先領域内で閉じた処理として複製する。 For example, the preprocessing unit 130 performs processing according to the result of the matching by the index matching unit 120, as described above. That is, when the number of checksum matches is greater than the number of path name matches, the preprocessing unit 130 performs at least a file movement process to change the path name as a process according to the matching result. Furthermore, when there is a plurality of checksum matching numbers, the preprocessing unit 130 copies the process as a closed process within the backup destination area as a process according to the matching result.

ファイルコピー部140は、前処理部130による処理の後、必要なファイルコピーを行う。例えば、ファイルコピー部140は、記憶装置150に形成されたバックアップ元領域からバックアップ先領域に対して、上書きなし(つまり、既存ファイルがあればコピーしない)条件で、ファイルコピーを実施する。上述したように前処理部130が前処理を行っているため、ファイルコピー部140は、前回のバックアップからファイルの内容が変更されたファイル、または、新規に作成されたファイルについて、ファイルコピーすることになる。 The file copy unit 140 performs necessary file copying after the processing by the preprocessing unit 130. For example, the file copy unit 140 performs file copying from a backup source area formed in the storage device 150 to a backup destination area under the condition that there is no overwriting (that is, no copying is made if there is an existing file). Since the preprocessing unit 130 performs the preprocessing as described above, the file copying unit 140 can perform file copying on files whose contents have been changed since the previous backup or on newly created files. become.

記憶装置150は、ディスク装置などの記憶装置である。記憶装置150には、バックアップ元領域が形成されている。図2で示すように、バックアップ元領域には、バックアップ元領域内ファイル151が格納されている。 The storage device 150 is a storage device such as a disk device. A backup source area is formed in the storage device 150. As shown in FIG. 2, a backup source area file 151 is stored in the backup source area.

以上が、バックアップ元装置100の構成の一例である。 The above is an example of the configuration of the backup source device 100.

バックアップ先装置200は、ファイルなどのデータを記憶する情報記憶装置である。バックアップ先装置200は、例えば、USB(Universal Serial Bus)メモリ、外付けハードディスク、ディスク装置などであって構わない。 The backup destination device 200 is an information storage device that stores data such as files. The backup destination device 200 may be, for example, a USB (Universal Serial Bus) memory, an external hard disk, a disk device, or the like.

図7は、バックアップ先装置200の構成の一例を示している。図7を参照すると、バックアップ先装置200は、データ制御部210を有している。また、バックアップ先装置200は、記憶装置220を有している。記憶装置220に形成されたバックアップ先領域内には、バックアップ先領域内ファイル221が格納されている。 FIG. 7 shows an example of the configuration of the backup destination device 200. Referring to FIG. 7, the backup destination device 200 has a data control unit 210. Further, the backup destination device 200 has a storage device 220. In the backup destination area formed in the storage device 220, a backup destination area file 221 is stored.

例えば、バックアップ先装置200は、CPUやコントローラIC(Integrated Circuit)などの演算装置と、記憶装置と、を有している。例えば、バックアップ先装置200は、記憶装置に格納されたプログラムを演算装置が実行することで、上述した処理部を実現する。 For example, the backup destination device 200 includes an arithmetic device such as a CPU or a controller IC (Integrated Circuit), and a storage device. For example, the backup destination device 200 implements the above-described processing unit by having a calculation device execute a program stored in a storage device.

データ制御部210は、バックアップ元装置100からの指示に基づいて、記憶装置220に格納されているバックアップ先領域内ファイル221を制御する。例えば、データ制御部210は、バックアップ元装置100からの指示に基づいて、記憶装置220に格納されているバックアップ先領域内ファイル221のコピーを行ったり、削除を行ったり、ファイル移動を行ったりする。 The data control unit 210 controls the backup destination area file 221 stored in the storage device 220 based on instructions from the backup source device 100. For example, the data control unit 210 copies, deletes, or moves files 221 in the backup destination area stored in the storage device 220 based on instructions from the backup source device 100. .

記憶装置220は、メモリ、ディスクなどの記憶装置である。記憶装置220には、バックアップ先領域が形成されている。図7で示すように、バックアップ先領域には、バックアップ先領域内ファイル221が格納されている。 The storage device 220 is a storage device such as a memory or a disk. A backup destination area is formed in the storage device 220. As shown in FIG. 7, a backup destination area file 221 is stored in the backup destination area.

以上が、バックアップ先装置200の構成の一例である。 The above is an example of the configuration of the backup destination device 200.

続いて、図8を参照して、バックアップ元からバックアップ先へファイルコピーを行う際のバックアップ元装置100の動作の一例について説明する。 Next, with reference to FIG. 8, an example of the operation of the backup source device 100 when copying a file from the backup source to the backup destination will be described.

図8を参照すると、バックアップ元装置100のインデックス生成部110は、バックアップ元領域内に格納されたバックアップ元領域内ファイル151のパス名、チェックサムに基づいて、インデックスLを生成する。また、インデックス生成部110は、バックアップ先領域内に格納されたバックアップ先領域内ファイル221のパス名、チェックサムに基づいて、インデックスBを生成する。このように、インデックス生成部110は、インデックスLとインデックスBを生成する(ステップS101)。 Referring to FIG. 8, the index generation unit 110 of the backup source device 100 generates an index L based on the path name and checksum of the backup source area file 151 stored in the backup source area. The index generation unit 110 also generates an index B based on the path name and checksum of the backup destination area file 221 stored in the backup destination area. In this way, the index generation unit 110 generates an index L and an index B (step S101).

インデックス照合部120は、インデックス生成部110が生成したインデックスLとインデックスBとを照合する(ステップS102)。例えば、インデックス照合部120は、インデックスBに含まれるパス名、チェックサムの組み合わせごとに、インデックスLと照合することで、パス名が一致する数を示すパス名一致数とチェックサムが一致する数を示すチェックサム一致数とを確認する。 The index matching unit 120 matches the index L generated by the index generating unit 110 and the index B (step S102). For example, by comparing each combination of path name and checksum included in index B with index L, the index matching unit 120 determines the number of path name matches indicating the number of matching path names and the number of matching checksums. Check the number of checksum matches indicating the number of matches.

前処理部130は、インデックス照合部120による照合の結果に応じた前処理を行う(ステップS103)。例えば、前処理部130は、パス名一致数とチェックサム一致数とに応じた前処理を行う。 The preprocessing unit 130 performs preprocessing according to the result of the matching by the index matching unit 120 (step S103). For example, the preprocessing unit 130 performs preprocessing depending on the number of path name matches and the number of checksum matches.

ファイルコピー部140は、前処理部130による処理の後、必要なファイルコピーを行う(ステップS104)。例えば、ファイルコピー部140は、記憶装置150に形成されたバックアップ元領域からバックアップ先領域に対して、上書きなし(つまり、既存ファイルがあればコピーしない)条件で、ファイルコピーを実施する。 After the processing by the preprocessing unit 130, the file copying unit 140 performs necessary file copying (step S104). For example, the file copy unit 140 performs file copying from a backup source area formed in the storage device 150 to a backup destination area under the condition that there is no overwriting (that is, no copying is made if there is an existing file).

以上が、バックアップ元からバックアップ先へファイルコピーを行う際のバックアップ元装置100の動作の一例である。 The above is an example of the operation of the backup source device 100 when copying a file from the backup source to the backup destination.

このように、バックアップ元装置100は、インデックス照合部120と、前処理部130と、ファイルコピー部140と、を有している。このような構成により、ファイルコピー部140は、インデックス照合部120による照合の結果に応じて前処理部130が前処理を行った後に、必要なファイルコピーを行うことが出来る。その結果、前処理としてファイル移動などを事前に行うことが可能となり、ファイル名やディレクトリ名の変更を行った際に生じるファイル削除・コピーを抑制することが可能となる。これにより、バックアップ時間が遅くなるおそれがある、という課題を解決することが出来る。 In this way, the backup source device 100 includes an index matching section 120, a preprocessing section 130, and a file copying section 140. With such a configuration, the file copy unit 140 can perform necessary file copying after the preprocessing unit 130 performs preprocessing according to the result of the verification by the index verification unit 120. As a result, it becomes possible to perform file movement etc. in advance as pre-processing, and it becomes possible to suppress file deletion and copying that would occur when a file name or directory name is changed. This makes it possible to solve the problem that backup time may be delayed.

具体的には、例えば、前処理部130は、チェックサム一致数が1でありパス名一致数が0である場合、前処理として、インデックスLのパスにファイル移動するよう構成されている。このように前処理を行っておくと、例えば、前回バックアップ実施後にパス名だけを変更した際などにおいて、無駄にファイルを削除して無駄なファイルコピーが生じる事態を抑制することが出来る。 Specifically, for example, if the number of checksum matches is 1 and the number of path name matches is 0, the preprocessing unit 130 is configured to move the file to the path with index L as preprocessing. By performing preprocessing in this way, it is possible to prevent unnecessary file deletion and unnecessary file copying, for example, when only the path name is changed after the previous backup.

また、例えば、前処理部130は、チェックサム一致数が複数ある場合、バックアップ先領域内に閉じた処理として対象ファイルを複製した後、必要に応じてインデックスLのパスにファイル移動するよう構成されている。このように前処理を行っておくと、転送処理を抑制することが可能となり、バックアップ時間を高速にすることが可能となる。 Further, for example, if there is a plurality of checksum matches, the preprocessing unit 130 is configured to copy the target file in the backup destination area as a closed process, and then move the file to the path of index L as necessary. ing. By performing preprocessing in this way, it becomes possible to suppress transfer processing, and it becomes possible to speed up the backup time.

なお、ファイルコピー部140は、ファイルコピーを行う際に、インデックスLなどを活用しても構わない。例えば、インデックスLにチェックサムが同一のファイルが複数含まれる場合、ファイルコピー部140は、バックアップ先領域に対して1つのファイルを転送した後、バックアップ先領域内で閉じた処理として、必要な分転送したファイルを複製するよう構成しても構わない。 Note that the file copying unit 140 may utilize the index L or the like when performing file copying. For example, if index L includes multiple files with the same checksum, the file copy unit 140 transfers one file to the backup destination area and then closes the file in the backup destination area as needed. It may also be configured to duplicate transferred files.

また、本実施形態においては、ファイル(データ)ごとに一意に与えられるユニークな情報としてチェックサムを用いる場合について説明した。しかしながら、本発明は、例えば、ファイルの更新日時などの時刻ベースの識別子をチェックサムの代わりに用いるよう構成しても構わない。このように、ユニーク情報は、本実施形態において説明した以外の情報であっても構わない。 Furthermore, in this embodiment, a case has been described in which a checksum is used as unique information uniquely given to each file (data). However, the present invention may be configured to use a time-based identifier such as the date and time of a file update instead of the checksum. In this way, the unique information may be information other than that described in this embodiment.

また、システムの構成は、本実施形態において説明した場合に限定されない。例えば、バックアップ元装置100は、複数台の情報処理装置から構成されても構わない。また、バックアップ元装置100は、例えば、外部装置が生成したインデックスLとインデックスBを取得して照合するなど、本実施形態で説明した機能のうちの一部のみを有していても構わない。 Furthermore, the configuration of the system is not limited to that described in this embodiment. For example, the backup source device 100 may be composed of a plurality of information processing devices. Further, the backup source device 100 may have only some of the functions described in this embodiment, such as acquiring and comparing index L and index B generated by an external device.

また、前処理部130は、バックアップ先領域内ファイル221をバックアップ先領域から削除する際、削除する処理の代わりに、当該ファイルに削除フラグを追加する、または、当該ファイルを世代前フォルダなどの他のフォルダに移動させる、処理などを行うよう構成しても構わない。例えば、/directoryZ/file.txtが削除対象のファイルであるとする。この場合、前処理部130は、例えば、上記ファイル(/directoryZ/file.txt)を削除せず、/bak_2019-10-10-12-00-00/directoryZ/file.txtなどに移動させるよう構成することが出来る。上記のように構成することで、例えば、世代前ファイルを入手したい場合に、削除フラグ付きまたは世代前フォルダ内のファイルをバックアップ先からバックアップ元にコピーすることで、世代前のファイルに復元することが可能となる。なお、上記のように構成する場合、バックアップ元装置100などは、バックアップ先領域の容量に基づいて、削除フラグが追加されているファイルや世代前フォルダ中のファイルなどを削除するよう構成しても構わない。 Further, when deleting the file 221 in the backup destination area from the backup destination area, the preprocessing unit 130 adds a deletion flag to the file instead of deleting the file 221, or deletes the file from a folder such as a previous generation folder. It may be configured to move the file to a folder or perform processing. For example, assume that /directoryZ/file.txt is the file to be deleted. In this case, the preprocessing unit 130 is configured to, for example, not delete the above file (/directoryZ/file.txt) but move it to /bak_2019-10-10-12-00-00/directoryZ/file.txt. You can. With the above configuration, for example, if you want to obtain a previous generation file, you can restore it to the previous generation file by copying the file with a deletion flag or in the previous generation folder from the backup destination to the backup source. becomes possible. Note that when configured as described above, the backup source device 100 etc. may be configured to delete files to which a deletion flag has been added, files in the previous generation folder, etc. based on the capacity of the backup destination area. I do not care.

また、例えば、本実施形態において説明したシステムにリストア機能を追加する場合などにおいて、バックアップ先領域で同じチェックサムかつパス名不一致のファイルについて、重複排除的に処理するよう構成しても構わない。例えば、前処理部130は、チェックサムが一致するファイルを重複してバックアップ先領域に記憶しないように、重複排除処理を行うことが出来る。 Further, for example, when a restore function is added to the system described in this embodiment, files with the same checksum and mismatched path names in the backup destination area may be processed in a deduplication manner. For example, the preprocessing unit 130 can perform deduplication processing so that files with matching checksums are not stored redundantly in the backup destination area.

[第2の実施形態]
次に、本発明の第2の実施形態について、図9、図10を参照して説明する。図9、図10は、ストレージ装置500の構成の一例を示している。
[Second embodiment]
Next, a second embodiment of the present invention will be described with reference to FIGS. 9 and 10. 9 and 10 show an example of the configuration of the storage device 500.

図9は、情報処理装置300のハードウェア構成の一例を示している。図9を参照すると、情報処理装置300は、1台又は複数台の情報処理装置にて構成されており、一例として、以下のようなハードウェア構成を有している。
・CPU(Central Processing Unit)301(演算装置)
・ROM(Read Only Memory)302(記憶装置)
・RAM(Random Access Memory)303(記憶装置)
・RAM303にロードされるプログラム群304
・プログラム群304を格納する記憶装置305
・情報処理装置外部の記録媒体310の読み書きを行うドライブ装置306
・情報処理装置外部の通信ネットワーク311と接続する通信インタフェース307
・データの入出力を行う入出力インタフェース308
・各構成要素を接続するバス309
FIG. 9 shows an example of the hardware configuration of the information processing device 300. Referring to FIG. 9, the information processing device 300 is composed of one or more information processing devices, and has the following hardware configuration as an example.
・CPU (Central Processing Unit) 301 (arithmetic unit)
・ROM (Read Only Memory) 302 (storage device)
・RAM (Random Access Memory) 303 (storage device)
- Program group 304 loaded into RAM 303
- Storage device 305 that stores the program group 304
- A drive device 306 that reads and writes from and to a recording medium 310 external to the information processing device
- A communication interface 307 that connects to a communication network 311 outside the information processing device
- Input/output interface 308 that inputs and outputs data
・Bus 309 that connects each component

また、情報処理装置300は、プログラム群304をCPU301が取得して当該CPU301が実行することで、図10に示す取得部321、照合部22、前処理部323、としての機能を実現することが出来る。なお、プログラム群304は、例えば、予め記憶装置305やROM302に格納されており、必要に応じてCPU301がRAM303などにロードして実行する。また、プログラム群304は、通信ネットワーク311を介してCPU301に供給されてもよいし、予め記録媒体310に格納されており、ドライブ装置306が該プログラムを読み出してCPU301に供給してもよい。 Further, the information processing device 300 can realize the functions of the acquisition unit 321, the collation unit 22, and the preprocessing unit 323 shown in FIG. I can do it. Note that the program group 304 is stored in the storage device 305 or ROM 302 in advance, for example, and is loaded into the RAM 303 or the like by the CPU 301 and executed as necessary. Further, the program group 304 may be supplied to the CPU 301 via the communication network 311, or may be stored in the recording medium 310 in advance, and the drive device 306 may read the program and supply it to the CPU 301.

なお、図9は、情報処理装置300のハードウェア構成の一例を示しており、情報処理装置300のハードウェア構成は上述した場合に限定されない。例えば、情報処理装置300は、ドライブ装置306を有さないなど、上述した構成の一部から構成されてもよい。 Note that FIG. 9 shows an example of the hardware configuration of the information processing device 300, and the hardware configuration of the information processing device 300 is not limited to the above-described case. For example, the information processing device 300 may be configured from part of the configuration described above, such as not having the drive device 306.

取得部321は、バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する。 The acquisition unit 321 obtains first information that associates the path name of the data stored in the backup destination area with unique information uniquely given to each piece of data, and the path of the data stored in the backup source area. second information that associates the name with unique information uniquely given to each data is acquired.

照合部322は、取得部321が取得した第1情報と第2情報とを照合する。 The collation unit 322 collates the first information and the second information acquired by the acquisition unit 321.

前処理部323は、バックアップ元領域に格納されたデータをバックアップ先領域に複製する際に、照合部322が照合した結果に基づく前処理を行う。 The preprocessing unit 323 performs preprocessing based on the results of the verification performed by the verification unit 322 when copying data stored in the backup source area to the backup destination area.

このように、情報処理装置300は、照合部322と前処理部323を有している。このような構成により、前処理部323は、バックアップ元領域に格納されたデータをバックアップ先領域に複製する際に、照合部322が照合した結果に基づく前処理を行うことが出来る。これにより、例えば、パス名を変更するデータ移動処理を前処理として行うことなどが可能となる。その結果、例えば、ファイル名やディレクトリ名の変更を行っただけの場合、前処理としてパス名を変更しておくことで、無駄にデータの削除・再コピーが生じる事態を抑制すること可能となり、バックアップ時間の遅延を抑制することが可能となる。 In this way, the information processing device 300 includes the matching section 322 and the preprocessing section 323. With such a configuration, the preprocessing unit 323 can perform preprocessing based on the results of the verification performed by the verification unit 322 when copying data stored in the backup source area to the backup destination area. This makes it possible, for example, to perform data movement processing for changing path names as preprocessing. As a result, for example, when only changing a file name or directory name, by changing the path name as a preprocessing, it is possible to prevent unnecessary data deletion and re-copying. This makes it possible to suppress delays in backup time.

なお、上述した情報処理装置300は、当該情報処理装置300に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、情報処理装置300に、バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部321と、取得部321が取得した第1情報と第2情報とを照合する照合部322と、バックアップ元領域に格納されたデータをバックアップ先領域に複製する際に、照合部322が照合した結果に基づく前処理をデータの複製前に行う前処理部323と、を実現するためのプログラムである。 Note that the information processing device 300 described above can be realized by incorporating a predetermined program into the information processing device 300. Specifically, a program according to another embodiment of the present invention causes the information processing device 300 to associate path names of data stored in a backup destination area with unique information uniquely given to each data. an acquisition unit 321 that acquires first information and second information that associates a path name of data stored in a backup source area with unique information uniquely given to each data; A collating unit 322 collates the first information and second information acquired by the collating unit 322, and when copying data stored in the backup source area to the backup destination area, preprocessing based on the collated results by the collating unit 322 is performed on the data. This is a program for realizing a preprocessing unit 323 that performs processing before copying.

また、上述した情報処理装置300により実行される情報処理方法は、情報処理装置300が、バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、取得した第1情報と第2情報とを照合し、バックアップ元領域に格納されたデータをバックアップ先領域に複製する際に、照合結果に基づく前処理をデータの複製前に行う、という方法である。 Further, in the information processing method executed by the information processing device 300 described above, the information processing device 300 corresponds to the path name of the data stored in the backup destination area and the unique information uniquely given to each data. Obtain the first information that has been assigned, obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data, and obtain the obtained first information. In this method, when the data stored in the backup source area is copied to the backup destination area, preprocessing is performed based on the comparison result before the data is duplicated.

上述した構成を有する、プログラム、又は、情報処理方法、の発明であっても、上記情報処理装置300と同様の作用・効果を有するために、上述した本発明の目的を達成することが出来る。 Even the invention of a program or an information processing method having the above-described configuration can achieve the above-described object of the present invention because it has the same operation and effect as the information processing device 300.

<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における情報処理方法などの概略を説明する。但し、本発明は、以下の構成に限定されない。
<Additional notes>
Part or all of the above embodiments may also be described as in the following additional notes. Hereinafter, an outline of the information processing method and the like in the present invention will be explained. However, the present invention is not limited to the following configuration.

(付記1)
情報処理装置が、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、
バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、
取得した前記第1情報と前記第2情報とを照合し、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う
情報処理方法。
(付記2)
請求項1に記載の情報処理方法であって、
照合結果に基づく処理として、パス名を変更するデータ移動処理を行う
情報処理方法。
(付記3)
付記1または付記2に記載の情報処理方法であって、
前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、同一のパス名、ユニーク情報が前記第2情報に含まれるか否か確認する照合を行う
情報処理方法。
(付記4)
付記1から付記3までのいずれか1項に記載の情報処理方法であって、
前記第1情報と前記第2情報とを照合することで、前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、前記第2情報においてパス名が一致する数を示すパス名一致数とチェックサムが一致する数を示すチェックサム一致数とを算出する
情報処理方法。
(付記5)
付記4に記載の情報処理方法であって、
照合結果に基づく処理として、前記パス名一致数と前記チェックサム一致数とに応じた処理を行う
情報処理方法。
(付記6)
付記5に記載の情報処理方法であって、
前記チェックサム一致数の方が前記パス名一致数よりも多い場合、照合結果に基づく処理として、バックアップ先領域に格納されているデータのパス名を変更するデータ移動処理を行う
情報処理方法。
(付記7)
付記5または付記6に記載の情報処理方法であって、
前記チェックサム一致数が複数である場合、照合結果に基づく処理として、バックアップ先領域内でデータをコピーする処理を少なくとも行う
情報処理方法。
(付記8)
付記1から付記7までのいずれか1項に記載の情報処理方法であって、
前記ユニーク情報は、データの内容に基づいて算出されるチェックサムである
情報処理方法。
(付記9)
付記1から付記8までのいずれか1項に記載の情報処理方法であって、
バックアップ先領域に格納されているデータに基づいて前記第1情報を生成し、バックアップ元領域に格納されているデータに基づいて前記第2情報を生成し、
生成した前記第1情報と、生成した前記第2情報と、を照合する
情報処理方法。
(付記10)
付記1から付記9までのいずれか1項に記載の情報処理方法であって、
照合結果に基づく処理を行った後、バックアップ先領域に存在しないデータをバックアップ元領域からバックアップ先領域に複製する
情報処理方法。
(付記11)
付記1から付記10までのいずれか1項に記載の情報処理方法であって、
照合結果に基づく処理としてデータを削除する処理を行う際、データの削除の代わりに、データに削除フラグを付与する、または、データを世代前フォルダに移動させる、処理を行う
情報処理方法。
(付記12)
付記1から付記11までのいずれか1項に記載の情報処理方法であって、
照合結果に基づく処理として、前記ユニーク情報が一致するデータを重複してバックアップ先領域に記憶しない重複排除処理を行う
情報処理方法。
(付記13)
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部と、
前記取得部が取得した前記第1情報と前記第2情報とを照合する照合部と、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う前処理部と、
を有する
情報処理装置。
(付記14)
情報処理装置に、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部と、
前記取得部が取得した前記第1情報と前記第2情報とを照合する照合部と、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う前処理部と、
を実現するためのプログラム。
(Additional note 1)
The information processing device
Obtain first information that associates the path name of data stored in the backup destination area with unique information uniquely given to each data,
Obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data,
collating the acquired first information and the second information;
An information processing method that performs processing based on the results of matching the path name of the data stored in the backup destination area before copying the data stored in the backup source area to the backup destination area.
(Additional note 2)
The information processing method according to claim 1,
An information processing method that performs data movement processing to change path names as processing based on the matching results.
(Additional note 3)
The information processing method according to appendix 1 or appendix 2,
An information processing method that performs a check to confirm whether or not the same path name and unique information are included in the second information for each combination of a path name and unique information included in the first information.
(Additional note 4)
The information processing method according to any one of Supplementary notes 1 to 3,
By comparing the first information and the second information, a path name match is generated that indicates the number of matching path names in the second information for each combination of a path name and unique information included in the first information. An information processing method that calculates the number of checksum matches and the number of checksum matches.
(Appendix 5)
The information processing method described in Appendix 4,
An information processing method that performs processing according to the number of path name matches and the number of checksum matches as processing based on the matching result.
(Appendix 6)
The information processing method according to appendix 5,
If the number of checksum matches is greater than the number of path name matches, the information processing method performs data movement processing to change the path name of data stored in a backup destination area as processing based on the matching result.
(Appendix 7)
The information processing method according to appendix 5 or appendix 6,
When the number of checksum matches is plural, the information processing method includes at least performing a process of copying data within a backup destination area as a process based on the comparison result.
(Appendix 8)
The information processing method according to any one of Supplementary notes 1 to 7,
An information processing method, wherein the unique information is a checksum calculated based on the content of data.
(Appendix 9)
The information processing method according to any one of Supplementary Notes 1 to 8,
generating the first information based on data stored in a backup destination area; generating the second information based on data stored in a backup source area;
An information processing method, comprising comparing the generated first information with the generated second information.
(Appendix 10)
The information processing method according to any one of Supplementary Notes 1 to 9,
An information processing method that copies data that does not exist in the backup destination area from the backup source area to the backup destination area after performing processing based on the verification results.
(Appendix 11)
The information processing method according to any one of Supplementary notes 1 to 10,
An information processing method that performs processing such as attaching a deletion flag to the data or moving the data to a previous generation folder instead of deleting the data when performing data deletion processing based on the verification results.
(Appendix 12)
The information processing method according to any one of Supplementary Notes 1 to 11,
An information processing method, as processing based on a matching result, performing deduplication processing in which data with matching unique information is not stored redundantly in a backup destination area.
(Appendix 13)
First information that associates the path name of data stored in the backup destination area with unique information uniquely given to each piece of data, and the path name of data stored in the backup source area and each piece of data. an acquisition unit that acquires unique information uniquely given to , and second information that associates the .
a collation unit that collates the first information and the second information acquired by the acquisition unit;
a preprocessing unit that performs processing based on a result of matching a path name of data stored in the backup destination area, before replicating the data stored in the backup source area to the backup destination area;
An information processing device having:
(Appendix 14)
In the information processing device,
First information that associates the path name of data stored in the backup destination area with unique information uniquely given to each piece of data, and the path name of data stored in the backup source area and each piece of data. an acquisition unit that acquires unique information uniquely given to , and second information that associates the .
a collation unit that collates the first information and the second information acquired by the acquisition unit;
a preprocessing unit that performs processing based on a result of matching a path name of data stored in the backup destination area, before replicating the data stored in the backup source area to the backup destination area;
A program to achieve this.

なお、上記各実施形態及び付記において記載したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されていたりする。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。 Note that the programs described in each of the above embodiments and supplementary notes are stored in a storage device or recorded in a computer-readable recording medium. For example, the recording medium is a portable medium such as a flexible disk, an optical disk, a magneto-optical disk, and a semiconductor memory.

以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることが出来る。 Although the present invention has been described above with reference to the embodiments described above, the present invention is not limited to the embodiments described above. The configuration and details of the present invention can be modified in various ways that can be understood by those skilled in the art within the scope of the present invention.

100 バックアップ元装置
110 インデックス生成部
120 インデックス照合部
130 前処理部
140 ファイルコピー部
150 記憶装置
151 バックアップ元領域内ファイル
200 バックアップ先装置
210 データ制御部
220 記憶装置
221 バックアップ先領域内ファイル
300 情報処理装置
301 CPU
302 ROM
303 RAM
304 プログラム群
305 記憶装置
306 ドライブ装置
307 通信インタフェース
308 入出力インタフェース
309 バス
310 記録媒体
311 通信ネットワーク
321 取得部
322 照合部
323 前処理部

100 Backup source device 110 Index generation unit 120 Index collation unit 130 Preprocessing unit 140 File copy unit 150 Storage device 151 File in backup source area 200 Backup destination device 210 Data control unit 220 Storage device 221 File in backup destination area 300 Information processing device 301 CPU
302 ROM
303 RAM
304 Program group 305 Storage device 306 Drive device 307 Communication interface 308 Input/output interface 309 Bus 310 Recording medium 311 Communication network 321 Acquisition unit 322 Collation unit 323 Preprocessing unit

Claims (16)

情報処理装置が、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、
バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、
取得した前記第1情報と前記第2情報とを照合し、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行い、
前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、同一のパス名、ユニーク情報が前記第2情報に含まれるか否か確認する照合を行う
情報処理方法。
The information processing device
Obtain first information that associates the path name of data stored in the backup destination area with unique information uniquely given to each data,
Obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data,
collating the acquired first information and the second information;
Before replicating the data stored in the backup source area to the backup destination area, processing is performed based on the result of matching the path name of the data stored in the backup destination area.
For each combination of a path name and unique information included in the first information, a check is performed to check whether the same path name and unique information are included in the second information.
Information processing method.
請求項1に記載の情報処理方法であって、
照合結果に基づく処理として、パス名を変更するデータ移動処理を行う
情報処理方法。
The information processing method according to claim 1,
An information processing method that performs data movement processing to change path names as processing based on the matching results.
請求項1または請求項2に記載の情報処理方法であって、
前記第1情報と前記第2情報とを照合することで、前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、前記第2情報においてパス名が一致する数を示すパス名一致数とチェックサムが一致する数を示すチェックサム一致数とを算出する
情報処理方法。
The information processing method according to claim 1 or claim 2 ,
By comparing the first information and the second information, a path name match is generated that indicates the number of matching path names in the second information for each combination of a path name and unique information included in the first information. An information processing method that calculates the number of checksum matches and the number of checksum matches.
請求項に記載の情報処理方法であって、
照合結果に基づく処理として、前記パス名一致数と前記チェックサム一致数とに応じた処理を行う
情報処理方法。
The information processing method according to claim 3 ,
An information processing method that performs processing according to the number of path name matches and the number of checksum matches as processing based on the matching result.
請求項に記載の情報処理方法であって、
前記チェックサム一致数の方が前記パス名一致数よりも多い場合、照合結果に基づく処理として、バックアップ先領域に格納されているデータのパス名を変更するデータ移動処理を行う
情報処理方法。
The information processing method according to claim 4 ,
If the number of checksum matches is greater than the number of path name matches, the information processing method performs data movement processing to change the path name of data stored in a backup destination area as processing based on the matching result.
請求項または請求項に記載の情報処理方法であって、
前記チェックサム一致数が複数である場合、照合結果に基づく処理として、バックアップ先領域内でデータをコピーする処理を少なくとも行う
情報処理方法。
The information processing method according to claim 4 or claim 5 ,
When the number of checksum matches is plural, the information processing method at least performs a process of copying data within a backup destination area as a process based on the matching result.
請求項1から請求項までのいずれか1項に記載の情報処理方法であって、
前記ユニーク情報は、データの内容に基づいて算出されるチェックサムである
情報処理方法。
The information processing method according to any one of claims 1 to 6 ,
An information processing method, wherein the unique information is a checksum calculated based on the content of data.
請求項1から請求項までのいずれか1項に記載の情報処理方法であって、
バックアップ先領域に格納されているデータに基づいて前記第1情報を生成し、バックアップ元領域に格納されているデータに基づいて前記第2情報を生成し、
生成した前記第1情報と、生成した前記第2情報と、を照合する
情報処理方法。
The information processing method according to any one of claims 1 to 7 ,
generating the first information based on data stored in a backup destination area; generating the second information based on data stored in a backup source area;
An information processing method, comprising comparing the generated first information with the generated second information.
請求項1から請求項までのいずれか1項に記載の情報処理方法であって、
照合結果に基づく処理を行った後、バックアップ先領域に存在しないデータをバックアップ元領域からバックアップ先領域に複製する
情報処理方法。
The information processing method according to any one of claims 1 to 8 ,
An information processing method that copies data that does not exist in the backup destination area from the backup source area to the backup destination area after performing processing based on the verification results.
請求項1から請求項までのいずれか1項に記載の情報処理方法であって、
照合結果に基づく処理としてデータを削除する処理を行う際、データの削除の代わりに、データに削除フラグを付与する、または、データを世代前フォルダに移動させる、処理を行う
情報処理方法。
The information processing method according to any one of claims 1 to 9 ,
An information processing method that performs processing such as attaching a deletion flag to the data or moving the data to a previous generation folder instead of deleting the data when performing data deletion processing based on the verification results.
請求項1から請求項10までのいずれか1項に記載の情報処理方法であって、
照合結果に基づく処理として、前記ユニーク情報が一致するデータを重複してバックアップ先領域に記憶しない重複排除処理を行う
情報処理方法。
The information processing method according to any one of claims 1 to 10 ,
An information processing method that performs, as a process based on a matching result, a deduplication process that does not duplicate data that has the same unique information and stores it in a backup destination area.
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部と、
前記取得部が取得した前記第1情報と前記第2情報とを照合する照合部と、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う前処理部と、
を有し、
前記照合部は、前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、同一のパス名、ユニーク情報が前記第2情報に含まれるか否か確認する照合を行う
情報処理装置。
First information that associates the path name of data stored in the backup destination area with unique information uniquely given to each piece of data, and the path name of data stored in the backup source area and each piece of data. an acquisition unit that acquires unique information uniquely given to , and second information that associates the .
a collation unit that collates the first information and the second information acquired by the acquisition unit;
a preprocessing unit that performs processing based on a result of matching a path name of data stored in the backup destination area, before replicating the data stored in the backup source area to the backup destination area;
has
The matching unit performs matching to check whether the same path name and unique information are included in the second information for each combination of a path name and unique information included in the first information.
Information processing device.
情報処理装置に、
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報と、バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報と、を取得する取得部と、
前記取得部が取得した前記第1情報と前記第2情報とを照合する照合部と、
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行う前処理部と、
を実現させ、
前記照合部は、前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、同一のパス名、ユニーク情報が前記第2情報に含まれるか否か確認する照合を行う
プログラム。
In the information processing device,
First information that associates the path name of data stored in the backup destination area with unique information uniquely given to each piece of data, and the path name of data stored in the backup source area and each piece of data. an acquisition unit that acquires unique information uniquely given to , and second information that associates the .
a collation unit that collates the first information and the second information acquired by the acquisition unit;
a preprocessing unit that performs processing based on a result of matching a path name of data stored in the backup destination area, before replicating the data stored in the backup source area to the backup destination area;
Realize,
The matching unit performs matching to check whether the same path name and unique information are included in the second information for each combination of a path name and unique information included in the first information.
program.
情報処理装置が、The information processing device
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、Obtain first information that associates the path name of data stored in the backup destination area with unique information uniquely given to each data,
バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、Obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data,
取得した前記第1情報と前記第2情報とを照合し、collating the acquired first information and the second information;
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行い、Before copying the data stored in the backup source area to the backup destination area, processing is performed based on the result of matching the path name of the data stored in the backup destination area.
前記第1情報と前記第2情報とを照合することで、前記第1情報に含まれるパス名とユニーク情報との組み合わせごとに、前記第2情報においてパス名が一致する数を示すパス名一致数とチェックサムが一致する数を示すチェックサム一致数とを算出するBy comparing the first information and the second information, a path name match is generated that indicates the number of matching path names in the second information for each combination of a path name and unique information included in the first information. Calculate the number of checksum matches and the number of checksum matches.
情報処理方法。Information processing method.
情報処理装置が、The information processing device
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、Obtain first information that associates the path name of data stored in the backup destination area with unique information uniquely given to each data,
バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、Obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data,
取得した前記第1情報と前記第2情報とを照合し、collating the acquired first information and the second information;
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行い、Before replicating the data stored in the backup source area to the backup destination area, processing is performed based on the result of matching the path name of the data stored in the backup destination area.
照合結果に基づく処理を行った後、バックアップ先領域に存在しないデータをバックアップ元領域からバックアップ先領域に複製するAfter performing processing based on the matching results, copy data that does not exist in the backup destination area from the backup source area to the backup destination area.
情報処理方法。Information processing method.
情報処理装置が、The information processing device
バックアップ先領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第1情報を取得し、Obtain first information that associates the path name of data stored in the backup destination area with unique information uniquely given to each data,
バックアップ元領域に格納されているデータのパス名と、データごとに一意に与えられるユニーク情報と、を対応づけた第2情報を取得し、Obtain second information that associates the path name of the data stored in the backup source area with unique information uniquely given to each data,
取得した前記第1情報と前記第2情報とを照合し、collating the acquired first information and the second information;
バックアップ元領域に格納されたデータをバックアップ先領域に複製する前に、バックアップ先領域に格納されたデータのパス名に対する照合結果に基づく処理を行い、Before replicating the data stored in the backup source area to the backup destination area, processing is performed based on the result of matching the path name of the data stored in the backup destination area.
照合結果に基づく処理としてデータを削除する処理を行う際、データの削除の代わりに、データに削除フラグを付与する、または、データを世代前フォルダに移動させる、処理を行うWhen deleting data as a process based on the verification results, instead of deleting the data, add a deletion flag to the data or move the data to the previous generation folder.
情報処理方法。Information processing method.
JP2020020543A 2020-02-10 2020-02-10 Information processing method Active JP7452840B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020020543A JP7452840B2 (en) 2020-02-10 2020-02-10 Information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020020543A JP7452840B2 (en) 2020-02-10 2020-02-10 Information processing method

Publications (2)

Publication Number Publication Date
JP2021125181A JP2021125181A (en) 2021-08-30
JP7452840B2 true JP7452840B2 (en) 2024-03-19

Family

ID=77459280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020020543A Active JP7452840B2 (en) 2020-02-10 2020-02-10 Information processing method

Country Status (1)

Country Link
JP (1) JP7452840B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200208A (en) 1999-01-06 2000-07-18 Fujitsu Ltd Method and device for file backup, and program recording medium
JP2008234269A (en) 2007-03-20 2008-10-02 Nec Corp File management system and method, and program
JP2009245264A (en) 2008-03-31 2009-10-22 Nec Corp System, method, and program for controlling backup
JP2012506582A (en) 2008-10-24 2012-03-15 イーエルテー イノベイションズ アーベー Distributed data storage
JP2012093827A (en) 2010-10-25 2012-05-17 Internatl Business Mach Corp <Ibm> Device and method removing duplication of file

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200208A (en) 1999-01-06 2000-07-18 Fujitsu Ltd Method and device for file backup, and program recording medium
JP2008234269A (en) 2007-03-20 2008-10-02 Nec Corp File management system and method, and program
JP2009245264A (en) 2008-03-31 2009-10-22 Nec Corp System, method, and program for controlling backup
JP2012506582A (en) 2008-10-24 2012-03-15 イーエルテー イノベイションズ アーベー Distributed data storage
JP2012093827A (en) 2010-10-25 2012-05-17 Internatl Business Mach Corp <Ibm> Device and method removing duplication of file

Also Published As

Publication number Publication date
JP2021125181A (en) 2021-08-30

Similar Documents

Publication Publication Date Title
US11561716B2 (en) Fast migration of metadata
US8880824B1 (en) Global de-duplication in shared architectures
US9633065B2 (en) Efficient data rehydration
US9134914B1 (en) Deduplication
US10949405B2 (en) Data deduplication device, data deduplication method, and data deduplication program
JP4369471B2 (en) Mirroring program, mirroring method, information storage device
JP5650982B2 (en) Apparatus and method for eliminating file duplication
US9465695B2 (en) Efficient backup replication
US20120197844A1 (en) Block level data replication
US11861392B2 (en) Deploying a cloud instance of a user virtual machine
US20110302139A1 (en) Method, apparatus, program and system for migrating nas system
US9239869B1 (en) Replication and synchronization for protecting NTFS deduplication volumes
US10599359B2 (en) Data migration system and method thereof
JP2018097450A (en) Data processing apparatus, data processing program and data processing method
JP4755244B2 (en) Information generation method, information generation program, and information generation apparatus
TW201908987A (en) Storage system of distributed deduplication for internet of things backup in data center and method for achieving the same
US10613923B2 (en) Recovering log-structured filesystems from physical replicas
US10331362B1 (en) Adaptive replication for segmentation anchoring type
US8639660B1 (en) Method and apparatus for creating a database replica
JP7452840B2 (en) Information processing method
US9690837B1 (en) Techniques for preserving redundant copies of metadata in a data storage system employing de-duplication
JP2017142664A (en) Data processing apparatus, data processing system, data processing method, and data processing program
US11636073B2 (en) File storage system and file management method by file storage system
JP6413792B2 (en) Storage system
JP7306665B2 (en) Storage device, data migration method, program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240229

R150 Certificate of patent or registration of utility model

Ref document number: 7452840

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150