JP2009122866A - 電子ファイル記憶装置および電子ファイル記憶方法 - Google Patents

電子ファイル記憶装置および電子ファイル記憶方法 Download PDF

Info

Publication number
JP2009122866A
JP2009122866A JP2007294850A JP2007294850A JP2009122866A JP 2009122866 A JP2009122866 A JP 2009122866A JP 2007294850 A JP2007294850 A JP 2007294850A JP 2007294850 A JP2007294850 A JP 2007294850A JP 2009122866 A JP2009122866 A JP 2009122866A
Authority
JP
Japan
Prior art keywords
file
electronic file
difference
information
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007294850A
Other languages
English (en)
Inventor
Kenji Watanabe
健司 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007294850A priority Critical patent/JP2009122866A/ja
Publication of JP2009122866A publication Critical patent/JP2009122866A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract


【課題】 電子ファイルの情報量をより少なくして記憶することができる電子ファイル記憶装置および電子ファイル記憶方法を提供する。
【解決手段】 差分検出部14は、ファイル取得部13によって取得されたファイルと、ファイル記録部11に記憶される各ファイルとの差分データを検出する。近似ファイル検索部15は、ファイル記録部11に記憶されるファイルのうち、差分検出部14によって検出された差分データのデータ量が最も少なく、かつそのデータ量が閾値記憶部17に記憶される閾値以下である場合に、その最も少ない差分データのファイルを近似ファイルとして特定する。そして、ファイル記録部11に記憶される近似ファイルを削除し、ファイル取得部13によって取得されたファイルをファイル記録部11に記憶し、さらに、近似ファイルの差分データを差分ファイル記録部12に差分ファイルとして記憶する。
【選択図】 図1

Description

本発明は、電子ファイルを記憶する電子ファイル記憶装置および電子ファイル記憶方法に関する。
ドキュメントのバージョン管理は、従来から差分による管理が行われている。差分による管理は、修正前および修正後の両方のドキュメントをそのまま電子ファイル(以下単に「ファイル」ともいう)として保存するのではなく、どちらか1つのドキュメントについては、他のドキュメントに対する差分のみを電子ファイルとして保存することによって、保存するために必要な記憶容量を低減しようとするものである。
たとえば特許文献1に記載されている文書管理システムは、更新が行なわれたファイルあるいは新規追加されたファイルを検出し、ファイル名が類似している場合に、既存のファイルにおけるバージョンアップファイルとして管理する。ファイル名が類似しているか否かは、ファイル名の接頭辞が同じで、かつファイルが同一階層に存在する場合に、類似していると判定する。更新が行なわれたファイルあるいは新規追加されたファイルは、既存のファイルとの差分のみが、既存のファイルと対応付けられて記憶される。
特開2005−316715号公報
従来の技術によるドキュメントのバージョン管理は、修正後のファイルと修正前のファイルとが予め対応付けられている場合、あるいは上述した文書管理システムのように、ファイル名に規則性を持たせてファイル名から修正前のファイルがどれであるかを類推することができるような場合、すなわち、ファイル間で何らかの関係が認められる場合に、差分による管理を行なうものである。しかしながら、従来の技術では、ファイルの内容が大幅に更新された場合、差分の情報量が大きくなることがあるという問題がある。
図10は、従来の技術によって差分をとった場合の差分の情報量を示す図である。図10には、ファイル名「A.txt」、ファイル名「A2.txt」、ファイル名「B.txt」およびファイル名「B2.txt」の4つのファイルの内容が示されている。
ファイル名「A2.txt」の内容は、ファイル名「A.txt」の内容に編集、具体的には、文字列31の大幅な削除を行なった内容であり、ファイル名「B2.txt」の内容は、ファイル名「B.txt」の内容に編集、具体的には、文字列32の大幅な追加を行なった内容である。文字列31と文字列32とは同じ内容であり、ファイル名「A2.txt」とファイル名「B2.txt」とは、同じ内容になっている。
ファイル名「A.txt」の内容とファイル名「A2.txt」の内容との差分は、文字列31であり、ファイル名「B.txt」の内容とファイル名「B2.txt」の内容との差分は、文字列32であり、いずれもその差分の情報量が大きい。
本発明の目的は、電子ファイルの情報量をより少なくして記憶することができる電子ファイル記憶装置および電子ファイル記憶方法を提供することである。
本発明は、新規に作成された情報を電子ファイルとして入力する入力手段と、
既に作成されている情報を情報の集合である電子ファイルとして記憶する記憶手段と、
入力手段によって入力される電子ファイルと、記憶手段に記憶される各電子ファイルとの差分を、記憶手段に記憶される電子ファイルごとに差分情報として検出する検出手段と、
記憶手段に記憶される電子ファイルのうち、検出手段によって検出される差分情報の情報量が最も少ない差分情報の電子ファイルを特定する特定手段と、
記憶手段に記憶される電子ファイルのうち、特定手段によって特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分情報を電子ファイルとして、および入力手段によって入力される電子ファイルを記憶手段に記憶させる制御手段とを含むことを特徴とする電子ファイル記憶装置である。
また本発明は、前記入力手段は、電子ファイルとして記憶する差分情報の情報量を制限するための予め定める基準差分情報量を表す基準差分情報量情報をさらに入力し、
前記制御手段は、前記特定された電子ファイルの差分情報の情報量が、前記入力手段によって入力される基準差分情報量情報が示す基準差分情報量以下のときにのみ、前記特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分情報を電子ファイルとして、および前記入力手段によって入力される電子ファイルを前記記憶手段に記憶させることを特徴とする。
また本発明は、前記制御手段は、前記特定される電子ファイルの差分情報を電子ファイルとして前記記憶手段に記憶させるとき、前記入力手段によって入力され、前記記憶手段に記憶される電子ファイルに対応付けて記憶させることを特徴とする。
また本発明は、情報を出力する出力手段をさらに含み、
前記記憶手段は、各電子ファイルを、各電子ファイルを識別するためのファイル識別情報に対応付けて記憶し、
前記入力手段は、電子ファイル識別情報をさらに入力し、
前記制御手段は、前記入力手段によって電子ファイル識別情報が入力されると、前記入力手段によって入力される電子ファイル識別情報が示す電子ファイルを前記記憶手段から検索し、
前記検索した電子ファイルが差分情報の電子ファイルである場合は、前記検索した電子ファイルの差分情報と、前記記憶手段に記憶される電子ファイルのうち、前記検索した電子ファイル対応付けられている電子ファイルの情報とに基づいて、前記置き換えられた電子ファイルを復元し、復元した電子ファイルの情報を出力手段によって出力させ、
前記検索した電子ファイルが新規に作成された情報の電子ファイルである場合は、前記検索した電子ファイルの情報を出力手段よってに出力させることを特徴とする。
また本発明は、新規に作成された情報を電子ファイルとして入力する入力ステップと、
入力ステップで入力された電子ファイルと、既に作成されている情報を情報の集合である電子ファイルとして記憶する記憶部に記憶されたる電子ファイルとの差分を、記憶部に記憶される電子ファイルごとに差分情報として検出する検出ステップと、
記憶部に記憶される電子ファイルのうち、検出ステップで検出された差分情報の情報量が最も少ない差分情報の電子ファイルを特定する特定ステップと、
記憶部に記憶される電子ファイルのうち、特定ステップで特定された電子ファイルに置き換えて、前記特定された電子ファイルの差分情報を電子ファイルとして、および入力ステップで入力された電子ファイルを記憶部に記憶する制御ステップとを含むことを特徴とする電子ファイル記憶方法である。
本発明によれば、入力手段によって、新規に作成された情報が電子ファイルとして入力され、記憶手段によって、既に作成されている情報が情報の集合である電子ファイルとして記憶され、検出手段によって、入力手段によって入力される電子ファイルと、記憶手段に記憶される各電子ファイルとの差分が、記憶手段に記憶される電子ファイルごとに差分情報として検出される。
そして、特定手段によって、記憶手段に記憶される電子ファイルのうち、検出手段によって検出される差分情報の情報量が最も少ない差分情報の電子ファイルが特定され、制御手段によって、記憶手段に記憶される電子ファイルのうち、特定手段によって特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分情報が電子ファイルとして、および入力手段によって入力される電子ファイルが記憶手段に記憶される。
すなわち、既存電子ファイルに置き換えて、新規電子ファイルとの差分情報の情報量が最も少ない差分情報および新規電子ファイルを記憶するので、電子ファイルの情報量をより少なくして記憶することができる。
また本発明によれば、入力ステップでは、新規に作成された情報を電子ファイルとして入力する。検出ステップでは、入力ステップで入力された電子ファイルと、既に作成されている情報を情報の集合である電子ファイルとして記憶する記憶部に記憶されたる電子ファイルとの差分を、記憶部に記憶される電子ファイルごとに差分情報として検出する。特定ステップでは、記憶部に記憶される電子ファイルのうち、検出ステップで検出された差分情報の情報量が最も少ない差分情報の電子ファイルを特定する。
そして、制御ステップでは、記憶部に記憶される電子ファイルのうち、特定ステップで特定された電子ファイルに置き換えて、前記特定された電子ファイルの差分情報を電子ファイルとして、および入力ステップで入力された電子ファイルを記憶部に記憶する。
したがって、本発明に係る電子ファイル記憶方法を適用すれば、既存電子ファイルに置き換えて、新規電子ファイルとの差分情報の情報量が最も少ない差分情報および新規電子ファイルを記憶するので、電子ファイルの情報量をより少なくして記憶することができる。
図1は、本発明の実施の一形態であるファイル保管装置1の機能の構成を示すブロック図である。本発明に係る電子ファイル記憶方法は、電子ファイル記憶装置であるファイル保管装置1で処理される。
ファイル保管装置1は、たとえばコンピュータシステムによって構成される。ファイル保管装置1を構成するコンピュータシステムは、たとえば入力装置、出力装置、記憶装置、および中央処理装置(Central Processing Unit:以下「CPU」という)を含んで構成される。入力装置は、キーボードあるいはマウスなどによって構成され、情報を入力するための装置である。出力装置は、液晶ディスプレイあるいはCRT(Cathode Ray Tube
)などの表示装置あるいはプリンタなどの印刷装置によって構成され、情報を出力する。
記憶装置は、ROM(Read Only Memory)およびRAM(Random Access Memory)などの半導体メモリあるいは大容量の情報を記憶するためのHDD(Hard Disk Drive)などによって構成され、ファイル保管装置1を制御するための制御プログラム、および制御プログラムを実行する際に用いる情報を記憶する。CPUは、記憶装置に記憶される制御プログラムを実行することによって、入力装置および出力装置を制御し、後述する各機能を実現する。
ファイル保管装置1は、ファイル記録部11、差分ファイル記録部12、ファイル取得部13、差分検出部14、近似ファイル検索部15、閾値入力部16、閾値記憶部17、ファイル指定部18、ファイル検索部19、ファイル再生成部20およびファイル出力部21などの機能を含んで構成される。
図2は、ファイル記録部11および差分ファイル記録部12に記憶されるファイルの関係を示す図である。記憶手段および記憶部であるファイル記録部11および差分ファイル記録部12は、記憶装置に形成される領域であり、ファイル記録部11および差分ファイル記録部12に記憶される情報は、記憶装置に記憶される。
ファイル記録部11は、ファイル取得部13によって取得された情報をそのまま電子ファイル(以下単に「ファイル」ともいう)として、各ファイルを識別するための電子ファイル識別情報であるファイル名と対応付けて記憶する。差分ファイル記録部12は、ファイル取得部13に記憶されている電子ファイルの情報と、ファイル取得部13によって取得された情報との差分データを電子ファイルとして、ファイル名と対応付けて記憶する。
差分情報である差分データは、ファイル取得部13によって取得された情報に対する差分ファイル記録部12に記憶される電子ファイルの情報の差分を表す情報である。以下、差分ファイル記録部12に記憶される電子ファイルのことを差分ファイルといい、差分ファイルのファイル名を、差分ファイル名という。
図2に示したファイル記録部11には、ファイル名が「ファイルA」、「ファイルB」および「ファイルC」の3つのファイルが記憶されている。図2に示した差分ファイル記録部12には、差分ファイル名が「差分A−1」、「差分A−2」、「差分A−3」、「差分B−1」、「差分C−1」および「差分C−2」の6つの差分ファイルが記憶されている。
差分ファイル名が「差分A−3」の差分ファイルは、ファイル記録部11に記憶されるファイル名が「ファイルA」のファイルに対する差分データの差分ファイルである。差分ファイル名が「差分A−2」の差分ファイルは、差分ファイル名が「差分A−3」の差分ファイルによって復元されるファイルに対する差分データの差分ファイルである。差分ファイル名が「差分A−1」の差分ファイルは、差分ファイル名が「差分A−2」の差分ファイルによって復元されるファイルに対する差分データの差分ファイルである。
差分ファイル名が「差分B−1」の差分ファイルは、ファイル記録部11に記憶されるファイル名が「ファイルB」のファイルに対する差分データの差分ファイルである。差分ファイル名が「差分C−2」の差分ファイルは、ファイル記録部11に記憶されるファイル名が「ファイルC」のファイルに対する差分データの差分ファイルである。差分ファイル名が「差分C−1」の差分ファイルは、差分ファイル名が「差分C−2」の差分ファイルによって復元されるファイルに対する差分データの差分ファイルである。
差分ファイルは、差分ファイル名121、差分データ122、および差分対象へのポインタ123を含む。差分対象は、ファイル取得部13によって取得され、ファイル記録分11に記憶されたファイル、すなわち新しく記憶されたファイルである。差分対象へのポインタは、該当する差分ファイルと新しく記憶されたファイルとの対応関係を示す情報であり、該当する差分ファイルから新しく記憶されたファイルを指し示す。図2に示した差分ファイル名が「差分C−2」の差分ファイルについて、差分ファイル名121が「差分C−2」、および差分対象へのポインタ123が「ファイルC」と示されている。
差分対象のファイル、つまりファイル取得部13によって取得され、ファイル記録部11に記憶されたファイルには、差分ファイルへのポインタが記憶される。すなわち、ファイル記録部11に記憶されたファイルと、差分ファイル記録部12に記憶された差分ファイルとの間に双方向ポインタが設定される。図2に示した例では、たとえばファイル名「ファイルC」のファイルには、図2には示していないが、差分ファイル名「差分C−2」の差分ファイルへのポインタが記憶される。
さらに、当該差分ファイルに、当該差分ファイルが差分対象のファイルになる他の差分ファイルがあるときは、他の差分ファイルへのポインタも当該差分ファイルに記憶される図2に示した例では、差分ファイル名「差分C−2」の差分ファイルは、差分ファイル名「差分C−1」の差分ファイルの差分対象であり、図2には示していないが、差分ファイル名「差分C−2」の差分ファイルには、差分ファイル名「差分C−1」へのポインタも記憶され、差分ファイル名「差分C−1」の差分ファイルには、差分ファイル名「差分C−2」へのポインタが記憶される。すなわち、差分ファイルに差分対象の差分ファイルがある場合は、それらの差分ファイル間に双方向ポインタが設定される。
入力手段であるファイル取得部13は、ユーザによって入力装置から入力される新規に作成された情報をファイルとして取得する。検出手段である差分検出部14は、ファイル取得部13によってファイルが取得されると、ファイル記録部11に記憶されるファイルとの差分を、ファイル記録部11に記憶されるファイルごとに差分データとして検出する。差分データの検出は、たとえばオペレーティングシステムUNIX(登録商標)で用いられる「Diff」コマンドなどを用いて検出する。
特定手段および制御手段である近似ファイル検索部15は、ファイル記録部11に記憶されるファイルのうち、差分検出部14によって検出された差分データの情報量であるデータ量が最も少なく、かつそのデータ量が閾値記憶部17に記憶される閾値情報が示す閾値以下である場合に、その差分データのファイルを近似ファイルとして特定する。基準差分情報量情報である閾値情報は、閾値を表す情報であり、閾値は、差分ファイルとして記憶する差分データのデータ量を制限するための予め定める基準差分情報量である。
そして、近似ファイル検索部15は、ファイル記録部11に記憶される特定した近似ファイルを削除し、ファイル取得部13によって取得されたファイルをファイル記録部11に記憶し、さらに、差分検出部14によって検出された差分データつまり近似ファイルとの差分データを差分ファイル記録部12に差分ファイルとして記憶する。差分ファイルには、ファイル取得部13によって取得され、ファイル記録部11に記憶したファイルつまり差分対象へのポインタも含めて記憶する。
このように、近似ファイル検索部15によって、前記特定される電子ファイルの差分データが電子ファイルとして差分ファイル記録部12に記憶されるとき、ファイル取得部13によって入力され、ファイル記録部11に記憶される電子ファイルに対応付けて記憶されるので、差分データがどの電子ファイルとの差分であるかを特定することができる。
近似ファイル検索部15は、最も少ない差分データのデータ量が、閾値記憶部17に記憶される閾値よりも多い場合は、近似ファイルはないと判定し、ファイル取得部13によって取得されたファイルを、そのままファイル記録部11に記憶する。
入力手段である閾値入力部16は、ユーザによって入力装置から入力される閾値情報を取得する。閾値記憶部17は、閾値入力部16によって取得された閾値情報を記憶する。閾値記憶部17は、記憶装置に形成される領域であり、閾値記憶部17に記憶される情報は、記憶装置に記憶される。
このように、閾値入力部16によって、電子ファイルとして記憶する差分データのデータ量を制限するための予め定める閾値を表す閾値情報がさらに入力され、近似ファイル検索部15によって、前記特定された電子ファイルの差分データのデータ量が、閾値入力部16によって入力される閾値情報が示す閾値以下のときにのみ、前記特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分データが電子ファイルとして、およびファイル取得部13によって入力される電子ファイルがファイル記録部11および差分ファイル記録部12に記憶されるので、差分データのデータ量が閾値を超える場合は、近似ファイルをそのまま残すことができ、復元時の復元時間を不要とし、表示時間を短縮することができる。
図3は、ファイルFを登録する前のファイル記録部11および差分ファイル記録部12に記憶されるファイルの関係を示す図である。ファイル取得部13によって取得されたファイルのファイル名を「ファイルF」とし、ファイル記録部11に記憶されるファイルのファイル名を「ファイルFi」とし、差分ファイル記録部12に記憶される差分ファイルの差分ファイル名を「差分Fi−1」とする。ファイル取得部13によって取得されたファイル名「ファイルF」のファイルと、ファイル記録部11に記憶されるファイル名「ファイルFi」のファイルとの差分データを「差分D」とする。
差分検出部14は、ファイル取得部13によってファイル名「ファイルF」のファイルが取得されると、ファイル取得部13によって取得されたファイル名「ファイルF」のファイルと、ファイル記録部11に記憶されるファイル名「ファイルFi」のファイルとの差分を差分データ「差分D」として検出する。
図4は、ファイルFを登録した後のファイル記録部11および差分ファイル記録部12に記憶されるファイルの関係を示す図である。差分データ「差分D」のデータ量は、閾値記憶部17に記憶される閾値情報が示す閾値以下であるとする。
近似ファイル検索部15は、差分検出部14によって検出された差分データのうち最もデータ量が少なく、かつそのデータ量が閾値以下である差分データのファイルを近似ファイルとして特定する。図3に示した例では、ファイル記録部11に記憶されるファイルがファイル名「ファイルFi」のファイルのみであるので、その差分データのデータ量は最も少ないデータ量であり、かつそのデータ量は閾値以下であり、その差分データのファイルつまりファイル名「ファイルFi」のファイルを近似ファイルとして特定する。
そして、近似ファイル検索部15は、ファイル記録部11に記憶されるファイル名「ファイルFi」のファイルを削除し、ファイル取得部13によって取得されたファイル名「ファイルF」のファイルをファイル記録部11に記憶し、さらに、差分データ「差分D」を差分ファイル名「差分D」の差分ファイルとして、差分ファイル記録部12に記憶する。差分ファイル名「差分D」の差分ファイルには、差分対象へのポインタとして「ファイルF」が記憶され、差分ファイル名「差分F−1」の差分ファイルの差分対象へのポインタは、ファイル記録部11から削除されたファイルのファイル名「ファイルFi」から、差分ファイルのファイル名「差分D」に置き換えられる。
このように、ファイル取得部13によって、新規に作成された情報が電子ファイルとして入力され、ファイル記録部11によって、既に作成されている情報が情報の集合である電子ファイルとして記憶され、差分検出部14によって、ファイル取得部13によって入力される電子ファイルと、ファイル記録部11に記憶される各電子ファイルとの差分が、ファイル記録部11に記憶される電子ファイルごとに差分データとして検出される。
そして、近似ファイル検索部15によって、ファイル記録部11に記憶される電子ファイルのうち、差分検出部14によって検出される差分データのデータ量が最も少ない差分データの電子ファイルが特定され、近似ファイル検索部15によって、ファイル記録部11に記憶される電子ファイルのうち、近似ファイル検索部15によって特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分データが電子ファイルとして、およびファイル取得部13によって入力される電子ファイルがファイル記録部11および差分ファイル記録部12に記憶される。
すなわち、既存電子ファイルに置き換えて、新規電子ファイルとの差分データのデータ量が最も少ない差分データおよび新規電子ファイルを記憶するので、電子ファイルの情報量をより少なくして記憶することができる。換言すると、従来の技術に比べて、同等あるいはより少ない記憶領域でファイルを保管することができる。
入力手段であるファイル指定部18は、ユーザによって入力装置から入力されるファイル名を、出力するために指定されたファイル名として取得する。制御手段であるファイル検索部19は、ファイル指定部18によって指定されたファイル名のファイルが、ファイル記録部11および差分ファイル記録部12のうちのどちらに記憶されているかを検索する。
制御手段であるファイル再生成部20は、ファイル検索部19によって検索されたファイルがファイル記録部11に記憶されている場合は、ファイル指定部18によって指定されたファイル名のファイルをファイル記録部11から読み出し、読み出したファイルの情報をファイル出力部に送る。
ファイル再生成部20は、ファイル検索部19によって検索されたファイルが差分ファイル記録部12に記憶されている場合は、ファイル指定部18によって指定されたファイル名の差分ファイル、およびその差分ファイルのポインタが示す差分対象のファイルの情報に基づいて、ファイル指定部18によって指定されるファイル名のファイルを復元し、復元したファイルの情報をファイル出力部に送る。
その差分ファイルのポインタが示す差分対象が差分ファイルである場合は、ファイル記録部11に記憶されるファイルにたどり着くまでの差分ファイルについて、ファイル記録部11に記憶されるファイルに最も近い差分ファイルから順に元のファイルを復元し、ファイル検索部19によって検索されたファイルの差分ファイルの元のファイルの情報をファイル出力部に送る。
出力手段であるファイル出力部21は、ファイル再生成部20から送られるファイルの情報を出力装置に出力する。
図5は、差分ファイル出力時に関係するファイルを示す図である。ファイル記録部11には、ファイル名「ファイルF」のファイルが記憶され、差分ファイル記録部12には、ファイル記録部11に記憶されるファイル名「ファイルF」のファイルへのポインタを有する差分ファイル名「差分F−1」の差分ファイル、および差分ファイル名「差分F−1」の差分ファイルへのポインタを有する差分ファイル名「差分F−2」の差分ファイルを記憶する。
たとえば、ファイル指定部18によって指定されたファイル名のファイルが「差分F−2」である場合、ファイル再生成部20は、先ず、ファイル記録部11に記憶されるファイル名「ファイルF」のファイルの情報と差分ファイル名「差分F−1」の差分ファイルの差分データとに基づいて、差分ファイル名「差分F−1」の差分ファイルの元のファイルを復元する。次に、復元した差分ファイル名「差分F−1」の差分ファイルの元のファイルの情報と差分ファイル名「差分F−2」の差分ファイルの差分データとに基づいて、差分ファイル名「差分F−2」の差分ファイルの元のファイルを復元する。そして、復元した差分ファイル名「差分F−1」の差分ファイルの元のファイル情報を、ファイル出力部に送り、出力する。
このように、ファイル出力部21によって、情報が出力され、ファイル記録部11によって、各電子ファイルが、各電子ファイルを識別するためのファイル名に対応付けて記憶され、ファイル指定部18によって、ファイル名がさらに入力され、ファイル検索部19およびファイル再生成部20によって、ファイル指定部18によってファイル名が入力されると、ファイル指定部18によって入力されるファイル名が示す電子ファイルがファイル記録部11から検索される。
そして、前記検索された電子ファイルが差分データの電子ファイルである場合は、前記検索された電子ファイルの差分データと、ファイル記録部11に記憶される電子ファイルのうち、前記検索された電子ファイル対応付けられている電子ファイルの情報とに基づいて、前記置き換えられた電子ファイルが復元され、復元された電子ファイルの情報がファイル出力部21によって出力され、前記検索された電子ファイルが新規に作成された情報の電子ファイルである場合は、前記検索された電子ファイルの情報がファイル出力部21によって出力される。
したがって、差分情報として記憶されている電子ファイルについても出力することができる。
図6は、ファイル保管装置1によって実行されるファイル登録処理の処理手順を示すフローチャートである。たとえば表示装置に表示されるメインメニューからファイル登録処理が選択されると、ステップA1に移る。ファイル記録部11には、ファイル名「ファイルF」〜「ファイルFn−1」のn個のファイルが記憶されているとする。
入力ステップであるステップA1では、ファイル取得部13は登録するファイルを取得する。ステップA2では、近似ファイル検索部15は、変数iに「0」、変数minに「0」、およびデータ量Dminにデータ量「D」を代入する。変数iは、ファイル記録部11に記憶されるファイルのうち第何番目のファイルであるかを示す番号であり、「0」から「n−1」の整数である。第i番目のファイルを、ファイル名「ファイルF」の添え字「i」で表す。
変数minは、ファイル記録部11に記憶されるファイルのうち、データ量が最も少ない差分データのファイルを探索するとき、すでに探索したファイルのうち差分データのデータ量が最も少ないファイルの番号を示す変数である。すなわち、第min番目のファイルつまりファイル名「ファイルFmin」のファイルがすでに探索したファイルのうち差分データのデータ量が最も少ないファイルであることを示す。データ量Dminは、ファイル名「ファイルFmin」の差分データのデータ量である。データ量「D」は、可能な限り無限大に近いデータ量を意味し、たとえばファイル記録部11に記憶可能なファイルのデータ量の上限を超える値とする。
ステップA3では、差分検出部14は、ファイル記録部11から第i番目のファイルつまりファイル名「ファイルF」のファイルを読み出す。ステップA4では、差分検出部14は、登録するファイルと、ファイル名「ファイルF」のファイルとの差分データを検出し、検出した差分データのデータ量「D」を算出する。ステップA3およびステップA4は、検出ステップである。
ステップA5では、近似ファイル検索部15は、ステップA4で算出したデータ量「D」がデータ量Dmin未満であるか否かを判定する。データ量「D」がデータ量Dmin未満であると、ステップA10に進み、データ量「D」がデータ量Dmin未満でないと、ステップA6に進む。ステップA6では、近似ファイル検索部15は、変数iに「1」を加算する。ステップA7では、近似ファイル検索部15は、変数iの値がファイル記録部11に記憶されるファイルの数「n」未満であるか否かを判定する。変数iの値が「n」未満であると、ステップA3に戻り、変数iの値が「n」未満でないと、ステップA8に進む。
ステップA8では、近似ファイル検索部15は、データ量Dminが閾値記憶部17に記憶される閾値情報が示す閾値以下であるか否かを判定する。データ量Dminが閾値以下であると、ステップA11に進み、データ量Dminが閾値以下でないと、ステップA9に進む。ステップA9では、近似ファイル検索部15は、登録するファイルを丸ごと保存つまりそのままファイル記録部11に記憶して、ファイル登録処理を終了する。ステップA2、ステップA5〜ステップA8、およびステップA10は、特定ステップである。
ステップA10では、近似ファイル検索部15は、データ量Dminにデータ量Dを代入し、変数minに変数iの値を代入し、ステップA6に進む。制御ステップであるステップA11では、近似ファイル検索部15は、差分で保存し、具体的には、差分ファイル登録処理を呼び出して、差分ファイルを生成し、生成した差分ファイルを差分ファイル記録部12に記憶し、ファイル登録処理を終了する。
図7は、近似ファイル検索部15によって実行される差分ファイル登録処理の処理手順を示すフローチャートである。図6に示したフォローチャートのステップA11で差分ファイル登録処理が呼び出されると、ステップB1に移る。
登録するファイルのファイル名を「ファイルF」とし、ファイル記録部11に記憶されるファイルのうち差分データのデータ量が最もっとも少ないファイルのファイル名を「ファイルF」とし、ファイル名「ファイルF」のファイルとファイル名「ファイルF」のファイルとの差分データの差分ファイル名を「差分D」とする。
ステップB1では、登録するファイルつまりファイル名「ファイルF」のファイルをファイル記録部11に登録つまり記憶する。ステップB2では、差分ファイル名「差分D」の差分ファイルを差分ファイル記録部12に登録つまり記憶する。
ステップB3では、対象ファイルつまり差分データのデータ量が最もっとも少ないファイル名「ファイルF」のファイルに対する差分ファイルを探索する。ファイル名「ファイルF」のファイルに記憶される差分ファイルへのポインタによって、ファイル名「ファイルF」のファイルに対する差分ファイルを探索ことができる。探索した差分ファイルの差分ファイル名を「ファイルFi−1」とする。
ステップB4では、差分ファイル名「ファイルFi−1」の差分ファイルと差分ファイル名「差分D」の差分ファイルとが、お互いを指すように両者間に双方向ポインタを設定する。ステップB5では、登録するファイルつまりファイル名「ファイルF」のファイルと、差分ファイル名「差分D」の差分ファイルとが、お互いを指すように両者間に双方向ポインタを設定する。ステップB6では、ファイル記録部11からファイル名「ファイルF」のファイルを削除して、差分ファイル登録処理を終了する。
図8は、ファイル保管装置1によって実行されるファイル出力処理の処理手順を示すフローチャートである。たとえば表示装置に表示されるメインメニューからファイル出力処理が選択されると、ステップC1に移る。
ステップC1では、ファイル指定部18は、出力するために指定されたファイル名を取得する。ステップC2では、ファイル探索部19は、ファイル指定部18によって指定されたファイル名のファイルを探索する。
ステップC3では、ファイル再生成部20は、ファイル指定部18によって指定されたファイル名のファイルつまりファイル探索部19によって探索されたファイルがファイル記録部11に存在するか否かを判定する。ファイル記録部11に存在すると、ステップC6に進み、ファイル記録部11に存在しないと、ステップC4に進む。
ステップC4では、ファイル再生成部20は、ファイル指定部18によって指定されたファイル名のファイルつまりファイル探索部19によって探索されたファイルが差分ファイル記録部12に存在するか否かを判定する。差分ファイル記録部12に存在すると、ステップC7に進み、差分ファイル記録部12に存在しないと、ステップC5に進む。
ステップC5では、ファイル再生成部20は、ファイル指定部18によって指定されたファイル名のファイルが、ファイル記録部11および差分ファイル記録部12のいずれにも存在しないので、エラー表示のための情報を、ファイル出力部21に送り、出力装置に出力させた後、ファイル出力処理を終了する。
ステップC6では、ファイル再生成部20は、ファイル探索部19によって探索されたファイルをファイル記録部11から読み出し、読み出したファイルの情報をファイル出力部21に送り、出力装置に出力させた後、ファイル出力処理を終了する。
ステップC7では、ファイル再生成部20は、ファイル探索部19によって探索されたファイルつまり差分ファイルを差分ファイル記録部12から読み出す。そして、読み出した差分ファイルに基づいて元のファイルを復元して出力するために復元出力処理を呼び出して復元し、復元した元のファイルの情報をファイル出力部21に送り、出力装置に出力させた後、ファイル出力処理を終了する。
図9は、ファイル再生成部20によって実行される復元出力処理の処理手順を示すフローチャートである。図8に示したフォローチャートのステップC7で復元出力処理が呼び出されると、ステップD1に移る。ファイル指定部18によって指定されたファイル名を「差分F−2」とし、ファイル名「差分F−2」の差分ファイルのポインタが示す差分ファイルのファイル名を「差分F−1」、ファイル名「差分F−1」の差分ファイルのポインタが示すファイルのファイル名を「ファイルF」とする。
ステップD1では、ファイル指定部18によって指定されたファイル名「差分F−2」の差分ファイルからリンクつまりポインタをたどり、ファイル記録部11に記憶されるファイル名「ファイルF」のファイルを特定する。
ステップD2では、特定したファイル名「ファイルF」のファイルから逆にリンクつまりポインタをたどりながら、ファイル名「差分F−1」の差分ファイルの差分データと、ファイル名「差分F−2」の差分ファイルの差分データと順番に特定したファイル名「ファイルF」のファイルに提供して、ファイル名「差分F−2」の差分ファイルの元のファイルを復元する。
ステップD3では、復元した元のファイルの情報をファイル出力部に送り、出力装置に出力して、復元出力処理を終了する。
このように、図6に示したフローチャートにおいて、ステップA1では、新規に作成された情報を電子ファイルとして入力する。ステップA3およびステップA4では、ステップA1で入力された電子ファイルと、既に作成されている情報を情報の集合である電子ファイルとして記憶するファイル記録部11に記憶されたる電子ファイルとの差分を、ファイル記録部11に記憶される電子ファイルごとに差分データとして検出する。ステップA2、ステップA5〜ステップA8、およびステップA10では、ファイル記録部11に記憶される電子ファイルのうち、ステップA3およびステップA4で検出された差分データのデータ量が最も少ない差分データの電子ファイルを特定する。
そして、ステップA11では、ファイル記録部11に記憶される電子ファイルのうち、ステップA2、ステップA5〜ステップA8、およびステップA10で特定された電子ファイルに置き換えて、前記特定された電子ファイルの差分データを電子ファイルとして、およびステップA1で入力された電子ファイルをファイル記録部11および差分ファイル記録部12に記憶する。
したがって、本発明に係る電子ファイル記憶方法を適用すれば、既存電子ファイルに置き換えて、新規電子ファイルとの差分データのデータ量が最も少ない差分データおよび新規電子ファイルを記憶するので、電子ファイルの情報量をより少なくして記憶することができる。換言すると、従来の技術に比べて、同等あるいはより少ない記憶領域でファイルを保管することができる。
本発明の実施の一形態であるファイル保管装置1の機能の構成を示すブロック図である。 ファイル記録部11および差分ファイル記録部12に記憶されるファイルの関係を示す図である。 ファイルFを登録する前のファイル記録部11および差分ファイル記録部12に記憶されるファイルの関係を示す図である。 ファイルFを登録した後のファイル記録部11および差分ファイル記録部12に記憶されるファイルの関係を示す図である。 差分ファイル出力時に関係するファイルを示す図である。 ファイル保管装置1によって実行されるファイル登録処理の処理手順を示すフローチャートである。 近似ファイル検索部15によって実行される差分ファイル登録処理の処理手順を示すフローチャートである。 ファイル保管装置1によって実行されるファイル出力処理の処理手順を示すフローチャートである。 ファイル再生成部20によって実行される復元出力処理の処理手順を示すフローチャートである。 従来の技術によって差分をとった場合の差分の情報量を示す図である。
符号の説明
1 ファイル保管装置
11 ファイル記録部
12 差分ファイル記録部
13 ファイル取得部
14 差分検出部
15 近似ファイル検索部
16 閾値入力部
17 閾値記憶部
18 ファイル指定部
19 ファイル検索部
20 ファイル再生成部
21 ファイル出力部

Claims (5)

  1. 新規に作成された情報を電子ファイルとして入力する入力手段と、
    既に作成されている情報を情報の集合である電子ファイルとして記憶する記憶手段と、
    入力手段によって入力される電子ファイルと、記憶手段に記憶される各電子ファイルとの差分を、記憶手段に記憶される電子ファイルごとに差分情報として検出する検出手段と、
    記憶手段に記憶される電子ファイルのうち、検出手段によって検出される差分情報の情報量が最も少ない差分情報の電子ファイルを特定する特定手段と、
    記憶手段に記憶される電子ファイルのうち、特定手段によって特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分情報を電子ファイルとして、および入力手段によって入力される電子ファイルを記憶手段に記憶させる制御手段とを含むことを特徴とする電子ファイル記憶装置。
  2. 前記入力手段は、電子ファイルとして記憶する差分情報の情報量を制限するための予め定める基準差分情報量を表す基準差分情報量情報をさらに入力し、
    前記制御手段は、前記特定された電子ファイルの差分情報の情報量が、前記入力手段によって入力される基準差分情報量情報が示す基準差分情報量以下のときにのみ、前記特定される電子ファイルに置き換えて、前記特定される電子ファイルの差分情報を電子ファイルとして、および前記入力手段によって入力される電子ファイルを前記記憶手段に記憶させることを特徴とする請求項1に記載の電子ファイル記憶装置。
  3. 前記制御手段は、前記特定される電子ファイルの差分情報を電子ファイルとして前記記憶手段に記憶させるとき、前記入力手段によって入力され、前記記憶手段に記憶される電子ファイルに対応付けて記憶させることを特徴とする請求項1または2に記載の電子ファイル記憶装置。
  4. 情報を出力する出力手段をさらに含み、
    前記記憶手段は、各電子ファイルを、各電子ファイルを識別するためのファイル識別情報に対応付けて記憶し、
    前記入力手段は、電子ファイル識別情報をさらに入力し、
    前記制御手段は、前記入力手段によって電子ファイル識別情報が入力されると、前記入力手段によって入力される電子ファイル識別情報が示す電子ファイルを前記記憶手段から検索し、
    前記検索した電子ファイルが差分情報の電子ファイルである場合は、前記検索した電子ファイルの差分情報と、前記記憶手段に記憶される電子ファイルのうち、前記検索した電子ファイル対応付けられている電子ファイルの情報とに基づいて、前記置き換えられた電子ファイルを復元し、復元した電子ファイルの情報を出力手段によって出力させ、
    前記検索した電子ファイルが新規に作成された情報の電子ファイルである場合は、前記検索した電子ファイルの情報を出力手段よってに出力させることを特徴とする請求項1〜3のいずれか1つに記載の電子ファイル記憶装置。
  5. 新規に作成された情報を電子ファイルとして入力する入力ステップと、
    入力ステップで入力された電子ファイルと、既に作成されている情報を情報の集合である電子ファイルとして記憶する記憶部に記憶されたる電子ファイルとの差分を、記憶部に記憶される電子ファイルごとに差分情報として検出する検出ステップと、
    記憶部に記憶される電子ファイルのうち、検出ステップで検出された差分情報の情報量が最も少ない差分情報の電子ファイルを特定する特定ステップと、
    記憶部に記憶される電子ファイルのうち、特定ステップで特定された電子ファイルに置き換えて、前記特定された電子ファイルの差分情報を電子ファイルとして、および入力ステップで入力された電子ファイルを記憶部に記憶する制御ステップとを含むことを特徴とする電子ファイル記憶方法。
JP2007294850A 2007-11-13 2007-11-13 電子ファイル記憶装置および電子ファイル記憶方法 Pending JP2009122866A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007294850A JP2009122866A (ja) 2007-11-13 2007-11-13 電子ファイル記憶装置および電子ファイル記憶方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007294850A JP2009122866A (ja) 2007-11-13 2007-11-13 電子ファイル記憶装置および電子ファイル記憶方法

Publications (1)

Publication Number Publication Date
JP2009122866A true JP2009122866A (ja) 2009-06-04

Family

ID=40814966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007294850A Pending JP2009122866A (ja) 2007-11-13 2007-11-13 電子ファイル記憶装置および電子ファイル記憶方法

Country Status (1)

Country Link
JP (1) JP2009122866A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502396A (ja) * 2010-11-23 2014-01-30 マイクロソフト コーポレーション 効果的な仮想アプリケーションのアップデート

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502396A (ja) * 2010-11-23 2014-01-30 マイクロソフト コーポレーション 効果的な仮想アプリケーションのアップデート

Similar Documents

Publication Publication Date Title
JP6070936B2 (ja) 情報処理装置、情報処理方法及びプログラム
US9195666B2 (en) Location independent files
US10768928B2 (en) Software development work item management system
JP6446819B2 (ja) 文書差分表示プログラム及び情報処理装置
JP2010102593A (ja) 情報処理装置およびその方法、プログラム、記録媒体
US20070067348A1 (en) Repeated Segment Manager
US20090259654A1 (en) Information processing apparatus, control method thereof, and storage medium
JP2009122866A (ja) 電子ファイル記憶装置および電子ファイル記憶方法
JP5808264B2 (ja) コード生成装置及びコード生成方法及びプログラム
JP4116434B2 (ja) 計算ユニットにおけるテキスト処理方法及び計算ユニット
JP2007004383A (ja) 文書管理装置、文書管理方法、文書管理プログラム及び記録媒体
JP2002163129A (ja) ログレベル定義方法および該方法を実現するプログラムを記録した記録媒体
JP7092992B2 (ja) 文書管理プログラム、文書管理装置および文書管理方法
JP4036852B2 (ja) 差分データ生成装置、差分データ生成方法および差分データ生成プログラム
JP4874670B2 (ja) ポリシー管理装置、ポリシー管理プログラムおよびポリシー管理方法
JP2006072705A (ja) 文書検索装置および方法
JP5298484B2 (ja) 文書処理装置
JP4925711B2 (ja) 一括登録情報生成装置及び一括登録情報生成方法及び一括登録情報生成プログラム
JP2639349B2 (ja) 誤修正行検索装置
JP2720805B2 (ja) プログラム流れ図参照方式
JP4477036B2 (ja) 文書群マスク装置、文書群マスク方法、プログラムおよび記録媒体
JP2009087174A (ja) リソース操作履歴管理システム
JP2008041112A (ja) 差分データ生成装置、差分データ生成装置の差分データ生成方法および差分データ生成プログラム
JP2009245235A (ja) 辞書メンテナンスシステム、方法、及び、プログラム
JP2004070923A (ja) 帳票処理システム