JP2006114058A - ファイル管理装置、及び、その方法 - Google Patents

ファイル管理装置、及び、その方法 Download PDF

Info

Publication number
JP2006114058A
JP2006114058A JP2005363890A JP2005363890A JP2006114058A JP 2006114058 A JP2006114058 A JP 2006114058A JP 2005363890 A JP2005363890 A JP 2005363890A JP 2005363890 A JP2005363890 A JP 2005363890A JP 2006114058 A JP2006114058 A JP 2006114058A
Authority
JP
Japan
Prior art keywords
recording medium
file
electronic
backup
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005363890A
Other languages
English (en)
Inventor
Yasuyuki Higashiura
康之 東浦
Takumi Kishino
琢己 岸野
Masatake Kotani
誠剛 小谷
Koji Yoshioka
孝司 吉岡
Keizo Sato
啓三 佐藤
Hirotaka Inoue
博貴 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2005363890A priority Critical patent/JP2006114058A/ja
Publication of JP2006114058A publication Critical patent/JP2006114058A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】原本性を保証する電子書庫などのファイル管理装置において、文書などのファイルの追い出しあるいはバックアップを適切に行う装置及び方法を提供する。
【解決手段】電子書庫において、電子文書ファイルの追い出しやバックアップを行う場合には、追い出し処理の履歴あるいはバックアップ処理の履歴を格納するファイルを生成し、追い出し処理やバックアップ処理を管理する。これにより、原本がどの媒体に追い出されたか、原本のバックアップはどこにあるかが容易に管理でき、追い出し履歴やバックアップ履歴で示される原本の唯一性を保護するようにすれば、追い出しやバックアップによって、複数の電子書庫の記録媒体に複数の原本が出来てしまうという事態を避けることが出来る。
【選択図】図1

Description

本発明は、ファイル管理装置である電子書庫に関し、特には、電子的に原本性を保証する電子書庫に登録されたファイルの追い出しおよびバックアップに関する。
最近の情報装置の発達につれて、従来、紙ベースで管理されていた文書などが、電子データのまま管理される様になってきている。情報処理装置上では、このような電子データである文書をコピーしたり、改ざんすることが容易に実行でき、これらの文書の原本がどれであるかが不明になる可能性が大きい。このような問題点を解決する手段として、電子書庫という電子文書の原本を管理する情報装置が実用化されている。
原本とコピーの区別を持たせる装置、電子書庫では、下記の機能を持つことにより原本性を実現している。
(1)原本とコピーを区別し、原本を唯一とする。このとき、原本を他の電子書庫に移動したときも原本は唯一となるようにする。
(2)原本の改ざんを検出する。
(3)原本に対する操作事実を記録する。また、その操作事実に対する改ざんも検出する。ここで、操作とは、登録、参照、更新、移動、複写(コピー)、バックアップの作成、他の媒体への追い出し、復元などすべての操作を示す。また、更新においては、各世代の実体も保存する。
(4)原本に対するアクセス権限を制御する。
この場合、基本的には、ファイル(電子文書など)はRAID(Redundant Array of Independent Disks)装置に記録するため、格納するファイルの全容量が大きくなり、RAID装置に収まらなくなる前に、DISKの増設もしくは外部媒体に追い出すことが必要となる。
また、ファイルのバックアップを行う場合、バックアップ元の記録媒体(DISK等)が破壊された場合、バックアップ媒体から、バックアップ時点の状態に復元する。当然前回バックアップ後の情報は復元することは出来ない。しかしながら、原本性(あるいは、原本の唯一性)、すなわち原本とコピーの区別を持たせる電子書庫の場合、バックアップ後のリストアにおいても原本性を保持する必要がある。原本性を保証するためには、追い出しの場合と同様に上記(1)〜(4)の特性を備えておく必要がある。
図24は、電子書庫の文書管理において、管理単位となる文書の系列を説明する図である。
文書1が最初に作成されると、これが電子書庫に格納され、文書1の第1版となる。これと、電子書庫が原本性を保証するために必要とする、文書1の第1版に関する管理情報とを1組の情報として管理する。次に、原本である文書1が更新されて、第2版が出来ると、この第2版の文書1と第2版の文書1の管理情報とが1組として管理される。同様に、文書1の第3版と、文書1の第3版の管理情報とが1組として管理される。このように、同じ文書1が更新を重ねて、順次、第1版から第n版まで更新されたとすると、同一文書の第1版から第n版までの文書を1つの系列と呼ぶ。すなわち、一文書であって、順次更新などを受けて変更されていった経歴を1系列と呼ぶ。従って、二つの文書について、それぞれが更新などを受けて変更されていった場合、2系列の文書が存在すると言う。
原本性を保証する場合には、単なるファイルサーバではなく、上記特別の機能が必要となる。原本を電子的に保存する場合においても、一般のファイルサーバ同様、通常はRAID装置に記録する。RAID装置の容量が満杯になるとDISK装置を追加するか、古いファイルをテープやMOに追い出すことが必要となる。このため、追い出しの制御においても通常のファイルサーバとは異なった配慮が必要である。すなわち、
(1)追い出す場合、無作為に追い出さないようにする。もし無作為に追い出しが出来るとすると、同一系列内各版数の原本が別々の媒体に追い出され管理、運用が煩雑になる。
(2)追い出した情報を他の装置に復元してはならない。これが可能となると原本が二重に存在するだけでなく、セキュリティ上重要な問題が発生する。
(3)追い出した外部媒体の改ざんを検出する必要がある。外部媒体の改ざんを検出しないと追い出し元を故意に故障させ、改ざんしたバックアップ媒体から不正な原本が作成出来てしまうことになる。
(4)追い出したファイルを再度使用する場合、そのファイルがどの媒体に追い出されているかを明確に管理する必要がある。
(5)追い出し作業実施中に外部媒体が満杯になり、予備の媒体が手元にない場合など、追い出しをキャンセルしたくなるケースが想定される。
(6)追い出し履歴ファイルはRAID−DISK故障に備え、バックアップの対象となる。RAID装置破壊後の復元において、下記ケースではDISKが満杯になる場合がある。
(7)追い出しは、常に外部媒体とは限らない、外部媒体への追い出しは人手が介するので、オンライン中の追い出しは都合が悪いケースがある。追い出し先は他の電子書庫にする可能性もある。
図25、26は、追い出し処理において、追い出した文書を復元する場合に、記録媒体に復元しきれない場合の説明をする図である。
まず、図25(a)に示すように、DISKなどの第1の記録媒体に格納されているA〜Fまでの文書を別の第2の記録媒体に全面バックアップする。そして、図25(b)に示されているように、新たな文書Gが追加されたとすると、第1の記録媒体には、まだ空きがあるので、文書Gを格納することが出来る。
次に、図26(a)に示すように、第1の記録媒体が満杯になったので、ここで、文書A〜Cを追い出すとする。このとき、第3の記録媒体に文書A〜Cを移動すると共に、文書A〜Cを追い出したという履歴を残す。次に、図26(b)に示されるように、文書A〜Cを追い出した結果生じた空き領域に、文書H〜Jを追加する。このとき、第1の記録媒体に格納されている文書のバックアップを取る場合には、前回バックアップした内容との差分についてバックアップを取る。すなわち、前回のバックアップ後に追加された、文書G〜Jをバックアップすると共に、文書A〜Cを追い出したという履歴をバックアップする。
ここで、RAID装置である第1の記録媒体が破壊されたとする。すると、バックアップした内容から、新たな記録媒体に、文書A〜Jを復元しようとする。しかし、この新たな記録媒体は、破壊された第1の記録媒体と同じ容量しか有していないので、文書A〜Gまでは、復元することが出来るが、文書H〜Jは、新たな記録媒体に復元することが出来ないことになる。
また、ファイルのバックアップにおいても、原本性を保証するには、単なるファイルサーバではなく、同様に、上記特別の機能が必要となる。原本を電子的に保存する場合においても、一般のファイルサーバ同様、通常はRAID装置に記録する。そのバックアップにおいても、テープ装置やMO装置などに記録することには変わりない。また、前回のバックアップ以降に発生した更新においては、RAID装置が故障した場合は反映できない。これを救済するためには各トランザクション毎にバックアップを取ることが必要になるが、システム性能の大幅な低下を招く。しかしながら、バックアップの後にリストアするためには、通常のファイルサーバのケース以外に下記のような解決すべき課題がある。
(1)リストアする場合、バックアップした情報を全て確実に復元する必要がある。部分的な復元では本来の原本性保証が出来ない。例えば、ある原本を更新した場合、更新履歴の一部のみを復元したのでは、原本に対する操作の保証が出来なくなる。
(2)(1)の対策として復元手順を示した運用媒体を別に用意し、それに伴って復元する場合においても、その媒体が複数存在するとき、どの運用媒体を使用するかをシステム側で管理する必要がある。
(3)バックアップした情報を他の装置に復元してはならない。これが可能となると原本が二重に存在するだけでなくセキュリティ上重要な問題が発生する。
(4)バックアップした外部媒体の改ざんを検出する必要がある。改ざん検出しないとバックアップ元を故意に故障させ、改ざんしたバックアップ媒体から不正な原本が作成できてしまうことになる。
(5)バックアップの後、原本を他の電子書庫に移動したとする。その後RAID装置が故障し、文書を復元すると、元の装置と移動先の装置に二重に原本が存在することになる。
(6)バックアップのタイミングを柔軟に設定し、かつ、バックアップ作業による性能低下を最低限にとどめる必要がある。
(7)複数の原本が関連するようなトランザクションにおいては、バックアップ時にその全ての原本をバックアップするか、いずれもバックアップしないかという制御が必要となる。これは、リストアした後に互いに矛盾する複数のファイルができあがってしまうからである。
本発明の課題は、原本性を保証する電子書庫などのファイル管理装置において、文書などのファイルの追い出しあるいはバックアップを適切に行う装置及び方法を提供することである。
本発明のファイル管理装置は、第一の記録媒体に格納された電子ファイルを、第二の記録媒体に記録する記録処理手段と、前記第二の記録媒体に記録された電子ファイルに関する情報と、前記第二の記録媒体の識別子とを対応付け、処理記録の履歴情報として第三の記録媒体に保存する履歴保存手段と、を備えるファイル管理装置であって、前記記録処理手段によって一連の関連する電子ファイルを第二の記録媒体に記録する場合に、当該一連の関連するすべての電子ファイルのうち第二の記録媒体に記録ができない電子ファイルがある場合には、前記履歴保存手段は該一連の関連するすべての電子ファイルに関する処理記録の履歴情報を第三の記録媒体に記録しないことを特徴とする。
本発明のファイル管理方法は、第一の記録媒体に格納された電子ファイルを第二の記録媒体に記録する記録ステップと、前記第二の記録媒体に記録された電子ファイルに関する情報と、前記第二の記録媒体の識別子とを対応付け、処理記録の履歴情報として第三の記録媒体に保存する履歴保存ステップとを備えるファイル管理方法であって、前記記録ステップにおいて一連の関連する電子ファイルを第二の記録媒体に記録する場合に、当該一連の関連するすべての電子ファイルのうち第二の記録媒体に記録ができない電子ファイルがある場合には、前記履歴保存ステップにおいて該一連の関連するすべての電子ファイルにおける処理記録の履歴情報を第三の記録媒体に記録しないことを特徴とする。
本発明によれば、電子ファイルを処理する場合、例えば、電子ファイルの追い出し、電子ファイルのバックアップを行う場合、これらの履歴を記録しておくので、どの電子ファイルが原本であるかを明確に判断することが出来る。従って、原本は、唯一つだけ保存するようにし、バックアップや追い出しによって、原本とは異なる格納手段、あるいは、記録媒体に記録されたファイルを原本と差別化する事ができ、原本性を損なうことなく、電子ファイルの管理をすることが出来る。
本発明によれば、従来、原本性を保証した追い出し技術は現在未確立であるが、DISK容量を有効に活用するための追い出し技術を提供できる。
本発明によれば、従来、原本性を保証したバックアップ技術は現在未確立であるが、性能を維持しつつ原本性を保証したバックアップ方法を提供できる。
まず、追い出し処理について説明する。
文書ファイルを追い出す時は、その管理上、同一系列のファイルはセットで追い出す方が管理、運用が効率化される。たとえば、すでに登録から月日がたち、この後の更新もまず発生しないと思われる原本がその例である。また、定期的に更新が発生するため最新版のみはアクセスの速いDISKに格納しておきたい場合もある。本発明の実施形態では、同一系列のファイルをセットで追い出すモードと、過去のファイルについてのみ追い出しを行うモードとを有するものとする。これらのモードの実現は、ユーザに指定された同一系列のファイルの更新日時を確認し、最新のもの以外を追い出す処理をするか、ユーザに同一系列のファイルが指定されると、この同一系列の全てのファイルを追い出す処理を行うようにすればよく、当業者によれば容易に実現されるであろう。
また、各々の電子書庫は、電子書庫IDを持っているので、追い出し媒体(追い出すファイルの追い出し先記録媒体)にも、追い出し元となった電子書庫IDを書き込んでおき、復元する場合、他の電子書庫に復元できないようにする。
更に、各々の電子書庫には固有の暗号鍵を持たせる。ファイル追い出す際、その暗号鍵でファイルを暗号化して記録するようにする。
追い出し処理においては、追い出したファイルを再度使用する場合、そのファイルがどの媒体に追い出されているかを明確に管理する必要があり、そのために、追い出した先の媒体にIDを持たせ、追い出したファイルと追い出し先媒体を関連付ける履歴ファイルを持保持するようにする。そして、復元する場合、その履歴ファイルの内容に従って、確実に正しい媒体から復元するようにする。
追い出し作業実施中に外部媒体(追い出し先の媒体)が満杯になり、予備の媒体が手元に無い場合などは、追い出しをキャンセルしたくなるケースが想定される。このときはDISK上のデータはそのまま残し、中途半端に作成された外部媒体上のデータ(未管理データ)は追い出し履歴ファイルに登録しない。これにより、電子書庫内は追い出し前の状態にもどるが、媒体上の中途半端なデータ(未管理データ)は、後に未管理データとして認識可能にしておく。
全面バックアップ、追い出し、差分バックアップを行うと、前述したように、リストアするとき、復元先DISKに収まりきらない場合がある。これに備えて、全面バックアップと差分バックアップとその後に発生したファイルの総容量をカウントしておき、それが所定の容量(例えば、DISK容量の70%)を超えたら、全面バックアップを再度実施するようにユーザに促すようにする。
全面バックアップ後のバックアップに差分バックアップをとるバックアップ方法において、各バックアップは、原本系列単位に操作履歴の最も古い順にバックアップし、リストア時点で追い出し履歴を持つファイルを検出したときは、すでに追い出し済みのファイルの実体を削除しながらリストアする。
バックアップ媒体からのリストアにおいて、同一媒体の中にある追い出し履歴を最初にリストアすることとし、当該ファイルに追い出しが記述されていたら、当該リストア手順にてリストアされたファイルの実体を最初に削除する。
追い出し先は外部媒体に制限されず、同一機能を持つ他の装置であることも可能である。
図1は、本発明の実施形態において使用する追い出し履歴ファイルの構成例である。
図1のような追い出し履歴ファイルは、追い出しファイルと異なる、DISKなどの記録媒体上に格納する。図1の追い出し履歴ファイルは、電子書庫内文書情報、タイムスタンプ、格納媒体、媒体IDのフィールドからなっている。
電子書庫内文書情報は、例えば、文書名であり、図1では、文書A、B、C、D、Eが格納されている。タイムスタンプは、それぞれの文書が追い出し処理を受けた日時を記録するものである。このタイムスタンプは、電子書庫に装備される時計によって記録される時刻である。この時計は、電子書庫の工場出荷時に設定された後には、時刻の変更が出来ないように構成される。格納媒体は、追い出し先記録媒体を識別するための情報であり、今の場合、「MO」と記載されている。すなわち、図1の場合には、文書A〜Eが追い出しされた先の記録媒体の種類は、MOであることが示される。そして、媒体IDは、文書A〜Eが格納された記録媒体(今の場合、MO)を一意に決定する識別子であり、この媒体IDによって、文書A〜Eがどの媒体に格納されているかを特定することが出来る。
従って、一旦追い出した文書ファイルを復元するときには、電子書庫は、この追い出し履歴ファイルを参照し、文書ファイルの復元を行おうとするユーザに対し、例えば、文書Aを復元する際には、媒体ID「ABCD」で特定されるMOを記録媒体読み取り装置にセットするように指示をだす。このようにすることによって、文書A〜Eの原本を一元管理することが出来る。
更に、元のデータに改ざん検出情報を加えて当該電子書庫固有の鍵でデータを暗号化して追い出しを行い、復元するときは、上記追い出し履歴ファイルに基づいてリストアする。このとき、当該電子書庫固有の鍵で復元しながらリストアするので、追い出されたデータの改ざんを防ぐと共に、元の電子書庫に確実に復元することを保証する。
図2〜5は、DISK容量を検出することによって、追い出したファイルを復元する場合に、DISK容量が足りなくなることを回避する方法を説明する図である。
まず、図2(a)に示されるように、第1の記録媒体に文書A〜Cが格納されていたとすると、ある時点で文書A、B、Cをバックアップ媒体に全面バックアップする。次の時点で、図2(b)に示すように、文書Dが追加される。
次に、図3(a)のように、文書A〜Cを追い出す。すると、第1の記録媒体には、文書Dだけが残され、第1の記録媒体の記録可能領域が広がる。次に、図3(b)に示すように、文書Eの追加が行われたとき、第1の記録媒体には、先に追い出した文書A〜Cについての情報、すなわち、文書A〜Cを追い出したという旨の情報も一緒に格納されている。このとき、別の記録媒体には、追い出し履歴ファイルが格納される。次に、図4(a)において、文書Eが格納された時点で、バックアップ要求があったとすると、差分バックアップが行われる。すなわち、文書D、Eがバックアップされると共に、文書A〜Cが先に追い出されている旨の情報もバックアップされる。
そして、次に、図4(b)のように、文書Fが追加されると、図4(c)において、文書A〜Fの総容量が第1の記録媒体のDISK容量の70%を超えたことを検出し、全面バックアップ要求を行う。すると、図5(a)において、現在の第1の記録媒体に記録されている記録内容を全面バックアップする。すなわち、文書A〜Cを追い出したという旨の情報と、文書D〜Fをバックアップする。このようなバックアップ及び追い出しを行っていた場合に、RAIDである第1の記録媒体が破壊された場合には、直前に行った全面バックアップの結果に基づいて復元を行う。すなわち、文書A、B、Cを追い出した旨の情報と、文書D〜Fを復元する。このようにすると、全面バックアップされる情報の中に、文書A〜Cが無くなるので、復元したときに、復元先の記録容量が足りないという事態を避けることができる。
図6〜9は、リストア時点で追い出し履歴を持つファイルを検出した場合の、リストア処理を説明する図である。
まず、図6(a)に示されるように、メインの記録装置である第1の記録媒体に記録されている文書A〜Fの全面バックアップを行う。これにより、バックアップ媒体には、文書A〜Fが格納される。次に、図6(b)において、文書Gが第1の記録媒体に追加されたとする。次に、図7(a)において、文書A、B、Cを別の記録媒体に追い出し、文書A、B、Cを追い出した旨の情報を第1の記録媒体に格納する。このとき、追い出し履歴ファイルも別の媒体に記録される。そして、図7(b)において、更に、文書H、Iが追加されたとする。すると、図8(a)において、バックアップを行う。ここでのバックアップは、差分バックアップとなる。すなわち、文書G、H、Iと文書A、B、Cを追い出した旨の情報がバックアップされる。
この時点で、RAIDである第1の記録媒体が破壊されると、図8(b)において、リストアを行う。このとき、最初に全面バックアップが取られた、文書A〜Fが復元される。
次に、2回目のバックアップ(差分バックアップ)したものが復元される。まず、図9(a)において、文書Gが復元される。次に、図9(b)に示されているように、バックアップファイルの内容に、文書A、B、Cを追い出した旨の情報があるので、文書A、B、Cを追い出し状態にする。このとき、実際の文書A〜Cのデータの追い出し処理は行われない。なぜならば、文書A〜Cは、図7(a)において、既に原本が追い出されているからである。従って、図9(b)においては、文書A〜Cを削除し、文書A〜Cを追い出した旨の情報が復元される。そして、図9(c)において、文書HとIが復元されて、リストア処理が終了する。
図10〜12は、図6〜9のリストア処理の別の実施形態を説明する図である。
本実施形態においては、図9の処理を以下の通りに実行する。
すなわち、図10に示されるように、まず、バックアップ媒体に格納されている2回目のバックアップ情報から、文書A、B、Cの追い出しを行った旨の情報を復元する。そして、次に、図11(a)において、先にバックアップが取られた、文書Gを復元し、次に、図11(b)において、文書H、Iを復元する。
なお、ここで、前回のバックアップから次のバックアップの間に、文書X、Y、Zを追加し、文書X、Y、Zを追い出した場合、次の差分バックアップ時には、文書X、Y、Zの追い出し履歴のみがバックアップされる。すなわち、図12(a)のように、文書X、Y、Zが第1の記録媒体に格納され、図12(b)に示すように、文書X、Y、Zを追い出した場合には、文書X、Y、Zの文書データがバックアップ媒体に格納されると共に、第1の記録媒体には、文書X、Y、Zを追い出した旨の情報が格納される。そして、次に、図12(c)で示されるように、バックアップを取るときは、差分バックアップとなり、文書X、Y、Zを追い出した旨の情報のバックアップが取られる。
図13、14は、追い出し処理の具体例を説明する図である。
追い出し処理の具体例としては、例えば、ファイルA、B、Cは、ある業務に関連するファイルで、D、E及びF、Gは別の業務に関連しており、DISK容量が枯渇してきたので、一括して追い出せるものを追い出そうとする場合を考える。
まず、Begin Transactionで処理を開始し、最初に、未管理データを削除する。そして、文書A〜CをDISKから媒体に追い出す。文書A〜Cの追い出しが終了すると、一連の追い出し処理はCommitによって終了する。次に、文書D、Eを追い出ししようとする。この場合にも、Begin Transactionによって処理を開始する。そして、文書Dを最初に追い出し、次に、文書Eを追い出そうとする。しかし、文書Eは、媒体が一杯になってしまったので、追い出すことが出来ない。従って、Begin Transactionで開始した処理は不成功であったとして、Rollbackを行って処理を終了する。この結果、追い出し処理を途中で中断したので、追い出し履歴ファイルに追い出し履歴を追加しない。従って、媒体に書き込んだ文書Dのデータは、未管理データとなる。この結果、追い出し履歴ファイルには、A、B、Cのみが記録される。一方、媒体上には、A、B、C、Dが記録されている。引き続いて、同様にF、Gを追い出し処理を行う場合、Begin Transactionで開始する追い出し処理において、最初に、未管理データである、文書Dを媒体から削除する。そして、文書F、GをDISKから媒体に追い出し、成功すると、Commitして処理を終了する。このように、媒体上の文書Dは未管理データとして認識され、削除されると共に、文書F、Gの容量が媒体上に収まればトランザクションは成立する。
次に、バックアップ処理について説明する。
本発明の実施形態では、ファイルのバックアップを行ったとき、どのファイルをどこへ格納したかの履歴を別の媒体に記録する。
従来は、復元手順はシステム管理者の運用に任されており、一部ファイルの復元を省略、忘却しても必要なファイルのみ復元されていれば、運用に耐えうるケースが多かった。本発明の実施形態では、上記バックアップ履歴ファイルの内容を元に復元作業を行うことにより確実な復元作業を実現することが出来る。
バックアップファイルを格納した媒体が複数ある時、どの媒体を使用して復元をすれば良いかを、システムがバックアップ履歴ファイルによって把握しておくことにより作業をより確実なものにすることが出来る。
各々の電子書庫には電子書庫IDを持たせる。バックアップ履歴ファイルにもその電子書庫IDを書き込んでおき、復元する場合、他の電子書庫に復元できないようにする。
あるいは各々の電子書庫に固有の暗号鍵を持たせる。バックアップする際、その暗号鍵でファイルを暗号化して記録する。
ある時点でのバックアップ後の原本移動のトランザクション発生時、その事実を通常の記録装置(RAID装置)以外の箇所(C−MOSメモリなど)に記録しておくようにする。復元する時はその事実を元に移動先の電子書庫と照合を取りながら二重原本を防ぐ。
なお、当該情報は次のバックアップ時に削除することができるので、C−MOSメモリ容量は最小限にすることが出来る。
バックアップ操作は全面バックアップするモードと、全面バックアップの後に変更された差分をバックアップするモードを備え、当該装置の運用中(オンライン中)に差分バックアップを実施可能とするため、差分バックアップ対象ファイルを抽出し、未使用のものから順に排他をかける。当該ファイルのうち、一部が使用中の場合は使用中が解除されるまで待ち合わせ、対象ファイルを全て排他完了後バックアップする第一のモードを持たせる。しかしながら、本モードでは、全ての対象ファイルを獲得するまで、他のファイルがバックアップトランザクションにより排他されているため、その後に発生した要求が待たされることになる。このため、対象ファイルの内、未使用中のファイルのみに排他をかけてからバックアップし、そのとき使用中の対象ファイルの次回のバックアップタイミングまで保留する第二のモードを持つ。
図15は、バックアップ履歴ファイルの構成例である。
バックアップ履歴ファイルには、モード、タイムスタンプ、媒体、枚数、媒体ID、ラベルのフィールドが設けられている。モードは上記した、全面バックアップか差分バックアップかを示す。図15では、最初のバックアップのみが全面バックアップになっている。タイムスタンプは、バックアップが行われた時刻を前述のような電子書庫に付属の時計によって計時して、記録するものである。媒体は、バックアップ先の媒体が何の媒体であるかを示しており、図15では、全てMOとなっている。また、枚数は、バックアップファイルが何枚の媒体にわたって記録されているかを示しており、図15では、最初の全面バックアップの時に、MOを2枚使用していることが記載されている。その他の差分バックアップの時には、MOを1枚ずつ使用している。媒体IDは、バックアップファイルが格納されている媒体のIDを示すもので、2回目から4回目の差分バックアップにおいては、同じ媒体が使用されていることが示されている。ラベルは、バックアップ処理を一意に決定するための識別子であり、バックアップ処理それぞれにラベルが貼られる。図15では、2回目から4回目の差分バックアップ処理は処理としては、同じ1トランザクションとして識別子が与えられている。
トランザクションによっては、ファイルA0、B0、C0を関連付けて登録、更新する場合がある。これらのファイルを更新してA1、B1、C1とした後、バックアップを行おうとしたとき、偶然、当該バックアップ以外のトランザクションがファイルC1を閲覧中により使用中の場合があり得る。このとき、上記第二のモードでは、A1、B1のみバックアップを行うこととなり、その後RAIDが破壊すると、復元した場合、A1、B1、C0となり3者の整合性が満たされない状態で復元されることになる。これを防ぐため下記処理フローを採用する。
複数のファイルを関連付けてアクセスする場合、下記の手順を取る。
(1)BEGIN TRANSACTION
(2)ファイルA獲得(排他)、更新
(3)ファイルB獲得(排他)、更新
(4)ファイルC獲得(排他)、更新
(5)COMMIT(ファイルA、B、C解放)
電子書庫は当該トランザクションの経緯を監視し、ファイルA、B、Cが関連付けられていることを認識し、バックアップの際、上記第2のモードでは、A、B、Cとも獲得出来たときのみバックアップを行い、いずれか一つでも獲得出来なかった場合は、その次のバックアップのタイミングでバックアップを行うこととする。
また、バックアップしたファイルのリストアは、システム初期化状態(インストール直後)のみリストアを許可する。
最新のバックアップデータを復元しても、バックアップ以後のデータは復元できない。そのため、登録された文書が都合の悪いデータであった場合、バックアップデータを復元することで、都合の悪いデータを破棄することが可能となる。
そのような状況も防ぐために、システムインストール直後のみ、リストアを許可するものである。リストアを行うのはディスクが壊れた場合であり、その場合は、システムのインストールも実施される。そのため、システムインストール状態でのみ、リストアを許可する。
復元(リストア)時は、上記運用媒体(ユーザがメインに作業を行うために使用する媒体)内のデータを元に手順を管理者に通知し、その手順に沿って復元するものとする。
図16は、バックアップの世代を説明する図である。
バックアップの世代とは、原本から、何回目のバックアップを受けたファイルであるかを示すものであり、第N世代目のファイルという(Nは、バックアップの回数)。バックアップの世代を複数持つとき、運用媒体のどれを使用すれば良いかをRAID−DISK以外の他の場所(C−MOSメモリ、あるいは、RAM等)に格納しておくことにより、復元作業を確実なものにする。また、C−MOSメモリの内容はDISKにバックアップを取る。C−MOSメモリ破壊時はDISKからC−MOSメモリへ復元し、RAID−DISK破壊時は、まずシステムを復元し、C−MOSメモリ情報→最新の運用媒体→バックアップ媒体の順に復元手順を行う。
図17は、バックアップデータの構成を示す図である。
バックアップされたデータの改ざんを防ぐとともに、元の電子書庫に確実に復元することを保証する。そのために、図17のようなデータ構成を採用する。
ヘッダ部には以下の情報を記録する。
(1)電子書庫ID(各電子書庫固有の暗号鍵で暗号化する)。
(2)タイムスタンプ(前述と同様)
(3)媒体ID(運用媒体に符合するIDを電子書庫固有の暗号鍵で暗号化する)。
また、バックアップでの改ざん、閲覧を禁止するためバックアップデータを電子書庫に固有の鍵で暗号化しておく。更にMAC(Mesage Authentication Code)などの改ざん検出コードを付与しておく。これにより、暗号化データそのものを無作為に改ざんしても検出可能となる。
なお、電子書庫内の暗号化および電子書庫IDを格納するエリアはアラームグリッドで覆われ、当該情報を盗む行為により、アラームグリッドが切断され、それをトリガに上記情報を消去することによりセキュリティを強化する。
図18は、原本の移動を伴う場合の処理を説明する図である。
図19は、移動を伴う原本のバックアップを行う場合の処理を説明する図である。
図18に示されるように、トランザクションの中には、原本の移動を行うものがある。原本の移動とは、ある電子書庫内の原本を別の電子書庫に移動し、当該電子書庫には、「別の電子書庫に原本を移動した」と言う情報を記録する。
また、図19に示されるように、原本バックアップ後、原本移動を行い、その後電子書庫1のRAIDが破壊すると、復元された電子書庫1と電子書庫2の原本が二重に存在することになる。
その他の行為(登録、更新等)は当然バックアップ後のRAID破壊に対しては、その間の作業は消失するが二重原本の存在は発生しない。
差分バックアップ時、対象となるファイルは前回のバックアップ後に変動があったファイルのみである。原本性保証を行う装置の場合、原本の操作事実の保証が必要となるので、更新のみでなく、参照、移動などすべての行為を差分バックアップの対象とする。
例えば、A0、B0、C0、D0、E0、F0、G0、H0、I0、J0と10個のファイルが存在していたとする。前回バックアップでその全てをバックアップした後、A0を更新してA1、B0を参照してB1と言うように全てに何らかの操作が発生した場合、次のバックアップではA1〜J1の全てをバックアップする必要がある。本来バックアップする場合、その全てを排他制御するべきであるが、バックアップトランザクション発生時、A1、B1、C1は更に他のトランザクションで使用中(排他中)の場合、D1〜J1をまずバックアップトランザクションが排他獲得し、A1、B1、C1が解放されるのを待つことになる(そのときはA2、B2、C2となっている)。そして、全対象を獲得してからバックアップ作業を開始する。その間他のトランザクションがD1〜J1のいずれを使用したくても、バックアップ処理のための獲得が行われているので使用できない。この方法は確実ではあるが、運用面では性能低下を免れないことになる。
そこで、上記においては獲得できたD1〜J1のみをバックアップしてA2、B2、C2のバックアップは、今回はあきらめるという動作を行うモードを設ける。これにより、他のトランザクションがD1〜J1を使用したい場合、当該バックアップ時間のみ待てば良いことになる。
図20は、トランザクション処理とバックアップについて説明するための図(その1)である。
電子書庫では、複数の原本に対して一連の関連操作を行ったことで初めて成立するトランザクションを定義することが可能である。例えば、レポートや稟議書の表紙、添付ファイル1(テキスト)、添付ファイル2(画像)をおのおのを電子書庫上で原本管理すると共に、改版時は、2つの添付ファイルをセットで更新したいケースもサポートする。このときは、以下の手順で原本の操作を行う。上記3つのファイルをA0、B0、C0とするとそれをセットで更新する場合、以下のようにする。
(1)BEGIN TRANSACTION(“1”)
(2)ファイルA0獲得(排他)、更新
(3)ファイルB0獲得(排他)、更新
(4)ファイルC0獲得(排他)、更新
(5)COMMIT(ファイルA、B、C解放)
まず、(1)で、以降のトランザクションはセットであることを宣言する。図示しないトランザクションID(ここでは、“1”)でこれらの文書への処理を電子書庫内で管理する。その後、まず、A0を排他獲得し、ついで、B0、C0を排他獲得する。一度排他獲得したファイルは(5)のCOMMITまで解放しない。COMMIT完了後、各ファイルはA1、B1、C1となる。
当該一連のトランザクションが終了した後、バックアップを実施し、バックアップトランザクションがA1、B1を獲得し、C1を獲得しようとする前に他のトランザクションがC1を参照(閲覧)のため獲得してしまったと仮定する(本参照によりC2になる)。すると、A1とB1のみバックアップする事になる。
これを解決するため、RAIDとは異なる領域(バッテリバックアップされたC−MOSメモリなど)にトランザクション毎にセットで操作されたファイルを登録しておき、バックアップ時に、そのセットが全て獲得できたときのみ、バックアップを実施する。バックアップ終了後、当該C−MOSメモリの情報はクリアする。バックアップしなかった場合は、C−MOSメモリの情報は保持し、次回のバックアップ時その情報を使用する。
図21は、トランザクション処理の記録を取る場合の処理の概念図である。
図22は、トランザクション処理とバックアップについて説明するための図(その2)である。
トランザクション処理とバックアップの関係は、図22のようになる。まず、Begin Transactionによって文書A0、B0、C0を順次獲得して、更新する。そして、Commitによって処理を終了する。その後、文書D0の更新が生じたとする。バックアップする場合には、更新後の文書A1〜D1について、順次獲得していくが、今の場合、文書C1が獲得できなかったとする。つまり、他の処理によって、C1が参照などされているとする。すると、一連の処理によって、互いに関連付けられたファイルである文書A1〜C1については、バックアップを保留し、これらの文書とは独立に生成された文書D1についてのみバックアップ処理を行う。そして、その後、文書A1〜D1は解放される。このような処理により、今バックアップするのはD1のみとなる。
このように、Begin TransactionとCommitで囲まれたトランザクションで関連付けて生成、更新などがされた文書A1〜C1は、これら全てが獲得できない限り、バックアップを取らないようにすることにより、関連のある文書A1〜C1の整合性が、バックアップ処理によって破壊されることを防ぐことが出来る。
図23は、本発明の実施形態の処理をプログラム(ソフトウェア)で実現する場合に必要とされる電子書庫のハードウェア構成を説明する図である。
CPU11は、バス10を介して、ROM12、RAM13、通信インターフェース14、C−MOSメモリ15、記録媒体19、記録媒体読み取り装置20、入出力装置22に接続される。このような電子書庫の場合、格納すべき電子文書は、ハードディスクなどの記録媒体19や、MO、フレキシブルディスクなどの可搬記録媒体21に格納される。CPU11は、記録媒体19からは、バス10を介して直接、電子文書にアクセスし、追い出し処理やバックアップ処理を行う。追い出し先やバックアップ先は、例えば、可搬記録媒体21であり、可搬記録媒体21は、記録媒体読み取り装置20を介してCPU11からのアクセスを受ける。また、電子文書は、RAM13に格納することも可能であるが、RAM13は、揮発性メモリであるので、電子文書を半永久的に保管するためには、記録媒体19や可搬記録媒体21に記録する必要がある。上記実施形態で述べたC−MOSメモリ15は、バックアップをどの電子書庫にしたかの情報を一時的に格納する。C−MOSメモリ15は、図23のRAM13のような揮発性のメモリであり、C−MOSメモリ15をRAM13で代用することも可能である。
また、ROM12は、電子書庫の基本的入出力を可能とするためのBIOSなどが格納され、ユーザが入出力装置22からCPU11に対して、バックアップするべき旨の命令、あるいは、追い出しすべき旨の命令などを入力することや、CPU11が処理を行った結果をユーザに提示することを可能とする。ここで、入出力装置22は、ディスプレイ、マウス、キーボードなどからなっている。また、電子書庫の処理に基本的な、電子文書の格納処理や文書管理処理、追い出し、バックアップ処理、あるいは、追い出し履歴ファイル、バックアップ履歴ファイルの生成プログラムをROM12に格納して実行することが可能である。もちろん、これらの処理を行うプログラムは記録媒体19や可搬記録媒体21に記録しておき、CPU11が、これらからRAM13に当該プログラムを展開することによって、上記処理を行えるようにすることも可能である。
また、電子書庫には、他の電子書庫などのデータベース18にネットワーク17を介して接続するための通信インターフェース14を設けても良い。この場合、記録媒体19の容量がいっぱいになったときや、可搬記録媒体21が使用できない場合などに、通信インターフェース14を用いて、他の電子書庫などのデータベース18に、追い出すべき文書あるいは、バックアップするべき文書のバックアップファイルをネットワーク17経由で格納するようにすることも可能である。
更に、電子文書の格納処理や管理処理、追い出し、バックアップ処理などの本発明の実施形態に関連する処理を行うためのプログラムを他の電子書庫などのデータベース18からネットワーク17を介してダウンロードし、CPU11がこのプログラムを実行するようにすることも可能である。あるいは、ネットワーク17がLANなどのように構成されている場合には、ネットワーク環境のもとでの電子文書管理を行うことが出来る。
なお、上記実施形態の説明では、暗号化については詳細には述べなかったが、情報装置である電子書庫に固有のIDを設けることは、よく知られており、また、暗号化の具体的方法も、DESなどに代表されるようによく知られているので、当業者によれば容易に実現されるであろう。
(付記1)電子ファイルを格納する格納手段と、
該電子ファイルを処理する処理手段と、
該処理の履歴を記録する履歴ファイルを生成する履歴生成手段と、
該履歴ファイルを保存する保存手段と、
を備えることを特徴とするファイル管理装置。
(付記2)前記処理は、電子ファイルの追い出しであることを特徴とする付記1に記載のファイル管理装置。
(付記3)前記履歴ファイルは、電子ファイルの登録、更新、参照などの操作や、操作の回数を管理し、一の電子ファイルの系列全てを追い出す第1のモードと、一の電子ファイルの内、最新の電子ファイルのみを追い出す第2のモードとを備えることを特徴とする付記2に記載のファイル管理装置。
(付記4)前記履歴ファイルには、追い出し元媒体の識別子が格納され、追い出された電子ファイルをリストアする場合には、該識別子で特定される媒体以外にはリストアを行わないことを特徴とする付記2に記載のファイル管理装置。
(付記5)追い出すべき電子ファイルを、前記ファイル管理装置に固有の鍵で暗号化することを特徴とする付記2に記載のファイル管理装置。
(付記6)一連の関連する電子ファイルを追い出す場合には、当該一連の関連する全ての電子ファイルの内、追い出し不可能な電子ファイルがある場合には、追い出し処理を中断することを特徴とする付記2に記載のファイル管理装置。
(付記7)リストア時点で、前記履歴ファイルに追い出した履歴が記録されている電子ファイルを検出した場合には、リストア済みの電子ファイルの内、追い出し履歴が記録されている電子ファイルをリストア先から削除することを特徴とする付記2に記載のファイル管理装置。
(付記8)前記処理は、バックアップ処理であることを特徴とする付記1に記載のファイル管理装置。
(付記9)前記履歴ファイルには、バックアップの履歴の他に追い出し処理の履歴が記録され、バックアップ先から電子ファイルをリストアする場合に、追い出し処理の履歴を最初にリストアし、該追い出し履歴に記録されている電子ファイルは、リストア後削除されることを特徴とする付記8に記載のファイル管理装置。
(付記10)前記履歴ファイルには、バックアップされたファイルに関する情報と、バックアップ先の媒体の識別子を格納することを特徴とする付記8に記載のファイル管理装置。
(付記11)前記履歴ファイルには、バックアップ元の媒体の識別子が格納されることを特徴とする付記10に記載のファイル管理装置。
(付記12)前記電子ファイルは、バックアップ元の前記ファイル管理装置に固有の鍵を用いて暗号化された後、バックアップされることを特徴とする付記8に記載のファイル管理装置。
(付記13)前記バックアップ処理は、前記格納手段に格納されている全ての電子ファイルをバックアップする全面バックアップモードと、前回のバックアップ内容との差異のみをバックアップする差分バックアップモードとを有することを特徴とする付記8に記載のファイル管理装置。
(付記14)前記バックアップ処理は、差分バックアップ対象の電子ファイルを抽出した時点で、該電子ファイルがアクセス不可能な場合には、アクセス可能になるまでバックアップ処理を待ち合わせ、差分バックアップ対象の電子ファイルの内、アクセス可能な電子ファイルのみバックアップすることを特徴とする付記13に記載のファイル管理装置。
(付記15)一連の関連する電子ファイルをバックアップする場合には、当該一連の関連する全ての電子ファイルの内、バックアップ不可能な電子ファイルがある場合には、バックアップ処理を中断することを特徴とする付記8に記載のファイル管理装置。
(付記16)(a)電子ファイルを格納するステップと、
(b)該電子ファイルを処理するステップと、
(c)該処理の履歴を記録する履歴ファイルを生成するステップと、
(d)該履歴ファイルを保存するステップと、
を備えることを特徴とするファイル管理方法。
(付記17)前記処理は、電子ファイルの追い出しであることを特徴とする付記16に記載のファイル管理方法。
(付記18)前記履歴ファイルは、電子ファイルの登録、更新、参照などの操作や、操作の回数を管理し、一の電子ファイルの系列全てを追い出す第1のモードと、一の電子ファイルの内、最新の電子ファイルのみを追い出す第2のモードとを備えることを特徴とする付記17に記載のファイル管理方法。
(付記19)前記履歴ファイルには、追い出し元媒体の識別子が格納され、追い出された電子ファイルをリストアする場合には、該識別子で特定される媒体以外にはリストアを行わないことを特徴とする付記17に記載のファイル管理方法。
(付記20)追い出すべき電子ファイルを、前記ファイル管理装置に固有の鍵で暗号化することを特徴とする付記17に記載のファイル管理方法。
(付記21)一連の関連する電子ファイルを追い出す場合には、当該一連の関連する全ての電子ファイルの内、追い出し不可能な電子ファイルがある場合には、追い出し処理を中断することを特徴とする付記17に記載のファイル管理方法。
(付記22)リストア時点で、前記履歴ファイルに追い出した履歴が記録されている電子ファイルを検出した場合には、リストア済みの電子ファイルの内、追い出し履歴が記録されている電子ファイルをリストア先から削除することを特徴とする付記17に記載のファイル管理方法。
(付記23)前記処理は、バックアップ処理であることを特徴とする付記16に記載のファイル管理方法。
(付記24)前記履歴ファイルには、バックアップの履歴の他に追い出し処理の履歴が記録され、バックアップ先から電子ファイルをリストアする場合に、追い出し処理の履歴を最初にリストアし、該追い出し履歴に記録されている電子ファイルは、リストア後削除されることを特徴とする付記23に記載のファイル管理方法。
(付記25)前記履歴ファイルには、バックアップされたファイルに関する情報と、バックアップ先の媒体の識別子を格納することを特徴とする付記23に記載のファイル管理方法。
(付記26)前記履歴ファイルには、バックアップ元の媒体の識別子が格納されることを特徴とする付記25に記載のファイル管理方法。
(付記27)前記電子ファイルは、バックアップ元の前記ファイル管理装置に固有の鍵を用いて暗号化された後、バックアップされることを特徴とする付記23に記載のファイル管理方法。
(付記28)前記バックアップ処理は、前記格納手段に格納されている全ての電子ファイルをバックアップする全面バックアップモードと、前回のバックアップ内容との差異のみをバックアップする差分バックアップモードとを有することを特徴とする付記23に記載のファイル管理方法。
(付記29)前記バックアップ処理は、差分バックアップ対象の電子ファイルを抽出した時点で、該電子ファイルがアクセス不可能な場合には、アクセス可能になるまでバックアップ処理を待ち合わせ、差分バックアップ対象の電子ファイルの内、アクセス可能な電子ファイルのみバックアップすることを特徴とする付記28に記載のファイル管理方法。
(付記30)一連の関連する電子ファイルをバックアップする場合には、当該一連の関連する全ての電子ファイルの内、バックアップ不可能な電子ファイルがある場合には、バックアップ処理を中断することを特徴とする付記23に記載のファイル管理方法。
(付記31)コンピュータに
(a)電子ファイルを格納するステップと、
(b)該電子ファイルを処理するステップと、
(c)該処理の履歴を記録する履歴ファイルを生成するステップと、
(d)該履歴ファイルを保存するステップと、
を備えることを特徴とするファイル管理方法を実現させるプログラムを格納した、コンピュータ読み取り可能な記録媒体。
(付記32)前記処理は、電子ファイルの追い出しであることを特徴とする付記31に記載の記録媒体。
(付記33)前記履歴ファイルは、電子ファイルの登録、更新、参照などの操作や、操作の回数を管理し、一の電子ファイルの系列全てを追い出す第1のモードと、一の電子ファイルの内、最新の電子ファイルのみを追い出す第2のモードとを備えることを特徴とする付記32に記載の記録媒体。
(付記34)前記履歴ファイルには、追い出し元媒体の識別子が格納され、追い出された電子ファイルをリストアする場合には、該識別子で特定される媒体以外にはリストアを行わないことを特徴とする付記32に記載の記録媒体。
(付記35)追い出すべき電子ファイルを、前記ファイル管理装置に固有の鍵で暗号化することを特徴とする付記32に記載の記録媒体。
(付記36)一連の関連する電子ファイルを追い出す場合には、当該一連の関連する全ての電子ファイルの内、追い出し不可能な電子ファイルがある場合には、追い出し処理を中断することを特徴とする付記32に記載の記録媒体。
(付記37)リストア時点で、前記履歴ファイルに追い出した履歴が記録されている電子ファイルを検出した場合には、リストア済みの電子ファイルの内、追い出し履歴が記録されている電子ファイルをリストア先から削除することを特徴とする付記32に記載の記録媒体。
(付記38)前記処理は、バックアップ処理であることを特徴とする付記31に記載の記録媒体。
(付記39)前記履歴ファイルには、バックアップの履歴の他に追い出し処理の履歴が記録され、バックアップ先から電子ファイルをリストアする場合に、追い出し処理の履歴を最初にリストアし、該追い出し履歴に記録されている電子ファイルは、リストア後削除されることを特徴とする付記38に記載の記録媒体。
(付記40)前記履歴ファイルには、バックアップされたファイルに関する情報と、バックアップ先の媒体の識別子を格納することを特徴とする付記38に記載の記録媒体。
(付記41)前記履歴ファイルには、バックアップ元の媒体の識別子が格納されることを特徴とする付記40に記載の記録媒体。
(付記42)前記電子ファイルは、バックアップ元の前記ファイル管理装置に固有の鍵を用いて暗号化された後、バックアップされることを特徴とする付記38に記載の記録媒体。
(付記43)前記バックアップ処理は、前記格納手段に格納されている全ての電子ファイルをバックアップする全面バックアップモードと、前回のバックアップ内容との差異のみをバックアップする差分バックアップモードとを有することを特徴とする付記38に記載の記録媒体。
(付記44)前記バックアップ処理は、差分バックアップ対象の電子ファイルを抽出した時点で、該電子ファイルがアクセス不可能な場合には、アクセス可能になるまでバックアップ処理を待ち合わせ、差分バックアップ対象の電子ファイルの内、アクセス可能な電子ファイルのみバックアップすることを特徴とする付記43に記載の記録媒体。
(付記45)一連の関連する電子ファイルをバックアップする場合には、当該一連の関連する全ての電子ファイルの内、バックアップ不可能な電子ファイルがある場合には、バックアップ処理を中断することを特徴とする付記38に記載の記録媒体。
本発明の実施形態において使用する追い出し履歴ファイルの構成例である。 DISK容量を検出することによって、追い出したファイルを復元する場合に、DISK容量が足りなくなることを回避する方法を説明する図(その1)である。 DISK容量を検出することによって、追い出したファイルを復元する場合に、DISK容量が足りなくなることを回避する方法を説明する図(その2)である。 DISK容量を検出することによって、追い出したファイルを復元する場合に、DISK容量が足りなくなることを回避する方法を説明する図(その3)である。 DISK容量を検出することによって、追い出したファイルを復元する場合に、DISK容量が足りなくなることを回避する方法を説明する図(その4)である。 リストア時点で追い出し履歴を持つファイルを検出した場合の、リストア処理を説明する図(その1)である。 リストア時点で追い出し履歴を持つファイルを検出した場合の、リストア処理を説明する図(その2)である。 リストア時点で追い出し履歴を持つファイルを検出した場合の、リストア処理を説明する図(その3)である。 リストア時点で追い出し履歴を持つファイルを検出した場合の、リストア処理を説明する図(その4)である。 図6〜9のリストア処理の別の実施形態を説明する図(その1)である。 図6〜9のリストア処理の別の実施形態を説明する図(その2)である。 図6〜9のリストア処理の別の実施形態を説明する図(その3)である。 追い出し処理の具体例を説明する図(その1)である。 追い出し処理の具体例を説明する図(その2)である。 バックアップ履歴ファイルの構成例である。 バックアップの世代を説明する図である。 バックアップデータの構成を示す図である。 原本の移動を伴う場合の処理を説明する図である。 移動を伴う原本のバックアップを行う場合の処理を説明する図である。 トランザクション処理とバックアップについて説明するための図(その1)である。 トランザクション処理の記録を取る場合の処理の概念図である。 トランザクション処理とバックアップについて説明するための図(その2)である。 本発明の実施形態の処理をプログラム(ソフトウェア)で実現する場合に必要とされる電子書庫のハードウェア構成を説明する図である。 電子書庫の文書管理において、管理単位となる文書の系列を説明する図である。 追い出し処理において、追い出した文書を復元する場合に、記録媒体に復元しきれない場合の説明をする図(その1)である。 追い出し処理において、追い出した文書を復元する場合に、記録媒体に復元しきれない場合の説明をする図(その2)である。
符号の説明
10 バス
11 CPU
12 ROM
13 RAM
14 通信インターフェース
17 ネットワーク
18 他の電子書庫などのデータベース
19 記録媒体
20 記録媒体読み取り装置
21 可搬記録媒体
22 入出力装置

Claims (9)

  1. 第一の記録媒体に格納された電子ファイルを、第二の記録媒体に記録する記録処理手段と、
    前記第二の記録媒体に記録された電子ファイルに関する情報と、前記第二の記録媒体の識別子とを対応付け、処理記録の履歴情報として第三の記録媒体に保存する履歴保存手段と、
    を備えるファイル管理装置であって、
    前記記録処理手段によって一連の関連する電子ファイルを第二の記録媒体に記録する場合に、当該一連の関連するすべての電子ファイルのうち第二の記録媒体に記録ができない電子ファイルがある場合には、前記履歴保存手段は該一連の関連するすべての電子ファイルに関する処理記録の履歴情報を第三の記録媒体に記録しないことを特徴とするファイル管理装置。
  2. 前記記録処理手段は、第一の記録媒体から選択された複数のファイルを一括して前記第二の記録媒体に記録処理をする場合に、当該複数のファイルを一連の関連するファイルとして扱うことを特徴とする請求項1に記載のファイル管理装置。
  3. 前記記録処理手段は、第二の記録媒体に対する記録処理を実行する前に、前記第三の記録媒体に当該電子ファイルに関する履歴情報が存在しない未管理電子ファイルが前記第二の記録媒体に存在する場合は、該未管理電子ファイルを前記第二の記録媒体から削除することを特徴とする請求項1に記載のファイル管理装置。
  4. 第一の記録媒体に格納された電子ファイルを第二の記録媒体に記録する記録ステップと、
    前記第二の記録媒体に記録された電子ファイルに関する情報と、前記第二の記録媒体の識別子とを対応付け、処理記録の履歴情報として第三の記録媒体に保存する履歴保存ステップと、
    を備えるファイル管理方法であって、
    前記記録ステップにおいて一連の関連する電子ファイルを第二の記録媒体に記録する場合に、当該一連の関連するすべての電子ファイルのうち第二の記録媒体に記録ができない電子ファイルがある場合には、前記履歴保存ステップにおいて該一連の関連するすべての電子ファイルにおける処理記録の履歴情報を第三の記録媒体に記録しないことを特徴とするファイル管理方法。
  5. 前記記録ステップにて第一の記録媒体から選択された複数のファイルを一括して前記第二の記録媒体に記録処理をする場合に、当該複数のファイルを一連の関連するファイルとして扱うことを特徴とする請求項4に記載のファイル管理方法。
  6. 前記記録ステップにおいて、第二の記録媒体に対する記録処理を実行する前に、前記第三の記録媒体に当該電子ファイルに関する履歴情報が存在しない未管理電子ファイルが前記第二の記録媒体に存在する場合は、該未管理電子ファイルを前記第二の記録媒体から削除することを特徴とする請求項4に記載のファイル管理方法。
  7. コンピュータを、
    第一の記録媒体に格納された電子ファイルを第二の記録媒体に記録する記録処理手段と、
    前記第二の記録媒体に記録された電子ファイルに関する情報と、前記第二の記録媒体の識別子とを対応付け、処理記録の履歴情報として第三の記録媒体に保存する履歴保存手段と、
    として機能させるプログラムであって、
    前記記録処理手段によって一連の関連する電子ファイルを第二の記録媒体に記録する場合に、当該一連の関連するすべての電子ファイルのうち第二の記録媒体に記録ができない電子ファイルがある場合には、前記履歴保存手段は該一連の関連するすべての電子ファイルに関する処理記録の履歴情報を第三の記録媒体に記録しないことを特徴とするプログラム。
  8. 前記記録処理手段は、第一の記録媒体から選択された複数のファイルを一括して前記第二の記録媒体に記録処理をする場合に、当該複数のファイルを一連の関連するファイルとして扱うことを特徴とする請求項7に記載のプログラム。
  9. 前記記録処理手段は、第二の記録媒体に対する記録処理を実行する前に、前記第三の記録媒体に当該電子ファイルに関する履歴情報が存在しない未管理電子ファイルが前記第二の記録媒体に存在する場合は、該未管理電子ファイルを前記第二の記録媒体から削除することを特徴とする請求項7に記載のプログラム。
JP2005363890A 2000-06-26 2005-12-16 ファイル管理装置、及び、その方法 Pending JP2006114058A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005363890A JP2006114058A (ja) 2000-06-26 2005-12-16 ファイル管理装置、及び、その方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000190387 2000-06-26
JP2005363890A JP2006114058A (ja) 2000-06-26 2005-12-16 ファイル管理装置、及び、その方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001170551A Division JP2002082821A (ja) 2000-06-26 2001-06-06 ファイル管理装置、その方法及び記録媒体

Publications (1)

Publication Number Publication Date
JP2006114058A true JP2006114058A (ja) 2006-04-27

Family

ID=36382470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005363890A Pending JP2006114058A (ja) 2000-06-26 2005-12-16 ファイル管理装置、及び、その方法

Country Status (1)

Country Link
JP (1) JP2006114058A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181924A (ja) * 2009-02-03 2010-08-19 Hitachi Ltd データベース管理方法および装置並びにその処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181924A (ja) * 2009-02-03 2010-08-19 Hitachi Ltd データベース管理方法および装置並びにその処理プログラム

Similar Documents

Publication Publication Date Title
JP4141070B2 (ja) データの保存方法,データストレージユニットおよびコンピュータ読み取り可能な記録媒体
US9690794B2 (en) System and method for backing up data
US6304948B1 (en) Method and apparatus for erasing data after expiration
US8352448B2 (en) Securely deleting data in a transactionally consistent manner
US7752492B1 (en) Responding to a failure of a storage system
US8572039B2 (en) Focused backup scanning
US8627025B2 (en) Protecting data during different connectivity states
US8060468B2 (en) Storage system and data recovery method
US8205049B1 (en) Transmitting file system access requests to multiple file systems
EP2583176B1 (en) Error detection for files
US6795834B2 (en) Apparatus, method, and storage medium for file management
US20130339569A1 (en) Storage System and Method for Operating Thereof
JP3180038B2 (ja) 大容量記憶装置の構成管理のための方法およびシステム
CN101647017A (zh) 改进的顺序介质回收和复制
JP5012628B2 (ja) メモリデータベース、メモリデータベースシステム及びメモリデータベース更新方法
KR100819022B1 (ko) 하나의 타겟 볼륨과 하나의 소스 볼륨 사이의 관계 관리
US20090063596A1 (en) Backup data erasure method
US8095804B1 (en) Storing deleted data in a file system snapshot
JP2006114058A (ja) ファイル管理装置、及び、その方法
JP2002082821A (ja) ファイル管理装置、その方法及び記録媒体
JP4141069B2 (ja) データの保存方法,データストレージユニットおよびコンピュータ読み取り可能な記録媒体
JP2006107531A (ja) ファイル管理装置、及び、その方法
CN116483284B (zh) 一种读写虚拟硬盘的方法、装置、介质及电子设备
US11928497B2 (en) Implementing erasure coding with persistent memory
CN116483284A (zh) 一种读写虚拟硬盘的方法、装置、介质及电子设备

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090331