JP5759915B2 - ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 - Google Patents
ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 Download PDFInfo
- Publication number
- JP5759915B2 JP5759915B2 JP2012030149A JP2012030149A JP5759915B2 JP 5759915 B2 JP5759915 B2 JP 5759915B2 JP 2012030149 A JP2012030149 A JP 2012030149A JP 2012030149 A JP2012030149 A JP 2012030149A JP 5759915 B2 JP5759915 B2 JP 5759915B2
- Authority
- JP
- Japan
- Prior art keywords
- directory
- file
- hierarchy
- search target
- scanning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/1734—Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
なお、この種の先行技術として下記の特許文献1に開示された技術が知られている。
ここで、追加、変更、削除されたファイルデータが少量である場合であっても、全てのファイルデータを走査する必要があるため、追加、変更、削除されたファイルデータの一覧の作成処理が、インデクス更新処理の長時間化の要因となってしまっている。
これに対して、ファイルサーバ内のファイルツリー構造を幾つかに分割し、それらのサブツリーに対する走査処理を並列に行うことにより、走査処理を高速化することが考えられる。
前記分割方針を決定するステップは、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
また、本発明に係るファイルリスト生成方法は、検索対象ファイルについて作成済みのインデクス情報を第1の記憶手段に記憶するステップと、検索対象ファイルの現在のディレクトリツリーをコピーしてバックアップディレクトリとして第2の記憶手段に格納するステップと、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定するステップと、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割するステップと、前記現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針を決定するステップで決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するステップと、当該分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力するステップとを備え、
前記分割方針を決定するステップは、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
また、本発明に係るファイルリスト生成システムは、検索対象ファイルについて作成済みのインデクス情報を記憶する第1の記憶手段と、検索対象ファイルの現在のディレクトリツリーをコピーしてバックアップディレクトリとして格納する第2の記憶手段と、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割する手段と、前記第2の記憶手段に格納された現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段とを備え、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
また、本発明に係るファイルリスト生成装置は、検索対象ファイルについて作成済みのインデクス情報を記憶する第1の記憶手段と、検索対象ファイルの現在のディレクトリツリーをコピーしてバックアップディレクトリとして格納する第2の記憶手段と、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割する手段と、前記第2の記憶手段に格納された現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段とを備え、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
前記ファイルリスト作成サーバを、
第1の記憶手段に記憶された検索対象ファイルについて作成済みのインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのディレクトリを分割し、現在ディレクトリツリーのスナップショットを取得し、第2の記憶手段に格納する手段と、前記現在ディレクトリツリーのスナップショットと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのディレクトリツリーのスナップショットについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段として機能させ、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
また、本発明に係るファイルリスト生成プログラムは、インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力するファイルリスト作成サーバで用いるプログラムであって、
前記ファイルリスト作成サーバを、
検索対象ファイルの現在のディレクトリツリーのコピーをバックアップディレクトリとして第2の記憶手段に格納させる手段と、第1の記憶手段に記憶された検索対象ファイルについて作成済みのインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割する手段と、前記第2の記憶手段に格納された現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段として機能させ、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とする。
これにより、自システム内に検索対象ファイルのハッシュ値を含むデータを記憶する大容量のインデクス済みファイル一覧を持つことなく、既に一度検索インデクスを作成したことのあるファイルサーバに対して、ファイルサーバ上で追加、変更、削除されたファイルデータの一覧を高速に作成することが可能となる。これによって、検索インデクスの更新処理を高速に行うことが可能となり、結果として、検索システムによる検索結果を可能な限り的確なものとすることができる。
なお、スナップショットは追加、変更、削除されたファイルデータの一覧を作成することを主な目的とした新たなスナップショットを作成してもよいし、通常のバックアップ目的で作成したスナップショットを流用してもよい。また、スナップショットディレクトリの代わりに共通の命名規則に基づいた親ディレクトリに配置したバックアップディレクトリを作成し、前回と今回のバックアップディレクトリを、分散処理サーバ群を利用して分散して走査処理を行ってもよい。なお、以下の説明では自システムからの指令で追加、変更、削除されたファイルデータの一覧を作成することを主な目的とした新たなスナップショットを更新インデクス作成のたびに作成するものとして記述する。
図1は、本発明に係る第一の実施形態におけるシステム構成図である。
図1において示したファイルリスト生成システムは、ファイルリスト作成サーバ1、分散処理サーバ群2およびファイルサーバ3(以下「サーバ等」という)を、LAN(Local Area Network)4等の有線又は無線の通信回線により互いに通信可能に接続したシステムである。
ファイルリスト作成サーバ1はスケジューラ11、ファイル走査処理分割方針決定手段12、スナップショット作成処理実行手段13、ファイル走査実行手段14、およびファイルリスト比較手段15を備えている。
ファイル走査実行手段14はファイル走査処理分割方針決定手段12によって決定されたファイルデータ走査処理の分割方針に基づいて、ファイルサーバ3上の前回インデクス更新時に取得した検索対象ファイル群のスナップショットディレクトリ、および今回のファイル走査で取得した検索対象ファイル群のスナップショットディレクトリ内にあるファイルデータを取得し、それぞれのスナップショットディレクトリにあるファイルデータの一覧を作成する。
この動作については、ファイルサーバ内データ走査処理(S501等)として後述する。
検索インデクス17は、1以上のインデクス済みファイルレコード170から構成される。インデクス済みファイルレコード170には、少なくともファイルのURL171を含む、検索対象ファイルの属性情報(ファイル名、最終アクセス時刻、最終更新時刻、インデクス作成時刻等が記憶されている。
ファイルURL171には、具体的にはファイルサーバ上のファイルを一意に識別するためのパスが設定される。例えばファイルサーバの識別名が”server1”であり、共有名がshare1である共有ディレクトリの直下にあるetcという名前のディレクトリにあるfile2.xmlを示すURLはhttp://server1/share1/etc/file2.xmlとなる。
この概念図に示すファイルサーバ3のディレクトリ構成においては、あるファイルサーバ3の識別名が“server1”である。“server1”では2つのディレクトリが共有されており、それぞれ”share1”、”share2”という共有名により一意に識別可能である。“server1”の”share1”、”share2”には、図示したようなディレクトリおよびファイルが存在する。例えば、“server1”の“share1”には、“etc”、“doc”の2つのディレクトリが存在し、“etc”ディレクトリには“file1.doc”、“file2.xml”の2つのファイルが、“doc”ディレクトリには“file3.doc”の1つのファイルが存在する。同様に、“server1”の“share2”には、1つのディレクトリ“pjt”が存在し、“pjt”ディレクトリには“pjt1”、“pjt2”、“pjt3”の3つのディレクトリが存在し、そのうち“pjt1”ディレクトリには“file4.txt”、“file5.doc”の2つのファイルが存在する。
1つは“.IDX01”という名称で作成されており、もう1つは“.IDX02”という名称で作成されている。それぞれのスナップショットディレクトリの配下には、スナップショットを作成した時点の“share1”配下のディレクトリおよびファイル群が存在する。なお、追加、更新、削除されたファイルデータの一覧を作成することを主な目的として作成したスナップショットディレクトリの配下のファイルについては、原本ファイル群が上位ディレクトリに存在することもあり、検索インデクスを作成しなくともよい。以下の説明では、“~snapshot”配下については検索インデクスを作成しなかったものとして説明する。
なお、スナップショットにはファイルサイズの情報が付随しているので、これによりファイルが変更されているかどうかを検出することができる。
ファイル走査処理分割方針決定手段12は、走査対象のファイルツリー構造を複数に分割して走査処理を並列に行うことで高速化するという本発明の目的に対し、分割された範囲があまりに小さかった場合には並列処理を行うことによるオーバーヘッドが並列処理による高速化のメリットを上回ってしまうことを避けるために、既にインデクス済みのファイルからディレクトリ構造を分析することにより、最初に行う走査処理の範囲が適切な大きさになるように判断する処理である。
このような判断処理は、走査対象のファイルツリー構造が、走査処理開始ディレクトリに近い上位階層ほどディレクトリ数が少なく、下位階層ほどディレクトリ数が多い三角形構造の場合に適している。三角形構造の中でも特に、階層間のディレクトリ数の増加の割合が一定ではなく途中の階層で増加の割合が急激に大きくなるような場合、最上位階層から増加割合が急激に大きくなる直前の階層までを最初の初回走査範囲に設定する。
この概念図に示すファイルサーバ3のファイルツリーの構造においては、第一階層1501に1ディレクトリが属し、第二階層1502には3ディレクトリが属し、第三階層1503には6ディレクトリが属し、第四階層1504には12ディレクトリが属し、第五階層1505には10000ディレクトリが属している。このようなファイルツリー構造を持つファイルサーバとしては企業組織のヒエラルキーに即して構築された企業内ファイルサーバが考えられる。例えば第一階層1501を”本部”とし、第二階層1502を”部”、第三階層1503を”課”、第四階層1504を”各従業員”用のディレクトリとする場合、このようなディレクトリ数の比率を持つファイルツリー構造になる。
各階層間のディレクトリ数の増加の割合は階層間のディレクトリ数の2階差分値によって近似的に算出できる。
図15の例においては、第一階層1501、第二階層1502、第三階層1503間の2階差分値は1となり、第二階層1502、第三階層1503、第四階層1504間の2階差分値は3となり、第三階層1503、第四階層1504、第五階層1505間の2階差分値は9982となる。これらの2階差分値の比較から第四階層1504と第五階層1505の間で増加の割合が急激に大きくなっていることが判断できる。ファイル走査処理分割方針決定手段12はこの手法によって、最上位階層1501から第4階層1504までを1つの分割深度とする初回走査範囲として設定する。
なお、ディレクトリ数が多い第5階層以下の階層においては、当該階層に属するディレクトリの走査を複数の分散処理サーバで分担して走査する。この場合、分担の仕方については任意である。
また、最下位階層までのディレクトリ数の集計結果が非常に少なく所定数未満であった場合には、分割して走査しても高速化の目的に反するので、分割数を1として走査する。
図4のS401に至るまでの処理は、前述のように、スケジューラ11が、追加、更新、削除されたファイルデータの一覧を定期的に作成するにあたり、記憶装置16に記憶されている一覧作成処理実行間隔を参照して、処理を開始させる。
次に取得した各ファイルURL171を文字”/”でファイルパス上の各階層のディレクトリ名に分割する(S402)。例えば、前述の例でいうと、”http://server1/share1/etc/file2.xml”は、”http:”、””(空字列)、”server1”、”share1”、”etc”、“file2.xml”に分割される。末尾の要素はファイル名でありディレクトリ構造解析には用いないため破棄する。前述の例では“file2.xml”は用いずに破棄する。
次に、階層ごとにディレクトリ数を集計する。例えば図3に示したファイルツリーの場合、共有ディレクトリ”share1”に係る第一階層は”share1”一つであると算出される。
同様に第二階層は”etc”と”doc”の二つであると算出される。ここで“~snapshot”配下のディレクトリは検索インデクスを作成していないため“~snapshot”は集計対象外となる。
次に、階層ごとにユニークなディレクトリ名がいくつあるかを数えることにより、階層ごとのディレクトリ数を集計する(S404)。S404は分散処理サーバ群2において分散処理実行手段21を利用して並列に分散処理する。S403で算出した階層数ごとに、ディレクトリ名を各分散処理サーバに分配し、各分散処理サーバは割り当てられた階層についてS404のユニークなディレクトリ数を集計する処理を行う。
次に、第一階層の推定ファイル数を算出して、推定総ファイル数に加算する(S406)。なお、推定ファイル数は、S404で算出した第一階層のディレクトリ数に一定の数をかけることで算出する。一定の数とは例えば100といった値である。この値はファイルリスト作成サーバ1上の設定ファイルなどに記憶している値を参照する。この値は、1ディレクトリが保持するファイルの平均の数に近い値を推定して設定することが望ましい。
なお、最高推定総ファイル数はファイルリスト作成サーバ1上の設定ファイルなどに記憶している値を参照する。この値は、例えば2000000といった値であり、一台のファイルリスト作成サーバ1が1度のファイル走査によって少なくとも数時間以内に走査完了できる数字を推定して設定することが望ましい。推定総ファイル数が最高推定総ファイル数以上だった場合は、最初の階層から今階層までをまとめて走査する対象として判断する(S412)。
推定総ファイル数が最高推定総ファイル数より少なかった場合は、次に、前々階層、前階層、今階層のディレクトリ数の2階差分値を計算する(S408)。第一階層の場合は、前々階層、前階層が無いため、第一階層のディレクトリ数そのものを2階差分値とする。
2階差分値が2階差分閾値以上である場合は、次に推定総ファイル数が最低推定総ファイル数以上であるかどうかを決定する(S410)。
S410の判断で推定総ファイル数が最低推定総ファイル数より少なかった場合は、次の階層に進む(S411)。
図4の処理はあまりに小さな範囲を走査範囲として設定しないようにするための処理であるため、一定数のファイルは走査範囲に含まれるようにS410の判断処理を加えている。
S409の判断で2階差分値が2階差分閾値より小さかった場合は、次の階層に進む(S411)。
S411で次の階層に進んだ後は、S406の処理に戻る。S407かS409とS410のどちらかの判断によって走査範囲が決まるまでS406からS411の処理を繰り返し実行する。
これらの処理により、ファイル走査実行手段14が最初に行う走査処理の範囲として、適切な範囲が決定される。
図4のフローチャートに示した処理の終了後、スケジューラ11はスナップショット作成処理実行手段13を用いてファイルサーバ3の記憶装置31内に検索対象ファイル群のスナップショットを作成し、その後に図5の処理を起動させる。このスナップショットが前述の前提となるスナップショットである。
図4のフローチャートで示された分割方針決定手段によって決定された範囲を走査範囲に設定する(S501)。
次に、今回取得した検索対象ファイル群のスナップショットディレクトリにおける走査範囲について走査し、ファイルとディレクトリのURLを列挙する(S502)。ファイルサーバ内の一部範囲を走査してファイルとディレクトリを列挙することは周知の技術であるため、ファイルサーバ走査実行手段13がどのように走査を行うかについてはここでは詳細には記載しないが、例えばファイルリスト作成サーバ1がファイルサーバ3の記憶装置31の検索対象ファイルのスナップショット32を、ネットワークファイルシステムを通じてアクセス可能な状態にし、ファイルリスト作成サーバ1のローカルファイル用のファイルツリー探索プログラムを使用して各ファイルデータのファイルシステム上のファイルパスの一覧を出力するなどさせればよい。ファイルシステム上のファイルパスが求まれば、ファイルパスにファイルサーバ3の識別名などをファイルパスに付け加えることでURLを作成することができる。
次に、ファイルリストを作成し、次回走査範囲を設定する(S504)。この次回走査範囲は、S502で走査された範囲の最下層のディレクトリが設定され、そのディレクトリの直下1階層分を走査範囲として設定する。すなわちS501で設定された初回の走査より後の走査では1階層ずつファイルツリーを走査する。この処理の詳細はファイルリスト作成と走査範囲設定処理(S601等)として後述する。
もし次回走査範囲が空であれば、ファイルツリーを全て探索し終えたので、処理を終了する。
次回走査範囲が空でなければ、S502に戻って次の走査範囲について走査し、ファイルとディレクトリのURLを列挙する。
最初に、S502とS503で列挙されたファイルとディレクトリのURLを合わせて反転文字列順にソートする(S601)。ここで反転文字列とは、文字列の表記順序を前後で反転(入れ替えた)させたものを言う。例えば「あいうえお」という文字列に対する反転文字列は「おえういあ」である。
ファイルリスト1701では通常の文字列順に両スナップショットディレクトリ内のファイルURLをソートした場合を示している。ファイルリスト1702では反転文字列順にファイルURLをソートした場合を示している。ファイルリスト1703は見易さのためにファイルリスト1702を、並び順をそのままに文字列を再反転させたものである。
この特徴を利用することで、1705で示すような隣接する2行の比較によって前回更新インデクス時に取得したスナップショットディレクトリと、今回取得したスナップショットディレクトリにどのような差異があるかを判断することができる。
このようにURLリスト全体を意識せずに、隣接する2行のみを見れば追加、変更、削除されたファイルデータの一覧が作成できる状態にすることにより、追加、変更、削除されたファイルデータの一覧の作成処理を分散処理サーバ群2に分散させることが可能になる。
S602でURLリストの先頭2行をとりだす。
次に、先頭2行のURL同士を文字列として比較する(S603)。
次に、S603の比較の結果、URLのスナップショットディレクトリ以下が文字列として一致しているかどうかを判断する(S604)。
もしURLリストに次の行がある場合は、次に、URLリストに更に次の行があるかを判断する(S607)。
もしURLリストに更に次の行がある場合、すなわちURLリストに次の2行がある場合は、次の2行を取り出す(S608)。
次に、図6のS603に戻り、次のURL同士を比較する。URLリストの全てのURLについて処理を終えるまで、これらの処理を繰り返し実行する。
もしS607の判断でURLリストに更に次の行が無かった場合、すなわち、URLリストに1行しか残っていなかった場合は、その最終行について追加、更新、削除ファイル一覧に追加する処理を行う(S609)。この処理の詳細はURLリストの最終行処理(S701等)として後述する。
次にURLリストに次の行があるかどうかを判断する(S611)。
もしURLリストに次の行がある場合は、今取り出している1行目を判断済みの行として破棄し、今取り出している2行目を1行目にシフトし、次の行を取り出して2行目とする(S612)。
これらの処理により、今回の走査範囲についての追加、更新、削除されたファイルデータの一覧が作成され、次回の走査範囲が決定される。
最初に最終行のURLが今回取得したスナップショットディレクトリのものかどうかを判断する(S801)。
もし最終行のURLが今回取得したスナップショットディレクトリのものだった場合は次にURLがディレクトリのものかどうかを判断する(S802)。
もしURLがディレクトリのものだった場合は、走査範囲の最下層のディレクトリかどうかを判断する(S803)。例えば、図15のファイルツリーで第一階層1501から第五階層1505までを走査範囲に設定した場合は、第五階層1505に属するディレクトリのURLが最下層のディレクトリと判断される。
もしS802の処理でURLがディレクトリではなく、ファイルのものだった場合は、そのファイルは前回インデクス更新時には存在していなかったが、今回インデクス時には存在しているファイル、すなわちファイルサーバ3に追加されたファイルと判断できるため、追加ファイルとして追加、更新、削除ファイル一覧に追加する(S805)。
もしS806の処理でURLがディレクトリではなく、ファイルのものだった場合は、そのファイルは前回インデクス更新時には存在していたが、今回インデクス時には存在していなかったファイル、すなわちファイルサーバ3から削除されたファイルと判断できるため、削除ファイルとして追加、更新、削除ファイル一覧に追加する(S809)。
これらの処理により、URLリストの最終行のURLが、追加、更新、削除ファイル一覧または次回走査範囲に追加される。
最初に取り出した2つのURLがディレクトリのものかファイルのものかを判断し、1行目のURLがファイル、2行目のURLがファイルの組み合わせか、1行目のURLがファイル、2行目のURLがディレクトリの組み合わせか、1行目のURLがディレクトリ、2行目のURLがファイルの組み合わせか、1行目のURLがディレクトリ、2行目のURLがディレクトリの組み合わせか、のいずれであるかを判断する(S1001)。この処理の詳細は、ディレクトリまたはファイルに係るURL組み合わせ決定処理(S1001等)として後述する。
最初に1行目のURLがディレクトリのものかどうかを判断する(S1101)。
もしS1101の判断で、1行目のURLがディレクトリのものではなく、ファイルだった場合は、次に2行目のURLがディレクトリのものかどうかを判断する(S1102)。
もしS1102の判断で、2行目のURLがディレクトリのものではなく、ファイルだった場合は、この2行のURLはファイル、ファイルの組み合わせと判断される。図10のS1003の決定処理の説明の便宜上、この組み合わせをA(1104)と名づける。
もしS1102の判断で、2行目のURLがディレクトリのものだった場合は、この2行のURLはファイル、ディレクトリの組み合わせと判断される。この組み合わせも同様に便宜上B(1105)と名づける。
もしS1103の判断で、2行目のURLがディレクトリのものではなく、ファイルだった場合は、この2行のURLはディレクトリ、ファイルの組み合わせと判断される。この組み合わせも同様に便宜上C(1106)と名づける。
ここでURLの前半部分の「http://server1/share1/」は見易さのため省略してある。また、<A>や<B>はスナップショットディレクトリ以下の適当なファイルパスを示す記号として用いている。すなわち表で「.IDX01/<A>」と表記しているものは例えば「http://server1/share1/.IDX01/etc/file1.doc」というファイルURLを示している。
表1201において、1207のような「(※1)」が記述されている組み合わせは同一URLが2行並んでいる場合を示しており、今まで述べてきた方法でURLリストを作成した場合、決して現れない。
出現しうるURLの組み合わせは表の1202から1207に示す6種類である。これらの組み合わせに説明の便宜上1から6という名をつける。
例えばS1001の判断結果がA(1104)であり、S1002の判断結果が1(1202)だった場合は、取り出したURLの1行目のURLが示すファイルを削除ファイルとして追加、更新、削除ファイル一覧に追加する(1302)。
最初に、URLがディレクトリのものであるかどうか判断する(S1401)。スナップショットディレクトリ以下のURLは同一であるため、判断に使用するURLは1行目でもよいし、2行目でもよい。
もしURLが示すディレクトリが走査範囲の最下層のディレクトリだった場合は、そのディレクトリは次回走査範囲における起点ディレクトリの一つとして含まれるため、次回走査範囲に追加する(S1403)。
もしS1401の判断で、URLがディレクトリのものではなくファイルのものだった場合は、取り出した2行のURLが表すファイルについて、ファイルの更新時刻やサイズなどのメタデータからファイル情報ハッシュ値を算出し、2つのハッシュ値を比較する(S1404)。
S1405の判断でハッシュ値に差がある場合は、そのファイルが更新されていることを示すので、次にそのURLを更新ファイルとして追加、更新、削除ファイル一覧にURLを追加する(S1406)。
S1405の判断でハッシュ値に差が無い場合は、そのファイルが更新されていないことを示すので、そのファイルについては追加、更新、削除ファイル一覧に追加する必要は無い。そのため、これで処理を終了する。
すなわち、スナップショットは、ストレージ管理者が“簡単”に(ボタン1クリックで)「すばやく」「少ない容量で」対象とするファイルの「バックアップを取得する」機能である。ストレージ管理者が手動のコピー&ペーストで取得したバックアップディレクトリと、スナップショットディレクトリは、ほぼ同じのものである。
本実施形態では、ファイルサーバ3の記憶装置1831に、2つのバックアップディレクトリを格納し、これらのバックアップディレクトリに格納した今回インデクス対象とする検索対象ファイル群のバックアップディレクトリ1832と、前記インデクス更新時に対象とした検索対象ファイル群のバックアップディレクトリ1833とを、図1の今回取得した検索対象ファイル群のスナップショット32と前回インデクス更新時に取得した検索対象ファイル群のスナップショットとの代わりに使用し、前回インデクス更新時(作成時)より新たに追加、更新、削除されたファイルデータの一覧を生成するものである。
ファイルリスト作成サーバ1は、ファイル走査処理分割方針決定手段12、スナップショット作成処理手段12、ファイル走査実行手段14、ファイルリスト比較手段15、分散処理サーバ群2を図1の実施形態と同様に用い、前回インデクス更新時(作成時)より新たに追加、更新、削除されたファイルデータの一覧を生成する。
したがって、詳細な説明は省略する。
なお、本実施形態においては、スナップショット作成処理手段に代えて、ストレージ管理者が検索対象ファイルの現在のディレクトリツリーを手動でコピー&ペーストしてバックアップディレクトリとして記憶手段に記憶させる点が前述の実施形態の動作と異なる。
2 分散処理サーバ群
3 ファイルサーバ
4 ネットワーク
11 スケジューラ
12 ファイル走査処理分割方針決定手段
13 スナップショット作成処理実行手段
14 ファイル走査実行手段
15 ファイルリスト比較手段
16 ファイルリスト作成サーバ1に接続された記憶装置
17 検索インデクス
21 分散処理実行手段
31 ファイルサーバ3に接続された記憶装置
32 今回取得した検索対象ファイル群のスナップショット
33 前回インデクス更新時に取得した検索対象ファイル群のスナップショット
160 検索インデクス16のファイルレコード
161 ファイルURL
Claims (8)
- 検索対象ファイルについて作成済みのインデクス情報を第1の記憶手段に記憶するステップと、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定するステップと、決定された分割方針に従い検索対象ファイルのディレクトリを分割するステップと、走査対象ファイルの現在ディレクトリツリーのスナップショットを取得して第2の記憶手段に格納するステップと、前記現在ディレクトリツリーのスナップショットと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのディレクトリツリーのスナップショットについて前記分割方針を決定するステップで決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するステップと、当該分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力するステップとを備え、
前記分割方針を決定するステップは、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成方法。 - 検索対象ファイルについて作成済みのインデクス情報を第1の記憶手段に記憶するステップと、検索対象ファイルの現在のディレクトリツリーをコピーしてバックアップディレクトリとして第2の記憶手段に格納するステップと、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定するステップと、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割するステップと、前記現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針を決定するステップで決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するステップと、当該分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力するステップとを備え、
前記分割方針を決定するステップは、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成方法。 - 検索対象ファイルについて作成済みのインデクス情報を記憶する第1の記憶手段と、この第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのディレクトリを分割し、走査対象ファイルの現在ディレクトリツリーのスナップショットを取得し、第2の記憶手段に格納する手段と、前記現在ディレクトリツリーのスナップショットと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのディレクトリツリーのスナップショットについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段とを備え、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成システム。 - 検索対象ファイルについて作成済みのインデクス情報を記憶する第1の記憶手段と、検索対象ファイルの現在のディレクトリツリーをコピーしてバックアップディレクトリとして格納する第2の記憶手段と、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割する手段と、前記第2の記憶手段に格納された現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段とを備え、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成システム。 - 第1の記憶手段に記憶された検索対象ファイルについて作成済みのインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのディレクトリを分割し、走査対象ファイルの現在ディレクトリツリーのスナップショットを取得し、第2の記憶手段に格納する手段と、前記現在ディレクトリツリーのスナップショットと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのディレクトリツリーのスナップショットについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段とを備え、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成装置。 - 検索対象ファイルについて作成済みのインデクス情報を記憶する第1の記憶手段と、検索対象ファイルの現在のディレクトリツリーをコピーしてバックアップディレクトリとして格納する第2の記憶手段と、前記第1の記憶手段に記憶されたインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割する手段と、前記第2の記憶手段に格納された現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段とを備え、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成装置。 - インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力するファイルリスト作成サーバで用いるプログラムであって、
前記ファイルリスト作成サーバを、
第1の記憶手段に記憶された検索対象ファイルについて作成済みのインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのディレクトリを分割し、現在ディレクトリツリーのスナップショットを取得し、第2の記憶手段に格納する手段と、前記現在ディレクトリツリーのスナップショットと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのディレクトリツリーのスナップショットについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段として機能させ、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成プログラム。 - インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力するファイルリスト作成サーバで用いるプログラムであって、
前記ファイルリスト作成サーバを、
検索対象ファイルの現在のディレクトリツリーのコピーをバックアップディレクトリとして第2の記憶手段に格納させる手段と、第1の記憶手段に記憶された検索対象ファイルについて作成済みのインデクス情報から検索対象ファイルのディレクトリURLを取得し、そのディレクトリURLを解析して各階層のディレクトリ数を集計し、その集計結果に基づき走査対象ディレクトリの走査処理を分散サーバ群によって分割して行う分割方針を決定する分割方針決定手段と、決定された分割方針に従い検索対象ファイルのバックアップディレクトリを分割する手段と、前記第2の記憶手段に格納された現在のディレクトリツリーのバックアップディレクトリと前記分割方針を決定する前に取得して第3の記憶手段に格納しておいた検索対象ファイルのバックアップディレクトリツリーについて前記分割方針決定手段で決定した分割した単位で各ディレクトリ上の検索対象ファイルを前記分散サーバ群によって分散走査するファイル走査手段と、当該ファイル走査手段による分散走査結果を比較し、前記インデクス情報作成後に追加、削除、変更されたファイルの一覧を作成して出力する比較手段として機能させ、
前記分割方針を決定する手段は、検索対象ファイルのディレクトリの最上位階層から数えたディレクトリ数が所定数未満であれば検索対象ディレクトリの走査処理を行う分割数を1とする分割方針を決定し、所定数を越えた場合には最上位階層のディレクトリから所定階層までの階層を1つの分割単位として初回走査を行い、その初回走査で発見した走査対象ディレクトリの下位階層は深度1階層を分割単位として走査する分割方針を決定するものであることを特徴とするファイルリスト生成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012030149A JP5759915B2 (ja) | 2012-02-15 | 2012-02-15 | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
US13/753,208 US8965941B2 (en) | 2012-02-15 | 2013-01-29 | File list generation method, system, and program, and file list generation device |
EP13154012.2A EP2629215A1 (en) | 2012-02-15 | 2013-02-05 | File list generation method, system, and program, and file list generation device |
CN201310045913.0A CN103257993B (zh) | 2012-02-15 | 2013-02-05 | 文件列表生成方法、系统以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012030149A JP5759915B2 (ja) | 2012-02-15 | 2012-02-15 | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013167990A JP2013167990A (ja) | 2013-08-29 |
JP5759915B2 true JP5759915B2 (ja) | 2015-08-05 |
Family
ID=47740812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012030149A Expired - Fee Related JP5759915B2 (ja) | 2012-02-15 | 2012-02-15 | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8965941B2 (ja) |
EP (1) | EP2629215A1 (ja) |
JP (1) | JP5759915B2 (ja) |
CN (1) | CN103257993B (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2997595B1 (fr) * | 2012-10-29 | 2014-12-19 | Bouygues Telecom Sa | Procede d'indexation des contenus d'un dispositif de stockage de contenus numeriques connecte a un boitier d'acces a internet |
CN103473277B (zh) * | 2013-08-27 | 2017-04-05 | 华为技术有限公司 | 文件系统的快照方法和装置 |
US10296425B2 (en) * | 2017-04-20 | 2019-05-21 | Bank Of America Corporation | Optimizing data processing across server clusters and data centers using checkpoint-based data replication |
US10896097B1 (en) * | 2017-05-25 | 2021-01-19 | Palantir Technologies Inc. | Approaches for backup and restoration of integrated databases |
CN107133363B (zh) * | 2017-06-05 | 2020-12-25 | 掌阅科技股份有限公司 | 电子书目录列表信息的更新方法、电子设备以及存储介质 |
CN108874930A (zh) * | 2018-05-31 | 2018-11-23 | 郑州云海信息技术有限公司 | 文件属性信息统计方法、装置、系统、设备及存储介质 |
CN110875951B (zh) * | 2018-09-04 | 2022-07-01 | 北京奇虎科技有限公司 | 一种调用消息并发量的统计方法及装置 |
GB201905533D0 (en) * | 2019-03-20 | 2019-06-05 | Cohesity Inc | Determining differences between two versions of a file directory tree structure |
CN111723050A (zh) * | 2019-03-22 | 2020-09-29 | 伊姆西Ip控股有限责任公司 | 用于文件管理的方法、电子设备和计算机程序产品 |
CN111125024B (zh) * | 2019-11-29 | 2022-05-24 | 浪潮电子信息产业股份有限公司 | 一种分布式系统文件的删除方法、装置、设备及存储介质 |
CN112650723A (zh) * | 2020-12-28 | 2021-04-13 | 北京浪潮数据技术有限公司 | 一种文件共享方法、装置、设备及计算机可读存储介质 |
US11561935B2 (en) | 2021-06-17 | 2023-01-24 | Netapp, Inc. | Methods for ensuring correctness of file system analytics and devices thereof |
US11934347B2 (en) | 2021-07-23 | 2024-03-19 | EMC IP Holding Company LLC | Determining a sharing relationship of a file in namespace snapshots |
CN113946553A (zh) * | 2021-10-27 | 2022-01-18 | 浪潮卓数大数据产业发展有限公司 | 一种基于ftp的千万级文件量的文件同步方法 |
CN114356844B (zh) * | 2021-11-19 | 2023-11-21 | 苏州浪潮智能科技有限公司 | 一种基于目录树轮询对比文件快照的方法和装置 |
US20230169037A1 (en) * | 2021-11-30 | 2023-06-01 | Dell Products L.P. | Directory snapshots based on directory level inode virtualization |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5845290A (en) * | 1995-12-01 | 1998-12-01 | Xaxon R&D Ltd. | File recording support apparatus and file recording support system for supporting recording of file on home page on internet and intranet |
US5935207A (en) * | 1996-06-03 | 1999-08-10 | Webtv Networks, Inc. | Method and apparatus for providing remote site administrators with user hits on mirrored web sites |
US7243369B2 (en) * | 2001-08-06 | 2007-07-10 | Sun Microsystems, Inc. | Uniform resource locator access management and control system and method |
JP4106601B2 (ja) * | 2002-07-31 | 2008-06-25 | 日本電気株式会社 | ディレクトリ情報への更新情報生成システム、更新情報生成プログラム |
US7730155B1 (en) * | 2002-10-01 | 2010-06-01 | Apple Inc. | Method and apparatus for dynamically locating resources |
US20040068523A1 (en) | 2002-10-07 | 2004-04-08 | Keith Robert Olan | Method and system for full asynchronous master-to-master file synchronization |
EP1636681A4 (en) * | 2003-06-24 | 2008-09-24 | Interwoven Inc | SYSTEM AND METHOD FOR DEVELOPING WEB SITES INVOLVING THE UPDATING AND REPLACEMENT OF RELATED CARDS |
TWI317476B (en) * | 2005-01-14 | 2009-11-21 | Fineart Technology Co Ltd | Method for recording the condition of file and computer-readable recording medium |
JP2006268456A (ja) | 2005-03-24 | 2006-10-05 | Nec Corp | ファイル管理装置、ファイル管理方法、及びファイル管理プログラム |
JP2007193660A (ja) * | 2006-01-20 | 2007-08-02 | Seiko Epson Corp | 情報管理装置、情報管理方法及びそのプログラム |
US7854006B1 (en) * | 2006-03-31 | 2010-12-14 | Emc Corporation | Differential virus scan |
JP4971717B2 (ja) * | 2006-08-11 | 2012-07-11 | 国立大学法人東京工業大学 | ディレクトリ分散型記憶装置及びデータ処理要求移譲プログラム |
US7599920B1 (en) * | 2006-10-12 | 2009-10-06 | Google Inc. | System and method for enabling website owners to manage crawl rate in a website indexing system |
JP2008304981A (ja) * | 2007-06-05 | 2008-12-18 | Konica Minolta Holdings Inc | ディレクトリ情報の管理方法、及びディレクトリ情報の管理システム |
GB0712640D0 (en) * | 2007-06-28 | 2007-08-08 | Symbian Software Ltd | Domputing device having a merged directory hierarchy from multiple filesystems |
JP2009098733A (ja) * | 2007-10-12 | 2009-05-07 | Olympus Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
JP5371656B2 (ja) * | 2009-09-24 | 2013-12-18 | 株式会社日立ソリューションズ | ファイル検索システム |
CN102331957B (zh) * | 2011-09-28 | 2013-08-28 | 华为技术有限公司 | 文件备份的方法及装置 |
JP5657498B2 (ja) * | 2011-09-30 | 2015-01-21 | 株式会社日立ソリューションズ | ファイル検索システム |
-
2012
- 2012-02-15 JP JP2012030149A patent/JP5759915B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-29 US US13/753,208 patent/US8965941B2/en not_active Expired - Fee Related
- 2013-02-05 EP EP13154012.2A patent/EP2629215A1/en not_active Withdrawn
- 2013-02-05 CN CN201310045913.0A patent/CN103257993B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN103257993B (zh) | 2016-08-17 |
EP2629215A1 (en) | 2013-08-21 |
CN103257993A (zh) | 2013-08-21 |
JP2013167990A (ja) | 2013-08-29 |
US8965941B2 (en) | 2015-02-24 |
US20130212136A1 (en) | 2013-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5759915B2 (ja) | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 | |
JP5798503B2 (ja) | ファイルリスト生成方法及びシステム、ファイルリスト生成装置並びにプログラム | |
JP6870071B2 (ja) | テーブルのインクリメンタルクラスタリング保守 | |
US11461286B2 (en) | Fair sampling in a hierarchical filesystem | |
US10108649B2 (en) | Early exit from table scans of loosely ordered and/or grouped relations using nearly ordered maps | |
US8560569B2 (en) | Method and apparatus for performing bulk file system attribute retrieval | |
US9747331B2 (en) | Limiting scans of loosely ordered and/or grouped relations in a database | |
US8200719B2 (en) | System and method for performing a file system operation on a specified storage tier | |
JP2005078612A (ja) | ファイル共有システム及びファイル共有装置間のファイル移行方法 | |
US20130297788A1 (en) | Computer system and data management method | |
JP6135509B2 (ja) | 情報システム、その管理方法およびプログラム、データ処理方法およびプログラム、ならびに、データ構造 | |
JP2009110260A (ja) | 検索エンジン連携ファイル共有システム | |
KR20130049111A (ko) | 분산 처리를 이용한 포렌식 인덱스 방법 및 장치 | |
Cheng et al. | A Multi-dimensional Index Structure Based on Improved VA-file and CAN in the Cloud | |
JP2008305352A (ja) | 全文検索システム | |
CN110795520B (zh) | 一种数字化地质资料包目录与文件关联关系自动识别方法 | |
Mathew et al. | Efficient information retrieval using Lucene, LIndex and HIndex in Hadoop | |
US9542457B1 (en) | Methods for displaying object history information | |
US20220365905A1 (en) | Metadata processing method and apparatus, and a computer-readable storage medium | |
Singh | NoSQL: A new horizon in big data | |
US20170212940A1 (en) | File system for supporting time-series analysis and operating method thereof | |
Yadav et al. | Working with HBase | |
CN117093559A (zh) | 用于快速分布式文件系统的方法、装置和系统 | |
Pelekis et al. | The case of big mobility data | |
WO2017135264A1 (ja) | 情報処理装置、情報処理方法、及びコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150309 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150413 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5759915 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |