JP6651915B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP6651915B2 JP6651915B2 JP2016045326A JP2016045326A JP6651915B2 JP 6651915 B2 JP6651915 B2 JP 6651915B2 JP 2016045326 A JP2016045326 A JP 2016045326A JP 2016045326 A JP2016045326 A JP 2016045326A JP 6651915 B2 JP6651915 B2 JP 6651915B2
- Authority
- JP
- Japan
- Prior art keywords
- file
- column
- entity
- document
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
- G06F16/137—Hash-based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
Description
ところで、複数の文書記憶装置における重複ファイルに対して、この仮想ファイルを適用した場合は、既存ファイルのみがマッピング先とされてしまう。このような場合、例えば、アクセスが多いにもかかわらず、仮想ファイルであると、通信時間が必要であり、アクセス時間が長くかかってしまうことが起こり得る。しかし、特許文献1に記載の技術では、1つの文書記憶装置内における重複ファイルの排除であるため、代表とするファイルをいずれにするかについては、何ら考慮されていない。
そこで、本発明は、同じ文書を、代表格納場所を示すリンクに置換する場合にあって、その代表格納場所を決定することができるようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段を有し、前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、情報処理装置である。
前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段として機能させ、前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、情報処理プログラムである。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
情報処理装置100は、文書の個別リンクと実体の関係を管理する。そして、文書のアクセス権管理リストはこの個別リンク毎にもつようにしてもよい。
集約実体ファイルテーブル作成モジュール130は、例えば、集約実体ファイルテーブル600を生成する。図6は、集約実体ファイルテーブル600のデータ構造例を示す説明図である。集約実体ファイルテーブル600は、ID欄610、ファイル名欄620、ハッシュ欄630、LOCコード欄640、ノードID欄650、物理位置欄660、ACL欄670を有している。ID欄610は、本実施の形態において、集約実体ファイルテーブル600内の各行を一意に識別するための情報(ID)を記憶している。ファイル名欄620は、ファイル名を記憶している。ハッシュ欄630は、そのファイルのハッシュ値を記憶している。LOCコード欄640は、そのファイルが格納されている装置の位置を示すLOCコード(ロケーションコード)を記憶している。つまりLOCコードは、ユーザー用端末210、ファイルサーバー250等が設置されている場所を示しており、例えば、「0♯0450」は、横浜にあるユーザー用端末210を示し、「1♯0750」は、京都にあるファイルサーバー250を示し、「2♯0000」は、アーカイブの機能を有しているファイルサーバー250を示している。ノードID欄650は、本実施の形態において、そのファイルを格納していた装置(ノード、具体的には、ユーザー用端末210、ファイルサーバー250)を一意に識別するための情報(ノードID)を記憶している。物理位置欄660は、そのファイルの格納場所である物理位置を記憶している。ACL欄670は、そのファイルのアクセス権管理リストを記憶している。
同一ファイルテーブル作成モジュール140は、例えば、同一ファイルテーブル700を生成する。図7は、同一ファイルテーブル700のデータ構造例を示す説明図である。同じファイルを抽出したものである。実体へのリンクを有している。同一ファイルテーブル700は、集約ID欄710、ハッシュ欄720、実体1欄730、実体2欄740を有している。集約ID欄710は、本実施の形態において、同一ファイルテーブル700内の各行を一意に識別するための情報(集約ID)を記憶している。ハッシュ欄720は、ハッシュ値を記憶している。実体1欄730は、実体1のID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。実体2欄740は、実体2のID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。さらに、実体1欄730と同等の欄が続いてもよい。
リロケーションクローラ―155は、通信モジュール110を介して、複数の文書記憶装置と通信を行い、文書又は文書のハッシュ値を収集する。定期的に複数回の収集を行ってもよい。そして、実体ファイルテーブル作成モジュール120による処理を行わせる。さらに、リロケーションクローラ―155は、文書に対するアクセスの履歴を収集してもよい。なお、文書記憶装置側でハッシュ値を算出する場合は、文書のハッシュ値を収集する。
また、リロケーション分析モジュール160は、文書に対するアクセスの履歴を用いて、代表格納場所を決定するようにしてもよい。
リロケーション分析モジュール160は、例えば、リンク−ファイル管理テーブル800又はローカルリンク−ファイル管理テーブル900を生成する。リンク−ファイル管理テーブル800は、ファイルサーバー250用に作成したものであり、個々のファイルサーバー250毎にあるリンクが、どのファイル実体を指すか示すものである。
図8は、リンク−ファイル管理テーブル800のデータ構造例を示す説明図である。リンク−ファイル管理テーブル800は、LinkID欄810、ファイル名欄820、集約ID欄830、実体ID欄840、ACL欄850を有している。LinkID欄810は、リンク−ファイル管理テーブル800内の各行を一意に識別するための情報(LinkID)を記憶している。ファイル名欄820は、ファイル名を記憶している。集約ID欄830は、集約ID(同一ファイルテーブル700の集約ID欄710の内容)を記憶している。実体ID欄840は、実体ID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。ACL欄850は、その実体(ファイル)のアクセス権管理リストを記憶している。
ローカルリンク−ファイル管理テーブル900は、ユーザー用端末210用に作成したものであり、個々のユーザー用端末210毎にあるリンクが、どのファイル実体を指すか示すものである。
図9は、ローカルリンク−ファイル管理テーブル900のデータ構造例を示す説明図である。ローカルリンク−ファイル管理テーブル900は、LinkID欄910、ファイル名欄920、集約ID欄930、実体ID欄940、ACL欄950を有している。LinkID欄910は、ローカルリンク−ファイル管理テーブル900内の各行を一意に識別するための情報(LinkID)を記憶している。ファイル名欄920は、ファイル名を記憶している。集約ID欄930は、集約ID(同一ファイルテーブル700の集約ID欄710の内容)を記憶している。実体ID欄940は、実体ID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。ACL欄950は、その実体(ファイル)のアクセス権管理リストを記憶している。
そして、リロケーション分析モジュール160は、クラスター分割モジュール165による処理結果である集合内の格納場所におけるアクセスの履歴を用いて、その集合内の代表格納場所を決定するようにしてもよい。集合毎に代表格納場所が生成される。したがって、集合が複数ある場合は、複数の代表格納場所が生成されることになる。
また、リロケーションモジュール170は、文書のアクセス権管理リストをリンク毎に付与する。ここで「アクセス権管理リスト」とは、ACL(Access Control List)ともいわれ、文書への利用者(複数人の利用者によって構成されるグループを含む)のアクセス権限を列挙したリストをいう。利用者から文書への操作を指示されると、その文書のアクセス権管理リストが照合されて、適切な権限があるかを調べ、操作の実行の可否が判断される。
アクセス権管理リストはリンク毎に有しており、同じ文書間で統一していない。例えば、グループAで共有されている文書をコピーして、新しいアクセス権管理リストによってグループBに共有させるような利用をする場合、リンク毎にアクセス権管理リストを付与することで、文書の実体をコピーしなくてもよい。
情報処理装置100、ユーザー用端末210A、ユーザー用端末210B、ユーザー用端末210C、ユーザー用端末210D、ファイルサーバー250A、ファイルサーバー250B、ファイルサーバー250Cは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。ユーザー用端末210、ファイルサーバー250は、地域的に分散されていてもよい。例えば、東京、大阪等にあってもよいし、世界的に分散されていてもよい。また、情報処理装置100、ファイルサーバー250による機能は、クラウドサービスとして実現してもよい。情報処理装置100は、各ユーザー用端末210、各ファイルサーバー250内のファイルを対象とする。リロケーションクローラ―155は、クローラとしての機能を用いて、各ユーザー用端末210、各ファイルサーバー250内のファイルを収集する。また、各ユーザー用端末210、各ファイルサーバー250において、ファイルのハッシュ値を算出させ、ハッシュ値を収集してもよい。また、各ユーザー用端末210、各ファイルサーバー250において、実体ファイルテーブル400を生成させて、その実体ファイルテーブル400を収集してもよい。
ユーザー用端末210は、ブラウザ等のユーザーインタフェースにより、文書の実体とリンクに使用上の差がないようにする。つまり、そのユーザー用端末210内にある文書(実体)と、そのユーザー用端末210ではない異なった場所(他のユーザー用端末210、ファイルサーバー250)にある文書(そのユーザー用端末210内ではリンク)の表示上の区別を設けない。したがって、統一的に見せることができ、実体の格納場所を気にする必要がなくなる。
また、ユーザー用端末210は情報処理装置100を含んで構成してもよいし、ファイルサーバー250は情報処理装置100を含んで構成してもよい。
ステップS302では、実体ファイルテーブル作成モジュール120は、各ノード内の実体ファイルに対し、ハッシュ値を算出し、実体ファイルテーブル400を作成する。
具体的には、図5(a)の例に示す実体ファイルテーブル400A、図5(b)の例に示す実体ファイルテーブル400Bを作成する。実体ファイルテーブル400Aは、ユーザー用端末210A内のファイルを対象としたものであり、実体ファイルテーブル400Bは、ファイルサーバー250A内のファイルを対象としたものである。
ハッシュ値(ハッシュ欄430A、ハッシュ欄430B内の値)を比較することによって、実体ファイルテーブル400A内の対象行582(ID:1234)のファイルと実体ファイルテーブル400B内の対象行584(ID:2866)のファイルは同一であるが、まだ共通化されていない状態であることを示している。
なお、実体ファイルテーブル400B内の対象行586(ID:4331)は共通化されたファイルである。ACL欄450B内の“−−−−”は、共通化されたACLであることを示す。
具体的には、図6の例に示す集約実体ファイルテーブル600は、図5(a)の例に示す実体ファイルテーブル400A、図5(b)の例に示す実体ファイルテーブル400Bをマージしたものである。ID欄610、ファイル名欄620、ハッシュ欄630、物理位置欄660、ACL欄670は、それぞれ実体ファイルテーブル400のID欄410、ファイル名欄420、ハッシュ欄430、物理位置欄440、ACL欄450に対応している。そして、ノードID欄650は、そのファイルが格納されている装置(具体的には、実体ファイルテーブル400Aのユーザー用端末210A、実体ファイルテーブル400Bのファイルサーバー250A等)を示している。対象行682は対象行582、対象行684は対象行584、対象行686は対象行586に対応している。
具体的には、図7の例に示す同一ファイルテーブル700は、集約実体ファイルテーブル600から作成したものである。対象行782は、対象行682、対象行684から生成したものである。対象行784は、対象行686から生成したものである。
リンク−ファイル管理テーブル800の対象行882(実体ID:1234)と対象行884(実体ID:2866)は同一であるが、まだ共通化されていない状態である。対象行886(実体ID:4331)、対象行888(実体ID:4331)は共通化されたファイルである。なお、それぞれに異なったACLをもつ。つまり、リンク毎にACLをつけることで、実体をコピーしなくてよいようにしている。
そして、ローカルリンク−ファイル管理テーブル900の対象行982では、ファイルの実体はユーザー用端末210Aにあることを示している。対象行984では、ファイルの実体はファイルサーバー250A、ACLはファイルサーバー250Aのものであることを示している。
例えば、ユーザー用端末210は、ローカルリンク−ファイル管理テーブル900を用いて、アクセス画面1000を表示する。アクセス画面1000は、フォルダ一覧表示領域1040、ファイル一覧表示領域1050を有している。フォルダ一覧表示領域1040はフォルダを木構造として表示し、ファイル一覧表示領域1050は、フォルダ一覧表示領域1040で指定されたフォルダ内のファイルをリスト表示している。
つまり、各ノード(ユーザー用端末210、ファイルサーバー250)でリンク(ローカルリンク−ファイル管理テーブル900、リンク−ファイル管理テーブル800)を保持する。そのリンクを用いて、ファイルのリスト表示、ファイルのオープンなどの操作ができる。
ステップS1102では、同一ファイルテーブル700で、同じ実体が複数あるものを探す。その複数の実体を内容とする統一候補リストを生成する。
ステップS1104では、統一候補リストから1行取り出す。
ステップS1112では、要求元とファイルロケーションが一致するアクセスのアクセス頻度を計算する。
ステップS1114では、頻度が週5回以下であるか否かを判断し、週5回以下の場合はステップS1118へ進み、それ以外の場合はステップS1116へ進む。なお、もちろんのことながら、閾値としての5回は予め定められた値の例示であって、5回以外の数値であってもよい。
ステップS1116では、リロケーションせず同じ格納場所に置き、検討対象から除外する。
ステップS1120では、アクセスカウント数を合計する。
ステップS1122では、合計が閾値以下であるか否かを判断し、合計が閾値以下の場合はステップS1128へ進み、それ以外の場合はステップS1124へ進む。ここでの閾値は、予め定められた値である。
ステップS1124では、要求元ロケーション毎にその時間帯のカウント数を集計する。例えば、要求元カウントテーブル1600を生成する。図16は、要求元カウントテーブル1600のデータ構造例を示す説明図である。要求元カウントテーブル1600は、要求元LOC欄1610、カウント欄1620を有している。要求元LOC欄1610は、アクセスの要求を行った装置(ユーザー用端末210、ファイルサーバー250)のLOCコードを記憶している。カウント欄1620は、その装置によるアクセスのカウント値を記憶している。なお、図16では、最終行にカウント値の合計を示している。
ステップS1128では、全体を一つの抽出クラスターとして、ステップS1130へ進む。
ステップS1130では、クラスターから1個選択する。
ステップS1132では、クラスターの中心に近い標準ファイルサーバーを選択する。
ステップS1136では、次のクラスターを対象として、ステップS1132に戻る。
ステップS1138では、最も安いタイプのファイルサーバーを候補として、ステップS1140へ進む。
ステップS1140では、クラスターから1個選択する。
ステップS1144では、同一ファイルテーブルに追加する。
ステップS1146では、各ノードからのリンク先をこの実体IDに置き換える。
ステップS1148では、すべてのクラスターの処理が終わったか否かを判断し、すべてのクラスターの処理が終わった場合はステップS1152へ進み、それ以外の場合はステップS1150へ進む。
ステップS1152では、選択されたファイルサーバー以外の旧実体ファイルを削除し、同一ファイルテーブルから旧実体IDを削除する。
ステップS1154では、すべての統一候補の処理が終わったか否かを判断し、すべての統一候補の処理が終わった場合は処理を終了し(ステップS1199)、それ以外の場合はステップS1156へ進む。
ステップS1156では、次の統一候補を対象として、ステップS1106に戻る。
ステップS1702では、アクセス要求元の近いところからボトムアップに樹状クラスターを形成する。
ステップS1704では、残ったクラスターが1であるか否かを判断し、残ったクラスターが1である場合はステップS1716へ進み、それ以外の場合はステップS1706へ進む。
ステップS1708では、2つのアクセスカウントを合計する。
ステップS1710では、合計が閾値以下であるか否かを判断し、合計が閾値以下である場合はステップS1714へ進み、それ以外の場合はステップS1712へ進む。ここでの閾値は、予め定められた値である。
ステップS1714では、2つのクラスターをマージし、中心地のロケーションコードを与える。アクセスカウントを合計する。そして、ステップS1704に戻る。
ステップS1716では、残ったクラスターを抽出クラスターに追加する。
ステップS1702の処理では、以下のようになる。
図18は、図18(a)の例に示す要求元カウントテーブル1600に対して、図18(b)の例に示す樹状クラスターを形成したことを示している。4行目と5行目でクラスターAを形成し、要求元カウントテーブル1600の1行目と2行目でクラスターBを形成し、6行目とクラスターAでクラスターCを形成し、3行目とクラスターCでクラスターDを形成し、クラスターBとクラスターDでクラスターEを形成していることを示している。なお、「アクセス要求元の近い」とは、アクセス要求をした装置の位置が近いことをいい、ここで近いと判定するための距離は、装置が設置されている位置間における距離(地図上での距離)としてもよいし、通信回線上でのトポロジカル的な距離(例えば、通信相手に到達するまでに経由する中継設備の数を示すホップ数)としてもよい。
図19は、最初のループでは、図18の例に示す要求元カウントテーブル1600では、4行目と5行目の対(クラスターA)が該当する。4行目(0#0920)と5行目(0#0930)のカウント数をマージすると合計のアクセスカウントが閾値(例えば、ここでは「10000」とする)を超える。したがって、4行目(#0920)を抽出して、図19(b)の例に示す抽出クラスターテーブル1900を生成する。
次のループでは、以下のようになる。
図20(a)の例に示す要求元カウントテーブル1600は、図18(a)の例に示す要求元カウントテーブル1600の4行目(0#0920)を削除したものである。
図20(b)の例に示す要求元カウントテーブル1600は、図20(a)の例に示す要求元カウントテーブル1600の1行目と2行目をマージし、4行目と5行目をマージしたものである。それぞれのアクセスカウントの合計は閾値以下であるので、それぞれの中心地のロケーションコード(0#0440、0#0942)を付与する。これによって、図20(b)の例に示す要求元カウントテーブル1600が生成される。
次に、図20(b)の例に示す要求元カウントテーブル1600の2行目(0#0780)と3行目(0#0942)をマージすると合計のアクセスカウントが閾値を超える。したがって、3行目(0#0942)を抽出して、図21の例に示す抽出クラスターテーブル1900の2行目を生成する。そして、図20(b)の例に示す要求元カウントテーブル1600の1行目(0#0440)と2行目(0#0780)をマージすると合計のアクセスカウントは閾値以下であるので、中心地のロケーションコード(0#0500)を付与する。これによって、図21の例に示す抽出クラスターテーブル1900が生成される。
図22は、中心サーバー適用テーブル2200のデータ構造例を示す説明図である。
中心サーバー適用テーブル2200は、図21の例に示す抽出クラスターテーブル1900に中心サーバー欄2230を付加したものである。中心サーバー適用テーブル2200は、要求元LOC欄2210、カウント欄2220、中心サーバー欄2230を有している。要求元LOC欄2210は、要求元LOCを記憶している。カウント欄2220は、カウントを記憶している。中心サーバー欄2230の中心サーバーは、要求元の中心の場所である要求元LOCに最も近い場所にあるファイルサーバーを割り当てる。例えば0#0500の位置に近い地域にファイルサーバーがない場合、その中で最も近いファイルサーバーであるFS2#0750 が選択されている。このファイルサーバーに、文書の実体が置かれることになる。そして、この実体へのリンクで、そのファイルサーバーが含まれているクラスター内における他の装置(ユーザー用端末210)での実体の文書を置き換える。
ステップS2302では、アクセス装置であるユーザー用端末210は、アクセスの対象としているファイルについて、ローカルリンク−ファイル管理テーブルから集約IDと実体IDを取得する。
ステップS2304では、ステップS2302で対象としたファイルがローカルファイルであるか否か(実体はユーザー用端末210内にあるか否か)を判断し、ローカルファイルである場合はステップS2312へ進み、それ以外の場合はステップS2306へ進む。
ステップS2306では、リソース管理装置である情報処理装置100に集約IDと実体IDを送る。
ステップS2308では、リソース管理装置である情報処理装置100は集約実体ファイルから実体があるファイルサーバー250を特定する。
ステップS2310では、実体があるファイルサーバー250にファイルリクエストを送り、得られた結果をユーザー用端末210に返す。
ステップS2312では、ユーザー用端末210内のローカルファイルをオープンする。そして、処理を終了する(ステップS2399)。
別名で保存する場合は、ユーザーが決めた実体の場所(ファイルサーバー250又はユーザー用端末210)に実体を置き、実体ファイルテーブル、同一ファイルテーブル、リンク−ファイル管理テーブルに新しいエントリーを作る。
上書き保存する場合は、図24の例に示すフローチャートによる処理を行う。
ステップS2402では、元のファイルロケーションに別ファイルとして作成する。
ステップS2404では、集約実体ファイルテーブルに新しいエントリーを作成する。
ステップS2406では、同一ファイルテーブルに新しいエントリーを作成する。
ステップS2408では、リンク−ファイル管理テーブルで新しいリンクに書き換える。なお、旧集約IDに対応するリンクがなくなったら同一ファイルテーブルから削除する。
LinkID:$FS1−063とLinkID:$FS2−241は、同一の実体(実体ID:4331)を指す別ファイルである。ここでLinkID:$FS1−063のファイルを書き換えるとする。
図25は、集約実体ファイルテーブル2500のデータ構造例を示す説明図である。
集約実体ファイルテーブル2500は、図6の例に示した集約実体ファイルテーブル600と同等のデータ構成である。集約実体ファイルテーブル2500は、ID欄2510、ファイル名欄2520、ハッシュ欄2530、LOCコード欄2540、ノードID欄2550、物理位置欄2560、ACL欄2570を有している。ID欄2510は、IDを記憶している。ファイル名欄2520は、ファイル名を記憶している。ハッシュ欄2530は、ハッシュを記憶している。LOCコード欄2540は、LOCコードを記憶している。ノードID欄2550は、ノードIDを記憶している。物理位置欄2560は、物理位置を記憶している。ACL欄2570は、ACLを記憶している。
ステップS2404の処理として、集約実体ファイルテーブル2500の2行目(対象行2584)を作成する。
ステップS2406の処理として、同一ファイルテーブル2600の2行目(対象行2684)を作成する。
ステップS2408の処理として、リンク−ファイル管理テーブル2700の3行目(対象行2784)を4行目(対象行2786)に書き換える。
なお、図28に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図28に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図28に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
利用者の個人が有しているユーザー用端末210にだけあるファイルで、更新が長期間(予め定められた期間よりも長い又は以上)なされていないものを通知し、ファイルサーバー250への移動を促すコメントを出力(レコメンド)してもよい。
アクセスカウントが予め定められた閾値よりも低い又は以下である場合、アーカイブ専用のファイルサーバー250(ストレージ)に実体を移行するようにしてもよい。コストダウンを図ることができる。
ユーザー用端末210内のファイル(ユーザー用端末210内におけるローカルファイル等が該当する)に対して、そのユーザー用端末210からのアクセスカウントが予め定められた閾値より多い又は以上である場合は、実体の移動は行わないようにしてもよい。なお、ここでの閾値は、実体の移動を行う場合に用いた閾値よりも低い値とする。
また、前述の実施の形態の説明内での比較処理において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分又は全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
110…通信モジュール
120…実体ファイルテーブル作成モジュール
130…集約実体ファイルテーブル作成モジュール
140…同一ファイルテーブル作成モジュール
150…リンク・ファイル管理テーブル作成モジュール
155…リロケーションクローラ―
160…リロケーション分析モジュール
165…クラスター分割モジュール
170…リロケーションモジュール
180…記憶モジュール
210…ユーザー用端末
250…ファイルサーバー
290…通信回線
Claims (5)
- 複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、
前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、
前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段
を有し、
前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、
情報処理装置。 - 前記決定手段は、文書に対するアクセスの履歴を用いて、代表格納場所を決定する、
請求項1に記載の情報処理装置。 - 前記決定手段は、複数の格納場所を有する集合を生成し、該集合内の格納場所におけるアクセスの履歴を用いて、該集合内の代表格納場所を決定する、
請求項2に記載の情報処理装置。 - 文書のアクセス権管理リストを前記リンク毎に付与する付与手段
をさらに有する請求項1から3のいずれか一項に記載の情報処理装置。 - コンピュータを、
複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、
前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、
前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段
として機能させ、
前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、
情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016045326A JP6651915B2 (ja) | 2016-03-09 | 2016-03-09 | 情報処理装置及び情報処理プログラム |
US15/236,491 US20170262439A1 (en) | 2016-03-09 | 2016-08-15 | Information processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016045326A JP6651915B2 (ja) | 2016-03-09 | 2016-03-09 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017162142A JP2017162142A (ja) | 2017-09-14 |
JP6651915B2 true JP6651915B2 (ja) | 2020-02-19 |
Family
ID=59788115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016045326A Expired - Fee Related JP6651915B2 (ja) | 2016-03-09 | 2016-03-09 | 情報処理装置及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170262439A1 (ja) |
JP (1) | JP6651915B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7102529B2 (ja) | 2018-08-24 | 2022-07-19 | 三菱電機株式会社 | データ収集サーバ、データ利用サーバ、機器、データ流通システム、データ収集方法及びプログラム |
CN112540727A (zh) * | 2020-12-04 | 2021-03-23 | 北京百度网讯科技有限公司 | 数据管理方法、装置、计算设备、存储介质和云平台 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5020673B2 (ja) * | 2007-03-27 | 2012-09-05 | 株式会社日立製作所 | 重複したファイルの記憶を防ぐコンピュータシステム |
CN104106063B (zh) * | 2012-02-13 | 2017-06-30 | 株式会社日立制作所 | 用于分级存储系统的管理装置和管理方法 |
-
2016
- 2016-03-09 JP JP2016045326A patent/JP6651915B2/ja not_active Expired - Fee Related
- 2016-08-15 US US15/236,491 patent/US20170262439A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2017162142A (ja) | 2017-09-14 |
US20170262439A1 (en) | 2017-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5046881B2 (ja) | 情報処理装置、表示制御方法ならびにプログラム | |
EP2759942A1 (en) | Computer system, file management method and metadata server | |
KR101355273B1 (ko) | 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체 | |
US20140358868A1 (en) | Life cycle management of metadata | |
EP2778953A1 (en) | Encoded-search database device, method for adding and deleting data for encoded search, and addition/deletion program | |
WO2023160327A1 (en) | Container image management | |
US20210165785A1 (en) | Remote processing of memory and files residing on endpoint computing devices from a centralized device | |
US20150286663A1 (en) | Remote processing of memory and files residing on endpoint computing devices from a centralized device | |
US20230206365A1 (en) | Seamless Electronic Discovery System with an Enterprise Data Portal | |
CN110888837A (zh) | 对象存储小文件归并方法及装置 | |
WO2013145125A1 (ja) | コンピュータシステム及びセキュリティ管理方法 | |
US8812467B2 (en) | Information processing apparatus and computer readable medium for performing history cancellation processing | |
JP4259588B2 (ja) | 情報処理システム及び情報処理プログラム | |
JP6651915B2 (ja) | 情報処理装置及び情報処理プログラム | |
CN110941629A (zh) | 元数据处理方法、装置、设备及计算机可读存储介质 | |
US9785724B2 (en) | Secondary queue for index process | |
CN116204540A (zh) | 操作日志记录方法、装置、设备及存储介质 | |
US20210157849A1 (en) | Determining an audit level for data | |
JP6123519B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2013171447A (ja) | 情報処理装置及び情報処理プログラム | |
JP5929356B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20220067183A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
KR20190109664A (ko) | 빅 데이터 비식별화 처리 시스템 및 방법 | |
US20120233224A1 (en) | Data processing | |
JP7347533B2 (ja) | 管理装置、管理方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6651915 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |