JP6651915B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP6651915B2
JP6651915B2 JP2016045326A JP2016045326A JP6651915B2 JP 6651915 B2 JP6651915 B2 JP 6651915B2 JP 2016045326 A JP2016045326 A JP 2016045326A JP 2016045326 A JP2016045326 A JP 2016045326A JP 6651915 B2 JP6651915 B2 JP 6651915B2
Authority
JP
Japan
Prior art keywords
file
column
entity
document
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016045326A
Other languages
English (en)
Other versions
JP2017162142A (ja
Inventor
良寛 上田
良寛 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016045326A priority Critical patent/JP6651915B2/ja
Priority to US15/236,491 priority patent/US20170262439A1/en
Publication of JP2017162142A publication Critical patent/JP2017162142A/ja
Application granted granted Critical
Publication of JP6651915B2 publication Critical patent/JP6651915B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、ユーザーが保存する情報は、同じデータやファイルをユーザー毎に個別に保存しているケースが多く見られ、このため、管理者は、ストレージには同じデータが複数箇所に重複保存されているものの、ユーザーが異なるため共有化/削除することもできず、余分なストレージエリアを消費しているが、本ストレージ仮想化装置により、データ重複除外機能を利用してリソース効率化が可能となるストレージ仮想化装置の新たな機能を生み出すことを課題とし、ストレージ仮想化装置は、配下のデータの同一性をチェックし、同一データがあれば、1データのみ特定のストレージエリアに移動させ代表データとし、それ以外のデータは削除するが、ただし、ユーザー毎に本ファイルを用意する必要があるため、代表実データと、各ユーザー上の仮想化エリア上の仮想ファイルとマッピングさせて、参照できるようにすることが開示されている。
特開2012−008854号公報
特許文献1に記載の技術では、重複して格納される新規ファイルを仮想ファイルとして、既存ファイルにマッピングすることが行われている。
ところで、複数の文書記憶装置における重複ファイルに対して、この仮想ファイルを適用した場合は、既存ファイルのみがマッピング先とされてしまう。このような場合、例えば、アクセスが多いにもかかわらず、仮想ファイルであると、通信時間が必要であり、アクセス時間が長くかかってしまうことが起こり得る。しかし、特許文献1に記載の技術では、1つの文書記憶装置内における重複ファイルの排除であるため、代表とするファイルをいずれにするかについては、何ら考慮されていない。
そこで、本発明は、同じ文書を、代表格納場所を示すリンクに置換する場合にあって、その代表格納場所を決定することができるようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段を有し、前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、情報処理装置である。
請求項2の発明は、前記決定手段は、文書に対するアクセスの履歴を用いて、代表格納場所を決定する、請求項1に記載の情報処理装置である。
請求項3の発明は、前記決定手段は、複数の格納場所を有する集合を生成し、該集合内の格納場所におけるアクセスの履歴を用いて、該集合内の代表格納場所を決定する、請求項2に記載の情報処理装置である。
請求項4の発明は、文書のアクセス権管理リストを前記リンク毎に付与する付与手段をさらに有する請求項1から3のいずれか一項に記載の情報処理装置である。
請求項5の発明は、コンピュータを、複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、
前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段として機能させ、前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、情報処理プログラムである。
請求項1の情報処理装置によれば、同じ文書を、代表格納場所を示すリンクに置換する場合にあって、その代表格納場所を決定することができる。
請求項2の情報処理装置によれば、文書に対するアクセスの履歴を用いて、代表格納場所を決定することができる。
請求項3の情報処理装置によれば、複数の格納場所を有する集合を生成し、その集合内の格納場所におけるアクセスの履歴を用いて、その集合内の代表格納場所を決定することができる。
請求項4の情報処理装置によれば、文書のアクセス権管理リストをリンク毎に付与することができる。
請求項5の情報処理プログラムによれば、同じ文書を、代表格納場所を示すリンクに置換する場合にあって、その代表格納場所を決定することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 実体ファイルテーブルのデータ構造例を示す説明図である。 本実施の形態が対象とする実体ファイルテーブル400の例を示す説明図である。 集約実体ファイルテーブルのデータ構造例を示す説明図である。 同一ファイルテーブルのデータ構造例を示す説明図である。 リンク−ファイル管理テーブルのデータ構造例を示す説明図である。 ローカルリンク−ファイル管理テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示すフローチャートである。 集約アクセスログのデータ構造例を示す説明図である。 保有コストテーブルのデータ構造例を示す説明図である。 要求元カウントテーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 中心サーバー適用テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示すフローチャートである。 集約実体ファイルテーブルのデータ構造例を示す説明図である。 同一ファイルテーブルのデータ構造例を示す説明図である。 リンク−ファイル管理テーブルのデータ構造例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である情報処理装置100は、同じ文書(以下、ファイルともいう)を、代表格納場所を示すリンクに置換するものであって、図1の例に示すように、通信モジュール110、実体ファイルテーブル作成モジュール120、集約実体ファイルテーブル作成モジュール130、同一ファイルテーブル作成モジュール140、リンク・ファイル管理テーブル作成モジュール150、記憶モジュール180を有している。なお、文書とは、主にテキストデータ、場合によっては図形、画像、動画、音声等の電子データ(ファイルともいわれる)、又はこれらの組み合わせであり、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。具体的には、文書作成プログラムによって作成された文書、Webページ等を含む。
情報処理装置100は、文書の個別リンクと実体の関係を管理する。そして、文書のアクセス権管理リストはこの個別リンク毎にもつようにしてもよい。
通信モジュール110は、実体ファイルテーブル作成モジュール120、リンク・ファイル管理テーブル作成モジュール150、記憶モジュール180と接続されている。通信モジュール110は、文書記憶装置との通信を行う。ここでの文書記憶装置として、例えば、文書サーバー(以下、ファイルサーバーともいう)、個人が用いる情報処理装置等がある。また、個人が用いる情報処理装置として、例えば、PC(Personal Computer)、スマートフォンを含む携帯端末装置等がある。
実体ファイルテーブル作成モジュール120は、通信モジュール110、集約実体ファイルテーブル作成モジュール130、記憶モジュール180と接続されている。実体ファイルテーブル作成モジュール120は、リロケーションクローラ―155によって収集された文書に関する情報を管理する。例えば、実体ファイルテーブル400を生成する。図4は、実体ファイルテーブル400のデータ構造例を示す説明図である。実体ファイルテーブル400は、ID欄410、ファイル名欄420、ハッシュ欄430、物理位置欄440、ACL欄450を有している。ID欄410は、本実施の形態において、実体ファイルテーブル400内の各行(ファイル(文書))を一意に識別するための情報(ID:IDentification)を記憶している。ファイル名欄420は、ファイル名を記憶している。ハッシュ欄430は、そのファイルのハッシュ値を記憶している。物理位置欄440は、そのファイルの物理位置を記憶している。ACL欄450は、そのファイルのアクセス権管理リストを記憶している。実体ファイルテーブル400は、文書を記憶している装置(後述するノード、各ユーザー用端末210、各ファイルサーバー250)毎に生成する。なお、実体ファイルテーブル作成モジュール120が生成するのではなく、文書を記憶している装置が生成した実体ファイルテーブル400を収集してもよい。
集約実体ファイルテーブル作成モジュール130は、実体ファイルテーブル作成モジュール120、同一ファイルテーブル作成モジュール140、記憶モジュール180と接続されている。集約実体ファイルテーブル作成モジュール130は、複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する。例えば、対応する文書の内容をマッチングさせて、同じ文書であるか否かを判断してもよいし、文書に対してハッシュ値を計算して、そのハッシュ値が同じものを、同じ文書として抽出してもよい。なお、「複数の文書記憶装置」であるので、もちろんのことながら、「複数の格納場所」である。同じ文書は、複数の文書記憶装置内にあるが、そのうちの1つの文書記憶装置内において複数の格納場所にある場合を含めてもよい。
集約実体ファイルテーブル作成モジュール130は、例えば、集約実体ファイルテーブル600を生成する。図6は、集約実体ファイルテーブル600のデータ構造例を示す説明図である。集約実体ファイルテーブル600は、ID欄610、ファイル名欄620、ハッシュ欄630、LOCコード欄640、ノードID欄650、物理位置欄660、ACL欄670を有している。ID欄610は、本実施の形態において、集約実体ファイルテーブル600内の各行を一意に識別するための情報(ID)を記憶している。ファイル名欄620は、ファイル名を記憶している。ハッシュ欄630は、そのファイルのハッシュ値を記憶している。LOCコード欄640は、そのファイルが格納されている装置の位置を示すLOCコード(ロケーションコード)を記憶している。つまりLOCコードは、ユーザー用端末210、ファイルサーバー250等が設置されている場所を示しており、例えば、「0♯0450」は、横浜にあるユーザー用端末210を示し、「1♯0750」は、京都にあるファイルサーバー250を示し、「2♯0000」は、アーカイブの機能を有しているファイルサーバー250を示している。ノードID欄650は、本実施の形態において、そのファイルを格納していた装置(ノード、具体的には、ユーザー用端末210、ファイルサーバー250)を一意に識別するための情報(ノードID)を記憶している。物理位置欄660は、そのファイルの格納場所である物理位置を記憶している。ACL欄670は、そのファイルのアクセス権管理リストを記憶している。
同一ファイルテーブル作成モジュール140は、集約実体ファイルテーブル作成モジュール130、リンク・ファイル管理テーブル作成モジュール150、記憶モジュール180と接続されている。
同一ファイルテーブル作成モジュール140は、例えば、同一ファイルテーブル700を生成する。図7は、同一ファイルテーブル700のデータ構造例を示す説明図である。同じファイルを抽出したものである。実体へのリンクを有している。同一ファイルテーブル700は、集約ID欄710、ハッシュ欄720、実体1欄730、実体2欄740を有している。集約ID欄710は、本実施の形態において、同一ファイルテーブル700内の各行を一意に識別するための情報(集約ID)を記憶している。ハッシュ欄720は、ハッシュ値を記憶している。実体1欄730は、実体1のID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。実体2欄740は、実体2のID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。さらに、実体1欄730と同等の欄が続いてもよい。
リンク・ファイル管理テーブル作成モジュール150は、リロケーションクローラ―155、リロケーション分析モジュール160、クラスター分割モジュール165、リロケーションモジュール170を有しており、通信モジュール110、同一ファイルテーブル作成モジュール140、記憶モジュール180と接続されている。
リロケーションクローラ―155は、通信モジュール110を介して、複数の文書記憶装置と通信を行い、文書又は文書のハッシュ値を収集する。定期的に複数回の収集を行ってもよい。そして、実体ファイルテーブル作成モジュール120による処理を行わせる。さらに、リロケーションクローラ―155は、文書に対するアクセスの履歴を収集してもよい。なお、文書記憶装置側でハッシュ値を算出する場合は、文書のハッシュ値を収集する。
リロケーション分析モジュール160は、複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する。
また、リロケーション分析モジュール160は、文書に対するアクセスの履歴を用いて、代表格納場所を決定するようにしてもよい。
リロケーション分析モジュール160は、例えば、リンク−ファイル管理テーブル800又はローカルリンク−ファイル管理テーブル900を生成する。リンク−ファイル管理テーブル800は、ファイルサーバー250用に作成したものであり、個々のファイルサーバー250毎にあるリンクが、どのファイル実体を指すか示すものである。
図8は、リンク−ファイル管理テーブル800のデータ構造例を示す説明図である。リンク−ファイル管理テーブル800は、LinkID欄810、ファイル名欄820、集約ID欄830、実体ID欄840、ACL欄850を有している。LinkID欄810は、リンク−ファイル管理テーブル800内の各行を一意に識別するための情報(LinkID)を記憶している。ファイル名欄820は、ファイル名を記憶している。集約ID欄830は、集約ID(同一ファイルテーブル700の集約ID欄710の内容)を記憶している。実体ID欄840は、実体ID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。ACL欄850は、その実体(ファイル)のアクセス権管理リストを記憶している。
ローカルリンク−ファイル管理テーブル900は、ユーザー用端末210用に作成したものであり、個々のユーザー用端末210毎にあるリンクが、どのファイル実体を指すか示すものである。
図9は、ローカルリンク−ファイル管理テーブル900のデータ構造例を示す説明図である。ローカルリンク−ファイル管理テーブル900は、LinkID欄910、ファイル名欄920、集約ID欄930、実体ID欄940、ACL欄950を有している。LinkID欄910は、ローカルリンク−ファイル管理テーブル900内の各行を一意に識別するための情報(LinkID)を記憶している。ファイル名欄920は、ファイル名を記憶している。集約ID欄930は、集約ID(同一ファイルテーブル700の集約ID欄710の内容)を記憶している。実体ID欄940は、実体ID(集約実体ファイルテーブル600のID欄610の内容)を記憶している。ACL欄950は、その実体(ファイル)のアクセス権管理リストを記憶している。
クラスター分割モジュール165は、同じ文書に対する複数の格納場所を対象として、複数の格納場所を有する集合(以下、クラスターともいう)を生成する。
そして、リロケーション分析モジュール160は、クラスター分割モジュール165による処理結果である集合内の格納場所におけるアクセスの履歴を用いて、その集合内の代表格納場所を決定するようにしてもよい。集合毎に代表格納場所が生成される。したがって、集合が複数ある場合は、複数の代表格納場所が生成されることになる。
リロケーションモジュール170は、代表格納場所以外の格納場所にある文書を、その代表格納場所を示すリンクに置換する。つまり、文書の実体は、代表格納場所に格納されており、その文書以外の文書は、その代表格納場所を示すリンクに置換する。なお、代表格納場所は、1つであってもよいし、複数であってもよい。
また、リロケーションモジュール170は、文書のアクセス権管理リストをリンク毎に付与する。ここで「アクセス権管理リスト」とは、ACL(Access Control List)ともいわれ、文書への利用者(複数人の利用者によって構成されるグループを含む)のアクセス権限を列挙したリストをいう。利用者から文書への操作を指示されると、その文書のアクセス権管理リストが照合されて、適切な権限があるかを調べ、操作の実行の可否が判断される。
アクセス権管理リストはリンク毎に有しており、同じ文書間で統一していない。例えば、グループAで共有されている文書をコピーして、新しいアクセス権管理リストによってグループBに共有させるような利用をする場合、リンク毎にアクセス権管理リストを付与することで、文書の実体をコピーしなくてもよい。
記憶モジュール180は、通信モジュール110、実体ファイルテーブル作成モジュール120、集約実体ファイルテーブル作成モジュール130、同一ファイルテーブル作成モジュール140、リンク・ファイル管理テーブル作成モジュール150と接続されている。記憶モジュール180は、リロケーションクローラ―155が収集したファイル又はファイルのハッシュ値、実体ファイルテーブル400、集約実体ファイルテーブル600、同一ファイルテーブル700、リンク−ファイル管理テーブル800、ローカルリンク−ファイル管理テーブル900等を記憶する。
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
情報処理装置100、ユーザー用端末210A、ユーザー用端末210B、ユーザー用端末210C、ユーザー用端末210D、ファイルサーバー250A、ファイルサーバー250B、ファイルサーバー250Cは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。ユーザー用端末210、ファイルサーバー250は、地域的に分散されていてもよい。例えば、東京、大阪等にあってもよいし、世界的に分散されていてもよい。また、情報処理装置100、ファイルサーバー250による機能は、クラウドサービスとして実現してもよい。情報処理装置100は、各ユーザー用端末210、各ファイルサーバー250内のファイルを対象とする。リロケーションクローラ―155は、クローラとしての機能を用いて、各ユーザー用端末210、各ファイルサーバー250内のファイルを収集する。また、各ユーザー用端末210、各ファイルサーバー250において、ファイルのハッシュ値を算出させ、ハッシュ値を収集してもよい。また、各ユーザー用端末210、各ファイルサーバー250において、実体ファイルテーブル400を生成させて、その実体ファイルテーブル400を収集してもよい。
ユーザー用端末210は、ブラウザ等のユーザーインタフェースにより、文書の実体とリンクに使用上の差がないようにする。つまり、そのユーザー用端末210内にある文書(実体)と、そのユーザー用端末210ではない異なった場所(他のユーザー用端末210、ファイルサーバー250)にある文書(そのユーザー用端末210内ではリンク)の表示上の区別を設けない。したがって、統一的に見せることができ、実体の格納場所を気にする必要がなくなる。
また、ユーザー用端末210は情報処理装置100を含んで構成してもよいし、ファイルサーバー250は情報処理装置100を含んで構成してもよい。
図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、実体ファイルテーブル作成モジュール120は、各ノード内の実体ファイルに対し、ハッシュ値を算出し、実体ファイルテーブル400を作成する。
具体的には、図5(a)の例に示す実体ファイルテーブル400A、図5(b)の例に示す実体ファイルテーブル400Bを作成する。実体ファイルテーブル400Aは、ユーザー用端末210A内のファイルを対象としたものであり、実体ファイルテーブル400Bは、ファイルサーバー250A内のファイルを対象としたものである。
ハッシュ値(ハッシュ欄430A、ハッシュ欄430B内の値)を比較することによって、実体ファイルテーブル400A内の対象行582(ID:1234)のファイルと実体ファイルテーブル400B内の対象行584(ID:2866)のファイルは同一であるが、まだ共通化されていない状態であることを示している。
なお、実体ファイルテーブル400B内の対象行586(ID:4331)は共通化されたファイルである。ACL欄450B内の“−−−−”は、共通化されたACLであることを示す。
ステップS304では、集約実体ファイルテーブル作成モジュール130は、対象となる実体ファイルテーブル400を収集し、集約実体ファイルテーブル600を作成する。
具体的には、図6の例に示す集約実体ファイルテーブル600は、図5(a)の例に示す実体ファイルテーブル400A、図5(b)の例に示す実体ファイルテーブル400Bをマージしたものである。ID欄610、ファイル名欄620、ハッシュ欄630、物理位置欄660、ACL欄670は、それぞれ実体ファイルテーブル400のID欄410、ファイル名欄420、ハッシュ欄430、物理位置欄440、ACL欄450に対応している。そして、ノードID欄650は、そのファイルが格納されている装置(具体的には、実体ファイルテーブル400Aのユーザー用端末210A、実体ファイルテーブル400Bのファイルサーバー250A等)を示している。対象行682は対象行582、対象行684は対象行584、対象行686は対象行586に対応している。
ステップS306では、同一ファイルテーブル作成モジュール140は、ハッシュ値が同じファイルを集約IDを付して、同一ファイルテーブル700を作成する。
具体的には、図7の例に示す同一ファイルテーブル700は、集約実体ファイルテーブル600から作成したものである。対象行782は、対象行682、対象行684から生成したものである。対象行784は、対象行686から生成したものである。
ステップS308では、リンク・ファイル管理テーブル作成モジュール150は、同一ファイルテーブル700を用いて、リンク−ファイル管理テーブル800又はローカルリンク−ファイル管理テーブル900を作成する。この処理の詳細は、図11から図13に示すフローチャートを用いて後述する。図8の例に示すリンク−ファイル管理テーブル800、図9の例に示すローカルリンク−ファイル管理テーブル900は、同一ファイルテーブル700から作成したものである。リンク−ファイル管理テーブル800を、ファイルサーバー250Aに送信し、ローカルリンク−ファイル管理テーブル900をユーザー用端末210Aに送信する。
リンク−ファイル管理テーブル800の対象行882(実体ID:1234)と対象行884(実体ID:2866)は同一であるが、まだ共通化されていない状態である。対象行886(実体ID:4331)、対象行888(実体ID:4331)は共通化されたファイルである。なお、それぞれに異なったACLをもつ。つまり、リンク毎にACLをつけることで、実体をコピーしなくてよいようにしている。
そして、ローカルリンク−ファイル管理テーブル900の対象行982では、ファイルの実体はユーザー用端末210Aにあることを示している。対象行984では、ファイルの実体はファイルサーバー250A、ACLはファイルサーバー250Aのものであることを示している。
図10は、本実施の形態による処理例を示す説明図である。
例えば、ユーザー用端末210は、ローカルリンク−ファイル管理テーブル900を用いて、アクセス画面1000を表示する。アクセス画面1000は、フォルダ一覧表示領域1040、ファイル一覧表示領域1050を有している。フォルダ一覧表示領域1040はフォルダを木構造として表示し、ファイル一覧表示領域1050は、フォルダ一覧表示領域1040で指定されたフォルダ内のファイルをリスト表示している。
つまり、各ノード(ユーザー用端末210、ファイルサーバー250)でリンク(ローカルリンク−ファイル管理テーブル900、リンク−ファイル管理テーブル800)を保持する。そのリンクを用いて、ファイルのリスト表示、ファイルのオープンなどの操作ができる。
図11から図13は、本実施の形態による処理例を示すフローチャートである。
ステップS1102では、同一ファイルテーブル700で、同じ実体が複数あるものを探す。その複数の実体を内容とする統一候補リストを生成する。
ステップS1104では、統一候補リストから1行取り出す。
ステップS1106では、それぞれの実体ファイルのアクセスログを集約する。各ユーザー用端末210、各ファイルサーバー250から、文書のアクセスログを収集し、例えば、集約アクセスログ1400を生成する。図14は、集約アクセスログ1400のデータ構造例を示す説明図である。集約アクセスログ1400は、ID欄1410、要求元LOC欄1420、日時欄1430を有している。ID欄1410は、本実施の形態において、集約アクセスログ1400内の各行を一意に識別するための情報(ID)を記憶している。要求元LOC欄1420は、アクセスを要求したユーザー用端末210(ファイルサーバー250であってもよい)のLOCコードを記憶している。日時欄1430は、アクセスが行われた日時(年、月、日、時、分、秒、秒以下、又はこれらの組み合わせであってもよい)を記憶している。
ステップS1108では、ファイルの保有コストをストレージタイプ毎に試算する。例えば、「ファイルサイズ*保有料金+アクセス回数*アクセス料金」によって算出する。保有料金、アクセス料金は、ストレージタイプによって異なっているので、例えば、保有コストテーブル1500によって定義されている。図15は、保有コストテーブル1500のデータ構造例を示す説明図である。保有コストテーブル1500は、タイプ欄1510、保有料金欄1520、アクセス料金欄1530を有している。タイプ欄1510は、ストレージタイプを記憶している。保有料金欄1520は、そのストレージタイプにおける保有料金を記憶している。アクセス料金欄1530は、そのストレージタイプにおけるアクセス料金を記憶している。
ステップS1110では、ストレージタイプでの標準が最も安いか否かを判断し、標準が最も安い場合はステップS1112へ進み、それ以外の場合はステップS1138へ進む。
ステップS1112では、要求元とファイルロケーションが一致するアクセスのアクセス頻度を計算する。
ステップS1114では、頻度が週5回以下であるか否かを判断し、週5回以下の場合はステップS1118へ進み、それ以外の場合はステップS1116へ進む。なお、もちろんのことながら、閾値としての5回は予め定められた値の例示であって、5回以外の数値であってもよい。
ステップS1116では、リロケーションせず同じ格納場所に置き、検討対象から除外する。
ステップS1118では、アクセス日時を時間単位で切り取り、最もアクセス数の多い時間帯を抽出する。
ステップS1120では、アクセスカウント数を合計する。
ステップS1122では、合計が閾値以下であるか否かを判断し、合計が閾値以下の場合はステップS1128へ進み、それ以外の場合はステップS1124へ進む。ここでの閾値は、予め定められた値である。
ステップS1124では、要求元ロケーション毎にその時間帯のカウント数を集計する。例えば、要求元カウントテーブル1600を生成する。図16は、要求元カウントテーブル1600のデータ構造例を示す説明図である。要求元カウントテーブル1600は、要求元LOC欄1610、カウント欄1620を有している。要求元LOC欄1610は、アクセスの要求を行った装置(ユーザー用端末210、ファイルサーバー250)のLOCコードを記憶している。カウント欄1620は、その装置によるアクセスのカウント値を記憶している。なお、図16では、最終行にカウント値の合計を示している。
ステップS1126では、各クラスターのアクセスカウントが閾値以下になるようクラスター分割を行う。図17の例に示すフローチャートを用いて後述する。ここでの閾値は、予め定められた値である。
ステップS1128では、全体を一つの抽出クラスターとして、ステップS1130へ進む。
ステップS1130では、クラスターから1個選択する。
ステップS1132では、クラスターの中心に近い標準ファイルサーバーを選択する。
ステップS1134では、すべてのクラスターの処理が終わったか否かを判断し、すべてのクラスターの処理が終わった場合はステップS1140へ進み、それ以外の場合はステップS1136へ進む。
ステップS1136では、次のクラスターを対象として、ステップS1132に戻る。
ステップS1138では、最も安いタイプのファイルサーバーを候補として、ステップS1140へ進む。
ステップS1140では、クラスターから1個選択する。
ステップS1142では、選択されたファイルサーバーにファイルを置き、実体IDを取得する。
ステップS1144では、同一ファイルテーブルに追加する。
ステップS1146では、各ノードからのリンク先をこの実体IDに置き換える。
ステップS1148では、すべてのクラスターの処理が終わったか否かを判断し、すべてのクラスターの処理が終わった場合はステップS1152へ進み、それ以外の場合はステップS1150へ進む。
ステップS1150では、次のクラスターを対象として、ステップS1142に戻る。
ステップS1152では、選択されたファイルサーバー以外の旧実体ファイルを削除し、同一ファイルテーブルから旧実体IDを削除する。
ステップS1154では、すべての統一候補の処理が終わったか否かを判断し、すべての統一候補の処理が終わった場合は処理を終了し(ステップS1199)、それ以外の場合はステップS1156へ進む。
ステップS1156では、次の統一候補を対象として、ステップS1106に戻る。
図17は、本実施の形態による処理例を示すフローチャートである。前述のステップS1126(クラスター分割処理)の詳細な処理例を示すものである。
ステップS1702では、アクセス要求元の近いところからボトムアップに樹状クラスターを形成する。
ステップS1704では、残ったクラスターが1であるか否かを判断し、残ったクラスターが1である場合はステップS1716へ進み、それ以外の場合はステップS1706へ進む。
ステップS1706では、距離の最も近いクラスター対を選択する。
ステップS1708では、2つのアクセスカウントを合計する。
ステップS1710では、合計が閾値以下であるか否かを判断し、合計が閾値以下である場合はステップS1714へ進み、それ以外の場合はステップS1712へ進む。ここでの閾値は、予め定められた値である。
ステップS1712では、大きいほうのクラスターを抽出クラスターに追加し、樹状クラスターから取り除く。そして、ステップS1704に戻る。
ステップS1714では、2つのクラスターをマージし、中心地のロケーションコードを与える。アクセスカウントを合計する。そして、ステップS1704に戻る。
ステップS1716では、残ったクラスターを抽出クラスターに追加する。
図18から図22の具体例を用いて、クラスター分割処理を説明する。
ステップS1702の処理では、以下のようになる。
図18は、図18(a)の例に示す要求元カウントテーブル1600に対して、図18(b)の例に示す樹状クラスターを形成したことを示している。4行目と5行目でクラスターAを形成し、要求元カウントテーブル1600の1行目と2行目でクラスターBを形成し、6行目とクラスターAでクラスターCを形成し、3行目とクラスターCでクラスターDを形成し、クラスターBとクラスターDでクラスターEを形成していることを示している。なお、「アクセス要求元の近い」とは、アクセス要求をした装置の位置が近いことをいい、ここで近いと判定するための距離は、装置が設置されている位置間における距離(地図上での距離)としてもよいし、通信回線上でのトポロジカル的な距離(例えば、通信相手に到達するまでに経由する中継設備の数を示すホップ数)としてもよい。
ステップS1704からステップS1714までの処理では、以下のようになる。
図19は、最初のループでは、図18の例に示す要求元カウントテーブル1600では、4行目と5行目の対(クラスターA)が該当する。4行目(0#0920)と5行目(0#0930)のカウント数をマージすると合計のアクセスカウントが閾値(例えば、ここでは「10000」とする)を超える。したがって、4行目(#0920)を抽出して、図19(b)の例に示す抽出クラスターテーブル1900を生成する。
次のループでは、以下のようになる。
図20(a)の例に示す要求元カウントテーブル1600は、図18(a)の例に示す要求元カウントテーブル1600の4行目(0#0920)を削除したものである。
図20(b)の例に示す要求元カウントテーブル1600は、図20(a)の例に示す要求元カウントテーブル1600の1行目と2行目をマージし、4行目と5行目をマージしたものである。それぞれのアクセスカウントの合計は閾値以下であるので、それぞれの中心地のロケーションコード(0#0440、0#0942)を付与する。これによって、図20(b)の例に示す要求元カウントテーブル1600が生成される。
次に、図20(b)の例に示す要求元カウントテーブル1600の2行目(0#0780)と3行目(0#0942)をマージすると合計のアクセスカウントが閾値を超える。したがって、3行目(0#0942)を抽出して、図21の例に示す抽出クラスターテーブル1900の2行目を生成する。そして、図20(b)の例に示す要求元カウントテーブル1600の1行目(0#0440)と2行目(0#0780)をマージすると合計のアクセスカウントは閾値以下であるので、中心地のロケーションコード(0#0500)を付与する。これによって、図21の例に示す抽出クラスターテーブル1900が生成される。
ステップS1716の処理では、以下のようになる。
図22は、中心サーバー適用テーブル2200のデータ構造例を示す説明図である。
中心サーバー適用テーブル2200は、図21の例に示す抽出クラスターテーブル1900に中心サーバー欄2230を付加したものである。中心サーバー適用テーブル2200は、要求元LOC欄2210、カウント欄2220、中心サーバー欄2230を有している。要求元LOC欄2210は、要求元LOCを記憶している。カウント欄2220は、カウントを記憶している。中心サーバー欄2230の中心サーバーは、要求元の中心の場所である要求元LOCに最も近い場所にあるファイルサーバーを割り当てる。例えば0#0500の位置に近い地域にファイルサーバーがない場合、その中で最も近いファイルサーバーであるFS2#0750 が選択されている。このファイルサーバーに、文書の実体が置かれることになる。そして、この実体へのリンクで、そのファイルサーバーが含まれているクラスター内における他の装置(ユーザー用端末210)での実体の文書を置き換える。
図23は、本実施の形態による処理例(ファイルへのアクセス処理例)を示すフローチャートである。例えば、ファイルアクセスとして、情報処理装置100を含むユーザー用端末210において、ユーザーがリンクID:$FS2−241を選択し、閲覧コマンドを発行する等がある。
ステップS2302では、アクセス装置であるユーザー用端末210は、アクセスの対象としているファイルについて、ローカルリンク−ファイル管理テーブルから集約IDと実体IDを取得する。
ステップS2304では、ステップS2302で対象としたファイルがローカルファイルであるか否か(実体はユーザー用端末210内にあるか否か)を判断し、ローカルファイルである場合はステップS2312へ進み、それ以外の場合はステップS2306へ進む。
ステップS2306では、リソース管理装置である情報処理装置100に集約IDと実体IDを送る。
ステップS2308では、リソース管理装置である情報処理装置100は集約実体ファイルから実体があるファイルサーバー250を特定する。
ステップS2310では、実体があるファイルサーバー250にファイルリクエストを送り、得られた結果をユーザー用端末210に返す。
ステップS2312では、ユーザー用端末210内のローカルファイルをオープンする。そして、処理を終了する(ステップS2399)。
なお、ファイルの編集処理又は更新処理は、自分用のコピーとして編集する場合と、共通に使うファイルを更新する場合がある。これらはリンクに対して、別名で保存するか、上書き保存するか、ユーザーのオペレーションによって決まる。
別名で保存する場合は、ユーザーが決めた実体の場所(ファイルサーバー250又はユーザー用端末210)に実体を置き、実体ファイルテーブル、同一ファイルテーブル、リンク−ファイル管理テーブルに新しいエントリーを作る。
上書き保存する場合は、図24の例に示すフローチャートによる処理を行う。
図24は、本実施の形態による処理例(ファイルの編集処理又は更新処理)を示すフローチャートである。
ステップS2402では、元のファイルロケーションに別ファイルとして作成する。
ステップS2404では、集約実体ファイルテーブルに新しいエントリーを作成する。
ステップS2406では、同一ファイルテーブルに新しいエントリーを作成する。
ステップS2408では、リンク−ファイル管理テーブルで新しいリンクに書き換える。なお、旧集約IDに対応するリンクがなくなったら同一ファイルテーブルから削除する。
次に、図25から図27の具体例を用いて、図24の例に示す処理を説明する。
LinkID:$FS1−063とLinkID:$FS2−241は、同一の実体(実体ID:4331)を指す別ファイルである。ここでLinkID:$FS1−063のファイルを書き換えるとする。
図25は、集約実体ファイルテーブル2500のデータ構造例を示す説明図である。
集約実体ファイルテーブル2500は、図6の例に示した集約実体ファイルテーブル600と同等のデータ構成である。集約実体ファイルテーブル2500は、ID欄2510、ファイル名欄2520、ハッシュ欄2530、LOCコード欄2540、ノードID欄2550、物理位置欄2560、ACL欄2570を有している。ID欄2510は、IDを記憶している。ファイル名欄2520は、ファイル名を記憶している。ハッシュ欄2530は、ハッシュを記憶している。LOCコード欄2540は、LOCコードを記憶している。ノードID欄2550は、ノードIDを記憶している。物理位置欄2560は、物理位置を記憶している。ACL欄2570は、ACLを記憶している。
ステップS2404の処理として、集約実体ファイルテーブル2500の2行目(対象行2584)を作成する。
図26は、同一ファイルテーブル2600のデータ構造例を示す説明図である。同一ファイルテーブル2600は、図7の例に示した同一ファイルテーブル700と同等のデータ構成である。同一ファイルテーブル2600は、集約ID欄2610、ハッシュ欄2620、実体1欄2630、実体2欄2640を有している。集約ID欄2610は、集約IDを記憶している。ハッシュ欄2620は、ハッシュを記憶している。実体1欄2630は、実体1のIDを記憶している。実体2欄2640は、実体2のIDを記憶している。
ステップS2406の処理として、同一ファイルテーブル2600の2行目(対象行2684)を作成する。
図27は、リンク−ファイル管理テーブル2700のデータ構造例を示す説明図である。リンク−ファイル管理テーブル2700は、図8の例に示したリンク−ファイル管理テーブル800と同等のデータ構成である。リンク−ファイル管理テーブル2700は、LinkID欄2710、ファイル名欄2720、集約ID欄2730、実体ID欄2740、ACL欄2750を有している。LinkID欄2710は、LinkIDを記憶している。ファイル名欄2720は、ファイル名を記憶している。集約ID欄2730は、集約IDを記憶している。実体ID欄2740は、実体IDを記憶している。ACL欄2750は、ACLを記憶している。
ステップS2408の処理として、リンク−ファイル管理テーブル2700の3行目(対象行2784)を4行目(対象行2786)に書き換える。
なお、本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図28に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。つまり、具体例として、処理部(演算部)としてCPU2801を用い、記憶装置としてRAM2802、ROM2803、HD2804を用いている。HD2804として、例えばハードディスク、SSD(Solid State Drive)を用いてもよい。通信モジュール110、実体ファイルテーブル作成モジュール120、集約実体ファイルテーブル作成モジュール130、同一ファイルテーブル作成モジュール140、リンク・ファイル管理テーブル作成モジュール150、リロケーションクローラ―155、リロケーション分析モジュール160、クラスター分割モジュール165、リロケーションモジュール170等のプログラムを実行するCPU2801と、そのプログラムやデータを記憶するRAM2802と、本コンピュータを起動するためのプログラム等が格納されているROM2803と、記憶モジュール180としての機能を有する補助記憶装置(フラッシュ・メモリ等であってもよい)であるHD2804と、キーボード、マウス、タッチスクリーン、マイク等に対する利用者の操作に基づいてデータを受け付ける受付装置2806と、CRT、液晶ディスプレイ、スピーカー等の出力装置2805と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース2807、そして、それらをつないでデータのやりとりをするためのバス2808により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。
前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図28に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図28に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図28に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
文書のアクセス履歴から、予め定められた回数より多く又は以上のアクセスがあるファイルを提示するようにしてもよい。又は、予め定められた期間内に予め定められた回数より多く又は以上のアクセスがあるファイルを提示するようにしてもよい。重要な知識を発見するためである。なお、提示する先は、そのアクセスを行った利用者であってもよいし、他の利用者(例えば、管理者、グループリーダー等)であってもよい。
利用者の個人が有しているユーザー用端末210にだけあるファイルで、更新が長期間(予め定められた期間よりも長い又は以上)なされていないものを通知し、ファイルサーバー250への移動を促すコメントを出力(レコメンド)してもよい。
アクセスカウントが予め定められた閾値よりも低い又は以下である場合、アーカイブ専用のファイルサーバー250(ストレージ)に実体を移行するようにしてもよい。コストダウンを図ることができる。
ユーザー用端末210内のファイル(ユーザー用端末210内におけるローカルファイル等が該当する)に対して、そのユーザー用端末210からのアクセスカウントが予め定められた閾値より多い又は以上である場合は、実体の移動は行わないようにしてもよい。なお、ここでの閾値は、実体の移動を行う場合に用いた閾値よりも低い値とする。
また、前述の実施の形態の説明内での比較処理において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分又は全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
110…通信モジュール
120…実体ファイルテーブル作成モジュール
130…集約実体ファイルテーブル作成モジュール
140…同一ファイルテーブル作成モジュール
150…リンク・ファイル管理テーブル作成モジュール
155…リロケーションクローラ―
160…リロケーション分析モジュール
165…クラスター分割モジュール
170…リロケーションモジュール
180…記憶モジュール
210…ユーザー用端末
250…ファイルサーバー
290…通信回線

Claims (5)

  1. 複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、
    前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、
    前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段
    を有し、
    前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、
    情報処理装置。
  2. 前記決定手段は、文書に対するアクセスの履歴を用いて、代表格納場所を決定する、
    請求項1に記載の情報処理装置。
  3. 前記決定手段は、複数の格納場所を有する集合を生成し、該集合内の格納場所におけるアクセスの履歴を用いて、該集合内の代表格納場所を決定する、
    請求項2に記載の情報処理装置。
  4. 文書のアクセス権管理リストを前記リンク毎に付与する付与手段
    をさらに有する請求項1から3のいずれか一項に記載の情報処理装置。
  5. コンピュータを、
    複数の文書記憶装置の格納場所に格納されている、同じ文書を抽出する抽出手段と、
    前記複数の格納場所のうち、代表となる格納場所である代表格納場所を決定する決定手段と、
    前記代表格納場所以外の格納場所にある文書を、該代表格納場所を示すリンクに置換する置換手段
    として機能させ、
    前記決定手段は、文書記憶装置のタイプ毎に定義されている保有料金とアクセス料金から算出される各格納場所における文書の保有コストを用いて、代表格納場所を決定する、
    情報処理プログラム。
JP2016045326A 2016-03-09 2016-03-09 情報処理装置及び情報処理プログラム Expired - Fee Related JP6651915B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016045326A JP6651915B2 (ja) 2016-03-09 2016-03-09 情報処理装置及び情報処理プログラム
US15/236,491 US20170262439A1 (en) 2016-03-09 2016-08-15 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016045326A JP6651915B2 (ja) 2016-03-09 2016-03-09 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2017162142A JP2017162142A (ja) 2017-09-14
JP6651915B2 true JP6651915B2 (ja) 2020-02-19

Family

ID=59788115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016045326A Expired - Fee Related JP6651915B2 (ja) 2016-03-09 2016-03-09 情報処理装置及び情報処理プログラム

Country Status (2)

Country Link
US (1) US20170262439A1 (ja)
JP (1) JP6651915B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7102529B2 (ja) 2018-08-24 2022-07-19 三菱電機株式会社 データ収集サーバ、データ利用サーバ、機器、データ流通システム、データ収集方法及びプログラム
CN112540727A (zh) * 2020-12-04 2021-03-23 北京百度网讯科技有限公司 数据管理方法、装置、计算设备、存储介质和云平台

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5020673B2 (ja) * 2007-03-27 2012-09-05 株式会社日立製作所 重複したファイルの記憶を防ぐコンピュータシステム
CN104106063B (zh) * 2012-02-13 2017-06-30 株式会社日立制作所 用于分级存储系统的管理装置和管理方法

Also Published As

Publication number Publication date
JP2017162142A (ja) 2017-09-14
US20170262439A1 (en) 2017-09-14

Similar Documents

Publication Publication Date Title
JP5046881B2 (ja) 情報処理装置、表示制御方法ならびにプログラム
EP2759942A1 (en) Computer system, file management method and metadata server
KR101355273B1 (ko) 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체
US20140358868A1 (en) Life cycle management of metadata
EP2778953A1 (en) Encoded-search database device, method for adding and deleting data for encoded search, and addition/deletion program
WO2023160327A1 (en) Container image management
US20210165785A1 (en) Remote processing of memory and files residing on endpoint computing devices from a centralized device
US20150286663A1 (en) Remote processing of memory and files residing on endpoint computing devices from a centralized device
US20230206365A1 (en) Seamless Electronic Discovery System with an Enterprise Data Portal
CN110888837A (zh) 对象存储小文件归并方法及装置
WO2013145125A1 (ja) コンピュータシステム及びセキュリティ管理方法
US8812467B2 (en) Information processing apparatus and computer readable medium for performing history cancellation processing
JP4259588B2 (ja) 情報処理システム及び情報処理プログラム
JP6651915B2 (ja) 情報処理装置及び情報処理プログラム
CN110941629A (zh) 元数据处理方法、装置、设备及计算机可读存储介质
US9785724B2 (en) Secondary queue for index process
CN116204540A (zh) 操作日志记录方法、装置、设备及存储介质
US20210157849A1 (en) Determining an audit level for data
JP6123519B2 (ja) 情報処理装置及び情報処理プログラム
JP2013171447A (ja) 情報処理装置及び情報処理プログラム
JP5929356B2 (ja) 情報処理装置及び情報処理プログラム
US20220067183A1 (en) Information processing apparatus and non-transitory computer readable medium
KR20190109664A (ko) 빅 데이터 비식별화 처리 시스템 및 방법
US20120233224A1 (en) Data processing
JP7347533B2 (ja) 管理装置、管理方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200106

R150 Certificate of patent or registration of utility model

Ref document number: 6651915

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees