JP2015219672A - データ管理装置、データ管理方法、及び、そのプログラム - Google Patents

データ管理装置、データ管理方法、及び、そのプログラム Download PDF

Info

Publication number
JP2015219672A
JP2015219672A JP2014101951A JP2014101951A JP2015219672A JP 2015219672 A JP2015219672 A JP 2015219672A JP 2014101951 A JP2014101951 A JP 2014101951A JP 2014101951 A JP2014101951 A JP 2014101951A JP 2015219672 A JP2015219672 A JP 2015219672A
Authority
JP
Japan
Prior art keywords
file
information
file table
registered
data management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014101951A
Other languages
English (en)
Inventor
拓也 荒木
Takuya Araki
拓也 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014101951A priority Critical patent/JP2015219672A/ja
Publication of JP2015219672A publication Critical patent/JP2015219672A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 本発明は、通常ファイルのファイル等に含まれる情報をデータベース言語から利用可能とする、データ管理装置等を提供する。【解決手段】 データ管理装置500は、データベース言語により操作可能なテーブルであるファイルテーブル503と、ファイルシステムにおける1以上のファイルに関する情報を、上記ファイルテーブルに登録可能な形式に変換することにより、上記ファイルテーブルに登録可能なファイルテーブル登録情報を作成するファイル情報解析手段502と、上記ファイルテーブルの構造に関する情報に基づいて上記ファイルテーブルを作成し、当該作成したファイルテーブルに対して、上記ファイル情報解析手段により作成された上記ファイルテーブル登録情報を登録するファイルテーブル作成手段501と、を有する。【選択図】 図5

Description

本発明は検索可能なデータを管理するデータ管理装置等に関する。本発明は、特にファイルシステムにおけるファイルに関する情報を、検索可能な形式により管理するデータ管理装置等に関する。
近年、大量のデータを収集し、収集したデータを分析することにより、特定の傾向や特徴を抽出するデータ解析手法が普及している。このようなデータ解析手法を実行する場合、まずは解析対象となるデータを大量に収集する必要がある。このようなデータは、例えば、ファイルシステムにおけるファイルとして存在する場合や、Relational Database(RDB)等のデータベースにおけるテーブルとして存在する場合がある。
このため、係るデータを分析する場合、例えば、ファイルシステムにおけるファイルに対する操作と、RDBにおけるテーブルに対する操作との両方が求められる。以下の説明において「ファイルシステムに存在するファイル」を単に「ファイル」または「通常ファイル」と称する場合がある。また、各種データベースにおけるテーブルを、単に「テーブル」または「表」と称する場合がある。
データがファイルとして存在する場合、当該データのユーザは、係るファイルを操作可能なコンピュータ・プログラム(以下、単に「プログラム」と称する場合がある)を用いて、当該ファイルや、ファイルに記録されたデータに対する各種操作を実行する。例えば、ある種の画像に関するデータが画像ファイルとしてファイルシステムに存在する場合、当該ユーザは、画像処理用のプログラムを用いて、これを処理する。
また、データがRDBにおけるテーブルとして存在する場合、当該ユーザは、SQLのようなデータベース言語を用いて、当該テーブルに登録されたデータを処理する。
上記のように、通常ファイルに記録されたデータと、テーブルに登録されたデータとを扱うデータ解析作業においては、データベース言語の機能を利用して、通常ファイル(あるいは、通常ファイルに記録されたデータ)を操作可能であると、作業者にとって便利である。
例えば、人が映った画像ファイルを処理する場合を仮定する。ここで画像ファイルのファイル名は「ユーザID_日付_連番.jpg」のような形式であると仮定する。また、RDBには、ユーザID(ファイル名に含まれる「ユーザID」と同じデータ)に関連付けされた情報(性別や年齢等)が、保存されていると仮定する。このような状況で、「年齢30才台の男性」に関するファイルだけを選び、処理したい場合を仮定する。なお、この場合「ユーザID(Identifier)」は、ユーザを識別可能な識別子である。また、拡張子「.jpg」は、JPEG(Joint Photographic Experts Group)形式にて圧縮された画像ファイルであることを示す。
この場合、例えば、ユーザは、RDBに対してデータベース言語を用いて問合せ(クエリ)を発行することにより、RDBに登録されている「年齢30才台の男性」のデータを抽出する。そして、作業者(ユーザ)は、処理対象である全ての画像ファイルのファイル名を取得し、係るファイル名を解析することにより、各ファイル名から「ユーザID」に相当する部分を抽出する。このようにしてRDBから抽出したデータと、ファイル名を解析したデータとを用いて、ユーザは、所望のファイル(「年齢30才台の男性」のファイル)を選択する。
上記したように、RDBに対する操作と、通常ファイルに対する操作との両方を実行する必要がある場合、ユーザにとって作業が煩雑である。また、係る作業を自動化する場合、例えば、スクリプト言語や、コンピュータ言語を用いてプログラムを作成する必要があり、作業工数が増大する場合がある。
このような、通常ファイルと、RDBにおけるテーブルとを組み合わせて扱う技術に関連して、例えば、下記非特許文献1が開示されている。
非特許文献1は、DBMS(Database Management System)内部のテーブルと区別なく、データベース外部のCSV(Comma Separated Value)形式のファイルを、外部テーブルとして扱う技術を開示する。非特許文献1に開示された技術によれば、CSV形式のファイルのデータ(ファイルの内容)及びDBMS内部のテーブルに対して、SQL等のデータベース言語の機能を利用した各種操作が可能である。
また、上記のような技術に関連して、特許文献1は、SQLを用いて、RDBとして管理されていない通常ファイルを操作する技術を開示する。特許文献2に開示されたシステムは、ファイル名、テーブル名、ファイル編成等のファイル情報と、テーブル名、項目名等の項目情報とを保持する。当該システムは、入力されたSQLを解析して、テーブル名から操作対象のファイル及び項目(ファイルのレコード)を特定し、特定したファイルに対する操作を実行する。
また、上記のような技術に関連して、特許文献2は、仮想フォルダシステムに関する技術を開示する。特許文献1に開示されたシステムは、実ファイルに関するメタデータを保持するリレーショナルデータベースと、ユーザに仮想フォルダを提供するフォルダプロセッサとを備える。特許文献1に開示されたシステムは、ユーザからのクエリに基づいてリレーショナルデータベースを操作し、その結果に基づいて、ユーザに対して特定のファイルを含む仮想フォルダを提供可能である。
なお、上記のような技術とは直接関係ないが、特許文献3には、既存のファイル名から所定のプレフィックス、サフィックス部分を抽出し、それらに利用して新たなファイル名を生成する技術が開示されている。
特開平10−64911号公報 特表2006−521594号公報 特開2012−014590号公報
日高東潮、小谷尚也、須賀啓敏、藤田悦郎、川田明良、山室健著、「PostgreSQL SQL/MED技術 サービスログやシステムログの分析を効率的に行う基盤技術」、NTT技術ジャーナル、電気通信協会、2011年8月1日、第23巻、第8号、p.30−34
ここで、上記したようなデータ分析作業においては、データが記録された大量のファイルを収集する場合がある。この場合、収集されたファイルに付与されたファイル名の一部に、収集したデータに関する情報が組み込まれることがある。これにより、例えば、当該ファイルのファイル名に基づいて、当該ファイルに記録されたデータを識別することが可能である。
また、例えば、収集したデータに関する情報が、当該データを記録したファイルのパス(ファイルパス)に組み込まれることがある。ここで、ファイルのパスは、ファイルシステムにおける当該ファイルの配置場所を特定可能な情報である。この場合、当該ファイルのパスを構成するディレクトリの名称の一部に、収集したデータに関する情報が組み込まれる。
即ち、上記したようなデータ分析作業においては、通常ファイルのファイル名や、通常ファイルが配置されたパスに含まれる情報を利用して、通常ファイルや、テーブルに対する操作を実行可能であると、都合がよい。なお、以下において、通常ファイルに対して付与されたファイル名、及び、当該通常ファイルが配置されたパスの、少なくともいずれかを含む情報を「ファイル名等」と称する場合がある。
これに対して、上記非特許文献1、及び、特許文献1に開示された技術は、いずれもファイルの内容(ファイルに記録されたデータ)についは、SQLにより操作可能であるものの、ファイル名やパス等に含まれる情報については、十分対応することができない。
また、特許文献1に開示された技術は、RDBのテーブルではない一般ファイルについて、係るファイルをテーブルに変換して扱うための情報を登録する必要がある。
また、上記特許文献2は、通常ファイルに関するメタデータを全てリレーショナルデータベースに登録し、係るデータベースを検索する技術を開示するのみであり、係るメタデータは、主にファイルの内容(コンテンツ)に関するプロパティである。このため、ファイル名に含まれる情報の利用については、十分考慮されていない。
また、特許文献3に開示された技術は、ファイル名を所定の区切り文字により分解する技術を開示するのみであり、分解されたファイル名の一部が、新たなファイル名として再利用されるにすぎない。
本発明は、上記の事情を鑑みてなされたものである。即ち、本発明は、通常ファイルのファイル名等に含まれる情報をデータベース言語から利用可能とする、データ管理装置等を提供することを主たる目的とする。
上記の目的を達成すべく、本発明の一態様に係るデータ管理装置は、以下の構成を備える。即ち、本発明の一態様に係るデータ管理装置は、データベース言語により操作可能なテーブルであるファイルテーブルと、ファイルシステムにおける1以上のファイルに関する情報を、上記ファイルテーブルに登録可能な形式に変換することにより、上記ファイルテーブルに登録可能なファイルテーブル登録情報を作成するファイル情報解析手段と、上記ファイルテーブルの構造に関する情報に基づいて上記ファイルテーブルを作成し、当該作成したファイルテーブルに対して、上記ファイル情報解析手段により作成された上記ファイルテーブル登録情報を登録するファイルテーブル作成手段と、を有する。
また、本発明の一態様に係るデータ管理方法は、データベース言語により操作可能なテーブルであるファイルテーブルを有する情報処理装置が、ファイルシステムにおける1以上のファイルに関する情報を、上記ファイルテーブルに登録可能な形式に変換することにより、上記ファイルテーブルに登録可能なファイルテーブル登録情報を作成し、上記ファイルテーブルの構造に関する情報に基づいて上記ファイルテーブルを作成し、当該作成したファイルテーブルに対して、上記ファイル情報解析手段により作成された上記ファイルテーブル登録情報を登録する。
また、同目的は、上記構成を有するデータ管理装置、並びに対応する情報通知方法を、コンピュータによって実現するコンピュータ・プログラム、及び、そのコンピュータ・プログラムが格納されている、コンピュータ読み取り可能な記憶媒体によっても達成される。
本発明によれば、通常ファイルのファイル等に含まれる情報をデータベース言語から利用可能とする、データ管理装置等を提供可能である。より具体的には、本発明に依れば、ファイル等に含まれる情報に基づいて、データベース言語の機能を利用して、当該ファイル、及び、当該ファイルに記録されたデータに関する各種操作を実行可能である。
図1は、本願発明の第1の実施形態に係る、データ管理装置の機能的な構成を例示する、ブロック図である。 図2Aは、本願発明の第1の実施形態に係る、データ管理装置におけるファイルテーブル作成処理を例示する、フローチャートである。 図2Bは、本願発明の第1の実施形態に係る、データ管理装置におけるファイルテーブル作成処理の一部を例示する、フローチャートである。 図3は、本願発明の第2の実施形態に係る、データ管理装置の機能的な構成を例示する、ブロック図である。 図4は、本願発明の第2の実施形態に係る、データ管理装置におけるファイルテーブル作成処理を例示する、フローチャートである。 図5は、本願発明の第3の実施形態に係る、データ管理装置の機能的な構成を例示する、ブロック図である。 図6は、本願発明の各実施形態に係る、データ管理装置の各構成要素を実現可能な情報処理装置のハードウェア構成を例示したブロック図である。
次に、本発明を実施する形態について図面を参照して詳細に説明する。以下の実施の形態に記載されている構成は単なる例示であり、本願発明の技術範囲はそれらには限定されない。
<第1の実施形態>
以下、本発明の第1の実施形態について説明する。まず、図1を参照して、本実施形態におけるデータ管理装置について説明する。なお、以下においては、一般的なデータベースを構成するテーブル(表)を例に、本願発明の実施形態について説明する。しかし、本願発明を実現可能な実施形態は、特定のデータ構造や、特定のデータベースにおけるテーブルには限定されない。
図1は本実施形態におけるデータ管理装置の機能的な構成を例示する、ブロック図である。
図1に例示するように、本実施形態におけるデータ管理装置100は、ファイルテーブル作成部101と、ファイル情報解析部102と、ファイルテーブル103と、検索部104と、を有する。また、本実施形態におけるデータ管理装置100は、インタフェース部105と、データテーブル106と、を有してもよい。以下、上記構成要素についてそれぞれ説明する。
ファイルテーブル作成部101は、後述するインタフェース部105から受け付けたファイルテーブル103を作成する要求(以下「ファイルテーブル作成要求」と称する場合がある)に基づいて、ファイルテーブル103を作成する。
ファイルテーブル作成部101は、当該ファイルテーブル作成要求に含まれる、ファイルテーブル構造情報101a、対象ファイル特定情報101b、及び、”ファイル情報−ファイルテーブル”関連情報101cを保持してもよい。
ファイルテーブル構造情報101aは、後述するファイルテーブル103のテーブル構造を規定した情報である。本実施形態において、当該テーブル構造は、例えば、関係データベース(RDB:Relational Database)における属性(列)の構造(例えば、属性名や、属性値の型情報)を有してもよい。本実施形態におけるファイルテーブル構造情報101aは、例えば、SQL等の所定のデータベース言語により操作可能な任意のテーブルの構造を規定する情報であってよい。
対象ファイル特定情報101bは、ファイルシステムに存在する1以上のファイル107の内、後述するファイルテーブル103に登録されるファイル(以下「登録対象ファイル」と称する場合がある)を特定可能な情報を有する。係る対象ファイル特定情報101bは、例えば、登録対象ファイルを列挙したリストを含んでもよい。ここで、登録対象ファイルを特定可能な情報は、例えば、ファイルシステムにおける登録対象ファイルのパスやファイル名であってもよい。
また、対象ファイル特定情報101bは、例えば、登録対象ファイルを特定可能な登録ルールを含んでもよい。係る登録ルールは、例えば、「ファイルシステムにおける特定のディレクトリ(例えば、”/path/to/files/”等)に存在するファイルを対象とする」等でもよい。また、係る登録ルールは、例えば、正規表現やワイルドカード(例えば、”/path/to/files/*.jpg”等)により特定のファイルを指定してもよい。即ち、係る登録ルールは、登録対象ファイルを特定可能な任意の形式を採用してよい。なお、対象ファイル特定情報101bをどのような形式により保持するかは、システムの実装等に応じて、適宜選択してよい。
”ファイル情報−ファイルテーブル”関連情報101cは、登録対象ファイルに関する情報を、上記ファイルテーブルに登録可能な1以上の値に変換可能な変換ルールを有する。
係る変換ルールは、例えば、「ファイル名の拡張子より前の部分を、特定の区切り文字により分割し、分割された文字列をファイルテーブルの属性(列)に対する属性値とする」という内容でもよい。また、「登録対象ファイルのパスをディレクトリに分解し、分解されたディレクトリの名称の一部をファイルテーブルの属性(列)に対する属性値とする」という内容でもよい。また、係る変換ルールは、「正規表現によってファイル名あるいはディレクトリ名を分解し、分解された文字列をファイルテーブルの属性(列)に対する属性値とする」という内容でもよい。
即ち、係る変換ルールは、少なくとも、登録対象ファイルに対するファイル名及びパス名に含まれる情報を、後述するファイルテーブルの属性(列)に対する属性値として登録可能な形式に変換可能な、任意の変換方法を採用してよい。なお、”ファイル情報−ファイルテーブル”関連情報101cをどのような形式により保持するかは、システムの実装等に応じて、適宜選択してよい。
本実施形態におけるファイルテーブル作成部101は、後述するインタフェース部105におけるファイルテーブル作成コマンドを介して、上記ファイルテーブル構造情報101aと、対象ファイル特定情報101bと、”ファイル情報−ファイルテーブル”関連情報101cとを受け付ける。
また、ファイルテーブル作成部101は、後述するファイル情報解析部102に対して、登録対象ファイルのファイル名等と、”ファイル情報−ファイルテーブル”関連情報101cが有する変換ルールとに基づいて、ファイルテーブル103に登録可能な情報の生成を依頼する。ファイルテーブル作成部101の具体的な動作については、後述する。
次に、ファイル情報解析部102について説明する。登録対象ファイルを特定可能な情報(登録対象ファイルのファイル名等)と、上記変換ルールとに基づいて、ファイルテーブル103に登録可能な情報(以下、「ファイルテーブル登録情報」と称する場合がある)を生成する。より具体的には、本実施形態におけるファイル情報解析部102は、ファイルテーブル作成部101から、上記登録対象ファイルのファイル名等と、上記変換ルールとを受け付ける。なお、ファイル情報解析部102は、ファイルテーブル作成部101から、”ファイル情報−ファイルテーブル”関連情報101cを受け付けてもよい。
ファイル情報解析部102は、ファイルテーブル作成部101から受け付けた上記変換ルールに基づいて、ファイルテーブル作成部101から受け付けたファイル名等を、ファイルテーブル103に登録可能な形式に変換する。より具体的には、ファイル情報解析部102は、上記変換ルールに基づいてファイル名等を解析することにより、ファイルテーブル103の1以上の属性(列)に対して登録される属性値を抽出する。ファイル情報解析部102は、当該抽出した属性値を、ファイルテーブル103に登録する行情報とする。ここで、係る行情報は、上記変換ルールに基づいて登録対象ファイルのファイル名等を解析した結果得られる、ファイル名や、パスに含まれる情報である。
そして、ファイル情報解析部102は、当該行情報と、登録対象ファイルを特定可能な情報とを対として、ファイルテーブル登録情報を生成する。この場合、登録対象ファイルを特定可能な情報は、例えば、当該ファイルのファイル名や、パスであってもよい。そして、ファイル情報解析部102は、生成したファイルテーブル登録情報を、ファイルテーブル作成部101に通知する。
例えば、ファイルテーブル作成部101から受け付けた上記変換ルールが、「ファイル名の拡張子より前の部分について、アンダースコア(”_”)を区切り文字として分割し、分割された文字列をファイルテーブルの属性(列)に対する属性値とする」である場合を仮定する。更に、例えば、ある登録対象ファイルのファイル名が「1016183_0726_1.jpg」であることを仮定する。この場合、ファイル情報解析部102は、”[1016183、0726、1]”という行情報と、”1016183_0726_1.jpg”というファイル名を表す情報との対を作成する。
この場合、上記行情報は、図1に例示するファイルテーブル103における属性(列)である”ユーザID”、”日付”、”連番”の各属性値として登録される。即ち、この場合、登録対象ファイルのファイル名に含まれる情報として、”ユーザID”、”日付”、”連番”に関連する情報が抽出され、ファイルテーブル103に登録される。また、ファイル名を表す情報は、”登録ファイル情報”(符号103a)の属性値として登録される。
また、ファイルテーブル作成部101から受け付けた上記変換ルールが、「登録対象ファイルについて、拡張子を除くファイル名及び、二つ上位の親ディレクトリまでを、ファイルテーブルの属性(列)に対する属性値とする」である場合を仮定する。更に、例えば、ある登録対象ファイルのパスが”「/some/path/1036183/0726/1.jpg」”であることを仮定する。この場合、ファイル情報解析部102は、”[1036183、 0726、 1]”という行情報と、”/some/path/1036183/0726/1.jpg”というパスを表す情報との対を作成する。
この場合、上記行情報は、図1に例示するファイルテーブル103における属性(列)である”ユーザID”、”日付”、”連番”の各属性値として登録される。即ち、この場合、登録対象ファイルのパスに含まれる情報として、”ユーザID”、”日付”、”連番”に関連する情報が抽出され、ファイルテーブル103に登録される。また、登録対象ファイルのパスを表す情報は、”登録ファイル情報”(符号103a)の属性値として登録される。
ファイル情報解析部102は、例えば、ファイルテーブル作成部101から受け付けた登録対象ファイルを特定可能な情報に基づいて、上記生成した行情報と対となるファイル名、あるいは、パス名を作成してもよい。具体的には、登録対象ファイルを特定可能な情報として、当該登録対象ファイルのファイル名が与えられた場合には、当該ファイル名と、上記生成した行情報とを対にして、ファイルテーブル登録情報を生成してもよい。また、登録対象ファイルを特定可能な情報として、当該登録対象ファイルのパスが与えられた場合には、当該パスと、上記生成した行情報とを対として、ファイルテーブル登録情報を生成してもよい。上記生成した行情報と対にするファイル名、あるいは、パス名をどのように選択するかは、適宜選択してよい。
なお、本実施形態における変換ルールは、上記説明した区切り文字による分割や、パスを構成するディレクトリによる分割には限定されない。
係る変換ルールは、例えば、ファイル名等を解析する正規表現により表現されてもよい。この場合、ファイル情報解析部102は、正規表現により記載された変換ルールを解釈し、係る正規表現によりファイルテーブル作成部101から受け付けた登録対象ファイルに関する情報を解析する。そして、ファイル情報解析部102は、解析結果に基づいて上記行情報を生成する。変換ルールにどのような正規表現を記載するかは、適宜選択してよい。また、ファイル情報解析部102は、周知の技術を用いて、正規表現の解釈処理を実行してよい。
また、係る変換ルールとして、例えば、別途提供されるコンピュータ・プログラム(以下「プログラム」と称する場合がある)を用いてファイル名等を解析することを指定してもよい。より具体的には、ファイル情報解析部102は、例えば、上記変換ルールにおいて指定された解析プログラム108に対して、ファイルテーブル作成部101から受け付けた登録対象ファイルに関する情報を通知し、当該解析プログラム108による解析結果を受領してもよい。
この場合、ファイル情報解析部102は、上記解析プログラム108における解析処理の結果に基づいて、上記行情報を生成する。解析プログラム108として、どのようなプログラムを採用するかは、適宜選択してよい。また、解析プログラム108は、データ管理装置100と任意の通信回線を介して通信可能に接続された他のシステムにおいて実行されてもよい。
次に、ファイルテーブル103について説明する。ファイルテーブル103は、上記ファイルテーブル構造情報101aにより規定された構造を有するテーブルである。ファイルテーブル103は、データベース言語(例えばSQL等)により操作可能なテーブルである。より具体的には、本実施形態におけるファイルテーブル103は、例えば、関係データベースにおけるテーブルであってもよい。
ファイルテーブル103は、上記ファイル構造解析部102において生成されたファイルテーブル登録情報に含まれる情報を、属性(列)に対する属性値として有する。即ち、ファイルテーブル103は、一つの登録対象ファイルに対する情報を、テーブルにおける一つの行として保持する。また、ファイルテーブル103は、自テーブルが有する1以上の行のうち、特定の行が、どの登録対象ファイルに該当するかを記録するため、登録対象ファイルに対するファイル名あるいはパス名を記録する属性(列)を有する。図1に例示する構成においては、”登録ファイル情報”属性(符号103a)に、登録対象ファイルのファイル名あるいはパス名が記録される。
係るファイルテーブル103は、例えば、以下のように作成される。まず、上記ファイルテーブル作成部101が、上記ファイルテーブル構造情報101aに基づいて、ファイルテーブル103を作成する。この際、作成されるファイルテーブル103は、空のテーブルであってもよい。
次に、ファイルテーブル作成部101は、ファイル情報解析部102が生成したファイルテーブル登録情報を、ファイルテーブル103に挿入する。この際、ファイルテーブル作成部101は、上記行情報と対となるファイル名あるいはパス名を、ファイルテーブル103の属性(図1に例示する登録ファイル情報103a)に登録する。
このように構成されたファイルテーブル103は、はデータベース言語により操作可能なテーブルであることから、登録対象ファイルのファイル名等に関する情報を利用して、当該ファイルテーブル103に対する各種操作を実行可能である。
次に、検索部104について説明する。検索部104は、後述するインタフェース部105における検索コマンド等からの要求に対応して、上記ファイルテーブル103に対する各種操作を実行する。より具体的には、本実施形態における検索部104は、データベース言語を用いて、ファイルテーブル103に対する検索処理を実行する。なお、検索部104の具体的な動作は、例えば、周知のデータベース言語を用いた関係データベースの検索処理と同様としてよいため、詳細な説明は省略する。
また、検索部104は、例えば、他の関係データベースのテーブルと、ファイルテーブル103とを結合することにより、他の関係データベースのテーブルに保持される情報を利用して、複雑な検索を実行することも可能である。
例えば、図1に例示するように、データ管理装置100がファイルテーブル以外に、関係データベースのテーブルであるデータテーブル106を有する場合を仮定する。ここで、データテーブル106は、属性(列)として”ユーザID”、”性別”、及び、”年齢”を有する。ここで、検索部104は、ファイルテーブル103と、データテーブル106とを結合することにより、例えば、「年齢30才台の男性」に該当するユーザIDを抽出し、当該ユーザIDに対応するファイル名等を得ることができる。この場合、検索部104は、登録ファイル情報103aを参照することにより、特定のユーザIDに対応するファイル名あるいはパスを取得することが可能である。なお、係るテーブル同士の結合操作は、例えば、データベース言語としてSQLを採用した場合には、JOIN句などを使用してもよい。
次に、インタフェース部105について説明する。本実施形態におけるインタフェース部105は、図示しないデータ管理装置100のユーザや、他のシステム等に対するインタフェースを提供する。より具体的には、インタフェース部105は、例えば、ファイルテーブル103の作成や、検索等の操作に関する各種インタフェースを提供する。この場合、インタフェース部105は、例えば、ファイルテーブル103を作成するコマンドを提供してもよい。また、インタフェース部105は、ファイルテーブル103を検索するコマンドを提供してもよい。また、インタフェース部105は、データベース言語により記載された命令文等を受け付けてもよい。
次に、本実施形態におけるデータテーブル106について説明する。本実施形態におけるデータテーブル106は、ファイルテーブル103と同じデータベース言語により操作可能な、任意のデータを保持するテーブルである。本実施形態において、データテーブル106にどのようなデータを登録するかは、システムの実装等に応じて、適宜定めてよい。例えば、検索部104は、これらのテーブルを結合することにより、相互のテーブルに登録された情報を組み合わせた検索が可能である。なお、本実施形態におけるデータ管理装置100は、データテーブル106を備えなくともよい。
次に、以上のように構成された本実施形態におけるデータ管理装置100の動作について、図2A及び図2Bに例示するフローチャートを参照して説明する。なお、図2A及び図2Bに例示するフローチャートは、ファイルテーブル作成部101、及び、ファイル情報解析部102における、ファイルテーブル103の作成処理について例示する。
まず、図示しないデータ管理装置100のユーザ等は、インタフェース部105が提供するコマンド等を用いて、データ管理装置100に対してファイルテーブル103の作成を要求する。上記図示しないユーザ等からの要求を受け付けたインタフェース部105は、ファイルテーブル作成部101に対して、ファイルテーブル103の作成を要求する。この際、インタフェース部は、ファイルテーブル103の作成に必要な情報を、ファイルテーブル作成部101に通知する。ファイルテーブル103の作成に必要な情報は、例えば、ファイルテーブル構造情報101a、対象ファイル特定情報101b、及び、”ファイル情報−ファイルテーブル”関連情報101cを含む。
ファイルテーブル作成部101は、上記ファイルテーブル103の作成に必要な情報を含む、ファイルテーブル作成要求を受け付ける(ステップS201)。
次に、ファイルテーブル作成部101は、上記ファイルテーブル作成要求に含まれるファイルテーブル構造情報101aに基づいて、ファイルテーブル103を作成する(ステップS202)。この場合、ファイルテーブル作成部101は、空のファイルテーブル103を作成してもよい。
次に、ファイルテーブル作成部101は、上記ファイルテーブル作成要求に含まれる対象ファイル特定情報101bに基づいて、登録対象ファイルのファイル名等を抽出する(ステップS203)。この場合、ファイルテーブル作成部101は、例えば、対象ファイル特定情報101bに列挙された登録対象ファイルのファイル名等を抽出してもよい。また、ファイルテーブル作成部101は、上記説明したように、対象ファイル特定情報101bに記載された登録ルールに基づいて、登録対象ファイルのファイル名等を抽出してもよい。
次に、ファイルテーブル作成部101は、ステップS203において抽出した登録対象ファイルのファイル名等と、上記ファイルテーブル作成要求に含まれる”ファイル情報−ファイルテーブル”関連情報101cと、を、ファイル情報解析部102に通知する(ステップS204)。この場合、ファイルテーブル作成部101は、”ファイル情報−ファイルテーブル”関連情報101cに含まれる変換ルールを、ファイル情報解析部102に通知してもよい。
次に、図2Bを参照して、ファイル情報解析部102における、ファイルテーブル登録情報生成処理(ステップS205)の詳細について説明する。
上記ステップS204における通知を受領したファイル情報解析部102は、”ファイル情報−ファイルテーブル”関連情報101cに含まれる変換ルールに基づいて、ファイル名等を解析する(ステップS2051)。
次に、ファイル情報解析部102は、上記ステップS2051における解析結果に基づいて、ファイルテーブル103の属性(列)に対する属性値として挿入可能な、行情報を生成する(ステップS2052)。より具体的には、上記説明したように、ステップS2051における解析結果から得られる、ファイル名等に含まれる情報(例えば、図1に例示する”ユーザID”、”日付”、”連番”等)を、上記説明した行情報として抽出する。
次に、ファイル情報解析部102は、ステップS2052において抽出した行情報と、登録対象ファイルを特定可能な情報(ファイル名、あるいは、パス等)を対として、ファイルテーブル登録情報を生成する。そして、ファイル情報解析部102は、生成したファイルテーブル登録情報を、ファイルテーブル作成部101に通知する(ステップS2053)。
次に、ファイルテーブル作成部は、ステップS2053において生成されたファイルテーブル登録情報を受け付け、ファイルテーブル103に挿入(登録)する(ステップS206)。即ち、ステップS208の処理によってファイルテーブル103が更新される。
上記各ステップ実行することによりファイルテーブル103が作成および更新された場合、検索部104は、データベース言語を利用して各種検索処理を実行可能である。
以上説明したように、本実施形態におけるデータ管理装置100によれば、データベース言語により操作可能なファイルテーブル103が作成及び更新される。そして、係るファイルテーブル103には、ファイルに関する情報が、データベース言語の機能を利用して処理可能な形式により登録される。特に、ファイルテーブル103には、ファイル名やファイルのパスに含まれる情報が、データベース言語の機能を利用して処理可能な形式により登録される。
このため、本実施形態におけるデータ管理装置100によれば、ファイルシステムに存在するファイルに付与されたファイル名や、当該ファイルが配置されたパスに含まれる情報を、データベース言語から利用可能である。これにより、本実施形態におけるデータ管理装置100によれば、ファイルに記録されたデータだけでなく、ファイル名やパスに含まれる情報に基づいて、各種ファイルの操作やファイルの抽出が可能である。
以上より、本実施形態におけるデータ管理装置100によれば、通常ファイルのファイル名等に含まれる情報を、データベース言語から利用可能とする、データ管理装置等を提供することが可能である。
<第1の実施形態の変形例>
次に、上記説明した第1の実施形態の変形例について説明する。
上記第1の実施形態においては、図1に例示する登録ファイル情報103aに対する属性値として、ファイルテーブル103に登録された登録対象ファイルのファイル名、あるいはパスが登録される。
これに対して、本変形例においては、登録ファイル情報103aに対して、登録対象ファイルに記録されたデータ(以下、「ファイルの内容」と称する場合がある)が登録される。本変形例は、この点において上記第1の実施形態と相違し、その他は同様である。よって、以下、係る相違点についてのみ説明し、共通する構成についての説明は省略する。
本変形例においては、例えば、ファイル情報解析部102が、上記説明した行情報を作成する際、登録ファイルの内容をバイナリデータとして読み込み、行情報と、バイナリデータとを対として、ファイルテーブル登録情報を生成してもよい。
また、ファイルの内容が、CSV形式のように特定の区切り文字により区切られている場合を仮定する。この場合、ファイル情報解析部102は、当該ファイルの内容を、区切り文字により区切られる単位ごとに、ファイルテーブル103における複数の属性(列)として登録するよう、ファイルテーブル登録情報を生成してもよい。
なお、本変形例においては、上記ファイルテーブル構造情報101aにおいて、登録ファイル情報103aに相当する属性を複数有するよう、ファイルテーブル103の構造を規定してもよい。この場合、例えば、上記第1の実施形態と同様に、登録ファイル情報103aに相当する属性の一つには、登録対象ファイルのファイル名、あるいは、パス名を登録する。そして、他の登録ファイル情報103aに相当する属性に、ファイルの内容を登録する。この場合、ファイル名、及び、パスから生成された属性値と、ファイルの内容から生成された属性値との両方がファイルテーブル103に登録される。検索部104は、これらの情報を組み合わせて、各種検索処理を実行可能である。
以上より、本変形例におけるデータ管理装置によれば、データベース言語の機能を利用して、ファイル名やフェイルのパスの情報に加えて、ファイルの内容に関する各種操作も実行可能である。
<第2の実施形態>
次に、本願発明の第2の実施形態について、図3を参照して説明する。以下の説明においては、本実施形態に係る特徴的な部分を中心に説明すると共に、上述した第1の実施形態と同様な構成についての重複する説明は省略する。
本実施形態におけるデータ管理装置300においては、ファイルテーブル作成部301の動作が、上記説明した第1の実施形態におけるファイルテーブル作成部101と相違する。また、本実施形態におけるデータ管理装置300においては、検索部304の動作が、上記説明した第1の実施形態における検索部104と相違する。以下、係る相違点を中心に説明する。
図4を参照して、ファイルテーブル作成部301、及び、検索部304の動作について説明する。
まず、図4に例示するステップS401については上記第1の実施形態において説明したステップS201と同様としてよいため、説明を省略する。
次に、ファイルテーブル作成部301は、ステップS402において、上記第1の実施形態において説明したステップS201と同様に、ファイルテーブル103を作成する。この場合、ファイルテーブル作成部301は、空のファイルテーブル103を作成する。即ち、この場合、ファイルテーブル103の内容(各属性(列)に対する属性値、即ち、テーブルの行に相当する)は作成されず、テーブル構造のみが作成される。
次に、ファイルテーブル作成部301は、検索部304から通知される検索要求を待機する(ステップS403)。
次に、検索部304は、図示しないユーザ等からの検索要求を受け付ける。そして、検索部304は、検索処理を実行するため、ファイルテーブル作成部301に対して、ファイルテーブル103へのアクセスを要求する(ステップS404)。より具体的には、検索部304は、ファイルテーブル作成部301に対して、ファイルテーブル103の内容へのアクセスを要求する。
ステップS404における要求を受け付けたファイルテーブル作成部301は、ステップS405から処理を実行し、上記第1の実施形態と同様に、ファイルテーブル301の内容を作成する。即ち、本実施形態におけるファイルテーブル作成部301は、検索部304から要求があった際に、ファイルテーブル301の内容を作成する。
以下、ファイルテーブル作成部301におけるステップS405及びステップS406の処理は、それぞれ上記第1の実施形態におけるステップS203及びS204と同様としてよい。
次に、ファイル情報解析部102における処理(ファイルテーブル登録情報生成処理:ステップS205)は、上記第1の実施形態におけるステップS205(図2BにおけるS2051乃至ステップS2053)と同様としてよい。
次に、ファイルテーブル作成部301は、上記第1の実施形態におけるステップS208と同様に、ファイルテーブル103に対して、ステップS205において生成されたファイルテーブル登録情報を登録(挿入)する(ステップS407)。即ち、ステップS407の処理により、ファイルテーブル103が更新される。なお、ステップS407において、ファイルテーブル作成部301は、ファイルテーブル103が作成されたことを検索部304に通知してもよい。
次に、検索部304は、上記ステップS407において作成されたファイルテーブル103に対する検索処理を実行する(ステップS408)。なお、ステップS408において、検索部304は、検索処理が完了したことをファイルテーブル作成部301に通知してもよい。
次に、ファイルテーブル作成部301は、検索部304における検索処理が終了した後、ファイルテーブル103の内容を破棄(削除)する(ステップS409)。即ち、ステップS409の処理により、ファイルテーブル103が更新される。ステップS409の結果、ファイルテーブル103は、空の状態(属性(列)に対して、何ら属性値(行)が登録されていない状態)になる。
上記のように構成された本実施形態におけるデータ管理装置300によれば、ファイルテーブル103を作成した後に、登録対象ファイルの内容の変更や、ファイル名の変更や、ファイル自体の追加及び削除等が発生した場合でも、係る変更に対応した検索処理が実行可能である。また、本実施形態におけるデータ管理装置300は、上記相違点以外は、上記説明した第1の実施形態と同様であるため、上記第1の実施形態と同様の効果を奏する。
<第3の実施形態>
次に、本願発明の第3の実施形態について、図5を参照して説明する。
図5に例示するように、本実施形態におけるデータ管理装置500は、ファイルテーブル作成部501と、ファイル情報解析部502と、ファイルテーブル503と、検索部504と、を備える。
本実施形態におけるファイルテーブル503は、データベース言語により操作可能なテーブルである。ファイルテーブル503は、、例えば、ファイル名やファイルのパスに含まれる情報をテーブルの属性(列)として保持してもよい。本実施形態におけるファイルテーブル503は、上記第1の実施形態におけるファイルテーブル103に相当する。
本実施形態におけるファイル情報解析部502は、ファイルシステムにおける1以上のファイルに関する情報を、上記ファイルテーブルに登録可能な形式に変換することにより、上記ファイルテーブルに登録可能なファイルテーブル登録情報を作成する。本実施形態におけるファイル情報解析部502は、上記第1の実施形態におけるファイル情報解析部102に相当する。
本実施形態におけるファイルテーブル作成部501は、上記ファイルテーブル503の構造に関する情報に基づいて上記ファイルテーブル503を作成する。そして、ファイルテーブル作成部501は、当該作成したファイルテーブル503に対して、上記ファイル情報解析により作成された上記ファイルテーブル登録情報を登録する。本実施形態におけるファイルテーブル作成部501は、上記第1の実施形態におけるファイルテーブル作成部101に相当する。
なお、本実施形態におけるデータ管理装置500は、データベース言語を用いて、上記ファイルテーブルを検索可能な検索手段504を有してもよい。
上記のように構成された本実施形態におけるデータ管理装置500によれば、データベース言語により操作可能なファイルテーブル503が作成される。そして、係るファイルテーブル503には、ファイルシステムにおけるファイルに関する情報が、データベース言語の機能を利用して処理可能な形式により登録される。
以上より、本実施形態におけるデータ管理装置500によれば、通常ファイルのファイル名等に含まれる情報を、データベース言語から利用可能とする、データ管理装置等を提供することが可能である。
<ハードウェア及びソフトウェア・プログラム(コンピュータ・プログラム)の構成>
以下、上記説明した各実施形態を実現可能なハードウェア構成について説明する。
以下の説明において、データ管理装置(符号100、符号300、及び、符号500)をまとめて、単に「データ管理装置」と称する場合がある。また、当該データ管理装置の各構成要素(例えば、ファイルテーブル作成部(符号101、301、501)、ファイル情報解析部(符号102、502)、インタフェース部(符号105)、検索部(符号104、304、504)等)をまとめて、単に「データ管理装置の構成要素」と称する場合がある。
上記各実施形態において説明したデータ管理装置は、専用のハードウェア装置により構成してもよい。その場合、上記各図に示した各部は、一部または全部を統合したハードウェア(処理ロジックを実装した集積回路等)として実現してもよい。
また、上述したデータ管理装置は、図6に例示するようなハードウェアと、係るハードウェアによって実行される各種ソフトウェア・プログラム(コンピュータ・プログラム)とによって構成してもよい。
図6における演算装置601は、汎用のCPU(Central Processing Unit)やマイクロプロセッサ等の演算処理装置である。演算装置601は、例えば後述する不揮発性記憶装置603に記憶された各種ソフトウェア・プログラムを記憶装置602に読み出し、係るソフトウェア・プログラムに従って処理を実行してもよい。
記憶装置602は、演算装置601から参照可能な、RAM(Random Access Memory)等のメモリ装置であり、ソフトウェア・プログラムや各種データ等を記憶する。なお、記憶装置602は、揮発性のメモリ装置であってもよい。
不揮発性記憶装置603は、例えば磁気ディスクドライブや、フラッシュメモリによる半導体記憶装置のような、不揮発性の記憶装置であり、各種ソフトウェア・プログラムやデータ等を記録してもよい。
ネットワークインタフェース606は、通信ネットワークに接続するインタフェース装置であり、例えば有線及び無線のLAN(Local Area Network)接続用インタフェース装置等を採用してもよい。
例えば、上記各実施形態におけるデータ管理装置は、図示しない当該データ管理装置のユーザが使用する端末や、他のシステムと、上記ネットワークインタフェース606を介して通信可能に接続されていてもよい。
外部記憶装置604は、例えば、後述する外部記憶媒体605に対するデータの読み込みや書き込みを処理する装置である。
外部記録媒体605は、例えば光ディスク、光磁気ディスク、半導体フラッシュメモリ等、データを記録可能な任意の記録媒体である。
入出力インタフェース607は、外部装置との間の入出力を制御する装置である。
例えば、上記各実施形態においては、図示しないユーザは、入出力インタフェース607に接続された入出力機器(キーボード等)を用いて、データ管理装置に対してファイルテーブル(符号103、503)の作成や、検索に関する指示を入力してもよい。
上述した各実施形態を例に説明した本発明は、例えば、図6に例示したハードウェア装置によりデータ管理装置を構成し、係る装置に対して、上記各実施形態において説明した機能を実現可能なソフトウェア・プログラムを供給することにより実現してもよい。この場合、係る装置に対して供給したソフトウェア・プログラムを、演算装置601が実行することによって、本願発明が達成されてもよい。
上述した各実施形態において、上記各図に示した各部は、上述したハードウェアにより実行されるソフトウェア・プログラムの機能(処理)単位である、ソフトウェアモジュールとして実現することができる。但し、これらの図面に示した各ソフトウェアモジュールの区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。
例えば、図1、図3、及び、図5に例示した各部をソフトウェアモジュールとして実現する場合、これらのソフトウェアモジュールを不揮発性記憶装置603に記憶しておき、演算装置601がそれぞれの処理を実行する際に、これらのソフトウェアモジュールを記憶装置602に読み出すよう構成してもよい。
また、これらのソフトウェアモジュール間は、共有メモリやプロセス間通信等の適宜の方法により、相互に各種データを伝達できるように構成してもよい。このような構成により、これらのソフトウェアモジュール間は、相互に通信可能に接続可能である。
更に、上記各ソフトウェア・プログラムを外部記憶媒体605に記録しておき、上記通信装置等の出荷段階、あるいは運用段階等において、適宜外部記憶装置604を通じて当該ソフトウェア・プログラムを不揮発性メモリ603に格納するよう構成してもよい。
また、上記データ管理装置の構成要素をソフトウェア・プログラムとして実現する場合、上記各実施形態において説明した、ファイルテーブル(符号103、503)やデータテーブル(符号106)は、適切なデータベースを用いて、記憶装置602や、不揮発性記憶装置603に記憶してもよい。
なお、上記の場合において、上記データ管理装置への各種ソフトウェア・プログラムの供給方法は、出荷前の製造段階、あるいは出荷後のメンテナンス段階等において、適当な治具を利用して当該装置内にインストールする方法を採用してもよい。また、各種ソフトウェア・プログラムの供給方法は、インターネット等の通信回線を介して外部からダウンロードする方法等のように、現在では一般的な手順を採用してもよい。
そして、このような場合において、本発明は、係るソフトウェア・プログラムを構成するコード、あるいは係るコードが記録されたところの、コンピュータ読み取り可能な記憶媒体によって構成されると捉えることができる。
以上、本発明を、上述した模範的な実施形態に適用した例として説明した。しかしながら、本発明の技術的範囲は、上述した各実施形態に記載した範囲には限定されない。当業者には、係る実施形態に対して多様な変更または改良を加えることが可能であることは明らかである。そのような場合、係る変更または改良を加えた新たな実施形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、特許請求の範囲に記載した事項から明らかである。
本発明は、例えば、ファイルの内容とデータベースの内容との両者を用いてデータの分析を実行するデータ分析処理や、業務バッチ処理などに適用可能である。
100 データ管理装置
101 ファイルテーブル作成部
102 ファイル情報解析部
103 ファイルテーブル
104 検索部
105 インタフェース部
106 データテーブル
107 ファイル
108 解析プログラム
300 データ管理装置
301 ファイルテーブル作成部
304 検索部
500 データ管理装置
501 ファイルテーブル作成部
502 ファイル情報解析部
503 ファイルテーブル
504 検索部
601 演算装置
602 記憶装置
603 不揮発性記憶装置
604 外部記憶装置
605 外部記録媒体
606 ネットワークインタフェース
607 入出力インタフェース

Claims (10)

  1. データベース言語により操作可能なテーブルであるファイルテーブルと、
    ファイルシステムにおける1以上のファイルに関する情報を、前記ファイルテーブルに登録可能な形式に変換することにより、前記ファイルテーブルに登録可能なファイルテーブル登録情報を作成するファイル情報解析手段と、
    前記ファイルテーブルの構造に関する情報に基づいて前記ファイルテーブルを作成し、当該作成したファイルテーブルに対して、前記ファイル情報解析手段により作成された前記ファイルテーブル登録情報を登録するファイルテーブル作成手段と、を有することを特徴とする、
    データ管理装置。
  2. 前記データベース言語を用いて前記ファイルテーブルを検索可能な検索手段を、更に有することを特徴とする、
    請求項1に記載のデータ管理装置。
  3. 前記ファイルテーブルは、前記ファイルに対するファイル名、及び、ファイルパスの少なくともいずれかに含まれる情報を1以上の属性として有し、
    前記ファイル情報解析手段は、前記1以上のファイルに関する情報である、当該ファイルのファイル名、及び、ファイルパスの少なくともいずれかを解析し、
    当該解析結果に基づいて、前記ファイルテーブルが有する前記1以上の属性に登録可能な属性値を生成し、
    当該生成した属性値に基づいて、前記ファイルテーブル登録情報を作成することを特徴とする、
    請求項1または請求項2に記載のデータ管理装置。
  4. 前記ファイル情報解析手段は、
    前記1以上のファイルに関する情報である、当該ファイルのファイル名、及び、ファイルパスの少なくともいずれかを、特定の区切り文字を用いて区切り、
    当該区切られた結果の少なくとも一部を、当該ファイルのファイル名、及び、ファイルパスの少なくともいずれかに含まれる情報として抽出し、
    当該抽出した情報に基づいて、前記ファイルテーブルが有する前記1以上の属性に登録可能な属性値を生成することを特徴とする、
    請求項3に記載のデータ管理装置。
  5. 前記ファイル情報解析手段は、
    前記1以上のファイルに関する情報である、当該ファイルのファイル名、及び、ファイルパスの少なくともいずれかを、正規表現を用いて解析し、
    当該解析の結果に基づいて、当該ファイルのファイル名、及び、ファイルパスの少なくともいずれかに含まれる情報を抽出し、
    当該抽出した情報に基づいて、前記ファイルテーブルが有する前記1以上の属性に登録可能な属性値を生成することを特徴とする、
    請求項3に記載のデータ管理装置。
  6. 前記ファイル情報解析手段は、自装置の外部から指定された解析処理手段に対して、前記1以上のファイルに関する情報である、当該ファイルのファイル名、及び、ファイルパスの少なくとも何れかを通知し、当該解析処理手段による解析結果に基づいて、前記ファイルテーブルが有する前記1以上の属性に登録可能な属性値を生成し、
    前記解析処理手段は、前記ファイル情報解析手段より通知されたファイル名、及び、ファイルパスの少なくともいずれかを所定の手順に従って解析することにより、当該ファイル名、及び、ファイルパスの少なくともいずれかに含まれる情報を抽出することを特徴とする、
    請求項3に記載のデータ管理装置。
  7. 前記ファイルテーブル作成手段は、前記ファイルテーブルに対する検索要求を前記検索手段から受け付けた際に、前記ファイル情報解析手段により作成された前記ファイルテーブル登録情報を、検索対象である前記ファイルテーブルに登録し、
    前記検索手段による検索が終了した際に、少なくとも前記ファイルテーブル登録情報により登録された前記ファイルテーブルの属性値を削除することを特徴とする、
    請求項1乃至請求項6のいずれかに記載のデータ管理装置。
  8. 前記ファイルテーブルは、関係データベースを構成するテーブルであり、前記ファイルに対するファイル名、及び、ファイルパスの少なくともいずれかに含まれる情報を列として含み、
    前記ファイル情報解析手段は、前記1以上のファイルに関する情報である、当該ファイルのファイル名、及び、ファイルパスの少なくとも何れかを解析することにより、1以上の前記列に登録可能な値を生成し、当該生成した値に基づいて、前記ファイルテーブルに挿入する行を表す情報を生成し、
    前記ファイルテーブル作成手段は、前記ファイル情報解析手段により生成された行を表す情報を、前記ファイルテーブルに挿入することにより、当該ファイルテーブルを更新し、
    前記検索手段は、前記データベース言語を用いて、前記作成されたファイルテーブルを検索することを特徴とする、
    請求項2に記載のデータ管理装置。
  9. データベース言語により操作可能なテーブルであるファイルテーブルを有する情報処理装置が、
    ファイルシステムにおける1以上のファイルに関する情報を、前記ファイルテーブルに登録可能な形式に変換することにより、前記ファイルテーブルに登録可能なファイルテーブル登録情報を作成し、
    前記ファイルテーブルの構造に関する情報に基づいて前記ファイルテーブルを作成し、当該作成したファイルテーブルに対して、前記ファイル情報解析手段により作成された前記ファイルテーブル登録情報を登録することを特徴とする、
    データ管理方法。
  10. データベース言語により操作可能なテーブルであるファイルテーブルを有するコンピュータに、
    ファイルシステムにおける1以上のファイルに関する情報を、前記ファイルテーブルに登録可能な形式に変換することにより、前記ファイルテーブルに登録可能なファイルテーブル登録情報を作成する処理と
    前記ファイルテーブルの構造に関する情報に基づいて前記ファイルテーブルを作成し、当該作成したファイルテーブルに対して、前記ファイル情報解析手段により作成された前記ファイルテーブル登録情報を登録する処理と、を実行させることを特徴とする、
    コンピュータ・プログラム。
JP2014101951A 2014-05-16 2014-05-16 データ管理装置、データ管理方法、及び、そのプログラム Pending JP2015219672A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014101951A JP2015219672A (ja) 2014-05-16 2014-05-16 データ管理装置、データ管理方法、及び、そのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014101951A JP2015219672A (ja) 2014-05-16 2014-05-16 データ管理装置、データ管理方法、及び、そのプログラム

Publications (1)

Publication Number Publication Date
JP2015219672A true JP2015219672A (ja) 2015-12-07

Family

ID=54778995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014101951A Pending JP2015219672A (ja) 2014-05-16 2014-05-16 データ管理装置、データ管理方法、及び、そのプログラム

Country Status (1)

Country Link
JP (1) JP2015219672A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116658A (ja) * 2017-01-20 2018-07-26 株式会社オービック ファイル管理装置、ファイル管理方法、および、ファイル管理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116658A (ja) * 2017-01-20 2018-07-26 株式会社オービック ファイル管理装置、ファイル管理方法、および、ファイル管理プログラム
JP2021182395A (ja) * 2017-01-20 2021-11-25 株式会社オービック ファイル管理装置、ファイル管理方法、および、ファイル管理プログラム
JP7100748B2 (ja) 2017-01-20 2022-07-13 株式会社オービック ファイル管理装置、ファイル管理方法、および、ファイル管理プログラム

Similar Documents

Publication Publication Date Title
CN109299102B (zh) 一种基于Elastcisearch的HBase二级索引系统及方法
CN106202207B (zh) 一种基于HBase-ORM的索引及检索系统
JP5601066B2 (ja) 情報統合プログラム、装置及び方法
KR20100117415A (ko) 데이터베이스 관리 방법 및 시스템
CN104715032A (zh) 一种报表系统中英文表名字段名映射系统及方法
US11514697B2 (en) Probabilistic text index for semi-structured data in columnar analytics storage formats
JP2019109693A (ja) データ管理装置、データ管理方法、およびプログラム
KR20200094074A (ko) 인덱스 관리 방법, 장치, 기기 및 저장 매체
JP6642435B2 (ja) データ処理装置、データ処理方法、及び、プログラム
JP4237813B2 (ja) 構造化文書管理システム
US20140067853A1 (en) Data search method, information system, and recording medium storing data search program
US11301441B2 (en) Information processing system and information processing method
JP6737039B2 (ja) データベースシステム、データ処理プログラム、及びデータ処理方法
US20230153455A1 (en) Query-based database redaction
CN112889039A (zh) 用于克隆后租户标识符转换的记录的标识
JP2015219672A (ja) データ管理装置、データ管理方法、及び、そのプログラム
CN113434413B (zh) 基于数据差异的数据测试方法、装置、设备及存储介质
JP5162215B2 (ja) データ処理装置、データ処理方法、および、プログラム
US20200278981A1 (en) Information processing device and non-transitory computer readable medium
JP5696280B1 (ja) 用語統一システム及び用語統一プログラム、並びに用語統一方法
CN110968634B (zh) 大数据场景下基于xml描述实现利用可编程函数式进行etl转换处理的方法
US10942969B2 (en) Non-transitory computer-readable storage medium, search control method, and search control apparatus
JP4304226B2 (ja) 構造化文書管理システム、構造化文書管理方法及びプログラム
JP6668513B2 (ja) データ管理方法及び計算機
JP2009301511A (ja) 索引情報作成装置、索引情報作成方法及びプログラム