データ管理装置と方法並びにプログラム 技術分野
[0001] (関連出願の記載)本願は、先の日本特許出願 2006— 332062号(2006年 12月 8日出願)の優先権を主張するものであり、前記先の出願の全記載内容は、本書に 引用をもって繰込み記載されているものとみなされる。
本発明は、情報処理技術に関し、特に、ファイル、データベースといった異なるデ 明
ータ格納手段を持つデータストレージ装置を統合し、異種形式のデータを統合的に 管理する装置、及びプログラムに関する。
書
背景技術
一般に、アプリケーションやユーザが何かしらの目的によって生成されたデータは、 そのデータの種別や、データのその後の活用目的、又は管理目的によって、様々な データストレージシステムに格納されている。例えば、
•データをファイルという単位で格納し、「ディレクトリツリー」と呼ばれるツリー形式で
•データをある意味や目的で定義し形式化することにより、複数のカラムをもったレコ ードをテープノレ化させたリレーショナノレデータベース、
などが、現在、広く使われているデータストレージシステムである。
[0003] ファイルシステムは、一般的に実用とされる範囲においては、格納することのできる データのサイズに制限はなぐまた「ファイル」と呼ばれる特定のデータ構造を持たな いデータを格納することができるため、アプリケーションやユーザが作成したデータの 格納先として広く活用されている。
[0004] ところで、ファイルシステムに格納されたデータは、「ディレクトリツリー」と呼ばれる、 ファイル名をノードとして持つツリー形式によってデータ管理が行われている。このた め、データの抽出の際は、ディレクトリツリー上にマッピングされているフアイノレ名を手 力 Sかりとして、データの所在、つまり、ディレクトリツリー上のパス名を指定しなければ データにアクセスすることができない。
[0005] ファイルシステムには、データ本体以外のデータとして、
•ファイル名や、
•ファイルサイズ、
•データ更新時間などの時間に関するデータ、
•データの所有者などのデータ処理実行者に関するデータ、
等が、メタデータとして、データ本体と共に管理されている。
[0006] しかしながら、データ抽出は、基本的にパス名を指定することによってのみ行われる
[0007] したがって、ファイルシステムを介したデータの処理をアプリケーション上で実行す る際には、必要となるファイルのパス名を予め認識していることにより、高速なデータ 抽出が可能となるものの、パス名以外の情報を基に、データを抽出することは、その 情報がファイルシステム上で管理されているメタデータであったとしても、該抽出処理 に長時間を要する。
[0008] このように、ファイルシステムは、格納できるデータの自由度が高いものの、データ の検索性に劣る。
[0009] リレーショナルデータベースは、データの中身を構造化できるデータ利用環境にお いて、データを予め決められた項目に分類整理したレコードという形で表現し、複数 のレコードを 2次元テーブル状に管理することで、高いデータ検索性を実現するスト
[0010] リレーショナルデータベースにおいては、データの分類整理に使われている、すべ ての項目を情報抽出キーとして活用することが可能であるため、必要とする情報のみ を非常に高速に抽出することができる。したがって、構造化されたデータを、格納及 び活用するために、最適なストレージシステムであり、特に定型的な作業を実施する アプリケーション用のストレージシステムとして広く活用されている。
[0011] しかしながら、リレーショナルデータベースは、レコード内に格納できるデータのサイ ズに制限があり、構造化されていないデータを格納するには、非効率な手段である。
[0012] このため、リレーショナルデータベースは、ファイルシステムに比べて、データの検 索性は優れているものの、格納できるデータの自由度は低い。
[0013] このように、現在は特定のシステムが実現すべき要件にあわせて、最適なストレージ システムが選ばれ、様々なデータ格納方式でデータが格納されて!/、る。
[0014] これらのストレージシステムに格納されているデータを、他の複数のシステムで活用 するようなデータ共有環境を想定した場合、データ作成元のシステムと連携して、デ ータ作成元で採用していたデータ形式から、データ活用先で採用しているデータ形 式に変換する作業を、アプリケーションごとに個別に実施する必要があった。
[0015] このような課題を解決するために、例えば特許文献 1では、異なるデータ形式ゃ異 なるデータアクセス手段を持つ複数のストレージシステムに格納されているデータを、 単一のデータ表現にマッピングしてオブジェクトとして极レ、、オブジェクト単位での単 一のデータアクセスインターフェースを新たに設けることで、ストレージシステム固有 のデータアクセス手段をアプリケーションに対して隠蔽し、異種データ形式及び異種 ストレージシステムにおけるアプリケーション間でのデータ共有を実現している。
[0016] また特許文献 2には、構造化情報 (DB)と非構造化情報 (文書)の組み合わせに関 する検索と分析を統合するアプリケーションを開発する UIMA (Unstructured Inf ormation Management Architecture)力、開不 れてレヽる。 UIMS (Unstructu red Information Management System)は、検糸'ェンンンと、ァータ 己 ^と 、ノイプライン化した文書ァノテータを含む分析エンジンと、さまざまなアダプタを含 み、検索照会は、それぞれが関連重み値を有する複数の検索部分式からなる検索 演算子 (加重 ANDとして機能するブール述部)を含む。検索エンジンは、しきい値重 み合計を超える重み値合計を有する 1つ又は複数の文書を返す。
[0017] 特許文献 1 :特開平 11 327997号公報
特許文献 2:特開 2004— 362563号公幸
発明の開示
発明が解決しょうとする課題
[0018] 以上の特許文献 1、 2の開示事項は、本書に引用をもって繰り込み記載されている ものとする。以下に本発明による関連技術の分析を与える。
上記したように、複数のデータ形式、複数のデータアクセス手段を保持しているよう なストレージシステム環境にぉレ、て、データを共通形式のオブジェクトにマッピングし
、データアクセス手段を統合するアプローチにより、複数のアプリケーションからデー タを共有する環境を構築することができる。
[0019] しかしながら、このような環境に接続するアプリケーションが互いに異なるサービスを 提供することを前提にして様々なデータが作成された場合、
•どのような目的で作成されたデータであるか、
-データに含まれる情報がどのような情報であるのか、
等のデータ内容を、データを活用するアプリケーション自身が判別することが出来 なければ、他のアプリケーションが作成したデータを活用することはできない。
[0020] また、
あるアプリケーションによって作成されたオブジェクトが巨大なサイズのデータである 場合や、
データを活用するアプリケーションが必要とするデータがオブジェクト内の一部のデ ータである場合、
前記データ内容と連動してデータの一部分のみを取得する機能が必要となる。
[0021] 本発明の目的は、複数のデータ形式、複数のデータアクセス手段を保持している 環境にお!/、てデータを共通形式のオブジェクトにマッピングし、データアクセス手段 を統合する手段を持つデータ管理装置に適用した場合に、アプリケーション同士が 連携せずとも、所望データにアクセスすることを可能とするデータ管理装置と方法と プログラムを提供することにある。
[0022] また、本発明の他の目的は、付帯情報をオブジェクトに付与することで、新たなアブ リケーシヨンが導入された場合に、既に作成済みのデータをデータ資産として活用す ることを可能とするデータ管理装置と方法とプログラムを提供することにある。
[0023] さらに、本発明の他の目的は、上記目的を達成しながら、不要なデータの読み出し 処理を削減することを可能とするデータ管理装置と方法とプログラムを提供することに ある。
課題を解決するための手段
[0024] 本願で開示される発明は、前記課題を解決するために、概略以下の構成とされる。
[0025] 本発明は、ファイル、データベースといった異なるデータ格納手段を持つデータスト
レージ装置を統合し、異種形式のデータを統合的に管理する装置であって、格納さ れているデータをある意味を持つ情報として活用する際に、意味とその意味に関連し ているデータ領域の管理及びデータアクセス制御を行うものである。
[0026] より詳細には、本発明においては、複数のデータ形式、複数のデータアクセス手段 を保持している環境において、データを共通形式のオブジェクトにマッピングし、デー タアクセス手段を統合する手段を持つデータ管理装置に適用される。このデータ管 理装置は、データ作成元となるアプリケーションや、作成されたデータの内容を分析 するアプリケーション力 オブジェクトに対して、データの内容を表現又は説明するた めの付帯情報と、前記付帯情報がオブジェ外のどの領域に関連する付帯情報であ る力、を解釈するための情報 (データ部分情報)とを保存する手段を備える。
[0027] また、本発明においては、前記付帯情報の付与にあたっては、 1つのオブジェクト に対して複数の付帯情報を付与することができることを特徴としている。
[0028] さらに、前記データ管理装置は、データを活用するアプリケーションが、ストレージ システムに格納されているオブジェクトに対して、前記アプリケーションが必要とする オブジェ外を、前記付帯情報を基に検索する手段と、前記付帯情報と付帯情報に 関連付けられたデータ部分情報を基に、オブジェクトデータの一部分のみを読み出 すことが可能なデータ読み出し手段を備える。
[0029] 本発明に係るコンピュータプログラムは、複数のデータ形式のデータを共通形式の オブジェクトにマッピングして、データアクセスを統合化する処理と、
データ作成元となるアプリケーションや作成されたデータの内容を分析するアプリケ ーシヨン力 S、オブジェクトに対してデータの内容の表現又は説明に用いられる付帯情 報を付与し、前記付帯情報を、前記付帯情報がオブジェクトのどのデータ領域に関 連する付帯情報である力、を示すデータ部分情報とを関連付けて保存する処理とを、 コンピュータに実行させるプログラムよりなる。
[0030] 本発明に係るコンピュータプログラムにおいて、データを活用するアプリケーション 力 Sストレージシステムに格納されているオブジェクトに対して、前記アプリケーションが 必要とするオブジェクトを、前記付帯情報を基に検索する処理と、
前記付帯情報と、前記付帯情報に関連付けられたデータ部分情報を基に、ォブジ
ェクトデータの一部分を読み出す処理と、を前記コンピュータに実行させるプログラム よりなる。
[0031] 本発明の他のアスペクト(側面)に係る装置は、オブジェクトのデータへのアクセスを 管理するデータ管理装置であって、前記オブジェクトのデータの内容の表現又は説 明に用いられる付帯情報と、前記付帯情報がオブジェ外のどのデータ領域に関連 する付帯情報である力、を示すデータ部分情報とを、オブジェクトを識別するオブジェ タト IDに関連付けて、前記オブジェクトのメタデータとして、前記オブジェクトデータの 格納先である記憶部とは別に、オブジェクトメタデータ記憶部にて、記憶管理する手 段を備えている。
[0032] 本発明に係る装置において、クライアントからの読み出し要求を受け、前記読み出 し要求で指定されたオブジェクト IDと付帯情報とから、前記オブジェクトメタデータ記 憶部を検索して、前記付帯情報に対応するオブジェ外データのデータ部分を、前記 オブジェクトのデータの格納先の記憶部から、選択的に読み出す手段を備えている。
[0033] 本発明に係る装置にお!/、て、前記オブジェクトメタデータ記憶部は、前記オブジェ タト IDに関連付けて、前記オブジェクトのデータ形式と前記オブジェクトのデータの格 納先アドレス情報と、を記憶管理する構成としてもよい。
[0034] 本発明に係る装置において、クライアントからの読み出し要求を受け、前記読み出 し要求で指定されたオブジェクト IDと付帯情報とから、前記オブジェクトメタデータ記 憶部を検索して、前記データ形式とデータ部分情報に対応したオブジェクトデータ読 み出しコマンドを生成する手段と、前記オブジェクトのデータの格納先の記憶部から 、前記付帯情報に対応する、オブジェクトデータのデータ部分を選択的に読み出す 手段を備えている。
[0035] 本発明に係る装置にお!/、て、前記オブジェクトのデータ形式としてファイル形式と データベース形式を含み、前記オブジェクトデータ読み出しコマンドを生成する手段 は、前記オブジェクトのデータ形式に応じてファイルへの読み出し命令、又はデータ ベースへのデータ読み出し命令を生成するようにしてもよい。
[0036] 本発明に係る装置にお!/、て、前記クライアントからオブジェクトの生成又は更新要 求を受け取ると、前記オブジェクトのデータ形式に応じて、オブジェクトの生成又は更
新コマンドを生成し、前記オブジェクトデータの格納先であるファイルサーバへ、ファ ィル作成又は更新命令を送信するか、あるいは、前記オブジェクトデータの格納先で あるデータベースサーバへ、テーブル作成又は更新命令を送信するようにしてもよい
[0037] 本発明に係る装置において、前記クライアントから付帯情報を追加する要求を受け 取ると、前記オブジェクトメタデータ記憶部に前記付帯情報と、追加された前記付帯 情報に該当するデータ部分情報を追加する構成としてもよい。
[0038] 本発明に係る装置において、前記クライアントからオブジェクト一覧要求を受け取る と、前記要求で指定された付帯情報に合致するオブジェ外 IDを抽出し、データ形式 、付帯情報、データ部分情報を一覧で表示する構成としてもよい。
[0039] 本発明のさらに他のアスペクト (側面)に係る装置は、オブジェクトのデータへのァク セスを管理するデータ管理装置であって、前記オブジェクトのデータの内容の表現 又は説明に用いられる付帯情報と、前記付帯情報がオブジェクトのどのデータ領域 に関連する付帯情報である力、を示すデータ部分情報とを、オブジェクトを識別するォ ブジェクト IDに関連付けて、前記オブジェクトのメタデータとして記憶管理する第 1の 記憶領域 (第 1のテーブル)と、
前記オブジェクト IDに関連させて、前記オブジェクトのデータ形式と、前記オブジェ タトのデータを格納する格納先アドレス情報を記憶管理する第 2の記憶領域 (第 2の テープノレ)と、
クライアントからの読み出し要求を受け、前記読み出し要求で指定されたオブジェク ト IDとから、前記第 1の記憶領域と前記第 2の記憶領域を参照して、前記データ形式 とデータ部分情報に対応したオブジェクトデータ読み出しコマンドを生成する手段と、 前記オブジェクトのデータの格納先であるファイルサーバ又はデータベースサーバ から、前記付帯情報に対応する、オブジェ外データのデータ部分を選択的に読み 出す手段と、を備えた構成としてもよい。
[0040] 本発明のさらに他のアスペクト (側面)に係る装置は、クライアントから送信されるォ ブジェクトデータのアクセス要求を受け取り、応答を返送するメッセージ転送/解析 部と、
オブジェクトに関してデータの付帯情報と、前記付帯情報の該当するデータ領域と の組を、オブジェクトのメタデータとして記憶するオブジェクトメタデータ記憶部と、 オブジェクトに関するメタデータを取り扱い、前記メッセージ転送/解析部からの要 求により、前記オブジェクトメタデータ記憶部に記憶されているメタデータの読み出し 、更新、新規登録を実行管理するオブジェクトメタデータ管理部と、
前記ファイルサーバと前記データベースサーバの接続を行うデータアクセス部と、 前記メッセージ転送/解析部からの要求により、前記ファイルサーバ又は前記デー タベースサーバ対応のデータアクセス用コマンドを生成し、該データアクセス用コマ ンドを前記データアクセス部へ送信し、前記データアクセス部から送信される応答デ ータからオブジェクトデータを抽出して前記メッセージ転送/解析部へ送信するデー タ変換部と、
を備え、
前記データアクセス部は、
前記ファイルサーバ又は前記データベースサーバに、前記データ変換部から指定 されたデータアクセス用コマンドを送信し、前記ファイルサーバ又はデータベースサ ーバからの応答データを、前記データ変換部へ送信する。
[0041] 本発明に係る装置にお!/、て、前記オブジェクトメタデータ記憶部は、
オブジェクトデータを一意に識別するオブジェクト ro情報と、
オブジェクトのデータ形式を示すデータ形式情報と、
オブジェクトデータの格納先のアドレス情報を示すデータ格納先アドレス情報と、 オブジェクトデータの内容を判別するために、データの内容を表現した付帯情報と 前記付帯情報が該当するデータの位置を示すデータ部分情報と、
を含む。
[0042] 本発明に係る装置において、
(al)前記メッセージ転送/解析部は、
前記クライアントから、データ形式と作成するオブジェクトデータ全体を表す付帯情 報を指定したオブジェクト作成要求を受信すると、前記オブジェクト作成要求の中か
ら、データ形式情報と付帯情報を抽出し、
前記オブジェクトメタデータ管理部に、前記データ形式情報と付帯情報とオブジェ タト作成要求を送信し、
(a2)前記オブジェクトメタデータ管理部は、
付帯情報に基づき、オブジェクト IDを生成し、オブジェクトを格納するデータ格納先 アドレスを決定し、前記オブジェクトメタデータ記憶部に、オブジェクト D 情報、データ 形式情報、付帯情報、データ格納先アドレス情報を関連付けて格納し、前記メッセ一 ジ転送/解析部に対してオブジェクト IDとデータ格納先アドレス情報を送信し、 (a3)前記メッセージ転送/解析部は、
前記データ変換部に、オブジェクト ID、データ格納先アドレス情報、データ形式情 報を付与したオブジェクト作成要求を送信し、
(a4)前記データ変換部は、
指定されたデータ形式に対応したオブジェクト作成コマンドを作成し、前記データ 形式に対応したオブジェクト作成コマンドを前記データアクセス部に送信し、
(a5)前記データアクセス部は、
前記オブジェクト作成コマンドに基づき、
オブジェクトがファイルである場合には、前記ファイルサーバへファイル作成コマン ドを送信し、
オブジェクトがデータベースである場合には、前記データベースサーバへテーブル 作成コマンドを送信し、
前記ファイルサーバ又は前記データベースサーバより、オブジェクト作成処理が成 功した旨を示す応答が返送されると、
前記データ変換部に対して、ファイル又はテーブルの作成要求が成功した旨を通 知し、
(a6)前記データ変換部は、
前記データアクセス部から、ファイル又はテーブルの作成要求が成功した旨の通知 を受けると、前記メッセージ転送/解析部に対して、オブジェクト作成要求が成功し た旨を通知し、
(a7)前記メッセージ転送/解析部は、
前記データ変換部からの前記オブジェクト作成要求の成功の通知を受け、前記クラ イアントに、オブジェクト IDと共に、オブジェクト作成要求が成功した旨を通知する構 成としてあよい。
本発明に係る装置において、
(bl)前記メッセージ転送/解析部は、
オブジェクト作成要求が成功したことを受けとつた前記クライアントより、オブジェクト データ更新要求が、オブジェクト 、データ形式、オブジェクトデータ、データの更新 位置情報を付与して、前記メッセージ転送/解析部へ送信されると、
前記クライアントから受け取ったオブジェクトデータ更新要求から、オブジェクト IDと オブジェクトデータを抽出し、前記オブジェクトメタデータ管理部に対して、オブジェク ト IDをキーとしたデータ格納先アドレス情報とデータ形式情報の抽出要求を送信し、 (b2)前記オブジェクトメタデータ管理部は、
前記抽出要求を基に、前記オブジェクトメタデータ記憶部から、該当するオブジェク ト IDに関連する情報の中からデータ格納先アドレス情報とデータ形式情報を抽出し 、抽出した情報を、前記メッセージ転送/解析部に送信し、
(b3)前記メッセージ転送/解析部は
前記オブジェクトメタデータ管理部から送信されたデータ格納先アドレス情報及び データ形式情報と、前記クライアントから送信されたオブジェクトデータ及びデータの 更新位置情報を、オブジェクトデータ更新要求と共に、前記データ変換部へ送信し、 (b4)前記データ変換部は、前記メッセージ転送/解析部からの要求を基に、前記 データアクセス部に対して、与えられたデータ形式に基づくオブジェクト更新コマンド に変換して、前記データアクセス部にオブジェクトデータを付与した更新コマンドを送 信し、
前記データアクセス部は、前記データ変換部からのオブジェクト更新要求に基づき 、前記ファイルサーバ又は前記データベースサーバに前記更新コマンドとオブジェク トデータを送信し、
(b5)前記ファイルサーバ又は前記データベースサーバからの更新要求が成功した
ことを示す応答データの処理は、前記データアクセス部、前記データ変換部、前記メ ッセージ転送/解析部と、応答データが受け渡され、前記メッセージ転送/解析部 から、前記クライアントに、オブジェクトデータの更新要求が成功したことが通知される 、構成としてあよい。
[0044] 本発明に係るシステムは、クライアントと、データ管理装置と、ファイルサーバ、デー タベースサーバを備えてレ、る。
[0045] 本発明に係るシステムにおいて、
(cl)前記クライアントは、
付帯情報を追加するオブジェクト IDと、
データ形式情報、
付帯情報、
付帯情報に該当するデータ部分情報
を付与した、付帯情報追加要求を、前記データ管理装置の前記メッセージ転送/ 解析部へ送信し、
(c2)前記メッセージ転送/解析部は、
前記要求からオブジェクト ID、データ形式情報、付帯情報、付帯情報に該当する データ部分情報を抽出し、前記オブジェクトメタデータ管理部に対して、前記データ 部分情報と付帯情報追加要求を送信し、
(c3)前記オブジェクトメタデータ管理部は、
前記データ部分情報の中から、オブジェクト IDをキーとして、前記オブジェクトメタ データ記憶部から、該当するオブジェクトのメタデータを抽出し、前記データ部分情 報に含まれるデータ形式情報を、前記オブジェクトメタデータ記憶部に登録されてレ、 るデータ形式情報と照合を行い、データ形式が一致して!/、ることを確認し、
前記クライアントによって指定されたデータ形式情報と、前記オブジェクトメタデータ 記憶部に登録されているデータ形式情報が一致しており、前記データ形式が、フアイ ル且つストリーム型のデータ形式であり、さらに、付帯情報に該当するデータ領域付 帯情報が、オフセット時間とオフセットからの経過時間という形で指定されていた場合 、前記メッセージ転送/解析部へ、オフセット時間とオフセットからの経過時間に該当
するオフセットバイトとバイトレンジが必要であることをオブジェクト格納先のアドレス情 報、データ形式と共に通知し、
(c4)前記メッセージ転送/解析部は、
前記オブジェクトメタデータ管理部から通知されたオブジェクト格納先のアドレス情 報、オフセット時間とオフセットからの経過時間と共に、オフセットバイトとバイトレンジ 取得要求を、前記データ変換部へ送信し、
(c 5)前記データ変換部は、
前記メッセージ転送/解析部から送信されたオブジェクト格納先のアドレス情報か ら、前記ファイルサーバへのデータ読み出しコマンドを生成し、前記データアクセス 部を介して、前記ファイルサーバからファイルデータを取得し、
取得したファイルデータとファイル形式から、ストリーム型データを展開し、オフセット 時間とオフセットからの経過時間に該当する、記憶単位に換算したオフセットとそのレ ンジを解析し、前記メッセージ転送/解析部へ、解析した情報を送信し、
(c6)前記メッセージ転送/解析部は、
取得した前記オフセットとレンジを、前記オブジェクトメタデータ管理部へ送信し、 (c7)前記オブジェクトメタデータ管理部は、
付帯情報の追加指定されたオブジェクト IDのオブジェクトメタデータ内に、追加指 定された付帯情報と、前記記憶単位でのオフセットとレンジをデータとして持つ付帯 情報に該当するデータ部分情報を、前記オブジェクトメタデータ記憶部に保存し、前 記メッセージ転送/解析部に、前記追加要求が成功したことを通知し、
(c8)前記メッセージ転送/解析部は、
前記オブジェクトメタデータ管理部からの応答を受けて、前記クライアントへ応答結 果を通知する、構成としてもよい。
本発明に係るシステムにおいて、
(dl)前記オブジェクトメタデータ管理部は、
前記クライアントによって指定されたデータ形式情報と、前記オブジェクトメタデータ 記憶部に登録されているデータ形式情報が一致しており、データ形式がファイル且 つストリーム型のデータ形式でなレ、場合、付帯情報の追加指定されたオブジェクト ID
のオブジェクトメタデータ内に、追加指定された付帯情報と付帯情報に該当するデー タ部分情報を、前記オブジェクトメタデータ記憶部に保存し、前記メッセージ転送/ 解析部に前記追加要求が成功したことを通知し、
(d2)前記メッセージ転送/解析部は、
前記オブジェクトメタデータ管理部からの応答を受けて、前記クライアントへ応答結 果を通知する。
[0047] 本発明に係るシステムにおいて、
(el)前記クライアントは、
前記データ管理装置の前記メッセージ転送/解析部に対して、オブジェクトデータ に関連する付帯情報とともに、オブジェ外一覧取得要求を送信し、
(e2)前記メッセージ転送/解析部は、
前記クライアントからの前記オブジェ外一覧取得要求に含まれる付帯情報を抽出 し、前記オブジェクトメタデータ管理部に、前記付帯情報とオブジェクト一覧取得要求 を送り、
(e3)前記オブジェクトメタデータ管理部は、
前記オブジェクトメタデータ記憶部から、前記付帯情報と一致する付帯情報をもつ オブジェ外 IDを抽出し、データ形式情報、オブジェ外格納先アドレス情報、前記ォ ブジェクトに関連付けられている付帯情報、該付帯情報に関連するデータ部分情報 と共に、前記メッセージ転送/解析部へ送信し、
(e4)前記メッセージ転送/解析部は、
前記オブジェクトメタデータ管理部から送信された前記情報を、オブジェクト IDごと に、データ形式情報、付帯情報、付帯情報に関連するデータ部分情報をリスト化して 前記クライアントへ返送する。
[0048] 本発明に係るシステムにおいて、
(fl)前記クライアントは、前記オブジェクト IDに関するリスト上の情報を基に、データ を取得するオブジェクトを選択し、前記データ管理装置のメッセージ転送/解析部へ 、オブジェクト 、オブジェクト格納先アドレス情報、データ形式情報、付帯情報、付 帯情報に関連するデータ部分情報を付与したデータ読み出し要求を送信し、
(f 2)前記メッセージ転送/解析部は、オブジェクト格納先アドレス情報、データ形式 情報、付帯情報に関連するデータ部分情報を付与したオブジェクトデータ読み出し 要求を、前記データ変換部へ転送し、
(f 3)前記データ変換部は、前記メッセージ転送/解析部から転送されたデータ形式 情報、及びデータ格納先アドレス情報、付帯情報に関連するデータ部分情報を基に 、オブジェクトの格納先である前記ファイルサーバ又は前記データベースサーバ用の データ読み出しコマンドを生成して、前記データアクセス部へ送信し、
前記ファイルサーバ又はデータベースサーバから返送されたオブジェクトデータは 、前記データアクセス部、前記データ変換部、前記メッセージ転送/解析部を介して 、付帯情報に関連するオブジェクトデータの一部が前記クライアントに送信され、 前記データ読み出しコマンドは、
データ形式がファイルの場合、データ格納先アドレス情報であるファイルのパス名と 、付帯情報に関連するデータ部分情報であるオフセットバイトとバイトレンジに基づく ファイルの読み出し要求とされ、
データ形式がデータベースの場合、データ格納先アドレス情報であるテーブル名と 、付帯情報に関連するデータ部分情報である SQL (Structured Query Langua ge)クエリに基づぐデータベースの読み出し要求とされる。
[0049] 本発明の他のアスペクトに係る方法は、
複数のデータ形式のデータを共通形式のオブジェクトにマッピングして、データァク セスを統合化する工程と、
オブジェクトに対して、データの内容の表現又は説明に用いられる付帯情報を付与 し、前記付帯情報を、前記付帯情報がオブジェクトのどのデータ領域に関連する付 帯情報である力、を示す情報とを関連付けて保存する工程と、
を含む。
[0050] 本発明にお!/、ては、オブジェクトを、前記付帯情報を基に検索する工程と、
前記付帯情報と、前記付帯情報に関連付けられた前記データ部分情報を基に、ォ ブジェクトデータの一部分を読み出す工程と、
をさらに含む。
[0051] 本発明の他のアスペクトに係る方法は、オブジェクトのデータへのアクセスを管理す るデータ管理方法であって、
前記オブジェクトのデータの内容の表現又は説明に用いられる付帯情報と、前記 付帯情報がオブジェクトのどのデータ領域に関連する付帯情報であるかを示すデー タ部分情報とを、オブジェクトを識別するオブジェクト IDに関連付けて前記オブジェク トのメタデータとして第 1の記憶領域 (第 1のテーブル)で記憶管理し、前記オブジェク ト IDに関連させて、前記オブジェクトのデータ形式と、前記オブジェクトのデータを格 納する格納先アドレス情報を第 2の記憶領域 (第 2のテーブル)で記憶管理する工程 と、
クライアントからの読み出し要求を受け、前記読み出し要求で指定されたオブジェク ト IDとから、前記第 1の記憶領域と前記第 2の記憶領域を参照して、前記データ形式 とデータ部分情報に対応したオブジェクトデータ読み出しコマンドを生成する工程と、 前記オブジェクトのデータの格納先であるファイルサーバ又はデータベースサーバ から、前記付帯情報に対応する、オブジェ外データのデータ部分を選択的に読み 出す工程と、を含む。
発明の効果
[0052] 本発明によれば、複数のアプリケーションがデータ管理装置を介してデータにァク セスする際、アプリケーション同士が連携せずとも、オブジェクトに付与された付帯情 報を基に、必要となるデータにアクセスすることが可能となる。
[0053] また、本発明によれば、付帯情報をオブジェクトに付与することで、新たなアプリケ ーシヨンが導入された場合においても、過去に作成されたデータをデータ資産として 活用することが可能となる。
[0054] さらに、本発明によれば、付帯情報と付帯情報に関連付けられたデータ部分情報 を基に、付帯情報に関連する部分のみのデータを読み出しできることから、不要なデ ータの読み出し処理を削減することが可能となる。
図面の簡単な説明
[0055] [図 1]本発明の一実施の形態のシステム構成を示す図である。
[図 2]本発明の一実施の形態のデータ管理装置の内部構成を示す図である。
[図 3]本発明の一実施の形態のオブジェクトメタデータ記憶部に記憶されているメタ データの例を示す図である。
[図 4]本発明の一実施の形態におけるオブジェクト作成処理の動作を説明するフロー チャートである。
[図 5]本発明の一実施の形態におけるオブジェクトデータ更新処理の動作を説明す るフローチャートである。
[図 6]本発明の一実施の形態における付帯情報追加処理の動作を説明するフローチ ヤートでめる。
[図 7]本発明の一実施の形態におけるオブジェクト一覧取得処理の動作を説明する フローチャートである。
[図 8]本発明の一実施の形態におけるオブジェクトデータ読み出しの動作を説明する フローチャートである。 符号の説明
[0056] 1 データ管理装置
2 フアイノレサーバ
3 データベースサーバ
4 クライアント
101 メッセージ転送/解析部
102 オブジェクトメタデータ管理部
103 オブジェクトメタデータ記憶部
104 データ変換部
105 データアクセス部
200 テーブル(オブジェクト管理テーブル)
201 テーブル (付帯情報管理テーブル)
発明を実施するための最良の形態
[0057] 上記した本発明についてさらに詳細に説述すべぐ添付図面を参照して以下に説 明する。本発明は、オブジェクトのデータの内容の表現又は説明に用いられる付帯 情報(「ァノテーシヨン」とも!/、う)と、前記付帯情報がオブジェクトのどのデータ領域に
関連する付帯情報である力、を示すデータ部分情報とをオブジェクトを識別するォブジ エタ HDに関連付けて、前記オブジェクトのメタデータとして、前記オブジェクトデータ の格納先のリポジトリ(例えばファイル装置、データベース)とは別に、オブジェクトメタ データ記憶部(図 2の 103)で記憶管理する(図 3 (b)参照)。また、オブジェクトメタデ ータ記憶部(図 2の 103)では、前記オブジェクト IDに関連付けて、前記オブジェクト のデータ形式と前記オブジェクトのデータの格納先アドレス情報とを記憶管理する( 図 3 (a)参照)。
[0058] 本発明のデータ管理装置は、クライアントからの読み出し要求を受け、前記読み出 し要求で指定されたオブジェクト IDと付帯情報とから、オブジェクトメタデータ記憶部 を検索して、前記オブジェ外 IDに対応するデータ形式と前記付帯情報に関連する データ部分情報に対応したオブジェクトデータ読み出しコマンドを生成し、前記ォブ ジェタトのデータの格納先の記憶部に、前記オブジェクトデータ読み出しコマンドを送 信し、前記付帯情報に対応する、オブジェクトデータのデータ部分を、前記オブジェ タトのデータの格納先の記憶部から、選択的に読み出す。前記オブジェクトのデータ 形式として、例えばファイル形式とデータベース形式を含む。前記オブジェクトデータ 読み出しコマンドを生成する手段は、前記オブジェクトのデータ形式に応じてフアイ ルへの読み出し命令、又は、データベースへのデータ読み出し命令を生成する。
[0059] 本発明のデータ管理装置は、前記クライアントからオブジェクトの生成又は更新要 求を受け取ると、前記オブジェクトのデータ形式に応じて、オブジェクトの生成又は更 新コマンドを生成し、前記オブジェクトデータの格納先であるファイルサーバへ、ファ ィル作成又は更新命令を送信するか、あるいは、前記オブジェクトデータの格納先で あるデータベースサーバへ、テーブル作成又は更新命令を送信する、構成としてもよ い。
[0060] あるいは、本発明のデータ管理装置は、前記クライアントから付帯情報を追加する 要求を受け取ると、前記オブジェクトメタデータ記憶部に前記付帯情報と、追加され た前記付帯情報に該当するデータ部分情報を追加する、構成としてもよい。
[0061] あるいは、本発明のデータ管理装置は、前記クライアントからオブジェクト一覧要求 を受け取ると、前記要求で指定された付帯情報に合致するオブジェ外 IDを抽出し、
データ形式、付帯情報、データ部分情報を一覧で表示する、構成としてもよい。
[0062] このように、本発明によれば、ファイル、データベースといった異なるデータ格納手 段を持つデータストレージ装置を統合し、異種形式のデータを統合的に管理する装 置であって、格納されているデータをある意味を持つ情報として活用する際に、意味 とその意味に関連しているデータ領域の管理及びデータアクセス制御を行う。以下、 実施例に即して説明する。
実施例
[0063] 図 1は、本発明の一実施形態におけるシステム構成を示している。本実施の形態で は、少なくとも 1台以上のクライアント 4と、少なくとも 1台以上のファイルサーバ 2と、少 なくとも 1台以上のデータベースサーバ 3と、データ管理装置 1とを備えている。デー タ管理装置 1は、その機能から、「統合データ管理装置」とも呼ばれる。
[0064] クライアント 4は、データ管理装置 1を介して、ファイルサーバ 2及びデータベースサ ーバ 3に格納されているデータにアクセスする。
[0065] クライアント 4上には、データの作成やデータの読み出し等のデータ処理要求を発 行するアプリケーションが動作しており、クライアント 4は、アプリケーションからの要求 に応じて、データ管理装置 1にデータ処理要求を発行する。
[0066] 図 2は、図 1のデータ管理装置 1の構成を示している。データ管理装置 1は、メッセ ージ転送/解析部 101と、オブジェクトメタデータ管理部 102と、オブジェクトメタデー タ記憶部 103と、データ変換部 104と、データアクセス部 105とを備えている。
[0067] メッセージ転送/解析部 101は、クライアント 4から転送されるオブジェクトデータァ クセス要求の内容を解析し、処理要求に応じて、データ管理装置 1内の他のコンポ一 ネントへ処理を受け渡すと共に、他のコンポーネントからの処理結果を受けて、クライ アント 4に対して、該処理要求に対する応答を実行する。
[0068] オブジェクトメタデータ管理部 102は、オブジェクトデータに関連する、
•データ格納先のアドレス情報、
•データ格納先のデータ形式、
•データの内容を表す付帯情報、
等の、オブジェクトに関するメタデータを取り扱う。
[0069] そして、オブジェクトメタデータ管理部 102は、
メッセージ転送/解析部 101からの要求により、オブジェクトメタデータ記憶部 103 上に記憶されてレヽるメタデータの
'読み出し、
•更新、
•新規登録
といった処理を実行する。なお、オブジェクトメタデータ管理部 102の処理はその一 例を例示したものであり、力、かる処理にのみ制限されるものでないことは勿論である。
[0070] データ変換部 104は、メッセージ転送/解析部 101からの要求により、ファイルサ ーバ 2や、データベースサーバ 3が実装して!/、るデータアクセス用コマンドを生成し、 データアクセス要求をデータアクセス部 105へ転送する。
[0071] また、データ変換部 104は、データアクセス部 105から送信される応答データから、 オブジェクトデータ、コマンドの実行ステータス等の情報を抽出して、メッセージ転送
/解析部 101へ転送する。
[0072] データアクセス部 105は、図 1のファイルサーバ 2、又はデータベースサーバ 3が実 装している通信プロトコルを用い、データ変換部 104から指定されたデータアクセス 用コマンドを転送する。
[0073] また、データアクセス部 105は、ファイルサーバ 2又はデータベースサーバ 3からの 応答データを、データ変換部 104へ転送する。処理を実行するに当たり、データァク セス部 105では、ファイルサーバ 2やデータベースサーバ 3の IPアドレス、サーバ名、 ログインアカウントの管理を行い、データ管理装置 1とファイルサーバ 2と、データべ一 スサーバ 3の接続を実行する。
[0074] <オブジェクトのメタデータの構成〉
特に制限されないが、本実施例において、データ管理装置 1のオブジェクトメタデ ータ記憶部 103に記憶されるオブジェクトメタデータは、次のようなデータにより構成 される。
[0075] (A)オブジェクト D 情報:
オブジェクト IDは、データ管理装置 1を介して格納されるオブジェクトデータを一意 に識別するために用いられる。オブジェクト IDは、オブジェクトが新規に作成される際 に付与される。
[0076] (B)データ形式情報:
オブジェクトのデータ形式を示すデータであり、データ管理装置 1に接続しているデ 一タストレージのデータの格納手段によって決定される。
[0077] 本実施形態においては、ファイルサーバ 2及びデータベースサーバ 3の 2種類のス トレージサーバが接続しているため、データ形式は、ファイルとデータベースの 2種類 となる。
[0078] また、ファイル、データベースの形式を補足する情報として、
•ファイルであれば、ファイルの種別を表すテキスト、画像、音声、動画といったファ ィルの種別を表すデータ、
•データベースであれば、オブジェクトを構成するテーブル群のカラムと、カラム内の データ形式、
が含まれる。
[0079] (C)データ格納先アドレス情報:
オブジェクトデータの格納先のアドレス情報を示すデータである。オブジェクトデー タの格納先がファイルサーバ 2である場合は、オブジェクトを構成するファイルのパス 情報が含まれる。オブジェクトデータの格納先がデータベースサーバ 3である場合は
、オブジェクトを構成するデータベース名、テーブル名が含まれる。
[0080] (D)付帯情報:
オブジェクトデータの内容を判別するために、データの内容をキーワード等により表 現した情報である。付帯情報は、オブジェクトデータ内の一部のデータに対して付与 してもよい。したがって、動画のようなストリーム型のデータに対しても、ストリームから の切り出した一部分のデータに対して、付帯情報を付与することが可能である。また 、データベースに対しても、オブジェクトとして定義されているデータの一部分に対し て、そのデータの内容を判別するために、データを補足する情報を付与することが可 能である。前記付帯情報は、分類の異なる同名、もしくは同値の付帯情報を区別する
ために、付帯情報の分類を表す付帯情報分類名を含む。
[0081] (E)付帯情報に該当するデータ部分情報:
付帯情報は、オブジェクトデータの一部に対して付与することが可能である。
[0082] データ部分情報は、付帯情報が該当するデータの位置を示す情報である。フアイ ルデータであれば、一般に、オフセットバイトとバイトレンジで示されたデータ部分情 報が付与される。
[0083] ストリーム型の動画ファイルであれば、前記オフセットバイトとバイトレンジを、オフセ ット時間(又はフレーム)と、オフセットからの経過時間(フレーム数)と!/、う形で部分情 報を表現してもよい。
[0084] またデータベースであれば、 SQL (Structured Query Language)のクエリで 表現することにより、一部のデータを指定することができる。
[0085] なお、オブジェクトデータ全体に対して、付帯情報を関連付ける場合には、その付 帯情報に対して、データ部分情報を付与しなければ、オブジェクトデータ全体に対す る付帯情報となる。
[0086] 図 3は、前記 (A)〜(E)のオブジェクトのメタデータをオブジェクトメタデータ記憶部 ( 図 2の 103)にテーブル形式で記憶管理する際のフォーマットの一例を模式的に示し たものである。図 3 (a)のテーブル(「オブジェクト管理テーブル」ともいう) 200は、前 記(A)〜(C)のデータを管理するテーブルである。テーブル 200は、オブジェクト ID 情報と、データ形式情報と、データ形式補足情報と、データ格納先アドレス情報を一 エントリあたり有する。図 3 (a)では、オブジェクト IDが XXXXXXXのオブジェクトは FI LEであり、データ形式補足情報は video/avi (ビデオファイル/オーディオファイル )、格納先アドレスは、 ¥ ¥ ServerA¥DirA¥FileA、オブジェクト IDが YYYYYY Yのオブジェクトは DBであり、データ形式補足情報は(Keylは Int、 Key2は Char( 文字型)、 Key3は Int (整数)であり、格納先は、 ¥ ¥NodeA¥DBA¥TableAであ
[0087] 図 3 (b)のテーブル 201は、前記(D)、(E)のデータを管理するテーブル(「付帯情 報管理テーブル」ともいう)であり、オブジェクトメタデータ記憶部 (図 2の 103)にテー ブル形式で記憶管理される。付帯情報分類名と、付帯情報と、データ部分情報と、ォ
ブジェクト IDを含む。付帯情報分類名 KeyAは、付帯情報として ValueAを有し、デ ータ部分情報は「0、 100」であり、オブジェクト IDは XXXXXXXである。このオブジェ タトはデータ形式が FILEであり、付帯情報 ValueAのデータ部分情報はオフセット 0 、長さ 100である。次の付帯情報分類名 KeyAは付帯情報として ValueBを有し、デ ータ部分情報は「50、 120」であり、オブジェクト IDは XXXXXXXである。このォブジ ェクトは、データ形式が FILEであり、付帯情報 ValueBのデータ部分情報はオフセッ ト 50、長さ 120である。付帯情報分類名 KeyBは付帯情報として ValueCを有し、デ ータ部分情報は、「Select Keyl , Key2 From TableA Where Key2 = B」で あり、オブジェクト IDは YYYYYYYであり、このオブジェクトは、データ形式が DBで ある。付帯情報 ValueCのデータ部分情報は、 SQL文 Select Keyl , Key2 Fro m TableA Where Key2 = Bによってデータベースのテープノレ TableAから取得 される。なお、オブジェクト IDの管理、データ形式、オブジェクトデータの格納先アド レス、付帯情報、データ部分情報の管理形態は、図 3に示したテーブル 200、 201の 構成、及びフォーマットに限定されるものでないことは勿論である。
[0088] <オブジェクトの作成及びオブジェクトデータの更新手順〉
クライアント 4からの要求により、データ管理装置 1を介してオブジェクトを作成する 手順を、図 4と図 5のフローチャートを使って以下に説明する。まず、図 4には、ォブジ ェクト作成処理の手順が示されている。図 5には、オブジェクト更新処理の手順が示さ れている。
[0089] 本実施形態においては、前提として、オブジェクトを作成するすべてのクライアント は、予め統一された動画形式、画像形式、音声形式に基づいたデータから、ォブジ ェクトを作成するものとする。
[0090] まず、クライアント 4が、データ形式と作成するオブジェクトデータ全体を表す付帯情 報を指定して、データ管理装置 1に、オブジェクト作成要求を送信する。なお、クライ アント 4からのすベての処理要求は、メッセージ転送/解析部 101にて、処理要求の 解析が行われる。
[0091] メッセージ転送/解析部 101は、
受け取ったオブジェ外作成要求の中から、データ形式情報、付帯情報を抽出し、
オブジェクトメタデータ管理部 102に、前記情報 (データ形式情報、付帯情報)とォ ブジエ外作成要求を送信する。
[0092] オブジェクトメタデータ管理部 102は、
付帯情報と現在時刻を組み合わせたデータからのハッシュ値を、オブジェクト IDと して生成し、オブジェクトを格納するデータ格納先アドレスを決定し(図 4のステップ S 100)、
オブジェクトメタデータ記憶部 103に、オブジェクト ro情報、データ形式情報、付帯 情報、データ格納先アドレス情報を関連付けて格納する(図 4のステップ S101)、 メッセージ転送/解析部 101に、オブジェクト m情報と、データ格納先アドレス情報 を転送する。
[0093] メッセージ転送/解析部 101は、
オブジェクトメタデータ管理部 102から受け取ったオブジェクト ro情報を基に、デー タ変換部 104に対して、オブジェクト ro情報、データ格納先アドレス情報、データ形 式情報を付与したオブジェクト作成要求を転送する。
[0094] データ変換部 104は、
メッセージ転送/解析部 101から受け取った情報 (オブジェクト ro情報、データ格 納先アドレス情報、データ形式情報を付与したオブジェクト作成要求)を基に、指定さ れたデータ形式に対応したオブジェクト作成コマンドを作成し(図 4のステップ S102) 作成したオブジェクト作成コマンドをデータアクセス部 105に対して転送する。
[0095] このオブジェクト作成コマンドは、
•データ形式がファイルである場合には、オブジェクト IDをファイル名とするファイル 作成コマンド、
•データ形式がデータベースである場合には、データ形式情報内に含まれるデータ ベースの構成情報に基づき、オブジェクト IDをテーブル名とするテーブル作成コマン ド、、
に変換される。
[0096] データアクセス部 105は、データ変換部 104からのオブジェクト作成コマンドに基づ
き(図 4のステップ S103)、
'オブジェクトがファイルであれば、ファイルサーバ 2へファイル作成コマンド(命令) を転送し(図 4のステップ S104)、
•オブジェクトがデータベースであれば、データベースサーバ 3へテープノレ作成コマ ンド (命令)を転送する(図 4のステップ S105)。
[0097] ファイルサーバ 2又はデータベースサーバ 3からデータアクセス部 105に対して、ォ ブジェクト作成処理が成功したことを示す応答データ力 S、返送されると、データァクセ ス部 105は、データ変換部 104に、ファイル又はテーブルの作成要求が成功したこと を通知する(図 4のステップ S 106)。
[0098] また、データ変換部 104は、同様にして、メッセージ転送/解析部 101に対してォ ブジェクト作成要求が成功したことを通知する。
[0099] メッセージ転送/解析部 101は、
データ変換部 104からオブジェクト作成要求が成功したことを受け、
クライアント 4に対して、オブジェクト IDと共に、オブジェクト作成要求が成功したこと を通知する。
[0100] クライアント 4は、
メッセージ転送/解析部 101からオブジェクト作成要求が成功したことを受け、 オブジェクトデータ更新要求をオブジェクト ID、データ形式、オブジェクトデータ、デ ータの更新位置情報を付与して、メッセージ転送/解析部 101へ送信する。なお、 データの更新位置情報には、データ形式がファイルであれば、オフセットバイトとバイ トレンジ情報、データ形式がデータベースであれば SQLクエリ情報が含まれる。
[0101] メッセージ転送/解析部 101は、
クライアント 4から受け取ったオブジェクトデータ更新要求から、オブジェクト IDとォ ブジェクトデータを抽出し、
オブジェクトメタデータ管理部 102に対して、オブジェクト IDをキーとしたデータ格 納先アドレス情報とデータ形式情報の抽出要求を転送する。
[0102] オブジェクトメタデータ管理部 102は、
該抽出要求を基に、オブジェクトメタデータ記憶部 103から、該当するオブジェクト I
Dに関連する情報の中から、データ格納先アドレス情報とデータ形式情報を抽出し( 図 5のステップ S200)、
抽出したデータ格納先アドレス情報とデータ形式情報を、メッセージ転送/解析部 101に転送する。
[0103] なお、該抽出処理の際、オブジェクトメタデータ管理部 102は、オブジェクトメタデー タ記憶部 103から抽出されたデータ形式情報と、クライアント 4から転送されたデータ 形式情報が異なっているか確認し(図 5のステップ S201)、
異なっていた場合においては、データ変換部 104へ処理エラーを返し、メッセージ 解析/転送部 101からクライアント 4へ処理エラー応答が送信される(図 5のステップ S203)。
[0104] メッセージ転送/解析部 101は、
オブジェクトメタデータ管理部 102から転送されたデータ格納先アドレス情報及び データ形式情報と、クライアント 4から転送されたオブジェクトデータ及びデータの更 新位置情報を、オブジェクトデータ更新要求と共に、データ変換部 104へ転送する。
[0105] データ変換部 104は、
メッセージ転送/解析部 101からの要求を基に、オブジェクト作成要求と同様にし て、データアクセス部 105に対して、与えられたデータ形式に基づぐオブジェクト更 新コマンドに変換し(図 5のステップ S202)、
データアクセス部 105に、オブジェクトデータを付与したオブジェクト更新コマンドを 転送する。
[0106] データアクセス部 105は、
データ変換部 104からのオブジェクト更新要求に基づき、オブジェクト作成要求の 場合と同様にして、ファイルサーバ 2又はデータベースサーバ 3に前記更新コマンド とオブジェクトデータを転送する(図 5のステップ S204〜S206)。
[0107] 以下、ファイルサーバ 2及びデータベースサーバ 3からの更新要求が成功したこと を示す応答データの処理方法は、前述したオブジェクト作成要求の場合と同様に、 データアクセス部 105、データ変換部 104、メッセージ転送/解析部 101と応答デー タが受け渡され、メッセージ転送/解析部 101からクライアント 4にオブジェクトデータ
の更新要求が成功したことが通知される(図 5のステップ S207)。
[0108] <付帯情報の追加手順〉
本実施例において、既に作成されたオブジェクトに対して、新たに付帯情報を追加 するための手順を以下に説明する。図 6は、付帯情報追加処理の手順を示すフロー チャートである。
[0109] 特に制限されないが、本実施例では、付帯情報は、
•クライアント 4上で稼動するアプリケーション自身がデータを解析することによって 導き出すか、又は、
•クライアント 4を操作する一般ユーザ自身がオブジェクトの内容から導き出すことに よって生成される、ものとする。
[0110] まず、クライアント 4は、
'付帯情報を追加したレ、オブジェクト IDと、
•データ形式情報、
•付帯情報、
•付帯情報に該当するデータ部分情報
を付与した、付帯情報追加要求をデータ管理装置 1へ転送する。
[0111] メッセージ転送/解析部 101は、
クライアント 4より受信した付帯情報追加要求から、オブジェクト ID、データ形式情報 、付帯情報、付帯情報に該当するデータ部分情報を抽出し、
オブジェクトメタデータ管理部 102に対して、前記各情報と、付帯情報追加要求を 送信する。
[0112] オブジェクトメタデータ管理部 102は、
メッセージ転送/解析部 101から受け取った情報の中から、オブジェクト IDをキー として、オブジェクトメタデータ記憶部 103から、該当するオブジェクトのメタデータを 抽出し(図 6のステップ S300)、
メッセージ転送/解析部 101から受け取った情報に含まれるデータ形式情報と、ォ ブジェクトメタデータ記憶部 103に登録されて!/、るデータ形式情報と照合し、データ 形式が一致していることを確認する(図 6のステップ S301)。
[0113] 照合の結果、メッセージ転送/解析部 101から受け取った情報に含まれるデータ 形式情報と、オブジェクトメタデータ記憶部 103に登録されて!/、るデータ形式情報の データ形式が一致していな力、つた場合、付帯情報の登録エラーとなり、メッセージ転 送/解析部 101を介して、クライアント 4に登録エラーが通知される(図 6のステップ S 303)。
[0114] クライアント 4指定のデータ形式情報とオブジェクトメタデータ記憶部 103に登録さ れているデータ形式情報が一致しており、且つ、
そのデータ形式が、ファイル、且つ、ストリーム型のデータ形式であり(図 6のステツ プ S302の Yes)、さらに、
付帯情報に該当するデータ領域付帯情報が、オフセット時間(フレーム)とオフセッ トからの経過時間(フレーム数)と!/、う形で指定されてレ、る力、確認し(S304)、 前記各条件を満たす場合、
オブジェクトメタデータ管理部 102は、
メッセージ転送/解析部 101へ、
オフセット時間と、オフセットからの経過時間に該当するオフセットバイトとバイトレン ジが必要であることを、オブジェクト格納先のアドレス情報、データ形式と共に通知す
[0115] メッセージ転送/解析部 101は、
オブジェクトメタデータ管理部 102から通知されたオブジェクト格納先のアドレス情 報、オフセット時間とオフセットからの経過時間と共に、オフセットバイトとバイトレンジ 取得要求を、データ変換部 104へ送信する。
[0116] データ変換部 104は、
メッセージ転送/解析部 101から送信されたオブジェクト格納先のアドレス情報から 、ファイルサーバ 2へのデータ読み出しコマンドを生成し、データ読み出しコマンドを データアクセス部 105に転送し、
データアクセス部 105を介して、データ読み出しコマンドをファイルサーバ 2で実行 し、ファイルサーバ 2からフアイノレデータを取得する。
[0117] さらに、データ変換部 104は、
取得したファイルデータとファイル形式から、ストリーム型データを展開し、 オフセット時間(フレーム)とオフセットからの経過時間(フレーム数)に該当する、ォ フセットバイトとバイトレンジを解析し(図 6のステップ S305)
メッセージ転送/解析部 101 解析した情報を転送する。なお、オフセットバイト とバイトレンジは、ワード単位のオフセットとレンジであってもよ!/、。
[0118] メッセージ転送/解析部 101は、取得したオフセットバイトとバイトレンジをオブジェ タトメタデータ管理部 102 転送する。
[0119] オブジェクトメタデータ管理部 102は、
付帯情報の追加指定されたオブジェクト IDのオブジェクトメタデータ内に、 •追加指定された付帯情報と、
•オフセットバイトとバイトレンジをデータとして持つ付帯情報に該当するデータ部分 情報を、
オブジェクトメタデータ記憶部 103に保存し、メッセージ転送/解析部 101に、追加 要求が成功したことを通知する。
[0120] メッセージ転送/解析部 101は、オブジェクトメタデータ管理部 102からの追加要 求成功の応答を受けて、クライアント 4 応答結果を通知する(図 6のステップ S306)
[0121] ·クライアント 4指定のデータ形式情報とオブジェクトメタデータ記憶部 103に登録さ れているデータ形式情報が一致しており、且つ、
'そのデータ形式力 S、ファイル且つストリーム型のデータ形式でない場合、 オブジェクトメタデータ管理部 102は、
付帯情報の追加指定されたオブジェクト IDのオブジェクトメタデータ内に、追加指 定された付帯情報と付帯情報に該当するデータ部分情報をオブジェクトメタデータ記 憶部 103に保存し、
メッセージ転送/解析部 101に、前記追加要求が成功したことを通知する。
[0122] メッセージ転送/解析部 101は、オブジェクトメタデータ管理部 102からの追加要 求成功の応答を受けて、クライアント 4 応答結果を通知する(図 6のステップ S306)
[0123] <オブジェクトの読み出し手順〉
次に、本実施例において、既に作成されたオブジェクト群の中から、付帯情報を用 いてクライアント 4が要求するオブジェクトを抽出し、付帯情報に関連しているォブジ ェクトデータをのみを読み出すための手順について説明する。図 7は、オブジェクト一 覧取得の手順を示すフローチャートである。図 8は、オブジェクトの読み出し手順を示 すフローチャートである。
[0124] まず、クライアント 4は、データ管理装置 1に対して、自身が読み出したいオブジェク トデータに関連する付帯情報とともに、オブジェ外一覧取得要求を送信する。
[0125] メッセージ転送/解析部 101は、
クライアント 4から受信したオブジェクト一覧取得要求に含まれる付帯情報を抽出し オブジェクトメタデータ管理部 102へ、抽出した付帯情報とオブジェクト一覧取得要 求を达る。
[0126] オブジェクトメタデータ管理部 102は、
オブジェクトメタデータ記憶部 103から、前記付帯情報と一致する付帯情報をもつ すべてのオブジェクト IDを抽出し(図 7のステップ S400)、データ形式情報、前記ォ ブジエタトに関連付けられているすべての付帯情報、付帯情報に関連するデータ部 分情報と共に、メッセージ転送/解析部 101へ転送する。
[0127] メッセージ転送/解析部 101は、
オブジェクトメタデータ管理部 102から転送された情報 (オブジェクト 、データ形 式情報、前記オブジェクトに関連付けられているすべての付帯情報、付帯情報に関 連するデータ部分情報)を、オブジェ外 ID毎に、データ形式情報、付帯情報、付帯 情報に関連するデータ部分情報をリスト化して、クライアント 4へ返答する(図 7のステ ップ S401)。
[0128] クライアント 4は、
メッセージ転送/解析部 101から転送された、オブジェクト IDに関するリスト上の情 報を基に、データを取得するオブジェクトを選択し、
データ管理装置 1へ、オブジェクト 、データ形式情報、付帯情報を付与したデー
タ読み出し要求を送信する。
[0129] メッセージ転送/解析部 101は、クライアント 4から受信したオブジェクト読み出し要 求に含まれるオブジェクト ID、データ形式情報、
付帯情報を抽出し(S500)、オブジェクトメタデータ管理部 102へ、抽出したオブジェ タト IDとデータ形式情報とともに、オブジェクトメタデータ取得要求を送る。
[0130] オブジェクトメタデータ管理部 102は、オブジェクトメタデータ記憶部 103から、前記 オブジェクト IDと一致するオブジェクトメタデータを抽出し、抽出したデータ形式情報 と、メッセージ転送/解析部 101から受け取ったデータ形式情報を照合し、データ形 式が一致して!/、ることを確認する(図 8のステップ S 501 )。
[0131] 照合の結果、メッセージ転送/解析部 101から受け取った情報に含まれるデータ 形式情報と、オブジェクトメタデータ記憶部 103に登録されて!/、るデータ形式情報の データ形式が一致していな力、つた場合、付帯情報の登録エラーとなり、メッセージ転 送/解析部 101を介して、クライアント 4に処理エラーが通知される(図 8のステップ S 503)。
[0132] クライアント 4指定のデータ形式情報とオブジェクトメタデータ記憶部 103に登録さ れているデータ形式情報が一致していた場合、オブジェクトメタデータ管理部 102は 、メッセージ転送/解析部 101から指定されたオブジェクト ID、及び付帯情報に該当 するメタデータとして、データ格納先情報と、付帯情報に関連するデータ部分情報を 、メッセージ転送/解析部 101へ転送する。
[0133] メッセージ転送/解析部 101は、オブジェクト格納先アドレス情報、データ形式情報 、付帯情報に関連するデータ部分情報と共にオブジェ外データ読み出し要求をデ ータ変換部 104へ転送する。
[0134] データ変換部 104は、
メッセージ転送/解析部 101から転送されたデータ形式情報、及びデータ格納先 アドレス情報、付帯情報に関連するデータ部分情報を基に、オブジェクトの格納先で あるファイルサーバ 2、又はデータベースサーバ 3用のデータ読み出しコマンドを生 成し(図 8のステップ S502)、生成したデータ読み出しコマンドをデータアクセス部 10 5へ転送する。
[0135] データ読み出しコマンドは、データ形式がファイルであれば、データ格納先アドレス 情報であるファイルのパス名と、付帯情報に関連するデータ部分情報であるオフセッ トバイトとバイトレンジに基づくファイルの読み出し要求となる。
[0136] また、データ読み出しコマンドは、データ形式がデータベースであれば、データ格 納先アドレス情報であるテーブル名と、付帯情報に関連するデータ部分情報である S QLクエリに基づぐデータベースの読み出し要求となる。
[0137] データアクセス部 105は、データ変換部 104からのデータ読み出しコマンドに基づ いてコマンドの転送先を決定し(図 8のステップ S504)、ファイルサーバ 2、もしくはデ ータベースサーバ 3へデータ読み出し要求を送信する(図 8のステップ S505、 S506 )。
[0138] 前記データ読み出し要求を元に、ファイルサーバ 2又はデータベースサーバ 3から 返送されたオブジェクトデータは、データアクセス部 105、データ変換部 104、メッセ ージ転送/解析部 101を介して、付帯情報に関連するオブジェクトデータの一部の みがクライアント 4に送信される(図 8のステップ S507)。
[0139] なお、クライアント 4からの読み出し要求時に指定される付帯情報のうち、データ管 理装置 1にて前記付帯情報に関連するデータ部分情報が登録されていない場合に おいては、オブジェクトデータ全体がクライアント 4へ送信されることになる。
[0140] 本発明によれば、オブジェクトの作成者、又は作成アプリケーションが作成したォブ ジェタトに対して、オブジェクトデータの内容を分析するアプリケーションや、ユーザが オブジェクトの作成者、又は作成アプリケーションが作成したオブジェクトに依存せず に、データの内容を表す付帯情報を分析アプリケーションや、ユーザ自身が指定した データ領域に対して自由に付与することが可能となり、複数の分析視点からオブジェ タトデータを抽出、活用することが可能となり、統合データ管理基盤を介して様々なァ プリケーシヨンが異種ストレージシステムに格納されているデータを活用できるように なる。
[0141] また、オブジェクト単位ではなぐ付帯情報に関連するデータ領域単位でオブジェク トデータを抽出、活用することが可能であることから、巨大なデータサイズのオブジェ タトであっても、アプリケーションが必要とする最小限のデータ部分のみを提供するこ
と力 Sできる。
[0142] このため、データ活用を行うアプリケーションにおけるデータ処理の効率化と高速化 が見込める。
[0143] 以上、本発明を上記実施例に即して説明したが、本発明は上記実施例の構成にの み制限されるものでなく、本発明の範囲内で当業者であればなし得るであろう各種変 形、修正を含むことは勿論である。
本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思 想に基づいて、実施形態ないし実施例の変更'調整が可能である。また、本発明の 請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可 能である。