JP7472078B2

JP7472078B2 - データ仮想化装置及び方法

Info

Publication number: JP7472078B2
Application number: JP2021085266A
Authority: JP
Inventors: 基孝金松
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2021-05-20
Filing date: 2021-05-20
Publication date: 2024-04-22
Anticipated expiration: 2041-05-20
Also published as: JP2022178453A; US11847102B2; US20220374400A1

Description

本発明の実施形態は、データ仮想化装置及び方法に関する。

近年では、複数のデータソースに散在する実データを複製することなく仮想的に統合し、
例えばビジネス等の分野で活用することができるデータを提供するデータ仮想化（データ統合ソリューション）という技術が知られている。

このようなデータ仮想化を実現するデータ仮想化装置においては、各データソースにおいて実データとして管理されているテーブルの構造（当該テーブルのテーブル名及び当該テーブルを構成するカラムのカラム名等）が定義されたスキーマ情報に基づいて、当該実データを保持しない仮想化テーブル（外部テーブル）が作成される。これにより、ユーザは、データ仮想化装置において作成された仮想化テーブルを介して、各データソースにおいて管理されているテーブルを区別することなく、当該テーブルにアクセスすることができる。

しかしながら、上記した複数のデータソースの各々において管理されているテーブルで同一の種類のデータが扱われている場合において、当該テーブルのテーブル名等が異なる表記で定義されている場合、当該テーブルに対して効率的にアクセスすることができない場合がある。

特許第６５２３８２３号公報

そこで、本発明が解決しようとする課題は、複数のデータソースにおいて管理されているテーブルに対する効率的なアクセスを実現することが可能なデータ仮想化装置及び方法を提供することにある。

実施形態によれば、第１及び第２データソースと接続され、格納手段を有するデータ仮想化装置が提供される。前記データ仮想化装置は、取得手段と、第１変換手段と、登録手段とを具備する。前記取得手段は、前記第１データソースにおいて管理されている第１ソーステーブルの第１テーブル名を含む第１スキーマ情報と、前記第２データソースにおいて管理されている第２ソーステーブルの第２テーブル名を含む第２スキーマ情報とを取得する。前記第１変換手段は、前記取得された第１スキーマ情報に含まれる第１テーブル名を第３テーブル名に変換し、前記取得された第２スキーマ情報に含まれる第２テーブル名を第３テーブル名に変換する。前記登録手段は、前記第１ソーステーブルに対応する第１外部テーブルを作成するために、前記第１テーブル名及び当該第１テーブル名から変換された第３テーブル名を対応づけて含む第１テーブル対応情報を前記格納手段に登録し、前記第２ソーステーブルに対応する第２外部テーブルを作成するために、前記第２テーブル名及び当該第２テーブル名から変換された第３テーブル名を対応づけて含む第２テーブル対応情報を前記格納手段に登録する。

第１実施形態におけるデータ仮想化システムのネットワーク構成の一例を示す図。データ仮想化装置のハードウェア構成の一例を示す図。本実施形態の比較例に係るデータ仮想化装置の機能構成の一例を示す図。外部テーブルを作成する際のデータ仮想化装置の動作の概要を示す図。外部テーブルを介してデータを取得する際のデータ仮想化装置の動作の概要を示す図。本実施形態に係るデータ仮想化装置の機能構成の一例を示すブロック図。外部テーブルを作成する際のデータ仮想化装置の動作の概要を説明するための図。外部テーブルを作成する際のデータ仮想化装置の処理手順の一例を示すフローチャート。変換処理の処理手順の一例を示すフローチャート。データ仮想化装置において作成される外部テーブルの具体例を示す図。データ仮想化装置の使用態様の一例について説明するための図。データ仮想化装置の使用態様の一例について説明するための図。データ仮想化装置の使用態様の一例について説明するための図。第２実施形態に係るデータ仮想化装置が有するマルチテナント機能について説明するための図。本実施形態に係るデータ仮想化装置の機能構成の一例を示すブロック図。マルチテナントテーブルを作成する際のデータ仮想化装置の動作の概要を説明するための図。マルチテナントテーブルを作成する際のデータ仮想化装置の処理手順の一例を示すフローチャート。本実施形態の作用効果を説明するための図。本実施形態の作用効果を説明するための図。第３実施形態に係るデータ仮想化装置の機能構成の一例を示すブロック図。データ取得クエリに含まれるテーブル名及びカラム名を変換する際のデータ仮想化装置の動作の概要を説明するための図。クライアント端末においてデータ取得クエリが指定された際のデータ仮想化装置の処理手順の一例を示すフローチャート。本実施形態の作用効果について説明するための図。第４実施形態に係るデータ仮想化装置の機能構成の一例を示すブロック図。マルチテナントテーブルを作成する際のデータ仮想化装置の動作の概要を説明するための図。マルチテナントテーブルを作成する際のデータ仮想化装置の処理手順の一例を示すフローチャート。マルチテナントテーブルを作成する際のデータ仮想化装置の処理手順の一例を示すフローチャート。マルチテナントテーブルを作成する際のデータ仮想化装置の処理手順の一例を示すフローチャート。本実施形態の作用効果を説明するための図。本実施形態の作用効果を説明するための図。第５実施形態に係るテーブル仮想化装置の機能構成の一例を示すブロック図。類語辞書を作成する際のデータ仮想化装置の動作の概要を説明するための図。類語辞書を作成する際のデータ仮想化装置の処理手順の一例を示すフローチャート。

以下、図面を参照して、各実施形態について説明する。
（第１実施形態）
図１は、第１実施形態におけるデータ仮想化システムのネットワーク構成の一例を示す。図１に示すように、データ仮想化システム１は、複数のデータソース１０、クライアント端末２０及びデータ仮想化装置３０を備える。

本実施形態において、複数のデータソース１０は、データ仮想化装置３０と通信可能に接続されている。また、クライアント端末２０は、データ仮想化装置３０と通信可能に接続されている。

複数のデータソース１０の各々は、例えばＩｏＴ（Internet of Things）技術において収集されたデータ（実データ）を保持する各種テーブルを管理するデータベース管理システム（データベース管理サーバ）に相当する。なお、データソース１０は、実データ（データファイル）自体を意味していてもよい。

クライアント端末２０は、ユーザによって使用される端末装置であり、パーソナルコンピュータ等の電子機器によって実現される。ユーザは、クライアント端末２０を操作することによって様々なクエリ（問い合わせ）を指定することができる。なお、クライアント端末２０においてユーザによって指定されるクエリは、例えばＳＱＬ（Structured Query Language）で記述された命令文（ＳＱＬ文）等である。例えばクライアント端末２０において特定のデータソース１０において管理されているテーブルに保持されているデータを取得（検索）するためのクエリ（以下、データ取得クエリと表記）が指定された場合、クライアント端末２０は、当該データ取得クエリに基づいてデータ仮想化装置３０が当該データソース１０から取得したデータをユーザに対して提示（表示）する。

データ仮想化装置３０は、複数のデータソース１０の各々において管理されているテーブル（以下、ソーステーブルと表記）に対応する外部テーブル（仮想化テーブル）を作成し、当該外部テーブルを介してユーザに対してデータを提供するデータ仮想化を実現するための情報処理装置である。本実施形態において、外部テーブルは、データソース１０において管理されているソーステーブルをデータ仮想化層で管理し、当該ソーステーブルを自テーブルとしてクライアント端末２０にアクセスさせる（つまり、当該ソーステーブルが自身のテーブルであるかのように振る舞う）機能を実現する。

なお、データ仮想化装置３０においては、上記した複数のデータソース１０の各々において管理されているソーステーブルに保持されている実データを当該データソース１０から複製して保持する必要はない。上記したようにクライアント端末２０においてデータ取得クエリが指定された場合、データ仮想化装置３０は、外部テーブルを参照して当該データ取得クエリに基づいて取得されるべきデータ（を保持するソーステーブル）を管理しているデータソース１０を特定し、当該データソース１０から取得されたデータをクライアント端末２０に返す（つまり、ユーザに提供する）ように動作する。

また、データ仮想化装置３０は複数のデータソース１０の各々と接続されるが、クライアント端末２０において指定されたデータ取得クエリは、例えば当該データ仮想化装置３０上で動作する所定のプラグインによって当該データソース１０向けに変更される。これにより、データ仮想化装置３０は、仕様が異なる複数のデータソース１０と接続されている場合であっても、当該データソース１０間の差異を吸収して、当該データソース１０の各々からユーザによって指定されたデータ取得クエリに基づく適切なデータを取得することができる。

図２は、図１に示すデータ仮想化装置３０のハードウェア構成の一例を示す。図２に示すように、データ仮想化装置３０は、ＣＰＵ３１、不揮発性メモリ３２、主メモリ３３及び通信デバイス３４等を備える。

ＣＰＵ３１は、データ仮想化装置３０内の各コンポーネントの動作を制御するプロセッサである。ＣＰＵ３１は、ストレージデバイスである不揮発性メモリ３２から主メモリ３３にロードされる様々なプログラムを実行する。このプログラムには、オペレーティングシステム（ＯＳ）及びデータ仮想化装置３０がデータ仮想化システム１において動作するためのプログラム等が含まれる。

通信デバイス３４は、複数のデータソース１０及びクライアント端末２０等と有線または無線による通信を実行するように構成されたデバイスである。

図２においてはＣＰＵ３１、不揮発性メモリ３２、主メモリ３３及び通信デバイス３４のみが示されているが、データ仮想化装置３０は、例えばＨＤＤ（Hard Disk Drive）及びＳＳＤ（Solid State Drive）のような他の記憶装置等を更に備えていてもよいし、他のデバイスを更に備えていてもよい。

以下、本実施形態に係るデータ仮想化装置について説明する前に、本実施形態の比較例に係るデータ仮想化装置について説明する。

図３は、本実施形態の比較例に係るデータ仮想化装置の機能構成の一例を示すブロック図である。図３に示すようにデータ仮想化装置３０´は、格納部３０１´、インタフェース部３０２´、クエリ解析部３０３´、クエリプラン作成部３０４´、クエリ実行部３０５´、クエリ分割部３０６´、スキーマ情報取得部３０７´及び外部テーブル情報登録部３０８´を含む。

なお、本実施形態の比較例に係るデータ仮想化装置３０´は、上記した図１において説明した本実施形態に係るデータ仮想化装置３０と同様に、複数のデータソース１０及びクライアント端末２０と通信可能に接続されているものとする。

格納部３０１´は例えばシステムカタログ等と称され、当該格納部３０１´には、複数のデータソース１０の各々において管理されているソーステーブルに対応する外部テーブルに関する情報（以下、外部テーブル情報と表記）が格納されている。また、格納部３０１´には、複数のデータソース１０の各々に関する情報（以下、データソース情報と表記）が更に格納されている。なお、データソース情報には、例えばデータソース１０において管理されているソーステーブルのテーブル名及び当該データソース１０にアクセスするために用いられるアクセス情報等が含まれる。アクセス情報には、データソース１０のデータソース名（サーバ名）及び当該データソース１０に割り当てられているアドレス等が含まれる。

上記したようにクライアント端末２０においてデータ取得クエリが指定された場合、インタフェース部３０２´は、当該データ取得クエリを当該クライアント端末２０から取得（入力）する。

クエリ解析部３０３´は、インタフェース部３０２´によって取得されたデータ取得クエリを解析し、当該データ取得クエリの正当性を確認する。データ取得クエリの正当性が確認されると、クエリ解析部３０３´は、当該データ取得クエリに対する処理を判別する。

クエリプラン作成部３０４´は、クエリ解析部３０３´によるデータ取得クエリに対する処理の判別結果に基づいて、当該データ取得クエリを効率的に実行するための当該クエリの実行プランを作成する。

なお、上記したクエリ解析部３０３´及びクエリプラン作成部３０４´の処理は、格納部３０１´に格納されている外部テーブル情報を参照して実行される。

クエリ実行部３０５´は、クエリプラン作成部３０４´によって作成された実行プランに従ってデータ取得クエリを実行する。

データ仮想化装置３０´は例えば仕様の異なる複数のデータソース１０と接続されているため、クエリ分割部３０６´は、クエリ実行部３０５´によって実行されたデータ取得クエリを、当該複数のデータソース１０（当該クエリが実行されるべきデータソース１０）の各々に適した複数のクエリに分割する。クエリ分割部３０６´によって分割された複数のクエリは、例えば格納部３０１´に格納されているデータソース情報を用いて、それぞれ複数のデータソース１０に送信される。

複数のデータソース１０の各々においては、実データを保持するソーステーブルが管理（格納）されている。上記したようにクエリ分割部３０６´によって送信されたクエリを受信したデータソース１０の各々は、当該クエリを実行することによって当該データソース１０において管理されているソーステーブルからデータを取得し、当該データをデータ仮想化装置３０に送信する。このようにデータソース１０の各々からデータ仮想化装置３０に送信されたデータは、データ取得クエリに対する応答として、インタフェース部３０２´を介してクライアント端末２０に送信される。

このように本実施形態の比較例に係るデータ仮想化装置３０´は、複数のデータソース１０の各々において管理されているソーステーブルを自身のテーブルであるかのように振る舞うことによってデータ仮想化を実現し、ユーザが所望するデータ（つまり、データ取得クエリに基づいて取得されたデータ）を当該ユーザに対して提供することができる。

ここで、格納部３０１´には外部テーブル情報が格納されているものとして説明したが、上記したデータ仮想化を実現するためには、データ仮想化装置３０´において予め外部テーブルを作成しておく（つまり、外部テーブル情報を登録しておく）必要がある。

外部テーブルを作成する場合、例えばクライアント端末２０において、当該外部テーブルを作成する（新規に外部テーブル情報を登録する）ためのクエリ（以下、外部テーブル作成クエリと表記）が指定される。なお、外部テーブル作成クエリには、例えばデータソース１０のデータソース名（サーバ名）、当該データソース１０において管理されているソーステーブルのテーブル名及び当該ソーステーブルを構成するカラムのカラム名等が含まれる。

このように指定された外部テーブル作成クエリは、インタフェース部３０２´によって取得され、クエリ実行部３０５´によって実行される。

外部テーブル作成クエリがクエリ実行部３０５´によって実行されると、スキーマ情報取得部３０７´は、当該外部テーブル作成クエリに含まれるデータソース名、テーブル名及びカラム名に基づいて特定されるデータソース１０において管理されているソーステーブルの構造が定義されたスキーマ情報を、当該データソース１０から取得（受信）する。スキーマ情報取得部３０７´によって取得されるスキーマ情報には、ソーステーブルのテーブル名及び当該ソーステーブルを構成するカラムのカラム名（以下、単にソーステーブルのカラム名と表記）等が含まれる。スキーマ情報には、ソーステーブルに保持されるデータのタイプ（カラムの属性）等が更に含まれていてもよい。

外部テーブル情報登録部３０８´は、スキーマ情報取得部３０７´によって取得されたスキーマ情報に基づいて、当該スキーマ情報によって構造が定義されるソーステーブルに対応する外部テーブルに関する外部テーブル情報を格納部３０１´に登録する。なお、本実施形態の比較例に係るデータ仮想化装置３０´において格納部３０１´に格納される外部テーブル情報には、当該外部テーブル（ソーステーブル）のテーブル名及び当該外部テーブルを構成するカラムのカラム名等が含まれる。また、外部テーブルのテーブル名は、ソーステーブルのテーブル名と同一であってもよいが、当該ソーステーブルのテーブル名に所定の加工を施したテーブル名等であってもよい。この場合、外部テーブルのテーブル名は、ソーステーブルのテーブル名に外部テーブルであることを示す識別情報（例えば、番号等）が付されたようなものであってもよい。

なお、図４は、外部テーブルを作成する際のデータ仮想化装置３０´の動作の概要を示している。図４に示す例では、データソース１０において、テーブル名が「ｍｅｄｉａ＿ｔｙｐｅｓ」であり、カラム名が「ＭｅｄｉａＴｙｐｅＩｄ」及び「Ｎａｍｅ」であるカラムから構成されるテーブルが管理されている。

ここで、図４に示すように、例えば外部テーブル作成クエリ「ＣＲＥＡＴＥＦＯＲＥＩＧＮＴＡＢＬＥｍｅｄｉａ＿ｔｙｐｅｓ（“ＭｅｄｉａＴｙｐｅＩｄ”ｂｉｇｉｎｔ，“Ｎａｍｅ”ｔｅｘｔ）ＳＥＲＶＥＲｓｑｌｉｔｅ＿ｓｅｒｖｅｒ；」がクライアント端末２０において指定された場合を想定する。この外部テーブル作成クエリは、データソース名（サーバ名）が「ｓｑｌｉｔｅ＿ｓｅｒｖｅｒ」であるデータソース１０において管理されている、テーブル名が「ｍｅｄｉａ＿ｔｙｐｅｓ」であり、カラム名が「ＭｅｄｉａＴｙｐｅＩｄ」及び「Ｎａｍｅ」であるカラムから構成されるソーステーブルに対応する外部テーブルを作成することを意味する。なお、この外部テーブル作成クエリに含まれる「ｂｉｇｉｎｔ」はカラム名が「ＭｅｄｉａＴｙｐｅＩｄ」であるカラムのタイプ（属性）であり、「ｔｅｘｔ」はカラム名が「Ｎａｍｅ」であるカラムのタイプ（属性）である。

この場合、外部テーブル作成クエリがクエリ実行部３０５´によって実行され、スキーマ情報取得部３０７´は、データソース名が「ｓｑｌｉｔｅ＿ｓｅｒｖｅｒ」であるデータソース１０からスキーマ情報を取得する。この場合にスキーマ情報取得部３０７´によって取得されるスキーマ情報には、テーブル名「ｍｅｄｉａ＿ｔｙｐｅｓ」、カラム名「ＭｅｄｉａＴｙｐｅｓＩｄ」及び「Ｎａｍｅ」が含まれる。なお、このスキーマ情報は、データソース１０内のシステムカタログに格納されているものとする。

このようにスキーマ情報取得部３０７´によってスキーマ情報が取得された場合、外部テーブル情報登録部３０８´は、当該スキーマ情報に基づいて、テーブル名が「ｍｅｄｉａ＿ｔｙｐｅｓ」であり、カラム名が「ＭｅｄｉａＴｙｐｅｓＩｄ」及び「Ｎａｍｅ」であるカラムから構成される外部テーブルを作成する。この場合、外部テーブル情報登録部３０８´は、テーブル名「ｍｅｄｉａ＿ｔｙｐｅｓ」、カラム名「ＭｅｄｉａＴｙｐｅｓＩｄ」及び「Ｎａｍｅ」を含む外部テーブル情報を格納部（システムカタログ）３０１´に登録する。

ここではデータソース１０において管理されている１つのソーステーブルに対応する外部テーブルが作成される（当該外部テーブルに関する外部テーブル情報が登録される）場合について説明したが、例えば「ｐｏｓｔｇｒｅｓ＝＃ＩＭＰＯＲＴＦＯＲＥＩＧＮＳＣＨＥＭＡｐｕｂｌｉｃＦＲＯＭＳＥＲＶＥＲｓｑｌｉｔｅ＿ｓｅｒｖｅｒＩＮＴＯｐｕｂｌｉｃ；」のように表される外部スキーマ取り込み機能が実行されると、データソース名が「ｓｑｌｉｔｅ＿ｓｅｒｖｅｒ」であるデータソース１０において管理されている全てのソーステーブルの構造が定義されているスキーマ情報が取得され、当該ソーステーブルの各々に対応する外部テーブルを一括して作成することも可能である。

図５は、上記した図４において説明した外部テーブルを介してデータを取得する際のデータ仮想化装置３０´の動作の概要を示している。

図５に示す例では、データ取得クエリとして例えば「ＳＥＬＥＣＴ＊ＦＲＯＭｍｅｄｉａ＿ｔｙｐｅｓ；」がクライアント端末２０において指定されている場合を想定している。このデータ取得クエリは、テーブル名が「ｍｅｄｉａ＿ｔｙｐｅｓ」であるテーブルに保持されているデータを取得することを意味している。

この場合、データ仮想化装置３０´は、外部テーブル情報及びデータソース情報に基づいて、テーブル名が「ｍｅｄｉａ＿ｔｙｐｅｓ」であるソーステーブルを管理しているデータソース１０にアクセスし、当該ソーステーブルに保持されているデータを取得する。このように取得されたデータは、データ仮想化装置３０´からクライアント端末２０に返される。

ここでは、データ取得クエリに基づいて１つのデータソース１０からデータが取得される場合について説明したが、上記したテーブル名が「ｍｅｄｉａ＿ｔｙｐｅｓ」であるソーステーブルを管理しているデータソース１０が複数存在する場合には、当該複数のデータソース１０の各々からデータを取得することも可能である。

また、図５に示すデータ取得クエリにはデータを取得する対象となるテーブルのテーブル名のみが含まれているが、特定のカラムのデータ（値）を取得する場合には、データ取得クエリに当該カラムのカラム名が含まれる。

上記したようにデータ仮想化装置３０´においては、データソース１０において管理されているソーステーブルの構造の定義を取得（抽出）して外部テーブルを自動的に作成（登録）し、当該外部テーブルを介してデータソース１０からデータを取得することが可能である。

なお、データ仮想化装置３０´において作成された外部テーブルは、通常のテーブルと同様にレコードの追加、変更、削除及び参照が可能である。

ここで、上記した本実施形態の比較例に係るデータ仮想化装置３０´において作成される外部テーブルは、ソーステーブルのテーブル名及びカラム名で作成（登録）されるため、複数のデータソース１０間で表記揺れが生じていると、同一の意味であっても異なる名称（テーブル名及びカラム名）が割り当てられている場合がある。このような場合には、複数のデータソース１０の各々において管理されているソーステーブルから同種のデータを取得しようとしたとしても、データ取得クエリに含まれるテーブル名とは異なるテーブル名の外部テーブルを介して当該ソーステーブルにアクセスすることができず、当該ソーステーブルからデータを取得することができない。

具体的には、複数のデータソース１０のうちの第１データソース１０においてテーブル名が「ｐｕｒｃｈａｓｅ」であるソーステーブル（以下、単にｐｕｒｃｈａｓｅテーブルと表記）が管理されており、第２データソース１０においてテーブル名が「ｂｕｙｉｎｇ」であるソーステーブル（以下、単にｂｕｙｉｎｇテーブルと表記）が管理されており、当該ｐｕｒｃｈａｓｅテーブル及びｂｕｙｉｎｇテーブルにおいて同種のデータ（例えば、購買に関するデータ）が保持されているものとする。

この場合、クライアント端末２０において指定される１つのデータ取得クエリに基づいてｐｕｒｃｈａｓｅテーブル及びｂｕｙｉｎｇテーブルからデータを取得することが好ましいが、ｐｕｒｃｈａｓｅテーブル及びｂｕｙｉｎｇテーブルはテーブル名が異なっている。このような場合、例えばｐｕｒｃｈａｓｅテーブルのテーブル名を含むデータ取得クエリでは、ｐｕｒｃｈａｓｅテーブルからデータを取得することはできるが、ｂｕｙｉｎｇテーブルからはデータを取得することができない。一方、ｂｕｙｉｎｇテーブルのテーブル名を含むデータ取得クエリでは、ｂｕｙｉｎｇテーブルからデータを取得することはできるが、ｐｕｒｃｈａｓｅテーブルからはデータを取得することができない。

すなわち、本実施形態の比較例に係るデータ仮想化装置３０´においては、データを取得（参照）する際にテーブル名等を正確に指定しなければならず、当該テーブル名が異なる複数のデータソース１０（ソーステーブル）に効率的にアクセスすることができない。

そこで、本実施形態においては、複数のデータソース１０において管理されているソーステーブルに対する効率的なアクセスを実現する構成を有する。

図６は、本実施形態に係るデータ仮想化装置３０の機能構成の一例を示すブロック図である。図３に示すように、データ仮想化装置３０は、格納部３０１、インタフェース部３０２、クエリ解析部３０３、クエリプラン作成部３０４、クエリ実行部３０５、クエリ分割部３０６、スキーマ情報取得部３０７、外部テーブル情報登録部３０８及び変換部３０９を含む。

なお、本実施形態において、格納部３０１は、データ仮想化装置３０に備えられる不揮発性メモリ３２または他の記憶装置等によって実現される。

また、本実施形態において、インタフェース部３０２、クエリ解析部３０３、クエリプラン作成部３０４、クエリ実行部３０５、クエリ分割部３０６、スキーマ情報取得部３０７、外部テーブル情報登録部３０８及び変換部３０９の一部または全ては、データ仮想化装置３０に備えられるＣＰＵ３１（つまり、データ仮想化装置３０のコンピュータ）に所定のプログラムを実行させること、すなわち、ソフトウェアによって実現されるものとする。この所定のプログラムは、データ仮想化装置３０がデータ仮想化システム１において動作するためのプログラムであり、コンピュータ読み取り可能な記憶媒体に予め格納して頒布されてもよいし、ネットワークを介してデータ仮想化装置３０にダウンロードされてもよい。

ここでは、上記した各部３０２～３０９の一部または全てがソフトウェアによって実現されるものとして説明したが、当該各部３０２～３０９の一部または全ては、例えばハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。

また、図６に示す格納部３０１、インタフェース部３０２、クエリ解析部３０３、クエリプラン作成部３０４、クエリ実行部３０５、クエリ分割部３０６、スキーマ情報取得部３０７及び外部テーブル情報登録部３０８は、上記した図３に示す格納部３０１´、インタフェース部３０２´、クエリ解析部３０３´、クエリプラン作成部３０４´、クエリ実行部３０５´、クエリ分割部３０６´、スキーマ情報取得部３０７´及び外部テーブル情報登録部３０８´に相当する機能部である。このため、図６においては図３と同様の部分についてその詳しい説明を省略し、当該図３（つまり、本実施形態の比較例に係るデータ仮想化装置３０´）と異なる部分について主に説明する。

上記した本実施形態の比較例に係るデータ仮想化装置３０´においては、外部テーブル情報登録部３０８´がスキーマ情報取得部３０７´によって取得されたスキーマ情報（ソーステーブルのテーブル名及びカラム名）に基づいて外部テーブル情報を登録するものとして説明したが、本実施形態に係るデータ仮想化装置３０において、変換部３０９は、スキーマ情報に含まれるテーブル名及びカラム名を変換する。この場合、外部テーブル情報登録部３０８は、変換部３０９によって変換されたテーブル名及びカラム名に基づいて外部テーブル情報を格納部３０１に登録する。

以下、本実施形態に係るデータ仮想化装置３０の動作について説明する。まず、図７を参照して、外部テーブルを作成する（外部テーブル情報を登録する）際のデータ仮想化装置３０の動作の概要を説明する。

ここでは、テーブル名が「ｂｕｙｉｎｇ」であり、カラム名が「ａｍｏｕｎｔ」及び「ｒａｔｅ」であるカラムから構成されるソーステーブルを管理しているデータソース１０からスキーマ情報取得部３０７がテーブル名「ｂｕｙｉｎｇ」、カラム名「ａｍｏｕｎｔ」及び「ｒａｔｅ」を含むスキーマ情報を取得した場合を想定する。

この場合、変換部３０９はスキーマ情報取得部３０７によって取得されたスキーマ情報に含まれるテーブル名及びカラム名を変換するが、当該テーブル名及びカラム名の変換は、例えば類語辞書を参照することによって行うことができる。類語辞書には例えば複数の代表語及び当該複数の代表語の各々の類語（類義語）が対応づけて登録されており、当該類語辞書を参照することによって、変換部３０９は、スキーマ情報に含まれているテーブル名及びカラム名を類語（代表語）に変換することができる。

図７に示す例では、代表語「ｐｕｒｃｈａｓｅ」に対応づけて類語「ｐｕｒｃｈａｓｉｎｇ」及び「ｂｕｙｉｎｇ」が類語辞書に登録されている。この場合、変換部３０９は、スキーマ情報に含まれるテーブル名「ｂｕｙｉｎｇ」を当該「ｂｕｙｉｎｇ」の代表語である「ｐｕｒｃｈａｓｅ」に変換することができる。

また、代表語「ｑｕａｎｔｉｔｙ」に対応づけて類語「ｖａｌｕｅｓ」及び「ａｍｏｕｎｔ」が類語辞書に登録されている。この場合、変換部３０９は、スキーマ情報に含まれるカラム名「ａｍｏｕｎｔ」を、当該「ａｍｏｕｎｔ」の代表語である「ｑｕａｎｔｉｔｙ」に変換することができる。

なお、代表語「ｒａｔｅ」に対応づけて類語「ｐｒｉｃｅｓ」及び「ｃｏｓｔ」が類語辞書に登録されているが、スキーマ情報に含まれているカラム名「ｒａｔｅ」は代表語であるため、当該カラム名「ｒａｔｅ」は変換される必要はない。

上記した類語辞書を用いた場合には、スキーマ情報に含まれるテーブル名及びカラム名を特定の類語（代表語）に名寄せするような変換を実現することができる。

なお、本実施形態においては上記したようにソーステーブルのテーブル名及びカラム名を類語に変換するため、本実施形態における外部テーブルの作成は意味論に基づいて実行されるということができる。

ここでは類語辞書を用いてテーブル名及びカラム名を変換するものとして説明したが、当該類語辞書とは別に用意されているテーブル名及びカラム名における表記の揺れを訂正するためのルール（表記揺れルール）を用いて、スキーマ情報に含まれるテーブル名及びカラム名を変換してもよい。なお、このテーブル名及びカラム名を変換するために用いられるルールには、例えば全角または半角に表記を統一する、大文字または小文字に表記を統一する、漢字の表記を統一する、及びカタカナの表記を統一するためのルール等が含まれるが、他の観点から表記を統一するようなルールが含まれていてもよい。変換部３０９は、このようなルールを用いてスキーマ情報に含まれるテーブル名及びカラム名を正規化するように変換してもよい。

更に、テーブル名及びカラム名を入力として、当該テーブル名及びカラム名の類語を出力するように学習された学習モデルを用いて、スキーマ情報に含まれるテーブル名及びカラム名を変換してもよい。この場合、変換部３０９は、スキーマ情報に含まれるテーブル名及びカラム名を学習モデルに入力することによって、当該テーブル名及びカラム名を変換することができる。なお、この学習モデルは、例えばテーブル名及びカラム名（単語）のクラスタリングを実施するようなものであってもよいし、ニューラルネットワークまたはランダムフォレスト等の既知の様々な機械学習アルゴリズムを適用して生成されるものであってもよい。

なお、ここで説明したテーブル名及びカラム名の変換に用いられる類語辞書、ルール及び学習モデルは、予め用意されて、データ仮想化装置３０内に保持されているものとする。

外部テーブル情報登録部３０８は、上記したようにスキーマ情報に含まれるテーブル名「ｂｕｙｉｎｇ」から変換されたテーブル名「ｐｕｒｃｈａｓｅ」、カラム名「ａｍｏｕｎｔ」から変換されたカラム名「ｑｕａｎｔｉｔｙ」及びスキーマ情報に含まれるカラム名「ｒａｔｅ」に基づいて、外部テーブル情報を格納部３０１に登録する。

なお、本実施形態において格納部３０１に登録される外部テーブル情報は、テーブル対応情報、ソースカラム情報及び外部カラム情報を含む。

テーブル対応情報は、ソーステーブルと当該ソーステーブルに対応する外部テーブルとの対応関係を示す情報である。図７に示す例では、ソーステーブルのテーブル名「ｂｕｙｉｎｇ」及び外部テーブルのテーブル名「ｐｕｒｃｈａｓｅ」を対応づけて含むテーブル対応情報が登録されている。

ソースカラム情報は、ソーステーブルを構成するカラムに関する情報である。図７に示す例では、ソーステーブルのテーブル名「ｂｕｙｉｎｇ」と、カラム名「ａｍｏｕｎｔ」及び「ｒａｔｅ」とを対応づけて含むソースカラム情報が登録されている。

外部カラム情報は、外部テーブルを構成するカラムに関する情報である。図７に示す例では、外部テーブルのテーブル名「ｐｕｒｃｈａｓｅ」と、カラム名「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」とを対応づけて含む外部カラム情報が登録されている。

上記したテーブル対応情報、ソースカラム情報及び外部カラム情報を含む外部テーブル情報が格納部３０１に登録されることは、データ仮想化装置３０において図７に示すテーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるカラムから構成される外部テーブルが作成されることに相当する。

次に、図８のフローチャートを参照して、外部テーブルを作成する際のデータ仮想化装置３０の処理手順の一例について説明する。

まず、クライアント端末２０において外部テーブル作成クエリが指定された場合、インタフェース部３０２は、当該外部テーブル作成クエリを取得する（ステップＳ１）。

ステップＳ１の処理が実行されると、当該ステップＳ１において取得された外部テーブル作成クエリがクエリ実行部３０５によって実行され、スキーマ情報取得部３０７は、少なくとも１つのデータソース１０において管理されているソーステーブルの定義を示すスキーマ情報を当該データソース１０から取得する（ステップＳ２）。上記したようにスキーマ情報には、ソーステーブルのテーブル名及びカラム名が含まれる。ここでは、ステップＳ２において複数のスキーマ情報（つまり、複数のソーステーブルの各々の構造が定義されたスキーマ情報）が取得されたものとする。

以下、ステップＳ２において取得された複数のスキーマ情報の各々について、ステップＳ２～Ｓ１０の処理を実行する。以下の説明においては、ステップＳ２～Ｓ１０の処理の対象となるスキーマ情報を対象スキーマ情報と称する。

まず、外部テーブル情報登録部３０８は、対象スキーマ情報に含まれるテーブル名を当該対象スキーマ情報から抽出する（ステップＳ３）。

次に、変換部３０９は、ステップＳ３において抽出されたテーブル名を変換する変換処理を実行する（ステップＳ４）。

ステップＳ４の処理が実行されると、外部テーブル情報登録部３０８は、対象スキーマ情報に含まれるソーステーブルのテーブル名及びステップＳ４において対象スキーマ情報から抽出されたテーブル名から変換されたテーブル名（つまり、外部テーブルのテーブル名）を対応づけて含むテーブル対応情報を作成し、当該テーブル対応情報を格納部３０１に登録する（ステップＳ５）。

ここで、ソーステーブルは複数のカラムから構成されており、対象スキーマ情報には複数のカラム名が含まれている。この場合、対象スキーマ情報に含まれる複数のカラム名の各々についてステップＳ６～Ｓ９の処理が実行される。以下、ステップＳ６～Ｓ９の処理が実行されるカラム名を対象カラム名と称する。

まず、外部テーブル情報登録部３０８は、対象スキーマ情報に含まれる複数のカラム名の中から対象カラム名を抽出する（ステップＳ６）。

次に、外部テーブル情報登録部３０８は、上記したソーステーブルのテーブル名及びステップＳ６において抽出された対象カラム名を対応づけて含むソースカラム情報を作成し、当該ソースカラム情報を格納部３０１に登録する（ステップＳ７）。

ステップＳ７の処理が実行されると、変換部３０９は、ステップＳ６において抽出された対象カラム名を変換する変換処理を実行する（ステップＳ８）。

次に、外部テーブル情報登録部３０８は、上記した外部テーブルのテーブル名及びステップＳ８において対象カラム名から変換されたカラム名（つまり、外部テーブルのカラム名）を対応づけて含む外部カラム情報を作成し、当該外部カラム情報を格納部３０１に登録する（ステップＳ９）。

ステップＳ９の処理が実行されると、対象スキーマ情報に含まれる全てのカラム名についてステップＳ６～Ｓ９の処理が実行されたか否かが判定される（ステップＳ１０）。

全てのカラム名について処理が実行されていないと判定された場合（ステップＳ１０のＮＯ）、ステップＳ６に戻って処理が繰り返される。この場合、処理が実行されていないカラム名を対象カラム名として、ステップＳ６～Ｓ９の処理が実行される。

一方、全てのカラム名について処理が実行されたと判定された場合（ステップＳ１０のＹＥＳ）、ステップＳ２において取得された全てのスキーマ情報についてステップＳ３～Ｓ１０の処理が実行されたか否かが判定される。

全てのスキーマ情報について処理が実行されていないと判定された場合（ステップＳ１１のＮＯ）、ステップＳ３に戻って処理が繰り返される。この場合、処理が実行されていないスキーマ情報を対象スキーマ情報として、ステップＳ３～Ｓ１０の処理が実行される。

一方、全てのスキーマ情報について処理が実行されたと判定された場合（ステップＳ１１のＹＥＳ）、図８に示す処理は終了される。

上記した図８に示す処理によれば、データソース１０から取得されたスキーマ情報に含まれるテーブル名及びカラム名を変換して外部テーブル情報を登録（外部テーブルを作成）することができる。

次に、図９のフローチャートを参照して、上記した変換処理（図８に示すステップＳ４及びＳ８の処理）の処理手順の一例について説明する。

ここでは、上記した類語辞書、ルール（表記揺れルール）及び学習モデルのうちの１つを用いてテーブル名またはカラム名を変換するものとし、当該類語辞書、ルール及び学習モデルのいずれを用いるかは設定ファイル等において予め設定されているものとする。

この場合、変換部３０９は、上記した設定ファイルを参照し、類語辞書を用いるか否かを判定する（ステップＳ２１）。

類語辞書を用いると判定された場合（ステップＳ２１のＹＥＳ）、変換部３０９は、当該類語辞書を用いてテーブル名またはカラム名を変換する（ステップＳ２２）。なお、類語辞書を用いたテーブル名またはカラム名の変換については上記した通りであるため、ここではその詳しい説明を省略する。

一方、類語辞書を用いないと判定された場合（ステップＳ２１のＮＯ）、変換部３０９は、設定ファイルを参照し、ルールを用いるか否かを判定する（ステップＳ２３）。

ルールを用いると判定された場合（ステップＳ２３のＹＥＳ）、変換部３０９は、当該ルールを用いてテーブル名またはカラム名を変換する（ステップＳ２４）。なお、ルールを用いたテーブル名またはカラム名の変換については上記した通りであるため、ここではその詳しい説明を省略する。

一方、ルールを用いないと判定された場合（ステップＳ２３のＮＯ）、変換部３０９は、設定ファイルを参照し、学習モデルを用いるか否かを判定する（ステップＳ２５）。

学習モデルを用いると判定された場合（ステップＳ２５のＹＥＳ）、変換部３０９は、当該学習モデルを用いてテーブル名またはカラム名を変換する（ステップＳ２６）。なお、学習モデルを用いたテーブル名またはカラム名の変換については上記した通りであるため、ここではその詳しい説明を省略する。

なお、学習モデルを用いないと判定された場合（ステップＳ２５のＮＯ）、変換処理は終了される。例えば設定ファイルにおいて類語辞書、ルール及び学習モデルのいずれも設定されていない（つまり、テーブル名及びカラム名の変換を実施しないことが設定されている）場合には、ステップＳ２５において学習モデルを用いないと判定され、テーブル名またはカラム名は変換されないものとする。

図９に示す例では、類語辞書、ルール及び学習モデルのうちの１つを用いてテーブル名またはカラム名を変換するものとして説明したが、当該類語辞書、ルール及び学習モデルのうちの少なくとも２つ以上を組み合わせてテーブル名またはカラム名を変換する構成としてもよい。また、テーブル名とカラム名とで異なる変換手法を適用するようにしてもよい。具体的には、テーブル名は類語辞書を用いて変換し、カラム名はルールを用いて変換するようにしてもよい。

図１０は、データ仮想化装置３０において作成される外部テーブルの具体例を示している。

詳細な説明については省略するが、図１０に示す例では、テーブル名が「ｄｅｖ＿ｍｓｔ」であり、カラム名が「ｄｅｖ＿ｉｄ」及び「ｍｆｇ＿ｄａｔｅ」であるカラムから構成されるソーステーブルの構造が定義されたスキーマ情報が取得された場合に、テーブル名が「ｄｅｖｉｃｅ＿ｍａｓｔｅｒ」であり、カラム名が「ｄｅｖｉｃｅ＿ｉｄ」及び「ｍａｎｕｆａｃｔｕｒｉｎｇ＿ｄａｔｅ」であるカラムから構成される外部テーブルが作成されることが示されている。

また、テーブル名が「ｄｅｖ＿ｄｅｓｉｇｎｅｒ＿ｉｎｆｏ」であり、カラム名が「ｄｅｖ＿ｉｄ」、「ｄｅｓｉｇｎｅｒ＿ｉｄ」、「ｄｅｓｉｇｎ＿ｄａｔｅ」及び「ｐａｓｓｅｄ＿ｄａｔｅ」であるカラムから構成されるソーステーブルの構造が定義されたスキーマ情報が取得された場合に、テーブル名が「ｄｅｖｉｃｅ＿ａｒｃｈｉｔｅｃｔ＿ｉｎｆｏｒｍａｔｉｏｎ」であり、カラム名が「ｄｅｖｉｃｅ＿ｉｄ」、「ａｒｃｈｉｔｅｃｔ＿ｉｄ」、「ｄｅｓｉｇｎ＿ｄａｔｅ」及び「ａｐｐｒｏｖａｌ＿ｄａｔｅ」であるカラムから構成される外部テーブルが作成されることが示されている。

更に、テーブル名が「ｄｅｓｉｇｎｅｒ」であり、カラム名が「ｄｅｓｉｇｎｅｒ＿ｉｄ」、「ｎａｍｅ」及び「ｗｏｒｋｅｒ＿ｉｄ」であるカラムから構成されるソーステーブルの構造が定義されたスキーマ情報が取得された場合に、テーブル名が「ａｒｃｈｉｔｅｃｔ」であり、カラム名が「ａｒｃｈｉｔｅｃｔ＿ｉｄ」、「ｎａｍｅ」及び「ｅｍｐｌｏｙｅｅ＿ｉｄ」であるカラムから構成される外部テーブルが作成されることが示されている。

上記したように本実施形態においては、第１データソース１０おいて管理されている第１ソーステーブルの第１テーブル名及び当該第１ソーステーブルを構成する第１カラムの第１カラム名を含む第１スキーマ情報を取得し、当該第１スキーマ情報に含まれる第１テーブル名を第３テーブル名に変換し、当該第１スキーマ情報に含まれる第１カラム名を第３カラム名に変換する。これにより、第１ソーステーブルの第１テーブル名及び当該第１テーブル名から変換された第３テーブル名（つまり、第１外部テーブルのテーブル名）を対応づけて含む第１テーブル対応情報と、当該第１テーブル名及び当該第１カラム名を対応づけて含む第１ソースカラム情報と、当該第３テーブル名及び当該第１カラム名から変換された第３カラム名を対応づけて含む第１外部カラム情報とを格納部３０１に登録する。

また、本実施形態においては、第２データソース１０において管理されている第２ソーステーブルの第２テーブル名及び当該第２ソーステーブルを構成する第２カラムの第２カラム名を含む第２スキーマ情報を取得し、当該第２スキーマ情報に含まれる第２テーブル名を第３テーブル名に変換し、当該第２スキーマ情報に含まれる第２カラム名を第３カラム名に変換する。これにより、第２ソーステーブルの第２テーブル名及び当該第２テーブル名から変換された第３テーブル名（つまり、第２外部テーブルのテーブル名）を対応づけて含む第２テーブル対応情報と、当該第２テーブル名及び当該第２カラム名を対応づけて含む第２ソースカラム情報と、当該第３テーブル名及び当該第２カラム名から変換された第３カラム名を対応づけて含む第２外部カラム情報とを格納部３０１に登録する。

なお、上記した第３テーブル名は第１テーブル名及び第２テーブル名の類語であり、第３カラム名は第１カラム名及び第２カラム名の類語である。

本実施形態においては、このような構成により、ソーステーブルのテーブル名及びカラム名を類語に変換して外部テーブルを作成する（つまり、データソースのテーブル名及びカラム名を意味論に基づく命名規則で登録する）ことができるため、意味が同一（つまり、類語）であればデータソース１０（ソーステーブル）間でテーブル名またはカラム名が違っていても同一のテーブルまたはカラムとして扱われるため、１つのデータ取得クエリで複数のデータソース１０からデータを取得することができ、検索の幅が広がる。

ここで、上記したように第１ソーステーブルの第１テーブル名及び第１カラム名と、第２ソーステーブルの第２テーブル名及び第２カラム名とが異なっており、当該第１ソーステーブルに対応する第１外部テーブルのテーブル名及びカラム名が第１テーブル名及び第１カラム名であり、当該第２ソーステーブルに対応する第２外部テーブルのテーブル名及びカラム名が第２テーブル名及び第２カラム名である（つまり、本実施形態の比較例のようにテーブル名及びカラム名を変換することなく外部テーブルが作成された）場合を想定する。

この場合、第１ソーステーブルからデータを取得するためには、データ取得クエリにおいて第１テーブル名及び第１カラム名を指定する必要があり、第２ソーステーブルからデータを取得するためには、データ取得クエリにおいて第２テーブル名及び第２カラム名を指定する必要がある。

これに対して、本実施形態においては、第１ソーステーブルに対応する第１外部テーブルのテーブル名及びカラム名は第３テーブル名及び第３カラム名であり、第２ソーステーブルに対応する第２外部テーブルのテーブル名及びカラム名は第３テーブル名及び第３カラム名である。

この場合、データ取得クエリにおいて第３テーブル名及び第３カラム名が指定されていれば、第１ソーステーブル及び第２ソーステーブルの両方からデータを取得することができ、テーブル名及びカラム名が異なっている第１及び第２ソーステーブルの各々に応じたデータ取得クエリを指定することなく、テーブル名及びカラム名の表記が統一された第１及び第２外部テーブルを介して当該第１及び第２ソーステーブルの各々に効率的にアクセスしてデータを取得することが可能となる。

なお、ソーステーブルのテーブル名及びカラム名を変換して外部テーブルが作成された場合、ソーステーブルと外部テーブルとの対応関係、当該ソーステーブルを構成するカラムに関する情報、当該外部テーブルを構成するカラムに関する情報が、外部テーブル情報（テーブル対応情報、ソースカラム情報及び外部カラム情報）として格納部３０１に登録される。このため、ソーステーブルのテーブル名及びカラム名から変換された外部テーブルのテーブル名及びカラム名がデータ取得クエリにおいて指定されていた場合であっても、上記した外部テーブル情報及びデータソース情報に基づいて、適切なデータソースにアクセスし、当該データ取得クエリに応じたデータを取得することができる。

なお、本実施形態においては、複数の代表語及び当該複数の代表語の各々の類語が対応づけて登録されている類語辞書を参照して、ソーステーブルのテーブル名（第１及び第２テーブル名）を、当該テーブル名に対応づけて当該類語辞書に登録されている代表語（第３テーブル名）に変換することができる。ソーステーブルのカラム名（第１及び第２カラム名）についても同様である。

本実施形態においては、このような構成により、ソーステーブルのテーブル名及びカラム名を同一の意味を有する類語に適切に変換することが可能となる。

なお、ソーステーブルのテーブル名及びカラム名の変換には、テーブル名及びカラム名における表記の揺れを訂正するためのルール、またはテーブル名及びカラム名を入力として当該テーブル名及びカラム名の類語を出力するように学習された学習モデルを用いてもよい。

ここで、図１１を参照して、上記した本実施形態に係るデータ仮想化装置３０の使用態様の一例について説明する。図１１は、本実施形態に係るデータ仮想化装置３０をＶＰＰ（Virtual Power Plant）／ＤＲ（Demand Response）に適用する例を示している。

なお、ＶＰＰとは、分散設置されたエネルギーリソース（発電設備、蓄電設備及び需要設備）を、ＩＣＴ（Information and Communication Technology）を活用してアグリゲーションし、あたかも１つの発電所のように制御する技術である。また、ＤＲとは、例えば市場価格の高騰時または系統信頼性の低下時において、電気料金価格の設定またはインセンティブの支払いに応じて、需要家側が電力の使用を抑制するよう電力の消費パターンを変化させること、と定義される。

この場合、図１１に示すＶＰＰ／ＤＲに本実施形態に係るデータ仮想化装置３０を配置することによって、各アグリゲータ（電力需要を束ねて効果的にエネルギーマネジメントサービスを行う組織または団体等）が保有するサーバ装置(データベース管理サーバ)において管理されているデータを仮想的に統合することができる。

なお、本実施形態に係るデータ仮想化装置３０は、例えば図１２に示すようにアグリゲータ（データベース管理サーバ）が追加されたとしても、当該データ仮想化装置３０を使用するアプリケーション等を変化することなく容易に対応することができる。

更に、本実施形態に係るデータ仮想化装置３０は、図１３に示すように当該データ仮想化装置３０の上位に位置する他のデータ仮想化装置３０と通信可能に接続されるように構成されてもよい（つまり、多段構成とすることが可能である）。なお、図１３においては、ＶＰＰ／ＤＲの上位に位置し、各種施設（水力発電所及び火力発電所等）や気象情報（気象システム）から得られる情報に基づいてＶＰＰ／ＤＲと連係動作するシステムコントローラにデータ仮想化装置３０が配置される例が示されている。

ここでは本実施形態に係るデータ仮想化装置３０がＶＰＰ／ＤＲに適用される例について説明したが、当該データ仮想化装置３０は、複数のデータソース１０（サーバ装置）に分散管理されているデータを仮想的に統合する用途であれば、他の分野に適用されても構わない。具体的には、データ仮想化装置３０は、例えば上記した購買に関するデータを管理するデータソース１０として機能する複数のＰＯＳシステム等と接続され、当該データを仮想的に統合するような用途に用いることができる。

なお、本実施形態においてはスキーマ情報に含まれるテーブル名及びカラム名の両方を変換するものとして説明したが、本実施形態は、当該テーブル名及びカラム名の少なくとも一方を変換する構成であっても構わない。

また、本実施形態においてはデータ仮想化システム１がクライアント端末２０を備えるものとして説明したが、ユーザがデータ仮想化装置３０を操作する（つまり、データ仮想化装置３０を操作して各種クエリを指定する）ような場合には、クライアント端末２０は省略されても構わない。

（第２実施形態）
次に、第２実施形態について説明する。本実施形態に係るデータ仮想化システムのネットワーク構成は、前述した第１実施形態と同様であるため、適宜、図１を用いて説明する。本実施形態に係るデータ仮想化装置３０は、マルチテナント機能を有する点で前述した第１実施形態とは異なる。

まず、図１４を参照して、本実施形態に係るデータ仮想化装置３０が有するマルチテナント機能について簡単に説明する。

前述した第１実施形態において説明したように、データ仮想化装置３０は、複数のデータソース１０の各々において管理されているソーステーブルに対応する外部テーブルを作成することにより、当該外部テーブルを介してユーザに対してデータを提供することができるが、マルチテナント機能とは、テーブル名及び構成が同一の複数の外部テーブルを１つの仮想的なテーブルに統合する機能である。このマルチテナント機能によれば、複数の外部テーブルが統合された外部テーブル（以下、マルチテナントテーブルと表記）が作成される。なお、本実施形態において「構成が同一」とは、テーブルを構成するカラムの数及び当該カラムのカラム名等に基づくテーブル構成が同一であることをいう。

ここで、図１４に示すように、データ仮想化装置３０と通信可能に接続される複数のデータソース１０が３つのデータソース（第１～第３データソース）１０を含み、当該３つのデータソース１０の各々がテーブル名及び構成が同一のソーステーブルを管理している場合を想定する。

なお、図１４に示す例において、第１～第３データソース１０の各々に管理されているソーステーブルは、テーブル名が「テーブル１」であり、カラム名が「ｖａｌｕｅ１」及び「ｖａｌｕｅ２」であるカラムから構成されている。また、図１４に示すように、第１～第３データソース１０の各々に管理されているソーステーブルはテーブル名及びカラム名（つまり、構成）は同一であるが、当該カラムのデータは異なる。

この場合、データ仮想化装置３０においては、テーブル名及び構成が同一の３つの外部テーブル（テーブル名が「テーブル１」であり、カラム名が「ｖａｌｕｅ１」及び「ｖａｌｕｅ２」であるカラムから構成されている外部テーブル）が作成される。

ここで、例えばクライアント端末２０において「ＳＥＬＥＣＴｓｕｍ（ｖａｌｕｅ２）ＦＲＯＭテーブル１」というデータ取得クエリが指定された場合を想定する。なお、このデータ取得クエリは、テーブル名が「テーブル１」であるテーブルからカラム名が「ｖａｌｕｅ２」であるカラムのデータの合計値を取得することを示している。

この場合において、上記したマルチテナントテーブルが作成されていない（マルチテナント機能がない）ものとすると、上記したデータ取得クエリに基づいて第１データソース１０において管理されているソーステーブルからｓｕｍ（ｖａｌｕｅ２）＝３が取得される。同様に、第２データソース１０において管理されているソーステーブルからはｓｕｍ（ｖａｌｕｅ２）＝３０、第３データソース１０において管理されているソーステーブルからはｓｕｍ（ｖａｌｕｅ２）＝３００が取得される。すなわち、この場合には各データソース１０から別個のデータが取得される。

一方、図１４に示すように、第１～第３データソース１０において管理されているソーステーブルの各々に対応する３つの外部テーブルを統合したマルチテナントテーブルが作成されている（マルチテナント機能がある）場合を想定する。この場合、上記したデータ取得クエリが指定されると、当該マルチテナントテーブルを利用することによって、ｓｕｍ（ｖａｌｕｅ２）＝３３３が取得される。

すなわち、マルチテナント機能によれば、テーブル名及び構成が同一の複数の外部テーブルを１つの仮想的なテーブルとして扱うことにより、当該複数の外部テーブルを横断するようにデータを検索（取得）することができるため、より有用なデータをユーザに提供することができる。

図１５は、本実施形態に係るデータ仮想化装置３０の機能構成の一例を示すブロック図である。図１５においては、前述した図６と同様の部分については同一参照符号を付してその詳しい説明を省略し、当該図６と異なる部分について主に説明する。

図１５に示すように、本実施形態に係るデータ仮想化装置３０は、マルチテナントテーブル作成部３１０を更に含む。

なお、本実施形態において、マルチテナントテーブル作成部３１０の一部または全ては、データ仮想化装置３０に備えられるＣＰＵ３１（つまり、データ仮想化装置３０のコンピュータ）に所定のプログラムを実行させること、すなわち、ソフトウェアによって実現されるものとする。ここでは、上記したマルチテナントテーブル作成部３１０の一部または全てがソフトウェアによって実現されるものとして説明したが、当該マルチテナントテーブル作成部３１０の一部または全ては、例えばハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。

マルチテナントテーブル作成部３１０は、上記したマルチテナントテーブルを作成する機能を有する。具体的には、マルチテナントテーブル作成部３１０は、データ仮想化装置３０において作成される複数の外部テーブルのうち、テーブル名及び構成が同一である２以上の外部テーブルを統合したマルチテナントテーブルを作成する。なお、マルチテナントテーブル作成部３１０は、既に作成されたマルチテナントテーブルに外部テーブルを更に統合させることも可能である。マルチテナントテーブル作成部３１０によってマルチテナントテーブルが作成された場合、当該マルチテナントテーブルに関する情報（以下、マルチテナントテーブル情報と表記）が格納部３０１に登録される。

以下、本実施形態に係るデータ仮想化装置３０の動作について説明する。まず、図１６を参照して、マルチテナントテーブルを作成する際のデータ仮想化装置３０の動作の概要を説明する。

ここでは、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｖａｌｕｅｓ」及び「ｐｒｉｃｅｓ」であるカラムから構成されるソーステーブル（以下、第１ソーステーブルと表記）を管理しているデータソース１０からスキーマ情報取得部３０７がテーブル名「ｐｕｒｃｈａｓｅ」、カラム名「ｖａｌｕｅｓ」及び「ｐｒｉｃｅｓ」を含むスキーマ情報を取得したものとする。

また、テーブル名が「ｂｕｙｉｎｇ」であり、カラム名が「ａｍｏｕｎｔ」及び「ｒａｔｅ」であるカラムから構成されるソーステーブル（以下、第２ソーステーブルと表記）を管理しているデータソース１０からスキーマ情報取得部３０７がテーブル名「ｂｕｙｉｎｇ」、カラム名「ａｍｏｕｎｔ」及び「ｒａｔｅ」を含むスキーマ情報を取得したものとする。

更に、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｃｏｓｔ」であるカラムから構成されるテーブル名が「ｐｕｒｃｈａｓｉｎｇ」であるソーステーブル（以下、第３ソーステーブル）を管理しているデータソース１０からスキーマ情報取得部３０７がテーブル名「ｐｕｒｃｈａｓｉｎｇ」、カラム名「ｑｕａｎｔｉｔｙ」及び「ｃｏｓｔ」を含むスキーマ情報を取得したものとする。

この場合、図１６においては省略されているが、上記したスキーマ情報に含まれるテーブル名及びカラム名が変換部３０９によって変換され、当該変換されたテーブル名及びカラム名に基づいて外部テーブルが作成される。

変換部３０９によるテーブル名及びカラム名の変換については前述した第１実施形態において説明した通りであるため、ここではその詳しい説明を省略するが、図１６に示す例では、上記した第１ソーステーブルに対応する外部テーブル（以下、第１外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるカラムから構成されるテーブルが作成される。

また、上記した第２ソーステーブルに対応する外部テーブル（以下、第２外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるカラムから構成されるテーブルが作成される。

更に、上記した第３ソーステーブルに対応する外部テーブル（以下、第３外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるカラムから構成されるテーブルが作成される。

すなわち、図１６においては、テーブル名及び構成が同一の第１～第３外部テーブル（つまり、３つの外部テーブル）が生成される。

この場合、マルチテナントテーブル作成部３１０は、上記した第１～第３外部テーブルを統合してマルチテナントテーブルを作成する。なお、このマルチテナントテーブルは、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｒｙ」及び「ｒａｔｅ」であるカラムから構成されるテーブルである。

上記したようにマルチテナントテーブル作成部３１０によってマルチテナントテーブルが作成された場合、当該マルチテナントテーブルに関するマルチテナントテーブル情報が格納部３０１に登録される。なお、マルチテナントテーブル情報は、マルチテナントテーブルを介してデータを取得する際にアクセスすべきデータソースやソーステーブルを特定することができる情報であればよく、例えば当該マルチテナントテーブルのテーブル名（つまり、マルチテナントテーブルが作成される際に統合された外部テーブルの外部テーブル名）及び当該マルチテナントテーブルを構成するカラムのカラム名等を含むものとする。

なお、上記したマルチテナントテーブルが作成される場合であっても、当該マルチテナントテーブルが作成される際に統合された外部テーブルの各々に関する外部テーブル情報（テーブル対応情報、ソースカラム情報及び外部カラム情報）は、格納部３０１に登録されるものとする。

次に、図１７のフローチャートを参照して、マルチテナントテーブルを作成する際のデータ仮想化装置３０の処理手順の一例について説明する。

まず、データ仮想化装置３０は、外部テーブル作成処理を実行する（ステップＳ３１）。なお、この外部テーブル作成処理は前述した第１実施形態において説明した図８に示す処理に相当するため、ここではその詳しい説明を省略する。

ここで、ステップＳ３１の処理（外部テーブル作成処理）が実行されることに複数の外部テーブルが作成された（複数の外部テーブル情報が登録された）場合を想定する。この場合、複数の外部テーブルの各々について、以下のステップＳ３２～Ｓ３８の処理が実行される。以下、ステップＳ３２～Ｓ３８の処理が実行される外部テーブルを対象外部テーブルと称する。

まず、マルチテナントテーブル作成部３１０は、格納部３０１を参照して、既に作成されているマルチテナントテーブルの中に対象外部テーブルとテーブル名が同一のマルチテナントテーブル（以下、既存マルチテナントテーブルと表記）が存在するか否かを判定する（ステップＳ３２）。ステップＳ３２においては、例えば対象外部テーブルのテーブル名をマルチテナントテーブルのテーブル名とするマルチテナントテーブル情報が格納部３０１に格納（登録）されていない場合、既存マルチテナントテーブルが存在しないと判定される。一方、対象外部テーブルのテーブル名をマルチテナントテーブルのテーブル名とするマルチテナントテーブル情報が格納部３０１に格納されている場合、既存マルチテナントテーブルが存在すると判定される。

対象外部テーブルとテーブル名が同一のマルチテナントテーブル（既存マルチテナントテーブル）が存在しないと判定された場合（ステップＳ３２のＮＯ）、マルチテナントテーブル作成部３１０は、対象外部テーブルとテーブル名が同一の他の外部テーブル（以下、既存外部テーブルと表記）が存在するか否かを判定する（ステップＳ３３）。ステップＳ３３においては、対象外部テーブルに関する外部テーブル情報以外で、当該対象外部テーブルのテーブル名と同一のテーブル名を含む外部テーブル情報（テーブル対応情報または外部カラム情報）が格納部３０１に格納されている場合、既存外部テーブルが存在すると判定される。一方、対象外部テーブルに関する外部テーブル情報以外で、当該対象外部テーブルのテーブル名と同一のテーブル名を含む外部テーブル情報（テーブル対応情報または外部カラム情報）が格納部３０１に格納されていない場合、既存外部テーブルが存在しないと判定される。

テーブル名が同一の他の外部テーブル（既存外部テーブル）が存在すると判定された場合（ステップＳ３３のＹＥＳ）、マルチテナントテーブル作成部３１０は、当該既存外部テーブルの構成が対象外部テーブルの構成と同一であるか否かを判定する（ステップＳ３４）。ステップＳ２４においては、既存外部テーブルのテーブル名を含む外部カラム情報に含まれるカラム名の全てが対象外部テーブルを構成するカラムのカラム名と一致する場合、既存外部テーブルの構成が対象外部テーブルの構成と同一であると判定される。一方、既存外部テーブルのテーブル名を含む外部カラム情報に含まれるカラム名のうちの少なくとも１つが対象外部テーブルを構成するカラムのカラム名と一致しない場合、既存外部テーブルの構成が対象外部テーブルの構成と同一でないと判定される。

既存外部テーブルの構成が対象外部テーブルの構成と同一であると判定された場合（ステップＳ３４のＹＥＳ）、マルチテナントテーブル作成部３１０は、対象外部テーブル及び既存外部テーブルを統合したマルチテナントテーブルに関するマルチテナントテーブル情報を作成する（ステップＳ３５）。なお、マルチテナントテーブル情報は、例えば対象外部テーブル及び既存外部テーブルのテーブル名及びカラム名等に基づいて作成される。

ステップＳ３５において作成されたマルチテナントテーブル情報は、格納部３０１に登録される（ステップＳ３６）。

なお、本実施形態においては、上記したステップＳ３５及びＳ３６の処理が実行されることによってマルチテナントテーブルが作成される。

一方、ステップＳ３２において対象外部テーブルとテーブル名が同一のマルチテナントテーブル（既存マルチテナントテーブル）が存在すると判定された場合（ステップＳ３２のＹＥＳ）、マルチテナントテーブル作成部３１０は、当該既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一であるか否かを判定する（ステップＳ３７）。上記したように既存マルチテナントテーブルに関するマルチテナントテーブル情報が当該既存マルチテナントテーブルを構成するカラムのカラム名を含む情報であるものとすると、ステップＳ３７においては、当該マルチテナントテーブル情報によって示されるカラム名の全てが対象外部テーブルを構成するカラムのカラム名と一致する場合、既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一であると判定される。一方、既存マルチテナントテーブルに関するマルチテナントテーブル情報によって示されるカラム名のうちの少なくとも１つが対象外部テーブルを構成するカラムのカラム名と一致しない場合、既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一でないと判定される。

既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一であると判定された場合（ステップＳ３７のＹＥＳ）、マルチテナントテーブル作成部３１０は、既存マルチテナントテーブルに関するマルチテナントテーブル情報に対象外部テーブル（のテーブル名等）を追加する（ステップＳ３８）。ステップＳ３８の処理が実行されることによって、既存マルチテナントテーブルに統合された複数の外部テーブルの１つとして対象外部テーブルが追加される。ステップＳ３８において対象外部テーブルが追加されたマルチテナントテーブル情報は、格納部３０１に登録（上書き）される。

なお、ステップＳ３７において既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一でないと判定された場合（ステップＳ３７のＮＯ）、ステップＳ３３以降の処理が実行される。

ステップＳ３６またはＳ３８の処理が実行されると、マルチテナントテーブル作成部３１０は、ステップＳ３１の処理が実行されることによって作成された全ての外部テーブルについてステップＳ３２～Ｓ３８の処理が実行されたか否かを判定する（ステップＳ３９）。

全ての外部テーブルについて処理が実行されていないと判定された場合（ステップＳ３９のＮＯ）、ステップＳ３２に戻って処理が繰り返される。この場合、処理が実行されていない外部テーブルを対象外部テーブルとして、ステップＳ３２の処理が実行される。

一方、全ての外部テーブルについて処理が実行されたと判定された場合（ステップＳ３９のＹＥＳ）、図１７に示す処理は終了される。

なお、ステップＳ３３においてテーブル名が同一の他の外部テーブル（既存外部テーブル）が存在しないと判定された場合（ステップＳ３３のＮＯ）またはステップＳ３４において既存外部テーブルの構成が対象外部テーブルの構成と同一でないと判定された場合（ステップＳ３４のＮＯ）、ステップＳ３９の処理が実行される。

また、ステップＳ３７において既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一でないと判定された場合には、ステップＳ３３以降の処理が実行されるものとして説明したが、例えばステップＳ３９の処理が実行されてもよい。

上記したように本実施形態においては、複数の外部テーブルの各々を構成するカラムに関する外部カラム情報（第１及び第２外部カラム情報）に基づいて、当該複数の外部テーブルが統合されたマルチテナントテーブルが作成される。このような構成によれば、マルチテナントテーブルを介して、複数の外部テーブルを横断するようにデータを検索（取得）することが可能となるため、より有用なデータをユーザに対して提供することができる。

ここで、図１８及び図１９を参照して、本実施形態の作用効果について説明する。図１８は、前述した第１実施形態の比較例においてマルチテナントテーブルを作成する場合を説明するための図である。

図１８に示すように、例えば第１データソース１０において、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｖａｌｕｅｓ」及び「ｐｒｉｃｅｓ」であるカラムから構成されるソーステーブルが管理されているものとする。前述した第１実施形態の比較例によれば、このソーステーブルに対応する外部テーブルのテーブル名は「ｐｕｒｃｈａｓｅ」であり、当該外部テーブルを構成するカラムのカラム名は「ｖａｌｕｅｓ」及び「ｐｒｉｃｅｓ」である。

また、例えば第２データソース１０において、テーブル名が「ｂｕｙｉｎｇ」であり、カラム名が「ａｍｏｕｎｔ」及び「ｒａｔｅ」であるカラムから構成されるソーステーブルが管理されているものとする。前述した第１実施形態の比較例によれば、このソーステーブルに対応する外部テーブルのテーブル名は「ｂｕｙｉｎｇ」であり、当該外部テーブルを構成するカラムのカラム名は「ａｍｏｕｎｔ」及び「ｒａｔｅ」である。

更に、例えば第３データソース１０において、テーブル名が「ｐｕｒｃｈａｓｉｎｇ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｃｏｓｔ」であるカラムから構成されるソーステーブルが管理されているものとする。前述した第１実施形態の比較例によれば、このソーステーブルに対応する外部テーブルのテーブル名は「ｐｕｒｃｈａｓｉｎｇ」であり、当該外部テーブルを構成するカラムのカラム名は「ｑｕａｎｔｉｔｙ」及び「ｃｏｓｔ」である。

この場合、前述した第１実施形態の比較例に係るデータ仮想化装置３０´がマルチテナント機能を有し、マルチテナントテーブルを作成しようとしたとしても、上記した３つの外部テーブルのテーブル名及び構成（当該外部テーブルを構成するカラムのカラム名）が一致しないため、当該３つの外部テーブルからマルチテナントテーブルを作成することはできない。

次に、図１９は、本実施形態においてマルチテナントテーブルを作成する場合を説明するための図である。

例えば第１データソース１０において図１８で説明したソーステーブルが管理されているものとすると、本実施形態における当該ソーステーブルに対応する外部テーブルのテーブル名は「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」である。

また、例えば第２データソース１０において図１８で説明したソーステーブルが管理されているものとすると、本実施形態における当該ソーステーブルに対応する外部テーブルのテーブル名は「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」である。

更に、例えば第３データソース１０において図１８で説明したソーステーブルが管理されているものとすると、本実施形態における当該ソーステーブルに対応する外部テーブルのテーブル名は「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」である。

この場合、上記した３つの外部テーブルのテーブル名及び構成は同一であるため、本実施形態に係るデータ仮想化装置３０は、当該３つの外部テーブルからマルチテナントテーブルを作成することができる。

すなわち、前述した第１実施形態の比較例においては、複数のデータソース１０の各々においてテーブル名及び構成が異なるソーステーブルが管理されている場合には、当該ソーステーブルに対応する外部テーブルからはマルチテナントテーブルを作成することができないが、本実施形態においては、複数のデータソース１０の各々においてテーブル名及び構成が異なるソーステーブルが管理されている場合であっても、前述した第１実施形態において説明したようにテーブル名及びカラム名が変換された外部テーブルを作成することによって、複数の外部テーブルを統合したマルチテナントテーブルを作成することが可能となる。

（第３実施形態）
次に、第３実施形態について説明する。本実施形態に係るデータ仮想化システムのネットワーク構成は、前述した第１実施形態と同様であるため、適宜、図１を用いて説明する。本実施形態に係るデータ仮想化装置３０は、クライアント端末２０において指定されるデータ取得クエリに含まれるテーブル名及びカラム名を変換する点で前述した第１実施形態とは異なる。

図２０は、本実施形態に係るデータ仮想化装置３０の機能構成の一例を示すブロック図である。図２０においては、前述した図６と同様の部分については同一参照符号を付してその詳しい説明を省略し、当該図６と異なる部分について主に説明する。

図２０に示すように、本実施形態に係るデータ仮想化装置３０は、第２変換部３１１を更に含む。図２０に示す第１変換部３０９は、図６に示す変換部３０９と同一の機能部である。

なお、本実施形態において、第２変換部３１１の一部または全ては、データ仮想化装置３０に備えられるＣＰＵ３１（つまり、データ仮想化装置３０のコンピュータ）に所定のプログラムを実行させること、すなわち、ソフトウェアによって実現されるものとする。ここでは、上記した第２変換部３１１の一部または全てがソフトウェアによって実現されるものとして説明したが、当該第２変換部３１１の一部または全ては、例えばハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。

ここで、クライアント端末２０においてユーザによって指定されるデータ取得クエリには例えばデータを取得する対象となるテーブルのテーブル名が含まれているが、当該ユーザがデータ仮想化装置３０において作成されている外部テーブルのテーブル名以外のテーブル名を含むデータ取得クエリを指定した場合には、当該外部テーブルを介して適切なデータを取得することができない。

そこで、本実施形態における第２変換部３１１は、クライアント端末２０において指定されたデータ取得クエリに含まれるテーブル名を変換する機能を有する。なお、データ取得クエリにはカラム名が含まれる場合があるが、第２変換部３１１は、当該カラム名を変換する機能も有する。

以下、本実施形態に係るデータ仮想化装置３０の動作について説明する。まず、図２１を参照して、データ取得クエリに含まれるテーブル名及びカラム名を変換する際のデータ仮想化装置３０の動作の概要を説明する。

クライアント端末２０において「ＳＥＬＥＣＴａｍｏｕｎｔ，ｒａｔｅＦＲＯＭｂｕｙｉｎｇ」というデータ取得クエリが指定された場合を想定する。なお、このデータ取得クエリは、テーブル名が「ｂｕｙｉｎｇ」であるテーブルからカラム名が「ａｍｏｕｎｔ」及び「ｒａｔｅ」であるカラムのデータを取得することを示している。すなわち、このデータ取得クエリには、テーブル名（ＴＡＢＬＥ）及びカラム名（ＣＯＬＵＭＮ）が含まれている（指定されている）。なお、データ取得クエリには、データを取得する際の条件（ＷＨＥＲＥ）が含まれていてもよい。

この場合、データ取得クエリは、インタフェース部３０２によって取得され、当該インタフェース部３０２からクエリ解析部３０３に渡される。

クエリ解析部３０３は、データ取得クエリを解析する。この場合、クエリ解析部３０３は、例えばデータ取得クエリが正しい文法で記述されているか否か（つまり、データ取得クエリの正当性）を確認するために、当該データ取得クエリの構文を表すパースツリーを作成する。図２１に示す例においては、クエリ解析部３０３によってデータ取得クエリのパースツリーが作成されることによって、当該データ取得クエリに含まれるテーブル名「ｂｕｙｉｎｇ」、カラム名「ａｍｏｕｎｔ」及び「ｒａｔｅ」が取得される。

この場合、第２変換部３１１は、上記したように取得されたテーブル名及びカラム名を変換する。図２１に示す例では、テーブル名「ｂｕｙｉｎｇ」は「ｐｕｒｃｈａｓｅ」に変換され、カラム名「ａｍｏｕｎｔ」は「ｑｕａｎｔｉｔｙ」に変換されている。なお、図２１に示す例では、カラム名「ｒａｔｅ」は変換する必要がないため、変換されていない。

これによれば、クエリ解析部３０３は、「ＳＥＬＥＣＴｑｕａｎｔｉｔｙ，ｒａｔｅＦＲＯＭｐｕｒｃｈａｓｅ」というデータ取得クエリを作成し、クエリ実行部３０５に渡すことができる。

なお、第２変換部３１１による変換処理（データ取得クエリに含まれるテーブル名及びカラム名の変換）は、前述した第１実施形態において説明した変換部３０９による変換処理（スキーマ情報に含まれるテーブル名及びカラム名の変換）と同様であるため、ここではその詳しい説明を省略する。

次に、図２２のフローチャートを参照して、クライアント端末２０においてデータ取得クエリが指定された際のデータ仮想化装置３０の処理手順の一例について説明する。

上記したようにクライアント端末２０においてデータ取得クエリが指定された場合、インタフェース部３０２は、当該データ取得クエリをクライアント端末２０から取得（入力）する（ステップＳ４１）。なお、ステップＳ４１において取得されるデータ取得クエリには、少なくともテーブル名が含まれているが、当該テーブル名に加えてカラム名が含まれている場合もある。

次に、クエリ解析部３０３は、ステップＳ４１において取得されたデータ取得クエリを解析する（ステップＳ４２）。

ここで、ステップＳ４２の処理が実行された場合、クエリ解析部３０３は、ステップＳ４１において取得されたデータ取得クエリの構文を表すパースツリーを作成し、当該パースツリーに基づいて当該データ取得クエリが正しい文法で記述されているか否かを判定（確認）する（ステップＳ４３）。

データ取得クエリが正しい文法で記述されていないと判定された場合（ステップＳ４３のＮＯ）、例えばエラーがクライアント端末２０に返され、図２２の処理は終了される。

一方、データ取得クエリが正しい文法で記述されていると判定された場合（ステップＳ４３のＹＥＳ）、クエリ解析部３０３は、上記したパースツリーからテーブル名を取得（抽出）する（ステップＳ４４）。

次に、クエリ解析部３０３は、データ仮想化装置３０において既に作成されている外部テーブルの中に、ステップＳ４４において取得されたテーブル名の外部テーブルが存在するか否かを判定する（ステップＳ４５）。なお、ステップＳ４５の処理は、ステップＳ４４において取得されたテーブル名を外部テーブルのテーブル名として含む外部テーブル情報（テーブル対応情報または外部カラム情報）が格納部３０１内に存在するか否かに基づいて実行される。

外部テーブルが存在しないと判定された場合（ステップＳ４５のＮＯ）、第２変換部３１１は、ステップＳ４４において取得されたテーブル名を変換する変換処理を実行する（ステップＳ４６）。ステップＳ４６の処理は前述した図８に示すステップＳ４の処理に相当するため、ここではその詳しい説明を省略する。

なお、前述した図８に示すステップＳ４においては例えば類語辞書、ルールまたは学習モデルを用いてテーブル名が変換されるものとして説明したが、例えば当該ステップＳ４において類語辞書を用いてテーブル名が変換される構成の場合には、ステップＳ４６においても同様に類語辞書を用いた変換処理が実行される。ステップＳ４においてルールまたは学習モデルが用いられる場合についても同様である。すなわち、本実施形態におけるデータ取得クエリに含まれるテーブル名及びカラム名の変換処理は、外部テーブルが作成される際に実行された変換処理と同様の処理が実行される。

ステップＳ４６の処理が実行されると、クエリ解析部３０３は、データ仮想化装置３０において既に作成されている外部テーブルの中に、当該ステップＳ４６において変換されたテーブル名（つまり、変換後のテーブル名）の外部テーブルが存在するか否かを判定する（ステップＳ４７）。なお、ステップＳ４７の処理は、ステップＳ４６における変換後のテーブル名を外部テーブルのテーブル名として含む外部テーブル情報（テーブル対応情報または外部カラム情報）が格納部３０１内に存在するか否かに基づいて実行される。

外部テーブルが存在すると判定された場合（ステップＳ４７のＹＥＳ）、クエリ解析部３０３は、ステップＳ４１において取得されたデータ取得クエリに含まれるテーブル名を、ステップＳ４６における変換後のテーブル名と置き換える（ステップＳ４８）。

一方、外部テーブルが存在しないと判定された場合（ステップＳ４７のＮＯ）、ステップＳ４８の処理は実行されない（つまり、データ取得クエリに含まれるデータ名は変換されない）。

次に、クエリ解析部３０３は、上記したパースツリーからカラム名を取得（抽出）する（ステップＳ４９）。

ステップＳ４９の処理が実行されると、クエリ解析部３０３は、データ仮想化装置３０において既に作成されている外部テーブルを構成するカラムの中に、ステップＳ４９において取得されたカラム名のカラムが存在するか否かを判定する（ステップＳ５０）。なお、ステップＳ５０の処理は、ステップＳ４９において取得されたカラム名を、外部テーブルを構成するカラムのカラム名として含む外部テーブル情報（外部カラム情報）が格納部３０１内に存在するか否かに基づいて実行される。

カラムが存在しないと判定された場合（ステップＳ５０のＮＯ）、第２変換部３１１は、ステップＳ４９において取得されたカラム名を変換する変換処理を実行する（ステップＳ５１）。ステップＳ５１の処理は前述した図８に示すステップＳ８の処理に相当するため、ここではその詳しい説明を省略する。

なお、前述した図８に示すステップＳ８においては例えば類語辞書、ルールまたは学習モデルを用いてカラム名が変換されるものとして説明したが、例えば当該ステップＳ８において類語辞書を用いてテーブル名が変換される構成の場合には、ステップＳ５１においても同様に類語辞書を用いた変換処理が実行される。ステップＳ８においてルールまたは学習モデルが用いられる場合についても同様である。

ステップＳ５１の処理が実行されると、クエリ解析部３０３は、データ仮想化装置３０において既に作成されている外部テーブルを構成するカラムの中に、当該ステップＳ５１において変換されたカラム名（つまり、変換後のカラム名）のカラムが存在するか否かを判定する（ステップＳ５２）。なお、ステップＳ５０の処理は、ステップＳ５１における変換後のカラム名を、外部テーブルを構成するカラムのカラム名として含む外部テーブル情報（外部カラム情報）が格納部３０１内に存在するか否かに基づいて実行される。

カラムが存在すると判定された場合（ステップＳ５２のＹＥＳ）、クエリ解析部３０３は、ステップＳ３１において取得されたデータ取得クエリに含まれるカラム名を、ステップＳ５１における変換後のカラム名と置き換える（ステップＳ５３）。

一方、カラムが存在しないと判定された場合（ステップＳ５２のＮＯ）、ステップＳ５３の処理は実行されない（つまり、データ取得クエリに含まれるカラム名は変更されない）。

本実施形態においては、図２２に示すような処理が実行されることにより、データ取得クエリに含まれるテーブル名及びカラム名が変換されたデータ取得クエリを作成することができる。

なお、図２２においては省略されているが、このように作成されたデータ取得クエリはクエリ実行部３０５によって実行され、当該データ取得クエリに基づくデータが外部テーブルを介して各データソース１０から取得される。

上記したステップＳ４５において外部テーブルが存在すると判定された場合（ステップＳ４５のＹＥＳ）、データ取得クエリに含まれるテーブル名は変換されず、ステップＳ５０の処理が実行される。

また、上記したステップＳ５０においてカラムが存在すると判定された場合（ステップＳ５０のＹＥＳ）、データ取得クエリに含まれるカラム名は変換されず、図２２に示す処理は終了される。

上記したように本実施形態においては、例えばデータ取得クエリ（ソーステーブルのデータを取得するためのクエリ）がクライアント端末２０において指定された場合、当該クエリに含まれていているテーブル名（第１テーブル名）またはカラム名（第１カラム名）を変換する。

本実施形態においては、このような構成により、例えばデータ取得クエリを指定するユーザが外部テーブルのテーブル名及びカラム名（つまり、ソーステーブルのテーブル名及びカラム名から変換された外部テーブルのテーブル名及びカラム名）を正確に把握していない場合であっても、当該データ取得クエリに含まれるテーブル名及びカラム名を意味が同じテーブル名及びカラム名に変換することによって、当該変換後のテーブル名及びカラム名を含むデータ取得クエリに基づいて適切にデータを取得することが可能となる。

ここで、図２３に示すように、データソース１０において、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ａｍｏｕｎｔ」及び「ｒａｔｅ」であるカラムから構成されるソーステーブルが管理されており、更に、前述した第１実施形態等において説明したようにテーブル名及びカラム名が変換されることにより、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるカラムから構成される外部テーブルが作成されているものとする。

この場合において、クライアント端末２０において「ＳＥＬＥＣＴａｍｏｕｎｔ，ｒａｔｅＦＲＯＭｂｕｙｉｎｇ」というデータ取得クエリが指定された場合を想定する。この場合、データ取得クエリ「ＳＥＬＥＣＴａｍｏｕｎｔ，ｒａｔｅＦＲＯＭｂｕｙｉｎｇ」（つまり、テーブル名「ｂｕｙｉｎｇ」、カラム名「ａｍｏｕｎｔ」及び「ｒａｔｅ」を含むデータ取得クエリ）では、上記した外部テーブルを参照することができないため、当該データ取得クエリに対してはエラーが返されることになる。

しかしながら、本実施形態においては、データ取得クエリに含まれるテーブル名「ｂｕｙｉｎｇ」を「ｐｕｒｃｈａｓｅ」に変換し、当該データ取得クエリに含まれるカラム名「ａｍｏｕｎｔ」を「ｑｕａｎｔｉｔｙ」に変換することによって、データ取得クエリ「ＳＥＬＥＣＴｑｕａｎｔｉｔｙ，ｒａｔｅＦＲＯＭｐｕｒｃｈａｓｅ」を得ることができるため、当該データ取得クエリを用いて外部テーブルを参照し、当該外部テーブルに関する外部テーブル情報を用いてデータソース１０から適切なデータを取得することが可能となる。

なお、本実施形態においては前述した第１実施形態に係るデータ仮想化装置３０に第２変換部３１１が追加された構成であるものとして説明したが、本実施形態は、前述した第２実施形態に適用されても構わない。すなわち、本実施形態は、前述した第２実施形態に係るデータ仮想化装置３０に第２変換部３１１が追加された構成であっても構わない。

（第４実施形態）
次に、第４実施形態について説明する。本実施形態に係るデータ仮想化システムのネットワーク構成は、前述した第１実施形態と同様であるため、適宜、図１を用いて説明する。本実施形態に係るデータ仮想化装置３０は、マルチテナント機能を有する点で前述した第２実施形態と同様であるが、複数の外部テーブル（の構成）の類似度に基づいて当該複数の外部テーブルからマルチテナントテーブルを作成する点で当該第２実施形態とは異なる。

図２４は、本実施形態に係るデータ仮想化装置３０の機能構成の一例を示すブロック図である。図２４においては、前述した図１５と同様の部分については同一参照符号を付してその詳しい説明を省略し、当該図１５とは異なる部分について主に説明する。

図２４に示すように、本実施形態に係るデータ仮想化装置３０は、類似度判定部３１２を含む。

なお、本実施形態において、類似度判定部３１２の一部または全ては、データ仮想化装置３０に備えられるＣＰＵ３１（つまり、データ仮想化装置３０のコンピュータ）に所定のプログラムを実行させること、すなわち、ソフトウェアによって実現されるものとする。ここでは、上記した類似度判定部３１２の一部または全てがソフトウェアによって実現されるものとして説明したが、当該類似度判定部３１２の一部または全ては、例えばハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。

類似度判定部３１２は、データ仮想化装置３０において作成された複数の外部テーブルの類似度を算出し、当該類似度に基づいて当該複数の外部テーブルが類似しているか否かを判定する機能を有する。

以下、本実施形態に係るデータ仮想化装置３０の動作について説明する。まず、図２５を参照して、マルチテナントテーブルを作成する際のデータ仮想化装置３０の動作の概要を説明する。

ここでは、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｖａｌｕｅｓ」、「ｐｒｉｃｅｓ」及び「ｓｐａｒｅ」であるカラムから構成されるソーステーブル（以下、第１ソーステーブルと表記）を管理しているデータソース１０からスキーマ情報取得部３０７がテーブル名「ｐｕｒｃｈａｓｅ」、カラム名「ｖａｌｕｅｓ」、「ｐｒｉｃｅｓ」及び「ｓｐａｒｅ」を含むスキーマ情報を取得したものとする。

また、テーブル名が「ｂｕｙｉｎｇ」であり、カラム名が「ａｍｏｕｎｔ」、「ｒａｔｅ」及び「ｆｌａｇ」であるソーステーブル（以下、第２ソーステーブルと表記）を管理しているデータソース１０からスキーマ情報取得部３０７がテーブル名「ｂｕｙｉｎｇ」、カラム名「ａｍｏｕｎｔ」、「ｒａｔｅ」及び「ｆｌａｇ」を含むスキーマ情報を取得したものとする。

この場合、図２５においては省略されているが、上記したスキーマ情報に含まれるテーブル名及びカラム名が変換部３０９によって変換され、当該変換されたテーブル名及びカラム名に基づいて外部テーブルが作成される。

図２５に示す例では、上記した第１ソーステーブルに対応する外部テーブル（以下、第１外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」及び「ｓｐａｒｅ」であるカラムから構成されるテーブルが作成される。

また、上記した第２ソーステーブルに対応する外部テーブル（以下、第２外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」及び「ｆｌａｇ」であるカラムから構成されるテーブルが作成される。

本実施形態において、類似度判定部３１２は、上記した第１外部テーブルの構成（第１外部テーブルを構成するカラムのカラム名）と第２外部テーブルの構成（第２外部テーブルを構成するカラムのカラム名）とを比較し、当該第１及び第２外部テーブルの類似度を算出する。類似度判定部３１２による類似度の算出処理の詳細については後述するが、当該類似度が予め定められた値（以下、閾値と表記）以上である場合、マルチテナントテーブル作成部３１０は、第１及び第２外部テーブルを統合し、マルチテナントテーブルを作成する。

なお、上記したように第１外部テーブルはカラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」及び「ｓｐａｒｅ」であるカラムから構成され、第２外部テーブルはカラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」及び「ｆｌａｇ」であるカラムから構成されているが、図２５に示す例において、当該第１及び第２外部テーブルから作成されるマルチテナントテーブルは、例えばカラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるカラム（つまり、第１及び第２外部テーブルにおいて共通するカラム）から構成されている。

ただし、第１及び第２外部テーブルから作成されるマルチテナントテーブルは、例えばカラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」、「ｓｐａｒｅ」及び「ｆｌａｇ」であるカラム（つまり、第１及び第２外部テーブルを構成する全てのカラム）から構成されていてもよい。

上記したようにマルチテナントテーブル作成部３１０によってマルチテナントテーブルが作成された場合、当該マルチテナントテーブルに関するマルチテナントテーブル情報が格納部３０１に登録される。

次に、図２６～図２８のフローチャートを参照して、マルチテナントテーブルを作成する際のデータ仮想化装置３０の処理手順の一例について説明する。

本実施形態においては、前述した図１７に示すステップＳ３１～Ｓ３９の処理に相当するステップＳ６１～Ｓ６９の処理が実行される。

ただし、本実施形態においては、ステップＳ６４において既存外部テーブルの構成が対象外部テーブルの構成と同一でないと判定された場合、当該対象外部テーブルの構成が当該既存外部テーブルの構成と類似するか否かを判定する処理が更に実行される。

具体的には、類似度判定部３１２は、対象外部テーブルに関する外部テーブル情報（外部カラム情報）及び既存外部テーブルに関する外部テーブル情報（外部カラム情報）に基づいて第１カラム数を特定する（ステップＳ７０）。第１カラム数は、対象外部テーブル及び既存外部テーブルにおいてカラム名が共通するカラムの数である。すなわち、第１カラム数は、例えば「対象外部テーブルを構成するカラム∩既存外部テーブルを構成するカラム」の数に相当する。

ステップＳ７０の処理が実行されると、類似度判定部３１２は、対象外部テーブルに関する外部テーブル情報（外部カラム情報）及び既存外部テーブルに関する外部テーブル情報（外部カラム情報）に基づいて第２カラム数を特定する（ステップＳ７１）。第２カラム数は、対象外部テーブルを構成するカラムの数及び既存外部テーブルを構成するカラムの数を合計し、当該合計されたカラムの数から対象外部テーブル及び既存外部テーブルにおいてカラム名が共通するカラムの数（つまり、上記したステップＳ７０において特定された第１カラム数）を減算することによって特定される。すなわち、第２カラム数は、例えば「対象外部テーブルを構成するカラム∪既存外部テーブルを構成するカラム」の数に相当する。

次に、類似度判定部３１２は、上記した第１及び第２カラム数に基づいて、対象外部テーブル及び既存外部テーブルの類似度を算出する（ステップＳ７２）。なお、ステップＳ６２において、類似度は、例えば「第１カラム数／第２カラム数×１００」によって算出される。

類似度判定部３１２は、ステップＳ７２において算出された類似度が閾値以上であるか否かを判定する（ステップＳ７３）。

類似度が閾値以上であると判定された場合（ステップＳ７３のＹＥＳ）、ステップＳ６５及びＳ６６の処理が実行される。

これにより、本実施形態においては、類似度が閾値以上である複数の外部テーブルを統合してマルチテナントテーブルを作成することができる。なお、この場合に作成されるマルチテナントテーブルは、対象外部テーブル及び既存外部テーブルにおいて共通するカラムから構成されていてもよいし、対象外部テーブル及び既存外部テーブルを構成する全てのカラムから構成されていてもよい。

なお、類似度が閾値以上でないと判定された場合（ステップＳ７３のＮＯ）、ステップＳ６９の処理が実行される。

ここではステップＳ６４において既存外部テーブルの構成が対象外部テーブルの構成と同一でないと判定された場合に実行される処理について説明したが、ステップＳ６７において既存マルチテナントテーブルの構成が対象外部テーブルの構成と同一でないと判定された場合においても同様の処理が実行される。

具体的には、類似度判定部３１２は、対象外部テーブルに関する外部テーブル情報（外部カラム情報）及び既存マルチテナントテーブルに関するマルチテナントテーブル情報に基づいて第１カラム数を特定する（ステップＳ７４）。第１カラム数は、対象外部テーブル及び既存マルチテナントテーブルにおいてカラム名が共通するカラムの数である。

ステップＳ７４の処理が実行されると、類似度判定部３１２は、対象外部テーブルに関する外部テーブル情報（外部カラム情報）及び既存マルチテナントテーブルに関するマルチテナントテーブル情報に基づいて第２カラム数を特定する（ステップＳ７５）。第２カラム数は、対象外部テーブルを構成するカラムの数及び既存マルチテナントテーブルを構成するカラムの数を合計し、当該合計されたカラムの数から対象外部テーブル及び既存マルチテナントテーブルにおいてカラム名が共通するカラムの数（つまり、上記したステップＳ７６において特定された第１カラム数）を減算することによって特定される。

次に、類似度判定部３１２は、上記した第１及び第２カラム数に基づいて、対象外部テーブル及び既存マルチテナントテーブルの類似度を算出する（ステップＳ７６）。なお、ステップＳ７６における類似度は、上記したステップＳ７２において説明したように例えば「第１カラム数／第２カラム数×１００」によって算出される。

類似度判定部３１２は、ステップＳ７６において算出された類似度が閾値以上であるか否かを判定する（ステップＳ７７）。

類似度が閾値以上であると判定された場合（ステップＳ７７のＹＥＳ）、ステップＳ６８の処理が実行される。なお、図２６においては省略されているが、上記したように対象外部テーブルを統合することによってマルチテナントテーブルの構成が変化する（つまり、マルチテナントテーブルを構成するカラムに対象外部テーブルを構成するカラムを追加する）場合には、当該マルチテナントテーブルに関するマルチテナントテーブル情報に当該カラムを追加する処理が実行される。なお、「マルチテナントテーブル情報にカラムを追加する」とは、マルチテナントテーブルを構成するカラムとして当該カラムが含まれるようにマルチテナントテーブル情報を変更（更新）することをいう。

これにより、本実施形態においては、既存マルチテナントテーブルと類似度が閾値以上である外部テーブルを当該既存マルチテナントテーブルに更に統合する（追加する）ことができる。

なお、類似度が閾値以上でないと判定された場合（ステップＳ７７のＮＯ）、ステップＳ６３の処理が実行される。ここでは類似度が閾値以上でないと判定された場合には、ステップＳ６３の処理が実行されるものとして説明したが、例えばステップＳ６９の処理が実行されても構わない。

上記したように本実施形態においては、例えば第１外部テーブルを構成する複数のカラムと第２外部テーブルを構成する複数のカラムとの類似度に基づいてマルチテナントテーブルを作成する構成を有する。

ここで、図２９及び図３０を参照して、本実施形態の作用効果を前述した第２実施形態と比較して説明する。

図２９に示すように、例えば第１データソース１０において、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｖａｌｕｅｓ」、「ｐｒｉｃｅｓ」及び「ｓｐａｒｅ」であるカラムから構成される第１ソーステーブルが管理されているものとする。この場合、この第１ソーステーブルに対応する外部テーブル（以下、第１外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」及び「ｓｐａｒｅ」であるカラムから構成されるテーブルが作成されたものとする。

また、例えば第２データソース１０において、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ａｍｏｕｎｔ」、「ｒａｔｅ」及び「ｆｌａｇ」であるカラムから構成されている第２ソーステーブルが管理されているものとする。この場合、この第２ソーステーブルに対応する外部テーブル（以下、第２外部テーブルと表記）として、テーブル名が「ｐｕｒｃｈａｓｅ」であり、カラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」及び「ｆｌａｇ」であるカラムから構成されるテーブルが作成されたものとする。

この場合、前述した第２実施形態においては、上記した２つの外部テーブル（第１及び第２外部テーブル）を統合してマルチテナントテーブルを作成しようとしたとしても、当該２つの外部テーブルの構成が異なる（つまり、当該外部テーブルを構成するカラムのカラム名が一致しない）ため、テーブル名が一致していたとしてもマルチテナントテーブルを作成することができない。すなわち、第１及び第２データソース１０を含む複数のデータソース１０はベンダーが異なることにより当該複数のデータソースにおいて管理されるソーステーブルの構成が異なることが多く、このような場合、前述した第２実施形態においてはマルチテナントテーブルを作成することができない。

一方、本実施形態においては、図３０に示すように、第１及び第２外部テーブルの類似度を算出し、当該類似度が閾値以上である場合には、当該第１及び第２外部テーブルを統合してマルチテナントテーブルを作成することができる。

なお、図３０に示す例においては、上記した第１カラム数（第１及び第２外部テーブルにおいてカラム名が共通するカラム名の数）は２であり、第２カラム数（第１及び第２外部テーブルを構成するカラムの数の合計値から第１カラム数を減算した数）は４であるため、第１及び第２外部テーブルの類似度は５０％である。この場合、例えば閾値が５０％に定められていたものとすると、カラム名が「ｑｕａｎｔｉｔｙ」及び「ｒａｔｅ」であるマルチテナントテーブル、またはカラム名が「ｑｕａｎｔｉｔｙ」、「ｒａｔｅ」、「ｓｐａｒｅ」及び「ｆｌａｇ」であるマルチテナントテーブルを、第１及び第２外部テーブルから作成することができる。

なお、本実施形態においては前述した第２実施形態に係るデータ仮想化装置３０に類似度判定部３１２が追加された構成であるものとして説明したが、本実施形態は、前述した第３実施形態と組み合わせても構わない。すなわち、本実施形態に係るデータ仮想化装置３０は、前述した第３実施形態において説明した第２変換部３１１を含む構成であっても構わない。

（第５実施形態）
次に、第５実施形態について説明する。本実施形態に係るデータ仮想化システムのネットワーク構成は、前述した第１実施形態と同様であるため、適宜、図１を用いて説明する。

ここで、前述した第１実施形態においては類語辞書を用いて外部テーブルを作成するものとして説明したが、本実施形態は、当該類語辞書を自動作成する点で当該第１実施形態とは異なる。

図３１は、本実施形態に係るデータ仮想化装置３０の機能構成の一例を示すブロック図である。図３１においては、前述した図６と同様の部分については同一参照符号を付してその詳しい説明を省略し、当該図６と異なる部分について主に説明する。

図３１に示すように、本実施形態に係るデータ仮想化装置３０は、類語辞書作成部３１３を含む。

なお、本実施形態において、類語辞書作成部３１３の一部または全ては、データ仮想化装置３０に備えられるＣＰＵ３１（つまり、データ仮想化装置３０のコンピュータ）に所定のプログラムを実行させること、すなわち、ソフトウェアによって実現されるものとする。ここでは、上記した類語辞書作成部３１３の一部または全てがソフトウェアによって実現されるものとして説明したが、当該類語辞書作成部３１３の一部または全ては、例えばハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。

類語辞書作成部３１３は、上記した外部テーブルを作成する際に用いられる類語辞書を自動的に作成する機能を有する。類語辞書作成部３１３は、例えばユーザによって指定されたドメインに基づいて検索されたＷｅｂサイト（Ｗｅｂページ）を解析することによって、当該Ｗｅｂサイトから抽出された単語に基づいて、当該ドメインに関する類語辞書を作成する。

以下、本実施形態に係るデータ仮想化装置３０の動作について説明する。まず、図３２を参照して、類語辞書を作成する際のデータ仮想化装置３０の動作の概要を説明する。

類語辞書を作成する場合、ユーザは、例えばクライアント端末２０を操作することによって、当該クライアント端末２０に表示されるドメイン指定画面においてドメインを指定することができるものとする。本実施形態において、ユーザによって指定されるドメインには、例えば類語辞書の分野を指示するキーワード等が含まれる。

このようにユーザによってドメイン（キーワード）が指定された場合、当該ドメインに関連するＷｅｂサイトが検索され、当該検索結果に対してクローリングが実施される。なお、クローリングとは、Ｗｅｂサイトを巡回することをいう。

次に、クローリングされたＷｅｂサイトに対してスクレイピングが実施されることにより、当該Ｗｅｂサイトから単語（群）が抽出され、当該Ｗｅｂサイトに記述されている単語の一覧（すなわち、ユーザによって指定されたドメインに関する単語の一覧）が取得される。

このように取得された単語の一覧から当該単語の各々の出現回数（出現頻度）を取得し、当該出現回数に基づいて頻出単語の一覧が生成される。

ここで、データ仮想化装置３０は概念辞書（意味辞書）を保持しているものとする。この概念辞書においては、意味が同一または類似している単語の集合が定義されているものとする。

本実施形態においては、このような概念辞書を用いて、上記した頻出単語の類語を検索し、当該頻出単語を代表語、当該検索結果を当該代表語の類語として、類語辞書に登録する。

詳しい説明については省略するが、前述した第１実施形態において説明した例によれば、例えばＷｅｂサイトから抽出された頻出単語が例えば「ｐｕｒｃｈａｓｅ」であり、当該「ｐｕｒｃｈａｓｅ」の類語として「ｂｕｙｉｎｇ」及び「ｐｕｒｃｈａｓｉｎｇ」等が概念辞書から検索された場合には、代表語「ｐｕｒｃｈａｓｅ」と、類語「ｂｕｙｉｎｇ」及び「ｐｕｒｃｈａｓｉｎｇ」とが対応づけて登録された類語辞書が作成される。

本実施形態においては、このような処理を頻出単語毎に行うことにより、複数の代表語が登録された類語辞書を自動的に作成することができる。

次に、図３３のフローチャートを参照して、類語辞書を作成する際のデータ仮想化装置３０（類語辞書作成部３１３）の処理手順の一例について説明する。

まず、例えばユーザによってドメインが指定された場合、類語辞書作成部３１３は、当該ドメインを取得する（ステップＳ８１）。なお、本実施形態においてはドメインがユーザによって指定されるものとして説明するが、当該ドメインは、例えばデータソース１０において管理されているソーステーブルの情報（例えば、テーブル名及び当該テーブルを構成するカラムのカラム名）や当該テーブルに保持されているデータ等に基づいて自動的に指定されてもよい。

次に、類語辞書作成部３１３は、ステップＳ８１において取得されたドメインに基づくＷｅｂ検索を実行する（ステップＳ８２）。なお、ステップＳ８２の処理は、所定の検索エンジンを用いて実行されてもよい。

ここで、ステップＳ８２の処理が実行されると、当該ステップＳ８２における検索結果として複数のＷｅｂサイトのＵＲＬ（Uniform Resource Locator）が取得される。類語辞書作成部３１３は、このように取得された複数のＷｅｂサイトのＵＲＬのうちの１つのＵＲＬを取得する（ステップＳ８３）。

類語辞書作成部３１３は、ステップＳ８３において取得されたＵＲＬに基づいてＷｅｂサイトにアクセスし、当該Ｗｅｂサイトを解析することによって当該Ｗｅｂサイトから単語群を抽出する（ステップＳ８４）。

ここで、例えば類語辞書を作成するためにＮ個のＷｅｂサイトから単語（群）を抽出する（つまり、ステップＳ８３及びＳ８４の処理をＮ回実行する）ものとすると、類語辞書作成部３１３は、当該処理の回数がＮ回未満であるか否かを判定する（ステップＳ８５）。なお、Ｎ（回）は、データ仮想化装置３０（または類語辞書作成部３１３）において予め定められていればよいが、上記したドメインととともにユーザによって指定されてもよい。

Ｎ回未満であると判定された場合（ステップＳ８５のＹＥＳ）、ステップＳ８３に戻って処理が繰り返される。この場合、既に単語群が抽出されたＷｅｂサイトのＵＲＬとは異なるＵＲＬがステップＳ８３において取得され、ステップＳ８４の処理が実行される。

一方、Ｎ回未満でない（つまり、処理がＮ回実行された）と判定された場合（ステップＳ８５のＮＯ）、類語辞書作成部３１３は、Ｎ回繰り返し実行されたステップＳ８４において抽出された複数の単語（単語群）を当該単語の各々の出現回数に基づいてソートする（ステップＳ８６）。このステップＳ８６の処理が実行されることによって、上記した頻出単語の一覧が取得される。

以下、ステップＳ８６の処理が実行されることによって取得された頻出単語の一覧から、出現回数が最も多い単語（以下、対象単語と表記）を取得する（ステップＳ８７）。

ステップＳ８７の処理が実行されると、類語辞書作成部３１３は、当該ステップＳ８７において取得された対象単語に基づいて、概念辞書から当該対象単語の類語を検索する（ステップＳ８８）。

類語辞書作成部３１３は、ステップＳ８７において取得された対象単語を代表語、ステップＳ８８の処理が実行されることによって得られた検索結果を当該対象単語の類語とし、当該代表語及び類語を対応づけて類語辞書に登録する（ステップＳ８９）。

ここで、例えば類語辞書を作成するためにＭ個の代表語を類語辞書に登録するものとすると、類語辞書作成部３１３は、類語辞書に登録された代表語の数がＭ個未満であるか否かを判定する（ステップＳ９０）。なお、Ｍ（個）は、データ仮想化装置３０（または類語辞書作成部３１３）において予め定められていればよいが、上記したドメインとともにユーザによって指定されてもよい。

Ｍ個未満であると判定された場合（ステップＳ９０のＹＥＳ）、ステップＳ８７戻って処理が繰り返される。この場合、上記した対象単語の次に出現回数が多い単語が対象単語としてステップＳ８７において取得され、ステップＳ８８及びＳ８９の処理が実行される。

なお、ステップＳ８７において取得された単語が既に類語としてステップＳ８９において登録されている場合には、当該単語については処理を省略するものとする。

上記したように本実施形態においては、ユーザによって指定されたドメインに基づいて検索されたＷｅｂサイト（Ｗｅｂページ）から抽出された単語に基づいて、類語辞書を作成する。具体的には、本実施形態においては、出現回数が多い単語及び当該単語の類語を類語辞書に登録することによって当該類語辞書を作成する。

本実施形態においては、このような構成により、類語辞書を自動的に作成することができるため、外部テーブルを作成する際に用いられる類語辞書を予め用意しておく必要がない。また、本実施形態においては、ユーザによって指定されたドメインに特化した類語辞書を作成することができるため、外部テーブルを作成する際にユーザの意図するテーブル名及びカラム名の変換を実現することができる。

なお、本実施形態においては、例えば予めデータ仮想化装置３０内において概念辞書を保持しているが、当該概念辞書には単に類語の集合が定義されているのみであり、代表語が定義されていないため、外部テーブルを作成するための類語辞書として用いることができない。

このため、本実施形態においては、ユーザによって指定されたドメインに基づいて検索されたＷｅｂサイトから抽出された単語群のうち出現頻度の高い単語を代表語とするとともに、当該代表語の類語を概念辞書から検索することによって、類語辞書を作成することができる。

なお、本実施形態においては概念辞書（類語の集合が定義された辞書）を利用して類語辞書が作成されるものとして説明した、類語辞書を作成するために必要な類語は、例えばＷｅｂ検索等により取得されても構わない。

また、本実施形態においては前述した第１実施形態に係るデータ仮想化装置３０に類語辞書作成部３１３が追加された構成であるものとして説明したが、本実施形態は、前述した第２～第４実施形態に適用されても構わない。すなわち、本実施形態は、前述した第２～第４実施形態に係るデータ仮想化装置３０に類語辞書作成部３１３が追加された構成であっても構わない。

以上述べた少なくとも１つの実施形態によれば、複数のデータソースにおいて管理されているテーブルに対する効率的なアクセスを実現することが可能なデータ仮想化装置及び方法を提供することにある。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

１０…データソース、２０…クライアント端末、３０…データ仮想化装置、３１…ＣＰＵ、３２…不揮発性メモリ、３３…主メモリ、３４…通信デバイス、３０１…格納部、３０２…インタフェース部、３０３…クエリ解析部、３０４…クエリプラン作成部、３０５…クエリ実行部、３０６…クエリ分割部、３０７…スキーマ情報取得部、３０８…外部テーブル情報登録部、３０９…変換部，第１変換部、３１０…マルチテナントテーブル作成部、３１１…第２変換部、３１２…類似度判定部、３１３…類語辞書作成部。

Claims

第１及び第２データソースと接続され、格納手段を有するデータ仮想化装置において、
前記第１データソースにおいて管理されている第１ソーステーブルの第１テーブル名を含む第１スキーマ情報と、前記第２データソースにおいて管理されている第２ソーステーブルの第２テーブル名を含む第２スキーマ情報とを取得する取得手段と、
前記取得された第１スキーマ情報に含まれる第１テーブル名を第３テーブル名に変換し、前記取得された第２スキーマ情報に含まれる第２テーブル名を第３テーブル名に変換する第１変換手段と、
前記第１ソーステーブルに対応する第１外部テーブルを作成するために、前記第１テーブル名及び当該第１テーブル名から変換された第３テーブル名を対応づけて含む第１テーブル対応情報を前記格納手段に登録し、前記第２ソーステーブルに対応する第２外部テーブルを作成するために、前記第２テーブル名及び当該第２テーブル名から変換された第３テーブル名を対応づけて含む第２テーブル対応情報を前記格納手段に登録する登録手段と
を具備するデータ仮想化装置。
前記第１スキーマ情報は、前記第１ソーステーブルを構成する第１カラムの第１カラム名を含み、
前記第２スキーマ情報は、前記第２ソーステーブルを構成する第２カラムの第２カラム名を含み、
前記第１変換手段は、前記取得された第１スキーマ情報に含まれる第１カラム名を第３カラム名に変換し、前記取得された第２スキーマ情報に含まれる第２カラム名を第３カラム名に変換し、
前記登録手段は、前記第１テーブル名及び前記第１カラム名を対応づけて含む第１ソースカラム情報と、当該第１テーブル名から変換された第３テーブル名及び当該第１カラム名から変換された第３カラム名を対応づけて含む第１外部カラム情報とを前記格納手段に登録し、前記第２テーブル名及び前記第２カラム名を対応づけて含む第２ソースカラム情報と、当該第２テーブル名から変換された第３テーブル名及び当該第２カラム名から変換された第３カラム名を対応づけて含む第２外部カラム情報とを前記格納手段に登録する
請求項１記載のデータ仮想化装置。
前記第３テーブル名は、前記第１テーブル名及び前記第２テーブル名の類語であり、
前記第３カラム名は、前記第１カラム名及び前記第２カラム名の類語である
請求項２記載のデータ仮想化装置。
前記第１変換手段は、複数の代表語及び当該複数の代表語の各々の類語が対応づけて登録されている類語辞書を参照して、前記第１テーブル名に対応づけて当該類語辞書に登録されている代表語を前記第３テーブル名として当該第１テーブル名を当該第３テーブル名に変換し、前記第１カラム名に対応づけて当該類語辞書に登録されている代表語を前記第３カラム名として当該第１カラム名を当該第３カラム名に変換し、前記第２テーブル名に対応づけて当該類語辞書に登録されている代表語を前記第３テーブル名として当該第２テーブル名を当該第３テーブル名に変換し、前記第２カラム名に対応づけて当該類語辞書に登録されている代表語を前記第３カラム名として当該第２カラム名を当該第３カラム名に変換する請求項２または３記載のデータ仮想化装置。
前記第１変換手段は、テーブル名及びカラム名における表記の揺れを訂正するためのルールを用いて、前記第１テーブル名を前記第３テーブル名に変換し、前記第１カラム名を前記第３カラム名に変換し、前記第２テーブル名を前記第３テーブル名に変換し、前記第２カラム名を前記第３カラム名に変換する請求項２または３記載のデータ仮想化装置。
前記第１変換手段は、テーブル名及びカラム名を入力として、当該テーブル名及びカラム名の類語を出力するように学習された学習モデルを用いて、前記第１テーブル名を前記第３テーブル名に変換し、前記第１カラム名を前記第３カラム名に変換し、前記第２テーブル名を前記第３テーブル名に変換し、前記第２カラム名を前記第３カラム名に変換する請求項２または３記載のデータ仮想化装置。
前記第１及び第２外部カラム情報に基づいて、前記第１及び第２外部テーブルが統合されたマルチテナントテーブルを作成する第１作成手段を更に具備する請求項２記載のデータ仮想化装置。
前記第１ソーステーブルに保持されているデータを取得するためのクエリが指定された場合、当該クエリに含まれている当該第１ソーステーブルの第１テーブル名を第３テーブル名に変換し、当該クエリに含まれている当該第１ソーステーブルを構成する第１カラムの第１カラム名を第３カラム名に変換する第２変換手段を更に具備する請求項２記載のデータ仮想化装置。
前記第１外部テーブルは、前記第１カラム名から変換された第３カラム名の第３カラムを含む複数のカラムから構成され、
前記第２外部テーブルは、前記第２カラム名から変換された第３カラム名の第３カラムを含む複数のカラムから構成され、
前記第１作成手段は、前記第１外部テーブルを構成する複数のカラムと前記第２外部テーブルを構成する複数のカラムとの類似度に基づいて、前記マルチテナントテーブルを作成する
請求項７記載のデータ仮想化装置。
ユーザによって指定されたドメインに基づいて検索されたＷｅｂページから抽出された単語に基づいて、前記類語辞書を作成する第２作成手段を更に具備する請求項４記載のデータ仮想化装置。
前記第２作成手段は、前記抽出された単語のうち、出現回数が多い単語及び当該単語の類語を前記類語辞書に登録する請求項１０記載のデータ仮想化装置。
第１及び第２データソースと接続され、格納手段を有するデータ仮想化装置が実行する方法において、
前記第１データソースにおいて管理されている第１ソーステーブルの第１テーブル名を含む第１スキーマ情報と、前記第２データソースにおいて管理されている第２ソーステーブルの第２テーブル名を含む第２スキーマ情報とを取得するステップと、
前記取得された第１スキーマ情報に含まれる第１テーブル名を第３テーブル名に変換し、前記取得された第２スキーマ情報に含まれる第２テーブル名を第３テーブル名に変換するステップと、
前記第１ソーステーブルに対応する第１外部テーブルを作成するために、前記第１テーブル名及び当該第１テーブル名から変換された第３テーブル名を対応づけて含む第１テーブル対応情報を前記格納手段に登録し、前記第２ソーステーブルに対応する第２外部テーブルを作成するために、前記第２テーブル名及び当該第２テーブル名から変換された第３テーブル名を対応づけて含む第２テーブル対応情報を前記格納手段に登録するステップと
を具備する方法。