JP6262505B2 - 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム - Google Patents

分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム Download PDF

Info

Publication number
JP6262505B2
JP6262505B2 JP2013246938A JP2013246938A JP6262505B2 JP 6262505 B2 JP6262505 B2 JP 6262505B2 JP 2013246938 A JP2013246938 A JP 2013246938A JP 2013246938 A JP2013246938 A JP 2013246938A JP 6262505 B2 JP6262505 B2 JP 6262505B2
Authority
JP
Japan
Prior art keywords
processing
query
data
distributed
plan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013246938A
Other languages
English (en)
Other versions
JP2015106219A (ja
Inventor
和広 斉藤
和広 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013246938A priority Critical patent/JP6262505B2/ja
Publication of JP2015106219A publication Critical patent/JP2015106219A/ja
Application granted granted Critical
Publication of JP6262505B2 publication Critical patent/JP6262505B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、一つ以上のデータベースシステムに対する論理的なモデルを提供するデータ仮想化システムに関し、クエリ処理を複数のデータ仮想化装置に分散して並列処理する分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラムに関する。
データ仮想化システム(又はマルチデータベースシステム)は、複数のデータベースシステムを仮想的に一つのデータベースシステムに見せるために、各データベースシステムが持つテーブルを論理的に一つのシステムに集約して管理し、ユーザのクエリに対応するデータベースシステムにクエリを投稿する。
代表的なデータ仮想化システムは、例えば特許文献1に示されるように、複数の階層的なデータベースシステムを、データマッピングにより仮想スキーマ(実際の物理テーブルをユーザに提供する論理テーブルに変換する処理を定義したもの)に統合し、クエリ実行時において処理対象となるデータを保持するデータベースシステムにクエリを分配するよう構成されている。各データベースシステムで実行されたクエリの結果は中央に収集され、仮想スキーマに従って一つに統合して結果を出力するシステムとなっている。
特開平07−141399号公報
特許文献1のように、複数のデータベースシステムに跨がるクエリ処理の最終的な統合処理は、データ仮想化システム上で実行する必要がある。このとき、一つ以上のデータベースシステムから得られるデータが、データ仮想化システムの物理メモリサイズを超えるほど大規模であった場合、実行できずにエラー終了してしまう可能性がある。
OSのスワップ機構もしくはデータ仮想化システムのディスク退避の機能の実装によってある程度のサイズまでは対応可能であると考えられるが、それによる遅延は非常に大きく、その許容量を超えてしまった場合にも同様に終了してしまうという問題がある。
ユーザにとってデータ仮想化システムを利用する最大のメリットは、個々のデータベースシステムを意識せず利用できる点にあり、データ仮想化システムがアクセスするデータベースシステムのクエリ処理の結果が大規模かどうかを意識させることはデータ仮想化システムの利益を損なうこととなる。
本発明は上記実情に鑑みて提案されたものであり、データ仮想化システムにおいて、一台のデータ仮想化装置では処理しきれない大規模なデータを、複数のデータ仮想化装置に分散して並列処理を行う分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラムを提供することを目的としている。
上記目的を達成するため本発明の請求項1は、クエリ処理要求と結果受信を行うクライアントと、クエリ処理を行うデータ仮想化装置と、前記データ仮想化装置が利用する1つ以上のデータベースシステムと、前記データ仮想化装置のリソース量に関する情報、及び、前記データベースシステムが有するテーブル情報を管理する分散型データ仮想化システム管理装置と、を備えた分散型データ仮想化システムにおいて、
前記データ仮想化装置は、複数のデータ仮想化装置から構成し、
前記各データ仮想化装置は、
前記クエリ処理の手順を定義したクエリプランと前記リソース量及び前記テーブル情報を考慮し、クエリ処理を並列実施する複数のデータ仮想化装置の選定と当該複数のデータ仮想化装置でのクエリ処理内容とを含む分散処理計画を作成する分散処理計画部と、
分散処理するデータ仮想化装置群に前記分散処理計画を分配する処理計画配置部と、
前記分散処理計画に応じて各データベースシステムから取得した処理対象データをレコード単位で他のデータ仮想化装置に分配又は当該データ仮想化装置で受信するデータ分散部と、
前記分散処理計画に従った処理を行うクエリ処理部と、
前記分散処理計画に従った処理の結果を各クエリ処理部から受信し、集計した結果を前記クライアントに送信するデータ集計部とを備えることを特徴としている。
請求項2は、クエリ処理要求と結果受信を行うクライアントと、クエリ処理を行う複数のデータ仮想化装置と、前記データ仮想化装置のリソース量に関する情報を管理する分散型データ仮想化システム管理装置と、前記データ仮想化装置が利用する1つ以上のデータベースシステムとを備えた分散型データ仮想化システムにおけるクエリ処理方法であって、
前記クライアントからクエリ処理要求があった場合に、
クエリ処理の手順を定義したクエリプランを作成するクエリプラン作成手順と、
前記クエリプランと前記リソース量及び前記データベースシステムが有するテーブル情報を考慮して、クエリ処理を並列実施する複数のデータ仮想化装置の選定と当該複数のデータ仮想化装置での分散クエリ処理内容とを含む分散処理計画を作成する分散処理計画手順と、
分散処理するデータ仮想化装置群に前記分散処理計画を分配する処理分配手順と、
前記分散処理計画に応じて各データベースシステムから取得した処理対象データをレコード単位で分配又は受信するデータ分散手順と、
前記分散処理計画に従った処理を行うクエリ処理手順と、
前記分散処理計画に従った処理の結果を受信し、集計した結果を前記クライアントに送信するデータ集計手順と
を含むことを特徴としている。
請求項3は、請求項2のクエリ処理方法において、
前記分散処理計画手順は、 前記分散クエリ処理内容から各データベースシステムから得られる分散クエリ結果の容量を計算する手順と、
計算された容量から、実際の物理テーブルをユーザに提供する論理テーブルに変換する処理を定義した仮想スキーマで得られるテーブルや中間テーブル、最終的な結果の出力容量と、前記仮想スキーマの処理における最大処理容量を計算する手順と、
計算された容量を利用して、必要なデータ仮想化装置の数及び適用先のデータ仮想化装置を決定するデータ仮想化装置群選択手順と
を含むことを特徴としている。
請求項4は、請求項3のクエリ処理方法において、
前記データ仮想化装置群選択手順は、
前記クエリプランから作成したプランツリーを根(クエリ結果)から順に前記クエリ処理を実行するノードを決める対象となるテーブルを降順探索する手順と、
前記テーブルが仮想スキーマにおける出力テーブルである場合に、当該仮想スキーマにおける最大出力容量と、データ仮想化装置群における利用状況及び利用可能メモリサイズからデータ仮想化装置群を選択する手順と
を含むことを特徴としている。
請求項5は、請求項2のクエリ処理方法において、
前記データ分散手順は、
前記各データベースシステムから前記処理対象データを取得する手順と、
前記処理対象データを処理するデータ仮想化装置をレコード単位で判定する手順と
を含むことを特徴としている。
請求項6は、請求項2のクエリ処理方法において、
前記クエリ処理手順は、
処理完了により次の処理を行う場合に、
単項演算であるか二項演算であるかを判定する手順と、
二項演算である場合は、二項演算の完了通知を待って次の処理を行うためのデータ移動とクエリ処理を行う手順と
を含むことを特徴としている。
請求項7は、請求項2の各手順をコンピュータに実行させるクエリ処理プログラム。
であることを特徴している。
本発明(請求項1及び請求項2)によれば、分散処理計画と処理計画配置を行うことで、複数のデータ仮想化装置上の処理を分散化し並列処理を行うことができ、大規模データ処理に対応することが可能となる。
また、仮想スキーマを利用した分散による並列性の向上を実現することができる。
また、仮想スキーマの処理を独立化することにより、クエリ再実行の効率化及び仮想化対象のデータベースシステムの負荷軽減を実現することができる。
請求項3及び請求項4によれば、分散クエリ結果の容量と、仮想スキーマの処理における最大処理容量を考慮することで、適切なデータ仮想化装置群の選択が可能となる。
請求項5によれば、データ仮想化装置を判定するに際して、各テーブルの1レコードずつ指定するので、処理に適したデータ仮想化装置を選択することができる。
請求項6によれば、クエリ処理を行うに際し、二項演算の完了通知を待って次の処理を行うようにしたので、計画に沿ったクエリ処理を確実に行うことが可能となる。
請求項7によれば、複数のデータ仮想化装置上の処理を分散化し並列処理を行うことができるクエリ処理方法をコンピュータ上に構築することができる。
本発明の分散型データ仮想化システムの全体構成図を示すモデル図である。 一般的なデータ仮想化システムにおける仮想スキーマの例を示す 分散型データ仮想化システムにおけるデータ仮想化装置の構成を説明するためのブロック図である。 分散型データ仮想化システムにおけるデータ仮想化処理及び分散クエリ処理において、データ仮想化装置が各データベースシステムの処理結果を受け取るまでのデータの流れを示すブロック図である。 分散型データ仮想化システムにおけるデータ仮想化処理及び分散クエリ処理において、データ仮想化装置が各データベースシステムの処理結果を分散処理するときのデータの流れを示すブロック図である。 データ仮想化装置の分散処理計画部における処理手順を示すフローチャート図である。 図5の仮想スキーマaを例に、ユーザが投稿したSQLクエリ「SELECT aid FROM a」のクエリプランをプランツリーへの変換例を示すモデル図である。 図6における「各テーブルの処理データ仮想化装置群選択」についての処理手順を示すフローチャート図である。 作成した分散処理計画を利用するデータ仮想化装置群に配布し、データベースシステムにおけるクエリ処理が完了した直後のデータ分散処理について、図9に示す。フローチャート図である。 データ仮想化装置のクエリ処理部において、クエリツリー上のそれぞれの処理が完了した後の処理の流れを図10に示す。フローチャート図である。
本発明の分散型データ仮想化システムの実施形態について、図1を参照して説明する。
本発明の分散型データ仮想化システムは、データ仮想化システムにおいて、一台のデータ仮想化装置では処理しきれない大規模なデータを、複数のデータ仮想化装置に分散して並列処理を行うシステムであり、図1に示すように、システムを利用するクライアント1と、分散型データ仮想化システム管理装置2と、1つ以上のデータ仮想化装置3と、分散型データ仮想化システムが利用する1つ以上のデータベースシステム4から構成されている。
各データ仮想化装置3と、クライアント1及び分散型データ仮想化システム管理装置2とはネットワークXを介して接続されている。また、各データ仮想化装置3と各データベースシステム4とはネットワークYを介して接続されている。
クライアント1、分散型データ仮想化システム管理装置2、各データ仮想化装置3及び各データベースシステム4は、それぞれ、オペレーティングシステム(OS)を含む基本プログラムや各種の基本デバイスが記憶されたROMと、各種のプログラムションやデータが記憶されるハードディスクドライブ装置(HDD)と、CR-ROMやDVD等の記憶媒体からプログラムやデータを読み出すメディアドライブ装置と、プログラムを実行するCPUと、このCPUにワークエリアを提供するRAMと、外部装置と通信するパラレル/シリアルI/Fとを主要部分とする一般的な構成を備えたコンピュータ上に構築されている。
例えば、上述した構成を有する各コンピュータにおいて、メディアドライブ装置で読み取られたクエリ処理プログラムがHDDにインストールされることで分散型データ仮想化システムが構築される。
クライアント1は、データ仮想化装置3の利用状況や稼働状況から適切な一つのデータ仮想化装置3に接続し、クエリの投稿と結果の受信を行う分散コネクタ11を備えている。
分散型データ仮想化システム管理装置2は、それぞれのデータ仮想化装置3が持つリソース容量及び現在の利用状況(リソース情報)を保持するリソース管理データ21と、各データベースシステム4上にあるテーブル情報(物理モデルやサイズ、クエリによるサイズ変更差分)を持つデータソース管理データ22と、その物理モデルに対する仮想スキーマの構成、変換手順(論理モデル情報)及び消費リソース量に関する情報(消費情報)を持つモデルデータ23を備えている。
モデルデータ23が有する仮想スキーマは、ユーザがクエリで指定する論理テーブルを、どのデータベースシステム4上のテーブルに対して、どのように処理を行うかに関する仮想スキーマ情報を管理している。例えば、データ仮想化装置3にクエリが投稿された場合の仮想スキーマによる一般的な処理例について、図2に示す。
ここでは、クライアント1からテーブルaへのSQLクエリが投稿されたとする。データ仮想化装置3上では、テーブルaに対して、テーブルsとテーブルtのUNION処理の結果が仮想スキーマaと定義されている。テーブルsは、実際にはデータベースシステムS上にあるテーブルであり、テーブルtは、データベースシステムTにあるテーブルである。
このとき、クライアント1が投稿したSQLクエリに対して、テーブルaを仮想スキーマaの処理に変換する。そして、このクエリは、データ仮想化装置3上で実行されるクエリ(UNION)、データベースシステムS上で実行されるクエリ(テーブルsへのSQLクエリ)、データベースシステムT上で実行されるクエリ(テーブルtへのSQLクエリ)に分解され、各データベースシステム4にクエリが投稿される。
それぞれのデータベースシステム4の処理結果は、クエリを投稿したデータ仮想化装置3に収集され、予め作られたクエリ(UNION)処理を実行してクライアント1に送信される。
データ仮想化装置3は、図3〜図5に示すように、クエリ評価部31と、分散クエリ生成部32と、分散クエリ投稿部33と、分散処理計画部34と、処理計画配置部35と、クエリ結果受信部36、データ分散部37と、クエリ処理部38と、データ集計部39とを備えて構成されている。
クエリ評価部31は、クライアント1からクエリ処理要求を受け取り、モデルデータ23から仮想スキーマ情報を取得Aして、この情報に従ってクエリ処理の手順を定義したクエリプランを生成する(図4)。
分散クエリ生成部32は、データソース管理データ22からテーブル情報を取得Bし、この情報を基にクエリプランに従って適切なデータベースシステム4向けのクエリを生成(再構成)する(図4)。
分散クエリ投稿部33は、分散クエリ生成部32で生成したクエリを各データベースシステム4に投稿Cする(図3)。
分散処理計画部34は、リソース管理データ21からリソース情報を取得Dし、モデルデータ23から論理モデル情報及び消費情報を取得Eし、データソース管理データ22からテーブル情報を取得Fし、クエリ評価部31で生成されたクエリプランに対してこれらの情報を利用して、処理内容と処理を実施するデータ仮想化装置3を選択する分散処理計画を生成する。
処理計画配置部35は、分散処理するデータ仮想化装置群に分散処理計画部34で生成した分散処理計画を分配Gする(図3)。
クエリ結果受信部36は、各データベースシステム4からのクエリ実行結果の受信Hし、データ分散部37への出力Iを行う(図4)。
データ分散部37は、リソース管理データ21からリソース情報を受信Jするとともに、処理計画配置部35から分散処理計画を受け取り、この計画に基いて各データベースシステム4から受信したクエリ実行結果をレコード単位で各データ仮想化装置3のデータ分散部37に分配K又は受信する(図5)。
クエリ処理部38は、データ分散部37との間で分散処理計画に基いた処理Lを行う(図5)。
データ集計部39は、処理Lの結果を各クエリ処理部38から受信Mして集計し、その結果をクライアント1の分散コネクタ11に転送Oする(図5)。
なお、データ仮想化装置を構成する各データ仮想化装置3は、それぞれ同様の機能を備えて構成されている。
データベースシステム4は、クエリを処理するクエリエンジン41と、実データを保管するデータソース42から構成されている。
次に、分散型データ仮想化システムにおけるデータ仮想化処理及び分散クエリ処理の一連の流れについて説明する。
ユーザは、クライアント1の分散コネクタ11を経由してクエリを投稿する。
クエリ評価部31はクエリを受け取り、クエリの処理対象となるテーブルに対応する仮想スキーマをモデルデータ23から呼び出し、ユーザが投稿したクエリに仮想スキーマの処理を適用した形でクエリプランを生成する。
このクエリプランには、データ仮想化装置(以下、ノードと称する)3群に接続されたデータベースシステム4群の実際のテーブルが含まれる。
分散クエリ生成部32は、このテーブルとデータソース管理データ22を突合し、対象のデータベースシステム4を明確にする。そして、クエリプランを基に実際のデータベースシステム4で実行可能なクエリを生成する。
分散クエリ投稿部33は、この実行可能なクエリを、対象となるデータベースシステム4にそれぞれ投稿する。
分散処理計画部34は、クエリ評価部31がクエリプランを生成した段階で、このクエリプランを利用してノード3群の分散処理計画を作成する。
分散処理計画部34における処理手順について、図6及び図7を参照して説明する。
クエリプラン(文字データ)を基に、処理対象テーブルと処理内容の流れを、処理毎の中間テーブルも含めて表すプランツリーを生成する(ステップ61)。プランツリーは、図7に示すように、テーブルに対する処理が連なるように構成されている。
次に、モデルデータ23及びデータソース管理データ22を取得し(ステップ62)、プランツリー上の処理内容から各データベースシステム4から得られる分散クエリ結果の容量を計算する(ステップ63)。
この結果から、仮想スキーマで得られるテーブルや中間テーブル、最終的な結果の出力容量と、仮想スキーマの処理における最大処理容量を計算する(ステップ64)。最大処理容量は、必要なノードの数を決める際に有用なデータとなる。
計算した容量を利用して、必要なノードの数及び適用先のノード(自身なのか別なのか)を決定する(ステップ65)。このとき、最終的にデータを収集するノード3が、現在分散処理を作成しているノード3と異なる場合には(ステップ66)、クライアント1の分散コネクタ11に接続先変更を依頼し(ステップ67)、分散処理計画を完了する(ステップ68)。
このような処理を行うことで、分散クエリ結果の容量と、仮想スキーマの処理における最大処理容量が考慮されるので、適切なノードの選択が可能となる。
図7は、図2の仮想スキーマaを例に、ユーザが投稿したSQLクエリ「SELECT aid FROM a」のクエリプランをプランツリーに変換した例を示す。
ユーザが投稿したSQLクエリは、図7の例のように、3つのSQLクエリに分解される。これらのうち物理モデルであるテーブルsとテーブルtへのクエリの結果は、中間テーブルとしてノード3上に収集され、仮想スキーマaで定義されたUNION処理の対象として処理される。
このような流れについて、処理の前後のテーブルを明確に表したものが図7のプランツリーである。すなわち、各データベースシステムから得られるテーブル容量としてデータソース管理データ22から取得したテーブルsのサイズ(30GB)とテーブルtのサイズ(10GB)が示される。また、中間テーブルの出力容量として、Projection処理後のテーブルsのサイズ(6GB)とテーブルtのサイズ(2GB)、及び、モデルデータ23にある仮想スキーマ処理のサイズ計算メソッドを適用した処理後のサイズ(8GB)が示されている。
次に、図6における「各テーブルの処理ノード群選択」(ステップ65)についての詳細の処理フローを図8に示す。
処理ノード群の選択が開始された場合(ステップ81)、作成したプランツリーを根(クエリ結果)から順に、クエリ処理を実行するノードを決める対象となるテーブルを降順探索する(ステップ82)。
探索で対象のテーブルが発見された場合(ステップ83)、対象テーブルが、論理テーブル(仮想スキーマにおける出力テーブル)、仮想スキーマ内のテーブル(仮想スキーマにおける物理テーブル又は中間テーブル)、仮想スキーマ外のテーブル(論理テーブルに対する処理における中間テーブル又はクエリ結果)のいずれであるかのテーブル種別を行う(ステップ84)。
ステップ84のテーブル種別で、論理テーブルを発見した場合、当該仮想スキーマにおける最大出力容量と、ノード群における利用状況及び利用可能メモリサイズからノード群を選択する(ステップ85)。
なお、仮想スキーマ内のテーブルである場合は、仮想スキーマ全体で処理容量を計算しているため、ここでは無視して再度探索を続ける。
ステップ84のテーブル種別で、仮想スキーマ外のテーブル(中間テーブル又はクエリ結果)を発見した場合は、当該テーブルの出力容量とノード群の利用可能メモリサイズを基に、ツリーにおける下位(葉側)のテーブルに対する処理を行ったノードの中から処理するノード群を選択する(ステップ86)。このとき、できる限りデータ通信が少なくなるよう、テーブルデータが多く含まれているノードを優先する。また併せて、利用するノードのリソース管理データを更新する。
ここで空いているノードがない場合、すでに実行されている処理が最も早く終わると考えられるノードを選択し、対象ノードのリソース管理データの処理待ちキューの対象として記録される。
ノード群を選択後、当該ノード群へのデータ転送を行うために、ハッシュ化対象属性を選択する(ステップ87)。この属性は、直前の処理内容に依存し、例えばJOINのように、特定の属性毎の処理が必要な場合には選択されるが、UNION処理のようなハッシュ化が必要のない場合には選択されない。
以上の処理をプランツリー全体に対して行った後(ステップ88)、処理ノード群選択の処理が完了する(ステップ89)。
このように、仮想スキーマをベースとしたノード群の選択を行うことで、依存性のあるテーブル間の処理を特定のノードに集めることができ、クエリ処理に対して高い並列性を出すことが可能となる。
更には、仮にある特定のノードが実行中に異常終了し、ノード単位で再実行が不可能になったとしても、異常終了したノードで実行された仮想スキーマの処理のみを再実行すればよく、ノード群におけるクエリ処理と、対象となるデータベースシステムへのクエリ処理要求を最低限に抑えることが可能となる。
次に、作成した分散処理計画を利用するノード群に配布し、データベースシステムにおけるクエリ処理が完了した直後のデータ分散処理の詳細フローについて、図9に示す。
各データベースシステム4にクエリを投稿したノード3において、データベースシステム4の実行結果が受信されると(ステップ91)、クエリ結果受信部36は、この結果データをストリーム的にデータ分散部37に1レコードずつ渡す(ステップ92)。
このときデータ分散部37は、処理計画配置部35から取得した分散処理計画を基に、対象となるノード3のデータ分散部37へ結果データを転送する。転送先が複数あり、ハッシュ化対象属性がある場合は、これを利用して複数の対象ノードから一つを選択する。ハッシュ化対象属性がない場合は、複数の対象ノード3から空いているノード3を選択する。
したがって、ノード3を判定するに際して、前記処理対象データを処理するデータ仮想化装置をレコード単位で判定するので、処理に適したノードが選択可能となる。
ここで、事前に計算した最大処理容量の誤差等でノード3のメモリに空きがなくなった場合、リソース管理データから代替のノード3を決定し、分散処理計画を修正後に全利用ノード3に再配布し、レコードを対象のノード3に転送する(ステップ93)。
転送の可否が判断され(ステップ94)、データソース管理データ22上も空きノード3がなく転送できない場合には、分散処理計画部34と同様に、すでに実行されている処理が最も早く終わると考えられるノード3を代替ノードとして選択する(ステップ95)。
データ転送時に、対象のノード3の処理待ちキューに当該クエリ処理が登録されている場合、対象のノード3のディスク上等の、現在実行されている処理を阻害しない場所にデータを格納する。実行中の処理が終了後、対象のテーブルに対する分散クエリ処理の実行が開始される。これにより、実行中クエリを阻害することなく、またクエリ処理のメモリ過剰で強制終了することなくクエリを実行することが可能となる。
ステップ94において転送可である場合、データベースシステム単位でデータ転送が完了した時点で(ステップ96)、対象のノードにテーブルの受信完了通知を配布する(ステップ97)。
続いて、処理続行の可否を判断する(ステップ98)。例えば、演算が二項処理(2つの演算結果が必要)であって、もう片方のテーブルの受信が完了してない場合や、処理待ちキューに登録されている場合は、それぞれの完了通知が配布されるまで実行は開始されない。全ての完了通知が配布されて初めて、対象ノードのクエリ処理部38におけるクエリ処理が開始される(ステップ99)。
次に、クエリ処理部38にて、クエリツリー上のそれぞれの処理が完了した後における詳細な処理フローを図10に示す。
クエリ処理部38では、処理終了後(ステップ101)、残処理の有無を判断し(ステップ102)、他の処理が残っている場合は、分散処理計画に従って次の処理内容を続行する(ステップ103)。
他の処理が残っていない場合は、分散処理計画に従ってデータ集計部39に転送する(ステップ104)。
ステップ103で次の処理内容を続行する場合、完了した処理の結果のテーブルに対して、次に利用する処理が二項演算の場合、対象処理ノード全体でデータの移動を行い(ステップ105)、もう一方の完了を待つ必要がある。そのため、処理対象の両テーブルともに完了していることを完了通知の有(ステップ106)や完了通知待ち(ステップ107)で確認してから、次の処理が開始される。
したがって、クエリ処理を行うに際し、二項演算の完了通知を待って次の処理を行うようにしたので、計画に沿ったクエリ処理を確実に行うことが可能となる。
単項演算の場合は、他の処理に影響されることはないため、処理終了後、そのまますぐ開始される。ただし、仮にデータのサイズが処理前に比べて大きくなり、他ノードへの転送が必要となっていて、そのノードが処理待ちキューに登録されている場合は、その完了を待つ必要がある。
次の処理に伴うデータ移動において(ステップ108)、メモリサイズを超えてしまった場合は(ステップ109)、クエリツリー上のこれまで利用してきたノードのうち、メモリが空いているノードに結果を転送する(ステップ110)。もし空きがない場合は、前述の代替ノード選択のロジック(ステップ95)で転送先ノードを決定する。
完了した処理がクエリツリー上の最も根に近い最終処理の場合は、クエリ処理全体が完了となることから、最終処理の結果をデータ集計部39に転送する。
その後、クエリ集計部39にて、必要に応じた最終的な処理を行って、クライアント1に結果を転送し、クエリ処理が完了する。
上述した分散型データ仮想化システムによれば、分散処理計画部34と処理計画配置部35を備えることで、複数のデータ仮想化装置(ノード)3上の処理を分散化し並列処理を行うことにより、大規模データ処理に対応することが可能となる。
また、仮想スキーマ単位でテーブルを処理することで、複数仮想スキーマに対して仮想スキーマ毎にデータ仮想化装置(ノード)3へ分散することにより、並列性の向上を実現することができる。
また、仮想スキーマの処理を仮想スキーマ単位に独立化することにより、クエリ再実行の効率化及び仮想化対象のデータベースシステムの負荷軽減を実現することができる。
1…クライアント、 2…分散型データ仮想化システム管理装置、 3…データ仮想化装置(ノード)、 4…データベースシステム、 11…分散コネクタ、 21…リソース管理データ、 22…データソース管理データ、 23…モデルデータ、 31…クエリ評価部、 32…分散クエリ生成部、 33…分散クエリ投稿部、 34…分散処理計画部、 35…処理計画配置部、 36…クエリ結果受信部、 37…データ分散部、 38…クエリ処理部、 39…データ集計部。

Claims (7)

  1. クエリ処理要求と結果受信を行うクライアントと、クエリ処理を行うデータ仮想化装置と、前記データ仮想化装置が利用する1つ以上のデータベースシステムと、前記データ仮想化装置のリソース量に関する情報、及び、前記データベースシステムが有するテーブル情報を管理する分散型データ仮想化システム管理装置と、を備えた分散型データ仮想化システムにおいて、
    前記データ仮想化装置は、複数のデータ仮想化装置から構成し、
    前記各データ仮想化装置は、
    前記クエリ処理の手順を定義したクエリプランと前記リソース量及び前記テーブル情報を考慮し、クエリ処理を並列実施する複数のデータ仮想化装置の選定と当該複数のデータ仮想化装置でのクエリ処理内容とを含む分散処理計画を作成する分散処理計画部と、
    分散処理するデータ仮想化装置群に前記分散処理計画を分配する処理計画配置部と、
    前記分散処理計画に応じて、各データベースシステムから取得した処理対象データをレコード単位で他のデータ仮想化装置に分配又は当該データ仮想化装置で受信するデータ分散部と、
    前記分散処理計画に従った処理を行うクエリ処理部と
    前記分散処理計画に従った処理の結果を各クエリ処理部から受信し、集計した結果を前記クライアントに送信するデータ集計部と
    を備えることを特徴とする分散型データ仮想化システム。
  2. クエリ処理要求と結果受信を行うクライアントと、クエリ処理を行う複数のデータ仮想化装置と、前記データ仮想化装置のリソース量に関する情報を管理する分散型データ仮想化システム管理装置と、前記データ仮想化装置が利用する1つ以上のデータベースシステムとを備えた分散型データ仮想化システムにおけるクエリ処理方法であって、
    前記クライアントからクエリ処理要求があった場合に、
    クエリ処理の手順を定義したクエリプランを作成するクエリプラン作成手順と、
    前記クエリプランと前記リソース量及び前記データベースシステムが有するテーブル情報を考慮して、クエリ処理を並列実施する複数のデータ仮想化装置の選定と当該複数のデータ仮想化装置での分散クエリ処理内容とを含む分散処理計画を作成する分散処理計画手順と、
    分散処理するデータ仮想化装置群に前記分散処理計画を分配する処理分配手順と、
    前記分散処理計画に応じて、各データベースシステムから取得した処理対象データをレコード単位で分配又は受信するデータ分散手順と、
    前記分散処理計画に従った処理を行うクエリ処理手順と
    前記分散処理計画に従った処理の結果を受信し、集計した結果を前記クライアントに送信するデータ集計手順と
    を含むことを特徴とするクエリ処理方法。
  3. 前記分散処理計画手順は、
    前記分散クエリ処理内容から各データベースシステムから得られる分散クエリ結果の容量を計算する手順と、
    計算された容量から、実際の物理テーブルをユーザに提供する論理テーブルに変換する処理を定義した仮想スキーマで得られるテーブルや中間テーブル、最終的な結果の出力容量と、前記仮想スキーマの処理における最大処理容量を計算する手順と、
    計算された容量を利用して、必要なデータ仮想化装置の数及び適用先のデータ仮想化装置を決定するデータ仮想化装置群選択手順と
    を含む請求項2に記載のクエリ処理方法。
  4. 前記データ仮想化装置群選択手順は、
    前記クエリプランから作成したプランツリーを根(クエリ結果)から順に前記クエリ処理を実行するノードを決める対象となるテーブルを降順探索する手順と、 前記テーブルが仮想スキーマにおける出力テーブルである場合に、当該仮想スキーマにおける最大出力容量と、データ仮想化装置群における利用状況及び利用可能メモリサイズからデータ仮想化装置群を選択する手順と
    を含む請求項3に記載のクエリ処理方法。
  5. 前記データ分散手順は、
    前記各データベースシステムから前記処理対象データを取得する手順と、
    前記処理対象データを処理するデータ仮想化装置をレコード単位で判定する手順と
    を含む請求項2に記載のクエリ処理方法。
  6. 前記クエリ処理手順は、
    処理完了により次の処理を行う場合に、
    単項演算であるか二項演算であるかを判定する手順と、
    二項演算である場合は、二項演算の完了通知を待って次の処理を行うためのデータ移動とクエリ処理を行う手順と
    を含む請求項2に記載のクエリ処理方法。
  7. 請求項2の各手順をコンピュータに実行させるクエリ処理プログラム。
JP2013246938A 2013-11-29 2013-11-29 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム Active JP6262505B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013246938A JP6262505B2 (ja) 2013-11-29 2013-11-29 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013246938A JP6262505B2 (ja) 2013-11-29 2013-11-29 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム

Publications (2)

Publication Number Publication Date
JP2015106219A JP2015106219A (ja) 2015-06-08
JP6262505B2 true JP6262505B2 (ja) 2018-01-17

Family

ID=53436303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013246938A Active JP6262505B2 (ja) 2013-11-29 2013-11-29 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム

Country Status (1)

Country Link
JP (1) JP6262505B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6405062B2 (ja) * 2016-02-08 2018-10-17 株式会社日立製作所 分散データベースシステム、及び、分散データベースシステムの管理方法
WO2018074479A1 (ja) * 2016-10-20 2018-04-26 日本電信電話株式会社 データ処理装置およびデータ処理方法
JP6866632B2 (ja) 2016-12-22 2021-04-28 日本電気株式会社 データ検索方法、データ検索装置およびデータ検索プログラム
KR102049420B1 (ko) * 2018-03-27 2019-11-27 주식회사 리얼타임테크 분산 데이터베이스에서의 복제본이 존재하는 데이터에 대한 질의 병렬화 방법
JP7434088B2 (ja) 2020-07-07 2024-02-20 株式会社東芝 分散処理システム、分散処理装置、データベース管理装置及び方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199804A (ja) * 2006-01-24 2007-08-09 Hitachi Ltd データベース管理方法、データベース管理プログラム、データベース管理装置、および、データベース管理システム
JP2013025425A (ja) * 2011-07-19 2013-02-04 Nec Corp 分散データ管理システム、分散データ管理方法、および分散データ管理プログラム
JP6204753B2 (ja) * 2013-08-28 2017-09-27 Kddi株式会社 分散クエリ処理装置、処理方法及び処理プログラム

Also Published As

Publication number Publication date
JP2015106219A (ja) 2015-06-08

Similar Documents

Publication Publication Date Title
US11347761B1 (en) System and methods for distributed database query engines
US11620308B2 (en) Adaptive distribution method for hash operations
US10521427B2 (en) Managing data queries
US9665620B2 (en) Managing data queries
Khalifa et al. The six pillars for building big data analytics ecosystems
JP5387757B2 (ja) 並列データ処理システム、並列データ処理方法及びプログラム
JP6262505B2 (ja) 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム
WO2015058578A1 (zh) 一种分布式计算框架参数优化方法、装置及系统
Chen et al. Pisces: optimizing multi-job application execution in mapreduce
JP6376947B2 (ja) 仮想データベースシステム管理装置、管理方法及び管理プログラム
US20150347507A1 (en) Hierarchical query plans in an elastic parallel database management system
JP6393193B2 (ja) データ仮想化装置及び大規模データ処理プログラム
JP6523823B2 (ja) 仮想データベースシステム管理装置、管理方法及び管理プログラム
JP6371136B2 (ja) データ仮想化サーバ、データ仮想化サーバにおけるクエリ処理方法及びクエリ処理プログラム
JPWO2013145512A1 (ja) 管理装置及び分散処理管理方法
JP6193491B2 (ja) 計算機システム
JP6401617B2 (ja) データ処理装置、データ処理方法及び大規模データ処理プログラム
Choudhry HBase High Performance Cookbook
JPWO2018061070A1 (ja) 計算機システム及び分析ソースデータ管理方法
Boytsov et al. Multi-tenant Database Clusters for SaaS
JP6776562B2 (ja) 更新装置、更新方法、更新プログラム、及び、データベース管理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160729

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171214

R150 Certificate of patent or registration of utility model

Ref document number: 6262505

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150