WO2017168483A1

WO2017168483A1 - 計算機及びデータベースの処理方法

Info

Publication number: WO2017168483A1
Application number: PCT/JP2016/059800
Authority: WO
Inventors: 渡辺　聡; 美智子田中; 清水　晃; 山本　彰
Original assignee: 株式会社日立製作所
Priority date: 2016-03-28
Filing date: 2016-03-28
Publication date: 2017-10-05

Abstract

プロセッサとメモリ及びアクセラレータとを含んでデータベースを処理する計算機は、データベースのデータを読み込み、データベースを所定のサイズのデータセグメントに分割してメモリの第１の記憶領域に格納するデータローダと、クエリを受け付けて、クエリに含まれるデータベース演算のうち、アクセラレータで実行可能なデータベース演算を通知するクエリ実行部と、前記通知に基づいて、第１の記憶領域からデータセグメントを選択してメモリの第２の記憶領域へ転送し、アクセラレータにデータベース演算の実行を通知するカラムデータ処理部と、を有し、データローダは、データベースのカラム毎に圧縮したカラムデータと、圧縮に使用した辞書とをデータセグメントに設定する。

Description

計算機及びデータベースの処理方法

　本発明は、データベース処理をアクセラレータ装置にオフロードする方法、および、システムに関する。

　近年、コンピュータシステムの性能を向上するため、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）に加えてＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等のハードウェア回路をアクセラレータとして活用する技術が開発されている。

　非特許文献１によれば、ＣＰＵとＦＰＧＡとがＱＰＩ（ＱｕｉｃｋＰａｔｈ　Ｉｎｔｅｒｃｏｎｎｅｃｔ）で接続された、新たなハードウェアが提案されている。本ハードウェアでは、処理対象のデータをＣＰＵからＦＰＧＡに転送し、ＦＰＧＡで処理を行うことが可能である。

　アクセラレータを適用する処理としては、データベース処理の一部をアクセラレータにオフロードする技術が開発されている。特許文献１によれば、サーバ装置で受け付けたデータベース処理を、前記サーバ装置とネットワークで接続されたストレージ装置が有する、複数台のデータベース演算機能を有するフラッシュモジュール（アクセラレータ）を活用することで、データベース処理を高速化する技術が開示されている。

　一方、データベース処理の高速化のため、データベースが管理するデータを、サーバ装置の主記憶装置上に、カラムデータとしてまとめて格納する、インメモリカラムストアデータベース技術が開発されている。

　特許文献２によれば、データベースが管理するレコード集合の一部をメモリに格納する際に、サーバ装置は複数のレコード集合に分割し、各レコード集合について、当該レコード集合に属するレコードをカラム毎に纏め、ＩＭＣＵｓ（ｉｎ－ｍｅｍｏｒｙ　ｃｏｍｐｒｅｓｓｉｏｎ　ｕｎｉｔｓ）として圧縮格納する技術が開示されている。カラムストアデータベースの圧縮技術としては、出現頻度の高いデータを短い符号で置き換える圧縮辞書を作成し、圧縮辞書の符号を用いてデータを格納する辞書式圧縮が広く用いられている。

国際公開第２０１５／１６２７５２号米国特許出願公開第ＵＳ２０１５／００８８８２２号明細書

ＰＫ　Ｇｕｐｔａ　著、"Ｘｅｏｎ＋ＦＰＧＡ　Ｐｌａｔｆｏｒｍ　ｆｏｒ　ｔｈｅ　Ｄａｔａ　Ｃｅｎｔｅｒ"、ＩＳＣＡ／ＣＡＲＬ　２０１５、ＩＮＴＥＬ　Ｃｏｒｐｏｒａｔｉｏｎ　発行、２０１５年６月

　データベース処理の一部をハードウェア回路にオフロードするためには、処理対象のデータをオフロード先のハードウェア回路に送信する処理と、ハードウェア回路が処理結果をＣＰＵへ送信する処理が必要である。ＣＰＵとハードウェア回路の通信には、例えば、通信用メモリが使用される。

　データベース処理では、レコードを構成する複数のカラムを対象とした処理が行われる。したがって、データベース処理をオフロードするためには、処理対象の全てのカラムをハードウェア回路に送信する必要がある。

　また、カラムストアデータベースでは、辞書式圧縮を用いてデータが格納されるケースがある。データベース処理では、圧縮されたデータを伸長して処理を行う必要がある。そのため、データが辞書式圧縮で格納されている場合には、処理対象の全てのカラムに加えて、該カラムの圧縮に用いられた辞書情報をハードウェア回路に送信する必要がある。

　以上の背景から、カラムストアデータベースの処理をハードウェア回路にオフロードする場合には、処理対象のカラム、および、該カラムの辞書情報が通信用メモリに納まらないと、複数回のデータ送信が必要になり、ＣＰＵからハードウェア回路へのデータ転送性能が大幅に低下する可能性があった。

　そこで本発明は、カラムストアデータベースに対するデータベース処理の一部を、ハードウェア回路にオフロードする際に、データ転送性能が低下するのを抑制することを目的とする。

　本発明は、プロセッサとメモリ及びアクセラレータとを含んでデータベースを処理する計算機であって、前記メモリは、前記プロセッサからアクセス可能な第１の記憶領域と、前記プロセッサと前記アクセラレータからアクセス可能な第２の記憶領域とを含み、データベースのデータを読み込んで、前記データベースを所定のサイズのデータセグメントに分割して前記メモリに設定された第１の記憶領域に格納するデータローダと、クエリを受け付けて、当該クエリに含まれるデータベース演算のうち、前記アクセラレータで実行可能なデータベース演算を通知するクエリ実行部と、前記クエリ実行部からの通知に基づいて、前記第１の記憶領域からデータセグメントを選択して、当該選択したデータセグメントを前記第２の記憶領域へ転送し、前記アクセラレータにデータベース演算の実行を通知するカラムデータ処理部と、を有し、前記データローダは、前記データベースのカラム毎に圧縮したカラムデータと、前記圧縮に使用した辞書とを前記データセグメントに設定する。

　本発明によれば、データベース処理の一部をＦＰＧＡ１０３にオフロードする際には第２の記憶領域にデータセグメントを収めることができ、データベース処理の高速化が可能となる。

本発明の第１の実施例を示し、サーバの一例を示すブロック図である。本発明の第１の実施例を示し、データの一例を示す図である。本発明の第１の実施例を示し、データ格納セグメントの一例を示す図である。本発明の第１の実施例を示し、入力データからデータ格納セグメントを作成する処理の一例を示すフローチャートである。本発明の第１の実施例を示し、カラムデータの選択及び転送処理の一例を示すフローチャートである。本発明の第１の実施例を示し、ＤＢＭＳに設定された設定ファイルの一例を示す図である。本発明の第２の実施例を示し、サーバの一例を示すブロック図である。本発明の第２の実施例を示し、カラムデータの選択及び転送処理の一例を示すフローチャートである。本発明の第３の実施例を示し、入力データからデータ格納セグメントを作成する処理の一例を示すフローチャートである。本発明の第３の実施例を示し、クエリ実行部で行われるオフロード判定処理の一例を示すフローチャートである。本発明の第４の実施例を示し、計算機システムの一例を示すブロック図である。

　以下、本発明の一実施形態について添付図面を用いて説明する。

　図１は、実施例１にかかるサーバの一例を機システムの構成を示す。

　サーバ１０１は計算機の一例であって、例えば、パーソナルコンピュータ、ワークステーションまたはメインフレームであってもよい。サーバ１０１は、ＣＰＵ１０２と、ＦＰＧＡ１０３と、メモリ１０４とを有する。サーバ１０１には、データ２００を格納するストレージ装置３００が接続される。なお、データ２００は、行と列を含むデータベースである。

　ＣＰＵ１０２は、コンピュータプログラムを実行する。ＣＰＵ１０２により実行されるコンピュータプログラムは、例えば、ＤＢＭＳ（DataBase Management System）１０８である。ＦＰＧＡ１０３は、データベース演算を実行するデータベース演算回路１１８を有するアクセラレータとして機能する。メモリ１０４は、例えば、揮発性のＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ－Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等で構成され、ＣＰＵメモリ領域１０５と、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６と、ＦＰＧＡメモリ領域１０７とを有する。

　なお、メモリ１０４に設定されたＣＰＵメモリ領域１０５は、ＣＰＵ１０２が占有する記憶領域であり、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６は、ＣＰＵ１０２とＦＰＧＡ１０３が相互にアクセス可能な共有記憶領域であり、ＦＰＧＡメモリ領域１０７はＦＰＧＡ１０３が占有する記憶領域である。

　ＣＰＵメモリ領域１０５は、ＣＰＵ１０２により実行されるコンピュータプログラムであるＤＢＭＳ１０８と、ＤＢＭＳ１０８が管理するデータ２００を構成する１以上のデータ格納セグメント１１５－１～１１５－ｎを格納する。なお、以下では、データ格納セグメント１１５－１～１１５－ｎの総称を符号１１５で表示する。

　ＤＢＭＳ１０８が管理するデータ２００は、１以上のレコードの集合であり、レコードは１以上のカラムで構成される。図２は、ＤＢＭＳ１０８が管理するデータ２００の一例を示す図である。データ２００は、１以上のカラム（２０１～２０３）で構成されるレコードの集合である。例えば、レコード２０４は、カラム１（２０１）の値が「ＲｅｃＡ－１」、カラム２（２０２）の値が「ＲｅｃＡ－２」、カラムＮ（２０３）の値が「ＲｅｃＡ－Ｎ」のレコードである。

　データ格納セグメント１１５には、１以上のレコード集合が格納される。図３は、データ格納セグメント１１５の一例を示す図である。各データ格納セグメント１１５－１～１１５－ｎは所定のサイズ（オフロード上限サイズ）以下のデータ集合としてそれぞれ生成される。

　データ格納セグメント１１５には、図２に示した１以上のレコード集合について、カラム１（２０１）の値がカラム１データ部３０２に格納され、カラム２（２０２）の値がカラム２データ部３０３に格納され、カラムＮ（２０３）の値がカラムＮデータ部３０４に格納される。

　また、データ格納セグメント１１５の格納情報、および、カラムデータ（３０２～３０４）の圧縮辞書情報が、セグメント管理情報３０１に格納される。各カラムデータの圧縮辞書は、前記特許文献２等の公知または周知の技術を用いればよい。

　ＤＢＭＳ１０８は、クエリ解析部１０９と、クエリ実行部１１０と、データローダ１１１と、カラムデータ選択転送部１１２と、ＦＰＧＡ処理開始部１１３と、ＦＰＧＡ処理結果受信部１１４を有する。

　クエリ解析部１０９は、クライアント計算機（図示省略）からクエリを受け付けて、当該クエリを実行するためのクエリ実行プランを生成する。クエリ実行部１１０は、クエリ解析部１０９が生成したクエリ実行プランに従ってクエリを実行し、一部をＦＰＧＡ１０３に処理させる。

　データローダ１１１は、ストレージ装置３００のデータ２００を入力データとして読み込んで、１以上のデータ格納セグメント１１５に格納する。カラムデータ選択転送部（カラムデータ処理部）１１２は、データ格納セグメント１１５からデータベース演算に必要なデータを選択し、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６に、ＦＰＧＡ処理対象データ（第１の格納領域）１１６として格納する。

　ＦＰＧＡ処理開始部１１３は、ＦＰＧＡ処理対象データ１１６をＦＰＧＡ１０３に処理させる。ＦＰＧＡ処理結果受信部１１４は、ＦＰＧＡ１０３が処理した結果をＣＰＵ１０２に転送する。

　クエリ解析部１０９と、クエリ実行部１１０と、データローダ１１１と、カラムデータ選択転送部１１２と、ＦＰＧＡ処理開始部１１３と、ＦＰＧＡ処理結果受信部１１４の各機能部はプログラムとしてメモリ１０４にロードされる。

　ＣＰＵ１０２は、各機能部のプログラムに従って処理することによって、所定の機能を提供する機能部として稼働する。例えば、ＣＰＵ１０２は、クエリ解析プログラムに従って処理することでクエリ解析部１０９として機能する。他のプログラムについても同様である。さらに、ＣＰＵ１０２は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。

　ＤＢＭＳ１０８の各機能を実現するプログラム、テーブル等の情報は、ストレージ装置３００や不揮発性半導体メモリ、ハードディスクドライブ、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記憶デバイス、または、ＩＣカード、ＳＤカード、ＤＶＤ等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。

　図６は、ＤＢＭＳ１０８に予め設定された設定ファイル７０１の一例を示す図である。ＤＢＭＳ１０８は、図６の設定ファイル７０１より、予め設定されたＣＰＵ・ＦＰＧＡ通信メモリ領域サイズ７０２を取得する。尚、図６は、設定ファイル７０１によりＤＢＭＳ１０８に設定パラメータを通知する一例を示したものであり、設定ファイル７０１の形式を限定するものではなく、また、設定ファイル７０１以外に設定画面にて当該情報を設定する設定ツールでも良い。

　また、ＣＰＵ・ＦＰＧＡ通信メモリ領域サイズ７０２は、メモリ１０４の容量などに応じて管理者などによって適宜設定されたものである。

　ＤＢＭＳ１０８は、オフロード上限サイズを、前記ＣＰＵ・ＦＰＧＡ通信メモリ領域サイズ７０２に設定する。オフロード上限サイズは、ＤＢＭＳ１０８がＦＰＧＡ１０３にデータベース演算をオフロードする最大のデータ量を示す。

　データローダ１１１は、１以上のレコード集合で構成されるデータ２００（入力データ）をストレージ装置３００から読み込んで、１以上のデータ格納セグメント１１５に格納する。

　図４は、データローダ１１１が、データ２００を所定のセグメントサイズに分割してデータ格納セグメント１１５に格納する処理の一例を示すフローチャートである。この処理は、ＤＢＭＳ１０８が、図示しないクライアント計算機から所定のコマンドを受け付けたときに実行される。

　データローダ１１１は、格納元データサイズと、データ格納セグメント１１５のサイズを示すセグメントサイズ、０に初期化する（Ｓ５００２）。データローダ１１１は、ストレージ装置３００のデータ２００から１レコードを取得する（Ｓ５００３）。

　データローダ１１１は、格納元データサイズに、前記取得したレコードサイズを加算する（Ｓ５００４）。データローダ１１１は、前記取得したレコードを、圧縮してデータ格納セグメント１１５に追加した場合の、セグメントサイズを計算する。

　セグメントサイズは、圧縮後のカラムデータ（３０２～３０４）のサイズ（カラムデータサイズ）と、圧縮辞書を含むセグメント管理情報３０１のサイズの和である。

　データローダ１１１は、セグメントサイズが、ＣＰＵ・ＦＰＧＡ通信メモリ領域サイズ７０２（閾値＝オフロード上限サイズ）を超えるか否かを判定する。データローダ１１１は、セグメントサイズが閾値を超える場合はステップＳ５００９へ進む。

　一方、データローダ１１１は、セグメントサイズが閾値以下でればステップＳ５００７で、前記取得したレコードを、データ格納セグメント１１５に追加する。データローダ１１１は、１レコードのデータをカラム単位に分轄して、各カラムに対応するカラム１データ部３０２～カラムＮデータ部３０４に追加する。

　次に、データローダ１１１は、データ２００の終端に達したか否かを判定する（Ｓ５００８）。データローダ１１１は、データ２００の終端でない場合は、ステップＳ５００３へ進んで、次の未処理のレコードを読み込んで上記処理を繰り返す。

　一方、データローダ１１１は、データ２００の終端に達するか、セグメントサイズが閾値を超えた場合には、データ格納セグメント１１５を作成する（Ｓ５００９）。

　次に、データローダ１１１は、データ２００の終端に達したか否かを判定する（Ｓ５０１０）。データローダ１１１は、データ２００の終端でない場合は、ステップＳ５００２へ戻って、上記処理を繰り返して次のデータ格納セグメント１１５を生成する。

　上記処理によって、データローダ１１１は、入力されたデータ２００を所定のサイズのデータ格納セグメント１１５に分割してＣＰＵメモリ領域１０５に格納する。各データ格納セグメント１１５には、１以上のレコードを、カラム単位で分割し、かつ、辞書圧縮を実施したカラムデータ（３０２～３０４）と、圧縮辞書を含むセグメント管理情報３０１が含まれる。

　クエリ解析部１０９は、図示しないクライアント計算機からクエリを受け付けると、当該クエリを実行するために必要な１以上のデータベース演算を含むクエリ実行プランを生成する。クエリ実行プランは、例えば、１以上のデータベース演算と、データベース演算の実行順序の関係を含む情報である。

　クエリ実行部１１０は、前記クエリ解析部１０９が生成したクエリ実行プランに従ってクエリを実行する。クエリ実行部１１０は、クエリ実行の過程において、実行対象のデータベース演算が、ＦＰＧＡ１０３のデータベース演算回路１１８で実行可能な場合は、カラムデータ選択転送部１１２を起動する。データベース演算回路１１８で実行可能なデータベース演算としては、例えば、検索処理や集約処理などである。

　クエリ実行部１１０は、クエリをＦＰＧＡ１０３にオフロードするデータ格納セグメント１１５を指定してカラムデータ選択転送部１１２にオフロードの実行を通知する。

　カラムデータ選択転送部１１２は、クエリ実行部１１０が指定したデータ格納セグメント１１５からデータベース演算に必要なデータを選択し、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６に、ＦＰＧＡ処理対象データ１１６として格納する。

　図５は、カラムデータ選択転送部１１２が、カラムデータ（３０２～３０４）の選択及び転送処理を実行する処理の一例を示すフローチャートである。

　カラムデータ選択転送部１１２は、データ格納セグメント１１５のカラムデータ（３０２～３０４）について、未判定のカラムデータが残っているか否かを判定する（Ｓ６００２）。カラムデータ選択転送部１１２は、未判定のカラムデータが残っていなければ、処理を終了し、残っていればステップＳ６００３に進む。

　カラムデータ選択転送部１１２は、未判定のカラムデータから１つを選択する（Ｓ６００３）。カラムデータ選択転送部１１２は、選択したカラムデータが、データベース演算に必要か否かを判定する（Ｓ６００４）。

　この判定では、カラムデータ選択転送部１１２が、実行対象のクエリで当該カラムデータを使用するか否かを判定する。カラムデータ選択転送部１１２は、当該カラムデータがデータベース演算に必要であればステップＳ６００５へ進み、不要であればステップＳ６００２へ戻って上記処理を繰り返す。

　カラムデータ選択転送部１１２は、データ格納セグメント１１５内のカラムデータ（３０２～３０４）を、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６にＦＰＧＡ処理対象データ１１６としてコピーする。

　カラムデータ選択転送部１１２は、カラムデータ選択転送処理が完了した後、クエリ実行部１１０に通知する。クエリ実行部１１０は、ＦＰＧＡ処理開始部１１３を起動する。なお、カラムデータ選択転送部１１２が、ＦＰＧＡ１０３にデータベース演算の開始を指令してもよい。

　ＦＰＧＡ処理開始部１１３は、ＦＰＧＡ１０３に、データベース演算と、ＦＰＧＡ処理対象データ１１６とを通知する。ＦＰＧＡ１０３は、データベース演算回路１１８を起動する。データベース演算回路１１８は、ＦＰＧＡ処理対象データ１１６を読み込み、データベース演算を実行し、処理結果をＣＰＵ・ＦＰＧＡ通信メモリ領域１０６にＦＰＧＡ処理結果（第２の格納領域）１１７として格納する。

　ＦＰＧＡ１０３は、前記データベース演算の過程で生じる中間結果をＦＰＧＡ１０３に格納できない場合は、ＦＰＧＡメモリ領域１０７にＦＰＧＡ処理中間データ１１９として格納する。ＦＰＧＡ１０３は、ＦＰＧＡ処理結果１１７の格納が完了したら、ＦＰＧＡ処理結果１１７をＦＰＧＡ１０３はクエリ実行部１１０に通知する。クエリ実行部１１０は、ＦＰＧＡ処理結果受信部１１４を起動する。

　ＦＰＧＡ処理結果受信部１１４は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６から、ＦＰＧＡ処理結果１１７を読み込んでクエリ実行部１１０に通知し、ＣＰＵ・ＦＰＧＡ通信メモリ領域から、ＦＰＧＡ処理対象データ１１６およびＦＰＧＡ処理結果１１７を削除する。

　クエリ実行部１１０は、ＦＰＧＡ処理結果１１７を含む処理結果を纏めてクエリ実行結果を作成し、クエリ発行元（クライアント計算機）へ返信する。

　以上のように、本実施例１によれば、ＤＢＭＳ１０８は、読み込んだデータ２００をカラム単位で圧縮したカラムデータと、圧縮に用いた辞書を予め設定したサイズ以内のデータ格納セグメント１１５に分割してから、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６に転送する。

　これにより、データベース処理の一部または全てをＦＰＧＡ１０３にオフロードする際には、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６にデータ格納セグメント１１５を収めることができ、データベース処理の高速化が可能となる。すなわち、データ格納セグメント１１５が、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６の容量よりも過大になるのを抑制することで、前記従来例のように処理対象のデータ転送回数が増大するのを防ぐことができ、ＦＰＧＡ１０３のようなアクセラレータを利用するカラムストアデータベースにおいてデータ転送性能の低下を抑制できる。

　また、ＤＢＭＳ１０８のカラムデータ選択転送部１１２は、ＦＰＧＡ１０３へオフロードするデータ格納セグメント１１５について、クエリで使用しないカラムデータの転送を禁止することで、転送するデータ格納セグメント１１５の容量を削減してデータ転送の効率を向上させることができる。

　以下、本発明の実施例２を説明する。以下では、実施例１との相違点を主に説明し、実施例１との共通点については説明を省略または簡略化する。

　図７は、実施例２にかかるサーバ１０１の構成を示すブロック図である。本実施例２では、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６が、１以上のオフロード領域８０１－１～８０１－ｍに分割される点が、前記実施例１との差分となる。なお、以下では、オフロード領域８０１－１～８０１－ｍの総称を符号８０１で表示する。

　各オフロード領域８０１には、前記実施例１のＣＰＵ・ＦＰＧＡ通信メモリ領域１０６と同様に、ＦＰＧＡ処理対象データ１１６とＦＰＧＡ処理結果１１７が含まれる。

　本実施例２のＤＢＭＳ１０８は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６を、ＦＰＧＡ１０３へのオフロード多重度で除算してオフロード領域サイズを算出し、オフロード上限サイズを、オフロード用メモリ領域サイズに設定する。

　オフロード多重度は、ＤＢＭＳ１０８の図示しない設定ファイルより取得してもよいし、ＦＰＧＡ１０３の処理性能とＦＰＧＡ１０３とメモリ１０４間の通信性能とからＤＢＭＳ１０８で算出してもよい。また、図７では、ＦＰＧＡ１０３が一つの例を示すが、複数のＦＰＧＡ１０３がＣＰＵ１０２に接続されてもよい。

　クエリ実行部１１０は、クエリ実行の過程において、実行対象のデータベース演算がＦＰＧＡ１０３のデータベース演算回路１１８で実行可能な場合は、カラムデータ選択転送部１１２を起動する処理を、１以上のデータ格納セグメントに対し、並行して実行する。なお、平行して実行可能なカラムデータ選択転送部１１２の数は、ＦＰＧＡ１０３で実行可能なオフロード多重度を上限とする。

　図８は、カラムデータ選択転送部１１２で行われるカラムデータの選択及び転送処理の一例を示すフローチャートである。カラムデータ選択転送部１１２は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６にオフロード領域サイズの空きがあるか否かを判定する（Ｓ９００１）。カラムデータ選択転送部１１２は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６に空きがあれば、ステップＳ９００４に進み、空きがない場合にはステップＳ９００３で空き領域ができるまで待機する。

　ステップＳ９００４でカラムデータ選択転送部１１２は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６にオフロード領域サイズのオフロード領域８０１を確保する。カラムデータ選択転送部１１２は、クエリ実行部１１０から指定されたデータ格納セグメント１１５について、未判定カラムが残っているか否かを判定する（Ｓ９００５）。カラムデータ選択転送部１１２は、データ格納セグメント１１５に未判定カラムが残っていなければ、処理を終了し、未判定カラムが残っていればステップＳ９００６へ進む。

　カラムデータ選択転送部１１２は、未判定カラムから、カラムデータを１つ選択する（Ｓ９００６）。カラムデータ選択転送部１１２は、選択したカラムデータが、データベース演算に必要か否かを判定する（Ｓ９００７）。カラムデータ選択転送部１１２は、選択したカラムデータが、データベース演算に必要なければ、ステップＳ９００５に戻って上記処理を繰り返す。

　カラムデータ選択転送部１１２は、選択したカラムデータが、データベース演算に必要であればステップＳ９００８へ進み、選択したデータ格納セグメント１１５内のカラムデータを、オフロード領域８０１にコピーする。

　上記処理によって、カラムデータ選択転送部１１２は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６にオフロード領域サイズのオフロード領域８０１を確保する。そして、カラムデータ選択転送部１１２は、データ格納セグメント１１５からデータベース演算に必要なデータを選択し、前記オフロード領域８０１に、ＦＰＧＡ処理対象データ１１６として格納する。

　ＦＰＧＡ処理開始部１１３は、ＦＰＧＡ１０３に、データベース演算と、オフロード領域８０１－１～８０１－Ｎと、ＦＰＧＡ処理対象データ１１６とを通知する。ＦＰＧＡ１０３は、データベース演算回路１１８を起動する。データベース演算回路１１８は、ＦＰＧＡ処理対象データ１１６を読み込み、データベース演算を実行し、処理結果をオフロード領域８０１にＦＰＧＡ処理結果１１７として格納する。

　ＦＰＧＡ処理結果受信部１１４は、オフロード領域８０１から、ＦＰＧＡ処理結果１１７を読み込んでクエリ実行部１１０に通知し、オフロード領域８０１を解放する。

　本実施例２によれば、ＦＰＧＡ１０３へのオフロードを多重実行することにより、データベース処理の高速化が可能となる。

　以下、本発明の実施例３を説明する。以下では、実施例１との相違点を主に説明し、実施例１～２との共通点については説明を省略または簡易にする。

　本実施例３では、実施例１の図１に示したＣＰＵ・ＦＰＧＡ通信メモリ領域１０６を、動的に確保し、データローダ１１１がＣＰＵ・ＦＰＧＡ通信メモリ領域１０６内にＦＰＧＡ処理対象データ（第１の格納領域）１１６とＦＰＧＡ処理結果１１７が収まるようにデータ格納セグメント１１５を生成する点が相違する。

　ＤＢＭＳ１０８は、オフロード上限サイズを、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６の最大値に設定する。前記ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６の最大値とは、ＤＢＭＳ１０８が、クエリ実行時に動的に確保可能なメモリ領域の最大値である。

　データローダ１１１は、ＦＰＧＡ処理対象データ１１６としてＣＰＵ・ＦＰＧＡ通信メモリ領域１０６に格納されるデータ格納セグメント１１５のサイズと、ＦＰＧＡ処理結果１１７のサイズの和が、オフロード上限サイズ以下となるようにデータ格納セグメント１１５を生成する。

　前記実施例１で述べたように、データローダ１１１は、辞書によってカラムデータを圧縮してデータ格納セグメント１１５を生成し、ＦＰＧＡ処理対象データ１１６に格納される。

　これに対して、ＦＰＧＡ１０３は、セグメント管理情報３０１の辞書を用いて圧縮されたカラムデータを伸長してからデータベース演算を行うため、ＦＰＧＡ処理結果１１７のサイズは、圧縮されたカラムデータより大きくなる可能性がある。

　そこで、本実施例３では、ＦＰＧＡ処理結果１１７のサイズの最大値として、圧縮前のカラムデータのサイズを使用し、ＦＰＧＡ処理対象データ１１６のサイズと、ＦＰＧＡ処理結果１１７のサイズの和が、オフロード上限サイズ以下となるようにデータローダ１１１がデータ格納セグメント１１５を生成する。

　図９は、データローダ１１１が、データ２００を所定のセグメントサイズに分割してデータ格納セグメント１１５に格納する処理の一例を示すフローチャートである。図９は、前記実施例１の図４のフローチャートに示したステップＳ５００６をステップＳ５０２０に置き換えたもので、その他の構成は前記実施例１と同様である。

　データローダ１１１は、読み込んだデータ２００のレコードサイズを格納元データサイズに加算してから（Ｓ５００４）、カラム毎に圧縮したカラムデータを生成し、辞書のサイズとカラムデータのサイズの和をセグメントサイズとして更新する（Ｓ５００５）。

　ここで、格納元データサイズは、圧縮前のデータ２００のサイズであり、ＦＰＧＡ処理結果１１７のサイズの最大値に相当する。

　そして、データローダ１１１は、セグメントサイズと格納元データサイズの和が、オフロード上限サイズを超えると、現在のデータ格納セグメント１１５の生成を完了して次の、データ格納セグメント１１５の生成に移行する。

　上記処理によって、データ格納セグメント１１５をＦＰＧＡ処理対象データ１１６に転送し、ＦＰＧＡ１０３がデータベース演算の結果をＦＰＧＡ処理結果１１７に格納しても、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６のオフロード上限サイズ以下に収めることが可能となる。

　ＤＢＭＳ１０８がクエリを受け付けると、クエリ実行部１１０は、前記実施例１と同様に、クエリ解析部１０９が生成したクエリ実行プランに従ってクエリを実行する。クエリ実行の過程において、処理対象とするデータ格納セグメント１１５に対するデータベース演算が、ＦＰＧＡ１０３のデータベース演算回路１１８へのオフロードが可能か否かを判定する。

　図１０は、クエリ実行部１１０で行われるオフロード判定処理の一例を示すフローチャートである。この処理は、ＤＢＭＳ１０８がクエリを受け付けたときに実行される。クエリ実行部１１０は、クエリに設定されたデータベース演算の対象カラムを列挙し、データベース演算に必要なカラムデータを特定する（Ｓ１１００２）。

　クエリ実行部１１０は、データ格納セグメント１１５のセグメント管理情報３０１を参照し、前記データベース演算に必要なカラムデータについて格納サイズを取得し、オフロード処理対象のデータのサイズを計算する（Ｓ１１００３）。

　クエリ実行部１１０は、データベース演算の演算内容を参照し、ＦＰＧＡ１０３で処理した結果のサイズを見積もる（Ｓ１１００４）。クエリ実行部１１０は、セグメント管理情報３０１から圧縮辞書を取得して、例えば、圧縮されたカラムデータを伸長したサイズをＦＰＧＡ処理結果１１７のサイズとして見積もることができる。

　そして、クエリ実行部１１０は、ＦＰＧＡ１０３へオフロードするデータ格納セグメント１１５のサイズ（ＦＰＧＡ処理対象データ１１６のサイズ）と、ＦＰＧＡ１０３で処理したＦＰＧＡ処理結果１１７の和を算出する。

　クエリ実行部１１０は、前記計算したＦＰＧＡ処理対象データ１１６のサイズと、前記見積もったＦＰＧＡ処理結果１１７のサイズの和と等しい値で、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６を確保可能か否かを判定する（Ｓ１１００５）。上記サイズでＣＰＵ・ＦＰＧＡ通信メモリ領域１０６確保できない場合は、ステップＳ１１００８へ進み、確保可能な場合にはステップＳ１００６に進む。

　クエリ実行部１１０は、データベース処理をＦＰＧＡ１０３にオフロード可能と判定する（Ｓ１１００６）。クエリ実行部１１０は、メモリ１０４にＣＰＵ・ＦＰＧＡ通信メモリ領域１０６を確保する。一方、クエリ実行部１１０は、ステップＳ１１００８で、データベース処理のオフロードは不可と判定する。

　クエリ実行部１１０は、前記判定によりオフロード可能と判定した場合、カラムデータ選択転送部１１２を起動する。オフロード不可と判定した場合は、ＣＰＵ１０２にてデータベース演算を実行する。

　以上のように、本実施例３によれば、ＣＰＵ１０２とＦＰＧＡ１０３とのＣＰＵ・ＦＰＧＡ通信メモリ領域１０６のサイズが、データロードの実行時とクエリ実行時とで異なる場合にも、ＦＰＧＡ１０３へのオフロードが可能となる。

　また、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６のサイズはＦＰＧＡ処理対象データ１１６のサイズと、ＦＰＧＡ処理結果１１７のサイズの和に等しいサイズで確保されるため、ＤＢＭＳ１０８がデータベース演算をＦＰＧＡ１０３にオフロードするときから、ＦＰＧＡ１０３で処理が完了するまで、ＦＰＧＡ処理対象データ１１６及びＦＰＧＡ処理結果１１７は、ＣＰＵ・ＦＰＧＡ通信メモリ領域１０６内にＦＰＧＡ処理対象データ１１６とＦＰＧＡ処理結果１１７を収めることができる。

　以下、本発明の実施例４を説明する。以下では、実施例１との相違点を主に説明し、実施例１～３との共通点については説明を省略または簡易にする。

　図１１は、実施例４にかかる計算機システムの構成を示すブロック図である。ＤＢＭＳ１０８は、バッファ管理部１２０２を有し、サーバ１０１は、ネットワーク１２０３を介してストレージ１２０１に接続される。実施例１においてメモリ１０４に格納されたデータ格納セグメント１１５は、ストレージ１２０１にデータ格納セグメント１１５－１～１１５－ｎとして格納される。

　ストレージ１２０１は、記憶デバイスを有する装置であり、例えば、ディスクアレイ装置であるが、それに代えて、単一の記憶デバイスであってもよい。前記記憶デバイスは、不揮発性の記憶媒体を有するデバイスであって、例えば、磁気ディスクドライブ、フラッシュメモリドライブ、その他半導体メモリドライブである。

　ネットワーク１２０３を介した通信プロトコルとしては、例えば、ファイバチャネル（ＦＣ）、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、または、ＴＣＰ／ＩＰ（Ｔｒａｎｓｍｉｓｓｉｏｎ　Ｃｏｎｔｒｏｌ　Ｐｒｏｔｏｃｏｌ／Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）が採用されてよい。

　ＤＢＭＳ１０８は、データ格納セグメント１１５にアクセスする際、ネットワーク１２０３を介してストレージ１２０１に対してデータ読み出し要求を発行し、ストレージは前記データ読み出し要求を受信し、対象データを読み出して返送し、前記ＤＢＭＳ１０８は、返送されたデータをバッファ管理部１２０２に一時的に格納し、前記バッファ管理部１２０２に格納されたデータにアクセスする。

　実施例４によれば、ストレージ装置に格納されたカラムストアデータベースに対しても、データベース処理のＦＰＧＡオフロードが実現可能となる。

　＜まとめ＞
　なお、上記実施例１～４では、アクセラレータとしてＦＰＧＡ１０３を用いる例を示したが、これに限定されるものではなく、ＧＰＧＰＵ（General-purpose computing on graphics processing units）やＡＳＩＣ（Application Specific Integrated Circuit）等を採用してもよい。

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。

　また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記録装置、または、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。

　また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

Claims

　プロセッサとメモリ及びアクセラレータとを含んでデータベースを処理する計算機であって、
　前記メモリは、前記プロセッサからアクセス可能な第１の記憶領域と、前記プロセッサと前記アクセラレータからアクセス可能な第２の記憶領域とを含み、
　データベースのデータを読み込んで、前記データベースを所定のサイズのデータセグメントに分割して前記メモリに設定された第１の記憶領域に格納するデータローダと、
　クエリを受け付けて、当該クエリに含まれるデータベース演算のうち、前記アクセラレータで実行可能なデータベース演算を通知するクエリ実行部と、
　前記クエリ実行部からの通知に基づいて、前記第１の記憶領域からデータセグメントを選択して、当該選択したデータセグメントを前記第２の記憶領域へ転送し、前記アクセラレータにデータベース演算の実行を通知するカラムデータ処理部と、を有し、
　前記データローダは、
　前記データベースのカラム毎に圧縮したカラムデータと、前記圧縮に使用した辞書とを前記データセグメントに設定することを特徴とする計算機。
　請求項１に記載の計算機であって、
　前記データローダは、
　前記データセグメントのサイズを、前記第２の記憶領域のサイズ以下に設定することを特徴とする計算機。
　請求項１に記載の計算機であって、
　前記第２の記憶領域は、
　前記データセグメントを格納する第１の格納領域と、前記データセグメントを前記アクセラレータで処理した結果を格納する第２の格納領域と、を含み、
　前記データローダは、
　前記第１の格納領域のサイズと第２の格納領域のサイズの和が、前記第２の記憶領域のサイズ以下となるように前記データセグメントを生成することを特徴とする計算機。
　請求項３に記載の計算機であって、
　前記クエリ実行部は、
　前記第１の格納領域のサイズと第２の格納領域のサイズの和が、前記第２の記憶領域のサイズを超える場合には、前記プロセッサで前記データベース演算を実行させることを特徴とする計算機。
　請求項１に記載の計算機であって、
　前記クエリ実行部は、
　所定の多重度以内で、前記アクセラレータで実行可能なデータベース演算を通知し、
　前記カラムデータ処理部は、
　前記多重度に応じて前記データセグメントを格納する第１の格納領域と、前記データセグメントを前記アクセラレータで処理した結果を格納する第２の格納領域と、を前記第２の記憶領域にそれぞれ確保することを特徴とする計算機。
　請求項１に記載の計算機であって、
　前記カラムデータ処理部は、
　前記クエリを参照して、前記選択した前記第１の記憶領域のデータセグメントから前記データベース演算で必要なカラムデータを選択して、当該選択したカラムデータを前記第２の記憶領域へ転送することを特徴とする計算機。
　プロセッサとメモリ及びアクセラレータとを含む計算機でデータベースを処理するデータベースの処理方法であって、
　前記プロセッサが、データベースのデータを読み込んで、前記データベースを所定のサイズのデータセグメントに分割して前記メモリに設定されて前記プロセッサからアクセス可能な第１の記憶領域に格納する第１のステップと、
　前記プロセッサが、クエリを受け付けて、当該クエリに含まれるデータベース演算のうち、前記アクセラレータで実行可能なデータベース演算を通知する第２のステップと、
　前記プロセッサが、通知に基づいて、前記第１の記憶領域からデータセグメントを選択して、当該選択したデータセグメントを、前記プロセッサと前記アクセラレータからアクセス可能な第２の記憶領域へ転送する第３のステップと、
　前記プロセッサが、前記アクセラレータにデータベース演算の実行を通知する第４のステップと、を含み、
　前記第１のステップは、
　前記データベースのカラム毎に圧縮したカラムデータと、前記圧縮に使用した辞書とを前記データセグメントに設定することを特徴とするデータベースの処理方法。
　請求項７に記載のデータベースの処理方法であって、
　前記第１のステップは、
　前記データセグメントのサイズを、前記第２の記憶領域のサイズ以下に設定することを特徴とするデータベースの処理方法。
　請求項７に記載のデータベースの処理方法であって、
　前記第２の記憶領域は、
　前記データセグメントを格納する第１の格納領域と、前記データセグメントを前記アクセラレータで処理した結果を格納する第２の格納領域と、を含み、
　前記第１のステップは、
　前記第１の格納領域のサイズと第２の格納領域のサイズの和が、前記第２の記憶領域のサイズ以下となるように前記データセグメントを生成することを特徴とするデータベースの処理方法。
　請求項９に記載のデータベースの処理方法であって、
　前記第２のステップは、
　前記第１の格納領域のサイズと第２の格納領域のサイズの和が、前記第２の記憶領域のサイズを超える場合には、前記プロセッサで前記データベース演算を実行させることを特徴とするデータベースの処理方法。
　請求項７に記載のデータベースの処理方法であって、
　前記第２のステップは、
　所定の多重度以内で、前記アクセラレータで実行可能なデータベース演算を通知し、
　前記第３のステップは、
　前記多重度に応じて前記データセグメントを格納する第１の格納領域と、前記データセグメントを前記アクセラレータで処理した結果を格納する第２の格納領域と、を前記第２の記憶領域にそれぞれ確保することを特徴とするデータベースの処理方法。
　請求項７に記載のデータベースの処理方法であって、
　前記第３のステップは、
　前記クエリを参照して、前記選択した前記第１の記憶領域のデータセグメントから前記データベース演算で必要なカラムデータを選択して、当該選択したカラムデータを前記第２の記憶領域へ転送することを特徴とするデータベースの処理方法。