JP5813458B2 - データベース装置およびデータベース装置の制御方法 - Google Patents

データベース装置およびデータベース装置の制御方法 Download PDF

Info

Publication number
JP5813458B2
JP5813458B2 JP2011236386A JP2011236386A JP5813458B2 JP 5813458 B2 JP5813458 B2 JP 5813458B2 JP 2011236386 A JP2011236386 A JP 2011236386A JP 2011236386 A JP2011236386 A JP 2011236386A JP 5813458 B2 JP5813458 B2 JP 5813458B2
Authority
JP
Japan
Prior art keywords
format
storage device
column
record
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011236386A
Other languages
English (en)
Other versions
JP2013097389A (ja
Inventor
圭 山地
圭 山地
基孝 金松
基孝 金松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011236386A priority Critical patent/JP5813458B2/ja
Publication of JP2013097389A publication Critical patent/JP2013097389A/ja
Application granted granted Critical
Publication of JP5813458B2 publication Critical patent/JP5813458B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、データベース装置およびデータベース装置の制御方法に関する。
記憶装置を有するデータベース装置は、記憶装置の記憶容量の削減や高速性能を求められる。このため、たとえば記憶装置に記憶されたデータへのアクセス速度を向上させるための種々の技術が開発されている。
特願2009−48497号公報
しかし、従来のこの種の技術は、記憶装置のデータへのアクセス速度を向上させるために、記憶装置の内容を別の記憶装置にコピーしておくようになっており、複数のボリュームが必要となってしまう。
また、記憶装置のフォーマットには、レコード型や、レコード型の各レコードを構成する複数のカラムごとにページ分割するカラム分割型などがある。レコード型フォーマットおよびカラム分割型フォーマットのいずれのフォーマットがデータへのアクセス速度に優れているかは、ユーザのデータ利用方法によって異なる。ユーザが同一レコードのデータに対するアクセスを多く行う場合はレコード型のほうが優れている一方、ユーザが同一カラムのデータに対するアクセスを多く行う場合はカラム分割型のほうが優れているといえる。
しかし、レコード型フォーマットとカラム分割型フォーマットのいずれのフォーマットを採用するかは、記憶装置を使用する前に決定しておかなければならない。にもかかわらず、記憶装置が使用されてデータの記録が進むと、データの内容によっては当初決定したフォーマットが必ずしも現状に適したフォーマットであるとはいえなくなる場合がある。
本発明の一実施形態に係るデータベース装置は、上述した課題を解決するために、ページ数取得部と、平均算出部と、見積もり部と、変更判定部と、フォーマット部とを備える。ページ数取得部は、レコード型と、レコード型の各レコードを構成する複数のカラムごとにページ分割するカラム分割型と、のいずれか一方のフォーマットでデータを記録される記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、参照されたデータが属する実参照ページ数である実参照ページ数を取得する。平均算出部は、記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、現在および過去に参照されたデータのレコード長の平均値を求めるとともに現在および過去に参照されたデータのカラム長の平均値を求める。見積もり部は、記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、記憶装置のフォーマットを他方のフォーマットとした場合においてこのアクセスによって参照されると予測される予測参照ページ数を求める。変更判定部は、実参照ページ数と予測参照ページ数とにもとづいて、記憶装置のフォーマットを他方のフォーマットに変更するか否かを判定する。フォーマット部は、変更判定部の判定結果に応じて記憶装置のフォーマットを他方のフォーマットに変更する。また、見積もり部は、記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、(a)記憶装置のフォーマットがレコード型であり他方のフォーマットがカラム分割型である場合は、レコード長の平均値、カラム長の平均値および全ページ数に応じた数の配列をカラムごとに用意し、実参照ページに対応する配列の数を求めることにより、このアクセスによって参照されると予測される予測参照ページ数を求める、または(b)記憶装置のフォーマットがカラム分割型であり他方のフォーマットがレコード型である場合は、各カラムをレコード長の平均値およびカラム長の平均値に応じて分割し、この分割したカラムごとに配列を用意し、実参照ページに対応する配列の数を求めることにより、このアクセスによって参照されると予測される予測参照ページ数を求める。
本発明の一実施形態に係るデータベース装置の一例を示す全体構成図。 レコード型フォーマットおよびカラム分割型フォーマットの1ファイルの論理構造の一例を示す説明図。 レコード型フォーマットおよびカラム分割型フォーマットのファイルを構成するデータに対するアクセスの様子の一例を示す説明図。 レコード型フォーマットのファイルを構成するレコードのIDとカラム分割型フォーマットのファイルを構成するカラムのIDとの関係の一例を示す説明図。 データベースエンジンの詳細な構成の一例を示すブロック図。 図1に示すデータベース装置のCPUにより、主記憶装置の使用が開始された後に、主記憶装置のデータへのアクセス速度を向上させるために最も適したフォーマットを的確に判定する際の手順を示すフローチャート。 レコード型フォーマットにおけるページ、レコードおよびカラムの関係の一例を示す説明図。 (a)は図7に示すデータのカラム分割型フォーマットにおけるカラムaのページとカラムの関係の一例を示す説明図、(b)はカラムbのページとカラムの関係の一例を示す説明図。 現在のフォーマットがカラム分割型である場合にレコード型における予測参照ページ数を求める際に、同時に複数のカラムに対してアクセス要求があるものの、全てのカラムについて同一の配列結果が得られる場合の例について示す説明図。 カラム分割型フォーマットからレコード型フォーマットへ段階的にフォーマット変更を行う場合において、ID1〜ID90のデータまでレコード型フォーマットへの変更が終了した様子の一例を示す説明図。 図10に示す例のあと、さらにID120のデータまでレコード型フォーマットへの変更が終了した様子の一例を示す説明図。
本発明に係るデータベース装置およびデータベース装置の制御方法の実施の形態について、添付図面を参照して説明する。
図1は、本発明の一実施形態に係るデータベース装置10の一例を示す全体構成図である。
データベース装置10は、図1に示すように、データベースエンジン11、表示部12および入力部13および主記憶装置14を有する。
データベースエンジン11は、主制御部21と、レコード型エンジン22と、カラム分割型エンジン23とを有する。
主制御部21は、CPU31および記憶部32を有する。記憶部32は、キャッシュメモリ33と、不揮発性の記憶媒体により構成された不揮発性記憶部34を有する。
レコード型エンジン22およびカラム分割型エンジン23は、いわゆるストレージエンジンである。レコード型エンジン22およびカラム分割型エンジン23は、たとえば、それぞれ主制御部21のCPU31が不揮発性記憶部34に記憶されたプログラムを実行することにより実現される機能実現部として構成されてもよいし、それぞれCPU、RAM、ROMなどを有するいわゆるワンチップマイクロコントローラにより構成されてもよい。なお、CPU31の機能実現部として構成される場合、見積もり式51、61は、たとえば記憶部32に記憶されていればよい。
表示部12は、たとえば液晶ディスプレイやOLED(Organic Light Emitting Diode)ディスプレイなどの一般的な表示出力装置により構成され、主制御部21の制御に従って各種情報を表示する。
入力部13は、たとえばキーボード、タッチパネル、テンキーなどの一般的な入力装置により構成され、ユーザの操作に対応した操作入力信号を主制御部21に出力する。
主記憶装置14は、磁気的もしくは光学的記録媒体または半導体メモリなどのCPU31により読み書き可能な記録媒体を含んだ構成を有し、これら記憶媒体内のプログラムおよびデータの一部または全部は電子ネットワークを介してダウンロードされるように構成してもよい。
主記憶装置14は、データベースエンジン11によりレコード型フォーマットおよびカラム分割型フォーマットのいずれか1つのフォーマットでデータを記録される。
図2は、レコード型フォーマットおよびカラム分割型フォーマットの1ファイルの論理構造の一例を示す説明図である。
レコード型フォーマット(以下、レコード型という)およびカラム分割型フォーマット(以下、カラム分割型という)とも、1ファイルは、複数のページによって構成されるとともに、各ページは一定のサイズを有する。換言すれば、この一定のページサイズとページ数とを乗じることで、各ファイルのサイズを得ることができる。
図2に示すように、レコード型において、各ページは複数のレコードで構成され、各レコードは複数のカラムにより構成される。カラム分割型において、各ページは同一のカラムで構成される。なお、各カラムは、同一のカラムごとに固定長か可変長かを選択することができる。したがって、同一のカラムごとにカラム長が異なる場合がある。
データベースエンジン11は、ページ単位でフォーマットを管理する。このページ単位のフォーマットの情報は、テーブルヘッダに記録されている。データベースエンジン11は、ページにアクセスする際に、まずテーブルヘッダから各ページのフォーマットの情報を取得する。
図3は、レコード型フォーマットおよびカラム分割型フォーマットのファイルを構成するデータに対するアクセスの様子の一例を示す説明図である。また、図4は、レコード型フォーマットのファイルを構成するレコードのIDとカラム分割型フォーマットのファイルを構成するカラムのIDとの関係の一例を示す説明図である。
図4に示すように、レコード型のファイルを構成する各レコードにはIDが付加されるとよい。また、レコードを構成する各カラムにも、レコードのIDと同一のIDが付加されるとよい。図2−4に示す例では、レコード型においては1つのレコードは1つの行を構成するため、レコードのIDは行のID(rowid)と同一となる。
各種アプリケーションプログラムのデータベースアクセス要求を行う機能実現部としてのアクセス部100は、データベース装置10に対し、主記憶装置14に記憶されたデータに対するアクセス要求を行う。アクセス部100は、たとえばデータベース装置10を内包するパーソナルコンピュータなどの情報処理装置のCPUが各種アプリケーションプログラムを実行することにより実現されてもよいし、データベース装置10にネットワークを介して接続された外部のパーソナルコンピュータなどの情報処理装置のCPUが各種アプリケーションプログラムを実行することにより実現されてもよい。
たとえば、図2に示す例において、アクセス要求が“SELECT * FROM table where rowid=2”である場合を考える。この場合、図3に示すように、レコード型のファイルでは2行目のレコードが抽出される。このとき参照されるページ数は1ページである。一方、カラム分割型のファイルでは参照されるページ数は3ページである。
他方、図2に示す例において、アクセス要求が“SELECT name FROM table”である場合を考える。この場合、図3に示すように、レコード型のファイルでは1列目のレコードが抽出され、このとき参照されるページ数は3ページである。一方、カラム分割型のファイルでは参照されるページ数は1ページである。
参照されるページ数が少ないほうが、データアクセス速度が速いといえる。しかし、図3に示すように、レコード型フォーマットおよびカラム分割型フォーマットのいずれのフォーマットがデータへのアクセス速度に優れているか、すなわちいずれのフォーマットが少ない参照ページ数ですむかは、アクセス内容に応じて異なる。このため、いずれのフォーマットが少ない参照ページ数ですむかは、ユーザのデータの利用傾向に応じて異なると考えられる。
そこで、本実施形態に係るデータベース装置10は、現在のフォーマットにおいて実際に参照されたページの数である実参照ページ数を蓄積するとともに、他のフォーマットであった場合に同一のアクセスで参照されていたと予測されるページの数である予測参照ページ数を蓄積することで、主記憶装置14へのデータの蓄積やデータの更新が進んだ後でも、ユーザの利用傾向を反映しつつデータへのアクセス速度を向上させるために最も適したフォーマットに主記憶装置14の各ページのフォーマットを変更する。
図5は、データベースエンジン11の詳細な構成の一例を示すブロック図である。
主制御部21のCPU31は、不揮発性記憶部34に記憶されたプログラムおよびこのプログラムの実行のために必要なデータをキャッシュメモリ33へロードし、このプログラムに従って、主記憶装置14の使用が開始された後に、主記憶装置14のデータへのアクセス速度を向上させるために最も適したフォーマットを的確に判定する処理を実行する。
キャッシュメモリ33は、CPU31が実行するプログラムおよびデータを一時的に格納するワークエリアを提供する。また、キャッシュメモリ33は、主記憶装置14に記憶されたデータの一部を一時的に記憶する。
不揮発性記憶部34は、データベース装置10の起動プログラムや、プログラムを実行するために必要な各種データを記憶する。
なお、不揮発性記憶部34は、磁気的もしくは光学的記録媒体または半導体メモリなどの、CPU31により読み書き可能な記録媒体を含んだ構成を有し、これら記憶媒体内のプログラムおよびデータの一部または全部は電子ネットワークを介してダウンロードされるように構成してもよい。
CPU31は、プログラムによって、少なくともアクセス内容解析部41、読み書き部42、ページ数取得部43、平均算出部44、見積もり部45および変更判定部46として機能する。この各部41〜46は、キャッシュメモリ33の所要のワークエリアをデータの一時的な格納場所として利用する。
レコード型エンジン22は、見積もり式51を記憶しているとともに、フォーマット部52を有する。
見積もり式51は、主記憶装置14のフォーマットがカラム分割型である場合に、主記憶装置14のフォーマットをレコード型とした場合における予測参照ページ数を算出するための式である。
フォーマット部52は、変更判定部46により制御されて、主記憶装置14のフォーマットをページごとにレコード型フォーマットに変更する機能を有する。
カラム分割型エンジン23は、見積もり式61を記憶しているとともに、フォーマット部62を有する。
見積もり式61は、主記憶装置14のフォーマットがレコード型である場合に、主記憶装置14のフォーマットをカラム分割型とした場合における予測参照ページ数を算出するための式である。
フォーマット部62は、変更判定部46により制御されて、主記憶装置14のフォーマットをページごとにカラム分割型フォーマットに変更する機能を有する。
アクセス内容解析部41は、各種アプリケーションプログラムのデータベースアクセス要求を行う機能実現部としてのアクセス部100から主記憶装置14に記憶されたデータに対するアクセス要求を受けるごとに(アクセスがあるごとに)、アクセス内容を解析する。たとえばアクセスがSQL文を用いて行われる場合、アクセス内容解析部41は、SQL文からアクセス内容を解析する。
読み書き部42は、アクセス内容に応じて主記憶装置14に対してデータの読み書きを行うとともに、必要に応じてデータをキャッシュメモリ33に格納する。
ページ数取得部43は、アクセスがあるごとに、アクセス内容解析部41により解析されたアクセス内容から今回アクセスされるページ数である実参照ページ数の情報を取得する。そして、ページ数取得部43は、記憶部32のキャッシュメモリ33または不揮発性記憶部34から実参照ページ数の積算値を読み出し、この今回のアクセスでの実参照ページ数をさらに積算して新たな積算値とし、記憶部32に記憶させる。
また、ページ数取得部43は、アクセスがあるごとに、アクセス内容解析部41により解析されたアクセス内容から今回アクセスされるデータのレコード長およびカラムのカラム長を取得して平均算出部44に与える。たとえば、アクセスがSQL文を用いて行われる場合、アクセス内容解析部41は、SQL文にもとづいて今回のアクセスにおける実参照ページ数、レコード長およびカラム長の情報を抽出する。このとき、SQL文そのものを平均算出部44に与える必要はない。
平均算出部44は、記憶部32のキャッシュメモリ33または不揮発性記憶部34に記憶されたこれまでのアクセスにおけるレコード長の平均値の情報を読みだす。そして、ページ数取得部43から受けた今回アクセスされるデータのレコード長とこれまでのアクセスにおけるレコード長の平均値とを平均して新たに現在の平均値を算出して記憶部32の平均値を更新する。
また、平均算出部44は、記憶部32のキャッシュメモリ33または不揮発性記憶部34に記憶されたこれまでのアクセスにおけるカラム長の平均値の情報を読みだす。そして、ページ数取得部43から受けた今回アクセスされるデータのカラム長とこれまでのアクセスにおけるカラム長の平均値とを平均して新たに現在の平均値を算出して記憶部32の平均値を更新する。
見積もり部45は、記憶部32からレコード長の現在の平均値およびカラム長の現在の平均値の情報を取得する。そして、現在のフォーマット(たとえばレコード型フォーマット)とは異なる他方のフォーマット(たとえばカラム分割型フォーマット)の見積もり式(たとえば見積もり式61)を用いて、レコード長の現在の平均値およびカラム長の現在の平均値にもとづいて、主記憶装置14のフォーマットを現在のフォーマットとは異なる他方のフォーマットとした場合における、今回のアクセスでの予測参照ページ数を求める。そして、見積もり部45は、記憶部32のキャッシュメモリ33または不揮発性記憶部34から予測参照ページ数の積算値を読出し、この今回のアクセスでの予測参照ページ数をさらに積算して新たな積算値とし、記憶部32に記憶させる。
変更判定部46は、記憶部32に記憶された実参照ページ数の積算値と予測参照ページ数の積算値とにもとづいて、主記憶装置14のフォーマットをどちらのフォーマットにすると利便性が高いかを判定する。判定結果のフォーマットが現在のフォーマットと異なる場合は、変更判定部46は、主記憶装置14のフォーマットを判定結果のフォーマットに変更するようフォーマット部52および62のいずれかに指示する。
なお、主記憶装置14に対するアクセスが集中している場合などフォーマット変更にふさわしくない場合には、変更判定部46は、主記憶装置14のフォーマットを変更すべき旨の情報およびどのフォーマットに変更するかを示す情報を一旦記憶部32に格納しておくとよい。この場合、変更判定部46は、たとえばあらかじめ定めた所定のタイミング(たとえば主記憶装置14の断片化を解消するための再編成を実行するタイミングなど)やユーザによる入力部13を介したフォーマット変更指示をうけたタイミングで、記憶部32にフォーマットを変更すべき旨の情報が格納されているか否かを確認し、格納されていれば、およびどのフォーマットに変更するかを示す情報に応じてフォーマット部52および62のいずれかに主記憶装置14のフォーマットを変更するよう指示するとよい。
次に、本実施形態に係るデータベース装置およびデータベース装置の制御方法の動作の一例について説明する。
図6は、図1に示すデータベース装置10のCPU31により、主記憶装置14の使用が開始された後に、主記憶装置14のデータへのアクセス速度を向上させるために最も適したフォーマットを的確に判定する際の手順を示すフローチャートである。図6において、Sに数字を付した符号は、フローチャートの各ステップを示す。
この手順は、アクセス部100から主記憶装置14に記憶されたデータに対するアクセス要求を受けた時点でスタートとなる。
まず、ステップS1において、アクセス内容解析部41は、アクセス部100から主記憶装置14に記憶されたデータに対するアクセス要求を受け、アクセス内容を解析する。
次に、ステップS2において、ページ数取得部43は、アクセス内容解析部41により解析されたアクセス内容から今回アクセスされるページ数である実参照ページ数の情報を取得する。そして、ページ数取得部43は、記憶部32から実参照ページ数の積算値を読み出し、この今回のアクセスでの実参照ページ数をさらに積算して新たな積算値とし、記憶部32に記憶させる。また、ページ数取得部43は、アクセス内容解析部41により解析されたアクセス内容から今回アクセスされるデータのレコード長およびカラムのカラム長を取得して平均算出部44に与える。
次に、ステップS3において、平均算出部44は、記憶部32に記憶されたこれまでのアクセスにおけるレコード長の平均値の情報を読みだす。そして、ページ数取得部43から受けた今回アクセスされるデータのレコード長とこれまでのアクセスにおけるレコード長の平均値とを平均して新たに現在の平均値を算出して記憶部32の平均値を更新する。
次に、ステップS4において、平均算出部44は、記憶部32に記憶されたこれまでのアクセスにおけるカラム長の平均値の情報を読みだす。そして、ページ数取得部43から受けた今回アクセスされるデータのカラム長とこれまでのアクセスにおけるカラム長の平均値とを平均して新たに現在の平均値を算出して記憶部32の平均値を更新する。
次に、ステップS5において、見積もり部45は、記憶部32からレコード長の現在の平均値の情報を取得するとともに、カラム長の現在の平均値の情報を取得し、現在のフォーマットとは異なる他方のフォーマットの見積もり式を用いて、主記憶装置14のフォーマットを現在のフォーマットとは異なる他方のフォーマットとした場合における、今回のアクセスでの予測参照ページ数を求める。そして、見積もり部45は、記憶部32から予測参照ページ数の積算値を読出し、この今回のアクセスでの予測参照ページ数をさらに積算して新たな積算値とし、記憶部32に記憶させる。
次に、ステップS6において、変更判定部46は、記憶部32に記憶された実参照ページ数の積算値と予測参照ページ数の積算値とにもとづいて、主記憶装置14のフォーマットをどちらのフォーマットにすると利便性が高いかを判定する。そして、判定結果のフォーマットが現在のフォーマットと異なるか否かをもって、主記憶装置14のフォーマットを判定結果のフォーマットに変更すべきか否かを判定する。
フォーマットを変更すべき場合は、変更すべき旨の情報およびどのフォーマットに変更するかを示す情報を記憶部32に格納する(ステップS7)。その後、所定のタイミングで記憶部32にフォーマットを変更すべき旨の情報が格納されていることを確認し、どのフォーマットに変更するかを示す情報に応じてフォーマット部52および62のいずれかに主記憶装置14のフォーマットを変更するよう指示し、フォーマット部52および62のいずれかによって主記憶装置14のフォーマットが変更される(ステップS8)。一方、フォーマットを変更すべきでない場合(ステップS6のNO)、すなわち現在のフォーマットが最も利便性が高い場合は、一連の手順は終了となる。
なお、ステップS7は、主記憶装置14に対するアクセスが集中している場合などフォーマット変更にふさわしくない場合に実行されるとよいが、実行されずともよい。ステップS7を実行しない場合は、変更判定部46は、主記憶装置14のフォーマットを変更すべきと判定すると、速やかにフォーマット部52および62のいずれかにフォーマットを変更するよう指示し、ステップS8に移行する。
以上の手順により、主記憶装置14の使用が開始された後に、主記憶装置14のデータへのアクセス速度を向上させるために最も適したフォーマットを的確に判定することができる。
ここで、図6のステップS5で見積もり部45により実行される予測参照ページ数の算出方法について説明する。
図7は、レコード型フォーマットにおけるページ、レコードおよびカラムの関係の一例を示す説明図である。図7には、1レコードの平均長Xが20、レコード数が100、1ページの大きさが1000であり、各レコードが4つのカラムa、b、c、dで構成され、カラムa、b、c、dの平均長Ya、Yb、Yc、Ydがそれぞれ4、5、3、8である場合の例について示した。
また、図8(a)は、図7に示すデータのカラム分割型フォーマットにおけるカラムaのページとカラムの関係の一例を示す説明図、(b)はカラムbのページとカラムの関係の一例を示す説明図である。
図7に示すように、1レコードの平均長Xが20、1ページの大きさが1000である場合、レコード型では、1ページには50件のレコードが格納される。IDnのレコードを構成するカラムをそれぞれan、bn、cn、dnとすると、たとえば1ページ目にはa1〜d1で構成されるレコードからa50〜d50で構成されるレコードまでが格納される。
一方、図8(a)に示すように、カラム平均長Yaが4のカラムaは、カラム分割型では1ページに250件が格納され、たとえば1ページ目にはa1〜a250が格納される。また、図8(b)に示すように、カラム平均長Ybが5のカラムbは、カラム分割型では1ページに200件が格納され、たとえば1ページ目にはb1〜b200が格納される。
まず、現在のフォーマットがレコード型である場合に、カラム分割型における予測参照ページ数を求める方法について説明する。
図7および8に示す例において、現在のフォーマットがレコード型である場合に、アクセス要求が“SELECT a, b FROM table”である場合を考える。このアクセス要求はカラムa1〜1000とカラムb1〜1000を抽出する要求であるため、レコード型の1行目および2行目が抽出され、このアクセスにおける実参照ページ数は20である(図7参照)。一方、主記憶装置14のフォーマットがカラム分割型であると仮定すると、図8のようなデータ構造となる。このため、このアクセス要求における予測参照ページ数は、カラムaについて4ページ(図8(a)参照)、カラムbについて5ページ(図8(b)参照)の合計9ページである。
カラム分割型のカラムaの全5ページ中の1ページ目には、a1〜a250が格納される。一方、レコード型では、a1〜a250は全20ページ中の1ページ目から5ページ目にかけて50件ずつ格納される。このため、たとえばレコード型で全20ページ中の1ページ目から5ページ目が参照された場合は、カラム分割型では全5ページ中の1ページ目が参照されることが予測できる。よって、レコード型でNページ目を開いた場合は、カラム分割型では(N/5)+1ページ目(整数部分のみ)が参照されると予測できる。
したがって、カラムごとに(「カラムの平均長Y」/「レコードの平均長X」)・「レコード型のページ数」の数の配列を用意し、Nページ目が参照された場合はN/((X/Y)+1)番目の配列に1を立てればよい。そして、カラムごとに1が立っている配列の数を取得し、すべてのカラムについて加算することで、カラム分割型であると仮定した場合における予測参照ページ数を求めることができる。
たとえば図7および図8に示す例では、カラムaについては(Ya/X)・ページ数=(4/20)・20=4つの配列を用意し、n番目の配列にページ型の1+(X/Ya)(n−1)ページ目から(X/Ya)・nページ目、すなわち1+5(n−1)ページ目から5nページ目を割り当てればよく(n=1〜4)、カラムbについては、(Yb/X)・ページ数=(5/20)・20=5つの配列を用意し、m番目の配列にページ型の1+(X/Yb)(m−1)ページ目から(X/Yb)・mページ目、すなわち1+4(m−1)ページ目から4mページ目を割り当てればよい(m=1〜5)。
次に、現在のフォーマットがカラム分割型である場合に、レコード型における予測参照ページ数を求める方法について説明する。
図7および8に示す例において、カラムaの1ページ目はレコード型の1〜5ページ目に対応する。また、カラムbの1ページ目はレコード型の1〜4ページ目に対応する。
このため、各カラムを(レコード平均長X/カラム平均長Y)で分割し、分割カラムごとに配列を用意し、参照された分割カラムの配列に1を立てればよい。そして、1が立っている配列の数を加算することで、レコード型であると仮定した場合における予測参照ページ数を求めることができる。
図9は、現在のフォーマットがカラム分割型である場合にレコード型における予測参照ページ数を求める際に、同時に複数のカラムに対してアクセス要求があるものの、全てのカラムについて同一の配列結果が得られる場合の例について示す説明図である。
たとえば、“SELECT a, b FROM table where 条件”などのアクセスでは、同時に複数のカラムに対してアクセス要求があるものの、全てのカラムについて同一の配列結果が得られる(図9参照)。この場合、いずれか1つのカラムにのみ注目すればよい。
このようにして予測参照ページ数を求めた後、図6のステップS6で変更判定部46により主記憶装置14のフォーマットをどちらのフォーマットにすると利便性が高いかを判定する処理が実行される。このとき、変更判定部46は、簡単には、記憶部32に記憶された実参照ページ数の積算値が予測参照ページ数の積算値より大きいとフォーマットを変更すべきと判定すればよい。
また、変更判定部46は、実参照ページ数の積算値が予測参照ページ数の積算値より大きく、かつ互いの積算値の差が所定の閾値よりも大きい場合にフォーマットを変更すべきと判定してもよい。所定の閾値を用いる場合、互いの積算値の差が小さい場合に頻繁に大小が入れ替わることによりフォーマット変更が繰り返されてしまう弊害を未然に防ぐことができる。また、互いの積算値の差に代えて、たとえば実参照ページ数の積算値に所定の数値(たとえば0.6など)を乗じた数が予測参照ページ数の積算値よりも大きい場合に、主記憶装置14のフォーマットを変更すべきと判定してもよい。
図10は、カラム分割型フォーマットからレコード型フォーマットへ段階的にフォーマット変更を行う場合において、ID1〜ID90のデータまでレコード型フォーマットへの変更が終了した様子の一例を示す説明図である。また、図11は、図10に示す例のあと、さらにID120のデータまでレコード型フォーマットへの変更が終了した様子の一例を示す説明図である。
フォーマット部52および62は、変更判定部46に制御されて主記憶装置14のフォーマットを変更する。このとき、フォーマットの変更は、図10および図11に示すように段階的に実行されてもよい。
たとえば、現在のフォーマットがカラム分割型フォーマットであり、変更判定部46からフォーマット部52に対してレコード型フォーマットに変更するよう指示された場合を考える。この場合、フォーマット部52は、たとえばレコード型フォーマットのページ単位で段階的にフォーマットの変更を行う。
たとえば、図10に示すように、レコード型フォーマットの1ページあたりのデータ数が30であり、ID1〜90のデータまでレコード型フォーマットへの変更が終了した場合、フォーマット部52は、テーブルヘッダにその旨の情報を格納する。このため、たとえばアクセス部100からID80のデータに対するアクセス要求があると、読み書き部42はテーブルヘッダを確認し、レコード型フォーマットで主記憶装置14に記憶されたID80のデータへアクセスする。一方、アクセス部100からID120のデータに対するアクセス要求があると、読み書き部42はテーブルヘッダを確認し、カラム分割型フォーマットで主記憶装置14に記憶されたID120のデータへアクセスする。
次に、ID91〜120のデータで構成されるページのレコード型フォーマットへの変更が終了すると、図11に示すように、フォーマット部52は、テーブルヘッダにその旨の情報を格納する。このとき、カラム分割型フォーマット側のページのうち、ページを構成する全てのデータがレコード型フォーマットに変更されたページについては、削除してかまわない。
このように、フォーマット部52および62は、現在のフォーマットとは異なる他方のフォーマットのページ単位で段階的にフォーマットの変更を行ってもよい。
本実施形態に係るデータベース装置10によれば、主記憶装置14の使用が開始された後であっても、データの使用履歴にもとづいて他方のフォーマットでの予測参照ページ数を求めることができ、主記憶装置14のデータへのアクセス速度を向上させるために最も適したフォーマットを的確に判定することができる。
なお、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
また、本発明の実施形態では、フローチャートの各ステップは、記載された順序に沿って時系列的に行われる処理の例を示したが、必ずしも時系列的に処理されなくとも、並列的あるいは個別実行される処理をも含むものである。
10 データベース装置
11 データベースエンジン
14 主記憶装置
22 レコード型エンジン
23 カラム分割型エンジン
32 記憶部
33 キャッシュメモリ
41 アクセス内容解析部
43 ページ数取得部
44 平均算出部
45 見積もり部
46 変更判定部
51、61 見積もり式
52、62 フォーマット部

Claims (4)

  1. レコード型と、前記レコード型の各レコードを構成する複数のカラムごとにページ分割するカラム分割型と、のいずれか一方のフォーマットでデータを記録される記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、参照されたデータが属する実参照ページ数である実参照ページ数を取得するページ数取得部と、
    前記記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、現在および過去に参照されたデータのレコード長の平均値を求めるとともに前記現在および過去に参照されたデータのカラム長の平均値を求める平均算出部と、
    前記記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、前記記憶装置のフォーマットを他方のフォーマットとした場合においてこのアクセスによって参照されると予測される予測参照ページ数を求める見積もり部と、
    前記実参照ページ数と前記予測参照ページ数とにもとづいて、前記記憶装置のフォーマットを前記他方のフォーマットに変更するか否かを判定する変更判定部と、
    前記変更判定部の判定結果に応じて前記記憶装置のフォーマットを前記他方のフォーマットに変更するフォーマット部と、
    を備え
    前記見積もり部は、
    前記記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、(a)前記記憶装置のフォーマットが前記レコード型であり前記他方のフォーマットが前記カラム分割型である場合は、前記レコード長の平均値、前記カラム長の平均値および全ページ数に応じた数の配列をカラムごとに用意し、前記実参照ページに対応する配列の数を求めることにより、このアクセスによって参照されると予測される前記予測参照ページ数を求める、または(b)前記記憶装置のフォーマットが前記カラム分割型であり前記他方のフォーマットが前記レコード型である場合は、各カラムを前記レコード長の平均値および前記カラム長の平均値に応じて分割し、この分割したカラムごとに配列を用意し、前記実参照ページに対応する配列の数を求めることにより、このアクセスによって参照されると予測される前記予測参照ページ数を求める、
    データベース装置。
  2. 前記変更判定部は、
    前記ページ数取得部により取得されたページ数が前記見積もり部により求められた前記予測参照ページ数よりも多く、かつ互いの差が所定の閾値以上であると、前記記憶装置のフォーマットを前記他方のフォーマットに変更すると判定する、
    請求項1記載のデータベース装置。
  3. 前記フォーマット部は、
    前記変更判定部により前記記憶装置のフォーマットを前記他方のフォーマットに変更すると判定された後、前記変更判定部によりフォーマットの変更を実行するよう指示されるまで前記記憶装置のフォーマットの変更を待機する、
    請求項1または2に記載のデータベース装置。
  4. レコード型と、前記レコード型の各レコードを構成する複数のカラムごとにページ分割するカラム分割型と、のいずれか一方のフォーマットでデータを記録される記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、参照されたデータが属する実参照ページ数である実参照ページ数を取得するステップと、
    前記記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、現在および過去に参照されたデータのレコード長の平均値を求めるとともに前記現在および過去に参照されたデータのカラム長の平均値を求めるステップと、
    前記記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、前記記憶装置のフォーマットを他方のフォーマットとした場合においてこのアクセスによって参照されると予測される予測参照ページ数を求めるステップと、
    前記実参照ページ数と前記予測参照ページ数とにもとづいて、前記記憶装置のフォーマットを前記他方のフォーマットに変更するか否かを判定するステップと、
    前記他方のフォーマットに変更すると判定されると、前記記憶装置のフォーマットを前記他方のフォーマットに変更するステップと、
    を有し、
    前記予測参照ページ数を求めるステップは、
    前記記憶装置に対してアプリケーションプログラムによるアクセスがあるごとに、(a)前記記憶装置のフォーマットが前記レコード型であり前記他方のフォーマットが前記カラム分割型である場合は、前記レコード長の平均値、前記カラム長の平均値および全ページ数に応じた数の配列をカラムごとに用意し、前記実参照ページに対応する配列の数を求めることにより、このアクセスによって参照されると予測される前記予測参照ページ数を求めるステップである、または(b)前記記憶装置のフォーマットが前記カラム分割型であり前記他方のフォーマットが前記レコード型である場合は、各カラムを前記レコード長の平均値および前記カラム長の平均値に応じて分割し、この分割したカラムごとに配列を用意し、前記実参照ページに対応する配列の数を求めることにより、このアクセスによって参照されると予測される前記予測参照ページ数を求めるステップである、
    データベース装置の制御方法。
JP2011236386A 2011-10-27 2011-10-27 データベース装置およびデータベース装置の制御方法 Expired - Fee Related JP5813458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011236386A JP5813458B2 (ja) 2011-10-27 2011-10-27 データベース装置およびデータベース装置の制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011236386A JP5813458B2 (ja) 2011-10-27 2011-10-27 データベース装置およびデータベース装置の制御方法

Publications (2)

Publication Number Publication Date
JP2013097389A JP2013097389A (ja) 2013-05-20
JP5813458B2 true JP5813458B2 (ja) 2015-11-17

Family

ID=48619314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011236386A Expired - Fee Related JP5813458B2 (ja) 2011-10-27 2011-10-27 データベース装置およびデータベース装置の制御方法

Country Status (1)

Country Link
JP (1) JP5813458B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626421B2 (en) * 2007-09-21 2017-04-18 Hasso-Plattner-Institut Fur Softwaresystemtechnik Gmbh ETL-less zero-redundancy system and method for reporting OLTP data
US8150850B2 (en) * 2008-01-07 2012-04-03 Akiban Technologies, Inc. Multiple dimensioned database architecture
WO2011099114A1 (ja) * 2010-02-09 2011-08-18 株式会社ターボデータラボラトリー ハイブリッド型データベースシステム及びその動作方法

Also Published As

Publication number Publication date
JP2013097389A (ja) 2013-05-20

Similar Documents

Publication Publication Date Title
CN107609098B (zh) 搜索方法及装置
CN100458779C (zh) 扩展索引的方法
US9990276B2 (en) Read-write control method for memory, and corresponding memory and server
CN103914483B (zh) 文件存储方法、装置及文件读取方法、装置
EP2735978A1 (en) Storage system and management method used for metadata of cluster file system
US20160253982A1 (en) Contextual zoom
JP5499825B2 (ja) データベース管理方法、データベースシステム、プログラム及びデータベースのデータ構造
CN103019887A (zh) 数据备份方法及装置
US8255406B2 (en) Data management using multi-state bloom filter
CN109582598B (zh) 一种基于外部存储实现高效查找哈希表的预处理方法
WO2012169102A1 (ja) データベース性能予測装置及びデータベース予測方法
JPWO2010084754A1 (ja) データベースシステム、データベース管理方法、及びデータベース構造
CN104504076A (zh) 一种高并发和高空间利用率的分布式缓存方法
JP5230184B2 (ja) 検索装置、検索方法及び検索プログラム
US20070255771A1 (en) Method and system for renewing an index
JP2010211633A (ja) ストレージシステム及びデータマイグレーション対応検索システム
US8332595B2 (en) Techniques for improving parallel scan operations
US20100287331A1 (en) Electronic device and method for recording power-on time thereof
Park et al. FAST: Flash-aware external sorting for mobile database systems
JP5813458B2 (ja) データベース装置およびデータベース装置の制御方法
Chai et al. The adapted pure h-index
US7991756B2 (en) Adding low-latency updateable metadata to a text index
JP2009157441A (ja) 情報処理装置、ファイル再配置方法およびプログラム
WO2011099114A1 (ja) ハイブリッド型データベースシステム及びその動作方法
JP5813457B2 (ja) データベース装置およびデータベース装置の制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140814

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150916

R151 Written notification of patent or utility model registration

Ref document number: 5813458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees