JP5665518B2 - データベースシステム、その情報処理方法、およびそのプログラム - Google Patents

データベースシステム、その情報処理方法、およびそのプログラム Download PDF

Info

Publication number
JP5665518B2
JP5665518B2 JP2010278564A JP2010278564A JP5665518B2 JP 5665518 B2 JP5665518 B2 JP 5665518B2 JP 2010278564 A JP2010278564 A JP 2010278564A JP 2010278564 A JP2010278564 A JP 2010278564A JP 5665518 B2 JP5665518 B2 JP 5665518B2
Authority
JP
Japan
Prior art keywords
file
data
commit
database
update
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010278564A
Other languages
English (en)
Other versions
JP2012128596A (ja
JP2012128596A5 (ja
Inventor
鈴木 大記
大記 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010278564A priority Critical patent/JP5665518B2/ja
Publication of JP2012128596A publication Critical patent/JP2012128596A/ja
Publication of JP2012128596A5 publication Critical patent/JP2012128596A5/ja
Application granted granted Critical
Publication of JP5665518B2 publication Critical patent/JP5665518B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ファイルベースのデータベースシステムに関する。
近年、記憶メディアの大容量化に伴って機器の扱うデータが増大している。同時に扱うデータの種類も増えている。そのため、機器でのデータ処理負荷低減および機器内アプリケーションの開発負荷低減のために、組込み機器用のデータベースシステムが多数提案され利用されるようになってきている。
一般にデータベースシステムでは、不可分な一連の処理をトランザクションとして管理する。処理結果はトランザクション単位で利用され、トランザクション実行中の処理途中状態結果を他が利用することを阻止する。トランザクション単位での処理結果の確定はコミットによって指示し、結果の破棄(トランザクション実行前に戻す)はロールバックによって指示する。
また、データベースシステムはコミットした処理結果を障害等で紛失しないことを保証する。データを保証するため、コミット時にハードディスク装置等の永続化可能な記憶装置へ処理結果を書き込んでいる。書き込み途中の状態での利用は処理結果を正しく読み出すことができないため、他からのアクセスを排他する。
永続化可能な記憶装置への書き込み時間は、通常メモリ上の更新時間と比べ数十倍以上遅い。ファイルシステムはメモリ上にファイルバッファを持ち、ファイルバッファ上に書き込まれただけでアプリケーションに終了をリターンする。これにより、アプリケーションへの書込応答時間を短縮している。実際には記憶装置に書き終わっていないので、リターン時にはデータは保証されていない。ファイルベースのデータベースシステムは、データ保証のために、ファイルバッファから記憶装置への書き込みを実行している時間に、他からのアクセスを排他する。よって、他が利用できるようになるには、書き込みが終わるまで待機し、時間がかかる。
排他時間を短縮するために、記憶装置への書き込みが終了する前に他から利用可能とする取り組みがなされてきた。例えば特許文献1においては、データベースファイルのコピーをメモリ上に保持すると同時にコミット時の更新差分情報もトランザクション単位で保持する手法が開示されている。
特開平5−88954号公報
しかしながら、データベースファイルのコピーをメモリ上に保持する手法は登録データ量に比例してメモリリソースを必要とする。そのため、近年適用が進んでいる組込み機器のような環境では適用できない。メモリ上の共有は、データの一部に制限する必要がある。
しかし、データベースエンジンのローカルメモリ自体を共有する手法では、ローカルメモリを共有化するための制御にかかる負荷が大きいという問題がある。またファイルバッファからファイルへの書き込みを行わないコミット手法も提供されているが、その場合はロールバック用の更新前データと更新後データの整合性を失うことでリカバリが不可能になる問題がある。
また、コミットのようなトランザクションをクローズさせる指示は、直後にファイルへの書き込み指示を実行する他のトランザクションが開始されてしまう問題もある。
以上の問題から、組込み機器において、トランザクション実行中の任意のタイミングの更新状態を、他のトランザクションで高速に利用することはできなかった。
本発明はこのような問題点に鑑みなされたもので、トランザクションが指示するタイミングで、トランザクション実行中に更新内容を、他から高速に利用可能とすることを目的とする。
上記の目的は、以下のシステムによって達成できる。
すなわち、データベースファイルに書き込むためのトランザクションにおける更新データを保持するローカル保持手段と、前記ローカル保持手段に保持された前記更新データを、前記トランザクションの途中で前記データベースファイルに対するファイルキャッシュ保持手段に書き込む仮想コミット手段と、前記ファイルキャッシュ保持手段に保持されたデータを前記データベースファイルに書き込むコミット手段と、前記トランザクションの途中で、他のトランザクションから前記データベースファイルのデータの出力を要求され、要求された該データが前記更新データで更新されるデータの場合、前記ファイルキャッシュ保持手段に保持された前記更新データを要求されたデータとして出力する出力手段とを有することを特徴とするデータベースシステム。
本発明によれば、トランザクションが指示するタイミングで、トランザクション実行中に更新内容を高速に他のトランザクションへ反映することができる。これにより、更新内容をすぐに他のトランザクションから読み出すことができる。
情報処理装置の一例であるデータベースシステムのハードウェア構成の一例を示した図である。 本実施形態におけるデータベースシステムによる仮想コミット処理動作の一例を示した図である。 本実施形態において仮想コミットを使用するアプリケーションのデータベース操作シーケンスの一例を示した図である。 本実施形態におけるロールバック用のジャーナルファイルの構成の一例を示した図である。 仮想コミットを整合性非保証で使用した時のキャッシュとジャーナルファイルの状態遷移の一例を示した図である。 本実施形態におけるデータベースエンジンの仮想コミット処理手順の一例を示したフローチャートである。 本実施形態におけるデータベースエンジンのコミット処理手順の一例を示したフローチャートである。 本実施形態におけるデータベースエンジンのロールバック処理手順の一例を示したフローチャートである。
以下、本発明の実施形態について図面に基づいて説明する。
〔実施形態1〕
図1は、情報処理装置(コンピュータ)の一例であるデータベースシステムのハードウェア構成の一例を示す図である。図1において、CPU(中央演算装置)101は、データベースシステムのための演算・論理判断等を行い、後述するバス108を介してバス108に接続された後述する各構成要素を制御する。ROM102は、CPU101の処理手順となる制御プログラムや各種データを記憶している。RAM103は、処理中の各種制御のための一時記憶用のワークエリアとして使用される。入力装置104は、ボタン・タッチパネル・マウス等から構成される。表示装置105は、液晶ディスプレイ等で構成される。記憶装置106は、ハードディスク等の各種ディスク機器やフラッシュメモリ等から構成される。CPU101の処理手順となる制御プログラムやデータベースに保持されるデータやロールバック用データ等の各種データが格納される。通信装置107は、USB等の外部入出力機器やモデム等の有線或いは無線通信機器から構成され、外部機器とのデータ交換を行う。バス108は、機器・装置間101〜107で制御プログラムやデータのやり取りを行うものである。
かかる各構成要素からなる本実施形態の情報処理装置は、入力装置等からの各種イベントに応じて作動するものである。入力装置からのインタラプトが供給されると信号がCPUに送られ、それに伴ってイベントが発生する。CPUは、そのイベントに応じてROM又はRAM内に記憶される各種命令(プログラム)を読み出し、その実行によって各種の制御が行なわれる。
図2は、本実施形態におけるデータベースシステムによる仮想コミット処理動作の一例を示す図である。
アプリケーション201、204は、使用するデータベースエンジン202、205を使用する。データベースエンジン202、205は、データの一部をローカル保持部(以下、ローカルメモリと呼ぶ)203、206に保持する。メモリ上(RAM103)にその領域が確保される。
ファイルシステム207は、データベースファイル209の内容の一部をファイルキャッシュ保持部208(以下、ファイルキャッシュ208と呼ぶ)に保持する。このファイルキャッシュ208は、データベースファイル209などのファイルにデータを書き込むバッファデータを保持するファイルバッファとして機能する。ローカルメモリ同様にメモリ上(RAM103)にその領域が確保される。データベースファイル209、ジャーナル保持部210(以下、ジャーナルファイル210と呼ぶ)は、記憶装置106にその領域が確保される。また、本実施形態における、ファイルシステム207は、ファイルキャッシュ208に保持されているデータを、アプリケーション204などの外部に出力することができる。
データベースエンジン202、205は、扱うテーブルのスキーマ情報やレコード、カラムデータへのインデックスデータ等を固定長ブロックに分割して管理する。データベースファイル209に、すべてのブロックが格納されている。データベースエンジンは、アプリケーションの要求に基づいて、データベースファイル209内のブロックの一部をローカルメモリに適宜保持する。
データベースの更新方法は、トランザクションの開始要求、レコード等のデータ更新要求を繰り返し、コミット要求によってその更新内容を記憶装置に書き込んでトランザクションを終了する。データ更新要求時点では、実際に更新するのはローカルメモリ内ののみであり、更新前のブロックイメージをジャーナルファイル210へ格納する。その後、コミットが指示された時点で、データベースファイル209に更新されたブロックを格納する。ロールバックが指示された場合は、ジャーナルファイル210に格納されたブロックイメージを使用して変更前に戻す。
また、データベースエンジンは複数のトランザクションが同時に実行されようとする場合、矛盾無く実行させるために各トランザクションを制御する。そのために、一般的なデータベースエンジンで実施されている以下の方法を用いている。すなわち、共有ロック・排他ロック・更新ロックを用いて制御する。データの読み出しには共有ロックの取得、データのローカルメモリ上の更新には更新ロックの取得、コミットによるファイルへの書き込みには排他ロックの取得を必要とする。共有ロックの取得は、排他ロックが解放されていれば、他のトランザクションが共有・更新ロックいずれを取得していても可能である。更新ロックの取得は、更新ロック・排他ロックがともに解放されていれば可能。排他ロックの取得は、他のトランザクションのロックがすべて解放されていれば可能である。3つのロックにより、複数の読み出しトランザクションと1つの更新トランザクションの同時実行を可能する。標準的なファイルシステムは、ファイルに対し共有ロック・排他ロックの2つのロックをサポートしている。データベースエンジンは、ファイルシステムがサポートしていない更新ロックを、データベースファイルの一部の領域に対する排他ロックによって実現している。ロックが取得できない場合は、データベースエンジンはBUSYであることを示すコードをアプリケーションに返し、リトライするか否かをアプリケーションが判断する。
以上から、データベースの更新において、トランザクション開始時に共有ロック、データ更新時に更新ロック、コミット時に排他ロックの取得をそれぞれ要する。コミットによりトランザクションが終了すると、すべてのロックは解放される。トランザクション実行中に動作する仮想コミットは、更新ロックを取得している状態で終了する。
アプリケーション201は、デバイスの一機能を担当し、その処理の実行段階に応じて処理結果を含むステータスデータを、データベースエンジン201を用いてデータベースに格納している。デバイスの一機能とは、例えばデジタル複合機にデータベースを適用した場合、コピー・印刷・スキャン送信機能等である。その場合、ステータスデータは、処理済枚数,課金情報,エラー情報等のログ情報である。
アプリケーション204は、デバイスのステータス表示機能を担当、アプリケーション201の担当する機能の実行状態をユーザに提示している。アプリケーション204は、アプリケーション201が更新した結果をリアルタイムに表示している。
仮想コミット処理は、アプリケーション201のトランザクションが指示するタイミングで、トランザクション実行中に更新内容を高速に他のトランザクションへ反映する。これにより、アプリケーション204で更新内容をすぐに読み出すことができる。
アプリケーション201は、データベースエンジン202に対し、複数のデータ更新を指示する。データベースエンジン202は、指示された更新内容に基づき、ローカルメモリ203内に保持するブロックの内容を更新する。同時に、データベースエンジン202は、更新前のブロックの内容をジャーナルファイル210に対応するファイルキャッシュ208へ書き込むように、ファイルシステム207に指示する。ステータス表示に必要なデータの更新が終了した段階で、アプリケーション201は、データベースエンジン202に仮想コミットを指示する。
データベースエンジン202は、ファイルシステム207にジャーナルファイル210のファイル同期を指示し、ジャーナルファイル210への更新前ブロックのデータ書き込みを保証する。次に、データベースエンジン202は、ファイルシステム207にローカルメモリ203内にある更新済データをデータベースファイル209に対応するファイルキャッシュ208へ書き込むように指示する。
アプリケーション204は、データベースエンジン205に対し、定期的に更新内容の検索を実行するため、データベースのデータの出力を要求する。データベースエンジン205は、データベースファイル209に保持されるブロックの内容の取得を、ファイルシステム207に要求する。ファイルシステム207は、データ取得要求に対し、既に対象ブロックがファイルキャッシュ208に読み込まれていた場合、ファイルキャッシュ208から出力する。ファイルキャッシュ208に存在しない場合は、通常どおり、データベースファイル209から読み出し可能になるまで待機して出力してもよい。
通常のファイルデータベースであれば、アプリケーションによって更新を実行している間、データベースファイルのデータは確定していないため、取得することができない。本実施形態では、アプリケーション201による仮想コミット指示によってファイルキャッシュ208に更新データを書き込む。そして、書き込まれた更新データは、データベースファイル209に実際は書き込まれていなくても、データベースエンジン205がファイルシステム207から取得することができる。
以上により、アプリケーション201のトランザクションが指示するタイミングで、トランザクション実行中に更新内容を高速に他のトランザクションへ反映する。これにより、アプリケーション204で更新内容をすぐに読み出すことができる。デジタル複合機に適用した場合では、コピーや印刷実行中の処理途中枚数等のステータス情報をリアルタイムにユーザに提示することが可能となる。
また、仮想コミットを指示する際に、ジャーナルファイル210へのファイル同期を行わないように指示することも可能である。この場合は、ロールバック用データのファイル書き込みが保証されていない。つまりデータベースファイル209とジャーナルファイル210との整合性が保証されないため、障害時のリカバリ処理が実行できなくなる。リカバリ時はバックアップされたデータベースファイルからリストアすることが必要となる。
以上のような整合性非保証(ジャーナルファイル210へのファイル同期を行わない)を指示した仮想コミットは、基本的にロールバック用データのファイル書き込みを行わないためさらに高速に処理することが可能である。本実施形態においては、仮想コミット時に整合性保証・非保証を指示することが可能である。
図3は、本実施形態において仮想コミットを使用するアプリケーションのデータベース操作シーケンスの一例を示す図である。
具体的にはアプリケーション201がデータベースエンジン202への更新処理におけるクエリシーケンスである。アプリケーション201による更新トランザクションの全体シーケンス303は、開始要求(begin)で始まり、コミット要求(commit)で終了する。この間、他のアプリが更新トランザクションを開始することはできない。アプリケーション201は、処理のステータス情報を3つのテーブルへの更新処理で行っている。アプリケーション204によるステータス表示を更新するための更新処理301は、テーブル1〜3への3つの更新要求(update)から成る。テーブル1のみを更新した状態では更新内容の整合性が取れていないため、ステータス表示に使用することはできない。3つのテーブルへの更新が終了した段階で、仮想コミット要求(virtual−commit)によって整合性のとれた更新内容をアプリケーション204で使用可能になる。処理の進捗に合わせて実行される次の更新処理302の結果を、再び仮想コミット要求によって他から使用可能とし、ステータス情報が更新されていくことになる。仮想コミット要求は、アプリケーション201によって整合性保証モードが指示される。
アプリケーション201は、数回の仮想コミット要求によってステータスを更新しながら処理を進め、アプリの処理終了後のステータス表示も終了した後、最終的にコミット要求によってデータを確定している。
アプリケーション204は、検索によって更新結果を得るトランザクションを定期的に繰り返すことで、アプリケーション201による任意の更新情報を利用している。
図3で示したシーケンスは、最終的にコミット要求によって確定しているが、アプリケーション201の処理結果によってはロールバック要求によって更新前に戻すことが可能である。その場合、直前の仮想コミット時までの更新内容を確定することも可能である。ロールバックを要する状況が更新処理302の途中に生じた場合、直前の仮想コミット時点、つまり更新処理301の結果を確定させることが可能である。本実施形態では、ロールバック要求時にアプリケーションが選択可能である。
図4は、本実施形態におけるロールバック用のジャーナルファイルの構成の一例を示す図である。
ジャーナルヘッダ401は、ジャーナルファイル210に格納されているロールバック用のブロック総数やデータベースファイル209の整合性非保証フラグが格納される。
ロールバック用データ402は、トランザクション実行中に更新されたデータベースファイル209内のブロックのIDと更新前のブロックイメージが格納される。ロールバック用データ402は、ジャーナルヘッダ401に格納されたブロック総数分だけ連続して格納されている。
図5は、仮想コミットを整合性非保証で使用した時のキャッシュとジャーナルファイルの状態遷移の一例を示す図である。
(状態501)ローカルメモリ及びジャーナルファイル210の初期状態501では、ジャーナルファイル210にデータは格納されていない。
(状態502)次に、更新要求実施によって、ローカルメモリのデータ1がジャーナルファイル210に書き込まれるときに、ローカルメモリのデータ1が書かれていたブロックの内容を5に変更する。変更する更新要求後に整合性非保証の仮想コミット要求が実行された状態502となる。このときの仮想コミット要求実施において、非保証フラグをonにしてジャーナルファイル210のファイル書き込み(データ保証)が実行される。
(状態503)続けて、ローカルメモリのデータ3がジャーナルファイル210に書き込まれるときに、ローカルメモリのデータ3が書かれていたブロックの内容を6に変更する。変更する更新要求後に整合性非保証の仮想コミット要求が実行された状態503となる。既に整合性非保証フラグはジャーナルファイル210に書き込まれているので、フラグを書き直してジャーナルファイル210へ書き込む(データ保証)必要はない。この状態での整合性非保証の仮想コミットは、ファイルアクセスをまったく必要としないため、より高速に処理することが可能である。更新要求実施において、ジャーナルファイル210のファイルキャッシュ208に、更新されたブロックの更新前イメージである3が書き込まれているのみである。図5のジャーナルファイル210内における破線で示されたブロックは、ファイルキャッシュ208までの書き込みは済んでいるが、データベースファイル209までの書き込みが済んでいる保証ができないものを示している。
(状態504)更に続けて、ローカルメモリのデータ4がジャーナルファイル210に書き込まれるときに、ローカルメモリのデータ4が書かれていたブロックの内容を7に変更する。変更する更新要求後に整合性保証の仮想コミット要求が実行された状態504となる。整合性非保証から整合性保証に切り替わるため、ジャーナルファイル210はロールバックに必要な内容1、3、4が書き込まれている(データ保証)。また、非保証フラグはoffに戻されている。
以下、上述のデータベース更新手段をフローチャートに従って説明する。
(仮想コミット処理)図6は、本実施形態におけるデータベースエンジンの仮想コミット処理手順の一例を示したフローチャートである。仮想コミットの処理手順について図6を用いて説明する。
ステップS601において、CPU101は、仮想コミット要求時に指示された整合性保証モードを確認する。整合性保証が指示された場合、ステップS602へ進む。一方、整合性保証が指示されなかった場合、ステップS605へ進む。
ステップS602において、ステップS601で整合性保証が指示された場合、ジャーナルファイルヘッダに存在する整合性非保証フラグを確認する。ステップS602での非保証フラグがonであった場合、ステップS603へ進む。一方、非保証フラグがoffであった場合、フラグの変更処理は不要で、そのままステップS604へ進む。
ステップS603において、ステップS602で非保証フラグがonであった場合、非保証フラグをoffに変更してファイルキャッシュ208に書き込んでから、ステップS604へ進む。
ステップS604において、ジャーナルファイル210のファイル同期処理が行われ、ロールバック用データのファイル書き込みが保証される。
ステップS605において、ステップS601で整合性非保証が指示された場合も、ジャーナルファイルヘッダに存在する整合性非保証フラグを確認する。非保証フラグがoffであった場合は、ステップS606へ進む。非保証フラグがonであった場合は、ステップS607へ進む。
ステップS606において、非保証フラグをonに変更してファイルキャッシュ208に書き込んでから、ステップS604へ進む。ステップS604では、ジャーナルファイル210のファイル同期処理が行われ、非保証フラグのファイル書き込みが保証される。ステップS604のジャーナルファイル210の同期処理終了後、ステップS607へ進む。
ステップS607において、CPU101は、取得済であるデータベースファイル209の更新ロックを解放し、排他ロックを取得する。ファイルキャッシュ208への書き込み途中状態を、他のトランザクションに読み込まれないようにするためである。排他ロックが取得できない場合、ステップS610へ進む。排他ロックが取得できた場合、ステップS608へ進む。
ステップS608において、ステップS607で排他ロックが取得できた場合、ローカルメモリ203内の更新済ブロックをファイルキャッシュ208へ書き込む。書き込みが終了したら、ステップS609へ進む。
ステップS609において、ステップS607で取得した排他ロックを解放してから更新ロックを取得後、リターンする。トランザクションは実行中であり、更新ロックを取得している状態でリターンする。
ステップS610において、ステップS607で排他ロックが取得できなかった場合、リターンコードをBUSYに変更し、リターンする。
(コミット処理)図7は、データベースエンジンのコミット処理の詳細を示したフローチャートである。データベースエンジンのコミット処理を図7を用いて説明する。なお、コミット処理を実行している間、仮想コミットされたファイルキャッシュ208からのデータ読み出し実行を開放する。
ステップS701において、CPU101は、ジャーナルファイル210のファイル同期処理を行い、ロールバック用データのファイル書き込みが保証される。これにより、整合性保証が可能となる。
ステップS702において、ジャーナルファイルヘッダに存在する整合性非保証フラグを確認する。整合性非保証フラグがonであることを確認された場合、ステップS703へ進む。整合性非保証フラグが、offであることを確認された場合、ステップS705へ進む。
ステップS703において、ステップS702で整合性非保証フラグがonであることを確認された場合、整合性非保証フラグをonからoffに変更してファイルキャッシュ208へ書き込み、ステップS704へ進む。
ステップS704において、再びジャーナルファイル210のファイル同期処理を行って、非保証フラグoffのファイル書き込みを保証する。整合性非保証フラグoffのファイル書き込みが終了後、ステップS705へ進む。
ステップS705において、CPU101は、取得済であるデータベースファイル209の更新ロックを解放し、排他ロックを取得する。排他ロックを取得できない場合、ステップS710へ進む。排他ロックを取得できた場合、ステップS706へ進む。
ステップS706において、ステップS705で排他ロックを取得できた場合、ローカルメモリ203内の更新済ブロックをファイルキャッシュ208へ書き込む。ファイルキャッシュ208への書き込みが終了して、ステップS707へ進む。
ステップS707において、データベースファイル209のファイル同期処理を行う。これにより、全更新済データのファイル書き込みが保証される。ファイル同期処理後、ステップS708へ進む。
ステップS708において、不要となったジャーナルファイル210内のロールバックデータを削除し、ステップS709へ進む。
ステップS709において、CPU101は、取得した排他ロックを解放してからリターンする。トランザクションを終了した状態でリターンする。
ステップS710において、ステップS705で排他ロックを取得できなかった場合、リターンコードをBUSYに変更し、リターンする。
(ロールバック処理)図8は、データベースエンジンのロールバック処理の詳細を示したフローチャートである。データベースエンジンのロールバック処理を図8を用いて説明する。ここでの、ロールバック処理は、仮想コミット実行後にロールバックを行う場合、直前の仮想コミット時点までを確定することが可能である。ロールバック処理自体を実行している時の障害から、リカバリ可能となるようにジャーナルデータを確定する。
ステップS801において、CPU101は、ジャーナルファイル210のファイル同期処理を行い、ロールバック用データのファイル書き込みが保証される。これにより、整合性保証が可能となる。
ステップS802において、ジャーナルファイルヘッダに存在する整合性非保証フラグを確認する。整合性非保証フラグがonである場合、ステップS803へ進む。整合性非保証フラグがoffである場合、ステップS805へ進む。
ステップS803において、ステップS802で整合性非保証フラグがonであった場合、整合性非保証フラグをonからoffに変更してファイルキャッシュ208へ書き込み、ステップS804へ進む。
ステップS804において、再びジャーナルファイル210のファイル同期処理を行って、非保証フラグoffのファイル書き込みを保証する。整合性非保証フラグoffのファイル書き込みが終了後、ステップS805へ進む。
ステップS805において、CPU101は、取得済であるデータベースファイル209の更新ロックを解放し、排他ロックを取得する。排他ロックを取得できない場合、ステップS812へ進む。排他ロックを取得できた場合、ステップS806へ進む。
ステップS806において、排他ロックを取得できた場合、CPU101は、ロールバック要求時に指示された直前の仮想コミット時の更新内容を確定するか否かを確認する。直前の仮想コミット時点までを確定することが確認された場合、ステップS813へ進む。一方、直前の仮想コミット時点の更新内容を確定しないことが確認された場合、ステップS807へ進む。更新内容を確定しない場合、トランザクション開始時に戻すため、ジャーナルファイル210を用いて仮想コミットで書き込まれたデータをもとに戻していく。
ステップS807において、ジャーナルファイル210内のロールバックデータをローカルメモリへ更新済ブロックとして読み出し、ステップS808へ進む。
ステップS808において、ローカルメモリ内の更新済ブロック、つまり読み出されたロールバックデータをファイルキャッシュ208へ上書きし、ステップS809へ進む。
ステップS809において、データベースファイル209のファイル同期処理を行う。これにより、ロールバックデータのファイル書き込みを保証する。すなわち、仮想コミット処理によってファイルキャッシュ208まで書き込まれていた更新データを、データベースファイル209上でもとに戻したことを保証する。
ステップS810において、不要となったジャーナルファイル210内のロールバックデータを削除し、ステップS811へ進む。
ステップS811において、CPU101は、取得した排他ロックを解放してからリターンする。
ステップS812において、S805で排他ロックを取得できない場合、リターンコードをBUSYに変更してリターンする。
ステップS813において、S806で直前の仮想コミット時点までを確定することが確認された場合、データベースファイル209のファイル同期処理を行う。これにより、仮想コミット処理によってファイルキャッシュ208まで書き込まれている更新データのデータベースファイル209へのファイル書き込みを保証する。ファイル同期処理終了後、ステップS814へ進む。
ステップS814において、不要となったジャーナルファイル210内のロールバックデータを削除し、ステップS815へ進む。
ステップS815において、更新途中のデータが存在するローカルメモリをクリアする。そして、ステップS811に進み、CPU101は、取得した排他ロックを解放してからリターンする。
〔変形例〕
実施形態1では、システム共通のファイルシステムおよびそのファイルキャッシュ208を用いているが、データベースファイル209専用のファイルキャッシュ208を管理するサービスを介在させてもよい。これにより、システム全体のファイル操作の影響を受けにくくなる。
また、ロールバック時の選択は直前の仮想コミット後に戻す指示のみを可能にしている。一方、ジャーナルファイル210に仮想コミット後の更新処理に対し、同トランザクション内で再び更新されたブロックの更新前イメージも格納するようにしてもよい。これにより、ロールバック時に任意の仮想コミット時の状態に戻すことが可能になる。
また、整合性非保証フラグをジャーナルファイル210に保持していたが、データベースファイル209あるいは独立の別ファイルに保持するようにしてもよい。
〔その他の実施形態〕
また、上述した実施形態の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は上述した実施形態を構成することになる。
更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書き込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
上述した実施形態を前記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
以上、上述した各実施形態によれば、トランザクションが指示するタイミングで、トランザクション実行中に更新内容を高速に他のトランザクションへ反映することができる。これにより、更新内容をすぐに他のトランザクションから読み出すことができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

Claims (5)

  1. データベースファイルに書き込むためのトランザクションにおける更新データを保持するローカル保持手段と、
    前記ローカル保持手段に保持された前記更新データを、前記トランザクションの途中で前記データベースファイルに対するファイルキャッシュ保持手段に書き込む仮想コミット手段と、
    前記ファイルキャッシュ保持手段に保持されたデータを前記データベースファイルに書き込むコミット手段と、
    前記トランザクションの途中で、他のトランザクションから前記データベースファイルのデータの出力を要求され、要求された該データが前記更新データで更新されるデータの場合、前記ファイルキャッシュ保持手段に保持された前記更新データを要求されたデータとして出力する出力手段と
    を有することを特徴とするデータベースシステム。
  2. 前記仮想コミット手段が行う仮想コミットを、ジャーナル保持手段に更新前のデータを保持してロールバック可能にする整合性保証モード、または、整合性非保証モードで行うことを特徴とする請求項1に記載のデータベースシステム。
  3. 前記仮想コミット手段では、整合性保証モードで前記ジャーナル保持手段に更新前のデータの保持をしたことを示す整合性保証フラグ、または、整合性非保証モードを示す整合性非保証フラグ、を前記ジャーナル保持手段に格納することを特徴とする請求項2に記載のデータベースシステム。
  4. データベースシステムが実行する情報処理方法であって、
    前記データベースシステムが有する仮想コミット手段が、ローカル保持手段に保持された当該データベースファイルに書き込むためのトランザクションにおける更新データを、前記トランザクションの途中で当該データベースファイルに対するファイルキャッシュ保持手段に書き込む仮想コミット工程と、
    前記データベースシステムが有するコミット手段が、前記ファイルキャッシュ保持手段に保持された前記更新データを前記データベースファイルに書き込むコミット工程と、
    前記データベースシステムが有する出力手段が、前記トランザクションの途中で、他のトランザクションから前記データベースファイルのデータの出力を要求され、要求された該データが前記更新データで更新されるデータの場合、前記ファイルキャッシュ保持手段に保持された前記更新データを要求されたデータとして出力する出力工程と
    を有することを特徴とする情報処理方法。
  5. 請求項4に記載の情報処理方法の各工程の処理をコンピュータに実行させることを特徴とするプログラム。
JP2010278564A 2010-12-14 2010-12-14 データベースシステム、その情報処理方法、およびそのプログラム Expired - Fee Related JP5665518B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010278564A JP5665518B2 (ja) 2010-12-14 2010-12-14 データベースシステム、その情報処理方法、およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010278564A JP5665518B2 (ja) 2010-12-14 2010-12-14 データベースシステム、その情報処理方法、およびそのプログラム

Publications (3)

Publication Number Publication Date
JP2012128596A JP2012128596A (ja) 2012-07-05
JP2012128596A5 JP2012128596A5 (ja) 2014-02-06
JP5665518B2 true JP5665518B2 (ja) 2015-02-04

Family

ID=46645557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010278564A Expired - Fee Related JP5665518B2 (ja) 2010-12-14 2010-12-14 データベースシステム、その情報処理方法、およびそのプログラム

Country Status (1)

Country Link
JP (1) JP5665518B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3136245B1 (en) * 2014-04-23 2019-07-03 Hitachi, Ltd. Computer
CN116257531B (zh) * 2023-05-16 2023-08-04 广州图灵科技有限公司 一种数据库空间回收方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6022A (en) * 1849-01-09 Cast-iron oak-wheel
US4013A (en) * 1845-04-26 Machine fqe making match-splihts and arranging them in dipping
JPH0512087A (ja) * 1991-07-03 1993-01-22 Nec Corp 更新前ジヤーナルの出力方式
JP4393762B2 (ja) * 2002-12-19 2010-01-06 株式会社日立製作所 データベース処理方法及び装置並びにその処理プログラム
JP4248510B2 (ja) * 2005-03-24 2009-04-02 株式会社東芝 計算機システム、ディスク装置およびデータ更新制御方法

Also Published As

Publication number Publication date
JP2012128596A (ja) 2012-07-05

Similar Documents

Publication Publication Date Title
US9940067B2 (en) Performing a data write on a storage device
JP4800056B2 (ja) ストレージシステム及びその制御方法
US7472139B2 (en) Database recovery method applying update journal and database log
US8001165B2 (en) Storage system format for transaction safe file system
US7111137B2 (en) Data storage systems and processes, such as one-way data mirror using write mirroring
US7844643B2 (en) Storage management system with integrated continuous data protection and remote copy
US20040103104A1 (en) Snapshot creating method and apparatus
JP2007207063A (ja) データベースを有するストレージシステムの記憶制御方法
JP2006268139A (ja) データ複製装置、方法及びプログラム並びに記憶システム
KR100981064B1 (ko) 저널링 파일 시스템을 이용한 소프트웨어 레이드에서의 일관성 유지방법
JP5665518B2 (ja) データベースシステム、その情報処理方法、およびそのプログラム
JPH11120057A (ja) ファイルバックアップ方法
US8131958B2 (en) Storage system, storage device, and data updating method using a journal volume
JP2003162438A (ja) データベース管理システム
JP2002318717A (ja) データベースシステム
US20220164335A1 (en) Cloud-native object storage for page-based relational database
US20050149548A1 (en) One-way data mirror using copy-on-write
US20050149554A1 (en) One-way data mirror using write logging
JP2007034551A (ja) データの二重化管理方法
EP3293635B1 (en) Electronic device and method of controlling the same
JP2002108673A (ja) 共有ファイルシステム及び同システムに適用されるメタデータサーバコンピュータ
JP7225852B2 (ja) ストレージ制御装置、ストレージシステムおよびバックアップ制御プログラム
JP2013178686A (ja) 記憶領域制御装置、及びそのデータ複製方法、記憶領域制御システム並びにコンピュータ・プログラム
JP2013092836A (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141209

R151 Written notification of patent or utility model registration

Ref document number: 5665518

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees