WO2016181640A1

WO2016181640A1 - 計算装置、方法、及び、プログラム

Info

Publication number: WO2016181640A1
Application number: PCT/JP2016/002262
Authority: WO
Inventors: 真樹菅; 鈴木　順; 佑樹林
Original assignee: 日本電気株式会社
Priority date: 2015-05-11
Filing date: 2016-05-09
Publication date: 2016-11-17

Abstract

不揮発性メモリデバイスの寿命延長を実現しつつ、当該デバイスを用いたストレージシステムの性能低下を抑制する計算装置は、識別子によるランダムアクセスをされるデータ項目を複数格納する通常記憶手段に格納されているデータ項目の更新ログを格納するログ記憶手段から、更新されたデータ項目の識別子と更新データを抽出して集め、新記憶手段にシーケンシャルに書き込む、ログ変換手段と、指定された識別子のデータ項目を、新記憶手段に格納されていれば新記憶手段から、格納されていなければ通常記憶手段から取得する読み込み手段と、を備える。

Description

計算装置、方法、及び、プログラム

　本発明は、不揮発性メモリデバイスを活用したデータストアシステムにおいて、不揮発性メモリデバイスの寿命を延長する計算装置、方法、及び、プログラムに関する。

　記憶装置及び記憶システムに対するデータアクセスの制御に関するさまざまな技術が知られている。

　例えば、単一あるいは複数の計算機によって構成されるデータストアシステム、例えば、データベースシステムやファイルシステム、キャッシュシステム、がある。分散ストレージシステムが、そのようなシステムに、しばしば適用されている。その分散ストレージシステムは、ネットワークを介して接続された複数の汎用的な計算機を含む。

　その分散ストレージシステムは、それらの計算機に搭載された記憶装置を用いて、データの格納及びデータの提供を行う。記憶装置は、例えば、ＨＤＤ（Hard disk drive）、不揮発性メモリ、または、ＤＲＡＭ（Dynamic random access memory）である。

　クラスタベースの分散ストレージシステムや分散データベースシステムの技術は、伝統的なサーバアーキテクチャを前提に発展してきている。このサーバアーキテクチャに基づく分散データベースシステムにおいては、各サーバは、他のサーバのリソースにアクセスするには、該当するサーバを経由しなければならない。一方、リソース分離型アーキテクチャに基づくシステムでは、ＣＰＵ（Central Processing Unit）と各リソース、例えば、メモリや、ストレージは、インターコネクトネットワークを経由して直接接続されている。そのため、各ＣＰＵから各リソースを物理的に共有することが可能であり、ＣＰＵはリソースを他のサーバを経由せずアクセスすることができる。このようなサーバアーキテクチャの変化は、分散ストレージシステムや分散データベースシステムの技術にも変化を与える。

　フラッシュメモリに代表される不揮発性メモリは、その物理的特性から記憶素子への書き込み回数に制限がある。また、不揮発性メモリは、一般的に、削除のサイズや書き込みサイズにも制約を有する。例えば、２５６キロバイトのブロック単位でしか削除処理できない不揮発メモリにおいて４キロバイトのデータを書き換える場合、サーバはその４キロバイトの領域を含む２５６キロバイトを一旦削除してから、再度書き直す。

　単純に更新処理を実行すると、サーバは、実際に書き換える４キロバイトの他にフラッシュメモリデバイスに対して２５６キロバイトのデータを書き込むことになる。このような書き込み量の増加は、書き込み回数の増加を招き、不揮発性メモリの寿命を低下させる。このような書き込み量の増加分は、一般的に、ライト・アンプリケーションと呼ばれる。

　このような書き込み量の増大を抑制するために、不揮発性メモリデバイスのコントローラや、不揮発性メモリデバイスを利用するストレージソフトウェアは、様々に工夫されたアクセス機能を備えている。

　例えば、特許文献１は、事前消去済みで実容量として見えない書き込み用領域を備えたオーバー・プロビジョニングと呼ばれる技術を開示している。

　また、特許文献２は、ソフトウェア側とフラッシュメモリデバイス側の連携技術を開示している。この技術は、データの削除要求が有った時に、ファイルシステムなどのソフトウェアで管理上の削除をするだけで、実際の削除は削除用のコマンドを別途発行した時にフラッシュメモリデバイス側の実際の削除を行う。この技術は、このようにソフトウェアとフラッシュメモリデバイスを連携させることでデバイスの寿命を延ばす。

　ファイルシステムや、データベースシステムは、ランダムアクセス性能の低いフラッシュメモリデバイスに対し、書き込みが必要な処理の高速化を図るために、ログ形式で書き込みを行う。このような方式は、古く無効になったデータ領域を回収するガベージコレクションと呼ばれる処理や、データベースシステムソフトウェアから見たときに参照しやすい順序で格納するための変換処理を必要とする。

　また、フラッシュメモリデバイスへの書き込みは、ランダム書き込みで指定された論理アドレスが物理アドレスに変換されて、物理的にはシーケンシャルに行われる。この変換は、ＦＴＬ（Flash Transaction Layer）と呼ばれるレイヤで行われる。ただし、フラッシュメモリデバイス側のコントローラの計算能力、メモリ量は限られているため、ソフトウェアから何も顧慮せずにランダム書き込みが行われると、ガベージコレクションの処理コストが問題になる。通常性能に影響を及ぼすリスクが高いのである。

国際公開第２０１３／０４６４６４号特開２０１４－２３２５４３号公報

　上述したように、データストアシステムは、ジャーナルログのようなシーケンシャルに書き込まれたデータを通常のファイル格納形式に変換するとき、記憶デバイスに対してランダム書き込みを行う。そのため、記憶デバイスは、様々な領域のデータ更新を行ってしまい、上述のライト・アンプリケーションを発生する。その結果、記憶デバイスの寿命が短くなってしまう。

　ランダム書き込みに対して、記憶デバイスのコントローラが、寿命延長のための制御を行った場合、コントローラの負荷を増大させ性能劣化を招く。

　本発明は、上述の問題点を低減させるための計算装置、方法、及び、プログラムを提供することを目的とする。

　本発明の１実施の形態の計算装置は、識別子によるランダムアクセスをされるデータ項目を複数格納する通常記憶手段に格納されているデータ項目の更新ログを格納するログ記憶手段から、更新されたデータ項目の識別子と更新データを抽出して集め、新記憶手段にシーケンシャルに書き込む、ログ変換手段と、指定された識別子のデータ項目を、前記新記憶手段に格納されていれば前記新記憶手段から、格納されていなければ前記通常記憶手段から取得する読み込み手段と、を備える。

　本発明の１実施の形態の方法は、識別子によるランダムアクセスをされるデータ項目を複数格納する通常記憶手段に格納されているデータ項目の更新ログを格納するログ記憶手段から、更新されたデータ項目の識別子と更新データを抽出して集め、新記憶手段にシーケンシャルに書き込み、指定された識別子のデータ項目を、前記新記憶手段に格納されていれば前記新記憶手段から、格納されていなければ前記通常記憶手段から取得する。

　本発明にかかる計算装置は、不揮発性メモリデバイスの寿命延長を実現しつつ、当該デバイスを用いたストレージシステムの性能低下を抑制する。

図１は、本発明の第１の実施の形態におけるデータストアシステム９０の構成を示す。図２は、計算装置１０および外部記憶装置２０の内部構成を示す。図３は、計算装置１０のハードウェア構成を示す装置である。図４は、ログ管理情報記録部１４の構成図である。図５は、データストアシステム９０の読み込み処理のフローチャートである。図６Ａは、ログ読み込み部１５の処理フローチャート（その１）である。図６Ｂは、ログ読み込み部１５の処理フローチャート（その２）である。図７は、記憶部読み込み部１６の処理フローチャートである。図８は、データストアシステム９０の書き込み処理のフローチャートである。図９は、ログ変換部１７の処理フローチャートである。ロ図１０は、ログ記憶部２１に対する読み込み集約の概要を示す図である。図１１は、ログ読み込み部１５によるログ読み込み命令の発行要否判断を説明する図である。図１２は、本実施の形態における外部記憶装置２０の構成を示す図である。図３は、第２の実施の形態にかかる計算装置１０の構成図である。

　＜第１の実施の形態＞
［構成］
図１は、本発明の第１の実施の形態におけるデータストアシステム９０の構成を示す。データストアシステム９０は、例えば、データベースシステム、ＫＶＳ(Key Value Store)、ファイルシステムである。データストアシステム９０は、Ｘ個の計算装置１０（計算装置１０-１から計算装置１０-Ｘまで）と、Ｙ個の外部記憶装置２０（外部記憶装置２０－１から外部記憶装置２０-Ｙまで）と、図示されないＺ個のその他リソースと、それらを結合するインターコネクトネットワーク３０を包含する。ここで、Ｘ及びＹは１以上、Ｚは０以上の数である。リース分離型アーキテクチャを採用するデータストアシステム９０は、計算装置１０、外部記憶装置２０、および、必要に応じてそれ以外のリソースを組み合わせて、単一あるいは複数の計算機サーバを構築する。

　図２は、計算装置１０および外部記憶装置２０の内部構成を示す。図面を簡単にするため、本図は、計算装置１０および外部記憶装置２０を各々１台だけ包含するデータストアシステム９０を例示している。データストアシステム９０が、複数の計算装置１０および複数の外部記憶装置２０を包含する場合も、それらの内部構成は図２に示す通りであって良い。

　計算装置１０は、要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ管理情報記録部１４、ログ読み込み部１５、記憶部読み込み部１６、および、ログ変換部１７を備える。外部記憶装置２０は、ログ記憶部２１、新記憶部２２、および、通常記憶部２３を備える。これらの各部が連携して動作することで、データストアシステム９０は、ユーザに対してデータアクセス機能を提供することが出来る。なお、例えば、ログ読み込み部１５、記憶部読み込み部１６は、まとめて、読み込み部１８として実装されても良い。

　要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ読み込み部１５、記憶部読み込み部１６、および、ログ変換部１７は、それぞれ論理回路で構成される。

　要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ読み込み部１５、記憶部読み込み部１６、および、ログ変換部１７は、プログラムで実現されても良い。当該プログラムは、例えば、計算装置１０、計算装置１０とインターコネクトネットワーク３０と外部記憶装置２０から構成される計算機サーバ、あるいは、インターコネクトネットワーク３０に接続される他のコンピュータ上で実行される。

　ログ管理情報記録部１４は、例えば、計算装置１０が備える半導体記憶装置、ディスク装置である。ログ管理情報記録部１４は、インターコネクトネットワーク３０あるいはその他のネットワークに接続された、計算装置１０あるいは他のハードウェアによって実現されてもよい。

　以降、要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ管理情報記録部１４、ログ読み込み部１５、記憶部読み込み部１６、および、ログ変換部１７は、同一の計算装置１０で動作することを前提とする。

　要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ管理情報記録部１４、ログ読み込み部１５、記憶部読み込み部１６、ログ変換部１７は、計算装置１０ごとに複数動作しても良い。以降、特に断りが無ければ、計算装置１０ごとに要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ管理情報記録部１４、ログ読み込み部１５、記憶部読み込み部１６が1つずつ動作することを前提とする。

　また、ログ変換部１７は、外部記憶装置２０のうちのログ記憶部２１ごとに計算装置１０上で1つ動作するものとする。

　要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ読み込み部１５、記憶部読み込み部１６、および、ログ変換部１７が、計算装置１０上で実行されるプログラムで実現される場合、計算装置１０は、例えば、図３に示すハードウェア構成を有する装置である。

　計算装置１０は、例えば、ＣＰＵ８１、主記憶装置８２、および、ネットワークインタフェース８３を備える。ＣＰＵ８１は、中央処理装置と呼ばれる演算装置であり、一般的にはプロセッサによって実現される。主記憶装置８２は、例えば、ＤＲＡＭで実装される記憶装置である。ネットワークインタフェース８３はインターコネクトネットワーク３０へのインタフェースである。

　計算装置１０は、図示されていない部位、例えば、他の記憶装置や、インターコネクトネットワーク３０以外のネットワークに対するインタフェースのデバイスを備えても良い。さらに、計算装置１０は、レジスタのような高速な記憶回路、ＣＰＵキャッシュ、あるいは、計算装置１０内に閉じたネットワークを別途保持し、その中にＨＤＤやフラッシュメモリなどの記憶装置を備えても良い。

　外部記憶装置２０は、例えば、計算装置１０と結合するためのインターコネクトネットワーク３０へのインタフェースと、記憶装置と、記憶装置へのアクセス部、電力制御部を備える装置である。記憶装置は、例えば、フラッシュメモリメモリ、ＤＲＡＭ、ＭＲＡＭ（Magneto resistive Random Access Memory）、ＨＤＤである。

　ログ記憶部２１、新記憶部２２、および、通常記憶部２３は、外部記憶装置２０が備える記憶装置である。

　インターコネクトネットワーク３０は、計算装置１０、外部記憶装置２０間で、例えば、データ、制御メッセージ、および、その他のメッセージをやりとりする為の通信網である。インターコネクトネットワーク３０は、例えば、光ケーブルとスイッチによって実現される。また、インターコネクトネットワーク３０は、PCI Express（登録商標）規格のケーブルで実現されても良い。

　また、計算装置１０は、従来のアーキテクチャによる計算機（以降、単に計算機）であっても良い。このとき、インターコネクトネットワーク３０は、例えば、イーサネット（登録商標）やPCI Expressネットワークなどよって実現される。ExpEther（登録商標）技術が、計算機のインターコネクトネットワークであるPCI Express規格を拡張できる。このため、計算機にExpEther機能を備えたインタフェースを保持させることで、計算機を用いてリソース分離型アーキテクチャに類似したアーキテクチャを実現できる。

　このとき、外部記憶装置２０は、ExpEther機能を備えるカード、PCI Express規格のデバイスを備える。PCI Express規格のデバイスは、何らかの記憶装置を持つのであれば、如何なる手段で実現されても良い。外部記憶装置２０は、例えば、PCI Express規格のフラッシュメモリ、ＲＡＩＤ(Redundant Arrays of Independent Disks)カードを経由して接続された複数のＨＤＤやＳＳＤ(Slid State Drive)で良い。さらに、外部記憶装置２０は、ＧＰＧＰＵ(Graphical-Purpose computing on graphics processing units )機能と記憶装置を備えるカード、Intel Xeon PhiのようなＭＩＣ(Many Integrated Core)アーキテクチャに基づく演算ボードでも良い。

　また、分離されるリソースが従来のストレージシステムに限定されれば、インターコネクトネットワーク３０はファイバチャネルやＦＣｏＥ(Fiber Channel over Ethernet（登録商標）)で実現されても良い。計算装置１０は、計算機にホストバスアダプタ、あるいは、イーサネットカードを備え、外部記憶装置２０はこれらのネットワークへのインタフェースを備えるストレージ装置またはストレージシステムである。このようなアーキテクチャのデータストアシステム９０は、計算装置１０間のネットワークは別に備えることが多い。例えば、計算機間がイーサネットで接続され、計算機とストレージ間はファイバチャネルで接続される。

　また、電力は、計算装置１０、外部記憶装置２０のそれぞれが備える電源から供給されても良いし複数の計算装置１０、外部記憶装置２０に対して電源を別に用意してケーブルを介して供給されてもよい。

　｛各部の概要｝
　以降の説明は、要求受付部１１、要求処理部１２、ログ書き込み部１３、ログ読み込み部１５、記憶部読み込み部１６、および、ログ変換部１７が、計算装置１０上で実行されるプログラムで実現される場合についてのものである。各部が、論理回路で実現される場合も、基本的に動作は同じである。

　要求受付部１１は、例えば、計算装置１０で動作するアプリケーションプログラムから外部記憶装置２０に格納されているデータに対するアクセスリクエストを受け付けるモジュールである。要求受付部１１は、独立したプロセスとして動作することもあれば、ライブラリとしてアプリケーションプログラムに組み込まれることによって動作することもある。要求受付部１１は、アクセスリクエストを受け付け、解釈して要求処理部１２に渡す。

　アクセスリクエストの種類はデータストアシステム９０によって異なるが、例えば、ファイルシステムならＲＥＡＤ/ＷＲＩＴＥ、ＫＶＳシステムならＰＵＴ/ＧＥＴ、データベースシステムならＳＱＬ（Structured Query Language）命令である。

　以降、ＫＶＳシステムを例に説明する。ＫＶＳシステムは、識別子（キー）に対して値（バリュー）を取得したり、書き込みしたりするデータストアシステムである。ＫＶＳシステムのＰＵＴ/ＧＥＴのアクセスリクエストは、書き込みたい、または、取得したい値の識別子を含む。ＫＶＳシステムは、識別子に対応した値を記憶媒体の特定のアドレス領域に格納する仕組みを持つことで、アクセス処理を行う。ＫＶＳシステムは、そのアドレス領域を何らかの方法で算出する仕組みを備えている。例えば、計算装置１０が主記憶装置８２に識別子とアドレスのマップ情報を持ち、ハッシュ値によって機械的に物理アドレスを算出する。また、外部記憶装置２０だけでなく計算装置１０の主記憶装置８２に値を格納するＫＶＳシステムもあるが、以降の説明は、主記憶装置８２に値を格納しないＫＶＳシステムについてのものである。

　要求処理部１２は、要求受付部１１が受け取ったアクセスリクエストを実際に該当デバイスの必要領域に対してアクセスするモジュールである。前述した通り、ＫＶＳシステムは、アクセスリクエストで指定される識別子に基づいて、アクセスすべき外部記憶装置２０の特定と、外部記憶装置２０内のアドレスを算出する仕組みを持つ。要求処理部１２がその仕組みを備える。

　要求処理部１２は、識別子に対する値が複数の外部記憶装置２０の何れに格納されているかを、コンシステント・ハッシングの手法で決定する。なお、ログ書き込み部１３、ログ読み込み部１５、記憶部読み込み部１６が、同様の方法で外部記憶装置２０を決定してもよい。識別子に対する値は、外部記憶装置２０内部のログ記憶部２１、新記憶部２２、通常記憶部２３のいずれか、または、複数に格納される。

　識別子に対する値がログ記憶部２１内のどのアドレスに格納されているかを決定する為の情報は、ログ管理情報記録部１４が保持する。なお、記憶部読み込み部１６が、新記憶部２２および通常記憶部２３内の物理アドレスの算出を行う。

　要求処理部１２は概略次のように動作する。更新系（ＰＵＴ等）の処理では、要求処理部１２は、ログ書き込み部１３にアクセスリクエストの情報を渡し、ログ記憶部２１への書き込みを依頼する。更新系処理において、ログ書き込みの前に該当の値を読みこむ必要がある場合、要求処理部１２は事前に参照処理を行う。このようなシステムにおいては、値のバージョン情報を読み込んだり、比較書き込みのような現在の値と比較してから処理したりするコマンドが提供される。

　参照系（ＧＥＴ等）の処理では、要求処理部１２は、ログ読み込み部１５、および、記憶部読み込み部１６に対してリクエストに指定された識別子の値の読み込みを依頼する。要求処理部１２は、これらの要求を同時に行っても良いし、ログ読み込み部１５に依頼して該当識別子の値が見つからない時に、記憶部読み込み部１６に依頼しても良い。
　ログ書き込み部１３は、要求処理部１２により指定された識別子と値、またその他のメタ情報をログ記憶部２１に書き込む。ここで、その他のメタ情報は、システムによって異なるが、例えば、バージョン情報や、時刻である。ログ記憶部２１は、開始アドレスから連続した領域を利用するため、基本的には常にデータが書かれている末尾のアドレスに新しいログ情報を書き込む。要求処理部１２は、末尾のアドレスをログ管理情報記録部１４から取得する。

　ログ書き込み部１３は、更に、ログ管理情報記録部１４に該当識別子とログ記憶部２１内の物理アドレスの関係情報を記録する。これらの処理完了後、ログ書き込み部１３は要求処理部１２に完了通知を送り、それを受けた要求処理部１２が、要求受付部１１に該アクセスリクエスト処理の完了を通知する。なお、システムの動作ポリシーによっては、要求処理部１２は、ログ書き込み部１３に依頼した後に、要求受付部１１に完了通知を送っても良い。また、ログ書き込み部１３は、外部記憶装置２０が保持する比較書き込み命令を用いて書き込み命令を行う。この比較書き込み命令は、ＣＡＷ（Compare and Write）命令、または、ＣＡＳ（Compare and Swap）命令と呼ばれる。その際、ログ書き込み部１３は、比較元のデータはブランク状態とする。つまり、ログ書き込み部１３は、ブランクであったら書き込みを行う、という命令を発行する。このような命令を発行する理由は、他の計算装置１０によってログが追記される可能性があるためである。

　ログ管理情報記録部１４は、識別子と該識別子に対応する値が格納されているログ記憶部２１のアドレス（ポインタなどでもよい）情報と、ログ記憶部２１の末尾アドレス情報を保持する。

　図４は、ログ管理情報記録部１４の構成図である。ログ管理情報記録部１４は、末尾アドレス管理部４１、および、ログ記憶部アドレス管理部４２を包含する。末尾アドレス管理部４１は、計算装置１０が知るログ書き込み部１３が書き込むべきログの末尾のアドレスを保持すし、ログ読み込み部１５によって更新される。データストアシステム９０が、図１に示したように複数の計算装置１０を包含する場合、他の計算装置１０が更新ログを追記する可能性がある。そのため、ログ書き込み部１３だけではログの最新の末尾アドレスを特定できず、ログ読み込み部１５が末尾アドレス管理部４１の情報を更新する必要がある。なお、１つのログ記憶部２１に対して書き込み出来るログ書き込み部１３を１つに限定するように動作させても良く、その場合、このような仕組みは不要である。

　ログ記憶部アドレス管理部４２は、ログ記憶部２１に格納された更新情報について、指定されたキーに対する更新情報の格納場所を記録する。例えば、キーＡに対する更新情報がアドレス０番に格納されている、といった情報を記録する。ログ記憶部アドレス管理部４２は、必要に応じてその他の情報をキャッシュしてもよい。

　ログ読み込み部１５は、ログ記憶部２１から該当キーの更新情報を取得する。その為、ログ読み込み部１５は、ログ管理情報記録部１４から情報を取得した上で、該当キーの更新情報の格納されているアドレスに対して読み込み命令を実行する。また、ログ読み込み部１５は、ログの末尾領域に対して更新されていないか読み込み命令を実行する。ログ読み込み部１５は、この末尾に対する読み込み命令を、リクエストを処理するたびに実行してもよいし、投機的に実行してもよい。この詳細は、後述する。

　記憶部読み込み部１６は、要求処理部１２からのリクエストに応じて該当キーに対応するデータを新記憶部２２あるいは通常記憶部２３から読み込む。記憶部読み込み部１６は、該当キーから格納先のアドレスを算出する方法として、種々の方法を採用することができる。また、記憶部読み込み部１６は値取得のための読み込み要求を、理新記憶部２２と通常記憶部２３に対して同時並行で発行しても良いし、逐次的に発行しても良い。新記憶部２２と通常記憶部２３の双方に該当キーに対するデータが格納されている場合、記憶部読み込み部１６は、新記憶部２２に格納されている値を出力する。

　ログ変換部１７は、ログ記憶部２１に格納されている情報を変換して新記憶部２２へ書き込む。またログ変換部１７は、新記憶部２２に格納されている情報を通常記憶部２３に書き込む。ログ変換部１７は、ある時間周期で定期的に処理を実行しても良いし、ログ記憶部２１の利用容量が一定値を超えたときに行っても良い。

　外部記憶装置２０は、データストアシステム９０のデータを格納する記憶媒体であり、ログ記憶部２１、新記憶部２２、および、通常記憶部２３の３つの領域を包含する。

　ログ記憶部２１は、外部記憶装置２０が担当するキー群の更新情報をジャーナルログ形式で格納する。ログ書き込み部１３が、逐次的に更新情報をログ記憶部２１に格納する。更新情報は、少なくとも、レコードのキーと、更新されたデータを格納する。また、更新情報は、バージョン情報や、それに類するベクタークロック、時刻情報を共に包含しても良い。それらの情報は、耐障害性のためにデータの複製を保持する際に複製間の整合性を確保するために用いられる。また、ログ記憶部２１は、ウェアレベリングと呼ばれる技術による、書き込み対象の物理アドレスが平滑的に使われるような制御を行っても良い。

　新記憶部２２は、ログ変換部１７がログ記憶部２１のログ情報を変換して格納する領域である。通常記憶部２３は、最終的に識別子（キー）に対応するデータを保持する領域である。通常記憶部２３は、いわゆる、データファイル形式、データベース形式のデータが格納される領域である。
［動作］
｛読み込み動作について｝
　図５は、データストアシステム９０の読み込み処理のフローチャートである。図５は、ＫＶＳシステムにおけるＧＥＴ処理フローの例であるが、他のデータストアシステム９０の参照処理も、ほぼ同種の処理となる。

　まず、データストアシステム９０の利用者であるアプリケーションプログラム（あるいはユーザ）が、要求受付部１１にリクエストを発行する（S11）。例えば、アプリケーションプログラムが要求受付部１１であるライブラリを使用してリクエストを発行する。

　次に、要求処理部１２は、該リクエストを受信して解釈する（S12）。要求処理部１２は、要求受付部１１が提供するＡＰＩ（Application Program Interface）の、どのＡＰＩを通じて呼ばれたかによって異なる処理を実行する。ＧＥＴ処理であれば、引数としてデータのキーが指定されており、要求処理部１２がこのキーを認識する。ＫＶＳシステム以外のデータベースシステムではＳＱＬで命令を受け付けるため、要求処理部１２は、ＳＱＬを解釈して実行処理に落とし込む。本ステップの処理は、例えば、クエリパーサーや、エクゼキューターが行う処理である。

　S12でＧＥＴ処理であることを特定した後、要求処理部１２は、ログ読み込み部１５および記憶部読み込み部１６に対して、指定されたキーのデータの取得を依頼する（S13）。次に、ログ読み込み部１５および記憶部読み込み部１６はそれぞれ該当キーのデータ取得処理を実行する（S14、S17）。要求処理部１２は、ログ読み込み部１５および記憶部読み込み部１６を並列に起動しても良いし、ログ読み込み部１５を先に起動しログ記憶部２１からデータが得られなかったとき（S15でNO）、記憶部読み込み部１６を起動しても良い。この選択は、例えば、データストアシステム９０の設計者が、アプリケーションプログラムのレイテンシとデバイスへの負荷量とのトレードオフを考慮して、行えば良い。S14、S17の詳細については後述する。

　S14においてログ読み込み部１５のＧＥＴ処理が完了したら、要求処理部１２は、この結果として該当キーに対する値（データ）を取得できたかどうかを判定する（S15）。ログ記憶部２１内に該当キーに対するデータが含まれない場合（S15でNO）、要求処理部１２は記憶部読み込み部１６の結果を取得する（S18）。ログ読み込み部１５が該当キーに対する値を取得できた場合（S15でYES）、要求処理部１２は、ログ読み込み部１５の結果を要求受付部１１に対して応答する（S16）。

　S17では、記憶部読み込み部１６が該当キーの値の取得処理を行う。要求処理部１２は、記憶部読み込み部１６が得た結果を、ログ読み込み部１５により該キーのデータが取得されなかった場合に限り（S15でNO）、要求受付部１１へ応答する（S18）。

　なお、ログ読み込み部１５と記憶部読み込み部１６がまとめて、読み込み部１８として、実装された場合、読み込み部１８は、S14乃至S16のステップを実行する。この場合、読み込み部１８は、S14、S17相当の処理を、並列にも、上述の順番でも実行して良い。
｛ログ読み込み部１５の動作｝
　図６Ａ及びＢは、ログ読み込み部１５の処理フローチャートである。ログ読み込み部１５は、図５のS14で起動されて以降の処理を実行する。なお、図６の例では、ログ読み込み部１５はS21から始まるフローおよびS26から始まるフローを並行的に実行するが、この２つのフローを逐次的に実行しても良い。

　まず、S21から始まる処理フローについて説明する。このフローは、ログの最新データを取得するフローである。ログ読み込み部１５は、データの最新値を応答する必要がある。データストアシステム９０内の他の計算装置１０（図１参照）がデータを書き変えている可能性が有るため、最新値を得るためには、ログ読み込み部１５は他の計算装置１０が追加した最新のログまでを取得する必要がある。

　まず、ログ読み込み部１５は、ログ管理情報記録部１４内の末尾アドレス管理部４１から、ログの末尾アドレス情報を取得する（S21）。この末尾アドレスは、ログ管理情報記録部１４が認識している情報であり、実際のログ記憶部２１における末尾アドレスとは異なる可能性がある。その理由は、データストアシステム９０内の他の計算装置１０が、ログを追加しているかもしれないからである。

　次に、ログ読み込み部１５は、ログ記憶部２１内の末尾アドレスから一定サイズ分のデータの読み込み命令を発行し、データを取得する（S22）。このサイズは、不揮発性デバイスの最小書き込みサイズの定数倍とする。次に、ログ読み込み部１５は、読み込んだデータの中身をチェックして、ログ情報が書き込まれているかどうか判定する（S23）。読み込んだデータに有効なログ情報が格納されている場合（S23でYES）、ログ読み込み部１５はS24に進み、格納されていない場合（S23でNO）、S25へ進む。

　有効なログ情報が確認出来た場合（S23でYES）、ログ読み込み部１５は最新ログまで読み込んだかどうか確認する（S24）。ログ読み込み部１５は、読み込んだデータの途中までしか有効なログ情報が格納されていなければ、最新ログまで読み込んだと判断する。読み込んだデータの末尾まで有効ログが格納されている場合には、後続のログが有る可能性が有り、必ずしも最新ログまで読んだとは限らない。

　最新ログまで読み込んだと判断できない場合（S24でNO）、ログ読み込み部１５は、S22に戻り後続のログを再度読む。読み込み対象は、前回のS22で読んだデータの続き（末尾アドレス以降）である。

　最新ログまで読み込んだことを確認できた場合（S24でYES）、ログ読み込み部１５は、末尾アドレスが変わっている場合には、末尾アドレス管理部４１およびログ記憶部アドレス管理部４２の情報を更新する（S25）。なお、ログ読み込み部１５は、本ステップを実行する代わりに、S22乃至24でログを読み込む度に末尾アドレス管理部４１を更新しても良い。

　なお、読み込んだデータの最初から有効なログ情報が格納されていない場合も（S23でNO）、ログ読み込み部１５は、最新ログまで読み込んだと判断してS25に進む。

　ログ読み込み部１５は、S25の後、S29に進む。

　次に、S26から始まる動作フローについて説明する。まず、ログ読み込み部１５は該当キーの格納先アドレスをログ記憶部アドレス管理部４２から取得する(S26)。ログ読み込み部１５は、ログ記憶部アドレス管理部４２の情報からログ中に該当キーが含まれているかどうかを判定する（S27）。ログが該当キーを含む場合（S27でYES）、ログ読み込み部１５はS28へ進み、含まない場合にはS29へ進む。該当キーを含む場合（S27でYES）、ログ読み込み部１５は、ログ記憶部アドレス管理部４２から得たアドレス情報を用いて読み込み命令をログ記憶部２１に発行し、該当キーに対応するデータを取得する（S28）。

　S21から始まるフローと、S26から始まるフローの後に、ログ読み込み部１５は、これまで取得したデータから要求受付部１１へ応答すべき情報を特定する（S29）。まず、S21からS25までで得られた最新ログ（以降、差分ログ）情報が、該当キーに対応するデータを含む場合には、この差分ログ内の最新のデータを要求受付部１１へ応答する（S2A、および、図５のS15およびS16）。この場合、ログ読み込み部１５は、S26からS28までのフローの動作完了を待つ必要が無い。このように動作することで、ログ読み込み部１５はレイテンシを短縮することが可能である。

　ここで、該当キーに対応する情報が、差分ログ内に含まれていないがログ記憶部２１内のいずれかに含まれる場合には、ログ読み込み部１５は、S26からS28までで得られたデータを要求受付部１１へ応答する（S2B、及び、図５のS15およびS16）。また、該当キーに対応する情報が差分ログにもログ記憶部２１にも含まれない場合には、ログ読み込み部１５は、該当キーに対応する情報はログ記憶部２１には含まれないと要求処理部１２へ応答する（S2C）。この場合、要求処理部１２は、記憶部読み込み部１６の結果を要求受付部１１へ応答する（図５のS18）。
｛記憶部読み込み部１６の動作｝
　図７は、記憶部読み込み部１６の処理フローチャートである。記憶部読み込み部１６は、図５のS17で起動されて以降の処理を実行する。

　記憶部読み込み部１６は、新記憶部２２および通常記憶部２３に対して読み込み命令を発行する（S31およびS34）。これら２つの読み込み命令は同時並行的に行われる。こうすることで、読み込みリクエストに対する応答時間（レイテンシ）が短縮される。なお、読み込みは逐次的に行っても良く、S31から始まる処理を行った後に、S34の処理を行っても良い。このような順にすることによって、不要なS34の処理を省略することができるために、外部記憶装置２０への負荷が軽減される。

　記憶部読み込み部１６は、同時並行的な読み込み（S31とS34）を行うかどうかを、データへのアクセスパターンに基づいて決めても良い。これらの同時並行的な読み込みは、キーに対するアクセスの偏りが大きいアプリケーションでは効果が比較的少なく、逆に偏りが小さい（均等にアクセスされる）場合には、効果が大きい。この事情は、ログ読み込み部１５が行う、同時並行的な読み込み（S21とS26）にも当てはまる。なお、記憶部読み込み部１６およびログ読み込み部１５は、S21とS26、および、S31とS34の一方の組だけを並行的に処理し、他方は逐次的に処理しても良い。

　S31において、記憶部読み込み部１６は、ハッシュ値計算などの手法を用いて、対象とするキーが新記憶部２２の中のどのアドレスに格納されているかを算出する。S34においても、記憶部読み込み部１６は、同様に、対象とするキーが通常記憶部２３の中のどのアドレスに格納されているかを算出する。

　対象とするキーが新記憶部２２の中に格納されている場合（S32でYES）、記憶部読み込み部１６は、新記憶部２２から取得したデータを出力する（S33）。対象とするキーが新記憶部２２の中に格納されておらず（S32でNO）、通常記憶部２３の中に格納されている場合（S35でYES）、記憶部読み込み部１６は、通常記憶部２３から取得したデータを出力する（S36）。対象とするキーが新記憶部２２の中にも、通常記憶部２３の中にも格納されていない場合（S32でNO、かつ、S35でNO）、記憶部読み込み部１６は、対象とするキーのデータ無を報告する（S37）。

　｛書き込み動作について｝
　図８は、データストアシステム９０の書き込み処理のフローチャートである。図８は、ＫＶＳシステムにおけるＰＵＴ処理フローの例であるが、他のデータストアシステム９０の更新処理も、ほぼ同種の処理となる。

　まず、アプリケーションプログラムが要求受付部１１を介してリクエストを発行し（S11）、要求処理部１２がリクエストを解釈する（S12）。この２つのステップは、図５と同様である。

　次に、要求処理部１２は、書き込み処理に必要なデータを取得する（S41）。このデータは、例えば、障害に備えて取得する複製間の整合をとるために必要となる、バージョン情報やベクタークロック情報である。すなわち、要求処理部１２はここで、例えば、キーに対応したバージョン情報を取得する。

　要求処理部１２は、バージョン情報をＧＥＴ処理により得る。または、ログ管理情報記録部１４内のログ記憶部アドレス管理部４２にキーに対応したアドレスと共にバージョン情報を保持しておき、要求処理部１２はバージョン情報をログ記憶部アドレス管理部４２から得ても良い。

　また、ＣＡＷ命令は、古いデータと比較した上で更新するかどうかを決める命令であり、例えば、ログ書き込み部１３がＣＡＳ命令を使用するときは、データの古い値が必要となる。要求処理部１２は、この値も事前にＧＥＴ処理で得る。計算装置１０の主記憶装置８２が、このデータを保持していても良い。

　次に、要求処理部１２は、ログ書き込み部１３に更新情報を渡す（S42）。更新情報には、S41で得られた、例えば、バージョン情報と、要求受付部１１が受け付けたリクエスト内の新しく書き込むデータが少なくとも含まれる。

　ログ書き込み部１３は、ログ管理情報記録部１４の末尾アドレス管理部４１から末尾アドレスを取得し、ログ記憶部２１の該アドレスに対し更新情報を書き込む（S43）。

　ログ書き込み部１３は、この更新情報をバッファリングして、書き込みサイズを不揮発性記憶媒体であるログ記憶部２１の最小書き込みサイズの定数倍（定数は、自然数）にして行っても良い。ログ書き込み部１３は、例えば、不揮発性記憶媒体の最小書き込みサイズが４キロバイトのとき、更新情報が４キロバイトになるまで複数の書き込み命令を集約してから書き込みを実行する。このバッファリングは、不揮発性記憶媒体への書き込みデータ量を抑え、不揮発性記憶媒体の寿命を延長することが出来る。

　不揮発性記憶媒体の最小書き込みサイズより小さい書き込み命令は、実際には大きな容量の書き込みとなってしまう。例えば、更新情報が５１２キロバイトであっても、最小書き込みサイズが４キロバイトである場合には、記憶媒体には４キロバイトの書き込みが行われてしまう。

　なお、ログ書き込み部１３は、このようなバッファリングを、外部記憶装置２０に揮発性メモリを備えることで行っても良い。

　前述した通り、ログ書き込み部１３は、ログ記憶部２１への書き込みはＣＡＷ命令で行う。この時、ＣＡＷ命令の比較データはログ記憶部２１の初期化状態データ、あるいは、削除された状態を示すデータとする。このような比較を行う理由は、他の計算装置１０によってログ書き込みが行われている可能性があるためである。ＣＡＷ命令が失敗した場合、ログ書き込み部１３は、新たに末尾アドレスを取得し再度ＣＡＷ命令を行う。ログ書き込み部１３は、これを成功するまで繰り返す（S43）。

　次に、ログ書き込み部１３は、ログ管理情報記録部１４の末尾アドレス管理部４１およびログ記憶部アドレス管理部４２の情報を更新する（S44）。最後に、ログ書き込み部１３は要求処理部１２へログ書き込み完了を通知し、これを受けて要求処理部１２が要求受付部１１へ処理の完了を通知する（S45）。S43において複数の書き込み命令をバッファリングして書き込みした場合、ログ書き込み部１３は、バッファリングされたログ情報の書き込み命令が完了した後で通知する。

　｛ログ変換部１７の動作｝
　図９は、ログ変換部１７の処理フローチャートである。ログ変換部１７は、ログ記憶部２１のログデータを、新記憶部２２、および、通常記憶部２３のデータへ変換する。ログ変換部１７は、一定期間ごと、あるいは、ログ記憶部２１の利用容量が閾値を超えたとき起動される。

　まず、ログ変換部１７は、ログ記憶部２１の更新ログを先頭から変換容量分読み込む（S51）。変換対象ログは、変換処理開始時点のログ記憶部２１に格納されている全ログでもよいし、所定割合のログ、例えば、全ログの８０％、であっても良いし、所定容量のログであっても良い。

　次に、ログ変換部１７は、読み込んだログ情報から、データ更新が有ったキー（被更新キー）、被更新キーに対応する更新データ、および、被更新キーに対するバージョン情報などのメタデータを抽出する（S52）。

　ログ変換部１７は、新記憶部２２に格納されているキーのリストを抽出する（S53）。ログ変換部１７は、新記憶部２２をこの契機で読み込んでも良いし、前回のログ変換処理にそのリスト情報を作成して、例えば、主記憶装置８２に保存しておいても良い。

　続いてログ変換部１７は、通常記憶部２３に書き込むキーのリストを抽出する（S54）。ここで抽出するリストは、新記憶部２２に書き込まれているキーのリストのうち、S52で抽出された被更新キーのリストに含まれないものである。

　次に、ログ変換部１７は、S54で抽出されたキー群のデータを通常記憶部２３に書き込み（S55）、被更新キー群とそれらに対応するデータを新記憶部２２に一括のシーケンシャル書き込みとして書き込む（S56）。このとき、ログ変換部１７は、書き込む更新情報が格納される十分な大きさを決定し、当該容量の新記憶部２２を確保する。このサイズは、通常記憶部２３に比べて小さく、不揮発性記憶媒体の最小書き込みサイズ、削除単位の定数倍であることが望ましい。

　なお、予め決定されたサイズの新記憶部２２が固定的に確保されていても良い。この場合、ログ変換部１７は、新記憶部２２の容量が足りないときは、被更新キーの一部のキーについて、更新データを通常記憶部２３へ書き込んでも良い（S55）。逆に、ログ変換部１７は、新記憶部２２の容量に余裕が有るときは、S54で抽出したリストのうち、幾つかを新記憶部２２に残してもよい。その場合、残すキーは通常記憶部２３へ書き込むリストからは取り除く。

　最後に、ログ変換部１７は、ログ記憶部２１から、今回変換されたログのデータを削除し、その領域を解放する（S57）。
｛読み込みの集約｝
　ログ記憶部２１の末尾アドレスに対する読み込み命令（図６のS22）は、リクエスト毎に発行する必要がある。この読み込み命令の増大は、データストアシステム９０の性能悪化を招く。これを防止する為、ログ読み込み部１５は、複数のリクエストに対してこの読み込み命令を１度に集約しても良い。この集約を、読み込み集約と呼ぶ。

　図１０は、ログ記憶部２１に対する読み込み集約の概要を示す図である。本図のａ）は、リクエストごとに読み込み命令を発行する場合の様子を示す。ｂ）は、読み込み集約を行った場合の様子を示す。

　ａ）とｂ）の両方のケースで、要求処理部１２は、４つのリクエスト（リクエスト１からリクエスト４まで）をログ読み込み部１５に発行している。ａ）の場合、ログ読み込み部１５は、これら４つのリクエストの各々に対し、ログ記憶部２１に対する読み込み命令を発行している。一方、ｂ）において、ログ読み込み部１５は、最初のリクエスト１を受け付けてログ末尾読み込み命令を発行した後に、当該読み込みが完了する迄に受け取ったリクエスト２とリクエスト３に対してログ末尾読み込み命令を発行しない。リクエスト４はリクエスト１の結果を受け付けた後に受け取っているため、ログ読み込み部１５は、再度ログの読み込み命令を発行しその返値を待つ。

　確実に最新状態のログを読み込むために、ログ読み込み部１５は、インターコネクトネットワーク３０の遅延を考慮して、ログ読み込み命令を発行するかどうかを決める。図１１は、ログ読み込み部１５によるログ読み込み命令の発行要否判断を説明する図である。

　本図のａ）は、インターコネクトネットワーク３０の遅延が小さい場合を示す。この場合、ログ読み込み部１５は、リクエストを受け付けた時点でログ読み込み発行の要否を決定できる。一方、ｂ）は、インターコネクトネットワーク３０の遅延が大きな場合を示す。この場合、ログ記憶部２１の状態とログ管理情報記録部１４の情報とに差がある可能性が有るため、リクエスト４を受け付けた時点では、ログ読み込み部１５はログ読み込み発行の要否を決定できない。そこで、ログ読み込み部１５は、システムの遅延に基づいて返値が返ってきた時点以前で遅延時間分以内に到着した、即ち、ｂ）における時間ｔが遅延時間以内である、リクエストに対してはログ読み込み命令を発行しても良い。

　具体的には、ログ読み込み部１５は、以下のようにして、ログ記憶部２１から応答が帰ってきた時点で、ログ読み込み発行の要否をチェックする。
１）ログ読み込み部１５は、要求処理部１２から受信してキューイングするリクエストに到着時刻を入れておく。
２）ログ読み込み部１５は、ログ記憶部２１から返値を受け取った時刻と，キューに含まれているリクエストの到着時刻を比較する。
３）ログ読み込み部１５は、リクエスト到着時刻が返値時刻の前であって一定時間以内ならば、即ち、ｂ）における時間ｔが一定間以内ならば、新たな読み込み命令を発行する。
４）上述の一定時間は、パラメータで与えられる。この値は、インターコネクトネットワーク３０の遅延時間＋α程度の時間である。

　なお、上述した処理の一部は、計算装置１０内の各部が実行するのではなく、外部記憶装置２０に論理回路やプロセッサを設け、それらが実行しても良い。
［効果］
　本実施の形態の計算装置１０は、不揮発性メモリデバイスの寿命延長を実現しつつ、当該デバイスを用いたストレージシステムの性能低下を抑制する。その理由は、ログ書き込み部１３が、データベースなどである通常記憶部２３のデータ更新をログ形式でログ記憶部２１に格納し、ログ変換部１７が、そのログに記録されたデータ更新を抽出してまとめ、新記憶部２２にシーケンシャルに書き込むからである。これにより、計算装置１０は、通常記憶部２３へのランダム書き込みで発生するライト・アンプリケーションを抑制し、不揮発性メモリデバイスの寿命延長を実現する。計算装置１０では、記憶デバイスのコントローラが、寿命延長のための特別な制御が必須ではなく、コントローラの負荷増大を抑制する。

　＜第２の実施形態＞
　本実施の形態のデータストアシステム９０は、通常記憶部２３を、第１の実施の形態とは異なる方法で管理する。その他の基本的な動作、構成は第１の実施の形態と同一であるため、当該部分の説明は省略する。

　図１２は、本実施の形態における外部記憶装置２０の構成を示す図である。本実施の形態における外部記憶装置２０は、Ｗ個（Ｗは２以上の数）の通常記憶部２３（通常記憶部２３－１から通常記憶部２３－Ｗまで）、を備える。さらに、外部記憶装置２０は、通常記憶管理情報保持部２４を備える。

　第１の発明の実施の形態においては、通常記憶部２３への書き込みがランダム書き込みになり、不揮発性記憶媒体の寿命に悪影響を与える。これを防止するために、本実施の形態の外部記憶装置２０は、複数の通常記憶部２３を備えてデータを記録する。

　ログ変換部１７は、新記憶部２２に入っていたデータを通常記憶部２３に移す際に、その契機で変換されるデータが全て格納できるサイズの通常記憶部２３を作成する。そしてログ変換部１７は、新記憶部２２から通常記憶部２３への書き込みをシーケンシャル書き込みとして実行する。ログ変換部１７は、次の契機の通常記憶部２３は前回に使用した通常記憶部２３の後ろの空き通常記憶部２３に作成する。

　また、本実施の形態の外部記憶装置２０は、各通常記憶部２３の管理情報格納域として通常記憶管理情報保持部２４を備える。通常記憶管理情報保持部２４は、各通常記憶部２３の開始アドレス、未使用または使用中の状態表示、および、記憶しているキーのリストを保持する。キーのリストは、はブルームフィルタと呼ばれる技術で容量を圧縮できる。通常記憶管理情報保持部２４が記憶する、未使用または使用中の状態表示は、初期状態は‘空き’で、ログ変換部１７が、書き込み時に‘使用中’に変更し、後述するガベージコレクションで最新のデータが無くなったとき‘空き’に戻す。

　記憶部読み込み部１６は、通常記憶管理情報保持部２４の情報を用いて、該当キーの最も新しいデータを格納する通常記憶部２３にアクセスすることで、該当キーのデータを取得する。なお、例えば、記憶部読み込み部１６は、通常記憶管理情報保持部２４に格納されている情報を計算装置１０内にキャッシュすることで、読み込みを高速化できる。

　なお、計算装置１０、例えば、ログ変換部１７は、定期的に通常記憶部２３のガベージコレクションに類する処理を実行する必要が有る。このガベージコレクションは、一般的なデータベースシステムで実施されている処理と類似する。

　＜第３の実施形態＞
　図３は、第２の実施の形態にかかる計算装置１０の構成図である。この計算装置１０は、読み込み部１８とログ変換部１７を備える。

　ログ変換部１７は、識別子によるランダムアクセスをされるデータ項目を複数格納する通常記憶部２３に格納されているデータ項目の更新ログを格納するログ記憶部２１から、更新されたデータ項目の識別子と更新データを抽出する。その後、ログ変換部１７は、抽出した識別子と更新データをまとめて、新記憶部２２にシーケンシャルに書き込む。

　読み込み部１８は、指定された識別子のデータ項目を、新記憶部２２に格納されていれば新記憶部２２から、格納されていなければ通常記憶部２３から取得する。

　本実施の形態の計算装置１０は、不揮発性メモリデバイスの寿命延長を実現しつつ、当該デバイスを用いたストレージシステムの性能低下を抑制する。その理由は、ログ書き込み部１３が、データベースなどである通常記憶部２３のデータ更新をログ形式でログ記憶部２１に格納し、ログ変換部１７が、そのログに記録されたデータ更新を抽出してまとめ、新記憶部２２にシーケンシャルに書き込むからである。これにより、計算装置１０は、通常記憶部２３へのランダム書き込みで発生するライト・アンプリケーションを抑制し、不揮発性メモリデバイスの寿命延長を実現する。計算装置１０では、記憶デバイスのコントローラが、寿命延長のための特別な制御が必須ではなく、コントローラの負荷増大を抑制する。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、2015年05月11日に出願された日本出願特願2015-096308を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　１０　　計算装置
　１１　　要求受付部
　１２　　要求処理部
　１３　　ログ書き込み部
　１４　　ログ管理情報記録部
　１５　　ログ読み込み部
　１６　　記憶部読み込み部
　１７　　ログ変換部
　２０　　外部記憶装置
　２１　　ログ記憶部
　２２　新記憶部
　２３　通常記憶部
　２４　通常記憶管理情報保持部
　３０　インターコネクトネットワーク
　４１　末尾アドレス管理部
　４２　ログ記憶部アドレス管理部
　８１　ＣＰＵ
　８２　主記憶装置
　８３　ネットワークインタフェース
　９０　データストアシステム

Claims

　識別子によるランダムアクセスをされるデータ項目を複数格納する通常記憶手段に格納されている前記データ項目の更新ログを格納するログ記憶手段から、更新された前記データ項目の前記識別子と更新データを抽出して集め、新記憶手段にシーケンシャルに書き込む、ログ変換手段と、
　指定された前記識別子の前記データ項目を、前記新記憶手段に格納されていれば前記新記憶手段から、格納されていなければ前記通常記憶手段から取得する読み込み手段と、を備える計算装置。
　前記ログ変換手段は、前記新記憶手段に格納されていた前記データ項目のうち、前記ログ記憶手段から抽出されなかった前記データ項目の一部分について、前記識別子と前記更新データを集めて前記新記憶手段にシーケンシャルに書き込み、その他の部分について、前記識別子をキーとするランダムアクセスにより前記通常記憶域の前記データ項目を前記更新データで更新する、請求項１の計算装置。
　前記ログ変換手段は、前記新記憶手段に格納されていた前記データ項目のうち、前記ログ記憶手段から抽出されなかった前記データ項目について、前記識別子と前記更新データを集めて、複数ある前記通常記憶手段のうちの未使用な前記通常記憶手段にシーケンシャルに書き込んで、当該通常記憶手段を使用中とし、
　前記読み込み手段は、指定された前記識別子の前記データ項目のデータを、当該データ項目の最新データを格納する前記通常記憶手段から読み込む、請求項１乃至２の何れか１項の計算装置。
　前記ログ記憶手段は、不揮発性記録媒体上に設けられており、
　前記更新ログをバッファに一時保存して、前記不揮発性記録媒体の書き込みサイズの倍数単位に前記ログ記憶手段に書き込むログ書き込み手段を備える、請求項１乃至３の何れか１項の計算装置。
　前記更新ログ末尾へのポインタ情報を格納するログ管理情報記録手段を、さらに備え、
　前記読み込み手段は、前記ポインタ情報が示す前記ログ記憶手段の領域の読み込みが必要な時、先行する読み込み要求によって前記ポインタ情報が示す前記ログ記憶手段の領域が読み込み中であれば、新たな読み込み要求の発行を行わず、前記先行する読み込み要求で読み込まれた情報を参照する、請求項１乃至４の何れか１項の計算装置。
　前記読み込み手段は、前記ログ記憶領域、前記新記憶手段、前記通常記憶手段に、読み込み要求を並行して発行し、指定された前記識別子の前記データ項目を、前記ログ記憶領域に格納されていれば前記ログ記憶領域から、前記ログ記憶領域に格納されていなくて前記新記憶手段に格納されていれば前記新記憶手段から、前記ログ記憶領域にも前記新記憶手段にも格納されていなければ前記通常記憶手段から取得する、請求項１乃至５の何れか１項の計算装置。
　識別子によるランダムアクセスをされるデータ項目を複数格納する通常記憶手段に格納されている前記データ項目の更新ログを格納するログ記憶手段から、更新された前記データ項目の前記識別子と更新データを抽出して集め、新記憶手段にシーケンシャルに書き込み、
　指定された前記識別子の前記データ項目を、前記新記憶手段に格納されていれば前記新記憶手段から、格納されていなければ前記通常記憶手段から取得する、方法。
　前記新記憶手段に格納されていた前記データ項目のうち、前記ログ記憶手段から抽出されなかった前記データ項目の一部分について、前記識別子と前記更新データを集めて前記新記憶手段にシーケンシャルに書き込み、その他の部分について、前記識別子をキーとするランダムアクセスにより前記通常記憶域のデータ項目を更新データで更新する、請求項７の方法。
　前記新記憶手段に格納されていた前記データ項目のうち、前記ログ記憶手段から抽出されなかった前記データ項目について、前記識別子と前記更新データを集めて、複数ある前記通常記憶手段のうちの未使用な前記通常記憶手段にシーケンシャルに書き込んで、当該通常記憶手段を使用中とし、
　指定された前記識別子の前記データ項目のデータを、当該データ項目の最新データを格納する前記通常記憶手段から読み込む、請求項７乃至８の何れか１項の方法。
　コンピュータに、請求項７乃至９の何れか１項の方法を実行させる、プログラムを記録した記録媒体。