JP2006338145A - Multiplex database system, synchronization method thereof, intermediation device and intermediation program - Google Patents
Multiplex database system, synchronization method thereof, intermediation device and intermediation program Download PDFInfo
- Publication number
- JP2006338145A JP2006338145A JP2005159578A JP2005159578A JP2006338145A JP 2006338145 A JP2006338145 A JP 2006338145A JP 2005159578 A JP2005159578 A JP 2005159578A JP 2005159578 A JP2005159578 A JP 2005159578A JP 2006338145 A JP2006338145 A JP 2006338145A
- Authority
- JP
- Japan
- Prior art keywords
- server
- database
- snapshot
- database server
- difference information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、障害などによりサービスが停止することなく常時連続したサービス提供が要求される多重化データベースシステムに関し、特に該システムを構成するデータベースサーバに障害が発生した場合の復旧処理や新規のデータベースサーバの組み込み処理を、サービス提供を継続したまま実施するためのデータ同期化技術に関する。 The present invention relates to a multiplexed database system in which continuous service provision is required without a service being stopped due to a failure or the like, and more particularly, recovery processing when a failure occurs in a database server constituting the system or a new database server The present invention relates to a data synchronization technique for performing the embedded processing while continuing to provide services.
従来のデータベース同期化技術としては、例えば特許文献1に記載されているものが知られている。この従来技術では、それぞれデータベースを内蔵する複数のサーバがネットワーク等を介して相互接続されている。図46に示すように、特許文献1に記載されている実施例では、3個のサーバ1010,1020,1030を含み、それぞれネットワーク1040を介して相互接続されている。各サーバ1010,1020及び1030は、それぞれデータ更新制御部1011,1021,1031と、レプリケーション制御部1012,1022,1032と、データベース1013,1023,1033及び差分ファイル1014,1024,1034を含んでいる。
As a conventional database synchronization technique, for example, one described in
サーバ1010のデータ更新制御部1011は、データベースの更新処理を行う。レプリケーション制御部1012は、差分ファイル1014によりデータベース1013の同期化処理を行う。データベース1013は、データを一括管理する。差分ファイル1014は、データベース1013の差分情報を格納する。また、サーバ1020及び1030のデータ更新制御部1021,1031、レプリケーション制御部1022,1032、データベース1023,1033及び差分ファイル1024,1034は、それぞれ上述したデータ更新制御部1011,レプリケーション制御部1012,データベース1013及び差分ファイル1014と同様の機能を有する。
The data
サーバ1010にデータ更新イベントが発生した場合、サーバ1010のデータ更新制御部1011は、自データベース1013の内容を更新した後、サーバ1020及びサーバ1030に対してデータ更新通知を送信する。サーバ1020及びサーバ1030のデータ更新制御部1021,1031は、自データベース1023,1033の内容を更新する。その後、サーバ1020及び1030は、それぞれサーバ1010に対してデータ更新完了通知を送信する。サーバ1010は、サーバ1020及びサーバ1030からのデータ更新完了通知がともに正常であれば、何も行わずに更新処理を終了する。差分ファイル1014,1024,1034には何も書き込まれない。
When a data update event occurs in the server 1010, the data
サーバ1030が障害などでダウンしている時にサーバ1010にデータ更新イベントが発生した場合、サーバ1020はデータ更新完了通知をサーバ1010へ送信するが、サーバ1030はデータ更新完了通知をサーバ1010へ送信できない。サーバ1010は、サーバ1030からのデータ更新完了通知を待ち続けるが、タイムアウトし、サーバ1030での更新が正常に終了しなかったことを知る。サーバ1010は、差分ファイル1014に更新が失敗した装置の情報(この場合、サーバ1030)と更新内容を保存する。以上で、サーバ1010は更新処理を終了する。 When a data update event occurs in the server 1010 when the server 1030 is down due to a failure or the like, the server 1020 transmits a data update completion notification to the server 1010, but the server 1030 cannot transmit a data update completion notification to the server 1010. . The server 1010 continues to wait for a data update completion notification from the server 1030, but times out and knows that the update at the server 1030 has not ended normally. The server 1010 stores information on the device that failed to be updated in the difference file 1014 (in this case, the server 1030) and the update content. Thus, the server 1010 ends the update process.
サーバ1020にデータ更新イベントが発生した場合も、サーバ1020は上述と同様の処理を行い、差分ファイル1024に更新が失敗した装置の情報と更新内容を保存し、更新処理を終了する。
Even when a data update event occurs in the server 1020, the server 1020 performs the same processing as described above, stores the information of the apparatus that failed to be updated and the update content in the
以上のようにして、サーバ1030が復旧するまでの間、サーバ1010とサーバ1020は更新内容をそれぞれ差分ファイル1014,1024へ保存し続ける。
As described above, until the server 1030 is restored, the server 1010 and the server 1020 continue to store the updated contents in the
サーバ1030が障害から復旧すると、サーバ1030のレプリケーション制御部1032はサーバ1010に対してレプリケーション開始通知を送信する。サーバ1010のレプリケーション制御部1012は差分ファイル1014に保存されているデータを古い順に取り出し、サーバ1030へデータ更新通知を送信する。サーバ1030は自データベース1033の内容を更新した後、データ更新完了通知をサーバ1010へ送信する。サーバ1010は、データ更新完了通知を受信するたびに該当するデータを差分ファイル1014から削除する。
When the server 1030 recovers from the failure, the
差分ファイル1014が空になったら、サーバ1020の差分ファイル1024のデータを上記と同様にしてサーバ1030に送信する。差分ファイル1024も空になったら、サーバ1030の同期化が完了する。
しかしながら、上記特許文献1に記載のものでは、障害発生直後から正常稼働中のサーバがデータ更新内容を差分ファイルに蓄積しはじめるため、障害サーバの復旧までの時間が長くなると差分ファイルが巨大になってしまう。その結果、正常稼働中のサーバの記憶容量を食い潰してそのサーバが障害になってしまったり、障害から復旧したサーバの同期完了までに時間がかかるなどの問題がある。
However, in the case of the above-mentioned
また、同期化の手順は障害が発生した時点のデータベースに、障害が発生した後の更新内容を反映させるという方法である。このことは、同期化するサーバーは障害が発生する直前までのデータベースを正常に保持していることが前提となっていることを意味する。したがって、ハードディスクの故障などデータベースが破壊される障害が発生した場合、このサーバを同期化させることが不可能であるという問題がある。また、同じ理由から、サーバをアップグレードする場合など、データを全く保持していない新しいサーバを同期化することができないという問題もある。 The synchronization procedure is a method of reflecting the updated contents after the failure occurs in the database at the time of the failure. This means that it is assumed that the server to be synchronized normally maintains the database up to just before the failure occurs. Therefore, there is a problem that it is impossible to synchronize the server when a failure such as a hard disk failure occurs that destroys the database. For the same reason, there is also a problem that a new server that does not hold any data cannot be synchronized, such as when upgrading a server.
さらに、同期化の手順は障害が発生した後の更新内容と障害が発生する直前までのデータベースを基に行う方式、つまり、障害発生時点をポイントとした方式であるため、障害復旧以外の目的にこの方式を使うことができない。すなわち、システム全体のサーバ台数を増やす目的で、新たなサーバを同期化させることはできないという問題がある。例えば、特許文献1の実施例では、システム全体のサーバ台数は3台であるが、これを4台に増やすために4台目のサーバを同期化させることはできない。
In addition, the synchronization procedure is a method based on the update contents after the failure occurs and the database until the failure occurs. This method cannot be used. That is, there is a problem that a new server cannot be synchronized for the purpose of increasing the number of servers in the entire system. For example, in the example of
また、システム全体のサーバ台数を減らすことができないという問題点もある。その理由は、サーバを1台切り離すと、永遠に差分ファイルを蓄積するためである。 Another problem is that the number of servers in the entire system cannot be reduced. The reason is that, when one server is disconnected, the difference file is accumulated forever.
さらに、トランザクションが失敗した場合にその失敗したトランザクションの更新内容を取り消す方法が無いという問題もある。 There is also a problem that when a transaction fails, there is no way to cancel the updated contents of the failed transaction.
さらに、障害でダウンしたサーバ以外の全てのサーバで、更新内容を分散して保存しているため、2台以上のサーバがダウンした場合には障害になったサーバを同期化できないという問題もある。 In addition, since the update contents are distributed and stored on all servers other than the server that is down due to a failure, there is also a problem that if two or more servers go down, the failed server cannot be synchronized. .
本発明は、上記事情に鑑みてなされたものであり、第1の目的とするところは、少ない同期化用データでデータベースサーバの同期化を図ることができる多重化データベースシステムを提供することにある。また、第2の目的とするところは、システム全体をダウンさせることなく、データベースサーバのデータ記憶状況に拘わらずデータベースサーバを任意に切り離し又は組み込むことができる多重化データベースシステムを提供することにある。 The present invention has been made in view of the above circumstances, and a first object is to provide a multiplexed database system capable of synchronizing a database server with a small amount of synchronization data. . A second object is to provide a multiplexed database system that can arbitrarily detach or incorporate a database server regardless of the data storage status of the database server without bringing down the entire system.
上記目的を達成するため、本願発明では、複数のデータベースサーバと、クライアントコンピュータからの処理要求を各データベースサーバに中継するとともに各データベースサーバからの正当な応答の1つをクライアントコンピュータに処理結果として返す仲介装置とを備えた多重化データベースシステムにおいて、仲介装置は、クライアントコンピュータからの処理要求を差分情報として記憶する差分情報記憶部と、データベースのスナップショットを記憶するスナップショット記憶部とを備える。そして、仲介装置は、新規データベースサーバの組込要求があると、(a)正常稼働中のデータベースサーバからデータベースのスナップショットを取得してスナップショット記憶部に記憶する処理を開始し、(b)クライアントコンピュータから受信する処理要求を差分情報として差分情報記憶部に順次記憶し、(c)スナップショットの取得を完了するとスナップショット記憶部に記憶したスナップショットを用いて新規データベースサーバのデータベースを復元させ、(d)新規データベースサーバにおいて前記スナップショットからのデータベースの復元が完了すると、差分情報記憶部に記憶されている処理要求を新規データベースサーバに順次送出し、(e)差分情報記憶部に記憶されている処理要求について新規データベースにおいて処理が終了すると新規データベースサーバをシステムに組み込む。 In order to achieve the above object, the present invention relays processing requests from a plurality of database servers and client computers to each database server and returns one of the valid responses from each database server as a processing result to the client computer. In a multiplexed database system including an intermediary device, the intermediary device includes a difference information storage unit that stores processing requests from client computers as difference information, and a snapshot storage unit that stores a snapshot of the database. Then, when there is a request for incorporating a new database server, the intermediary device (a) starts a process of acquiring a database snapshot from a normally operating database server and storing it in the snapshot storage unit, (b) The processing request received from the client computer is sequentially stored as difference information in the difference information storage unit, and (c) when the acquisition of the snapshot is completed, the database of the new database server is restored using the snapshot stored in the snapshot storage unit. (D) When restoration of the database from the snapshot is completed in the new database server, processing requests stored in the difference information storage unit are sequentially sent to the new database server, and (e) stored in the difference information storage unit The new processing request to the new database When the stomach processing is completed incorporate a new database server to the system.
このようなシステムによれば、仲介装置では新規データベースサーバの同期化用の差分情報を差分情報記憶部に記憶するが、この差分情報は新規データベースサーバからの組み込み要求を契機として差分情報記憶部への蓄積が開始される。したがって、データベースサーバを故障等によりシステムから切り離した後に再びシステムに組み込む場合、障害復旧までに長時間要しても、仲介装置に多大な差分情報が蓄積することがない。これにより、仲介装置の記憶容量を節約できるとともに差分情報の増大による仲介装置の負荷増大やダウンを防止できる。 According to such a system, the intermediary device stores the difference information for synchronization of the new database server in the difference information storage unit, but this difference information is sent to the difference information storage unit in response to an incorporation request from the new database server. Accumulation starts. Therefore, when the database server is separated from the system due to a failure or the like and then incorporated into the system again, a large amount of difference information is not accumulated in the mediation device even if it takes a long time to recover from the failure. As a result, the storage capacity of the mediation device can be saved, and an increase in load or down of the mediation device due to an increase in difference information can be prevented.
また、正常稼働中のデータベースサーバにおけるスナップショット及び仲介装置で記憶された差分情報に基づき新規データベースサーバのデータが復元されるので、組み込み時の新規データベースにおけるデータ蓄積状況はどのようなものであっても構わない。したがって、ディスク故障により切り離されたデータベースサーバの復帰や、新規のデータベースサーバの組み込み(すなわちデータベースサーバの増強)を実現できる。すなわち、任意のデータベースサーバの組み込みが可能となる。 In addition, since the data in the new database server is restored based on the snapshot in the database server in normal operation and the difference information stored in the mediation device, what is the data storage status in the new database at the time of installation? It doesn't matter. Therefore, it is possible to restore a database server that has been disconnected due to a disk failure or to incorporate a new database server (that is, increase the database server). That is, any database server can be incorporated.
さらに、正常稼働中のデータベースサーバにおけるスナップショットは仲介装置において記憶・保持されるので、該スナップショットにより正常稼働中のデータベースサーバの記憶容量を圧迫することがない。したがって、記憶容量の圧迫による正常稼働中のデータベースサーバの動作不良を未然に防止できる。 Furthermore, since the snapshot in the database server that is operating normally is stored and held in the intermediary device, the snapshot does not impose the storage capacity of the database server that is operating normally. Therefore, it is possible to prevent a malfunction of the database server during normal operation due to storage capacity compression.
さらに、データベースサーバをシステムから切り離しただけでは差分情報の記憶やスナップショットの作成は行われないので、データベースのシステムからの切り離しを任意に行うことができる。 Furthermore, since the difference information is not stored and the snapshot is not created simply by disconnecting the database server from the system, the database can be arbitrarily disconnected from the system.
なお、ここでシステムへのデータベースサーバの組み込みとは、多重化データベースシステムを構成するデータベースサーバとして機能するよう仲介装置が当該データベースサーバを取り扱うようにすることを意味する。また、システムからのデータベースサーバからの切り離しとは、多重化データベースシステムを構成するデータベースサーバとして機能しないよう仲介装置が当該データベースサーバを取り扱うようにすることを意味する。したがって、システムに組み込まれているデータベースサーバにはクライアントコンピュータからの処理要求が仲介装置を介して届くが、システムから切り離されたデータベースサーバにはクライアントコンピュータからの処理要求が届かない状態となる。なお、データベースサーバがシステムに組み込まれていること又は切り離されていることと、データベースサーバが仲介装置と通信可能又は不能であることとは無関係である点に留意されたい。つまり、データベースサーバと仲介装置が通信可能な状態にある場合であっても、データベースサーバがシステムに組み込まれていない場合もあり得る。 Here, the incorporation of the database server into the system means that the mediating apparatus handles the database server so as to function as a database server constituting the multiplexed database system. In addition, the separation from the database server from the system means that the mediating apparatus handles the database server so that it does not function as the database server constituting the multiplexed database system. Therefore, the processing request from the client computer reaches the database server incorporated in the system via the mediation device, but the processing request from the client computer does not reach the database server separated from the system. It should be noted that it is irrelevant whether the database server is incorporated in or disconnected from the system, and whether the database server can or cannot communicate with the mediation device. That is, even when the database server and the mediation apparatus are in a communicable state, the database server may not be incorporated in the system.
以上説明したように本発明によれば、少ない同期化用データでデータベースサーバの同期化を図ることができる。また、システム全体をダウンさせることなく、データベースサーバのデータ記憶状況に拘わらずデータベースサーバを任意に切り離し又は組み込むことができる。 As described above, according to the present invention, the database server can be synchronized with a small amount of synchronization data. Further, the database server can be arbitrarily separated or incorporated regardless of the data storage status of the database server without bringing down the entire system.
(第1の実施の形態)
本発明の第1の実施の形態に係る多重化データベースシステムについて図面を参照して説明する。図1は本実施の形態に係る多重化データベースシステムの全体構成を説明するブロック図である。
(First embodiment)
A multiplexed database system according to a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating the overall configuration of a multiplexed database system according to the present embodiment.
この多重化データベースシステムは、図1に示すように、複数のデータベースサーバ(以下「サーバ」と言う)100と仲介装置200とをネットワーク300で接続したものであり、ネットワーク400を介して1以上のクライアントコンピュータ(以下「クライアント」と言う)500からアクセスされるものである。本実施の形態では、図1に示すように、2台のサーバ100a及び100bを有しており、2台のクライアント500a及び500bからアクセスされる。以降の説明において各サーバ100を他のサーバ100と区別する場合には添え字「a」「b」を付加するものとする。クライアント500についても同様である。なお、図1の例では、サーバ100とクライアント500はそれぞれ別々のネットワーク300,400に接続されているが、同じネットワークに接続されていてもよい。
As shown in FIG. 1, this multiplexed database system is a system in which a plurality of database servers (hereinafter referred to as “servers”) 100 and an
図1に示すように、仲介装置200は、ネットワーク400側にIPアドレス172.17.1.1を持っており、これをデータベースサーバのIPアドレスとして公開している。クライアント500はデータベースにアクセスしたいときはIPアドレス172.17.1.1へクエリを送信し、IPアドレス172.17.1.1の仲介装置200からそのクエリに対する応答パケットを受信する。これは、クライアント500等にとっては、IPアドレス172.17.1.1を持ったデータベースサーバとパケットを送受信していることと同じである。このIPアドレス172.17.1.1を持った仮想的なデータベースサーバを仮想サーバ800と呼ぶ。この仮想サーバ800の目的は、サーバ100が冗長化されていることを隠蔽するためである。つまり、サーバ100aとサーバ100b両方が稼働していようとサーバ100bがダウンしてサーバ100aのみが稼働していようとサーバ100aとサーバ100bの他に新たなサーバが追加されようとクライアントには影響は無く、動作を変更する必要がない。
As shown in FIG. 1, the
サーバ100は、データを保存・管理するデータベース101を備えている。データベース101は、SQL(Structured Query Language)を解して処理を行うRDBMS(Relational Database Management System)である。このようなデータベース101としては種々のものがあり、例えばThe PostgreSQL Global Development GroupによるPostgreSQL(http://www.postgres.org/)や、Oracle社によるOracle(登録商標)(http://www.oracle.com)などが挙げられる。本実施の形態ではデータベース101としてPostgreSQLを用いるものとする。
The server 100 includes a
また、データベース101は、ネットワークを介して他の端末から、スナップショットの作成、及び、スナップショットからのデータベースの復元する機能を有しているものとする。この機能は、通常、データベース101のメンテナンスに係る機能として提供されている。例えば、PostgreSQLでは、pg_dump及びpsqlというツールが用意されており、これらのツールを用いることにより他の端末からスナップショットの取得及びスナップショットからの復元を実施できる。ここで、スナップショットとはデータベース全体の複製データやデータベースを復元するために必要なデータを意味する。一般的に、スナップショット作成開始時にコミットされていないデータがスナップショットに含まれるか否かや、スナップショット作成中にクエリの処理が可能か否かなどはデータベース101の仕様によって異なる。本実施の形態では、スナップショット作成開始時にコミットされているデータのみがスナップショットに反映される、スナップショット作成中でもクエリの処理が可能である、という事を前提とする。
In addition, the
仲介装置200は、図2に示すように、本システム内のサーバ100を管理するサーバ管理表201と、トランザクションを管理するトランザクション管理表202と、サーバ100に送信するクエリを一時保存する送信キュー203と、クライアント500から受信したクエリを送信キュー203に投入する受信クエリ処理部204と、送信キュー203からクエリを取り出してサーバ100に送信するクエリ送信処理部205と、クエリ送信処理部205で送信したクエリに対する各サーバ100からの応答の正当性を判定する正当性判定部206と、正当性判定部206で正当と判定された応答を要求元のクライアント500等に送信する応答送信処理部207と、各サーバ100間の同期化処理を制御する同期化処理制御部208と、同期化処理時にサーバ100から取得したデータベース101のスナップショットを一時記憶するスナップショット記憶部209とを備えている。
As illustrated in FIG. 2, the
サーバ管理表201は、サーバが正常稼働中でクエリの処理が可能であるか(active)、同期化処理中であるか(sync)という状態情報を保存している。また、サーバ100がシステムから切り離された場合には、当該サーバ100についてのエントリはサーバ管理表201から削除される。図3にサーバ管理表の一例を示す。サーバ管理表201は、図3に示すように、サーバ100を識別するためのサーバIDと、サーバの稼働状態から構成されている。図3の例では、サーバ100aとサーバ100bとが登録されており、稼働状態は共に正常稼働を示すactiveである。また、本実施形態では、サーバIDとしてサーバ100に付されたIPアドレスを用いた。
The server management table 201 stores state information indicating whether the server is operating normally and whether the query can be processed (active) or is being synchronized (sync). When the server 100 is disconnected from the system, the entry for the server 100 is deleted from the server management table 201. FIG. 3 shows an example of the server management table. As shown in FIG. 3, the server management table 201 is composed of a server ID for identifying the server 100 and an operating state of the server. In the example of FIG. 3, the
トランザクション管理表202は、現在実行中の又は実行開始を保留されているトランザクションの有無を記憶する。図4にトランザクション管理表202の一例を示す。図4に示すように、トランザクション管理表202は、クライアントを一意に識別するクライアントIDとトランザクションを一意に識別するトランザクションIDから構成される。これらのペアは、受信クエリ処理部204がトランザクション開始時にトランザクション管理表202に登録し、応答送信処理部207がトランザクション終了時にトランザクション管理表202から削除する。クライアントIDは、例えばクライアント500等のIPアドレスやポート番号である。トランザクションIDは新しいトランザクションが発生する毎に受信クエリ処理部204が新たに割り振る。
The transaction management table 202 stores the presence / absence of a transaction that is currently being executed or whose execution has been suspended. FIG. 4 shows an example of the transaction management table 202. As shown in FIG. 4, the transaction management table 202 includes a client ID for uniquely identifying a client and a transaction ID for uniquely identifying a transaction. These pairs are registered in the transaction management table 202 by the reception
送信キュー203は、クライアント500等から受信したクエリをサーバ100に送信する際の送信バッファとしての機能を有するとともに、同期化処理時にクライアント500から受信したクエリを差分情報として記憶蓄積する機能とを有するものである。
The
送信キュー203のデータ構造について図5を参照して説明する。送信キュー203は、クライアント500から受信したクエリの内容と、そのクエリの属するトランザクションIDと、各サーバ100への送信状態とを記憶する。トランザクションIDは、トランザクション管理表202から取得される。各サーバ100への送信状態は、システムに属する各サーバ100毎に記憶される。
The data structure of the
送信キュー203の各サーバ100への送信状態は、「未送信」,「送信完了」,「保留」,「保留解除」の4つの値を取りうる。「未送信」は、特に保留することなく当該サーバ100に送信予定であるが未だ送信されていない状態である。「送信完了」は、当該サーバ100への送信が完了した状態である。「保留」は、サーバ100のシステムへの組み込み処理中に、当該サーバ100へ転送されることなく保留されている状態である。「保留解除」は、「保留」状態が解除されたが未送信の状態である。送信キュー203の各エントリは、全てのサーバ100についての送信状態が「送信完了」になり、且つ、当該クエリの属するトランザクションが終了すると送信キュー203から削除される。
The transmission status of the
受信クエリ処理部204は、クライアント500からのクエリをネットワーク400経由で受信すると、当該クエリを解析して新規トランザクションの開始を検出した場合にはトランザクション管理表202に該トランザクションを登録するとともに、サーバ管理表201を参照して受信クエリを送信キュー203に投入する。
When receiving a query from the client 500 via the
受信クエリ処理部204が新規トランザクションの開始を検出する方法は、DBMSの種類によって異なる。例えば前述のPostgreSQLの場合は、トランザクションの開始はクライアント500等が「BEGIN」というSQLを送信した時であり、トランザクションの終了はクライアント500等が「COMMIT」「ROLLBACK」というSQLを送信した時である。また、Oracleの場合は、トランザクションの開始はクライアント500等が有効なSQLを送信したときであり(明示的なトランザクションの開始を宣言するSQLは無い)、トランザクションの終了はクライアント500等が「COMMIT」「ROLLBACK」というSQLを送信した時である。また、サーバ100がAUTO COMMITモードで動作する場合には、クライアント500等から受信したSQL文はそれぞれ1つの独立したトランザクションに属していると解釈できるので、クライアント500等からSQLを受信する毎に、該SQL実行前にトランザクションが開始されるとともにSQL実行後に当該トランザクションが終了したこととして扱うことができる。
The method by which the received
受信クエリ処理部204が受信クエリを送信キュー203に投入する際には以下のようにして各サーバ100についての送信状態を設定する。サーバ管理表201のサーバ稼働状態が「active」である場合には、当該サーバ100については送信状態を「未送信」とする。また、サーバ管理表201のサーバ稼働状態が「sync」の場合であって、当該サーバ100に対するクエリの転送処理が未だ始まっていない場合には、当該サーバ100については送信状態を「保留」とする。すなわち、本実施の形態では、受信クエリを「保留」として送信キュー203に記憶することにより、差分情報の蓄積を図っている。また、サーバ管理表201のサーバ稼働状態が「sync」の場合であって、当該サーバ100に対するクエリの転送処理が始まっている場合には、当該サーバ100については送信状態を「保留解除」とする。
When the reception
クエリ送信処理部205は、送信キュー203を監視して、該送信キュー203に送信状態が「未送信」又は「保留解除」となっているクエリを古いものから順に取り出し、対象となるサーバ100に対して送信するとともに、送信キュー203の送信状態を「送信完了」に更新する。
The query
正当性判定部206は、クエリ送信処理部205で各サーバ100に送信したクエリに対する応答を受信して当該応答の正当性を判定する。この正当性判定は、一台以上のサーバ100間でのクエリ処理の正当性を判定するものである。具体的には、サーバ100が3台以上ある場合には多数決で決める方法や、受信した応答を所定のルールに基づいて判断する方法がある。例えば、クライアント500からの「参照」要求に対して「更新成功」という応答が返ってきた場合、正常であればそのような応答はあり得ないので(参照成功など参照に関する応答のはず)、この応答は正しくないと判断する。また、当該応答に係るパケット中にデータ長フィールドがある場合、このデータ長フィールドの値と実際に受信したパケット長を比較し、異なる場合は正しくないと判断する。また、複数のサーバ100の中からMasterサーバを予め1台決めておき、このサーバ100からの応答を常に正しいと判断する。また、上記複数の方法を併用する方法もある。例えば、3台で多数決を行った結果、応答の中身が全てバラバラであり、多数派の応答を決められない場合はMasterサーバの応答を正しいと判断する。正常稼働しているサーバ100が1つだけの場合は、そのサーバ100からの応答を正常と判断する。なお、正常稼働しているサーバ100の台数はサーバ管理表201を参照することにより認識できる。正当性判定部206は、正当性判定の結果、正当でない応答を返したサーバ100を検出すると、サーバ管理表201及び送信キュー203から当該サーバ100についてのエントリを削除する。これにより、当該サーバ100にはクエリが送信されなくなるので、該サーバ100はシステムから切り離されたことになる。
The
応答送信処理部207は、正当性判定部206において正当と判断された応答であって、該応答の送信元サーバ100の稼働状態が「active」の場合、当該応答の1つを処理要求元のクライアント500等に返す。また、応答送信処理部207は、サーバ100から受信した応答がトランザクションの終了に係るものであるかを検出し、トランザクションの終了に係るものである場合には、当該トランザクションについてのエントリをトランザクション管理表202から削除する。また、応答送信処理部207は、終了したトランザクションに属するクエリであり且つ全てのサーバ100の送信状態が「送信完了」となったものを送信キュー203から削除する。また、応答送信処理部207は、「保留解除」のクエリが送信キュー203からなくなった場合には、「保留解除」となっていたサーバ100について、サーバ管理表201の稼働状態を「active」に更新する。これにより、当該サーバ100はシステムに組み込まれる。なお、システムへの組み込みのタイミングは、正常稼働中のサーバ100においてクエリの実行中であっても構わず、またトランザクションが継続中であっても構わない点に留意されたい。
The response
同期化処理制御部208は、システム外のサーバ100(ここでは便宜上「新規サーバ100」と呼ぶ)をシステムに組み込む際に、該新規サーバ100とシステム内で正常稼働中のサーバとの同期化処理を制御する。ここで、新規サーバ100としては、システムに新たに追加するもの、一旦システムから切り離され再びシステムに組み込むものの双方が含まれる。
The synchronization
同期化処理制御部208は、データベース同期化要求(システムの組み込み要求)を受信すると、(1)当該新規サーバ100について稼働状態を「sync」にしてサーバ管理表201に追加する、(2)送信キュー203の送信状態の欄に当該新規サーバ100についての列を追加する、(3)正常稼働中のサーバ100の中から同期化処理用のサーバを1台を選定して当該サーバ100について送信キュー203の送信状態が「未送信」となっているものは「保留」に更新する、(4)同期化処理用のサーバ100において実行中クエリの処理が完了するまで待機し、同期化処理用のサーバ100において実行中クエリの処理が完了したら該サーバ100のスナップショットを取得してスナップショット記憶部209に保存する処理を開始する、という処理を行う。なお、データベース同期化要求は、仲介装置200に接続したコンソール等などから入力するようにしてもよいし、ネットワークを介して他の装置から入力するようにしてもよい。
Upon receiving the database synchronization request (system integration request), the synchronization processing control unit 208 (1) sets the operating state of the new server 100 to “sync” and adds it to the server management table 201. (2) Transmission A column for the new server 100 is added to the transmission status column of the
また、同期化処理制御部208は、データの整合性を維持するために、前記(1)から(4)のスナップショット作成開始までの処理は1つの処理として取り扱い、排他制御を行う。つまり、同期化処理制御部208は、前記(1)から(4)のスナップショット作成開始までの処理を行っている間は、各処理でアクセスするサーバ管理表201及び送信キュー203に対して、他の機能ブロック(例えば受信クエリ処理部204など)からのアクセスを中断させる。
Also, the synchronization
前記(2)において同期化処理制御部208は、送信キュー203にクエリが残っている場合には、そのクエリについての新規サーバ100の送信状態は全て「保留」とする。前述したように、送信キュー203のエントリは、トランザクションが終了した際に削除される。したがって、送信キュー203に残っているクエリは、トランザクションが終了していないクエリであり、前記(4)で作成されるスナップショットには反映されないものである。前記(2)の処理では、このクエリについての送信状態を「保留」とすることで該クエリを差分情報として保持する。
When the query remains in the
また、同期化処理制御部208は、(5)スナップショットの作成が完了したら、当該スナップショットから新規サーバ100のデータベース101を復元させる、(6)データベース101の復元が完了すると送信キュー203に記憶されている新規サーバ100の欄の全てのクエリについて送信状態を「保留」から「保留解除」に変更する。これにより、クエリ送信処理部205が新規サーバ100に対して差分情報としてクエリの送信を開始する。「保留解除」になっていたクエリの処理が全て終了すると、応答送信処理部207が、当該新規サーバ100について、サーバ管理表201の稼働状態を「active」に更新することにより、新規サーバ100はシステムに組み込まれる。
Further, the synchronization processing control unit 208 (5) restores the
クライアント500は、多重化データベースシステムに対して更新クエリ(データベースを更新するリクエスト)や参照クエリ(データベースの内容を参照するリクエスト)などを発行するものである。 The client 500 issues an update query (request to update the database) and a reference query (request to refer to the contents of the database) to the multiplexed database system.
次に、本実施の形態に係る多重化データベースシステムの動作について図面を参照して説明する。まず、サーバ100aと100bが正常に動作している場合の動作を図6から図8を参照して説明する。
Next, the operation of the multiplexed database system according to the present embodiment will be described with reference to the drawings. First, the operation when the
初期状態では、データベース101aと101bは完全に同一であり、サーバ管理表201は図7のようになっているものとする。また、トランザクション管理表202と送信キュー203は空であるとする。各サーバ100a,100bには、テーブルtest_tableが存在しているとする。
In the initial state, the
クライアント500aが172.17.1.1宛にトランザクション開始SQLを含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS1)。受信クエリ処理部204は、トランザクションが開始されたことを検知し、トランザクション管理表202にクライアント500aのIPアドレスとトランザクション番号を登録する(ステップS2)。図8にこのときのトランザクション管理表202を示す。そして、このパケットに係るクエリを、サーバ管理表201を参照して正常稼働しているサーバ100(ここではサーバ100a及び100b)について送信状態を「未送信」にして送信キュー203に入れる。
When the
クエリ送信処理部205は、送信キュー203から送信状態が「未送信」のクエリを取り出し、対応するサーバ100に該パケットを送信する。ここでは、サーバ100aと100bが正常稼働しているので、サーバ100aとサーバ100bへ該パケットを転送する(それぞれステップS3とS4)。そして、各サーバ100への送信が完了したので各サーバ100について送信キュー203の送信状態を「送信完了」に更新する。正当性判定部206は、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100aから受信するが(ステップS5)、この時点では、未だ全ての応答パケットが揃っているわけではないので(この場合、サーバ100bからの応答パケットが来ていない)、正当性判定部206は何もせずにサーバ100bからの応答パケットを待つ。そして、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100bから受信すると(ステップS6)、これで全ての応答パケットが揃ったので、正当性判定部206はそれらの応答パケットを互いに比較することでサーバ100に障害が発生しているか否かをチェックする(ステップS7)。この場合、2つの応答パケットは共にトランザクションが正常に開始されたことを示すパケットであるため、障害は無いと判断する。そして、応答送信処理部207は正当な応答パケットの1つをクライアント500aに返す(ステップS8)。
The query
次に、クライアント500aは、テーブルtest_tableを更新するSQL(UPDATE)を含んだパケットを172.17.1.1へ送信する(ステップS9)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働しているサーバ100について送信状態を「未送信」にして送信キュー203に入れる。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、各サーバ100へパケットを転送し(それぞれステップS10とS11)、送信キュー203の送信状態を「送信完了」に更新する。サーバ100aは正常にUPDATE成功したことを通知する応答パケットを仲介装置200に送信し、仲介装置200の正当性判定部206がこの応答パケットを受信する(ステップS12)。この時点では全ての応答パケットが全て揃っているわけではないので、正当性判定部206は何もせず待機する。そして、正常にUPDATE成功したことを通知する応答パケットをサーバ100bから受信すると(ステップS13)、これで応答パケットが全て揃ったので、正当性判定部206はそれら応答パケットを互いに比較することでサーバ100に障害が発生しているか否かをチェックする(ステップS14)。この場合、2つの応答パケットは共にUPDATE成功したことを示すパケットであるため、障害は無いと判断する。そして、応答送信処理部207は、正当な応答パケットの1つをクライアント500aへ転送する(ステップS15)。
Next, the
次に、クライアント500aは、テーブルtest_tableへの更新を確定する(実際にデータベースを更新する)SQL(COMMIT)を含んだパケットを172.17.1.1へ送信する(ステップS16)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働しているサーバ100について送信状態を「未送信」にして送信キュー203に入れる。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し各サーバ100へパケットを転送し(それぞれステップS17とS18)、送信キュー203の送信状態を「送信完了」に更新する。サーバ100aは正常にCOMMIT成功したことを通知するパケットを仲介装置200に送信し、仲介装置200の正当性判定部206がこの応答パケットを受信する(ステップS19)。この時点では全ての応答パケットが全て揃っているわけではないので、正当性判定部206は何もせず待機する。そして、正常にCOMMIT成功したことを通知する応答パケットをサーバ100bから受信すると(ステップS20)、これで応答パケットが全て揃ったので、正当性判定部206はそれら応答パケットを互いに比較することでサーバ100に障害が発生しているか否かをチェックする(ステップS21)。この場合、2つの応答パケットは共にCOMMIT成功したことを示すパケットであるため、障害は無いと判断する。応答送信処理部207は、正当な応答パケットの1つをクライアント500aへ転送する(ステップS22)。また、COMMITが正常に完了したことから、トランザクションが終了したことが分かるので、応答送信処理部207はトランザクション管理表202からこのトランザクションの登録を削除するとともに(ステップS23)、全てのサーバ100について送信状態が「送信完了」となっているクエリ(ここでは、「BEGIN」,「UPDATE」,「COMMIT」の3つのクエリ)を送信キュー203から削除する(ステップS23)。このときのトランザクション管理表202及び送信キュー203は再び初期状態(すなわち空)になる。
Next, the
次に、サーバ100bが故障などで障害になった場合の動作を図9から図11を参照して説明する。初期状態では、データベース101aと101bは完全に同一であり、サーバ管理表201は前述した図7のようになっているとする。また、トランザクション管理表202と送信キュー203は空であるとする。
Next, an operation when the
クライアント500aが172.17.1.1宛にトランザクション開始SQL(BEGIN)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS30)。受信クエリ処理部204は、トランザクションが開始されたことを検知し、トランザクション管理表202にクライアント500aのIPアドレスとトランザクション番号を登録する(ステップS31)。図10にこのときのトランザクション管理表202を示す。そして、このパケットに係るクエリを、サーバ管理表201を参照して正常稼働しているサーバ100について送信状態を「未送信」にして送信キュー203に入れる。
When the
クエリ送信処理部205は、送信キュー203から送信状態が「未送信」のクエリを取り出し、対応する各サーバ100に該パケットを転送する(それぞれステップS32とS33)。次いで、送信キュー203の送信状態を「送信完了」に更新する。仲介装置200の正当性判定部206は、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100aから受信するが(ステップS34)、この時点では、未だ全ての応答パケットが揃っているわけではないので(この場合、サーバ100bからの応答パケットが来ていない)、何もせずにサーバ100bからの応答パケットを待つ。そして、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100bから受信すると(ステップS35)、これで全ての応答パケットが揃ったので、正当性判定部206はそれら応答パケットを互いに比較することでサーバ100に障害が発生しているか否かをチェックする(ステップS36)。この場合、2つの応答パケットは共にトランザクションが正常に開始されたことを示すパケットであるため、障害は無いと判断する。そして、応答送信処理部207は、正当な応答パケットの1つをクライアント500aへ転送する(ステップS37)。
The query
ここで、サーバ100bは、ステップS35で応答パケットを返した後、故障などの障害が発生してダウンしたものとする(ステップS38)。
Here, it is assumed that the
次に、クライアント500aは、テーブルtest_tableを更新するSQL(UPDATE)を含んだパケットを172.17.1.1へ送信する(ステップS39)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働しているサーバ100について送信状態を「未送信」にして送信キュー203に入れる。この時点では、仲介装置200はサーバ100bのダウンを知らないので、サーバ100bが正常稼働しているという情報がサーバ管理表201に格納されたままである。したがって、受信クエリ処理部204は、サーバ100aの欄だけでなくサーバ100bの欄についても送信状態を「未送信」にして送信キュー203に受信クエリを格納する。クエリ送信処理部205は、送信キュー203から送信状態が「未送信」のクエリを取り出して各サーバ100a及び100bにパケットを転送する(それぞれステップS40とS41)。次いで、クエリ送信処理部205は、送信キュー203の送信状態を「送信完了」に更新する。サーバ100aは正常にUPDATE成功したことを通知する応答パケットを仲介装置200に送信し、仲介装置200の正当性判定部206がこの応答パケットを受信する(ステップS42)。この時点では応答パケットが全て揃っているわけではないので、正当性判定部206は何もせず待機する。しかし、サーバ100bはダウンしているのでサーバ100bからの応答パケットはいつまで経っても正当性判定部206には届かない。これにより正当性判定部206はタイムアウトし、サーバ100bのダウンを検知する。そして、正当性判定部206はサーバ管理表201からサーバ100bのエントリを削除する(ステップS43)。このときのサーバ管理表201を図11に示す。また、サーバ100bについての送信状態の欄を送信キュー203から削除する。このときの送信キュー203を図12に示す。次に、応答送信処理部207は応答パケットをクライアント500aへ転送する(ステップS44)。ここでは、クライアント500aにとって、サーバ100bが障害になったかどうかは認識せず、今までと同様に仮想サーバ800からサービスを受けることができることに注目すべきである。
Next, the
次に、クライアント500aは、テーブルtest_tableへの更新を確定するSQL(COMMIT)を含んだパケットを172.17.1.1へ送信する(ステップS45)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働しているサーバ100について送信状態を「未送信」にして送信キュー203に入れる。ここでは、サーバ100aについてのみ送信状態が「未送信」で送信キュー203にクエリが記憶される。そして、クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、対応するサーバ、この場合、サーバ100aのみへ該パケットを転送する(ステップS46)。次いで、送信キュー203の送信状態を「送信完了」に更新する。サーバ100aは正常にCOMMIT成功したことを通知する応答パケットを送信し、仲介装置200の正当性判定部206がこの応答パケットを受信する(ステップS47)。ここでは、正常稼働中のサーバ100が1台のみなので正当性判定部206は当該応答パケットを正当と判断し、応答送信処理部207は該応答パケットをクライアント500aへ転送する(ステップS48)。また、COMMITが正常に完了したことから、トランザクションが終了したことが分かるので、応答送信処理部207はトランザクション管理表202からこのトランザクションの登録を削除するとともに(ステップS49)、全てのサーバ100について送信状態が「送信完了」となっているクエリ(ここでは、「BEGIN」,「UPDATE」,「COMMIT」の3つのクエリ)を送信キュー203から削除する(ステップS50)。このときのトランザクション管理表202及び送信キュー203は再び初期状態(すなわち空)になる。
Next, the
次に、新規サーバ100をシステムに組み込む際のデータベースの同期化処理について詳細に説明する。本発明における同期化処理では、仲介装置200が同期化処理開始時において正常稼働しているサーバ100からデータベース101のスナップショットを取得し、このスナップショットを用いて新規サーバ100のデータベース101を復元する。さらに、この処理中に受信したクライアント500からのクエリを仲介装置200において差分情報として蓄積する。この差分情報の蓄積は送信キュー203を利用する。そして、新規サーバ100がスナップショットからのデータベース101の復元が完了したら仲介装置200から差分情報を取得して、この差分情報を処理する。
Next, database synchronization processing when the new server 100 is incorporated into the system will be described in detail. In the synchronization process according to the present invention, the
以下に、サーバ100bをシステムに組み込む場合の同期化動作を図13から図27を参照して説明する。このとき注目すべきポイントは、クライアント500a及び500bに対するサービスを続けたままサーバ100bを追加する、つまり、システムダウンさせずにデータベース101aと101bを同期させることである。
Hereinafter, the synchronization operation when the
データベース101bはデータベース101aと同期がとれていない状態、つまり、同一ではない状態である。例えば、データベース101bは、障害発生直前のデータを保持しているかもしれないし、全く新しいサーバの場合には、データを全く持っていない状態かもしれない。本発明では、前者の場合でも古いデータは削除し、データベース101bはデータを全く保持していないものとしてシステムに組み込む。つまり、古いデータを保持している必要はない。
The
ここでは、サーバ100aのみが正常稼働しているのでサーバ管理表201は図16のようになっているとする。また、トランザクション管理表202は空であるとする。さらに、送信キュー203は空であり、正常稼働中のサーバ100aについてのみ送信状態を記憶する構成となっている。
Here, since only the
図13に示すように、クライアント500aが172.17.1.1宛のトランザクション開始SQL(BEGIN)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS301)。受信クエリ処理部204は、トランザクションが開始されたことを検知し、トランザクション管理表202にクライアント500aのIPアドレスとトランザクション番号を登録する(ステップS302)。図17にこのときのトランザクション管理表202を示す。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働中のサーバ100aについて送信状態を「未送信」にして受信クエリを送信キュー203に入れる(ステップS303)。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、対応するサーバ100aに転送し(ステップS304)、送信キュー203の送信状態を「送信完了」に更新する(ステップS305)。仲介装置200の正当性判定部206は、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100aから受信すると(ステップS306)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207は該応答パケットをクライアント500aへ転送する(ステップS307)。この時の送信キュー203を図18に示す。
As illustrated in FIG. 13, when the
次いで、クライアント500aが172.17.1.1宛に、テーブルtest_tableを更新するSQL(UPDATE)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS308)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働中のサーバ100aについて送信状態を「未送信」にして受信クエリを送信キュー203に入れる(ステップS309)。この時の送信キュー203を図19に示す。
Next, when the
ここで、仲介装置200のコンソール又はネットワークを介して他の端末などからデータベース同期化要求(システムへの組込要求)が入力されたものとする(ステップS310)。
Here, it is assumed that a database synchronization request (request for incorporation into the system) is input from another terminal or the like via the console of the
同期化処理制御部208は、データベース同期化要求があると、サーバ管理表201を参照して同期化用のサーバ100を選定する。ここでは、正常稼働中のサーバ100は1台のみなので、サーバ100aを選定する。そして、送信キュー203のサーバ100aについて送信状態が「未送信」となっているエントリを「保留」に更新する(ステップS311)。また、同期化処理制御部208は、同期化用のサーバ100aにおいて実行中クエリがないことを確認した後に、新規サーバ100bについて稼働状態を「sync」でサーバ管理表201に追加するとともに(ステップS312)、送信キュー203の送信状態の欄に当該サーバ100b用の列を追加する(ステップS313)。ここで、当該サーバ100bの送信状態は全て「保留」に設定する。この時のサーバ管理表201及び送信キュー203を図20,図21に示す。なお、同期化処理制御部208は、上記ステップS311〜S313の処理は1つの処理として取り扱い、排他制御を行う。つまり、ステップS311〜S313の処理中には、各ステップでアクセスするサーバ管理表201及び送信キュー203に対して、他の機能ブロック(例えば受信クエリ処理部204やクエリ送信処理部205など)からのアクセスを中断させる。
When there is a database synchronization request, the synchronization
次いで、同期化処理制御部208は、サーバ100aのデータベース101aのスナップショットの作成を開始する(ステップS314)。スナップショットはスナップショット記憶部209に保存する。本実施の形態ではデータベース101としてPostgreSQLを利用したので、スナップショットの作成ツールとしてはpg_dumpを用いた。
Next, the synchronization
上述したように、本実施の形態で用いるスナップショット作成ツールでは、スナップショット作成中にクエリの処理が可能である。そこで、同期化処理制御部208は、同期化用のサーバ100aについて送信キュー203の各クエリの送信状態を「保留」から「保留解除」に更新する(ステップS315)。この時の送信キュー203を図22に示す。これにより、クエリ送信処理部205による送信キュー203からのクエリの送信が再開する。具体的には、クエリ送信処理部205は、UPDATEクエリを送信キュー203から取り出して同期化用サーバ100aに送信するとともに(ステップS316)、送信状態を「送信完了」に更新する(ステップS317)。正当性判定部206は、当該クエリが正常処理されたことを通知する応答パケットをサーバ100aから受信すると(ステップS318)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207が該応答パケットをクライアント500aへ転送する(ステップS319)。この時の送信キュー203を図23に示す。また、スナップショット作成開始以降、クライアント500から受信したクエリは、同期化用サーバ100aについては「未送信」で、新規サーバ100bについては「保留」で送信キュー203に投入する。
As described above, the snapshot creation tool used in the present embodiment can process a query during snapshot creation. Therefore, the synchronization
ここで、スナップショットの作成処理が完了したものとする(ステップS320)。同期化処理制御部208は、スナップショットの作成処理が完了すると、当該スナップショットを用いて新規サーバ100bのデータベース101bの復元処理を開始する(ステップS321)。本実施の形態ではデータベース101としてPostgreSQLを利用したので、スナップショットからの復元ツールとしてはpsqlを用いた。
Here, it is assumed that the snapshot creation processing has been completed (step S320). When the snapshot creation processing is completed, the synchronization
前述したように、スナップショット作成開始以降、クライアント500から受信したクエリは、同期化用サーバ100aについては「未送信」で、新規サーバ100bについては「保留」で送信キュー203に投入する。図14の例では、受信クエリ処理部204は、クライアント500aからINSERTクエリを受信すると(ステップS322)、同期化用サーバ100aについては「未送信」で、新規サーバ100bについては「保留」で当該エリを送信キュー203に投入する(ステップS323)。この時の送信キュー203を図24に示す。そして、クエリ送信処理部205は、送信状態が「未送信」となっているクエリを取り出して対応する同期化用サーバ100aに転送するとともに(ステップS324)、送信状態を「送信完了」に更新する(ステップS325)。正当性判定部206は、当該クエリが正常処理されたことを通知する応答パケットをサーバ100aから受信すると(ステップS326)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207が該応答パケットをクライアント500aへ転送する(ステップS327)。
As described above, the query received from the client 500 after starting the snapshot creation is put in the
ここで、新規サーバ100bのデータベース101bの復元処理が完了したものとする(ステップS328)。同期化処理制御部208は、新規サーバ100bのデータベース101bのスナップショットからの復元が完了すると、送信キュー203に保留となっているクエリを差分情報として送出すべく、新規サーバ100bについて送信状態が「保留」となっているすべてのクエリを、送信状態「保留解除」に更新する(ステップS329)。この時の送信キュー203を図25に示す。これにより、クエリ送信処理部205による送信キュー203からの差分情報としてのクエリの送信が開始される。具体的には、クエリ送信処理部205は、BEGINクエリを送信キュー203から取り出して新規サーバ100bに送信するとともに(ステップS330)、送信状態を「送信完了」に更新する(ステップS331)。正当性判定部206は、当該クエリが正常処理されたことを通知する応答パケットを新規サーバ100bから受信する(ステップS332)。ここで、当該応答は差分情報としてのクエリの処理応答なので、当該応答はクライアント500へは転送しない。
Here, it is assumed that the restoration process of the
受信クエリ処理部204は、差分情報転送開始以降クライアント500から受信したクエリは、同期化用サーバ100aについては送信状態を「未送信」で、新規サーバ100bについては送信状態を「保留解除」で送信キュー203に投入する。図15の例では、クライアント500aからCOMMITクエリを受信すると(ステップS333)、受信クエリ処理部204は、同期化用サーバ100aについては送信状態を「未送信」で、新規サーバ100bについては送信状態を「保留解除」で送信キュー203に投入する(ステップS334)。この時の送信キュー203を図26に示す。
The received
以降、クエリ送信処理部205は、送信状態が「未送信」及び「保留解除」となっているクエリを対応するサーバ100に送信するとともに送信状態を「送信完了」に更新する。そして、送信状態が「未送信」であったクエリに対する応答に対しては、正当性判定部206が正当性の判定を行うとともに、応答送信処理部207が正当な応答の1つをクライアント500に返す。一方、送信状態が「保留解除」であったクエリに対する応答に対してはクライアント500への転送は行わない。
Thereafter, the query
図15の例では、クエリ送信処理部205は、送信状態が「未送信」であるCOMMITクエリを取り出して対応する同期化用サーバ100aに転送するとともに(ステップS335)、送信状態を「送信完了」に更新する(ステップS336)。正当性判定部206は、当該クエリが正常処理されたことを通知する応答パケットをサーバ100aから受信すると(ステップS337)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207が該応答パケットをクライアント500aへ転送する(ステップS338)。また、このCOMMITクエリの処理によりトランザクションが終了するので、応答送信処理部207は当該トランザクションの登録をトランザクション管理表202から削除する(ステップS339)。
In the example of FIG. 15, the query
また、図15の例では、クエリ送信処理部205は、送信状態が「保留解除」となっているUPDATEクエリ,INSERTクエリ、COMMITクエリを差分情報として順次、新規サーバ100bに転送し、送信状態を「送信完了」に更新する処理を繰り返す(ステップS340〜S348)。差分情報の送出が完了すると、すなわち送信キュー203に送信状態が「保留解除」となっているクエリがなくなると、新規サーバ100bをシステムに組み込むべくサーバ100bについてのサーバ管理表201の稼働状態を「active」に更新する(ステップS349)。この時のサーバ管理表201を図27に示す。
In the example of FIG. 15, the query
このような同期化処理により、もともとシステムに組み込まれていたが障害等のためにシステムから切り離されたサーバであっても、新規のサーバであっても、理論的には幾らでも追加できる。つまり、追加できるサーバ数に制限はない。 By such a synchronization process, any number of servers can be added theoretically, whether they are servers that were originally incorporated in the system or disconnected from the system due to a failure or the like, or new servers. In other words, there is no limit to the number of servers that can be added.
また、仲介装置200において差分情報として送信キュー203に記憶するデータは、同期化要求(システムの組み込み要求)があった後から蓄積を開始するので、仲介装置200において同期化用データが増大することがない。これにより、仲介装置200の記憶容量を節約でき、該記憶容量が溢れることによる障害発生を未然に防止できる。また、サーバ100の切り離しも任意に行うことができる。
In addition, since the data stored in the
したがって、本実施の形態に係る多重化データベースシステムでは、サーバの組み込み及び切り離しを任意に実施できるので、用途や予算などの要求に応じて柔軟なシステム設計を行うことができる。 Therefore, in the multiplexed database system according to the present embodiment, the server can be arbitrarily installed and disconnected, so that a flexible system design can be performed according to the demands such as usage and budget.
(第2の実施の形態)
本発明の第2の実施の形態に係る多重化データベースシステムについて図面を参照して説明する。本実施の形態が前述の第1の実施の形態と異なる点は、仮想サーバ800が3台のサーバ100を備えていること、及び、スナップショットの作成・復元ルーツとしてSQLを用いた汎用的なものを用いる点にある。以下、第1の実施の形態との相違点のみ詳述する。
(Second Embodiment)
A multiplexed database system according to a second embodiment of the present invention will be described with reference to the drawings. This embodiment is different from the first embodiment described above in that the virtual server 800 includes three servers 100 and that the SQL is used as a snapshot creation / restoration root. The point is to use things. Hereinafter, only differences from the first embodiment will be described in detail.
前記第1の実施の形態において同期化処理制御部208は、スナップショットの作成ツールとして、スナップショット作成開始時にコミットされているデータのみがスナップショットに反映され、スナップショット作成中でもクエリの処理が可能であるpg_dumpを用いた。一方、本実施の形態において同期化処理制御部208は、データベース101に対してSELECTなどの一般的なクエリを発行することによりスナップショットを取得し、INSERTクエリ等を発行することによりスナップショットからのデータベース101の復元を行う。このような方法を採用することにより、データベース101の種類に依存しない汎用的なシステムを構築可能となる。
In the first embodiment, the synchronization
ところで、このような汎用的なスナップショットの作成及びデータベースの復元方法では、スナップショット作成開始後に処理された更新クエリがスナップショットに反映するか否かが問題となる。このため、第1の実施の形態のようなシステム構成では、スナップショットの作成中にはクエリの処理を停止する必要がある。そして、これによりクライアント500へのサービス提供が停止してしまうという問題がある。そこで、本実施の形態では、クライアント500に対するサービス継続とスナップショット作成とをそれぞれ別のサーバ100で行うことにより、クライアント500へのサービス提供を継続するようにしている。以下、本実施の形態に係るシステムの動作について詳述する。 By the way, in such a general-purpose snapshot creation and database restoration method, it becomes a problem whether or not an update query processed after the start of snapshot creation is reflected in the snapshot. For this reason, in the system configuration as in the first embodiment, it is necessary to stop query processing while creating a snapshot. This causes a problem that service provision to the client 500 is stopped. Therefore, in the present embodiment, service continuation for the client 500 and snapshot creation are performed by different servers 100 so that service provision to the client 500 is continued. Hereinafter, the operation of the system according to the present embodiment will be described in detail.
ここでは、3台のサーバ100a〜100cのうち1台のサーバ100cがシステムから切り離されている状態から、該サーバ100cをシステムに再び組み込む場合について図28〜図45を参照して説明する。
Here, a case in which one server 100c among the three
初期状態にけるサーバ管理表201を図33に示す。また、トランザクション管理表202は空であるものとする。送信キュー203は空であり図34に示すような構造となっている。
FIG. 33 shows the server management table 201 in the initial state. The transaction management table 202 is assumed to be empty. The
図28に示すように、クライアント500aが172.17.1.1宛のトランザクション開始SQL(BEGIN)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS401)。受信クエリ処理部204は、トランザクションが開始されたことを検知し、トランザクション管理表202にクライアント500aのIPアドレスとトランザクション番号を登録する(ステップS402)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働中のサーバ100a及び100bについて送信状態を「未送信」にして受信クエリを送信キュー203に入れる(ステップS403)。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、対応するサーバ100a及び100bに転送し(ステップS404,S405)、それぞれ送信キュー203の送信状態を「送信完了」に更新する(ステップS406)。仲介装置200の正当性判定部206は、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100a及び100bから受信すると(ステップS407,S408)、各サーバ100a及び100bからの応答パケットの正当性を判定する。そして、応答送信処理部207は正当な応答パケットの1つをクライアント500aへ転送する(ステップS409)。この時の送信キュー203を図35に示す。
As illustrated in FIG. 28, when the
次いで、クライアント500aが172.17.1.1宛に、テーブルtest_tableを更新するSQL(UPDATE)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS410)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働中のサーバ100a及び100bについて送信状態を「未送信」にして受信クエリを送信キュー203に入れる(ステップS411)。この時の送信キュー203を図36に示す。
Next, when the
ここで、仲介装置200のコンソール又はネットワークを介して他の端末などからデータベース同期化要求(システムへの組込要求)が入力されたものとする(ステップS412)。
Here, it is assumed that a database synchronization request (request for incorporation into the system) is input from another terminal or the like via the console of the
同期化処理制御部208は、データベース同期化要求があると、サーバ管理表201を参照して同期化用のサーバ100を1台選定する。ここでは、正常稼働中のサーバ100は2台なので、何れか一方のサーバを所定の規則に従って選定する。本実施の形態では、サーバ100bを同期化用サーバとして選定したものとする。同期化処理制御部208は、サーバ管理表201のサーバ100bについての稼働状態を「sync」に更新するとともに(ステップS413)、送信キュー203のサーバ100bについて送信状態が「未送信」となっているエントリを「保留」に更新する(ステップS414)。また、同期化処理制御部208は、同期化用のサーバ100bにおいて実行中クエリの処理が完了したことを確認した後に、要求元のサーバ100cについて稼働状態を「sync」でサーバ管理表201に追加するとともに(ステップS415)、送信キュー203の送信状態の欄に当該サーバ100c用の列を追加する(ステップS416)。ここで、当該サーバ100cの送信状態は全て「保留」に設定する。この時のサーバ管理表201及び送信キュー203を図37,図38に示す。なお、同期化処理制御部208は、上記ステップS413〜S416の処理は1つの処理として取り扱い、排他制御を行う。つまり、ステップS413〜S416の処理中には、各ステップでアクセスするサーバ管理表201及び送信キュー203に対して、他の機能ブロック(例えば受信クエリ処理部204やクエリ送信処理部205など)からのアクセスを中断させる。
When there is a database synchronization request, the synchronization
次いで、同期化処理制御部208は、サーバ100bのデータベース101bのスナップショットの作成を開始する(ステップS417)。スナップショットはスナップショット記憶部209に保存する。本実施の形態では前述したようにSELECTクエリを使ってデータベース101bの各テーブルのデータ等を取得する。
Next, the synchronization
同期化処理制御部208が上記ステップS413〜S416の排他処理を終えると、図29に示すように、クエリ送信処理部205は、送信キュー203から送信状態が「未送信」のクエリを取り出し、対応するサーバ100aに転送するとともに(ステップS418)、送信キュー203の送信状態を「送信完了」に更新する(ステップS419)。仲介装置200の受信クエリ処理部204は、UPDATEが正常に処理されたことを通知する応答パケットをサーバ100aから受信すると(ステップS420)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207は該応答パケットのクライアント500aへ転送する(ステップS421)。
When the synchronization
また、クライアント500bが172.17.1.1宛のトランザクション開始SQL(BEGIN)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS422)。受信クエリ処理部204は、トランザクションが開始されたことを検知し、トランザクション管理表202にクライアント500bのIPアドレスとトランザクション番号を登録する(ステップS423)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働中のサーバ100aについて送信状態を「未送信」にするとともに、同期化処理中のサーバ100b及び100cについて送信状態を「保留」にして受信クエリを送信キュー203に入れる(ステップS424)。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、送信状態が「未送信」であるサーバ100aに転送し(ステップS425)、送信キュー203のサーバ100aについての送信状態を「送信完了」に更新する(ステップS426)。仲介装置200の正当性判定部206は、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100aから受信すると(ステップS427)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207は該応答パケットのクライアント500bへ転送する(ステップS428)。この時の送信キュー203を図39に示す。
When the
ここで、スナップショットの作成処理が完了したものとする(ステップS429)。同期化処理制御部208は、スナップショットの作成処理が完了すると、当該スナップショットを用いて新規サーバ100cのデータベース101cの復元処理を開始する(ステップS430)。本実施の形態では、INSERTクエリ等を新規サーバ100cに発行することによりスナップショットからのデータベース101の復元を図る。
Here, it is assumed that the snapshot creation processing has been completed (step S429). When the snapshot creation processing is completed, the synchronization
また、スナップショットの作成処理が完了すると、同期化処理制御部208は、該サーバ100bについて送信キュー203の送信状態が「保留」となっているものを「保留解除」に更新する(ステップS431)。この時の送信キュー203を図40に示す。以降、各クライアント500から受信したクエリは、サーバ100aについては送信状態を「未送信」で、サーバ100bについては送信状態を「保留解除」で、サーバ100cについては送信状態を「保留」にして送信キュー203に入れる。これにより、クエリ送信処理部205は、送信状態が「保留解除」となったクエリを差分情報として古いものから順にサーバ100bに送信する。
When the snapshot creation processing is completed, the synchronization
具体的には、クエリ送信処理部205は、送信キュー203からUPDATEクエリを取り出してサーバ100bに転送するとともに(ステップS432)、送信キュー203の送信状態を「送信完了」に更新する(ステップS433)。仲介装置200の正当性判定部206は、更新が正常に処理されたことを通知する応答パケットをサーバ100bから受信する(ステップS434)。ここで、当該応答は差分情報としてのクエリの処理応答なので、当該応答はクライアント500へは転送しない。
Specifically, the query
ここで、クライアント500bがINSERTクエリを仲介装置200に送信すると(ステップS435)、前述したように、仲介装置200の受信クエリ処理部204は、サーバ100aについては送信状態を「未送信」で、サーバ100bについては送信状態を「保留解除」で、サーバ100cについては送信状態を「保留」で当該クエリを送信キューに投入する(ステップS436)。この時の送信キュー203を図41に示す。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、送信状態が「未送信」であるサーバ100aに対して転送するとともに(ステップS437)、送信キュー203のサーバ100aについての送信状態を「送信完了」に更新する(ステップS438)。正当性判定部206は、INSERTが正常に処理されたことを通知するパケットをサーバ100aから受信すると(ステップS439)、ここでは、正常稼働中のサーバ100が1台のみなので当該応答パケットを正当と判断し、応答送信処理部207は該応答パケットをクライアント500bへ転送する(ステップS440)。
Here, when the
図41に示すように、この時点では送信キュー203において送信状態が「保留解除」になったクエリは、BEGINクエリとINSERTクエリの2つである。仲介装置200は、前述のステップS432〜S434と同様にして、当該2つのクエリを処理する(ステップS441〜S446)。
As shown in FIG. 41, at this time, there are two queries, the BEGIN query and the INSERT query, whose transmission status is “pending release” in the
以上でサーバ100bに対しては、全ての差分情報の転送が終了し(すなわち送信キュー203から「保留解除」のクエリを全て送出し終わり)、且つ、差分情報としてのクエリの処理が正常に処理されたことになるので、サーバ100aのデータベース101aとサーバ100bのデータベース101bの同期化が完了したことになる。そこで、仲介装置200の応答送信処理部207は、サーバ100bをシステムに組み込むべくサーバ100bについてのサーバ管理表201の稼働状態を「active」に更新する(ステップS447)。なお、システムへの組み込みのタイミングは、正常稼働中のサーバ100aにおいてクエリの実行中であっても構わず、またトランザクションが継続中であっても構わない点に留意されたい。
As described above, the transfer of all the difference information to the
以降、クライアント500からのクエリは、サーバ100a及びサーバ100bについては送信状態を「未送信」で、サーバ100cについては送信状態を「保留」にして送信キュー203に入れる。具体的には、図30に示すように、クライアント500aが172.17.1.1宛のトランザクション確定SQL(COMMIT)を含んだパケットを送信すると、仲介装置200の受信クエリ処理部204はそのパケットを受信する(ステップS448)。受信クエリ処理部204は、サーバ管理表201を参照して正常稼働中のサーバ100a及び100bについては送信状態を「未送信」に、同期化処理中のサーバ100cについては送信状態を「保留」にして受信クエリを送信キュー203に入れる(ステップS449)。この時の送信キュー203を図42に示す。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、対応するサーバ100a及び100bに転送し(ステップS450,S451)、それぞれ送信キュー203の送信状態を「送信完了」に更新する(ステップS452)。仲介装置200の正当性判定部206は、トランザクションが正常にCOMMITされたことを通知する応答パケットをサーバ100a及び100bから受信すると(ステップS453,S454)、各サーバ100a及び100bからの応答パケットの正当性を判定する。そして、応答送信処理部207は正当な応答パケットの1つをクライアント500aへ転送する(ステップS455)。また、COMMITが正常に完了したことから、トランザクションが終了したことが分かるので、応答送信処理部207はトランザクション管理表202からこのトランザクションの登録を削除する(ステップS456)。
Thereafter, the query from the client 500 is placed in the
ここで、新規サーバ100cのデータベース101cの復元処理が完了したものとする(ステップS457)。同期化処理制御部208は、新規サーバ100cのデータベース101cのスナップショットからの復元が完了すると、送信キュー203に保留となっているクエリを差分情報として送出すべく、新規サーバ100cについて送信キュー203の送信状態が「保留」となっているものを「保留解除」に更新する(ステップS458)。この時の送信キュー203を図43に示す。以降、各クライアント500から受信したクエリは、サーバ100a及びサーバ100bについては送信状態を「未送信」で、サーバ100cについては送信状態を「保留解除」にして送信キュー203に入れる。これにより、クエリ送信処理部205は、送信状態が「保留解除」となったクエリを差分情報として古いものから順にサーバ100cに送信する。
Here, it is assumed that the restoration processing of the database 101c of the new server 100c has been completed (step S457). When the restoration from the snapshot of the database 101c of the new server 100c is completed, the synchronization
具体的には、クエリ送信処理部205は、送信キュー203からBEGINクエリを取り出してサーバ100cに転送するとともに(ステップS459)、送信キュー203の送信状態を「送信完了」に更新する(ステップS460)。仲介装置200の正当性判定部206は、トランザクションが正常に開始されたことを通知する応答パケットをサーバ100cから受信する(ステップS461)。ここで、当該応答は差分情報としてのクエリの処理応答なので、当該応答はクライアント500へは転送しない。
Specifically, the query
サーバ100cへの差分情報転送中にクライアント500bからUPDATEクエリを受信すると(ステップS462)、受信クエリ処理部204は、サーバ100a及び100bについては送信状態を「未送信」で、サーバ100cについては送信状態を「保留解除」で当該クエリーを送信キュー203に投入する(ステップS463)。この時の送信キュー203を図44に示す。クエリ送信処理部205は、送信キュー203から当該クエリを取り出し、送信状態が「未送信」であるサーバ100a及び100bに転送し(ステップS464,S465)、それぞれのサーバ100a及び100bについて送信キュー203の送信状態を「送信完了」に更新する(ステップS466)。正当性判定部206は、各サーバ100a及び100bからUPDATEが正常に処理されたことを通知するパケットを受信すると(ステップS467,S468)、各応答の正当性を判定して正当な応答の1つをクライアント500bに返す(ステップS469)。
When the UPDATE query is received from the
全ての差分情報の転送が終了し(すなわち送信キュー203から「保留解除」のクエリを全て送出し終わり)、且つ、差分情報としてのクエリの処理が正常に処理された時点で、サーバ100aのデータベース101aとサーバ100cのデータベース101cの同期化が完了するので、サーバ100cをシステムに組み込むべくサーバ100cについてのサーバ管理表201の稼働状態を「active」に更新する。なお、システムへの組み込みのタイミングは、正常稼働中のサーバ100においてクエリの実行中であっても構わず、またトランザクションが継続中であっても構わない点に留意されたい。
When the transfer of all the difference information is completed (that is, the transmission of all the “hold release” queries from the
図44の例では、まず、トランザクションIDが5番のUPDATEクエリからトランザクションIDが6番のINSERTクエリについて、前述のステップS459〜S461と同様の処理を行う。以下、図44の例における、トランザクションIDが5番のCOMMITクエリと、トランザクションIDが6番のUPDATEクエリの処理について詳述する。 In the example of FIG. 44, first, the same processing as in steps S459 to S461 described above is performed for the INSERT query with the transaction ID No. 6 from the UPDATE query with the transaction ID No. 5. The processing of the COMMIT query with the transaction ID No. 5 and the UPDATE query with the transaction ID No. 6 in the example of FIG. 44 will be described in detail below.
クエリ送信処理部205は、送信キュー203からCOMMITクエリを取り出してサーバ100cに転送するとともに(ステップS490)、送信キュー203の送信状態を「送信完了」に更新する(ステップS491)。仲介装置200の正当性判定部206は、トランザクションが確定したことを通知する応答パケットをサーバ100cから受信する(ステップS492)。ここで、当該応答は差分情報としてのクエリの処理応答なので、当該応答はクライアント500へは転送しない。
The query
この時点でトランザクションID5のトランザクションは全てのサーバ100において処理が終了し、且つ、送信キュー203にはトランザクションID5に属する各クエリは全てのサーバ100a,100b,100cについて送信状態が「送信完了」となったので、応答送信処理部207は、当該トランザクションに属するクエリのエントリを送信キュー203から削除する(ステップS493)。この時の送信キュー203を図45に示す。
At this time, the transaction with
次いで、図32に示すように、クエリ送信処理部205は、送信キュー203からUPDATEクエリを取り出してサーバ100cに転送するとともに(ステップS494)、送信キュー203の送信状態を「送信完了」に更新する(ステップS495)。仲介装置200の正当性判定部206は、UPDATEが正常に処理されたことを通知する応答パケットをサーバ100cから受信する(ステップS496)。ここで、当該応答は差分情報としてのクエリの処理応答なので、当該応答はクライアント500へは転送しない。
Next, as shown in FIG. 32, the query
この時点で送信キュー203には送信状態が「保留解除」のクエリがなくなったので、応答送信処理部207は、サーバ100cをシステムに組み込むべくサーバ100cについてのサーバ管理表201の稼働状態を「active」に更新する(ステップS497)。
At this point, since there is no query in the
以上のように本実施の形態では、スナップショットの作成方法として、該スナップショットの作成中にはクエリの処理を行うことができない方法を採用しているが、スナップショットの作成とクライアントからのクエリの処理を別々のサーバで処理することにより、クライアントへのサービスの提供を維持しつつ同期化処理を行うことができる。他の作用・効果については第1の実施の形態と同じである。 As described above, in this embodiment, as a snapshot creation method, a method in which query processing cannot be performed during creation of the snapshot is employed. By processing these processes with separate servers, the synchronization process can be performed while maintaining the provision of services to the clients. Other operations and effects are the same as those in the first embodiment.
なお、本実施の形態では、スナップショットを作成する同期化用のサーバ100bと、システムに再び組み込まれるサーバ100cとに対して、それぞれ独立したタイミングで差分情報を転送していたが、サーバ100cにおいてデータベースの復旧が完了した後に両サーバ100b,100cに対して同一の差分情報を転送するようにしてもよい。
In this embodiment, the difference information is transferred to the
また、本実施の形態では、システムに再び組み込まれるサーバ100cにおいてデータベースの復旧が完了した後に仲介装置200からサーバ100cに差分情報の転送を開始していたが、サーバ100cに差分情報を一時蓄積する機能がある場合にはデータベースの復旧完了を待たずに差分情報の転送を開始しても良い。これにより、仲介装置200からサーバ100への差分情報の転送速度を抑えられるので、差分情報転送によるトラフィック増大を防止できる。
Further, in the present embodiment, transfer of difference information from the
以上、本発明の実施形態について詳述したが、上記実施の形態は例示的なものであり、本発明はこれに限定されるものではない。本発明の範囲は特許請求の範囲に示されており、この特許請求の範囲の意味に入る全ての変形例は本発明に含まれるものである。なお、以下の各変形例は適宜組み合わせて上記各実施の形態に適用できる。 As mentioned above, although embodiment of this invention was explained in full detail, the said embodiment is an illustration and this invention is not limited to this. The scope of the invention is set forth in the appended claims, and all modifications that come within the meaning of the claims are intended to be embraced by the invention. Note that the following modifications can be applied to the above-described embodiments in appropriate combinations.
例えば、上記実施の形態の構成に加えて、仲介装置200が、差分情報として新規サーバ100等で処理されたクエリの処理結果の正当性を判定するようにしても良い。具体的には、仲介装置200は、正常稼働中のサーバ100におけるクエリの処理結果を仲介装置200において保存しておく。そして、当該クエリを差分情報として新規サーバ100等で処理された際に、新規サーバ100等での処理結果と正常稼働中のサーバ100での処理結果とを比較する。そして、両者が一致しない場合には、同期化処理を直ちに又は適当なタイミングで再試行すると好適である。
For example, in addition to the configuration of the above embodiment, the
また、上記実施の形態では、送信状態が「保留解除」となっているクエリを送信キュー203から取り出して差分情報としてサーバ100に対して転送し、該転送中にクライアント500からクエリを受信すると、当該サーバ100についての送信状態を「保留解除」にして送信キュー203に投入する処理を行っている。そして、送信状態が「保留解除」となっているクエリが全てサーバ100において処理された後に当該サーバ100をシステムに組み込む処理を行っている。このような処理では、クライアント500からのクエリ受信頻度が高いとサーバ100のシステムへの組み込みに時間を要することが考えられる。そこで、例えば送信キュー203に送信状態が「保留解除」として記憶されているクエリが所定数以下となったら、受信クエリ処理部204が送信キュー203へのクエリの投入を一時停止するなど所定条件で差分情報の転送処理を優先させるようにしてもよい。
Further, in the above embodiment, when a query whose transmission state is “hold release” is taken out from the
また、上記実施の形態では、クライアント500から受信した全てのクエリを送信キュー203に保存しておき、同期化処理時には該送信キュー203に保存されているクエリを差分情報としてサーバ100に転送しているが、SELECTクエリのようにデータベース101の更新を行わない参照系クエリについては差分情報としてのサーバ100への転送を行わないようにしてもよい。これにより、同期化処理の処理時間を短縮化できる。
In the above embodiment, all queries received from the client 500 are stored in the
さらに、UPDATEクエリのようにデータベース101の更新を行う更新系クエリのみを転送し、参照系クエリやトランザクション制御クエリ(BEGIN,ROLLBACK等)の転送を行わないようにしてもよい。そして、当該更新系クエリを差分情報としてサーバ100に転送する際には、サーバ100においてAutoCommitモードで当該クエリを処理させるようにする。これにより、更に同期化処理の短縮化及び記憶容量の節約が可能となる。ただし、この場合にはサーバ100に対してクエリを転送する順序が、正常稼働中のサーバ100で処理された順序と一致することを保証する必要がある。これを実現するためには、各更新系クエリに対する正常稼働中サーバ100からの処理応答から正常稼働中サーバ100における各クエリの実際の処理順序を把握し、当該順序に従って各クエリを転送すればよい。
Further, only an update query that updates the
また、上記実施の形態では、サーバ100においてトランザクションが継続中であっても仲介装置200がスナップショットの作成を開始していたが、継続中のトランザクションが無くなった時点でスナップショットの作成指示を送信するようにしてもよい。これにより、データベース101として、トランザクションの継続中にはスナップショットの作成ができないものや、トランザクションの継続中であってもスナップショットの作成は開始できるが当該スナップショットにトランザクションに係るクエリが反映されるか否かが不確定なものを利用することができる。
In the above-described embodiment, the
また、上記の実施の形態では、同期化処理中に送信キュー203から各クエリを削除するタイミングは、当該クエリが属するトランザクションが全てのサーバ100において終了した時点としていた。この方法では、通常動作時におけるクエリの削除タイミングと同じなので実装が容易であるという利点がある。一方、同期化処理中には、送信キュー203のクエリが差分情報としてサーバ100において処理されたら随時削除するようにしてもよい。また、同期化処理が完了した後に一括して削除するようにしても良い。
Further, in the above embodiment, the timing for deleting each query from the
また、上記の実施の形態では、クエリのバッファリング機能と同期化処理用の差分情報の記憶機能とを送信キュー203に統合させていたが、それぞれ機能毎に記憶手段を設けるようにしてもよい。なお、この場合には、サーバ100が3台構成となっているときには、システムに組み込もうとするサーバ100と、同期化処理用サーバ100とで差分情報記憶部を共有できるので、記憶容量を節約できるという点で有利である。
In the above-described embodiment, the query buffering function and the synchronization information storage function for synchronization processing are integrated in the
また、上記の実施の形態に加えて更に、各サーバ100にデータベース101やデータベース制御部102の障害を検出する障害検出手段を設けてもよい。この障害検出手段は、データベース101やデータベース制御部102の動作を定期的に監視することで障害を検出し、障害検出時には仲介装置200に障害発生を通知する。これにより、仲介装置200では各サーバ100やネットワークでの障害発生検出をより確実且つ効率的に行うことができる。
Further, in addition to the above-described embodiment, each server 100 may be provided with a failure detection unit that detects a failure of the
また、各サーバは要求に応じて同じ応答をするならば同じ実装である必要はない。すなわち、バージョン、仕様、プログラム言語、コンパイラの種類、コンパイラオプション、ハードウェアかソフトウェアか、などが異なっていてもよい。サーバには、PostgreSQLなどのフリーソフトウェアやOracleなどの市販のソフトウェア、独自開発のソフトウェア、いずれを使ってもよい。また、それらが混在していてもよい。例えば、サーバ100aはPostgreSQLでサーバ100bはOracleでも良い。
In addition, if each server responds in response to a request, it does not have to be the same implementation. That is, the version, specifications, programming language, compiler type, compiler options, hardware or software, and the like may be different. For the server, free software such as PostgreSQL, commercially available software such as Oracle, or proprietary software may be used. Moreover, they may be mixed. For example, the
また、上記実施の形態では、サーバはパソコン上のソフトウェアで実現しているが、ハードウェアで実装しても良い。 In the above-described embodiment, the server is realized by software on a personal computer, but may be implemented by hardware.
また、上記実施の形態では、仮想サーバ800を構成する仲介装置200は1台のみであったが、複数台設けて冗長性を持たせることにより、より可用性の高い構成とすることも可能である。仲介装置を多重化させる技術については、例えば本願出願人による特開2003−345679号公報に記載されたものなどを用いればよい。
In the above embodiment, only one
また、上記実施の形態では、クライアント500とサーバ100はそれぞれ別のネットワーク300,400に属するようにし、仲介装置200が両ネットワーク300,400を仲介するようなネットワーク構成としたが、本発明ではネットワーク構成は不問である。例えば、1つのネットワークにクライアント500,サーバ100,仲介装置200が属するように構成してもよい。
In the above embodiment, the client 500 and the server 100 belong to
100…サーバ、101…データベース、102…データベース制御部、200…仲介装置、201…サーバ管理表、202…トランザクション管理表、203…送信キュー、204…受信クエリ処理部、205…クエリ送信処理部、206…正当性判定部、207…応答送信処理部、208…同期化処理制御部、209…スナップショット記憶部、300,400…ネットワーク、500…クライアント DESCRIPTION OF SYMBOLS 100 ... Server, 101 ... Database, 102 ... Database control part, 200 ... Mediation apparatus, 201 ... Server management table, 202 ... Transaction management table, 203 ... Transmission queue, 204 ... Reception query processing part, 205 ... Query transmission processing part, 206 ... Validity determination unit, 207 ... Response transmission processing unit, 208 ... Synchronization processing control unit, 209 ... Snapshot storage unit, 300, 400 ... Network, 500 ... Client
Claims (8)
仲介装置は、
クライアントコンピュータからの処理要求を差分情報として記憶する差分情報記憶部と、データベースのスナップショットを記憶するスナップショット記憶部とを備え、
新規データベースサーバの組込要求があると、
(a)正常稼働中のデータベースサーバからデータベースのスナップショットを取得してスナップショット記憶部に記憶する処理を開始し、
(b)クライアントコンピュータから受信する処理要求を差分情報として差分情報記憶部に順次記憶し、
(c)スナップショットの取得を完了するとスナップショット記憶部に記憶したスナップショットを用いて新規データベースサーバのデータベースを復元させ、
(d)新規データベースサーバにおいて前記スナップショットからのデータベースの復元が完了すると、差分情報記憶部に記憶されている処理要求を新規データベースサーバに順次送出し、
(e)差分情報記憶部に記憶されている処理要求について新規データベースにおいて処理が終了すると新規データベースサーバをシステムに組み込む
ことを特徴とする多重化データベースシステムにおける同期化方法。 In a multiplexed database system comprising a plurality of database servers and an intermediary device that relays processing requests from client computers to each database server and returns one of the valid responses from each database server as a processing result to the client computer A method of synchronizing each database server when a new or disconnected database server (hereinafter referred to as “new database server”) is incorporated into the system,
The intermediary device
A difference information storage unit that stores a processing request from a client computer as difference information, and a snapshot storage unit that stores a snapshot of a database;
When there is a request to install a new database server,
(A) Start processing to acquire a snapshot of the database from the database server that is operating normally and store it in the snapshot storage unit,
(B) The processing request received from the client computer is sequentially stored in the difference information storage unit as difference information,
(C) When the acquisition of the snapshot is completed, the database of the new database server is restored using the snapshot stored in the snapshot storage unit,
(D) When the restoration of the database from the snapshot is completed in the new database server, the processing requests stored in the difference information storage unit are sequentially sent to the new database server,
(E) A synchronization method in a multiplexed database system, wherein a new database server is incorporated into the system when processing for the processing request stored in the difference information storage unit is completed in the new database.
ことを特徴とする請求項1記載の多重化データベースシステムにおける同期化方法。 2. The synchronization method in a multiplexed database system according to claim 1, wherein in the step (b), the intermediary device sequentially stores processing requests not reflected in the snapshot as difference information in the difference information storage unit.
ことを特徴とする請求項2記載の多重化データベースシステムにおける同期化方法。 3. The multiplexing according to claim 2, wherein the intermediary device stores, in the step (b), a processing request related to a transaction that has not been committed in a server that is operating normally at the time of the incorporation request, retroactively from the time of the incorporation request. A synchronization method in a database system.
ことを特徴とする請求項1記載の多重化データベースシステムにおける同期化方法。 2. The synchronization method in a multiplexed database system according to claim 1, wherein, in the step (a), the intermediary device starts acquiring a snapshot when a transaction is not processed in a normally operating server. 3. .
ことを特徴とする請求項1記載の多重化データベースシステムにおける同期化方法。 When there are two or more database servers in normal operation, the mediation device selects one database server as a synchronization database server, acquires a snapshot from the synchronization database server, and creates a snapshot. 2. The synchronization method in a multiplexed database system according to claim 1, wherein the processing request received from the client is relayed to another normally operating database server.
仲介装置は、
クライアントコンピュータからの処理要求を差分情報として記憶する差分情報記憶部と、
データベースのスナップショットを記憶するスナップショット記憶部と、
新規の又はこのシステムから切り離されたデータベースサーバ(以降「新規データベースサーバ」と言う)のシステムへの組込要求があると、(a)正常稼働中のデータベースサーバからデータベースのスナップショットを取得してスナップショット記憶部に記憶する処理を開始し、(b)クライアントコンピュータから受信する処理要求を差分情報として差分情報記憶部に順次記憶し、(c)スナップショットの取得を完了するとスナップショット記憶部に記憶したスナップショットを用いて新規データベースサーバのデータベースを復元させ、(d)新規データベースサーバにおいて前記スナップショットからのデータベースの復元が完了すると、差分情報記憶部に記憶されている処理要求を新規データベースサーバに順次送出し、(e)差分情報記憶部に記憶されている処理要求について新規データベースにおいて処理が終了すると新規データベースサーバをシステムに組み込む制御部とを備えた
ことを特徴とする多重化データベースシステム。 In a multiplexed database system comprising a plurality of database servers and an intermediary device that relays processing requests from client computers to each database server and returns one of the valid responses from each database server as a processing result to the client computer ,
The intermediary device
A difference information storage unit for storing a processing request from the client computer as difference information;
A snapshot storage unit for storing database snapshots;
When there is a request to incorporate a new or disconnected database server (hereinafter referred to as “new database server”) into the system, (a) a database snapshot is obtained from the database server that is operating normally. Starts processing to be stored in the snapshot storage unit, (b) sequentially stores processing requests received from the client computer as difference information in the difference information storage unit, and (c) completes acquisition of the snapshot in the snapshot storage unit. The database of the new database server is restored using the stored snapshot, and (d) when restoration of the database from the snapshot is completed in the new database server, the processing request stored in the difference information storage unit is transferred to the new database server To (e Multiplexing database system is characterized in that a control unit incorporating the process in the new database is completed a new database server system for processing requests stored in the difference information storage unit.
クライアントコンピュータからの処理要求を差分情報として記憶する差分情報記憶部と、
データベースのスナップショットを記憶するスナップショット記憶部と、
新規の又はこのシステムから切り離されたデータベースサーバ(以降「新規データベースサーバ」と言う)のシステムへの組込要求があると、(a)正常稼働中のデータベースサーバからデータベースのスナップショットを取得してスナップショット記憶部に記憶する処理を開始し、(b)クライアントコンピュータから受信する処理要求を差分情報として差分情報記憶部に順次記憶し、(c)スナップショットの取得を完了するとスナップショット記憶部に記憶したスナップショットを用いて新規データベースサーバのデータベースを復元させ、(d)新規データベースサーバにおいて前記スナップショットからのデータベースの復元が完了すると、差分情報記憶部に記憶されている処理要求を新規データベースサーバに順次送出し、(e)差分情報記憶部に記憶されている処理要求について新規データベースにおいて処理が終了すると新規データベースサーバをシステムに組み込む制御部とを備えた
ことを特徴とする仲介装置。 In a multiplexed database system comprising a plurality of database servers and an intermediary device that relays processing requests from client computers to each database server and returns one of the valid responses from each database server to the client computer as a processing result An intermediary device,
A difference information storage unit for storing a processing request from the client computer as difference information;
A snapshot storage unit for storing database snapshots;
When there is a request to incorporate a new or disconnected database server (hereinafter referred to as “new database server”) into the system, (a) a database snapshot is obtained from the database server that is operating normally. Processing to be stored in the snapshot storage unit is started, (b) processing requests received from the client computer are sequentially stored as difference information in the difference information storage unit, and (c) snapshot acquisition is completed when acquisition of the snapshot is completed. The database of the new database server is restored using the stored snapshot, and (d) when the restoration of the database from the snapshot is completed in the new database server, the processing request stored in the difference information storage unit is transferred to the new database server To (e Intermediary device being characterized in that a control unit incorporating a new database server system when the processing request stored in the difference information memory section processed in the new database ends.
コンピュータを、
クライアントコンピュータからの処理要求を差分情報として記憶する差分情報記憶部と、
データベースのスナップショットを記憶するスナップショット記憶部と、
新規の又はこのシステムから切り離されたデータベースサーバ(以降「新規データベースサーバ」と言う)のシステムへの組込要求があると、(a)正常稼働中のデータベースサーバからデータベースのスナップショットを取得してスナップショット記憶部に記憶する処理を開始し、(b)クライアントコンピュータから受信する処理要求を差分情報として差分情報記憶部に順次記憶し、(c)スナップショットの取得を完了するとスナップショット記憶部に記憶したスナップショットを用いて新規データベースサーバのデータベースを復元させ、(d)新規データベースサーバにおいて前記スナップショットからのデータベースの復元が完了すると、差分情報記憶部に記憶されている処理要求を新規データベースサーバに順次送出し、(e)差分情報記憶部に記憶されている処理要求について新規データベースにおいて処理が終了すると新規データベースサーバをシステムに組み込む制御部として機能させる
ことを特徴とする仲介プログラム。 In a multiplexed database system comprising a plurality of database servers and an intermediary device that relays processing requests from client computers to each database server and returns one of the valid responses from each database server to the client computer as a processing result A program for realizing an intermediary device,
Computer
A difference information storage unit for storing a processing request from the client computer as difference information;
A snapshot storage unit for storing database snapshots;
When there is a request to incorporate a new or disconnected database server (hereinafter referred to as “new database server”) into the system, (a) a database snapshot is obtained from the database server that is operating normally. Processing to be stored in the snapshot storage unit is started, (b) processing requests received from the client computer are sequentially stored as difference information in the difference information storage unit, and (c) snapshot acquisition is completed when acquisition of the snapshot is completed. The database of the new database server is restored using the stored snapshot, and (d) when restoration of the database from the snapshot is completed in the new database server, the processing request stored in the difference information storage unit is transferred to the new database server To (e Intermediation program, characterized in that the processing request stored in the difference information storage unit process in the new database to function as a control unit incorporating a new database server system upon completion.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005159578A JP2006338145A (en) | 2005-05-31 | 2005-05-31 | Multiplex database system, synchronization method thereof, intermediation device and intermediation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005159578A JP2006338145A (en) | 2005-05-31 | 2005-05-31 | Multiplex database system, synchronization method thereof, intermediation device and intermediation program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006338145A true JP2006338145A (en) | 2006-12-14 |
Family
ID=37558675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005159578A Pending JP2006338145A (en) | 2005-05-31 | 2005-05-31 | Multiplex database system, synchronization method thereof, intermediation device and intermediation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006338145A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217641A (en) * | 2007-03-07 | 2008-09-18 | Nec Corp | Replication method, storage device and program |
JP2009252149A (en) * | 2008-04-10 | 2009-10-29 | Nippon Telegr & Teleph Corp <Ntt> | Database replication method, and database management system, and program |
JP2010067115A (en) * | 2008-09-12 | 2010-03-25 | Nec Informatec Systems Ltd | Data storage system and data storage method |
JP2014099061A (en) * | 2012-11-14 | 2014-05-29 | Omron Corp | Controller and program |
JP2014197346A (en) * | 2013-03-29 | 2014-10-16 | オムロン株式会社 | Controller and program |
CN110597891A (en) * | 2018-06-12 | 2019-12-20 | 武汉斗鱼网络科技有限公司 | Device, system, method and storage medium for aggregating MySQL into PostgreSQL database |
CN113420088A (en) * | 2021-06-24 | 2021-09-21 | 广州欢网科技有限责任公司 | Method, device and terminal for synchronizing cache database and database |
-
2005
- 2005-05-31 JP JP2005159578A patent/JP2006338145A/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217641A (en) * | 2007-03-07 | 2008-09-18 | Nec Corp | Replication method, storage device and program |
JP4715777B2 (en) * | 2007-03-07 | 2011-07-06 | 日本電気株式会社 | Replication method, storage apparatus, and program |
JP2009252149A (en) * | 2008-04-10 | 2009-10-29 | Nippon Telegr & Teleph Corp <Ntt> | Database replication method, and database management system, and program |
JP2010067115A (en) * | 2008-09-12 | 2010-03-25 | Nec Informatec Systems Ltd | Data storage system and data storage method |
JP2014099061A (en) * | 2012-11-14 | 2014-05-29 | Omron Corp | Controller and program |
US9824229B2 (en) | 2012-11-14 | 2017-11-21 | Omron Corporation | Controller with enhanced reliability |
JP2014197346A (en) * | 2013-03-29 | 2014-10-16 | オムロン株式会社 | Controller and program |
CN110597891A (en) * | 2018-06-12 | 2019-12-20 | 武汉斗鱼网络科技有限公司 | Device, system, method and storage medium for aggregating MySQL into PostgreSQL database |
CN113420088A (en) * | 2021-06-24 | 2021-09-21 | 广州欢网科技有限责任公司 | Method, device and terminal for synchronizing cache database and database |
CN113420088B (en) * | 2021-06-24 | 2024-04-26 | 广州欢网科技有限责任公司 | Method, device and terminal for synchronizing cache database and database |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4301849B2 (en) | Information processing method and its execution system, its processing program, disaster recovery method and system, storage device for executing the processing, and its control processing method | |
US7925633B2 (en) | Disaster recovery system suitable for database system | |
JP5467625B2 (en) | Production-substitution system including a production system that processes transactions and a substitution system that is a backup system of the production system | |
JP2006338145A (en) | Multiplex database system, synchronization method thereof, intermediation device and intermediation program | |
CN104486319B (en) | Suitable for the configuration file real-time synchronization method and its system of high-availability system | |
CN103294701B (en) | A kind of method that distributed file system and data process | |
US20180150501A1 (en) | Database system, server device, computer program product, and information processing method | |
US20100333094A1 (en) | Job-processing nodes synchronizing job databases | |
US20070220059A1 (en) | Data processing node | |
US20060259517A1 (en) | Data synchronizer with failover facility | |
US7330860B2 (en) | Fault tolerant mechanism to handle initial load of replicated object in live system | |
JP2004295540A (en) | Method for synchronizing transaction, database system, and database apparatus | |
JP2001356945A (en) | Data backup recovery system | |
WO2003048936A1 (en) | Fault tolerance using logical checkpointing in computing systems | |
EP1661000A1 (en) | Recovery from failures within data processing systems | |
CN103782279A (en) | File management system and file management method | |
WO2008117205A2 (en) | Upgrading services associated with high availability systems | |
CN101770513A (en) | Method and system for validation and correction in a distributed namespace | |
JP4870190B2 (en) | Data processing method, computer, and data processing program | |
JP6520448B2 (en) | INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING DEVICE, AND INFORMATION PROCESSING DEVICE CONTROL METHOD | |
CN102937955A (en) | Main memory database achieving method based on My structured query language (SQL) double storage engines | |
CN102045187A (en) | Method and equipment for realizing HA (high-availability) system with checkpoints | |
US8522069B2 (en) | Process for secure backspacing to a first data center after failover through a second data center and a network architecture working accordingly | |
CN110196788B (en) | Data reading method, device and system and storage medium | |
JP3823169B1 (en) | Data control apparatus, system, method, and program |