JP2021174065A - 情報処理装置、情報処理システム、及び情報処理プログラム - Google Patents

情報処理装置、情報処理システム、及び情報処理プログラム Download PDF

Info

Publication number
JP2021174065A
JP2021174065A JP2020074859A JP2020074859A JP2021174065A JP 2021174065 A JP2021174065 A JP 2021174065A JP 2020074859 A JP2020074859 A JP 2020074859A JP 2020074859 A JP2020074859 A JP 2020074859A JP 2021174065 A JP2021174065 A JP 2021174065A
Authority
JP
Japan
Prior art keywords
data
record
difference
server
replica
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020074859A
Other languages
English (en)
Other versions
JP7428894B2 (ja
Inventor
隆 秋山
Takashi Akiyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2020074859A priority Critical patent/JP7428894B2/ja
Priority to US17/156,673 priority patent/US11561958B2/en
Publication of JP2021174065A publication Critical patent/JP2021174065A/ja
Application granted granted Critical
Publication of JP7428894B2 publication Critical patent/JP7428894B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2308Concurrency control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】レスポンスタイムを短くすること【解決手段】第1のデータベース43の複数のレコード43aの各々を複数のサーバ21、22が操作した後の該レコード43aのデータと、操作が行われた順序を示す識別子とを対応付けて記憶した、複数のサーバ21、22ごとに設けられた複数の第2のデータベース41、42から、第1の期間CTに記憶されたデータを取得するデータ取得部67と、取得したデータを、識別子が示す順に第3のデータベース45に格納するデータ格納部73とを有する情報処理装置による。【選択図】図10

Description

本発明は、情報処理装置、情報処理システム、及び情報処理プログラムに関する。
データベースを参照する際の負荷分散等を実現するために、当該データベースの内容を複製したデータベースを作成することがある。この場合、複製元のデータベースはマスタDB(database)と呼ばれ、複製先のデータベースはレプリカDBと呼ばれる。
データベースを参照するクライアント端末が複数存在する場合、マスタDBだけでなくレプリカDBにも各クライアント端末が参照することによりマスタDBの負荷分散を実現できる。
しかし、レプリカDBを利用するシステムにおいては、マスタDBからレプリカDBを複製するときのレスポンスタイムを短くするという点で改善の余地がある。
特開平11−167510号公報 特開平10−49416号公報
一側面によれば、レスポンスタイムを短くすることを目的とする。
一側面によれば、第1のデータベースの複数のレコードの各々を複数のサーバが操作した後の該レコードのデータと、前記操作が行われた順序を示す識別子とを対応付けて記憶した、複数の前記サーバごとに設けられた複数の第2のデータベースから、第1の期間に記憶された前記データを取得するデータ取得部と、取得した前記データを、前記識別子が示す順に第3のデータベースに格納するデータ格納部とを有する情報処理装置が提供される。
一側面によれば、レスポンスタイムの低下を抑制することができる。
図1は、検討に使用したシステムの構成図である。 図2は、検討に使用したシステムにおける処理の流れを示す模式図である。 図3は、検討に使用したシステムにおける処理の流れを示す模式図である。 図4は、排他制御の模式図である。 図5は、本実施形態に係る情報処理システムのシステム構成図である。 図6は、本実施形態に係るディスク装置の模式図である。 図7は、本実施形態におけるマスタDBの内容を示す模式図である。 図8(a)は、本実施形態に係る第1の採番DBの内容について示す模式図であり、図8(b)は、本実施形態に係るチェックポイントDBの内容について示す模式図である。 図9は、本実施形態に係る第1の差分DBの内容について示す模式図である。 図10は、本実施形態に係る情報処理システムの処理の流れを示す模式図である。 図11は、本実施形態において、マスタDBの同一レコードに対する複数の操作の間で許容される状態遷移を示す模式図である。 図12は、本実施形態において、操作間の遷移の具体例を示す模式図である。 図13は、本実施形態において、操作間の状態遷移を利用してレプリカDBの一貫性を保つ方法を示す模式図である。 図14は、本実施形態に係る第1のサーバの機能構成図である。 図15は、本実施形態に係るレプリカDB作成サーバの機能構成図である。 図16は、本実施形態に係る主キー一覧の模式図である。 図17は、本実施形態に係る第1のサーバの処理を示すフローチャートである。 図18は、本実施形態において、各サーバが各採番DBと各差分の各々にアクセスする際の模式図である。 図19は、チェックポイントDBを操作するときに本実施形態に係るレプリカDB作成サーバが行う情報処理方法のフローチャートである。 図20は、レプリカDBを作成するときに本実施形態に係るレプリカDB作成サーバが行う情報処理方法のフローチャート(その1)である。 図21は、レプリカDBを作成するときに本実施形態に係るレプリカDB作成サーバが行う情報処理方法のフローチャート(その2)である。 図22は、本実施形態に係る第1のサーバと第2のサーバの各々のハードウェア構成図である。 図23は、本実施形態に係るレプリカDB作成サーバのハードウェア構成図である。
本実施形態の説明に先立ち、本願発明者が検討した事項について説明する。
図1は、検討に使用したシステムの構成図である。
このシステム1は、マスタDBからレプリカDBを複製するシステムであって、業務サーバ2、ディスク装置3、レプリカDB作成サーバ4、及びクライアント端末5を有する。これらの各装置は、インターネット等のネットワーク6を介して相互に接続される。
このうち、業務サーバ2は、クライアント端末5の要求に応じてディスク装置3のデータベースの更新や挿入等の操作を行うサーバである。ここでは、業務サーバ2は、業務用のアプリケーションプログラムである業務アプリ7と、ディスク装置3のデータベースを管理するDB管理アプリ8とを実行する。
また、ディスク装置3は、マスタDB、採番DB、差分DB、及びレプリカDBを記憶したストレージ装置である。
マスタDBは、各クライアント端末5が参照するデータベースである。また、採番DBは、マスタDBのレコードに対して削除、挿入、及び更新等の操作があった場合に、レコードの操作の順序を示す番号を格納するデータベースである。
更に、差分DBは、マスタDBのレコードが操作された場合に、操作後のレコードのデータを格納するデータベースである。また、レプリカDBは、マスタDBのレコードを複製したレコードを格納されるデータベースである。
そして、レプリカDB作成サーバ4はレプリカDBを作成するサーバである。また、クライアント端末5は、システム1の利用者が操作するPC(Personal Computer)等の計算機である。
次に、このシステム1における処理の流れについて説明する。
図2は、システム1における処理の流れを示す模式図である。
まず、クライアント端末5が、業務サーバ2に対してマスタDBの操作を依頼する(P1)。その操作としては、レコードの削除、挿入、及び更新のいずれかがある。
次いで、業務サーバ2の業務アプリ7が、トランザクションTS1においてDB管理アプリ8に対してマスタDBの操作を依頼し、DB管理アプリ8がマスタDBのレコードのデータを操作する(P2)。ここでは、操作後の当該レコードのデータが「A」であるとする。また、以下では操作が行われた後のデータのことを単に操作後データとも呼ぶ。
次に、DB管理アプリ8に実装されているトリガを利用して、業務アプリ7が、マスタDBのレコードの操作後データが「A」であることを検知する(P3)。
次いで、業務アプリ7が、DB管理アプリ8に対して採番DBの最新の通番を1だけカウントアップするように要求し、カウントアップ後の通番をDB管理アプリ8を介して取得する(P4)。ここでは、採番DBの最新の通番が「0」であり、それを1だけカウントアップした通番「1」を業務アプリ7が取得する。
続いて、業務アプリ7が、DB管理アプリ8を介して、操作後データ「A」と通番「1」とを対応付けて差分DBに格納する(P5)。
次いで、クライアント端末5が、業務サーバ2に対して再びマスタDBの操作を依頼する(P6)。
次に、業務アプリ7が、今度はトランザクションTS2においてDB管理アプリ8に対してマスタDBの操作を依頼し、DB管理アプリ8がマスタDBのレコードのデータを操作する(P7)。この例では、当該レコードの操作後データが「B」であるとする。
次に、DB管理アプリ8に実装されているトリガを利用して、業務アプリ7が、マスタDBのレコードの操作後データが「B」であることを検知する(P8)。
次いで、業務アプリ7が、DB管理アプリ8に対して採番DBの最新の通番を1だけカウントアップするように要求し、カウントアップ後の通番をDB管理アプリ8を介して取得する(P9)。この例では、採番DBの最新の通番は「1」となっているため、それを1だけカウントアップした通番「2」を業務アプリ7が取得することになる。
続いて、業務アプリ7が、DB管理アプリ8を介して、操作後データ「B」と通番「2」とを対応付けて差分DBに格納する(P10)。
次に、レプリカDB作成サーバ4が、差分DBに格納されている操作後データを通番が小さい順に読み込み、それをレプリカDBに格納する(P11)。この例では、レプリカDB作成サーバ4は、最初に通番が「1」の操作後データ「A」をレプリカDBに格納し、次に通番が「2」の操作後データ「B」をレプリカDBに格納する。その後、レプリカDB作成サーバ4は、レプリカDBに格納した操作後データを差分DBから削除する。
以上により、このシステム1の基本処理を終える。
このシステム1によれば、業務サーバ2が、マスタDBのレコードの操作後データを通番と対応付けて差分DBに格納し(P5、P10)、レプリカDB作成サーバ4が操作後データを通番順にレプリカDBに格納する(P11)。これにより、レプリカDBの内容がマスタDBの内容と同一となり、マスタDBを複製したレプリカDBを得ることができる。そのため、クライアント端末5が、マスタDBに代えてレプリカDBを参照することが可能となり、マスタDBにアクセスが集中するのを防止できる。
ところで、図2においては一つの業務サーバ2がディスク装置3にアクセスする例を説明したが、場合によっては複数の業務サーバ2がディスク装置3にアクセスするシステムも考えられる。例えば、複数の業務サーバ2とディスク装置3の各々を異なる地域や国に分散して配置することにより、ある地域の業務サーバ2に障害が発生しても他の地域の業務サーバ2でシステム1を継続して利用できるようにする場合がある。
図3は、この場合のシステム1における処理の流れを示す模式図である。
この場合は、まず、クライアント端末5が、複数の業務サーバ2のうちの一つに対してマスタDBの操作を依頼する(P21)。
次いで、当該業務サーバ2の業務アプリ7が、トランザクションTS1においてDB管理アプリ8に対してマスタDBの操作を依頼し、DB管理アプリ8がマスタDBのレコードを操作する(P22)。ここでは、当該レコードの操作後データが「A」であるとする。
次に、DB管理アプリ8に実装されているトリガを利用して、業務アプリ7が、マスタDBのレコードの操作後データが「A」であることを検知する(P23)。
次いで、業務アプリ7が、DB管理アプリ8に対して採番DBの最新の通番を1だけカウントアップするように要求し、カウントアップ後の通番をDB管理アプリ8を介して取得する(P24)。図2の例と同様に、ここでは採番DBの最新の通番が「0」であり、それを1だけカウントアップした通番「1」を業務アプリ7が取得する。
続いて、業務アプリ7が、DB管理アプリ8を介して、操作後データ「A」と通番「1」とを対応付けて差分DBに格納する(P25)。
次に、上記とは別の業務サーバ2に対し、クライアント端末5がマスタDBの操作を依頼する(P26)。
続いて、その依頼を受けた業務サーバ2の業務アプリ7が、トランザクションTS2において自装置のDB管理アプリ8に対してマスタDBの操作を依頼し、DB管理アプリ8がマスタDBのレコードを操作する(P27)。図2の例と同様に、この例でも当該レコードの操作後データが「B」であるとする。
そして、DB管理アプリ8に実装されているトリガを利用して、業務アプリ7が、マスタDBのレコードの操作後データが「B」であることを検知する(P28)。
次いで、業務アプリ7が、DB管理アプリ8に対して採番DBの最新の通番を1だけカウントアップするように要求し、カウントアップ後の通番をDB管理アプリ8を介して取得する(P29)。ここでは採番DBの最新の通番は「1」となっているため、それを1だけカウントアップした通番「2」を業務アプリ7が取得する。
続いて、業務アプリ7が、DB管理アプリ8を介して、操作後データ「B」と通番「2」とを対応付けて差分DBに格納する(P30)。
次に、レプリカDB作成サーバ4が、差分DBに格納されている操作後データを通番が小さい順に読み込み、それをレプリカDBに格納する(P31)。
以上により、業務サーバ2が複数存在する場合のシステム1の基本処理を終える。この場合も、各業務サーバ2が、レコードの操作後データと採番DBの通番とを対応付けて差分DBに格納することにより、マスタDBと同一内容のレプリカDBをレプリカDB作成サーバ4が作成できる。
しかし、このように複数の業務サーバ2が採番DBと差分DBにアクセスする場合には、採番DBと差分DBの各々の一貫性を保証するために、DB管理アプリ8がアクセスの排他制御を行う必要がある。
図4は、その排他制御の模式図である。
図4に示すように、この例では、採番DBの一貫性を保証するために、一つの業務サーバ2が前述のステップP24を実行した後に、他の業務サーバ2が前述のステップP29を行う必要がある。
同様に、差分DBの一貫性を保証するために、一つの業務サーバ2が前述のステップP25を実行した後に、他の業務サーバ2が前述のステップP30を行う必要がある。
このように採番DBと差分DBの各々へのアクセスを排他的に行うと、例えばステップP24を実行してからステップP30が終了するまでのレスポンスタイムT0が長くなる。特に、業務サーバ2の台数が多くなるとレスポンスタイムT0の長時間化が顕著となる。
(本実施形態)
図5は、本実施形態に係る情報処理システムのシステム構成図である。
この情報処理システム20は、マスタDBからレプリカDBを複製するシステムであって、第1及び第2のサーバ21、22、ディスク装置23、レプリカDB作成サーバ24、及びクライアント端末25を有する。これらの各装置は、インターネット等のネットワーク26を介して相互に接続される。
このうち、第1のサーバ21と第2のサーバ22は、クライアント端末25の要求に応じてディスク装置23のデータベースに対してレコードの挿入、削除、及び更新のいずれかの操作を行うサーバである。
また、ディスク装置23は、マスタDBやレプリカDB等の各種のデータベースを記憶したHDD(Hard Disk Drive)やSSD(Solid State Drive)等のストレージ装置である。そして、レプリカDB作成サーバ24は、情報処理装置の一例であって、ディスク装置23にレプリカDBを作成するサーバである。更に、クライアント端末25は、情報処理システム20の利用者が操作するPC等の計算機である。
次に、ディスク装置23に記憶されている各種のデータベースについて説明する。
図6は、ディスク装置23の模式図である。
図6に示すように、ディスク装置23は、第1の採番DB31、第2の採番DB32、第1の差分DB41、第2の差分DB42、マスタDB43、チェックポイントDB44、及びレプリカDB45を記憶する。
このうち、マスタDB43は複製元のデータベースであり、レプリカDB45は複製先のデータベースである。
また、第1の採番DB31と第1の差分DB41は、第1のサーバ21に対応付けられたデータベースであり、各サーバ21、22のうちで第1のサーバ21のみがアクセス可能である。
一方、第2の採番DB32と第2の差分DB42は、第2のサーバ22に対応付けられたデータベースであり、各サーバ21、22のうちで第2のサーバ22のみがアクセス可能である。
なお、第1の差分DB41と第2の差分DB42は、いずれも第2のデータベースの一例である。そして、第1の採番DB31と第2の採番DB32は、いずれも第5のデータベースの一例である。
また、チェックポイントDB44は、第4のデータベースの一例であって、予め定められたチェック期間内における各差分DB41、42の内容を取得するときに使用するデータベースである。
次に、マスタDB43、第1及び第2の採番DB31、32、第1及び第2の差分DB41、42、及びチェックポイントDB44の各々の内容について説明する。
図7は、マスタDB43の内容を示す模式図である。
図7の例では、表名が「社員名簿」、「得意先名簿」、及び「支店一覧」の三つのデータベースがマスタDBに格納される。これらのデータベースの各々には、一行分のデータであるレコード43aが複数格納される。なお、マスタDB43に格納されるデータベースの個数はこれに限定されず、一つのデータベースのみがマスタDB43に格納されてもよいし、四つ以上のデータベースがマスタDB43に格納されてもよい。
複数のレコード43aのうちの一つを一意に識別する主キーはデータベースごとに異なる。例えば、表名が「社員番号」の主キーは属性「社員番号」である。また、表名が「得意先名簿」の主キーは属性「得意先名」である。そして、表名が「支店一覧」の主キーは属性「支店番号」である。
図8(a)は、第1の採番DB31の内容について示す模式図である。
図8(a)に示すように、第1の採番DB31は、属性として通番のみを備えたデータベースである。通番は、第1のサーバ21がマスタDB43の操作を行った順序を識別する識別子の一例である。ここでは、その通番子として整数を採用する。
これと同様に、第2の採番DB32も属性として通番のみを有するデータベースである。例えば、第2の採番DB32には、第2のサーバ22がマスタDB43の操作を行った順序を識別する識別子として整数値の通番が格納される。
図8(b)は、チェックポイントDB44の内容について示す模式図である。
図8(b)に示すように、チェックポイントDB44は、表名が「チェックポイント」のデータベースである。そのチェックポイントDB44には、予め定められたチェック期間CTごとに更新される属性「チェックポイント」として文字列「CKPT」のみが格納される。チェック期間CTの長さは特に限定されないが、ここでは1分程度とする。また、チェック期間CTは、第1の期間の一例である。
図9は、第1の差分DB41の内容について示す模式図である。
図9に示すように、第1の差分DB41は、「通番」、「データ種」、「表名」、「主キー」、「操作内容」、「操作前データ」、及び「操作後データ」の各属性を対応付けた複数の差分レコード49を記憶する。
このうち、「通番」は、第1の採番DB31における「通番」である。また、「データ種」は、マスタDB43とチェックポイントDB44のどちらの操作後データが第1の差分DB41に格納されているのかを特定する文字列である。例えば、マスタDB43の操作後データの場合には文字列「DB」が「データ種」に格納される。また、チェックポイントDB44の操作後データの場合には文字列「CKPT」が「データ種」に格納される。
「表名」は、マスタDB43とチェックポイントDB44のいずれかに記憶されているデータベースの表名である。
「主キー」は、マスタDB43の複数の属性のうちで、レコード43aを一意に特定できる属性である。なお、チェックポイントDB44に対応した差分レコード49の「主キー」には文字列「CKPT」が格納される。
「操作内容」は、第1のサーバ21がマスタDB43に対して行った操作の内容である。例えば、「更新」、「削除」、及び「挿入」が「操作内容」となる。なお、第1のサーバ21がチェックポイントDB44に対して行う操作は常に挿入であるため、チェックポイントDB44に対応した「操作内容」には「挿入」となる。
そして、「操作前データ」は、マスタDB43とチェックポイントDB44の各々を第1のサーバ21が操作する前にこれらのデータベースに格納されているデータである。一方、「操作後データ」は、マスタDB43とチェックポイントDB44の各々を第1のサーバ21が操作した後にこれらのデータに格納されているデータである。
チェックポイントDB44の内容は常に文字列「CKPT」であるため、「操作前データ」と「操作後データ」はどちらも「CKPT」となる。
なお、第2の差分DB42も、上記した第1の差分DB41と同じ属性を対応つけた差分レコード49を記憶する。その属性のうち、「通番」には、第2の採番DB32の「通番」が格納される。そして、「操作前データ」には、マスタDB43とチェックポイントDB44の各々を第2のサーバ22が操作する前にこれらのデータベースに格納されているデータが格納される。更に、「操作後データ」には、マスタDB43とチェックポイントDB44の各々を第2のサーバ22が操作した後にこれらのデータに格納されているデータが格納される。
次に、この情報処理システム20においてマスタDB43の内容をレプリカDB45に複製するときの処理の流れについて説明する。
図10は、情報処理システム20の処理の流れを示す模式図である。
本実施形態では、第1のサーバ21と第2のサーバ22の各々がディスク装置23にアクセスするときに、アクセスの排他制御を行わずに以下のようにしてマスタDB43の内容をレプリカDB45に複製する。
まず、第1のサーバ21が、マスタDB43の操作を依頼する通知をクライアント端末25(図5参照)から受け付け、それを契機としてマスタDB43のレコード43aを操作する(P41)。
次に、第1のサーバ21が、トリガを利用することにより、マスタDBを操作した後のレコード43aの操作後データを取得する(P42)。ここでは操作後データが「A」であるとする。
次いで、第1のサーバ21が、第1の採番DB31の最新の通番を1だけカウントアップし、カウントアップ後の通番を取得する(P43)。この例では、第1の採番DB31の最新の通番が「0」であり、それを1だけカウントアップした通番「1」を第1のサーバ21が取得する。
続いて、第1のサーバ21が、操作後データ「A」と通番「1」とを対応付けた差分レコード49を第1の差分DB41に格納する(P44)。なお、図10においては、図9の「操作後データ」と「通番」以外の差分レコード49の属性は省略している。
その後、上記と同様にして第1のサーバ21がマスタDB43の操作を行い、操作後データと通番とを対応付けた差分レコード49を第1の差分DB41に格納する(P45〜P47)。一例として、第1のサーバ21は、操作後データ「B」、「C」、「D」をそれぞれ通番「2」、「3」、「4」と対応付けた差分レコード49を第1の差分DB41に格納する。
そして、上記のステップP41〜P47と非同期に、第2のサーバ22がマスタDB43、第2の採番DB32、及び第2の差分DB42にアクセスする(P48〜P53)。
例えば、第2のサーバ22は、マスタDB43の操作を依頼する通知をクライアント端末25(図5参照)から受け付け、それを契機としてマスタDB43のレコード43aを操作する(P48)。
次に、第2のサーバ22が、トリガを利用することにより、マスタDBの操作後データを取得する(P49)。この例では操作後データが「X」であるとする。
続いて、第1のサーバ21が、第2の採番DB32の最新の通番を1だけカウントアップし、カウントアップ後の通番を取得する(P50)。この例では、第2の採番DB32の最新の通番が「4」であり、それを1だけカウントアップした通番「5」を第2のサーバ22が取得する。
なお、第2の採番DB32における通番は、第2のサーバ22がマスタDB43の操作を行った順序を識別する整数であって、第1の採番DB31における通番とは独立している。そのため、第2の採番DB32の通番「5」と、第1の採番DB31の通番「1」との先後は任意であり、通番「5」が通番「1」よりも先であってもよいし、通番「5」が通番「1」よりも後であってもよい。これについては他の通番についても同様である。
そして、第2のサーバ22が、操作後データ「X」と通番「5」とを対応付けた差分レコード49を第2の差分DB42に格納する(P51)。
その後、上記と同様にして第2のサーバ22がマスタDB43の操作を行い、差分レコード49を第2の差分DB42に格納する(P52〜P53)。例えば、第2のサーバ22は、操作後データ「Y」、「Z」をそれぞれ通番「6」、「7」と対応付けた差分レコード49を第2の差分DB42に格納する。
次いで、レプリカDB作成サーバ24が、チェックポイントDB44を操作することにより、文字列「CKPT」をチェックポイントDB44に挿入する(P54)。レプリカDB作成サーバ24がチェックポイントDB44を操作するのは、予め定められたチェック期間CTに一回のみである。よって、レプリカDB作成サーバ24は、チェック期間CTごとに定期的に文字列「CKPT」をチェックポイントDB44に挿入することになる。
なお、図8(b)に示したように、この操作の前にもチェックポイントDB44には文字列「CKPT」が格納されているため、この操作の前後でチェックポイントDB44の内容は変わらない。
次に、レプリカDB作成サーバ24が、トリガを利用することにより、チェックポイントDB44に挿入された文字列「CKPT」を取得する(P55)。
続いて、レプリカDB作成サーバ24が、第1の採番DB31を参照して、該第1の採番DB31における最新の通番を1だけカウントアップした通番を特定する(P56)。この例では、第1の採番DB31における最新の通番は「4」であるため、これを1だけカウントアップした通番「5」をレプリカDB作成サーバ24が特定する。その通番「5」は、第1の差分DB41におけるチェック期間CTの終点を示す終点識別子の一例である。
次に、レプリカDB作成サーバ24が、その通番「5」と文字列「CKPT」とを対応付けて第1の差分DB41に格納する(P57)。
続いて、レプリカDB作成サーバ24が、第2の採番DB32を参照して、該第2の採番DB32における最新の通番を1だけカウントアップした通番を特定する(P58)。ここでは、第2の採番DB32における最新の通番は「7」であるため、これを1だけカウントアップした通番「8」をレプリカDB作成サーバ24が特定する。その通番「8」は、第2の差分DB42におけるチェック期間CTの終点を示す終点識別子の一例である。
そして、レプリカDB作成サーバ24が、その通番「8」と文字列「CKPT」とを対応付けて第2の差分DB42に格納する(P59)。
次いで、レプリカDB作成サーバ24が、第1の差分DB41を参照して、文字列「CKPT」と対応付けられた通番「5」を特定する(P60)。
そして、レプリカDB作成サーバ24が、通番「5」よりも順序が先の通番を含む全ての差分レコード49を第1の差分DB41から取得し、通番が小さい順に操作後データをレプリカDB45に格納する(P61)。
この例では、通番「5」よりも先の通番「1」〜「4」に対応付けられた操作後データ「A」〜「D」を含む差分レコード49をレプリカDB作成サーバ24が取得する。そして、レプリカDB作成サーバ24が、これらの操作後データを「A」、「B」、「C」、「D」の順にレプリカDB45に格納する。
その後に、レプリカDB作成サーバ24が、通番「5」よりも順序が先の通番を含む差分レコード49を第1の差分DB41から削除する。この例では、レプリカDB作成サーバ24は、操作後データ「A」〜「D」を含む差分レコード49を第1の差分DB41から削除する。
同様に、レプリカDB作成サーバ24が、第2の差分DB42を参照して、文字列「CKPT」と対応付けられた通番「8」を特定する(P62)。
そして、レプリカDB作成サーバ24が、特定した通番「8」よりも順序が先の通番を含む全ての差分レコード49を第2の差分DB42から取得し、通番が小さい順に各操作後データをレプリカDB45に格納する(P63)。
ここでは、通番「8」よりも先の通番「5」〜「7」に対応付けられた操作後データ「X」〜「Z」を含む差分レコード49をレプリカDB作成サーバ24が取得する。そして、レプリカDB作成サーバ24が、これらの操作後データを「X」、「Y」、「Z」の順にレプリカDB45に格納する。
その後に、レプリカDB作成サーバ24が、通番「8」よりも順序が先の通番を含む差分レコード49を第2の差分DB42から削除する。この例では、レプリカDB作成サーバ24は、操作後データ「X」〜「Z」を含む差分レコード49を第2の差分DB42から削除する。
以上により、情報処理システム20における基本処理を終える。
これによれば、第1及び第2のサーバ21、22ごとに第1及び第2の採番DB31、32と第1及び第2の差分DB41、42を設け、かつレプリカDB作成サーバ24が操作後データを通番順にレプリカDB45に格納する。そのため、各採番DB31、32と各差分DB41、42への各サーバ21、22のアクセスに対して排他制御をしなくても、レプリカDBにおける操作後データの一貫性を保証できる。
なお、P57ではレプリカDB作成サーバ24が第1の差分DB41にアクセスしているため、このタイミングではレプリカDB作成サーバ24と第1のサーバ21の各々の第1の差分DB41へのアクセスを排他的に行うことになる。但し、P57が実行されるのはチェック期間CTに一回のみなので、これにより情報処理システム20のレスポンスタイムが大きく悪化することはない。
また、この例では、各サーバ21、22とは別にレプリカDB作成サーバ24を設けたが、第1のサーバ21と第2のサーバ22のいずれかにレプリカDB作成サーバ24の機能を持たせてもよい。この場合は、例えば、第1のサーバ21が前述のP54〜P63の処理を行うことになる。
ところで、第1の採番DB31の通番「1」〜「4」は、第1のサーバ21がマスタDB43を操作した順番を示す。そのため、上記のように通番通りに操作後データ「A」〜「D」をレプリカDB45に格納することにより、第1のサーバ21が操作したレコードの一貫性は保たれる。
但し、第1の採番DB31と第2の採番DB32のそれぞれの通番では時間的な先後を特定できないため、これらの通番のみでは第1のサーバ21と第2のサーバ22の各々がマスタDB43を操作した順番を特定できない。例えば、第1の採番DB31の通番「3」は第2の採番DB32の通番「5」よりも小さいが、通番「3」に対する操作が通番「5」に対する操作よりも先に行われたとは限らない。
そのため、第1のサーバ21と第2のサーバ22がマスタDB43の同一のレコード43aを操作した場合には、レプリカDB45に通番順に操作後データを格納してもレプリカDB45の一貫性が保たれない。
その場合には、以下のようにして同一のレコード43aに対する複数の操作の間で許容される状態遷移に基づいて最後に操作されたレコード43aの操作後データを特定し、当該操作後データをレプリカDB45に格納する。
図11は、マスタDB43の同一レコード43aに対する複数の操作の間で許容される状態遷移を示す模式図である。
この状態遷移50は、マスタDB43の一貫性を保つために許容される操作の状態遷移である。
図11に示されるように、複数の操作の間で許容されるのは(1)〜(5)の遷移のみである。このうち、(1)は、あるレコード43aに対して「挿入」を行った後に、そのレコード43aの「更新」を行う遷移である。また、(2)は、あるレコード43aを「更新」した後に、そのレコード43aの「更新」を再び行う遷移である。
(3)は、あるレコード43aの「更新」をした後に、そのレコード43aを「削除」する遷移である。(4)は、あるレコード43aを「挿入」した後に、そのレコード43aを「削除」する遷移である。
そして、(5)は、あるレコード43aを「削除」した後に、そのレコード43aを再び「挿入」する遷移である。
図12は、操作間の遷移の具体例を示す模式図である。
なお、図12においては、各操作をした後の差分レコード49も併記してある。
この例では、(1)の遷移において、挿入されたレコード43aのデータが「A」から「B」に更新される。また、(2)の遷移において、レコード43aのデータが「B」から「C」に更新される。
そして、(3)の遷移においては、データが「B」に更新されたレコード43aが削除される。更に、(4)の遷移においては、データとして「A」が挿入されたレコード43aが削除される。
また、(5)の遷移においては、削除されたレコード43aのデータを「A」にし、再びそのレコード43aを挿入する。
このように複数の操作の間で許容される状態遷移を利用すると、各サーバ21、22がマスタDB43の同一のレコード43aを操作した場合であっても、以下のようにレプリカDB45の一貫性を保つことができる。
図13は、操作間の状態遷移を利用してレプリカDB45の一貫性を保つ方法を示す模式図である。
ここでは、第1のサーバ21と第2のサーバ22の各々が、マスタDB43の同一のレコード43aに対し、「Aを挿入」→「Bに更新」→「Cに更新」という三つの操作をこの順に行った場合を例にして説明する。例えば、「Aを挿入」と「Bに更新」を第1のサーバ21が行い、「Cに更新」を第2のサーバ22が行ったものとする。また、各サーバ21、22が操作する前の当該レコード43aの初期値は空であるとする。
この場合は、まず、レプリカDB作成サーバ24が、第1の差分DB41と第2の差分DB42の各々の差分レコード49の中に、マスタDB43の同一のレコード43aに対応したものがあるかを判定する。
ここで、同一のレコード43aに対応した差分レコード49があると判定された場合には、レプリカDB作成サーバ24は、レプリカDB45の当該レコード43aを自装置の記憶部に退避させる(P71)。この例では、レプリカDB作成サーバ24は、初期値が空のレコード43aを記憶部に退避させる。
次に、レプリカDB作成サーバ24が、第1の差分DB41と第2の差分DB42の各々の差分レコード49と状態遷移50とに基づいて、最後に操作されたレコード43aを特定する(P72)
この例では、三つの差分レコード49の各々の「操作内容」は「挿入」、「更新」、「更新」である。状態遷移50によれば、これらの操作間で許容される遷移は、(1)の「挿入」→「更新」の遷移と、(2)の「更新」→「更新」の遷移の二つである。そして、これら二つの遷移が可能なのは、「挿入」→「更新」→「更新」という遷移のみである。
最後の二つの「更新」を行った順序は、差分レコード49の「操作前データ」と「操作後データ」から判断できる。例えば、二つの「更新」のうちの一方の「操作後データ」が他方の「操作前データ」に一致すれば、二つの「更新」がこの順に行われたことになる。図13の例では、最初に「Bに更新」が行われ、その後に「Aに更新」が行われたことになる。
以上により、最後に行われた操作は、「B」から「C」への更新であることが特定できる。
その後、レプリカDB作成サーバ24は、上記のようにして最後に操作されたレコード43aに対応する操作後データのみをレプリカDB45に格納する(P73)。
これにより、各サーバ21、22がマスタDB43の同一のレコード43aに対して操作を行った場合でも、最後の操作における操作後データのみがレプリカDB45に格納されるため、レプリカDB45の一貫性を保つことができる。
なお、このように状態遷移50を利用せずに、レコード43aを操作した時刻を示すタイムスタンプを各サーバ21、22が差分レコード49に付与することも考えられる。この場合は、レプリカDB作成サーバ24は、タイムスタンプ順に差分レコード49を並べ替えることにより、最後に操作されたレコード43aに対応する差分レコード49を特定することになる。しかし、各サーバ21、22が計測する時刻を正確に合わせるのは困難であるため、この方法では並べ替えた後の差分レコード49の順序が時刻順になる保障がない。
これに対し、この例のように状態遷移50を利用すれば時刻順に差分レコード49を正しく並べ替えることができ、最後の差分レコード49を正しく求めることができる。
次に、情報処理システム20の各装置の機能構成について説明する。
図14は、第1のサーバ21の機能構成図である。
図14に示すように、第1のサーバ21は、通信部51と制御部52とを有する。
このうち、通信部51は、第1のサーバ21をネットワーク26に接続するための通信インターフェースである。
一方、制御部52は、第1のサーバ21の各部を制御する処理部であって、受付部53、操作部54、通番取得部55、及びデータ格納部56を備える。
受付部53は、マスタDB43の操作を要求する操作要求をクライアント端末25から受け付ける処理部である。また、操作部54は、マスタDB43のレコード43aに対し、挿入、更新、及び削除等の操作を行う処理部である。
そして、通番取得部55は、第1の採番DB31から最新の通番を取得する処理部である。更に、データ格納部56は、操作部54が操作したレコード43aの操作後データと、通番取得部55が取得した通番とを対応付けて第1の差分DB41に格納する処理部である。
なお、第2のサーバ22も上記と同様の機能構成を有する。例えば、第2のサーバ22の通信部51は、該第2のサーバ22をネットワーク26に接続する。また、第2のサーバ22の通番取得部55は、第2の採番DB32から通番を取得する。そして、第2のサーバ22のデータ格納部56は、レコード43aの操作後データと通番とを対応付けて第2の差分DB42に格納する。
図15は、レプリカDB作成サーバ24の機能構成図である。
図15に示すように、レプリカDB作成サーバ24は、通信部61、記憶部62、及び制御部63を有する。
このうち、通信部61は、レプリカDB作成サーバ24をネットワーク26に接続するための通信インターフェースである。
一方、記憶部62は、主キー一覧80を記憶する。
図16は、主キー一覧80の模式図である。
主キー一覧80は、第1のサーバ21と第2のサーバ22の両方から操作が行われたマスタDB43のレコード43aを特定するための情報である。ここでは、各サーバ21、22の両方から操作されたレコード43aの「表名」と「主キー」とが対応付けられて主キー一覧80に格納される。
例えば、表名が「社員名簿」のデータベースを考える。このデータベースの主キーは「社員番号」である。この場合は、マスタDB43に格納されている表名が「社員名簿」のデータベースのレコード43aのうち、「社員番号」が「1234」で特定されるレコードを、第1のサーバ21と第2のサーバ22の両方が操作したということになる。
再び図15を参照する。
制御部63は、レプリカDB作成サーバ24の各部を制御する処理部である。この例では、制御部63は、データ取得部67、通番取得部68、操作部69、検知部70、特定部71、及び通番格納部72を有する。更に、制御部63は、データ格納部73、削除部74、生成部75、及び判定部76を有する。
このうち、データ取得部67は、第1の差分DB41と第2の差分DB42の各々から差分レコード49を取得する処理部である。また、通番取得部68は、第1の採番DB31と第2の採番DB32の各々から最新の通番を取得する処理部である。
操作部69は、チェック期間CTごとにチェックポイントDB44を操作することにより、チェックポイントDB44に文字列「CKPT」を定期的に挿入する処理部である。この例では、操作部69は、チェック期間CTごとにチェックポイントDB44に文字列「CKPT」を挿入する。
そして、検知部70は、チェック期間CT内にチェックポイントDBが操作されたことを検知する処理部である。一例として、検知部70は、操作部69がチェックポイントDB44に文字列「CKPT」を挿入したときに、トリガを利用してチェックポイントDB44が操作されたことを検知する。
特定部71は、検知部70が上記の操作を検知したときに、第1の採番DB31と第2の採番DB32の各々を参照して、各採番DB31、32における最新の通番に1を加えた通番を特定する処理部である。図10の例では、特定部71は、第1の採番DB31における最新の通番「4」に1を加えた通番「5」を特定する。これと共に、特定部71は、第2の採番DB32における最新の通番「7」に1を加えた通番「8」を特定する。
通番格納部72は、識別子格納部の一例であって、特定部71が特定した通番を、チェック期間CTの終点を示す終点識別子として各差分DB41、42に格納する処理部である。図10の例では、通番格納部72は、第1の差分DB41に終点識別子として通番「5」を文字列「CKPT」と対応付けて格納し、第2の差分DB42に終点識別子として通番「8」を文字列「CKPT」と対応付けて格納する。
データ格納部73は、データ取得部67が取得した差分レコード49に含まれる操作後データを通番順にレプリカDB45に格納する処理部である。
削除部74は、データ取得部67が差分レコード49を取得した後に、終点識別子よりも順序が先の通番を含む差分レコード49を各差分DB41、42の各々から削除する処理部である。例えば、図10の場合には、削除部74は、第1の差分DB41において終点識別子「5」よりも先の「1」〜「4」の通番を含む差分レコード49を該第1の差分DB41から削除する。同様に、削除部74は、第2の差分DB42において終点識別子「8」よりも先の「5」〜「7」の通番を含む差分レコード49を該第2の差分DB42から削除する。
生成部75は、前述の主キー一覧80を記憶部62に生成する処理部である。そして、判定部76は、主キー一覧80を参照することにより、データ取得部67が取得した差分レコード49の中に、第1のサーバ21と第2のサーバ22の両方が操作したレコード43aに係るものが存在するかを判定する。
なお、この例では、第1及び第2のサーバ21、22とは別にレプリカDB作成サーバ24を設けたが、前述のようにレプリカDB作成サーバ24の機能を各サーバ21、22のいずれかに持たせてもよい。例えば、第1のサーバ21の制御部52にレプリカDB作成サーバ24の制御部63の機能を持たせ、かつ、第1のサーバ21にレプリカDB作成サーバ24の記憶部62の機能を持たせてもよい。
次に、本実施形態に係る情報処理方法について説明する。
図17は、第1のサーバ21の処理を示すフローチャートである。
まず、第1のサーバ21の受付部53が、マスタDB43の操作を要求する操作要求をクライアント端末25から受け付ける(ステップP31)。
次いで、操作部54が、操作要求に応じてマスタDB43のレコード43aを操作する(ステップS32)。例えば、操作要求がレコード43aの更新を要求している場合には、操作部54は当該レコード43aを更新する。
次に、通番取得部55が、例えばトリガを利用してレコード43aが操作されたことを検知し、これを契機として第1の採番DB31から最新の通番を取得する(ステップS33)。
その後、データ格納部56が、トリガによって検知されたレコード43aの操作後データと、ステップS33で取得した通番とを対応付けた差分レコード49を第1の差分DB41に格納する(ステップS34)。
この際、データ格納部56は、図9のように「データ種」、「表名」、「主キー」、「操作内容」、及び「操作前データ」も通番と対応付けて第1の差分DB41に格納する。
この例では、「データ種」には、マスタDB43を操作したことを示す文字列「DB」が格納される。また、「表名」には、「社員名簿」等のように操作が行われたデータベースの表名が格納される。更に、「主キー」には、操作が行われたレコード43aを一意に特定する属性が格納される。上記の「社員名簿」の場合には属性「社員番号」が主キーとなる。そして、「操作内容」は、レコード43aに対して行われた操作を示す「挿入」、「更新」、及び「削除」のいずれかが格納される。また、「操作前データ」には、操作前におけるレコード43aのデータが格納される。
この後は、第1のサーバ21の業務が終わるまでステップS31〜S34を繰り返す。
また、第2のサーバ22も同様にして上記のステップS31〜S34を実行する。
図18は、図17のフローチャートに従って各サーバ21、22が各採番DB31、32と各差分DB41、42の各々にアクセスする際の模式図である。
図18に示すように、本実施形態では、第1のサーバ21がアクセスする第1の採番DB31と第1の差分DB41の各々を、第2のサーバ22がアクセスする第2の採番DB32と第2の差分DB42の各々と別にした。そのため、第1のサーバ21が第1の採番DB31にアクセスするステップS33と、第2のサーバ22が第2の採番DB32にアクセスするステップS33とを排他的に行わなくても、各採番DB31、32の一貫性が保たれる。同様に、各サーバ21、22のそれぞれのステップS34を排他的に行わなくても各差分DB41、42の一貫性が保たれる。
その結果、第1のサーバ21がステップS33を実行してから第2のサーバ22がステップS34を終えるまでのレスポンスタイムT1を、図4のレスポンスタイムT0よりも短くすることができる。
次に、レプリカDB作成サーバ24が行う情報処理方法について説明する。レプリカDB作成サーバ24が行う情報処理方法は、チェックポイントDB44を操作する処理と、レプリカDB45を作成する処理とがある。
最初に、チェックポイントDB44を操作する場合の情報処理方法について説明する。
図19は、チェックポイントDB44を操作するときにレプリカDB作成サーバ24が行う情報処理方法のフローチャートである。
まず、操作部69が、チェックポイントDB44を操作することにより、チェックポイントDB44に文字列「CKPT」を挿入する(ステップS35)。
次いで、チェックポイントDB44の操作があったことを検知部70が検知し、これを契機として特定部71が各採番DB31、32における最新の通番に1を加えた通番を特定する(ステップS36)。
そして、通番格納部72が、特定部71が特定した通番を、チェック期間CTの終点を示す終点識別子として各差分DB41、42に格納する(ステップS37)。このとき、通番格納部72は、図10のP57と同様に、終点識別子と文字列「CKPT」とを対応付けて各差分DB41、42に格納する。
この後は、チェック期間CTに1回の周期でステップS35〜S37を繰り返す。
以上により、チェックポイントDB44を操作するときにレプリカDB作成サーバ24が行う情報処理方法の基本処理を終える。
次に、レプリカDB45を作成する場合の情報処理方法について説明する。
図20及び図21は、レプリカDB45を作成するときにレプリカDB作成サーバ24が行う情報処理方法のフローチャートである。
この情報処理方法は、レプリカDB作成サーバ24が後述の情報処理プログラムを実行することにより行われ、管理者が当該情報処理プログラムを起動することにより開始する。
まず、検知部70が、チェックポイントDB44に対する操作があるかを検知する(ステップS41)。例えば、検知部70は、操作部69がチェックポイントDB44に文字列「CKPT」を挿入したときにチェックポイントDB44が操作されたことを検知する。
ここで、操作がない場合(ステップS41:否定)にはステップS42に移る。ステップS42ではレプリカDB作成サーバ24が一定の時間だけ待機した後に再びステップS41に戻る。
一方、操作がある場合(ステップS41:肯定)にはステップS43に移る。
ステップS43においては、第1の採番DB31における最新の通番に1を加えた終点識別子を特定部71が特定する。ステップS43は、各採番DB31、32の数だけ繰り返される。よって、ステップS43においては、特定部71は、第2の採番DB32における最新の通番に1を加えた終点識別子も特定する。
次に、生成部75が、各差分DB41、42の各々から終点識別子よりも順序が先の差分レコード49を取得し、これらの差分レコード49から主キー一覧80を記憶部62に生成する(ステップS44)。例えば、生成部75は、第1の差分DB41の複数の差分レコード49のうちで、「主キー」と「表名」が第2の差分DB42の差分レコード49におけるのと同じレコードを特定する。そして、生成部75は、特定した差分レコード49の「主キー」、「表名」、及び「操作前データ」を記憶部62の主キー一覧80に格納する。
これにより、図13のP71と同様に、第1のサーバ21と第2のサーバ22の両方から操作されたレコード43aに対応した差分レコード49が記憶部62に退避されることになる。
次いで、データ取得部67が、終点識別子よりも順序が先の差分レコード49を、第1の差分DB41から通番順に取得する(ステップS45)。ステップS45は各差分DB41、42ごとに行われる。よって、データ取得部67は、第2の差分DB42にある差分レコード49についても同様に取得する。
更に、この例では、チェック期間CTに一度だけ行われるチェックポイントDB44に対する操作があった場合(ステップS41:肯定)にステップS45が実行される。これにより、データ取得部67は、終点識別子よりも順序が先の差分レコード49を、チェック期間において操作されたレコード43aに対応した差分レコード49として取得することになる。
次に、判定部76が、ステップS45で取得した差分レコード49の「表名」と「主キー」が主キー一覧80にあるかを判定する(ステップS46)。ここで、ないと判定された場合(ステップS46:否定)にはステップS47に移る。
ステップS47においては、データ格納部73が、ステップS45で取得した差分レコード49に含まれる操作後データをレプリカDB45に格納する。ステップS45〜S47は、ステップS43で取得した終点識別子よりも順序が先の差分レコード49に対して通番順に行われる。これにより、データ格納部73は、通番順に操作後データをレプリカDB45に格納することになる。
一方、ステップS46で差分レコード49の「表名」と「主キー」が主キー一覧80にあると判定された場合(ステップS46:肯定)は、該差分レコード49に対応するレコード43aが各サーバ21、22から操作されたことになる。この場合には、図13に例示したように、当該レコード43aに対する複数の操作のうちで最後の操作に対応した差分レコード49の操作後データのみをレプリカDB45に格納する必要があるため、ステップS47をスキップする。
次に、判定部76が、記憶部62に主キー一覧80があるかどうかを判定する(ステップS48)。
ここで、主キー一覧80があると判定された場合(ステップS48:肯定)は、第1のサーバ21と第2のサーバ22の両方から操作が行われたマスタDB43のレコード43aが存在することになる。この場合には、図13を参照して説明したように、最後に操作されたレコード43aに対応する差分レコード49を状態遷移50に基づいて以下のように特定する。
まず、データ取得部67が、各差分DB41、DB42にある複数の差分レコード49のうち、「表名」と「主キー」が主キー一覧80に存在する差分レコード49を各差分DB41、42から取得する(ステップS49)。このようにして取得した複数の差分レコード49の各々には、同一のレコード43aを各サーバ21、22が操作したときの操作後データが格納されている。
次に、データ格納部73が、複数の差分レコード49の各々を、図11の状態遷移50を利用して操作順に並べ替えることにより、最後に操作されたレコード43aに対応した差分レコード49を特定する(ステップS50)。一例として、データ格納部73は、複数の差分レコード49の「操作内容」、「操作前データ」、及び「操作後データ」の各々が状態遷移50と整合するように差分レコード49を並べ替える。そして、データ格納部73は、その並びの最後にある差分レコード49を、最後に操作されたレコード43aに対応した差分レコード49であると特定する。
図13を参照して説明したように、このように状態遷移50を利用して差分レコード49を並べ替えることにより、タイムスタンプを利用しなくても最後の差分レコード49を正確に求めることができる。
次に、データ格納部73が、ステップS49で取得した複数の差分レコード49のうちで、ステップS50で特定した最後の差分レコード49の操作後データのみをレプリカDB45に格納する(ステップS51)。
次いで、生成部75が、記憶部62から主キー一覧80を削除する(ステップS52)。なお、前述のステップS48で記憶部62に主キー一覧80がないと判定された場合にも主キー一覧80を削除する。
続いて、削除部74が、終点識別子よりも順序が先の通番を含む差分レコード49を各差分DB41、42の各々から削除する(ステップS53)。図10の例では、削除部74は、第1の差分DB41における終点識別子である「5」よりも先の通番「1」〜「4」を含む差分レコード49を削除する。また、削除部74は、第2の差分DB42における終点識別子である「8」よりも先の通番「5」〜「7」を含む差分レコード49を削除する。
次いで、判定部76が、管理者から情報処理プログラムの実行を終了する指示があったかを判定する(ステップS54)。ここで、指示がない場合(ステップS54:否定)にはステップS41に戻る。
一方、指示があった場合(ステップS54:肯定)には処理を終える。
以上により、レプリカDB作成サーバ24が行う情報処理方法の基本処理が終了する。
上記した本実施形態によれば、図18に示したように、第1及び第2のサーバ21、22ごとに第1及び第2の採番DB31、32を設ける。そして、本実施形態では各サーバ21、22ごとに第1及び第2の差分DB41、42を設けため、レスポンスタイムT1を短くすることができる。
しかも、図20のステップS47において、データ格納部73が通番順に操作後データをレプリカDB45に格納する。これにより、操作が行われた順に操作後データがレプリカDB45に格納されるため、レプリカDB45の一貫性を保証できる。
更に、同一レコード43aについての差分レコード49が各差分DB41、42にある場合には、ステップS51において、データ格納部73が、最後に操作された差分レコード49の操作後データのみをレプリカDB45に格納する。そのため、第1のサーバ21と第2のサーバ22の両方が同一のレコード43aを操作した場合であっても、レプリカDB45の一貫性を保つことができる。
更に、操作部69がチェック期間CTごとにチェックポイントDB44を操作するため、チェック期間CTごとにステップS41でYESと判定されてステップS47が実行される。その結果、ステップS47において、データ格納部73が、チェック期間CTにおいて操作されたレコード43aの操作後データを一括してレプリカDB45に格納できる。
(ハードウェア構成)
図22は、本実施形態に係る第1のサーバ21と第2のサーバ22の各々のハードウェア構成図である。
図22に示すように、各サーバ21、22は、記憶装置21a、メモリ21b、プロセッサ21c、及び通信インターフェース21dを有する。これらの各部は、バス21gにより相互に接続される。
このうち、記憶装置21aは、HDDやSSD等の不揮発性のストレージであって、本実施形態に係る各サーバ21、22用の情報処理プログラム100を記憶する。
なお、情報処理プログラム100をコンピュータが読み取り可能な記録媒体90に記録させておき、プロセッサ21cに記録媒体90の情報処理プログラム100を読み取らせるようにしてもよい。
そのような記録媒体90としては、例えばCD-ROM(Compact Disc - Read Only Memory)、DVD(Digital Versatile Disc)、及びUSB(Universal Serial Bus)メモリ等の物理的な可搬型記録媒体がある。また、フラッシュメモリ等の半導体メモリやハードディスクドライブを記録媒体90として使用してもよい。これらの記録媒体90は、物理的な形態を持たない搬送波のような一時的な媒体ではない。
更に、公衆回線、インターネット、及びLAN(Local Area Network)等に接続された装置に情報処理プログラム100を記憶させてもよい。その場合は、プロセッサ21cがその情報処理プログラム100を読み出して実行すればよい。
一方、メモリ21bは、DRAM(Dynamic Random Access Memory)等のようにデータを一時的に記憶するハードウェアであって、その上に情報処理プログラム100が展開される。
プロセッサ21cは、CPU(Central Processing Unit)やGPU(Graphical Processing Unit)等のハードウェアであって、メモリ21bと協働して情報処理プログラム100を実行する。
このようにメモリ21bとプロセッサ21cとが協働して情報処理プログラム100を実行することにより図14の制御部52が実現される。その制御部52には、受付部53、操作部54、通番取得部55、及びデータ格納部56の各処理部が含まれる。
更に、通信インターフェース21dは、各サーバ21、22をネットワーク26(図5参照)に接続するためのNIC(Network Interface Card)等の通信インターフェースである。その通信インターフェース21dにより、図14の通信部51が実現される。
図23は、本実施形態に係るレプリカDB作成サーバ24のハードウェア構成図である。
図23に示すように、レプリカDB作成サーバ24は、記憶装置24a、メモリ24b、プロセッサ24c、及び通信インターフェース24dを有する。これらの各部は、バス24gにより相互に接続される。
このうち、記憶装置24aは、HDDやSSD等の不揮発性のストレージであって、本実施形態に係るレプリカDB作成サーバ24用の情報処理プログラム101を記憶する。
なお、情報処理プログラム101をコンピュータが読み取り可能な記録媒体90に記録させておき、プロセッサ21cに記録媒体90の情報処理プログラム101を読み取らせるようにしてもよい。
更に、公衆回線、インターネット、及びLAN等に接続された装置に情報処理プログラム100を記憶させてもよい。その場合は、プロセッサ24cがその情報処理プログラム101を読み出して実行すればよい。
一方、メモリ24bは、DRAM等のようにデータを一時的に記憶するハードウェアであって、その上に情報処理プログラム101が展開される。
プロセッサ24cは、レプリカDB作成サーバ24の各部を制御するCPUやGPU等のハードウェアである。また、プロセッサ24cは、メモリ24bと協働して情報処理プログラム101を実行する。
このようにメモリ24bとプロセッサ24cとが協働して情報処理プログラム101を実行することにより図15の制御部63が実現される。その制御部63には、データ取得部67、通番取得部68、操作部69、検知部70、特定部71、通番格納部72、データ格納部73、削除部74、生成部75、及び判定部76の各部が含まれる。
また、図15の記憶部62は、記憶装置24aとメモリ24bによって実現される。
更に、通信インターフェース24dは、レプリカDB作成サーバ24をネットワーク26(図5参照)に接続するためのNIC等の通信インターフェースである。その通信インターフェース24dにより、図15の通信部61が実現される。
以上説明した各実施形態に関し、更に以下の付記を開示する。
(付記1) 第1のデータベースの複数のレコードの各々を複数のサーバが操作した後の該レコードのデータと、前記操作が行われた順序を示す識別子とを対応付けて記憶した、複数の前記サーバごとに設けられた複数の第2のデータベースから、第1の期間に記憶された前記データを取得するデータ取得部と、
取得した前記データを、前記識別子が示す順に第3のデータベースに格納するデータ格納部と、
を有することを特徴とする情報処理装置。
(付記2) 前記データ格納部は、同一の前記レコードの前記データが複数の前記第2のデータベースに存在する場合に、同一の前記レコードの前記データのうちで、最後に操作された前記レコードの前記データのみを前記第3のデータベースに格納することを特徴とする付記1に記載の情報処理装置。
(付記3) 前記第2のデータベースは、前記識別子、前記データ、前記操作の内容、及び前記操作をする前の前記レコードのデータの各々を対応付けて記憶し、
前記データ格納部は、
取得した前記データと、該データに対応する前記操作の内容と、該データに対応する前記操作をする前の前記データと、複数の前記操作の間で許容される状態遷移とに基づいて、最後に操作された前記レコードを特定することを特徴とする付記2に記載の情報処理装置。
(付記4) 前記第1の期間に第4のデータベースが操作されたことを検知する検知部と、
前記検知部が前記操作を検知したときに、前記識別子を複数の前記サーバごとに記憶した複数の第5のデータベースを参照して、各々の前記第5のデータベースにおける最新の前記識別子に1を加えた前記識別子を特定する特定部と、
特定した前記識別子に対応した前記サーバに対応付けられた前記第2のデータベースに、該識別子を、前記第1の期間の終点を示す終点識別子として格納する識別子格納部と、
前記データ取得部が前記データを取得した後に、前記終点識別子よりも順序が先の前記識別子と対応付けられた前記データを、複数の前記第2のデータベースの各々から削除する削除部とを更に有し、
前記データ取得部は、
前記第2のデータベースにおいて前記終点識別子よりも順序が先の前記データを、前記第1の期間における前記データとして取得することを特徴とする付記1に記載の情報処理装置。
(付記5) 前記第1の期間ごとに前記第4のデータベースを操作する操作部を更に有することを特徴とする付記4に記載の情報処理装置。
(付記6) 情報処理装置と複数のサーバとを備えた情報処理システムであって、
複数の前記サーバの各々は、
第1のデータベースのレコードを操作する操作部と、
複数の前記サーバの各々に対応した複数の第2のデータベースのうちで自装置に対応する前記第2のデータベースに、前記操作をした後の前記レコードのデータを、前記操作を行った順序を示す識別子に対応付けて格納する第1のデータ格納部とを有し、
前記情報処理装置は、
複数の前記第2のデータベースの各々から、第1の期間に記憶された前記データを取得するデータ取得部と、
取得した前記データを、前記識別子が示す順に第3のデータベースに格納する第2のデータ格納部とを有する、
ことを特徴とする情報処理システム。
(付記7) 前記第2のデータ格納部は、同一の前記レコードにおける前記データが複数の前記第2のデータベースに存在する場合に、同一の前記レコードの前記データのうちで、最後に操作された前記レコードに対応する前記データのみを前記第3のデータベースに格納することを特徴とする付記6に記載の情報処理システム。
(付記8) 前記第1のデータ格納部は、前記第2のデータベースに、前記識別子、前記データ、前記操作の内容、及び前記操作をする前の前記レコードのデータの各々を対応付けて格納し、
前記第2のデータ格納部は、
取得した前記データと、該データに対応する前記操作の内容と、該データに対応する前記操作をする前の前記データと、複数の前記操作の間で許容される状態遷移とに基づいて、最後に操作された前記レコードを特定することを特徴とする付記7に記載の情報処理システム。
(付記9) コンピュータに、
第1のデータベースの複数のレコードの各々を複数のサーバが操作した後の該レコードのデータと、前記操作が行われた順序を示す識別子とを対応付けて記憶した、複数の前記サーバごとに設けられた複数の第2のデータベースから、第1の期間に記憶された前記データを取得し、
取得した前記データを、前記識別子が示す順に第3のデータベースに格納する、
処理を実行させるための情報処理プログラム。
(付記10) 前記コンピュータに、
同一の前記レコードにおける前記データが複数の前記第2のデータベースに存在する場合に、同一の前記レコードの前記データのうちで、最後に操作された前記レコードに対応する前記データのみを前記第3のデータベースに格納する、
処理を実行させるための付記9に記載の情報処理プログラム。
(付記11) 前記第2のデータベースは、前記識別子、前記データ、前記操作の内容、及び前記操作をする前の前記レコードのデータの各々を対応付けて記憶し、
前記コンピュータに、
取得した前記データと、該データに対応する前記操作の内容と、該データに対応する前記操作をする前の前記データと、複数の前記操作の間で許容される状態遷移とに基づいて、最後に操作された前記レコードを特定する、
処理を実行させるための付記10に記載の情報処理プログラム。
1…システム、2…業務サーバ、3…ディスク装置、4…レプリカDB作成サーバ、5…クライアント端末、6…ネットワーク、7…業務アプリ、8…DB管理アプリ、20…情報処理システム、21…第1のサーバ、22…第2のサーバ、23…ディスク装置、24…レプリカDB作成サーバ、25…クライアント端末、26…ネットワーク、31…第1の採番DB、32…第2の採番DB、41…第1の差分DB、42…第2の差分DB、43…マスタDB、43a…レコード、44…チェックポイントDB、45…レプリカDB、49…差分レコード、51…通信部、52…制御部、53…受付部、54…操作部、55…通番取得部、56…データ格納部、61…通信部、62…記憶部、63…制御部、67…データ取得部、68…通番取得部、69…操作部、70…検知部、71…特定部、72…通番格納部、73…データ格納部、74…削除部、75…生成部、76…判定部、80…主キー一覧、CT…チェック期間。

Claims (5)

  1. 第1のデータベースの複数のレコードの各々を複数のサーバが操作した後の該レコードのデータと、前記操作が行われた順序を示す識別子とを対応付けて記憶した、複数の前記サーバごとに設けられた複数の第2のデータベースから、第1の期間に記憶された前記データを取得するデータ取得部と、
    取得した前記データを、前記識別子が示す順に第3のデータベースに格納するデータ格納部と、
    を有することを特徴とする情報処理装置。
  2. 前記データ格納部は、同一の前記レコードの前記データが複数の前記第2のデータベースに存在する場合に、同一の前記レコードの前記データのうちで、最後に操作された前記レコードの前記データのみを前記第3のデータベースに格納することを特徴とする請求項1に記載の情報処理装置。
  3. 前記第2のデータベースは、前記識別子、前記データ、前記操作の内容、及び前記操作をする前の前記レコードのデータの各々を対応付けて記憶し、
    前記データ格納部は、
    取得した前記データと、該データに対応する前記操作の内容と、該データに対応する前記操作をする前の前記データと、複数の前記操作の間で許容される状態遷移とに基づいて、最後に操作された前記レコードを特定することを特徴とする請求項2に記載の情報処理装置。
  4. 情報処理装置と複数のサーバとを備えた情報処理システムであって、
    複数の前記サーバの各々は、
    第1のデータベースのレコードを操作する操作部と、
    複数の前記サーバの各々に対応した複数の第2のデータベースのうちで自装置に対応する前記第2のデータベースに、前記操作をした後の前記レコードのデータを、前記操作を行った順序を示す識別子に対応付けて格納する第1のデータ格納部とを有し、
    前記情報処理装置は、
    複数の前記第2のデータベースの各々から、第1の期間に記憶された前記データを取得するデータ取得部と、
    取得した前記データを、前記識別子が示す順に第3のデータベースに格納する第2のデータ格納部とを有する、
    ことを特徴とする情報処理システム。
  5. コンピュータに、
    第1のデータベースの複数のレコードの各々を複数のサーバが操作した後の該レコードのデータと、前記操作が行われた順序を示す識別子とを対応付けて記憶した、複数の前記サーバごとに設けられた複数の第2のデータベースから、第1の期間に記憶された前記データを取得し、
    取得した前記データを、前記識別子が示す順に第3のデータベースに格納する、
    処理を実行させるための情報処理プログラム。
JP2020074859A 2020-04-20 2020-04-20 情報処理装置、情報処理システム、及び情報処理プログラム Active JP7428894B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020074859A JP7428894B2 (ja) 2020-04-20 2020-04-20 情報処理装置、情報処理システム、及び情報処理プログラム
US17/156,673 US11561958B2 (en) 2020-04-20 2021-01-25 Information processing device and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020074859A JP7428894B2 (ja) 2020-04-20 2020-04-20 情報処理装置、情報処理システム、及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021174065A true JP2021174065A (ja) 2021-11-01
JP7428894B2 JP7428894B2 (ja) 2024-02-07

Family

ID=78081764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020074859A Active JP7428894B2 (ja) 2020-04-20 2020-04-20 情報処理装置、情報処理システム、及び情報処理プログラム

Country Status (2)

Country Link
US (1) US11561958B2 (ja)
JP (1) JP7428894B2 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778395A (en) 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
JPH11167510A (ja) 1997-12-04 1999-06-22 Hitachi Ltd レプリケーション方法、レプリケーションツール、および、レプリケーションサーバ
US6738748B2 (en) * 2001-04-03 2004-05-18 Accenture Llp Performing predictive maintenance on equipment
AU2003298731A1 (en) * 2002-11-26 2004-06-18 Digimarc Id Systems Systems and methods for managing and detecting fraud in image databases used with identification documents
US7647344B2 (en) * 2003-05-29 2010-01-12 Experian Marketing Solutions, Inc. System, method and software for providing persistent entity identification and linking entity information in an integrated data repository
US7403945B2 (en) * 2004-11-01 2008-07-22 Sybase, Inc. Distributed database system providing data and space management methodology
US7962458B2 (en) * 2008-06-12 2011-06-14 Gravic, Inc. Method for replicating explicit locks in a data replication engine
JP2012155634A (ja) 2011-01-28 2012-08-16 Fujitsu Frontech Ltd 情報処理プログラム、情報処理装置および情報処理方法
US10909143B1 (en) * 2017-04-14 2021-02-02 Amazon Technologies, Inc. Shared pages for database copies
US11429576B2 (en) * 2019-07-23 2022-08-30 Macrometa Corporation Methods and systems for garbage deletion in a document database

Also Published As

Publication number Publication date
US11561958B2 (en) 2023-01-24
US20210326323A1 (en) 2021-10-21
JP7428894B2 (ja) 2024-02-07

Similar Documents

Publication Publication Date Title
US8843454B2 (en) Elimination of duplicate objects in storage clusters
EP3079078B1 (en) Multi-version concurrency control method in database, and database system
CN109086388B (zh) 区块链数据存储方法、装置、设备及介质
US7523141B2 (en) Synchronization operations involving entity identifiers
US8843449B2 (en) Unobtrusive copies of actively used compressed indices
JP2020502626A (ja) データベース・システムにおけるテスト・データの形成及び動作
EP3495964B1 (en) Apparatus and program for data processing
KR101085735B1 (ko) 기초 테이블로부터 삭제된 행을 식별하는 컴퓨터 구현 방법, 기초 테이블에 삽입된 행을 식별하는 컴퓨터 구현 방법, 삭제된 행의 식별 시스템, 삽입된 행의 식별 시스템, 및 컴퓨터 판독가능 저장 매체
JP2009522677A (ja) ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス
WO2007099636A1 (ja) ファイルシステム移行方法、ファイルシステム移行プログラム及びファイルシステム移行装置
US20060004877A1 (en) Method and system for data processing with data replication for the same
JP7428894B2 (ja) 情報処理装置、情報処理システム、及び情報処理プログラム
US8554722B2 (en) Method for transferring data into database systems
KR102214697B1 (ko) 데이터베이스 관리 시스템에서 데이터 저장을 위한 공간 관리를 제공하는 컴퓨터 프로그램
US8510269B2 (en) Uninterrupted database index reorganization/movement
JP4825504B2 (ja) データ登録・検索システムおよびデータ登録・検索方法
JP3769775B2 (ja) 分散リンク情報維持方法
JP5960798B2 (ja) データベースの管理方法
JP6239697B2 (ja) データベースの管理方法
JP2000132435A (ja) 異種データベース管理システム間のデータ整合処理装置
CN112685431B (zh) 异步缓存方法、装置、系统、电子设备和存储介质
US11687564B2 (en) Continuous real-time masked database replication
WO2023276212A1 (ja) ソフトウェア部品更新システム及びソフトウェア部品更新方法
US8171003B2 (en) Method and apparatus for changing reference of database
KR102513228B1 (ko) 데이터 변환 규칙에 따라 데이터의 표시 형식을 자동 변환하여 이관할 수 있는 전자 장치 및 그 동작 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240108

R150 Certificate of patent or registration of utility model

Ref document number: 7428894

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150