JP5924117B2 - コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム - Google Patents
コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム Download PDFInfo
- Publication number
- JP5924117B2 JP5924117B2 JP2012113466A JP2012113466A JP5924117B2 JP 5924117 B2 JP5924117 B2 JP 5924117B2 JP 2012113466 A JP2012113466 A JP 2012113466A JP 2012113466 A JP2012113466 A JP 2012113466A JP 5924117 B2 JP5924117 B2 JP 5924117B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- server
- database
- computer
- received
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2035—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[第1の実施の形態]
第1の実施の形態について図1を用いて説明する。
情報処理システム1は、図1に示すように、複数のコンピュータ2〜5が相互に送受信可能にネットワーク6を介して接続されている。
読み出し高速型のDB2bに対して、更新のためにオブジェクトAを書き込む場合には、コンピュータ2は、ランダムアクセスにより、インデックスの位置情報等に基づいて特定した書き込み箇所に、直接アクセスして書き込む。一方、DB2bからオブジェクトAを読み出す場合には、シーケンシャルアクセスにより、オブジェクトAのブロックA−1,A−2,A−3を先頭から順番に読み出す。このようにDB2bでは、オブジェクトAの書き込みは、ブロックごとのランダムアクセスとなるが、オブジェクトAの読み出しは、連続したブロックへのシーケンシャルなアクセスとなる。DBへのアクセスは、ランダムアクセスよりシーケンシャルアクセスの方が効率よく行うことができる。すなわち、DB2bは、読み出し機構の方が書き込み機構よりも効率的である。
コンピュータ3は、DB3aにデータD1を保持していると共に、コンピュータ4のDB4aにも、データD1と同一の内容のデータD2を予め保持させて、データを冗長化させている。
次に第2の実施の形態について説明する。第2の実施の形態は、第1の実施の形態のより規模の大きなクライアント・サーバ型の分散ストレージシステムにおいて、サーバ故障時の信頼性の低下を抑制したものである。
図4は、第2の実施の形態に係るサーバシステムの一例を示す図である。サーバシステム10は、図4に示すように、複数のDBサーバ100,200,300,400,500,・・・や、その他のサーバ600が相互に送受信可能にネットワーク20を介して接続されている。
図5は、第2の実施の形態に係るDBサーバのハードウェアの一例を示すブロック図である。
図6は、第2の実施の形態に係るDBサーバの機能の一例を示すブロック図である。
運用DB111は、サーバ600が使用するデータを格納するデータベースである。運用DB111は、オブジェクト単位のデータを格納する。また、運用DB111は、シーケンシャルに読み出しを行うことができるデータ配列で、データが格納されている。
図7は、第2の実施の形態に係るサーバ状態管理テーブルの一例を示す図である。サーバ状態管理テーブル113は、DBサーバ100以外のDBサーバ200,300,400,500,・・・の稼働状態を表すサーバ状態情報を記録するものである。例えば、サーバ状態管理テーブル113には、DBサーバ200,300,400,500,・・・の識別子に対応付けて、サーバの稼働状態が設定されている。図7の例では、識別子「B,C,E,F」の各サーバに対しては稼働中を表す「1」が、識別子「D」のサーバに対しては故障中を表す「0」がそれぞれ記録されている。
図10は、第2の実施の形態に係るサーバシステムのデータのやりとりの一例を示す図である。
この際に、例えば、図10に示すように、DBサーバ100,200,300,400,500,・・・のうち、DBサーバ200が故障した場合を想定する。この場合には、DBサーバ200に格納されていた複数のスロットそれぞれを保持する他のDBサーバ100,300,400,500,・・・が相互にコピー元、コピー先となり、DBサーバ200が保持していたスロットに含まれるオブジェクトがコピーされる。このようにして、DBサーバ100,300,400,500,・・・間では、スロットに含まれるオブジェクトの送受信が行われることにより、DBサーバ200に格納されていた複数のスロットの冗長化が迅速に回復される。
図11は、第2の実施の形態に係るDBサーバのスロットのコピー実行通知の処理手順の一例を示すフローチャートである。
[ステップS12] サーバ状態監視部122は、受信部121が受信したサーバ状態情報に基づき、サーバ状態管理テーブル113を更新する。
故障している他のDBサーバが存在している場合(例えば、DBサーバ200)には、DBサーバ100はステップS14の処理を実行する。存在していない場合には、スロットのコピー実行通知の処理を終了する。
[ステップS17] 送信部125は、コピー先決定部124から通知されたスロット格納情報の更新要求を、自身を除く全DBサーバ300,400,500,・・・に対して送信する。
[ステップS21] DBサーバ100の受信部121は、他のDBサーバ300,400,500,・・・からスロット格納情報の更新要求を受信する。この際、複数のDBサーバ400,500,・・・からスロット格納情報の更新要求が通知される可能性がある。そこで受信部121は、例えば、最初のスロット格納情報の更新要求の受信から一定の時間だけ、他のDBサーバからのスロット格納情報の更新要求の受信を待ち、その後、次のステップS22の処理を開始する。
[ステップS23] コピー先判定部127は、更新されたスロット格納管理テーブル114を参照して、DBサーバ100自身がスロットのコピー先として決定されているか否かを判別する。
[ステップS25] DB管理部129は、DBサーバ300から送信されたスロットのオブジェクトをリカバリDB112に書き込む。このときDB管理部129は、リカバリ中オブジェクト一覧115に、書き込んだオブジェクトの識別情報を登録する。
[ステップS31] DBサーバ100の受信部121は、サーバ600からDBサーバ200に格納していたものと同じスロットに含まれるオブジェクトの書き込み要求を受信する。
当該オブジェクトがリカバリ中オブジェクト一覧115に含まれている場合には、DBサーバ100は、ステップS33の処理を実行する。含まれていない場合には、DBサーバ100は、ステップS35の処理を実行する。
なお、この際、リカバリDB112には、書き込み対象のオブジェクトが格納されている。
サーバ600からオブジェクトの書き込み要求が通知されるごとに、このような処理が実行される。
[ステップS41] DBサーバ100の受信部121は、サーバ600からDBサーバ200に格納していたものと同じオブジェクトの読み出し要求を受信する。
当該オブジェクトがリカバリ中オブジェクト一覧115に含まれている場合には、DBサーバ100は、ステップS43の処理を実行する。含まれていない場合には、DBサーバ100は、ステップS44の処理を実行する。
[ステップS44] DB管理部129は、運用DB111から、読み出し対象のオブジェクトを読み出す。その後、読み出し処理が終了する。
第3の実施の形態では、複数のHDDを別途用意して、リカバリ処理を実行する際に、用意しておいたHDDをサーバに接続するものである。
図17は、第3の実施の形態において1台のDBサーバが故障したときのサーバシステムの運用状況の一例を示す図である。DBサーバ711が故障すると、第2の実施の形態と同様に、他のDBサーバ712〜715がDBサーバ711の故障を検知する。このとき第3の実施の形態では、DBサーバ711の故障を検知したDBサーバ712〜715それぞれが、管理サーバ730にHDD割り当て要求を送信する。このHDD割り当て要求に応答し、管理サーバ730が、DBサーバ712〜715に対してHDDの追加割り当てを行う。
[その他の実施の形態]
第1・第2の実施の形態では、HDD内にDBを構築するものとしているが、HDD以外の記憶装置にDBを構築してもよい。例えばSSDにDBを構築することもできる。またHDDに代えて、RAID(Redundant Array of Inexpensive Disks)装置を用いることもできる。
2,3,4,5 コンピュータ
2a,2b,3a,4a データベース
2c 格納手段
2d コピー手段
2e データ更新手段
6 ネットワーク
D1,D2 データ
Claims (7)
- 故障した第1の装置が保持していたデータと同一内容のデータを第2の装置から受信すると、読み出しがランダムアクセスとなり、書き込みがシーケンシャルアクセスとなるデータ構造の第1のデータベースに、該受信したデータを格納する格納手段と、
前記第1のデータベースに格納されたデータを、書き込みがランダムアクセスとなり、読み出しがシーケンシャルアクセスとなるデータ構造の第2のデータベースにコピーするコピー手段と、
を有するコンピュータ。 - 前記格納手段は、前記第1の装置が保持していたデータのうちの少なくとも1つのデータの識別情報を前記第2の装置から受信し、該受信した識別情報それぞれに対応するデータを受信した場合に、データ受信完了と判断し、
前記コピー手段は、前記格納手段がデータ受信完了と判断した後、コピーを開始する、
ことを特徴とする請求項1記載のコンピュータ。 - 前記格納手段は、前記第1の装置の故障を検知すると、未使用のストレージ装置内に前記第1のデータベースを構築し、前記第1のデータベースに格納したデータの前記第2のデータベースへのコピーが完了すると、前記ストレージ装置内の前記第1のデータベースを消去することを特徴とする請求項1または2記載のコンピュータ。
- 前記第1のデータベースに格納され、前記第2のデータベースへのコピーが済んでいないデータの更新要求を受信すると、該更新要求に含まれている更新後のデータを前記第2のデータベースに書き込み、該更新要求で指定された前記第1のデータベース内の更新元のデータを削除するデータ更新手段をさらに有することを特徴とする請求項1乃至3のいずれかに記載のコンピュータ。
- コンピュータが、
故障した第1の装置が保持していたデータと同一内容のデータを第2の装置から受信すると、読み出しがランダムアクセスとなり、書き込みがシーケンシャルアクセスとなるデータ構造の第1のデータベースに、該受信したデータを格納し、
前記第1のデータベースに格納されたデータを、書き込みがランダムアクセスとなり、読み出しがシーケンシャルアクセスとなるデータ構造の第2のデータベースにコピーする、
データ格納方法。
- コンピュータに、
故障した第1の装置が保持していたデータと同一内容のデータを第2の装置から受信すると、読み出しがランダムアクセスとなり、書き込みがシーケンシャルアクセスとなるデータ構造の第1のデータベースに、該受信したデータを格納し、
前記第1のデータベースに格納されたデータを、書き込みがランダムアクセスとなり、読み出しがシーケンシャルアクセスとなるデータ構造の第2のデータベースにコピーする、
処理を実行させるデータ格納プログラム。 - ネットワークを介して接続されたコンピュータの故障を検知すると、該故障したコンピュータが保持するデータと同一内容のデータを、第1のデータベース内から読み出し、該読み出したデータを、前記ネットワークを介して送信する第1のコンピュータと、
前記第1のコンピュータが送信したデータを、前記ネットワークを介して受信し、読み出しがランダムアクセスとなり、書き込みがシーケンシャルアクセスとなるデータ構造の第2のデータベースに、該受信したデータを格納し、前記第2のデータベースに格納されたデータを、書き込みがランダムアクセスとなり、読み出しがシーケンシャルアクセスとなるデータ構造の第3のデータベースにコピーする第2のコンピュータと、
を有する情報処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012113466A JP5924117B2 (ja) | 2012-05-17 | 2012-05-17 | コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム |
US13/850,379 US9430489B2 (en) | 2012-05-17 | 2013-03-26 | Computer, data storage method, and information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012113466A JP5924117B2 (ja) | 2012-05-17 | 2012-05-17 | コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013239117A JP2013239117A (ja) | 2013-11-28 |
JP5924117B2 true JP5924117B2 (ja) | 2016-05-25 |
Family
ID=49582155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012113466A Expired - Fee Related JP5924117B2 (ja) | 2012-05-17 | 2012-05-17 | コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9430489B2 (ja) |
JP (1) | JP5924117B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015065444A1 (en) * | 2013-10-31 | 2015-05-07 | Hewlett-Packard Development Company, L.P. | Network database hosting |
US20230409590A1 (en) * | 2022-06-10 | 2023-12-21 | Capital One Services, Llc | Methods and systems for generating recommendations in cloud-based data warehousing system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5727346A (en) * | 1980-07-28 | 1982-02-13 | Fujitsu Ltd | Restoration processing system at fault of doubling file |
JPH03191443A (ja) * | 1989-12-21 | 1991-08-21 | Hitachi Ltd | データベースの高速回復方式 |
JP3340431B2 (ja) * | 1990-03-07 | 2002-11-05 | 株式会社日立製作所 | データベース管理方法 |
JP4296120B2 (ja) * | 2004-04-09 | 2009-07-15 | 富士通株式会社 | 冗長構成復元方法、データ管理システム及び冗長構成復元プログラム |
US20070220059A1 (en) * | 2006-03-20 | 2007-09-20 | Manyi Lu | Data processing node |
US20090132621A1 (en) * | 2006-07-28 | 2009-05-21 | Craig Jensen | Selecting storage location for file storage based on storage longevity and speed |
JP2010097385A (ja) | 2008-10-16 | 2010-04-30 | Fujitsu Ltd | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム |
-
2012
- 2012-05-17 JP JP2012113466A patent/JP5924117B2/ja not_active Expired - Fee Related
-
2013
- 2013-03-26 US US13/850,379 patent/US9430489B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20130311430A1 (en) | 2013-11-21 |
JP2013239117A (ja) | 2013-11-28 |
US9430489B2 (en) | 2016-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8458398B2 (en) | Computer-readable medium storing data management program, computer-readable medium storing storage diagnosis program, and multinode storage system | |
US8386707B2 (en) | Virtual disk management program, storage device management program, multinode storage system, and virtual disk managing method | |
JP6056453B2 (ja) | プログラム、データ管理方法および情報処理装置 | |
JP5158074B2 (ja) | ストレージ管理プログラム、ストレージ管理方法、ストレージ管理装置およびストレージシステム | |
US8484413B2 (en) | Recording medium storing control program for decentralized data, storage management program, control node, and disk node | |
US8234467B2 (en) | Storage management device, storage system control device, storage medium storing storage management program, and storage system | |
US7480780B2 (en) | Highly available external storage system | |
CN101571815B (zh) | 信息系统及i/o处理方法 | |
JP5412882B2 (ja) | 論理ボリューム構成情報提供プログラム、論理ボリューム構成情報提供方法、および論理ボリューム構成情報提供装置 | |
US9971527B2 (en) | Apparatus and method for managing storage for placing backup data into data blocks based on frequency information | |
US20090265510A1 (en) | Systems and Methods for Distributing Hot Spare Disks In Storage Arrays | |
JP2009116783A (ja) | 障害の発生した記憶装置に記憶されているデータを修復するストレージシステム | |
US9336093B2 (en) | Information processing system and access control method | |
US10789007B2 (en) | Information processing system, management device, and control method | |
JP2010282324A (ja) | ストレージ制御装置、ストレージシステムおよびストレージ制御方法 | |
US10860224B2 (en) | Method and system for delivering message in storage system | |
US20180307427A1 (en) | Storage control apparatus and storage control method | |
JP5924117B2 (ja) | コンピュータ、データ格納方法、データ格納プログラム及び情報処理システム | |
US20230244385A1 (en) | Storage apparatus and control method | |
US20150135004A1 (en) | Data allocation method and information processing system | |
JP5640618B2 (ja) | 管理プログラム、管理装置、および管理方法 | |
JPWO2008126169A1 (ja) | ストレージ管理プログラム、ストレージ管理方法およびストレージ管理装置 | |
JP2012194867A (ja) | ストレージ装置および制御装置 | |
JP2010277342A (ja) | 管理プログラム、管理装置および管理方法 | |
JP2021009646A (ja) | ストレージ制御装置およびストレージ制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5924117 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |