JP6564349B2 - 保守減設システム、ノードおよび保守減設方法 - Google Patents
保守減設システム、ノードおよび保守減設方法 Download PDFInfo
- Publication number
- JP6564349B2 JP6564349B2 JP2016115035A JP2016115035A JP6564349B2 JP 6564349 B2 JP6564349 B2 JP 6564349B2 JP 2016115035 A JP2016115035 A JP 2016115035A JP 2016115035 A JP2016115035 A JP 2016115035A JP 6564349 B2 JP6564349 B2 JP 6564349B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- data
- information
- distribution
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
(1)保守者からの指示や、クラスタを構成するノードの減設を決定する所定のロジックに基づき、減設開始を決定する。
(2)減設するノード(以下、「減設ノード」と称する。)を削除した仮のID表を用いて、減設ノードの信号振り分けを停止する(以下、「振り分け先変更処理」と称する。)。
(3)冗長度を保つように、原本データの複製(複製データ)を再配置する(以下、「データ再配置」と称する。)。
(4)複製データを原本データに昇格させる(以下、「原本昇格」と称する。)。
(5)減設ノードを削除したID表に更新する(以下、「ID表更新」と称する。)。
(6)減設ノードをクラスタから切り離す。
図7は、従来の分散処理システム(高可用システム)における保守減設の処理シーケンスを示す図である。
ここで、ネットワーク管理装置5は、分散処理システムを構成する各ノード1全体を管理する装置である。また、クラスタを構成する各ノード1は、減設対象となるノードである減設ノード1bと、クラスタを構成する各ノード1のうち減設ノード1b以外のノードである既存ノード1aと、既存ノード1aの中で、上記したID表の管理等を行い、ノード1の代表として動作する代表ノード1Aと、が存在する。
次に、既存ノード1aは、複製完了確認通知を受信し、さらに、原本データの昇格処理が終了すると、データの再配置処理の完了通知を代表ノード1Aに送信する(ステップS18)。また、減設ノード1bは、複製完了確認通知を受信すると、データの再配置処理の完了通知を代表ノード1Aに送信する(ステップS18)。
まず、本発明を実施するための形態(以下、「本実施形態」と称する。)に係る保守減設システム1000を含む分散処理システム(高可用システム)Sについて説明する。
図1は、本実施形態に係る保守減設システム1000を含む分散処理システムSの全体構成を示す図である。
従来の保守減設の処理は図7で示したように、振り分け先変更処理→データ再配置→原本昇格→ID表更新の順で行われていた。しかしながら、この手順では、振り分け先変更処理において、減設ノードを除いた仮ID表での処理に移行した後、最終的にID表を更新するまでは、過渡期間となる。つまり、データの再配置や原本昇格のすべてが完了しないと、保守減設の処理が完了しない。
これに対し、本実施形態に係る保守減設システム1000では、振り分け先変更処理の後、本発明特有の限定的同期処理(詳細は後記)を実行する。その後、原本昇格を行い、ID表を更新し、最後に、データ再配置を行う。この限定的同期処理は、減設ノードが持つ原本データと、減設ノードが減設された後に新たに原本データに昇格する複製データとの間で、データ内容を一致させる同期処理を意味する。この限定的同期処理により、原本データの最新の状態が、その原本データの消滅後に昇格する複製データに同期される。そして、保守減設システム1000において、限定的同期処理の後、原本昇格とID表の更新を行うことで、保守減設処理に伴う過渡状態を終了する。つまり、データ再配置を、保守減設とは切り離して行うことができるため、過渡状態をより短い期間にすることが可能となる。
以下、本実施形態に係るノード1を含む保守減設システム1000について、具体的に説明する。
まず、本実施形態に係る保守減設システム1000を構成するノード1について、具体的に説明する。なお、本実施形態に係るノード1は、保守減設システム1000を構成する複数のノード1のうち、後記するノード識別子管理情報100(図3参照)、および、上記したID表(振り分けID情報200(図4参照))を管理する代表ノード1Aとなる場合と、代表ノード1Aからノード識別子管理情報100および振り分けID情報200を受け取り、各情報を更新して記憶する既存ノード1a(非代表ノード)になる場合とが存在する。なお、代表ノード1Aが行う処理等については、後記する。また、保守減設システム1000において、クラスタを構成する既存ノード1aのうち、減設対象となるノード1を減設ノード1bとして、以下において説明する。また、本実施形態に係るノード1の代表ノード1Aが、減設ノード1bを決定する処理に用いる情報の例として、ここでは、代表ノード1Aが外部装置から故障確率情報300(図5参照)を受信し、各ノード1の故障確率に基づき、減設ノード1bを決定する例として説明する。
図2に示すように、ノード1は、制御部10と、入出力部20と、記憶部30とを含んで構成される。
具体的には、ノード識別子管理部11は、自身が属する保守減設システム1000においてノード1の離脱(減設)等が発生した場合に、保守減設システム1000を構成するノード1の識別情報等が記憶されたノード識別子管理情報100(図3)を更新する。
図3に示すように、ノード識別子管理情報100には、保守減設システム1000を構成する各ノード1のノード識別子101とアドレス102(例えば、IPアドレス)とが対応付けられて格納される。
さらに、ノード識別子管理部11は、自身が代表ノード1Aのノード識別子管理部11である場合には、減設ノード決定部12により、減設するノード(減設ノード1b)が決定され、後記する保守減設処理部15の振り分け先変更処理部151により、減設ノード1bへの振り分けが停止されると、その減設ノード1bを削除した仮の振り分けID情報200k(仮ID表)を生成し、減設ノード1b以外の既存ノード1aに送信する。
また、ノード識別子管理部11は、自身が既存ノード1aのノード識別子管理部11である場合には、代表ノード1Aから仮の振り分けID情報200k(仮ID表)を受信し、自身の記憶部30に記憶する。また、ノード識別子管理部11は、振り分けID情報200の更新通知を代表ノード1Aから受信すると、仮の振り分けID情報200k(仮ID表)を用いて、現状の振り分けID情報200を更新する。
本実施形態においては、外部装置から地震等の災害による(近い)将来の故障確率情報を取得し、減設ノード決定部12が、所定の故障確率以上のノード1(被災して障害が発生する確率が高いノード)を、減設対象ノード(減設ノード1b)として決定する例として説明する。
故障確率情報300は、各拠点のノード1(サーバ)それぞれが、将来発生が予測される大規模災害等により故障する確率(障害が発生する確率)を示す情報である。なお、大規模災害等とは、例えば、台風や暴風雨、竜巻、落雷、大雨、河川の氾濫、津波、地震等であり、数日若しくは数秒から数時間後に、拠点が位置する地域において、上記災害による物理的な損傷(ネットワークの切断等も含む)や、停電の発生、若しくは、サーバの管理者がサーバ設置施設に近付けない等を含む障害によりサーバが使用不能となる予測される確率を示す情報である。
ノード識別子301は、クラスタを構成する各ノード1の識別子を表わし、図3および図4のノード識別子101,201と同様の情報である。
時刻302および故障確率303は、ノード識別子301に対応付けて格納される情報である。故障確率303には、時刻302(所定時刻)における当該サーバの故障確率(%)が格納される。なお、図5においては、時刻302は、1時間毎に設定される例を示している。
例えば、故障確率情報300の1行目に示すように、ノード識別子301のノード「A」は、時刻302で示される「2015年6月1日」の13時から14時の間の故障確率303が「10(%)」、14時から15時の間の故障確率303が「30(%)」、15時から16時の間の故障確率303が「40(%)」であることを示している。
この信号処理部14は、信号処理後に送付するメッセージに、例えば、SIP(Session Initiation Protocol)においては「Call-id」をもとに算出したハッシュ値を振り分けキーとして埋め込む(SIPにおいては、例えばTo/FromヘッダのTagに記載する。)ようにしてもよい。これにより、振り分け部13がそのメッセージの後続呼を受信した場合に、振り分けキーとして埋め込まれたハッシュ値を用いて、振り分けID情報200(図4)を参照し、その後続呼を担当するノード1を特定することができる。
この保守減設処理部15は、振り分け先変更処理部151と、限定的同期処理部152と、原本昇格処理部153と、データ再配置処理部154とを備える。
また、振り分け先変更処理部151は、ノード識別子管理部11に対し、減設ノード1bへの信号振り分けが停止されたことを通知する。これにより、ノード識別子管理部11に、所定のロジックに基づき、減設ノード1bが減設したものとする仮の振り分けID情報200k(仮ID表)を生成させる。
そして、振り分け先変更処理部151は、既存ノード1aおよび減設ノード1bのすべてに対し、生成した仮の振り分けID情報200k(仮ID表)を通知する。
具体的には、原本昇格対象データを有する既存ノード1aの限定的同期処理部152から、減設ノード1bの限定的同期処理部152に対し、同期要求を送信する。そして、減設ノード1bの限定的同期処理部152が、現状の振り分けID情報200を参照し、自身が原本として持つデータ(原本データ)を抽出し、当該原本データの情報を同期情報として同期要求を送信してきた既存ノード1aに送信する。このとき、減設ノード1bの限定的同期処理部152は、原本データと複製データとの間の差分情報のみを送信するようにしてもよい。
そして、原本昇格処理部153は、複製データを原本データに昇格したことを示す原本昇格完了通知を代表ノード1Aに送信する。
そして、代表ノード1Aの原本昇格処理部153は、自身の振り分けID情報200が更新されたことを契機として、既存ノード1aに対し、仮の振り分けID情報200k(仮ID表)を用いて、現状の振り分けID情報200を更新する指示情報であるID表更新通知を既存ノード1aに送信し、現状の振り分けID情報200を更新させる。
また、代表ノード1Aの原本昇格処理部153は、原本昇格処理が完了したことを示す原本昇格完了通知を、ネットワーク管理装置に送信する。
次に、本実施形態に係る保守減設システム1000が実行する、保守減設処理の流れについて説明する。
図6は、本実施形態に係る保守減設システム1000が実行する保守減設処理を示すシーケンス図である。
具体的には、既存ノード1aの限定的同期処理部152は、仮の振り分けID情報200k(仮ID表)を参照し、自身が持つ複製データのうち、原本昇格の対象となる複製データ(原本昇格対象データ)を抽出する(ステップS108)。
続いて、原本昇格対象データを有する既存ノード1aの限定的同期処理部152から、減設ノード1bの限定的同期処理部152に対し、同期要求を送信する(ステップS109)。そして、減設ノード1bの限定的同期処理部152が、現状の振り分けID情報200を参照し、自身が原本として持つデータ(原本データ)を抽出し、当該原本データの情報を同期情報として同期要求を送信してきた既存ノード1aに送信する(ステップS110)。これにより、減設ノード1bが持つ原本データと、原本昇格対象データとの間で、同期処理が実行される。
続いて、原本昇格処理を実行した既存ノード1aの原本昇格処理部153は、複製データの原本昇格が完了したことを示す原本昇格完了通知を代表ノード1Aに送信する(ステップS112)。
そして、代表ノード1Aの原本昇格処理部153は、自身の振り分けID情報200が更新されたことを契機として、既存ノード1aに対し、仮の振り分けID情報200k(仮ID表)を用いて、現状の振り分けID情報200を更新する指示情報であるID表更新通知を既存ノード1aに送信する(ステップS114)。これにより、既存ノード1aにおいて、仮の振り分けID情報200kの減設フラグ「+1」を下げて、振り分けID情報200を更新させる(ステップS115)。
また、代表ノード1Aの原本昇格処理部153は、原本昇格処理が完了したことを示す原本昇格完了通知を、ネットワーク管理装置に送信する(ステップS116)。
この原本昇格完了通知をネットワーク管理装置に送信した時点で、原本昇格と振り分けID情報200の更新が完了しているため、各ノード1は、過渡状態を終了することができる。よって、ネットワーク管理者は、この時点で、クラスタからの減設ノード1bの切り離しを実行することができる。
代表ノード1Aの保守減設処理部15は、クラスタメンバの更新がすべて完了したことを示すクラスタメンバ更新完了通知をネットワーク管理装置5に送信し(ステップS121)、処理を終える。
1A 代表ノード
1a 既存ノード
1b 減設ノード
2 クライアント
3 ロードバランサ
10 制御部
11 ノード識別子管理部
12 減設ノード決定部
13 振り分け部
14 信号処理部
15 保守減設処理部
20 入出力部
30 記憶部
100 ノード識別子管理情報
151 振り分け先変更処理部
152 限定的同期処理部
153 原本昇格処理部
154 データ再配置処理部
200 振り分けID情報
300 故障確率情報
400 データ
1000 保守減設システム
S 分散処理システム(高可用システム)
Claims (3)
- クラスタを構成する複数のノードそれぞれにメッセージを振り分けて処理させ、前記メッセージとして処理されたデータの原本である原本データとその複製である複製データとを異なる前記ノードに記憶させる高可用システムに備えられ、前記クラスタを構成する複数のノードのうちの一部のノードを保守減設する保守減設システムであって、
前記ノードは、
各ノードの識別情報を示すIDに対応付けて、各ノードが処理するデータの担当を示す振り分けID情報を記憶する記憶部と、
前記複数のノードの中から減設対象となるノードを示す減設ノードを決定する減設ノード決定部と、
前記減設ノードに対する前記メッセージの振り分けを停止し、前記減設ノードを除いた各ノードの前記データの担当を示す仮の振り分けID情報を生成する振り分け先変更処理部と、
前記仮の振り分けID情報を用いて、前記減設ノードが減設されたときに前記原本データに昇格する複製データを、原本昇格対象データとして抽出し、前記抽出した原本昇格対象データと、前記減設ノードに記憶される前記原本データとの間で同期処理を実行する限定的同期処理部と、
前記限定的同期処理部による同期処理の後に、前記原本昇格対象データを前記原本データに昇格させ、その後に、前記仮の振り分けID情報を用いて、現状の振り分けID情報を更新させる原本昇格処理部と、
前記高可用システムに定められた冗長度を保つように、前記更新された振り分けID情報に基づき前記データの複製および再配置を実行するデータ再配置処理部と、
を備えることを特徴とする保守減設システム。 - クラスタを構成する複数のノードそれぞれにメッセージを振り分けて処理させ、前記メッセージとして処理されたデータの原本である原本データとその複製である複製データとを異なる前記ノードに記憶させる高可用システムに備えられ、前記クラスタを構成する複数のノードのうちの一部のノードを保守減設する保守減設システムの前記ノードであって、
各ノードの識別情報を示すIDに対応付けて、各ノードが処理するデータの担当を示す振り分けID情報を記憶する記憶部と、
前記複数のノードの中から減設対象となるノードを示す減設ノードを決定する減設ノード決定部と、
前記減設ノードに対する前記メッセージの振り分けを停止し、前記減設ノードを除いた各ノードの前記データの担当を示す仮の振り分けID情報を生成する振り分け先変更処理部と、
前記仮の振り分けID情報を用いて、前記減設ノードが減設されたときに前記原本データに昇格する複製データを、原本昇格対象データとして抽出し、前記抽出した原本昇格対象データと、前記減設ノードに記憶される前記原本データとの間で同期処理を実行する限定的同期処理部と、
前記限定的同期処理部による同期処理の後に、前記原本昇格対象データを前記原本データに昇格させ、その後に、前記仮の振り分けID情報を用いて、現状の振り分けID情報を更新させる原本昇格処理部と、
前記高可用システムに定められた冗長度を保つように、前記更新された振り分けID情報に基づき前記データの複製および再配置を実行するデータ再配置処理部と、
を備えることを特徴とするノード。 - クラスタを構成する複数のノードそれぞれにメッセージを振り分けて処理させ、前記メッセージとして処理されたデータの原本である原本データとその複製である複製データとを異なる前記ノードに記憶させる高可用システムに備えられ、前記クラスタを構成する複数のノードのうちの一部のノードを保守減設する保守減設システムの保守減設方法であって、
前記ノードは、
各ノードの識別情報を示すIDに対応付けて、各ノードが処理するデータの担当を示す振り分けID情報を記憶部に記憶しており、
前記複数のノードの中から減設対象となるノードを示す減設ノードを決定するステップと、
前記減設ノードに対する前記メッセージの振り分けを停止し、前記減設ノードを除いた各ノードの前記データの担当を示す仮の振り分けID情報を生成するステップと、
前記仮の振り分けID情報を用いて、前記減設ノードが減設されたときに前記原本データに昇格する複製データを、原本昇格対象データとして抽出し、前記抽出した原本昇格対象データと、前記減設ノードに記憶される前記原本データとの間で同期処理を実行するステップと、
前記同期処理の後に、前記原本昇格対象データを前記原本データに昇格させ、その後に、前記仮の振り分けID情報を用いて、現状の振り分けID情報を更新させるステップと、
前記高可用システムに定められた冗長度を保つように、前記更新された振り分けID情報に基づき前記データの複製および再配置を実行するステップと、
を実行することを特徴とする保守減設方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016115035A JP6564349B2 (ja) | 2016-06-09 | 2016-06-09 | 保守減設システム、ノードおよび保守減設方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016115035A JP6564349B2 (ja) | 2016-06-09 | 2016-06-09 | 保守減設システム、ノードおよび保守減設方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017220846A JP2017220846A (ja) | 2017-12-14 |
JP6564349B2 true JP6564349B2 (ja) | 2019-08-21 |
Family
ID=60656324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016115035A Active JP6564349B2 (ja) | 2016-06-09 | 2016-06-09 | 保守減設システム、ノードおよび保守減設方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6564349B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6977621B2 (ja) | 2018-03-02 | 2021-12-08 | 日本電信電話株式会社 | 制御装置、及び制御方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012221419A (ja) * | 2011-04-13 | 2012-11-12 | Hitachi Ltd | 情報記憶システム及びそのデータ複製方法 |
JP5711771B2 (ja) * | 2013-01-29 | 2015-05-07 | 日本電信電話株式会社 | ノード離脱処理システム |
JP5918802B2 (ja) * | 2014-04-08 | 2016-05-18 | 日本電信電話株式会社 | ノードおよびプログラム |
-
2016
- 2016-06-09 JP JP2016115035A patent/JP6564349B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017220846A (ja) | 2017-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6382454B2 (ja) | 分散ストレージ及びレプリケーションシステム、並びに方法 | |
JP5686034B2 (ja) | クラスタシステム、同期制御方法、サーバ装置および同期制御プログラム | |
US11892982B2 (en) | Facilitating immediate performance of volume resynchronization with the use of passive cache entries | |
CN113010496B (zh) | 一种数据迁移方法、装置、设备和存储介质 | |
CN106936623A (zh) | 分布式缓存系统及缓存集群的管理方法 | |
EP3526931B1 (en) | Computer system and method for dynamically adapting a software-defined network | |
JP2015509232A (ja) | クラウドにおけるメッセージングのための方法および装置 | |
JP6564349B2 (ja) | 保守減設システム、ノードおよび保守減設方法 | |
EP3570169B1 (en) | Method and system for processing device failure | |
CN112698926B (zh) | 数据处理方法、装置、设备、存储介质及系统 | |
JP2010152591A (ja) | データベースシステム、データ処理方法及びデータ処理プログラム | |
JP5945252B2 (ja) | 分散処理システム | |
CN113254511B (zh) | 一种分布式向量检索系统及方法 | |
US20240176762A1 (en) | Geographically dispersed hybrid cloud cluster | |
CN113592656B (zh) | 联盟链交易同步优化方法、计算机可读介质和电子设备 | |
CN113890850B (zh) | 路由容灾系统及方法 | |
JP6322161B2 (ja) | ノード、データ救済方法およびプログラム | |
CN106897365B (zh) | 数据处理方法及装置 | |
JP6473425B2 (ja) | ノードおよびデータ配置方法 | |
CN115277114B (zh) | 分布式锁处理方法、装置、电子设备及存储介质 | |
JP5711771B2 (ja) | ノード離脱処理システム | |
JP5815000B2 (ja) | ノードおよびプログラム | |
JP2014164502A (ja) | クラスタシステム | |
JP5711772B2 (ja) | クラスタシステム | |
JP6506156B2 (ja) | ノードおよびグラビテーション抑止方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6564349 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |