JP2017016404A - 分散ストレージシステム、データ再配置方法およびデータ再配置プログラム - Google Patents

分散ストレージシステム、データ再配置方法およびデータ再配置プログラム Download PDF

Info

Publication number
JP2017016404A
JP2017016404A JP2015132715A JP2015132715A JP2017016404A JP 2017016404 A JP2017016404 A JP 2017016404A JP 2015132715 A JP2015132715 A JP 2015132715A JP 2015132715 A JP2015132715 A JP 2015132715A JP 2017016404 A JP2017016404 A JP 2017016404A
Authority
JP
Japan
Prior art keywords
storage unit
data
data storage
weight
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015132715A
Other languages
English (en)
Other versions
JP6315608B2 (ja
Inventor
一兵衛 内藤
Ichibe Naito
一兵衛 内藤
宏幸 鬼頭
Hiroyuki Kito
宏幸 鬼頭
晋 市橋
Susumu Ichihashi
晋 市橋
正裕 白石
Masahiro Shiraishi
正裕 白石
重彦 牛島
Shigehiko Ushijima
重彦 牛島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015132715A priority Critical patent/JP6315608B2/ja
Publication of JP2017016404A publication Critical patent/JP2017016404A/ja
Application granted granted Critical
Publication of JP6315608B2 publication Critical patent/JP6315608B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データの再配置が行われる場合であっても、分散ストレージのサービスを安定して提供する。
【解決手段】分散ストレージシステム10は、ディスクが追加された場合、重み記憶部123に記憶されている追加されたディスクの重みを、所定の増加値ずつ増加させる。そして、分散ストレージシステム10は、重み付け部201が追加されたディスクの重みを増加させるたびに、追加されたディスクを含む各ディスクの蓄積量の比が、追加されたディスクを含む各ディスクの重みの比と等しくなるように、追加されたディスク以外のディスクが蓄積する複製データのうち、追加されたディスクに移動させる複製データを決定する。そして、分散ストレージシステム10は、複製データが決定されるたびに、決定された複製データを、追加されたディスクに移動させる。
【選択図】図1

Description

本発明は、分散ストレージシステム、データ再配置方法およびデータ再配置プログラムに関する。
従来、ストレージを格納する装置が故障した場合に発生するデータの破損や消失を防止する方法として、ファイルデータを複製して冗長化し、複数の装置に分散して蓄積する方法が知られている。具体的には、同一データの複製を複数のサーバに分散させて管理する分散ストレージ装置が知られている。分散ストレージ装置においては、ファイルデータを複製して冗長化し、複数のサーバ上に分散して蓄積することにより、耐故障性を向上させている。
例えば、各クラスタがマスタサーバ、複数のチャンクサーバおよび複数のクライアントサーバで構成され、クラスタにファイルを格納するときは、ファイルを固定長の複数のブロックに分割し、ブロック1つ1つの複製したブロックデータをチャンクサーバに格納する分散ファイルシステムを有する分散ストレージ装置が知られている(例えば、非特許文献1を参照)。
また、各クラスタがプロキシ、複数のストレージノード、リングファイルおよび複数のクライアントで構成され、クラスタにファイルを格納するときは、リングファイルに基づき、ファイルのパス名から複数のストレージノードを選択し、ファイルの複製データを選択した当該ストレージノードに格納する分散オブジェクトストレージを有する分散ストレージ装置が知られている(例えば、非特許文献2を参照)。
Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung、"The Google File System"、19th ACM Symposium on Operating Systems Principles、2003年10月、p.20-43 OpenStack Object Storage("Swift")、https://wiki.openstack.org/wiki/Swift
しかしながら、従来の分散ストレージ装置には、蓄積ノードまたはディスクの増減等に伴うデータ再配置により、クライアントに対するデータのI/Oスループットが低下し、分散ストレージのサービスを安定して提供することができなくなるという問題があった。
例えば、分散ストレージ装置では、チャンクサーバ、ストレージノードといったデータ蓄積ノードの障害を復旧する際や、クラスタのデータ容量を増加させる際に、新規のデータ蓄積ノードを追加する。この時、新規データ蓄積ノードに対して、複製したデータの再配置が行われる。なお、再配置とは、例えば、クラスタに保存したデータを既存蓄積ノードから新規のデータ蓄積ノードへファイルデータをコピーし、既存データ蓄積ノードから当該データを削除することである。
このようなデータ再配置処理が、データ蓄積ノードのNIC(Network Interface Card)帯域、ディスクI/Oを圧迫することで、クライアントからのリクエスト処理を阻害し、クライアントからの分散ストレージ装置に対するデータI/Oのスループットを低下させる。
本発明の分散ストレージシステムは、複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムであって、各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして記憶し、また、前記分散ストレージシステムにデータ記憶部が追加された場合、該追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の初期値を、前記追加されたデータ記憶部の重みとして記憶する重み記憶部と、前記重み記憶部に記憶されている前記追加されたデータ記憶部の重みを、前記追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の増加値ずつ増加させる重み付け部と、前記重み付け部が前記追加されたデータ記憶部の重みを増加させるたびに、前記追加されたデータ記憶部を含む各データ記憶部の蓄積量の比が、前記追加されたデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記追加されたデータ記憶部以外のデータ記憶部が蓄積する複製データのうち、前記追加されたデータ記憶部に移動させる複製データを決定する蓄積先決定部と、前記蓄積先決定部によって複製データが決定されるたびに、前記蓄積先決定部によって決定された複製データを、前記追加されたデータ記憶部に移動させる複製データ配置部と、を有することを特徴とする。
また、本発明の分散ストレージシステムは、複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムであって、各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして記憶する重み記憶部と、前記分散ストレージシステムからデータ記憶部が除去される場合、前記重み記憶部に記憶されている該除去されるデータ記憶部の重みを、前記除去されるデータ記憶部の最大容量に比例する値よりも小さい所定の減少値ずつ減少させる重み付け部と、前記重み付け部が前記除去されるデータ記憶部の重みを減少させるたびに、前記除去されるデータ記憶部を含む各データ記憶部の蓄積量の比が、前記除去されるデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記除去されるデータ記憶部が蓄積する複製データのうち、前記除去されるデータ記憶部から移動させる複製データを決定する蓄積先決定部と、前記蓄積先決定部によって複製データが決定されるたびに、前記蓄積先決定部によって決定された複製データを、前記除去されるデータ記憶部から移動させる複製データ配置部と、を有することを特徴とする。
また、本発明のデータ再配置方法は、複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムで実行されるデータ再配置方法であって、各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして重み記憶部に記憶させる第1の記憶工程と、前記分散ストレージシステムにデータ記憶部が追加された場合、該追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の初期値を、前記追加されたデータ記憶部の重みとして前記重み記憶部に記憶させる第2の記憶工程と、前記重み記憶部に記憶されている前記追加されたデータ記憶部の重みを、前記追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の増加値ずつ増加させる重み付け工程と、前記重み付け工程が前記追加されたデータ記憶部の重みを増加させるたびに、前記追加されたデータ記憶部を含む各データ記憶部の蓄積量の比が、前記追加されたデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記追加されたデータ記憶部以外のデータ記憶部が蓄積する複製データのうち、前記追加されたデータ記憶部に移動させる複製データを決定する蓄積先決定工程と、前記蓄積先決定工程によって複製データが決定されるたびに、前記蓄積先決定工程によって決定された複製データを、前記追加されたデータ記憶部に移動させる複製データ配置工程と、を含んだことを特徴とする。
また、本発明のデータ再配置方法は、複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムで実行されるデータ再配置方法であって、各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして重み記憶部に記憶させる記憶工程と、前記分散ストレージシステムからデータ記憶部が除去される場合、前記重み記憶部に記憶されている該除去されるデータ記憶部の重みを、前記除去されるデータ記憶部の最大容量に比例する値よりも小さい所定の減少値ずつ減少させる重み付け工程と、前記重み付け工程が前記除去されるデータ記憶部の重みを減少させるたびに、前記除去されるデータ記憶部を含む各データ記憶部の蓄積量の比が、前記除去されるデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記除去されるデータ記憶部が蓄積する複製データのうち、前記除去されるデータ記憶部から移動させる複製データを決定する蓄積先決定工程と、前記蓄積先決定工程によって複製データが決定されるたびに、前記蓄積先決定工程によって決定された複製データを、前記除去されるデータ記憶部から移動させる複製データ配置工程と、を含んだことを特徴とする。
本発明によれば、蓄積ノードまたはディスクの増減等に伴うデータ再配置により、クライアントに対するデータのI/Oスループットが低下しないため、分散ストレージのサービスを安定して提供することができる。
図1は、第1の実施形態に係る分散ストレージシステムの構成の一例を示す図である。 図2は、第1の実施形態に係る分散ストレージシステムの重み記憶部の構成の一例を示す図である。 図3は、第1の実施形態に係る分散ストレージシステムの制御部の構成の一例を示す図である。 図4は、第1の実施形態に係るデバイス一覧表の一例を示す図である。 図5は、第1の実施形態に係るデータ配置一覧表の一例を示す図である。 図6は、第1の実施形態に係る構成データ表の一例を示す図である。 図7は、第1の実施形態に係るレプリケーションパラメータの一例を示す図である。 図8は、第1の実施形態に係るディスクを増設した場合のデバイス一覧表の一例を示す図である。 図9は、第1の実施形態に係るディスクを増設した場合のデバイス一覧表の変化の一例を示す図である。 図10は、第1の実施形態に係る分散ストレージシステムの処理の一例を示す図である。 図11は、第1の実施形態に係る分散ストレージシステムのハッシュ作成処理の一例を示す図である。 図12は、第2の実施形態に係るディスクを減設する場合のデバイス一覧表の変化の一例を示す図である。 図13は、その他の実施形態に係る分散ストレージシステムの構成の一例を示す図である。 図14は、プログラムが実行されることにより、分散ストレージシステムが実現されるコンピュータの一例を示す図である。
以下に、本願に係る分散ストレージシステム、データ再配置方法およびデータ再配置プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本願に係る分散ストレージシステム、データ再配置方法およびデータ再配置プログラムが限定されるものではない。
[第1の実施形態]
以下の実施形態では、第1の実施形態に係る分散ストレージシステムの構成、分散ストレージシステムにおける各部の処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
[第1の実施形態の構成]
まず、図1を用いて分散ストレージシステムの構成について説明する。図1は、第1の実施形態に係る分散ストレージシステムの構成の一例を示す図である。図1に示すように、分散ストレージシステム10は、ネットワーク20を介してクライアント30と接続されている。また、分散ストレージシステム10は、受付部11、管理部12および蓄積部13を有する。受付部11は、クライアント30から送信されるデータ等を受け付ける。管理部12は、システムの管理および制御を行う。蓄積部13は、複製されたデータを蓄積する。
また、受付部11は、グループID変換部111を有する。グループID変換部111は、例えば、オブジェクトの名称をハッシュにかけ、グループIDに変換する。そして、グループIDに従ってデータの蓄積先が決定される。データの蓄積先の決定方法については後述する。
また、管理部12は、監視部121、制御部122および重み記憶部123を有する。監視部121は、蓄積部13の各蓄積ノードを監視し、レプリケーションの頻度、ディスクのI/O、スループット等の情報を集約する。また、制御部122は、クライアント30から送信されたデータ、または既に蓄積部13に蓄積されているデータを所定の蓄積ノードに蓄積させるための制御を行う。重み記憶部123は、制御部122等の動作に必要な情報を記憶する。
また、蓄積部13は、複数の蓄積ノードを有する。また各蓄積ノードには複数のディスクが備えられている。図1に示すように、蓄積部13は、蓄積ノード131、蓄積ノード132、蓄積ノード133および蓄積ノード134を有する。また、例えば蓄積ノード131は、ディスク131a、ディスク131bおよびディスク131cを有する。
(基本的なデータ配置の動作)
ここで、主に管理部12の制御部122および重み記憶部123によって行われるデータ配置の基本的な動作について説明する。まず、管理部12の重み記憶部123について図2を用いて説明する。図2は、第1の実施形態に係る分散ストレージシステムの重み記憶部の構成の一例を示す図である。図2に示すように、重み記憶部123は、ハッシュ表21および構成データ22を記憶している。また、ハッシュ表21には、デバイス一覧表221およびデータ配置一覧表222が含まれる。
ハッシュ表21および構成データ22は、管理部12の制御部122によって参照または更新される。ここで、図3を用いて、制御部122の構成について説明する。図3は、第1の実施形態に係る分散ストレージシステムの制御部の構成の一例を示す図である。図3に示すように、制御部122は、重み付け部201、蓄積先決定部202、複製データ配置部203および構成データ更新部204を有する。なお、複製データ配置部203は複数であってもよい。複製データ配置部203が複数の場合は、それぞれの複製データ配置部が、各蓄積ノード、または各ディスクに対応する。
重み記憶部123は、各ディスクの最大容量に比例する値を、各ディスクの重みとして記憶し、また、分散ストレージシステム10にディスクが追加された場合、追加されたディスクの最大容量に比例する値よりも小さい所定の初期値を、追加されたディスクの重みとして記憶する。具体的には、構成データ22およびデバイス一覧表221に重みが記憶される。また、初期値としては例えば0が設定される。なお、第1の実施形態においては、ディスクがデータ記憶部として機能する。
重み付け部201は、重み記憶部123に記憶されている追加されたディスクの重みを、追加されたディスクの最大容量に比例する値よりも小さい所定の増加値ずつ増加させる。具体的には、重み付け部201は、増加値をレプリケーションパラメータに基づいて決定し、デバイス一覧表221を更新する。また、ディスクは、1つ以上のディスクを有する蓄積ノード単位で追加されてもよい。
蓄積先決定部202は、重み付け部201が追加されたディスクの重みを増加させるたびに、追加されたディスクを含む各ディスクの蓄積量の比が、追加されたディスクを含む各ディスクの重みの比と等しくなるように、追加されたディスク以外のディスクが蓄積する複製データのうち、追加されたディスクに移動させる複製データを決定する。具体的には、蓄積先決定部202は、データ配置一覧表222の更新を行う。
複製データ配置部203は、蓄積先決定部202によって複製データが決定されるたびに、蓄積先決定部202によって決定された複製データを、追加されたディスクに移動させる。そして、複製データ配置部203は、蓄積先決定部202によって更新されたデータ配置一覧表222に従って、追加されたディスクに複製データを移動させる。
例えば、既存のディスクの重みが100であり、追加されたディスクの重みが0から10に増加した場合は、既存のディスクと追加されたディスクのデータの蓄積量の比が100:10となるようにデータの移動が行われる。また、追加されたディスクの重みが10から20に増加した場合は、既存のディスクと追加されたディスクのデータの蓄積量の比が100:20となるように重み10と重み20の差分のデータの移動が行われる。なお、蓄積先決定部202および複製データ配置部203の処理は、重み付け部201が重みを増加させるたびに、重みが最大容量に比例する値に至るまでループして実行される。以降、各部について詳細に説明する。
図4を用いて、デバイス一覧表221について説明する。図4は、第1の実施形態に係るデバイス一覧表の一例を示す図である。図4に示すように、デバイス一覧表221には、各蓄積ノードのノード識別子、各ディスクのディスク識別子および各ディスクに設定された重みが記載されている。例えば、図1の蓄積ノード131は「Host001」、蓄積ノード132は「Host002」、蓄積ノード133は「Host003」にそれぞれ対応している。
また、図1のディスク131aは「diskA001」、ディスク131bは「diskA002」、ディスク131cは「diskA003」、ディスク132aは「diskB001」、ディスク132bは「diskB002」、ディスク132cは「diskB003」、ディスク133aは「diskC001」、ディスク133bは「diskC002」、ディスク133cは「diskC003」、にそれぞれ対応している。なお、図1の蓄積ノード134は、初めは蓄積部13には含まれず、後に追加されるものとする。
また、制御部122の重み付け部201は、各ディスクの最大容量に比例する値である重みを設定する。例えば、ディスク131aのノード識別子は「Host001」、ディスク識別子は「diskA001」であり、重みは「120」である。また、ディスク131bのノード識別子は「Host001」、ディスク識別子は「diskA002」であり、重みは「80」である。また、ディスク133aのノード識別子は「Host003」、ディスク識別子は「diskC001」であり、重みは「200」である。
そして、蓄積先決定部202は、デバイス一覧表221を参照し、データ配置一覧表222の作成または更新を行う。図5を用いて、データ配置一覧表222について説明する。図5は、第1の実施形態に係るデータ配置一覧表の一例を示す図である。図5に示すように、データ配置一覧表222には、グループID、レプリカ1保存先、レプリカ2保存先、レプリカ3保存先が記載されている。グループIDは、蓄積部13に蓄積されるオブジェクトに対し、受付部11のグループID変換部111がオブジェクトの名称をハッシュにかけること等により付与するIDである。
なお、蓄積部13に蓄積されるオブジェクトは、例えばクライアント30から送信されたデータを一定の容量のブロックに分割したデータを複製したものである。図5の例では、3つの複製データが作成されるものとする。ただし、複製データの個数は3個に限定されるものではなく、いくつであってもよい。
そして、蓄積先決定部202は、デバイス一覧表221の重みに応じて、データ配置一覧表222の各レプリカの保存先を決定する。この時、データ配置一覧表222における各保存先の出現率および出現回数は、デバイス一覧表221における重みに比例する。すなわち、図4のデバイス一覧表221の重みの合計は1080、ノード識別子が「Host001」、ディスク識別子が「diskA001」であるディスクの重みは120なので、「Host001:diskA001」の出現率は120/1080であり、出現回数は3回である。
また、ノード識別子が「Host001」、ディスク識別子が「diskA002」であるディスクの重みは80なので、「Host001:diskA002」の出現率は80/1080であり、出現回数は2回である。また、ノード識別子が「Host003」、ディスク識別子が「diskC001」であるディスクの重みは200なので、「Host003:diskC001」の出現率は200/1080であり、出現回数は5回である。
そして、複製データ配置部203は、データのグループIDをキーとして、データ配置一覧表222に従って指定された保存先に保存することでデータの配置を行う。なお、データの配置は、クライアント30からデータを受け付けた時に、受付部11が行うこととしてもよい。この時、受付部11は、クライアント30からのリクエストおよびデータを蓄積部13へ転送する。
なお、上記計算による出現率および出現回数の計算結果は理論値であり、重みの合計が各重みの整数倍になるとは限らず、また、出現率の理論値に基づくランダム性を持った処理により保存先が決定されることも考えられるので、データ配置一覧表222における各保存先の出現率および出現回数は、計算結果と一致しない場合も当然考えられる。また、構成データ22はこの場合、デバイス一覧表221と同一の表であり、蓄積ノードの増減等に応じて構成データ更新部204によって更新される。
(蓄積ノードが追加された場合のデータ再配置の動作)
ここで、分散ストレージシステム10に、新たな蓄積ノード134が追加された場合の動作について説明する。
具体的には、蓄積ノード134が追加されると、構成データ更新部204は、構成データ22を更新する。図6を用いて、構成データ22について説明する。図6は、第1の実施形態に係る構成データ表の一例を示す図である。図6に示すように、蓄積ノード134が追加されることによって、構成データ22には、蓄積ノード134のノード識別子「Host004」についての行が追加されている。そして、各ディスクには、最大容量に比例する重みが設定されている。
そして、制御部122は、蓄積ノードの追加に伴うハッシュ表21の更新を行う。まず、重み付け部201は、デバイス一覧表221に記載する蓄積ノード134の重みを決定するために、監視部121が集約した蓄積ノード134に関するレプリケーションパラメータを参照する。図7に示すように、レプリケーションパラメータには、ディスクの性能に応じたディスクの一定時間当たりの最大増設幅、最大減設幅、また、蓄積ノードの通信性能に応じた一定時間当たりの最大増設幅、最大減設幅が記載されている。図7は、第1の実施形態に係るレプリケーションパラメータの一例を示す図である。
なお、レプリケーションパラメータにおける幅とは、重みの幅を示すものであり、後述の再構成処理において、重みの変化による影響が許容範囲内であるか否か等に基づいて決定される値である。なお、レプリケーションパラメータは、例えば重み記憶部123に記憶される。
また、監視部121は、例えば、監視項目としてディスクの入出力の頻度を監視する。そして、複製データ配置部203は、ディスクの入出力の頻度が所定の値以下である場合に、ディスクに複製データを配置する。例えば、図7の監視項目のDISK I/Oはディスクの入出力の頻度の一例であり、一定時間内にディスクに対して行われたI/Oの回数を示すものである。なお、複製データ配置部203は、重み付け部201および蓄積先決定部202の動作に連動して複製データの配置を行うため、ディスクの入出力の頻度が所定の値以下でない場合に、重み付け部201および蓄積先決定部202の動作が実行されないようにしてもよい。
この時、DISK I/Oが、所定の値以下である場合は、データ再構成処理を行い、所定の値より大きい場合はデータ再構成処理を行わないようにしてもよい。例えば、所定のDISK I/Oの値を300とすると、この場合は監視部121によって得られたDISK I/Oは200であるため、データ再配置処理が行われる。
重み記憶部123は、蓄積ノードに含まれるディスク毎の重みの増加値、すなわち増設幅の閾値であるY1と、蓄積ノード毎に設定された重みの増設幅の閾値であるX1と、をさらに記憶する。そして、重み付け部201は、Y1に蓄積ノードに含まれるディスクの個数D_nを乗じた値がX1より小さい場合は、重み増設幅をY1とし、Y1にノードに含まれるディスクの個数D_nを乗じた値がX1以上である場合は、重み増設幅を、X1をD_nで除した値とする。具体的には、重み付け部201は、レプリケーションパラメータを参照し、式(1−1)および式(1−2)に従って重み増設幅W1_nを決定する。
Figure 2017016404
この場合、D_nが3、X1が100、Y1が10であるため、W1_nは10となる。そして、重み付け部201は、デバイス一覧表221の蓄積ノード134の重みを10ずつ増加させていく。1回目の増加では、図8に示すように、増設された蓄積ノードに含まれるディスクの重みが10となっている。図8は、第1の実施形態に係るディスクを増設した場合のデバイス一覧表の一例を示す図である。
そして、蓄積先決定部202は、図8のデバイス一覧表221に基づいてデータ配置一覧表222を作成する。例えば、図8のデバイス一覧表221の重みの合計は1110、ノード識別子が「Host001」、ディスク識別子が「diskA001」であるディスクの重みは120なので、「Host001:diskA001」の出現率は120/1110であり、出現回数は約2.9回である。
また、ノード識別子が「Host001」、ディスク識別子が「diskA002」であるディスクの重みは80なので、「Host001:diskA002」の出現率は80/1110であり、出現回数は約1.9回である。また、ノード識別子が「Host003」、ディスク識別子が「diskC001」であるディスクの重みは200なので、「Host003:diskC001」の出現率は200/1110であり、出現回数は約4.9回である。このように、既存のディスクにおいては、新たなディスクの追加により、図4の場合と比較すると、出現率および出現回数が減少している。
また、新たに追加されたノード識別子が「Host004」、ディスク識別子が「diskD001」であるディスクの重みは10なので、「Host004:diskD001」の出現率は10/1110であり、出現回数は約0.2回である。このように、構成データ22の上では、新しく追加されたディスクの重みは120であるが、デバイス一覧表221上では10しか増加していないため、出現率および出現回数は非常に小さい値となる。
そして、複製データ配置部203は、新たなデータ配置一覧表222に従って、指定された保存先にデータを保存し直すように蓄積部13を制御することでデータの再配置を行う。この時、蓄積部13の各蓄積ノードのディスクに記憶されているレプリカの現在の保存先と新たに作成されたデータ配置一覧表222に記載されている保存先が異なる場合は、新たな保存先にデータの複製を作成し、もとの保存先のデータを削除する。
さらに、重み付け部201は、図9に示すように、増設されたディスクのデバイス一覧表221における重みを増加させる。図9は、第1の実施形態に係るディスクを増設した場合のデバイス一覧表の変化の一例を示す図である。図9に示すように、新たに追加された蓄積ノード134のディスクの重みは最終的に120となり、12回に分けてデータの再配置が行われることになる。このように、蓄積ノードの追加に伴うデータの再配置は少量ずつ行われる。
なお、図1では、受付部11、管理部12および蓄積部13が1つの装置に含まれる例を示しているが、各部がそれぞれ異なるサーバ等の装置に備えられるようにしてもよい。また、蓄積部13の各蓄積ノードは、同一のサーバ上に備えられるものとしてもよいし、それぞれが物理的に異なるサーバ上に備えられることとしてもよい。また、図1では蓄積ノードの数は4つであるが、蓄積ノードの数はいくつであってもよい。
[第1の実施形態の処理]
次に、図10を用いて分散ストレージシステム10のデータ再配置の処理について説明する。図10は、第1の実施形態に係る分散ストレージシステムの処理の一例を示す図である。図10に示すように、まず、新たな蓄積ノードが追加された場合、構成データ更新部204は構成データ22を更新する(ステップS11)。この時、構成データ22には、新たに追加された蓄積ノードに含まれるディスクの重みの最大値が記載される。
ここで、制御部122は、ディスク再構成制御を開始する(ステップS12)。まず、制御部122は、レプリケーションパラメータを参照し、レプリケーション可能か否かを判定する(ステップS13)。この時、制御部122は、例えばレプリケーションパラメータの監視項目であるDISK I/Oの値が所定の値以上か否かによってレプリケーション可否を判定する。
ここで、レプリケーション不可と判定された場合(ステップS13、No)は、制御部122は、一定時間待機した後(ステップS14)、ステップS13に戻り、再び判定を行う。また、レプリケーション可能と判定された場合(ステップS13、Yes)は、制御部122は新ハッシュ表21の作成を行う(ステップS15)。その後、複製データ配置部203はデータの再配置を行う(ステップS16)。そして、構成データ22と新ハッシュ表21のデバイス一覧表221に記載されている重みが一致している場合(ステップS17、Yes)は、処理を終了する。構成データ22と新ハッシュ表21のデバイス一覧表221に記載されている重みが一致していない場合(ステップS17、No)は、ステップS13に戻り、再び処理を実行する。
新ハッシュ作成処理について図11を用いて説明する。図11は、第1の実施形態に係る分散ストレージシステムのハッシュ作成処理の一例を示す図である。図11に示すように、制御部122は、まず、現在のハッシュ表である旧ハッシュ表21と構成データ22を比較し、追加ディスクの有無を確認し、追加ディスクがある場合はリスト化する(ステップS151)。次に、重み付け部201は、レプリケーションパラメータを参照し、リスト化したディスクの重みの増設幅を計算する(ステップS152)。
そして、重み付け部201は、計算した増設幅に従って、デバイス一覧表221の重みを決定する。ここで、未確認の蓄積ノードがある場合(ステップS153、No)は、制御部122は、追加ディスクのリスト化および重みの計算を再び実行する。また、全蓄積ノードについて確認済みである場合(ステップS153、Yes)は、蓄積先決定部202は、新ハッシュ表21を作成して処理を終了する(ステップS154)。
[第1の実施形態の効果]
重み記憶部123は、各ディスクの最大容量に比例する値を、各ディスクの重みとして記憶し、また、分散ストレージシステム10にディスクが追加された場合、追加されたディスクの最大容量に比例する値よりも小さい所定の初期値を、追加されたディスクの重みとして記憶する。重み付け部201は、重み記憶部123に記憶されている追加されたディスクの重みを、追加されたディスクの最大容量に比例する値よりも小さい所定の増加値ずつ増加させる。そして、蓄積先決定部202は、重み付け部201が追加されたディスクの重みを増加させるたびに、追加されたディスクを含む各ディスクの蓄積量の比が、追加されたディスクを含む各ディスクの重みの比と等しくなるように、追加されたディスク以外のディスクが蓄積する複製データのうち、追加されたディスクに移動させる複製データを決定する。そして、複製データ配置部203蓄積先決定部202によって複製データが決定されるたびに、蓄積先決定部202によって決定された複製データを、追加されたディスクに移動させる。
これにより、例えば蓄積ノードの追加が行われた際の再配置において、一度に大量のデータを移動させることなく、少量ずつデータを移動させることができる。そのため、第1の実施形態によれば、蓄積ノードまたはディスクの増加等に伴うデータ再配置により、クライアントに対するデータのI/Oスループットが低下することなく、分散ストレージのサービスを安定して提供することができる。
また、ディスクは、少なくとも1つ以上のディスクの集合であるノード単位で分散ストレージシステムへ追加される。重み記憶部123は、ノードに含まれるディスク毎の重みの増加値の閾値である第1の閾値と、ノード毎に設定された重みの増加値の閾値である第2の閾値と、をさらに記憶する。そして、重み付け部201は、第1の閾値にノードに含まれるディスクの個数を乗じた値が第2の閾値より小さい場合は、第1の閾値を増加値とし、第1の閾値にノードに含まれるディスクの個数を乗じた値が第2の閾値以上である場合は、第2の閾値をディスクの個数で除した値を増加値とする。また、監視部121は、ディスクの入出力の頻度を監視する。そして、複製データ配置部203は、ディスクの入出力の頻度が所定の値以下である場合に、複製データを移動させる。
これにより、レプリケーションパラメータによる増設幅の閾値の設定、および監視項目によるデータ再配置を行うか否かの制御を行うことができるので、データ再配置を行う際のデータの移動量をスループットに影響がない範囲で安定させることができる。
[第2の実施形態]
第1の実施形態においては、蓄積ノードが追加された場合について説明した。本発明は、蓄積ノードの追加、すなわち増設の場合だけでなく、蓄積ノードの減設の場合にも適用することが可能である。そこで、第2の実施形態においては、蓄積ノードが減設される場合について説明する。なお、蓄積ノードの減設は、蓄積ノードを分散ストレージシステム10から除去することによって行われる。
[第2の実施形態の構成]
第2の実施形態に係る分散ストレージシステムの基本的な構成は第1の実施形態の分散ストレージシステムの構成と同様である。重み記憶部123は、各ディスクの最大容量に比例する値を、各ディスクの重みとして記憶する。具体的には、構成データ22およびデバイス一覧表221に重みが記憶される。
重み付け部201は、分散ストレージシステム10からディスクが除去される場合、重み記憶部に記憶されている除去されるディスクの重みを、除去されるディスクの最大容量に比例する値よりも小さい所定の減少値ずつ減少させる。具体的には、重み付け部201は、減少値をレプリケーションパラメータに基づいて決定し、デバイス一覧表221を更新する。また、ディスクは、1つ以上のディスクを有する蓄積ノード単位で除去されてもよい。
蓄積先決定部202は、重み付け部201が除去されるディスクの重みを減少させるたびに、除去されるディスクを含む各ディスクの蓄積量の比が、除去されるディスクを含む各ディスクの重みの比と等しくなるように、除去されるディスクが蓄積する複製データのうち、除去されるディスクから移動させる複製データを決定する。具体的には、蓄積先決定部202は、データ配置一覧表222の更新を行う。
複製データ配置部203は、蓄積先決定部によって複製データが決定されるたびに、蓄積先決定部によって決定された複製データを、除去されるディスクから移動させる。具体的には、複製データ配置部203は、蓄積先決定部202によって更新されたデータ配置一覧表222に従って、追加されたディスクに複製データを移動させる。なお、蓄積先決定部202および複製データ配置部203の処理は、重み付け部201が重みを減少させるたびに、重み0に至るまでループして実行される。
重み記憶部123は、蓄積ノードに含まれるディスク毎の重みの減少値、すなわち減設幅の閾値であるY2と、蓄積ノード毎に設定された重みの減設幅の閾値であるX2と、をさらに記憶する。そして、重み付け部201は、Y2に蓄積ノードに含まれるディスクの個数D_nを乗じた値がX2より小さい場合は、重み減設幅をY2とし、Y2にノードに含まれるディスクの個数D_nを乗じた値がX2以上である場合は、重み減設幅を、X2をD_nで除した値とする。具体的には、第2の実施形態では、レプリケーションパラメータを参照し、式(2−1)および式(2−2)に従って重み減設幅W2_nを決定する。
Figure 2017016404
例えば、蓄積ノード134が減設される場合、図7のレプリケーションパラメータによると、D_nが3、X2が100、Y2が10であるため、W2_nは10となる。そして、重み付け部201は、図12に示すように、減設されるディスクのデバイス一覧表221における重みを減少させる。図12は、第2の実施形態に係るディスクを減設する場合のデバイス一覧表の変化の一例を示す図である。図12に示すように、減設される蓄積ノード134のディスクの重みは最終的に0となり、12回に分けてデータの再配置が行われることになる。
[第2の実施形態の効果]
重み記憶部123は、各ディスクの最大容量に比例する値を、各ディスクの重みとして記憶する。重み付け部201は、分散ストレージシステム10からディスクが除去される場合、重み記憶部に記憶されている除去されるディスクの重みを、除去されるディスクの最大容量に比例する値よりも小さい所定の減少値ずつ減少させる。蓄積先決定部202は、重み付け部201が除去されるディスクの重みを減少させるたびに、除去されるディスクを含む各ディスクの蓄積量の比が、除去されるディスクを含む各ディスクの重みの比と等しくなるように、除去されるディスクが蓄積する複製データのうち、除去されるディスクから移動させる複製データを決定する。複製データ配置部203は、蓄積先決定部によって複製データが決定されるたびに、蓄積先決定部によって決定された複製データを、除去されるディスクから移動させる。
これにより、例えば蓄積ノードの減設を行う際の再配置において、一度に大量のデータを移動させることなく、少量ずつデータを移動させることができる。そのため、蓄積ノードまたはディスクの減少等に伴うデータ再配置により、クライアントに対するデータのI/Oスループットが低下することなく、分散ストレージのサービスを安定して提供することができる。
また、ディスクは、少なくとも1つ以上のディスクの集合であるノード単位で分散ストレージシステムから除去され、重み記憶部123は、ノードに含まれるディスク毎の重みの減少値の閾値である第1の閾値と、ノード毎に設定された重みの減少値の閾値である第2の閾値と、をさらに記憶し、重み付け部201は、第1の閾値にノードに含まれるディスクの個数を乗じた値が第2の閾値より小さい場合は、第1の閾値を減少値とし、第1の閾値にノードに含まれるディスクの個数を乗じた値が第2の閾値以上である場合は、第2の閾値をディスクの個数で除した値を減少値とする。
これにより、レプリケーションパラメータによる減設幅の閾値の設定、および監視項目によるデータ再配置を行うか否かの制御を行うことができるので、第1の実施形態と同様に、データ再配置を行う際のデータの移動量をスループットに影響がない範囲で安定させることができる。
[その他の実施形態]
上記の実施形態では、ハッシュ表21が管理部12の重み記憶部123に記憶されることとしたが、図13に示すように、ハッシュ表21を、受付部11や蓄積部13の各蓄積ノードに配布するようにしてもよい。図13は、その他の実施形態に係る分散ストレージシステムの構成の一例を示す図である。この場合、ハッシュ表21も分散して保存されることになり、故障等によりハッシュ表21が参照できなくなることを防止することができる。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPU(Central Processing Unit)および当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
図14は、プログラムが実行されることにより、分散ストレージシステムが実現されるコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011およびRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、分散ストレージシステムの各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、分散ストレージシステムにおける機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
また、上述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して実行する。
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093およびプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093およびプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
10 分散ストレージシステム
11 受付部
12 管理部
13 蓄積部
21 ハッシュ表
22 構成データ
111 グループID変換部
121 監視部
122 制御部
123 重み記憶部
131、132、133、134 蓄積ノード
131a、131b、131c、132a、132b、132c、133a、133b、133c、134a、134b、134c ディスク
201 重み付け部
202 蓄積先決定部
203 複製データ配置部
204 構成データ更新部
221 デバイス一覧表
222 データ配置一覧表

Claims (8)

  1. 複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムであって、
    各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして記憶し、また、前記分散ストレージシステムにデータ記憶部が追加された場合、該追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の初期値を、前記追加されたデータ記憶部の重みとして記憶する重み記憶部と、
    前記重み記憶部に記憶されている前記追加されたデータ記憶部の重みを、前記追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の増加値ずつ増加させる重み付け部と、
    前記重み付け部が前記追加されたデータ記憶部の重みを増加させるたびに、前記追加されたデータ記憶部を含む各データ記憶部の蓄積量の比が、前記追加されたデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記追加されたデータ記憶部以外のデータ記憶部が蓄積する複製データのうち、前記追加されたデータ記憶部に移動させる複製データを決定する蓄積先決定部と、
    前記蓄積先決定部によって複製データが決定されるたびに、前記蓄積先決定部によって決定された複製データを、前記追加されたデータ記憶部に移動させる複製データ配置部と、
    を有することを特徴とする分散ストレージシステム。
  2. 前記データ記憶部は、少なくとも1つ以上のデータ記憶部の集合であるノード単位で前記分散ストレージシステムへ追加され、
    前記重み記憶部は、前記ノードに含まれるデータ記憶部毎の重みの増加値の閾値である第1の閾値と、前記ノード毎に設定された重みの増加値の閾値である第2の閾値と、をさらに記憶し、
    前記重み付け部は、前記第1の閾値に前記ノードに含まれるデータ記憶部の個数を乗じた値が前記第2の閾値より小さい場合は、前記第1の閾値を前記増加値とし、前記第1の閾値に前記ノードに含まれるデータ記憶部の個数を乗じた値が前記第2の閾値以上である場合は、前記第2の閾値を前記データ記憶部の個数で除した値を前記増加値とすることを特徴とする請求項1に記載の分散ストレージシステム。
  3. 複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムであって、
    各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして記憶する重み記憶部と、
    前記分散ストレージシステムからデータ記憶部が除去される場合、前記重み記憶部に記憶されている該除去されるデータ記憶部の重みを、前記除去されるデータ記憶部の最大容量に比例する値よりも小さい所定の減少値ずつ減少させる重み付け部と、
    前記重み付け部が前記除去されるデータ記憶部の重みを減少させるたびに、前記除去されるデータ記憶部を含む各データ記憶部の蓄積量の比が、前記除去されるデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記除去されるデータ記憶部が蓄積する複製データのうち、前記除去されるデータ記憶部から移動させる複製データを決定する蓄積先決定部と、
    前記蓄積先決定部によって複製データが決定されるたびに、前記蓄積先決定部によって決定された複製データを、前記除去されるデータ記憶部から移動させる複製データ配置部と、
    を有することを特徴とする分散ストレージシステム。
  4. 前記データ記憶部は、少なくとも1つ以上のデータ記憶部の集合であるノード単位で前記分散ストレージシステムから除去され、
    前記重み記憶部は、前記ノードに含まれるデータ記憶部毎の重みの減少値の閾値である第1の閾値と、前記ノード毎に設定された重みの減少値の閾値である第2の閾値と、をさらに記憶し、
    前記重み付け部は、前記第1の閾値に前記ノードに含まれるデータ記憶部の個数を乗じた値が前記第2の閾値より小さい場合は、前記第1の閾値を前記減少値とし、前記第1の閾値に前記ノードに含まれるデータ記憶部の個数を乗じた値が前記第2の閾値以上である場合は、前記第2の閾値を前記データ記憶部の個数で除した値を前記減少値とすることを特徴とする請求項3に記載の分散ストレージシステム。
  5. データ記憶部の入出力の頻度を監視する監視部をさらに有し、
    前記複製データ配置部は、前記データ記憶部の入出力の頻度が所定の値以下である場合に、複製データを移動させることを特徴とする請求項1から4のいずれか1項に記載の分散ストレージシステム。
  6. 複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムで実行されるデータ再配置方法であって、
    各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして重み記憶部に記憶させる第1の記憶工程と、
    前記分散ストレージシステムにデータ記憶部が追加された場合、該追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の初期値を、前記追加されたデータ記憶部の重みとして前記重み記憶部に記憶させる第2の記憶工程と、
    前記重み記憶部に記憶されている前記追加されたデータ記憶部の重みを、前記追加されたデータ記憶部の最大容量に比例する値よりも小さい所定の増加値ずつ増加させる重み付け工程と、
    前記重み付け工程が前記追加されたデータ記憶部の重みを増加させるたびに、前記追加されたデータ記憶部を含む各データ記憶部の蓄積量の比が、前記追加されたデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記追加されたデータ記憶部以外のデータ記憶部が蓄積する複製データのうち、前記追加されたデータ記憶部に移動させる複製データを決定する蓄積先決定工程と、
    前記蓄積先決定工程によって複製データが決定されるたびに、前記蓄積先決定工程によって決定された複製データを、前記追加されたデータ記憶部に移動させる複製データ配置工程と、
    を含んだことを特徴とするデータ再配置方法。
  7. 複数のデータ記憶部を有し、複数の複製データを各データ記憶部に分散する分散ストレージシステムで実行されるデータ再配置方法であって、
    各データ記憶部の最大容量に比例する値を、各データ記憶部の重みとして重み記憶部に記憶させる記憶工程と、
    前記分散ストレージシステムからデータ記憶部が除去される場合、前記重み記憶部に記憶されている該除去されるデータ記憶部の重みを、前記除去されるデータ記憶部の最大容量に比例する値よりも小さい所定の減少値ずつ減少させる重み付け工程と、
    前記重み付け工程が前記除去されるデータ記憶部の重みを減少させるたびに、前記除去されるデータ記憶部を含む各データ記憶部の蓄積量の比が、前記除去されるデータ記憶部を含む各データ記憶部の重みの比と等しくなるように、前記除去されるデータ記憶部が蓄積する複製データのうち、前記除去されるデータ記憶部から移動させる複製データを決定する蓄積先決定工程と、
    前記蓄積先決定工程によって複製データが決定されるたびに、前記蓄積先決定工程によって決定された複製データを、前記除去されるデータ記憶部から移動させる複製データ配置工程と、
    を含んだことを特徴とするデータ再配置方法。
  8. コンピュータを、請求項1から5のいずれか1項に記載の分散ストレージシステムとして機能させるためのデータ再配置プログラム。
JP2015132715A 2015-07-01 2015-07-01 分散ストレージシステム、データ再配置方法およびデータ再配置プログラム Active JP6315608B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015132715A JP6315608B2 (ja) 2015-07-01 2015-07-01 分散ストレージシステム、データ再配置方法およびデータ再配置プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015132715A JP6315608B2 (ja) 2015-07-01 2015-07-01 分散ストレージシステム、データ再配置方法およびデータ再配置プログラム

Publications (2)

Publication Number Publication Date
JP2017016404A true JP2017016404A (ja) 2017-01-19
JP6315608B2 JP6315608B2 (ja) 2018-04-25

Family

ID=57828177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015132715A Active JP6315608B2 (ja) 2015-07-01 2015-07-01 分散ストレージシステム、データ再配置方法およびデータ再配置プログラム

Country Status (1)

Country Link
JP (1) JP6315608B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119741A (ja) * 2004-10-19 2006-05-11 Hitachi Ltd ストレージネットワークシステム及びホスト計算機並びに物理パス割当方法
US20130132450A1 (en) * 2011-11-22 2013-05-23 Fujitsu Limited Node determining program, node determining apparatus, and node determining method
JP2014186364A (ja) * 2013-03-21 2014-10-02 Kddi Corp 分散システム
JP2014228946A (ja) * 2013-05-20 2014-12-08 富士通株式会社 情報処理装置、情報処理システム、情報処理装置の制御方法及び情報処理装置の制御プログラム
JP2015022327A (ja) * 2013-07-16 2015-02-02 日本電信電話株式会社 データ再配置装置、方法およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119741A (ja) * 2004-10-19 2006-05-11 Hitachi Ltd ストレージネットワークシステム及びホスト計算機並びに物理パス割当方法
US20130132450A1 (en) * 2011-11-22 2013-05-23 Fujitsu Limited Node determining program, node determining apparatus, and node determining method
JP2013109672A (ja) * 2011-11-22 2013-06-06 Fujitsu Ltd ノード決定プログラム、ノード決定装置およびノード決定方法
JP2014186364A (ja) * 2013-03-21 2014-10-02 Kddi Corp 分散システム
JP2014228946A (ja) * 2013-05-20 2014-12-08 富士通株式会社 情報処理装置、情報処理システム、情報処理装置の制御方法及び情報処理装置の制御プログラム
JP2015022327A (ja) * 2013-07-16 2015-02-02 日本電信電話株式会社 データ再配置装置、方法およびプログラム

Also Published As

Publication number Publication date
JP6315608B2 (ja) 2018-04-25

Similar Documents

Publication Publication Date Title
US9645756B2 (en) Optimization of in-memory data grid placement
US9740536B2 (en) Method of achieving intra-machine workload balance for task chunks for distributed graph-processing systems
US10050862B2 (en) Distributed application framework that uses network and application awareness for placing data
US9703610B2 (en) Extensible centralized dynamic resource distribution in a clustered data grid
US8713125B2 (en) Method and system for scaling usage of a social based application on an online social network
JP6886964B2 (ja) 負荷平衡方法及び装置
US9594801B2 (en) Systems and methods for allocating work for various types of services among nodes in a distributed computing system
KR101790701B1 (ko) 분산 인-메모리 환경에서 데이터 복제 및 이주를 이용한 부하 분산 시스템
CN108804465B (zh) 一种分布式缓存数据库数据迁移的方法及系统
US10346217B1 (en) Best-effort key affinity workload sharding
US20130007091A1 (en) Methods and apparatuses for storing shared data files in distributed file systems
Honnutagi The Hadoop distributed file system
CN110765092A (zh) 分布式搜索系统、索引分发方法及存储介质
Mate et al. Robust multi-tenant server consolidation in the cloud for data analytics workloads
JP6374841B2 (ja) 仮想マシン配置装置および仮想マシン配置方法
Fazul et al. Improving data availability in HDFS through replica balancing
US10379780B2 (en) Statistics management for scale-out storage
JP6315608B2 (ja) 分散ストレージシステム、データ再配置方法およびデータ再配置プログラム
US20220391411A1 (en) Dynamic adaptive partition splitting
JP7485046B2 (ja) 負荷分散方法、負荷分散装置、負荷分散システムおよびプログラム
US10122789B1 (en) Log information transmission integrity
US11797282B2 (en) Optimizing services deployment in a cloud computing environment
US10379902B2 (en) Information processing device for aggregating load information, information processing system for aggregating load information, and non-transitory computer-readable storage medium recording program for aggregating load information
JP2024514467A (ja) 地理的に分散されたハイブリッドクラウドクラスタ
Al Nuaimi et al. Partial storage optimization and load control strategy of cloud data centers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180320

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180322

R150 Certificate of patent or registration of utility model

Ref document number: 6315608

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150