JP2019192032A - 記憶システム、及び、クラスタ構成制御方法 - Google Patents
記憶システム、及び、クラスタ構成制御方法 Download PDFInfo
- Publication number
- JP2019192032A JP2019192032A JP2018085691A JP2018085691A JP2019192032A JP 2019192032 A JP2019192032 A JP 2019192032A JP 2018085691 A JP2018085691 A JP 2018085691A JP 2018085691 A JP2018085691 A JP 2018085691A JP 2019192032 A JP2019192032 A JP 2019192032A
- Authority
- JP
- Japan
- Prior art keywords
- storage
- storage node
- cluster
- control program
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0617—Improving the reliability of storage systems in relation to availability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
- G06F3/0605—Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0806—Configuration setting for initial configuration or provisioning, e.g. plug-and-play
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/0816—Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0895—Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/40—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/20—Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Hardware Redundancy (AREA)
Abstract
Description
・ストレージノード101−S0又は101−S3が対象ストレージノードの場合、データ重要度は「高」である。なぜなら、ストレージノード101−S0内のユーザデータセット4−G0、及び、ストレージノード101−S3内のユーザデータセット4−G2は、いずれも、冗長度が、所定値0のためである(データ配置管理テーブル222において、グループG0及びG2のいずれについても、ノードID502及び503の一方が無効な値(又はブランク)だからである)。すなわち、ストレージノード101−S0又は101−S3がストレージクラスタから離脱すると、ホストノード51から、ユーザデータセット4−G0又は4−G2にアクセスできなくなるためである。
・ストレージノード101−S1又は101−S2が対象ストレージノードの場合、データ重要度は「低」である。なぜなら、ストレージノード101−S1内のユーザデータセット4−G1及び4−G3、及び、ストレージノード101−S2内のユーザデータセット4−G0及び4−G4のいずれも、冗長度が、所定値0を超えているためである。
・ストレージノード101−S0又は101−S3が対象ストレージノードの場合、I/O重要度は「高」である。なぜなら、ストレージノード101−S0内のアクティブI/O制御プログラム6A−P3が停止しフェールオーバーが行われストレージノード101−S3内のスタンバイのI/O制御プログラム6S−P3がアクティブのI/O制御プログラム6A−P3に切り替わり、結果として、プログラムペアP3について、I/O制御プログラム6の冗長度が0になったからである(I/O配置管理テーブル223において、プログラムペアP2について、ノードID(Standby)603が無効な値(又はブランク)だからである)。
・ストレージノード101−S1又は101−S2が対象ストレージノードの場合、I/O重要度は「低」である。なぜなら、ストレージノード101−S1及び101−S2のいずれも、冗長度が0のI/O制御プログラム6が存在しないからである。
Claims (10)
- ストレージクラスタのメンバであるN台(Nは3以上の整数)のストレージノードを備え、
前記N台のストレージノードのうちのいずれかである第1のストレージノードが、
前記第1のストレージノード以外のストレージノードのうち対象とされたストレージノードである第2のストレージノードの重要度が所定の重要度以上であって、前記第2のストレージノードの信頼度が所定の信頼度以上であるか否かを判定し、
当該判定の結果が真の場合に、前記第2のストレージノードを前記ストレージクラスタから離脱させ再び前記第2のストレージノードを前記ストレージクラスタのメンバとすることである再組込みを行い、
前記第2のストレージノードの重要度は、前記第2のストレージノードが前記ストレージクラスタから離脱したと仮定した場合の可用性の高さに依存し、
前記第2のストレージノードの信頼度は、前記第2のストレージノードの稼働の傾向に依存する、
記憶システム。 - 前記N台のストレージノードの各々は、プロセッサ部を有し、
前記N台のストレージノードが、
P個(Pは自然数)のプログラムクラスタと、
Q個(Qは2以上N以下の整数)のクラスタ制御プログラムと
を有し、
前記P個のプログラムクラスタの各々は、
アクティブのI/O(Input/Output)制御プログラムと、
当該アクティブのI/O制御プログラム以外のI/O制御プログラムであり当該アクティブのI/O制御プログラムが配置されているストレージノードとは別の1以上のストレージノードにそれぞれ配置されている1以上のスタンバイのI/O制御プログラムと
を含み、
前記アクティブのI/O制御プログラムは、当該I/O制御プログラムが配置されているストレージノードにおけるプロセッサ部によって実行されることで、1以上のストレージノードに対して、データセットを書き込み、
前記1以上のスタンバイのI/O制御プログラムのいずれかが、前記アクティブのI/O制御プログラムが停止した場合に当該I/O制御プログラムに代わってアクティブとなり、
前記Q個のクラスタ制御プログラムは、
プライマリのクラスタ制御プログラムと、
当該プライマリの制御プログラム以外のクラスタ制御プログラムであり当該プライマリのクラスタ制御プログラムが配置されているストレージノードとは別の1以上のストレージノードにそれぞれ配置されている1以上のセカンダリのクラスタ制御プログラムと
を含み、
前記プライマリのクラスタ制御プログラムは、当該クラスタ制御プログラムが配置されているストレージノードにおけるプロセッサ部によって実行されることで、前記ストレージクラスタを管理し、
前記1以上のセカンダリのクラスタ制御プログラムのいずれかが、前記プライマリのクラスタ制御プログラムが停止した場合に当該クラスタ制御プログラムに代わってプライマリとなり、
前記第2のストレージノードの重要度は、
前記第2のストレージノードに格納されている少なくとも1つのデータセットについての当該データセットの冗長度と、
前記第2のストレージノードに配置されている少なくとも1個のI/O制御プログラムについてのプログラムクラスタにおけるI/O制御プログラムの冗長度と、
前記Q個のクラスタ制御プログラムがそれぞれ配置されているQ台のストレージノードに前記第2のストレージノードが含まれていなければQであり、前記Q台のストレージノードに前記第2のストレージノードが含まれていればQから前記第2のストレージノードの数を引いた値である残存ノード数と
に依存する、
請求項1に記載の記憶システム。 - 前記第2のストレージノードの重要度は、前記第2のストレージノードに格納されている少なくとも1つのデータセットについての当該データセットの冗長度に依存する、
請求項1に記載の記憶システム。 - 前記N台のストレージノードの各々は、プロセッサ部を有し、
前記N台のストレージノードが、P個(Pは自然数)のプログラムクラスタを有し、
前記P個のプログラムクラスタの各々は、
アクティブのI/O(Input/Output)制御プログラムと、
当該アクティブのI/O制御プログラム以外のI/O制御プログラムであり当該アクティブのI/O制御プログラムが配置されているストレージノードとは別の1以上のストレージノードにそれぞれ配置されている1以上のスタンバイのI/O制御プログラムと
を含み、
前記アクティブのI/O制御プログラムは、当該I/O制御プログラムが配置されているストレージノードにおけるプロセッサ部によって実行されることで、1以上のストレージノードに対して、データセットを書き込み、
前記1以上のスタンバイのI/O制御プログラムのいずれかが、前記アクティブのI/O制御プログラムが停止した場合に当該I/O制御プログラムに代わってアクティブとなり、
前記第2のストレージノードの重要度は、前記第2のストレージノードに配置されている少なくとも1個のI/O制御プログラムについてのプログラムクラスタにおけるI/O制御プログラムの冗長度に依存する、
請求項1に記載の記憶システム。 - 前記N台のストレージノードの各々は、プロセッサ部を有し、
前記N台のストレージノードが、Q個(Qは2以上N以下の整数)のクラスタ制御プログラムを有し、
前記Q個のクラスタ制御プログラムは、Q台のストレージノードにそれぞれ配置されており、
前記Q個のクラスタ制御プログラムは、
プライマリのクラスタ制御プログラムと、
当該プライマリの制御プログラム以外のクラスタ制御プログラムであり当該プライマリのクラスタ制御プログラムが配置されているストレージノードとは別の1以上のストレージノードにそれぞれ配置されている1以上のセカンダリのクラスタ制御プログラムと
を含み、
前記プライマリのクラスタ制御プログラムは、当該クラスタ制御プログラムが配置されているストレージノードにおけるプロセッサ部によって実行されることで、前記記憶システムとしてのクラスタを管理し、
前記1以上のセカンダリのクラスタ制御プログラムのいずれかが、前記プライマリのクラスタ制御プログラムが停止した場合に当該クラスタ制御プログラムに代わってプライマリとなり、
前記第2のストレージノードの重要度は、前記Q個のクラスタ制御プログラムがそれぞれ配置されているQ台のストレージノードに前記第2のストレージノードが含まれていなければQであり、前記Q台のストレージノードに前記第2のストレージノードが含まれていればQから前記第2のストレージノードの数を引いた値である残存ノード数に依存する、
請求項1に記載の記憶システム。 - 前記第2のストレージノードの重要度は、前記残存ノード数が前記残存ノード数の閾値以下か否かに依存し、
前記残存ノード数の閾値は、Qの過半数に、同時に再組込みの対象となり得るストレージノードの数を加えた値である、
請求項5に記載の記憶システム。 - 前記第2のストレージノードの稼働の傾向は、前記第2のストレージノードの障害発生の傾向を含む、
請求項1に記載の記憶システム。 - 前記第2のストレージノードの障害発生の傾向は、前記第2のストレージノードの最近の長期間における障害発生の傾向と、前記第2のストレージノードの最近の短期間における障害発生の傾向とを含む、
請求項7に記載の記憶システム。 - ストレージクラスタのメンバであるN台(Nは3以上の整数)のストレージノードのうち対象とされたストレージノードである対象ストレージノードの重要度が所定の重要度以上であって、前記対象ストレージノードの信頼度が所定の信頼度以上であるか否かを判定し、
当該判定の結果が真の場合に、前記対象ストレージノードを前記ストレージクラスタから離脱させ再び前記対象ストレージノードを前記ストレージクラスタのメンバとすることである再組込みを行い、
前記対象のストレージノードの重要度は、前記対象ストレージノードが前記ストレージクラスタから離脱したと仮定した場合の可用性の高さに依存し、
前記対象ストレージノードの信頼度は、前記対象ストレージノードの稼働の傾向に依存する、
クラスタ構成制御方法。 - ストレージクラスタのメンバであるN台(Nは3以上の整数)のストレージノードのうち対象とされたストレージノードである対象ストレージノードの重要度が所定の重要度以上であって、前記対象ストレージノードの信頼度が所定の信頼度以上であるか否かを判定し、
当該判定の結果が真の場合に、前記対象ストレージノードを前記ストレージクラスタから離脱させ再び前記対象ストレージノードを前記ストレージクラスタのメンバとすることである再組込みを行う、
ことを計算機に実行させ、
前記対象のストレージノードの重要度は、前記対象ストレージノードが前記ストレージクラスタから離脱したと仮定した場合の可用性の高さに依存し、
前記対象ストレージノードの信頼度は、前記対象ストレージノードの稼働の傾向に依存する、
コンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018085691A JP6714037B2 (ja) | 2018-04-26 | 2018-04-26 | 記憶システム、及び、クラスタ構成制御方法 |
US16/296,961 US10795587B2 (en) | 2018-04-26 | 2019-03-08 | Storage system and cluster configuration control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018085691A JP6714037B2 (ja) | 2018-04-26 | 2018-04-26 | 記憶システム、及び、クラスタ構成制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019192032A true JP2019192032A (ja) | 2019-10-31 |
JP6714037B2 JP6714037B2 (ja) | 2020-06-24 |
Family
ID=68292485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018085691A Active JP6714037B2 (ja) | 2018-04-26 | 2018-04-26 | 記憶システム、及び、クラスタ構成制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10795587B2 (ja) |
JP (1) | JP6714037B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491616B (zh) * | 2018-11-14 | 2022-05-24 | 三星(中国)半导体有限公司 | 数据的存储方法和设备 |
US11456917B2 (en) * | 2020-06-01 | 2022-09-27 | Cisco Technology, Inc. | Analyzing deployed networks with respect to network solutions |
CN113656242B (zh) * | 2021-07-29 | 2023-12-22 | 济南浪潮数据技术有限公司 | 一种服务器集群的监控方法及系统 |
JP7532333B2 (ja) * | 2021-12-02 | 2024-08-13 | 株式会社日立製作所 | ストレージシステム及びストレージプログラム更新方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5999712A (en) * | 1997-10-21 | 1999-12-07 | Sun Microsystems, Inc. | Determining cluster membership in a distributed computer system |
US8112593B2 (en) * | 2007-03-29 | 2012-02-07 | Netapp, Inc. | System and method for improving cluster performance |
US8352692B1 (en) * | 2007-03-30 | 2013-01-08 | Symantec Corporation | Utilizing peer-to-peer services with single instance storage techniques |
JP5872433B2 (ja) | 2012-10-04 | 2016-03-01 | 日本電信電話株式会社 | 仮想マシン配置装置および仮想マシン配置方法 |
US10158743B2 (en) * | 2016-06-12 | 2018-12-18 | International Business Machines Corporation | Compute node cluster management |
-
2018
- 2018-04-26 JP JP2018085691A patent/JP6714037B2/ja active Active
-
2019
- 2019-03-08 US US16/296,961 patent/US10795587B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6714037B2 (ja) | 2020-06-24 |
US10795587B2 (en) | 2020-10-06 |
US20190332282A1 (en) | 2019-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10795587B2 (en) | Storage system and cluster configuration control method | |
US9547552B2 (en) | Data tracking for efficient recovery of a storage array | |
US11221935B2 (en) | Information processing system, information processing system management method, and program thereof | |
US11301162B2 (en) | Balancing resiliency and performance by selective use of degraded writes and spare capacity in storage systems | |
US10324780B2 (en) | Efficient data system error recovery | |
EP3147797B1 (en) | Data management method, node and system for database cluster | |
CN111104051B (zh) | 用于管理存储系统的方法、设备和计算机程序产品 | |
US20150089171A1 (en) | Storage control apparatus, control method, and computer product | |
US9063854B1 (en) | Systems and methods for cluster raid data consistency | |
US12050778B2 (en) | Data restoration method and related device | |
CN112764661A (zh) | 用于管理存储系统的方法、设备和计算机程序产品 | |
US20170220249A1 (en) | Systems and Methods to Maintain Consistent High Availability and Performance in Storage Area Networks | |
WO2016190893A1 (en) | Storage management | |
US10019182B2 (en) | Management system and management method of computer system | |
JP7419456B2 (ja) | 記憶システム及びその制御方法 | |
JP2021026375A (ja) | ストレージシステム | |
US10990313B2 (en) | Multi-storage node system and capacity management method of multi-storage node system | |
US10691564B2 (en) | Storage system and storage control method | |
WO2017026070A1 (ja) | ストレージシステム及びストレージ管理方法 | |
US10866756B2 (en) | Control device and computer readable recording medium storing control program | |
WO2023143039A1 (zh) | 一种数据处理方法及装置 | |
US10365836B1 (en) | Electronic system with declustered data protection by parity based on reliability and method of operation thereof | |
US8930762B1 (en) | Optimal tracking of cluster-wide shared storage connectivity for graceful error handling | |
US20230090032A1 (en) | Storage system and control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6714037 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |