JP6842480B2 - 分散ストレージシステム - Google Patents
分散ストレージシステム Download PDFInfo
- Publication number
- JP6842480B2 JP6842480B2 JP2019024936A JP2019024936A JP6842480B2 JP 6842480 B2 JP6842480 B2 JP 6842480B2 JP 2019024936 A JP2019024936 A JP 2019024936A JP 2019024936 A JP2019024936 A JP 2019024936A JP 6842480 B2 JP6842480 B2 JP 6842480B2
- Authority
- JP
- Japan
- Prior art keywords
- drive
- controller
- upper limit
- virtual
- queue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(P)IE5A0又は5A1、ISW3A0、SN4A、専用線48A、SN4C、ISW3C1、及び、IE5D0又は5D1。
(Q)IE5A2又は5A3、ISW3B0、SN4B、専用線48B、SN4D、ISW3D1、及び、IE5D2又は5D3。
Claims (15)
- ホストシステムに論理ボリュームを提供する分散ストレージシステムであって、
複数のドライブが関連付けられた複数のストレージノードを有し、
前記複数のストレージノードの各々は、一つ以上のコントローラを有し、
各コントローラにとって、前記複数のドライブには、当該コントローラに物理的に接続されているドライブである接続ドライブがあり、
前記各コントローラは、ホストシステムから送信され論理ボリュームのアドレスを指定したI/O(Input/Output)コマンドであるHost−IOを前記ホストシステム又は別のコントローラから受け付けた場合、当該受け付けたHost−IOに基づきドライブのアドレスを指定したI/OコマンドであるDrive−IOを発行するようになっており、
前記各コントローラは、当該コントローラの接続ドライブ毎に一つ以上の実キューである実キュー群を有することに加えて、前記複数のドライブの各々について一つ以上の仮想キューである仮想キュー群を有し、
各実キューは、ドライブに送信されるDrive−IOが蓄積されるキューであり、
各仮想キューは、受け付けられたDrive−IOが蓄積されるキューであり、
いずれかのコントローラにより受け付けられたDrive−IOである対象Drive−IOは、当該対象Drive−IOの発行先ドライブに対応した実キュー群に蓄積される前に、当該発行先ドライブに対応した仮想キュー群に蓄積される、
分散ストレージシステム。 - 前記各コントローラには、
各ドライブについて、当該ドライブに対応した仮想キュー群に蓄積可能なDrive−IOの数の上限である仮想上限値と、
当該コントローラの各接続ドライブについて、当該接続ドライブに対応した実キュー群に蓄積可能なDrive−IOの数の上限である実上限値と
が設定されている、
請求項1に記載の分散ストレージシステム。 - 前記各コントローラにおいて、前記各ドライブに関し、当該ドライブに対応した仮想上限値は、当該ドライブが接続ドライブであるコントローラに設定される実上限値と同じ又はそれよりも大きい値である、
請求項2に記載の分散ストレージシステム。 - 前記各コントローラにおいて、前記各ドライブに関し、
当該ドライブに対応した仮想上限値は、当該ドライブのハード仕様に従う上限値に基づく値であり、
当該ドライブを接続ドライブとしたコントローラに設定される実上限値は、当該ドライブのハード仕様に従う上限値に基づく値を、当該ドライブが接続ドライブであるコントローラの数で割った値である、
請求項3に記載の分散ストレージシステム。 - 前記複数のストレージノードにおける複数のコントローラの少なくとも一つには、当該コントローラに物理的に接続されていないドライブである非接続ドライブがあり、
前記対象Drive−IOが受け付けられた受付コントローラと、前記発行先ドライブが接続ドライブである実行コントローラとが異なっている場合、前記対象Drive−IOは、
前記受付コントローラにおける複数の仮想キュー群のうち前記発行先ドライブに対応した仮想キュー群から前記受付コントローラにより取得され、
前記受付コントローラから前記実行コントローラに転送され、
前記実行コントローラにおける複数の実キュー群のうち前記発行先ドライブに対応した実キュー群に、前記実行コントローラにより蓄積される、
請求項3に記載の分散ストレージシステム。 - 前記実行コントローラは、前記対象Drive−IOを前記受付コントローラから受け付けた場合、前記実行コントローラにおける複数の仮想上限値のうち、前記発行先ドライブに対応した仮想上限値を下げる、
請求項5に記載の分散ストレージシステム。 - 前記各コントローラは、複数のプロセッサコアを有し、
前記各コントローラにおいて、当該コントローラにおけるプロセッサコア毎に仮想キュー及び実キューの各々が備えられ、
前記実行コントローラにおいて前記発行先ドライブに対応した仮想上限値のデフォルト値は、前記発行先ドライブのハード仕様に従う上限値に基づく値であり、
前記受付コントローラと前記実行コントローラとが異なっている場合、前記実行コントローラにおいて前記発行先ドライブに対応した仮想上限値は、前記実行コントローラが有するプロセッサコア数と同じ値に下げられる、
請求項6に記載の分散ストレージシステム。 - 前記実行コントローラは、周期的に、当該実行コントローラにおいてデフォルト値と異なる値になっている仮想上限値があれば当該仮想上限値をデフォルト値に戻す、
請求項6に記載の分散ストレージシステム。 - 前記複数のストレージノードの各々が、二つ以上のコントローラを有する、
請求項1に記載の分散ストレージシステム。 - 前記複数のストレージノードは、複数のノード群を有し、
前記複数のノード群の各々は、冗長化されたストレージノードであり、
各ストレージノードにおいて、前記二つ以上のコントローラは、冗長化されたコントローラである、
請求項9に記載の分散ストレージシステム。 - 前記各コントローラは、当該コントローラに設定されている複数の仮想上限値の各々を動的に調整する、
請求項2に記載の分散ストレージシステム。 - 前記各コントローラは、当該コントローラに設定されている複数の仮想上限値の各々を、当該仮想上限値に対応したドライブに対するDrive−IOの実行状況に応じて調整する、
請求項11に記載の分散ストレージシステム。 - 前記各コントローラは、当該コントローラに設定されている複数の仮想上限値の各々を周期的に調整する、
請求項2に記載の分散ストレージシステム。 - 前記各コントローラは、周期的に、当該コントローラにおいてデフォルト値と異なる値になっている仮想上限値があれば当該仮想上限値をデフォルト値に戻す、
請求項13に記載の分散ストレージシステム。 - ホストシステムに論理ボリュームを提供する分散ストレージシステムで実現される記憶制御方法であって、
前記分散ストレージシステムは、複数のドライブが関連付けられた複数のストレージノードを有し、
前記複数のストレージノードの各々は、一つ以上のコントローラを有し、
各コントローラにとって、前記複数のドライブには、当該コントローラに物理的に接続されているドライブである接続ドライブがあり、
前記各コントローラは、ホストシステムから送信され論理ボリュームのアドレスを指定したI/O(Input/Output)コマンドであるHost−IOを前記ホストシステム又は別のコントローラから受け付けた場合、当該受け付けたHost−IOに基づきドライブのアドレスを指定したI/OコマンドであるDrive−IOを発行するようになっており、
前記記憶制御方法は、
前記各コントローラに、当該コントローラの接続ドライブ毎に一つ以上の実キューである実キュー群と、前記複数のドライブの各々について一つ以上の仮想キューである仮想キュー群とを設定し、
各実キューは、ドライブに送信されるDrive−IOが蓄積されるキューであり、
各仮想キューは、受け付けられたDrive−IOが蓄積されるキューであり、
いずれかのコントローラにより発行されたDrive−IOである対象Drive−IOを、当該対象Drive−IOの発行先ドライブに対応した実キュー群に蓄積される前に、当該対象Drive−IOを受け付けたコントローラにより、当該発行先ドライブに対応した仮想キュー群に蓄積する、
記憶制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019024936A JP6842480B2 (ja) | 2019-02-14 | 2019-02-14 | 分散ストレージシステム |
US16/577,569 US11144242B2 (en) | 2019-02-14 | 2019-09-20 | Distributed storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019024936A JP6842480B2 (ja) | 2019-02-14 | 2019-02-14 | 分散ストレージシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135155A JP2020135155A (ja) | 2020-08-31 |
JP6842480B2 true JP6842480B2 (ja) | 2021-03-17 |
Family
ID=72042053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019024936A Active JP6842480B2 (ja) | 2019-02-14 | 2019-02-14 | 分散ストレージシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11144242B2 (ja) |
JP (1) | JP6842480B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6942163B2 (ja) * | 2019-08-06 | 2021-09-29 | 株式会社日立製作所 | ドライブボックス、ストレージシステム及びデータ転送方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001001262A1 (fr) * | 1999-06-24 | 2001-01-04 | Fujitsu Limited | Controleur de peripherique et systeme d'entree/sortie |
JP4654273B2 (ja) | 2008-07-14 | 2011-03-16 | 富士通株式会社 | ストレージ装置および制御装置 |
JP2010211428A (ja) * | 2009-03-10 | 2010-09-24 | Fujitsu Ltd | ストレージ装置、中継装置、及びコマンド発行制御方法 |
WO2017158799A1 (ja) * | 2016-03-17 | 2017-09-21 | 株式会社日立製作所 | ストレージ装置および情報処理方法 |
JP2019175292A (ja) * | 2018-03-29 | 2019-10-10 | 東芝メモリ株式会社 | 電子機器、コンピュータシステム、および制御方法 |
-
2019
- 2019-02-14 JP JP2019024936A patent/JP6842480B2/ja active Active
- 2019-09-20 US US16/577,569 patent/US11144242B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20200264806A1 (en) | 2020-08-20 |
JP2020135155A (ja) | 2020-08-31 |
US11144242B2 (en) | 2021-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107430528B (zh) | 机会性资源迁移以优化资源放置 | |
CN110324264B (zh) | 分配系统资源的方法与系统 | |
JP4775846B2 (ja) | 物理リンクの割当てを制御するコンピュータシステム及び方法 | |
JP6074056B2 (ja) | 計算機システムおよびデータ制御方法 | |
JP5981563B2 (ja) | 情報記憶システム及び情報記憶システムの制御方法 | |
US8751741B2 (en) | Methods and structure for implementing logical device consistency in a clustered storage system | |
US20110167189A1 (en) | Storage apparatus and its data transfer method | |
US8489845B2 (en) | Storage system comprising multiple storage control apparatus | |
US20190339905A1 (en) | Storage apparatus and information processing method | |
US10616134B1 (en) | Prioritizing resource hosts for resource placement | |
JP2022517890A (ja) | コンポーザブルインフラストラクチャにおける記憶装置の故障耐性を維持するための方法とシステム | |
CN105739930A (zh) | 一种存储架构及其初始化方法和数据存储方法及管理装置 | |
JP6617461B2 (ja) | 制御装置、制御プログラム、及び制御方法 | |
JP2009015843A (ja) | ロング・サイド入出力コマンド処理 | |
JP6842480B2 (ja) | 分散ストレージシステム | |
WO2016203629A1 (ja) | ストレージシステム及びキャッシュ制御方法 | |
WO2014184943A1 (ja) | ストレージ装置及びraidグループ構成方法 | |
US10776173B1 (en) | Local placement of resource instances in a distributed system | |
US8312234B2 (en) | Storage system configured from plurality of storage modules and method for switching coupling configuration of storage modules | |
CN114442910A (zh) | 管理存储系统的方法、电子设备和计算机程序产品 | |
US8924683B2 (en) | Storage apparatus and data control method using a relay unit and an interface for communication and storage management | |
US9569373B2 (en) | Sharing message-signaled interrupts between peripheral component interconnect (PCI) I/O devices | |
CN111124253A (zh) | 管理存储设备的方法、装置和计算机程序产品 | |
US11513861B2 (en) | Queue management in solid state memory | |
JP6836536B2 (ja) | ストレージシステム及びio処理の制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200915 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6842480 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |