JP2018029337A - コンピューティング資源への高可用性アクセスを提供するコンピューティングシステム及び予備資源連結ファブリック - Google Patents
コンピューティング資源への高可用性アクセスを提供するコンピューティングシステム及び予備資源連結ファブリック Download PDFInfo
- Publication number
- JP2018029337A JP2018029337A JP2017156664A JP2017156664A JP2018029337A JP 2018029337 A JP2018029337 A JP 2018029337A JP 2017156664 A JP2017156664 A JP 2017156664A JP 2017156664 A JP2017156664 A JP 2017156664A JP 2018029337 A JP2018029337 A JP 2018029337A
- Authority
- JP
- Japan
- Prior art keywords
- switch
- resource
- data storage
- computing
- connection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/15—Interconnection of switching modules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2007—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
- G06F11/201—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2035—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
- G06F11/2092—Techniques of failing over between control units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4004—Coupling between buses
- G06F13/4022—Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
- G06F13/4282—Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/10—Packet switching elements characterised by the switching fabric construction
- H04L49/101—Packet switching elements characterised by the switching fabric construction using crossbar or matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/552—Prevention, detection or correction of errors by ensuring the integrity of packets received through redundant connections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/557—Error correction, e.g. fault recovery or fault tolerance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Hardware Redundancy (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
本発明の実施形態は、コンピューティング資源がデュアルポートデータ格納装置セットであり、連結及びスイッチがPCIe連結及びスイッチであり、インターフェイスがネットワークインターフェイスであるデータ格納システムの特定事例を参照して以下に説明する。しかし、本発明の実施形態はこれに限定されず、他の形態のコンピューティング資源、連結プロトコル、及びインターフェイスに適用できる。
図3は本発明の一実施形態に係るスイッチの故障及びデータ伝送トラフィックのリバランシング(rebalancing)を示すブロック図である。サーバーノード及びスイッチの間の予備連結(redundant connections)がないので、スイッチ40の故障状況において、スイッチ40と連関されたサーバーノード20はシステムの残りの部分との連結が切断される。したがって、本発明の一部の実施形態において、スイッチ40の故障はそれと連関されたサーバーノードの損失を実質的に発生させる。しかし、本発明の実施形態がこれに限定されることはなく、一部の実施形態において、サーバーノードは複数のスイッチと連結される。
本発明の一部の実施形態において、補助ファブリック50(secondary fabric)がサーバーノード20の間の通信のために含まれる。図5は本発明の一実施形態に係るサーバーノード20を連結する補助ファブリック50をさらに含むシステムのブロック図である。補助ファブリック50は補助スイッチ54(例えば、54A、54B、54C、及び54D)を他の1つに連結する相互連結52(inter−connections)(例えば、52AB、52AC、52AD、52BC、及び52BD)を含む。この時、補助スイッチ54の各々は対応する1つのサーバーノード20と直接連結される。例えば、補助スイッチ54Aはサーバーノード20Aと直接連結される。ファブリック10と同様に、補助ファブリック50は印刷回路基板上のパターン(trace)、複数の電気配線(例えば、リボンケーブル、mini−SASHDケーブル、OCuLinkケーブル等)、及びそれらの組合せのような多様な方式により具現される。本発明の一実施形態によれば、補助ファブリック50はサーバーノードCPU NTB(non−transparent bridge)ポートと連結される。補助ファブリック50はサーバーノード20の間のメタデータを同期化するのに使用され、サーバーノード20の間の低遅延内部通信(low−latency internal communication)を提供する。
図1、図2、図3、図4、及び図5は4つのデータ格納装置セットへの高可用性及び高性能アクセスを提供するサーバーノード20の2つのペア22を具備するシステムを示しているが、本発明の実施形態がこれに限定されることではない。
サーバーノードの個数、SSDの個数、エンドツーエンドパフォーマンス規定(end−to−end performance specification)に関して柔軟性(flexibility)を提供し、
サーバーノード及びSSDを通じてエンドツーエンド負荷均衡を支援し、SSDのマルチポートを通じて一対のサーバーノード(HA−peers)からSSDのセットへの予備アクセスを提供し、
様々なペアのHAピアノードの間のクロス接続帯域幅を提供して故障復旧及び負荷均等化シナリオによりすべてのサーバーノードに帯域幅をリバランシングし、すべての生存ノードによって帯域幅をリバランシングすることによってエンドツーエンドシステムパフォーマンスの低下無しに1つのノード故障に耐え、自動故障検出及びその後のサーバーノードへのSSDエンドポイントの再割当及び帯域幅のリバランシングに転じる能力を提供する。
1つのルート−コンプレックス故障(HA)の状況においてパフォーマンス低下を制限しながら、すべてのPCIeエンドポイントを継続的にアクセスする機能と、ルート−コンプレックス及びエンドポイントの間の帯域幅の割当を調整する機能と、
故障復旧又は負荷バランシングシナリオにより、PCIeエンドポイントをルートコンプレックスに動的に再割当する機能と、
ホストルート−コンプレックス上のオーバーヘッド無しにエンドポイントの間のピアツーピアデータ伝送を遂行する機能と、HAピアサーバーノードの間のローレイテンシの高い処理量通信を遂行する機能を可能とする。
12 クロス接続
14 ホストリンク
16 資源リンク
20 サーバーノード
22 ペア
24 ホストプロセッサ
26 ネットワークインターフェイス
30 データ格納装置セット
32 データ格納装置
40 スイッチ
50 補助ファブリック
52 相互連結
54 補助スイッチ
100 データ格納システム
Claims (23)
- コンピューティング資源への高可用性アクセスを提供するコンピューティングシステムにおいて、
複数のインターフェイスと、
複数のコンピューティング資源セットと、
少なくとも3つのスイッチと、を含み、
前記複数のコンピューティング資源セットの各々は、複数のコンピューティング資源を含み、
前記少なくとも3つのスイッチの各々は、ホストリンクを通じて前記インターフェイスの中の対応する1つと連結され、複数の資源連結を通じて前記複数のコンピューティング資源セットの中の対応する1つと連結され、前記スイッチの中の1つが故障の場合、前記スイッチの間の複数のクロス接続を通じて前記スイッチの中の残されているスイッチにデータトラフィックが分散されるように構成されることを特徴とするコンピューティングシステム。 - 前記少なくとも3つのスイッチは、
第1スイッチと、
第2スイッチと、
第1クロス接続を通じて前記第1スイッチと直接連結され、第2クロス接続を通じて前記第2スイッチと直接連結される第3スイッチと、を含むことを特徴とする請求項1に記載のコンピューティングシステム。 - 第1ホストリンクを通じて前記第1スイッチと連結され、前記複数のインターフェイスの中の第1インターフェイスを含む第1サーバーノードと、
第2ホストリンクを通じて前記第2スイッチと連結され、前記複数のインターフェイスの中の第2インターフェイスを含む第2サーバーノードと、をさらに含むことを特徴とする請求項2に記載のコンピューティングシステム。 - 第3ホストリンクを通じて前記第3スイッチと連結される第3サーバーノードをさらに含むことを特徴とする請求項3に記載のコンピューティングシステム。
- 前記第1サーバーノードと直接連結される第1補助スイッチと、
前記第2サーバーノードと直接連結される第2補助スイッチと、
前記第3サーバーノードと直接連結される第3補助スイッチと、
前記第1補助スイッチを前記第2補助スイッチと直接連結する第1クロス接続と、
前記第1補助スイッチを前記第3補助スイッチと直接連結する第2クロス接続と、
前記第2補助スイッチを前記第3補助スイッチと直接連結する第3クロス接続と、をさらに含むことを特徴とする請求項4に記載のコンピューティングシステム。 - 前記複数のコンピューティング資源セットの中の第1コンピューティング資源セットは、第1データ格納装置セットを含み、
前記第1データ格納装置セットのデータ格納装置の各々は、前記複数の資源連結の中の第1資源連結を通じて前記第1スイッチと直接連結された第1ポート及び前記複数の資源連結の中の第2資源連結を通じて前記第2スイッチと直接連結された第2ポートを含み、
前記複数のコンピューティング資源セットの中の第2コンピューティング資源セットは、第2データ格納装置セットを含み、
前記第2データ格納装置セットのデータ格納装置の各々は、前記複数の資源連結の中の第3資源連結を通じて前記第1スイッチと直接連結された第3ポート及び前記複数の資源連結の中の第4資源連結を通じて前記第2スイッチと直接連結される第4ポートを含むことを特徴とする請求項3に記載のコンピューティングシステム。 - 第3クロス接続を通じて前記第1スイッチと直接連結され、第4クロス接続を通じて前記第2スイッチと直接連結される第4スイッチをさらに含むことを特徴とする請求項6に記載のコンピューティングシステム。
- 第3データ格納装置セットをさらに含み、
前記第3データ格納装置セットのデータ格納装置の各々は、第5資源連結を通じて前記第3スイッチと直接連結される第5ポート及び第6資源連結を通じて前記第4スイッチと直接連結される第6ポートを含むことを特徴とする請求項7に記載のコンピューティングシステム。 - 第4ホストリンクを通じて前記第4スイッチと直接連結された第4サーバーノードをさらに含むことを特徴とする請求項8に記載のコンピューティングシステム。
- 第4データ格納装置セットをさらに含み、
前記第4データ格納装置セットのデータ格納装置の各々は、第7資源連結を通じて前記第3スイッチと直接連結される第7ポート及び第8資源連結を通じて前記第4スイッチと直接連結される第8ポートを含むことを特徴とする請求項9に記載のコンピューティングシステム。 - 前記スイッチの各々は、他のスイッチの故障を検出し、前記スイッチに対応する前記クロス接続及び前記ホストリンクを通じて前記第1データ格納装置セットのデータ格納装置及び前記第2データ格納装置セットのデータ格納装置へのアクセスを提供するように構成されることを特徴とする請求項6に記載のコンピューティングシステム。
- 前記コンピューティングシステムはN個(但し、Nは自然数)のインターフェイスを含み、
帯域幅ユニットB(但し、Bは正数)は、前記コンピューティング資源セットのコンピューティング資源の中の1つが最高帯域幅(full bandwidth)にて動作するのに要求される帯域幅の量を示し、
前記複数の資源連結の各々は、少なくとも1XBの帯域幅を含み、
前記複数のコンピューティング資源セットの各々は、K(但し、Kは自然数)個以下のコンピューティング資源を含み、
前記複数のインターフェイスの各々のホストリンクの各々は、KXBの正常トラフィック帯域幅及びKXB以上の最大トラフィック帯域幅を支援し、
前記複数のクロス接続の各々は、少なくともKXB/(N−1)の帯域幅を含むことを特徴とする請求項1に記載のコンピューティングシステム。 - 少なくとも2つの高可用性ペア(high−availability pairs)を含み、
前記高可用性ペアの各々は、
第1スイッチと、
第2スイッチと、
第1ホストリンクを通じて前記第1スイッチと連結される第1インターフェイスと、
第2ホストリンクを通じて前記第2スイッチと連結される第2インターフェイスと、
第1資源連結を通じて前記第1スイッチと連結され、第2資源連結を通じて前記第2スイッチと連結される第1コンピューティング資源セットと、
第3資源連結を通じて前記第1スイッチと連結され、第4資源連結を通じて前記第2スイッチと連結される第2コンピューティング資源セットと、
複数の第1クロス接続と、
複数の第2クロス接続と、を含み、
前記複数の第1クロス接続の各々は、前記第1スイッチを他の高可用性ペアの各スイッチに直接連結し、前記第2クロス接続の各々は、前記第2スイッチを前記他の高可用性ペアの各スイッチに直接連結することを特徴とするコンピューティングシステム。 - 前記第1コンピューティング資源セットは、第1データ格納装置セットを含み、前記第1データ格納装置セットのデータ格納装置の各々は、前記第1資源連結を通じて前記第1スイッチと直接連結される第1ポート及び前記第2資源連結を通じて前記第2スイッチと直接連結される第2ポートを含み、
前記第2コンピューティング資源セットは、第2データ格納装置セットを含み、前記第2データ格納装置セットのデータ格納装置の各々は、前記第3資源連結を通じて前記第1スイッチと直接連結される第3ポート及び前記第4資源連結を通じて前記第2スイッチと直接連結される第4ポートを含むことを特徴とする請求項13に記載のコンピューティングシステム。 - 前記第1スイッチは、前記第2スイッチの故障を検出し、前記第1ホストリンク及び前記第1クロス接続を通じて前記第1データ格納装置セットのデータ格納装置及び前記第2データ格納装置セットのデータ格納装置へのアクセスを提供するように構成されることを特徴とする請求項14に記載のコンピューティングシステム。
- 前記コンピューティングシステムは、N個(但し、Nは自然数)のサーバーノードを含み、
帯域幅ユニットB(但し、Bは正数)はコンピューティング資源の中の1つが最高帯域幅(full bandwidth)にて動作するのに要求される帯域幅の量であり、
資源連結の各々は、少なくとも1XBの帯域幅を含み、
コンピューティング資源セットの各々は、K(但し、Kは自然数)個以下のコンピューティング資源を含み、
前記サーバーノードの各々は、KXBの正常帯域幅を支援し、KXB以上の最大帯域幅を支援し、
クロス接続の各々は、少なくともKXB/(N−1)の帯域幅を含むことを特徴とする請求項13に記載のコンピューティングシステム。 - スイッチは、PCIe(Peripheral Component Interconnect Express)スイッチであり、
ホストリンク及び前記資源連結は、PCIeバスリンクであることを特徴とする請求項1又は13に記載のコンピューティングシステム。 - 前記少なくとも2つの高可用性ペアは、
第1高可用性ペアと、
第2高可用性ペアと、
第3高可用性ペアと、
第4高可用性ペアと、を含むことを特徴とする請求項13に記載のコンピューティングシステム。 - 第1スイッチと、
第2スイッチと、
第1クロス接続を通じて前記第1スイッチと直接連結され、第2クロス接続を通じて前記第2スイッチと直接連結される第3スイッチと、
第1コンピューティング資源セットと、
第2コンピューティング資源セットと、を含み、
前記第1コンピューティング資源セットの各々は、第1資源連結を通じて前記第1スイッチと直接連結された第1ポート及び第2資源連結を通じて前記第2スイッチと直接連結される第2ポートを含み、
前記第2コンピューティング資源セットの各々は、第3資源連結を通じて前記第1スイッチと直接連結される第3ポート及び第4資源連結を通じて前記第2スイッチと直接連結される第4ポートを含むことを特徴とする予備資源連結ファブリック。 - 前記第1スイッチは、前記第2スイッチの故障を検出し、前記第1クロス接続を通じて前記第1コンピューティング資源セット及び前記第2コンピューティング資源セットへのアクセスを提供するように構成されることを特徴とする請求項19に記載の予備資源連結ファブリック。
- 第3資源連結を通じて前記第1スイッチと直接連結され、第4資源連結を通じて前記第2スイッチと直接連結される第4スイッチをさらに含むことを特徴とする請求項19に記載の予備資源連結ファブリック。
- 第5資源連結を通じて前記第3スイッチと直接連結され、第6資源連結を通じて前記第4スイッチと直接連結される第3コンピューティング資源セットをさらに含むことを特徴とする請求項21に記載の予備資源連結ファブリック。
- 第7資源連結を通じて前記第3スイッチと直接連結され、第8資源連結を通じて前記第4スイッチと直接連結される第4コンピューティング資源セットをさらに含むことを特徴とする請求項22に記載の予備資源連結ファブリック。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662377487P | 2016-08-19 | 2016-08-19 | |
US62/377487 | 2016-08-19 | ||
US15/344,438 US10365981B2 (en) | 2016-08-19 | 2016-11-04 | Adaptive multipath fabric for balanced performance and high availability |
US15/344438 | 2016-11-04 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018029337A true JP2018029337A (ja) | 2018-02-22 |
JP2018029337A5 JP2018029337A5 (ja) | 2020-09-24 |
JP7043201B2 JP7043201B2 (ja) | 2022-03-29 |
Family
ID=61191712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017156664A Active JP7043201B2 (ja) | 2016-08-19 | 2017-08-14 | コンピューティング資源への高可用性アクセスを提供するコンピューティングシステム及び予備資源連結ファブリック |
Country Status (5)
Country | Link |
---|---|
US (3) | US10365981B2 (ja) |
JP (1) | JP7043201B2 (ja) |
KR (1) | KR102191242B1 (ja) |
CN (1) | CN107769956B (ja) |
TW (1) | TWI704459B (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11983138B2 (en) | 2015-07-26 | 2024-05-14 | Samsung Electronics Co., Ltd. | Self-configuring SSD multi-protocol support in host-less environment |
US10372659B2 (en) | 2016-07-26 | 2019-08-06 | Samsung Electronics Co., Ltd. | Multi-mode NMVE over fabrics devices |
US11144496B2 (en) | 2016-07-26 | 2021-10-12 | Samsung Electronics Co., Ltd. | Self-configuring SSD multi-protocol support in host-less environment |
US10210123B2 (en) | 2016-07-26 | 2019-02-19 | Samsung Electronics Co., Ltd. | System and method for supporting multi-path and/or multi-mode NMVe over fabrics devices |
US10346041B2 (en) | 2016-09-14 | 2019-07-09 | Samsung Electronics Co., Ltd. | Method for using BMC as proxy NVMeoF discovery controller to provide NVM subsystems to host |
US11461258B2 (en) | 2016-09-14 | 2022-10-04 | Samsung Electronics Co., Ltd. | Self-configuring baseboard management controller (BMC) |
US20190109720A1 (en) | 2016-07-26 | 2019-04-11 | Samsung Electronics Co., Ltd. | Modular system (switch boards and mid-plane) for supporting 50g or 100g ethernet speeds of fpga+ssd |
US10365981B2 (en) * | 2016-08-19 | 2019-07-30 | Samsung Electronics Co., Ltd. | Adaptive multipath fabric for balanced performance and high availability |
WO2018193352A1 (en) * | 2017-04-17 | 2018-10-25 | Cerebras Systems Inc. | Dataflow triggered tasks for accelerated deep learning |
US11102294B2 (en) * | 2017-06-09 | 2021-08-24 | Samsung Electronics Co., Ltd. | System and method for supporting energy and time efficient content distribution and delivery |
US10476816B2 (en) | 2017-09-15 | 2019-11-12 | Facebook, Inc. | Lite network switch architecture |
US10235625B1 (en) | 2018-02-09 | 2019-03-19 | Capital One Services, Llc | Automatically scaling neural networks based on load |
TWI679861B (zh) | 2018-09-06 | 2019-12-11 | 財團法人工業技術研究院 | 控制器、調整封包通信規則的方法及網路通信系統 |
CN109408451B (zh) * | 2018-11-05 | 2022-06-14 | 英业达科技有限公司 | 一种图形处理器系统 |
US11513699B2 (en) * | 2019-08-01 | 2022-11-29 | EMP IP Holding Company, LLC | System and method for caching data in persistent memory of a non-volatile memory express storage array enclosure |
US11515538B2 (en) * | 2019-10-11 | 2022-11-29 | GM Global Technology Operations LLC | In-situ polymerization to protect lithium metal electrodes |
TWI719741B (zh) | 2019-12-04 | 2021-02-21 | 財團法人工業技術研究院 | 改變冗餘處理節點的處理器及其方法 |
CN114930312A (zh) * | 2020-03-25 | 2022-08-19 | 华为技术有限公司 | 一种通信方法及相关装置 |
CN111639008B (zh) * | 2020-05-29 | 2023-08-25 | 杭州海康威视系统技术有限公司 | 基于双端口ssd的文件系统状态监测方法、装置及电子设备 |
US11720413B2 (en) * | 2020-06-08 | 2023-08-08 | Samsung Electronics Co., Ltd. | Systems and methods for virtualizing fabric-attached storage devices |
TWI802268B (zh) * | 2022-02-14 | 2023-05-11 | 神雲科技股份有限公司 | 伺服系統 |
EP4387196A1 (en) * | 2022-12-13 | 2024-06-19 | Barcelona Supercomputing Center-Centro Nacional de Supercomputación | System and method for connecting complete interconnection networks for high-performance computers |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090204743A1 (en) * | 2008-02-08 | 2009-08-13 | Tetsuya Inoue | Storage subsystem and control method therefof |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5922077A (en) * | 1996-11-14 | 1999-07-13 | Data General Corporation | Fail-over switching system |
US6219753B1 (en) | 1999-06-04 | 2001-04-17 | International Business Machines Corporation | Fiber channel topological structure and method including structure and method for raid devices and controllers |
US6330642B1 (en) * | 2000-06-29 | 2001-12-11 | Bull Hn Informatin Systems Inc. | Three interconnected raid disk controller data processing system architecture |
US6658478B1 (en) * | 2000-08-04 | 2003-12-02 | 3Pardata, Inc. | Data storage system |
US6952734B1 (en) * | 2000-08-21 | 2005-10-04 | Hewlett-Packard Development Company, L.P. | Method for recovery of paths between storage area network nodes with probationary period and desperation repair |
US7307948B2 (en) * | 2002-10-21 | 2007-12-11 | Emulex Design & Manufacturing Corporation | System with multiple path fail over, fail back and load balancing |
US7505401B2 (en) | 2005-01-31 | 2009-03-17 | International Business Machines Corporation | Method, apparatus and program storage device for providing mutual failover and load-balancing between interfaces in a network |
JP3890063B2 (ja) * | 2005-03-03 | 2007-03-07 | シャープ株式会社 | 排水処理装置および排水処理方法 |
US7903556B2 (en) * | 2005-11-03 | 2011-03-08 | Hewlett-Packard Development Company, L.P. | Method of controlling data transfers between nodes in a computer system |
US8296534B1 (en) | 2007-06-29 | 2012-10-23 | Emc Corporation | Techniques for using flash-based memory in recovery processing |
US8296782B2 (en) | 2008-04-22 | 2012-10-23 | Lsi Corporation | System eliminating hardware duplication during application testing of an internal storage array across different operating systems |
CN102165427A (zh) | 2008-09-25 | 2011-08-24 | Lsi公司 | 在外部存储阵列中验证带外管理应用的方法和/或装置 |
CN101727399B (zh) * | 2008-10-30 | 2012-10-10 | 鸿富锦精密工业(深圳)有限公司 | 存储装置及使用该存储装置的数据交换系统 |
US9047351B2 (en) | 2010-04-12 | 2015-06-02 | Sandisk Enterprise Ip Llc | Cluster of processing nodes with distributed global flash memory using commodity server technology |
US8688926B2 (en) | 2010-10-10 | 2014-04-01 | Liqid Inc. | Systems and methods for optimizing data storage among a plurality of solid state memory subsystems |
US8468385B1 (en) * | 2010-10-27 | 2013-06-18 | Netapp, Inc. | Method and system for handling error events |
US8521941B2 (en) | 2010-12-28 | 2013-08-27 | Plx Technology, Inc. | Multi-root sharing of single-root input/output virtualization |
CN102394923A (zh) * | 2011-10-27 | 2012-03-28 | 周诗琦 | 一种基于n×n陈列结构的云系统平台 |
US9158540B1 (en) | 2011-11-14 | 2015-10-13 | Emc Corporation | Method and apparatus for offloading compute resources to a flash co-processing appliance |
US9110813B2 (en) | 2013-02-14 | 2015-08-18 | Avago Technologies General Ip (Singapore) Pte Ltd | Cache load balancing in storage controllers |
US9003090B1 (en) * | 2014-03-25 | 2015-04-07 | DSSD, Inc. | PCI express fabric routing for a fully-connected mesh topology |
US9785520B2 (en) * | 2014-04-04 | 2017-10-10 | Hitachi, Ltd. | Computer system, storage apparatus and control method |
US9921989B2 (en) | 2014-07-14 | 2018-03-20 | Intel Corporation | Method, apparatus and system for modular on-die coherent interconnect for packetized communication |
US9507678B2 (en) * | 2014-11-13 | 2016-11-29 | Netapp, Inc. | Non-disruptive controller replacement in a cross-cluster redundancy configuration |
CN104965677B (zh) * | 2015-06-26 | 2018-04-13 | 北京百度网讯科技有限公司 | 存储系统 |
US10334334B2 (en) * | 2016-07-22 | 2019-06-25 | Intel Corporation | Storage sled and techniques for a data center |
US10365981B2 (en) * | 2016-08-19 | 2019-07-30 | Samsung Electronics Co., Ltd. | Adaptive multipath fabric for balanced performance and high availability |
-
2016
- 2016-11-04 US US15/344,438 patent/US10365981B2/en active Active
-
2017
- 2017-06-08 KR KR1020170071853A patent/KR102191242B1/ko active IP Right Grant
- 2017-06-28 TW TW106121508A patent/TWI704459B/zh active
- 2017-07-17 CN CN201710580359.4A patent/CN107769956B/zh active Active
- 2017-08-14 JP JP2017156664A patent/JP7043201B2/ja active Active
-
2019
- 2019-06-10 US US16/436,087 patent/US11693747B2/en active Active
-
2023
- 2023-06-09 US US18/332,242 patent/US20230325288A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090204743A1 (en) * | 2008-02-08 | 2009-08-13 | Tetsuya Inoue | Storage subsystem and control method therefof |
Also Published As
Publication number | Publication date |
---|---|
US20190294513A1 (en) | 2019-09-26 |
US11693747B2 (en) | 2023-07-04 |
KR20180020873A (ko) | 2018-02-28 |
TW201807581A (zh) | 2018-03-01 |
CN107769956B (zh) | 2022-02-18 |
TWI704459B (zh) | 2020-09-11 |
US10365981B2 (en) | 2019-07-30 |
JP7043201B2 (ja) | 2022-03-29 |
CN107769956A (zh) | 2018-03-06 |
US20180052745A1 (en) | 2018-02-22 |
KR102191242B1 (ko) | 2020-12-15 |
US20230325288A1 (en) | 2023-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7043201B2 (ja) | コンピューティング資源への高可用性アクセスを提供するコンピューティングシステム及び予備資源連結ファブリック | |
JP2018029337A5 (ja) | ||
JP5176039B2 (ja) | 冗長ストレージサブシステム間におけるsasraidコントローラデバイスチャネルの接続のためのシステム、及び方法 | |
US9880972B2 (en) | Computer subsystem and computer system with composite nodes in an interconnection structure | |
US20180341419A1 (en) | Storage System | |
US6904556B2 (en) | Systems and methods which utilize parity sets | |
TW201319824A (zh) | 透過虛擬序列附接式小電腦系統介面擴展器分享的伺服器直接附接儲存器 | |
US8788753B2 (en) | Systems configured for improved storage system communication for N-way interconnectivity | |
US20050289386A1 (en) | Redundant cluster network | |
WO2017167106A1 (zh) | 存储系统 | |
US11537443B2 (en) | Reconfigurable computing pods using optical networks | |
JP4483168B2 (ja) | ディスクアレイ制御装置 | |
US8160061B2 (en) | Redundant network shared switch | |
JP2003330626A (ja) | 常時稼働コントローラ相互接続を介してのコントローラ通信 | |
US7373546B2 (en) | Cluster network with redundant communication paths | |
CN111684421B (zh) | 服务器系统 | |
US8554973B2 (en) | Storage device and method for managing size of storage device | |
US20050050243A1 (en) | Modified core-edge topology for a fibre channel network | |
US20060233164A1 (en) | Method to separate fibre channel switch core functions and fabric management in a storage area network | |
US20200409885A1 (en) | Redundant paths to single port storage devices | |
US20030061326A1 (en) | Managing one or more domains in a system | |
JP6885237B2 (ja) | ノード間通信装置、並列処理装置及びノード間通信経路制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200811 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200811 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200811 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210706 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220111 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220111 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220121 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7043201 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |