JP2006260223A - iSCSI STORAGE SYSTEM AND PASS MULTIPLEX METHOD FOR THE SYSTEM - Google Patents
iSCSI STORAGE SYSTEM AND PASS MULTIPLEX METHOD FOR THE SYSTEM Download PDFInfo
- Publication number
- JP2006260223A JP2006260223A JP2005077366A JP2005077366A JP2006260223A JP 2006260223 A JP2006260223 A JP 2006260223A JP 2005077366 A JP2005077366 A JP 2005077366A JP 2005077366 A JP2005077366 A JP 2005077366A JP 2006260223 A JP2006260223 A JP 2006260223A
- Authority
- JP
- Japan
- Prior art keywords
- iscsi
- path
- path control
- initiator
- control device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、iSCSIを使用してデータが転送されるiSCSIストレージシステム、およびiSCSIストレージシステムにおけるパス多重化方法に関する。 The present invention relates to an iSCSI storage system in which data is transferred using iSCSI, and a path multiplexing method in the iSCSI storage system.
インターネットなどのIP(Internet Protocol )ネットワークの普及に伴って、サーバなどからストレージデバイスに対してIPネットワークを経由してデータを転送する要求が高まっている。そのようなデータ転送を実現する方法として、iSCSI(internet Small Computer System Interface)を使用する方法がある。iSCSIでは、SCSIのコマンドやレスポンスが、TCP(Transmission Control Protocol )パケットにカプセル化されて転送される。 With the spread of IP (Internet Protocol) networks such as the Internet, there is an increasing demand for data transfer from a server or the like to a storage device via an IP network. As a method for realizing such data transfer, there is a method using iSCSI (Internet Small Computer System Interface). In iSCSI, SCSI commands and responses are encapsulated in TCP (Transmission Control Protocol) packets and transferred.
IPネットワークなどの広域ネットワークを介してサーバ(iSCSIイニシエータに相当)とiSCSIを実装したストレージデバイス(例えば磁気ディスクと制御装置とからなる。iSCSIターゲットに相当)との間でデータ送受信が行われる場合、一般に、サーバとストレージデバイスとの間の距離は大きい。そのような状況において、ストレージシデバイスの信頼性、およびストレージデバイスに対するデータ転送の信頼性に対する懸念は、ローカルなSCSI環境に比べて高い。 When data transmission / reception is performed between a server (corresponding to an iSCSI initiator) and a storage device (for example, consisting of a magnetic disk and a control device; corresponding to an iSCSI target) mounted with iSCSI via a wide area network such as an IP network, In general, the distance between the server and the storage device is large. In such a situation, concerns about the reliability of the storage device and the reliability of data transfer to the storage device are high compared to the local SCSI environment.
そこで、何らかの冗長構成(二重化構成)がとられる必要性がある。例えば、IPネットワークとストレージデバイスとの間に2つのiSCSIコントローラが設置されたストレージシステムがある(例えば、特許文献1参照。)。そのようなストレージシステムでは、2つのiSCSIコントローラが通信可能に接続され、それぞれが、他のiSCSIコントローラを監視する。そして、一方のiSCSIコントローラにおいて故障が生ずると、そのiSCSIコントローラに対して発行されたコマンドが、他方のiSCSIコントローラに引き継がれる。 Therefore, some redundant configuration (duplex configuration) needs to be taken. For example, there is a storage system in which two iSCSI controllers are installed between an IP network and a storage device (see, for example, Patent Document 1). In such a storage system, two iSCSI controllers are communicatively connected, each monitoring the other iSCSI controller. When a failure occurs in one iSCSI controller, a command issued to the iSCSI controller is taken over by the other iSCSI controller.
しかし、特許文献1に記載されているiSCSIストレージシステムは、単に、既存の冗長化技術を流用して、他方のiSCSIコントローラを待機させるようにしたスタンバイシステムにすぎない。
However, the iSCSI storage system described in
iSCSIには、1つのセッションに複数のコネクションを張ることができるマルチコネクション/セッションが規定されている。本発明は、iSCSIにおけるマルチコネクション/セッションを利用してストレージシステムにおける冗長構成を実現することができるiSCSIストレージシステムおよびそのシステムにおけるパス多重化方法を提供することを目的とする。 iSCSI defines a multi-connection / session in which a plurality of connections can be established in one session. An object of the present invention is to provide an iSCSI storage system capable of realizing a redundant configuration in a storage system using multi-connection / session in iSCSI and a path multiplexing method in the system.
本発明によるiSCSIストレージシステムは、iSCSIイニシエータとターゲットデバイス(例えば磁気ディスクと制御装置とからなる)との間に複数のiSCSIパス制御装置が設けられ、iSCSIイニシエータが、複数のiSCSIパス制御装置のそれぞれとの間にマルチコネクション/セッションでセッションを確立するコネクション/セッション制御手段と、iSCSIレイヤにおける制御を行うiSCSIレイヤ制御手段とを含み、複数のiSCSIパス制御装置が、それぞれ、他のiSCSIパス制御装置との間で、互いの順位を設定する状態設定手段と、自身が第1順位に設定されている場合に、コネクション/セッション制御手段がディスカバリ処理を実行したときに自身のアドレスと他のiSCSIパス制御装置のアドレスとをiSCSIイニシエータに応答するアドレス応答手段と、iSCSIイニシエータから受信されたコマンド(命令またはデータ)をターゲットデバイスに与える機能を有するiSCSI/SCSIプロトコル制御部とを含み、コネクション/セッション制御手段が、第1順位に設定されているiSCSIパス制御装置から受信した複数のアドレスにもとづいてセッションを確立し、第1順位に設定されているiSCSIパス制御装置におけるiSCSI/SCSIプロトコル制御部が、iSCSIイニシエータから受信されたiSCSIのPDUからSCSIののCDBを抽出し、抽出したCDBにもとづいてターゲットデバイスに入出力要求を与えることを特徴とする。 In the iSCSI storage system according to the present invention, a plurality of iSCSI path control devices are provided between an iSCSI initiator and a target device (for example, consisting of a magnetic disk and a control device), and the iSCSI initiator is connected to each of the plurality of iSCSI path control devices. A connection / session control means for establishing a session with a multi-connection / session, and an iSCSI layer control means for performing control in the iSCSI layer, and each of the plurality of iSCSI path control devices includes other iSCSI path control devices. Status setting means for setting each other's order, and when the connection / session control means executes the discovery process when it is set to the first order, its own address and other iSCSI paths Control unit Address response means for responding to the iSCSI initiator, and an iSCSI / SCSI protocol control unit having a function of giving a command (command or data) received from the iSCSI initiator to the target device, and a connection / session control means, A session is established based on a plurality of addresses received from the iSCSI path control device set in the first order, and the iSCSI / SCSI protocol control unit in the iSCSI path control device set in the first order is sent from the iSCSI initiator. A SCSI CDB is extracted from the received iSCSI PDU, and an input / output request is given to the target device based on the extracted CDB.
iSCSIパス制御装置が、iSCSIイニシエータから受信されたiSCSIのPDUに含まれる情報(例えばITT)を他のiSCSIパス制御装置に転送する機能を有するPDU経路制御手段を含み、第1順位以外の順位に設定されているiSCSIパス制御装置のPDU経路制御手段が、iSCSIイニシエータからiSCSIのPDUを受信したときに前記情報を、第1順位に設定されているiSCSIパス制御装置に転送し、第1順位に設定されているiSCSIパス制御装置のPDU経路制御手段は、前記情報の転送を受けている場合には、ターゲットデバイスから入力したデータを、前記情報を転送したiSCSIパス制御装置に出力するように構成されていてもよい。 The iSCSI path control device includes a PDU route control means having a function of transferring information (for example, ITT) included in the iSCSI PDU received from the iSCSI initiator to another iSCSI path control device, and is in a rank other than the first rank. When the PDU route control means of the set iSCSI path control device receives the iSCSI PDU from the iSCSI initiator, the information is transferred to the iSCSI path control device set in the first order, The PDU route control means of the set iSCSI path control device is configured to output the data input from the target device to the iSCSI path control device to which the information is transferred when receiving the information transfer. May be.
iSCSIレイヤ制御手段が、コネクション/セッション制御手段がiSCSIイニシエータとiSCSIパス制御装置との間の伝送経路の障害に起因してエラーが発生したと判断したときにiSCSIコマンドの再送制御を実行するように構成されていてもよい。 When the iSCSI layer control means determines that an error has occurred due to a failure in the transmission path between the iSCSI initiator and the iSCSI path control device, the connection / session control means executes retransmission control of the iSCSI command. It may be configured.
第1順位に設定されているiSCSIパス制御装置に障害が発生したと他のiSCSIパス制御装置が判断した場合に、他のiSCSIパス制御装置の状態設定手段が、自iSCSIパス制御装置を第1順位に設定するように構成されていてもよい。そのような構成によれば、一のiSCSIパス制御装置に障害が発生してもiSCSIイニシエータとターゲットデバイスとの間のデータ転送ができなくなることはない。 When another iSCSI path control device determines that a failure has occurred in the iSCSI path control device set in the first order, the status setting means of the other iSCSI path control device sets the first iSCSI path control device as the first. It may be configured to set the rank. According to such a configuration, even if a failure occurs in one iSCSI path control device, data transfer between the iSCSI initiator and the target device is not disabled.
第1順位に設定されているiSCSIパス制御装置の状態設定手段が、自iSCSIパス制御装置とターゲットデバイスとの間の伝送経路に障害が発生したと判断した場合に、自iSCSIパス制御装置に代えて他のiSCSIパス制御装置を第1順位に設定する制御を行うように構成されていてもよい。そのような構成によれば、iSCSIイニシエータとiSCSIパス制御装置との間では冗長構成が維持されるので、single point of failure(構成要素が1つしかないことに起因してシステムが停止)ということにはならない。 When the status setting unit of the iSCSI path control device set in the first order determines that a failure has occurred in the transmission path between the own iSCSI path control device and the target device, the iSCSI path control device is replaced with the own iSCSI path control device. The other iSCSI path control device may be configured to perform control for setting to the first order. According to such a configuration, since a redundant configuration is maintained between the iSCSI initiator and the iSCSI path control device, it is a single point of failure (the system is stopped due to only one component). It will not be.
本発明によるパス多重化方法は、iSCSIイニシエータとターゲットデバイスとの間に複数のiSCSIパス制御装置を設け、複数のiSCSIパス制御装置が、それぞれ、他のiSCSIパス制御装置との間で、互いの順位を設定し、複数のiSCSIパス制御装置が、自身が第1順位に設定されている場合に、iSCSIイニシエータがディスカバリ処理を実行したときに自身のアドレスと他のiSCSIパス制御装置のアドレスとをiSCSIイニシエータに応答し、iSCSIイニシエータが、第1順位に設定されているiSCSIパス制御装置から受信した複数のアドレスにもとづいてマルチコネクション/セッションでセッションを確立し、第1順位に設定されているiSCSIパス制御装置が、iSCSIイニシエータから受信されたiSCSIのPDUからSCSIののCDBを抽出し、抽出したCDBにもとづいてターゲットデバイスに入出力要求を与えることを特徴とする。 In the path multiplexing method according to the present invention, a plurality of iSCSI path control devices are provided between the iSCSI initiator and the target device, and each of the plurality of iSCSI path control devices communicates with other iSCSI path control devices. When a plurality of iSCSI path controllers are set to the first rank, when the iSCSI initiator executes the discovery process, the addresses of other iSCSI path controllers are set. In response to the iSCSI initiator, the iSCSI initiator establishes a multi-connection / session session based on the plurality of addresses received from the iSCSI path control device set in the first order, and the iSCSI set in the first order. The path control device starts from the iSCSI initiator Extract the CDB of a SCSI from Shin has been the iSCSI PDU, it is characterized in providing an output request to the target device based on the extracted CDB.
本発明によれば、iSCSIイニシエータがマルチコネクション/セッションでセッションを確立するだけで複数のハードウェアにまたがったiSCSIターゲット(iSCSIパス制御装置)を1つのセッションに含めることができる。この結果、どれか1つのiSCSIターゲットに障害が起きても業務を続けることができる。 According to the present invention, an iSCSI target (iSCSI path control device) spanning a plurality of pieces of hardware can be included in one session only by the iSCSI initiator establishing a session by multi-connection / session. As a result, the business can be continued even if a failure occurs in any one iSCSI target.
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本発明によるiSCSIストレージシステムの構成例をを示すブロック図である。図1に示す例では、iSCSIストレージシステムは、iSCSIおよびTCP/IPプロトコル制御部(以下、プロトコル制御部という。)2を有するiSCSIイニシエータ装置1、iSCSIイニシエータ装置1と2つのiSCSIパス多重化装置(iSCSIパス制御装置)13,14とを通信可能に接続するIPネットワーク3、および2つのiSCSIパス多重化装置13,14からファイバーチャネルでデータを受信するとともにiSCSIパス多重化装置13,14にファイバーチャネルでデータを出力するファイバーチャネルストレージユニット(ターゲットデバイス)12を含む。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of an iSCSI storage system according to the present invention. In the example shown in FIG. 1, the iSCSI storage system includes an
なお、iSCSIイニシエータ装置1は、例えばLAN(図示せず)によって他のサーバ装置や端末装置に接続されるサーバである。従って、iSCSIイニシエータ装置1は、プログラムに従って動作するCPUを含む。また、iSCSIイニシエータ装置1とIPネットワーク3との間に少なくとも2つの通信経路が備えられている。
Note that the
プロトコル制御部2は、図2に示すiSCSI階層モデルにおける各層(レイヤ)の制御を行うハードウェアおよびソフトウェアである。プロトコル制御部2は、例えば、iSCSIレイヤの制御では、SCSIレイヤからのSCSIコマンドやデータをカプセル化処理してiSCSIのPDU(Protocol Data Unit)を作成し、TCP/IPレイヤに渡す。また、TCP/IPレイヤからのiSCSIのPDUからSCSIレスポンスやデータを抜き出してSCSIレイヤに渡す。従って、iSCSIパス制御装置のそれぞれとの間にセッションを確立するコネクション/セッション制御手段、およびiSCSIレイヤにおける制御を行うiSCSIレイヤ制御手段は、プロトコル制御部2で実現される。
The
iSCSIパス多重化装置13,14は、それぞれ、iSCSIターゲットとしての機能を含む。また、iSCSIパス多重化装置13は、主記憶装置(図示せず)、IPネットワーク3につながるNIC(Network Interface Card)4、iSCSIパス多重化装置14との通信用に用いられるリモートダイレクトメモリアクセス(RDMA)機能を有するRNIC(Remote NIC)10、iSCSIパス多重化装置13,14の状態に応じてiSCSIのPDUの経路を設定する状態/PDU経路制御機構(状態設定手段、PDU経路制御手段)6、およびiSCSI/SCSIプロトコル制御部8を備える。iSCSIパス多重化装置13は、プログラムに従って制御を行うCPU(図示せず)が搭載され、状態/PDU経路制御機構6の実体は、ソフトウェアである。
Each of the iSCSI
なお、iSCSIパス多重化装置13,14において、NIC10,11と状態/PDU経路制御機構6,7との間に、TCP/IPプロトコルのプロトコル制御やiSCSIディスカバリセッション(iSCSIイニシエータが例えばSendTagetsコマンドでiSCSIターゲットに問い合わせるセッション)の場合の制御を行う制御部(図示せず)が存在する。従って、そのような制御部は、アドレスをiSCSIイニシエータに応答するアドレス応答手段を実現する。
In the iSCSI
iSCSIパス多重化装置14は、iSCSIパス多重化装置13と同様に構成されている。すなわち、主記憶装置、IPネットワーク3につながるNIC5、iSCSIパス多重化装置13との通信用に用いられるリモートダイレクトメモリアクセス(RDMA)機能を有するRNIC11、iSCSIパス多重化装置13,14の状態に応じてiSCSIのPDUの経路を設定する状態/PDU経路制御機構7、およびiSCSI/SCSIプロトコル制御部9を備える。
The
なお、iSCSIパス多重化装置13,14間の通信路15は二重化され、一方のパスが切断されても、iSCSIパス多重化装置13,14間の通信が継続されるように構成されている。また、通信路15は、死活監視のためにも用いられる。つまり、iSCSIパス多重化装置13,14は、通信路15で、例えばハートビートの送受信を行う。また、iSCSI/SCSIプロトコル制御部8,9は、iSCSIレイヤおよびSCSIレイヤの制御を行う。
Note that the
ストレージデバイスとしてのファイバーチャネルストレージユニット12は、iSCSIパス多重化装置13,14に対して同じ論理ユニットを提供する。すなわち、iSCSIパス多重化装置13から見てもiSCSIパス多重化装置14から見ても、ファイバーチャネルストレージユニット12は、同じものとして見える。
The fiber
状態/PDU経路制御機構6,7は、RNIC10,11によって通信を行い、iSCSIパス多重化装置13,14が第1の状態(第1順位)にあるのか第2の状態にあるのかを示す情報を主記憶部に設定する。具体的には、iSCSIパス多重化装置13,14のうちのいずれかが第1の状態にあるとされ、他方が第2の状態にあるとされる。iSCSIパス多重化装置13,14がともに正常動作を行える状況にある場合には、あらかじめ決められている方のiSCSIパス多重化装置が第1の状態に設定される。第2の状態にあるiSCSIパス多重化装置における状態/PDU経路制御機構は、RNIC10,11を用いてリモートダイレクトメモリアクセスによってiSCSIのPDUを、第1の状態にあるiSCSIパス多重化装置における主記憶部に転送する。第1の状態にあるiSCSIパス多重化装置における状態/PDU経路制御機構は、iSCSIのPDUをiSCSI/SCSIプロトコル制御部に送る。
The state / PDU
次に、図3〜図6のフローチャートを参照してiSCSIストレージシステムの動作を説明する。図3は、iSCSIディスカバリセッションの場合の動作を示すフローチャートである。なお、以下の説明において、iSCSIパス多重化装置13が第1の状態に設定され、iSCSIパス多重化装置14が第2の状態に設定されているとする。 Next, the operation of the iSCSI storage system will be described with reference to the flowcharts of FIGS. FIG. 3 is a flowchart showing the operation in the case of an iSCSI discovery session. In the following description, it is assumed that the iSCSI path multiplexer 13 is set in the first state and the iSCSI path multiplexer 14 is set in the second state.
iSCSIイニシエータ装置1がディスカバリ処理を実行する場合、iSCSIパス多重化装置13,14は、iSCSIイニシエータ装置1が送信したIPパケットからディスカバリセッションの情報を抽出する(ステップS11)。第1の状態になっているiSCSIパス多重化装置13は、ディスカバリセッションの応答として、自身のIPアドレス、第2の状態になっているiSCSIパス多重化装置14のIPアドレス、ターゲットポータルグループタグおよびターゲット名をiSCSIイニシエータ装置1に返す(ステップS12,S13)。第2の状態になっているiSCSIパス多重化装置14は、ディスカバリセッションにおいて応答しない(ステップS12,S14)。
When the
iSCSIイニシエータ装置1は、iSCSIディスカバリセッションで得た複数のIPアドレスに対して、マルチコネクション/セッションでセッションを確立する(ステップS15)。一のコネクションは、iSCSIパス多重化装置13についてのコネクションであり、他のコネクションは、iSCSIパス多重化装置14についてのコネクションである。
The
図4および図5は、iSCSIパス多重化装置13,14の動作を示すフローチャートである。iSCSIパス多重化装置13またはiSCSIパス多重化装置14は、iSCSIイニシエータ装置1が送信したIPパケットからiSCSIのPDUを抽出する(ステップS21)。
4 and 5 are flowcharts showing the operation of the iSCSI path multiplexers 13 and 14. The iSCSI
第1の状態になっているiSCSIパス多重化装置13のコネクションを利用してiSCSIイニシエータ装置1からiSCSIコマンドが発行された場合には、iSCSIパス多重化装置13の状態/PDU経路制御機構6は、iSCSIのPDUのイニシエータタスクタグ(ITT)を抽出する。そして、ITTから主記憶装置のアドレスを生成し、生成したアドレスにiSCSIのPDUを格納する。すなわち、状態/PDU経路制御機構6は、ITTに応じた主記憶装置のアドレスに、受信したiSCSIのPDUをマッピングする(ステップS22,S23)。
When an iSCSI command is issued from the
第2の状態になっているiSCSIパス多重化装置14のコネクションを利用してiSCSIイニシエータ装置1からiSCSIコマンドが発行された場合には、iSCSIパス多重化装置14の状態/PDU経路制御機構7は、iSCSIのPDUのイニシエータタスクタグ(ITT)を抽出し、ITTから主記憶装置のアドレスを生成し、生成したアドレスに、受信したiSCSIのPDUを格納するが(ステップS22,S26)、さらに、受信したiSCSIのPDUを、RNIC11および通信路15によって、iSCSIパス多重化装置13の主記憶装置に転送する(ステップS27)。なお、第1の状態になっているiSCSIパス多重化装置を第1のiSCSIパス多重化装置といい、第2の状態になっているiSCSIパス多重化装置を第2のiSCSIパス多重化装置という。
When an iSCSI command is issued from the
iSCSIパス多重化装置13の状態/PDU経路制御機構6は、iSCSIパス多重化装置14からiSCSIのPDUが転送されてきた場合には、主記憶装置に格納されたiSCSIのPDUからITTを抽出し、抽出したITTを第2ITTとして記憶する(ステップS24)。なお、iSCSIパス多重化装置14からiSCSIのPDUが転送されない場合には、ステップS24の処理は実行されない。
The state / PDU
そして、iSCSIパス多重化装置13のiSCSI/SCSIプロトコル制御部8は、iSCSIのPDUからSCSIのコマンドとしてのCDB(Command Description Block )を抽出し(ステップS25)、ファイバーチャネル(FC)を介して、抽出したコマンドをファイバーチャネルストレージユニット12に対して実行する。すなわち、例えばファイバーチャネルストレージユニット12に入出力要求を与える。
Then, the iSCSI / SCSI
以上のように、第1の状態になっているiSCSIパス多重化装置のコネクションを利用してiSCSIイニシエータ装置1がiSCSIタスクを実行した場合には、ステップS21,S22,S23,S25の順に処理が実行される。また、第2の状態になっているiSCSIパス多重化装置のコネクションを利用してiSCSIイニシエータ装置1がiSCSIタスクを実行した場合には、ステップS21,S22,S26,S27,S24,S25の順に処理が実行される。なお、iSCSIでは、iSCSIイニシエータはiSCSI内のどのコネクションからでもiSCSIコマンドを発行することができるが、iSCSIレスポンスは、iSCSIコマンドが発行されたコネクションで返送される必要がある。
As described above, when the
この実施の形態では、複数のiSCSIパスが同時に使用可能に設定されているが、例えば、iSCSIイニシエータ装置1は、原則として、第1の状態になっているiSCSIパス多重化装置のコネクションを利用してiSCSIタスクを実行する。また、iSCSIパス多重化装置13,14とファイバーチャネルストレージユニット12との間では、第1の状態になっているiSCSIパス多重化装置とファイバーチャネルストレージユニット12との間でデータの入出力が行われる。
In this embodiment, a plurality of iSCSI paths are set to be usable at the same time. However, for example, the
図5に示すように、ファイバーチャネルストレージユニット12からiSCSIレスポンスが出力された場合には(ステップS31)、第1の状態になっているiSCSIパス多重化装置13のみがiSCSIレスポンスを受信する。
As shown in FIG. 5, when the iSCSI response is output from the fiber channel storage unit 12 (step S31), only the iSCSI
第1の状態になっているiSCSIパス多重化装置13のiSCSI/SCSIプロトコル制御部8は、SCSIのCDBをiSCSIのPDUに変換し主記憶装置に格納する(ステップS32)。また、iSCSIパス多重化装置13のiSCSI/SCSIプロトコル制御部8は、変換したiSCSIのPDUからITTを抽出する。そして、抽出したITTが、記憶してある第2ITTと一致するか否か判定する(ステップS33)。
The iSCSI / SCSI
一致した場合には、ファイバーチャネルストレージユニット12からiSCSIレスポンスは、第2の状態になっているiSCSIパス多重化装置14のコネクションを利用してiSCSIイニシエータ装置1が発行したiSCSIコマンドに対するレスポンスであるということになる。そこで、iSCSIパス多重化装置13の状態/PDU経路制御機構6は、RNIC10および通信路15によって、iSCSIパス多重化装置14の主記憶装置に転送する(ステップS34)。その場合、第2の状態になっているiSCSIパス多重化装置14が、iSCSIのPDUをiSCSIイニシエータ装置1に返送する(ステップS36)。
If they match, the iSCSI response from the Fiber
一致しない場合には、RNIC10および通信路15を介する転送を行わない(ステップS35)。その場合、第1の状態になっているiSCSIパス多重化装置13が、iSCSIのPDUをiSCSIイニシエータ装置1に返送する(ステップS36)。
If they do not match, no transfer is performed via the
図6は、iSCSIパスにおいて障害が発生した場合のリカバリ方式を示すフローチャートである。iSCSIイニシエータ装置1のプロトコル制御部2は、実行中のiSCSIタスクにおいてエラーが発生したことを検出すると(ステップS41)、以下のような処理を行う。なお、iSCSIタスクにおけるエラーとして、iSCSIコマンドに対するiSCSIレスポンスがないこと、PDUに整合性のないフィールドがあること、PDU内のデータエラー(ダイジェストエラー)などがある。また、TCPレイヤなどでエラーが発生する可能性もある。
FIG. 6 is a flowchart showing a recovery method when a failure occurs in the iSCSI path. When the
iSCSIイニシエータ装置1のプロトコル制御部2は、発生したエラーが、iSCSIイニシエータ装置1とiSCSIパス多重化装置13,14との間の伝送経路の障害に起因するか否か判定する(ステップS42)。具体的には、iSCSIコマンドに対するiSCSIレスポンスはあるが、データエラーが生じている場合などには、伝送経路の障害に起因してエラーが発生したと判定する。伝送経路の障害に起因してエラーが発生した場合には、iSCSIイニシエータ装置1のプロトコル制御部2は、iSCSIにおいて定められているリカバリ方式に則ってiSCSIコマンドの再送等を行う(ステップS43)。
The
エラーの原因が伝送経路の障害ではないと判定した場合には、iSCSIイニシエータ装置1のプロトコル制御部2は、iSCSIパス多重化装置13,14に対してエラーの問い合わせを行う。iSCSIパス多重化装置13,14の状態/PDU経路制御機構6,7は、問い合わせに応じて、iSCSIパス多重化装置13,14のインターコネクト(通信路15による)においてハートビートの応答がなされているか否か確認する(ステップS44)。
If it is determined that the cause of the error is not a failure in the transmission path, the
iSCSIパス多重化装置13の状態/PDU経路制御機構6がハートビートの応答がないことを確認したら、iSCSIパス多重化装置14にハードウェア障害が発生したと判断する。また、iSCSIパス多重化装置14の状態/PDU経路制御機構7がハートビートの応答がないことを確認したら、iSCSIパス多重化装置13にハードウェア障害が発生したと判断する。
When the state / PDU
iSCSIパス多重化装置14の状態/PDU経路制御機構7は、第1の状態になっているiSCSIパス多重化装置13にハードウェア障害が発生したと判断した場合、iSCSIイニシエータ装置1にセッションのクローズを促す(ステップS45,S46)。そして、iSCSIパス多重化装置14の状態/PDU経路制御機構7は、自身が第1の状態にあることを示す情報を主記憶部に設定する(ステップS47)。また、iSCSIイニシエータ装置1は、シングルコネクション/セッションでセッションを再確立し、セッションリカバリを行う(ステップS48)。そして、iSCSIイニシエータ装置1は、エラーが発生したiSCSIタスクを再度実行する(ステップS49)。なお、iSCSIイニシエータ装置1がディスカバリセッションを実行したときに、iSCSIパス多重化装置14は、自身のIPアドレスのみを返す。
When the state / PDU
iSCSIパス多重化装置13の状態/PDU経路制御機構6は、第2の状態になっているiSCSIパス多重化装置14にハードウェア障害が発生したと判断した場合には、例えば、iSCSIイニシエータ装置1にその旨を報告する。その場合、iSCSIイニシエータ装置1のプロトコル制御部2は、iSCSIにおいて定められているリカバリ方式に則ってiSCSIコマンドの再送等を行う(ステップS43)。
If the state / PDU
iSCSIパス多重化装置13,14の状態/PDU経路制御機構6,7がともにハートビートの応答があると判定した場合には、第1の状態になっているiSCSIパス多重化装置13とファイバーチャネルストレージユニット12との間の伝送経路に障害が発生したと判断する。その場合、第2の状態になっているiSCSIパス多重化装置14の状態/PDU経路制御機構7は、iSCSIイニシエータ装置1にセッションのクローズを促す(ステップS50)。なお、iSCSIパス多重化装置13の側がセッションのクローズを促すようにしてもよい。
State of iSCSI path multiplexers 13 and 14 / If both PDU
そして、iSCSIパス多重化装置13の状態/PDU経路制御機構6は、自身が第2の状態にあることを示す情報を主記憶部に設定する。また、iSCSIパス多重化装置14の状態/PDU経路制御機構7は、自身が第1の状態にあることを示す情報を主記憶部に設定する(ステップS51)。iSCSIイニシエータ装置1は、図3に示されたような方式で、マルチコネクション/セッションでセッションを確立する(ステップS52)。また、iSCSIイニシエータ装置1のプロトコル制御部2は、エラーが発生したiSCSIタスクを再度実行する(ステップS53)。
Then, the state / PDU
以上に説明したように、iSCSIイニシエータ装置1は、iSCSIイニシエータ装置1とiSCSIパス多重化装置13,14との間の伝送経路の障害に起因してエラーが発生したと判断したときには、iSCSIにおいて定められているリカバリ方式に則ってiSCSIコマンドの再送等を行う。また、第1の状態になっているiSCSIパス多重化装置において障害が発生したと判断された場合には、第2の状態になっていたiSCSIパス多重化装置を第1の状態にしてiSCSIタスクを再度実行する。さらに、第1の状態になっているiSCSIパス多重化装置とファイバーチャネルストレージユニット12との間の伝送経路に障害が発生したと判断された場合には、第1の状態に設定されるiSCSIパス多重化装置と第2の状態に設定されるiSCSIパス多重化装置とを入れ替えてiSCSIタスクを再度実行する。
As described above, when the
なお、同一論理ユニット(例えば、ファイバーチャネルストレージユニット12)をターゲットデバイスとして持つiSCSIターゲット(iSCSIパス多重化装置13,14に相当するもの)が複数のハードウェアにまたがる環境でiSCSIパス多重化を実現する場合、従来は、iSCSIイニシエータが動作しているオペレーティングシステム(OS)上で多重化を可能にするソフトウェアを利用していた。 Note that iSCSI path multiplexing is realized in an environment in which an iSCSI target (corresponding to the iSCSI path multiplexers 13 and 14) having the same logical unit (for example, Fiber Channel storage unit 12) as a target device spans multiple hardware. In the past, software that enables multiplexing on the operating system (OS) on which the iSCSI initiator is operating has been used.
しかし、そのような構成では、iSCSIで規定されているパス多重化方法を活用できない。なぜなら、複数のハードウェアにまたがるターゲットデバイスを1つのSCSIセッションに含めることができず、iSCSIイニシエータが動作しているOSから論理ユニットが複数見えてしまうからである。また、パスの多重化を実現するには多重化機能を実現するためのソフトウェアを利用しなければならず、システムの価格が上昇してしまう。 However, in such a configuration, the path multiplexing method defined by iSCSI cannot be used. This is because a target device that spans multiple hardware cannot be included in one SCSI session, and multiple logical units can be seen from the OS on which the iSCSI initiator is operating. Also, in order to realize path multiplexing, software for realizing the multiplexing function must be used, which increases the price of the system.
なお、上記の実施の形態では、iSCSIパス多重化装置として2つのハードウェアが設けられていたが、さらに多くのハードウェアを設けてもよい。より多くのハードウェアを設けた場合には、他のiSCSIパス多重化装置は、第1の状態に設定されているiSCSIパス多重化装置に、受信したiSCSIのPDUを転送する。 In the above embodiment, two pieces of hardware are provided as the iSCSI path multiplexing device, but more pieces of hardware may be provided. When more hardware is provided, the other iSCSI path multiplexer transfers the received iSCSI PDU to the iSCSI path multiplexer set in the first state.
本発明は、IPネットワークを介してストレージデバイスに対してデータの書き込みを行うとともにストレージデバイスからデータを読み出すシステムに好適に適用される。 The present invention is suitably applied to a system that writes data to a storage device via an IP network and reads data from the storage device.
1 iSCSIイニシエータ
2 TCP/IPのプロトコル制御部
3 IPネットワーク
4,5 NIC
6,7 状態/PDU経路制御機
8,9 iSCSI/SCSIプロトコル制御部
10,11 RNIC
12 ファイバーチャネルストレージユニット
13,14 iSCSIパス多重化装置
15 通信路
1
6, 7 Status /
12 Fiber
Claims (6)
iSCSIイニシエータとターゲットデバイスとの間に複数のiSCSIパス制御装置が設けられ、
前記iSCSIイニシエータは、前記複数のiSCSIパス制御装置のそれぞれとの間にマルチコネクション/セッションでセッションを確立するコネクション/セッション制御手段と、
iSCSIレイヤにおける制御を行うiSCSIレイヤ制御手段とを含み、
前記複数のiSCSIパス制御装置は、それぞれ、
他のiSCSIパス制御装置との間で、互いの順位を設定する状態設定手段と、
自身が第1順位に設定されている場合に、前記コネクション/セッション制御手段がディスカバリ処理を実行したときに自身のアドレスと他のiSCSIパス制御装置のアドレスとを前記iSCSIイニシエータに応答するアドレス応答手段と、
前記iSCSIイニシエータから受信されたコマンドを前記ターゲットデバイスに与える機能を有するiSCSI/SCSIプロトコル制御部とを含み、
前記コネクション/セッション制御手段は、第1順位に設定されているiSCSIパス制御装置から受信した複数のアドレスにもとづいてセッションを確立し、
第1順位に設定されているiSCSIパス制御装置におけるiSCSI/SCSIプロトコル制御部が、前記iSCSIイニシエータから受信されたiSCSIのPDUからSCSIののCDBを抽出し、抽出したCDBにもとづいてターゲットデバイスに入出力要求を与える
ことを特徴とするiSCSIストレージシステム。 In the iSCSI storage system in which the path between the iSCSI initiator and the target device is multiplexed,
A plurality of iSCSI path control devices are provided between the iSCSI initiator and the target device,
The iSCSI initiator includes a connection / session control means for establishing a session with each of the plurality of iSCSI path control devices by a multi-connection / session;
iSCSI layer control means for performing control in the iSCSI layer,
Each of the plurality of iSCSI path control devices includes:
Status setting means for setting the mutual ranking with other iSCSI path control devices;
Address response means for responding to the iSCSI initiator with its own address and the address of another iSCSI path control device when the connection / session control means executes discovery processing when it is set in the first order. When,
An iSCSI / SCSI protocol control unit having a function of giving a command received from the iSCSI initiator to the target device;
The connection / session control means establishes a session based on a plurality of addresses received from the iSCSI path control device set in the first order,
The iSCSI / SCSI protocol control unit in the iSCSI path control device set in the first order extracts the SCSI CDB from the iSCSI PDU received from the iSCSI initiator, and enters the target device based on the extracted CDB. An iSCSI storage system characterized by providing an output request.
第1順位以外の順位に設定されているiSCSIパス制御装置のPDU経路制御手段は、前記iSCSIイニシエータからiSCSIのPDUを受信したときに前記情報を、第1順位に設定されているiSCSIパス制御装置に転送し、
第1順位に設定されているiSCSIパス制御装置のPDU経路制御手段は、前記情報の転送を受けている場合には、ターゲットデバイスから入力したデータを、前記情報を転送したiSCSIパス制御装置に出力する
請求項1記載のiSCSIストレージシステム。 The iSCSI path control device includes a PDU route control means having a function of transferring information included in the iSCSI PDU received from the iSCSI initiator to another iSCSI path control device,
The PDU route control means of the iSCSI path control device set to a rank other than the first rank receives the information when the iSCSI PDU is received from the iSCSI initiator, and the iSCSI path control apparatus is set to the first rank. Forward to
When receiving the information transfer, the PDU route control means of the iSCSI path control device set in the first order outputs the data input from the target device to the iSCSI path control device that transferred the information. The iSCSI storage system according to claim 1.
請求項1または請求項3記載のiSCSIストレージシステム。 The iSCSI layer control means executes retransmission control of an iSCSI command when the connection / session control means determines that an error has occurred due to a failure in a transmission path between the iSCSI initiator and the iSCSI path control device. The iSCSI storage system according to claim 1 or 3.
請求項1から請求項3のうちのいずれか1項に記載のiSCSIストレージシステム。 When another iSCSI path control device determines that a failure has occurred in the iSCSI path control device set in the first order, the status setting means of the other iSCSI path control device refers to its own iSCSI path control device. The iSCSI storage system according to any one of claims 1 to 3, wherein the iSCSI storage system is set to one rank.
請求項1から請求項4のうちのいずれか1項に記載のiSCSIストレージシステム。 If the status setting means of the iSCSI path control device set in the first order determines that a failure has occurred in the transmission path between the own iSCSI path control device and the target device, it replaces the own iSCSI path control device. The iSCSI storage system according to any one of claims 1 to 4, wherein control for setting another iSCSI path control device to the first order is performed.
iSCSIイニシエータとターゲットデバイスとの間に複数のiSCSIパス制御装置を設け、
前記複数のiSCSIパス制御装置が、それぞれ、他のiSCSIパス制御装置との間で、互いの順位を設定し、
前記複数のiSCSIパス制御装置が、自身が第1順位に設定されている場合に、iSCSIイニシエータがディスカバリ処理を実行したときに自身のアドレスと他のiSCSIパス制御装置のアドレスとを前記iSCSIイニシエータに応答し、
前記iSCSIイニシエータが、第1順位に設定されているiSCSIパス制御装置から受信した複数のアドレスにもとづいてマルチコネクション/セッションでセッションを確立し、
第1順位に設定されているiSCSIパス制御装置が、前記iSCSIイニシエータから受信されたiSCSIのPDUからSCSIののCDBを抽出し、抽出したCDBにもとづいてターゲットデバイスに入出力要求を与える
ことを特徴とするパス多重化方法。 In a path multiplexing method for multiplexing a path between an iSCSI initiator and a target device,
A plurality of iSCSI path control devices are provided between the iSCSI initiator and the target device,
Each of the plurality of iSCSI path control devices sets the order of each other with other iSCSI path control devices,
When the plurality of iSCSI path control devices are set to the first order, when the iSCSI initiator executes the discovery process, its own address and the addresses of other iSCSI path control devices are sent to the iSCSI initiator. Respond,
The iSCSI initiator establishes a session with a multi-connection / session based on a plurality of addresses received from the iSCSI path control device set in the first order,
The iSCSI path control device set in the first order extracts the SCSI CDB from the iSCSI PDU received from the iSCSI initiator, and gives an input / output request to the target device based on the extracted CDB. Path multiplexing method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005077366A JP4258482B2 (en) | 2005-03-17 | 2005-03-17 | iSCSI storage system and path multiplexing method in the system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005077366A JP4258482B2 (en) | 2005-03-17 | 2005-03-17 | iSCSI storage system and path multiplexing method in the system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006260223A true JP2006260223A (en) | 2006-09-28 |
JP4258482B2 JP4258482B2 (en) | 2009-04-30 |
Family
ID=37099398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005077366A Expired - Fee Related JP4258482B2 (en) | 2005-03-17 | 2005-03-17 | iSCSI storage system and path multiplexing method in the system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4258482B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010097614A (en) * | 2008-10-17 | 2010-04-30 | Lsi Corp | Embedded scale-out aggregator for storage array controller |
JP2013097683A (en) * | 2011-11-02 | 2013-05-20 | Fujitsu Ltd | Connection control device, storage system and control method for connection control device |
WO2016046943A1 (en) * | 2014-09-25 | 2016-03-31 | 株式会社日立製作所 | Storage device and storage device control method |
CN112153128A (en) * | 2020-09-11 | 2020-12-29 | 北京浪潮数据技术有限公司 | Communication method, device, equipment and readable storage medium |
-
2005
- 2005-03-17 JP JP2005077366A patent/JP4258482B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010097614A (en) * | 2008-10-17 | 2010-04-30 | Lsi Corp | Embedded scale-out aggregator for storage array controller |
JP2013097683A (en) * | 2011-11-02 | 2013-05-20 | Fujitsu Ltd | Connection control device, storage system and control method for connection control device |
WO2016046943A1 (en) * | 2014-09-25 | 2016-03-31 | 株式会社日立製作所 | Storage device and storage device control method |
CN112153128A (en) * | 2020-09-11 | 2020-12-29 | 北京浪潮数据技术有限公司 | Communication method, device, equipment and readable storage medium |
CN112153128B (en) * | 2020-09-11 | 2022-11-15 | 北京浪潮数据技术有限公司 | Communication method, device, equipment and readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP4258482B2 (en) | 2009-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101651559B (en) | Failover method of storage service in double controller storage system | |
JP4543051B2 (en) | Remote data facility on IP network | |
US6963932B2 (en) | Intermediate driver having a fail-over function for a virtual network interface card in a system utilizing Infiniband architecture | |
US8639794B2 (en) | Provisioning and commissioning a communications network with a virtual network operations center and interface | |
US10193951B2 (en) | Binding CRUD-type protocols in distributed agreement protocols | |
TW201426286A (en) | Method, apparatus and computer program product for providing high availability in an active/active appliance cluster | |
JP5034495B2 (en) | Storage system, program and method | |
JP4258482B2 (en) | iSCSI storage system and path multiplexing method in the system | |
US20090077275A1 (en) | Multiple I/O interfacing system for a storage device and communicating method for the same | |
CN1980232A (en) | Telnet session maitenance method, telnet proxy and computer network system | |
JP2007208502A (en) | Communication system, backup router, redundant processing program thereof, and redundant processing method thereof | |
JP4413806B2 (en) | Fault isolation method, communication apparatus and program having fault isolation function | |
MXPA02006896A (en) | Method and apparatus for providing reliable communications in an intelligent network. | |
JP2005527898A (en) | How to provide redundancy against channel adapter failure | |
JP4133738B2 (en) | High-speed network address takeover method, network device, and program | |
US10798159B2 (en) | Methods for managing workload throughput in a storage system and devices thereof | |
KR100383490B1 (en) | System and method for high availabilty network | |
CN102118389B (en) | Method for accessing storage device through internet small computer system interface (iSCSI) in multipath manner and storage device | |
JP5005425B2 (en) | Control device return system | |
CN109510725B (en) | Communication equipment fault detection system and method | |
KR20180099143A (en) | Apparatus and method for recovering tcp-session | |
JP5287440B2 (en) | Non-stop communication recovery system and method in case of failure | |
CN112100008B (en) | Cross-node multilink redundancy protection method and system | |
JP2013179430A (en) | Inter-device synchronizing and switching method, and inter-device switching system | |
JP5170000B2 (en) | Redundant pair detection method, communication device, redundant pair detection program, recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090113 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090126 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4258482 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |