JPWO2001050283A1 - 情報処理システムおよび情報配信方法 - Google Patents
情報処理システムおよび情報配信方法 Download PDFInfo
- Publication number
- JPWO2001050283A1 JPWO2001050283A1 JP2001550574A JP2001550574A JPWO2001050283A1 JP WO2001050283 A1 JPWO2001050283 A1 JP WO2001050283A1 JP 2001550574 A JP2001550574 A JP 2001550574A JP 2001550574 A JP2001550574 A JP 2001550574A JP WO2001050283 A1 JPWO2001050283 A1 JP WO2001050283A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- processing
- processing device
- storage device
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0658—Controller construction arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/322—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
- H04L69/329—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
複数の処理装置から成る分散システムにおける情報配信に関するものであり、特に1つの処理装置から複数の処理装置に同一情報を配信する方法に関する。
背景技術
分散システムの新たなインフラとして、SAN(Storage Area Network)が実現されはじめている(日経エレクトロニクスPP.57−63 1998.5 48 No715)。SANは複数の処理装置と複数ディスク装置を接続するネットワーク形態であり、それまで各処理装置に個別に接続されていたディスク装置を複数の処理装置に接続することにより、複数の処理装置がディスク装置を物理的に共有できるようになる。SANを実現する代表的な媒体としてはFibre Channelが挙げられる。Fibre Channelは、光ファイバまたは銅線により高速なシリアル伝送を実現し、1対1接続,Fabricによるスター型接続,FC−AL(Fibre Channel Arbitrated Loop)によるループ型接続が可能である。また、ディスク装置など周辺装置の主要プロトコルであるSCSI−3プロトコルをFibre Channelプロトコルの上位に実装できる(従来技術1)。
また、特開平6−348657号公報には、2台のホストコンピュータの間が共有する共有ディスクを設け、この共有ディスク装置への書込みと読み出しを介してデータの交換を行うことにより、多量のデータの転送所要時間の短縮を行うものが開示されている(従来技術2)。
しかしながら上記従来技術1には、処理装置間のデータのやり取りについて詳細な記載はない。また上記従来技術2は共有ディスクにより溝築したものであり、3台以上のホストコンピュータ間でのデータ交換を実現する形態について具体的に記述されていない。
発明の開示
本発明は、複数の処理装置間の情報配信を効率良く実現する方法およびシステムを提供することを目的とする。
発明を実施するための最良の形態
以下、本発明の実施例を説明する。
第1図は本発明にかかるシステム構成を示す図である。
1a,1b,…,1nはそれぞれ所望の処理を実行する処理装置、2a,2b,…,2nはデータやプログラムを記憶する記憶装置、3は複数の処理装置と複数の記憶装置を接続するスイッチを示す。各処理装置はそれぞれスイッチ3を介して任意の記憶装置にアクセス可能であり、複数の処理装置が1つ以上の記憶装置を物理的に共有可能となっている。本システムにおいて、ある1つの処理装置から他の1つ以上の処理装置に同一のデータを配信する場合、配信元の処理装置は配信先の処理装置の各々に配信データを送信する代わりに、スイッチ3を介していずれかの記憶装置に配信データを書込み、配信データが書込まれた記憶装置は配信データの書込みを配信先の処理装置にスイッチ3経由で通知し、この通知を受信した処理装置はそれぞれ通知元の記憶装置から配信データを読み出す。また、ある1つの処理装置から他の1つ以上の処理装置に同一のプログラムを配信する場合にも同様の方法を用いる。
第2図は本発明にかかる処理装置1aの構成を示す図である。なお他の処理装置も同様の構成である。
11はマイクロプロセッサユニット(MPU)、12は主記憶、15はシステムバス、13はMPU11と主記憶12とシステムバス15とを接続するブリッジ、14はMPU11への割込みを制御する割込みコントローラ(INTC)、16は処理装置1aをスイッチ3に接続するアダプタである。
アダプタ16の構成を第2図を用いて説明すると、161はスイッチ3から処理装置1aへのシリアル信号を受信する受信回路(RX)、162は処理装置1aからスイッチ3へのシリアル信号を送信する送信回路(TX)、163はRX161が受信したシリアル信号をパラレル信号に変換するためのシリ/パラ変換回路、164はスイッチ3に出力するパラレル信号をシリアル信号に変換してTX162に渡すためのパラ/シリ変換回路、165はFibre Channelのプロトコルを処理するFCプロトコル処理回路、166はSCSI−3のプロトコルを処理するSCSIプロトコル処理回路、167は送信データや受信データを一時的に保持するバッファ・メモリ、168は主記憶20とバッファ・メモリ167との間のDMA(Dynamic Memory Access)転送を制御するDMAコントローラ(DMAC)である。本実施例では、スイッチ3をSANの主要なネットワーク媒体であるFibre Channelで構成し、処理装置と記憶装置との間の通信プロトコルを周辺装置の主要なプロトコルであるSCSI−3を使用し、RX161,TX162,シリ/パラ変換回路163,パラ/シリ変換回路164,FCプロトコル処理回路165,SCSIプロトコル処理回路166をFibre ChannelおよびSCSI−3の仕様を示すANSI X3.230(Fibre Channel Enhanced Physical and Signaling Interface)、ANSI X3.269(Fibre Channel Protocol)、ANSI X3T10/995D(SCSI−3 Primary Commands)、ANSI X3.270(SCSI−3 Architecture Model)に基づいて実現する。
SCSI−3プロトコルの基本的な例を第15図を用いて説明する。
アクセス元をイニシエータ、アクセス先をターゲットとすると、先ず、コマンドフェーズ(1500)において、イニシエータはターゲットにコマンド・ディスクリプタ・ブロック(CDB)を送信する。CDBはコマンドの内容(ライトやリードなど)、ハードディスク上のアクセス対象の論理ブロック領域などを指定するもので、SCSI−3の仕様で形式が定められている。
次に、指定したコマンドがライトアクセスであれば、データアウトフェーズ(1501)でイニシエータからターゲットにライトデータを送信し、指定したコマンドがリードアクセスであれば、データインフェーズ(1502)でターゲットからイニシエータにリードデータを送信する。
そしてターゲットは、ステータスフェーズ(1503)においてコマンドが正常に実行されたかあるいは実行中にエラーが発生したことを示すステータスをイニシエータに送信し、最後にコマンド実行の終了をイニシエータに通知する(1504)。
次に、Fibre Channelによるデータ転送の概略を第16図を用いて説明する。
Fibre Channelは基本的に1603に示すような形式のフレームによってデータを転送する。フレーム1603は、フレームの開始を示すSOF(1604)と、ヘッダ(1605)と、転送データを格納するデータフィールド(1606)と、エラーチェックのためのCRC(1607)と、フレームの終了を示すEOF(1608)で構成される。
ヘッダ(1605)は、フレームのタイプ(1609)と、各種の制御部(1610)と、ヘッダカウント(1611)と、送信元ID(1612)と、送信先ID(1613)と、シーケンスカウント(1614)と、フレームの長さを設定するフレーム長(1615)とから成る。
シーケンス(1602)は1つ以上のフレームで構成され、1つのシーケンスでSCSI−3の1つのフェーズ(コマンドフェーズ,データアウトフェーズ,データインフェーズ,ステータスフェーズなどのうちの1つ)を実現する。
エクスチェンジ(1600)は、1つ以上のシーケンスで構成され、SCSI−3でのデータライトやデータリードなどの完結した周辺装置へのアクセスを実現する。
なお、Fibre Channelによるデータ転送の詳細については、ANSI X3.230(Fibre Channel Enhanced Physical and Signaling Interface)に述べられている。
処理装置1aによる記憶装置へのデータライト動作を第3図および第4図を用いて説明する。
先ず、MPU11がSCSIプロトコル処理回路166に第4図に示すように設定されたコマンド・ディスクリプタ・ブロック(CDB)を渡して書込み先の記憶装置への送信を指示する(3010)。第4図のCDBは、SCSI−3の仕様で定められており、Operation codeはライトやリード等のコマンドのタイプを示し(ライトの場合は0Ah)、LUNはターゲットの論理ユニット番号を示し、Logical block addressはライトやリードの対象となる論理ブロック群の先頭論理ブロック番号を示し、Transfer lengthはライトやリードの対象となる論理ブロック群の長さを示し、controlは各種制御ビットを示す。
次に、SCSIプロトコル処理回路166はFCプロトコル処理回路165にCDBと送信先IDを渡して送信を指示し、FCプロトコル処理回路165はCDBをデータ部に格納したフレームを形成してパラ/シリ変換回路164およびTX162を介してスイッチ3に出力する(3020)。
次に、MPU11は主記憶12上にあるライトデータを送信するためにDMAC168を設定してDMAによってライトデータをアダプタ16に供給するようにする(3030)。
次に、MPU11はSCSIプロトコル処理回路166に書込み先の記憶装置へのライトデータ送信を指示し、SCSIプロトコル処理回路166はDMAを起動して主記憶12からライトデータをバッファメモリ167経由で取り出しながらライトデータと送信先IDをFCプロトコル処理回路165に渡してデータ送信を指示し、FCプロトコル処理回路165はライトデータをデータ部に格納したフレームを形成してパラ/シリ変換回路164およびTX62を介してスイッチ3に出力する(3040)。
次に、書込み先の記憶装置からステータスが返送されるのを待つ(3050)。ステータスが返送されたならばその内容をチェックしてコマンドの実行が正常終了したかどうかを確認する(3060)。
最後に、書込み先の記憶装置からコマンド実行終了のメッセージが送られるのを待ち(3070)、同メッセージの受信を持ってコマンドを完了する。
次に、処理装置1aによる記憶装置からのデータリード動作を第5図および第6図を用いて説明する。
先ず、MPU11がSCSIプロトコル処理回路166に第6図に示すように設定されたコマンド・ディスクリプ・タブロック(CDB)を渡す(5010)。第6図のCDBは基本的に第4図のCDBと同じであり、Operation codeがリードコマンドを示す08hになっている点が異なる。
次に、MPU11は主記憶20上にリードデータを格納するためにDMAC168を設定してDMAによってリードデータをアダプタ16から取り出すようにする(5020)。
次に、MPU11はSCSIプロトコル処理回路166に読み出し先の記憶装置へのCDB送信を指示し、SCSIプロトコル処理回路166はFCプロトコル処理回路165にCDBと送信先IDを渡して送信を指示し、FCプロトコル処理回路165はCDBをデータ部に格納したフレームを形成してパラ/シリ変換回路164およびTX162を介してスイッチ3に出力する(5030)。
次に、読み出し先の記憶装置がスイッチ3を介して処理装置1aにリードデータを送信すると、リードデータはRX161,シリ/パラ変換回路163,FCプロトコル処理回路165を介してSCSIプロトコル処理回路166に送られ、SCSIプロトコル処理回路166は受信したリードデータをバッファ・メモリ167に送るとともにDMAC168を起動してDMAにより主記憶にリードデータを格納する(5040)。
次に、読み出し先の記憶装置からステータスが返送されるのを待つ(5050)。ステータスが返送されたならばその内容をチェックしてコマンドの実行が正常終了したかどうかを確認する(5060)。
最後に、読み出し先の記憶装置からコマンド実行終了のメッセージが送られるのを待ち(5070)、同メッセージの受信を持ってコマンドを完了する。
第14図は、スイッチ3の構成を示す図である。
本実施例のスイッチ3はFibre ChannelのFabricトポロジを形成するFabricを示している。
31a,31b,…,31i,31j,…,31x,31yはそれぞれ、処理装置または記憶装置のそれぞれと1対1で結合するFポート、32は任意のFポート間の回線接続を実現するConnection Sub−Fabric、33は任意のFポート間の非回線接続を実現するConnectionless Sub−Fabric、34はFabric制御部である。
Fポート31aは、処理装置または記憶装置からシリアル信号を受信するRX311と、処理装置または記憶装置へシリアル信号を送信するTX312と、RX311が受信したシリアル信号を一時的に待避してConnectionl Sub−Fabric32またはConnectionless Sub−Fabric33に送信する受信バッファ(BUF)313を有して構成される。他のFポートも同様の構成である。
Connection Sub−Fabric 32は、2つのFポート間の接続を確立すると双方間のルートを占有してフレーム転送を実行するものであり、2つのFポート間で複数のフレームを高速に転送できる。
Connectionless Sub−Fabric33は、2つのFポート間の接続を固定せず、フレーム単位で任意のFポート間の転送を実行するものであり、複数のFポート間の多重転送を実現する。
このConnection sub−Fabric 32とConnection sub−Fabric 33は、配信元,配信先の処理装置により選択される。つまり、配信先の処理装置が第16図に示すフレーム1603のヘッダ1605の制御部1610へ、Connection sub−Fabric 32とConnection sub−Fabric 33のいずれを使うか指定して送る。スイッチ3は、配信元の指定を配信先の処理装置へ送り、配信先の処理装置は、配信元で指定されたConnection sub−Fabricを使えるか判断し、使用可能であればその旨をスイッチ3へ返す。配信先及び配信元の一致がとれたらスイッチ3は、一致がとれた方のConnection sub−Fabricで情報の配信を行う。
第7図は本発明にかかる記憶装置2aの構成を示す図である。なお他の記憶装置も同様の構成である。
21は記憶装置2aをスイッチ3に接続するインタフェース部、22は磁気ディスクである。
インタフェース21の構成を第7図を用いて説明すると、211はスイッチ3から記憶装置2aへのシリアル信号を受信する受信回路(RX)、212は記憶装置2aからスイッチ3へのシリアル信号を送信する送信回路(TX)、213はRX211が受信したシリアル信号をパラレル信号に変換するためのシリ/パラ変換回路、214はスイッチ3に出力するパラレル信号をシリアル信号に変換してTX212に渡すためのパラ/シリ変換回路、215はFibre Channelのプロトコルを処理するFCプロトコル処理回路、216はSCSI−3のプロトコルを処理するSCSIプロトコル処理回路、217は磁気ディスク22へのライトデータや磁気ディスク22からのリードデータを一時的に保持するバッファ・メモリ、218は磁気ディスク22へのアクセスやスイッチ3による通信を制御するMPU、219は磁気ディスク22へのアクセスやスイッチ3による通信を制御するプログラムを格納する不揮発性メモリ(ROM)、220は配信データを格納する論理ブロック領域と配信元処理装置のIDと配信先処理装置のIDの組合わせを複数記憶するテーブルである。本実施例では第2図でも説明したように、処理装置と記憶装置との間の通信プロトコルをSCSI−3,スイッチ3をFibre Channelとし、RX211,TX212,シリ/パラ変換回路213,パラ/シリ変換回路214,プロトコル処理回路215,コマンド処理回路216はSCSI−3の各種規格の中のANSI X3.230(Fibre Channel Enhanced Physical and Signaling Interface)、ANSI X3.269(Fibre Channel Protocol)、ANSI X3T10/995D(SCSI−3 Primary Commands)、ANSI X3.270(SCSI−3 Architecture Model)に基づいて実現する。
記憶装置2aによるデータライト/リード動作を第8図を用いて説明する。
先ず、処理装置からスイッチ3を介して送信されるコマンド・ディスクリプ・タブロック(CDB)をRX211,シリ/パラ変換回路213,FCプロトコル処理回路215を経てSCSIプロトコル処理回路216に入力し(8010)、CDBのCommand codeにより実行すべきコマンドを判定する(8020)。Command codeがライトであれば、CDBのLogical block addressとTransfer lengthで定まる磁気ディスク22の論理ブロック領域に、その後に受信するライトデータをバッファ・メモリ217経由でライトし(8030)、Command codeがリードであれば、CDBのLogical block addressとTransfer lengthで定まる磁気ディスク22の論理ブロック領域のデータをバッファ・メモリ217経由で読み出し、FCプロトコル処理装置215,パラ/シリ変換回路214,TX212,スイッチ3を介してアクセス元の処理装置に送信する(8040)。
ライトデータ受信後あるいはリードデータ送信後、アクセス元の処理装置にコマンドの実行が正常に終了したかどうかを示すステータスを送信する(8050)。
次に、アクセス元の処理装置にコマンドの実行終了を通知する(8060)。
最後に、データ配信を実現するためのメッセージ送信を実行する(8070)。ある処理装置から他の1つ以上の処理装置にデータを配信する場合、本実施例では配信元の処理装置が記憶装置に配信データを書込み、そして配信先の処理装置がそれぞれ配信データを記憶装置から読み出すことによりデータ配信を実現する。上記のメッセージ送信(8070)はこのデータ配信において、配信データが記憶装置に書込まれたことを配信先の処理装置に通知したり、配信データが読み取られたことを配信元の処理装置に通知したりするために用いる。
記憶装置は、処理装置から書込まれるデータが配信データかどうかを、その論理ブロック領域によって判定する。記憶装置は、データ配信のための特定の論理ブロック領域と、同論理ブロック領域を介してデータを配信する配信元の処理装置のIDと、配信先の処理装置のIDとの組合わせをテーブル220に記憶し、処理装置から送られるCDBのアクセス先論理ブロック領域をテーブル220に照合することでそのアクセスがデータ配信であるかどうかや、データ配信である場合はその配信元および配信先を判定できる。テーブル220の記憶形式は第12図に示すように、論理ブロック番号およびフィルタと、配信元の処理装置のIDと、配信先ノード数と、配信先の各処理装置のIDを1エントリとし、そして論理ブロック番号の2進数表記のうち無効な桁を最下位桁から任意の桁までフィルタで指定してデータ配信のための論理ブロック領域を示すようにする。例えばフィルタによって下位8桁を無効とすれば28=256論理ブロックの領域を指定することになる。
メッセージ送信の動作を第9図,第10図、および第11図を用いて説明する。
本メッセージ送信はSCSI−3の仕様に定められているAsynchronous Event Notification(AEN)機構のよって実現する。AENは処理装置や記憶装置で非同期に発生した事象をターゲット側からイニシエータ側に通知するための機能である。AENは第10図に示すSENDコマンドのCDB(但しAENビットは1を設定)によって第11図に示すメッセージを転送する。メッセージのInformationには、配信元の処理装置によって配信データが書込まれた論理ブロック領域の先頭番号およびブロック長を設定する(9010)。この論理ブロック領域の先頭番号およびブロック長は、配信元の処理装置から受信するデータライトのCDBの論理ブロック番号およびブロックと同値である。
次に、AENのためのCDBを設定し(9010)、テーブル220を参照して配信先の処理装置の1つにCDBおよびメッセージを送信する(9030,9040)。
次に、メッセージ送信先からのステータス返信を待ち(9050)、ステータスを受信するとメッセージ送信が正常に終了したかどうかをチェックし(9060)、メッセージ送信先からのコマンド終了通知を待つ(9070)。コマンド終了を受信した時に、全ての配信先処理装置にメッセージを送信するまでCDB送信(9030)からコマンド終了待ち(9070)までを繰り返す。
第13図は記憶装置を介したデータ配信のフローを示す図である。
先ず、配信元処理装置は記憶装置に配信データのライトを示すCDBを送信し(1300)、続いて配信データを送信する(1301)。
記憶装置はデータライトコマンドを実行後、ステータスおよびコマンド終了通知を配信元処理装置に返送し(1302,1303)、配信先処理装置にAENを示すCDBを送信し(1304)、続いて配信データを格納した論理ブロックを示すメッセージを送信する(1305)。
配信先処理装置はメッセージを受信後、ステータスおよびコマンド終了通知を記憶装置に返送し(1306,1307)、その後、メッセージを参照して記憶装置に配信データのリードを示すCDBを送信する(1308)。
記憶装置はデータリードコマンドを実行して配信先処理装置に配信データを送信(1309)した後、ステータスおよびコマンド終了通知を配信元処理装置に返送し(1310,1311)、配信元処理装置にAENを示すCDBを送信し(1312)、続いて配信データを格納した論理ブロックを示すメッセージを送信する(1313)。
配信元処理装置はメッセージを受信後、ステータスおよびコマンド終了通知を記憶装置に返送し(1314,1315)、その後、メッセージを参照して該当するデータ配信が完了したことを判定し、配信データの更新が可能になったことを検知する。
以上の実施例では、ある1つの処理装置から他の1つ以上の処理装置に同一のデータを配信する場合、ネットワークを介していずれかの記憶装置に配信データを書込み、配信データが書込まれた記憶装置は配信データの書込みを配信先の処理装置にネットワーク経由で通知し、この通知を受信した処理装置はそれぞれ通知元の記憶装置から配信データを読み出すので、配信元処理装置は、配信先処理装置の準備完了の確認や、配信先処理装置への配信データ書込み完了の通知などの処理が不要となり、データ配信に係る処理のオーバヘッドを削減できる。
以上の実施例では、記憶装置に配信データの書込みや読み出しを通知するための機構を設けるが、他の第2の実施例として、処理装置が配信データの書込みや読み出しを通知することにより、記憶装置の特別な機構を不要にするシステムについて説明する。本実施例のシステム構成は第1図と同様であり、本実施例の処理装置およびネットワークはそれぞれ第2図および第14図と同様である。一方、本実施例の記憶装置は第7図と基本的に同じであるが、配信データの書込みや読み出しを通知する必要がないので、第17図に示すように配信テーブル220を除いた構成となる。
配信元の処理装置は、各種配信データを書込む記憶装置の論理ブロック領域と、配信先の処理装置IDの組合わせを主記憶12に記憶し、配信データを記憶装置に書込む時と、配信先の処理装置にデータ書込みを通知する時に参照する。各種配信データを書込む記憶装置の論理ブロック領域と、配信先の処理装置IDの組合わせの記憶形式は第18図に示すように、配信データを識別する配信データIDと、配信データを書込む記憶装置の論理ブロック領域の先頭を示す論理ブロック番号および論理ブロックと、配信先ノード数と、配信先の各処理装置のIDとの組合わせを1エントリとする。
第19図は、第2の実施例において記憶装置を介したデータ配信のフローを示す図である。
先ず、配信元処理装置は記憶装置に配信データのライトを示すCDBを送信し(1900)、続いて配信データを送信する(1901)。
記憶装置はデータライトコマンドを実行後、ステータスおよびコマンド終了通知を配信元処理装置に返送する(1902,1903)。
次に、配信元処理装置は配信先処理装置にAENを示すCDBを送信し(1904)、続いて配信データを格納した論理ブロックを示すメッセージを送信する(1905)。
配信先処理装置はメッセージを受信後、ステータスおよびコマンド終了通知を配信元処理装置に返送し(1906,1907)、その後、メッセージを参照して記憶装置に配信データのリードを示すCDBを送信する(1908)。
記憶装置はデータリードコマンドを実行して配信先処理装置に配信データを送信(1909)した後、ステータスおよびコマンド終了通知を配信元処理装置に返送する(1910,1911)。
次に、配信先処理装置は配信元処理装置にAENを示すCDBを送信し(1912)、続いて配信データを格納した論理ブロックを示すメッセージを送信する(1913)。
配信元処理装置はメッセージを受信後、ステータスおよびコマンド終了通知を配信先処理装置に返送し(1914,1915)、その後、メッセージを参照して該当するデータ配信が完了したことを判定し、配信データの更新が可能になったことを検知する。
以上の実施例では、処理装置が配信データの書込みや読み出しを通知することにより、記憶装置に配信データの書込みや読み出しを通知する機構を設ける必要がなく、既存の記憶装置によってデータ配信を実現できる。
以上の実施例では、記憶装置への配信データの書込みや読み出しを記憶装置または処理装置が通知するが、他の第3の実施例として、ネットワークの中核であるFabricが記憶装置への配信データの書込みや読み出しを通知することにより、記憶装置の特別な機構を不要にし、かつ、処理装置におけるデータ配信処理のオーバヘッドを削減するシステムについて説明する。本実施例のシステム構成は第1図と同様であり、本実施例の処理装置および記憶装置はそれぞれ第2図および第17図と同様である。一方、本実施例のFabricは第14図と基本的に同じであるが、第20図に示すように記憶装置への配信データの書込みおよび読み出しを通知する時に参照するテーブル35を付加した構成となる。
第20図のFabric3は、配信データを書込む記憶装置のIDおよび論理ブロック領域と、配信元の処理装置IDと、配信先の処理装置IDの組合わせをテーブル35に記憶し、配信元の処理装置から記憶装置への配信データ書込みを中継する時に参照する。テーブル35の記憶形式は第21図に示すように、第12図の記憶形式に配信データを書込む記憶装置IDを付加した形式となる。
第22図は、第2の実施例において記憶装置を介したデータ配信のフローを示す図である。
先ず、配信元処理装置は記憶装置に配信データのライトを示すCDBを送信し(2200)、続いて配信データを送信する(2201)。
記憶装置はデータライトコマンドを実行後、ステータスおよびコマンド終了通知を配信元処理装置に返送する(2202,2203)。
FabricはCDB2200の送信先記憶装置IDおよび論理ブロックをテーブル35と照合し、対応する配信先処理装置にAENを示すCDBを送信し(2204)、続いて配信データを格納した記憶装置IDおよび論理ブロックを示すメッセージを送信する(2205)。
配信先処理装置はメッセージを受信後、ステータスおよびコマンド終了通知をFabricに返送し(2206,2207)、その後、メッセージを参照して記憶装置に配信データのリードを示すCDBを送信する(2208)。
記憶装置はデータリードコマンドを実行して配信先処理装置に配信データを送信(2209)した後、ステータスおよびコマンド終了通知を配信元処理装置に返送する(2210,2211)。
FabricはCDB2208の送信先記憶装置IDおよび論理ブロックをテーブル35と照合し、対応する配信元処理装置にAENを示すCDBを送信し(2212)、続いて配信データを格納した論理ブロックを示すメッセージを送信する(2213)。
配信元処理装置はメッセージを受信後、ステータスおよびコマンド終了通知をFabricに返送し(2214,2215)、その後、メッセージを参照して該当するデータ配信が完了したことを判定し、配信データの更新が可能になったことを検知する。
以上の実施例では、Fabricが記憶装置への配信データの書込みや読み出しを通知することにより、記憶装置の特別な機構を不要にし、かつ、処理装置におけるデータ配信処理のオーバヘッドを削減できる。
以上の実施例では、いずれも配信先の複数の処理装置が1つの記憶装置に書込まれた配信データを読み出すことになるが、記憶装置へのアクセスを分散させるために、配信先処理装置を複数のグループに分割し、配信元処理装置が複数の記憶装置に同一の配信データを書込み、そして各配信先処理装置はそれぞれグループ毎に異なる記憶装置から配信データを読み出すことが実行可能である。
また、記憶装置から読み出した配信データを一時的に保持するキャッシュをネットワークに設け、記憶装置からの配信データ読み出しを高速にする形態が考えられる。
第23図に示すように、Fabric3の各Fポート31a,31b,…,31i,31j,…,31x,31yにそれぞれキャッシュ314を設け、複数の処理装置がある記憶装置から配信データを読み出す場合に、最初にアクセスした処理装置が記憶装置から読み出したデータをその記憶装置が接続されているFポートのキャッシュ314に保持し、他の処理装置は記憶装置から配信データを読み出す代わりにキャッシュ314から配信データを読み出すことにより、配信データの読み出しを高速にすることができる。
本発明によれば、ある1つの処理装置から他の1つ以上の処理装置に同一のデータを配信する場合、ネットワークを介していずれかの記憶装置に配信データを書込み、配信データが書込まれた記憶装置は配信データの書込みを配信先の処理装置にネットワーク経由で通知し、この通知を受信した処理装置はそれぞれ通知元の記憶装置から配信データを読み出すので、配信元処理装置は、配信先処理装置の準備完了の確認や、配信先処理装置への配信データ書込み完了の通知などの処理が不要となり、データ配信に係る処理のオーバヘッドを削減できるという効果がある。
また別の形態として、処理装置が配信データの書込みや読み出しを通知することにより、記憶装置に配信データの書込みや読み出しを通知する機構を設ける必要がなく、既存の記憶装置によってデータ配信を実現できるという効果がある。
また別の形態として、Fabricが記憶装置への配信データの書込みや読み出しを通知することにより、記憶装置の特別な機構を不要にし、かつ、処理装置におけるデータ配信処理のオーバヘッドを削減できるという効果がある。
さらに、配信先処理装置を複数のグループに分割し、配信元処理装置が複数の記憶装置に同一の配信データを書込み、そして各配信先処理装置はそれぞれグループ毎に異なる記憶装置から配信データを読み出すことにより、記憶装置へのアクセスを分散させることができるという効果がある。
さらに、記憶装置から読み出した配信データを一時的に保持するキャッシュをネットワークに設け、最初にアクセスした処理装置が記憶装置から読み出した配信データをキャッシュに保持し、他の処理装置は記憶装置から配信データを読み出す代わりにキャッシュから配信データを読み出すことにより、配信データの読み出しを高速にすることができるという効果がある。
産業上の利用可能性
複数の処理装置から成る分散システムを適用できる、産業機器,電力,鉄道,自動車などの分野において利用することができる。
【図面の簡単な説明】
第1図は、本発明にかかるシステム構成を示す図である。
第2図は、本発明にかかる処理装置の構成を示す図である。
第3図は、処理装置による記憶装置へのデータライト動作を示す図である。
第4図は、データライトのコマンド・ディスクリプタ・ブロックを示す図である。
第5図は、処理装置による記憶装置へのデータリード動作を示す図である。
第6図は、データリードのコマンド・ディスクリプタ・ブロックを示す図である。
第7図は、記憶装置の構成を示す図である。
第8図は、記憶装置によるデータライト/リード動作を示す図である。
第9図は、記憶装置によるメッセージ送信の動作を示す図である。
第10図は、SENDコマンドのコマンド・ディスクリプタ・ブロックを示す図である。
第11図は、Asynchronous Event Notificationのメッセージを示す図である。
第12図は、テーブルの記憶形式を示す図である。
第13図は、記憶装置を介したデータ配信のフローを示す図である。
第14図は、スイッチ3の構成を示す図である。
第15図は、SCSI−3プロトコルの基本的な例を示す図である。
第16図は、Fibre Channelによるデータ転送の概略を示す図である。
第17図は、記憶装置の第2の構成を示す図である。
第18図は、テーブルの第2の記憶形式を示す図である。
第19図は、記憶装置を介したデータ配信の第2のフローを示す図である。
第20図は、Fabricの第2の構成を示す図である。
第21図は、テーブルの第3の記憶形式を示す図である。
第22図は、記憶装置を介したデータ配信の第3のフローを示す図である。
第23図は、Fabricの第3の構成を示す図である。
Claims (11)
- 複数の処理装置と、
情報を記憶する記憶部と、配信される情報の書込み先の記憶領域と配信元の処理装置のアドレスと配信先の処理装置のアドレスとを対応付けて記憶するテーブルとを有し、配信元の前記処理装置から送られた情報の書込みに応じて、前記テーブルを参照して配信先の処理装置に配信情報が書込まれた記憶領域を通知する、少なくとも1つの記憶装置と、
前記処理装置及び前記記憶装置とを接続する接続手段とを有する情報処理システム。 - 請求項1の情報処理システムにおいて、
前記記憶装置は、配信先の前記処理装置による記憶された前記情報の読み出しに応じて前記テーブルを参照して配信元の前記処理装置へ情報が読み出されたことを通知する情報処理システム。 - 記憶装置と、
配信する情報の種類と自処理装置のアドレスと配信先の処理装置のアドレスとを対応付けて記憶するテーブルを有し、情報を前記記憶装置に書込むとともに前記テーブルを参照して配信先の処理装置に情報の種類および情報を書込んだ前記記憶装置の記憶領域を通知する、複数の処理装置と、
前記記憶装置及び前記処理装置とを接続する接続手段とを有する情報処理システム。 - 請求項3の情報処理システムにおいて、
前記処理装置は、前記記憶装置に記憶された前記情報の読み出しに応じて、前記テーブルを参照して配信元の前記処理装置へ情報を読み出したことを通知する情報処理システム。 - 複数の処理装置と、
少なくとも1つの記憶装置と、
前記記憶装置と、前記処理装置とを接続すると共に、配信する情報の書込み先である前記記憶装置および記憶領域と配信元の処理装置のアドレスと配信先の処理装置のアドレスとを対応付けて記憶するテーブルを有し、前記処理装置から前記記憶装置への情報書込みが行われる際に、前記テーブルを参照して配信先の前記処理装置を判定して各々に配信情報が書込まれた前記記憶装置および記憶領域を通知する接続手段とを有する情報処理システム。 - 請求項5の情報処理システムにおいて、
前記接続手段は、配信先の前記処理装置による記憶された前記情報の読み出しに応じて前記テーブルを参照して配信元の前記処理装置へ情報が読み出されたことを通知する情報処理システム。 - 請求項5又は6の情報処理システムにおいて、
前記接続手段は、前記処理装置が前記記憶装置から読み出した情報を一時的に記憶するキャッシュ手段を有し、情報配信先の前記処理装置の1つが読み出した情報を前記キャッシュ手段に記憶し、情報配信先の他の前記処理装置は前記キャッシュ手段から情報を読み出すことを特徴とする情報処理システム。 - 複数の処理装置と、少なくとも1つの記憶装置と、複数の前記処理装置および前記記憶装置とを接続する接続手段とを有するシステムにおいて、ある処理装置から他の処理装置に情報を配信する方法であって、
情報配信元の処理装置は情報を前記記憶装置に書込み、前記記憶装置は情報が書込まれたことを情報配信先の処理装置に通知し、情報配信先の処理装置はそれぞれ、前記記憶装置からの通知に基づいて前記記憶装置から情報を読み出す情報配信方法。 - 複数の処理装置と、少なくとも1つの記憶装置とを有するシステムにおいて、ある処理装置から少なくとも1つの他の処理装置に情報を配信する方法であって、
配信元の処理装置は情報を前記記憶装置に書込むとともに情報が前記記憶装置に書込まれたことを情報配信先の処理装置にそれぞれ通知し、情報配信先の前記処理装置は前記処理装置からの通知に基づいて前記記憶装置から情報を読み出すことを特徴とする情報配信方法。 - 複数の処理装置と、少なくとも1つの記憶装置と、複数の前記処理装置及び前記記憶装置とを接続する接続手段を有するシステムにおいて、ある処理装置から少なくとも1つの他の処理装置に情報を配信する方法であって、
配信元の処理装置は情報を前記接続手段を経由して前記記憶装置に書込み、前記接続手段は情報が書込まれたことを配信先の処理装置に通知し、配信先の前記処理装置はそれぞれ、前記接続手段からの通知に基づいて前記記憶装置から情報を読み出すことを特徴とする情報配信方法。 - 複数の処理装置と、複数の記憶装置とを有するシステムにおいて、ある処理装置から他の複数の処理装置に同一情報を配信する方法であって、
配信元の前記処理装置は同一の情報を複数の前記記憶装置に書込み、情報配信先のそれぞれの処理装置は複数の前記記憶装置のいずれか1つから情報を読み出すことを特徴とする情報配信方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2000/000040 WO2001050283A1 (fr) | 2000-01-07 | 2000-01-07 | Dispositif de traitement de donnees et procede de distribution d'information |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2001050283A1 true JPWO2001050283A1 (ja) | 2004-01-08 |
Family
ID=11735554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001550574A Pending JPWO2001050283A1 (ja) | 2000-01-07 | 2000-01-07 | 情報処理システムおよび情報配信方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2001050283A1 (ja) |
WO (1) | WO2001050283A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193282A (ja) * | 2008-02-14 | 2009-08-27 | Sharp Corp | データ処理装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0269045A (ja) * | 1988-09-05 | 1990-03-08 | Canon Inc | メッセージ蓄積中継装置 |
JPH04332234A (ja) * | 1991-05-08 | 1992-11-19 | Nippon Telegr & Teleph Corp <Ntt> | 閲覧管理装置 |
JPH06282529A (ja) * | 1993-03-26 | 1994-10-07 | Hitachi Software Eng Co Ltd | 計算機間のデータ共用方法 |
JPH08241186A (ja) * | 1995-03-07 | 1996-09-17 | Fujitsu Ltd | バッファメモリ管理ユニット及びバッファメモリ管理方法 |
JPH08328988A (ja) * | 1995-05-30 | 1996-12-13 | Kofu Nippon Denki Kk | 情報処理システム |
JPH09223087A (ja) * | 1995-12-11 | 1997-08-26 | Fujitsu Ltd | メッセージ処理方法及びメッセージ処理システム |
JPH10145421A (ja) * | 1996-11-12 | 1998-05-29 | Dainippon Printing Co Ltd | 電子絵はがきシステム |
JPH1127314A (ja) * | 1997-06-27 | 1999-01-29 | Nec Corp | 電子メールシステム |
JPH11338870A (ja) * | 1998-05-26 | 1999-12-10 | Pfu Ltd | 情報配信システム |
-
2000
- 2000-01-07 JP JP2001550574A patent/JPWO2001050283A1/ja active Pending
- 2000-01-07 WO PCT/JP2000/000040 patent/WO2001050283A1/ja active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0269045A (ja) * | 1988-09-05 | 1990-03-08 | Canon Inc | メッセージ蓄積中継装置 |
JPH04332234A (ja) * | 1991-05-08 | 1992-11-19 | Nippon Telegr & Teleph Corp <Ntt> | 閲覧管理装置 |
JPH06282529A (ja) * | 1993-03-26 | 1994-10-07 | Hitachi Software Eng Co Ltd | 計算機間のデータ共用方法 |
JPH08241186A (ja) * | 1995-03-07 | 1996-09-17 | Fujitsu Ltd | バッファメモリ管理ユニット及びバッファメモリ管理方法 |
JPH08328988A (ja) * | 1995-05-30 | 1996-12-13 | Kofu Nippon Denki Kk | 情報処理システム |
JPH09223087A (ja) * | 1995-12-11 | 1997-08-26 | Fujitsu Ltd | メッセージ処理方法及びメッセージ処理システム |
JPH10145421A (ja) * | 1996-11-12 | 1998-05-29 | Dainippon Printing Co Ltd | 電子絵はがきシステム |
JPH1127314A (ja) * | 1997-06-27 | 1999-01-29 | Nec Corp | 電子メールシステム |
JPH11338870A (ja) * | 1998-05-26 | 1999-12-10 | Pfu Ltd | 情報配信システム |
Also Published As
Publication number | Publication date |
---|---|
WO2001050283A1 (fr) | 2001-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0841781B1 (en) | Fibre channel switch employing distributed queuing | |
US7836249B2 (en) | Disk subsystem | |
US5878236A (en) | Method for coupling segments of a bus system | |
US6493750B1 (en) | Command forwarding: a method for optimizing I/O latency and throughput in fibre channel client/server/target mass storage architectures | |
US7073022B2 (en) | Serial interface for a data storage array | |
JP3003977B2 (ja) | 入出力通信サブシステム及び方法 | |
US8423677B2 (en) | Storage system having a channel control function using a plurality of processors | |
US20040100944A1 (en) | Serial ATA frame structure routing circuitry and protocols | |
JP2001523862A (ja) | ループの初期化および応答のための方法及び専用のフレームバッファ | |
EP0772121A1 (en) | Method and apparatus for memory sequencing | |
JPH07325767A (ja) | 入出力通信サブシステム及び方法 | |
WO1998015896A1 (en) | High speed heterogeneous coupling of computer systems using channel-to-channel protocol | |
WO1997010663A1 (en) | Method and apparatus for implementing a two-port ethernet bridge using a semaphoring technique | |
JPH07143202A (ja) | システムを構成する方法、デバイスを構成する方法、制御装置およびシステム | |
JPWO2001050283A1 (ja) | 情報処理システムおよび情報配信方法 | |
CN104346310A (zh) | 一种高性能i2c从机数据交换电路及方法 | |
JP4432388B2 (ja) | 入出力制御装置 | |
JP4615122B2 (ja) | インタフェース制御装置 | |
JP4930554B2 (ja) | 入出力制御装置 | |
JP4231633B2 (ja) | 外部記憶システム | |
JPH06301607A (ja) | マルチアクセスi/o制御方式 | |
JP2998186B2 (ja) | データ転送装置 | |
CN117370231A (zh) | 实现gpu核内片上网络总线访问的协议转换模块及方法 | |
JP3130226B2 (ja) | 入出力通信サブシステム及び方法 | |
Snively | SCSI applications on fiber channel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040604 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071009 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080701 |