JP2000181887A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2000181887A5 JP2000181887A5 JP1998357254A JP35725498A JP2000181887A5 JP 2000181887 A5 JP2000181887 A5 JP 2000181887A5 JP 1998357254 A JP1998357254 A JP 1998357254A JP 35725498 A JP35725498 A JP 35725498A JP 2000181887 A5 JP2000181887 A5 JP 2000181887A5
- Authority
- JP
- Japan
- Prior art keywords
- shared memory
- access
- failure
- adapter
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 101700013183 CHA3 Proteins 0.000 description 1
- 201000000522 chronic kidney disease Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
Images
Description
【特許請求の範囲】
【請求項1】
アダプタから共有メモリへのアクセスに障害が発生した場合に、他の接続手段を使用して同一共有メモリへアクセスし、そのアクセス結果より故障部位を判定し、その判定した故障部位を切り離す情報処理装置の障害処理方法。
【請求項2】
アダプタから共有メモリへのアクセスに障害が発生した場合に、障害情報を採取し故障部位が明らかなときにはその部分を閉鎖し、明らかでない場合にはアクセスを再トライし、再度障害が発生したときには他の接続手段を使用して同一共有メモリへアクセスし、そのアクセス結果と故障部位を判定するためのテーブルを比較し障害部位を判定し、その判定した故障部位を切り離す情報処理装置の障害処理方法。
【請求項3】
上位装置と接続するためのチャネル接続系と、このチャネル接続系経由で前記上位装置からのコマンドを受け付けるチャネルアダプタと、このチャネルアダプタに接続され前記上位装置へのデータを一時的に格納するキャッシュメモリと、前記チャネルアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記共有メモリとを互いに複数の接続手段で接続した記憶制御装置。
【請求項4】
データを格納するディスクアレイと、上位装置に送る際にデータを一時的に格納するキャッシュメモリと、前記ディスクアレイから前記キャッシュディスクにデータを転送するディスクアダプタと、前記ディスクアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記ディスクアダプタと前記共有メモリとを互いに複数の接続手段で接続した記憶制御装置。
【請求項5】
上位装置と接続するためのチャネル接続系と、このチャネル接続系経由で前記上位装置からのコマンドを受け付けるチャネルアダプタと、このチャネルアダプタに接続され前記上位装置へのデータを一時的に格納するキャッシュメモリと、前記チャネルアダプタに接続され前記キャッシュメモリに格納しているデータを管理する第1の共有メモリと第2の共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記第1の共有メモリと、前記チャネルアダプタと前記第2の共有メモリと、を互いに複数の接続手段で接続した記憶制御装置。
【請求項6】
データを格納するディスクアレイと、上位装置に送る際にデータを一時的に格納するキャッシュメモリと、前記ディスクアレイから前記キャッシュディスクにデータを転送するディスクアダプタと、前記ディスクアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記第1の共有メモリと、前記チャネルアダプタと前記第2の共有メモリと、を互いに複数の接続手段で接続した記憶制御装置。
【請求項7】
前記チャネルアダプタまたは前記ディスクアダプタのプロセッサは、処理を行う際に前記共有メモリにロック付きのアクセス命令を出し処理終了後にはロック解除を行う請求項3ないし請求項6のいずれか一つに記載の記憶制御装置。
【請求項1】
アダプタから共有メモリへのアクセスに障害が発生した場合に、他の接続手段を使用して同一共有メモリへアクセスし、そのアクセス結果より故障部位を判定し、その判定した故障部位を切り離す情報処理装置の障害処理方法。
【請求項2】
アダプタから共有メモリへのアクセスに障害が発生した場合に、障害情報を採取し故障部位が明らかなときにはその部分を閉鎖し、明らかでない場合にはアクセスを再トライし、再度障害が発生したときには他の接続手段を使用して同一共有メモリへアクセスし、そのアクセス結果と故障部位を判定するためのテーブルを比較し障害部位を判定し、その判定した故障部位を切り離す情報処理装置の障害処理方法。
【請求項3】
上位装置と接続するためのチャネル接続系と、このチャネル接続系経由で前記上位装置からのコマンドを受け付けるチャネルアダプタと、このチャネルアダプタに接続され前記上位装置へのデータを一時的に格納するキャッシュメモリと、前記チャネルアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記共有メモリとを互いに複数の接続手段で接続した記憶制御装置。
【請求項4】
データを格納するディスクアレイと、上位装置に送る際にデータを一時的に格納するキャッシュメモリと、前記ディスクアレイから前記キャッシュディスクにデータを転送するディスクアダプタと、前記ディスクアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記ディスクアダプタと前記共有メモリとを互いに複数の接続手段で接続した記憶制御装置。
【請求項5】
上位装置と接続するためのチャネル接続系と、このチャネル接続系経由で前記上位装置からのコマンドを受け付けるチャネルアダプタと、このチャネルアダプタに接続され前記上位装置へのデータを一時的に格納するキャッシュメモリと、前記チャネルアダプタに接続され前記キャッシュメモリに格納しているデータを管理する第1の共有メモリと第2の共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記第1の共有メモリと、前記チャネルアダプタと前記第2の共有メモリと、を互いに複数の接続手段で接続した記憶制御装置。
【請求項6】
データを格納するディスクアレイと、上位装置に送る際にデータを一時的に格納するキャッシュメモリと、前記ディスクアレイから前記キャッシュディスクにデータを転送するディスクアダプタと、前記ディスクアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記第1の共有メモリと、前記チャネルアダプタと前記第2の共有メモリと、を互いに複数の接続手段で接続した記憶制御装置。
【請求項7】
前記チャネルアダプタまたは前記ディスクアダプタのプロセッサは、処理を行う際に前記共有メモリにロック付きのアクセス命令を出し処理終了後にはロック解除を行う請求項3ないし請求項6のいずれか一つに記載の記憶制御装置。
まず、図1に本発明を適用した記憶装置の実施例の階層を表すシステム概略図を示す。上位装置であるホストコンピュータ(図示せず)に接続するチャネル接続系1、入出力データを一時的に格納するキャッシュメモリ2、チャネル接続系1とキャッシュメモリ2間のデータ転送を制御するチャネルアダプタ(以下CHAと称する)3、データを蓄積する記憶媒体であるディスクアレイ4、キャッシュメモリ2とディスクアレイ4間のデータ転送を制御するディスクアダプタ(以下DKAと称する)5、CHA3とDKA3との間に設けられ、後述する共有メモリ6から構成される。
図1は概念的な略図であるので詳細な接続を示すものではなく、実際にはキャッシュメモリ2と共有メモリ6は一つのCHA(またはDKA)と接続をしている。尚、チャネル接続系としては例えば、メインフレーム系のホストコンピュータ(CKDデータフォーマット)と接続の場合にはチャネル制御装置、UNIX系のコンピュータ(FBAデータフォーマット)の場合にはSCSIバス制御装置が挙げられる。また、ファイバチャネルを用いた制御装置でもよい。
次に、DKA12のプロセッサからアクセスパス35を経由し、共有メモリ22へのアクセス時に、ハード故障によりアクセスエラーが発生した場合のフォールトトレラント制御について説明する。
まず、障害発生時のハード情報から故障部位が明確に判定可能なケースが存在する。例えば、いまDKA12内のプロセッサ内部の故障であると判定できれば、DKA12をシステムから引き離し、残り他のDKA内のプロセッサでシステム動作を継続する。また例えば、障害情報から共有メモリ22内部の故障であると判定できれば、共有メモリ22をシステムから切り離し、共有メモリ21を用いてシステム動作を継続する。
しかし、複数のハード構成部位からなるシステムで、障害時の情報のみで故障部位が明確的にわからない場合が考えられる。例えば、DKA12内のプロセッサがアクセスパス35を用いて、共有メモリ22へのライトアクセスにタイムアウトが発生し、正常終了が報告されない場合が発生したとする。DKA12内のプロセッサの故障により、ライト命令が共有メモリ22の制御部に伝わらなかったのか、共有メモリ22の故障により、正常終了の報告ができなかったか、或いはアクセスパス35の故障により情報の伝達が正常にできなかったかを、タイムアウトが発生したという事実だけでは明確的に判別できない。
具体的には、DKA12で障害を検出したら、アクセスパス35を経由した共有メモリ22へのアクセス、アクセスパス36を経由した共有メモリ22へのアクセス、アクセスパス37を経由した共有メモリ21へのアクセス、アクセスパス38を経由した共有メモリ21へのアクセスをそれぞれ試行する。以上4パターンのアクセスが、それぞれ正常に行えたかどうかの結果を用いて故障部位を判定する。
例えば、ここでアクセスパス35を経由して、共有メモリ22へのアクセス時のみに障害が発生し、アクセスパス36から共有メモリ22へのアクセス時は、正常にアクセス可能だとすれば、アクセスパス35のみの故障であると判定し、アクセスパス35の使用を停止し、以降は、保守作業によってアクセスパス35が回復される迄、DKA12から共有メモリ22へのアクセスはアクセスパス36の経路から行う。
また、例えば、アクセスパス35及び36から共有メモリ22へのアクセスが両方失敗し、アクセスパス37及び38を経由した共有メモリ21へは、正常にアクセス可能だとすれば、共有メモリ22の故障に起因する障害であると判定して、共有メモリ22の閉塞を行う。以降は、保守作業によって共有メモリ22が回復されるまで、各プロセッサは、共有メモリ22を使用せず、情報の伝達等は共有メモリ21を用いて行う。
更に、アクセスパス35及び36から共有メモリ22へのアクセス、アクセス37及び38から共有メモリ21へのアクセスが、全ての経路で正常にアクセスできないのだとすれば、DKA12回りに故障があるものと判定し、当該プロセッサの閉塞を行う。
【0054】
【発明の効果】
マルチプロセッサを持つ情報処理装置において、性能面と信頼性が両立可能な接続手段を提供することができる。
【発明の効果】
マルチプロセッサを持つ情報処理装置において、性能面と信頼性が両立可能な接続手段を提供することができる。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35725498A JP4132322B2 (ja) | 1998-12-16 | 1998-12-16 | 記憶制御装置およびその制御方法 |
EP99117283A EP1011047B1 (en) | 1998-12-16 | 1999-09-02 | Fault recovery method and storage controller in information processing apparatus |
DE69939050T DE69939050D1 (de) | 1998-12-16 | 1999-09-02 | Fehlerkorrekturverfahren und Speichersteuergerät in einer Datenverarbeitungsvorrichtung |
US10/600,828 US7302606B2 (en) | 1998-12-16 | 2003-06-23 | Fault recovery method and a storage controller in an information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35725498A JP4132322B2 (ja) | 1998-12-16 | 1998-12-16 | 記憶制御装置およびその制御方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000181887A JP2000181887A (ja) | 2000-06-30 |
JP2000181887A5 true JP2000181887A5 (ja) | 2006-01-12 |
JP4132322B2 JP4132322B2 (ja) | 2008-08-13 |
Family
ID=18453188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35725498A Expired - Fee Related JP4132322B2 (ja) | 1998-12-16 | 1998-12-16 | 記憶制御装置およびその制御方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7302606B2 (ja) |
EP (1) | EP1011047B1 (ja) |
JP (1) | JP4132322B2 (ja) |
DE (1) | DE69939050D1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003288279A (ja) | 2002-03-28 | 2003-10-10 | Hitachi Ltd | 記憶装置間の障害検出方法、及びこれに用いられる記憶装置 |
US7565566B2 (en) * | 2003-04-23 | 2009-07-21 | Dot Hill Systems Corporation | Network storage appliance with an integrated switch |
US7401254B2 (en) * | 2003-04-23 | 2008-07-15 | Dot Hill Systems Corporation | Apparatus and method for a server deterministically killing a redundant server integrated within the same network storage appliance chassis |
WO2004095304A1 (en) * | 2003-04-23 | 2004-11-04 | Dot Hill Systems Corporation | Network storage appliance with integrated redundant servers and storage controllers |
US7627780B2 (en) | 2003-04-23 | 2009-12-01 | Dot Hill Systems Corporation | Apparatus and method for deterministically performing active-active failover of redundant servers in a network storage appliance |
JP4454299B2 (ja) | 2003-12-15 | 2010-04-21 | 株式会社日立製作所 | ディスクアレイ装置及びディスクアレイ装置の保守方法 |
US7450959B2 (en) * | 2003-12-31 | 2008-11-11 | Qualcomm Incorporated | Wireless multiprocessor system-on-chip with unified memory and fault inhibitor |
JP4585217B2 (ja) * | 2004-03-29 | 2010-11-24 | 株式会社日立製作所 | ストレージシステムおよびその制御方法 |
JP2006244123A (ja) * | 2005-03-03 | 2006-09-14 | Fujitsu Ltd | データストレージシステム及びデータストレージ制御装置 |
JP4461485B2 (ja) * | 2005-04-05 | 2010-05-12 | 株式会社ジェイテクト | 分散制御装置 |
JP4645278B2 (ja) | 2005-04-15 | 2011-03-09 | ソニー株式会社 | 光信号処理装置 |
US7590885B2 (en) * | 2005-04-26 | 2009-09-15 | Hewlett-Packard Development Company, L.P. | Method and system of copying memory from a source processor to a target processor by duplicating memory writes |
JP4414399B2 (ja) * | 2006-01-30 | 2010-02-10 | 富士通株式会社 | ディスク制御装置 |
US8055856B2 (en) * | 2008-03-24 | 2011-11-08 | Nvidia Corporation | Lock mechanism to enable atomic updates to shared memory |
JP5966243B2 (ja) | 2010-12-20 | 2016-08-10 | 富士通株式会社 | ストレージ装置及びストレージ装置の制御方法 |
US9021214B2 (en) * | 2011-12-14 | 2015-04-28 | Hitachi, Ltd. | Storage system and method for controlling memory in storage system |
US20150248320A1 (en) * | 2014-02-28 | 2015-09-03 | Red Hat Israel, Ltd. | Host-storage connectivity monitoring |
US10514859B2 (en) | 2017-05-08 | 2019-12-24 | International Business Machines Corporation | Reduction of processing overhead for point in time copy to allow access to time locked data |
US10514721B2 (en) | 2017-05-08 | 2019-12-24 | International Business Machines Corporation | Validation of clock to provide security for time locked data |
US10528435B2 (en) * | 2017-05-08 | 2020-01-07 | International Business Machines Corporation | Performance efficient time locks on data in a storage controller |
US10489080B2 (en) | 2017-05-08 | 2019-11-26 | International Business Machines Corporation | Point in time copy of time locked data in a storage controller |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3623014A (en) | 1969-08-25 | 1971-11-23 | Control Data Corp | Computer communications system |
US5680574A (en) * | 1990-02-26 | 1997-10-21 | Hitachi, Ltd. | Data distribution utilizing a master disk unit for fetching and for writing to remaining disk units |
US5155845A (en) | 1990-06-15 | 1992-10-13 | Storage Technology Corporation | Data storage system for providing redundant copies of data on different disk drives |
US5638506A (en) | 1991-04-08 | 1997-06-10 | Storage Technology Corporation | Method for logically isolating a cache memory bank from a memory bank group |
US5392425A (en) * | 1991-08-30 | 1995-02-21 | International Business Machines Corporation | Channel-initiated retry and unit check for peripheral devices |
JP2777301B2 (ja) | 1992-01-07 | 1998-07-16 | 三菱電機株式会社 | 記録装置 |
US5581724A (en) | 1992-10-19 | 1996-12-03 | Storage Technology Corporation | Dynamically mapped data storage subsystem having multiple open destage cylinders and method of managing that subsystem |
US5572694A (en) * | 1992-11-25 | 1996-11-05 | Fujitsu Limited | Virtual system for detecting access paths belonging to same group from plurality of access paths to reach device designated by command with reference to table |
US5771367A (en) * | 1992-12-17 | 1998-06-23 | International Business Machines Corporation | Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores |
US5473752A (en) | 1993-03-17 | 1995-12-05 | Detector Electronics Corporation | Fault isolation circuit |
US5390326A (en) | 1993-04-30 | 1995-02-14 | The Foxboro Company | Local area network with fault detection and recovery |
JP3264465B2 (ja) * | 1993-06-30 | 2002-03-11 | 株式会社日立製作所 | 記憶システム |
US5790775A (en) * | 1995-10-23 | 1998-08-04 | Digital Equipment Corporation | Host transparent storage controller failover/failback of SCSI targets and associated units |
JP3628777B2 (ja) * | 1995-10-30 | 2005-03-16 | 株式会社日立製作所 | 外部記憶装置 |
US6032271A (en) | 1996-06-05 | 2000-02-29 | Compaq Computer Corporation | Method and apparatus for identifying faulty devices in a computer system |
JP3581765B2 (ja) | 1996-09-20 | 2004-10-27 | 株式会社日立コミュニケーションテクノロジー | 複合リング形ネットワークシステムにおけるパス切替方法及び装置 |
US5890219A (en) | 1996-11-27 | 1999-03-30 | Emc Corporation | Redundant writing of data to cached storage system |
US5862308A (en) * | 1996-12-03 | 1999-01-19 | Bull Hn Information Systems Inc. | Fault intercept and resolution process independent of operating system |
-
1998
- 1998-12-16 JP JP35725498A patent/JP4132322B2/ja not_active Expired - Fee Related
-
1999
- 1999-09-02 DE DE69939050T patent/DE69939050D1/de not_active Expired - Fee Related
- 1999-09-02 EP EP99117283A patent/EP1011047B1/en not_active Expired - Lifetime
-
2003
- 2003-06-23 US US10/600,828 patent/US7302606B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000181887A5 (ja) | ||
US7600152B2 (en) | Configuring cache memory from a storage controller | |
JP3264465B2 (ja) | 記憶システム | |
US7269690B2 (en) | Disk array device and data processing method thereof | |
US7185222B2 (en) | Apparatus, system, and method for maintaining data in a storage array | |
US6006342A (en) | Failover and failback system for a direct access storage device | |
JP4107083B2 (ja) | 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム | |
JP2728108B2 (ja) | 記憶装置制御装置 | |
US6678788B1 (en) | Data type and topological data categorization and ordering for a mass storage system | |
US6691209B1 (en) | Topological data categorization and formatting for a mass storage system | |
US6604171B1 (en) | Managing a cache memory | |
US6591335B1 (en) | Fault tolerant dual cache system | |
TWI291103B (en) | Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system | |
JP4132322B2 (ja) | 記憶制御装置およびその制御方法 | |
US20040172489A1 (en) | Storage system and disconnecting method of a faulty storage device | |
JP2005196490A (ja) | データ多重化のためのシステム及び方法 | |
JP4796251B2 (ja) | ネットワークストレージシステム及びその制御方法 | |
US7752340B1 (en) | Atomic command retry in a data storage system | |
US7529776B2 (en) | Multiple copy track stage recovery in a data storage system | |
US9542273B2 (en) | Storage control apparatus, storage control system, and storage control method for failure detection and configuration of cascaded storage cabinets | |
US7302526B1 (en) | Handling memory faults for mirrored memory | |
US7472221B1 (en) | Mirrored memory | |
JP3288071B2 (ja) | 情報変換処理装置および情報転送制御方法 | |
JPH11338646A (ja) | ディスクアレイ装置 | |
KR20010011204A (ko) | 캐쉬미러링을 통한 레이드 장애극복 방법 및 장치 |