JP2000181887A5 - - Google Patents

Download PDF

Info

Publication number
JP2000181887A5
JP2000181887A5 JP1998357254A JP35725498A JP2000181887A5 JP 2000181887 A5 JP2000181887 A5 JP 2000181887A5 JP 1998357254 A JP1998357254 A JP 1998357254A JP 35725498 A JP35725498 A JP 35725498A JP 2000181887 A5 JP2000181887 A5 JP 2000181887A5
Authority
JP
Japan
Prior art keywords
shared memory
access
failure
adapter
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1998357254A
Other languages
English (en)
Other versions
JP4132322B2 (ja
JP2000181887A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP35725498A priority Critical patent/JP4132322B2/ja
Priority claimed from JP35725498A external-priority patent/JP4132322B2/ja
Priority to EP99117283A priority patent/EP1011047B1/en
Priority to DE69939050T priority patent/DE69939050D1/de
Publication of JP2000181887A publication Critical patent/JP2000181887A/ja
Priority to US10/600,828 priority patent/US7302606B2/en
Publication of JP2000181887A5 publication Critical patent/JP2000181887A5/ja
Application granted granted Critical
Publication of JP4132322B2 publication Critical patent/JP4132322B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【特許請求の範囲】
【請求項1】
アダプタから共有メモリへのアクセスに障害が発生した場合に、他の接続手段を使用して同一共有メモリへアクセスし、そのアクセス結果より故障部位を判定し、その判定した故障部位を切り離す情報処理装置の障害処理方法。
【請求項2】
アダプタから共有メモリへのアクセスに障害が発生した場合に、障害情報を採取し故障部位が明らかなときにはその部分を閉鎖し、明らかでない場合にはアクセスを再トライし、再度障害が発生したときには他の接続手段を使用して同一共有メモリへアクセスし、そのアクセス結果と故障部位を判定するためのテーブルを比較し障害部位を判定し、その判定した故障部位を切り離す情報処理装置の障害処理方法。
【請求項3】
上位装置と接続するためのチャネル接続系と、このチャネル接続系経由で前記上位装置からのコマンドを受け付けるチャネルアダプタと、このチャネルアダプタに接続され前記上位装置へのデータを一時的に格納するキャッシュメモリと、前記チャネルアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記共有メモリとを互いに複数の接続手段で接続した記憶制御装置。
【請求項4】
データを格納するディスクアレイと、上位装置に送る際にデータを一時的に格納するキャッシュメモリと、前記ディスクアレイから前記キャッシュディスクにデータを転送するディスクアダプタと、前記ディスクアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記ディスクアダプタと前記共有メモリとを互いに複数の接続手段で接続した記憶制御装置。
請求項5
上位装置と接続するためのチャネル接続系と、このチャネル接続系経由で前記上位装置からのコマンドを受け付けるチャネルアダプタと、このチャネルアダプタに接続され前記上位装置へのデータを一時的に格納するキャッシュメモリと、前記チャネルアダプタに接続され前記キャッシュメモリに格納しているデータを管理する第1の共有メモリと第2の共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記第1の共有メモリと、前記チャネルアダプタと前記第2の共有メモリと、を互いに複数の接続手段で接続した記憶制御装置。
請求項6
データを格納するディスクアレイと、上位装置に送る際にデータを一時的に格納するキャッシュメモリと、前記ディスクアレイから前記キャッシュディスクにデータを転送するディスクアダプタと、前記ディスクアダプタに接続され前記キャッシュメモリに格納しているデータを管理する共有メモリとを備えた記憶制御装置において、
前記チャネルアダプタと前記第1の共有メモリと、前記チャネルアダプタと前記第2の共有メモリと、を互いに複数の接続手段で接続した記憶制御装置。
請求項7
前記チャネルアダプタまたは前記ディスクアダプタのプロセッサは、処理を行う際に前記共有メモリにロック付きのアクセス命令を出し処理終了後にはロック解除を行う請求項3ないし請求項6のいずれか一つに記載の記憶制御装置。
まず、図1に本発明を適用した記憶装置の実施例の階層を表すシステム概略図を示す。上位装置であるホストコンピュータ(図示せず)に接続するチャネル接続系1、入出力データを一時的に格納するキャッシュメモリ2、チャネル接続系1とキャッシュメモリ2間のデータ転送を制御するチャネルアダプタ(以下CHAと称する)3、データを蓄積する記憶媒体であるディスクアレイ4、キャッシュメモリ2とディスクアレイ4間のデータ転送を制御するディスクアダプタ(以下DKAと称する)5、CHA3とDKA3との間に設けられ、後述する共有メモリ6から構成される。
図1は概念的な略図であるので詳細な接続を示すものではなく、実際にはキャッシュメモリ2と共有メモリ6は一つのCHA(またはDKA)接続をしている。尚、チャネル接続系としては例えば、メインフレーム系のホストコンピュータ(CKDデータフォーマット)と接続の場合にはチャネル制御装置、UNIX系のコンピュータ(FBAデータフォーマット)の場合にはSCSIバス制御装置が挙げられる。また、ファイバチャネルを用いた制御装置でもよい。
次に、DKA12のプロセッサからアクセスパス35を経由し、共有メモリ22へのアクセス時に、ハード故障によりアクセスエラーが発生した場合のフォールトトレラント制御について説明する。
まず、障害発生時のハード情報から故障部位が明確に判定可能なケースが存在する。例えば、いまDKA12内のプロセッサ内部の故障であると判定できれば、DKA12をシステムから引き離し、残り他のDKA内のプロセッサでシステム動作を継続する。また例えば、障害情報から共有メモリ22内部の故障であると判定できれば、共有メモリ22をシステムから切り離し、共有メモリ21を用いてシステム動作を継続する。
しかし、複数のハード構成部位からなるシステムで、障害時の情報のみで故障部位が明確的にわからない場合が考えられる。例えば、DKA12内のプロセッサがアクセスパス35を用いて、共有メモリ22へのライトアクセスにタイムアウトが発生し、正常終了が報告されない場合が発生したとする。DKA12内のプロセッサの故障により、ライト命令が共有メモリ22の制御部に伝わらなかったのか、共有メモリ22の故障により、正常終了の報告ができなかったか、或いはアクセスパス35の故障により情報の伝達が正常にできなかったかを、タイムアウトが発生したという事実だけでは明確的に判別できない。
具体的には、DKA12で障害を検出したら、アクセスパス35を経由した共有メモリ22へのアクセス、アクセスパス36を経由した共有メモリ22へのアクセス、アクセスパス37を経由した共有メモリ21へのアクセス、アクセスパス38を経由した共有メモリ21へのアクセスをそれぞれ試行する。以上4パターンのアクセスが、それぞれ正常に行えたかどうかの結果を用いて故障部位を判定する。
例えば、ここでアクセスパス35を経由して、共有メモリ22へのアクセス時のみに障害が発生し、アクセスパス36から共有メモリ22へのアクセス時は、正常にアクセス可能だとすれば、アクセスパス35のみの故障であると判定し、アクセスパス35の使用を停止し、以降は、保守作業によってアクセスパス35が回復される迄、DKA12から共有メモリ22へのアクセスはアクセスパス36の経路から行う。
また、例えば、アクセスパス35及び36から共有メモリ22へのアクセスが両方失敗し、アクセスパス37及び38を経由した共有メモリ21へは、正常にアクセス可能だとすれば、共有メモリ22の故障に起因する障害であると判定して、共有メモリ22の閉塞を行う。以降は、保守作業によって共有メモリ22が回復されるまで、各プロセッサは、共有メモリ22を使用せず、情報の伝達等は共有メモリ21を用いて行う。
更に、アクセスパス35及び36から共有メモリ22へのアクセス、アクセス37及び38から共有メモリ21へのアクセスが、全ての経路で正常にアクセスできないのだとすれば、DKA12回りに故障があるものと判定し、当該プロセッサの閉塞を行う。
【0054】
【発明の効果】
マルチプロセッサを持つ情報処理装置において、性能面と信頼性が両立可能な接続手段を提供することができる
JP35725498A 1998-12-16 1998-12-16 記憶制御装置およびその制御方法 Expired - Fee Related JP4132322B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP35725498A JP4132322B2 (ja) 1998-12-16 1998-12-16 記憶制御装置およびその制御方法
EP99117283A EP1011047B1 (en) 1998-12-16 1999-09-02 Fault recovery method and storage controller in information processing apparatus
DE69939050T DE69939050D1 (de) 1998-12-16 1999-09-02 Fehlerkorrekturverfahren und Speichersteuergerät in einer Datenverarbeitungsvorrichtung
US10/600,828 US7302606B2 (en) 1998-12-16 2003-06-23 Fault recovery method and a storage controller in an information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35725498A JP4132322B2 (ja) 1998-12-16 1998-12-16 記憶制御装置およびその制御方法

Publications (3)

Publication Number Publication Date
JP2000181887A JP2000181887A (ja) 2000-06-30
JP2000181887A5 true JP2000181887A5 (ja) 2006-01-12
JP4132322B2 JP4132322B2 (ja) 2008-08-13

Family

ID=18453188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35725498A Expired - Fee Related JP4132322B2 (ja) 1998-12-16 1998-12-16 記憶制御装置およびその制御方法

Country Status (4)

Country Link
US (1) US7302606B2 (ja)
EP (1) EP1011047B1 (ja)
JP (1) JP4132322B2 (ja)
DE (1) DE69939050D1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003288279A (ja) 2002-03-28 2003-10-10 Hitachi Ltd 記憶装置間の障害検出方法、及びこれに用いられる記憶装置
US7565566B2 (en) * 2003-04-23 2009-07-21 Dot Hill Systems Corporation Network storage appliance with an integrated switch
US7401254B2 (en) * 2003-04-23 2008-07-15 Dot Hill Systems Corporation Apparatus and method for a server deterministically killing a redundant server integrated within the same network storage appliance chassis
WO2004095304A1 (en) * 2003-04-23 2004-11-04 Dot Hill Systems Corporation Network storage appliance with integrated redundant servers and storage controllers
US7627780B2 (en) 2003-04-23 2009-12-01 Dot Hill Systems Corporation Apparatus and method for deterministically performing active-active failover of redundant servers in a network storage appliance
JP4454299B2 (ja) 2003-12-15 2010-04-21 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の保守方法
US7450959B2 (en) * 2003-12-31 2008-11-11 Qualcomm Incorporated Wireless multiprocessor system-on-chip with unified memory and fault inhibitor
JP4585217B2 (ja) * 2004-03-29 2010-11-24 株式会社日立製作所 ストレージシステムおよびその制御方法
JP2006244123A (ja) * 2005-03-03 2006-09-14 Fujitsu Ltd データストレージシステム及びデータストレージ制御装置
JP4461485B2 (ja) * 2005-04-05 2010-05-12 株式会社ジェイテクト 分散制御装置
JP4645278B2 (ja) 2005-04-15 2011-03-09 ソニー株式会社 光信号処理装置
US7590885B2 (en) * 2005-04-26 2009-09-15 Hewlett-Packard Development Company, L.P. Method and system of copying memory from a source processor to a target processor by duplicating memory writes
JP4414399B2 (ja) * 2006-01-30 2010-02-10 富士通株式会社 ディスク制御装置
US8055856B2 (en) * 2008-03-24 2011-11-08 Nvidia Corporation Lock mechanism to enable atomic updates to shared memory
JP5966243B2 (ja) 2010-12-20 2016-08-10 富士通株式会社 ストレージ装置及びストレージ装置の制御方法
US9021214B2 (en) * 2011-12-14 2015-04-28 Hitachi, Ltd. Storage system and method for controlling memory in storage system
US20150248320A1 (en) * 2014-02-28 2015-09-03 Red Hat Israel, Ltd. Host-storage connectivity monitoring
US10514859B2 (en) 2017-05-08 2019-12-24 International Business Machines Corporation Reduction of processing overhead for point in time copy to allow access to time locked data
US10514721B2 (en) 2017-05-08 2019-12-24 International Business Machines Corporation Validation of clock to provide security for time locked data
US10528435B2 (en) * 2017-05-08 2020-01-07 International Business Machines Corporation Performance efficient time locks on data in a storage controller
US10489080B2 (en) 2017-05-08 2019-11-26 International Business Machines Corporation Point in time copy of time locked data in a storage controller

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3623014A (en) 1969-08-25 1971-11-23 Control Data Corp Computer communications system
US5680574A (en) * 1990-02-26 1997-10-21 Hitachi, Ltd. Data distribution utilizing a master disk unit for fetching and for writing to remaining disk units
US5155845A (en) 1990-06-15 1992-10-13 Storage Technology Corporation Data storage system for providing redundant copies of data on different disk drives
US5638506A (en) 1991-04-08 1997-06-10 Storage Technology Corporation Method for logically isolating a cache memory bank from a memory bank group
US5392425A (en) * 1991-08-30 1995-02-21 International Business Machines Corporation Channel-initiated retry and unit check for peripheral devices
JP2777301B2 (ja) 1992-01-07 1998-07-16 三菱電機株式会社 記録装置
US5581724A (en) 1992-10-19 1996-12-03 Storage Technology Corporation Dynamically mapped data storage subsystem having multiple open destage cylinders and method of managing that subsystem
US5572694A (en) * 1992-11-25 1996-11-05 Fujitsu Limited Virtual system for detecting access paths belonging to same group from plurality of access paths to reach device designated by command with reference to table
US5771367A (en) * 1992-12-17 1998-06-23 International Business Machines Corporation Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
US5473752A (en) 1993-03-17 1995-12-05 Detector Electronics Corporation Fault isolation circuit
US5390326A (en) 1993-04-30 1995-02-14 The Foxboro Company Local area network with fault detection and recovery
JP3264465B2 (ja) * 1993-06-30 2002-03-11 株式会社日立製作所 記憶システム
US5790775A (en) * 1995-10-23 1998-08-04 Digital Equipment Corporation Host transparent storage controller failover/failback of SCSI targets and associated units
JP3628777B2 (ja) * 1995-10-30 2005-03-16 株式会社日立製作所 外部記憶装置
US6032271A (en) 1996-06-05 2000-02-29 Compaq Computer Corporation Method and apparatus for identifying faulty devices in a computer system
JP3581765B2 (ja) 1996-09-20 2004-10-27 株式会社日立コミュニケーションテクノロジー 複合リング形ネットワークシステムにおけるパス切替方法及び装置
US5890219A (en) 1996-11-27 1999-03-30 Emc Corporation Redundant writing of data to cached storage system
US5862308A (en) * 1996-12-03 1999-01-19 Bull Hn Information Systems Inc. Fault intercept and resolution process independent of operating system

Similar Documents

Publication Publication Date Title
JP2000181887A5 (ja)
US7600152B2 (en) Configuring cache memory from a storage controller
JP3264465B2 (ja) 記憶システム
US7269690B2 (en) Disk array device and data processing method thereof
US7185222B2 (en) Apparatus, system, and method for maintaining data in a storage array
US6006342A (en) Failover and failback system for a direct access storage device
JP4107083B2 (ja) 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム
JP2728108B2 (ja) 記憶装置制御装置
US6678788B1 (en) Data type and topological data categorization and ordering for a mass storage system
US6691209B1 (en) Topological data categorization and formatting for a mass storage system
US6604171B1 (en) Managing a cache memory
US6591335B1 (en) Fault tolerant dual cache system
TWI291103B (en) Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system
JP4132322B2 (ja) 記憶制御装置およびその制御方法
US20040172489A1 (en) Storage system and disconnecting method of a faulty storage device
JP2005196490A (ja) データ多重化のためのシステム及び方法
JP4796251B2 (ja) ネットワークストレージシステム及びその制御方法
US7752340B1 (en) Atomic command retry in a data storage system
US7529776B2 (en) Multiple copy track stage recovery in a data storage system
US9542273B2 (en) Storage control apparatus, storage control system, and storage control method for failure detection and configuration of cascaded storage cabinets
US7302526B1 (en) Handling memory faults for mirrored memory
US7472221B1 (en) Mirrored memory
JP3288071B2 (ja) 情報変換処理装置および情報転送制御方法
JPH11338646A (ja) ディスクアレイ装置
KR20010011204A (ko) 캐쉬미러링을 통한 레이드 장애극복 방법 및 장치