TWI291103B - Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system - Google Patents

Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system Download PDF

Info

Publication number
TWI291103B
TWI291103B TW093113003A TW93113003A TWI291103B TW I291103 B TWI291103 B TW I291103B TW 093113003 A TW093113003 A TW 093113003A TW 93113003 A TW93113003 A TW 93113003A TW I291103 B TWI291103 B TW I291103B
Authority
TW
Taiwan
Prior art keywords
cluster
data
reserved area
modified
storage device
Prior art date
Application number
TW093113003A
Other languages
English (en)
Other versions
TW200506636A (en
Inventor
Yu-Cheng Hsu
Vernon J Legvold
Michael H Hartung
Michael T Benhase
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of TW200506636A publication Critical patent/TW200506636A/zh
Application granted granted Critical
Publication of TWI291103B publication Critical patent/TWI291103B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

1291103 九、發明說明: 【發明所屬之技術領域】 本發明一般係關於儲存子系統領域,而特定言之係關於 管理該資料傳輸以防止若一多叢集系統之一叢集在一功率 損失或其他可比較事件後未能恢復而產生之一損失。 【先前技術】 在大型分佈式計算系統中,一般藉由一 Μ存控制器而將 若干主機電腦連接至若干直接存取儲存裝置 (direct access storage device ; DASD),例如磁帶或磁碟驅動單元。 除其他功能以外,該儲存控制器處置一特定電腦與一 DASD 之間的連接與斷開以用於傳輸一資料記錄。此外,該儲存 控制器將資料儲存於電子記憶體中以用於較快輸入及輸出 操作。 國際商用機器(International Business Machines ; IBM) 公司(紐約州阿蒙克市(Armonk,N.Y))之企業級儲存伺 月艮器(Enterprise Storage Server™ ; ESS)係控制磁碟單元 與主機電腦之間的連接之一儲存控制器。該等主機電腦一 般為大型主機系統,例如,IBM 3090TM、ES/9000⑧型或其 他可比較系統。 一典型的IBM儲存控制器能處置來自主機電腦的多達十 六個通道以及多達六十四個磁儲存單元。經由一至四個通 道而將該等主機電腦連接至該儲存控制器。一儲存控制器 一般具有二儲存叢集,每一叢集提供一主機電腦與一直接 存取儲存裝置之間的選擇性連接且每一叢集較佳均位於一 93013.doc 1291103 分離功率邊界上H集可能包括具有第-與第二儲存 夕路仨儲存導引盗、一共享控制陣列(— array ; SCA)、一快取記憶體以及一非揮發性 路徑之 control (顺,latile storage ; NVS)儲存記憶體。該sca係共享於 所有儲存路徑之一記憶體陣列。 快取記憶體最為人熟知者係其應用為電腦記憶體之一附 件,其中其係作為一高速儲存器而用於頻繁存取之指令及 資料將自;k最後使用—記錄以來之時間長度用作使用頻 率之^曰示為。快取$己憶體與系統記憶體之不同在於其内 合自最後使用之時間點起老化。在一電腦記憶體位址空間 中,在該位址空間中競爭空間之資料獲得存取之前必須釋 放程式貧料。在快取記憶體中,空間的競爭導致在資料成 為最近使用最少之資料時,該快取記憶體便失去該等資 料。而當非頻繁存取之資料週期性地進入快取記憶體時, 其往往將「老化」而快取記憶體便失去該等資料。在非揮 發性g己憶體中全部或部分複製快取記憶體中的資料。從該 等直接存取儲存裝置之磁媒體讀取資料(以及向該磁媒體 寫入資料)係相當耗時的。在放慢該等讀取及寫入操作之 因素中’該磁碟將一記錄位置對準一轉換器所需之時間以 及用於讀取及寫入該等資料之磁轉換器之有限頻寬係其中 之因素。藉由複製快取記憶體中頻繁存取之資料,資料之 "貝取時間減少而資料儲存系統通量大大增加。 在每一叢集中,非揮發性儲存器充當用於該缓衝功能之 快取記憶體之一備份(參見圖3)。存取NVS比存取一直接存 93013.doc 1291103 取錯存裝置更快,但-般比快取記憶體更慢。將資料分支 給快取記憶體以及給NVS以在功率故障情況下備份該快取 L己憶體。處理寫人NVS之資料,就像寫人磁雜—樣安全。 、、二將一貝料§己錄分級給Nvs,便向該主機電腦發出成功 儲存該資料之一指示。 般將一傳統的儲存控制單元設計成使得該單元中無單 :故障點將引起整個系統之—故障。但是,特定組件之故 ^將引起該控制單元性能之一下降。快取記憶體中之一故 障,例如,-般引起此類性能故障。不幸的係,主機系統 已調諸而因此依賴於由一完全功能性快取記憶體所提供之 速度,而使得與快取記憶體中之一故障相關之性能下降具 有與一單一故障點相同之效果。 安例如,藉由1995年7月25日發佈的一般指定美國專利申請 水第5’437,022就之發明’其名稱為「具有額外快取記憶體 與用於故障恢復並回應其故障而為其重新配置一控制單元 之構件的儲存控制器」,講述此項技術中對一種用於消除與 :關的快取記憶體中之一故障相關之一館存控制單元之性 月匕下降之系統及技術之需要,以引用方式將該案併入本 文。其中,該申請案中之發明提供具有二快取記情體、二 非揮發性儲存緩衝器之一儲存控制器。一叢集之则記I 體備伤另-叢集之一快取記憶體,例如經由一處理器(來 見圖句。該儲存控制器亦包括用於故障恢復並回應其故障 而重新配置其控制單元之微碼。在實行DASD快速寫入時, 將邊寻寫入資料同時傳輸進入該快取記憶體及聰。將該 93013.doc 1291103 系統設計成即使在發生快取記憶體或NVS之一故障時亦提 供延#的功能操作(例如,DASD快速寫入及雙重複製)之 連績可用性。(DASD快速寫入係其中將欲寫入該儲存装置 之貧料寫入快取記憶體並備份於非揮發性記憶體之一操 作。雙重複製包括指定及保留資料供以後備份至一儲存裝 置。)其他關於提鬲儲存子系統之強固性並減少在發生一組 件故障情況下的性能下降之一般指定專利案包括·· 1999年 12月21日發佈的第6,006,342號美國專利案,其名稱為「故 障回復及故障轉移系統或一直接存取儲存裝置」,以及a% 年6月23曰發佈的美國專利案第5,771,367號,其名稱為「使 用交叉耦合快取記憶體及非揮發性儲存器而用於經改進之 故障恢復之儲存控制器及方法」,該等二專利案均以引用的 方式併入於本文。 儘管NVS在發生-功率故障時將保持諸,但—缺點係 NVS需要一特別㈣電池支持之記憶體子系统,該子系统 切加-儲存控制器之成本。不採用则之一技術係讓每 叢集在發生-功率㈣時將整個快取記憶體傳輸給磁碟 (參見圖5)。當功率得到復原時,可從該磁碟復原該快取記 憶體。但是,此類「消防水帶傾卸」方法之一缺點係處理 該傳輸所需之電池功率量與欲保護之記憶體大小成比例。 因此’在具有一很大快取記憶體之一系統中’該消防水帶 傾卸方法係不經濟的。 此外,右該等叢集之-叢集在該功率故障後未能恢復, 則該資料處理系統之客戶可能不能獲得包括經修改資料在 93013.doc -10- 1291103 内的特定資料部分。 因此’仍然需要-用於在-功率故障或可比較事件發生 之情況下保護資料(尤其係經修改之資料)而無一由特殊 電池支持之記憶體子系統且即使—叢集未能復原亦防止資 料損失之系統及技術。 、 【發明内容】 士發明之系統及方法解決此項技術中之需要。該儲存控 制盗包括用於將資料從一主機電腦導引至一儲存裝置之— 弟一叢集,以及用於將資料從一主機電腦導引至一儲存裝 置之-第二叢集。該第一叢集包括—第一快取記憶體、二 弟一記憶體保留區域以及一第一磁碟裝置;該第二叢集包 括-第二快取記憶體、一第二記憶體保留區域以及一第: 磁=裝置。在-正常操作模式中,將該第一叢集中之經修 改貧料引至該第-快取記憶體並備份至該第二保留區域 (在該第二叢集中)。同樣地,將第二叢集中之經修改資料導 引至該第二快取記憶體並備份至該第-保留區在該第 叢术中)。右發生一功率故障,則將經修改資料從該第一 保留區域複製到該第—磁碟裝置以及從該第二保留區域複 製到該第二磁碟裝置。此外,亦將經修改資料從該第一保 留區域複製到該第二磁碟裝置以及從該第二保留區域複製 到該第-磁碟裝置。因此,^該等叢集之—叢集在該功$ 故障後未能恢復,料經由另—叢集而獲得來自該故 集之經修改資料。 【實施方式】 93013.doc 1291103 圖1係一包括其中可實施本發 ^ 之儲存子糸統之資斜 處理系統100之一高階方塊圖。 、+ 糸、、先10〇包括一或更多主 故電腦⑽、-或更多儲存裝置(例如直接存取儲存穿置 (duect access storage device ; DASD) 等主機電腦1G2與該等儲存裝置⑽之間的資料傳輸之一 ^ 存控制器200。圖2係分成叢集(例如叢集〇2i〇與叢集工22〇) 之儲存控制器2GG之-方塊圖。儘管可將該儲存控制器· 分成二個以上叢集’且本發明同樣適用於具有任何數目叢 集之-儲存控制器,但基於簡潔之目@,本文僅說明並將 論述二叢集。每一叢集21〇與22〇包括經由其而附著主機電 织02^_接$211與221’以及經由其而附著該等儲存 裝置(例如,DASD 104A及104B)之裝置配接器212與222。 母叢木210與220進一步包括:經程式化以管理該叢集中 之操作之一處理器213及223,在相對應的裝置配接器212 及222與處理器213及223之間之一裝置配接器匯流排214與 224,躺合至該處理器213及223之快取記憶體215及225,以 及亦輕合至該處理器213及223之記憶體保留區域216及 226。一主機配接器橋23〇將該等叢集210與22〇互連。 圖6係本發明之一方法之一流程圖,將參考圖7至9對其進 行論述。在一正常操作模式中(步驟600),該儲存控制器2〇〇 將儲存於儲存裝置1〇4中而欲由一主機電腦1〇2存取之資料 指派給該等叢集21〇或220之一叢集(步驟602)並將該等資料 傳輸進入一快取記憶體215或225(步驟604)。若僅由該主機 電腦102讀取該等資料,則不需要進一步行動來保護該等資 93013.doc -12- 1291103 ,:一功率故障將^會影響㈣存裝置1G4中所儲存之該等 貝枓之原始副本。但是,若該主機電腦1〇2修改該等資料 (步驟_),本發明便提供保護(圖7)。將該第一叢集㈣之 快取記憶體215中的經修改資料複製進該第二叢集2 2 〇之保 留區域226。同樣地(但未說明),將該第二叢集22〇之快取 記憶體225中的經修改資料複製進該第一叢集加之保留區 域216(步驟608)。儘管該等保留區域216及咖可為傳統的由 電池支持之NVS,但該等保留區域216與咖可替代性地為 每-叢集210與220之常規記憶體之一指定部分。可按需要 調整分配給該等保留區域216與226之記憶體大小以容:所 處理之經修改資料量。應明白,昂貴的㈣數量可能不容 易改交,會需要添加或移除記憶體模組及相關的備份電 路以及重新酉己置該等叢集以識別該㈣。而1,可能有會 阻止該NVS數量增加超過—規定大小之特定限制。僅保: 經修改資料大大降低該電池要求。 若發生一功率損失或其他可比較事件(圖8A,·步驟610), 則忒儲存控制|§ 200將繼續在一短期電池下操作而該處理 态213將會指示··將儲存於叢集〇21〇之保留區域216中的所 有資料均保存到一附著磁碟1〇4A中(步驟612)。同樣,該處 理器223將會指示:將儲存於叢集122〇之保留區域226中的 所有貧料均保存至一附著磁碟1〇43中(步驟614)。此外,該 處理器213將會指示··將儲存於叢集〇22〇之保留區域216中 的所有資料暫時儲存於叢集! 22〇之保留區域226中(或更普 通之記憶體228中)(圖8B),隨後保存至該附著磁碟1〇4八(圖 93013.doc -13- 1291103 8C ;步驟616)。同樣,該處理器223將會指示:將儲存於叢 集1 220之保留區域226中的所有資料暫時儲存於叢集〇 21〇 之保留區域216中(或更普通之記憶體218中),隨後保存至該 附著磁碟104B(步驟618)。從而,二叢集210與220均將保持 來自二叢集210與220之經修改資料之永久副本。 在该功率損失結束之後,則嘗試將該儲存控制器200復原 至正常操作(步驟620)。若二叢集210與220得到完全復原(步 驟622) ’則將恢復正常操作而無資料損失(步驟Μ*)。若一 叢集(例如,叢集1 220)喪失其初始微碼載入序列或者未能 從該功率損失恢復(步驟626),則另一叢集(本範例中的叢集 0 210)便可繼續處理其自己的資料(從該磁碟入恢復)以 及來自該故障叢集220之資料(亦從該磁碟1〇4A恢復)(圖 9,步驟628)。在修復該故障叢集22〇(步驟63〇)後,便可恢 復正常的二叢集操作(步驟624)。 經由本文所揭示之具體實施例已完全實現本發明之目 =。熟習此項技術者將明白,可經由不同的具體實施例來 只現本發明之各方面而不脫離本發明之關鍵功能。該等特 定具體實施例係說明性而並非意欲限制以下中請專利範圍 中斤提出的本發明之範疇。例如,儘管係在一個二叢集儲 存拴制杰之情況下對本發明進行說明,但本發明亦可實施 於具有一個以上叢集之一儲存控制器中。在一此類具體實 施,中H率故障或其他可比較事件發生之情況下,、 將母一叢集之保留區域複製到每一叢集之附著磁碟,從 而’即使除—叢料的所有叢集皆未能恢復,纟亦保護經 93013.doc -14- 1291103 修改資料。或者,叢隼 ^ 成對以相互支援。相對於先前的 〆、體貝施例’後來的呈妒每 /、例會減小資料保護所需之磁 碟二間、邏輯及時間的量。 【圖式簡單說明】 '係包括其中可貫施本發明之—儲存子系、統之資料 處理系統之方塊圖; 圖2係其中可實施本發明之—儲存子系統之方塊圖; =3係說明—非揮發性儲存器保持—叢集快取記憶體之 令之^ #像的先丽技術儲存子系統之資料流之方塊圖; 圖4係說明――叢集之非揮發性儲存器保持另—叢集之 、取。己L體之至少-些内容的先前技術儲存子系統之資料 流之方塊圖; 圖5係w兄明功率故障後實行「消防水帶傾卸」之先前技 術儲存子系統之方塊圖; 圖6係本發明之一方法之流程圖; 圖7係說明在一正常操作模< 中本發明之一儲存子系統 之資料流之方塊圖; 圖8 A係說明在一功率故障後,在一故障模式中之一第一 v驟中圖7之儲存子系統之資料流之方塊圖; 圖8B係說明在一功率故障後,在一故障模式中之一第二 步驟中圖7之儲存子系統之資料流之方塊圖; 圖8C係說明在一功率故障後,在一故障模式中之一第三 步驟中圖7之儲存子系統之資料流之方塊圖;以及 圖9係說明在該等叢集之一叢集未能從該功率故障恢復 93013.doc -15- 1291103 之後,在一經修改操作模式中圖7之儲存子系統之資料流之 方塊圖。 【主要元件符號說明】 100 資料處理系統 102 主機電腦 104 直接存取儲存裝置 200 儲存控制器 210 叢集 211 主機配接器 212 裝置配接器 213 處理器 214 裝置配接器匯流排 215 快取記憶體 216 記憶體之一保留區域 218 記憶體 220 叢集 221 主機配接器 222 裝置配接器 223 處理器 224 裝置配接器匯流排 225 快取記憶體 226 記憶體之一保留區域 228 更普通之記憶體 230 主機配接器橋 93013.doc -16· 1291103 600 步驟 602 步驟 604 步驟 606 步驟 608 步驟 610 步驟 612 步驟 614 步驟 616 步驟 618 步驟 620 步驟 624 步驟 626 步驟 628 步驟 630 步驟 104A 直接存取儲存裝置 104B 直接存取儲存裝置 93013.doc 17

Claims (1)

1291觀咖號㈣請荦一r — 中文申請專利範圍替換本(96年5月) 十、申請專利範圍·· * 1· 一種用於多叢隼儲在 木減存子糸統之自動功率損失恢復之方 法,該方法包含: $正吊知作模式中,導引一第一叢集中之第一經修 改資料儲存於該第-業 ^ 禾一最集之—記憶體保留區域中; 在該正常操作模式中, 笛_ f隹士 >外 等引一弟一叢集中之第二經修 改:痛存於該第—叢集之—記憶體保留區域中; 一:工力率故障模式中,導弓丨該第一經修改資料儲存於 一弟一儲存裝置中; =6亥功率故障模式中,導弓丨該第二經修改資料儲存於 一第二儲存裝置中; 在該功率故障模式中, ^ 一 ^ T等引忒弟—經修改資料從該第 一最杲之該保留區域偯齡 尚^ Α得輸至该第二儲存裝置;以及 在該功率故障模式中, 一業隹—斗 導引1亥弟—經修改資料從該第 叢集之该保留區域傳輸至該第一儲存裝置. 從而,若該第一或第二叢 二, i κ. ^ 果之叢集在一功率故障後 未此恢设,則可經由另一叢 _ .. y. 最集而&件來自該故障叢隼之 该經修改資料。 平敢果之 2·如申請專利範圍第1項之方法,直中. 障模式中,該第-經修改資料從該第 -:=保留區域傳輪至該第二輝存裝置包含: 等W δ亥第一經修改資料從該第一 輸至嗲篦-釁隹 集之该保留區域傳 亥弟一叢集之該保留區域;以及 導引該第一經修改資料從該第二 敬集之該保留區域傳 93013-960503.doc 1291103 輸至該第二儲存裝置;以及 在忒功率故障模式中,導引該第二經修改資料從該第 一叢集之該保留區域傳輸至該第一儲存裝置包含: 導引該第二經修改資料從該第二叢集之該保留區域傳 輸,-叢集之該第一保留區域;以& 導引該第:經修改資料從該第—叢集之該保留區域傳 輸至該第一儲存裝置。 3.如申請專利範圍第1項之方法,其進一步包含: 調整該第—叢集之該保留區域之容量,以容納該等第 一與第二經修改資料;以及 調整該第二叢集之該保留區域之容量,以容納該等 一與第二經修改資料 第 4.如申請專利範圍第㈤之方法,其進_以+ : 將暫時的非揮發性構件提 ^ y …、,口 °亥弟一叢集之該保留區 域’從而保留所儲存在兮楚 ±t #在^ —叢集之該保留區域中的資 枓直至將此類資料傳輸給該第—儲存裝置;以& 、 將暫時的非揮發性構件提 砧捉仏,、,口 °亥弟—叢集之該保留區 域’從而保留所儲存在該第— 弟一叢集之该保留區域中的資 科直至將此類資料傳輸給該第:儲存裝置。 、 5.如申請專利範圍第旧之方法,其進一步包含· 在:功率故障模式之結束後,嘗試將該等第一與第二 叢集復原至該正常操作模式;以及 若僅復原該等第一或第 集之一叢集,則在 改操作模式中操作該資料處理㈣,從而所復原之則 93013-960503.doc -2- 1291103 年與##修走)正替換訇 6. 集貫行該故障叢集之功能。 一種用於多叢集儲存子系統 控制器,其包含·· 之自動功率損失恢復 之儲存 第叢集,其用於導引資料在一主機電腦與 裝置之間的傳輸,該第一叢集包含·· :存 一第一快取記憶體; 一第一記憶體保留區域; 一第一磁碟裝置; 一第一叢集,其用於導引資料在一主機電腦與一 裝置之間的傳輸,該第二叢集包含: :子 一第二快取記憶體; 一第二記憶體保留區域; 弟一磁碟裝置; 用於在一正常操作模式中導引第一經修改資料 該第二叢集之該保留區域中之構件; ; 用於在該正常操作模式中導引第二經修改資料儲 该第一叢集之該保留區域中之構件; ; 用於在一功率故障模式中導引該第一經修改資料儲存 於该第一磁碟裝置中之構件; 用於在"亥功率故障模式巾導引該第三經修改資料儲存 於該第二磁碟裝置中之構件; :在亥功率故(I早模式中導引該第一經修改資料從該 第一叢集之该保留區域傳輸至該第二磁碟裝置之構件· 以及 ^ 93013-960503.doc i i 年月 0 l29ll〇3 第::在6亥功率故障模式中導引該第二經修改資料從該 "广集之該保留區域傳輸至該第一磁碟裝置之構件; 未二二若該第一或第二叢集之-叢集在-功率故障後 二料則可經由另一叢集而獲得來自該故障叢集之 η 如申請專利範圍第6項之儲存控制器,其中: 而::::Γ保:區域包含暫時的非揮發性構件,從 ' H亥第—5己憶體保留區域巾的f料直至將 此類諸傳輸給該第-磁碟裝置;以及貝抖直至將 二,-錢體保留區域包含暫時的非揮發性構件,從 4所儲存在該第二記憶體保留區域 此類資料傳輸給該第二磁碟裝置。 、枓直至將 8.如申請專利範圍第6項之儲存控制器,其進一步包a : 用於调整該第—叢集之該S冑區域之容旦 — 等第一與第二經修改資料之構件;以及里’以谷納該 用於調整該第二叢集之該保留區域之容s ^ 等第-與第二經修改資料之構件。…以谷納該 9·如申請專利範圍第6項之儲存控制器,其進—步包人. 叢=率故障模式之結束後,嘗試將該等第—I第_ 叢集设原至該正常操作模式之構件;以及 -弟- 若僅復原該等第一或第二叢隼 修改操作模式中操作該資料處理系統,從=其^一經 該叢集實行該故障叢集之功能之構件。 戶斤设原之 A一種用於多叢集儲存子系統之自動功率損失恢復之儲存 93013-960503.doc *.-Λ 1291103 控制系統,其包含 至少一主機電腦 至少一儲存裝置 一儲存控制器,其包含·· 第叢集’其用於導引資料在一主機電腦與_儲 存裝置之間的傳輸,該第一叢集包含: 一第一快取記憶體; 一第一記憶體保留區域; 一弟一磁碟裝置; 第一叢集’其用於導引資料在一主機電腦與一儲存 裝置之間的傳輸,該第二叢集包含: 一第二快取記憶體; 一第二記憶體保留區域; 一弟一磁碟裝置; 用於在一正常操作模式中導引第一經修改資料儲存於 5亥弟一保留區域中之構件; 用於在一正常操作模式中導引第二經修改資料儲存於 δ亥弟一保留區域中之構件; 用於在一功率故障模式中導引該第一經修改資料儲存 於該第一磁碟裝置中之構件; 用於在该功率故障模式中導引該第二經修改 於該第二磁碟裝置中之構件; 子 用;在4功率故障模式中導引該第_經修改資料 第二叢集之該保留區域傳輸至該第二磁碟裝置之構件 93013-960503.doc -5- 1291103 以及 π π隹琢功罕 ^ 丨 α丨丨乡队負科從哕 弟一叢集之該保留區域傳輸至該第一磁碟裝置之構件Μ 從而,若該第一或第二叢集之一叢集在一功率故障 未能恢復,則可經由另-叢集而獲得來自該故障叢 4等經修改資料。 〃 u.如申請專利範圍第1G項之儲存控制系統,其中: 該第一記憶體保留區域包含暫時的非揮發性構件 而保留所儲存在該第—記憶體保留區域中的資料直至: 此類資料傳輸給該第一磁碟裝置;以及 、 該第二記憶體保留區域包含暫時的非揮發性構件 而保留所儲存在該第二記憶體保留區域中的資料直至將 此類資料傳輸給該第二磁碟裝置。 貝抖直至將 12·如切專利範圍第1G項之儲存控制系統,其進-步包含: 用於调整該第一叢集之該保留 暮装 .^ 田匕靖之合里,以容納該 寻弟一與弟二經修改資料之構件;以及 等第」:整4第一叢集之該保留區域之容量,以容納該 一 一第二經修改資料之構件。 13·如申請專利範圍第1()項之儲存控制系統,其進—步包含. 2該功率故障模式之結束後,嘗試將該等第-與第二 叢集设原至該正常操作模式之構件;以及 若僅復原該等第一哎第-業隹+ _ 佟…, 叢集之一叢集,則其在-經 ^改#作模式中操作該 j f隹— 仔径制系統,從而使所復原之 ^叢集貫行該故障叢集之功能之構件。 93013-960503.doc 1291103
1 種電腦可碩取記錄媒體,其上記錄了用於多叢集儲存 子系、、充之自動功率損失恢復之電腦可執行指令,該等電 腦可執行指令實行以下步驟: j 一正常操作模式中,導引一第一叢集中之第一經修 改貝料儲存於該第二叢集之一記憶體保留區域中,· 在该正常操作模式中,導引一第二叢集中之第二經修 改 > 料儲存於該第一叢集之一記憶體保留區域中; 在一功率故障模式中,導引該第一經修改資料儲存於 一第一儲存裝置中; 在忒功率故障模式中,導引該第二經修改資料儲存於 一第一儲存裝置中; 在该功率故障模式中,導引該第一經修改資料從該第 一叢集之該保留區域傳輸至該第二儲存裝置;以及 在該功率故障模式中,導引該第二經修改資料從該第 叢集之5亥保留區域傳輸至該第一館存裝置; =而,若該第一或第二叢集之一叢集在一功率故障後 未能恢復,則可經由另一叢集而獲得來自該故障叢集之 該等經修改資料。 / 15·如申請專利範圍第14項之記錄媒體,其 指令進一步實行以下步驟: 了執仃 在忒功率故障模式中,導引該第一經修改資料從該第 二叢集之該保留區域傳輸至該第二儲存裴置其包含: 導引該第一經修改資料從該第—叢集之該保留區域 傳輸至该第二叢集之該保留區域;以及 如$ 93013-960503.doc -7- 1291103 >r 導引該第一經修改資料從該第二叢集之該保留區域 傳輸至該第二儲存裝置;以及 在該功率故障模式中,導引該第二經修改資料從該第 一叢集之該保留區域傳輸至該第一儲存裝置包含: 導引該第二經修改資料從該第二叢集之該保留區域 傳輸至該第一叢集之該保留區域;以及 導引該第二經修改資料從該第一叢集之該保留區域 傳輸至該第一儲存裝置。 16. 17. 18. 如申請專利範圍第14項之記錄媒體,其中該電腦可執行 指令進一步實行以下步驟: 调整該第一叢集之該保留區域之容量,以容納該等第 一與笫一經修改資料;以及 調整該第二叢集之該保留區域之容量,以容納該等第 一與第二經修改資料。 如申請專利範圍第14項之記錄媒體,其中該電腦可執行 指令進一步實行以下步驟: 將暫時的非揮發性構件提供給該第一叢集之該保留區 域,從而保留所儲存在該第一叢集之該保留區域中的資 料直至將此類資料傳輸給該第一儲存裝置;以及 、 將暫時的非揮發性構件提供給該第二叢集之該保留區 域,從而保留所儲存在該第二叢集之該保留區域中的資 料直至將此類資料傳輸給該第二儲存裝置。 如申請專利範圍第14項之記錄媒體,其中該電腦可執行 指令進一步實行以下步驟: τ 93013-960503.doc -8 - 1291103 年月止替換頁 在該功率故障模式之結束後,嘗試將該等第一與第二 叢集復原至該正常操作模式; 若僅復原該等第一或第二叢集之一叢集,則在一經修 改操作模式中操作該資料處理系統,從而所復原之該叢 集實行該故障叢集之功能。 93013-960503.doc 9-
TW093113003A 2003-05-28 2004-05-07 Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system TWI291103B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/446,911 US7085886B2 (en) 2003-05-28 2003-05-28 Autonomic power loss recovery for a multi-cluster storage sub-system

Publications (2)

Publication Number Publication Date
TW200506636A TW200506636A (en) 2005-02-16
TWI291103B true TWI291103B (en) 2007-12-11

Family

ID=33510324

Family Applications (1)

Application Number Title Priority Date Filing Date
TW093113003A TWI291103B (en) 2003-05-28 2004-05-07 Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system

Country Status (5)

Country Link
US (1) US7085886B2 (zh)
JP (1) JP4041473B2 (zh)
KR (1) KR100621446B1 (zh)
CN (1) CN1300696C (zh)
TW (1) TWI291103B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI586127B (zh) * 2012-02-20 2017-06-01 F5網路公司 具有改良之故障處理之多片式網路流量管理設備及其方法

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047231B2 (en) 2003-10-16 2015-06-02 International Business Machines Corporation Apparatus system and method for deterministically transferring data by rebooting to a data transfer kernel
KR100608012B1 (ko) * 2004-11-05 2006-08-02 삼성전자주식회사 데이터 백업 방법 및 장치
US7406624B2 (en) * 2005-02-15 2008-07-29 General Motors Corporation Method for responding to a control module failure
US20070118693A1 (en) * 2005-11-19 2007-05-24 International Business Machines Cor Method, apparatus and computer program product for cache restoration in a storage system
US8090987B2 (en) * 2005-12-05 2012-01-03 Lg Electronics Inc. Imaging apparatus having automatic backup function and method for controlling the same
US7715307B2 (en) * 2005-12-13 2010-05-11 Alcatel Lucent Communication connection control systems and methods
US7444541B2 (en) * 2006-06-30 2008-10-28 Seagate Technology Llc Failover and failback of write cache data in dual active controllers
US7694031B2 (en) * 2006-10-31 2010-04-06 Globalfoundries Inc. Memory controller including a dual-mode memory interconnect
US7680982B2 (en) * 2007-02-20 2010-03-16 International Business Machines Corporation Preservation of cache data following failover
US7761680B2 (en) * 2007-04-03 2010-07-20 International Business Machines Corporation Copying data from a first cluster to a second cluster to reassign storage areas from the first cluster to the second cluster
JP4977554B2 (ja) * 2007-08-22 2012-07-18 株式会社日立製作所 キャッシュメモリ上のデータをバックアップする機能を備えたストレージシステム
US7861048B2 (en) * 2007-11-14 2010-12-28 Infineon Technologies Ag Method and arrangement for processing a file
JP2009146169A (ja) * 2007-12-14 2009-07-02 Fujitsu Ltd ストレージシステム、ストレージ装置、データバックアップ方法
US7975169B2 (en) * 2008-06-03 2011-07-05 International Business Machines Corporation Memory preserved cache to prevent data loss
US7895465B2 (en) * 2008-06-03 2011-02-22 International Business Machines Corporation Memory preserved cache failsafe reboot mechanism
US8325554B2 (en) * 2008-07-10 2012-12-04 Sanmina-Sci Corporation Battery-less cache memory module with integrated backup
US8055846B2 (en) 2008-08-15 2011-11-08 International Business Machines Corporation Data vaulting in emergency shutdown
US8621569B1 (en) * 2009-04-01 2013-12-31 Netapp Inc. Intercluster relationship management
JP6291776B2 (ja) * 2013-10-11 2018-03-14 富士通株式会社 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム
US9459676B2 (en) 2013-10-28 2016-10-04 International Business Machines Corporation Data storage device control with power hazard mode
CN103605620B (zh) * 2013-11-28 2017-01-11 北京华胜天成科技股份有限公司 一种集群存储数据保护方法及装置
EP2937785B1 (en) 2014-04-25 2016-08-24 Fujitsu Limited A method of recovering application data
US9489149B2 (en) 2014-06-16 2016-11-08 Netapp, Inc. Methods and systems for using a write cache in a storage system
US9836359B2 (en) * 2014-07-11 2017-12-05 Hitachi, Ltd. Storage and control method of the same
US11550676B2 (en) * 2018-09-06 2023-01-10 International Business Machines Corporation Hardware-management-console-initiated data protection
US11416147B2 (en) * 2018-09-06 2022-08-16 International Business Machines Corporation Rack-power-controller-initiated data protection

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5454099A (en) 1989-07-25 1995-09-26 International Business Machines Corporation CPU implemented method for backing up modified data sets in non-volatile store for recovery in the event of CPU failure
JP2888401B2 (ja) 1992-08-03 1999-05-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 冗長ディスクドライブアレイに対する同期方法
CA2086874E (en) * 1992-08-03 2000-01-04 Renzo Mauro Canetta Methods for administration of taxol
DE4241494A1 (de) * 1992-12-09 1994-06-16 Emitec Emissionstechnologie Verfahren zur Steuerung der Aufheizung eines elektrisch beheizbaren katalytischen Konverters
US5640530A (en) 1992-12-17 1997-06-17 International Business Machines Corporation Use of configuration registers to control access to multiple caches and nonvolatile stores
US5437022A (en) 1992-12-17 1995-07-25 International Business Machines Corporation Storage controller having additional cache memory and a means for recovering from failure and reconfiguring a control unit thereof in response thereto
US5771367A (en) * 1992-12-17 1998-06-23 International Business Machines Corporation Storage controller and method for improved failure recovery using cross-coupled cache memories and nonvolatile stores
JPH06282386A (ja) 1993-03-25 1994-10-07 Toshiba Corp ディスク記憶装置
US5548711A (en) 1993-08-26 1996-08-20 Emc Corporation Method and apparatus for fault tolerant fast writes through buffer dumping
US5586291A (en) 1994-12-23 1996-12-17 Emc Corporation Disk controller with volatile and non-volatile cache memories
EP0721162A2 (en) 1995-01-06 1996-07-10 Hewlett-Packard Company Mirrored memory dual controller disk storage system
US5682513A (en) 1995-03-31 1997-10-28 International Business Machines Corporation Cache queue entry linking for DASD record updates
US5588110A (en) 1995-05-23 1996-12-24 Symbios Logic Inc. Method for transferring data between two devices that insures data recovery in the event of a fault
WO1997001139A1 (en) 1995-06-23 1997-01-09 Elonex Plc Disk array controller with enhanced synchronous write
US5774643A (en) 1995-10-13 1998-06-30 Digital Equipment Corporation Enhanced raid write hole protection and recovery
US5870537A (en) 1996-03-13 1999-02-09 International Business Machines Corporation Concurrent switch to shadowed device for storage controller and device errors
US5968182A (en) 1997-05-12 1999-10-19 International Business Machines Corporation Method and means for utilizing device long busy response for resolving detected anomalies at the lowest level in a hierarchical, demand/response storage management subsystem
US6006342A (en) * 1997-12-11 1999-12-21 International Business Machines Corporation Failover and failback system for a direct access storage device
US6173374B1 (en) * 1998-02-11 2001-01-09 Lsi Logic Corporation System and method for peer-to-peer accelerated I/O shipping between host bus adapters in clustered computer network
US6324654B1 (en) 1998-03-30 2001-11-27 Legato Systems, Inc. Computer network remote data mirroring system
US6438661B1 (en) 1999-03-03 2002-08-20 International Business Machines Corporation Method, system, and program for managing meta data in a storage system and rebuilding lost meta data in cache
US6378037B1 (en) 1999-06-29 2002-04-23 International Business Machines Corporation Write-twice method of fail-safe write caching
US7043504B1 (en) * 2000-04-10 2006-05-09 International Business Machines Corporation System and method for parallel primary and secondary backup reading in recovery of multiple shared database data sets
JP3640349B2 (ja) 2001-07-10 2005-04-20 インターナショナル・ビジネス・マシーンズ・コーポレーション クラスタリング・システムおよびクラスタリング・システムにおける障害発生時のデータ復旧方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI586127B (zh) * 2012-02-20 2017-06-01 F5網路公司 具有改良之故障處理之多片式網路流量管理設備及其方法

Also Published As

Publication number Publication date
JP2004355623A (ja) 2004-12-16
JP4041473B2 (ja) 2008-01-30
US7085886B2 (en) 2006-08-01
KR100621446B1 (ko) 2006-09-08
CN1300696C (zh) 2007-02-14
US20040255181A1 (en) 2004-12-16
CN1573705A (zh) 2005-02-02
KR20040104391A (ko) 2004-12-10
TW200506636A (en) 2005-02-16

Similar Documents

Publication Publication Date Title
TWI291103B (en) Method, storage controller, system, and computer-readable recording medium for autonomic power loss recovery for a multi-cluster storage sub-system
US7260695B2 (en) Scanning modified data during power loss
JP2728108B2 (ja) 記憶装置制御装置
US7600152B2 (en) Configuring cache memory from a storage controller
US7269690B2 (en) Disk array device and data processing method thereof
US7669008B2 (en) Destage management of redundant data copies
US6006342A (en) Failover and failback system for a direct access storage device
US7975168B2 (en) Storage system executing parallel correction write
US7107486B2 (en) Restore method for backup
US8074035B1 (en) System and method for using multivolume snapshots for online data backup
US6513097B1 (en) Method and system for maintaining information about modified data in cache in a storage system for use during a system failure
US7925831B2 (en) Disk array apparatus and disk array apparatus control method
US6604171B1 (en) Managing a cache memory
JPH08305500A (ja) 記憶制御装置、それを含むデータ記憶システムおよび二重ペア抑止方法
US6591335B1 (en) Fault tolerant dual cache system
US7216210B2 (en) Data I/O system using a plurality of mirror volumes
US7293138B1 (en) Method and apparatus for raid on memory
JP2000181887A5 (zh)
US6931499B2 (en) Method and apparatus for copying data between storage volumes of storage systems
JP2005122453A (ja) ストレージ装置のディスクコントローラ制御方式およびストレージ装置
KR100881803B1 (ko) 기억 장치, 데이터 배치 방법 및 프로그램
US7219256B2 (en) Method and apparatus for controlling data storage within a data storage system

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees