TW201306632A - 用於服務之回復服務位置 - Google Patents

用於服務之回復服務位置 Download PDF

Info

Publication number
TW201306632A
TW201306632A TW101116227A TW101116227A TW201306632A TW 201306632 A TW201306632 A TW 201306632A TW 101116227 A TW101116227 A TW 101116227A TW 101116227 A TW101116227 A TW 101116227A TW 201306632 A TW201306632 A TW 201306632A
Authority
TW
Taiwan
Prior art keywords
service
location
backup
primary
secondary location
Prior art date
Application number
TW101116227A
Other languages
English (en)
Other versions
TWI561099B (en
Inventor
Viktoriya Taranov
Alexander Hopmann
Silva Jr Antonio Marcos Da
Nikita Voronkov
Kai Yiu Luk
Ramanathan Somasundaram
Artsiom Kokhan
Siddharth Rajendra Shah
Daniel Blood
Bhavesh Doshi
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of TW201306632A publication Critical patent/TW201306632A/zh
Application granted granted Critical
Publication of TWI561099B publication Critical patent/TWI561099B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

網路的次要位置作為對於服務主要位置的回復網路。次要位置被維持於暖狀態中,並經配置以在發生失效切換時代替主要位置。在一般作業期間,主要位置活動地服務使用者負載並執行備份,備份包含被自動複製至次要位置的完整備份、遞增備份與交易日誌。資訊(例如時間、重試次數)被儲存而可被用以支援判定何時備份被正確地回復在次要位置。在次要位置備份被回復且交易日誌被重播,以反映對主要位置所做的改變(內容與行政管理)。在失效切換至次要位置之後,次要位置成為主要位置並開始活動地服務使用者負載。

Description

用於服務之回復服務位置
本發明係關於用於服務之回復服務位置。
以網頁為基礎的服務,包含位在網頁伺服器上的檔案以及儲存在資料庫中的資料。例如,存在大量的伺服器以處理被導向服務的訊務。在一些情況中,服務可毀滅性地失效,而使工作遺失。將作業轉移到新的服務可為昂貴且耗時的處理。
本【發明內容】被提供以由簡化形式介紹一些概念選擇,該等概念在以下的【實施方式】中將被進一步說明。本【發明內容】並不意為辨識所主張發明標的之關鍵特徵或必要特徵,亦不意為用以限制所主張發明標的之範疇。
網路的次要位置作為服務主要位置的回復網路。次要位置被維持在暖狀態(warm state)中,並經配置以在發生失效切換(failover)時代替主要位置。在正常作業中,主要位置活動地服務使用者負載,並執行被自動複製至次要位置的備份,備份包含完整備份、遞增備份與交易日 誌。資訊(例如時間、重試次數)被儲存而可被用以支援判定何時備份被正確地回復。在次要位置備份被回復且交易日誌被重播,以反映對主要位置所做的改變(內容與行政管理)。在失效切換至次要位置之後,次要位置成為主要位置並開始活動地服務使用者負載。
現將參照附加圖式來說明各種具體實施例,在圖式中類似的元件符號代表類似的元件。
一般而言,程式模組包含常式、程式、部件、資料結構,以及其他執行特定工作或實施特定抽象資料類型的結構類型。亦可使用其他電腦系統配置,包含手持式裝置、多處理器系統、以微處理器為基礎或可程式化的消費者電子設備、微電腦、主機電腦等等。亦可使用分散式運算環境,其中由透過通訊網路鏈結的遠端處理裝置來執行工作。在分散式運算環境中,可將程式模組放置在本地與遠端記憶體儲存裝置兩者中。
第1圖圖示說明雲端管理系統,雲端管理系統包含用於服務之次要位置的回復網路。本文所使用的術語「服務」,可代表使用單一運算裝置以服務一或多個使用者的單純服務,或是使用上千個分散在世界各地的運算裝置之非常複雜的以雲端為基礎的服務。系統100圖示說明雲端管理器105,雲端管理器105管理並連接至潛在地 分散在世界各地的不同網路。網路的每一者經配置為對一或多個租戶(例如用戶端、顧客)提供內容服務。網路可被容納在雲端服務內,及/或在內部資料中心內。如所圖示說明者,每一主要網路(網路1、網路2)在次要位置(次要網路1、次要網路2)包含回復服務。使用雲端管理器105以佈署、配置並管理網路。雲端管理器經配置以透過冪等(idempotent)與非同步應用程式網路服務應用程式介面(API)150接收要求,API 150可容忍間歇性網路失效。
如所圖示說明者,雲端管理器105包含工作管理器110、機器管理器115、應用程式特定管理器120、腳本130、回復管理器26與中央儲存庫(central repository),諸如資料儲存器140(例如資料庫)。未包含在所圖示說明管理器之一者內的功能性,可位於雲端管理器的一些其他位置。根據一個具體實施例,應用程式管理器120為包含SharePoint特定邏輯的SharePoint租戶管理器。
一般而言,雲端管理器105支援佈署並管理用於線上服務(諸如線上內容管理服務)的網路。雲端管理系統為中央協調服務,該中央協調服務接收要求以執行作業,該作業相關於在用以提供線上服務的網路中配置、更新與執行工作。例如,可呼叫雲端管理器以管理網路(例如伺服器、伺服器場、使用者性質等等)之一或多者內的資產。資產管理可包含佈署機器、更新機器、移除機器、在伺服器上執行配置改變、虛擬機器(VM)、建立並維持 回復網路、以及執行其他相關於管理的工作。雲端管理器經配置以對附接網路提供服務,即使在雲端管理器的更新期間內。雲端管理器經配置以透過無法依賴可靠網路的冪等與非同步應用程式介面(API)接收要求。
如所圖示說明者,網路1與網路2為活動地服務使用者的運轉網路。次要網路1與次要網路2為鏡射對應運轉網路的內容與配置的次要網路。在主要網路為活動中的同時,次要網路並不活動地服務使用者。根據一具體實施例,次要網路被保持為「暖」,而使在發生停電/災害/失效切換時,來自主要網路的使用者負載可被快速地切換至次要網路。
主要網路經配置以執行備份(完整、遞增),備份包含被常規地並經常地執行的SQL交易日誌備份。根據一具體實施例,完整備份為每週執行,遞增備份為每日執行,而交易日誌每五分鐘更新一次(亦可使用其他時間)。來自主要網路(例如網路1與2)的備份在被產生之後,被複製至次要網路(例如次要網路1與2)(例如分散式檔案系統複製(Distributed File System Replication;DFSR))。根據一具體實施例,次要網路在從對應主要網路接收交易日誌時,將交易日誌重播。發生在運轉主要網路上的管理性作業被自動重播在對應暖次要網路上,而使主要網路與次要網路保持為在時間上同步。
工作管理器110管理工作的執行,並致能對於較長之運行中工作的排程與重試。工作管理器110啟動儲存在 工作佇列112中的工作,並保持追蹤運行中工作。在經過了預定時間之後,工作管理器110可自動取消工作,並執行相關於工作的一些進一步的處理。根據一個具體實施例,在工作佇列112中的工作被工作管理器110藉由引動一或多個腳本130來執行。例如,可使用腳本處理語言(諸如Microsoft PowerShell®),來把被工作管理器110執行的工作程式化。每一腳本可被運行為新的處理。在將每一腳本作為新處理來執行而可具有相當高之CPU負擔的同時,此系統為可縮放的,而幫助確保用於每一腳本執行的乾淨環境,並在腳本完成時進行完整清理。
在要於次要位置發送工作時(例如回應於失效切換至次要位置、要被反映於次要網路中的主要網路之配置改變),工作管理器110可用以判定要被發送的工作。例如,工作管理器110可用於判定要被發送以在服務的主要位置執行的工作,並發送對應的工作至次要位置。
機器管理器115經配置以管理網路(例如網路1、網路2、次要網路1、次要網路2)中的實體機器。一般而言,機器管理器115瞭解網路、實體機器、虛擬機器(VM)、虛擬機器映像(VHD)等等。機器管理器並不強烈地繫結至在網路內運行的特定服務,但在「角色」方面保持追蹤網路中的各種部件。例如,機器管理器115可透過API 150被要求在網路2佈署「Foo」類型、版本12.34.56.78的VM。回應於對雲端管理器105的要求,機器管理器 115定位位在網路2上之適合的實體機器,並根據相關聯於VM之角色的VM映像來配置VM。實體機器被以「Foo」類型、版本12.34.56.78的VHD來配置,VHD被儲存在資料儲存器內,諸如資料儲存器140。對次要網路2進行對應的改變。在網路內使用的映像亦可被儲存在其他位置中,諸如用於網路之一或多者的本地資料共享。腳本可被運行以執行在實體機器上安裝VHD,以及執行任何佈署後的配置。機器管理器115保持追蹤每一網路之機器的配置。例如,機器管理器115可保持追蹤VM的角色(VM類型)、VM狀態(供應、運行、停止、失效)、版本以及VM是否存在於給定伺服器場中(此處隱含VM的網路)。
配置資料庫116包含每一網路的地圖。例如,配置資料庫116可包含關於網路的伺服器場、資料庫、網站集合等等的資訊。配置資料庫116對於每一網路可包含對每一實體機器、VM、伺服器場等等的一列。根據一具體實施例,網路內的每一VHD、伺服器場與VM具有相關聯的版本字串。
腳本130經配置以儲存腳本,該等腳本被執行以本地地執行對雲端管理器105的工作,並遠端地在網路之一或多者上執行工作。腳本130之一或多者亦可被儲存於其他位置中。例如,要在網路(例如網路1、網路2)上執行的腳本可被本地地儲存至彼網路。腳本可用於許多不同的目的。例如,腳本可用以執行網路之一或多者中機器的配置、改 變經先前配置機器的設定、增加新VM、增加新資料庫、將資料從一個機器移動至另一個機器、移動租戶、改變模架構等等。根據一個具體實施例,腳本為Microsoft PowerShell®腳本。可使用其他程式化實施。例如,可使用經編譯及/或早期繫結的程式語言來實施功能性。然而,腳本處理為相當精確的表示欲執行之工作之許多者的語言。將均等物以諸如C#的程式語言來程式化,通常將需要更多的冗長實施(verbose implementation)。腳本亦為晚期繫結,表示可將多個下層碼基底版本做為目標,而毋需持續地鏈結至不同的介面DLL。使用PowerShell腳本,允許過程被雲端管理器105本地地啟動,此可相應地在遠端機器(亦即在所附接網路之一者中的實體機器)上啟動過程。亦可使用其他技術以在遠端機器上啟動過程,諸如Secure Shell(SSH)等等。在腳本運行於主要位置(例如網路1)時,腳本亦可被運行在次要位置(例如次要網路2),而使主要位置與次要位置被以相同方式配置。
雲端管理器105所管理的應用程式特定資訊,係由應用程式管理器120執行。根據一個具體實施例,應用程式特定資訊係相關於Microsoft SharePoint®。如此,應用程式管理器120經配置以瞭解SharePoint租戶、網站集合等等。
每一網路可經配置為租戶的專屬網路,及/或配置為服務多於一個用戶端的多重租戶網路。該網路可包含改變數量的實體/虛擬機器,且實體/虛擬機器的配置在佈署 之後亦改變。根據一具體實施例,服務的主要位置與次要位置係以相同方式配置。
一般而言,網路可持續增長,只要未超過網路限制(例如負載平衡器與網路切換器)。例如,網路在啟動時可具有十個伺服器,而隨後可延伸至一百個或更多個伺服器。隨著主要網路改變,對應的次要網路自動改變以反映主要網路的改變。網路內的實體機器可被指派(assign)分類或類型。例如,機器之一些者可為運算機器(用於網頁前端與應用程式伺服器),且其他機器可為提供比運算機器更多儲存的儲存機器。根據一具體實施例,雲端管理器105以映像檔案的多個版本來配置網路內的機器。根據一具體實施例,伺服器場通常具有相同的映像檔案版本。
根據一個具體實施例,軟體限制係由網路內的雲端管理器系統100管理,藉由將機器虛擬化並管理網路內部獨立作用的「伺服器場」。每一網路可包含一或多個伺服器場(例如,見網路1)。根據一個具體實施例,網路被視為網路負載平衡機器的單一叢集,該叢集暴露一或多個VIP(虛擬IP)給外界,並可將VIP訊務選徑至網路內的任意機器。一般而言,網路中的機器係緊密地耦合,並具有最少的潛時(亦即小於1 ms ICMP回音檢查(ping)潛時)。
伺服器場為用以協調需要緊密繫結關係之應用程式的機器基礎分群(grouping)。例如,內容伺服器場可被佈署 在網路之每一者中,以用於內容管理應用程式,諸如Microsoft SharePoint®。一般而言,伺服器場之每一者中的機器集合提供網頁服務與應用程式伺服器功能。伺服器場內部的各機器通常運行相同構造的應用程式(亦即SharePoint),並共享通用配置資料庫以服務特定租戶與網站集合。
伺服器場可包含不均一的虛擬機器集合。雲端管理器105在資料儲存器140中維持「伺服器場目標」,伺服器場目標為對於每一伺服器場之每一角色的目標機器編號。一些角色包含內容前端、內容中央管理員、內容計時器服務、聯合中央管理員、聯合應用程式伺服器等等。例如,內容伺服器場為處理輸入之顧客要求的基本SharePoint伺服器場。聯合服務伺服器場包含可跨伺服器場操作的SharePoint服務,諸如搜尋與設定儲存。伺服器場可用以容納大容量公眾網際網路網站。一些伺服器場可包含活動目錄伺服器分組與供應常駐程式。雲端管理器105自動佈署及/或除役網路中的虛擬機器,以幫助達成所界定的目標。該等伺服器場目標可為自動及/或手動配置。例如,伺服器場目標可改變以回應對於活動與容量需求的改變。網路伺服器場-每一網路存在一個網路伺服器場,網路伺服器場包含可輕易橫向擴張(scale out)而作為整個網路的資源的所有VM角色。
雲端管理器網頁服務API 150係設計為在大量可縮放全域服務的背景中工作。API假定任何網路要求可能失 效及/或停擺在傳輸中。對雲端管理器105的呼叫經配置為冪等。換言之,可對雲端管理器105進行多次相同的呼叫(只要參數相同),而不改變結果。
雲端管理器105維持紀錄以保持追蹤對服務的當前要求。例如,雲端管理器105更新在本地資料庫中的紀錄,且在需要時排程「工作」以在其後執行更長的活動。
雲端管理器105保持追蹤映像(諸如虛擬磁碟映像),映像為用以在網路內佈署新機器的範本。可將映像參照儲存於資料庫中,諸如資料庫140,及/或儲存於一些其他位置。可將映像儲存於一或多個共享資料儲存器中,一或多個共享資料儲存器位於將佈署映像之網路的本地。根據一個具體實施例,每一映像包含虛擬機器(VM)角色類型,該虛擬機器角色類型指定可佈署的VM類型、應使用的處理器數量、將被指派的RAM量、用以尋找附近安裝點的網路ID(使其不會被跨資料中心鏈結重複複製)以及可被佈署碼使用以存取VHD的共享路徑。
一般而言,被雲端系統100管理的網路中的機器,不被傳統方式由下載資料並將資料併入機器上之現存軟體來更新。相反的,機器係由將VHD替換成經更新的VHD來更新。例如,在伺服器場需要新的軟體版本時,已安裝新版本的新伺服器場被佈署。在新伺服器場被佈署時,租戶被從舊伺服器場移動至新伺服器場。以此方式,由更新所造成的停機時間被最小化,且伺服器場中的每 一機器具有已被測試過的相同版本。在虛擬機器需要被更新時,機器上的VM可被刪除並替換成經配置以運行所需服務的VM。
在對於現存軟體的更新不為最佳時,網路內的一些伺服器利用原地(in-place)更新的傳統更新程序。例如,活動目錄域控制器係由更新伺服器上的當前軟體來更新,而不完全替換機器上的映像。雲端管理器亦可在一些實例中原地更新。
根據一個具體實施例,雲端管理器包含記錄系統,記錄系統經配置以對每一網頁服務呼叫記錄日誌項目。記錄系統可被實施為包含如所需般少量/許多的特徵。
映射表114包含相關聯於主要網路的參數(例如識別符及/或秘密)對次要網路的映射。例如,在相關聯於服務之主要位置(例如主要網路1與2)的資料庫、伺服器場與網路,與相關聯於服務之次要位置(例如次要網路1與2)的相應資料庫、伺服器場與網路之間存在映射。
回復管理器26經配置以支援維持網路的次要位置,此次要位置作為對於服務主要位置的回復網路。次要位置被維持在暖狀態中,在暖狀態中的次要位置係經配置以在發生失效切換時替換主要位置。在正常作業中,主要位置活動地服務使用者負載並執行備份,備份包含自動提供給次要位置的完整備份、遞增備份與交易日誌。備份與交易日誌的檔案名稱包含資訊,此資訊可用以支援判定備份何時被正確地回復至次要位置。在次要位置備 份被回復且交易日誌被重播,以反映主要位置的改變(內容與行政管理)。在失效切換至次要位置之後,次要位置成為主要位置,並開始活動地服務使用者負載。
第2圖圖示包含回復網路的系統,回復網路位在服務的次要位置。如圖示說明,系統200包含主要服務210、次要服務220、雲端管理器230與運算裝置240。
所使用的運算裝置可為經配置以執行相關於運算裝置使用之作業的任何類型的運算裝置。例如,一些運算裝置可為:行動運算裝置(例如行動電話、平版電腦、智慧型手機、膝上型電腦等等);一些可為桌上型運算裝置,且其他運算裝置可被配置為伺服器。一些運算裝置可被設置為提供以雲端為基礎的線上服務(例如服務210與服務220),一些運算裝置可被設置為提供資料儲存服務的資料共享,一些運算裝置可被設置於本地網路中,而一些可被設置於可透過網際網路存取的網路中等等。
運算裝置係透過網路18來耦合。網路18可為許多不同類型的網路。例如,網路18可為IP網路、用於蜂巢式通訊的載波網路等等。一般而言,網路18係用以傳送資料於運算裝置之間,諸如服務210、服務220、雲端管理器230與運算裝置240。
運算裝置240包含應用程式242、網頁瀏覽器244與使用者介面246。如圖示說明,運算裝置240係由使用者使用以與線上服務(諸如服務210)互動。根據一具體實施例,服務210與220為多租戶服務。一般而言,多租 戶代表在顧客之間資料(有時包含備份)、使用與管理的隔離。換言之,來自一個顧客(租戶1)的資料不可由另一顧客(租戶2)來存取,即使來自每一租戶的資料可被儲存在相同資料儲存內的相同資料庫內。
使用者介面(UI)246係用以與對於運算裝置240為本地或非本地的各種應用程式互動。可使用一或多種類型的一或多個使用者介面來與內容互動。例如,UI 246可包含使用背景選單、選單列內的選單、選取自緞帶(ribbon)使用者介面的選單項目、圖形選單等等。一般而言,UI 246經配置而讓使用者可輕易與應用程式的功能性互動。例如,使用者可單純地選擇UI 246內的選項,以要求來自服務的動作。
如圖示說明,內容資料儲存器212與212’包含租戶資料,包含對於不同租戶的對應備份資料與日誌。應用程式資料儲存器210包含應用程式資料,包含對於與服務相關聯之不同應用程式的對應備份資料與日誌。資料儲存器可儲存租戶/應用程式資料的所有/部分資料。例如,一些租戶/應用程式可使用多於一個資料儲存器,而其他租戶/應用程式與許多其他租戶/應用程式共享資料儲存器。在對於租戶/應用程式的對應備份資料被圖示說明於相同資料儲存器內時,備份資料可被儲存於其他位置。例如,一個資料儲存器可用以儲存租戶資料,而一或多個其他資料儲存器可用以儲存對應備份資料。類似的,對於一或多個應用程式的備份與日誌可被儲存於不 同的資料儲存器中。一般而言,資料儲存器212’與資料儲存器210’中的資料,為在資料儲存器212與資料儲存器210中的資料的鏡射。
對相關聯於主要服務210之資料(亦即相關於行政管理改變的資料與租戶資料)的改變,被鏡射至次要服務220。根據一具體實施例,完整備份(例如每週)、遞增備份(例如每小時、每天)與交易日誌被用以維持所做的改變。根據一具體實施例,對主要服務的改變被複製至次要服務,而使次要服務維持實質上與主要服務同步(例如在五或十分鐘內)。週期性地,被複製至次要服務的資料被驗證,以幫助確保資料已被正確地複製。可使用不同的方法來執行驗證(例如校驗和、雜湊函數等等)。資料儲存器236包含相關於服務作業及/或配置的資料(例如服務210、服務220)。例如,資料儲存器236可包含工作佇列、映射表及/或配置資料庫。
根據一具體實施例,使用DFSR以自動從主要服務210複製內容至服務220。DFSR使用遠端差異壓縮(Remote Differential Compression;RDC)。一般而言,RDC偵測資料在檔案中插入、移除與重設置,使DFSR能夠在檔案被更新時複製差異(改變)。DFSR服務使用RPC以在伺服器之間通訊。DFSR複製由經複製資料夾路徑所界定的資料夾範圍。參與複製的電腦集合係由經配置之連結拓樸來界定,並被稱為複製群組。複製群組可包含多個經複製資料夾,同時會籍選擇性地致能或去能特定複 製的資料夾。DFSR服務使用視窗管理儀表(Windows Management Instrumentation;WMI)來配置伺服器域參數,同時全域參數與某些經複製之資料夾特定參數係使用活動目錄來配置。DFSR亦使用WMI以暴露關於特定物件的監視資訊,諸如經複製資料夾與連結。根據一具體實施例,DFSR經配置以具有分級區域,分級區域經縮放以處理大量資料,並將資料以單一方向從主要服務210移至次要服務220。共享於主要位置與次要位置的檔案可具有不同名稱。
根據一具體實施例,活動目錄(Active Directory;AD)複製係用以在主要服務210與次要服務220之間同步目錄服務資料。可使用其他檔案複製方法來代替DFSR與AD。
服務210係配置為線上服務的主要位置,線上服務經配置以提供相關於顯示與來自多個租戶之資料互動的服務。服務210提供對多個租戶的共享內部結構。根據一具體實施例,服務210為MICROSOFT’S SHAREPOINT ONLINE服務。不同的租戶可使用服務210來容納其網頁應用程式/網站集合。租戶亦可使用專屬單獨服務或結合由服務210提供的服務。服務220係配置為服務的次要位置,次要位置實質上為服務210的鏡射。
回復管理器26經配置以支持建立、維持並轉移作業至次要位置。例如,回復管理器26可用以管理在主要服務210與次要服務220之間的同步。回復管理器26儲存資 訊以幫助確保日誌與備份被正確地傳輸並重播。例如,資訊可包含日誌/備份所作成的時間(例如UTC時間),而使日誌與備份可被根據其時間來排序並設置。資訊亦可包含其他資訊,諸如作成備份/日誌的資料庫名稱以及重試次數。重試次數為在備份/日誌被讀取以為了被重播/回復時被改變的值。例如,在日誌被存取以被重播時,回復管理器26遞增重試次數的值。在重試次數超過預定值(例如2次、3次、4次嘗試)時,回復管理器26可觸發警報,並試圖處理對於日誌/備份的問題。亦可使用時間限制以幫助確保日誌被依時間來重播。例如,在日誌舊於一些時間量時(例如5、10、15分鐘),回復管理器26可觸發警報,並試圖處理對於日誌/備份的問題。此資訊可被儲存於不同的位置中。例如,資訊可被儲存於備份資料夾,及/或儲存於一些可由重播管理器26存取的其他位置。根據一具體實施例,日誌的檔案名稱可包含一些/全部的資訊,以幫助確保日誌與備份被正確地傳輸與重播。例如,檔案名稱可為以下格式:「資料庫_年_月_日_時_分_秒_tlog_重試次數」
一旦回復管理器26發出警報,則警報亦在任何相繼的重試時發出。警報指示在最後一次成功的回復之後的時間量。警報的層級可在經過了一些經決定時間(例如30分鐘)之後改變(亦即從關鍵層級至失效層級)。
在發生警報之後,可執行校驗(手動/自動),來看看日誌/備份是否存在於主要位置,且是否並未被複製至次要 位置。在日誌/備份不存在時,日誌/備份可被複製且/或可產生另一備份。
根據一具體實施例,警報包含下列訊息串:事件來源:DR日誌重播;事件ID;對於資料庫[<dbname>]存在遺漏的交易日誌於[<時間戳記UTC>]與交易日誌[<完整檔案路徑>]之間。在最後一次成功的回復之後已經過了[<N>]分鐘。在回復的同時SQL所提供的錯誤為:<SQL錯誤碼><SQL錯誤訊息>。
回復管理器26亦經配置以偵測何時交易日誌在一段時間內未被接收(例如在前15分鐘內)。在此情況中,回復管理器26可在主要位置校驗備份工作,並判定:備份是否暫停了?(例如,諸如資料庫移動與資料庫更新的維護程序可暫停備份程序)。亦可(手動/自動)執行校驗,以看看日誌/備份是否存在於主要位置,且是否並未被複製至次要位置。
根據一具體實施例,在日誌/備份在一段時間內未被接收時,警報包含下列訊息串:事件來源:DR日誌重播;事件ID:對於資料庫[<dbname>],在前[<N>]分鐘內沒有新的交易日誌。
在次要位置因為訛誤而無法回復日誌之一者時,回復管理器26發出警報。為了處理日誌因為在產生備份期間內發生失效切換,而被部分地寫入的潛在常見情況,重播工作試圖及時回復「下一」日誌。若成功地回復了「下一」日誌,則回復管理器26忽略失效。根據一具體實施 例,在回復管理器26發出警報之前,日誌被重試3次或15分鐘。一旦警報被發出,則警報將持續發生於相繼的重試。警報指示在前一次成功回復之後的時間量。在日誌未被回復時,回復管理器26在主要位置執行完整資料庫備份、在次要位置與網站刪除對應資料庫,並藉由從主要位置獲取資料複製品於次要位置,來在次要位置複製對應的資料庫。根據另一具體實施例,重播工作可被暫停,且最新的備份與日誌集合可被回復而試圖移到鏈中的空缺之後。根據一具體實施例,在此情況中的警報包含以下訊息串:事件來源:DR日誌重播;事件ID:在回復交易日誌[<完整檔案路徑>]的同時,發生對於資料庫[<dbname>]的錯誤。在最後一次成功回復之後已經過了[<N>]分鐘。在回復的同時SQL所提供的錯誤為:<SQL錯誤碼><SQL錯誤訊息>。
現參照第3圖,將說明維持並失效切換至服務之次要位置的過程。
在閱讀本文所呈現之常式的論述時,應認知到各種具體實施例的邏輯作業,被實施為(1)運行在運算系統上的電腦實施步驟序列或程式模組,及/或(2)運算系統內的經交互連接的機器邏輯電路或電路模組。實施的選擇係取決於實施本發明之運算系統的效能要求。因此,所圖示說明之實施本文所說明具體實施例的邏輯作業,係多樣地代表作業、結構化裝置、步驟或模組。該等作業、結構化裝置、步驟與模組可被實施於軟體、韌體、特定 目的數位邏輯,與以上之任何結合者中。
在啟動作業之後,過程300進行至作業310,在作業310於主要位置產生備份與交易日誌。根據一具體實施例,備份包含每週執行的完整備份、每日執行的遞增備份以及每5分鐘(可使用其他時間)執行的SQL交易日誌。一些備份可經配置為不包含遞增備份及/或日誌。例如,由服務(例如搜尋)所提供的應用程式/服務,可包含較少的備份及/或在不同時間執行的備份/日誌。相關於備份/日誌的資訊被儲存,以支援被正確地傳送與重播的日誌與備份。例如,資訊可包含日誌/備份所作成的時間(例如UTC時間),而使日誌與備份可被根據其時間來儲存與設置。資訊亦可包含其他資訊,諸如作成備份/日誌的資料庫名稱以及重試次數。重試次數為在備份/日誌被讀取以為了被重播/回復時所改變的值。重試次數在日誌被存取以被重播時被更新。
進行至作業320,備份與日誌被複製到服務的次要位置。根據一具體實施例,備份與日誌在被使用以DFSR與AD為基礎的演算法完成時,即被自動複製。
進行至作業330,被複製至次要位置的內容被驗證。可使用不同的方法來驗證內容已被正確地複製至次要位置。例如,可使用雜湊、雜湊+檔案屬性,來判定內容是否已被正確地複製到次要位置。在內容未被驗證時,內容可被複製/重複製到次要位置。
進行至作業340,備份在次要位置被回復,且日誌在 次要位置被重播。根據一具體實施例,日誌在被複製至次要位置時即被重播,而使次要位置維持與主要位置同步。
進行至作業350,回復/重播作業被監視,以幫助確保內容與行動被正確地在次要位置執行。警告機制警告使用者及/或自動執行作業,以處理在回復/重播備份/日誌時發生的問題。例如,警告機制經配置以在根據預定排程還未接收到日誌/備份時;備份/日誌有訛誤時;存在備份/日誌的待處理件時;以及類似者時,產生警告。
進行至作業360,偵測到失效切換。失效切換可回應於經計劃/未經計劃事件而被偵測。例如,失效切換可由在主要網路的毀滅性失效而造成,或可由對於停止使用主要網路的判定而造成。失效切換事件可手動/自動地起始。例如,經授權的使用者可觸發從主要網路至次要網路的失效切換,或可基於偵測到一或多個狀況(例如一或多個機器的失效)而自動觸發失效切換。
進行至作業370,在失效切換之後次要位置被設為主要位置。根據一具體實施例,在次要位置與主要位置同步之後,次要位置接收被導向主要位置的要求。在次要位置成為主要位置時,鏡射被建立在次要位置,且另一回復網路可對新主要位置被建立。
過程隨後移動至結束作業,並返回處理其他動作。
現參照第4圖,將說明被利用在各種具體實施例中的電腦400的說明性電腦架構。第4圖所圖示的電腦架構 可被配置為伺服器、桌上型或行動電腦,並包含中央處理單元5(「CPU」)、系統記憶體7以及系統匯流排12,系統記憶體7包含隨機存取記憶體9(「RAM」)與唯讀記憶體10(「ROM」),系統匯流排12將記憶體耦合至中央處理單元5(「CPU」)。
ROM 10儲存基本輸入/輸出系統,基本輸入/輸出系統包含基本常式以幫助在電腦內的元件之間傳送資訊,諸如在啟動期間。電腦400進一步包含用於儲存作業系統16的大型儲存裝置14、應用程式10、資料儲存器24、檔案與相關於執行雲端系統100並與雲端系統100互動的雲端程式26。
大型儲存裝置14透過連接至匯流排12的大型儲存控制器(未圖示)連接至CPU 5。大型儲存裝置14與相關聯的電腦可讀取媒體,提供用於電腦400的非揮發性儲存器。雖然本文所包含之對於電腦可讀取媒體的說明代表大型儲存裝置(諸如硬碟或CD-ROM光碟機),但電腦可讀取媒體可為任何可由電腦100存取的可用媒體。
作為示例性目的且不為限制,電腦可讀取媒體可包含電腦儲存媒體與通訊媒體。電腦儲存媒體包含以任何儲存資訊(諸如電腦可讀取指令、資料結構、程式模組或其他資料)的方法或科技來實施的揮發性與非揮發性、可移除與不可移除媒體。電腦儲存媒體包含(但不限於)RAM、ROM、可抹除可程式化唯讀記憶體(「EPROM」)、電子可抹除可程式化唯讀記憶體 (「EEPROM」)、快閃記憶體或其他固態記憶體科技、CD-ROM、數位多功能光碟(「DVD」)、或其他光學儲存器、磁匣、磁帶、磁碟儲存器或其他磁性儲存裝置,或任何可用以儲存所需資訊並可由電腦400存取的其他媒體。
根據各種具體實施例,電腦400可操作於網路環境中,透過網路18(諸如網際網路)邏輯連接至遠端電腦。電腦400可透過連接至匯流排12的網路介面單元20連接至網路18。網路連接可為無線及/或有線。網路介面單元20亦可用以連接至其他類型的網路與遠端電腦系統。電腦400亦可包含輸入/輸出控制器22以接收並處理來自數個其他裝置(包含鍵盤、滑鼠或電子尖筆(未圖示於第4圖))的輸入。類似地,輸入/輸出控制器22可提供輸出至顯示螢幕28、印表機,或其他類型的輸出裝置。
如上文所簡短提及的,數個程式模組與資料檔案可被儲存在電腦400的大型儲存裝置14與RAM 9中,包含適合控制網路電腦作業的作業系統16,諸如來自設立於美國華盛頓州雷德蒙市的MICROSOFT® CORPORATION的WINDOWS®作業系統。大型儲存裝置14與RAM 9亦可儲存一或多個程式模組。特定言之,大型儲存裝置14與RAM 9可儲存一或多個應用程式,諸如執行相關於雲端系統之工作的雲端程式25。
上文的說明、範例與資料提供對本發明組成之製造與 使用的詳細說明。因為可作成本發明的許多具體實施例而不脫離本發明的精神與範疇,本發明位在下列的附加申請範圍中定義。
100‧‧‧雲端管理系統
105‧‧‧雲端管理器
110‧‧‧工作管理器
112‧‧‧工作佇列
114‧‧‧映射表
115‧‧‧機器管理器
116‧‧‧配置資料庫
120‧‧‧應用程式特定管理器
130‧‧‧腳本
140‧‧‧資料儲存器
150‧‧‧網頁服務API
26‧‧‧回復管理器/重播管理器
200‧‧‧回復網路系統
210‧‧‧主要服務/資料儲存器
220‧‧‧次要服務
210’‧‧‧資料儲存器
212‧‧‧內容資料儲存器
212’‧‧‧內容資料儲存器
214‧‧‧服務配置
214’‧‧‧服務配置
18‧‧‧網路
230‧‧‧雲端管理器
236‧‧‧資料儲存器
240‧‧‧運算裝置
242‧‧‧應用程式
244‧‧‧網頁瀏覽器
246‧‧‧使用者介面
300-370‧‧‧步驟
5‧‧‧中央處理單元
7‧‧‧系統記憶體
9‧‧‧隨機存取記憶體
10‧‧‧應用程式
11‧‧‧唯讀記憶體
12‧‧‧系統匯流排
14‧‧‧大型儲存裝置
16‧‧‧作業系統
20‧‧‧網路介面單元
22‧‧‧輸入/輸出控制器
24‧‧‧資料儲存器
25‧‧‧雲端程式
28‧‧‧顯示器
400‧‧‧電腦
第1圖圖示說明一雲端管理系統,此雲端管理系統包含用於服務之次要位置的回復網路;第2圖圖示一系統,此系統包含用於服務之次要位置的回復網路;第3圖圖示說明用以維持並失效切換至服務次要位置的一過程;且第4圖圖示一示例性電腦架構。
300-370‧‧‧步驟

Claims (20)

  1. 一種建立並維持用於一服務之一回復服務位置的方法,該方法包含以下步驟:同步步驟,在一服務的一主要位置正活動地從使用者接收要求的同時,使該服務的該主要位置與該服務的一次要位置同步,其中該服務的該次要位置實質上被配置為與該服務的該主要位置相同,且該服務的該次要位置隨著該主要位置被更新而被更新;偵測步驟,偵測該服務的該主要位置的一網路失效;及設定步驟,回應於該網路失效,將該服務的該次要位置設定為該主要位置。
  2. 如請求項1所述之方法,其中使該服務的該主要位置與該服務的該次要位置同步的同步步驟,包含以下步驟:產生完整備份、遞增備份以及交易日誌,該等遞增備份係產生於該等完整備份之間。
  3. 如請求項1所述之方法,其中使該服務的該主要位置與該服務的該次要位置同步的同步步驟,包含以下步驟:與該服務的應用程式資料分開地維持租戶資料。
  4. 如請求項2所述之方法,其中使該服務的該主要位置與該服務的該次要位置同步的同步步驟,包含以下步驟:在該等交易日誌被在該服務的該次要位置接收時,重播該等交易日誌。
  5. 如請求項1所述之方法,該方法進一步包含以下步驟:在將該等要求從該主要位置切換至該次要位置之後,建立該服務的該次要位置的鏡射。
  6. 如請求項1所述之方法,該方法進一步包含以下步驟:驗證在該次要位置處該同步的一完整性。
  7. 如請求項1所述之方法,其中使該服務的該主要位置與該服務的該次要位置同步的同步步驟,包含以下步驟:以一可排序格式儲存該備份的一備份時間。
  8. 如請求項7所述之方法,其中儲存該備份時間之步驟包含以下步驟:包含一讀取次數並儲存一資料庫的一名稱,該讀取次數在該備份被讀取時被更新。
  9. 如請求項1所述之方法,其中使該服務的該主要位置與該服務的該次要位置同步的同步步驟,包含以下步驟:使用分散式檔案系統複製(Distributed File System Replication;DFSR)以一單一方向,將資料從該主要位 置移動至該次要位置,該等資料包含在該主要位置與該次要位置處的不同共享名稱。
  10. 一種電腦可讀取儲存媒體,該媒體具有建立並維持用於一服務之一回復服務位置的電腦可執行指令,包含:藉由執行動作,而在一服務的一主要位置正活動地從使用者接收要求的同時,使該服務的該主要位置與該服務的一次要位置同步,該等動作包含:產生資料庫的完整備份;產生在該等資料庫的該等完整備份之間的遞增備份;產生交易日誌;提供該等完整備份、遞增備份與交易日誌給該次要位置,其中該等交易日誌被在該次要位置重播;偵測該服務的該主要位置的一網路失效;及設定步驟,回應於該網路失效,將該服務的該次要位置設定為該主要位置。
  11. 如請求項10所述之電腦可讀取儲存媒體,其中使該服務的該主要位置與該服務的該次要位置同步包含:與該服務的應用程式資料分開地維持租戶資料。
  12. 如請求項10所述之電腦可讀取儲存媒體,更進一步包含在將該等要求從該主要位置切換至該次要位置之後,建立該服務的該次要位置的鏡射。
  13. 如請求項10所述之電腦可讀取儲存媒體,更進一步包含在預定時間驗證在該次要位置處該同步的一完整性。
  14. 如請求項10所述之電腦可讀取儲存媒體,其中使該服務的該主要位置與該服務的該次要位置同步包含:以一可排序格式在該備份的一檔案名稱內包含該備份的一備份時間與以下之至少一者:在該備份的該檔案名稱內包含一讀取次數,該讀取次數在該備份被在該次要位置處讀取時被更新,以及在該備份的該檔案名稱內包含一名稱資料庫。
  15. 如請求項10所述之電腦可讀取儲存媒體,其中使該服務的該主要位置與該服務的該次要位置同步包含:使用分散式檔案系統複製(Distributed File System Replication;DFSR)以一單一方向,將資料從該主要位置移動至該次要位置,該等資料包含在該主要位置與該次要位置處的不同共享名稱。
  16. 一種建立並維持用於一服務之一回復服務位置的系統,該系統包含: 一處理器與一電腦可讀取媒體;一作業環境,該作業環境儲存在該電腦可讀取媒體上並在該處理器上執行;及一雲端管理器,該一雲端管理器可操作以執行動作,該等動作包含:藉由執行動作,而在一服務的一主要位置正活動地從使用者接收要求的同時,使該服務的該主要位置與該服務的一次要位置同步,該等動作包含:產生備份,該等備份包含資料庫的交易日誌;提供該等備份與該等交易日誌給該次要位置,以在該次要位置重播;偵測該服務的該主要位置的一網路失效;及回應於該網路失效,將該服務的該次要位置設定為該主要位置。
  17. 如請求項16所述之系統,其中使該服務的該主要位置與該服務的該次要位置同步包含:與該服務的應用程式資料分開地維持租戶資料。
  18. 如請求項16所述之系統,在預定時間驗證在該次要位置處該同步的一完整性。
  19. 如請求項16所述之系統,其中使該服務的該主要位置與該服務的該次要位置同步包含:以一可排序格式儲存 該備份的一備份時間與以下之至少一者:一讀取次數,該讀取次數在該備份被在該次要位置處讀取時被更新,以及儲存該備份的一名稱資料庫。
  20. 如請求項16所述之系統,其中使該服務的該主要位置與該服務的該次要位置同步包含:使用分散式檔案系統複製(Distributed File System Replication;DFSR)以一單一方向,將資料從該主要位置移動至該次要位置,該等資料包含在該主要位置與該次要位置處的不同共享名稱。
TW101116227A 2011-06-06 2012-05-07 Recovery service location for a service TWI561099B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US13/154,299 US8938638B2 (en) 2011-06-06 2011-06-06 Recovery service location for a service

Publications (2)

Publication Number Publication Date
TW201306632A true TW201306632A (zh) 2013-02-01
TWI561099B TWI561099B (en) 2016-12-01

Family

ID=47262639

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101116227A TWI561099B (en) 2011-06-06 2012-05-07 Recovery service location for a service

Country Status (7)

Country Link
US (1) US8938638B2 (zh)
EP (1) EP2718816B1 (zh)
CN (1) CN103608781A (zh)
AR (1) AR086225A1 (zh)
ES (1) ES2566947T3 (zh)
TW (1) TWI561099B (zh)
WO (1) WO2012170310A2 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10585766B2 (en) 2011-06-06 2020-03-10 Microsoft Technology Licensing, Llc Automatic configuration of a recovery service
JP5948933B2 (ja) * 2012-02-17 2016-07-06 日本電気株式会社 ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
US10346369B2 (en) * 2012-10-11 2019-07-09 Delphix Corp. Retrieving point-in-time copies of a source database for creating virtual databases
US9424056B1 (en) * 2013-06-28 2016-08-23 Emc Corporation Cross site recovery of a VM
EP3039553A1 (en) 2013-08-29 2016-07-06 Hewlett Packard Enterprise Development LP Separating storage transaction logs
US9158633B2 (en) * 2013-12-24 2015-10-13 International Business Machines Corporation File corruption recovery in concurrent data protection
US9703638B2 (en) * 2013-12-27 2017-07-11 Oracle International Corporation System and method for supporting asynchronous invocation in a distributed data grid
JP6273916B2 (ja) * 2014-03-10 2018-02-07 富士通株式会社 冗長処理方法、冗長処理システム及び情報処理装置
US10348837B2 (en) 2014-12-16 2019-07-09 Citrix Systems, Inc. Methods and systems for connecting devices to applications and desktops that are receiving maintenance
US10320892B2 (en) 2015-01-02 2019-06-11 Microsoft Technology Licensing, Llc Rolling capacity upgrade control
US20160210306A1 (en) 2015-01-15 2016-07-21 Commvault Systems, Inc. Managing structured data in a data storage system
US10108687B2 (en) 2015-01-21 2018-10-23 Commvault Systems, Inc. Database protection using block-level mapping
US9904598B2 (en) 2015-04-21 2018-02-27 Commvault Systems, Inc. Content-independent and database management system-independent synthetic full backup of a database based on snapshot technology
US10165040B2 (en) 2015-06-05 2018-12-25 Apple Inc. Small disk support for large cloud-based storage systems
CN107426265A (zh) * 2016-03-11 2017-12-01 阿里巴巴集团控股有限公司 数据一致性同步的方法及设备
CN106227621B (zh) * 2016-07-25 2019-03-01 北京飞杰信息技术有限公司 基于逻辑卷管理精简卷的数据备份方法及系统
US10387275B2 (en) * 2016-07-26 2019-08-20 Hewlett Packard Enterprise Development Lp Resume host access based on transaction logs
US10917469B2 (en) * 2017-03-22 2021-02-09 Western Digital Technologies, Inc. Read performance enhancement by enabling read from secondary in highly available cluster setup
US11226876B2 (en) * 2018-06-21 2022-01-18 Sap Se Non-blocking backup in a log replay node for tertiary initialization
US10944581B2 (en) 2018-11-08 2021-03-09 International Business Machines Corporation Increasing processing capacity of processor cores during initial program load processing
US10884818B2 (en) 2018-11-08 2021-01-05 International Business Machines Corporation Increasing processing capacity of virtual machines
US10884845B2 (en) 2018-11-08 2021-01-05 International Business Machines Corporation Increasing processing capacity of processor cores during initial program load processing
US11068351B2 (en) * 2018-11-19 2021-07-20 International Business Machines Corporation Data consistency when switching from primary to backup data storage
US11269732B2 (en) * 2019-03-12 2022-03-08 Commvault Systems, Inc. Managing structured data in a data storage system
US11327767B2 (en) * 2019-04-05 2022-05-10 International Business Machines Corporation Increasing resources for partition to compensate for input/output (I/O) recovery event
US11216446B2 (en) * 2019-08-29 2022-01-04 Snowflake Inc. Identifying software regressions based on query retry attempts in a database environment
CN114003439B (zh) * 2021-12-30 2022-05-24 深圳市科力锐科技有限公司 数据备份方法、装置、设备及存储介质
US11757960B1 (en) * 2022-02-23 2023-09-12 Iheartmedia Management Services, Inc. Disaster recovery in media broadcast system

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6526418B1 (en) * 1999-12-16 2003-02-25 Livevault Corporation Systems and methods for backing up data files
AU2001229332A1 (en) * 2000-01-10 2001-07-24 Connected Corporation Administration of a differential backup system in a client-server environment
US7512673B2 (en) * 2001-01-11 2009-03-31 Attune Systems, Inc. Rule based aggregation of files and transactions in a switched file system
US20040133606A1 (en) * 2003-01-02 2004-07-08 Z-Force Communications, Inc. Directory aggregation for files distributed over a plurality of servers in a switched file system
US7685126B2 (en) * 2001-08-03 2010-03-23 Isilon Systems, Inc. System and methods for providing a distributed file system utilizing metadata to track information about data stored throughout the system
US7065041B2 (en) 2001-12-14 2006-06-20 Siemens Communications, Inc. Method for resilient call setup through ATM networks for Softswitch applications
US20040153709A1 (en) * 2002-07-03 2004-08-05 Burton-Krahn Noel Morgen Method and apparatus for providing transparent fault tolerance within an application server environment
US6947940B2 (en) * 2002-07-30 2005-09-20 International Business Machines Corporation Uniform name space referrals with location independence
JP2005538470A (ja) 2002-09-10 2005-12-15 イグザグリッド システムズ, インコーポレイテッド ノーダルフェイルオーバを用いるプライマリーデータバックアップおよびリモートデータバックアップ
JP4235177B2 (ja) * 2002-12-11 2009-03-11 富士通株式会社 バックアップシステム,バックアップ制御装置,バックアップデータ管理方法,バックアップ制御プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US7330859B2 (en) * 2003-09-10 2008-02-12 International Business Machines Corporation Database backup system using data and user-defined routines replicators for maintaining a copy of database on a secondary server
US7188273B2 (en) * 2003-11-24 2007-03-06 Tsx Inc. System and method for failover
US7490103B2 (en) 2004-02-04 2009-02-10 Netapp, Inc. Method and system for backing up data
US7185026B2 (en) * 2004-04-15 2007-02-27 International Business Machines Corporation Method for synchronizing read/unread data during LOTUS NOTES database migration
US7363365B2 (en) * 2004-07-13 2008-04-22 Teneros Inc. Autonomous service backup and migration
JP2008510232A (ja) * 2004-08-13 2008-04-03 サイトリックス システムズ, インコーポレイテッド 多数のリモートアクセスサーバにわたる処理整合性を維持する方法
US20060129562A1 (en) 2004-10-04 2006-06-15 Chandrasekhar Pulamarasetti System and method for management of recovery point objectives of business continuity/disaster recovery IT solutions
US7483929B2 (en) * 2005-02-08 2009-01-27 Pro Softnet Corporation Systems and methods for storing, backing up and recovering computer data files
US7911359B2 (en) * 2005-09-12 2011-03-22 Abl Ip Holding Llc Light management system having networked intelligent luminaire managers that support third-party applications
US20070162516A1 (en) * 2005-12-30 2007-07-12 Microsoft Corporation Computing asynchronous transaction log replication progress based on file change notifications
US9268659B2 (en) * 2006-01-05 2016-02-23 Emc Corporation Detecting failover in a database mirroring environment
US7734951B1 (en) * 2006-03-20 2010-06-08 Netapp, Inc. System and method for data protection management in a logical namespace of a storage system environment
US7613742B2 (en) * 2006-05-02 2009-11-03 Mypoints.Com Inc. System and method for providing three-way failover for a transactional database
US7877628B2 (en) * 2006-06-08 2011-01-25 International Business Machines Corporation Mirroring data between primary and secondary sites
US8225129B2 (en) 2007-04-10 2012-07-17 International Business Machines Corporation Methods and apparatus for effective on-line backup selection for failure recovery in distributed stream processing systems
US7861111B2 (en) 2007-06-15 2010-12-28 Savvis, Inc. Shared data center disaster recovery systems and methods
US7830784B2 (en) 2007-06-29 2010-11-09 Verizon Patent And Licensing Inc. Intelligent network restoration
US8375440B2 (en) * 2007-10-15 2013-02-12 Microsoft Corporation Secure bait and switch resume
CN101183979B (zh) * 2007-11-27 2010-08-18 上海华为技术有限公司 一种配置备份的方法和装置
US8700574B2 (en) * 2008-03-21 2014-04-15 Omnitracs, Llc Pourover journaling
US8103842B2 (en) 2008-11-17 2012-01-24 Hitachi, Ltd Data backup system and method for virtual infrastructure
WO2010102084A2 (en) 2009-03-05 2010-09-10 Coach Wei System and method for performance acceleration, data protection, disaster recovery and on-demand scaling of computer applications
US8849955B2 (en) 2009-06-30 2014-09-30 Commvault Systems, Inc. Cloud storage and networking agents, including agents for utilizing multiple, different cloud storage sites
US9141489B2 (en) * 2009-07-09 2015-09-22 Uniloc Luxembourg S.A. Failover procedure for server system
US8074107B2 (en) 2009-10-26 2011-12-06 Amazon Technologies, Inc. Failover and recovery for replicated data instances
US8145945B2 (en) * 2010-01-04 2012-03-27 Avaya Inc. Packet mirroring between primary and secondary virtualized software images for improved system failover performance

Also Published As

Publication number Publication date
EP2718816A4 (en) 2015-04-22
US20120311376A1 (en) 2012-12-06
WO2012170310A2 (en) 2012-12-13
WO2012170310A3 (en) 2013-04-25
US8938638B2 (en) 2015-01-20
CN103608781A (zh) 2014-02-26
ES2566947T3 (es) 2016-04-18
TWI561099B (en) 2016-12-01
EP2718816A2 (en) 2014-04-16
EP2718816B1 (en) 2016-03-09
AR086225A1 (es) 2013-11-27

Similar Documents

Publication Publication Date Title
US11720456B2 (en) Automatic configuration of a recovery service
TW201306632A (zh) 用於服務之回復服務位置
US20220261419A1 (en) Provisioning and managing replicated data instances
US9442813B2 (en) Replaying jobs at a secondary location of a service
US10394550B2 (en) System and method for supporting patching in a multitenant application server environment
JP6050342B2 (ja) リカバリーサイトにおけるレプリカされた仮想ストレージの管理

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees