TWI452462B - 使用寫入配置快照之動態儲存層的方法和系統 - Google Patents

使用寫入配置快照之動態儲存層的方法和系統 Download PDF

Info

Publication number
TWI452462B
TWI452462B TW098110961A TW98110961A TWI452462B TW I452462 B TWI452462 B TW I452462B TW 098110961 A TW098110961 A TW 098110961A TW 98110961 A TW98110961 A TW 98110961A TW I452462 B TWI452462 B TW I452462B
Authority
TW
Taiwan
Prior art keywords
hotspot
logical block
storage
storage cluster
virtual volume
Prior art date
Application number
TW098110961A
Other languages
English (en)
Other versions
TW201028843A (en
Inventor
Martin Jess
Rodney A Dekoning
Brian Mckean
Original Assignee
Lsi Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lsi Corp filed Critical Lsi Corp
Publication of TW201028843A publication Critical patent/TW201028843A/zh
Application granted granted Critical
Publication of TWI452462B publication Critical patent/TWI452462B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

使用寫入配置快照之動態儲存層的方法和系統
本揭示說明動態儲存層的系統和方法。
動態儲存層(DST)係基於儲存元件的效能特徵來將儲存元件分類成多個層級,並且將資料動態地重新配置在該等元件中,用以平衡它們的特定功能的一種概念。此技術領域希望DST系統實施此項重新配置時,資料仍保持連線並且可供取用。
為達效能管理的目的,具有高活動率或負載水平(load level)的資料可被重新配置到高效能儲存層。或者,具有低活動率水平的資料可被重新配置到低效能儲存層,以便提供高效能儲存層較大的功能。
一種用於動態儲存層的方法,可包括:偵測位於第一儲存群集中的一儲存熱點;以及根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝(point-in-time copy)。
一種用於動態儲存層的系統,可包括:用以偵測位於第一儲存群集中的一儲存熱點的構件;以及用以根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝的構件。
熟習本技術的人士參考附圖便可更瞭解本發明的眾多優點。
在下面的詳細說明中可能會參考構成其一部分的附圖。在該等圖式中,除非內文另外提及,否則雷同的符號通常表示雷同的器件。在詳細說明、圖式、以及申請專利範圍中所描述的解釋性實施例可能不具有限制意義。可以利用其它實施例,可以對其進行其它改變,其並不會脫離本文所提出之主要內容的精神或範疇。
參考圖1,圖中所示的係一大量儲存系統100的例示性代表圖,其包括:一主機101運算元件;一RAID控制器102;以及一RAID 103。該RAID控制器102可包含卷冊管理電路系統/軟體,藉以讓該RAID控制器102能夠處理要存取被組態在該RAID 103上之各個邏輯卷冊的主機101的讀取/寫入要求。該RAID 103可能包含一具有n個磁碟機的磁碟機群。
參考圖1,一或多個實體磁碟機(舉例來說,磁碟機0至磁碟機n)可被邏輯分割成一或多個虛擬磁碟機(舉例來說,RAID 103中的虛擬磁碟機104A至虛擬磁碟機104C)。部分的一或多個虛擬磁碟機可進一步被分割成多個儲存群集(舉例來說,儲存群集105A、儲存群集105B、...等)。一儲存群集可被定義為具有雷同效能特徵的一或多個實體磁碟機(或是該等一或多個實體磁碟機的一或多個邏輯分割)。舉例來說,儲存群集105A(也就是,磁碟機0)可能包含高效能固態磁碟機(SSD),而儲存群集105B(也就是,磁碟機1與磁碟機2)則可能包含低效能元件,例如串列式ATA(SATA)硬碟機(HDD)。可區分高效能儲存群集與低效能儲存群集的因素可能包含:單位時間中所處理的I/O運算數;單位時間中被讀取或被寫入的位元組數;及/或一I/O要求的平均回應時間。
為增強整體系統效能,可能會希望將具有高活動率水平的資料(舉例來說,I/O要求在一高頻率下定址到該資料)配置到高效能儲存群集,及/或將具有低活動率水平的資料(舉例來說,I/O要求在一低頻率下定址到該資料)配置到低效能儲存群集。為達成有效的DST解決方案,在儲存群集之間移動的資料區塊的大小可小於一完整的SCSI邏輯單元(LU)。
對一給定的LU來說,具有高活動率水平的資料可能會被認為係一LU內的邏輯區塊位址(LBA)範圍。相較於其餘LU,此具有顯著活動率負載的LBA範圍可被稱為熱點(hot-spot)。一LU可能含有一個以上的熱點。
熱點目前所在的儲存群集可被稱為原始儲存群集。熱點可被移往的儲存群集則可被稱為目的地儲存群集。應該注意的係,熱點可能係指被頻繁存取且可被移至高效能儲存群集的資料或者極少被存取的資料可被移至低效能儲存群集。或者,極少被存取的資料可稱為冷點(cold-spot),並且可利用本文針對熱點移動所述的相同系統與方法被移至低效能儲存群集。
RAID控制器102可藉由監視自該主機101所接收的I/O要求的位址位置來辨識熱點。對一給定儲存群集中的特殊LBA區段來說,當超過一I/O要求臨界值時(舉例來說,超過指定的要求速率、要求的數量、...等),該些LBA可能會被表明為熱點並且要重新配置到具有另一效能特徵的儲存群集。
參考圖2,虛擬卷冊106可由一或多個儲存群集的容量所提供。舉例來說,儲存群集105B可包含來自一或多個虛擬磁碟機的LBA(舉例來說,虛擬磁碟機104A中被配置到實體磁碟機0的部分的虛擬磁碟機LBA區段107A;虛擬磁碟機104B中被配置到實體磁碟機1的部分的虛擬磁碟機LBA區段107B;虛擬磁碟機104C中被配置到實體磁碟機2的部分的虛擬磁碟機LBA區段107C;...等)。
參考圖3與4,一虛擬卷冊可被映射至一或多個虛擬磁碟機中的一或多個LBA範圍(舉例來說,多個虛擬磁碟機區段)。當一虛擬卷冊由一或多個儲存群集來提供時,可產生一虛擬卷冊LBA區段,用於從一虛擬卷冊LBA範圍至一虛擬磁碟機LBA範圍的每一次映射。舉例來說,虛擬卷冊LBA區段108A可包含被映射至虛擬磁碟機104A中LBA 0至m的LBA 0至m。虛擬卷冊LBA區段108B可包含被映射至虛擬磁碟機104B中LBA 0至j的LBA m+1至n。虛擬卷冊LBA區段108C可包含被映射至虛擬磁碟機104C中LBA 0至k的LBA n+1至p。
參考圖5,該大量儲存系統100可進一步施行快照功能。快照功能允許產生並儲存一虛擬卷冊(舉例來說,虛擬卷冊106A)的一或多個即時(PiT)複製。當產生一虛擬卷冊的PiT時,該虛擬卷冊內容可能會被凍結(frozen);並且可能會產生一PiT臨時虛擬卷冊(Pit Temporary Virtual Volume、PTVV),其會記錄在進行該PiT之後對該虛擬卷冊所進行的所有改變。結果,在該PiT被產生時,該虛擬卷冊的原始內容便會被保留。此快照機制可稱為寫入配置快照(allocate-on-write snapshot)或是寫入再導向快照(redirect-on-write snapshot),統稱為寫入配置快照。進一步言之,在一目前的PTVV被凍結且一新的PTVV被產生處可能會產生一給定PTVV的後續PiT。
圖5至9進一步例示代表和動態儲存層有關之範例作業的作業流程。在圖5至9中可能會針對上面所述之圖1至4的範例及/或針對其它的範例與背景來作討論與解釋。不過,應該瞭解的係,作業流程可以在許多其它環境與背景中執行,及/或在圖1至4的修正範例中執行。此外,雖然本文以圖中所示的順序來表示各種作業流程;不過,應該瞭解的係,亦可以圖中所示者以外的其它順序來實施該等各種作業流程,或者可以同時實施該等各種作業流程。
RAID控制器102可藉由監視自該主機101所接收的I/O要求的已定址儲存位置來偵測熱點。對一給定儲存群集中的特殊LBA區段來說,當超過一I/O要求臨界值時(舉例來說,超過指定的要求速率、要求的數量、...等),該些LBA可能會被表明為熱點並且會重新配置到具有另一效能特徵的儲存群集。熱點的特徵可能為寫入熱點(舉例來說,多數I/O為寫入的LBA範圍)和讀取熱點(舉例來說,多數I/O為讀取的LBA範圍)。應該注意的係,寫入熱點未必僅由寫入動作所構成。同樣地,讀取熱點亦未必僅由讀取動作所構成。
參考圖5至7,圖中所示的係圖解用以根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝的作業流程。圖中可能會先出現一第一PiT(舉例來說,PiT1 )作業,其可能會凍結一含有一熱點的原始虛擬卷冊(舉例來說,虛擬卷冊106A)的內容並且可能會產生一第一PTVV(舉例來說,PTVV1 )。在產生該PTVV之後,從一主機(舉例來說,主機101)被定址至包含該熱點之虛擬卷冊的I/O作業可能會被導向該PTVV,如下面的敘述。最近的PiT可稱為「現役(active)」PiT,因為所有目前的I/O作業均會被導向至其相關聯的PTVV。
接著,可能會偵測該PTVV1 內的第二熱點。其可能會出現一第二PiT(舉例來說,PiT2 )作業,其可能會凍結PTVV1 的內容並且可能會產生一第二PTVV(舉例來說,PTVV2 )。在產生第二該PTVV之後,從該主機至該虛擬卷冊的I/O作業可能會被導向至該現役PTVV(舉例來說,PTVV2 )。
於刪除一PiT(舉例來說,PiT1 )時,該原始虛擬卷冊(舉例來說,虛擬卷冊106)可能會被重新組態,俾使該原始卷冊中在該PiT存在期間被寫入要求定址的部分的內容會被更新以便與該PTVV相符。舉例來說,虛擬卷冊106中在該PiT存在期間被寫入要求定址的LBA可能會被複製到虛擬卷冊106的LBA。
虛擬卷冊LBA範圍可在邏輯上被分成多個相同大小的虛擬卷冊LBA區段(舉例來說,虛擬卷冊LBA區段108),一虛擬卷冊LBA區段的大小會對應於PiT粒度(granularity),其為虛擬卷冊的一項屬性。因此,每一個虛擬卷冊LBA區段均會對應於該原始虛擬卷冊內的一LBA範圍。可以為每一個PiT產生一再配置表(RT)(其含有該虛擬卷冊中每一個虛擬卷冊LBA區段的映射)並且將其儲存在和該PiT相關聯的PTVV的起始處。當在已經產生一PiT之後從一主機處接收到定址到一虛擬卷冊LBA區段中一或多個LBA的寫入要求時,現役PiT的RT中的對應登錄項便會被標記為「已配置(allocated)」,該虛擬卷冊LBA區段則可被放置在下一個可用LBA處的PTVV之中,而該虛擬卷冊LBA區段的RT登錄項則會被映射至該PTVV LBA區段。
舉例來說,如圖6A至6C中所示,一主機101可能會送出定址到一虛擬卷冊之一或多個LBA區段(舉例來說,虛擬卷冊LBA區段108B、虛擬卷冊LBA區段108A、虛擬卷冊LBA區段108C、...等)的一或多個寫入命令。每一個被定址的虛擬卷冊區段的一登錄項可以產生在對應於該等個別虛擬卷冊LBA區段的RT位置之中(舉例來說,登錄項110B、登錄項110A、登錄項110C、...等)。接著,該等寫入作業便可能會被導向至下一個可用的PTVV LBA區段(舉例來說,PTVV LBA區段111B、PTVV LBA區段111A、PTVV LBA區段111C、...等)。
應該注意的係,連續的PTVV LBA區段可能並未必對應於連續的虛擬卷冊LBA區段,因為PTVV LBA區段可能係以它們被寫入的順序被放置,而並非根據它們相關聯的虛擬卷冊LBA區段的LBA範圍。
參考圖7,當收到一虛擬卷冊的讀取要求時,該現役PiT的RT可能會指向該虛擬卷冊LBA區段的最近版本。這可能係該現役PiT本身的PTVV、較舊PiT的PTVV、或是原始的虛擬卷冊。舉例來說,如圖7中所示,一虛擬卷冊LBA區段可能會被寫入現役PTVV2 之中(舉例來說,和RT登錄項110B相關聯的PTVV LBA區段111B),而其它的虛擬卷冊LBA區段可能會在PTVV1 為現役時(舉例來說,和登錄項110A相關聯的PTVV LBA區段)或是在產生和PTVV1 相關聯的PiT1 之前(舉例來說,虛擬卷冊106的原始虛擬卷冊LBA區段)被最後寫入。
圖8所示的係將被導向至包含位於第一儲存群集中之儲存熱點之虛擬卷冊的寫入要求再導向至第二儲存群集。舉例來說,RAID控制器102可藉由監視自該主機101所接收的寫入要求的位址位置來偵測寫入熱點。對一運用上面提出的即時拷貝方法的系統來說,寫入I/O活動率可能會集中在該現役(最近)PiT的PTVV之中。藉由在目的地儲存群集中產生虛擬卷冊的一新的PiT便可將一熱點移到該目的地儲存群集。舉例來說,如圖8中所示,主機101可能會送出定址到位於一既有PTVV(舉例來說,PTVV1 )或是一原始虛擬卷冊(舉例來說,虛擬卷冊106)(其可能係位於低效能儲存群集之中,舉例來說,儲存群集105B)中的熱點之LBA的一或多個寫入要求。在收到被定址到該熱點之LBA的寫入要求後,可能會在高效能儲存群集(舉例來說,儲存群集105A)之中產生一新的PTVV(舉例來說,PTVV2 ),而被定址到該熱點的寫入要求則可被再導向至該新的PTVV。就此來說,寫入I/O活動率將會繼續集中在該現役PiT(其現在係駐存在高效能儲存群集之中)之中。
倘若該熱點的寫入要求活動率水平應該下降至不再需要使用高效能儲存群集的水平的話,那麼便可以刪除和該現役PTVV相關聯的PiT而且該現役PTVV的內容可以重新整合至先前的PTVV之中。舉例來說,倘若PTVV2 中的活動率下降至臨界水平之下的話,那麼PTVV2 的內容便可以重新整合至PTVV1 之中。
進一步言之,寫入熱點活動率實際上可能不會下降,取而代之的係要移到不同的LBA範圍。於此情況中,該等熱點LBA可能仍然位於較快速的目的地儲存群集之中,但是該PTVV中可能會有PTVV LBA區段不再具有熱點的資格而應該被轉換至低效能儲存群集。
當如上面所述般產生一寫入熱點的PiT時,RAID控制器102便可監視目的地儲存群集中的PTVV之中的實際熱點LBA和該PTVV中可用的LBA總數的比例。當熱點LBA和低活動率LBA的比例跨越一特殊臨界值(舉例來說,使用者可組態設定的臨界值)時,該RAID控制器102便可能會在該目的地儲存群集中產生一新的PiT,以便僅含有該等寫入熱點LBA而沒有其它LBA。在一可組態設定的時間週期之後便可以刪除該目的地儲存群集中「舊的」PiT,從而釋放被非現役PiT佔據的容量。
於讀取熱點的情況中,對象虛擬卷冊LBA範圍可能會分散在和該虛擬卷冊相關聯的多個PiT中,如圖9A中所示。進一步言之,即使該讀取熱點被包含在單一個PiT內,該等LBA範圍仍可能不會在連續的PTVV中(也就是,構成該讀取熱點的LBA可能會分散在PTVV中)。除此之外,該PTVV本身於某些情況中可能會非常大並且實際上可能無法將整個PTVV移到高效能的儲存群集。
圖9A與9B所示的係接收定址到該虛擬卷冊之儲存熱點中一或多個LBA的讀取要求並且將該儲存熱點的一或多個邏輯區塊位址的內容複製到第二儲存群集中的第一即時拷貝。舉例來說,主機101可能會送出定址到位於一既有PTVV(舉例來說,PTVV2 、PTVV1 、...等)或是一原始虛擬卷冊(舉例來說,虛擬卷冊106)(其可能係位於低效能儲存群集之中,舉例來說,儲存群集105B)中的熱點之LBA的一或多個讀取要求。在收到被定址到該熱點之LBA的讀取要求時,可能會在高效能儲存群集(舉例來說,儲存群集105A)之中產生一新的PTVV(舉例來說,PTVV3 )。該讀取要求可能會經過處理而且該熱點的LBA(舉例來說,PTVV2 的LBA)的內容可被複製成該新的PTVV的PTVV LBA區段。用以實施此複製的其中一種機制係在符合下面準則的任何LBA的每一次主機讀取作業的後面加入一虛擬卷冊層級寫入作業:1)該等LBA會受到該主機讀取作業的影響;2)該等LBA並未包含在該新的PTVV之中;以及3)該等LBA位於一熱點的LBA範圍內。
此方法善用要被寫入PTVV中的LBA可能會因為主機讀取作業的關係而已經存在於RAID控制器102快取之中的事實。和從該目的地PTVV中消失的熱點LBA相對應的被讀取LBA可能不會被釋放,以供進一步使用,直到額外的寫入作業完成為止。控制器韌體可以支援寫入資料的來源並非主機而係已位於控制器快取中之資料區塊的特殊類型寫入作業。
進一步言之,鎖定和現役PTVV(舉例來說,PTVV3 )相關聯的RT可以防止在發起熱點LBA寫入的RAID控制器102和發起LBA寫入的主機之間產生衝突。
當收到該虛擬卷冊中該熱點的後續讀取要求時,該等要求便可能會被導向至高效能儲存群集中該新的PTVV(舉例來說,PTVV3 )的LBA。
本領域可能會希望在複製來自先前PTVV及/或原始虛擬卷冊的熱點LBA的過程期間,避免覆寫該新的PTVV(舉例來說,PTVV3 )中的任何主機寫入資料。熱點LBA範圍中的所有LBA可能不會立刻被複製到目的地PTVV,因為這可能會在進行複製時覆寫主機已試圖寫入至該高效能儲存群集之相同LBA範圍中的資料。因此,讀取熱點可利用被稱為PiT附加式複製的方法被移到目的地儲存群集。於此情況中,在該讀取熱點LBA範圍內的LBA可能僅在熱點LBA先前未被複製到該目的地PTVV之對象LBA時才會從來源處被複製到該目的地PTVV。倘若該些LBA在產生該目的地PTVV之後尚未被寫入的話。
當如上面所述般產生一讀取熱點的PiT時,RAID控制器102便可能會監視目的地儲存群集中的PTVV之中的熱點LBA的實際數量和該PTVV中可用的LBA總數的比例。當熱點LBA和低活動率LBA的比例跨越一特殊臨界值(舉例來說,使用者可組態設定的臨界值)時,該RAID控制器102便可能會利用先前所述的附加式複製法在該目的地儲存群集中產生一新的PiT,以便僅含有該等讀取熱點LBA而沒有其它LBA。在一可組態設定的時間週期之後便可以刪除該目的地儲存群集中「舊的」PiT,從而釋放被低活動率虛擬卷冊LBA佔據的容量。
倘若該讀取熱點的讀取要求活動率水平應該下降至不再需要使用高效能儲存群集的水平的話,那麼便可以刪除和該現役PTVV相關聯的PiT而且該現役PTVV的內容可以重新整合至先前的PTVV之中。舉例來說,倘若PTVV3 中的活動率下降至臨界水平之下的話,那麼PTVV3 的內容便可以重新整合至PTVV2 之中。
當刪除一PiT時,對應PTVV中的虛擬卷冊LBA區段便可以重新整合至先前的PiT之中;或者,倘若沒有其它先前PiT存在的話,則可以重新整合至該等虛擬卷冊LBA本身之中。舉例來說,PTVV1 的LBA中的資料可以被複製到虛擬卷冊106的LBA。或者,在該PiT存在期間被讀取要求定址到的虛擬卷冊106的LBA亦可直接再映射至PTVV1 的相關聯LBA。
咸信,藉由前面的說明便會瞭解本發明及眾多其伴隨優點。又,咸信可以對其器件的形式、構造、以及排列進行各種變更,而不會脫離本發明的範疇與精神或者不會犧牲其所有的重大優點。本文前面所述的形式僅係其解釋性的實施例。下面申請專利範圍的用意可能希望涵蓋與包含此等變化。
前面的詳細說明可能包含透過以方塊圖、流程圖、及/或範例所提出的元件及/或製程的各種實施例。在此等方塊圖、流程圖、及/或範例之中含有一或多項功能及/或作業,本技術領域中的人士便會瞭解,可以各式各樣的硬體、軟體、韌體、或是其虛擬性的任何組合,以個別及/或統合的方式來施行此等方塊圖、流程圖、或範例內的每一項功能及/或作業。於其中一實施例中,可以透過特定應用積體電路(ASIC)、可場程式化閘陣列(FPGA)、數位訊號處理器(DSP)、或是其它整合形式來施行本文所述之主要內容的數個部分。不過,熟習本技術的人士便會瞭解,本文所揭示之實施例的某些觀點可以下面的方式等效地完全或部分施行在積體電路中:於一或多部電腦中執行的一或多個電腦程式(舉例來說,於一或多個電腦系統中執行的一或多個程式);於一或多個處理器中執行的一或多個程式(舉例來說,於一或多個微處理器中執行的一或多個程式);韌體;或是其虛擬性的任何組合。而且,熟習本技術的人士依照本揭示內容便可熟練地設計該電路系統及/或寫入該軟體及/或韌體的程式碼。
此外,熟習本技術的人士便會明白,本文所述之主要內容的機制可以各種形式的程式產品來散佈,並且會明白不論用於實際施行該散佈的訊號攜載媒體的特殊類型為何,皆可套用本文所述之主要內容的解釋性實施例。訊號攜載媒體的範例包含,但是並不受限於下面:可記錄類型的媒體,例如軟磁碟、硬碟機、光碟片(CD)、數位視訊碟片(DVD)、數位磁帶、電腦記憶體、...等;以及傳送類型的媒體,例如數位及/或類比通訊媒體,舉例來說,光纖纜線、波導、有線通訊鏈路、無線通訊鏈路(舉例來說,發射器、接收器、傳送邏輯、接收邏輯、...等)、...等。
熟習本技術的人士便會瞭解,最新技術可能已進展到本發明之系統的觀點的硬體、軟體、及/或韌體施行方式之間可能僅有些微的差別;硬體、軟體、及/或韌體的使用大體上可能僅係代表在成本與效率之間作取捨的一種設計選擇(但並非絕對,因為在特定的情況中,在硬體與軟體之間作選擇可能會變得非常顯著)。熟習本技術的人士便會明白,有各種手段(舉例來說,硬體、軟體、及/或韌體)可藉以實現本文所述的製程及/或系統及/或其它技術,而且較佳的手段會隨著可於其中部署該等製程及/或系統及/或其它技術的情況而改變。舉例來說,倘若設計者判定速度與精確性可能為最重要的話,那麼設計者的選擇便可能會以硬體及/或韌體手段為主;或者,倘若彈性可能為最重要的話,那麼設計者的選擇便可能會以軟體手段為主;又,同樣地,或者,設計者的選擇亦可能會係硬體、軟體、及/或韌體的某種組合。所以,有數種可能的手段可藉以實現本文所述的製程及/或元件及/或其它技術,沒有任一種手段在本質上優於其它手段,因為要被採用的任何手段均可能係一種和要於其中部署該項手段的情況及設計者的特定考量(舉例來說,速度、彈性、或是可預測性)有關的選擇結果,任何手段皆可能會改變。熟習本技術的人士便會瞭解,光學式態樣的施行方式通常會運用以光學為目的的硬體、軟體、及/或韌體。
100‧‧‧大量儲存系統
101‧‧‧主機
102‧‧‧RAID控制器
103‧‧‧RAID
104A-104D‧‧‧虛擬磁碟機
105A、105B‧‧‧儲存群集
106‧‧‧虛擬卷冊
107A-107C‧‧‧虛擬磁碟機LBA區段
108A-108C‧‧‧虛擬卷冊LBA區段
109‧‧‧虛擬卷冊LBA
110A-101C‧‧‧登錄項
111A-111C‧‧‧PTVV LBA區段
圖1所示的係一資料儲存系統。
圖2所示的係一資料儲存系統。
圖3所示的係一資料儲存系統。
圖4所示的係一資料儲存系統。
圖5所示的係和動態儲存層相關聯的作業流程。
圖6A至6C所示的係和動態儲存層相關聯的作業流程。
圖7所示的係和動態儲存層相關聯的作業流程。
圖8所示的係和動態儲存層相關聯的作業流程。
圖9A與9B所示的係和動態儲存層相關聯的作業流程。
103...RAID
104A-104D...虛擬磁碟機
105A、105B...儲存群集
106...虛擬卷冊

Claims (24)

  1. 一種用於動態儲存層的方法,其包括:偵測位於第一儲存群集中的一儲存熱點,該儲存熱點包含一或多個邏輯區塊位址;根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝;凍結一包含位於該第一儲存群集中的該儲存熱點的原始虛擬卷冊之內容;以及將被導向至包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的寫入要求再導向至位於該第二儲存群集中的該第一即時拷貝。
  2. 如申請專利範圍第1項之方法,其進一步包括:偵測被導向至該第二儲存群集中該熱點降低的輸入/輸出(IO)活動率;以及將該第二儲存群集中的該即時拷貝重新整合至第二即時拷貝或該虛擬卷冊的至少其中一者。
  3. 如申請專利範圍第1項之方法,其進一步包括:偵測包括該儲存熱點的該第一即時拷貝的邏輯區塊位址的百分比;以及根據該百分比來產生僅包含儲存熱點之邏輯區塊位址的第二即時拷貝。
  4. 如申請專利範圍第3項之方法,其進一步包括:將該第一即時拷貝中的非熱點邏輯區塊位址重新整合至該虛擬卷冊。
  5. 如申請專利範圍第1項之方法,其中,該根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝進一步包括:接收定址到該虛擬卷冊中該儲存熱點中一或多個邏輯區塊位址的讀取要求;以及將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝。
  6. 如申請專利範圍第5項之方法,其中,該將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝進一步包括:倘若該儲存熱點的該等邏輯區塊位址先前未被寫入該第二儲存群集中的話,便將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝。
  7. 如申請專利範圍第5項之方法,其進一步包括:偵測包括該儲存熱點的該第一即時拷貝的邏輯區塊位址的百分比;以及根據該百分比來產生僅包含儲存熱點之邏輯區塊位址的第二即時拷貝。
  8. 如申請專利範圍第7項之方法,其進一步包括:將該第一即時拷貝中的非熱點邏輯區塊位址重新整合至該虛擬卷冊。
  9. 一種用於動態儲存層的系統,其包括:用以偵測位於第一儲存群集中的一儲存熱點的構件, 該儲存熱點包含一或多個邏輯區塊位址;用以根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝的構件;凍結一包含位於該第一儲存群集中的該儲存熱點的原始虛擬卷冊之內容的構件;以及將被導向至包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的寫入要求再導向至位於該第二儲存群集中的該第一即時拷貝的構件。
  10. 如申請專利範圍第9項之系統,其進一步包括:用以偵測被導向至該第二儲存群集中該熱點降低的輸入/輸出(IO)活動率的構件;以及用以將該第二儲存群集中的該即時拷貝重新整合至第二即時拷貝或該虛擬卷冊的至少其中一者的構件。
  11. 如申請專利範圍第9項之系統,其進一步包括:用以偵測包括該儲存熱點的該第一即時拷貝的邏輯區塊位址的百分比的構件;以及用以根據該百分比來產生僅包含儲存熱點之邏輯區塊位址的第二即時拷貝的構件。
  12. 如申請專利範圍第11項之系統,其進一步包括:用以將該第一即時拷貝中的非熱點邏輯區塊位址重新整合至該虛擬卷冊的構件。
  13. 如申請專利範圍第9項之系統,其中,該根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集 中之儲存熱點的虛擬卷冊的第一即時拷貝進一步包括:用以接收定址到該虛擬卷冊中該儲存熱點中一或多個邏輯區塊位址的讀取要求的構件;以及用以將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝的構件。
  14. 如申請專利範圍第13項之系統,其中,該將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝進一步包括:用以在倘若該儲存熱點的該等邏輯區塊位址先前未被寫入該第二儲存群集中的話,便將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝的構件。
  15. 如申請專利範圍第13項之系統,其進一步包括:用以偵測包括該儲存熱點的該第一即時拷貝的邏輯區塊位址的百分比的構件;以及用以根據該百分比來產生僅包含儲存熱點之邏輯區塊位址的第二即時拷貝的構件。
  16. 如申請專利範圍第15項之系統,其進一步包括:用以將該第一即時拷貝中的非熱點邏輯區塊位址重新整合至該虛擬卷冊的構件。
  17. 一種用於動態儲存層的系統,其包括:用以偵測位於第一儲存群集中的一儲存熱點的電路系統,該儲存熱點包含一或多個邏輯區塊位址;用以根據該偵測結果於一第二儲存群集中產生包含位 於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝的電路系統;凍結一包含位於該第一儲存群集中的該儲存熱點的原始虛擬卷冊之內容的電路系統;以及將被導向至包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的寫入要求再導向至位於該第二儲存群集中的該第一即時拷貝的電路系統。
  18. 如申請專利範圍第17項之系統,其進一步包括:用以偵測被導向至該第二儲存群集中該熱點降低的輸入/輸出(IO)活動率的電路系統;以及用以將該第二儲存群集中的該即時拷貝重新整合至第二即時拷貝或該虛擬卷冊的至少其中一者的電路系統。
  19. 如申請專利範圍第17項之系統,其進一步包括:用以偵測包括該儲存熱點的該第一即時拷貝的邏輯區塊位址的百分比的電路系統;以及用以根據該百分比來產生僅包含儲存熱點之邏輯區塊位址的第二即時拷貝的電路系統。
  20. 如申請專利範圍第19項之系統,其進一步包括:用以將該第一即時拷貝中的非熱點邏輯區塊位址重新整合至該虛擬卷冊的電路系統。
  21. 如申請專利範圍第17項之系統,其中,該根據該偵測結果於一第二儲存群集中產生包含位於該第一儲存群集中之儲存熱點的虛擬卷冊的第一即時拷貝進一步包括:用以接收定址到該虛擬卷冊中該儲存熱點中一或多個 邏輯區塊位址的讀取要求的電路系統;以及用以將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝的電路系統。
  22. 如申請專利範圍第21項之系統,其中,該將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝進一步包括:用以在倘若該儲存熱點的該等邏輯區塊位址先前未被寫入該第二儲存群集中的話,便將該儲存熱點的該等一或多個邏輯區塊位址的內容複製到該第二儲存群集中的該第一即時拷貝的電路系統。
  23. 如申請專利範圍第21項之系統,其進一步包括:用以偵測包括該儲存熱點的該第一即時拷貝的邏輯區塊位址的百分比的電路系統;以及用以根據該百分比來產生僅包含儲存熱點之邏輯區塊位址的第二即時拷貝的電路系統。
  24. 如申請專利範圍第23項之系統,其進一步包括:用以將該第一即時拷貝中的非熱點邏輯區塊位址重新整合至該虛擬卷冊的電路系統。
TW098110961A 2009-01-29 2009-04-02 使用寫入配置快照之動態儲存層的方法和系統 TWI452462B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US20628709P 2009-01-29 2009-01-29
PCT/US2009/001998 WO2010087803A1 (en) 2009-01-29 2009-03-31 Allocate-on-write snapshot mechanism to provide dynamic storage tiering on-line data placement for volumes

Publications (2)

Publication Number Publication Date
TW201028843A TW201028843A (en) 2010-08-01
TWI452462B true TWI452462B (zh) 2014-09-11

Family

ID=42395860

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098110961A TWI452462B (zh) 2009-01-29 2009-04-02 使用寫入配置快照之動態儲存層的方法和系統

Country Status (7)

Country Link
US (1) US9170756B2 (zh)
EP (1) EP2382549A4 (zh)
JP (1) JP5271424B2 (zh)
KR (1) KR101552753B1 (zh)
CN (1) CN102272742B (zh)
TW (1) TWI452462B (zh)
WO (1) WO2010087803A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8557937B1 (en) 2012-05-09 2013-10-15 Sabic Innovative Plastics Ip B.V. Rubber composition, method for its formation, and automotive tire containing the composition
KR101405729B1 (ko) * 2009-01-23 2014-06-10 엘에스아이 코포레이션 동적 저장장치 계층화 방법 및 시스템
US9134922B2 (en) 2009-03-12 2015-09-15 Vmware, Inc. System and method for allocating datastores for virtual machines
KR20120004162A (ko) * 2010-07-06 2012-01-12 삼성전자주식회사 데이터베이스 관리 방법 및 이를 이용한 데이터베이스 서버 시스템
WO2012104912A1 (en) * 2011-02-02 2012-08-09 Hitachi, Ltd. Data storage apparatus and data management method
JP5664347B2 (ja) * 2011-03-04 2015-02-04 ソニー株式会社 仮想メモリシステム、仮想メモリの制御方法、およびプログラム
WO2012131753A1 (en) * 2011-03-25 2012-10-04 Hitachi, Ltd. Storage system and performance management method of storage system
US8775773B2 (en) 2011-08-26 2014-07-08 Vmware, Inc. Object storage system
US8595460B2 (en) 2011-08-26 2013-11-26 Vmware, Inc. Configuring object storage system for input/output operations
US8775774B2 (en) 2011-08-26 2014-07-08 Vmware, Inc. Management system and methods for object storage system
US8650359B2 (en) 2011-08-26 2014-02-11 Vmware, Inc. Computer system accessing object storage system
US8769174B2 (en) 2011-08-29 2014-07-01 Vmware, Inc. Method of balancing workloads in object storage system
US8677085B2 (en) 2011-08-29 2014-03-18 Vmware, Inc. Virtual machine snapshotting in object storage system
US9063768B2 (en) 2011-10-10 2015-06-23 Vmware, Inc. Method and apparatus for comparing configuration and topology of virtualized datacenter inventories
CN102609360B (zh) * 2012-01-12 2015-03-25 华为技术有限公司 一种数据处理方法、装置及系统
US8972680B2 (en) * 2012-01-23 2015-03-03 International Business Machines Corporation Data staging area
WO2014087497A1 (ja) 2012-12-05 2014-06-12 株式会社日立製作所 ストレージ装置及びその制御方法
GB2509057A (en) 2012-12-18 2014-06-25 Ibm Predictive point-in-time copy for storage systems
US9087055B2 (en) * 2013-01-28 2015-07-21 International Business Machines Corporation Segmenting documents within a full text index
US9330108B2 (en) 2013-09-30 2016-05-03 International Business Machines Corporation Multi-site heat map management
US9552259B1 (en) * 2014-05-30 2017-01-24 EMC IP Holding Company LLC Dynamic provisioning of snapshots
CN104536909B (zh) * 2014-12-09 2018-01-23 华为技术有限公司 一种存储管理方法,存储管理装置及存储设备
US10331374B2 (en) 2017-06-30 2019-06-25 Oracle International Corporation High-performance writable snapshots in data storage systems
CN109189583B (zh) * 2018-09-20 2021-10-01 郑州云海信息技术有限公司 一种分布式锁实现方法和装置
US10921986B2 (en) 2019-05-14 2021-02-16 Oracle International Corporation Efficient space management for high performance writable snapshots
CN114063880B (zh) * 2020-07-31 2024-09-06 伊姆西Ip控股有限责任公司 处理输入输出请求的方法、电子设备和计算机程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6170037B1 (en) * 1997-09-02 2001-01-02 Emc Corporation Method and apparatus for storing information among a plurality of disk drives
US20020133681A1 (en) * 2001-03-15 2002-09-19 International Business Machines Corporation Method of automatically generating and disbanding data mirrors according to workload conditions
TWI224732B (en) * 2002-08-29 2004-12-01 Ibm Apparatus and method to assign pseudotime attributes to one or more logical volumes
US20080162843A1 (en) * 2007-01-03 2008-07-03 International Business Machines Corporation Method, computer program product, and system for providing a multi-tiered snapshot of virtual disks

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04259048A (ja) * 1991-02-14 1992-09-14 Fujitsu Ltd 統計情報による先読みデータ制御方式
JP3457394B2 (ja) * 1994-09-16 2003-10-14 株式会社東芝 情報記憶装置
JPH0944381A (ja) * 1995-07-31 1997-02-14 Toshiba Corp データ格納方法およびデータ格納装置
US6973553B1 (en) * 2000-10-20 2005-12-06 International Business Machines Corporation Method and apparatus for using extended disk sector formatting to assist in backup and hierarchical storage management
JP4972845B2 (ja) * 2001-09-27 2012-07-11 富士通株式会社 ストレージシステム
JP2003167781A (ja) * 2001-11-30 2003-06-13 Matsushita Electric Ind Co Ltd 磁気ディスク装置およびデータ読み出し制御方法
US7191304B1 (en) * 2002-09-06 2007-03-13 3Pardata, Inc. Efficient and reliable virtual volume mapping
US7181578B1 (en) 2002-09-12 2007-02-20 Copan Systems, Inc. Method and apparatus for efficient scalable storage management
US7383381B1 (en) 2003-02-28 2008-06-03 Sun Microsystems, Inc. Systems and methods for configuring a storage virtualization environment
EP1668486A2 (en) * 2003-08-14 2006-06-14 Compellent Technologies Virtual disk drive system and method
CN101566928B (zh) * 2003-08-14 2012-06-27 克姆佩棱特科技公司 虚拟磁盘驱动系统和方法
US20050097132A1 (en) * 2003-10-29 2005-05-05 Hewlett-Packard Development Company, L.P. Hierarchical storage system
JP4863605B2 (ja) * 2004-04-09 2012-01-25 株式会社日立製作所 記憶制御システム及び方法
JP2005309739A (ja) 2004-04-21 2005-11-04 Hitachi Ltd ディスクアレイ装置およびディスクアレイ装置のキャッシュ制御方法
US7383406B2 (en) * 2004-11-19 2008-06-03 International Business Machines Corporation Application transparent autonomic availability on a storage area network aware file system
US20070185912A1 (en) * 2006-02-08 2007-08-09 International Business Machines Corporation Off-loading I/O and computationally intensive operations to secondary systems
JP4903461B2 (ja) * 2006-03-15 2012-03-28 株式会社日立製作所 記憶システム及びデータ移行方法並びにサーバ装置
JP4414409B2 (ja) * 2006-04-24 2010-02-10 富士通株式会社 ディスク装置、ディスク制御方法及びプログラム
JP2008087450A (ja) 2006-10-03 2008-04-17 Eiji Akutsu 製図用具
WO2008070172A2 (en) * 2006-12-06 2008-06-12 Fusion Multisystems, Inc. (Dba Fusion-Io) Apparatus, system, and method for remote direct memory access to a solid-state storage device
WO2010042109A1 (en) * 2008-10-07 2010-04-15 Hewlett-Packard Development Company, L.P. Creating snapshots of data using a selected one of different snapshot algorithms
US8527720B2 (en) * 2008-12-03 2013-09-03 Lsi Corporation Methods of capturing and naming dynamic storage tiering configurations to support data pre-staging
KR101405729B1 (ko) * 2009-01-23 2014-06-10 엘에스아이 코포레이션 동적 저장장치 계층화 방법 및 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6170037B1 (en) * 1997-09-02 2001-01-02 Emc Corporation Method and apparatus for storing information among a plurality of disk drives
US20020133681A1 (en) * 2001-03-15 2002-09-19 International Business Machines Corporation Method of automatically generating and disbanding data mirrors according to workload conditions
TWI224732B (en) * 2002-08-29 2004-12-01 Ibm Apparatus and method to assign pseudotime attributes to one or more logical volumes
US20080162843A1 (en) * 2007-01-03 2008-07-03 International Business Machines Corporation Method, computer program product, and system for providing a multi-tiered snapshot of virtual disks

Also Published As

Publication number Publication date
JP5271424B2 (ja) 2013-08-21
CN102272742A (zh) 2011-12-07
US20110283075A1 (en) 2011-11-17
KR20110117123A (ko) 2011-10-26
EP2382549A4 (en) 2012-08-22
CN102272742B (zh) 2015-08-05
US9170756B2 (en) 2015-10-27
KR101552753B1 (ko) 2015-09-11
WO2010087803A1 (en) 2010-08-05
TW201028843A (en) 2010-08-01
EP2382549A1 (en) 2011-11-02
JP2012516498A (ja) 2012-07-19

Similar Documents

Publication Publication Date Title
TWI452462B (zh) 使用寫入配置快照之動態儲存層的方法和系統
TWI475393B (zh) 使用寫入配置快照之動態儲存層的方法和系統
US7873600B2 (en) Storage control device to backup data stored in virtual volume
US8447946B2 (en) Storage apparatus and hierarchical data management method for storage apparatus
US10168945B2 (en) Storage apparatus and storage system
JP2012509521A (ja) ソリッドステートドライブデータを回復するためのシステム及び方法
JP2008015623A (ja) 複数種類の記憶デバイスを備えたストレージシステムの制御装置
JP2009093571A (ja) 記憶制御装置、記憶制御装置のデータアーカイブ方法及びストレージシステム
US11461287B2 (en) Managing a file system within multiple LUNS while different LUN level policies are applied to the LUNS
JP6867578B2 (ja) ストレージ制御装置、ストレージシステム、ストレージ制御方法およびストレージ制御プログラム
WO2011135622A1 (en) Storage device and method of controlling storage system
JP2014519062A (ja) ストレージシステム及びその論理ユニット管理方法
JP2008299559A (ja) ストレージシステム及びストレージシステムにおけるデータ移行方法
JP2007249728A (ja) ディスクアレイ装置
US8850087B2 (en) Storage device and method for controlling the same
JP5768118B2 (ja) 複数のフラッシュパッケージを有するストレージシステム
JP4563314B2 (ja) ストレージシステム制御装置、ストレージシステム制御プログラム、ストレージシステム制御方法
JP5945040B2 (ja) 複数のフラッシュパッケージを有するストレージシステム
US20160328184A1 (en) Performance of storage controllers for applications with varying access patterns in information handling systems
WO2015145707A1 (ja) 追記型記憶装置への書き込みデータ決定方法
JP2008250715A (ja) データ配置管理システム及びその方法