CN106919477B - 一种虚拟磁盘的解析方法及系统 - Google Patents

一种虚拟磁盘的解析方法及系统 Download PDF

Info

Publication number
CN106919477B
CN106919477B CN201710124719.XA CN201710124719A CN106919477B CN 106919477 B CN106919477 B CN 106919477B CN 201710124719 A CN201710124719 A CN 201710124719A CN 106919477 B CN106919477 B CN 106919477B
Authority
CN
China
Prior art keywords
sector
data
mapped
virtual disk
offset address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710124719.XA
Other languages
English (en)
Other versions
CN106919477A (zh
Inventor
李�根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eisoo Information Technology Co Ltd
Original Assignee
Shanghai Eisoo Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eisoo Information Technology Co Ltd filed Critical Shanghai Eisoo Information Technology Co Ltd
Priority to CN201710124719.XA priority Critical patent/CN106919477B/zh
Publication of CN106919477A publication Critical patent/CN106919477A/zh
Application granted granted Critical
Publication of CN106919477B publication Critical patent/CN106919477B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45545Guest-host, i.e. hypervisor is an application program itself, e.g. VirtualBox

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种虚拟磁盘的解析方法及系统,所述方法为将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,以供还原成所述第一类型格式虚拟磁盘数据或不同于所述第一类型格式虚拟磁盘的第二类型格式虚拟磁盘数据。本发明实施例中,通过将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,裸磁盘数据相当于存储在真实磁盘中不存在组织格式的数据。裸磁盘数据可供还原成其他格式虚拟磁盘的数据,从而可在不同虚拟平台间实现数据恢复。

Description

一种虚拟磁盘的解析方法及系统
技术领域
本发明属于计算机技术领域,更具体是涉及一种虚拟磁盘的解析方法及系统。
背景技术
KVM(kernel-based Virtual Machine),是一个开源的系统虚拟化模块,自Linux2.6.20之后集成在Linux的各个主要发行版本中。它使用Linux自身的调度器进行管理,所以相对于Xen,其核心源码很少。KVM目前已成为学术界的主流VMM之一。
众多虚拟化平台底层基于KVM开发,如国产虚拟化平台H3C CAS。为了对此类虚拟化平台提供数据备份恢复支持,目前可行的方案是通过备份整个qcow2磁盘文件的方式,但会存在问题:如基于外部快照备份会导致磁盘链路复杂而难以管理,虽然基于内部快照备份不会产生因磁盘链路复杂而难于管理的问题,但始终存在一个很大的限制,即只能恢复到基于KVM开发的虚拟化平台。
而今,为了更加安全可靠的保护虚拟化数据,越来越多的客户选择用某一种虚拟化平台提供业务的同时,选择另一家公司的另一种虚拟化平台来做容灾。此时,就急需要一种能实现跨虚拟化平台恢复数据的技术。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种虚拟磁盘的解析方法,用于提供跨虚拟化平台恢复用数据,从而解决现有技术中跨虚拟化平台恢复数据的问题。
为实现上述目的及其他相关目的,本发明的第一个方面是提供一种虚拟磁盘的解析方法,包括将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,以供还原成所述第一类型格式虚拟磁盘数据或不同于所述第一类型格式虚拟磁盘的第二类型格式虚拟磁盘数据的步骤。
于本发明的一实施例中,将第一类型格式虚拟磁盘的数据解析为裸磁盘数据采用下列步骤:
解析所述第一类型格式虚拟磁盘以获取所述第一类型格式虚拟磁盘的扇区总数及一级索引表L1表;
计算每个扇区映射在L1表的偏移量,结合所述L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区未分配数据,若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为第一格式虚拟磁盘的全部真实数据集。
为实现上述目的及其他相关目的,本发明的另一个方面是提供一种虚拟磁盘的解析系统,包括用于将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,以供还原成所述第一类型格式虚拟磁盘数据或不同于所述第一类型格式虚拟磁盘的第二类型格式虚拟磁盘数据的解析模块。
于本发明的一实施例中,所述解析模块包括:
预处理模块:用于解析所述第一类型格式虚拟磁盘以获取所述第一类型格式虚拟磁盘的扇区总数和一级索引表L1表;
寻址模块:计算每个扇区位于所述L1表的偏移量,结合所述L1表的起始偏移地址,获取此扇区位于所述L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区映射的数据簇的起始偏移地址;
判断读取模块:遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区未分配数据,若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为第一格式虚拟磁盘的全部真实数据集。
采用上述发明技术方案的有益效果:本发明将第一类型格式虚拟磁盘的数据按扇区读成裸磁盘数据,所述裸磁盘数据相当于真实磁盘中存储的无组织格式的数据,所述裸磁盘数据可直接被重新组织化成不同虚拟化平台所用的不同虚拟化磁盘格式,故可供用于在不同虚拟化平台间恢复数据,从而实现了跨不同类型的虚拟化平台的备份恢复,大大提高了备份产品的竞争力。
附图说明
图1显示为本发明的虚拟磁盘的解析方法的一实施例的流程示意图。
图2显示为本发明基于内部快照读取虚拟磁盘所有扇区全部数据的解析方法的一实施例的流程示意图。
图3显示为本发明基于内部快照读取虚拟磁盘所有扇区已变动数据的解析方法的一实施例的流程示意图。
图4显示为本发明基于外部快照读取虚拟磁盘所有扇区全部数据的解析方法的一实施例的流程示意图。
图5显示为本发明基于外部快照读取虚拟磁盘所有扇区已变动数据的解析方法的一实施例的流程示意图。
图6显示为本发明的虚拟磁盘的解析系统的一实施例结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明提供一种虚拟磁盘的解析方法,即将一种虚拟化平台中的虚拟磁盘的数据解析为裸磁盘数据,该裸磁盘数据相当于真实磁盘中的数据,不存在组织格式,该裸磁盘数据可用于恢复到相同的虚拟化平台也可用于恢复到不同的虚拟化平台中。如将H3C CAS虚拟化平台中格式为Qcow2的虚拟磁盘解析为裸磁盘数据后,可将该裸磁盘数据恢复到CAS平台的Qcow2格式磁盘中,也可将该裸磁盘数据恢复到VMWERE平台的VMDK格式磁盘中或VirtualBox平台的VDI格式磁盘中。当然也可以恢复到其它虚拟化平台的虚拟磁盘中。因此本发明将虚拟磁盘数据解析为裸磁盘数据的方法,可用于实现在各种虚拟化平台间恢复数据。
本发明主要以解析Qcow2格式虚拟磁盘为例进行说明。Qcow2格式是一种特殊的磁盘格式,内部主要包括文件头、一级索引表(L1表)、引用计数表、二级索引表(L2表)以及数据部分。其文件头包含了虚拟磁盘文件的基本性质,例如虚拟磁盘文件的版本信息、磁盘文件大小信息、快照信息等;L1表和L2表是Qcow2格式的两级索引表,通过这两级索引表结构将数据组织起来,数据的查找也根据这两级索引表。不管是文件头、数据还是表,都是以数据簇Cluster为单位存储的,按数据簇Cluster对齐。其中,L1表中的每条表项存储一个L2表在虚拟磁盘文件中的偏移值,L2表中的每条表项存储一个数据簇Cluster的偏移值;引用计数表则记录每个数据簇Cluster的使用情况,当某个数据簇Cluster对应的引用计数表中的值为0时,证明该数据簇Cluster为空,但是Qcow2格式不提供删除的方法,只能标记为空闲(即在引用计数表中标记为0),当有新数据存储时则优先存储在这些空闲的数据簇Cluster中。
将一种虚拟化平台中的虚拟磁盘的数据解析为裸磁盘数据,在一个实施例中,如图1所示,所述虚拟磁盘的解析方法包括:
步骤101、解析所述第一类型格式虚拟磁盘以获取所述第一类型格式虚拟磁盘的扇区总数及一级索引表L1表。即解析Qcow2格式虚拟磁盘,获取相应的所有扇区的信息和L1表的信息;
步骤102、计算每个扇区映射在L1表的偏移量,结合所述L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
步骤103、遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区未分配数据,若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为第一格式虚拟磁盘的全部真实数据集。
本发明提供一种具体的解析Qcow2格式虚拟磁盘某扇区数据的实施例对上述方法进行进一步说明:
如获取Qcow2格式虚拟disk1第N个扇区的数据,需进行如下操作:
a1、读取disk1的Header信息,解析到相应的属性值;。
a2、根据Header信息获取到L1表的偏移量;
a3、通过运算获取本扇区位于L1表的偏移量,结合L1表的起始偏移地址获取到对应的L2表的起始偏移地址,进一步计算获取到本扇区位于L2表的偏移量,结合L2表的起始偏移地址读取L2表中相应数据簇cluster的起始偏移地址;
a4、若扇区数据簇cluster的起始偏移地址为0,说明此扇区未分配数据;若不为0,则进一步计算得到此扇区位于此数据簇cluster的偏移量,读取到相应的数据即为此扇区的真实数据(簇为扇区的整数倍,因此不存在某个扇区数据不在同一个簇的情况)。
遍历读取disk1所有扇区的数据,此时即可得到Qcow2格式虚拟磁盘对应的全量裸磁盘数据。
进一步的,本发明还提供一种更具体的解析Qcow2格式虚拟磁盘某扇区数据的实施例对上述方法进行具体说明:
如存在一个Qcow2格式虚拟磁盘disk1,需读取第N=10个扇区的数据(因为Qcow2磁盘内数据按照一系列格式组织,第10个扇区并不对应于磁盘的第10个扇区,需进一步计算得到第10个扇区位于磁盘的真实偏移地址)。
b1、读取Disk1的Header信息,解析得到Header相应属性的值;
b2、根据步骤2解析得到L1表的起始偏移地址为786432;
b3、通过运算获取本扇区位于L1表的偏移量为0,结合L1表的起始偏移地址,读取磁盘偏移地址为786432的数据,得到L2表的起始偏移地址为1048576;
b4、进一步计算获取到本扇区位于L2表的偏移量为0,结合L2表的起始偏移地址,读取磁盘偏移地址为1048576的数据,得到Cluster的起始偏移地址为1310720;
b5、簇起始偏移地址为1310720,不为0,说明此扇区已分配数据,则进一步计算得到此扇区位于此簇的偏移量为10;
b6、结合簇偏移量及起始偏移地址,读取512个字节的磁盘偏移地址为1310720+10*512的数据,即为第10个扇区的数据。
针对Qcow2格式虚拟磁盘,快照分为外部快照和内部快照。以下分别对基于内部快照或外部快照获取Qcow2格式虚拟磁盘的全量备份或增量备份裸磁盘数据的方法进行具体说明。
图2为本发明基于内部快照读取虚拟磁盘所有扇区全部数据的解析方法的一实施例,其解析虚拟磁盘的方法包括:
步骤201、对所述第一类型格式虚拟磁盘执行内部快照,生成新的内部快照;
步骤202、解析所述第一类型格式虚拟磁盘和所述内部快照以获取所述第一类型格式虚拟磁盘的扇区总数及所述内部快照对应的一级索引表L1表;
步骤203、计算每个扇区映射在L1表的偏移量,结合所述L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
步骤204、遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区尚未分配数据;若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为所述第一格式虚拟磁盘在执行所述内部快照时刻的全部真实数据集。
本发明提供一种具体的基于内部快照读取Qcow2格式虚拟磁盘所有扇区数据的实施例对图2中所述方法做进一步说明:
c1、对Qcow2格式虚拟磁盘disk1触发接口执行内部快照1;
c2、读取disk1的Header信息,解析到相应属性值;
c3、根据Header属性值,获取到磁盘大小及新生成的内部快照1的偏移地址;
c4、通过偏移地址检索获取到内部快照1对应的L1表的起始偏移地址;
c5、从0~size遍历每个扇区,如遍历第N个扇区时,通过运算获取本扇区位于L1表的偏移量,结合L1表的起始偏移地址获取到对应的L2表的起始偏移地址,进一步计算获取到本扇区位于L2表的偏移量中结合L2表的起始偏移地址读取L2表中相应数据簇Cluster的起始偏移地址,如果为0,说明此扇区未分配,及不存在数据;若不为0,则说明此扇区已分配数据,记录此扇区地址;
c6、遍历步骤c5,即得到所有已分配Data Clusters(真实用户数据)的所有扇区地址信息。
图3为本发明基于内部快照读取虚拟磁盘所有扇区已变动数据的解析方法的一实施例,其解析虚拟磁盘的方法包括:
步骤301、对所述第一类型格式虚拟磁盘执行内部快照,生成新的内部快照;
步骤302、解析所述第一类型格式虚拟磁盘、所述新的内部快照及所述新的内部快照前的任意一个内部快照,获取所述第一类型格式虚拟磁盘的扇区总数、所述新的内部快照对应的一级索引表L1表及所述新的内部快照前的任意一个内部快照对应的一级索引表L1表;
步骤303、计算每个扇区映射在所述新的内部快照对应的L1表的偏移量,结合所述新的内部快照对应的L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
步骤304、计算每个扇区映射在所述新的内部快照前的任意一个内部快照的L1表偏移量,结合所述新的内部快照前的任意一个内部快照的L1表起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
步骤305、遍历对比每个扇区对应在所述新的内部快照和所述新的内部快照前的任意一个内部快照中分别所映射的数据簇的起始偏移地址,当所述两个数据簇的起始偏移地址相同时,说明此簇数据未改变;不相同时,说明此簇已重新分配,说明此扇区数据已变动,结合此扇区映射在所述新的内部快照中数据簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为所述第一类型格式虚拟磁盘在所述新的内部快照及所述新的内部快照前的任意一个内部快照间所有变动的真实数据集。
本发明提供一种具体的基于内部快照读取Qcow2格式虚拟磁盘所有扇区已变动数据的实施例对图3中所述方法做进一步说明:
d1、对Qcow2格式虚拟磁盘disk1触发接口执行内部快照2;
d2、通过读取disk1对应的内部快照1及disk1的Header信息,获取到内部快照1的偏移地址,进而得到其对应的L1表起始偏移地址,进而得到其对应的所有L2表起始偏移地址;
d3、通过内部快照2的Header信息,获取到内部快照2的偏移地址,进而得到其对应的L1表起始偏移地址,进而得到其对应的所有L2表起始偏移地址;
d4、分别解析步骤d2和步骤d3两个内部快照各自L2表对应的数据,即已分配的DataClusters的起始偏移地址;
d5、依次对比步骤d4中的数据,如果起始偏移地址不相同,说明本扇区相应数据已发生了变动。通过计算获取到所有已变动数据的扇区位于内部快照2的L2表对应的数据簇Cluster的偏移量,获取到并读取相应数据。
图4为本发明基于外部快照读取虚拟磁盘所有扇区全部数据的解析方法的一实施例,其解析虚拟磁盘的方法包括:
步骤401、对所述第一类型格式虚拟磁盘执行外部快照,生成新的外部快照;
步骤402、解析所述第一类型格式虚拟磁盘及所述新的外部快照之前生成的所有外部快照,获取所述第一类型格式虚拟磁盘的扇区总数及所述于所述新的外部快照之前生成的所有外部快照对应的一级索引表L1表;
步骤403、计算每个扇区映射在所述新的外部快照的上一级外部快照对应的L1表的偏移量,结合所述新的外部快照的上一级外部快照对应的L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
步骤404、若扇区映射的数据簇的起始偏移地址为0,则说明此扇区尚未在此外部快照中分配,需进一步获取此扇区在此外部快照的上一级外部快照中所映射的数据簇的起始偏移地址,若所述起始偏移地址仍为0,则需继续获取此扇区在上上一级外部快照中所映射的数据簇的起始偏移地址,,直至此扇区映射的数据簇起始偏移地址不为0或根磁盘,若此扇区在上述某一外部快照中或所述根磁盘中映射的数据簇的起始偏移地址不为0,说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
步骤405、若扇区映射的数据簇的起始偏移地址不为0,则说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
步骤406、遍历所有扇区,即可获得所述第一类型格式虚拟磁盘在执行所述新的外部快照时刻的全部真实数据集。
本发明提供一种具体的基于外部快照读取Qcow2格式虚拟磁盘所有扇区已变化数据的实施例对图4中所述方法做进一步说明:
e1、对disk1触发接口执行外部快照1,得到disk2→disk1(disk2为当前使用盘,disk1为disk2的backing_file)。
e2、读取disk2的Header信息,解析到相应的属性值;
e3、根据Header信息,获取到磁盘大小size及backing_file偏移地址,进而获取到backing_file的绝对路径(即disk1的绝对路径);
e4、根据步骤e2和e3,如磁盘链路较复杂,可依次获取到执行外部快照1后的磁盘链路关系;
e5、获取到链路关系后,只需剔除当前使用盘,依次获取其他磁盘的数据即可。(因当前使用盘为快照后生成,不包含需读取的数据)。即此例只需解析读取disk1;
e6、通过获取到的disk1的绝对路径,读取disk1的Header信息,解析到相应的属性值。
e7、通过Header信息获取到L1表的起始偏移地址;
e8、从0~size遍历每个扇区,如遍历第N个扇区时,通过运算获取本扇区位于L1表的偏移量,结合L1表的起始偏移地址获取到对应的L2表的起始偏移地址,进一步计算获取到本扇区所位于L2表的偏移量,结合L2表的起始偏移地址读取L2表中相应数据簇Cluster的起始偏移地址,如果为0,说明此扇区未分配,即不存在数据;若不为0,则说明此扇区已分配数据,记录此扇区地址;
e9、遍历步骤e8,即得到所有已分配Data Clusters(真实用户数据)的所有扇区地址信息;
e10、如磁盘disk1存在backing_file(disk0),则步骤e4、e5后需读取的磁盘为disk1和disk0,继续执行步骤e6、e7、e8,若第N个扇区已在disk1中分配,读取此扇区数据后继续遍历第N+1个扇区;如第N个扇区未在disk1中分配,则开始在disk0中检索此扇区是否已分配。具体方法为执行步骤e6、e7、e8,其中步骤e6相应改为“通过获取到的disk1的绝对路径,读取disk0的Header信息,解析到相应的属性值”。执行后若此扇区已在disk0中分配,读取此扇区数据后继续遍历第N+1个扇区;如第N个扇区未在disk0中分配,则说明第N个扇区未分配,跳过此扇区继续遍历第N+1个扇区。
图5为本发明基于外部快照读取虚拟磁盘所有扇区已变动数据的解析方法的一实施例,其解析虚拟磁盘的方法包括:
步骤501、对所述第一类型格式虚拟磁盘执行外部快照,生成新的外部快照;
步骤502、解析所述第一类型格式虚拟磁盘和所述新的外部快照获取所述第一类型格式虚拟磁盘的扇区总数和所有外部快照;
步骤503、解析获取所述第一类型格式虚拟磁盘的任意两次外部快照之间的所有外部快照的一级索引表L1表;
步骤504、计算每个扇区映射在所述第一类型格式虚拟磁盘的任意两个外部快照之间的所有外部快照中的最后生成的外部快照对应的L1表的偏移量,结合所述L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
步骤505、若扇区映射的数据簇的起始偏移地址为0,则说明此扇区尚未在此外部快照中分配,需进一步获取此扇区在此外部快照的上一级外部快照中所映射的数据簇的起始偏移地址,若所述起始偏移地址仍为0,则需继续获取此扇区在上上一级外部快照中所映射的数据簇的起始偏移地址,,直至所述第一类型格式虚拟磁盘的任意两次外部快照之间的所有外部快照中的最先生成的外部快照,若此扇区在上述某一外部快照中映射的数据簇的起始偏移地址不为0,则说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
步骤506、若扇区映射的数据簇的起始偏移地址不为0,则说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
步骤507、遍历所有扇区,即可获得所述第一类型格式虚拟磁盘在任意两次外部快照间的所有变动的真实数据集。
本发明提供一种具体的基于外部快照读取Qcow2格式虚拟磁盘所有扇区数据的实施例对图5中所述方法做进一步说明:
f1、对Qcow2格式虚拟磁盘disk1执行外部快照3,得到disk4,此时磁盘链路关系为disk4→disk3→disk2→disk1(disk4为当前使用盘,disk2、disk3分别对应外部快照1和外部快照2,disk1为根磁盘);
f2、读取disk4的Header信息,解析到相应的属性值;
f3、根据Header信息,获取到backing_file偏移地址,进而获取到backing_file(disk3)的绝对路径;
f4、根据步骤f2和f3,可依次获取到执行外部快照2后的各磁盘链路关系及disk1、disk2及disk3的绝对路径;
f5、通过查询外部快照1后磁盘的变化数据集,可知外部快照1后disk2、disk3为新增盘(disk4是为了保证disk3的数据一致性而生成),即保存外部快照1后的所有变化数据;
f6、获取disk3的Header信息,进而获取到磁盘大小size及L1表的起始偏移地址;
f7、从0~size遍历每个扇区,如遍历第N个扇区时,通过运算获取本扇区位于L1表的偏移量,结合L1表的起始偏移地址获取到对应的L2表的起始偏移地址,进一步计算获取到本扇区所位于L2表的偏移量,结合L2表的起始偏移地址读取L2表中相应Cluster的起始偏移地址,如果为0,说明此扇区未分配,若不为0,则说明此扇区已分配数据,记录此扇区地址;
f8、若f7中第N个扇区未在disk3分配,则需继续在disk2中检索此扇区,检索后若此扇区未在disk2分配,说明此扇区数据一直未改变,继续在disk3执行遍历第N+1个扇区;若此扇区在disk2中分配,说明此扇区数据已改变,记录此扇区地址后,继续在disk3磁盘执行遍历第N+1个扇区;
f9、遍历步骤f7、f8,即获取到所有已变化数据的扇区信息。
本发明还提供一种虚拟磁盘的解析系统,包括:用于将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,以供还原成所述第一类型格式虚拟磁盘数据或不同于所述第一类型格式虚拟磁盘的第二类型格式虚拟磁盘数据的解析模块。
所述解析模块,在一实施例中,如图6所示,包括:
预处理模块601:用于解析所述第一类型格式虚拟磁盘以获取所述第一类型格式虚拟磁盘的扇区总数和一级索引表L1表;
寻址模块602:计算每个扇区位于所述L1表的偏移量,结合所述L1表的起始偏移地址,获取此扇区位于所述L2表的起始偏移地址,结合此扇区映射在此L2表的偏移量,获取到此扇区映射的数据簇的起始偏移地址;
判断读取模块603:遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区未分配数据,若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为第一格式虚拟磁盘的全部真实数据集。
本发明还提供了一种将裸磁盘扇区真实数据写入到Qcow2格式虚拟磁盘的实施例:
如将第N个扇区写入到Qcow2格式虚拟磁盘disk1,需进行如下操作:
g1、读取disk1的Header信息,解析得到相应的属性值。
g2、通过N计算得到扇区所在L1表和L2表的偏移量。
g3、通过解析Header信息,查询L1表的起始偏移地址。如disk1中L1表尚未分配,则将L1表信息写入到disk1中。
g4、通过L1表的信息获取L2表的起始偏移地址,如L2表尚未分配,则将L2able信息写入到disk1中。
g5、通过L2表的起始偏移地址及此扇区所在L2表的偏移量,查询相应DataClusters信息。如Cluster尚未分配,则遍历所有Cluster信息,获取已分配的最大簇起始偏移地址,增加一个簇大小后,进而将簇信息写入到disk1中。
g6、此时已分配了Cluster,计算此扇区所在cluster的偏移量,将数据写入到此Cluster的相应偏移地址即可。
g7、步骤g4、g5、g6如手动写入L1表、L2表和Cluster信息时(即手动分配创建L1表、L2表和Cluster),需根据Header信息计算disk1的Refcount表(引用计数表)的偏移地址,计算得到需写入到引用计数表的偏移地址后,将引用计数信息写入到disk1中。
g8、此时即成功将裸磁盘数据重新组织格式化并写入为Qcow2磁盘中的数据。
综上所述,本发明虚拟磁盘的解析方法及系统,可实现基于扇区将Qcow2格式虚拟磁盘数据解析为裸磁盘数据,也可实现基于扇区将Qcow2格式虚拟磁盘内部快照或外部快照解析为裸磁盘,且能将裸磁盘(此裸磁盘可以是其他类型虚拟化平台备份而来)写入到qcow2格式虚拟磁盘中或其他不同的格式虚拟磁盘中,极大提高了备份的灵活性,便于基于不同客户情况采取不同的备份方案。可极大提升备份产品在市场上的优势。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (7)

1.一种虚拟磁盘的解析方法,其特征在于,将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,以供还原成所述第一类型格式虚拟磁盘数据或不同于所述第一类型格式虚拟磁盘的第二类型格式虚拟磁盘数据;
所述将第一类型格式虚拟磁盘的数据解析为裸磁盘数据采用下列步骤:
解析所述第一类型格式虚拟磁盘以获取所述第一类型格式虚拟磁盘的扇区总数及一级索引表L1表;
计算每个扇区映射在所述一级索引表L1表的偏移量,结合所述一级索引表L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区未分配数据,若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为第一格式虚拟磁盘的全部真实数据集。
2.根据权利要求1所述的虚拟磁盘的解析方法,其特征在于,将所述第一类型格式虚拟磁盘的数据解析为裸磁盘数据采用下列步骤:
对所述第一类型格式虚拟磁盘执行内部快照,生成新的内部快照;
解析所述第一类型格式虚拟磁盘和所述内部快照以获取所述第一类型格式虚拟磁盘的扇区总数及所述内部快照对应的一级索引表L1表;
计算每个扇区映射在所述一级索引表L1表的偏移量,结合所述一级索引表L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区尚未分配数据;若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为所述第一类型格式虚拟磁盘在执行所述内部快照时刻的全部真实数据集。
3.根据权利要求1所述的虚拟磁盘的解析方法,其特征在于,将所述第一类型格式虚拟磁盘的数据解析为裸磁盘数据采用下列步骤:
对所述第一类型格式虚拟磁盘执行内部快照,生成新的内部快照;
解析所述第一类型格式虚拟磁盘、所述新的内部快照及所述新的内部快照前的任意一个内部快照,获取所述第一类型格式虚拟磁盘的扇区总数、所述新的内部快照对应的一级索引表L1表及所述新的内部快照前的任意一个内部快照对应的一级索引表L1表;
计算每个扇区映射在所述新的内部快照对应的所述一级索引表L1表的偏移量,结合所述新的内部快照对应的所述一级索引表L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
计算每个扇区映射在所述新的内部快照前的任意一个内部快照的所述一级索引表L1表的偏移量,结合所述新的内部快照前的任意一个内部快照的所述一级索引表L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
遍历对比每个扇区对应在所述新的内部快照和所述新的内部快照前的任意一个内部快照中分别所映射的数据簇的起始偏移地址,当每个扇区对应在所述新的内部快照和所述新的内部快照前的任意一个内部快照中分别所映射的数据簇的起始偏移地址相同时,说明此簇数据未改变;不相同时,说明此簇已重新分配,说明此扇区数据已变动,结合此扇区映射在所述新的内部快照中数据簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为所述第一类型格式虚拟磁盘在所述新的内部快照及所述新的内部快照前的任意一次内部快照间所有变动的真实数据集。
4.根据权利要求1所述的虚拟磁盘的解析方法,其特征在于,将所述第一类型格式虚拟磁盘的数据解析为裸磁盘数据采用下列步骤:
对所述第一类型格式虚拟磁盘执行外部快照,生成新的外部快照;
解析所述第一类型格式虚拟磁盘及所述新的外部快照之前生成的所有外部快照,获取所述第一类型格式虚拟磁盘的扇区总数及所述于所述新的外部快照之前生成的所有外部快照对应的一级索引表L1表;
计算每个扇区映射在所述新的外部快照的上一级外部快照对应的所述一级索引表L1表的偏移量,结合所述新的外部快照的上一级外部快照对应的所述一级索引表L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
若扇区映射的数据簇的起始偏移地址为0,则说明此扇区尚未在此外部快照中分配,需进一步获取此扇区在此外部快照的上一级外部快照中所映射的数据簇的起始偏移地址,若所述起始偏移地址仍为0,则需继续获取此扇区在上上一级外部快照中所映射的数据簇的起始偏移地址,直至此扇区映射的数据簇起始偏移地址不为0或根磁盘,若此扇区在某一所述外部快照中或所述根磁盘中映射的数据簇的起始偏移地址不为0,说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
若扇区映射的数据簇的起始偏移地址不为0,则说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
遍历所有扇区,即可获得所述第一类型格式虚拟磁盘在执行所述新的外部快照时刻的全部真实数据集。
5.根据权利要求1所述的虚拟磁盘的解析方法,其特征在于,将所述第一类型格式虚拟磁盘的数据解析为裸磁盘数据采用下列步骤:
对所述第一类型格式虚拟磁盘执行外部快照,生成新的外部快照;
解析所述第一类型格式虚拟磁盘和所述新的外部快照获取所述第一类型格式虚拟磁盘的扇区总数和所有外部快照;
解析获取所述第一类型格式虚拟磁盘的任意两次外部快照之间的所有外部快照的一级索引表L1表;
计算每个扇区映射在所述第一类型格式虚拟磁盘的任意两个外部快照之间的所有外部快照中的最后生成的外部快照对应的所述一级索引表L1表的偏移量,结合所述一级索引表L1表的起始偏移地址,获取到此扇区所映射的二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区所映射的数据簇的起始偏移地址;
若扇区映射的数据簇的起始偏移地址为0,则说明此扇区尚未在此外部快照中分配,需进一步获取此扇区在此外部快照的上一级外部快照中所映射的数据簇的起始偏移地址,若所述起始偏移地址仍为0,则需继续获取此扇区在上上一级外部快照中所映射的数据簇的起始偏移地址,直至所述第一类型格式虚拟磁盘的任意两次外部快照之间的所有外部快照中的最先生成的外部快照,若此扇区在某一所述外部快照中映射的数据簇的起始偏移地址不为0,则说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
若扇区映射的数据簇的起始偏移地址不为0,则说明此扇区已分配,并且此数据簇中存储着此扇区的最新数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据;
遍历所有扇区,即可获得所述第一类型格式虚拟磁盘在任意两次外部快照间的所有变动的真实数据集。
6.根据权利要求1至5中任一权利要求所述的虚拟磁盘的解析方法,其特征在于,所述的第一类型格式虚拟磁盘为Qcow2格式虚拟磁盘。
7.一种虚拟磁盘的解析系统,其特征在于,包括:用于将第一类型格式虚拟磁盘的数据解析为裸磁盘数据,以供还原成所述第一类型格式虚拟磁盘数据或不同于所述第一类型格式虚拟磁盘的第二类型格式虚拟磁盘数据的解析模块;
所述解析模块包括:预处理模块:用于解析所述第一类型格式虚拟磁盘以获取所述第一类型格式虚拟磁盘的扇区总数和一级索引表L1表;
寻址模块:计算每个扇区位于所述一级索引表L1表的偏移量,结合所述一级索引表L1表的起始偏移地址,获取此扇区位于二级索引表L2表的起始偏移地址,结合此扇区映射在所述二级索引表L2表的偏移量,获取到此扇区映射的数据簇的起始偏移地址;
判断读取模块:遍历获取每个扇区所映射数据簇的起始偏移地址,若起始偏移地址为0,则说明此扇区未分配数据,若起始偏移地址不为0,则说明此扇区已经分配数据,结合此扇区映射在此簇的偏移量,获取到此扇区相对于此磁盘文件起始地址的偏移地址,即可读取此扇区对应的数据,遍历读取到的数据集即为第一格式虚拟磁盘的全部真实数据集。
CN201710124719.XA 2017-03-03 2017-03-03 一种虚拟磁盘的解析方法及系统 Active CN106919477B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710124719.XA CN106919477B (zh) 2017-03-03 2017-03-03 一种虚拟磁盘的解析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710124719.XA CN106919477B (zh) 2017-03-03 2017-03-03 一种虚拟磁盘的解析方法及系统

Publications (2)

Publication Number Publication Date
CN106919477A CN106919477A (zh) 2017-07-04
CN106919477B true CN106919477B (zh) 2020-05-22

Family

ID=59460381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710124719.XA Active CN106919477B (zh) 2017-03-03 2017-03-03 一种虚拟磁盘的解析方法及系统

Country Status (1)

Country Link
CN (1) CN106919477B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032838B (zh) * 2018-06-28 2022-07-15 上海爱数信息技术股份有限公司 虚拟机备份恢复数据一致性的自动校验方法
CN111966526A (zh) * 2019-05-20 2020-11-20 中兴通讯股份有限公司 一种基于云平台数据中心的虚拟机备份方法及装置
CN111125010B (zh) * 2019-12-20 2022-05-10 北京浪潮数据技术有限公司 一种裸磁盘文件在线迁移的方法、系统及设备
CN111198750A (zh) * 2020-01-06 2020-05-26 紫光云技术有限公司 一种提高虚拟磁盘读写性能的方法
CN114296649B (zh) * 2021-12-27 2024-01-02 天翼云科技有限公司 云间业务迁移系统
CN117349086B (zh) * 2023-12-04 2024-02-23 四川精容数安科技有限公司 一种Windows整机永久增量备份的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664923A (zh) * 2012-03-30 2012-09-12 浪潮电子信息产业股份有限公司 一种利用Linux全局文件系统实现共享存储池的方法
CN103744743A (zh) * 2014-01-17 2014-04-23 浪潮电子信息产业股份有限公司 一种基于数据库rac模式心跳信号的冗余配置的方法
CN104063294A (zh) * 2014-07-07 2014-09-24 国家电网公司 一种Linux系统备份和恢复方法
CN104937570A (zh) * 2013-01-29 2015-09-23 惠普发展公司,有限责任合伙企业 从原始图像备份数据恢复文件系统对象

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6021594B2 (ja) * 2012-11-08 2016-11-09 オリンパス株式会社 撮像装置及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664923A (zh) * 2012-03-30 2012-09-12 浪潮电子信息产业股份有限公司 一种利用Linux全局文件系统实现共享存储池的方法
CN104937570A (zh) * 2013-01-29 2015-09-23 惠普发展公司,有限责任合伙企业 从原始图像备份数据恢复文件系统对象
CN103744743A (zh) * 2014-01-17 2014-04-23 浪潮电子信息产业股份有限公司 一种基于数据库rac模式心跳信号的冗余配置的方法
CN104063294A (zh) * 2014-07-07 2014-09-24 国家电网公司 一种Linux系统备份和恢复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
集群环境下数据库的数据安全保护;艾锟、王帅;《启明星辰》;20081231;第06卷(第8期);第72-75页 *

Also Published As

Publication number Publication date
CN106919477A (zh) 2017-07-04

Similar Documents

Publication Publication Date Title
CN106919477B (zh) 一种虚拟磁盘的解析方法及系统
US10762038B2 (en) System and method for virtual machine conversion
CN110531940B (zh) 视频文件处理方法及装置
US10977124B2 (en) Distributed storage system, data storage method, and software program
US8812446B2 (en) Block level backup and restore
US9747207B2 (en) Crash-proof cache data protection method and system
US11314420B2 (en) Data replica control
WO2016086819A1 (zh) 将数据写入叠瓦状磁记录smr硬盘的方法及装置
US8732411B1 (en) Data de-duplication for information storage systems
US8954399B1 (en) Data de-duplication for information storage systems
US8392423B2 (en) Data set index record preservation
US8799595B1 (en) Eliminating duplicate data in storage systems with boot consolidation
US11010334B2 (en) Optimal snapshot deletion
US10572184B2 (en) Garbage collection in data storage systems
US8825936B2 (en) Systems and methods for increasing data volume sparseness
US8732427B2 (en) Systems and methods for collapsing a derivative version of a primary storage volume
CN103430178A (zh) 数据更新方法及装置和产品
CN105302665A (zh) 一种改进的写时拷贝快照方法及系统
US9535796B2 (en) Method, apparatus and computer for data operation
CN104461759B (zh) 一种内存多位错误的处理方法及装置
US8413114B1 (en) Method to simplify developing software having localization
US10268411B1 (en) Policy and heuristic based conversion of write-optimized virtual disk format into read-optimized virtual disk format
CN109871355B (zh) 一种快照元数据存储方法、装置及设备、介质
US11429287B2 (en) Method, electronic device, and computer program product for managing storage system
Shinde et al. Inline block level data de-duplication technique for ext4 file system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant