CN115543697B - 电子档案存储方法、装置、电子设备和存储介质 - Google Patents

电子档案存储方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115543697B
CN115543697B CN202211513681.2A CN202211513681A CN115543697B CN 115543697 B CN115543697 B CN 115543697B CN 202211513681 A CN202211513681 A CN 202211513681A CN 115543697 B CN115543697 B CN 115543697B
Authority
CN
China
Prior art keywords
packet
data
electronic
storage
xor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211513681.2A
Other languages
English (en)
Other versions
CN115543697A (zh
Inventor
杨蔚乔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Netzhiyitong Technology Co ltd
Original Assignee
Beijing Netzhiyitong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Netzhiyitong Technology Co ltd filed Critical Beijing Netzhiyitong Technology Co ltd
Priority to CN202211513681.2A priority Critical patent/CN115543697B/zh
Publication of CN115543697A publication Critical patent/CN115543697A/zh
Application granted granted Critical
Publication of CN115543697B publication Critical patent/CN115543697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Abstract

本发明涉及数据处理技术领域,提供一种电子档案存储方法、装置、电子设备和存储介质。方法包括:确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;将多个电子档案存储于多个存储介质;确定多个存储介质中每一存储介质所存储的数据包;基于各数据包之间的数据差异,确定目标校验包,并将目标校验包存储于校验介质,目标校验包用于恢复任一数据包。本发明可以在任一存储介质损坏时,通过目标校验包和其他存储介质的数据包恢复得到该损坏介质的数据包,进而确保电子档案存储的安全性,从而只需生成目标校验包即可确保电子档案存储的安全性,无需对各电子档案均进行备份,从而降低存储资源的浪费。

Description

电子档案存储方法、装置、电子设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种电子档案存储方法、装置、电子设备和存储介质。
背景技术
随着科技的迅速发展和信息化的飞速发展,电子档案的应用场景越来越广。电子档案指的是对实体档案进行数字化得到的档案。电子档案通常需要长期保存至存储介质,然而存储介质可能意外损坏或退化等,导致电子档案的信息丢失。因此,对电子档案进行长期保存时,需要确保电子档案存储的安全性。
目前,通过对电子档案进行备份,确保电子档案存储的安全性。然而,通过软件备份方式进行备份,依赖于软件,且数据恢复只能通过软件恢复,一旦软件依赖的操作系统或环境变化时,将无法通过软件读取备份的电子档案;即使将电子档案备份于多个存储介质中,可以不依赖于软件,但需要耗费过多的存储空间才能确保电子档案存储的安全性。
发明内容
本发明提供一种电子档案存储方法、装置、电子设备和存储介质,用以解决现有技术中存储空间耗费过多的缺陷。
本发明提供一种电子档案存储方法,包括:
确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;
将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;
确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;
基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包。
根据本发明提供的一种电子档案存储方法,所述基于各所述数据包之间的数据差异,确定目标校验包,包括:
确定各所述数据包的比特位数,并确定各所述比特位数中的最大比特位数;
基于所述最大比特位数,补齐各所述数据包;
基于各补齐后的数据包之间的数据差异,确定目标校验包。
根据本发明提供的一种电子档案存储方法,所述基于各补齐后的数据包之间的数据差异,确定目标校验包,包括:
排序各补齐后的数据包,并基于排序结果从所述各补齐后的数据包中确定出第一个数据包和第二个数据包;
对所述第一个数据包与所述第二个数据包进行按位异或计算,得到第一校验包,将所述第一校验包作为第二个异或轮次的校验包;
基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包,并确定所述当前异或轮次的校验包;
对所述当前异或轮次的数据包与所述当前异或轮次的校验包进行按位异或计算,得到第二校验包;
将所述第二校验包作为下一异或轮次的校验包,返回所述基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包的步骤,直至所述当前异或轮次为最后一个异或轮次,将最后一个异或轮次的所述第二校验包确定为目标校验包。
根据本发明提供的一种电子档案存储方法,还包括:
将各所述数据包的比特位数和所述排序结果存储于所述校验介质。
根据本发明提供的一种电子档案存储方法,所述将所述多个电子档案存储于所述多个存储介质,包括:
确定各所述电子档案的数据量,以及各所述存储介质的存储量;
基于各所述数据量和各所述存储量,分配各所述存储介质所需存储的所述电子档案;
基于分配结果,将所述多个电子档案存储于所述多个存储介质。
根据本发明提供的一种电子档案存储方法,所述将所述多个电子档案存储于所述多个存储介质,包括:
确定各所述电子档案的描述文件,任一所述电子档案对应一个描述文件,所述描述文件用于记载电子档案的元数据;
分别将各所述电子档案与对应的所述描述文件进行打包处理,得到多个档案存储包,所述电子档案包括若干文件;
将所述多个档案存储包存储于所述多个存储介质。
根据本发明提供的一种电子档案存储方法,所述基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,之后还包括:
在所述多个存储介质中存在待恢复数据的待恢复存储介质的情况下,获取所述校验介质中的所述目标校验包,以及所述多个存储介质所存储的目标数据包;
基于所述目标校验包和所述目标数据包,生成所述待恢复存储介质的恢复数据包。
根据本发明提供的一种电子档案存储方法,所述多个存储介质均为蓝光光盘。
本发明还提供一种电子档案存储装置,包括:
档案确定模块,用于确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;
档案存储模块,用于将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;
数据包确定模块,用于确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;
校验包确定模块,用于基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述电子档案存储方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述电子档案存储方法。
本发明提供的电子档案存储方法、装置、电子设备和存储介质,将多个电子档案存储于多个存储介质,并确保任一存储介质存储有至少一个电子档案,进而让每个存储介质均存储有电子档案,减少存储介质所存储的数据包的数据量,进而减少目标校验包的数据量,最终降低存储资源的浪费;同时,任一存储介质所存储的数据包是基于至少一个电子档案确定得到的,即任一电子档案完整存储至一个存储介质,从而电子档案可以不依赖于专用软件即可读取,进而提高电子档案存储的安全性。基于各数据包之间的数据差异,确定目标校验包,从而可以在任一存储介质损坏时,通过目标校验包和其他存储介质的数据包恢复得到该损坏介质的数据包,进而确保电子档案存储的安全性,从而只需生成目标校验包即可确保电子档案存储的安全性,无需对各电子档案均进行备份,从而降低存储资源的浪费。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的电子档案存储方法的流程示意图之一;
图2为本发明提供的电子档案存储方法的流程示意图之二;
图3为本发明提供的电子档案存储方法的流程示意图之三;
图4为本发明提供的电子档案存储方法的流程示意图之四;
图5为本发明提供的电子档案存储装置的结构示意图;
图6为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出以下各实施例。图1为本发明提供的电子档案存储方法的流程示意图之一,如图1所示,该电子档案存储方法包括:
步骤110,确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质。
此处,多个电子档案均为待存储的电子档案,即需要存储至存储介质的电子档案。任一电子档案包括至少一个文件,该电子档案内的文件可以为二进制文件。
此外,还可以确定各电子档案的描述文件,任一电子档案对应一个描述文件,该描述文件用于记载电子档案的元数据。
此处,存储介质可以包括但不限于:光盘、磁盘、磁带、硬盘等等。在一实施例中,多个存储介质均为光盘,从而提高电子档案的保存年限。
在一实施例中,获取介质数量设定指令,基于该介质数量设定指令指示的介质数量确定多个存储介质。该介质数量设定指令可以由用户触发。
在另一实施例中,获取介质设定指令,基于该介质设定指令确定多个存储介质。该介质设定指令可以由用户触发,该介质设定指令可以用于指示存储介质的编号,以供自主选择存储介质,也可以用于指示介质数量。
步骤120,将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案。
在本发明实施例中,多个电子档案以单份电子档案为单位进行存储,即任一电子档案完整存储至一个存储介质,从而电子档案可以不依赖于专用软件即可读取,进而提高电子档案存储的安全性。
需要说明的是,多个电子档案的数量大于多个存储介质的数量,基于此,一个存储介质存储有至少一个电子档案,尽可能让每个存储介质均存储有电子档案,减少存储介质所存储的数据包的数据量,减少恢复数据包的数据量,且减少目标校验包的数据量,进而减少存储资源的浪费。
在一实施例中,将多个电子档案按照数据量尽可能平均存储于多个存储介质。例如,多个存储介质的数量为N,将多个电子档案按照数据量大小近乎平均分成N组,以使每一存储介质所存储的数据包的数据量尽可能平均,进而使后续的目标校验包的长度尽可能小,从而减少存储资源的浪费。当然,任一电子档案需要完整存储于一个存储介质,且任一存储介质所存储的数据包的长度不能超过该存储介质的存储量。
在另一实施例中,将多个电子档案按照档案数尽可能平均存储于多个存储介质。例如,多个存储介质的数量为N,将多个电子档案按照档案数近乎平均分成N组,以使每一存储介质所存储的档案数尽可能平均,进而使后续的目标校验包的长度尽可能小,从而减少存储资源的浪费。当然,任一存储介质所存储的数据包的长度不能超过该存储介质的存储量。
在一实施例中,将各电子档案进行打包处理,得到多个档案存储包,将多个档案存储包存储于多个存储介质。一个电子档案对应一个档案存储包。更为具体地,将任一电子档案内的若干文件进行打包处理,得到一个档案存储包。该打包处理的方式通常采用通用压缩格式,例如zip压缩格式,从而因为格式通用,无需保留软件即可读取,并无需保留解压缩工具,从而减少存储资源的浪费。
步骤130,确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的。
此处,若一个存储介质仅存储一个电子档案,则该存储介质所存储的数据包是基于该电子档案生成的;若该电子档案包括多个文件,则该存储介质所存储的数据包是基于该多个文件顺序连接而成的。若一个存储介质存储多个电子档案,则该存储介质所存储的数据包是基于多个电子档案顺序连接而成的。
步骤140,基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包。
此处,目标校验包可以结合多个存储介质中的若干数据包,恢复得到一数据包。
此处,校验介质可以包括但不限于:光盘、磁带、磁盘、硬盘等等。在一实施例中,该校验介质可以为光盘,从而提高目标校验包的保存年限,进而提高电子档案存储的安全性。
具体地,基于各数据包之间的二进制数据差异,确定目标校验包。
在一实施例中,基于各数据包之间的数据差异,确定一个目标校验包。
在另一实施例中,基于各数据包之间的数据差异,确定多个目标校验包。例如,该多个目标校验包的数量为M,该数据包的数量为N,N=M+1,即基于两个数据包之间的数据差异确定一个目标校验包,如对任两个数据包进行按位异或计算或按位同或计算得到一个目标校验包。
需要说明的是,假设多个存储介质的数量为N,若采用介质备份的方式确保电子档案存储的安全性,则至少需要2*N个存储介质,而本发明实施例,只需要N个存储介质和1个校验介质,进而降低存储资源的浪费,即一个存储介质损坏时,可以通过该校验介质和其他N-1个存储介质恢复丢失的数据。
本发明实施例提供的电子档案存储方法,将多个电子档案存储于多个存储介质,并确保任一存储介质存储有至少一个电子档案,进而让每个存储介质均存储有电子档案,减少存储介质所存储的数据包的数据量,进而减少目标校验包的数据量,最终降低存储资源的浪费;同时,任一存储介质所存储的数据包是基于至少一个电子档案确定得到的,即任一电子档案完整存储至一个存储介质,从而电子档案可以不依赖于专用软件即可读取,进而提高电子档案存储的安全性。基于各数据包之间的数据差异,确定目标校验包,从而可以在任一存储介质损坏时,通过目标校验包和其他存储介质的数据包恢复得到该损坏介质的数据包,进而确保电子档案存储的安全性,从而只需生成目标校验包即可确保电子档案存储的安全性,无需对各电子档案均进行备份,从而降低存储资源的浪费。
基于上述实施例,图2为本发明提供的电子档案存储方法的流程示意图之二,如图2所示,上述步骤140中,基于各所述数据包之间的数据差异,确定目标校验包,包括:
步骤141,确定各所述数据包的比特位数,并确定各所述比特位数中的最大比特位数。
此处,最大比特位数指的是各比特位数中值最大的比特位数。例如,多个存储介质的数量为N,则N个数据包对应有N个比特位数,该最大比特位数为N个比特位数中的最大值。
步骤142,基于所述最大比特位数,补齐各所述数据包。
具体地,基于最大比特位数,补齐各数据包,以使补齐后的各数据包的比特位数均为最大比特位数,换言之,使补齐后的各数据包的比特位数相同,以供后续更好地确定目标校验包。
在一实施例中,通过0补齐各数据包。在另一实施例中,通过1补齐各数据包。
在一实施例中,在数据包的后面部分补齐比特,例如,最大比特位数为16,数据包为11011101,则补齐后的数据包可以为1101110100000000或者1101110111111111。
在另一实施例中,在数据包的前面部分补齐比特,例如,最大比特位数为16,数据包为11011101,则补齐后的数据包可以为0000000011011101或者1111111111011101。
步骤143,基于各补齐后的数据包之间的数据差异,确定目标校验包。
具体地,基于各补齐后的数据包之间的二进制数据差异,确定目标校验包。
在一些实施例中,基于各补齐后的数据包之间的二进制数据差异,确定一个目标校验包。
在一实施例中,排序各补齐后的数据包,并基于排序结果从各补齐后的数据包中确定出第一个数据包和第二个数据包;对第一个数据包与第二个数据包进行按位异或计算,得到第一校验包,将第一校验包作为第二个异或轮次的校验包;基于排序结果,从各补齐后的数据包中确定出当前异或轮次的数据包,并确定当前异或轮次的校验包;对当前异或轮次的数据包与当前异或轮次的校验包进行按位异或计算,得到第二校验包;将第二校验包作为下一异或轮次的校验包,返回基于排序结果,从各补齐后的数据包中确定出当前异或轮次的数据包的步骤,直至当前异或轮次为最后一个异或轮次,将最后一个异或轮次的第二校验包确定为目标校验包。
在另一实施例中,排序各补齐后的数据包,并基于排序结果从各补齐后的数据包中确定出第一个数据包和第二个数据包;对第一个数据包与第二个数据包进行按位同或计算,得到第一校验包,将第一校验包作为第二个同或轮次的校验包;基于排序结果,从各补齐后的数据包中确定出当前同或轮次的数据包,并确定当前同或轮次的校验包;对当前同或轮次的数据包与当前同或轮次的校验包进行按位同或计算,得到第二校验包;将第二校验包作为下一同或轮次的校验包,返回基于排序结果,从各补齐后的数据包中确定出当前同或轮次的数据包的步骤,直至当前同或轮次为最后一个同或轮次,将最后一个同或轮次的第二校验包确定为目标校验包。
在另一些实施例中,基于各补齐后的数据包之间的二进制数据差异,确定多个目标校验包。例如,该多个目标校验包的数量为M,该数据包的数量为N,N=M+1,即基于两个补齐后的数据包之间的二进制数据差异确定一个目标校验包,如对任两个补齐后的数据包进行按位异或计算或按位同或计算得到一个目标校验包。
本发明实施例提供的电子档案存储方法,基于各数据包的比特位数中的最大比特位数,补齐各数据包,使各补齐后的数据包的比特位数相同,从而基于各补齐后的数据包之间的数据差异,可以更好地确定目标校验包,进而确保通过目标校验包可以完整恢复得到数据包,进而进一步提高电子档案存储的安全性。
基于上述任一实施例,图3为本发明提供的电子档案存储方法的流程示意图之三,如图3所示,上述步骤143包括:
步骤1431,排序各补齐后的数据包,并基于排序结果从所述各补齐后的数据包中确定出第一个数据包和第二个数据包。
此处,各补齐后的数据包可以随机排序,也可以根据实际需求排序,还可以根据用户的指令,确定排序方式,本发明实施例对此不作具体限定。
此处,排序结果用于表征各补齐后的数据包的顺序。例如,各补齐后的数据包的数量为10个,排序后的各数据包按照顺序划分为第一个数据包、第二个数据包、第三个数据包、第四个数据包、第五个数据包、第六个数据包、第七个数据包、第八个数据包、第九个数据包、第十个数据包。
第一个数据包为排序第一的数据包,第二个数据包为排序第二的数据包。
步骤1432,对所述第一个数据包与所述第二个数据包进行按位异或计算,得到第一校验包,将所述第一校验包作为第二个异或轮次的校验包。
此处,第一校验包的数量为1,该第一校验包的比特位数为最大比特位数。
需要说明的是,第一个异或轮次不存在校验包,因此,需要将第一个数据包与第二个数据包进行按位异或计算,得到第一校验包,且该第一校验包作为第二个异或轮次的校验包,以在第二个异或轮次中,将该第一校验包与第三个数据包进行按位异或计算,得到第二校验包,并将该第二校验包作为第三个异或轮次的校验包,以在第三个异或轮次中,将该第三个异或轮次的校验包与第四个数据包进行按位异或计算,得到第四个异或轮次的校验包,依此类推,直至最后一个异或轮次,将最后一个异或轮次的第二校验包确定为目标校验包。
可以理解的是,将第一校验包与第一个数据包进行按位异或计算,可以得到第二个数据包。将第一校验包与第二个数据包进行按位异或计算,可以得到第一个数据包。
例如,第一个数据包为1101110111011101,第二个数据包为1010101010101010,则第一校验包为0111011101110111。
步骤1433,基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包,并确定所述当前异或轮次的校验包。
此处,当前异或轮次可以为第二个异或轮次至最后一个异或轮次。例如,当前异或轮次为第n个异或轮次,则当前异或轮次的数据包为第n+1个数据包,如第二个异或轮次的数据包为第三个数据包。
此处,当前异或轮次的校验包为上一异或轮次确定的校验包。例如,当前异或轮次为第n个异或轮次,则当前异或轮次的校验包为第n-1个异或轮次确定的校验包,如第二个异或轮次的校验包为第一个异或轮次确定的第一校验包,第三个异或轮次的校验包为第二个异或轮次确定的第二校验包,第四个异或轮次的校验包为第三个异或轮次确定的第二校验包。
步骤1434,对所述当前异或轮次的数据包与所述当前异或轮次的校验包进行按位异或计算,得到第二校验包。
此处,第二校验包的数量为多个,假设各补齐后的数据包的数量为N,则第二校验包的数量为N-2,该第二校验包的比特位数为最大比特位数。
可以理解的是,将该第二校验包与当前异或轮次的数据包进行按位异或计算,可以得到当前异或轮次的校验包。将该第二校验包与当前异或轮次的校验包进行按位异或计算,可以得到当前异或轮次的数据包。
例如,当前异或轮次的数据包为1101110111011101,当前异或轮次的校验包为1010101010101010,则第二校验包为0111011101110111。
步骤1435,将所述第二校验包作为下一异或轮次的校验包,返回所述基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包的步骤,直至所述当前异或轮次为最后一个异或轮次,将最后一个异或轮次的所述第二校验包确定为目标校验包。
此处,目标校验包的数量为1个,该目标校验包的比特位数为最大比特位数。需要说明的是,不断执行步骤1433和步骤1434,最终可以得到该目标校验包。
为便于理解,此处以一特定实施例进行说明。例如,各补齐后的数据包的数量为5,按照顺序划分为第一个数据包、第二个数据包、第三个数据包、第四个数据包、第五个数据包;异或轮次的数量为4,其划分为第一个异或轮次、第二个异或轮次、第三个异或轮次、第四个异或轮次;第二校验包的数量为3个。具体地,在第一个异或轮次中,对第一个数据包与第二个数据包进行按位异或计算,得到第一校验包,并将该第一校验包作为第二个异或轮次的校验包;在第二个异或轮次中,对第三个数据包与第二个异或轮次的校验包进行按位异或计算,得到第三个异或轮次的校验包;在第三个异或轮次中,对第四个数据包与第三个异或轮次的校验包进行按位异或计算,得到第四个异或轮次的校验包;在第四个异或轮次中,对第五个数据包与第四个异或轮次的校验包进行按位异或计算,得到目标校验包。
本发明实施例提供的电子档案存储方法,先对第一个数据包与第二个数据包进行按位异或计算,得到第一校验包,然后再依次对当前异或轮次的数据包与当前异或轮次的校验包进行按位异或计算,得到第二校验包,直至当前异或轮次为最后一个异或轮次,将最后一个异或轮次的第二校验包确定为目标校验包,从而为目标校验包的确定提供支持,且该目标校验包的数量为1个,相比多个目标校验包,仅增加一部分保存空间,即可以在任一存储介质损坏时,通过一个目标校验包和其他存储介质的数据包恢复得到该损坏介质的数据包,进而确保电子档案存储的安全性,最终进一步降低存储资源的浪费。
基于上述任一实施例,该方法还包括:
将各所述数据包的比特位数和所述排序结果存储于所述校验介质。
需要说明的是,在多个存储介质中存在待恢复数据的待恢复存储介质的情况下,获取校验介质中的目标校验包,以及多个存储介质所存储的目标数据包之后,还需要获取校验介质中的排序结果,从而基于该排序结果得知恢复的异或顺序,在基于异或顺序、目标校验包和目标数据包生成初始恢复数据包后,还需要获取校验介质中该待恢复存储介质对应的数据包的比特位数,进而基于该比特位数对初始恢复数据包进行比特删减得到待恢复存储介质的恢复数据包。
为便于理解,此处以一特定实施例进行说明。例如,各补齐后的数据包的数量为5,按照顺序划分为第一个数据包、第二个数据包、第三个数据包、第四个数据包、第五个数据包;异或轮次的数量为4;第二校验包的数量为3个。具体地,基于排序结果,确定第一个异或轮次、第二个异或轮次、第三个异或轮次、第四个异或轮次;若待恢复存储介质为第一个数据包对应的存储介质,则对目标校验包和第五个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第四个异或轮次的校验包和第四个数据包进行按位异或计算,得到第三个异或轮次的校验包;对第三个异或轮次的校验包和第三个数据包进行按位异或计算,得到第二个异或轮次的校验包(第一校验包);对第一校验包和第二个数据包进行按位异或计算,得到第一个数据包,从而完成数据恢复。若待恢复存储介质为第五个数据包对应的存储介质,则对第一个数据包与第二个数据包进行按位异或计算,得到第一校验包;对第一校验包和第三个数据包进行按位异或计算,得到第三个异或轮次的校验包;对第三个异或轮次的校验包和第四个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第四个异或轮次的校验包和目标校验包进行按位异或计算,得到第五个数据包,从而完成数据恢复。
例如,初始恢复数据包为1011101100000000,而该待恢复存储介质对应的数据包的比特位数为8,则对初始恢复数据包进行比特删减得到10111011。
本发明实施例提供的电子档案存储方法,将各数据包的比特位数和排序结果存储于校验介质,以供在任一存储介质损坏时,通过目标校验包和其他存储介质的数据包,以及各数据包的比特位数和排序结果,可以更为准确恢复得到该损坏介质的数据包,进而进一步提高电子档案存储的安全性。
基于上述任一实施例,该方法中,上述步骤120包括步骤121、步骤122和步骤123。
步骤121,确定各所述电子档案的数据量,以及各所述存储介质的存储量。
此处,数据量用于表征电子档案的数据大小。可以理解的是,每个电子档案的数据量不同。
此处,存储量用于表征存储介质的存储空间大小(存储容量)。可以理解的是,每个存储介质的存储量不同。
步骤122,基于各所述数据量和各所述存储量,分配各所述存储介质所需存储的所述电子档案。
具体地,基于各数据量和存储介质的个数,平均分配各电子档案,得到多个电子档案组,任一电子档案组包括至少一个电子档案,电子档案组的数量与存储介质的数量相同;基于各存储量,将多个电子档案组分配至多个存储介质,确保存储至存储介质的电子档案组的数据量不超过该存储介质的存储量。
例如,电子档案的数量为10,第一电子档案的数据量为10MB,第二电子档案的数据量为8MB,第三电子档案的数据量为9MB,第四电子档案的数据量为11MB,第五电子档案的数据量为12MB,第六电子档案的数据量为10MB,第七电子档案的数据量为12MB,第八电子档案的数据量为9MB,第九电子档案的数据量为11MB,第十电子档案的数据量为8MB;存储介质的数量为5,第一存储介质的存储量为20MB,第二存储介质的存储量为30MB,第三存储介质的存储量为18MB,第四存储介质的存储量为20MB,第五存储介质的存储量为40MB。首先,基于各数据量和存储介质的个数,平均分配各电子档案,得到多个电子档案组,如第一个电子档案组包括第一电子档案和第六电子档案,第二个电子档案组包括第第二电子档案和第五电子档案,第三个电子档案组包括第三电子档案和第四电子档案,第四个电子档案组包括第七电子档案和第十电子档案,第五个电子档案组包括第八电子档案和第九电子档案;然后,基于各存储量,更新各电子档案组,以使第一个电子档案组包括第一电子档案和第二电子档案,第二个电子档案组包括第八电子档案和第五电子档案,第三个电子档案组包括第三电子档案和第四电子档案,第四个电子档案组包括第七电子档案和第十电子档案,第五个电子档案组包括第六电子档案和第九电子档案,进而将第一个电子档案组分配至第三存储介质,将第二个电子档案组分配至第二存储介质,将第三个电子档案组分配至第一存储介质,将第四个电子档案组分配至第四存储介质,将第五个电子档案组分配至第五存储介质,以使每一存储介质所存储的数据包的数据量尽可能平均,进而使后续的目标校验包的长度尽可能小,从而减少存储资源的浪费,此处的目标校验包的长度为21MB。
步骤123,基于分配结果,将所述多个电子档案存储于所述多个存储介质。
具体地,基于上述分配结果,将多个电子档案存储于多个存储介质。一个存储介质存储有至少一个电子档案,尽可能让每个存储介质均存储有电子档案,减少存储介质所存储的数据包的数据量,减少恢复数据包的数据量,且减少目标校验包的数据量,进而减少存储资源的浪费。
本发明实施例提供的电子档案存储方法,基于各电子档案的数据量和各存储介质的存储量,可以更好地分配各存储介质所需存储的电子档案,进而使每一存储介质所存储的数据包的最大长度最小,从而使后续的目标校验包的长度最小,最终进一步降低存储资源的浪费。
基于上述任一实施例,该方法中,上述步骤120包括步骤124、步骤125和步骤126。
步骤124,确定各所述电子档案的描述文件,任一所述电子档案对应一个描述文件,所述描述文件用于记载电子档案的元数据。
此处,元数据为对各种信息资源进行结构化的描述,提供关于新型资源或数据的一种结构化数据。该元数据可以对各种电子数据本身的特征和属性进行描述。在一实施例中,描述文件的描述格式可以参照DA/T48-2009的规定。
步骤125,分别将各所述电子档案与对应的所述描述文件进行打包处理,得到多个档案存储包,所述电子档案包括若干文件。
此处,档案存储包的数量与电子档案的数量相同。该电子档案可以包括1个或多个文件,若包括多个文件,则将多个文件全部一起打包。在一实施例中,电子档案包括若干二进制文件。
此处,打包处理的方式可以根据实际需要进行设定。在一实施例中,采用通用压缩格式,例如zip压缩格式,从而因为格式通用,无需保留软件即可读取,并无需保留解压缩工具,从而降低存储资源的浪费。
具体地,将各电子档案逐份打包,即一个电子档案与其对应的一个描述文件进行打包处理,得到一个档案存储包。
步骤126,将所述多个档案存储包存储于所述多个存储介质。
在本发明实施例中,多个档案存储包以单份档案存储包为单位进行存储,即任一档案存储包完整存储至一个存储介质,从而电子档案可以不依赖于专用软件即可读取,进而提高电子档案存储的安全性。
需要说明的是,多个档案存储包的数量大于多个存储介质的数量,基于此,一个存储介质存储有至少一个档案存储包,尽可能让每个存储介质均存储有档案存储包,减少存储介质所存储的数据包的数据量,减少恢复数据包的数据量,且减少目标校验包的数据量,进而减少存储资源的浪费。
在一实施例中,确定各档案存储包的数据量,以及各存储介质的存储量;基于各数据量和各存储量,分配各存储介质所需存储的档案存储包;基于分配结果,将多个档案存储包存储于多个存储介质。具体的执行过程参照上述实施例,此处不再一一赘述。
在另一实施例中,将多个档案存储包按照档案数尽可能平均存储于多个存储介质。例如,多个存储介质的数量为N,将多个档案存储包按照档案数近乎平均分成N组,以使每一存储介质所存储的档案数尽可能平均,进而使后续的目标校验包的长度尽可能小,从而减少存储资源的浪费。当然,任一存储介质所存储的数据包的长度不能超过该存储介质的存储量。
本发明实施例提供的电子档案存储方法,分别将各电子档案与对应的描述文件进行打包处理,得到多个档案存储包,从而压缩数据量,进一步降低存储资源的浪费;同时,任一电子档案对应一个描述文件,电子档案包括若干文件,从而对电子档案以单份电子档案为单位进行打包,进而以单份档案存储包为单位进行存储,从而电子档案可以不依赖于专用软件即可读取,进而提高电子档案存储的安全性。此外,将描述文件一起打包,以供后续可以更好地读取电子档案。
基于上述任一实施例,图4为本发明提供的电子档案存储方法的流程示意图之四,如图4所示,在上述步骤140之后,该方法还包括:
步骤410,在所述多个存储介质中存在待恢复数据的待恢复存储介质的情况下,获取所述校验介质中的所述目标校验包,以及所述多个存储介质所存储的目标数据包。
此处,待恢复存储介质为需要恢复数据的存储介质,更为具体地,其为需要恢复数据包的存储介质。待恢复存储介质可以为损坏介质,也可以为遗失介质,或者为退化介质等等。
可以理解的是,待恢复存储介质无法获取到其所存储的数据包,因此,获取多个存储介质中除待恢复存储介质以外的目标数据包。
在一实施例中,若校验介质中的目标校验包只存在一个,则获取该目标校验包。
在另一实施例中,若校验介质中的目标校验包包括多个,则获取该待恢复存储介质对应的目标校验包,并获取该待恢复存储介质对应的目标数据包。
步骤420,基于所述目标校验包和所述目标数据包,生成所述待恢复存储介质的恢复数据包。
具体地,基于目标校验包和目标数据包之间的二进制数据差异,确定恢复数据包。
在一些实施例中,若校验介质中的目标校验包只存在一个,则基于该目标校验包和若干目标数据包,生成待恢复存储介质的恢复数据包。
在一实施例中,获取排序结果,基于该排序结果确定恢复顺序(恢复的异或次数),基于恢复顺序、目标校验包和目标数据包,进行按位异或计算,生成恢复数据包。进一步地,获取校验介质中的排序结果。
为便于理解,此处以一特定实施例进行说明。例如,存储介质的数量为5,数据包的数量为5,按照顺序划分为第一个数据包、第二个数据包、第三个数据包、第四个数据包、第五个数据包;异或轮次的数量为4;第二校验包的数量为3个。具体地,基于恢复顺序,确定第一个异或轮次、第二个异或轮次、第三个异或轮次、第四个异或轮次。
基于上述,若待恢复存储介质为第一个数据包对应的存储介质,则对目标校验包和第五个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第四个异或轮次的校验包和第四个数据包进行按位异或计算,得到第三个异或轮次的校验包;对第三个异或轮次的校验包和第三个数据包进行按位异或计算,得到第二个异或轮次的校验包(第一校验包);对第一校验包和第二个数据包进行按位异或计算,得到第一个数据包,从而完成数据恢复。
若待恢复存储介质为第二个数据包对应的存储介质,则对目标校验包和第五个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第四个异或轮次的校验包和第四个数据包进行按位异或计算,得到第三个异或轮次的校验包;对第三个异或轮次的校验包和第三个数据包进行按位异或计算,得到第二个异或轮次的校验包(第一校验包);对第一校验包和第一个数据包进行按位异或计算,得到第一个数据包,从而完成数据恢复。
若待恢复存储介质为第三个数据包对应的存储介质,则对目标校验包和第五个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第四个异或轮次的校验包和第四个数据包进行按位异或计算,得到第三个异或轮次的校验包;对第一个数据包和第二个数据包进行按位异或计算,得到第二个异或轮次的校验包(第一校验包),对第三个异或轮次的校验包和第一校验包进行按位异或计算,得到第三个数据包,从而完成数据恢复。
若待恢复存储介质为第四个数据包对应的存储介质,则对目标校验包和第五个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第一个数据包与第二个数据包进行按位异或计算,得到第一校验包,并将该第一校验包作为第二个异或轮次的校验包;对第三个数据包与第二个异或轮次的校验包进行按位异或计算,得到第三个异或轮次的校验包;对第四个异或轮次的校验包与第三个异或轮次的校验包进行按位异或计算,得到第四个数据包,从而完成数据恢复。
若待恢复存储介质为第五个数据包对应的存储介质,则对第一个数据包与第二个数据包进行按位异或计算,得到第一校验包;对第一校验包和第三个数据包进行按位异或计算,得到第三个异或轮次的校验包;对第三个异或轮次的校验包和第四个数据包进行按位异或计算,得到第四个异或轮次的校验包;对第四个异或轮次的校验包和目标校验包进行按位异或计算,得到第五个数据包,从而完成数据恢复。
在另一实施例中,获取排序结果,基于该排序结果确定恢复顺序(恢复的同或次数),基于恢复顺序、目标校验包和目标数据包,进行按位同或计算,生成恢复数据包。进一步地,获取校验介质中的排序结果。
在另一些实施例中,若校验介质中的目标校验包包括多个,则基于该待恢复存储介质对应的目标校验包和待恢复存储介质对应的目标校验包,生成待恢复存储介质的恢复数据包。
在一些实施例中,基于目标校验包和目标数据包,生成待恢复存储介质的初始恢复数据包;获取该恢复数据包对应的比特位数,基于该比特位数对初始恢复数据包进行比特删减得到待恢复存储介质的恢复数据包。进一步地,获取校验介质中的比特位数。
在一实施例中,基于比特位数对初始恢复数据包进行0比特删减得到待恢复存储介质的恢复数据包。在另一实施例中,基于比特位数对初始恢复数据包进行1比特删减得到待恢复存储介质的恢复数据包。
在一实施例中,在初始恢复数据包的后面部分删减比特,例如,初始恢复数据包为1011101111111111,而该待恢复存储介质对应的数据包的比特位数为8,则对初始恢复数据包进行比特删减得到10111011。
在另一实施例中,在初始恢复数据包的前面部分删减比特,例如,初始恢复数据包为1111111110111011,而该待恢复存储介质对应的数据包的比特位数为8,则对初始恢复数据包进行比特删减得到10111011。
在一实施例中,将恢复数据包存储至一个新的存储介质,并将该新的存储介质替换待恢复存储介质。
本发明实施例提供的电子档案存储方法,获取校验介质中的目标校验包,以及多个存储介质所存储的目标数据包,从而可以在任一存储介质损坏时,通过目标校验包和其他存储介质的数据包恢复得到该损坏介质的数据包,进而确保电子档案存储的安全性,从而只需生成目标校验包即可确保电子档案存储的安全性,无需对各电子档案均进行备份,从而降低存储资源的浪费。
基于上述任一实施例,该方法中,所述多个存储介质均为蓝光光盘。
进一步地,校验介质为蓝光光盘。
本发明实施例提供的电子档案存储方法,该蓝光光盘可以供电子档案长期保存,同时,该蓝光光盘廉价,可以降低电子档案存储的成本。
下面对本发明提供的电子档案存储装置进行描述,下文描述的电子档案存储装置与上文描述的电子档案存储方法可相互对应参照。
图5为本发明提供的电子档案存储装置的结构示意图,如图5所示,该电子档案存储装置,包括:
档案确定模块510,用于确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;
档案存储模块520,用于将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;
数据包确定模块530,用于确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;
校验包确定模块540,用于基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包。
本发明实施例提供的电子档案存储装置,将多个电子档案存储于多个存储介质,并确保任一存储介质存储有至少一个电子档案,进而让每个存储介质均存储有电子档案,减少存储介质所存储的数据包的数据量,进而减少目标校验包的数据量,最终降低存储资源的浪费;同时,任一存储介质所存储的数据包是基于至少一个电子档案确定得到的,即任一电子档案完整存储至一个存储介质,从而电子档案可以不依赖于专用软件即可读取,进而提高电子档案存储的安全性。基于各数据包之间的数据差异,确定目标校验包,从而可以在任一存储介质损坏时,通过目标校验包和其他存储介质的数据包恢复得到该损坏介质的数据包,进而确保电子档案存储的安全性,从而只需生成目标校验包即可确保电子档案存储的安全性,无需对各电子档案均进行备份,从而降低存储资源的浪费。
基于上述任一实施例,该校验包确定模块540包括:
比特数确定单元,用于确定各所述数据包的比特位数,并确定各所述比特位数中的最大比特位数;
数据包补齐单元,用于基于所述最大比特位数,补齐各所述数据包;
校验包确定单元,用于基于各补齐后的数据包之间的数据差异,确定目标校验包。
基于上述任一实施例,该校验包确定单元还用于:
排序各补齐后的数据包,并基于排序结果从所述各补齐后的数据包中确定出第一个数据包和第二个数据包;
对所述第一个数据包与所述第二个数据包进行按位异或计算,得到第一校验包,将所述第一校验包作为第二个异或轮次的校验包;
基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包,并确定所述当前异或轮次的校验包;
对所述当前异或轮次的数据包与所述当前异或轮次的校验包进行按位异或计算,得到第二校验包;
将所述第二校验包作为下一异或轮次的校验包,返回所述基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包的步骤,直至所述当前异或轮次为最后一个异或轮次,将最后一个异或轮次的所述第二校验包确定为目标校验包。
基于上述任一实施例,该装置还包括:
结果存储模块,用于将各所述数据包的比特位数和所述排序结果存储于所述校验介质。
基于上述任一实施例,该档案存储模块520包括:
数据量确定单元,用于确定各所述电子档案的数据量,以及各所述存储介质的存储量;
档案分配单元,用于基于各所述数据量和各所述存储量,分配各所述存储介质所需存储的所述电子档案;
档案存储单元,用于基于分配结果,将所述多个电子档案存储于所述多个存储介质。
基于上述任一实施例,该档案存储模块520包括:
文件确定单元,用于确定各所述电子档案的描述文件,任一所述电子档案对应一个描述文件,所述描述文件用于记载电子档案的元数据;
档案打包单元,用于分别将各所述电子档案与对应的所述描述文件进行打包处理,得到多个档案存储包,所述电子档案包括若干文件;
档案存储单元,还用于将所述多个档案存储包存储于所述多个存储介质。
基于上述任一实施例,该装置还包括:
校验包获取模块,用于在所述多个存储介质中存在待恢复数据的待恢复存储介质的情况下,获取所述校验介质中的所述目标校验包,以及所述多个存储介质所存储的目标数据包;
数据包生成模块,用于基于所述目标校验包和所述目标数据包,生成所述待恢复存储介质的恢复数据包。
基于上述任一实施例,所述多个存储介质均为蓝光光盘。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行电子档案存储方法,该方法包括:确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的电子档案存储方法,该方法包括:确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种电子档案存储方法,其特征在于,包括:
确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;
将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;
确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;
基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包;
所述基于各所述数据包之间的数据差异,确定目标校验包,包括:
确定各所述数据包的比特位数,并确定各所述比特位数中的最大比特位数;
基于所述最大比特位数,补齐各所述数据包;
基于各补齐后的数据包之间的数据差异,确定目标校验包;
所述基于各补齐后的数据包之间的数据差异,确定目标校验包,包括:
排序各补齐后的数据包,并基于排序结果从所述各补齐后的数据包中确定出第一个数据包和第二个数据包;
对所述第一个数据包与所述第二个数据包进行按位异或计算,得到第一校验包,将所述第一校验包作为第二个异或轮次的校验包;
基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包,并确定所述当前异或轮次的校验包;
对所述当前异或轮次的数据包与所述当前异或轮次的校验包进行按位异或计算,得到第二校验包;
将所述第二校验包作为下一异或轮次的校验包,返回所述基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包的步骤,直至所述当前异或轮次为最后一个异或轮次,将最后一个异或轮次的所述第二校验包确定为目标校验包。
2.根据权利要求1所述的电子档案存储方法,其特征在于,还包括:
将各所述数据包的比特位数和所述排序结果存储于所述校验介质。
3.根据权利要求1所述的电子档案存储方法,其特征在于,所述将所述多个电子档案存储于所述多个存储介质,包括:
确定各所述电子档案的数据量,以及各所述存储介质的存储量;
基于各所述数据量和各所述存储量,分配各所述存储介质所需存储的所述电子档案;
基于分配结果,将所述多个电子档案存储于所述多个存储介质。
4.根据权利要求1所述的电子档案存储方法,其特征在于,所述将所述多个电子档案存储于所述多个存储介质,包括:
确定各所述电子档案的描述文件,任一所述电子档案对应一个描述文件,所述描述文件用于记载电子档案的元数据;
分别将各所述电子档案与对应的所述描述文件进行打包处理,得到多个档案存储包,所述电子档案包括若干文件;
将所述多个档案存储包存储于所述多个存储介质。
5.根据权利要求1至4中任一项所述的电子档案存储方法,其特征在于,所述基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,之后还包括:
在所述多个存储介质中存在待恢复数据的待恢复存储介质的情况下,获取所述校验介质中的所述目标校验包,以及所述多个存储介质所存储的目标数据包;
基于所述目标校验包和所述目标数据包,生成所述待恢复存储介质的恢复数据包。
6.根据权利要求1至4中任一项所述的电子档案存储方法,其特征在于,所述多个存储介质均为蓝光光盘。
7.一种电子档案存储装置,其特征在于,包括:
档案确定模块,用于确定待存储的多个电子档案,以及用于存储电子档案的多个存储介质;
档案存储模块,用于将所述多个电子档案存储于所述多个存储介质,任一所述存储介质存储有至少一个所述电子档案;
数据包确定模块,用于确定所述多个存储介质中每一存储介质所存储的数据包,任一所述数据包是基于至少一个所述电子档案确定得到的;
校验包确定模块,用于基于各所述数据包之间的数据差异,确定目标校验包,并将所述目标校验包存储于校验介质,所述目标校验包用于恢复任一所述数据包;
所述校验包确定模块包括:
比特数确定单元,用于确定各所述数据包的比特位数,并确定各所述比特位数中的最大比特位数;
数据包补齐单元,用于基于所述最大比特位数,补齐各所述数据包;
校验包确定单元,用于基于各补齐后的数据包之间的数据差异,确定目标校验包;
所述校验包确定单元还用于:
排序各补齐后的数据包,并基于排序结果从所述各补齐后的数据包中确定出第一个数据包和第二个数据包;
对所述第一个数据包与所述第二个数据包进行按位异或计算,得到第一校验包,将所述第一校验包作为第二个异或轮次的校验包;
基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包,并确定所述当前异或轮次的校验包;
对所述当前异或轮次的数据包与所述当前异或轮次的校验包进行按位异或计算,得到第二校验包;
将所述第二校验包作为下一异或轮次的校验包,返回所述基于所述排序结果,从所述各补齐后的数据包中确定出当前异或轮次的数据包的步骤,直至所述当前异或轮次为最后一个异或轮次,将最后一个异或轮次的所述第二校验包确定为目标校验包。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述电子档案存储方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述电子档案存储方法。
CN202211513681.2A 2022-11-30 2022-11-30 电子档案存储方法、装置、电子设备和存储介质 Active CN115543697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211513681.2A CN115543697B (zh) 2022-11-30 2022-11-30 电子档案存储方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211513681.2A CN115543697B (zh) 2022-11-30 2022-11-30 电子档案存储方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN115543697A CN115543697A (zh) 2022-12-30
CN115543697B true CN115543697B (zh) 2023-03-10

Family

ID=84722334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211513681.2A Active CN115543697B (zh) 2022-11-30 2022-11-30 电子档案存储方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115543697B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117113440B (zh) * 2023-10-24 2024-02-02 浙江星汉信息技术股份有限公司 影像档案的完整性保护方法、系统与存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744750A (zh) * 2014-01-13 2014-04-23 杭州华为数字技术有限公司 一种数据恢复方法及装置
WO2018076629A1 (zh) * 2016-10-29 2018-05-03 华为技术有限公司 一种数据备份方法、节点及数据备份系统
CN111782152A (zh) * 2020-07-03 2020-10-16 深圳市欢太科技有限公司 数据存储方法、数据恢复方法、装置、服务器及存储介质
CN111930552A (zh) * 2020-06-17 2020-11-13 深圳佰维存储科技股份有限公司 坏块数据的恢复方法、装置、存储介质及电子设备
WO2021003822A1 (zh) * 2019-07-11 2021-01-14 平安科技(深圳)有限公司 数据存储及恢复的方法、装置及计算机设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762336B2 (en) * 2011-05-23 2014-06-24 Microsoft Corporation Geo-verification and repair
KR20210111561A (ko) * 2020-03-03 2021-09-13 에스케이하이닉스 주식회사 메모리 컨트롤러 및 그것의 동작 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744750A (zh) * 2014-01-13 2014-04-23 杭州华为数字技术有限公司 一种数据恢复方法及装置
WO2018076629A1 (zh) * 2016-10-29 2018-05-03 华为技术有限公司 一种数据备份方法、节点及数据备份系统
WO2021003822A1 (zh) * 2019-07-11 2021-01-14 平安科技(深圳)有限公司 数据存储及恢复的方法、装置及计算机设备
CN111930552A (zh) * 2020-06-17 2020-11-13 深圳佰维存储科技股份有限公司 坏块数据的恢复方法、装置、存储介质及电子设备
CN111782152A (zh) * 2020-07-03 2020-10-16 深圳市欢太科技有限公司 数据存储方法、数据恢复方法、装置、服务器及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
奇校验下的三磁盘崩溃数据恢复策略;张华等;《计算机系统应用》;20130815(第08期);全文 *

Also Published As

Publication number Publication date
CN115543697A (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
CN108170555B (zh) 一种数据恢复方法及设备
CN107844268B (zh) 一种数据分发方法、数据存储方法、相关装置以及系统
US9665427B2 (en) Hierarchical data storage architecture
CN107436733B (zh) 分片管理方法和分片管理装置
US20160378624A1 (en) Erasure coding of data within a group of storage units based on connection characteristics
US10666435B2 (en) Multi-tenant encryption on distributed storage having deduplication and compression capability
CN115543697B (zh) 电子档案存储方法、装置、电子设备和存储介质
CN112612576B (zh) 虚拟机备份方法、装置、电子设备及存储介质
EP3617868A1 (en) Persistent storage device management
KR101953548B1 (ko) 네트워크 트래픽 기록 장치 및 그 방법
CN102096558A (zh) 一种数据的存储方法和装置
CN107340971A (zh) 一种数据存储与恢复架构与方法
CN111400105A (zh) 数据库备份方法及装置
CN111459399A (zh) 一种数据写入方法、数据读取方法及装置
CN110658994B (zh) 一种基于hdd和ssd混合磁盘阵列的数据处理方法及装置
CN102523112A (zh) 信息处理方法及设备
CN116049318A (zh) 一种数据存储方法及通信装置
CN116010160A (zh) 分布式文件系统的纠删码数据分布的方法及应用
JP5492103B2 (ja) バックアップ装置、バックアップ方法、データ圧縮方法、バックアッププログラムおよびデータ圧縮プログラム
CN112181974B (zh) 标识信息分配方法、系统及存储设备
US20170337213A1 (en) Metadata regeneration
JP5972455B2 (ja) 情報を削除する方法
US9569512B2 (en) Methods, devices and computer programs for optimizing the replication of data in computer systems
CN111949440A (zh) 数据恢复方法及装置
WO2020088211A1 (zh) 压缩数据、解压缩数据的方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant