CN106528349A - 一种数据存储方法及装置 - Google Patents
一种数据存储方法及装置 Download PDFInfo
- Publication number
- CN106528349A CN106528349A CN201611109787.0A CN201611109787A CN106528349A CN 106528349 A CN106528349 A CN 106528349A CN 201611109787 A CN201611109787 A CN 201611109787A CN 106528349 A CN106528349 A CN 106528349A
- Authority
- CN
- China
- Prior art keywords
- disk
- character string
- daily record
- write
- backup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1456—Hardware arrangements for backup
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种数据存储方法及装置。该方法包括:将当前数据切分成至少两个数据块,还包括:将所述至少两个数据块写入至少两个磁盘中;针对每一个磁盘均执行:判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;将所述当前写入日志语句对应的当前写入数据块重新写入所述备份磁盘中。本发明提供的方案可以减少数据丢失。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种数据存储方法及装置。
背景技术
随着计算机技术的发展,数据量也在以爆炸式的不断增长,对于企业来说每天都会产生诸如企业财务报表、客户数据和企业业务交易数据等数据,由于这些数据对于企业的发展来说至关重要,需要存储起来,因此数据存储安全的重要性也逐渐显现出来。
目前,采用备份盘的方式来存储数据,当磁盘工作正常时,就将数据按照顺序写入到磁盘中,一旦磁盘工作异常时,则启动备份磁盘,将数据继续写入到备份磁盘中。在上述的磁盘和备份磁盘交替的过程中,在磁盘工作异常之后,在备份磁盘启动工作之前的这部分时间,对应写入的数据会出现丢失,因此,现有的方式存在数据丢失的情况。
发明内容
本发明实施例提供了一种数据存储方法及装置,从而减少数据丢失。
第一方面,本发明实施例提供了一种数据存储方法,该方法可以包括:
将当前数据切分成至少两个数据块;
将所述至少两个数据块写入至少两个磁盘中;
针对每一个磁盘均执行:
判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则,
确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;
将所述当前写入日志语句对应的当前写入数据块重新写入所述备份磁盘中。
优选地,所述将所述至少两个数据块写入至少两个磁盘中,包括:
利用下述公式(1),计算所述至少两个数据块对应的至少两个校验块;
将每一个所述校验块写入对应的所述磁盘中;
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量。
优选地,在所述将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘之后,进一步包括:
监测所述故障磁盘的运行状态;
当所述故障磁盘的运行状态恢复正常时,调取所述至少两个磁盘对应的原始日志文件,并将所述原始日志文件合并为权威日志文件;
将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对;
根据比对结果,编辑所述目标日志文件;
利用所述编辑后的目标日志文件,在所述运行状态恢复正常的故障磁盘中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
优选地,
所述原始日志文件中的每一条日志语句,包括:类型字符串、对象字符串和版本号字符串;
所述将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对,根据比对结果,编辑所述目标日志文件,包括:
针对所述目标日志文件中每一条日志语句均执行:
将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;
确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。
优选地,在所述确定所述磁盘为故障磁盘之后,在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘之前,进一步包括:
为所述故障磁盘配置磁盘占用率为100%;
所述在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘,包括:
确定每一所述磁盘对应的磁盘占用率,按照所述磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘。
第二方面,本发明实施例提供了一种数据存储装置,该装置包括:
切分单元,用于将当前数据切分成至少两个数据块;
写入单元,用于将所述切分单元切分出的至少两个数据块写入至少两个磁盘中;
备份处理单元,用于针对所述写入单元写入的每一个所述磁盘均执行:判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘中。
优选地,所述写入单元,包括:数据块计算子单元和数据块写入子单元;其中,
所述数据块计算子单元,用于利用下述公式(1),计算所述切分单元切分出的至少两个数据块对应的至少两个校验块;
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量;
所述数据块写入子单元,用于将所述数据块计算子单元计算出的每一个所述校验块写入对应的所述磁盘中。
优选地,进一步包括:监测单元、日志文件处理单元和恢复单元;其中,
所述监测单元,用于监测所述备份处理单元确定出的故障磁盘的运行状态;
所述日志文件处理单元,用于当所述监测单元监测到所述故障磁盘的运行状态恢复正常时,调取所述至少两个磁盘对应的原始日志文件,并将所述原始日志文件合并为权威日志文件;将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对;根据比对结果,编辑所述目标日志文件;
所述恢复单元,用于利用所述日志文件处理单元编辑后的目标日志文件,在所述运行状态恢复正常的故障磁盘中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
优选地,
所述原始日志文件中的每一条日志语句,包括:类型字符串、对象字符串和版本号字符串;
所述日志文件处理单元,用于针对所述目标日志文件中每一条日志语句均执行:将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。
优选地,进一步包括:配置单元;其中,
所述配置单元,用于为所述备份处理单元确定出的所述故障磁盘配置磁盘占用率为100%;
所述备份处理单元,进一步用于确定每一所述磁盘对应的磁盘占用率,按照所述磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘。
可见,本发明实施例提供的数据存储方法及装置,通过将当前数据切分成至少两个数据块,将至少两个数据块按照设定的规则写入至少两个磁盘中,并针对每一个磁盘均执行:判断磁盘对应的日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定磁盘为故障磁盘,并在至少两个磁盘中,选取故障磁盘对应的备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中。通过上述过程可知,本方案可以根据磁盘对应的原始日志文件中当前写入日志语句的写入时长判断出运行状态出现故障磁盘,为故障磁盘选取备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中,因此,本发明提供的方案可以减少数据丢失。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种数据存储方法的流程图;
图2是本发明另一个实施例提供的一种数据存储方法的流程图;
图3是本发明一个实施例提供的一种数据存储装置的结构示意图;
图4是本发明另一个实施例提供的一种数据存储装置的结构示意图;
图5是本发明又一个实施例提供的一种数据存储装置的结构示意图;
图6是本发明又一个实施例提供的一种数据存储装置的结构示意图;
图7是本发明一个实施例提供的一种数据存储系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种数据存储方法,该方法可以包括以下步骤:
步骤101:将当前数据切分成至少两个数据块;
步骤102:将所述至少两个数据块写入至少两个磁盘中;
步骤103:针对每一个磁盘均执行:判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则执行步骤105,否则,执行步骤104;
步骤104:在所述原始日志文件中记录完整的当前写入日志语句,并结束当前流程;
步骤105:确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;
步骤106:将所述当前写入日志语句对应的当前写入数据块重新写入所述备份磁盘中。
根据附图1所示的实施例,通过将当前数据切分成至少两个数据块,将至少两个数据块写入至少两个磁盘中,并针对每一个磁盘均执行:判断磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定磁盘为故障磁盘,并在至少两个磁盘中,选取故障磁盘对应的备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中。通过上述过程可知,本方案可以根据磁盘对应的原始日志文件中当前写入日志语句的写入时长判断出运行状态出现故障磁盘,为故障磁盘选取备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中,因此,本发明提供的方案可以减少数据丢失。
在本发明一个实施例中,为了对当前数据进行多重备份,所述将所述至少两个数据块写入至少两个磁盘中,包括:
利用下述公式(1),计算所述至少两个数据块对应的至少两个校验块;
将每一个所述校验块写入对应的所述磁盘中;
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量。
上述的当前数据切分成数据块的数量m以及检验块的数量n均可以根据具体的业务要求来确定。编码snm的编码规则也可以根据具体的业务要求确定。比如,将当前数据切分成3个数据块,需要得到4个校验块,那么编码就为s43的矩阵,利用公式(1)得到每一个校验块对应的数据,比如校验块C1中的数据为S11D1、S12D2、S13D3。
上述的将每一个所述校验块写入对应的所述磁盘中,可以包括两种情况,一种是一个校验块对应写入一个磁盘中,另一种是至少两个校验块对应写入同一个磁盘中,比如两个校验块写入到同一个磁盘中。具体的写入情况可以根据业务要求来确定。
根据上述实施例,通过设定编码矩阵,计算至少两个数据块对应的至少两个校验块,并将每一个校验块写入对应的磁盘中,由于经过上述过程每一数据块可以同时存在于不同的校验块中,因此在每一个校验块写入对应的磁盘时,可以对当前数据进行多重备份。
在本发明一个实施例中,为了使故障磁盘运行状态恢复正常后,恢复其需要存储的数据,在所述将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘之后可以进一步包括:
监测所述故障磁盘的运行状态;
当所述故障磁盘的运行状态恢复正常时,调取所述至少两个磁盘对应的原始日志文件,并将所述原始日志文件合并为权威日志文件;
将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对;
根据比对结果,编辑所述目标日志文件;
利用所述编辑后的目标日志文件,在所述运行状态恢复正常的故障磁盘中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
上述的监测所述故障磁盘的运行状态,可以包括监测故障磁盘的转速是否恢复到预先设定的阈值,如果是则确定故障磁盘的运行状态恢复正常。当然监测故障磁盘的转速只是一种优选的方式,也可以根据业务要求选用其他的业务参数来监测故障磁盘的运行状态,比如数据传输率。
当监测到故障磁盘的运行状态恢复正常时,调取至少两个磁盘中每一个磁盘对应的原始日志文件,并将各个原始日志文件合并为权威日志文件。在进行各个磁盘原始日志文件合并时,当对于一个数据块的各个日志文件中的原始日志语句一致时,直接将该数据块对应的原始日志语句写入到权威日志文件中。当对于一个数据块的各个原始日志文件中的日志语句存在不一致时,则将各个原始日志文件中内容一致且数量最多的日志语句写入到权威日志文件中,比如对于数据块1的10个原始日志文件中的日志语句存在不一致,其中有8个原始日志文件中的日志语句一致,那么就将8个原始日志文件中的一致的日志语句写入到权威日志文件中。
待得到权威日志文件时,将备份磁盘中对应的目标日志文件与权威日志文件进行比对,根据比对结果编辑得到更新后的目标日志文件,并根据编辑得到的目标日志文件中的具体内容在运行状态恢复正常的故障磁盘中恢复目标日志文件中每一条备份日志语句对应的数据块。
根据上述实施例,通过当监测到故障磁盘的运行状态恢复正常时,根据至少两个磁盘中每一个磁盘对应的原始日志文件,合并生成权威日志文件。根据权威日志文件编辑故障磁盘对应的备份磁盘中的目标日志文件,并根据编辑后的目标日志文件在运行状态恢复正常的故障磁盘中恢复目标日志文件中每一条备份日志语句对应的数据块,因此可以准确恢复故障磁盘需要存储的数据。
在本发明一个实施例中,为了使备份磁盘对应的目标日志文件与权威日志文件中的内容可以完全一致,所述将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对,根据比对结果,编辑所述目标日志文件,包括:
针对所述目标日志文件中每一条日志语句均执行:
将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;
确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。
上述的所述原始日志文件中的每一条日志语句可以包括:类型字符串、对象字符串和版本号字符串,上述的每一条日志语句中的内容只是一种优选内容,可以根据具体的业务要求进行增加和修改。另外上述的类型、对象和版本号均对应的是写入数据的操作,比如,写入数据的操作类型为A、对象为1和版本号为1.0。
在目标日志文件中每一条日志语句均要执行:将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。比如在目标日志文件中存在3条日志语句,分别为日志语句1、日志语句2和日志语句3,那么就要首先将日志语句1对应的类型字符串、对象字符串和版本号字符串与权威日志文件中权威日志语句1对应的类型字符串、对象字符串和版本号字符串分别进行对比,然后将日志语2对应的类型、对象和版本号对应的字符串与权威日志文件中权威日志语句2对应的类型字符串、对象字符串和版本号字符串分别进行对比,最后将日志语3对应的类型、对象和版本号对应的字符串与权威日志文件中权威日志语句3对应的类型字符串、对象字符串和版本号字符串分别进行对比,经过上述对比得到日志语句1和日志语句2与权威文件中的日志语句1和日志语句2完全相同,而日志语句3与权威文件中的权威日志语句3版本号字符串存在差异,则利用权威日志文件中的版本号字符串替换日志语句3中的差异字符串。
根据上述实施例,通过将目标日志文件中的每一个语句对应的类型字符串、对象字符串和版本号字符串与权威日志文件中权威语句对应的类型字符串、对象字符串和版本号字符串进行比对,确定差异字符串,利用所述权威日志文件中的字符串替换所述目标日志文件中的差异字符串。通过上述过程,可以使备份磁盘对应的目标日志文件与权威日志文件中的内容可以完全一致。
在本发明一个实施例中,在所述确定所述磁盘为故障磁盘之后,在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘之前,可以进一步包括:
为所述故障磁盘配置磁盘占用率为100%;
所述在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘,包括:
确定每一所述磁盘对应的磁盘占用率,按照所述磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘。
上述的在至少两个磁盘中选取故障磁盘对应的备份磁盘可以包括:分别确定每一个磁盘对应的磁盘占用率,然后按照磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的磁盘为备份磁盘。由于当磁盘处于故障状态时,其将不能再继续写入数据,因此当确定磁盘为故障磁盘后,就要为其配置磁盘占用率为100%,在进行排序时,该故障磁盘将排在最末位。比如存在磁盘1、磁盘2、磁盘3和磁盘4,当确定磁盘1为故障磁盘时,将为其配置磁盘占用率为100%。然后分别确定磁盘2的磁盘占用率为65%、磁盘3的磁盘占用率为35%和磁盘4的磁盘占用率为70%,则按照磁盘占用率从小到大的顺序对磁盘1、磁盘2、磁盘3和磁盘4进行排序,可以看出由于磁盘3的磁盘占用率最小排在首位,因此选取磁盘3为磁盘1的备份磁盘。
另外除了可以按照磁盘占用率来选取故障磁盘对应的备份磁盘外,还可以选用其他的参数来选取故障磁盘对应的备份磁盘,比如磁盘存储速度。
根据上述实施例,通过确定每一个磁盘对应的磁盘占用率,按照磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘,通过上述过程可以避免出现由于选取的备份磁盘存储空间不足的情况。
下面以将数据1写入磁盘1、磁盘2、磁盘3和磁盘4为例,展开说明数据存储的方法,如图2所示,该方法包括:
步骤201:将当前数据切分成至少两个数据块。
在本步骤根据具体的业务要求将数据1划分为3个数据块,分别为D1、D2和D3。
步骤202:计算至少两个数据块对应的至少两个校验块。
在本步骤中根据下述公式(1)计算在步骤201中划分的3个数据块对应的校验块,其中校验块的数量根据业务要求确定为4个。
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量。可以看出在本步骤中,编码为S43,利用公式(1)得到C1、C2、C3和C4对应的数据,比如校验块C1中的数据为S11D1、S12D2、S13D3。
步骤203:将每一个校验块写入对应的磁盘中。
在本步骤中,将校验块C1、C2、C3和C4写入对应的所述磁盘中,比如将校验块C1写入到磁盘1。
步骤204:针对每一个磁盘均执行:判断磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则执行步骤205;否则执行步骤206。
在本步骤中,时长阈值可以根据具体的业务要求确定,比如在本实施例中确定为5分钟,针对磁盘1、磁盘2、磁盘3和磁盘4均要执行本步骤,比如以磁盘1为例,判断磁盘1对应的原始日志文件中,当前写入日志语句的写入时长是否达到5分钟,若是则执行步骤205,否则继续判断下一条日志语句的写入的时长是否达到时长阈值。
步骤205:确定故障磁盘,为故障磁盘配置磁盘占用率为100%,并在原始日志文件中删除当前写入日志语句。
当磁盘1对应的原始日志文件中,比如当前写入日志语句为日志语句1,写入日志语句1的写入时长达到5分钟时,则确定磁盘1为故障磁盘,并为磁盘1配置磁盘占用率为100%。
步骤206:在原始日志文件中记录完整的当前写入日志语句,结束当前流程。
在本步骤中,在原始日志文件中可以设置一个日志语句条数阈值,比如为3000,当记录当前写入日志语句后要判断原始日志文件中已存在的日志语句条数是否达到条数阈值,当达到条数阈值时,则删除时间最早的一条日志语句。
步骤207:确定每一磁盘对应的磁盘占用率,按照磁盘占用率的从小到大的顺序对磁盘进行排序,选取排序在首位的磁盘为备份磁盘。
在本步骤中,确定磁盘1的磁盘占用率为100%、磁盘2的磁盘占用率为65%、磁盘3的磁盘占用率为35%和磁盘4的磁盘占用率为70%,并按照各个磁盘占用率的从小到大的顺序对磁盘1、磁盘2、磁盘3和磁盘4进行排序,可以看出磁盘3的磁盘占用率最小排在首位,因此确定磁盘3为磁盘1对应的备份磁盘。
步骤208:将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中,并在备份磁盘对应的原始日志文件中写入完整的当前写入日志语句。
在本步骤中,将当前写入日志语句1对应的当前写入数据块重新写入至磁盘3中。
步骤209:监测故障磁盘的运行状态。
在本步骤中监测磁盘1的运行状态。
步骤210:当故障磁盘的运行状态恢复正常时,调取每一个磁盘对应的原始日志文件,并将原始日志文件合并为权威日志文件。
在本步骤中,当监测到磁盘1的运行状态恢复正常时,调取磁盘1、磁盘2、磁盘3和磁盘4对应的原始日志文件,并将所有原始日志文件合并为权威日志文件,在合并权威日志文件时,当对于一个数据块的各个原始日志文件中的日志语句一致时,直接将该数据块对应的日志语句写入到权威日志文件中。当对于一个数据块的各个原始日志文件中的日志语句存在不一致时,则将各个原始日志文件中内容一致数量最多的日志语句写入到权威日志文件中,比如对于数据块1的10个原始日志文件中的日志语句存在不一致,其中有8个原始日志文件中的日志语句一致,那么就将8个原始日志文件中的一致的日志语句写入到权威日志文件中。根据上述方法得到权威日志文件。
步骤211:针对目标日志文件中每一条日志语句均执行:将日志语句包括的类型字符串、对象字符串和版本号字符串与权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对。
在本步骤中,比如磁盘3对应的目标日志文件中存在3条日志语句,分别为日志语句1、日志语句2和日志语句3,那么就要首先将日志语句1对应的类型字符串、对象字符串和版本号字符串与权威日志文件中权威日志语句1对应的类型字符串、对象字符串和版本号字符串分别进行对比,然后将日志语2对应的类型、对象和版本号对应的字符串与权威日志文件中权威日志语句2对应的类型字符串、对象字符串和版本号字符串分别进行对比,最后将日志语3对应的类型、对象和版本号对应的字符串与权威日志文件中权威日志语句3对应的类型字符串、对象字符串和版本号字符串分别进行对比,经过上述对比得到日志语句1和日志语句2与权威文件中的日志语句1和日志语句2完全相同,而日志语句3与权威文件中的权威日志语句3版本号字符串存在差异,则确定为差异字符串。
步骤212:根据比对确定差异字符串,利用权威日志文件中的字符串替换目标日志文件中的差异字符串。
在本步骤中,对步骤211中确定的差异字符串利用权威日志文件中的版本号对应的字符串替换日志语句3中的差异字符串。
步骤213:利用编辑后的目标日志文件,在运行状态恢复正常的故障磁盘中恢复目标日志文件中每一条备份日志语句对应的数据块。
在本步骤中,在运行状态恢复正常的磁盘1中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
如图3所示,本发明实施例提供了一种数据存储装置,该装置包括:
切分单元301,用于将当前数据切分成至少两个数据块;
写入单元302,用于将所述切分单元301切分出的至少两个数据块写入至少两个磁盘中;
备份处理单元303,用于针对所述写入单元302写入的每一个所述磁盘均执行:判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘中。
根据图3所示的实施例,通过切分单元将当前数据切分成至少两个数据块;写入单元将所述至少两个数据块写入至少两个磁盘中;备份处理单元针对每一个磁盘均执行:判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘中。通过上述过程可知,本方案可以根据磁盘对应的原始日志文件中当前写入日志语句的写入时长判断出运行状态出现故障磁盘,为故障磁盘选取备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中,因此,本发明提供的方案可以减少数据丢失。
在本发明一个实施例中,如图4所示,所述写入单元302,可以包括:数据块计算子单元401和数据块写入子单元402;其中,
所述数据块计算子单元401,用于利用下述公式(1),计算所述切分单元301切分出的至少两个数据块对应的至少两个校验块;
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量;
所述数据块写入子单元402,用于将所述数据块计算子单元401计算出的每一个所述校验块写入对应的所述磁盘中。
在本发明一个实施例中,如图5所示,所述数据存储装置可以进一步包括:监测单元501、日志文件处理单元502和恢复单元503;其中,
所述监测单元501,用于监测所述备份处理单元303确定出的故障磁盘的运行状态;
所述日志文件处理单元502,用于当所述监测单元501监测到所述故障磁盘的运行状态恢复正常时,调取所述至少两个磁盘对应的原始日志文件,并将所述原始日志文件合并为权威日志文件;将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对;根据比对结果,编辑所述目标日志文件;
所述恢复单元503,用于利用所述日志文件处理单元502编辑后的目标日志文件,在所述运行状态恢复正常的故障磁盘中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
在本发明一个实施例中,当所述原始日志文件中的每一条日志语句,包括类型字符串、对象字符串和版本号字符串时,所述日志文件处理单元502,用于针对所述目标日志文件中每一条日志语句均执行:将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。
在本发明一个实施例中,如图6所示,所述数据存储装置可以进一步包括:配置单元601其中,
所述配置单元601,用于为所述备份处理单元303确定出的所述故障磁盘配置磁盘占用率为100%;
所述备份处理单元303,进一步用于确定每一所述磁盘对应的磁盘占用率,按照所述磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘。
如图7所示,本发明实施例提供了一种数据存储系统,该系统可以包括:至少一个磁盘701和所述数据存储装置702;其中,磁盘的数量可以根据具体的业务要求来确定,每一个磁盘701,用于存储所述数据存储装置702写入的数据。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上所述,本发明各个实施例至少可以实现如下有益效果:
1、在本发明实施例中,通过将当前数据切分成至少两个数据块,将至少两个数据块写入至少两个磁盘中,并针对每一个磁盘均执行:判断磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定磁盘为故障磁盘,并在至少两个磁盘中,选取故障磁盘对应的备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中。通过上述过程可知,本方案可以根据磁盘对应的原始日志文件中当前写入日志语句的写入时长判断出运行状态出现故障磁盘,为故障磁盘选取备份磁盘,并将当前写入日志语句对应的当前写入数据块重新写入至备份磁盘中,因此,本发明提供的方案可以减少数据丢失。
2、在本发明实施例中,通过设定编码矩阵,计算至少两个数据块对应的至少两个校验块,并将每一个校验块写入对应的磁盘中,由于经过上述过程每一数据块可以同时存在于不同的校验块中,因此在每一个校验块写入对应的磁盘时,可以对当前数据进行多重备份。
3、在本发明实施例中,通过当监测到故障磁盘的运行状态恢复正常时,根据至少两个磁盘中每一个磁盘对应的原始日志文件,合并生成权威日志文件。根据权威日志文件编辑故障磁盘对应的备份磁盘中的目标日志文件,并根据编辑后的目标日志文件在运行状态恢复正常的故障磁盘中恢复目标日志文件中每一条备份日志语句对应的数据块,因此可以准确恢复故障磁盘需要存储的数据。
4、在本发明实施例中,通过将目标日志文件中的每一个语句对应的类型字符串、对象字符串和版本号字符串与权威日志文件中权威语句对应的类型字符串、对象字符串和版本号字符串进行比对,确定差异字符串,利用所述权威日志文件中的字符串替换所述目标日志文件中的差异字符串。通过上述过程,可以使备份磁盘对应的目标日志文件与权威日志文件中的内容可以完全一致。
5、在本发明实施例中,通过确定每一个磁盘对应的磁盘占用率,按照磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘,通过上述过程可以避免出现由于选取的备份磁盘存储空间不足的情况。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种数据存储方法,其特征在于,将当前数据切分成至少两个数据块,还包括:
将所述至少两个数据块写入至少两个磁盘中;
针对每一个磁盘均执行:
判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则,
确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;
将所述当前写入日志语句对应的当前写入数据块重新写入所述备份磁盘中。
2.根据权利要求1所述的方法,其特征在于,所述将所述至少两个数据块写入至少两个磁盘中,包括:
利用下述第一公式,计算所述至少两个数据块对应的至少两个校验块;
将每一个所述校验块写入对应的所述磁盘中;
所述第一公式包括:
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量。
3.根据权利要求1所述的方法,其特征在于,在所述将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘之后,进一步包括:
监测所述故障磁盘的运行状态;
当所述故障磁盘的运行状态恢复正常时,调取所述至少两个磁盘对应的原始日志文件,并将所述原始日志文件合并为权威日志文件;
将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对;
根据比对结果,编辑所述目标日志文件;
利用所述编辑后的目标日志文件,在所述运行状态恢复正常的故障磁盘中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
4.根据权利要求3所述的方法,其特征在于,
所述原始日志文件中的每一条日志语句,包括:类型字符串、对象字符串和版本号字符串;
所述将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对,根据比对结果,编辑所述目标日志文件,包括:
针对所述目标日志文件中每一条日志语句均执行:
将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;
确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。
5.根据权利要求1所述的方法,其特征在于,在所述确定所述磁盘为故障磁盘之后,在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘之前,进一步包括:
为所述故障磁盘配置磁盘占用率为100%;
所述在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘,包括:
确定每一所述磁盘对应的磁盘占用率,按照所述磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘。
6.一种数据存储装置,其特征在于,包括:
切分单元,用于将当前数据切分成至少两个数据块;
写入单元,用于将所述切分单元切分出的至少两个数据块写入至少两个磁盘中;
备份处理单元,用于针对所述写入单元写入的每一个所述磁盘均执行:判断所述磁盘对应的原始日志文件中,当前写入日志语句的写入时长是否达到设定的时长阈值,若是,则确定所述磁盘为故障磁盘,并在所述至少两个磁盘中,选取所述故障磁盘对应的备份磁盘;将所述当前写入日志语句对应的当前写入数据块重新写入至所述备份磁盘中。
7.根据权利要求6所述的装置,其特征在于,所述写入单元,包括:数据块计算子单元和数据块写入子单元;其中,
所述数据块计算子单元,用于利用下述第一公式,计算所述切分单元切分出的至少两个数据块对应的至少两个校验块;
所述第一公式包括:
其中,所述snm表征编码;所述Cn表征校验块;所述Dm表征每一个数据块对应的数据;所述n表征所述校验块的数量;所述m表征所述数据块的数量;
所述数据块写入子单元,用于将所述数据块计算子单元计算出的每一个所述校验块写入对应的所述磁盘中。
8.根据权利要求6所述的装置,其特征在于,进一步包括:监测单元、日志文件处理单元和恢复单元;其中,
所述监测单元,用于监测所述备份处理单元确定出的故障磁盘的运行状态;
所述日志文件处理单元,用于当所述监测单元监测到所述故障磁盘的运行状态恢复正常时,调取所述至少两个磁盘对应的原始日志文件,并将所述原始日志文件合并为权威日志文件;将所述备份磁盘对应的目标日志文件与所述权威日志文件进行比对;根据比对结果,编辑所述目标日志文件;
所述恢复单元,用于利用所述日志文件处理单元编辑后的目标日志文件,在所述运行状态恢复正常的故障磁盘中恢复所述目标日志文件中每一条备份日志语句对应的数据块。
9.根据权利要求8所述的装置,其特征在于,
所述原始日志文件中的每一条日志语句,包括:类型字符串、对象字符串和版本号字符串;
所述日志文件处理单元,用于针对所述目标日志文件中每一条日志语句均执行:将所述日志语句包括的类型字符串、对象字符串和版本号字符串与所述权威日志文件中对应的权威日志语句包括的类型字符串、对象字符串和版本号字符串进行比对;确定所述日志语句中的差异字符串,利用对应的所述权威日志语句中的字符串替换所述差异字符串。
10.根据权利要求6所述的装置,其特征在于,进一步包括:配置单元;其中,
所述配置单元,用于为所述备份处理单元确定出的所述故障磁盘配置磁盘占用率为100%;
所述备份处理单元,进一步用于确定每一所述磁盘对应的磁盘占用率,按照所述磁盘占用率的从小到大的顺序对所述磁盘进行排序,选取排序在首位的所述磁盘为所述备份磁盘。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611109787.0A CN106528349B (zh) | 2016-12-06 | 2016-12-06 | 一种数据存储方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611109787.0A CN106528349B (zh) | 2016-12-06 | 2016-12-06 | 一种数据存储方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106528349A true CN106528349A (zh) | 2017-03-22 |
CN106528349B CN106528349B (zh) | 2019-03-12 |
Family
ID=58341450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611109787.0A Active CN106528349B (zh) | 2016-12-06 | 2016-12-06 | 一种数据存储方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106528349B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707395A (zh) * | 2017-09-28 | 2018-02-16 | 浙江大华技术股份有限公司 | 一种数据传输方法、装置和系统 |
CN108509518A (zh) * | 2018-03-09 | 2018-09-07 | 北京小米移动软件有限公司 | 信息处理方法及设备 |
CN109189738A (zh) * | 2018-09-18 | 2019-01-11 | 郑州云海信息技术有限公司 | 一种分布式文件系统中主osd的选取方法、装置及系统 |
CN109271241A (zh) * | 2018-08-20 | 2019-01-25 | 赛凡信息科技(厦门)有限公司 | 一种蓝光设备操作任务调度的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103197988A (zh) * | 2012-01-05 | 2013-07-10 | 中国移动通信集团湖南有限公司 | 一种数据备份、恢复的方法、设备和数据库系统 |
CN103200272A (zh) * | 2013-04-18 | 2013-07-10 | 南京工业大学 | 一种流媒体存储系统及存储方法 |
CN103942252A (zh) * | 2014-03-17 | 2014-07-23 | 华为技术有限公司 | 一种恢复数据的方法及系统 |
-
2016
- 2016-12-06 CN CN201611109787.0A patent/CN106528349B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103197988A (zh) * | 2012-01-05 | 2013-07-10 | 中国移动通信集团湖南有限公司 | 一种数据备份、恢复的方法、设备和数据库系统 |
CN103200272A (zh) * | 2013-04-18 | 2013-07-10 | 南京工业大学 | 一种流媒体存储系统及存储方法 |
CN103942252A (zh) * | 2014-03-17 | 2014-07-23 | 华为技术有限公司 | 一种恢复数据的方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707395A (zh) * | 2017-09-28 | 2018-02-16 | 浙江大华技术股份有限公司 | 一种数据传输方法、装置和系统 |
CN108509518A (zh) * | 2018-03-09 | 2018-09-07 | 北京小米移动软件有限公司 | 信息处理方法及设备 |
CN109271241A (zh) * | 2018-08-20 | 2019-01-25 | 赛凡信息科技(厦门)有限公司 | 一种蓝光设备操作任务调度的方法 |
CN109189738A (zh) * | 2018-09-18 | 2019-01-11 | 郑州云海信息技术有限公司 | 一种分布式文件系统中主osd的选取方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106528349B (zh) | 2019-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2818472C (en) | Optimized startup verification of file system integrity | |
CN106528349A (zh) | 一种数据存储方法及装置 | |
EP1739535B1 (en) | File system storing transaction records in flash-like media | |
EP1744246B1 (en) | File system having deferred verification of data integrity | |
CN100573464C (zh) | 恢复多卷数据集的装置、系统和方法 | |
US20110072060A1 (en) | File system having transaction record coalescing | |
CN102609337A (zh) | 一种内存数据库快速数据恢复方法 | |
CA2575418A1 (en) | Information recording medium, recording/ reproducing apparatus, and recording/ reproducing method | |
CN104239438A (zh) | 基于分离存储的文件信息存储方法和文件信息读写方法 | |
CN110187841A (zh) | 一种存储系统管理磁盘的方法、装置及存储服务器 | |
CN106095613A (zh) | 使用wal的数据库回滚 | |
CN110555055A (zh) | 针对Oracle数据库重做日志文件的数据挖掘方法 | |
CN103838645B (zh) | 一种基于哈希的远程差异合成备份实现方法 | |
CN108470039A (zh) | 区块链中的数据处理方法和装置 | |
CN105302665A (zh) | 一种改进的写时拷贝快照方法及系统 | |
CN107992268A (zh) | 一种坏块标记的方法及相关装置 | |
CN108170766B (zh) | 一种保证数据库一致性的cdp备份与恢复方法 | |
CN103294658A (zh) | 一种文档保存方法及装置 | |
CN106407292B (zh) | 一种空间数据库中矢量数据几何变化检测的方法及装置 | |
US7552421B1 (en) | Method for adding comments to deleted code | |
CN106503250A (zh) | 一种日志跟踪方法和装置 | |
CN110209530B (zh) | 一种恢复cdp系统io数据的方法及系统 | |
CN103744939A (zh) | 一种日志的记录方法、日志的恢复方法及日志管理器 | |
CN111240893B (zh) | 一种基于数据流分片技术的备份和还原管理方法及系统 | |
CN107229535A (zh) | 数据块的多副本存储方法、存储设备、数据读取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |