CN112685360A - 内存数据的持久化方法及装置、存储介质、计算机设备 - Google Patents

内存数据的持久化方法及装置、存储介质、计算机设备 Download PDF

Info

Publication number
CN112685360A
CN112685360A CN202011599588.9A CN202011599588A CN112685360A CN 112685360 A CN112685360 A CN 112685360A CN 202011599588 A CN202011599588 A CN 202011599588A CN 112685360 A CN112685360 A CN 112685360A
Authority
CN
China
Prior art keywords
data
persistence
mode
service
service data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011599588.9A
Other languages
English (en)
Other versions
CN112685360B (zh
Inventor
赵祎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Central China Technology Development Of Electric Power Co ltd
Shenzhen Lian Intellectual Property Service Center
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202011599588.9A priority Critical patent/CN112685360B/zh
Publication of CN112685360A publication Critical patent/CN112685360A/zh
Application granted granted Critical
Publication of CN112685360B publication Critical patent/CN112685360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种内存数据的持久化方法及装置、存储介质、计算机设备,该方法包括:获取目标时间对应的业务数据持久化方式,其中,所述业务数据持久化方式与所述目标时间对应的历史参照时间的业务数据特征匹配;基于所述业务数据持久化方式对所述目标时间对应的内存数据进行持久化处理,得到持久化数据文件。本申请通过对历史参照时间的业务数据的数据特征进行统计分析从而确定目标时间匹配的业务数据持久化方式,解决了持久化方式需要人工确定缺乏理论依据、持久化方式与业务数据特征不匹配从而导致的业务数据丢失、持久化数据文件过大等问题。本申请还涉及区块链技术,所述业务数据特征存储于区块链中。

Description

内存数据的持久化方法及装置、存储介质、计算机设备
技术领域
本申请涉及计算机技术领域,尤其是涉及到一种内存数据的持久化方法及装置、存储介质、计算机设备。
背景技术
随着互联网技术的高速发展,数据处理的复杂性和密集型急剧增加,使得数据的处理量成倍增长,因此对数据处理速度提出了更高的要求。目前,通常采用Redis数据库来提高数据的处理效率,通过将数据存储在内存中,处理完成后再将处理结果存储到磁盘中,减少了内存与磁盘在数据交互过程中的频繁I/O操作,大大提高了数据的处理效率。
由于Redis是一个内存数据库,内存中的数据都是临时存储的,当发生故障时,容易导致数据丢失。因而,如何确保内存数据的安全性是内存数据库需要解决的问题,Redis数据库提供了快照文件RDB(即快照,snapshot)和增量文件AOF(Append Only File)两种方式确保数据的安全性。RDB快照是周期性的将内存中的数据保存到磁盘中,然而,由于数据是周期性保存的,一旦发生故障,从上次数据保存到发生故障这段时间的数据将全部丢失,可见RDB快照并不能够很好的保证数据的安全性,仍然存在丢失部分数据的风险。增量文件AOF是将Redis数据库的每次写操作都保存到一个AOF文件,由于AOF文件中保存了每次的写操作,可以很好地确保数据的安全性,然而,AOF文件是不断地累积Redis数据库的写操作,随着时间的推移,AOF文件会变得越来越大,占用大量的存储空间。
然而,在现有技术中,只能由技术人员指定其中的一种持久化策略进行数据持久化。这就导致了在使用RBD策略时,如果数据库发生故障可能会丢失一个时间节点的重要数据。使用AOF策略时,如果数据库内的数据集过大,生成的文件体积过大,占用存储空间大,并且恢复时间长。
发明内容
有鉴于此,本申请提供了一种内存数据的持久化方法及装置、存储介质、计算机设备。
根据本申请的一个方面,提供了一种内存数据的持久化方法,包括:
获取目标时间对应的业务数据持久化方式,其中,所述业务数据持久化方式与所述目标时间对应的历史参照时间的业务数据特征匹配;
若所述业务数据持久化方式为所述快照文件方式,则调用分叉函数fork创建子进程,以及通过所述子进程将内存中已有的业务数据写入所述快照文件中,得到与所述目标时间对应的持久化文件;
若所述业务数据持久化方式为所述增量文件方式,则当有更新数据写入内存时,将所述更新数据对应的写入指令顺序添加至所述增量文件中,得到与所述目标时间对应的持久化文件。
具体地,所述获取目标时间对应的业务数据持久化方式之前,所述方法还包括:
获取与所述目标时间对应的所述历史参照时间,以及与所述历史参照时间对应的所述业务数据特征,其中,所述业务数据特征存储于区块链中,所述业务数据特征包括但不限于所述历史参照时间内产生的业务数据对应的重要数据占比、读写次数以及数据集大小;
基于预设数据持久化特征规则,确定与所述业务数据特征匹配的所述业务数据持久化方式,其中,所述预设数据持久化特征规则包括与所述快照文件方式对应的第一特征规则以及与所述增量文件方式对应的第二特征规则。
具体地,当所述业务数据特征包括所述重要数据占比时,所述获取与所述历史参照时间对应的所述业务数据特征,具体包括:
分别获取所述历史参照时间内的每一条业务数据的业务类型标识,并统计所述历史参照时间内全部业务数据中预设重要业务类型的数据量,其中,所述业务类型标识包括但不限于所述每一条业务数据的key值;
基于所述预设重要业务类型的数据量,确定所述预设重要业务类型的业务数据占所述全部业务数据的比重,将所述比重作为所述重要数据占比。
具体地,所述得到持久化数据文件之后,所述方法还包括:
接收业务数据恢复指令,其中,所述业务数据恢复指令包括恢复时间;
获取与所述恢复时间对应的待恢复的持久化数据文件;
按照与所述待恢复的持久化数据文件对应的时间先后顺序,依次恢复所述待恢复的持久化数据文件。
具体地,所述确定与所述业务数据特征匹配的所述持久化方式,具体包括:
若所述业务数据特征与所述第一特征规则以及所述第二特征规则均不匹配,则确定所述业务数据持久化方式为混合方式;
所述获取目标时间对应的业务数据持久化方式之后,所述方法还包括:
若所述目标时间对应的所述业务数据持久化方式为所述混合方式,则当有更新数据需要写入内存时,将所述更新数据对应的写入指令顺序添加至增量文件中;
当所述增量文件的大小大于或等于预设阈值时,将所述内存中已有的数据添加至快照文件中,并清空所述增量文件。
根据本申请的另一方面,提供了一种内存数据的持久化装置,包括:
持久化方式获取模块,用于获取目标时间对应的业务数据持久化方式,其中,所述业务数据持久化方式与所述目标时间对应的历史参照时间的业务数据特征匹配;
第一持久化模块,用于若所述业务数据持久化方式为所述快照文件方式,则调用分叉函数fork创建子进程,以及通过所述子进程将内存中已有的业务数据写入所述快照文件中,得到与所述目标时间对应的持久化文件;
第二持久化模块,用于若所述业务数据持久化方式为所述增量文件方式,则当有更新数据写入内存时,将所述更新数据对应的写入指令顺序添加至所述增量文件中,得到与所述目标时间对应的持久化文件。
具体地,所述装置还包括:
数据特征获取模块,用于所述获取目标时间对应的业务数据持久化方式之前,获取与所述目标时间对应的所述历史参照时间,以及与所述历史参照时间对应的所述业务数据特征,其中,所述业务数据特征存储于区块链中,所述业务数据特征包括但不限于所述历史参照时间内产生的业务数据对应的重要数据占比、读写次数以及数据集大小;
持久化方式确定模块,用于基于预设数据持久化特征规则,确定与所述业务数据特征匹配的所述业务数据持久化方式,其中,所述预设数据持久化特征规则包括与所述快照文件方式对应的第一特征规则以及与所述增量文件方式对应的第二特征规则。
具体地,所述数据特征获取模块,具体包括:
业务类型统计单元,用于当所述业务数据特征包括所述重要数据占比时,分别获取所述历史参照时间内的每一条业务数据的业务类型标识,并统计所述历史参照时间内全部业务数据中预设重要业务类型的数据量,其中,所述业务类型标识包括但不限于所述每一条业务数据的key值;
重要数据占比确定单元,用于基于所述预设重要业务类型的数据量,确定所述预设重要业务类型的业务数据占所述全部业务数据的比重,将所述比重作为所述重要数据占比。
具体地,所述装置还包括:
恢复指令接收模块,用于所述得到与所述目标时间对应的持久化文件之后,接收业务数据恢复指令,其中,所述业务数据恢复指令包括恢复时间;
持久化文件获取模块,用于获取与所述恢复时间对应的待恢复的持久化数据文件;
数据恢复模块,用于按照与所述待恢复的持久化数据文件对应的时间先后顺序,依次恢复所述待恢复的持久化数据文件。
具体地,所述持久化方式确定模块,具体用于:若所述业务数据特征与所述第一特征规则以及所述第二特征规则均不匹配,则确定所述业务数据持久化方式为混合方式;
所述装置还包括:
增量文件添加模块,用于若所述目标时间对应的所述业务数据持久化方式为所述混合方式,则当有更新数据需要写入内存时,将所述更新数据对应的写入指令顺序添加至增量文件中;
快照文件写入模块,用于当所述增量文件的大小大于或等于预设阈值时,将所述内存中已有的数据添加至快照文件中,并清空所述增量文件。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述内存数据的持久化方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述内存数据的持久化方法。
借由上述技术方案,本申请提供的一种内存数据的持久化方法及装置、存储介质、计算机设备,通过获取目标时间对应的业务数据持久化方式,从而按照相应的业务数据持久化方式对数据库中相应目标时间对应的业务数据进行持久化得到持久化数据文件,实现对内存数据的持久化处理,其中,业务数据持久化方式基于目标时间相应的历史参考时间的业务数据特征确定,使得对目标时间的业务数据持久化方式与历史参考时间对应的业务数据特征相匹配。本申请实施例相比于现有技术中技术人员指定一种持久化策略的方式,通过对历史参照时间的业务数据的数据特征进行统计分析从而确定目标时间对应的业务数据持久化方式,使得目标时间的业务数据持久化方式与该时间段对应的业务数据的数据特征相匹配,从而自动选择一种更贴近目标时段业务数据特征的持久化方式,解决了持久化方式需要人工确定缺乏理论依据、持久化方式与业务数据特征不匹配从而导致的业务数据丢失、持久化数据文件过大等问题。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种内存数据的持久化方法的流程示意图;
图2示出了本申请实施例提供的另一种内存数据的持久化方法的流程示意图;
图3示出了本申请实施例提供的一种内存数据的持久化装置的结构示意图;
图4示出了本申请实施例提供的另一种内存数据的持久化装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种内存数据的持久化方法,如图1所示,该方法包括:
步骤101,获取目标时间对应的业务数据持久化方式,其中,业务数据持久化方式与目标时间对应的历史参照时间的业务数据特征匹配;
步骤102,若业务数据持久化方式为快照文件方式,则调用分叉函数fork创建子进程,以及通过子进程将内存中已有的业务数据写入快照文件中,得到与目标时间对应的持久化文件;
步骤103,若业务数据持久化方式为增量文件方式,则当有更新数据写入内存时,将更新数据对应的写入指令顺序添加至增量文件中,得到与目标时间对应的持久化文件。
本申请实施例用于持久化Redis数据库中的数据,Redis数据库是一种内存数据库,Redis数据库将数据存储在内存中,直接在内存中读取数据进行相应的操作处理,由于内存的数据读写速度要高出磁盘几个数量级,Redis数据库通过将数据存储在内存能够极大地提高数据的处理效率。内存数据具有断电丢失的特性,一旦机器发生故障或重启时,内存中的数据将全部丢失。
在上述实施例中,Redis数据库中业务数据的持久化方式与业务数据的产生时间相关,目标时间为数据库中业务数据的产生时间,目标时间为一个或多个时间段,例如,目标时间为0:00-1:00,或者目标时间为0:00-1:00、1:00-3:00……等等。目标时间对应的历史参照时间具体可以基于预先约定的业务数据持久化规则来确定,在预设的业务数据持久化规则中预先约定了目标时间内对应的Redis内存数据在进行持久化时应参考哪个历史时间段对应的业务数据来制定持久化策略,例如,预先对历史业务数据进行大数据统计分析发现,某业务平台对应的业务数据的数据特征呈周期性变化,且变化周期为一天,即该业务平台可能在每一天中的同一个时间段产生的业务数据的数据特征都非常相近,那么目标时间0:00-1:00可以参考前一天0:00-1:00的业务数据的数据特征来制定持久化策略,即目标时间(0:00-1:00)对应的历史参照时间为前一天的同一时间段(0:00-1:00)或者前一周每天的同一时间段(0:00-1:00)。进一步,确定目标时间对应的历史参照时间之后,可以根据该历史参照时间对应的业务数据特征来确定目标时间的业务数据持久化方式。例如,业务数据中写操作次数较多可以采用增量文件方式实现对内存数据中的每一次写操作进行记录,以使恢复数据时可以保持较高的数据一致性。又例如,业务数据中数据量巨大可以采用快照文件方式实现对内存数据的持久化,使得产生的持久化数据文件占用内存较小。
进而,确定了目标时间对应的业务数据持久化方式之后,可以按照相应的业务数据持久化方式对目标时间对应的Redis数据库中的业务数据进行持久化,生成持久化文件,以便在故障时或其他情况需要进行数据恢复时利用持久化文件对业务数据进行恢复。另外,业务数据持久化方式除了包含持久化策略(RDB或AOF)外,还可以包含具体的快照文件方式对应的持久化周期,即多久进行一次RDB持久化存储,或者增量文件方式对应的具体策略,比如是每次修改同步还是每秒同步等等。
在具体的应用场景中,若业务数据持久化方式为快照文件方式,则使用fork函数复制一份当前进程的副本(子进程),父进程继续处理客户端请求,fork进程负责把内存的数据同步到磁盘的临时文件,当子进程将快照写入临时文件完毕后,用临时文件替换原来的快照文件,然后子进程退出。若业务数据持久化方式为增量文件方式,则内存通常会对同一个数据进行不断的更新操作,每一次的更新操作都对应一个写入指令,将每次更新操作对应的写入指令按顺序添加至增量文件中,先添加至增量文件的写入指令排在后添加至增量文件的写入指令的前面。
通过应用本实施例的技术方案,通过获取目标时间对应的业务数据持久化方式,从而按照相应的业务数据持久化方式对数据库中相应目标时间对应的业务数据进行持久化得到持久化数据文件,实现对内存数据的持久化处理,其中,业务数据持久化方式基于目标时间相应的历史参考时间的业务数据特征确定,使得对目标时间的业务数据持久化方式与历史参考时间对应的业务数据特征相匹配。本申请实施例相比于现有技术中技术人员指定一种持久化策略的方式,通过对历史参照时间的业务数据的数据特征进行统计分析从而确定目标时间对应的业务数据持久化方式,使得目标时间的业务数据持久化方式与该时间段对应的业务数据的数据特征相匹配,从而自动选择一种更贴近目标时段业务数据特征的持久化方式,解决了持久化方式需要人工确定缺乏理论依据、持久化方式与业务数据特征不匹配从而导致的业务数据丢失、持久化数据文件过大等问题。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种内存数据的持久化方法,如图2所示,该方法包括:
步骤201,获取与目标时间对应的历史参照时间,以及与历史参照时间对应的业务数据特征,其中,业务数据特征存储于区块链中,业务数据特征包括但不限于历史参照时间内产生的业务数据对应的重要数据占比、读写次数以及数据集大小;
本申请实施例基于目标时间对应的历史参照时间内产生的业务数据的数据特征来确定目标时间的业务数据持久化方式,因此为确定目标时间对应的业务数据持久化规则,应先获取与目标时间对应的历史参照时间,以及与历史参照时间对应的业务数据特征。其中,业务数据特征包括但不限于以下几个方面:该时段产生的业务数据中重要数据的占比、该时段产生的业务数据的读、写次数以及该时段内产生的业务数据的数据集大小,从而对业务数据特征进行分析,并根据业务数据特征确定相应的目标时间对应的业务数据持久化方式。需要强调的是,为进一步保证上述业务数据的数据特征的私密和安全性,上述业务数据特征还可以存储于一区块链的节点中。
其中,步骤201中业务数据特征中的重要数据占比基于以下方式确定:
步骤201-1,分别获取历史参照时间内的每一条业务数据的业务类型标识,并统计历史参照时间内全部业务数据中预设重要业务类型的数据量,其中,
业务类型标识包括但不限于每一条业务数据的key值;
步骤201-2,基于预设重要业务类型的数据量,确定预设重要业务类型的业务数据占全部业务数据的比重,将比重作为重要数据占比。
在上述实施例中,统计历史参照时间内对应的每一条业务数据的业务类型,其中,通过业务数据的业务类型标识确定业务数据的业务类型,具体若数据库中存储的业务数据为key-value数据(键值对数据),可以通过key(关键字)值来确定具体的业务数据的业务类型,并在确定每条业务数据的业务类型后,对属于预设重要业务类型的业务数据的数据量进行统计,将重要业务类型的业务数据的数据量占该时段全部业务数据的数据量的比重作为上述的重要数据占比,从而将该重要数据占比作为业务数据特征的一项分析因素。
步骤202,基于预设数据持久化特征规则,确定与业务数据特征匹配的业务数据持久化方式,其中,预设数据持久化特征规则包括与快照文件方式对应的第一特征规则以及与增量文件方式对应的第二特征规则。
在上述实施例中,通过预先设定不同持久化方式的选择条件,形成预设数据持久化特征规则,从而在获取业务数据对应的业务数据特征之后,确定业务数据特征命中情况,具体的,如果业务数据特征命中第一特征规则,那么可以确定该业务数据特征对应的业务数据持久化方式为快照文件方式,相应的,若命中第二特征规则,则为增量文件方式。在具体的应用场景中,本领域技术人员可以按照实际需要设定第一特征规则和第二特征规则,在此不做具体限定。例如,第一特征规则可以为重要数据占比大于50%,读操作次数大于写操作次数100万次,数据集大小大于1G,那么当业务数据特征满足上述条件时确定业务数据特征匹配的业务数据持久化方式为快照文件方式,否则确定增量文件方式为业务数据持久化方式。
另外,在本申请实施例中,具体地,若业务数据特征与第一特征规则以及第二特征规则均不匹配,则确定业务数据持久化方式为混合方式。
在上述实施例中,业务数据持久化方式还可以包括一种RDB和AOF混合的方式,当业务数据特征未命中第一特征规则,也未命中第二特征规则时,确定业务数据持久化方式为该混合方式,具体如何利用该方式进行数据持久化在下文中详细描述。
需要说明的是,本申请实施例的步骤201和步骤202可以是在需要对目标时间对应的业务数据进行持久化时执行。例如,可以在9月6号0:00到来前,通过获取9月1号至5号每天0:00-1:00对应的业务数据特征从而确定9月6号至10号0:00-1:00对应的业务数据持久化方式。也可以是产生业务数据后立即执行,从而对后续时间段对应的业务数据持久化方式进行预测以便预测的时间段到来时直接按照相应持久化方式执行,具体地,设置定时任务,定时任务自动统计分析已产生业务数据的数据特征,并制定相应时间的业务数据持久化方式。例如,在9月5号1:00之后,通过统计9月1号至5号每天0:00-1:00的业务数据特征,确定9月6号至10号0:00-1:00的业务数据持久化方式,从而在9月6号0:00到来时直接按照相应方式进行数据持久化即可,另外,为了减少定时任务的执行次数,若9月1号至5号每天0:00-1:00的数据特征变大不大,可以将定时任务由每5天统计一次改为每10天统计一次,即从原来的用前5天的业务数据特征确定后5天的业务数据持久化方式,变为用前10天的业务数据特征确定后10天的业务数据持久化方式,提高统计效率。
步骤203,获取目标时间对应的业务数据持久化方式,其中,业务数据持久化方式与目标时间对应的历史参照时间的业务数据特征匹配;
步骤204,基于业务数据持久化方式对目标时间对应的内存数据进行持久化处理,得到持久化数据文件。
在本申请实施例中,按照业务数据持久化方式的不同,上述步骤204具体包括以下3种实施例:
实施例1、
当业务数据持久化方式为快照文件方式时,步骤204,具体包括:
步骤204A1,调用分叉函数fork创建子进程;
步骤204A2,通过子进程将内存中已有的业务数据写入快照文件中。
在上述实施例中,使用fork函数复制一份当前进程的副本(子进程),父进程继续处理客户端请求,fork进程负责把内存的数据同步到磁盘的临时文件,当子进程将快照写入临时文件完毕后,用临时文件替换原来的快照文件,然后子进程退出。
实施例2、
当业务数据持久化方式为增量文件方式时,步骤204,具体包括:
步骤204B1,当有更新数据写入内存时,将更新数据对应的写入指令顺序添加至增量文件中。
在上述实施例中,内存通常会对同一个数据进行不断的更新操作,每一次的更新操作都对应一个写入指令,将每次更新操作对应的写入指令按顺序添加至增量文件中,先添加至增量文件的写入指令排在后添加至增量文件的写入指令的前面。
实施例3、
若目标时间对应的业务数据持久化方式为混合方式,步骤204,具体包括:
步骤204C1,当有更新数据需要写入内存时,将更新数据对应的写入指令顺序添加至增量文件中;
步骤204C2,当增量文件的大小大于或等于预设阈值时,将内存中已有的数据添加至快照文件中,并清空增量文件。
在上述实施例中,混合方式对应的数据持久化过程具体为,先按照增量文件方式持久化业务数据,每次数据更新都将更新数据对应的写入指令添加至增量文件中,写入增量文件中的写入指令将会越来越多,增量文件的大小将变得越来越大,所占用的存储空间也越来越大,当增量文件的大小大于或等于预设阈值时,可以将内存中已有的数据添加至快照文件,其中,本领域技术人员可以根据实际需要设定预设阈值的大小,本申请实施例对此不做限定,另外,将内存中已有的数据添加至快照文件中后,可以将该时段对应的增量文件情况,删除增量文件中已经保存的写入指令。
步骤205,接收业务数据恢复指令,其中,业务数据恢复指令包括恢复时间;
步骤206,获取与恢复时间对应的待恢复的持久化数据文件;
步骤207,按照与待恢复的持久化数据文件对应的时间先后顺序,依次恢复待恢复的持久化数据文件。
在上述实施例中,目标时间对应的业务数据完成持久化之后,若因故障或其他原因需要对相应时段对应的业务数据进行恢复,即接收到业务数据恢复指令之后,应先基于业务数据恢复指令对应的恢复时间,找出与该恢复时间对应的待恢复的持久化数据文件,恢复时间为需要将业务数据回溯到的时间,例如恢复时间为9月2号0:30,那么应恢复截止到9月2号0:30的业务数据,从而基于找出的待恢复文件进行业务数据恢复。其中,持久化数据文件对应有该文件中所存储数据的业务时间,可以每个持久化数据文件对应的业务时间查找与恢复时间匹配的持久化数据文件,例如恢复时间为9月2号1:30,基于持久化文件对应的业务时间查找到当天0:00-1:00对应的RDB快照文件以及1:00-2:00对应的AOF增量文件,那么可以先对RDB快照文件进行恢复,然后再恢复AOF增量文件中0:30之前的数据。
具体地,若持久化数据文件为RDB快照文件,则恢复方式为:调用RDB Load函数,提取RDB快照文件中的业务数据,并将提取的业务数据写入内存中,从而将快照文件RDB中的数据恢复至内存。若持久化数据文件为AOF增量文件,则恢复方式为:提取增量文件中的写入指令,根据写入指令将写入指令对应的数据恢复至内存中。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种内存数据的持久化装置,如图3所示,该装置包括:
持久化方式获取模块31,用于获取目标时间对应的业务数据持久化方式,其中,业务数据持久化方式与目标时间对应的历史参照时间的业务数据特征匹配;
第一持久化模块32,用于若业务数据持久化方式为快照文件方式,则调用分叉函数fork创建子进程,以及通过子进程将内存中已有的业务数据写入快照文件中,得到与目标时间对应的持久化文件;
第二持久化模块33,用于若业务数据持久化方式为增量文件方式,则当有更新数据写入内存时,将更新数据对应的写入指令顺序添加至增量文件中,得到与目标时间对应的持久化文件。
在具体的应用场景中,如图4所示,该装置还包括:
数据特征获取模块34,用于获取目标时间对应的业务数据持久化方式之前,获取与目标时间对应的历史参照时间,以及与历史参照时间对应的业务数据特征,其中,业务数据特征存储于区块链中,业务数据特征包括但不限于历史参照时间内产生的业务数据对应的重要数据占比、读写次数以及数据集大小;
持久化方式确定模块35,用于基于预设数据持久化特征规则,确定与业务数据特征匹配的业务数据持久化方式,其中,预设数据持久化特征规则包括与快照文件方式对应的第一特征规则以及与增量文件方式对应的第二特征规则。
在具体的应用场景中,如图4所示,数据特征获取模块34,具体包括:
业务类型统计单元341,用于当业务数据特征包括重要数据占比时,分别获取历史参照时间内的每一条业务数据的业务类型标识,并统计历史参照时间内全部业务数据中预设重要业务类型的数据量,其中,业务类型标识包括但不限于每一条业务数据的key值;
重要数据占比确定单元342,用于基于预设重要业务类型的数据量,确定预设重要业务类型的业务数据占全部业务数据的比重,将比重作为重要数据占比。
在具体的应用场景中,如图4所示,该装置还包括:
恢复指令接收模块36,用于得到与目标时间对应的持久化数据文件之后,接收业务数据恢复指令,其中,业务数据恢复指令包括恢复时间;
持久化文件获取模块37,用于获取与恢复时间对应的待恢复的持久化数据文件;
数据恢复模块38,用于按照与待恢复的持久化数据文件对应的时间先后顺序,依次恢复待恢复的持久化数据文件。
在具体的应用场景中,如图4所示,持久化方式确定模块31,具体用于:若业务数据特征与第一特征以及第二特征均不匹配,则确定业务数据持久化方式为混合方式;
在具体的应用场景中,如图4所示,该装置还包括:
增量文件添加模块39,用于若目标时间对应的业务数据持久化方式为混合方式,则当有更新数据需要写入内存时,将更新数据对应的写入指令顺序添加至增量文件中;
快照文件写入模块30,用于当增量文件的大小大于或等于预设阈值时,将内存中已有的数据添加至快照文件中,并清空增量文件。
需要说明的是,本申请实施例提供的一种内存数据的持久化装置所涉及各功能单元的其他相应描述,可以参考图1至图2方法中的对应描述,在此不再赘述。
基于上述如图1至图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1至图2所示的内存数据的持久化方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1至图2所示的方法,以及图3至图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的内存数据的持久化方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现通过获取目标时间对应的业务数据持久化方式,从而按照相应的业务数据持久化方式对数据库中相应目标时间对应的业务数据进行持久化得到持久化数据文件,实现对内存数据的持久化处理,其中,业务数据持久化方式基于目标时间相应的历史参考时间的业务数据特征确定,使得对目标时间的业务数据持久化方式与历史参考时间对应的业务数据特征相匹配。本申请实施例相比于现有技术中技术人员指定一种持久化策略的方式,通过对历史参照时间的业务数据的数据特征进行统计分析从而确定目标时间对应的业务数据持久化方式,使得目标时间的业务数据持久化方式与该时间段对应的业务数据的数据特征相匹配,从而自动选择一种更贴近目标时段业务数据特征的持久化方式,解决了持久化方式需要人工确定缺乏理论依据、持久化方式与业务数据特征不匹配从而导致的业务数据丢失、持久化数据文件过大等问题。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种内存数据的持久化方法,其特征在于,包括:
获取目标时间对应的业务数据持久化方式,其中,所述业务数据持久化方式与所述目标时间对应的历史参照时间的业务数据特征匹配;
若所述业务数据持久化方式为所述快照文件方式,则调用分叉函数fork创建子进程,以及通过所述子进程将内存中已有的业务数据写入所述快照文件中,得到与所述目标时间对应的持久化文件;
若所述业务数据持久化方式为所述增量文件方式,则当有更新数据写入内存时,将所述更新数据对应的写入指令顺序添加至所述增量文件中,得到与所述目标时间对应的持久化文件。
2.根据权利要求1所述的方法,其特征在于,所述获取目标时间对应的业务数据持久化方式之前,所述方法还包括:
获取与所述目标时间对应的所述历史参照时间,以及与所述历史参照时间对应的所述业务数据特征,其中,所述业务数据特征存储于区块链中,所述业务数据特征包括但不限于所述历史参照时间内产生的业务数据对应的重要数据占比、读写次数以及数据集大小;
基于预设数据持久化特征规则,确定与所述业务数据特征匹配的所述业务数据持久化方式,其中,所述预设数据持久化特征规则包括与所述快照文件方式对应的第一特征规则以及与所述增量文件方式对应的第二特征规则。
3.根据权利要求2所述的方法,其特征在于,当所述业务数据特征包括所述重要数据占比时,所述获取与所述历史参照时间对应的所述业务数据特征,具体包括:
分别获取所述历史参照时间内的每一条业务数据的业务类型标识,并统计所述历史参照时间内全部业务数据中预设重要业务类型的数据量,其中,所述业务类型标识包括但不限于所述每一条业务数据的key值;
基于所述预设重要业务类型的数据量,确定所述预设重要业务类型的业务数据占所述全部业务数据的比重,将所述比重作为所述重要数据占比。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述得到与所述目标时间对应的持久化文件之后,所述方法还包括:
接收业务数据恢复指令,其中,所述业务数据恢复指令包括恢复时间;
获取与所述恢复时间对应的待恢复的持久化数据文件;
按照与所述待恢复的持久化数据文件对应的时间先后顺序,依次恢复所述待恢复的持久化数据文件。
5.根据权利要求2所述的方法,其特征在于,所述确定与所述业务数据特征匹配的所述持久化方式,具体包括:
若所述业务数据特征与所述第一特征规则以及所述第二特征规则均不匹配,则确定所述业务数据持久化方式为混合方式;
所述获取目标时间对应的业务数据持久化方式之后,所述方法还包括:
若所述目标时间对应的所述业务数据持久化方式为所述混合方式,则当有更新数据需要写入内存时,将所述更新数据对应的写入指令顺序添加至增量文件中;
当所述增量文件的大小大于或等于预设阈值时,将所述内存中已有的数据添加至快照文件中,并清空所述增量文件。
6.一种内存数据的持久化装置,其特征在于,包括:
持久化方式获取模块,用于获取目标时间对应的业务数据持久化方式,其中,所述业务数据持久化方式与所述目标时间对应的历史参照时间的业务数据特征匹配;
第一持久化模块,用于若所述业务数据持久化方式为所述快照文件方式,则调用分叉函数fork创建子进程,以及通过所述子进程将内存中已有的业务数据写入所述快照文件中,得到与所述目标时间对应的持久化文件;
第二持久化模块,用于若所述业务数据持久化方式为所述增量文件方式,则当有更新数据写入内存时,将所述更新数据对应的写入指令顺序添加至所述增量文件中,得到与所述目标时间对应的持久化文件。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
数据特征获取模块,用于所述获取目标时间对应的业务数据持久化方式之前,获取与所述目标时间对应的所述历史参照时间,以及与所述历史参照时间对应的所述业务数据特征,其中,所述业务数据特征存储于区块链中,所述业务数据特征包括但不限于所述历史参照时间内产生的业务数据对应的重要数据占比、读写次数以及数据集大小;
持久化方式确定模块,用于基于预设数据持久化特征规则,确定与所述业务数据特征匹配的所述业务数据持久化方式,其中,所述预设数据持久化特征规则包括与所述快照文件方式对应的第一特征规则以及与所述增量文件方式对应的第二特征规则。
8.根据权利要求7所述的装置,其特征在于,所述数据特征获取模块,具体包括:
业务类型统计单元,用于当所述业务数据特征包括所述重要数据占比时,分别获取所述历史参照时间内的每一条业务数据的业务类型标识,并统计所述历史参照时间内全部业务数据中预设重要业务类型的数据量,其中,所述业务类型标识包括但不限于所述每一条业务数据的key值;
重要数据占比确定单元,用于基于所述预设重要业务类型的数据量,确定所述预设重要业务类型的业务数据占所述全部业务数据的比重,将所述比重作为所述重要数据占比。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的内存数据的持久化方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的内存数据的持久化方法。
CN202011599588.9A 2020-12-29 2020-12-29 内存数据的持久化方法及装置、存储介质、计算机设备 Active CN112685360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011599588.9A CN112685360B (zh) 2020-12-29 2020-12-29 内存数据的持久化方法及装置、存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011599588.9A CN112685360B (zh) 2020-12-29 2020-12-29 内存数据的持久化方法及装置、存储介质、计算机设备

Publications (2)

Publication Number Publication Date
CN112685360A true CN112685360A (zh) 2021-04-20
CN112685360B CN112685360B (zh) 2023-09-22

Family

ID=75454297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011599588.9A Active CN112685360B (zh) 2020-12-29 2020-12-29 内存数据的持久化方法及装置、存储介质、计算机设备

Country Status (1)

Country Link
CN (1) CN112685360B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116755683A (zh) * 2023-08-14 2023-09-15 腾讯科技(深圳)有限公司 一种数据处理方法和相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971170A (zh) * 2014-04-17 2014-08-06 北京百度网讯科技有限公司 一种用于对特征信息的变化进行预测的方法和装置
CN105989160A (zh) * 2015-03-03 2016-10-05 大唐软件技术股份有限公司 一种针对Redis数据库的内存数据持久化方法和装置
CN110309122A (zh) * 2018-03-28 2019-10-08 腾讯科技(深圳)有限公司 获取增量数据的方法、装置、服务器和存储介质
CN110515774A (zh) * 2019-08-28 2019-11-29 北京百度网讯科技有限公司 内存快照的生成方法、装置、电子设备及存储介质
US20200050681A1 (en) * 2018-08-09 2020-02-13 Netapp, Inc. Methods and systems for protecting data of a persistent memory based file system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971170A (zh) * 2014-04-17 2014-08-06 北京百度网讯科技有限公司 一种用于对特征信息的变化进行预测的方法和装置
CN105989160A (zh) * 2015-03-03 2016-10-05 大唐软件技术股份有限公司 一种针对Redis数据库的内存数据持久化方法和装置
CN110309122A (zh) * 2018-03-28 2019-10-08 腾讯科技(深圳)有限公司 获取增量数据的方法、装置、服务器和存储介质
US20200050681A1 (en) * 2018-08-09 2020-02-13 Netapp, Inc. Methods and systems for protecting data of a persistent memory based file system
CN110515774A (zh) * 2019-08-28 2019-11-29 北京百度网讯科技有限公司 内存快照的生成方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116755683A (zh) * 2023-08-14 2023-09-15 腾讯科技(深圳)有限公司 一种数据处理方法和相关装置
CN116755683B (zh) * 2023-08-14 2023-11-14 腾讯科技(深圳)有限公司 一种数据处理方法和相关装置

Also Published As

Publication number Publication date
CN112685360B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN109034993B (zh) 对账方法、设备、系统及计算机可读存储介质
US10158549B2 (en) Real-time monitoring of computer system processor and transaction performance during an ongoing performance test
CN107832406B (zh) 海量日志数据的去重入库方法、装置、设备及存储介质
US10031948B1 (en) Idempotence service
CN111414389A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN110716739B (zh) 一种代码变更信息统计方法、系统和可读存储介质
CN110543354B (zh) 任务调度方法、装置、设备及存储介质
CN111414362B (zh) 数据读取方法、装置、设备及存储介质
CN110445828B (zh) 一种基于Redis的数据分布式处理方法及其相关设备
CN106933836B (zh) 一种基于分表的数据存储方法和系统
CN107491383A (zh) 应用崩溃操作日志的捕获方法、装置及移动终端
CN110392100B (zh) 高并发事件的处理方法及装置、存储介质、计算机设备
CN109359109B (zh) 一种基于分布式流计算的数据处理方法及系统
US10642530B2 (en) Global occupancy aggregator for global garbage collection scheduling
CN112115113A (zh) 数据存储系统、方法、装置、设备以及存储介质
CN115048254A (zh) 数据分配策略的仿真测试方法、系统、设备和可读介质
CN111753141B (zh) 一种数据管理方法及相关设备
CN112685360B (zh) 内存数据的持久化方法及装置、存储介质、计算机设备
JP2023553220A (ja) マルチインスタンスプロセスのためのプロセスマイニング
CN114153856A (zh) 主机数据双写方法及装置
CN112380115A (zh) 一种回归测试方法、装置、电子设备及存储介质
US11403274B1 (en) Efficient creation and/or restatement of database tables
CN115293685A (zh) 物流订单的状态跟踪方法、装置、设备和存储介质
CN111078738B (zh) 数据处理方法、装置、电子设备和存储介质
US11048664B2 (en) Log destaging from fixed-size log portion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230829

Address after: No. 546, Luoyu Road, Hongshan District, Wuhan, Hubei Province, 430000

Applicant after: HUBEI CENTRAL CHINA TECHNOLOGY DEVELOPMENT OF ELECTRIC POWER Co.,Ltd.

Address before: 518000 Room 202, block B, aerospace micromotor building, No.7, Langshan No.2 Road, Xili street, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: Shenzhen LIAN intellectual property service center

Effective date of registration: 20230829

Address after: 518000 Room 202, block B, aerospace micromotor building, No.7, Langshan No.2 Road, Xili street, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen LIAN intellectual property service center

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: PING AN PUHUI ENTERPRISE MANAGEMENT Co.,Ltd.

GR01 Patent grant
GR01 Patent grant