CN111090786B - 基于数据压缩的业务数据动态存储方法及装置 - Google Patents

基于数据压缩的业务数据动态存储方法及装置 Download PDF

Info

Publication number
CN111090786B
CN111090786B CN202010193763.8A CN202010193763A CN111090786B CN 111090786 B CN111090786 B CN 111090786B CN 202010193763 A CN202010193763 A CN 202010193763A CN 111090786 B CN111090786 B CN 111090786B
Authority
CN
China
Prior art keywords
data
storage
service data
compressed
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010193763.8A
Other languages
English (en)
Other versions
CN111090786A (zh
Inventor
杨贻宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Feiqi Network Technology Co ltd
Original Assignee
Shanghai Feiqi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feiqi Network Technology Co ltd filed Critical Shanghai Feiqi Network Technology Co ltd
Priority to CN202010193763.8A priority Critical patent/CN111090786B/zh
Publication of CN111090786A publication Critical patent/CN111090786A/zh
Application granted granted Critical
Publication of CN111090786B publication Critical patent/CN111090786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于数据压缩的业务数据动态存储方法及装置。首先,确定目标数据业务的数据容量均值并结合动态存储设备的存储区的剩余存储容量值确定存储溢出容量值。其次,确定存储区中的每个业务数据集的数据活跃度并根据数据活跃度的大小顺序以及存储溢出容量值对确定得到的待压缩数据进行特征提取得到数据特征向量。最后,在对当前业务数据进行存储时,根据每个数据特征向量将每个待压缩数据进行压缩存储以释放目标存储容量值,使得动态存储设备可以将当前业务数据进行完整地存储。如此,可以将存储区中已存储的业务数据进行压缩以实现动态存储,从而释放存储区的存储容量,确保将当前业务数据完整地进行存储,避免当前业务数据的丢失。

Description

基于数据压缩的业务数据动态存储方法及装置
技术领域
本发明涉及大数据存储技术领域,具体而言,涉及一种基于数据压缩的业务数据动态存储方法及装置。
背景技术
随着大数据通信的迅速发展,大数据资源的类型不断增多且数据规模不断增大,对数据存储设备的各方面要求也在不断提高。在对海量数据进行存储管理时,数据存储设备的存储性能和存储效率是应对不同存储需求的关键。然而数据存储设备在对数据进行存储时,可能因为存储性能刻板且存储效率低下而导致部分数据的丢失。
发明内容
为了改善上述问题,本发明提供了一种基于数据压缩的业务数据动态存储方法及装置。
本发明实施例的第一方面,提供了一种基于数据压缩的业务数据动态存储方法,应用于与业务终端通信的动态存储设备,所述方法包括:
根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,所述历史业务数据是指所述业务终端临时存储在所述动态存储设备中的业务数据;
根据所述数据容量均值以及所述动态存储设备的存储区的剩余存储容量值,确定所述数据容量均值相对于所述剩余存储容量值的存储溢出容量值;
基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度;
根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量;
在接收到所述业务终端发送的用于储存当前业务数据的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储;
向所述业务终端发送响应信息,接收所述业务终端发送的当前业务数据并将当前业务数据存储至所述存储区中。
在一种可替换的实施方式中,所述方法还包括:
判断在设定时长内是否接收到所述业务终端发送的用于获取所述存储区中的当前业务数据的第一数据获取指令;
若在所述设定时长内接收到所述第一数据获取指令,则将当前业务数据发送给所述业务终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原;
若在所述设定时长内未接收到所述第一数据获取指令,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
在一种可替换的实施方式中,所述方法还包括:
判断在设定时长内是否接收到其它终端发送的用于获取所述存储区中的当前业务数据的第二数据获取指令;
在所述设定时长内接收到所述第二数据获取指令时,解析所述第二数据获取指令得到所述第二数据获取指令中包括的校验字段;
从存储于所述存储区的当前业务数据中获取用于对所述校验字段进验证的动态随机数;
根据所述动态随机数对所述校验字段进行校验得到校验结果;
在所述校验结果表征所述第二数据获取指令为合法指令时,将当前业务数据发送给所述其它终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,在所述校验结果表征所述第二数据获取指令为非法指令时,向所述业务终端发送用于提示存在对当前业务数据进行非法获取行为的提示信息;
在所述设定时长内未接收到所述第二数据获取指令时,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
在一种可替换的实施方式中,根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,包括:
根据所述动态存储设备的资源配置信息确定所述业务数据存储记录的结构化描述信息,所述资源配置信息为所述动态存储设备的运行日志信息,所述结构化描述信息包括用于表征所述业务数据存储记录中每个存储交互记录在所述业务数据存储记录对应的关联列表中的行列位置,所述关联列表存储于所述动态存储设备中,所述行列位置为二维数组,所述二维数组包括用于表示所述存储交互记录在所述关联列表中的行数的第一数值以及用于表示所述存储交互记录在所述关联列表中的列数的第二数值;
基于所述结构化描述信息中的每个存储交互记录的行列位置,确定每个存储交互记录包括的历史业务数据的参数信息在所述动态存储设备中的存储位置;根据所述存储位置获取每个存储交互记录包括的历史业务数据的数据容量值;
根据每个存储交互记录中包括的所述业务终端与所述动态存储设备的交互时段为每个存储交互记录对应的数据容量值设置加权系数,并对每个数据容量值进行加权求和得到所述数据容量均值。
在一种可替换的实施方式中,基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度,包括:
针对所述动态存储设备的存储区中的每个业务数据集,基于该业务数据集在预设时段内被调用的第一累计值以及各所述业务数据集在所述预设时段内被调用的第二累计值,确定该业务数据集在所述预设时段内的影响因子,所述影响因子用于表征该业务数据集在所述预设时段内的调用活跃度或在所述预设时段内的调用率,所述第一累计值和所述第二累计值通过所述数据调用记录获得;
根据该业务数据集在两个连续的预设时段内的影响因子确定该业务数据集在两个连续的预设时段之间被调用的影响轨迹,所述影响轨迹用于表征影响因子的变化趋势;基于所述影响轨迹确定所述该业务数据集的活跃系数,所述活跃系数用于表征该业务数据集相对于所述存储区中的除该业务数据集之外的业务数据集的活跃度;
基于所述活跃系数确定该业务数据集的数据活跃度。
在一种可替换的实施方式中,根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量,包括:
将所述存储区中的所有业务数据集按照数据活跃度由小到大的顺序进行排列得到排序序列;
判断所述排序序列中前N个待压缩数据在所述存储区中所占用的存储容量总和是否达到所述存储溢出容量值,N为正整数,N的初始值为一;
若是,则将对前N个待压缩数据进行特征提取,得到N个数据特征向量;
若否,则使N自加一并返回判断所述排序序列中前N个待压缩数据在所述存储区中所占用的存储容量总和是否达到所述存储溢出容量值的步骤。
在一种可替换的实施方式中,在接收到所述业务终端发送的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储,包括:
建立每个数据特征向量与其对应的待压缩数据的映射关系,并将映射关系通过一个映射关系列表进行记录;
将存储于所述存储区的每个待压缩数据替换为对应的数据特征向量。
本发明实施例的第二方面,提供了一种基于数据压缩的业务数据动态存储装置,应用于与业务终端通信的动态存储设备,所述装置包括:
均值确定模块,用于根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,所述历史业务数据是指所述业务终端临时存储在所述动态存储设备中的业务数据;
溢出值确定模块,用于根据所述数据容量均值以及所述动态存储设备的存储区的剩余存储容量值,确定所述数据容量均值相对于所述剩余存储容量值的存储溢出容量值;
活跃度确定模块,用于基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度;
特征提取模块,用于根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量;
数据压缩模块,用于在接收到所述业务终端发送的用于储存当前业务数据的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储;
数据存储模块,用于向所述业务终端发送响应信息,接收所述业务终端发送的当前业务数据并将当前业务数据存储至所述存储区中。
在一种可替换的实施方式中,所述装置还包括指令判断模块,用于:
判断在设定时长内是否接收到所述业务终端发送的用于获取所述存储区中的当前业务数据的第一数据获取指令;若在所述设定时长内接收到所述第一数据获取指令,则将当前业务数据发送给所述业务终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原;若在所述设定时长内未接收到所述第一数据获取指令,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
在一种可替换的实施方式中,所述指令判断模块,还用于:
判断在设定时长内是否接收到其它终端发送的用于获取所述存储区中的当前业务数据的第二数据获取指令;在所述设定时长内接收到所述第二数据获取指令时,解析所述第二数据获取指令得到所述第二数据获取指令中包括的校验字段;从存储于所述存储区的当前业务数据中获取用于对所述校验字段进验证的动态随机数;根据所述动态随机数对所述校验字段进行校验得到校验结果;在所述校验结果表征所述第二数据获取指令为合法指令时,将当前业务数据发送给所述其它终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,在所述校验结果表征所述第二数据获取指令为非法指令时,向所述业务终端发送用于提示存在对当前业务数据进行非法获取行为的提示信息;在所述设定时长内未接收到所述第二数据获取指令时,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
本发明实施例所提供的基于数据压缩的业务数据动态存储方法及装置,首先,基于业务数据存储记录确定目标数据业务的数据容量均值并结合动态存储设备的存储区的剩余存储容量值确定存储溢出容量值。
其次,基于数据调用记录确定存储区中的每个业务数据集的数据活跃度并根据数据活跃度的大小顺序以及存储溢出容量值对确定得到的待压缩数据进行特征提取得到数据特征向量。
最后,在对当前业务数据进行存储时,根据每个数据特征向量将每个待压缩数据进行压缩存储以释放目标存储容量值,使得动态存储设备可以将当前业务数据进行完整地存储。
如此,可以将存储区中已存储的业务数据进行压缩以实现动态存储,从而释放存储区的存储容量,确保将当前业务数据完整地进行存储,避免当前业务数据的丢失。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的一种基于数据压缩的业务数据动态存储方法的流程图。
图2为本发明实施例所提供的一种基于数据压缩的业务数据动态存储方法的另一流程图。
图3为一实施方式中图1所示的步骤S24的子步骤示意图。
图4为本发明实施例所提供的一种基于数据压缩的业务数据动态存储装置的功能模块框图。
图5为本发明实施例所提供的一种动态存储设备的产品模块示意图。
图标:
20-基于数据压缩的业务数据动态存储装置;21-均值确定模块;22-溢出值确定模块;23-活跃度确定模块;24-特征提取模块;25-数据压缩模块;26-数据存储模块;27-指令判断模块;
30-动态存储设备;31-处理器;32-总线;33-存储器。
具体实施方式
下面将参照附图更详细地描述本发明公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
当数据存储设备与多个业务终端进行交互时,某个业务终端可能会将业务数据临时存储在数据存储设备中,经过一段时间之后再从数据存储设备中获取临时存储的业务数据,或者由其他业务终端从数据存储设备中获取该业务数据。然而,在数据存储设备的剩余存储空间不足时,可能无法将业务数据进行完整地存储,这会导致部分业务数据的丢失。
为改善上述问题,本发明实施例提供了一种基于数据压缩的业务数据动态存储方法,该方法应用于与业务终端通信的动态存储设备,请结合参阅图1,该方法包括的具体内容描述如下。
步骤S21,根据动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值。
在本实施例中,所述业务数据存储记录中包括所述动态存储设备与所述业务终端的多个存储交互记录,每个存储交互记录中包括历史业务数据的数据容量值,所述历史业务数据是所述业务终端临时存储在所述动态存储设备中的业务数据,所述数据容量值用于表征所述历史业务数据的大小。
步骤S22,根据所述数据容量均值以及所述动态存储设备的存储区的剩余存储容量值,确定所述数据容量均值相对于所述剩余存储容量值的存储溢出容量值。
在本实施例中,所述存储溢出容量值可以为所述数据容量均值与所述剩余存储容量值之间的差值。
步骤S23,基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度。
步骤S24,根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量。
步骤S25,在接收到所述业务终端发送的用于储存当前业务数据的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储。
步骤S26,向所述业务终端发送响应信息,接收所述业务终端发送的当前业务数据并将当前业务数据存储至所述存储区中。
在本实施例中,所述目标存储容量值可以大于等于所述存储溢出容量值。
可以理解,在上述步骤S21到步骤S26所描述的方法中,动态存储设备会根据业务数据存储记录以及数据调用记录确定出业务数据集中数据活跃度较低的数据作为待压缩数据,并在接收到业务终端发送的数据存储请求时将待压缩数据进行压缩以释放存储区的存储空间,然后将业务终端发送的当前业务数据进行完整地存储,从而避免因存储空间不足导致在存储当前业务数据时的部分数据的丢失。
在具体实施时,当前业务数据是临时存储在存储区中的,为了确保存储区中除当前业务数据之外的业务数据能够被完整地调用,当前业务数据在存储区中的存储时长不宜过长。为此,在上述步骤S21到步骤S26的基础上,该业务数据动态存储方法还可以包括图2所示的步骤,具体描述如下。
步骤S271,判断在设定时长内是否接收到所述业务终端发送的用于获取所述存储区中的当前业务数据的第一数据获取指令。
步骤S272,若在所述设定时长内接收到所述第一数据获取指令,则将当前业务数据发送给所述业务终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
步骤S273,若在所述设定时长内未接收到所述第一数据获取指令,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
在本实施例中,设定时长可以根据当前业务数据中携带的临时存储标识确定,临时存储标识可以是业务终端在封装当前业务数据时添加的,临时存储标识用于指示当前业务数据的临时存储时长。动态存储设备可以根据临时存储标识确定出当前业务数据的期望存储时长,然后根据该期望存储时长以及动态存储设备的设备延时确定设定时长。一般而言,设定时长可以大于当前业务数据的期望存储时长。
可以理解,通过上述步骤S271到步骤S273所描述的方法,不仅能够在设定时长内接收到业务终端发送的第一数据获取指令时将存储于存储区中的当前业务数据返还给业务终端,并根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,还能够在设定时长内未接收到第一数据获取指令时将当前业务数据从存储区中删除并根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
在本实施例中,将压缩存储的每个待压缩数据进行还原可以理解为将压缩存储的每个待压缩数据进行解压缩存储。如此,能够根据设定时长为当前业务数据设置存储时限,避免当前业务数据长时间占据存储区,进而避免待压缩数据长时间处于压缩存储状态。确保处于压缩状态的待压缩数据能够存在动态的压缩和解压缩行为,确保存储区中除当前业务数据之外的业务数据能够被完整地调用。
在一种可替换的实施方式中,在上述步骤S21到步骤S273的基础上,该业务数据动态存储方法还可以包括下述步骤S281到步骤S286所描述的内容。
步骤S281,判断在设定时长内是否接收到其它终端发送的第二数据获取指令。
步骤S282,在所述设定时长内接收到所述第二数据获取指令时,解析所述第二数据获取指令得到所述第二数据获取指令中包括的校验字段。
步骤S283,从存储于所述存储区的当前业务数据中获取用于对所述校验字段进验证的动态随机数。
步骤S284,根据所述动态随机数对所述校验字段进行校验得到校验结果。
步骤S285,在所述校验结果表征所述第二数据获取指令为合法指令时,将当前业务数据发送给所述其它终端并根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,在所述校验结果表征所述第二数据获取指令为非法指令时,向所述业务终端发送用于提示存在对当前业务数据进行非法获取行为的提示信息。
步骤S286,在所述设定时长内未接收到所述第二数据获取指令时,则将当前业务数据从所述存储区中删除并根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
通过上述步骤S281到步骤S286所描述的方法,能够对除业务终端之外的业务终端发送的数据获取指令进行合法性验证,并基于合法性验证结果执行不同的响应。如此,能够确保存储于存储区中的当前业务数据的安全性。
可选地,在步骤S21中,根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,一种可替代的具体实现方法可以包括下述步骤S211到步骤S213所描述的方法。
步骤S211,根据所述动态存储设备的资源配置信息确定所述业务数据存储记录的结构化描述信息。
在本实施例中,所述资源配置信息为所述动态存储设备的运行日志信息,所述结构化描述信息包括用于表征所述业务数据存储记录中每个存储交互记录在所述业务数据存储记录对应的关联列表中的行列位置,所述关联列表存储于所述动态存储设备中,所述行列位置为二维数组,所述二维数组包括用于表示所述存储交互记录在所述关联列表中的行数的第一数值以及用于表示所述存储交互记录在所述关联列表中的列数的第二数值。
步骤S212,基于所述结构化描述信息中的每个存储交互记录的行列位置,确定每个存储交互记录包括的历史业务数据的参数信息在所述动态存储设备中的存储位置;根据所述存储位置获取每个存储交互记录包括的历史业务数据的数据容量值。
步骤S213,根据每个存储交互记录中包括的所述业务终端与所述动态存储设备的交互时段为每个存储交互记录对应的数据容量值设置加权系数,并对每个数据容量值进行加权求和得到所述数据容量均值。
在本实施例中,加权系数用于表征每个数据容量值的时效性,加权系数越大,数据容量值的时效性越强,数据容量值对应的交互时段越接近当前时刻。
在本实施例中,通过上述步骤S211到步骤S213所描述的方法,能够基于资源配置信息确定业务数据存储记录的结构化描述信息,进而确定出业务数据存储记录中每个存储交互记录对应的行列位置。从而基于行列位置确定每个存储交互记录包括的历史业务数据的数据容量值并为每个数据容量值设置加权系数。最后通过对每个数据容量值进行加权求和得到数据容量均值。如此,能够将不同数据容量值的时效性考虑在内,进而准确确定出数据容量均值。
在具体实施时,为了准确确定出每个第一业务数据集的数据活跃度,在步骤S23中,基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个第一业务数据集的数据活跃度,具体可以通过下述步骤S231到步骤S233所描述的方法实现。
步骤S231,针对所述动态存储设备的存储区中的每个业务数据集,基于该业务数据集在预设时段内被调用的第一累计值以及各所述业务数据集在所述预设时段内被调用的第二累计值,确定该业务数据集在所述预设时段内的影响因子。
在本实施例中,所述影响因子用于表征该业务数据集在所述预设时段内的调用活跃度或在所述预设时段内的调用率,所述第一累计值和所述第二累计值通过所述数据调用记录获得。
步骤S232,根据该业务数据集在两个连续的预设时段内的影响因子确定该业务数据集在两个连续的预设时段之间被调用的影响轨迹,基于所述影响轨迹确定所述该业务数据集的活跃系数,
在本实施例中,所述影响轨迹用于表征影响因子的变化趋势,所述活跃系数用于表征该业务数据集相对于所述存储区中的除该业务数据集之外的业务数据集的活跃度。
步骤S233,基于所述活跃系数确定该业务数据集的数据活跃度。
在本实施例中,基于上述步骤S231到步骤S233所描述的方法,能够对存储区中的每个第一业务数据集的调用情况进行分析,从而确定出每个第一业务数据集的活跃系数,进而准确确定出每个第一业务数据集的数据活跃度。
在具体实施时,为了避免对存储区存储的业务数据进行过多的压缩存储,从而确保存储区存储的业务数据的周期性完整率。为此,在步骤S24中,根据数据活跃度由小到大的顺序对所述存储区中的所有第一业务数据集中的至少部分待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量,可以通过图3所示的步骤S241到步骤S244所描述的方法实现,具体描述如下。
步骤S241,将所述存储区中的所有业务数据集按照数据活跃度由小到大的顺序进行排列得到排序序列。
步骤S242,判断所述排序序列中前N个待压缩数据在所述存储区中所占用的存储容量总和是否达到所述存储溢出容量值。
在本实施例中,N为正整数,N的初始值为一。
步骤S243,若是,则将对前N个待压缩数据进行特征提取,得到N个数据特征向量。
步骤S244,若否,则使N自加一并返回判断所述排序序列中前N个待压缩数据在所述存储区中所占用的存储容量总和是否达到所述存储溢出容量值的步骤。
可以理解,通过上述步骤S241-步骤S244所描述的内容,能够按照数据活跃度由大到小的顺序对存储区中的所有第一业务数据集进行排序,从而根据排序序列对待压缩数据进行递增分析,以避免对存储区存储的业务数据进行过多的压缩存储,从而确保存储区存储的业务数据的周期性完整率。
在具体实施时,为了确保压缩之后的待压缩数据能够快速地恢复,在步骤S25中,所述在接收到所述业务终端发送的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储,具体可以通过以下步骤S251到步骤S252所描述的方法实现。
步骤S251,建立每个数据特征向量与其对应的待压缩数据的映射关系,并将映射关系通过一个映射关系列表进行记录。
步骤S252,将存储于所述存储区的每个待压缩数据替换为对应的数据特征向量。
在本实施例中,基于上述步骤S251和步骤S252所描述的方法,能够将每个数据特征向量与其对应的待压缩数据的映射关系导入映射关系列表中进行记录,然后将存储于存储区的每个待压缩数据替换为对应的数据特征向量以实现对每个待压缩数据进行压缩存储。
如此,在进行待压缩数据的恢复时,可以根据映射关系列表确定与每个数据特征向量对应的待压缩数据,从而确保压缩之后的待压缩数据能够快速地恢复。
在上述基础上,请结合参阅图4,为本发明实施例所提供的一种基于数据压缩的业务数据动态存储装置20的模块框图,该基于数据压缩的业务数据动态存储装置20可以包括均值确定模块21、溢出值确定模块22、活跃度确定模块23、特征提取模块24、数据压缩模块25和数据存储模块26。
所述均值确定模块21,用于根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,所述历史业务数据是指所述业务终端临时存储在所述动态存储设备中的业务数据。
关于均值确定模块21的详细实现方式可以参阅与图1所示的步骤S21的内容,在此不作更多说明。
所述溢出值确定模块22,用于根据所述数据容量均值以及所述动态存储设备的存储区的剩余存储容量值,确定所述数据容量均值相对于所述剩余存储容量值的存储溢出容量值。
关于溢出值确定模块22的详细实现方式可以参阅与图1所示的步骤S22的内容,在此不作更多说明。
所述活跃度确定模块23,用于基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度。
关于活跃度确定模块23的详细实现方式可以参阅与图1所示的步骤S23的内容,在此不作更多说明。
所述特征提取模块24,用于根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量。
关于特征提取模块24的详细实现方式可以参阅与图1所示的步骤S24的内容,在此不作更多说明。
所述数据压缩模块25,用于在接收到所述业务终端发送的用于储存当前业务数据的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储。
关于数据压缩模块25的详细实现方式可以参阅与图1所示的步骤S25的内容,在此不作更多说明。
所述数据存储模块26,用于向所述业务终端发送响应信息,接收所述业务终端发送的当前业务数据并将当前业务数据存储至所述存储区中。
关于数据存储模块26的详细实现方式可以参阅与图1所示的步骤S26的内容,在此不作更多说明。
在一种可替换的实施方式中,请继续参阅图4,所述业务数据动态存储装置201还包括指令判断模块27,用于判断在设定时长内是否接收到所述业务终端发送的用于获取所述存储区中的当前业务数据的第一数据获取指令;若在所述设定时长内接收到所述第一数据获取指令,则将当前业务数据发送给所述业务终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原;若在所述设定时长内未接收到所述第一数据获取指令,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
在一种可替换的实施方式中,所述指令判断模块27,还用于判断在设定时长内是否接收到其它终端发送的用于获取所述存储区中的当前业务数据的第二数据获取指令;在所述设定时长内接收到所述第二数据获取指令时,解析所述第二数据获取指令得到所述第二数据获取指令中包括的校验字段;从存储于所述存储区的当前业务数据中获取用于对所述校验字段进验证的动态随机数;根据所述动态随机数对所述校验字段进行校验得到校验结果;在所述校验结果表征所述第二数据获取指令为合法指令时,将当前业务数据发送给所述其它终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,在所述校验结果表征所述第二数据获取指令为非法指令时,向所述业务终端发送用于提示存在对当前业务数据进行非法获取行为的提示信息;在所述设定时长内未接收到所述第二数据获取指令时,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
请结合参阅图5,本发明实施例还提供了一种动态存储设备30,包括处理器31,以及与处理器31连接的存储器33和总线32。其中,处理器31和存储器33通过总线32完成相互间的通信。处理器31用于调用存储器33中的程序指令,以执行上述的基于数据压缩的业务数据动态存储方法。
综上,本发明实施例所提供的一种基于数据压缩的业务数据动态存储方法及装置,首先,基于业务数据存储记录确定目标数据业务的数据容量均值并结合动态存储设备的存储区的剩余存储容量值确定存储溢出容量值。
其次,基于数据调用记录确定存储区中的每个业务数据集的数据活跃度并根据数据活跃度的大小顺序以及存储溢出容量值对确定得到的待压缩数据进行特征提取得到数据特征向量。
在对当前业务数据进行存储时,根据每个数据特征向量将每个待压缩数据进行压缩存储以释放目标存储容量值,使得动态存储设备可以将当前业务数据进行完整地存储。
如此,可以将存储区中已存储的业务数据进行压缩以实现动态存储,从而释放存储区的存储容量,确保将当前业务数据完整地进行存储,避免当前业务数据的丢失。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (9)

1.一种基于数据压缩的业务数据动态存储方法,其特征在于,应用于与业务终端通信的动态存储设备,所述方法包括:
根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,所述历史业务数据是指所述业务终端临时存储在所述动态存储设备中的业务数据;
根据所述数据容量均值以及所述动态存储设备的存储区的剩余存储容量值,确定所述数据容量均值相对于所述剩余存储容量值的存储溢出容量值;
基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度;
根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量;
在接收到所述业务终端发送的用于储存当前业务数据的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储;
向所述业务终端发送响应信息,接收所述业务终端发送的当前业务数据并将当前业务数据存储至所述存储区中;
其中,根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,具体包括:
根据所述动态存储设备的资源配置信息确定所述业务数据存储记录的结构化描述信息,所述资源配置信息为所述动态存储设备的运行日志信息,所述结构化描述信息包括用于表征所述业务数据存储记录中每个存储交互记录在所述业务数据存储记录对应的关联列表中的行列位置,所述关联列表存储于所述动态存储设备中,所述行列位置为二维数组,所述二维数组包括用于表示所述存储交互记录在所述关联列表中的行数的第一数值以及用于表示所述存储交互记录在所述关联列表中的列数的第二数值;
基于所述结构化描述信息中的每个存储交互记录的行列位置,确定每个存储交互记录包括的历史业务数据的参数信息在所述动态存储设备中的存储位置;根据所述存储位置获取每个存储交互记录包括的历史业务数据的数据容量值;
根据每个存储交互记录中包括的所述业务终端与所述动态存储设备的交互时段为每个存储交互记录对应的数据容量值设置加权系数,并对每个数据容量值进行加权求和得到所述数据容量均值。
2.根据权利要求1所述的基于数据压缩的业务数据动态存储方法,其特征在于,所述方法还包括:
判断在设定时长内是否接收到所述业务终端发送的用于获取所述存储区中的当前业务数据的第一数据获取指令;
若在所述设定时长内接收到所述第一数据获取指令,则将当前业务数据发送给所述业务终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原;
若在所述设定时长内未接收到所述第一数据获取指令,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
3.根据权利要求1所述的基于数据压缩的业务数据动态存储方法,其特征在于,所述方法还包括:
判断在设定时长内是否接收到其它终端发送的用于获取所述存储区中的当前业务数据的第二数据获取指令;
在所述设定时长内接收到所述第二数据获取指令时,解析所述第二数据获取指令得到所述第二数据获取指令中包括的校验字段;
从存储于所述存储区的当前业务数据中获取用于对所述校验字段进验证的动态随机数;
根据所述动态随机数对所述校验字段进行校验得到校验结果;
在所述校验结果表征所述第二数据获取指令为合法指令时,将当前业务数据发送给所述其它终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,在所述校验结果表征所述第二数据获取指令为非法指令时,向所述业务终端发送用于提示存在对当前业务数据进行非法获取行为的提示信息;
在所述设定时长内未接收到所述第二数据获取指令时,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
4.根据权利要求1所述的业务数据动态存储方法,其特征在于,基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度,包括:
针对所述动态存储设备的存储区中的每个业务数据集,基于该业务数据集在预设时段内被调用的第一累计值以及各所述业务数据集在所述预设时段内被调用的第二累计值,确定该业务数据集在所述预设时段内的影响因子,所述影响因子用于表征该业务数据集在所述预设时段内的调用活跃度或在所述预设时段内的调用率,所述第一累计值和所述第二累计值通过所述数据调用记录获得;
根据该业务数据集在两个连续的预设时段内的影响因子确定该业务数据集在两个连续的预设时段之间被调用的影响轨迹,所述影响轨迹用于表征影响因子的变化趋势;基于所述影响轨迹确定所述该业务数据集的活跃系数,所述活跃系数用于表征该业务数据集相对于所述存储区中的除该业务数据集之外的业务数据集的活跃度;
基于所述活跃系数确定该业务数据集的数据活跃度。
5.根据权利要求1所述的业务数据动态存储方法,其特征在于,根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量,包括:
将所述存储区中的所有业务数据集按照数据活跃度由小到大的顺序进行排列得到排序序列;
判断所述排序序列中前N个待压缩数据在所述存储区中所占用的存储容量总和是否达到所述存储溢出容量值,N为正整数,N的初始值为一;
若是,则将对前N个待压缩数据进行特征提取,得到N个数据特征向量;
若否,则使N自加一并返回判断所述排序序列中前N个待压缩数据在所述存储区中所占用的存储容量总和是否达到所述存储溢出容量值的步骤。
6.根据权利要求1所述的业务数据动态存储方法,其特征在于,在接收到所述业务终端发送的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储,包括:
建立每个数据特征向量与其对应的待压缩数据的映射关系,并将映射关系通过一个映射关系列表进行记录;
将存储于所述存储区的每个待压缩数据替换为对应的数据特征向量。
7.一种基于数据压缩的业务数据动态存储装置,其特征在于,应用于与业务终端通信的动态存储设备,所述装置包括:
均值确定模块,用于根据所述动态存储设备的业务数据存储记录确定历史业务数据的数据容量均值,所述历史业务数据是指所述业务终端临时存储在所述动态存储设备中的业务数据;
溢出值确定模块,用于根据所述数据容量均值以及所述动态存储设备的存储区的剩余存储容量值,确定所述数据容量均值相对于所述剩余存储容量值的存储溢出容量值;
活跃度确定模块,用于基于所述动态存储设备的数据调用记录,确定存储于所述动态存储设备的存储区中的每个业务数据集的数据活跃度;
特征提取模块,用于根据数据活跃度由小到大的顺序以及所述存储溢出容量值从所述存储区中的所有业务数据集中确定待压缩数据,并对所述待压缩数据进行特征提取,得到每个待压缩数据对应的数据特征向量;
数据压缩模块,用于在接收到所述业务终端发送的用于储存当前业务数据的数据存储请求时,根据每个数据特征向量将每个待压缩数据进行压缩存储;
数据存储模块,用于向所述业务终端发送响应信息,接收所述业务终端发送的当前业务数据并将当前业务数据存储至所述存储区中;
其中,所述均值确定模块,具体用于:
根据所述动态存储设备的资源配置信息确定所述业务数据存储记录的结构化描述信息,所述资源配置信息为所述动态存储设备的运行日志信息,所述结构化描述信息包括用于表征所述业务数据存储记录中每个存储交互记录在所述业务数据存储记录对应的关联列表中的行列位置,所述关联列表存储于所述动态存储设备中,所述行列位置为二维数组,所述二维数组包括用于表示所述存储交互记录在所述关联列表中的行数的第一数值以及用于表示所述存储交互记录在所述关联列表中的列数的第二数值;
基于所述结构化描述信息中的每个存储交互记录的行列位置,确定每个存储交互记录包括的历史业务数据的参数信息在所述动态存储设备中的存储位置;根据所述存储位置获取每个存储交互记录包括的历史业务数据的数据容量值;
根据每个存储交互记录中包括的所述业务终端与所述动态存储设备的交互时段为每个存储交互记录对应的数据容量值设置加权系数,并对每个数据容量值进行加权求和得到所述数据容量均值。
8.根据权利要求7所述的基于数据压缩的业务数据动态存储装置,其特征在于,所述装置还包括指令判断模块,用于:
判断在设定时长内是否接收到所述业务终端发送的用于获取所述存储区中的当前业务数据的第一数据获取指令;若在所述设定时长内接收到所述第一数据获取指令,则将当前业务数据发送给所述业务终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原;若在所述设定时长内未接收到所述第一数据获取指令,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
9.根据权利要求8所述的基于数据压缩的业务数据动态存储装置,其特征在于,所述指令判断模块,还用于:
判断在设定时长内是否接收到其它终端发送的用于获取所述存储区中的当前业务数据的第二数据获取指令;在所述设定时长内接收到所述第二数据获取指令时,解析所述第二数据获取指令得到所述第二数据获取指令中包括的校验字段;从存储于所述存储区的当前业务数据中获取用于对所述校验字段进验证的动态随机数;根据所述动态随机数对所述校验字段进行校验得到校验结果;在所述校验结果表征所述第二数据获取指令为合法指令时,将当前业务数据发送给所述其它终端,并在从所述存储区中删除当前业务数据后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原,在所述校验结果表征所述第二数据获取指令为非法指令时,向所述业务终端发送用于提示存在对当前业务数据进行非法获取行为的提示信息;在所述设定时长内未接收到所述第二数据获取指令时,则将当前业务数据从所述存储区中删除后,根据每个数据特征向量将压缩存储的每个待压缩数据进行还原。
CN202010193763.8A 2020-03-19 2020-03-19 基于数据压缩的业务数据动态存储方法及装置 Active CN111090786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010193763.8A CN111090786B (zh) 2020-03-19 2020-03-19 基于数据压缩的业务数据动态存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010193763.8A CN111090786B (zh) 2020-03-19 2020-03-19 基于数据压缩的业务数据动态存储方法及装置

Publications (2)

Publication Number Publication Date
CN111090786A CN111090786A (zh) 2020-05-01
CN111090786B true CN111090786B (zh) 2020-06-26

Family

ID=70400646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010193763.8A Active CN111090786B (zh) 2020-03-19 2020-03-19 基于数据压缩的业务数据动态存储方法及装置

Country Status (1)

Country Link
CN (1) CN111090786B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538464B (zh) * 2020-05-10 2021-05-07 浙江智飨科技有限公司 一种基于物联网平台的数据清理方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473276B (zh) * 2013-08-26 2017-08-25 广东电网公司电力调度控制中心 超大型数据存储方法、分布式数据库系统及其检索方法
CN103914516B (zh) * 2014-02-25 2017-09-08 深圳市中博科创信息技术有限公司 一种存储系统分层管理的方法与系统
US10015274B2 (en) * 2015-12-31 2018-07-03 International Business Machines Corporation Enhanced storage clients
CN110765125B (zh) * 2018-07-25 2022-09-20 杭州海康威视数字技术股份有限公司 一种存储数据的方法及装置

Also Published As

Publication number Publication date
CN111090786A (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
US10412170B2 (en) Retention-based data management in a network-based data store
JP5160408B2 (ja) サービス要求を満足するためのリソース・マネージャを選択するための方法、システム、およびコンピュータ・プログラム
CN112788270B (zh) 视频回溯方法、装置、计算机设备及存储介质
CN112835792B (zh) 一种压力测试系统及方法
CN109495547B (zh) 车辆信号采集方法、装置以及云端服务器和车辆
CN107707660B (zh) 算法可选择的基于身份验证技术的云存储方法及系统
CN111090786B (zh) 基于数据压缩的业务数据动态存储方法及装置
CN106648445B (zh) 用于网络爬虫的数据存储方法及装置
CN114818446A (zh) 面向5g云边端协同的电力业务分解方法及系统
CN111538464B (zh) 一种基于物联网平台的数据清理方法及装置
CN114357445A (zh) 一种终端侧攻击路径识别的方法、装置及存储介质
CN110019347A (zh) 一种区块链的数据处理方法、装置及终端设备
CN116595224A (zh) 针对在线业务会话的大数据存储优化方法及服务器
CN105871982A (zh) 内容推送的方法、装置以及系统
CN114500348B (zh) 一种cdn网关测试方法及系统
CN115168203A (zh) 接口模拟方法、装置、系统、计算机设备和存储介质
CN113934510A (zh) 镜像处理方法、装置、电子设备及计算机可读存储介质
CN113407491A (zh) 数据处理方法及装置
CN113676377A (zh) 基于大数据的在线用户数评估方法、装置、设备及介质
CN113342274A (zh) 一种数据处理方法及装置
CN111435346A (zh) 离线数据的处理方法、装置及设备
CN112488723A (zh) 结合区块链网络和大数据分析的支付验证方法及智能设备
CN116663068B (zh) 联盟链归档方法、相关装置和介质
CN110334047A (zh) 采集设备数据的系统及方法、变频器及计算机可读介质
KR100464486B1 (ko) 에이티엠 교환기 운용터미널의 로그 관리 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant