CN113779043A

CN113779043A - 一种数据分布式缓存自动加载与转换方法

Info

Publication number: CN113779043A
Application number: CN202111303289.0A
Authority: CN
Inventors: 陈忠国; 李忱; 周鑫; 江何; 门殿春; 孟繁荣; 姚志强
Original assignee: Beijing Testor Technology Co ltd; Beijing Tongtech Co Ltd
Current assignee: Beijing Testor Technology Co ltd; Beijing Tongtech Co Ltd
Priority date: 2021-11-05
Filing date: 2021-11-05
Publication date: 2021-12-10

Abstract

本发明公开了一种数据分布式缓存自动加载与转换方法，具体涉及数据库技术领域，通过采用一致性哈希均匀分布的缓存方式，实现基于现一致性哈希分布式数据的环状存储结构，同时采用存入数据的特征提取，使其数据实现向特征的转换，并针对于特征创立相应集合数据库，采用独立的搜索引擎对内容索引，使其分布式大数据实现统一集合索引，提高检索速度同时，依照数据节点的超链对应，形成数据的精准读取，同步的配合三层缓存的方式，针对于时效性的缓存数据而言，对于清除的缓存数据单独存储，实现高频率文件的集合，降低再次通过分布式存储数据调用，一定程度上减缓了分布式存储的数据压力，同时针对于缓存效果进一步增强。

Description

一种数据分布式缓存自动加载与转换方法

技术领域

本发明涉及数据库技术领域，更具体地说，本发明涉及一种数据分布式缓存自动加载与转换方法。

背景技术

Redis是Remote Dictionary Server(Redis) 的缩写，是一个由SalvatoreSanfilippo编写的key-value存储系统，是一个使用ANSI C语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型的Key-Value数据库，并提供多种语言的API。在很多地方，Redis也被业内人士称为数据结构服务器，因为它允许缓存的值（value）可以是字符串(string)、哈希(hash)、列表(list)、集合(set)和有序集合(sorted set)等类型。此外，Redis还支持master-slave方式的数据备份。

作为Redis分布式缓存的方式而言，采用传统的数据索引方式，对其分布的数据而言，形成较大的数据索引压力，其数据的索引速度一定程度上的制约了缓存数据引入的响应速度，同时针对于缓存数据而言，目前的缓存数据在一定当量的存储量下，使其失去时效性的缓存数据将会被清理，作为清理后的数据仍旧有着极大的调用可能性，无形中进一步增加分布数据索引的压力，使其无法做到原始数据的高效缓存读取与应用。

发明内容

为了克服现有技术的上述缺陷，本发明提供了一种数据分布式缓存自动加载与转换方法，本发明所要解决的技术问题是：针对于缓存数据而言，目前的缓存数据在一定当量的存储量下，使其失去时效性的缓存数据将会被清理，作为清理后的数据仍旧有着极大的调用可能性，无形中进一步增加分布数据索引的压力，使其无法做到原始数据的高效缓存读取与应用的问题。

为实现上述目的，本发明提供如下技术方案：一种数据分布式缓存自动加载与转换方法，包括以下方法：

步骤一：建立分布式数据缓存，通过MurmurHash计算方式实现hash计算，通过java的TreeMap来模拟环状结构，实现数据一致性哈希缓存节点均匀分布。

步骤二：原始数据存入所述分布式数据缓存下层的数据库中，并对数据进行特征提取处理。

步骤三：所述步骤二中提取的特征数据建立与对应原始数据的索引超链，并提取原始数据位于模拟环状结构的对应数据节点部署。

步骤四：依据所述分布式数据缓存建立中层集合数据库，并基于中层集合数据库装载特征搜索引擎。

步骤五：在所述集合数据库中建立三层缓存，并对预清理缓存进行提前量读取，实现缓存数据垃圾桶整合策略。

作为本发明的进一步方案：所述特征搜索引擎组成为多个source searchingEngine的安装，其下层安装有元搜索引擎。

作为本发明的进一步方案：步骤五中提出的所述三层缓存数据依照读取频率分层，所述三层缓存呈金字塔式分布，高频读取缓存位于顶端，低频读取缓存位于底端，且高频读取缓存数据量维持较少数目。

作为本发明的进一步方案：所述缓存节点中设置有Master和Slave节点，通过Master与Slave节点实现节点互相切换。

作为本发明的进一步方案：所述中层集合数据库采用基于database的MySQL数据库，所述步骤二中特征提取采用递归特征消除法方式。

本发明的有益效果在于：

本发明通过采用一致性哈希均匀分布的缓存方式，实现基于现一致性哈希分布式数据的环状存储结构，同时采用存入数据的特征提取，使其数据实现向特征的转换，并针对于特征创立相应集合数据库，采用独立的搜索引擎对内容索引，使其分布式大数据实现统一集合索引，提高检索速度同时，依照数据节点的超链对应，形成数据的精准读取，同步的配合三层缓存的方式，针对于时效性的缓存数据而言，对于清除的缓存数据单独存储，并依照读取频率实现数据的金字塔式区分，实现高频率文件的集合，降低再次通过分布式存储数据调用，一定程度上减缓了分布式存储的数据压力，并降低脏数据的影响，同时针对于缓存效果进一步增强。

附图说明

图1为本发明整体框架原理示意图；

图2为本发明流程框图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1-2所示，本发明提供，一种数据分布式缓存自动加载与转换方法，包括以下方法：

步骤二：原始数据存入分布式数据缓存下层的数据库中，并对数据进行特征提取处理。

步骤三：步骤二中提取的特征数据建立与对应原始数据的索引超链，并提取原始数据位于模拟环状结构的对应数据节点部署。

步骤四：依据分布式数据缓存建立中层集合数据库，并基于中层集合数据库装载特征搜索引擎。

步骤五：在集合数据库中建立三层缓存，并对预清理缓存进行提前量读取，实现缓存数据垃圾桶整合策略。

通过上述步骤，在运作时，其数据录入过程中，通过采用递归特征消除法方式对数据进行特征提取，随即原始数据存入到数据库中，特征数据通过超链与对应的原始数据建立索引，随即多个数据的特征数据均存储到集合数据库内，依据内部的特征搜索引擎实现数据的高速检索，同时在分布式数据缓存过程中，直接采用对集合数据库内部进行读取即可，随即依据内部数据的读取数量依次排列，其排列呈金字塔状分为三层缓存，使其除了分布式缓存内部的高频缓存的数据而言，其余数据能够依照频率实现分级，进一步提升其读取的速度，其分布式缓存内的数据在失去时效性清除前其缓存数据位于集合数据库内标记，使其实现删除数据在二次提取时速度更快，无需通过超链在此索引原始文件。

在其他实施例中，特征搜索引擎组成为多个source searching Engine的安装，其下层安装有元搜索引擎。通过采用多个source searching Engine之上与元搜索引擎的配合方式，使其能够实现多个引擎的同步检索，提升其数据提取的效率。

在其他实施例中，步骤五中提出的三层缓存数据依照读取频率分层，三层缓存呈金字塔式分布，高频读取缓存位于顶端，低频读取缓存位于底端，且高频读取缓存数据量维持较少数目。通过采用三层缓存的方式，使其数据实现优先级的分类，检索采用金字塔的自上而下检索，使其读取频率高的数据能够更快的检索，使其在长时间的使用中，一定程度上的提高数据的提取速度，优化其整体的数据提取结构，降低数据库内原始数据检索和传输的压力。

在其他实施例中，缓存节点中设置有Master和Slave节点，通过Master与Slave节点实现节点互相切换。通过采用Master和Slave节点配合的方式，使其能够在某一节点故障时，能够实现配合切换，保障缓存数据的可靠性，

在其他实施例中，中层集合数据库采用基于database的MySQL数据库，步骤二中特征提取采用递归特征消除法方式。通过采用中层集合数据库采用基于database的关系型MySQL数据库结合超链的方式，使其能够保持特征与原始数据的稳定索引，使其逻辑性与线性更为可靠。

实施例1：

一种数据分布式缓存自动加载与转换方法，包括以下方法：

步骤二：分布式数据缓存下层的数据库中原始数据存入。

步骤三：依据分布式数据缓存建立中层集合数据库，并基于中层集合数据库装载数据搜索引擎。

步骤四：在集合数据库中建立三层缓存，并对预清理缓存进行提前量读取，实现缓存数据垃圾桶整合策略。

特征搜索引擎组成为多个source searching Engine的安装，其下层安装有元搜索引擎。

步骤五中提出的三层缓存数据依照读取频率分层，三层缓存呈金字塔式分布，高频读取缓存位于顶端，低频读取缓存位于底端，且高频读取缓存数据量维持较少数目。

缓存节点中设置有Master和Slave节点，通过Master与Slave节点实现节点互相切换。

中层集合数据库采用基于database的MySQL数据库。

实施例2：

一种数据分布式缓存自动加载与转换方法，包括以下方法：

中层集合数据库采用基于database的MySQL数据库，步骤二中特征提取采用递归特征消除法方式。

实施例3：

一种数据分布式缓存自动加载与转换方法，包括以下方法：

步骤二：分布式数据缓存下层的数据库中原始数据存入并对数据进行特征提取处理。

缓存节点通过加入Master和Slave节点，Master与Slave节点实现互相切换。

综上可知，本发明：上述三个实施例作为本发明的三种实施方式，且三个实施例均能实现分布式缓存在一定程度上的的速度与性能提升，施例二通过原始数据的特征数据的提取，以及超链的索引方式，相对于实施例一和实施例三比较下优化效果最为显著。

最后应说明的几点是：虽然，上文中已经用一般性说明及具体实施例对本发明作了详尽的描述，但在本发明的基础上，以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种数据分布式缓存自动加载与转换方法，其特征在于，包括以下方法：

步骤一：建立分布式数据缓存，通过MurmurHash计算方式实现hash计算，通过java的TreeMap来模拟环状结构，实现数据一致性哈希缓存节点均匀分布；

步骤二：原始数据存入所述分布式数据缓存下层的数据库中，并对数据进行特征提取处理；

步骤三：所述步骤二中提取的特征数据建立与对应原始数据的索引超链，并提取原始数据位于模拟环状结构的对应数据节点部署；

步骤四：依据所述分布式数据缓存建立中层集合数据库，并基于中层集合数据库装载特征搜索引擎；

2.根据权利要求1所述的一种数据分布式缓存自动加载与转换方法，其特征在于：所述特征搜索引擎组成为多个source searching Engine的安装，其下层安装有元搜索引擎。

3.根据权利要求1所述的一种数据分布式缓存自动加载与转换方法，其特征在于：步骤五中提出的所述三层缓存数据依照读取频率分层，所述三层缓存呈金字塔式分布，高频读取缓存位于顶端，低频读取缓存位于底端，且高频读取缓存数据量维持较少数目。

4.根据权利要求1所述的一种数据分布式缓存自动加载与转换方法，其特征在于：所述缓存节点中设置有Master和Slave节点，通过Master与Slave节点实现节点互相切换。

5.根据权利要求1所述的一种数据分布式缓存自动加载与转换方法，其特征在于：所述中层集合数据库采用基于database的MySQL数据库，所述步骤二中特征提取采用递归特征消除法方式。