CN106547828B

CN106547828B - 一种基于神经网络的数据库缓存系统及方法

Info

Publication number: CN106547828B
Application number: CN201610877968.1A
Authority: CN
Inventors: 孙宇; 季家亮
Original assignee: Nanjing Tu Niu Science And Technology Ltd
Current assignee: Nanjing Tu Niu Science And Technology Ltd
Priority date: 2016-09-30
Filing date: 2016-09-30
Publication date: 2019-12-06
Anticipated expiration: 2036-09-30
Also published as: CN106547828A

Abstract

本发明公开了一种基于神经网络的数据库缓存系统，包括接入适配模块、分析模块和神经网络；其中：接入适配模块：负责进出数据的适配；分析模块：用于分析用户输入意图；神经网络：包括输入层、隐藏层和输出层；输入层用于接收参数激活隐藏层，隐藏层的每个神经元都包含数据库访问模块、前驱后继神经元路由表、记忆生存周期标识、特征标识和缓存数据集合；输出层用于输出查询结果集至接入适配模块。本发明解决了传统的缓存技术数据无法更新以及缓存状态逐渐恶化造成缓存命中率低的问题，大大提高了缓存的性能和稳定性。解决了传统缓存单一平面的问题，使得子查询相关中间数据可以被缓存，显著减少了数据库多表关联查询的处理时间。

Description

一种基于神经网络的数据库缓存系统及方法

技术领域

本发明涉及信息检索领域，特别是涉及一种基于神经网络的数据库缓存系统及方法。

背景技术

在面临海量访问的网络应用中，大规模的数据读写造成的高磁盘负载，往往会让数据库系统成为整个数据信息系统的性能瓶颈，为了解决这个问题，在现代的数据信息系统中，通常会引入了缓存系统，来降低数据库负载，提高系统整体的性能，由于缓存系统一般将数据保存于内存中，只要命中对应的磁盘负载将为零，而且就算数据保存在磁盘中，其磁盘IO次数都远小于数据库，所以可以大大减少处理等待的时间，其性能差距可能达到几倍甚至几十倍，因此合理的缓存系统已经成为了影响整个数据信息系统性能的关键因素。然而现有的缓存系统，无法主动调节自身状态，随着系统的运行缓存状态的逐渐恶化会带来缓存命中率低的问题。

发明内容

发明目的：本发明的目的是提供一种能够解决现有技术中存在的缺陷的基于神经网络的数据库缓存系统及方法。

技术方案：本发明所述的基于神经网络的数据库缓存系统，包括接入适配模块、分析模块和神经网络；其中：

接入适配模块：负责进出数据的适配；

分析模块：用于分析用户操作意图，并将用户操作意图进行特征化；

神经网络：包括输入层、隐藏层和输出层；输入层用于接收特征化样本并逐步激活隐藏层处理，隐藏层的每个神经元都包含数据库访问模块、前驱后继神经元路由表、记忆生存周期标识、特征标识和缓存数据集合；输出层用于输出查询结果集至接入适配模块。

进一步，所述接入适配模块包括JDBC模拟驱动和MySQL原生协议。

进一步，所述分析模块包括SQL驱动解析引擎和神经网络输入层生成器，其中：

SQL驱动解析引擎：用于分析SQL语句查询意图，将一个多关系表的查询操作拆解成多个单表并互相依赖的查询操作，并转化为系统所能理解的内部数据结构；

神经网络输入层生成器：用于将生成的内部数据结构进行特征化，并转化为神经网络所能理解的包含固定特征条件的特征化样本。

本发明所述的基于神经网络的数据库缓存方法，包括以下步骤：

S1：客户端访问数据库时，通过接入适配模块将数据发送给分析模块；

S2：分析模块分析SQL语句，并根据其意图、参数以及额外信息生成神经网络能够理解的包含固定特征条件的特征化样本；其中，额外信息包括运行环境信息；

S3：将步骤S2得到的特征化样本交由神经网络处理，神经网络包括输入层、隐藏层和输出层，其中隐藏层包含起点神经元、中继神经元和终点神经元；

S4：当操作类型为select时，输入层根据特征化样本中包含的特征条件逐步激活隐藏层神经元，直到输出层输出结果集为止；

S5：如果特征条件全满足，则直接返回此路径上隐藏层终点神经元已经存在的缓存数据给输出层，并回溯此路径上的所有神经元并将记忆周期加1，再进行步骤S8；如果有特征条件没有被满足，则进行步骤S6；

S6：对于没有被满足的特征条件，创建一个满足此特征条件的空隐层神经元，并将特征化样本转入新的空隐层神经元处理，之后判断特征化样本中所有的特征条件是否已满足：如果不满足，则循环执行步骤S6，直到特征化样本中所有特征条件满足并到达起点神经元为止，激活起点神经元，路径上神经元的缓存数据反向流动到终点神经元，最后隐藏层终点神经元将最终处理完成的缓存数据返回给输出层；

S7：当操作类型为insert、update和delete时，神经网络根据特征化样本中包含的特征条件按照S4中的激活方式激活相关已存在的隐藏层神经元，被激活的神经元逐步将其缓存的数据调整至最新状态；

S8：输出层返回数据给接入适配模块，接入适配模块生成结果集给客户端。

进一步，所述步骤S2中的特征化样本包括：

1)操作的类型；

2)拆解的单一特征条件以及参数；

3)数据表；

4)特征条件之间的关联依赖关系。

进一步，所述步骤S4中激活隐藏层神经元的方法为：从终点神经元开始同层匹配特征条件，如果匹配成功则激活相应的神经元，如果匹配不成功则根据特征样本包含的当前特征条件新建满足当前特征条件的空隐层神经元，直至满足所有的特征条件，并到达起点神经元为止。

有益效果：与现有技术相比，本发明具有如下的有益效果：

1)基于神经网络实现了一种缓存结构，使缓存能够主动调整其内部数据状态，解决了传统的缓存技术数据无法主动调节自身状态以及缓存状态逐渐恶化造成缓存命中率低的问题，大大提高了缓存的性能和稳定性；

2)基于神经网络的多层次结构，解决了传统缓存单一平面的问题，使得子查询相关中间数据可以被缓存，显著减少了数据库多表关联查询的处理时间，将多表连接查询化为单一表查询，使得数据库索引效率得以充分释放，大大提高了数据库系统性能；

3)通过适配器模式，解决传统缓存技术代码侵入性高的问题，极大降低缓存系统接入难度。

附图说明

图1为本发明具体实施方式的系统框图；

图2为本发明具体实施方式的神经网络的结构框图。

图3为本发明具体实施方式的缓存路径结构框图

具体实施方式

本具体实施方式公开了一种基于神经网络的数据库缓存系统，如图1所示，包括接入适配模块、分析模块和神经网络；其中：

接入适配模块：负责进出数据的适配；包括JDBC模拟驱动、MySQL原生协议等接入实现，可以降低调用方接入难度，如果使用语言标准接口如JDBC，甚至可以不用修改其代码，将系统的代码侵入性降低为零。

分析模块：用于分析用户操作意图，并将用户操作意图进行特征化。包括SQL驱动解析引擎，用于分析SQL语句查询意图，将一个多关系表的查询操作拆解成多个单表并互相依赖的查询操作，并转化为系统所能理解的内部数据结构；神经网络输入层生成器，用于将上述生成的内部数据结构进行特征化，并转化为神经网络所能理解的包含固定特征条件的特征化样本。

神经网络：负责数据处理，包括输入层、隐藏层和输出层，如图2所示。输入层用于接收特征化样本并逐步激活隐藏层处理，隐藏层的每个神经元都包含数据库访问模块、前驱后继神经元路由表、记忆生存周期标识、特征标识和缓存数据集合；输出层用于输出查询结果集至接入适配模块，接入适配模块将结果集转换成客户端标准结果集返回。

本具体实施方式还公开了一种基于神经网络的数据库缓存方法，包括以下步骤：

S1：客户端通过JDBC或者ADO.NET等标准接口访问数据库时，通过接入适配模块将数据发送给分析模块，其中包括了需要执行的SQL、参数以及额外信息，额外信息包括运行环境信息。

S2：分析模块分析SQL语句，并根据其意图、参数以及额外信息生成神经网络能够理解的包含固定特征条件的特征化样本；特征化样本包括：

1)操作的类型；

2)拆解的单一特征条件以及参数；

3)数据表；

4)特征条件之间的关联依赖关系。

S3：将步骤S2得到的特征化样本交由神经网络处理，神经网络包括输入层、隐藏层和输出层，其中隐藏层包含起点神经元、中继神经元和终点神经元。其中，起点神经元是没有前驱只有后继的神经元，中继神经元是既有前驱又有后继的神经元，终点神经元是只有前驱没有后继的神经元。

S4：当操作类型为select时，输入层根据特征化样本中包含的特征条件逐步激活隐藏层神经元，直到输出层输出结果集为止。激活方法如下：

从终点神经元开始同层匹配特征条件，如果匹配成功则激活相应的神经元，如果匹配不成功则根据特征样本包含的当前特征条件新建满足当前特征条件的空隐层神经元，直至满足所有的特征条件，并到达起点神经元为止。

S7：当操作类型为insert、update和delete时，神经网络根据特征化样本中包含的特征条件按照S4中的激活方式激活相关已存在的隐藏层神经元，被激活的神经元逐步将其缓存的数据调整至最新状态。

例如：

为了保证数据时效性，每个神经元都有固定初始记忆周期(例如给定值位1000，意味着神经网络进行1000次思考后仍未激活该神经元，则该神经元缓存会被丢弃)，当每次神经网络被激活时，隐层上被激活路径上的神经元记忆周期加1，反之减1，当神经元记忆周期为0时，此神经元将被神经网络丢弃，防止过期数据浪费存储空间。

S8：输出层返回数据给接入适配模块，接入适配模块返回相应的JDBC或ADO.NET等标准接口的结果集给客户端。

下面介绍一个实施例：

分析模块接收到select*from student where id in(select stuid fromclassroom where name＝’小三班’)的SQL语句，SQL驱动解析引擎会将其解析成二段：

A:特征select stuid from classroom where name＝’小三班’

B:特征select*from student where id in A特征

解析完成后上述输入将生成一个包含特征条件A和特征条件B的特征化样本，其中B特征为终点特征，A特征为起点特征，，将之作为输入层向量。

神经网络开始查找深度为1的神经元中是否存在匹配B特征的神经元，如果有，则激活此神经元，如果没有则创建一个满足B特征的空神经元并做为终点神经元，然后继续匹配A特征，如果深度为2的同层中含有A特征的神经元则激活，如果没有则依然创建一个满足A特征的空神经元并作为起点神经元，此时一个满足所有特征条件的缓存路径已经生成完毕，假设A被激活时缓存数据为A1[1,2,3,4]，此数据将流动至B中，B利用A1数据生成类似select*from student where id＝1or id＝2or id＝3or id＝4的SQL从数据库拉取数据缓存并返回；这样就形成了一个有效的缓存路径，当后续再有类似诸如查询’小三班’学生家长信息这样的操作时，其路径上的缓存数据则可以被命中，数据库只需根据此缓存查询一次家长表即可返回终点数据，而路径上的中间状态数据则可以被其他特征条件所使用。

Claims

1.一种基于神经网络的数据库缓存方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于神经网络的数据库缓存方法，其特征在于：所述步骤S2中的特征化样本包括：

1)操作的类型；

2)拆解的单一特征条件以及参数；

3)数据表；

4)特征条件之间的关联依赖关系。

3.根据权利要求1所述的基于神经网络的数据库缓存方法，其特征在于：所述步骤S4中激活隐藏层神经元的方法为：从终点神经元开始同层匹配特征条件，如果匹配成功则激活相应的神经元，如果匹配不成功则根据特征样本包含的当前特征条件新建满足当前特征条件的空隐层神经元，直至满足所有的特征条件，并到达起点神经元为止。