CN105302858A - 一种分布式数据库系统的跨节点查询优化方法及系统 - Google Patents

一种分布式数据库系统的跨节点查询优化方法及系统 Download PDF

Info

Publication number
CN105302858A
CN105302858A CN201510601093.8A CN201510601093A CN105302858A CN 105302858 A CN105302858 A CN 105302858A CN 201510601093 A CN201510601093 A CN 201510601093A CN 105302858 A CN105302858 A CN 105302858A
Authority
CN
China
Prior art keywords
query
global
cost
module
optimization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510601093.8A
Other languages
English (en)
Other versions
CN105302858B (zh
Inventor
张春光
孙乔
焦艳斌
孙甲松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Great Opensource Software Co ltd
Tsinghua University
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
State Grid Zhejiang Electric Power Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Beijing China Power Information Technology Co Ltd
Beijing Zhongdian Feihua Communication Co Ltd
Original Assignee
Beijing Great Opensource Software Co Ltd
Tsinghua University
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Beijing Fibrlink Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Great Opensource Software Co Ltd, Tsinghua University, State Grid Corp of China SGCC, State Grid Zhejiang Electric Power Co Ltd, Beijing Guodiantong Network Technology Co Ltd, Beijing Fibrlink Communications Co Ltd filed Critical Beijing Great Opensource Software Co Ltd
Priority to CN201510601093.8A priority Critical patent/CN105302858B/zh
Publication of CN105302858A publication Critical patent/CN105302858A/zh
Application granted granted Critical
Publication of CN105302858B publication Critical patent/CN105302858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Abstract

本发明公开了一种分布式数据库系统的跨节点查询优化系统,包括:全局查询总代价最低要求模块,查询分解及本地化模块,多因素决策的模糊评估模块,连接建立模块,局部优化模块,Bp神经网络自适应优化模块,全局优化模块。在此系统的基础上,提出了一种分布式数据库系统的跨节点查询优化方法,实现了在局部优化阶段对每个分片查询路径进行优化判决,以及在全局优化阶段对全部分片查询路径进行Bp神经网络自适应优化。本发明通过对每个分片查询路径的优化,降低全局优化的计算负担,使得全局查询具有更快的查询速度,并通过定义全局优化代价函数使得查询总代价可控。

Description

一种分布式数据库系统的跨节点查询优化方法及系统
技术领域
本发明涉及分布式数据库系统技术领域,特别是指一种分布式数据库系统的跨节点查询优化方法及系统。
背景技术
分布式数据库系统是计算机网络与数据库系统的有机结合。由于涉及大量数据在网络上的传输,因此查询处理和优化就成为分布式数据库提高查询性能的关键因素。查询处理和优化就是通过合理的算法尽量减少通信的信息量,从而提高查询的响应时间性能以及减少系统开销。分布式查询优化相比传统的单机优化方法拥有更好的数据可靠性,更快的查询速度以及可扩展的存储容量。分布式查询优化一般需要进行:查询分解、数据本地化、局部优化、全局优化。
在分布式数据库系统上的一般查询步骤为:根据用户的查询内容进行查询分解,初始化查询路径,检查本地是否有此数据库,如果有则在本地执行;如果没有则全局查询处理模块根据查询路径来选择一台处理本查询最优化的节点,即选择一个有该数据库且所操纵的表的查询代价最小的数据库节点。并与优化的节点建立连接,将查询命令发送到优化的节点上去执行。
在此过程中,由于分布式数据库系统存在于网络环境,所以必须考虑节点之间的通信代价和分布式计算处理。目前的查询分解、数据本地化、局部优化、全局优化四步骤的方法,在通信代价的开销及查询执行的实际代价上仍然无法满足用户需求,得到的并非分布式数据库系统中全局最优的执行节点。
发明内容
有鉴于此,本发明的目的在于提出一种分布式数据库系统的跨节点查询优化方法及系统,提高查询的响应时间性能。
基于上述目的本发明提供的一种分布式数据库系统的跨节点查询优化方法,包括:
确定全局查询总代价以及全局查询总代价最低要求;
在局部优化阶段:
通过数据本地化及查询分解的步骤将查询问题落在合适的片段上;
通过多因素决策的模糊评估判定多个影响因素中对降低查询代价贡献最大的影响因素;
进行连接建立,即在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询,从而得到片段上的查询结果;
在与片段上的查询结果有关的各个数据库节点进行局部优化;
在全局优化阶段:
定义全局优化代价函数;
采用Bp神经网络求得全局优化代价函数的最小值,使得输出满足全局查询总代价逼近全局查询总代价最低要求,其中,Bp神经网络的输入为片段上的查询结果;
进行全局优化并最终输出最优的全局查询路径。
在一些实施方式中,所述确定全局查询总代价以及全局查询总代价最低要求的步骤中,将全局查询总代价最低要求定义为查询时间误差估计和查询响应时间的加权和,即Cmin=w1·te+w2·tr,其中,Cmin是指全局查询总代价最低要求,te是指查询时间误差估计,其为全部网络时延及时钟漂移引起的查询时间误差之和的估计,tr是指查询响应时间,其是从用户提交查询请求到收到完整的返回信息的平均时间,并有w1+w2=1。
在一些实施方式中,,所述多因素决策的模糊评估至少包括以下过程:
构建多因素决策的模糊评估模型;
对每个分片查询路径进行优化判决;
评估结果作为局部优化的输入。
在一些实施方式中,所述构建多因素决策的模糊评估模型至少包括以下步骤:
定义每个分片查询路径中共有I个影响因素能够降低查询代价;
定义在I个影响因素共同作用下得到的查询代价函数为F(xI),其中xI为为函数输入;
定义其优化目标函数,即min{F(xi)},用于判定对降低查询代价贡献最大的影响因素。
在一些实施方式中,所述对每个分片查询路径进行优化判决至少包括以下步骤:
对min{F(xi)}进行求解得到一组ui,其中ui为优化目标函数解析式中的一个参数,其表示第i(i≤I)个影响因素对降低查询代价的贡献;
选取其中最大的ui,判定对应第i个影响因素对降低查询代价贡献最大;
查找当前的分片查询路径中,在第i个影响因素作用下查询代价最小的数据库节点并与之建立连接进行查询。
在一些实施方式中,所述的Bp神经网络设计为一个3层的前馈神经网络N,各层均有连接权向量,用梯度下降法对BP神经网络的各层的连接权向量进行求解,最终输出即为最优的全局查询路径。
本发明提供的一种分布式数据库系统的跨节点查询优化系统,包括:
全局查询总代价最低要求模块,用于在全局总代价定义确定全局查询总代价以及全局查询总代价最低要求;
本地化及查询分解模块,用于将查询问题落在合适的片段上;
多因素决策的模糊评估模块,用于通过构建多因素决策的模糊评估模型,判定多个影响因素中对降低查询代价贡献最大的影响因素;
连接建立模块,用于在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询;从而得到片段上的查询结果;
局部优化模块,用于在与片段上的查询结果有关的各个数据库节点进行局部优化;
Bp神经网络自适应优化模块,用于定义全局优化代价函数,并采用Bp神经网络求得全局优化代价函数的最小值,使得输出满足全局查询总代价逼近全局查询总代价最低要求,其中,Bp神经网络的输入为片段上的查询结果;
全局优化模块,用于进行全局优化并最终输出最优的全局查询路径。
在一些实施方式中,所述全局查询总代价最低要求模块,用于将全局查询总代价最低要求定义为查询时间误差估计和查询响应时间的加权和,即Cmin=w1·te+w2·tr,其中,Cmin是指全局查询总代价最低要求,te是指查询时间误差估计,其为全部网络时延及时钟漂移引起的查询时间误差之和的估计,tr是指查询响应时间,其是从用户提交查询请求到收到完整的返回信息的平均时间,并有w1+w2=1。
在一些实施方式中,所述多因素决策的模糊评估模块,包括:
模型构建模块,用于构建多因素决策的模糊评估模型;
优化判决模块,用于对每个分片查询路径进行优化判决;
局部优化输入模块,用于将评估结果作为局部优化的输入。
在一些实施方式中,所述模型构建模块包括:
影响因素定义模块,用于定义每个分片查询路径中共有I个影响因素能够降低查询代价;
查询代价函数定义模块,用于定义在I个影响因素共同作用下得到的查询代价函数为F(xI),其中xI为函数输入;
优化目标函数定义模块,用于定义其优化目标函数,即min{F(xi)},其用于判定对降低查询代价贡献最大的影响因素。
在一些实施方式中,所述优化判决模块包括:
求解模块,用于对min{F(xi)}进行求解得到一组ui,其中ui为优化目标函数解析式中的一个参数,其表示第i(i≤I)个影响因素对降低查询代价的贡献;
影响因素判定模块,用于选取其中最大的ui,判定对应第i个影响因素对降低查询代价贡献最大;
查询连接模块,用于查找当前的分片查询路径中,在第i个影响因素作用下查询代价最小的数据库节点并与之建立连接进行查询。
在一些实施方式中,所述Bp神经网络自适应优化模块包括:
Bp神经网络设计模块,用于将Bp神经网络设计为一个3层的前馈神经网络,各层均有连接权向量;
各层参数求解模块,用于利用梯度下降法对BP神经网络的各层的连接权向量进行求解。
从上面所述可以看出,本发明提供的分布式数据库系统的跨节点查询优化方法及系统可以实现:
1、对每个分片查询路径进行优化判决,即在多个影响因素中通过计算判决出对降低查询代价贡献最大的影响因素,并用该影响因素做出优化判决,降低全局优化的计算负担,从而提高全局上的查询速度。
2、对全部分片查询路径进行Bp神经网络自适应优化,即设定全局查询总代价最低要求,在实际的全局查询总代价满足所述全局查询总代价最低要求的情况下,在神经网络中自适应的调整各层的权值,从而在全局上实现查询的自适应最优化。由于最低要求是事先设定好的,故,这样做可使得全局查询代价可控。
附图说明
图1为现有方案实施例流程示意图;
图2为本发明提供的分布式数据库系统的跨节点查询优化方法实施例的流程示意图;
图3为本发明提供的分布式数据库系统的跨节点查询优化系统实施例的模块结构示意图;
图4为本发明提供的分布式数据库系统的跨节点查询优化方法实施例的步骤S230的进一步具体流程示意图;
图5为本发明提供的分布式数据库系统的跨节点查询优化方法实施例的步骤S310的进一步具体流程示意图;
图6为本发明提供的分布式数据库系统的跨节点查询优化系统实施例的模块430的进一步具体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
本发明提出了一种分布式数据库系统的跨节点查询优化方法,本方法通过构建多因素决策的模糊评估模型,用于对每个分片查询路径进行优化判决,并定义全局优化的代价函数,用于对全局查询路径进行自适应优化,达到满足全局查询总代价最低要求的目的。
总体来说,本方法包含三大阶段,各阶段名称及其主要完成功能为:
第一阶段:全局查询总代价定义阶段100,用于定义全局优化阶段所需要的参数;
第二阶段:局部优化阶段200,用于对每个分片查询路径进行优化判决;
第三阶段:全局优化阶段300,用于找出分片查询路径的最佳操作次序,包括使得代价函数最小。
参照附图2,为本发明提供的分布式数据库系统的跨节点查询优化方法实施例流程示意图。
每一阶段的详细步骤如下:
在第一阶段,即全局查询总代价定义阶段100中:
步骤S110,确定全局查询总代价C以及全局查询总代价最低要求Cmin
将全局查询总代价最低要求定义为查询时间误差估计te和查询响应时间tr的加权和,即Cmin=w1·te+w2·tr,其中te为查询时间误差估计,即全部网络时延及时钟漂移引起的查询时间误差之和的估计;tr为查询响应时间,即从用户提交查询请求到收到完整的返回信息的平均时间,并有w1+w2=1。
在第二阶段,即局部优化阶段200中:
步骤S210,进行查询分解,
即将查询问题(例如SQL语句),转换成一个定义在全局关系上的关系代数表达式。
步骤S220,进行数据本地化,
即把定义在全局关系上的关系代数表达式具体化,落实到合适的(使尽可能做到本地化或近地化)片段上进行查询。检查本地是否有此数据库,如果本地有此数据库,则在本地执行查询;如果本地没有此数据库,则通过全局查询从而选择一台处理本查询最优化的节点。
步骤S230,进行多因素决策的模糊评估(无论查询结果是否在本地),判定多个影响因素中对降低查询代价贡献最大的影响因素。
首先构建一个多因素决策的模糊评估模型,用于对共计N个分片查询路径进行优化判决;接着在查询分解和数据本地化后进行多因素决策模糊评估,得到评估结果,即对降低查询代价贡献最大的影响因素,作为在查询代价最小的数据库节点上进行局部优化的输入。
步骤S240,进行连接建立,
即在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询,从而得到片段上的查询结果。
步骤S250,在与片段上的查询结果有关的各个数据库节点进行局部优化,
即将多因素决策的模糊评估的评估结果作为局部优化的输入,在与片段上的查询结果有关的各个数据库节点进行局部优化。局部优化的输出是在片段上的查询结果,即最优分片查询路径。
在第三阶段,即全局优化阶段300中:
步骤S310,进行Bp神经网络自适应优化,
其输入是在片段上的查询结果,即最优分片查询路径。由于全局查询总代价C表示的是实际操作中全局消耗的总代价,定义E(w)为全局优化代价函数,表示全局查询总代价误差。在应用中,理想情况是C可以无限逼近全局查询总代价最低要求Cmin,即我们期望E(w)尽可能小,基于此,对上述全局优化代价函数E(w)采用BP神经网络求得其最小值。
步骤S320,进行全局优化并最终输出最优的全局查询路径。
从上述实施例可以看出,本发明提供的分布式数据库系统的跨节点查询优化方法的优点在于,通过对每个分片查询路径的优化,降低全局优化的计算负担,使得全局查询具有更快的查询速度,并通过定义全局优化代价函数使得查询总代价可控。
较佳的,参照附图4,为本发明提供的分布式数据库系统的跨节点查询优化方法实施例的步骤S230的进一步具体流程示意图。
所述进行多因素决策的模糊评估的步骤S230还可以进一步包括以下步骤:
步骤S231,定义每个分片查询路径中共有I个影响因素(如节点间网络时延、数据库尺度等)能够降低查询代价;
步骤S232,定义多因素决策的模糊评估模型如下:
假设F(xI)为在I个影响因素共同作用下得到的查询代价函数,其中xI为查询代价函数输入;
步骤S233,定义优化准则为:加权距离平方总和最小。因此定义其优化目标函数为:
m i n { F ( x i ) } = u i 2 Σ j = 1 n w j ( 1 - M i j ) 2 + ( 1 - u i ) 2 Σ j = 1 n w j M i j 2
其中,ui为第i(i≤I)个影响因素对降低查询代价的贡献,wj为i(i≤I)个影响因素对应的初始权重,MIN为I个影响因素和N个分片查询路径构成一个I*N矩阵并归一化后得到的矩阵,Mij为归一化后的矩阵MIN中的元素。
步骤S234,对步骤S233中定义的优化目标函数进行求解得到一组ui,选取最大的ui并判定对应的第i个影响因素对降低查询代价贡献最大;
步骤S235,得到多因素决策的模糊评估的评估结果,多因素决策的模糊评估的输出是i。
通过上述处理步骤,可以人为定义对降低查询代价有所贡献的I个影响因素,使得通过经验人为避免一些不重要的影响因素对总体计算的干扰。判断出对降低查询代价贡献最大的影响因素后,即可进一步排除其余影响因素对总体计算的干扰,从而逐步降低运算时间。
较佳的,参照附图5,为本发明提供的分布式数据库系统的跨节点查询优化方法实施例的步骤S310的进一步具体流程示意图。
所述进行Bp神经网络自适应优化的步骤S310还可以进一步包括以下步骤:
步骤S311,将全局优化代价函数定义为:
E ( w ) = 1 2 Σ i = 1 I ( d i w - y i w ) 2
其中,E(w)为全局优化代价函数,表示全局查询总代价误差;
w(w≤W)为全局查询结果中包含分片查询路径的个数;
i为局部优化阶段求得的多因素决策的模糊评估的结果,即第i个影响因素;
为分片查询路径w中第i个影响因素作用下的全局查询总代价理想值;
为分片查询路径w中第i个影响因素作用下的全局查询总代价实际输出值。
步骤S312,将BP神经网络设计为一个3层的前馈神经网络,第一层是输入单元,第二层称为隐含层,第三层称为输出层。X表示网络的输入向量,对应N个分片查询路径,w1、w2、w3分别表示网络各层的连接权向量,F1、F2、F3表示3层对应的激活函数。
则第一层神经元的输出为:O1=F1(Xw1)
第二层神经元的输出为:O2=F2F1(Xw1)w2
输出层神经元的输出为:O3=F3(F2F1(Xw1)w2)w3
其中激活函数均定义为sigmoid函数:
F = 1 1 + e x
步骤S313,用梯度下降法对BP神经网络的各层的连接权向量进行求解并更新。
步骤S314,最终输出层的输出即为最优的全局查询路径,即加权后的分片查询路径。
通过上述处理步骤,可通过计算自适应的调整BP神经网络的各层的连接权向量,提高了全局查询的效率和可靠性。
需要特别指出的是,上述方法实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于所述方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
本发明另一方面还提出了一种分布式数据库系统的跨节点查询优化系统400,实现了在分布式并行系统中进行查询时降低数据I/O次数和负载均衡的目的,参照附图3,为本发明提供的分布式数据库系统的跨节点查询优化系统400实施例模块示意图。
所述分布式数据库系统的跨节点查询优化系统400包括:
全局查询总代价最低要求模块410,用于在全局总代价定义确定全局查询总代价以及全局查询总代价最低要求;
查询分解及本地化模块420,用于将查询问题落在合适的片段上;
多因素决策的模糊评估模块430,用于通过构建多因素决策的模糊评估模型,判定多个影响因素中对降低查询代价贡献最大的影响因素;
连接建立模块440,用于在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询;从而得到片段上的查询结果;
局部优化模块450,用于在与片段上的查询结果有关的各个数据库节点进行局部优化;
Bp神经网络自适应优化模块460,用于定义全局优化代价函数,并采用Bp神经网络求得全局优化代价函数的最小值,使得输出满足全局查询总代价逼近全局查询总代价最低要求,其中,Bp神经网络的输入为片段上的查询结果;
全局优化模块470,用于进行全局优化并最终输出最优的全局查询路径。
从上述实施例可以看出,本发明提供的分布式数据库系统的跨节点查询优化系统400,其优点在于,通过对每个分片查询路径的优化,降低全局优化的计算负担,使得全局查询具有更快的查询速度,并通过定义全局优化代价函数使得查询总代价可控。
较佳的,所述全局查询总代价最低要求模块410,还可用于将全局查询总代价最低要求定义为查询时间误差估计和查询响应时间的加权和,即Cmin=w1·te+w2·tr,其中,Cmin是指全局查询总代价最低要求,te是指查询时间误差估计,其为全部网络时延及时钟漂移引起的查询时间误差之和的估计,tr是指查询响应时间,其是从用户提交查询请求到收到完整的返回信息的平均时间,并有w1+w2=1。
较佳的,参照附图6,为本发明提供的分布式数据库系统的跨节点查询优化系统400实施例的模块430的进一步具体结构示意图。
所述多因素决策的模糊评估模块430,还可以进一步包括以下模块:
模型构建模块431,用于构建多因素决策的模糊评估模型;
优化判决模块432,用于对每个分片查询路径进行优化判决;
局部优化输入模块433,用于将评估结果作为局部优化的输入。
进一步的,所述模型构建模块431,还可以进一步包括以下模块:
影响因素定义模块4311,用于定义每个分片查询路径中共有I个影响因素能够降低查询代价;
查询代价函数定义模块4312,用于定义在I个影响因素共同作用下得到的查询代价函数为F(xI),其中xI为函数输入;
优化目标函数定义模块4313,用于定义其优化目标函数,即min{F(xi)}其用于判定对降低查询代价贡献最大的影响因素。
进一步的,所述优化判决模块432,还可以进一步包括以下模块:
求解模块4321,用于对min{F(xi)}进行求解得到一组ui,其中ui为优化目标函数解析式中的一个参数,其表示第i(i≤I)个影响因素对降低查询代价的贡献;
影响因素判定模块4322,用于选取其中最大的ui,判定对应第i个影响因素对降低查询代价贡献最大;
查询连接模块4323,用于查找当前的分片查询路径中,在第i个影响因素作用下查询代价最小的数据库节点并与之建立连接进行查询。
通过上述处理步骤,可以人为定义对降低查询代价有所贡献的I个影响因素,使得通过经验人为避免一些不重要的影响因素对总体计算的干扰。判断出对降低查询代价贡献最大的影响因素后,即可进一步排除其余影响因素对总体计算的干扰,从而逐步降低运算时间。
较佳的,Bp神经网络自适应优化模块,还可以进一步包括以下模块:
Bp神经网络设计模块,用于将Bp神经网络设计为一个3层的前馈神经网络,各层均有连接权向量;
各层参数求解模块,用于利用梯度下降法对BP神经网络的各层的连接权向量进行求解并更新。
通过上述处理步骤,可通过计算自适应的调整BP神经网络的各层的连接权向量,提高了全局查询的效率和可靠性。
下面参照附图2,简要介绍采用本发明提供的分布式数据库系统的跨节点查询优化系统400进行分布式数据库系统的跨节点查询优化方法:
所述分布式数据库系统的跨节点查询优化方法,包括:
在第一阶段,即全局查询总代价定义阶段100中:
步骤S110,全局查询总代价最低要求模块410确定全局查询总代价C以及全局查询总代价最低要求Cmin
在第二阶段,即局部优化阶段200中:
步骤S210,查询分解及本地化模块420进行查询分解,即将查询问题(例如SQL语句),转换成一个定义在全局关系上的关系代数表达式。
步骤S220,查询分解及本地化模块420进行数据本地化,即把定义在全局关系上的关系代数表达式具体化,落实到合适的(使尽可能做到本地化或近地化)片段上进行查询。
步骤S230,多因素决策的模糊评估模块430进行多因素决策的模糊评估(无论查询结果是否在本地),判定多个影响因素中对降低查询代价贡献最大的影响因素。
步骤S240,连接建立模块440进行连接建立,即在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询,从而得到片段上的查询结果。
步骤S250,局部优化模块450在与片段上的查询结果有关的各个数据库节点进行局部优化,即将多因素决策的模糊评估的评估结果作为局部优化的输入,由拥有与查询有关的片段的各个站点进行局部优化。局部优化的输出是在片段上的查询结果,即最优分片查询路径
在第三阶段,即全局优化阶段300中:
步骤S310,Bp神经网络自适应优化模块460进行Bp神经网络自适应优化,其输入是在片段上的查询结果,即最优分片查询路径。定义全局优化代价函数并采用BP神经网络求得其最小值。
步骤S320,全局优化模块470进行全局优化并最终输出最优的全局查询路径。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种分布式数据库系统的跨节点查询优化方法,其特征在于,包括:
确定全局查询总代价以及全局查询总代价最低要求;
在局部优化阶段:
通过查询分解及数据本地化的步骤将查询问题落在合适的片段上;
通过多因素决策的模糊评估判定多个影响因素中对降低查询代价贡献最大的影响因素;
进行连接建立,即在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询,从而得到片段上的查询结果;
在与片段上的查询结果有关的各个数据库节点进行局部优化;
在全局优化阶段:
定义全局优化代价函数;
采用Bp神经网络求得全局优化代价函数的最小值,使得输出满足全局查询总代价逼近全局查询总代价最低要求,其中,Bp神经网络的输入为片段上的查询结果;
进行全局优化并最终输出最优的全局查询路径。
2.根据权利要求1所述的方法,其特征在于,所确定全局查询总代价以及全局查询总代价最低要求的步骤中,将全局查询总代价最低要求定义为查询时间误差估计和查询响应时间的加权和,即Cmin=w1·te+w2·tr,其中,Cmin是指全局查询总代价最低要求,te是指查询时间误差估计,其为全部网络时延及时钟漂移引起的查询时间误差之和的估计,tr是指查询响应时间,其是从用户提交查询请求到收到完整的返回信息的平均时间,并有w1+w2=1。
3.根据权利要求1所述的方法,其特征在于,所述多因素决策的模糊评估至少包括以下过程:
构建多因素决策的模糊评估模型;
对每个分片查询路径进行优化判决;
评估结果作为局部优化的输入。
4.根据权利要求3所述的方法,其特征在于,所述构建多因素决策的模糊评估模型至少包括以下步骤:
定义每个分片查询路径中共有I个影响因素能够降低查询代价;
定义在I个影响因素共同作用下得到的查询代价函数为F(xI),其中xI为函数输入;
定义其优化目标函数,即min{F(xi)},用于判定对降低查询代价贡献最大的影响因素。
5.根据权利要求4所述的方法,其特征在于,所述对每个分片查询路径进行优化判决至少包括以下步骤:
对min{F(xi)}进行求解得到一组ui,其中ui为优化目标函数解析式中的一个参数,其表示第i(i≤I)个影响因素对降低查询代价的贡献;
选取其中最大的ui,判定对应第i个影响因素对降低查询代价贡献最大;
查找当前的分片查询路径中,在第i个影响因素作用下查询代价最小的数据库节点并与之建立连接进行查询。
6.一种分布式数据库系统的跨节点查询优化系统,其特征在于,包括:
全局查询总代价最低要求模块,用于在全局总代价定义确定全局查询总代价以及全局查询总代价最低要求;
查询分解及本地化模块,用于将查询问题落在合适的片段上;
多因素决策的模糊评估模块,用于通过构建多因素决策的模糊评估模型,判定多个影响因素中对降低查询代价贡献最大的影响因素;
连接建立模块,用于在当前的分片查询路径中,根据对降低查询代价贡献最大的影响因素,查找到查询代价最小的数据库节点并与之建立连接进行查询;从而得到片段上的查询结果;
局部优化模块,用于在与片段上的查询结果有关的各个数据库节点进行局部优化;
Bp神经网络自适应优化模块,用于定义全局优化代价函数,并采用Bp神经网络求得全局优化代价函数的最小值,使得输出满足全局查询总代价逼近全局查询总代价最低要求,其中,Bp神经网络的输入为片段上的查询结果;
全局优化模块,用于进行全局优化并最终输出最优的全局查询路径。
7.根据权利要求6所述的系统,其特征在于,所述全局查询总代价最低要求模块,用于将全局查询总代价最低要求定义为查询时间误差估计和查询响应时间的加权和,即Cmin=w1·te+w2·tr,其中,Cmin是指全局查询总代价最低要求,te是指查询时间误差估计,其为全部网络时延及时钟漂移引起的查询时间误差之和的估计,tr是指查询响应时间,其是从用户提交查询请求到收到完整的返回信息的平均时间,并有w1+w2=1。
8.根据权利要求6所述的系统,其特征在于,所述多因素决策的模糊评估模块,包括:
模型构建模块,用于构建多因素决策的模糊评估模型;
优化判决模块,用于对每个分片查询路径进行优化判决;
局部优化输入模块,用于将评估结果作为局部优化的输入。
9.根据权利要求8所述的系统,其特征在于,所述模型构建模块包括:
影响因素定义模块,用于定义每个分片查询路径中共有I个影响因素能够降低查询代价;
查询代价函数定义模块,用于定义在I个影响因素共同作用下得到的查询代价函数为F(xI),其中xI为函数输入;
优化目标函数定义模块,用于定义其优化目标函数,即min{F(xi)},其用于判定对降低查询代价贡献最大的影响因素。
10.根据权利要求9所述的系统,其特征在于,所述优化判决模块包括:
求解模块,用于对min{F(xi)}进行求解得到一组ui,其中ui为优化目标函数函数解析式中的一个参数,其表示第i(i≤I)个影响因素对降低查询代价的贡献;
影响因素判定模块,用于选取其中最大的ui,判定对应第i个影响因素对降低查询代价贡献最大;
查询连接模块,用于查找当前的分片查询路径中,在第i个影响因素作用下查询代价最小的数据库节点并与之建立连接进行查询。
CN201510601093.8A 2015-09-18 2015-09-18 一种分布式数据库系统的跨节点查询优化方法及系统 Active CN105302858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510601093.8A CN105302858B (zh) 2015-09-18 2015-09-18 一种分布式数据库系统的跨节点查询优化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510601093.8A CN105302858B (zh) 2015-09-18 2015-09-18 一种分布式数据库系统的跨节点查询优化方法及系统

Publications (2)

Publication Number Publication Date
CN105302858A true CN105302858A (zh) 2016-02-03
CN105302858B CN105302858B (zh) 2019-02-05

Family

ID=55200130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510601093.8A Active CN105302858B (zh) 2015-09-18 2015-09-18 一种分布式数据库系统的跨节点查询优化方法及系统

Country Status (1)

Country Link
CN (1) CN105302858B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930407A (zh) * 2016-04-18 2016-09-07 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及系统
CN107688589A (zh) * 2017-02-20 2018-02-13 平安科技(深圳)有限公司 数据库系统优化的方法及装置
CN108509453A (zh) * 2017-02-27 2018-09-07 华为技术有限公司 一种信息处理方法及装置
CN108628904A (zh) * 2017-03-23 2018-10-09 北京嘀嘀无限科技发展有限公司 一种路径编码、相似路径检索方法及装置和电子设备
CN109271453A (zh) * 2018-10-22 2019-01-25 阿里巴巴集团控股有限公司 一种数据库容量的确定方法和装置
CN109885536A (zh) * 2019-02-26 2019-06-14 深圳众享互联科技有限公司 一种基于分布式数据分片存储和模糊查找方法
CN107239541B (zh) * 2017-06-02 2020-02-14 星环信息科技(上海)有限公司 一种代价估计的方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1342291A (zh) * 1999-02-19 2002-03-27 Pc多媒体公司 匹配引擎
CN101739451A (zh) * 2009-12-03 2010-06-16 南京航空航天大学 一种网格数据库连接查询自适应处理方法
CN102346873A (zh) * 2010-07-29 2012-02-08 同济大学 一种不确定数据上的多准则信息处理方法
US20150081222A1 (en) * 2013-09-19 2015-03-19 Sas Institute Inc. Control variable determination to maximize a drilling rate of penetration

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1342291A (zh) * 1999-02-19 2002-03-27 Pc多媒体公司 匹配引擎
US20050246317A1 (en) * 1999-02-19 2005-11-03 Square Pi Limited Matching engine
CN101739451A (zh) * 2009-12-03 2010-06-16 南京航空航天大学 一种网格数据库连接查询自适应处理方法
CN102346873A (zh) * 2010-07-29 2012-02-08 同济大学 一种不确定数据上的多准则信息处理方法
US20150081222A1 (en) * 2013-09-19 2015-03-19 Sas Institute Inc. Control variable determination to maximize a drilling rate of penetration

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930407A (zh) * 2016-04-18 2016-09-07 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及系统
CN105930407B (zh) * 2016-04-18 2019-05-17 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及系统
CN107688589A (zh) * 2017-02-20 2018-02-13 平安科技(深圳)有限公司 数据库系统优化的方法及装置
WO2018149085A1 (zh) * 2017-02-20 2018-08-23 平安科技(深圳)有限公司 数据库系统优化的方法、系统、电子装置及存储介质
US11132362B2 (en) 2017-02-20 2021-09-28 Ping An Technology (Shenzhen) Co., Ltd. Method and system of optimizing database system, electronic device and storage medium
CN107688589B (zh) * 2017-02-20 2019-02-26 平安科技(深圳)有限公司 数据库系统优化的方法及装置
CN108509453B (zh) * 2017-02-27 2021-02-09 华为技术有限公司 一种信息处理方法及装置
CN108509453A (zh) * 2017-02-27 2018-09-07 华为技术有限公司 一种信息处理方法及装置
CN108628904B (zh) * 2017-03-23 2021-03-02 北京嘀嘀无限科技发展有限公司 一种路径编码、相似路径检索方法及装置和电子设备
US10883842B2 (en) 2017-03-23 2021-01-05 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for route searching
CN108628904A (zh) * 2017-03-23 2018-10-09 北京嘀嘀无限科技发展有限公司 一种路径编码、相似路径检索方法及装置和电子设备
CN107239541B (zh) * 2017-06-02 2020-02-14 星环信息科技(上海)有限公司 一种代价估计的方法及设备
CN109271453A (zh) * 2018-10-22 2019-01-25 阿里巴巴集团控股有限公司 一种数据库容量的确定方法和装置
CN109271453B (zh) * 2018-10-22 2021-08-27 创新先进技术有限公司 一种数据库容量的确定方法和装置
CN109885536A (zh) * 2019-02-26 2019-06-14 深圳众享互联科技有限公司 一种基于分布式数据分片存储和模糊查找方法
CN109885536B (zh) * 2019-02-26 2023-06-16 深圳众享互联科技有限公司 一种基于分布式数据分片存储和模糊查找方法

Also Published As

Publication number Publication date
CN105302858B (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
CN105302858A (zh) 一种分布式数据库系统的跨节点查询优化方法及系统
Luo et al. Minimizing the delay and cost of computation offloading for vehicular edge computing
CN104598994A (zh) 一种带时变时间窗的关联物流运输优化调度方法
CN101873224A (zh) 一种云计算负载均衡方法和设备
CN103701894A (zh) 动态资源调度方法与系统
CN102118450A (zh) 一种基于中间中心度的机会网络p2p信息查询方法
CN105117292A (zh) 随机扩散动态负载均衡方法
CN108111335A (zh) 一种调度和链接虚拟网络功能的方法及系统
CN109818792B (zh) 一种基于二阶线性系统时变耦合复杂动态网络模型的控制器
CN105591875B (zh) 一种面向多任务的自组网动态匹配选择方法
CN101739451A (zh) 一种网格数据库连接查询自适应处理方法
CN103824127B (zh) 云计算环境下服务的自适应组合优化方法
CN103577899B (zh) 一种基于可靠性预测与QoS相结合的服务组合方法
CN111324429B (zh) 一种基于多代血统参考距离的微服务组合调度方法
CN104363104A (zh) 一种面向用户需求的海量多元数据态势显示系统与方法
Wang et al. An optimal edge server placement approach for cost reduction and load balancing in intelligent manufacturing
Yang et al. E-tree learning: A novel decentralized model learning framework for edge ai
CN110310014B (zh) 基于过渡矩阵的泛在电力物联网分布式经济调度方法
CN102081754A (zh) 多专家动态协调评判方法及智能化辅助决策支持系统
CN108415775A (zh) 一种基于服务质量的资源确定方法及系统
CN101442562A (zh) 基于移动代理的上下文感知方法
CN112512000A (zh) 一种配电物联网节点部署优化方法
Yuan et al. Low-Cost Federated Broad Learning for Privacy-Preserved Knowledge Sharing in the RIS-Aided Internet of Vehicles
Yang E-commerce logistics system based on Internet of Things
CN115062868B (zh) 一种预聚类的车辆配送路径规划方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20170313

Address after: 100070 Fengtai District, Feng Feng Road, the era of wealth on the 1st floor of the world's 28 floor, Beijing

Applicant after: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: State Grid Corporation of China

Applicant after: STATE GRID ZHEJIANG ELECTRIC POWER Co.

Applicant after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Applicant after: TSINGHUA University

Applicant after: BEIJING GREAT OPENSOURCE SOFTWARE Co.,Ltd.

Applicant after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Address before: 100070 Fengtai District, Feng Feng Road, the era of wealth on the 1st floor of the world's 28 floor, Beijing

Applicant before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Applicant before: State Grid Corporation of China

Applicant before: STATE GRID ZHEJIANG ELECTRIC POWER Co.

Applicant before: Beijing Zhongdian Feihua Communications Co.,Ltd.

Applicant before: TSINGHUA University

Applicant before: BEIJING GREAT OPENSOURCE SOFTWARE Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Co-patentee after: STATE GRID CORPORATION OF CHINA

Patentee after: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Co-patentee after: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Co-patentee after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Co-patentee after: TSINGHUA University

Co-patentee after: BEIJING GREAT OPENSOURCE SOFTWARE Co.,Ltd.

Co-patentee after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Address before: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Co-patentee before: State Grid Corporation of China

Patentee before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Co-patentee before: STATE GRID ZHEJIANG ELECTRIC POWER Co.

Co-patentee before: Beijing Zhongdian Feihua Communications Co.,Ltd.

Co-patentee before: TSINGHUA University

Co-patentee before: BEIJING GREAT OPENSOURCE SOFTWARE Co.,Ltd.

Co-patentee before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190701

Address after: 100085 Beijing city Haidian District Qinghe small Camp Road No. 15

Co-patentee after: STATE GRID CORPORATION OF CHINA

Patentee after: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Co-patentee after: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Co-patentee after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Co-patentee after: TSINGHUA University

Co-patentee after: BEIJING GREAT OPENSOURCE SOFTWARE Co.,Ltd.

Co-patentee after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Address before: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Co-patentee before: STATE GRID CORPORATION OF CHINA

Patentee before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Co-patentee before: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Co-patentee before: Beijing Zhongdian Feihua Communications Co.,Ltd.

Co-patentee before: TSINGHUA University

Co-patentee before: BEIJING GREAT OPENSOURCE SOFTWARE Co.,Ltd.

Co-patentee before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

TR01 Transfer of patent right