CN107480199B - 数据库的查询重构方法、装置、设备及存储介质 - Google Patents

数据库的查询重构方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN107480199B
CN107480199B CN201710581300.7A CN201710581300A CN107480199B CN 107480199 B CN107480199 B CN 107480199B CN 201710581300 A CN201710581300 A CN 201710581300A CN 107480199 B CN107480199 B CN 107480199B
Authority
CN
China
Prior art keywords
query
user
database
attribute
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710581300.7A
Other languages
English (en)
Other versions
CN107480199A (zh
Inventor
曲强
张金波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201710581300.7A priority Critical patent/CN107480199B/zh
Publication of CN107480199A publication Critical patent/CN107480199A/zh
Application granted granted Critical
Publication of CN107480199B publication Critical patent/CN107480199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用计算机技术领域,提供了一种数据库的查询重构方法、装置、设备及存储介质,该方法包括:当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,根据查询视图对数据库的元组进行标记,生成数据库的标记属性,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。

Description

数据库的查询重构方法、装置、设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种数据库的查询重构方法、装置、设备及存储介质。
背景技术
数据库查询是数据库系统的重要功能之一。在大数据背景下,面对海量的异构数据,数据库技术也不断发展,出现了诸如云管理、分布式数据库、内存数据库、NoSQL等多种多样的数据库系统,然而数据库查询仍然是这些系统的核心业务之一,如何让用户对数据进行快速高效的查询因此变得尤为重要。使用数据查询语言查询指定数据库对于非专家用户通常是一项非常具有挑战性的任务,尤其是在数据模式的不确定性情况下,例如用户对数据存储的不明确、数据存储结构复杂以及多变,数据查询往往缺乏模式或者只有不完整的模式来帮助用户指定其查询,这使得数据库查询的效率问题变得更加重要。查询重构可以针对用户输入的一个有效的查询找到一个相同或者相似但是更加高效的替代查询语句。这一方法也是数据库领域的一个研究热点问题,可以被广泛的应用在数据库系统查询优化、数据反向工程、数据库安全等领域。
当用户输入一个数据库查询后,如何找到一个相同或者相似的查询,该查询返回与原始查询相同的结果,但新生成的查询执行更加高效,这是一个非常有意义和有技术挑战的难点问题。例如,在篮球数据库中,可以通过查询诸如积分、篮板、助攻等多个不同属性的组合来寻找优秀的球员。但是由于涉及模式属性繁多甚至跨实体,这种组合查询往往效率不高,如何利用较少数目且尽可能使用索引属性重构另一个替代查询并返回相同的结果具有很高的实践价值,因为重构的查询涉及较少、较优数据模式属性,因而可以使得整个系统具有更高的响应效率和反应速度,进而提高系统性能。
已有数据库数据分析技术主要基于两类方法:简单的选择策略和机器学习方法。简单的选择策略主要包括最近邻居方法和子结构搜索方法;机器学习方法包括决策树和神经网络。简单的选择策略缺乏经验指导,无法适应新的数据环境,已有很多研究证明应用机器学习方法进行数据查找优于这类方法。决策树法以“按输出查询”(QOP)的形式进行查询重构:给定一个查询,使用决策树生成该查询的多个实例等效查询(IEQ)。通过分析多个查询的成本,可以选择类似输出的最优查询。也有一些方法尝试以视图定义问题(VDP)解决了这个问题,VDP问题可以为数据库视图找出最准确和最简洁的定义,还可以根据阈值查找近似的定义。通过为数据库视图寻找定义的方式可以在一定程度上解决这一问题。
但是,决策树在处理这一问题时,将属性分为两个互斥的集合,导致属性之间的比较关系丢失,并且决策树方法依赖于对数据的认识,需要用户提前预知数据的模式属性,此外,决策树方法易过拟合。VDP问题没有挖掘已有的查询Q和视图V之间的关联,因而生成的查询跟用户输入查询之间差异很大。
发明内容
本发明的目的在于提供一种数据库的查询重构方法、装置、设备及存储介质,旨在解决由于现有数据库系统的查询重构效率低下,导致数据库系统的查询效率不高的问题。
一方面,本发明提供了一种数据库的查询重构方法,所述方法包括下述步骤:
当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;
根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;
获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;
根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。
另一方面,本发明提供了一种数据库的查询重构装置,所述装置包括:
查询视图获取单元,用于当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;
标记属性生成单元,用于根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;
超平面生成单元,用于获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;以及
查询生成单元,用于根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。
另一方面,本发明还提供了一种数据库查询设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述查询重构方法的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述查询重构方法的步骤。
本发明当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,根据查询视图对数据库的元组进行标记,生成数据库的标记属性,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。
附图说明
图1是本发明实施例一提供的数据库的查询重构方法的实现流程图;
图2是本发明实施例二提供的数据库的查询重构方法的实现流程图;
图3是本发明实施例三提供的数据库的查询重构装置的结构示意图;
图4是本发明实施例四提供的数据库的查询重构装置的结构示意图;以及
图5是本发明实施例五提供的数据库查询设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的数据库的查询重构方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图。
本发明实施例适用于数据库系统,尤其适用于数据库系统的查询优化,以方便进行数据库系统的查询重构。在本发明实施例中,当接收到用户的查询请求时,说明用户需要从数据库中寻找数据,此时,接收用户输入的原始查询,根据原始查询的查询语句在用户指定的数据库中进行查询,得到对应的查询视图。
在步骤S102中,根据查询视图对数据库的元组进行标记,生成数据库的标记属性。
在本发明实施例中,得到对应的查询视图之后,将数据库中属于查询视图的元组和不属于查询视图的元组进行区别标记,在数据库中添加一列标记数据,即增加了数据库属性。具体地,在对元组进行区别标记时,可以将属于查询视图的元组标记为+1,将不属于查询视图的元组标记为-1。
在步骤S103中,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面。
在本发明实施例中,获取用户在输入的原始查询中指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,以获取用户的查询意图,并根据用户的查询意图生成分类超平面,以对用户指定的属性进行最佳分类。
优选地,预设的支持向量机模型为C-支持向量分类机模型。进一步优选地,在通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面时,首先根据用户指定的属性,确定训练的表达式为
Figure GDA0002416259920000051
然后根据确定的表达式,获取对应的对偶表达式
Figure GDA0002416259920000052
最后根据参数α对该对偶表达式进行训练,以得到分类超平面,该分类超平面的表达式为
Figure GDA0002416259920000053
因此,该超平面的决策函数为
Figure GDA0002416259920000054
b。
其中,参数ξi和系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,ξi≥0,i=1,…,l,l为样本数量,C为预先确定的指定参数,ξi是松弛变量,xi为训练矢量,φ()为映射函数,α满足约束条件dTα=0,0≤αi≤C,i=1,…,l,αi为xi的对偶变量,α为向量x的对偶向量,d为预设的参数,e为单位向量,Q为l×l的正半定数矩阵,具体地,Qij=didjK(xi,xj),K(xi,xj)为预设的内核函数。
在步骤S104中,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询。
在本发明实施例中,生成分类超平面之后,根据分类超平面表达式的系数,获取用户需要的查询属性,根据用户需要的查询属性,生成原始查询对应的替代查询,即对原始查询进行重构,从而在查询中使用更少的数据库模式属性和使用更多的索引模式属性,提高了数据库的查询效率和安全性。
作为示例地,用户需要在如表1所示的数据集中查询属性“sname”为“Huawei”的样本时,发出查询1,得到如表2所示的结果(即查询视图),在表2中,第一个元组和第二个元组是查询结果,标记为“+1”,其他两个元组由“-1”标记。然后我们使用线性内核选择属性cs1和cs2进行支持向量机的训练,并提取超平面,生成替代查询2。
表1:
id sname cs1 cs2
1 Huawei 0 3
2 Huawei 1 2
3 ZTE 2 1
4 ZTE 3 0
查询1:
SELECT*
FROM Grade
WHERE sname=“Huawei”
表2:
Figure GDA0002416259920000061
替代查询2:
SELECT*
FROM Grade
WHERE cs1-cs2<0
在本发明实施例中,通过支持向量机训练得到超平面,从超平面中提取系数和用户选定的属性结合,挖掘属性之间的关系,生成新的查询语句,该方法可以在保证生成相同查询结果的情况下,根据数据存储方式和数据库性能,生成更好的查询语句,实现查询重构,自动生成等价替代查询,从而优化了数据库系统的查询方式,提高了数据库的查询效率,进而提高数据库系统的性能。
实施例二:
图2示出了本发明实施例二提供的数据库的查询重构方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S201中,当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图。
本发明实施例适用于数据库系统,尤其适用于数据库系统的查询优化,以方便进行数据库系统的查询重构。在本发明实施例中,当接收到用户的查询请求时,说明用户需要从数据库中寻找数据,此时,接收用户输入的原始查询,根据原始查询的查询语句在用户指定的数据库中进行查询,得到对应的查询视图。
在步骤S202中,根据查询视图对数据库的元组进行标记,生成数据库的标记属性。
在本发明实施例中,得到对应的查询视图之后,将数据库中属于查询视图的元组和不属于查询视图的元组进行区别标记,在数据库中添加一列标记数据,即增加了数据库属性。具体地,在对元组进行区别标记时,可以将属于查询视图的元组标记为+1,将不属于查询视图的元组标记为-1。
在步骤S203中,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面。
在本发明实施例中,获取用户在输入的原始查询中指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,以获取用户的查询意图,并根据用户的查询意图生成分类超平面,以对用户指定的属性进行最佳分类。
优选地,预设的支持向量机模型为C-支持向量分类机模型。进一步优选地,在通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面时,首先根据用户指定的属性,确定训练的表达式为
Figure GDA0002416259920000081
然后根据确定的表达式,获取对应的对偶表达式
Figure GDA0002416259920000082
最后根据参数α对该对偶表达式进行训练,以得到分类超平面,该分类超平面的表达式为
Figure GDA0002416259920000083
因此,该超平面的决策函数为
Figure GDA0002416259920000084
Figure GDA0002416259920000085
其中,参数ξi和系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,ξi≥0,i=1,…,l,l为样本数量,C为预先确定的指定参数,ξi是松弛变量,xi为训练矢量,φ()为映射函数,α满足约束条件dTα=0,0≤αi≤C,i=1,…,l,αi为xi的对偶变量,α为向量x的对偶向量,d为预设的参数,e为单位向量,Q为l×l的正半定数矩阵,具体地,Qij=didjK(xi,xj),K(xi,xj)为预设的内核函数。
在步骤S204中,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询。
在本发明实施例中,生成分类超平面之后,根据分类超平面表达式的系数,获取用户需要的查询属性,根据用户需要的查询属性,生成原始查询对应的替代查询,即对原始查询进行重构,从而在查询中使用更少的数据库模式属性和使用更多的索引模式属性,提高了数据库的查询效率和安全性。
在步骤S205中,获取替代查询的查询结果,并向用户输出查询结果。
在本发明实施例中,为了检验重构得到的替代查询,执行这个替代查询,获取替代查询的查询结果,并向用户输出查询结果,从而确定替代查询的查询结果是否为用户需要的查询结果。
在步骤S206中,接收用户对查询结果的反馈信息,判断反馈信息是否为预设正面反馈,是则执行步骤S207,否则执行步骤S203。
在步骤S207中,当反馈信息为预设正面反馈时,结束此次查询。
在本发明实施例中,预设正面反馈为确定替代查询的查询结果是用户需要的查询结果的反馈,具体地,可以为“满意”、“可以”“很满意”等。用户对替代查询的查询结果进行确认之后,如果用户输入的反馈信息不是这些预设正面反馈,则跳转至步骤S203,执行获取用户指定的属性的步骤,直至接收到的反馈信息为这些预设正面反馈,说明用户对查询重构的结果满意,即得到了满意查询结果,因此,结束此次查询,从而提高了查询重构的有效性和数据库的查询效率,进而提高了用户体验。
实施例三:
图3示出了本发明实施例三提供的数据库的查询重构装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
查询视图获取单元31,用于当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图。
标记属性生成单元32,用于根据查询视图对数据库的元组进行标记,生成数据库的标记属性。
超平面生成单元33,用于获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面。
查询生成单元34,用于根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询。
在本发明实施例中,当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,标记属性生成单元32根据查询视图对数据库的元组进行标记,生成数据库的标记属性,超平面生成单元33获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,查询生成单元34根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。
在本发明实施例中,查询重构装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考前述实施例一的描述,在此不再赘述。
实施例四:
图4示出了本发明实施例四提供的数据库的查询重构装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
查询视图获取单元41,用于当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图。
在本发明实施例中,当接收到用户的查询请求时,说明用户需要从数据库中寻找数据,此时,查询视图获取单元41接收用户输入的原始查询,根据原始查询的查询语句在用户指定的数据库中进行查询,得到对应的查询视图。
标记属性生成单元42,用于根据查询视图对数据库的元组进行标记,生成数据库的标记属性。
在本发明实施例中,得到对应的查询视图之后,标记属性生成单元42将数据库中属于查询视图的元组和不属于查询视图的元组进行区别标记,在数据库中添加一列标记数据,即增加了数据库属性。具体地,在对元组进行区别标记时,可以将属于查询视图的元组标记为+1,将不属于查询视图的元组标记为-1。
超平面生成单元43,用于获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面。
在本发明实施例中,超平面生成单元43获取用户在输入的原始查询中指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,以获取用户的查询意图,并根据用户的查询意图生成分类超平面,以对用户指定的属性进行最佳分类。
优选地,预设的支持向量机模型为C-支持向量分类机模型。进一步优选地,在通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面时,首先根据用户指定的属性,确定训练的表达式为
Figure GDA0002416259920000101
然后根据确定的表达式,获取对应的对偶表达式
Figure GDA0002416259920000102
最后根据参数α对该对偶表达式进行训练,以得到分类超平面,该分类超平面的表达式为
Figure GDA0002416259920000103
因此,该超平面的决策函数为
Figure GDA0002416259920000104
Figure GDA0002416259920000111
其中,参数ξi和系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,ξi≥0,i=1,…,l,l为样本数量,C为预先确定的指定参数,ξi是松弛变量,xi为训练矢量,φ()为映射函数,α满足约束条件dTα=0,0≤αi≤C,i=1,…,l,αi为xi的对偶变量,α为向量x的对偶向量,d为预设的参数,e为单位向量,Q为l×l的正半定数矩阵,具体地,Qij=didjK(xi,xj),K(xi,xj)为预设的内核函数。
查询生成单元44,用于根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询。
在本发明实施例中,生成分类超平面之后,根据分类超平面表达式的系数,获取用户需要的查询属性,查询生成单元44根据用户需要的查询属性,生成原始查询对应的替代查询,即对原始查询进行重构,从而在查询中使用更少的数据库模式属性和使用更多的索引模式属性,提高了数据库的查询效率和安全性。
结果输出单元45,用于获取替代查询的查询结果,并向用户输出查询结果。
在本发明实施例中,为了检验重构得到的替代查询,执行这个替代查询,获取替代查询的查询结果,并通过结果输出单元45向用户输出查询结果,从而确定替代查询的查询结果是否为用户需要的查询结果。
反馈接收单元46,用于接收用户的对查询结果的反馈信息。
循环重构单元47,用于当反馈信息为非预设正面反馈时,触发超平面生成单元43获取用户指定的属性,直至接收到的反馈信息为预设正面反馈。
在本发明实施例中,预设正面反馈为确定替代查询的查询结果是用户需要的查询结果的反馈,具体地,可以为“满意”、“可以”“很满意”等。用户对替代查询的查询结果进行确认之后,如果用户输入的反馈信息不是这些预设正面反馈,则循环重构单元47触发超平面生成单元43获取用户指定的属性并通过预设的支持向量机模型进行训练,直至接收到的反馈信息为这些预设正面反馈,说明用户对查询重构的结果满意,即得到了满意查询结果,因此,结束此次查询,从而提高了查询重构的有效性,进而提高了用户体验。
因此,优选地,该超平面生成单元43包括:
表达式确定单元431,用于根据用户指定的属性,确定训练的表达式为
Figure GDA0002416259920000121
其中,C为预先确定的指定参数,ξi是松弛变量,参数ξi和系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,xi为训练矢量,φ()为映射函数;
表达式对偶单元432,用于根据确定的表达式,获取对应的对偶表达式
Figure GDA0002416259920000122
其中,α满足约束条件dTα=0,α为向量x的对偶向量,d为预设的参数,e为单位向量,Q为l×l的正半定数矩阵;以及
参数训练单元433,用于根据α对对偶表达式进行训练,以得到分类超平面,分类超平面的表达式为
Figure GDA0002416259920000123
K(xi,x)为预设的内核函数。
在本发明实施例中,查询重构装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例五:
图5示出了本发明实施例五提供的数据库查询设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的数据库查询设备5包括处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。该处理器50执行计算机程序52时实现上述各个查询重构方法实施例中的步骤,例如图1所示的步骤S101至S104、图2所示的步骤S201至S207。或者,处理器50执行计算机程序52时实现上述各装置实施例中各单元的功能,例如图3所示单元31至34、图4所示单元41至47的功能。
在本发明实施例中,该处理器50执行计算机程序52时实现上述各个屏幕唤醒的控制方法实施例中的步骤时,当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,根据查询视图对数据库的元组进行标记,生成数据库的标记属性,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。
该数据库查询设备5中处理器50在执行计算机程序52时实现的步骤具体可参考实施例一中方法的描述,在此不再赘述。
实施例六:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各个查询重构方法实施例中的步骤,例如,图1所示的步骤S101至S104、图2所示的步骤S201至S207。或者,该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能,例如图3所示单元31至34、图4所示单元41至47的功能。
在本发明实施例中,当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,根据查询视图对数据库的元组进行标记,生成数据库的标记属性,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。该计算机程序被处理器执行时实现的查询重构方法进一步可参考前述方法实施例中步骤的描述,在此不再赘述。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据库的查询重构方法,其特征在于,所述方法包括下述步骤:
当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;
根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;
获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;
根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述替代查询的查询结果,并向所述用户输出所述查询结果;
接收所述用户对所述查询结果的反馈信息;
当所述反馈信息为非预设正面反馈时,跳转至获取所述用户指定的属性的步骤,直至接收到的所述反馈信息为所述预设正面反馈。
3.如权利要求1所述的方法,其特征在于,所述预设的支持向量机模型为C-支持向量分类机模型。
4.如权利要求3所述的方法,其特征在于,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面的步骤,包括:
根据所述用户指定的属性,确定训练的表达式为
Figure FDA0002416259910000011
其中,所述C为预先确定的指定参数,所述ξi是松弛变量,所述参数ξi和所述系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,所述xi为训练矢量,所述φ()为映射函数;
根据所述确定的表达式,获取对应的对偶表达式
Figure FDA0002416259910000012
其中,所述α满足约束条件dTα=0,所述α为向量x的对偶向量,所述d为预设的参数,所述e为单位向量,所述Q为l×l的正半定数矩阵;
根据所述α对所述对偶表达式进行训练,以得到分类超平面,所述分类超平面的表达式为
Figure FDA0002416259910000021
所述K(xi,x)为预设的内核函数;其中,l为样本数量,α满足约束条件dTα=0,0≤αi≤C,i=1,…,l。
5.一种数据库的查询重构装置,其特征在于,所述装置包括:
查询视图获取单元,用于当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;
标记属性生成单元,用于根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;
超平面生成单元,用于获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;以及
查询生成单元,用于根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
结果输出单元,用于获取所述替代查询的查询结果,并向所述用户输出所述查询结果;
反馈接收单元,用于接收所述用户对所述查询结果的反馈信息;以及
循环重构单元,用于当所述反馈信息为非预设正面反馈时,触发所述超平面生成单元获取所述用户指定的属性,直至接收到的所述反馈信息为所述预设正面反馈。
7.如权利要求5所述的装置,其特征在于,所述预设的支持向量机模型为C-支持向量分类机模型。
8.如权利要求7所述的装置,其特征在于,所述超平面生成单元包括:
表达式确定单元,用于根据所述用户指定的属性,确定训练的表达式为
Figure FDA0002416259910000022
其中,所述C为预先确定的指定参数,所述ξi是松弛变量,所述参数ξi和所述系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,所述xi为训练矢量,所述φ()为映射函数;
表达式对偶单元,用于根据所述确定的表达式,获取对应的对偶表达式
Figure FDA0002416259910000031
其中,所述α满足约束条件dTα=0,所述α为向量x的对偶向量,所述d为预设的参数,所述e为单位向量,所述Q为l×l的正半定数矩阵;以及
参数训练单元,用于根据所述α对所述对偶表达式进行训练,以得到分类超平面,所述分类超平面的表达式为
Figure FDA0002416259910000032
所述K(xi,x)为预设的内核函数;其中,l为样本数量,α满足约束条件dTα=0,0≤αi≤C,i=1,…,l。
9.一种数据库查询设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
CN201710581300.7A 2017-07-17 2017-07-17 数据库的查询重构方法、装置、设备及存储介质 Active CN107480199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710581300.7A CN107480199B (zh) 2017-07-17 2017-07-17 数据库的查询重构方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710581300.7A CN107480199B (zh) 2017-07-17 2017-07-17 数据库的查询重构方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN107480199A CN107480199A (zh) 2017-12-15
CN107480199B true CN107480199B (zh) 2020-06-12

Family

ID=60595207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710581300.7A Active CN107480199B (zh) 2017-07-17 2017-07-17 数据库的查询重构方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN107480199B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760318A (zh) * 2020-11-24 2021-12-07 北京沃东天骏信息技术有限公司 信息处理方法、装置、服务器及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1930816A1 (en) * 2006-11-07 2008-06-11 Fast Serach &amp; Transfer ASA Contextual relevance-weighted result set navigation for search engines
CN102043776A (zh) * 2009-10-14 2011-05-04 南开大学 与查询相关的多排序模型集成算法
US8032514B2 (en) * 2005-01-14 2011-10-04 International Business Machines Corporation SQL distinct optimization in a computer database system
CN102385599A (zh) * 2010-09-03 2012-03-21 上海实方软件有限公司 一种分布式数据源的查询与更新方法
CN103218439A (zh) * 2013-04-22 2013-07-24 武汉大学 一种面向对象代理数据库的虚属性查询优化方法
CN103608812A (zh) * 2011-06-15 2014-02-26 微软公司 业务智能系统的查询优化技术
CN103646067A (zh) * 2013-12-06 2014-03-19 四川九洲电器集团有限责任公司 一种提高数据库查询效率的方法和系统
CN105279276A (zh) * 2015-11-11 2016-01-27 浪潮(北京)电子信息产业有限公司 一种数据库索引优化系统
CN105630881A (zh) * 2015-12-18 2016-06-01 陕西师范大学 一种rdf的数据存储方法和查询方法
CN105786827A (zh) * 2014-12-18 2016-07-20 中国科学院深圳先进技术研究院 基于效用的搜索引擎查询推荐方法
CN105975488A (zh) * 2016-04-25 2016-09-28 哈尔滨工程大学 一种关系数据库中基于主题类簇单元的关键词查询方法
US9582539B1 (en) * 2012-05-04 2017-02-28 Paraccel, Inc. Optimizing database queries using reusable subqueries
CN106919678A (zh) * 2017-02-27 2017-07-04 武汉珞佳伟业科技有限公司 一种数据库查询优化系统及方法
CN106933842A (zh) * 2015-12-29 2017-07-07 阿里巴巴集团控股有限公司 一种数据库查询方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8161035B2 (en) * 2009-06-04 2012-04-17 Oracle International Corporation Query optimization by specifying path-based predicate evaluation in a path-based query operator
US8655867B2 (en) * 2010-05-13 2014-02-18 Salesforce.Com, Inc. Method and system for optimizing queries in a multi-tenant database environment

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8032514B2 (en) * 2005-01-14 2011-10-04 International Business Machines Corporation SQL distinct optimization in a computer database system
EP1930816A1 (en) * 2006-11-07 2008-06-11 Fast Serach &amp; Transfer ASA Contextual relevance-weighted result set navigation for search engines
CN102043776A (zh) * 2009-10-14 2011-05-04 南开大学 与查询相关的多排序模型集成算法
CN102385599A (zh) * 2010-09-03 2012-03-21 上海实方软件有限公司 一种分布式数据源的查询与更新方法
CN103608812A (zh) * 2011-06-15 2014-02-26 微软公司 业务智能系统的查询优化技术
US9582539B1 (en) * 2012-05-04 2017-02-28 Paraccel, Inc. Optimizing database queries using reusable subqueries
CN103218439A (zh) * 2013-04-22 2013-07-24 武汉大学 一种面向对象代理数据库的虚属性查询优化方法
CN103646067A (zh) * 2013-12-06 2014-03-19 四川九洲电器集团有限责任公司 一种提高数据库查询效率的方法和系统
CN105786827A (zh) * 2014-12-18 2016-07-20 中国科学院深圳先进技术研究院 基于效用的搜索引擎查询推荐方法
CN105279276A (zh) * 2015-11-11 2016-01-27 浪潮(北京)电子信息产业有限公司 一种数据库索引优化系统
CN105630881A (zh) * 2015-12-18 2016-06-01 陕西师范大学 一种rdf的数据存储方法和查询方法
CN106933842A (zh) * 2015-12-29 2017-07-07 阿里巴巴集团控股有限公司 一种数据库查询方法和装置
CN105975488A (zh) * 2016-04-25 2016-09-28 哈尔滨工程大学 一种关系数据库中基于主题类簇单元的关键词查询方法
CN106919678A (zh) * 2017-02-27 2017-07-04 武汉珞佳伟业科技有限公司 一种数据库查询优化系统及方法

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
"An image retrieval scheme with relevance feedback using feature";Xiang-YangWang et al.;《Neurocomputing》;20131028;全文 *
"Automatic Suggestion for PubMed Query Reformulation";Luu Anh Tuan et al.;《Journal of Computing Science and Engineering》;20120630;第6卷(第2期);全文 *
"Exact Query Reformulation with First-Order Ontologies and Databases";Enrico Franconi et al.;《 Logics in Artificial Intelligence》;20120928;全文 *
"Learning-based Query Performance Modeling and Prediction";Mert Akdere et al.;《2012 IEEE 28th International Conference on Data Engineering》;20120702;全文 *
"Optimizing Database-Backed Applications with Query Synthesis";Alvin Cheung et al.;《PLDI’13 Proceedings of the 34th ACM SIGPLAN Conference on Programming Language Design and Implementation》;20130619;全文 *
"Oracle数据库查询优化方法研究";杨小艳 等;《计算机与现代化》;20080525;全文 *
"SQL语句的查询优化分析";蔡葵;《华南金融电脑》;20040810;全文 *
"基于历史查询的关系数据库关键词查询优化问题研究";冯丽敏;《中国优秀硕士学位论文全文数据库 信息科技辑》;20141015;全文 *
"基于检索历史上下文的个性化查询重构技术研究";宋巍 等;《中文信息学报》;20100531;第24卷(第3期);全文 *
"基于视图的查询重写";车建华 等;《燕山大学学报》;20060131;第30卷(第1期);全文 *
"查询重写关系数据库查询优化技术";陈启才;《电脑编程技巧与维护》;20090407;全文 *
"适用于范围查询的列存储数据桶划分算法";李晔锋 等;《计算机研究与发展》;20130426;全文 *

Also Published As

Publication number Publication date
CN107480199A (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
Kumar et al. An efficient k-means clustering filtering algorithm using density based initial cluster centers
Zhang et al. Entitables: Smart assistance for entity-focused tables
Pham et al. S3g2: A scalable structure-correlated social graph generator
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
Plantenga Inexact subgraph isomorphism in MapReduce
Wu et al. Ontology-based subgraph querying
Guo et al. SOR: An optimized semantic ontology retrieval algorithm for heterogeneous multimedia big data
CN104239513A (zh) 一种面向领域数据的语义检索方法
CN104834693A (zh) 基于深度搜索的视觉图像检索方法及系统
Cheng et al. Active semi-supervised community detection based on must-link and cannot-link constraints
CN105045875A (zh) 个性化信息检索方法及装置
Misuraca et al. BMS: An improved Dunn index for Document Clustering validation
CN110968802B (zh) 一种用户特征的分析方法、分析装置及可读存储介质
El-Roby et al. ALEX: Automatic link exploration in linked data
CN106971005A (zh) 一种云计算环境下基于MapReduce的分布式并行文本聚类方法
CN107480199B (zh) 数据库的查询重构方法、装置、设备及存储介质
Yan et al. The self-adaptive integrated algorithm on time-sensitive cluster evolution tracking
KR20160120583A (ko) 지식 관리 시스템 및 이의 지식 구조 기반의 자료 관리 방법
Wijayanti et al. K-means cluster analysis for students graduation: case study: STMIK Widya Cipta Dharma
Xie et al. Active zero-shot learning
Assi et al. BIGMAT: A distributed affinity-preserving random walk strategy for instance matching on knowledge graphs
Shen et al. Predicting named entity location using Twitter
Rivero et al. On isomorphic matching of large disk-resident graphs using an XQuery engine
Paradies et al. Robust cardinality estimation for subgraph isomorphism queries on property graphs
Hussan et al. An optimized user behavior prediction model using genetic algorithm on mobile web structure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Qu Qiang

Inventor after: Zhang Jinbo

Inventor before: Zhang Jinbo

Inventor before: Qu Qiang

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant