CN111831626A - 数据库逻辑关系的图结构生成方法、数据查询方法及装置 - Google Patents
数据库逻辑关系的图结构生成方法、数据查询方法及装置 Download PDFInfo
- Publication number
- CN111831626A CN111831626A CN202010687140.6A CN202010687140A CN111831626A CN 111831626 A CN111831626 A CN 111831626A CN 202010687140 A CN202010687140 A CN 202010687140A CN 111831626 A CN111831626 A CN 111831626A
- Authority
- CN
- China
- Prior art keywords
- connection relation
- database
- data
- result
- tables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000002910 structure generation Methods 0.000 title claims abstract description 12
- 230000002452 interceptive effect Effects 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了数据库逻辑关系的图结构生成方法、数据查询方法及装置。图结构生成方法包括:将表、字段、外部键均作为节点,将表与字段连接关系、表间连接关系、表与外部键连接关系作为连接不同节点的边,以生成用于描述数据库逻辑关系的图结构。数据查询方法可包括:对自然语言文本进行编码、形成第一编码结果,再对子图部分进行编码、形成第二编码结果,堆叠后形成最终编码结果,对最终编码结果进行解码,进而生成完整的结构化查询语句,利用完整的结构化查询语句从数据库中查询数据结果;本发明可通过相应的装置实现相应的方法。本发明能够使数据的获取逻辑变得更加清晰简洁,能够准确且快速地从数据库中获取数据查询结果,普适性非常好。
Description
技术领域
本发明涉及深度学习技术领域,更为具体来说,本发明能够提供一种数据库逻辑关系的图结构生成方法、数据查询方法及装置。
背景技术
随着计算机技术的不断进步,数据规模在不断增大,数据的开放程度往往也在不断提高。对于用户来说,如何能够准确且快速的查询到想要的数据就显得非常重要。目前的主流方案是建立在机器学习的基础上再进行改进,但存在人工的工作量较大、实现方式复杂、效率随着数据量增大而降低以及成本高等问题。因此,现有技术无法用于海量数据库和复杂关系场景。
发明内容
为解决现有的数据查询方案存在的实现方式复杂、人工工作量大以及难以适应海量数据库和复杂关系场景等问题,本发明提供了一种数据库逻辑关系的图结构生成方法、数据查询方法及装置。
为实现上述技术目的,本发明公开了一种数据库逻辑关系的图结构生成方法,该图结构生成方法包括但不限于如下步骤。通过遍历数据库中的所有表的方式得到各个表的字段,以及得到表与字段连接关系;收集已执行过的历史查询语句,提取所述历史查询语句中的外部键、表间连接关系及表与外部键连接关系;将所述表、所述字段、所述外部键均作为节点,将所述表与字段连接关系、所述表间连接关系、所述表与外部键连接关系作为连接不同节点的边,以生成用于描述数据库逻辑关系的图结构。
进一步地,所述历史查询语句为存在表间连接关系的结构化查询语句。
为实现上述技术目的,本发明还能够提供一种数据查询方法,该数据查询方法包括但不限于如下的步骤。对用于数据查询的自然语言文本进行编码,以形成第一编码结果;获取图结构中与所述自然语言文本相关程度最高的子图部分;其中,所述图结构为本发明任一实施例中的用于描述数据库逻辑关系的图结构;对所述子图部分进行编码,以形成第二编码结果;将所述第一编码结果和所述第二编码结果进行堆叠,以形成最终编码结果;对所述最终编码结果进行解码,以得到关键词及与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系;根据解码得到的与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系生成完整的结构化查询语句;利用所述完整的结构化查询语句从数据库中查询数据结果。
进一步地,接收用户通过可交互式界面输入的自然语言文本;对所述自然语言文本进行编码的同时存储所述自然语言文本。
进一步地,将查询得到的数据结果通过所述可交互式界面输出,以及在输出所述数据结果的同时存储所述数据结果和所述完整的结构化查询语句。
进一步地,基于带有注意力机制的双向循环神经网络对所述自然语言文本进行编码;基于使用门限机制的图神经网络对所述子图部分进行编码;基于带有注意力机制的双向循环神经网络对所述最终编码结果进行解码。
进一步地,生成完整的结构化查询语句的过程包括:将与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系置入预设的简化模板中;依据所述简化模板生成所述完整的结构化查询语句。
为实现上述的技术目的,本发明还提供了一种数据库逻辑关系的图结构生成装置,该图结构生成装置包括但不限于数据遍历模块、数据提取模块及关系生成模块。数据遍历模块,用于通过遍历数据库中的所有表的方式得到各个表的字段,以及得到表与字段连接关系;数据提取模块,用于收集已执行过的历史查询语句以及提取所述历史查询语句中的外部键、表间连接关系及表与外部键连接关系;关系生成模块,用于将所述表、所述字段、所述外部键均作为节点且将所述表与字段连接关系、所述表间连接关系、所述表与外部键连接关系作为连接不同节点的边,生成用于描述数据库逻辑关系的图结构。
为实现上述的技术目的,本发明还提供了一种数据查询装置,该数据查询装置包括但不限于第一编码模块、子图获取模块、第二编码模块、堆叠模块、解码模块、语句生成模块及查询模块。第一编码模块,用于对用于数据查询的自然语言文本进行编码,以形成第一编码结果;子图获取模块,用于获取图结构中与所述自然语言文本相关程度最高的子图部分;其中,所述图结构为本发明任一实施例的图结构生成装置生成的用于描述数据库逻辑关系的图结构;第二编码模块,用于对所述子图部分进行编码,以形成第二编码结果;堆叠模块,用于将所述第一编码结果和所述第二编码结果进行堆叠,以形成最终编码结果;解码模块,用于对所述最终编码结果进行解码,以得到关键词及与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系;语句生成模块,用于根据解码得到的与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系生成完整的结构化查询语句;查询模块,用于利用所述完整的结构化查询语句从数据库中查询数据结果。
为实现上述的技术目的,本发明还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,以实现本发明任一实施例中的图结构生成方法或数据查询方法。
本发明的有益效果为:相比现有技术,通过生成以及存储表示数据库逻辑关系的图结构,本发明能够理清数据库中繁杂庞巨的数据间的关系,使数据存储变得结构化,所以本发明能够提升数据库中表结构的连续性和访问的简洁性,进而使数据的获取逻辑变得更加清晰简洁,提高从数据库中查询数据的效率。
本发明能够建立人类自然语言、数据库编程语言、数据库之间的映射和逻辑关系,解决了海量数据库和复杂关系场景下的查询语句生成问题,所以本发明能够准确且快速地从数据库中获取数据查询结果,而且还具有普适性等优点。本发明能够实现友好方便的查询检索服务,从而能够提升非专业人员使用数据的能力,并使得数据查询更加简便。
另外,本发明在执行输入和输出过程中,结果都会被保存至存储单元,后续一些工作可直接取用存储的内容进行优化、训练、增量更新等工作,所以本发明还具有数据的可复用性较强的优点。
附图说明
图1示出了本发明一些实施例的数据库逻辑关系的图结构生成方法的流程示意图。
图2示出了本发明一些实施例的用于描述数据库逻辑关系的图结构示意图。
图3示出了本发明一些实施例的利用图结构的数据查询方法的流程示意图。
图4示出了本发明一些实施例的利用图结构的数据查询装置的工作原理示意图。
具体实施方式
下面结合说明书附图对本发明提供的一种数据库逻辑关系的图结构生成方法、数据查询方法及装置进行详细的解释和说明。
实施例一:
如图1、2所示,本实施例提供了一种数据库逻辑关系的图结构生成方法,该生成方法是一种海量数据库逻辑关系整理的方法。该图结构生成方法可以包括但不限于如下的步骤。
首先,通过遍历数据库中的所有现存的表的方式得到各个表的字段、分区名称及相关属性,相关属性包括但不限于类型、解释、表与字段连接关系等等。本实施例按照(表名,表名.字段)形式将上述信息保存。
其次,收集已执行过的历史查询语句,提取历史查询语句中的外部键、表间连接关系及表与外部键连接关系。本实施例中的历史查询语句为存在表间连接关系的结构化查询(SQL,Structured Query Language)语句。需要说明的是,外部键也是一种字段,可具体表示为外部键字段。本实施例按照(表名.外部键字段,表名.外部键字段)形式将上述信息保存,而且还可记录不同表之间的关系,以(表名.表名)的形式保存。另外需要强调的是,本实施例中的“表间连接关系”含义为:在数据库中的不同表之间的连接关系。
最后,根据表、字段、外部键三者之间的关系生成用于表示数据库中逻辑关系的图结构。本实施例中,具体将表、字段、外部键均作为节点,将表与字段连接关系、表间连接关系、表与外部键连接关系作为连接不同节点的边,以生成用于描述数据库逻辑关系的图结构,生成的图结构可如图2中的示意。
实施例二:
如图3、4所示,本实施例是在实施例一的基础上的数据查询方法,能够基于实施例一实现复杂数据库自然语言查询方案。该数据查询方法可包括但不限于如下的步骤。
接收用户通过可交互式界面或其他方式输入的自然语言文本。用户可在一个交互式界面上输入要检索的自然语言文本,自然语言文本例如可以是关键词、代号等。
对用于数据查询的自然语言文本进行编码,以形成第一编码结果。本发明一些实施例中,基于带有注意力机制的双向循环神经网络对自然语言文本进行编码。对自然语言文本进行编码的同时存储自然语言文本。
获取图结构中与自然语言文本相关程度最高的子图部分;本实施例可通过计算得到与输入文本相关程度最高的子图部分。其中涉及的图结构可为实施例一中的用于描述数据库逻辑关系的图结构,涉及的子图部分为整个图结构中的一部分,本实施例通过上述方式从各子图部分中找到与输入文本相关程度最高的一个。
对子图部分进行编码,以形成第二编码结果。本发明一些实施例中,基于使用门限机制的图神经网络对子图部分进行编码。
将第一编码结果和第二编码结果进行堆叠,即将图的编码和文本的编码堆叠,以形成最终编码结果。最终编码结果同时包含用户的查询意图和数据库中的区域性结构,该区域性结构存放有用户查询意图对应的数据。
本实施例中的最终编码结果可理解为一种融合编码。本实施例对最终编码结果进行解码,以得到关键词及对应的关键词类别信息,关键词类别信息包括但不限于与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系,关键词类别信息还包括查询内容、查询条件等等。在本发明一些实施例中,基于带有注意力机制的双向循环神经网络对最终编码结果进行解码。
本实施例可根据解码得到的与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系以及表与外部键连接关系生成完整的结构化查询(SQL,StructuredQuery Language)语句。本发明的一些实施例生成完整的结构化查询语句的过程包括:将与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系置入预设的简化模板中,依据简化模板生成完整的结构化查询语句。所以本发明能够实现基于图神经网络的复杂关系库查询语句(即数据库编程语言)的生成,以通过结构化查询语句直接作用于构成数据库的数据表,进而可达到准确且快速查询数据的目的。本实施例中的预设的简化模板内可以包括但不限于select(选取哪个字段名)、from(来自哪个表名)、like(搜索列中的指定模式)、join(表之间连接关系)等内容。
通过输出端将结构化查询语句发送至SQL语句查询系统中进行查询,利用完整的结构化查询语句从数据库中查询数据结果。
将查询得到的数据结果通过可交互式界面输出,以及在输出数据结果的同时通过存储单元存储得到的结构化查询语句和数据结果。显而易见地,针对复杂数据库的自然语言查询解决方案,现有技术中针对数据库的自然语言查询解决方案无法实施于复杂数据库,而对复杂数据库的逻辑关系生成又无法结合查询解决方案;本发明利用编码器的特殊策略,充分有效地结合两者,使对复杂数据库的简单查询成为现实
实施例三:
如图1、2所示,与实施例一基于相同的发明构思,本实施例能够提供一种数据库逻辑关系的图结构生成装置,该图结构生成装置包括但不限于数据遍历模块、数据提取模块及关系生成模块。数据遍历模块用于通过遍历数据库中的所有现存的表的方式得到各个表的字段,以及得到表与字段连接关系;数据提取模块用于收集已执行过的历史查询语句以及提取历史查询语句中的外部键、表间连接关系及表与外部键连接关系;关系生成模块用于将表、字段、外部键均作为节点且将表与字段连接关系、表间连接关系、表与外部键连接关系作为连接不同节点的边,生成用于描述数据库逻辑关系的图结构。其中,历史查询语句为存在表间连接关系的结构化查询语句。
实施例四:
如图4所示,与实施例二基于相同的发明构思,本实施例可提供一种数据查询装置,该装置包括但不限于输入模块(输入端)、第一编码模块(即第一编码器)、子图获取模块、第二编码模块(即第二编码器)、堆叠模块、解码模块(即解码器)、语句生成模块(编译器)及查询模块及存储单元及输出模块(输出端)。基于本实施例能够形成一套复杂数据库自然语言查询系统,该系统可具有编译端,编译端包括上述的第一编码器、第二编码器、解码器及编译器。输入模块接收用户通过可交互式界面输入的自然语言文本,存储单元用于对自然语言文本进行存储,以及用于在输出数据结果时对输出结果进行存储,第一编码模块用于对用于数据查询的自然语言文本进行编码,以形成第一编码结果,子图获取模块用于获取图结构中与自然语言文本相关程度最高的子图部分;其中,图结构为实施例三中图结构生成装置生成的用于描述数据库逻辑关系的图结构,第二编码模块用于对子图部分进行编码,以形成第二编码结果;堆叠模块用于将第一编码结果和第二编码结果进行堆叠,以形成最终编码结果;解码模块用于对最终编码结果进行解码,以得到关键词及与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系;语句生成模块用于根据解码得到的与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系生成完整的结构化查询语句;查询模块用于利用完整的结构化查询语句从数据库中查询数据结果。输出模块将查询得到的数据结果通过可交互式界面输出。
实施例五:
与实施例一或二基于相同的发明构思,本实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,以实现本发明任一实施例中的图结构生成方法或者查询方法。计算机程序中可具有多个程序模块,这些程序模块包括但不限于输入模块、第一编码模块、子图获取模块、第二编码模块、堆叠模块、解码模块、语句生成模块及查询模块及存储单元。输入模块接收用户通过可交互式界面输入的自然语言文本,存储单元用于对自然语言文本进行存储,以及用于在输出数据结果时对输出结果进行存储,第一编码模块用于对用于数据查询的自然语言文本进行编码,以形成第一编码结果,子图获取模块用于获取图结构中与自然语言文本相关程度最高的子图部分;其中,图结构为实施例三中图结构生成装置生成的用于描述数据库逻辑关系的图结构,第二编码模块用于对子图部分进行编码,以形成第二编码结果;堆叠模块用于将第一编码结果和第二编码结果进行堆叠,以形成最终编码结果;解码模块用于对最终编码结果进行解码,以得到关键词及与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系;语句生成模块用于根据解码得到的与关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系生成完整的结构化查询语句;查询模块用于利用完整的结构化查询语句从数据库中查询数据结果。输出模块将查询得到的数据结果通过可交互式界面输出。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM,Random Access Memory),只读存储器(ROM,Read-Only Memory),可擦除可编辑只读存储器(EPROM,Erasable Programmable Read-Only Memory,或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM,Compact Disc Read-Only Memory)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA,Programmable Gate Array),现场可编程门阵列(FPGA,Field Programmable Gate Array)等。
在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明实质内容上所作的任何修改、等同替换和简单改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据库逻辑关系的图结构生成方法,其特征在于,包括:
通过遍历数据库中的所有表的方式得到各个表的字段,以及得到表与字段连接关系;
收集已执行过的历史查询语句,提取所述历史查询语句中的外部键、表间连接关系及表与外部键连接关系;
将所述表、所述字段、所述外部键均作为节点,将所述表与字段连接关系、所述表间连接关系、所述表与外部键连接关系作为连接不同节点的边,以生成用于描述数据库逻辑关系的图结构。
2.根据权利要求1所述的数据库逻辑关系的图结构生成方法,其特征在于,
所述历史查询语句为存在表间连接关系的结构化查询语句。
3.一种数据查询方法,其特征在于,包括:
对用于数据查询的自然语言文本进行编码,以形成第一编码结果;
获取图结构中与所述自然语言文本相关程度最高的子图部分;其中,所述图结构为所述权利要求1或2中的用于描述数据库逻辑关系的图结构;
对所述子图部分进行编码,以形成第二编码结果;
将所述第一编码结果和所述第二编码结果进行堆叠,以形成最终编码结果;
对所述最终编码结果进行解码,以得到关键词及与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系;
根据解码得到的与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系生成完整的结构化查询语句;
利用所述完整的结构化查询语句从数据库中查询数据结果。
4.根据权利要求3所述的数据查询方法,其特征在于,还包括:
接收用户通过可交互式界面输入的自然语言文本;
对所述自然语言文本进行编码的同时存储所述自然语言文本。
5.根据权利要求4所述的数据查询方法,其特征在于,还包括:
将查询得到的数据结果通过所述可交互式界面输出,以及在输出所述数据结果的同时存储所述数据结果和所述完整的结构化查询语句。
6.根据权利要求3-5中任一权利要求所述的数据查询方法,其特征在于,
基于带有注意力机制的双向循环神经网络对所述自然语言文本进行编码;
基于使用门限机制的图神经网络对所述子图部分进行编码;
基于带有注意力机制的双向循环神经网络对所述最终编码结果进行解码。
7.根据权利要求3-5中任一权利要求所述的数据查询方法,其特征在于,
生成完整的结构化查询语句的过程包括:
将与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系置入预设的简化模板中;
依据所述简化模板生成所述完整的结构化查询语句。
8.一种数据库逻辑关系的图结构生成装置,其特征在于,包括:
数据遍历模块,用于通过遍历数据库中的所有表的方式得到各个表的字段,以及得到表与字段连接关系;
数据提取模块,用于收集已执行过的历史查询语句以及提取所述历史查询语句中的外部键、表间连接关系及表与外部键连接关系;
关系生成模块,用于将所述表、所述字段、所述外部键均作为节点且将所述表与字段连接关系、所述表间连接关系、所述表与外部键连接关系作为连接不同节点的边,生成用于描述数据库逻辑关系的图结构。
9.一种数据查询装置,其特征在于,
第一编码模块,用于对用于数据查询的自然语言文本进行编码,以形成第一编码结果;
子图获取模块,用于获取图结构中与所述自然语言文本相关程度最高的子图部分;其中,所述图结构为权利要求8的图结构生成装置生成的用于描述数据库逻辑关系的图结构;
第二编码模块,用于对所述子图部分进行编码,以形成第二编码结果;
堆叠模块,用于将所述第一编码结果和所述第二编码结果进行堆叠,以形成最终编码结果;
解码模块,用于对所述最终编码结果进行解码,以得到关键词及与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系;
语句生成模块,用于根据解码得到的与所述关键词对应的表、字段、外部键、表与字段连接关系、表间连接关系、表与外部键连接关系生成完整的结构化查询语句;
查询模块,用于利用所述完整的结构化查询语句从数据库中查询数据结果。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,以实现如权利要求1或2所述的生成方法,或实现权利要求3-7中任一项所述的查询方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010687140.6A CN111831626A (zh) | 2020-07-16 | 2020-07-16 | 数据库逻辑关系的图结构生成方法、数据查询方法及装置 |
PCT/CN2020/118913 WO2021139270A1 (zh) | 2020-07-16 | 2020-09-29 | 数据库逻辑关系的图结构生成方法、数据查询方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010687140.6A CN111831626A (zh) | 2020-07-16 | 2020-07-16 | 数据库逻辑关系的图结构生成方法、数据查询方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111831626A true CN111831626A (zh) | 2020-10-27 |
Family
ID=72923051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010687140.6A Pending CN111831626A (zh) | 2020-07-16 | 2020-07-16 | 数据库逻辑关系的图结构生成方法、数据查询方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111831626A (zh) |
WO (1) | WO2021139270A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112447300A (zh) * | 2020-11-27 | 2021-03-05 | 平安科技(深圳)有限公司 | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 |
CN113177123A (zh) * | 2021-04-29 | 2021-07-27 | 思必驰科技股份有限公司 | 文本转sql模型的优化方法及系统 |
CN117370361A (zh) * | 2023-12-08 | 2024-01-09 | 朴道征信有限公司 | 数据表操作方法、装置、电子设备和计算机可读介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115081437B (zh) * | 2022-07-20 | 2022-12-09 | 中国电子科技集团公司第三十研究所 | 基于语言学特征对比学习的机器生成文本检测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947794A (zh) * | 2019-02-21 | 2019-06-28 | 东华大学 | 一种交互式自然语言查询转换方法 |
CN110399533A (zh) * | 2019-07-29 | 2019-11-01 | 中国工商银行股份有限公司 | 资金流向查询方法及装置 |
CN110807335A (zh) * | 2019-09-02 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 基于机器学习的翻译方法、装置、设备及存储介质 |
CN111159330A (zh) * | 2018-11-06 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 一种数据库查询语句的生成方法及装置 |
CN111274267A (zh) * | 2019-12-31 | 2020-06-12 | 杭州量之智能科技有限公司 | 一种数据库查询方法、装置及计算机可读取存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8027970B1 (en) * | 2006-12-22 | 2011-09-27 | Emc Corporation | Query translation for searching complex structures of objects |
-
2020
- 2020-07-16 CN CN202010687140.6A patent/CN111831626A/zh active Pending
- 2020-09-29 WO PCT/CN2020/118913 patent/WO2021139270A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159330A (zh) * | 2018-11-06 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 一种数据库查询语句的生成方法及装置 |
CN109947794A (zh) * | 2019-02-21 | 2019-06-28 | 东华大学 | 一种交互式自然语言查询转换方法 |
CN110399533A (zh) * | 2019-07-29 | 2019-11-01 | 中国工商银行股份有限公司 | 资金流向查询方法及装置 |
CN110807335A (zh) * | 2019-09-02 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 基于机器学习的翻译方法、装置、设备及存储介质 |
CN111274267A (zh) * | 2019-12-31 | 2020-06-12 | 杭州量之智能科技有限公司 | 一种数据库查询方法、装置及计算机可读取存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112447300A (zh) * | 2020-11-27 | 2021-03-05 | 平安科技(深圳)有限公司 | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 |
WO2021213160A1 (zh) * | 2020-11-27 | 2021-10-28 | 平安科技(深圳)有限公司 | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 |
CN112447300B (zh) * | 2020-11-27 | 2024-02-09 | 平安科技(深圳)有限公司 | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 |
CN113177123A (zh) * | 2021-04-29 | 2021-07-27 | 思必驰科技股份有限公司 | 文本转sql模型的优化方法及系统 |
CN113177123B (zh) * | 2021-04-29 | 2023-11-17 | 思必驰科技股份有限公司 | 文本转sql模型的优化方法及系统 |
CN117370361A (zh) * | 2023-12-08 | 2024-01-09 | 朴道征信有限公司 | 数据表操作方法、装置、电子设备和计算机可读介质 |
CN117370361B (zh) * | 2023-12-08 | 2024-03-08 | 朴道征信有限公司 | 数据表操作方法、装置、电子设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021139270A1 (zh) | 2021-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111831626A (zh) | 数据库逻辑关系的图结构生成方法、数据查询方法及装置 | |
CN109284363B (zh) | 一种问答方法、装置、电子设备及存储介质 | |
US11995073B2 (en) | One-shot learning for text-to-SQL | |
CN108959433B (zh) | 一种从软件项目数据中提取知识图谱并问答的方法与系统 | |
US11789945B2 (en) | Clause-wise text-to-SQL generation | |
KR20180041200A (ko) | 정보 처리 방법 및 장치 | |
CN111930906A (zh) | 基于语义块的知识图谱问答方法及装置 | |
CN110427471B (zh) | 一种基于知识图谱的自然语言问答方法及系统 | |
CN112925563B (zh) | 一种面向代码重用的源代码推荐方法 | |
CN104469029A (zh) | 通过语音进行查号的方法及装置 | |
CN108008947B (zh) | 一种编程语句的智能提示方法、装置、服务器及存储介质 | |
CN112835920B (zh) | 基于混合存储模式的分布式sparql查询优化方法 | |
CN112925889B (zh) | 自然语言处理方法、装置、电子设备和存储介质 | |
CN115292347A (zh) | 一种基于规则的主动式sql算法性能检查装置及方法 | |
CN111783465B (zh) | 一种命名实体归一化方法、系统及相关装置 | |
CN113886420A (zh) | Sql语句的生成方法、装置、电子设备及存储介质 | |
CN114036268A (zh) | 基于意图门的任务型多轮对话方法及系统 | |
CN112948419A (zh) | 查询语句处理方法及装置 | |
CN115879441B (zh) | 文本新颖性检测方法、装置、电子设备及可读存储介质 | |
CN111737282B (zh) | 服务端接受参数进行组织数据库查询条件的方法及其系统 | |
CN117827886B (zh) | 一种基于大语言模型的自然语句转sql语句的方法 | |
CN118210809A (zh) | 一种基于er信息的对象定义方法、系统、设备以及介质 | |
CN117851445A (zh) | 一种大语言模型Text2SQL图表生成方法及装置 | |
CN118228824A (zh) | 知识问答方法、装置、电子设备和存储介质 | |
Nurhadi et al. | Complex SQL-NoSQL Query Translation for Data Lake Management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |