CN111538818A

CN111538818A - 数据查询方法、装置、电子设备及存储介质

Info

Publication number: CN111538818A
Application number: CN202010224981.3A
Authority: CN
Inventors: 张�成; 胡文泽; 王孝宇
Original assignee: Shenzhen Intellifusion Technologies Co Ltd
Current assignee: Shenzhen Intellifusion Technologies Co Ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2020-08-14
Anticipated expiration: 2040-03-26
Also published as: CN111538818B

Abstract

本发明实施例提供一种数据查询方法、装置、电子设备及存储介质，所述方法包括：获取待查询自然语言的文本信息；将所述文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对；将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息；将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对；将所述第一预测槽值对与所述第二预测槽值对形成查询槽值对列表；将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令；基于所述数据库查询命令进行数据查询，并返回对应的查询结果。降低了数据库查询的难度。

Description

数据查询方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种数据查询方法、装置、电子设备及存储介质。

背景技术

在数据库查询技术中，数据库用户通过构建固定模式的查询语句，在数据库中进行数据查询，以得到对应查询语句的数据。然而，由于数据库查询策略的设定以及查询语句的固定化，对于不熟悉数据库的用户而言，无法清楚的短简该数据库的查询策略以及查询语句，使得数据库的查询具有一定的难度，需要进行一定程度的培训，这无疑加大了数据库的使用难度。因此，现有的数据库存在使用难度较高的问题。

发明内容

本发明实施例提供一种数据查询识别方法，能够降低数据库的使用难度。

第一方面，本发明实施例提供一种数据查询方法，包括：

获取待查询自然语言的文本信息；

将所述文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对，所述第一预测槽值对包括数据库槽值对；

将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息；

将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，所述第二预测槽值对包括条件子句槽值、条件判断槽值以及条件子句位置槽值；

将所述第一预测槽值对与所述第二预测槽值对形成查询槽值对列表；

将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令；

基于所述数据库查询命令进行数据查询，并返回对应的查询结果。

第二方面，本发明实施例提供一种数据查询装置，包括：

获取模块，用于获取待查询自然语言的文本信息；

第一预测模块，用于将所述文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对，所述第一预测槽值对包括数据库槽值对；

第一查询模块，用于将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息；

第二预测模块，用于将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，所述第二预测槽值对包括条件子句槽值、条件判断槽值以及条件子句位置槽值；

列表模块，用于将所述第一预测槽值对与所述第二预测槽值对形成查询槽值对列表；

第二查询模块，用于将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令；

第三查询模块，用于基于所述数据库查询命令进行数据查询，并返回对应的查询结果。

第三方面，本发明实施例提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明实施例提供的数据查询方法中的步骤。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现发明实施例提供的数据查询方法中的步骤。

本发明实施例中，获取待查询自然语言的文本信息；将所述文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对，所述第一预测槽值对包括数据库槽值对以及属性槽值对；将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息；将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，所述第二预测槽值对包括条件子句槽值对、条件判断槽值对以及条件子句位置槽值对；将所述第一预测槽值对与所述第二预测槽值对形成查询槽值对列表；将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令；基于所述数据库查询命令进行数据查询，并返回对应的查询结果。通过对自然语言的文本信息进行预测，得到第一预测槽值用于确定目标数据库，使得到第二槽值对的预测更为准确，且不需要用户主动输入对应的目标数据库信息，使得到数据库可以通过自然语言进行更好的查询，用户不必清楚知道数据库的查询策略以及查询语句，就可以对数据库进行查询，降低了数据库查询的难度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种数据查询方法的流程图；

图2是本发明实施例提供的一种第一预测网络的结构示意图；

图3是本发明实施例提供的一种第二预测网络的结构示意图；

图4是本发明实施例提供的另一种数据查询方法的流程图；

图5是本发明实施例提供的另一种数据查询方法的流程图；

图6是本发明实施例提供的一种数据查询装置的结构示意图；

图7是本发明实施例提供的一种第一查询模块的结构示意图；

图8是本发明实施例提供的一种第二预测模块的结构示意图；

图9是本发明实施例提供的另一种第二预测模块的结构示意图；

图10是本发明实施例提供的一种获取模块的结构示意图；

图11是本发明实施例提供的另一种获取模块的结构示意图；

图12是本发明实施例提供的另一种数据查询装置的结构示意图；

图13是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，图1是本发明实施例提供的一种数据查询方法的流程图，如图1所示，包括以下步骤：

101、获取待查询自然语言的文本信息。

其中，上述的自然语言可以是用户语音或用户上传的图像，上述的文本信息指的是将上述自然语言通过自然语言识别算法转换得到的文本信息。比如，通过语音识别算法对用户语音进行识别，以得到用户语音对应的文本信息，通过图像语义识别算法对用户上传的图像进行语义识别，得到用户上传的图像对应的文本信息等。当然，上述的自然语言的文本信息还可以是用户输入的字符文本信息。

上述的文本信息可以包括整型数字、浮点型数字、中文、英文等字符信息。

可选的，可以对上述的文本信息进行预处理，以使上述的文本信息符合处理要求。

在一种具体的预处理方式中：首先，获取用户输入的自然语言；其次，将用户输入的自然语言转换为第一文本信息；然后，检测该第一文本信息中是否存在可查询语句；若该第一文本信息中存在可查询语句，则将该第一文本信息作为待查询自然语言的文本信息。这样可以避免在用户没有查询意图的时候也进行查询。可选的，可以设置唤醒词，当用户需要进行查询时，则通过唤醒词唤醒查询系统，在唤醒查询系统后，用户再输入待查询自然语言。

在另一种具体的预处理方式中：获取用户输入的自然语言；将用户输入的自然语言转换为第一文本信息；判断该第一文本信息的长度是否大于预设的文本长度；若该第一文本信息的长度大于上述预设的文本长度，则在该第一文本信息中选取一段第二文本信息作为待查询自然语言的文本信息，该第二文本信息的文本长度等于上述预设的文本长度；若该第一文本信息的长度小于上述预设的文本长度，则对该第一文本信息进行填充，得到第三文本信息作为待查询自然语言的文本信息，该第三文本信息的文本长度等于上述预设的文本长度。

需要理解的是，上述的第二文本信息可以取第一文本信息的前段部分或后段部分，也可以是中间部分。上述的第三文本所填充的内容为空值编码(none)，这样，在预测的过程中，会将其预测为空，不会作为有效条件子句进行查询。

上述预设的文本长度可以根据训练语料进行确定，上述的训练语料可以通过用户进行收集获取，也可以使用数据库中所使用过的条件子句，并根据文本生成器生成对应的训练语料。需要说明的是，上述预设的文本长度至少应满足90％至99％的训练语料长度，具体数值可以根据情况进行选取，比如，99％训练语料的字符不超过50个字符，则预设的文本长度可以为50个字符。这样，通过预设的文本长度的训练语料来进行训练，可以提高预测网络的兼容性。

假设文本信息为：有多少图片中的行人是穿着红色衣服，戴着太阳眼镜，拖着行李箱，年龄在40岁以上的中年男性。对文本长度的填充可以如表1所示：

编码	0	1	2	3	4	5	6	7	8	9
											question	有	多	少	图	片	中	的	行	人	是
编码	10	11	12	13	14	15	16	17	18	19
											question	穿	着	红	色	衣	服	，	戴	着	太
编码	20	21	22	23	24	25	26	27	28	29
											question	阳	眼	镜	，	拖	着	行	李	箱	，
编码	30	31	32	33	34	35	36	37	38	39
											question	年	龄	在	40	岁	以	上	的	中	年
编码	40	41	42	43	44	45	46	47	48	49
											question	男	性	。	None	None	None	None	None	None	None

表1

102、将文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对。

其中，上述第一预测槽值对包括数据库槽值对。上述第一预测网络预测出的数据库槽值对用于表示该文本信息应该在哪个数据库中进行查询。

上述的第一预测网络为分类网络模型，具体的，由于第一预测网络只对数据库的选取进行预测，所以第一预测网络是一个单任务网络模型，可以通过交叉熵损失对第一预测网络进行训练，交叉熵损失函数如下：

其中，式中y_i为训练时的预测值，

为训练时的标签值。

第一预测网络的网络结构如图2所示，包括：BERT双向翻译编码网络、BI-LSTM双向长短时记忆网络、以及三个FC全连接层，其最后一个全连接层为softmax分类全连接，用于分类输出第一预测槽值对。

103、将第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息。

在该步骤中，上述的第一查询字典中包括数据库编码以及对应的类型或属性信息。需要说明的是，上述的数据库槽值对所对应的数据库也可以是数据表的形式。

上述的数据库可以根据数据库类型进行分类，也可以根据数据库运营商进行分类。其中，作为内部自用的数据库，则可以根据数据库类型进行分类，比如，将数据库分类为图片数据库、文本数据库、视频数据库等，分别对应一个编码作为数据库ID。而作为外部接入的商用数据库，比如电商网站、视频网站、社交网站等对接的数据库分别对应一个编码作为数据库ID。

上述数据库槽值对包括数据库槽名以及数据库槽值。上述的数据库槽名用于表示该槽值对为数据库预测，上述的数据库槽值为具体预测到的值，可以是数据库编码(即数据库ID)。

上述的第一查询字典中预先设置有与数据库槽值对以及与属性槽值对相对应的映射关系，第一查询字典如表2所示：

编码(ID)	0	1	2
				数据库名(data)	视频	文本	图像

表2

在表2中，上述的数据库槽名为数据库，上述的数据库槽值为编码，即0、1、2，分别对应图像、文本、视频类型的数据库。

数据库槽值对的表示形式如表3所示：

槽名	槽值
		data	2

表3

在表3中，上述的槽名表示预测目标为数据库，上述的槽值表示预测得到的目标数据库为表2中的图片数据库(数据库ID或数据库编码为2)。

进一步的，在只对图片进行查询时，无需对数据库的类型进行选取时，上述的数据库可以根据属性进行分类，此时，第一查询字典如表4所示：

表4

在表4中，上述的数据库槽名为数据表，上述的数据库槽值为编码，即0、1、2、3、4，分别对应人脸、车辆、人员、动物、花等属性的数据库。

此时，数据库槽值对的表示形式可以如表5所示：

槽	槽值
		table	2

表5

在表5中，上述的槽名表示预测目标为数据库，上述的槽值表示预测得到的目标数据库为表4中的人员数据库(数据库ID或数据库编码为2)。

在一种可能的实施例中，上述的第一预测槽值对可以同时包括第一数据库槽值对以及第二数据库槽值对，第一数据库槽值对可以用于预测数据库类型，第二数据库槽值对可以用于预测数据库属性，结合上述的表2和表4作为第一查询字典，第一预测槽值对可以如表6所示：

槽名	槽值
		data	2
table	2

表6

在表6中，根据表2及表4，第一预测槽值对所表示的意思为，预测得到的目标数据库为图片数据库中人员数据表。

104、将目标数据库信息与文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对。

其中，上述第二预测槽值对包括条件子句槽值、条件判断槽值以及条件子句位置槽值。

上述的条件子句槽值用于表示该条件子句所对应的数据库查询子句，比如，在文本信息“有多少图片中的行人是穿着红色衣服，戴着太阳眼镜，拖着行李箱，年龄在40岁以上的中年男性。”中，条件子句为红色衣服、太阳眼镜、行李箱、年龄、性别等5个，条件子句也可以理解为数据库的查询关键词。

上述的条件判断槽值用于表示对应条件子句的查询条件，条件判断槽名可以是判断条件，条件判断槽值对应于各个判断符号的编码，判断符号比如非数值类型的“＝＝”，以及数值类型的“＝＝”、“>”、“<”、“＝>”、“＝<”等。比如，在上述文本信息例子中，红色衣服的查询表达为：上衣颜色(衣服所对应的条件子句槽名)＝＝红(条件子句槽值)。

上述的条件子句位置槽值用于表示，在条件子句中，条件子句槽值在文本信息中的位置，比如，上衣颜色(衣服所对应的条件子句槽名)＝＝红(条件子句槽值)中，结合表1，“红”在文本信息中的位置为编码“12”，也就是第十三个字符。

结合以上，以上衣颜色为例，第二预测槽值对的表达如表7所示：

槽名	槽值
		上衣颜色	红
条件判断	＝＝
		槽值位置	12

表7

在表7中，表示上衣颜色为文本信息中的编码为12的字符。

进一步的，第二预测网络的结构如图3所示，第二预测网络的输入为第一预测网络的输入以及文本信息，第二预测网络包括：BERT双向翻译编码网络、双向长短时记忆网络以及注意力机制，其中，BERT双向翻译编码网络将第一预测槽值对以及文本信息编码到向量空间，双向长短时记忆网络则提供时序依赖，注意力机制则分配不同的注意力参数，以使第二预测网络在当前步可以得到更为关注的参数作为依赖。最后通过分类器进行分类，得到第二预测槽值对。

需要说明的是，在训练时，第二预测网络的损失函数与第一预测网络的损失函数可以是相同的交叉熵损失函数，但由于第二预测槽值对为多个，所以第二预测网络为多任务分类的模型，在训练过程中，其损失为各个槽值对任务的交叉熵损失之和。

进一步的，在预测得到当前条件子句对应的条件子句槽值后，根据该条件子句槽值判断当前条件子句的类型为数值型或非数值型；若当前条件子句的类型为非数值型，则为当前条件子句所对应的条件判断槽值进行赋值，得到与当前条件子句对应的条件判断槽值；若当前条件子句的类型为数值型，则对条件判断槽值进行预测，得到与当前条件子句对应的条件判断槽值；预测当前条件子句在文本信息中的位置信息，得到当前条件子句对应的条件子句位置槽值。其中，上述的条件子句位置槽值包括起始位置槽值，终止位置槽值。

举例来说，预测得到当前条件子句为“红色衣服”，该条件子句的类型为非数值型，则可以直接对条件判断槽值进行赋值“＝＝”。若预测得到当前条件子句为“年龄在40岁”时，该条件子句的类型为数据型，需要预测条件判断槽值为“＝＝”、“>”、“<”、“＝>”、“＝<”的其中一个。

105、将第一预测槽值对与第二预测槽值对形成查询槽值对列表。

在该步骤中，将第一预测槽值对与第二预测槽值对聚合查询槽值对列表，可以得到具体的查询条件。上述的查询槽值对列表可以如表8所示：

槽名	槽值
		data	2
table	2
		上衣颜色	红
条件判断	＝＝
		槽值位置	12

表8

在表8中，可以通过查询槽值对列表直观的展现第一预测网络与第二预测网络的预测结果。

106、将查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令。

在该步骤中，上述第二查询字典与条件子句槽名具有映射关系，可以根据预测出的条件子句槽名，查找到第二查询字典。

在一种可能的实施例中，也可以通过目标数据库信息来查找到第二查询字典。在该可能的实施例中，每个数据库都预先存储有对应的第二查询字典。需要说明的是，第二查询字典可以理解为第一查询字典的下级分类字典。比如，通过第一查询字典得到的目标数据库为人员数据表时，则会自动找到对应的第二查询字典，此时，该第二查询字典中包括人员属性类别以及对应的属性类别编码。

上述的第二查询字典包括查询子句以及与查询子句对应属性类别编码，第二查询字典可以如表9所示：

表9

表9中，属性header为属性表头，用于表示对应查询子句，属性types用于表示该属性表头的上一级属性，比如行李箱、与手推车都属于cart(载物工具)，类别编码则是与条件子句槽值对应的信息。比如，条件子句槽值为12，则表示预测得到眼镜属性，说明用户想要查询带有眼镜的人员。

可选的，在将查询槽值对列表进行映射转换时，删除查询槽值对列表中具有空槽值的条件子句槽值对，或者忽略具有空槽值的条件子句槽值对。这样，由于剔除了包含空槽值的条件子句，所以如果多条件子句的查询语句进行预测存在部分条件子句预测错误，则系统只会根据正确的条件子句执行查询操作。结果会较预测正确时模糊(范围变大，但不会查询错误)，但也能得到查询结果。

在一种可能的实施例中，第二预测槽值对还包括条件子句槽名，条件子句槽名与第二查询字典存在映射关系，预测得到当前条件子句对应的条件子句槽时，判断当前条件子句槽值是否为第二查询字典中的查询条件值；若当前条件子句槽值不为第二查询字典的查询条件值，则将当前条件子句本槽值赋值为空槽值。

可选的，若当前条件子句槽值不为第二查询字典的查询条件值，可以先判断第二查询字典中每个查询子句对应的编码是否被包含于预测得到的条件子句槽值中，如果存在某个编码被包含在预测得到的条件子句槽值中，则条件子句槽值赋值为该编码，否则赋值为空槽值。

在后续步骤中，可以删除条件子句槽值为空槽值的第二预测槽值对后，再将条件子句槽值对通过预先设置的第二查询字典进行映射转换，得到条件子句对应的查询命令。即空槽值不参与查询，避免查询错误。

举例来说，假设文本信息为“有多少图片中的行人是穿着红色衣服，戴着太阳眼镜，拖着行李箱，年龄在40岁以上的中年男性。”，在经过上述步骤后，得到查询槽值对列表如表10所示：

表10

在表10中，上述的conds_1、conds_2、conds_3、conds_4、conds_5分别表示5个第二预测槽值对。

结合上述的表4，Table为数据库槽名，2为数据库槽值，表示目标数据库为编码2的人员数据库。

结合上述的表9，Sel为需要查询的属性类别槽名，0为属性类别槽值，表示需要查询的是图片ID。

Agg(聚合)比如：COUNT(计数)、SUM(求和)、MAX(最大值)、MIN(最小值)、AVG(求平均)等，具体如表11所示：

agg	代表意义
		0	无聚合操作
1	MAX
		2	MIN
3	COUNT
		4	SUM
5	AVG

表11

结合表10与表11，Agg为聚合方式槽名，3为聚合方式槽值，表示需要查询的是图片ID的数量，即文本信息中的“有多少图片”。

表10中，where_num(条件子句数量)为条件子句数量槽名，5为条件子句数量槽值，表示文本信息预测出5个条件子句。

第二预测槽值对还包括预测槽名，其中，表10中的conds_N为预测槽名，表示第N个条件子句，conds_1为第一个条件子句的预测槽名，对应的槽值为(6,0,12,12)，其中，6为条件子句槽值，0为条件判断槽值，12，12为条件子句位置槽值。即第二预测槽值对的表达为槽名－槽值(条件子句槽值，条件判断槽值，起始位置槽值，终止位置槽值)。

其中，数据库中条件判断槽值与代表意义可以如表12所示：

表12

结合表1、表9、表10与表12，conds_1－(6,0,12,12)表示第一个条件子句为衣服，其对应查询子句为“上衣颜色”，条件判断为“＝＝”，在文本信息中的位置为“12”，映射转换的查询命令为：上衣颜色＝＝红。

同理，结合表1、表9、表10与表12，conds_2－(12,0,19,22)表示第二个条件子句为太阳眼镜，其对应查询子句为“眼镜”，条件判断为“＝＝”，在文本信息中的位置为“19至22”，映射转换的查询命令为：眼镜＝＝太阳眼镜。

结合表1、表9、表10与表12，conds_3－(17,0,26,28)表示第三个条件子句为行李箱，其对应查询子句为“行李箱”，条件判断为“＝＝”，在文本信息中的位置为“26至28”，映射转换的查询命令为：行李箱＝＝行李箱。

结合表1、表9、表10与表12，conds_4－(1,1,33,33)表示第四个条件子句为年龄，其对应查询子句为“年龄”，条件判断为“>”，在文本信息中的位置为“33”，映射转换的查询命令为：年龄>40。

结合表1、表9、表10与表12，conds_5－(3,0,40,40)表示第五个条件子句为男性，其对应查询子句为“性别”，条件判断为“＝＝”，在文本信息中的位置为“40”，映射转换的查询命令为：性别＝＝男。

映射转换后，第二预测槽值对所得到查询命令为：

查询命令：上衣颜色＝＝红AND眼镜＝＝太阳眼镜AND行李箱＝＝行李箱AND年龄>40AND性别＝＝男。

进一步，基于查询槽值对列表所得到的数据库查询命令为：

SELECT COUNT(picture id)FROM person WHERE上衣颜色＝＝红AND眼镜＝＝太阳眼镜AND行李箱＝＝行李箱AND年龄>40AND性别＝＝男。

其中，“SELECT”，“FROM”，“WHERE”，“AND”为SQL数据库查询命令中固有的组成部分。

107、基于数据库查询命令进行数据查询，并返回对应的查询结果。

在经过上述的步骤101至步骤106，已经将用户的自然语言转换为目标数据库的数据库查询命令，根据该数据库查询命令，可以在目标数据库中进行查询。

在本发明实施例中，获取待查询自然语言的文本信息；将所述文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对，所述第一预测槽值对包括数据库槽值对以及属性槽值对；将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息；将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，所述第二预测槽值对包括条件子句槽值对、条件判断槽值对以及条件子句位置槽值对；将所述第一预测槽值对与所述第二预测槽值对形成查询槽值对列表；将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令；基于所述数据库查询命令进行数据查询，并返回对应的查询结果。通过对自然语言的文本信息进行预测，得到第一预测槽值用于确定目标数据库，使得到第二槽值对的预测更为准确，且不需要用户主动输入对应的目标数据库信息，使得到数据库可以通过自然语言进行更好的查询，用户不必清楚知道数据库的查询策略以及查询语句，就可以对数据库进行查询，降低了数据库查询的难度。

需要说明的是，本发明实施例提供的数据查询方法可以应用于需要进行数据查询的手机、计算机、服务器等设备。

请参见图4，图4是本发明实施例提供的另一种数据查询方法的流程图，如图4所示，包括：

401、语音采集设备获取用户音频。

在该步骤中，当用户需要进行数据查询时，可以唤醒用于采集用户音频的语音采集设备，以对用户音频进行采集，上述的用户音频作为待查询自然语言。

402、语音识别模块将语音转换成文字，得到第一文本。

在获取到用户音频后，将用户音频发送到语音识别模块中对该用户音频转换为文字文本，得到第一文本。上述的语音识别模块可以是本地的语音识别模块，也可以是云服务器上的语音识别模块。

上述的第一文本信息可以包括整型数字、浮点型数字、中文、英文等字符信息。

403、对第一文本进行文本语义分析。

在该步骤中，可以先对第一文本进行分词，将分词后的第一文本通过语言模型进行语义预测，得到第一文本的语义分析结果。其中，上述对第一文本进行分词可以采用网络上开源的分词工具，上述的语言模型中编码有查询关键词或查询语义的词典，以使对第一文本的文本语义分析能够分析到用户是否存在查询意图。若语义预测过程中，在词典中匹配到查询关键词或查询语义，则可以认为第一文本中存在查询意向。上述的查询关键词可以是“请”、“帮”、“查找”、“找到”、“想找”等查询关键词，上述查询语义可以是可查询语句，比如“照片”、“衣服”、“眼镜”、“年龄”等具有查询意义的可查询语句。

404、根据文本语义，判断第一文本是否存在查询意向。

若存在查询意向，则转入步骤405；若不存在查询意向，则返回开始，或对用户进行提示。

405、通过数据库预测模型对第一文本进行预测，得到第一预测槽值对。

在该步骤中，通过第一预测网络对第一文本进行预测，上述第一预测槽值对包括数据库槽值对。上述第一预测网络预测出的数据库槽值对用于表示该文本信息应该在哪个数据库中进行查询。

上述的第一预测网络为分类网络模型，第一预测网络的网络结构如图2所示，具体的，由于第一预测网络只对数据库的选取进行预测，所以第一预测网络是一个单任务网络模型，可以通过交叉熵损失对第一预测网络进行训练。

406、根据第一预测槽值对获取数据库表头信息和属性信息。

407、将第一文本、数据库表头信息和属性信息输入到NL2SQL预测模型中进行预测，得到第二预测槽值对。

在该步骤中，上述的NL2SQL预测模型也可以称为第二预测网络，第二预测网络的结构如图3所示。

上述的条件子句槽值用于表示该条件子句所对应的数据库查询子句。

408、对第二预测槽值对进行后处理。

上述的后处理可以是删除槽值为空值的第二预测槽值对。

409、生成SQL数据库查询命令。

在该步骤中，可以将第一预测槽值对与第二预测槽值对形成查询槽值对列表。将查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令。

410、在目标数据库中查询，并返回查询结果。

需要说明的是，上述步骤401-410的具体实现可以结合图1实施例，并起到相似的技术效果，在此不另行赘述。

请参见图5，图5是本发明实施例提供的另一种数据查询方法的流程图，如图5所示，包括：

501、获取待查询图像。

在该步骤中，用户可以通过电子设备上传待查询图像，上述的待查询图像可以是人脸图像、物品图像、风景图像等。

502、将图像语义换成文字，得到第一文本。

在获取到待查询图像，将待查询图像发送到图像语义生成模块中将该待查询图像转换为文字文本，得到第一文本。上述的图像语义生成模块可以是本地的图像语义生成模块，也可以是云服务器上的图像语义生成模块。

503、对第一文本进行文本语义分析。

504、根据文本语义，判断第一文本是否存在查询意向。

505、通过数据库预测模型对第一文本进行预测，得到第一预测槽值对。

506、根据第一预测槽值对获取数据库表头信息和属性信息。

507、将第一文本、数据库表头信息和属性信息输入到NL2SQL预测模型中进行预测，得到第二预测槽值对。

508、对第二预测槽值对进行后处理。

509、生成SQL数据库查询命令。

510、在目标数据库中查询，并返回查询结果。

需要说明的是，上述步骤501-510的具体实现可以结合图1实施例，并起到相似的技术效果，在此不另行赘述。

请参见图6，图6是本发明实施例提供的一种数据查询装置的结构示意图，如图6所示，包括：

获取模块601，用于获取待查询自然语言的文本信息；

第一预测模块602，用于将所述文本信息输入到预先训练好的第一预测网络中进行预测，得到第一预测槽值对，所述第一预测槽值对包括数据库槽值对；

第一查询模块603，用于将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息；

第二预测模块604，用于将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，所述第二预测槽值对包括条件子句槽值、条件判断槽值以及条件子句位置槽值；

列表模块605，用于将所述第一预测槽值对与所述第二预测槽值对形成查询槽值对列表；

第二查询模块606，用于将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令；

第三查询模块607，用于基于所述数据库查询命令进行数据查询，并返回对应的查询结果。

可选的，如图7所示，所述数据库槽值对包括数据库槽名以及数据库槽值，所述第一查询字典与所述数据库槽名具有映射关系，所述目标数据库信息包括数据库ID，所述第一查询模块603，包括：

查询子模块6031，用于根据所述数据库槽名，映射到预先设置的第一查询字典，通过所述第一查询字典映射得到与所述数据库槽值对应的数据库ID；

第一选取子模块6032，用于根据所述数据库ID，选取得到目标数据库。

可选的，如图8所示，所述第二预测模块604，包括：

第一判断子模块6041，用于在预测得到当前条件子句对应的条件子句槽值对后，根据所述条件子句槽值对判断所述当前条件子句的类型为数值型或非数值型；

第一赋值子模块6042，用于若所述当前条件子句的类型为非数值型，则为所述当前条件子句所对应的条件判断槽值进行赋值，得到与所述当前条件子句对应的条件判断槽值；

第一预测子模块6043，用于若所述当前条件子句的类型为数值型，则对所述条件判断槽值对进行预测，得到与所述当前条件子句对应的条件判断槽值；

第二预测子模块6044，用于预测当前条件子句在所述文本信息中的位置信息，得到当前条件子句对应的条件子句位置槽值。

可选的，如图9所示，所述第二预测模块604，包括：

第二判断子模块6045，用于预测得到当前条件子句对应的当前条件子句槽值时，判断所述当前条件子句槽值是否为第二查询字典中的查询条件值；

第二赋值子模块6046，用于若所述当前条件子句槽值不为所述第二查询字典的查询条件值，则将当前条件子句本槽值赋值为空槽值；

所述第二查询模块606还用于删除条件子句槽值为空槽值的条件子句槽值对后，将条件子句槽值对通过预先设置的第二查询字典进行映射转换，得到条件子句对应的查询命令。

可选的，如图10所示，所述获取模块601，包括：

第一获取子模块6011，用于获取用户输入的自然语言；

第一转换子模块6012，用于将所述用户输入的自然语言转换为第一文本信息；

检测子模块6013，用于检测所述第一文本信息中是否存在可查询语句；

确定子模块6014，用于若所述第一文本信息中存在可查询语句，则将所述第一文本信息作为待查询自然语言的文本信息。

可选的，如图11所示，所述获取模块601，包括：

第二获取子模块6015，用于获取用户输入的自然语言；

第二转换子模块6016，用于将所述用户输入的自然语言转换为第一文本信息；

第三判断子模块6017，用于判断所述第一文本信息的长度是否大于预设的文本长度；

第二选取子模块6018，用于若所述第一文本信息的长度大于所述预设的文本长度，则在所述第一文本信息中选取第二文本信息作为待查询自然语言的文本信息，所述第二文本信息的文本长度等于所述预设的文本长度；

填充子模块6019，用于若所述第一文本信息的长度小于所述预设的文本长度，则对所述第一文本信息进行填充，得到第三文本信息作为待查询自然语言的文本信息，所述第三文本信息的文本长度等于所述预设的文本长度。

可选的，如图12所示，在对所述第二预测网络进行训练时，所述装置还包括训练模块608，所述训练模块608包括：

填充模块6081，对于条件子句的数量不满足预设数量的样本，填充空属性条件子句到所述样本中，以使所述样本的条件子句数量达到预设数量，训练所述空属性条件子句预测得到的条件子句槽值对为空。

需要说明的是，本发明实施例提供的数据查询装置可以应用于需要进行进行数据查询的手机、计算机、服务器等设备。

本发明实施例提供的数据查询装置能够实现上述方法实施例中数据查询方法实现的各个过程，且可以达到相同的有益效果。为避免重复，这里不再赘述。

参见图13，图13是本发明实施例提供的一种电子设备的结构示意图，如图13所示，包括：存储器1302、处理器1301及存储在所述存储器1302上并可在所述处理器1301上运行的计算机程序，其中：

处理器1301用于调用存储器1302存储的计算机程序，执行如下步骤：

获取待查询自然语言的文本信息；

可选的，所述数据库槽值对包括数据库槽名以及数据库槽值，所述第一查询字典与所述数据库槽名具有映射关系，所述目标数据库信息包括数据库ID，处理器1301执行的所述将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息，包括：

根据所述数据库槽名，映射到预先设置的第一查询字典，通过所述第一查询字典映射得到与所述数据库槽值对应的数据库ID；

根据所述数据库ID，选取得到目标数据库。

可选的，处理器1301执行的所述将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，包括：

在预测得到当前条件子句对应的条件子句槽值对后，根据所述条件子句槽值对判断所述当前条件子句的类型为数值型或非数值型；

若所述当前条件子句的类型为非数值型，则为所述当前条件子句所对应的条件判断槽值进行赋值，得到与所述当前条件子句对应的条件判断槽值；

若所述当前条件子句的类型为数值型，则对所述条件判断槽值对进行预测，得到与所述当前条件子句对应的条件判断槽值；

预测当前条件子句在所述文本信息中的位置信息，得到当前条件子句对应的条件子句位置槽值。

可选的，处理器1301执行的所述将所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，包括：

预测得到当前条件子句对应的当前条件子句槽值时，判断所述当前条件子句槽值是否为第二查询字典中的查询条件值；

若所述当前条件子句槽值不为所述第二查询字典的查询条件值，则将当前条件子句本槽值赋值为空槽值；

所述将所述查询槽值对列表通过预先设置的第二查询字典进行映射转换，得到数据库查询命令，包括：

删除条件子句槽值为空槽值的条件子句槽值对后，将条件子句槽值对通过预先设置的第二查询字典进行映射转换，得到条件子句对应的查询命令。

可选的，处理器1301执行的所述获取待查询自然语言的文本信息，包括：

获取用户输入的自然语言；

将所述用户输入的自然语言转换为第一文本信息；

检测所述第一文本信息中是否存在可查询语句；

若所述第一文本信息中存在可查询语句，则将所述第一文本信息作为待查询自然语言的文本信息。

获取用户输入的自然语言；

将所述用户输入的自然语言转换为第一文本信息；

判断所述第一文本信息的长度是否大于预设的文本长度；

若所述第一文本信息的长度大于所述预设的文本长度，则在所述第一文本信息中选取第二文本信息作为待查询自然语言的文本信息，所述第二文本信息的文本长度等于所述预设的文本长度；

若所述第一文本信息的长度小于所述预设的文本长度，则对所述第一文本信息进行填充，得到第三文本信息作为待查询自然语言的文本信息，所述第三文本信息的文本长度等于所述预设的文本长度。

可选的，在对所述第二预测网络进行训练时，处理器1301执行还执行包括：

对于条件子句的数量不满足预设数量的样本，填充空属性条件子句到所述样本中，以使所述样本的条件子句数量达到预设数量，训练所述空属性条件子句预测得到的条件子句槽值对为空。

需要说明的是，上述电子设备可以是可以应用于需要进行数据查询的手机、计算机、服务器等设备。

本发明实施例提供的电子设备能够实现上述方法实施例中数据查询方法实现的各个过程，且可以达到相同的有益效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现本发明实施例提供的数据查询方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存取存储器(Random AccessMemory，简称RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种数据查询方法，其特征在于，包括以下步骤：

获取待查询自然语言的文本信息；

2.如权利要求1所述的方法，其特征在于，所述数据库槽值对包括数据库槽名以及数据库槽值，所述第一查询字典与所述数据库槽名具有映射关系，所述目标数据库信息包括数据库ID，所述将所述第一预测槽值根据预先设置的第一查询字典进行映射转换，得到目标数据库信息，包括：

根据所述数据库ID，选取得到目标数据库。

3.如权利要求1所述的方法，其特征在于，所述将所述目标数据库信息与所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，包括：

4.如权利要求1所述的方法，其特征在于，所述将所述文本信息输入到预先训练好的第二预测网络中进行预测，得到第二预测槽值对，包括：

5.如权利要求1所述的方法，其特征在于，所述获取待查询自然语言的文本信息，包括：

获取用户输入的自然语言；

将所述用户输入的自然语言转换为第一文本信息；

检测所述第一文本信息中是否存在可查询语句；

6.如权利要求1所述的方法，其特征在于，所述获取待查询自然语言的文本信息，包括：

获取用户输入的自然语言；

将所述用户输入的自然语言转换为第一文本信息；

判断所述第一文本信息的长度是否大于预设的文本长度；

7.如权利要求1－6中任一所述的方法，其特征在于，在对所述第二预测网络进行训练时，所述方法还包括：

8.一种数据查询装置，其特征在于，所述装置包括：

获取模块，用于获取待查询自然语言的文本信息；

9.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的数据查询方法中的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的数据查询方法中的步骤。