CN114265860A

CN114265860A - 执行语句的识别方法及装置

Info

Publication number: CN114265860A
Application number: CN202111585126.6A
Authority: CN
Inventors: 刘帝江
Original assignee: China Telecom Corp Ltd
Current assignee: China Telecom Corp Ltd
Priority date: 2021-12-22
Filing date: 2021-12-22
Publication date: 2022-04-01

Abstract

本申请公开了一种执行语句的识别方法及装置。其中，该方法包括：获取待预测执行语句；将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；比较执行时长与预设时长；依据比较结果确定待预测执行语句是否为目标执行语句。本申请解决了由于慢SQL语句会频繁地进行I/O操作进而长时间地占用CPU造成数据库故障的技术问题。

Description

执行语句的识别方法及装置

技术领域

本申请涉及互联网运维领域，具体而言，涉及一种执行语句的识别方法及装置。

背景技术

结构化查询语言(Structured Query Language，SQL)，是一种数据库查询和程序设计语言，是目前使用最广泛的关系型数据库操作语言。在数据库管理系统中，使用SQL语言来实现数据的存取、查询、更新等功能。SQL是一种非过程性语言，只需要提出“做什么”，而不需要指明“怎么做”。

慢SQL语句就是查询慢的SQL语句，是指MySQL记录所有执行超过long_query_time参数设定的时长阈值的SQL语句的日志。该日志能为SQL语句的优化带来很好的帮助。默认情况下，慢查询日志是关闭的，要使用慢查询日志功能，首先要开启慢查询日志功能。long_query_time的默认值是10，意思是运行10S之上的数据。

在实际的生产场景中，数据库SQL语句在适应不同业务或者不同使用者时产生了千变万化的种类，这其中部分会产生慢SQL现象，该现象可能会频繁地进行I/O操作进而长时间地占用CPU，成为产生数据库故障的诱因。

针对上述由于慢SQL语句会频繁地进行I/O操作进而长时间地占用CPU造成数据库故障的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种执行语句的识别方法及装置，以至少解决由于慢SQL语句会频繁地进行I/O操作进而长时间地占用CPU造成数据库故障的技术问题。

根据本申请实施例的一个方面，提供了一种执行语句的识别方法，包括：获取待预测执行语句；将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；比较执行时长与预设时长；依据比较结果确定待预测执行语句是否为目标执行语句。

可选地，将待预测执行语句输入至神经网络模型进行预测之前，所述方法还包括：获取多个历史执行语句的信息，其中，信息包括：多个历史执行语句和多个历史执行语句的执行时长；根据信息构造多个目标矩阵；将多个目标矩阵和多个历史执行语句的执行时长输入至神经网络模型进行训练，得到训练好的神经网络模型。

可选地，根据信息构造多个目标矩阵，包括：获取历史执行语句的执行计划信息，并将执行计划信息构造为第一矩阵；将历史执行语句转换为树形结构，并依据树形结构构造第二矩阵；将第一矩阵和第二矩阵合并为目标矩阵。

可选地，将历史执行语句转换为树形结构，并依据树形结构构造第二矩阵，包括：将历史执行语句转换为树形结构；按照前序遍历算法遍历树形结构，生成结果集；依据结果集构造第二矩阵。

可选地，将第一矩阵和第二矩阵合并为目标矩阵，包括：将第一矩阵进行转置处理，得到第三矩阵；将第二矩阵和第三矩阵进行拼接，得到目标矩阵。

可选地，将多个目标矩阵和多个历史执行语句的执行时长输入至神经网络模型进行训练，得到训练好的神经网络模型，包括：将多个目标矩阵按照预设比例进行随机组合，得到训练集和测试集；将训练集和测试集输入神经网络模型进行预测，得到训练好的神经网络模型。

可选地，依据比较结果确定待预测执行语句是否为目标执行语句，包括：在待预测执行语句的执行时长大于或等于预设时长的情况下，将待预测执行语句确定为目标执行语句；在待预测执行语句的执行时长小于预设时长的情况下，确定待预测执行语句不是目标执行语句。

根据本申请实施例的另一方面，还提供了一种执行语句的识别装置，包括：获取模块，用于获取待预测执行语句；预测模块，用于将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；比较模块，用于比较执行时长与预设时长；确定模块，用于依据比较结果确定待预测执行语句是否为目标执行语句。

根据本申请实施例的再一方面，还提供了一种非易失性存储介质，非易失性存储介质包括存储的程序，其中，在程序运行时控制非易失性存储介质所在设备执行以上的执行语句的识别方法。

根据本申请实施例的再一方面，还提供了一种处理器，处理器用于运行存储在存储器中的程序，其中，程序运行时执行以上的执行语句的识别方法。

在本申请实施例中，采用获取待预测执行语句；将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；比较执行时长与预设时长；依据比较结果确定待预测执行语句是否为目标执行语句的方式，通过构建神经网络模型来预测SQL语句的执行时长，达到了识别慢SQL语句的目的，从而实现了界定不同情况下的慢SQL场景、准确识别慢SQL场景、提升数据库的运维能力的技术效果，进而解决了由于慢SQL语句会频繁地进行I/O操作进而长时间地占用CPU造成数据库故障技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种用于实现执行语句的识别方法的计算机终端(或移动设备)的硬件结构框图；

图2是根据本申请实施例的一种执行语句的识别方法的流程图；

图3是根据本申请实施例的一种可选的神经网络模型的构建方法的示意图；

图4根据本申请实施例的一种可选的树形结构的示意图；

图5是根据本申请实施例的一种可选的神经网络模型的结构示意图；

图6是根据本申请实施例的一种执行语句的识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

现有的对慢SQL问题处理的主要方法是围绕系统中运行的慢SQL语句进行查找识别或运行后判定，这样存在以下问题：

1)需要使用数据库管理方法检索正在执行中的SQL语句，检索和判定过程花费较长时间，耗费人力和系统资源。

2)采用传统的语句识别需要一定量的慢SQL样本。

另一种方案虽然设计了慢SQL语句的识别方法，以及预测查询时间的方法，但依然存在以下不足：

1)该方案识别慢SQL的方式为根据历史已有的慢SQL语句，来计算当前语句和历史语句特征的相似度，这样需要已有的一定量历史慢SQL样本，如果样本过少会使结果不准确。

2)需要建立一个历史慢SQL库，建立该库已经意味着大量的慢SQL语句形成，代价是无形中也给数据库造成故障的几率提升。

3)历史慢SQL库中的慢SQL时间界定定义问题。例如历史慢SQL库中的慢SQL语句界限为执行时间超过10s，但如果有一定需求在该业务下想调整为判定超过5s为慢SQL，则慢SQL库出现不适用问题。

4)利用语句特征的相似度，存在一定情况下的误判。采用一般预测的编码方式，预测不够准确。例如SQL语句1解构为“查询A表条件B”，该SQL语句已知为一条慢SQL语句，待识别的语句为“查询A～表条件B”，这两条语句条件相同，查询方法相同，并且查询表名略相似，则相似度达到阈值，但如果仅仅是由于A表表设计结构的问题(例如无索引)，但B表表结构正常，则待识别语句可能不是一条慢SQL语句，这样造成了判定失误。

鉴于此，本发明提出了一种基于神经网络的利用组合编码方式的慢SQL语句预测方法，在预测前的编码方式上做了革新，来直接预测SQL语句的执行时间是否大于某限定值，大于则为慢SQL语句，小于则为否。本发明不需要大量慢SQL样本，并且从最直观的时间角度入手预测，更有效地提升了慢SQL预测的准确性；并且本发明相比传统的对比识别方法，有了一定的可扩展性，可以调整不同场景下的限定值重新界定不同情况下的慢SQL场景；本发明重点在于对于其他SQL类预测的技术中，采用了新型的组合编码方式。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现执行语句的识别方法的计算机终端(或移动设备)的硬件结构框图。如图1所示，计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b，……，102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的执行语句的识别方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

根据本申请实施例，提供了一种执行语句的识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图2是根据本申请实施例的一种执行语句的识别方法的流程图，如图2所示，该方法包括如下步骤：

步骤S202，获取待预测执行语句；

对于不同的待预测执行语句，可反复使用该编码方式来提供结果，用于提供神经网络的输入。

步骤S204，将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；

步骤S206，比较执行时长与预设时长；

步骤S208，依据比较结果确定待预测执行语句是否为目标执行语句。

通过上述步骤，通过构建神经网络模型来预测SQL语句的执行时长，达到了识别慢SQL语句的目的，从而实现了界定不同情况下的慢SQL场景、准确识别慢SQL场景、提升数据库的运维能力的技术效果。

根据本申请的一个可选的实施例，执行步骤S204将待预测执行语句输入至神经网络模型进行预测之前，所述方法还包括：获取多个历史执行语句的信息，其中，信息包括：多个历史执行语句和多个历史执行语句的执行时长；根据信息构造多个目标矩阵；将多个目标矩阵和多个历史执行语句的执行时长输入至神经网络模型进行训练，得到训练好的神经网络模型。

首先从数据库全量查询历史中获取历史执行语句的信息，包括历史执行语句及其执行时间。然后根据信息构造多个目标矩阵，将得到的最终矩阵作为输入，时间作为标签，可输入神经网络模型训练，得到训练好的神经网络模型。

将该矩阵用在神经网络的输入中，以时间为输出标签，所得到的预测效果好于其他编码方式，求出的时间精度更高，用于神经网络能够充分提取编码的特征，较为精准地预测SQL的执行时间。

根据本申请的另一个可选的实施例，根据信息构造多个目标矩阵，包括：获取历史执行语句的执行计划信息，并将执行计划信息构造为第一矩阵；将历史执行语句转换为树形结构，并依据树形结构构造第二矩阵；将第一矩阵和第二矩阵合并为目标矩阵。

可选地，执行计划信息即explain结果，第一矩阵为8*N矩阵，第二矩阵为M*8矩阵。Explain结果用于分析某条SQL语句的执行过程和执行效率，即执行计划信息。首先获取语句的explain结果，并构造8*N矩阵；然后将SQL语句转化为解析树，并构造M*8矩阵，最后合并两个矩阵，得到(M+N)*8矩阵，该步骤的示意图如图3所示。

从数据库历史查询记录中获取历史执行语句的explain结果及时间，例如：语句select offer_id from offer where offer_name＝‘作废’，查询时间为0.025s，该语句的explain结果如下表。

通过在数据库执行语句前增加explain关键字，得到explain结果。该结果反映了SQL语句执行的具体细节，结果为一个10列的表格，分别是id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra。将原始数据中执行语句构造为SQL解析数，例如语句：select offer_id from offer where offer_name＝‘作废’，其中select，from，where这些均为SQL中的关键词，offer是源表，offer_name，‘作废’这些为条件，offer_id为查询的列，则可构造为树，如图4所示。

矩阵的第一行为id的权重值的二进制结果，权重值计算方法为所有id值乘以id值对应的个数(表示为Cnt(id))，然后最终的和，即：

第二行为select_type编码结果，编码方式为one-hot位值对应，方式如下表：

第三行为type，编码方式类似select_type，见下表：

ALL	index	range	ref	eq_ref	const	system	NULL
								1
	1
									1
			1
										1
					1
											1
							1

第四行为possible_keys的种类个数的二进制结果，相同索引为一种；

第五行为键的种类总和，方法同第四行；

第六行为索引字节数之和的二进制结果，即(Sum(key_len))_B；

第七行为ref种类总和的二进制结果；

第八行为所有rows值的总和二进制结果。

经过以上步骤最终形成的矩阵为：

根据本申请的再一个可选的实施例，将历史执行语句转换为树形结构，并依据树形结构构造第二矩阵，包括：将历史执行语句转换为树形结构；按照前序遍历算法遍历树形结构，生成结果集；依据结果集构造第二矩阵。

SQL解析树即采用语法分析，把SQL语句解析为一颗语法树，然后再按照语法的转换规则把SQL语句转换到SqlServer上可执行的语句，实现不同数据库平台的转换。前序遍历算法即二叉树遍历的一种，首先访问根节点然后遍历左子树，最后遍历右子树。

将历史执行语句构造为SQL解析树，对该树进行前序遍历，遍历后按照指定位结果再构造为M*8矩阵。将SQL语句构造为SQL解析树，是数据库系统实现中SQL进行编译的一个步骤，这个步骤将SQL语句转换成一定结构的树，对该树进行前序遍历可生成一个结果集，再将该结果集以一定方式构建为M*8的矩阵，构建方式如下：

第一列取基础动作的操作类型指定位，例如query，create，delete等，操作类型和位数对应关系如下表：

query	create	update	delete
				1
	1
					1
			1

第二列为所有关键字个数的二进制，同一类不能合并为一个；

第三列为selList和的二进制结果；

第四列为fromList和的二进制结果；

第五列为用于条件判断的列名种类总和二进制结果；

第六列为用于条件判断的条件个数，例如大于、小于、等于的条件个数，同一类不能合并为一个；

第七列为用于条件的具体判断值的个数，例如where关键字后对列名的判断值；

第八列为结果集中所有元素的个数。

例如，将上述得到的树进行前序遍历，形成结果集：{query,select,selList:1,attribute,offer_id,from,fromList:1,relation,offer,where,equals,attribute,name,‘＝’，attribute_literal,’作废’}，然后矩阵的构建方式为：

第一列取结果集中基础动作的操作类型指定位，二进制结果作为首列，上例中query为1，操作类型和位数对应关系见下表：

query	create	update	delete
				1
	1
					1
			1

第二列为结果集中所有关键字个数的二进制，上述结果为select，from，where 3个；

第三列为结果集中selList和的二进制结果，上述为1；

第四列为结果集中fromList和的二进制结果，上述为1；

第五列为结果集中用于条件判断的列名种类总和二进制结果，仅有一个offer_name，所以为1；

第六列为结果集中用于条件判断的条件个数，例如大于，小于，等于的条件个数，同一类不能合并为一个，上述为‘＝’，所以为1；

第七列为结果集中用于条件的具体判断值的个数，例如where关键字后对列名的判断值，上述仅有‘作废’一个，所以为1；

第八列为结果集中所有元素的个数，上述为16。

经过以上步骤最终形成的矩阵为：

在本申请的一些可选的实施例中，将第一矩阵和第二矩阵合并为目标矩阵，包括：将第一矩阵进行转置处理，得到第三矩阵；将第二矩阵和第三矩阵进行拼接，得到目标矩阵。

将上述得到的N*8矩阵和M*8矩阵进行合并，通过将N*8矩阵进行转置处理再和M*8矩阵进行拼接，最后得到矩阵(M+N)*8，即为最终得到的输入矩阵。该矩阵可作为输入层结果，对应运行时间作为标签，可输入神经网络模型进行训练。

在本申请的另一些可选的实施例中，将多个目标矩阵和多个历史执行语句的执行时长输入至神经网络模型进行训练，得到训练好的神经网络模型，包括：将多个目标矩阵按照预设比例进行随机组合，得到训练集和测试集；将训练集和测试集输入神经网络模型进行预测，得到训练好的神经网络模型。

不断重复以上步骤，可获得大量目标矩阵数据集，随机打乱后可按一定比例作为训练集和测试集，不断输入神经网络训练，得到训练好的神经网络模型，如图5所示。然后输入待预测执行语句，可以输出运行时间，完成对SQL语句的执行时间的预测。神经网络模型的输入层，隐层，输出层的结构可自行调整，隐层和输出层选用相应激活函数。

根据本申请的一个可选的实施例，执行步骤S208依据比较结果确定待预测执行语句是否为目标执行语句，包括：在待预测执行语句的执行时长大于或等于预设时长的情况下，将待预测执行语句确定为目标执行语句；在待预测执行语句的执行时长小于预设时长的情况下，确定待预测执行语句不是目标执行语句。

将得到的结果与定义的慢SQL阈值对比，完成慢SQL识别。

本申请使用的执行语句的识别方法，可以以最终结果的均方误差(Meam SquareError，MSE)作为评价指标，比较5个例句下的效果。与使用普通的单explain结果编码、单语法树编码、以及其他方案的对比如下：

由此可见，本申请相对于其他单一或传统的编码方式，有着较为精准的预测效果，更能准确识别慢SQL场景。

本发明是一种采用组合编码技术的来预测进而识别数据库中慢SQL语句的方法，可通过预测SQL语句执行时间的神经网络输入数据，提高判别慢SQL的准确性。本申请基于神经网络，并利用组合编码方式实现慢SQL语句预测并识别，在预测前的编码方式上做了革新，来直接预测SQL语句的执行时间是否大于某限定值。本申请不需要慢SQL样本，并且从最直观的时间角度入手预测，更有效地提升了慢SQL预测的准确性；相比传统的对比识别方法，有了一定的可扩展性，可以界定不同情况下的慢SQL场景；在编码上采用了组合编码方式，用于神经网络时，所得到的结果更加准确，更接近真实值；从语句执行时间维度入手，相比其他特征方法更加直观，更易于判断。

图6是根据本申请的一种执行语句的识别装置的结构框图，如图6所示，该装置包括：

获取模块60，用于获取待预测执行语句；

预测模块62，用于将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；

比较模块64，用于比较执行时长与预设时长；

确定模块66，用于依据比较结果确定待预测执行语句是否为目标执行语句。

使用本申请的组合编码方式，相对于其他单一或传统的编码方式，有着较为精准的预测效果，从最直观的时间角度入手预测，更有效地提升了慢SQL识别的准确性，更能准确识别慢SQL场景提升数据库运维效能。本申请可以加入到当前数据库系统运维的管理方法中，提前精准识别慢SQL，降低数据库故障发生几率，提升运维能力；也可以和预警类系统结合，在慢SQL语句执行之前，以告警等方式阻断大量慢SQL语句的执行。

需要说明的是图6所示实施例的优选实施方式可以参见图2所示实施例的相关描述，此处不再赘述。

上述非易失性存储介质用于存储执行以下功能的程序：获取待预测执行语句；将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；比较执行时长与预设时长；依据比较结果确定待预测执行语句是否为目标执行语句。

本申请实施例还提供了一种处理器，处理器用于运行存储在存储器中的程序，其中，程序运行时执行以上的执行语句的识别方法。

上述处理器用于运行执行以下功能的程序：获取待预测执行语句；将待预测执行语句输入至神经网络模型进行预测，得到待预测执行语句的执行时长；比较执行时长与预设时长；依据比较结果确定待预测执行语句是否为目标执行语句。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种执行语句的识别方法，其特征在于，包括：

获取待预测执行语句；

将所述待预测执行语句输入至神经网络模型进行预测，得到所述待预测执行语句的执行时长；

比较所述执行时长与预设时长；

依据比较结果确定所述待预测执行语句是否为目标执行语句。

2.根据权利要求1所述的方法，其特征在于，将所述待预测执行语句输入至神经网络模型进行预测之前，所述方法还包括：

获取多个历史执行语句的信息，其中，所述信息包括：所述多个历史执行语句和所述多个历史执行语句的执行时长；

根据所述信息构造多个目标矩阵；

将所述多个目标矩阵和所述多个历史执行语句的执行时长输入至所述神经网络模型进行训练，得到训练好的神经网络模型。

3.根据权利要求2所述的方法，其特征在于，根据所述信息构造多个目标矩阵，包括：

获取所述历史执行语句的执行计划信息，并将所述执行计划信息构造为第一矩阵；

将所述历史执行语句转换为树形结构，并依据所述树形结构构造第二矩阵；

将所述第一矩阵和所述第二矩阵合并为所述目标矩阵。

4.根据权利要求3所述的方法，其特征在于，将所述历史执行语句转换为树形结构，并依据所述树形结构构造第二矩阵，包括：

将所述历史执行语句转换为所述树形结构；

按照前序遍历算法遍历所述树形结构，生成结果集；

依据所述结果集构造所述第二矩阵。

5.根据权利要求3所述的方法，其特征在于，将所述第一矩阵和所述第二矩阵合并为所述目标矩阵，包括：

将所述第一矩阵进行转置处理，得到第三矩阵；

将所述第二矩阵和所述第三矩阵进行拼接，得到所述目标矩阵。

6.根据权利要求2所述的方法，其特征在于，将所述多个目标矩阵和所述多个历史执行语句的执行时长输入至神经网络模型进行训练，得到训练好的神经网络模型，包括：

将所述多个目标矩阵按照预设比例进行随机组合，得到训练集和测试集；

将所述训练集和所述测试集输入所述神经网络模型进行预测，得到训练好的神经网络模型。

7.根据权利要求1所述的方法，其特征在于，依据比较结果确定所述待预测执行语句是否为目标执行语句，包括：

在所述待预测执行语句的执行时长大于或等于所述预设时长的情况下，将所述待预测执行语句确定为所述目标执行语句；

在所述待预测执行语句的执行时长小于所述预设时长的情况下，确定所述待预测执行语句不是所述目标执行语句。

8.一种执行语句的识别装置，其特征在于，包括：

获取模块，用于获取待预测执行语句；

预测模块，用于将所述待预测执行语句输入至神经网络模型进行预测，得到所述待预测执行语句的执行时长；

比较模块，用于比较所述执行时长与预设时长；

确定模块，用于依据比较结果确定所述待预测执行语句是否为目标执行语句。

9.一种非易失性存储介质，其特征在于，所述非易失性存储介质包括存储的程序，其中，在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述的执行语句的识别方法。

10.一种处理器，其特征在于，所述处理器用于运行存储在存储器中的程序，其中，所述程序运行时执行权利要求1至7中任意一项所述的执行语句的识别方法。