WO2020228378A1

WO2020228378A1 - 一种确定数据库的配置参数的方法及装置

Info

Publication number: WO2020228378A1
Application number: PCT/CN2020/073429
Authority: WO
Inventors: 李国良; 李士福; 周煊赫; 高波
Original assignee: 华为技术有限公司; 清华大学
Priority date: 2019-05-14
Filing date: 2020-01-21
Publication date: 2020-11-19
Also published as: CN111949631B; CA3137748A1; CA3137748C; EP3961413A4; CN111949631A; EP3961413A1; US20220067008A1

Abstract

一种确定数据库的配置参数的方法，可以应用于数据库管理系统。该方法通过对查询语句进行向量化编码，从而得到查询语句的目标特征向量，然后再根据目标特征向量和所述数据库（101）的当前状态信息这两方面的双状态信息确定用于确定数据库的配置参数集，该配置参数集用于执行所述N个查询语句。可以动态的根据查询语句和数据库（101）的当前状态信息确定数据库（101）的配置参数，可以保障数据库（101）在不同负载需求下的良好表现，例如：时延、吞吐量等方面的表现。

Description

一种确定数据库的配置参数的方法及装置

本申请要求于2019年5月14日提交中国专利局、申请号为201910401715.0、发明名称为“一种确定数据库的配置参数的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据库技术领域，具体涉及一种确定数据库的配置参数的方法及装置。

背景技术

数据库(database，DB)中存储有海量数据，可以为大量客户端提供数据服务。换句话说，客户端就是数据库的负载。数据库工作时可以基于不同的配置参数运行，对客户端提供不同表现的数据服务。也就是说，若数据库的配置参数与负载的业务相匹配，则数据库提供服务时响应的就会较快，若数据库的配置参数与负载的业务不相匹配，则数据库提供服务时响应的就会较慢。

为了更好的为客户端提供服务，数据库运行期间，数据库管理员(database administrator，DBA)会根据负载的情况确定数据库的配置参数。

目前，DBA确定数据库的配置参数需要在测试环境中对所要部署的业务进行测试，需要花费大量时间才能确定适合这次业务的数据库的配置参数，而一旦业务发生变化，则需要重新测试。针对网络中随时有可能变化的业务或者负载的数量，这种DBA调参的方式无法满足当前的需求。

发明内容

本申请实施例提供一种确定数据库的配置参数的方法，用于动态的根据负载的情况和数据库的当前状态信息确定数据库的配置参数，可以保障数据库在不同负载需求下的良好表现，例如：时延、吞吐量等方面的表现。

为达到上述目的，本申请的实施例采用如下技术方案：

第一方面，提供一种确定数据库的配置参数的方法，可以包括：获取M个客户端发送的N个查询语句，所述M为大于0的整数，所述N为大于0的整数，且N≥M；从所述N个查询语句中确定N个查询信息，所述N个查询语句与所述N个查询信息一一对应；对所述N个查询信息进行向量化编码，以得到对应的N个目标特征向量，所述N个查询信息与所述N个目标特征向量一一对应；根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括至少一个目标配置参数组，所述目标配置参数组包括至少一个配置参数，所述配置参数集用于执行所述N个查询语句。

上述第一方面提供的技术方案中，在确定配置参数集后可以基于该配置参数集调整数据库当前所使用的配置参数，配置参数的调整方式可以是用当前配置参数集中的配置参数替换数据库当前所使用的配置参数，也可以是通过在数据库当前所使用的配置参数的数值上增加或减少偏移值的方式调整数据库当前所使用的配置参数。该第一方面中可以动态的根据负载的情况和数据库的当前状态信息确定数据库的配置参数，可以保障数据库在不同负载需求下的良好表现，例如：可以满足时延和吞吐量等方面的表现。

在第一方面的一种可能的实现方式中，该方法还可以包括：响应于模式选择指令，从查询级别的调参模式、负载级别的调参模式和聚类级别的调参模式中确定用于所述N个查询语句的目标调参模式。也就是说，该种可能的实现方式提供了查询级别的调参模式、负载级别的调参模式和聚类级别的调参模式这三种粒度的调参模式，模式选择指令可以是用户触发的，也可以是数据库管理员触发的，也就是说用户或者数据库管理员可以在不同需求场景下对调参模式进行切换，从而可以满足多种调参需求。

在第一方面的一种可能的实现方式中，当所述目标调参模式为所述查询级别的调参模式时，所述M＝1，所述N＝1，也就是说，针对查询级别的调参模式，可以针对一个查询语句确定一个配置参数集，该配置参数集中包括针对该查询语句的一个目标配置参数组，该一个目标配置参数组用于执行该一个查询语句时配置给数据库。

在第一方面的一种可能的实现方式中，当所述目标调参模式为所述负载级别的调参模式时，所述方法还包括：对所述N个目标特征向量进行融合，以得到融合后的统一向量；所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：根据所述统一向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括一个目标配置参数组，所述一个目标配置参数组用于在执行所述N个查询语句时调整所述数据库当前所使用的配置参数。由该第一方面的一种可能的实现方式可知，这种负载级别的调参模式可以为N个查询语句进行一次调参，可以满足大吞吐量的场景需求。

在第一方面的一种可能的实现方式中，当所述目标调参模式为所述聚类级别的调参模式时，所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：根据所述N个目标特征向量和所述数据库的当前状态信息，确定N个配置参数组，其中，N个配置参数组与所述N个目标特征向量一一对应；对所述N个配置参数组进行聚类，以得到Q个目标配置参数组，其中，第一配置参数组对应至少一个目标特征向量，所述第一配置参数组为所述Q个目标配置参数组中的任意一个，所述Q为大于0的整数，且Q＜N，所述第一配置参数组用于在执行所述至少一个目标特征向量对应的查询语句时调整所述数据库当前所使用的配置参数。由该第一方面的一种可能的实现方式可知，这种聚类级别的调参模式可以针对同类型的查询语句确定一组目标配置参数组，既可以保证较大的吞吐量，又可以满足低时延的需求。

在第一方面的一种可能的实现方式中，所述N个查询信息中的第一查询信息包括第一查询类型、第一表信息和查询时所涉及算子的类型和对应的代价信息，所述第一查询信息为所述N个查询信息中的任意一个；所述第一查询类型用于指示所述第一查询信息所对应的查询语句请求对所述数据库的操作类型；所述第一表信息用于指示所述第一查询信息所对应的查询语句被所述数据库执行时所涉及的关系表；所述代价信息用于指示所涉及的算子在执行所述第一查询信息所对应的查询语句时各自的执行代价。

在第一方面的一种可能的实现方式中，所述第一查询信息对应的目标特征向量包括第一查询类型的标识和第二查询类型的标识、第一表信息的标识和第二表信息的标识，以及各类型算子的浮点位；其中，所述第一查询类型的标识用第一值表示，所述第二查询类型的标识用第二值表示，所述第二查询类型属于所述数据库的查询类型且未包括在所述第一查询信息中；所述第一表信息的标识用第三值表示，所述第二表信息的标识用第四值表示，所述第二表信息属于所述数据库的表信息且未包括在所述第一查询信息中；所述各类型算子的浮点位上包括对应类型算子的执行代价。

该种可能的实现方式中，标识可以是比特位标识，也可以是浮点位标识，当是比特位标识时可以通过1表示第一查询类型，可以通过0表示第二查询类型，也可以通过T来表示第一查询类型，可以通过F表示第二查询类型，或者其他比特位的表示方式也都可以适用于本方案。当是浮点位标识时，可以对所涉及到的所有查询类型都用不同字符做标记，例如：插入(insert)用1表示、选择(select)用2表示、更新(update)用3表示，删除(delete)用4表示，当然，这里只是以这四种查询类型为例进行说明，不限定只有这四种查询类型，也不限于用该处列举的数值的形式表示，也可以通过其他符号或数值的形式来表示不同的查询类型。

在第一方面的一种可能的实现方式中，所述对应类型算子的执行代价为归一化后的执行代价。

在第一方面的一种可能的实现方式中，所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习(double-state deep reinforcement learning，DS-DRL)模型，确定与所述N个查询语句对应的所述数据库的配置参数集。该DS-DRL模型可以对查询语句的特征向量和数据库的状态信息这两方面的数据进行处理，从而得出适合查询语句的数据库的配置参数。

在第一方面的一种可能的实现方式中，所述DS-DRL模型包括预测模型、环境模型和代理模型；所述根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：通过所述预测模型，根据所述N个目标特征向量预测所述数据库的状态信息变化量ΔS，所述ΔS是执行所述N个查询语句之后相对于执行所述N个查询语句之前的所述数据库的状态信息的变化量；通过所述环境模型，根据所述ΔS，以及执行所述N个查询语句之前的所述数据库的状态信息S确定模拟所述N个查询语句执行后的所述数据库的模拟状态信息S’；通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集；通过所述环境模型，根据所述推荐配置参数集进行模拟配置，并执行所述N个目标特征向量，以更新所述S和S’，并确定所述N个目标特征向量被执行后的表现值R；通过所述代理模型，根据所述表现值R更新调参策略，并根据更新后的所述S’确定更新的推荐配置参数集；若所述表现值R满足预设条件，则确定更新的推荐配置参数集为所述配置参数集；若所述表现值R不满足预设条件，则重复执行上述环境模型更新所述S以及所述S’，以及所述代理模型确定更新的推荐配置参数集的过程直至表现值R满足预设条件，所述满足预设条件的R值所对应的更新的推荐配置参数集为所述配置参数集。由该种可能的实现方式可知，该DS-DRL模型通过预测模型、环境模型和代理模型三个模型的配合实现上述确定配置参数集的过程，可以确保配置参数集的准确度。

该种可能的实现方式中的满足预设条件可以包括经过R值超过预设阈值，或者达到预先规定的资源限制条件，例如：迭代了预定次数，或者迭代了预设时长等。

在第一方面的一种可能的实现方式中，当所述DS-DRL模型为双状态深度确定性策略梯度算法DS-DDPG模型时，所述代理模型包括角色actor模型和评分critic模型；所述通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集，包括：通过所述actor模型，根据所述模拟状态信息S’，确定推荐配置参数集；通过所述critic模型，根据所述模拟状态信息S’和所述推荐配置参数集，确定所述推荐配置参数集的评分。

在第一方面的一种可能的实现方式中，所述根据所述表现值R更新调参策略，可以包括：通过所述actor模型，根据所述评分更新所述actor模型的权重。

在第一方面的一种可能的实现方式中，所述根据所述表现值R更新调参策略，可以包括：通过所述critic模型，根据表现值R，更新所述critic模型的权重。

第二方面，提供了一种确定数据库的配置参数的装置，用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。具体地，该装置包括用于执行上述第一方面或第一方面的任意可能的实现方式中的方法的模块或单元。

第三方面，提供了一种确定数据库的配置参数的装置。该装置可以包括至少一个处理器、存储器和通信接口。处理器与存储器和通信接口耦合。存储器用于存储指令，处理器用于执行该指令，通信接口用于在处理器的控制下与其他网元进行通信。该指令在被处理器执行时，使处理器执行第一方面或第一方面的任意可能的实现方式中的方法。

第四方面，提供了一种数据库系统。该数据库系统包括第二方面或第三方面的确定数据库的配置参数的装置和数据库。

第五方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有程序，该程序使得数据查询的装置执行上述第一方面，及其各种实现方式中的任一种确定数据库的配置参数的方法。

第六方面，提供一种计算机程序产品，该计算机程序产品包括计算机执行指令，该计算机执行指令存储在计算机可读存储介质中；设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令，至少一个处理器执行该计算机执行指令使得设备实施上述第一方面或者第一方面的任一种可能的实现方式所提供的确定数据库的配置参数的方法。

可以理解地，上述提供的任一种确定数据库的配置参数的装置、计算机存储介质或者计算机程序产品均用于执行上文所提供的对应的确定数据库的配置参数的方法，因此，其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果，此处不再赘述。

附图说明

图1是本申请实施例提供的数据库系统的一架构示意图；

图2是本申请实施例提供的数据库系统的另一架构示意图；

图3是本申请实施例提供的数据库系统的又一架构示意图；

图4是本申请实施例提供的数据库系统的又一架构示意图；

图5是本申请实施例提供的数据库服务器的一结构示意图；

图6是本申请实施例提供的数据库服务器的另一结构示意图；

图7是本申请实施例提供的神经网络模型的一示意图；

图8是本申请实施例提供的数据库系统的又一架构示意图；

图9是本申请实施例提供的确定数据库的配置参数的方法的一实施例示意图；

图10是本申请实施例提供的数据库系统的又一架构示意图；

图11是本申请实施例提供的确定数据库的配置参数的方法的另一实施例示意图；

图12是本申请实施例提供的神经网络模型的另一示意图；

图13是本申请实施例提供的查询语句向量化编码过程的一示意图；

图14是本申请实施例提供的DS-DRL的一架构示意图；

图15是本申请实施例提供的DS-DDPG的一架构示意图；

图16是本申请实施例提供的确定数据库的配置参数的装置的一实施例示意图；

图17是本申请实施例提供的数据库服务器的另一结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请的实施例所应用的数据库系统的架构如图1所示，该数据库系统包括数据库101和数据库管理系统(Database Management System，DBMS)102。

其中，数据库101是指长期存储在数据存储器(Data Store)中的有组织的数据集合，即按照一定的数据模型组织、存储和使用的相关联的数据集合，比如，数据库101可以包括一个或者多个表数据。

DBMS 102用于建立、使用和维护数据库101，以及对数据库101进行统一的管理和控制，以保证数据库101的安全性和完整性。用户可以通过DBMS 102访问数据库101中的数据，数据库管理员(database administrator，DBA)也通过DBMS 102进行数据库的维护工作。DBMS102提供多种功能，可使多个应用程序和用户设备使用不同的方法，在同一时刻或不同时刻去建立，修改和询问数据库，应用程序和用户设备可以统称为客户端。DBMS 102所提供的功能可以包括以下几项：(1)数据定义功能，DBMS 102提供数据定义语言(Data Definition Language，DDL)来定义数据库结构，DDL用于刻画数据库框架，并可以被保存在数据字典中；(2)数据存取功能，DBMS 102提供数据操纵语言(Data Manipulation Language，DML)，实现对数据库数据的基本存取操作，比如检索、插入、修改和删除；(3)数据库运行管理功能，DBMS 102提供数据控制功能，即是数据的安全性、完整性和并发控制等对数据库运行进行有效地控制和管理，以确保数据正确有效；(4)数据库的建立和维护功能，包括数据库初始数据的装入，数据库的转储、恢复、重组织，系统性能监视、分析等功能；(5)数据库的传输，DBMS 102提供处理数据的传输，实现客户端与DBMS 102之间的通信，通常与操作系统协调完成。

具体地，图2为单机数据库系统示意图，包括一个数据库管理系统和数据存储器(Data Store)，该数据库管理系统用于提供数据库的查询和修改等服务，该数据库管理系统将数据存储到数据存储器中。在单机数据库系统中，数据库管理系统和数据存储器通常位于单一服务器上，比如一台对称多处理器(Symmetric Multi-Processor，SMP)服务器。该SMP服务器包括多个处理器，所有的处理器共享资源，如总线，内存和I/O系统等。数据库管理系统的功能可由一个或多个处理器执行内存中的程序来实现。

图3为采用共享磁盘(Shared-storage)架构的集群数据库系统示意图，包括多个节点(如图3中的节点1-N)，每个节点部署有数据库管理系统，分别为用户提供数据库的查询和修改等服务，多个数据库管理系统存储有共享的数据在共享数据存储器中，并且通过交换机对数据存储器中的数据执行读写操作。共享数据存储器可以为共享磁盘阵列。集群数据库系统中的节点可以为物理机，比如数据库服务器，也可以为运行在抽象硬件资源上的虚拟机。若节点为物理机，则交换机为存储区网络(Storage Area Network，SAN)交换机、以太网交换机，光纤交换机或其它物理交换设备。若节点为虚拟机，则交换机为虚拟交换机。

图4为采用无共享(Shared-nothing)架构的集群数据库系统示意图，每个节点具有各自独享的硬件资源(如数据存储器)、操作系统和数据库，节点之间通过网络来通信。该体系下，数据将根据数据库模型和应用特点被分配到各个节点上，查询任务将被分割成若干部分，在所有节点上并行执行，彼此协同计算，作为整体提供数据库服务，所有通信功能都在一个高宽带网络互联体系上实现。如同图3所描述的共享磁盘架构的集群数据库系统一样，这里的节点既可以是物理机，也可以是虚拟机。

在本申请所有实施例中，数据库系统的数据存储器(Data Store)包括但不限于固态硬盘(SSD)、磁盘阵列或其他类型的非瞬态计算机可读介质。图2至图4中虽未示出数据库，应理解，数据库存储在数据存储器中。所属领域的技术人员可以理解一个数据库系统可能包括比图2至图4中所示的部件更少或更多的组件，或者包括与图2至图4中所示组件不同的组件，图2至图4仅仅示出了与本申请实施例所公开的实现方式更加相关的组件。例如，虽然图3和图4中已经描述了4个节点，但所属领域的技术人员可理解成一个集群数据库系统可包含任何数量的节点。各节点的数据库管理系统功能可分别由运行在各节点上的软件、硬件和/或固件的适当组合来实现。

本领域技术人员根据本申请实施例的教导可以很清楚地理解，本申请实施例的方法应用于数据库管理系统，该数据库管理系统可应用于单机数据库系统、Shared-nothing架构的集群数据库系统、Shared-storage架构的集群数据库系统，或其它类型的数据库系统。

进一步地，参见图1，DBMS 102在执行数据库101查询时，通常需要对查询语句进行语法分析、预编译和优化等步骤，估算出数据库系统认为代价最小的执行方式，继而生成代价最小的执行计划，运行时执行结构体将按照生成的执行计划进行数据操作，以提高数据库系统的性能。DBMS 102在对查询语句进行代价估算时，需要收集查询语句的统计信息，并根据收集的统计信息进行代价估算。其中，收集统计信息的方法可以是通过机器学习进行模型训练得到的模型信息，或者是通过数据采样统计得到的统计信息，模型信息也可以称为统计信息。

其中，DBMS 102可以位于数据库服务器中，比如，该数据库服务器具体可以为图2所述的单机数据库系统中的SMP服务器，或者图3或图4中所述的节点。具体的，如图5所示，数据库服务器可以包括内核1021、以及独立于内核1021的且位于数据库服务器内部的外部训练器1022；或者，如图6所示，数据库服务器包括内核1021，外部训练器1022位于数据库服务器之外。其中，内核1021是数据库服务器的核心，可以用于执行DBMS 102所提供的多种功能。内核1021可以包括实用程序10211和优化器10212。在数据库服务器在执行数据库101查询时，实用程序10211可以触发外部训练器1022通过机器学习进行模型训练，从而得到训练模型的模型信息。优化器10212可以根据外部训练器1022训练得到的模型信息进行代价估算，从而生成代价最小的执行计划，使得执行结构体按照生成的执行计划进行数据操作，以提高数据库系统的性能。

机器学习是指依赖于对现存数据的学习或者观察获取新的推理模型的过程。机器学习可以通过多种不同的算法进行实现，常见的机器学习的算法可以包括：神经网络(Neural Network，NN)和随机森林(Random Forest，RF)等模型。比如，神经网络可以包括前向反馈神经网络(Feed Forward Neural Network，FFNN)和循环神经网络(Recurrent Neural Network，RNN)。如图7所示，为一种神经网络的模型示意图，该模型可以包括输入层、隐层和输出层，每一层可以包括不同数量的神经元。

因为请求数据库提供服务的客户端数量不是固定的，为了使数据库在为客户端提供服务时能有更好的表现(如：时延、吞吐量方面的表现)，本申请实施例提供了一种确定数据库的配置参数的方法，该方法提供了一种基于双状态的配置参数的调整方案，其中的双状态可以是，查询语句的特征向量(query vector)和数据库的状态信息(database states)。其中，查询语句的特征向量会影响数据库各项活动的统计信息，也可以说是查询语句或者负载会影响数据库各项活动的统计信息，数据库的状态信息可以包括数据库的内部配置，该配置会受调参行为影响。本申请实施例提供的基于双状态的配置参数的调整方案可以是通过双状态深度强化学习(double-state deep reinforcement learning，DS-DRL)模型实现的，该DS-DRL模型可以对查询语句的特征向量和数据库的状态信息这两方面的数据进行处理，从而得出适合查询语句的数据库的配置参数。DS-DRL模型的具体表现形式可以有多种，其中一种例如可以为双状态深度确定性策略梯度算法(double-state deep deterministic policy gradient,DS-DDPG)模型,关于DS-DRL模型和DS-DDPG模型的具体结构和在确定数据库的配置参数的过程中的作用在后文进行描述，此处不做过多展开。

本申请实施例在上述基于双状态的配置参数的调整方案中包括三种粒度的调参模式，分别为：查询级别的调参模式(query-level tuning)、负载级别的调参模式 (workload-level tuning)和聚类级别的调参模式(cluster-level tuning)。关于这三种粒度的调参模式在确定数据库的配置参数的过程中的具体内容在后文进行描述，此处不做过多展开。

因本申请实施例所提供的确定数据库的配置参数的方法应用于DBMS，由DBMS为DB提供与负载相匹配的配置参数集，进而根据配置参数集调整DB的配置参数。因为DBMS和DB都属于数据库系统，下面结合图8介绍本申请实施例的确定数据库的配置参数的过程。

图8为本申请实施例提供的数据库系统的又一架构示意图。

如图8所示，该数据库系统包括DBMS和DB，其中，DB的功能与图1所对应实施例描述的功能基本相同，此处不再做详细赘述。另外，需要说明的是该DB可以基于DBMS所提供的配置参数集调整自身所使用的配置参数。

其中，DBMS可以包括控制器(Controller)、查询语句向量化模块(Query2Vector)、负载向量化模块(Workload2Vector)、负载聚类模块(Workload2Cluster)和调参系统(tuner)，该DBMS中还可以包括训练参数集存储模块，若包括训练参数集存储模块则该模块中存储有训练数据(Training Data)。需要说明的是，(Query2Vector)中的“2”表示的是英文“to”的意思，表示的是从查询语句到向量，其他模块中的“2”也都是相同的含义，此处不再一一列举。

训练数据主要用于训练DS-DRL模型，若DS-DRL模型是离线训练的，则该数据库系统也可以不包括该训练参数集存储模块。一种可能的实现方式中，即使DS-DRL模型是离线训练的也可以包括该训练参数集存储模块，在调参过程中，调参系统所产生的新的数据也可以更新到训练参数集存储模块的训练数据中，从而实现在线DS-DRL模型的优化。

图8中所示的客户端并不限制数量，可以表示有一个客户端，也可以表示有两个或多个客户端。

客户端在使用数据库时，会发送查询语句(Query)，可以是通过查询请求的方式发送查询语句。

DBMS可以执行如图9所示的确定数据库的配置参数的方法的过程。

如图9所示，本申请实施例提供的确定数据库的配置参数的方法的一实施例可以包括：

201、获取M个客户端发送的N个查询语句。

所述M为大于0的整数，所述N为大于0的整数，且N≥M。

本申请实施例中，可以只有一个客户端，也可以有两个或多个客户端，一个客户端可以发送一个查询语句，也可以发送两个或多个查询语句。

202、从所述N个查询语句中确定N个查询信息。

所述N个查询语句与所述N个查询信息一一对应。

203、对所述N个查询信息进行向量化编码，以得到对应的N个目标特征向量。

所述N个查询信息与所述N个目标特征向量一一对应。

204、根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集。

所述配置参数集包括至少一个目标配置参数组，所述目标配置参数组包括至少一个配置参数。其中，所述配置参数集用于执行所述N个查询语句。

一种可能的实现方式中，在步骤204之后还可以执行步骤205。

205、在执行所述N个查询语句时，根据所述配置参数集调整所述数据库当前所使用的配置参数。

配置参数的调整方式可以是用当前配置参数集中的配置参数替换数据库当前所使用的配置参数，也可以是通过在数据库当前所使用的配置参数的数值上增加或减少偏移值的方式调整数据库当前所使用的配置参数。

一种可能的实现方式中，上述步骤201至205也可以是将DBMS中除去控制器的剩余部分作为一个确定数据库的配置参数的装置来执行的，这种情况下控制器为客户端提供访问数据库的接口，转发查询语句。然后由确定数据库的配置参数的装置来执行上述步骤201至205。

本申请实施例可以通过查询语句的目标特征向量和数据库的当前状态信息确定数据库的配置参数，可以保障数据库在不同负载需求下的良好表现。例如：可以满足时延和吞吐量等方面的表现。

前述已经介绍了本申请实施例提供了三种粒度的调参模式，这三种调参模式在向量化编码查询语句时的过程分别为：

1、对于查询级别的调参模式(query-level tuning)：由查询语句向量化模块(Query2Vector)对单个查询语句进行向量化编码，以得到该查询语句的目标特征向量，然后将该查询语句的目标特征向量传递给调参系统(tuner)，调参系统根据该查询语句的特征向量确定针对该查询语句的数据库的配置参数集。也就是说，当执行查询级别的调参模式时，会通过上述过程得到一个配置参数集，该配置参数集包括与该查询语句对应的一个目标配置参数组，所述一个目标配置参数组用于在执行所述该单个查询语句时调整所述数据库当前所使用的配置参数。查询级别的调参模式针对一个查询语句进行一次调参，这种调参时延很小，可以满足对不同查询语句的个性化调参需求。

2、对于负载级别的调参模式(workload-level tuning)：由查询语句向量化模块(Query2Vector)对N个查询语句中的每个查询语句进行向量化编码，以得到N个目标特征向量，N个查询语句为要数据库提供服务的所有查询语句。然后，查询语句向量化模块将N个目标特征向量传递给负载向量化模块(Workload2Vector)，由该负载向量化模块将N个目标特征向量融合为一个统一向量，然后由负载向量化模块将该统一向量传递给调参系统，调参系统根据该统一向量确定针对N个查询语句的数据库的配置参数集。

其中，负载向量化模块将N个目标特征向量融合为一个统一向量的过程可以是对N个目标特征向量各自对应的部分做合并，例如：每个目标特征向量都包括查询类型、表信息和代价信息三种子向量，则在做向量融合时可以是：对于查询类型的子向量和表信息的子向量，可以按照“并”的逻辑进行合并；对于代价信息的子向量，可以通过加和的方式进行合并。当然，也不仅限定于这里列举的这种融合方式，也可以是有的子向量按照“并”的逻辑进行合并，有的子向量用向量积的方式进行合并。

这种负载级别的调参模式可以为N个查询语句进行一次调参，可以满足大吞吐量的场景需求。

3、对于聚类级别的调参模式(cluster-level tuning)：由查询语句向量化模块(Query2Vector)对N个查询语句中的每个查询语句进行向量化编码，以得到N个目标特征向量，N个查询语句为要数据库提供服务的所有查询语句。然后由查询语句向量化模块将N个目标特征向量传递给调参系统，调参系统为N个目标特征向量确定N个配置参数组，然后调参系统再将这N个配置参数组传递给负载聚类模块(Workload2Cluster)，负载聚类模块对N个配置参数组进行聚类，以得到Q个目标配置参数组。负载聚类模块再将这Q个目标配置参数组传递给调参系统，调参系统根据该Q个目标配置参数组确定针对N个查询语句的数据库的配置参数集。其中，负载聚类模块对N个配置参数组进行聚类，以得到Q个目标配置参数组的过程可以是按照各组的配置参数的相似度进行聚类，如针对两组中同类型的配置参数的可以通过最短欧氏距离的方式进行聚类。

上述聚类级别的调参模式中，是由调参系统为N个目标特征向量确定N个配置参数组，然后由负载聚类模块将N个配置参数组聚类为Q个目标配置参数组。实际上也不限于这一种由N个目标特征向量到Q个目标配置参数组的方式。还可以通过负载聚类模块根据N个目标特征向量确定N个配置参数组，然后再聚类为Q个目标配置参数组。这种实现方式的情况下，负载聚类模块可以包括向量到参数模块(Vector2Pattern)和参数聚类模块(Pattern2Cluster)两部分，这种情况下与聚类相关的内容可以参阅图10进行理解，与聚类不相关的负载向量化模块(Workload2Vector)在图10中没有示出，但不表示该负载向量化模块不存在。

在图10所示的聚类过程中，查询语句向量化模块将N个目标特征向量传递给向量到参数模块，向量到参数模块为N个目标特征向量确定N个配置参数组。向量到参数模块再将N个配置参数组传递给参数聚类模块，由参数聚类模块将N个配置参数组聚类为Q个目标配置参数组。其中，向量到参数模块可以包括一个深度学习模型(deep learning model，DL Model)，该DL Model可以确定离散值作为配置参数，例如可以根据估计值与默认值的关系在{-1,0,1}中确定配置参数，其中：当估计值在默认值附近时取0；当估计值远大于默认值时取1；当估计值远小于默认值时取-1。这种通过离散的数值来表示配置参数的方案，可以节省大量的计算开销。

关于执行哪种调参模式可以是由用户或管理员基于实际需求进行选择的，这种情况下，本申请实施例提供的确定数据库的配置参数的方法还可以包括：

响应于模式选择指令，从查询级别的调参模式、负载级别的调参模式和聚类级别的调参模式中确定用于所述N个查询语句的目标调参模式。

也就是说，当所述目标调参模式为所述查询级别的调参模式时，所述M＝1，所述N＝1，也就是说，针对查询级别的调参模式，可以针对一个查询语句确定一个配置参数集，该配置参数集中包括针对该查询语句的一个目标配置参数组，该一个目标配置参数组用于执行该一个查询语句时配置给数据库。

当所述目标调参模式为所述负载级别的调参模式时，上述确定数据库的配置参数的方法还可以包括：对所述N个目标特征向量进行融合，以得到融合后的统一向量；其中，步骤204可以包括根据所述统一向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括一个目标配置参数组，所述一个目标配置参数组用于在执行所述N个查询语句时调整所述数据库当前所使用的配置参数。这种负载级别的调参模式可以为N个查询语句进行一次调参，可以满足大吞吐量的场景需求。

当所述目标调参模式为所述聚类级别的调参模式时，所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，可以包括：

根据所述N个目标特征向量和所述数据库的当前状态信息，确定N个配置参数组，其中，N个配置参数组与所述N个目标特征向量一一对应；

对所述N个配置参数组进行聚类，以得到Q个目标配置参数组，其中，第一配置参数组对应至少一个目标特征向量，所述第一配置参数组为所述Q个目标配置参数组中的任意一个，所述Q为大于0的整数，且Q＜N，所述第一配置参数组用于在执行所述至少一个目标特征向量对应的查询语句时调整所述数据库当前所使用的配置参数。

这种聚类级别的调参模式可以针对同类型的查询语句确定一组目标配置参数组，既可以保证较大的吞吐量，又可以满足低时延的需求。

上述图8和图10是从DBMS模块化的角度描述的确定数据库的配置参数的过程，图11从处理流程的角度描述了上述实施例对N个目标特征向量进行后续处理从而得到配置参数集，以确定数据库的配置参数的过程。

如图11所示，本申请实施例提供的三种粒度的调参模式的处理过程，并且还从三种粒度的调参模式的处理过程中提取了调参系统的工作过程，以及聚类级别的调参模式中的向量到参数(Vector2Pattern)的处理过程，图11中的调参模型是以DS-DDPG为例的，实际上不限于DS-DDPG这一种调参模型。

图11中，查询语句级别(Query-level)的调参模式：任何一个查询语句Q _i被向量化编码后都可以得到一个特征向量，该特征向量输入到DS-DDPG模型后，就可以得到针对该查询语句Q _i的一个配置参数组[a ₁，a ₂,…a _m]，在(Query-level)的调参模式下配置参数集A中包括该配置参数组[a ₁，a ₂,…a _m]，即：A＝[a ₁，a ₂,…a _m]，在执行该查询语句Q _i时就可以使用该配置参数集A确定数据库的配置参数。

图11中，负载级别(workload-level)的调参模式：查询语句全集有N个，可以表示为Q＝{Q ₁，Q ₂，…Q _n},对这N个查询语句分别进行向量化编码，以得到N个目标特征向量，再将这N个目标特征向量融合为一个统一向量V ^*，然后将V ^*输入到DS-DDPG模型，就可以得到针对N个查询语句Q＝{Q ₁，Q ₂，…Q _n}的一个配置参数组[a ₁，a ₂,…a _m]，在(workload-level)的调参模式下配置参数集A中包括该配置参数组[a ₁，a ₂,…a _m]，即：A＝[a ₁，a ₂,…a _m]，在执行N个查询语句Q＝{Q ₁，Q ₂，…Q _n}时就可以使用该配置参数集A确定数据库的配置参数。

图11中，聚类级别(cluster-level)的调参模式：查询语句全集有N个，可以表示为Q＝{Q ₁，Q ₂，…Q _n},对这N个查询语句分别进行向量化编码，以得到N个目标特征向量，可以通过DS-DDPG模型确定出这N个目标特征向量对应的N个配置参数组[A ₁，A ₂，…A _n],也可以通过向量到参数(Vector2Pattern)的DL Model确定出这N个目标特征向量对应的N个配置参数组[P ₁，P ₂，…P _n]，无论是N个配置参数组[A ₁，A ₂，…A _n]，还是N个配置参数组[P ₁，P ₂，…P _n]，接下来都进行聚类，以得到Q个目标配置参数组{U ₁，U ₂，…U _q},然后将每个目标配置参数组U _j做向量化编码，以得到该U _j对应的向量化编码V ^**，然后将该U _j对应的向量化编码V ^**输入到DS-DDPG模型，就可以得到该U _j对应的配置参数集A，在执行与U _j对应的查询语句时，就可以使用该配置参数集A确定数据库的配置参数。

在上述三个粒度的调参模式中，DS-DDPG模型的工作原理都基本是相同的，DS-DDPG模型会根据查询语句的目标特征向量预测数据库的状态变化量ΔS＝[Δs ₁，Δs ₂，…，Δs _m],然后结合当前的状态信息S＝[s ₁，s ₂，…，s _m]，按照S’＝ΔS+S的方式确定S’＝[S’ ₁，S’ ₂，…，S’ _m]，然后将S’作为表现值(表现值也可以称为观察值Observation)输出给角色(Actor)-评分(Critic)模块，该(Actor-Critic)模块也可以称为(Actor-Critic)模型，然后由(Actor-Critic)模型确定配置参数集A，关于DS-DDPG模型的具体调参过程后文再做详细介绍，此处不做过多展开。

在聚类级别(cluster-level)的调参模式中，DL Model的过程是以查询语句的目标特征向量作为输入，然后经过输入层(Input Layer)、隐藏层(Hidden Layer)和输出层(Output Layer)转换后得到目标特征配置参数组P＝[p ₁，p ₂，…p _n]。

关于DL Model也可以参阅图12进行理解，其中，L1为输入层，L2、L3和L4为隐藏层，L5为输出层，目标特征向量v ₁,v ₂至v _k输入到L1层，然后经过L1、L2、L3、L4和L5之间的关系后，输出目标特征配置参数组P＝[p ₁，p ₂，…p _n]。

由上述描述可知，无论哪种粒度的调参模式，都需要对查询语句进行向量化编码，向量化编码的是查询语句中的查询信息，本申请实施例中的查询信息包括查询类型、表信息以及查询时所涉及算子的类型和对应的代价信息。其中，查询类型例如可以包括：插入(insert)、选择(select)、更新(update)和删除(delete)等。表信息可以包括表的标识信息，也可以包括表的数据体量和数据结构。查询时所涉及算子的类型可以包括顺序扫描(Seq_Scan)、哈希连接(Hash_Join)和聚合操作(Aggregate)等类型。算子的代价信息指的是在执行该查询语句时该算子所花费的执行代价。每个算子的执行代价可以预先通过优化器根据该查询语句的查询计划计算出来，也就是说，每个算子的执行代价可以预先得到。

如图13示出了针对一个查询语句进行向量化的过程，该过程中从查询计划到预估算子的执行代价，然后该查询计划的各部分进行向量化的过程。

如图13中，一个模板向量可以包括查询类型(DML)、表(Tables)和算子代价(Operation Costs)三部分。

针对DML，模板向量可以包括插入(insert)、选择(select)、更新(update)和删除(delete)。若该查询语句是一个选择操作，则在select的比特位上填1，其他insert、update和delete的比特位都填0。

针对表部分，该查询语句的查询计划中包括tbl1、tbl2和tbl3三个表的表信息，则在tbl1、tbl2和tbl3的比特位上填1，其他tbl4至tbl8的比特位上都填0。

针对各类型的算子，可以对算子结构树上的同类型算子的执行代价做累加，然后在相应类型的算子的浮点位上填累加后的代价值。例如：图13中，每个算子都包括代价预估相应操作的时间点，该代价预估相应操作的时间点分包括总时间(Total)、开始时间(Startup)和子节点时间(Child)。其中，总时间指示执行结果全部返回的时间点；开始时间指示开始返回结果的时间点；子节点时间(指示可以开始执行节点算子的最早时间。对于查询计划上的任意一个算子节点，可以用(总时间-子节点时间)表示它最大的执行代价)。例如：图13中有三个顺序扫描算子，而且每个顺序扫描算子的子节点时间都为0，所以这三个顺序扫描算子的执行代价加和为2.41+17.8+20.7＝40.91。同理，Hash_Join算子的执行代价为23.19+48.16-2.43＝68.92，Aggregate算子的执行代价为48.28-23.24＝25.04。

上述在模板向量上，对查询类型、表信息和算子代价三部分都赋值后就得到该查询语句的目标特征向量。为了消除由于取值范围不同导致的特征重要性差异，可以这些算子的执行代价可以做归一化处理，得到归一化处理后的目标特征向量，将所有特征约束在相同的数量级上。比如，取值为10000的特征在生成最终结果的过程中比取值为-1的特征占更大的比重，但可能经过归一化后二者都是0.5，表示两者有相同的影响程度。

上述目标特征向量中的DML和Table的表示方式是用比特位标识的方式来表示的，实际上本申请实施例中不限于这种比特位标识的表示方式，还可以是通过浮点位标识的形式来表示。当通过比特位标识来表示时也不限于上述表示方式中的0、1这种表示方式，例如：也可以用T来代替1，用F来代替0，或者用其他的表示来代替1和0。当通过浮点位标识来表示时，可以对所涉及到的所有查询类型都用不同字符做标记，例如：插入用1表示、选择用2表示、更新用3表示，删除用4表示，当然，这里只是以这四种查询类型为例进行说明，不限定只有这四种查询类型，也不限于用该处列举的数值的形式表示，也可以通过其他符号或数值的形式来表示不同的查询类型。

上述是按照对向量模板进行赋值的过程来描述向量化的，实际上，若从N个查询信息中选择任意一个称为第一查询信息，上述过程也可以描述为：第一查询信息包括第一查询类型、第一表信息和查询时所涉及算子的类型和对应的代价信息，所述第一查询类型用于指示所述第一查询信息所对应的查询语句请求对所述数据库的操作类型；所述第一表信息用于指示所述第一查询信息所对应的查询语句被所述数据库执行时所涉及的关系表；所述代价信息用于指示所涉及的算子在执行所述第一查询信息所对应的查询语句时各自的执行代价。

所述第一查询信息对应的目标特征向量包括第一查询类型的标识和第二查询类型的标识、第一表信息的标识和第二表信息的标识，以及各类型算子的浮点位；其中，所述第一查询类型的标识用第一值表示，所述第二查询类型的标识用第二值表示，所述第二查询类型属于所述数据库的查询类型且未包括在所述第一查询信息中；所述第一表信息的标识用第三值表示，所述第二表信息的标识用第四值表示，所述第二表信息属于所述数据库的表信息且未包括在所述第一查询信息中；所述各类型算子的浮点位上包括对应类型算子的执行代价。所述对应类型算子的执行代价为归一化后的执行代价。

上述描述了对查询语句进行向量化编码的过程，下面再介绍调参系统(tuner)基于DS-DRL模型进行调参的过程，以及基于DS-DDPG模型进行调参的过程。

下面先结合图14介绍基于DS-DRL模型进行调参的过程。

DS-DRL模型包括预测模型(Predictor)、环境模型(Environment)和代理模型(Agent)；其中，环境模型包括外部测量(outer metric)和内部状态(inner state)两部分。通过DS-DRL模型调参的过程可以包括：

301、负载(Workload)向查询语句向量化模块提供查询语句。

查询语句向量化模块对查询语句执行上文所描述的向量化编码过程，会得到N个目标特征向量。

302、查询语句向量化模块将N个目标特征向量传递给预测模型。

预测模型根据所述N个目标特征向量预测所述数据库的状态信息变化量ΔS，所述ΔS是执行所述N个查询语句之后相对于执行所述N个查询语句之前的所述数据库的状态信息的变化量。

预测模型可以是一个神经网络模型。

303、预测模型将ΔS传递给环境模型。

环境模型获知该ΔS，并根据外部状态(outer metric)中存储的执行所述N个查询语句之前的所述数据库的状态信息S，确定模拟所述N个查询语句执行后的所述数据库的模拟状态信息S’。可以是S’＝ΔS+S。

数据库的状态信息可以包括数据库的中央处理器(central processing unit，CPU)的利用率，网络利用率，磁盘的输入/输出(input/output，I/O)数，磁盘繁忙程度和内存换页数等。

304、环境模型将S’传递给代理模型。

代理模型将S’作为输入，生成一个推荐配置参数集(Action)。

305、代理模型将该推荐配置参数集传递给环境模型。

环境模型根据所述推荐配置参数集进行模拟配置。

环境模型中还包括内部状态(inner state)，内部状态存储有数据库当前的配置参数，这样就可以根据推荐配置参数集(Action)调整内部状态中的配置参数。

306、查询语句向量化模块将N个目标特征向量传递给环境模型。

环境模型执行所述N个目标特征向量，以更新所述S和S’。

环境模型确定所述N个目标特征向量被执行后的表现值(Reward，R)。

其中R的计算过程可以参阅如下公式进行理解：

其中，R为N个目标特征向量被执行后的表现值；w _i是m个表现指标(如延迟、吞吐量等)中第i个表现指标的权重，r _i为第i个表现指标的表现值。

其中，

其中，Δ _0,t表示当前表现相对于起始表现的变化量，Δ _(t-1),t表示当前表现相对于上一个表现的变化量。

其中，

其中，

其中，m ₀表示起始的表现度量，m _t表示当前的表现度量，m _t-1表示相对于当前的上一个的表现度量，其中，表现度量可以是如延迟、吞吐量和执行时间等。

307、环境模型将R值传递给代理模型。

所述代理模型根据所述表现值R更新调参策略，并根据更新后的所述S’确定更新的推荐配置参数集。

若所述表现值R满足预设条件，则确定更新的推荐配置参数集为所述配置参数集；

若所述表现值R不满足预设条件，则重复执行305和306中环境模型更新所述S以及所述S’，以及所述代理模型确定更新的推荐配置参数集的过程直至表现值R满足预设条件，所述满足预设条件的R值所对应的更新的推荐配置参数集为所述配置参数集。

也就是说，步骤204可以包括：根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集。

当所述DS-DRL模型包括预测模型、环境模型和代理模型时，所述根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集，可以包括：

通过所述预测模型，根据所述N个目标特征向量预测所述数据库的状态信息变化量ΔS，所述ΔS是执行所述N个查询语句之后相对于执行所述N个查询语句之前的所述数据库的状态信息的变化量；

通过所述环境模型，根据所述ΔS，以及执行所述N个查询语句之前的所述数据库的状态信息S确定模拟所述N个查询语句执行后的所述数据库的模拟状态信息S’；

通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集；

通过所述环境模型，根据所述推荐配置参数集进行模拟配置，并执行所述N个目标特征向量，以更新所述S和S’，并确定所述N个目标特征向量被执行后的表现值R；

通过所述代理模型，根据所述表现值R更新调参策略，并根据更新后的所述S’确定更新的推荐配置参数集；

若所述表现值R不满足预设条件，则重复执行上述环境模型更新所述S以及所述S’，以及所述代理模型确定更新的推荐配置参数集的过程直至表现值R满足预设条件，所述满足预设条件的R值所对应的更新的推荐配置参数集为所述配置参数集。

上述是通过DS-DRL模型介绍的调参的过程，下面结合图15基于DS-DDPG模型介绍调参的过程。

当所述DS-DRL模型为DS-DDPG模型时，所述代理模型包括角色actor模型和评分critic模型。角色actor模型和评分critic模可以是神经网络模型。

基于DS-DDPG模型介绍调参的过程中的步骤401至403与上述实施例中的步骤301至303相同，此处不再重复赘述。

404、环境模型将S’传递给actor模型。

角色模型将S’作为输入，生成一个推荐配置参数集(Action)。也就是说，所述通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集，可以包括：通过所述actor模型，根据所述模拟状态信息S’，确定推荐配置参数集；通过所述critic模型，根据所述模拟状态信息S’和所述推荐配置参数集，确定所述推荐配置参数集的评分。

步骤405和406与上述实施例中的步骤305和306相同，此处不再重复赘述。

407、环境模型将R值传递给critic模型。

408、actor模型将配置参数集传递给critic模型。

所述critic模型根据所述模拟状态信息S’和所述推荐配置参数集，确定所述推荐配置参数集的评分。

409、critic模型将评分传递给角色模型。

上述307中的所述根据所述表现值R更新调参策略，可以包括：

所述actor模型根据所述评分更新所述actor模型的权重。也就是说，通过所述actor模型，根据所述评分更新所述actor模型的权重。

所述critic模型根据表现值R，更新所述critic模型的权重。也就是说，通过所述critic模型，根据表现值R，更新所述critic模型的权重。

本申请实施例提供的数据库的配置参数调整的方案相对于默认配置或者DBA的推荐配置在时延更短，下面表1是以事务处理性能委员会的基准(transaction processing performance council Benchmark ^TMH，TPC-H)用例为例，分别测试了TPCH10x用例和TPCH30x用例在不同配置下的时延测试结果。

表1:不同配置下的作业执行总时延(秒：s)

	默认配置	DBA推荐配置	调优推荐配置
TPCH10x	293.37	283.12	197.90
TPCH30x	1083.67	872.45	539.86

由表1可以看出，无论是TPCH10x用例还是TPCH30x用例，本申请实施例提供的调优推荐配置方案的时延都远远小于默认配置和DBA的推荐配置。

以上多个实施例描述的数据库系统以及确定数据库的配置参数的方法，下面结合附图介绍本申请实施例提供的确定数据库的配置参数的装置50。

如图16所示，本申请实施例提供的确定数据库的配置参数的装置50的一实施例包括：

获取单元501，用于获取M个客户端发送的N个查询语句，所述M为大于0的整数，所述N为大于0的整数，且N≥M；

第一确定单元502，用于从所述获取单元501获取的N个查询语句中确定N个查询信息，所述N个查询语句与所述N个查询信息一一对应；

向量编码单元503，用于对所述第一确定单元502确定的N个查询信息进行向量化编码，以得到对应的N个目标特征向量，所述N个查询信息与所述N个目标特征向量一一对应；

第二确定单元504，用于根据所述向量编码单元503编码得到的N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括至少一个目标配置参数组，所述目标配置参数组包括至少一个配置参数，所述配置参数集用于执行所述N个查询语句。

一种可能的实现方式中，该装置50还包括：

第三确定单元505，用于响应于模式选择指令，从查询级别的调参模式、负载级别的调参模式和聚类级别的调参模式中确定用于所述获取单元501获取的N个查询语句的目标调参模式。

一种可能的实现方式中，所述向量编码单元503，还用于当所述目标调参模式为所述负载级别的调参模式时，对所述N个目标特征向量进行融合，以得到融合后的统一向量；

所述第二确定单元504，用于根据所述统一向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括一个目标配置参数组，所述一个目标配置参数组用于在执行所述N个查询语句时调整所述数据库当前所使用的配置参数。

一种可能的实现方式中，所述第二确定单元504，用于当所述目标调参模式为所述聚类级别的调参模式时，根据所述N个目标特征向量和所述数据库的当前状态信息，确定N个配置参数组，其中，N个配置参数组与所述N个目标特征向量一一对应；对所述N个配置参数组进行聚类，以得到Q个目标配置参数组，其中，第一配置参数组对应至少一个目标特征向量，所述第一配置参数组为所述Q个目标配置参数组中的任意一个，所述Q为大于0的整数，且Q＜N，所述第一配置参数组用于在执行所述至少一个目标特征向量对应的查询语句时调整所述数据库当前所使用的配置参数。

一种可能的实现方式中，所述N个查询信息中的第一查询信息包括第一查询类型、第一表信息和查询时所涉及算子的类型和对应的代价信息，所述第一查询信息为所述N个查询信息中的任意一个；

所述第一查询类型用于指示所述第一查询信息所对应的查询语句请求对所述数据库的操作类型；

所述第一表信息用于指示所述第一查询信息所对应的查询语句被所述数据库执行时所涉及的关系表；

所述代价信息用于指示所涉及的算子在执行所述第一查询信息所对应的查询语句时各自的执行代价。

一种可能的实现方式中，所述第一查询信息对应的目标特征向量包括第一查询类型的标识和第二查询类型的标识、第一表信息的标识和第二表信息的标识，以及各类型算子的浮点位；

其中，所述第一查询类型的标识用第一值表示，所述第二查询类型的标识用第二值表示，所述第二查询类型属于所述数据库的查询类型且未包括在所述第一查询信息中；

所述第一表信息的标识用第三值表示，所述第二表信息的标识用第四值表示，所述第二表信息属于所述数据库的表信息且未包括在所述第一查询信息中；

所述各类型算子的浮点位上包括对应类型算子的执行代价。

一种可能的实现方式中，所述对应类型算子的执行代价为归一化后的执行代价。

一种可能的实现方式中，所述第二确定单元504，用于根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集。

一种可能的实现方式中，所述第二确定单元504用于：当所述DS-DRL模型包括预测模型、环境模型和代理模型时；

一种可能的实现方式中，所述第二确定单元504用于：当所述DS-DRL模型为双状态深度确定性策略梯度算法DS-DDPG模型，所述代理模型包括角色actor模型和评分critic模型时；

通过所述actor模型，根据所述模拟状态信息S’，确定推荐配置参数集；

通过所述critic模型，根据所述模拟状态信息S’和所述推荐配置参数集，确定所述推荐配置参数集的评分。

一种可能的实现方式中，所述第二确定单元504，用于通过所述actor模型，根据所述评分更新所述actor模型的权重。

一种可能的实现方式中，所述第二确定单元504，用于通过所述critic模型，根据表现值R，更新所述critic模型的权重。

关于确定数据库的配置参数的装置50的相应内容可以参与上述图8至图15所对应的实施例的相应内容进行理解，本处不做过多赘述。

在硬件实现上，上述确定数据库的配置参数的装置可以为数据库服务器，上述获取单元501、第一确定单元502、向量编码单元503、第二确定单元504和调参单元都可以为处理器，当然获取单元501也可以为通信接口。

图17所示，为本申请的实施例提供的上述实施例中所涉及的数据库服务器60的一种可能的逻辑结构示意图。数据库服务器60包括：处理器601、通信接口602、存储器603以及总线604。处理器601、通信接口602以及存储器603通过总线604相互连接。在本申请的实施例中，处理器601用于对数据库服务器60的动作进行控制管理，例如，处理器601用于执行图9中的步骤201至205和/或用于本文所描述的技术的其他过程。通信接口602用于支持数据库服务器60进行通信。存储器603，用于存储数据库服务器60的程序代码和数据。

其中，处理器601可以是中央处理器单元，通用处理器，数字信号处理器，专用集成电路，现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，数字信号处理器和微处理器的组合等等。总线604可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图17中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请的另一实施例中，还提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当设备的至少一个处理器执行该计算机执行指令时，设备执行上述图8至图15部分实施例所描述的确定数据库的配置参数的方法。

在本申请的另一实施例中，还提供一种计算机程序产品，该计算机程序产品包括计算机执行指令，该计算机执行指令存储在计算机可读存储介质中；设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令，至少一个处理器执行该计算机执行指令使得设备执行上述图8至图15部分实施例所描述的确定数据库的配置参数的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请实施例的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请实施例所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请实施例各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请实施例的具体实施方式，但本申请实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请实施例的保护范围之内。因此，本申请实施例的保护范围应以所述权利要求的保护范围为准。

Claims

一种确定数据库的配置参数的方法，其特征在于，包括：

获取M个客户端发送的N个查询语句，所述M为大于0的整数，所述N为大于0的整数，且N≥M；

从所述N个查询语句中确定N个查询信息，所述N个查询语句与所述N个查询信息一一对应；

对所述N个查询信息进行向量化编码，以得到对应的N个目标特征向量，所述N个查询信息与所述N个目标特征向量一一对应；

根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括至少一个目标配置参数组，所述目标配置参数组包括至少一个配置参数，所述配置参数集用于执行所述N个查询语句。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

响应于模式选择指令，从查询级别的调参模式、负载级别的调参模式和聚类级别的调参模式中确定用于所述N个查询语句的目标调参模式。
根据权利要求2所述的方法，其特征在于，当所述目标调参模式为所述负载级别的调参模式时，所述方法还包括：

对所述N个目标特征向量进行融合，以得到融合后的统一向量；

所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：

根据所述统一向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括一个目标配置参数组，所述一个目标配置参数组用于在执行所述N个查询语句时调整所述数据库当前所使用的配置参数。
根据权利要求2所述的方法，其特征在于，当所述目标调参模式为所述聚类级别的调参模式时，所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：

根据所述N个目标特征向量和所述数据库的当前状态信息，确定N个配置参数组，其中，N个配置参数组与所述N个目标特征向量一一对应；

对所述N个配置参数组进行聚类，以得到Q个目标配置参数组，其中，第一配置参数组对应至少一个目标特征向量，所述第一配置参数组为所述Q个目标配置参数组中的任意一个，所述Q为大于0的整数，且Q＜N，所述第一配置参数组用于在执行所述至少一个目标特征向量对应的查询语句时调整所述数据库当前所使用的配置参数。
根据权利要求1-4任一项所述的方法，其特征在于，所述N个查询信息中的第一查询信息包括第一查询类型、第一表信息和查询时所涉及算子的类型和对应的代价信息，所述第一查询信息为所述N个查询信息中的任意一个；

所述第一查询类型用于指示所述第一查询信息所对应的查询语句请求对所述数据库的操作类型；

所述第一表信息用于指示所述第一查询信息所对应的查询语句被所述数据库执行时所涉及的关系表；

所述代价信息用于指示所涉及的算子在执行所述第一查询信息所对应的查询语句时各自的执行代价。
根据权利要求5所述的方法，其特征在于，

所述第一查询信息对应的目标特征向量包括第一查询类型的标识和第二查询类型的标识、第一表信息的标识和第二表信息的标识，以及各类型算子的浮点位；

其中，所述第一查询类型的标识用第一值表示，所述第二查询类型的标识用第二值表示，所述第二查询类型属于所述数据库的查询类型且未包括在所述第一查询信息中；

所述第一表信息的标识用第三值表示，所述第二表信息的标识用第四值表示，所述第二表信息属于所述数据库的表信息且未包括在所述第一查询信息中；

所述各类型算子的浮点位上包括对应类型算子的执行代价。
根据权利要求6所述的方法，其特征在于，

所述对应类型算子的执行代价为归一化后的执行代价。
根据权利要求1-7任一项所述的方法，其特征在于，所述根据所述N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：

根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集。
根据权利要求8所述的方法，其特征在于，所述DS-DRL模型包括预测模型、环境模型和代理模型；

所述根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集，包括：

通过所述预测模型，根据所述N个目标特征向量预测所述数据库的状态信息变化量ΔS，所述ΔS是执行所述N个查询语句之后相对于执行所述N个查询语句之前的所述数据库的状态信息的变化量；

通过所述环境模型，根据所述ΔS，以及执行所述N个查询语句之前的所述数据库的状态信息S确定模拟所述N个查询语句执行后的所述数据库的模拟状态信息S’；

通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集；

通过所述环境模型，根据所述推荐配置参数集进行模拟配置，并执行所述N个目标特征向量，以更新所述S和S’，并确定所述N个目标特征向量被执行后的表现值R；

通过所述代理模型，根据所述表现值R更新调参策略，并根据更新后的所述S’确定更新的推荐配置参数集；

若所述表现值R满足预设条件，则确定更新的推荐配置参数集为所述配置参数集；

若所述表现值R不满足预设条件，则重复执行上述环境模型更新所述S以及所述S’，以及所述代理模型确定更新的推荐配置参数集的过程直至表现值R满足预设条件，所述满足预设条件的R值所对应的更新的推荐配置参数集为所述配置参数集。
根据权利要求9所述的方法，其特征在于，当所述DS-DRL模型为双状态深度确定性策略梯度算法DS-DDPG模型时，所述代理模型包括角色actor模型和评分critic模型；

所述通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集，包括：

通过所述actor模型，根据所述模拟状态信息S’，确定推荐配置参数集；

通过所述critic模型，根据所述模拟状态信息S’和所述推荐配置参数集，确定所述推荐配置参数集的评分。
根据权利要求10所述的方法，其特征在于，所述根据所述表现值R更新调参策略，包括：

通过所述actor模型，根据所述评分更新所述actor模型的权重。
根据权利要求10或11所述的方法，其特征在于，所述根据所述表现值R更新调参策略，包括：

通过所述critic模型，根据表现值R，更新所述critic模型的权重。
一种确定数据库的配置参数的装置，其特征在于，包括：

获取单元，用于获取M个客户端发送的N个查询语句，所述M为大于0的整数，所述N为大于0的整数，且N≥M；

第一确定单元，用于从所述获取单元获取的N个查询语句中确定N个查询信息，所述N个查询语句与所述N个查询信息一一对应；

向量编码单元，用于对所述第一确定单元确定的N个查询信息进行向量化编码，以得到对应的N个目标特征向量，所述N个查询信息与所述N个目标特征向量一一对应；

第二确定单元，用于根据所述向量编码单元编码得到的N个目标特征向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括至少一个目标配置参数组，所述目标配置参数组包括至少一个配置参数，所述配置参数集用于执行所述N个查询语句。
根据权利要求13所述的装置，其特征在于，所述装置还包括：

第三确定单元，用于响应于模式选择指令，从查询级别的调参模式、负载级别的调参模式和聚类级别的调参模式中确定用于所述获取单元获取的N个查询语句的目标调参模式。
根据权利要求14所述的装置，其特征在于，

所述向量编码单元，还用于当所述目标调参模式为所述负载级别的调参模式时，对所述N个目标特征向量进行融合，以得到融合后的统一向量；

所述第二确定单元，用于根据所述统一向量和所述数据库的当前状态信息，确定与所述N个查询语句对应的所述数据库的配置参数集，所述配置参数集包括一个目标配置参数组，所述一个目标配置参数组用于在执行所述N个查询语句时调整所述数据库当前所使用的配置参数。
根据权利要求14所述的装置，其特征在于，

所述第二确定单元，用于当所述目标调参模式为所述聚类级别的调参模式时，根据所述N个目标特征向量和所述数据库的当前状态信息，确定N个配置参数组，其中，N个配置参数组与所述N个目标特征向量一一对应；对所述N个配置参数组进行聚类，以得到Q个目标配置参数组，其中，第一配置参数组对应至少一个目标特征向量，所述第一配置参数组为所述Q个目标配置参数组中的任意一个，所述Q为大于0的整数，且Q＜N，所述第一配置参数组用于在执行所述至少一个目标特征向量对应的查询语句时调整所述数据库当前所使用的配置参数。
根据权利要求13-16任一项所述的装置，其特征在于，所述N个查询信息中的第一查询信息包括第一查询类型、第一表信息和查询时所涉及算子的类型和对应的代价信息，所述第一查询信息为所述N个查询信息中的任意一个；

所述第一查询类型用于指示所述第一查询信息所对应的查询语句请求对所述数据库的操作类型；

所述第一表信息用于指示所述第一查询信息所对应的查询语句被所述数据库执行时所涉及的关系表；

所述代价信息用于指示所涉及的算子在执行所述第一查询信息所对应的查询语句时各自的执行代价。
根据权利要求17所述的装置，其特征在于，

所述第一查询信息对应的目标特征向量包括第一查询类型的标识和第二查询类型的标识、第一表信息的标识和第二表信息的标识，以及各类型算子的浮点位；

其中，所述第一查询类型的标识用第一值表示，所述第二查询类型的标识用第二值表示，所述第二查询类型属于所述数据库的查询类型且未包括在所述第一查询信息中；

所述第一表信息的标识用第三值表示，所述第二表信息的标识用第四值表示，所述第二表信息属于所述数据库的表信息且未包括在所述第一查询信息中；

所述各类型算子的浮点位上包括对应类型算子的执行代价。
根据权利要求18所述的装置，其特征在于，

所述对应类型算子的执行代价为归一化后的执行代价。
根据权利要求13-19任一项所述的装置，其特征在于，

所述第二确定单元，用于根据所述N个目标特征向量和所述数据库的当前状态信息，使用双状态深度强化学习DS-DRL模型，确定与所述N个查询语句对应的所述数据库的配置参数集。
根据权利要求20所述的装置，其特征在于，

所述第二确定单元用于：当所述DS-DRL模型包括预测模型、环境模型和代理模型时；

通过所述预测模型，根据所述N个目标特征向量预测所述数据库的状态信息变化量ΔS，所述ΔS是执行所述N个查询语句之后相对于执行所述N个查询语句之前的所述数据库的状态信息的变化量；

通过所述环境模型，根据所述ΔS，以及执行所述N个查询语句之前的所述数据库的状态信息S确定模拟所述N个查询语句执行后的所述数据库的模拟状态信息S’；

通过所述代理模型，根据所述模拟状态信息S’，确定推荐配置参数集；

通过所述环境模型，根据所述推荐配置参数集进行模拟配置，并执行所述N个目标特征向量，以更新所述S和S’，并确定所述N个目标特征向量被执行后的表现值R；

通过所述代理模型，根据所述表现值R更新调参策略，并根据更新后的所述S’确定更新的推荐配置参数集；

若所述表现值R满足预设条件，则确定更新的推荐配置参数集为所述配置参数集；

若所述表现值R不满足所述预设条件，则重复执行上述环境模型更新所述S以及所述S’，以及所述代理模型确定更新的推荐配置参数集的过程直至表现值R满足预设条件，所述满足预设条件的R值所对应的更新的推荐配置参数集为所述配置参数集。
根据权利要求21所述的装置，其特征在于，

所述第二确定单元用于：当所述DS-DRL模型为双状态深度确定性策略梯度算法DS-DDPG模型，所述代理模型包括角色actor模型和评分critic模型时；

通过所述actor模型，根据所述模拟状态信息S’，确定推荐配置参数集；

通过所述critic模型，根据所述模拟状态信息S’和所述推荐配置参数集，确定所述推荐配置参数集的评分。
根据权利要求22所述的装置，其特征在于，

所述第二确定单元，用于通过所述actor模型，根据所述评分更新所述actor模型的权重。
根据权利要求22或23所述的装置，其特征在于，

所述第二确定单元，用于通过所述critic模型，根据表现值R，更新所述critic模型的权重。
一种确定数据库的配置参数的装置，其特征在于，所述装置包括至少一个处理器、存储器及存储在所述存储器上并可被所述至少一个处理器执行的指令，其特征在于，所述至少一个处理器执行所述指令，以实现权利要求1至12中任一项所述的方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
一种数据库系统，其特征在于，包括根据权利要求13至26中任一项所述的确定数据库的配置参数的装置和数据库。