CN102354289B

CN102354289B - 一种并发事务的调度方法和相关装置

Info

Publication number: CN102354289B
Application number: CN201110281872A
Authority: CN
Inventors: 赵雷
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2011-09-21
Filing date: 2011-09-21
Publication date: 2012-10-10
Anticipated expiration: 2031-09-21
Also published as: CN102354289A

Abstract

本发明实施例公开了一种并发事务的调度方法和相关装置，用于对事务进行可串行化预判定。本发明实施例方法包括：获取提交队列中每个事务的资源集合；将提交队列中的事务送入等待队列；根据等待队列中每个事务的资源集合，逐一判断等待队列中每个的事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列；将准执行队列分成可执行队列和不可执行队列，并将不可执行队列中的事务送入等待队列，将可执行队列中的事务发送至CPU。通过实行本发明的技术方案，能够避免死锁现象的出现，从而提高了系统整体运行的效率和性能。

Description

一种并发事务的调度方法和相关装置

技术领域

本发明涉及数据库技术领域，尤其涉及一种并发事务的调度方法和相关装置。

背景技术

数据库管理系统是为适应数据处理的需要而发展起来的一种较为理想的数据处理核心机构。数据库管理系统中访问并可能更新数据库中各种数据的一个程序执行单元称为事务，系统中事务的执行靠中央处理器(Central Processing Unit，CPU)来完成。衡量数据库管理系统性能的一个重要指标就是该系统能否为多用户维持高事务吞吐量和低响应时间。另外，数据库管理系统的高事务吞吐量带来数据一致性问题，所谓数据一致性问题就是指多个事务并发执行时，如果对同一项数据进行操作，那么操作结果可能与该多个事务非并发执行时产生的操作结果不一致。所有引起数据一致性问题的原因归结为并发事务之间存在依赖关系，当一个事务或一条结构化查询语言(Structured Query Language，SQL)语句与另一个事务或另一条SQL语句之间存在共享数据对象，且两个事务或两条SQL语句对共享数据对象有写操作，则可判定两个事务或两条SQL语句之间存在依赖关系。

目前，解决数据一致性问题关键在于对并发事务进行可串行化处理，最常用于处理并发事务可串行化的方法是加锁。所谓加锁，即事务对某个数据库中的资源存取前，先向系统提出请求并锁定该资源，该事务获得锁后，即取得对该资源中数据的控制权，在该事务释放锁之前，其他事务不能更新此数据，该事务结束时，即释放被该锁定的资源。

但是，加锁机制实现的是强制性可串行化处理，若加锁机制失效，就会会导致事务执行出现死锁现象，死锁出现后，需要等待一段时间系统才能检测出来，并且至少需要有一个事务放弃执行并回滚到执行前的状态才能解开死锁，降低了系统整体运行的效率和性能。

发明内容

本发明实施例提供了一种并发事务的调度方法和相关装置，用于在事务执行前对所述事务进行可串行化预判定，并将判定后可串行化的事务送入CPU中执行，避免死锁现象的出现，从而提高了系统整体运行的效率和性能。

一种并发事务的调度方法，包括：

获取提交队列中每个事务的资源集合；

将所述提交队列中的事务送入等待队列；

根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中每个的事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列；

将所述准执行队列分成可执行队列和不可执行队列，并将所述不可执行队列中的事务送入所述等待队列，将所述可执行队列中的事务发送至中央处理器CPU，所述可执行队列中的两两事务之间不存在依赖关系，所述不可执行队列中的事务与所述可执行队列中的至少一个事务存在依赖关系。

一种用于并发事务调度的装置，包括：

资源集合获取模块，用于获取提交队列中每个事务的资源集合；

等待队列管理模块，用于将所述提交队列中的事务送入等待队列；

依赖关系判断模块，用于根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中每个的事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列；

事务分离模块，用于将所述准执行队列分成可执行队列和不可执行队列，并将所述不可执行队列中的事务送入所述等待队列，将所述可执行队列中的事务发送至中央处理器CPU，所述可执行队列中的两两事务之间不存在依赖关系，所述不可执行队列中的事务与所述可执行队列中的至少一个事务存在依赖关系。

从以上技术方案可以看出，本发明实施例具有以下优点：

将提交队列中的事务送入等待队列中，通过获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对依赖关系的判断，将所述准执行队列中的事务分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就不会出现死锁现象，从而提高了系统整体运行的效率和性能。

附图说明

图1为本发明第一实施例并发事务调度方法基本流程图；

图2为本发明第一实施例事务流向图；

图3为本发明第二实施例并发事务调度方法详细流程图；

图4为本发明第三实施例并发事务调度方法详细流程图；

图5为本发明第四实施例并发事务调度方法详细流程图；

图6为本发明第四实施例举例事务的资源前趋图；

图7为本发明第五实施例用于并发事务调度的装置基本结构图；

图8为本发明第六实施例用于并发事务调度的装置详细结构图。

具体实施方式

本发明提供了一种并发事务的调度方法，用于在事务执行前对所述事务进行可串行化预判定，并将判定后可串行化的事务送入CPU中执行，避免死锁现象的出现。本方法在数据库管理系统中执行队列中有事务完成或有事务被送入提交队列或两者同时发生时，结束本轮调度，进行下一轮调度。另外，本发明还提供与所述并发事务的调度方法相关的装置。以下分别进行详细的说明。

本发明第一实施例的并发事务的调度方法基本流程请参见图1，调度过程中事务的流向请参见图2，进行本轮调度，必须为数据库管理系统中执行队列中有事务完成或有事务被送入提交队列或两者同时发生，该调度方法主要包括步骤：

101、获取提交队列中每个事务的资源集合。

数据库管理系统获取提交队列中每个事务的资源集合。

其中，资源集合即事务中操作关键字的操作对象的集合，此步骤中获取的提交队列中每个事务的资源集合将于后续步骤中作为判断所述事务与其它队列中事务是否存在依赖关系的依据。

在本实施例中，所有事务都必定先被提交到数据库管理系统中的提交队列，再经由提交队列被送入其它队列中，而获取事务资源集合的操作在是在本步骤中完成，因此在每一轮调度中，其它队列中的事务的资源集合是已知的，因为在本轮调度之前的调度中，其它队列中的事务都曾经作为提交队列中的事务被系统获取过资源集合。

102、将提交队列中的事务送入等待队列。

数据库管理系统将所述提交队列中的事务送入等待队列中，形成新的等待队列，所述事务的流向如图2示，等待队列中的事务等待系统的调度。

103、判断等待队列中每个的事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列，若是，则将等待队列中的事务停留在等待队列中，事务的流向如图2示。

其中，根据步骤101所述，等待队列中的事务的资源集合无须重新获取，因为等待队列中的事务都曾经作为提交队列中的事务被系统获取过资源集合。

104、将准执行队列分成可执行队列和不可执行队列，并将不可执行队列中的事务送入等待队列，将可执行队列中的事务发送至CPU。

其中，所述事务的流向如图2示，所述可执行队列中的两两事务之间不存在依赖关系，所述不可执行队列中的事务与所述可执行队列中的至少一个事务存在依赖关系。

本实施例方法通过获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对准执行队列中事务的依赖关系的判断，将所述准执行队列分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就避免死锁现象的出现，从而提高了系统整体运行的效率和性能。

本发明第二实施例将对第一实施例中的方法进行详细描述，其中，第一实施例中的资源集合具体为读资源集合和写资源集合，相关的获取资源集合的步骤将在本实施例中详细描述。本调度方法详细流程请参见图3，进行本轮调度，必须为数据库管理系统中执行队列中有事务完成或有事务被送入提交队列或两者同时发生，该调度方法主要包括步骤：

301、获取提交队列中每个事务中的每条结构化查询语言SQL语句的资源快照。

数据库管理系统对SQL语句进行预编译，即对其进行语法和词法分析。具体操作是找出SQL语句中的操作关键字和操作对象。SQL语句中的操作关键字有4个：选择select、插入insert、删除delete和更新update，其中，除select为读操作外，其余均为写操作。操作对象是指被操作的数据表。

经过上述语法分析和词法分析，可得到SQL语句的资源快照，资源快照用于指示所述提交队列的事务中的SQL语句的读资源集合和写资源集合。资源快照的形式为：

其中x代表事务的唯一编号，y代表事务中SQL语句的顺序号，集合{A，B}代表读操作的操作对象为表A和表B的数据，集合{C}代表写操作把数据写入操作对象表C。集合{A，B}为SQL语句

的读资源集合，集合{C}为SQL语句

的写资源集合。

302、根据资源快照，获取SQL语句的读资源集合和写资源集合。

资源快照用于指示所述提交队列的事务中的SQL语句的读资源集合和写资源集合，系统可根据资源快照获取SQL语句的读资源集合和写资源集合。

303、合并每个事务中的每条SQL语句的读资源集合为每个事务的读资源集合，合并每个事务中的每条SQL语句的写资源集合为每个事务的写资源集合。

数据库管理系统合并所述提交队列中的每个事务中的每条SQL语句的读资源集合为所述提交队列中的每个事务的读资源集合，合并所述提交队列中的每个事务中的每条SQL语句的写资源集合为所述提交队列中的每个事务的写资源集合。

其中，此步骤中获取的提交队列中每个事务的资源集合将于后续步骤中作为判断所述事务与其它队列中事务是否存在依赖关系的依据。

304、将提交队列中的事务送入等待队列。

数据库管理系统将所述提交队列中的事务送入等待队列中，形成新的等待队列，等待队列中的事务等待系统的调度。

305、判断等待队列中每个的事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列，若是，则将等待队列中的事务停留在等待队列中。

在本实施例中，所有事务都必定先被提交到数据库管理系统中的提交队列，再经由提交队列被送入其它队列中，而获取事务资源集合的操作在是在本步骤中完成，因此在每一轮调度中，其它队列中的事务的资源集合是已知的，因为在本轮调度之前的调度中，其它队列中的事务都曾经作为提交队列中的事务被系统获取过资源集合。所以，等待队列中的事务的资源集合无须重新获取，因为等待队列中的事务都曾经作为提交队列中的事务被系统获取过资源集合。

306、将准执行队列分成可执行队列和不可执行队列，并将不可执行队列中的事务送入等待队列，将可执行队列中的事务发送至CPU。

其中，所述可执行队列中的两两事务之间不存在依赖关系，所述不可执行队列中的事务与所述可执行队列中的至少一个事务存在依赖关系。

本实施例方法通过获取等待队列的每个事务中每条SQL语句的资源集合，再获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对准执行队列中事务的依赖关系的判断，将所述准执行队列分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就避免死锁现象的出现，从而提高了系统整体运行的效率和性能。

本发明第三实施例将对第二实施例中的方法进行详细描述，其中，根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系的步骤将在本实施例中详细描述。本调度方法详细流程请参见图4，进行本轮调度，必须为数据库管理系统中执行队列中有事务完成或有事务被送入提交队列或两者同时发生，该调度方法主要包括步骤：

401、获取提交队列中每个事务中的每条结构化查询语言SQL语句的资源快照。

的读资源集合，集合{C}为SQL语句

的写资源集合。

402、根据资源快照，获取SQL语句的读资源集合和写资源集合。

403、合并每个事务中的每条SQL语句的读资源集合为每个事务的读资源集合，合并每个事务中的每条SQL语句的写资源集合为每个事务的写资源集合。

其中，此步骤中获取的提交队列中每个事务的资源集合将于后续步骤中作为判断所述事务与执行队列中事务是否存在依赖关系的依据。

404、去除执行队列中已完成执行的事务。

其中，执行队列中的已完成执行的事务不会再占用CPU资源，也不会对本轮调度产生影响，故去除。

405、获取去除已完成执行的事务的执行队列中所有事务的读资源集合的并集和写资源集合的并集。

其中，此步骤中获取的所述去除已完成执行的事务的执行队列中所有事务的读资源集合的并集和写资源集合的并集将于后续步骤中作为判断所述事务与等待队列事务队列中事务是否存在依赖关系的依据。

406、将提交队列中的事务送入等待队列。

407、判断执行队列中所有事务的写资源集合的并集与等待队列中每个事务的读资源集合是否存在交集，若否，则触发执行步骤408，若是，则将等待队列中的事务停留在等待队列中。

408、判断执行队列中所有事务的读资源集合的并集与等待队列中每个事务的写资源集合是否存在交集，若否，则触发执行步骤409，若是，则将等待队列中的事务停留在等待队列中。

409、判断执行队列中所有事务的写资源集合的并集与等待队列中每个事务的写资源集合是否存在交集，若否，则将等待队列中的事务送入准执行队列，若是，则将等待队列中的事务停留在等待队列中。

410、将准执行队列分成可执行队列和不可执行队列，并将不可执行队列中的事务送入等待队列，将可执行队列中的事务发送至CPU。

本步骤将准执行队列中的事务分成可执行队列和不可执行队列，并将所述不可执行队列中的事务送入所述等待队列，将所述可执行队列中的事务发送至CPU的具体方法举例：其中等待队列为P，执行队列为E，准执行队列为E_ready，从准执行队列E_ready中任意提取一个事务T_x，计算新的准执行队列E_ready＝E_ready-{T_x}，将事务T_x送入执行队列E中，计算新的执行队列E＝E∪{T_x}，并将事务T_x送入可执行队列M中，计算执行队列E中所有事务的读资源集合的并集R和写资源集合的并集W，根据依赖条件，计算准执行队列E_ready中所有满足下列条件的事务，构成集合E_ready+：准执行队列E_ready中事务的读资源集合与执行队列E中所有事务的写资源集合的并集W的交集为空；准执行队列E_ready中事务的写资源集合与执行队列E中所有事务的读资源集合的并集R的交集为空；准执行队列E_ready中事务的写资源集合与执行队列E中所有事务的写集合的并集W的交集为空。集合E_ready+中和事务与执行队列E中的事务之间没有资源冲突。计算集合E_ready-＝E_ready-E_ready+，计算新的准执行队列E_ready＝E_ready+，将集合E_ready-中的事务送入等待队列P中，计算新的等待队列P＝P∪E_ready-。然后重复执行上述所有操作步骤，直至准执行队列E_ready为空集。

其中，每一轮操作步骤中被送入执行队列E中的事务的集合即为可执行队列，每一轮操作步骤中被送入等待队列P中的事务的集合即为不可执行队列。所述可执行队列中的事务之间不存在依赖关系，所述不可执行队列中的事务与所述可执行队列中的事务存在依赖关系。

本实施例方法通过获取等待队列的每个事务中每条SQL语句的资源集合，再获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对准执行队列中事务的依赖关系的判断，将所述准执行队列中的事务分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就避免死锁现象的出现，从而提高了系统整体运行的效率和性能。

本发明第四实施例将对第三实施例中的方法进行详细描述，其中，将所述可执行队列中的事务发送至CPU的步骤将在本实施例中详细描述。本调度方法详细流程请参见图5，进行本轮调度，必须为数据库管理系统中执行队列中有事务完成或有事务被送入提交队列或两者同时发生，该调度方法主要包括步骤：

501、获取提交队列中每个事务中的每条结构化查询语言SQL语句的资源快照。

的读资源集合，集合{C}为SQL语句

的写资源集合。

502、根据资源快照，获取SQL语句的读资源集合和写资源集合。

503、合并每个事务中的每条SQL语句的读资源集合为每个事务的读资源集合，合并每个事务中的每条SQL语句的写资源集合为每个事务的写资源集合。

504、去除执行队列中已完成执行的事务。

505、获取所述去除已完成执行的事务的执行队列中所有事务的读资源集合的并集和写资源集合的并集。

506、将提交队列中的事务送入等待队列。

507、判断执行队列中所有事务的写资源集合的并集与等待队列中每个事务的读资源集合是否存在交集，若否，则触发执行步骤408，若是，则将等待队列中的事务停留在等待队列中。

508、判断执行队列中所有事务的读资源集合的并集与等待队列中每个事务的写资源集合是否存在交集，若否，则触发执行步骤409，若是，则将等待队列中的事务停留在等待队列中。

509、判断执行队列中所有事务的写资源集合的并集与等待队列中每个事务的写资源集合是否存在交集，若否，则将等待队列中的事务送入准执行队列，若是，则将等待队列中的事务停留在等待队列中。

510、将准执行队列中的事务分成可执行队列和不可执行队列，并将不可执行队列中的事务送入等待队列。

511、为可执行队列中的每个事务建立资源前趋图。

事务中的每条SQL语句在资源前趋图中表示为一个节点。若一个事务中有9条SQL语句，依次为E₁～E₉，任意两条SQL语句：第一SQL语句和第二SQL语句有依赖关系，即第一SQL语句的读资源集合和第二SQL语句的写资源集合的交集不为空，或第一SQL语句的写资源集合和第二SQL语句的读资源集合的交集不为空，或第一SQL语句的写资源集合和第二SQL语句的写资源集合的交集不为空，则在代表第一SQL语句和第二SQL语句的两个节点间画一条有方向的线段，方向为由代表排序较前的SQL语句的节点指向代表排序较后的SQL语句的节点。假设为上述事务建立的资源前趋图如图6。

512、计算资源前趋图的宽度，并根据宽度获取可执行队列中的事务的事务内并行度。

如图6所示的资源前趋图，计算图中入度为0的节点个数，图中只有E₁的入度为0，记资源前趋图宽度为max＝1；去除入度为0的节点和以这些入度为0的节点为起点的有向线段，保留出度为0的节点，此操作步骤后E₁以及以E₁为起点的有向线段被去除，此时入度为0的节点个数为3，这三个节点为E₂、E₃和E₄，因为本操作中入度为0的节点个数比上一操作中入度为0的节点的个数大，则记资源前趋图宽度为max＝3，否则保持max值不变；去除入度为0的节点和以这些入度为0的节点为起点的有向线段，保留出度为0的节点，此操作步骤后入度为0的节点个数为2，这两个节点为E₄和E₅，保持max＝3不变；去除入度为0的节点和以这些入度为0的节点为起点的有向线段，保留出度为0的节点，此操作步骤后入度为0的节点个数为4，这两个节点为E₄、E₆、E₇和E₈，记max＝4；去除入度为0的节点和以这些入度为0的节点为起点的有向线段，保留出度为0的节点，此操作步骤后入度为0的节点个数为3，这三个节点为E₄、E₈和E₉，保持max＝4不变。所以获取到的所述资源前趋图的宽度为4，其事务内事务并行度为4。

513、根据事务内并行度，按照排序规则对可执行队列中的事务进行排序。

其中，排序规则可能是升序排列、降序排列或者其它有规律的排序规则。

514、根据CPU的计算核数量，按照排序规则对系统中的空闲CPU进行排序。

由于目前数据库管理系统越来越多地使用非对称多处理器，平台中每个CPU的核数是不相同的，因此需要事务内并行度的事务分配到核数多的CPU中执行，以提高平台的执行效率。

其中，排序规则可能是升序排列、降序排列或者其它有规律的排序规则，步骤514中所选择的排序规则必须和步骤513中所选择的排序规则一致。

515、将排序后的可执行队列中的事务依次发送至排序后的CPU中。

将所述排序后的可执行队列中的事务依次发送至所述排序后的CPU中，所述CPU执行所述事务。

本实施例方法通过获取等待队列的每个事务中每条SQL语句的资源集合，再获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对准执行队列中事务的依赖关系的判断，将所述准执行队列中的事务分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就避免死锁现象的出现，从而提高了系统整体运行的效率和性能。另外，在非对称处理器平台中使用排序方法将可执行队列中的事务根据事务内并行度进行排序，而多核CPU也用相同的排序方法根据核数进行排序，最后将事务内并行度高的事务分配到核数较多的CPU中执行，将事务内并行度低的事务分配到核数较少的CPU中执行，充分利用CPU资源，提高系统的整体效率。

本发明第五实施例的用于并发事务调度的装置基本结构请参见图7，该装置主要包括：

资源集合获取模块701，新提交的事务被送入提交队列，资源集合获取模块701获取提交队列中每个事务的资源集合。

等待队列管理模块702，资源集合获取模块701获取提交队列中每个事务的资源集合后，等待队列管理模块702将所述提交队列中的事务送入等待队列。

依赖关系判断模块703，根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，若是，则将所述等待队列中的事务停留在等待队列中。

事务分离模块704，接收依赖关系判断模块703送入所述准执行队列中的事务，并将所述事务分成可执行队列和不可执行队列，并将所述不可执行队列中的事务送入所述等待队列，将所述可执行队列中的事务发送至CPU。

本实施例装置通过获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对准执行队列中事务的依赖关系的判断，将所述准执行队列中的事务分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就避免死锁现象的出现，从而提高了系统整体运行的效率和性能。

本发明第六实施例将对第五实施例中的用于并发事务调度的装置进行详细描述，并增加执行队列处理模块和CPU分配模块，所述装置的详细结构请参见图8，该装置主要包括：

资源集合获取模块801，新提交的事务被送入提交队列，资源集合获取模块801获取提交队列中每个事务的资源集合。所述资源集合获取模块801进一步包括：资源快照获取单元8011，接收新提交的事务并送入提交队列，对所述提交队列中每个事务中的每条SQL语句进行预编译，并获取所述SQL语句的资源快照，所述资源快照用于指示所述提交队列的事务中的SQL语句的读资源集合和写资源集合；语句资源集合获取单元8012，根据所述资源快照，获取所述SQL语句的读资源集合和写资源集合；事务资源集合获取单元8013，用于合并所述提交队列中的事务中的每条SQL语句的读资源集合为所述提交队列中的事务的读资源集合，合并所述提交队列中的事务中的每条SQL语句的写资源集合为所述提交队列中的事务的写资源集合。

等待队列管理模块802，资源集合获取模块801获取提交队列中每个事务的资源集合后，等待队列管理模块802将所述提交队列中的事务送入等待队列。

执行队列处理模块803，去除所述执行队列中已完成执行的事务，并获取所述去除已完成执行的事务的执行队列中所有事务的读资源集合的并集和写资源集合的并集。

依赖关系判断模块804，根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中的事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，若是，则将所述等待队列中的事务停留在等待队列中。所述依赖关系判断模块804进一步包括：第一判断单元8041，判断所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的读资源集合是否存在交集；第二判断单元8042，判断所述执行队列中所有事务的读资源集合的并集与所述等待队列中每个事务的写资源集合是否存在交集；第三判断单元8043，用于判断所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的写资源集合是否存在交集。只有第一判断单元8041、第二判断单元8042和第三判断单元8043三者的判断结果同为是时，所述逐一判断所述等待队列中的事务与执行队列中的任一事务是否存在依赖关系的判断结果才为是，否则为否。

事务分离模块805，接收依赖关系判断模块804送入所述准执行队列中的事务，并将所述事务分成可执行队列和不可执行队列，并将所述不可执行队列中的事务送入所述等待队列，将所述可执行队列中的事务发送至CPU分配模块806。

CPU分配模块806，用于为所述可执行队列中的事务分配CPU。所述CPU分配模块806进一步包括：前趋图建立单元8061，为可执行队列中的每个事务建立资源前趋图；并行度计算单元8062，计算所述资源前趋图的宽度，并根据所述宽度获取所述可执行队列中的事务的事务内并行度；事务排序单元8063，根据所述事务内并行度，按照排序规则对所述可执行队列中的事务进行排序；CPU排序单元8064，根据CPU的计算核数量，按照所述排序规则对系统中的空闲CPU进行排序；CPU分配单元8065，用于将所述排序后的可执行队列中的事务依次发送到所述排序后的CPU中，供CPU执行所述事务。

本实施例装置通过获取等待队列的每个事务中每条SQL语句的资源集合，再获取等待队列中每个事务的资源集合，逐一判断所述等待队列中的事务与执行队列中的任一事务是否存在依赖关系，若否，则将所述等待队列中的事务送入准执行队列，再根据对准执行队列中事务的依赖关系的判断，将所述准执行队列中的事务分成可执行队列和不可执行队列。如此处理后的可执行队列中的事务就是可串行化的，所以将可执行队列中的事务送入CPU中执行就不会出现数据一致性问题，因此不须使用加锁机制，也就避免死锁现象的出现，从而提高了系统整体运行的效率和性能。另外，在非对称处理器平台中将可执行队列中的事务根据事务内并行度进行排序，而多核CPU也用相同的排序规则根据核数进行排序，最后将事务内并行度高的事务分配到核数较多的CPU中执行，将事务内并行度低的事务分配到核数较少的CPU中执行，充分利用CPU资源，提高系统的整体效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上对本发明所提供的一种并发事务的调度方法和相关装置进行了详细介绍，对于本领域的一般技术人员，依据本发明实施例的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种并发事务的调度方法，其特征在于，包括：

获取提交队列中每个事务的资源集合；

所述获取提交队列中每个事务的资源集合包括步骤：

获取提交队列中每个事务中的每条结构化查询语言SQL语句的资源快照，所述资源快照用于指示所述提交队列的事务中的SQL语句的读资源集合和写资源集合；

根据所述资源快照，获取所述SQL语句的读资源集合和写资源集合；

合并所述提交队列中的每个事务中的每条SQL语句的读资源集合为所述提交队列中的每个事务的读资源集合，合并所述提交队列中的每个事务中的每条SQL语句的写资源集合为所述提交队列中的每个事务的写资源集合；

将所述提交队列中的事务送入等待队列；

根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列；

所述根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中的每个事务与执行队列中的任一事务是否存在依赖关系包括步骤：

判断所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的读资源集合是否存在交集；

和，

判断所述执行队列中所有事务的读资源集合的并集与所述等待队列中每个事务的写资源集合是否存在交集；

和，

判断所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的写资源集合是否存在交集；

若所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的读资源集合存在交集，所述执行队列中所有事务的读资源集合的并集与所述等待队列中每个事务的写资源集合存在交集，且所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的写资源集合存在交集，则判断结果为所述等待队列中的每个事务与执行队列中的任一事务不存在依赖关系，否则判断结果为所述等待队列中的每个事务与执行队列中的任一事务存在依赖关系；

2.根据权利要求1所述的方法，其特征在于，

所述资源集合包括读资源集合和写资源集合，所述读资源集合为所述提交队列中的事务中读操作的操作对象的集合，所述写资源集合为所述提交队列中的事务中写操作的操作对象的集合。

3.根据权利要求1或2所述的方法，其特征在于，所述获取提交队列中每个事务的资源集合之后进一步包括步骤：

去除执行队列中已完成执行的事务；

获取去除已完成执行的事务的执行队列中所有事务的读资源集合的并集和写资源集合的并集。

4.根据权利要求1或2所述的方法，其特征在于，所述将所述可执行队列中的事务发送至CPU包括步骤：

为可执行队列中的每个事务建立资源前趋图；

计算所述资源前趋图的宽度，并根据所述宽度获取所述可执行队列中的事务的事务内并行度；

根据所述事务内并行度，按照排序规则对所述可执行队列中的事务进行排序；

根据CPU的计算核数量，按照所述排序规则对系统中的空闲CPU进行排序；

将排序后的可执行队列中的事务依次发送至排序后的CPU中。

5.一种用于并发事务调度的装置，其特征在于，包括：

所述资源集合获取模块包括：

预编译单元，用于对所述提交队列中每个事务中的每条结构化查询语言SQL语句进行预编译，并获取所述SQL语句的资源快照，所述资源快照用于指示所述提交队列的事务中的SQL语句的读资源集合和写资源集合；

语句资源集合获取单元，用于根据所述资源快照，获取所述SQL语句的读资源集合和写资源集合；

事务资源集合获取单元，用于合并所述提交队列中的事务中的每条SQL语句的读资源集合为所述提交队列中的事务的读资源集合，合并所述提交队列中的事务中的每条SQL语句的写资源集合为所述提交队列中的事务的写资源集合；

依赖关系判断模块，用于根据所述等待队列中每个事务的资源集合，逐一判断所述等待队列中每个事务与执行队列中的任一事务是否存在依赖关系，若否，则将与执行队列中的任一事务无依赖关系的等待队列中的事务送入准执行队列；

所述依赖关系判断模块包括：

第一判断单元，用于判断所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的读资源集合是否存在交集；

第二判断单元，用于判断所述执行队列中所有事务的读资源集合的并集与所述等待队列中每个事务的写资源集合是否存在交集；

第三判断单元，用于判断所述执行队列中所有事务的写资源集合的并集与所述等待队列中每个事务的写资源集合是否存在交集；

6.根据权利要求5所述的装置，其特征在于，所述装置进一步包括：

执行队列处理模块，用于去除所述执行队列中已完成执行的事务，并获取去除已完成执行的事务的执行队列中所有事务的读资源集合的并集和写资源集合的并集。

7.根据权利要求5或6所述的装置，其特征在于，所述装置进一步包括：CPU分配模块，用于为所述可执行队列中的事务分配CPU，

所述CPU分配模块包括：

前趋图建立单元，用于为可执行队列中的每个事务建立资源前趋图；

并行度计算单元，用于计算所述资源前趋图的宽度，并根据所述宽度获取所述可执行队列中的事务的事务内并行度；

事务排序单元，用于根据所述事务内并行度，按照排序规则对所述可执行队列中的事务进行排序；

CPU排序单元，用于根据CPU的计算核数量，按照所述排序规则对系统中的空闲CPU进行排序；

CPU分配单元，用于将排序后的可执行队列中的事务依次发送到排序后的CPU中。