CN115048220A - 动态数据竞争检测方法、装置、终端及存储介质 - Google Patents
动态数据竞争检测方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN115048220A CN115048220A CN202210699473.XA CN202210699473A CN115048220A CN 115048220 A CN115048220 A CN 115048220A CN 202210699473 A CN202210699473 A CN 202210699473A CN 115048220 A CN115048220 A CN 115048220A
- Authority
- CN
- China
- Prior art keywords
- thread
- buffer area
- current
- size
- dynamic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/544—Buffers; Shared memory; Pipes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5018—Thread allocation
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明提供一种动态数据竞争检测方法、装置、终端及存储介质。该方法包括:初始化各线程的向量时钟,并基于sub‑hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集;根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;根据数据竞争检测结果,调整动态缓冲区的大小。本发明能够减少检测结果误报问题,减少漏报的情形,降低算法复杂度。
Description
技术领域
本发明涉及计算机程序技术领域,尤其涉及一种动态数据竞争检测方法、装置、终端及存储介质。
背景技术
在多线程程序运行过程中,不同线程独立地访问各自的私有变量。而对于共享变量的访问而言,线程之间的读写顺序尤为关键,直接关系到共享变量在内存中的最终状态。
数据竞争是多线程程序中最复杂的一种并发错误,数据竞争必须满足如下条件:存在两个或多个线程对同一处内存进行并发访问、至少有一个访问为写访问操作并且不存在任何的线程同步来控制线程的执行顺序。也就是说至少存在两次访问未定义严格的先后关系,它们之间的执行先后顺序完全依靠操作系统对线程的调度来决定。因此,判定不同线程对共享变量的访问是否存在先后的顺序关系是检测数据竞争的重要依据。
传统的数据竞争检测算法有Djit+算法、FastTrack算法和Lockset算法等。Djit+算法基于向量时钟架构,其基本思想是对每一次共享变量的访问进行记录,然后检测该记录是否和最近的前次访问满足happen-before关系,若不满足,就检测到数据竞争。由此可见,Djit+算法需要较高的算法复杂度。
FastTrack算法采用一种更轻量级的数据结构epoch来进行数据竞争检测,该算法相对于Djit+算法在效率上得到了提高,但其精简向量时钟的同时,只保留了共享变量最近一次的访问信息,在共享读时执行特殊处理,使得该算法丢弃了部分有用的线程执行数据信息。
另外,Djit+和FastTrack算法都受限于完整的happen-before关系。
Lockset算法采用简单的加锁规则来检测数据竞争,也就是说每个共享变量都设置锁保护,对没有被锁保护的共享变量进行访问就会产生数据竞争。Lockset算法是最基础的数据竞争检测算法之一,但是由于其存在较多的误报问题,很少独立使用。
综上所述,Djit+算法和FastTrack算法遵循完整的happen-before关系,通常不存在误报的检测结果,但是其检测的方法只针对某一次特定的程序执行路径而进行,因此其检测结果会因线程调度产生不同的检测路径而受到影响,从而使得其每次检测只能检测出完整结果中的一部分,忽视了可能存在的数据竞争,这样大大增加了整个程序数据竞争检测所要完成的工作。Lockset算法由于使用的加锁规则较为简单,所以该算法有较高的误报率,其检测出的正确结果和错误结果混杂在检测结果中,不易辨别。
发明内容
本发明实施例提供了一种动态数据竞争检测方法、装置、终端及存储介质,以解决现有的数据竞争检测算法中存在的算法复杂度高、误报率高的问题。
第一方面,本发明实施例提供了一种动态数据竞争检测方法,包括:
初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;
根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集,所述锁集包含对应线程持有的全部锁;
根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;
根据数据竞争检测结果,调整动态缓冲区的大小,所述动态缓冲区用于存储各线程中共享变量的访问序列。
在一种可能的实现方式中,所述初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、发送信号和等待信号时同步更新各线程的向量时钟,包括:
初始化各线程的向量时钟时,将当前线程的本地时钟值置为1,其他线程的时钟值置为0;
线程创建时,将子线程的初始化向量时钟与父线程的向量时钟合并取最大值,并赋值给子线程的向量时钟,父线程的本地时钟值加1;
线程等待时,将等待线程的向量时钟与被等待线程的向量时钟合并取最大值,并赋值给等待线程的向量时钟,被等待线程的本地时钟值加1;
线程发送信号时,将当前线程的向量时钟与同步对象的向量时钟合并取最大值,并赋值给同步对象的向量时钟,当前线程的本地时钟加1;
线程接收信号时,将当前线程的向量时钟与同步对象的向量时钟合并取最大值,并赋值给当前线程的向量时钟。
在一种可能的实现方式中,所述根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测,包括:
当前线程读取变量时,根据当前线程的向量时钟值以及当前线程的锁集,进行读写数据竞争检测;
当前线程写入变量时,根据当前线程的向量时钟值以及当前线程的锁集进行写写数据竞争检测以及写读数据竞争检测。
在一种可能的实现方式中,所述当前线程读取变量时,根据当前线程的向量时钟值以及当前线程的锁集,进行读写数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于写访问缓冲区的大小;
当前索引值小于所述写访问缓冲区的大小时,判断当前线程号是否不等于所述写访问缓冲区记录的线程号,并且所述写访问缓冲区记录的线程的本地时钟值是否小于所述写访问缓冲区中第i个位置记录的时钟值,所述i表示当前索引值;
若是,则继续判断当前线程的锁集与所述写访问缓冲区第i个位置记录中锁集的交集是否为空;
若为空,则检测到读写数据竞争,若不为空,则没有检测到读写数据竞争;
将当前索引值加1,并跳转到“判断当前索引值是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若否,则将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
当前索引值大于或等于所述写访问缓冲区的大小时,判断当前线程号是否不等于读访问缓冲区记录的线程号,并且所述读访问缓冲区记录的线程的本地时钟值小于所述读访问缓冲区第i个位置记录的时钟值;
若是,则设置共享读标志为真,并为读缓冲区添加一条新的新纪录;
若否,则直接为所述读缓冲区添加一条新纪录。
在一种可能的实现方式中,所述当前线程写入变量时,根据当前线程的向量时钟值以及当前线程的锁集进行写写数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于写访问缓冲区的大小;
当前索引值小于所述写访问缓冲区的大小时,判断当前线程号是否不等于所述写访问缓冲区记录的线程号,并且所述写访问缓冲区记录的线程的本地时钟值小于所述写访问缓冲区第i个位置记录的时钟值;
若是,则继续判断当前线程的锁集与所述写访问缓冲区第i个位置记录锁集的交集是否为空;
若为空,则检测到读写数据竞争,若不为空,则没有检测到写写数据竞争;
将当前索引值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若否,则将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若当前索引值大于或等于所述写访问缓冲区的大小时,重新初始化索引值,进行写读数据竞争检测。
在一种可能的实现方式中,所述重新初始化索引值,进行写读数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于读访问缓冲区的大小;
若是,则判断当前线程号是否不等于所述读访问缓冲区记录的线程号,并且所述读访问缓冲区记录的线程的本地时钟值小于得到读访问缓冲区第i个位置记录的时钟值;
若是,则继续判断当前线程的锁集与所述读访问缓冲区第i个位置记录锁集的交集是否为空;
若为空,则检测到写读数据竞争,若不为空,则没有检测到写读数据竞争;
将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述读访问缓冲区的大小;
当前索引值大于或等于所述读访问缓冲区的大小时,则设置共享读标志为假,并为写缓冲区添加一条新的新纪录。
在一种可能的实现方式中,所述根据数据竞争检测结果,调整动态缓冲区的大小,包括:
判断检测到的数据竞争数量是否大于0,并且当前动态缓冲区的大小是否小于所述动态缓冲区的预设上限;
若是,则将当前动态缓冲区的大小扩大一倍,并继续判断当前动态缓冲区的大小是否大于所述动态缓冲区的预设上限;
若当前动态缓冲区的大小大于所述动态缓冲区的预设上限,将当前缓冲区的大小设置为所述动态缓冲区的新的预设上限;
若当前动态缓冲区的大小不大于所述动态缓冲区的预设上限,不对所述动态缓冲区的预设上限进行改动;
若否,则继续判断所述动态缓冲区的访问次数是否大于当前动态缓冲区大小的预设倍数;
若是,则将当前动态缓冲区的大小缩减一半,并继续判断当前动态缓冲区的大小是否小于所述动态缓冲区的预设下限;
若当前动态缓冲区的大小小于所述动态缓冲区的预设下限,则将当前动态缓冲区的大小设定为所述动态缓冲区的新的预设下限,并将所述动态缓冲区的访问次数设为1;
若当前动态缓冲区的大小大于或等于所述动态缓冲区的预设下限,则直接将所述动态缓冲区的访问次数设为1。
第二方面,本发明实施例提供了一种动态数据竞争检测装置,包括:
向量时钟模块,用于初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;
锁集更新模块,用于根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集,所述锁集包含对应线程持有的全部锁;
检测模块,用于根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;
调整模块,用于根据数据竞争检测结果,调整动态缓冲区的大小,所述动态缓冲区用于存储各线程中共享变量的访问序列。
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
本发明实施例提供一种动态数据竞争检测方法、装置、终端及存储介质,通过初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集;根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;根据数据竞争检测结果,调整动态缓冲区的大小;通过基于sub-hb关系更新向量时钟,从而使得线程调度的敏感度降低,减少检测结果误报问题;通过采用动态缓冲区对读写访问信息进行记录,能够减少漏报的情形,从而减少检测工作,降低算法复杂度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的动态数据竞争检测方法的实现流程图;
图2是本发明实施例提供的更新向量时钟的的实现流程图;
图3是本发明实施例提供的读写数据竞争检测的实现流程图;
图4是本发明实施例提供的写读数据竞争检测以及写写数据竞争检测的实现流程图;
图5是本发明实施例提供的调整动态缓冲区大小的的实现流程图;
图6是本发明实施例提供的表示各类数据竞争检测算法响应时间的柱状示意图;
图7是本发明实施例提供的动态数据竞争检测装置的结构示意图;
图8是本发明实施例提供的终端的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
图1为本发明实施例提供的动态数据竞争检测方法的实现流程图,详述如下:
步骤101,初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;
具体参见图2,初始化各线程的向量时钟时,将当前线程的本地时钟值置为1,其他线程的时钟值置为0;
线程创建时,将子线程的初始化向量时钟与父线程的向量时钟合并取最大值,并赋值给子线程的向量时钟,父线程的本地时钟值加1;
线程等待时,将等待线程的向量时钟与被等待线程的向量时钟合并取最大值,并赋值给等待线程的向量时钟,被等待线程的本地时钟值加1;
线程发送信号时,将当前线程的向量时钟与同步对象的向量时钟合并取最大值,并赋值给同步对象的向量时钟,当前线程的本地时钟加1;
线程接收信号时,将当前线程的向量时钟与同步对象的向量时钟合并取最大值,并赋值给当前线程的向量时钟。
为了减少数据竞争检测对线程的敏感度,本方法并不遵循完整的happen-before关系。本方法在线程进行加锁和解锁时不改变向量时钟的状态,这减小了加解锁顺序给检测结果带来的的影响,并且不将锁对象设置为同步对象,使得其不具有向量时钟,锁对象也不会对线程的向量时钟带来影响。本方法只有在线程创建、线程等待、线程发送信号以及线程接受信号等确定性同步操作时才按照Djit+算法中的操作更新同步对象以及线程的向量时钟。
本发明实施例把这种优化后的happen-before关系定义为sub-hb关系。在某一数据竞争检测的执行过程中,sub-hb关系的空间是happen-before空间的子空间。因此,sub-hb关系具有更好的的稳定性,即使在线程调度信息不确定的情形下,sub-hb关系依然可以保持较高的一致性,从而大大减小了对线程调度的依赖性。
步骤102,根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集,锁集包含对应线程持有的全部锁;
需要说明的是:线程的加锁和解锁只影响线程锁集的集合,并不影响线程的向量时钟。
步骤103,根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;
可选的,当前线程读取变量时,根据当前线程的向量时钟值以及当前线程的锁集,进行读写数据竞争检测;
当前线程写入变量时,根据当前线程的向量时钟值以及当前线程的锁集进行写写数据竞争检测以及写读数据竞争检测。
进一步地,参见图3,当前线程读取变量时,根据当前线程的向量时钟值以及当前线程的锁集,进行读写数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于写访问缓冲区的大小;
当前索引值小于所述写访问缓冲区的大小时,判断当前线程号是否不等于所述写访问缓冲区记录的线程号,并且所述写访问缓冲区记录的线程的本地时钟值是否小于所述写访问缓冲区中第i个位置记录的时钟值,所述i表示当前索引值;
若是,则继续判断当前线程的锁集与所述写访问缓冲区第i个位置记录中锁集的交集是否为空;
若为空,则检测到读写数据竞争,若不为空,则没有检测到读写数据竞争;
将当前索引值加1,并跳转到“判断当前索引值是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若否,则将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
当前索引值大于或等于所述写访问缓冲区的大小时,判断当前线程号是否不等于读访问缓冲区记录的线程号,并且所述读访问缓冲区记录的线程的本地时钟值小于所述读访问缓冲区第i个位置记录的时钟值;
若是,则设置共享读标志为真,并为所述读缓冲区添加一条新的新纪录;
若否,则直接为所述读缓冲区添加一条新纪录。
进一步地,参见图4,当前线程写入变量时,根据当前线程的向量时钟值以及当前线程的锁集进行写写数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于写访问缓冲区的大小;
当前索引值小于所述写访问缓冲区的大小时,判断当前线程号是否不等于所述写访问缓冲区记录的线程号,并且所述写访问缓冲区记录的线程的本地时钟值小于所述写访问缓冲区第i个位置记录的时钟值;
若是,则继续判断当前线程的锁集与所述写访问缓冲区第i个位置记录锁集的交集是否为空;
若为空,则检测到读写数据竞争,若不为空,则没有检测到写写数据竞争;
将当前索引值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若否,则将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若当前索引值大于或等于所述写访问缓冲区的大小时,重新初始化索引值,进行写读数据竞争检测。
进一步可选地,重新初始化索引值,进行写读数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于读访问缓冲区的大小;
若是,则判断当前线程号是否不等于所述读访问缓冲区记录的线程号,并且所述读访问缓冲区记录的线程的本地时钟值小于得到读访问缓冲区第i个位置记录的时钟值;
若是,则继续判断当前线程的锁集与所述读访问缓冲区第i个位置记录锁集的交集是否为空;
若为空,则检测到写读数据竞争,若不为空,则没有检测到写读数据竞争;
将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述读访问缓冲区的大小;
当前索引值大于或等于所述读访问缓冲区的大小时,则设置共享读标志为假,并为写缓冲区添加一条新的新纪录。
步骤104,根据数据竞争检测结果,调整动态缓冲区的大小,所述动态缓冲区用于存储各线程中共享变量的访问序列。
可选的,参见图5,根据数据竞争检测结果,调整动态缓冲区的大小,包括:
判断检测到的数据竞争数量是否大于0,并且当前动态缓冲区的大小是否小于所述动态缓冲区的预设上限;
若是,则将当前动态缓冲区的大小扩大一倍,并继续判断当前动态缓冲区的大小是否大于所述动态缓冲区的预设上限;
若当前动态缓冲区的大小大于所述动态缓冲区的预设上限,将当前缓冲区的大小设置为所述动态缓冲区的新的预设上限;
若当前动态缓冲区的大小不大于所述动态缓冲区的预设上限,不对所述动态缓冲区的预设上限进行改动;
若否,则继续判断所述动态缓冲区的访问次数是否大于当前动态缓冲区大小的预设倍数;
若是,则将当前动态缓冲区的大小缩减一半,并继续判断当前动态缓冲区的大小是否小于所述动态缓冲区的预设下限;
若当前动态缓冲区的大小小于所述动态缓冲区的预设下限,则将当前动态缓冲区的大小设定为所述动态缓冲区的新的预设下限,并将所述动态缓冲区的访问次数设为1;
若当前动态缓冲区的大小大于或等于所述动态缓冲区的预设下限,则直接将所述动态缓冲区的访问次数设为1。
数据竞争检测完成后调整动态缓冲区状态。缓冲区设置过大,会增加数据竞争检测时的开销,设置过小,造成空间不足和频繁扩容的问题,因此,本方法在数据竞争检测结束后根据检测的状态和缓冲区访问状态动态调整缓冲区的大小。
下面结合具体的实验数据来对本发明实施例中的动态数据检测方法的可行性进行说明:
采用典型的多线程程序Apache的httpd服务器,该服务器通过生成多个线程来应对大量的请求。实验对httpd服务器采用不同程度的压力测试。首先在Pin的框架下执行httpd,并链接不同的对比算法实现的Pintool,然后使用压测工具Apache-benchmark本地对httpd服务器进行访问,从Pintool的检测结果中得到数据竞争检测的个数。
采用压测工具Apache-benchmark向本地httpd服务器执行100次请求的实验结果,其中最高并行请求量为50。分别使用Djit+算法、FastTrack算法以及本发明实施例公开的动态数据竞争检测方法(CachedTrack)检测。其中CachedTrack的动态缓冲区大小的上限为8,下限为1。数据竞争检测结果如表1所示:
实验编号 | Djit+ | FastTrack | CachedTrack |
1 | 644 | 42 | 1321 |
2 | 88 | 371 | 1343 |
3 | 596 | 381 | 1319 |
4 | 93 | 41 | 1338 |
5 | 661 | 375 | 1325 |
表1Apache-benchmark数据竞争检测结果
从表1中可以看出CachedTrack的检测数量高于Djit+和FastTrack,这是由于CachedTrack可以根据当前线程的执行过程预测可能的执行过程,从而进行竞争预测,检测结果中不仅含有了已产生的数据竞争,还包含了在此次执行过程没有发生,但是在其他执行过程上可能发生的竞争,也就是潜在的数据竞争。
进一步,为了对比每种检测算法对程序执行所产生的消耗,同样在Pin框架下运行Apache,通过压测工具Apache-benchmark对本地httpd服务器进行压力测试,测试结果中的数据用来表明服务器的响应速度,从而判断算法对程序运行带来的影响,也就是检测算法产生消耗的相对大小。
采用Apache-benchmark执行压测时,需要设置总的请求量以及最大并发请求量。在检测结果中,每个请求的处理时间能最直接地反应服务器的效率。进行实验时,维持总请求量为10000,分别设置50、100、150、200、250的并发请求量进行压测。首先在Pin框架下执行Apache,不进行数据竞争检测,然后分别采用Djit+、FastTrack与CachedTrack进行检测,得到不同算法检测情况下,每个请求的平均响应时间。
参见图6,单纯在Pin下运行Apache而不进行数据竞争检测,平均响应时间在0.5毫秒左右,而执行数据竞争检测算法后,响应时间会明显增加。其中,使用Djit+算法检测的响应时间最长,FastTrack算法次之,与两者算法复杂度相吻合,FastTrack将Djit+算法中的大多数的O(n)操作优化为O(1)。CachedTrack采用了FastTrack的基本思想,但是并不遵循完整的happen-before关系,而是使用精简的sub-hub。在Djit+算法与FastTrack算法中,加锁和解锁操作都要进行复杂度为O(n)的向量时钟归并操作,而在CachedTrack中加锁和解锁时,向量时钟并没有发生变化,从这一方面来说,CachedTrack节省了大量的向量时钟合并操作时间,所以在效率上高于FastTrack。
本发明的有益效果如下:
1、优化了Djit+算法和FastTrack算法中的happen-before关系,对于该关系中的加锁和解锁操作不再更新向量时钟,从而使得线程调度的敏感度降低。在并发访问之间,结合Lockset检测算法,优化了判断并发访问是否存在数据竞争的过程。
2、本发明提出了动态缓冲区的概念,精简了FastTrack算法的向量时钟,降低了缓冲区记录信息中可能存在的问题。采用动态缓冲区对多次读写访问信息进行记录,从而减少漏报的情形,并预测潜在的数据竞争。
3、本发明提出的动态缓冲区可以根据访问信息动态调整缓冲区的大小,最大限度地降低缓冲区所产出的消耗,使得部分检测的复杂度与FastTrack算法相近,又可以增加数据竞争检测的数量。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
图7示出了本发明实施例提供的动态数据竞争检测装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
如图7所示,动态数据竞争检测装置7包括:向量时钟模块71、锁集更新模块72、检测模块73和调整模块74。
向量时钟模块71,用于初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;
锁集更新模块72,用于根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集,所述锁集包含对应线程持有的全部锁;
检测模块73,用于根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;
调整模块74,用于根据数据竞争检测结果,调整动态缓冲区的大小,所述动态缓冲区用于存储各线程中共享变量的访问序列。
本发明实施例通过向量时钟模块71,用于初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;锁集更新模块72,用于根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集锁;检测模块73,用于根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;调整模块74,用于根据数据竞争检测结果,调整动态缓冲区的大小;通过基于sub-hb关系更新向量时钟,从而使得线程调度的敏感度降低,减少检测结果误报问题;通过采用动态缓冲区对读写访问信息进行记录,能够减少漏报的情形,从而减少检测工作,降低算法复杂度。
图8是本发明实施例提供的终端的示意图。如图8所示,该实施例的终端8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82。所述处理器80执行所述计算机程序82时实现上述各个动态数据竞争检测方法实施例中的步骤,例如图1所示的步骤101至步骤104。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如图7所示模块/单元71至74的功能。
示例性的,所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述终端8中的执行过程。例如,所述计算机程序82可以被分割成图7所示的模块/单元71至74。
所述终端8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端8可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端8的示例,并不构成对终端8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81可以是所述终端8的内部存储单元,例如终端8的硬盘或内存。所述存储器81也可以是所述终端8的外部存储设备,例如所述终端8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述终端8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个动态数据竞争检测方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种动态数据竞争检测方法,其特征在于,包括:
初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;
根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集,所述锁集包含对应线程持有的全部锁;
根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;
根据数据竞争检测结果,调整动态缓冲区的大小,所述动态缓冲区用于存储各线程中共享变量的访问序列。
2.根据权利要求1所述的动态数据竞争检测方法,其特征在于,所述初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、发送信号和等待信号时同步更新各线程的向量时钟,包括:
初始化各线程的向量时钟时,将当前线程的本地时钟值置为1,其他线程的时钟值置为0;
线程创建时,将子线程的初始化向量时钟与父线程的向量时钟合并取最大值,并赋值给子线程的向量时钟,父线程的本地时钟值加1;
线程等待时,将等待线程的向量时钟与被等待线程的向量时钟合并取最大值,并赋值给等待线程的向量时钟,被等待线程的本地时钟值加1;
线程发送信号时,将当前线程的向量时钟与同步对象的向量时钟合并取最大值,并赋值给同步对象的向量时钟,当前线程的本地时钟加1;
线程接收信号时,将当前线程的向量时钟与同步对象的向量时钟合并取最大值,并赋值给当前线程的向量时钟。
3.根据权利要求1所述的动态数据竞争检测方法,其特征在于,所述根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测,包括:
当前线程读取变量时,根据当前线程的向量时钟值以及当前线程的锁集,进行读写数据竞争检测;
当前线程写入变量时,根据当前线程的向量时钟值以及当前线程的锁集进行写写数据竞争检测以及写读数据竞争检测。
4.根据权利要求3所述的动态数据竞争检测方法,其特征在于,所述当前线程读取变量时,根据当前线程的向量时钟值以及当前线程的锁集,进行读写数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于写访问缓冲区的大小;
当前索引值小于所述写访问缓冲区的大小时,判断当前线程号是否不等于所述写访问缓冲区记录的线程号,并且所述写访问缓冲区记录的线程的本地时钟值是否小于所述写访问缓冲区中第i个位置记录的时钟值,所述i表示当前索引值;
若是,则继续判断当前线程的锁集与所述写访问缓冲区第i个位置记录中锁集的交集是否为空;
若为空,则检测到读写数据竞争,若不为空,则没有检测到读写数据竞争;
将当前索引值加1,并跳转到“判断当前索引值是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若否,则将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
当前索引值大于或等于所述写访问缓冲区的大小时,判断当前线程号是否不等于读访问缓冲区记录的线程号,并且所述读访问缓冲区记录的线程的本地时钟值小于所述读访问缓冲区第i个位置记录的时钟值;
若是,则设置共享读标志为真,并为读缓冲区添加一条新的新纪录;
若否,则直接为所述读缓冲区添加一条新纪录。
5.根据权利要求3所述的动态数据竞争检测方法,其特征在于,所述当前线程写入变量时,根据当前线程的向量时钟值以及当前线程的锁集进行写写数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于写访问缓冲区的大小;
当前索引值小于所述写访问缓冲区的大小时,判断当前线程号是否不等于所述写访问缓冲区记录的线程号,并且所述写访问缓冲区记录的线程的本地时钟值小于所述写访问缓冲区第i个位置记录的时钟值;
若是,则继续判断当前线程的锁集与所述写访问缓冲区第i个位置记录锁集的交集是否为空;
若为空,则检测到读写数据竞争,若不为空,则没有检测到写写数据竞争;
将当前索引值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若否,则将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述写访问缓冲区的大小;
若当前索引值大于或等于所述写访问缓冲区的大小时,重新初始化索引值,进行写读数据竞争检测。
6.根据权利要求5所述的动态数据竞争检测方法,其特征在于,所述重新初始化索引值,进行写读数据竞争检测,包括:
初始化索引值;
判断当前索引值是否小于读访问缓冲区的大小;
若是,则判断当前线程号是否不等于所述读访问缓冲区记录的线程号,并且所述读访问缓冲区记录的线程的本地时钟值小于得到读访问缓冲区第i个位置记录的时钟值;
若是,则继续判断当前线程的锁集与所述读访问缓冲区第i个位置记录锁集的交集是否为空;
若为空,则检测到写读数据竞争,若不为空,则没有检测到写读数据竞争;
将当前索引的值加1,并跳转到“判断当前索引i是否小于写访问缓冲区的大小”的步骤,重新判断并执行后续步骤,直至当前索引值大于或等于所述读访问缓冲区的大小;
当前索引值大于或等于所述读访问缓冲区的大小时,则设置共享读标志为假,并为写缓冲区添加一条新的新纪录。
7.根据权利要求1所述的动态数据竞争检测方法,其特征在于,所述根据数据竞争检测结果,调整动态缓冲区的大小,包括:
判断检测到的数据竞争数量是否大于0,并且当前动态缓冲区的大小是否小于所述动态缓冲区的预设上限;
若是,则将当前动态缓冲区的大小扩大一倍,并继续判断当前动态缓冲区的大小是否大于所述动态缓冲区的预设上限;
若当前动态缓冲区的大小大于所述动态缓冲区的预设上限,将当前缓冲区的大小设置为所述动态缓冲区的新的预设上限;
若当前动态缓冲区的大小不大于所述动态缓冲区的预设上限,不对所述动态缓冲区的预设上限进行改动;
若否,则继续判断所述动态缓冲区的访问次数是否大于当前动态缓冲区大小的预设倍数;
若是,则将当前动态缓冲区的大小缩减一半,并继续判断当前动态缓冲区的大小是否小于所述动态缓冲区的预设下限;
若当前动态缓冲区的大小小于所述动态缓冲区的预设下限,则将当前动态缓冲区的大小设定为所述动态缓冲区的新的预设下限,并将所述动态缓冲区的访问次数设为1;
若当前动态缓冲区的大小大于或等于所述动态缓冲区的预设下限,则直接将所述动态缓冲区的访问次数设为1。
8.一种动态数据竞争检测装置,其特征在于,包括:
向量时钟模块,用于初始化各线程的向量时钟,并基于sub-hb关系在线程创建、线程等待、线程发送信号和线程等待信号时同步更新各线程的向量时钟;
锁集更新模块,用于根据各线程获取锁和释放锁的状态,分别更新各线程对应的锁集,所述锁集包含对应线程持有的全部锁;
检测模块,用于根据各线程的向量时钟值以及各线程的锁集,对各线程进行数据竞争检测;
调整模块,用于根据数据竞争检测结果,调整动态缓冲区的大小,所述动态缓冲区用于存储各线程中共享变量的访问序列。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210699473.XA CN115048220A (zh) | 2022-06-20 | 2022-06-20 | 动态数据竞争检测方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210699473.XA CN115048220A (zh) | 2022-06-20 | 2022-06-20 | 动态数据竞争检测方法、装置、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115048220A true CN115048220A (zh) | 2022-09-13 |
Family
ID=83163039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210699473.XA Pending CN115048220A (zh) | 2022-06-20 | 2022-06-20 | 动态数据竞争检测方法、装置、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115048220A (zh) |
-
2022
- 2022-06-20 CN CN202210699473.XA patent/CN115048220A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8364909B2 (en) | Determining a conflict in accessing shared resources using a reduced number of cycles | |
US8473963B2 (en) | Synchronizing multiple threads efficiently | |
US11386065B2 (en) | Database concurrency control through hash-bucket latching | |
US8108659B1 (en) | Controlling access to memory resources shared among parallel synchronizable threads | |
CN105511969B (zh) | 一种跨进程的线程间进行互斥的方法 | |
CN109471718B (zh) | 基于人脸识别的计算资源配置方法、装置、设备及介质 | |
CN108572876B (zh) | 一种读写锁的实现方法及装置 | |
US20080059808A1 (en) | Managing data access via a loop only if changed locking facility | |
US20190042615A1 (en) | Hybrid concurrency control | |
CN112231070A (zh) | 数据写入、读取方法、装置及服务器 | |
CN111459691A (zh) | 共享内存的读写方法及装置 | |
CN106844215B (zh) | 一种基于约束求解的原子违背探测方法 | |
US20120059997A1 (en) | Apparatus and method for detecting data race | |
CN109063091A (zh) | 混合编码的数据迁移方法、数据迁移装置和存储介质 | |
US8789060B1 (en) | Deterministic, parallel execution with overlapping regions | |
CN109885489B (zh) | 驱动程序中数据竞争检测方法及装置 | |
US8688872B2 (en) | Method and device for managing queues, and corresponding computer program product | |
US8341368B2 (en) | Automatic reallocation of structured external storage structures | |
CN111752715A (zh) | 大量请求量下的系统优化方法、装置、设备及存储介质 | |
CN111522730A (zh) | 程序测试方法及装置、计算机装置、计算机可读介质 | |
CN115048220A (zh) | 动态数据竞争检测方法、装置、终端及存储介质 | |
CN109241039B (zh) | 一种全局唯一参数化文件的实现方法、系统、服务器及存储介质 | |
CN105094993A (zh) | 一种多核处理器、数据同步的方法及装置 | |
US20140189712A1 (en) | Memory Address Collision Detection Of Ordered Parallel Threads With Bloom Filters | |
CN115114612A (zh) | 访问处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |