CN107783904B - 单元测试桩去重方法、装置、计算机可读存储介质及设备 - Google Patents
单元测试桩去重方法、装置、计算机可读存储介质及设备 Download PDFInfo
- Publication number
- CN107783904B CN107783904B CN201710889793.0A CN201710889793A CN107783904B CN 107783904 B CN107783904 B CN 107783904B CN 201710889793 A CN201710889793 A CN 201710889793A CN 107783904 B CN107783904 B CN 107783904B
- Authority
- CN
- China
- Prior art keywords
- function
- verified
- fingerprint
- memory
- unit test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/362—Software debugging
- G06F11/3624—Software debugging by performing operations on the source code, e.g. via a compiler
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明涉及软件开发技术领域,尤其涉及单元测试桩去重方法、装置、计算机可读存储介质及设备,方法包括:基于文件属性参数,对待去重的多个单元测试桩进行去重处理;将去重处理后保留下的各个单元测试桩分别转换为字节码;对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;若存在与待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与待验证函数指纹相同的函数指纹,并将待验证函数指纹保存在内存中;若不存在与待验证函数指纹相同的函数指纹,则将待验证函数指纹保存在内存中。本申请提高了去重效率和准确率,进而提高了单元测试的速度。
Description
技术领域
本发明涉及软件开发技术领域,尤其涉及单元测试桩去重方法、装置、计算机可读存储介质及设备。
背景技术
在应用程序开发过程中,单元测试是程序正式提交给测试人员进行大规模功能测试前的一个重要且必要的环节。单元测试是指对程序中最小可测试单元进行逻辑检查和验证,其中,单元就是规定的最小的被测功能模块。
在安卓(Android)应用的开发过程中,单元测试分为:Java虚拟机单元测试(JVMTest)和设备测试(Instrumentation Test)。其中,对于JVM Test而言,一般通过运行由纯Java代码编写的测试桩(Test Case)实现,无需依赖其他组件,由于代码运行于JVM虚拟机上,因此测试速度较快;对于Instrumentation Test而言,由于这类测试需要依赖Android系统提供的组件,因此需要在真机或者模拟器上部署运行,并需要进行预编译,因此测试速度较慢。
而无论是采用上述的JVM Test还是Instrumentation Test,在单元测试过程中,随着应用程序业务量的增大,编写单元测试桩(case)数量也变得庞大,然而,在现有技术中,往往会存在很多重复编写的单元测试桩,这些重复的单元测试桩将会降低单元测试的速度。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的单元测试桩去重方法、装置、计算机可读存储介质及设备。
本发明实施例提供一种单元测试桩去重方法,所述方法包括:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
将去重处理后保留下的各个单元测试桩分别转换为字节码;
对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
优选的,所述文件属性参数包括文件名、文件大小和文件时间戳中的至少一种。
优选的,对于去重处理后保留下的每个单元测试桩而言,将所述单元测试桩转换为所述字节码,包括:
提取所述单元测试桩中的字符;
将提取出的字符拼接成字符串;
判断所述字符串的长度是否超过预设长度阈值;
若所述字符串的长度超过所述预设长度阈值,则以所述预设长度阈值对所述字符串进行循环分割,获得包含多个子字符串的字符串序列,并将所述字符串序列作为与所述单元测试桩对应的所述字节码;
若所述字符串的长度未超过预设长度阈值,则将所述字符串作为与所述单元测试桩对应的所述字节码。
优选的,所述预设长度阈值为1兆。
优选的,所述对各个字节码进行指纹生成操作,包括:
利用MD5算法对各个字节码进行指纹生成操作。
优选的,所述MD5算法的划分单元长度为2048比特。
本发明实施例提供一种单元测试桩去重装置,所述装置包括:
去重模块,用于基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
转换模块,用于将去重处理后保留下的各个单元测试桩分别转换为字节码;
指纹获得模块,用于对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
判断模块,用于分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
第一处理模块,用于若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
第二处理模块,用于若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
优选的,所述文件属性参数包括文件名、文件大小和文件时间戳中的至少一种。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
将去重处理后保留下的各个单元测试桩分别转换为字节码;
对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
本发明实施例提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
将去重处理后保留下的各个单元测试桩分别转换为字节码;
对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
本申请通过先基于文件属性参数,对待去重的多个单元测试桩进行去重处理,以降低后续精细去重处理操作的文件量,提高精细去重处理操作的效率,再将去重处理后保留的各个单元测试桩分别转换为字节码,对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹,接着,分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹,若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中,若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中,以实现精细去重处理操作,本申请通过两次去重处理操作,提高了去重效率和准确率,进而提高了单元测试的速度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考图形表示相同的部件。在附图中:
图1示出了本发明实施例中的单元测试桩去重方法的流程图;
图2示出了本发明实施例中的单元测试桩去重装置的结构图;
图3示出了本发明实施例中的计算机设备的实体结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例提供一种单元测试桩去重方法,该方法可以被应用于Android系统中,且,该方法的编码语言可以为Java。如图1所示,所述方法包括:
步骤101:基于文件属性参数,对待去重的多个单元测试桩进行文件去重处理。
针对步骤101而言,在具体实施过程中,首先对待去重的多个单元测试桩进行粗去重操作,即,通过判断文件属性参数是否相同,将具有相同的文件属性参数的多个单元测试桩进行去重,其中,文件属性参数包括文件名、文件大小和文件时间戳中的至少一种。例如,当文件属性参数仅包含文件名时,待去重的多个单元测试桩分别为第一单元测试桩、第二单元测试桩和第三单元测试桩,第一单元测试桩的文件名为A,第二单元测试桩的文件名为A,第三单元测试桩的文件名为B,则,通过执行步骤101,对第一单元测试桩、第二单元测试桩和第三单元测试桩进行去重处理,去除文件名重复的单元测试桩,最后保留下的单元测试桩可以为:第一单元测试桩和第三单元测试桩,也可以为:第二单元测试桩和第三单元测试桩。
需要说明的是,步骤101中的去重处理属于文件级去重处理操作,可以利用Android系统的智能检索技术实现该文件级去重处理操作,同时,该操作的目的在于降低后续精细去重处理操作的文件量,减少文件体积,提高精细去重处理操作的效率。
进一步,在完成步骤101之后,执行步骤102:将去重处理后保留下的各个单元测试桩分别转换为字节码。
对于步骤102而言,一个单元测试桩对应一个字节码,即,去重处理后保留下多少单元测试桩则分别进行多少次转换,并获得对应数量的字节码,例如,当去重处理后保留下两个单元测试桩,分别为第一单元测试桩和第三单元测试桩,则通过步骤102,将第一单元测试桩转换为第一字节码,将第三单元测试桩转换为第二字节码。
进一步,对于如何将一个单元测试桩转换为一个字节码,本申请提供一种优选的实施例,在该优选的实施例中,包括:
步骤1021:提取单元测试桩中的字符;
步骤1022:将提取出的字符拼接成字符串;
步骤1023:判断字符串的长度是否超过预设长度阈值;
步骤1024:若字符串的长度超过预设长度阈值,则以预设长度阈值对字符串进行循环分割,获得包含多个子字符串的字符串序列,并将字符串序列作为与单元测试桩对应的字节码;若字符串的长度未超过预设长度阈值,则将字符串作为与单元测试桩对应的字节码。
在具体实施过程中,预设长度阈值可以为1兆(M),本申请通过对字符串的长度进行判断,并在字符串的长度超过预设长度阈值后,对其进行循环分割,有效地防止了字符串长度过长所导致的内存溢出。
进一步,在完成步骤102之后,执行步骤103:对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹。
针对步骤103而言,在通过步骤102获得各个单元测试桩对应的字节码之后,分别对每个字节码进行指纹生成操作,对应获得与各个字节码对应的待验证函数指纹,例如,在获得第一字节码和第二字节码之后,分别对第一字节码进行指纹生成操作,获得第一待验证函数指纹,对第二字节码进行指纹生成操作,获得第二待验证函数指纹。
进一步,对于如何进行指纹生成操作,本申请提供一种优选的实施例,在该优选的实施例中,利用MD5算法对字节码进行指纹生成操作,进一步,该MD5算法的划分单元长度为2048比特(bit),具体地,首先判断字节码的长度是否大于2048bit,若不大于2048bit,则直接生成与该字节码对应的待验证函数指纹,若大于2048bit,则循环划分直至长度不大于2048bit,最终获得包含多个子待验证函数指纹的待验证函数序列。由于单元测试桩的字节长度不低于1024bit,同时单元测试桩的测试量往往十分庞大,若采用现有的512bit为一个划分单元长度将会使得划分量庞大,本申请通过利用2048bit作为MD5算法的划分单元长度,有效地减少了划分量,并且也不会影响后续生成函数指纹的过程。
进一步,在完成步骤103之后,执行步骤104:分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹,若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
对于步骤104而言,内存中具有一指纹库,指纹库中存储有在当前时刻之前缓存的函数指纹以及关联的响应索引值,本申请对于待验证函数指纹的判断即在该指纹库中执行。当在步骤103之后,获得第一待验证函数指纹和第二待验证函数指纹,在步骤104中,分别判断当前时刻内存的指纹库中是否存在与第一待验证函数指纹相同的函数指纹,以及判断当前时刻内存的指纹库中是否存在与第二待验证函数指纹相同的函数指纹,若存在与第一待验证函数指纹相同的函数指纹,则将指纹库中与第一待验证函数指纹对应的函数指纹进行删除,并将第一待验证函数指纹保存到指纹库中,若不存在与第二待验证函数指纹相同的函数指纹,则将第二待验证函数指纹保存到指纹库中,从而实现了进一步的去重处理,并能够保证不会出现误删除的现象。
基于同一发明构思,本申请实施例还提供一种单元测试桩去重装置,如图2所示,所述装置包括:
去重模块201,用于基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
转换模块202,用于将去重处理后保留下的各个单元测试桩分别转换为字节码;
指纹获得模块203,用于对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
判断模块204,用于分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
第一处理模块205,用于若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
第二处理模块206,用于若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
优选的,所述文件属性参数包括文件名、文件大小和文件时间戳中的至少一种。
优选的,对于去重处理后保留下的每个单元测试桩而言,将所述单元测试桩转换为所述字节码,包括:
提取所述单元测试桩中的字符;
将提取出的字符拼接成字符串;
判断所述字符串的长度是否超过预设长度阈值;
若所述字符串的长度超过所述预设长度阈值,则以所述预设长度阈值对所述字符串进行循环分割,获得包含多个子字符串的字符串序列,并将所述字符串序列作为与所述单元测试桩对应的所述字节码;
若所述字符串的长度未超过预设长度阈值,则将所述字符串作为与所述单元测试桩对应的所述字节码。
优选的,所述预设长度阈值为1兆。
优选的,所述指纹获得模块,具体用于:
利用MD5算法对各个字节码进行指纹生成操作。
优选的,所述MD5算法的划分单元长度为2048比特。
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
将去重处理后保留下的各个单元测试桩分别转换为字节码;
对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
本发明实施例还提供了一种计算机设备,如图3所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机设备可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以计算机设备为手机为例:
图3示出的是与本发明实施例提供的计算机设备相关的部分结构的框图。参考图3,该计算机设备包括:存储器301和处理器302。本领域技术人员可以理解,图3中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对计算机设备的各个构成部件进行具体的介绍:
存储器301可用于存储软件程序以及模块,处理器302通过运行存储在存储器301的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器301可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储数据(比如音频数据、电话本等)等。此外,存储器301可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器302是计算机设备的控制中心,通过运行或执行存储在存储器301内的软件程序和/或模块,以及调用存储在存储器301内的数据,执行各种功能和处理数据。可选的,处理器302可包括一个或多个处理单元;优选的,处理器302可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。
在本发明实施例中,该计算机设备所包括的处理器302可以具有以下功能:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理;
将去重处理后保留下的各个单元测试桩分别转换为字节码;
对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
总之,本申请通过先基于文件属性参数,对待去重的多个单元测试桩进行去重处理,以降低后续精细去重处理操作的文件量,提高精细去重处理操作的效率,再将去重处理后保留的各个单元测试桩分别转换为字节码,对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹,接着,分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹,若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中,若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中,以实现精细去重处理操作,本申请通过两次去重处理操作,提高了去重效率和准确率,进而提高了单元测试的速度。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (4)
1.一种单元测试桩去重方法,其特征在于,所述方法包括:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理,所述文件属性参数包括文件名、文件大小和文件时间戳;
将去重处理后保留下的各个单元测试桩分别转换为字节码;其中,对于去重处理后保留下的每个单元测试桩而言,将所述单元测试桩转换为所述字节码,包括:提取所述单元测试桩中的字符;将提取出的字符拼接成字符串;判断所述字符串的长度是否超过预设长度阈值,所述预设长度阈值为1兆;若所述字符串的长度超过所述预设长度阈值,则以所述预设长度阈值对所述字符串进行循环分割,获得包含多个子字符串的字符串序列,并将所述字符串序列作为与所述单元测试桩对应的所述字节码;若所述字符串的长度未超过预设长度阈值,则将所述字符串作为与所述单元测试桩对应的所述字节码;
利用MD5算法对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹,所述MD5算法的划分单元长度为2048比特;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
2.一种单元测试桩去重装置,其特征在于,所述装置包括:
去重模块,用于基于文件属性参数,对待去重的多个单元测试桩进行去重处理,所述文件属性参数包括文件名、文件大小和文件时间戳;
转换模块,用于将去重处理后保留下的各个单元测试桩分别转换为字节码;其中,对于去重处理后保留下的每个单元测试桩而言,将所述单元测试桩转换为所述字节码,包括:提取所述单元测试桩中的字符;将提取出的字符拼接成字符串;判断所述字符串的长度是否超过预设长度阈值,所述预设长度阈值为1兆;若所述字符串的长度超过所述预设长度阈值,则以所述预设长度阈值对所述字符串进行循环分割,获得包含多个子字符串的字符串序列,并将所述字符串序列作为与所述单元测试桩对应的所述字节码;若所述字符串的长度未超过预设长度阈值,则将所述字符串作为与所述单元测试桩对应的所述字节码;
指纹获得模块,用于利用MD5算法对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹,所述MD5算法的划分单元长度为2048比特;
判断模块,用于分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
第一处理模块,用于若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
第二处理模块,用于若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
3.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理,所述文件属性参数包括文件名、文件大小和文件时间戳;
将去重处理后保留下的各个单元测试桩分别转换为字节码;其中,对于去重处理后保留下的每个单元测试桩而言,将所述单元测试桩转换为所述字节码,包括:提取所述单元测试桩中的字符;将提取出的字符拼接成字符串;判断所述字符串的长度是否超过预设长度阈值,所述预设长度阈值为1兆;若所述字符串的长度超过所述预设长度阈值,则以所述预设长度阈值对所述字符串进行循环分割,获得包含多个子字符串的字符串序列,并将所述字符串序列作为与所述单元测试桩对应的所述字节码;若所述字符串的长度未超过预设长度阈值,则将所述字符串作为与所述单元测试桩对应的所述字节码;
利用MD5算法对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹,所述MD5算法的划分单元长度为2048比特;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
4.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
基于文件属性参数,对待去重的多个单元测试桩进行去重处理,所述文件属性参数包括文件名、文件大小和文件时间戳;
将去重处理后保留下的各个单元测试桩分别转换为字节码;其中,对于去重处理后保留下的每个单元测试桩而言,将所述单元测试桩转换为所述字节码,包括:提取所述单元测试桩中的字符;将提取出的字符拼接成字符串;判断所述字符串的长度是否超过预设长度阈值,所述预设长度阈值为1兆;若所述字符串的长度超过所述预设长度阈值,则以所述预设长度阈值对所述字符串进行循环分割,获得包含多个子字符串的字符串序列,并将所述字符串序列作为与所述单元测试桩对应的所述字节码;若所述字符串的长度未超过预设长度阈值,则将所述字符串作为与所述单元测试桩对应的所述字节码;
利用MD5算法对各个字节码进行指纹生成操作,分别获得与各个字节码对应的待验证函数指纹,所述MD5算法的划分单元长度为2048比特;
分别判断当前时刻内存中是否存在与各个待验证函数指纹相同的函数指纹;
若当前时刻内存中存在与所述待验证函数指纹相同的函数指纹,则删除当前内存中已存在的与所述待验证函数指纹相同的函数指纹,并将所述待验证函数指纹保存在所述内存中;
若当前时刻内存中不存在与所述待验证函数指纹相同的函数指纹,则将所述待验证函数指纹保存在所述内存中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710889793.0A CN107783904B (zh) | 2017-09-27 | 2017-09-27 | 单元测试桩去重方法、装置、计算机可读存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710889793.0A CN107783904B (zh) | 2017-09-27 | 2017-09-27 | 单元测试桩去重方法、装置、计算机可读存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107783904A CN107783904A (zh) | 2018-03-09 |
CN107783904B true CN107783904B (zh) | 2021-03-16 |
Family
ID=61434102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710889793.0A Active CN107783904B (zh) | 2017-09-27 | 2017-09-27 | 单元测试桩去重方法、装置、计算机可读存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107783904B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113037725B (zh) * | 2021-02-26 | 2022-04-22 | 上海钧正网络科技有限公司 | 骑行测试方法、服务器、测试桩及可读存储介质 |
CN113656293A (zh) * | 2021-08-05 | 2021-11-16 | 上海钧正网络科技有限公司 | 一种用于流量回放的数据去重方法、测试方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079034A (zh) * | 2006-07-10 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 消除文件存储系统中冗余文件的系统及方法 |
CN103970722A (zh) * | 2014-05-07 | 2014-08-06 | 江苏金智教育信息技术有限公司 | 一种文本内容去重的方法 |
CN106649107A (zh) * | 2016-12-09 | 2017-05-10 | 武汉斗鱼网络科技有限公司 | 安卓系统稳定性的自动化测试方法及装置 |
CN106776348A (zh) * | 2017-02-06 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 测试用例管理方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8650545B2 (en) * | 2009-02-11 | 2014-02-11 | International Business Machines Corporation | File creation utility for deduplication testing |
CN102033962B (zh) * | 2010-12-31 | 2012-05-30 | 中国传媒大学 | 一种快速去重的文件数据复制方法 |
-
2017
- 2017-09-27 CN CN201710889793.0A patent/CN107783904B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079034A (zh) * | 2006-07-10 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 消除文件存储系统中冗余文件的系统及方法 |
CN103970722A (zh) * | 2014-05-07 | 2014-08-06 | 江苏金智教育信息技术有限公司 | 一种文本内容去重的方法 |
CN106649107A (zh) * | 2016-12-09 | 2017-05-10 | 武汉斗鱼网络科技有限公司 | 安卓系统稳定性的自动化测试方法及装置 |
CN106776348A (zh) * | 2017-02-06 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 测试用例管理方法和装置 |
Non-Patent Citations (2)
Title |
---|
"python删除重复文件代码";竹木一540;《CSDN》;20170903;第1-4页 * |
"python实现检测文件的MD5值来查找重复文件";mighty13;《CSDN》;20170915;第1-2页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107783904A (zh) | 2018-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609186B (zh) | 信息处理方法及装置、终端设备及计算机可读存储介质 | |
CN103136243B (zh) | 基于云存储的文件系统去重方法及装置 | |
CN107315668B (zh) | 分布式存储系统数据一致性自动化快速检测方法及装置 | |
CN107305586B (zh) | 索引生成方法、索引生成装置及搜索方法 | |
CN102663281A (zh) | 检测恶意软件的方法和装置 | |
US8650229B2 (en) | System and method for removing master file table ($MFT) file record segments (FRS) | |
CN106201774B (zh) | 一种nand flash存储芯片数据存储结构分析方法 | |
CN109710185A (zh) | 数据处理方法及装置 | |
CN107783904B (zh) | 单元测试桩去重方法、装置、计算机可读存储介质及设备 | |
CN112416880A (zh) | 一种基于实时归并的海量小文件存储性能优化方法及装置 | |
CN112182010A (zh) | 脏页刷新方法和装置、存储介质和电子设备 | |
CN112926647B (zh) | 模型训练方法、域名检测方法及装置 | |
CN113468118B (zh) | 一种基于区块链的文件增量存储方法、装置及存储介质 | |
CN108133026B (zh) | 一种多数据的处理方法、系统及存储介质 | |
US7685211B2 (en) | Deterministic file content generation of seed-based files | |
CN111026736B (zh) | 数据血缘管理方法及装置、数据血缘解析方法及装置 | |
CN112257757A (zh) | 一种基于深度学习的恶意样本检测方法及系统 | |
CN107315806B (zh) | 一种基于文件系统的嵌入式存储方法和装置 | |
CN111984600B (zh) | 一种文件聚合方法、装置、设备及可读存储介质 | |
CN113312619B (zh) | 基于小样本学习的恶意进程检测方法、装置、电子设备及存储介质 | |
CN112612830B (zh) | 一种压缩数据批量导出方法、系统及电子设备 | |
CN113656044B (zh) | 安卓安装包压缩方法、装置、计算机设备及存储介质 | |
US8988258B2 (en) | Hardware compression using common portions of data | |
CN109002710A (zh) | 一种检测方法、装置及计算机可读存储介质 | |
CN108683749B (zh) | 一种随机邮箱地址的判断方法、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |