CN117971302A - 一种代码基线的匹配方法、装置、设备及介质 - Google Patents
一种代码基线的匹配方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117971302A CN117971302A CN202410141167.3A CN202410141167A CN117971302A CN 117971302 A CN117971302 A CN 117971302A CN 202410141167 A CN202410141167 A CN 202410141167A CN 117971302 A CN117971302 A CN 117971302A
- Authority
- CN
- China
- Prior art keywords
- file
- processed
- determining
- code
- version library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000008859 change Effects 0.000 claims abstract description 45
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 16
- 238000004519 manufacturing process Methods 0.000 abstract description 13
- 238000011161 development Methods 0.000 abstract description 11
- 230000008569 process Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Stored Programmes (AREA)
Abstract
本申请公开了一种代码基线的匹配方法、装置、设备及介质。其中,该方法通过确定软件制品包中的至少一个待处理文件;获取待处理文件的变更历史记录,并确定与变更历史记录对应的至少一个版本库文件;将待处理文件分别与至少一个版本库文件进行匹配,得到匹配结果;根据匹配结果确定与待处理文件对应的代码基线。本技术方案,通过将生产环境的软件制品包与源代码仓库中相应源代码的所有历史版本进行自动匹配,以解决软件项目中源代码基线遗失的问题,提高代码开发效率。
Description
技术领域
本申请涉及计算机应用技术领域,尤其涉及一种代码基线的匹配方法、装置、设备及介质。
背景技术
代码基线是一个稳定、可重复使用的代码版本,在软件开发中起到管理代码变更、追踪代码状态和确保软件质量的重要作用。它通过版本控制和变更追踪,帮助团队管理代码库,确保软件在不同阶段的稳定性和可靠性。
在软件开发过程中,软件的基线版本可能会由于发布流程不完善或人为因素疏忽而未进行恰当的管理,例如:(1)在使用SVN等源代码版本库时,由于分支代价较高而没有区分开发主干(对应开发集成环境)和发布分支(对应生产环境),导致主干分支的最新代码版本无法保证和生产环境上线版本一致。(2)由于版本管理流程疏忽,每次发布生产版本时未创建对应的代码基线标签,或者生产紧急问题处理后,变更的代码没有及时合入版本库,造成代码基线与实际生产版本不匹配。
而当代码基线出现问题时,可能会导致一系列的不利情况。首先,软件的稳定性会受到影响,因为基线作为一个稳定版本的标记,如果基线本身存在问题或缺陷,可能会导致软件出现新的错误,功能无法正常运行或系统性能下降,这将对用户体验和系统可靠性带来负面影响。其次,基线中存在的代码错误或逻辑缺陷可能会在运行时导致应用程序崩溃、异常或产生错误的结果,进而影响到业务流程的正常进行。这会导致团队花费额外的时间和资源来修复问题,延迟开发进度,并可能引起整个项目的时间表调整。此外,如果基线问题无法及时修复,团队可能需要回滚到之前的一个稳定基线以避免问题继续扩大;然而,回滚和恢复的过程可能会增加额外的成本和工作量,包括代码回退、数据恢复和重新测试等,而且如果回滚的版本太多,可能会造成无法预料到的后果。
现有方案中,处理代码基线问题几乎全靠开发人员人工处理,严重增加了完成开发任务的时间周期。
发明内容
本申请提供了一种代码基线的匹配方法、装置、设备及介质,通过将生产环境的软件制品包与源代码仓库中相应源代码的所有历史版本进行自动匹配,以解决软件项目中源代码基线遗失的问题,提高代码开发效率。
根据本申请的一方面,提供了一种代码基线的匹配方法,该方法包括:
确定软件制品包中的至少一个待处理文件;
获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本库文件;
将所述待处理文件分别与所述至少一个版本库文件进行匹配,得到匹配结果;
根据所述匹配结果确定与所述待处理文件对应的代码基线。
根据本申请的另一方面,提供了一种代码基线的匹配装置,该装置包括:
待处理文件确定模块,用于确定软件制品包中的至少一个待处理文件;
版本库文件确定模块,用于获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本库文件;
文件匹配模块,用于将所述待处理文件分别与所述至少一个版本库文件进行匹配,得到匹配结果;
代码基线确定模块,用于根据所述匹配结果确定与所述待处理文件对应的代码基线。
根据本申请的另一方面,提供了一种代码基线的匹配设备,该设备包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一实施例所述的代码基线的匹配方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本申请任一实施例所述的代码基线的匹配方法。
本申请提供的技术方案,通过确定软件制品包中的至少一个待处理文件;获取待处理文件的变更历史记录,并确定与变更历史记录对应的至少一个版本库文件;将待处理文件分别与至少一个版本库文件进行匹配,得到匹配结果;根据匹配结果确定与待处理文件对应的代码基线。本技术方案,通过将生产环境的软件制品包与源代码仓库中相应源代码的所有历史版本进行自动匹配,以解决软件项目中源代码基线遗失的问题,提高代码开发效率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的一种代码基线的匹配方法的流程图;
图2为本申请实施例二提供的一种代码基线的匹配方法的流程图;
图3为本申请实施例三提供的一种代码基线的匹配装置的结构示意图;
图4是实现本申请实施例的一种代码基线的匹配方法的设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“候选”、“待处理”、“目标”、“第一”、“第二”、“第三”、“第四”、“第五”、“第六”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本申请实施例一提供的一种代码基线的匹配方法的流程图,本实施例可适用于代码基线遗失的情况,该方法可以由代码基线的匹配装置来执行,该代码基线的匹配装置可以采用硬件和/或软件的形式实现,该代码基线的匹配装置可配置于具有数据处理能力的设备中。如图1所示,该方法包括:
S110、确定软件制品包中的至少一个待处理文件。
其中,软件制品包通常为源码文件的集合或编译后的产物,主要有二进制文件和压缩包两种形式。二进制文件可为以.exe、.so、.dll、.bin、.rpm等为后缀的文件,压缩包可为以.zip、.tar、.jar、.war、.gz、.whl等为后缀的文件。示例性的,Java Web Application部署使用的软件制品包通常为war包或者jar包。
其中,待处理文件可为无法直观看到原始文件内容的资源文件。示例性的,war包或jar包中的待处理文件可为以class为后缀的文件。
在本方案中,可对软件制品包进行遍历,通过文件后缀名称确定软件制品包中的待处理文件。
可选的,确定软件制品包中的至少一个待处理文件,包括:将软件制品包解压至临时目录,并遍历所述临时目录,确定所述临时目录中的候选文件;将文件类型为编译文件的候选文件确定为待处理文件。
具体的,为了便于对待处理文件进行提取,可先将软件制品包解压至临时目录中,临时目录包括解压得到的多个候选文件。其中,临时目录可为预先设定的文件保存路径。
进一步的,对临时目录中的各候选文件进行遍历,并判断文件类型,将文件类型为编译文件的候选文件,记录到带匹配列表,以便于进行后续处理。
可选的,在确定所述临时目录中的候选文件之后,所述方法还包括:将文件类型为非编译文件的候选文件确定为与所述待处理文件对应的代码基线。
其中,非编译文件可为非代码编译的结果文件,可直观看到原始文件内容的资源文件。示例性的,war包或jar包中的非编译文件可为以.xml为后缀的文件。
由于非编译文件可直观看到原始文件内容,且软件制品包为当前正在开发的软件,因此可直接将非编译文件的候选文件确定为最新的代码基线。
S120、获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本库文件。
具体的,可遍历待处理文件列表,根据待处理文件的包路径以及文件名,通过VCS(Version Control System,版本控制系统)接口获取对应路径源文件的所有变更历史记录。
进一步的,根据变更历史记录,从最新版本开始进行逐个编译,以获取与变更历史记录对应的一个或多个版本库文件。
S130、将所述待处理文件分别与所述至少一个版本库文件进行匹配,根据匹配结果确定与所述待处理文件对应的代码基线。
具体的,可将生产包中的待处理文件与各版本库文件逐一进行匹配处理,匹配内容可包括内容、逻辑、语法结构、语义等。
其中,匹配结果可为一致或不一致。一致可以是任一项匹配内容一致,也可以是所有匹配内容均一致;不一致可以是任一项匹配内容不一致,也可以是所有匹配内容均一致。本申请实施例对此不作限定,可根据实际需要进行确定。
在本申请中,可根据匹配结果为一致的版本库文件,创建与待处理文件对应的代码基线。
可选的,将所述待处理文件分别与所述至少一个版本库文件进行匹配,根据匹配结果确定与所述待处理文件对应的代码基线,包括:
针对各所述版本库文件,将所述待处理文件的二进制数据与所述版本库文件的二进制数据进行对比,确定第一对比结果;
若所述第一对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第一对比结果为不一致,则分别对所述待处理文件与所述版本库文件进行反编译,得到待处理反编译文件与版本库反编译文件,并对所述待处理反编译文件与所述版本库反编译文件进行对比,确定第二对比结果;
若所述第二对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第二对比结果为不一致,则分别对所述待处理反编译文件与所述版本库反编译文件进行格式化,得到待处理格式化文件与版本库格式化文件,并对所述待处理格式化文件与所述版本库格式化文件进行对比,确定第三对比结果;
若所述第三对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第三对比结果为不一致,则分别对所述待处理反编译文件与所述版本库反编译文件创建语法树,得到待处理语法树与版本库语法树,并对所述待处理语法树和所述版本库语法树进行对比,确定第四对比结果;
若所述第四对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第四对比结果为不一致,则分别对所述待处理文件与所述版本库文件进行信息提取,得到待处理文件信息与版本库文件信息,并对所述待处理文件信息与所述版本库文件信息进行对比,确定第五对比结果;
若所述第五对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第五对比结果为不一致,则基于代码语义理解大模型,分别对所述待处理反编译文件与所述版本库反编译文件进行识别,得到待处理反编译等效代码和版本库反编译等效代码,并对所述待处理反编译等效代码和所述版本库反编译等效代码进行对比,确定第六对比结果;
若所述第六对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第六对比结果为不一致,则确定所述版本库文件不是与所述待处理文件对应的代码基线。
具体的,上述技术方案为依次对待处理文件与版本库文件之间的二进制数据、反编译文件、格式化文件、语法树、文件信息以及等效代码。
图2为本申请实施例一提供的一种文件匹配的流程示意图。若其中一项匹配内容的匹配结果一致,则确定该版本库文件为与待处理文件对应的代码基线。其中,匹配内容的顺序是根据匹配效率进行确定,先对匹配复杂度低的匹配内容进行匹配,再对匹配复杂度高的的匹配内容进行匹配,这样可以提高代码基线的匹配效率。
其中,二进制数据对比可为对二进制数据的字节数量以及字节内容进行对比,确定第一对比结果,若一致则将该版本库文件确定为与待处理文件对应的代码基线,若不一致则继续进行对比。
其中,反编译是指将可执行的程序代码转换为某种形式的高级编程语言,使其具有更易读的格式。因此,本申请通过反编译工具对版本库文件为与待处理文件分别进行反编译,得到待处理反编译文件与版本库反编译文件,再对反编译后的文件内容进行一一对比,确定第二对比结果。其中,反编译工具可为jad-core。
其中,反编译过程中可能会导致部分注释、参数名等发生变化,即文件内容不一样,但文件逻辑可能是一样的,因此对反编译文件进行格式化。格式化可为分别对待处理反编译文件与版本库反编译文件中的换行、import语句等进行去除,以及统一缩进和参数名,得到待处理格式化文件与版本库格式化文件,再一一进行对比,确定第三对比结果。
其中,语法树可为源代码语法结构的一种树状表示,每一步节点的生长过程都可以对应一个推导过程。因此,本申请对格式化后的文件创建语法树,通过对比语法树结构,确定第四对比结果。具体的,可通过ANTLR(Another Tool for Language Recognition,开源语法分析器)、JavaParser或Eclipse等工具对格式化后的文件生成语法树。
其中,信息提取可为通过Java-version分别对述待处理文件与版本库文件进行处理,得到文件信息,如常量池、字段、方法、访问修饰符等。本申请通过对待处理文件信息与版本库文件信息进行一一对比,得到第五对比结果。
进一步的,即使代码的语法结构不同,但如果两者具有相同的语义和功能,也可以视为匹配一致。由于等效代码没有规则可循,因此,本申请可通过结合支持代码语义理解的AI大模型(如GPT-3.5、GPT-4、文心一言等)进行等效代码行的智能识别匹配,确定第六对比结果。
若上述步骤中任一项匹配内容的对比结果为一致,则可将该版本库文件确定为与待处理文件对应的代码基线。本申请为了避免由于反编译工具造成代码缺失等问题,对版本库反编译文件再进行一次编译,以确保能成功完成编译。
本申请实施例提供了一种代码基线的匹配方法,该方法通过确定软件制品包中的至少一个待处理文件;获取待处理文件的变更历史记录,并确定与变更历史记录对应的至少一个版本库文件;将待处理文件分别与至少一个版本库文件进行匹配,得到匹配结果;根据匹配结果确定与待处理文件对应的代码基线。本技术方案,通过将生产环境的软件制品包与源代码仓库中相应源代码的所有历史版本进行自动匹配,以解决软件项目中源代码基线遗失的问题,提高代码开发效率。
实施例二
图2为本申请实施例二提供的一种代码基线的匹配方法的流程图,本实施例以上述实施例为基础进行优化。如图2所示,本实施例的方法具体包括如下步骤:
S210、确定软件制品包中的至少一个待处理文件。
S220、获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本的源代码。
具体的,可根据变更历史记录中每个版本的名称,通过版本控制系统获取与各版本名称对应的源代码。
S230、确定所述待处理文件的目标版本软件开发工具包。
以待处理文件为class文件为例进行解释说明,由于不同版本的软件开发工具包(Java Development Kit,JDK)对相同Java源代码文件的编译结果有差异,因此在进行编译前,先检测生产class文件的版本,确定生产class文件的编译JDK版本后,使用相同版本的JDK对变更历史记录中至少一个版本的源代码进行编译。
具体的,待处理文件的目标版本软件开发工具包的确定过程如下:在JVM(JavaVirtual Machine,Java虚拟机)规范中,class文件首4个字节固定为0xCAFEBABE,其后4个字节分别为minor_version和major_version,例如major_version(0031)为JDK1.5。
S240、基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件。
具体的,从最新版本的源代码开始,采用与生产待处理文件的目标版本软件开发工具包,依次对源代码进行编译,得到与待处理文件类型相同的版本库文件。例如,待处理文件类型为class文件,则版本库文件业务class文件。
需要说明的是,在进行源代码编译时,以待处理文件为class文件为例进行解释说明,可将class文件中lib目录下的依赖包和classses目录下的其他class文件作为编译期的classpath依赖。
可选的,在基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件之前,所述方法还包括:根据-g参数和字符集编码类型,确定至少一个编译参数组。
由于相同版本的JDK若在编译期使用的参数不一样,其得到的编译结果也可能不一样。因此,本申请通过对编译参数进行限定,以确保后续待处理文件和版本库文件对比的准确性。
其中,-g参数可表示在编译结果中携带行号、参数名称等调试信息。字符集编码类型可为UTF-8或GBK。
具体的,根据-g参数和字符集编码类型,可得到编译参数组1:带-g参数且字符集编码类型为UTF-8、编译参数组2:带-g参数且字符集编码类型为GBK、编译参数组3:不带-g参数且字符集编码类型为UTF-8、编译参数组4:不带-g参数且字符集编码类型为GBK。本申请实施例对编译参数组的数量和类型不作限定,可根据实际需要进行确定。
相应地,基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件,包括:基于所述目标版本软件开发工具包,分别采用各所述编译参数组对所述源代码依次进行编译,确定与所述变更历史记录对应的至少一个版本库文件。
其中,一个源代码对应一个或多个版本库文件,版本库文件的数量与编译参数组相同。
示例性的,基于目标版本软件开发工具包,分别采用编译参数组1、编译参数组2、编译参数组3和编译参数组4对源代码A进行编译,可得到与源代码A对应的版本库文件1、版本库文件2、版本库文件3和版本库文件4。
上述技术方案的有益效果在于,通过对软件开发工具包以及编译参数组的限定,提高待处理文件和版本库文件的匹配准确度,进而提高了代码基线的准确性。
S250、将所述待处理文件分别与所述至少一个版本库文件进行匹配,根据匹配结果确定与所述待处理文件对应的代码基线。
本申请实施例提供了一种代码基线的匹配方法,该方法通过确定软件制品包中的至少一个待处理文件;获取待处理文件的变更历史记录,确定与变更历史记录对应的至少一个版本的源代码;确定待处理文件的目标版本软件开发工具包;基于目标版本软件开发工具包,对源代码进行编译,确定与变更历史记录对应的版本库文件;将待处理文件分别与至少一个版本库文件进行匹配,根据匹配结果确定与待处理文件对应的代码基线。本技术方案,通过对软件开发工具包的版本进行限定,提高了版本库文件和待处理文件匹配的准确性,进而提高了代码基线的准确性。
在上述各实施例的基础上,可选的,在根据对比匹配结果确定与所述待处理文件对应的代码基线之后,所述方法还包括:生成与所述代码基线对应的待验证软件制品包;对所述待验证软件制品包进行回归验证,确定验证结果;若所述验证结果为验证通过,则确定所述代码基线为目标代码基线。
为了进一步确保代码基线版本的可用性,本申请实施例基于所创建的代码基线生成待验证软件制品包,结合系统已有的单元测试或者API测试代码,对代码基线版本进行自动化回归验证,若验证结果为验证通过,则确定该代码基线可用。
实施例三
图3为本申请实施例三提供的一种代码基线的匹配装置的结构示意图。如图3所示,该装置包括:
待处理文件确定模块310,用于确定软件制品包中的至少一个待处理文件;
版本库文件确定模块320,用于获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本库文件;
代码基线确定模块330,用于将所述待处理文件分别与所述至少一个版本库文件进行匹配,根据匹配结果确定与所述待处理文件对应的代码基线。
本申请实施例提供了一种代码基线的匹配装置,该装置通过确定软件制品包中的至少一个待处理文件;获取待处理文件的变更历史记录,并确定与变更历史记录对应的至少一个版本库文件;将待处理文件分别与至少一个版本库文件进行匹配,得到匹配结果;根据匹配结果确定与待处理文件对应的代码基线。本技术方案,通过将生产环境的软件制品包与源代码仓库中相应源代码的所有历史版本进行自动匹配,以解决软件项目中源代码基线遗失的问题,提高代码开发效率。
进一步的,待处理文件确定模块310,包括:
候选文件确定单元,用于将软件制品包解压至临时目录,并遍历所述临时目录,确定所述临时目录中的候选文件;
待处理文件确定单元,用于将文件类型为编译文件的候选文件确定为待处理文件。
进一步的,待处理文件确定模块310,还包括:
代码基线确定单元,用于在确定所述临时目录中的候选文件之后,将文件类型为非编译文件的候选文件确定为与所述待处理文件对应的代码基线。
进一步的,版本库文件确定模块320,包括:
源代码确定单元,用于确定与所述变更历史记录对应的至少一个版本的源代码;
软件开发工具包确定单元,用于确定所述待处理文件的目标版本软件开发工具包;
版本库文件确定单元,用于基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件。
进一步的,版本库文件确定模块320,还包括:
编译参数组确定单元,用于在基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件之前,根据-g参数和字符集编码类型,确定至少一个编译参数组;
相应地,版本库文件确定单元,具体用于:
基于所述目标版本软件开发工具包,分别采用各所述编译参数组依次对所述源代码进行编译,确定与所述变更历史记录对应的至少一个版本库文件。
进一步的,代码基线确定模块330,包括:
第一匹配单元,用于针对各所述版本库文件,将所述待处理文件的二进制数据与所述版本库文件的二进制数据进行对比,确定第一对比结果;
第二匹配单元,用于若所述第一对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第一对比结果为不一致,则分别对所述待处理文件与所述版本库文件进行反编译,得到待处理反编译文件与版本库反编译文件,并对所述待处理反编译文件与所述版本库反编译文件进行对比,确定第二对比结果;
第三匹配单元,用于若所述第二对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第二对比结果为不一致,则分别对所述待处理反编译文件与所述版本库反编译文件进行格式化,得到待处理格式化文件与版本库格式化文件,并对所述待处理格式化文件与所述版本库格式化文件进行对比,确定第三对比结果;
第四匹配单元,用于若所述第三对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第三对比结果为不一致,则分别对所述待处理反编译文件与所述版本库反编译文件创建语法树,得到待处理语法树与版本库语法树,并对所述待处理语法树和所述版本库语法树进行对比,确定第四对比结果;
第五匹配单元,用于若所述第四对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第四对比结果为不一致,则分别对所述待处理文件与所述版本库文件进行信息提取,得到待处理文件信息与版本库文件信息,并对所述待处理文件信息与所述版本库文件信息进行对比,确定第五对比结果;
第六匹配单元,用于若所述第五对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第五对比结果为不一致,则基于代码语义理解大模型,分别对所述待处理反编译文件与所述版本库反编译文件进行识别,得到待处理反编译等效代码和版本库反编译等效代码,并对所述待处理反编译等效代码和所述版本库反编译等效代码进行对比,确定第六对比结果;
第七匹配单元,用于若所述第六对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第六对比结果为不一致,则确定所述版本库文件不是与所述待处理文件对应的代码基线。
进一步的,所述装置还包括:
待验证软件制品包生成模块,用于在根据对比匹配结果确定与所述待处理文件对应的代码基线之后,生成与所述代码基线对应的待验证软件制品包;
回归验证模块,用于对所述待验证软件制品包进行回归验证,确定验证结果;
目标代码基线确定模块,用于若所述验证结果为验证通过,则确定所述代码基线为目标代码基线。
本申请实施例所提供的一种代码基线的匹配装置可执行本申请任意实施例所提供的一种代码基线的匹配方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本申请的实施例的设备10的结构示意图。设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储设备10操作所需的各种程序和数据。处理器11、ROM12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如代码基线的匹配方法。
在一些实施例中,代码基线的匹配方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到设备10上。当计算机程序加载到RAM13并由处理器11执行时,可以执行上文描述的代码基线的匹配方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行代码基线的匹配方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在设备上实施此处描述的系统和技术,该设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (10)
1.一种代码基线的匹配方法,其特征在于,所述方法包括:
确定软件制品包中的至少一个待处理文件;
获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本库文件;
将所述待处理文件分别与所述至少一个版本库文件进行匹配,根据匹配结果确定与所述待处理文件对应的代码基线。
2.根据权利要求1所述的方法,其特征在于,确定软件制品包中的至少一个待处理文件,包括:
将软件制品包解压至临时目录,并遍历所述临时目录,确定所述临时目录中的候选文件;
将文件类型为编译文件的候选文件确定为待处理文件。
3.根据权利要求2所述的方法,其特征在于,在确定所述临时目录中的候选文件之后,所述方法还包括:
将文件类型为非编译文件的候选文件确定为与所述待处理文件对应的代码基线。
4.根据权利要求1所述的方法,其特征在于,确定与所述变更历史记录对应的至少一个版本库文件,包括:
确定与所述变更历史记录对应的至少一个版本的源代码;
确定所述待处理文件的目标版本软件开发工具包;
基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件。
5.根据权利要求4所述的方法,其特征在于,在基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件之前,所述方法还包括:
根据-g参数和字符集编码类型,确定至少一个编译参数组;
相应地,基于所述目标版本软件开发工具包,对所述源代码进行编译,确定与所述变更历史记录对应的版本库文件,包括:
基于所述目标版本软件开发工具包,分别采用各所述编译参数组依次对所述源代码进行编译,确定与所述变更历史记录对应的至少一个版本库文件。
6.根据权利要求1所述的方法,其特征在于,将所述待处理文件分别与所述至少一个版本库文件进行匹配,根据匹配结果确定与所述待处理文件对应的代码基线,包括:
针对各所述版本库文件,将所述待处理文件的二进制数据与所述版本库文件的二进制数据进行对比,确定第一对比结果;
若所述第一对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第一对比结果为不一致,则分别对所述待处理文件与所述版本库文件进行反编译,得到待处理反编译文件与版本库反编译文件,并对所述待处理反编译文件与所述版本库反编译文件进行对比,确定第二对比结果;
若所述第二对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第二对比结果为不一致,则分别对所述待处理反编译文件与所述版本库反编译文件进行格式化,得到待处理格式化文件与版本库格式化文件,并对所述待处理格式化文件与所述版本库格式化文件进行对比,确定第三对比结果;
若所述第三对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第三对比结果为不一致,则分别对所述待处理反编译文件与所述版本库反编译文件创建语法树,得到待处理语法树与版本库语法树,并对所述待处理语法树和所述版本库语法树进行对比,确定第四对比结果;
若所述第四对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第四对比结果为不一致,则分别对所述待处理文件与所述版本库文件进行信息提取,得到待处理文件信息与版本库文件信息,并对所述待处理文件信息与所述版本库文件信息进行对比,确定第五对比结果;
若所述第五对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第五对比结果为不一致,则基于代码语义理解大模型,分别对所述待处理反编译文件与所述版本库反编译文件进行识别,得到待处理反编译等效代码和版本库反编译等效代码,并对所述待处理反编译等效代码和所述版本库反编译等效代码进行对比,确定第六对比结果;
若所述第六对比结果为一致,则确定所述版本库文件为与所述待处理文件对应的代码基线;若所述第六对比结果为不一致,则确定所述版本库文件不是与所述待处理文件对应的代码基线。
7.根据权利要求1所述的方法,其特征在于,在根据对比匹配结果确定与所述待处理文件对应的代码基线之后,所述方法还包括:
生成与所述代码基线对应的待验证软件制品包;
对所述待验证软件制品包进行回归验证,确定验证结果;
若所述验证结果为验证通过,则确定所述代码基线为目标代码基线。
8.一种代码基线的匹配装置,其特征在于,所述装置包括:
待处理文件确定模块,用于确定软件制品包中的至少一个待处理文件;
版本库文件确定模块,用于获取所述待处理文件的变更历史记录,并确定与所述变更历史记录对应的至少一个版本库文件;
文件匹配模块,用于将所述待处理文件分别与所述至少一个版本库文件进行匹配,得到匹配结果;
代码基线确定模块,用于根据所述匹配结果确定与所述待处理文件对应的代码基线。
9.一种电子设备,其特征在于,所述设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的代码基线的匹配方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的代码基线的匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410141167.3A CN117971302A (zh) | 2024-02-01 | 2024-02-01 | 一种代码基线的匹配方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410141167.3A CN117971302A (zh) | 2024-02-01 | 2024-02-01 | 一种代码基线的匹配方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117971302A true CN117971302A (zh) | 2024-05-03 |
Family
ID=90860568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410141167.3A Pending CN117971302A (zh) | 2024-02-01 | 2024-02-01 | 一种代码基线的匹配方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117971302A (zh) |
-
2024
- 2024-02-01 CN CN202410141167.3A patent/CN117971302A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108027722B (zh) | 在编译和部署中动态更新应用 | |
KR102493449B1 (ko) | 엣지 컴퓨팅 테스트 방법, 장치, 전자 장치 및 컴퓨터 판독 가능 매체 | |
CN106156186B (zh) | 一种数据模型管理装置、服务器及数据处理方法 | |
US10248409B1 (en) | Limiting the effects of source code patches on corresponding native-code patches | |
US10083029B2 (en) | Detect application defects by correlating contracts in application dependencies | |
CN111367510A (zh) | 一种安卓功能模块开发的方法及装置 | |
US20150261766A1 (en) | Method and apparatus for determining a range of files to be migrated | |
WO2017087801A1 (en) | Dynamic update of an application in compilation and deployment | |
CN113296786A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN113760306A (zh) | 安装软件的方法、装置、电子设备及存储介质 | |
US11029934B2 (en) | Method and system for updating legacy software | |
CN113138768B (zh) | 应用程序包生成方法、装置、电子设备以及可读存储介质 | |
CN113778849A (zh) | 用于测试代码的方法、装置、设备以及存储介质 | |
CN111352631A (zh) | 一种接口兼容性检测方法及装置 | |
CN113297081B (zh) | 一种持续集成流水线的执行方法和装置 | |
CN113656044B (zh) | 安卓安装包压缩方法、装置、计算机设备及存储介质 | |
CN117971302A (zh) | 一种代码基线的匹配方法、装置、设备及介质 | |
CN114489704A (zh) | 基于策略的版本编译部署方法及装置 | |
CN114924742A (zh) | 用于虚拟机模拟软件的热补丁制作和应用方法、装置 | |
CN114860202A (zh) | 项目运行方法、装置、服务器及存储介质 | |
CN114816816A (zh) | 崩溃堆栈信息处理方法、装置、设备及存储介质 | |
US20210240596A1 (en) | Source code file retrieval | |
US9870257B1 (en) | Automation optimization in a command line interface | |
CN113760765B (zh) | 代码测试方法、装置、电子设备和存储介质 | |
KR101506656B1 (ko) | 애플리케이션 품질 관리를 위한 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |