CN112527623A - 代码扫描方法、装置、计算设备及计算机存储介质 - Google Patents

代码扫描方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN112527623A
CN112527623A CN201910889415.1A CN201910889415A CN112527623A CN 112527623 A CN112527623 A CN 112527623A CN 201910889415 A CN201910889415 A CN 201910889415A CN 112527623 A CN112527623 A CN 112527623A
Authority
CN
China
Prior art keywords
code
information
variables
function
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910889415.1A
Other languages
English (en)
Inventor
王晓军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201910889415.1A priority Critical patent/CN112527623A/zh
Publication of CN112527623A publication Critical patent/CN112527623A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3616Software analysis for verifying properties of programs using software metrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种代码扫描方法、装置、计算设备及计算机存储介质,方法包括:扫描代码文件,提取代码文件的代码信息;对代码信息进行分析整理,并分类缓存代码信息;对缓存的代码信息进行检测,确定代码信息中是否存在代码问题;若是,标记并定位代码问题。利用对代码文件的扫描,可以在代码线上执行前发现代码中存在的代码问题,有效地对代码问题进行定位、标记,方便对代码文件进行修正,解决存在的代码问题。

Description

代码扫描方法、装置、计算设备及计算机存储介质
技术领域
本发明涉及代码安全领域,具体涉及一种代码扫描方法及装置。
背景技术
对于在线上执行的代码,其存在如代码执行失败没有报警机制、代码执行前未对所需要的资源进行必要的判断、代码所依赖的数据并非最新数据等问题。这些问题在代码执行前没有被检测发现,会导致代码在执行过程中报错。
现有技术虽然可以采用代码扫描工具来对代码进行扫描,但对于以上非代码逻辑的问题,现有的代码扫描工具无法及时发现和定位问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的代码扫描方法、装置、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种代码扫描方法,其包括:
扫描代码文件,提取代码文件的代码信息;
对代码信息进行分析整理,并分类缓存代码信息;
对缓存的代码信息进行检测,确定代码信息中是否存在代码问题;
若是,标记并定位代码问题。
根据本发明的另一方面,提供了一种代码扫描装置,其包括:
扫描模块,适于扫描代码文件,提取代码文件的代码信息;
缓存模块,适于对代码信息进行分析整理,并分类缓存代码信息;
检测模块,适于对缓存的代码信息进行检测,确定代码信息中是否存在代码问题;
标记定位模块,适于若检测模块确定代码信息中存在代码问题,标记并定位代码问题。
根据本发明的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述代码扫描方法对应的操作。
根据本发明的另一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述代码扫描方法对应的操作。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述代码扫描方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述代码扫描方法对应的操作。
根据本发明提供的代码扫描方法、装置、计算设备及计算机存储介质,扫描代码文件,提取代码文件的代码信息;对代码信息进行分析整理,并分类缓存代码信息;对缓存的代码信息进行检测,确定代码信息中是否存在代码问题;若是,标记并定位代码问题。利用对代码文件的扫描,可以在代码线上执行前发现代码中存在的代码问题,有效地对代码问题进行定位、标记,方便对代码文件进行修正,解决存在的代码问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的代码扫描方法的流程示意图;
图2示出了代码信息存储方式示意图;
图3示出了根据本发明另一个实施例的代码扫描方法的流程示意图;
图4示出了代码文件与引用的其它的代码文件的代码信息存储方式示意图;
图5示出了根据本发明一个实施例的代码扫描装置的结构框图;
图6示出了根据本发明一个实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的代码扫描方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S101,扫描代码文件,提取代码文件的代码信息。
获取代码文件,如test.sh文件,对test.sh文件进行扫描。扫描时可以一次一行进行扫描,一次获取代码文件的一行内容,也可以一次多行进行扫描,一次获取代码文件的多行内容。获取到代码文件的一行或多行内容后,可以将其先缓存在内存中,再对缓存后的整体代码文件或者缓存后的某段代码文件(代码文件中的某个函数、某段声明代码等)进行分析、提取等处理,得到代码文件中的代码信息。此处,代码信息包括变量、参数、函数等。
变量需在代码中声明,用来存放数据、信息等,变量根据声明类型不同分为如数值型变量、日期型变量、字符型变量等等,变量根据其声明位置不同分为如全局变量、函数内变量等。变量的提取可以通过解析代码文件中对变量的声明代码,提取出对应的变量。
参数即函数在被调用时所需传递的参数,根据函数声明时的代码,提取到所包含的参数等。参数在函数声明时也包括了对参数类型的声明,根据对参数类型的声明,可以确定参数对应的类型。
从代码文件中根据函数声明提取出对应的函数名称,还可以根据代码文件提取函数初始化的起始行号信息、函数实现的功能信息等。
步骤S102,对代码信息进行分析整理,并分类缓存代码信息。
在提取得到代码信息后,对代码信息中的变量、参数、函数等分别进行分析整理,针对变量、参数、函数等分类进行缓存。具体的,可以通过不同的堆栈,分别缓存变量、参数、函数等。
针对变量,需要先整理代码信息中的变量,如代码文件中提取到变量a=20190801,其中变量为a,代码文件在声明a时,还对其进行了赋值,赋值信息为20190801,将变量与对应的赋值信息以键值对方式存储。键值对中key值为a,对应的value值为20190801。在代码文件中,变量包括了全局变量(供代码文件中的多个函数使用)、单个函数中使用的变量等。针对不同的变量,需要分别进行存储。如对于全局变量,整理代码信息中的全局变量,并将全局变量与对应的赋值信息以键值对方式存储。存储时,由于全局变量可以供代码文件中的多个函数使用,不局限于某一函数,因此,将全局变量与代码文件对应,一个代码文件绑定存储该代码文件中所有全局变量与对应的赋值信息的键值对。对应单个函数中的变量,从代码信息中划分出单个函数,将代码信息中的至少一个函数中的变量以及对应的赋值信息以键值对方式与函数名称绑定存储。如为代码文件中所声明的各个函数划分单独的存储空间,在各个函数的存储空间下,存储该函数的变量以及对应的赋值信息的键值对。
进一步,对于函数中的变量,有些变量仅赋值一次后使用,有些变量会被多次赋值。如case、while、for、if等命令语句,其会使得变量被多次赋值。为后续对变量的每一次赋值进行检测,还需要解析代码信息中的至少一个函数的遍历语句(如case、while、for、if等命令语句),将遍历语句中的变量与每次遍历时对应的赋值信息以键值对方式与函数名称绑定存储。如变量i其被多次赋值,赋值信息为1、2、3……,在存储时,对变量每次被遍历时后重新赋值的赋值信息均进行存储,即存储多个键值对,每个键值对的key值为i,value值分别为每次遍历时的赋值信息。
进一步,若赋值信息中还包含对其他变量、参数的引用关系时,如b=/home/test/$a。其中,变量b的赋值信息中还引用了变量a。现有扫描工具在扫描到变量b时,由于变量b中引用了变量a,其无法直接对如变量b进行问题扫描,往往忽略对变量b的检测。在本实施例中,若变量的赋值信息中还包含对其他变量、参数的引用关系时,对变量的赋值信息进行解析,根据引用关系将引用的其他变量、参数替换为其他变量、参数对应的赋值信息。如变量b引用了变量a,对变量b的赋值信息进行解析,根据引用关系将引用的其他变量a替换为其他变量a对应的赋值信息,得到变量b替换后的赋值信息为b=/home/test/20190801。对于赋值信息包含对其他变量、参数的引用关系的,在提取到代码信息中的变量后,将变量与替换后的赋值信息以键值对方式存储,存储的赋值信息为变量在使用时的直接赋值信息,方便后续对变量、赋值信息直接进行检测,保障检测准确性。
针对参数,在分类存储时,需将代码信息中的至少一个函数中的至少一个参数按照其调用顺序与函数名称绑定存储。首先在确定了函数名称后,记录函数所引用的各参数,再根据各参数在函数中实际被调用的顺序,依次将参数与函数名称绑定存储。如函数中引用了参数$1、$2,在函数中先调用了$2,又调用了$1,根据实际调用顺序,先存储参数$2,在存储参数$1。存储时,可以采用先入先出的数据存储结构,按照调用顺序进行存储。进一步,参数的赋值信息,一般在函数被调用时传入。仅利用现有扫描工具其无法确定参数的赋值信息,不能对参数进行扫描检测。本实施例通过分析代码文件的上下文关系,抽取函数被调用时传入的参数的赋值信息,将参数与对应的赋值信息以键值对方式与函数名称绑定存储,可以方便后续对参数的赋值信息进行检测。若变量的赋值信息中包含对参数的引用关系时,在得到参数的赋值信息后,可以根据引用关系将引用的参数替换为参数对应的赋值信息,得到变量替换后的赋值信息。如变量c=$1,在函数被调用时,参数$1传入赋值信息test,在将参数$1和赋值信息test以键值对方式与函数名称绑定存储后,还需要将变量c的赋值信息进行替换,得到变量c和其替换后的赋值信息test进行存储。
针对函数,可以根据提取到的代码信息,对至少一个函数的起始行号信息进行定位,获取到函数的起始行号信息,也可以同时获取到函数的终止行号信息等。对于函数,还需要获取函数的功能信息,方便对函数所实现的功能信息进行检测等。将获取到的函数的起始行号信息、函数的功能信息等与对应的函数名称绑定。
存储时,可以按照如图2所示存储方式,为一个代码文件划分对应的存储空间,其存储与代码文件对应的所有全局变量的代码信息,并为代码文件中包含的各个函数划分对应的各函数的存储空间,各函数的存储空间中存储函数包含的变量、参数、函数的功能信息等代码信息。
步骤S103,对缓存的代码信息进行检测,确定代码信息中是否存在代码问题。
在缓存各代码信息后,可以基于缓存的代码信息进行检测。
具体的,对缓存的变量、参数以及其对应的赋值信息进行检测:检测变量、参数是否引用前被声明(可以在提取变量、参数等代码信息同时检测其是否被声明,且在声明时还未被引用,或者,在缓存后,确认缓存中的变量、参数等在代码文件中的声明位置是否早于其引用位置等),若否,则确定代码信息存在代码问题;检测变量、参数是否引用前被赋值(检测变量、参数等是否有对应的赋值信息,以及检测代码文件中其赋值操作是否在引用前等),若否,则确定代码信息存在代码问题;变量、参数的赋值信息是否符合变量、参数的声明信息(根据缓存的变量、参数的赋值信息检测其是否与变量、参数的声明信息相符;当变量被多次赋值时,需要检测是否每次赋值的赋值信息都与其声明信息相符),若否,则确定代码信息存在代码问题。
对缓存的函数相关的函数功能,进行功能验证检测。如函数功能为可并行执行功能,需要检测函数是否实现功能信息对应的功能。函数的功能信息包括了如并行执行、错误反馈、报警、文件存在性验证等功能,如根据缓存的函数的功能信息,检测代码文件是否包含实现该功能信息的代码,若否,则确定代码信息存在代码问题。
步骤S104,标记并定位代码问题。
当检测到代码问题后,还可以根据代码问题确定对应的代码问题定位信息,方便用户可以根据定位信息对代码问题进行修正。该步骤可以在步骤S103检测到任一代码问题时执行,直接对检测到的代码问题进行定位,也可以在步骤S103检测完成后再执行,对检测到的代码问题分别进行定位,此处不做限定。
在定位代码问题时,若代码问题为全局变量的问题,可以定位至代码文件中缓存的具体的全局变量,还可以定位到该全局变量在代码文件中出现代码问题的具体位置信息(代码文件中的声明位置信息、引用位置信息等)。若代码问题为函数中的变量、参数等,可以定位至代码文件中函数缓存的具体的变量、参数,或者定位到该变量、参数在代码文件中出现代码问题的具体位置信息。若代码问题为函数的功能信息,定位到代码文件缓存的函数名称,或者该函数在代码文件中的位置信息等。
定位代码问题可以将定位与缓存的代码信息存储在一起,也可以将代码问题以及对应的代码问题定位信息存储至代码问题数据库中统一管理。
根据本发明提供的代码扫描方法,扫描代码文件,提取代码文件的代码信息;对代码信息进行分析整理,并分类缓存代码信息;对缓存的代码信息进行检测,确定代码信息中是否存在代码问题;若是,标记并定位代码问题。利用对代码文件的扫描,可以在代码线上执行前发现代码中存在的代码问题,有效地对代码问题进行定位、标记,方便对代码文件进行修正,解决存在的代码问题。
图3示出了根据本发明另一个实施例的代码扫描方法的流程示意图,如图3所示,该方法包括如下步骤:
步骤S301,对代码文件进行代码逻辑检测,确定代码文件中是否存在代码问题。
在扫描代码文件过程中,对代码文件进行代码逻辑检测。代码逻辑检测包括如判断代码文件中任务(如streaming任务)启动前是否监测输入信息的存在性,若否,则确定代码文件存在代码问题;判断代码文件中的任务是否设置重试机制,若否,则确定代码文件存在代码问题;判断代码文件中的任务失败是否设置通告机制,若否,则确定代码文件存在代码问题;判断输入文件的实时性,若未进行判断,则确定代码文件存在代码问题;判断是否有非安全拷贝,若是,则确定代码文件存在代码问题;判断拷贝是否为跨机器拷贝,若是,则确定代码文件存在代码问题;判断拷贝所使用账号是否为公共账号,若否,则确定代码文件存在代码问题;判断邮件通知中的收件人是否未更新(收件人中存在如离职人员、非指定人员等),若未更新,则确定代码文件存在代码问题等等。代码逻辑检测基于代码文件的实际情况设置,此处为举例说明,不做具体限定。
该步骤是在扫描代码文件的过程中执行,其可以与步骤S302一起执行。
进一步,若在扫描代码文件的过程中,步骤S302判断代码文件中引用至少一个其它的代码文件,则对代码文件的代码逻辑检测包括了对代码文件和引用的其它的代码文件的代码逻辑检测。当扫描到代码文件时,对代码文件进行代码逻辑检测,当扫描至引用的其它的代码文件时,对引用的其它的代码文件进行代码逻辑检测。
当扫描代码文件或引用的其它的代码文件,进行代码逻辑检测后确定代码文件或引用的其它的代码文件存在代码问题,则记录代码问题,方便后续标记并定位代码问题。代码逻辑检测到的代码问题定位至具体的代码文件或引用的其它的代码文件。
步骤S302,判断代码文件中是否引用至少一个其它的代码文件。
代码文件基于其实现的功能不同,有时需要引起其它的代码文件。在扫描一个代码文件的过程中,通过读取代码文件的具体内容,可以对其进行判断,判断其是否引用了其它的代码文件。如扫描代码文件test.sh的过程中,读取到test.sh中包含了引用conf.sh代码文件的命令语句或者包含了对某函数的调用语句(该函数为conf.sh代码文件的函数),可以判断代码文件test.sh引用了代码文件conf.sh。
代码文件可能引用一个或多个其它的代码文件,在扫描代码文件的过程中根据代码文件中包含的引用其它代码文件的命令语句或调用非本代码文件的函数的调用语句以及该函数所在代码文件信息等判断代码文件所引用的其它的代码文件。
若代码文件引用了其它的代码文件,则在扫描时,除如图1实施例中扫描代码文件外,还需要扫描代码文件所引用的其它的代码文件。若判断代码文件未引用其它的代码文件时,可以根据图1实施例所描述的步骤执行,在此不再赘述。若判断代码文件引用了至少一个其它的代码文件时,则执行步骤S303。
步骤S303,扫描代码文件和至少一个其它的代码文件,提取代码文件和至少一个其它的代码文件的代码信息,并以树状结构关联记录代码文件和至少一个其它的代码文件的引用关系。
在扫描代码文件的过程中,当判断代码文件引用了至少一个其它的代码文件时,可以先暂时保存对代码文件的当前扫描,记录扫描位置,跳转至扫描引用的其它的代码文件,优先扫描引用的其它的代码文件,从中提取出其它的代码文件的代码信息。在扫描完成引用的其它的代码文件后,在从记录的代码文件的扫描位置继续对代码文件进行扫描,提取代码文件的代码信息。
其中,代码文件的代码信息与其它的代码文件的代码信息分别与各自的代码文件绑定存储,代码文件与其它的代码文件的引用关系以树状结构关联记录。具体可以如图4所示,如代码文件引用了其它的代码文件1、其它的代码文件2……,其它的代码文件1引用了其它的代码文件3,根据引用关系,利用树状结构关联代码文件和至少一个其它的代码文件。扫描代码文件和其它的代码文件得到的代码文件的代码信息与其它的代码文件的代码信息,分别与各自的代码文件绑定存储。
步骤S304,对代码信息进行分析整理,并分类缓存代码信息。
对扫描得到的代码文件的代码信息与其它的代码文件的代码信息分别进行分析整理,并分类缓存。具体的,如图4所示,为代码文件划分对应的存储空间,存储与代码文件对应代码信息,为其它的代码文件1、2、3…等划分各自的存储空间,存储各自对应的代码信息。代码文件与其它的代码文件1、2、3…之间的引用关系通过树状结构关联。
代码信息的具体存储参照图1实施例中步骤S102的描述,在此不再赘述。
步骤S305,对缓存的代码信息进行检测,确定代码信息中是否存在代码问题。
对缓存的代码文件的代码信息与其它的代码文件的代码信息进行检测,从中确定代码文件与其它的代码文件是否存在代码问题。
对缓存的代码信息的检测参照图1实施例中步骤S103的描述,在此不再赘述。
步骤S306,标记并定位代码问题。
标记定位代码问题时,对于代码逻辑检测所确定的代码文件与其它的代码文件存在的代码问题,定位至代码文件与其它的代码文件,对于代码信息进行检测所确定的代码信息中存在的代码问题,定位至代码信息或代码信息在代码文件或其它的代码文件中具体位置信息。
步骤S307,从代码问题数据库中获取代码问题,并在代码问题展示页面中进行展示。
为方便用户可以直观的查看到代码文件的代码问题或引用的其它的代码文件中的代码问题,本实施例还提供了代码问题展示页面,其可以从代码问题数据库中获取存储的代码问题,将代码问题以及代码问题定位信息等展示在代码问题展示页面中。具体展示方式可以利用如表格等,此处不做限定。
根据本发明提供的代码扫描方法,可以对代码文件以及代码文件所引用的其它的代码文件均进行扫描,并利用树状结构关联存储扫描得到的代码文件的代码信息和其它的代码文件的代码信息,一方面可以一次完成对代码文件以及代码文件所引用的其它的代码文件的扫描,另一方面可以根据代码文件间的引用关系,获取到代码文件间参数调用的赋值信息,从而可以对参数的赋值信息进行检测,与现有扫描工具相比,检测更全面准确,解决现有扫描工具无法对非代码逻辑的代码问题的检测。进一步,本发明还提供了代码问题展示页面将代码问题展示给用户,用户可以根据展示的代码问题以及代码问题定位信息直接对代码文件进行修正,提升用户对代码问题修正的效率。
图5示出了根据本发明一个实施例的代码扫描装置的结构框图,如图5所示,该装置包括:
扫描模块510适于:扫描代码文件,提取代码文件的代码信息。
缓存模块520适于:对代码信息进行分析整理,并分类缓存代码信息。
检测模块530适于:对缓存的代码信息进行检测,确定代码信息中是否存在代码问题。
标记定位模块540适于:若检测模块530确定代码信息中存在代码问题,标记并定位代码问题。
可选地,扫描模块510进一步适于:判断代码文件中是否引用至少一个其它的代码文件;若是,扫描代码文件和至少一个其它的代码文件,提取代码文件和至少一个其它的代码文件的代码信息,并以树状结构关联记录代码文件和至少一个其它的代码文件的引用关系。
可选地,缓存模块520还包括:变量单元521、函数单元522和参数单元523。
变量单元521适于:整理代码信息中的变量,并将变量与对应的赋值信息以键值对方式存储。
函数单元522适于:定位代码信息中至少一个函数的起始行号信息和/或功能信息,并与对应的函数名称绑定。
参数单元523适于:将代码信息中的至少一个函数中的至少一个参数按照其调用顺序与函数名称绑定存储。
可选地,变量单元521进一步适于:整理代码信息中的全局变量,并将全局变量与对应的赋值信息以键值对方式存储;和/或,将代码信息中的至少一个函数中的变量以及对应的赋值信息以键值对方式与函数名称绑定存储;和/或,解析代码信息中的至少一个函数的遍历语句,将遍历语句中的变量与每次遍历时对应的赋值信息以键值对方式与函数名称绑定存储。
可选地,参数单元523进一步适于:抽取函数被调用时传入的参数的赋值信息,将参数与对应的赋值信息以键值对方式与函数名称绑定存储。
可选地,变量单元521进一步适于:对赋值信息进行解析,根据引用关系将引用的其他变量和/或参数替换为其他变量和/或参数对应的赋值信息;整理代码信息中的变量,并将变量与替换后的赋值信息以键值对方式存储。
可选地,检测模块530还包括:变量参数检测单元531和功能检测单元532。
变量参数检测单元531适于:对缓存的变量和/或参数以及其对应的赋值信息进行检测,确定变量和/或参数是否存在代码问题;其中,检测包括以下一项或多项:变量和/或参数是否引用前被声明;变量和/或参数是否引用前被赋值;变量和/或参数的赋值信息是否符合变量和/或参数的声明信息。
功能检测单元532适于:根据缓存的功能信息进行功能验证检测,确定代码信息是否实现功能信息对应的功能;其中,功能信息包括:并行执行、错误反馈、报警、和/或文件存在性验证。
可选地,装置还包括:代码逻辑检测模块550。
代码逻辑检测模块550适于:在扫描代码文件时,对代码文件进行代码逻辑检测,确定代码文件中是否存在代码问题;其中,代码逻辑检测包括以下一项或多项:判断任务启动前是否监测输入信息的存在性、判断任务是否设置重试机制、判断任务失败是否设置通告机制、判断输入文件的实时性、判断是否有非安全拷贝和/或跨机器拷贝、判断拷贝所使用账号是否为公共账号、判断邮件通知中的收件人是否及时更新。
可选地,标记定位模块540进一步适于:根据代码问题确定对应的代码问题定位信息;将代码问题以及对应的代码问题定位信息存储至代码问题数据库中。
可选地,装置还包括:展示模块560。
展示模块560适于:从代码问题数据库中获取代码问题,并在代码问题展示页面中进行展示。
以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。
本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的代码扫描方法。
图6示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图6所示,该计算设备可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:
处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。
通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器602,用于执行程序610,具体可以执行上述代码扫描方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行上述任意方法实施例中的代码扫描方法。程序610中各步骤的具体实现可以参见上述代码扫描实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本申请公开了:A1.一种代码扫描方法,其包括:
扫描代码文件,提取所述代码文件的代码信息;
对所述代码信息进行分析整理,并分类缓存所述代码信息;
对缓存的所述代码信息进行检测,确定所述代码信息中是否存在代码问题;
若是,标记并定位所述代码问题。
A2.根据A1所述的方法,其中,所述扫描代码文件,提取所述代码文件的代码信息进一步包括:
判断所述代码文件中是否引用至少一个其它的代码文件;
若是,扫描所述代码文件和所述至少一个其它的代码文件,提取所述代码文件和所述至少一个其它的代码文件的代码信息,并以树状结构关联记录所述代码文件和所述至少一个其它的代码文件的引用关系。
A3.根据A1或A2所述的方法,其中,所述代码信息包括变量、参数和/或函数;
所述对所述代码信息进行分析整理,并分类缓存所述代码信息进一步包括:
整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储;
和/或,
定位所述代码信息中至少一个函数的起始行号信息和/或功能信息,并与对应的函数名称绑定;
和/或,
将所述代码信息中的至少一个函数中的至少一个参数按照其调用顺序与所述函数名称绑定存储。
A4.根据A3所述的方法,其中,所述整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储进一步包括:
整理所述代码信息中的全局变量,并将所述全局变量与对应的赋值信息以键值对方式存储;
和/或,
将所述代码信息中的至少一个函数中的变量以及对应的赋值信息以键值对方式与所述函数名称绑定存储;
和/或,
解析所述代码信息中的至少一个函数的遍历语句,将所述遍历语句中的变量与每次遍历时对应的赋值信息以键值对方式与所述函数名称绑定存储。
A5.根据A3所述的方法,其中,所述将所述代码信息中的至少一个函数中的至少一个参数按照其调用顺序与所述函数名称绑定存储进一步包括:
抽取函数被调用时传入的参数的赋值信息,将所述参数与对应的赋值信息以键值对方式与所述函数名称绑定存储。
A6.根据A3-A5中任一项所述的方法,其中,所述赋值信息中包含对其他变量和/或参数的引用关系;
所述整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储进一步包括:
对所述赋值信息进行解析,根据引用关系将引用的其他变量和/或参数替换为其他变量和/或参数对应的赋值信息;
整理所述代码信息中的变量,并将所述变量与替换后的赋值信息以键值对方式存储。
A7.根据A3-A6中任一项所述的方法,其中,所述对缓存的所述代码信息进行检测,确定所述代码信息中是否存在代码问题进一步包括:
对缓存的所述变量和/或参数以及其对应的赋值信息进行检测,确定所述变量和/或参数是否存在代码问题;其中,所述检测包括以下一项或多项:所述变量和/或参数是否引用前被声明;所述变量和/或参数是否引用前被赋值;所述变量和/或参数的赋值信息是否符合所述变量和/或参数的声明信息;
和/或,
根据缓存的所述功能信息进行功能验证检测,确定所述代码信息是否实现所述功能信息对应的功能;其中,所述功能信息包括:并行执行、错误反馈、报警、和/或文件存在性验证。
A8.根据A1-A7中任一项所述的方法,其中,所述方法还包括:
在扫描代码文件时,对所述代码文件进行代码逻辑检测,确定所述代码文件中是否存在代码问题;其中,所述代码逻辑检测包括以下一项或多项:判断任务启动前是否监测输入信息的存在性、判断任务是否设置重试机制、判断任务失败是否设置通告机制、判断输入文件的实时性、判断是否有非安全拷贝和/或跨机器拷贝、判断拷贝所使用账号是否为公共账号、判断邮件通知中的收件人是否及时更新。
A9.根据A1-A8任一项所述的方法,其中,所述在所述代码信息中标记并定位所述代码问题进一步包括:
根据所述代码问题确定对应的代码问题定位信息;
将所述代码问题以及对应的代码问题定位信息存储至代码问题数据库中。
A10.根据A9所述的方法,其中,所述方法还包括:
从所述代码问题数据库中获取所述代码问题,并在代码问题展示页面中进行展示。
本申请还公开了:B11.一种代码扫描装置,其包括:
扫描模块,适于扫描代码文件,提取所述代码文件的代码信息;
缓存模块,适于对所述代码信息进行分析整理,并分类缓存所述代码信息;
检测模块,适于对缓存的所述代码信息进行检测,确定所述代码信息中是否存在代码问题;
标记定位模块,适于若所述检测模块确定所述代码信息中存在代码问题,标记并定位所述代码问题。
B12.根据B11所述的装置,其中,所述扫描模块进一步适于:
判断所述代码文件中是否引用至少一个其它的代码文件;
若是,扫描所述代码文件和所述至少一个其它的代码文件,提取所述代码文件和所述至少一个其它的代码文件的代码信息,并以树状结构关联记录所述代码文件和所述至少一个其它的代码文件的引用关系。
B13.根据B11或B12所述的装置,其中,所述代码信息包括变量、参数和/或函数;
所述缓存模块还包括:
变量单元,适于整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储;
和/或,
函数单元,适于定位所述代码信息中至少一个函数的起始行号信息和/或功能信息,并与对应的函数名称绑定;
和/或,
参数单元,适于将所述代码信息中的至少一个函数中的至少一个参数按照其调用顺序与所述函数名称绑定存储。
B14.根据B13所述的装置,其中,所述变量单元进一步适于:
整理所述代码信息中的全局变量,并将所述全局变量与对应的赋值信息以键值对方式存储;
和/或,
将所述代码信息中的至少一个函数中的变量以及对应的赋值信息以键值对方式与所述函数名称绑定存储;
和/或,
解析所述代码信息中的至少一个函数的遍历语句,将所述遍历语句中的变量与每次遍历时对应的赋值信息以键值对方式与所述函数名称绑定存储。
B15.根据B13所述的装置,其中,所述参数单元进一步适于:
抽取函数被调用时传入的参数的赋值信息,将所述参数与对应的赋值信息以键值对方式与所述函数名称绑定存储。
B16.根据B13-B15中任一项所述的装置,其中,所述赋值信息中包含对其他变量和/或参数的引用关系;
所述变量单元进一步适于:
对所述赋值信息进行解析,根据引用关系将引用的其他变量和/或参数替换为其他变量和/或参数对应的赋值信息;
整理所述代码信息中的变量,并将所述变量与替换后的赋值信息以键值对方式存储。
B17.根据B13-B16中任一项所述的装置,其中,所述检测模块还包括:
变量参数检测单元,适于对缓存的所述变量和/或参数以及其对应的赋值信息进行检测,确定所述变量和/或参数是否存在代码问题;其中,所述检测包括以下一项或多项:所述变量和/或参数是否引用前被声明;所述变量和/或参数是否引用前被赋值;所述变量和/或参数的赋值信息是否符合所述变量和/或参数的声明信息;
和/或,
功能检测单元,适于根据缓存的所述功能信息进行功能验证检测,确定所述代码信息是否实现所述功能信息对应的功能;其中,所述功能信息包括:并行执行、错误反馈、报警、和/或文件存在性验证。
B18.根据B11-B17中任一项所述的装置,其中,所述装置还包括:
代码逻辑检测模块,适于在扫描代码文件时,对所述代码文件进行代码逻辑检测,确定所述代码文件中是否存在代码问题;其中,所述代码逻辑检测包括以下一项或多项:判断任务启动前是否监测输入信息的存在性、判断任务是否设置重试机制、判断任务失败是否设置通告机制、判断输入文件的实时性、判断是否有非安全拷贝和/或跨机器拷贝、判断拷贝所使用账号是否为公共账号、判断邮件通知中的收件人是否及时更新。
B19.根据B11-B18中任一项所述的装置,其中,所述标记定位模块进一步适于:
根据所述代码问题确定对应的代码问题定位信息;
将所述代码问题以及对应的代码问题定位信息存储至代码问题数据库中。
B20.根据B19所述的装置,其中,所述装置还包括:
展示模块,适于从所述代码问题数据库中获取所述代码问题,并在代码问题展示页面中进行展示。
本申请还公开了:C21.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如A1-A10中任一项所述的代码扫描方法对应的操作。
本申请还公开了:D22.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-A10中任一项所述的代码扫描方法对应的操作。

Claims (10)

1.一种代码扫描方法,其包括:
扫描代码文件,提取所述代码文件的代码信息;
对所述代码信息进行分析整理,并分类缓存所述代码信息;
对缓存的所述代码信息进行检测,确定所述代码信息中是否存在代码问题;
若是,标记并定位所述代码问题。
2.根据权利要求1所述的方法,其中,所述扫描代码文件,提取所述代码文件的代码信息进一步包括:
判断所述代码文件中是否引用至少一个其它的代码文件;
若是,扫描所述代码文件和所述至少一个其它的代码文件,提取所述代码文件和所述至少一个其它的代码文件的代码信息,并以树状结构关联记录所述代码文件和所述至少一个其它的代码文件的引用关系。
3.根据权利要求1或2所述的方法,其中,所述代码信息包括变量、参数和/或函数;
所述对所述代码信息进行分析整理,并分类缓存所述代码信息进一步包括:
整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储;
和/或,
定位所述代码信息中至少一个函数的起始行号信息和/或功能信息,并与对应的函数名称绑定;
和/或,
将所述代码信息中的至少一个函数中的至少一个参数按照其调用顺序与所述函数名称绑定存储。
4.根据权利要求3所述的方法,其中,所述整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储进一步包括:
整理所述代码信息中的全局变量,并将所述全局变量与对应的赋值信息以键值对方式存储;
和/或,
将所述代码信息中的至少一个函数中的变量以及对应的赋值信息以键值对方式与所述函数名称绑定存储;
和/或,
解析所述代码信息中的至少一个函数的遍历语句,将所述遍历语句中的变量与每次遍历时对应的赋值信息以键值对方式与所述函数名称绑定存储。
5.根据权利要求3所述的方法,其中,所述将所述代码信息中的至少一个函数中的至少一个参数按照其调用顺序与所述函数名称绑定存储进一步包括:
抽取函数被调用时传入的参数的赋值信息,将所述参数与对应的赋值信息以键值对方式与所述函数名称绑定存储。
6.根据权利要求3-5中任一项所述的方法,其中,所述赋值信息中包含对其他变量和/或参数的引用关系;
所述整理所述代码信息中的变量,并将所述变量与对应的赋值信息以键值对方式存储进一步包括:
对所述赋值信息进行解析,根据引用关系将引用的其他变量和/或参数替换为其他变量和/或参数对应的赋值信息;
整理所述代码信息中的变量,并将所述变量与替换后的赋值信息以键值对方式存储。
7.根据权利要求3-6中任一项所述的方法,其中,所述对缓存的所述代码信息进行检测,确定所述代码信息中是否存在代码问题进一步包括:
对缓存的所述变量和/或参数以及其对应的赋值信息进行检测,确定所述变量和/或参数是否存在代码问题;其中,所述检测包括以下一项或多项:所述变量和/或参数是否引用前被声明;所述变量和/或参数是否引用前被赋值;所述变量和/或参数的赋值信息是否符合所述变量和/或参数的声明信息;
和/或,
根据缓存的所述功能信息进行功能验证检测,确定所述代码信息是否实现所述功能信息对应的功能;其中,所述功能信息包括:并行执行、错误反馈、报警、和/或文件存在性验证。
8.一种代码扫描装置,其包括:
扫描模块,适于扫描代码文件,提取所述代码文件的代码信息;
缓存模块,适于对所述代码信息进行分析整理,并分类缓存所述代码信息;
检测模块,适于对缓存的所述代码信息进行检测,确定所述代码信息中是否存在代码问题;
标记定位模块,适于若所述检测模块确定所述代码信息中存在代码问题,标记并定位所述代码问题。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的代码扫描方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的代码扫描方法对应的操作。
CN201910889415.1A 2019-09-19 2019-09-19 代码扫描方法、装置、计算设备及计算机存储介质 Pending CN112527623A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910889415.1A CN112527623A (zh) 2019-09-19 2019-09-19 代码扫描方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910889415.1A CN112527623A (zh) 2019-09-19 2019-09-19 代码扫描方法、装置、计算设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN112527623A true CN112527623A (zh) 2021-03-19

Family

ID=74974519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910889415.1A Pending CN112527623A (zh) 2019-09-19 2019-09-19 代码扫描方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112527623A (zh)

Similar Documents

Publication Publication Date Title
JP5933762B2 (ja) コード網羅率決定方法およびシステム
CN108628751B (zh) 一种无用依赖项检测方法及装置
EP1873706A1 (en) Systems and methods for integrating services
US10296552B1 (en) System and method for automated identification of internet advertising and creating rules for blocking of internet advertising
CN106708704B (zh) 一种对崩溃日志进行分类的方法和装置
CN106469049B (zh) 一种文件扫描的方法及装置
CN109284225A (zh) 一种多人协同开发编程代码的质量检测方法及电子设备
CN111190807A (zh) 一种埋点测试方法及设备
CN115658128A (zh) 一种生成软件物料清单的方法、装置及存储介质
CN109992511B (zh) 获取代码测试覆盖率的装置及方法
US20160314061A1 (en) Software Defect Detection Identifying Location of Diverging Paths
CN112783749A (zh) 一种静态代码扫描优化方法、装置、电子设备和存储介质
CN113452613B (zh) 获取页面路由地址的方法、装置、电子设备及存储介质
US20210342900A1 (en) Methods for customized rule engines for automated medical bill review and devices thereof
CN110796178B (zh) 决策模型训练方法及样本特征选择方法、装置和电子设备
CN112527623A (zh) 代码扫描方法、装置、计算设备及计算机存储介质
US8056050B2 (en) Method and system for guided inconsistency resolution in a model-driven software environment
CN110716866A (zh) 代码质量扫描方法、装置、计算机设备及存储介质
CN110968779A (zh) 网页信息爬取的处理方法和装置
CN113190235B (zh) 一种代码的分析方法、装置、电子终端及存储介质
CN113704114A (zh) 功能接口的自动化测试方法、装置、设备及介质
CN111680974A (zh) 电子化承保流程的问题定位方法及装置
JP6747209B2 (ja) 情報処理方法、情報処理プログラムおよび情報処理システム
CN111444057A (zh) 页面性能数据采集方法、装置及计算设备
JP5962779B2 (ja) フラグアクセス不具合検査装置、フラグアクセス不具合検査方法、フラグアクセス不具合検査プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination