CN116450581A

CN116450581A - 一种白名单本地快速匹配方法、系统和电子设备

Info

Publication number: CN116450581A
Application number: CN202310374123.0A
Authority: CN
Inventors: 吴庆; 穆源; 吴志勇; 代培武; 俞仁涵; 谷允捷; 朱涛; 王菁; 李艳斌; 黄天纵; 朱怀东
Original assignee: UNIT 61660 OF PLA
Current assignee: UNIT 61660 OF PLA
Priority date: 2023-04-10
Filing date: 2023-04-10
Publication date: 2023-07-18
Anticipated expiration: 2043-04-10
Also published as: CN116450581B

Abstract

本发明给出了一种白名单本地快速匹配方法、系统和电子设备，属于信息安全技术领域，包括：步骤S1、构建一个白名单；步骤S2、获取各个索引对应的文件指纹集；步骤S3、获取待匹配文件的待匹配索引；步骤S4、判断排序后的白名单中是否存在与待匹配索引相匹配的索引，如是，则从排序后的白名单中提取出与待匹配索引相匹配的索引对应的文件指纹集，进入步骤S5；如否，则禁止放行所述待匹配文件，结束；步骤S5、计算待匹配文件的待匹配文件指纹；步骤S6、将待匹配文件指纹与待匹配索引相匹配的索引对应的文件指纹集进行匹配。本发明能够实现白名单本地快速比对，且匹配效率高，适用批量文件比匹配。

Description

一种白名单本地快速匹配方法、系统和电子设备

技术领域

本发明属于信息安全技术领域，尤其涉及一种白名单本地快速匹配方法、系统和电子设备。

背景技术

黑白名单是用于记录某些内容是否能通过的数据表，在白名单中的项即为可以通过的项，在黑名单中的项即为需阻止的项。通常在具体实现时，黑白名单记录在同一张数据表中，用一个字段存储文件指纹，通常是文件散列值，用于比较匹配，一个标志字段表示该项为黑名单中的项还是白名单中的项。黑白名单广泛应用于病毒查杀、进程访问控制、权限控制等场景。

现有的黑白名单库通常都比较大，一般是放在云端，匹配时，本地客户端先提取文件指纹，然后上传到云端进行文件指纹比对，云端将匹配结果返回给客户端。在黑白名单库体积小的情况下，也有将其放在本地，采用客户端提取文件指纹，直接与本地黑白名单库进行比较的方法。通常文件指纹比对就是对128比特(MD5)或160比特(SHA1)散列值的排序和查找。上述两种匹配方法，均需要进行文件指纹的散列值计算，十分耗时的，匹配效率低，不适用批量文件比对。

发明内容

本发明的目的之一，在于提供一种白名单本地快速匹配方法，该白名单本地快速匹配方法能够实现白名单本地快速比对，且匹配效率高，适用批量文件比匹配。

本发明的目的之二，在于提供一种白名单本地快速匹配系统。

本发明的目的之三，在于提供一种电子设备。

为了达到上述目的之一，本发明采用如下技术方案实现：

一种白名单本地快速匹配方法，所述白名单本地快速匹配方法包括：

步骤S1、获取各个已知文件的索引和文件指纹，以构建一个白名单；

步骤S2、对所述白名单进行排序，以获取各个索引对应的文件指纹集；

步骤S3、获取待匹配文件的待匹配索引；

步骤S4、判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引，如是，则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集，进入步骤S5；如否，则禁止放行所述待匹配文件，结束；

步骤S5、计算所述待匹配文件的待匹配文件指纹；

步骤S6、将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。

进一步的，在所述步骤S1中，所述索引为文件名的散列值；

所述文件指纹为所述索引为文件名和文件大小的散列值。

进一步的，在所述步骤S1中，所述白名单的构建过程包括：

步骤S11、设置一个空的数据表；所述数据表包括索引项和文件指纹项；

步骤S12、采用操作系统提供的文件操作API函数，查找所述各个已知文件对应的对象名称；

步骤S13、对所述各个已知文件对应的对象名称进行文件名解析；

步骤S14、计算各个文件名解析结果的第一散列值；

步骤S15、获取所述各个已知文件对应的文件内容，并计算各个文件内容的第二散列值；

步骤S16、将所述第一散列值和对应的第二散列值分别填写到所述数据表，并将填写后的数据表作为白名单。

进一步的，在所述步骤S2中，所述排序的具体实现过程包括：

步骤S21、按照所述文件指纹，对所述白名单进行第一次排序；

步骤S22、对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。

进一步的，在所述步骤S22中，所述合并处理的具体过程包括：

步骤S221、在第二次排序后的白名单中索引项前增加一列序号项，得到新白名单；

步骤S222、设置所述新白名单中索引对应的序号初始i＝1；

步骤S223、判断第i个索引和第i+1个索引是否相同，如是，则将所述第i个索引和第i+1个对应的序号均标记为1，进入步骤S224；如否，则将所述第i个索引和第i+1个对应的序号分别标记为1和0，进入步骤S224；

步骤S224、判断i是否小于n，如是，则令i＝i+1，返回步骤S223；如否，则将标记为1的索引和对应的相邻索引合并成一个索引后，合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹，并删除所述新白名单中序号项，结束；

其中，n为所述新白名单中的索引数。

为了达到上述目的之二，本发明采用如下技术方案实现：

一种白名单本地快速匹配系统，所述白名单本地快速匹配系统包括：

构建模块，用于获取各个已知文件的索引和文件指纹，以构建一个白名单；

排序模块，用于对所述白名单进行排序，以获取各个索引对应的文件指纹集；

获取模块，用于获取待匹配文件的待匹配索引；

判断模块，用于判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引，如是，则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集，并传输给计算模块；如否，则禁止放行所述待匹配文件，结束；

计算模块，用于计算所述待匹配文件的待匹配文件指纹；

匹配模块，用于将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。

进一步的，所述构建模块包括：

设置子模块，用于设置一个空的数据表；所述数据表包括索引项和文件指纹项；

查找子模块，用于采用操作系统提供的文件操作API函数，查找所述各个已知文件对应的对象名称；

文件名解析子模块，用于对所述各个已知文件对应的对象名称进行文件名解析；

第一计算子模块，用于计算各个文件名解析结果的第一散列值；

获取子模块，用于获取所述各个已知文件对应的文件内容，并计算各个文件内容的第二散列值；

填写子模块，用于将所述第一散列值和对应的第二散列值分别填写到所述数据表，并将填写后的数据表作为白名单。

进一步的，所述排序模块包括：

第一次排序子模块，用于按照所述文件指纹，对所述白名单进行第一次排序；

第二次排序子模块，用于对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。

进一步的，所述第二次排序子模块包括：

增加子单元，用于在第二次排序后的白名单中索引项前增加一列序号项，得到新白名单；

设置子单元，用于设置所述新白名单中索引对应的序号初始i＝1；

第一判断子单元，用于判断第i个索引和第i+1个索引是否相同，如是，则将所述第i个索引和第i+1个对应的序号均标记为1，并传输给第二判断子单元；如否，则将所述第i个索引和第i+1个对应的序号分别标记为1和0，并传输给第二判断子单元；

第二判断子单元，用于判断i是否小于n，如是，则令i＝i+1，并传输给第二判断子单元；如否，则将标记为1的索引和对应的相邻索引合并成一个索引后，合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹，并删除所述新白名单中序号项；

其中，n为所述新白名单中的索引数。

为了达到上述目的之三，本发明采用如下技术方案实现：

一种电子设备，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时，实现权利要求1至5中任一项所述的一种白名单本地快速匹配方法中的步骤。

综上，本发明提出的方案具备如下技术效果：

本发明通过对包括索引和文件指纹的白名单进行排序，得到各个索引对应的文件指纹集；再根据待匹配文件的待匹配索引，预先判断排序后的白名单中是否存在与待匹配索引相匹配的索引待匹配文件，如果存在，再进行文件指纹匹配，如不存在，则无须计算文件指纹，保证了在尚未获取待匹配文件的文件指纹的情况下，实现本地规则的快速比对，提高匹配效率；本实施例通过获取待匹配文件的索引信息(如文件名的散列值)，实现了索引匹配，避免了不在白名单中的文件指纹的散列值计算，从而降低了后续的文件指纹匹配过程中的运算量，提高了匹配效率高，尤其适用批量文件比匹配。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的白名单本地快速匹配方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例只是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本实施例给出了一种白名单本地快速匹配方法，参考图1，该白名单本地快速匹配方法包括：

S1、获取各个已知文件的索引和文件指纹，以构建一个白名单。

本实施例的白名单包括索引和文件指纹，每个索引项至少对应一个文件指纹项。其中，索引为具有文件标识功能的文件属性，为文件名和文件大小的散列值。文件指纹为文件内容的散列值。

本实施例中的白名单的构建过程包括：

步骤S14、计算各个文件名解析结果的第一散列值；

S2、对所述白名单进行排序，以获取各个索引对应的文件指纹集。

本实施例中的件指纹排序过程中需交换整个文件指纹记录的索引和文件指纹。索引排序过程中只需交换文件指纹记录的索引，通过指针进行追踪。排序的具体实现过程包括：

合并处理的具体过程包括：

步骤S222、设置所述新白名单中索引对应的序号初始i＝1；

其中，n为所述新白名单中的索引数。

S3、获取待匹配文件的待匹配索引。

S4、判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引，如是，则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集，进入步骤S5；如否，则禁止放行所述待匹配文件，结束；

S5、计算所述待匹配文件的待匹配文件指纹。

S6、将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。

在索引碰撞比较少的情况下(个人主机上通常如此)，则顺序循指针项(箭头)进行文件指纹的比对。如果指针项数量较多，由于此时文件指纹列已经进行过排序，因此指针大小顺序与文件指纹值大小顺序相同，故也可对相同索引值的指针项进行第三次排序处理，从而进一步实施二分匹配查找。因此，在步骤S4和步骤S5中，本实施例还包括：对所述文件指纹集进行文件指纹排序。

本实施例通过对包括索引和文件指纹的白名单进行排序，得到各个索引对应的文件指纹集；再根据待匹配文件的待匹配索引，预先判断排序后的白名单中是否存在与待匹配索引相匹配的索引待匹配文件，如果存在，再进行文件指纹匹配，如不存在，则无须计算文件指纹，保证了在尚未获取待匹配文件的文件指纹的情况下，实现本地规则的快速比对，提高匹配效率；本实施例通过获取待匹配文件的索引信息(如文件名和文件大小的散列值)，实现了索引匹配，避免了不在白名单中的文件指纹的散列值计算，从而降低了后续的文件指纹匹配过程中的运算量，提高了匹配效率高，尤其适用批量文件比匹配。

本实施例可采用如下实施例给出的技术方案实现：

另一实施例给出了一种白名单本地快速匹配系统，该白名单本地快速匹配系统包括：

获取模块，用于获取待匹配文件的待匹配索引；

计算模块，用于计算所述待匹配文件的待匹配文件指纹；

进一步的，所述构建模块包括：

进一步的，所述排序模块包括：

进一步的，所述第二次排序子模块包括：

其中，n为所述新白名单中的索引数。

又一实施例给出了一种电子设备，该电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时，实现上述实施例给出的一种白名单本地快速匹配方法中的步骤。

上述实施例所涉及的原理、公式及其参数定义均可适用，这里不再一一赘述。

请注意，以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种白名单本地快速匹配方法，其特征在于，所述白名单本地快速匹配方法包括：

步骤S3、获取待匹配文件的待匹配索引；

步骤S5、计算所述待匹配文件的待匹配文件指纹；

2.根据权利要求1所述的白名单本地快速匹配方法，其特征在于，在所述步骤S1中，所述索引为文件名和文件大小的散列值；

所述文件指纹为文件内容的散列值。

3.根据权利要求2所述的白名单本地快速匹配方法，其特征在于，在所述步骤S1中，所述白名单的构建过程包括：

步骤S14、计算各个文件名解析结果的第一散列值；

4.根据权利要求3所述的白名单本地快速匹配方法，其特征在于，在所述步骤S2中，所述排序的具体实现过程包括：

5.根据权利要求4所述的白名单本地快速匹配方法，其特征在于，在所述步骤S22中，所述合并处理的具体过程包括：

步骤S222、设置所述新白名单中索引对应的序号初始i＝1；

其中，n为所述新白名单中的索引数。

6.一种白名单本地快速匹配系统，其特征在于，所述白名单本地快速匹配系统包括：

获取模块，用于获取待匹配文件的待匹配索引；

计算模块，用于计算所述待匹配文件的待匹配文件指纹；

7.根据权利要求6所述的白名单本地快速匹配系统，其特征在于，所述构建模块包括：

8.根据权利要求7所述的白名单本地快速匹配系统，其特征在于，所述排序模块包括：

9.根据权利要求8所述的白名单本地快速匹配系统，其特征在于，所述第二次排序子模块包括：

其中，n为所述新白名单中的索引数。

10.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时，实现权利要求1至5中任一项所述的一种白名单本地快速匹配方法中的步骤。