CN116450581A - 一种白名单本地快速匹配方法、系统和电子设备 - Google Patents

一种白名单本地快速匹配方法、系统和电子设备 Download PDF

Info

Publication number
CN116450581A
CN116450581A CN202310374123.0A CN202310374123A CN116450581A CN 116450581 A CN116450581 A CN 116450581A CN 202310374123 A CN202310374123 A CN 202310374123A CN 116450581 A CN116450581 A CN 116450581A
Authority
CN
China
Prior art keywords
file
index
matched
white list
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310374123.0A
Other languages
English (en)
Other versions
CN116450581B (zh
Inventor
吴庆
穆源
吴志勇
代培武
俞仁涵
谷允捷
朱涛
王菁
李艳斌
黄天纵
朱怀东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UNIT 61660 OF PLA
Original Assignee
UNIT 61660 OF PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UNIT 61660 OF PLA filed Critical UNIT 61660 OF PLA
Priority to CN202310374123.0A priority Critical patent/CN116450581B/zh
Publication of CN116450581A publication Critical patent/CN116450581A/zh
Application granted granted Critical
Publication of CN116450581B publication Critical patent/CN116450581B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • G06F16/152File search processing using file content signatures, e.g. hash values
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明给出了一种白名单本地快速匹配方法、系统和电子设备,属于信息安全技术领域,包括:步骤S1、构建一个白名单;步骤S2、获取各个索引对应的文件指纹集;步骤S3、获取待匹配文件的待匹配索引;步骤S4、判断排序后的白名单中是否存在与待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与待匹配索引相匹配的索引对应的文件指纹集,进入步骤S5;如否,则禁止放行所述待匹配文件,结束;步骤S5、计算待匹配文件的待匹配文件指纹;步骤S6、将待匹配文件指纹与待匹配索引相匹配的索引对应的文件指纹集进行匹配。本发明能够实现白名单本地快速比对,且匹配效率高,适用批量文件比匹配。

Description

一种白名单本地快速匹配方法、系统和电子设备
技术领域
本发明属于信息安全技术领域,尤其涉及一种白名单本地快速匹配方法、系统和电子设备。
背景技术
黑白名单是用于记录某些内容是否能通过的数据表,在白名单中的项即为可以通过的项,在黑名单中的项即为需阻止的项。通常在具体实现时,黑白名单记录在同一张数据表中,用一个字段存储文件指纹,通常是文件散列值,用于比较匹配,一个标志字段表示该项为黑名单中的项还是白名单中的项。黑白名单广泛应用于病毒查杀、进程访问控制、权限控制等场景。
现有的黑白名单库通常都比较大,一般是放在云端,匹配时,本地客户端先提取文件指纹,然后上传到云端进行文件指纹比对,云端将匹配结果返回给客户端。在黑白名单库体积小的情况下,也有将其放在本地,采用客户端提取文件指纹,直接与本地黑白名单库进行比较的方法。通常文件指纹比对就是对128比特(MD5)或160比特(SHA1)散列值的排序和查找。上述两种匹配方法,均需要进行文件指纹的散列值计算,十分耗时的,匹配效率低,不适用批量文件比对。
发明内容
本发明的目的之一,在于提供一种白名单本地快速匹配方法,该白名单本地快速匹配方法能够实现白名单本地快速比对,且匹配效率高,适用批量文件比匹配。
本发明的目的之二,在于提供一种白名单本地快速匹配系统。
本发明的目的之三,在于提供一种电子设备。
为了达到上述目的之一,本发明采用如下技术方案实现:
一种白名单本地快速匹配方法,所述白名单本地快速匹配方法包括:
步骤S1、获取各个已知文件的索引和文件指纹,以构建一个白名单;
步骤S2、对所述白名单进行排序,以获取各个索引对应的文件指纹集;
步骤S3、获取待匹配文件的待匹配索引;
步骤S4、判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集,进入步骤S5;如否,则禁止放行所述待匹配文件,结束;
步骤S5、计算所述待匹配文件的待匹配文件指纹;
步骤S6、将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。
进一步的,在所述步骤S1中,所述索引为文件名的散列值;
所述文件指纹为所述索引为文件名和文件大小的散列值。
进一步的,在所述步骤S1中,所述白名单的构建过程包括:
步骤S11、设置一个空的数据表;所述数据表包括索引项和文件指纹项;
步骤S12、采用操作系统提供的文件操作API函数,查找所述各个已知文件对应的对象名称;
步骤S13、对所述各个已知文件对应的对象名称进行文件名解析;
步骤S14、计算各个文件名解析结果的第一散列值;
步骤S15、获取所述各个已知文件对应的文件内容,并计算各个文件内容的第二散列值;
步骤S16、将所述第一散列值和对应的第二散列值分别填写到所述数据表,并将填写后的数据表作为白名单。
进一步的,在所述步骤S2中,所述排序的具体实现过程包括:
步骤S21、按照所述文件指纹,对所述白名单进行第一次排序;
步骤S22、对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。
进一步的,在所述步骤S22中,所述合并处理的具体过程包括:
步骤S221、在第二次排序后的白名单中索引项前增加一列序号项,得到新白名单;
步骤S222、设置所述新白名单中索引对应的序号初始i=1;
步骤S223、判断第i个索引和第i+1个索引是否相同,如是,则将所述第i个索引和第i+1个对应的序号均标记为1,进入步骤S224;如否,则将所述第i个索引和第i+1个对应的序号分别标记为1和0,进入步骤S224;
步骤S224、判断i是否小于n,如是,则令i=i+1,返回步骤S223;如否,则将标记为1的索引和对应的相邻索引合并成一个索引后,合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹,并删除所述新白名单中序号项,结束;
其中,n为所述新白名单中的索引数。
为了达到上述目的之二,本发明采用如下技术方案实现:
一种白名单本地快速匹配系统,所述白名单本地快速匹配系统包括:
构建模块,用于获取各个已知文件的索引和文件指纹,以构建一个白名单;
排序模块,用于对所述白名单进行排序,以获取各个索引对应的文件指纹集;
获取模块,用于获取待匹配文件的待匹配索引;
判断模块,用于判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集,并传输给计算模块;如否,则禁止放行所述待匹配文件,结束;
计算模块,用于计算所述待匹配文件的待匹配文件指纹;
匹配模块,用于将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。
进一步的,所述构建模块包括:
设置子模块,用于设置一个空的数据表;所述数据表包括索引项和文件指纹项;
查找子模块,用于采用操作系统提供的文件操作API函数,查找所述各个已知文件对应的对象名称;
文件名解析子模块,用于对所述各个已知文件对应的对象名称进行文件名解析;
第一计算子模块,用于计算各个文件名解析结果的第一散列值;
获取子模块,用于获取所述各个已知文件对应的文件内容,并计算各个文件内容的第二散列值;
填写子模块,用于将所述第一散列值和对应的第二散列值分别填写到所述数据表,并将填写后的数据表作为白名单。
进一步的,所述排序模块包括:
第一次排序子模块,用于按照所述文件指纹,对所述白名单进行第一次排序;
第二次排序子模块,用于对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。
进一步的,所述第二次排序子模块包括:
增加子单元,用于在第二次排序后的白名单中索引项前增加一列序号项,得到新白名单;
设置子单元,用于设置所述新白名单中索引对应的序号初始i=1;
第一判断子单元,用于判断第i个索引和第i+1个索引是否相同,如是,则将所述第i个索引和第i+1个对应的序号均标记为1,并传输给第二判断子单元;如否,则将所述第i个索引和第i+1个对应的序号分别标记为1和0,并传输给第二判断子单元;
第二判断子单元,用于判断i是否小于n,如是,则令i=i+1,并传输给第二判断子单元;如否,则将标记为1的索引和对应的相邻索引合并成一个索引后,合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹,并删除所述新白名单中序号项;
其中,n为所述新白名单中的索引数。
为了达到上述目的之三,本发明采用如下技术方案实现:
一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至5中任一项所述的一种白名单本地快速匹配方法中的步骤。
综上,本发明提出的方案具备如下技术效果:
本发明通过对包括索引和文件指纹的白名单进行排序,得到各个索引对应的文件指纹集;再根据待匹配文件的待匹配索引,预先判断排序后的白名单中是否存在与待匹配索引相匹配的索引待匹配文件,如果存在,再进行文件指纹匹配,如不存在,则无须计算文件指纹,保证了在尚未获取待匹配文件的文件指纹的情况下,实现本地规则的快速比对,提高匹配效率;本实施例通过获取待匹配文件的索引信息(如文件名的散列值),实现了索引匹配,避免了不在白名单中的文件指纹的散列值计算,从而降低了后续的文件指纹匹配过程中的运算量,提高了匹配效率高,尤其适用批量文件比匹配。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的白名单本地快速匹配方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例给出了一种白名单本地快速匹配方法,参考图1,该白名单本地快速匹配方法包括:
S1、获取各个已知文件的索引和文件指纹,以构建一个白名单。
本实施例的白名单包括索引和文件指纹,每个索引项至少对应一个文件指纹项。其中,索引为具有文件标识功能的文件属性,为文件名和文件大小的散列值。文件指纹为文件内容的散列值。
本实施例中的白名单的构建过程包括:
步骤S11、设置一个空的数据表;所述数据表包括索引项和文件指纹项;
步骤S12、采用操作系统提供的文件操作API函数,查找所述各个已知文件对应的对象名称;
步骤S13、对所述各个已知文件对应的对象名称进行文件名解析;
步骤S14、计算各个文件名解析结果的第一散列值;
步骤S15、获取所述各个已知文件对应的文件内容,并计算各个文件内容的第二散列值;
步骤S16、将所述第一散列值和对应的第二散列值分别填写到所述数据表,并将填写后的数据表作为白名单。
S2、对所述白名单进行排序,以获取各个索引对应的文件指纹集。
本实施例中的件指纹排序过程中需交换整个文件指纹记录的索引和文件指纹。索引排序过程中只需交换文件指纹记录的索引,通过指针进行追踪。排序的具体实现过程包括:
步骤S21、按照所述文件指纹,对所述白名单进行第一次排序;
步骤S22、对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。
合并处理的具体过程包括:
步骤S221、在第二次排序后的白名单中索引项前增加一列序号项,得到新白名单;
步骤S222、设置所述新白名单中索引对应的序号初始i=1;
步骤S223、判断第i个索引和第i+1个索引是否相同,如是,则将所述第i个索引和第i+1个对应的序号均标记为1,进入步骤S224;如否,则将所述第i个索引和第i+1个对应的序号分别标记为1和0,进入步骤S224;
步骤S224、判断i是否小于n,如是,则令i=i+1,返回步骤S223;如否,则将标记为1的索引和对应的相邻索引合并成一个索引后,合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹,并删除所述新白名单中序号项,结束;
其中,n为所述新白名单中的索引数。
S3、获取待匹配文件的待匹配索引。
S4、判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集,进入步骤S5;如否,则禁止放行所述待匹配文件,结束;
S5、计算所述待匹配文件的待匹配文件指纹。
S6、将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。
在索引碰撞比较少的情况下(个人主机上通常如此),则顺序循指针项(箭头)进行文件指纹的比对。如果指针项数量较多,由于此时文件指纹列已经进行过排序,因此指针大小顺序与文件指纹值大小顺序相同,故也可对相同索引值的指针项进行第三次排序处理,从而进一步实施二分匹配查找。因此,在步骤S4和步骤S5中,本实施例还包括:对所述文件指纹集进行文件指纹排序。
本实施例通过对包括索引和文件指纹的白名单进行排序,得到各个索引对应的文件指纹集;再根据待匹配文件的待匹配索引,预先判断排序后的白名单中是否存在与待匹配索引相匹配的索引待匹配文件,如果存在,再进行文件指纹匹配,如不存在,则无须计算文件指纹,保证了在尚未获取待匹配文件的文件指纹的情况下,实现本地规则的快速比对,提高匹配效率;本实施例通过获取待匹配文件的索引信息(如文件名和文件大小的散列值),实现了索引匹配,避免了不在白名单中的文件指纹的散列值计算,从而降低了后续的文件指纹匹配过程中的运算量,提高了匹配效率高,尤其适用批量文件比匹配。
本实施例可采用如下实施例给出的技术方案实现:
另一实施例给出了一种白名单本地快速匹配系统,该白名单本地快速匹配系统包括:
构建模块,用于获取各个已知文件的索引和文件指纹,以构建一个白名单;
排序模块,用于对所述白名单进行排序,以获取各个索引对应的文件指纹集;
获取模块,用于获取待匹配文件的待匹配索引;
判断模块,用于判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集,并传输给计算模块;如否,则禁止放行所述待匹配文件,结束;
计算模块,用于计算所述待匹配文件的待匹配文件指纹;
匹配模块,用于将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。
进一步的,所述构建模块包括:
设置子模块,用于设置一个空的数据表;所述数据表包括索引项和文件指纹项;
查找子模块,用于采用操作系统提供的文件操作API函数,查找所述各个已知文件对应的对象名称;
文件名解析子模块,用于对所述各个已知文件对应的对象名称进行文件名解析;
第一计算子模块,用于计算各个文件名解析结果的第一散列值;
获取子模块,用于获取所述各个已知文件对应的文件内容,并计算各个文件内容的第二散列值;
填写子模块,用于将所述第一散列值和对应的第二散列值分别填写到所述数据表,并将填写后的数据表作为白名单。
进一步的,所述排序模块包括:
第一次排序子模块,用于按照所述文件指纹,对所述白名单进行第一次排序;
第二次排序子模块,用于对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。
进一步的,所述第二次排序子模块包括:
增加子单元,用于在第二次排序后的白名单中索引项前增加一列序号项,得到新白名单;
设置子单元,用于设置所述新白名单中索引对应的序号初始i=1;
第一判断子单元,用于判断第i个索引和第i+1个索引是否相同,如是,则将所述第i个索引和第i+1个对应的序号均标记为1,并传输给第二判断子单元;如否,则将所述第i个索引和第i+1个对应的序号分别标记为1和0,并传输给第二判断子单元;
第二判断子单元,用于判断i是否小于n,如是,则令i=i+1,并传输给第二判断子单元;如否,则将标记为1的索引和对应的相邻索引合并成一个索引后,合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹,并删除所述新白名单中序号项;
其中,n为所述新白名单中的索引数。
又一实施例给出了一种电子设备,该电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现上述实施例给出的一种白名单本地快速匹配方法中的步骤。
上述实施例所涉及的原理、公式及其参数定义均可适用,这里不再一一赘述。
请注意,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种白名单本地快速匹配方法,其特征在于,所述白名单本地快速匹配方法包括:
步骤S1、获取各个已知文件的索引和文件指纹,以构建一个白名单;
步骤S2、对所述白名单进行排序,以获取各个索引对应的文件指纹集;
步骤S3、获取待匹配文件的待匹配索引;
步骤S4、判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集,进入步骤S5;如否,则禁止放行所述待匹配文件,结束;
步骤S5、计算所述待匹配文件的待匹配文件指纹;
步骤S6、将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。
2.根据权利要求1所述的白名单本地快速匹配方法,其特征在于,在所述步骤S1中,所述索引为文件名和文件大小的散列值;
所述文件指纹为文件内容的散列值。
3.根据权利要求2所述的白名单本地快速匹配方法,其特征在于,在所述步骤S1中,所述白名单的构建过程包括:
步骤S11、设置一个空的数据表;所述数据表包括索引项和文件指纹项;
步骤S12、采用操作系统提供的文件操作API函数,查找所述各个已知文件对应的对象名称;
步骤S13、对所述各个已知文件对应的对象名称进行文件名解析;
步骤S14、计算各个文件名解析结果的第一散列值;
步骤S15、获取所述各个已知文件对应的文件内容,并计算各个文件内容的第二散列值;
步骤S16、将所述第一散列值和对应的第二散列值分别填写到所述数据表,并将填写后的数据表作为白名单。
4.根据权利要求3所述的白名单本地快速匹配方法,其特征在于,在所述步骤S2中,所述排序的具体实现过程包括:
步骤S21、按照所述文件指纹,对所述白名单进行第一次排序;
步骤S22、对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。
5.根据权利要求4所述的白名单本地快速匹配方法,其特征在于,在所述步骤S22中,所述合并处理的具体过程包括:
步骤S221、在第二次排序后的白名单中索引项前增加一列序号项,得到新白名单;
步骤S222、设置所述新白名单中索引对应的序号初始i=1;
步骤S223、判断第i个索引和第i+1个索引是否相同,如是,则将所述第i个索引和第i+1个对应的序号均标记为1,进入步骤S224;如否,则将所述第i个索引和第i+1个对应的序号分别标记为1和0,进入步骤S224;
步骤S224、判断i是否小于n,如是,则令i=i+1,返回步骤S223;如否,则将标记为1的索引和对应的相邻索引合并成一个索引后,合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹,并删除所述新白名单中序号项,结束;
其中,n为所述新白名单中的索引数。
6.一种白名单本地快速匹配系统,其特征在于,所述白名单本地快速匹配系统包括:
构建模块,用于获取各个已知文件的索引和文件指纹,以构建一个白名单;
排序模块,用于对所述白名单进行排序,以获取各个索引对应的文件指纹集;
获取模块,用于获取待匹配文件的待匹配索引;
判断模块,用于判断排序后的白名单中是否存在与所述待匹配索引相匹配的索引,如是,则从排序后的白名单中提取出与所述待匹配索引相匹配的索引对应的文件指纹集,并传输给计算模块;如否,则禁止放行所述待匹配文件,结束;
计算模块,用于计算所述待匹配文件的待匹配文件指纹;
匹配模块,用于将所述待匹配文件指纹与所述待匹配索引相匹配的索引对应的文件指纹集进行匹配。
7.根据权利要求6所述的白名单本地快速匹配系统,其特征在于,所述构建模块包括:
设置子模块,用于设置一个空的数据表;所述数据表包括索引项和文件指纹项;
查找子模块,用于采用操作系统提供的文件操作API函数,查找所述各个已知文件对应的对象名称;
文件名解析子模块,用于对所述各个已知文件对应的对象名称进行文件名解析;
第一计算子模块,用于计算各个文件名解析结果的第一散列值;
获取子模块,用于获取所述各个已知文件对应的文件内容,并计算各个文件内容的第二散列值;
填写子模块,用于将所述第一散列值和对应的第二散列值分别填写到所述数据表,并将填写后的数据表作为白名单。
8.根据权利要求7所述的白名单本地快速匹配系统,其特征在于,所述排序模块包括:
第一次排序子模块,用于按照所述文件指纹,对所述白名单进行第一次排序;
第二次排序子模块,用于对第一次排序后的白名单中的索引进行第二次排序后进行合并处理。
9.根据权利要求8所述的白名单本地快速匹配系统,其特征在于,所述第二次排序子模块包括:
增加子单元,用于在第二次排序后的白名单中索引项前增加一列序号项,得到新白名单;
设置子单元,用于设置所述新白名单中索引对应的序号初始i=1;
第一判断子单元,用于判断第i个索引和第i+1个索引是否相同,如是,则将所述第i个索引和第i+1个对应的序号均标记为1,并传输给第二判断子单元;如否,则将所述第i个索引和第i+1个对应的序号分别标记为1和0,并传输给第二判断子单元;
第二判断子单元,用于判断i是否小于n,如是,则令i=i+1,并传输给第二判断子单元;如否,则将标记为1的索引和对应的相邻索引合并成一个索引后,合并后的索引通过箭头指向分别指向合并前的各个索引对应的文件指纹,并删除所述新白名单中序号项;
其中,n为所述新白名单中的索引数。
10.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至5中任一项所述的一种白名单本地快速匹配方法中的步骤。
CN202310374123.0A 2023-04-10 2023-04-10 一种白名单本地快速匹配方法、系统和电子设备 Active CN116450581B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310374123.0A CN116450581B (zh) 2023-04-10 2023-04-10 一种白名单本地快速匹配方法、系统和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310374123.0A CN116450581B (zh) 2023-04-10 2023-04-10 一种白名单本地快速匹配方法、系统和电子设备

Publications (2)

Publication Number Publication Date
CN116450581A true CN116450581A (zh) 2023-07-18
CN116450581B CN116450581B (zh) 2024-02-13

Family

ID=87123234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310374123.0A Active CN116450581B (zh) 2023-04-10 2023-04-10 一种白名单本地快速匹配方法、系统和电子设备

Country Status (1)

Country Link
CN (1) CN116450581B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117932106A (zh) * 2024-01-23 2024-04-26 北京信息职业技术学院 针对音频指纹库数据的多级索引方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100073134A (ko) * 2008-12-22 2010-07-01 한국전자통신연구원 시그니처 자동생성 시스템을 위한 문자열 포함성 결정장치 및 방법
US20160294849A1 (en) * 2015-03-31 2016-10-06 Juniper Networks, Inc. Detecting suspicious files resident on a network
CN111538984A (zh) * 2020-04-17 2020-08-14 南京东科优信网络安全技术研究院有限公司 一种可信白名单快速匹配装置与方法
CN112579155A (zh) * 2021-02-23 2021-03-30 北京北大软件工程股份有限公司 代码相似性检测方法、装置以及存储介质
CN114598530A (zh) * 2022-03-09 2022-06-07 上海中广核工程科技有限公司 工控防火墙白名单规则匹配方法、装置及相关设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100073134A (ko) * 2008-12-22 2010-07-01 한국전자통신연구원 시그니처 자동생성 시스템을 위한 문자열 포함성 결정장치 및 방법
US20160294849A1 (en) * 2015-03-31 2016-10-06 Juniper Networks, Inc. Detecting suspicious files resident on a network
CN111538984A (zh) * 2020-04-17 2020-08-14 南京东科优信网络安全技术研究院有限公司 一种可信白名单快速匹配装置与方法
CN112579155A (zh) * 2021-02-23 2021-03-30 北京北大软件工程股份有限公司 代码相似性检测方法、装置以及存储介质
CN114598530A (zh) * 2022-03-09 2022-06-07 上海中广核工程科技有限公司 工控防火墙白名单规则匹配方法、装置及相关设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117932106A (zh) * 2024-01-23 2024-04-26 北京信息职业技术学院 针对音频指纹库数据的多级索引方法及系统

Also Published As

Publication number Publication date
CN116450581B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
US9659013B2 (en) System and method for indexing electronic discovery data
US8489613B1 (en) LSH-based retrieval using sub-sampling
US9053386B2 (en) Method and apparatus of identifying similar images
CN110377558B (zh) 文档查询方法、装置、计算机设备和存储介质
EP2045731A1 (en) Automatic generation of ontologies using word affinities
KR100903961B1 (ko) 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템
CN105589894B (zh) 文档索引建立方法和装置、文档检索方法和装置
CN116450581B (zh) 一种白名单本地快速匹配方法、系统和电子设备
US9754023B2 (en) Stochastic document clustering using rare features
CN110210038B (zh) 核心实体确定方法及其系统、服务器和计算机可读介质
CN108388556B (zh) 同类实体的挖掘方法及系统
EP3301603A1 (en) Improved search for data loss prevention
CN110874526B (zh) 一种文件相似性检测方法、装置、电子设备及存储介质
CN117171331B (zh) 基于大型语言模型的专业领域信息交互方法、装置及设备
CN110222015A (zh) 一种文件数据的读取、查询方法、装置及可读存储介质
CN116126997B (zh) 一种文献去重存储方法、系统、设备及存储介质
CN110427496B (zh) 用于文本处理的知识图谱扩充方法及装置
US8566366B2 (en) Format conversion apparatus and file search apparatus capable of searching for a file as based on an attribute provided prior to conversion
CN116383423A (zh) 图像检索结果的重排方法、装置、计算机设备及介质
CN112733523B (zh) 文档发送方法、装置、设备及存储介质
CN114490511A (zh) 一种档案校正方法、终端及计算机可读存储介质
CN116263770A (zh) 基于数据库的业务数据存储方法、装置、终端设备及介质
CN112579763A (zh) 一种文书的推送方法及装置
CN113836534B (zh) 一种病毒家族识别方法、系统、设备及计算机存储介质
CN116821146B (zh) 一种基于Apache Iceberg的数据表列更新方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant