CN105701093A - 基于自动机的模式匹配的方法及装置 - Google Patents

基于自动机的模式匹配的方法及装置 Download PDF

Info

Publication number
CN105701093A
CN105701093A CN201410681752.9A CN201410681752A CN105701093A CN 105701093 A CN105701093 A CN 105701093A CN 201410681752 A CN201410681752 A CN 201410681752A CN 105701093 A CN105701093 A CN 105701093A
Authority
CN
China
Prior art keywords
pattern
subgroup
searched
chain
hash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201410681752.9A
Other languages
English (en)
Inventor
李文
陈娟
刘青海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201410681752.9A priority Critical patent/CN105701093A/zh
Priority to PCT/CN2015/080174 priority patent/WO2016082503A1/zh
Publication of CN105701093A publication Critical patent/CN105701093A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种基于自动机的模式匹配的方法及装置,方法包括:根据当前输入内容查找SHIFT地址表,得到SHIFT地址值;判断得到的SHIFT地址值是否为零;若SHIFT地址值为零,则根据当前输入内容的前缀计算HASH值,并以HASH值作为索引进入实际匹配的模式子分组,对模式子分组通过蛮力算法或自动机算法进行匹配查找,并且在模式子分组查找完成后,将当前输入内容向前偏移一个长度单位;若SHIFT地址值不为零,则将当前输入内容向后偏移SHIFT地址值个长度单位;判断当前输入内容是否全部扫描完成,若是,则输出匹配结果集;否则跳到根据当前输入内容查找SHIFT地址表的步骤,在保证效率和正确性的前提下,使优化后的算法有一个稳定的匹配性能。

Description

基于自动机的模式匹配的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于自动机的模式匹配的方法及装置。
背景技术
Wu-Manber算法(简称WM算法)由吴升和UdiManber在九十年代提出,它基于单模匹配算法BM演化而来。WM算法采用块字符(SHIFT)、HASH、前缀表(PREFIX)等技术,达到了比较好的匹配效率。图1为Wu-Manber算法的数据模型,该数据模型包括三个部分,SHIFT地址表、HASH-PATTERNS表(前缀列表)和PREFIX表,其中SHIFT地址表中记录有偏移地址,HASH-PATTERNS表记录有HASH值与模式子分组的对应关系。按照原有技术,模式子分组中的模式链abcde、bcbde会被散列到同一个HASH桶内,这样在匹配的最坏情况下需要扫描长度={length(abcde)+length(bcbde)},最好情况下需要扫描长度={模式个数,即每个模式扫描一个字节},同时还需查找PREFIX表。其中length(abcde)表示模式链abcde的长度。
然而,由于HASH的不稳定性,随着模式数量的增加,HASH冲突加剧,它的匹配效率会发生不同程度的退化,无法满足商用需求。
发明内容
为了解决上述技术问题,发明的实施例提供了一种基于自动机的模式匹配的方法及装置,在保证效率和正确性的前提下,使优化后的算法有一个稳定的匹配性能。
依据本发明的一个方面,提供了一种基于自动机的模式匹配的方法,所述方法包括:根据当前输入内容查找SHIFT地址表,得到SHIFT地址值;判断得到的所述SHIFT地址值是否为零;若所述SHIFT地址值为零,则根据所述当前输入内容的前缀计算HASH值,并以所述HASH值作为索引进入实际匹配的模式子分组,对所述模式子分组按照预设的方式进行匹配查找,并且在所述模式子分组查找完成后,将当前输入内容向前偏移一个长度单位;若所述SHIFT地址值不为零,则将当前输入内容向后偏移所述SHIFT地址值个长度单位;判断所述当前输入内容是否全部扫描完成,若是,则输出匹配结果集;否则跳到所述根据当前输入内容查找SHIFT地址表的步骤。
可选地,在所述根据当前输入内容查找SHIFT地址表之前,所述方法还包括:构建跳转用的SHIFT地址表;将一个或多个模式链散列到各个HASH桶中,以链式存储;以HASH桶中的每个模式链作为输入,若模式子分组中仅有一条所述模式链,则使用蛮力算法完成所述模式链的预处理;若模式子分组中的所述模式链的模式数大于1,则使用自动机算法完成所述模式链的预处理。
可选地,若需要将多个模式链散列到同一个HASH桶内时,所述将一个或多个模式链散列到各个HASH桶中,以链式存储,具体包括:将多个模式链散列到同一个HASH桶内;将同一个HASH桶内的模式子分组中多个模式链编译为自动机的图形。
可选地,若所述模式子分组为空,则退出当前的所述模式子分组的匹配过程。
可选地,所述对所述模式子分组按照预设的方式进行匹配查找,具体包括:使用蛮力算法对所述模式子分组进行匹配查找当前输入内容;如果匹配成功,则将当前匹配结果加入匹配结果集;否则,退出本次所述模式子分组匹配查找。
可选地,所述对所述模式子分组按照预设的方式进行匹配查找,具体包括:使用自动机算法对当前的所述模式子分组进行匹配查找,如果自动机状态中存在输出,则将当前所有匹配结果加入匹配结果集;如果遇到失效的自动机状态,则退出本次所述模式子分组匹配查找。
依据本发明的另一个方面,还提供了一种基于自动机的模式匹配的装置,所述装置包括:第一匹配模块,用于根据当前输入内容查找SHIFT地址表,得到SHIFT地址值;第一检测模块,用于判断得到的所述SHIFT地址值是否为零;第二匹配模块,用于若所述SHIFT地址值为零,则根据所述当前输入内容的前缀计算HASH值,并以所述HASH值作为索引进入实际匹配的模式子分组,对所述模式子分组通过蛮力算法或自动机算法进行匹配查找,并且在所述模式子分组查找完成后,将当前输入内容向前偏移一个长度单位;若所述SHIFT地址值不为零,则将当前输入内容向后偏移所述SHIFT地址值个长度单位;第二检测模块,用于判断所述当前输入内容是否全部扫描完成,若是,则输出匹配结果集;否则触发所述第一匹配模块根据当前输入内容查找SHIFT地址表。
可选地,所述装置还包括:预处理模块,用于构建跳转用的SHIFT地址表;将一个或多个模式链散列到各个HASH桶中,以链式存储;以HASH桶中的每个模式链作为输入,若模式子分组中仅有一条所述模式链,则使用蛮力算法完成所述模式链的预处理;若模式子分组中的所述模式链的模式数大于1,则使用自动机算法完成所述模式链的预处理。
可选地,所述第二匹配模块进一步用于使用蛮力算法对所述模式子分组进行匹配查找当前输入内容;如果匹配成功,则将当前匹配结果加入匹配结果集;否则,退出本次所述模式子分组匹配查找。
可选地,所述第二匹配模块进一步用于使用自动机算法对当前的所述模式子分组进行匹配查找,如果自动机状态中存在输出,则将当前所有匹配结果加入匹配结果集;如果遇到失效的自动机状态,则退出本次所述模式子分组匹配查找。
通过本发明的实施例,将HASH桶内的冲突链模式编译为基于自动机算法的图形结构,并省略前缀表的查询,在保证效率和正确性的前提下,使优化后的算法有一个稳定的匹配性能,可以使冲突链中的模式匹配时间复杂度达到线性,而与冲突链中模式条数无关。
附图说明
图1为Wu-Manber算法的数据模型;
图2为本发明的实施例中基于自动机的模式匹配的方法的流程图;
图3为本发明的实施例中改进后的算法数据模型;
图4为本发明的实施例中算法对模式链的预处理过程;
图5为本发明的实施例中子分组模式为蛮力类型时的扫描过程;
图6为本发明的实施例中子分组模式为自动机类型时的扫描过程;以及
图7为本发明的实施例中基于自动机的模式匹配的装置的结构示意图。
具体实施方式
在现有技术中,WM算法采用块字符(SHIFT)、HASH、前缀表(PREFIX)等技术,达到了比较好的匹配效率。但由于HASH的不稳定性,随着模式数量的增加,HASH冲突加剧,它的匹配效率会发生不同程度的退化,无法满足商用需求。例如:当SHIFT地址为零时,HASH桶中冲突链的每个节点都需要查找一次PREFIX表,性能上存在消耗。当模式数量增大到一定程度,如达到万条级规模后,模式的HASH冲突会加剧,造成匹配性能下降明显。由于上述的原因,WM算法在真实的商用场景下,不能展现稳定的匹配性能。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图2所示,为本发明的实施例中基于自动机的模式匹配的方法的流程图,具体步骤如下:
步骤S201、根据当前输入内容查找SHIFT地址表,得到SHIFT地址值;
在本实施例中,SHIFT地址表(偏移地址表)中记录有SHIFT地址值(偏移地址值),用于表示当前输入内容的偏移地址。如图3所示,若当前输入内容为“ab”,则在SHIFT地址表中对应查找到的SHIFT地址值为“0”。
步骤S203、判断得到的SHIFT地址值是否为零;若SHIFT地址值为零,进入步骤S205;否则,进入步骤S207;
步骤S205、根据当前输入内容的前缀计算HASH值,并以HASH值作为索引进入实际匹配的模式子分组,按照预设的方式对模式子分组进行匹配查找,然后进入步骤S209;
具体地,在步骤S205中,可以通过蛮力算法或自动机算法对模式子分组进行匹配查找。如图3所示,若当前输入内容为“ab”,则根据当前输入内容的前缀计算得到的HASH值为“oxab”,则可以通过蛮力算法对该模式子分组(abcabe)进行匹配查找;若当前输入内容为“de”,则根据当前输入内容的前缀计算得到的HASH值为“oxde”,由于该模式子分组(abcde和bcbde)被编译为自动机的图形,因此可以通过自动机算法对该模式子分组(abcde和bcbde)进行匹配查找。
在本发明的实施例中,若模式子分组为空,则说明内容不可能发生匹配,则不做任何处理,直接退出当前模式子分组的匹配过程。如图3所示,HASH值为oxfffe对应的模式子分组为空。
步骤S207、将当前输入内容向后偏移SHIFT地址值个长度单位,然后进入后步骤S211;
步骤S209、在模式子分组扫描完成后,将当前输入内容向前偏移一个长度单位,然后进入后步骤S211;
步骤S211、判断当前输入内容是否全部扫描完成,若是,进入步骤S213;否则,进入步骤S201;
步骤S213、输出匹配结果集。
如图3所示,为本发明的实施例中改进后的算法数据模型,具体地,在本实施例中,模式链(abcde、bcbde)被散列到同一个HASH桶内后进一步编译为自动机的图形,这样在匹配的最坏情况下扫描长度=MAX{length(abcde),length(bcbde)},最好情况下需扫描长度=1。其中MAX{length(abcde),length(bcbde)}表示最大的模式长度。由此可以看出,改进后的算法,对于冲突链的比较具有良好的稳定性,不会随着冲突链的增加而导致扫描长度的增长。
如图4所示,为本发明的实施例中算法对模式链的预处理过程;
步骤S401,构建跳转用的SHIFT地址表。
具体地,可以使用现有块字符技术,构建跳转用的SHIFT地址表。
步骤S403,将模式链以前缀方式散列到各个HASH桶中,以链式存储。
具体地,可以使用现有HASH技术,将模式链以前缀方式散列到各个HASH桶中,以链式存储。
HASH桶(HashBucket):哈希表中同一个位置可能存有多个元素,以应对哈希冲突问题。这样,哈希表中的每个位置表示一个HASH桶(哈希桶)。
步骤S405,以HASH桶中的每个模式链作为输入,若冲突链中仅有一条模式,那么使用蛮力算法完成模式预处理,若冲突链中的模式数大于1,那么以自动机算法完成模式链预处理。如图3所示,HASH值为0xde对应的子分组模式中的冲突链的数量为2个。
在本发明的实施例中,通过改变WM算法对HASH桶中模式冲突链的处理方式,由简单的链式方式修改为基于自动机的图形结构,而对于桶内只存在单条模式的情况,仍然采用蛮力算法,以节省存储空间。
如图5所示,为本发明的实施例中子分组模式为蛮力类型时的扫描过程,具体步骤如下:
步骤S501,使用蛮力算法对模式子分组进行匹配查找当前输入内容,如果扫描到模式尾,则说明匹配成功,执行步骤S503,如果遇到不匹配字符则说明匹配失败,终止当前扫描,执行步骤S507。
步骤S505,此次匹配成功,则将当前匹配结果加入匹配结果集。
步骤S507,此次匹配结束,退出本次模式子分组扫描。
如图6所示,为本发明的实施例中子分组模式为自动机类型时的扫描过程,具体步骤如下:
步骤S601,使用自动机算法对当前的所述模式子分组进行匹配查找,如果自动机状态中存在输出,则说明有匹配成功的模式,执行步骤S603,如果遇到失效的自动机状态则说明匹配失败,终止当前扫描,执行步骤S605。
步骤S603,有匹配的模式,将当前所有匹配结果加入匹配结果集。
步骤S605,此次匹配结束,退出本次模式子分组匹配查找。
如图7所示,为本发明的实施例中基于自动机的模式匹配的装置的结构示意图,该装置700包括:
第一匹配模块701,用于根据当前输入内容查找SHIFT地址表,得到SHIFT地址值;
第一检测模块703,用于判断得到的所述SHIFT地址值是否为零;
第二匹配模块705,用于若所述SHIFT地址值为零,则根据所述当前输入内容的前缀计算HASH值,并以所述HASH值作为索引进入实际匹配的模式子分组,对所述模式子分组按照预设的方式进行匹配查找,并且在所述模式子分组查找完成后,将当前输入内容向前偏移一个长度单位;若所述SHIFT地址值不为零,则将当前输入内容向后偏移所述SHIFT地址值个长度单位;
第二检测模块707,用于判断所述当前输入内容是否全部扫描完成,若是,则输出匹配结果集;否则触发所述第一匹配模块根据当前输入内容查找SHIFT地址表。
可选地,在本发明的另一个实施例中,装置还包括:
预处理模块,用于构建跳转用的SHIFT地址表;将一个或多个模式链散列到各个HASH桶中,以链式存储;以HASH桶中的每个模式链作为输入,若模式子分组中仅有一条所述模式链,则使用蛮力算法完成所述模式链的预处理;若模式子分组中的所述模式链的模式数大于1,则使用自动机算法完成所述模式链的预处理。
可选地,在本发明的另一个实施例中,所述第二匹配模块进一步用于使用蛮力算法对所述模式子分组进行匹配查找当前输入内容;如果匹配成功,则将当前匹配结果加入匹配结果集;否则,退出本次所述模式子分组匹配查找。
可选地,在本发明的另一个实施例中,所述第二匹配模块进一步用于使用自动机算法对当前的所述模式子分组进行匹配查找,如果自动机状态中存在输出,则将当前所有匹配结果加入匹配结果集;如果遇到失效的自动机状态,则退出本次所述模式子分组匹配查找。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于自动机的模式匹配的方法,其特征在于,所述方法包括:
根据当前输入内容查找SHIFT偏移地址表,得到SHIFT偏移地址值;
判断得到的所述SHIFT地址值是否为零;
若所述SHIFT地址值为零,则根据所述当前输入内容的前缀计算HASH哈希值,并以所述HASH值作为索引进入实际匹配的模式子分组,按照预设的方式进行匹配查找,并且在所述模式子分组查找完成后,将当前输入内容向前偏移一个长度单位;
若所述SHIFT地址值不为零,则将当前输入内容向后偏移所述SHIFT地址值个长度单位;
判断所述当前输入内容是否全部扫描完成,若是,则输出匹配结果集;否则跳到所述根据当前输入内容查找SHIFT地址表的步骤。
2.如权利要求1所述的方法,其特征在于,在所述根据当前输入内容查找SHIFT地址表之前,所述方法还包括:
构建跳转用的SHIFT地址表;
将一个或多个模式链散列到各个HASH桶中,以链式存储;
以HASH桶中的每个模式链作为输入,若模式子分组中仅有一条所述模式链,则使用蛮力算法完成所述模式链的预处理;若模式子分组中的所述模式链的模式数大于1,则使用自动机算法完成所述模式链的预处理。
3.如权利要求2所述的方法,其特征在于,所述将一个或多个模式链散列到各个HASH桶中,以链式存储,具体包括:
将多个模式链散列到同一个HASH桶内;
将同一个HASH桶内的模式子分组中多个模式链编译为自动机的图形。
4.如权利要求1所述的方法,其特征在于,若所述模式子分组为空,则退出当前的所述模式子分组的匹配过程。
5.如权利要求1所述的方法,其特征在于,所述对所述模式子分组按照预设的方式进行匹配查找,具体包括:
使用蛮力算法对所述模式子分组进行匹配查找当前输入内容;
如果匹配成功,则将当前匹配结果加入匹配结果集;否则,退出本次所述模式子分组匹配查找。
6.如权利要求1所述的方法,其特征在于,按照预设的方式进行匹配查找,具体包括:
使用自动机算法对当前的所述模式子分组进行匹配查找;
如果自动机状态中存在输出,则将当前所有匹配结果加入匹配结果集;如果遇到失效的自动机状态,则退出本次所述模式子分组匹配查找。
7.一种基于自动机的模式匹配的装置,其特征在于,所述装置包括:
第一匹配模块,用于根据当前输入内容查找SHIFT地址表,得到SHIFT地址值;
第一检测模块,用于判断得到的所述SHIFT地址值是否为零;
第二匹配模块,用于若所述SHIFT地址值为零,则根据所述当前输入内容的前缀计算HASH值,并以所述HASH值作为索引进入实际匹配的模式子分组,对所述模式子分组按照预设的方式进行匹配查找,并且在所述模式子分组查找完成后,将当前输入内容向前偏移一个长度单位;若所述SHIFT地址值不为零,则将当前输入内容向后偏移所述SHIFT地址值个长度单位;
第二检测模块,用于判断所述当前输入内容是否全部扫描完成,若是,则输出匹配结果集;否则触发所述第一匹配模块根据当前输入内容查找SHIFT地址表。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
预处理模块,用于构建跳转用的SHIFT地址表;将一个或多个模式链散列到各个HASH桶中,以链式存储;以HASH桶中的每个模式链作为输入,若模式子分组中仅有一条所述模式链,则使用蛮力算法完成所述模式链的预处理;若模式子分组中的所述模式链的模式数大于1,则使用自动机算法完成所述模式链的预处理。
9.如权利要求7所述的装置,其特征在于,所述第二匹配模块进一步用于使用蛮力算法对所述模式子分组进行匹配查找当前输入内容;如果匹配成功,则将当前匹配结果加入匹配结果集;否则,退出本次所述模式子分组匹配查找。
10.如权利要求7所述的装置,其特征在于,所述第二匹配模块进一步用于使用自动机算法对当前的所述模式子分组进行匹配查找,如果自动机状态中存在输出,则将当前所有匹配结果加入匹配结果集;如果遇到失效的自动机状态,则退出本次所述模式子分组匹配查找。
CN201410681752.9A 2014-11-24 2014-11-24 基于自动机的模式匹配的方法及装置 Withdrawn CN105701093A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410681752.9A CN105701093A (zh) 2014-11-24 2014-11-24 基于自动机的模式匹配的方法及装置
PCT/CN2015/080174 WO2016082503A1 (zh) 2014-11-24 2015-05-29 基于自动机的模式匹配的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410681752.9A CN105701093A (zh) 2014-11-24 2014-11-24 基于自动机的模式匹配的方法及装置

Publications (1)

Publication Number Publication Date
CN105701093A true CN105701093A (zh) 2016-06-22

Family

ID=56073511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410681752.9A Withdrawn CN105701093A (zh) 2014-11-24 2014-11-24 基于自动机的模式匹配的方法及装置

Country Status (2)

Country Link
CN (1) CN105701093A (zh)
WO (1) WO2016082503A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797940A (zh) * 2017-11-21 2018-03-13 四川巧夺天工信息安全智能设备有限公司 一种针对无法访问东芝硬盘数据区的恢复方法
CN108282454A (zh) * 2017-01-06 2018-07-13 瞻博网络公司 用于使用内联模式匹配加速安全检查的装置、系统和方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117668527B (zh) * 2024-01-31 2024-04-26 国网湖北省电力有限公司信息通信公司 一种大流量模型下的多特征识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101060411A (zh) * 2007-05-23 2007-10-24 西安交大捷普网络科技有限公司 可提高入侵检测系统检测速率和效率的多模匹配方法
CN101251845A (zh) * 2008-03-13 2008-08-27 苏州爱迪比科技有限公司 利用改进的Wu-Manber算法进行多模式串匹配的方法
CN102609450A (zh) * 2012-01-10 2012-07-25 顾乃杰 一种按字长匹配的多模式串匹配方法
CN103412858A (zh) * 2012-07-02 2013-11-27 清华大学 用于文本或网络内容分析的大规模特征匹配的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101060411A (zh) * 2007-05-23 2007-10-24 西安交大捷普网络科技有限公司 可提高入侵检测系统检测速率和效率的多模匹配方法
CN101251845A (zh) * 2008-03-13 2008-08-27 苏州爱迪比科技有限公司 利用改进的Wu-Manber算法进行多模式串匹配的方法
CN102609450A (zh) * 2012-01-10 2012-07-25 顾乃杰 一种按字长匹配的多模式串匹配方法
CN103412858A (zh) * 2012-07-02 2013-11-27 清华大学 用于文本或网络内容分析的大规模特征匹配的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108282454A (zh) * 2017-01-06 2018-07-13 瞻博网络公司 用于使用内联模式匹配加速安全检查的装置、系统和方法
CN107797940A (zh) * 2017-11-21 2018-03-13 四川巧夺天工信息安全智能设备有限公司 一种针对无法访问东芝硬盘数据区的恢复方法
CN107797940B (zh) * 2017-11-21 2021-02-23 四川巧夺天工信息安全智能设备有限公司 一种针对无法访问东芝硬盘数据区的恢复方法

Also Published As

Publication number Publication date
WO2016082503A1 (zh) 2016-06-02

Similar Documents

Publication Publication Date Title
EP3622411B1 (en) Incremental graph computations for querying large graphs
CN103425739B (zh) 一种字符串匹配方法
US10645105B2 (en) Network attack detection method and device
CN104281563A (zh) 用于发现表格数据中的关系的方法和系统
US10192028B2 (en) Data analysis device and method therefor
CN111552969A (zh) 基于神经网络的嵌入式终端软件代码漏洞检测方法及装置
US20110295869A1 (en) Efficient string matching state machine
US20160210333A1 (en) Method and device for mining data regular expression
CN105701093A (zh) 基于自动机的模式匹配的方法及装置
CN109800337B (zh) 一种适用于大字母表的多模式正则匹配算法
CN102207979A (zh) 一种敏感词匹配方法和系统
CN103577598B (zh) 模式串与文本串的匹配方法和装置
CN102298618B (zh) 一种获取匹配度以执行相应操作的方法、装置及设备
US8612917B2 (en) Method and system for selecting gate sizes, repeater locations, and repeater sizes of an integrated circuit
CN113157981A (zh) 一种图网络关系扩散方法和装置
CN115934756A (zh) 混编算子计算方法、装置、设备及介质
Díaz-Domínguez et al. Genome assembly with variable order de Bruijn graphs
US11494555B2 (en) Identifying section headings in a document
CN109710626B (zh) 数据入库管理方法、装置、电子设备,及存储介质
CN108304467B (zh) 用于文本间匹配的方法
CN110333871B (zh) 一种验证方法、装置和存储介质
CN103440122A (zh) 一种新的使用逆向扩展控制流图的静态函数识别方法
Chen et al. CGAP-align: a high performance DNA short read alignment tool
CN102750460A (zh) 分层简化大规模图数据的运算方法
US20140289264A1 (en) One pass submatch extraction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20160622