CN113377917A - 一种多模式匹配方法、装置、电子设备和存储介质 - Google Patents
一种多模式匹配方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113377917A CN113377917A CN202110693846.8A CN202110693846A CN113377917A CN 113377917 A CN113377917 A CN 113377917A CN 202110693846 A CN202110693846 A CN 202110693846A CN 113377917 A CN113377917 A CN 113377917A
- Authority
- CN
- China
- Prior art keywords
- symbol
- matching
- matched
- text
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000014509 gene expression Effects 0.000 claims abstract description 13
- 238000010276 construction Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 125000006850 spacer group Chemical group 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种多模式匹配方法、装置、电子设备和存储介质,该方法包括:获取待匹配文本;将待匹配文本符号化转化成符号序列;从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号类型确定匹配策略;依次匹配结束后得到匹配结果。本申请通过将待匹配文本符号化转化为符号序列,能够对正则表达式转化为符号序列,然后将符号序列在字典树上依次进行匹配,对不同的符号类型采取不同的匹配策略进行匹配,如区间节点、活动节点等类型的匹配策略,与正则语法完全一致,不仅匹配速度快,而且基于字典树的表达能力进行匹配,大大增强了模式的表达能力,减少了模式的维护成本。
Description
技术领域
本发明涉及多模式匹配技术领域,具体涉及一种多模式匹配方法、装置、电子设备和存储介质。
背景技术
目前,多模式匹配是一项非常重要的基础工作,应用范围很广,可以应用在文本分词、文本匹配、对话系统等方向。多模式匹配是指对于给定的一个输入文本T,如:”ABCDEF”,同时提供一些字符串模式,如”ABC”,“CD”,“FG”,从这些模式中找到能匹配文本T的模式,如示例中可以看到”ABC”,“CD”都是匹配T的模式。当输入文本T很长,模式很多时,就需要有一定的方法去解决了。目前比较好解决方法有AC方法、Wu Manber方法等。
目前的多模式匹配算法,主要是优化效率,但不支持正则表达式。
发明内容
本发明提供一种多模式匹配方法、装置、电子设备和存储介质,能够解决上述多模式匹配中的技术问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明实施例提供了一种多模式匹配方法,包括:
获取待匹配文本;
将待匹配文本符号化转化成符号序列;
从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号类型确定匹配策略;
从所述根节点到所述子节点的路径中得到匹配结果。
在一些实施例中,上述多模式匹配方法中,将待匹配文本符号化转化成符号序列,包括:
通过符号化工具对所述待匹配文本的字符表达进行字符切分,形成不同的符号类型;
符号序列中每个符号用第一分隔符隔开;
每个符号均包括两部分,第一部分是符号本身,第二部分是符号类型,所述第一部分和第二部分用第二分隔符隔开;
其中,符号类型包括:文字类型、数字类型、区间类型或者活动节点。
在一些实施例中,上述多模式匹配方法中,从字典树的根节点开始依次匹配符号序列中每个符号对应的子节点,包括:
从字典树的根节点开始匹配符号序列中第一个符号对应的子节点;
当匹配到第一个符号对应的子节点后,从子节点开始匹配符号序列中第二个符号的子节点;
依次匹配直到匹配完符号序列中最后一个符号对应的子节点后得到匹配结果。
在一些实施例中,上述多模式匹配方法中,根据符号序列中的每个符号类型确定匹配策略,包括:
当符号类型是活动节点时,如果当前字符和活动节点匹配成功,仍然在所述活动节点匹配下一个字符;
当符号类型是区间节点时,当前字符与区间节点中的每一个字符进行匹配。
当符号类型包括至少两种时,对当前字符进行转写或者保留,进行匹配。
在一些实施例中,上述多模式匹配方法中,将待匹配文本符号化转化成符号序列后,符号序列通过树构建工具放在字典树上。
在一些实施例中,上述多模式匹配方法中,从所述根节点到所述子节点的路径中得到匹配结果后,还包括:通过结果选择单元确定最终匹配结果。
在一些实施例中,上述多模式匹配方法中,从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,包括:通过字典树匹配逻辑单元进行匹配。
第二方面,本发明实施例提供了一种多模式匹配装置,包括:
获取模块:用于获取待匹配文本;
转化模块;用于将所述待匹配文本符号化转化成符号序列;
匹配模块:用于从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号类型确定匹配策略;
得到模块:用于从所述根节点到所述子节点的路径中得到匹配结果。
第三方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如上所述任一项一种多模式匹配方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如上所述任一项所述一种多模式匹配方法。
本发明的有益效果是:通过获取待匹配文本;将待匹配文本符号化转化成符号序列;从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号类型确定匹配策略;依次匹配结束后得到匹配结果。本申请通过将待匹配文本符号化转化为符号序列,能够对正则表达式转化为符号序列,然后将符号序列在字典树上依次进行匹配,对不同的符号类型采取不同的匹配策略进行匹配,如区间节点、活动节点等类型的匹配策略,与正则语法完全一致,不仅匹配速度快,而且基于字典树的表达能力进行匹配,大大增强了模式的表达能力,减少了模式的维护成本。
附图说明
图1为本发明实施例提供的一种多模式匹配方法图一;
图2为本发明实施例提供的一种多模式匹配方法图二;
图3为本发明实施例提供的一种多模式匹配方法图三;
图4为本发明实施例提供的一种多模式匹配装置图;
图5为本发明实施例提供的一种电子设备的示意性框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本公开,而非对本申请的限定。基于所描述的本申请的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
图1为本发明实施例提供的一种多模式匹配方法图一;
第一方面,本发明实施例提供了一种多模式匹配方法,结合图1,包括:
S101:获取待匹配文本。
具体的,本申请实施例中的待匹配文本可以是正则表达式如:BCD。
S102:将待匹配文本符号化转化成符号序列。
示例性的,将待匹配文本BCD符号化后转化成符号序列,如S=[B|文字,C|文字,D|文字]。
S103:从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号类型确定匹配策略。
具体的,本申请实施例中,经过符号化以后,符号序列S=[B|文字,C|文字,D|文字]会通过树构建工具放在字典树上,对于第1个符号,从字典树的根节点开始,找Key为B的子节点,找到B;接着对于S第2个字符,从字典树的节点B开始找,找到C;依次寻找,直到找到最后一个字符。应理解,上述示例只是一个简单的正则表达式举例,下文介绍在匹配过程中,根据符号序列中的每个符号类型确定匹配策略的过程。
S104:从所述根节点到所述子节点的路径中得到匹配结果。
至此,上述符号序列S,对应于字典树上的路径是B->C->D,得到匹配结果BCD。
在一些实施例中,上述多模式匹配方法中,将待匹配文本符号化转化成符号序列,包括:
通过符号化工具对所述待匹配文本的字符表达进行字符切分,形成不同的符号类型。
示例性的,待匹配的文本是一个正则表达式,如“A\dE[a-z]+”,则经过符号化工具符号化以后变成一下符号序列:A(文字),\d(数字),E(文字),[a-z]+(区间节点同时也是活动节点)。
符号序列中每个符号用第一分隔符隔开。
具体的,符号序列A(文字),\d(数字),E(文字)[a-z]+(区间节点同时也是活动节点)中每个符号用第一分隔符逗号隔开,具体的,第一分隔符可以灵活进行选取。
符号序列中每个符号均包括两部分,第一部分是符号本身,第二部分是符号类型,第一部分和第二部分用第二分隔符隔开。
其中,符号类型包括:文字类型、数字类型、区间类型或者活动节点类型。
示例性的如得到符号序列S=[B|文字,C|文字,D|文字],
如上,中括号表示是一个符号序列,每个符号由“,”分隔。每个符号分两部分,由“|”分隔,前面的是符号本身的文字,“|”后面的表示符号的类型。具体的,分割的符号可以根据具体情况灵活确定,并不以此限定本申请的保护范围。符号类型包括:文字类型、数字类型、区间类型或者活动节点类型。
图2为本发明实施例提供的一种多模式匹配方法图二。
在一些实施例中,上述多模式匹配方法中,
从字典树的根节点开始依次匹配符号序列中每个符号对应的子节点,包括:从字典树的根节点开始匹配符号序列中第一个符号对应的子节点;当匹配到第一个符号对应的子节点后,从子节点开始匹配符号序列中第二个符号的子节点;依次匹配直到匹配完符号序列中最后一个符号对应的子节点后得到匹配结果。
示例性的,结合图2,对于符号序列中第1个符号,从字典树的根节点开始,找Key为B的子节点,找到B;接着对于符号序列中第2个字符,从字典树的节点B开始找,找到C;接着对符号序列中的第3个字符,从字典树上找到节点D。至此,S匹配完毕,对应于字典树上的路径是B->C->D,得到匹配结果BCD。
图3为本发明实施例提供的一种多模式匹配方法图三。
在一些实施例中,上述多模式匹配方法中,根据符号序列中的每个符号类型确定匹配策略,包括:
当符号类型是活动节点时,如果当前字符和活动节点匹配成功,仍然在所述活动节点匹配下一个字符。
当符号类型是区间节点时,当前字符与区间节点中的每一个字符进行匹配。
当符号类型包括至少两种时,对当前字符进行转写或者保留,进行匹配。
示例性的输入的文本是“AC5dfE”,流程类似上文介绍的,先将输入的文本符号化转化为符号序列,得到符号序列:[A|文字,C|文字,5|数字或文字,d|文字,f|文字,E|文字],符号化完以后,将符号序列[A|文字,C|文字,5|数字或文字,d|文字,f|文字,E|文字]在字典树上匹配。当匹配到“5|数字或文字”的时候,会把5转写成\d或者保留5,字典树上的恰好下一个节点是\d,所以匹配成功。
当字符“d|文字”匹配成功节点“\d”以后,后续匹配就从这个节点开始,[a-z]+,它是区间节点,当前字符d与区间节点中的每一个字符进行匹配,匹配成功,[a-z]+还是活动节点,如果当前字符和活动节点匹配成功,仍然在活动节点匹配下一个字符,所以仍然在[a-z]+这个节点匹配f,匹配成功,下一个符号E|文字,不属于[a-z]这个区间,字典树要检查活动节点[a-z]+的子节点能否以匹配E,发现的确有一个字节点E能匹配符号E|文字,所以匹配成功。这样,就得到模式“AC\d[a-z]+E”能匹配输入的文本“AC5dfE”。
在一些实施例中,上述多模式匹配方法中,将待匹配文本符号化转化成符号序列后,符号序列通过树构建工具放在字典树上。
经过符号化以后,如符号序列S=[B|文字,C|文字,D|文字]会通过树构建工具放在字典树上。
在一些实施例中,上述多模式匹配方法中,依次匹配结束后得到匹配结果后,还包括:通过结果选择单元确定最终匹配结果。
示例性的,结果选择单元可以是选择匹配最长的那个结果。例如:输入的字符串是ABCDEF,假如有两个匹配结果,分别是AB,ABC,结果选择单元选择ABC,因为ABC更长。
在一些实施例中,上述多模式匹配方法中,从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,包括:通过字典树匹配逻辑单元进行匹配。
具体的,对每一个输入的字,将其符号化以后,经过字典树匹配逻辑单元,在字典树上匹配对应的节点,当文本能够匹配到字典树的一条完整路径时,则将其作为一个结果输出。
图4为本发明实施例提供的一种多模式匹配装置图。
第二方面,本发明实施例提供了一种多模式匹配装置,结合图4,包括:
获取模块401:用于获取待匹配文本;
具体的,本申请实施例中的待匹配文本可以是正则表达式如:BCD,通过获取模块401获取待匹配文本。
转化模块402;用于将所述待匹配文本符号化转化成符号序列;
示例性的,通过转化模块502将待匹配文本BCD符号化后转化成符号序列,如S=[B|文字,C|文字,D|文字]。
匹配模块403:用于从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据所述符号序列中的每个符号类型确定匹配策略;
具体的,本申请实施例中,经过符号化以后,序列S=[B|文字,C|文字,D|文字]会通过树构建工具放在字典树上,对于第1个符号,匹配模块503从字典树的根节点开始,找Key为B的子节点,找到B;接着对于S第2个字符,从字典树的节点B开始找,找到C;接着对S的第3个字符,从字典树上找到节点D。应理解,上述示例只是一个简单的正则表达式举例,上文已经介绍了在匹配过程中,根据符号序列中的每个符号类型确定匹配策略的过程。
得到模块404:用于依次匹配结束后得到匹配结果。
至此,S匹配完毕,对应于字典树上的路径是B->C->D,得到模块504得到匹配结果BCD。
第三方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如上所述任一项一种多模式匹配方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如上所述任一项所述一种多模式匹配方法。
图5是本公开实施例提供的一种电子设备的示意性框图。
如图5所示,电子设备包括:至少一个处理器501、至少一个存储器502和至少一个通信接口503。电子设备中的各个组件通过总线系统504耦合在一起。通信接口503,用于与外部设备之间的信息传输。可理解,总线系统504用于实现这些组件之间的连接通信。总线系统504除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但为了清楚说明起见,在图5中将各种总线都标为总线系统504。
可以理解,本实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
在一些实施方式中,存储器502存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。
其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本申请实施例提供的一种多模式匹配方法中任一方法的程序可以包含在应用程序中。
在本申请实施例中,处理器501通过调用存储器502存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器501用于执行本申请实施例提供的多模式匹配方法各实施例的步骤。
获取待匹配文本;
将待匹配文本符号化转化成符号序列;
从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号类型确定匹配策略;
依次匹配结束后得到匹配结果。
本申请实施例提供的多模式匹配方法中任一方法可以应用于处理器501中,或者由处理器501实现。处理器501可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例提供的多模式匹配方法中任一方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成多模式匹配方法的步骤。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
虽然结合附图描述了本申请的实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种多模式匹配方法,其特征在于,包括:
获取待匹配文本;
将所述待匹配文本符号化转化成符号序列;
从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据所述符号序列中的每个符号类型确定匹配策略;
从所述根节点到所述子节点的路径中得到匹配结果;
其中,所述符号类型包括:文字类型、数字类型、区间类型或者活动节点。
2.根据权利要求1所述的多模式匹配方法,其特征在于,将所述待匹配文本符号化转化成符号序列,包括:
通过符号化工具对所述待匹配文本的字符表达进行字符切分,形成不同的符号类型;
所述符号序列中每个符号用第一分隔符隔开;
每个符号均包括两部分,第一部分是符号本身,第二部分是符号类型,所述第一部分和第二部分用第二分隔符隔开。
3.根据权利要求1所述的多模式匹配方法,其特征在于,所述从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,包括:
从字典树的根节点开始匹配所述符号序列中第一个符号对应的子节点;
当匹配到第一个符号对应的子节点后,从所述子节点开始匹配所述符号序列中第二个符号的子节点;
依次匹配直到匹配完符号序列中最后一个符号对应的子节点后得到匹配结果。
4.根据权利要求1所述的多模式匹配方法,其特征在于,根据所述符号序列中的每个符号类型确定匹配策略,包括:
当符号类型是活动节点时,如果当前字符和所述活动节点匹配成功,仍然在所述活动节点匹配下一个字符;
当符号类型是区间节点时,当前字符与所述区间节点中的每一个字符进行匹配。
当符号类型包括至少两种时,对当前字符进行转写或者保留,进行匹配。
5.根据权利要求1所述的多模式匹配方法,其特征在于,所述将所述待匹配文本符号化转化成符号序列后,所述符号序列通过树构建工具放在字典树上。
6.根据权利要求1所述的多模式匹配方法,其特征在于,所述从所述根节点到所述子节点的路径中得到匹配结果后,所述方法还包括:通过结果选择单元确定最终匹配结果。
7.根据权利要求1所述的多模式匹配方法,其特征在于,所述从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,包括:通过字典树匹配逻辑单元进行匹配。
8.一种多模式匹配装置,其特征在于,包括:
获取模块:用于获取待匹配文本;
转化模块:用于将所述待匹配文本符号化转化成符号序列;
匹配模块:用于从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据所述符号序列中的每个符号类型确定匹配策略;
得到模块:用于从所述根节点到所述子节点的路径中得到匹配结果;
其中,所述符号类型包括:文字类型、数字类型、区间类型或者活动节点。
9.一种电子设备,其特征在于,包括:处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至7任一项所述一种多模式匹配方法。
10.一种计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至7任一项所述一种多模式匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693846.8A CN113377917A (zh) | 2021-06-22 | 2021-06-22 | 一种多模式匹配方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693846.8A CN113377917A (zh) | 2021-06-22 | 2021-06-22 | 一种多模式匹配方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113377917A true CN113377917A (zh) | 2021-09-10 |
Family
ID=77578416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110693846.8A Pending CN113377917A (zh) | 2021-06-22 | 2021-06-22 | 一种多模式匹配方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113377917A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6738515B1 (en) * | 1999-08-06 | 2004-05-18 | Kabushiki Kaisha Toshiba | Pattern string matching apparatus and pattern string matching method |
CN107680579A (zh) * | 2017-09-29 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 文本正则化模型训练方法和装置、文本正则化方法和装置 |
CN109740165A (zh) * | 2019-01-09 | 2019-05-10 | 网易(杭州)网络有限公司 | 字典树构建方法、语句搜索方法、装置、设备及存储介质 |
CN111680489A (zh) * | 2020-06-10 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 目标文本的匹配方法和装置、存储介质及电子设备 |
CN112181489A (zh) * | 2020-09-28 | 2021-01-05 | 中国平安人寿保险股份有限公司 | 代码迁移方法、装置、计算机设备及存储介质 |
CN112883703A (zh) * | 2021-03-19 | 2021-06-01 | 腾讯科技(深圳)有限公司 | 一种识别关联文本的方法、装置、电子设备及存储介质 |
-
2021
- 2021-06-22 CN CN202110693846.8A patent/CN113377917A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6738515B1 (en) * | 1999-08-06 | 2004-05-18 | Kabushiki Kaisha Toshiba | Pattern string matching apparatus and pattern string matching method |
CN107680579A (zh) * | 2017-09-29 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 文本正则化模型训练方法和装置、文本正则化方法和装置 |
CN109740165A (zh) * | 2019-01-09 | 2019-05-10 | 网易(杭州)网络有限公司 | 字典树构建方法、语句搜索方法、装置、设备及存储介质 |
CN111680489A (zh) * | 2020-06-10 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 目标文本的匹配方法和装置、存储介质及电子设备 |
CN112181489A (zh) * | 2020-09-28 | 2021-01-05 | 中国平安人寿保险股份有限公司 | 代码迁移方法、装置、计算机设备及存储介质 |
CN112883703A (zh) * | 2021-03-19 | 2021-06-01 | 腾讯科技(深圳)有限公司 | 一种识别关联文本的方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
李辉;赵辉;李安贵;: "一种多模式匹配高效算法的设计与实现", 北京工商大学学报(自然科学版), no. 03, 15 May 2009 (2009-05-15), pages 69 - 72 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110209830B (zh) | 实体链接方法、装置、设备、计算机可读存储介质 | |
US8260799B2 (en) | Method and apparatus for creating pattern matching state machine and identifying pattern | |
CN110795399B (zh) | 一种为应用产生机器id的方法、装置和系统 | |
CN111158680A (zh) | 一种页面构建的方法、装置、设备及存储介质 | |
CN110888756A (zh) | 一种诊断日志生成方法及装置 | |
CN108153528B (zh) | 流程模型的扩展处理方法、装置、存储介质及电子设备 | |
CN113515620A (zh) | 电力设备技术标准文档排序方法、装置、电子设备和介质 | |
CN116340470B (zh) | 一种基于aigc的关键词关联检索系统 | |
CN113377917A (zh) | 一种多模式匹配方法、装置、电子设备和存储介质 | |
JP2002373163A (ja) | 最大エントロピーモデル生成方法および装置ならびにそれを用いた自然言語処理方法および装置 | |
CN108829872B (zh) | 无损压缩文件的快速处理方法、设备、系统及存储介质 | |
CN116346777A (zh) | 一种字典树域名匹配方法、装置、设备及存储介质 | |
CN112948555B (zh) | 人机交互方法、装置、电子设备及存储介质 | |
CN114579767A (zh) | 因果关系抽取方法、装置、电子设备及可读存储介质 | |
CN112416431B (zh) | 一种基于编码序列表示的源代码片段成对比较方法 | |
CN114942781A (zh) | 一种用于数据读取的数据格式适配方法及装置 | |
CN115048913A (zh) | 一种命令处理方法、装置和电子设备 | |
CN110222051B (zh) | 以太坊区块链的智能合约压缩方法 | |
CN112395468A (zh) | 一种号码管理方法、装置及电子设备和存储介质 | |
CN112084768A (zh) | 一种多轮交互方法、装置及存储介质 | |
CN116088938B (zh) | 一种连续指令处理方法及系统、电子设备和存储介质 | |
CN109360561A (zh) | 语音控制方法及系统、存储介质、语音模块、主控系统 | |
CN111176638B (zh) | 一种bios代码变量转化方法、系统、设备以及介质 | |
CN111628778B (zh) | 一种基于动态规划的无损压缩方法和装置 | |
CN110727442B (zh) | 用于嵌入式平台数据存储优化方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |