CN105279157A - 一种正则查询的方法和装置 - Google Patents

一种正则查询的方法和装置 Download PDF

Info

Publication number
CN105279157A
CN105279157A CN201410234200.3A CN201410234200A CN105279157A CN 105279157 A CN105279157 A CN 105279157A CN 201410234200 A CN201410234200 A CN 201410234200A CN 105279157 A CN105279157 A CN 105279157A
Authority
CN
China
Prior art keywords
characteristic
regular expression
data
target data
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410234200.3A
Other languages
English (en)
Other versions
CN105279157B (zh
Inventor
闫帅帅
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410234200.3A priority Critical patent/CN105279157B/zh
Publication of CN105279157A publication Critical patent/CN105279157A/zh
Application granted granted Critical
Publication of CN105279157B publication Critical patent/CN105279157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种正则查询的方法和装置,属于计算机技术领域。所述方法包括:获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。采用本发明,可以提高查询效率。

Description

一种正则查询的方法和装置
技术领域
本发明涉及计算机技术领域,特别涉及一种正则查询的方法和装置。
背景技术
随着计算机技术和网络技术的飞速发展,条件查询技术得到了非常广泛的应用,正则查询是基于正则表达式进行的条件查询,是一种常用的条件查询处理方法,正则表达式是一种规范的查询条件的描述信息,例如,正则表达式“/a*b/”表示查询以a开头以b结尾的字符串。
在进行正则查询时,技术人员可以根据查询的需求选择或编写正则表达式,然后对目标数据(也可称作母串或目标串)执行正则查询,在目标数据中查询符合正则表达式的数据,作为结果数据进行输出。在实际应用中,当有多个正则查询需要执行时,一般采用的处理方式是,基于各正则表达式,按顺序逐个执行每个正则查询。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
正则查询一般比较复杂,查询时间很长,当需要执行的正则查询比较多时,逐个执行所有正则查询会导致处理时间过长,查询效率较为低下。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种正则查询的方法和装置,以提高查询效率。所述技术方案如下:
一方面,提供了一种正则查询的方法,所述方法包括:
获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;
在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;
根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。
另一方面,提供了一种正则查询的装置,所述装置包括:
获取模块,用于获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;
选取模块,用于在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;
查询模块,用于根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例中,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询,这样,可以排除掉与目标数据不相关的特征数据对应的正则表达式,只基于与目标数据相关的特征数据对应的正则表达式进行正则查询,可以减少需要逐个执行的正则查询的数目,从而,可以提高总的查询效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的正则查询的方法流程图;
图2是本发明实施例提供的字典树的结构示意图;
图3是本发明实施例提供的正则查询的方法流程图;
图4是本发明实施例提供的建立字典树过程的示意图;
图5是本发明实施例提供的正则查询的装置结构示意图;
图6是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
本发明实施例提供了一种正则查询的方法,如图1所示,该方法的处理流程可以包括如下步骤:
步骤101,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据。
步骤102,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据。
步骤103,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询。
本发明实施例中,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询,这样,可以排除掉与目标数据不相关的特征数据对应的正则表达式,只基于与目标数据相关的特征数据对应的正则表达式进行正则查询,可以减少需要逐个执行的正则查询的数目,从而,可以提高总的查询效率。
实施例二
本发明实施例提供了一种正则查询的方法,该方法的执行主体可以为具有一定数据处理能力的电子设备,如服务器、终端设备等。
下面将结合具体的处理方式,对图1所示的流程进行详细的说明,内容可以如下:
步骤101,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据。
其中,目标数据是正则查询中作为查询基础的数据,例如,在某段文字中查询符合某正则表达式的字符,那么该段文字即为目标数据。特征数据可以用于反映目标数据中是否包含符合相应的正则表达式的数据,可以是一个字符串,所以特征数据又可称作特征串。特征数据可以由技术人员根据对应的正则表达式预先设置,特征数据的特点可以是:如果目标数据中不包含该特征数据,则说明目标数据中不包含符合该特征数据对应的正则表达式的数据。例如,某正则表达式是为了查询报文中是否包含有某个指令A,而指令A是一种只能出现在报文的某个特定字段中的指令,那么,可以设置该正则表达式对应的特征数据为该特定字段的字段名,这样,如果目标数据中不包含该特征数据(即该字段名),则可以认为目标数据中不可能包含符合该正则表达式的数据。
在实施中,电子设备中可以安装有具有正则查询功能的应用,该应用中可以设置有查询页面,查询页面中可以设置有表达式输入窗口,技术人员可以在其中输入一个或多个正则表达式,也可以在预先存储的正则表达式列表中选择一个或多个正则表达式。对应表达式输入窗口中的每个正则表达式,还可以设置有特征数据输入窗口,在应用中可以预先设置并存储多个正则表达式对应的特征数据,在表达式输入窗口中的每个正则表达式中,对于存储有特征数据的正则表达式,可以直接在对应的特征数据输入窗口中显示该正则表达式对应的特征数据,对于未存储特征数据的正则表达式,技术人员可以在相应的特征数据输入窗口中输入特征数据,以完成为该正则表达式设置特征数据。经过上述设置之后,在对目标数据进行正则查询时,则可以获取用户输入或选择的各正则表达式,并获取对应的特征数据,供后续处理中使用。
另外,除了上述方式,也可以不通过应用完成相应的处理,技术人员可以根据实际需求编写用于正则查询的程序,在程序中写入多个正则表达式,并写入每个正则表达式对应的特征数据。当执行该程序对目标数据进行正则查询时,则获取程序中记录的多个正则表达式以及每个正则表达式对应的特征数据。
步骤102,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据。
在实施中,可以查询目标数据中是否包含各正则表达式对应的特征数据,查询的方式可以多种多样,例如,可以分别使用每个特征数据在目标数据中进行匹配查询,以分别确认各特征数据是否包含于目标数据中。另外,还可以采用多模匹配算法进行查询,相应的步骤102的处理可以如下:
根据多模匹配算法,在各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据。
其中,多模匹配算法是在目标数据中同时进行多个数据(关键词)的匹配查询的算法,如AC(发明者名称的缩写)多模匹配算法、Wu-Manber(发明者名称)多模匹配算法。
可选的,基于AC多模匹配算法,选取目标数据中包含的特征数据的处理过程可以包括如下步骤:
步骤一,根据各正则表达式对应的特征数据,构建字典树。
其中,字典树是一种可以用于字符串等数据的匹配查询的树形结构,如图2所示,在字典树中除根节点外每个节点都可以存储一个字符。
在实施中,以各正则表达式对应的特征数据分别为say、she、he、her、shr为例,参见图2,字典树的建立过程可以如下:选取任一个特征数据,如say,在根节点的所有子节点中查询存储有该特征数据的第一个字符(即s)的节点,查询不存在,则建立根节点的子节点(记作节点1),及节点1的子节点(记作节点2),及节点2的子节点(记作节点3),并在节点1、节点2、节点3中分别存储字符s、字符a、字符y;再选取任意一个特征数据,如she,在根节点的所有子节点中查询存储有字符s的节点,查询到上述节点1,此时可以继续在节点1的子节点中查询存储有字符h的节点,查询不存在,则建立节点1的子节点(记作节点4),及节点4的子节点(记作节点5),并在节点4、节点5中分别存储字符h、字符e;对应其它特征数据的处理过程可以依此类推。
可选的,在字典树中还可以设置每个节点的失败指针,参见图2,虚线为失败指针,失败指针的设置方式可以是:根节点的子节点的失败指针指向根节点,对于其他节点,如果当前节点存储的字符为T,则沿当前节点的父节点的失败指针找到指向的节点,如果该节点的子节点中包含存储有T的节点,则设置当前节点的失败指针指向此存储T的节点,否则,设置当前节点的失败指针指向根节点。
步骤二,根据目标数据中的每个数据,在字典树中进行匹配查询,对匹配到的特征数据进行记录。
在实施中,目标数据中可以包含有多个字符串,可以分别提取每个字符串,在字典树中进行匹配查询,如果字符串与字典树中的某个特征数据相匹配,则说明目标数据中包含该特征数据,可以对该特征数据进行记录。例如,目标数据为一段文字,可以分别提取其中每个单词,在字典树中进行匹配查询,又例如,目标数据为一个报文中的数据,可以分别提取其中每个字段的数据,在字典树中进行匹配查询。
在字典树中进行匹配查询的过程可以如下:假设在目标数据中提取字符串she,在图2所示的字典树中进行匹配查询,先在根节点的子节点中查询存储有s的节点,查询到节点1,然后在节点1的子节点中查询存储有h的节点,查询到节点4,然后在节点4的子节点中查询存储有e的节点,查询到节点5,此时,可以判定匹配成功,即能够确定目标数据中包含特征数据she,可以对she进行记录。
步骤三,在各正则表达式对应的特征数据中,选取记录的特征数据,作为目标数据中包含的特征数据。
通过上述处理,对于各正则表达式对应的特征数据,可以确定哪些特征数据包含在目标数据中,哪些特征数据未包含在目标数据中。这样,选取目标数据中包含的特征数据,可以筛选掉一些目标数据中不包含的特征数据。
步骤103,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询。
在实施中,可以先根据上述步骤选取的特征数据,找到每个特征数据对应的正则表达式,然后,可以按照一定的顺序,逐个使用正则表达式进行相应的正则查询,并将每个正则查询的结果进行输出。
可选的,如果步骤101中的多个正则表达式中存在一个或多个未设置特征数据的正则表达式,则步骤103可以采取以下的处理方式:如果步骤101获取的各正则表达式中的第二正则表达式不存在预先设置的特征数据,则根据选取的特征数据对应的正则表达式,以及第二正则表达式,在目标数据中,进行正则查询。
在实施中,对于未设置特征数据的正则表达式,可以不经过步骤102的筛选过程,直接用到步骤103的正则查询中。
本发明实施例中,还提供了为正则表达式设置特征数据的方法,相应的处理可以如下:
接收特征数据设置请求,特征数据设置请求中携带有第一正则表达式和第一特征数据;将第一特征数据设置为第一正则表达式对应的特征数据,并将第一正则表达式和第一特征数据对应存储。
在实施中,技术人员可以在上述的应用中为正则表达式设置对应的特征数据,该应用中可以包含有设置页面,其中设置有正则表达式输入窗口和对应的特征数据输入窗口,用户可以输入正则表达式(即第一正则表达式),并为正则表达式设置对应的特征数据(第一特征数据),然后点击确定按钮,这时,电子设备将接收到特征数据设置请求,其中携带用户输入的第一正则表达式和第一特征数据,然后,将第一正则表达式和第一特征数据对应存储。后续在进行正则查询时,如果使用第一正则表达式,则可以获取第一特征数据作为第一正则表达式的特征数据。
本发明实施例中,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询,这样,可以排除掉与目标数据不相关的特征数据对应的正则表达式,只基于与目标数据相关的特征数据对应的正则表达式进行正则查询,可以减少需要逐个执行的正则查询的数目,从而,可以提高总的查询效率。
实施例三
下面将结合具体的应用过程,对本发明实施例提供的正则查询的方法进行详细说明,如图3所示,可以包括如下步骤:
步骤301,获取用于正则查询的原始数据(即上述目标数据)和多个正则表达式。获取的正则表达式包括正则表达式1、正则表达式2、正则表达式3。
步骤302,确定各正则表达式对应的特征串,并根据各特征串生成trie字典树,在trie字典树中构造失败指针,基于trie字典树对原始数据进行AC多模匹配,以在各特征串中选取原始数据中包含的特征串。
相应的处理过程可以参见图4,各正则表达式对应的特征串分别为特征串1、特征串2、特征串3,假设经过AC多模匹配确定原始数据中包含的特征串为特征串1和特征串2。
步骤303,根据特征串1对应的正则表达式1,在原始数据中进行正则查询,对查询到的数据进行输出。
步骤304,根据特征串2对应的正则表达式2,在原始数据中进行正则查询,对查询到的数据进行输出。
实施例四
基于相同的技术构思,本发明实施例还提供了一种正则查询的装置,如图5所示,所述装置包括:
获取模块510,用于获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;
选取模块520,用于在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;
查询模块530,用于根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。
可选的,所述选取模块520,用于:
根据多模匹配算法,在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据。
可选的,所述选取模块520,用于:
根据所述各正则表达式对应的特征数据,构建字典树;
根据所述目标数据中的每个数据,在所述字典树中进行匹配查询,对匹配到的特征数据进行记录;
在所述各正则表达式对应的特征数据中,选取所述记录的特征数据,作为所述目标数据中包含的特征数据。
可选的,所述装置还包括存储模块,用于:
接收特征数据设置请求,所述特征数据设置请求中携带有第一正则表达式和第一特征数据;
将所述第一特征数据设置为所述第一正则表达式对应的特征数据,并将所述第一正则表达式和第一特征数据对应存储。
可选的,所述查询模块530,用于:
如果所述各正则表达式中的第二正则表达式不存在预先设置的特征数据,则根据选取的特征数据对应的正则表达式,以及所述第二正则表达式,在所述目标数据中,进行正则查询。
本发明实施例中,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询,这样,可以排除掉与目标数据不相关的特征数据对应的正则表达式,只基于与目标数据相关的特征数据对应的正则表达式进行正则查询,可以减少需要逐个执行的正则查询的数目,从而,可以提高总的查询效率。
需要说明的是:上述实施例提供的正则查询的装置在正则查询时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的正则查询的装置与正则查询的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
实施例五
图6是本发明实施例提供的电子设备的结构示意图。该电子设备1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在电子设备1900上执行存储介质1930中的一系列指令操作。
电子设备1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
电子设备1900可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;
在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;
根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。
可选的,所述在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据,包括:
根据多模匹配算法,在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据。
可选的,所述根据多模匹配算法,在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据,包括:
根据所述各正则表达式对应的特征数据,构建字典树;
根据所述目标数据中的每个数据,在所述字典树中进行匹配查询,对匹配到的特征数据进行记录;
在所述各正则表达式对应的特征数据中,选取所述记录的特征数据,作为所述目标数据中包含的特征数据。
可选的,所述方法还包括:
接收特征数据设置请求,所述特征数据设置请求中携带有第一正则表达式和第一特征数据;
将所述第一特征数据设置为所述第一正则表达式对应的特征数据,并将所述第一正则表达式和第一特征数据对应存储。
可选的,所述根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询,包括:
如果所述各正则表达式中的第二正则表达式不存在预先设置的特征数据,则根据选取的特征数据对应的正则表达式,以及所述第二正则表达式,在所述目标数据中,进行正则查询。
本发明实施例中,获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据,在各正则表达式对应的特征数据中,选取目标数据中包含的特征数据,根据选取的特征数据对应的正则表达式,在目标数据中,进行正则查询,这样,可以排除掉与目标数据不相关的特征数据对应的正则表达式,只基于与目标数据相关的特征数据对应的正则表达式进行正则查询,可以减少需要逐个执行的正则查询的数目,从而,可以提高总的查询效率。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种正则查询的方法,其特征在于,所述方法包括:
获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;
在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;
根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。
2.根据权利要求1所述的方法,其特征在于,所述在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据,包括:
根据多模匹配算法,在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据。
3.根据权利要求2所述的方法,其特征在于,所述根据多模匹配算法,在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据,包括:
根据所述各正则表达式对应的特征数据,构建字典树;
根据所述目标数据中的每个数据,在所述字典树中进行匹配查询,对匹配到的特征数据进行记录;
在所述各正则表达式对应的特征数据中,选取所述记录的特征数据,作为所述目标数据中包含的特征数据。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收特征数据设置请求,所述特征数据设置请求中携带有第一正则表达式和第一特征数据;
将所述第一特征数据设置为所述第一正则表达式对应的特征数据,并将所述第一正则表达式和第一特征数据对应存储。
5.根据权利要求1所述的方法,其特征在于,所述根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询,包括:
如果所述各正则表达式中的第二正则表达式不存在预先设置的特征数据,则根据选取的特征数据对应的正则表达式,以及所述第二正则表达式,在所述目标数据中,进行正则查询。
6.一种正则查询的装置,其特征在于,所述装置包括:
获取模块,用于获取用于正则查询的目标数据和多个正则表达式,并获取预先设置的各正则表达式对应的特征数据;
选取模块,用于在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据;
查询模块,用于根据选取的特征数据对应的正则表达式,在所述目标数据中,进行正则查询。
7.根据权利要求6所述的装置,其特征在于,所述选取模块,用于:
根据多模匹配算法,在所述各正则表达式对应的特征数据中,选取所述目标数据中包含的特征数据。
8.根据权利要求7所述的装置,其特征在于,所述选取模块,用于:
根据所述各正则表达式对应的特征数据,构建字典树;
根据所述目标数据中的每个数据,在所述字典树中进行匹配查询,对匹配到的特征数据进行记录;
在所述各正则表达式对应的特征数据中,选取所述记录的特征数据,作为所述目标数据中包含的特征数据。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括存储模块,用于:
接收特征数据设置请求,所述特征数据设置请求中携带有第一正则表达式和第一特征数据;
将所述第一特征数据设置为所述第一正则表达式对应的特征数据,并将所述第一正则表达式和第一特征数据对应存储。
10.根据权利要求6所述的装置,其特征在于,所述查询模块,用于:
如果所述各正则表达式中的第二正则表达式不存在预先设置的特征数据,则根据选取的特征数据对应的正则表达式,以及所述第二正则表达式,在所述目标数据中,进行正则查询。
CN201410234200.3A 2014-05-29 2014-05-29 一种正则查询的方法和装置 Active CN105279157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410234200.3A CN105279157B (zh) 2014-05-29 2014-05-29 一种正则查询的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410234200.3A CN105279157B (zh) 2014-05-29 2014-05-29 一种正则查询的方法和装置

Publications (2)

Publication Number Publication Date
CN105279157A true CN105279157A (zh) 2016-01-27
CN105279157B CN105279157B (zh) 2019-08-20

Family

ID=55148184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410234200.3A Active CN105279157B (zh) 2014-05-29 2014-05-29 一种正则查询的方法和装置

Country Status (1)

Country Link
CN (1) CN105279157B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766483A (zh) * 2018-12-28 2019-05-17 平安科技(深圳)有限公司 正则表达式生成方法、装置、计算机设备和存储介质
US11681701B2 (en) 2020-05-12 2023-06-20 Coupang Corp. Systems and methods for reducing database query latency

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074852A1 (en) * 2002-07-29 2006-04-06 Microsoft Corporation Method and data structure for performing regular expression searches in a fixed length word language
US20060179054A1 (en) * 2005-02-10 2006-08-10 Sap Portals Israel Ltd. Compilation of nested regular expressions
CN101853301A (zh) * 2010-05-25 2010-10-06 华为技术有限公司 正则表达式匹配的方法和系统
CN102567456A (zh) * 2010-11-03 2012-07-11 微软公司 正则表达式的有条件的执行
CN103377259A (zh) * 2012-04-28 2013-10-30 北京新媒传信科技有限公司 一种多模式字符串匹配方法和装置
CN103617226A (zh) * 2013-11-25 2014-03-05 华为技术有限公司 一种正则表达式匹配方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074852A1 (en) * 2002-07-29 2006-04-06 Microsoft Corporation Method and data structure for performing regular expression searches in a fixed length word language
US20060179054A1 (en) * 2005-02-10 2006-08-10 Sap Portals Israel Ltd. Compilation of nested regular expressions
CN101853301A (zh) * 2010-05-25 2010-10-06 华为技术有限公司 正则表达式匹配的方法和系统
CN102567456A (zh) * 2010-11-03 2012-07-11 微软公司 正则表达式的有条件的执行
CN103377259A (zh) * 2012-04-28 2013-10-30 北京新媒传信科技有限公司 一种多模式字符串匹配方法和装置
CN103617226A (zh) * 2013-11-25 2014-03-05 华为技术有限公司 一种正则表达式匹配方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766483A (zh) * 2018-12-28 2019-05-17 平安科技(深圳)有限公司 正则表达式生成方法、装置、计算机设备和存储介质
CN109766483B (zh) * 2018-12-28 2024-04-19 平安科技(深圳)有限公司 正则表达式生成方法、装置、计算机设备和存储介质
US11681701B2 (en) 2020-05-12 2023-06-20 Coupang Corp. Systems and methods for reducing database query latency

Also Published As

Publication number Publication date
CN105279157B (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
JP5995409B2 (ja) コンピュータ解析のためにテキスト文書を表現するためのグラフィカル・モデル
US9069859B2 (en) Search query processing
CN109743346B (zh) 会话流程配置方法、装置及计算机可读存储介质
US11907659B2 (en) Item recall method and system, electronic device and readable storage medium
CN104866465A (zh) 敏感文本检测方法及装置
CN107545071B (zh) 一种字符串匹配的方法和装置
CN103514229A (zh) 用于在分布式数据库系统中处理数据库数据的方法和装置
CN109791492B (zh) 流水线相关树查询优化器和调度器
WO2017040209A1 (en) Data preparation for data mining
CN112115232A (zh) 一种数据纠错方法、装置及服务器
CN110502520A (zh) 一种数据入库的方法、系统、设备及计算机可读存储介质
Keivanloo et al. Seclone-a hybrid approach to internet-scale real-time code clone search
US20170053023A1 (en) System to organize search and display unstructured data
Lin et al. Adaptive code learning for spark configuration tuning
CN104484392A (zh) 数据库查询语句生成方法及装置
CN105550217A (zh) 场景音乐搜索方法及场景音乐搜索装置
CN105279157A (zh) 一种正则查询的方法和装置
US20160196303A1 (en) String search device, string search method, and string search program
CN109101595B (zh) 一种信息查询方法、装置、设备及计算机可读存储介质
JP2018081403A (ja) インシデント管理システム、インシデント管理方法およびコンピュータプログラム
US11586633B2 (en) Secondary tagging in a data heap
CN112860811A (zh) 数据血缘关系的确定方法、装置、电子设备和存储介质
US11893048B1 (en) Automated indexing and extraction of multiple information fields in digital records
US11893047B1 (en) Automated indexing and extraction of information in digital records
US20190370259A1 (en) Devices and methods for implementing dynamic collaborative workflow systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant