CN112732796A - 一种模糊查询匹配方法 - Google Patents
一种模糊查询匹配方法 Download PDFInfo
- Publication number
- CN112732796A CN112732796A CN202110091480.7A CN202110091480A CN112732796A CN 112732796 A CN112732796 A CN 112732796A CN 202110091480 A CN202110091480 A CN 202110091480A CN 112732796 A CN112732796 A CN 112732796A
- Authority
- CN
- China
- Prior art keywords
- template
- character
- wildcard
- character string
- retrieval position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种模糊查询匹配方法。属于应用开发方法实现领域,用于对模板字符串和目标字符串之间进行快速匹配,该方法是对模板字符串中的任意通配符进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度;且对于模板字符串最后一位不是该任意通配符的情况,在模板字符串先进行到结尾时,需对目标字符串进行反向匹配步骤。本发明能够针对各种场景做出全模糊与半模糊的匹配优化。具有快速高效的特点,且能适用于大批量数据的查询匹配。
Description
技术领域
本发明涉及应用开发方法实现领域,尤指一种模糊查询匹配方法。
背景技术
数据湖分析是目前炙手可热的、全新的大数据方向,其主要应用在低成本、无限容量的对象存储系统中,可存储各种各样的数据,并以存储计算分离架构方式,构建出结构化的元信息,最终围绕这些元信息和数据,在上层构建各种各样的分析和计算服务。其一般包含结构化、半结构化、非结构化等类型的数据,并且数据量巨大,分析难度很高。其中,结构化和半结构化数据是数据湖目前主要的处理对象。
由于在数据湖场景中,往往需要通过对大数据集信息的发现,并结合索引优化,模糊匹配等相关技术,对给定的条件,快速过滤并准确计算出满足条件的数据信息。经发明人的不懈努力,本发明实现了这样一种快速模糊匹配的方法,其能够针对各种场景做出全模糊与半模糊的匹配优化。
鉴于现有的模糊匹配方法多为数据库中的类似“like“的查询语句,而且这些现有应用开发中的模糊匹配方法不适用于海量数据的查询匹配的情况,本发明公开了一种新的模糊匹配方法,其具有快速高效的特点,且能适用于大批量数据的查询匹配。
发明内容
为解决上述问题,本发明主要目的在于,提供一种模糊查询匹配方法,其能够针对各种极端场景做出全模糊与半模糊的匹配优化。其次一目的在于,提供一种具有快速高效的特点,且能适用于大批量数据的查询匹配的模糊匹配方法。
为实现上述目的,本发明提供了一种模糊查询匹配方法,用于对模板字符串和目标字符串之间进行快速匹配,所述模板字符串包含任意通配符、单字通配符、及转义通配符,该方法是对模板字符串中的任意通配符进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度;且对于模板字符串最后一位不是该任意通配符的情况,在模板字符串先进行到结尾时,需对目标字符串进行反向匹配步骤。该反向匹配步骤只需要反向从模板字符串结尾匹配到通配符标记位置即可。该方法可适用于各种数据类型和编码格式,比如:包括但不限于字节数组(byte[])、字符型数组(char[])、字符串类(String)、数据流(Stream)等。通配符也一样,任意通配符也可能是“*”或其它字符,单字符通配符也可能是“?”或其它字符。
较佳的是,该方法包含步骤:
(1)将可匹配任意长度字符串的该任意通配符,看作是一段匹配的开始,对该任意通配符进行位置标记,其初始标记为-1;如果有在模板中有匹配到新的任意通配符就对标记进行更新;如果在其它字符匹配中失败就返回标记位置;当返回位置为-1时,表示当前匹配段中没有任意通配符,匹配失败;如果返回位置不小于0,则任意通配符存在,继续匹配,直到模板字符串和目标字符串中的某一个结束;
(2)对于模板字符串最后一位是任意通配符的情况,如果匹配字符串进行完毕,则匹配成功;如果目标字符串先于模板前一位结束,则匹配失败;
(3)对于模板字符串最后一位不是该任意通配符的情况,则在模板字符串先进行到结尾时还需要进行反向匹配。
其中,上述方法在步骤(3)中,可反向从模板字符串结尾匹配到标记位置即可。
较佳的是,该方法的具体步骤如下:
1.先将模板字符串中的任意通配符标记为-1;
2.模板字符检索位置,将目标字符串检索位置置位为字符开头;
3.在满足模板字符检索位置小于模板字符长度并且目标字符串检索位置小于目标字符长度的条件下,开始对模板检索位置字符和目标检索位置字符进行比较,如不满足该条件则转到步骤7;
4.如果模板检索位置字符和目标检索位置字符相同,则模板检索位置和目标字符检索位置均加1,并回到步骤3;
5.如果模板检索位置字符和目标检索位置字符不相同,则:
5.1如果模板字符串中的任意通配符标记位置等于-1,则转到步骤7;
5.2如果模板字符串中的任意通配符标记位置小于模板检索位置;
5.2.1如果模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则目标字符检索位置均加1,将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.2.2不满足模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.3如为其他情况,则将目标字符检索位置均加1,
6.回到步骤3;
7.如果模板字符检索位置等于模板字符长度并且目标字符串检索位置等于目标字符长度,则说明匹配成功,此时,模板字符串和目标字符串均结束;
8.如果目标字符串检索位置等于目标字符长度,模板字符检索位置为模板字符串结束位置,那么当模板字符串结束字符为任意通配符时匹配成功,此时目标字符串结束;
9.模板字符检索位置等于模板字符长度,此时模板字符串结束;
9.1如果模板字符串长度大于1,当模板字符串是以任意通配符结束时,匹配成功;
9.2如果模板字符串长度大于1,且模板字符串不是以任意通配符结束时,此时需要反向匹配未结束的目标字符串;
9.2.1目标字符串反向检索位置置位为字符串最后一位,模板反向检索位置置位为模板最后一位;
9.2.2反向对比模板任意通配符到结束位置的字符;
A.如果模板反向检索位置的字符不是转义通配符,而是单一通配符,且前一位不是转义通配符时,目标反向检索位置减1;继续9.2.2
B.如果模板反向检索位置的字符不是转义通配符,当模板反向检索位置和目标字符反向检索位置字符不相同时,匹配失败;当模板反向检索位置和目标字符反向检索位置字符相同时,目标反向检索位置减1;继续步骤9.2.2;
C.如果模板反向检索位置的字符为转义通配符;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置不是转义通配符,则匹配失败;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置也是转义通配符时,则目标反向检索位置减1;继续步骤9.2.2;
9.2.3反向比对正常结束,则匹配成功;
9.3如果模板字符串长度小于1,如果模板字符串为任意通配符,则匹配成功,如果不是通配符则匹配失败;
10.其他情况,匹配失败。
进一步的,其中的步骤3的比较步骤如下:
3.1如果模板检索位置字符为任意通配符,则模板检索位置加1,任意通配符标记为当前模板检索位置,并回到步骤3;
3.2如果模板检索位置字符为单一通配符,则视为与目标字符相同,模板检索位置和目标字符检索位置均加1,然后回到步骤3;
3.3如果模板检索位置字符为转义通配符,则为转义符,模板检索位置加1。
本发明有益效果在于,借助上述技术方案,本发明具体实现了一种快速模糊匹配的方法。其能够针对各种极端场景做出全模糊与半模糊的匹配优化,且即可适用于数据湖分析,也可以应用到其他应用开发领域。
附图说明
图1本发明的一种模糊查询匹配方法方框示意图。
图2为本发明的一种模糊查询匹配方法步骤示意图的一部分。
图3为图2所示的一种模糊查询匹配方法步骤示意图的另一部分。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案做进一步具体的说明。
目前,字符串在数据中有很多种存在形式,包括各种数据类型和编码格式,比如:包括但不限于字节数组(byte[])、字符型数组(char[])、字符串类(String)、数据流(Stream)等。通配符也一样,任意通配符也可能是“*”或其它字符,单字符通配符也可能是“?”或其它字符。
以下具体实施例是以任意通配符是“%”,单字通配符是“_”,转义通配符是“/”为例进行示范说明。本发明的一种模糊查询匹配方法,是针对Byte化数据开发了模糊查询引擎,能够完成超长字段的快速查询;
其是用于对模板字符串(在本具体实施例中是以包含“%”、“_”、“/”为例)和目标字符串之间进行快速匹配的一种方法。
其核心思想是对模板字符串中的通配符“%”进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度。而对于模板字符串最后一位不是“%”通配符的情况下,则在模板字符串先进行到结尾时还需要反向对目标字符串进行匹配,该步骤只需要反向从模板字符串结尾匹配到通配符标记位置即可。
由于该方法是对模板字符串中的通配符“%”进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度。因而本发明利用该方法可以简单,快速精准的判断字符串是否匹配,该方法可使用于大数据量进行匹配判断的环境。
如图1所示,为本发明的一种模糊查询匹配方法方框示意图。其中主要步骤可表示为:
(1)由于通配符“%”可匹配任意长度字符串,那么可以把“%”看作是一段匹配的开始,因此对通配符“%”进行位置标记,其初始标记为-1。如果有在模板中有匹配到新的“%”就对标记进行更新;如果在其它字符匹配中失败就返回标记位置。当返回位置为-1时,意味着当前匹配段中没有任意通配符,匹配失败。如果返回位置不小于0,则说明任意通配符“%”存在,可以继续匹配,直到模板字符串和目标字符串中的某一个结束。
(2)对于模板字符串最后一位是“%”的情况,如果匹配字符串进行完毕,则说明匹配成功。如果目标字符串先于模板前一位结束,则说明匹配失败。
(3)对于模板字符串最后一位不是“%”的情况,则在模板字符串先进行到结尾时还需要进行反向匹配。“%”的标记位置在反向匹配中再次发挥了作用,只需要反向从模板字符串结尾匹配到标记位置即可,不用考虑“%”的存在。
作为一个具体的实施例,请参见图2及图3,为本发明的一种模糊查询匹配方法步骤示意图,在本具体实施例中,采用的具体步骤如下:
1.先将模板字符串中的通配符“%”标记为-1;
2.模板字符检索位置,将目标字符串检索位置置位为字符开头;
3.在满足模板字符检索位置小于模板字符长度并且目标字符串检索位置小于目标字符长度的条件下,开始对模板检索位置字符和目标检索位置字符进行比较,如不满足该条件则转到步骤7;
3.1如果模板检索位置字符为“%”,则模板检索位置加1,通配符“%”标记为当前模板检索位置,并回到步骤3;
3.2如果模板检索位置字符为“_”,则视为与目标字符相同,模板检索位置和目标字符检索位置均加1,然后回到步骤3;
3.3如果模板检索位置字符为“\”,则为转义符,模板检索位置加1;
4.如果模板检索位置字符和目标检索位置字符相同,则模板检索位置和目标字符检索位置均加1,并回到步骤3;
5.如果模板检索位置字符和目标检索位置字符不相同,则:
5.1如果模板字符串中的通配符“%”标记位置等于-1,则转到步骤7;
5.2如果模板字符串中的通配符“%”标记位置小于模板检索位置;
5.2.1如果模板字符串中的通配符“%”标记位置在模板检索位置的前一位并且模板字符串中的通配符“%”标记位置的字符为“\”,则目标字符检索位置均加1,将模板检索位置重置为模板字符串中的通配符“%”标记位置;
5.2.2不满足模板字符串中的通配符“%”标记位置在模板检索位置的前一位并且模板字符串中的通配符“%”标记位置的字符为“\”,则将模板检索位置重置为模板字符串中的通配符“%”标记位置;
5.3如为其他情况,则将目标字符检索位置均加1,
6.回到步骤3;
7.如果模板字符检索位置等于模板字符长度并且目标字符串检索位置等于目标字符长度,则说明匹配成功;(模板字符串和目标字符串均结束)
8.如果目标字符串检索位置等于目标字符长度,模板字符检索位置为模板字符串结束位置,那么当模板字符串结束字符为通配符“%”时匹配成功;(目标字符串结束)
9.模板字符检索位置等于模板字符长度;(模板字符串结束)
9.1如果模板字符串长度大于1,当模板字符串是以通配符“%”结束时,匹配成功;
9.2如果模板字符串长度大于1,且模板字符串不是以通配符“%”结束时,此时需要反向匹配未结束的目标字符串;
9.2.1目标字符串反向检索位置置位为字符串最后一位,模板反向检索位置置位为模板最后一位;
9.2.2反向对比模板通配符“%”到结束位置的字符;
A.如果模板反向检索位置的字符不是转义符“\”,而是“_”且前一位不是转义符“\”时,目标反向检索位置减1;继续9.2.2
B.如果模板反向检索位置的字符不是转义符“\”,当模板反向检索位置和目标字符反向检索位置字符不相同时,匹配失败。当模板反向检索位置和目标字符反向检索位置字符相同时,目标反向检索位置减一;继续步骤9.2.2;
C.如果模板反向检索位置的字符为转义符“\”;当模板反向检索位置的前一位是转义符“\”且目标字符的反向检索位置不是转义符“\”,则匹配失败;当模板反向检索位置的前一位是转义符“\”且目标字符的反向检索位置也是转义符“\”时,则目标反向检索位置减1;继续步骤9.2.2;
9.2.3反向比对正常结束,则匹配成功;
9.3如果模板字符串长度小于1,如果模板字符串为通配符“%”,则匹配成功,如果不是通配符则匹配失败;
10.其他情况,匹配失败。
图1、图2是表示验证时,设定模板字符为matchMould,目标字符串为matchObject,模板字符串长度为mmLen,目标字符串长度为btEnd,模板通配符“%”位置标记为retreatLoc,模板字符检索位置为i,目标字符检索位置Z,模板字符反向检索位置为iRev,目标字符检索位置zRev。
其中,所述的字符串可为在数据中存在的各种形式,本发明可适用于各种数据类型和编码格式,比如:包括但不限于字节数组(byte[])、字符型数组(char[])、字符串类(String)、数据流(Stream)等;任意通配符也可能是“*”或其它字符,单字符通配符也可能是“?”或其它字符。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解,依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种模糊查询匹配方法,用于对模板字符串和目标字符串之间进行快速匹配,所述模板字符串包含任意通配符、单字通配符、及转义通配符,其特征在于,该方法是对模板字符串中的任意通配符进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度;且对于模板字符串最后一位不是该任意通配符的情况,在模板字符串先进行到结尾时,需对目标字符串进行反向匹配步骤。
2.根据权利要求1所述的一种模糊查询匹配方法,其特征在于,该方法如下步骤:
(1)将可匹配任意长度字符串的该任意通配符,看作是一段匹配的开始,对该任意通配符进行位置标记,其初始标记为-1;如果有在模板中有匹配到新的任意通配符就对标记进行更新;如果在其它字符匹配中失败就返回标记位置;当返回位置为-1时,表示当前匹配段中没有任意通配符,匹配失败;如果返回位置不小于0,则任意通配符存在,继续匹配,直到模板字符串和目标字符串中的某一个结束;
(2)对于模板字符串最后一位是任意通配符的情况,如果匹配字符串进行完毕,则匹配成功;如果目标字符串先于模板前一位结束,则匹配失败;
(3)对于模板字符串最后一位不是该任意通配符的情况,则在模板字符串先进行到结尾时还需要进行反向匹配。
3.根据权利要求2所述的一种模糊查询匹配方法,其特征在于,在步骤(3)中,只需要反向从模板字符串结尾匹配到标记位置即可。
4.根据权利要求2或3所述的一种模糊查询匹配方法,其特征在于,该方法的具体步骤为:
1.先将模板字符串中的任意通配符标记为-1;
2.模板字符检索位置,将目标字符串检索位置置位为字符开头;
3.在满足模板字符检索位置小于模板字符长度并且目标字符串检索位置小于目标字符长度的条件下,开始对模板检索位置字符和目标检索位置字符进行比较,如不满足该条件则转到步骤7;
4.如果模板检索位置字符和目标检索位置字符相同,则模板检索位置和目标字符检索位置均加1,并回到步骤3;
5.如果模板检索位置字符和目标检索位置字符不相同,则:
5.1如果模板字符串中的任意通配符标记位置等于-1,则转到步骤7;
5.2如果模板字符串中的任意通配符标记位置小于模板检索位置;
5.2.1如果模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则目标字符检索位置均加1,将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.2.2不满足模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.3如为其他情况,则将目标字符检索位置均加1,
6.回到步骤3;
7.如果模板字符检索位置等于模板字符长度并且目标字符串检索位置等于目标字符长度,则说明匹配成功,此时,模板字符串和目标字符串均结束;
8.如果目标字符串检索位置等于目标字符长度,模板字符检索位置为模板字符串结束位置,那么当模板字符串结束字符为任意通配符时匹配成功,此时目标字符串结束;
9.模板字符检索位置等于模板字符长度,此时模板字符串结束;
9.1如果模板字符串长度大于1,当模板字符串是以任意通配符结束时,匹配成功;
9.2如果模板字符串长度大于1,且模板字符串不是以任意通配符结束时,此时需要反向匹配未结束的目标字符串;
9.2.1目标字符串反向检索位置置位为字符串最后一位,模板反向检索位置置位为模板最后一位;
9.2.2反向对比模板任意通配符到结束位置的字符;
A.如果模板反向检索位置的字符不是转义通配符,而是单一通配符,且前一位不是转义通配符时,目标反向检索位置减1;继续9.2.2
B.如果模板反向检索位置的字符不是转义通配符,当模板反向检索位置和目标字符反向检索位置字符不相同时,匹配失败;当模板反向检索位置和目标字符反向检索位置字符相同时,目标反向检索位置减1;继续步骤9.2.2;
C.如果模板反向检索位置的字符为转义通配符;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置不是转义通配符,则匹配失败;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置也是转义通配符时,则目标反向检索位置减1;继续步骤9.2.2;
9.2.3反向比对正常结束,则匹配成功;
9.3如果模板字符串长度小于1,如果模板字符串为任意通配符,则匹配成功,如果不是通配符则匹配失败;
10.其他情况,匹配失败。
5.根据权利要求4所述的一种模糊查询匹配方法,其特征在于,步骤3的比较步骤如下:
3.1如果模板检索位置字符为任意通配符,则模板检索位置加1,任意通配符标记为当前模板检索位置,并回到步骤3;
3.2如果模板检索位置字符为单一通配符,则视为与目标字符相同,模板检索位置和目标字符检索位置均加1,然后回到步骤3;
3.3如果模板检索位置字符为转义通配符,则为转义符,模板检索位置加1。
6.根据权利要求5所述的一种模糊查询匹配方法,其特征在于,所述任意通配符、单字通配符、及转义通配符分别为“%”、“_”、“/”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110091480.7A CN112732796B (zh) | 2021-01-23 | 2021-01-23 | 一种模糊查询匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110091480.7A CN112732796B (zh) | 2021-01-23 | 2021-01-23 | 一种模糊查询匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112732796A true CN112732796A (zh) | 2021-04-30 |
CN112732796B CN112732796B (zh) | 2023-01-24 |
Family
ID=75595230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110091480.7A Active CN112732796B (zh) | 2021-01-23 | 2021-01-23 | 一种模糊查询匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112732796B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5655129A (en) * | 1994-05-23 | 1997-08-05 | International Business Machines Corporation | Character-string retrieval system and method |
US6199062B1 (en) * | 1998-11-19 | 2001-03-06 | International Business Machines Corporation | Reverse string indexing in a relational database for wildcard searching |
US20100010989A1 (en) * | 2008-07-03 | 2010-01-14 | The Regents Of The University Of California | Method for Efficiently Supporting Interactive, Fuzzy Search on Structured Data |
US20100131475A1 (en) * | 2007-05-24 | 2010-05-27 | Fujitsu Limited | Computer product, information retrieving apparatus, and information retrieval method |
CN101794283A (zh) * | 2009-02-03 | 2010-08-04 | 华为技术有限公司 | 字符串处理方法及系统和匹配器 |
CN101807184A (zh) * | 2009-02-16 | 2010-08-18 | 阿尔卡特朗讯 | 用于检索包含通配符的字符串的方法和系统 |
CN102929900A (zh) * | 2012-01-16 | 2013-02-13 | 中国科学院北京基因组研究所 | 一种字符串匹配的方法及装置 |
US20160210532A1 (en) * | 2015-01-21 | 2016-07-21 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
CN106446122A (zh) * | 2016-09-19 | 2017-02-22 | 华为技术有限公司 | 信息检索的方法、装置与计算设备 |
CN106874401A (zh) * | 2016-12-30 | 2017-06-20 | 中安威士(北京)科技有限公司 | 一种面向数据库加密字段模糊检索的密文索引方法 |
CN106934069A (zh) * | 2017-04-24 | 2017-07-07 | 中国工商银行股份有限公司 | 数据检索方法及系统 |
CN107122222A (zh) * | 2017-04-20 | 2017-09-01 | 深圳大普微电子科技有限公司 | 一种字符串的搜索系统及方法 |
CN108549679A (zh) * | 2018-04-03 | 2018-09-18 | 国家计算机网络与信息安全管理中心 | 用于url分析系统的文件扩展名快速匹配方法和装置 |
CN112260872A (zh) * | 2020-10-22 | 2021-01-22 | 北京理工大学 | 一种基于字符串匹配的标识异构识别方法及系统 |
-
2021
- 2021-01-23 CN CN202110091480.7A patent/CN112732796B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5655129A (en) * | 1994-05-23 | 1997-08-05 | International Business Machines Corporation | Character-string retrieval system and method |
US6199062B1 (en) * | 1998-11-19 | 2001-03-06 | International Business Machines Corporation | Reverse string indexing in a relational database for wildcard searching |
US20100131475A1 (en) * | 2007-05-24 | 2010-05-27 | Fujitsu Limited | Computer product, information retrieving apparatus, and information retrieval method |
US20100010989A1 (en) * | 2008-07-03 | 2010-01-14 | The Regents Of The University Of California | Method for Efficiently Supporting Interactive, Fuzzy Search on Structured Data |
CN101794283A (zh) * | 2009-02-03 | 2010-08-04 | 华为技术有限公司 | 字符串处理方法及系统和匹配器 |
CN101807184A (zh) * | 2009-02-16 | 2010-08-18 | 阿尔卡特朗讯 | 用于检索包含通配符的字符串的方法和系统 |
CN102929900A (zh) * | 2012-01-16 | 2013-02-13 | 中国科学院北京基因组研究所 | 一种字符串匹配的方法及装置 |
US20160210532A1 (en) * | 2015-01-21 | 2016-07-21 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
CN106446122A (zh) * | 2016-09-19 | 2017-02-22 | 华为技术有限公司 | 信息检索的方法、装置与计算设备 |
CN106874401A (zh) * | 2016-12-30 | 2017-06-20 | 中安威士(北京)科技有限公司 | 一种面向数据库加密字段模糊检索的密文索引方法 |
CN107122222A (zh) * | 2017-04-20 | 2017-09-01 | 深圳大普微电子科技有限公司 | 一种字符串的搜索系统及方法 |
CN106934069A (zh) * | 2017-04-24 | 2017-07-07 | 中国工商银行股份有限公司 | 数据检索方法及系统 |
CN108549679A (zh) * | 2018-04-03 | 2018-09-18 | 国家计算机网络与信息安全管理中心 | 用于url分析系统的文件扩展名快速匹配方法和装置 |
CN112260872A (zh) * | 2020-10-22 | 2021-01-22 | 北京理工大学 | 一种基于字符串匹配的标识异构识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112732796B (zh) | 2023-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8838551B2 (en) | Multi-level database compression | |
US8095526B2 (en) | Efficient retrieval of variable-length character string data | |
CN105589838A (zh) | 一种基于文件比较的电子公文痕迹保留方法 | |
US20060106888A1 (en) | Data update system, differential data creating device and program for data update system, updated file restoring device and program | |
JP2006519445A (ja) | 文字列検索の方法および設備 | |
CN102867049B (zh) | 一种基于单词查找树实现的汉语拼音快速分词方法 | |
CN116628083B (zh) | 区块链交易数据扩容存储方法及系统 | |
CN112307138B (zh) | 地域信息的存储和查询方法、系统与介质 | |
CN114647764B (zh) | 图结构的查询方法、装置及存储介质 | |
CN111046938B (zh) | 基于字符串多模式匹配的网络流量分类识别方法和设备 | |
CN116301656A (zh) | 基于日志结构合并树的数据存储方法、系统及设备 | |
CN115688779A (zh) | 一种基于自监督深度学习的地址识别方法 | |
CN112732796B (zh) | 一种模糊查询匹配方法 | |
CN104052749B (zh) | 一种链路层协议数据类型识别的方法 | |
CN115840751B (zh) | 一种新型树状数据的编码方法 | |
CN116170026A (zh) | 一种适用于类物联网设备生成数据领域的数据压缩和模糊搜索方法 | |
WO2005066835A1 (fr) | Procede d'extraction d'un enregistrement d'une page de donnees d'une base de donnees | |
CN111814009B (zh) | 一种基于搜索引擎检索信息的模式匹配方法 | |
JP7082542B2 (ja) | 軌跡検索装置及び軌跡検索プログラム | |
CN106777178A (zh) | 一种手机号码的存储方法及查询方法 | |
CN114490703A (zh) | 一种数据解析方法、装置及计算机可读存储介质 | |
JPH10162013A (ja) | デジタル探索装置 | |
CN115934873B (zh) | 一种基于地图经纬度坐标的事件查询方法 | |
CN109996232A (zh) | 鉴权消息合法性识别的方法、装置、设备及介质 | |
CN109508345A (zh) | 基于汽车vin搜索的数据库索引查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |