CN109933644A - 一种字符串匹配方法及装置 - Google Patents
一种字符串匹配方法及装置 Download PDFInfo
- Publication number
- CN109933644A CN109933644A CN201910221366.4A CN201910221366A CN109933644A CN 109933644 A CN109933644 A CN 109933644A CN 201910221366 A CN201910221366 A CN 201910221366A CN 109933644 A CN109933644 A CN 109933644A
- Authority
- CN
- China
- Prior art keywords
- character
- target
- string
- key
- hash index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种字符串匹配方法及装置,方法包括:分别构建可疑集合中各个字符串的键值对,并分别计算各个键值对中关键字的哈希索引;获取待匹配字符串,并将待匹配字符串切分为目标长度的字符,作为目标字符;分别计算各个目标字符的哈希索引;在所述键值对中关键字的哈希索引中判断是否存在与目标字符的哈希索引相同的哈希索引;若存在,则确定匹配成功;若不存在,则调整目标长度,并返回执行将目标字符串切分为目标长度的字符,作为目标字符的步骤,直至目标长度小于设定值。在本申请中,通过以上方式可以缩短匹配时间,提高交易效率。
Description
技术领域
本申请涉及金融技术领域,特别涉及一种字符串匹配方法及装置。
背景技术
在实时反欺诈等风控领域,在交易发起后,需在给定的可疑集合(如,公安部公布的涉恐名单、最高法公布的失信名单、银行大数据生成的欺诈可疑名单)中对交易部分关键信息(如姓名等)进行匹配,并及时返回匹配得分情况,便于风险评估。
但是,可疑集合中的可疑信息往往在百万条以上,需要遍历可疑集合中的可疑信息进行匹配,所需时间较长,影响交易效率。
发明内容
为解决上述技术问题,本申请实施例提供一种字符串匹配方法及装置,以达到缩短匹配时间,提高交易效率的目的,技术方案如下:
一种字符串匹配方法,包括:
分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;
获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
分别计算各个所述目标字符的哈希索引;
在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引;
若存在,则确定匹配成功;
若不存在,则调整所述目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
优选的,所述分别构建可疑集合中各个字符串的键值对,包括:
分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
分别构建各个所述目标字符串的键值对;
所述获取待匹配字符串之后,还包括:
去除所述待匹配字符串中的干扰元素。
优选的,所述分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引,包括:
加载所述可疑集合至redis中;
在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
优选的,所述将所述待匹配字符串切分为目标长度的字符,包括:
利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
一种字符串匹配装置,包括:
第一计算模块,用于分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;
切分模块,用于获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
第二计算模块,用于分别计算各个所述目标字符的哈希索引;
判断模块,用于在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引,若存在,则执行第二确定模块,若不存在,则执行调整模块;
所述第一确定模块,用于确定匹配成功;
所述调整模块,用于调整所述目标长度,并返回执行所述切分模块将所述目标字符串切分为目标长度的字符,作为目标字符,直至所述目标长度小于设定值。
优选的,所述第一计算模块,包括:
第一去除子模块,用于分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
第一构建子模块,用于分别构建各个所述目标字符串的键值对;
所述切分模块,包括:
第二去除子模块,用于获取待匹配字符串之后,去除所述待匹配字符串中的干扰元素。
优选的,所述第一计算模块,包括:
加载子模块,用于加载所述可疑集合至redis中;
计算子模块,用于在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
优选的,所述切分模块,包括:
切分子模块,用于利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
与现有技术相比,本申请的有益效果为:
在本申请中,基于哈希查找的原则,构建可疑集合中字符串的键值对中关键字的哈希索引,以及待匹配字符串切分后的目标字符的哈希索引,在针对可疑集合构建的哈希索引中判断是否存在与目标字符的哈希索引相同的哈希索引来进行字符串匹配。由于在针对可疑集合构建的哈希索引中判断是否存在与目标字符的哈希索引相匹配的哈希索引时,不需要遍历即可直接确定是否存在与目标字符的哈希索引相匹配的哈希索引,因此可以缩短匹配时间,提高交易效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种字符串匹配方法的流程图;
图2是本申请提供的另一种字符串匹配方法的流程图;
图3是本申请提供的一种字符串匹配装置的逻辑结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例公开了一种字符串匹配方法,包括:分别构建可疑集合中各个字符串的键值对,并分别构建各个所述键值对中关键字的哈希索引;获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;分别构建各个所述目标字符的哈希索引;在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引;若存在,则确定匹配成功;若不存在,则调整所述目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。在本申请中,可以缩短匹配时间,提高交易效率。
接下来对本申请实施例公开的字符串匹配方法进行介绍,请参见图1,可以包括:
步骤S11、分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
本实施例中,构建可疑集合中各个字符串的键值对的过程可以包括:
从字符串中提取关键信息,作为关键字;
将字符串作为值;
将关键字与值的对应关系作为键值对。
计算各个键值对中关键字的哈希索引的方式可以参见现有技术中利用哈希函数计算哈希值的过程,在此不再赘述。
本实施例中,分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引的过程可以包括:
加载所述可疑集合至redis中;
在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
加载所述可疑集合至redis中,可以提高构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引的便捷性,提高效率。
步骤S12、获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符。
本实施例中,将待匹配字符串切分为目标长度的字符,可以适应包含的匹配关系,提高匹配准确性。
优选的,目标长度的最大值设置为可疑集合中字符串的键值对中的最长关键字的长度。在目标长度等于可疑集合中字符串的键值对中的最长关键字的长度,且目标长度大于待匹配字符串的情况下,不对待匹配字符串进行切分。
本实施例中,并不限制将所述待匹配字符串切分为目标长度的字符的方式,优选的,可以利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
步骤S13、分别计算各个所述目标字符的哈希索引。
本步骤中采用与步骤S11中计算各个键值对中关键字的哈希索引时相同的哈希函数,计算各个目标字符的哈希索引,保证哈希索引查找的准确性。
步骤S14、在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引。
在针对可疑集合构建的哈希索引中判断是否存在与目标字符的哈希索引相同的哈希索引时,不需要遍历即可直接确定是否存在与目标字符的哈希索引相同的哈希索引。
若存在,则执行步骤S15;若不存在,则执行步骤S16。
步骤S15、确定匹配成功。
在匹配成功后,可以继续判断与目标字符的哈希索引相匹配的哈希索引对应的记录与目标字符是否相匹配,来验证并进一步保证匹配结果的准确性。
步骤S16、调整所述目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
在步骤S14判断出存在与所述目标字符的哈希索引相同的哈希索引的基础上,可以调整目标长度,在调整目标长度之后,返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
优选的,设定值可以设置为2。
直至目标长度小于设定值时,若所述键值对中关键字的哈希索引中不存在与所述目标字符的哈希索引相同的哈希索引,则可以确定匹配失败。
现举例对调整目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值的过程进行说明,例如,待匹配字符串为金易融网络科技,可疑集合中存在字符串金易融,设定目标长度的最大值为5,由k表示,对金易融网络科技切分成的目标长度的字符可以参见表1。
表1
如,表1所示,将目标长度设置为5时,可以将金易融网络科技切分为金易融网络、易融网络科、融网络科技,这种情况下,可疑集合的哈希索引中不存在与目标字符的哈希索引相同的哈希索引,因此调整目标长度为4,将金易融网络科技切分为金易融网、易融网络、融网络科、网络科技,这种情况下,可疑集合的哈希索引中仍不存在与目标字符的哈希索引相同的哈希索引,因此调整目标长度为3,将金易融网络科技切分为金易融、易融网、融网络、网络科、络科技,这种情况下,可疑集合的哈希索引中存在与目标字符的哈希索引相同的哈希索引,可以停止调整目标长度,并结束匹配过程。
如表1所示,在最坏的情况下,切分的字符的总个数为1+(n-K+1)+(n-K+2)+(n-K+3)...(n-K+(K-R+1))=(K-R)(n-K)+(K-R+1)(K-R+2)/2<KN<n*n,匹配运算次数仅为n*n次,相比于百万次的匹配次数,匹配次数大大减少,缩短了匹配时间。
在本申请中,基于哈希查找的原则,构建可疑集合中字符串的键值对中关键字的哈希索引,以及待匹配字符串切分后的目标字符的哈希索引,在针对可疑集合构建的哈希索引中判断是否存在与目标字符的哈希索引相同的哈希索引来进行字符串匹配。由于在针对可疑集合构建的哈希索引中判断是否存在与目标字符的哈希索引相匹配的哈希索引时,不需要遍历即可直接确定是否存在与目标字符的哈希索引相匹配的哈希索引,因此可以缩短匹配时间,提高交易效率。
在本申请的另一个实施例中,介绍另外一种字符串匹配方法,请参见图2,可以包括:
步骤S21、分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串。
干扰元素可以包括:干扰词和标点符号等。如,金易融公司中的公司为干扰词,将其去除;本·拉登中的符号“·”为干扰元素,将其去除。
去除可疑集合中各个字符串中的干扰元素,可以提高匹配的效率及准确性。
步骤S22、分别构建各个所述目标字符串的键值对。
构建各个目标字符串的键值对的过程可以参见前述实施例中步骤S11构建可疑集合中各个字符串的键值对的过程,在此不再赘述。
步骤S23、获取待匹配字符串,去除所述待匹配字符串中的干扰元素,并将去除干扰元素的待匹配字符串切分为目标长度的字符,作为目标字符。
与可疑集合中字符串进行去除干扰元素的实施方式相对应,在获取待匹配字符串之后,去除待匹配字符串中的干扰元素,以保证字符处理的一致性。
步骤S24、分别计算各个所述目标字符的哈希索引。
步骤S25、在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引。
若存在,则执行步骤S26;若不存在,则执行步骤S27。
步骤S26、确定匹配成功。
步骤S27、调整所述目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
步骤S24-S27与前述实施例中的步骤S13-S16相同,步骤S24-S27的详细过程可以参见步骤S13-S16的相关介绍,在此不再赘述。
接下来对本申请提供的字符串匹配装置进行介绍,下文介绍的字符串匹配装置与上文介绍的字符串匹配方法可相互对应参照。
请参见图3,字符串匹配装置包括:第一计算模块11、切分模块12、第二计算模块13、判断模块14、第一确定模块15和调整模块16。
第一计算模块11,用于分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
切分模块12,用于获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符。
第二计算模块13,用于分别计算各个所述目标字符的哈希索引。
判断模块14,用于在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引,若存在,则执行第二确定模块,若不存在,则执行调整模块。
所述第一确定模块15,用于确定匹配成功。
所述调整模块16,用于调整所述目标长度,并返回执行所述切分模块将所述目标字符串切分为目标长度的字符,作为目标字符,直至所述目标长度小于设定值。
本实施例中,第一计算模块11,可以包括:
第一去除子模块,用于分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
第一构建子模块,用于分别构建各个所述目标字符串的键值对。
相应地,切分模块,可以包括:
第二去除子模块,用于获取待匹配字符串之后,去除所述待匹配字符串中的干扰元素。
本实施例中,第一计算模块11,可以包括:
加载子模块,用于加载所述可疑集合至redis中;
计算子模块,用于在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
本实施例中,切分模块12,可以包括:
切分子模块,用于利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
以上对本申请所提供的一种字符串匹配方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (8)
1.一种字符串匹配方法,其特征在于,包括:
分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;
获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
分别计算各个所述目标字符的哈希索引;
在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引;
若存在,则确定匹配成功;
若不存在,则调整所述目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
2.根据权利要求1所述的方法,其特征在于,所述分别构建可疑集合中各个字符串的键值对,包括:
分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
分别构建各个所述目标字符串的键值对;
所述获取待匹配字符串之后,还包括:
去除所述待匹配字符串中的干扰元素。
3.根据权利要求1所述的方法,其特征在于,所述分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引,包括:
加载所述可疑集合至redis中;
在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
4.根据权利要求1所述的方法,其特征在于,所述将所述待匹配字符串切分为目标长度的字符,包括:
利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
5.一种字符串匹配装置,其特征在于,包括:
第一计算模块,用于分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;
切分模块,用于获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
第二计算模块,用于分别计算各个所述目标字符的哈希索引;
判断模块,用于在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引,若存在,则执行第二确定模块,若不存在,则执行调整模块;
所述第一确定模块,用于确定匹配成功;
所述调整模块,用于调整所述目标长度,并返回执行所述切分模块将所述目标字符串切分为目标长度的字符,作为目标字符,直至所述目标长度小于设定值。
6.根据权利要求5所述的装置,其特征在于,所述第一计算模块,包括:
第一去除子模块,用于分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
第一构建子模块,用于分别构建各个所述目标字符串的键值对;
所述切分模块,包括:
第二去除子模块,用于获取待匹配字符串之后,去除所述待匹配字符串中的干扰元素。
7.根据权利要求5所述的装置,其特征在于,所述第一计算模块,包括:
加载子模块,用于加载所述可疑集合至redis中;
计算子模块,用于在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
8.根据权利要求5所述的装置,其特征在于,所述切分模块,包括:
切分子模块,用于利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910221366.4A CN109933644B (zh) | 2019-03-22 | 2019-03-22 | 一种字符串匹配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910221366.4A CN109933644B (zh) | 2019-03-22 | 2019-03-22 | 一种字符串匹配方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109933644A true CN109933644A (zh) | 2019-06-25 |
CN109933644B CN109933644B (zh) | 2021-03-09 |
Family
ID=66987973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910221366.4A Active CN109933644B (zh) | 2019-03-22 | 2019-03-22 | 一种字符串匹配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933644B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110572161A (zh) * | 2019-09-10 | 2019-12-13 | 北京中科寒武纪科技有限公司 | 数据的编码方法、装置、计算机设备及可读存储介质 |
CN111104566A (zh) * | 2019-12-26 | 2020-05-05 | 腾讯科技(深圳)有限公司 | 特征索引编码方法、装置、电子设备及存储介质 |
CN112765224A (zh) * | 2021-01-27 | 2021-05-07 | 云账户技术(天津)有限公司 | 发行者代码自动匹配方法、装置和电子设备 |
CN112860957A (zh) * | 2020-11-26 | 2021-05-28 | 国网宁夏电力有限公司检修公司 | 一种定值单的核对方法、介质及系统 |
CN113836367A (zh) * | 2021-09-26 | 2021-12-24 | 杭州迪普科技股份有限公司 | 一种字符反向匹配的方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186669A (zh) * | 2013-03-21 | 2013-07-03 | 厦门雅迅网络股份有限公司 | 关键词快速过滤方法 |
CN103309882A (zh) * | 2012-03-13 | 2013-09-18 | 北京启明星辰信息技术股份有限公司 | 一种多模式下匹配字符串的方法及系统 |
US20170293617A1 (en) * | 2016-04-06 | 2017-10-12 | Baidu Usa Llc | Unified storage system for online image searching and offline image analytics |
CN107545023A (zh) * | 2017-05-11 | 2018-01-05 | 新华三大数据技术有限公司 | 文本型指标的提取方法和装置 |
CN108182221A (zh) * | 2017-12-26 | 2018-06-19 | 珠海市君天电子科技有限公司 | 数据处理的方法以及相关设备 |
CN108846013A (zh) * | 2018-05-04 | 2018-11-20 | 昆明理工大学 | 一种基于geohash与Patricia Trie的空间关键词查询方法及装置 |
CN109408681A (zh) * | 2018-10-11 | 2019-03-01 | 广东工业大学 | 一种字符串匹配方法、装置、设备及可读存储介质 |
-
2019
- 2019-03-22 CN CN201910221366.4A patent/CN109933644B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309882A (zh) * | 2012-03-13 | 2013-09-18 | 北京启明星辰信息技术股份有限公司 | 一种多模式下匹配字符串的方法及系统 |
CN103186669A (zh) * | 2013-03-21 | 2013-07-03 | 厦门雅迅网络股份有限公司 | 关键词快速过滤方法 |
US20170293617A1 (en) * | 2016-04-06 | 2017-10-12 | Baidu Usa Llc | Unified storage system for online image searching and offline image analytics |
CN107545023A (zh) * | 2017-05-11 | 2018-01-05 | 新华三大数据技术有限公司 | 文本型指标的提取方法和装置 |
CN108182221A (zh) * | 2017-12-26 | 2018-06-19 | 珠海市君天电子科技有限公司 | 数据处理的方法以及相关设备 |
CN108846013A (zh) * | 2018-05-04 | 2018-11-20 | 昆明理工大学 | 一种基于geohash与Patricia Trie的空间关键词查询方法及装置 |
CN109408681A (zh) * | 2018-10-11 | 2019-03-01 | 广东工业大学 | 一种字符串匹配方法、装置、设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
LIANG ZHANG ET AL.: ""Improvement on Wu-manber multi-pattern matching algorithm"", 《INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND NETWORK TECHNOLOGY》 * |
李玮: ""面向大数据的高效布鲁姆过滤器研究与应用"", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110572161A (zh) * | 2019-09-10 | 2019-12-13 | 北京中科寒武纪科技有限公司 | 数据的编码方法、装置、计算机设备及可读存储介质 |
CN110572161B (zh) * | 2019-09-10 | 2020-12-11 | 安徽寒武纪信息科技有限公司 | 数据的编码方法、装置、计算机设备及可读存储介质 |
CN111104566A (zh) * | 2019-12-26 | 2020-05-05 | 腾讯科技(深圳)有限公司 | 特征索引编码方法、装置、电子设备及存储介质 |
CN111104566B (zh) * | 2019-12-26 | 2023-07-21 | 腾讯科技(深圳)有限公司 | 特征索引编码方法、装置、电子设备及存储介质 |
CN112860957A (zh) * | 2020-11-26 | 2021-05-28 | 国网宁夏电力有限公司检修公司 | 一种定值单的核对方法、介质及系统 |
CN112765224A (zh) * | 2021-01-27 | 2021-05-07 | 云账户技术(天津)有限公司 | 发行者代码自动匹配方法、装置和电子设备 |
CN113836367A (zh) * | 2021-09-26 | 2021-12-24 | 杭州迪普科技股份有限公司 | 一种字符反向匹配的方法及装置 |
CN113836367B (zh) * | 2021-09-26 | 2023-04-28 | 杭州迪普科技股份有限公司 | 一种字符反向匹配的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109933644B (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933644A (zh) | 一种字符串匹配方法及装置 | |
US11514242B2 (en) | Method for automatically summarizing internet web page and text information | |
CN102970289B (zh) | 基于Web用户行为模式的身份认证方法 | |
CN107730262A (zh) | 一种欺诈识别方法和装置 | |
CN107728941A (zh) | 一种区块链数据压缩方法及系统 | |
Li et al. | A study on the service and trend of Fintech security based on text-mining: Focused on the data of Korean online news | |
CN112868042B (zh) | 使用共享散列图进行欺诈管理的系统、方法和计算机程序产品 | |
CN107239954A (zh) | 一种提高区块产生速度的方法及装置 | |
CN106209821B (zh) | 基于可信云计算的信息安全大数据管理系统 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN105161116B (zh) | 多媒体文件高潮片段的确定方法及装置 | |
CN104077530A (zh) | 用于评估数据访问语句的安全性的方法和装置 | |
CN105447169A (zh) | 文献归一方法、文献搜索方法及对应装置 | |
CN103714086A (zh) | 用于生成非关系数据库的模式的方法和设备 | |
CN110162752A (zh) | 文章判重处理方法、装置及电子设备 | |
CN107784027A (zh) | 一种裁判文书检索关键词的提示方法及装置 | |
CN104239285A (zh) | 文章新章节的检测方法及装置 | |
JP6903595B2 (ja) | データ分析支援システム及びデータ分析支援方法 | |
CN107315831B (zh) | 一种挖掘规则关联模型未知关联关系的方法及装置 | |
CN110532805B (zh) | 数据脱敏方法及装置 | |
CN106844338A (zh) | 基于属性间依赖关系的网络表格的实体列的检测方法 | |
US8463730B1 (en) | Rapid evaluation of numerically large complex rules governing network and application transactions | |
CN108777621A (zh) | 一种获取支付工具支付宝交易记录的方法 | |
Bikku et al. | Optimized Machine Learning Algorithm to classify Phishing Websites | |
CN107992524A (zh) | 一种专家信息搜索及领域评分计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221104 Address after: 100005 No. 69, inner main street, Dongcheng District, Beijing, Jianguomen Patentee after: AGRICULTURAL BANK OF CHINA Patentee after: Agricultural Bank of China Financial Technology Co.,Ltd. Address before: 100005 No. 69, inner main street, Dongcheng District, Beijing, Jianguomen Patentee before: AGRICULTURAL BANK OF CHINA |