CN107229759A - 一种字符串模式匹配的方法 - Google Patents
一种字符串模式匹配的方法 Download PDFInfo
- Publication number
- CN107229759A CN107229759A CN201710622746.XA CN201710622746A CN107229759A CN 107229759 A CN107229759 A CN 107229759A CN 201710622746 A CN201710622746 A CN 201710622746A CN 107229759 A CN107229759 A CN 107229759A
- Authority
- CN
- China
- Prior art keywords
- string
- character
- alignment
- move
- follows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种字符串模式匹配的方法,在检索模式串过程中,坏字符移动规则取得M1,与尾字符移动规则取得M2,M1与M2的最大值即为模式串可移动的最大距离,相比于传统的KMP算法、Horspool算法和Boyer‑Moore算法,能够达到更好的移动模式串的效果,且检索手段丰富多变,可以更快速的定位模式串在文本串中出现的位置,具有高效的检索字符串功能,从而提升用户体验。
Description
技术领域
本发明涉及字符串检索技术领域,具体为一种字符串模式匹配的方法。
背景技术
字符串检索在现实生活中有广泛的应用。如何高效的从一大段文本中定位到自己想查找的内容是很有必要的。如今也有一些算法,如KMP算法、Horspool算法、Boyer-Moore算法等为大家熟知。而每种算法的时间复杂度根据具体情况的不同而不同,但最终的目的都是用最少的步骤,检索到内容。也就是当每次没有匹配到要检索的字符串时,尽可能忽略更多的字符继续向后检索。
KMP算法是从左到右的匹配过程,在很多情况下不如从右到左的匹配高效。从右到左的匹配过程中有很大的概率第一个字符就不匹配,这时就可以移动模式串长度+1个位置继续匹配。
Boyer-Moore算法的好后缀方法具体实现的时候比较繁琐。
Horspool算法改进了Boyer-Moore算法的坏字符方法,但是比较单一,有时不能达到较好的移动模式串的效果。
发明内容
本发明的目的在于提供一种字符串模式匹配的方法,高效的检索字符串,提升用户体验,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种字符串模式匹配的方法,包括以下步骤:
S1:假设:文本串X为:x1x2x3……xn,模式串Y为:y1y2y3……ym,其m、n均为正整数;
S2:分析Y在X中首次出现的位置p,若Y没有出现在X中,则结果p=0,否则p应该应满足条件:p>=1且p<n-m+1;
S3:由S2得:
S2.1:若n<m则p=0;
S2.2:若n=m,依次比较xn与ym,xn-1与ym-1…… x1与y1,出现有比较不相等,则可停止比较;p=1当且仅当所有的比较都相等,否则p=0;
S2.3:若n>m,假设此时Y与X的子集X’:xk-m+1xk-m+2…… xk对齐,如下:
x1x2……xk-mxk-m+1xk-m+2……xkxk+1……xn
y1 y2…… ym
其中k>=m且k<=n,依次比较xk与ym,xk-1与ym-1…… xk-m+1与y1;
S2.4:由S2.3得:
S2.3.1:若xk!=ym,其xk与ym不相等,设Y的子串Y’:y1y2…… ym-1,从右到左查找xk在Y’中的位置p’,找到后即可停止查询;分为以下分析步骤:
S2.3.1.1:若p’=0,即xk不在Y’中,则可使Y右移m个位置,使Y与X的子集X”:xk+ 1xk+2…… xk+m对齐,如下:
x1x2……xk-1xkxk+1xk+2……xk+mxk+m+1……xn
y1 y2…… ym
若k+m>n,则p=0;
若k+m=n,则依次比较xn与ym,xn-1与ym-1…… xk+1与y1,若有比较不相等,则可停止比较,p=n-m+1当且仅当所有的比较都相等,否则p=0;
若k+m<n,则令X’=X”,k=k+m,重复步骤S2.3.1;
S2.3.1.2:若p’!=0,即xk在Y中,从ym-1开始,从右到左查找xk,找到即可停止查询;设xk==yj,j>=1且j<m,此时可右移Y,使得xk与yj对齐,如下:
x1x2……xk-j+1xk-j+2……xkxk+1xk+2……xk+m-j……xn
y1 y2…… yjyj+1yj+2……ym
此时可移动Y的位置为m-j个字符,令X’:xk-j+1xk-j+2……xkxk+1xk+2……xk+m-j,k=k+m-j,重复步骤S2.3.1;
S2.3.2:若X’与Y从右到左比较有i,其i为正整数且i<=m个字符相等;
S2.3.2.1:若i=m,则p=k-m+1;
S2.3.2.2:若i<m,即x1+k-ix2+k-i…… xk==y1+m-i y2+m-i …… ym且xk-i!=ym-I,则Y中剩余为比较的字符串为:Y’:y1y2……ym-i-1。;
S2.3.2.2.1:若m-i=1,则Y’不存在,此时设Y”:y1 y2 …… ym-1,从右到左查找xk在Y”中的位置;
S2.3.2.2.1.1:如果xk不在Y”中则可移动Y串m个字符的位置,使得y1与xk+1对齐,结果如下:
x1x2……xkxk+1xk+2……xk+m-1……xn
y1 y2…… ym
若k+m-1>n,则p=0,否则令X’:xkxk+1xk+2……xk+m-1,k=k+m-1,重复步骤S2.3.1:
S2.3.2.2.1.2:如果xk在Y”中,在Y”中从右到左查询xk,找到即停止查寻,假设xk=yj,则可向右移动Y串m-j个字符的位置,使得yj与xk对齐,如下:
x1x2……xk-j+1xk-j+2……xkxk+1……xk+m-j……xn
y1 y2…… yjyj+1……ym
若k+m-j>n,则p=0,否则令X’:xk-j+1xk-j+2……xkxk+1……xk+m-j,k=k+m-j,重复步骤S2.3.1;
S2.3.2.2.2:若m-i>1,则Y’存在,令Y”:y1y2……ym-i-1;
S2.3.2.2.2.1:首先从右到左查找xk-i在Y”中的位置,找到即停止查询;若xk-i不在Y”中,则Y可向右移动的距离为M1=m-i+1,使得y1与xk-i+1对齐,如下:
x1x2……xk-i-1xk-i+1xk-i+2……xk-1xkxk+1……xk+m-i……xn-1xn
y1 y2…… yi-1yiyi+1……ym
若在Y”找到yj,其j>=1且j<=m-i-1,使得xk-i=yj,则Y可向右移动的距离为M1=m-i-j,使得xk-i与yj对齐,如下:
x1x2……xk-i-j+1xk-i-j+2……xk-i-1xk-ixk-i+1……xk-i-j+mxk-i-j+m+1……xn
y1 y2…… yj-1 yj yj+1…… ym
S2.3.2.2.2.2:其次从右到左查找xk在Y”’:y1 y2……ym-1中的位置,找到即停止查询;同从右到左查找xk-i在Y”中的位置一样,此时设Y可向右移动的距离为M2,取M=MAX(M1,M2),即为Y可向右移动的距离;
若k+M>n,则p=0,否则向右移动Y M个字符的距离,即有如下对齐方式:
x1x2……xk+M-mxk+M-m+1xk+M-m+2……xk+Mxk+M+1……xn
y1 y2…… ym
令X’:xk+M-m+1xk+M-m+2……xk+M,k=k+M,重复执行步骤S2.3.1。
优选的,所述方法用于检索模式串首次出现在文本串中的位置,其与文本串中检索出所有模式串的方法一样。
优选的,所述步骤S2.3.2.2.2.2中,M1为坏字符移动规则取得,M2为尾字符移动规则取得,M1与M2的最大值即为模式串可移动的最大距离。
与现有技术相比,本发明的有益效果是:
本字符串模式匹配的方法,相比于传统的KMP算法、Horspool算法和Boyer-Moore算法,能够更快速的定位模式串在文本串中出现的位置,具有高效的检索字符串功能,从而提升用户体验。
附图说明
图1为本发明整体结构流程图;
图2为本发明A部放大图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明实施例中:一种字符串模式匹配的方法,该方法只检索模式串首次出现在文本串中的位置,要从文本串中检索出所有的模式串,方法一样;完整的方案如下:
第一步:假设:文本串X为:x1x2x3……xn,模式串Y为:y1y2y3……ym,其m、n均为正整数;
第二步:分析Y在X中首次出现的位置p,若Y没有出现在X中,则结果p=0,否则p应该应满足条件:p>=1且p<n-m+1;
第三步:由第二步得:
(2.1):若n<m则p=0;
(2.2):若n=m,依次比较xn与ym,xn-1与ym-1…… x1与y1,出现有比较不相等,则可停止比较;p=1当且仅当所有的比较都相等,否则p=0;
(2.3):若n>m,假设此时Y与X的子集X’:xk-m+1xk-m+2…… xk对齐,如下:
x1x2……xk-mxk-m十1xk-m+2……xkxk+1……xn
y1 y2…… ym
其中k>=m且k<=n,依次比较xk与ym,xk-1与ym-1……xk-m+1与y1;
(2.4):由(2.3)得:
(2.3.1):若xk!=ym,其xk与ym不相等,设Y的子串Y’:y1y2…… ym-1,从右到左查找xk在Y’中的位置p’,找到后即可停止查询;分为以下分析步骤:
第一步:若p’=0,即xk不在Y’中,则可使Y右移m个位置,使Y与X的子集X”:xk+ 1xk+2…… xk+m对齐,如下:
x1x2……xk-1xkxk+1xk+2……xk+mxk+m+1……xn
y1 y2…… ym
若k+m>n,则p=0;
若k+m=n,则依次比较xn与ym,xn-1与ym-1…… xk+1与y1,若有比较不相等,则可停止比较,p=n-m+1当且仅当所有的比较都相等,否则p=0;
若k+m<n,则令X’=X”,k=k+m,重复步骤(2.3.1);
第二步:若p’!=0,即xk在Y中,从ym-1开始,从右到左查找xk,找到即可停止查询;设xk==yj,j>=1且j<m,此时可右移Y,使得xk与yj对齐,如下:
x1x2……xk-j+1xk-j+2……xkxk+1xk+2……xk+m-j……xn
y1 y2…… yjyj+1yj+2……ym
此时可移动Y的位置为m-j个字符,令X’:xk-j+1xk-j+2……xkxk+1xk+2……xk+m-j,k=k+m-j,重复步骤S2.3.1;
(2.3.2):若X’与Y从右到左比较有i,其i为正整数且i<=m个字符相等;
若i=m,则p=k-m+1;
若i<m,即x1+k-ix2+k-i…… xk==y1+m-i y2+m-i …… ym且xk-i!=ym-I,则Y中剩余为比较的字符串为:Y’:y1y2…… ym-i-1。;分为以下分析步骤:
第一步:若m-i=1,则Y’不存在,此时设Y”:y1 y2 …… ym-1,从右到左查找xk在Y”中的位置;
如果xk不在Y”中则可移动Y串m个字符的位置,使得y1与xk+1对齐,结果如下:
x1x2……xkxk+1xk+2……xk+m-1……xn
y1 y2…… ym
若k+m-1>n,则p=0,否则令X’:xkxk+1xk+2……xk+m-1,k=k+m-1,重复步骤S2.3.1:
如果xk在Y”中,在Y”中从右到左查询xk,找到即停止查寻,假设xk=yj,则可向右移动Y串m-j个字符的位置,使得yj与xk对齐,如下:
x1x2……xk-j+1xk-j+2……xkxk+1……xk+m-j……xn
y1 y2…… yjyj+i……ym
若k+m-j>n,则p=0,否则令X’:xk-j+1xk-j+2……xkxk+1……xk+m-j,k=k+m-j,重复步骤S2.3.1;
第二步:若m-i>1,则Y’存在,令Y”:y1y2 …… ym-i-1;
首先从右到左查找xk-i在Y”中的位置,找到即停止查询;若xk-i不在Y”中,则Y可向右移动的距离为M1=m-i+1,使得y1与xk-i+1对齐,如下:
x1x2……xk-i-1xk-i+1xk-i+2……xk-1xkxk+1……xk+m-i……xn-1xn
y1 y2…… yi-1yiyi+1……ym
若在Y”找到yj,其j>=1且j<=m-i-1,使得xk-i=yj,则Y可向右移动的距离为M1=m-i-j,使得xk-i与yj对齐,如下:
x1x2……xk-i-j+1xk-i-j+2……xk-i-1xk-ixk-i+1……xk-i-j+mxk-i-j+m+1……xn
y1 y2…… yj-1 yj yj+i…… ym
其次从右到左查找xk在Y”’:y1y2……ym-1中的位置,找到即停止查询;同从右到左查找xk-i在Y”中的位置一样,此时设Y可向右移动的距离为M2,取M=MAX(M1,M2),即为Y可向右移动的距离;M1为坏字符移动规则取得,M2为尾字符移动规则取得,M1与M2的最大值即为模式串可移动的最大距离;
若k+M>n,则p=0,否则向右移动Y M个字符的距离,即有如下对齐方式:
x1x2……xk+M-mxk+M-m+1xk+M-m+2……xk+Mxk+M+1……xn
y1 y2…… ym
令X’:xk+M-m+1xk+M-m+2……xk+M,k=k+M,重复执行步骤(2.3.1)。
由上述步骤可得,本发明的字符串模式匹配的方法,相比于传统的KMP算法、Horspool算法和Boyer-Moore算法,能够更快速的定位模式串在文本串中出现的位置,具有高效的检索字符串功能,从而提升用户体验。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (3)
1.一种字符串模式匹配的方法,其特征在于,包括以下步骤:
S1:假设:文本串X为:x1x2x3……xn,模式串Y为:y1y2y3……ym,其m、n均为正整数;
S2:分析Y在X中首次出现的位置p,若Y没有出现在X中,则结果p=0,否则p应该应满足条件:p>=1且p<n-m+1;
S3:由S2得:
S2.1:若n<m则p=0;
S2.2:若n=m,依次比较xn与ym,xn-1与ym-1……x1与y1,出现有比较不相等,则可停止比较;p=1当且仅当所有的比较都相等,否则p=0;
S2.3:若n>m,假设此时Y与X的子集X’:xk-m+1xk-m+2……xk对齐,如下:
x1x2……xk-mxk-m+1xk-m+2……xkxk+1……xn
y1 y2…… ym
其中k>=m且k<=n,依次比较xk与ym,xk-1与ym-1……xk-m+1与y1;
S2.4:由S2.3得:
S2.3.1:若xk!=ym,其xk与ym不相等,设Y的子串Y’:y1y2……ym-1,从右到左查找xk在Y’中的位置p’,找到后即可停止查询;分为以下分析步骤:
S2.3.1.1:若p’=0,即xk不在Y’中,则可使Y右移m个位置,使Y与X的子集X”:xk+1xk+2……xk+m对齐,如下:
x1x2……xk-1xkxk+1xk+2……xk+mxk+m+1……xn
y1 y2…… ym
若k+m>n,则p=0;
若k+m=n,则依次比较xn与ym,xn-1与ym-1……xk+1与y1,若有比较不相等,则可停止比较,p=n-m+1当且仅当所有的比较都相等,否则p=0;
若k+m<n,则令X’=X”,k=k+m,重复步骤S2.3.1;
S2.3.1.2:若p’!=0,即xk在Y中,从ym-1开始,从右到左查找xk,找到即可停止查询;设xk==yj,j>=1且j<m,此时可右移Y,使得xk与yj对齐,如下:
x1x2……xk-j+1xk-j+2……xkxk+1xk+2……xk+m-j……xn
y1 y2…… yjyj+1yj+2……ym
此时可移动Y的位置为m-j个字符,令X’:xk-j+1xk-j+2……xkxk+1xk+2……xk+m-j,k=k+m-j,重复步骤S2.3.1;
S2.3.2:若X’与Y从右到左比较有i,其i为正整数且i<=m个字符相等;
S2.3.2.1:若i=m,则p=k-m+1;
S2.3.2.2:若i<m,即x1+k-ix2+k-i……xk==y1+m-i y2+m-i……ym且xk-i!=ym-I,则Y中剩余为比较的字符串为:Y’:y1y2……ym-i-1。;
S2.3.2.2.1:若m-i=1,则Y’不存在,此时设Y”:y1y2……ym-1,从右到左查找xk在Y”中的位置;
S2.3.2.2.1.1:如果xk不在Y”中则可移动Y串m个字符的位置,使得y1与xk+1对齐,结果如下:
x1x2……xkxk+1xk+2……xk+m-1……Xn
y1 y2…… ym
若k+m-1>n,则p=0,否则令X’:xkxk+1xk+2……xk+m-1,k=k+m-1,重复步骤S2.3.1;
S2.3.2.2.1.2:如果xk在Y”中,在Y”中从右到左查询xk,找到即停止查寻,假设xk=yj,则可向右移动Y串m-j个字符的位置,使得yj与xk对齐,如下:
x1X2……xk-j+1xk-j+2……xkxk+1……xk+m-j……xn
y1 y2…… yjyj+1……ym
若k+m-j>n,则p=0,否则令X’:xk-j+1xk-j+2……xkxk+1……xk+m-j,k=k+m-j,重复步骤S2.3.1;
S2.3.2.2.2:若m-i>1,则Y’存在,令Y”:y1y2……ym-i-1;
S2.3.2.2.2.1:首先从右到左查找xk-i在Y”中的位置,找到即停止查询;若xk-i不在Y”中,则Y可向右移动的距离为M1=m-i+1,使得y1与xk-i+1对齐,如下:
x1x2……xk-i-1xk-i+1xk-i+2……xk-1xkxk+1……xk+m-i……xn-1xn
y1 y2…… yi-1yiyi+1……ym
若在Y”找到yj,其j>=1且j<=m-i-1,使得xk-i=yj,则Y可向右移动的距离为M1=m-i-j,使得xk-i与yj对齐,如下:
x1x2……xk-i-j+1xk-i-j+2……xk-i-1xk-ixk-i+1……xk-i-j+mxk-i-j+m+1……xn
y1 y2…… yj-1 yj yj+1…… ym
S2.3.2.2.2.2:其次从右到左查找xk在Y”’:y1 y2……ym-1中的位置,找到即停止查询;同从右到左查找xk-i在Y”中的位置一样,此时设Y可向右移动的距离为M2,取M=MAX(M1,M2),即为Y可向右移动的距离;
若k+M>n,则p=0,否则向右移动Y M个字符的距离,即有如下对齐方式:
x1x2……xk+M-mxk+M-m+1xk+M-m+2……xk+Mxk+M+1……xn
y1 y2…… ym
令X’:xk+M-m+1xk+M-m+2……xk+M,k=k+M,重复执行步骤S2.3.1。
2.根据权利要求1所述的一种字符串模式匹配的方法,其特征在于,所述方法用于检索模式串首次出现在文本串中的位置,其与文本串中检索出所有模式串的方法一样。
3.根据权利要求1所述的一种字符串模式匹配的方法,其特征在于,所述步骤S2.3.2.2.2.2中,M1为坏字符移动规则取得,M2为尾字符移动规则取得,M1与M2的最大值即为模式串可移动的最大距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710622746.XA CN107229759B (zh) | 2017-07-27 | 2017-07-27 | 一种字符串模式匹配的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710622746.XA CN107229759B (zh) | 2017-07-27 | 2017-07-27 | 一种字符串模式匹配的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107229759A true CN107229759A (zh) | 2017-10-03 |
CN107229759B CN107229759B (zh) | 2020-08-11 |
Family
ID=59957203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710622746.XA Active CN107229759B (zh) | 2017-07-27 | 2017-07-27 | 一种字符串模式匹配的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107229759B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920483A (zh) * | 2018-04-28 | 2018-11-30 | 南京搜文信息技术有限公司 | 基于后缀数组的字符串快速匹配方法 |
CN110489997A (zh) * | 2019-08-16 | 2019-11-22 | 北京计算机技术及应用研究所 | 一种基于模式匹配算法的敏感信息脱敏方法 |
CN112069303A (zh) * | 2020-09-17 | 2020-12-11 | 四川长虹电器股份有限公司 | 字符串的匹配查找方法、装置及终端 |
CN114550381A (zh) * | 2022-02-16 | 2022-05-27 | 深圳市乐宜科技有限公司 | 一种基于远程物联网操控的游艺设备的传输方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133523A1 (en) * | 2004-07-26 | 2008-06-05 | Sourcefire, Inc. | Methods and systems for multi-pattern searching |
CN101901257A (zh) * | 2010-07-21 | 2010-12-01 | 北京理工大学 | 一种多字符串匹配方法 |
CN103559266A (zh) * | 2013-11-04 | 2014-02-05 | 中国科学院声学研究所 | 多模式匹配方法及装置 |
US20150142843A1 (en) * | 2012-03-05 | 2015-05-21 | Coupons.Com Incorporated | Fault-tolerant search |
CN104866465A (zh) * | 2014-02-25 | 2015-08-26 | 腾讯科技(深圳)有限公司 | 敏感文本检测方法及装置 |
-
2017
- 2017-07-27 CN CN201710622746.XA patent/CN107229759B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133523A1 (en) * | 2004-07-26 | 2008-06-05 | Sourcefire, Inc. | Methods and systems for multi-pattern searching |
CN101901257A (zh) * | 2010-07-21 | 2010-12-01 | 北京理工大学 | 一种多字符串匹配方法 |
US20150142843A1 (en) * | 2012-03-05 | 2015-05-21 | Coupons.Com Incorporated | Fault-tolerant search |
CN103559266A (zh) * | 2013-11-04 | 2014-02-05 | 中国科学院声学研究所 | 多模式匹配方法及装置 |
CN104866465A (zh) * | 2014-02-25 | 2015-08-26 | 腾讯科技(深圳)有限公司 | 敏感文本检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
PEI-FEI WU,等: "The Research and Amelioration of Pattern-matching Algorithm in Intrusion Detection System", 《2012 IEEE 14TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATION & 2012 IEEE 9TH INTERNATIONAL CONFERENCE ON EMBEDDED SOFTWARE AND SYSTEMS》 * |
万晓榆,等: "改进的Sunday模式匹配算法", 《计算机工程》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920483A (zh) * | 2018-04-28 | 2018-11-30 | 南京搜文信息技术有限公司 | 基于后缀数组的字符串快速匹配方法 |
CN110489997A (zh) * | 2019-08-16 | 2019-11-22 | 北京计算机技术及应用研究所 | 一种基于模式匹配算法的敏感信息脱敏方法 |
CN112069303A (zh) * | 2020-09-17 | 2020-12-11 | 四川长虹电器股份有限公司 | 字符串的匹配查找方法、装置及终端 |
CN114550381A (zh) * | 2022-02-16 | 2022-05-27 | 深圳市乐宜科技有限公司 | 一种基于远程物联网操控的游艺设备的传输方法 |
CN114550381B (zh) * | 2022-02-16 | 2023-03-17 | 深圳市乐宜科技有限公司 | 一种基于远程物联网操控的游艺设备的传输方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107229759B (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107229759A (zh) | 一种字符串模式匹配的方法 | |
Gagie et al. | LZ77-based self-indexing with faster pattern matching | |
Lkhagva et al. | Extended SAX: Extension of symbolic aggregate approximation for financial time series data representation | |
Clifford et al. | Dictionary matching in a stream | |
CN103744956A (zh) | 一种关键词的多样化拓展方法 | |
CN103902599B (zh) | 模糊查找的方法和装置 | |
CN108763295A (zh) | 一种基于深度学习的视频近似拷贝检索算法 | |
CN104268629A (zh) | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 | |
CN108197315A (zh) | 一种建立分词索引库的方法和装置 | |
CN103500178B (zh) | 一种fs算法最差情况下的快速多模式匹配方法 | |
CN104572872A (zh) | 一种基于极值的数据去重分块方法 | |
US20160196303A1 (en) | String search device, string search method, and string search program | |
CN107861940A (zh) | 一种基于hmm的中文分词方法 | |
CN108304384A (zh) | 拆词方法及设备 | |
CN111310849A (zh) | 一种基于knn的有效链路预测方法 | |
Khancome et al. | A two-hashing table multiple string pattern matching algorithm | |
Fuad et al. | Towards a faster symbolic aggregate approximation method | |
CN111814009B (zh) | 一种基于搜索引擎检索信息的模式匹配方法 | |
CN109241124A (zh) | 一种快速检索相似字符串的方法及系统 | |
Cai et al. | A novel link prediction algorithm based on deepwalk and clustering method | |
CN102184245A (zh) | 一种海量文本数据关键词的快速查找方法 | |
Ouyang | Mining rare sequential patterns in data streams with a sliding window | |
Guo et al. | Optimization and comparison of multiple game algorithms in amazon chess | |
Guo et al. | Approximate string matching of power system substation names | |
Pandey et al. | Plagiarism detection in software using efficient string matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |