CN112364862A - 一种基于直方图相似度的扰动变形汉字图片匹配的方法 - Google Patents
一种基于直方图相似度的扰动变形汉字图片匹配的方法 Download PDFInfo
- Publication number
- CN112364862A CN112364862A CN202011420541.1A CN202011420541A CN112364862A CN 112364862 A CN112364862 A CN 112364862A CN 202011420541 A CN202011420541 A CN 202011420541A CN 112364862 A CN112364862 A CN 112364862A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- deformed
- text
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000005516 engineering process Methods 0.000 claims abstract description 13
- 238000000691 measurement method Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000009966 trimming Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 238000003709 image segmentation Methods 0.000 claims description 5
- 238000003064 k means clustering Methods 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种基于直方图相似度的扰动变形汉字图片匹配的方法,包括:获取待匹配文本并转换为图像格式;对文本图像进行图像处理生成白底黑字图像;使用OCR技术识别出图像中每一个字符;从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像;获取本地字库中对应被识别汉字的标准变形字图像,将标准变形字图像裁成标准白底黑字包围盒图像,作为变形字图像;使用图像切边方法切除字符图像多余的白边,生成标准的汉字包围盒图像,作为原图像;分别对原图像与所有变形字图像在水平与垂直方向上进行投影,生成投影直方图;运用相似度度量方法计算直方图相似度,得出最终的匹配结果。本发明有效提高了变形汉字图像匹配的准确率。
Description
技术领域
本发明属于扰动汉字的识别与匹配领域,具体涉及一种基于直方图相似度的扰动变形汉字图片匹配的方法。
背景技术
随着图像处理技术的发展与成熟,数字图像识别与匹配技术被广泛应用于人们的日常生活中。图像识别和匹配主要是用来判断两张图像是否完全相同或者一张图像中是否包含另一张图像内容的重要技术。当前图像识别与匹配主要采用基于模板和基于特征的两大类算法。基于模板的图像匹配算法可以利用模板图像的灰度值或形状到待匹配图像中搜索相似或者相同区域,从而实现图像匹配,该类匹配算法用于较为清晰的图像匹配中能达到较好的匹配结果。基于特征的图像匹配算法主要使用图像的点、线、面、骨架等特征,通过生成特征描述子向量,计算两幅图像特征向量的距离,从而获得匹配结果,该类算法的准确率高,应用较为广泛。
字符图像相对于人物与景物而言具有图像尺寸小,放大易失真的特点,因此模板匹配的方法并不适用于字符图像的匹配。与此同时,汉字扰动变形主要是通过微调汉字笔画的相对位置实现,其图像的总体特征并未得到显著的改变,因此想要通过特征匹配的方式,识别汉字字符图像中的细微差异,也是较为困难的。目前,关于扰动变形汉字图像识别和匹配的研究成果极少,有实质性突破的匹配算法也较少。
因此,如何设计一种准确、高效的扰动变形汉字识别匹配算法已经成为本领域亟待解决的问题。
发明内容
本发明主要目的在于提供一种汉字变形字图像匹配的方法,用于扰动汉字图像的识别与匹配领域。为了解决现有技术针对汉字变形字图像匹配准确度不高的难点,本发明提出了一种基于直方图相似度的扰动变形汉字图片匹配的方法,通过计算原图像和扰动汉字图片的投影直方图,运用直方图相似度度量方法,有效提高扰动变形汉字匹配的准确率。
为了实现上述目的,本发明采用如下方案:
一种基于直方图相似度的扰动变形汉字图片匹配的方法,包括以下步骤:
(1)获取嵌入了变形汉字的待匹配文本,并将待匹配的文本由文本格式转换为图像格式,得到文本图像,对文本图像进行预处理操作,生成白底黑字图像,使用OCR技术识别出白底黑字图像中对应的每一个字符编码,得到被识别汉字;
(2)利用字符图像分割方法,从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像;
(3)根据字符编码映射关系从本地字库中获取对应被识别汉字的标准变形字图像,采用图像切边方法将标准变形字图像裁成标准白底黑字包围盒图像,作为变形字图像;
(4)使用图像切边方法切除字符图像多余的白边,生成标准的汉字包围盒图像,作为原图像;
(5)将原图像与变形字图像的大小缩放到相同尺寸;
(6)分别对原图像与其所有变形字图像在水平与垂直方向上进行投影,生成投影直方图,并归一化处理;
(7)运用相似度度量方法计算原图像和其所有变形字图像之间直方图相似度,通过对比相似度得出最终的匹配结果。
作为优选方案,所述步骤(1)包括:
对汉字扰动变形生成汉字对应的多个变体,保存于本地字库中,用本地字库的变形字替换文本中的对应汉字,生成嵌入了变形汉字的待匹配文本;通过屏幕截图、拍照或扫描将待匹配文本由文本格式转换为图像格式;对文本图像进行预处理操作,生成白底黑字图像;利用OCR技术识别出白底黑字图像中的每一个字符,并获取每个字符在文本图像中的坐标信息。
作为优选方案,所述步骤(2)中,
采用K-means聚类算法,优化OCR技术识别结果;
根据优化后计算出的字符图像宽度与高度比值的经验值,对白底黑字图像进行水平投影分割文本行;
对每一文本行进行垂直投影,通过经验值调整相邻字符图像间距阈值,准确分割出单个白底黑字字符图像。
作为优选方案,所述步骤(3)包括:
根据被识别汉字获得对应汉字图像的字符编码;
利用字符编码与标准变形汉字编码之间的映射关系,从本地字库中提取对应汉字的所有标准变形字图像;
采用图像切边算法将标准变形字图像裁成标准白底黑字包围盒图像,作为变形字图像。
作为优选方案,所述步骤(4)还包括:
根据字符的坐标信息,获得单个字符的图像,同时使用图像切边方法切除字符图像多余的白边,生成标准的汉字包围盒图像,作为原图像。
作为优选方案,所述步骤(5)包括:
采用Lanczos图像插值算法将原图像与变形字图像的大小缩放到相同尺寸。
作为优选方案,所述步骤(6)包括:
计算原图像在水平方向与垂直方向的投影直方图,并归一化处理;
计算所有变形字图像在水平方向与垂直方向的投影直方图,并归一化处理。
作为优选方案,所述步骤(7)包括:
依次获取变形字图像的水平方向与垂直方向的投影直方图,运用相似度度量方法计算变形字图像与原图像在水平方向和垂直方向的投影直方图的相似度;
将相似度进行比较,相似度最大的为最终匹配结果。
本发明与现有技术相比,有益效果是:本发明利用直方图相似度的比较,获取扰动变形汉字图片匹配的结果,有效提高了变形汉字图像匹配的准确率和效率。
附图说明
图1为本发明实施例的基于直方图相似度的扰动变形汉字图片匹配的方法的流程图;
图2为本发明实施例的对“的”字扰动变形的示意图;
图3为本发明实施例的文本图像的水平投影直方图的示意图;
图4为本发明实施例的文本图像的垂直投影直方图的示意图;
图5为本发明实施例的“法”字在水平、垂直投影方向上的示意图;
图6为本发明实施例的“法”字的分割图像(虚线)与标准字图像(实线)在垂直投影直方图对比示意图。
图7为本发明实施例的“法”字的分割图像(虚线)与标准字图像(实线)在水平投影直方图对比示意图。
具体实施方式
为了更好的理解本发明提供的方法,下面结合附图对本发明具体实施例进行清楚、完整的描述。应当明确,所描述的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明实施例的基于直方图相似度的扰动变形汉字图片匹配的方法,包括以下步骤:
步骤S1,获取待匹配的文本。即获取嵌入了变形汉字的待匹配文本。
具体地,通过微调汉字笔画的相对位置对汉字进行扰动变形,生成汉字对应的多个变体,如图2所示的汉字“的”,保存于本地字库中;将本地字库的变形字通过编码映射的方式替换文本中的对应汉字,生成嵌入了变形汉字的待匹配文本。
步骤S2,待匹配文本转为图像格式。即将待匹配的文本由文本格式转换为图像格式,得到文本图像。
具体地,将步骤S1获得的待匹配文本是以文本格式保存的,为方便后续使用图像匹配方法,需要将嵌入了变形汉字的待匹配文本转换为图像格式。目前,将文本转为文本图像可以使用网上现有的主流的一些格式转换工具,或者利用屏幕截图、扫描以及电子设备拍照的方式将文本转为文本图像。
步骤S3,文本图像预处理操作。即对文本图像进行图像预处理操作,生成白底黑字图像。
具体地,由于文本转换为文本图像的过程中,电子设备会受到一定的外界噪声干扰,使得生成的文本图像上会存在一定的噪点,并引发图像的失真。因此,需要对文本图像进行预处理操作是必要的。针对不同的转换方式,采用不同的图像预处理操作,能达到较好的处理效果。
由于屏幕截图生成的文本图像其噪声较为少,采用大津算法OSTU对其进行二值化处理。OSTU作为一种全局阈值法,在图像光照不均时效果较差,会存在部分的图像区域大面积错误边缘现象,在进行处理时参照自适应阈值二值化的方法对OSTU算法进行改进,具体的采用图像分块的方法,为多个图像分块分别取OSTU阈值,从而使得光照不均的图像也能得到较好的文字背景分离效果。
针对扫描方式生成的文本图像,图像中不仅噪点多,且字符笔画之间还会存在断开、粘连以及偏移现象,因此对文本图像二值化处理的基础上,还要对其进行均值滤波处理,均值滤波的卷积核如下式所示:
W、H为卷积核的宽度和高度,该卷积核的作用是在覆盖的像素中取平均值,再进行滤波处理后,还需进行膨胀、腐蚀等图像形态学操作,以达到较好的处理效果。
针对电子设备拍照生成的文本图像,由于会受到拍摄角度以及拍摄现场光照强度的影响,因此在预处理的过程中使用霍夫变换法对图像进行矫正,并采用图像锐化方法降低光照对图像的影响。
步骤S4,OCR识别文本图像中每个字符。即使用OCR技术识别出白底黑字图像中对应的每一个字符,得到被识别汉字。
具体地,将步骤S3图像预处理操作生成的白底黑字图像输入到OCR系统中,通过OCR技术识别出白底黑字图像中的每一个字符,得到被识别的汉字,并获取单个汉字在文本图像中的坐标信息。
步骤S5,图像分割技术分割文本图像中每个汉字字符图像。即利用字符图像分割方法,从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像;
具体地,字符图像分割方法目前使用较多的算法是投影法。
首先,对步骤S3生成的白底黑字图像进行水平投影,获得文本图像的水平投影直方图,如图3所示,通过对直方图的分割达到文本图像行切分的效果;接着对每个文本行进行垂直投影,如图4所示,从而确定单个汉字起始位置。一般而言,上下结构的汉字就能被较为准确地分割出来,而左右结构或者左中右结构的汉字,由于部件之间会存在一定的空隙,导致不能被完整的分割。为了优化分割算法,采用K-means聚类算法,优化OCR技术识别结果;即采用聚类分析的方法,对嵌入使用的字体进行取样,对样本的宽高进行分析,获得样本的宽度、高度,统计直方图,并计算宽高比,使用K-means聚类算法动态确定字符分割的阈值,从而达到更好的分割效果。具体地,根据优化后计算出的字符图像宽度与高度比值的经验值,对白底黑字图像进行水平投影分割文本行;对每一文本行进行垂直投影,通过经验值调整相邻字符图像间距阈值,准确分割出单个白底黑字字符图像。
步骤S6,字符编码映射关系获取本地字库中对应汉字的标准变形字图像。即根据字符编码映射关系获取本地字库中对应被识别汉字的标准变形字图像,采用图像切边方法将标准变形字图像裁成标准白字黑字包围盒图像,作为变形字图像。
具体地,根据OCR技术的识别结果可以获得文本图像中每个汉字图像的字符编码;接着利用字符编码与标准变形汉字编码之间的映射关系,从本地字库中提取对应汉字的所有标准变形字图像,采用图像切边方法将标准变形字图像裁成标准白字黑字包围盒图像,作为变形字图像。
步骤S7,字符图像切边处理生成白底黑字包围盒图像。即使用图像切边方法切除字符图像多余的白边,生成标准的汉字包围盒图像,作为原图像。
具体地,无论是投影法分割出的字符图像还是字库中获取的标准变形字图像,均是背景为白色,字符为黑色的图像。这些图像四周均可能存在一定的白边,导致后续字体缩放不能较好的对准。为了提高匹配准确率,使用字符图像切边算法,切除图像上下左右多余的白边,生成标准的白底黑字包围盒图像,作为原图像。
步骤S8,调整分割字符图像和标准变形字图像大小到相同尺寸。即将原图像与变形字图像的大小缩放到相同尺寸。
具体地,采用Lanczos图像插值算法,将分割的字符图像和标准的变形字图像大小缩放到相同大小,双立方插值算法的公式如下所示:
其中,f(x,y)是一个三次多项式,i,j∈[0,3),x和y代表函数f(x,y)上的一个点,aij为权重系数。
步骤S9,计算分割图像与变形字图像水平和垂直方向投影直方图,并归一化直方图。即:分别对原图像与其所有变形字图像在水平与垂直方向上进行投影,生成投影直方图,并归一化处理。
具体地,由于单个汉字投影反应的是笔画在一个方向上整体的位置信息,而字形设计时采用尽量挪动水平和垂直笔画的方法,所以不同字形间的水平和垂直投影必定会有部分不同。以“法”字为例,计算该字在水平与垂直方向上的直方图,并归一化处理,如图5所示。
S10,运用相似度度量法度量直方图相似度。即运用相似度度量方法计算原图像和其所有变形字图像之间直方图相似度。
具体地,将分割后字符图像(即原图像)与标准变形字图像的投影直方图归一化处理后,使用相关性比较法计算直方图似度。图6、图7分别为输入分割字符图像(虚线)与变形字形(实线)对比中垂直、水平投影的差异,可见投影能一定程度上反应笔画的移动。
S11,根据计算得出的直方图相似度值,得出匹配结果。
基于相关性的比较方法,相关性系数绝对值取值为0-1,水平和垂直投影两个值总体偏差的影响较小,且直方图整体高度差对相关性系数计算结果影响较小。在相关性系数算法下,综合评分取值最大的即为最佳的匹配结果。
以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。
Claims (8)
1.一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,包括以下步骤:
(1)获取嵌入了变形汉字的待匹配文本,并将待匹配的文本由文本格式转换为图像格式,得到文本图像,对文本图像进行预处理操作,生成白底黑字图像,使用OCR技术识别出白底黑字图像中对应的每一个字符编码,得到被识别汉字;
(2)利用字符图像分割方法,从白底黑字图像中分割并提取出所有被识别汉字对应的字符图像;
(3)根据字符编码映射关系从本地字库中获取对应被识别汉字的标准变形字图像,采用图像切边方法将标准变形字图像裁成标准白底黑字包围盒图像,作为变形字图像;
(4)使用图像切边方法切除字符图像多余的白边,生成标准的汉字包围盒图像,作为原图像;
(5)将原图像与变形字图像的大小缩放到相同尺寸;
(6)分别对原图像与其所有变形字图像在水平与垂直方向上进行投影,生成投影直方图,并归一化处理;
(7)运用相似度度量方法计算原图像和其所有变形字图像之间直方图相似度,通过对比相似度得出最终的匹配结果。
2.如权利要求1所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(1)包括:
对汉字扰动变形生成汉字对应的多个变体,保存于本地字库中,用本地字库的变形字替换文本中的对应汉字,生成嵌入了变形汉字的待匹配文本;通过屏幕截图、拍照或扫描将待匹配文本由文本格式转换为图像格式;对文本图像进行预处理操作,生成白底黑字图像;利用OCR技术识别出白底黑字图像中的每一个字符,并获取每个字符在文本图像中的坐标信息。
3.如权利要求2所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(2)中,
采用K-means聚类算法,优化OCR技术识别结果;
根据优化后计算出的字符图像宽度与高度比值的经验值,对白底黑字图像进行水平投影分割文本行;
对每一文本行进行垂直投影,通过经验值调整相邻字符图像间距阈值,准确分割出单个白底黑字字符图像。
4.如权利要求3所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(3)包括:
根据被识别汉字获得对应汉字图像的字符编码;
利用字符编码与标准变形汉字编码之间的映射关系,从本地字库中提取对应汉字的所有标准变形字图像;
采用图像切边算法将标准变形字图像裁成标准白底黑字包围盒图像,作为变形字图像。
5.如权利要求4所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(4)还包括:
根据字符的坐标信息,获得单个字符的图像,同时使用图像切边方法切除字符图像多余的白边,生成标准的汉字包围盒图像,作为原图像。
6.如权利要求5所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(5)包括:
采用Lanczos图像插值算法将原图像与变形字图像的大小缩放到相同尺寸。
7.如权利要求6所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(6)包括:
计算原图像在水平方向与垂直方向的投影直方图,并归一化处理;
计算所有变形字图像在水平方向与垂直方向的投影直方图,并归一化处理。
8.如权利要求7所述的一种基于直方图相似度的扰动变形汉字图片匹配的方法,其特征在于,所述步骤(7)包括:
依次获取变形字图像的水平方向与垂直方向的投影直方图,运用相似度度量方法计算变形字图像与原图像在水平方向和垂直方向的投影直方图的相似度;
将相似度进行比较,相似度最大的为最终匹配结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011420541.1A CN112364862B (zh) | 2020-12-08 | 2020-12-08 | 一种基于直方图相似度的扰动变形汉字图片匹配的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011420541.1A CN112364862B (zh) | 2020-12-08 | 2020-12-08 | 一种基于直方图相似度的扰动变形汉字图片匹配的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112364862A true CN112364862A (zh) | 2021-02-12 |
CN112364862B CN112364862B (zh) | 2024-04-16 |
Family
ID=74536672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011420541.1A Active CN112364862B (zh) | 2020-12-08 | 2020-12-08 | 一种基于直方图相似度的扰动变形汉字图片匹配的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112364862B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926568A (zh) * | 2021-03-05 | 2021-06-08 | 北京全路通信信号研究设计院集团有限公司 | 联锁表蓝图识别方法、装置、电子设备及存储介质 |
CN113837118A (zh) * | 2021-09-28 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 文本变异关系的获取方法和装置 |
CN113962199A (zh) * | 2021-12-20 | 2022-01-21 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、设备、存储介质及程序产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961417A (zh) * | 2017-12-26 | 2019-07-02 | 广州极飞科技有限公司 | 图像处理方法、装置及移动装置控制方法 |
CN110942473A (zh) * | 2019-12-02 | 2020-03-31 | 哈尔滨工程大学 | 一种基于特征点网格化匹配的运动目标跟踪检测方法 |
-
2020
- 2020-12-08 CN CN202011420541.1A patent/CN112364862B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961417A (zh) * | 2017-12-26 | 2019-07-02 | 广州极飞科技有限公司 | 图像处理方法、装置及移动装置控制方法 |
CN110942473A (zh) * | 2019-12-02 | 2020-03-31 | 哈尔滨工程大学 | 一种基于特征点网格化匹配的运动目标跟踪检测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926568A (zh) * | 2021-03-05 | 2021-06-08 | 北京全路通信信号研究设计院集团有限公司 | 联锁表蓝图识别方法、装置、电子设备及存储介质 |
CN112926568B (zh) * | 2021-03-05 | 2024-02-13 | 北京全路通信信号研究设计院集团有限公司 | 联锁表蓝图识别方法、装置、电子设备及存储介质 |
CN113837118A (zh) * | 2021-09-28 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 文本变异关系的获取方法和装置 |
CN113837118B (zh) * | 2021-09-28 | 2024-04-26 | 支付宝(杭州)信息技术有限公司 | 文本变异关系的获取方法和装置 |
CN113962199A (zh) * | 2021-12-20 | 2022-01-21 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、设备、存储介质及程序产品 |
CN113962199B (zh) * | 2021-12-20 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、设备、存储介质及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN112364862B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112364862B (zh) | 一种基于直方图相似度的扰动变形汉字图片匹配的方法 | |
Shahab et al. | ICDAR 2011 robust reading competition challenge 2: Reading text in scene images | |
EP2783328B1 (en) | Text detection using multi-layer connected components with histograms | |
CN108416355B (zh) | 一种基于机器视觉的工业现场生产数据的采集方法 | |
CN108133216B (zh) | 基于机器视觉的可实现小数点读取的数码管读数识别方法 | |
CN110717497B (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
CN103295009B (zh) | 基于笔画分解的车牌字符识别方法 | |
CN111241975A (zh) | 一种基于移动端边缘计算的人脸识别检测方法及系统 | |
CN110647795A (zh) | 一种表格识别方法 | |
WO2009114967A1 (zh) | 基于移动扫描的图像处理方法及装置 | |
CN111553344A (zh) | 文本图像的倾斜校正方法、系统、设备和存储介质 | |
CN111126240A (zh) | 一种三通道特征融合人脸识别方法 | |
CN113780276A (zh) | 一种结合文本分类的文本检测和识别方法及系统 | |
CN114332865A (zh) | 一种证件ocr识别方法及系统 | |
CN111652117A (zh) | 一种对多文档图像分割的方法及介质 | |
CN113139535A (zh) | 一种ocr文档识别方法 | |
Keefer et al. | A survey on document image processing methods useful for assistive technology for the blind | |
Liu et al. | Detection and segmentation text from natural scene images based on graph model | |
Bessmeltsev et al. | High-speed OCR algorithm for portable passport readers | |
CN113989485A (zh) | 基于ocr识别的文本字符分割方法及系统 | |
Su et al. | Skew detection for Chinese handwriting by horizontal stroke histogram | |
Savelyev et al. | A method for machine-readable zones location based on a combination of the Hough transform and the search for feature points | |
CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
CN110580451A (zh) | 一种基于三维优化子曲面的人脸识别方法及系统 | |
CN117095423B (zh) | 一种银行单据字符的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |