CN115331211B - 一种用于文字识别的去噪增强方法 - Google Patents

一种用于文字识别的去噪增强方法 Download PDF

Info

Publication number
CN115331211B
CN115331211B CN202211186525.XA CN202211186525A CN115331211B CN 115331211 B CN115331211 B CN 115331211B CN 202211186525 A CN202211186525 A CN 202211186525A CN 115331211 B CN115331211 B CN 115331211B
Authority
CN
China
Prior art keywords
area
noise
new
connected domains
domains
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202211186525.XA
Other languages
English (en)
Other versions
CN115331211A (zh
Inventor
何芸
余伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Juxin Zhonghui Digital Technology Co ltd
Original Assignee
Jiangsu Juxin Zhonghui Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Juxin Zhonghui Digital Technology Co ltd filed Critical Jiangsu Juxin Zhonghui Digital Technology Co ltd
Priority to CN202211186525.XA priority Critical patent/CN115331211B/zh
Publication of CN115331211A publication Critical patent/CN115331211A/zh
Application granted granted Critical
Publication of CN115331211B publication Critical patent/CN115331211B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及数据识别处理技术领域,具体涉及一种用于文字识别的去噪增强方法。该方法包括:获取拓印完成后的碑文图像对应的二值图像;获取二值图像中多个连通域以及连通域面积进而得到噪声阈值;基于噪声阈值将连通域分为小连通域和大连通域,根据所有小连通域的连通域面积得到噪声程度;根据预设的形态学结构元将小连通域融合相连以构建新直方图,基于新直方图以及噪声程度获取噪声衰减率;相应的,获取新噪声衰减率以及利用新形态学结构元对大连通域处理的相似性;基于相似性以及新噪声衰减率获取合适度,进而得到最优结构元,基于最优结构元得到修复图像;使得噪声去除后图像增强修复的效果较好,使得文字识别更加准确。

Description

一种用于文字识别的去噪增强方法
技术领域
本发明涉及数据识别处理技术领域,具体涉及一种用于文字识别的去噪增强方法。
背景技术
拓片是记录中华古代文明的重要载体之一,如果原始的石碑损坏或丢失,拓片可以保留石碑原来的历史资料;相较于相机拍摄记录图像,拓片皆为正射影像,贴近被拓目标,可以清晰地展现碑文原有的线条,但相机拍摄可能会因为拍摄角度影响导致拍摄图像偏离真实的碑文。
由于碑文经过时间的洗礼导致碑文表面会出现瑕疵,拓印出来的图像会存在瑕疵的干扰,因此拓印下来的碑文图像需要进行修复,去除瑕疵的干扰;传统修复方法通常是将孤立的小面积区域直接去除,但直接去除小面积会导致信息去除量太多,影响碑文拓印图像的质量;也有部分采用形态学进行瑕疵去除,但形态学处理时结构元的选取难以统一,导致处理不足或过处理,过处理会导致碑文原始的文字缺失,处理不足会导致瑕疵去除效果不良,从而使得文字识别的准确性低。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种用于文字识别的去噪增强方法,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种用于文字识别的去噪增强方法,该方法包括以下步骤:
获取拓印完成后的碑文图像,对所述碑文图像进行阈值分割得到对应的二值图像;
获取所述二值图像中多个连通域,基于连通域中像素点的数量得到连通域面积;根据连通域的数量以及连通域面积构建面积直方图,基于所述面积直方图得到噪声阈值;获取连通域面积小于所述噪声阈值的连通域为小连通域,连通域面积大于所述噪声阈值的连通域为大连通域;根据所有小连通域的连通域面积得到噪声程度;
根据预设的形态学结构元将小连通域融合相连得到新连通域,基于所有大连通域和新连通域的数量及其对应的连通域面积构建新直方图,基于所述新直方图以及所述噪声程度获取噪声衰减率;
根据新形态学结构元将小连通域融合相连得到多个第二连通域,基于所有大连通域和第二连通域的数量获取新噪声衰减率;利用新形态学结构元对大连通域处理,以得到面积的变化曲线,获取大连通域的原始曲线与所述变化曲线之间的相似性;
获取不同的形态学结构元处理后的合适度,所述合适度由所述相似性以及所述新噪声衰减率获取,所述合适度最小时的对应的形态学结构元为最优结构元,基于最优结构元对碑文图像进行处理得到修复图像;
其中,所述基于所述面积直方图得到噪声阈值的步骤,包括:
基于所述面积直方图获取最大连通域面积和最小连通域面积,根据最大连通域面积和最小连通域面积获取噪声阈值,所述噪声阈值的计算为:
Figure DEST_PATH_IMAGE001
其中,
Figure 100002_DEST_PATH_IMAGE002
表示噪声阈值;
Figure 100002_DEST_PATH_IMAGE003
表示最大连通域面积;
Figure 100002_DEST_PATH_IMAGE004
表示最小连通域面积;
Figure 100002_DEST_PATH_IMAGE005
表示自然常数;
Figure 100002_DEST_PATH_IMAGE006
表示经验比例。
优选的,所述根据所有小连通域的连通域面积得到噪声程度的步骤,包括:
将所有小连通域的连通域面积进行求和得到第一面积,将碑文图像中所有连通域的连通域面积进行求和得到第二面积,所述第一面积与所述第二面积的比值为所述噪声程度。
优选的,所述根据预设的形态学结构元将小连通域融合相连得到新连通域的步骤,包括:
利用预设的形态学结构元对碑文图像进行开运算,对开运算处理后的图像进行闭运算,基于闭运算将存在关联的小连通域进行融合连接,融合连接后的小连通域为新连通域。
优选的,所述基于所述新直方图以及所述噪声程度获取噪声衰减率的步骤,包括:
将所述新直方图中连通域面积小于噪声阈值的连通域记为第二区域,获取所有第二区域的连通域面积的求和结果;
获取新直方图中所有连通域面积的求和得到第二求和结果,计算所述求和结果与所述第二求和结果的第二比值;
所述噪声程度与所述第二比值的差值为所述噪声衰减率。
优选的,所述获取大连通域的原始曲线与所述变化曲线之间的相似性的步骤,包括:
在所述变化曲线上进行均匀采样得到多个采样点,获取每个采样点在原始曲线中的Y轴坐标值以及每个采样点在变化曲线中的Y轴坐标值;
获取每个采样点对应的原始曲线中Y轴坐标值与变化曲线中的Y轴坐标值的差值,所有采样点的差值的均值为所述相似性。
优选的,所述获取不同的形态学结构元处理后的合适度的步骤,包括:
获取所述新噪声衰减率与所述相似性的求和的均值为所述合适度。
本发明具有如下有益效果:本发明实施例通过对碑文图像中连通域的分析得到噪声阈值,结合噪声的特点利用噪声阈值将所有的连通域划分为小连通域和大连通域,通过对小连通域进行形态学结构元运算,使得噪声去除的效果更好,且计算更加具有针对行;进一步的,利用形态学结构元对大连通域进行运算,得到处理后变化曲线与原始曲线之间的相似性,基于相似性计算此时的合适度,进而基于合适度得到最优结构元,使得碑文图像增强修复的效果最好,在去除噪声的同时使得大连通域的特征保留,后续文字识别的准确性较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种用于文字识别的去噪增强方法流程图;
图2为本发明一个实施例所提供的一种碑文图像示意图;
图3为本发明一个实施例所提供的一种碑文的二值图像示意图;
图4为本发明一个实施例所提供的一种面积直方图示意图;
图5为本发明一个实施例所提供的一种异常腐蚀的碑文示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于文字识别的去噪增强方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本申请用于对拓印后碑文图像的增强修复,以增强修复后图像进行文字识别;下面结合附图具体的说明本发明所提供的一种用于文字识别的去噪增强方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用于文字识别的去噪增强方法流程图,该方法包括以下步骤:
步骤S100,获取拓印完成后的碑文图像,对碑文图像进行阈值分割得到对应的二值图像。
具体的,将拓印完成后的碑文置于平整桌面上,在桌面的正上方布置相机,以采集拓印完成后的碑文图像,相机应保证采集到的碑文图像为正射图像;然后通过自适应阈值分割方法对采集到的碑文图像进行阈值分割,从而得到碑文图像的二值图像;具体可参阅图2和图3,其分别示出一种碑文图像示意图和一种碑文的二值图像示意图。
步骤S200,获取二值图像中多个连通域,基于连通域中像素点的数量得到连通域面积;根据连通域的数量以及连通域面积构建面积直方图,基于面积直方图得到噪声阈值;获取连通域面积小于噪声阈值的连通域为小连通域,连通域面积大于噪声阈值的连通域为大连通域;根据所有小连通域的连通域面积得到噪声程度。
由于碑文破损等原因的影响,会导致碑文图像中存在较多的噪声,影响碑文图像的质量;在实际的碑文图像中,汉字通常为一个个连通域,部分汉字也存在部分笔画脱离汉字本体,形成单独的连通域,但整体而言,汉字所形成的连通域的面积相对于缺陷或噪声形成的连通域而言要较大,因此对图像中的连通域进行分析。
具体的,由于二值图像中碑文部分的像素点的像素值非零,背景部分的像素点的像素值为0;在二值图像中任意选择一个非零像素点为种子点,采用区域生长法获取种子点所在的连通域,当区域生长不符合迭代条件时停止,此时随机选取下一个像素值非零的像素点作为种子点,以新的种子点继续进行区域生长,直至将所有像素值非零的像素点搜索完成后停止。
需要说明的是,每次随机选取的下一个种子点时,选取范围不包括已经划分为连通域的像素点。
每个连通域对应的连通域面积为该连通域中所有像素点的数量,基于每个连通域面积以及该连通域面积下对应的连通域数量构建面积直方图,该面积直方图的X轴表示不同的连通域面积,Y轴表示连通域的数量,请参阅图4,其示出一种面积直方图示意图。
然后,根据面积直方图获取噪声阈值;由于不同的碑文图像中字体大小不同,故对应的噪声阈值也不相同,对于较大的字体而言,对应的噪声阈值可较大,对于较小的字体而言,对应的噪声阈值需较小,基于面积直方图获取最大连通域面积和最小连通域面积,根据最大连通域面积和最小连通域面积获取噪声阈值,则噪声阈值的计算为:
Figure 100002_DEST_PATH_IMAGE007
其中,
Figure 663265DEST_PATH_IMAGE002
表示噪声阈值;
Figure 642723DEST_PATH_IMAGE003
表示最大连通域面积;
Figure 484777DEST_PATH_IMAGE004
表示最小连通域面积;
Figure 942303DEST_PATH_IMAGE005
表示自然常数;
Figure 320457DEST_PATH_IMAGE006
表示经验比例,本发明实施例中取经验值为100。
根据噪声阈值将连通域划分为两种类型,将连通域面积小于噪声阈值的连通域记为小连通域,连通域面积大于噪声阈值的连通域记为大连通域;由于噪声以及缺陷的连通域较小,因此基于小连通域获取噪声程度,噪声程度的计算为:
Figure DEST_PATH_IMAGE008
其中,
Figure DEST_PATH_IMAGE009
表示噪声程度;
Figure DEST_PATH_IMAGE010
表示第
Figure DEST_PATH_IMAGE011
个小连通域的面积;
Figure DEST_PATH_IMAGE012
表示碑文图像中第
Figure DEST_PATH_IMAGE013
个连 通域的面积;
Figure DEST_PATH_IMAGE014
表示碑文图像中所有连通域的数量;
Figure DEST_PATH_IMAGE015
表示所有小连通域的数量。
步骤S300,根据预设的形态学结构元将小连通域融合相连得到新连通域,基于所有大连通域和新连通域的数量及其对应的连通域面积构建新直方图,基于新直方图以及噪声程度获取噪声衰减率。
考虑到小连通域也有可能为碑文表面风化所导致的破损,或者可能为字体本身的组成部分,故小连通域是否为噪声是不确定的,但部分小连通域与其他连通域之间是存在关联的,因此分析小连通域之间的关联性,并根据关联性进行小连通域的融合连接。
首先,选用大小为
Figure DEST_PATH_IMAGE016
大小的R型结构元对碑文图像进行开运算,开运算可以去 除孤立的小点和毛刺,通过开运算操作之后,一些小的孤立的小噪声被去除掉,同时一些毛 刺被去除掉,避免影响关联性的获取。
然后,对开运算之后的图像进行形态学闭运算,闭运算可以将有关联的小连通域进行连接融合,此时通过开运算和闭运算的组合操作后,会将部分有关联的小连通域进行融合,将融合连接后的小连通域标记为新连通域。
利用形态学结构元进行开运算和闭运算之后,去除了部分孤立的噪声,同时将关联的连通域进行融合相连,此时碑文图像中包括了新连通域和原来的大连通域,因此基于此时新连通域和大连通域的连通域满级得到新的面积直方图记为新直方图;根据新直方图获取小于噪声阈值的连通域记为第二区域,基于所有第二区域的连通域面积以及噪声程度获取噪声衰减率,噪声衰减率的计算为:
Figure DEST_PATH_IMAGE017
其中,
Figure DEST_PATH_IMAGE018
表示噪声衰减率;
Figure 678274DEST_PATH_IMAGE009
表示噪声程度;
Figure DEST_PATH_IMAGE019
表示第
Figure 804362DEST_PATH_IMAGE011
个第二区域的连通域面积;
Figure DEST_PATH_IMAGE020
表示第二区域的数量;
Figure DEST_PATH_IMAGE021
表示小连通域融合后碑文图像中第
Figure 691678DEST_PATH_IMAGE013
个连通域面积;
Figure DEST_PATH_IMAGE022
表示小 连通域融合后碑文图像中所有连通域的数量。
步骤S400,根据新形态学结构元将小连通域融合相连得到多个第二连通域,基于所有大连通域和第二连通域的数量获取新噪声衰减率;利用新形态学结构元对大连通域处理,以得到面积的变化曲线,获取大连通域的原始曲线与变化曲线之间的相似性。
采用不同的形态学结构元进行开运算和闭运算后的结果不同,初始选择的
Figure 750769DEST_PATH_IMAGE016
大小的结构元为最小结构元,通过
Figure 304985DEST_PATH_IMAGE016
大小的结构元处理之后去除了小的孤立的噪声点 的同时,将有关联的连通域融合到一起,此时碑文拓印图像中的部分噪声点被去除,但噪声 可能并没有被完全去除;因此通过改变形态学的结构元大小再次进行形态学的开闭运算的 组合操作,获取对应大小结构元的噪声衰减率,例如:选用
Figure DEST_PATH_IMAGE023
大小的R型结构元对碑文图 像中的小连通域进行开运算,对开运算的结果图像进行形态学闭运算,闭运算可以将存在 新关联的小连通域进行连接融合,此时通过开闭运算的组合操作后,会将部分有关联的小 连通域进行融合得到多个第二连通域,基于与步骤S300中计算噪声衰减率相同的方法,获 取此时的新噪声衰减率
Figure DEST_PATH_IMAGE024
,当新噪声衰减率
Figure 246265DEST_PATH_IMAGE024
为0时说明噪声去除效果达到最好。
但在实际操作过程中形态学结构元并非越大越好,当形态学的结构元大到某个程 度时,会将字体原本的部分腐蚀掉,影响字体本身的完整性,例如图5所示的一种异常腐蚀 的碑文示意图;因此在通过开运算和闭运算对碑文图像进行处理时,需要保证原本字体的 完整性;开闭运算的组合运用对小面积的连通域影响较大,而对大面积的连通域影响较小, 则当大连通域的变化情况较小时说明对应的结构元处理是合适的,当大连通域变化较大时 说明对应的结构元处理不合适,影响了字体的完整性,因此利用新形态学结构元对大连通 域进行开闭运算处理,通过处理融合后图像可构建新的直方图并可得到大连通域的面积的 变化曲线;对比初始的面积直方图中大连通域的原始曲线,计算变化曲线与原始大面积连 通域的变化曲线的相似性判断结构元的合适度,即通过统计直方图拟合变化曲线,在变化 曲线上进行均匀采样,采样点的数量为
Figure DEST_PATH_IMAGE025
,实施者可自行设定;相似性为:
Figure DEST_PATH_IMAGE026
其中,
Figure DEST_PATH_IMAGE027
表示相似性;
Figure 734010DEST_PATH_IMAGE025
表示采样点数量;
Figure DEST_PATH_IMAGE028
表示第
Figure DEST_PATH_IMAGE029
个采样点在原始曲线的Y轴坐 标值;
Figure DEST_PATH_IMAGE030
表示第
Figure 739618DEST_PATH_IMAGE029
个采样点在变化曲线的Y轴坐标值。
相似性
Figure 733244DEST_PATH_IMAGE027
的值越趋近于0,说明对应的结构元越合适;本发明实施例设定经验阈值
Figure DEST_PATH_IMAGE031
,当相似性
Figure 99504DEST_PATH_IMAGE027
不大于经验阈值时,说明对应的结构元较为合适。
步骤S500,获取不同的形态学结构元处理后的合适度,合适度由相似性以及新噪声衰减率获取,合适度最小时的对应的形态学结构元为最优结构元,基于最优结构元对碑文图像进行处理得到修复图像。
当形态学结构元不断增大时,对不同大小的小连通域去除情况不同,随着开闭运算组合操作的次数增加,碑文图像中的小连通域不断减少,当减少到某一个程度时,噪声衰减率为0,此时噪声去除效果达到最好,但可能会导致图像中字体受到影响,因此在保证字体本身尽可能小的受到影响的情况下去除更多的噪声,此时的迭代次数为最优迭代次数;通过步骤S300和步骤S400中的开闭运算的组合操作得到不同结构元下对应的新噪声衰减率和相似性,则基于新噪声衰减率和相似性获取处理后的合适度为:
Figure DEST_PATH_IMAGE032
其中,
Figure DEST_PATH_IMAGE033
表示合适度;
Figure DEST_PATH_IMAGE034
表示新噪声衰减率;
Figure 388009DEST_PATH_IMAGE027
表示相似性。
合适度越小时,表明当前的迭代次数越佳,获取合适度
Figure 93797DEST_PATH_IMAGE033
最小时的迭代次数作为最 优迭代次数,此时合适度
Figure 992745DEST_PATH_IMAGE033
对应的形态学结构元为最优结构元。
将最优迭代次数下的处理图像与原图相减,得到多个孤立的连通域,该多个连通域即为对应的噪声,将相减后得到的噪声图像作为掩膜,噪声部位置为0,其他区域为1,与原图相乘,得到去除部分小连通域的去噪图像,最后选用最优迭代次数下的所用的最优结构元对去除噪声的碑文图像进行最终的开闭运算组合操作,修补字体中的空缺部分并去除字体边缘的毛刺,得到修复图像。
通过上述操作之后可以去除大部分的小噪声,但有部分小面积难以通过上述操作去除,由于部分字体本身存在点的笔画,会与部分较大的小面积混淆在一起,为了防止字体本身的点被去除,同时可以去除其他相对较大的小面积噪声的影响,故采用瓦片分割的方式将带有小点的字体分割处理,将对应的字体输入字体库与模板字体进行对比,若对应位置存在点,则说明该点为字体本身的笔画,若对应位置不存在,则说明该点为面积较大的小面积噪声点,需要进行去除,最终在碑文拓印图像上去除相应的孤立点即可,从而根据操作后的修复图像进行文字识别。
综上所述,本发明实施例通过对拓印完成后的碑文图像进行阈值分割得到对应的二值图像,基于二值图像得到图像中多个连通域,通过每个连通域的连通域面积构建面积直方图,进而基于面积直方图获取噪声阈值,通过噪声阈值将所有的连通域分为大连通域和小连通域,基于所有小连通域的连通域面积得到噪声程度;进一步的,对所有的小连通域进行形态学结构元运算进行融合得到多个新连通域,通过新连通域构建新直方图,结合噪声程度得到噪声衰减率;利用新形态学结构元对小连通域处理得到多个第二连通域,进而获取新噪声衰减率;进一步利用新形态学结构元对大连通域处理,以得到变化曲线,获取变化曲线与原始曲线的相似性,结合新噪声衰减率得到不同的形态学结构元处理后的合适度,基于合适度得到最优结构元,基于最优结构元对碑文图像进行处理得到修复图像,进而进行文字识别,排除了图像中噪声以及碑文缺陷的影响,对碑文图像进行增强,使得文字识别更加准确。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种用于文字识别的去噪增强方法,其特征在于,该方法包括以下步骤:
获取拓印完成后的碑文图像,对所述碑文图像进行阈值分割得到对应的二值图像;
获取所述二值图像中多个连通域,基于连通域中像素点的数量得到连通域面积;根据连通域的数量以及连通域面积构建面积直方图,基于所述面积直方图得到噪声阈值;获取连通域面积小于所述噪声阈值的连通域为小连通域,连通域面积大于所述噪声阈值的连通域为大连通域;根据所有小连通域的连通域面积得到噪声程度;
根据预设的形态学结构元将小连通域融合相连得到新连通域,基于所有大连通域和新连通域的数量及其对应的连通域面积构建新直方图,基于所述新直方图以及所述噪声程度获取噪声衰减率;
根据新形态学结构元将小连通域融合相连得到多个第二连通域,基于所有大连通域和第二连通域的数量获取新噪声衰减率;利用新形态学结构元对大连通域处理,以得到面积的变化曲线,获取大连通域的原始曲线与所述变化曲线之间的相似性;
获取不同的形态学结构元处理后的合适度,所述合适度由所述相似性以及所述新噪声衰减率获取,所述合适度最小时的对应的形态学结构元为最优结构元,基于最优结构元对碑文图像进行处理得到修复图像;
其中,所述基于所述面积直方图得到噪声阈值的步骤,包括:
基于所述面积直方图获取最大连通域面积和最小连通域面积,根据最大连通域面积和最小连通域面积获取噪声阈值,所述噪声阈值的计算为:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示噪声阈值;
Figure DEST_PATH_IMAGE004
表示最大连通域面积;
Figure DEST_PATH_IMAGE005
表示最小连通域面积;
Figure DEST_PATH_IMAGE006
表示自 然常数;
Figure DEST_PATH_IMAGE007
表示经验比例。
2.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述根据所有小连通域的连通域面积得到噪声程度的步骤,包括:
将所有小连通域的连通域面积进行求和得到第一面积,将碑文图像中所有连通域的连通域面积进行求和得到第二面积,所述第一面积与所述第二面积的比值为所述噪声程度。
3.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述根据预设的形态学结构元将小连通域融合相连得到新连通域的步骤,包括:
利用预设的形态学结构元对碑文图像进行开运算,对开运算处理后的图像进行闭运算,基于闭运算将存在关联的小连通域进行融合连接,融合连接后的小连通域为新连通域。
4.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述基于所述新直方图以及所述噪声程度获取噪声衰减率的步骤,包括:
将所述新直方图中连通域面积小于噪声阈值的连通域记为第二区域,获取所有第二区域的连通域面积的求和结果;
获取新直方图中所有连通域面积的求和得到第二求和结果,计算所述求和结果与所述第二求和结果的第二比值;
所述噪声程度与所述第二比值的差值为所述噪声衰减率。
5.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述获取大连通域的原始曲线与所述变化曲线之间的相似性的步骤,包括:
在所述变化曲线上进行均匀采样得到多个采样点,获取每个采样点在原始曲线中的Y轴坐标值以及每个采样点在变化曲线中的Y轴坐标值;
获取每个采样点对应的原始曲线中Y轴坐标值与变化曲线中的Y轴坐标值的差值,所有采样点的差值的均值为所述相似性。
6.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述获取不同的形态学结构元处理后的合适度的步骤,包括:
获取所述新噪声衰减率与所述相似性的求和的均值为所述合适度。
CN202211186525.XA 2022-09-28 2022-09-28 一种用于文字识别的去噪增强方法 Expired - Fee Related CN115331211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211186525.XA CN115331211B (zh) 2022-09-28 2022-09-28 一种用于文字识别的去噪增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211186525.XA CN115331211B (zh) 2022-09-28 2022-09-28 一种用于文字识别的去噪增强方法

Publications (2)

Publication Number Publication Date
CN115331211A CN115331211A (zh) 2022-11-11
CN115331211B true CN115331211B (zh) 2022-12-20

Family

ID=83914264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211186525.XA Expired - Fee Related CN115331211B (zh) 2022-09-28 2022-09-28 一种用于文字识别的去噪增强方法

Country Status (1)

Country Link
CN (1) CN115331211B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115497109B (zh) * 2022-11-17 2023-03-24 山东思玛特教育科技有限公司 基于智能翻译的文字图像预处理方法
CN118331430B (zh) * 2024-06-13 2024-10-01 深圳市中新云创科技有限公司 一种基于增强现实的跑步机全景体感运动系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5561524B2 (ja) * 2010-03-19 2014-07-30 ソニー株式会社 画像処理装置および方法、並びにプログラム
CN107085726A (zh) * 2017-01-04 2017-08-22 安阳师范学院 基于多方法去噪和连通区域分析的甲骨拓片单字定位方法
CN110309830B (zh) * 2019-06-04 2023-04-18 辽宁师范大学 基于数学形态学和区域连通性的甲骨文字自动分割方法

Also Published As

Publication number Publication date
CN115331211A (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
CN115331211B (zh) 一种用于文字识别的去噪增强方法
CN115345885B (zh) 一种金属健身器材外观质量检测方法
CN109816652B (zh) 一种基于灰度显著性的复杂铸件缺陷识别方法
WO2021212913A1 (zh) 一种图像分割方法、装置、设备及介质
CN110197153B (zh) 一种户型图中墙体自动识别方法
CN109426814B (zh) 一种发票图片特定板块的定位、识别方法、系统、设备
CN115294099B (zh) 一种钢板轧制过程发纹缺陷的检测方法及系统
CN110288566B (zh) 一种目标缺陷提取方法
CN105469027A (zh) 针对文档图像的水平和垂直线检测和移除
CN115880248B (zh) 一种表面划痕缺陷识别方法及视觉检测设备
CN109544577B (zh) 一种基于边缘点编组的改进直线提取方法
CN109544571A (zh) 一种基于数学形态学的金相图像边缘检测方法
CN111382745A (zh) 一种指甲图像分割方法、装置、设备和存储介质
CN114863492A (zh) 一种低质量指纹图像的修复方法及修复装置
CN114926387A (zh) 基于背景估计与边缘梯度抑制的焊缝缺陷检测方法及装置
CN109785356A (zh) 一种视频图像的背景建模方法
CN117911419A (zh) 中厚板转钢角度增强检测方法及装置、介质、设备
CN117132503A (zh) 一种图像局部高亮区域修复方法、系统、设备及存储介质
CN115619799B (zh) 一种基于迁移学习的晶粒图像分割方法及系统
CN112258449A (zh) 一种基于结节特征的快速结节匹配方法
CN112052859A (zh) 一种自由场景下的车牌精准定位方法及装置
CN109426770B (zh) 虹膜识别方法
CN116433978A (zh) 一种高质量瑕疵图像自动生成与自动标注方法及装置
CN113643290B (zh) 一种基于图像处理的吸管计数方法、装置及存储介质
CN116363097A (zh) 一种光伏板的缺陷检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20221220