CN117690139A - 一种基于纸质图书阅览电子化后的图像前处理方法及系统 - Google Patents
一种基于纸质图书阅览电子化后的图像前处理方法及系统 Download PDFInfo
- Publication number
- CN117690139A CN117690139A CN202311701989.4A CN202311701989A CN117690139A CN 117690139 A CN117690139 A CN 117690139A CN 202311701989 A CN202311701989 A CN 202311701989A CN 117690139 A CN117690139 A CN 117690139A
- Authority
- CN
- China
- Prior art keywords
- image
- corrected
- probability
- straight line
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000007781 pre-processing Methods 0.000 title claims abstract description 28
- 238000012937 correction Methods 0.000 claims abstract description 25
- 238000003702 image correction Methods 0.000 claims abstract description 16
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 33
- 238000012216 screening Methods 0.000 claims description 23
- 238000001514 detection method Methods 0.000 claims description 14
- 238000003708 edge detection Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 abstract description 4
- 230000009466 transformation Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 235000000434 Melocanna baccifera Nutrition 0.000 description 1
- 241001497770 Melocanna baccifera Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种基于纸质图书阅览电子化后的图像前处理方法及系统,首先通过预设的图像校正模板,确定哪些初始图像需要进行校正操作,然后通过待校正图像中的各个像素点的属性信息通过霍夫变换、贝叶斯定理等计算分析得到待校正图像的倾斜角度,通过计算待校正图像的倾斜角度;然后针对该倾斜角度对待校正图像进行校正操作从而得到校正后的图像,最后对校正后的图像进行优化处理得到优化后的图像,对校正后的图像进行进一步优化处理以确保最终得到的图像质量更高;能够高效地识别和校正文档扫描图像中的倾斜角度并进行校正操作,提高了文档扫描处理的效率和准确性。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种基于纸质图书阅览电子化后的图像前处理方法及系统。
背景技术
近年来,随着电子媒介的发展使得越来越多的纸质独本图书或者古书需要进行图像保存以及文字识别从而保障更好的实现文学研究。
在对现代印刷独本纸质图书或古籍古书资料等进行拍照扫描或打印机扫描时,经常会因为摄像头摆放位置或文本资料的放置倾斜,导致扫描得到的扫描文件倾斜,从而影响人们的查看;
现有的对于扫描到文件等信息的倾斜畸变校正主要依靠人工手动识别校正处理的方式,然而,受限于文件的倾斜程度、工作人员的校正处理速度、校正处理能力等因素的制约,在文件量特别大的时候,对扫描倾斜校正处理工作的全面性、准确率以及扫描效率无法得到保证;因此说上述问题存在导致无法保障后续扫描后的图像内容识别的准确。研究发现,通过图像处理技术进行纸质图书扫描后的文字识别,是一项复杂的任务,需要结合多种算法和技术手段来实现准确的文字识别。因此说前提是如何保障能够高效地识别和校正文档扫描图像中的倾斜角度,提高了文档处理的准确性是更为重要的因素;
发明内容
本发明的目的在于提供一种基于纸质图书阅览电子化后的图像前处理方法及系统,解决了现有技术中指出的上述技术问题。
本发明提供了一种基于纸质图书阅览电子化后的图像前处理方法,包括如下操作步骤:
获取多个初始图像;所述初始图像是文本扫描图像;
根据预设的图像校正模板确定所有所述初始图像中的待校正图像;
根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度;
根据所述倾斜角度对所述待校正图像进行校正操作,得到校正后的图像;
对所述校正后的图像进行优化处理,得到优化后的图像。
较佳的,所述像素点的属性信息包括像素点的亮度信息、像素点的坐标信息;所述图像信号包括所述待校正图像中的所有像素点及各像素点的属性信息。
较佳的,所述根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度,包括如下操作步骤:
遍历所有所述待校正图像,对所述待校正图像进行灰度化处理,得到灰度图像;
对所述灰度图像进行边缘检测,获取所述灰度图像对应的文本图像;
对所述文本图像进行直线检测,获取多条直线;
根据各个所述直线对应的字符信息进行筛选得到目标直线。
根据所述目标直线对应的斜率计算获取所述待校正图像对应的倾斜角度;
所述倾斜角度的计算方式为:
倾斜角度=arctan(目标直线的斜率)。
较佳的,所述字符信息包括字符坐标信息和字符本体信息。
较佳的,所述根据各个所述直线对应的字符信息进行筛选得到目标直线,包括如下操作步骤:
将各条所述直线对应的字符本体信息根据各字符本体信息对应的字符坐标信息进行排序,得到当前直线的字符序列集;
遍历各个所述字符序列集,获取所述字符序列集对应的字符本体形成的语句信息及多个相邻字符组成的字符组;将所述字符组通过二进制编码得到第一编码;
建立语料库;所述语料库包括多个字符、两个或多个字符互相组成的词汇以及各个词汇对应的第二编码;
根据所述第一编码与所述第二编码的对比结果筛选获取目标直线。
较佳的,所述第二编码指的是词汇通过二进制编码操作得到的;所述对比结果包括对比成功结果。
较佳的,所述根据所述第一编码与所述第二编码的对比结果筛选获取目标直线,包括如下操作步骤:
获取各个直线上对应的字符组的个数n以及各直线上对比成功结果的个数m;
根据所述字符组的个数n及所述对比成功结果的个数m计算获取各直线上字符组对比成功结果的第一概率E;
所述直线上字符组对比成功结果的第一概率E的计算方式为:
根据所述第一概率E获取各个所述直线属于目标直线的第二概率R;
根据所述字符组对比成功结果的第一概率E及所述第二概率R计算获取各个所述直线属于目标直线的第三概率T;
所述第三概率T的计算方式为:
将所述第三概率T进行排序得到第三概率序列集;选择所述第三概率序列集中排序靠前的i个概率对应的直线并确定为待选目标直线,判断所述待选目标直线处于平行状态的个数是否大于预设的平行判断阈值,若是,则确定所述待选目标直线中处于平行状态的直线为目标直线。
较佳的,所述第一概率E与所述第二概率R成正比。
较佳的,所述将所述第三概率T进行排序得到第三概率序列集,包括如下操作步骤:
确定置信度阈值U;
遍历所有所述第三概率T,判断所述第三概率T是否大于或等于所述置信度U;若是,则建立第三概率集合,并将所述第三概率T放入所述第三概率集合;若否,则将所述第三概率T筛除;
将所述第三概率集合中所有所述第三概率T从大到小排序,得到第三概率序列集。
相应的,本发明还提供了一种系统,所述系统包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线系统相连,所述网络接口用于与至少一个软件应用服务终端通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行上述一种基于纸质图书阅览电子化后的图像前处理方法。
与现有技术相比,本发明实施例至少存在如下方面的技术优势:
分析本发明提供的上述一种基于纸质图书阅览电子化后的图像前处理方法及系统可知,在具体应用时首先将多个初始图像通过图像校正模板筛选得到待校正图像,通过预设的图像校正模板,确定哪些初始图像需要进行校正操作,从而减少对所有图像的处理,提高效率;
然后通过待校正图像中的各个像素点的属性信息进行分析得到待校正图像的倾斜角度,通过计算待校正图像的倾斜角度,为后续的校正操作提供具体的校正参数;然后针对该倾斜角度对待校正图像进行校正操作从而得到校正后的图像,最后对校正后的图像进行优化处理得到优化后的图像,对校正后的图像进行进一步优化处理,可能包括去除噪点、增强对比度等,以确保最终得到的图像质量更高;
利用上述前处理方法能够高效地识别和校正文档扫描图像中的倾斜角度,提高了文档处理的效率和准确性;同时,通过优化处理,能够得到质量更高的图像,使扫描文本角度端正,并且在扫描文本量特别大的时候,提高对扫描倾斜校正处理工作的全面性、准确率,并可提高扫描效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法的操作步骤示意图;
图2为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法中根据倾斜角度对待校正图像进行校正得到校正后的图像的操作模拟示意图;
图3为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法中获取倾斜角度的操作步骤示意图;
图4为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法中筛选得到目标直线的操作步骤示意图;
图5为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法中霍夫变换得到直线的模拟示意图;
图6为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法中筛选获取目标直线的操作步骤示意图;
图7为本发明实施例一种基于纸质图书阅览电子化后的图像前处理方法中排序得到第三概率序列集的操作步骤示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面通过具体的实施例并结合附图对本发明做进一步的详细描述。
如图1所示,相应地,本发明还提出了一种基于纸质图书阅览电子化后的图像前处理方法,包括如下操作步骤:
S10:获取多个初始图像;所述初始图像是通过拍照扫描或机器扫描纸质图书文件、古书资料文件等获取得到的文本扫描图像;上述古书资料文件甚至可以不是纸质的文件,也可以是其他古书籍用的布质的文件等;
S20:根据预设的图像校正模板确定所有所述初始图像中的待校正图像;
上述图像校正模板是预设的固定比例大小的用于与初始图像进行对比确定初始图像是否需要进行校正的、背景像素值为0的图像模板;上述本申请实施例将每一张初始图像放入图像校正模板后对初始图像进行等比例缩放操作之后,得到缩放后的初始图像,再进行判断缩放后的初始图像是否与图像校正模板是否完全重合;
若判断得到缩放后的初始图像与图像校正模板完全重合,则确定该初始图像扫描端正,则该初始图像不需要进行校正处理,则进一步将该初始图像放置不再进行下一步处理;若判断该缩放后的初始图像与图像校正模板不是完全重合的,则确定该初始图像扫描过程中发生倾斜,则该初始图像需要进行校正处理,并确定该初始图像为待校正图像,并进行下一步的校正处理操作。
S30:根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度;所述像素点的属性信息包括像素点的亮度信息、像素点的坐标信息;所述图像信号包括所述待校正图像中的所有像素点及各像素点的属性信息;
S40:根据所述倾斜角度对所述待校正图像进行校正操作,得到校正后的图像;
需要说明的是,上述本申请实施例是针对各个待校正图像的倾斜角度进行逆旋转操作之后,得到校正后的图像,举例说明:如图2所示,识别得到当前待校正图像的倾斜角度为向右倾斜a°,则对该待校正图像执行逆旋转a°的操作,从而得到校正后的图像。
S50:对所述校正后的图像进行优化处理,得到优化后的图像;
需要说明的是,上述优化处理包括清晰度增强、色彩平衡调整、对比度调整、亮度增强、锐度调整、平滑处理、降噪处理、细节增强等图像优化处理操作,以提高校正后的图像的表现力,从而得到更加清晰且完整的校正后的图像(即上述优化后的图像)。
上述本申请实施例首先将多个初始图像通过图像校正模板筛选得到待校正图像,通过预设的图像校正模板,确定哪些初始图像需要进行校正操作,从而减少对所有图像的处理,提高效率;然后通过待校正图像中的各个像素点的属性信息进行分析得到待校正图像的倾斜角度,通过计算待校正图像的倾斜角度,为后续的校正操作提供具体的校正参数;然后针对该倾斜角度对待校正图像进行校正操作从而得到校正后的图像,最后对校正后的图像进行优化处理得到优化后的图像,对校正后的图像进行进一步优化处理,可能包括去除噪点、增强对比度等,以确保最终得到的图像质量更高;
利用上述前处理方法能够高效地识别和校正文档扫描图像中的倾斜角度,提高了文档处理的效率和准确性;同时,通过优化处理,能够得到质量更高的图像,使扫描文本角度端正,并且在扫描文本量特别大的时候,提高对扫描倾斜校正处理工作的全面性、准确率,并可提高扫描效率。
本发明实施例认为上述S10-S50的执行过程中,其S30中具体如何根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度是至关重要的操作处理过程;尤其是如何高效率精准的识别图像倾斜角度很重要;
具体地,如图3所示,在S30中,根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度,包括如下操作步骤:
S31:遍历所有所述待校正图像,对所述待校正图像进行灰度化处理,得到灰度图像;
上述本申请实施例将扫描到的待校正的文本图像进行灰度化处理,得到的是一张倾斜的灰度图像,灰度化处理可以去除原始待校正图像中的大量噪声,从而减少了后续边缘检测并进行直线检测带了的误差影响,从而提高检测效率,进而提高后续操作中得到的倾斜角度的精准度。
S32:对所述灰度图像进行边缘检测,获取所述灰度图像对应的文本图像(具体边缘检测算法是通过识别灰度图像中的文字边缘像素点就可以得到一个整体大片区域的含有文字的文本图像;所以说,文本图像是灰度图像过滤剪裁处理后的一种待处理图像);
需要说明的是,通过边缘检测算法获取文本图像,以便后续的直线检测操作;边缘检测可以帮助确定图像中文字的轮廓和位置,为后续直线检测提供准确的输入。
S33:对所述文本图像进行直线检测,获取多条直线;
较佳的,上述本申请中的直线检测操作,可使用霍夫变换操作进行直线检测,从而得到文本图像的多条直线;
在本申请实施例中,上述霍夫变换操作是一种粗略的直线检测,即第一次直线检测,是通过对文本图像中的每个点转换为一个参数空间,其中参数表示直线的斜率和截距,然后在参数空间中找到最强的峰值,这些峰值对应于图像中最可能的直线;但是,在字符间距与文本行间距相等时,扫描到的文本图像中的各个字符会呈阵列排布,这样的话,通过霍夫变换操作检测得到的直线可能存在平行于文本信息或者垂直于文本信息或者倾斜于文本信息的,但本申请是为了得到待检测图像即扫描到的文本图像的倾斜角,因此,还需要对得到的多条直线进行二次检测,从而得到平行于文本信息的目标直线;对文本图像进行直线检测,获取多条直线;通过霍夫变换等操作,可以初步得到文本图像中的多条直线,为后续的倾斜角度计算提供基础数据。
S34:根据各个所述直线对应的字符信息(直线上对应的字符具体是指,利用上述霍夫变换操作得到的当前直线然后穿插文本行后得到字符)进行筛选得到目标直线;其中,所述字符信息包括字符坐标信息和字符本体信息。
需要说明的是,上述本申请实施例根据各直线对应的字符信息进行筛选,得到最终的目标直线,这一步能够排除一些不相关的直线,确保后续倾斜角度计算的准确性。
S35:根据所述目标直线对应的斜率计算获取所述待校正图像对应的倾斜角度;
所述倾斜角度的计算方式为:
倾斜角度=arctan(目标直线的斜率)。
需要说明的是,上述本申请实施例能够从扫描到的文本图像中准确地计算出倾斜角度,同时降低了噪声的影响,增加了检测的精准度和准确性,这使得后续的校正操作能够更加有效地进行,提高了整体的处理效率和结果的准确性。
具体地,如图4所示,在S34中,根据各个所述直线对应的字符信息进行筛选得到目标直线,包括如下操作步骤:
S341:获取各个所述直线对应的字符信息;在对每一个直线进行创建字符序列集时,将当前直线的文本行上的各字符本体根据各自字符本体对应字符坐标进行排序,得到当前直线的字符序列集;汇集各直线对应的字符序列集;
需要说明的是,上述本申请中获取字符信息可使用光学字符识别算法(OCR)识别得到各个直线对应的字符信息,从而对各直线上的各个字符信息进行统计,得到各个直线上的字符序列集,举例说明:如图5所示,为扫描到的文本图像,并通过霍夫变换得到21条直线,分别表示为L1、L2、L3……L21,经过获取直线对应的字符信息,从而得到如下多个字符序列集:L1={“白”,“日”,“依”,“山”,“尽”};L2={“黄”,“河”,“入”,“海”,“流”};L3={“欲”,“穷”,“千”,“里”,“目”};……;L21={“层”,“目”};其中,因为扫描识别各字符信息,但不对各字符信息进行语义分析处理,因此,其中的字符序列集可因各端点坐标而反向得到,例如,直线L1对应的字符序列集还可能是L1={“尽”,“山”,“依”,“日”,“白”};因此说,将当前直线的文本行上的各字符本体根据各自字符本体对应字符坐标进行排序,得到当前直线的字符序列集操作时,一条直线会创建得到两个字符序列集。
S342:遍历各个所述字符序列集,获取所述字符序列集对应的字符本体形成的语句信息及多个相邻字符组成的字符组;将所述字符组通过二进制编码得到第一编码;
需要说明的是,上述本申请将各个字符序列集组成的语句信息及各个字符序列集中相邻字符组成的字符组进行综合分析,从而更加精准地筛选得到目标直线;上述一个文本行上多个字符本体形成的语句信息举例为:“白日依山尽”为一个语句信息、“黄河入海流”为一个语句信息、“尽流目楼”为一个语句信息、“楼层一上更”为一个语句信息等;上述字符组指的是相邻两个或多个字符构成的词汇,举例为:“白日”、“日依山”、“目里千”、“层里海”等;
上述二进制编码是一种将字符转换为二进制数字序列的方式,通常使用ASCII编码或Unicode编码;
S343:建立语料库;所述语料库包括多个字符、两个或多个字符互相组成的词汇以及各个词汇对应的第二编码;所述第二编码指的是各个词汇通过二进制编码得到的编码信息;
需要说明的是,上述本申请实施例中的语料库是根据网络爬虫或者使用词典得到的多个字符,上述词汇是通过将各个字符进行组合之后得到具有实际意义的词汇,比如“第一”、“编码”、“信息”等,而“码信”、“际意”等无实际意义的组合得到的词汇便不会在语料库中出现;通过将各个词汇进行二进制编码得到第二进制编码可以直接以第一编码进行对比,从而更加快速的识别第一编码对应的各个字符组是否具有实际意义,进一步可以更加快速方便的识别第一编码对应的语句信息是否为文本扫描文件上的正向排列行上的语句信息;上述正向排列行指的是文本扫描件中的内容排布行,比如在上述举例中“白日依山尽”就是正向排列行,而“尽山依日白”就是反向排列行,同时“尽海千上”与白“白河千层”就是斜向排列行;从而进一步的可快速简单识别得到与文本行平行的目标直线。
S344:根据所述第一编码与所述第二编码的对比结果筛选获取目标直线;所述对比结果包括对比成功结果;
需要说明的是,上述本实施例将第一编码与第二编码进行对比,得到对比结果,在第一编码与第二编码中任意一个对比完全相同时,则证明对比成功(即上述对比成功结果),上述对比成功结果可用于对各字符信息组合构建得到的语句信息进行判断其是否为正向排列行,即在一个语句信息上多个字符信息皆为对比成功结果,则证明该语句信心极有可能是正向排列行,也即该语句信息所处在的直线极有可能是目标直线,判断其是否为目标直线,还需要进一步的分析判断操作,具体操作如下述S3441-S3445所示。
上述本申请实施例首先通过OCR算法识别各个直线上的字符,然后将各个字符根据各个字符的坐标信息将各个字符进行排列得到各直线上的字符序列集;进一步根据各字符序列集得到语句信息以及字符序列集中相邻两个或多个字符构成的字符组,将字符组进行二进制编码操作后得到多个第一二进制编码,进而通过合预设的语料库中的词汇的第二二进制编码进行对比,从而得到对比成功的多个第一二进制编码,此时,对比成功意味着当前第一二进制编码对应的字符组具有实际意义,为下述进一步地筛选得到目标直线提供必要的支持。
具体地,如图6所示,在S344中,根据所述第一编码与所述第二编码的对比结果筛选获取目标直线,包括如下操作步骤:
S3441:获取各个直线上对应的字符组的个数n以及各直线上对比成功结果的个数m;
S3442:根据所述字符组的个数n及所述对比成功结果的个数m计算获取各直线上字符组对比成功结果的第一概率E(所述第一概率实际上指的是比例,即一条直线上对比成功结果个数在该直线上所有字符组中所占的比例);
所述直线上字符组对比成功结果的第一概率E的计算方式为:
S3443:根据所述第一概率E获取各个所述直线属于目标直线的第二概率R;
所述第一概率E与所述第二概率R成正比,即在一条直线上,其字符组对比成功结果所占的比例(第一概率E)越高,则其更有可能属于目标直线,因此其第二概率R越高;
S3444:根据所述字符组对比成功结果的第一概率E及所述第二概率R计算获取各个所述直线属于目标直线的第三概率T;
所述第三概率T的计算方式为:
S3445:将所述第三概率T进行排序得到第三概率序列集;选择所述第三概率序列集中排序靠前的i个概率对应的直线并确定为待选目标直线,判断所述待选目标直线处于平行状态的个数是否大于预设的平行判断阈值,若是,则确定所述待选目标直线中处于平行状态的直线为目标直线。
需要说明的是,上述本申请实施例首先通过各直线的字符组个数及对比成功结果个数来计算对比成功结果的比例,进一步通过这个比例来确定第二概率R的数值;接着通过第一概率E和第二概率R来计算该直线属于目标直线的第三概率T,根据贝叶斯定理来确定该直线是否属于目标直线,即利用先验概率(第一概率E)来计算后验概率(第二概率R)的真实程度(第三概率T);帮助技术人员在已知的一些先验信息的情况下根据新的证据来计算更准确的信息,从而更加准确的筛选得到目标直线。
具体地,如图7所示,在S3445中,将所述第三概率T进行排序得到第三概率序列集,包括如下操作步骤:
S34451:确定置信度阈值U;
S34452:遍历所有所述第三概率T,判断所述第三概率T是否大于或等于所述置信度U;若是,则建立第三概率集合,并将所述第三概率T放入所述第三概率集合;若否,则将所述第三概率T筛除;
S34453:将所述第三概率集合中所有所述第三概率T从大到小排序,得到第三概率序列集。
需要说明的是,上述本申请实施例设定的置信度阈值可以是60%,其可以筛选出去第三概率T较低对应的一些直线,从而减少后续服务器筛选计算的数据压力,从而提高服务器运行速度。
综上所述,本发明实例提出的一种基于纸质图书阅览电子化后的图像前处理方法及系统可知,在具体应用时首先将多个初始图像通过图像校正模板筛选得到待校正图像,通过预设的图像校正模板,确定哪些初始图像需要进行校正操作,从而减少对所有图像的处理,提高效率;然后通过待校正图像中的各个像素点的属性信息进行分析得到待校正图像的倾斜角度,能够从扫描到的文本图像中准确地计算出倾斜角度,同时通过灰度化和边缘检测操作降低了噪声的影响,增加了检测的精准度和准确性,这使得后续的校正操作能够更加有效地进行,提高了整体的处理效率和结果的准确性;
在进一步地技术方案中,通过OCR算法识别各个直线上的字符,然后将各个字符根据各个字符的坐标信息将各个字符进行排列得到各直线上的字符序列集;进一步根据各字符序列集得到语句信息以及字符序列集中相邻两个或多个字符构成的字符组,将字符组进行二进制编码操作后得到多个第一二进制编码,进而通过合预设的语料库中的词汇的第二二进制编码进行对比,从而得到对比成功的多个第一二进制编码,此时,对比成功意味着当前第一二进制编码对应的字符组具有实际意义,为下述进一步地筛选得到目标直线提供必要的支持;
再通过贝叶斯定理帮助技术人员在已知的一些先验信息的情况下根据新的证据来计算更准确的信息,从而更加准确的筛选得到目标直线;并且通过预设的置信度阈值筛除出去部分第三概率较低的直线,从而提高服务器运行速度;从而最终可以更加快速准确的识别目标直线,并得到目标直线的倾斜角度(即待校正图像的倾斜角度);
通过计算待校正图像的倾斜角度,为后续的校正操作提供具体的校正参数;然后针对该倾斜角度对待校正图像进行校正操作从而得到校正后的图像,最后对校正后的图像进行优化处理得到优化后的图像,对校正后的图像进行进一步优化处理,可能包括去除噪点、增强对比度等,以确保最终得到的图像质量更高;能够高效地识别和校正文档扫描图像中的倾斜角度,提高了文档处理的效率和准确性;
同时,通过优化处理,能够得到质量更高的图像,使扫描文本角度端正,并且在扫描文本量特别大的时候,提高对扫描倾斜校正处理工作的全面性、准确率,并可提高扫描效率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;本领域的普通技术人员可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,包括如下操作步骤:
获取多个初始图像;所述初始图像是文本扫描图像;
根据预设的图像校正模板确定所有所述初始图像中的待校正图像;
根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度;
根据所述倾斜角度对所述待校正图像进行校正操作,得到校正后的图像;
对所述校正后的图像进行优化处理,得到优化后的图像。
2.根据权利要求1所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述像素点的属性信息包括像素点的亮度信息、像素点的坐标信息;所述图像信号包括所述待校正图像中的所有像素点及各像素点的属性信息。
3.根据权利要求2所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度,包括如下操作步骤:
遍历所有所述待校正图像,对所述待校正图像进行灰度化处理,得到灰度图像;
对所述灰度图像进行边缘检测,获取所述灰度图像对应的文本图像;
对所述文本图像进行直线检测,获取多条直线;
根据各个所述直线对应的字符信息进行筛选得到目标直线;
根据所述目标直线对应的斜率计算获取所述待校正图像对应的倾斜角度;
所述倾斜角度的计算方式为:
倾斜角度=arctan(目标直线的斜率)。
4.根据权利要求3所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述字符信息包括字符坐标信息和字符本体信息。
5.根据权利要求4所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述根据各个所述直线对应的字符信息进行筛选得到目标直线,包括如下操作步骤:
将各条所述直线对应的字符本体信息根据各字符本体信息对应的字符坐标信息进行排序,得到当前直线的字符序列集;
遍历各个所述字符序列集,获取所述字符序列集对应的字符本体形成的语句信息及多个相邻字符组成的字符组;将所述字符组通过二进制编码得到第一编码;
建立语料库;所述语料库包括多个字符、两个或多个字符互相组成的词汇以及各个词汇对应的第二编码;
根据所述第一编码与所述第二编码的对比结果筛选获取目标直线。
6.根据权利要求5所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述第二编码指的是词汇通过二进制编码操作得到的;所述对比结果包括对比成功结果。
7.根据权利要求6所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述根据所述第一编码与所述第二编码的对比结果筛选获取目标直线,包括如下操作步骤:
获取各个直线上对应的字符组的个数n以及各直线上对比成功结果的个数m;
根据所述字符组的个数n及所述对比成功结果的个数m计算获取各直线上字符组对比成功结果的第一概率E;
所述直线上字符组对比成功结果的第一概率E的计算方式为:
根据所述第一概率E获取各个所述直线属于目标直线的第二概率R;
根据所述字符组对比成功结果的第一概率E及所述第二概率R计算获取各个所述直线属于目标直线的第三概率T;
所述第三概率T的计算方式为:
将所述第三概率T进行排序得到第三概率序列集;选择所述第三概率序列集中排序靠前的i个概率对应的直线并确定为待选目标直线,判断所述待选目标直线处于平行状态的个数是否大于预设的平行判断阈值,若是,则确定所述待选目标直线中处于平行状态的直线为目标直线。
8.根据权利要求7所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述第一概率E与所述第二概率R成正比。
9.根据权利要求8所述的一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,所述将所述第三概率T进行排序得到第三概率序列集,包括如下操作步骤:
确定置信度阈值U;
遍历所有所述第三概率T,判断所述第三概率T是否大于或等于所述置信度U;若是,则建立第三概率集合,并将所述第三概率T放入所述第三概率集合;若否,则将所述第三概率T筛除;
将所述第三概率集合中所有所述第三概率T从大到小排序,得到第三概率序列集。
10.一种系统,所述系统包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线系统相连,所述网络接口用于与至少一个软件应用服务终端通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行上述权利要求1-9任一项所述的一种基于纸质图书阅览电子化后的图像前处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311701989.4A CN117690139B (zh) | 2023-12-12 | 2023-12-12 | 一种基于纸质图书阅览电子化后的图像前处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311701989.4A CN117690139B (zh) | 2023-12-12 | 2023-12-12 | 一种基于纸质图书阅览电子化后的图像前处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117690139A true CN117690139A (zh) | 2024-03-12 |
CN117690139B CN117690139B (zh) | 2024-06-18 |
Family
ID=90136596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311701989.4A Active CN117690139B (zh) | 2023-12-12 | 2023-12-12 | 一种基于纸质图书阅览电子化后的图像前处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117690139B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105761219A (zh) * | 2016-02-03 | 2016-07-13 | 北京云江科技有限公司 | 文本图像倾斜矫正方法和系统 |
CN106447615A (zh) * | 2016-08-02 | 2017-02-22 | 浪潮软件股份有限公司 | 一种扫描文档图像的倾斜校正方法 |
WO2019056346A1 (zh) * | 2017-09-25 | 2019-03-28 | 深圳传音通讯有限公司 | 一种利用膨胀法校正文本图像倾斜的方法及装置 |
CN110188747A (zh) * | 2019-04-28 | 2019-08-30 | 广州华多网络科技有限公司 | 一种文本图像的倾斜校正方法、装置以及图像处理设备 |
CN111553344A (zh) * | 2020-04-17 | 2020-08-18 | 携程旅游信息技术(上海)有限公司 | 文本图像的倾斜校正方法、系统、设备和存储介质 |
CN112800824A (zh) * | 2020-12-08 | 2021-05-14 | 北京方正印捷数码技术有限公司 | 扫描文件的处理方法、装置、设备及存储介质 |
CN115100660A (zh) * | 2022-06-27 | 2022-09-23 | 平安银行股份有限公司 | 文档图像的倾斜校正方法及装置 |
CN116416624A (zh) * | 2022-10-09 | 2023-07-11 | 《河南科学》杂志社 | 一种基于版面校正的文档电子化方法、装置以及存储介质 |
-
2023
- 2023-12-12 CN CN202311701989.4A patent/CN117690139B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105761219A (zh) * | 2016-02-03 | 2016-07-13 | 北京云江科技有限公司 | 文本图像倾斜矫正方法和系统 |
CN106447615A (zh) * | 2016-08-02 | 2017-02-22 | 浪潮软件股份有限公司 | 一种扫描文档图像的倾斜校正方法 |
WO2019056346A1 (zh) * | 2017-09-25 | 2019-03-28 | 深圳传音通讯有限公司 | 一种利用膨胀法校正文本图像倾斜的方法及装置 |
CN110188747A (zh) * | 2019-04-28 | 2019-08-30 | 广州华多网络科技有限公司 | 一种文本图像的倾斜校正方法、装置以及图像处理设备 |
CN111553344A (zh) * | 2020-04-17 | 2020-08-18 | 携程旅游信息技术(上海)有限公司 | 文本图像的倾斜校正方法、系统、设备和存储介质 |
CN112800824A (zh) * | 2020-12-08 | 2021-05-14 | 北京方正印捷数码技术有限公司 | 扫描文件的处理方法、装置、设备及存储介质 |
CN115100660A (zh) * | 2022-06-27 | 2022-09-23 | 平安银行股份有限公司 | 文档图像的倾斜校正方法及装置 |
CN116416624A (zh) * | 2022-10-09 | 2023-07-11 | 《河南科学》杂志社 | 一种基于版面校正的文档电子化方法、装置以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117690139B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241894B (zh) | 一种基于表格定位和深度学习的票据内容识别系统和方法 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
CN109086714A (zh) | 表格识别方法、识别系统及计算机装置 | |
CN110569769A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN105760901B (zh) | 一种多语种倾斜文档图像的自动语言判别方法 | |
CN116071763B (zh) | 基于文字识别的教辅图书智能校编系统 | |
CN113139457A (zh) | 一种基于crnn的图片表格提取方法 | |
CN112364834A (zh) | 一种基于深度学习和图像处理的表格识别的还原方法 | |
CN109948621B (zh) | 一种基于图片验证码的图像处理与字符分割方法 | |
CN110490185A (zh) | 一种基于多次对比矫正ocr名片信息识别改进方法 | |
CN113065396A (zh) | 基于深度学习的扫描档案图像的自动化归档处理系统及方法 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN115273108B (zh) | 一种人工智能识别自动归集方法及系统 | |
CN112733828A (zh) | 一种进行字符识别的方法及系统 | |
CN116704523A (zh) | 一种用于出版印刷设备的文字排版图像识别系统 | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
CN114005127A (zh) | 一种基于深度学习的图像光学文字识别方法,存储装置及服务器 | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
CN107609482B (zh) | 一种基于汉字笔画特征的中文文本图像倒置判别方法 | |
CN117690139B (zh) | 一种基于纸质图书阅览电子化后的图像前处理方法及系统 | |
CN117333893A (zh) | 基于ocr的自定义模板图像识别方法、系统及存储介质 | |
CN113627442A (zh) | 医疗信息的录入方法、装置、设备及存储介质 | |
CN114038000A (zh) | 一种图像表格的结构化方法、系统和电子设备 | |
Jibril et al. | Recognition of Amharic braille documents | |
Liang et al. | Efficient algorithms for segmentation and recognition of printed characters in document processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |