CN113420762A - 一种图像处理方法、系统、电子设备及存储介质 - Google Patents
一种图像处理方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113420762A CN113420762A CN202110749142.8A CN202110749142A CN113420762A CN 113420762 A CN113420762 A CN 113420762A CN 202110749142 A CN202110749142 A CN 202110749142A CN 113420762 A CN113420762 A CN 113420762A
- Authority
- CN
- China
- Prior art keywords
- image
- rotation angle
- text line
- target
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 37
- 238000001514 detection method Methods 0.000 claims description 36
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000003702 image correction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Abstract
本发明公开了一种图像处理方法、系统、电子设备及存储介质,将获取到的目标文本行进行第一计算,得到目标文本行的初始旋转角度和面积,将初始旋转角度转换为第一顺时针方向旋转角度并计算方差,若方差小于第二预设阈值,对面积和初始旋转角度进行计算得到第二顺时针旋转角度并对原始图像进行旋转,若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像并输出。通过上述方案,可对任意角度倾斜的有边界图像进行旋转矫正,也可对任意角度倾斜的无边界图像进行旋转矫正,从而提高对倾斜图像进行矫正的灵活性。此外,通过对处于倒立状态的图像进行二次旋转,提高识别图像中文本倒立的精准度。
Description
技术领域
本发明涉及图像处理技术领域,更具体地说,涉及一种图像处理方法、系统、电子设备及存储介质。
背景技术
在文字识别中,不可避免会出现图像倾斜、图像文字竖排或者图像倒立等现象,而倾斜、竖直和倒立图片中的文字会对文字识别的精度带来干扰。为了保证文字识别的精度以及后续处理的正确性,对文本图像进行检测和矫正是非常必要的。
现有的图像矫正方法包括图像边界的矫正方法和文本行矫正方法。图像边界的矫正方法主要是基于分割的理论,通过计算得到图像中四个角点的位置坐标,使用仿射变换将图像矫正。但是这种方法受制于图像的边界信息,对于一些没有边界场景的图像,比如文档图片,就无法进行矫正。文本行矫正方法是通过计算图片中每个文本行的角度值,选取一些较长文本行的平均角度作为矫正角度对整张图片做矫正。但是这种方法只能完成小角度倾斜图片的矫正,对于倾斜角度比较大的图片,比如竖排图片中文字,由于受到文字阅读方向歧义的干扰,旋转后图像中的文字可能是倒立的,无法实现矫正。因此对于大角度倾斜的图片,文本行矫方法无法完成矫正。
因此,现有的图像矫正方法的灵活性低。
发明内容
有鉴于此,本发明公开了一种图像处理方法、系统、电子设备及存储介质,可对任意角度倾斜的有边界图像进行旋转矫正,也可对任意角度倾斜的无边界图像进行旋转矫正,从而提高对倾斜图像进行矫正的灵活性。此外,对处于倒立状态的图像进行二次旋转,提高识别图像中文本倒立的精准度。
为了实现上述目的,其公开的技术方案如下:
本发明第一方面公开了一种图像处理方法,所述方法包括:
获取原始图像中的各个文本行,并从所述各个文本行中选取长宽比大于第一预设阈值的目标文本行;
对所述目标文本行进行第一计算,得到所述目标文本行的初始旋转角度和面积,所述初始旋转角度包括多个无固定方向的旋转角度;
基于预设角度转换规则,将所述初始旋转角度转换为第一顺时针方向旋转角度,并计算所述第一顺时针方向旋转角度的方差;
若所述方差小于第二预设阈值,将所述面积和所述初始旋转角度进行第二计算,得到第二顺时针旋转角度;
基于所述第二顺时针旋转角度对所述原始图像进行旋转;
若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像;
输出所述目标图像。
优选的,所述对所述目标文本行进行第一计算,得到所述目标文本行对应的初始旋转角和面积,包括:
基于预设的文字检测规则,提取所述目标文本行的四点位置坐标信息;
通过预设的四点位置算法,对所述四点位置坐标信息进行计算,得到所述目标文本行的初始旋转角;
获取所述目标文本的长宽比,基于所述目标文本行的长宽比,确定所述目标文本行对应的面积。
优选的,所述若所述方差小于第二预设阈值,将所述面积和所述初始旋转角度进行第二计算,得到第二顺时针旋转角度,包括:
若所述方差小于第二预设阈值,确定所述面积为权重值,并将所述权重值与所述目标文本行的初始旋转角度进行加权平均运算,得到均值;
确定所述均值为第二顺时针旋转角度。
优选的,所述若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像,包括:
将旋转后的图像输入至预先训练的倒立检测模型进行识别,得到识别结果,所述识别结果包括正立结果和倒立结果;
若所述旋转后的图像的识别结果为所述倒立结果,确定旋转后的图像处于倒立状态;
基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像。
优选的,还包括:
若所述旋转后的图像的识别结果为所述正立结果,确定旋转后的图像处于非倒立状态;
确定所述处于非倒立状态的图像为目标图像并输出。
优选的,还包括:
若所述方差大于等于第二预设阈值,不执行图像旋转操作。
优选的,在所述若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像之后,所述输出所述目标图像之前,还包括:
对所述目标图像进行文字检测操作。
本发明第二方面公开了一种图像处理系统,所述系统包括:
获取单元,用于获取原始图像中的各个文本行,并从所述各个文本行中选取长宽比大于第一预设阈值的目标文本行;
第一计算单元,用于对所述目标文本行进行第一计算,得到所述目标文本行的初始旋转角度和面积,所述初始旋转角度包括多个无固定方向的旋转角度;
转换单元,用于基于预设角度转换规则,将所述初始旋转角度转换为第一顺时针方向旋转角度,并计算所述第一顺时针方向旋转角度的方差;
第二计算单元,用于若所述方差小于第二预设阈值,将所述面积和所述初始旋转角度进行第二计算,得到第二顺时针旋转角度;
第一旋转单元,用于基于所述第二顺时针旋转角度对所述原始图像进行旋转;
第二旋转单元,用于若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像;
输出单元,用于输出所述目标图像。
本发明第三方面公开了一种电子设备,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算程序,具体用于实现如第一方面任意一项所述的图像处理方法。
本发明第四方面公开了一种存储介质,所述存储介质包括存储指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如第一方面任意一项所述的图像处理方法。
经由上述技术方案可知,获取原始图像中的各个文本行,并从各个文本行中选取长宽比大于第一预设阈值的目标文本行,对目标文本行进行第一计算,得到目标文本行的初始旋转角度和面积,初始旋转角度包括多个无固定方向的旋转角度,基于预设角度转换规则,将初始旋转角度转换为第一顺时针方向旋转角度,并计算第一顺时针方向旋转角度的方差,若方差小于第二预设阈值,将面积和初始旋转角度进行第二计算,得到第二顺时针旋转角度,基于第二顺时针旋转角度对原始图像进行旋转,若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像,输出目标图像。通过上述方案,可对任意角度倾斜的有边界图像进行旋转矫正,也可对任意角度倾斜的无边界图像进行旋转矫正,从而提高对倾斜图像进行矫正的灵活性。此外,通过对处于倒立状态的图像进行二次旋转,提高识别图像中文本倒立的精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种图像处理方法的流程示意图;
图2为本发明实施例公开的无边界图像的检测示意图;
图3为本发明实施例公开的有边界图像的检测示意图;
图4为本发明实施例公开的预设角度转换规则示意图;
图5为本发明实施例公开的倾斜图像旋转示意图;
图6为本发明实施例公开的对目标文本行进行第一计算,得到目标文本行对应的初始旋转角和面积的流程示意图;
图7为本发明实施例公开的若方差小于第二预设阈值,将面积和初始旋转角度进行第二计算,得到第二顺时针旋转角度的流程示意图;
图8为本发明实施例公开的若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像并输出的流程示意图;
图9为本发明实施例公开的一种图像处理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,现有的图像矫正方法的灵活性低。
为了解决该问题,本发明实施例公开了一种图像处理方法、系统、电子设备及存储介质,可对任意角度倾斜的有边界图像进行旋转矫正,也可对任意角度倾斜的无边界图像进行旋转矫正,从而提高对倾斜图像进行矫正的灵活性。此外,通过对处于倒立状态的图像进行二次旋转,提高识别图像中文本倒立的精准度。具体实现方式通过下述实施例具体进行说明。
如图1所示,为本发明实施例公开的一种图像处理方法的流程示意图,该图像处理方法主要包括如下步骤:
步骤S101:获取原始图像中的各个文本行,并从各个文本行中选取长宽比大于第一预设阈值的目标文本行。
在步骤S101中,通过预设文字检测规则检测出原始图像中的各个文本行,并从各个文本行中选取长宽比大于第一预设阈值的目标文本行。
原始图像可以是有边界图像,如各种银行卡图像、身份证图像、货车票图像等,也可以是无边界图像,如文档图像等。
对于文字检测规则本身而言,长宽比越大的文本行,检测效果越精准,其计算出来的旋转角度越能反映整张图像的角度情况。因此设定了第一预设阈值用于过滤掉一些较短的文本行,得到精准的文本行,即目标文本行。对于一些有边界图像和无边界图像,这种方法均可使用。
第一预设阈值的确定由技术人员根据实际情况进行设置,本发明不做具体限定。
为了方便理解无边界图像的检测效果,结合图2进行说明。
图2中,如“一”、“磁”、“光”等字段,由于文本太短,其旋转角度不够精确,而且在这种竖直场景下,会带有一些无效小文本框的干扰,因此通过长宽比的第一预设阈值约束,筛选出满足条件的文本框,在后续的计算中可以大幅度降低这些干扰。
为了方便理解有边界图像的检测效果,结合图3进行说明。
图3中,如“一”、“磁”、“光”等字段,由于文本太短,其旋转角度不够精确,而且在这种竖直场景下,会带有一些无效小文本框的干扰,因此通过长宽比的第一预设阈值约束,筛选出满足条件的文本框,在后续的计算中可以大幅度降低这些干扰。
步骤S102:对目标文本行进行第一计算,得到目标文本行的初始旋转角度和面积,初始旋转角度包括多个无固定方向的旋转角度。
在步骤S102中,通过预设文字检测规则获取图像中的所有文本行的四点位置坐标信息,通过该四点位置坐标信息可计算得到每个文本行的初始旋转角度。
具体对目标文本行进行第一计算,得到目标文本行的初始旋转角度和面积的过程如下:
首先,基于预设的文字检测规则,提取目标文本行的四点位置坐标信息,然后,通过预设的四点位置算法,对四点位置坐标信息进行计算,得到目标文本行的初始旋转角,最后,获取目标文本的长宽比,基于目标文本行的长宽比,确定目标文本行对应的面积。
通过四点位置坐标信息计算出来的旋转角度是没有固定方向。因此需要通过预设角度转换规则,将初始旋转角度统一转换成顺时针旋转的度数。
步骤S103:基于预设角度转换规则,将初始旋转角度转换为第一顺时针方向旋转角度,并计算第一顺时针方向旋转角度的方差。
为了方便理解预设角度转换规则,结合图4进行说明。
图4中,X为横坐标,y为纵坐标。
a为-90度,b为-30度,c为-60度,d为-90度,e为-30度,f为-60度,g为-45度,h为-45度,i为-90度。
a和d同样是-90度,a和d却是两种不同的形态,a是平躺,d是竖直。同理b和e,c和f,g和h,d和i,也无法仅通过初始旋转角度来判定应该顺时针或者逆时针旋转多少度,因此需要在此基础上对这些初始旋转角度进行二次处理,通过预设角度转换规则,将其统一转换成顺时针旋转的度数。
a,b,c,d,e,f经过角度转换规则后,分别转换成顺时针旋转0度,顺时针旋转30度,顺时针旋转45度,顺时针旋转60度,顺时针旋转90度,顺时针旋转120度和顺时针旋转150度。
步骤S104:判断方差是否小于第二预设阈值,若是,则执行步骤105,若否,则执行步骤S110。
需要说明的是,得出满足一定长宽比的文本框的第一顺时针方向旋转角度后计算其方差,如果方差超过第二预设阈值,说明当前图像的文本行方向不一致,不能进行统一的旋转操作,如果方差不超过第二预设阈值,则可以对整张图像做旋转矫正。
第二预设阈值的确定由技术人员根据实际情况进行设置,本发明不做具体限定。
步骤S105:将面积和初始旋转角度进行第二计算,得到第二顺时针旋转角度。
在步骤S105中,将面积和初始旋转角度进行第二计算,得到第二顺时针旋转角度的过程如下:
若方差小于第二预设阈值,确定面积为权重值,并将权重值与目标文本行的初始旋转角度进行加权平均运算,得到均值,并确定均值为第二顺时针旋转角度。
为了进一步减小短文本行对旋转角度带来的影响,本方案引入面积作为权重因子,通过计算目标文本行和面积的加权平均,得出图像最终需要旋转的角度,即第二顺时针旋转角度。经过实践论证,这种加权平均的方式能进一步减弱短文本行的干扰影响,在实际使用中更具有鲁棒性。
步骤S106:基于第二顺时针旋转角度对原始图像进行旋转。
步骤S107:判断旋转后的图像是否处于倒立状态,若是,则执行步骤S108,若否,则执行步骤S111。
图像中的文本行一般是按照从左往右的阅读方向排列的,当图像倾斜时,会出现图5的a和b两种情况(以图像中的某个文本行为例),图5为预设角度转换规则示意图。
图5中,当倾斜图像中的文本行“这是一段测试文字”是情况a时,基于第二顺时针旋转角度对图像做顺时针旋转,将顺时针旋转后的图像放入预先训练的倒立检测模型进行识别,经倒立检测模块判定图像处于非倒立状态,则该图像不做预设旋转角度旋转。
当倾斜图像中的文本行“这是一段测试文字”是情况b时,基于第二顺时针旋转角度对图像做顺时针旋转,将顺时针旋转后的图像放入预先训练的倒立检测模型进行识别,经倒立检测模块判定图像处于倒立状态,则基于预设旋转角度对处于倒立状态的图像进行旋转。
其中,预设旋转角度可以是180°,也可以是其他度数,预设旋转角度的确定由技术人员根据时间情况进行设置,本发明不做具体限定,本发明预设旋转角度优选180°。
将图像放入预先训练的倒立检测模型进行识别时,会对图像中每个文本框的倒立情况做判定,如果图片中大部分文本行被判定为倒立,说明图像处于的状态,需要对图像做预设旋转角度旋转以完成矫正。
步骤S108:基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像。
在步骤S108中,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像的过程如下:
首先,将旋转后的图像输入至预先训练的倒立检测模型进行识别,得到识别结果,识别结果包括正立结果和倒立结果,然后,若旋转后的图像的识别结果为倒立结果,确定旋转后的图像处于倒立状态,最后,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像并输出。
目标图像即为本方案最终的旋转矫正的图像。
步骤S109:输出目标图像。
步骤S110:不执行图像旋转操作。
步骤S111:确定处于非倒立状态的图像为目标图像并输出。
在步骤S111中,通过预先训练的倒立检测模型对图像进行识别时,若图像的状态判定为非倒立状态,说明图像处于非倒立状态,无需对图像做预设旋转角度旋转,处于非倒立状态的图像即为目标图像。
本发明实施例中,可对任意角度倾斜的有边界图像进行旋转矫正,也可对任意角度倾斜的无边界图像进行旋转矫正,从而提高对倾斜图像进行矫正的灵活性。此外,通过对处于倒立状态的图像进行二次旋转,提高识别图像中文本倒立的精准度。
可选的,在若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像之后,输出目标图像之前,对目标图像进行文字检测操作。
当第二顺时针旋转角度比较大时,文字检测图像的检测框中会出现断行的情况,即对原始图像中的长文本行当成短文本行进行检测,因此需要做二次文字检测,从而实现提升了识别图像中的文本行倒立时的精准度。
本发明实施例中,在若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像之后,输出目标图像之前,对目标图像进行文字检测操作,从而实现提升了识别图像中的文本行倒立时的精准度。
如图6所示,为在上述步骤S102中涉及到对目标文本行进行第一计算,得到所述目标文本行对应的初始旋转角和面积的过程,主要包括如下步骤:
步骤S601:基于预设的文字检测规则,提取目标文本行的四点位置坐标信息。
步骤S602:通过预设的四点位置算法,对四点位置坐标信息进行计算,得到目标文本行的初始旋转角。
步骤S603:获取目标文本的长宽比,基于目标文本的长宽比,确定目标文本行对应的面积。
步骤S601-步骤S603的执行原理与上述步骤S102的执行原理一致,可参考,此处不再进行赘述。
本发明实施例中,基于预设的文字检测规则,提取目标文本行的四点位置坐标信息,通过预设的四点位置算法,对四点位置坐标信息进行计算,得到目标文本行的初始旋转角,获取目标文本的长宽比,基于目标文本的长宽比,确定目标文本行对应的面积,实现获取目标文本行的初始旋转角和面积的目的。
如图7所示,为在上述步骤S105中涉及到若方差小于第二预设阈值,将面积和初始旋转角度进行第二计算,得到第二顺时针旋转角度的过程,主要包括如下步骤:
步骤S701:若方差小于第二预设阈值,确定面积为权重值,并将权重值与目标文本行的初始旋转角度进行加权平均运算,得到均值。
步骤S702:确定均值为第二顺时针旋转角度。
步骤S701-步骤S702的执行原理与上述步骤S105的执行原理一致,可参考,此处不再进行赘述。
本发明实施例中,若方差小于第二预设阈值,确定面积为权重值,并将权重值与目标文本行的初始旋转角度进行加权平均运算,得到均值,确定均值为第二顺时针旋转角度,实现获取第二顺时针旋转角度的目的。
如图8所示,为在上述步骤S108中涉及到若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像的过程,主要包括如下步骤:
步骤S801:将旋转后的图像输入至预先训练的倒立检测模型进行识别,得到识别结果,识别结果包括正立结果和倒立结果。
步骤S802:确定识别结果的类型,若旋转后的图像的识别结果为倒立结果,则执行步骤S803,若旋转后的图像的识别结果为正立结果,则执行步骤S805。
步骤S803:确定旋转后的图像处于倒立状态。
步骤S804:基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像。
步骤S801-步骤S804的执行原理与上述步骤S107-步骤S108的执行原理一致,可参考,此处不再进行赘述。
步骤S805:确定旋转后的图像处于非倒立状态,并确定处于非倒立状态的图像为目标图像。
通过预先训练的倒立检测模型对图像进行识别时,若图像的状态判定为非倒立状态,说明图像处于非倒立状态,无需对图像做预设旋转角度旋转,处于非倒立状态的图像即为目标图像。
本发明实施例中,将旋转后的图像输入至预先训练的倒立检测模型进行识别,得到识别结果,识别结果包括正立结果和倒立结果,实现对旋转后的图像的非倒立状态或倒立状态的判断的目的,以便于对非倒立状态或倒立状态的图像执行各自对应的操作。
基于上述实施例图1公开的一种图像处理方法,本发明实施例还对应公开了一种图像处理系统,如图9所示,该图像处理系统包括获取单元901、第一计算单元902、转换单元903、第二计算单元904、第一旋转单元905、第二旋转单元906和输出单元907。
获取单元901,用于获取原始图像中的各个文本行,并从各个文本行中选取长宽比大于第一预设阈值的目标文本行。
第一计算单元902,用于对目标文本行进行第一计算,得到目标文本行的初始旋转角度和面积,初始旋转角度包括多个无固定方向的旋转角度。
转换单元903,用于基于预设角度转换规则,将初始旋转角度转换为第一顺时针方向旋转角度,并计算第一顺时针方向旋转角度的方差。
第二计算单元904,用于若方差小于第二预设阈值,将面积和初始旋转角度进行第二计算,得到第二顺时针旋转角度。
第一旋转单元905,用于基于第二顺时针旋转角度对原始图像进行旋转。
第二旋转单元906,用于若旋转后的图像处于倒立状态,基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像。
输出单元907,用于输出所述目标图像。
进一步的,第一计算单元902包括提取模块、第一计算模块和第一确定模块。
提取模块,用于基于预设的文字检测规则,提取目标文本行的四点位置坐标信息。
第一计算模块,用于通过预设的四点位置算法,对四点位置坐标信息进行计算,得到目标文本行的初始旋转角。
第一确定模块,用于获取目标文本的长宽比,基于目标文本行的长宽比,确定目标文本行对应的面积。
进一步的,第二计算单元904包括第二计算模块和第二确定模块。
第二计算模块,用于若方差小于第二预设阈值,确定面积为权重值,并将权重值与目标文本行的初始旋转角度进行加权平均运算,得到均值。
第二确定模块,用于确定均值为第二顺时针旋转角度。
进一步的,第一旋转单元906包括识别模块、第三确定模块和旋转模块。
识别模块,用于将旋转后的图像输入至预先训练的倒立检测模型进行识别,得到识别结果,识别结果包括正立结果和倒立结果。
第三确定模块,用于若旋转后的图像的识别结果为倒立结果,确定旋转后的图像处于倒立状态。
旋转模块,用于基于预设旋转角度对处于倒立状态的图像进行旋转,得到目标图像并输出。
进一步的,还包括第四确定模块和第五确定模块。
第四确定模块,用于若旋转后的图像的识别结果为正立结果,确定旋转后的图像处于非倒立状态。
第五确定模块,用于确定处于非倒立状态的图像为目标图像并输出。
进一步的,还包括执行单元。
执行单元,用于若方差大于等于第二预设阈值,不执行图像旋转操作。
进一步的,还包括操作单元。
操作单元,用于对目标图像进行文字检测操作。
本发明实施例中,可对任意角度倾斜的有边界图像进行旋转矫正,也可对任意角度倾斜的无边界图像进行旋转矫正,从而提高对倾斜图像进行矫正的灵活性。此外,通过对处于倒立状态的图像进行二次旋转,提高识别图像中文本倒立的精准度。
本发明实施例还公开了一种电子设备,包括存储器和处理器,其中,存储器用于存储计算机程序;处理器用于执行计算程序,具体用于实现如上述实施例公开的图像处理方法。
本发明实施例还公开了一种存储介质,存储介质包括存储指令,其中,在指令运行时控制存储介质所在的设备执行如上述实施例公开的图像处理方法。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种图像处理方法,其特征在于,所述方法包括:
获取原始图像中的各个文本行,并从所述各个文本行中选取长宽比大于第一预设阈值的目标文本行;
对所述目标文本行进行第一计算,得到所述目标文本行的初始旋转角度和面积,所述初始旋转角度包括多个无固定方向的旋转角度;
基于预设角度转换规则,将所述初始旋转角度转换为第一顺时针方向旋转角度,并计算所述第一顺时针方向旋转角度的方差;
若所述方差小于第二预设阈值,将所述面积和所述初始旋转角度进行第二计算,得到第二顺时针旋转角度;
基于所述第二顺时针旋转角度对所述原始图像进行旋转;
若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像;
输出所述目标图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文本行进行第一计算,得到所述目标文本行对应的初始旋转角和面积,包括:
基于预设的文字检测规则,提取所述目标文本行的四点位置坐标信息;
通过预设的四点位置算法,对所述四点位置坐标信息进行计算,得到所述目标文本行的初始旋转角;
获取所述目标文本的长宽比,基于所述目标文本行的长宽比,确定所述目标文本行对应的面积。
3.根据权利要求1所述的方法,其特征在于,所述若所述方差小于第二预设阈值,将所述面积和所述初始旋转角度进行第二计算,得到第二顺时针旋转角度,包括:
若所述方差小于第二预设阈值,确定所述面积为权重值,并将所述权重值与所述目标文本行的初始旋转角度进行加权平均运算,得到均值;
确定所述均值为第二顺时针旋转角度。
4.根据权利要求1所述的方法,其特征在于,所述若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像,包括:
将旋转后的图像输入至预先训练的倒立检测模型进行识别,得到识别结果,所述识别结果包括正立结果和倒立结果;
若所述旋转后的图像的识别结果为所述倒立结果,确定旋转后的图像处于倒立状态;
基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像。
5.根据权利要求4所述的方法,其特征在于,还包括:
若所述旋转后的图像的识别结果为所述正立结果,确定旋转后的图像处于非倒立状态;
确定所述处于非倒立状态的图像为目标图像并输出。
6.根据权利要求1所述的方法,其特征在于,还包括:
若所述方差大于等于第二预设阈值,不执行图像旋转操作。
7.根据权利要求1所述的方法,其特征在于,在所述若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像之后,所述输出所述目标图像之前,还包括:
对所述目标图像进行文字检测操作。
8.一种图像处理系统,其特征在于,所述系统包括:
获取单元,用于获取原始图像中的各个文本行,并从所述各个文本行中选取长宽比大于第一预设阈值的目标文本行;
第一计算单元,用于对所述目标文本行进行第一计算,得到所述目标文本行的初始旋转角度和面积,所述初始旋转角度包括多个无固定方向的旋转角度;
转换单元,用于基于预设角度转换规则,将所述初始旋转角度转换为第一顺时针方向旋转角度,并计算所述第一顺时针方向旋转角度的方差;
第二计算单元,用于若所述方差小于第二预设阈值,将所述面积和所述初始旋转角度进行第二计算,得到第二顺时针旋转角度;
第一旋转单元,用于基于所述第二顺时针旋转角度对所述原始图像进行旋转;
第二旋转单元,用于若旋转后的图像处于倒立状态,基于预设旋转角度对所述处于倒立状态的图像进行旋转,得到目标图像;
输出单元,用于输出所述目标图像。
9.一种电子设备,其特征在于,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算程序,具体用于实现如权利要求1至7任意一项所述的图像处理方法。
10.一种存储介质,其特征在于,所述存储介质包括存储指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1至7任意一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110749142.8A CN113420762B (zh) | 2021-07-01 | 2021-07-01 | 一种图像处理方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110749142.8A CN113420762B (zh) | 2021-07-01 | 2021-07-01 | 一种图像处理方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113420762A true CN113420762A (zh) | 2021-09-21 |
CN113420762B CN113420762B (zh) | 2024-02-06 |
Family
ID=77720074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110749142.8A Active CN113420762B (zh) | 2021-07-01 | 2021-07-01 | 一种图像处理方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420762B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100215285A1 (en) * | 2009-02-20 | 2010-08-26 | Avermedia Information, Inc. | Method and device for detecting and correcting skewed image data |
US9621761B1 (en) * | 2015-10-08 | 2017-04-11 | International Business Machines Corporation | Automatic correction of skewing of digital images |
CN109993161A (zh) * | 2019-02-25 | 2019-07-09 | 众安信息技术服务有限公司 | 一种文本图像旋转矫正方法及系统 |
CN111260569A (zh) * | 2020-01-10 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 图像倾斜校正的方法、装置、电子设备和存储介质 |
CN111353489A (zh) * | 2020-02-27 | 2020-06-30 | 平安国际智慧城市科技股份有限公司 | 文本图像处理方法、装置、计算机设备和存储介质 |
CN111652205A (zh) * | 2020-06-04 | 2020-09-11 | 广东小天才科技有限公司 | 基于深度学习的文本矫正方法、装置、设备和介质 |
CN112016341A (zh) * | 2019-05-28 | 2020-12-01 | 珠海金山办公软件有限公司 | 一种文本图片矫正方法及装置 |
CN112528776A (zh) * | 2020-11-27 | 2021-03-19 | 京东数字科技控股股份有限公司 | 文本行校正方法和装置 |
-
2021
- 2021-07-01 CN CN202110749142.8A patent/CN113420762B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100215285A1 (en) * | 2009-02-20 | 2010-08-26 | Avermedia Information, Inc. | Method and device for detecting and correcting skewed image data |
US9621761B1 (en) * | 2015-10-08 | 2017-04-11 | International Business Machines Corporation | Automatic correction of skewing of digital images |
CN109993161A (zh) * | 2019-02-25 | 2019-07-09 | 众安信息技术服务有限公司 | 一种文本图像旋转矫正方法及系统 |
CN112016341A (zh) * | 2019-05-28 | 2020-12-01 | 珠海金山办公软件有限公司 | 一种文本图片矫正方法及装置 |
CN111260569A (zh) * | 2020-01-10 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 图像倾斜校正的方法、装置、电子设备和存储介质 |
CN111353489A (zh) * | 2020-02-27 | 2020-06-30 | 平安国际智慧城市科技股份有限公司 | 文本图像处理方法、装置、计算机设备和存储介质 |
CN111652205A (zh) * | 2020-06-04 | 2020-09-11 | 广东小天才科技有限公司 | 基于深度学习的文本矫正方法、装置、设备和介质 |
CN112528776A (zh) * | 2020-11-27 | 2021-03-19 | 京东数字科技控股股份有限公司 | 文本行校正方法和装置 |
Non-Patent Citations (1)
Title |
---|
曾凡锋;吴飞飞;肖珂;王晓;: "一种快速文本图像倾斜校正方法", 计算机应用与软件, no. 04 * |
Also Published As
Publication number | Publication date |
---|---|
CN113420762B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009543B (zh) | 一种车牌识别方法及装置 | |
CN109376631B (zh) | 一种基于神经网络的回环检测方法及装置 | |
CN110135424B (zh) | 倾斜文本检测模型训练方法和票证图像文本检测方法 | |
US10187546B2 (en) | Method and device for correcting document image captured by image pick-up device | |
US20110211233A1 (en) | Image processing device, image processing method and computer program | |
US20200372248A1 (en) | Certificate recognition method and apparatus, electronic device, and computer-readable storage medium | |
EP2064652A1 (en) | Method of image processing | |
CN111860489A (zh) | 一种证件图像校正方法、装置、设备及存储介质 | |
CN112528776B (zh) | 文本行校正方法和装置 | |
CN107545223B (zh) | 图像识别方法及电子设备 | |
CN112651490B (zh) | 人脸关键点检测模型的训练方法及设备、可读存储介质 | |
CN111814905A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN110766007A (zh) | 证件遮挡检测方法、装置、设备及可读存储介质 | |
CN112419207A (zh) | 一种图像矫正方法及装置、系统 | |
CN108992033B (zh) | 一种视觉测试的评分装置、设备和存储介质 | |
JP2022009474A (ja) | ビジョンシステムでラインを検出するためのシステム及び方法 | |
CN117115823A (zh) | 一种篡改识别方法、装置、计算机设备和存储介质 | |
CN115937003A (zh) | 图像处理方法、装置、终端设备和可读存储介质 | |
CN113221897A (zh) | 图像矫正方法、图像文本识别方法、身份验证方法及装置 | |
CN113420762A (zh) | 一种图像处理方法、系统、电子设备及存储介质 | |
CN110660091A (zh) | 一种图像配准处理方法、装置和拍照批改作业系统 | |
CN109977937B (zh) | 图像处理方法、装置及设备 | |
CN112215032A (zh) | 图像中的目标识别方法、装置、电子设备及程序介质 | |
CN113673522B (zh) | 文本图像的倾斜角度检测方法、装置、设备及存储介质 | |
JPH05174182A (ja) | 文書傾き角検出方法および文書傾き角検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |