CN110705550A - 基于图像矩与投影法的文本图像的姿态校正算法 - Google Patents

基于图像矩与投影法的文本图像的姿态校正算法 Download PDF

Info

Publication number
CN110705550A
CN110705550A CN201910949798.7A CN201910949798A CN110705550A CN 110705550 A CN110705550 A CN 110705550A CN 201910949798 A CN201910949798 A CN 201910949798A CN 110705550 A CN110705550 A CN 110705550A
Authority
CN
China
Prior art keywords
image
moment
text
representing
steps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910949798.7A
Other languages
English (en)
Inventor
慕乾勇
韩永昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Contel Network Technology Co Ltd
Original Assignee
Qingdao Contel Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Contel Network Technology Co Ltd filed Critical Qingdao Contel Network Technology Co Ltd
Priority to CN201910949798.7A priority Critical patent/CN110705550A/zh
Publication of CN110705550A publication Critical patent/CN110705550A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明属于图像处理领域,提供了基于图像矩与投影法的文本图像的姿态校正算法,包括以下步骤:S1、选定一个合适的阈值k,将输入图像I转化为二值图像,所述输入图像的大小为的H×W;S2、通过图像的中心矩计算图像的主轴方向θ,S3、根据计算得到的主轴方向,旋转图像,得到旋转后的校正图像;计算公式为:I′=roate(I,θ);其中,I’表示校正后的图像,rotate表示旋转函数,本发明算法简单、运行速度快,可以实现实时校正;获得的旋转角度精度高,可以广泛应用于文本图像的姿态校正领域。

Description

基于图像矩与投影法的文本图像的姿态校正算法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于图像矩与投影法的文本图像的姿态校正算法。
背景技术
图片作为重要的信息载体,图像中的文本信息是理解整个图像的重要内容。近年来随着信息自动化的发展,对文本图像的关注度越来越高。在以数码相机、计算机摄像头、拍摄手机等数字设备拍摄目标物时,由于拍摄距离、拍摄角度或者摄像头等原因,所拍摄的图像经常会产生各种各样的变形,这样的变形可能会影响往后的图像处理效果,从而达不到预期的处理效果。为了对拍摄的图像进行识别,有必要就行校正预处理。
图像校正就是从具有畸变的图像中消除畸变还原图像的处理过程。图像畸变,一般分为两类:系统畸变和随机畸变。系统畸变是设备成像过程中产生的电子图像畸变,有枕形失真、桶形失真等,现在一般的拍摄设备都能进行自我校正。随机畸变是在实践运用中,由于拍摄角度位置变化或者目标物卷曲等而导致所获得的图像产生缩放、旋转、透视畸变。随机畸变图像有三种:倾斜畸变、透视畸变和扭曲畸变。
对于旋转畸变,目前多数方法先用Hough变换检测出图像的倾斜角度,有坐标变换完成畸变图像的变换。基于Hough的方法,首先需要进行Hough变换,此过程计算量大且计算耗时;然后需要确定所检测出来的线段中哪些线段对应的角度是图像需要选择的角度。基于矩形角点的算法,通过获取矩形的角点,而后利用这些检测出来的角点进行坐标变换从而实现图像校正。此方法使用具有局限性。
综上所述,对于图像旋转畸变的校正,虽然目前有一些对应的算法,但是仍然具有诸多的局限。
发明内容
本发明克服现有技术存在的不足,提供了一种基于图像矩与投影法的文本图像的姿态校正算法,以解决多行文本的文本图像旋转畸变校正问题。
为了解决上述技术问题,本发明采用的技术方案为:基于图像矩与投影法的文本图像的姿态校正算法,包括以下步骤:
S1、选定一个合适的阈值k,将输入图像I转化为二值图像,所述输入图像的大小为H×W,转换公式为:
Figure BDA0002225260240000021
其中,mask表示图像的二值函数,i,j分别表示图像像素在x方向和y方向的坐标,H表示图像的高度,W表示图像的宽度;
S2、计算图像的主轴方向θ,计算公式为:
Figure BDA0002225260240000022
其中,M11表示图像沿x方向的1阶,沿y方向的1阶的中心距,M20表示图像沿x方向的2阶,沿y方向的0阶的中心距中心距,M02表示图像沿x方向的0阶,沿y方向的2阶的中心距;
S3、根据计算得到的主轴方向,旋转图像,得到旋转后的校正图像;计算公式为:
I′=roate(I,θ);
其中,I’表示校正后的图像,rotate表示旋转函数。
所述步骤S2中,还还包括计算图像的中心矩的步骤,图像的中心矩的计算公式为:
Figure BDA0002225260240000023
其中,i和j是图像中像素沿x方向和沿y方向的坐标,
Figure BDA0002225260240000024
Figure BDA0002225260240000025
分别表示图像重心沿x方向和沿y方向的坐标,Mpq表示图像沿x方向的p阶,沿y方向的q阶的中心距。
所述步骤S2中,还包括计算图像的重心坐标的步骤,图像的重心坐标的计算公式为:
Figure BDA0002225260240000026
Figure BDA0002225260240000027
其中,m10表示图像沿x方向的1+y方向的0阶距;m00表示图像沿x方向的0+y方向的0阶距,m01表示图像沿x方向的0+y方向的1阶距。
图像的阶距的计算公式为:
Figure BDA0002225260240000031
其中,p表示x的阶次,q表示y方向的阶次。
本发明与现有技术相比具有以下有益效果:
(1)本发明算法简单、运行速度快,可以实现实时校正;
(2)本发明获得的旋转角度精度高。
附图说明
图1为本发明实施例提供的一种基于图像矩与投影法的文本图像的姿态校正算法的步骤示意图;
图2为采用本发明实施例提供的一种基于图像矩与投影法的文本图像的姿态校正算法进行校正前后的图像示意图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面将结合具体实施例和附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于图像矩与投影法的文本图像的姿态校正算法,包括以下步骤:
S1、利用大律法选定一个合适的阈值k,将输入图像I转化为二值图像,所述输入图像的大小为H×W,转换公式为:
其中,mask表示图像的二值函数,i,j分别表示图像像素在x方向和y方向的坐标;
S2、计算图像的主轴方向θ,计算公式为:
Figure BDA0002225260240000033
其中,M11表示图像沿x方向的1阶,沿y方向的1阶的中心距,M20表示图像沿x方向的2阶,沿y方向的0阶的中心距中心距,M02表示图像沿x方向的0阶,沿y方向的2阶的中心距;
其中,还还包括计算图像的中心矩的步骤,图像的中心矩的计算公式为:
Figure BDA0002225260240000041
其中,i和j是图像中像素沿x方向和沿y方向的坐标,
Figure BDA0002225260240000042
Figure BDA0002225260240000043
分别表示图像重心沿x方向和沿y方向的坐标,Mpq表示图像沿x方向的p阶,沿y方向的q阶的中心距。
通过(3)式可以知道,图像沿x方向的1阶,沿y方向的1阶的中心距M11,沿x方向的2阶,沿y方向的0阶的中心距M20,沿x方向的0阶,沿y方向的2阶的中心距M02的计算公式分为:
Figure BDA0002225260240000044
Figure BDA0002225260240000045
Figure BDA0002225260240000046
此外,本步骤中,还包括计算图像的重心坐标
Figure BDA0002225260240000049
的步骤,图像的重心坐标的计算公式为:
其中,m10表示图像沿x方向的1+y方向的0阶距;m00表示图像沿x方向的0+y方向的0阶距,m01表示图像沿x方向的0+y方向的1阶距。
其中,图像的阶距的计算公式为:
其中,p表示x的阶次,q表示y方向的阶次。
则由(8)式可以知道,图像沿x方向的1+y方向的0阶距m10,沿x方向的0+y方向的0阶距m00,沿x方向的0+y方向的1阶距m01的计算公式分别为:
Figure BDA0002225260240000051
Figure BDA0002225260240000052
Figure BDA0002225260240000053
则通过式(9)~(11),可以直接计算得到图像的各个阶距。
S3、根据计算得到的主轴方向,旋转图像,得到旋转后的校正图像;计算公式为:
I′=roate(I,θ); (12)
其中,I’表示校正后的图像,rotate表示旋转函数。
如图1所示,为采用本发明实施例提供的一种基于图像矩与投影法的文本图像的姿态校正算法进行校正前后的图像示意图,从图中可以看出,本发明的算法可以实现文本图像的姿态校正。
上面结合附图对本发明的实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (4)

1.基于图像矩与投影法的文本图像的姿态校正算法,其特征在于,包括以下步骤:
S1、选定一个合适的阈值k,将输入图像I转化为二值图像,所述输入图像的大小为H×W,转换公式为:
Figure FDA0002225260230000011
其中,mask表示图像的二值函数,i,j分别表示图像像素在x方向和y方向的坐标,H表示图像的高度,W表示图像的宽度;
S2、计算图像的主轴方向θ,计算公式为:
Figure FDA0002225260230000012
其中,M11表示图像沿x方向的1阶,沿y方向的1阶的中心距,M20表示图像沿x方向的2阶,沿y方向的0阶的中心距中心距,M02表示图像沿x方向的0阶,沿y方向的2阶的中心距;
S3、根据计算得到的主轴方向,旋转图像,得到旋转后的校正图像;计算公式为:
I′=roate(I,θ);
其中,I’表示校正后的图像,rotate表示旋转函数。
2.根据权利要求1所述的一种基于图像矩与投影法的文本图像的姿态校正算法,其特征在于,所述步骤S2中,还还包括计算图像的中心矩的步骤,图像的中心矩的计算公式为:
Figure FDA0002225260230000013
其中,i和j是图像中像素沿x方向和沿y方向的坐标,
Figure FDA0002225260230000015
分别表示图像重心沿x方向和沿y方向的坐标,Mpq表示图像沿x方向的p阶,沿y方向的q阶的中心距。
3.根据权利要求2所述的一种基于图像矩与投影法的文本图像的姿态校正算法,其特征在于,所述步骤S2中,还包括计算图像的重心坐标的步骤,图像的重心坐标的计算公式为:
Figure FDA0002225260230000021
Figure FDA0002225260230000022
其中,m10表示图像沿x方向的1+y方向的0阶距;m00表示图像沿x方向的0+y方向的0阶距,m01表示图像沿x方向的0+y方向的1阶距。
4.根据权利要求3所述的一种基于图像矩与投影法的文本图像的姿态校正算法,其特征在于,图像的阶距的计算公式为:
Figure FDA0002225260230000023
其中,p表示x的阶次,q表示y方向的阶次。
CN201910949798.7A 2019-10-08 2019-10-08 基于图像矩与投影法的文本图像的姿态校正算法 Pending CN110705550A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910949798.7A CN110705550A (zh) 2019-10-08 2019-10-08 基于图像矩与投影法的文本图像的姿态校正算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910949798.7A CN110705550A (zh) 2019-10-08 2019-10-08 基于图像矩与投影法的文本图像的姿态校正算法

Publications (1)

Publication Number Publication Date
CN110705550A true CN110705550A (zh) 2020-01-17

Family

ID=69198157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910949798.7A Pending CN110705550A (zh) 2019-10-08 2019-10-08 基于图像矩与投影法的文本图像的姿态校正算法

Country Status (1)

Country Link
CN (1) CN110705550A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221892A (zh) * 2021-05-12 2021-08-06 佛山育脉科技有限公司 手掌图像确定方法、装置及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592124A (zh) * 2011-01-13 2012-07-18 汉王科技股份有限公司 文本图像的几何校正方法、装置和双目立体视觉系统
US20130329134A1 (en) * 2012-06-11 2013-12-12 Ricoh Company, Ltd. Image processing method, and recording medium storing image processing control program
CN109461126A (zh) * 2018-10-16 2019-03-12 重庆金山医疗器械有限公司 一种图像畸变校正方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592124A (zh) * 2011-01-13 2012-07-18 汉王科技股份有限公司 文本图像的几何校正方法、装置和双目立体视觉系统
US20130329134A1 (en) * 2012-06-11 2013-12-12 Ricoh Company, Ltd. Image processing method, and recording medium storing image processing control program
CN109461126A (zh) * 2018-10-16 2019-03-12 重庆金山医疗器械有限公司 一种图像畸变校正方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
潘梅森 等: "基于图像矩的车牌号码倾斜校正", 《计算机辅助设计与图形学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221892A (zh) * 2021-05-12 2021-08-06 佛山育脉科技有限公司 手掌图像确定方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN111145238B (zh) 单目内窥镜图像的三维重建方法、装置及终端设备
JP5437311B2 (ja) 画像補正方法、画像補正システム、角度推定方法、および角度推定装置
CN113191954B (zh) 一种基于双目相机的全景图像拼接方法
CN110246079B (zh) 基于b样条曲面拟合的摄像头畸变矫正方法、系统及介质
CN111507908A (zh) 图像矫正处理方法、装置、存储介质及计算机设备
CN112470192A (zh) 双摄像头标定方法、电子设备、计算机可读存储介质
CN111950554A (zh) 一种身份证识别方法、装置、设备及存储介质
CN112950528A (zh) 证件姿态确定方法、模型训练方法、装置、服务器及介质
CN109934765B (zh) 高速相机全景图像拼接方法
CN110705550A (zh) 基于图像矩与投影法的文本图像的姿态校正算法
CN116152121B (zh) 基于畸变参数的曲面屏生成方法、矫正方法
CN111260574B (zh) 一种印章照片矫正的方法、终端及计算机可读存储介质
JP5254545B2 (ja) 画像処理装置、及び画像処理方法
CN111353945B (zh) 鱼眼图像校正方法、装置及存储介质
CN105488764B (zh) 鱼眼图像校正方法及装置
CN111507894A (zh) 一种图像拼接处理方法及装置
CN113920196A (zh) 视觉定位方法、装置及计算机设备
KR102598910B1 (ko) 왜곡된 이미지에서 객체를 검출하기 위한 방법, 시스템, 및 장치
CN113222990A (zh) 一种基于图像数据增强的芯片计数方法
CN114697542A (zh) 视频处理方法、装置、终端设备及存储介质
CN112288649A (zh) 一种圆柱状物体透视成像失真的图像校正方法及设备
CN112419172A (zh) 倾斜图像校正去模糊的遥感图像处理方法
CN111210384A (zh) 一种适用于机场跑道场景的图像拼接方法
CN113724141A (zh) 一种图像校正方法、装置及电子设备
CN110969586A (zh) 一种基于人机交互的消除文本图像变形的算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200117

RJ01 Rejection of invention patent application after publication