CN202058178U - 一种字符图像校正装置 - Google Patents

一种字符图像校正装置 Download PDF

Info

Publication number
CN202058178U
CN202058178U CN2010202126764U CN201020212676U CN202058178U CN 202058178 U CN202058178 U CN 202058178U CN 2010202126764 U CN2010202126764 U CN 2010202126764U CN 201020212676 U CN201020212676 U CN 201020212676U CN 202058178 U CN202058178 U CN 202058178U
Authority
CN
China
Prior art keywords
character
character picture
image
coordinate
utility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010202126764U
Other languages
English (en)
Inventor
邱有森
陈文传
刘峰
林辉辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Newland Computer Co Ltd
Original Assignee
Fujian Newland Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Newland Computer Co Ltd filed Critical Fujian Newland Computer Co Ltd
Priority to CN2010202126764U priority Critical patent/CN202058178U/zh
Application granted granted Critical
Publication of CN202058178U publication Critical patent/CN202058178U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本实用新型公开了一种字符图像校正装置,该字符图像校正装置包括:获取单元;映射系数确定单元,连接获取单元;映射单元,连接映射系数确定单元。通过上述图像校正装置,可以通过映射方式校正字符图像中的畸变,提高识别准确率。

Description

一种字符图像校正装置
【技术领域】
本实用新型涉及一种图像校正装置,特别涉及一种字符图像校正装置。 
【背景技术】
光学字符识别(Optical Character Recognition,OCR)是自动识别技术研究和应用领域中的一个重要方面。光学字符识别的主要功能是通过光学技术利用模板匹配、统计分类或神经网络等方法对拍摄图像上的字符进行识别。然而,如图1所示,在图像的拍摄过程中,由于拍摄系统、拍摄手法以及周围环境因素的影响,拍摄图像中的字符串可能存在较大的倾斜和弯曲等畸变,严重影响了识别的准确率。 
【实用新型内容】
为了克服上述技术问题,本实用新型提供了一种字符图像校正装置,以校正字符图像中的倾斜或弯曲等畸变。 
本实用新型解决上述技术问题所采取的技术方案是提供一种字符图像校正装置,该字符图像校正装置包括:获取单元;映射系数确定单元,连接获取单元;映射单元,连接映射系数确定单元。 
通过上述图像校正装置,可以通过映射方式校正字符图像中的畸变,提高识别准确率。此外,本实用新型还可以将来自至少两幅字符图像的图像信息融合到同一幅目标图像内,由此提高了目标图像的清晰度。 
【附图说明】
图1是现有字符图像的示意图; 
图2是根据本实用新型第一优选实施例的字符图像校正装置的示意框图; 
图3是根据本实用新型第一优选实施例的字符图像校正过程的示意图; 
图4是根据本实用新型第一优选实施例的字符图像校正过程的示意图; 
图5是根据本实用新型第一优选实施例的字符图像校正过程的示意图; 
图6是根据本实用新型第二优选实施例的字符图像校正过程的示意图。 
【具体实施方式】
本实用新型提供了一种字符图像校正装置,该字符图像校正装置可用于校正字符图像中的畸变,提高识别准确率。 
如图2-5所示,本实用新型的第一优选实施例提供了一种字符图像校正装置。本实施例的字符图像校正装置包括获取单元、映射系数确定单元以及映射单元。获取单元首先获得字符图像A,并对字符图像A进行分割,由此可以划分出各字符的大体区域及分隔部分。随后,获取单元确定多个字符的模块坐标及字符中心的图像坐标。 
在本实用新型一优选实施例中,获取单元包括包围四边形确定单元以及运算单元。如图4所示,包围四边形确定单元在字符图像A的分割区域内对单个字符进一步进行包围四边形检测,由此确定包围单个字符的最小四边形。在优选实施例中,最小四边形为矩形。在包围四边形确定单元确定最小四边形后,运算单元对四边形的四个顶点的图像坐标进行平均,即获得该字符的字符中心的图像坐标。 
在本实用新型的另一优选实施例中,获取单元包括包围四边形确定单元、二值化单元以及运算单元。在包围四边形确定单元确定包围单个字符的最小四边形后,二值化单元对该四边形所包围的图像区域进行二值化,将背景像素的像素值设置为0,并将字符像素(即,代表字符内容的像素)的像素值设置为非0。随后,运算单元利用如下公式计算字符中心的图像坐标: 
X = Σ i = 1 N ( X i × H i ) / Σ i = 1 N ( H i )
Y = Σ i = 1 N ( Y i × H i ) / Σ i = 1 N ( H i )
其中,N为四边形所包围的图像区域内的像素的个数,Xi和Yi为该图像区域内的各像素的坐标,Hi则为经二值化的图像区域内的各像素的像素值。 
在确定了多个字符的字符中心后,如图3所示,获取单元可对字符中心进行虚拟连线,并根据由此形成的矩阵网格来确定各字符的模块坐标。在本实用新型中,模块坐标是指以字符为单位的坐标,即某字符在坐标轴方向上 相对于坐标原点的字符个数,而图像坐标是以像素为单位的坐标,即某像素点在坐标轴方向上相对于坐标原点的像素的个数。当然,本领域技术人员还可以根据本领域的其他方式来确定字符图像内的多个字符的模块坐标及字符中心的图像坐标。 
在获取单元获取多个字符的模块坐标及字符中心的图像坐标后,映射系数确定单元可计算字符图像A与目标图像C之间的映射系数a1、b1、c1......。字符图像A与目标图像C之间的映射公式以及映射系数a1、b1、c1......可通过多种方式获得,例如透视变换、二次多项式、三次多项式、三角网格、小波变换等。 
本实用新型以透视变换为例进行详细描述。在确定字符图像A上的多个字符的模块坐标及字符中心的图像坐标后,映射系数确定单元利用透视变换公式计算出字符图像A与目标图像C之间的的透视变换系数a1、b1、c1......: 
X=(aU+bV+c)/(gU+hV+1) 
Y=(dU+eV+f)/(gU+hV+1) 
其中,X和Y为字符中心的图像坐标,U和V为字符中心在目标图像上的对应坐标,a、b、c、d、e、c、f、g及h为透视变换系数。U和V可由字符在字符图像上的模块坐标计算获得。在本实施例中,字符图像A与目标图像C的分辨率相同,则字符中心在目标图像上的对应坐标即为字符在字符图像上的模块坐标。 
如图5所示,在映射系数确定单元获得字符图像A与目标图像C之间的透视变换系数a1、b1、c1......后,映射单元通过上述透视变换公式可将字符图像A映射到目标图像C上。 
在本实施例中,映射单元根据上述透视变换系数及透视变换公式可确定目标图像C上的目标像素点c在字符图像A的对应位置。即,映射单元根据目标像素点c的坐标(Uc、Vc)通过上述透视变换公式可求得其在字符图像A上的对应坐标(Xa、Ya),并将对应坐标(Xa、Ya)的像素值Ha作为目标图像C的目标像素点c的像素值Hc。 
由于目标像素点c在字符图像A上的对应位置不会完全对应于字符图像A上的一个真实像素点,也就是说,对应坐标(Xa、Ya)出现非整数的情况。 在本实用新型中,映射单元通过将对应位置周边的多个像素点的像素值进行插值获得对应位置的像素值。例如,在本实施例中,映射单元将对应坐标(Xa、Ya)周边的像素点1a、2a、3a、4a的像素值H1a、H2a、H3a、H4a进行插值来获得对应坐标(Xa、Ya)的像素值Ha。同幅图像内多像素点的插值运算为本领域公知技术,在此不再赘述。 
此外,除了图2所描述的字符图像A与目标图像C的分辨率相同的情况,本实用新型的字符图像校正装置也可以应用于字符图像A与目标图像C的分辨率不同的情况。 
在目标图像的分辨率小于字符图像的情况下,即亚分辨率校正的情况下,首先可通过将各字符在字符图像上的模块坐标进行缩小获得该各字符中心在目标图像上的对应坐标,并利用上述透视变换公式计算出字符图像与目标图像之间的透视变换系数。随后,根据透视变换系数分别将目标图像中各目标像素点的坐标映射到字符图像,以确定其在字符图像上的对应位置。利用上文描述插值方法获取对应位置的像素值。 
在目标图像的分辨率大于字符图像的情况下,即超分辨率校正的情况下,首先可通过将各字符在字符图像上的模块坐标进行扩大获得该各字符中心在目标图像上的对应坐标,并利用上述透视变换公式计算出字符图像与目标图像之间的透视变换系数。随后,根据透视变换系数分别将目标图像中各目标像素点的坐标映射到字符图像,以确定其在字符图像上的对应位置。利用上文描述插值方法获取对应位置的像素值。 
通过上述装置,可以通过映射方式校正字符图像中的畸变,提高识别准确率。 
如图6所示,本实用新型的第二优选实施例提供了另一种字符图像校正过程。在本实施例中,利用两幅字符图像A、B融合生成目标图像C,由此提高目标图像C的清晰度。 
在本实施例中,获取单元通过上述方式分别确定字符图像A、B上的多个字符的模块坐标及字符中心的图像坐标,映射系数确定单元分别利用模块坐标及字符中心的图像坐标计算字符图像A、B与目标图像C之间的映射系数a1、b1、c1......以及a2、b2、c2......。随后,映射单元根据上述透视变换 系数及透视变换公式可确定目标图像C上的目标像素点c分别在字符图像A和字符图像B上的对应位置。即,映射单元根据目标像素点c的坐标(Uc、Vc)通过上述透视变换公式可求得其在字符图像A上的对应坐标(Xa、Ya)以及字符图像B上的对应坐标(Xb、Yb)。 
在本实施例中,映射单元将对应于目标图像C的同一目标像素点c的分别来自字符图像A、B的像素值进行融合。具体来说,映射单元将目标图像C的目标像素点c在字符图像A和字符图像B上的对应位置的像素值Ha、Hb进行融合,以作为该目标像素点c的像素值Hc,例如Hc=(Ha+Hb)/2。 
通过上述方式,目标图像C可以融合字符图像A、B的图像信息,由此提高了目标图像C的清晰度。本实用新型所提到的融合方式包括但不限于平均或加权平均运算。 
此外,与第一实施例相同,由于目标像素点c在字符图像A和字符图像B上的对应位置不会完全对应于字符图像A和字符图像B上的一个真实像素点,也就是说,对应坐标(Xa、Ya)和对应坐标(Xb、Yb)出现非整数的情况。在本实用新型中,通过将对应位置周边的多个像素点的像素值进行插值获得对应位置的像素值。例如,在本实施例中,将对应坐标(Xa、Ya)周边的像素点1a、2a、3a、4a的像素值H1a、H2a、H3a、H4a进行插值来获得对应坐标(Xa、Ya)的像素值Ha,并将对应坐标(Xb、Yb)周边的像素点1b、2b、3b、4b的像素值H1b、H2b、H3b、H4b进行插值来获得对应坐标(Xb、Yb)的像素值Hb。随后,再在对Ha和Hb进行融合来获得目标像素点c的像素值Hc。 
通过上述图像校正装置,可以将来自至少两幅字符图像的图像信息融合到同一幅目标图像内,由此提高了目标图像的清晰度。 
在上述实施例中,仅对本实用新型进行了示范性描述,但是本领域技术人员在阅读本专利申请后可以在不脱离本实用新型的精神和范围的情况下对本实用新型进行各种修改。 

Claims (1)

1.一种字符图像校正装置,其特征在于,所述字符图像校正装置包括:
获取单元;
映射系数确定单元,连接所述获取单元;
映射单元,连接所述映射系数确定单元。 
CN2010202126764U 2010-06-01 2010-06-01 一种字符图像校正装置 Expired - Fee Related CN202058178U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010202126764U CN202058178U (zh) 2010-06-01 2010-06-01 一种字符图像校正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010202126764U CN202058178U (zh) 2010-06-01 2010-06-01 一种字符图像校正装置

Publications (1)

Publication Number Publication Date
CN202058178U true CN202058178U (zh) 2011-11-30

Family

ID=45018147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010202126764U Expired - Fee Related CN202058178U (zh) 2010-06-01 2010-06-01 一种字符图像校正装置

Country Status (1)

Country Link
CN (1) CN202058178U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046184A (zh) * 2015-07-22 2015-11-11 福建新大陆自动识别技术有限公司 基于畸变图像校正的二维码解码方法和系统
CN105306883A (zh) * 2014-07-22 2016-02-03 瑞萨电子株式会社 图像接收装置、图像传送系统和图像接收方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105306883A (zh) * 2014-07-22 2016-02-03 瑞萨电子株式会社 图像接收装置、图像传送系统和图像接收方法
CN105306883B (zh) * 2014-07-22 2020-03-03 瑞萨电子株式会社 图像接收装置、图像传送系统和图像接收方法
CN105046184A (zh) * 2015-07-22 2015-11-11 福建新大陆自动识别技术有限公司 基于畸变图像校正的二维码解码方法和系统
CN105046184B (zh) * 2015-07-22 2017-07-18 福建新大陆自动识别技术有限公司 基于畸变图像校正的二维码解码方法和系统

Similar Documents

Publication Publication Date Title
CN101847209B (zh) 一种字符图像校正方法
JP7099509B2 (ja) 産業機器ゲージのデジタル化及びアラームのためのコンピュータビジョンシステム
CN107993263B (zh) 环视系统自动标定方法、汽车、标定装置及存储介质
CN104794421B (zh) 一种qr码定位及识别方法
JP4172941B2 (ja) 土地区画データ作成方法および装置
CN111259878A (zh) 一种检测文本的方法和设备
CN104657982A (zh) 一种投影仪标定方法
CN112927306B (zh) 拍摄装置的标定方法、装置及终端设备
KR20110105614A (ko) 문자 인식 전처리 방법 및 장치
CN110443245A (zh) 一种非限制场景下的车牌区域的定位方法、装置及设备
CN113449692A (zh) 一种基于无人机的地图车道信息更新方法及其系统
CN114037992A (zh) 仪表示数识别方法、装置、电子设备及存储介质
CN108335266B (zh) 一种文档图像畸变的矫正方法
CN113808004B (zh) 图像变换装置、图像变换方法以及图像变换用计算机程序
CN111626241A (zh) 一种人脸检测方法及装置
CN202058178U (zh) 一种字符图像校正装置
CN111862208B (zh) 一种基于屏幕光通信的车辆定位方法、装置及服务器
CN110557622B (zh) 基于结构光的深度信息获取方法及装置、设备及介质
KR102076635B1 (ko) 산재된 고정 카메라를 이용한 파노라마 영상 생성 장치 및 방법
CN112613372B (zh) 一种室外环境视觉惯性slam方法及装置
CN113011293B (zh) 一种行道线参数实时提取方法
CN113850100A (zh) 一种校正二维码的方法和装置
CN112364693A (zh) 基于双目视觉的障碍识别方法、装置、设备及存储介质
CN112541943A (zh) 一种基于视觉路标的机器人定位方法
CN111597967A (zh) 一种红外图像多目标行人识别方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111130

Termination date: 20180601

CF01 Termination of patent right due to non-payment of annual fee