CN106373092A - 一种基于图像空间能量分布的汉字旋转矫正方法 - Google Patents

一种基于图像空间能量分布的汉字旋转矫正方法 Download PDF

Info

Publication number
CN106373092A
CN106373092A CN201610811309.8A CN201610811309A CN106373092A CN 106373092 A CN106373092 A CN 106373092A CN 201610811309 A CN201610811309 A CN 201610811309A CN 106373092 A CN106373092 A CN 106373092A
Authority
CN
China
Prior art keywords
image
sample image
rotation
sector
chinese character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610811309.8A
Other languages
English (en)
Inventor
宋旭晨
杨雯
高学
丁彦方
王志鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610811309.8A priority Critical patent/CN106373092A/zh
Publication of CN106373092A publication Critical patent/CN106373092A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明涉及一种基于图像空间能量分布的汉字旋转矫正方法。该方法包括:将原始图像和旋转图像分别进行等分扇形处理,分成M个扇形区域;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量;求出原样本图像和旋转样本图像归一化能量的互相关函数;根据互相关函数最大峰值对应的角度将旋转样本进行逆时针旋转,得到纠正的旋转样本。本发明通过对汉字图像空间能量分布计算,进行字符的旋转矫正,使得对图片张的字符识别率的到提高,提升了识别图像的工作效率,降低了工作的成本。

Description

一种基于图像空间能量分布的汉字旋转矫正方法
技术领域
本发明属于图像识别验证领域,尤其涉及基于图像空间能量分布的汉字旋转矫正方法。
背景技术
目前一些用于文档OCR 的方法如Fourier 和kNN 方法, 都是基于文档中所有字符的倾斜和旋转角度是一致的,这一假设前提。而实际上例如验证码等识别中上诉方法则完全失去准确性, 到不可用的程度. 因为文本行每个字体的旋转角度不同 , 传统的用于文档OCR 的方法如Fourier 和kNN 方法根本无从使用。因此,有必要提供一种基于图像空间能量分布的汉字旋转矫正方法。
发明内容
本发明的目的在于提供一种基于图像空间能量分布的汉字旋转矫正方法,旨在解决旋转汉字的角度纠正问题。
本发明采用的技术方案如下。
一种基于图像空间能量分布的汉字旋转矫正方法,包括以下步骤:将原始图像和旋转图像分别进行等分扇形处理,分成M个扇形区域;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量;求出原样本图像和旋转样本图像归一化能量的互相关函数;根据互相关函数最大峰值对应的角度将旋转样本进行逆时针旋转,得到纠正的旋转样本。
进一步优化实施地,对一个大小为的、背景为黑色的汉字图像,当它以图像中心为轴心逆时针旋转任意角度时,对原样本图像和旋转样本图像均以轴心为圆心、为半径的圆形区域,将该圆形区域平均分为个扇形,每个扇形所占的弧度为,则原样本图像所占弧度为的扇形所包含的归一化能量与旋转样本图像所占弧度为的扇形所包含的归一化能量大小相同,k=1~M;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量,分别表示为,这里均为长度为的横向量;的互相关函数表示为,则的最大峰值所对应的即为样本图像逆时针的旋转角度。将旋转样本图像顺时针旋转角度,即可得到纠正的样本图像。
与现有技术相比,本发明具有如下优点和技术效果:
本发明通过对汉字图像空间能量分布计算,进行字符的旋转矫正,使得对图片张的字符识别率的到提高,提升了识别图像的工作效率,降低了工作的成本。
附图说明
图1a和图1b分别为实例中将原始图像和旋转图像分别进行等分扇形处理的示意图。
图2a和图2b分别为原图像和旋转图像的归一化能量曲线。
图2c为基于脱机手写汉字图像环形的归一化能量互相关曲线。
图2d矫正后图像。
图3a和图3b分别为原图和旋转图。
图3c为改进的基于脱机手写汉字图像环形的归一化能量互相关曲线。
图3d为图3c中ABCDE对应的矫正图。
具体实施方式
以下结合附图和实例对本发明的具体实施作进一步说明,但本发明的实施和保护不限于此,以下若有未特别详细说明之处,均是本领域技术人员可参照现有技术实现的。
如图1a、图1b,对一个大小为的、背景为黑色(像素点的灰度值为0)的汉字图像,当它以图像中心为轴心逆时针旋转任意角度时,对原样本图像和旋转样本图像均“画”一个以轴心为圆心、为半径的圆形区域,将该圆形区域平均分为个扇形,每个扇形所占的弧度为,则原样本图像所占弧度为的扇形所包含的归一化能量与旋转样本图像所占弧度为的扇形所包含的归一化能量大小相同,如图2a、图2b。对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量,分别表示为,这里均为长度为的横向量;的互相关函数表示为,则的最大峰值所对应的即为样本图像逆时针的旋转角度。将旋转样本图像顺时针旋转角度,即可得到纠正的样本图像,如图2d。
引入极坐标,,则样本图像在笛卡尔坐标系中的逆时针旋转在极坐标中表示为简单的平移关系,即。在笛卡尔坐标系中,样本图像对应的二维傅里叶变换表示为;则在极坐标系中,,存在以下变换关系:
表明,若样本图像在空域中逆时针旋转角度,则相应的二维傅里叶变换在频域中也逆时针旋转同一角度;反之亦然。
一般地,现有的旋转样本图像的原样本图像并不能获知。对于一个特定的汉字字符集,对样本集中该字符所有样本相同位置的像素点求灰度平均值,得到的图像作为未知类别的旋转样本图像的原图像,记为,如图3a、图3b。对分别求归一化能量横向量,分别表示为,当的互相关函数可能存在多个取值相近的峰值时,如图3c,取最高的三个峰值所对应的作为未知样本类别的旋转图像的逆时针旋转角度,分别记为。将未知样本类别的旋转图像分别顺时针旋转角度,即得到三个纠正的样本图像。对于这种三候选集的方法可以提高字符的矫正能力。

Claims (2)

1.一种基于图像空间能量分布的汉字旋转矫正方法,其特征在于,包括以下步骤:将原始图像和旋转图像分别进行等分扇形处理,分成M个扇形区域;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量;求出原样本图像和旋转样本图像归一化能量的互相关函数;根据互相关函数最大峰值对应的角度将旋转样本进行逆时针旋转,得到纠正的旋转样本。
2. 根据权利要求1所述的一种基于图像空间能量分布的汉字旋转矫正方法,其特征在于,对一个大小为的、背景为黑色的汉字图像,当它以图像中心为轴心逆时针旋转任意角度时,对原样本图像和旋转样本图像均以轴心为圆心、为半径的圆形区域,将该圆形区域平均分为个扇形,每个扇形所占的弧度为,则原样本图像所占弧度为的扇形所包含的归一化能量与旋转样本图像所占弧度为的扇形所包含的归一化能量大小相同,k=1,2,3…M;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量,分别表示为,这里均为长度为的横向量;的互相关函数表示为,则的最大峰值所对应的即为样本图像逆时针的旋转角度;将旋转样本图像顺时针旋转角度,即可得到纠正的样本图像。
CN201610811309.8A 2016-09-09 2016-09-09 一种基于图像空间能量分布的汉字旋转矫正方法 Pending CN106373092A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610811309.8A CN106373092A (zh) 2016-09-09 2016-09-09 一种基于图像空间能量分布的汉字旋转矫正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610811309.8A CN106373092A (zh) 2016-09-09 2016-09-09 一种基于图像空间能量分布的汉字旋转矫正方法

Publications (1)

Publication Number Publication Date
CN106373092A true CN106373092A (zh) 2017-02-01

Family

ID=57899307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610811309.8A Pending CN106373092A (zh) 2016-09-09 2016-09-09 一种基于图像空间能量分布的汉字旋转矫正方法

Country Status (1)

Country Link
CN (1) CN106373092A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934763A (zh) * 2017-04-17 2017-07-07 北京果毅科技有限公司 全景摄像机、行车记录仪、图像处理方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101697200A (zh) * 2009-09-25 2010-04-21 华南理工大学 一种旋转无关的手写中文草书词组识别方法
CN102103693A (zh) * 2011-03-23 2011-06-22 安徽科大讯飞信息科技股份有限公司 一种手写字识别方法
CN102831418A (zh) * 2011-06-17 2012-12-19 汉王科技股份有限公司 手写体汉字倾斜矫正方法及装置
CN104182732A (zh) * 2014-08-12 2014-12-03 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
WO2015049392A1 (en) * 2013-10-04 2015-04-09 I.R.I.S. A method and system for improving the quality of colour images
US20150193667A1 (en) * 2014-01-08 2015-07-09 Qualcomm Incorporated Processing text images with shadows
CN105096269A (zh) * 2015-07-21 2015-11-25 北京交通大学 基于畸变直线结构检测的图像径向畸变矫正的方法及系统
CN105930788A (zh) * 2016-04-18 2016-09-07 太原理工大学 非下采样轮廓波和主成分分析相结合的人脸识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101697200A (zh) * 2009-09-25 2010-04-21 华南理工大学 一种旋转无关的手写中文草书词组识别方法
CN102103693A (zh) * 2011-03-23 2011-06-22 安徽科大讯飞信息科技股份有限公司 一种手写字识别方法
CN102831418A (zh) * 2011-06-17 2012-12-19 汉王科技股份有限公司 手写体汉字倾斜矫正方法及装置
WO2015049392A1 (en) * 2013-10-04 2015-04-09 I.R.I.S. A method and system for improving the quality of colour images
US20150193667A1 (en) * 2014-01-08 2015-07-09 Qualcomm Incorporated Processing text images with shadows
CN104182732A (zh) * 2014-08-12 2014-12-03 南京师范大学 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法
CN105096269A (zh) * 2015-07-21 2015-11-25 北京交通大学 基于畸变直线结构检测的图像径向畸变矫正的方法及系统
CN105930788A (zh) * 2016-04-18 2016-09-07 太原理工大学 非下采样轮廓波和主成分分析相结合的人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BINU P.CHACKO等: "Handwritten character recognition using wavelet energy and extreme learning machine", 《INTERNATIONAL JOURNAL OF MACHINE LEARNING AND CYBERNETICS》 *
黄盛明: "联机手写汉字的旋转无关识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934763A (zh) * 2017-04-17 2017-07-07 北京果毅科技有限公司 全景摄像机、行车记录仪、图像处理方法和装置
CN106934763B (zh) * 2017-04-17 2023-08-22 北京灵起科技有限公司 全景摄像机、行车记录仪、图像处理方法和装置

Similar Documents

Publication Publication Date Title
US9824258B2 (en) Method and apparatus for fingerprint identification
Lu et al. Perspective rectification of document images using fuzzy set and morphological operations
CN107464252A (zh) 一种基于混合特征的可见光与红外异源图像识别方法
CN106709500B (zh) 一种图像特征匹配的方法
CN103942797B (zh) 基于直方图和超像素的场景图像文字检测方法及系统
CN104298990B (zh) 一种基于骨架图的快速图形匹配与识别的方法
CN103208004A (zh) 票据信息区域自动识别和提取方法及设备
CN105654421B (zh) 基于变换不变低秩纹理的投影变换图像匹配方法
Sharma et al. Word-wise script identification from video frames
CN108986038A (zh) 一种基于改进Hough变换的轮毂轮廓检测方法
CN106570475B (zh) 一种紫砂壶印章检索方法
CN106503694A (zh) 基于八邻域特征的数字识别方法
CN107784263B (zh) 基于改进加速鲁棒特征的平面旋转人脸检测的方法
CN104657728A (zh) 基于计算机视觉的条码识别系统
CN114648511A (zh) 一种大肠杆菌轮廓的精确提取及识别方法
Dong et al. Robust ellipse detection via arc segmentation and classification
Chen Chinese coin recognition based on unwrapped image and rotation invariant template matching
CN104680142A (zh) 一种基于特征点集分割和rst不变特征的四联指比对方法
CN106373092A (zh) 一种基于图像空间能量分布的汉字旋转矫正方法
Zhichao et al. Two modality-based bi-finger vein verification system
Shukla et al. An approach for skew detection using hough transform
CN112396638A (zh) 一种图像处理方法、终端和计算机可读存储介质
Wang et al. Unified detection of skewed rotation, reflection and translation symmetries from affine invariant contour features
CN115359249A (zh) 一种手掌图像roi区域提取方法及系统
Wu et al. Face detection based on YCbCr Gaussian model and KL transform

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170201