CN106373092A - 一种基于图像空间能量分布的汉字旋转矫正方法 - Google Patents
一种基于图像空间能量分布的汉字旋转矫正方法 Download PDFInfo
- Publication number
- CN106373092A CN106373092A CN201610811309.8A CN201610811309A CN106373092A CN 106373092 A CN106373092 A CN 106373092A CN 201610811309 A CN201610811309 A CN 201610811309A CN 106373092 A CN106373092 A CN 106373092A
- Authority
- CN
- China
- Prior art keywords
- image
- sample image
- rotation
- sector
- chinese character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 238000005314 correlation function Methods 0.000 claims abstract description 6
- 238000010606 normalization Methods 0.000 claims abstract description 4
- 238000009987 spinning Methods 0.000 claims description 7
- 239000000729 antidote Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract 1
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明涉及一种基于图像空间能量分布的汉字旋转矫正方法。该方法包括:将原始图像和旋转图像分别进行等分扇形处理,分成M个扇形区域;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量;求出原样本图像和旋转样本图像归一化能量的互相关函数;根据互相关函数最大峰值对应的角度将旋转样本进行逆时针旋转,得到纠正的旋转样本。本发明通过对汉字图像空间能量分布计算,进行字符的旋转矫正,使得对图片张的字符识别率的到提高,提升了识别图像的工作效率,降低了工作的成本。
Description
技术领域
本发明属于图像识别验证领域,尤其涉及基于图像空间能量分布的汉字旋转矫正方法。
背景技术
目前一些用于文档OCR 的方法如Fourier 和kNN 方法, 都是基于文档中所有字符的倾斜和旋转角度是一致的,这一假设前提。而实际上例如验证码等识别中上诉方法则完全失去准确性, 到不可用的程度. 因为文本行每个字体的旋转角度不同 , 传统的用于文档OCR 的方法如Fourier 和kNN 方法根本无从使用。因此,有必要提供一种基于图像空间能量分布的汉字旋转矫正方法。
发明内容
本发明的目的在于提供一种基于图像空间能量分布的汉字旋转矫正方法,旨在解决旋转汉字的角度纠正问题。
本发明采用的技术方案如下。
一种基于图像空间能量分布的汉字旋转矫正方法,包括以下步骤:将原始图像和旋转图像分别进行等分扇形处理,分成M个扇形区域;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量;求出原样本图像和旋转样本图像归一化能量的互相关函数;根据互相关函数最大峰值对应的角度将旋转样本进行逆时针旋转,得到纠正的旋转样本。
进一步优化实施地,对一个大小为的、背景为黑色的汉字图像,当它以图像中心为轴心逆时针旋转任意角度时,对原样本图像和旋转样本图像均以轴心为圆心、为半径的圆形区域,将该圆形区域平均分为个扇形,每个扇形所占的弧度为,则原样本图像所占弧度为的扇形所包含的归一化能量与旋转样本图像所占弧度为的扇形所包含的归一化能量大小相同,k=1~M;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量,分别表示为和,这里和均为长度为的横向量;和的互相关函数表示为,则的最大峰值所对应的即为样本图像逆时针的旋转角度。将旋转样本图像顺时针旋转角度,即可得到纠正的样本图像。
与现有技术相比,本发明具有如下优点和技术效果:
本发明通过对汉字图像空间能量分布计算,进行字符的旋转矫正,使得对图片张的字符识别率的到提高,提升了识别图像的工作效率,降低了工作的成本。
附图说明
图1a和图1b分别为实例中将原始图像和旋转图像分别进行等分扇形处理的示意图。
图2a和图2b分别为原图像和旋转图像的归一化能量曲线。
图2c为基于脱机手写汉字图像环形的归一化能量互相关曲线。
图2d矫正后图像。
图3a和图3b分别为原图和旋转图。
图3c为改进的基于脱机手写汉字图像环形的归一化能量互相关曲线。
图3d为图3c中ABCDE对应的矫正图。
具体实施方式
以下结合附图和实例对本发明的具体实施作进一步说明,但本发明的实施和保护不限于此,以下若有未特别详细说明之处,均是本领域技术人员可参照现有技术实现的。
如图1a、图1b,对一个大小为的、背景为黑色(像素点的灰度值为0)的汉字图像,当它以图像中心为轴心逆时针旋转任意角度时,对原样本图像和旋转样本图像均“画”一个以轴心为圆心、为半径的圆形区域,将该圆形区域平均分为个扇形,每个扇形所占的弧度为,则原样本图像所占弧度为的扇形所包含的归一化能量与旋转样本图像所占弧度为的扇形所包含的归一化能量大小相同,如图2a、图2b。对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量,分别表示为和,这里和均为长度为的横向量;和的互相关函数表示为,则的最大峰值所对应的即为样本图像逆时针的旋转角度。将旋转样本图像顺时针旋转角度,即可得到纠正的样本图像,如图2d。
引入极坐标,,,则样本图像在笛卡尔坐标系中的逆时针旋转在极坐标中表示为简单的平移关系,即。在笛卡尔坐标系中,样本图像对应的二维傅里叶变换表示为;则在极坐标系中,,,存在以下变换关系:
式表明,若样本图像在空域中逆时针旋转角度,则相应的二维傅里叶变换在频域中也逆时针旋转同一角度;反之亦然。
一般地,现有的旋转样本图像的原样本图像并不能获知。对于一个特定的汉字字符集,对样本集中该字符所有样本相同位置的像素点求灰度平均值,得到的图像作为未知类别的旋转样本图像的原图像,记为,如图3a、图3b。对和分别求归一化能量横向量,分别表示为和,当和的互相关函数可能存在多个取值相近的峰值时,如图3c,取最高的三个峰值所对应的作为未知样本类别的旋转图像的逆时针旋转角度,分别记为,,。将未知样本类别的旋转图像分别顺时针旋转角度,,,即得到三个纠正的样本图像。对于这种三候选集的方法可以提高字符的矫正能力。
Claims (2)
1.一种基于图像空间能量分布的汉字旋转矫正方法,其特征在于,包括以下步骤:将原始图像和旋转图像分别进行等分扇形处理,分成M个扇形区域;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量;求出原样本图像和旋转样本图像归一化能量的互相关函数;根据互相关函数最大峰值对应的角度将旋转样本进行逆时针旋转,得到纠正的旋转样本。
2. 根据权利要求1所述的一种基于图像空间能量分布的汉字旋转矫正方法,其特征在于,对一个大小为的、背景为黑色的汉字图像,当它以图像中心为轴心逆时针旋转任意角度时,对原样本图像和旋转样本图像均以轴心为圆心、为半径的圆形区域,将该圆形区域平均分为个扇形,每个扇形所占的弧度为,则原样本图像所占弧度为的扇形所包含的归一化能量与旋转样本图像所占弧度为的扇形所包含的归一化能量大小相同,k=1,2,3…M;对原样本图像和旋转样本图像的所有扇形区域分别求归一化能量,分别表示为和,这里和均为长度为的横向量;和的互相关函数表示为,则的最大峰值所对应的即为样本图像逆时针的旋转角度;将旋转样本图像顺时针旋转角度,即可得到纠正的样本图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610811309.8A CN106373092A (zh) | 2016-09-09 | 2016-09-09 | 一种基于图像空间能量分布的汉字旋转矫正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610811309.8A CN106373092A (zh) | 2016-09-09 | 2016-09-09 | 一种基于图像空间能量分布的汉字旋转矫正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106373092A true CN106373092A (zh) | 2017-02-01 |
Family
ID=57899307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610811309.8A Pending CN106373092A (zh) | 2016-09-09 | 2016-09-09 | 一种基于图像空间能量分布的汉字旋转矫正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106373092A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934763A (zh) * | 2017-04-17 | 2017-07-07 | 北京果毅科技有限公司 | 全景摄像机、行车记录仪、图像处理方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101697200A (zh) * | 2009-09-25 | 2010-04-21 | 华南理工大学 | 一种旋转无关的手写中文草书词组识别方法 |
CN102103693A (zh) * | 2011-03-23 | 2011-06-22 | 安徽科大讯飞信息科技股份有限公司 | 一种手写字识别方法 |
CN102831418A (zh) * | 2011-06-17 | 2012-12-19 | 汉王科技股份有限公司 | 手写体汉字倾斜矫正方法及装置 |
CN104182732A (zh) * | 2014-08-12 | 2014-12-03 | 南京师范大学 | 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法 |
WO2015049392A1 (en) * | 2013-10-04 | 2015-04-09 | I.R.I.S. | A method and system for improving the quality of colour images |
US20150193667A1 (en) * | 2014-01-08 | 2015-07-09 | Qualcomm Incorporated | Processing text images with shadows |
CN105096269A (zh) * | 2015-07-21 | 2015-11-25 | 北京交通大学 | 基于畸变直线结构检测的图像径向畸变矫正的方法及系统 |
CN105930788A (zh) * | 2016-04-18 | 2016-09-07 | 太原理工大学 | 非下采样轮廓波和主成分分析相结合的人脸识别方法 |
-
2016
- 2016-09-09 CN CN201610811309.8A patent/CN106373092A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101697200A (zh) * | 2009-09-25 | 2010-04-21 | 华南理工大学 | 一种旋转无关的手写中文草书词组识别方法 |
CN102103693A (zh) * | 2011-03-23 | 2011-06-22 | 安徽科大讯飞信息科技股份有限公司 | 一种手写字识别方法 |
CN102831418A (zh) * | 2011-06-17 | 2012-12-19 | 汉王科技股份有限公司 | 手写体汉字倾斜矫正方法及装置 |
WO2015049392A1 (en) * | 2013-10-04 | 2015-04-09 | I.R.I.S. | A method and system for improving the quality of colour images |
US20150193667A1 (en) * | 2014-01-08 | 2015-07-09 | Qualcomm Incorporated | Processing text images with shadows |
CN104182732A (zh) * | 2014-08-12 | 2014-12-03 | 南京师范大学 | 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法 |
CN105096269A (zh) * | 2015-07-21 | 2015-11-25 | 北京交通大学 | 基于畸变直线结构检测的图像径向畸变矫正的方法及系统 |
CN105930788A (zh) * | 2016-04-18 | 2016-09-07 | 太原理工大学 | 非下采样轮廓波和主成分分析相结合的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
BINU P.CHACKO等: "Handwritten character recognition using wavelet energy and extreme learning machine", 《INTERNATIONAL JOURNAL OF MACHINE LEARNING AND CYBERNETICS》 * |
黄盛明: "联机手写汉字的旋转无关识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934763A (zh) * | 2017-04-17 | 2017-07-07 | 北京果毅科技有限公司 | 全景摄像机、行车记录仪、图像处理方法和装置 |
CN106934763B (zh) * | 2017-04-17 | 2023-08-22 | 北京灵起科技有限公司 | 全景摄像机、行车记录仪、图像处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9824258B2 (en) | Method and apparatus for fingerprint identification | |
Lu et al. | Perspective rectification of document images using fuzzy set and morphological operations | |
CN107464252A (zh) | 一种基于混合特征的可见光与红外异源图像识别方法 | |
CN106709500B (zh) | 一种图像特征匹配的方法 | |
CN103942797B (zh) | 基于直方图和超像素的场景图像文字检测方法及系统 | |
CN104298990B (zh) | 一种基于骨架图的快速图形匹配与识别的方法 | |
CN103208004A (zh) | 票据信息区域自动识别和提取方法及设备 | |
CN105654421B (zh) | 基于变换不变低秩纹理的投影变换图像匹配方法 | |
Sharma et al. | Word-wise script identification from video frames | |
CN108986038A (zh) | 一种基于改进Hough变换的轮毂轮廓检测方法 | |
CN106570475B (zh) | 一种紫砂壶印章检索方法 | |
CN106503694A (zh) | 基于八邻域特征的数字识别方法 | |
CN107784263B (zh) | 基于改进加速鲁棒特征的平面旋转人脸检测的方法 | |
CN104657728A (zh) | 基于计算机视觉的条码识别系统 | |
CN114648511A (zh) | 一种大肠杆菌轮廓的精确提取及识别方法 | |
Dong et al. | Robust ellipse detection via arc segmentation and classification | |
Chen | Chinese coin recognition based on unwrapped image and rotation invariant template matching | |
CN104680142A (zh) | 一种基于特征点集分割和rst不变特征的四联指比对方法 | |
CN106373092A (zh) | 一种基于图像空间能量分布的汉字旋转矫正方法 | |
Zhichao et al. | Two modality-based bi-finger vein verification system | |
Shukla et al. | An approach for skew detection using hough transform | |
CN112396638A (zh) | 一种图像处理方法、终端和计算机可读存储介质 | |
Wang et al. | Unified detection of skewed rotation, reflection and translation symmetries from affine invariant contour features | |
CN115359249A (zh) | 一种手掌图像roi区域提取方法及系统 | |
Wu et al. | Face detection based on YCbCr Gaussian model and KL transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170201 |