CN104834930B - 一种用于多系统平台的图像汉字查找方法 - Google Patents

一种用于多系统平台的图像汉字查找方法 Download PDF

Info

Publication number
CN104834930B
CN104834930B CN201510269326.9A CN201510269326A CN104834930B CN 104834930 B CN104834930 B CN 104834930B CN 201510269326 A CN201510269326 A CN 201510269326A CN 104834930 B CN104834930 B CN 104834930B
Authority
CN
China
Prior art keywords
image
word
looking
chinese characters
gray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510269326.9A
Other languages
English (en)
Other versions
CN104834930A (zh
Inventor
万海山
朱广传
陈丹伟
任勋益
苗功勋
张璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANDONG ZHONGFU INFORMATION INDUSTRY Co Ltd
Original Assignee
SHANDONG ZHONGFU INFORMATION INDUSTRY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANDONG ZHONGFU INFORMATION INDUSTRY Co Ltd filed Critical SHANDONG ZHONGFU INFORMATION INDUSTRY Co Ltd
Priority to CN201510269326.9A priority Critical patent/CN104834930B/zh
Publication of CN104834930A publication Critical patent/CN104834930A/zh
Application granted granted Critical
Publication of CN104834930B publication Critical patent/CN104834930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/14Transformations for image registration, e.g. adjusting or mapping for alignment of images
    • G06T3/147Transformations for image registration, e.g. adjusting or mapping for alignment of images using affine transformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种用于多系统平台的图像汉字查找方法的技术方案,该方案的方法通过二值化处理,能有效的提取图像中的汉字,并且处理准确,利于使用。在该方案中先进行灰度处理,这样有利于通过阈值进行二值化处理;用户可以根据需要设定灰度阈值,便于调整,然后依次对汉字切割、匹配关键字,最后获得图像中的字。

Description

一种用于多系统平台的图像汉字查找方法
技术领域
本发明涉及的是一种用于多系统平台的图像中查找汉字的方法。
背景技术
在现有技术中,公知的技术是计算机已被广泛使用,但是操作系统平台多种多样,目前没有相应的从图像中查找汉字的方法,即使有的系统有这样的方法,也仅仅在这中系统中使用,无法推广,这是现有技术所存在的不足之处。
发明内容
本发明的目的就是针对现有技术所存在的不足,而提供一种用于多系统平台的图像汉字查找方法的技术方案,该方案的方法通过二值化处理,能有效的提取图像中的汉字,并且处理准确,利于使用。
本方案是通过如下技术措施来实现的:一种用于多系统平台的图像汉字查找方法,其特征在于包括如下步骤:
1)将图像做灰度处理;
2)设定灰度阈值,对图像进行二值化处理;
3)将图像旋转投影调整,搜索图像摆正的角度;
4)将图像切割成每一个字;
5)对于每个切割出的字与关键字进行匹配;
6)收集匹配结果。
所述的步骤2)中,所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。
所述的步骤3)中在旋转的过程中,进行仿真变换,统计每个角度下的非空白行的行数;若一行中有灰度值为255的像素则判定为非空白行,存在最多非空白行的角度判定为最佳角度。
搜索图像的角度范围为从-40度到40度。
所述的步骤4)中切割时依赖于文本行与行之间、字与字之间的空白,对于图像中包含比较多噪声的情况,需要预先做去噪处理。
对于切割出的字,要将字的边缘去掉不是字体的像素。
所述步骤5)将切割出的字缩放为与关键字生成的汉字图像相同大小,然后与关键字生成的每个汉字图像进行模板匹配。
所述的步骤6)中设定匹配阈值,收集所有大于阈值的匹配结果。
本方案的有益效果可根据对上述方案的叙述得知,由于在该方案中首先进行灰度处理,这样有利于通过阈值进行二值化处理;用户可以根据需要设定灰度阈值,便于调整;通过仿射变换,确定了x轴、y轴,沿旋转角度x轴或y轴旋转图像,可以调整图像的角度,这样有利于汉字的切割;旋转时,可以设定一条竖线,这样这条竖线对应的非空白行的角度就是最佳的角度,这样一旦图像扫描出现偏转时,也可以通过旋转调整图像的方向,利于切割;旋转角度为-40度到40度,这样就是避免了旋转过程中出现的重复;设定匹配阈值,这样超过匹配阈值的就是和关键字的图像匹配的。由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
具体实施方式
为能清楚说明本方案的技术特点,下面通过一个具体实施方式,对本方案进行阐述。
本方案的用于多系统平台的图像汉字查找方法,其特征在于包括如下步骤:
1)将图像做灰度处理;
2)设定灰度阈值,对图像进行二值化处理;所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域;
3)通过仿真变换,搜索图像摆正的最佳角度,角度范围为从-40度到40度,搜索过程中,统计每个角度下的非空白行的行数;若一行中有灰度值为255的像素则判定为非空白行,存在最多非空白行的角度判定为最佳角度;
4)将图像切割成每一个字;切割时依赖于文本行与行之间、字与字之间的空白,对于图像中包含比较多噪声的情况,需要预先做去噪处理;
5)对于每个切割出的汉字,通过边缘检测技术去掉无意义的像素,继而缩放为合适的大小,然后与关键字生成的每个汉字图像进行模板匹配,匹配方式使用平方差匹配法和归一化相关系数匹配法;将切割出的字缩放为与关键字生成的汉字图像相同大小,然后与关键字生成的每个汉字图像进行模板匹配;
6)设定匹配阈值,收集所有大于阈值的匹配结果。
本发明并不仅限于上述具体实施方式,本领域普通技术人员在本发明的实质范围内做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (6)

1.一种用于多系统平台的图像汉字查找方法,其特征在于包括如下步骤:
1)将图像做灰度处理;
2)设定灰度阈值,对图像进行二值化处理;所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域;
3)将图像旋转投影调整,搜索图像摆正的角度;在旋转的过程中,进行仿射变换,统计每个角度下的非空白行的行数;若一行中有灰度值为255的像素则判定为非空白行,存在最多非空白行的角度判定为最佳角度;
4)将图像切割成每一个字;
5)对于每个切割出的字与关键字进行匹配;
6)收集匹配结果。
2.根据权利要求1所述的用于多系统平台的图像汉字查找方法,其特征是:搜索图像的角度范围为从-40度到40度。
3.根据权利要求1所述的用于多系统平台的图像汉字查找方法,其特征是:所述的步骤4)中切割时依赖于文本行与行之间、字与字之间的空白,对于图像中包含比较多噪声的情况,需要预先做去噪处理。
4.根据权利要求3所述的用于多系统平台的图像汉字查找方法,其特征是:对于切割出的字,要将字的边缘去掉不是字体的像素。
5.根据权利要求1所述的用于多系统平台的图像汉字查找方法,其特征是:所述步骤5)将切割出的字缩放为与关键字生成的汉字图像相同大小,然后与关键字生成的每个汉字图像进行模板匹配。
6.根据权利要求5所述的用于多系统平台的图像汉字查找方法,其特征是:所述的步骤6)中设定匹配阈值,收集所有大于阈值的匹配结果。
CN201510269326.9A 2015-05-25 2015-05-25 一种用于多系统平台的图像汉字查找方法 Active CN104834930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510269326.9A CN104834930B (zh) 2015-05-25 2015-05-25 一种用于多系统平台的图像汉字查找方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510269326.9A CN104834930B (zh) 2015-05-25 2015-05-25 一种用于多系统平台的图像汉字查找方法

Publications (2)

Publication Number Publication Date
CN104834930A CN104834930A (zh) 2015-08-12
CN104834930B true CN104834930B (zh) 2018-07-24

Family

ID=53812808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510269326.9A Active CN104834930B (zh) 2015-05-25 2015-05-25 一种用于多系统平台的图像汉字查找方法

Country Status (1)

Country Link
CN (1) CN104834930B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426887B (zh) * 2015-10-30 2019-04-12 北京奇艺世纪科技有限公司 一种文本图像校正的方法及装置
CN110765245B (zh) * 2019-09-19 2023-08-01 平安科技(深圳)有限公司 基于大数据的情感正负判断方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496019A (zh) * 2011-12-08 2012-06-13 银江股份有限公司 一种车牌字符分割方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496019A (zh) * 2011-12-08 2012-06-13 银江股份有限公司 一种车牌字符分割方法

Also Published As

Publication number Publication date
CN104834930A (zh) 2015-08-12

Similar Documents

Publication Publication Date Title
CN104484643B (zh) 一种手写表格的智能识别方法及系统
EP3091479B1 (en) Method and apparatus for fingerprint identification
CN107464252A (zh) 一种基于混合特征的可见光与红外异源图像识别方法
Romero et al. Influence of text line segmentation in handwritten text recognition
WO2017016448A1 (zh) 一种qr码特征检测方法及系统
CN102426647A (zh) 一种台标识别的方法、装置
CN112232332B (zh) 一种基于视频序列的非接触式手掌检测方法
CN104899601A (zh) 一种手写维吾尔文单词识别方法
CN106127265B (zh) 一种基于激活力模型的图片中文本识别纠错方法
CN105138983B (zh) 基于加权部件模型和选择性搜索分割的行人检测方法
CN104834930B (zh) 一种用于多系统平台的图像汉字查找方法
CN107038432B (zh) 基于频率信息的指纹图像方向场提取方法
Wang et al. The research and realization of vehicle license plate character segmentation and recognition technology
CN104036280A (zh) 基于感兴趣区域和聚类相结合的视频指纹方法
CN107992869A (zh) 用于倾斜文字校正的方法、装置及电子设备
CN104933407A (zh) 基于sift变换的指纹识别方法
CN103500323B (zh) 基于自适应灰度图像滤波的模板匹配方法
CN111445386A (zh) 基于文本内容四点检测的图像校正方法
CN105303566B (zh) 一种基于目标轮廓裁剪的sar图像目标方位角估计方法
CN103902100B (zh) 用于智能手绘输入的基于速度特征的笔划分割方法
CN107679401A (zh) 一种恶意网页识别方法和装置
CN108897781B (zh) 论文图形查重系统
CN105069766A (zh) 一种基于汉字图像轮廓特征描述的碑文修复方法
CN104408452B (zh) 一种基于旋转投影宽度的拉丁字符倾斜纠正方法及系统
CN108764036A (zh) 一种手写体藏文字丁识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Xinluo Avenue high tech Zone of Ji'nan City, Shandong province 250101 No. 1166 orsus Building 2 building 15-16 layer

Applicant after: Shandong Zhongfu Information Industry Co., Ltd.

Address before: Xinluo Avenue high tech Zone of Ji'nan City, Shandong province 250101 No. 1166 orsus Building 2 building 15-16 layer

Applicant before: Shandong Zhongfu Information Industry Co., Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant