CN104834930B - 一种用于多系统平台的图像汉字查找方法 - Google Patents
一种用于多系统平台的图像汉字查找方法 Download PDFInfo
- Publication number
- CN104834930B CN104834930B CN201510269326.9A CN201510269326A CN104834930B CN 104834930 B CN104834930 B CN 104834930B CN 201510269326 A CN201510269326 A CN 201510269326A CN 104834930 B CN104834930 B CN 104834930B
- Authority
- CN
- China
- Prior art keywords
- image
- word
- looking
- chinese characters
- gray
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- 241001270131 Agaricus moelleri Species 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 claims description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/14—Transformations for image registration, e.g. adjusting or mapping for alignment of images
- G06T3/147—Transformations for image registration, e.g. adjusting or mapping for alignment of images using affine transformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明提供了一种用于多系统平台的图像汉字查找方法的技术方案,该方案的方法通过二值化处理,能有效的提取图像中的汉字,并且处理准确,利于使用。在该方案中先进行灰度处理,这样有利于通过阈值进行二值化处理;用户可以根据需要设定灰度阈值,便于调整,然后依次对汉字切割、匹配关键字,最后获得图像中的字。
Description
技术领域
本发明涉及的是一种用于多系统平台的图像中查找汉字的方法。
背景技术
在现有技术中,公知的技术是计算机已被广泛使用,但是操作系统平台多种多样,目前没有相应的从图像中查找汉字的方法,即使有的系统有这样的方法,也仅仅在这中系统中使用,无法推广,这是现有技术所存在的不足之处。
发明内容
本发明的目的就是针对现有技术所存在的不足,而提供一种用于多系统平台的图像汉字查找方法的技术方案,该方案的方法通过二值化处理,能有效的提取图像中的汉字,并且处理准确,利于使用。
本方案是通过如下技术措施来实现的:一种用于多系统平台的图像汉字查找方法,其特征在于包括如下步骤:
1)将图像做灰度处理;
2)设定灰度阈值,对图像进行二值化处理;
3)将图像旋转投影调整,搜索图像摆正的角度;
4)将图像切割成每一个字;
5)对于每个切割出的字与关键字进行匹配;
6)收集匹配结果。
所述的步骤2)中,所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。
所述的步骤3)中在旋转的过程中,进行仿真变换,统计每个角度下的非空白行的行数;若一行中有灰度值为255的像素则判定为非空白行,存在最多非空白行的角度判定为最佳角度。
搜索图像的角度范围为从-40度到40度。
所述的步骤4)中切割时依赖于文本行与行之间、字与字之间的空白,对于图像中包含比较多噪声的情况,需要预先做去噪处理。
对于切割出的字,要将字的边缘去掉不是字体的像素。
所述步骤5)将切割出的字缩放为与关键字生成的汉字图像相同大小,然后与关键字生成的每个汉字图像进行模板匹配。
所述的步骤6)中设定匹配阈值,收集所有大于阈值的匹配结果。
本方案的有益效果可根据对上述方案的叙述得知,由于在该方案中首先进行灰度处理,这样有利于通过阈值进行二值化处理;用户可以根据需要设定灰度阈值,便于调整;通过仿射变换,确定了x轴、y轴,沿旋转角度x轴或y轴旋转图像,可以调整图像的角度,这样有利于汉字的切割;旋转时,可以设定一条竖线,这样这条竖线对应的非空白行的角度就是最佳的角度,这样一旦图像扫描出现偏转时,也可以通过旋转调整图像的方向,利于切割;旋转角度为-40度到40度,这样就是避免了旋转过程中出现的重复;设定匹配阈值,这样超过匹配阈值的就是和关键字的图像匹配的。由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
具体实施方式
为能清楚说明本方案的技术特点,下面通过一个具体实施方式,对本方案进行阐述。
本方案的用于多系统平台的图像汉字查找方法,其特征在于包括如下步骤:
1)将图像做灰度处理;
2)设定灰度阈值,对图像进行二值化处理;所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域;
3)通过仿真变换,搜索图像摆正的最佳角度,角度范围为从-40度到40度,搜索过程中,统计每个角度下的非空白行的行数;若一行中有灰度值为255的像素则判定为非空白行,存在最多非空白行的角度判定为最佳角度;
4)将图像切割成每一个字;切割时依赖于文本行与行之间、字与字之间的空白,对于图像中包含比较多噪声的情况,需要预先做去噪处理;
5)对于每个切割出的汉字,通过边缘检测技术去掉无意义的像素,继而缩放为合适的大小,然后与关键字生成的每个汉字图像进行模板匹配,匹配方式使用平方差匹配法和归一化相关系数匹配法;将切割出的字缩放为与关键字生成的汉字图像相同大小,然后与关键字生成的每个汉字图像进行模板匹配;
6)设定匹配阈值,收集所有大于阈值的匹配结果。
本发明并不仅限于上述具体实施方式,本领域普通技术人员在本发明的实质范围内做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (6)
1.一种用于多系统平台的图像汉字查找方法,其特征在于包括如下步骤:
1)将图像做灰度处理;
2)设定灰度阈值,对图像进行二值化处理;所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域;
3)将图像旋转投影调整,搜索图像摆正的角度;在旋转的过程中,进行仿射变换,统计每个角度下的非空白行的行数;若一行中有灰度值为255的像素则判定为非空白行,存在最多非空白行的角度判定为最佳角度;
4)将图像切割成每一个字;
5)对于每个切割出的字与关键字进行匹配;
6)收集匹配结果。
2.根据权利要求1所述的用于多系统平台的图像汉字查找方法,其特征是:搜索图像的角度范围为从-40度到40度。
3.根据权利要求1所述的用于多系统平台的图像汉字查找方法,其特征是:所述的步骤4)中切割时依赖于文本行与行之间、字与字之间的空白,对于图像中包含比较多噪声的情况,需要预先做去噪处理。
4.根据权利要求3所述的用于多系统平台的图像汉字查找方法,其特征是:对于切割出的字,要将字的边缘去掉不是字体的像素。
5.根据权利要求1所述的用于多系统平台的图像汉字查找方法,其特征是:所述步骤5)将切割出的字缩放为与关键字生成的汉字图像相同大小,然后与关键字生成的每个汉字图像进行模板匹配。
6.根据权利要求5所述的用于多系统平台的图像汉字查找方法,其特征是:所述的步骤6)中设定匹配阈值,收集所有大于阈值的匹配结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510269326.9A CN104834930B (zh) | 2015-05-25 | 2015-05-25 | 一种用于多系统平台的图像汉字查找方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510269326.9A CN104834930B (zh) | 2015-05-25 | 2015-05-25 | 一种用于多系统平台的图像汉字查找方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104834930A CN104834930A (zh) | 2015-08-12 |
CN104834930B true CN104834930B (zh) | 2018-07-24 |
Family
ID=53812808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510269326.9A Active CN104834930B (zh) | 2015-05-25 | 2015-05-25 | 一种用于多系统平台的图像汉字查找方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104834930B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426887B (zh) * | 2015-10-30 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种文本图像校正的方法及装置 |
CN110765245B (zh) * | 2019-09-19 | 2023-08-01 | 平安科技(深圳)有限公司 | 基于大数据的情感正负判断方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102496019A (zh) * | 2011-12-08 | 2012-06-13 | 银江股份有限公司 | 一种车牌字符分割方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470094B1 (en) * | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
-
2015
- 2015-05-25 CN CN201510269326.9A patent/CN104834930B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102496019A (zh) * | 2011-12-08 | 2012-06-13 | 银江股份有限公司 | 一种车牌字符分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104834930A (zh) | 2015-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104484643B (zh) | 一种手写表格的智能识别方法及系统 | |
EP3091479B1 (en) | Method and apparatus for fingerprint identification | |
CN107464252A (zh) | 一种基于混合特征的可见光与红外异源图像识别方法 | |
Romero et al. | Influence of text line segmentation in handwritten text recognition | |
WO2017016448A1 (zh) | 一种qr码特征检测方法及系统 | |
CN102426647A (zh) | 一种台标识别的方法、装置 | |
CN112232332B (zh) | 一种基于视频序列的非接触式手掌检测方法 | |
CN104899601A (zh) | 一种手写维吾尔文单词识别方法 | |
CN106127265B (zh) | 一种基于激活力模型的图片中文本识别纠错方法 | |
CN105138983B (zh) | 基于加权部件模型和选择性搜索分割的行人检测方法 | |
CN104834930B (zh) | 一种用于多系统平台的图像汉字查找方法 | |
CN107038432B (zh) | 基于频率信息的指纹图像方向场提取方法 | |
Wang et al. | The research and realization of vehicle license plate character segmentation and recognition technology | |
CN104036280A (zh) | 基于感兴趣区域和聚类相结合的视频指纹方法 | |
CN107992869A (zh) | 用于倾斜文字校正的方法、装置及电子设备 | |
CN104933407A (zh) | 基于sift变换的指纹识别方法 | |
CN103500323B (zh) | 基于自适应灰度图像滤波的模板匹配方法 | |
CN111445386A (zh) | 基于文本内容四点检测的图像校正方法 | |
CN105303566B (zh) | 一种基于目标轮廓裁剪的sar图像目标方位角估计方法 | |
CN103902100B (zh) | 用于智能手绘输入的基于速度特征的笔划分割方法 | |
CN107679401A (zh) | 一种恶意网页识别方法和装置 | |
CN108897781B (zh) | 论文图形查重系统 | |
CN105069766A (zh) | 一种基于汉字图像轮廓特征描述的碑文修复方法 | |
CN104408452B (zh) | 一种基于旋转投影宽度的拉丁字符倾斜纠正方法及系统 | |
CN108764036A (zh) | 一种手写体藏文字丁识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Xinluo Avenue high tech Zone of Ji'nan City, Shandong province 250101 No. 1166 orsus Building 2 building 15-16 layer Applicant after: Shandong Zhongfu Information Industry Co., Ltd. Address before: Xinluo Avenue high tech Zone of Ji'nan City, Shandong province 250101 No. 1166 orsus Building 2 building 15-16 layer Applicant before: Shandong Zhongfu Information Industry Co., Ltd. |
|
COR | Change of bibliographic data | ||
GR01 | Patent grant | ||
GR01 | Patent grant |