CN105654087A - 一种基于彩色模板的脱机手写字符提取方法 - Google Patents
一种基于彩色模板的脱机手写字符提取方法 Download PDFInfo
- Publication number
- CN105654087A CN105654087A CN201511017969.0A CN201511017969A CN105654087A CN 105654087 A CN105654087 A CN 105654087A CN 201511017969 A CN201511017969 A CN 201511017969A CN 105654087 A CN105654087 A CN 105654087A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- channel
- template
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Abstract
本发明提供一种基于彩色模板的脱机手写字符提取方法,包括如下步骤:S11,在包含彩色方格及辅助线的预设模板中获取书写区域的模板图像;S12,根据字符和边框的特性,在所述模板图像中提取黑色通道和彩色通道;黑色通道用于保存字符笔迹特征;彩色通道用于保存所述预设模板的边框特征;S13,对S12中的黑色通道和彩色通道进行二值化处理,得到二值化图像,并在二值化图像中除去杂点,得到规范图像;S14,在规范图像中,根据所述彩色通道的预设网格分割黑色通道的图像,分割后得到黑色特征图像,作为提取的手写字符。
Description
技术领域
本发明属于图像识别中利用计算机、智能手机、平板电脑、摄像头等设备对脱机手写字符进行识别的技术领域,具体涉及一种基于彩色模板的脱机手写字符提取方法。
背景技术
现有技术中,脱机手写识别系统一般包含字符分割、特征提取、字符识别三个主要的步骤,其中字符分割是手写识别中的关键部分。将连接在一起的字符准确的分割出来在最近几十年的研究中提出了以下几种方法:一种是基于间隔和峰值的方法,这种方法利用竖向的统计值的大小来分割字符;第二种是基于搜索的分割方法,这种方法利用预先训练好的类别来寻找匹配的字符,并进行分割;第三种方法是基于混合的方法,这种方法结合前面两种方法,综合分析出最优的分割方法。但是,这些方法都不能够完全准确地解决脱机手写字符的分割问题,更不能有效准确的提取到字符。
发明内容
有鉴于此,本发明的目的在于克服现有技术的不足,提供一种基于彩色模板的脱机手写字符提取方法。
为实现上述目的,本发明采取以下技术方案:
该方法具体实现步骤如下:
一种基于彩色模板的脱机手写字符提取方法,包括如下步骤:
S11,在预设模板中获取书写区域的模板图像;
S12,根据字符和边框的特性,在所述模板图像中提取黑色通道和彩色通道;黑色通道用于保存字符笔迹特征;彩色通道用于保存所述预设模板的边框特征;
S13,对S12中的黑色通道和彩色通道进行二值化处理,得到二值化图像,并在二值化图像中除去杂点,得到规范图像;
S14,在规范图像中,根据所述彩色通道的预设网格分割黑色通道的图像,分割后得到黑色特征图像,作为提取的手写字符。
优选的,所述预设模板为设有多个字符格的模板;所述字符格子的颜色为彩色。
优选的,所述字符格子的边框颜色用于根据CMYK配比区分黑色的边框;CMYK印刷四分色,是彩色印刷时采用的一种套色模式,利用色料的三原色混色原理,加上黑色油墨,共计四种颜色混合叠加,形成彩色效果。
优选的,S12中,获取黑色通道的方法为:
将模板图像转换为RGB模式下的图像,则RGB模式下的图像中每个通道的最大值为255,最小值为0;
设黑色通道为K,则K=MIN(255-R,MIN(255-G,255-B))。
优选的,S12中,获取彩色通道的方法为:
设彩色通道为C,将模板图像转换为RGB模式下的图像;RGB模式包含3个通道,分别为R:红,G:绿,B:蓝;
当彩色通道为红色通道,则C=RGB(1);
当彩色通道为绿色通道,则C=RGB(2);
当彩色通道为蓝色通道,则C=RGB(3)。
优选的,S13中,去除杂点的方法为:
由于成像的环境会导致在K'中会有杂点(即一小部分不属于字符笔迹的点(iz,jz)也有可能会K'(iz,jz)==1),从而影响字符的提取和识别。
在二值化后的在彩色通道中获取边框特征;
设彩色通道C二值化后的图像为C',C'中包含了边框特征,如果C'(i,j)==1则表示点(i,j)为边框中的一点,其中i为图像的横坐标,j为图像的纵坐标;如果C'(i,j)≠1,则表示点(i,j)不是边框上的点;
根据CMYK原理,设黑色通道K二值化后的图像为K',K'中包含了字符特征,如果K'(i,j)==1则表示点(i,j)为字符笔迹中的一点;如果K'(i,j)≠1则表示点(i,j)不是字符笔迹中的一点;
去除杂点的具体方法为,对K'中所有非0点进行扫描,并进行杂点去除:
其中Round(C',i,j,r)表示以r为半径的区域在图像C'中,以点(i,j)为圆心;如果Round(C',i,j,r)>0则表示在以点(i,j)为圆心,以r为半径的区域内存在边框;否则均视为杂点,去除杂点。
在二值化后的在彩色通道中获取边框特征;
获取边框特征外以r为半径的像素,作为杂点;r为自然数;
除去杂点。
优选的,S14中,提取手写字符的方法具体为:
设规范图像在预设模板的区域R(x,y,w,h);其中x、y为所述预设网格的横纵坐标;w、h为所述预设网格的宽度和高度;x、y、w、y均为自然数;
通过区域R向四周扩充k个像素点,得到候选区域R'(x-k,y-k,w+2k,h+2k);其中k为自然数;
在候选区域R'中将黑色通道的图像通过归一化处理,得到黑色特征图像,作为提取的手写字符。
本发明采用如上技术方案,具有如下有益效果:
通过本发明的预设模板中设有网格,限制字符的书写范围,规范书写,同时成像后可以快速确定书写区域;通过本发明的网格线的色彩与书写字体颜色的区分,可快速区分字符和边框,大大降低了手动书写字符的提取过程中背景干扰与切割难度,为手写字符的识别提供了新的解决方案,防止了去除字符与边框重叠的部分,达到了字符提取的完整性;对于英文字符、书写、公式符号、汉字等各种手写字符的脱机识别,都有重要意义。
附图说明
图1是本发明中获取的字符模板示意图;
图2是本发明中扫描图像的K通道示意图;
图3.1-图3.3是本发明中拍摄图像的去除杂点前后K通道示意图;
图4是本发明中对字符进行提取的示意图。
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
为了解决字符识别中字符分割不准确的问题,本发明提出了一种基于彩色模板的脱机手写字符提取方法,采用网格或辅助线的设计限定书写规范,有效解决字符连笔的问题,有效的解决了字符之间的交叉提取字符特征的难点,确保字符的准确分割。
本发明在书写纸张上设置字符书写的小方格区域,通过这个区域来限制字符的书写范围,同时成像后可以快速的确定文字书写区域;
本发明将小方格的框线设置为与书写笔迹颜色不同的彩色(依据CMYK配色,彩色色度包括但不限于100%黄、100%蓝或红、黄、蓝各比例混色方式灵活调整的色度)以区分笔迹,在字符笔迹与方格边框相交后,仍可快速的区分出字符和边框,防止了去除字符与边框重叠的部分。从而达到了字符提取的完整性。
根据书写的环境需要,在预设模板中可以设置一定数量的网格,在本实施例中以8个网格举例说明;如图1-4所示,本发明的实现方法包括:
S11,在预设模板中获取书写区域的模板图像;
S12,根据字符和边框的特性,在模板图像中提取黑色通道和彩色通道;黑色通道用于保存字符笔迹特征;彩色通道用于保存预设模板的边框特征;在本实施例中彩色通道以蓝色通道举例说明;则蓝色通道注意用于保存边框的特征;
S13,对S12中的黑色通道和彩色通道进行二值化处理,得到二值化图像,并在二值化图像中除去杂点,得到规范图像;
S14,在规范图像中,根据彩色通道的预设网格分割黑色通道的图像,分割后得到黑色特征图像,作为提取的手写字符。
预设模板为设有多个字符格的模板;字符格子的颜色为彩色。
字符格子的边框颜色用于根据CMYK配比区分黑色的边框。
其中,S12中,获取黑色通道的方法为:
将模板图像转换为RGB模式下的图像,则RGB模式下的图像中每个通道的最大值为255,最小值为0;
设黑色通道为K,则K=MIN(255-R,MIN(255-G,255-B))。
其中,S12中,获取彩色通道的方法为:
设彩色通道为C,将模板图像转换为RGB模式下的图像;RGB模式包含3个通道,分别为R:红,G:绿,B:蓝;
当彩色通道为红色通道,则C=RGB(1);
当彩色通道为绿色通道,则C=RGB(2);
当彩色通道为蓝色通道,则C=RGB(3)。
其中,S13中,对于该步骤的主要用途在于拍摄或校正图像时可能会导致一些形变导致了黑色通道在图像二值化后再边框周围形成一些杂点,故此为了去除这些杂点而实施本步骤:
在二值化后的在彩色通道中获取边框特征;
设彩色通道C二值化后的图像为C',C'中包含了边框特征,如果C'(i,j)==1则表示点(i,j)为边框中的一点,其中i为图像的横坐标,j为图像的纵坐标;如果C'(i,j)≠1,则表示点(i,j)不是边框上的点;
根据CMYK原理,设黑色通道K二值化后的图像为K',K'中包含了字符特征,如果K'(i,j)==1则表示点(i,j)为字符笔迹中的一点;如果K'(i,j)≠1则表示点(i,j)不是字符笔迹中的一点;
去除杂点的具体方法为,对K'中所有非0点进行扫描,并进行杂点去除:
其中Round(C',i,j,r)表示以r为半径的区域在图像C'中,以点(i,j)为圆心;如果Round(C',i,j,r)>0则表示在以点(i,j)为圆心,以r为半径的区域内存在边框;否则均视为杂点,去除杂点。
通过此方法即可除去杂点。
在去除完毕字符周围的杂点后,提取手写字符的方法具体为:
设规范图像在预设模板的区域R(x,y,w,h);其中x、y为预设网格的横纵坐标;w、h为预设网格的宽度和高度;x、y、w、y均为自然数;
考虑到成像过程中带来的图像变形,故此通过区域R向四周扩充k个像素点,得到候选区域R'(x-k,y-k,w+2k,h+2k);其中k为自然数;
在候选区域R'(如果图像未变形,则可直接采用R)中将黑色通道的图像通过归一化处理,得到黑色特征图像,作为提取的手写字符。
通过本发明,首先,该发明利用预设的彩色网格或者辅助线模板限定书写规范,并基于网格的范围来提取字符;其次,该发明通过书写笔迹色彩与模板彩色的色彩差来准备的定位和消除方格,避免了字符和网格相交时难以区分的问题;最后,该发明针对扫描图像可以直接使用,同时该发明针对手机或其他移动设备拍照而产生的颜色变化也提出了相应的解决方案。
本发明不局限于上述最佳实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是具有与本申请相同或相近似的技术方案,均落在本发明的保护范围之内。
Claims (7)
1.一种基于彩色模板的脱机手写字符提取方法,其特征在于,包括如下步骤:
S11,在预设模板中获取书写区域的模板图像;
S12,根据字符和边框的特性,在所述模板图像中提取黑色通道和彩色通道;黑色通道用于保存字符笔迹特征;彩色通道用于保存所述预设模板的边框特征;
S13,对S12中的黑色通道和彩色通道进行二值化处理,得到二值化图像,并在二值化图像中除去杂点,得到规范图像;
S14,在规范图像中,根据所述彩色通道的预设网格分割黑色通道的图像,分割后得到黑色特征图像,作为提取的手写字符。
2.根据权利要求1所述的基于彩色模板的脱机手写字符提取方法,其特征在于:所述预设模板为设有多个字符格及辅助线的模板;所述字符格子及辅助线的颜色为彩色。
3.根据权利要求1所述的基于彩色模板的脱机手写字符提取方法,其特征在于:所述字符格子的边框颜色用于根据CMYK配比区分黑色的边框。
4.根据权利要求1所述的基于彩色模板的脱机手写字符提取方法,其特征在于:S12中,获取黑色通道的方法为:
将模板图像转换为RGB模式下的图像,则RGB模式下的图像中每个通道的最大值为255,最小值为0;
设黑色通道为K,则K=MIN(255-R,MIN(255-G,255-B))。
5.根据权利要求1所述的基于彩色模板的脱机手写字符提取方法,其特征在于:S12中,获取彩色通道的方法为:
设彩色通道为C,将模板图像转换为RGB模式下的图像;RGB模式包含3个通道,分别为R:红,G:绿,B:蓝;
当彩色通道为红色通道,则C=RGB(1);
当彩色通道为绿色通道,则C=RGB(2);
当彩色通道为蓝色通道,则C=RGB(3)。
6.根据权利要求1所述的基于彩色模板的脱机手写字符提取方法,其特征在于:S13中,去除杂点的方法为:
在二值化后的在彩色通道中获取边框特征;
设彩色通道C二值化后的图像为C',C'中包含了边框特征,如果C'(i,j)==1则表示点(i,j)为边框中的一点,其中i为图像的横坐标,j为图像的纵坐标;如果C'(i,j)≠1,则表示点(i,j)不是边框上的点;
根据CMYK原理,设黑色通道K二值化后的图像为K',K'中包含了字符特征,如果K'(i,j)==1则表示点(i,j)为字符笔迹中的一点;如果K'(i,j)≠1则表示点(i,j)不是字符笔迹中的一点;
去除杂点的具体方法为,对K'中所有非0点进行扫描,并进行杂点去除:
其中Round(C',i,j,r)表示以r为半径的区域在图像C'中,以点(i,j)为圆心;如果Round(C',i,j,r)>0则表示在以点(i,j)为圆心,以r为半径的区域内存在边框;否则均视为杂点,去除杂点。
7.根据权利要求1所述的基于彩色模板的脱机手写字符提取方法,其特征在于:S14中,提取手写字符的方法具体为:
设规范图像在预设模板的区域R(x,y,w,h);其中x、y为所述预设网格的横纵坐标;w、h为所述预设网格的宽度和高度;x、y、w、y均为自然数;
通过区域R向四周扩充k个像素点,得到候选区域R'(x-k,y-k,w+2k,h+2k);其中k为自然数;
在候选区域R'中将黑色通道的图像通过归一化处理,得到黑色特征图像,作为提取的手写字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511017969.0A CN105654087B (zh) | 2015-12-30 | 2015-12-30 | 一种基于彩色模板的脱机手写字符提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511017969.0A CN105654087B (zh) | 2015-12-30 | 2015-12-30 | 一种基于彩色模板的脱机手写字符提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105654087A true CN105654087A (zh) | 2016-06-08 |
CN105654087B CN105654087B (zh) | 2019-03-12 |
Family
ID=56478376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511017969.0A Active CN105654087B (zh) | 2015-12-30 | 2015-12-30 | 一种基于彩色模板的脱机手写字符提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105654087B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107256389A (zh) * | 2017-05-26 | 2017-10-17 | 山西农业大学 | 基于笔迹特征识别的认证及加密方法 |
CN108549509A (zh) * | 2018-03-28 | 2018-09-18 | 王宝林 | 用于书写内容的文档处理方法及装置 |
CN108985175A (zh) * | 2018-06-20 | 2018-12-11 | 天津科技大学 | 基于标准外围轮廓和深度学习的手写汉字句集识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463195A (zh) * | 2014-11-08 | 2015-03-25 | 沈阳工业大学 | 基于模板匹配的印刷体数字识别方法 |
CN105095924A (zh) * | 2014-04-25 | 2015-11-25 | 夏普株式会社 | 手写识别方法和设备 |
CN106529380A (zh) * | 2015-09-15 | 2017-03-22 | 阿里巴巴集团控股有限公司 | 图像的识别方法及装置 |
-
2015
- 2015-12-30 CN CN201511017969.0A patent/CN105654087B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095924A (zh) * | 2014-04-25 | 2015-11-25 | 夏普株式会社 | 手写识别方法和设备 |
CN104463195A (zh) * | 2014-11-08 | 2015-03-25 | 沈阳工业大学 | 基于模板匹配的印刷体数字识别方法 |
CN106529380A (zh) * | 2015-09-15 | 2017-03-22 | 阿里巴巴集团控股有限公司 | 图像的识别方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107256389A (zh) * | 2017-05-26 | 2017-10-17 | 山西农业大学 | 基于笔迹特征识别的认证及加密方法 |
CN108549509A (zh) * | 2018-03-28 | 2018-09-18 | 王宝林 | 用于书写内容的文档处理方法及装置 |
CN108985175A (zh) * | 2018-06-20 | 2018-12-11 | 天津科技大学 | 基于标准外围轮廓和深度学习的手写汉字句集识别方法 |
CN108985175B (zh) * | 2018-06-20 | 2021-06-04 | 天津科技大学 | 基于标准外围轮廓和深度学习的手写汉字句集识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105654087B (zh) | 2019-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104182750B (zh) | 一种在自然场景图像中基于极值连通域的中文检测方法 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN103942794B (zh) | 一种基于置信度的图像协同抠图方法 | |
CN103824091B (zh) | 一种用于智能交通系统的车牌识别方法 | |
CN101122999B (zh) | 一种自动提取中国书画作品中印章图像的方法 | |
JP2005309819A (ja) | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 | |
CN104598907B (zh) | 一种基于笔画宽度图的图像中文字数据提取方法 | |
CN105069466A (zh) | 基于数字图像处理的行人服饰颜色识别方法 | |
WO2021098163A1 (zh) | 一种基于角点的空中目标探测方法 | |
CN101295359A (zh) | 图像处理程序及图像处理装置 | |
CN110569774B (zh) | 基于图像处理与模式识别的折线图图像自动数字化方法 | |
CN108133216A (zh) | 基于机器视觉的可实现小数点读取的数码管读数识别方法 | |
CN105654087A (zh) | 一种基于彩色模板的脱机手写字符提取方法 | |
CN107659799B (zh) | 摄像装置、图像处理方法和存储介质 | |
CN107358184A (zh) | 文档文字的提取方法及提取装置 | |
CN106228157A (zh) | 基于图像识别技术的彩色图像文字段落分割与识别方法 | |
CN107122775A (zh) | 一种基于特征匹配的安卓手机身份证字符识别方法 | |
CN104463134A (zh) | 一种车牌检测方法和系统 | |
CN114782953A (zh) | 一种印章智能识别方法 | |
CN110781877A (zh) | 一种图像识别方法、设备及存储介质 | |
CN108038458B (zh) | 基于特征摘要图的视频中的户外场景文本自动获取方法 | |
Liu et al. | A novel multi-oriented chinese text extraction approach from videos | |
CN104021385B (zh) | 基于模板匹配及曲线拟合的视频字幕细化方法 | |
CN110619331A (zh) | 一种基于颜色距离的彩色影像字段定位方法 | |
CN108062548B (zh) | 一种盲文方自适应定位方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |