CN103955685A - 边缘跟踪数字识别方法 - Google Patents
边缘跟踪数字识别方法 Download PDFInfo
- Publication number
- CN103955685A CN103955685A CN201410164179.4A CN201410164179A CN103955685A CN 103955685 A CN103955685 A CN 103955685A CN 201410164179 A CN201410164179 A CN 201410164179A CN 103955685 A CN103955685 A CN 103955685A
- Authority
- CN
- China
- Prior art keywords
- marginal point
- point
- even marginal
- numeral
- eigenwert
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
边缘跟踪数字识别方法,包括以下步骤:将待识别图像进行灰度和二值化处理,使其成为二值化图像;提取特征值;获取最小轮廓;获取水平方向交点个数;获取偶边缘点;计算偶边缘点封闭值及根据偶边缘点个数及其封闭性识别数字。本发明利对二值化图像进行结构特征的内部跟踪,抓住数字主要特征,提高了图像的识别率和正确率,具有较好的鲁棒性及适用性;本发明能够识别不同的字体。
Description
技术领域
本发明属于数字图像处理方法技术领域,涉及一种边缘跟踪数字识别方法。
背景技术
模式识别是对表征事物或现象的各种形式(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。它是信息科学和人工智能的重要组成部分。而数字识别作为模式识别的一个分支,在日常生活和科研中具有十分重要的作用。
数字识别前景广阔,应用于表格中数字的识别、汽车牌照的数字自动识别和成绩单的识别等项目,涉及到交通、银行、教育和邮政等领域。实现数字的自动识别给人们提供了很大的方便。目前,适用印刷字体的数字识别的算法较多,当前运用较好的主流算法以模板、结构特征、神经网络和聚类分析的识别算法为主。鉴于待识别的字符皆为阿拉伯数字,字符的结构简单,采用基于结构特征的方法在识别过程中可以有效地结合结构信息,快捷高效的给出识别结果。然而对于不同字体混合的印刷体数字序列,以上方法的识别率会有不同程度的降低。如切割法是根据数字的基本结构、大小、形状等的特征标志来进行标示的,对于不同字体的数字来说,此种算法的识别率较低。
发明内容
本发明目的在于提供一种边缘跟踪数字识别方法,解决现有技术对于不同字体的识别率较低且正确率不高的问题。
本发明的技术方案是,边缘跟踪数字识别方法,包括以下步骤:
1、将待识别图像进行灰度和二值化处理,使其成为二值化图像;
2、提取特征值;
3、获取最小轮廓;
4、获取水平方向交点个数;
5、获取偶边缘点;
6、计算偶边缘点封闭值;
7、根据偶边缘点个数及其封闭性识别数字。
本发明的特点还在于:
上述特征值提取为,扫描二值化图像的每点的像素值,确定其特征值,白色像素点特征值为0,黑色像素点特征值为1,并将特征值保存成二维数组。
上述获取最小轮廓为:首先,对特征值二维数组固定列进行行扫描,确定左右边界线;然后,对特征值二维数组固定行进行列扫描,确定上下边界线。
上述获取水平方向交点个数为:对特征值二维数组固定行进行列扫描,初始化交点个数计数器,设二维数组有N列,扫描0到N-1列,如果第i(0<i<N-1)列为1且第i+1列为0,则交点个数计数器加1;若最后一列为1,交点个数计数器加1。
上述获取偶边缘点为:对固定特征值二维数组第X/2列,自上往下进行行扫描,初始化偶边缘点的动态数组,设二维数组有N行,扫描0到N-1行,如果第i(0<i<N-1)行为1且第i+1行为0,将该点加入偶边缘点数组中;若最后一行为1,将该点加入偶边缘点数组中。
上述计算偶边缘点封闭值为:第一步,初始化动态数组用来保存与偶边缘点邻接的所有值为0的点,递归地将与偶边缘点所邻接的所有值为0的点加入动态数组中;第二步,判断每个点的X坐标或Y坐标是否位于边界处,如果是,则说明该偶边缘点不封闭;否则该偶边缘点封闭。
上述根据偶边缘点个数及其封闭性识别数字包括以下步骤:
步骤1:在数字的横坐标(X轴)做中垂线,与数字相交,记录下所有的边缘点。
步骤2:根据偶边缘点的个数划分为以下几种情况(除最后一个偶边缘点以外):
第一种情况:偶边缘点个数为1;
第二种情况:偶边缘点个数为2;
步骤3:在所有的边缘点中,除最后一个偶边缘点以外,对所有偶边缘点进行内边缘跟踪;
步骤4:在跟踪的过程中,保存与偶边缘点邻接的所有值为0的点的坐标,判断每个点的X坐标或Y坐标是否位于边界处,如果是,则认为对此偶边缘点的内部跟踪成功。如果第一个偶边缘点跟踪成功,即封闭,则标记为featureEven1=1,否则标记为featureEven1=0;如果第二个偶边缘点跟踪成功,则标记为featureEven2=1,否则标记为featureEven2=0;
步骤5:如果偶边缘点个数为1,判断该偶边缘点的封闭性。如果不封闭,转入步骤7;如果封闭,继续判断是否有一行且有一列特征值全为1,若是,则该数字为4(可能为黑体);否则,判断水平方向Y/4+1处的交点个数,若为1,则该数字为6(可能为黑体);否则为0;
步骤6:如果偶边缘点个数为2,若第一个偶边缘点封闭且第二个偶边缘点也封闭,该数字为8;若第一个偶边缘点不封闭且第二个偶边缘点封闭,该数字为6;若第一个偶边缘点封闭且第二个偶边缘点不封闭,继续判断是否有一列上特征值全为1,若是,该数字为4,否则为9;若第一个偶边缘点不封闭且第二个偶边缘点也不封闭,继续判断1、2边缘点中点水平线与数字的交点X坐标是否小于X/4,若是,该数字为5;否则继续判断2、3边缘点中点水平线与数字的交点X坐标是否小于X/2,若是,该数字为2;否则该数字为3;
步骤7:如果平行X轴中间线与数字相交的点数为1且平行Y轴中间线与数字相交的点数为2,则该数字为7;
步骤8:求得数字的高宽,如果满足deltaX-2<1/2deltaY(deltaX为数字在X轴的长度,deltaY为数字在Y轴的长度),那么,此数字为1。
本发明具有如下技术效果:
1、本发明在对数字进行边缘跟踪扫描之后,对0,1,2,3,4,5,6,7,8,9等10个数字初步的进行分类,在同类别的数字中再采用切割法对数字进行识别,可以达到精确识别的目的。
2、本发明利用对二值化图像进行结构特征的内部跟踪,抓住数字主要特征,提高了图像的识别率和正确率,具有较好的鲁棒性及适用性。
3、本发明通过修改切割后的参数比较过程以及对不同字体的多方面考虑,能够达到识别不同的字体。
附图说明
图1为本发明边缘跟踪数字识别方法的总体流程图;
图2为本发明边缘跟踪数字识别方法实施例的特征值提取流程图;
图3为本发明边缘跟踪数字识别方法实施例的获取最小轮廓流程图;
图4为本发明边缘跟踪数字识别方法实施例的获取水平方向交点个数流程图;
图5为本发明边缘跟踪数字识别方法实施例的获取偶边缘点流程图;
图6为本发明边缘跟踪数字识别方法实施例的计算偶边缘点封闭值流程图;
图7为本发明边缘跟踪数字识别方法实施例的待识别数字图像示意图;
图8为本发明边缘跟踪数字识别方法实施例的待识别数字图像的特征值示意图;
图9为本发明边缘跟踪数字识别方法实施例的待识别数字图像最小轮廓的特征值示意图;
图10为本发明边缘跟踪数字识别方法实施例的待识别数字图像边缘点示意图;
图11为本发明边缘跟踪数字识别方法实施例的待识别数字图像边缘跟踪示意图;
图12为本发明边缘跟踪数字识别方法实施例的不同字体的数字边缘点个数区别示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
边缘跟踪数字识别方法,包括以下步骤:
1、将待识别图像进行灰度和二值化处理,使其成为二值化图像;
2、提取特征值:扫描二值化图像的每点的像素值,确定其特征值,白色像素点特征值为0,黑色像素点特征值为1,并将特征值保存成二维数组。参见图2。
3、获取最小轮廓:首先,对特征值二维数组固定列进行行扫描,确定左右边界线;然后,对特征值二维数组固定行进行列扫描,确定上下边界线。参见图3。
4、获取水平方向交点个数:对特征值二维数组固定行进行列扫描,初始化交点个数计数器,设二维数组有M行N列,对M/2行,扫描0到N-1列,如果第i(0<i<N-1)列值为1且第i+1列值为0,则交点个数计数器加1;若最后一列为1,交点个数计数器加1。参见图4,Xnumber表示水平方向交点个数。
5、获取偶边缘点:对固定特征值二维数组第X/2列,自上往下进行行扫描,初始化偶边缘点的动态数组,设二维数组有M行N列,扫描0到M-1行,如果第i(0<i<M-1)行值为1且第i+1行值为0,将该点加入偶边缘点数组中;若最后一行为值为1,将该点加入偶边缘点数组中。参见图5,其中,EvenNum表示保存偶边缘点的动态数组。Y-1表示最后一行的点。
6、计算偶边缘点封闭值:第一步,初始化动态数组用来保存与偶边缘点邻接的所有值为0的点,递归地将与偶边缘点所邻接的所有值为0的点加入动态数组中;第二步,判断每个点的X坐标或Y坐标是否位于边界处,如果是,则说明该偶边缘点不封闭;否则该偶边缘点封闭。参见图6,currentrowlen表示特征值数组最小轮廓的行数;currentcollen表示特征值数组最小轮廓的列数;EigenvalArray表示特征值数组;ZeroArray表示保存与偶边缘点邻接的所有值为0的点的动态数组。
7、根据偶边缘点个数及其封闭性识别数字,具体步骤如下:
步骤1:在数字的横坐标(X轴)做中垂线,与数字相交,记录下所有的边缘点。
步骤2:根据偶边缘点的个数划分为一下几种情况(除最后一个偶边缘点以外):
第一种情况:偶边缘点个数为1;
第二种情况:偶边缘点个数为2;
步骤3:在所有的边缘点中,除最后一个偶边缘点以外,对所有偶边缘点进行内边缘跟踪;
步骤4:在跟踪的过程中,保存与偶边缘点邻接的所有值为0的点的坐标,判断每个点的X坐标或Y坐标是否位于边界处,如果是,则认为对此偶边缘点的内部跟踪成功。如果第一个偶边缘点跟踪成功,即封闭,则标记为featureEven1=1,否则标记为featureEven1=0;如果第二个偶边缘点跟踪成功,则标记为featureEven2=1,否则标记为featureEven2=0;
步骤5:如果偶边缘点个数为1,判断该偶边缘点的封闭性。如果不封闭,转入步骤7;如果封闭,继续判断是否有一行且有一列特征值全为1,若是,则该数字为4(可能为黑体);否则,判断水平方向Y/4+1处的交点个数,若为1,则该数字为6(可能为黑体);否则为0;
步骤6:如果偶边缘点个数为2,若第一个偶边缘点封闭且第二个偶边缘点也封闭,该数字为8;若第一个偶边缘点不封闭且第二个偶边缘点封闭,该数字为6;若第一个偶边缘点封闭且第二个偶边缘点不封闭,继续判断是否有一列上特征值全为1,若是,该数字为4,否则为9;若第一个偶边缘点不封闭且第二个偶边缘点也不封闭,继续判断1、2边缘点中点水平线与数字的交点X坐标是否小于X/4,若是,该数字为5;否则继续判断2、3边缘点中点水平线与数字的交点X坐标是否小于X/2,若是,该数字为2;否则该数字为3;
步骤7:如果平行X轴中间线与数字相交的点数为1且平行Y轴中间线与数字相交的点数为2,则该数字为7;
步骤8:求得数字的高宽,如果满足deltaX-2<1/2deltaY(deltaX为数字在X轴的长度,deltaY为数字在Y轴的长度),那么,此数字为1。
总体流程参见图1,其中,①FeatureEven:偶边缘点封闭值数组;②FeatureEven.Count:偶边缘点个数;③FeatureEven[0]:第一个偶边缘点的封闭值;④FeatureEven[1]:第一个偶边缘点的封闭值;⑤XmiddleNumber:平行X轴中间线与数字相交的点数;⑥YmiddleNumber:平行Y轴中间线与数字相交的点数。
本发明将需要识别的数字先进行预处理,用面积最小的长方体将数字包含其中,求得数字的最大、最小X值、Y值,对X值进行二等分,中央等分线与数字相交,获取图像中数字的边缘点个数。在所有的边缘点中,除最后一个偶边缘点以外,对所有的偶边缘点进行内部跟踪;在进行跟踪的过程中,以一个偶边缘点为起点对与偶边缘邻接的所有点扫描;如果在扫描的过程中,扫描点的横坐标(x轴)到达数字的最大X坐标maxX或最小X坐标minX,或者扫描点的纵坐标(y轴)到达数字的最大Y坐标maxY或最小Y坐标minY,则认为对此偶边缘点的内部跟踪不成功,即此偶边缘点不是封闭的,反之则是封闭的。
在对数字进行边缘跟踪扫描之后,可以对10个数字初步的进行分类;在同类别的数字中再采用切割法对数字进行精确的识别。
实施例,采用本发明改进的边缘跟踪数字识别方法对数字8进行识别,待识别数字8的图像见图7;按照上述步骤将待识别图像进行灰度和二值化处理,使其成为二值化图像,提取特征值,见图8;获取最小轮廓,见图9;获取水平方向交点个数,见图10;获取偶边缘点,图10中一共有6个边缘点,用1、2、3、4、5、6表示,其中1、3、5表示奇边缘点,2、4、6表示偶边缘点,由于6表示的边缘点是最后一个偶边缘点,因此,只计算第2和第4两个偶边缘点的封闭值;最后,根据偶边缘点个数及其封闭性识别数字,边缘跟踪情况参见图11。
图12为仿宋字体的数字4和黑体字体的数字4的边缘点个数示意图,从图中可以看出,其边缘点个数存在明显的区别,仿宋数字4有3个偶边缘点,而黑体数字4有2个偶边缘点。
Claims (7)
1.边缘跟踪数字识别方法,其特征在于,包括以下步骤:
(1)将待识别图像进行灰度和二值化处理,使其成为二值化图像;
(2)提取特征值;
(3)获取最小轮廓;
(4)获取水平方向交点个数;
(5)获取偶边缘点;
(6)计算偶边缘点封闭值;
(7)根据偶边缘点个数及其封闭性识别数字。
2.如权利要求1所述的边缘跟踪数字识别方法,其特征在于,所述特征值提取为,扫描二值化图像的每点的像素值,确定其特征值,白色像素点特征值为0,黑色像素点特征值为1,并将特征值保存成二维数组。
3.如权利要求2所述的边缘跟踪数字识别方法,其特征在于,所述获取最小轮廓为:首先,对特征值二维数组固定列进行行扫描,确定左右边界线;然后,对特征值二维数组固定行进行列扫描,确定上下边界线。
4.如权利要求3所述的边缘跟踪数字识别方法,其特征在于,所述获取水平方向交点个数为:对特征值二维数组固定行进行列扫描,初始化交点个数计数器,设二维数组有N列,扫描0到N-1列,如果第i(0<i<N-1)列为1且第i+1列为0,则交点个数计数器加1;若最后一列为1,交点个数计数器加1。
5.如权利要求4所述的边缘跟踪数字识别方法,其特征在于,所述获取偶边缘点为:对固定特征值二维数组第X/2列,自上往下进行行扫描,初始化偶边缘点的动态数组,设二维数组有N行,扫描0到N-1行,如果第i(0<i<N-1)行为1且第i+1行为0,将该点加入偶边缘点数组中;若最后一行为1,将该点加入偶边缘点数组中。
6.如权利要求5所述的边缘跟踪数字识别方法,其特征在于,所述计算偶边缘点封闭值为:第一步,初始化动态数组用来保存与偶边缘点邻接的所有值为0的点,递归地将与偶边缘点所邻接的所有值为0的点加入动态数组中;第二步,判断每个点的X坐标或Y坐标是否位于边界处,如果是,则说明该偶边缘点不封闭;否则该偶边缘点封闭。
7.如权利要求6所述的边缘跟踪数字识别方法,其特征在于,所述根据偶边缘点个数及其封闭性识别数字包括以下步骤:
步骤1,在数字的横坐标即X轴做中垂线,与数字相交,记录下所有的边缘点。
步骤2,根据偶边缘点的个数划分为以下几种情况,除最后一个偶边缘点以外:
第一种情况:偶边缘点个数为1;
第二种情况:偶边缘点个数为2;
步骤3,在所有的边缘点中,除最后一个偶边缘点以外,对所有偶边缘点进行内边缘跟踪;
步骤4,在跟踪的过程中,保存与偶边缘点邻接的所有值为0的点的坐标,判断每个点的X坐标或Y坐标是否位于边界处,如果是,则认为对此偶边缘点的内部跟踪成功;如果第一个偶边缘点跟踪成功,即封闭,则标记为featureEven1=1,否则标记为featureEven1=0;如果第二个偶边缘点跟踪成功,则标记为featureEven2=1,否则标记为featureEven2=0;
步骤5,如果偶边缘点个数为1,判断该偶边缘点的封闭性。如果不封闭,转入步骤7;如果封闭,继续判断是否有一行且有一列特征值全为1,若是,则该数字为4;否则,判断水平方向Y/4+1处的交点个数,若为1,则该数字为6;否则为0;
步骤6,如果偶边缘点个数为2,若第一个偶边缘点封闭且第二个偶边缘点也封闭,该数字为8;若第一个偶边缘点不封闭且第二个偶边缘点封闭,该数字为6;若第一个偶边缘点封闭且第二个偶边缘点不封闭,继续判断是否有一列上特征值全为1,若是,该数字为4,否则为9;若第一个偶边缘点不封闭且第二个偶边缘点也不封闭,继续判断1、2边缘点中点水平线与数字的交点X坐标是否小于X/4,若是,该数字为5;否则继续判断2、3边缘点中点水平线与数字的交点X坐标是否小于X/2,若是,该数字为2;否则该数字为3;
步骤7,如果平行X轴中间线与数字相交的点数为1且平行Y轴中间线与数字相交的点数为2,则该数字为7;
步骤8,求得数字的高宽,如果满足deltaX-2<1/2deltaY,那么,此数字为1;deltaX为数字在X轴的长度,deltaY为数字在Y轴的长度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410164179.4A CN103955685A (zh) | 2014-04-22 | 2014-04-22 | 边缘跟踪数字识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410164179.4A CN103955685A (zh) | 2014-04-22 | 2014-04-22 | 边缘跟踪数字识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103955685A true CN103955685A (zh) | 2014-07-30 |
Family
ID=51332960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410164179.4A Pending CN103955685A (zh) | 2014-04-22 | 2014-04-22 | 边缘跟踪数字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103955685A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341210A (zh) * | 2017-06-26 | 2017-11-10 | 西安理工大学 | Hadoop平台下的C‑DBSCAN‑K聚类算法 |
CN113239929A (zh) * | 2021-04-30 | 2021-08-10 | 南京钢铁股份有限公司 | 一种识别计算机显示屏幕中数字的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211693A (ja) * | 2008-02-29 | 2009-09-17 | Fujitsu Ltd | パターン識別装置およびパターン識別方法 |
CN102982343A (zh) * | 2012-11-12 | 2013-03-20 | 信阳师范学院 | 手写数字识别的增量式模糊支持向量机方法 |
-
2014
- 2014-04-22 CN CN201410164179.4A patent/CN103955685A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211693A (ja) * | 2008-02-29 | 2009-09-17 | Fujitsu Ltd | パターン識別装置およびパターン識別方法 |
CN102982343A (zh) * | 2012-11-12 | 2013-03-20 | 信阳师范学院 | 手写数字识别的增量式模糊支持向量机方法 |
Non-Patent Citations (1)
Title |
---|
陈展东等: ""数字识别算法研究"", 《长春理工大学学报(自然科学版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341210A (zh) * | 2017-06-26 | 2017-11-10 | 西安理工大学 | Hadoop平台下的C‑DBSCAN‑K聚类算法 |
CN113239929A (zh) * | 2021-04-30 | 2021-08-10 | 南京钢铁股份有限公司 | 一种识别计算机显示屏幕中数字的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102722712B (zh) | 基于连续度的多尺度高分辨图像目标检测方法 | |
CN102509091B (zh) | 一种飞机尾号识别方法 | |
Mohammad et al. | Optical character recognition implementation using pattern matching | |
CN102043945B (zh) | 基于车辆实时跟踪和二进指数分类车牌字符识别的方法 | |
Zheng et al. | An algorithm for accuracy enhancement of license plate recognition | |
CN110210475B (zh) | 一种非二值化和边缘检测的车牌字符图像分割方法 | |
CN105205488B (zh) | 基于Harris角点和笔画宽度的文字区域检测方法 | |
CN104778470B (zh) | 基于组件树和霍夫森林的文字检测和识别方法 | |
CN102629322B (zh) | 一种基于边界点笔画形状的字符特征提取方法及应用 | |
CN103870803A (zh) | 一种基于粗定位与精定位融合的车牌识别方法和系统 | |
CN104809481A (zh) | 一种基于自适应色彩聚类的自然场景文本检测的方法 | |
CN107038416B (zh) | 一种基于二值图像改进型hog特征的行人检测方法 | |
CN110619326B (zh) | 一种基于扫描的英语试卷作文检测识别系统及方法 | |
CN109325507B (zh) | 结合超像素显著性特征与hog特征图像分类方法和系统 | |
CN103903018A (zh) | 一种复杂场景中对车牌进行定位的方法和系统 | |
CN103268489A (zh) | 基于滑窗搜索的机动车号牌识别方法 | |
CN103530600A (zh) | 复杂光照下的车牌识别方法及系统 | |
CN104408449A (zh) | 智能移动终端场景文字处理方法 | |
CN103902981A (zh) | 一种基于字符融合特征的车牌字符识别方法及系统 | |
CN103295009B (zh) | 基于笔画分解的车牌字符识别方法 | |
CN103065163B (zh) | 一种基于静态图片的快速目标检测识别系统及方法 | |
CN110991439A (zh) | 一种基于像素级多特征联合分类的手写体字符的提取方法 | |
CN104834891A (zh) | 一种中文图像型垃圾邮件过滤方法及系统 | |
CN109271882B (zh) | 一种区分颜色的手写体汉字提取方法 | |
CN111401364A (zh) | 一种基于颜色特征和模板匹配相结合的车牌定位算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140730 |
|
RJ01 | Rejection of invention patent application after publication |