CN107392206A - 一种工况条件下钢轨压印字符分割方法 - Google Patents
一种工况条件下钢轨压印字符分割方法 Download PDFInfo
- Publication number
- CN107392206A CN107392206A CN201710600894.1A CN201710600894A CN107392206A CN 107392206 A CN107392206 A CN 107392206A CN 201710600894 A CN201710600894 A CN 201710600894A CN 107392206 A CN107392206 A CN 107392206A
- Authority
- CN
- China
- Prior art keywords
- mrow
- character
- image
- mtd
- rail pressed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000005498 polishing Methods 0.000 claims description 11
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 230000003628 erosive effect Effects 0.000 claims description 2
- 238000000926 separation method Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000011161 development Methods 0.000 abstract description 4
- 230000018109 developmental process Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 3
- 238000013461 design Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种工况条件下钢轨压印字符分割方法,包括对钢轨压印字符定位;对钢轨压印字符进行高度方向分割;确定单个字符的实际宽度;对钢轨压印字符进行宽度方向分割,将其分割成单个字符;对单个字符进行反白处理等步骤。本发明具有算法简单,分割效果好,可靠性强等一系列优点,解决了工况条件下钢轨压印字符分割困难的问题,促进了钢轨压印字符自动识别技术的发展。
Description
技术领域
本发明属于钢轨检测技术领域,具体涉及一种工况条件下钢轨压印字符分割方法。
背景技术
随着科学技术的发展,铁路列车的运行速度不断提升,钢轨作为铁路的重要组成部分,直接影响着列车的运行速度以及安全性。由于钢轨上的压印字符具有唯一性,可用于记录钢轨的重要信息,因此,已成为钢轨生产基地进行生产管理、质量控制和产品跟踪的重要载体。由于很多因素的影响,目前我国钢轨压印字符的读取和记录主要由人工完成,识别效率较低且容易出错。因此,应用现代技术手段实现钢轨压印字符的自动识别对于提高焊轨基地生产效率具有重要意义。
在对钢轨压印字符进行识别的过程中,从钢轨压印字符图像中将压印字符提取出来,即实现压印字符的区域定位和自动分割,作为一个关键环节在整个识别系统中起着举足轻重的作用。由于钢轨压印字符由凸字模压印而成,具有一定的深度且字符区域同背景区域颜色相同,因此,钢轨压印字符的分割和一般光学字符分割有很大的差别。同时,由于工况条件下钢轨压印字符深度一般在0.2mm左右,深度较浅,字符容易产生缺失且字符周围噪音点较强,这些都增加了钢轨压印字符分割的难度,也严重制约着钢轨压印字符自动识别技术的发展。
发明内容
为了解决上述技术问题,本发明提供了一种工况条件下钢轨压印字符分割方法,可以准确分割字符深度较浅、缺失严重以及字符周围噪音点较强的钢轨压印字符。
本发明所采用的技术方案是:一种工况条件下钢轨压印字符分割方法,其特征在于,包括以下步骤:
步骤1:获取钢轨压印字符图像X,对图像X进行预处理,获得图像X1;
步骤2:在图像X1中,对钢轨压印字符进行定位,获得图像X2;
步骤3:在图像X2中,对钢轨压印字符进行高度方向分割,获得图像X3;
步骤4:在图像X3中,确定单个字符的实际宽度,获得图像X4;
步骤5:在图像X4中,对钢轨压印字符进行宽度方向分割,将其分割成单个字符,获得图像X5;
步骤6:在图像X5中,对单个字符进行反白处理。
本发明的积极效果是:
本发明采用投影法进行工况条件下钢轨压印字符分割,在分割过程中,采用聚类分析法确定单个字符实际宽度,并且将最后一个字符缺失宽度补齐,确定最佳分割基准线。本发明具有算法简单,分割效果好,可靠性强等一系列优点,解决了工况条件下钢轨压印字符分割困难的问题,促进了钢轨压印字符自动识别技术的发展。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的以8位钢轨压印字符为例的图像预处理后的效果图;
图3为图2字符定位后的效果图;
图4为图3字符高度方向分割后的效果图;
图5为图4字符宽度方向分割后的效果图;
图6为图5字符反白处理后的效果图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种工况条件下钢轨压印字符分割方法,包括以下步骤:
步骤1:获取钢轨压印字符图像X,对图像X进行预处理,获得图像X1(如图2);
对获取的图像进行图像膨胀和图像腐蚀处理,在不影响钢轨压印字符质量的情况下,使字符周围噪音点较少。
步骤2:在图像X1中,对钢轨压印字符进行定位,获得图像X2(如图3);
具体包括如下步骤:
(1)图2为钢轨压印字符经过图像预处理后的图像,对其进行像素值的遍历,若坐标(m,n)处的像素值p(m,n)=0,此时像素点为黑点,表示可能为字符区域,则令A(m,n)=1;若坐标(m,n)处的像素值p(m,n)=255,此时像素点为白点,表示可能为背景区域,则令A(m,n)=0。其处理公式如公式(1)所示。
其中,A(m,n)表示图像坐标(m,n)处的点是否为黑点,若其值为1,则为黑点,若其值为0,则为白点;
(2)对钢轨压印字符进行垂直投影,统计每列黑色像素点的数量,其统计公式如公式(2)所示。
式中,q[m]为垂直投影得到的数组,m为列数,M为图像的长度,N为图像的高度。
(3)对垂直投影数组q[m]进行处理,若连续5列黑色像素点的数量都小于6,则令该5列中的第1列对应的q[m]为0,依次遍历整个数组,该操作可将黑色噪音点与字符分离开来,处理公式如公式(3)所示。
若则q[m]=0,其中0≤m<M-5(3);
(4)对钢轨压印字符进行定位,若连续20列黑色像素点的数量q[m]都小于5,则表示该区域为背景区域,将该区域内的像素点全部转化为黑色像素点,依次遍历数组,即可实现字符区域的定位。
步骤3:在图像X2中,对钢轨压印字符进行高度方向分割,获得图像X3(如图4);
具体包括如下步骤:
(1)对步骤2处理后的图像进行像素值的遍历,若坐标(m,n)处的像素值p(m,n)=0,此时像素点为黑点,表示可能为字符区域或字符间隔区域,则令A(m,n)=1;若坐标(m,n)处的像素值p(m,n)=255,此时像素点为白点,表示可能为字符区域或背景区域,则令A(m,n)=0。其处理公式如公式(4)所示。
(2)对钢轨压印字符进行水平投影,统计每行黑色像素点的数量。由于步骤2的处理,在图像水平方向,字符间隔区域内的像素点全为黑色,且每行间隔区域内的的黑色像素点总数量为固定值q0,因此,从上到下进行水平投影时,当有字符出现时,黑色像素点的数量q[n0]>q0,则n0即为字符头部位置所对应的行数;从下到上进行水平投影时,当有字符出现时,黑色像素点的数量q[n1]>q0,则n1即为字符底部位置所对应的行数。
(3)对字符进行高度方向分割。将字符从头部n0和底部n1处进行分割,保留n0至n1区域,则字符高度H=n1-n0。
步骤4:在图像X3中,确定单个字符的实际宽度,获得图像X4;
具体包括如下步骤:
(1)对步骤3处理后的图像进行像素值的遍历,若坐标(m,n)处的像素值p(m,n)=0,此时像素点为黑点,表示可能为字符区域或字符间隔区域,则令A(m,n)=1;若坐标(m,n)处的像素值p(m,n)=255,此时像素点为白点,表示可能为字符区域或背景区域,则令A(m,n)=0。其处理公式如公式(5)所示。
(2)对钢轨压印字符进行垂直投影,统计每列黑色像素点的数量。由于步骤3的处理,在图像垂直方向,字符间隔区域内的像素点全为黑色,且每列间隔区域内的的黑色像素点总数量为固定值q1,因此,从左到右进行垂直投影时,当有字符出现时,黑色像素点的数量q[m]<q1,当字符消失时,黑色像素点的数量q[m]=q1,因此,即可确定字符的总数量k、以及每个字符的宽度W[i]。
(3)采用聚类分析法确定钢轨压印字符单个字符的实际宽度。由于钢轨压印字符深度较浅,容易产生缺失现象,因此,步骤(2)得到的字符宽度为字符缺失时的宽度,因此,需确定每个字符的实际宽度。
首先,计算所有字符的平均宽度计算公式如公式(6)所示,其中k为字符总数量,W[i]为第i个字符的宽度。
然后,将W[i]与进行比较,若其中i=1,2...k,则舍去该字符的宽度W[i],并且该字符将不参与下次平均值的计算。
依次循环步骤(3)5次后,此时得到的平均值表示较多的字符宽度聚集在该值附近,因此,该值即可作为钢轨压印字符单个字符的实际宽度。
其数据分析记录表如表1所示;
表1
步骤5:在图像X4中,对钢轨压印字符进行宽度方向分割,将其分割成单个字符,获得图像X5(如图5);
具体包括如下步骤:
(1)对钢轨压印字符进行垂直投影,统计每列黑色像素点的数量。由于步骤3的处理,在图像垂直方向,字符间隔区域内的像素点全为黑色,且每列间隔区域内的的黑色像素点总数量为固定值q1,因此,从左到右进行垂直投影时,当第一个字符出现时,黑色像素点的数量q[m0]<q1,则m0即为字符最左侧位置所对应的列数;从右到左进行垂直投影时,当最后一个字符消失时,黑色像素点的数量q[m1]<q1,则m1即为字符最右侧位置所对应的列数。
(2)将最后一个字符缺失宽度补齐,并确定宽度方向分割基准线。由于钢轨压印字符首字符可能为“W”,相比其后数字字符,其宽度较宽,不利于钢轨压印字符分割,所以选择最后一个数字字符作为分割基准。而又由于钢轨压印字符深度较浅,容易产生缺失现象,若将缺失字符边缘作为分割基准线,将导致其它字符分割不准确,影响后期识别,因此需将最后一个字符缺失宽度补齐。具体公式如公式(7)所示。
式中,m2为最后一个字符补齐缺失宽度后的最右侧位置所对应的列数,即分割基准线,m1为最后一个字符补齐缺失宽度前的最右侧位置所对应的列数,W(k)为第k个字符的宽度,即最后一个字符补齐缺失宽度前的字符宽度,为单个字符的实际宽度。
(3)确定钢轨压印字符间间隔大小。由于钢轨压印字符最右侧位置所对应的列数为m2、最左侧起始位置所对应的列数为m0、字符总数量k以及单个字符的实际宽度都已确定,所以字符间间隔Wd可由公式(8)确定。
(4)对钢轨压印字符进行宽度方向分割,将其分割成单个字符。分割公式如公式(9)所示。
式中,m[i]为第i个字符分割位置所对应的列数。
步骤6:在图像X5中,对单个字符进行反白处理(处理后的效果图如图6所示);
具体包括如下步骤:
(1)对所有单个字符进行垂直投影,统计每列黑色像素点的数量。由于步骤5的处理,在单个字符垂直方向,部分字符两侧全为黑色像素点,即每列黑色像素点的数量与字符高度相同,为固定值q1,因此,从左到右进行垂直投影时,当字符出现时,黑色像素点的数量q[m3]<q1,则m3为字符区域最左侧与背景区域的分界线所对应的列数;从右到左进行垂直投影时,当字符消失时,黑色像素点的数量q[m4]<q1,则m4为字符区域最右侧与背景区域的分界线所对应的列数。
(2)对分界线外侧全为黑色像素点的字符区域进行反白处理。即若字符在0≤m≤m3或区域内全为黑色像素点,则将其全部转化为白色像素点,如公式(10)所示。
若p(m,n)=0,则p(m,n)=255,其中0≤m≤m3或
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (8)
1.一种工况条件下钢轨压印字符分割方法,其特征在于,包括以下步骤:
步骤1:获取钢轨压印字符图像X,对图像X进行预处理,获得图像X1;
步骤2:在图像X1中,对钢轨压印字符进行定位,获得图像X2;
步骤3:在图像X2中,对钢轨压印字符进行高度方向分割,获得图像X3;
步骤4:在图像X3中,确定单个字符的实际宽度,获得图像X4;
步骤5:在图像X4中,对钢轨压印字符进行宽度方向分割,将其分割成单个字符,获得图像X5;
步骤6:在图像X5中,对单个字符进行反白处理。
2.根据权利要求1所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤1的具体实现过程是:
对获取的图像进行图像膨胀和图像腐蚀处理,在不影响钢轨压印字符质量的情况下,使字符周围噪音点较少。
3.根据权利要求1所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:在图像X1中,进行图像像素值遍历,若图像坐标(m,n)处的像素值p(m,n)=0,此时像素点为黑点,表示可能为字符区域,则令A(m,n)=1;若坐标(m,n)处的像素值p(m,n)=255,此时像素点为白点,表示可能为背景区域,则令A(m,n)=0;
<mrow>
<mi>A</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>255</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,A(m,n)表示图像坐标(m,n)处的点是否为黑点,若其值为1,则为黑点,若其值为0,则为白点;
步骤2.2:对钢轨压印字符进行垂直投影,统计每列黑色像素点的数量,统计公式为:
<mrow>
<mi>q</mi>
<mo>&lsqb;</mo>
<mi>m</mi>
<mo>&rsqb;</mo>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mrow>
<mi>N</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</munderover>
<mi>A</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mn>0</mn>
<mo>&le;</mo>
<mi>m</mi>
<mo><</mo>
<mi>M</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
式中,q[m]为垂直投影得到的数组,m为列数,M为图像的长度,N为图像的高度;
步骤2.3:对数组q[m]进行处理,若连续5列黑色像素点的数量都小于6,则令该5列中的第1列对应的q[m]为0;依次遍历整个数组,将黑色噪音点与字符分离开来;处理公式为:
若则q[m]=0,其中0≤m<M-5(3);
步骤2.4:对钢轨压印字符进行定位,获得图像X2;
若连续20列黑色像素点的数量q[m]都小于5,则表示该区域为背景区域,将该区域内的像素点全部转化为黑色像素点;依次遍历数组,完成字符区域的定位。
4.根据权利要求1所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤3的具体实现包括以下子步骤:
步骤3.1:在图像X2中,进行图像像素值遍历,若图像坐标(m,n)处的像素值p(m,n)=0,此时像素点为黑点,表示可能为字符区域,则令A(m,n)=1;若坐标(m,n)处的像素值p(m,n)=255,此时像素点为白点,表示可能为背景区域,则令A(m,n)=0;
<mrow>
<mi>A</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>255</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,A(m,n)表示图像坐标(m,n)处的点是否为黑点,若其值为1,则为黑点,若其值为0,则为白点;
步骤3.2:对钢轨压印字符进行水平投影,统计每行黑色像素点的数量;
经过步骤2的处理,在图像水平方向,字符间隔区域内的像素点全为黑色,且每行间隔区域内的黑色像素点总数量为固定值q0;因此,从上到下进行水平投影时,当有字符出现时,黑色像素点的数量q[n0]>q0,则n0即为字符头部位置所对应的行数;从下到上进行水平投影时,当有字符出现时,黑色像素点的数量q[n1]>q0,则n1即为字符底部位置所对应的行数;
步骤3.3:对字符进行高度方向分割,获得图像X3;
将字符从头部n0和底部n1处进行分割,保留n0至n1区域,则字符高度H=n1-n0。
5.根据权利要求1所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤4的具体实现包括以下子步骤:
步骤4.1:在图像X3中,进行图像像素值遍历,若图像坐标(m,n)处的像素值p(m,n)=0,此时像素点为黑点,表示可能为字符区域,则令A(m,n)=1;若坐标(m,n)处的像素值p(m,n)=255,此时像素点为白点,表示可能为背景区域,则令A(m,n)=0;
<mrow>
<mi>A</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>255</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,A(m,n)表示图像坐标(m,n)处的点是否为黑点,若其值为1,则为黑点,若其值为0,则为白点;
步骤4.2:对钢轨压印字符进行垂直投影,统计每列黑色像素点的数量;
经过步骤3的处理,在图像垂直方向,字符间隔区域内的像素点全为黑色,且每列间隔区域内的的黑色像素点总数量为固定值q1;因此,从左到右进行垂直投影时,当有字符出现时,黑色像素点的数量q[m]<q1,当字符消失时,黑色像素点的数量q[m]=q1,因此,即能确定字符的总数量k、以及每个字符的宽度W[i];
步骤4.3:采用聚类分析法确定钢轨压印字符单个字符的实际宽度,获得图像X4。
6.根据权利要求5所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤4.3的具体实现包括以下子步骤:
步骤4.3.1:计算所有字符的平均宽度
<mrow>
<mover>
<mi>W</mi>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</munderover>
<mi>W</mi>
<mo>&lsqb;</mo>
<mi>i</mi>
<mo>&rsqb;</mo>
</mrow>
<mi>k</mi>
</mfrac>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>...</mo>
<mi>k</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中k为字符总数量,W[i]为第i个字符的宽度;
步骤4.3.2:将W[i]与进行比较,若其中i=1,2...k,则舍去该字符的宽度W[i],并且该字符将不参与下次平均值的计算;
循环执行步骤4.3.1-步骤4.3.2,循环预定Y次后,此时得到的平均值表示较多的字符宽度聚集在该值附近,因此,该值即为钢轨压印字符单个字符的实际宽度。
7.根据权利要求1所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤5的具体实现包括以下子步骤:
步骤5.1:在图像X4中,对钢轨压印字符进行垂直投影,统计每列黑色像素点的数量;
经过步骤3的处理,在图像垂直方向,字符间隔区域内的像素点全为黑色,且每列间隔区域内的的黑色像素点总数量为固定值q1;因此,从左到右进行垂直投影时,当第一个字符出现时,黑色像素点的数量q[m0]<q1,则m0即为字符最左侧位置所对应的列数;从右到左进行垂直投影时,当最后一个字符消失时,黑色像素点的数量q[m1]<q1,则m1即为字符最右侧位置所对应的列数;
步骤5.2:将最后一个字符缺失宽度补齐,并确定宽度方向分割基准线;
补齐公式为:
<mrow>
<msub>
<mi>m</mi>
<mn>2</mn>
</msub>
<mo>=</mo>
<msub>
<mi>m</mi>
<mn>1</mn>
</msub>
<mo>+</mo>
<mfrac>
<mrow>
<mo>(</mo>
<mover>
<mi>W</mi>
<mo>&OverBar;</mo>
</mover>
<mo>-</mo>
<mo>(</mo>
<mrow>
<msub>
<mi>m</mi>
<mn>1</mn>
</msub>
<mo>-</mo>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mn>20</mn>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mn>2</mn>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
式中,m2为最后一个字符补齐缺失宽度后的最右侧位置所对应的列数,即分割基准线,m1为最后一个字符补齐缺失宽度前的最右侧位置所对应的列数,W(k)为第k个字符的宽度,即最后一个字符补齐缺失宽度前的字符宽度,为单个字符的实际宽度;
步骤5.3:确定钢轨压印字符间间隔大小;
字符间间隔Wd为:
<mrow>
<msub>
<mi>W</mi>
<mi>d</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mo>(</mo>
<msub>
<mi>m</mi>
<mn>2</mn>
</msub>
<mo>-</mo>
<msub>
<mi>m</mi>
<mn>0</mn>
</msub>
<mo>-</mo>
<mi>k</mi>
<mo>*</mo>
<mover>
<mi>W</mi>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mrow>
<mi>k</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
步骤5.4:对钢轨压印字符进行宽度方向分割,将其分割成单个字符,获得图像X5;
分割公式为:
<mrow>
<mi>m</mi>
<mo>&lsqb;</mo>
<mi>i</mi>
<mo>&rsqb;</mo>
<mo>=</mo>
<msup>
<mi>m</mi>
<mn>2</mn>
</msup>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>*</mo>
<mover>
<mi>W</mi>
<mo>&OverBar;</mo>
</mover>
<mo>-</mo>
<mi>i</mi>
<mo>*</mo>
<msub>
<mi>W</mi>
<mi>d</mi>
</msub>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>...</mo>
<mi>k</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
式中,m[i]为第i个字符分割位置所对应的列数。
8.根据权利要求1-7任意一项所述的一种工况条件下钢轨压印字符分割方法,其特征在于,步骤6的具体实现包括以下子步骤:
步骤6.1:对所有单个字符进行垂直投影,统计每列黑色像素点的数量;
经过步骤5的处理,在单个字符垂直方向,部分字符两侧全为黑色像素点,即每列黑色像素点的数量与字符高度相同,为固定值q1;因此,从左到右进行垂直投影时,当字符出现时,黑色像素点的数量q[m3]<q1,则m3为字符区域最左侧与背景区域的分界线所对应的列数;从右到左进行垂直投影时,当字符消失时,黑色像素点的数量q[m4]<q1,则m4为字符区域最右侧与背景区域的分界线所对应的列数;
步骤6.2:对分界线外侧全为黑色像素点的字符区域进行反白处理;
即若字符在0≤m≤m3或区域内全为黑色像素点,则将其全部转化为白色像素点,如公式(10)所示:
若p(m,n)=0,则p(m,n)=255,其中0≤m≤m3或
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710600894.1A CN107392206B (zh) | 2017-07-21 | 2017-07-21 | 一种工况条件下钢轨压印字符分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710600894.1A CN107392206B (zh) | 2017-07-21 | 2017-07-21 | 一种工况条件下钢轨压印字符分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107392206A true CN107392206A (zh) | 2017-11-24 |
CN107392206B CN107392206B (zh) | 2020-03-10 |
Family
ID=60337487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710600894.1A Active CN107392206B (zh) | 2017-07-21 | 2017-07-21 | 一种工况条件下钢轨压印字符分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107392206B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210496A (zh) * | 2019-05-24 | 2019-09-06 | 武汉理工大学 | 一种工况条件下钢轨压印字符提取装置及方法 |
CN110375644A (zh) * | 2019-07-04 | 2019-10-25 | 成都绝影智能科技有限公司 | 一种便携式打刻字符深度的检测装置和检测方法 |
CN110375645A (zh) * | 2019-07-04 | 2019-10-25 | 成都绝影智能科技有限公司 | 一种字符尺寸检测的方法和装置 |
CN111832423A (zh) * | 2020-06-19 | 2020-10-27 | 北京邮电大学 | 一种票据信息识别方法、装置及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5164996A (en) * | 1986-04-07 | 1992-11-17 | Jose Pastor | Optical character recognition by detecting geo features |
JP2014127161A (ja) * | 2012-12-27 | 2014-07-07 | Nidec Sankyo Corp | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
CN104657726A (zh) * | 2015-03-18 | 2015-05-27 | 哈尔滨工程大学 | 一种铁路油罐车车辆编号的识别方法 |
CN105894487A (zh) * | 2014-08-25 | 2016-08-24 | 武汉科技大学 | 钢材图像编号的提取与分割方法 |
-
2017
- 2017-07-21 CN CN201710600894.1A patent/CN107392206B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5164996A (en) * | 1986-04-07 | 1992-11-17 | Jose Pastor | Optical character recognition by detecting geo features |
JP2014127161A (ja) * | 2012-12-27 | 2014-07-07 | Nidec Sankyo Corp | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム |
CN105894487A (zh) * | 2014-08-25 | 2016-08-24 | 武汉科技大学 | 钢材图像编号的提取与分割方法 |
CN104657726A (zh) * | 2015-03-18 | 2015-05-27 | 哈尔滨工程大学 | 一种铁路油罐车车辆编号的识别方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210496A (zh) * | 2019-05-24 | 2019-09-06 | 武汉理工大学 | 一种工况条件下钢轨压印字符提取装置及方法 |
CN110375644A (zh) * | 2019-07-04 | 2019-10-25 | 成都绝影智能科技有限公司 | 一种便携式打刻字符深度的检测装置和检测方法 |
CN110375645A (zh) * | 2019-07-04 | 2019-10-25 | 成都绝影智能科技有限公司 | 一种字符尺寸检测的方法和装置 |
CN111832423A (zh) * | 2020-06-19 | 2020-10-27 | 北京邮电大学 | 一种票据信息识别方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107392206B (zh) | 2020-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107392206A (zh) | 一种工况条件下钢轨压印字符分割方法 | |
US10853565B2 (en) | Method and device for positioning table in PDF document | |
CN105654072B (zh) | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 | |
CN110909732B (zh) | 一种图中数据的自动提取方法 | |
CN111402209B (zh) | 一种基于U-Net的高速铁路钢轨损伤检测方法 | |
CN101615252B (zh) | 一种自适应图像文本信息提取方法 | |
CN107292936B (zh) | 一种汉字字体矢量化方法 | |
CN109376740A (zh) | 一种基于视频的水尺读数检测方法 | |
CN102663378A (zh) | 连笔手写字符的识别方法 | |
CN108235115B (zh) | 一种歌曲视频中人声区域定位的方法及终端 | |
CN102750773B (zh) | 纸币冠字号图像区域的定位方法 | |
CN102903136A (zh) | 一种手写笔迹电子化方法和系统 | |
CN103136527B (zh) | 图像处理设备及方法 | |
CN112446262A (zh) | 文本分析方法、装置、终端和计算机可读存储介质 | |
CN106228157A (zh) | 基于图像识别技术的彩色图像文字段落分割与识别方法 | |
CN111626302B (zh) | 乌金体藏文古籍文档图像的粘连文本行切分方法及系统 | |
CN109766892A (zh) | 一种基于边缘检测的射线检测图像标记信息字符分割方法 | |
CN103699876A (zh) | 一种基于线阵ccd图像识别车号的方法及装置 | |
CN106326872A (zh) | 一种扩增现实系统中手势轮廓的提取方法 | |
CN115393605A (zh) | 基于图像识别技术的岩芯rqd数字化统计方法、设备及终端 | |
CN104992176B (zh) | 一种面向碑文的汉字提取方法 | |
CN107145888A (zh) | 视频字幕实时翻译方法 | |
CN107798355B (zh) | 一种基于文档图像版式自动分析与判断的方法 | |
CN113538421A (zh) | 一种基于视觉技术的接触网数据检测方法 | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |