CN111368847A - 一种字符识别方法、装置、计算机设备和存储介质 - Google Patents
一种字符识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111368847A CN111368847A CN202010464480.2A CN202010464480A CN111368847A CN 111368847 A CN111368847 A CN 111368847A CN 202010464480 A CN202010464480 A CN 202010464480A CN 111368847 A CN111368847 A CN 111368847A
- Authority
- CN
- China
- Prior art keywords
- character
- pixel
- distance
- image
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000004590 computer program Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 10
- 230000005484 gravity Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Abstract
本申请涉及一种字符识别方法、装置、计算机设备和存储介质。所述方法包括:获取分割字符图像的二值化图像;获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。采用本方法能够提高字符识别的准确性。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种字符识别方法、装置、计算机设备和存储介质。
背景技术
随着图像处理技术的发展,出现了字符识别技术,通过对获取的图像进行字符识别,能够获取图像中的字符。现有的字符识别方法,一般采用训练分类的方式,在训练分类前需要提取有效的字符特征用于分类,常见的字符特征有均匀网格特征,基于网格的LBP特征,边缘特征等,该类方法依赖于字符样本的收集。
然而,现有的字符特征不具备良好的平移不变性和缩放不变性,比如,当分割后的字符相对于训练前的样本字符若存在偏移或者大小变化,可能会导致识别结果出现错误,用于分类的模型需要不断地添加新的样本字符来保证字符识别的准确性,使得模型的更新成本增加。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高字符识别准确性的字符识别方法、装置、计算机设备和存储介质。
一种字符识别方法,所述方法包括:
获取分割字符图像的二值化图像;
获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
在其中一个实施例中,在所述获取分割字符图像的二值化图像之后,包括:获取以所述二值化图像的字符的重心为圆心,半径长度等于一个像素距离到最小边界像素距离的圆,并计算所述圆的字符像素占比;其中,所述最小边界像素距离等于所述圆心到所述图像边界的最小距离;计算所有所述圆的字符像素占比的总和,得到字符像素总占比;对所述半径长度从一个像素距离到最小边界像素距离的所述圆的字符像素占比依次计算累加值,在所述累加值大于或等于字符像素总占比时,获取所述累加值对应的最小半径长度;根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征。
在其中一个实施例中,所述根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征,包括:获取所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成与所述半径长度相关的占比序列;对所述占比序列进行归一化和按照线性插值的方式规整,获得字符环状结构特征。
在其中一个实施例中,所述根据所述字符外轮廓特征对所述分割字符图像中字符进行识别,包括:对所述字符外轮廓特征和所述字符环状结构特征进行拼接,获得字符一维特征向量;根据所述字符一维特征向量对所述分割字符图像中字符进行识别。
在其中一个实施例中,所述获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征,包括:获取所述二值化图像的上、下、左、右四个方向的图像边界的像素点;依次计算每个方向的所述像素点在竖直方向或水平方向至所述字符边界的像素距离;根据每个方向的所述像素点在所述图像边界排列顺序依次对所述像素距离进行排序,获得距离特征。
在其中一个实施例中,所述对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征,包括:获取每个方向的所述距离特征中的最大像素距离;从所述像素距离序列的首端搜索,获取所述像素距离大于或等于预设倍数的所述最大像素距离的最小排列顺序;从所述像素距离序列的末端搜索,获取所述像素距离大于或等于预设倍数的最大像素距离的最大排列顺序;将所述最小排列顺序和所述最大排列顺序之间的所述像素距离,组成所述方向的第一像素距离序列;将所述第一像素距离序列进行归一化,获得所述方向第二像素距离序列;将多个方向的所述第二像素距离序列按照某一时针方向进行拼接,获得字符外轮廓特征。
在其中一个实施例中,所述对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征,包括:对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得拼接距离特征;对所述拼接距离特征进行滤波,获得字符外轮廓特征。
一种字符识别装置,所述装置包括:
二值化图像获取模块,用于获取分割字符图像的二值化图像;
距离特征获取模块,用于获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
拼接模块,用于对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
识别模块,用于根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取分割字符图像的二值化图像;
获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取分割字符图像的二值化图像;
获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
上述字符识别方法、装置、计算机设备和存储介质,通过获取分割字符图像对应距离特征,并对距离特征进行规整和拼接获得字符外轮廓特征,使得字符外轮廓特征对平移和缩放不敏感,保证了分割字符图像中字符即使相对于训练前的样本字符存在偏移或者大小变化,也不影响字符识别的准确性,本申请字符识别方法大大减少了样本的数量,使得字符识别模型的搭建效率更高。
附图说明
图1为一个实施例中字符识别方法的流程示意图;
图2为一个实施例中提取距离特征的示意图;
图3为一个实施例中对距离特征拼接获得字符外轮廓特征的流程示意图;
图4为一个实施例中获取字符环状结构特征的步骤示意图;
图5为一个实施例中提取字符环状结构特征的示意图;
图6为一个实施例中不同位置和大小的字符图片提取字符环状结构特征的对比图;
图7为一个实施例中距离特征规整的示意图;
图8为一个实施例中不同位置和大小的字符图片提取字符外轮廓特征的对比图;
图9为一个实施例中字符识别装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种字符识别方法,包括以下步骤:
步骤S110,获取分割字符图像的二值化图像。
其中,分割字符图像对包括文字的图像进行分割的单个字符的图像,二值化图像可为白底黑字的图像、黑底白字的图像。获取分割字符图像的二值化图像具体过程为:对分割字符图像进行阈值分割获得二值化图像。
步骤S120,获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征。
其中,图像边界是指二值化图像的边界的像素,字符边界是指字符边界的像素。二值化图像存在多个方向的边界,例如,二值化图像为三角形的图像则存在三个方向的边界,二值化图像为矩形的图像则存在四个方向的边界。每个方向的边界包括多个像素,其中,距离特征为某一边界所有像素从垂直于边界的方向到字符边界的距离序列,距离序列中每个元素按照像素在所述边界的排列顺序排列。例如,如图2所示,字符A的二值化图像(图2a所示)为矩形,存在上、下、左、右四个边界,从边界的每个像素点按照顺时针方向(如图2a中粗箭头所示)获取距离序列;在计算上边界像素点到字符边界的距离时,以所述像素点为起点,按照图2a中细箭头方向,向下移动,直到遇到字符边界(像素值为0的像素),将移动的像素距离作为像素点到字符边界的距离,如果从所述像素点至下边界均未遇到字符边界(像素值为0的像素),将所述像素点到字符边界的距离记为0;采用同样的方法获取上边界的其它像素点对应的距离,将上边界所有的像素点对应的距离按照顺时针方向组合成上边界的距离特征(图2b中最上方的曲线图所示);其它边界也采用同样的方法获得距离特征,如图2b中所示,每个边界对应的距离特征绘制成横轴为像素点的顺序值、纵轴为距离的曲线图。
步骤S130,对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征。
其中,对所述距离特征规整包括对所述距离特征的曲线进行平移和缩放,所述距离特征的曲线的横轴为像素点的顺序值、纵轴为距离。其中,所示时针方向包括顺时针方向和逆时针方向,所示距离特征中元素的排序方向与拼接的方向相同,例如,距离特征中元素按照顺时针排序,则按照顺时针对多个方向的所述距离特征进行拼接。字符外轮廓特征包括二值化图像多个方向的距离特征,可以理解为将多个方向的距离特征组合成字符外轮廓特征。例如,如图3所示,字符A(图3a所示)的上、右、下、左四个边界对应的距离特征(图3b所示)进行拼接组合,得到字符外轮廓特征(图3c所示)。
步骤S140,根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
其中,可通过字符外轮廓特征对字符识别模型进行训练,获得通过字符外轮廓特征对字符识别的字符识别模型;字符识别模型通过预设类型的神经网络训练获取,用于根据输入的二值化图像的字符外轮廓特征,输出识别到的字符。其中,预设类型的神经网络包括LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet等神经网络,当然,预设类型的神经网络还包括逻辑回归函数。
上述字符识别方法中,通过获取分割字符图像对应距离特征,并对距离特征进行规整和拼接获得字符外轮廓特征,使得字符外轮廓特征对平移和缩放不敏感,保证了分割字符图像中字符即使相对于训练前的样本字符存在偏移或者大小变化,也不影响字符识别的准确性,本申请字符识别方法大大减少了样本的数量,使得字符识别模型的搭建效率更高。
在一个实施例中,如图4所示,在步骤S110之后包括:步骤S150,获取以所述二值化图像的字符的重心为圆心,半径长度等于一个像素距离到最小边界像素距离的圆,并计算所述圆的字符像素占比;其中,所述最小边界像素距离等于所述圆心到所述图像边界的最小距离;步骤S160,计算所有所述圆的字符像素占比的总和,得到字符像素总占比;步骤S170,对所述半径长度从一个像素距离到最小边界像素距离的所述圆的字符像素占比依次计算累加值,在所述累加值大于或等于字符像素总占比时,获取所述累加值对应的最小半径长度;步骤S180,根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征。
其中,半径长度等于一个像素距离到最小边界像素距离的圆具有多个,例如,如图5a所示,字符A的重心作为圆心,从圆心出发,半径长度以单个像素递增的方式,形成多个圆,计算每个圆的字符像素占比。其中,字符像素占比等于所述圆上属于字符的像素个数与所述圆上总像素个数的比值,例如,如图5a所示,沿着半径r(r为整数且1<=r<=R,R为最小边界像素距离)的圆周方向统计总像素个数C(r)和灰度值等于val的像素个数S(r)(字符的像素的像素值为val),显然,S(r)<=C(r),记字符像素占比H(r) = S(r)/C(r),H为一维数值序列。所述最小边界像素距离等于所述圆心到所述图像边界的最小距离,此处的距离均指像素距离,例如,像素A1、A2、A3、A4、A5相邻且在同一直线上,则像素A1到像素A3的距离为2个像素距离,则像素A1到像素A5的距离为4个像素距离。
例如,如图5所示,选取字符A的重心为圆心,半径R为最小边界像素距离,即为圆心到二值化图像的边界的最小距离,分别沿着半径r(r为整数且1<=r<=R,R为最小边界像素距离)的圆周方向统计总像素个数C(r)和灰度值等于val的像素个数S(r),记字符像素占比H(r) = S(r)/C(r),H为一维数值序列。记序列H的和为字符像素总占比sumH,从序列首端(r=1)到序列末端(r=R)依次累加,当累加值>=0.95*sumH时,停止累加,此时的序号值记为r1(最小半径长度),取新的序列cH = H(1:r1)生成字符环状结构特征,如图5b所示。
在其中一个实施例中,所述步骤S180包括:获取所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成与所述半径长度相关的占比序列;对所述占比序列进行归一化和按照线性插值的方式规整,获得字符环状结构特征。
其中,占比序列生成的曲线(如图5b所示从上往下第二个曲线图),字符像素占比作为纵轴,半径长度作为横轴,将占比序列生成的曲线进行归一化,字符像素占比的数值范围为0~1,并采用线性插值的方式规整半径长度的范围为0-30的序列得到字符环状结构特征。因为采用字符重心为圆心获取圆形区域,所以对字符平移不敏感,根据比例0.95获取序列后并规整,所以字符环状结构特征对字符缩放也不敏感,如图6所示,两张字符图像中的A的大小和位置均不相同,最终获得的字符环状结构特征基本相同,因此通过字符环状结构特征能够对不同大小或不同位置的字符进行识别。
在其中一个实施例中,所述步骤S140包括:对所述字符外轮廓特征和所述字符环状结构特征进行拼接,获得字符一维特征向量;根据所述字符一维特征向量对所述分割字符图像中字符进行识别。
其中,对所述字符外轮廓特征和所述字符环状结构特征进行拼接具体为:将字符外轮廓特征和字符环状结构特征进行组合。字符一维特征向量包括了字符外轮廓特征和字符环状结构特征。本实施例通过字符外轮廓特征和字符环状结构特征组合的字符一维特征向量,增加了字符识别的特征,能够对字符识别更加准确,同时字符外轮廓特征和字符环状结构特征具有平移不变性和缩放不变性,降低了字符识别模型的训练难度。
在其中一个实施例中,所述步骤S120包括:获取所述二值化图像的上、下、左、右四个方向的图像边界的像素点;依次计算每个方向的所述像素点在竖直方向或水平方向至所述字符边界的像素距离;根据每个方向的所述像素点在所述图像边界排列顺序依次对所述像素距离进行排序,获得距离特征。
例如,如图2所示,字符A的二值化图像(图2a所示)为矩形,存在上、下、左、右四个边界,从边界的每个像素点按照顺时针方向(如图2a中粗箭头所示)获取距离序列;在计算上边界像素点到字符边界的距离时,以所述像素点为起点,按照图2a中细箭头方向,向下移动,直到遇到字符边界(像素值为0的像素),将移动的像素距离作为像素点到字符边界的距离,如果从所述像素点至下边界均未遇到字符边界(像素值为0的像素),将所述像素点到字符边界的距离记为0;采用同样的方法获取上边界的其它像素点对应的距离,将上边界所有的像素点对应的距离按照顺时针方向组合成上边界的距离特征(图2b中最上方的曲线图所示);其它边界也采用同样的方法获得距离特征,如图2b中所示,每个边界对应的距离特征绘制成横轴为像素点的顺序值、纵轴为距离的曲线图。
在其中一个实施例中,所述步骤S130包括:获取每个方向的所述距离特征中的最大像素距离;从所述像素距离序列的首端搜索,获取所述像素距离大于或等于预设倍数的所述最大像素距离的最小排列顺序;从所述像素距离序列的末端搜索,获取所述像素距离大于或等于预设倍数的最大像素距离的最大排列顺序;将所述最小排列顺序和所述最大排列顺序之间的所述像素距离,组成所述方向的第一像素距离序列;将所述第一像素距离序列进行归一化,获得所述方向第二像素距离序列;将多个方向的所述第二像素距离序列按照某一时针方向进行拼接,获得字符外轮廓特征。
例如,如图7所示,图7(a)表示距离特征的序列fUp曲线图,序列长度为L(距离特征中元素的个数),序列中的最大值即最大像素距离记为max(fUp),沿着序列首端(i=0)向末端(i=L-1)搜索,预设倍数为0.05,第一次遇到fUp(i)>=0.05*max(fUp),记最小排列顺序x1=i,停止搜索;沿着序列末端(i=L-1)向序列首端(i=0)搜索,第一次遇到fUp(i)>=0.05*max(fUp),记最大排列顺序x2=i;取像素距离在x1~x2范围内的序列,记为第一像素距离序列cfUp=fUp(x1:x2),如图7(b)所示。归一化过程为:对第一像素距离序列cfUp,其最小值为min(cfUp),对cfUp序列中的每一个值都减去其最小值,即cfUp(i)=cfUp(i)-min(cfUp),如图7(c)所示,调整cfUp曲线纵轴像素距离的数值范围在0~1,如图7(d)所示,最后,采用线性差值的方式,将cfUp曲线的横轴调整为长度为15的序列nfUp,得到第二像素距离序列,如图7(e)所示。采用相同的方式,可分别获得二值化图像的右边界、下边界和左边界的规整后的第二像素距离序列nfRight、nfDown、nfLeft,最后将四个边界的规整后的第二像素距离序列按顺时针方向依次整合为字符的字符外轮廓特征OutFeature=[nfUp,nfRight,nfDown,nfLeft],如图3c所示。本实施例中,对距离特征规整获得字符外轮廓特征,对字符的平移和缩放不敏感,相同字符的对应字符外轮廓特征大致一致,如图8所示,两张字符图像中的A的大小和位置均不相同,最终获得的字符外轮廓特征基本相同,因此通过字符外轮廓特征能够对不同大小或不同位置的字符进行识别。
在其中一个实施例中,所述步骤S130包括:对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得拼接距离特征;对所述拼接距离特征进行滤波,获得字符外轮廓特征。
其中,拼接距离特征进行滤波能够避免特征毛刺的影响,其中滤波方式可采用均值滤波。
应该理解的是,虽然图1、4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1、4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种字符识别装置,包括:二值化图像获取模块210、距离特征获取模块220、拼接模块230和识别模块240。其中:
二值化图像获取模块210,用于获取分割字符图像的二值化图像。
距离特征获取模块220,用于获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征。
拼接模块230,用于对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征。
识别模块240,用于根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
在其中一个实施例中,所述字符识别装置,还包括:字符像素占比计算模块,用于获取以所述二值化图像的字符的重心为圆心,半径长度等于一个像素距离到最小边界像素距离的圆,并计算所述圆的字符像素占比;其中,所述最小边界像素距离等于所述圆心到所述图像边界的最小距离;字符像素总占比计算模块,用于计算所有所述圆的字符像素占比的总和,得到字符像素总占比;最小半径长度计算模块,用于对所述半径长度从一个像素距离到最小边界像素距离的所述圆的字符像素占比依次计算累加值,在所述累加值大于或等于字符像素总占比时,获取所述累加值对应的最小半径长度;字符环状结构特征生成模块,用于根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征。
在其中一个实施例中,所述字符环状结构特征生成模块包括:占比序列生成单元,用于获取所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成与所述半径长度相关的占比序列;规整单元,用于对所述占比序列进行归一化和按照线性插值的方式规整,获得字符环状结构特征。
在其中一个实施例中,所述识别模块240包括:特征拼接单元,用于对所述字符外轮廓特征和所述字符环状结构特征进行拼接,获得字符一维特征向量;识别单元,用于根据所述字符一维特征向量对所述分割字符图像中字符进行识别。
在其中一个实施例中,所述距离特征获取模块220包括:像素点获取单元,用于获取所述二值化图像的上、下、左、右四个方向的图像边界的像素点;像素距离计算单元,用于依次计算每个方向的所述像素点在竖直方向或水平方向至所述字符边界的像素距离;距离特征获取单元,用于根据每个方向的所述像素点在所述图像边界排列顺序依次对所述像素距离进行排序,获得距离特征。
在其中一个实施例中,所述拼接模块230包括:最大像素距离获取单元,用于获取每个方向的所述距离特征中的最大像素距离;最小排列顺序获取单元,用于从所述像素距离序列的首端搜索,获取所述像素距离大于或等于预设倍数的所述最大像素距离的最小排列顺序;最大排列顺序获取单元,用于从所述像素距离序列的末端搜索,获取所述像素距离大于或等于预设倍数的最大像素距离的最大排列顺序;第一像素距离序列生成单元,用于将所述最小排列顺序和所述最大排列顺序之间的所述像素距离,组成所述方向的第一像素距离序列;第二像素距离序列获取单元,用于将所述第一像素距离序列进行归一化,获得所述方向第二像素距离序列;字符外轮廓特征获取单元,用于将多个方向的所述第二像素距离序列按照某一时针方向进行拼接,获得字符外轮廓特征。
在其中一个实施例中,所述拼接模块230包括:拼接单元,用于对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得拼接距离特征;字符外轮廓特征获取单元,用于对所述拼接距离特征进行滤波,获得字符外轮廓特征。
关于字符识别装置的具体限定可以参见上文中对于字符识别方法的限定,在此不再赘述。上述字符识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储标准字符外轮廓特征数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种字符识别方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取分割字符图像的二值化图像;
获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取以所述二值化图像的字符的重心为圆心,半径长度等于一个像素距离到最小边界像素距离的圆,并计算所述圆的字符像素占比;其中,所述最小边界像素距离等于所述圆心到所述图像边界的最小距离;计算所有所述圆的字符像素占比的总和,得到字符像素总占比;对所述半径长度从一个像素距离到最小边界像素距离的所述圆的字符像素占比依次计算累加值,在所述累加值大于或等于字符像素总占比时,获取所述累加值对应的最小半径长度;根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取分割字符图像的二值化图像;
获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取以所述二值化图像的字符的重心为圆心,半径长度等于一个像素距离到最小边界像素距离的圆,并计算所述圆的字符像素占比;其中,所述最小边界像素距离等于所述圆心到所述图像边界的最小距离;计算所有所述圆的字符像素占比的总和,得到字符像素总占比;对所述半径长度从一个像素距离到最小边界像素距离的所述圆的字符像素占比依次计算累加值,在所述累加值大于或等于字符像素总占比时,获取所述累加值对应的最小半径长度;根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种字符识别方法,其特征在于,所述方法包括:
获取分割字符图像的二值化图像;
获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
2.根据权利要求1所述的方法,其特征在于,在所述获取分割字符图像的二值化图像之后,包括:
获取以所述二值化图像的字符的重心为圆心,半径长度等于一个像素距离到最小边界像素距离的圆,并计算所述圆的字符像素占比;其中,所述最小边界像素距离等于所述圆心到所述图像边界的最小距离;
计算所有所述圆的字符像素占比的总和,得到字符像素总占比;
对所述半径长度从一个像素距离到最小边界像素距离的所述圆的字符像素占比依次计算累加值,在所述累加值大于或等于字符像素总占比时,获取所述累加值对应的最小半径长度;
根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成字符环状结构特征,包括:
获取所述半径长度属于一个像素距离到所述最小半径长度的所述圆的字符像素占比,生成与所述半径长度相关的占比序列;
对所述占比序列进行归一化和按照线性插值的方式规整,获得字符环状结构特征。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述字符外轮廓特征对所述分割字符图像中字符进行识别,包括:
对所述字符外轮廓特征和所述字符环状结构特征进行拼接,获得字符一维特征向量;
根据所述字符一维特征向量对所述分割字符图像中字符进行识别。
5.根据权利要求1所述的方法,其特征在于,所述获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征,包括:
获取所述二值化图像的上、下、左、右四个方向的图像边界的像素点;
依次计算每个方向的所述像素点在竖直方向或水平方向至所述字符边界的像素距离;
根据每个方向的所述像素点在所述图像边界排列顺序依次对所述像素距离进行排序,获得距离特征。
6.根据权利要求5所述的方法,其特征在于,所述对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征,包括:
获取每个方向的所述距离特征中的最大像素距离;
从所述像素距离序列的首端搜索,获取所述像素距离大于或等于预设倍数的所述最大像素距离的最小排列顺序;
从所述像素距离序列的末端搜索,获取所述像素距离大于或等于预设倍数的最大像素距离的最大排列顺序;
将所述最小排列顺序和所述最大排列顺序之间的所述像素距离,组成所述方向的第一像素距离序列;
将所述第一像素距离序列进行归一化,获得所述方向第二像素距离序列;
将多个方向的所述第二像素距离序列按照某一时针方向进行拼接,获得字符外轮廓特征。
7.根据权利要求1所述的方法,其特征在于,所述对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征,包括:
对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得拼接距离特征;
对所述拼接距离特征进行滤波,获得字符外轮廓特征。
8.一种字符识别装置,其特征在于,所述装置包括:
二值化图像获取模块,用于获取分割字符图像的二值化图像;
距离特征获取模块,用于获取所述二值化图像的多个方向的从图像边界至字符边界的距离特征;
拼接模块,用于对多个方向的所述距离特征规整后按照某一时针方向进行拼接,获得字符外轮廓特征;
识别模块,用于根据所述字符外轮廓特征对所述分割字符图像中字符进行识别。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464480.2A CN111368847B (zh) | 2020-05-28 | 2020-05-28 | 一种字符识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464480.2A CN111368847B (zh) | 2020-05-28 | 2020-05-28 | 一种字符识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111368847A true CN111368847A (zh) | 2020-07-03 |
CN111368847B CN111368847B (zh) | 2020-10-27 |
Family
ID=71209684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010464480.2A Active CN111368847B (zh) | 2020-05-28 | 2020-05-28 | 一种字符识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368847B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751785A (zh) * | 2010-01-12 | 2010-06-23 | 杭州电子科技大学 | 基于图像处理的车牌自动识别方法 |
CN103761531A (zh) * | 2014-01-20 | 2014-04-30 | 西安理工大学 | 基于形状轮廓特征的稀疏编码车牌字符识别方法 |
CN104331688A (zh) * | 2014-11-05 | 2015-02-04 | 中北大学 | 一种雷管外壳点阵字符识别方法 |
CN105930842A (zh) * | 2016-04-15 | 2016-09-07 | 深圳市永兴元科技有限公司 | 字符识别方法及装置 |
-
2020
- 2020-05-28 CN CN202010464480.2A patent/CN111368847B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751785A (zh) * | 2010-01-12 | 2010-06-23 | 杭州电子科技大学 | 基于图像处理的车牌自动识别方法 |
CN103761531A (zh) * | 2014-01-20 | 2014-04-30 | 西安理工大学 | 基于形状轮廓特征的稀疏编码车牌字符识别方法 |
CN104331688A (zh) * | 2014-11-05 | 2015-02-04 | 中北大学 | 一种雷管外壳点阵字符识别方法 |
CN105930842A (zh) * | 2016-04-15 | 2016-09-07 | 深圳市永兴元科技有限公司 | 字符识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
IL-SEOK OH等: "Distance features for neural network-based recognition of handwritten characters", 《INTERNATIONAL JOURNAL ON DOCUMENT ANALYSIS AND RECOGNITION》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111368847B (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710866B (zh) | 汉字模型训练方法、汉字识别方法、装置、设备及介质 | |
US10552705B2 (en) | Character segmentation method, apparatus and electronic device | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
WO2019232853A1 (zh) | 中文模型训练、中文图像识别方法、装置、设备及介质 | |
US9367766B2 (en) | Text line detection in images | |
CN109801260B (zh) | 牲畜个数的识别方法、装置、控制装置及可读存储介质 | |
WO2019015785A1 (en) | METHOD AND SYSTEM FOR LEARNING A NEURAL NETWORK TO BE USED FOR SEMANTIC INSTANCE SEGMENTATION | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
KR20220093187A (ko) | 포지셔닝 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 | |
CN111523429A (zh) | 基于深度学习的堆钢识别方法 | |
CN114299363A (zh) | 图像处理模型的训练方法、图像分类方法及装置 | |
CN113963353A (zh) | 一种文字图像处理识别方法、装置、计算机设备和存储介质 | |
CN112560856B (zh) | 车牌检测识别方法、装置、设备及存储介质 | |
CN111368847B (zh) | 一种字符识别方法、装置、计算机设备和存储介质 | |
CN111325199B (zh) | 一种文字倾斜角度检测方法及装置 | |
CN109657577B (zh) | 一种基于熵和运动偏移量的动物检测方法 | |
CN115984671A (zh) | 模型在线更新方法、装置、电子设备及可读存储介质 | |
CN111414952B (zh) | 行人重识别的噪声样本识别方法、装置、设备和存储介质 | |
CN111462059B (zh) | 胎儿超声图像智能目标检测的并行处理方法和装置 | |
CN113392455A (zh) | 基于深度学习的户型图比例尺检测方法、装置及电子设备 | |
CN111860289A (zh) | 一种时序动作检测方法、装置及计算机设备 | |
CN111739025A (zh) | 一种图像处理方法、装置、终端及存储介质 | |
CN112464894B (zh) | 交互方法、装置及计算机设备 | |
CN112417184B (zh) | 多场景特征信息存储结构及其比对方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A character recognition method, device, computer equipment, and storage medium Granted publication date: 20201027 Pledgee: Hangzhou High-tech Financing Guarantee Co.,Ltd. Pledgor: HANGZHOU HUICUI INTELLIGENT TECHNOLOGY CO.,LTD. Registration number: Y2024980003708 |