CN109727363B

CN109727363B - 一种在票据中识别大写金额的方法

Info

Publication number: CN109727363B
Application number: CN201811366005.0A
Authority: CN
Inventors: 赵亮; 刘贯伟; 刘秀; 武艳红
Original assignee: Cashway Technology Co Ltd
Current assignee: Cashway Technology Co Ltd
Priority date: 2018-11-16
Filing date: 2018-11-16
Publication date: 2022-03-29
Anticipated expiration: 2038-11-16
Also published as: CN109727363A

Abstract

本发明公开在票据中识别大写金额的方法，包括采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像，生成多种不同风格的仿手写体的数字大写字符的图像；对多种图像投影初次分割，选择通过求连通区域的方法将字符分开：或利用区域梯度图像，与卷积核卷积运算，利用像素点梯度，通过形成的分割路径将该子区域内的字符分开，最终形成字符分割算法；识别时，利用该字符分割算法对票据中的数字大写图像分割，形成单个字符然后输入到神经网识别模型中进行字符识别。本发明实现了对手写体大写金额的快速分割。

Description

一种在票据中识别大写金额的方法

技术领域

本发明涉及图像识别技术领域，特别是涉及一种在票据中识别大写金额的方法。

背景技术

在票据鉴伪和识别中，针对票据图像，需要识别其中手写体的大写金额，如"零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾"等。识别过程一般分为三步：1.在图像中裁剪出包含手写体金额的大致范围。2.将手写体金额分割为单个的字符。3.用神经网络识别每个字符。

第一步较为简单，因为手写体金额在票据中的相对位置是固定的。第二步的难点在于，由于不同人的手写风格十分迥异，且存在连笔的情形，因此字符分割很难做到百分百精确。比如在连笔字的情形前一个汉字的某些笔画可能与后一个汉字合并在一起，或者两个十分接近的汉字被合并为一个汉字。在票据识别这种对识别率要求非常高的场景，寻找更准确的汉字字符分割算法是非常必要的。第三步的难点在于获取包含足够样本量的训练数据。目前开源的汉字手写体数据集(如模式识别国家重点实验室发表的HWDB数据集)都是针对大多数常用汉字的，其中大写数字的样本量较小。

发明内容

本发明的目的是针对现有技术中存在的技术缺陷，而提供一种在票据中识别大写金额的方法。

为实现本发明的目的所采用的技术方案是：

一种在票据中识别大写金额的方法，包括步骤：

采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像，生成多种不同风格的仿手写体的数字大写字符的图像；

对多种所述图像进行投影实现初次分割，若初次分割后形成的子区域中两个字符投影相连，但字符不相连，通过求连通区域的方法将此两个字符分开：若初次分割后形成的子区域中两个字符投影相连且字符相连，则采用以下步骤分割：

计算该子区域的梯度图像，然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算，计算出每个像素点的梯度方向，将该梯度方向看作是该像素点的笔画方向；

从该子区域顶部的一个梯度为零的初始像素点开始，选择向下方梯度最小的像素点而向下移动以避开笔画方向，直到移动该子区域的底部为止，从而形成一条近似曲线的将该子区域内的字符分开的分割路径，将该分割路径用一条逐段线性的折线拟合，得到分割折线；最终形成字符分割算法；

识别时，利用该字符分割算法对票据中的数字大写图像进行分割，形成单个字符然后输入到神经网识别模型中进行字符识别。

所述卷积核采用7x7卷积核。

本发明从已有小的样本集出发，用程序生成样本量较大且随机性较好的样本图像，然后对这些样本图像进行分割，形成字符分割算法，实现对手写体大写金额的字符分割，从而实现了对手写体大写金额快速分割，为字符识别奠定的基础。

附图说明

图1所示为本发明的在票据中识别大写金额的方法的流程图；

图2所示为生成的变形手写体的图像；

图3所示为具有连通区域的子区域图像；

图4所示为不具有连通区域的子区域图像；

图5所示为图像分割后形成分割折线的示意图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1-5所示，本发明的在票据中识别大写金额的方法，包括步骤：

S1,采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像，生成多种不同风格的仿手写体的数字大写字符的图像；

即对给定的包含单个数字大写形式的汉字字符的图像，用弹性形变方法生成更多风格类似图像，如图1所示，为生成的图像。

具体是，对每个像素点(x,y)，生成两个随机数Δx和Δy，它们分别表示该像素点在水平和垂直方向的位移。生成一个均值为0，方差为σ的高斯核KN×N，将Δx和Δy与KN×N作卷积，并将得到的结果作用于原图像。当σ取值较大时，高斯核值会很小，变换后的结果看上去是原图的一个随机的平移；σ取值较小时变换后的结果类似与随机噪声。只有σ大小合适时变换后的图像，才是原始图像经过弹性变换的图像。本申请取σ＝4。

S2,对多种所述图像进行投影实现初次分割，若初次分割后形成的子区域中两个字符投影相连，但字符不相连，通过求连通区域的方法将此两个字符分开：若初次分割后形成的子区域中两个字符投影相连且字符相连，则采用以下步骤分割：计算该子区域的梯度图像，然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算，计算出每个像素点的梯度方向，将该梯度方向看作是该像素点的笔画方向；从该子区域顶部的一个梯度为零的初始像素点开始，选择向下方梯度最小的像素点而向下移动以避开笔画方向，直到移动该子区域的底部为止，从而形成一条近似曲线的将该子区域内的字符分开的分割路径，将该分割路径用一条逐段线性的折线拟合，得到分割折线；最终形成字符分割算法；

其中，字符分割最直接的方式是投影法，即把灰度图像的每一列投影到下方直线上，根据投影的结果来分割字符，但是若两个汉字相连，或者虽然不相连但是它们的投影相连，则这种方法就会有问题。

为此，本发明采用下方法：

首先用投影法获得一个粗略分割，初次分割下两个接近或者相连的汉字可能被分在一起；在第一步粗分割的基础上进行二次细分。这时对一个子区域，考虑两种情形：1)两个字符投影相连但是它们本身不相连。如图2所示：这种情形可以通过求连通区域的方法将它们分开。2)如果不存在连通区域，这说明可能出现两个字符的笔画连在一起的情形。

如图3所示：对这种不存在连通区域情形，按照如下方式，求出一条近似的分割折线来把它们分开，这可通过解一个最优化问题来实现。

首先求出此区域的梯度图像D以及8个7x7的卷积核，这8个卷积核是均匀分布的8个方向。将梯度图像与这8个方向分别作卷积运算，对每个像素点，其得到的结果中最大的一个即为此点的梯度方向。该点的梯度方向可以近似理解为该点的笔画方向。然后在粗分割的基础上，从一个上方的梯度为0的初始点开始，每次移动到其下方三个相邻的像素点中梯度最小者(有多个相同的最小者时选择正下方的像素点)，直到移动到区域底部为止。这时wfc得到一条近似曲线的分割路径C＝{(x₁,y₁),(x₂,y₂),…,(x_n,y_n)}。

最后对上面的分割路径，用一条逐段线性的折线拟合之。这是一个最小二乘逼近问题，最终得到折线P，最终的效果图4所示。

S3,识别时，利用该字符分割算法对票据中的数字大写图像进行分割，形成单个字符然后输入到神经网识别模型中进行字符识别。

本发明采用从已有的小的样本集出发，用程序生成样本量较大且随机性较好的数据集，然后用这个数据集中的数据去训练，形成字符分割算法，进行手写体大写金额的字符分割，这样在识别前，实现了对手写体大写金额的快速分割，为进一步的识别奠定的基础。

以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种在票据中识别大写金额的方法，其特征在于，包括步骤：

采用弹性形变的方法针对给定的包含多个数字大写形式的汉字字符的图像，生成多种不同风格的仿手写体的数字大写字符的形变图像；

对多种所述形变图像进行投影实现初次分割，若初次分割后形成的子区域中两个字符投影相连，但字符不相连，通过求连通区域的方法将此两个字符分开：若初次分割后形成的子区域中两个字符投影相连且字符相连，则采用以下步骤分割：

2.如权利要求1所述在票据中识别大写金额的方法，其特征在于，所述卷积核采用7x7卷积核。