CN107451583A

CN107451583A - 票据图像特征提取的方法

Info

Publication number: CN107451583A
Application number: CN201710657439.5A
Authority: CN
Inventors: 李强; 王凤琴
Original assignee: Sichuan Changhong Electric Co Ltd
Current assignee: Sichuan Changhong Electric Co Ltd
Priority date: 2017-08-03
Filing date: 2017-08-03
Publication date: 2017-12-08

Abstract

本发明公开了票据图像特征提取的方法，涉及人工智能技术领域。包括以下步骤：获取用户输入的目标票据图像文件；对目标图像进行归一化处理；计算每个像素的梯度：把图像看成二维离散函数，所述像素的梯度是指对这个二维离散函数的求导；将图像划分成多个小单元，统计每个单元的描述子：根据设定的区间数量，统计每个单元的梯度直方图，从而得到每个单元的描述子；统计每个块的特征描述子：将几个单元组成一个快，并把一个块内所有单元的描述子串联起来，获得这个块的特征描述子；串接各个块的特征描述子，得到票据图像的特征描述子将票据图像的特征描述子连接到SVM分类器；通过SVM分类器可以把各种不同类型的票据给区别出来；输出特征数据。

Description

票据图像特征提取的方法

技术领域

本发明涉及人工智能技术领域，具体涉及一种票据图像特征提取的方法。

背景技术

随着计算机、互联网技术的不断发展，使用计算机软件程序来代替或简化人工工作的需求越来越多，毕竟人会疲劳，需要一定的时间休息，而计算机软件程序可以24X7不间断地工作。而且使用计算机软件程序会大大降低业务运营的成本。对于企业而言，财务人工处理的票据种类和数量呈逐年增多的趋势。由于财务制度要求财务数据应具备高精准性，故通常财务系统对这些票据往往采用手工处理，不仅会消耗大量的人力物力，而且工作效率低下。故实现票据的自动化处理，对单一的重复劳动有很大的实用价值，但是如果系统对票据中的有效内容识别率较低，不仅会带来业务风险，同时增加后续手工处理的工作量。

发明内容

本发明的目的是针对上述背景技术，提供一种票据图像特征提取的方法，可以实现高精准度的票据图像识别，有较强的实用价值。

为了达到上述的技术效果，本发明采取以下技术方案：一种票据图像特征提取的方法，包括：

第一步，获取用户输入的目标票据图像文件。

所述的获取票据图像文件可以是通过手机或数码相机的摄像头对票据纸张进行拍摄而产生的图片文件，还可以是通过光学扫描仪或多用途打印机等设备对票据纸张进行扫描而产生的图片文件。

第二步，对目标图像进行归一化处理。

是指对图像进行一系列标准的处理变换，即利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响，使之变换为一个固定标准形式的过程。这种标准形式的图像对平移、旋转、缩放等仿射变换具有不变特性。归一化处理后的图像可以抵抗几何变换的攻击，能够找出图像中的那些不变量。

第三步，计算每个像素的梯度。

把图像看成二维离散函数，所述像素的梯度是指对这个二维离散函数的求导

第四步，将图像划分成多个小单元，统计每个单元的描述子。

统计每个单元的描述子：是指根据设定的区间数量，统计每个单元的梯度直方图，从而得到每个单元的描述子。

将图像划分为多个小单元：可以根据OCR识别的精准度进行调整和优化，通常每个单元的大小为4，每个块至少包含4个单元，而梯度方向则均分为16个区间。

第五步，统计每个块的特征描述子。

将几个单元组成一个快，并把一个块内所有单元的描述子串联起来，这样就获得了这个块的特征描述子。

第六步，串接各个块的特征描述子，得到票据图像的特征描述子。

将目标图像内的所有块的特征描述子串联起来，这样就得到了目标图像的特征描述子，这个特征描述子是可用于分类使用的特征向量。

第七步，将图像的特征描述子连接到SVM分类器。

通过SVM分类器可以把各种不同类型的票据给区别出来。

第八步，输出特征数据。输出特征数据后，可以供OCR引擎使用。

与现有技术相比，本发明的有益效果是，在实际的应用场景中，使用本发明提供的方法能够比较精准的获取票据图像的特征数据，并应用于OCR引擎软件(OCR即OpticalCharacter Recognition，光学字符识别)，实现票据图像的完美识别。

附图说明

图1是本发明票据图像特征提取方法的流程示意图。

具体实施方式

下面结合本发明的实施例对本发明作进一步的阐述和说明。

实施例：

如图1所示，为本发明实施例提供的一种票据图像特征提取方法的流程示意图，该方法主要包括以下步骤：

步骤101，获取用户输入的目标票据图像文件。

所述的获取票据图像文件的实施例可以是通过手机或数码相机的摄像头对票据纸张进行拍摄而产生的图片文件，还可以是通过光学扫描仪或多用途打印机等设备对票据纸张进行扫描而产生的图片文件。

步骤102，对目标图像进行归一化处理。

所述的图像归一化处理，是指对图像进行一系列标准的处理变换，即利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响，使之变换为一个固定标准形式的过程。这种标准形式的图像对平移、旋转、缩放等仿射变换具有不变特性。归一化处理后的图像可以抵抗几何变换的攻击，能够找出图像中的那些不变量。

步骤103，计算每个像素的梯度。

可以把图像看成二维离散函数，所述像素的梯度是指对这个二维离散函数的求导：

G(x,y)＝dx(i,j)+dy(i,j)；

dx(i,j)＝I(i+1,j)-I(i,j)；

dy(i,j)＝I(i,j+1)-I(i,j)；

其中，I是图像像素的RGB值，(i,j)为像素的坐标。

RGB色彩模式是工业界的一种颜色标准，是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的，RGB即是代表红、绿、蓝三个通道的颜色。RGB值代表了像素的色彩值。

步骤104，将图像划分成多个小单元，统计每个单元的描述子。

所述的统计单元的描述子是指根据设定的区间数量，统计每个单元的梯度直方图，从而得到每个单元的描述子。

所述的将图像划分为多个小单元，其实施例可以根据OCR识别的精准度进行调整和优化，通常每个单元的大小为4，每个块至少包含4个单元，而梯度方向则均分为16个区间。

步骤105，统计每个块的特征描述子。

所述的统计块的描述子是指将几个单元组成一个快，并把一个块内所有单元的特征描述子串联起来，这样就获得了这个块的特征描述子。

步骤106，串接各个块的特征描述子，得到票据图像的特征描述子。

所述的串接各块的特征描述子是指将目标图像内的所有块的特征描述子串联起来，这样就得到了目标图像的特征描述子，这个特征描述子是可用于分类使用的特征向量。

步骤107，将特征描述子连接到SVM分类器。

SVM即Support Vector Machine，支持向量机，是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器。通过SVM分类器可以把各种不同类型的票据给区别出来。

步骤108，输出特征数据。输出特征数据后，可以供OCR引擎使用。

本发明提供的方法对于企业或公司在财务领域的票据自动识别能起到良好的促进作用，而且通过用计算机软件来代替人工识别和审核，可以有效地节省人力资源，很好地降低业务运营的成本。

可以理解的是，以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式，然而本发明并不局限于此。对于本领域内的普通技术人员而言，在不脱离本发明的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本发明的保护范围。

Claims

1.票据图像特征提取的方法，其特征在于：

步骤1：获取用户输入的目标票据图像文件；

步骤2：对目标图像进行归一化处理；

步骤3：计算每个像素的梯度：把图像看成二维离散函数，所述像素的梯度是指对这个二维离散函数的求导；

步骤4：将图像划分成多个小单元，统计每个单元的描述子：根据设定的区间数量，统计每个单元的梯度直方图，从而得到每个单元的描述子；

步骤5：统计每个块的特征描述子：将几个单元组成一个快，并把一个块内所有单元的描述子串联起来，获得这个块的特征描述子；

步骤6：串接各个块的特征描述子，得到票据图像的特征描述子

步骤7：将票据图像的特征描述子连接到SVM分类器；通过SVM分类器可以把各种不同类型的票据给区别出来；

步骤8：输出特征数据。

2.根据权利要求1所述的票据图像特征提取的方法，其特征在于，步骤2的具体操作方法是：对图像进行一系列标准的处理变换：利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响，使之变换为一个固定标准形式的过程。