CN107451583A - 票据图像特征提取的方法 - Google Patents
票据图像特征提取的方法 Download PDFInfo
- Publication number
- CN107451583A CN107451583A CN201710657439.5A CN201710657439A CN107451583A CN 107451583 A CN107451583 A CN 107451583A CN 201710657439 A CN201710657439 A CN 201710657439A CN 107451583 A CN107451583 A CN 107451583A
- Authority
- CN
- China
- Prior art keywords
- image
- feature descriptor
- bill images
- bill
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了票据图像特征提取的方法,涉及人工智能技术领域。包括以下步骤:获取用户输入的目标票据图像文件;对目标图像进行归一化处理;计算每个像素的梯度:把图像看成二维离散函数,所述像素的梯度是指对这个二维离散函数的求导;将图像划分成多个小单元,统计每个单元的描述子:根据设定的区间数量,统计每个单元的梯度直方图,从而得到每个单元的描述子;统计每个块的特征描述子:将几个单元组成一个快,并把一个块内所有单元的描述子串联起来,获得这个块的特征描述子;串接各个块的特征描述子,得到票据图像的特征描述子将票据图像的特征描述子连接到SVM分类器;通过SVM分类器可以把各种不同类型的票据给区别出来;输出特征数据。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种票据图像特征提取的方法。
背景技术
随着计算机、互联网技术的不断发展,使用计算机软件程序来代替或简化人工工作的需求越来越多,毕竟人会疲劳,需要一定的时间休息,而计算机软件程序可以24X7不间断地工作。而且使用计算机软件程序会大大降低业务运营的成本。对于企业而言,财务人工处理的票据种类和数量呈逐年增多的趋势。由于财务制度要求财务数据应具备高精准性,故通常财务系统对这些票据往往采用手工处理,不仅会消耗大量的人力物力,而且工作效率低下。故实现票据的自动化处理,对单一的重复劳动有很大的实用价值,但是如果系统对票据中的有效内容识别率较低,不仅会带来业务风险,同时增加后续手工处理的工作量。
发明内容
本发明的目的是针对上述背景技术,提供一种票据图像特征提取的方法,可以实现高精准度的票据图像识别,有较强的实用价值。
为了达到上述的技术效果,本发明采取以下技术方案:一种票据图像特征提取的方法,包括:
第一步,获取用户输入的目标票据图像文件。
所述的获取票据图像文件可以是通过手机或数码相机的摄像头对票据纸张进行拍摄而产生的图片文件,还可以是通过光学扫描仪或多用途打印机等设备对票据纸张进行扫描而产生的图片文件。
第二步,对目标图像进行归一化处理。
是指对图像进行一系列标准的处理变换,即利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响,使之变换为一个固定标准形式的过程。这种标准形式的图像对平移、旋转、缩放等仿射变换具有不变特性。归一化处理后的图像可以抵抗几何变换的攻击,能够找出图像中的那些不变量。
第三步,计算每个像素的梯度。
把图像看成二维离散函数,所述像素的梯度是指对这个二维离散函数的求导
第四步,将图像划分成多个小单元,统计每个单元的描述子。
统计每个单元的描述子:是指根据设定的区间数量,统计每个单元的梯度直方图,从而得到每个单元的描述子。
将图像划分为多个小单元:可以根据OCR识别的精准度进行调整和优化,通常每个单元的大小为4,每个块至少包含4个单元,而梯度方向则均分为16个区间。
第五步,统计每个块的特征描述子。
将几个单元组成一个快,并把一个块内所有单元的描述子串联起来,这样就获得了这个块的特征描述子。
第六步,串接各个块的特征描述子,得到票据图像的特征描述子。
将目标图像内的所有块的特征描述子串联起来,这样就得到了目标图像的特征描述子,这个特征描述子是可用于分类使用的特征向量。
第七步,将图像的特征描述子连接到SVM分类器。
通过SVM分类器可以把各种不同类型的票据给区别出来。
第八步,输出特征数据。输出特征数据后,可以供OCR引擎使用。
与现有技术相比,本发明的有益效果是,在实际的应用场景中,使用本发明提供的方法能够比较精准的获取票据图像的特征数据,并应用于OCR引擎软件(OCR即OpticalCharacter Recognition,光学字符识别),实现票据图像的完美识别。
附图说明
图1是本发明票据图像特征提取方法的流程示意图。
具体实施方式
下面结合本发明的实施例对本发明作进一步的阐述和说明。
实施例:
如图1所示,为本发明实施例提供的一种票据图像特征提取方法的流程示意图,该方法主要包括以下步骤:
步骤101,获取用户输入的目标票据图像文件。
所述的获取票据图像文件的实施例可以是通过手机或数码相机的摄像头对票据纸张进行拍摄而产生的图片文件,还可以是通过光学扫描仪或多用途打印机等设备对票据纸张进行扫描而产生的图片文件。
步骤102,对目标图像进行归一化处理。
所述的图像归一化处理,是指对图像进行一系列标准的处理变换,即利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响,使之变换为一个固定标准形式的过程。这种标准形式的图像对平移、旋转、缩放等仿射变换具有不变特性。归一化处理后的图像可以抵抗几何变换的攻击,能够找出图像中的那些不变量。
步骤103,计算每个像素的梯度。
可以把图像看成二维离散函数,所述像素的梯度是指对这个二维离散函数的求导:
G(x,y)=dx(i,j)+dy(i,j);
dx(i,j)=I(i+1,j)-I(i,j);
dy(i,j)=I(i,j+1)-I(i,j);
其中,I是图像像素的RGB值,(i,j)为像素的坐标。
RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色。RGB值代表了像素的色彩值。
步骤104,将图像划分成多个小单元,统计每个单元的描述子。
所述的统计单元的描述子是指根据设定的区间数量,统计每个单元的梯度直方图,从而得到每个单元的描述子。
所述的将图像划分为多个小单元,其实施例可以根据OCR识别的精准度进行调整和优化,通常每个单元的大小为4,每个块至少包含4个单元,而梯度方向则均分为16个区间。
步骤105,统计每个块的特征描述子。
所述的统计块的描述子是指将几个单元组成一个快,并把一个块内所有单元的特征描述子串联起来,这样就获得了这个块的特征描述子。
步骤106,串接各个块的特征描述子,得到票据图像的特征描述子。
所述的串接各块的特征描述子是指将目标图像内的所有块的特征描述子串联起来,这样就得到了目标图像的特征描述子,这个特征描述子是可用于分类使用的特征向量。
步骤107,将特征描述子连接到SVM分类器。
SVM即Support Vector Machine,支持向量机,是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器。通过SVM分类器可以把各种不同类型的票据给区别出来。
步骤108,输出特征数据。输出特征数据后,可以供OCR引擎使用。
本发明提供的方法对于企业或公司在财务领域的票据自动识别能起到良好的促进作用,而且通过用计算机软件来代替人工识别和审核,可以有效地节省人力资源,很好地降低业务运营的成本。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (2)
1.票据图像特征提取的方法,其特征在于:
步骤1:获取用户输入的目标票据图像文件;
步骤2:对目标图像进行归一化处理;
步骤3:计算每个像素的梯度:把图像看成二维离散函数,所述像素的梯度是指对这个二维离散函数的求导;
步骤4:将图像划分成多个小单元,统计每个单元的描述子:根据设定的区间数量,统计每个单元的梯度直方图,从而得到每个单元的描述子;
步骤5:统计每个块的特征描述子:将几个单元组成一个快,并把一个块内所有单元的描述子串联起来,获得这个块的特征描述子;
步骤6:串接各个块的特征描述子,得到票据图像的特征描述子
步骤7:将票据图像的特征描述子连接到SVM分类器;通过SVM分类器可以把各种不同类型的票据给区别出来;
步骤8:输出特征数据。
2.根据权利要求1所述的票据图像特征提取的方法,其特征在于,步骤2的具体操作方法是:对图像进行一系列标准的处理变换:利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响,使之变换为一个固定标准形式的过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710657439.5A CN107451583A (zh) | 2017-08-03 | 2017-08-03 | 票据图像特征提取的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710657439.5A CN107451583A (zh) | 2017-08-03 | 2017-08-03 | 票据图像特征提取的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107451583A true CN107451583A (zh) | 2017-12-08 |
Family
ID=60490264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710657439.5A Pending CN107451583A (zh) | 2017-08-03 | 2017-08-03 | 票据图像特征提取的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107451583A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463128A (zh) * | 2014-12-17 | 2015-03-25 | 智慧眼(湖南)科技发展有限公司 | 用于人脸识别的眼镜检测方法及系统 |
CN105095889A (zh) * | 2014-04-22 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 特征提取、字符识别、引擎生成、信息确定方法及装置 |
CN105654093A (zh) * | 2015-11-25 | 2016-06-08 | 小米科技有限责任公司 | 特征提取方法及装置 |
CN106096667A (zh) * | 2016-07-26 | 2016-11-09 | 江苏鸿信系统集成有限公司 | 基于svm的票据图像分类方法 |
-
2017
- 2017-08-03 CN CN201710657439.5A patent/CN107451583A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095889A (zh) * | 2014-04-22 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 特征提取、字符识别、引擎生成、信息确定方法及装置 |
CN104463128A (zh) * | 2014-12-17 | 2015-03-25 | 智慧眼(湖南)科技发展有限公司 | 用于人脸识别的眼镜检测方法及系统 |
CN105654093A (zh) * | 2015-11-25 | 2016-06-08 | 小米科技有限责任公司 | 特征提取方法及装置 |
CN106096667A (zh) * | 2016-07-26 | 2016-11-09 | 江苏鸿信系统集成有限公司 | 基于svm的票据图像分类方法 |
Non-Patent Citations (4)
Title |
---|
刘永坚等: "《现代电子战支援侦察系统分析与设计》", 31 December 2016 * |
张志毅: "《中国爆破新技术》", 30 September 2016 * |
徐科等: "《金属表面质量在线检测技术》", 31 October 2016 * |
李雷达: "《图像质量评价中的特征提取方法与应用》", 30 June 2015 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9230382B2 (en) | Document image capturing and processing | |
CN108335331B (zh) | 一种钢卷双目视觉定位方法及设备 | |
US8693790B2 (en) | Form template definition method and form template definition apparatus | |
CN101957919B (zh) | 基于图像局部特征检索的文字识别方法 | |
US10311322B2 (en) | Character information recognition method based on image processing | |
CN110674815A (zh) | 基于深度学习关键点检测的发票图像畸变校正方法 | |
US7606414B2 (en) | Fusion of color space data to extract dominant color | |
CN109871845B (zh) | 证件图像提取方法及终端设备 | |
KR101893679B1 (ko) | 딥 러닝을 이용한 카드번호 인식방법 | |
JPWO2011074067A1 (ja) | 文字認識方法、文字認識装置および文字認識プログラム | |
CN111259891B (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN101295359A (zh) | 图像处理程序及图像处理装置 | |
CN103198311A (zh) | 基于拍摄的图像来识别字符的方法及装置 | |
CN104077557B (zh) | 一种获取卡片信息的方法和装置 | |
CN109886257B (zh) | 一种ocr系统中采用深度学习矫正发票图片分割结果的方法 | |
CN103824373A (zh) | 一种票据图像金额分类方法及系统 | |
CN108197624A (zh) | 证书图像校正识别方法及装置、计算机存储介质 | |
CN113569864B (zh) | 一种识别签字和印章的方法及系统 | |
CN113569863A (zh) | 一种单据稽查的方法、系统、电子设备及存储介质 | |
CN105117704A (zh) | 一种基于多特征的文本图像一致性比较方法 | |
CN110991434B (zh) | 自助终端证件识别方法及装置 | |
US20110064304A1 (en) | Electronic document comparison system and method | |
CN110569716A (zh) | 一种货架图像翻拍检测方法 | |
CN113902402A (zh) | 基于ar技术的单据辅助填写方法、系统、存储介质及装置 | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171208 |
|
RJ01 | Rejection of invention patent application after publication |