CN108460381B - 基于图像识别的发票报销信息定位及截取方法 - Google Patents

基于图像识别的发票报销信息定位及截取方法 Download PDF

Info

Publication number
CN108460381B
CN108460381B CN201810203890.4A CN201810203890A CN108460381B CN 108460381 B CN108460381 B CN 108460381B CN 201810203890 A CN201810203890 A CN 201810203890A CN 108460381 B CN108460381 B CN 108460381B
Authority
CN
China
Prior art keywords
image
invoice
reimbursement information
reimbursement
positioning method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810203890.4A
Other languages
English (en)
Other versions
CN108460381A (zh
Inventor
董恒
蒋璎
范山岗
熊健
王禹
杨洁
桂冠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201810203890.4A priority Critical patent/CN108460381B/zh
Publication of CN108460381A publication Critical patent/CN108460381A/zh
Application granted granted Critical
Publication of CN108460381B publication Critical patent/CN108460381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning

Abstract

本发明公开了一种基于图像识别的发票报销信息定位方法,包括从发票图像中分离提取全机打字符二值化图像;对全机打字符二值化图像进行黑白转换,获取相应的反转图像;对反转图像进行连通域连接,得到腐蚀成块图像;对腐蚀成块图像进行外部矩形边界检测,检测出各报销信息块的顶点和底点位置信息。本发明还公开了一种发票报销信息截取方法,包括采用前述的发票报销信息定位方法,按照纵向分行顺序截取各报销信息块。将本发明应用于发票报销中能够检测出所采集的发票图像中各个可报销信息连通域的位置信息,并根据位置信息对发票图像进行分块截取,提高了发票报销的工作效率、降低了出错率,具有较高的稳定性和鲁棒性。

Description

基于图像识别的发票报销信息定位及截取方法
技术领域
本发明涉及一种基于图像识别的发票报销信息定位及截取方法,属于图像处理技术领域。
背景技术
随着社会经济的高速发展,我国发票使用量日益上升。目前,我国每年报销使用的发票数以亿计,而且呈现出上升的趋势。但是现在大部分发票报销工作是由人工完成。人工报销发票效率低,报销流程长,消耗时间多,出错率极高。人工报销发票不仅加重了财务人员的工作负担,而且会占用报销者大量额外的精力,更会加重企业的生产成本。
近些年来,随着图像处理以及计算机视觉技术的飞快发展,高精度、高效率、低成本的文字识别技术得以实现。许多国内外的科研机构和科研人员将计算机视觉这一新兴技术引入到发票识别等相关领域中去,并对该技术的可行性进行了严谨深刻的分析。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种基于图像识别的发票报销信息定位及截取方法,解决现有技术中发票报销信息依赖人工识别工作效率低、报销流程长、出错率极高的技术问题。
为解决上述技术问题,本发明所采用的技术方案是:基于图像识别的发票报销信息定位方法,包括如下步骤:
采集发票图像;
从发票图像中分离提取全机打字符二值化图像;
对全机打字符二值化图像进行黑白转换,获取相应的反转图像;
对反转图像进行连通域连接,得到腐蚀成块图像;
对腐蚀成块图像进行外部矩形边界检测,检测出各报销信息块的顶点和底点位置信息。
进一步的,采集发票图像时,发票应置于纯色无条纹背景上。
进一步的,分离提取全机打字符二值化图像的具体方法为:
试验得出分离效果最佳的HSV范围;
建立HSV空间,用inRange函数将满足蓝色HSV范围的字符变成白色,其他区域变成黑色。
进一步的,采用bitwise_not变换对全机打字符二值化图像进行黑白转换。
进一步的,采用开运算对反转图像进行连通域连接。
进一步的,采用boundingRect算法对腐蚀成块图像进行外部矩形边界检测。
本发明还提供一种基于图像识别的发票报销信息截取方法,其特征在于,包括采用前述的发票报销信息定位方法获取各报销信息块的顶点和底点位置信息;
按照纵向分行顺序截取各报销信息块。
进一步的,按照纵向分行顺序截取各报销信息块的具体方法如下:
在发票图像中建立坐标系,横向用X轴表示,纵向用Y轴表示;
将报销信息块的顶点坐标和底点坐标分别存储于四个数组中,按某一数组中的X值或Y值从小到大排序,保证四个数组中值一一对应;
若报销信息块两顶点的Y值间隔小于k,k的范围为[1,30],就判定报销信息快的两顶点为同一行;
若报销信息块两顶点的Y值间隔小于k,k的范围为[1,30],就判定报销信息快的两顶点为同一行;
首先按照Y大小分行,对于同一行按X值从小到大截取各个报销信息块。
与现有技术相比,本发明所达到的有益效果:
利用图像处理及计算机视觉技术识别发票实现智能报销,能提高报销效率,降低出错率,降低中小型企业在发票报销方面的人力资源成本;
创造性地引入开运算以及boundingRect算法,能够检测出所采集的发票图像中各个可报销信息连通域的位置信息,并根据位置信息对发票图像进行分块截取,将本发明方法应用于增值税发票中进行报销信息分块截取,具有较高的稳定性和鲁棒性。
附图说明
图1是本发明提供的发票报销信息截取方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
基于图像识别的发票报销信息定位方法,包括如下步骤:
步骤一:将发票置于纯色无条纹背景上,利用图像采集设备采集发票图像;
步骤二:从发票图像中分离提取全机打字符二值化图像,具体方法如下:
鉴于机打字符是蓝色,试验得出HSV范围在下表区间时,分离效果最好。
Figure BDA0001595327790000031
其中,H的范围是最重要的,S、V的范围波动对结果影响不大。
建立HSV空间,用inRange函数将满足蓝色HSV范围的字符变成白色,其他区域变成黑色。
步骤三:采用bitwise_not变换对全机打字符二值化图像进行黑白转换,获取相应的反转图像;
步骤四:采用开运算对反转图像进行连通域连接,得到腐蚀成块图像;
开运算是通过先对图像腐蚀再膨胀实现。腐蚀和膨胀是最基本的形态学运算。腐蚀和膨胀是针对白色部分(高亮部分)而言的。膨胀就是对图像高亮部分进行“领域扩张”,效果图拥有比原图更大的高亮区域;腐蚀是原图中的高亮区域被蚕食,效果图拥有比原图更小的高亮区域。
步骤五:采用boundingRect算法对腐蚀成块图像进行外部矩形边界检测,检测出各报销信息块的顶点和底点位置信息。
boundingRect算法原理即计算点集的最外面(up-right)矩形边界。
本发明还提供一种基于图像识别的发票报销信息截取方法,如图1所示,包括采用前述的发票报销信息定位方法获取各报销信息块的顶点和底点位置信息;
按照纵向分行顺序截取各报销信息块,具体方法如下:
在发票图像中建立坐标系,横向用X轴表示,纵向用Y轴表示;
将报销信息块的顶点坐标和底点坐标分别存储于四个数组中,按某一数组中的X值或Y值从小到大排序,保证四个数组中值一一对应;
若报销信息块两顶点的Y值间隔小于k,k的范围为[1,30],就判定报销信息快的两顶点为同一行;
在同一行内按X值从小到大截取出各个报销信息块。
本发明利用图像处理及计算机视觉技术识别发票实现智能报销,能提高报销效率,降低出错率,降低中小型企业在发票报销方面的人力资源成本;创造性地引入开运算以及boundingRect算法,能够检测出所采集的发票图像中各个可报销信息连通域的位置信息,并根据位置信息对发票图像进行分块截取,将本发明方法应用于增值税发票中进行报销信息分块截取,具有较高的稳定性和鲁棒性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (5)

1.基于图像识别的发票报销信息定位方法,其特征在于,包括如下步骤:
采集发票图像;
从发票图像中分离提取全机打字符二值化图像;
对全机打字符二值化图像进行黑白转换,获取相应的反转图像;
对反转图像进行连通域连接,得到腐蚀成块图像;
对腐蚀成块图像进行外部矩形边界检测,检测出各报销信息块的顶点和底点位置信息;
采用boundingRect算法对腐蚀成块图像进行外部矩形边界检测;
按照纵向分行顺序截取各报销信息块;按照纵向分行顺序截取各报销信息块的具体方法如下:
在发票图像中建立坐标系,横向用X轴表示,纵向用Y轴表示;
将报销信息块的顶点坐标和底点坐标分别存储于四个数组中,按某一数组中的X值或Y值从小到大排序,保证四个数组中值一一对应;
若报销信息块两顶点的Y值间隔小于k,k的范围为[1,30],就判定报销信息快的两顶点为同一行;
首先按照Y大小分行,对于同一行按X值从小到大截取。
2.根据权利要求1所述的基于图像识别的发票报销信息定位方法,其特征在于,采集发票图像时,发票应置于纯色无条纹背景上。
3.根据权利要求1所述的基于图像识别的发票报销信息定位方法,其特征在于,分离提取全机打字符二值化图像的具体方法为:
试验得出分离效果最佳的HSV范围;
建立HSV空间,用inRange函数将满足蓝色HSV范围的字符变成白色,其他区域变成黑色。
4.根据权利要求1所述的基于图像识别的发票报销信息定位方法,其特征在于,采用bitwise_not变换对全机打字符二值化图像进行黑白转换。
5.根据权利要求1所述的基于图像识别的发票报销信息定位方法,其特征在于,采用开运算对反转图像进行连通域连接。
CN201810203890.4A 2018-03-13 2018-03-13 基于图像识别的发票报销信息定位及截取方法 Active CN108460381B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810203890.4A CN108460381B (zh) 2018-03-13 2018-03-13 基于图像识别的发票报销信息定位及截取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810203890.4A CN108460381B (zh) 2018-03-13 2018-03-13 基于图像识别的发票报销信息定位及截取方法

Publications (2)

Publication Number Publication Date
CN108460381A CN108460381A (zh) 2018-08-28
CN108460381B true CN108460381B (zh) 2022-06-10

Family

ID=63217345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810203890.4A Active CN108460381B (zh) 2018-03-13 2018-03-13 基于图像识别的发票报销信息定位及截取方法

Country Status (1)

Country Link
CN (1) CN108460381B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647824B (zh) * 2019-09-03 2022-06-28 四川大学 基于计算机视觉技术的增值税发票版面提取方法
CN110895690A (zh) * 2019-10-11 2020-03-20 南京邮电大学 一种基于openCV形态学的发票定位方法
CN110751136A (zh) * 2019-11-04 2020-02-04 北京亿信华辰软件有限责任公司武汉分公司 一种增值税发票信息的提取方法
CN111125413B (zh) * 2019-12-26 2023-10-13 南京中孚信息技术有限公司 文本图片的过滤方法、装置及电子设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6792133B2 (en) * 2001-04-10 2004-09-14 Picture Elements Incorporated Automatic bitonal image optimization
CN101853384B (zh) * 2010-04-20 2012-07-04 大连理工大学 一种彩色激光打印文档中黄色斑点阵列信息提取方法
CN101950354A (zh) * 2010-09-03 2011-01-19 西安大唐电信有限公司 一种国铁货车车号信息图像识别系统及方法
CN102253050A (zh) * 2011-03-14 2011-11-23 广州市盛通建设工程质量检测有限公司 基于机器视觉的磁瓦表面缺陷自动检测方法与装置
CN102831244B (zh) * 2012-09-13 2015-09-30 重庆立鼎科技有限公司 一种房产文档图像的分类检索方法
CN104346613B (zh) * 2013-08-08 2018-06-15 卡西欧计算机株式会社 图像处理装置以及图像处理方法
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN105528604B (zh) * 2016-01-31 2018-12-11 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN106778761A (zh) * 2016-12-23 2017-05-31 潘敏 一种汽车交易发票的处理方法
CN107358232B (zh) * 2017-06-28 2020-12-29 中山大学新华学院 基于插件的发票识别方法

Also Published As

Publication number Publication date
CN108460381A (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
CN108460381B (zh) 基于图像识别的发票报销信息定位及截取方法
CN109284758B (zh) 一种发票印章消除方法、装置和计算机存储介质
CN109145915A (zh) 一种复杂场景下车牌快速畸变矫正方法
CN102750556A (zh) 一种脱机手写体汉字识别方法
CN111753706B (zh) 一种基于图像统计学的复杂表格交点聚类提取方法
CN104463195A (zh) 基于模板匹配的印刷体数字识别方法
CN108460418B (zh) 一种基于文字识别与语义分析的发票分类方法
CN109344820A (zh) 基于计算机视觉和深度学习的数字式电表读数识别方法
CN110599552A (zh) 一种基于计算机视觉的pH试纸检测方法
CN109086772A (zh) 一种扭曲粘连字符图片验证码的识别方法及系统
CN111950654B (zh) 基于svm分类的魔方色块颜色还原方法
CN110610170B (zh) 一种基于图像精确校正的文档比对方法
CN109543525B (zh) 一种通用表格图像的表格提取方法
CN109271882B (zh) 一种区分颜色的手写体汉字提取方法
Jia Fabric defect detection based on open source computer vision library OpenCV
CN113657339A (zh) 一种基于机器视觉的仪表指针计数读取方法及介质
CN108388898A (zh) 基于连接体和模板的字符识别方法
CN105894475A (zh) 一种国际音标图像字符细化方法
CN107066997A (zh) 一种基于图像识别的电气元件报价方法
CN102332088B (zh) 一种基于游程特征的选票符号机器视觉识别方法
CN113537224B (zh) 一种基于视觉的配电柜开关状态自动识别方法
CN104504385A (zh) 手写粘连数字串的识别方法
CN101894277A (zh) 基于多分类支持向量机的集装箱箱号识别方法
CN112330611A (zh) 一种面向fpga的高并行性光斑分割方法
Pingping et al. Research on recognition technology of license plate image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant