CN112651289B - 一种增值税普通发票智能识别与校验系统及其方法 - Google Patents
一种增值税普通发票智能识别与校验系统及其方法 Download PDFInfo
- Publication number
- CN112651289B CN112651289B CN202011119283.3A CN202011119283A CN112651289B CN 112651289 B CN112651289 B CN 112651289B CN 202011119283 A CN202011119283 A CN 202011119283A CN 112651289 B CN112651289 B CN 112651289B
- Authority
- CN
- China
- Prior art keywords
- invoice
- value
- text
- module
- added tax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012795 verification Methods 0.000 title claims abstract description 31
- 238000012937 correction Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000001514 detection method Methods 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 238000003708 edge detection Methods 0.000 claims description 9
- 102100032202 Cornulin Human genes 0.000 claims description 8
- 101000920981 Homo sapiens Cornulin Proteins 0.000 claims description 8
- 230000002688 persistence Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000001629 suppression Effects 0.000 claims description 3
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 6
- 230000007547 defect Effects 0.000 abstract description 4
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1417—2D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/02—Affine transformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Toxicology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Electromagnetism (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种增值税普通发票智能识别与校验系统及其方法,采用传统图像处理技术并且融合最新的深度学习网络,将增值税普通发票中需要提取的关键字段精准的定位,并获得其位置坐标信息;通过坐标信息截取文本区域并将其送入预训练好的深度学习网络模型中进行文本识别;最后通过增强的二维码识别技术解码增值税发票中二维码信息,与识别的内容进行对比,完成发票的验证和金额等字段的校正,最后将处理后的信息化输出保存,实现发票的信息化管理。本发明不但解决了传统人员手动录入和查询的低效率、耗时长、出错率高等缺点,而且可以降低企业的人力成本和管理成本。
Description
技术领域
本发明涉及OCR票据识别的技术领域,尤其涉及到一种增值税普通发票智能识别与校验系统及其方法。
背景技术
随着社会经济的发展,发票的地位及作用显的越来越重要;在各行各业,消费者通过发票去报账的人数也在剧增,这也直接导致财务人员在面对大量发票后续的管理工作时显得尤为吃力。以学校为例,报账使用的增值税发票后期被粘贴在发票册中集中管理,以便后续财务人员的查阅以及核对,但面对成堆的发票册,当财务人员需要查找某一位人员曾经报过的账目时,需要翻阅大量的书册,这种方式的效率极其低下。为了将发票数据信息化管理,光学字符识别(OCR)技术在发票领域的应用就显得尤为重要。
由于深度学习时代的到来,OCR技术也得到了良好地发展,到目前也有一些技术方案。
公开号CN108171127A的发明专利《一种基于深度学习的发票自动识别方法》公开了利用深度AlexNet网络对发票进行识别;其字采用传统的方法,先将字符切割,再对单个字符进行识别,这种单个字符识别的方法效率并不高;另外,其字符定位采用了模板匹配算法定位到数字子区域,但是发票中存在太多数字干扰,没有具体介绍定位到某一块区域。
还有的是,在现有的发票OCR技术中,现有技术采用的发票原始数据都是版面整洁、没有背景污染并且发票版面大小一致的数据;倘若发票存在大小不一致、有背景污染的情况时,胡等人提出的经验定位和模板匹配算法就会失去作用;另外,其对于如何定位到文本区域没有进行详细的陈述,识别算法采用卷积神经网络(CNN)只能在空间上提取特征。
发明内容
本发明的目的在于克服现有技术的不足,提供一种增值税普通发票智能识别与校验系统,不但解决了传统人员手动录入和查询的低效率、耗时长、出错率高等缺点,而且可以降低企业的人力成本和管理成本。
为实现上述目的,本发明所提供的技术方案为:
一种增值税普通发票智能识别与校验系统,包括顺序连接的图像采集模块、图像预处理模块、二维码解码模块、文本区域定位模块、文本检测识别模块、校验模块以及结果输出模块;
其中,所述图像采集模块,用于扫描单张票据,将单张票据转换为计算机数字图像数据;
所述图像预处理模块,用于利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,完成增值税普通发票图像的提取;
所述二维码解码模块,用于对增值税普通发票图像进行二维码扫描解码;
所述文本区域定位模块,用于对文本区域一和文本区域二进行定位;
所述文本检测识别模块,用于进行端对端的文本区域检测及识别;
所述校验模块,用于对识别出的内容进行校验;
所述结果输出模块,用于将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询。
为实现上述目的,本发明另外提供一种用于增值税普通发票智能识别与校验系统的方法,包括以下步骤:
S1、通过图像采集模块扫描单张票据,将单张票据转换为计算机数字图像数据;
S2、通过图像预处理模块对计算机数字图像数据进行预处理,完成增值税普通发票图像的提取;
S3、通过二维码解码模块对增值税普通发票图像进行二维码扫描解码;
S4、对于增值税普通发票图像中需要提取的文本区域,划分为两个区域;文本区域一为:表格框中的内容信息;文本区域二为:表格框右上角的发票代码、发票号码、开票日期和校验码区域;通过文本区域定位模块对文本区域一和文本区域二进行定位;
S5、通过文本检测识别模块进行端对端的文本区域检测及识别;
S6、通过校验模块识别出的内容进行校验;
S7、结果输出模块将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询。
进一步地,所述步骤S2的具体过程为:
利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,从而完成发票图像的提取。
进一步地,所述步骤S3扫描二维码过程中,采用三次识别算法进行二维码识别,具体包括:
首先对原图进行识别,如果原图识别失败,对图像进行OTSU算法再识别,如果阈值OTSU失败,则对图像进行限制对比度的自适应直方图均衡化处理。
进一步地,所述步骤S4中,对于文本区域一的定位,采用边缘检测和角点检测将整个信息框提取出来,而整个信息框中小框的位置信息则采用等比例切割的方法初步获取。
进一步地,所述步骤S4中,对于文本区域二的定位,采用缩放坐标位置的方法获取其坐标位置信息:由于发票的规格统一,通过先验知识获取标准发票中二维码位置信息(x01,y01,w01,h01),区域二的位置信息(x02,y02,w02,h02);目标区域的位置信息为(x13,y13,w13,h13),由于该区域与二维码在同一水平线上,故将y13取为y11的值,y11为当前采集的增值税普通发票二维码左上角的y坐标信息;在二维码解码模块,测得输入图像二维码宽度w11,通过计算w01/w11获取当前采集的发票与标准发票之间的放缩比例大小a;通过该缩放比例,获得x13该的值为x11+a*(x02-x01),w13的值为a*w02,h13的值为a*h02;上述各个位置信息中,对应的x和y分别为所在对应位置左上角的x、y坐标,对应的w和h分别为所在对应位置的宽和高。
进一步地,所述步骤S5中,文本检测识别模块采用CTPN+CRNN文本检测识别模型进行端对端的文本区域检测及识别,具体如下:
对CTPN网络的训练,包括:
网络为vgg前5层,获得conv5的特征图,在此特征图上做3*3的卷积,此时通过卷积神经网学习到的只有空间特征;再将该特征输入到双向长短期记忆网络中,获得学习到的序列特征;然后通过一个全连接层和区域生成网层预测出一系列的文本框,最后通过非极大值抑制过滤掉得分较小的多余文本框,剩下的文本框通过中心点拟合直线,生成最终的文本框位置信息;
对CRNN网络的训练,包括:
卷积层:卷积层采用微调过后的VGG网络来完成特征提取;将第三、第四个后的maxpooling的核尺度从2×2改为1×2;在第五、第六卷积层后加入BatchNormalization,加速模型的收敛速度;
循环层:使用一个BLSTM,对特征序列进行预测,对序列中的每个特征向量进行学习,最终输出预测标签分布;
转录层:使用CTC模型,将RNN循环层每帧预测转换为标签序列,通过去重整合等操作转换成最终的识别结果;
模型训练完以后,通过文本定位区域输出文本位置信息,精准切割出文本区域送去CTPN+CRNN文本检测识别模型中完成内容的识别。
与现有技术相比,本方案原理及优点如下:
本方案采用传统图像处理技术并且融合最新的深度学习网络,将增值税普通发票中需要提取的关键字段精准的定位,并获得其位置坐标信息;通过坐标信息截取文本区域并将其送入预训练好的深度学习网络模型中进行文本识别;最后通过增强的二维码识别技术解码增值税发票中二维码信息,与识别的内容进行对比,完成发票的验证和金额等字段的校正,最后将处理后的信息化输出保存,实现发票的信息化管理。
本方案使得财务人员关注的重点只需要转移到增值税普通发票图像的采集工作上面来,并将采集的图像上传到智能识别与校验系统中,便能够得到详细的内容信息。智能识别与校验系统代替传统财务人员手动录入发票的繁琐工作,不但解决了传统人员手动录入和查询的低效率、耗时长、出错率高等缺点,而且可以降低企业的人力成本和管理成本。
具体分析地,本方案采用三次识别算法,避免了传统一次扫描失败就结束的影响,提高了二维码解码的成功率。根据相对坐标位置,提出了缩放法和等比例切割的方法来对增值税普通发票的版面进行剖析,避免了发票其他区域的干扰。最后,采用CTPN+CRNN的端到端的识别网络,避免了先将文本切割为单个字符、再分类、再对单个字符进行识别的繁琐步骤,并且提高了文本的识别速率和正确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种增值税普通发票智能识别与校验系统中各模块的连接示意图;
图2为用于本发明一种增值税普通发票智能识别与校验系统的方法的原理流程图;
图3为实施例图像采集模块采集到的增值税普通发票图像;
图4为实施例文本信息的分类区域示意图;
图5为实施例识别输出结果示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明:
如图1所示,本实施例所述的一种增值税普通发票智能识别与校验系统,包括顺序连接的图像采集模块1、图像预处理模块2、二维码解码模块3、文本区域定位模块4、文本检测识别模块5、校验模块6以及结果输出模块7;
如图2所示,该系统的工作原理如下:
S1、通过图像采集模块1扫描单张票据,将单张票据转换为计算机数字图像数据;扫描采集到的增值税普通图像如图3所示。
S2、通过图像预处理模块2对计算机数字图像数据进行预处理:
利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,从而完成发票图像的提取。
S3、通过二维码解码模块3对增值税普通发票图像进行二维码扫描解码:
由于图像存在噪音的干扰,对增值税普通发票图像进行二维码扫描解码可能存在识别无效的情况;二维码解码模块3采用三次识别算法,流程大致如下:首先对原图进行识别,如果原图识别失败,对图像进行大津二值化算法(OTSU)再识别,如果阈值OTSU失败,则采用则将图像进行限制对比度的自适应直方图均衡化处理;通过该算法提高了二维码识别准确率。
解码出来的信息不仅包括:发票号码、发票代码、开票金额、开票日期和校验码等信息,这一部分信息用于文本识别完成以后的内容纠正;除此之外,解码出来的信息还包含二维码的位置信息(x11,y11,w11,h11),x11、y11表示左上角位置坐标,w11、h11表示二维码宽度和高度,可用于后续文本定位使用。
S4、如图4所示,对于增值税普通发票图像中需要提取的文本区域,划分为两个区域;文本区域一为:表格框中的内容信息;文本区域二为:表格框右上角的发票代码、发票号码、开票日期和校验码区域;通过文本区域定位模块4对文本区域一和文本区域二进行定位;
对于文本区域一的定位,采用边缘检测和角点检测将整个信息框提取出来,由于发票的版面是固定的,每一个小框在版面中的比例是一定的,所以可以采用等比例切割的方法初步获取小框的位置信息:由于表格边框的纹理特征明显,通过边缘检测可以检测出表格的外边框,并获取其位置信息,通过位置信息将表格截取出来,获取其宽度W和高度H;按照国家增值税发票版面的大小特征来看,每一个小框在表格中的大小比例是固定的,通过该比例可以将区域一中需要提取的文本区域定位,所要提取的购买方区域位置信息即可推出(0,0,w12,h12),0、0分别为区域左上角顶点x,y轴的位置,w12=λ1W,h12=λ2H,其中λ1为购买方文本区域占表格宽度的比例,λ2为购买方文本区域占表格高度的比例,其他区域位置信息以此类推;
对于文本区域二的定位,采用缩放坐标位置的方法获取其坐标位置信息:由于发票的规格统一,通过先验知识获取标准发票中二维码位置信息(x01,y01,w01,h01),区域二的位置信息(x02,y02,w02,h02);目标区域的位置信息为(x13,y13,w13,h13),由于该区域与二维码在同一水平线上,故将y13取为y11的值,y11为当前采集的增值税普通发票二维码左上角的y坐标信息;在二维码解码模块,测得输入图像二维码宽度w11,通过计算w01/w11获取当前采集的增值税普通发票与标准发票之间的放缩比例大小a;通过该缩放比例,获得x13该的值为x11+a*(x02-x01),w13的值为a*w02,h13的值为a*h02;上述各个位置信息中,对应的x和y分别为所在对应位置左上角的x、y坐标,对应的w和h分别为所在对应位置的宽和高。
S5、文本检测识别模块5采用CTPN+CRNN文本检测识别模型进行端对端的文本区域检测及识别,具体如下:
对CTPN网络的训练,包括:
网络为vgg前5层,获得conv5的特征图,在此特征图上做3*3的卷积,此时通过卷积神经网学习到的只有空间特征;再将该特征输入到双向长短期记忆网络中,获得学习到的序列特征;然后通过一个全连接层和区域生成网层预测出一系列的文本框,最后通过非极大值抑制过滤掉得分较小的多余文本框,剩下的文本框通过中心点拟合直线,生成最终的文本框位置信息;
对CRNN网络的训练,包括:
卷积层:卷积层采用微调过后的VGG网络来完成特征提取;将第三、第四个后的maxpooling的核尺度从2×2改为1×2;在第五、第六卷积层后加入BatchNormalization,加速模型的收敛速度;
循环层:使用一个BLSTM,对特征序列进行预测,对序列中的每个特征向量进行学习,最终输出预测标签分布;
转录层:使用CTC模型,将RNN循环层每帧预测转换为标签序列,通过去重整合等操作转换成最终的识别结果;
模型训练完以后,通过文本定位区域输出文本位置信息,精准切割出文本区域送去CTPN+CRNN文本检测识别模型中完成内容的识别。
S6、通过校验模块6识别出的内容进行校验;在二维码解码模块3信息包括:发票号码、发票代码、开票金额、开票日期和校验码等信息;将其与深度模型OCR识别出来的内容进行比对;若出现差别,以解码出来的信息为准,将识别的内容进行更改完成校对。
S7、如图5所示,结果输出模块7将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询。
为证实本实施例的有效性和优越性,技术人员已进行过相应的验证实验,具体如下:
二维码解码模块3,以能够解码出区域中的发票代码、发票号码、开票日期、校验码这些信息为解码成功的标准。
文本区域定位模块4,通过缩放坐标位置得到的文本框,以文本框将需要提取的文本区域框住为定位成功。
文本检测识别模块5,随机抽取增值税普通发票,统计文本区域总字数、识别到字符的数量、识别到字符中正确识别的字符数,计算其识别率,正确识别率。
以上模块经过验证,能够达到一较高的成功率,具体如下表1、2、3所示:
表1
表2
表3
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (6)
1.一种增值税普通发票智能识别与校验系统,其特征在于,包括顺序连接的图像采集模块、图像预处理模块、二维码解码模块、文本区域定位模块、文本检测识别模块、校验模块以及结果输出模块;
其中,所述图像采集模块,用于扫描单张票据,将单张票据转换为计算机数字图像数据;
所述图像预处理模块,用于利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,完成增值税普通发票图像的提取;
所述二维码解码模块,用于对增值税普通发票图像进行二维码扫描解码;
所述文本区域定位模块,用于对文本区域一和文本区域二进行定位;
所述文本检测识别模块,用于进行端对端的文本区域检测及识别;
所述校验模块,用于对识别出的内容进行校验;
所述结果输出模块,用于将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询;
用于增值税普通发票智能识别与校验系统的方法,包括以下步骤:
S1、通过图像采集模块扫描单张票据,将单张票据转换为计算机数字图像数据;
S2、通过图像预处理模块对计算机数字图像数据进行预处理,完成增值税普通发票图像的提取;
S3、通过二维码解码模块对增值税普通发票图像进行二维码扫描解码;
S4、对于增值税普通发票图像中需要提取的文本区域,划分为两个区域;文本区域一为:表格框中的内容信息;文本区域二为:表格框右上角的发票代码、发票号码、开票日期和校验码区域;通过文本区域定位模块对文本区域一和文本区域二进行定位;
S5、通过文本检测识别模块进行端对端的文本区域检测及识别;
S6、通过校验模块识别出的内容进行校验;
S7、结果输出模块将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询;
所述步骤S4中,对于文本区域二的定位,采用缩放坐标位置的方法获取其坐标位置信息:由于发票的规格统一,通过先验知识获取标准发票中二维码位置信息(x01,y01,w01,h01),区域二的位置信息(x02,y02,w02,h02);目标区域的位置信息为(x13,y13,w13,h13),由于该区域与二维码在同一水平线上,故将y13取为y11的值,y11为当前采集的增值税普通发票二维码左上角的y坐标信息;在二维码解码模块,测得输入图像二维码宽度w11,通过计算w01/w11获取当前采集的增值税普通发票与标准发票之间的放缩比例大小a;通过该缩放比例,获得x13该的值为x11+a*(x02-x01),w13的值为a*w02,h13的值为a*h02;上述各个位置信息中,对应的x和y分别为所在对应位置左上角的x、y坐标,对应的w和h分别为所在对应位置的宽和高。
2.一种用于权利要求1所述的增值税普通发票智能识别与校验系统的方法,其特征在于,包括以下步骤:
S1、通过图像采集模块扫描单张票据,将单张票据转换为计算机数字图像数据;
S2、通过图像预处理模块对计算机数字图像数据进行预处理,完成增值税普通发票图像的提取;
S3、通过二维码解码模块对增值税普通发票图像进行二维码扫描解码;
S4、对于增值税普通发票图像中需要提取的文本区域,划分为两个区域;文本区域一为:表格框中的内容信息;文本区域二为:表格框右上角的发票代码、发票号码、开票日期和校验码区域;通过文本区域定位模块对文本区域一和文本区域二进行定位;
S5、通过文本检测识别模块进行端对端的文本区域检测及识别;
S6、通过校验模块识别出的内容进行校验;
S7、结果输出模块将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询;
所述步骤S4中,对于文本区域二的定位,采用缩放坐标位置的方法获取其坐标位置信息:由于发票的规格统一,通过先验知识获取标准发票中二维码位置信息(x01,y01,w01,h01),区域二的位置信息(x02,y02,w02,h02);目标区域的位置信息为(x13,y13,w13,h13),由于该区域与二维码在同一水平线上,故将y13取为y11的值,y11为当前采集的增值税普通发票二维码左上角的y坐标信息;在二维码解码模块,测得输入图像二维码宽度w11,通过计算w01/w11获取当前采集的增值税普通发票与标准发票之间的放缩比例大小a;通过该缩放比例,获得x13该的值为x11+a*(x02-x01),w13的值为a*w02,h13的值为a*h02;上述各个位置信息中,对应的x和y分别为所在对应位置左上角的x、y坐标,对应的w和h分别为所在对应位置的宽和高。
3.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S2的具体过程为:
利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,从而完成发票图像的提取。
4.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S3扫描二维码过程中,采用三次识别算法进行二维码识别,具体包括:
首先对原图进行识别,如果原图识别失败,对图像进行OTSU算法再识别,如果阈值OTSU失败,则对图像进行限制对比度的自适应直方图均衡化处理。
5.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S4中,对于文本区域一的定位,采用边缘检测和角点检测将整个信息框提取出来,而整个信息框中小框的位置信息则采用等比例切割的方法初步获取。
6.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S5中,文本检测识别模块采用CTPN+CRNN文本检测识别模型进行端对端的文本区域检测及识别,具体如下:
对CTPN网络的训练,包括:
网络为vgg前5层,获得conv5的特征图,在此特征图上做3*3的卷积,此时通过卷积神经网学习到的只有空间特征;再将该特征输入到双向长短期记忆网络中,获得学习到的序列特征;然后通过一个全连接层和区域生成网层预测出一系列的文本框,最后通过非极大值抑制过滤掉得分小的多余文本框,剩下的文本框通过中心点拟合直线,生成最终的文本框位置信息;
对CRNN网络的训练,包括:
卷积层:卷积层采用微调过后的VGG网络来完成特征提取;将第三、第四个后的maxpooling的核尺度从2×2改为1×2;在第五、第六卷积层后加入BatchNormalization,加速模型的收敛速度;
循环层:使用一个BLSTM,对特征序列进行预测,对序列中的每个特征向量进行学习,最终输出预测标签分布;
转录层:使用CTC模型,将RNN循环层每帧预测转换为标签序列,通过去重整合操作转换成最终的识别结果;
模型训练完以后,通过文本定位区域输出文本位置信息,精准切割出文本区域送去CTPN+CRNN文本检测识别模型中完成内容的识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011119283.3A CN112651289B (zh) | 2020-10-19 | 2020-10-19 | 一种增值税普通发票智能识别与校验系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011119283.3A CN112651289B (zh) | 2020-10-19 | 2020-10-19 | 一种增值税普通发票智能识别与校验系统及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112651289A CN112651289A (zh) | 2021-04-13 |
CN112651289B true CN112651289B (zh) | 2023-10-13 |
Family
ID=75347046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011119283.3A Active CN112651289B (zh) | 2020-10-19 | 2020-10-19 | 一种增值税普通发票智能识别与校验系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651289B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111630B (zh) * | 2021-04-21 | 2023-05-23 | 江西财经职业学院 | 一种会计系统 |
CN113378710B (zh) * | 2021-06-10 | 2024-03-08 | 平安科技(深圳)有限公司 | 图像文件的版面分析方法、装置、计算机设备和存储介质 |
CN113569629B (zh) * | 2021-06-11 | 2023-09-15 | 杭州玖欣物联科技有限公司 | 一种机加工图纸关键信息提取和敏感信息脱敏的模型方法 |
CN113963147B (zh) * | 2021-09-26 | 2023-09-15 | 西安交通大学 | 一种基于语义分割的关键信息提取方法及系统 |
CN113591508B (zh) * | 2021-09-29 | 2022-02-18 | 广州思林杰科技股份有限公司 | 基于人工智能目标识别的条码解码方法、装置及存储介质 |
CN113643005B (zh) * | 2021-10-13 | 2022-01-28 | 南昌志达科技有限公司 | 一种自助报销方法及装置 |
CN114359928B (zh) * | 2022-01-12 | 2024-10-01 | 平安科技(深圳)有限公司 | 一种电子发票识别方法、装置、计算机设备及存储介质 |
CN115063819A (zh) * | 2022-06-17 | 2022-09-16 | 中国平安人寿保险股份有限公司 | 一种信息提取方法、信息提取系统、电子设备及存储介质 |
CN116778513B (zh) * | 2023-08-24 | 2023-10-27 | 国网山西省电力公司太原供电公司 | 一种电力行业票据的智能归档控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411701A (zh) * | 2010-09-20 | 2012-04-11 | 航天信息股份有限公司 | 增值税专用发票的二维码阵列图像扫描识别方法及系统 |
CN108549843A (zh) * | 2018-03-22 | 2018-09-18 | 南京邮电大学 | 一种基于图像处理的增值税发票识别方法 |
CN110751143A (zh) * | 2019-09-26 | 2020-02-04 | 中电万维信息技术有限责任公司 | 一种电子发票信息的提取方法及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105957238B (zh) * | 2016-05-20 | 2019-02-19 | 聚龙股份有限公司 | 一种纸币管理方法及其系统 |
-
2020
- 2020-10-19 CN CN202011119283.3A patent/CN112651289B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411701A (zh) * | 2010-09-20 | 2012-04-11 | 航天信息股份有限公司 | 增值税专用发票的二维码阵列图像扫描识别方法及系统 |
CN108549843A (zh) * | 2018-03-22 | 2018-09-18 | 南京邮电大学 | 一种基于图像处理的增值税发票识别方法 |
CN110751143A (zh) * | 2019-09-26 | 2020-02-04 | 中电万维信息技术有限责任公司 | 一种电子发票信息的提取方法及电子设备 |
Non-Patent Citations (1)
Title |
---|
基于卷积神经网络的批量发票识别系统研究;胡泽枫;张学习;黎贤钊;;工业控制计算机(05);第108-109页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112651289A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112651289B (zh) | 一种增值税普通发票智能识别与校验系统及其方法 | |
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
CN111680688B (zh) | 字符识别方法及装置、电子设备、存储介质 | |
CN109118473B (zh) | 基于神经网络的角点检测方法、存储介质与图像处理系统 | |
CN111783757A (zh) | 一种基于ocr技术的复杂场景下身份证识别方法 | |
CN110008909A (zh) | 一种基于ai的实名制业务实时稽核系统 | |
CN112949455B (zh) | 一种增值税发票识别系统及方法 | |
CN110647885B (zh) | 基于图片识别的试卷拆分方法、装置、设备以及介质 | |
CN112052845A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN113762269A (zh) | 基于神经网络的中文字符ocr识别方法、系统、介质及应用 | |
CN113837151B (zh) | 表格图像处理方法、装置、计算机设备及可读存储介质 | |
CN110647956A (zh) | 一种联合二维码识别的发票信息提取方法 | |
CN106709474A (zh) | 一种手写电话号码识别、校验及信息发送系统 | |
CN112699867A (zh) | 一种固定版式目标图像要素信息提取方法及其系统 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN115116074A (zh) | 一种手写体文字识别、及模型训练方法和装置 | |
CN111652117B (zh) | 一种对多文档图像分割的方法及介质 | |
US20240330630A1 (en) | Decoding of linear barcodes under unfavorable conditions | |
CN113657377B (zh) | 一种机打票据图像结构化识别方法 | |
CN116152824A (zh) | 一种发票信息提取方法及系统 | |
CN118135584A (zh) | 一种基于深度学习的手写表单自动识别方法和系统 | |
CN111768385B (zh) | Usb表面缺陷检测的神经网络检测方法 | |
CN112200789A (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN111950556A (zh) | 一种基于深度学习的号牌印刷质量检测方法 | |
CN116363655A (zh) | 一种财务票据识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |