CN110188743A - 一种出租车发票识别系统及方法 - Google Patents

一种出租车发票识别系统及方法 Download PDF

Info

Publication number
CN110188743A
CN110188743A CN201910393140.2A CN201910393140A CN110188743A CN 110188743 A CN110188743 A CN 110188743A CN 201910393140 A CN201910393140 A CN 201910393140A CN 110188743 A CN110188743 A CN 110188743A
Authority
CN
China
Prior art keywords
invoice
taxi
computer
information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910393140.2A
Other languages
English (en)
Inventor
柳景斌
牛晓光
王泽民
安永强
王安康
张淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910393140.2A priority Critical patent/CN110188743A/zh
Publication of CN110188743A publication Critical patent/CN110188743A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Abstract

本发明公开了一种出租车发票识别系统及方法,系统包括图像数据采集装置、计算机、显示器、数据库;图像数据采集装置、显示器分别与计算机连接,在计算机控制下工作;数据库通过网络与计算机连接通信,用于保存计算机采集的发票信息。通过本发明的出租车发票信息识别系统获取出租车发票数据,采用本发明独有的数据处理方法智能识别并自动提取发票信息,将这些信息自动录入发票管理系统数据库,同时发票管理系统对发票的合规性进行检测,支持管理人员进行科学化决策。本发明的出租车发票管理系统及其装置简单易用,能够有效解决出租车发票管理中不合规问题,易于在各类企业财务部门管理推广使用。

Description

一种出租车发票识别系统及方法
技术领域
本发明属于图像识别技术领域,涉及一种发票识别系统及方法,尤其涉及一种出租车发票识别系统及方法。
背景技术
由于工作的需要,不少人选择出租车这种交通方式出行,许多单位、公司也承诺员工乘坐出租车的花费可以进行报销。出租车发票作为消费的记录与报销的凭证,是财务系统的重要组成部分之一。得益于早期的计算机数据库等技术,通常在进行出租车发票报销时,财务部门的有关工作人员需要通过计算机键盘人工输入发票的代码等相关信息,使之录入数据库,实现发票的电子化。然而,这种方法比较费时费力,同时不能很好地保证准确率,且难以对不合规(连号)的发票进行准确的判别。随着深度学习与人工智能技术的发展与壮大,为出租车发票的迅速电子化与识别管理提供了强有力的支撑。
因此,众多国内外知名学术研究机构对发票快捷电子化技术展开了深入的研究,使得OCR(Optical Character Recognition,光学字符识别)技术诞生,并经历从实验室技术到具体产品的转变,目前已经进入行业应用开发的成熟阶段。
OCR技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的数字化信息技术。经过不断的发展,OCR技术在票据自动识别能力上不断提升,目前处理速度可达到每分钟60~80张票据。
然而,目前国内OCR技术主要应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域,基本未涉及对于出租车发票信息的识别与数据录入等方面。
综上所述,现有技术存在以下问题:
(1)通过财务部门的工作人员人工录入出租车发票代码等信息的方法,无法很好地保证录入的效率与准确性;
(2)目前,OCR技术较为成熟,但其应用领域基本未涉及到出租车发票数据信息的智能识别与录入、合理性判别等方面。
目前没有涉及到出租车发票信息识别的技术,应用于银行票据、文档卷宗等不同方面的OCR技术与相关的系统对于出租车发票识别不具备通用性,需要重新构建深度学习网络。同时,由于不同城市的出租车发票格式基本不相同,为了保证本发明的普适性,需要采集大量的出租车发票样本。
发明内容
为了解决上述技术问题,本发明提供了一种出租车发票识别系统及方法。
本发明的系统所采用的技术方案是:一种出租车发票识别系统,其特征在于:包括图像数据采集装置、计算机、显示器、数据库;
所述图像数据采集装置、显示器分别与所述计算机连接,在所述计算机控制下工作;所述数据库通过网络与所述计算机连接通信,用于保存所述计算机采集的发票信息。
本发明的方法所采用的技术方案是:一种出租车发票识别方法,其特征在于,包括以下步骤:
步骤1:计算机控制图像数据采集装置进行出租车发票信息图像采集;
步骤2:进行发票信息提取,所述发票信息包括发票代码、发票号码、日期、上下车时间;
步骤3:对发票信息进行合规性检测;
如果合规,则将当前发票信息记录正式存储到数据库;
如果不合规,则将检测结果反馈给报销人员或发票使用人,拒绝报销;
其中,如果当前检测发票与数据库中的某张发票有相同的发票代码,且发票号码相连,则判断本次发票检测的当前发票或本版发票全部不合规。
本发明针对现有的人工录入出租车发票数据信息的方法中费时费力、人工录入准确率无法保证等问题,提供一种高效率的对出租车发票的数据信息进行智能识别与提取,数据录入与检测的方法,实现出租车发票的迅速电子化。提高对于出租车发票识别的速率与正确率,减少人工输入数据的工作量,同时可以对违规的发票进行准确识别,支持科学化决策。
附图说明
图1是本发明实施例的系统结构图;
图2为本发明实施例的方法流程图;
图3为本发明实施例的深度学习网络示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种出租车发票识别系统,包括图像数据采集装置、计算机、显示器、数据库;
图像数据采集装置、显示器分别与计算机连接,在计算机控制下工作;数据库通过网络与计算机连接通信,用于保存计算机采集的发票信息。
本实施例的图像数据采集装置采用照相机、摄像头或扫描仪,图像数据采集装置还配置有照明设备、支撑支架和外围电路。
请见图2,本发明提供的一种出租车发票识别方法,包括以下步骤:
步骤1:计算机控制图像数据采集装置进行出租车发票信息采集;
步骤2:进行发票信息提取,发票信息包括发票代码、发票号码、日期、上下车时间;
步骤2.1:构建并训练深度学习网络;
步骤2.1.1:构建深度学习网络;
请见图3,本实施例的深度学习网络,包括输入层,两个卷积层,两个降采样层,三个全连接层以及输出层。
步骤2.1.2:采集若干现有的出租车发票的发票代码和发票号码,构建发票代码和发票号码数据集;
步骤2.1.3:训练深度学习网络,获得训练好的深度学习网络;
1)将归一化图像的大小变为标准大小32×32;
2)用5×5的卷积核,步长为1对归一化图像进行遍历卷积操作生成6张28×28的特征图;
3)用2×2的最大池化层,步长为2将特征图规模降采样至6张14×14的特征图;
4)用5×5的卷积核,步长为1对特征图进行遍历卷积操作生成16张10×10的特征图;
5)用2×2的最大池化层,步长为2将特征图规模降采样至16张5×5的特征图;
6)最后用两层全连接层和softmax层将特征图变为10个概率输出;
7)用最大概率所对应的结果与真值进行比较,计算误差然后利用梯度下降进行反向传播来调整网络参数;
8)不断重复步骤1-步骤7,直到最大概率所对应结果与真值一致。
步骤2.2:使用深度学习网络进行发票识别流程;
步骤2.2.1:采集出租车发票的图像信息;
步骤2.2.2:对图像进行直方图均衡化、中值滤波和高斯滤波处理,然后对图像进行二值化操作;
步骤2.2.3:通过二值化图像的行列像素统计对图像进行字符区域检测,字符分割;
步骤2.2.4:将步骤2.2.3中处理后的图像进行归一化,输入深度学习网络进行发票代码和发票号码识别。
步骤3:对发票信息进行合规性检测;
如果合规,则将当前发票信息记录正式存储到数据库;
如果不合规,则将检测结果反馈给报销人员或发票使用人,拒绝报销;
其中,如果当前检测发票与数据库中的某张发票有相同的发票代码,且发票号码相连,则判断本次发票检测的当前发票或本版发票全部不合规。
本发明实施例提供的一种出租车发票管理系统及方法,提供的出租车发票数据库系统及其存储介质用于存储、管理出租车发票信息的数据库系统,包括但不限于,发票代码,发票号码,出租车使用城市,出租车使用人等,这些信息用于出租车发票管理系统检索、合规性检测、决策等。
通过本发明的出租车发票信息识别系统获取出租车发票数据,采用本发明独有的数据处理方法智能识别并自动提取发票信息,将这些信息自动录入发票管理系统数据库,同时发票管理系统对发票的合规性进行检测,支持管理人员进行科学化决策。本发明的出租车发票管理系统及其装置简单易用,能够有效解决出租车发票管理中不合规问题,易于在各类企业财务部门管理推广使用。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
在上述实施例中,集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种出租车发票识别系统,其特征在于:包括图像数据采集装置、计算机、显示器、数据库;
所述图像数据采集装置、显示器分别与所述计算机连接,在所述计算机控制下工作;所述数据库通过网络与所述计算机连接通信,用于保存所述计算机采集的发票信息。
2.根据权利要求1所述的出租车发票识别系统,其特征在于:所述图像数据采集装置采用照相机、摄像头或扫描仪,所述图像数据采集装置还配置有照明设备、支撑支架和外围电路。
3.一种出租车发票识别方法,其特征在于,包括以下步骤:
步骤1:计算机控制图像数据采集装置进行出租车发票信息图像采集;
步骤2:进行发票信息提取,所述发票信息包括发票代码、发票号码、日期、上下车时间;
步骤3:对发票信息进行合规性检测;
如果合规,则将当前发票信息记录正式存储到数据库;
如果不合规,则将检测结果反馈给报销人员或发票使用人,拒绝报销;
其中,如果当前检测发票与数据库中的某张发票有相同的发票代码,且发票号码相连,则判断本次发票检测的当前发票或本版发票全部不合规。
4.根据权利要求3所述的出租车发票识别方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:构建并训练深度学习网络;
步骤2.1.1:构建深度学习网络;
所述深度学习网络,包括输入层,两个卷积层,两个降采样层,三个全连接层以及输出层;
步骤2.1.2:采集若干现有的出租车发票的发票代码和发票号码,构建发票代码和发票号码数据集;
步骤2.1.3:训练深度学习网络,获得训练好的深度学习网络;
步骤2.2:使用深度学习网络进行发票识别流程;
步骤2.2.1:采集出租车发票的图像信息;
步骤2.2.2:对图像进行直方图均衡化、中值滤波和高斯滤波处理,然后对图像进行二值化操作;
步骤2.2.3:通过二值化图像的行列像素统计对图像进行字符区域检测,字符分割;
步骤2.2.4:将步骤2.2.3中处理后的图像进行归一化,输入深度学习网络进行发票代码和发票号码识别。
5.根据权利要求4所述的出租车发票识别方法,其特征在于,步骤2.1.3的具体实现包括以下子步骤:
1)将归一化图像的大小变为标准大小32×32;
2)用5×5的卷积核,步长为1对归一化图像进行遍历卷积操作生成6张28×28的特征图;
3)用2×2的最大池化层,步长为2将特征图规模降采样至6张14×14的特征图;
4)用5×5的卷积核,步长为1对特征图进行遍历卷积操作生成16张10×10的特征图;
5)用2×2的最大池化层,步长为2将特征图规模降采样至16张5×5的特征图;
6)最后用两层全连接层和softmax层将特征图变为10个概率输出;
7)用最大概率所对应的结果与真值进行比较,计算误差然后利用梯度下降进行反向传播来调整网络参数;
8)不断重复步骤1-步骤7,直到最大概率所对应结果与真值一致。
CN201910393140.2A 2019-05-13 2019-05-13 一种出租车发票识别系统及方法 Pending CN110188743A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910393140.2A CN110188743A (zh) 2019-05-13 2019-05-13 一种出租车发票识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910393140.2A CN110188743A (zh) 2019-05-13 2019-05-13 一种出租车发票识别系统及方法

Publications (1)

Publication Number Publication Date
CN110188743A true CN110188743A (zh) 2019-08-30

Family

ID=67714465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910393140.2A Pending CN110188743A (zh) 2019-05-13 2019-05-13 一种出租车发票识别系统及方法

Country Status (1)

Country Link
CN (1) CN110188743A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462388A (zh) * 2020-03-19 2020-07-28 广州市玄武无线科技股份有限公司 一种票据检验方法、装置、终端设备及存储介质
CN114025327A (zh) * 2021-10-25 2022-02-08 天津市普迅电力信息技术有限公司 一种基于数据中台的车队管理机器人设计方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
US20190019020A1 (en) * 2017-07-17 2019-01-17 Open Text Corporation Systems and methods for image based content capture and extraction utilizing deep learning neural network and bounding box detection training techniques
CN109299762A (zh) * 2018-10-09 2019-02-01 合肥深度财务管理咨询有限公司 一种基于大数据的企业财务报销管理系统
CN109344838A (zh) * 2018-11-02 2019-02-15 长江大学 发票信息自动快速识别方法、系统以及装置
CN109657665A (zh) * 2018-10-31 2019-04-19 广东工业大学 一种基于深度学习的发票批量自动识别系统
CN109670041A (zh) * 2018-11-29 2019-04-23 天格科技(杭州)有限公司 一种基于双通道文本卷积神经网络的带噪非法短文本识别方法
CN109726783A (zh) * 2018-12-28 2019-05-07 大象慧云信息技术有限公司 一种基于ocr图像识别技术的发票采集管理系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190019020A1 (en) * 2017-07-17 2019-01-17 Open Text Corporation Systems and methods for image based content capture and extraction utilizing deep learning neural network and bounding box detection training techniques
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
CN109299762A (zh) * 2018-10-09 2019-02-01 合肥深度财务管理咨询有限公司 一种基于大数据的企业财务报销管理系统
CN109657665A (zh) * 2018-10-31 2019-04-19 广东工业大学 一种基于深度学习的发票批量自动识别系统
CN109344838A (zh) * 2018-11-02 2019-02-15 长江大学 发票信息自动快速识别方法、系统以及装置
CN109670041A (zh) * 2018-11-29 2019-04-23 天格科技(杭州)有限公司 一种基于双通道文本卷积神经网络的带噪非法短文本识别方法
CN109726783A (zh) * 2018-12-28 2019-05-07 大象慧云信息技术有限公司 一种基于ocr图像识别技术的发票采集管理系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462388A (zh) * 2020-03-19 2020-07-28 广州市玄武无线科技股份有限公司 一种票据检验方法、装置、终端设备及存储介质
CN114025327A (zh) * 2021-10-25 2022-02-08 天津市普迅电力信息技术有限公司 一种基于数据中台的车队管理机器人设计方法
CN114025327B (zh) * 2021-10-25 2024-03-26 天津市普迅电力信息技术有限公司 一种基于数据中台的车队管理机器人设计方法

Similar Documents

Publication Publication Date Title
CN107067044B (zh) 一种财务报销全票据智能审核系统
CN109887153B (zh) 一种财税处理方法和处理系统
CN107194400B (zh) 一种财务报销全票据图片识别处理方法
CN108062674B (zh) 基于gps的订单欺诈识别方法、系统、存储介质和电子设备
CN109214382A (zh) 一种基于crnn的票据信息识别算法、设备及存储介质
Kunduru From Data Entry to Intelligence: Artificial Intelligence’s Impact on Financial System Workflows
CN110517130A (zh) 一种智能记账方法及其系统
CN109840520A (zh) 一种发票关键信息识别方法及系统
CN110019324B (zh) 一种生成纳税人资金回路的方法及系统
Zhang et al. A financial ticket image intelligent recognition system based on deep learning
CN112966941B (zh) 一种基于交通事故大数据的事故黑点识别方法及系统
CN110188743A (zh) 一种出租车发票识别系统及方法
CN110163205A (zh) 图像处理方法、装置、介质和计算设备
CN110992160A (zh) 一种自助报账投递处理系统
CN109508845A (zh) 费用数据的处理方法、装置和计算机可读存储介质
Vorozhtsova et al. System approach to development of intellectual information mobile system for electric power metering
US20200193525A1 (en) System and method for automatic verification of expense note
CN116843481A (zh) 知识图谱分析方法、装置、设备及存储介质
CN116245657A (zh) 基于半监督学习的税务预警分析方法及系统
CN114936927A (zh) 跨境汇款单据验证方法及装置
KR20140115078A (ko) 재무제표 자동 기장 시스템
KR102645180B1 (ko) Ocr을 이용한 지출 관리를 위한 자동화 시스템
Kumar et al. AI Enabled Invoice Management Application
Tran et al. Information extraction from invoices by using a graph convolutional neural network: a case study of Vietnamese stores
CN113392203B (zh) 智能问答方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830

RJ01 Rejection of invention patent application after publication