CN111104844A - 多发票信息录入方法、装置、电子设备及存储介质 - Google Patents

多发票信息录入方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111104844A
CN111104844A CN201910969568.7A CN201910969568A CN111104844A CN 111104844 A CN111104844 A CN 111104844A CN 201910969568 A CN201910969568 A CN 201910969568A CN 111104844 A CN111104844 A CN 111104844A
Authority
CN
China
Prior art keywords
target
image
invoice
result
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910969568.7A
Other languages
English (en)
Other versions
CN111104844B (zh
Inventor
温林祥
林梓棱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201910969568.7A priority Critical patent/CN111104844B/zh
Publication of CN111104844A publication Critical patent/CN111104844A/zh
Application granted granted Critical
Publication of CN111104844B publication Critical patent/CN111104844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种多发票信息录入方法、装置、电子设备及存储介质。该方法能够对获取的待录入开票系统的第一图像进行预处理,得到目标图像,基于图像识别提取目标图像中的文字区域特征作为目标特征层,切割目标特征层的所有文字,得到第一结果,识别第一结果,得到第二结果,标签化处理第二结果,得到特征标签,提取特征标签对应的特征值,获取每个特征值在第一图像中的坐标值作为第一坐标,计算第一图像中每张发票的坐标范围值作为目标区域,获取第一坐标落入每张发票中任意发票的目标区域的目标特征值对应的第一标识,将目标特征值录入开票系统中与第一标识的目标标签对应的空格中,避免多张发票录入混乱。

Description

多发票信息录入方法、装置、电子设备及存储介质
技术领域
本发明涉及图像识别技术领域,尤其涉及一种多发票信息录入方法、装置、电子设备及存储介质。
背景技术
目前,随着发票越来越被广泛使用,需要录入开票系统的发票也越来越多,由于手动将发票信息录入开票系统的方法,不仅加大财务人员的工作负担,且准确率还低,为此,基于OCR技术的发票信息录入方法也应运而生。
然而,在现有的技术方案中,只能处理图像中包含一张发票的情况,而对于任意一张含有多张发票的图像,则无法对图像中的多张发票信息进行准确识别,也无法将该图像中的发票信息准确录入开票系统中的相应空格,导致发票信息录入混乱。
发明内容
鉴于以上内容,有必要提供一种多发票信息录入方法、装置、电子设备及存储介质,能够在无需人为操作下,将图像中包含的多张发票信息准确录入开票系统对应的位置中,从而避免图像中的多张发票录入混乱。
一种多发票信息录入方法,所述方法包括:
获取待录入开票系统的第一图像,所述第一图像中包括多张发票;
对所述第一图像进行预处理,得到目标图像;
提取所述目标图像中的文字区域特征,得到目标特征层;
切割所述目标特征层的所有文字,得到第一结果;
采用神经网络算法识别所述第一结果,得到第二结果;
对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签;
从所述第二结果中提取与所述多个特征标签对应的多个特征值;
获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标;
计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域;
当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识;
从所述开票系统的当前界面中获取与所述第一标识对应的目标标签;
将所述目标特征值录入所述目标标签对应的空格中。
根据本发明优选实施例,所述对所述第一图像进行预处理,得到目标图像包括:
采用灰度化方法处理所述第一图像,得到第二图像;
对所述第二图像进行归一化处理,得到第三图像;
采用低通滤波方法对所述第三图像进行滤波处理,得到所述目标图像。
根据本发明优选实施例,所述提取所述目标图像中的文字区域特征,得到目标特征层包括:
采用核密度估计方法处理所述目标图像,得到所述目标图像的图像层;
根据二值腐蚀方法对所述图像层进行腐蚀处理,得到至少一个文字区域特征层;
采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
根据本发明优选实施例,所述采用神经网络算法识别所述第一结果,得到第二结果包括:
对所述第一结果进行卷积运算,得到卷积结果;
采用Adam算法优化所述卷积结果,得到优化结果;
将所述优化结果输入至语言模型中识别,得到第三结果;
采用动态规划方法处理所述第三结果,得到所述第二结果。
根据本发明优选实施例,所述对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签包括:
确定所述第二结果中的配置内容;
采用去冗余算法处理所述配置内容,得到多个结果;
采用浅层式语义分析方法对所述多个结果进行处理,得到所述多个特征标签。
根据本发明优选实施例,所述计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域包括:
以所述第一图像最左下角的点作为坐标轴零点;
对于每张发票中任意的给定发票,获取该给定发票第一预设信息的第二坐标值及该给定发票第二预设信息的第三X轴值,其中,所述第二坐标值包括第二X轴值及第二Y轴值;
根据所述第二X轴值及所述第三X轴值,确定该给定发票的X轴范围;
确定离该给定发票的上方距离最短的第一发票;
获取所述第一发票中第一预设信息的多个第五Y轴值;
将每个第五Y轴值与所述第二Y轴值进行相减运算,得到多个运算结果;
将所述多个运算结果中最小运算结果对应的第五Y轴值确定为目标Y轴值;
根据所述第二Y轴值及所述目标Y轴值,确定该给定发票的Y轴范围;
根据该给定发票的X轴范围及该给定发票的Y轴范围,计算该给定发票的目标区域。
根据本发明优选实施例,在将所述目标特征值录入所述目标标签对应的空格中后,所述方法还包括:
采用加密技术对所述开票系统中每张目标发票进行加密,得到至少一条密文;
当检测到所述至少一条密文中存在目标密文解密成功时,显示所述目标密文对应的目标发票。
一种多发票信息录入装置,所述装置包括:
获取单元,用于获取待录入开票系统的第一图像,所述第一图像中包括多张发票;
预处理单元,用于对所述第一图像进行预处理,得到目标图像;
提取单元,用于提取所述目标图像中的文字区域特征,得到目标特征层;
切割单元,用于切割所述目标特征层的所有文字,得到第一结果;
识别单元,用于采用神经网络算法识别所述第一结果,得到第二结果;
处理单元,用于对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签;
所述提取单元,还用于从所述第二结果中提取与所述多个特征标签对应的多个特征值;
所述获取单元,还用于获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标;
计算单元,用于计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域;
所述获取单元,还用于当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识;
所述获取单元,还用于从所述开票系统的当前界面中获取与所述第一标识对应的目标标签;
录入单元,用于将所述目标特征值录入所述目标标签对应的空格中。
根据本发明优选实施例,所述预处理单元具体用于:
采用灰度化方法处理所述第一图像,得到第二图像;
对所述第二图像进行归一化处理,得到第三图像;
采用低通滤波方法对所述第三图像进行滤波处理,得到所述目标图像。
根据本发明优选实施例,所述提取单元提取所述目标图像中的文字区域特征,得到目标特征层包括:
采用核密度估计方法处理所述目标图像,得到所述目标图像的图像层;
根据二值腐蚀方法对所述图像层进行腐蚀处理,得到至少一个文字区域特征层;
采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
根据本发明优选实施例,所述识别单元具体用于:
对所述第一结果进行卷积运算,得到卷积结果;
采用Adam算法优化所述卷积结果,得到优化结果;
将所述优化结果输入至语言模型中识别,得到第三结果;
采用动态规划方法处理所述第三结果,得到所述第二结果。
根据本发明优选实施例,所述处理单元具体用于:
确定所述第二结果中的配置内容;
采用去冗余算法处理所述配置内容,得到多个结果;
采用浅层式语义分析方法对所述多个结果进行处理,得到所述多个特征标签。
根据本发明优选实施例,所述计算单元具体用于:
以所述第一图像最左下角的点作为坐标轴零点;
对于每张发票中任意的给定发票,获取该给定发票第一预设信息的第二坐标值及该给定发票第二预设信息的第三X轴值,其中,所述第二坐标值包括第二X轴值及第二Y轴值;
根据所述第二X轴值及所述第三X轴值,确定该给定发票的X轴范围;
确定离该给定发票的上方距离最短的第一发票;
获取所述第一发票中第一预设信息的多个第五Y轴值;
将每个第五Y轴值与所述第二Y轴值进行相减运算,得到多个运算结果;
将所述多个运算结果中最小运算结果对应的第五Y轴值确定为目标Y轴值;
根据所述第二Y轴值及所述目标Y轴值,确定该给定发票的Y轴范围;
根据该给定发票的X轴范围及该给定发票的Y轴范围,计算该给定发票的目标区域。
根据本发明优选实施例,所述装置还包括:
加密单元,用于在将所述目标特征值录入所述目标标签对应的空格中后,采用加密技术对所述开票系统中每张目标发票进行加密,得到至少一条密文;
显示单元,用于当检测到所述至少一条密文中存在目标密文解密成功时,显示所述目标密文对应的目标发票。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述多发票信息录入方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述多发票信息录入方法。
由以上技术方案可以看出,本发明能够获取待录入开票系统的第一图像,所述第一图像中包括多张发票,对所述第一图像进行预处理,得到目标图像,提取所述目标图像中的文字区域特征,得到目标特征层,切割所述目标特征层的所有文字,得到第一结果,采用神经网络算法识别所述第一结果,得到第二结果,对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签,从所述第二结果中提取与所述多个特征标签对应的多个特征值,获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标,计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域,当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识,从所述开票系统的当前界面中获取与所述第一标识对应的目标标签,将所述目标特征值录入所述目标标签对应的空格中,能够在无需人为操作下,将所述第一图像中包含的多张发票信息准确录入所述开票系统对应的位置中,从而避免所述第一图像中的多张发票录入混乱。
附图说明
图1是本发明多发票信息录入方法的较佳实施例的流程图。
图2是本发明多发票信息录入装置的较佳实施例的功能模块图。
图3是本发明实现多发票信息录入方法的较佳实施例的电子设备的结构示意图。
主要元件符号说明
Figure BDA0002231618070000071
Figure BDA0002231618070000081
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明多发票信息录入方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述多发票信息录入方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital SignalProcessor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,获取待录入开票系统的第一图像,所述第一图像中包括多张发票。
在本发明的至少一个实施例中,所述第一图像中含有待录入开票系统的多张发票。
其中,所述开票系统是与电子设备相通信的系统,所述开票系统主要记载所述多张发票的信息。
通过上述实施方式,能够得到所述第一图像,为后续将所述第一图像中的发票信息录入所述开票系统提供基础条件。
S11,对所述第一图像进行预处理,得到目标图像。
在本发明的至少一个实施例中,所述目标图像是对所述第一图像进行一系列预处理后得到的。
在本发明的至少一个实施例中,所述电子设备对所述第一图像进行预处理,得到目标图像包括:
所述电子设备采用灰度化方法处理所述第一图像,得到第二图像,进一步地,所述电子设备对所述第二图像进行归一化处理,得到第三图像,更进一步地,所述电子设备采用低通滤波方法对所述第三图像进行滤波处理,得到所述目标图像。
通过上述实施方式,对所述第一图像进行灰度化处理,能够提高所述目标图像的分辨率,为所述目标图像的后续工作提供基础条件,进而对图像进行归一化处理,能够避免图像大小不一带来的干扰,最后对归一化处理后的图像进行滤波处理,能够达到去噪的目的,提高后续识别结果的准确率。
S12,提取所述目标图像中的文字区域特征,得到目标特征层。
在本发明的至少一个实施例中,所述文字区域特征是指从所述目标图像中提取的有文字的区域,所述目标特征层中包含所述文字区域特征。
在本发明的至少一个实施例中,所述电子设备提取所述目标图像中的文字区域特征,得到目标特征层包括:
所述电子设备采用核密度估计(kernel density estimation)方法处理所述目标图像,得到所述目标图像的图像层,根据二值腐蚀方法对所述图像层进行腐蚀处理,得到至少一个文字区域特征层,进一步地,所述电子设备采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
具体地,所述电子设备采用核密度估计方法处理所述目标图像,得到高斯核密度分布曲线,进一步地,所述电子设备从所述高斯核密度分布曲线中获取极大值及极小值,计算所述极大值的个数,进而以所述个数为层数,所述极小值为边界,对所述目标图像进行分层处理,得到所述目标图像的图像层,所述电子设备采用逐层识别方式识别所述特征层中的文字区域特征,更进一步地,所述电子设备采用二值腐蚀方法对所述文字区域特征进行腐蚀处理,得到所述至少一个文字区域特征层,所述电子设备采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
通过上述实施方式,采用核密度估计方法处理所述目标图像,能够直观地得到所述图像层,由于文字具有一定的抗腐蚀能力,因此进一步采取二值腐蚀方法腐蚀所述图像层,有利于提取所述至少一个文字区域特征,最后将所述至少一个文字区域特征层整合成所述目标特征层,有利于将所有文字都汇集在所述目标特征层中。
S13,切割所述目标特征层的所有文字,得到第一结果。
在本发明的至少一个实施例中,所述第一结果是使用一定的切割间距切割所述所有文字而来的。
在本发明的至少一个实施例中,所述电子设备切割所述目标特征层的所有文字,得到第一结果包括:
所述电子设备采用最邻近搜索(Nearest Neighbor Search,NNS)算法对所述目标特征层进行膨胀处理,得到第一区域,从所述第一区域中提取出至少一个成字特征,所述电子设备整合所述至少一个成字特征,得到至少一行文字,进一步地,所述电子设备基于不同的字符,采取不同的切割间距对所述至少一行文字中的所有文字进行切割,得到所述第一结果。
具体地,所述电子设备基于不同的字符,采取不同的切割间距对所述至少一行文字中的所有文字进行切割,得到所述第一结果包括:
当检测到所述至少一行文字为中文时,所述电子设备确定切割间距为第一切割间距,当检测到所述至少一行文字为英文或者阿拉伯数字时,所述电子设备确定切割间距为第二切割间距,其中,所述第一切割间距为所述第二切割间距的1.2倍。
例如:所述至少一行文字中的第一行文字为名称:甲有限公司,经过切割后得到的第一结果为:名、称、甲、有、限、公、司。
通过上述实施方式,基于最邻近搜索算法的膨胀特性,能够有效地整合文字碎片,进而提高文字成字的准确率,基于不同字符采用不同的切割间距,能够使切割出的结果更加精确。
S14,采用神经网络算法识别所述第一结果,得到第二结果。
在本发明的至少一个实施例中,所述第二结果是经过神经网络算法识别出的结果,一般体现为词组或者语句,所述第二结果中包含多个特征标签以及所述多个特征标签对应的多个特征值。
在本发明的至少一个实施例中,所述电子设备采用神经网络算法识别所述第一结果,得到第二结果包括:
所述电子设备对所述第一结果进行卷积运算,得到卷积结果,采用Adam算法优化所述卷积结果,得到优化结果,进一步地,所述电子设备将所述优化结果输入至语言模型中识别,得到第三结果,采用动态规划方法处理所述第三结果,得到所述第二结果。
具体地,所述语言模型用于对至少一个优化结果组成的词语进行概率估算,进而将概率最大的词语确定为所述第三结果,其中,所述语言模型包括统计语言模型(Statistical Language Model)以及神经网络语言模型(NNLM)。本实施例对所述语言模型的选择不作限制。
通过上述实施方式,能够得到更精确的词组或者语句,为后续的标签化处理提供精确的基础条件。
S15,对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签。
在本发明的至少一个实施例中,所述多个特征标签为所述开票系统中所含发票的基本信息,所述多个特征标签包括,但不限于:收款人、纳税人、开户银行、金额等。
在本发明的至少一个实施例中,所述电子设备对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签包括:
所述电子设备确定所述第二结果中的配置内容,采用去冗余算法处理所述配置内容,得到多个结果,进一步地,所述电子设备采用浅层式语义分析方法对所述多个结果进行处理,得到所述多个特征标签。
具体地,所述电子设备确定所述第二结果中的配置内容,所述配置内容为所述第一图像中所含多张发票的基本信息,所述电子设备根据所述开票系统中所需的信息,采用去冗余算法将所述配置内容中的冗余内容去除,得到所述多个结果,进一步地,所述电子设备采用浅层式语义分析方法识别所述多个结果,并将识别出的含义相似的结果进行归一化处理,得到所述多个特征标签。
例如:所述电子设备确定出的配置内容为:承办人、承办者、说明、纳税人、纳税者,进一步地,所述电子设备采用去冗余算法处理,得到所述多个结果为承办人、承办者、纳税人、纳税者,更进一步地,所述电子设备采用浅层式语义分析方法识别含义相似的结果有“承办人”与“承办者”、“纳税人”与“纳税者”,所述电子设备将“承办人”与“承办者”进行归一化处理,得到特征标签为:承办人,所述电子设备将“纳税人”与“纳税者”进行归一化处理,得到特征标签为:纳税人。
通过上述实施方式,能够对所述第二结果的配置内容去冗余,进而减少所述电子设备的占用内存,同时,对去冗余后的结果进行归一化处理,能够避免后续无法从所述开票系统中获取对应的目标标签。
S16,从所述第二结果中提取与所述多个特征标签对应的多个特征值。
在本发明的至少一个实施例中,所述多个特征值是与所述多个特征标签对应的第二结果。
例如:所述第二结果中包含“纳税人:张三”、“收款单位:A公司”,其中,所述多个特征标签包含“纳税人”及“收款单位”,因此,从所述第二结果中提取与“纳税人”对应的特征值为“张三”,从所述第二结果中提取与“收款单位”对应的特征值为“A公司”。
在本发明的至少一个实施例中,所述电子设备采用机器学习方法从所述第二结果中提取与所述多个特征标签对应的多个特征值。
S17,获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标。
在本发明的至少一个实施例中,所述第一坐标是以所述第一图像最左下角的点作为坐标轴零点,在所述第一图像中所述特征值的坐标。
通过上述实施方式,获取到每个特征值的第一坐标,有利于确定所述多个特征值的位置,进而使录入所述开票系统中的信息更加精确。
S18,计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域。
在本发明的至少一个实施例中,每张发票的目标区域是由每张发票的X轴范围及每张发票的Y轴范围组成的。
在本发明的至少一个实施例中,所述电子设备计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域包括:
所述电子设备以所述第一图像最左下角的点作为坐标轴零点,对于每张发票中任意的给定发票,所述电子设备获取该给定发票第一预设信息的第二坐标值及该给定发票第二预设信息的第三X轴值,其中,所述第二坐标值包括第二X轴值及第二Y轴值,根据所述第二X轴值及所述第三X轴值,确定该给定发票的X轴范围,所述电子设备确定离该给定发票的上方距离最短的第一发票,进一步地,所述电子设备获取所述第一发票中第一预设信息的多个第五Y轴值,将每个第五Y轴值与所述第二Y轴值进行相减运算,得到多个运算结果,更进一步地,所述电子设备将所述多个运算结果中最小运算结果对应的第五Y轴值确定为目标Y轴值,根据所述第二Y轴值及所述目标Y轴值,确定该给定发票的Y轴范围,根据该给定发票的X轴范围及该给定发票的Y轴范围,计算该给定发票的目标区域。
其中,所述第一预设信息是所述第一图像中所含多张发票上的信息,所述第一预设信息包括:收款单位或者收费单位。
所述第二预设信息是所述第一图像中所含多张发票上的信息,所述第二预设信息包括:第一联或者第二联。
通过上述实施方式,无需经过人为计算,能够准确计算出每张发票的目标区域,进而能够确定出所述多个特征值是否落在所述目标区域内。
S19,当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识。
在本发明的至少一个实施例中,所述目标特征值是其第一坐标落入所述任意发票的目标区域内的特征值,所述目标特征值可以是所述多个特征值中的一个或者多个,所述第一标识为所述目标特征值在所述第一图像中对应的特征标签。
通过上述实施方式,通过获取所述目标特征值对应的第一标识,便于将所述目标特征值录入所述开票系统中的相应位置,能够有效防止所述目标特征值录入错误的位置。
S20,从所述开票系统的当前界面中获取与所述第一标识对应的目标标签。
在本发明的至少一个实施例中,所述目标标签为所述第一标识在所述当前界面对应的标签,所述目标标签是所述第一图像与所述当前界面的桥梁。
通过上述实施方式,通过获取所述目标标签,便于所述当前界面与所述第一图像建立桥梁,进而有利于所述目标特征值准确地录入到所述当前界面中。
S21,将所述目标特征值录入所述目标标签对应的空格中。
在本发明的至少一个实施例中,所述空格在所述开票系统的当前界面中。
在本发明的至少一个实施例中,在将所述目标特征值录入所述目标标签对应的空格中后,所述方法还包括:
所述电子设备采用加密技术对所述开票系统中每张目标发票进行加密,得到至少一条密文,当检测到所述至少一条密文中存在目标密文解密成功时,显示所述目标密文对应的目标发票。
通过上述实施方式,对所述开票系统中的每张发票进行加密,能够避免所述开票系统中的发票被随意篡改,提高发票信息的安全性。
在本发明的至少一个实施例中,所述方法还包括:
在确定所述目标特征值均被录入所述目标标签对应的空格后,所述电子设备生成提示信息,进一步地,所述电子设备发送所述提示信息至指定联系人的终端设备。
其中,所述提示信息可以包括,但不限于:录入完成的时间等。
进一步地,所述指定联系人可以是所述开票系统的负责人。
通过上述实施方式,能够在所述目标特征值均被录入开票系统后,提醒所述指定联系人进行查收。
由以上技术方案可以看出,本发明能够获取待录入开票系统的第一图像,所述第一图像中包括多张发票,对所述第一图像进行预处理,得到目标图像,提取所述目标图像中的文字区域特征,得到目标特征层,切割所述目标特征层的所有文字,得到第一结果,采用神经网络算法识别所述第一结果,得到第二结果,对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签,从所述第二结果中提取与所述多个特征标签对应的多个特征值,获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标,计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域,当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识,从所述开票系统的当前界面中获取与所述第一标识对应的目标标签,将所述目标特征值录入所述目标标签对应的空格中,能够在无需人为操作下,将所述第一图像中包含的多张发票信息准确录入所述开票系统对应的位置中,从而避免所述第一图像中的多张发票录入混乱。
如图2所示,是本发明多发票信息录入装置的较佳实施例的功能模块图。所述多发票信息录入装置11包括获取单元110、预处理单元111、提取单元112、切割单元113、识别单元114、处理单元115、计算单元116、录入单元117、加密单元118、显示单元119、生成单元120以及发送单元121。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
获取单元110获取待录入开票系统的第一图像,所述第一图像中包括多张发票。
在本发明的至少一个实施例中,所述第一图像中含有待录入开票系统的多张发票。
其中,所述开票系统是与电子设备相通信的系统,所述开票系统主要记载所述多张发票的信息。
通过上述实施方式,能够得到所述第一图像,为后续将所述第一图像中的发票信息录入所述开票系统提供基础条件。
预处理单元111对所述第一图像进行预处理,得到目标图像。
在本发明的至少一个实施例中,所述目标图像是对所述第一图像进行一系列预处理后得到的。
在本发明的至少一个实施例中,所述预处理单元111对所述第一图像进行预处理,得到目标图像包括:
所述预处理单元111采用灰度化方法处理所述第一图像,得到第二图像,进一步地,所述预处理单元111对所述第二图像进行归一化处理,得到第三图像,更进一步地,所述预处理单元111采用低通滤波方法对所述第三图像进行滤波处理,得到所述目标图像。
通过上述实施方式,对所述第一图像进行灰度化处理,能够提高所述目标图像的分辨率,为所述目标图像的后续工作提供基础条件,进而对图像进行归一化处理,能够避免图像大小不一带来的干扰,最后对归一化处理后的图像进行滤波处理,能够达到去噪的目的,提高后续识别结果的准确率。
提取单元112提取所述目标图像中的文字区域特征,得到目标特征层。
在本发明的至少一个实施例中,所述文字区域特征是指从所述目标图像中提取的有文字的区域,所述目标特征层中包含所述文字区域特征。
在本发明的至少一个实施例中,所述提取单元112提取所述目标图像中的文字区域特征,得到目标特征层包括:
所述提取单元112采用核密度估计(kernel density estimation)方法处理所述目标图像,得到所述目标图像的图像层,根据二值腐蚀方法对所述图像层进行腐蚀处理,得到至少一个文字区域特征层,进一步地,所述提取单元112采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
具体地,所述提取单元112采用核密度估计方法处理所述目标图像,得到高斯核密度分布曲线,进一步地,所述提取单元112从所述高斯核密度分布曲线中获取极大值及极小值,计算所述极大值的个数,进而以所述个数为层数,所述极小值为边界,对所述目标图像进行分层处理,得到所述目标图像的图像层,所述提取单元112采用逐层识别方式识别所述特征层中的文字区域特征,更进一步地,所述提取单元112采用二值腐蚀方法对所述文字区域特征进行腐蚀处理,得到所述至少一个文字区域特征层,所述提取单元112采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
通过上述实施方式,采用核密度估计方法处理所述目标图像,能够直观地得到所述图像层,由于文字具有一定的抗腐蚀能力,因此进一步采取二值腐蚀方法腐蚀所述图像层,有利于提取所述至少一个文字区域特征,最后将所述至少一个文字区域特征层整合成所述目标特征层,有利于将所有文字都汇集在所述目标特征层中。
切割单元113切割所述目标特征层的所有文字,得到第一结果。
在本发明的至少一个实施例中,所述第一结果是使用一定的切割间距切割所述所有文字而来的。
在本发明的至少一个实施例中,所述切割单元113切割所述目标特征层的所有文字,得到第一结果包括:
所述切割单元113采用最邻近搜索(Nearest Neighbor Search,NNS)算法对所述目标特征层进行膨胀处理,得到第一区域,从所述第一区域中提取出至少一个成字特征,所述切割单元113整合所述至少一个成字特征,得到至少一行文字,进一步地,所述切割单元113基于不同的字符,采取不同的切割间距对所述至少一行文字中的所有文字进行切割,得到所述第一结果。
具体地,所述切割单元113基于不同的字符,采取不同的切割间距对所述至少一行文字中的所有文字进行切割,得到所述第一结果包括:
当检测到所述至少一行文字为中文时,所述切割单元113确定切割间距为第一切割间距,当检测到所述至少一行文字为英文或者阿拉伯数字时,所述切割单元113确定切割间距为第二切割间距,其中,所述第一切割间距为所述第二切割间距的1.2倍。
例如:所述至少一行文字中的第一行文字为名称:甲有限公司,经过切割后得到的第一结果为:名、称、甲、有、限、公、司。
通过上述实施方式,基于最邻近搜索算法的膨胀特性,能够有效地整合文字碎片,进而提高文字成字的准确率,基于不同字符采用不同的切割间距,能够使切割出的结果更加精确。
识别单元114采用神经网络算法识别所述第一结果,得到第二结果。
在本发明的至少一个实施例中,所述第二结果是经过神经网络算法识别出的结果,一般体现为词组或者语句,所述第二结果中包含多个特征标签以及所述多个特征标签对应的多个特征值。
在本发明的至少一个实施例中,所述识别单元114采用神经网络算法识别所述第一结果,得到第二结果包括:
所述识别单元114对所述第一结果进行卷积运算,得到卷积结果,采用Adam算法优化所述卷积结果,得到优化结果,进一步地,所述识别单元114将所述优化结果输入至语言模型中识别,得到第三结果,采用动态规划方法处理所述第三结果,得到所述第二结果。
具体地,所述语言模型用于对至少一个优化结果组成的词语进行概率估算,进而将概率最大的词语确定为所述第三结果,其中,所述语言模型包括统计语言模型(Statistical Language Model)以及神经网络语言模型(NNLM)。本实施例对所述语言模型的选择不作限制。
通过上述实施方式,能够得到更精确的词组或者语句,为后续的标签化处理提供精确的基础条件。
处理单元115对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签。
在本发明的至少一个实施例中,所述多个特征标签为所述开票系统中所含发票的基本信息,所述多个特征标签包括,但不限于:收款人、纳税人、开户银行、金额等。
在本发明的至少一个实施例中,所述处理单元115对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签包括:
所述处理单元115确定所述第二结果中的配置内容,采用去冗余算法处理所述配置内容,得到多个结果,进一步地,所述处理单元115采用浅层式语义分析方法对所述多个结果进行处理,得到所述多个特征标签。
具体地,所述处理单元115确定所述第二结果中的配置内容,所述配置内容为所述第一图像中所含多张发票的基本信息,所述处理单元115根据所述开票系统中所需的信息,采用去冗余算法将所述配置内容中的冗余内容去除,得到所述多个结果,进一步地,所述处理单元115采用浅层式语义分析方法识别所述多个结果,并将识别出的含义相似的结果进行归一化处理,得到所述多个特征标签。
例如:所述处理单元115确定出的配置内容为:承办人、承办者、说明、纳税人、纳税者,进一步地,所述处理单元115采用去冗余算法处理,得到所述多个结果为承办人、承办者、纳税人、纳税者,更进一步地,所述处理单元115采用浅层式语义分析方法识别含义相似的结果有“承办人”与“承办者”、“纳税人”与“纳税者”,所述处理单元115将“承办人”与“承办者”进行归一化处理,得到特征标签为:承办人,所述处理单元115将“纳税人”与“纳税者”进行归一化处理,得到特征标签为:纳税人。
通过上述实施方式,能够对所述第二结果的配置内容去冗余,进而减少所述电子设备的占用内存,同时,对去冗余后的结果进行归一化处理,能够避免后续无法从所述开票系统中获取对应的目标标签。
所述提取单元112从所述第二结果中提取与所述多个特征标签对应的多个特征值。
在本发明的至少一个实施例中,所述多个特征值是与所述多个特征标签对应的第二结果。
例如:所述第二结果中包含“纳税人:张三”、“收款单位:A公司”,其中,所述多个特征标签包含“纳税人”及“收款单位”,因此,从所述第二结果中提取与“纳税人”对应的特征值为“张三”,从所述第二结果中提取与“收款单位”对应的特征值为“A公司”。
在本发明的至少一个实施例中,所述提取单元112采用机器学习方法从所述第二结果中提取与所述多个特征标签对应的多个特征值。
所述获取单元110获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标。
在本发明的至少一个实施例中,所述第一坐标是以所述第一图像最左下角的点作为坐标轴零点,在所述第一图像中所述特征值的坐标。
通过上述实施方式,获取到每个特征值的第一坐标,有利于确定所述多个特征值的位置,进而使录入所述开票系统中的信息更加精确。
计算单元116计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域。
在本发明的至少一个实施例中,每张发票的目标区域是由每张发票的X轴范围及每张发票的Y轴范围组成的。
在本发明的至少一个实施例中,所述计算单元116计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域包括:
所述计算单元116以所述第一图像最左下角的点作为坐标轴零点,对于每张发票中任意的给定发票,所述计算单元116获取该给定发票第一预设信息的第二坐标值及该给定发票第二预设信息的第三X轴值,其中,所述第二坐标值包括第二X轴值及第二Y轴值,根据所述第二X轴值及所述第三X轴值,确定该给定发票的X轴范围,所述计算单元116确定离该给定发票的上方距离最短的第一发票,进一步地,所述计算单元116获取所述第一发票中第一预设信息的多个第五Y轴值,将每个第五Y轴值与所述第二Y轴值进行相减运算,得到多个运算结果,更进一步地,所述计算单元116将所述多个运算结果中最小运算结果对应的第五Y轴值确定为目标Y轴值,根据所述第二Y轴值及所述目标Y轴值,确定该给定发票的Y轴范围,根据该给定发票的X轴范围及该给定发票的Y轴范围,计算该给定发票的目标区域。
其中,所述第一预设信息是所述第一图像中所含多张发票上的信息,所述第一预设信息包括:收款单位或者收费单位。
所述第二预设信息是所述第一图像中所含多张发票上的信息,所述第二预设信息包括:第一联或者第二联。
通过上述实施方式,无需经过人为计算,能够准确计算出每张发票的目标区域,进而能够确定出所述多个特征值是否落在所述目标区域内。
当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,所述获取单元110获取所述目标特征值对应的第一标识。
在本发明的至少一个实施例中,所述目标特征值是其第一坐标落入所述任意发票的目标区域内的特征值,所述目标特征值可以是所述多个特征值中的一个或者多个,所述第一标识为所述目标特征值在所述第一图像中对应的特征标签。
通过上述实施方式,通过获取所述目标特征值对应的第一标识,便于将所述目标特征值录入所述开票系统中的相应位置,能够有效防止所述目标特征值录入错误的位置。
所述获取单元110从所述开票系统的当前界面中获取与所述第一标识对应的目标标签。
在本发明的至少一个实施例中,所述目标标签为所述第一标识在所述当前界面对应的标签,所述目标标签是所述第一图像与所述当前界面的桥梁。
通过上述实施方式,通过获取所述目标标签,便于所述当前界面与所述第一图像建立桥梁,进而有利于所述目标特征值准确地录入到所述当前界面中。
录入单元117将所述目标特征值录入所述目标标签对应的空格中。
在本发明的至少一个实施例中,所述空格在所述开票系统的当前界面中。
在本发明的至少一个实施例中,在将所述目标特征值录入所述目标标签对应的空格中后,所述方法还包括:
加密单元118采用加密技术对所述开票系统中每张目标发票进行加密,得到至少一条密文,当检测到所述至少一条密文中存在目标密文解密成功时,显示单元119显示所述目标密文对应的目标发票。
通过上述实施方式,对所述开票系统中的每张发票进行加密,能够避免所述开票系统中的发票被随意篡改,提高发票信息的安全性。
在本发明的至少一个实施例中,所述方法还包括:
在确定所述目标特征值均被录入所述目标标签对应的空格后,生成单元120生成提示信息,进一步地,发送单元121发送所述提示信息至指定联系人的终端设备。
其中,所述提示信息可以包括,但不限于:录入完成的时间等。
进一步地,所述指定联系人可以是所述开票系统的负责人。
通过上述实施方式,能够在所述目标特征值均被录入开票系统后,提醒所述指定联系人进行查收。
由以上技术方案可以看出,本发明能够获取待录入开票系统的第一图像,所述第一图像中包括多张发票,对所述第一图像进行预处理,得到目标图像,提取所述目标图像中的文字区域特征,得到目标特征层,切割所述目标特征层的所有文字,得到第一结果,采用神经网络算法识别所述第一结果,得到第二结果,对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签,从所述第二结果中提取与所述多个特征标签对应的多个特征值,获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标,计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域,当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识,从所述开票系统的当前界面中获取与所述第一标识对应的目标标签,将所述目标特征值录入所述目标标签对应的空格中,能够在无需人为操作下,将所述第一图像中包含的多张发票信息准确录入所述开票系统对应的位置中,从而避免所述第一图像中的多张发票录入混乱。
如图3所示,是本发明实现多发票信息录入方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如多发票信息录入程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个多发票信息录入方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成获取单元110、预处理单元111、提取单元112、切割单元113、识别单元114、处理单元115、计算单元116、录入单元117、加密单元118、显示单元119、生成单元120以及发送单元121。
所述存储器12可用于存储所述计算机程序和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机程序和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据等)等。此外,存储器12可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种多发票信息录入方法,所述处理器13可执行所述多个指令从而实现:获取待录入开票系统的第一图像,所述第一图像中包括多张发票;对所述第一图像进行预处理,得到目标图像;提取所述目标图像中的文字区域特征,得到目标特征层;切割所述目标特征层的所有文字,得到第一结果;采用神经网络算法识别所述第一结果,得到第二结果;对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签;从所述第二结果中提取与所述多个特征标签对应的多个特征值;获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标;计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域;当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识;从所述开票系统的当前界面中获取与所述第一标识对应的目标标签;将所述目标特征值录入所述目标标签对应的空格中。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种多发票信息录入方法,其特征在于,所述方法包括:
获取待录入开票系统的第一图像,所述第一图像中包括多张发票;
对所述第一图像进行预处理,得到目标图像;
提取所述目标图像中的文字区域特征,得到目标特征层;
切割所述目标特征层的所有文字,得到第一结果;
采用神经网络算法识别所述第一结果,得到第二结果;
对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签;
从所述第二结果中提取与所述多个特征标签对应的多个特征值;
获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标;
计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域;
当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识;
从所述开票系统的当前界面中获取与所述第一标识对应的目标标签;
将所述目标特征值录入所述目标标签对应的空格中。
2.如权利要求1所述的多发票信息录入方法,其特征在于,所述对所述第一图像进行预处理,得到目标图像包括:
采用灰度化方法处理所述第一图像,得到第二图像;
对所述第二图像进行归一化处理,得到第三图像;
采用低通滤波方法对所述第三图像进行滤波处理,得到所述目标图像。
3.如权利要求1所述的多发票信息录入方法,其特征在于,所述提取所述目标图像中的文字区域特征,得到目标特征层包括:
采用核密度估计方法处理所述目标图像,得到所述目标图像的图像层;
根据二值腐蚀方法对所述图像层进行腐蚀处理,得到至少一个文字区域特征层;
采用特征整合方法整合所述至少一个文字区域特征层,得到所述目标特征层。
4.如权利要求1所述的多发票信息录入方法,其特征在于,所述采用神经网络算法识别所述第一结果,得到第二结果包括:
对所述第一结果进行卷积运算,得到卷积结果;
采用Adam算法优化所述卷积结果,得到优化结果;
将所述优化结果输入至语言模型中识别,得到第三结果;
采用动态规划方法处理所述第三结果,得到所述第二结果。
5.如权利要求1所述的多发票信息录入方法,其特征在于,所述对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签包括:
确定所述第二结果中的配置内容;
采用去冗余算法处理所述配置内容,得到多个结果;
采用浅层式语义分析方法对所述多个结果进行处理,得到所述多个特征标签。
6.如权利要求1所述的多发票信息录入方法,其特征在于,所述计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域包括:
以所述第一图像最左下角的点作为坐标轴零点;
对于每张发票中任意的给定发票,获取该给定发票第一预设信息的第二坐标值及该给定发票第二预设信息的第三X轴值,其中,所述第二坐标值包括第二X轴值及第二Y轴值;
根据所述第二X轴值及所述第三X轴值,确定该给定发票的X轴范围;
确定离该给定发票的上方距离最短的第一发票;
获取所述第一发票中第一预设信息的多个第五Y轴值;
将每个第五Y轴值与所述第二Y轴值进行相减运算,得到多个运算结果;
将所述多个运算结果中最小运算结果对应的第五Y轴值确定为目标Y轴值;
根据所述第二Y轴值及所述目标Y轴值,确定该给定发票的Y轴范围;
根据该给定发票的X轴范围及该给定发票的Y轴范围,计算该给定发票的目标区域。
7.如权利要求1所述的多发票信息录入方法,其特征在于,在将所述目标特征值录入所述目标标签对应的空格中后,所述方法还包括:
采用加密技术对所述开票系统中每张目标发票进行加密,得到至少一条密文;
当检测到所述至少一条密文中存在目标密文解密成功时,显示所述目标密文对应的目标发票。
8.一种多发票信息录入装置,其特征在于,所述装置包括:
获取单元,用于获取待录入开票系统的第一图像,所述第一图像中包括多张发票;
预处理单元,用于对所述第一图像进行预处理,得到目标图像;
提取单元,用于提取所述目标图像中的文字区域特征,得到目标特征层;
切割单元,用于切割所述目标特征层的所有文字,得到第一结果;
识别单元,用于采用神经网络算法识别所述第一结果,得到第二结果;
处理单元,用于对所述第二结果的配置内容进行标签化处理,得到所述第二结果的多个特征标签;
所述提取单元,还用于从所述第二结果中提取与所述多个特征标签对应的多个特征值;
所述获取单元,还用于获取所述多个特征值中每个特征值在所述第一图像中的坐标值,得到每个特征值的第一坐标;
计算单元,用于计算所述第一图像中每张发票在所述第一图像中的坐标范围值,得到每张发票的目标区域;
所述获取单元,还用于当所述多个特征值中存在目标特征值的第一坐标落入每张发票中任意发票的目标区域内时,获取所述目标特征值对应的第一标识;
所述获取单元,还用于从所述开票系统的当前界面中获取与所述第一标识对应的目标标签;
录入单元,用于将所述目标特征值录入所述目标标签对应的空格中。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的多发票信息录入方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的多发票信息录入方法。
CN201910969568.7A 2019-10-12 2019-10-12 多发票信息录入方法、装置、电子设备及存储介质 Active CN111104844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910969568.7A CN111104844B (zh) 2019-10-12 2019-10-12 多发票信息录入方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910969568.7A CN111104844B (zh) 2019-10-12 2019-10-12 多发票信息录入方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111104844A true CN111104844A (zh) 2020-05-05
CN111104844B CN111104844B (zh) 2023-11-14

Family

ID=70421456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910969568.7A Active CN111104844B (zh) 2019-10-12 2019-10-12 多发票信息录入方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111104844B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117119114A (zh) * 2023-10-23 2023-11-24 北京华科诚信科技股份有限公司 一种多发票文件切割及识别一体化设备及发票信息识别方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295001A (zh) * 2013-06-03 2013-09-11 哈尔滨理工大学 应用于手持设备的发票信息识别设备及发票信息识别方法
CN107145814A (zh) * 2017-04-19 2017-09-08 畅捷通信息技术股份有限公司 发票录入方法、发票录入装置和终端
CN108268641A (zh) * 2018-01-18 2018-07-10 大象慧云信息技术有限公司 发票信息识别方法及发票信息识别装置、设备和存储介质
CN108460418A (zh) * 2018-03-07 2018-08-28 南京邮电大学 一种基于文字识别与语义分析的发票分类方法
CN109344838A (zh) * 2018-11-02 2019-02-15 长江大学 发票信息自动快速识别方法、系统以及装置
CN109657665A (zh) * 2018-10-31 2019-04-19 广东工业大学 一种基于深度学习的发票批量自动识别系统
CN109840520A (zh) * 2017-11-24 2019-06-04 中国移动通信集团广东有限公司 一种发票关键信息识别方法及系统
CN109858373A (zh) * 2018-12-29 2019-06-07 航天信息股份有限公司 一种基于深度学习的发票识别验真方法及系统
CN109977957A (zh) * 2019-03-04 2019-07-05 苏宁易购集团股份有限公司 一种基于深度学习的发票识别方法及系统
CN110263239A (zh) * 2019-05-31 2019-09-20 平安科技(深圳)有限公司 一种发票识别的方法、装置、存储介质及计算机设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295001A (zh) * 2013-06-03 2013-09-11 哈尔滨理工大学 应用于手持设备的发票信息识别设备及发票信息识别方法
CN107145814A (zh) * 2017-04-19 2017-09-08 畅捷通信息技术股份有限公司 发票录入方法、发票录入装置和终端
CN109840520A (zh) * 2017-11-24 2019-06-04 中国移动通信集团广东有限公司 一种发票关键信息识别方法及系统
CN108268641A (zh) * 2018-01-18 2018-07-10 大象慧云信息技术有限公司 发票信息识别方法及发票信息识别装置、设备和存储介质
CN108460418A (zh) * 2018-03-07 2018-08-28 南京邮电大学 一种基于文字识别与语义分析的发票分类方法
CN109657665A (zh) * 2018-10-31 2019-04-19 广东工业大学 一种基于深度学习的发票批量自动识别系统
CN109344838A (zh) * 2018-11-02 2019-02-15 长江大学 发票信息自动快速识别方法、系统以及装置
CN109858373A (zh) * 2018-12-29 2019-06-07 航天信息股份有限公司 一种基于深度学习的发票识别验真方法及系统
CN109977957A (zh) * 2019-03-04 2019-07-05 苏宁易购集团股份有限公司 一种基于深度学习的发票识别方法及系统
CN110263239A (zh) * 2019-05-31 2019-09-20 平安科技(深圳)有限公司 一种发票识别的方法、装置、存储介质及计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡泽枫;张学习;黎贤钊;: "基于卷积神经网络的批量发票识别系统研究", 工业控制计算机, no. 05, pages 108 - 109 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117119114A (zh) * 2023-10-23 2023-11-24 北京华科诚信科技股份有限公司 一种多发票文件切割及识别一体化设备及发票信息识别方法
CN117119114B (zh) * 2023-10-23 2024-01-23 北京华科诚信科技股份有限公司 一种多发票文件切割及识别一体化设备及发票信息识别方法

Also Published As

Publication number Publication date
CN111104844B (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
US10853638B2 (en) System and method for extracting structured information from image documents
CN111694826B (zh) 基于人工智能的数据增强方法、装置、电子设备及介质
CN108959257B (zh) 一种自然语言解析方法、装置、服务器及存储介质
CN112287914B (zh) Ppt视频段提取方法、装置、设备及介质
CN109766885B (zh) 一种文字检测方法、装置、电子设备及存储介质
CN112200081A (zh) 异常行为识别方法、装置、电子设备及存储介质
CN112541443B (zh) 发票信息抽取方法、装置、计算机设备及存储介质
CN111488732B (zh) 一种变形关键词检测方法、系统及相关设备
CN111639487A (zh) 基于分类模型的字段抽取方法、装置、电子设备及介质
CN111597309A (zh) 相似企业推荐方法、装置、电子设备及介质
CN114462412A (zh) 实体识别方法、装置、电子设备及存储介质
CN113342977B (zh) 发票图像分类方法、装置、设备及存储介质
CN112749639B (zh) 模型训练方法、装置、计算机设备和存储介质
CN111104844B (zh) 多发票信息录入方法、装置、电子设备及存储介质
EP3425531A1 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
CN114842982B (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN113627186B (zh) 基于人工智能的实体关系检测方法及相关设备
CN113486848B (zh) 文档表格识别方法、装置、设备及存储介质
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
CN114943306A (zh) 意图分类方法、装置、设备及存储介质
CN113705468A (zh) 基于人工智能的数字图像识别方法及相关设备
CN111933241B (zh) 医疗数据解析方法、装置、电子设备及存储介质
CN111476090B (zh) 水印识别方法和装置
CN114049686A (zh) 签名识别模型训练方法、装置及电子设备
CN116092094A (zh) 图像文本识别方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant