CN112686307A - 基于人工智能获取发票的方法、装置及存储介质 - Google Patents
基于人工智能获取发票的方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112686307A CN112686307A CN202011604913.6A CN202011604913A CN112686307A CN 112686307 A CN112686307 A CN 112686307A CN 202011604913 A CN202011604913 A CN 202011604913A CN 112686307 A CN112686307 A CN 112686307A
- Authority
- CN
- China
- Prior art keywords
- invoice
- picture
- target
- key information
- target invoice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了基于人工智能获取发票的方法、装置及存储介质,涉及图像分类技术领域,该方法包括:从终端接收初始图片;确定所述初始图片对应的目标发票类型;获取所述目标发票类型的目标发票模板;按照目标发票模板对所述初始图片进行发票内容识别;若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片;向所述终端发送所述目标发票图片。本方案能够提高发票识别和发票审核的效率。
Description
技术领域
本申请涉及图像分类技术领域,尤其涉及一种基于人工智能获取发票的方法、装置及存储介质。
背景技术
在发票报销系统中,用户经常会用手机对发票拍照后再上传给服务器,便于服务器侧的发票审查员进行在线审核。
但是,用户在使用手机拍摄发票时,一般比较随意且场景多样化,导致在对发票拍照时,容易将发票周围的环境和非必要素材一起拍摄进去,从而导致将这些包含干扰信息的发票上传至服务器。例如,将发票放在桌面上,拍照时可能把桌上的书也拍进去。由于目前的手机拍照都非常清晰,因此,有可能在不经意的情况下,拍摄的发票图片中可能泄漏了用户的信息。由此可见,由于用户自行上传的发票图片可能包含其它对发票审核无用的干扰信息,因此,导致线上审核发票的效率较低。
发明内容
本申请实施例提供了一种基于人工智能获取发票的方法、装置及存储介质,旨在解决现有技术中线上审核发票的效率较低的问题。
第一方面,本申请实施例提供了一种基于人工智能获取发票的方法,其包括:
从终端接收初始图片;
确定所述初始图片对应的目标发票类型;
获取所述目标发票类型的目标发票模板;
按照目标发票模板对所述初始图片进行发票内容识别;
若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;
将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片;
向所述终端发送所述目标发票图片。
第二方面,本申请实施例提供了一种发票获取装置,其包括:
所述输入输出模块,用于从终端接收初始图片;
所述处理模块,用于确定所述初始图片对应的目标发票类型;获取所述目标发票类型的目标发票模板;按照目标发票模板对所述初始图片进行发票内容识别;若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片;
所述输入输出模块还用于向所述终端发送所述处理模块生成的所述目标发票图片。
第三方面,本申请实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于人工智能获取发票的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于人工智能获取发票的方法。
本申请实施例提供了一种基于人工智能获取发票的方法、装置及存储介质,服务器从终端接收初始图片后,确定所述初始图片对应的目标发票类型;获取所述目标发票类型的目标发票模板;按照目标发票模板对所述初始图片进行发票内容识别;若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片。由于目标发票图片基于发票模板生成,所以,一方面中,目标发票图片能够突破格式不统一的限制,有效提高发票审核效率。另一方面中,将识别的发票关键信息进行信息重组,并利用预设发票模板去生成新的发票图片,所以,能够进一步规范发票的质量,即便初始图片的拍摄环境(例如拍摄角度、拍摄光线、干扰信息等)不为标准发票图片,本申请也能直接向审核者提供转换为标准格式(例如尺寸、大小、布局等)的发票图片,进一步提高审核效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于人工智能获取发票的方法的应用场景示意图;
图2为本申请实施例提供的基于人工智能获取发票的方法的流程示意图;
图3为本申请实施例提供的基于人工智能获取发票的方法的流程示意图;
图4为本申请实施例提供的发票获取装置的示意性框图;
图5为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本申请实施例提供的基于人工智能获取发票的方法的应用场景示意图;图2、图3均为本申请实施例提供的基于人工智能获取发票的方法的流程示意图,该基于人工智能获取发票的方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S107。
S101、从终端接收初始图片。
其中,初始图片为用户使用终端拍摄得到,该初始图片中可能包括至少一张发票、至少一种干扰信息等,本申请实施例不对此作限定。
本申请实施例中,当报销系统要求用户上传一种目标类型的发票时,该初始图片中若包括至少两种类型的发票,那么可以将除该目标类型的发票之外的其他发票均视为干扰信息。
当报销系统要求用户上传一种目标类型的发票时,该初始图片中若包括多张同一种类型的发票,那么可以将除该目标类型的发票之外的其他发票均视为干扰信息,并对该多张同一种类型的发票进行发票内容识别。
本申请实施例中,以识别初始图片中的一张发票为例,当初始图片包括至少两张发票时,可参考对本申请实施例中对目标发票区域的识别实施例。若对于至少两张发票的场景,该至少两张发票之间存在重叠区域,且该重叠区域覆盖了该发票中的部分或全部发票关键信息,则对被覆盖的发票设置异常标注后,生成标注图片并返回给终端,该异常标注用于指示该被覆盖的发票无法完成识别出部分或全部发票关键信息。具体来说,可通过下述方式实现:
所述初始图片中包括至少两张发票所对应的发票区域,所述方法还包括:
若确定所述至少两张发票之间存在重叠区域,且所述重叠区域覆盖至少一张发票中的部分或全部发票关键信息,则对发票关键信息被覆盖的发票设置异常标注并生成标注图片;
向所述终端发送所述标注图片,所述异常标注用于指示被覆盖的发票无法完成识别出部分或全部发票关键信息。
可见,通过向终端返回该标注图片,能够向用户针对性的指示当前识别异常的发票,使得用户无需重新将所有发票重新拍摄和上传一遍,因此,能够提高发票的识别效率,也缩短服务器侧发票审查员的审查时间,进而提高审查效率。
另一些实施方式中,考虑到用户上传发票时可能会将干扰信息也一同拍摄进去,例如笔、手指、污迹或者异物等遮挡发票的空白位置,为了给审核者不造成干扰,还可以对这些干扰信息进行识别和预处理。具体来说,所述方法还包括:
识别所述初始图片中的干扰信息,所述干扰信息是指与发票无关的信息;
对所述干扰信息进行去除处理。
可见,通过预先对初始图片中的干扰信息进行预处理,能够减少后期服务器识别发票的时间,并减少对识别的视觉干扰。
另一些实施方式中,考虑到用户上传发票时可能会将干扰信息也一同拍摄进去,例如笔、手指、污迹或者异物等遮挡发票的部分发票关键信息,但是通过剩余显示且未被遮挡的部分发票关键信息依然能够识别出其真实内容,为了给审核者不造成干扰以及提高审核效率和准确率,还可以对这些被遮挡的部分发票关键信息进行识别和修复处理。具体来说,所述方法还包括:
识别所述初始图片中的发票关键信息区域;
若确定发票关键信息区域存在部分遮挡且识别成功,则按照识别成功的内容对遮挡部分进行插值处理,以修复该被遮挡的部分,得到完整的发票关键信息。
可见,通过对发票关键信息的缺失或者被遮挡部分进行修复处理,能够给审核者减少造成视觉干扰以及提高审核效率和准确率。
S102、确定所述初始图片对应的目标发票类型。
可以理解的是,终端在访问服务器的报销系统时,服务器会向终端提供发票报销入口和发票报销选项,发票报销选项可包括差旅费、交通费、餐饮费、通信费、印刷费、咨询费等品名的发票,本申请不对此作限定。在服务器上进行报销的用户可以选择本次待报销的发票类型,并对应上传发票。因此,服务器知晓用户所选择的要报销的发票类型的。当服务器收到终端上传的初始图片后,即可按照选择的发票类型去进行发票内容识别。
S103、获取所述目标发票类型的目标发票模板。
其中,目标发票模板是指图片中的空白区域分别按照固定位置进行布局的图片模板,该目标发票模板中的空白区域为可输入状态,例如,可在该目标发票模板中填写对应的关键信息,以形成一个发票图片。
S104、按照目标发票模板对所述初始图片进行发票内容识别。
一些实施方式中,所述按照目标发票模板对所述初始图片进行发票识别之后,所述方法还包括:
若未识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则向所述终端发送第一提示信息,所述第一提示信息用于指示本次发票上传失败。例如,第一提示信息可提示用户“本次上传的图片中的发票不是本次要求的发票类型”、“”本次上传发票图片失败。例如,报销系统上需要用户上传市内交通费图片,用户在市内交通一栏上传了餐饮发票图片。又例如,报销系统上需要用户上传通信费图片,用户在市内交通一栏上传了车票图片。
另一些实施方式中,如果对初始图片的识别成功,但是识别出的内容不是发票内容,则向终端发送第二提示信息,所述第二提示信息用于指示本次发票上传失败。例如,第二提示信息可提示用户“本次上传的图片中不包含发票”、“”本次上传发票图片失败。例如,报销系统上需要用户上传市内交通费图片,用户在市内交通一栏上传了差旅订单截图。
S105、若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息。
其中,发票关键信息是指表征发票的唯一性或发票特征等的信息,也可以理解为一张发票中的组成元素。例如,发票关键信息可包括发票类型、品名、金额、消费单位或个人信息等关键信息,本申请实施例不对发票关键信息中的关键信息的项做任何限定。
一些实施方式中,所述从所述目标发票区域中提取发票关键信息,包括:
调用所述目标发票模板对应的多个定位框,每个定位框对应发票的一种关键信息;
基于所述多个定位框检测所述初始图片中的关键信息;
将检测到的关键信息进行提取。
一些实施方式中,从所述目标发票区域中提取发票关键信息也可通过神经网络模型实现。具体来说,可以将该发票的初始图片输入卷积神经网络,提取得到初始图片的特征,再采用分类器对初始图片的特征中的特征点进行分类,得到文字特征和图片特征,截取初始图片中与文字特征对应的区域,得到文字区域,以及截取初始图片中与图片特征对应的区域,得到图片区域(该图片区域一般为防伪标志)。
S106、将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片。
一些实施方式中,所述目标发票模板包括多个发票信息区域,所述发票关键信息包括多个关键信息;所述将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片,包括:
确定所述多个关键信息中各关键信息对应的发票信息区域;
按照各关键信息对应的发票信息区域,分别将各关键信息对应填入所述目标发票模板中的发票信息区域,以生成所述目标发票图片。例如,用户上传了一张交通费图片,识别出的发票类型为市内交通费,品名为出租车,金额为123.89元,发票号码为CT679895XX,开票日期为2020.12.23,消费单位为健行实业有限公司。然后调出交通费的预设发票模板,分别将这些发票关键信息填入该预设发票模板中对应的发票信息区域中。
另一些实施方式中,所述生成所述目标发票图片,包括:
将所述目标发票图片转换为预设格式的目标发票图片;
相应的,所述方法还包括:
向所述终端发送图片控件,所述图片控件用于所述终端按照预设格式显示所述目标发票图片。
相应的,终端在从服务器收到该图片控件和目标发票图片后,即可在终端侧顺利打开该目标发票图片,并将该终端本地保存的初始图片替换为该目标发票图片。可见,通过这种同步方式,能够同时保证服务器和终端侧均保存同一目标发票图片,便于后期对账或核查。
S107、向所述终端发送所述目标发票图片。
相应的,终端接收到服务器返回的目标发票图片后,就可以替换原先拍摄的发票的初始图片,并进行展示。
本申请实施例中,所述方法通过神经网络模型实现,所述方法还包括:
获取数据集,所述数据集包括多张不同发票格式的发票图片;
标注出每个发票图片中每个关键信息的位置和类型;
将所述数据集输入预设图片识别模型,以对所述预设图片识别模型进行模型训练,得到目标图片识别模型;
所述按照目标发票模板对所述初始图片进行发票内容识别,包括:
基于所述目标图片识别模型识别所述初始图片中发票的目标发票格式,并按照所述目标发票格式进行发票内容识别。
具体的,基于上述数据集训练目标图片识别模型的训练过程如下:
对于每种发票格式的发票图片,先进行尺寸缩放操作,以使得同一种发票格式的发票图片的尺寸趋近于统一;
从各进行尺寸缩放操作的发票图片中分别截取每张发票图片中的图片区域和文字区域;
定位出文字区域中每行文字在发票图片中的位置,以及定位出图片区域中人脸各像素点在发票图片中的位置;具体来说,可以进行每一行文字区域的左右和上下边界进行定位;
对各发票图片分别进行二值化处理,得到多张二值化图片;
基于分类器对多张二值化图片进行分类,得到有效发票图片和无效发票图片;
将有效发票图片作为正样本进行多帧图片融合训练,最终得到目标图片识别模型,使得该目标图片识别模型具有识别该种发票格式的功能,其它发票格式的图片的训练同理,本申请不对目标图片识别模型能够识别多少种发票格式的发票图片作限定,也不对目标图片识别模型每次训练一种发票格式的发票图片还是同时训练至少两种发票格式的发票图片作限定。
为便于理解,可参考图3所示的一种应用场景的一种流程示意图。用户用手机对发票进行拍摄,得到发票图片,并通过运营商网络或者wi-fi网络将该发票图片上传到服务器。首先,基于目标图片识别模型识别该发票图片中的内容,若识别失败,则返回识别失败提示信息;若识别成功,则进一步识别该发票图片是否为发票,如果不是发票,则返回不是发票的提示信息;若果是发票,则基于该目标图片识别模型将该发票图片中的发票关键信息进行提取,并按照预设发票模板中设定好的格式对应填入发票关键信息。将填入发票关键信息的预设发票模板转换为图片格式,得到目标图片,然后将目标图片返回给手机。该手机收到该目标图片后,使用预装的图片空间显示该目标图片。
可见,由于目标发票图片基于发票模板生成,所以,一方面中,目标发票图片能够突破格式不统一的限制,有效提高发票审核效率。另一方面中,将识别的发票关键信息进行信息重组,并利用预设发票模板去生成新的发票图片,所以,能够进一步规范发票的质量,即便初始图片的拍摄环境(例如拍摄角度、拍摄光线、干扰信息等)不为标准发票图片,本申请也能直接向审核者提供转换为标准格式(例如尺寸、大小、布局等)的发票图片,进一步提高审核效率。
本申请实施例还提供一种发票获取装置,该发票获取装置用于执行前述基于人工智能获取发票的方法的任一实施例,该发票获取装置可应用于报销系统或者需要上传发票的任意场景。具体地,请参阅图4,图4是本申请实施例提供的发票获取装置30的示意性框图。该发票获取装置30可以配置于服务器中。
如图3所示,发票获取装置30包括:输入输出模块301和处理模块302.
在一实施例中,所述输入输出模块301,用于从终端接收初始图片;
所述处理模块302,用于确定所述初始图片对应的目标发票类型;获取所述目标发票类型的目标发票模板;按照目标发票模板对所述初始图片进行发票内容识别;若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片;
所述输入输出模块301还用于向所述终端发送所述处理模块302生成的所述目标发票图片。
一些实施例中,所述处理模块302按照目标发票模板对所述初始图片进行发票识别之后,还用于:
若未识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则通过所述输入输出模块向所述终端发送第一提示信息,所述第一提示信息用于指示本次发票上传失败。
一些实施例中,所述目标发票模板包括多个发票信息区域,所述发票关键信息包括多个关键信息;所述处理模块302具体用于:
确定所述多个关键信息中各关键信息对应的发票信息区域;
按照各关键信息对应的发票信息区域,分别将各关键信息对应填入所述目标发票模板中的发票信息区域,以生成所述目标发票图片。
一些实施例中,所述处理模块302具体用于:
调用所述目标发票模板对应的多个定位框,每个定位框对应发票的一种关键信息;
基于所述多个定位框检测所述初始图片中的关键信息;
将检测到的关键信息进行提取。
一些实施例中,所述处理模块302具体用于:
将所述目标发票图片转换为预设格式的目标发票图片;
通过所述输入输出模块301向所述终端发送图片控件,所述图片控件用于所述终端按照预设格式显示所述目标发票图片。
一些实施例中,所述发票获取装置30通过神经网络模型实现,所述处理模块302还用于:
通过所述输入输出模块301获取数据集,所述数据集包括多张不同发票格式的发票图片;
标注出每个发票图片中每个关键信息的位置和类型;
通过所述输入输出模块301将所述数据集输入预设图片识别模型,以对所述预设图片识别模型进行模型训练,得到目标图片识别模型;
基于所述目标图片识别模型识别所述初始图片中发票的目标发票格式,并按照所述目标发票格式进行发票内容识别。
一些实施例中,,所述处理模块302还用于:
识别所述初始图片中的干扰信息,所述干扰信息是指与发票无关的信息;
对所述干扰信息进行去除处理。
一些实施例中,所述初始图片中包括至少两张发票所对应的发票区域,处理模块302还用于:
若确定所述至少两张发票之间存在重叠区域,且所述重叠区域覆盖至少一张发票中的部分或全部发票关键信息,则对发票关键信息被覆盖的发票设置异常标注并生成标注图片;
通过所述输入输出模块301向所述终端发送所述标注图片,所述异常标注用于指示被覆盖的发票无法完成识别出部分或全部发票关键信息。
上述发票获取装置30可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本申请实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图4,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于人工智能获取发票的方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于人工智能获取发票的方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本申请实施例公开的基于人工智能获取发票的方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本申请实施例公开的基于人工智能获取发票的方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于人工智能获取发票的方法,其特征在于,所述方法包括:
从终端接收初始图片;
确定所述初始图片对应的目标发票类型;
获取所述目标发票类型的目标发票模板;
按照目标发票模板对所述初始图片进行发票内容识别;
若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;
将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片;
向所述终端发送所述目标发票图片。
2.根据权利要求1所述的方法,其特征在于,所述目标发票模板包括多个发票信息区域,所述发票关键信息包括多个关键信息;所述将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片,包括:
确定所述多个关键信息中各关键信息对应的发票信息区域;
按照各关键信息对应的发票信息区域,分别将各关键信息对应填入所述目标发票模板中的发票信息区域,以生成所述目标发票图片。
3.根据权利要求2所述的方法,其特征在于,所述从所述目标发票区域中提取发票关键信息,包括:
调用所述目标发票模板对应的多个定位框,每个定位框对应发票的一种关键信息;
基于所述多个定位框检测所述初始图片中的关键信息;
将检测到的关键信息进行提取。
4.根据权利要求3所述的方法,其特征在于,所述生成所述目标发票图片,包括:
将所述目标发票图片转换为预设格式的目标发票图片;
所述方法还包括:
向所述终端发送图片控件,所述图片控件用于所述终端按照预设格式显示所述目标发票图片。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法通过神经网络模型实现,所述方法还包括:
获取数据集,所述数据集包括多张不同发票格式的发票图片;
将所述数据集输入预设图片识别模型,以对所述预设图片识别模型进行模型训练,得到目标图片识别模型;
所述按照目标发票模板对所述初始图片进行发票内容识别,包括:
基于所述目标图片识别模型识别所述初始图片中发票的目标发票格式,并按照所述目标发票格式进行发票内容识别。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
识别所述初始图片中的干扰信息,所述干扰信息是指与发票无关的信息;
对所述干扰信息进行去除处理。
7.根据权利要求6所述的方法,其特征在于,所述初始图片中包括至少两张发票所对应的发票区域,所述方法还包括:
若确定所述至少两张发票区域之间存在重叠区域,且所述重叠区域覆盖至少一张发票中的部分或全部发票关键信息,则对发票关键信息被覆盖的发票区域设置异常标注并生成标注图片;
向所述终端发送所述标注图片,所述异常标注用于指示被覆盖的发票区域无法完成识别出部分或全部发票关键信息。
8.一种发票获取装置,其特征在于,包括:
输入输出模块,用于从终端接收初始图片;
处理模块,用于确定所述初始图片对应的目标发票类型;获取所述目标发票类型的目标发票模板;按照目标发票模板对所述初始图片进行发票内容识别;若识别出所述初始图片中存在与所述目标发票类型对应的目标发票区域,则从所述目标发票区域中提取发票关键信息;将所述发票关键信息填入所述目标发票模板中,以生成目标发票图片;
所述输入输出模块还用于向所述终端发送所述处理模块生成的所述目标发票图片。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于人工智能获取发票的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于人工智能获取发票的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604913.6A CN112686307A (zh) | 2020-12-30 | 2020-12-30 | 基于人工智能获取发票的方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604913.6A CN112686307A (zh) | 2020-12-30 | 2020-12-30 | 基于人工智能获取发票的方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112686307A true CN112686307A (zh) | 2021-04-20 |
Family
ID=75454606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011604913.6A Pending CN112686307A (zh) | 2020-12-30 | 2020-12-30 | 基于人工智能获取发票的方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686307A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113066223A (zh) * | 2021-04-22 | 2021-07-02 | 中国工商银行股份有限公司 | 发票自动验证方法及装置 |
CN113344889A (zh) * | 2021-06-18 | 2021-09-03 | 广东电网有限责任公司 | 一种财务票据图像质量评价方法及装置 |
CN114581066A (zh) * | 2022-05-05 | 2022-06-03 | 阿里健康科技(杭州)有限公司 | 医疗订单处理方法、装置、计算机设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025581A (zh) * | 2017-04-21 | 2017-08-08 | 百望电子发票数据服务有限公司 | 一种自动开具发票的方法与系统 |
CN107832757A (zh) * | 2017-11-03 | 2018-03-23 | 深圳航天信息有限公司 | 一种发票图像的识别方法 |
CN108255705A (zh) * | 2017-11-24 | 2018-07-06 | 平安科技(深圳)有限公司 | 发票领用异常的构造方法、装置、计算机设备及存储介质 |
CN110008956A (zh) * | 2019-04-01 | 2019-07-12 | 深圳市华付信息技术有限公司 | 发票关键信息定位方法、装置、计算机设备及存储介质 |
CN110032990A (zh) * | 2019-04-23 | 2019-07-19 | 杭州智趣智能信息技术有限公司 | 一种发票文本识别方法、系统及相关组件 |
CN110471932A (zh) * | 2019-08-13 | 2019-11-19 | 爱信诺征信有限公司 | 基于区块链的发票管理方法及系统 |
CN110472524A (zh) * | 2019-07-25 | 2019-11-19 | 广东工业大学 | 基于深度学习的发票信息管理方法、系统和可读介质 |
KR20200113649A (ko) * | 2019-03-26 | 2020-10-07 | (주)자이로스 | Qr 승차권을 이용한 대중교통요금 처리 방법 및 시스템 |
CN111931769A (zh) * | 2020-06-30 | 2020-11-13 | 北京来也网络科技有限公司 | 结合rpa及ai的发票处理、装置、计算设备及存储介质 |
-
2020
- 2020-12-30 CN CN202011604913.6A patent/CN112686307A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025581A (zh) * | 2017-04-21 | 2017-08-08 | 百望电子发票数据服务有限公司 | 一种自动开具发票的方法与系统 |
CN107832757A (zh) * | 2017-11-03 | 2018-03-23 | 深圳航天信息有限公司 | 一种发票图像的识别方法 |
CN108255705A (zh) * | 2017-11-24 | 2018-07-06 | 平安科技(深圳)有限公司 | 发票领用异常的构造方法、装置、计算机设备及存储介质 |
KR20200113649A (ko) * | 2019-03-26 | 2020-10-07 | (주)자이로스 | Qr 승차권을 이용한 대중교통요금 처리 방법 및 시스템 |
CN110008956A (zh) * | 2019-04-01 | 2019-07-12 | 深圳市华付信息技术有限公司 | 发票关键信息定位方法、装置、计算机设备及存储介质 |
CN110032990A (zh) * | 2019-04-23 | 2019-07-19 | 杭州智趣智能信息技术有限公司 | 一种发票文本识别方法、系统及相关组件 |
CN110472524A (zh) * | 2019-07-25 | 2019-11-19 | 广东工业大学 | 基于深度学习的发票信息管理方法、系统和可读介质 |
CN110471932A (zh) * | 2019-08-13 | 2019-11-19 | 爱信诺征信有限公司 | 基于区块链的发票管理方法及系统 |
CN111931769A (zh) * | 2020-06-30 | 2020-11-13 | 北京来也网络科技有限公司 | 结合rpa及ai的发票处理、装置、计算设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113066223A (zh) * | 2021-04-22 | 2021-07-02 | 中国工商银行股份有限公司 | 发票自动验证方法及装置 |
CN113344889A (zh) * | 2021-06-18 | 2021-09-03 | 广东电网有限责任公司 | 一种财务票据图像质量评价方法及装置 |
CN114581066A (zh) * | 2022-05-05 | 2022-06-03 | 阿里健康科技(杭州)有限公司 | 医疗订单处理方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112686307A (zh) | 基于人工智能获取发票的方法、装置及存储介质 | |
CN106326888B (zh) | 图像识别方法和装置 | |
CN110399851B (zh) | 一种图像处理装置、方法、设备及可读存储介质 | |
US9002066B2 (en) | Methods, systems and processor-readable media for designing a license plate overlay decal having infrared annotation marks | |
CN105046553A (zh) | 基于手机的云智能发票识别查验系统及方法 | |
CN111797837A (zh) | 单据智能报销方法、系统、计算机设备及存储介质 | |
CN109840520A (zh) | 一种发票关键信息识别方法及系统 | |
CN109918984A (zh) | 保险单号码识别方法、装置、电子设备及存储介质 | |
CN111290684A (zh) | 图像显示方法、图像显示装置及终端设备 | |
CN112949455A (zh) | 一种增值税发票识别系统及方法 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
CN107861931B (zh) | 模板文件处理方法、装置、计算机设备和存储介质 | |
WO2021174869A1 (zh) | 用户图片数据的处理方法、装置、计算机设备及存储介质 | |
KR20010015963A (ko) | 한자의 일자대조에 의한 교정 시스템 | |
CN110991150B (zh) | 一种数据格式转换方法、装置及报账系统 | |
CN113807256A (zh) | 票据数据处理方法、装置、电子设备和存储介质 | |
CN113239881A (zh) | 一种发票报销方法 | |
CN112287828A (zh) | 一种基于机器学习的财务报表生成方法及装置 | |
CN112558958A (zh) | 基于模板的推送内容生成方法、装置及计算机设备 | |
CN112001784A (zh) | 发票自动盖章方法及自助办税终端 | |
CN112381702A (zh) | 一种图像隐私处理方法、计算设备及存储介质 | |
CN111223230A (zh) | 一种基于crnn算法的发票文件真伪识别方法 | |
CN110909098A (zh) | 一种云端地理信息数据分析方法及系统 | |
US11659104B2 (en) | Generation of an electronic document capable of receiving user input | |
CN103870793A (zh) | 纸媒广告的监测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |