CN110333813A - 发票图片展示的方法、电子装置及计算机可读存储介质 - Google Patents
发票图片展示的方法、电子装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110333813A CN110333813A CN201910465876.6A CN201910465876A CN110333813A CN 110333813 A CN110333813 A CN 110333813A CN 201910465876 A CN201910465876 A CN 201910465876A CN 110333813 A CN110333813 A CN 110333813A
- Authority
- CN
- China
- Prior art keywords
- invoice
- picture
- attribute
- mouse cursor
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/048—Indexing scheme relating to G06F3/048
- G06F2203/04806—Zoom, i.e. interaction techniques or interactors for controlling the zooming operation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明涉及数据展示技术领域,揭露了一种发票图片展示的方法、电子装置及计算机可读存储介质。该方法包括:利用预先训练好的模型识别发票图片的发票类型,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;侦测发票图片上的当前鼠标光标位置,分析当前鼠标光标位置对应的发票属性;针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应用户基于当前鼠标光标位置发出的放大或者缩小指令。本发明有效提高了发票录入和检查的效率,且可针对性的定位,提高了发票检查的准确性。
Description
技术领域
本发明涉及数据展示技术领域,尤其涉及一种发票图片展示的方法、电子装置及计算机可读存储介质。
背景技术
目前文档录入人员和复核人员在对显示的发票图片进行发票信息录入和检查的时候,由于电脑屏幕有限,展示的发票图片很小,在进行图片放大或者缩小时,只是对整个发票图片进行简单的放大或者缩小,无法准确定位到用户需要关注的有效内容,且用户进行鼠标拖拽操作时,只是随着鼠标拖拽在发票图片上进行任意的定位,无法快速有效的定位到用户需要关注的有效内容,导致发票录入和检查的效率低下。
发明内容
鉴于以上内容,有必要提供一种发票图片展示的方法、电子装置及计算机可读存储介质,旨在解决现有的发票录入和检查的效率低下的技术问题。
为实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器和处理器,所述存储器上存储有发票图片展示程序,所述发票图片展示程序被所述处理器执行时实现如下步骤:
S1、获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;
S2、侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性;
S3、若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
可选的,所述发票图片展示程序被所述处理器执行时在步骤S1前还实现如下步骤:
根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
可选的,所述发票图片展示程序被所述处理器执行时还实现如下步骤:
若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
可选的,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程包括:
S11、分别为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本;
S12、分别将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率,则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行上述步骤S12、S13及S14。
可选的,所述步骤S2包括:
为显示的发票图片建立坐标系,分别将所述显示的发票图片中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域转换为对应的该坐标系下的位置坐标区域;
将侦测的当前鼠标光标位置转换为该坐标系下的鼠标光标坐标值;
若有一个发票属性对应的位置坐标区域包含所述鼠标光标坐标值,或者若有一个发票属性对应的发票属性内容的位置坐标区域包含所述鼠标光标坐标值,则确定当前鼠标光标位置对应的发票属性为该发票属性。
为实现上述目的,本发明还提供一种发票图片展示的方法,所述发票图片展示的方法包括:
S1、获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;
S2、侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性;
S3、若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
可选的,所述发票图片展示的方法在步骤S1前还包括:
根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
可选的,所述发票图片展示的方法还包括:
若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
可选的,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程包括:
S11、分别为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本;
S12、分别将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率,则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行上述步骤S12、S13及S14。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有发票图片展示程序,所述发票图片展示程序可被一个或者多个处理器执行,以实现上述发票图片展示的方法的步骤。
相较现有技术,本发明通过预先训练好的模型识别出发票图片的发票类型,获取发票图片对应的各个发票属性的位置区域,及各个发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性,针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应用户发出的放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令,有效提高了发票录入和检查的效率,且可针对性的定位,提高了发票检查的准确性。
附图说明
图1为本发明电子装置一实施例的硬件结构图;
图2为图1中的发票图片展示程序一实施例的功能模块图;
图3为本发明发票图片展示的方法一实施例的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如图1所示,为本发明电子装置一实施例的硬件结构图。电子装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子装置1包括存储器11及处理器12,该存储器11中存储有发票图片展示程序10,所述发票图片展示程序10可被所述处理器12执行。图1仅示出了具有组件11-12以及发票图片展示程序10的电子装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对电子装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子装置1的内部存储单元,例如该电子装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件,例如存储本发明一实施例中的发票图片展示程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行发票图片展示程序10等。
可选的,所述电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
在本发明的一实施例中,所述发票图片展示程序10被所述处理器12执行时实现如下步骤S1、S2、S3。
S1、获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;
发票类型可以有多种,例如餐饮发票、交通发票、住宿发票、门诊发票、住院票据等,发票属性可以包括公司名称、纳税人识别号、地址、电话、开户行及/或账号等,发票属性“公司名称”对应的发票属性内容可以为“******公司”,发票属性“纳税人识别号”对应的发票属性内容可以为“9144*********”,发票属性“地址”对应的发票属性内容可以为“深圳市***区***街道**********”。同一种发票类型的所有发票中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域通常是固定不变的。
可选的,在本发明的一个实施例中,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程可以包括:
S11、分别为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本,其中,预设的发票类型可以包括多种,例如餐饮发票、交通发票、住宿发票、门诊发票、住院票据等,每一预设的发票类型的发票图片样本预设数量例如为1万张;
S12、分别将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集,其中,第一比例高于第二比例,第一比例与第二比例之和小于或者等于1,例如第一比例为70%,第二比例为30%;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率(例如预设准确率为95%),则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行上述步骤S12、S13及S14。
S2、侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性。
可选的,在本发明的一个实施例中,所述步骤S2可以包括:
为显示的发票图片建立坐标系,分别将显示的发票图片中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域转换为对应的该坐标系下的位置坐标区域,其中,所述坐标系可以由X坐标轴和Y坐标轴构成,所述位置坐标区域可以由X轴像素坐标范围和Y轴像素坐标范围确定,例如,第i个发票属性对应的X轴像素坐标范围可以为(Xi1,Xi2),第i个发票属性对应的Y轴像素坐标范围可以为(Yi1,Yi2),i为自然数,本实施例中,转换坐标时参考的坐标系可以以显示器的显示区域的边际来建立坐标,也可以以显示的发票图片的边际来建立坐标,在此不作赘述;
将侦测的当前鼠标光标位置转换为该坐标系下的鼠标光标坐标值;
若有一个发票属性对应的位置坐标区域包含所述鼠标光标坐标值,或者若有一个发票属性对应的发票属性内容的位置坐标区域包含所述鼠标光标坐标值,则确定当前鼠标光标位置对应的发票属性为该发票属性。
S3、若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
所述用户基于当前鼠标光标位置发出的放大或缩小指令可通过滚动鼠标滚轮或者触控发出。
进一步的,可在侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令后,将当前鼠标光标位置对应的发票属性及对应的发票属性内容置于显示区域正中位置,然后针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令。
可选的,在本发明的一个实施例中,所述发票图片展示程序10被所述处理器12执行时在步骤S1前还实现如下步骤:
根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
例如当发票图片的高宽比大于1时,说明发票图片高宽颠倒,若印章位置在发图片样本左侧,则对发票图片做顺时针旋转九十度处理,若印章位置在发票图片右侧,则对发票图片做逆时针旋转九十度处理;当发票图片的高宽比小于1时,说明发票图片高宽未颠倒,若印章位置在发票图片下侧,则对发票图片做顺时针旋转一百八十度处理,若印章位置在发票图片上侧,则不做处理。
可选的,在本发明的一个实施例中,所述发票图片展示程序10被所述处理器12执行时还实现如下步骤:
若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时(例如,每隔0.5秒)或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
例如,判断鼠标光标位置是否移动结束的判断规则可以为:若鼠标光标位置停止移动的停止时间大于预设时间阈值(例如,0.8秒),则判定鼠标光标位置移动结束。
本实施例中,用户操作鼠标光标移动时,基于鼠标光标的移动在发票图片上拖拽可定位到每一个发票属性及对应属性内容,如定位到发票名称、纳税人识别号、地址、电话、开户行及账号等有效信息上。
可选的,在本发明的一个实施例中,所述发票图片展示程序10被所述处理器12执行时还实现如下步骤:
针对当前鼠标光标位置对应的发票属性的位置区域,及对应的发票属性内容的位置区域,进行标识处理。
例如可以针对当前鼠标光标位置对应的发票属性的位置区域及对应的发票属性内容的位置区域进行高亮、加粗、使用带颜色的边界框线进行框选展示等。
如图2所示,为图1中的发票图片展示程序10一实施例的功能模块图。
在本发明的一个实施例中,发票图片展示程序10包括控制模块110及执行模块120。
所述控制模块110,用于获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域。
发票类型可以有多种,例如餐饮发票、交通发票、住宿发票、门诊发票、住院票据等,发票属性可以包括公司名称、纳税人识别号、地址、电话、开户行及/或账号等,发票属性“公司名称”对应的发票属性内容可以为“******公司”,发票属性“纳税人识别号”对应的发票属性内容可以为“9144*********”,发票属性“地址”对应的发票属性内容可以为“深圳市***区***街道**********”。同一种发票类型的所有发票中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域通常是固定不变的。
可选的,在本发明的一个实施例中,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程包括:
S11、为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本,其中,预设的发票类型包括多种,例如餐饮发票、交通发票、住宿发票、门诊发票、住院票据等,每一预设的发票类型的发票图片样本预设数量例如为1万张;
S12、将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集,其中,第一比例高于第二比例,第一比例与第二比例之和小于等于1,例如第一比例为70%,第二比例为30%;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率(预设准确率例如为95%),则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行步骤S12、S13及S14。
所述执行模块120,用于侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性;若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
其中,所述用户基于当前鼠标光标位置发出的放大或缩小指令可通过滚动鼠标滚轮或者触控发出。
进一步的,可在侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令后,将当前鼠标光标位置对应的发票属性及对应的发票属性内容置于显示区域正中位置,然后针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令。
可选的,在本发明的一个实施例中,所述控制模块110还用于根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
例如当发票图片的高宽比大于1时,说明发票图片高宽颠倒,若印章位置在发图片样本左侧,则对发票图片做顺时针旋转九十度处理,若印章位置在发票图片右侧,则对发票图片做逆时针旋转九十度处理;当发票图片的高宽比小于1时,说明发票图片高宽未颠倒,若印章位置在发票图片下侧,则对发票图片做顺时针旋转一百八十度处理,若印章位置在发票图片上侧,则不做处理。
可选的,在本发明的一个实施例中,所述执行模块120还用于若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时(例如,每隔0.5秒)或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
例如,判断鼠标光标位置是否移动结束的判断规则可以为:若鼠标光标位置停止移动的停止时间大于预设时间阈值(例如,0.8秒),则判定鼠标光标位置移动结束。
可选的,在本发明的一个实施例中,所述执行模块120还用于针对当前鼠标光标位置对应的发票属性的位置区域,及对应的发票属性内容的位置区域,进行标识处理。
例如可以针对当前鼠标光标位置对应的发票属性的位置区域及对应的发票属性内容的位置区域进行高亮、加粗、使用带颜色的边界框线进行框选展示等。
如图3所示,为本发明发票图片展示的方法一实施例的流程图,该发票图片展示的方法包括以下步骤S1、S2、S3。
S1、获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;
发票类型可以有多种,例如餐饮发票、交通发票、住宿发票、门诊发票、住院票据等,发票属性可以包括公司名称、纳税人识别号、地址、电话、开户行及/或账号等,发票属性“公司名称”对应的发票属性内容可以为“******公司”,发票属性“纳税人识别号”对应的发票属性内容可以为“9144*********”,发票属性“地址”对应的发票属性内容可以为“深圳市***区***街道**********”。同一种发票类型的所有发票中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域通常是固定不变的。
可选的,在本发明的一个实施例中,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程可以包括:
S11、分别为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本,其中,预设的发票类型可以包括多种,例如餐饮发票、交通发票、住宿发票、门诊发票、住院票据等,每一预设的发票类型的发票图片样本预设数量例如为1万张;
S12、分别将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集,其中,第一比例高于第二比例,第一比例与第二比例之和小于或者等于1,例如第一比例为70%,第二比例为30%;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率(例如预设准确率为95%),则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行上述步骤S12、S13及S14。
S2、侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性。
可选的,在本发明的一个实施例中,所述步骤S2可以包括:
为显示的发票图片建立坐标系,分别将显示的发票图片中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域转换为对应的该坐标系下的位置坐标区域,其中,所述坐标系可以由X坐标轴和Y坐标轴构成,所述位置坐标区域可以由X轴像素坐标范围和Y轴像素坐标范围确定,例如,第i个发票属性对应的X轴像素坐标范围可以为(Xi1,Xi2),第i个发票属性对应的Y轴像素坐标范围可以为(Yi1,Yi2),i为自然数,本实施例中,转换坐标时参考的坐标系可以以显示器的显示区域的边际来建立坐标,也可以以显示的发票图片的边际来建立坐标,在此不作赘述;
将侦测的当前鼠标光标位置转换为该坐标系下的鼠标光标坐标值;
若有一个发票属性对应的位置坐标区域包含所述鼠标光标坐标值,或者若有一个发票属性对应的发票属性内容的位置坐标区域包含所述鼠标光标坐标值,则确定当前鼠标光标位置对应的发票属性为该发票属性。
S3、若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
所述用户基于当前鼠标光标位置发出的放大或缩小指令可通过滚动鼠标滚轮或者触控发出。
进一步的,可在侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令后,将当前鼠标光标位置对应的发票属性及对应的发票属性内容置于显示区域正中位置,然后针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令。
可选的,在本发明的一个实施例中,所述发票图片展示的方法在步骤S1前还包括:
根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
例如当发票图片的高宽比大于1时,说明发票图片高宽颠倒,若印章位置在发图片样本左侧,则对发票图片做顺时针旋转九十度处理,若印章位置在发票图片右侧,则对发票图片做逆时针旋转九十度处理;当发票图片的高宽比小于1时,说明发票图片高宽未颠倒,若印章位置在发票图片下侧,则对发票图片做顺时针旋转一百八十度处理,若印章位置在发票图片上侧,则不做处理。
可选的,在本发明的一个实施例中,所述发票图片展示的方法还包括:
若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时(例如,每隔0.5秒)或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
例如,判断鼠标光标位置是否移动结束的判断规则可以为:若鼠标光标位置停止移动的停止时间大于预设时间阈值(例如,0.8秒),则判定鼠标光标位置移动结束。
本实施例中,用户操作鼠标光标移动时,基于鼠标光标的移动在发票图片上拖拽可定位到每一个发票属性及对应属性内容,如定位到发票名称、纳税人识别号、地址、电话、开户行及账号等有效信息上。
可选的,在本发明的一个实施例中,所述发票图片展示的方法还包括:
针对当前鼠标光标位置对应的发票属性的位置区域,及对应的发票属性内容的位置区域,进行标识处理。
例如可以针对当前鼠标光标位置对应的发票属性的位置区域及对应的发票属性内容的位置区域进行高亮、加粗、使用带颜色的边界框线进行框选展示等。
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等中的任意一种或者几种的任意组合。计算机可读存储介质中包括发票图片展示程序10,本发明之计算机可读存储介质的具体实施方式与上述发票图片展示的方法以及电子装置的具体实施方式大致相同,在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种电子装置,其特征在于,所述电子装置包括存储器和处理器,所述存储器上存储有发票图片展示程序,所述发票图片展示程序被所述处理器执行时实现如下步骤:
S1、获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;
S2、侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性;
S3、若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
2.如权利要求1所述的电子装置,其特征在于,所述发票图片展示程序被所述处理器执行时在步骤S1前还实现如下步骤:
根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
3.如权利要求1所述的电子装置,其特征在于,所述发票图片展示程序被所述处理器执行时还实现如下步骤:
若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
4.如权利要求1所述的电子装置,其特征在于,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程包括:
S11、分别为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本;
S12、分别将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率,则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行上述步骤S12、S13及S14。
5.如权利要求1所述的电子装置,其特征在于,所述步骤S2包括:
为显示的发票图片建立坐标系,分别将所述显示的发票图片中各个发票属性的位置区域及各个发票属性对应的发票属性内容的位置区域转换为对应的该坐标系下的位置坐标区域;
将侦测的当前鼠标光标位置转换为该坐标系下的鼠标光标坐标值;
若有一个发票属性对应的位置坐标区域包含所述鼠标光标坐标值,或者若有一个发票属性对应的发票属性内容的位置坐标区域包含所述鼠标光标坐标值,则确定当前鼠标光标位置对应的发票属性为该发票属性。
6.一种发票图片展示的方法,其特征在于,所述发票图片展示的方法包括:
S1、获取显示的发票图片,利用预先训练好的模型识别出所述发票图片的发票类型,根据预先确定的发票类型、发票属性的位置区域、发票属性内容的位置区域的映射关系,获取识别出的发票类型对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域;
S2、侦测显示的发票图片上的当前鼠标光标位置,根据获取的所述发票图片对应的各个发票属性的位置区域,及各个发票属性对应的发票属性内容的位置区域,分析当前鼠标光标位置对应的发票属性;
S3、若侦测到用户基于当前鼠标光标位置发出的放大或者缩小指令,则针对当前鼠标光标位置对应的发票属性及对应的发票属性内容响应所述放大或者缩小指令,针对除当前鼠标光标位置对应的发票属性及对应的发票属性内容以外的其他内容拒绝响应所述放大或者缩小指令。
7.如权利要求6所述的发票图片展示的方法,其特征在于,所述发票图片展示的方法在步骤S1前还包括:
根据发票图片的高宽比信息以及发票图片中印章的位置分析发票图片的转置情况,翻转调整发生转置的发票图片。
8.如权利要求6所述的发票图片展示的方法,其特征在于,所述发票图片展示的方法还包括:
若侦测到显示的发票图片上的当前鼠标光标位置发生移动,则实时或者定时或者在鼠标光标位置移动结束后,侦测当前鼠标光标的最新位置,分析侦测的当前鼠标光标的最新位置对应的发票属性。
9.如权利要求6所述的发票图片展示的方法,其特征在于,所述预先训练好的模型为深度卷积神经网络模型,所述深度卷积神经网络模型的训练过程包括:
S11、分别为每一预设的发票类型准备预设数量的标注有对应的发票类型的发票图片样本;
S12、分别将每一预设的发票类型对应的发票图片样本分为第一比例的训练子集和第二比例的验证子集,将所有训练子集中的发票图片样本进行混合得到训练集,将所有验证子集中的发票图片样本进行混合得到验证集;
S13、利用所述训练集训练所述深度卷积神经网络模型;
S14、利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率,则训练结束,或者,若所述准确率小于预设准确率,则增加每一预设的发票类型对应的发票图片样本的数量,并重新执行上述步骤S12、S13及S14。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有发票图片展示程序,所述发票图片展示程序可被一个或者多个处理器执行,以实现如权利要求6至9任一项所述的发票图片展示的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910465876.6A CN110333813A (zh) | 2019-05-30 | 2019-05-30 | 发票图片展示的方法、电子装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910465876.6A CN110333813A (zh) | 2019-05-30 | 2019-05-30 | 发票图片展示的方法、电子装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110333813A true CN110333813A (zh) | 2019-10-15 |
Family
ID=68140598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910465876.6A Pending CN110333813A (zh) | 2019-05-30 | 2019-05-30 | 发票图片展示的方法、电子装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110333813A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461100A (zh) * | 2020-03-31 | 2020-07-28 | 重庆农村商业银行股份有限公司 | 一种票据识别方法、装置、电子设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013038460A1 (ja) * | 2011-09-16 | 2013-03-21 | 株式会社日立製作所 | 画像表示システム及びその方法 |
US20150135125A1 (en) * | 2013-11-12 | 2015-05-14 | Apple Inc. | Bubble loupes |
CN105830012A (zh) * | 2014-09-05 | 2016-08-03 | Lg电子株式会社 | 移动终端及其控制方法 |
CN106504280A (zh) * | 2016-10-17 | 2017-03-15 | 努比亚技术有限公司 | 一种浏览视频的方法及终端 |
CN107766809A (zh) * | 2017-10-09 | 2018-03-06 | 平安科技(深圳)有限公司 | 电子装置、票据信息识别方法和计算机可读存储介质 |
CN107958249A (zh) * | 2017-11-21 | 2018-04-24 | 众安信息技术服务有限公司 | 一种基于图像的文本录入方法 |
CN109324736A (zh) * | 2018-08-31 | 2019-02-12 | 阿里巴巴集团控股有限公司 | 局部放大图片的交互方法及装置 |
CN109815949A (zh) * | 2018-12-20 | 2019-05-28 | 航天信息股份有限公司 | 基于神经网络的发票公示方法和系统 |
-
2019
- 2019-05-30 CN CN201910465876.6A patent/CN110333813A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013038460A1 (ja) * | 2011-09-16 | 2013-03-21 | 株式会社日立製作所 | 画像表示システム及びその方法 |
US20150135125A1 (en) * | 2013-11-12 | 2015-05-14 | Apple Inc. | Bubble loupes |
CN105830012A (zh) * | 2014-09-05 | 2016-08-03 | Lg电子株式会社 | 移动终端及其控制方法 |
CN106504280A (zh) * | 2016-10-17 | 2017-03-15 | 努比亚技术有限公司 | 一种浏览视频的方法及终端 |
CN107766809A (zh) * | 2017-10-09 | 2018-03-06 | 平安科技(深圳)有限公司 | 电子装置、票据信息识别方法和计算机可读存储介质 |
CN107958249A (zh) * | 2017-11-21 | 2018-04-24 | 众安信息技术服务有限公司 | 一种基于图像的文本录入方法 |
CN109324736A (zh) * | 2018-08-31 | 2019-02-12 | 阿里巴巴集团控股有限公司 | 局部放大图片的交互方法及装置 |
CN109815949A (zh) * | 2018-12-20 | 2019-05-28 | 航天信息股份有限公司 | 基于神经网络的发票公示方法和系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461100A (zh) * | 2020-03-31 | 2020-07-28 | 重庆农村商业银行股份有限公司 | 一种票据识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103946836B (zh) | 使用非光栅地图数据的修改来渲染地图图像的方法和设备 | |
US9756140B2 (en) | Tracking user behavior relative to a network page | |
JP5324411B2 (ja) | 広告配信装置、方法及びプログラム | |
CN103930885B (zh) | 测量网页渲染时间 | |
CN104937525B (zh) | 使用滑动手势识别技术的内容操作 | |
US9977765B2 (en) | Information processing device, information processing method, information processing program, display control device, and display control program | |
US9934206B2 (en) | Method and apparatus for extracting web page content | |
CN106462559A (zh) | 任意大小内容项生成 | |
CN109803152A (zh) | 违规审核方法、装置、电子设备以及存储介质 | |
CA2861616A1 (en) | Method and system to provide a scroll map | |
CN112965645B (zh) | 页面拖拽方法、装置、计算机设备及存储介质 | |
CN107886300A (zh) | 看板卡片管理方法、装置、计算机设备和存储介质 | |
CN114357345A (zh) | 图片处理方法、装置、电子设备及计算机可读存储介质 | |
CN109587031A (zh) | 数据处理方法 | |
CN109101294A (zh) | 数据采集方法及插件、电子设备及存储介质 | |
KR101361410B1 (ko) | 웹 관리 장치, 웹 관리 방법, 웹 관리 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체, 및 웹 시스템 | |
CN110472166A (zh) | 用于显示页面的方法和装置 | |
CN107168635A (zh) | 信息呈现方法和装置 | |
CN114879869A (zh) | 笔记擦除方法、电子设备及计算机存储介质 | |
CN110333813A (zh) | 发票图片展示的方法、电子装置及计算机可读存储介质 | |
KR102303206B1 (ko) | 전자장치에서 이미지 내의 특정 객체를 인식하기 위한 방법 및 장치 | |
JP2013232225A (ja) | コンテンツ配信装置、コンテンツ配信方法、コンテンツ配信プログラム及び端末用プログラム | |
CN108874384A (zh) | 终端设备、服务器、网页数据处理方法和计算机存储介质 | |
US20150178281A1 (en) | Determining whether a user has seen a content item | |
CN105243138B (zh) | 信息推送方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191015 |