CN115909363A - 基于票据图像的票据种类确定方法、装置、设备及介质 - Google Patents

基于票据图像的票据种类确定方法、装置、设备及介质 Download PDF

Info

Publication number
CN115909363A
CN115909363A CN202211445766.1A CN202211445766A CN115909363A CN 115909363 A CN115909363 A CN 115909363A CN 202211445766 A CN202211445766 A CN 202211445766A CN 115909363 A CN115909363 A CN 115909363A
Authority
CN
China
Prior art keywords
bill
image
type
determined
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211445766.1A
Other languages
English (en)
Inventor
张舒沁
陈明浩
张�浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202211445766.1A priority Critical patent/CN115909363A/zh
Publication of CN115909363A publication Critical patent/CN115909363A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供一种基于票据图像的票据种类确定方法、装置、设备及介质。该方法包括:获取待确定种类的票据图像;对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像;根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类。本申请的方法,通过将一张票据图像划分为两个区域,实现对整张票据图像的种类确定,提高票据种类的确定精度。

Description

基于票据图像的票据种类确定方法、装置、设备及介质
技术领域
本申请涉及图像处理技术,尤其涉及一种基于票据图像的票据种类确定方法、装置、设备及介质。
背景技术
图像处理应用在生活中的方方面面,例如,可以通过图像处理技术对票据进行识别。但是,在对票据图像识别前,需要先确定票据的种类。若种类确定错误,则会影响票据图像的识别精度。
目前,需要人工对票据图像进行分类,便于对票据中有用信息进行识别和提取。但是,人工分类容易出现错误,票据种类的确定精度和效率较低。
发明内容
本申请提供一种基于票据图像的票据种类确定方法、装置、设备及介质,用以提高票据种类的确定精度和效率。
第一方面,本申请提供一种基于票据图像的票据种类确定方法,包括:
获取待确定种类的票据图像;
对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像;
根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类。
第二方面,本申请提供一种基于票据图像的票据种类确定装置,包括:
图像获取模块,用于获取待确定种类的票据图像;
区域划分模块,用于对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像;
种类确定模块,用于根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类。
第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如本申请第一方面所述的基于票据图像的票据种类确定方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本申请第一方面所述的基于票据图像的票据种类确定方法。
本申请提供的一种基于票据图像的票据种类确定方法、装置、设备及介质,通过对待确定种类的票据图像进行区域划分,得到多张区域图像。根据一张票据图像中的多张区域图像,确定整张票据图像所属的票据种类,实现在确定票据种类时,结合票据图像中多个区域中的信息,提高票据种类的确定精度。解决了现有技术中,人工进行分类所造成的分类精度和效率低的问题,节约人力和时间,提高票据种类的确定效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种基于票据图像的票据种类确定方法的流程示意图;
图2为本申请实施例提供的票据图像的区域划分范围示意图;
图3为本申请实施例提供的一种基于票据图像的票据种类确定方法的流程示意图;
图4为本申请实施例提供的一种基于票据图像的票据种类确定装置的结构框图;
图5为本申请实施例提供的一种基于票据图像的票据种类确定装置的结构框图;
图6为本申请实施例提供的一种电子设备的结构框图;
图7为本申请实施例提供的一种电子设备的结构框图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
需要注意的是,由于篇幅所限,本申请说明书没有穷举所有可选的实施方式,本领域技术人员在阅读本申请说明书后,应该能够想到,只要技术特征不互相矛盾,那么技术特征的任意组合均可以构成可选的实施方式。下面对各实施例进行详细说明。
图像处理已经应用到生活中的方方面面,例如,可以对票据的图像进行内容识别。但是,在对票据进行识别前,需要先进行票据种类的选择,错误的分类对后续的操作有巨大的影响。考虑到票据本身的特殊性,不能使用OCR(Optical Character Recognition,光学字符识别)对票据种类进行直接识别,需要人工进行分类,再对票据中有用信息进行识别和提取,录入到生成好的票据模板中。
但是,人工进行分类会浪费大量的人力和时间,分类的精度和效率较低。近年来,深度学习在解决语音识别、图像处理等方面表现出相当不错的处理能力。在不同类型的深度学习神经网络中,卷积神经网络得到了深入的研究和巨大的发展。如何利用卷积神经网络对票据种类进行识别,成为亟待解决的问题。
本申请提供的一种基于票据图像的票据种类确定方法、装置、设备及介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1是根据本申请实施例提供的一种基于票据图像的票据种类确定方法的流程示意图,该方法可以由一种基于票据图像的票据种类确定装置执行。如图1所示,该方法包括以下步骤:
S101、获取待确定种类的票据图像。
示例性地,可以通过图像采集设备获取各类票据的票据图像,例如,可以采用摄像头,对用户填写后的票据进行图像采集,得到票据图像。即,票据图像中可以包括用户所填写的内容,便于在确定票据图像的票据种类后,识别和提取票据图像中的信息。
可以对获取到的票据图像进行票据种类的确定,即,获取到的票据图像为待确定种类的票据图像。
S102、对待确定种类的票据图像进行区域划分,得到待确定种类的票据图像中的至少两个区域图像。
示例性地,在得到待确定种类的票据图像后,可以将票据图像划分为多个区域。例如,可以将票据图像划分为两个区域,分别为票据头部区域和票据数据部区域。票据头部区域可以是票据抬头部分的区域,票据数据部区域可以是票据中所填写的项目和金额等数据的区域。也可以根据票据的面积进行区域划分,例如,可以将票据图像的面积进行上下均分,划分出两个区域。
可以将整张票据图像划分出多个区域,也可以只对票据图像中的局部进行划分。例如,划分后的多个区域可以组合成一张完整的票据图像,也可以无法组合成一张完整的票据图像。在划分出多个区域后,每个区域所对应的局部的票据图像即为区域图像,即,得到待确定种类的票据图像中的至少两个区域图像。
本实施例中,对待确定种类的票据图像进行区域划分,得到待确定种类的票据图像中的至少两个区域图像,包括:根据预设的区域划分网络模型,对待确定种类的票据图像进行感兴趣区域的提取,得到待确定种类的票据图像的至少两个感兴趣区域;将待确定种类的票据图像中感兴趣区域的图像,确定为区域图像。
具体的,可以预设一个区域划分网络模型,区域划分网络模型用于将票据图像划分出多个区域,得到多个区域图像。例如,区域划分网络模型可以采用Faster-RCNN(FasterRegion CNN,更快区域卷积神经网络),对票据图像的各个特征区域进行目标检测。
可以预先采集标注好区域的图片,用Faster-RCNN训练出区域划分网络模型。例如,可以采集票据的样本图像,去除相似图片和模糊图片,经过数据增强对样本图像进行平移、翻转、旋转、裁剪、添加噪声等操作,增加训练的数据量,提高模型的泛化能力。对处理后的票据样本图像中需要划分出的区域进行数据标注,输入至区域划分网络模型中。区域划分网络模型中可以输出样本图像中的感兴趣区域,若输出的感兴趣区域与预先标注的区域一致,则确定区域划分网络模型训练完成。例如,感兴趣区域可以是票据图像中用户填写信息的区域,则区域划分网络模型可以识别出图像中用户所填写的信息的位置,将所填写的信息的位置所对应的一定范围作为感兴趣区域。
将待确定种类的票据图像输入至训练好的区域划分网络模型中,对待确定种类的票据图像进行感兴趣区域的提取,例如,可以根据票据图像的图像特征,确定票据图像中抬头信息所在的位置和金额数据所在的位置,将票据图像抬头所在的区域和填写金额位置处的所在区域提取为感兴趣区域。得到待确定种类的票据图像的至少两个感兴趣区域,并将感兴趣区域内的图像确定为区域图像。
这样设置的有益效果在于,通过区域划分网络模型,可以对票据图像的区域图像进行自动确定,提高区域划分的精度,即使不同种类的票据的格式不同,也可以得到想要的区域图像,提高票据种类的确定效率和精度。
本实施例中,对待确定种类的票据图像进行区域划分,得到待确定种类的票据图像中的至少两个区域图像,包括:根据预设的区域划分范围,从待确定种类的票据图像中提取至少两张局部图像,为待确定种类的票据图像中的区域图像。
具体的,可以预先确定需要划分出的区域在票据图像中所在的范围,作为区域划分范围。例如,区域划分范围包括两部分,分别为票据图像中上方三分之一的范围和下方三分之二的范围。图2为票据图像的区域划分范围示意图。图2中的虚线将票据图像划分出两个区域,虚线上方的区域占票据图像的三分之一,虚线下方的区域占票据图像的三分之二。
在得到待确定种类的票据图像后,从票据图像中提取预设区域划分范围内的图像,即,票据图像的局部图像,作为区域图像。区域划分范围中可以包括票据图像中的多个局部的范围,得到票据图像的多张局部图像,作为区域图像。
这样设置的有益效果在于,通过预设的区域划分范围,直接得到区域图像,提高区域图像的确定效率,且不需要预先训练区域划分网络模型,减少工作量。
S103、根据待确定种类的票据图像中的至少两个区域图像,确定待确定种类的票据图像所属的票据种类。
示例性地,在得到多张区域图像后,根据区域图像中的信息,确定待确定种类的票据图像所属的票据种类。例如,可以根据各张区域图像,确定每一张区域图像所属的票据种类,若各张区域图像所属的票据种类一致,则可以将区域图像所属的票据种类确定为待确定种类的票据图像所属的票据种类。若各张区域图像所属的票据种类不一致,则可以向用户发出提示信息,提示用户进行人工分类。
也可以划分出三张或三张以上的区域图像,确定各张区域图像分别所属的票据种类,根据各张区域图像分别所属的票据种类,确定待确定种类的票据图像所属的票据种类。例如,三张区域图像所属的票据种类分别为A类、A类和B类,则可以确定票据图像所属的票据种类为A类。
可以通过预先训练的神经网络模型,提取各张区域图像中的图像特征,根据图像特征确定区域图像所属的票据种类,实现对票据种类的自动确定。也可以识别区域图像中的关键字,根据预设的关键字与票据种类之间的关联关系,确定区域图像所属的票据种类。
本申请实施例提供的一种基于票据图像的票据种类确定方法,通过对待确定种类的票据图像进行区域划分,得到多张区域图像。根据一张票据图像中的多张区域图像,确定整张票据图像所属的票据种类,实现在确定票据种类时,结合票据图像中多个区域中的信息,提高票据种类的确定精度。解决了现有技术中,人工进行分类所造成的分类精度和效率低的问题,节约人力和时间,提高票据种类的确定效率。
图3为本申请实施例提供的一种基于票据图像的票据种类确定方法的流程示意图,该实施例是在上述实施例基础上的可选实施例。
本实施例中,根据待确定种类的票据图像中的至少两个区域图像,确定待确定种类的票据图像所属的票据种类,可细化为:根据待确定种类的票据图像中的至少两个区域图像,基于预设的神经网络模型,确定区域图像属于预设的每一票据种类的概率;根据区域图像属于预设的每一票据种类的概率,确定待确定种类的票据图像属于预设的每一票据种类的概率;根据待确定种类的票据图像属于预设的每一票据种类的概率,确定待确定种类的票据图像所属的票据种类。
如图3所示,该方法包括以下步骤:
S301、获取待确定种类的票据图像。
示例性地,本步骤可以参见上述步骤S101,不再赘述。
S302、对待确定种类的票据图像进行区域划分,得到待确定种类的票据图像中的至少两个区域图像。
示例性地,本步骤可以参见上述步骤S102,不再赘述。
S303、根据待确定种类的票据图像中的至少两个区域图像,基于预设的神经网络模型,确定区域图像属于预设的每一票据种类的概率。
示例性地,预先训练一个神经网络模型,神经网络模型可以用于确定图像的票据种类。例如,神经网络模型可以是CNN(Convolutional Neural Networks,卷积神经网络)模型,具体的,可以采用AlexNet网络模型作为神经网络的基础模型,考虑到运行测试耗时,将原先AlexNet网络中的全连接层用全局平均池化层替代。AlexNet网络模型使用8层网络结构,具有三个卷积层,两个池化层和三个全连接层。全局池化层是指,对最后一层特征图进行整张图的均值池化,形成一个特征点,减少了网络模型的参数,进而缩短了模型训练的计算量,并对整个网络起到了防止过拟合的作用。将网络中的全连接层用全局平均池化层替代,相对于传统的AlexNet网络模型算法,各个参数收敛速度显著提升,提高了模型运行速度。
神经网络模型中预先设置多种票据种类,例如,票据种类可以包括普通票据和专用票据等。神经网络模型对每一张区域图像进行特征提取,得到区域图像的图像特征,根据图像特征确定区域图像属于每一类票据种类的概率,即,确定区域图像属于每一类票据种类的可能性。例如,有三类票据种类,分别为A、B、C,一张票据图像被划分为两个区域,区域图像分别为图像一和图像二。通过神经网络模型,可以得到图像一属于A类的概率为70%,属于B类的概率为10%,属于C类的概率为20%;图像二属于A类的概率为60%,属于B类的概率为20%,属于C类的概率为20%。
本实施例中,根据待确定种类的票据图像中的至少两个区域图像,基于预设的神经网络模型,确定区域图像属于预设的每一票据种类的概率,包括:将待确定种类的票据图像中的至少两个区域图像,输入至预设的神经网络模型中;根据神经网络模型的卷积层和全局平均池化层,对区域图像进行特征提取,得到区域图像的特征向量;根据区域图像的特征向量,得到区域图像属于预设的每一票据种类的概率。
具体的,将一张票据图像的多张区域图像全部输入至预先训练的神经网络模型中,神经网络模型为多路并行的CNN模型。例如,有两张区域图像,则神经网络模型为双路并行CNN模型,每一路通道用于对其中一张区域图像进行图像处理,确定一张区域图像属于各票据种类的概率。神经网络模型的各路通道的神经网络结构可以相同,也可以不同,每一路通道中都可以包括卷积层、池化层和全连接层等。本实施例中,可以采用GAP(GlobalAverage Pooling,全局平均池化层)代替全连接层。根据神经网络模型的卷积层、池化层和全局平均池化层等,对区域图像进行特征提取,得到区域图像的特征向量。根据区域图像的特征向量,与各类票据种类的特征进行对比,得到区域图像属于每一票据种类的概率。
本实施例中,神经网络模型中可以包括多层卷积层,实现对特征向量的逐层提取。在使用神经网络模型前,对神经网络模型进行训练。例如,可以预先采集待训练的样本,对待训练的样本进行清洗和数据增强。再通过预设的损失函数,确定神经网络模型是否训练完成。
这样设置的有益效果在于,采用优化后的多路并行神经网络模型,通过卷积层、池化层和全局平均池化层获取区域图像对每一票据种类预测的概率,压缩模型大小,减少了模型计算量和模型运行时间,提高票据种类的确定效率。
S304、根据区域图像属于预设的每一票据种类的概率,确定待确定种类的票据图像属于预设的每一票据种类的概率。
示例性地,确定区域图像属于预设的每一票据种类的概率,对于一张票据图像的多张区域图像,各区域图像属于同一种票据种类的概率可能相同,也可能不同。根据一张票据图像中,各区域图像属于预设的每一票据种类的概率,确定该票据图像属于预设的每一票据种类的概率。例如,可以将一张票据图像中,各区域图像属于预设的每一票据种类的概率进行相加,得到该票据图像属于预设的每一票据种类的概率。即可以得到一张票据图像的多个概率结果,概率结果的数量与票据种类的数量一致。
本实施例中,根据区域图像属于预设的每一票据种类的概率,确定待确定种类的票据图像属于预设的每一票据种类的概率,包括:根据区域图像属于预设的每一票据种类的概率,基于预设的区域图像的权重,得到待确定种类的票据图像属于预设的每一票据种类的概率。
具体的,可以预先为票据图像中的每一区域设置权重,例如,将票据图像划分为票据头部区域和票据数据部区域,票据头部区域的权重为0.7,票据数据部区域的权重为0.3,即票据头部区域的区域图像的权重为0.7,票据数据部区域的区域图像的权重为0.3。根据区域图像属于预设的每一票据种类的概率和各区域图像的权重,对区域图像属于预设的每一票据种类的概率进行加权求和,得到待确定种类的票据图像属于预设的每一票据种类的概率。
例如,票据头部区域的区域图像属于A类的概率为0.8,票据数据部区域的区域图像属于A类的概率为0.6,票据头部区域的区域图像的权重为0.7,票据数据部区域的区域图像的权重为0.3,则可以确定票据图像属于A类的概率为0.8×0.7+0.6×0.3,即票据图像属于A类的概率为0.74。
这样设置的有益效果在于,通过结合票据图像的多张区域图像,实现对票据图像的全面考虑,利用票据图像中各个区域的特征对票据图像类型识别的影响不一样,对每块区域图像的概率进行计算,最终实现票据种类的预测,达到提高票据种类识别准确率的目的。
S305、根据待确定种类的票据图像属于预设的每一票据种类的概率,确定待确定种类的票据图像所属的票据种类。
示例性地,在得到票据图像对于每种票据种类的概率后,根据票据图像对于每种票据种类的概率的大小,确定票据图像最终所属的票据种类。
本实施例中,根据待确定种类的票据图像属于预设的每一票据种类的概率,确定待确定种类的票据图像所属的票据种类,包括:将待确定种类的票据图像属于各票据种类的概率进行排序,将位于预设排序位置处的概率所对应的票据种类,确定为待确定种类的票据图像所属的票据种类。
具体的,将待确定种类的票据图像属于各票据种类的概率进行大小排序,可以由大至小进行排序,也可以由小至大进行排序。预设一个排序位置,例如,将概率由大至小进行排序,预设的排序位置为排在第一位的位置。确定位于预设排序位置处的概率所对应的票据种类,将该票据种类确定为待确定种类的票据图像所属的票据种类。即,将最大概率所对应的票据种类确定为待确定种类的票据图像所属的票据种类。例如,票据图像属于A类的概率为60%,属于B类的概率为15%,属于C类的概率为25%,则该票据图像的票据种类为A类。
这样设置的有益效果在于,通过对概率值进行排序,可以快速找到符合要求的概率值,从而得到待确定种类的票据图像所属的票据种类,提高票据种类的确定效率。
本申请实施例提供的一种基于票据图像的票据种类确定方法,通过对待确定种类的票据图像进行区域划分,得到多张区域图像。根据一张票据图像中的多张区域图像,确定整张票据图像所属的票据种类,实现在确定票据种类时,结合票据图像中多个区域中的信息,提高票据种类的确定精度。解决了现有技术中,人工进行分类所造成的分类精度和效率低的问题,节约人力和时间,提高票据种类的确定效率。
图4为本申请实施例提供的一种基于票据图像的票据种类确定装置的结构框图。为了便于说明,仅示出了与本公开实施例相关的部分。参照图4,所述装置包括:图像获取模块401、区域划分模块402和种类确定模块403。
图像获取模块401,用于获取待确定种类的票据图像;
区域划分模块402,用于对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像;
种类确定模块403,用于根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类。
图5为本申请实施例提供的一种基于票据图像的票据种类确定装置的结构框图,在图4所示实施例的基础上,如图5所示,种类确定模块403包括第一确定单元4031、第二确定单元4032和第三确定单元4033。
第一确定单元4031,用于根据所述待确定种类的票据图像中的至少两个区域图像,基于预设的神经网络模型,确定所述区域图像属于预设的每一票据种类的概率;
第二确定单元4032,用于根据所述区域图像属于预设的每一票据种类的概率,确定所述待确定种类的票据图像属于预设的每一票据种类的概率;
第三确定单元4033,用于根据所述待确定种类的票据图像属于预设的每一票据种类的概率,确定所述待确定种类的票据图像所属的票据种类。
一个示例中,第一确定单元4031,具体用于:
将所述待确定种类的票据图像中的至少两个区域图像,输入至预设的神经网络模型中;
根据所述神经网络模型的卷积层和全局平均池化层,对所述区域图像进行特征提取,得到所述区域图像的特征向量;
根据所述区域图像的特征向量,得到所述区域图像属于预设的每一票据种类的概率。
一个示例中,第二确定单元4032,具体用于:
根据所述区域图像属于预设的每一票据种类的概率,基于预设的所述区域图像的权重,得到所述待确定种类的票据图像属于预设的每一票据种类的概率。
一个示例中,第三确定单元4033,具体用于:
将所述待确定种类的票据图像属于各票据种类的概率进行排序,将位于预设排序位置处的概率所对应的票据种类,确定为所述待确定种类的票据图像所属的票据种类。
一个示例中,区域划分模块402,包括:
区域提取单元,用于根据预设的区域划分网络模型,对所述待确定种类的票据图像进行感兴趣区域的提取,得到所述待确定种类的票据图像的至少两个感兴趣区域;
图像确定单元,用于将所述待确定种类的票据图像中感兴趣区域的图像,确定为所述区域图像。
一个示例中,区域划分模块402,包括:
范围划分单元,用于根据预设的区域划分范围,从所述待确定种类的票据图像中提取至少两张局部图像,为所述待确定种类的票据图像中的区域图像。
图6为本申请实施例提供的一种电子设备的结构框图,如图6所示,电子设备包括:存储器61,处理器62;存储器61,用于存储处理器62可执行指令的存储器。
其中,处理器62被配置为执行如上述实施例提供的方法。
电子设备还包括接收器63和发送器64。接收器63用于接收其他设备发送的指令和数据,发送器64用于向外部设备发送指令和数据。
图7是根据一示例性实施例示出的一种电子设备的结构框图,该设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
设备700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)接口712,传感器组件714,以及通信组件716。
处理组件702通常控制设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在设备700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为设备700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为设备700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述设备700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为设备700提供各个方面的状态评估。例如,传感器组件714可以检测到设备700的打开/关闭状态,组件的相对定位,例如所述组件为设备700的显示器和小键盘,传感器组件714还可以检测设备700或设备700一个组件的位置改变,用户与设备700接触的存在或不存在,设备700方位或加速/减速和设备700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于设备700和其他设备之间有线或无线方式的通信。设备700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由设备700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行上述终端设备的基于票据图像的票据种类确定方法。
本申请还公开了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如本实施例中所述的方法。
本申请以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或电子设备上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据电子设备)、或者包括中间件部件的计算系统(例如,应用电子设备)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和电子设备。客户端和电子设备一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-电子设备关系的计算机程序来产生客户端和电子设备的关系。电子设备可以是云电子设备,又称为云计算电子设备或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。电子设备也可以为分布式系统的电子设备,或者是结合了区块链的电子设备。应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种基于票据图像的票据种类确定方法,其特征在于,包括:
获取待确定种类的票据图像;
对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像;
根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类。
2.根据权利要求1所述的方法,其特征在于,根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类,包括:
根据所述待确定种类的票据图像中的至少两个区域图像,基于预设的神经网络模型,确定所述区域图像属于预设的每一票据种类的概率;
根据所述区域图像属于预设的每一票据种类的概率,确定所述待确定种类的票据图像属于预设的每一票据种类的概率;
根据所述待确定种类的票据图像属于预设的每一票据种类的概率,确定所述待确定种类的票据图像所属的票据种类。
3.根据权利要求2所述的方法,其特征在于,根据所述待确定种类的票据图像中的至少两个区域图像,基于预设的神经网络模型,确定所述区域图像属于预设的每一票据种类的概率,包括:
将所述待确定种类的票据图像中的至少两个区域图像,输入至预设的神经网络模型中;
根据所述神经网络模型的卷积层和全局平均池化层,对所述区域图像进行特征提取,得到所述区域图像的特征向量;
根据所述区域图像的特征向量,得到所述区域图像属于预设的每一票据种类的概率。
4.根据权利要求2所述的方法,其特征在于,根据所述区域图像属于预设的每一票据种类的概率,确定所述待确定种类的票据图像属于预设的每一票据种类的概率,包括:
根据所述区域图像属于预设的每一票据种类的概率,基于预设的所述区域图像的权重,得到所述待确定种类的票据图像属于预设的每一票据种类的概率。
5.根据权利要求2所述的方法,其特征在于,根据所述待确定种类的票据图像属于预设的每一票据种类的概率,确定所述待确定种类的票据图像所属的票据种类,包括:
将所述待确定种类的票据图像属于各票据种类的概率进行排序,将位于预设排序位置处的概率所对应的票据种类,确定为所述待确定种类的票据图像所属的票据种类。
6.根据权利要求1所述的方法,其特征在于,对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像,包括:
根据预设的区域划分网络模型,对所述待确定种类的票据图像进行感兴趣区域的提取,得到所述待确定种类的票据图像的至少两个感兴趣区域;
将所述待确定种类的票据图像中感兴趣区域的图像,确定为所述区域图像。
7.根据权利要求1所述的方法,其特征在于,对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像,包括:
根据预设的区域划分范围,从所述待确定种类的票据图像中提取至少两张局部图像,为所述待确定种类的票据图像中的区域图像。
8.一种基于票据图像的票据种类确定装置,其特征在于,包括:
图像获取模块,用于获取待确定种类的票据图像;
区域划分模块,用于对所述待确定种类的票据图像进行区域划分,得到所述待确定种类的票据图像中的至少两个区域图像;
种类确定模块,用于根据所述待确定种类的票据图像中的至少两个区域图像,确定所述待确定种类的票据图像所属的票据种类。
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-7中任一项所述的基于票据图像的票据种类确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7中任一项所述的基于票据图像的票据种类确定方法。
CN202211445766.1A 2022-11-18 2022-11-18 基于票据图像的票据种类确定方法、装置、设备及介质 Pending CN115909363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211445766.1A CN115909363A (zh) 2022-11-18 2022-11-18 基于票据图像的票据种类确定方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211445766.1A CN115909363A (zh) 2022-11-18 2022-11-18 基于票据图像的票据种类确定方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN115909363A true CN115909363A (zh) 2023-04-04

Family

ID=86492736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211445766.1A Pending CN115909363A (zh) 2022-11-18 2022-11-18 基于票据图像的票据种类确定方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115909363A (zh)

Similar Documents

Publication Publication Date Title
CN108629354B (zh) 目标检测方法及装置
CN109871896B (zh) 数据分类方法、装置、电子设备及存储介质
WO2023087741A1 (zh) 缺陷检测方法及装置、电子设备、存储介质及计算机程序产品
CN110009090B (zh) 神经网络训练与图像处理方法及装置
US11443438B2 (en) Network module and distribution method and apparatus, electronic device, and storage medium
US11455491B2 (en) Method and device for training image recognition model, and storage medium
US20210097278A1 (en) Method and apparatus for recognizing stacked objects, and storage medium
CN107944447B (zh) 图像分类方法及装置
CN111464716B (zh) 一种证件扫描方法、装置、设备及存储介质
CN110619350B (zh) 图像检测方法、装置及存储介质
CN109446961B (zh) 姿势检测方法、装置、设备及存储介质
CN109871843B (zh) 字符识别方法和装置、用于字符识别的装置
CN110674719A (zh) 目标对象匹配方法及装置、电子设备和存储介质
CN111461182A (zh) 图像处理方法、图像处理装置及存储介质
CN110751659A (zh) 图像分割方法及装置、终端、存储介质
CN111062401A (zh) 堆叠物体的识别方法及装置、电子设备和存储介质
CN112884040B (zh) 训练样本数据的优化方法、系统、存储介质及电子设备
CN111274444B (zh) 视频封面确定模型的生成方法及装置、视频封面确定方法及装置
CN117671669A (zh) 图像识别方法、装置、电子设备及可读存储介质
CN112036307A (zh) 图像处理方法及装置、电子设备和存储介质
CN112381091A (zh) 视频内容识别方法、装置、电子设备及存储介质
CN105653623B (zh) 图片收集方法及装置
CN111797746A (zh) 人脸识别方法、装置及计算机可读存储介质
CN111428806A (zh) 图像标签确定方法、装置、电子设备及存储介质
CN116541238A (zh) 日志文件采集方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination