CN113780116A - 发票分类方法、装置、计算机设备和存储介质 - Google Patents
发票分类方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113780116A CN113780116A CN202110987139.XA CN202110987139A CN113780116A CN 113780116 A CN113780116 A CN 113780116A CN 202110987139 A CN202110987139 A CN 202110987139A CN 113780116 A CN113780116 A CN 113780116A
- Authority
- CN
- China
- Prior art keywords
- invoice
- processed
- image
- picture
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 claims description 84
- 238000004590 computer program Methods 0.000 claims description 29
- 238000010801 machine learning Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/04—Billing or invoicing
Abstract
本申请涉及一种发票分类方法、装置、计算机设备和存储介质。所述方法包括:获取待处理发票图片;对所述待处理发票图片进行图像码识别;当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;根据所述分类字符对所述待处理发票图片进行分类。采用本方法能够快速将某一类发票从大量发票图片中分离出来。
Description
技术领域
本申请涉及人工智能图像技术领域,特别是涉及一种电子发票分类方法、装置、计算机设备和存储介质。
背景技术
电子发票作为消费者消费的有效凭证,相比传统的纸质发票,它具有互通性、无纸化以及实名制的基本特点,且开具更为迅速,查询真伪更为方便,也便于保存。因此,电子发票获得了广泛的推广与应用。
在当前实际保险业务场景下,用户会上传手机拍摄的发票照片作为理赔凭证,即便是电子发票,也会通过打印出来进行拍摄或者直接上传发票截图来进行提交。但对于处理电子发票和普通发票识别问题的方法是不同的,电子发票可以通过识别发票上的二维码迅速获得发票的关键信息,准确率高,而普通发票只能通过传统OCR等技术来获得发票信息,准确率相对较低。如何从大量的发票中将电子发票分离出来用于后续发票信息识别成为一个非常有意义的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够快速对大量发票进行分类的发票分类方法、装置、计算机设备和存储介质。
一种发票分类方法,所述方法包括:
获取待处理发票图片;
对所述待处理发票图片进行图像码识别;
当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;
根据所述分类字符对所述待处理发票图片进行分类。
在其中一个实施例中,所述对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符,包括:
对所述待处理发票图片进行分割以得到表头区域;
识别所述表头区域中的分类字符。
在其中一个实施例中,所述对所述待处理发票图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,所述表头检测模型的训练方式包括:
读取第一发票图像,并标记所述第一发票图像中表头位置;
根据所述第一发票图像和对应的所述表头位置进行训练得到表头检测模型。
在其中一个实施例中,所述识别所述表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,所述文字识别模型的训练方式包括:
随机生成不同长度的文本切片,并标记所述文本切片的文本内容;
根据所述不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
在其中一个实施例中,所述根据所述分类字符对所述待处理发票图片进行分类,包括:
获取所述分类字符所对应的发票分类作为所述待处理发票图片的分类。
在其中一个实施例中,所述对所述待处理发票图片进行图像码识别是通过预先训练的图像码检测模型得到的;其中,所述图像码检测模型的训练方式包括:
读取第二发票图像,并根据所述第二发票图像是否含有图像码生成目标标记;
根据所述第二发票图像和所述目标标记进行模型训练得到图像码检测模型。
一种发票分类装置,所述装置包括:
接收模块,用于获取待处理发票图片;
图像码检测模块,用于判断待处理发票图片中是否含有图像码;
分类字符识别模块,用于当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;
分类模块,用于根据所述分类字符对所述待处理发票图片进行分类。
在其中一个实施例中,所述分类字符识别模块包括:
表头检测单元,用于对所述待处理发票图片进行分割以得到表头区域待;
文字识别单元,用于识别所述表头区域中的分类字符。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
上述电子发票分类方法、装置、计算机设备和存储介质,首先通过获取待处理发票图片,并对发票图片进行图像码识别判断该发票图片中是否含有图像码,若是则进入下一步检测,否则就及时结束判别过程,这样就能起到节省程序耗时的目的;当识别到图像码时,进一步识别发票图片中的分类字符,并根据分类字符对发票图片进行分类,从而能够根据分类字符快速地在大量发票中对发票进行分类,以为后续对不同类型的发票进行不一样的处理奠定基础。
附图说明
图1为一个实施例中发票分类方法的应用环境图;
图2为一个实施例中发票分类方法的流程示意图;
图3为一个实施例中对待处理发票图片进行识别以得到待处理发票图片中的分类字符步骤的流程示意图;
图4为一个实施例中发票图片示意图;
图5为一个实施例中预先训练表头检测模型的流程示意图;
图6为一个实施例中预先训练文字识别模型的流程示意图;
图7为一个实施例中预先训练图像码检测模型的流程示意图;
图8为一个实施例中一种电子发票分类方法的流程示意图;
图9为一个实施例中一种发票分类装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的发票分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以将获取待处理发票图片发送到服务器104,从而服务器104可以对该待处理发票图片进行处理,例如服务器104判断该待处理发票图片中是否包含图像码,若待处理发票图片中包含图像码时,则进入下一步检测,否则就及时结束判别过程,这样就能起到节省程序耗时的目的;当待处理发票图片中含有图像码时进行下一步检测,识别待处理发票图片中的分类字符,并根据分类字符对当前该待处理发票图片进行分类。这样可以实现从大量发票中快速的进行发票分类。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种发票分类方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取待处理发票图片。
其中,待处理发票图片是服务器接收的与终端上传的发票照片,该待处理发票图片可以是由终端上传的电子发票的截图,也可以是拍摄的打印出来的电子发票或是拍摄的普通发票。例如,终端可以根据需要从终端中选取部分或全部的待处理发票图片并上传至服务器,这样服务器可根据指令对待处理发票图片进行分类。当待处理发票图片为电子发票图片,则服务器可以通过识别电子发票图片上的二维码迅速获得发票的关键信息,准确率高。当待处理发票图片为普通发票图片,则服务器通过OCR等技术来获得发票信息。
步骤204,对待处理发票图片进行图像码识别。
其中,图像码是指包括发票信息的可识别的条码,其可以是一维码、二维码或者是条形码。
具体地,服务器获取用户上传的待识别发票图像后,判断待识别发票图像中是否包含图像码,以便对待识别发票图像进行下一步处理。
可选地,服务器获取终端上传的待识别发票图像后,使用图像码检测模型对该待识别发票图像进行识别以判断是否包含图像码,若包括图像码则进入下一个处理步骤进行识别,否则就及时结束判断过程,起到节省程序耗时的目的。
需要说明的一点是,发票分类包括但不限于电子发票和普通发票,其中电子发票和普通发票可以根据发票中的分类字符进行分类,但是由于对字符进行识别耗时较大,因此本实施例中,服务器先通过判断待处理发票图片中是否包括图像码以对待处理发票进行初始分类,从而过滤掉大部分普通发票,进而再对剩余的待处理发票图片进行字符识别,这样减少了字符识别的待处理发票的数量,从而提高了整个分类流程的效率。
步骤206,当识别到图像码时,对待处理发票图片进行识别以得到待处理发票图片中的分类字符。
其中,分类字符是指对发票图片分类的特定的字符,例如电子发票中在表头区域存在“电子”两个字,而普通发票中则不存在。因此服务器可以通过识别特定区域中的分类字符,并根据特定区域中的分类字符对用户上传的待识别的发票图像进行分类。
其中,服务器在判定待处理发票图片中存在图像码后,则继续对该待处理发票进行分类字符识别,若是识别到分类字符,则根据分类字符对待处理发票进行分类。
可选地,服务器检测到用户上传的待处理发票图片后,对该待处理发票图片进行分割,得到该待处理发票图片的特定区域,例如表头区域,并将表头区域裁剪出来得到相应的表头切片,然后识别表头切片中所包含的分类字符。这样仅对表头区域的字符进行识别,又进一步减少了字符识别的数量,提高了处理效率。
步骤208,根据分类字符对待处理发票图片进行分类。
具体地,服务器根据当前待处理发票图片的表头区域文字中的分类字符对发票图片进行分类。
可选地,分类字符可以是有一个也可以是多个,例如服务器可以根据“电子”二字对待处理的发票图片进行分类,也可以根据“电子”和“医疗”两个分类字符对待处理的发票图片进行分类。具体地,当服务器判定分类字符为“电子”时,则将对应的待处理发票分类为电子发票,否则分类普通发票。
其中,还需要说明的一定是,当服务器接收到的待处理发票的数量较多时,可以通过负载均衡的方式将待处理发票分配至不同的线程进行处理。此外线程还可以分为图像码检测线程,分类字符识别线程等,通过不同的线程来并行处理不同的步骤,提高处理效率。
上述电子发票分类方法中,首先通过获取待处理发票图片,并对发票图片进行图像码识别判断该发票图片中是否含有图像码,若是则进入下一步检测,否则就及时结束判别过程,这样就能起到减少程序耗时地目的;当识别到图像码时,进一步识别发票图片中的分类字符,并根据分类字符对发票图片进行分类,从而能够根据分类字符快速地在大量发票中对发票进行分类,为后续不同类型的发票进行处理奠定基础。
在其中一个实施例中,如图3所示,图3为图2所示实施例中的步骤206的步骤流程,该步骤206,具体地对待处理发票图片进行识别以得到待处理发票图片中的分类字符,包括以下步骤:
步骤302:对待处理发票图片进行分割以得到表头区域。
具体地,待处理发票图片中包括表格区域和表头区域,具体地,可以参见图4所示,其中表头区域是指位于待处理发票图片的顶部中间位置的区域。剩余的区域则为表格区域。
服务器通过对待处理发票图片进行分割以得到表头区域,可选地,服务器可以通过预先训练得到的表头检测模型对待处理发票图片进行分割得到表头区域,或者是通过对应的图像识别规则对待处理发票图片进行分割得到表头区域。
服务器对已识别到图像码的待处理发票图片进行定位检测,服务器定位到当前待处理发票图片的表头位置后,对当前待处理发票图片进行分割得到发票图片表头区域。其中可选地,为了避免误差,服务器可以将识别得到的表头区域向外延伸预设像素,例如5个像素,然后对延伸预设像素后的表头区域进行裁剪得到目标表头区域。
步骤304:识别表头区域中的分类字符。
具体地,分类字符是指对发票图片分类的特定的字符。
服务器获得目标表头区域后,对目标表头区域进行识别,读取目标表头区域中包含的文本内容,其中文本内容包括分类字符和其他字符。可选地,服务器可以仅识别读取到分类字符即可,以减少字符的识别量,例如服务器对表头区域进行识别以判断表头区域是否包括分类字符“电子”。
在上述实施例中,由于服务器可以识别待处理发票图片中表头区域的文字,并根据发票表头区域文字中所包括地分类字符对识别发票图片进行分类,从而避免对发票图片进行人工分类造成大量时间损耗。
在其中一个实施例中,如图5所示,图5为一个实施例中的表头检测模型训练步骤的步骤流程,待处理发票图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,表头检测模型的训练方式包括以下步骤:
步骤502:读取第一发票图像,并标记第一发票图像中表头位置。
具体地,表头检测模型是指用于获取发票图片表头区域的机器学习模型,训练完成后的表头检测模型可快速地对待处理发票图像进行分割以得到表头区域;第一发票图像是指用于训练表头检测模型的发票图像数据,其可以是包括表头的任意发票图片。
其中,用户预先对每一张第一发票图像中的表头位置进行标记,这样服务器可以获取到标记了表头位置的第一发票图像,该第一发票图像携带有标记的表头标签。
步骤504:根据第一发票图像和对应的表头位置进行训练得到表头检测模型。
服务器将第一发票图像及对应的表头位置输入至第一机器学习模型,其中,第一机器学习模型是指可以获取图像中某一区域定位的机器学习模型,其中可选地,第一机器学习模型可选择EAST(An Efficient and Accurate Scene Text Detector,一种文字检测模型)、DBNet(Differentiable Binarization Network,一种文字检测模型)等模型,该第一机器学习模型通过对大量第一发票图像及其对应的表头位置进行训练学习,得到能够对待处理发票图像进行识别以获得相应表头区域的表头检测模型。
服务器在在判定待处理发票图片中存在图像码后,通过表头检测模型对当前待处理发票图片的表头区域进行定位,并对待处理发票图片进行分割得到相应的表头切片。
在上述实施例中,由于通过训练得到了检测第一发票图片的表头检测模型,可快速自动识别发票表头位置,这样通过表头检测模型能够更快速、更准确地对发票图片表头进行识别。
在其中一个实施例中,如图6所示,图6为一个实施例中的文字识别模型训练步骤的步骤流程,识别表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,文字识别模型的训练方式包括以下步骤:
步骤602:随机生成不同长度的文本切片,并标记文本切片的文本内容。
具体地,文字识别模型是指用于读取发票表头区域文字内容的机器学习模型,训练完成后的文字识别模型可快速读取待处理发票图像中表头切片的文本内容,随机生成的不同长度的文本切片是指用于训练文字识别模型的文本切片数据,其中由于现实世界中各省各地区的发票表头文字长度不是固定的,例如“天津市医疗门诊收费票据”和“广东省医疗收费票据”,因此服务器在随机生成训练数据时其长度也是按一定规则随机变化的,例如均等地生成不同长度的文本切片,或者是根据文字识别模型的应用地区中所涉及的发票的表头中文字的多少来生成对应长度的文本切片,而不是每一种长度都生成。
服务器随机生成一系列不同长度的文本切片,并读取每一个文本切片中的文本内容对相应的文本切片进行标记,其中不同长度的文本切片为文字识别模型训练集样本,对应的文本内容为样本标签。
步骤604:根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
服务器将一系列不同长度的文本切片及其对应的文本内容标签输入至第二机器学习模型,其中第二机器学习模型是指可以识别图像中内容文本的机器学习模型,其中可选地,第二机器学习模型可选择CRNN(Convolutional Recurrent Neural Network,卷积循环神经网络)等模型,该第二机器学习模型通过对一系列不同长度的文本切片和对应的文本内容进行训练学习,得到能够识别待处理发票图像进行识别以得到表头区域内容的文字识别模型。
服务器通过预先训练的表头检测模型对待处理发票图片进行识别后分割得到相应的表头切片,再通过预先训练的文字识别模型对表头切片进行识别,得到待处理发票图片表头切片的文本内容。
在上述实施例中,由于通过训练得到了文字识别模型,文字识别模型可快速、准确的读取发票图片中的文本内容,从而避免了人工读取发票图片中包含的文本内容,节省人力资源开销。
在其中一个实施例中,根据分类字符对待处理发票图片进行分类,包括:获取分类字符所对应的发票分类作为待处理发票图片的分类。
具体地,服务器根据文字识别模型所识别的分类字符对待处理的发票图片进行分类,其中分类字符是指对发票图片分类的特定的字符,可根据不同的应用场景进调整。
可选地,分类字符可以是有一个也可以是多个,例如服务器可以根据“电子”二字对待处理的发票图片进行分类,也可以根据“电子”和“医疗”两个分类字符对待处理的发票图片进行分类。具体地,当服务器判定分类字符为“电子”时,则将对应的待处理发票分类为电子发票,否则分类普通发票。
服务器通过预先训练的表头检测模型对待处理发票图片进行识别后分割得到相应的表头切片,再通过预先训练的文字识别模型对表头切片进行识别,得到待处理发票图片表头区域的文本内容,然后根据待处理发票图片表头区域的文本内容中所包括的分类字符对待处理发票图片进行分类。
在上述实施例中,由于服务器可根据文字识别模型所识别的发票图片表头切片中的分类字符对发票图片进行分类,从而能够依据分类字符快速、准确地对大量发票进行分类,用于后续发票图片识别。
在其中一个实施例中,如图7所示,图7为一个实施例中预先训练的图像码检测模型步骤流程图,该图像码检测模型包括以下步骤:
步骤702:读取第二发票图像,并根据第二发票图像是否含有图像码生成目标标记。
具体地,图像码检测模型是指用于判断待处理发票图片中是否包括图像码的机器学习模型,训练完成后的图像码检测模型可快速地对待处理发票图片进行识别判断是否包括图像码;图像码是指包括发票信息的可识别的条形码,其可以是一维码、二维码或者是条形码。
服务器读取每一张第二发票图像,并对每一张第二发票是否包括图像码生成目标标记,可选地其目标标记可以是“1”或“0”,若第二发票图像中包含图像码,则第二图像的目标标记为“1”否则为“0”,其中第二发票为图像码检测模型的样本,对应的目标标记为样本标签。
可选地,第二发票可以是真实的发票图像,其数据更为真实,使训练的图像码检测模型能够对图像码的识别更为准确,也可以是服务器通过图像生成方式将图像码经过处理后贴在发票图像上生成的,其中空间处理的目的是为是更贴近真实的发票图片,若第二图像为图像生成方式生成的,则可以直接得到图像码的坐标,更加方便快捷。
步骤704:根据第二发票图像和目标标记进行模型训练得到图像码检测模型。
服务器将第二发票图像及对应的目标标记输入至第三机器学习模型,其中第三机器学习模型是指可以识别发票图片中是否含有图像码的机器学习模型,其中可选地,第三机器学习模型可以选择YOLO(You Only Look Once,一个对象检测算法)系列模型、FasterR-CNN(Faster Convolutional Recurrent Neural Network,区域卷积神经网络)和MaskR-CNN(Mask Convolutional Recurrent Neural Network,一个实例分割框架)等模型,该第三机器学习模型通过对第二发票图像及对应的目标标记进行训练学习,得到能够识别待处理发票图像进行识别是否包括图像码的图像码检测模型。
服务器通过预先训练的图像码检测模型对待处理发票图片进行识别以判断待处理发票图片是否包括图像码,若包括图像码则将当前待处理发票图片发送至表头训练模型,否则就及时结束判断过程,起到节省程序耗时的目的。
在上述实施例中,由于使用了图像码检测模型可以快速对待识别的发票图像进行判断是否含有图像码,服务器可及时对没有含有图像码的待识别发票对象结束判别过程,从而过滤掉大部分普通发票,起到减少程序耗时的目的。
在其中一个实施例中,如图8所示,一种电子发票分类方法的判别过程如下:
服务器首先获取待处理发票图片,其中待处理发票图片可以是终端上传的电子发票或者是普通发票;然后,通过二维码检测模型对待测发票图片进行检测,判断当前待处理发票图片是否包括二维码,若当前待处理发票图片包括二维码则进入表头检测模型进行下一步检测,否则就立刻结束判别过程,将当前待处理发票图片判定为普通发票;通过表头检测模型对包括二维码的待处理发票图片进行定位,获取当前待处理发票图片的表头区域,并对该表头区域进行分割得到相应的表头切片,随后用过文字识别模型读取表头切片中的文本内容,并对文本内容判断是否含有“电子”二字,其中“电子”二字为电子发票分类方法的分类字符,若当前待处理发票图片中含有“电子”二字则判定为电子发票,否则为普通发票。
其中,二维码检测模型、表头检测模型和文字识别模型是通过预先进行训练获得的,分别用于对待处理发票图像进行判断是否包括二维码、对待处理发票进行定位识别发票表头区域并进行分割得到发票表头切片和对发票表头切片进行文字识别获取发票表头切片中的分类字符。
在上述实施例中,电子发票分类方法首先使用二维码检测模型对待测发票图片进行检测,并对含有二维码的发票图片使用表头检测模型和文字识别模型获得并读取待处理发票图片中的表头切片及切片中的文本内容,最后根据分类字符即“电子”对待处理发票图片进行分类,可将电子发票从大量发票中分离出来,以为后续对不同类型的发票进行不一样的处理奠定基础。其中,二维码检测模型可对没有含有二维码的待识别发票图像及时结束判别过程,这样就能节省程序耗时的目的,从而能够更快速的对待识别的发票图像进行分类。
应该理解的是,虽然图1-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种发票分类装置,包括:接收模块100、图像码检测模块200、图像识别模块300、分类模块400,其中:
接收模块100,用于获取待处理发票图片;
图像码检测模块200,用于判断待处理发票图片中是否含有图像码;
分类字符识别模块300,用于当识别图像码时,对待处理发票图片进行识别以得到待处理发票图片中的分类字符;
分类模块400,用于根据分类字符对待处理发票图片进行分类。
在其中一个实施例中,上述分类字符识别模块300包括:
表头检测单元,用于对待处理发票图片进行分割以得到表头区域;
文字识别单元,用于识别表头区域中的分类字符。
在其中一个实施例中,上述表头检测单元用于通过预先训练的表头检测模型对待处理发票图片进行分割以得到表头区域;上述发票分类装置还包括:
第一图像获取子模块,用于读取第一发票图像,并标记第一发票图像中表头位置;
表头检测子模块,用于根据第一发票图像和对应的表头位置进行训练得到表头检测单元。
在其中一个实施例中,上述文字识别单元用于通过预先训练的文字检测模型识别表头区域中的分类字符;上述发票分类装置还包括:
数据获取子模块:用于随机生成不同长度的文本切片,并标记文本切片的文本内容;
文字识别子模块,用于根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别单元。
在其中一个实施例中,上述分类模块400包括:
接收单元,用于接收待处理图片中包括的分类字符;
分类单元,用于根据分类字符所对应的发票分类作为待处理发票图片的分类。
在其中一个实施例中,上述图像码检测模块用于通过预先训练的图像码检测模型判断待处理发票图片中是否含有图像码;上述发票分类装置还包括:
第二图像获取子模块,用于读取第二发票图像,并根据第二发票图像是否含有图像码生成目标标记;
图像码检测子模块,用于根据第二发票图像和目标标记进行模型训练得到图像码检测模块。
关于一种发票分类装置的具体限定可以参见上文中对于发票分类方法的限定,在此不再赘述。上述一种发票分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待识别发票图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种发票分类方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待处理发票图片;对待处理发票图片进行图像码识别;当识别到图像码时,对待处理发票图片进行识别以得到待处理发票图片中的分类字符;根据分类字符对待处理发票图片进行分类。
在一个实施例中,处理器执行计算机程序时所实现的对待处理发票图片进行识别以得到待处理发票图片中的分类字符,包括:对待处理发票图片进行分割以得到表头区域;识别表头区域中的分类字符。
在一个实施例中,处理器执行计算机程序时所实现的对待处理发票图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;处理器执行计算机程序时所涉及的表头检测模型的训练方式包括:读取第一发票图像,并标记第一发票图像中表头位置;根据第一发票图像和对应的表头位置进行训练得到表头检测模型。
在一个实施例中,处理器执行计算机程序时所实现的识别表头区域中的分类字符是通过预先训练的文字识别模型得到的;处理器执行计算机程序时所涉及的文字识别模型的训练方式包括:随机生成不同长度的文本切片,并标记文本切片的文本内容;根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
在一个实施例中,处理器执行计算机程序时所实现的根据分类字符对待处理发票图片进行分类,包括:获取分类字符所对应的发票分类作为待处理发票图片的分类。
在一个实施例中,处理器执行计算机程序时所实现的对待处理发票图片进行图像码识别是通过预先训练的图像码检测模型得到的;处理器执行计算机程序时所涉及的图像码检测模型的训练方式包括:读取第二发票图像,并根据第二发票图像是否含有图像码生成目标标记;根据第二发票图像和目标标记进行模型训练得到图像码检测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理发票图片;对待处理发票图片进行图像码识别;当识别到图像码时,对待处理发票图片进行识别以得到待处理发票图片中的分类字符;根据分类字符对待处理发票图片进行分类。
在一个实施例中,计算机程序被处理器执行时所实现的对待处理发票图片进行识别以得到待处理发票图片中的分类字符,包括:对待处理发票图片进行分割以得到表头区域;识别表头区域中的分类字符。
在一个实施例中,计算机程序被处理器执行时所实现的对待处理发票图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;计算机程序被处理器执行时所涉及的表头检测模型的训练方式,包括:读取第一发票图像,并标记第一发票图像中表头位置;根据第一发票图像和对应的表头位置进行训练得到表头检测模型。
在一个实施例中,计算机程序被处理器执行时所实现的识别表头区域中的分类字符是通过预先训练的文字识别模型得到的;计算机程序被处理器执行时所涉及的文字识别模型的训练方式,包括:随机生成不同长度的文本切片,并标记文本切片的文本内容;根据不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
在一个实施例中,计算机程序被处理器执行时所实现的根据分类字符对待处理发票图片进行分类,包括:获取分类字符所对应的发票分类作为待处理发票图片的分类。
在一个实施例中,计算机程序被处理器执行时所实现的对待处理发票图片进行图像码识别是通过预先训练的图像码检测模型得到的;计算机程序被处理器执行时所涉及的图像码检测模型的训练方式,包括:读取第二发票图像,并根据第二发票图像是否含有图像码生成目标标记;根据第二发票图像和目标标记进行模型训练得到图像码检测模型。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(RandomAccess Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种发票分类方法,其特征在于,所述方法包括:
获取待处理发票图片;
对所述待处理发票图片进行图像码识别;
当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;
根据所述分类字符对所述待处理发票图片进行分类。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符,包括:
对所述待处理发票图片进行分割以得到表头区域;
识别所述表头区域中的分类字符。
3.根据权利要求2所述的方法,其特征在于,所述对所述待处理发票图片进行分割以得到表头区域是通过预先训练的表头检测模型进行处理的;其中,所述表头检测模型的训练方式包括:
读取第一发票图像,并标记所述第一发票图像中表头位置;
根据所述第一发票图像和对应的所述表头位置进行训练得到表头检测模型。
4.根据权利要求2所述的方法,其特征在于,所述识别所述表头区域中的分类字符是通过预先训练的文字识别模型得到的;其中,所述文字识别模型的训练方式包括:
随机生成不同长度的文本切片,并标记所述文本切片的文本内容;
根据所述不同长度的文本切片和对应的标记的文本内容进行训练得到文字识别模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述分类字符对所述待处理发票图片进行分类,包括:
获取所述分类字符所对应的发票分类作为所述待处理发票图片的分类。
6.根据权利要求1所述的方法,其特征在于,所述对所述待处理发票图片进行图像码识别是通过预先训练的图像码检测模型得到的;其中,所述图像码检测模型的训练方式包括:
读取第二发票图像,并根据所述第二发票图像是否含有图像码生成目标标记;
根据所述第二发票图像和所述目标标记进行模型训练得到图像码检测模型。
7.一种发票分类装置,其特征在于,所述装置包括:
接收模块,用于获取待处理发票图片;
图像码检测模块,用于判断待处理发票图片中是否含有图像码;
分类字符识别模块,用于当识别到图像码时,对所述待处理发票图片进行识别以得到所述待处理发票图片中的分类字符;
分类模块,用于根据所述分类字符对所述待处理发票图片进行分类。
8.根据权利要求7所述的装置,其特征在于,所述分类字符识别模块包括:
表头检测单元,用于对所述待处理发票图片进行分割以得到表头区域待;
文字识别单元,用于识别所述表头区域中的分类字符。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110987139.XA CN113780116A (zh) | 2021-08-26 | 2021-08-26 | 发票分类方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110987139.XA CN113780116A (zh) | 2021-08-26 | 2021-08-26 | 发票分类方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113780116A true CN113780116A (zh) | 2021-12-10 |
Family
ID=78839351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110987139.XA Pending CN113780116A (zh) | 2021-08-26 | 2021-08-26 | 发票分类方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780116A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311297A (zh) * | 2023-04-12 | 2023-06-23 | 国网河北省电力有限公司 | 基于计算机视觉的电子凭据图像识别解析方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108460418A (zh) * | 2018-03-07 | 2018-08-28 | 南京邮电大学 | 一种基于文字识别与语义分析的发票分类方法 |
CN108921240A (zh) * | 2018-06-12 | 2018-11-30 | 新乡学院 | 一种发票编码识别分拣系统 |
CN109740417A (zh) * | 2018-10-29 | 2019-05-10 | 深圳壹账通智能科技有限公司 | 发票类型识别方法、装置、存储介质和计算机设备 |
CN109902737A (zh) * | 2019-02-25 | 2019-06-18 | 厦门商集网络科技有限责任公司 | 一种票据分类方法及终端 |
CN110348441A (zh) * | 2019-07-10 | 2019-10-18 | 深圳市华云中盛科技有限公司 | 增值税发票识别方法、装置、计算机设备及存储介质 |
CN110457973A (zh) * | 2018-05-07 | 2019-11-15 | 北京中海汇银财税服务有限公司 | 一种票据识别的方法及系统 |
CN111597958A (zh) * | 2020-05-12 | 2020-08-28 | 西安网算数据科技有限公司 | 一种高度自动化的票据分类方法及系统 |
CN111753744A (zh) * | 2020-06-28 | 2020-10-09 | 北京百度网讯科技有限公司 | 用于票据图像分类的方法、装置、设备及可读存储介质 |
CN111797772A (zh) * | 2020-07-07 | 2020-10-20 | 因凡科技(北京)有限公司 | 发票图像自动分类方法、系统、装置 |
CN112381153A (zh) * | 2020-11-17 | 2021-02-19 | 深圳壹账通智能科技有限公司 | 票据分类的方法、装置和计算机设备 |
CN113011246A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 票据分类方法、装置、设备及存储介质 |
-
2021
- 2021-08-26 CN CN202110987139.XA patent/CN113780116A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460418A (zh) * | 2018-03-07 | 2018-08-28 | 南京邮电大学 | 一种基于文字识别与语义分析的发票分类方法 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN110457973A (zh) * | 2018-05-07 | 2019-11-15 | 北京中海汇银财税服务有限公司 | 一种票据识别的方法及系统 |
CN108921240A (zh) * | 2018-06-12 | 2018-11-30 | 新乡学院 | 一种发票编码识别分拣系统 |
CN109740417A (zh) * | 2018-10-29 | 2019-05-10 | 深圳壹账通智能科技有限公司 | 发票类型识别方法、装置、存储介质和计算机设备 |
CN109902737A (zh) * | 2019-02-25 | 2019-06-18 | 厦门商集网络科技有限责任公司 | 一种票据分类方法及终端 |
CN110348441A (zh) * | 2019-07-10 | 2019-10-18 | 深圳市华云中盛科技有限公司 | 增值税发票识别方法、装置、计算机设备及存储介质 |
CN111597958A (zh) * | 2020-05-12 | 2020-08-28 | 西安网算数据科技有限公司 | 一种高度自动化的票据分类方法及系统 |
CN111753744A (zh) * | 2020-06-28 | 2020-10-09 | 北京百度网讯科技有限公司 | 用于票据图像分类的方法、装置、设备及可读存储介质 |
CN111797772A (zh) * | 2020-07-07 | 2020-10-20 | 因凡科技(北京)有限公司 | 发票图像自动分类方法、系统、装置 |
CN112381153A (zh) * | 2020-11-17 | 2021-02-19 | 深圳壹账通智能科技有限公司 | 票据分类的方法、装置和计算机设备 |
CN113011246A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 票据分类方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311297A (zh) * | 2023-04-12 | 2023-06-23 | 国网河北省电力有限公司 | 基于计算机视觉的电子凭据图像识别解析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492643B (zh) | 基于ocr的证件识别方法、装置、计算机设备及存储介质 | |
CN110569832B (zh) | 基于深度学习注意力机制的文本实时定位识别方法 | |
CN111476227B (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
CN110348294B (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
US20200356818A1 (en) | Logo detection | |
US9626555B2 (en) | Content-based document image classification | |
CN113963147B (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
CN107368827A (zh) | 字符识别方法及装置、用户设备、服务器 | |
CN111583180B (zh) | 一种图像的篡改识别方法、装置、计算机设备及存储介质 | |
CN109389115B (zh) | 文本识别方法、装置、存储介质和计算机设备 | |
CN112633297A (zh) | 目标对象的识别方法、装置、存储介质以及电子装置 | |
CN105335760A (zh) | 一种图像数字字符识别方法 | |
CN111368632A (zh) | 一种签名识别方法及设备 | |
CN110796145B (zh) | 基于智能决策的多证件分割关联方法及相关设备 | |
CN111144372A (zh) | 车辆检测方法、装置、计算机设备和存储介质 | |
CN113111880A (zh) | 证件图像校正方法、装置、电子设备及存储介质 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN114092938B (zh) | 图像的识别处理方法、装置、电子设备及存储介质 | |
CN113673528B (zh) | 文本处理方法、装置、电子设备和可读存储介质 | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN111401158A (zh) | 难样本发现方法、装置及计算机设备 | |
CN115984588A (zh) | 图像背景相似度分析方法、装置、电子设备及存储介质 | |
CN116363655A (zh) | 一种财务票据识别方法及系统 | |
CN115953744A (zh) | 一种基于深度学习的车辆识别追踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |