CN111860657A

CN111860657A - 一种图像分类方法、装置、电子设备及存储介质

Info

Publication number: CN111860657A
Application number: CN202010717294.5A
Authority: CN
Inventors: 胡雅伦; 郑邦东; 车越云
Original assignee: China Construction Bank Corp; CCB Finetech Co Ltd
Current assignee: China Construction Bank Corp
Priority date: 2020-07-23
Filing date: 2020-07-23
Publication date: 2020-10-30

Abstract

本发明实施例公开了一种图像分类方法、装置、电子设备及存储介质。该方法包括：获取待分类图像中全部文字字符串；根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成；将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度；根据所述匹配度对图像进行分类。通过运行本发明实施例所提供的技术方案，可以解决现有方法针对性训练的图像分类模型准确率不高；训练针对性深度学习模型耗时较长，开发效率低；只能判断一种类型的图片，通用性不强的问题，实现提高图像分类的准确率、效率和通用性的效果。

Description

一种图像分类方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及计算机技术，尤其涉及一种图像分类方法、装置、电子设备及存储介质。

背景技术

随着计算机技术的发展，如今图像的分类往往通过图像识别技术完成。

目前判断图像类型主要采用的是基于深度学习的图像分类技术。首先，现有方法需要收集大量样本图片作为训练数据，但真实应用场景中，由于数据保密性等原因，难以获取足量的图片，因此导致针对性训练的图像分类模型准确率不高；其次，现有方法需要训练针对性深度学习模型，通常耗时较长，开发效率低；最后，现有方法训练的深度学习模型只能判断一种类型的图片，新增图片类型则需要重新收集数据、标注数据、训练模型，因此该方法通用性不强。

发明内容

本发明实施例提供一种图像分类方法、装置、电子设备及存储介质，以实现提高图像分类的准确率、效率和通用性的效果。

第一方面，本发明实施例提供了一种图像分类方法，该方法包括：

获取待分类图像中全部文字字符串；

根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成；

将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度；

根据所述匹配度对图像进行分类。

可选的，所述模板词表的建立过程，包括：

获取模板图像中全部模板文字字符串；其中，所述模板图像与模板类别关联；

可选的，根据所述模板文字字符串确定模板词组，以构成所述模板类别的模板词表。

根据所述匹配度对图像进行分类，包括：

若所述匹配度大于预设阈值，则确定所述待分类图像与所述模板图像匹配；

将所述模板图像关联的模板类别确定为待分类图像的类型。

可选的，确定所述待匹配词组与所述模板词表中词组的匹配度，包括：

判断所述模板词表中的词组中是否有与所述待匹配词组相同的词组；

若是，则所述匹配度增加固定单位；

遍历所述待匹配词组，以确定所述匹配度。

可选的，获取待分类图像中全部文字字符串，包括：

获取所述待分类图像中文字所处的矩形框位置；

获取所述矩形框位置中的全部文字内容，以获取所述文字字符串。

第二方面，本发明实施例还提供了一种图像分类装置，该装置包括：

第一字符串获取模块，用于获取待分类图像中全部文字字符串；

待匹配词组确定模块，用于根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成；

匹配度确定模块，用于将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度；

图像分类模块，用于根据所述匹配度对图像进行分类。

可选的，模板词表建立模块，所述模板词表建立模块，包括：

第二字符串获取单元，用于获取模板图像中全部模板文字字符串；其中，所述模板图像与模板类别关联；

模板词组确定单元，用于根据所述模板文字字符串确定模板词组，以构成所述模板类别的模板词表。

可选的，所述图像分类模块，包括：

图像匹配确定单元，用于若所述匹配度大于预设阈值，则确定所述待分类图像与所述模板图像匹配；

图像类型确定单元，用于将所述模板图像关联的模板类别确定为待分类图像的类型。

可选的，所述匹配度确定模块，包括：

词组判断单元，用于判断所述模板词表中的词组中是否有与所述待匹配词组相同的词组；

匹配度增加单元，用于若所述词组判断单元判断为是，则所述匹配度增加固定单位；

匹配度确定单元，用于遍历所述待匹配词组，以确定所述匹配度。

可选的，所述第一字符串获取模块，包括：

矩形框位置获取单元，用于获取所述待分类图像中文字所处的矩形框位置；

字符串获取单元，用于获取所述矩形框位置中的全部文字内容，以获取所述文字字符串。

第三方面，本发明实施例还提供了一种电子设备，该电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上所述的图像分类方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的图像分类方法。

本发明实施例通过获取待分类图像中全部文字字符串；根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成；将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度；根据所述匹配度对图像进行分类。解决现有方法针对性训练的图像分类模型准确率不高；训练针对性深度学习模型耗时较长，开发效率低；只能判断一种类型的图片，通用性不强的问题，实现提高图像分类的准确率、效率和通用性的效果。

附图说明

图1为本发明实施例一提供的一种图像分类方法的流程图；

图2为本发明实施例一提供的一种报销单示意图；

图3为本发明实施例二提供的一种图像分类方法的流程图；

图4为本发明实施例三提供的一种图像分类装置的结构示意图；

图5为本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种图像分类方法的流程图，本实施例可适用于通过模板对图像进行分类情况，该方法可以由本发明实施例所提供的图像分类装置来执行，该装置可以由软件和/或硬件的方式实现。参见图1，本实施例提供的图像分类方法，包括：

步骤110、获取待分类图像中全部文字字符串。

其中，待分类图像为文字类图像，示例性的，可以为报销单、请假单等。

获取待分类图像中所有文字部分的文字内容，并以字符串的形式存储。文字内容包括图片标题和栏位名称，还可以包括栏位名称后填写的具体内容，本实施例对此不作限制。

图2为本发明实施例一提供的一种报销单示意图。如图2所示：

文字字符串内容为：邯郸分行本部、报销单、报销单编号、附件张数、报销事项、支付方式、电子支付、回单接收邮箱、是否国际收支、供应商编号、供应商名称等。

本实施例中，可选的，获取待分类图像中全部文字字符串，包括：

获取所述待分类图像中文字所处的矩形框位置；

其中，文字所处矩形框为文字的最小外接矩形框。矩形框位置可以为矩形框中顶点的坐标位置，可以通过图像定位的深度学习模型获取，本实施例对此不作限制。

再使用图像识别的深度学习模型等方式，得到每个矩形框中的文字内容，并以字符串的形式保存。其中深度学习模型用于学习样本数据的内在规律和表示层次，计算并训练出最终模型，使机器可以根据模型进行结果预测。

通过获取待分类图像中文字所处的矩形框位置，以获取所述文字字符串，提高待分类图像中文字字符串获取的准确率。

步骤120、根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成。

其中，待匹配词组为待分类图像中每个文字字符串中连续预设个数的字符，去掉重复部分组成的词组。示例性的，若预设个数为二，则邯郸分行本部可以分为邯郸、郸分、分行、行本、本部，报销单分为报销、销单等。

步骤130、将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度。

其中，模板词表为预先设置的词表，每个模板词表对应一种图像类型，示例性的，若以邯郸分行本部的报销单为报销单模板，则报销单对应的模板词表中的词组包括邯郸、郸分、分行、行本、本部、报销等。将模板词表中的词组与待匹配词组进行匹配，以获取待匹配词组与模板词表中词组的匹配度。匹配算法可以为KMP匹配算法等可实现字符串匹配的算法，本实施例对此不作限制。

匹配度为待匹配词组与模板词表中词组的相似程度，可以以数值的形式表示，本实施例对此不作限制。

本实施例中，可选的，确定所述待匹配词组与所述模板词表中词组的匹配度，包括：

若是，则所述匹配度增加固定单位；

遍历所述待匹配词组，以确定所述匹配度。

判断模板词表中的词组中是否有与待匹配词组相同的词组，例如判断待匹配词组中的“报销”、“金额”、“报账”等词组是否在模板词表的词组中出现，若出现一个相同词组，则匹配度增加固定单位，示例性的，若固定单位为1，则当“报销”、“金额”、“报账”均在报销单模板词表的词组中出现，则待匹配词组与模板词表的匹配度增加3。若待匹配词组在模板词表的词组中未出现，则匹配度不变，示例性的，待匹配词组“承德”在模板词表的词组中未出现，则匹配度不变。

对于每个模板词表，匹配度的初始值为0，遍历待匹配词组，以获取待匹配词组对于单个模板词表的匹配度。遍历所有模板词表，以获取待匹配词组对于所有模板词表的匹配度。

通过判断模板词表中的词组中是否有与待匹配词组相同的词组获取匹配度，直观体现图像相似度，以提高后续图像分类的准确性。

步骤140、根据所述匹配度对图像进行分类。

根据匹配度对图像进行分类，若待匹配词组与模板词表中词组的匹配度大于预设阈值，则待分类图像的类别为模板词表对应的图像类型。

应用场景可以为，获取一定数量的待分类图像，从待分类图像中获取指定图像类别的图像，本实施例对此不作限制。

可选的，若满足匹配度大于预设阈值的模板词表不唯一，则根据匹配度对匹配程度进行排序，将排序第一的模板词表对应的图像类型，作为待分类图像的图像类型。

现有技术中，图像分类的过程往往为通过收集大量、多样化的样本图片；然后对每张图片标注“是”或“否”，表示是否为当前指定的图像类型，通常以文本文件形式保存，一张图片对应一个同名的文本文件；最后将标注好的数据(图片与文本文件)作为训练数据。挑选合适的图像分类深度学习算法，对收集的训练数据进行针对性训练，并保存训练好的模型。在图像分类时，直接调用保存的模型，判断输入图像是否为当前应用需要识别的特定类型图像。该技术需要准备大量真实图像作为训练数据训练出图像分类模型，耗时长且通用性不佳，并且数据保密性等原因，难以获取足量的图片，因此导致针对性训练的图像分类模型准确率不高。

实施例二

图3为本发明实施例二提供的一种图像分类方法的流程图，本技术方案是针对根据所述匹配度对图像进行分类的过程进行补充说明的。与上述方案相比，本方案具体优化为，根据所述匹配度对图像进行分类，包括：

若所述匹配度大于预设阈值，则确定所述待分类图像与模板图像匹配；

将所述模板图像关联的模板类别确定为待分类图像的类型。具体的，图像分类方法的流程图如图3所示：

步骤310、获取待分类图像中全部文字字符串。

步骤320、根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成。

步骤330、将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度。

本实施例中，可选的，所述模板词表的建立过程，包括：

根据所述模板文字字符串确定模板词组，以构成所述模板类别的模板词表。

其中，模板图像用于制作模板词表，例如采用邯郸分行本部的未填写内容的报销单作为报销单的模板图像，以制作报销单类别的模板词表。

模板图像的要求为足够清晰、无倾斜。可以为每种类型的图像建立一个模板文件，通常为.txt格式。模板文件用于记录模板图像中所有标题类型文字的内容，即图片标题和栏位名称，内容以字符串形式存储，一行字符串表示一个文本框。以报销单图片为例，模板文件内容包括：邯郸分行本部、报销单、报销单编号、附件张数等文字字符串。

根据模板文字字符串确定模板词组，对每种类型的图像，读取其对应的模板文件。依次读取模板文件中每一行字符串，每次取连续预设个字符作为一个词存入词表，最后去掉重复的词得到词表。示例性的，连续预设个字符为二，则将报销单的模板文件中的字符串拆分为邯郸、郸分、分行、行本、本部、报销等，将重复部分去除，构成报销单的模板词表。只需要一张样本图片作为模板图像，不需要收集、标注大量训练数据来训练，减少了前期开发工作，提高了开发效率。

步骤340、若所述匹配度大于预设阈值，则确定所述待分类图像与模板图像匹配。

其中，预设阈值可以为匹配度占模板词表中词组总个数的预设比例，示例性的，匹配度为25，词表中的词组个数为30，匹配度占模板词表中词组总个数的比例为六分之五，大于预设阈值三分之四，则确定待分类图像与模板图像匹配。匹配度为10，词表中的词组个数为30，匹配度占模板词表中词组总个数的比例为三分之一，小于预设阈值三分之四，则确定待分类图像与模板图像不匹配。其中，预设阈值可以根据实际情况进行更改。

步骤350、将所述模板图像关联的模板类别确定为待分类图像的类型。

待分类图像的类别为匹配的模板图像关联的图像类型。

示例性的，待分类图片的匹配度占模板词表1中词组总个数的比例为六分之五，占模板词表2中词组总个数的比例为七分之六，均大于预设阈值，则将比例更高的模板词表2关联的图像类型作为待分类图像的图像类型。

本发明实施例通过制作模板来进行图像分类，不依赖收集训练数据的多少，提高了准确率。当需要新增图像类型时，只需要新增模板图像以制作模板词表，增强了图像分类的通用性。

实施例三

图4为本发明实施例三提供的一种图像分类装置的结构示意图。该装置可以由硬件和/或软件的方式来实现，可执行本发明任意实施例所提供的一种图像分类方法，具备执行方法相应的功能模块和有益效果。如图4示，该装置包括：

第一字符串获取模块410，用于获取待分类图像中全部文字字符串；

待匹配词组确定模块420，用于根据所述文字字符串确定待匹配词组；其中，所述待匹配词组由所述文字字符串中连续预设个数的字符组成；

匹配度确定模块430，用于将所述待匹配词组与模板词表中的词组匹配，以确定所述待匹配词组与所述模板词表中词组的匹配度；

图像分类模块440，用于根据所述匹配度对图像进行分类。

在上述各技术方案的基础上，可选的，模板词表建立模块，所述模板词表建立模块，包括：

在上述各技术方案的基础上，可选的，所述图像分类模块，包括：

在上述各技术方案的基础上，可选的，所述匹配度确定模块，包括：

在上述各技术方案的基础上，可选的，所述第一字符串获取模块，包括：

实施例四

图5为本发明实施例四提供的一种电子设备的结构示意图，如图5所示，该电子设备包括处理器50、存储器51、输入装置52和输出装置53；电子设备中处理器50的数量可以是一个或多个，图5中以一个处理器50为例；电子设备中的处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接，图5中以通过总线连接为例。

存储器51作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的图像分类方法对应的程序指令/模块。处理器50通过运行存储在存储器51中的软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现上述的图像分类方法。

存储器51可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器51可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器51可进一步包括相对于处理器50远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种图像分类方法，该方法包括：

获取待分类图像中全部文字字符串；

根据所述匹配度对图像进行分类。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的图像分类方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述图像分类装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种图像分类方法，其特征在于，包括：

获取待分类图像中全部文字字符串；

根据所述匹配度对图像进行分类。

2.根据权利要求1所述的方法，其特征在于，所述模板词表的建立过程，包括：

3.根据权利要求2所述的方法，其特征在于，根据所述匹配度对图像进行分类，包括：

将所述模板图像关联的模板类别确定为待分类图像的类型。

4.根据权利要求1所述的方法，其特征在于，确定所述待匹配词组与所述模板词表中词组的匹配度，包括：

若是，则所述匹配度增加固定单位；

遍历所述待匹配词组，以确定所述匹配度。

5.根据权利要求1所述的方法，其特征在于，获取待分类图像中全部文字字符串，包括：

获取所述待分类图像中文字所处的矩形框位置；

6.一种图像分类装置，其特征在于，包括：

图像分类模块，用于根据所述匹配度对图像进行分类。

7.根据权利要求6所述的装置，其特征在于，模板词表建立模块，所述模板词表建立模块，包括：

8.根据权利要求7所述的装置，其特征在于，所述图像分类模块，包括：

9.根据权利要求6所述的装置，其特征在于，所述匹配度确定模块，包括：

10.根据权利要求6所述的装置，其特征在于，所述第一字符串获取模块，包括：

11.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的图像分类方法。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-5中任一所述的图像分类方法。