CN113657234B

CN113657234B - 图像识别方法、装置、存储介质及电子设备

Info

Publication number: CN113657234B
Application number: CN202110914684.6A
Authority: CN
Inventors: 孙龙飞
Original assignee: Xiaoyezi Beijing Technology Co ltd
Current assignee: Xiaoyezi Beijing Technology Co ltd
Priority date: 2021-08-10
Filing date: 2021-08-10
Publication date: 2024-04-26
Anticipated expiration: 2041-08-10
Also published as: CN113657234A

Abstract

本发明实施例公开了一种图像识别方法、装置、存储介质及电子设备，其中，图像识别方法包括：获取待识别图像；以预设规则将所述待识别图像划分为多个第一子图；使用预先训练完成的分类模型，依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；根据属于所述目标对象的第一子图合成所述目标对象的图像，本发明实施例可提高图像识别的准确率。

Description

图像识别方法、装置、存储介质及电子设备

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种图像识别方法、装置、存储介质及电子设备。

背景技术

目前，在从图像中识别出目标对象的场景中，往往会由于图像中存在着大量干扰因素而增大识别难度。例如，在从图像中识别曲谱区域的场景中，若期望从图像中提取出曲谱区域，则可以通过获取黑白分明的像素来区分该有效区域以及非有效区。但黑白像素并非是曲谱所特有的，若图像中非曲谱区域也具有黑白像素，则会很容易对曲谱区域的划分造成干扰，导致识别结果不准确的问题。

发明内容

有鉴于此，本发明一个或多个实施例提供了一种图像识别方法、装置、存储介质及电子设备，能够有效提高图像识别准确率。

本发明一个或多个实施例提供了一种图像识别方法，包括：获取待识别图像；以预设规则将所述待识别图像划分为多个第一子图；使用预先训练完成的分类模型，依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；根据属于所述目标对象的第一子图合成所述目标对象的图像。

可选的，以预设规则将所述待识别图像划分为多个第一子图，包括：将所述待识别图像按照预设尺寸规格分割为所述多个第一子图，若所述多个第一子图中存在不足所述预设尺寸规格的第一子图，保留该第一子图的尺寸。

可选的，所述方法还包括：在以预设规则将所述待识别图片划分为多个第一子图之后，记录各所述第一子图在所述待识别图像中的位置，以及各所述第一子图的尺寸。

可选的，根据属于所述目标对象的所述第一子图合成所述目标对象的图像，包括：将所述多个第一子图像中，属于所述目标对象的第一子图保留在该第一子图在所述待识别图像中的位置；将所述多个第一子图像中，不属于所述目标对象的第一子图在所述待识别图像中的位置利用与该第一子图大小一致的空白图像进行填充。

可选的，所述方法还包括：在获取待识别图像之前，训练所述分类模型；其中，训练所述分类模型包括：以预设规则将训练用图像划分为多个第二子图；按照所述第二子图是否属于所述目标对象进行标注，得到用于训练所述分类模型的训练集；使用所述训练集中标注后的第二子图训练所述分类模型。

可选的，训练所述分类模型，还包括：在使用所述训练集中标注后的第二子图训练所述分类模型之后，循环执行如下步骤，直至利用训练完成的分类模型对测试子图进行分类得到的分类结果中不存在被错误分类的测试子图，得到最终的分类模型；使用所述分类模型对预设的一组测试子图进行分类，得到分类结果；根据所述分类结果对所述一组测试子图进行标注；判断所述分类结果中是否存在被错误分类的测试子图；响应于所述分类结果中存在被错误分类的测试子图，纠正被错误分类的测试子图的标注，并将标注后的测试子图添加至所述训练集，得到新的训练集，利用新的训练集再次训练所述分类模型，其中，每次使用分类模型进行分类的测试子图不同。

可选的，所述目标对象包括曲谱。

本发明一个或多个实施例提供了一种图像识别装置，包括：获取模块，被配置为获取待识别图像；划分模块，被配置为以预设规则将所述待识别图像划分为多个第一子图；分类模块，被配置为使用预先训练完成的分类模型，依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；合成模块，被配置为根据属于所述目标对象的第一子图合成所述目标对象的图像。

可选的，所述划分模块具体被配置为：将所述待识别图像按照预设尺寸规格分割为所述多个第一子图，若所述多个第一子图中存在不足所述预设尺寸规格的第一子图，保留该第一子图的尺寸。

可选的，所述装置还包括：记录模块，被配置为在以预设规则将所述待识别图片划分为多个第一子图之后，记录各所述第一子图在所述待识别图像中的位置，以及各所述第一子图的尺寸。

可选的，所述合成模块具体被配置为：将所述多个第一子图像中，属于所述目标对象的第一子图保留在该第一子图在所述待识别图像中的位置；将所述多个第一子图像中，不属于所述目标对象的第一子图在所述待识别图像中的位置利用与该第一子图大小一致的空白图像进行填充。

可选的，所述装置还包括：训练模块，被配置为在获取待识别图像之前，训练所述分类模型；其中，所述训练模块包括：划分单元，被配置为以预设规则将训练用图像划分为多个第二子图；标注单元，被配置为按照所述第二子图是否属于所述目标对象进行标注，得到用于训练所述分类模型的训练集；第一训练单元，被配置为使用所述训练集中标注后的第二子图训练所述分类模型。

可选的，所述训练模块还包括：第二训练单元，被配置为在使用所述训练集中标注后的第二子图训练所述分类模型之后，循环执行如下步骤，直至利用训练完成的分类模型对测试子图进行分类得到的分类结果中不存在被错误分类的测试子图，得到最终的分类模型；使用所述分类模型对预设的一组测试子图进行分类，得到分类结果；根据所述分类结果对所述一组测试子图进行标注；判断所述分类结果中是否存在被错误分类的测试子图；响应于所述分类结果中存在被错误分类的测试子图，纠正被错误分类的测试子图的标注，并将标注后的测试子图添加至所述训练集，得到新的训练集，利用新的训练集再次训练所述分类模型，其中，每次使用分类模型进行分类的测试子图不同。

可选的，所述目标对象包括曲谱。

本发明一个或多个实施例提供了一种电子设备，包括：处理器；和存储器，其上存储有计算机可执行指令，所述指令在被处理器执行时用于实现如上述任意一种所述的图像识别方法。

本发明一个或多个实施例提供了一种计算机可读存储介质，其上存储有计算机可执行指令，所述指令在被处理器执行时用于实现上述任意一种所述的图像识别方法。

本发明一个或多个实施例的图像识别方法、装置、存储介质及电子设备，将待识别的图像按照预设规则划分为多个子图，再利用预先训练完成的分类模型依次识别各子图是否属于目标对象，利用识别出的属于目标对象的子图合成目标对象的图像，从而可有效的从待识别图像中提取出目标对象，排除了待识别图像中的干扰因素，提高了图像识别的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是根据本发明一个或多个实施例示出的一种图像识别方法的流程图；

图2是根据本发明一个或多个实施例示出的一种待识别图像的示意图；

图3是根据本发明一个或多个实施例示出的一种合成的目标对象的图像的示意图；

图4是根据本发明一个或多个实施例示出的一种第二子图的示意图；。

图5是根据本发明一个或多个实施例示出的一种标注后的第二子图的示意图；

图6是根据本发明一个或多个实施例示出的一种图像识别方法的流程图；

图7是根据本发明一个或多个实施例示出的一种图像识别装置的结构示意图；

图8是根据本发明一个或多个实施例示出的一种电子设备的结构示意图。

具体实施方式

下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1是根据本发明一个或多个实施例示出的一种图像识别方法的流程图，如图1所示，该方法包括：

步骤101：获取待识别图像；

在本发明的一个或多个实施例中，待识别图像中可包括目标对象，该目标对象例如可以是曲谱、文本内容或指定图案，本发明实施例对此不做限定。图2中以目标对象为曲谱为例对待识别图像进行示例。如图2所示，图2中包括曲谱区域以及非曲谱区域，目标对象即为图中所示的曲谱。待识别图像例如可以由用户指定。

步骤102：以预设规则将所述待识别图像划分为多个第一子图；

可选的，预设规则中可预先指定了第一子图所需满足的尺寸规格，基于此，在步骤102中，可将待识别图像按照预设规则中预先指定的尺寸规格分割为多个第一子图。或者，预设规则中还可预先指定了第一子图的划分规则，基于此，在步骤102中，可按照该划分规则将待识别图像划分为多个第一子图。

步骤103：使用预先训练完成的分类模型依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；

例如，可依次将步骤102中得到的多个第一子图利用上述分类模型进行预测，如果某一第一子图的预测值为1，表明该第一子图属于目标对象，如果某一第一子图的预测值为0，表明该第一子图不属于目标对象。

在本发明一个或多个实施例中，属于目标对象的子图，指的可以是属于目标对象一部分或全部的子图。

步骤104：根据属于所述目标对象的第一子图合成所述目标对象的图像。

例如，可将上述步骤103中确定出的所有属于目标对象的第一子图中进行图像合成，得到目标对象的图像。

本发明一个或多个实施例的图像识别方法，将待识别的图像按照预设规则划分为多个子图，再利用预先训练完成的分类模型依次识别各子图是否属于目标对象，利用识别出的属于目标对象的子图合成目标对象的图像，从而可有效的从待识别图像中提取出目标对象，排除了待识别图像中的干扰因素，提高了图像识别的准确率。

考虑到待识别图像的大小不定，若按上述预设规则中指定的预设尺寸规格将待识别图像划分为多个预设尺寸规格的第一子图，则有可能会存在待识别图像边缘部分划分得到的第一子图不满足预设尺寸规格的情况。举一个例子，假设预设尺寸规格是64*64像素，则在将待识别图像分割为64*64像素大小的第一子图后，会出现在待识别图像边缘部分划分得到的第一子图的大小不足64*64像素的情况。基于此，在本发明的一个或多个实施例中，以预设规则将所述待识别图像划分为多个第一子图，可包括：

将所述待识别图像按照预设尺寸规格分割为所述多个第一子图，若所述多个第一子图中存在不足所述预设尺寸规格的第一子图，保留该第一子图的尺寸。沿用上述例子，对于大小不满足64*64像素第一子图，保留该第一子图的尺寸。

在本发明的一个或多个实施例中，图像识别方法还可包括：在以预设规则将所述待识别图片划分为多个第一子图之后，记录各所述第一子图在所述待识别图像中的位置(例如各第一子图在待识别图像中的坐标位置)，以及各所述第一子图的尺寸(例如，各第一子图的像素)。

在本发明的一个或多个实施例中，根据属于所述目标对象的所述第一子图合成所述目标对象的图像，可包括：

将所述多个第一子图像中，属于所述目标对象的第一子图保留在该第一子图在所述待识别图像中的位置；将所述多个第一子图像中，不属于所述目标对象的第一子图在所述待识别图像中的位置利用与该第一子图大小一致的空白图像进行填充。在一个例子中，可在待识别图像的基础上，保留属于目标对象的第一子图，去除不属于目标对象的第一子图，或者，保留属于目标对象的第一子图，在不属于目标对象的第一子图的位置，利用与该第一子图大小一致的空白图像进行填充。仍以图2所示的待识别图像为例，合成的目标对象的图像可如图3所示，需要说明的是，若采用仅保留属于目标对象的第一子图，去除不属于目标对象的第一子图的方式生成目标对象的图像，则生成的目标对象的图像仅包括图中所示的曲谱部分的不规则图像；若采用保留属于目标对象的第一子图，对不属于目标对象的第一子图利用空白图像进行填充的方式生成目标对象的图像，则生成的目标对象的图像与待识别图像原图大小形状一致，且其中仅显示有曲谱区域，其余部分为空白。

在本发明的一个或多个实施例中，图像识别方法还可包括：

在获取待识别图像之前，训练所述分类模型；

其中，训练所述分类模型包括：

以预设规则将训练用图像划分为多个第二子图；目标对象仍以曲谱为例，训练用图像例如可以是一批含有曲谱的图像。其中，第二子图可与上述第一子图大小一致。其中，划分后的第二子图以图4所示为例。

按照所述第二子图是否属于所述目标对象对所述第二子图进行标注，得到用于训练所述分类模型的训练集；为了提高准确性，可对第二子图进行人工标注，例如，可将是有效曲谱的一部分的第二子图标记为1，将不是有效曲谱的一部分的第二子图标注为0。标注后的第二子图以图5所示为例。

使用所述训练集中标注后的第二子图训练所述分类模型。例如，可使用resnet(深度残差网络)或CNN(Convolutional Neural Network，卷积神经网络)算法对所有标记后的第二子图进行模型训练，得到训练完成的神经网络模型，即上述分类模型。实验表明，使用resnet算法训练得到的分类模型的识别准确率较高。

为了提高分类模型的识别精度，在初次训练得到分类模型之后，还可对分类模型进行测试以及反复训练，其中，对分类模型进行测试以及反复训练的过程，以图6所示为例。基于此，在本发明的一个或多个实施例中，训练所述分类模型还可包括：在使用所述训练集中标注后的第二子图训练所述分类模型之后，循环执行如下步骤，直至利用训练完成的分类模型对测试子图进行分类得到的分类结果中不存在被错误分类的测试子图，分类模型训练结束，得到最终的分类模型；

步骤601：使用所述分类模型对预设的一组测试子图进行分类，得到分类结果；例如，可再准备一批含有有效曲谱的图像，该批图像可区别于上述待识别图像以及上述测试用图像，将这批图像按上述预设规则分割为一组测试子图。

步骤602：根据所述分类结果对所述一组测试子图进行标注；例如，将属于曲谱的测试子图标记为1，将不属于曲谱的测试子图标记为0。

步骤603：判断所述分类结果中是否存在被错误分类的测试子图；其中，被错误分类指的是原本属于曲谱的测试子图被分类模型识别为不属于曲谱，或原本不属于曲谱的测试子图被分类模型识别为属于曲谱。

步骤604：响应于所述分类结果中存在被错误分类的测试子图，纠正被错误分类的测试子图的标注，并将标注后的测试子图添加至所述训练集，得到新的训练集，利用新的训练集再次训练所述分类模型。其中，纠正被错误分类的测试子图的标注，例如，若某个测试子图实际并不属于曲谱而被标记为1，则需将该测试子图标记为0。

可选地，图6所示的流程中，还可包括步骤600：对一批含有目标对象的图像按照上述预设规则划分为多个测试子图，得到上述一组测试子图。此外，为了简化流程，步骤601中的一组测试子图也可以是预先分割好的测试子图集合中的一组。

需要说明的是，在图6所示的循环步骤中，用于测试每次生成的分类模型的各测试子图可来源于不同的图像，即各测试子图可由含有不同曲谱的图像划分得到。

图7是根据本发明一个或多个实施例示出的一种图像识别装置的结构示意图，如图7所示，该装置70包括：

获取模块71，被配置为获取待识别图像；

划分模块72，被配置为以预设规则将所述待识别图像划分为多个第一子图；

分类模块73，被配置为使用预先训练完成的分类模型，依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；

合成模块74，被配置为根据属于所述目标对象的第一子图合成所述目标对象的图像。

在本发明的一个或多个实施例中，所述划分模块具体可被配置为：

将所述待识别图像按照预设尺寸规格分割为所述多个第一子图，若所述多个第一子图中存在不足所述预设尺寸规格的第一子图，保留该第一子图的尺寸。

在本发明的一个或多个实施例中，图像识别装置还可包括：

记录模块，被配置为在以预设规则将所述待识别图片划分为多个第一子图之后，记录各所述第一子图在所述待识别图像中的位置，以及各所述第一子图的尺寸。

在本发明的一个或多个实施例中，所述合成模块具体被配置为：

将所述多个第一子图像中，属于所述目标对象的第一子图保留在该第一子图在所述待识别图像中的位置；

将所述多个第一子图像中，不属于所述目标对象的第一子图在所述待识别图像中的位置利用与该第一子图大小一致的空白图像进行填充。

在本发明的一个或多个实施例中，图像识别装置还可包括：

训练模块，被配置为在获取待识别图像之前，训练所述分类模型；

其中，所述训练模块包括：

划分单元，被配置为以预设规则将训练用图像划分为多个第二子图；

标注单元，被配置为按照所述第二子图是否属于所述目标对象进行标注，得到用于训练所述分类模型的训练集；

第一训练单元，被配置为使用所述训练集中标注后的第二子图训练所述分类模型。

在本发明的一个或多个实施例中，所述训练模块还可包括：

第二训练单元，被配置为在使用所述训练集中标注后的第二子图训练所述分类模型之后，循环执行如下步骤，直至利用训练完成的分类模型对测试子图进行分类得到的分类结果中不存在被错误分类的测试子图，得到最终的分类模型；

使用所述分类模型对预设的一组测试子图进行分类，得到分类结果；

根据所述分类结果对所述一组测试子图进行标注；

判断所述分类结果中是否存在被错误分类的测试子图；

响应于所述分类结果中存在被错误分类的测试子图，纠正被错误分类的测试子图的标注，并将标注后的测试子图添加至所述训练集，得到新的训练集，利用新的训练集再次训练所述分类模型，其中，每次使用分类模型进行分类的测试子图不同。

在本发明的一个或多个实施例中，所述目标对象可包括曲谱。

本发明一个或多个实施例还提供了一种电子设备，包括：

处理器；和存储器，其上存储有计算机可执行指令，所述指令在被处理器执行时用于实现上述任意一种图像识别方法。

本发明一个或多个实施例还提供了一种计算机可读存储介质，其上存储有计算机可执行指令，所述指令在被处理器执行时用于实现上述任意一种图像识别方法。

相应的，如图8所示，本发明的实施例提供的服务器，可以包括：壳体81、处理器82、存储器83、电路板84和电源电路85，其中，电路板84安置在壳体81围成的空间内部，处理器82和存储器83设置在电路板84上；电源电路85，用于为所述服务器的各个电路或器件供电；存储器83用于存储可执行程序代码；处理器82通过读取存储器83中存储的可执行程序代码来运行与可执行程序代码对应的程序，用于执行前述实施例提供的任一种图像识别方法。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

为了描述的方便，描述以上装置是以功能分为各种单元/模块分别描述。当然，在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种图像识别方法，其特征在于，包括：

获取待识别图像；

以预设规则将所述待识别图像划分为多个第一子图；

使用预先训练完成的分类模型，依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；

根据属于所述目标对象的第一子图合成所述目标对象的图像；

所述以预设规则将所述待识别图像划分为多个第一子图，包括：将所述待识别图像按照预设尺寸规格分割为所述多个第一子图，若所述多个第一子图中存在不足所述预设尺寸规格的第一子图，保留该第一子图的尺寸；

在以预设规则将所述待识别图像划分为多个第一子图之后，记录各所述第一子图在所述待识别图像中的位置，以及各所述第一子图的尺寸；

所述根据属于所述目标对象的所述第一子图合成所述目标对象的图像，包括：将所述多个第一子图中，属于所述目标对象的第一子图保留在该第一子图在所述待识别图像中的位置；将所述多个第一子图中，不属于所述目标对象的第一子图在所述待识别图像中的位置利用与该第一子图大小一致的空白图像进行填充。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在获取待识别图像之前，训练所述分类模型；

其中，训练所述分类模型包括：

以预设规则将训练用图像划分为多个第二子图；

按照所述第二子图是否属于所述目标对象对所述第二子图进行标注，得到用于训练所述分类模型的训练集；

使用所述训练集中标注后的第二子图训练所述分类模型。

3.根据权利要求2所述的方法，其特征在于，训练所述分类模型，还包括：

在使用所述训练集中标注后的第二子图训练所述分类模型之后，循环执行如下步骤，直至利用训练完成的分类模型对测试子图进行分类得到的分类结果中不存在被错误分类的测试子图，得到最终的分类模型；

根据所述分类结果对所述一组测试子图进行标注；

判断所述分类结果中是否存在被错误分类的测试子图；

4.根据权利要求1至3任一项所述的方法，其特征在于，所述目标对象包括曲谱。

5.一种图像识别装置，其特征在于，包括：

获取模块，被配置为获取待识别图像；

划分模块，被配置为以预设规则将所述待识别图像划分为多个第一子图；

分类模块，被配置为使用预先训练完成的分类模型，依次对所述多个第一子图进行分类，确定各所述第一子图是否属于目标对象；

合成模块，被配置为根据属于所述目标对象的第一子图合成所述目标对象的图像；

所述划分模块具体被配置为：将所述待识别图像按照预设尺寸规格分割为所述多个第一子图，若所述多个第一子图中存在不足所述预设尺寸规格的第一子图，保留该第一子图的尺寸；

所述装置还包括：记录模块，被配置为在以预设规则将所述待识别图像划分为多个第一子图之后，记录各所述第一子图在所述待识别图像中的位置，以及各所述第一子图的尺寸；

所述合成模块具体被配置为：将所述多个第一子图中，属于所述目标对象的第一子图保留在该第一子图在所述待识别图像中的位置；将所述多个第一子图中，不属于所述目标对象的第一子图在所述待识别图像中的位置利用与该第一子图大小一致的空白图像进行填充。

6.根据权利要求5所述的装置，其特征在于，所述装置还包括：

其中，所述训练模块包括：

7.根据权利要求6所述的装置，其特征在于，所述训练模块还包括：

根据所述分类结果对所述一组测试子图进行标注；

判断所述分类结果中是否存在被错误分类的测试子图；

8.根据权利要求5至7任一项所述的装置，其特征在于，所述目标对象包括曲谱。

9.一种电子设备，其特征在于，包括：

处理器；和

存储器，其上存储有计算机可执行指令，所述指令在被处理器执行时用于实现如权利要求1-4中任一项所述的图像识别方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机可执行指令，所述指令在被处理器执行时用于实现如权利要求1-4中任一项所述的图像识别方法。