CN111061898A

CN111061898A - 图像处理方法、装置、计算机设备及存储介质

Info

Publication number: CN111061898A
Application number: CN201911280649.2A
Authority: CN
Inventors: 朱圣晨
Original assignee: Oppo Chongqing Intelligent Technology Co Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2019-12-13
Filing date: 2019-12-13
Publication date: 2020-04-24
Also published as: WO2021115345A1

Abstract

本申请公开了一种图像处理方法、装置、计算机设备及存储介质。属于图像处理技术领域。所述方法由终端执行，所述方法包括：获取待识别的目标图像；提取目标图像中的对象图像，对象图像是目标图像中的对象所在区域的图像；通过第一分类模型对对象图像进行处理，获得对象图像中的对象的第一类别；根据第一类别确定第二分类模型；通过第二分类模型对对象图像进行处理，获得对象图像中的对象的第二类别，第二类别是第一类别的子类别。本申请可以实现第一分类模型和第二分类模型各自可识别的分类数量都能够得到较好的控制，从而提高对象图像的识别准确率。

Description

图像处理方法、装置、计算机设备及存储介质

技术领域

本申请涉及图像处理技术领域，特别涉及一种图片处理方法、装置、计算机设备及存储介质。

背景技术

随着科学技术的快速发展，人们在日常生活中需要对图像进行处理的场景越来越多，因此，越来越多的终端也都设计了对图像进行处理的功能。

比如，终端中可以提供有对图像进行分类、编辑、调色、识别等功能，用户可以通过终端对拍摄的图像进行处理，得到该图像中对象的类别，从而更好地了解该图像内容等。相关技术中，在终端对图像进行处理的过程中，往往采用的单一机器学习模型是对图像的整体进行处理，并要求图像中的物体是该机器学习模型支持的类别，从而得到图像中某个物体对象的类别识别结果。

对于上述的图像识别方式，单一的机器学习模型需要识别的类别数量很多，这会导致机器学习模型对各个类别的识别准确性较低，从而影响识别的准确性。

发明内容

本申请实施例提供了一种图像处理方法、装置、计算机设备及存储介质，可以提高图像的识别准确率。所述技术方案如下：

一个方面，本申请实施例提供了一种图像处理方法，所述方法包括：

获取待识别的目标图像；

提取所述目标图像中的对象图像，所述对象图像是所述目标图像中的对象所在区域的图像；

通过第一分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第一类别；

根据所述第一类别确定第二分类模型；

通过所述第二分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第二类别，所述第二类别是所述第一类别的子类别。

另一方面，本申请实施例提供了一种图像处理装置，所述装置包括：

图像获取模块，用于获取待识别的目标图像；

图像提取模块，用于提取所述目标图像中的对象图像，所述对象图像是所述目标图像中的对象所在区域的图像；

第一获得模块，用于通过第一分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第一类别；

模型确定模块，用于根据所述第一类别确定第二分类模型；

第二获得模块，用于通过所述第二分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第二类别，所述第二类别是所述第一类别的子类别。

另一方面，本申请实施例提供了一种计算机设备，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的图像处理方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的图像处理方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

本申请通过终端获取待识别的目标图像；提取目标图像中的对象图像，对象图像是目标图像中的对象所在区域的图像；通过第一分类模型对对象图像进行处理，获得对象图像中的对象的第一类别；根据第一类别确定第二分类模型；通过第二分类模型对对象图像进行处理，获得对象图像中的对象的第二类别，第二类别是第一类别的子类别。本申请按照目标图像中的对象所在区域将目标图像中的对象图像提取出来，通过两层分类模型中第一分类模型得到的第一类别确定第二分类模型，再由第二分类模型对对象图像进行处理，其中，第一分类模型和第二分类模型各自可识别的分类数量都能够得到较好的控制，使得第一分类模型和第二分类模型的识别准确性相对于单一模型而言都能够得到较大的提升，从而提高了对象图像的识别准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一示例性实施例提供的一种图像处理方法的方法流程图；

图2是本申请一示例性实施例提供的一种图像处理方法的方法流程图；

图3是本申请一示例性实施例涉及的一种终端的拍摄界面的界面示意图；

图4是本申请一示例性实施例涉及的一种终端的视频界面的界面示意图；

图5是本申请一示例性实施例涉及的一种相册界面的界面示意图；

图6是本申请一示例性实施例涉及的一种图像分割结果的示意图；

图7是本申请一示例性实施例涉及的一种终端界面的界面示意图；

图8是本申请一示例性实施例提供的一种图像处理方法的方法流程图；

图9是本申请一示例性实施例提供的图像处理装置的结构框图；

图10是本申请一个示例性实施例提供的终端的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

本申请提供的方案，可以用于人们在日常生活中使用终端时，需要对终端中的图像进行处理的现实场景中，为了便于理解，下面首先对本申请实施例涉及的一些名词以及应用场景进行简单介绍。

Top1结果：当存在多个识别结果时，一个维度上获取多个识别结果中识别结果最好的一个识别结果。比如，多个识别结果有各自的识别准确度以及识别效率，根据识别准确度获取多个识别结果中识别结果最好的一个识别结果；或者，根据识别效率获取多个识别结果中识别结果最好的一个识别结果。

TopN结果：当存在N个(N大于等于2)识别结果时，N个识别结果中任意一个识别结果符合要求，将N个识别结果都进行获取。比如，N个识别结果有各自的识别准确度，其中，如果任意一个识别结果的识别准确度高于预设门限值，则将N个识别结果都进行获取。

清晰度：指图像上各细部影纹及其边界的清晰程度。

随着科学技术的发展，越来越多的终端出现在人们的日常生活中，人们可以通过终端进行工作、娱乐、学习等。可选的，该终端是具有图像处理功能的终端。比如，该终端可以是手机、平板电脑、电子书阅读器、智能眼镜、智能手表、MP4(Moving Picture ExpertsGroup Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑、膝上型便携计算机和台式计算机等等。

可选的，上述终端中还可以设置有机器学习模型，终端可以通过该机器学习模型对图像进行处理(比如图像分类，图像识别，图像编辑等)，当用户需要对某个图像进行处理时，用户可以将该图像输入至终端的机器学习模型中，由该机器学习模型得到图像的处理结果。比如，当用户需要对某个物体进行识别时，用户可以通过终端获取该物体的图像，并通过机器学习模型对该图像进行识别，得到识别结果。

其中，在上述终端通过机器学习模型对图像进行处理的过程中，终端采用的机器学习模型往往是对图像的整体进行处理，并要求图像中的物体是该机器学习模型支持的类别，从而得到图像中某个物体对象的类别识别结果。比如，该机器学习模型支持对“食物”这一类别的识别，当图像一中包含有两个物体(面包和电脑)，终端在对该图像一进行处理的过程中，将图像一按照整体进行识别，最终得到其中“面包”的识别结果。

为了提高对图像的识别准确率，本申请提供了一种解决方案，可以实现对图像中包含的各个对象进行识别，提高对图像进行识别的准确性。请参考图1，其示出了本申请一示例性实施例提供的一种图像处理方法的方法流程图。该方法可以由上述具有图像处理功能的终端执行。如图1所示，该图像处理方法可以包括以下几个步骤：

步骤101，获取待识别的目标图像。

其中，待识别的目标图像可以是终端中任意一张图像。比如，用户使用终端下载了一张图片，此时该图片可以是待识别的目标图像，或者，用户使用终端拍摄了一张图片，此时该图片也可以是待识别的目标图像。或者，用户使用终端进行了截屏操作得到了截图，该截图也可以是待识别的目标图像。可选的，待识别的目标图像也可以是一段视频中的单个视频帧对应的图像，也可以是终端当前拍摄界面中展示的图像等。

步骤102，提取目标图像中的对象图像，对象图像是目标图像中的对象所在区域的图像。

可选的，终端可以确定出目标图像中各个对象各自的所在区域，将各个对象各自所在区域的图像作为对象图像。比如，终端可以对目标图像的各个对象进行轮廓提取，按照该轮廓所围成的区域作为各个对象的所在区域，并将各自所在区域的图像作为对象图像。

在一种可能实现的方式中，一张目标图像中可能包含有多个对象，终端可以从目标图像中提取各个对象所在区域的图像，每个对象所在区域的图像都可以是提取的目标图像中的对象图像。比如，目标图像一中包含有“树”、“狗”、“人”三个对象，终端提取到目标图像一中“树”、“狗”、“人”各自所在区域的图像，得到“树”、“狗”、“人”三个对象图像。

步骤103，通过第一分类模型对对象图像进行处理，获得对象图像中的对象的第一类别。

其中，终端得到上述对象图像后，可以将对象图像输入至第一分类模型中，通过第一分类模型对该对象图像进行处理，得到该对象图像的第一类别。比如，终端得到的一个对象图像是“斗牛犬”，终端可以将得到的对象图像输入至第一分类模型中，该第一分类模型对该对象图像进行处理，可以得到该对象图像的第一类别——“狗”。可选的，第一分类模型可以是开发人员预先设置在终端中的。

可选的，当上述提取到目标图像中的对象图像的数量是多个时，终端可以将各个对象图像依次输入至第一分类模型中，通过第一分类模型对各个对象图像进行处理，得到各个对象图像各自的第一类别，或者，终端也可以将各个对象图像一起输入至第一分类模型中，由第一分类模型对各个对象图像进行处理，得到各个对象图像各自的第一类别。其中，本申请实施例对对象图像输入至第一分类模型的方式并不加以限定。

在一种可能实现的方式中，该第一分类模型是可以按照一定数量的对象图像以及各个对象图像对应的类别(可以是人为设置的一个或者多个类别)进行训练的机器学习模型，当对该第一分类模型输入对象图像后，该第一分类模型可以输出该对象图像对应的类别。

步骤104，根据第一类别确定第二分类模型。

可选的，终端可以根据第一类别，确定可以对第一类别的对象图像识别出第二类别的第二分类模型，第二类别是第一类别的子类别。比如，第一类别是“狗”，第二类别可以是“斗牛犬”、“柴犬”、“哈士奇”等，第一类别是“猫”，第二类别可以是“布偶猫”、“波斯猫”、“加菲猫”等。

可选的，终端可以根据第一类别确定出一个或者多个第二分类模型，其中，当有多个第二分类模型识别出的分类结果都是第一类别的子类别时，终端可以根据第一类别确定出多个第二分类模型。比如，第二分类模型A可以识别出第一类别的三个子类别，第二分类模型B可以识别出第一类别的另外三个子类别，此时，终端可以根据第一类别确定出的第二分类模型包含第二分类模型A和第二分类模型B。

步骤105，通过第二分类模型对对象图像进行处理，获得对象图像中的对象的第二类别。

可选的，终端根据第一类别确定出第二分类模型后，可以将第一类别对应的对象图像输入至第二分类模型中，通过第二分类模型对对象图像再次进行处理，得到该对象图像的第二类别。可选的，如果终端获取到对象图像一的第一类别和对象图像二的第一类别相同，终端也可以将对象图像一和对象图像二输入至同一个第二分类模型中，从而得到对象图像一和对象图像二各自的第二类别。如果终端获取到对象图像一的第一类别和对象图像二的第一类别不同，终端也可以将对象图像一和对象图像二分别输入至各自对应的第二分类模型中，从而得到对象图像一和对象图像二各自的第二类别。

可选的，该第二分类模型也可以按照一定数量的对象图像以及各个对象图像对应的类别(可以是人为设置的一个或者多个类别)进行训练的机器学习模型，当对该第二分类模型输入对象图像后，该第二分类模型可以输出该对象图像对应的类别。可选的，第二分类模型可以是开发人员预先设置在终端中的。

也就是说，第一分类模型和第二分类模型分别是通过标注有类别的对象图像样本进行训练得到的机器学习模型；并且，用于训练第二分类模型所使用的对象图像样本，是上述第一类别下的各个子类别分别对应的对象图像样本。

综上所述，本申请通过终端获取待识别的目标图像；提取目标图像中的对象图像，对象图像是目标图像中的对象所在区域的图像；通过第一分类模型对对象图像进行处理，获得对象图像中的对象的第一类别；根据第一类别确定第二分类模型；通过第二分类模型对对象图像进行处理，获得对象图像中的对象的第二类别，第二类别是第一类别的子类别。本申请按照目标图像中的对象所在区域将目标图像中的对象图像提取出来，通过两层分类模型中第一分类模型得到的第一类别确定第二分类模型，再由第二分类模型对对象图像进行处理，其中，第一分类模型和第二分类模型各自可识别的分类数量都能够得到较好的控制，使得第一分类模型和第二分类模型的识别准确性相对于单一模型而言都能够得到较大的提升，从而提高了对象图像的识别准确率。

在一种可能实现的方式中，上述第一分类模型和第二分类模型输出结果时，还可以包含各自输出结果的置信度，终端还可以根据输出结果的置信度，对输出结果进行筛选，从而提高对象图像的识别准确率。请参考图2，其示出了本申请一示例性实施例提供的一种图像处理方法的方法流程图。该方法可以由上述具有图像处理功能的终端执行。如图2所示，该图像处理方法可以包括以下几个步骤：

步骤201，获取待识别的目标图像。

可选的，终端可以提供有智能识别功能，当用户激活该功能后，终端可以主动获取显示屏幕中的图像，并将该图像作为待识别的目标图像。例如，终端在拍摄界面中提供有智能识别功能对应的识别控件，用户可以通过点击该识别控件，激活或者关闭终端中的智能识别功能，当用户激活智能识别功能后，终端可以将拍摄界面中的图像获取为待识别的目标图像。请参考图3，其示出了本申请一示例性实施例涉及的一种终端的拍摄界面的界面示意图。如图3所示，在拍照界面300中包含了智能识别控件301，用户可以点击该智能识别控件301，激活或者关闭智能识别功能，可选的，在用户激活智能识别功能后，终端可以将拍摄界面中采集到的图像获取为待识别的目标图像。

在一种可能实现的方式中，终端也可以在播放视频的界面中展示智能识别控件，对终端中的视频中的各帧的图像进行识别，此时获取的视频中各帧的图像也可以是待识别的目标图像。请参考图4，其示出了本申请一示例性实施例涉及的一种终端的视频界面的界面示意图。如图4所示，在视频界面400中包含了智能识别控件401，用户可以点击该智能识别控件401，激活或者关闭智能识别功能，可选的，在用户激活智能识别功能后，终端可以将视频界面中展示的视频图像获取为待识别的目标图像。可选的，对视频图像进行识别时，终端可以周期性地获取视频帧，并将获取到的每个视频帧的图像作为待识别的目标图像。

在一种可能实现的方式中，用户也可以选择终端中存储的图片，对选择的图片进行识别，从而使得终端获取到用户选择的图片，将选择的图片作为待识别的目标图像。请参考图5，其示出了本申请一示例性实施例涉及的一种相册界面的界面示意图。如图5所示，在终端界面500中，包含了各个选择的图片501，识别控件502，用户可以点击其中的识别控件502，对选择的图片进行识别，此时终端可以将用户选择的图片作为待识别的目标图像。，本申请实施例对于上述如何获取到待识别的目标图像的方式并不加以限定。

步骤202，获取目标图像的清晰度。

其中，终端在对目标图像进行处理之前，可以先获取该目标图像的清晰度，根据该目标图像的清晰度，确定是否对该目标图像执行后续步骤，即当清晰度高于第三阈值时，执行提取目标图像中的对象图像的步骤(即执行步骤203)。

比如，终端将显示屏幕中的一张图片获取为目标图像，终端可以获取该图片的清晰度，通过该清晰度与第三阈值判断目标图像为模糊图像还是清晰图像，当该清晰度高于第三阈值时，判定该目标图像为清晰图像，当该清晰度低于第三阈值时，判断目标图像为模糊图像，终端可以对其中清晰图像执行后续步骤，从而提高终端的识别效果。其中，第三阈值可以是开发人员预先设置在终端中的一个清晰度值。

步骤203，当清晰度高于第三阈值时，提取目标图像中的对象图像。

其中，对象图像是目标图像中的对象所在区域的图像。

即，终端可以对清晰度高于第三阈值的目标图像进行处理，提取目标图像中的对象图像。可选的，终端提取到目标图像中的对象图像的数量至少为一个。

在一种可能实现的方式中，终端可以通过图像分割模型确定目标图像中包含的各个对象的物体框，物体框用于指示对目标图像进行分割时的边界；根据物体框对目标图像进行分割，获得至少一个对象图像。

其中，该图像分割模型可以给出目标图像中的对象图像的位置(比如，可用矩形检测框的坐标来表示)，并将目标图像中的对象图像从目标图像中分离出来，从而获取到目标图像中需要识别的对象图像。可选的，终端可以将上述清晰度高于第三阈值的目标图像输入至图像分割模型中，有图像分割模型确定出目标图像中包含的各个对象的物体框，并根据该物体框对目标图像进行分割。可选的，该图像分割模型可以是根据标注有对象分割边界的训练样本训练得到的机器学习模型，并预先由开发人员设置在终端中的。比如，开发人员可以将各个分割边界以及对应的图像组成的样本输入至机器学习模型中进行训练，得到输入一个图像，输出该图像的分割边界的机器学习模型。

请参考图6，其示出了本申请一示例性实施例涉及的一种图像分割结果的示意图。如图6所示，在目标图像601中包含了各个已经分割的对象图像602，相应的，终端可以将其中已经分割的对象图像提取为目标图像的对象图像。

在一种可能实现的方式中，上述图像分割模型得到各个分割的对象图像时，也可以得到各个对象图像的类别以及该类别的置信度。即，图像分割模型中也可以对对象图像的类别进行识别，并给出图像分割模型得到该类别的置信度，本申请实施例对此并不加以限定。

步骤204，通过第一分类模型对对象图像进行处理，获得第一分类模型输出的，对象图像中的对象的第一输出类别以及第一置信度。

其中，第一置信度是第一类别的置信度。

可选的，终端提取到目标图像中的对象图像后，可以将提取到的对象图像输入至第一分类模型中，由第一分类模型对对象图像进行处理，获取对象图像中的图像的第一输出类别以及第一置信度。比如，以上述图6中提取到的各个对象图像为例，终端可以将各个对象图像输入至第一分类模型中，由第一分类模型对对象图像进行处理，获得各个对象图像的各自的第一输出类别以及第一置信度。

例如，图6中提取到的各个对象图像中的对象分别为：“狗”、“猫”、“车”、“食物”。终端将各个对象图像输入至第一分类模型中后，第一分类模型输出的各个对象图像的类别和置信度分别为：“狗(90％)”、“猫(90％)”、“车(85％)”、“食物(95％)”。

在一种可能实现的方式中，第一分类模型的输出结果中还可以包含按照对象图像中的对象的轮廓生成的对象图像的第一输出类别。比如，开发人员在训练第一分类模型时，可以按照对象图像中的对象的轮廓以及对象图像进行训练，得到第一分类模型输出的类别中包含对象轮廓生成的对象图像的类别。例如，对于“水果”这一类别来说，训练第一分类模型时，根据水果的轮廓可以将水果这一类别细分为圆形水果、圆柱形水果、菠萝等类别，从而将第一分类模型的输出结果中“水果”这一类别用圆形水果、圆柱形水果、菠萝等类别代替，输入至第一分类模型中的对象图像如果有水果，则可以得到圆形水果或者圆柱形水果或者菠萝对应的类别结果。

比如，对于对象图像一来说，当对象图像一是“西瓜”时，第一分类模型可以对该对象图像一输出的分类结果是“水果”这一类别，如果第一分类模型中包含按照对象图像中物体的轮廓生成的对象图像的第一类别，则第一分类模型对该对象图像一输出的分类结果可能是“圆形水果”这一类别。在一种可能实现的方式中，第一分类模型在对对象图像一进行处理得到分类结果后，第一分类模型还可以获取该对象图像一的轮廓，根据分类结果以及获取的轮廓得到对象图像一对应的第一输出类别。

在一种可能实现的方式中，第一分类模型的输出结果中还可以包含按照对象图像中的对象的颜色生成的对象图像的第一输出类别。比如，开发人员在训练第一分类模型时，可以按照对象图像中的对象的颜色以及对象图像进行训练，得到第一分类模型输出的类别中包含对象颜色生成的对象图像的类别。例如，对于“水果”这一类别来说，训练第一分类模型时，根据水果的颜色可以将水果这一类别细分为红色水果、绿色水果、黄色水果等类别，从而将第一分类模型的输出结果中“水果”这一类别用红色水果、绿色水果、黄色水果等类别代替，输入至第一分类模型中的对象图像如果有水果，则可以得到红色水果或者绿色水果或者黄色水果对应的类别结果。

比如，对于对象图像一来说，当对象图像一是“西瓜”时，第一分类模型可以对该对象图像一输出的分类结果是“水果”这一类别，如果第一分类模型中包含按照对象图像中物体的颜色生成的对象图像的第一类别，则第一分类模型对该对象图像一输出的分类结果可能是“绿色水果”这一类别。在一种可能实现的方式中，第一分类模型在对对象图像一进行处理得到分类结果后，第一分类模型还可以获取该对象图像一的颜色，根据分类结果以及获取的颜色得到对象图像一对应的第一输出类别。

步骤205，当第一置信度高于第一阈值时，将第一输出类别获取为第一类别。

可选的，终端中还预先设置有第一阈值，终端可以根据该第一阈值以及上述得到的第一置信度，确定是否将第一输出类别获取为第一类别。可选的，当第一置信度高于第一阈值时，终端将该第一置信度对应的第一输出类别获取为第一类别。比如，上述得到的对象图像有四个，终端通过第一分类模型对这四个对象图像进行处理后，得到了四个第一输出类别(猫，狗，人，水果)和四个第一输出类别各自对应的第一置信度(90％，80％，85％，95％)，当第一阈值是89％时，终端可以得知高于第一阈值的第一置信度分别为(90％，95％)，可以将对应这两个第一置信度各自的第一输出类别(猫，水果)获取为第一类别。在一种可能实现的方式中，该第一置信度与第一阈值的判断也可以设置在第一分类模型中，第一分类模型直接输出高于第一阈值的第一输出类别即可，终端也可以直接将第一分类模型输出的第一输出类别获取为第一类别，本申请实施例对此并不加以限定。

步骤206，根据第一类别确定第二分类模型。

其中，第二分类模型是可以对第一类别的对象图像识别出第一类别的子类别的分类模型。例如，当第一类别是“狗”时，其对应的分类模型可以是输出结果为各种狗的名称的分类模型，当第一类别是“猫”时，其对应的分类模型可以是输出结果为各种猫的名称的分类模型，当第一类别是“车”时，其对应的分类模型可以是输出结果为各种车的名称的分类模型。

可选的，第一类别与第二分类模型之间存在对应关系，终端可以根据一类别以及对应关系，确定出与第一类别对应的第二分类模型。在一种可能实现的方式中，第一类别与第二分类模型具有唯一对应关系，终端可以根据第一类别，获取与第一类别具有唯一对应关系的第二分类模型。

例如，终端可以通过查询第一类别与第二分类模型之间的唯一对应关系，根据第一类别确定出需要使用的第二分类模型。请参考表1，其示出了本申请一示例性实施例涉及的一种类别与第二分类模型之间的唯一对应关系。

类别	分类模型
		类别一	分类模型一
类别二	分类模型二
		……	……

表1

如上述表1所示，其中包含了第一类别与第二分类模型之间的唯一对应关系，终端在根据第一分类模型获取到对象图像的第一类别之后，终端可以查询上述表1，确定与第一类别对应的第二分类模型。比如，终端在根据第一分类模型获取到对象图像的第一类别是表1中的类别一，终端可以查询上述表1，确定出与类别一对应的分类模型一。

步骤207，通过第二分类模型对对象图像进行识别，获得对象图像的第二输出类别以及第二输出类别的置信度。

其中，第二输出类别是第一类别的子类别。

可选的，终端在确定上述第二分类模型之后，可以将对象图像输入至对应的第二分类模型中，由第二分类模型对对象图像进行识别，得到对象图像的第二输出类别以及第二输出类别的置信度。例如，当终端根据对象图像一的第一类别确定的第二分类模型是第二分类模型A，终端根据对象图像二的第一类别确定的第二分类模型是第二分类模型B，终端可以将对象图像一输入至第二分类模型A中，将对象图像二输入至第二分类模型B中，从而得到对象图像一和对象图像二各自的第二输出类别。可选的，当终端根据对象图像一的第一类别确定的第二分类模型是第二分类模型A，终端根据对象图像二的第一类别确定的第二分类模型也是第二分类模型A，终端可以将对象图像一和对象图像二都输入至第二分类模型A中，从而得到对象图像一和对象图像二各自的第二输出类别。

比如，上述根据两个第一类别确定出了两个第二分类模型，分别是第二分类模型A和第二分类模型B，其中一个第一类别是“猫”，另一个第一类别是“水果”，第二分类模型A是“猫”类别对应的分类模型，第二分类模型A输出的第二输出类别均为“猫”类别的子类别，比如，可以是“波斯猫”、“加菲猫”等；第二分类模型B输出的第二输出类别均为“水果”类别的子类别，比如，可以是“苹果”、“梨”等。

步骤208，当第二输出类别的置信度高于第二阈值时，将第二输出类别获取为第二类别。

可选的，终端中还预先设置有第二阈值，终端可以根据该第二阈值以及上述得到的第二类别的置信度，确定是否需要将第二输出类别获取为第二类别。可选的，当第二类别的置信度高于第二阈值时，终端将第二输出类别获取为第二类别。比如，输入至第二分类模型中的对象图像有两个，终端通过第二分类模型对这四个对象图像进行处理后，得到了四个第二输出类别(波斯猫，哈士奇，苹果，面包)和四个第二输出类别各自对应的置信度(95％，80％，90％，90％)，当第二阈值是85％时，终端可以得知高于第二阈值的第二输出类别的置信度分别为(95％，90％，90％)，终端可以将这三个第二输出类别的置信度各自的第二输出类别(波斯猫，苹果，面包)获取为第二类别。在一种可能实现的方式中，该第二类别的置信度与第二阈值的判断也可以设置在第二分类模型中，第二分类模型直接输出高于第二阈值的第二输出类别即可。可选的，终端还可以将上述获取到的第二类别作为目标图像的处理结果输出。

在一种可能实现的方式中，当终端根据第一类别确定第二分类模型时，如果未得到第二分类模型，终端也可以将得到的第一类别作为目标图像的处理结果。比如，对某个对象图像来说，该对象图像在第一分类模型中得到的第一类别为“菠萝”，当终端根据“菠萝”这个类别并未有确定出有唯一对应关系的第二分类模型时，终端可以将“菠萝”这个类别作为目标图像的处理结果。可选的，如果对目标图像还有其他第二分类模型得到的第二类别，终端可以将“菠萝”以及其他第二分类模型得到的第二类别，共同作为该目标图像的处理结果。

可选的，终端还可以在显示屏中对目标图像的处理结果进行展示，请参考图7，其示出了本申请一示例性实施例涉及的一种终端界面的界面示意图。如图7所示，在终端界面700中包含了各个类别信息701和类别置信度702，用户可以通过终端界面中展示的类别信息了解目标图像。

另外，对视频流进行识别时，通过周期性地对帧图像进行提取，并对该帧图像进行识别，也可以减轻运算量，并对帧图像中的对象进行追踪，提高对视频流中帧图像的识别效果。

以上述终端是手机，目标图像是一张图片进行举例，请参考图8，其示出了本申请一示例性实施例提供的一种图像处理方法的方法流程图。该方法可以由上述具有图像处理功能的终端执行。如图8所示，该图像处理方法可以包括以下几个步骤：

步骤801，获取用户输入的待识别图片。

可选的，本步骤可以参照上述图2所示实施例中步骤201中的描述，此处不再赘述。

步骤802，通过目标检测模型获取各个对象图像。

可选的，此处目标检测模型的作用和上述图像分割模型的作用类似，从待识别图片中获取待识别图像中的对象所在区域的图像。目标检测模型获取对象图像的方式也可以参照上述步骤203中的图像分割模型的描述，此处不再赘述。

步骤803，通过粗粒度分类模型获取各个对象图像的第一类别。

可选的，此处粗粒度分类模型相当于上述图2所示实施例中的第一分类模型，该粗粒度分类模型获取各个对象图像的第一类别的方式也可以参照上述第一分类模型的描述，此处不再赘述。

步骤804，检测是否存在有第一类别对应的细粒度分类模型。

可选的，此处终端还可以检测自身中是否设置有第一类别对应的细粒度分类模型，如果检测到存在，则进入步骤805，如果检测到不存在，则可以进入步骤806。

步骤805，将第一类别对应的对象图像输入至细粒度分类模型中，获取第二类别。

可选的，此处细粒度分类模型相当于上述图2所示实施例中的第二分类模型，该细粒度分类模型获取对象图像的第二类别的方式也可以参照上述第二分类模型的描述，此处不再赘述。

步骤806，在待识别图片中展示第一类别和/或第二类别。

可选的，如果有的对象图像的第一类别有对应的细粒度分类模型，并获取到对象图像的第二类别，有的对象图像的第一类别没有对应的细粒度分类模型，终端可以将上述获取到的第一类别以及第二类别都展示在待识别图片中。即，待识别图片中展示的信息可以包含粗粒度模型识别的结果，也可以包含细粒度识别的结果。

综上所述，本申请通过终端提取待识别图片中的对象图像，对象图像是目标图像中的对象所在区域的图像；通过粗粒度分类模型对对象图像进行处理，获得对象图像中的对象的第一类别；检测是否存在有第一类别对应的细粒度分类模型，若存在，则通过细粒度分类模型对第一类别对应的对象图像进行处理，获得对象图像中的对象的第二类别。粗粒度分类模型和细粒度分类模型各自可识别的分类数量可以得到较好的控制，使得粗粒度分类模型和细粒度分类模型的识别准确性相对于单一模型而言都能够得到较大的提升，从而提高了待识别图片的识别准确率。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参考图9，其示出了本申请一示例性实施例提供的图像处理装置的结构框图。该图像处理装置可以用于上述终端中，以执行图1或者图2所示实施例提供的方法中由终端执行的全部或者部分步骤。该图像处理装置900可以包括：图片获取模块901，图像提取模块902，第一获得模块903、模型确定模块904以及第二获得模块904。

所述图像获取模块901，用于获取待识别的目标图像；

所述图像提取模块902，用于提取所述目标图像中的对象图像，所述对象图像是所述目标图像中的对象所在区域的图像；

所述第一获得模块903，用于通过第一分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第一类别；

所述模型确定模块904，用于根据所述第一类别确定第二分类模型；

所述第二获得模块905，用于通过所述第二分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第二类别，所述第二类别是所述第一类别的子类别。

可选的，所述第一获得模块903，包括：第一获得单元和第一获取单元；

所述第一获得单元，用于通过第一分类模型对所述对象图像进行处理，获得所述第一分类模型输出的，所述对象图像中的对象的第一输出类别以及第一置信度，所述第一置信度是所述第一输出类别的置信度；

所述类别获取单元，用于当所述第一置信度高于第一阈值时，将所述第一输出类别获取为所述第一类别。

可选的，所述第一类别与所述第二分类模型具有唯一对应关系，所述模型确定模块，用于根据所述第一类别，获取与所述第一类别具有所述唯一对应关系的所述第二分类模型。

可选的，所述第一分类模型的输出结果中包含按照所述对象图像中的对象的轮廓生成的所述对象图像的第一输出类别；

或者，

所述第一分类模型的输出结果中包含按照所述对象图像中的对象的颜色生成的所述对象图像的第一输出类别。

可选的，所述第二获得模块，包括：第二获得单元和第二获取单元；

所述第二获得单元，用于通过所述第二分类模型对所述对象图像进行识别，获得所述对象图像的第二输出类别以及所述第二输出类别的置信度；

所述第二获取单元，用于当所述第二输出类别的置信度高于第二阈值时，将所述第二输出类别获取为所述第二类别。

可选的，所述图像提取模块，包括：物体框确定单元和图像获得单元；

所述物体框确定单元，用于通过图像分割模型确定所述目标图像中包含的各个对象的物体框，所述物体框用于指示对所述目标图像进行分割时的边界；所述图像分割模型是根据标注有对象分割边界的训练样本训练得到的机器学习模型；

所述图像获得单元，用于根据所述物体框对所述目标图像进行分割，获得至少一个所述对象图像；

所述第一获得模块，用于通过所述第一分类模型对所述各个对象图像进行处理，获得所述各个对象图像中的对象的第一类别。

可选的，所述装置还包括：

清晰度获取模块，用于在所述图像提取模块提取所述目标图像中的对象图像之前，获取所述目标图像的清晰度；

执行模块，用于当所述清晰度高于第三阈值时，执行所述提取所述目标图像中的对象图像的步骤。

请参考图10，其示出了本申请一个示例性实施例提供的终端的结构示意图，如图10所示，该终端包括处理器1010、存储器1020、显示组件1030和传感器组件1040，显示组件1030用于显示终端中前台运行的程序的界面，传感器组件1040用于采集各个传感器数据。所述存储器1020中存储有至少一条指令，所述指令由所述处理器1010加载并执行以实现如上各个实施例所述的方法中，由终端执行的部分或者全部步骤。

本申请实施例还提供了一种计算机可读介质，该计算机可读介质存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的图像处理方法中，由终端执行的全部或部分步骤。

本申请实施例还提供了一种计算机程序产品，该计算机程序产品存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的图像处理方法中，由终端执行的全部或部分步骤。

需要说明的是：上述实施例提供的图像处理装置在执行上述图像处理方法时，仅以上述各实施例进行举例说明，实际程序中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请可选的实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种图像处理方法，其特征在于，所述方法包括：

获取待识别的目标图像；

根据所述第一类别确定第二分类模型；

2.根据权利要求1所述的方法，其特征在于，所述通过第一分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第一类别，包括：

通过第一分类模型对所述对象图像进行处理，获得所述第一分类模型输出的，所述对象图像中的对象的第一输出类别以及第一置信度，所述第一置信度是所述第一输出类别的置信度；

当所述第一置信度高于第一阈值时，将所述第一输出类别获取为所述第一类别。

3.根据权利要求2所述的方法，其特征在于，所述第一类别与所述第二分类模型具有唯一对应关系，所述根据所述第一类别确定第二分类模型，包括：

根据所述第一类别，获取与所述第一类别具有所述唯一对应关系的所述第二分类模型。

4.根据权利要求2所述的方法，其特征在于，

所述第一分类模型的输出结果中包含按照所述对象图像中的对象的轮廓生成的所述对象图像的第一输出类别；

或者，

5.根据权利要求1所述的方法，其特征在于，所述通过所述第二分类模型对所述对象图像进行处理，获得所述对象图像中的对象的第二类别，包括：

通过所述第二分类模型对所述对象图像进行识别，获得所述对象图像的第二输出类别以及所述第二输出类别的置信度；

当所述第二输出类别的置信度高于第二阈值时，将所述第二输出类别获取为所述第二类别。

6.根据权利要求1所述的方法，其特征在于，所述提取所述目标图像中的对象图像，包括：

通过图像分割模型确定所述目标图像中包含的各个对象的物体框，所述物体框用于指示对所述目标图像进行分割时的边界；所述图像分割模型是根据标注有对象分割边界的训练样本训练得到的机器学习模型；

根据所述物体框对所述目标图像进行分割，获得至少一个所述对象图像。

7.根据权利要求1至6任一所述的方法，其特征在于，在所述提取所述目标图像中的对象图像之前，还包括：

获取所述目标图像的清晰度；

当所述清晰度高于第三阈值时，执行所述提取所述目标图像中的对象图像的步骤。

8.一种图像处理装置，其特征在于，所述装置包括：

图像获取模块，用于获取待识别的目标图像；

模型确定模块，用于根据所述第一类别确定第二分类模型；

9.一种计算机设备，其特征在于，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的图像处理方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的图像处理方法。