CN109522946A

CN109522946A - 一种图像分类模型处理方法、装置及存储介质

Info

Publication number: CN109522946A
Application number: CN201811290314.4A
Authority: CN
Inventors: 许明微
Original assignee: China Mobile Communications Group Co Ltd; MIGU Culture Technology Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; MIGU Culture Technology Co Ltd
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2019-03-26

Abstract

本发明公开了一种图像分类模型处理方法，包括：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；将源域子空间和目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；当所确定的满足预设最小差异条件时的降维后的源域图像样本出现过拟合时，通过源域样本的标签信息对源域图像样本进行聚集处理；对降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；将对齐加权后的源域图像样本以及对应的标签，应用于对目标域中新图像样本进行分类的模型。本发明还公开了一种图像分类模型处理和存储介质。

Description

一种图像分类模型处理方法、装置及存储介质

技术领域

本发明涉及计算机领域中的图像识别技术，尤其涉及一种图像分类模型处理方法、装置及存储介质。

背景技术

目前，在常规机器学习中有一个重要假设，即源域的样本数据(也称为训练数据)和目标域的样本数据(也称为测试数据)具有相同的分布。然而在很多实际应用中，这一假设往往是不成立的。因此，应用传统的图像识别方法训练出的图像分类模型的识别效果远不能达到人们的期望。

实际上，当源域的样本数据与目标域的样本数据不能满足独立同分布的条件时，可以采用领域自适应方法如非监督领域自适应方法对图像样本进行分类。相关技术中，常用的领域自适应方法包括测地流方法和子空间对齐(SA，Subspace Alignment)方法。

然而，利用测地流方法对图像样本进行分类时，存在以下缺陷：1)需要计算大量的中间子空间，导致算法复杂度很高；2)最终得到的最优解是局部最优解，而不是全局最优解。相比于测地流方法，SA方法虽然在样本识别准确率方面有所提高，但仍存在如下不足：该方法假设源域中所有图像样本的地位相同，即对源域中所有图像样本进行同等对待，然而在实际情景中，经常会出现源域图像样本与目标域图像样本的类别不平衡的现象。如图1所示，图1(a)为源域图像样本中的各类别图像的示意图，图1(b)为目标域图像样本中的各类别图像的示意图，通过对比图1(a)和图1(b)可见，源域和目标域中每类样本对应的数目，比如源域图像样本中的三角形个数与目标域图像样本中的三角形个数不均衡，从而导致图像识别准确度降低，使得模型训练学习的效果无法达到预期结果。

因此，对于如何克服由于源域图像样本的类别与目标域图像样本的类别不平衡而影响图像分类模型准确度的问题，相关技术尚未提出有效解决方案。

发明内容

有鉴于此，本发明实施例期望提供一种图像分类模型的处理方法、装置及存储介质，至少用以解决相关技术中由于源域图像样本的类别与目标域图像样本的类别不平衡而降低图像分类模型准确度的问题。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种图像分类模型处理方法，包括：

分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；

将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；

当所确定的满足预设最小差异条件时的降维后的源域图像样本出现过拟合时，通过所述源域样本的标签信息对所述源域图像样本进行聚集处理；

对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；

将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

上述方案中，所述通过所述源域样本的标签信息对所述源域图像样本进行聚集处理，包括：

通过所述源域样本的标签信息，确定对齐后的所述源域样本的类间散布矩阵；

通过所述源域样本的标签信息，确定对齐后的所述源域样本的类内散布矩阵；

基于所述源域样本的类间散布矩阵和类内散布矩阵，对所述源域样本的进行聚集处理，以形成聚集化的源域图像样本。

上述方案中，在所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型之前，所述方法还包括：

对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本；

所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型，包括：

将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

上述方案中，所述对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间，包括：

确定所述源域图像样本集在第一投影空间对应的第一投影矩阵，以及确定所述目标域图像样本集在第二投影空间对应的第二投影矩阵；

基于所述第一投影矩阵，从所述源域图像样本集中提取预设维数的第一图像特征，根据所述预设维数的第一图像特征确定所述源域子空间；

基于所述第二投影矩阵，从所述目标域图像样本集中提取所述预设维数的第二图像特征，根据所述预设维数的第二图像特征确定所述目标域子空间；

其中，所述预设维数小于提取图像特征前对应的维数。

上述方案中，在所述将所述源域子空间和所述目标域子空间中的样本对齐之前，所述方法还包括：

确定初始化的对齐矩阵和初始化的权重矩阵；

构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数；

确定所述目标函数满足第一收敛条件时的更新对齐矩阵；

所述将所述源域子空间和所述目标域子空间中的样本对齐，包括：

根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。

上述方案中，在所述对所述降维后的源域图像样本中各类别样本进行加权处理之前，所述方法还包括：确定所述目标函数满足第二收敛条件时的更新权重矩阵；

所述对所述降维后的源域图像样本中各类别样本进行加权处理，包括：

根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理。

上述方案中，所述方法还包括：

将所述源域子空间和所述目标域子空间中的样本对齐时，确定所述原始空间中相应种类的所述源域样本的集合；

确定所述原始空间中所有种类的所述源域样本的集合；

基于所述源域样本的种类确定所述源域样本的压缩矩阵；

通过所述源域样本的压缩矩阵对经过对齐的所述目标域子空间中的样本进行处理。

上述方案中，所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型，包括：

以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；

获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；

基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。

本发明实施例还提供了一种图像分类模型的处理装置，包括：

降维模块，用于分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；

对齐模块，用于将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；

聚集处理模块，用于通过所述源域样本的标签信息对所述源域图像样本进行聚集处理；

加权模块，用于对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；

应用模块，用于将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

上述方案中，

所述聚集处理模块，用于通过所述源域样本的标签信息，确定对齐后的所述源域样本的类间散布矩阵；

所述聚集处理模块，用于通过所述源域样本的标签信息，确定对齐后的所述源域样本的类内散布矩阵；

所述聚集处理模块，用于基于所述源域样本的类间散布矩阵和类内散布矩阵，对所述源域样本的进行聚集处理，以形成聚集化的源域图像样本。

上述方案中，

所述降维模块，用于对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本；

所述应用模块，用于将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

上述方案中，

所述降维模块，用于确定所述源域图像样本集在第一投影空间对应的第一投影矩阵，以及确定所述目标域图像样本集在第二投影空间对应的第二投影矩阵；

所述降维模块，用于基于所述第一投影矩阵，从所述源域图像样本集中提取预设维数的第一图像特征，根据所述预设维数的第一图像特征确定所述源域子空间；

所述降维模块，用于基于所述第二投影矩阵，从所述目标域图像样本集中提取所述预设维数的第二图像特征，根据所述预设维数的第二图像特征确定所述目标域子空间；

其中，所述预设维数小于提取图像特征前对应的维数。

上述方案中，

所述对齐模块，用于确定初始化的对齐矩阵和初始化的权重矩阵；

所述对齐模块，用于构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数；

所述对齐模块，用于确定所述目标函数满足第一收敛条件时的更新对齐矩阵；

所述对齐模块，用于根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。

上述方案中，

所述加权模块，用于确定所述目标函数满足第二收敛条件时的更新权重矩阵；

所述加权模块，用于根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理。

上述方案中，

所述对齐模块，用于将所述源域子空间和所述目标域子空间中的样本对齐时，确定所述原始空间中相应种类的所述源域样本的集合；

所述聚集处理模块，用于确定所述原始空间中所有种类的所述源域样本的集合；

所述聚集处理模块，用于基于所述源域样本的种类确定所述源域样本的压缩矩阵；

所述聚集处理模块，用于通过所述源域样本的压缩矩阵对经过对齐的所述目标域子空间中的样本进行处理。

上述方案中，

所述应用模块，用于以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；

所述应用模块，用于获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；

所述应用模块，用于基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。

本发明实施例还提供了一种存储介质，其上存储有可执行程序，其特征在于，所述可执行程序被处理器执行时实现如：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；

本发明实施例还提供了一种图像分类模型的处理装置，包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序，其特征在于，所述处理器运行所述可执行程序时执行：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；

本发明实施例所提供的图像分类模型处理方法、装置及存储介质，通过对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间，将源域子空间和目标域子空间中的样本进行对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；当所确定的满足预设最小差异条件时的降维后的源域图像样本出现过拟合时，通过所述源域样本的标签信息对所述源域图像样本进行聚集处理；对所述降维后的源域图像样本中各类别样本进行加权处理，以得到对齐加权后的源域图像样本；最后，将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。如此，在对齐源域子空间和目标域子空间中的样本之后，对降维后的源域图像样本中各类别样本进行加权处理，可以减小因源域图像样本的类别与目标域图像样本的类别不平衡而对图像分类模型的准确度所带来的影响；并且，采用上述构建的图像分类模型对待识别的目标域新图像样本进行分类识别，使得训练的分类器可以更加的鲁棒，能够得到很好的识别结果，从而大大提高图像识别的准确度，提升用户使用体验，进一步的，由于通过所述源域样本的标签信息对所述源域图像样本进行聚集处理可以有效避免降维后的源域图像样本出现过拟合。

附图说明

图1A为源域图像样本中的各类别图像的示意图；

图1B为目标域图像样本中的各类别图像的示意图；

图1C为源域样本加权处理图像的示意图；

图1D为对源域样本进行线性判别处理的示意图；

图2本发明实施例提供的图像分类模型的处理方法的一个可选的实现流程示意图；

图3为本发明实施例提供的图像分类模型的处理方法的另一个可选的实现流程示意图；

图4为本发明实施例提供的图像分类模型的处理装置的一个可选的功能结构示意图；

图5为本发明实施例提供的图像分类模型的处理装置的另一个可选的功能结构示意图；

图6为本发明实施例提供的图像分类模型的处理装置的一个可选的硬件结构示意图。

具体实施方式

为了能够更加详尽地了解本发明实施例的特点与技术内容，下面结合附图对本发明实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本发明。

图2为本发明实施例提供的图像分类模型的处理方法的一个可选的实现流程示意图，所述图像分类模型的处理方法可应用于服务器或终端设备中；如图2所示，本发明实施例中的图像分类模型的处理方法的实现流程，可以包括以下步骤：

步骤201：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间。

本发明实施例中，可选地，采用主成分分析(PCA，Principal ComponentsAnalysis)方法对原始空间中的源域图像样本集和目标域图像样本集进行降维。PCA是一种分析、简化数据集的技术，主要用于减少数据集的维数，同时保持数据集中的对方差贡献最大的特征。对于原始空间中的源域图像样本集和目标域图像样本集来说，利用PCA方法保留源域图像样本集和目标域图像样本集中的低阶主成分，忽略源域图像样本集和目标域图像样本集中的高阶主成分，而这里所保留的低阶主成分能够体现源域图像样本集和目标域图像样本集中的重要图像特征，而忽略的高阶主成分一般不包括重要图像特征，因此，即使忽略了源域图像样本集和目标域图像样本集中的高阶主成分也不会影响到图像的整体效果。这样，通过降维操作可以去除图像中冗余的图像特征和噪声。

这里，对源域图像样本集和目标域图像样本集中的高阶主成分进行降维的过程，主要是将原始空间中的高维图像特征投影到较低维的特征空间中，从较低维的特征空间中分离出能够体现源域图像样本和目标域图像样本中的关键图像特征。

在本发明实施例中，对于本步骤201中的对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间的具体过程可以包括：

其中，所述预设维数小于提取图像特征前对应的维数。

这里，本发明实施例的图像分类模型的处理方法应用的服务器可以是远程服务器或云端服务器，该图像分类模型的处理方法应用的终端设备可以是智能电子设备，作为一种较佳的实施例，智能电子设备可以为智能手机或平板电脑。

步骤202：将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本。

在本发明实施例中，在执行本步骤202中的将所述源域子空间和所述目标域子空间中的样本对齐之前，所述方法还可以包括：确定初始化的对齐矩阵和初始化的权重矩阵；

确定所述目标函数满足第一收敛条件时的更新对齐矩阵。

相应的，对于本步骤202中的将所述源域子空间和所述目标域子空间中的样本对齐来说，可以采用如下方式实现：根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。

这里，构建的目标函数是以源域子空间、目标域子空间、初始化的对齐矩阵以及初始化的权重矩阵为因子的范数函数，对于确定更新对齐矩阵来说，实现的过程是：以求解目标函数最小值的方式，固定权重矩阵，确定目标函数满足第一收敛条件时的更新对齐矩阵。

步骤203：确定的满足预设最小差异条件时的降维后的源域图像样本是否出现过拟合，如果是，执行步骤204，否者执行步骤205。

步骤204：通过所述源域样本的标签信息对所述源域图像样本进行聚集处理。

步骤205：对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本。

在本发明实施例中，在执行本步骤205之前，所述方法还包括：确定初始化的对齐矩阵和初始化的权重矩阵；

确定所述目标函数满足第二收敛条件时的更新权重矩阵。

相应的，对于本步骤205中的对所述降维后的源域图像样本中各类别样本进行加权处理来说，可以采用如下方式实现：根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理。

这里，构建的目标函数同样是以源域子空间、目标域子空间、初始化的对齐矩阵以及初始化的权重矩阵为因子的范数函数，对于确定更新权重矩阵来说，实现的过程是：以求解目标函数最小值的方式，固定对齐矩阵，确定目标函数满足第二收敛条件时的更新权重矩阵。

步骤206：将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

在本发明实施例中，对于本步骤206中的将对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型来说，可以采用如下方式实现：

首先，以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；然后，获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；最后，基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。

这里，在获得目标域中新图像样本的标签之后，可以根据标签快速识别目标域中新图像样本。具体来说，可将待识别的目标域新图像样本数据输入图像分类模型，对待识别的目标域新图像样本数据中各数据的向量表示进行变换，将变换后的结果作为目标域新图像样本数据所属类别的概率进行输出，以获得待识别的目标域新图像样本数据中的各数据分别所属类别的各概率值，也即获得目标域中新图像样本的各数据具有不同标签的概率大小。基于图像分类模型中不同节点的激励函数，对输入的目标域新图像样本数据的向量表示进行变换，将变换的结果作为类别的向量表示及其对应的概率。本发明实施例中符合概率条件的标签可为概率最高的作为待识别的目标域新图像样本数据的标签。也就是说，从图像分类模型输出的各概率值中选取概率最高值对应的标签，作为最终识别出的图像类别。

在一些实施例中，除了上述将对齐加权后的源域图像样本以及对应的标签进行模型训练，得到对目标域新图像样本进行识别的结果以外，还可以基于以所述对齐加权后的源域图像样本及对应的标签为因子的相似性函数，对目标域新图像样本进行近邻分类，得到目标域新图像样本的标签。

在本发明一可选实施例中，在执行本步骤206之前，所述方法还可以包括：对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本。

对于本步骤206中的将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型来说，可以采用以下方式实现：将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

这里，对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本，可以包括：将所述目标域中新图像样本映射到一个特征空间中，得到映射后的目标域新图像样本；对所述映射后的目标域新图像样本进行降维，得到降维后的目标域新图像样本。

需要说明的是，这里所映射的特征空间为一个高维空间，其中，所述特征空间的维数远大于所述原始空间的维数。

下面对本发明实施例图像分类模型的处理方法的具体实现过程做进一步地详细说明。

图3为本发明实施例提供的图像分类模型的处理方法的另一个可选的实现流程示意图，所述图像分类模型的处理方法可应用于服务器或终端设备中；如图3所示，本发明实施例中的图像分类模型的处理方法的具体实现流程，可以包括以下步骤：

步骤301：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间。

在本发明实施例中，可采用PCA方法对原始空间中的源域图像样本集和目标域图像样本集进行降维，主要实现过程是：将原始空间中的高维图像特征投影到较低维的特征空间中，从较低维的特征空间中分离出能够体现源域图像样本和目标域图像样本中的关键图像特征。

在本发明实施例中，对于本步骤301中的对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间来说，可以采用以下方式实现：

其中，所述预设维数小于提取图像特征前对应的维数。

步骤302：确定初始化的对齐矩阵和初始化的权重矩阵，构建以所述源域子空间、目标域子空间、初始化的对齐矩阵以及初始化的权重矩阵为因子的目标函数，确定所述目标函数满足第一收敛条件时的更新对齐矩阵。

步骤303：根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本。

这里，所构建的目标函数是以源域子空间、目标域子空间、初始化的对齐矩阵以及初始化的权重矩阵为因子的范数函数，对于确定更新对齐矩阵来说，实现的过程是：以求解目标函数最小值的方式，固定权重矩阵，确定目标函数满足第一收敛条件时的更新对齐矩阵。

步骤304：确定所述目标函数满足第二收敛条件时的更新权重矩阵。

步骤305：根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本。

在执行步骤305之前，所述方法还包括：当所确定的满足预设最小差异条件时的降维后的源域图像样本出现过拟合时，通过所述源域样本的标签信息对所述源域图像样本进行聚集处理。

在本发明的一个实施例中，所述通过所述源域样本的标签信息对所述源域图像样本进行聚集处理，包括：

这里，所构建的目标函数同样是以源域子空间、目标域子空间、初始化的对齐矩阵以及初始化的权重矩阵为因子的范数函数，对于确定更新权重矩阵来说，实现的过程是：以求解目标函数最小值的方式，固定对齐矩阵，确定目标函数满足第二收敛条件时的更新权重矩阵。

下面对目标函数的构建，以及根据目标函数求解更新对齐矩阵和更新权重矩阵的实现过程进行详细说明。

首先对目标函数的构建过程进行说明：

令p_s(X_s)和p_t(X_t)分别表示源域图像样本X_s和目标域图像样本X_t的概率密度函数，Y_s和Y_t分别表示源域图像样本X_s和目标域图像样本X_t的标签，那么，p_s(X_s)和p_t(X_t)可以进一步地表示成类条件分布的组合：

其中，和分别表示源域图像样本和目标域图像样本的类先验概率，C表示源域图像样本和目标域图像样本中的类别数目。

为了比较源域图像样本和目标域图像样本在对齐子空间中的分布差异，本发明实施例构造了一种源域图像分布p_s,α(X^s)，具体来说就是要求p_s,α(X^s)与目标域图像具有相同的类权重，同时又可以表示源域图像的类条件分布。令p_s,α(X^s)具体可以表示成：

令表示给定的带标签的源域图像样本，其中，表示源域图像中的第i个样本，表示源域图像中的第i个样本的标签，n_s表示源域图像中样本的个数；表示不带标签的目标域图像样本，其中，表示目标域图像中的第j个样本，n_t表示目标域图像中样本的个数。那么，目标函数可以表示成：

其中，表示F范数，M表示初始化的对齐矩阵，α表示初始化的权重矩阵，P_s表示源域子空间，P_t表示目标域子空间。对于目标函数中其他参数的含义，可参照上面的描述。

进一步的，在本发明的一个实施例中，可以利用源域样本的标签信息使得在原始空间中不同类别的源域样本在对齐后的空间中尽可能的分散，属于同类别的源域样本在对齐后的空间中尽可能的聚集，其中，约束项可以具体表示成如下最优化模型：

argmin_Mλtr(S_w)+argmax_Mβtr(S_b) (2)

其中表示正则化常数，和分别表示对齐后的空间中源域样本的类间散布矩阵和类内散布矩阵，控制着原始空间中同类别的源域样本在对齐后的空间中的聚集程度，控制着原始空间中属于不同类别的源域样本在对齐后的空间中的分散程度，它们的表达式分别为：

其中n_i表示第i类样本的个数，μ_i表示第μ类样本的均值，表示所有样本的均值。μ_i和μ的表达式为：

将模型(1)和模型(2)结合起来得到我们所描述的一种用于图像识别的基于邻域保持的加权子空间对齐方法最终表达形式如下：

上述模型(7)相当于在对齐源域子空间和目标域子空间的同时，对模型(1)中的源域样本进行加权处理的过程中，如图1C所示，让源域同类样本尽可能的聚集在一起，不同类的样本尽可能的分开，保留着样本良好的可分性，最终利于分类器的训练。

下面说明下根据目标函数求解更新对齐矩阵和更新权重矩阵的实现过程：

令则上述公式(3)中的第一项可以重写成：

令则上述公式(3)中的第二项可以重写成：

最终基于F范数和矩阵轨迹之间的关系，上述目标函数可以表示成：

令

固定初始化的对齐矩阵M，对目标函数f(M,α)中的α进行求导，可得：

令可得

固定初始化的权重矩阵α，对目标函数f(M,α)中的M进行求导，可得：

令可得

通过上述求解过程即可获得更新权重矩阵如上述公式(5)所示，以及获得更新对齐矩阵如上述公式(6)所示，进而根据更新对齐矩阵，将源域子空间和目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；根据更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本。

进一步的，将模型(7)的第二项展开：

其中表示原始空间中第i类源域样本的集合。

其中表示原始空间中所有源域样本的集合，L是一个块对角矩阵，对角元素

将模型(7)的第三项展开：

由等式(8)可知因此：

其中D是一个n_s×n_s对角矩阵，对角元素

其中是一个n_s×n_s对角矩阵，矩阵中的每个元素都是

最终模型的第三项可以化简为：

其中G＝D-W是一个n_s×n_s的拉普拉斯矩阵。

因此，最终模型可以表述成：

步骤306：将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

在本发明实施例中，本步骤306的具体实现过程是：首先，以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；然后，获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；最后，基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。在获得目标域中新图像样本的标签之后，可以根据标签快速识别目标域中新图像样本。

具体来说，可将待识别的目标域新图像样本数据输入图像分类模型，对待识别的目标域新图像样本数据中各数据的向量表示进行变换，将变换后的结果作为目标域新图像样本数据所属类别的概率进行输出，以获得待识别的目标域新图像样本数据中的各数据分别所属类别的各概率值，也即获得目标域中新图像样本的各数据具有不同标签的概率大小。基于图像分类模型中不同节点的激励函数，对输入的目标域新图像样本数据的向量表示进行变换，将变换的结果作为类别的向量表示及其对应的概率。本发明实施例中符合概率条件的标签可为概率最高的作为待识别的目标域新图像样本数据的标签。也就是说，从图像分类模型输出的各概率值中选取概率最高值对应的标签，作为最终识别出的图像类别。

在本发明一可选实施例中，在执行本步骤306之前，所述方法还包括：对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本。

对于本步骤306中的将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型来说，可以采用以下方式实现：将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

采用本发明实施例的技术方案，在对齐源域子空间和目标域子空间中的样本之后，对降维后的源域图像样本中各类别样本进行加权处理，可以减小因源域图像样本的类别与目标域图像样本的类别不平衡而对图像分类模型的准确度所带来的影响；并且，采用上述构建的图像分类模型对待识别的目标域新图像样本进行分类识别，使得训练的分类器可以更加的鲁棒，能够更好的得到图像识别结果，从而提高图像识别的准确度。

为了实现上述图像分类模型的处理方法，本发明实施例还提供了一种图像分类模型的处理装置，该图像分类模型的处理装置可应用于服务器或终端设备中，图4为本发明实施例提供的图像分类模型的处理装置的一个可选的功能结构示意图；如图4所示，该图像分类模型的处理装置包括降维模块41、对齐模块42、加权模块43和应用模块44和聚集处理模块49。下面对各程序模块进行详细说明。

降维模块41，用于分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；

对齐模块42，用于将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；

聚集处理模块49，用于通过所述源域样本的标签信息对所述源域图像样本进行聚集处理；

加权模块43，用于对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；

应用模块44，用于将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

这里，所述降维模块41，具体用于：

其中，所述预设维数小于提取图像特征前对应的维数。

在本发明一可选实施例中，对于所述应用模块44将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型来说，可以采用如下方式来实现：首先，以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；然后，获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；最后，基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。

在本发明一可选实施例中，所述降维模块41，还用于在所述应用模块44将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型之前，对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本。

所述应用模块44，具体用于：将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

图5为本发明实施例提供的图像分类模型的处理装置的另一个可选的功能结构示意图，如图5所示，该图像分类模型的处理装置还包括：

第一确定模块45，用于在所述对齐模块42在将所述源域子空间和所述目标域子空间中的样本对齐之前，确定初始化的对齐矩阵和初始化的权重矩阵；

函数构建模块46，用于构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数；

第二确定模块47，用于确定所述目标函数满足第一收敛条件时的更新对齐矩阵。

在本发明一可选实施例中，对于所述对齐模块42将所述源域子空间和所述目标域子空间中的样本对齐来说，可以采用如下方式实现：根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。

在本发明另一可选实施例中，该图像分类模型的处理装置还包括：

第三确定模块48，用于在所述加权模块43在对所述降维后的源域图像样本中各类别样本进行加权处理之前，确定所述目标函数满足第二收敛条件时的更新权重矩阵。

这里，对于所述加权模块43对所述降维后的源域图像样本中各类别样本进行加权处理来说，可以采用如下方式实现：根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理。

需要说明的是：上述实施例提供的图像分类模型的处理装置在对图像分类模型进行处理时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将图像分类模型的处理装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者部分处理。另外，上述实施例提供的图像分类模型的处理装置与图像分类模型的处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再详细赘述。

在实际应用中，上述程序模块中的降维模块41、对齐模块42、加权模块43、应用模块44、第一确定模块45、函数构建模块46、第二确定模块47和第三确定模块48均可由位于服务器或终端设备上的中央处理器(CPU，Central Processing Unit)、微处理器(MPU，MicroProcessor Unit)、数字信号处理器(DSP，Digital Signal Processor)或现场可编程门阵列(FPGA，Field Programmable Gate Array)等实现。

为了实现上述图像分类模型的处理方法，本发明实施例还提供了一种图像分类模型的处理装置的硬件结构。现在将参考附图描述实现本发明实施例的图像分类模型的处理装置，该图像分类模型的处理装置可以以各种形式来实施，例如服务器如云服务器、终端设备如台式机电脑、笔记本电脑、智能手机等各种类型的计算机设备。下面对本发明实施例的图像分类模型的处理装置的硬件结构做进一步说明，可以理解，图6仅仅示出了图像分类模型的处理装置的示例性结构而非全部结构，根据需要可以实施图6示出的部分结构或全部结构。

参见图6，图6为本发明实施例提供的一种图像分类模型的处理装置的一个可选的硬件结构示意图，实际应用中可以应用于前述运行应用程序的各种服务器或终端设备中，图6所示的图像分类模型的处理装置600包括：至少一个处理器601、存储器602、用户接口603和至少一个网络接口604。所述图像分类模型的处理装置600中的各个组件通过总线系统605耦合在一起。可以理解，总线系统605用于实现这些组件之间的连接通信。总线系统605除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图6中将各种总线都标为总线系统605。

其中，用户接口603可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。

可以理解，存储器602可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。

本发明实施例中的存储器602用于存储各种类型的数据以支持图像分类模型的处理装置600的操作。这些数据的示例包括：用于在图像分类模型的处理装置600上操作的任何计算机程序，如可执行程序6021和操作系统6022，实现本发明实施例的图像分类模型的处理方法的程序可以包含在可执行程序6021中。

本发明实施例揭示的图像分类模型的处理方法可以应用于处理器601中，或者由处理器601实现。处理器601可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述图像分类模型的处理方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器、DSP，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器601可以实现或者执行本发明实施例中提供的各图像分类模型的处理方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所提供的图像分类模型的处理方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器602，处理器601读取存储器602中的信息，结合其硬件完成本发明实施例提供的图像分类模型的处理方法的步骤。

在本发明实施例中，所述图像分类模型的处理装置600包括存储器602、处理器601及存储在存储器602上并能够由所述处理器601运行的可执行程序6021，所述处理器601运行所述可执行程序6021时实现：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

作为一种实施方式，所述处理器601运行所述可执行程序6021时实现：在所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型之前，对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

作为一种实施方式，所述处理器601运行所述可执行程序6021时实现：确定所述源域图像样本集在第一投影空间对应的第一投影矩阵，以及确定所述目标域图像样本集在第二投影空间对应的第二投影矩阵；基于所述第一投影矩阵，从所述源域图像样本集中提取预设维数的第一图像特征，根据所述预设维数的第一图像特征确定所述源域子空间；基于所述第二投影矩阵，从所述目标域图像样本集中提取所述预设维数的第二图像特征，根据所述预设维数的第二图像特征确定所述目标域子空间；其中，所述预设维数小于提取图像特征前对应的维数。

作为一种实施方式，所述处理器601运行所述可执行程序6021时实现：在所述将所述源域子空间和所述目标域子空间中的样本对齐之前，确定初始化的对齐矩阵和初始化的权重矩阵；构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数；确定所述目标函数满足第一收敛条件时的更新对齐矩阵；根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。

作为一种实施方式，所述处理器601运行所述可执行程序6021时实现：在所述对所述降维后的源域图像样本中各类别样本进行加权处理之前，确定所述目标函数满足第二收敛条件时的更新权重矩阵；根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理。

作为一种实施方式，所述处理器601运行所述可执行程序6021时实现：以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。

在示例性实施例中，本发明实施例还提供了一种存储介质，该存储介质可为光盘、闪存或磁盘等存储介质，可选为非瞬间存储介质。其中，所述存储介质上存储有可执行程序6021，所述可执行程序6021被处理器601执行时实现：分别对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间；将所述源域子空间和所述目标域子空间中的样本对齐，确定源域与目标域之间的分布差异化满足预设最小差异条件时的降维后的源域图像样本；对所述降维后的源域图像样本中各类别样本进行加权处理，得到对齐加权后的源域图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型。

作为一种实施方式，所述可执行程序6021被处理器601执行时实现：在所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型之前，对所述目标域中新图像样本进行降维，得到降维后的目标域新图像样本；将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述降维后的目标域新图像样本进行分类的模型。

作为一种实施方式，所述可执行程序6021被处理器601执行时实现：确定所述源域图像样本集在第一投影空间对应的第一投影矩阵，以及确定所述目标域图像样本集在第二投影空间对应的第二投影矩阵；基于所述第一投影矩阵，从所述源域图像样本集中提取预设维数的第一图像特征，根据所述预设维数的第一图像特征确定所述源域子空间；基于所述第二投影矩阵，从所述目标域图像样本集中提取所述预设维数的第二图像特征，根据所述预设维数的第二图像特征确定所述目标域子空间；其中，所述预设维数小于提取图像特征前对应的维数。

作为一种实施方式，所述可执行程序6021被处理器601执行时实现：在所述将所述源域子空间和所述目标域子空间中的样本对齐之前，确定初始化的对齐矩阵和初始化的权重矩阵；构建以所述源域子空间、所述目标域子空间、所述初始化的对齐矩阵以及所述初始化的权重矩阵为因子的目标函数；确定所述目标函数满足第一收敛条件时的更新对齐矩阵；根据所述更新对齐矩阵，将所述源域子空间和所述目标域子空间中的样本对齐。

作为一种实施方式，所述可执行程序6021被处理器601执行时实现：在所述对所述降维后的源域图像样本中各类别样本进行加权处理之前，确定所述目标函数满足第二收敛条件时的更新权重矩阵；根据所述更新权重矩阵，对所述降维后的源域图像样本中各类别样本进行加权处理。

作为一种实施方式，所述可执行程序6021被处理器601执行时实现：以所述对齐加权后的源域图像样本以及对应的标签为输入值，输入所述模型中；获取所述模型输出的各概率值；其中，所述各概率值分别表示所述目标域中新图像样本的各数据具有不同标签的概率大小；基于所述各概率值，选取符合概率条件的标签作为所述目标域中新图像样本的标签。

采用本发明实施例的技术方案，在对齐源域子空间和目标域子空间中的样本之后，对降维后的源域图像样本中各类别样本进行加权处理，可以减小因源域图像样本的类别与目标域图像样本的类别不平衡而对图像分类模型的准确度所带来的影响；并且，采用上述构建的图像分类模型对待识别的目标域新图像样本进行分类识别，使得训练的分类器可以更加的鲁棒，能够得到很好的识别结果，从而提高图像识别的准确度。

本领域技术人员应当理解，本发明实施例所记载的各技术方案之间，在不冲突的情况下，可以任意组合。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或可执行程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的可执行程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和可执行程序产品的流程图和/或方框图来描述的。应理解可由可执行程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些可执行程序指令到通用计算机、专用计算机、嵌入式处理机或参考可编程数据处理设备的处理器以产生一个机器，使得通过计算机或参考可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些可执行程序指令也可存储在能引导计算机或参考可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些可执行程序指令也可装载到计算机或参考可编程数据处理设备上，使得在计算机或参考可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或参考可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种图像分类模型处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的图像分类模型的处理方法，其特征在于，所述通过所述源域样本的标签信息对所述源域图像样本进行聚集处理，包括：

3.根据权利要求1所述的图像分类模型的处理方法，其特征在于，在所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型之前，所述方法还包括：

4.根据权利要求1所述的图像分类模型的处理方法，其特征在于，所述对原始空间中的源域图像样本集和目标域图像样本集进行降维，对应得到源域子空间和目标域子空间，包括：

其中，所述预设维数小于提取图像特征前对应的维数。

5.根据权利要求1所述的图像分类模型的处理方法，其特征在于，在所述将所述源域子空间和所述目标域子空间中的样本对齐之前，所述方法还包括：

确定初始化的对齐矩阵和初始化的权重矩阵；

确定所述目标函数满足第一收敛条件时的更新对齐矩阵；

6.根据权利要求5所述的图像分类模型的处理方法，其特征在于，在所述对所述降维后的源域图像样本中各类别样本进行加权处理之前，所述方法还包括：确定所述目标函数满足第二收敛条件时的更新权重矩阵；

7.根据权利要求5所述的图像分类模型的处理方法，其特征在于，所述方法还包括：

确定所述原始空间中所有种类的所述源域样本的集合；

基于所述源域样本的种类确定所述源域样本的压缩矩阵；

8.根据权利要求1所述的图像分类模型的处理方法，其特征在于，所述将所述对齐加权后的源域图像样本以及对应的标签，应用于对所述目标域中新图像样本进行分类的模型，包括：

9.一种图像分类模型的处理装置，其特征在于，所述装置包括：

10.一种存储介质，其上存储有可执行程序，其特征在于，所述可执行程序被处理器执行时实现如权利要求1至8任一项所述的图像分类模型的处理方法的步骤。

11.一种图像分类模型的处理装置，包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序，其特征在于，所述处理器运行所述可执行程序时执行如权利要求1至8任一项所述的图像分类模型的处理方法的步骤。