WO2022095356A1

WO2022095356A1 - 用于图像分类的迁移学习方法、相关装置及存储介质

Info

Publication number: WO2022095356A1
Application number: PCT/CN2021/090571
Authority: WO
Inventors: 罗闯
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-11-05
Filing date: 2021-04-28
Publication date: 2022-05-12
Also published as: CN112348081B; CN112348081A

Abstract

一种用于图像分类的迁移学习方法，涉及人工智能技术领域，其中该方法包括：将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据源域图像数据得到目标域图像数据的伪标签（S21）；将源域图像数据与带有伪标签的目标域图像数据对齐，得到对齐后的源域图像数据和对齐后的目标域图像数据（S22）；利用对齐后的源域图像数据构建分类器，采用构建好的分类器对对齐后的目标域图像数据进行分类，得到目标域图像数据的预测标签（S23）；基于预测标签对目标域图像数据分类，得到分类结果（S24）。所述方法有利于提高迁移学习的效果，进而提高图像分类的准确性。此外，还涉及区块链技术，构建的分类器可存储于区块链节点中。

Description

用于图像分类的迁移学习方法、相关装置及存储介质

本申请要求于2020年11月5日提交中国专利局、申请号为202011228529.0，发明名称为“用于图像分类的迁移学习方法、相关装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器学习技术领域，尤其涉及一种用于图像分类的迁移学习方法、相关装置及存储介质。

背景技术

随着人工智能和机器学习的发展，迁移学习被广泛应用于图像、文本等各种分类问题中。传统的迁移学习算法通常在源域和目标域数据服从同一分布的假设上，用大量源域数据训练出用于对目标域数据进行分类的分类器，然而实际场景中该假设很难被满足。基于此，发明人发现，现有技术中也提出了减小两个域之间的数据分布差异的方法，认为源域和目标域之间存在着一个公共流形，在公共子空间中对齐源域和目标域的流行以减小二者的分布差异。但是，发明人意识到，实际应用中源域和目标域之间并不存在对应点对来实现两个域流形的对齐，这样的方式并不具有代表性，迁移效果仍然不理想。

发明内容

针对上述问题，本申请提供了一种用于图像分类的迁移学习方法、相关装置及存储介质，有利于提高迁移学习的效果，进而提高图像分类的准确性。

为实现上述目的，本申请实施例第一方面提供了一种用于图像分类的迁移学习方法，该方法包括：

将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

基于所述预测标签对所述目标域图像数据分类，得到分类结果。

本申请实施例第二方面提供了一种用于图像分类的迁移学习装置，该装置包括：

伪标签生成模块，用于将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

数据对齐模块，用于将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

标签预测模块，用于利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

数据分类模块，用于基于所述预测标签对所述目标域图像数据分类，得到分类结果。

本申请实施例第三方面提供了一种电子设备，该电子设备包括输入设备和输出设备，还包括处理器，适于实现一条或多条指令；以及，计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行以下方法：

本申请实施例第四方面提供了一种计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行以下方法：

可以看出，本申请实施例有利于提高迁移学习的效果，进而提高图像分类的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种用于图像分类的迁移学习方法的系统框图；

图2为本申请实施例提供的一种用于图像分类的迁移学习方法的流程示意图；

图3为本申请实施例提供的一种获取光谱近邻点的示例图；

图4为本申请实施例提供的一种将源域图像数据和目标域图像数据对齐的示例图；

图5为本申请实施例提供的另一种用于图像分类的迁移学习方法的流程示意图；

图6为本申请实施例提供的一种用于图像分类的迁移学习装置的结构示意图；

图7为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

本申请说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外，术语“第一”、“第二”和“第三”等是用于区别不同的对象，而并非用于描述特定的顺序。

本申请的技术方案涉及人工智能技术领域，如可具体涉及机器学习技术，以实现图像分类，从而可推动智慧城市的建设。可选的，本申请涉及的数据如图像数据和/或分类结果等可存储于数据库中，或者可以存储于区块链中，本申请不做限定。

以下结合相关附图对本申请实施例提供的用于图像分类的迁移学习方法进行详细阐述。

请参见图1，图1为本申请实施例提供的一种用于图像分类的迁移学习方法的系统框图，如图1所示，该系统包括终端11、12、13，服务器15，终端11、12、13通过网络14与服务器15通信，在一些示例中，终端11、12、13可以向服务器15发送用于图像分类的迁移学习请求，服务器15可以响应该请求为终端11、12、13提供后台服务，例如：通过数据协议接口从数据库获取源域图像数据和目标域图像数据，并将其映射到流行空间，采用空间滤波获取目标域图像数据的伪标签；在一些示例中，服务器15可通过数据处理接口将源域图像数据和目标域图像数据各个类别进行对齐，并利用对齐后的源域图像数据训练分类器或分类模型，并可对构建好的分类器进行保存或下发至终端11、12、13；在一些示例中，服务器15可通过数据分类接口调用构建好的分类器预测对齐后的目标域图像数据的标签，基于预测出的标签对目标域图像数据进行分类，并对分类结果进行存储或将分类结果返回到终端11、12、13，等等。其中，上述服务器15可以是独立的物理服务器，也可以是服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

请参见图2，图2为本申请实施例提供的一种用于图像分类的迁移学习方法的流程示意图，可以理解的，该方法由电子设备执行，电子设备包括但不限于终端、服务器，如图2所示，该方法包括步骤S21-S24：

S21，将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签。

本申请具体实施例中，源域图像数据是指带有真实标签的图像，目标域图像数据是指未带有标签的图像，例如：源域图像数据可以是开源数据库中的图像，也可以是对本地存储的图像进行标注后的图像，其中，本地存储的图像可以是闸机通道、小区、高速路等任何场景下采集的图像，目标域图像数据也可以是上述场景下采集的图像，区别在于未带有标签信息。由于在流行空间中的特征数据通常有着很好的几何性质，因此可将原始空间中的源域图像数据和目标域图像数据映射到流形空间，在流形空间中将两个域的数据进行对齐。

在一种可能的实施方式中，所述根据所述源域图像数据得到所述目标域图像数据的伪标签，包括：

针对所述目标域图像数据中的目标数据点，在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点；

判断所述k个光谱近邻点对应的真实标签是否一致；

在所述k个光谱近邻点对应的真实标签一致的情况下，将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。

具体的，目标数据点是指目标域图像数据映射在流行空间中的每个数据点，k个光谱近邻点可以通过欧氏距离计算得到，也可以通过光谱角距离计算得到，例如：在流行空间中计算所述目标数据点与源域图像数据中数据点之间的欧氏距离，将欧氏距离最近的k个数据点确定为所述k个光谱近邻点。如图3所示，对于目标数据点Xi，通过欧氏距离的计算在源域图像数据可以找到其k个光谱近邻点X1、X2、X3…Xk。k个光谱近邻点对应的真实标签一致说明其属于同一个类别，而该目标数据点的光谱特征也只与源域图像数据中一个类别的数据的光谱特征相似，该目标数据点就会被分类到k个光谱近邻点所属的类别，因此，可以将所述k个光谱近邻点的真实标签作为该目标数据点的伪标签。相反地，若k个光谱近邻点对应的真实标签不一致，则说明该目标数据点的光谱特征与源域图像数据中多个类别的数据的光谱特征相似，若还将这k个光谱近邻点对应的某个真实标签作为该目标数据点的伪标签，则该目标数据点有极大的概率会被分类器分错类别。

S22，将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。

本申请具体实施例中，在得到带有伪标签的目标域图像数据后，执行将带有真实标签的源域图像数据与带有伪标签的目标域图像数据的对齐操作，为了使目标域图像数据更具备可分性，流行空间需要满足三个约束条件：流形空间中数据点保持在原始空间中的相对关系；流形空间中标签相同的数据点之间的距离更近；流形空间中标签不同的数据点之间的距离更远。通过这三个约束条件，使源域和目标域之间各个类别的数据对齐，分布一致，也充分增大了不同类别数据之间的可分性。

在一种可能的实施方式中，如图4所示，所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据，包括步骤S41-S43：

S41，构建第一目标函数；所述第一目标函数包括待求解的映射矩阵；所述第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构，使得数据点保持在原始空间中的相对关系；

具体的，第一目标函数表示为：

其中，F表示待求解的映射矩阵；W _s和W _t分别表示源域图像数据和目标域图像数据的图邻接矩阵，分别表示了源域图像数据和目标域图像数据域内数据之间的相似性关系；L _s＝D _s-W _s和L _t＝D _t-W _t，分别表示源域图像数据和目标域图像数据的图拉普拉斯矩阵，D _s＝∑ _jW _s和D _t＝∑ _jW _t分别表示源域图像数据和目标域图像数据的对角矩阵；由L _s和L _t得到联合拉普拉斯矩阵

由D _s和D _t得到联合对角矩阵

X＝[X _s；X _t]包含了源域图像数据和目标域图像数据；X ⁱ和X ^j为X中的任意两个数据；n _s和n _t分别表示源域图像数据和目标域图像数据中各类别的数据点数目。

S42，构建第一矩阵，通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离；

具体的，第一矩阵是指类间相似矩阵

其中，针对流形空间中类别相同的数据点，W ^w(i,j)＝1；针对流形空间中类别不同的数据点，W ^w(i,j)＝0。所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现，第三目标函数表示为：

其中，

表示W ^w的拉图拉斯矩阵；D ^w＝∑ _jW ^w,表示W ^w的对角矩阵；通过最小化该第一公式使流形空间中标签相同的数据点对齐，分布变得一致。

S43，构建第二矩阵，通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离，以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。

具体的，第二矩阵是指类间不相似矩阵

其中，针对流形空间中类别相同的数据点，W ^b(i,j)＝1；针对流形空间中类别相同的数据点，W ^b(i,j)＝0。所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现，第四目标函数表示为：

其中，

表示W ^b的拉图拉斯矩阵；D ^b＝∑ _jW ^b,表示W ^b的对角矩阵；通过最大化该第二公式使流形空间中标签不同的数据点更具可分性。

S23，利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签。

本申请具体实施例中，在一种可能的实施方式中，所述利用对齐后的所述源域图像数据构建分类器，包括：

构建第二目标函数。具体的，利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数，第二目标函数表示为：

min tr(F ^TXLX ^TF)s.t.F ^TXL ^bX ^TF＝I

其中，L为拉普拉斯矩阵，表示为：

μ和η表示权衡参数，分别表示拉普拉斯矩阵L ^w在源域图像数据和目标域图像数据的权重，由于源域图像数据的标签都是真实可靠的，而目标域图像数据的伪标签可能存在错误，因此两者的权重会不一样。

求解所述第二目标函数，得到所述映射矩阵F。

基于所述映射矩阵F以及对齐后的所述源域图像数据得到映射后的所述源域图像数据。即按照映射矩阵F将对齐后的所述源域图像数据映射为新的源域图像数据，得到映射后的源域图像数据，表示为：Z _s＝F ^TX _s，Z _s表示映射后的源域图像数据。

利用映射后的所述源域图像数据对分类器进行训练，得到构建好的分类器。可选的，该分类器可以是支持向量机(Support Vector Machine,SVM)。在一些实施例中，本申请构建好的分类器还可以存储于区块链节点中。

在一种可能的实施方式中，所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签，包括：

基于所述映射矩阵F以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据。即按照映射矩阵F将对齐后的所述目标域图像数据映射为新的目标域图像数据，得到映射后的目标域图像数据，表示为：Z _t＝F ^TX _t，Z _t表示映射后的目标域图像数据。即将Z _t输入构建好的分类器进行分类预测，其输出为目标域图像数据的预测标签，例如：某个目标域图像数据的预测标签为车辆，某个目标域图像数据的预测标签为人脸。

利用构建好的分类器对映射后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签。

S24，基于所述预测标签对所述目标域图像数据分类，得到分类结果。

本申请具体实施例中，用目标域图像数据的预测标签求取目标域图像数据各个类别的平均光谱，即得到目标域图像数据各个类别的类心，从而实现源域图像数据和目标域图像数据各个类别类心的对齐，基于目标域图像数据各类别的类心将目标域图像数据分类到各类心下，即可得到目标域图像数据最终的分类结果。

可以看出，本申请实施例通过将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；基于所述预测标签对所述目标域图像数据分类，得到分类结果。这样通过空间滤波得到目标域图像数据更精确的伪标签，然后再将两个域的图像数据进行对齐，使得源域图像数据和目标域图像数据之间对应的信息更加丰富，构建的分类器得到的目标域图像数据的预测标签也更加具有代表性，从而有利于提高迁移学习的效果，进而提高图像分类的准确性。

请参见图5，图5为本申请实施例提供的另一种用于图像分类的迁移学习方法的流程示意图，如图5所示，包括步骤S51-S56：

S51，将源域图像数据和目标域图像数据映射到流形空间，在流形空间中，针对所述目标域图像数据中的目标数据点，在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点；

S52，判断所述k个光谱近邻点对应的真实标签是否一致；

S53，在所述k个光谱近邻点对应的真实标签一致的情况下，将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签；

S54，将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

S55，利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

S56，基于所述预测标签对所述目标域图像数据分类，得到分类结果。

其中，上述步骤S51-S56的具体实施方式，在图2所示的实施例中已有相关说明，且能达到相同或相似的有益效果，此处不再赘述。

基于图1或图5所示方法实施例的描述，本申请实施例还提供一种用于图像分类的迁移学习装置，请参见图6，图6为本申请实施例提供的一种用于图像分类的迁移学习装置的结构示意图，如图6所示，该装置包括：

伪标签生成模块61，用于将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

数据对齐模块62，用于将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

标签预测模块63，用于利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

数据分类模块64，用于基于所述预测标签对所述目标域图像数据分类，得到分类结果。

在一种可能的实施方式中，在根据所述源域图像数据得到所述目标域图像数据的伪标签方面，所述伪标签生成模块61具体用于：

判断所述k个光谱近邻点对应的真实标签是否一致；

在一种可能的实施方式中，在将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据方面，所述数据对齐模块62具体用于：

构建第一目标函数；所述第一目标函数包括待求解的映射矩阵；

构建第一矩阵，通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离；

构建第二矩阵，通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离，以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。

在一种可能的实施方式中，在利用对齐后的所述源域图像数据构建分类器方面，所述标签预测模块63具体用于：

构建第二目标函数；

求解所述第二目标函数，得到所述映射矩阵；

基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据；

利用映射后的所述源域图像数据对分类器进行训练，得到构建好的分类器。

在一种可能的实施方式中，在采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签方面，所述标签预测模块63具体用于：

基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据；

在一种可能的实施方式中，所述数据对齐模块62构建的第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构，使得数据点保持在原始空间中的相对关系。

在一种可能的实施方式中，所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现；所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现；在构建第二目标函数方面，所述标签预测模块63具体用于：利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。

根据本申请的一个实施例，图6所示的用于图像分类的迁移学习装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其它实施例中，基于用于图像分类的迁移学习装置也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。

根据本申请的另一个实施例，可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图1或图5中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图6中所示的用于图像分类的迁移学习装置设备，以及来实现本申请实施例的用于图像分类的迁移学习方法。所述计算机程序可以记载于例如计算机可读记录介质上，并通过计算机可读记录介质装载于上述计算设备中，并在其中运行。

基于上述方法实施例和装置实施例的描述，本申请实施例还提供一种电子设备。请参见图7，该电子设备至少包括处理器71、输入设备72、输出设备73以及计算机存储介质74。其中，电子设备内的处理器71、输入设备72、输出设备73以及计算机存储介质74可通过总线或其他方式连接。

计算机存储介质74可以存储在电子设备的存储器中，所述计算机存储介质74用于存储计算机程序，所述计算机程序包括程序指令，所述处理器71用于执行所述计算机存储介质74存储的程序指令。处理器71(或称CPU(Central Processing Unit，中央处理器))是电子设备的计算核心以及控制核心，其适于实现一条或多条指令，具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能。

在一个实施例中，本申请实施例提供的电子设备的处理器71可以用于进行一系列用于图像分类的迁移学习的处理：

再一个实施例中，处理器71执行所述根据所述源域图像数据得到所述目标域图像数据的伪标签，包括：

判断所述k个光谱近邻点对应的真实标签是否一致；

再一个实施例中，处理器71执行所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据，包括：

再一个实施例中，处理器71执行所述利用对齐后的所述源域图像数据构建分类器，包括：

构建第二目标函数；

求解所述第二目标函数，得到所述映射矩阵；

再一个实施例中，处理器71执行所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签，包括：

再一个实施例中，所述第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构，使得数据点保持在原始空间中的相对关系。

再一个实施例中，所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现；所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现；处理器71执行所述构建第二目标函数，包括：利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。

示例性的，上述电子设备可以是手机、移动互联网设备(MID，mobile internet device)、桌上电脑、平板电脑、电脑主机、服务器、云服务器、服务器集群等，电子设备可包括但不仅限于处理器71、输入设备72、输出设备73以及计算机存储介质74，输入设备72可以是键盘、触摸屏等，输出设备73可以是扬声器、显示器、射频发送器等。本领域技术人员可以理解，所述示意图仅仅是电子设备的示例，并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件。

需要说明的是，由于电子设备的处理器71执行计算机程序时实现上述的用于图像分类的迁移学习方法中的步骤，因此上述用于图像分类的迁移学习方法的实施例均适用于该电子设备，且均能达到相同或相似的有益效果。

本申请实施例还提供了一种计算机存储介质(Memory)，所述计算机存储介质是电子设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机存储介质既可以包括终端中的内置存储介质，当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间，该存储空间存储了终端的操作系统。并且，在该存储空间中还存放了适于被处理器71加载并执行的一条或多条的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机存储介质可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器；可选的，还可以是至少一个位于远离前述处理器71的计算机存储介质。在一个实施例中，可由处理器71加载并执行计算机存储介质中存放的一条或多条指令，以实现上述有关用于图像分类的迁移学习方法的相应步骤。具体实现中，计算机存储介质中的一条或多条指令由处理器71加载并执行如下步骤：

再一种示例中，计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤：

判断所述k个光谱近邻点对应的真实标签是否一致；

构建第二目标函数；

求解所述第二目标函数，得到所述映射矩阵；

再一种示例中，计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤：利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。

可选的，本申请涉及的存储介质可以是可读存储介质。进一步可选的，本申请涉及的存储介质如计算机存储介质可以是非易失性的，也可以是易失性的。

示例性的，计算机存储介质的计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需要说明的是，由于计算机存储介质的计算机程序被处理器执行时实现上述的用于图像分类的迁移学习方法中的步骤，因此上述用于图像分类的迁移学习方法的所有实施例均适用于该计算机存储介质，且均能达到相同或相似的有益效果。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种用于图像分类的迁移学习方法，其中，所述方法包括：

将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

基于所述预测标签对所述目标域图像数据分类，得到分类结果。
根据权利要求1所述的方法，其中，所述根据所述源域图像数据得到所述目标域图像数据的伪标签，包括：

针对所述目标域图像数据中的目标数据点，在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点；

判断所述k个光谱近邻点对应的真实标签是否一致；

在所述k个光谱近邻点对应的真实标签一致的情况下，将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
根据权利要求1所述的方法，其中，所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据，包括：

构建第一目标函数；所述第一目标函数包括待求解的映射矩阵；

构建第一矩阵，通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离；

构建第二矩阵，通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离，以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
根据权利要求3所述的方法，其中，所述利用对齐后的所述源域图像数据构建分类器，包括：

构建第二目标函数；

求解所述第二目标函数，得到所述映射矩阵；

基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据；

利用映射后的所述源域图像数据对分类器进行训练，得到构建好的分类器。
根据权利要求3所述的方法，其中，所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签，包括：

基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据；

利用构建好的分类器对映射后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签。
根据权利要求3所述的方法，其中，所述第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构，使得数据点保持在原始空间中的相对关系。
根据权利要求4所述的方法，其中，所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现；所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现；

所述构建第二目标函数，包括：利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
一种用于图像分类的迁移学习装置，其中，所述装置包括：

伪标签生成模块，用于将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

数据对齐模块，用于将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

标签预测模块，用于利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

数据分类模块，用于基于所述预测标签对所述目标域图像数据分类，得到分类结果。
一种电子设备，包括输入设备和输出设备，其中，还包括：

处理器，适于实现一条或多条指令；以及，

计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行以下方法：

将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

基于所述预测标签对所述目标域图像数据分类，得到分类结果。
根据权利要求9所述的电子设备，其中，执行所述根据所述源域图像数据得到所述目标域图像数据的伪标签，包括：

针对所述目标域图像数据中的目标数据点，在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点；

判断所述k个光谱近邻点对应的真实标签是否一致；

在所述k个光谱近邻点对应的真实标签一致的情况下，将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
根据权利要求9所述的电子设备，其中，执行所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据，包括：

构建第一目标函数；所述第一目标函数包括待求解的映射矩阵；

构建第一矩阵，通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离；

构建第二矩阵，通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离，以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
根据权利要求11所述的电子设备，其中，执行所述利用对齐后的所述源域图像数据构建分类器，包括：

构建第二目标函数；

求解所述第二目标函数，得到所述映射矩阵；

基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据；

利用映射后的所述源域图像数据对分类器进行训练，得到构建好的分类器。
根据权利要求11所述的电子设备，其中，执行所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签，包括：

基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据；

利用构建好的分类器对映射后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签。
根据权利要求12所述的电子设备，其中，所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现；所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现；

执行所述构建第二目标函数，包括：利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
一种计算机存储介质，其中，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行以下方法：

将源域图像数据和目标域图像数据映射到流形空间，在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签；

将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据；

利用对齐后的所述源域图像数据构建分类器，采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签；

基于所述预测标签对所述目标域图像数据分类，得到分类结果。
根据权利要求15所述的计算机存储介质，其中，执行所述根据所述源域图像数据得到所述目标域图像数据的伪标签，包括：

针对所述目标域图像数据中的目标数据点，在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点；

判断所述k个光谱近邻点对应的真实标签是否一致；

在所述k个光谱近邻点对应的真实标签一致的情况下，将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
根据权利要求15所述的计算机存储介质，其中，执行所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据，包括：

构建第一目标函数；所述第一目标函数包括待求解的映射矩阵；

构建第一矩阵，通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离；

构建第二矩阵，通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离，以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐，得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
根据权利要求17所述的计算机存储介质，其中，执行所述利用对齐后的所述源域图像数据构建分类器，包括：

构建第二目标函数；

求解所述第二目标函数，得到所述映射矩阵；

基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据；

利用映射后的所述源域图像数据对分类器进行训练，得到构建好的分类器。
根据权利要求17所述的计算机存储介质，其中，执行所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签，包括：

基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据；

利用构建好的分类器对映射后的所述目标域图像数据进行分类，得到所述目标域图像数据的预测标签。
根据权利要求18所述的计算机存储介质，其中，所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现；所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现；

执行所述构建第二目标函数，包括：利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。