CN109948741A

CN109948741A - 一种迁移学习方法及装置

Info

Publication number: CN109948741A
Application number: CN201910161120.2A
Authority: CN
Inventors: 张勇; 郭达; 宋梅; 张曌; 牛颉; 马腾滕; 高杨; 陈梦婷; 李俊杰; 康灿平
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2019-03-04
Filing date: 2019-03-04
Publication date: 2019-06-28

Abstract

本发明实施例提供一种迁移学习方法及装置，该方法包括：获取预处理后的子序列和密集预测网络模型，预处理后的子序列包括源域子序列和目标域子序列；将源域子序列和目标域子序列分批次输入密集预测网络模型，得到全局移位损失；获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据源域标签和目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；根据全局移位损失和对应类别移位损失得到总损失，根据总损失更新密集预测网络模型。本发明实施例提供的迁移学习方法及装置，提出一种多层次无监督域适应的方法，完成边缘分布和条件分布的对齐，实现对时间序列数据密集预测模型的迁移，性能更优越。

Description

一种迁移学习方法及装置

技术领域

本发明涉及神经网络领域，尤其涉及一种迁移学习方法及装置。

背景技术

随着可穿戴便捷式传感器设备的快速发展和广泛普及，基于传感器数据的人体行为识别目前已广泛地应用于行为监控、健康监测、智能家居、睡眠监测等领域，具有良好的应用前景。目前深度学习方法广泛地应用于基于传感器数据的人体行为识别，该方法从传感器产生的时间序列数据中提取抽象的模式信息，从而实现高准确率的人体行为识别。密集预测是目前性能最优的人体行为识别方法，考虑到人体各行为的持续时间不同且行为的确切界限难以定义，导致最佳的滑动窗口尺寸难以确定，而密集预测的HAR通过对时间序列进行逐个采样点的预测，避免了时间序列进行滑窗分割所带来的多类窗口问题，实现高精度的分类。

但是该方法依赖于大量的标记数据，而大规模地对传感器数据进行标记的代价是非常昂贵的。另外，当基于深度学习的人体行为识别模型在指定的数据源上进行训练之后，将其用于新的数据源上进行测试，例如采集自不同的放置位置、不同模态、不同用户的传感器的数据源，由于新的数据源与源数据源之间分布不同，模型的识别性能会显著下降。此时，迁移学习的方法就显得尤为重要了，迁移学习的方法可以减轻深度学习中需要大量标记数据的负担，并解决由不同域之间的分布差异引起的域移位问题。

现有的迁移学习方法大多应用于图像领域，主要用于图像识别领域。现有的较为常用的迁移学习方法有以下几种：深度域混淆(Deep Domain Confusion，DDC)是在深度神经网络的全连接层之后加入使用线性核最大平均误差的自适应层，实现最大域不变性。深度适应网络(Deep Adaptation Network，DAN)是在深度神经网络的全连接层之后加入多核最大平均误差的自适应层，通过将提取的特征嵌入到再生核希尔伯特空间实现学习可迁移的特征，从而实现深度域适应。联合适应网络(Joint Adaptation Networks，JAN)是在深度神经网络的全连接之后加入联合最大平均误差的自适应层，实现联合分布对齐。反向梯度(Reverse Gradient，RevGard)域适应方法是通过在深度神经网络全连接之后加入域鉴别器，通过梯度反转层和对抗训练，实现学习源域和目标域域不变特征。

而目前应用于人体行为识别的密集预测的迁移学习方法还存在空白，现有的迁移学习方法未充分考虑密集预测模型特有的深度神经网络结构以及其对每个时间点数据进行细粒度识别的特点，对时间序列数据进行密集预测的迁移效果不理想。

发明内容

本发明实施例为克服上述技术缺陷，提供一种迁移学习方法及装置。

第一方面，本发明实施例提供一种迁移学习方法，包括：

获取预处理后的子序列和密集预测网络模型，所述预处理后的子序列包括源域子序列和目标域子序列；

将所述源域子序列和所述目标域子序列分批次输入所述密集预测网络模型，得到全局移位损失；

获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据所述源域标签和所述目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；

根据所述全局移位损失和所述对应类别移位损失得到总损失，根据所述总损失更新所述密集预测网络模型。

第二方面，本发明实施例提供一种迁移学习装置，包括：

获取模块，用于获取预处理后的子序列和密集预测网络模型，所述预处理后的子序列包括源域子序列和目标域子序列；

第一处理模块，用于将所述源域子序列和所述目标域子序列分批次输入所述密集预测网络模型，得到全局移位损失；

损失计算模块，用于获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据所述源域标签和所述目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；

第二处理模块，用于根据所述全局移位损失和所述对应类别移位损失得到总损失，根据所述总损失更新所述密集预测网络模型。

第三方面，本发明实施例提供一种电子设备，包括存储器和处理器，所述处理器和所述存储器通过总线完成相互间的通信；所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如第一方面所述的一种迁移学习方法。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所述一种迁移学习方法。

本发明实施例提供的一种迁移学习方法及装置，利用源域丰富的密集标签数据实现对目标域无标签数据的密集预测，提出一种多层次无监督域适应的方法，通过结合全局域适应和特定任务适应，对源域和目标域进行多层次适应，完成边缘分布和条件分布的对齐，从而实现对时间序列数据进行密集预测模型的迁移，执行迁移任务的性能更优越，平均准确率更高。

附图说明

图1为本发明实施例提供的一种迁移学习方法的流程示意图；

图2为本发明实施例提供的基于U-Net的人体行为识别密集预测模型的深度神经网络结构图；

图3为本发明实施例提供的一种迁移学习装置的结构示意图；

图4为本发明实施例提供的一种电子设备的实体结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种迁移学习方法的流程示意图，如图1所示，包括：

步骤11，获取预处理后的子序列和密集预测网络模型，所述预处理后的子序列包括源域子序列和目标域子序列；

步骤12，将所述源域子序列和所述目标域子序列分批次输入所述密集预测网络模型，得到全局移位损失；

步骤13，获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据所述源域标签和所述目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；

步骤14，根据所述全局移位损失和所述对应类别移位损失得到总损失，根据所述总损失更新所述密集预测网络模型。

本发明实施例提供了一种用于密集预测的的迁移学习方法，利用源域丰富的密集标签数据实现对目标域无标签数据的密集预测。整个过程分为三个部分：(1)密集预测；(2)全局域适应；(3)特定任务适应。

密集预测阶段包括构建用于人体行为识别密集预测的深度神经网络模型以及输入数据的处理。构建密集预测网络模型可以使用全卷积网络(FCN)、U型网络(U-Net)、自动编码器网络等编解码器网络。考虑到密集预测网络模型无法将整个长时间序列作为网络输入，输入数据的处理主要是包括生成子序列，将长时间序列按照不重叠的滑动分割的方式分成若干个子序列，子序列中每一个采样点对应一个标签。

全局域适应阶段通过对密集预测网络模型中编码器和解码器输出的特征进行多层适应，实现多连接的全局域适应。使用多核最大均值差异(Multi-Kernel Maximum MeanDiscrepancy，MK-MMD)作为全局移位损失。仅对网络的最后一层进行域适应，迁移效果可能并不理想，特别是对于像素级别分类的情况。因此，提出了一种多连接的全局域适应架构，同时对编码器和解码器输出的特征进行适应。通过多层的适应，提高自适应层的性能，从而提高域适应的能力。

特定任务适应阶段通过引入余弦距离损失和滑动平均方法，进行各类别质心对齐，从而实现局部特定任务适应。考虑到目标域没有标签，本发明实施例使用训练分类器为目标域样本分配的伪标签来进行特定类别对齐，从而实现特定任务适应。考虑到伪标签可能是错误标签，从而会导致错误类别对齐，严重损害适应性能。因此，提出对应类质心余弦距离损失作为对应类别移位损失值。通过使用类别质心进行对齐，目标域中每个类别的质心会同时使用正确的伪标签和错误的伪标签的信息，正确的伪标签会中和错误的伪标签对域适应的损害。通过使用余弦距离损失，避免由源域和目标域各自的分布以及量纲差异造成损失值波动较大的问题。

本发明实施例提供的一种迁移学习方法，利用源域丰富的密集标签数据实现对目标域无标签数据的密集预测，提出一种多层次无监督域适应的方法，通过结合全局域适应和特定任务适应，对源域和目标域进行多层次适应，完成边缘分布和条件分布的对齐，从而实现对时间序列数据进行密集预测模型的迁移，执行迁移任务的性能更优越，平均准确率更高。

在上述实施例的基础上，在所述获取预处理后的子序列和密集预测网络模型之前，所述方法还包括：

获取源域数据和目标域数据；

基于不重叠滑动方式，根据所述源域数据得到所述源域子序列，根据所述目标域数据得到所述目标域子序列。

本发明实施例中，需要对子序列进行预处理，即首先获取源域数据和目标域数据，然后基于不重叠滑动方式，来根据源域数据和目标域数据，得到源域子序列和目标域子序列。

在上述任一实施例的基础上，所述密集预测网络模型通过全卷积网络、U型网络或自动编码器网络构建得到。全卷积网络是将传统卷积神经网络中的全连接层转化为一个个的卷积层，由于所有的层都是卷积层，故称为全卷积网络。全卷积网络有两大明显的优点：一是可以接受任意大小的输入图像，而不用要求所有的训练图像和测试图像具有同样的尺寸。二是更加高效，因为避免了由于使用像素块而带来的重复存储和计算卷积的问题。U型网络即U-Net卷积神经网络，主要有两部分组成：收缩路径和扩展路径。搜索路径主要是用来捕捉图片中的上下文信息，而与之相对称的扩展路径则是为了对图片中所需要分割出来的部分进行精准定位。

在全局域适应阶段，通过对密集预测的网络模型中编码器和解码器输出的特征进行多层适应，实现多连接的全局域适应。使用多核最大均值差异作为全局域移位损失。仅对网络的最后一层进行域适应，迁移效果可能并不理想，特别是对于像素级别分类的情况。因此，提出了一种多连接的全局域适应架构，同时对编码器和解码器输出的特征进行适应。通过多层的适应，提高自适应层的性能，从而提高域适应的能力。

L_gd(x_s,x_t)＝L_MK-MMD(E(x_s),E(x_t))+L_MK-MMD(D(x_s),D(x_t))，

其中，L_gd(x_s,x_t)为所述全局移位损失，x_s和x_t分别表示所述源域子序列和所述目标域子序列，L_MK-MMD表示多核最大均值差异损失，E(x_s)和E(x_t)分别表示所述源域子序列、所述目标域子序列经编码器网络所提取的特征，D(x_s)和D(x_t)分别表示所述源域子序列、所述目标域子序列通过解码器网络后所输出的结果。MK-MMD的计算公式如下：

其中，

所述对应类别移位损失，具体为：

其中，L_cd为所述对应类别移位损失，G_k(x_s)和G_k(x_t)分别表示源域和目标域的质心，φ(x₁,x₂)用于计算质心距离，

特定任务适应阶段，通过引入余弦距离损失和滑动平均方法，进行各类别质心对齐，从而实现局部特定任务适应。考虑到目标域没有标签，使用训练分类器为目标域样本分配的伪标签来进行特定类别对齐，从而实现特定任务适应。考虑到伪标签可能是错误标签，从而会导致错误类别对齐，严重损害适应性能。因此，提出对应类质心余弦距离损失作为对应类别移位损失值。通过使用类别质心进行对齐，目标域中每个类别的质心会同时使用正确的伪标签和错误的伪标签的信息，正确的伪标签会中和错误的伪标签对域适应的损害。通过使用余弦距离损失，避免由源域和目标域各自的分布以及量纲差异造成损失值波动较大的问题。提出特定类别质心对齐损失目标：

以使用U-Net网络作为密集预测网络模型为例，图2为本发明实施例提供的基于U-Net的人Ns体行为识别密集预测模型的深度神经网络结构图，如图2所示，所使用的网络结构共28层卷积层，分为编码器网络、解码器网络和分类器网络两部分。编码器网络的每一层主要由2个卷积层和1个池化层组成，共6层。编码器网络的每一层与解码器网络层次对应，解码网络的每一层主要由1个的上卷积层和2个卷积层组成。最后，通过由1层卷积层和Softmax分类器组成的分类器网络，得到具有与输入时间序列长度相同的稠密标签预测结果。

本发明实施例的具体实施时算法流程如下：

步骤一，输入源域数据和目标域数据以及源域预训练的密集预测网络模型；

步骤二，使用源域预训练模型初始化密集预测模型的参数，初始化源域和目标域的各类质心和子序列滑动分割起始点p₀＝0；

步骤三，使用不重叠滑动方式，生成源域子序列{x_s[1,p_t:p_t+N,T_s]}，{y_s[1,p_t:p_t+N,T_s]}，目标域子序列{x_t[1,p_t:p_t+N,T_t]}，其中p_t∈{p_t|p_t＝p_t-1+N}；

步骤四，将源域和目标域子序列数据分成小批次输入密集预测模型，计算全局移位损失L_g，以及有监督的分类损失；

步骤五，利用输入的源域标签和密集预测模型得到的目标域伪标签计算出源域和目标域当前批次中第k类的质心，其中源域当前批次中第k类的质心为目标域当前批次中第k类的质心为其中，分别表示源域和目标域前一批次中第k类的质心，C_s(x_s,i)和C_T(x_s,i)分别表示源域和目标域当前批次中分类器的输出；

步骤六，重复步骤五直到得到了所有类别的质心；

步骤七，计算对应类移位损失L_c，对有监督的源域损失、全局域移位损失和对应类移位损失加和得到总损失经反向传播后更新密集预测模型的参数；

步骤八，重复步骤四-七直到完成训练过程中所有的迭代；

步骤九，在目标域测试数据集上对密集预测模型进行测试，返回目标域密集预测标签以及测试的准确率。

进一步的，本发明实施例评估了迁移学习框架在三个公开数据集上：OPPORTUNITYdataset(OPP)、UCI daily and sports dataset(DSADS)和PAMAP dataset。OPPORTUNITY数据集利用放置在Back(B)，Right Upper Arm(RUA)，Right Left Arm(RLA)，Left Upper Arm(LLA)，Left Lower Arm(LLA)这五个位置的传感器，对2名志愿者进行4种行为的数据。UCIdaily and sports dataset(DSADS)利用放置在Right Arm(RA)，Left Arm(LA)，Right Leg(RL)，Left Leg(LL)，Torso(T)这五个位置的传感器，对8名志愿者进行19种日常行为的数据采集。PAMAP数据集利用放置在Hand(H)，Chest(C)，Ankle(A)这三个位置的传感器，对9名志愿者进行共18类行为的数据采集。这三个数据集使用的传感器都是Inertialmeasurement unit(IMU)，产生九轴数据。

为了全面得评估本发明实施例的迁移方法的性能，在两种迁移场景下进行实验：1)相似场景：源域和目标域数据采集相同的用户相近放置位置的传感器，例如同一个用户左右手之间的迁移，利用同一数据集中相近位置传感器数据来构建同一场景下的迁移任务。表1为在不同的迁移任务下的分类准确率。在OPPORTUNITY数据集和DSADS数据集中构造6组迁移任务，见表1。2)不同场景：源域和目标域数据采集相同用户或者不同用户的放置位置不相关的传感器，利用同一数据集和不同数据集中不相关放置位置的传感器数据来构造8组迁移任务，见表1。这两种迁移场景代表域之间不同层次的差异。使用S→T表示一组迁移任务，S表示是源域有标签的传感器数据，T表示目标域无标签的传感器数据。

需要说明的是本发明实施例的假设是源域和目标域是共享相同的标签空间，考虑到不同数据集中包含的行为类别，本发明实施例所有的迁移任务实验数据只使用三个数据集共有动作类别的数据：Sitting，Standing，Lying，Walking。

本发明实施例使用Pytorch框架，所有实验都使用源域数据预训练的模型，各种迁移学习方法在预训练模型上进行微调。使用随机梯度下降SGD，动量设置为0.9。学习率和trade-off参数λ设置采用JAN中的策略，并设置λ＝γ。BatchSize设置为32。源域数据都是有标签的，目标域数据分成70％无标签训练数据，30％为有标签的测试集，标签数据只在测试时使用，仅用来评估算法的准确率。

表1分类准确率(％)在不同的迁移任务

根据上表可观察到本发明实施例中的所提出的方法相对于直接使用源域预训练模型(U-Net only)来执行迁移任务，平均准确率提升了20％，并且在大多数的迁移任务中都比其他所有对比的迁移方法(DAN，DDC，JAN，RevGrad)的性能更优越，平均准确率提升了10％～18％。因此，本发明实施例提出的方法比其他的对比的方法都更能有效。

图3为本发明实施例提供的一种迁移学习装置的结构示意图，如图3所示，包括获取模块31、第一处理模块32、损失计算模块33和第二处理模块34，其中：

获取模块31用于获取预处理后的子序列和密集预测网络模型，所述预处理后的子序列包括源域子序列和目标域子序列；

第一处理模块32用于将所述源域子序列和所述目标域子序列分批次输入所述密集预测网络模型，得到全局移位损失；

损失计算模块33用于获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据所述源域标签和所述目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；

第二处理模块34用于根据所述全局移位损失和所述对应类别移位损失得到总损失，根据所述总损失更新所述密集预测网络模型。

本发明实施例提供了一种用于密集预测的的迁移学习装置，利用源域丰富的密集标签数据实现对目标域无标签数据的密集预测。整个过程分为三个部分：(1)密集预测；(2)全局域适应；(3)特定任务适应。

密集预测阶段包括获取模块31构建用于人体行为识别密集预测的深度神经网络模型以及输入数据的处理。构建密集预测网络模型可以使用全卷积网络(FCN)、U型网络(U-Net)、自动编码器网络等编解码器网络。考虑到密集预测网络模型无法将整个长时间序列作为网络输入，输入数据的处理主要是包括生成子序列，将长时间序列按照不重叠的滑动分割的方式分成若干个子序列，子序列中每一个采样点对应一个标签。

全局域适应阶段第一处理模块32通过对密集预测网络模型中编码器和解码器输出的特征进行多层适应，实现多连接的全局域适应。损失计算模块33使用多核最大均值差异(Multi-Kernel Maximum Mean Discrepancy，MK-MMD)作为全局移位损失。仅对网络的最后一层进行域适应，迁移效果可能并不理想，特别是对于像素级别分类的情况。因此，提出了一种多连接的全局域适应架构，同时对编码器和解码器输出的特征进行适应。通过多层的适应，提高自适应层的性能，从而提高域适应的能力。

特定任务适应阶段通过引入余弦距离损失和滑动平均方法，进行各类别质心对齐，从而实现局部特定任务适应。考虑到目标域没有标签，本发明实施例使用训练分类器为目标域样本分配的伪标签来进行特定类别对齐，从而实现特定任务适应。考虑到伪标签可能是错误标签，从而会导致错误类别对齐，严重损害适应性能。因此，提出对应类质心余弦距离损失作为对应类别移位损失值。第二处理模块34通过使用类别质心进行对齐，目标域中每个类别的质心会同时使用正确的伪标签和错误的伪标签的信息，正确的伪标签会中和错误的伪标签对域适应的损害。通过使用余弦距离损失，避免由源域和目标域各自的分布以及量纲差异造成损失值波动较大的问题。

本发明实施例提供的装置是用于执行上述各方法实施例的，具体的流程和详细介绍请参见上述各方法实施例，此处不再赘述。

本发明实施例提供的一种迁移学习装置，利用源域丰富的密集标签数据实现对目标域无标签数据的密集预测，提出一种多层次无监督域适应的方法，通过结合全局域适应和特定任务适应，对源域和目标域进行多层次适应，完成边缘分布和条件分布的对齐，从而实现对时间序列数据进行密集预测模型的迁移，执行迁移任务的性能更优越，平均准确率更高。

图4为本发明实施例提供的一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和总线440，其中，处理器410，通信接口420，存储器430通过总线440完成相互间的通信。总线440可以用于电子设备与传感器之间的信息传输。处理器410可以调用存储器430中的逻辑指令，以执行如下方法：获取预处理后的子序列和密集预测网络模型，所述预处理后的子序列包括源域子序列和目标域子序列；将所述源域子序列和所述目标域子序列分批次输入所述密集预测网络模型，得到全局移位损失；获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据所述源域标签和所述目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；根据所述全局移位损失和所述对应类别移位损失得到总损失，根据所述总损失更新所述密集预测网络模型。

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例提供一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令使计算机执行上述实施例所提供的一种迁移学习方法，例如包括：获取预处理后的子序列和密集预测网络模型，所述预处理后的子序列包括源域子序列和目标域子序列；将所述源域子序列和所述目标域子序列分批次输入所述密集预测网络模型，得到全局移位损失；获取源域标签和目标域伪标签，基于余弦距离损失和滑动平均方法，根据所述源域标签和所述目标域伪标签进行对应类别质心对齐，得到对应类别移位损失；根据所述全局移位损失和所述对应类别移位损失得到总损失，根据所述总损失更新所述密集预测网络模型。

以上所述仅为本发明的优选实施例，并不用于限制本发明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充，但并不会偏离本发明的精神或者超越所附权利要求书定义的范围。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种迁移学习方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述获取预处理后的子序列和密集预测网络模型之前，所述方法还包括：

获取源域数据和目标域数据；

3.根据权利要求1所述的方法，其特征在于，所述密集预测网络模型通过全卷积网络、U型网络或自动编码器网络构建得到。

4.根据权利要求1所述的方法，其特征在于，所述全局移位损失，具体为：

L_gd(x_s,x_t)＝L_MK-MMD(E(x_s),E(x_t))+L_MK-MMD(D(x_s),D(x_t))，

其中，L_gd(x_s,x_t)为所述全局移位损失，x_s和x_t分别表示所述源域子序列和所述目标域子序列，L_MK-MMD表示多核最大均值差异损失，E(x_s)和E(x_t)分别表示所述源域子序列、所述目标域子序列经编码器网络所提取的特征，D(x_s)和D(x_t)分别表示所述源域子序列、所述目标域子序列通过解码器网络后所输出的结果。

5.根据权利要求1所述的方法，其特征在于，所述对应类别移位损失，具体为：

其中，L_cd为所述对应类别移位损失，G_k(x_s)和G_k(x_t)分别表示源域和目标域的质心，φ(x₁,x₂)用于计算质心距离。

6.根据权利要求5所述的方法，其特征在于，所述φ(x₁,x₂)具体为：

7.一种迁移学习装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述密集预测网络模型通过全卷积网络、U型网络或自动编码器网络构建得到。

9.一种电子设备，其特征在于，包括存储器和处理器，所述处理器和所述存储器通过总线完成相互间的通信；所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的一种迁移学习方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至6任一项所述一种迁移学习方法。