CN112699960A

CN112699960A - 基于深度学习的半监督分类方法、设备及存储介质

Info

Publication number: CN112699960A
Application number: CN202110033029.XA
Authority: CN
Inventors: 范文涛; 朱姣姣; 杨霖
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2021-01-11
Filing date: 2021-01-11
Publication date: 2021-04-23
Anticipated expiration: 2041-01-11
Also published as: CN112699960B

Abstract

本发明提供一种基于深度学习的半监督分类方法、设备及存储介质，方法包括：对输入的脑电数据分别进行过滤、截取、归一化和类别化预处理，获得训练用数据集；将训练用数据集划分为训练集和验证集，将训练集输入预先构建的网络模型进行训练，获得预分类器；网络模型为双向循环门控单元与注意力编码器集合的网络模型；将训练集和验证集输入预分类器，获得低维训练集和验证集并生成对应的矩阵，并合并两个矩阵生成标签矩阵；将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符。本发明经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法，减少训练量，得到较好的预测结果。

Description

基于深度学习的半监督分类方法、设备及存储介质

技术领域

本发明涉及分类方法领域，具体而言，涉及一种基于深度学习的半监督分类方法、设备及存储介质。

背景技术

P300信号是一种人脑在低概率事件刺激后300毫秒左后出现的一个正向峰值信号，通过检测脑电图(Electroencephalogram，EEG)信号中是否存在P300电位，从而推测出人脑传达出的信息，这也是P300脑机接口技术实现大脑向外信息传输的原理。然而，在P300脑机接口系统使用之前，往往需要对受试者进行大量的监督训练，以获得有标签的样本来训练模型，这种训练过程对用户来说非常耗时耗力且得到的脑电数据需要进行大量的人工标记工作。

现有技术提出将EEG信号序列分成不同时期，每个时期包含了相同长度的样本，先对样本用双向GRU编码及注意力机制筛选出更具代表性的样本，以此得到该样本对所在时期的向量表示，再对以上得到的向量表示进行双向GRU编码及注意力机制筛选，最后通过softmax逻辑回归得到判别结果。但是此方法所使用的深度模型属于完全的监督学习网络，要求在系统使用之前，对受试者进行大量的监督训练，这种训练过程非常耗时且得到的数据需要进行大量的人工标记工作。而我们所提的半监督网络可以大大的减少系统使用前的准备工作。将EEG序列成分割成了不同的片段，每个片段中包含了相同长度的样本，并分别使用了两层双向GRU模型和注意力机制对数据进行训练，这势必会使得网络结构复杂化，训练参数冗余庞大，模型收敛速度减慢。模型旨在不依赖受试者的情况下进行情绪分类，即希望模型具有通用性，但众多研究工作表明，不同的受试者其重要的脑电通道组合都是相当不同的，不能一概而论。因此，为每个受试者训练针对最适合其情绪预测的模型是更加明智的选择。

现有技术提出了一种基于图的半监督宽度学习系统分类器。其先用半监督学习方法即标签传播算法(LPA)对无标签数据预测得到其伪标签，再将标签数据和伪标签数据共同放入宽度学习系统中训练分类器。旨在减少标签数据的获取代价以及避免深度学习复杂的网络机构和计算。此方法使用了基于图的标签传播算法得到无标签数据的伪标签，再同时使用伪标签和标签数据对基于宽度学习系统的分类器进行模型训练。由于标签传播算法需要对数据点构建完全连接网络，其时间复杂度为O(N^3)，N为样本的数据量，而EEG信号数据矩阵总的大小为三维，构建完全神经网络将消耗大量的运算资源，导致训练速度缓慢，难以推广到实际应用。其主要使用宽度学习系统作为分类器，宽度学习系统虽然是一种不需要大规模GPU的网络模型，但其随机性的节点选取和伪逆计算决定了该网络在面对大规模数据时的精度往往劣于利用深度结构的网络。

发明内容

本发明的目的在于提供一种基于深度学习的半监督分类方法、设备及存储介质，以解决上述存在的问题。

为实现上述目的，本发明实施例提供一种基于深度学习的半监督分类方法，包括

对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理，以获得训练用数据集；

将所述训练用数据集划分为训练集和验证集，将所述训练集输入预先构建的网络模型进行训练，以获得预分类器；其中，所述网络模型为双向循环门控单元与注意力编码器集合的网络模型；

将所述训练集和验证集输入所述预分类器，以获得低维训练集和验证集；

分别根据所述低维训练集和验证集生成对应的矩阵，并合并两个矩阵生成标签矩阵；其中，对由验证集生成的矩阵的标签进行了掩盖；

将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符。

进一步的，所述对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理，以获得训练用数据集具体为：

通过带通滤波器对所述脑电数据进行过滤以筛选出带有P300有效成分的数据；

使用时间窗对所述带有P300有效成分的数据进行截取；

对截取后的数据进行归一下处理；

对归一化后的数据使用min-max进行类别化，将脑电数据映射到[0-1]之间。

更进一步的，所述带通滤波器是8阶0.1-10Hz的FIR带通滤波器，所述时间窗是625ms的时间窗。

进一步的，所述网络模型包括输入层、双向循环门控单元层、注意力层和输出层。

进一步的，所述将所述训练用数据集划分为训练集和验证集，并将所述训练集输入预先构建的网络模型进行训练，以训练获得预分类器；其中，所述网络模型为双向循环门控单元与注意力编码器集合的网络模型，具体为：

将所述训练集通过网络模型的输入层输入到双向循环门控单元层；

计算第i个时间步长的输出并将其输入到注意力层以进行权重分析；

通过softmax层将权重分析后的数据集压缩到0-1之间，再通过argmax函数得到编码器预测的类别，计算损失函数；

多次迭代至收敛，保存编码器的参数。

更进一步的，所述计算第i个时间步长的输出并将其输入到注意力层以进行权重分析，第i个时间步长的输出计算公式如下：

其中

和

分别表示第i个时间步向前和向后的输出，

表示元素逐个相加；

将第i个时间步长的输出h_i输入注意力层公式如下：

u＝tanh(W_sh_i+b_s)

α＝softmax(u^TM)

h^*＝Hα^T

其中W_S为权重参数，b_s为偏差，M是样本层次的上下文向量，h^*为所有隐藏状态加权求和的结果，tanh为激活函数。

进一步的，将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符，具体为：

将标签数据和未标注数据构造相似矩阵，以建立一个完全连接图，所有数据均表示为图中的节点；

计算所述标签矩阵中两个节点之间的相似度，并进行归一化处理，获得概率传递矩阵；

将每个节点的标签以概率传递矩阵确定的概率传播给其他节点；

限定已标注的数据，将已标注的数据的概率分布重新赋值为初始值，然后重复上一步，直至算法收敛，以完成分类器训练，从而预测掩盖部分的标签，输出分类结果，获得目标字符。

更进一步的，所述计算所述标签矩阵中两个节点之间的相似度，相似度计算公式：

其中，d_ij表示任意两个节点的欧式距离，α为w_ij参数。

本发明还提供一种基于深度学习的半监督分类设备，包括存储器以及处理器，所述存储器内存储有计算机程序，所述处理器用于运行所述计算机程序以实现所述的一种基于深度学习的半监督分类方法。

本发明还提供一种存储介质，所述存储介质存储有计算机程序，所述计算机程序能够被所述存储介质所在设备的处理器执行，以实现所述的一种基于深度学习的半监督分类方法。

本发明提供的一种基于深度学习的半监督分类方法，包括：对输入的脑电数据分别进行过滤、截取、归一化和类别化预处理，获得训练用数据集；将所述训练用数据集划分为训练集和验证集，将训练集输入预先构建的网络模型进行训练，获得预分类器；网络模型为双向循环门控单元与注意力编码器集合的网络模型；将训练集和验证集输入所述预分类器，获得低维训练集和验证集；分别根据所述低维训练集和验证集生成对应的矩阵，并合并两个矩阵生成标签矩阵；其中，对由验证集生成的矩阵的标签进行了掩盖；将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符。经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法都能得到较好的预测结果，基于双向循环门控单元编码的标签传播分类算法精度更高，训练简单。

附图说明

为了更清楚地说明本发明实施方式的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明第一实施例提供的一种基于深度学习的半监督分类方法流程示意图。

图2为本发明第一实施例提供的一种基于深度学习的半监督分类方法另一流程示意图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。

参考图1-2，本发明第一实施例提供了一种基于深度学习的半监督分类方法，包括：

S11:对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理，以获得训练用数据集。

在本实施例中，通过带通滤波器对所述脑电数据进行过滤以筛选出带有P300有效成分的数据。

使用时间窗对所述带有P300有效成分的数据进行截取。

对截取后的数据进行归一下处理。

例如，将单个受试者训练用数据整合成全数据集X，X＝{x1,x1…..xn}，可采用了8阶0.1-10Hz的FIR带通滤波器对脑电信号进行过滤以筛选带有P300有效成分的信号。由于该数据的采样频率为240赫兹，而p300信号出现在刺激发生后的300ms左右，为了保证每次目标行/列闪烁能够将p300信号包括进来，可选择使用625ms的时间窗对数据进行截取，最后得到的数据维度为15300*150*64，其中150为单次闪烁的采样行数，64为通道数。同时，为了统一数据的统计分布性，减少数据幅值带来的影响，训练用数据也将进归一化处理。我们使用min-max标准化，将原始数据映射到[0-1]之间。最后，将训练数据集的标签置为0，1，其中1表示有目标字符所在的行或列闪烁，否则为0。当然需要说明的是所述带通滤波器、时间窗也可以是其他型号，这些方案均在本发明的保护范围。

S12:将所述训练用数据集划分为训练集和验证集，将所述训练集输入预先构建的网络模型进行训练，以获得预分类器；其中，所述网络模型为双向循环门控单元与注意力编码器集合的网络模型。

在本实施例中，首先将所述训练集通过网络模型的输入层输入到双向循环门控单元层。具体过程是：先将以上预处理后的训练用数据分为90％的训练集，10％的验证集。则对于单个受试者，其训练集的大小为[13770*150*64]，将其作为双向循环门控单元(Bi-GRU)与注意力(Attention)编码器集合的网络模型的输入。传统的单向循环门控单元网络只能够按时间顺序处理，无法考虑到未来的内容。对于学习时间序列模型的任务来说，能够访问到数据的过去和未来是很关键的，而双向的循环门控单元网络通过引入第二层循环门控单元网络，使得隐藏层之间以相反的方向流动，从而能够更好的捕获到p300脑电信号的代表性特征。循环门控单元计算当前时刻t的新状态公式为：

h_t是通过在上一个状态h_t-1和当前候选状态

之间的线性插值计算得到的。其中z_t代表了更新门，它决定着保留多少之前的信息以及增加多少新的信息，z_t越大，代表着越多之前的信息被留下。更新门z_t的表达方式如下：

z_t＝σ(W_zχ_t+U_zh_t-1+b_z)

其中χ_t表示时刻t的样本向量，W,U分别为χ_t和h_t-1的权重系数，b为偏差，σ为sigmoid激活函数，

为候选记忆单元：

tanh为激活函数，r_t代表重置门，它可以决定以前的状态贡献多少给当前的候选状态，r_t的值越小，前一个状态的贡献就越小，如果r_t＝0，那么将完全忘记上一个状态，其更新式如下：

r_t＝σ(W_rX_t+U_rh_t-1+b_r)。

在本实施例中，计算第i个时间步长的输出并将其输入到注意力层以进行权重分析。第i个时间步长的输出计算公式如下：

其中

和

分别表示第i个时间步向前和向后的输出，

表示元素逐个相加。

注意力层：注意力编码器机制通过分配权重系数，使得具有不同重要度的样本得到不同程度的关注，使用注意力编码器机制的模型可以学习更加显著的脑电图序列特征表示，突出重要样本和重要时期对其p300信号分类的贡献。将第i个时间步长的输出h_t输入注意力编码器层：

u＝tanh(W_sh_i+b_s)

α＝softmax(u^TM)

h^*＝Hα^T

其中W为权重参数，b为偏差，M是样本层次的上下文向量，可以看作是一个固定查询“什么是重要的样本”的高层表示，h^*为所有隐藏状态加权求和的结果。经过该层后所得数据向量大小为[13770*64]。

在本实施例中，通过softmax层将权重分析后的数据集压缩到0-1之间，再通过argmax函数得到编码器预测的类别，计算损失函数。

在本实施例中，多次迭代至收敛，保存编码器的参数。迭代50次后大致收敛，最后将编码器的参数保存用以在下一步骤中使用。

S13:将所述训练集和验证集输入所述预分类器，以获得低维训练集和验证集。

在本实施例中，经过预分类器，获得的低维训练集即标签数据矩阵为[13770*64]，验证集即无标签数据矩阵为[1530*64]。

S14:分别根据所述低维训练集和验证集生成对应的矩阵，并合并两个矩阵生成标签矩阵；其中，对由验证集生成的矩阵的标签进行了掩盖。

在本实施例中，标签传播算法即LPA，对由验证集生成的矩阵的标签进行了掩盖，将低维训练集即标签数据和验证集即无标签数据构造相似矩阵，以建立一个完全连接图，所有数据均表示为图中的节点。构造相似矩阵具体过程为：设(x₁,y₁)...(x_l,y_l)为标签数据，YL＝{y₁...y_L)∈{1,0}，且其存于数据标签中。(x_l+1,y_l+1)...(x_l+u,y_l+u)为无标签数据，则Yu＝{(y_l+1...y_l+u)}是未知的，即被掩盖、需要被预测的标签。在本数据集中，标签数据矩阵为[13770*64]，无标签验证数据集矩阵[1530*64]。将两个数据集合并作为输入数据集，并为各数据点构造相似矩阵。

在本实施例中，将标签数据设置为矩阵YL，初始化标签设置为矩阵YU，将两个矩阵进行合并，得到标签矩阵。标签数据的矩阵YL大小为[13770*2]，第一维表示数据量，第二维表示类别数，如果第i个样本的类别是1，那么第i行的第1个元素为1，其他为0。同样，为验证数据集设置其初始化标签矩阵YU，其值统一设置为-1。最后将两个矩阵进行合并，得到标签矩阵为F＝[YL；YU]。

S15:将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符。

在本实施例中，所述标签矩阵即建立一个完全连接图，将所有数据都表示为图中的节点，包括有标签数据和无标签数据，节点之间的连线，也称为边，表示的是两个节点之间的相似度。

计算所述标签矩阵中两个节点之间的相似度，并进行归一化处理，获得概率传递矩阵；两个节点之间的相似度计算公式如下：

其中d_ij表示任意两个节点的欧式距离，α为w_ij参数，且两点间的d_ij越小，权重w_ij越大。

为了评估一个节点的标签通过边传播到其他节点的概率，我们将以上得到的相似度进行归一化处理，得到一个概率传递矩阵T，表示节点j到i的传播概率。其表达式如下，

在本实施例中，将每个节点的标签以概率传递矩阵确定的概率传播给其他节点。

在本实施例中，限定已标注的数据，将已标注的数据的概率分布重新赋值为初始值，然后重复上一步，直至算法收敛，以完成分类器的训练，从而预测掩盖部分的标签，输出分类结果，获得目标字符。

为便于对本发明的理解，本实施例基于双向门控循环单元编码的标签传播算法针对p300脑电信号分类的有效性在公开数据集-第三届国际BCI竞赛中字符拼写系统的P300数据集的两位受试者身上进行验证。以Windows10系统为实验平台，以Python为程序语言。分类结果以二分类问题常用的评价准确度(accuracy)，精准度(precision)、召回率(recall)、F1值来进行度量。本实施例所提出的p300分类方法分别对两位受试者进行了训练和预测，得到的结果如表1所示，从表中可以看出，经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法都能得到较好的预测结果。

表1两位受试者的训练和预测结果

	Accuracy	Precision	Recall	F1值
					受试者A	0.95	0.94	0.94	0.94
受试者B	0.91	0.88	0.94	0.90

本实施例提供的一种基于深度学习的半监督分类方法，包括：对输入的脑电数据分别进行过滤、截取、归一化和类别化预处理，获得训练用数据集；将所述训练用数据集划分为训练集和验证集，将训练集输入预先构建的网络模型进行训练，获得预分类器；网络模型为双向循环门控单元与注意力编码器集合的网络模型；将训练集和验证集输入所述预分类器，获得低维训练集和验证集；分别根据所述低维训练集和验证集生成对应的矩阵，并合并两个矩阵生成标签矩阵；其中，对由验证集生成的矩阵的标签进行了掩盖；将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符。经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法都能得到较好的预测结果，基于双向循环门控单元编码的标签传播分类算法精度更高，训练简单。

本发明第二实施例提供一种帕金森病筛查设备，所述设备包括存储器以及处理器，所述存储器内存储有计算机程序，所述处理器用于运行所述计算机程序以实现所述的一种基于帕金森病筛查方法。

本发明第三实施例提供一种存储介质，所述存储介质存储有计算机程序，所述计算机程序能够被所述存储介质所在设备的处理器执行，以实现所述的一种帕金森病筛查方法。

在本发明实施例所提供的几个实施例中，应该理解到，所提供的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

尽管结合优选实施方案具体展示和介绍了本发明，但所属领域的技术人员应该明白，在不脱离所附权利要求书所限定的本发明的精神和范围内，在形式上和细节上可以对本发明做出各种变化，均为本发明的保护范围。

Claims

1.一种基于深度学习的半监督分类方法，其特征在于，包括：

将所述训练用数据集划分为训练集和验证集，并将所述训练集输入预先构建的网络模型进行训练，以训练获得预分类器；其中，所述网络模型为双向循环门控单元与注意力编码器集合的网络模型；

2.根据权利1所述的基于深度学习的半监督分类方法，其特征在于，所述对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理，以获得训练用数据集具体为：

使用时间窗对所述带有P300有效成分的数据进行截取；

对截取后的数据进行归一下处理；

3.根据权利要求2所述的基于深度学习的半监督分类方法，其特征在于，所述带通滤波器是8阶0.1-10Hz的FIR带通滤波器，所述时间窗是625ms的时间窗。

4.根据权利要求1所述的基于深度学习的半监督分类方法，其特征在于，所述网络模型包括输入层、双向循环门控单元层、注意力层和输出层。

5.根据权利要求1所述的基于深度学习的半监督分类方法，其特征在于，所述将所述训练用数据集划分为训练集和验证集，并将所述训练集输入预先构建的网络模型进行训练，以训练获得预分类器；其中，所述网络模型为双向循环门控单元与注意力编码器集合的网络模型，具体为：

多次迭代至收敛，保存编码器的参数。

6.根据权利要求5所述的基于深度学习的半监督分类方法，其特征在于，所述计算第i个时间步长的输出并将其输入到注意力层以进行权重分析，第i个时间步长的输出计算公式如下：

其中

和

分别表示第i个时间步向前和向后的输出，

表示元素逐个相加；

将第i个时间步长的输出h_i输入注意力层公式如下：

u＝tanh(W_sh_i+b_s)

α＝softmax(u^TM)

h^*＝Hα^T

7.根据权利要求1所述的基于深度学习的半监督分类方法，其特征在于，所述将所述标签矩阵输入标签传播算法的分类器，预测掩盖部分的标签、并输出分类结果，以最终获取目标字符，具体为：

8.根据权利要求7所述的基于深度学习的半监督分类方法，其特征在于，所述计算所述标签矩阵中两个节点之间的相似度，相似度计算公式：

其中，d_ij表示任意两个节点的欧式距离，α为w_ij参数。

9.一种基于深度学习的半监督分类设备，其特征在于，包括存储器以及处理器，所述存储器内存储有计算机程序，所述处理器用于运行所述计算机程序以实现如权利要求1-8任意一项所述的一种基于深度学习的半监督分类方法。

10.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序能够被所述存储介质所在设备的处理器执行，以实现如权利要求1-8任意一项所述的种基于深度学习的半监督分类方法。