CN112699960A - 基于深度学习的半监督分类方法、设备及存储介质 - Google Patents
基于深度学习的半监督分类方法、设备及存储介质 Download PDFInfo
- Publication number
- CN112699960A CN112699960A CN202110033029.XA CN202110033029A CN112699960A CN 112699960 A CN112699960 A CN 112699960A CN 202110033029 A CN202110033029 A CN 202110033029A CN 112699960 A CN112699960 A CN 112699960A
- Authority
- CN
- China
- Prior art keywords
- training
- data
- deep learning
- label
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000013135 deep learning Methods 0.000 title claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 85
- 239000011159 matrix material Substances 0.000 claims abstract description 44
- 238000012795 verification Methods 0.000 claims abstract description 26
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 23
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010200 validation analysis Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 230000001902 propagating effect Effects 0.000 claims description 2
- 238000007635 classification algorithm Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 6
- 210000004556 brain Anatomy 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 208000018737 Parkinson disease Diseases 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明提供一种基于深度学习的半监督分类方法、设备及存储介质,方法包括:对输入的脑电数据分别进行过滤、截取、归一化和类别化预处理,获得训练用数据集;将训练用数据集划分为训练集和验证集,将训练集输入预先构建的网络模型进行训练,获得预分类器;网络模型为双向循环门控单元与注意力编码器集合的网络模型;将训练集和验证集输入预分类器,获得低维训练集和验证集并生成对应的矩阵,并合并两个矩阵生成标签矩阵;将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符。本发明经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法,减少训练量,得到较好的预测结果。
Description
技术领域
本发明涉及分类方法领域,具体而言,涉及一种基于深度学习的半监督分类方法、设备及存储介质。
背景技术
P300信号是一种人脑在低概率事件刺激后300毫秒左后出现的一个正向峰值信号,通过检测脑电图(Electroencephalogram,EEG)信号中是否存在P300电位,从而推测出人脑传达出的信息,这也是P300脑机接口技术实现大脑向外信息传输的原理。然而,在P300脑机接口系统使用之前,往往需要对受试者进行大量的监督训练,以获得有标签的样本来训练模型,这种训练过程对用户来说非常耗时耗力且得到的脑电数据需要进行大量的人工标记工作。
现有技术提出将EEG信号序列分成不同时期,每个时期包含了相同长度的样本,先对样本用双向GRU编码及注意力机制筛选出更具代表性的样本,以此得到该样本对所在时期的向量表示,再对以上得到的向量表示进行双向GRU编码及注意力机制筛选,最后通过softmax逻辑回归得到判别结果。但是此方法所使用的深度模型属于完全的监督学习网络,要求在系统使用之前,对受试者进行大量的监督训练,这种训练过程非常耗时且得到的数据需要进行大量的人工标记工作。而我们所提的半监督网络可以大大的减少系统使用前的准备工作。将EEG序列成分割成了不同的片段,每个片段中包含了相同长度的样本,并分别使用了两层双向GRU模型和注意力机制对数据进行训练,这势必会使得网络结构复杂化,训练参数冗余庞大,模型收敛速度减慢。模型旨在不依赖受试者的情况下进行情绪分类,即希望模型具有通用性,但众多研究工作表明,不同的受试者其重要的脑电通道组合都是相当不同的,不能一概而论。因此,为每个受试者训练针对最适合其情绪预测的模型是更加明智的选择。
现有技术提出了一种基于图的半监督宽度学习系统分类器。其先用半监督学习方法即标签传播算法(LPA)对无标签数据预测得到其伪标签,再将标签数据和伪标签数据共同放入宽度学习系统中训练分类器。旨在减少标签数据的获取代价以及避免深度学习复杂的网络机构和计算。此方法使用了基于图的标签传播算法得到无标签数据的伪标签,再同时使用伪标签和标签数据对基于宽度学习系统的分类器进行模型训练。由于标签传播算法需要对数据点构建完全连接网络,其时间复杂度为O(N^3),N为样本的数据量,而EEG信号数据矩阵总的大小为三维,构建完全神经网络将消耗大量的运算资源,导致训练速度缓慢,难以推广到实际应用。其主要使用宽度学习系统作为分类器,宽度学习系统虽然是一种不需要大规模GPU的网络模型,但其随机性的节点选取和伪逆计算决定了该网络在面对大规模数据时的精度往往劣于利用深度结构的网络。
发明内容
本发明的目的在于提供一种基于深度学习的半监督分类方法、设备及存储介质,以解决上述存在的问题。
为实现上述目的,本发明实施例提供一种基于深度学习的半监督分类方法,包括
对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理,以获得训练用数据集;
将所述训练用数据集划分为训练集和验证集,将所述训练集输入预先构建的网络模型进行训练,以获得预分类器;其中,所述网络模型为双向循环门控单元与注意力编码器集合的网络模型;
将所述训练集和验证集输入所述预分类器,以获得低维训练集和验证集;
分别根据所述低维训练集和验证集生成对应的矩阵,并合并两个矩阵生成标签矩阵;其中,对由验证集生成的矩阵的标签进行了掩盖;
将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符。
进一步的,所述对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理,以获得训练用数据集具体为:
通过带通滤波器对所述脑电数据进行过滤以筛选出带有P300有效成分的数据;
使用时间窗对所述带有P300有效成分的数据进行截取;
对截取后的数据进行归一下处理;
对归一化后的数据使用min-max进行类别化,将脑电数据映射到[0-1]之间。
更进一步的,所述带通滤波器是8阶0.1-10Hz的FIR带通滤波器,所述时间窗是625ms的时间窗。
进一步的,所述网络模型包括输入层、双向循环门控单元层、注意力层和输出层。
进一步的,所述将所述训练用数据集划分为训练集和验证集,并将所述训练集输入预先构建的网络模型进行训练,以训练获得预分类器;其中,所述网络模型为双向循环门控单元与注意力编码器集合的网络模型,具体为:
将所述训练集通过网络模型的输入层输入到双向循环门控单元层;
计算第i个时间步长的输出并将其输入到注意力层以进行权重分析;
通过softmax层将权重分析后的数据集压缩到0-1之间,再通过argmax函数得到编码器预测的类别,计算损失函数;
多次迭代至收敛,保存编码器的参数。
更进一步的,所述计算第i个时间步长的输出并将其输入到注意力层以进行权重分析,第i个时间步长的输出计算公式如下:
将第i个时间步长的输出hi输入注意力层公式如下:
u=tanh(Wshi+bs)
α=softmax(uTM)
h*=HαT
其中WS为权重参数,bs为偏差,M是样本层次的上下文向量,h*为所有隐藏状态加权求和的结果,tanh为激活函数。
进一步的,将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符,具体为:
将标签数据和未标注数据构造相似矩阵,以建立一个完全连接图,所有数据均表示为图中的节点;
计算所述标签矩阵中两个节点之间的相似度,并进行归一化处理,获得概率传递矩阵;
将每个节点的标签以概率传递矩阵确定的概率传播给其他节点;
限定已标注的数据,将已标注的数据的概率分布重新赋值为初始值,然后重复上一步,直至算法收敛,以完成分类器训练,从而预测掩盖部分的标签,输出分类结果,获得目标字符。
更进一步的,所述计算所述标签矩阵中两个节点之间的相似度,相似度计算公式:
其中,dij表示任意两个节点的欧式距离,α为wij参数。
本发明还提供一种基于深度学习的半监督分类设备,包括存储器以及处理器,所述存储器内存储有计算机程序,所述处理器用于运行所述计算机程序以实现所述的一种基于深度学习的半监督分类方法。
本发明还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序能够被所述存储介质所在设备的处理器执行,以实现所述的一种基于深度学习的半监督分类方法。
本发明提供的一种基于深度学习的半监督分类方法,包括:对输入的脑电数据分别进行过滤、截取、归一化和类别化预处理,获得训练用数据集;将所述训练用数据集划分为训练集和验证集,将训练集输入预先构建的网络模型进行训练,获得预分类器;网络模型为双向循环门控单元与注意力编码器集合的网络模型;将训练集和验证集输入所述预分类器,获得低维训练集和验证集;分别根据所述低维训练集和验证集生成对应的矩阵,并合并两个矩阵生成标签矩阵;其中,对由验证集生成的矩阵的标签进行了掩盖;将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符。经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法都能得到较好的预测结果,基于双向循环门控单元编码的标签传播分类算法精度更高,训练简单。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明第一实施例提供的一种基于深度学习的半监督分类方法流程示意图。
图2为本发明第一实施例提供的一种基于深度学习的半监督分类方法另一流程示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。
参考图1-2,本发明第一实施例提供了一种基于深度学习的半监督分类方法,包括:
S11:对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理,以获得训练用数据集。
在本实施例中,通过带通滤波器对所述脑电数据进行过滤以筛选出带有P300有效成分的数据。
使用时间窗对所述带有P300有效成分的数据进行截取。
对截取后的数据进行归一下处理。
对归一化后的数据使用min-max进行类别化,将脑电数据映射到[0-1]之间。
例如,将单个受试者训练用数据整合成全数据集X,X={x1,x1…..xn},可采用了8阶0.1-10Hz的FIR带通滤波器对脑电信号进行过滤以筛选带有P300有效成分的信号。由于该数据的采样频率为240赫兹,而p300信号出现在刺激发生后的300ms左右,为了保证每次目标行/列闪烁能够将p300信号包括进来,可选择使用625ms的时间窗对数据进行截取,最后得到的数据维度为15300*150*64,其中150为单次闪烁的采样行数,64为通道数。同时,为了统一数据的统计分布性,减少数据幅值带来的影响,训练用数据也将进归一化处理。我们使用min-max标准化,将原始数据映射到[0-1]之间。最后,将训练数据集的标签置为0,1,其中1表示有目标字符所在的行或列闪烁,否则为0。当然需要说明的是所述带通滤波器、时间窗也可以是其他型号,这些方案均在本发明的保护范围。
S12:将所述训练用数据集划分为训练集和验证集,将所述训练集输入预先构建的网络模型进行训练,以获得预分类器;其中,所述网络模型为双向循环门控单元与注意力编码器集合的网络模型。
在本实施例中,首先将所述训练集通过网络模型的输入层输入到双向循环门控单元层。具体过程是:先将以上预处理后的训练用数据分为90%的训练集,10%的验证集。则对于单个受试者,其训练集的大小为[13770*150*64],将其作为双向循环门控单元(Bi-GRU)与注意力(Attention)编码器集合的网络模型的输入。传统的单向循环门控单元网络只能够按时间顺序处理,无法考虑到未来的内容。对于学习时间序列模型的任务来说,能够访问到数据的过去和未来是很关键的,而双向的循环门控单元网络通过引入第二层循环门控单元网络,使得隐藏层之间以相反的方向流动,从而能够更好的捕获到p300脑电信号的代表性特征。循环门控单元计算当前时刻t的新状态公式为:
ht是通过在上一个状态ht-1和当前候选状态之间的线性插值计算得到的。其中zt代表了更新门,它决定着保留多少之前的信息以及增加多少新的信息,zt越大,代表着越多之前的信息被留下。更新门zt的表达方式如下:
zt=σ(Wzχt+Uzht-1+bz)
tanh为激活函数,rt代表重置门,它可以决定以前的状态贡献多少给当前的候选状态,rt的值越小,前一个状态的贡献就越小,如果rt=0,那么将完全忘记上一个状态,其更新式如下:
rt=σ(WrXt+Urht-1+br)。
在本实施例中,计算第i个时间步长的输出并将其输入到注意力层以进行权重分析。第i个时间步长的输出计算公式如下:
注意力层:注意力编码器机制通过分配权重系数,使得具有不同重要度的样本得到不同程度的关注,使用注意力编码器机制的模型可以学习更加显著的脑电图序列特征表示,突出重要样本和重要时期对其p300信号分类的贡献。将第i个时间步长的输出ht输入注意力编码器层:
u=tanh(Wshi+bs)
α=softmax(uTM)
h*=HαT
其中W为权重参数,b为偏差,M是样本层次的上下文向量,可以看作是一个固定查询“什么是重要的样本”的高层表示,h*为所有隐藏状态加权求和的结果。经过该层后所得数据向量大小为[13770*64]。
在本实施例中,通过softmax层将权重分析后的数据集压缩到0-1之间,再通过argmax函数得到编码器预测的类别,计算损失函数。
在本实施例中,多次迭代至收敛,保存编码器的参数。迭代50次后大致收敛,最后将编码器的参数保存用以在下一步骤中使用。
S13:将所述训练集和验证集输入所述预分类器,以获得低维训练集和验证集。
在本实施例中,经过预分类器,获得的低维训练集即标签数据矩阵为[13770*64],验证集即无标签数据矩阵为[1530*64]。
S14:分别根据所述低维训练集和验证集生成对应的矩阵,并合并两个矩阵生成标签矩阵;其中,对由验证集生成的矩阵的标签进行了掩盖。
在本实施例中,标签传播算法即LPA,对由验证集生成的矩阵的标签进行了掩盖,将低维训练集即标签数据和验证集即无标签数据构造相似矩阵,以建立一个完全连接图,所有数据均表示为图中的节点。构造相似矩阵具体过程为:设(x1,y1)...(xl,yl)为标签数据,YL={y1...yL)∈{1,0},且其存于数据标签中。(xl+1,yl+1)...(xl+u,yl+u)为无标签数据,则Yu={(yl+1...yl+u)}是未知的,即被掩盖、需要被预测的标签。在本数据集中,标签数据矩阵为[13770*64],无标签验证数据集矩阵[1530*64]。将两个数据集合并作为输入数据集,并为各数据点构造相似矩阵。
在本实施例中,将标签数据设置为矩阵YL,初始化标签设置为矩阵YU,将两个矩阵进行合并,得到标签矩阵。标签数据的矩阵YL大小为[13770*2],第一维表示数据量,第二维表示类别数,如果第i个样本的类别是1,那么第i行的第1个元素为1,其他为0。同样,为验证数据集设置其初始化标签矩阵YU,其值统一设置为-1。最后将两个矩阵进行合并,得到标签矩阵为F=[YL;YU]。
S15:将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符。
在本实施例中,所述标签矩阵即建立一个完全连接图,将所有数据都表示为图中的节点,包括有标签数据和无标签数据,节点之间的连线,也称为边,表示的是两个节点之间的相似度。
计算所述标签矩阵中两个节点之间的相似度,并进行归一化处理,获得概率传递矩阵;两个节点之间的相似度计算公式如下:
其中dij表示任意两个节点的欧式距离,α为wij参数,且两点间的dij越小,权重wij越大。
为了评估一个节点的标签通过边传播到其他节点的概率,我们将以上得到的相似度进行归一化处理,得到一个概率传递矩阵T,表示节点j到i的传播概率。其表达式如下,
在本实施例中,将每个节点的标签以概率传递矩阵确定的概率传播给其他节点。
在本实施例中,限定已标注的数据,将已标注的数据的概率分布重新赋值为初始值,然后重复上一步,直至算法收敛,以完成分类器的训练,从而预测掩盖部分的标签,输出分类结果,获得目标字符。
为便于对本发明的理解,本实施例基于双向门控循环单元编码的标签传播算法针对p300脑电信号分类的有效性在公开数据集-第三届国际BCI竞赛中字符拼写系统的P300数据集的两位受试者身上进行验证。以Windows10系统为实验平台,以Python为程序语言。分类结果以二分类问题常用的评价准确度(accuracy),精准度(precision)、召回率(recall)、F1值来进行度量。本实施例所提出的p300分类方法分别对两位受试者进行了训练和预测,得到的结果如表1所示,从表中可以看出,经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法都能得到较好的预测结果。
表1两位受试者的训练和预测结果
Accuracy | Precision | Recall | F1值 | |
受试者A | 0.95 | 0.94 | 0.94 | 0.94 |
受试者B | 0.91 | 0.88 | 0.94 | 0.90 |
本实施例提供的一种基于深度学习的半监督分类方法,包括:对输入的脑电数据分别进行过滤、截取、归一化和类别化预处理,获得训练用数据集;将所述训练用数据集划分为训练集和验证集,将训练集输入预先构建的网络模型进行训练,获得预分类器;网络模型为双向循环门控单元与注意力编码器集合的网络模型;将训练集和验证集输入所述预分类器,获得低维训练集和验证集;分别根据所述低维训练集和验证集生成对应的矩阵,并合并两个矩阵生成标签矩阵;其中,对由验证集生成的矩阵的标签进行了掩盖;将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符。经过双向循环门控单元编码后的p300信号使用标签传播半监督分类算法都能得到较好的预测结果,基于双向循环门控单元编码的标签传播分类算法精度更高,训练简单。
本发明第二实施例提供一种帕金森病筛查设备,所述设备包括存储器以及处理器,所述存储器内存储有计算机程序,所述处理器用于运行所述计算机程序以实现所述的一种基于帕金森病筛查方法。
本发明第三实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序能够被所述存储介质所在设备的处理器执行,以实现所述的一种帕金森病筛查方法。
在本发明实施例所提供的几个实施例中,应该理解到,所提供的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
Claims (10)
1.一种基于深度学习的半监督分类方法,其特征在于,包括:
对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理,以获得训练用数据集;
将所述训练用数据集划分为训练集和验证集,并将所述训练集输入预先构建的网络模型进行训练,以训练获得预分类器;其中,所述网络模型为双向循环门控单元与注意力编码器集合的网络模型;
将所述训练集和验证集输入所述预分类器,以获得低维训练集和验证集;
分别根据所述低维训练集和验证集生成对应的矩阵,并合并两个矩阵生成标签矩阵;其中,对由验证集生成的矩阵的标签进行了掩盖;
将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符。
2.根据权利1所述的基于深度学习的半监督分类方法,其特征在于,所述对输入的目标受试者的脑电数据分别进行过滤、截取、归一化和类别化预处理,以获得训练用数据集具体为:
通过带通滤波器对所述脑电数据进行过滤以筛选出带有P300有效成分的数据;
使用时间窗对所述带有P300有效成分的数据进行截取;
对截取后的数据进行归一下处理;
对归一化后的数据使用min-max进行类别化,将脑电数据映射到[0-1]之间。
3.根据权利要求2所述的基于深度学习的半监督分类方法,其特征在于,所述带通滤波器是8阶0.1-10Hz的FIR带通滤波器,所述时间窗是625ms的时间窗。
4.根据权利要求1所述的基于深度学习的半监督分类方法,其特征在于,所述网络模型包括输入层、双向循环门控单元层、注意力层和输出层。
5.根据权利要求1所述的基于深度学习的半监督分类方法,其特征在于,所述将所述训练用数据集划分为训练集和验证集,并将所述训练集输入预先构建的网络模型进行训练,以训练获得预分类器;其中,所述网络模型为双向循环门控单元与注意力编码器集合的网络模型,具体为:
将所述训练集通过网络模型的输入层输入到双向循环门控单元层;
计算第i个时间步长的输出并将其输入到注意力层以进行权重分析;
通过softmax层将权重分析后的数据集压缩到0-1之间,再通过argmax函数得到编码器预测的类别,计算损失函数;
多次迭代至收敛,保存编码器的参数。
7.根据权利要求1所述的基于深度学习的半监督分类方法,其特征在于,所述将所述标签矩阵输入标签传播算法的分类器,预测掩盖部分的标签、并输出分类结果,以最终获取目标字符,具体为:
计算所述标签矩阵中两个节点之间的相似度,并进行归一化处理,获得概率传递矩阵;
将每个节点的标签以概率传递矩阵确定的概率传播给其他节点;
限定已标注的数据,将已标注的数据的概率分布重新赋值为初始值,然后重复上一步,直至算法收敛,以完成分类器训练,从而预测掩盖部分的标签,输出分类结果,获得目标字符。
9.一种基于深度学习的半监督分类设备,其特征在于,包括存储器以及处理器,所述存储器内存储有计算机程序,所述处理器用于运行所述计算机程序以实现如权利要求1-8任意一项所述的一种基于深度学习的半监督分类方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序能够被所述存储介质所在设备的处理器执行,以实现如权利要求1-8任意一项所述的种基于深度学习的半监督分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110033029.XA CN112699960B (zh) | 2021-01-11 | 2021-01-11 | 基于深度学习的半监督分类方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110033029.XA CN112699960B (zh) | 2021-01-11 | 2021-01-11 | 基于深度学习的半监督分类方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112699960A true CN112699960A (zh) | 2021-04-23 |
CN112699960B CN112699960B (zh) | 2023-06-09 |
Family
ID=75513927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110033029.XA Active CN112699960B (zh) | 2021-01-11 | 2021-01-11 | 基于深度学习的半监督分类方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112699960B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113139505A (zh) * | 2021-05-11 | 2021-07-20 | 北京邮电大学 | 半监督学习的方法及系统 |
CN113221995A (zh) * | 2021-04-30 | 2021-08-06 | 中南民族大学 | 基于半监督深度分类算法的数据分类方法、设备及装置 |
CN113420817A (zh) * | 2021-06-25 | 2021-09-21 | 西安电子科技大学 | 基于网络结构特征归纳的半监督调制类型识别方法、装置及介质 |
CN113657623A (zh) * | 2021-07-13 | 2021-11-16 | 国网河北省电力有限公司电力科学研究院 | 电力设备状态诊断效果确定方法、装置、终端及存储介质 |
CN114387477A (zh) * | 2022-01-18 | 2022-04-22 | 中国农业银行股份有限公司 | 标签分类模型训练方法、标签分类方法、装置及设备 |
CN114403899A (zh) * | 2022-02-08 | 2022-04-29 | 浙江浙大西投脑机智能科技有限公司 | 一种大脑神经元锋电位与局部场电位结合的抑郁检测方法 |
CN114626408A (zh) * | 2022-02-18 | 2022-06-14 | 清华大学深圳国际研究生院 | 脑电信号分类方法、装置、电子设备、介质及产品 |
CN115458049A (zh) * | 2022-06-29 | 2022-12-09 | 四川大学 | 基于双向循环神经网络的普适性抗瓜氨酸化多肽抗体表位预测方法及装置 |
CN116188876A (zh) * | 2023-03-29 | 2023-05-30 | 上海锡鼎智能科技有限公司 | 基于信息混合的半监督学习方法及半监督学习装置 |
CN117056788A (zh) * | 2023-10-12 | 2023-11-14 | 之江实验室 | 一种基于有监督对比学习的eeg信号分类方法、装置 |
CN117272244A (zh) * | 2023-11-21 | 2023-12-22 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
CN117407772A (zh) * | 2023-12-13 | 2024-01-16 | 江西师范大学 | 监督对比学习网络模型训练多元时序数据分类方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608690A (zh) * | 2015-12-05 | 2016-05-25 | 陕西师范大学 | 一种基于图论和半监督学习相结合的图像分割方法 |
US20170213000A1 (en) * | 2016-01-25 | 2017-07-27 | Shenzhen University | Metabolic mass spectrometry screening method for diseases based on deep learning and the system thereof |
CN109034205A (zh) * | 2018-06-29 | 2018-12-18 | 西安交通大学 | 基于直推式半监督深度学习的图像分类方法 |
US20190042952A1 (en) * | 2017-08-03 | 2019-02-07 | Beijing University Of Technology | Multi-task Semi-Supervised Online Sequential Extreme Learning Method for Emotion Judgment of User |
CN109657226A (zh) * | 2018-09-20 | 2019-04-19 | 北京信息科技大学 | 多联结注意力的阅读理解模型、系统及方法 |
CN110399805A (zh) * | 2019-07-02 | 2019-11-01 | 成都信息工程大学 | 半监督学习优化svm的运动想象脑电信号分类方法 |
CN110717390A (zh) * | 2019-09-05 | 2020-01-21 | 杭州电子科技大学 | 基于图半监督宽度学习的脑电信号分类方法 |
-
2021
- 2021-01-11 CN CN202110033029.XA patent/CN112699960B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608690A (zh) * | 2015-12-05 | 2016-05-25 | 陕西师范大学 | 一种基于图论和半监督学习相结合的图像分割方法 |
US20170213000A1 (en) * | 2016-01-25 | 2017-07-27 | Shenzhen University | Metabolic mass spectrometry screening method for diseases based on deep learning and the system thereof |
US20190042952A1 (en) * | 2017-08-03 | 2019-02-07 | Beijing University Of Technology | Multi-task Semi-Supervised Online Sequential Extreme Learning Method for Emotion Judgment of User |
CN109034205A (zh) * | 2018-06-29 | 2018-12-18 | 西安交通大学 | 基于直推式半监督深度学习的图像分类方法 |
CN109657226A (zh) * | 2018-09-20 | 2019-04-19 | 北京信息科技大学 | 多联结注意力的阅读理解模型、系统及方法 |
CN110399805A (zh) * | 2019-07-02 | 2019-11-01 | 成都信息工程大学 | 半监督学习优化svm的运动想象脑电信号分类方法 |
CN110717390A (zh) * | 2019-09-05 | 2020-01-21 | 杭州电子科技大学 | 基于图半监督宽度学习的脑电信号分类方法 |
Non-Patent Citations (2)
Title |
---|
李雯莉;张素兰;张继福;胡立华;: "基于卷积神经网络和概念格的图像语义完备标注", 小型微型计算机系统, no. 09, pages 189 - 196 * |
闫茹玉;刘学亮;: "结合自底向上注意力机制和记忆网络的视觉问答模型", 中国图象图形学报, no. 05, pages 147 - 160 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221995A (zh) * | 2021-04-30 | 2021-08-06 | 中南民族大学 | 基于半监督深度分类算法的数据分类方法、设备及装置 |
CN113221995B (zh) * | 2021-04-30 | 2023-06-30 | 中南民族大学 | 基于半监督深度分类算法的数据分类方法、设备及装置 |
CN113139505A (zh) * | 2021-05-11 | 2021-07-20 | 北京邮电大学 | 半监督学习的方法及系统 |
CN113420817A (zh) * | 2021-06-25 | 2021-09-21 | 西安电子科技大学 | 基于网络结构特征归纳的半监督调制类型识别方法、装置及介质 |
CN113657623B (zh) * | 2021-07-13 | 2023-09-29 | 国网河北省电力有限公司电力科学研究院 | 电力设备状态诊断效果确定方法、装置、终端及存储介质 |
CN113657623A (zh) * | 2021-07-13 | 2021-11-16 | 国网河北省电力有限公司电力科学研究院 | 电力设备状态诊断效果确定方法、装置、终端及存储介质 |
CN114387477A (zh) * | 2022-01-18 | 2022-04-22 | 中国农业银行股份有限公司 | 标签分类模型训练方法、标签分类方法、装置及设备 |
CN114403899A (zh) * | 2022-02-08 | 2022-04-29 | 浙江浙大西投脑机智能科技有限公司 | 一种大脑神经元锋电位与局部场电位结合的抑郁检测方法 |
CN114403899B (zh) * | 2022-02-08 | 2023-07-25 | 浙江浙大西投脑机智能科技有限公司 | 一种大脑神经元锋电位与局部场电位结合的抑郁检测装置 |
CN114626408A (zh) * | 2022-02-18 | 2022-06-14 | 清华大学深圳国际研究生院 | 脑电信号分类方法、装置、电子设备、介质及产品 |
CN115458049A (zh) * | 2022-06-29 | 2022-12-09 | 四川大学 | 基于双向循环神经网络的普适性抗瓜氨酸化多肽抗体表位预测方法及装置 |
CN116188876A (zh) * | 2023-03-29 | 2023-05-30 | 上海锡鼎智能科技有限公司 | 基于信息混合的半监督学习方法及半监督学习装置 |
CN116188876B (zh) * | 2023-03-29 | 2024-04-19 | 上海锡鼎智能科技有限公司 | 基于信息混合的半监督学习方法及半监督学习装置 |
CN117056788A (zh) * | 2023-10-12 | 2023-11-14 | 之江实验室 | 一种基于有监督对比学习的eeg信号分类方法、装置 |
CN117056788B (zh) * | 2023-10-12 | 2023-12-19 | 之江实验室 | 一种基于有监督对比学习的eeg信号分类方法、装置 |
CN117272244A (zh) * | 2023-11-21 | 2023-12-22 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
CN117272244B (zh) * | 2023-11-21 | 2024-03-15 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
CN117407772A (zh) * | 2023-12-13 | 2024-01-16 | 江西师范大学 | 监督对比学习网络模型训练多元时序数据分类方法及系统 |
CN117407772B (zh) * | 2023-12-13 | 2024-03-26 | 江西师范大学 | 监督对比学习网络模型训练多元时序数据分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112699960B (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699960A (zh) | 基于深度学习的半监督分类方法、设备及存储介质 | |
Liang et al. | Text feature extraction based on deep learning: a review | |
CN112163426B (zh) | 一种基于注意力机制与图长短时记忆神经网络结合的关系抽取方法 | |
Bengio et al. | Deep learning | |
Zorzi et al. | Modeling language and cognition with deep unsupervised learning: a tutorial overview | |
Mena et al. | A survey on uncertainty estimation in deep learning classification systems from a bayesian perspective | |
CN109165387A (zh) | 一种基于gru神经网络的中文评论情感分析法 | |
Schaaf et al. | Enhancing decision tree based interpretation of deep neural networks through l1-orthogonal regularization | |
CN112364638B (zh) | 一种基于社交文本的人格识别方法 | |
Nguyen et al. | Practical and theoretical aspects of mixture‐of‐experts modeling: An overview | |
Kleyko et al. | Integer echo state networks: Efficient reservoir computing for digital hardware | |
Xu et al. | A parallel GRU recurrent network model and its application to multi-channel time-varying signal classification | |
Rahman et al. | Predicting human design decisions with deep recurrent neural network combining static and dynamic data | |
Huang et al. | LTNN: A layerwise tensorized compression of multilayer neural network | |
Gong et al. | Exploiting deep neural network and long short-term memory method-ologies in bioacoustic classification of LPC-based features | |
Ferreira et al. | Data selection in neural networks | |
Shimazaki | The principles of adaptation in organisms and machines I: machine learning, information theory, and thermodynamics | |
Rodkin et al. | Stability and similarity detection for the biologically inspired temporal pooler algorithms | |
Mohanty et al. | Normalized approximate descent used for spike based automatic bird species recognition system | |
US20220202348A1 (en) | Implementing brain emulation neural networks on user devices | |
Mirowski | Time series modeling with hidden variables and gradient-based algorithms | |
Xiong et al. | Time series classification models based on nonlinear spiking neural P systems | |
CN113033710A (zh) | 一种时间序列分类方法、装置及计算机设备 | |
Patel et al. | Liquid state machine on loihi: Memory metric for performance prediction | |
Greaves-Tunnell | An optimization perspective on approximate neural filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |