CN116070120A - 一种多标签时序电生理信号的自动识别方法及系统 - Google Patents

一种多标签时序电生理信号的自动识别方法及系统 Download PDF

Info

Publication number
CN116070120A
CN116070120A CN202310356461.1A CN202310356461A CN116070120A CN 116070120 A CN116070120 A CN 116070120A CN 202310356461 A CN202310356461 A CN 202310356461A CN 116070120 A CN116070120 A CN 116070120A
Authority
CN
China
Prior art keywords
tag
label
recognition model
function
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310356461.1A
Other languages
English (en)
Other versions
CN116070120B (zh
Inventor
喻罡
李辉
杨华
孙凯
魏新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Guitu Information Technology Co ltd
Central South University
Original Assignee
Hunan Guitu Information Technology Co ltd
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Guitu Information Technology Co ltd, Central South University filed Critical Hunan Guitu Information Technology Co ltd
Priority to CN202310356461.1A priority Critical patent/CN116070120B/zh
Publication of CN116070120A publication Critical patent/CN116070120A/zh
Application granted granted Critical
Publication of CN116070120B publication Critical patent/CN116070120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种多标签时序电生理信号的自动识别方法及系统,通过采集时序电生理信号数据集,将多标签信号解码为单标签特征信号,建立正负样本训练单标签识别模型,并通过自主学习、强化学习以及单标签识别模型的特征迁移,获得多标签识别模型以及根据多标签先验概率、单标签先验概率、单标签识别模型以及多标签识别模型对待识别的多标签时序电生理信号进行自动识别,解决了对类别不平衡的多标签时序电生理信号识别准确度低的技术问题,能同时精准识别常见类别和罕见类别,从而大大提高了多标签预测的准确度。

Description

一种多标签时序电生理信号的自动识别方法及系统
技术领域
本发明主要涉及信号处理技术领域,特指一种多标签时序电生理信号的自动识别方法及系统。
背景技术
人体的时序电生理信号,如心电,肌电和脑电等,和人体生理活动密切相关,对监测人体健康状态具有重要意义。然而,电生理信号的监测依赖于有经验的专家人工识别。为了降低时序电生理信号人工识别的工作量,同时发展特殊人群的24小时时序电生理信号的监测系统,建立计算机自动识别技术具有重要意义。
当前,时序电生理信号的自动识别技术主要基于深度学习实现。首先,依据时序电生理信号的类别建立标签,组建训练集。其次,构建深度神经网络自动学习特征;输入原始的时序电生理信号,输出类别标签,从而建立正确识别时序电生理信号标签的分类模型。第一类技术基于卷积神经网络实现,采用卷积层、池化层以及全连接层进行组合,实现时序电生理信号标签的自动识别。第二类技术基于递归神经网络实现,将时序电生理信号看作为时间序列,以双向递归神经网络或者长短时记忆网络为代表性神经网络,实现时序电生理信号标签的自动识别。第三类技术将多种深度神经网络结构进行组合,例如将卷积神经网络和递归神经网络结合在一起构成混合方法,从而利用前两类方法的优势,取得更高的识别准确度。
现有方法的主要技术缺陷有:第一,不能有效识别罕见的时序电生理信号类别。例如现有时序电生理信号关于心率失常的类别多达数百种,常见的有20余种,超过95%的样本属于常见类别,因此各类别的样本数量严重不平衡。由于罕见类别样本数量远比常见类别样本数量少,常规深度学习建立的模型容易倾向于常见类别,造成罕见类别识别的准确度严重下降。第二,难以有效识别多标签的时序电生理信号。临床上认为一条时序电生理信号可能存在一种到多种诊断结论,因此这条时序电生理信号存在一种到多种标签的组合,即所谓多标签时序电生理信号。多标签时序电生理信号扩大了需要识别的类别组合的数量,进一步加剧了类别的不平衡问题。因此,现有绝大多数分类方法只能识别多标签时序电生理信号的某一种标签,例如只识别最显著的类别,而无法精确识别所有的标签。
发明内容
本发明提供的多标签时序电生理信号的自动识别方法及系统,解决了对类别不平衡的多标签时序电生理信号识别准确度低的技术问题。
为解决上述技术问题,本发明提出的多标签时序电生理信号的自动识别方法包括:
采集时序电生理信号数据集,并根据时序电生理信号数据集中的多标签以及单标签出现频次,分别计算多标签先验概率和单标签先验概率。
用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型,单标签识别模型的数量与单标签类别数相同。
通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型。
通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型。
根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别。
进一步地,用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型包括:
将时序电生理信号数据集中的数据样本输入解码器,获得数据样本的单标签特征信号,其中数据样本的单标签特征信号包括与所有单标签类别对应的单标签特征信号。
根据数据样本的单标签特征信号,获取与单标签类别对应的正类样本和负类样本,作为与单标签类别对应的单标签识别模型的输入,并将二分类的预测概率作为单标签识别模型的输出,其中与单标签类别对应的正类样本具体为与单标签类别相同的单标签类别对应的单标签特征信号,与单标签类别对应的负类样本具体为与单标签类别不同的单标签类别对应的单标签特征信号。
采用第一代价函数训练解码器和单标签识别模型,直到第一代价函数最小化,获得训练好的单标签识别模型。
进一步地,第一代价函数的具体公式为:
其中,为第一代价函数,为数据样本数量,为数据样本的第一代价,的单标签类别集合,分别为的单标签特征信号中与第个单标签类别对应的和不对应的单标签特征信号,分别为与第个单标签类别对应的单标签识别模型对的二分类预测概率。
 为的单标签特征信号中与第个单标签类别对应的单标签识别模型的代价函数,为交叉熵函数,为正类标签,为负类标签;的单标签特征信号中与第个单标签类别对应的单标签特征信号,且为独立性代价函数, 为相对熵函数;为不包含于的一个单标签,即 为能量代价函数,的单标签特征信号中与不包含于的单标签类别对应的单标签特征信号,为数据集中所有单标签类别集合,中单标签类别的个数,中单标签类别个数,为不包含于的任意一个单标签类别,的单标签特征信号中与第个单标签类别对应的单标签特征信号,为平均值计算函数,分别为第一、第二及第三权重系数。
进一步地,通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型包括:
根据多标签先验概率,获得自主学习重采样函数,并根据自主学习重采样函数对时序电生理信号数据集进行自主学习重采样,获得自主学习训练样本集合。
将自主学习训练样本集合同时输入解码器、单标签识别模型以及原始多标签识别模型。
保持解码器以及单标签识别模型不变,使用第二代价函数训练第一多标签识别模型。
训练预设训练周期后,采用循环平移方式,更新自主学习重采样函数,并根据更新后的自主学习重采样函数采集的自主学习训练样本集合对第一多标签识别模型进行训练,直至第二代价函数最小化,获得训练好的第一多标签识别模型。
进一步地,第二代价函数的具体公式为:
其中,为第二代价函数, 为数据样本的第二代价,为数据样本数量,为第一多标签识别模型输出的的多标签概率,的单标签类别集合,为交叉熵函数,为均方误差函数,为第四权重系数, 为第一多标签识别模型的高层次特征,分别为的第1个至第个单标签特征信号输入第1个至第个单标签类别对应的单标签识别模型输出的高层次特征, 为指示函数, 为维度连接函数。
进一步地,通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型包括:
根据单标签先验概率,获得强化学习重采样函数,并根据强化学习重采样函数对时序电生理信号数据集进行强化学习重采样,获得强化学习训练样本集合;
将强化学习训练样本集合同时输入解码器、单标签识别模型以及第一多标签识别模型。
保持解码器以及单标签识别模型不变,使用第三代价函数训练第一多标签识别模型。
训练预设训练周期后,采用倍增方式更新强化学习重采样函数,并根据更新后的强化学习重采样函数采集的强化学习训练样本集合对第一多标签识别模型进行训练,直至第三代价函数最小化,获得训练好的第二多标签识别模型。
进一步地,第三代价函数的具体公式为:
其中,为第三代价函数, 为数据样本的第三代价,为数据样本数量,为第二多标签识别模型输出的的多标签概率,的单标签类别集合,为数据集中所有单标签类别集合,中单标签类别的个数,中单标签类别的个数, 为将第二多标签识别模型输出的第个单标签类别的概率转换为向量的计算函数,为交叉熵函数,为均方误差函数,分别为第五和第六权重系数; 为第二多标签识别模型的高层次特征, 分别为的单标签特征向量中第1个至第个单标签特征信号输入第1个至第个单标签类别对应的单标签识别模型输出的高层次特征, 为指示函数, 为维度连接函数,为均值差异代价函数,为希尔伯特空间距离的计算函数,为和具有同样标签的样本的集合,中的子集,为同一个批次中和具有同样标签的样本出现的次数。
进一步地,根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别包括:
将待识别的多标签时序电生理信号分别输入单标签识别模型以及第二多标签识别模型。
根据预设的二值化阈值,将单标签识别模型和第二多标签识别模型的输出结果进行二值化,获得二值化单标签结果和二值化多标签结果。
根据二值化单标签结果和二值化多标签结果,以及多标签先验概率和单标签先验概率,对待识别的多标签时序电生理信号进行自动识别。
进一步地,根据二值化单标签结果和二值化多标签结果,以及多标签先验概率和单标签先验概率,对待识别的多标签时序电生理信号进行自动识别包括:
判断与单标签类别对应的单标签识别模型输出的二值化单标签结果是否均等于二值化多标签结果中与单标签类别对应的输出结果,若是,则判断多标签结果中等于1的单标签组成的多标签是否属于数据集存在的预设多标签集合,若是,则将二值化多标签结果作为识别结果,若否,则将预设多标签集合中与多标签结果中等于1的单标签组成的多标签的相似度大于预设相似阈值的预设多标签作为识别结果,以及在判断有多个大于预设相似阈值的预设多标签时,选择单标签先验概率和最大的预设多标签作为识别结果,若无法获得相似度大于预设相似阈值的预设多标签,则将单标签正类标签组合作为识别结果,单标签正类标签组合具体为所有单标签识别模型预测为正类标签的二值化单标签结果的组合。
若与单标签类别对应的单标签识别模型输出的二值化单标签结果不全部等于二值化多标签结果中与单标签类别对应的输出结果时,判断是否有包含于数据集存在的预设多标签集合的二值化多标签结果或单标签正类标签组合,若是,则选择包含于预设多标签集合的二值化多标签结果或单标签正类标签组合作为识别结果,若否,则将预设多标签集合中与多标签结果中等于1的单标签组成的多标签的相似度大于预设相似阈值或与单标签正类标签组合的相似度大于预设相似阈值的预设多标签作为识别结果,以及在判断有多个相似度大于预设相似阈值的预设多标签时,选择单标签先验概率和最大的预设多标签作为识别结果,若无法获得相似度大于预设相似阈值的预设多标签,则将单标签正类标签组合作为识别结果。
本发明提供的多标签时序电生理信号的自动识别系统包括:
存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明提供的多标签时序电生理信号的自动识别方法的步骤。
与现有技术相比,本发明的优点在于:
本发明提供的多标签时序电生理信号的自动识别方法及系统,通过采集时序电生理信号数据集,并根据时序电生理信号数据集中的多标签以及单标签出现频次,分别计算多标签先验概率和单标签先验概率,用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型,通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型,通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型以及根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别,解决了对类别不平衡的多标签时序电生理信号识别准确度低的技术问题,能同时精准识别常见类别和罕见类别,从而大大提高了多标签预测的准确度。
附图说明
图1为本发明实施例二的多标签时序电生理信号的自动识别方法的流程图;
图2为本发明实施例二的单标签识别模型与解码模块的示意图,其中图2(a)为单标签识别模型的示意图,图2(b)为解码模块的示意图;
图3为本发明实施例二的自主学习流程图;
图4为本发明实施例二的强化学习流程图;
图5为本发明实施例的多标签时序电生理信号的自动识别系统的结构框图。
附图标记:
10、存储器;20、处理器。
具体实施方式
为了便于理解本发明,下文将结合说明书附图和较佳的实施例对本发明作更全面、细致地描述,但本发明的保护范围并不限于以下具体的实施例。
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
实施例一
本发明实施例一提供的多标签时序电生理信号的自动识别方法,包括:
步骤S101,采集时序电生理信号数据集,并根据时序电生理信号数据集中的多标签以及单标签出现频次,分别计算多标签先验概率和单标签先验概率;
步骤S102,用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型,单标签识别模型的数量与单标签类别数相同;
步骤S103,通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型;
步骤S104,通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型;
步骤S105,根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别。
本发明实施例提供的多标签时序电生理信号的自动识别方法,通过采集时序电生理信号数据集,并根据时序电生理信号数据集中的多标签以及单标签出现频次,分别计算多标签先验概率和单标签先验概率;用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型;通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型;通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型;根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别,解决了对类别不平衡的多标签时序电生理信号识别准确度低的技术问题,能同时精准识别常见类别和罕见类别,从而大大提高了多标签预测的准确度。
具体地,本实施例将多标签信号解码为单标签特征信号,建立正负样本训练单标签识别模型,提高了类别的平衡性,从而提高了罕见标签的识别准确度;采用自主学习、强化学习以及单标签识别模型的特征迁移,使得常见标签和罕见标签均取得良好的识别准确度,从而解决了多标签识别模型在常见类别以及罕见类别的识别准确度不平衡的问题;此外,融合多标签先验概率、单标签先验概率、单标签识别模型以及多标签识别模型结果,建立决策规则,进一步提高了识别准确度。
实施例二
如图1所示,本发明实施例的多标签时序电生理信号的自动识别方法包括:
1) 制作时序电生理信号数据集,根据数据集中的多标签出现频次以及单标签出现频次,计算多标签以及单标签先验概率。
2)用解码器对多标签信号进行分解,得到独立的单标签特征信号。用单标签特征信号训练单标签识别模型。
3)每个周期设定重采样频率,对数据集中样本进行采样,构建本周期训练数据,通过自主学习以及单标签识别模型迁移,训练第一多标签识别模型。
4)计算第一多标签识别模型和单标签模型输出特征的均值差异,对均值差异增大的单标签提高采样频率;对均值差异减小的降低采样频率,重采样数据集,通过强化学习以及单标签识别模型迁移,训练第二多标签识别模型。
5)将多标签以及单标签先验概率,单标签识别模型以及第二多标签识别模型建立决策规则,实现时序电生理信号的多标签识别。
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
步骤一:制作包括个时序电生理信号样本的数据集,全部标签的集合为均为标签集合中的一个标签(单标签);一个多标签定义为若干个单标签的集合,记为;令中的标签数量为,且。所有多标签集合定义为
优选的,用不同的自然数字表示。
优选的,用OneHot向量表示且向量的维度为,属于的标签定义为1,不属于的标签定义为0。
S11:从中查找多标签为的样本数量,用出现次数计算多标签先验概率
其中,为数据集中任一个时序电生理信号的多标签,定义为的所有单标签集合,为指示函数。
S12:从中查找标签包括的样本数量,用出现次数计算单标签先验概率
步骤二:对于任意一个时序电生理信号,其多标签为;用解码器进行分解,得到单标签特征信号集合;训练m个单标签识别模型,如图2(a)所示。
训练步骤如下:
S21:对于任意一个时序电生理信号,其标签为。其中的矩阵,为信号导联数,为时间点数。将输入底层和中层解码模块。
S22:底层和中层解码模块分别输的底层和中层特征信号。
S23:将中层特征信号分别输出高层解码模块1-m,得到单标签特征信号
S24:令;将作为正类样本,将除之外且属于作为负类样本,输入第单标签识别模型,得到预测概率以及
S25:用第一代价函数训练解码器和单标签识别模型;第一代价函数定义为:
其中,为第一代价函数,为数据样本数量,为数据样本的第一代价,的单标签类别集合,分别为的单标签特征信号中与第个单标签类别对应的和不对应的单标签特征信号,分别为与第个单标签类别对应的单标签识别模型对的二分类预测概率;
 为的单标签特征信号中与第个单标签类别对应的单标签识别模型的代价函数,为交叉熵函数,为正类标签,为负类标签;的单标签特征信号中与第个单标签类别对应的单标签特征信号,且为独立性代价函数, 为相对熵函数;为不包含于的一个单标签,即 为能量代价函数,的单标签特征信号中与不包含于的单标签类别对应的单标签特征信号,为数据集中所有单标签类别集合,中单标签类别的个数,中单标签类别个数,为不包含于的任意一个单标签类别,的单标签特征信号中与第个单标签类别对应的单标签特征信号,为平均值计算函数,分别为第一、第二及第三权重系数。
具体地,为一个批次的第一代价,批次中样本数量为为批次中的一个样本,为该样本的第一代价,定义为单标签识别代价、独立性代价以及能量代价之和;的单标签集合,单标签识别代价为单标签集合对应的单标签识别模型的代价之和;独立性代价计算包含于单标签集合对应的单标签特征信号的两两之间的统计学独立性;能量代价计算不包含于单标签集合对应的单标签特征信号的能量值。
为第j单标签识别模型的代价函数,定义为第j单标签识别模型对单标签集合中对应第j单标签特征信号预测概率与正类标签的交叉熵、对单标签集合中对应非第j单标签特征信号预测概率与负类标签的交叉熵之和;为正类标签,为负类标签;为交叉熵函数。为独立性代价函数,定义为单标签集合中任意两个单标签对应的单标签特征信号的相对熵与余弦距离之和。为能量代价函数,定义为单标签特征信号的方差。为权重。
优选地,每个解码模块为循环网络结构,如图2(b)。可选的结构如长短程记忆网络,双向循环神经网络等。
优选地,单标签识别模型为卷积神经网络,输入单标签特征信号,输出预测概率,且预测概率为一个二维向量。
优选地,独立性代价可以选择其它评估独立性的函数,例如互信息。
优选地,用第一代价函数和随机梯度下降法,训练编码器以及单标签识别模型。
S26:选择其他的时序电生理信号样本,转到S21,直到第一代价函数最小化。
步骤三:将个单标签识别模型进行融合,通过自主学习建立第一多标签识别模型,如图3所示。
步骤如下:
S31:定义自主学习重采样函数的更新频次为。用多标签先验概率,作为第一个训练周期的自主学习重采样函数
从高到低排序,得到样本出现概率序列为排序操作。
S32:在第k个训练周期,用自主学习重采样函数重采样,获得第k周期训练样本集合,使得样本的多标签出现频次和一致。
S33:将训练样本集合输入解码器以及单标签识别模型,同时输入第一多标签识别模型。
S34:保持解码器以及单标签识别模型保持不变,使用第二代价函数训练第一多标签自动识别模型。
其中,为一个批次的第二代价,批次中样本数量为为批次中的一个样本,为该样本的第二代价。第二代价函数定义为第一多标签识别代价与特征差异代价之和。其中,多标签识别代价为第一多标签识别模型输出多标签预测概率和真实多标签概率的交叉熵;特征差异代价定义为第一多标签识别模型高层次特征和单标签识别模型高层次特征的差异;为权重。
为本周期训练样本集合中一个训练样本;为交叉熵函数;为均方误差函数;为第j单标签识别模型输出的高层次特征;为第一多标签识别模型输出的高层次特征;为维度连接函数,将属于的单标签识别模型输出的的高层次特征用系数1,不属于的单标签识别模型输出的高层次特征用系数0,进行连接。例如假设=标签1,2,3,则将输入到标签1,2,3对应的三个单标签识别模型的高层次特征进行拼接,假如=标签2,4,则将输入到标签2和4对应的二个单标签识别模型的高层次特征进行拼接;其余单标签识别模型的高层次特征填上0再连接。
优选地,高层次特征可选择模型输出层前1-3层的特征向量。
优选地,第一多标签识别模型用卷积神经网络实现,且高层次特征维度等于各单标签识别模型的高层次特征维度之和。
S35:第k个训练周期结束后,采用循环平移方式,更新自主学习重采样函数。步骤如下:
如果k+1除以的余数不为0,则;
如果k+1除以余数为0,采用向前循环平移方式,更新自主学习重采样函数,具体为:
,若>1;
[最后一个位置],若=1;
求出在T的位置;获得在T所在位置的前一个位置的概率;
S36:回到S32,执行第k+1个训练周期。
步骤四:将个单标签识别模型进行融合,通过强化学习阶段建立第二多标签识别模型,如图4所示。
步骤如下:
S41:用单标签先验概率,作为第一个训练周期的强化学习重采样函数。用步骤三的第一多标签识别模型开始本步骤的训练。
S42:在第k个训练周期,用强化学习重采样函数重采样,得到本周期的训练样本集合;使得集合中包含标签的样本的出现频率和一致。
S43:将训练样本集合输入解码器、单标签识别模型以及第二多标签识别模型。定义第三代价函数,训练第二多标签识别模型。
其中,为第三代价函数,为数据样本的第三代价,为数据样本数量, 为第二多标签识别模型输出的的多标签概率,的单标签类别集合,为数据集中所有单标签类别集合,中单标签类别的个数,中单标签类别的个数, 为将第二多标签识别模型输出的第个单标签类别的概率转换为向量的计算函数,为交叉熵函数,为均方误差函数,分别为第五和第六权重系数; 为第二多标签识别模型的高层次特征, 分别为的单标签特征向量中第1个至第个单标签特征信号输入第1个至第个单标签类别对应的单标签识别模型输出的高层次特征,为指示函数, 为维度连接函数,为均值差异代价函数,为希尔伯特空间距离的计算函数,为和具有同样标签的样本的集合,中的子集,为同一个批次中和具有同样标签的样本出现的次数。
具体地,第三代价函数定义为单标签平均识别代价、特征差异代价以及均值差异之和;单标签平均识别代价将第二多标签模型输出的多标签作为多个单标签,分别计算和[1,0]、[0,1]正负二类的标签向量的交叉熵的平均值。特征差异代价定义为多标签时序电生理信号的高层次特征,与多标签包括的单标签识别模型的高层次特征的欧式空间距离;均值差异表示同一个批次中,相同多标签时序电生理信号的高层次特征的平均值,与该多标签包括的单标签识别模型的高层次特征平均值在希尔伯特空间的距离,且该距离按照多标签类别分别进行计算。
S44:第k个训练周期结束后,用倍增方式更新强化学习重采样函数。步骤如下:
用多标签识别模型预测验证集数据,计算单标签模型输出高层次特征与多标签模型输出的高层次特征的均值差异,其中的多标签为,且
假如和上一周期相比,如果标签提升,则采样频率加倍,
假如和上一周期相比,如果标签降低,则采样频率缩减为二分之一,
对所有的做归一化处理,使得和等于1。
S45:回到S42,执行第k+1个训练周期。
步骤五:将多标签先验概率、单标签先验概率,对单标签识别模型以及第二多标签识别模型的输出进行融合,建立五条决策规则,得到每个标签的预测概率。执行步骤如下:
S51:将待预测的时序电生理信号样本输入单标签识别模型以及多标签识别模型,得到标签的预测概率
S52:根据预设的阈值,将概率二值化,得到第j个单标签识别模型输出结果,以及第二多标签识别模型输出结果,为一个长度为的向量,其中第j个元素为第j个单标签的输出结果。
S53:建立决策规则,将单标签识别模型和多标签识别模型的结果进行融合;定义决策规则的输出结果为,为一个One_hot向量,其长度等于所有标签的数量
规则一:假如均相等,且,则
其中,等于1的单标签组成的集合(多标签),向量的第j个元素;,为数据集中存在的多标签集合。
规则二:假如均相等,且,则寻找中和最相似的多标签,令
在出现多个最相似的多标签,由单标签先验概率和最大的作为最接近的多标签
优选的,最相似指超过预定义的相似阈值;最相似的多标签的同样的标签数量超过预定义的相似阈值;
优选的,定义相似阈值为多标签模型预测的等于1的标签的数量-1,即的等于1的单标签的数量减1。
规则三:假如不相等。如,则;如,则
其中,为所有单标签识别模型预测为正类标签的单标签组成的集合(多标签)。向量的第j个元素。
规则四:假如不相等,且,则寻找中和或者最相似的多标签,令
在出现多个最相似的多标签,则选择最大的
规则五:如不能寻找到最相似的多标签,则
需要说明的是,本实施例的代价函数定义的方式,例如独立性评价方式有多种,除了专利提到的外,还有相关性、联合概率密度函数、独立成分分析等;自主学习、强化学习可以采用其他的更新重采样函数的方式;决策规则,在现有规则基础上进行增删。
且本实施例的关键改进点包括:将多标签信号解码为单标签特征信号,用包括在多标签里面的单标签特征信号的正类和负类样本分别训练单标签识别模型,解决了罕见类别远少于常见类别造成识别准确度差的问题;采用自主学习、强化学习以及单标签识别模型的特征迁移,解决了多标签识别模型在常见类别以及罕见类别的识别准确度不平衡的问题;建立决策规则,融合了模型预测结果以及单、多标签的先验概率,进一步提高了多标签预测的准确度。
本发明实施例由于将多标签时序电生理信号解码为单标签特征信号,建立正负样本训练单标签识别模型,提高了类别的平衡性,从而提高了罕见标签的识别准确度;通过自主学习和强化学习两个阶段学习,使得常见标签和罕见标签均取得良好的识别准确度;融合多标签先验概率、单标签先验概率、单标签识别模型以及多标签识别模型结果,建立决策规则,进一步提高了识别准确度。本发明对类别不平衡的多标签时序电生理信号的识别,取得了提高多标签识别准确度的进步。
参照图5,本发明实施例提出的多标签时序电生理信号的自动识别系统,包括存储器10、处理器20以及存储在存储器10上并可在处理器20上运行的计算机程序,其中,处理器20执行计算机程序时实现本实施例提出的多标签时序电生理信号的自动识别方法的步骤。
本实施例的多标签时序电生理信号的自动识别系统的具体工作过程和工作原理可参照本实施例的多标签时序电生理信号的自动识别方法的工作过程和工作原理。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多标签时序电生理信号的自动识别方法,其特征在于,所述方法包括:
采集时序电生理信号数据集,并根据时序电生理信号数据集中的多标签以及单标签出现频次,分别计算多标签先验概率和单标签先验概率;
用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型,所述单标签识别模型的数量与单标签类别数相同;
通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型;
通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型;
根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别。
2.根据权利要求1所述的多标签时序电生理信号的自动识别方法,其特征在于,用解码器对时序电生理信号数据集中的数据样本进行分解,获得数据样本的单标签特征信号,并通过单标签特征信号训练获得单标签识别模型包括:
将时序电生理信号数据集中的数据样本输入解码器,获得数据样本的单标签特征信号,其中数据样本的单标签特征信号包括与所有单标签类别对应的单标签特征信号;
根据数据样本的单标签特征信号,获取与单标签类别对应的正类样本和负类样本,作为与单标签类别对应的单标签识别模型的输入,并将二分类的预测概率作为单标签识别模型的输出,其中所述与单标签类别对应的正类样本具体为与单标签类别相同的单标签类别对应的单标签特征信号,所述与单标签类别对应的负类样本具体为与单标签类别不同的单标签类别对应的单标签特征信号;
采用第一代价函数训练解码器和单标签识别模型,直到第一代价函数最小化,获得训练好的单标签识别模型。
3.根据权利要求2所述的多标签时序电生理信号的自动识别方法,其特征在于,第一代价函数的具体公式为:
其中,为第一代价函数,为数据样本数量,为数据样本的第一代价,的单标签类别集合,分别为的单标签特征信号中与第个单标签类别对应的和不对应的单标签特征信号,分别为与第个单标签类别对应的单标签识别模型对的二分类预测概率;
 为的单标签特征信号中与第个单标签类别对应的单标签识别模型的代价函数,为交叉熵函数,为正类标签,为负类标签;的单标签特征信号中与第个单标签类别对应的单标签特征信号,且为独立性代价函数, 为相对熵函数;为不包含于的一个单标签,即 为能量代价函数,的单标签特征信号中与不包含于的单标签类别对应的单标签特征信号,为数据集中所有单标签类别集合,中单标签类别的个数,中单标签类别个数,为不包含于的任意一个单标签类别,的单标签特征信号中与第个单标签类别对应的单标签特征信号,为平均值计算函数,分别为第一、第二及第三权重系数。
4.根据权利要求3所述的多标签时序电生理信号的自动识别方法,其特征在于,通过自主学习以及单标签识别模型迁移,训练获得第一多标签识别模型包括:
根据多标签先验概率,获得自主学习重采样函数,并根据自主学习重采样函数对时序电生理信号数据集进行自主学习重采样,获得自主学习训练样本集合;
将自主学习训练样本集合同时输入解码器、单标签识别模型以及原始多标签识别模型;
保持解码器以及单标签识别模型不变,使用第二代价函数训练第一多标签识别模型;
训练预设训练周期后,采用循环平移方式,更新自主学习重采样函数,并根据更新后的自主学习重采样函数采集的自主学习训练样本集合对第一多标签识别模型进行训练,直至第二代价函数最小化,获得训练好的第一多标签识别模型。
5.根据权利要求4所述的多标签时序电生理信号的自动识别方法,其特征在于,第二代价函数的具体公式为:
其中,为第二代价函数, 为数据样本的第二代价,为数据样本数量, 为第一多标签识别模型输出的的多标签概率,的单标签类别集合,为交叉熵函数,为均方误差函数,为第四权重系数, 为第一多标签识别模型的高层次特征, 分别为的第1个至第个单标签特征信号输入第1个至第个单标签类别对应的单标签识别模型输出的高层次特征, 为指示函数, 为维度连接函数。
6.根据权利要求5所述的多标签时序电生理信号的自动识别方法,其特征在于,通过强化学习以及单标签识别模型迁移,对第一多标签识别模型进行训练,获得第二多标签识别模型包括:
根据单标签先验概率,获得强化学习重采样函数,并根据强化学习重采样函数对时序电生理信号数据集进行强化学习重采样,获得强化学习训练样本集合;
将强化学习训练样本集合同时输入解码器、单标签识别模型以及第一多标签识别模型;
保持解码器以及单标签识别模型不变,使用第三代价函数训练第一多标签识别模型;
训练预设训练周期后,采用倍增方式更新强化学习重采样函数,并根据更新后的强化学习重采样函数采集的强化学习训练样本集合对第一多标签识别模型进行训练,直至第三代价函数最小化,获得训练好的第二多标签识别模型。
7.根据权利要求6所述的多标签时序电生理信号的自动识别方法,其特征在于,第三代价函数的具体公式为:
,
其中,为第三代价函数, 为数据样本的第三代价,为数据样本数量, 为第二多标签识别模型输出的的多标签概率,的单标签类别集合,为数据集中所有单标签类别集合,中单标签类别的个数,中单标签类别的个数, 为将第二多标签识别模型输出的第个单标签类别的概率转换为向量的计算函数,为交叉熵函数,为均方误差函数,分别为第五和第六权重系数; 为第二多标签识别模型的高层次特征, 分别为的单标签特征向量中第1个至第个单标签特征信号输入第1个至第个单标签类别对应的单标签识别模型输出的高层次特征, 为指示函数, 为维度连接函数,为均值差异代价函数,为希尔伯特空间距离的计算函数,为和具有同样标签的样本的集合,中的子集,为同一个批次中和具有同样标签的样本出现的次数。
8.根据权利要求7所述的多标签时序电生理信号的自动识别方法,其特征在于,根据多标签先验概率、单标签先验概率、单标签识别模型以及第二多标签识别模型对待识别的多标签时序电生理信号进行自动识别包括:
将待识别的多标签时序电生理信号分别输入单标签识别模型以及第二多标签识别模型;
根据预设的二值化阈值,将单标签识别模型和第二多标签识别模型的输出结果进行二值化,获得二值化单标签结果和二值化多标签结果;
根据二值化单标签结果和二值化多标签结果,以及多标签先验概率和单标签先验概率,对待识别的多标签时序电生理信号进行自动识别。
9.根据权利要求8所述的多标签时序电生理信号的自动识别方法,其特征在于,根据二值化单标签结果和二值化多标签结果,以及多标签先验概率和单标签先验概率,对待识别的多标签时序电生理信号进行自动识别包括:
判断与单标签类别对应的单标签识别模型输出的二值化单标签结果是否均等于二值化多标签结果中与单标签类别对应的输出结果,若是,则判断多标签结果中等于1的单标签组成的多标签是否属于数据集存在的预设多标签集合,若是,则将二值化多标签结果作为识别结果,若否,则将预设多标签集合中与多标签结果中等于1的单标签组成的多标签的相似度大于预设相似阈值的预设多标签作为识别结果,以及在判断有多个大于预设相似阈值的预设多标签时,选择单标签先验概率和最大的预设多标签作为识别结果,若无法获得相似度大于预设相似阈值的预设多标签,则将单标签正类标签组合作为识别结果,所述单标签正类标签组合具体为所有单标签识别模型预测为正类标签的二值化单标签结果的组合;
若与单标签类别对应的单标签识别模型输出的二值化单标签结果不全部等于二值化多标签结果中与单标签类别对应的输出结果时,判断是否有包含于数据集存在的预设多标签集合的二值化多标签结果或单标签正类标签组合,若是,则选择包含于预设多标签集合的二值化多标签结果或单标签正类标签组合作为识别结果,若否,则将预设多标签集合中与多标签结果中等于1的单标签组成的多标签的相似度大于预设相似阈值或与单标签正类标签组合的相似度大于预设相似阈值的预设多标签作为识别结果,以及在判断有多个相似度大于预设相似阈值的预设多标签时,选择单标签先验概率和最大的预设多标签作为识别结果,若无法获得相似度大于预设相似阈值的预设多标签,则将单标签正类标签组合作为识别结果。
10.一种多标签时序电生理信号的自动识别系统,所述系统包括:
存储器(10)、处理器(20)以及存储在存储器(10)上并可在处理器(20)上运行的计算机程序,其特征在于,所述处理器(20)执行所述计算机程序时实现上述权利要求1至9任一所述方法的步骤。
CN202310356461.1A 2023-04-06 2023-04-06 一种多标签时序电生理信号的自动识别方法及系统 Active CN116070120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310356461.1A CN116070120B (zh) 2023-04-06 2023-04-06 一种多标签时序电生理信号的自动识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310356461.1A CN116070120B (zh) 2023-04-06 2023-04-06 一种多标签时序电生理信号的自动识别方法及系统

Publications (2)

Publication Number Publication Date
CN116070120A true CN116070120A (zh) 2023-05-05
CN116070120B CN116070120B (zh) 2023-06-27

Family

ID=86178861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310356461.1A Active CN116070120B (zh) 2023-04-06 2023-04-06 一种多标签时序电生理信号的自动识别方法及系统

Country Status (1)

Country Link
CN (1) CN116070120B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125461A1 (en) * 2007-11-09 2009-05-14 Microsoft Corporation Multi-Label Active Learning
WO2019100724A1 (zh) * 2017-11-24 2019-05-31 华为技术有限公司 训练多标签分类模型的方法和装置
US20190370394A1 (en) * 2018-05-31 2019-12-05 Fmr Llc Automated computer text classification and routing using artificial intelligence transfer learning
CN111275107A (zh) * 2020-01-20 2020-06-12 西安奥卡云数据科技有限公司 一种基于迁移学习的多标签场景图像分类方法及装置
CN111700608A (zh) * 2020-07-24 2020-09-25 武汉中旗生物医疗电子有限公司 一种心电信号多分类方法及装置
CN111783831A (zh) * 2020-05-29 2020-10-16 河海大学 基于多源多标签共享子空间学习的复杂图像精确分类方法
US20210042580A1 (en) * 2018-10-10 2021-02-11 Tencent Technology (Shenzhen) Company Limited Model training method and apparatus for image recognition, network device, and storage medium
WO2021143402A1 (zh) * 2020-01-17 2021-07-22 上海优加利健康管理有限公司 一种用于多标签标注心电信号的心搏分类方法和装置
US20220054071A1 (en) * 2019-09-06 2022-02-24 Tencent Technology (Shenzhen) Company Limited Motor imagery electroencephalogram signal processing method, device, and storage medium
CN114118138A (zh) * 2021-10-22 2022-03-01 苏州大学 一种基于多标签领域自适应模型的轴承复合故障诊断方法
CN114358125A (zh) * 2021-12-03 2022-04-15 华南理工大学 一种基于多源信息深度融合的旋转机械故障自动识别方法
CN115481667A (zh) * 2022-10-12 2022-12-16 上海交通大学 一种基于多尺度uda和特征学习的uwb引信目标识别方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125461A1 (en) * 2007-11-09 2009-05-14 Microsoft Corporation Multi-Label Active Learning
WO2019100724A1 (zh) * 2017-11-24 2019-05-31 华为技术有限公司 训练多标签分类模型的方法和装置
US20190370394A1 (en) * 2018-05-31 2019-12-05 Fmr Llc Automated computer text classification and routing using artificial intelligence transfer learning
US20210042580A1 (en) * 2018-10-10 2021-02-11 Tencent Technology (Shenzhen) Company Limited Model training method and apparatus for image recognition, network device, and storage medium
US20220054071A1 (en) * 2019-09-06 2022-02-24 Tencent Technology (Shenzhen) Company Limited Motor imagery electroencephalogram signal processing method, device, and storage medium
WO2021143402A1 (zh) * 2020-01-17 2021-07-22 上海优加利健康管理有限公司 一种用于多标签标注心电信号的心搏分类方法和装置
CN111275107A (zh) * 2020-01-20 2020-06-12 西安奥卡云数据科技有限公司 一种基于迁移学习的多标签场景图像分类方法及装置
CN111783831A (zh) * 2020-05-29 2020-10-16 河海大学 基于多源多标签共享子空间学习的复杂图像精确分类方法
CN111700608A (zh) * 2020-07-24 2020-09-25 武汉中旗生物医疗电子有限公司 一种心电信号多分类方法及装置
CN114118138A (zh) * 2021-10-22 2022-03-01 苏州大学 一种基于多标签领域自适应模型的轴承复合故障诊断方法
CN114358125A (zh) * 2021-12-03 2022-04-15 华南理工大学 一种基于多源信息深度融合的旋转机械故障自动识别方法
CN115481667A (zh) * 2022-10-12 2022-12-16 上海交通大学 一种基于多尺度uda和特征学习的uwb引信目标识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SACHIN GOEL ET AL.: "Automated Detection of Epileptic EEG Signals using Recurrence Plots based Feature Extraction with Transfer Learning", 《RESEARCH SQUARE》, pages 1 - 23 *
ZISHENG WANG ET AL.: "Transfer reinforcement learning method with multi-label learning for compound fault recognition", 《ADVANCED ENGINEERING INFORMATICS》, vol. 55, pages 1 - 13 *
杨小童 等: "融合多标签特征在心电异常事件分类上的应用", 《计算机仿真》, vol. 39, pages 508 - 513 *
苏丹宁 等: "小样本雷达辐射源识别的深度学习方法综述", 《计算机科学》, vol. 49, pages 226 - 235 *

Also Published As

Publication number Publication date
CN116070120B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN110597735B (zh) 一种面向开源软件缺陷特征深度学习的软件缺陷预测方法
CN112767997A (zh) 一种基于多尺度卷积注意力神经网络的蛋白质二级结构预测方法
CN112712118A (zh) 一种面向医疗文本数据的过滤方法及系统
CN112199532B (zh) 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置
CN113314205A (zh) 一种高效的医学影像标注与学习系统
CN111582506A (zh) 基于全局和局部标记关系的偏多标记学习方法
CN112116950A (zh) 基于深度度量学习的蛋白质折叠识别方法
CN111008570B (zh) 一种基于压缩-激励伪三维网络的视频理解方法
CN114897085A (zh) 一种基于封闭子图链路预测的聚类方法及计算机设备
CN114511759A (zh) 一种皮肤状态图像的类别识别和特征确定方法及系统
CN113781385B (zh) 用于大脑医学影像自动分类的联合注意力图卷积方法
CN116070120B (zh) 一种多标签时序电生理信号的自动识别方法及系统
CN117036760A (zh) 一种基于图对比学习的多视图聚类模型实现方法
CN114764575B (zh) 基于深度学习和时序注意力机制的多模态数据分类方法
CN116188428A (zh) 一种桥接多源域自适应的跨域组织病理学图像识别方法
CN115206539A (zh) 一种基于围术期患者风险事件数据的多标签集成分类方法
CN114528333A (zh) 基于属性探索的试题隐含知识属性关联挖掘及相关试题推送方法及系统
CN114171206A (zh) 模型训练、传感病预测方法、装置、设备及存储介质
CN113535928A (zh) 基于注意力机制下长短期记忆网络的服务发现方法及系统
CN108304546B (zh) 一种基于内容相似度和Softmax分类器的医学图像检索方法
CN114724630B (zh) 用于预测蛋白质翻译后修饰位点的深度学习方法
CN113096828B (zh) 基于癌症基因组大数据核心算法的诊断、预测以及大健康管理平台
CN109934139B (zh) 一种基于群智能算法的肌肉电信号通道组合优化方法
CN116975695B (zh) 一种基于多智能体强化学习的肢体运动识别系统
CN116665906B (zh) 基于相似性孪生网络的静息态功能磁共振脑龄预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant