CN117076994A - 一种多通道生理时间序列分类方法 - Google Patents
一种多通道生理时间序列分类方法 Download PDFInfo
- Publication number
- CN117076994A CN117076994A CN202311347686.7A CN202311347686A CN117076994A CN 117076994 A CN117076994 A CN 117076994A CN 202311347686 A CN202311347686 A CN 202311347686A CN 117076994 A CN117076994 A CN 117076994A
- Authority
- CN
- China
- Prior art keywords
- channel
- data
- node
- graph
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000012549 training Methods 0.000 claims abstract description 29
- 230000000007 visual effect Effects 0.000 claims abstract description 23
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000010586 diagram Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 238000012800 visualization Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000001360 synchronised effect Effects 0.000 description 7
- 238000010276 construction Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 101710134389 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 2 Proteins 0.000 description 2
- 102100021588 Sterol carrier protein 2 Human genes 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000036244 familial 15 atrial fibrillation Diseases 0.000 description 1
- 230000005057 finger movement Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Surgery (AREA)
- Heart & Thoracic Surgery (AREA)
- Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- Fuzzy Systems (AREA)
- Physiology (AREA)
- Psychiatry (AREA)
- Image Analysis (AREA)
Abstract
一种多通道生理时间序列分类方法,包括如下步骤:S1:将各通道传感器采集到的生理数据按时间顺序分别排列,形成多通道时间序列数据;S2:对各通道时间序列数据分别进行时序特征增强有限穿越可视图即TPVG图建模;S3:利用图同构网络对建模后的TPVG图进行训练,学习所述多通道时间序列数据中的复杂关系与模式,得到若干图神经网络弱分类器,作为用于分类的图同构网络模型;S4:使用训练好的图同构网络模型对目标待分类数据进行分类。相比于之前的方法,本方法具有在生理信号数据集中更优的性能以及更稳定的表现。本方法可提高分类准确性,增强结果的稳定性,并提供更好的可解释性和可视化效果。
Description
技术领域
本发明涉及数据挖掘和机器学习技术,特别是涉及一种多通道生理时间序列分类方法。
背景技术
随着经济的发展和人民生活水平的提高,居民的健康意识大大增强,健康评估在慢性病的预防和早期筛查中具有越来越重要的作用。生理信号捕捉的相关设备在临床诊断中发挥着重要作用。当前无论是医疗设备还是居民日常佩戴的可穿戴设备中,均可以采集到大量的不同传感器上的生理数据,因此从多通道生理数据中进行疾病的早期筛查和诊断具有重要意义。然而,传统的疾病筛查和早期诊断方法主要依赖于医生根据其专业知识从医疗设备的记录中做出判断,不仅效率低下,而且极易受到主观因素的影响。近年来,随着传感器技术的进步,医疗设备可以同时捕捉患者的多通道信号,如心电图(ECG)、肌电图(EMG)、眼电图(EOG)、脑电图(EEG)等,为更好地诊断提供了更多的信息和数据,这使得多变量时间序列分类(MTSC)算法成为辅助医生决策的另一种方式。因此,在当今"人工智能+医疗"时代,找到一种适合健康评估的MTSC方法具有重要的社会价值。
可以归纳典型的多变量时间序列分类(MTSC)问题。然而,在构建相应模型时,需充分考虑到生理数据高噪声和非平稳性的特点以及应用场景中对保护隐私以及结果性能稳定的需要。
MTSC是利用多个通道的时间序列信息进行决策,算法的本质是寻求有效的特征选择方法,以更好地利用数据信息。现有方法中的主流操作是选择单变量时间序列分类的若干分类器作为弱分类器进行集成,再通过投票策略得到最终标签。其中弱分类器的选择包括基于距离的方法、基于特征的方法、基于形状的方法以及深度学习的方法等,然后通过少数服从多数的投票策略得到最终的标签。然而,上述算法作为通用的时序分类算法虽然可以用在生理时序数据中,但部分方法对于具有高噪声和非平稳性的生理数据效果有限。同时,在集成过程中,投票策略基本都是遵循少数服从多数的原则,对于分类性能差距较大的弱分类器间均赋予相同的权重,对模型分类的准确性与稳定性均有负面影响。
由于生理信号应用场景的特殊性,对于多通道原始时间序列的隐私保护也是在模型设计中的一个考量。当前已经有部分学者提出了基于转换的方法来提取时间序列的特征,其中可视图算法作为一种时间序列的复杂网络表示方法,是一种简单、快捷的方法,对数据的隐私保护与非平稳数据表现良好,已在医学、金融等领域有所应用。然而当前的研究运用可视图方法的目的更多的是希望从复杂网络视角来提取额外特征,如节点度、中心性等,再结合传统机器学习方法完成下游多变量分类任务,很少直接将图作为输入并采用图神经网络的方法来自主学习图信息,完成分类任务;同时,当前建图方法较为单一,没有考虑不同的任务需求和数据特点建立包含更多有效信息的网络构建方法。由于医疗及可穿戴设备中采集的生理时间序列通常属于长时间序列,但大部分的诊断过程主要是通过局部信号的异常表现得出的,因此局部特征的捕捉能力对于生理数据来说尤为重要,而现有的可视图算法及其变体更擅长捕捉全局特征,在局部特征提取方面也具有一定的局限性。对多通道生理时间序列数据进行准确分类是一个具有挑战性的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的主要目的在于克服上述背景技术的缺陷,提供一种多通道生理时间序列分类方法。
为实现上述目的,本发明采用以下技术方案:
一种多通道生理时间序列分类方法,包括如下步骤:
S1:将各通道传感器采集到的生理数据按时间顺序分别排列,形成多通道时间序列数据;
S2:对各通道时间序列数据分别进行时序特征增强有限穿越可视图即TPVG图建模;
S3:利用图同构网络对建模后的TPVG图进行训练,学习所述多通道时间序列数据中的复杂关系与模式,得到若干图神经网络弱分类器,作为用于分类的图同构网络模型;
S4:使用训练好的图同构网络模型对目标待分类数据进行分类。
进一步地,步骤S1包括进行数据预处理,其中,通过补充缺失值,将各通道时间序列数据整理成在同一时间范围内的等长数据。
进一步地,步骤S2具体包括如下步骤:
S2.1:按时间顺序记录节点的顺序信息,并采用独热编码方式作为节点特征;
S2.2:划分时间窗长度,确定有限穿越视距/>的参数;
S2.3:确定网络中两两数据点的相对位置信息,建立加权邻接矩阵;
S2.4:以加权邻接矩阵取值作为TPVG的邻接矩阵,建立TPVG图。
步骤S2.1中,时间序列中每个数据点作为可视图的一个节点,将各节点按时间顺序通过独热编码记录各节点的顺序信息,并作为节点特征;
步骤S2.2中,根据数据长度定义时间窗与有限穿越视距/>,如果网络中两节点相连,当且仅当两节点在时间窗范围内且与节点对应的两个直方条之间的连线被位于其间的其他直方条截断次数/>时,判断两节点有限穿越可视,其数据点之间满足可视性准则的连线定义为网络连边,可视性准则为:对于任意两个数据点/>之间可视,当且仅当该两个数据点/>之间的点/>满足
;
则认为该两个数据点之间存在连边,其中/>分别表示在时间/>下的时间序列取值;
步骤S2.3中,对于存在网络连边的所有数据点,通过公式确定两两数据点的相对位置信息,并形成加权邻接矩阵取值作为TPVG的邻接矩阵/>;
步骤S2.4中,构造一个邻接矩阵,节点特征为时间顺序的独热编码的图表示。
进一步地,步骤S3中,通过监督学习,利用已知训练集中的数据进行训练,并调整模型参数,通过提前终止条件的判断防止模型过拟合,并获取模型最后一次训练中样本在各个通道的准确性;通过选取不同的随机种子,训练多个图同构网络模型用于测试集的分类。
进一步地,步骤S3具体包括如下步骤:
S3.1:输入TPVG图的邻接矩阵、节点特征以及数据集的标签,在每层图同构网络中,将每个节点的特征与其邻居节点的特征进行聚合,得到新的节点,并将更新后的节点输入多层感知机中,节点特征更新后进入下一层图同构网络进行节点聚合操作,并继续更新;
S3.2:得到最终更新后的节点特征后,使用求和函数作为READOUT函数聚合节点特征,从而得到图表示;
S3.3:将所述图表示作为输入,使用全连接层进行分类,并得到样本在相应通道的分类结果。
进一步地,步骤S3.1中,将更新后的节点输入多层感知机中,过程为:
;
其中代表节点/>在第/>次迭代的表示,/>表示节点/>的邻居节点/>在第层的表示,/>为可学习参数,MLP为多层感知机,/>为MLP的学习率,/>代表节点/>的所有邻居节点的集合。
进一步地,步骤S4中,确定测试集最终类别标签,其中,将初始随机种子数取值不同的训练好的个图神经网络弱分类器模型分别作用于测试集中,得到测试样本在各通道上的/>个弱分类器模型中的分类标签/>,通过提出的考虑训练集准确性的通道投票策略得到样本最终的分类标签。
进一步地,所述通道投票策略准则包括:
(1)对测试样本的各个弱分类器的分类结果进行计数,若存在某个类别大于其他类别的情况,则该类别为测试样本的最终分类结果;
(2)若通过多数投票,存在2个类别具有相同的票数,则通过计算权重得分,取相同票数中的得分更高的类别作为该测试样本的最终分类结果;其中第/>个测试样本的权重得分/>定义为:
;
其中,通过将具有相同票数的各取值为的所有弱分类器/>对应的训练准确率分别进行求和,取最大值所对应的标签作为最终分类结果。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序由处理器执行时,实现所述的多通道生理时间序列分类方法。
本发明具有如下有益效果:
本发明提出一种基于时序特征增强有限穿越可视图的多通道生理时间序列分类方法,通过将各通道的生理时间序列数据转化为时序特征增强有限穿越可视图(TPVG)建模,从而保护原始数据,再通过图神经网络方法对各通道图数据进行训练并根据所提出的通道投票策略得到最终的分类结果。相比于之前的方法,本方法具有在生理信号数据集中更优的性能以及更稳定的表现。进一步地,提出的图建模方法也可以更好捕捉时序特征,尤其是生理时间序列特征,使得模型具有有效性和可靠性。
本发明提供了一种从复杂网络视角上对多通道生理时间序列的分类方法,通过构建时序特征增强有限穿越可视图来减小生理时序的高噪声、非平稳性影响的同时,更好捕捉各通道数据的时序与局部特征,并结合图神经网络进行模型训练。进一步地,最终标签的决策采用了一种新的考虑训练准确率的通道投票策略。本发明具有比现有技术更好的分类准确性和稳定性。
本发明实施例中的其他有益效果将在下文中进一步述及。
附图说明
图1为本发明实施例的多通道生理时间序列分类方法的流程图
图2 为本发明实施例的多通道生理时间序列分类方法的原理示意图。
图3为本发明实施例基于时序增强有限穿越可视图建模的示意图。
具体实施方式
以下对本发明的实施方式做详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
参阅图1,本发明实施例提供一种多通道生理时间序列分类方法,包括如下步骤:
S1:将各通道传感器采集到的生理数据按时间顺序分别排列,形成多通道时间序列数据;
S2:对各通道时间序列数据分别进行时序特征增强有限穿越可视图即TPVG图建模;
S3:利用图同构网络对建模后的TPVG图进行训练,学习所述多通道时间序列数据中的复杂关系与模式,得到若干图神经网络弱分类器,作为用于分类的图同构网络模型;
S4:使用训练好的图同构网络模型对目标待分类数据进行分类。
本发明提供一种能够有效分类多通道生理时间序列数据的新方法,可提高分类准确性,增强结果的稳定性,并提供更好的可解释性和可视化效果。
在优选的实施例中,本发明的解决方案着眼于以下两个核心点:
(1)寻求有效的时间序列的可视图表示,从而捕捉有助于决策的指标。提出了一种新的可视图表示方法,使其更适用于生理时间序列数据中捕捉有效信息:考虑到生理数据的时序信息的重要性,将原始时间序列的顺序信息作为节点特征来构建顺序矩阵T,从而在网络构建中进行时序增强;考虑到生理时序数据局部特征的重要性,增加了时间窗来控制可视图的建图区域、同时通过构建权重矩阵w刻画距离对于不同时间点的影响。
(2)分类模型的选择与多通道时序标签的决策策略。由于输入为图,考虑采用图神经网络方法作为分类模型的选择,同时由于图同构网络(GIN)已从理论上证明是具有最强表现力的图神经网络算法,因此将其作为弱分类器进行训练。在弱分类器得到分类标签后,提出了一种新的决策策略,将训练集的准确率作为指标纳入多通道最终分类标签的决策过程。
以下进一步描述本发明具体实施例。
本发明提供一种基于时序特征增强有限穿越可视图的多通道生理时间序列分类方法,流程如图1所示,包括如下步骤S1至S4:
步骤S1:利用医疗器械或可穿戴设备的各通道传感器采集到的生理数据进行数据准备与预处理。其中数据准备是指将各通道传感器上的数据按时间顺序分别排列,形成多通道时间序列数据,其中/>表示第/>个样本的第/>个通道的时间序列数据;数据预处理主要包括通过补充缺失值,将各通道时间序列数据整理成在同一时间范围内的等长数据。
步骤S2:将预处理后的各通道时间序列数据分别进行TPVG图建模。建图过程为:
步骤S2.1:节点顺序信息的刻画与顺序矩阵的构造。时间序列中每个数据点作为可视图的一个节点,因此节点数量与时间序列的长度有关;并将各节点按时间顺序通过独热编码记录各节点的顺序信息,并作为节点特征。
步骤S2.2:时间窗长度的划分与有限穿越视距/>的参数确定。根据数据长度人为定义时间窗/>与有限穿越视距/>,规定若网络中两节点相连,当且仅当两节点在时间窗范围内且与节点对应的两个直方条之间的连线被位于其间的其他直方条截断次数/>时,认为两节点有限穿越可视,其数据点之间满足可视性准则的连线定义为网络连边,可视性准则为:对于任意两个数据点/>之间可视,当且仅当该两个数据点之间的点/>满足
;
则认为该两个数据点之间存在连边,其中/>分别表示在时间/>下的时间序列取值;
步骤S2.3:相对位置信息的刻画与加权邻接矩阵的建立。对于存在网络连边的所有数据点,通过公式刻画两两数据点的相对位置信息,并形成加权邻接矩阵取值作为TPVG的邻接矩阵/>。
步骤S2.4:TPVG图的建立。基于上述步骤,构造一个邻接矩阵为,节点特征为时间顺序的独热编码的图表示。
步骤S3:利用图同构网络对建模后的图进行训练,从而学习传感器数据中的复杂关系与模式。通过监督学习,利用已知训练集中数据进行训练,并调整模型参数,通过提前终止条件的判断防止模型过拟合,并获取模型最后一次训练中样本在各个通道的准确性。通过选取不同的随机种子,共训练个图同构网络模型用于测试集的分类。图同构网络分类的具体步骤为:
步骤S3.1:更新。输入为TPVG图的邻接矩阵、节点特征以及数据集的标签,在每层图同构网络中,将每个节点的特征与其邻居节点的特征进行聚合,得到新的节点,并将更新后的节点输入多层感知机中,过程为:
;
其中代表节点/>在第/>次迭代的表示,/>表示节点/>的邻居节点/>在第层的表示,/>为可学习参数,MLP为多层感知机,/>为MLP的学习率,/>代表节点/>的所有邻居节点的集合。节点特征更新后进入下一层图同构网络进行节点聚合操作,并继续更新。
步骤S3.2:聚合--得到最终更新后的节点特征后,使用求和函数作为READOUT函数聚合节点特征,从而得到图表示。
;
步骤S3.3:分类结果--将上一步骤中的图表示作为输入,将全连接层作为分类器进行分类,并得到样本在该通道的分类结果。
步骤S4:测试集最终类别标签的确定。将初始随机种子数取值不同的训练好的个图神经网络弱分类器模型分别作用于测试集中,得到测试样本在各通道上的/>个弱分类器模型中的分类标签/>,通过提出的考虑训练集准确性的通道投票策略得到样本最终的分类标签。其中通道投票策略准则为:
(1)多数投票。对测试样本的10个弱分类器的分类结果进行计数,若存在某个类别大于其他类别的情况,则该类别为测试样本的最终分类结果。
(2)权重得分。若通过多数投票,存在2个类别具有相同的票数,则通过计算权重得分,取相同票数中的得分更高的类别作为该测试样本的最终分类结果。其中第/>个测试样本的权重得分/>定义为:
;
即通过将具有相同票数的各取值为的所有弱分类器/>对应的训练准确率分别进行求和,取最大值所对应的标签作为最终分类结果。
实例测试:
为了使本发明的目的、技术方案和优点更加清楚,下面将以5个生理信号的公开数据集为例,对本发明所述过程作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。
本实施例采用加州大学河滨分校的UEA数据集中的披露的5个多通道生理信号数据作为实验数据,该数据集是时间序列分类的经典数据集,并已划分好训练集、测试集以及每个样本的分类标签。选择的这5个数据集各通道等长,因此无需进行数据预处理过程;然而每个数据集的类别数、训练集与测试集划分比例以及序列长度不一,以此来测试所提方法的准确性与稳定性等综合性能,各数据集的具体信息见表1所示。
表1. UEA多变量生理时间序列数据集基本信息
简称 | 数据集名称 | 训练集 | 测试集 | 通道数 | 序列长度 | 类别数 |
AF | AtrialFibrillation | 15 | 15 | 2 | 640 | 3 |
SWJ | StandWalkJump | 12 | 15 | 4 | 2500 | 3 |
FM | FingerMovements | 316 | 100 | 28 | 50 | 2 |
HMD | HandMovementDirection | 160 | 74 | 10 | 400 | 4 |
SCP2 | SelfRegulationSCP2 | 200 | 180 | 7 | 1152 | 2 |
对于给定的数据集,设定将各数据集序列长度的1/3的向上取整值作为值,步长为1,有限穿越视距/>,弱分类器个数/>,根据算法设计的步骤构建TPVG图,并得到相应的图表示,然后通过图同构网络结合通道投票策略确定最终的分类结果。
为了证明本发明所提方法的稳定性,基于该数据集分别进行了10次独立重复实验,并将10次实验的准确率均值作为模型的最终的分类准确率。同时也计算了10次结果的准确率方差,对模型的稳定性进行分析。与此同时,本发明也进行了与HIVE-COTE、CIF、ROCKET、ResNet、InceptionTime等当前通用时间序列效果较好的方法进行对比实验,分类结果如表2所示。根据该表,可以发现本发明的方法在大多数的数据集上具有更好的表现,同时方差也几乎最小,显示了方法对于多通道生理时间序列的有效性与稳定性。
表2. 模型10次独立重复试验分类结果
AF | SWJ | HM | FM | SCP2 | |
HIVE-COTE | 26.00%(0.34%) | 40.00% (0.40%) | 40.54% (0.28%) | 53.77% (0.04%) | 53.33% (0.06%) |
CIF | 42.67% (0.41%) | 40.00% (0.30%) | 50.27% (0.10%) | 52.40% (0.04%) | 50.89% (0.06%) |
ROCKET | 26.67% (0.03%) | 46.67% (0.00%) | 49.59% (0.08%) | 54.60% (0.05%) | 54.94% (0.03%) |
ResNet | 35.33% (0.54%) | 38.67% (2.12%) | 42.29% (0.09%) | 51.60% (0.06%) | 47.33% (0.03%) |
InceptionTime | 40.00% (1.97%) | 30.00% (1.27%) | 40.41% (0.06%) | 55.90%(0.10%) | 48.83% (0.05%) |
本发明的模型 | 46.67% (0.12%) | 46.67% (0.17%) | 51.35% (0.05%) | 54.00% (0.02%) | 58.33% (0.03%) |
综上所述,本发明提出一种基于时序特征增强有限穿越可视图的多通道生理时间序列分类方法,通过将各通道的生理时间序列数据转化为时序特征增强有限穿越可视图(TPVG)建模,从而保护原始数据,再通过图神经网络方法对各通道图数据进行训练并根据所提出的通道投票策略得到最终的分类结果。相比于之前的方法,本方法具有在生理信号数据集中更优的性能以及更稳定的表现。优选实施例中提出的图建模方法也可以更好捕捉时序特征,尤其是生理时间序列特征,使得模型具有有效性和可靠性。优选实施例中,最终标签的决策采用了一种新的考虑训练准确率的通道投票策略。本发明具有比现有技术更好的分类准确性和稳定性。
本发明实施例还提供一种存储介质,用于存储计算机程序,该计算机程序被执行时至少执行如上所述的方法。
本发明实施例还提供一种控制装置,包括处理器和用于存储计算机程序的存储介质;其中,处理器用于执行所述计算机程序时至少执行如上所述的方法。
本发明实施例还提供一种处理器,所述处理器执行计算机程序,至少执行如上所述的方法。
所述存储介质可以由任何类型的易失性或非易失性存储设备、或者它们的组合来实现。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,ErasableProgrammable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,ElectricallyErasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,FerromagneticRandom Access Memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,SynchronousStatic Random Access Memory)、动态随机存取存储器(DRAM,DynamicRandom AccessMemory)、同步动态随机存取存储器(SDRAM,Synchronous Dynamic RandomAccessMemory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double DataRateSynchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本发明所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本发明所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本发明所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上内容是结合具体的优选实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
Claims (10)
1.一种多通道生理时间序列分类方法,其特征在于,包括如下步骤:
S1:将各通道传感器采集到的生理数据按时间顺序分别排列,形成多通道时间序列数据;
S2:对各通道时间序列数据分别进行时序特征增强有限穿越可视图即TPVG图建模;
S3:利用图同构网络对建模后的TPVG图进行训练,学习所述多通道时间序列数据中的复杂关系与模式,得到若干图神经网络弱分类器,作为用于分类的图同构网络模型;
S4:使用训练好的图同构网络模型对目标待分类数据进行分类。
2.如权利要求1所述的多通道生理时间序列分类方法,其特征在于,步骤S1包括进行数据预处理,其中,通过补充缺失值,将各通道时间序列数据整理成在同一时间范围内的等长数据。
3.如权利要求1或2所述的多通道生理时间序列分类方法,其特征在于,步骤S2具体包括如下步骤:
S2.1:按时间顺序记录节点的顺序信息,并采用独热编码方式作为节点特征;
S2.2:划分时间窗长度,确定有限穿越视距/>的参数;
S2.3:确定网络中两两数据点的相对位置信息,建立加权邻接矩阵;
S2.4:以加权邻接矩阵取值作为TPVG的邻接矩阵,建立TPVG图。
4.如权利要求1所述的多通道生理时间序列分类方法,其特征在于,
步骤S2.1中,时间序列中每个数据点作为可视图的一个节点,将各节点按时间顺序通过独热编码记录各节点的顺序信息,并作为节点特征;
步骤S2.2中,根据数据长度定义时间窗与有限穿越视距/>,如果网络中两节点相连,当且仅当两节点在时间窗范围内且与节点对应的两个直方条之间的连线被位于其间的其他直方条截断次数/>时,判断两节点有限穿越可视,其数据点之间满足可视性准则的连线定义为网络连边,可视性准则为:对于任意两个数据点/>之间可视,当且仅当该两个数据点/>之间的点/>满足
;
则认为该两个数据点之间存在连边,其中/>分别表示在时间/>下的时间序列取值;
步骤S2.3中,对于存在网络连边的所有数据点,通过公式确定两两数据点的相对位置信息,并形成加权邻接矩阵取值作为TPVG的邻接矩阵/>;
步骤S2.4中,构造一个邻接矩阵,节点特征为时间顺序的独热编码的图表示。
5.如权利要求1至2任一项所述的多通道生理时间序列分类方法,其特征在于,步骤S3中,通过监督学习,利用已知训练集中的数据进行训练,并调整模型参数,通过提前终止条件的判断防止模型过拟合,并获取模型最后一次训练中样本在各个通道的准确性;通过选取不同的随机种子,训练多个图同构网络模型用于测试集的分类。
6.如权利要求5所述的多通道生理时间序列分类方法,其特征在于,步骤S3具体包括如下步骤:
S3.1:输入TPVG图的邻接矩阵、节点特征以及数据集的标签,在每层图同构网络中,将每个节点的特征与其邻居节点的特征进行聚合,得到新的节点,并将更新后的节点输入多层感知机中,节点特征更新后进入下一层图同构网络进行节点聚合操作,并继续更新;
S3.2:得到最终更新后的节点特征后,使用求和函数作为READOUT函数聚合节点特征,从而得到图表示;
S3.3:将所述图表示作为输入,使用全连接层进行分类,并得到样本在相应通道的分类结果。
7.如权利要求6所述的多通道生理时间序列分类方法,其特征在于,步骤S3.1中,将更新后的节点输入多层感知机中,过程为:
;
其中代表节点/>在第/>次迭代的表示,/>表示节点/>的邻居节点/>在第层的表示,/>为可学习参数,MLP为多层感知机,/>为MLP的学习率,/>代表节点/>的所有邻居节点的集合。
8.如权利要求1至2任一项所述的多通道生理时间序列分类方法,其特征在于,步骤S4中,确定测试集最终类别标签,其中,将初始随机种子数取值不同的训练好的个图神经网络弱分类器模型分别作用于测试集中,得到测试样本在各通道上的/>个弱分类器模型中的分类标签/>,通过提出的考虑训练集准确性的通道投票策略得到样本最终的分类标签。
9.如权利要求8所述的多通道生理时间序列分类方法,其特征在于,所述通道投票策略准则包括:
(1)对测试样本的各个弱分类器的分类结果进行计数,若存在某个类别大于其他类别的情况,则该类别为测试样本的最终分类结果;
(2)若通过多数投票,存在2个类别具有相同的票数,则通过计算权重得分,取相同票数中的得分更高的类别作为该测试样本的最终分类结果;其中第/>个测试样本的权重得分定义为:
;
其中,通过将具有相同票数的各取值为的所有弱分类器/>对应的训练准确率分别进行求和,取最大值所对应的标签作为最终分类结果。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现如权利要求1至9任一项所述的多通道生理时间序列分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311347686.7A CN117076994B (zh) | 2023-10-18 | 2023-10-18 | 一种多通道生理时间序列分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311347686.7A CN117076994B (zh) | 2023-10-18 | 2023-10-18 | 一种多通道生理时间序列分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117076994A true CN117076994A (zh) | 2023-11-17 |
CN117076994B CN117076994B (zh) | 2024-01-26 |
Family
ID=88713888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311347686.7A Active CN117076994B (zh) | 2023-10-18 | 2023-10-18 | 一种多通道生理时间序列分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117076994B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019100724A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN112085124A (zh) * | 2020-09-27 | 2020-12-15 | 西安交通大学 | 一种基于图注意力网络的复杂网络节点分类方法 |
CN112380959A (zh) * | 2020-11-11 | 2021-02-19 | 浙江工业大学 | 一种基于图神经网络的单变量时间序列分类方法 |
CN112541511A (zh) * | 2019-09-20 | 2021-03-23 | 宫文峰 | 基于卷积神经网络的多通道时间序列数据故障诊断方法 |
CN114897090A (zh) * | 2022-05-26 | 2022-08-12 | 浙江工业大学 | 一种基于图神经网络的长时间序列分类方法 |
CN115053277A (zh) * | 2020-07-08 | 2022-09-13 | 深圳元戎启行科技有限公司 | 对周围移动物体进行变道分类的方法、系统、计算机设备及存储介质 |
CN115481682A (zh) * | 2022-09-11 | 2022-12-16 | 北京工业大学 | 一种基于监督对比学习与结构推断的图分类训练方法 |
CN115496953A (zh) * | 2022-10-31 | 2022-12-20 | 河北工业大学 | 基于时空图卷积的脑网络分类方法 |
CN115906954A (zh) * | 2022-12-09 | 2023-04-04 | 北京数洋智慧科技有限公司 | 一种基于图神经网络的多变量时间序列预测方法及装置 |
-
2023
- 2023-10-18 CN CN202311347686.7A patent/CN117076994B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019100724A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN112541511A (zh) * | 2019-09-20 | 2021-03-23 | 宫文峰 | 基于卷积神经网络的多通道时间序列数据故障诊断方法 |
CN115053277A (zh) * | 2020-07-08 | 2022-09-13 | 深圳元戎启行科技有限公司 | 对周围移动物体进行变道分类的方法、系统、计算机设备及存储介质 |
CN112085124A (zh) * | 2020-09-27 | 2020-12-15 | 西安交通大学 | 一种基于图注意力网络的复杂网络节点分类方法 |
CN112380959A (zh) * | 2020-11-11 | 2021-02-19 | 浙江工业大学 | 一种基于图神经网络的单变量时间序列分类方法 |
CN114897090A (zh) * | 2022-05-26 | 2022-08-12 | 浙江工业大学 | 一种基于图神经网络的长时间序列分类方法 |
CN115481682A (zh) * | 2022-09-11 | 2022-12-16 | 北京工业大学 | 一种基于监督对比学习与结构推断的图分类训练方法 |
CN115496953A (zh) * | 2022-10-31 | 2022-12-20 | 河北工业大学 | 基于时空图卷积的脑网络分类方法 |
CN115906954A (zh) * | 2022-12-09 | 2023-04-04 | 北京数洋智慧科技有限公司 | 一种基于图神经网络的多变量时间序列预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117076994B (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sors et al. | A convolutional neural network for sleep stage scoring from raw single-channel EEG | |
Birjandtalab et al. | Automated seizure detection using limited-channel EEG and non-linear dimension reduction | |
Wang | An intelligent computer-aided approach for atrial fibrillation and atrial flutter signals classification using modified bidirectional LSTM network | |
Papastergiou et al. | Tensor Decomposition for Multiple‐Instance Classification of High‐Order Medical Data | |
AU2019101151A4 (en) | Classify Mental States from EEG Signal Using Xgboost Algorithm | |
Ge et al. | Multi-label correlation guided feature fusion network for abnormal ECG diagnosis | |
Rasekhi et al. | Epileptic seizure prediction based on ratio and differential linear univariate features | |
Saini et al. | An extensive review on development of EEG-based computer-aided diagnosis systems for epilepsy detection | |
CN109817339A (zh) | 基于大数据的患者分组方法和装置 | |
Imani et al. | Nested gaussian process modeling for high-dimensional data imputation in healthcare systems | |
Khan et al. | Automated glaucoma detection from fundus images using wavelet-based denoising and machine learning | |
Jeong et al. | Convolutional neural network for classification of eight types of arrhythmia using 2D time–frequency feature map from standard 12-lead electrocardiogram | |
Highland et al. | A review of detection techniques for depression and bipolar disorder | |
Alturki et al. | Predictors of readmissions and length of stay for diabetes related patients | |
Golrizkhatami et al. | Multi-scale features for heartbeat classification using directed acyclic graph CNN | |
CN114191665A (zh) | 机械通气过程中人机异步现象的分类方法和分类装置 | |
Kutluana et al. | Classification of cardiac disorders using weighted visibility graph features from ECG signals | |
Liu et al. | Scalp EEG-based automatic detection of epileptiform events via graph convolutional network and bi-directional LSTM co-embedded broad learning system | |
Spina et al. | Nighttime features derived from topic models for classification of patients with COPD | |
CN117076994B (zh) | 一种多通道生理时间序列分类方法 | |
Hsu | Embedded grey relation theory in Hopfield neural network: application to motor imagery EEG recognition | |
Yang et al. | Clustering inter-arrival time of health care encounters for high utilizers | |
Liu et al. | A hybrid double-density dual-tree discrete wavelet transformation and marginal Fisher analysis for scoring sleep stages from unprocessed single-channel electroencephalogram | |
CN115349821A (zh) | 一种基于多模态生理信号融合的睡眠分期方法及系统 | |
CHOLLETI et al. | BIOMEDICAL DATA ANALYSIS IN PREDICTING AND IDENTIFICATION CANCER DISEASE USING DUO-MINING |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |