CN111466877B - 一种基于lstm网络的氧减状态预测方法 - Google Patents
一种基于lstm网络的氧减状态预测方法 Download PDFInfo
- Publication number
- CN111466877B CN111466877B CN202010246372.8A CN202010246372A CN111466877B CN 111466877 B CN111466877 B CN 111466877B CN 202010246372 A CN202010246372 A CN 202010246372A CN 111466877 B CN111466877 B CN 111466877B
- Authority
- CN
- China
- Prior art keywords
- data
- network
- prediction
- matrix
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 title claims abstract description 93
- 229910052760 oxygen Inorganic materials 0.000 title claims abstract description 93
- 239000001301 oxygen Substances 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000009467 reduction Effects 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 61
- 239000008280 blood Substances 0.000 claims abstract description 48
- 210000004369 blood Anatomy 0.000 claims abstract description 48
- 238000012360 testing method Methods 0.000 claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 55
- 238000000605 extraction Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 6
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 abstract description 7
- 238000003745 diagnosis Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000003066 decision tree Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010064719 Oxyhemoglobins Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000009184 walking Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
Abstract
本发明公开了一种基于LSTM网络的氧减状态预测方法,包括,采集待测人员不同指标的数据并进行处理,获取测试数据;构建预测网络并对预测网络进行训练,输出训练后的预测网络;将测试数据输入训练后的预测网络中进行处理;预测网络输出预测结果。本发明的有益效果:能够通过待测人员的血氧饱和度和脉搏频率数据,预测其处于氧减状态概率,帮助待测人员或医务人员判断其是否需要接受进一步诊断治疗,特别是对于慢性阻塞性肺疾病的潜在患者具有很大帮助。
Description
技术领域
本发明涉及氧减状态预测的技术领域,尤其涉及一种基于LSTM网络的氧减状态预测方法。
背景技术
近年来,慢性阻塞性肺疾病的氧减状态作为一项非常关键的诊断依据,医护人员需要根据慢性阻塞性肺疾病氧减状态所呈现出来的特性,判断待诊人员是否有患病的可能性和征兆。现阶段,医护人员在进行判断时,通常是获取待诊人员在一段时间内的血氧饱和度指数以及脉率的数据,根据经验手动标定血脉氧指数中处于氧减状态的数据点,并根据氧减状态下的血脉氧、心率等数据表现出来的特征,如脉率是否有明显变化、氧减状态持续的时间、血氧饱和度指数下降的幅度等,并根据这些特征来判断待测人员是否有可能患病而需要进一步接受具体诊断。但是这样的判断方式,一来需要等待获取数据的设备传递数据以及对大量数据进行手工标注的问题,二来医护人员自身的经验也会对诊断结果有影响。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的技术问题是:提出一种基于LSTM网络的氧减状态预测方法,能够对慢性阻塞性肺疾病氧减状态进行预测,预测出待测人员的患病风险。
为解决上述技术问题,本发明提供如下技术方案:一种基于LSTM网络的氧减状态预测方法,包括,采集待测人员不同指标的数据并进行处理,获取测试数据;构建预测网络并对预测网络进行训练,输出训练后的预测网络;将测试数据输入训练后的预测网络中进行处理;预测网络输出预测结果。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述采集数据还包括以下步骤,令待测人员穿戴测试仪器,并进行运动;通过测试仪器得到的待测人员的相关指标数据;根据相关指标数据和测试时长得到原始数据矩阵。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述原始数据矩阵表示为,
其中,矩阵M中四列元素分别对应索引、时刻、血氧饱和度和脉搏频率四个指标,n为采集数据的时刻长度,且i∈[1,n]。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述对采集到的数据进行处理还包括对血氧饱和度进行窗口特征和梯度特征的提取,并由提取出的特征值和原始数据中的血氧饱和度以及脉搏频率构成测试数据矩阵M',表示如下,
其中,矩阵M'中四列元素分别对应血氧饱和度、脉搏频率、窗口特征提取值和梯度特征提取值四个特征指标,n为采集数据的时刻长度,且i∈[1,n]。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述窗口特征的提取计算公式如下,
其中,winsize表示窗口大小,此处窗口大小为10,m'i,3表示矩阵M'第i行第三列的血氧饱和度窗口特征提取值。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述梯度特征的计算公式为,
其中,m'i,4表示第i行第四列的血氧饱和度梯度特征提取值,m'i,1为该时刻对应的血氧饱和度值。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述构建的预测网络包括长短时记忆网络,网络结构中包括输入门、输出门和遗忘门。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述对预测网络进行训练还包括以下步骤,获取训练数据;将训练数据依次输入至预测网络中;根据预测网络输出结果判断预测的准确率并重复训练;当预测准确率不再增加时,结束训练。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述获取训练数据包括采集原始训练数据,得到原始训练数据矩阵X,原始训练数据矩阵X表示为,
其中,元素A、B、C、D、E、F和G分别表示索引、时刻、血氧饱和度、脉搏频率、数据是否有效、数据质量和是否发生氧减的指标,n表示采集数据的时长,单位为秒,xi,j表示第i个时间点第j列的数据值,且i∈[1,n],j∈[1,7]。
作为本发明所述的基于LSTM网络的氧减状态预测方法的一种优选方案,其中:所述获取训练数据还包括对原始训练数据进行处理,
对原始训练数据进行窗口特征和梯度特征的提取;
去除原始训练数据矩阵X中的索引和时刻列;
在原始数训练据矩阵X中加入窗口特征和梯度特征值,构成新的矩阵X1,矩阵X1表示如下:
其中,A1、B1、C1、D1、E1、F1和G1分别代表血氧饱和度、脉搏频率、血氧饱和度特征、变化幅度、数据是否有效、数据质量和是否发生氧减的指标;
对矩阵X1中的数据进行整合,得到训练数据矩阵X*,矩阵X*表示如下:
其中,A*、B*、C*、D*和E*分别代表血氧饱和度、脉搏频率、血氧饱和度特征、变化幅度和标签值。
本发明的有益效果:本发明提出的氧减状态预测方法,能够通过待测人员的血氧饱和度和脉搏频率数据,预测其处于氧减状态概率,帮助待测人员或医务人员判断其是否需要接受进一步诊断治疗,特别是对于慢性阻塞性肺疾病的潜在患者具有很大帮助。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明所述基于LSTM网络的氧减状态预测方法的整体流程示意图;
图2为本发明所述LSTM网络单元中包含的输入门、输出门和遗忘门的结构示意图;
图3为一个待测人员工作特征曲线的示意图;
图4为实验中采用不同方法下得到的待测人员工作特征曲线对比示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1的示意,示意为本实施例提出一种基于LSTM网络的氧减状态预测方法的流程图,具体包括以下步骤,
S1:采集待测人员不同指标的数据并进行处理,获取测试数据;
具体的,所述采集数据还包括以下步骤,
令待测人员穿戴测试仪器,并进行运动;其中,测试仪器可以为脉氧监测仪,进行的运动包括日常活动、步行、登楼等;
通过测试仪器得到的待测人员的相关指标数据;测试仪器能够获取血氧饱和度和脉率数据。
根据相关指标数据和测试时长得到原始数据矩阵。具体的,所述原始数据矩阵可以表示为,
其中,矩阵M中四列元素分别对应索引、时刻、血氧饱和度和脉搏频率四个指标,n为采集数据的时刻长度,且i∈[1,n]。
索引值为从0开始按照顺序递增的自然数,仅作为排列标号使用;时刻值表示获取到对应数据项的时间点,此处测试仪器对数据采集的间隔为每秒采集一次,因此时刻值为以秒为单位递增的数字,总采集时长为n;血氧饱和度为血液中血氧的浓度,该值为血液中被氧结合的氧合血红蛋白的容量占全部可结合的血红蛋白容量的百分比,是呼吸循环的重要生理参数;脉搏频率作为对同一时刻血氧饱和度指数的补充参考,脉搏频率和血氧饱和度指数均由测试仪器获取。
采集得到原始数据矩阵后,需要进行处理从而获取测试数据,所述对采集到的数据进行处理还包括对血氧饱和度进行窗口特征和梯度特征的提取,并由提取出的特征值和原始数据中的血氧饱和度以及脉搏频率构成测试数据矩阵M',表示如下,
其中,矩阵M'中四列元素分别对应血氧饱和度、脉搏频率、窗口特征提取值和梯度特征提取值四个特征指标,n为采集数据的时刻长度,且i∈[1,n]。
具体的,所述窗口特征的提取计算公式如下,
其中,winsize表示窗口大小,此处窗口大小为10,m'i,3表示矩阵M'第i行第三列的血氧饱和度窗口特征提取值。此处用矩阵M'中第到第/>行的血氧饱和度值之和除以窗口大小,得到对应的窗口特征提取值。
所述梯度特征的计算公式为,
其中,m'i,4表示第i行第四列的血氧饱和度梯度特征提取值,m'i,1为该时刻对应的血氧饱和度值,m'i-1,1为其前一时刻的血氧饱和度值。
S2:构建预测网络并对预测网络进行训练,输出训练后的预测网络;
其中,构建的预测网络包括长短时记忆网络,网络结构中包括输入门、输出门和遗忘门。预测网络可以采用长短时记忆网络(LSTM),该网络是在循环神经网络基础上提出的一种变种结构,通过LSTM算法解决循环神经网络中存在的与当前时刻距离越远的时刻信息会被逐渐弱以及有用信息间隔不确定的问题,其核心思想是采用了由输入门、输出门和遗忘门组成的特殊网络结构。参照图2的示意,示意为一个LSTM单元的三个门的结构。
具体的,每个门结构都是一个采用Sigmod函数作为激活函数的神经网络结构加上一个按位做乘法的操作,这两个操作合在一起共同实现了门的功能。Ct-1和Ct分别表示上一时刻和当前时刻的状态,ht-1和ht分别表示前一时刻的输出和当前时刻的输出,xt表示当前时刻输入层的输入。在一个LSTM的单元结构中,遗忘门的作用是让LSTM过滤掉之前无用的信息,遗忘门通过前一时刻的状态Ct-1、前一时刻的输出ht-1以及当前输入层的输入xt共同决定哪些信息会被遗忘。输入门的作用是让LSTM补充当前新的信息,通过前一时刻的状态Ct-1、前一时刻的输出ht-1以及当前输入层的输入xt共同决定哪些信息会被保留。经过遗忘门和输入门的处理后,得出当前时刻的状态Ct,随后输出门会对当前时刻的状态Ct、前一时刻的输出ht-1以及当前输入层的输入xt进行处理,得出该时刻的输出ht。通过这样的结构,LSTM可以从训练样本中学习到在某一时刻哪些信息应该被遗忘,哪些信息应该被保留,如此便可更好地适应实际应用的需求。
长短时记忆网络的遗忘门包括以下公式,
ft=σ(Wf·[ht-1,xt]+bf)
其中,ft为遗忘门的输出,范围为[0,1],0表示完全遗忘,1表示完全不变,Wf和bf分别为遗忘门结构中的权值矩阵和偏置项,ht-1为上一时刻输出门的输出,xt为当前时刻的输入,σ为激活函数,本实施例中为Sigmod函数。
输入门包括以下公式,
it=σ(Wi·[ht-1,xt]+bi)
其中,Ct为输入门决定的给节点的输入,ft为遗忘门的输出,Ct-1为上一时刻输入门的输出,it为输入门决定的对于当前信息的接收程度,为新的状态信息,Wi和bi分别为输入门结构中的用于确定对于当前信息的接收程度的权值矩阵和偏置项。WC和bC分别为输入门结构中的用于确定新状态信息的权值矩阵和偏置项。
输出门包括以下公式,
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中,ot用于控制需要输出的信息,Wo和bo分别为输出门结构中的用于确定ot接收程度的权值矩阵和偏置项,ht为当前LSTM单元的输出。
构建完成预测网络后,需要对其进行训练才能投入实际使用,所述对预测网络进行训练还包括以下步骤,
获取训练数据;所述获取训练数据包括采集原始训练数据,得到原始训练数据矩阵X,原始训练数据矩阵X表示为,
其中,元素A、B、C、D、E、F和G分别表示索引、时刻、血氧饱和度、脉搏频率、数据是否有效、数据质量和是否发生氧减的指标,n表示采集数据的时长,单位为秒,xi,j表示第i个时间点第j列的数据值,且i∈[1,n],j∈[1,7]。原始训练数据矩阵X的获取方式可以参照步骤S1中采集数据的方式,为了后续的训练,采集的对象应当包括健康人和患者。
具体的,数据是否有效是指测试仪器在进行采集过程中是否出现受环境影响,如噪音过大,或设备故障导致测试有误的情况,导致测试数据无效,例如出现血氧饱和度指数127,脉搏频率255等测试数据,若出现数据无效的情况,则此处标记为FLASE,若数据有效则标记为TRUE;数据质量是指采集过程中,是否存在如设备松开或脱落、接触不良等意外情况,即与设备本身和环境影响无关而导致获取的数据出现中断等现象,若存在以上现象则此列记为FLASE,否则记为TRUE;G列表示对应时刻是否发生氧减,若采集的对象为健康人,则未发生氧减,此列为FLASE,否则为TRUE。
所述获取训练数据还包括对原始训练数据进行处理,
对原始训练数据进行窗口特征和梯度特征的提取;具体的,此处可参照前述获取测试数据中窗口特征和梯度特征的提取方法。
去除原始训练数据矩阵X中的索引和时刻列;
在原始数训练据矩阵X中加入窗口特征和梯度特征值,构成新的矩阵X1,矩阵X1表示如下:
其中,A1、B1、C1、D1、E1、F1和G1分别代表血氧饱和度、脉搏频率、血氧饱和度特征、变化幅度、数据是否有效、数据质量和是否发生氧减的指标;且A1、B1、E1、F1和G1列的值分别对应原始训练数据矩阵X中的C、D、E、F和G列的值,C1、D1列的值由窗口特征和梯度特征的提取结果决定。
对矩阵X1中的数据进行整合,得到训练数据矩阵X*,矩阵X*表示如下:
其中,A*、B*、C*、D*和E*分别代表血氧饱和度、脉搏频率、血氧饱和度特征、变化幅度和标签值。训练数据矩阵X*中,A*、B*、C*、D*分别对应矩阵X1的A1、B1、C1、D1,E*列表示标签值,E*列的值为0或1,根据矩阵X1中E1、F1和G1的值来判断E*列的值,当同一行的E1、F1和G1均为TRUE时,E*列对应此行的值为1,否则为0。
将训练数据依次输入至预测网络中;其中,输入至预测网络中的数据为训练数据矩阵X*的前四列数据,标签值作为真实标签,用于指导训练的准确率。
根据预测网络输出结果判断预测的准确率并重复训练;根据标签值可以知道输入的训练数据对应的测试人员实际是否出现氧减状态,对比预测网络输出的概率值,可以判断出此处预测的准确率。
当预测准确率不再增加时,结束训练。若预测准确率相比于此前有所增加,则继续训练,或可以采用多组数据,直至全部数据训练完毕时输出网络的训练方式,此处可以选6000组训练数据。
S3:将测试数据输入训练后的预测网络中进行处理;训练后的预测网络可以投入实际使用,此处将采集到的待测人员的测试数据输入预测网络中,由预测网络进行处理和预测。
S4:预测网络输出预测结果。
具体的,预测网络的输出为输入的测试数据属于氧减状态的概率值,其范围为0~1,输出值越大说明属于氧减状态的可能性越大,若输出值的概率超过0.5,则待测人员应当前往医院进行接受诊断。
场景一:
为了验证本实施例所述基于LSTM网络的氧减状态预测方法在实际应用中的效果,进行如下实验,采用同样的测试数据集,分别基于本实施例所述方法以及现有的方法根据测试数据集进行处理判断,并对比不同方法下的预测结果。实验中采用的现有方法包括决策树算法(DecisionTree)和支持向量机算法(SVM)。测试数据可以通过3位待诊患者进行采集,最终得到的测试数据集有效时长为1500秒。对实验结果进行统计并比较准确率,实验中选取接受测试的待测人员工作特征(ROC)曲线下方的面积(AUC)作为评价模型分类准确率的指标。其中,ROC曲线为分类问题中被广泛采用的统计和评价方式。对于一个分类模型,若其输出直接为预测样本的类别,则称这样的分类模式为硬分类;若其输出的结果是预测样本属于某一类的概率,那么这样的分类模式为软分类。在决定其最终的分类结果时,存在着阈值的选取,例如阈值选择0.5时,那么概率低于0.5时就认为属于负类,高于0.5时就认为属于正类,然后可以根据混淆矩阵进行统计并计算一系列的评价指标。若以一定的步长对阈值进行选取,那么将会出现一系列的分类结果,每个结果都可统计为一个混淆矩阵并有其对应的指标,ROC曲线的绘制就是基于这样的思想,参照图3的示意,图3为一个ROC曲线图的示例。
此处得出每个算法在测试数据集上的ROC曲线图和AUC值,结果分别如图4和下表1所示,
表1:不同算法在测试数据集上的AUC值
算法 | 决策树算法 | 支持向量机算法 | LSTM网络 |
AUC | 0.7529 | 0.8053 | 0.8453 |
可以看出,在图4中本实施例所述LSTM算法模型得到的ROC曲线更加接近(0,1)点,证明其分类性能要高于传统的决策树模型和支持向量机模型。且对于同样的测试数据集,决策树算法模型取得的AUC为0.7529,支持向量机算法模型取得的AUC为0.8053,本实施例中的LSTM算法模型取得的AUC为0.8453,相比于决策树算法模型的AUC提高了12.3%,相比于支持向量机算法模型的AUC提高了5.0%,体现了本实施例所述方法对于处理具有时序特点的数据,相比于传统方法更具有优势。
另外,本实施例中对数据进行预处理进行窗口特征的提取时,选择的窗口大小为10,为了验证该窗口大小对于后续测试结果的影响,进行如下的实验,选择不同的窗口大小进行特征提取,保持其它因素和步骤相同并进行测试,对比测试结果如下表2所示,
表2:不同窗口大小对应测试结果的AUC值
根据表2可以看出,当窗口大小低于10时,窗口大小的提高会降低LSTM算法模型的分类性能,而当窗口大小扩大到10附近时,对应模型的AUC有较为明显的提升,当窗口大小为10时,AUC值增长为0.8453,为实验中的最高值,因此本实施例中选取的窗口大小为10。
为了验证本实施例中,对数据进行预处理时提取窗口特征和梯度特征的作用,进行如下的实验,分别对采集到的数据进行只提取窗口特征、只提取梯度特征、两种特征均不提取和两种特征均提取的方式进行预处理,其它步骤保持不变,构成的四种测试数据集进行检测,得到的结果如下表3所示,
表3:不同特征组合下对应测试结果的AUC值
特征组合 | 只提取窗口特征 | 只提取梯度特征 | 均不提取 | 均提取 |
AUC | 0.8064 | 0.8246 | 0.8268 | 0.8453 |
根据表3可以看出,窗口特征和梯度特征都进行提取后得到的测试数据,测试结果的AUC值最高,且梯度特征相比于窗口特征对于慢性阻塞性肺疾病氧减状态的预测更为重要,让模型更好地学习到慢性阻塞性肺疾病氧减状态的特征,提高模型的分类能力,本实施例中对于测试数据采取了窗口特征和梯度特征均提取的处理方式。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (4)
1.一种基于LSTM网络的氧减状态预测方法,其特征在于:包括,
采集待测人员不同指标的数据并进行处理,获取测试数据;
令待测人员穿戴测试仪器,并进行运动;
通过测试仪器得到的待测人员的相关指标数据;
根据相关指标数据和测试时长得到原始数据矩阵;
构建预测网络并对预测网络进行训练,输出训练后的预测网络;
对预测网络进行训练包括以下步骤,
获取训练数据;
将训练数据依次输入至预测网络中;
根据预测网络输出结果判断预测的准确率并重复训练;
当预测准确率不再增加时,结束训练;
所述获取训练数据包括采集原始训练数据,得到原始训练数据矩阵X,原始训练数据矩阵X表示为,
其中,元素A、B、C、D、E、F和G分别表示索引、时刻、血氧饱和度、脉搏频率、数据是否有效、数据质量和是否发生氧减的指标,n表示采集数据的时长,单位为秒,xi,j表示第i个时间点第j列的数据值,且i∈[1,n],j∈[1,7];
所述获取
训练数据还包括对原始训练数据进行处理,
对原始训练数据进行窗口特征和梯度特征的提取;
去除原始训练数据矩阵X中的索引和时刻列;
在原始数训练据矩阵X中加入窗口特征和梯度特征值,构成新的矩阵X1,矩阵X1表示如
下:
其中,A1、B1、C1、D1、E1、F1和G1分别代表血氧饱和度、脉搏频率、血氧饱和度特征、变化幅度、数据是否有效、数据质量和是否发生氧减的指标;
对矩阵X1中的数据进行整合,得到训练数据矩阵X*,矩阵X*表示如下:
其中,A*、B*、C*、D*和E*分别代表血氧饱和度、脉搏频率、血氧饱和度特征、变化幅度和标签值;
将测试数据输入训练后的预测网络中进行处理;
预测网络输出预测结果。
2.如权利要求1所述的基于LSTM网络的氧减状态预测方法,其特征在于:所述窗口特征的提取计算公式如下,
其中,winsize表示窗口大小,此处窗口大小为10,m′i,3表示矩阵M'第i行第三列的血氧饱和度窗口特征提取值。
3.如权利要求1或2所述的基于LSTM网络的氧减状态预测方法,其特征在于:所述梯度特征的计算公式为,
其中,m′i,4表示第i行第四列的血氧饱和度梯度特征提取值,m′i,1为该时刻对应的血氧饱和度值。
4.如权利要求3所述的基于LSTM网络的氧减状态预测方法,其特征在于:所述构建的预测网络包括长短时记忆网络,网络结构中包括输入门、输出门和
遗忘门。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010246372.8A CN111466877B (zh) | 2020-03-31 | 2020-03-31 | 一种基于lstm网络的氧减状态预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010246372.8A CN111466877B (zh) | 2020-03-31 | 2020-03-31 | 一种基于lstm网络的氧减状态预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111466877A CN111466877A (zh) | 2020-07-31 |
CN111466877B true CN111466877B (zh) | 2023-12-01 |
Family
ID=71749381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010246372.8A Active CN111466877B (zh) | 2020-03-31 | 2020-03-31 | 一种基于lstm网络的氧减状态预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111466877B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113192598A (zh) * | 2021-02-02 | 2021-07-30 | 中国中医科学院针灸研究所 | taVNS疗法的疗效预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5830135A (en) * | 1994-03-31 | 1998-11-03 | Bosque; Elena M. | Fuzzy logic alarm system for pulse oximeters |
CN108463166A (zh) * | 2015-08-20 | 2018-08-28 | 塞雷尼姆有限公司 | 儿童阻塞性睡眠呼吸暂停症的诊断系统和方法 |
CN110074765A (zh) * | 2019-04-29 | 2019-08-02 | 中山大学 | 一种sahs筛查及睡眠分期的判别方法 |
CN110726505A (zh) * | 2019-10-23 | 2020-01-24 | 上海电力高压实业有限公司 | 基于长短时记忆网络的输电杆塔螺栓紧固检测方法及系统 |
CN110876621A (zh) * | 2018-09-06 | 2020-03-13 | 南京大学 | 一种基于神经网络的睡眠呼吸暂停综合症检测系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11109817B2 (en) * | 2017-04-20 | 2021-09-07 | Gmeci, Llc | Systems and methods for measuring physiological parameters |
-
2020
- 2020-03-31 CN CN202010246372.8A patent/CN111466877B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5830135A (en) * | 1994-03-31 | 1998-11-03 | Bosque; Elena M. | Fuzzy logic alarm system for pulse oximeters |
CN108463166A (zh) * | 2015-08-20 | 2018-08-28 | 塞雷尼姆有限公司 | 儿童阻塞性睡眠呼吸暂停症的诊断系统和方法 |
CN110876621A (zh) * | 2018-09-06 | 2020-03-13 | 南京大学 | 一种基于神经网络的睡眠呼吸暂停综合症检测系统 |
CN110074765A (zh) * | 2019-04-29 | 2019-08-02 | 中山大学 | 一种sahs筛查及睡眠分期的判别方法 |
CN110726505A (zh) * | 2019-10-23 | 2020-01-24 | 上海电力高压实业有限公司 | 基于长短时记忆网络的输电杆塔螺栓紧固检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111466877A (zh) | 2020-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108597601B (zh) | 基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法 | |
WO2016201499A1 (en) | Method and system for assessing mental state | |
US11062792B2 (en) | Discovering genomes to use in machine learning techniques | |
CN113080986A (zh) | 一种基于可穿戴设备的运动性疲劳检测方法和系统 | |
Adetiba et al. | Automated detection of heart defects in athletes based on electrocardiography and artificial neural network | |
Guo et al. | A supervised machine learning semantic segmentation approach for detecting artifacts in plethysmography signals from wearables | |
Kelly et al. | Automatic prediction of health status using smartphone-derived behavior profiles | |
CN113171080B (zh) | 一种基于可穿戴传感信息融合的能量代谢评估方法和系统 | |
Çallı et al. | FRODO: Free rejection of out-of-distribution samples: application to chest x-ray analysis | |
CN115363586A (zh) | 一种基于脉搏波信号的心理压力等级评估系统及方法 | |
CN110575178B (zh) | 一种运动状态判断的诊断监控综合医疗系统及其判断方法 | |
CN111466877B (zh) | 一种基于lstm网络的氧减状态预测方法 | |
CN113128585B (zh) | 一种基于多尺寸卷积核的深度神经网络实现心电异常检测分类方法 | |
CN113469218A (zh) | 基于深度学习的心电信号危急值处理方法、系统及介质 | |
KR101764503B1 (ko) | 프랙탈 차원 지표를 산정하여 미병 분류를 보조하는 컴퓨팅 장치 및 방법 | |
KR101653502B1 (ko) | 미병 분류를 보조하는 컴퓨팅 장치 및 방법 | |
Nam et al. | Selective prediction with long short-term memory using unit-wise batch standardization for time series health data sets: algorithm development and validation | |
CN115376638A (zh) | 一种基于多源健康感知数据融合的生理特征数据分析方法 | |
CN115633961A (zh) | 基于动态加权决策融合恐高情绪识别模型构建方法与系统 | |
US20230290506A1 (en) | Systems and methods for rapidly screening for signs and symptoms of disorders | |
Nguyen et al. | Digital Phenotype Representation by Statistical, Information Theory, Data-Driven Approach with Digital Health Data | |
Li et al. | Assessment of firefighter-training effectiveness in China based on human-factor parameters and machine learning | |
van Gorp et al. | Aleatoric Uncertainty Estimation of Overnight Sleep Statistics Through Posterior Sampling Using Conditional Normalizing Flows | |
CN112971791B (zh) | 一种个体化的生理状态监测分析方法和设备 | |
CN116453641B (zh) | 一种中医辅助分析信息的数据处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |