CN103473467A - 一种基于压缩感知检测icu患者记录中伪像的方法及系统 - Google Patents
一种基于压缩感知检测icu患者记录中伪像的方法及系统 Download PDFInfo
- Publication number
- CN103473467A CN103473467A CN2013104335635A CN201310433563A CN103473467A CN 103473467 A CN103473467 A CN 103473467A CN 2013104335635 A CN2013104335635 A CN 2013104335635A CN 201310433563 A CN201310433563 A CN 201310433563A CN 103473467 A CN103473467 A CN 103473467A
- Authority
- CN
- China
- Prior art keywords
- test sample
- training sample
- sample book
- pseudomorphism
- normalization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于压缩感知检测ICU患者记录中伪像的方法,其通过寻找测试集关于训练集的稀疏表示,建立一个二元分类器,实现对ICU病人是否会死亡的判断。基于本发明检测ICU患者记录中伪像的方法不需要预先建立统计学模型,仅仅通过寻找测试样本关于训练集的稀疏表示就可以做到分类,使用灵活。相比于基于假设检验的病情评价模型,不需要对生理指标偏离正常范围的程度分级,基本消除了研究者的主观影响。本发明还公开了实现上述方法的系统,能够有效解决现有风险预测模型的非特异性问题;相对现有模型,本发明提高了预测的准确率和特异性。
Description
技术领域
本发明属于医疗检测技术领域,具体涉及一种基于压缩感知检测ICU患者记录中伪像的方法及系统。
背景技术
重症监护室(ICU)有限的医疗资源和高昂的费用决定了并不是所有病人都可以得到特殊护理。传感技术(如心电、血压、血氧、呼吸、体温等)在ICU广泛应用。专家系统处理来自各类传感器监视信号,准确评估病人的状态,然后觉得是否需要特殊护理。对病人病情的准确评价和可靠的风险预测,是决定病人是否需要重症监护、控制护理质量的重要依据。一个有效的病情评价系统,能够在患者健康作为首要考量的前提下,最大程度节约医疗成本,并使更多真正有需要的患者受益。
值得注意的是,绝大多数现有评价模型建立的初衷都是对病人进行风险分层,而不是对某个特定病人的状态进行预测。这样模型预测的概率可以认为是对一个“平均”的预测。从理论上讲,要使得模型能够给出特异性的预测,除了要对病人群体进行准确细分,还要综合考虑更多的风险因素,比如营养不良、求生意愿等。然而这些因素的加入势必会显著增加模型的复杂度,对系统的建立者和使用者都提出了极大的挑战。
现有的检测ICU患者记录中伪像的方法均采用假设检验方法。公开号为1914623的国际专利公开了一种用于利用数据融合和假设检验来检测ICU患者记录中的伪像的方法和系统;其在假设检验中,虚假设包括:假定几个受监视信号的高度相关受监视信号的样本对具有预定分布。所述方法当虚假设为真的可能性低于预定置信度值时,确定伪像可存在于多个受监视信号之一中。这种方法受制于预定分布的正确性。
发明内容
针对现有技术所存在的上述技术问题,本发明提供了一种基于压缩感知检测ICU患者记录中伪像的方法及系统,实现了对特定个体病人的重症分析,解决了传统方法的非特异性问题。
一种基于压缩感知检测ICU患者记录中伪像的方法,包括如下步骤:
(1)对病人进行生理检测得到测试样本,并收集对应标识为0和1的两组训练样本集X0和X1;其中,标识0表示病人无需进行重症监护,标识1表示需要进行重症监护;
(2)利用正则化最小二乘法计算测试样本分别关于两组训练样本集的稀疏表示c0和c1;
(3)根据稀疏表示c0和c1计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y)。
所述的训练样本集为由对应标识下的m个历史样本组成的n×m维矩阵,所述的测试样本和历史样本均为由n个生理指标数据组成的n维向量,所述的稀疏表示c0和c1均为m维向量,n和m均为大于1的自然数且m<n。
每个历史样本的标识均由医生诊断确定,每个生理指标数据采用多次测量后的平均数据。
所述的步骤(2)中,计算测试样本分别关于两组训练样本集的稀疏表示c0和c1的过程如下:
首先,对测试样本和两组训练样本集进行归一化处理;
然后,建立基于Lp范数最小化的目标函数如下:
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,λ为平衡系数,|| ||2表示L2范数,|| ||p表示Lp范数,p为自然数,i=0或1;
最后,对所述的目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c0和c1。
所述的步骤(3)中,根据以下算式计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y):
gi(y)=||y′-Xi′ci||2
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,|| ||2表示L2范数,i=0或1。
优选地,对测试样本和两组训练样本集进行归一化处理的过程为:
对于测试样本或训练样本集中的任一生理指标数据v,若该生理指标数据的正常范围为[vmin,vmax],则根据以下关系对生理指标数据v进行归一化计算,得到归一化后的生理指标数据v′:
若v∈[vmin,vmax],则v′=0;否则,v′=max{|v-vmax|,|vmin-v|};
依此,遍历测试样本和训练样本集中的所有生理指标数据,得到归一化后的测试样本y′以及训练样本集X0′和X1′。
本发明不直接采用多次测量中偏离正常范围最大的值来作为预测变量,而是通过它来构造预测变量;这样保证了预测变量随病情严重程度是单调变化的,避免出现某项正常的测量值由多个不正常的测量值(其中有些偏高,有些偏低)叠加而成的情形,从而保证了压缩感知算法的有效性。
优选地,对于所述的Lp范数,取p=1;采用L1范数最小化可以有效地恢复稀疏信号,可将目标函数转化为L1正则化的最小二乘问题。
利用L1-magic算法对目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c0和c1。
一种基于压缩感知检测ICU患者记录中伪像的系统,包括:
数据接收存储模块,用于存储对应标识为0和1的两组训练样本集X0和X1,同时接收病人经生理检测得到的测试样本;其中,标识0表示病人无需进行重症监护,标识1表示需要进行重症监护;
稀疏降维模块,用于利用正则化最小二乘法计算所述的测试样本分别关于两组训练样本集的稀疏表示c0和c1;
误差计算模块,用于根据稀疏表示c0和c1计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y)。
所述的稀疏降维模块计算测试样本分别关于两组训练样本集的稀疏表示c0和c1的过程如下:
首先,对测试样本和两组训练样本集进行归一化处理;
然后,建立基于Lp范数最小化的目标函数如下:
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,λ为平衡系数,|| ||2表示L2范数,|| ||p表示Lp范数,p为自然数,i=0或1;
最后,利用L1-magic算法对所述的目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c0和c1。
所述的误差计算模块根据以下算式计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y):
gi(y)=||y′-Xi′ci||2
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,|| ||2表示L2范数,i=0或1。
本发明基于压缩感知检测ICU患者记录中伪像的方法不需要预先建立统计学模型,仅仅通过寻找测试样本关于训练集的稀疏表示就可以做到分类,使用灵活。相比于基于假设检验的病情评价模型,不需要对生理指标偏离正常范围的程度分级,基本消除了研究者的主观影响。与现有风险预测模型的比较表明,本发明提高了预测的准确率和特异性。
附图说明
图1为本发明方法的步骤流程示意图。
图2为处理测试样本与训练样本集的流程示意图。
图3为求解稀疏表示问题的流程示意图。
图4为本发明系统的结构示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,一种基于压缩感知检测ICU患者记录中伪像的方法,包括如下步骤:
(1)对病人进行生理检测得到测试样本,并收集对应标识为0和1的两组训练样本集X0和X1;其中,标识0表示病人无需进行重症监护,标识1表示需要进行重症监护;
训练样本集为由对应标识下的m个历史样本组成的n×m维矩阵,测试样本和历史样本均为由n个生理指标数据组成的n维向量,稀疏表示c0和c1均为m维向量,n和m均为大于1的自然数且m<n。
每个历史样本的标识均由医生诊断确定,每个生理指标数据采用多次测量后的平均数据。
(2)对于所给的训练集与测试样本,利用正则化最小二乘法计算测试样本分别关于两组训练样本集的稀疏表示c0和c1;
如图2所示,为了处理上述训练样本集和测试样本,进行构造变量及归一化处理。本实施方式并不直接采用多次测量中偏离正常范围最大的值来作为预测变量,而是通过它来构造预测变量。这样保证了预测变量随病情严重程度是单调变化的,避免出现某项正常的测量值由多个不正常的测量值(其中有些偏高,有些偏低)叠加而成的情形,从而保证了压缩感知算法的有效性。
对于测试样本或训练样本集中的任一生理指标数据v,若该生理指标数据的正常范围为[vmin,vmax],则根据以下关系对生理指标数据v进行归一化计算,得到归一化后的生理指标数据v′:
若v∈[vmin,vmax],则v′=0;否则,v′=max{|v-vmax|,|vmin-v|};
依此,遍历测试样本和训练样本集中的所有生理指标数据,得到归一化后的测试样本y′以及训练样本集X0′和X1′。
标记一个训练集为{(xj,Lj),j=1,2,…,m},xj∈Rn,Lj∈{0,1},xj表示第j个病人样本,它是一个n维的列向量,n是预测变量的个数。Lj是表明第j个病人生存状态的标签,取值为0表示病人存活,取值为1表示病人死亡。一个测试样本(即生存状态未知的病人)y∈Rn。
得到归一化后的测试样本y′以及训练样本集X0′和X1′后,如图3所示,本实施方式利用Lp范数代替L0范数得到稀疏表示问题的近似解;稀疏表示问题可以表示为:subject to y=Xc;替代后得到的近似解为:subject to y=Xc;其中,向量v的Lp范数定义为||v||p=(∑j|vj|p)1/p;
进而引入参数λ以得到更一般化的目标函数,并作为平衡重建误差和稀疏度的正则化标量。从而得到更一般化的目标函数表示如下:
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,λ为平衡系数,|| ||2表示L2范数,|| ||p表示Lp范数,p为自然数,i=0或1;
本实施方式取p=1,因为L1范数最小化可以有效地恢复稀疏信号。于是,问题转化为L1正则化的最小二乘问题:
最后,利用L1-magic算法对上述目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c0和c1。
(3)根据稀疏表示c0和c1通过以下算式计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y):
gi(y)=||y′-Xi′ci||2
将测试样本y归为近似误差最小的那一类,即建立一个二元分类器,对ICU病人是否会死亡进行预测;即取对应误差函数相对较小的标识作为病人的重症评价。
图4为实现上述方法的系统,包括:
数据接收存储模块,用于存储对应标识为0和1的两组训练样本集X0和X1,同时接收病人经生理检测得到的测试样本;其中,标识0表示病人无需进行重症监护,标识1表示需要进行重症监护;
稀疏降维模块,用于利用正则化最小二乘法计算所述的测试样本分别关于两组训练样本集的稀疏表示c0和c1;其具体计算方法如上。
误差计算模块,用于根据稀疏表示c0和c1计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y)。
利用本实施方式与传统的假设检验方法进行了对比实验。我们分别对755例ICU患者进行了连续监测。在5个时间点采集信息,分别是:入住ICU时,入住24小时后,入住48小时后,从ICU搬出时以及出院时。入住信息包含人口统计学信息、从前在ICU治疗的历史,和很多状态变量,比如某个器官系统衰竭,功能性状况,与癌症相关的变量,血液气体,肝脏、神经系统和呼吸系统功能。此外,还包含了一些治疗变量,比如输血量、吸入氧气分数。
在对病人是否会死亡这一事件的预测上,正确率不是一个完善的评价指标。因此,我们采用了如表1的打分规则:
表1
其中:Se=TP/(TP+FN),PPV=TP/(TP+FP),得分=min(Se,PPV)。
表2给出了传统假设检验以及本实施方式的得分结果。
表2
Se | PPV | 得分 | 正确率 | |
假设检验 | 0.6 | 0.1944 | 0.1944 | 58.5% |
本实施方式 | 0.3652 | 0.2456 | 0.2456 | 74.75% |
从以上结果可以看出,本发明方法大大提升了病人状态的评估正确率与特异性。
Claims (10)
1.一种基于压缩感知检测ICU患者记录中伪像的方法,包括如下步骤:
(1)对病人进行生理检测得到测试样本,并收集对应标识为0和1的两组训练样本集X0和X1;其中,标识0表示病人无需进行重症监护,标识1表示需要进行重症监护;
(2)利用正则化最小二乘法计算测试样本分别关于两组训练样本集的稀疏表示c0和c1;
(3)根据稀疏表示c0和c1计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y)。
2.根据权利要求1所述的检测ICU患者记录中伪像的方法,其特征在于:所述的训练样本集为由对应标识下的m个历史样本组成的n×m维矩阵,所述的测试样本和历史样本均为由n个生理指标数据组成的n维向量,所述的稀疏表示c0和c1均为m维向量,n和m均为大于1的自然数且m<n。
3.根据权利要求2所述的检测ICU患者记录中伪像的方法,其特征在于:每个历史样本的标识均由医生诊断确定,每个生理指标数据采用多次测量后的平均数据。
4.根据权利要求1所述的检测ICU患者记录中伪像的方法,其特征在于:所述的步骤(2)中,计算测试样本分别关于两组训练样本集的稀疏表示c0和c1的过程如下:
首先,对测试样本和两组训练样本集进行归一化处理;
然后,建立基于Lp范数最小化的目标函数如下:
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,λ为平衡系数,|| ||2表示L2范数,|| ||p表示Lp范数,p为自然数,i=0或1;
最后,对所述的目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c0和c1。
5.根据权利要求1所述的检测ICU患者记录中伪像的方法,其特征在于:所述的步骤(3)中,根据以下算式计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y):
gi(y)=||y′-Xi′ci||2
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,|| ||2表示L2范数,i=0或1。
6.根据权利要求4所述的检测ICU患者记录中伪像的方法,其特征在于:对测试样本和两组训练样本集进行归一化处理的过程为:
对于测试样本或训练样本集中的任一生理指标数据v,若该生理指标数据的正常范围为[vmin,vmax],则根据以下关系对生理指标数据v进行归一化计算,得到归一化后的生理指标数据v′:
若v∈[vmin,vmax],则v′=0;否则,v′=max{|v-vmax|,|vmin-v|};
依此,遍历测试样本和训练样本集中的所有生理指标数据,得到归一化后的测试样本y′以及训练样本集X0′和X1′。
7.根据权利要求4所述的检测ICU患者记录中伪像的方法,其特征在于:对于所述的Lp范数,取p=1。
8.一种基于压缩感知检测ICU患者记录中伪像的系统,其特征在于,包括:
数据接收存储模块,用于存储对应标识为0和1的两组训练样本集X0和X1,同时接收病人经生理检测得到的测试样本;其中,标识0表示病人无需进行重症监护,标识1表示需要进行重症监护;
稀疏降维模块,用于利用正则化最小二乘法计算所述的测试样本分别关于两组训练样本集的稀疏表示c0和c1;
误差计算模块,用于根据稀疏表示c0和c1计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y)。
9.根据权利要求8所述的检测ICU患者记录中伪像的系统,其特征在于:所述的稀疏降维模块计算测试样本分别关于两组训练样本集的稀疏表示c0和c1的过程如下:
首先,对测试样本和两组训练样本集进行归一化处理;
然后,建立基于Lp范数最小化的目标函数如下:
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,λ为平衡系数,|| ||2表示L2范数,|| ||p表示Lp范数,p为自然数,i=0或1;
最后,利用L1-magic算法对所述的目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c0和c1。
10.根据权利要求8所述的检测ICU患者记录中伪像的系统,其特征在于:所述的误差计算模块根据以下算式计算测试样本分别归于标识0和1对应的误差函数g0(y)和g1(y):
gi(y)=||y′-Xi′ci||2
其中:y′为归一化后的测试样本,Xi′表示对应标识为i归一化后的训练样本集,|| ||2表示L2范数,i=0或1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013104335635A CN103473467A (zh) | 2013-09-18 | 2013-09-18 | 一种基于压缩感知检测icu患者记录中伪像的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013104335635A CN103473467A (zh) | 2013-09-18 | 2013-09-18 | 一种基于压缩感知检测icu患者记录中伪像的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103473467A true CN103473467A (zh) | 2013-12-25 |
Family
ID=49798314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013104335635A Pending CN103473467A (zh) | 2013-09-18 | 2013-09-18 | 一种基于压缩感知检测icu患者记录中伪像的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103473467A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1914623A (zh) * | 2004-02-04 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 用于利用数据融合和假设检验来检测icu患者记录中的伪像的方法和系统 |
CN102663450A (zh) * | 2012-03-21 | 2012-09-12 | 南京邮电大学 | 基于稀疏表示的新生儿疼痛与非疼痛表情分类识别方法 |
CN103226196A (zh) * | 2013-05-17 | 2013-07-31 | 重庆大学 | 基于稀疏特征的雷达目标识别方法 |
CN103268485A (zh) * | 2013-06-09 | 2013-08-28 | 上海交通大学 | 基于稀疏正则化的实现多波段人脸图像信息融合的人脸识别方法 |
-
2013
- 2013-09-18 CN CN2013104335635A patent/CN103473467A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1914623A (zh) * | 2004-02-04 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 用于利用数据融合和假设检验来检测icu患者记录中的伪像的方法和系统 |
CN102663450A (zh) * | 2012-03-21 | 2012-09-12 | 南京邮电大学 | 基于稀疏表示的新生儿疼痛与非疼痛表情分类识别方法 |
CN103226196A (zh) * | 2013-05-17 | 2013-07-31 | 重庆大学 | 基于稀疏特征的雷达目标识别方法 |
CN103268485A (zh) * | 2013-06-09 | 2013-08-28 | 上海交通大学 | 基于稀疏正则化的实现多波段人脸图像信息融合的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
杨蜀秦等: "基于稀疏表示的大米品种识别", 《农业工程学报》 * |
陈才扣等: "一种快速的基于稀疏表示分类器", 《南京大学学报(自然科学)》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Akbari et al. | Depression Detection Based on Geometrical Features Extracted from SODP Shape of EEG Signals and Binary PSO. | |
Sun et al. | Prediction of cardiovascular diseases based on machine learning | |
Song et al. | Development of a stress classification model using deep belief networks for stress monitoring | |
Lin et al. | Maximal information coefficient for feature selection for clinical document classification | |
CN102663450B (zh) | 基于稀疏表示的新生儿疼痛与非疼痛表情分类识别方法 | |
CN104866713B (zh) | 基于增量局部鉴别子空间嵌入的川崎病和发烧诊断系统 | |
Vargas-Lopez et al. | An explainable machine learning approach based on statistical indexes and SVM for stress detection in automobile drivers using electromyographic signals | |
Cohen et al. | Automated detection of sleep apnea in infants: A multi-modal approach | |
Nieto-del-Amor et al. | Assessment of dispersion and bubble entropy measures for enhancing preterm birth prediction based on electrohysterographic signals | |
CN112472101A (zh) | 基于转换技术的深度学习心电图数据分类方法及装置 | |
CN113707317B (zh) | 一种基于混合模型的疾病危险因素重要性分析方法 | |
Mohammadi Far et al. | Prediction of preterm delivery from unbalanced EHG database | |
KR102169637B1 (ko) | 사망 위험도의 예측 방법 및 이를 이용한 사망 위험도의 예측 디바이스 | |
US20210117867A1 (en) | Method and apparatus for subtyping subjects based on phenotypic information | |
CN110353641A (zh) | 生命体征监测方法及系统 | |
CN110739075A (zh) | 一种基于大数据的copd疾病辅助诊断监测系统 | |
CN108665975A (zh) | 临床路径匹配方法和系统 | |
Mendis et al. | Computerised Cardiotocography Analysis for the Automated Detection of Fetal Compromise during Labour: A Review | |
Huang et al. | Study on patient similarity measurement based on electronic medical records | |
CN107157498B (zh) | 一种针对脑力疲劳的语音疲劳度检测方法 | |
CN103473467A (zh) | 一种基于压缩感知检测icu患者记录中伪像的方法及系统 | |
Srhoj-Egekher et al. | Feature modeling for interpretable low back pain Classification based on Surface EMG | |
US20240038383A1 (en) | Health Monitoring System | |
Lv et al. | Mcfn: A multichannel fusion network for sleep apnea syndrome detection | |
Malviya et al. | Mental stress level detection using LSTM for WESAD dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20131225 |
|
RJ01 | Rejection of invention patent application after publication |