CN103473467A

CN103473467A - 一种基于压缩感知检测icu患者记录中伪像的方法及系统

Info

Publication number: CN103473467A
Application number: CN2013104335635A
Authority: CN
Inventors: 刘华锋
Original assignee: SHANGHAI XINGXIANG COMPUTER TECHNOLOGY Co Ltd
Current assignee: SHANGHAI XINGXIANG COMPUTER TECHNOLOGY Co Ltd
Priority date: 2013-09-18
Filing date: 2013-09-18
Publication date: 2013-12-25

Abstract

本发明公开了一种基于压缩感知检测ICU患者记录中伪像的方法，其通过寻找测试集关于训练集的稀疏表示，建立一个二元分类器，实现对ICU病人是否会死亡的判断。基于本发明检测ICU患者记录中伪像的方法不需要预先建立统计学模型，仅仅通过寻找测试样本关于训练集的稀疏表示就可以做到分类，使用灵活。相比于基于假设检验的病情评价模型，不需要对生理指标偏离正常范围的程度分级，基本消除了研究者的主观影响。本发明还公开了实现上述方法的系统，能够有效解决现有风险预测模型的非特异性问题；相对现有模型，本发明提高了预测的准确率和特异性。

Description

一种基于压缩感知检测ICU患者记录中伪像的方法及系统

技术领域

本发明属于医疗检测技术领域，具体涉及一种基于压缩感知检测ICU患者记录中伪像的方法及系统。

背景技术

重症监护室（ICU）有限的医疗资源和高昂的费用决定了并不是所有病人都可以得到特殊护理。传感技术（如心电、血压、血氧、呼吸、体温等）在ICU广泛应用。专家系统处理来自各类传感器监视信号，准确评估病人的状态，然后觉得是否需要特殊护理。对病人病情的准确评价和可靠的风险预测，是决定病人是否需要重症监护、控制护理质量的重要依据。一个有效的病情评价系统，能够在患者健康作为首要考量的前提下，最大程度节约医疗成本，并使更多真正有需要的患者受益。

值得注意的是，绝大多数现有评价模型建立的初衷都是对病人进行风险分层，而不是对某个特定病人的状态进行预测。这样模型预测的概率可以认为是对一个“平均”的预测。从理论上讲，要使得模型能够给出特异性的预测，除了要对病人群体进行准确细分，还要综合考虑更多的风险因素，比如营养不良、求生意愿等。然而这些因素的加入势必会显著增加模型的复杂度，对系统的建立者和使用者都提出了极大的挑战。

现有的检测ICU患者记录中伪像的方法均采用假设检验方法。公开号为1914623的国际专利公开了一种用于利用数据融合和假设检验来检测ICU患者记录中的伪像的方法和系统；其在假设检验中，虚假设包括：假定几个受监视信号的高度相关受监视信号的样本对具有预定分布。所述方法当虚假设为真的可能性低于预定置信度值时，确定伪像可存在于多个受监视信号之一中。这种方法受制于预定分布的正确性。

发明内容

针对现有技术所存在的上述技术问题，本发明提供了一种基于压缩感知检测ICU患者记录中伪像的方法及系统，实现了对特定个体病人的重症分析，解决了传统方法的非特异性问题。

一种基于压缩感知检测ICU患者记录中伪像的方法，包括如下步骤：

（1）对病人进行生理检测得到测试样本，并收集对应标识为0和1的两组训练样本集X₀和X₁；其中，标识0表示病人无需进行重症监护，标识1表示需要进行重症监护；

（2）利用正则化最小二乘法计算测试样本分别关于两组训练样本集的稀疏表示c₀和c₁；

（3）根据稀疏表示c₀和c₁计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)。

所述的训练样本集为由对应标识下的m个历史样本组成的n×m维矩阵，所述的测试样本和历史样本均为由n个生理指标数据组成的n维向量，所述的稀疏表示c₀和c₁均为m维向量，n和m均为大于1的自然数且m＜n。

每个历史样本的标识均由医生诊断确定，每个生理指标数据采用多次测量后的平均数据。

所述的步骤（2）中，计算测试样本分别关于两组训练样本集的稀疏表示c₀和c₁的过程如下：

首先，对测试样本和两组训练样本集进行归一化处理；

然后，建立基于Lp范数最小化的目标函数如下：

J (c_{i}, λ) = \min_{c_{i}} {{| | {x_{i}}^{'} c_{i} - y^{'} | |}_{2} + λ {| | c_{i} | |}_{p}}

其中：y′为归一化后的测试样本，X_i′表示对应标识为i归一化后的训练样本集，λ为平衡系数，|| ||₂表示L2范数，|| ||_p表示Lp范数，p为自然数，i=0或1；

最后，对所述的目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c₀和c₁。

所述的步骤（3）中，根据以下算式计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)：

g_i(y)＝||y′-X_i′c_i||₂

其中：y′为归一化后的测试样本，X_i′表示对应标识为i归一化后的训练样本集，|| ||₂表示L2范数，i=0或1。

优选地，对测试样本和两组训练样本集进行归一化处理的过程为：

对于测试样本或训练样本集中的任一生理指标数据v，若该生理指标数据的正常范围为[v_min,v_max]，则根据以下关系对生理指标数据v进行归一化计算，得到归一化后的生理指标数据v′：

若v∈[v_min,v_max]，则v′=0；否则，v′＝max{|v-v_max|,|v_min-v|}；

依此，遍历测试样本和训练样本集中的所有生理指标数据，得到归一化后的测试样本y′以及训练样本集X₀′和X₁′。

本发明不直接采用多次测量中偏离正常范围最大的值来作为预测变量，而是通过它来构造预测变量；这样保证了预测变量随病情严重程度是单调变化的，避免出现某项正常的测量值由多个不正常的测量值（其中有些偏高，有些偏低）叠加而成的情形，从而保证了压缩感知算法的有效性。

优选地，对于所述的Lp范数，取p=1；采用L1范数最小化可以有效地恢复稀疏信号，可将目标函数转化为L1正则化的最小二乘问题。

利用L1-magic算法对目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c₀和c₁。

一种基于压缩感知检测ICU患者记录中伪像的系统，包括：

数据接收存储模块，用于存储对应标识为0和1的两组训练样本集X₀和X₁，同时接收病人经生理检测得到的测试样本；其中，标识0表示病人无需进行重症监护，标识1表示需要进行重症监护；

稀疏降维模块，用于利用正则化最小二乘法计算所述的测试样本分别关于两组训练样本集的稀疏表示c₀和c₁；

误差计算模块，用于根据稀疏表示c₀和c₁计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)。

所述的稀疏降维模块计算测试样本分别关于两组训练样本集的稀疏表示c₀和c₁的过程如下：

首先，对测试样本和两组训练样本集进行归一化处理；

然后，建立基于Lp范数最小化的目标函数如下：

J (c_{i}, λ) = \min_{c_{i}} {{| | {x_{i}}^{'} c_{i} - y^{'} | |}_{2} + λ {| | c_{i} | |}_{p}}

最后，利用L1-magic算法对所述的目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c₀和c₁。

所述的误差计算模块根据以下算式计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)：

g_i(y)＝||y′-X_i′c_i||₂

本发明基于压缩感知检测ICU患者记录中伪像的方法不需要预先建立统计学模型，仅仅通过寻找测试样本关于训练集的稀疏表示就可以做到分类，使用灵活。相比于基于假设检验的病情评价模型，不需要对生理指标偏离正常范围的程度分级，基本消除了研究者的主观影响。与现有风险预测模型的比较表明，本发明提高了预测的准确率和特异性。

附图说明

图1为本发明方法的步骤流程示意图。

图2为处理测试样本与训练样本集的流程示意图。

图3为求解稀疏表示问题的流程示意图。

图4为本发明系统的结构示意图。

具体实施方式

为了更为具体地描述本发明，下面结合附图及具体实施方式对本发明的技术方案进行详细说明。

如图1所示，一种基于压缩感知检测ICU患者记录中伪像的方法，包括如下步骤：

训练样本集为由对应标识下的m个历史样本组成的n×m维矩阵，测试样本和历史样本均为由n个生理指标数据组成的n维向量，稀疏表示c₀和c₁均为m维向量，n和m均为大于1的自然数且m＜n。

（2）对于所给的训练集与测试样本，利用正则化最小二乘法计算测试样本分别关于两组训练样本集的稀疏表示c₀和c₁；

如图2所示，为了处理上述训练样本集和测试样本，进行构造变量及归一化处理。本实施方式并不直接采用多次测量中偏离正常范围最大的值来作为预测变量，而是通过它来构造预测变量。这样保证了预测变量随病情严重程度是单调变化的，避免出现某项正常的测量值由多个不正常的测量值（其中有些偏高，有些偏低）叠加而成的情形，从而保证了压缩感知算法的有效性。

若v∈[v_min,v_max]，则v′=0；否则，v′＝max{|v-v_max|,|v_min-v|}；

标记一个训练集为{（x_j,L_j），j=1,2,…,m}，x_j∈Rⁿ，L_j∈{0,1}，x_j表示第j个病人样本，它是一个n维的列向量，n是预测变量的个数。L_j是表明第j个病人生存状态的标签，取值为0表示病人存活，取值为1表示病人死亡。一个测试样本（即生存状态未知的病人）y∈Rⁿ。

得到归一化后的测试样本y′以及训练样本集X₀′和X₁′后，如图3所示，本实施方式利用Lp范数代替L0范数得到稀疏表示问题的近似解；稀疏表示问题可以表示为：

subject to y=Xc；替代后得到的近似解为：

subject to y=Xc；其中，向量v的Lp范数定义为||v||_p=(∑_j|v_j|^p)^1/p；

进而引入参数λ以得到更一般化的目标函数，并作为平衡重建误差和稀疏度的正则化标量。从而得到更一般化的目标函数表示如下：

J (c_{i}, λ) = \min_{c_{i}} {{| | {x_{i}}^{'} c_{i} - y^{'} | |}_{2} + λ {| | c_{i} | |}_{p}}

本实施方式取p=1，因为L1范数最小化可以有效地恢复稀疏信号。于是，问题转化为L1正则化的最小二乘问题：

J (c_{i}, λ) = \min_{c_{i}} {{| | {X_{i}}^{'} c_{i} - y^{'} | |}_{2} + λ {| | c_{i} | |}_{1}} .

最后，利用L1-magic算法对上述目标函数进行求解得到测试样本分别关于两组训练样本集的稀疏表示c₀和c₁。

（3）根据稀疏表示c₀和c₁通过以下算式计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)：

g_i(y)＝||y′-X_i′c_i||₂

将测试样本y归为近似误差最小的那一类，即建立一个二元分类器，对ICU病人是否会死亡进行预测；即取对应误差函数相对较小的标识作为病人的重症评价。

图4为实现上述方法的系统，包括：

稀疏降维模块，用于利用正则化最小二乘法计算所述的测试样本分别关于两组训练样本集的稀疏表示c₀和c₁；其具体计算方法如上。

利用本实施方式与传统的假设检验方法进行了对比实验。我们分别对755例ICU患者进行了连续监测。在5个时间点采集信息，分别是：入住ICU时，入住24小时后，入住48小时后，从ICU搬出时以及出院时。入住信息包含人口统计学信息、从前在ICU治疗的历史，和很多状态变量，比如某个器官系统衰竭，功能性状况，与癌症相关的变量，血液气体，肝脏、神经系统和呼吸系统功能。此外，还包含了一些治疗变量，比如输血量、吸入氧气分数。

在对病人是否会死亡这一事件的预测上，正确率不是一个完善的评价指标。因此，我们采用了如表1的打分规则：

表1

其中：Se=TP/(TP+FN)，PPV=TP/(TP+FP)，得分=min(Se，PPV)。

表2给出了传统假设检验以及本实施方式的得分结果。

表2

	Se	PPV	得分	正确率
					假设检验	0.6	0.1944	0.1944	58.5%
本实施方式	0.3652	0.2456	0.2456	74.75%

从以上结果可以看出，本发明方法大大提升了病人状态的评估正确率与特异性。

Claims

1.一种基于压缩感知检测ICU患者记录中伪像的方法，包括如下步骤：

2.根据权利要求1所述的检测ICU患者记录中伪像的方法，其特征在于：所述的训练样本集为由对应标识下的m个历史样本组成的n×m维矩阵，所述的测试样本和历史样本均为由n个生理指标数据组成的n维向量，所述的稀疏表示c₀和c₁均为m维向量，n和m均为大于1的自然数且m＜n。

3.根据权利要求2所述的检测ICU患者记录中伪像的方法，其特征在于：每个历史样本的标识均由医生诊断确定，每个生理指标数据采用多次测量后的平均数据。

4.根据权利要求1所述的检测ICU患者记录中伪像的方法，其特征在于：所述的步骤（2）中，计算测试样本分别关于两组训练样本集的稀疏表示c₀和c₁的过程如下：

首先，对测试样本和两组训练样本集进行归一化处理；

然后，建立基于Lp范数最小化的目标函数如下：

J (c_{i}, λ) = \min_{c_{i}} {{| | {x_{i}}^{'} c_{i} - y^{'} | |}_{2} + λ {| | c_{i} | |}_{p}}

5.根据权利要求1所述的检测ICU患者记录中伪像的方法，其特征在于：所述的步骤（3）中，根据以下算式计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)：

g_i(y)＝||y′-X_i′c_i||₂

6.根据权利要求4所述的检测ICU患者记录中伪像的方法，其特征在于：对测试样本和两组训练样本集进行归一化处理的过程为：

若v∈[v_min,v_max]，则v′=0；否则，v′＝max{|v-v_max|,|v_min-v|}；

7.根据权利要求4所述的检测ICU患者记录中伪像的方法，其特征在于：对于所述的Lp范数，取p=1。

8.一种基于压缩感知检测ICU患者记录中伪像的系统，其特征在于，包括：

9.根据权利要求8所述的检测ICU患者记录中伪像的系统，其特征在于：所述的稀疏降维模块计算测试样本分别关于两组训练样本集的稀疏表示c₀和c₁的过程如下：

首先，对测试样本和两组训练样本集进行归一化处理；

然后，建立基于Lp范数最小化的目标函数如下：

J (c_{i}, λ) = \min_{c_{i}} {{| | {x_{i}}^{'} c_{i} - y^{'} | |}_{2} + λ {| | c_{i} | |}_{p}}

10.根据权利要求8所述的检测ICU患者记录中伪像的系统，其特征在于：所述的误差计算模块根据以下算式计算测试样本分别归于标识0和1对应的误差函数g₀(y)和g₁(y)：

g_i(y)＝||y′-X_i′c_i||₂