CN116564553A

CN116564553A - 一种基于共病特征的用药效果预测方法

Info

Publication number: CN116564553A
Application number: CN202310505434.6A
Authority: CN
Inventors: 李鹏; 滕飞; 督静雯; 姚远; 李双庆; 梅挺; 张聂; 武云; 卓强; 朱军
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2023-05-06
Filing date: 2023-05-06
Publication date: 2023-08-08

Abstract

本发明提供了一种基于共病特征的用药效果预测方法，属于用药效果预测技术领域，该方法包括：获取原始数据，并对原始数据进行处理得到标准数据集；利用标准数据集训练双通道神经网络模型，得到患者的单个特征；将患者的单个特征作为节点特征，以患者间相似程度连边构造网络得到相似患者网络；利用图卷积网络学习相似患者网络的空间结构，挖掘相似患者间的关联信息，并基于关联信息预测患者的用药效果。本发明构建了相似患者网络，充分挖掘患者间信息，大幅提高用药效果预测的准确度，进而提高医疗决策的准确性，改善患者的治疗效果，在临床实践中具有广泛的应用前景。

Description

一种基于共病特征的用药效果预测方法

技术领域

本发明属于用药效果预测技术领域，尤其涉及一种基于共病特征的用药效果预测方法。

背景技术

用药效果预测在临床实践和个体化医疗中具有广泛的应用前景，可以帮助科研人员和临床医生更好地了解药物的药效，优化药物治疗方案，提高治疗效果。用药效果预测在临床实践中涉及多方面的挑战：患者个体性差异，患者之间的生理和病理差异很大，包括性别、年龄、肝肾功能等方面，缺乏准确预测患者用药效果的方法；临床医生在实际诊疗中往往依赖经验进行用药效果的判断，对临床产生的大量数据无法有效利用；传统医学统计分析进行用药疗效分析存在较大限制条件，需要控制各组间的某些指标处于可比的同一基线水平再进行不同组患者的用药效果预测，控制的指标多时，数据通常难以达到可比的标准；控制的指标少时，则会漏掉某些影响因素。因此，研究用药效果预测方法对降低医疗成本，促进个体化医疗具有重要意义。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于共病特征的用药效果预测方法，解决了用药预测中的患者个体化差异大、临床数据模式复杂、预测准确率低的问题。

为了达到以上目的，本发明采用的技术方案为：

本方案提供一种基于共病特征的用药效果预测方法，包括以下步骤：

S1、获取原始数据，并对原始数据进行处理得到标准数据集；

S2、利用标准数据集训练双通道神经网络模型，得到患者的单个特征；

S3、将患者的单个特征作为节点特征，以患者间相似程度连边构造网络得到相似患者网络；

S4、利用图卷积网络学习相似患者网络的空间结构，挖掘相似患者间的关联信息，并基于关联信息预测患者的用药效果。

本发明的有益效果是：本发明在构建的标准数据集的基础上，从患者单个特征和患者群体间相似性两方面提取时序序列的相关特征，挖掘更多深层次的信息，大幅提高用药效果预测的准确性，因此具有较高的应用价值。

进一步地，所述步骤S1包括以下步骤：

S101、获取原始数据；

S102、对原始数据进行抽取，并对抽取的原始数据进行填充和校正，得到患者信息数据和患者检查时序数据；

S103、对原始数据进行压缩，得到医嘱信息正确的数据；

S104、基于医嘱信息正确的数据，将长期医嘱按照给药时间进行展开，得到医嘱时序序列数据；

S105、将步骤S102至步骤S104得到的数据进行整合，得到标准数据集。

上述进一步方案的有益效果是：在本发明中，通过数据抽取及清洗、数据压缩及序列形成和数据融合等方法，构建了标准数据集，提高后续用药效果预测模型质量。

再进一步地，所述步骤S2包括以下步骤：

S201、利用标准数据集训练卷积神经网络，并通过局部信息的聚合捕捉时序序列的整体信息，得到变量之间隐藏的局部相关性特征；

S202、利用所述标准数据集训练门控循环单元网络，获取时序序列的时间特征，得到时序特征；

S203、利用局部相关性特征和时序特征构建患者的单个特征。

上述进一步方案的有益效果是：在本发明中利用双通道神经网络模型提取了患者的变量局部相关特征和宏观时间特征，充分提取了反应患者差异性的特征，避免患者的差异性信息淹没在复杂数据中，充分考虑了不同患者的个性特征，提高对不同患者群体的用药效果预测的准确性。

再进一步地，所述步骤S3包括以下步骤：

S301、将患者的单个特征作为节点特征，得到节点特征构造；

S302、按共病类型将患者进行分类；

S303、根据分类结果，利用动态时间规整算法计算得到反应患者间的相似矩阵；

S304、基于相似矩阵，获取边信息，得到边结构的构造，并基于节点特征构造得到相似患者网络。

上述进一步方案的有益效果是：在本发明中基于患者的单个特征和相似度构造合理的相似患者网络，为后续利用图神经网络模型挖掘患者群体间的关联信息奠定基础。

再进一步地，所述步骤S303包括以下步骤：

S3031、根据分类结果以及患者前期用药效果指数，获取两个患者的时序序列X和Y，其中，X的长度为m，Y的长度为n，m＝n；

S3032、对两条时序序列X和Y进行扫描，并通过计算时序序列X和Y间对应点的欧式距离得到带有距离值的矩阵网络，所述矩阵网络大小为m×n，矩阵网络中每个格点坐标表示为(i,j)，i表示X的第i个时刻，j表示Y的第j个时刻；

S3033、在矩阵网络中寻找最优路径；

S3034、基于最优路径，在满足连续性和单调性的约束条件下，通过下式计算得到约束条件下的归整路径P：

P＝{p₁,p₂,…,p_k}

其中，P_k表示矩阵网络搜索到的最优路径中的第k个格点；

S3035、基于归整路径P的规划策略，从矩阵网络的(0,0)处搜索至(m,n)处，并计算累加距离：

其中，distance(i,j)表示当前格点的累加距离，distance(i-1,j-1)表示当前格点左下方的格点累加距离，dist(X_i,Y_j)表示当前格点的距离，distance(i-1,j)表示当前格点下方的格点累加距离，distance(1,j-1)表示当前格点左边的格点累加距离，min表示最小化运算；

S3036、根据累加距离构建患者间的相似矩阵。

上述进一步方案的有益效果是：通过构建患者间的相似矩阵，利用相似矩阵以及相似矩阵中反应相似度的信息完成相似患者网络边的构造。

再进一步地，所述步骤S4包括以下步骤：

S401、将相似患者网络作为图卷积网络的输入，其中，所述相似患者网络的空间结构反应了患者间的相似性；

S402、定义图卷积层的传播方式，通过对相似患者网络的空间结构进行卷积操作；

S403、基于图卷积层的传播方式，对归一化邻接矩阵进行计算，其中，所述邻接矩阵描述了患者节点之间的连接关系；

S404、基于步骤S403的计算结果，得到训练后的图卷积网络；

S405、基于训后的图卷积网络，计算激活函数ReLU，输出相似患者间的关联信息，并基于关联信息预测患者的用药效果。

上述进一步方案的有益效果是：将患者群体表示为图，其中将变量之间隐藏的局部相关性特征和时序特征表征为图节点特征，利用共病患者的前期用药效果之间的潜在关系信息作为边进行集成，更好提取了患者群体间的关联信息。解决了临床患者情况多样、药物干预方式复杂，仅仅提取时序特征难以分析患者群体之间的相关性的问题，通过引入相似患者信息，增强预测精确度，进而提高了用药效果预测的质量。

再进一步地，所述步骤S402中定义图卷积层的传播方式，其具体为：

其中，Q^(l+1)表示图卷积层的传播方式，Q表示第一层的特征，σ表示激活函数ReLU，表示/>的度矩阵，/>表示描述图的连接性的邻接矩阵，Q^(l)表示第l层的特征，W^(l)表示第l层的权重参数矩阵，/>I表示单位矩阵，A表示描述图的连通性的矩阵。

上述进一步方案的有益效果是：将相似患者网络作为GCN的输入进行多患者间相似特征提取，使其可以同时获取以患者为中心的单个患者特性和相似关系特性，构建准确度较高的患者用药效果预测模型。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

实施例

如图1所示，本发明提供了一种基于共病特征的用药效果预测方法，其实现方法如下：

S1、获取原始数据，并对原始数据进行处理得到标准数据集，其实现方法如下：

S101、获取原始数据；

S103、对原始数据进行压缩，得到医嘱信息正确的数据；

本实施例中，在临床医生指导下，根据相关筛选标准，对原始数据进行抽取，针对抽取后数据存在的不完整和不一致问题，利用缺失值填补和修正数据不一致性的方法进行填充和校正，得到抽取和清洗后的患者信息数据和患者检查时序数据；由于患者状况和实际用药不足等原因，临床医生多次下达临时医嘱，原始数据存在完全相同的重复数据，针对该情况，与医院后台核实，在临床医生指导下，进行数据压缩，得到医嘱信息正确的数据；针对所述医嘱信息正确的数据，患者在医院进行长期治疗，形成长期的医嘱数据，将长期医嘱按照给药时间进行展开，得到符合临床治疗的医嘱时序序列数据；将所述患者信息数据、患者检查时序数据、医嘱时序序列数据进行融合，构建患者队列，得到标准数据集。

本实施例中，原始数据来自医院提供的重症患者数据，数据分布不同数据库，包含无用、重复等数据，且涉及大量长期数据，需要进行预处理、序列生成等操作。

本实施例中，获取原始数据后，在重症监护室临床医生的指导下，根据相关标准，按照研究任务的需求进行数据抽取。抽取的主要依据如下：针对住院天数，根据平均住院时间，筛选连续住院12天的患者；针对年龄，参考医生建议，老年和未成年属于特殊群体，抽取年龄在18至65之间的患者加入研究队列；针对疾病分类，根据国内标准与临床医生共同完成疾病分类，将疾病分为三大类即创伤、外科系统疾病、内科系统疾病；针对实验室检验指标，选取可以表征用药效果且缺失率较小的实验室检验指标值；对用药效果指数，由专科医生根据患者状况和相应检验指标制订指数规则，按照规则得出每个患者的用药效果指数。过上述筛选标准进行抽取，得到抽取后的数据；

本实施例中，抽取后的数据存在数据缺失和数据不一致的问题，针对缺失数据，发现多数缺失数据由于医院数据抽取遗漏造成，根据医院查询结果直接将真实值补充填入表中；针对不一致的数据，除了数据缺失，原始数据中还有年龄、性别、疾病诊断、营养支持方式等不一致的数据，本文利用二值化、独热编码和标签编码进行处理；通过数据填补和修正，得到清洗后的数据。

本实施例中，临床上，由于患者的情况和实际用药不足等原因，临床医生时常调整临时医嘱，原始数据中存在完全相同的医嘱信息，该情况主要有两种情形，一种是医生下错医嘱，办公护士会根据与医生复核作废一条医嘱，另一种是医生下达医嘱后自觉用量不够进行临时追加，那么两条一模一样的医嘱复核无误后均会被执行，与医院后台确认信息的真实情况，如确实为此类重复数据就进行删除，经过数据压缩，可以获得一个医嘱正确的数据集；对于住院患者，会进行长期的药物干预治疗，在医嘱数据中存在长期数据，将原始数据集中长期医嘱按给药时间进行展开，构造符合临床营养治疗的时序序列，得到医嘱时序序列数据。

S2、利用标准数据集训练双通道神经网络模型，得到患者的单个特征，其实现方法如下：

S203、利用局部相关性特征和时序特征构建患者的单个特征。

本实施例中，利用标准数据集训练卷积神经网络模型，通过局部信息的聚合捕捉时序序列的整体信息，得到变量之间隐藏的局部相关性特征；利用标准数据集训练门控循环单元网络获取时序序列的时间特征，得到时序特征；单个患者特征由提取患者的微观变量间的相关性特征和时序特征拼接得到。

本实施例中，为了得到患者的全面特征，构造了CNN和GRU两个通道，CNN通过局部信息的聚合来捕捉时序序列的整体信息，用来获取重症患者时序序列的微观变量之间的相关性特征，GRU则用来获取时序数据时间特征。为确保两种信道的输入特性都能均衡地反映出各自的特征，通道采用两种大小相等的张量。

本实施例中，构造CNN通道，标准数据集的时序序列向量表示为表示第n个患者在t时刻的第d维的特征；对所述时序向量进行卷积操作，卷积核大小k为2；定义X_i:i+k-1为k个相邻特征构成的滑动窗口，逐步对所述滑动窗口进行卷积运算，对于第m个窗口，有如下计算：

c_m＝f(wei·x_m:m+k-1+b)

其中，c_i表示第m个窗口的卷积操作，权重向量表示为wei，通过反向传播算法进行更新，b为偏执向量，·为卷积运算，f为非线性函数，使用tanh。

经过所述运算，患者及相关特征c表示为：

c＝[c₁,c₂,...,c_n]

其中，c_n表示第n维特征。

经过全连接层计算相应结果p_i，得到特征向量Tens1＝{p₁,p₂,...,p_d}，d为输出向量的维度。

本实施例中，构造GRU通道，通过GRU的重置门和更新门来修改隐藏状态的计算方式；给定患者垂直拼接后形成营养支持时序序列输入x_t，和上一时刻隐藏状态h_t-1；根据公式：

reset_t＝sigmoid(W_resetx_t+V_reserh_t-1)

update_t＝sigmoid(W_updatex_t+V_updateh_t-1)

计算重置门reset_t和更新门update_t，其中，sigmoid激活函数承担着将输出结果值变换为0-1之间的责任。

当前时刻节点隐藏状态在获取门控状态之后，首先重置门reset_t作用于上一时刻的隐含层的输出h_t-1，实现信息状态的重置。再将其与输入样本x_t一并乘以对应的偏置求和后，通过激活函数tanh激活即实现了对当前时刻节点即时信息h_t-1的更新，具体公式如下：

通过tanh全连接层求出值域为[-1,1]的候选隐藏状态，其中⊙表示Hadamard乘积，W、V表示各个状态相对应的权重矩阵；

当前隐含层的输出。是通过更新门控制输出的，更新门可以进行遗忘和选择记忆两个操作，遗忘操作作用的对象是上个时刻隐含层的输出，选择记忆操作作用的对象是当前时刻节点隐藏状态，其具体公式为：

也就是通过更新门update_t和隐藏状态计算时刻t的隐藏状态h_t；

为了从隐藏状态h_t中提取时序特征，将h_t输入到一个全连接层，应用sigmoid函数进行计算，将h_t与权重矩阵w₀相乘，在加上一个偏执向量b_s，w₀和b_s是可学习的参数，通过反向传播算法自动学习得到，具体公式为：

s_t＝sigmoid(W₀·h_t+b_s)

计算输出时序特征s_t,经过完全连接层，得到特征向量Tens2＝{s₁,s₂,...,s_d}，d表示输出向量的维度。

S3、将患者的单个特征作为节点特征，以患者间相似程度连边构造网络得到相似患者网络，其实现方法如下：

S301、将患者的单个特征作为节点特征，得到节点特征构造；

S302、按共病类型将患者进行分类；

S303、根据分类结果，利用动态时间规整算法计算得到反应患者间的相似矩阵，其实现方法如下：

S3033、在矩阵网络中寻找最优路径；

P＝{p₁,p₂,…,p_k}

其中，P_k表示矩阵网络搜索到的最优路径中的第k个格点；

S3036、根据累加距离构建患者间的相似矩阵；

本实施例中，利用患者的单个特征作为节点特征，按照患者共病特征和前期用药效果分关，在此基础上，计算患者间的相似度，以患者间相似程度连边构造网络，得到相似患者网络。

本实施例中，为了挖掘患者群体间的关联，提高用药效果预测效率，并且挖掘类似患者之间营养支持治疗的潜在规律，关键在于构建合理的相似网络图。该图每个节点对应一个患者，节点特征利用单个患者特征进行表征，边结构则是利用同类患者间的相似性来表征。

本实施例中，节点特征构造：相似网络中每个患者节点都带有各自的属性，将双通道神经网络提取的患者单个特征即局部变量相关特征和时间依赖作为节点特征。

本实施例中，边构造：考虑到相似患者间共病特征和用药效果具有较多共性。因此，首先将患者按照疾病种类分为三大类：创伤、外科系统疾病、内科系统疾病。对于每类疾病中的患者，按照用药效果分为：完全改善、部分改善、维持稳定、暂时控制、无效，得到患者的分类；在所述分类的基础上利用时序相似度方法计算同种疾病的不同患者之间的相似性，得到相似网络图的邻接矩阵。采用动态时间规整算法(DynamicTimeWarping，DTW)进行计算，DTW是一种用所有相似点的距离来测量两个病人的时序序列的相似性的算法：

首先，定义两个患者的用药效果指数的时序序列分别是X＝{X₁,X₂,...,X_m}、Y＝{Y₁,Y₂,...,Y_N}，X、Y的长度分别是m、n；DTW算法将矩阵视作单个网格，计算的X与Y的对齐点即通过的格点，通过网格的最佳路径，得到最优的序列路径；

根据公式：

P_k-1＝(i,j),P＝(i',j')i≤i'≤i+1,j≤j'≤j+1

计算归整路径距离：P＝{p₁,p₂,…,p_k}，其中，P_k为(i,j)，i表示患者X中i时刻的用药效果指数，j表示患者Y中j时刻的用药效果指数；

确定累加距离distance，即从P₁＝(1,1)开始匹配X和Y，每次计算下一个点时把之前所有点的距离累加到一起，直到所有点都匹配完毕为止。序列X和Y的总体相似程度就表示为该distance；

根据公式：

其中，distance(i,j)表示当前格点的累加距离，distance(i-1,j-1)表示当前格点左下方的格点累加距离，dist(X_i,Y_j)表示当前格点的距离，distance(i-1,j)表示当前格点下方的格点累加距离，distance(1,j-1)表示当前格点左边的格点累加距离，min表示最小化运算。

计算累加距离distance，其中，distance(i,j)为当前格点的距离dist(X_i,Y_j)，即两个时序序列X，Y中对应点X_i和Y_j的欧式距离与到达当前格点的最小相邻元素的累积距离总和，该distance(i,j)构成患者间的相似矩阵；所述相似矩阵中的最后一个元素表示两个时序序列X、Y的相似度即患者间的相似度。

通过上述方法，构造每种疾病中相似患者子图g，该图g可以简单表述为：考虑一个共病患者群体，每个患者都由一组营养方式、患者静态信息(如性别、年龄)和疾病疗效描述/关联。该人群包括一组N个具有相同疾病的患者，表示为一个无向稀疏图g＝(v,e,a)；其中，a是描述图的连通性的邻接矩阵即上述定义的相似矩阵，每个患者由顶点v表示，边e描述了患者间的相似度，因此，相似网络图是具有节点属性信息的图。将上述形成的子图g融合，得到一个完整的患者相似网络。

S4、利用图卷积网络学习相似患者网络的空间结构，挖掘相似患者间的关联信息，并基于关联信息预测患者的用药效果，其实现方法如下：

S402、定义图卷积层的传播方式，通过对相似患者网络的空间结构进行卷积操作，以使相似患者之间的特征得到更好的交互和整合，挖掘相似患者间的关联信息，从而而支持模型最后进行准确地预测；

S404、基于步骤S403的计算结果，得到训练后的图卷积网络；

本实施例中，图卷积网络模型将整个相似患者网络图作为输入，在训练过程中评估损失函数，采用逆向传播梯度衰减法对损失函数进行迭代优化，在测试集上计算ReLU激活函数，并输出相应节点的预测值。完整的相似患者网络定义为G＝(V,E,A)，V是所有患者的集合，E是所有边的集合，A是描述图的连通性的矩阵；患者的时序特征定义为X_N×M，N表示每个患者即节点数量，M表示每个患者特征值的数量即时序特征向量维度，将X和A作为图卷积神经网络的输入；定义图卷积层传播方式：其中/>I表示单位矩阵，/>为/>的度矩阵，Q代表每一层的特征，若Q为输入层，则Q＝X，σ为激活函数ReLU，W^(l)为第l层的权重参数矩阵，传播方式由拉普拉斯矩阵进行计算，具体的公式是：

其中，S^sym表示图的拉普拉斯矩阵，I_n表示n维的单位矩阵。

本实施例中，对于归一化邻接矩阵计算，图卷积网络是将邻接矩阵本身两边分别乘以节点的度开方，并在此基础上取逆。在无向无权图中，deg(v_x)和deg(v_y)表示为x、y的度，对于每一个节点对(x,y)表示为：

其中，表示对称归一化拉普拉斯算子在位置(x,y)上的元素，反应了节点x、y之间的关系，x、y表示图结构中的两个节点。

本实施例中，图卷积完成后，通过一层输出维度为1的全连接层输出用药效果的预测结果。

本实施例中，本发明通过获取原始数据，并数据抽取及清洗、数据压缩及序列形成和数据融合等方法，得到标准数据集；利用标准数据集训练双通道神经网络模型，得到单个患者特征；利用单个患者特征作为节点特征，以患者间相似程度连边构造网络，得到相似患者网络；通过图卷积网络学习所述相似患者网络的空间结构，提取患者群体间的关联信息，预测患者的用药效果。本发明在构建的标准数据集的基础上，从患者单个特征和患者群体间相似性两方面提取时序序列的相关特征，挖掘更多深层次的信息，大幅提高用药效果预测的准确性，因此具有较高的应用价值。

Claims

1.一种基于共病特征的用药效果预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于共病特征的用药效果预测方法，其特征在于，所述步骤S1包括以下步骤：

S101、获取原始数据；

S103、对原始数据进行压缩，得到医嘱信息正确的数据；

3.根据权利要求1所述的基于共病特征的用药效果预测方法，其特征在于，所述步骤S2包括以下步骤：

S203、利用局部相关性特征和时序特征构建患者的单个特征。

4.根据权利要求1所述的基于共病特征的用药效果预测方法，其特征在于，所述步骤S3包括以下步骤：

S301、将患者的单个特征作为节点特征，得到节点特征构造；

S302、按共病类型将患者进行分类；

5.根据权利要求4所述的基于共病特征的用药效果预测方法，其特征在于，所述步骤S303包括以下步骤：

S3033、在矩阵网络中寻找最优路径；

P＝{p₁,p₂,…,p_k}

其中，P_k表示矩阵网络搜索到的最优路径中的第k个格点；

S3036、根据累加距离构建患者间的相似矩阵。

6.根据权利要求1所述的基于共病特征的用药效果预测方法，其特征在于，所述步骤S4包括以下步骤：

S404、基于步骤S403的计算结果，得到训练后的图卷积网络；

7.根据权利要求6所述的基于共病特征的用药效果预测方法，其特征在于，所述步骤S402中定义图卷积层的传播方式，其具体为：