CN116564553A - 一种基于共病特征的用药效果预测方法 - Google Patents
一种基于共病特征的用药效果预测方法 Download PDFInfo
- Publication number
- CN116564553A CN116564553A CN202310505434.6A CN202310505434A CN116564553A CN 116564553 A CN116564553 A CN 116564553A CN 202310505434 A CN202310505434 A CN 202310505434A CN 116564553 A CN116564553 A CN 116564553A
- Authority
- CN
- China
- Prior art keywords
- network
- patient
- patients
- matrix
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 201000010099 disease Diseases 0.000 title claims abstract description 27
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 27
- 230000000857 drug effect Effects 0.000 title abstract description 18
- 239000003814 drug Substances 0.000 claims abstract description 40
- 230000000694 effects Effects 0.000 claims abstract description 34
- 229940079593 drug Drugs 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000003062 neural network model Methods 0.000 claims abstract description 7
- 238000005065 mining Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 62
- 230000006870 function Effects 0.000 claims description 13
- 238000009825 accumulation Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 9
- 230000007774 longterm Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000005096 rolling process Methods 0.000 claims description 4
- 238000011282 treatment Methods 0.000 abstract description 10
- 230000009286 beneficial effect Effects 0.000 description 7
- 235000016709 nutrition Nutrition 0.000 description 4
- 238000013144 data compression Methods 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 3
- 230000035764 nutrition Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000009533 lab test Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000009101 premedication Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008733 trauma Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 235000008242 dietary patterns Nutrition 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 238000011866 long-term treatment Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Toxicology (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明提供了一种基于共病特征的用药效果预测方法,属于用药效果预测技术领域,该方法包括:获取原始数据,并对原始数据进行处理得到标准数据集;利用标准数据集训练双通道神经网络模型,得到患者的单个特征;将患者的单个特征作为节点特征,以患者间相似程度连边构造网络得到相似患者网络;利用图卷积网络学习相似患者网络的空间结构,挖掘相似患者间的关联信息,并基于关联信息预测患者的用药效果。本发明构建了相似患者网络,充分挖掘患者间信息,大幅提高用药效果预测的准确度,进而提高医疗决策的准确性,改善患者的治疗效果,在临床实践中具有广泛的应用前景。
Description
技术领域
本发明属于用药效果预测技术领域,尤其涉及一种基于共病特征的用药效果预测方法。
背景技术
用药效果预测在临床实践和个体化医疗中具有广泛的应用前景,可以帮助科研人员和临床医生更好地了解药物的药效,优化药物治疗方案,提高治疗效果。用药效果预测在临床实践中涉及多方面的挑战:患者个体性差异,患者之间的生理和病理差异很大,包括性别、年龄、肝肾功能等方面,缺乏准确预测患者用药效果的方法;临床医生在实际诊疗中往往依赖经验进行用药效果的判断,对临床产生的大量数据无法有效利用;传统医学统计分析进行用药疗效分析存在较大限制条件,需要控制各组间的某些指标处于可比的同一基线水平再进行不同组患者的用药效果预测,控制的指标多时,数据通常难以达到可比的标准;控制的指标少时,则会漏掉某些影响因素。因此,研究用药效果预测方法对降低医疗成本,促进个体化医疗具有重要意义。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于共病特征的用药效果预测方法,解决了用药预测中的患者个体化差异大、临床数据模式复杂、预测准确率低的问题。
为了达到以上目的,本发明采用的技术方案为:
本方案提供一种基于共病特征的用药效果预测方法,包括以下步骤:
S1、获取原始数据,并对原始数据进行处理得到标准数据集;
S2、利用标准数据集训练双通道神经网络模型,得到患者的单个特征;
S3、将患者的单个特征作为节点特征,以患者间相似程度连边构造网络得到相似患者网络;
S4、利用图卷积网络学习相似患者网络的空间结构,挖掘相似患者间的关联信息,并基于关联信息预测患者的用药效果。
本发明的有益效果是:本发明在构建的标准数据集的基础上,从患者单个特征和患者群体间相似性两方面提取时序序列的相关特征,挖掘更多深层次的信息,大幅提高用药效果预测的准确性,因此具有较高的应用价值。
进一步地,所述步骤S1包括以下步骤:
S101、获取原始数据;
S102、对原始数据进行抽取,并对抽取的原始数据进行填充和校正,得到患者信息数据和患者检查时序数据;
S103、对原始数据进行压缩,得到医嘱信息正确的数据;
S104、基于医嘱信息正确的数据,将长期医嘱按照给药时间进行展开,得到医嘱时序序列数据;
S105、将步骤S102至步骤S104得到的数据进行整合,得到标准数据集。
上述进一步方案的有益效果是:在本发明中,通过数据抽取及清洗、数据压缩及序列形成和数据融合等方法,构建了标准数据集,提高后续用药效果预测模型质量。
再进一步地,所述步骤S2包括以下步骤:
S201、利用标准数据集训练卷积神经网络,并通过局部信息的聚合捕捉时序序列的整体信息,得到变量之间隐藏的局部相关性特征;
S202、利用所述标准数据集训练门控循环单元网络,获取时序序列的时间特征,得到时序特征;
S203、利用局部相关性特征和时序特征构建患者的单个特征。
上述进一步方案的有益效果是:在本发明中利用双通道神经网络模型提取了患者的变量局部相关特征和宏观时间特征,充分提取了反应患者差异性的特征,避免患者的差异性信息淹没在复杂数据中,充分考虑了不同患者的个性特征,提高对不同患者群体的用药效果预测的准确性。
再进一步地,所述步骤S3包括以下步骤:
S301、将患者的单个特征作为节点特征,得到节点特征构造;
S302、按共病类型将患者进行分类;
S303、根据分类结果,利用动态时间规整算法计算得到反应患者间的相似矩阵;
S304、基于相似矩阵,获取边信息,得到边结构的构造,并基于节点特征构造得到相似患者网络。
上述进一步方案的有益效果是:在本发明中基于患者的单个特征和相似度构造合理的相似患者网络,为后续利用图神经网络模型挖掘患者群体间的关联信息奠定基础。
再进一步地,所述步骤S303包括以下步骤:
S3031、根据分类结果以及患者前期用药效果指数,获取两个患者的时序序列X和Y,其中,X的长度为m,Y的长度为n,m=n;
S3032、对两条时序序列X和Y进行扫描,并通过计算时序序列X和Y间对应点的欧式距离得到带有距离值的矩阵网络,所述矩阵网络大小为m×n,矩阵网络中每个格点坐标表示为(i,j),i表示X的第i个时刻,j表示Y的第j个时刻;
S3033、在矩阵网络中寻找最优路径;
S3034、基于最优路径,在满足连续性和单调性的约束条件下,通过下式计算得到约束条件下的归整路径P:
P={p1,p2,…,pk}
其中,Pk表示矩阵网络搜索到的最优路径中的第k个格点;
S3035、基于归整路径P的规划策略,从矩阵网络的(0,0)处搜索至(m,n)处,并计算累加距离:
其中,distance(i,j)表示当前格点的累加距离,distance(i-1,j-1)表示当前格点左下方的格点累加距离,dist(Xi,Yj)表示当前格点的距离,distance(i-1,j)表示当前格点下方的格点累加距离,distance(1,j-1)表示当前格点左边的格点累加距离,min表示最小化运算;
S3036、根据累加距离构建患者间的相似矩阵。
上述进一步方案的有益效果是:通过构建患者间的相似矩阵,利用相似矩阵以及相似矩阵中反应相似度的信息完成相似患者网络边的构造。
再进一步地,所述步骤S4包括以下步骤:
S401、将相似患者网络作为图卷积网络的输入,其中,所述相似患者网络的空间结构反应了患者间的相似性;
S402、定义图卷积层的传播方式,通过对相似患者网络的空间结构进行卷积操作;
S403、基于图卷积层的传播方式,对归一化邻接矩阵进行计算,其中,所述邻接矩阵描述了患者节点之间的连接关系;
S404、基于步骤S403的计算结果,得到训练后的图卷积网络;
S405、基于训后的图卷积网络,计算激活函数ReLU,输出相似患者间的关联信息,并基于关联信息预测患者的用药效果。
上述进一步方案的有益效果是:将患者群体表示为图,其中将变量之间隐藏的局部相关性特征和时序特征表征为图节点特征,利用共病患者的前期用药效果之间的潜在关系信息作为边进行集成,更好提取了患者群体间的关联信息。解决了临床患者情况多样、药物干预方式复杂,仅仅提取时序特征难以分析患者群体之间的相关性的问题,通过引入相似患者信息,增强预测精确度,进而提高了用药效果预测的质量。
再进一步地,所述步骤S402中定义图卷积层的传播方式,其具体为:
其中,Q(l+1)表示图卷积层的传播方式,Q表示第一层的特征,σ表示激活函数ReLU,表示/>的度矩阵,/>表示描述图的连接性的邻接矩阵,Q(l)表示第l层的特征,W(l)表示第l层的权重参数矩阵,/>I表示单位矩阵,A表示描述图的连通性的矩阵。
上述进一步方案的有益效果是:将相似患者网络作为GCN的输入进行多患者间相似特征提取,使其可以同时获取以患者为中心的单个患者特性和相似关系特性,构建准确度较高的患者用药效果预测模型。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例
如图1所示,本发明提供了一种基于共病特征的用药效果预测方法,其实现方法如下:
S1、获取原始数据,并对原始数据进行处理得到标准数据集,其实现方法如下:
S101、获取原始数据;
S102、对原始数据进行抽取,并对抽取的原始数据进行填充和校正,得到患者信息数据和患者检查时序数据;
S103、对原始数据进行压缩,得到医嘱信息正确的数据;
S104、基于医嘱信息正确的数据,将长期医嘱按照给药时间进行展开,得到医嘱时序序列数据;
S105、将步骤S102至步骤S104得到的数据进行整合,得到标准数据集。
本实施例中,在临床医生指导下,根据相关筛选标准,对原始数据进行抽取,针对抽取后数据存在的不完整和不一致问题,利用缺失值填补和修正数据不一致性的方法进行填充和校正,得到抽取和清洗后的患者信息数据和患者检查时序数据;由于患者状况和实际用药不足等原因,临床医生多次下达临时医嘱,原始数据存在完全相同的重复数据,针对该情况,与医院后台核实,在临床医生指导下,进行数据压缩,得到医嘱信息正确的数据;针对所述医嘱信息正确的数据,患者在医院进行长期治疗,形成长期的医嘱数据,将长期医嘱按照给药时间进行展开,得到符合临床治疗的医嘱时序序列数据;将所述患者信息数据、患者检查时序数据、医嘱时序序列数据进行融合,构建患者队列,得到标准数据集。
本实施例中,原始数据来自医院提供的重症患者数据,数据分布不同数据库,包含无用、重复等数据,且涉及大量长期数据,需要进行预处理、序列生成等操作。
本实施例中,获取原始数据后,在重症监护室临床医生的指导下,根据相关标准,按照研究任务的需求进行数据抽取。抽取的主要依据如下:针对住院天数,根据平均住院时间,筛选连续住院12天的患者;针对年龄,参考医生建议,老年和未成年属于特殊群体,抽取年龄在18至65之间的患者加入研究队列;针对疾病分类,根据国内标准与临床医生共同完成疾病分类,将疾病分为三大类即创伤、外科系统疾病、内科系统疾病;针对实验室检验指标,选取可以表征用药效果且缺失率较小的实验室检验指标值;对用药效果指数,由专科医生根据患者状况和相应检验指标制订指数规则,按照规则得出每个患者的用药效果指数。过上述筛选标准进行抽取,得到抽取后的数据;
本实施例中,抽取后的数据存在数据缺失和数据不一致的问题,针对缺失数据,发现多数缺失数据由于医院数据抽取遗漏造成,根据医院查询结果直接将真实值补充填入表中;针对不一致的数据,除了数据缺失,原始数据中还有年龄、性别、疾病诊断、营养支持方式等不一致的数据,本文利用二值化、独热编码和标签编码进行处理;通过数据填补和修正,得到清洗后的数据。
本实施例中,临床上,由于患者的情况和实际用药不足等原因,临床医生时常调整临时医嘱,原始数据中存在完全相同的医嘱信息,该情况主要有两种情形,一种是医生下错医嘱,办公护士会根据与医生复核作废一条医嘱,另一种是医生下达医嘱后自觉用量不够进行临时追加,那么两条一模一样的医嘱复核无误后均会被执行,与医院后台确认信息的真实情况,如确实为此类重复数据就进行删除,经过数据压缩,可以获得一个医嘱正确的数据集;对于住院患者,会进行长期的药物干预治疗,在医嘱数据中存在长期数据,将原始数据集中长期医嘱按给药时间进行展开,构造符合临床营养治疗的时序序列,得到医嘱时序序列数据。
S2、利用标准数据集训练双通道神经网络模型,得到患者的单个特征,其实现方法如下:
S201、利用标准数据集训练卷积神经网络,并通过局部信息的聚合捕捉时序序列的整体信息,得到变量之间隐藏的局部相关性特征;
S202、利用所述标准数据集训练门控循环单元网络,获取时序序列的时间特征,得到时序特征;
S203、利用局部相关性特征和时序特征构建患者的单个特征。
本实施例中,利用标准数据集训练卷积神经网络模型,通过局部信息的聚合捕捉时序序列的整体信息,得到变量之间隐藏的局部相关性特征;利用标准数据集训练门控循环单元网络获取时序序列的时间特征,得到时序特征;单个患者特征由提取患者的微观变量间的相关性特征和时序特征拼接得到。
本实施例中,为了得到患者的全面特征,构造了CNN和GRU两个通道,CNN通过局部信息的聚合来捕捉时序序列的整体信息,用来获取重症患者时序序列的微观变量之间的相关性特征,GRU则用来获取时序数据时间特征。为确保两种信道的输入特性都能均衡地反映出各自的特征,通道采用两种大小相等的张量。
本实施例中,构造CNN通道,标准数据集的时序序列向量表示为表示第n个患者在t时刻的第d维的特征;对所述时序向量进行卷积操作,卷积核大小k为2;定义Xi:i+k-1为k个相邻特征构成的滑动窗口,逐步对所述滑动窗口进行卷积运算,对于第m个窗口,有如下计算:
cm=f(wei·xm:m+k-1+b)
其中,ci表示第m个窗口的卷积操作,权重向量表示为wei,通过反向传播算法进行更新,b为偏执向量,·为卷积运算,f为非线性函数,使用tanh。
经过所述运算,患者及相关特征c表示为:
c=[c1,c2,...,cn]
其中,cn表示第n维特征。
经过全连接层计算相应结果pi,得到特征向量Tens1={p1,p2,...,pd},d为输出向量的维度。
本实施例中,构造GRU通道,通过GRU的重置门和更新门来修改隐藏状态的计算方式;给定患者垂直拼接后形成营养支持时序序列输入xt,和上一时刻隐藏状态ht-1;根据公式:
resett=sigmoid(Wresetxt+Vreserht-1)
updatet=sigmoid(Wupdatext+Vupdateht-1)
计算重置门resett和更新门updatet,其中,sigmoid激活函数承担着将输出结果值变换为0-1之间的责任。
当前时刻节点隐藏状态在获取门控状态之后,首先重置门resett作用于上一时刻的隐含层的输出ht-1,实现信息状态的重置。再将其与输入样本xt一并乘以对应的偏置求和后,通过激活函数tanh激活即实现了对当前时刻节点即时信息ht-1的更新,具体公式如下:
通过tanh全连接层求出值域为[-1,1]的候选隐藏状态,其中⊙表示Hadamard乘积,W、V表示各个状态相对应的权重矩阵;
当前隐含层的输出。是通过更新门控制输出的,更新门可以进行遗忘和选择记忆两个操作,遗忘操作作用的对象是上个时刻隐含层的输出,选择记忆操作作用的对象是当前时刻节点隐藏状态,其具体公式为:
也就是通过更新门updatet和隐藏状态计算时刻t的隐藏状态ht;
为了从隐藏状态ht中提取时序特征,将ht输入到一个全连接层,应用sigmoid函数进行计算,将ht与权重矩阵w0相乘,在加上一个偏执向量bs,w0和bs是可学习的参数,通过反向传播算法自动学习得到,具体公式为:
st=sigmoid(W0·ht+bs)
计算输出时序特征st,经过完全连接层,得到特征向量Tens2={s1,s2,...,sd},d表示输出向量的维度。
S3、将患者的单个特征作为节点特征,以患者间相似程度连边构造网络得到相似患者网络,其实现方法如下:
S301、将患者的单个特征作为节点特征,得到节点特征构造;
S302、按共病类型将患者进行分类;
S303、根据分类结果,利用动态时间规整算法计算得到反应患者间的相似矩阵,其实现方法如下:
S3031、根据分类结果以及患者前期用药效果指数,获取两个患者的时序序列X和Y,其中,X的长度为m,Y的长度为n,m=n;
S3032、对两条时序序列X和Y进行扫描,并通过计算时序序列X和Y间对应点的欧式距离得到带有距离值的矩阵网络,所述矩阵网络大小为m×n,矩阵网络中每个格点坐标表示为(i,j),i表示X的第i个时刻,j表示Y的第j个时刻;
S3033、在矩阵网络中寻找最优路径;
S3034、基于最优路径,在满足连续性和单调性的约束条件下,通过下式计算得到约束条件下的归整路径P:
P={p1,p2,…,pk}
其中,Pk表示矩阵网络搜索到的最优路径中的第k个格点;
S3035、基于归整路径P的规划策略,从矩阵网络的(0,0)处搜索至(m,n)处,并计算累加距离:
其中,distance(i,j)表示当前格点的累加距离,distance(i-1,j-1)表示当前格点左下方的格点累加距离,dist(Xi,Yj)表示当前格点的距离,distance(i-1,j)表示当前格点下方的格点累加距离,distance(1,j-1)表示当前格点左边的格点累加距离,min表示最小化运算;
S3036、根据累加距离构建患者间的相似矩阵;
S304、基于相似矩阵,获取边信息,得到边结构的构造,并基于节点特征构造得到相似患者网络。
本实施例中,利用患者的单个特征作为节点特征,按照患者共病特征和前期用药效果分关,在此基础上,计算患者间的相似度,以患者间相似程度连边构造网络,得到相似患者网络。
本实施例中,为了挖掘患者群体间的关联,提高用药效果预测效率,并且挖掘类似患者之间营养支持治疗的潜在规律,关键在于构建合理的相似网络图。该图每个节点对应一个患者,节点特征利用单个患者特征进行表征,边结构则是利用同类患者间的相似性来表征。
本实施例中,节点特征构造:相似网络中每个患者节点都带有各自的属性,将双通道神经网络提取的患者单个特征即局部变量相关特征和时间依赖作为节点特征。
本实施例中,边构造:考虑到相似患者间共病特征和用药效果具有较多共性。因此,首先将患者按照疾病种类分为三大类:创伤、外科系统疾病、内科系统疾病。对于每类疾病中的患者,按照用药效果分为:完全改善、部分改善、维持稳定、暂时控制、无效,得到患者的分类;在所述分类的基础上利用时序相似度方法计算同种疾病的不同患者之间的相似性,得到相似网络图的邻接矩阵。采用动态时间规整算法(DynamicTimeWarping,DTW)进行计算,DTW是一种用所有相似点的距离来测量两个病人的时序序列的相似性的算法:
首先,定义两个患者的用药效果指数的时序序列分别是X={X1,X2,...,Xm}、Y={Y1,Y2,...,YN},X、Y的长度分别是m、n;DTW算法将矩阵视作单个网格,计算的X与Y的对齐点即通过的格点,通过网格的最佳路径,得到最优的序列路径;
根据公式:
Pk-1=(i,j),P=(i',j')i≤i'≤i+1,j≤j'≤j+1
计算归整路径距离:P={p1,p2,…,pk},其中,Pk为(i,j),i表示患者X中i时刻的用药效果指数,j表示患者Y中j时刻的用药效果指数;
确定累加距离distance,即从P1=(1,1)开始匹配X和Y,每次计算下一个点时把之前所有点的距离累加到一起,直到所有点都匹配完毕为止。序列X和Y的总体相似程度就表示为该distance;
根据公式:
其中,distance(i,j)表示当前格点的累加距离,distance(i-1,j-1)表示当前格点左下方的格点累加距离,dist(Xi,Yj)表示当前格点的距离,distance(i-1,j)表示当前格点下方的格点累加距离,distance(1,j-1)表示当前格点左边的格点累加距离,min表示最小化运算。
计算累加距离distance,其中,distance(i,j)为当前格点的距离dist(Xi,Yj),即两个时序序列X,Y中对应点Xi和Yj的欧式距离与到达当前格点的最小相邻元素的累积距离总和,该distance(i,j)构成患者间的相似矩阵;所述相似矩阵中的最后一个元素表示两个时序序列X、Y的相似度即患者间的相似度。
通过上述方法,构造每种疾病中相似患者子图g,该图g可以简单表述为:考虑一个共病患者群体,每个患者都由一组营养方式、患者静态信息(如性别、年龄)和疾病疗效描述/关联。该人群包括一组N个具有相同疾病的患者,表示为一个无向稀疏图g=(v,e,a);其中,a是描述图的连通性的邻接矩阵即上述定义的相似矩阵,每个患者由顶点v表示,边e描述了患者间的相似度,因此,相似网络图是具有节点属性信息的图。将上述形成的子图g融合,得到一个完整的患者相似网络。
S4、利用图卷积网络学习相似患者网络的空间结构,挖掘相似患者间的关联信息,并基于关联信息预测患者的用药效果,其实现方法如下:
S401、将相似患者网络作为图卷积网络的输入,其中,所述相似患者网络的空间结构反应了患者间的相似性;
S402、定义图卷积层的传播方式,通过对相似患者网络的空间结构进行卷积操作,以使相似患者之间的特征得到更好的交互和整合,挖掘相似患者间的关联信息,从而而支持模型最后进行准确地预测;
S403、基于图卷积层的传播方式,对归一化邻接矩阵进行计算,其中,所述邻接矩阵描述了患者节点之间的连接关系;
S404、基于步骤S403的计算结果,得到训练后的图卷积网络;
S405、基于训后的图卷积网络,计算激活函数ReLU,输出相似患者间的关联信息,并基于关联信息预测患者的用药效果。
本实施例中,图卷积网络模型将整个相似患者网络图作为输入,在训练过程中评估损失函数,采用逆向传播梯度衰减法对损失函数进行迭代优化,在测试集上计算ReLU激活函数,并输出相应节点的预测值。完整的相似患者网络定义为G=(V,E,A),V是所有患者的集合,E是所有边的集合,A是描述图的连通性的矩阵;患者的时序特征定义为XN×M,N表示每个患者即节点数量,M表示每个患者特征值的数量即时序特征向量维度,将X和A作为图卷积神经网络的输入;定义图卷积层传播方式:其中/>I表示单位矩阵,/>为/>的度矩阵,Q代表每一层的特征,若Q为输入层,则Q=X,σ为激活函数ReLU,W(l)为第l层的权重参数矩阵,传播方式由拉普拉斯矩阵进行计算,具体的公式是:
其中,Ssym表示图的拉普拉斯矩阵,In表示n维的单位矩阵。
本实施例中,对于归一化邻接矩阵计算,图卷积网络是将邻接矩阵本身两边分别乘以节点的度开方,并在此基础上取逆。在无向无权图中,deg(vx)和deg(vy)表示为x、y的度,对于每一个节点对(x,y)表示为:
其中,表示对称归一化拉普拉斯算子在位置(x,y)上的元素,反应了节点x、y之间的关系,x、y表示图结构中的两个节点。
本实施例中,图卷积完成后,通过一层输出维度为1的全连接层输出用药效果的预测结果。
本实施例中,本发明通过获取原始数据,并数据抽取及清洗、数据压缩及序列形成和数据融合等方法,得到标准数据集;利用标准数据集训练双通道神经网络模型,得到单个患者特征;利用单个患者特征作为节点特征,以患者间相似程度连边构造网络,得到相似患者网络;通过图卷积网络学习所述相似患者网络的空间结构,提取患者群体间的关联信息,预测患者的用药效果。本发明在构建的标准数据集的基础上,从患者单个特征和患者群体间相似性两方面提取时序序列的相关特征,挖掘更多深层次的信息,大幅提高用药效果预测的准确性,因此具有较高的应用价值。
Claims (7)
1.一种基于共病特征的用药效果预测方法,其特征在于,包括以下步骤:
S1、获取原始数据,并对原始数据进行处理得到标准数据集;
S2、利用标准数据集训练双通道神经网络模型,得到患者的单个特征;
S3、将患者的单个特征作为节点特征,以患者间相似程度连边构造网络得到相似患者网络;
S4、利用图卷积网络学习相似患者网络的空间结构,挖掘相似患者间的关联信息,并基于关联信息预测患者的用药效果。
2.根据权利要求1所述的基于共病特征的用药效果预测方法,其特征在于,所述步骤S1包括以下步骤:
S101、获取原始数据;
S102、对原始数据进行抽取,并对抽取的原始数据进行填充和校正,得到患者信息数据和患者检查时序数据;
S103、对原始数据进行压缩,得到医嘱信息正确的数据;
S104、基于医嘱信息正确的数据,将长期医嘱按照给药时间进行展开,得到医嘱时序序列数据;
S105、将步骤S102至步骤S104得到的数据进行整合,得到标准数据集。
3.根据权利要求1所述的基于共病特征的用药效果预测方法,其特征在于,所述步骤S2包括以下步骤:
S201、利用标准数据集训练卷积神经网络,并通过局部信息的聚合捕捉时序序列的整体信息,得到变量之间隐藏的局部相关性特征;
S202、利用所述标准数据集训练门控循环单元网络,获取时序序列的时间特征,得到时序特征;
S203、利用局部相关性特征和时序特征构建患者的单个特征。
4.根据权利要求1所述的基于共病特征的用药效果预测方法,其特征在于,所述步骤S3包括以下步骤:
S301、将患者的单个特征作为节点特征,得到节点特征构造;
S302、按共病类型将患者进行分类;
S303、根据分类结果,利用动态时间规整算法计算得到反应患者间的相似矩阵;
S304、基于相似矩阵,获取边信息,得到边结构的构造,并基于节点特征构造得到相似患者网络。
5.根据权利要求4所述的基于共病特征的用药效果预测方法,其特征在于,所述步骤S303包括以下步骤:
S3031、根据分类结果以及患者前期用药效果指数,获取两个患者的时序序列X和Y,其中,X的长度为m,Y的长度为n,m=n;
S3032、对两条时序序列X和Y进行扫描,并通过计算时序序列X和Y间对应点的欧式距离得到带有距离值的矩阵网络,所述矩阵网络大小为m×n,矩阵网络中每个格点坐标表示为(i,j),i表示X的第i个时刻,j表示Y的第j个时刻;
S3033、在矩阵网络中寻找最优路径;
S3034、基于最优路径,在满足连续性和单调性的约束条件下,通过下式计算得到约束条件下的归整路径P:
P={p1,p2,…,pk}
其中,Pk表示矩阵网络搜索到的最优路径中的第k个格点;
S3035、基于归整路径P的规划策略,从矩阵网络的(0,0)处搜索至(m,n)处,并计算累加距离:
其中,distance(i,j)表示当前格点的累加距离,distance(i-1,j-1)表示当前格点左下方的格点累加距离,dist(Xi,Yj)表示当前格点的距离,distance(i-1,j)表示当前格点下方的格点累加距离,distance(1,j-1)表示当前格点左边的格点累加距离,min表示最小化运算;
S3036、根据累加距离构建患者间的相似矩阵。
6.根据权利要求1所述的基于共病特征的用药效果预测方法,其特征在于,所述步骤S4包括以下步骤:
S401、将相似患者网络作为图卷积网络的输入,其中,所述相似患者网络的空间结构反应了患者间的相似性;
S402、定义图卷积层的传播方式,通过对相似患者网络的空间结构进行卷积操作;
S403、基于图卷积层的传播方式,对归一化邻接矩阵进行计算,其中,所述邻接矩阵描述了患者节点之间的连接关系;
S404、基于步骤S403的计算结果,得到训练后的图卷积网络;
S405、基于训后的图卷积网络,计算激活函数ReLU,输出相似患者间的关联信息,并基于关联信息预测患者的用药效果。
7.根据权利要求6所述的基于共病特征的用药效果预测方法,其特征在于,所述步骤S402中定义图卷积层的传播方式,其具体为:
其中,Q(l+1)表示图卷积层的传播方式,Q表示第一层的特征,σ表示激活函数ReLU,表示/>的度矩阵,/>表示描述图的连接性的邻接矩阵,Q(l)表示第l层的特征,W(l)表示第l层的权重参数矩阵,/>I表示单位矩阵,A表示描述图的连通性的矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310505434.6A CN116564553A (zh) | 2023-05-06 | 2023-05-06 | 一种基于共病特征的用药效果预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310505434.6A CN116564553A (zh) | 2023-05-06 | 2023-05-06 | 一种基于共病特征的用药效果预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116564553A true CN116564553A (zh) | 2023-08-08 |
Family
ID=87490967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310505434.6A Pending CN116564553A (zh) | 2023-05-06 | 2023-05-06 | 一种基于共病特征的用药效果预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564553A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079835A (zh) * | 2023-08-21 | 2023-11-17 | 广东工业大学 | 一种基于多视图的药物-药物相互作用预测方法及系统 |
CN118053591A (zh) * | 2024-04-16 | 2024-05-17 | 中国科学院苏州生物医学工程技术研究所 | 基于时变图卷积网络和图相似度计算的智能康复评估方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798954A (zh) * | 2020-06-11 | 2020-10-20 | 西北工业大学 | 基于时间注意力机制和图卷积网络的药物组合推荐方法 |
CN112883738A (zh) * | 2021-03-23 | 2021-06-01 | 西南交通大学 | 基于神经网络和自注意力机制的医学实体关系抽取方法 |
CN113077901A (zh) * | 2021-03-31 | 2021-07-06 | 厦门大学 | 一种电子病历分析装置和方法 |
CN113223656A (zh) * | 2021-05-28 | 2021-08-06 | 西北工业大学 | 一种基于深度学习的药物组合预测方法 |
-
2023
- 2023-05-06 CN CN202310505434.6A patent/CN116564553A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798954A (zh) * | 2020-06-11 | 2020-10-20 | 西北工业大学 | 基于时间注意力机制和图卷积网络的药物组合推荐方法 |
CN112883738A (zh) * | 2021-03-23 | 2021-06-01 | 西南交通大学 | 基于神经网络和自注意力机制的医学实体关系抽取方法 |
CN113077901A (zh) * | 2021-03-31 | 2021-07-06 | 厦门大学 | 一种电子病历分析装置和方法 |
CN113223656A (zh) * | 2021-05-28 | 2021-08-06 | 西北工业大学 | 一种基于深度学习的药物组合预测方法 |
Non-Patent Citations (2)
Title |
---|
CHANGCHANG YIN等: ""Identifying Sepsis Subphenotypes via Time-Aware Multi-Modal Auto-Encoder"", 《VIRTUAL EVENT》, 27 August 2020 (2020-08-27), pages 865 - 866 * |
崔永超: ""基于深度学习的临床合理用药推荐系统"", 《CNKI优秀硕士学位论文全文库》, no. 1, 15 January 2022 (2022-01-15), pages 13 - 16 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079835A (zh) * | 2023-08-21 | 2023-11-17 | 广东工业大学 | 一种基于多视图的药物-药物相互作用预测方法及系统 |
CN117079835B (zh) * | 2023-08-21 | 2024-02-20 | 广东工业大学 | 一种基于多视图的药物-药物相互作用预测方法及系统 |
CN118053591A (zh) * | 2024-04-16 | 2024-05-17 | 中国科学院苏州生物医学工程技术研究所 | 基于时变图卷积网络和图相似度计算的智能康复评估方法和系统 |
CN118053591B (zh) * | 2024-04-16 | 2024-06-11 | 中国科学院苏州生物医学工程技术研究所 | 基于时变图卷积网络和图相似度计算的智能康复评估方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220375611A1 (en) | Determination of health sciences recommendations | |
Yin et al. | Domain knowledge guided deep learning with electronic health records | |
CN116564553A (zh) | 一种基于共病特征的用药效果预测方法 | |
EP3306500A1 (en) | Method for analysing medical treatment data based on deep learning, and intelligent analyser thereof | |
CN104572583B (zh) | 用于数据致密化的方法和系统 | |
CN116364299B (zh) | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 | |
CN104021316B (zh) | 基于基因空间融合的矩阵分解对老药预测新适应症的方法 | |
CN113724876A (zh) | 基于多模态融合和dfs-lle算法的脑卒中院内并发症预测模型 | |
Zhang et al. | Medical diagnosis data mining based on improved Apriori algorithm | |
CN113160986B (zh) | 用于预测全身炎症反应综合征发展的模型构建方法及系统 | |
CN116072265B (zh) | 基于时间自注意力与动态图卷积的睡眠分期分析系统及方法 | |
Jazayeri et al. | Imputation of missing data in electronic health records based on patients’ similarities | |
CN111696661A (zh) | 患者分群模型构建方法、患者分群方法及相关设备 | |
Liu et al. | BrainTGL: A dynamic graph representation learning model for brain network analysis | |
CN109360658A (zh) | 一种基于词向量模型的疾病模式挖掘方法及装置 | |
CN115798711A (zh) | 基于反事实对比学习的慢性肾病诊疗决策支持系统 | |
Zhu et al. | Multi-modal non-euclidean brain network analysis with community detection and convolutional autoencoder | |
Sampath et al. | Ensemble Nonlinear Machine Learning Model for Chronic Kidney Diseases Prediction | |
CN117457192A (zh) | 智能远程诊断方法及系统 | |
CN117370565A (zh) | 一种信息检索方法及系统 | |
Mishu | A patient oriented framework using big data & c-means clustering for biomedical engineering applications | |
CN110993121A (zh) | 一种基于双协同线性流形的药物关联预测方法 | |
Li et al. | Patient multi-relational graph structure learning for diabetes clinical assistant diagnosis | |
CN116596836A (zh) | 基于多视图邻域证据熵的肺炎ct影像属性约简方法 | |
CN115602299A (zh) | 一种基于深度学习的icu辅助干预手段预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |