CN116631626A - 一种患者临床风险评估方法、装置、设备及介质 - Google Patents
一种患者临床风险评估方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116631626A CN116631626A CN202310676071.2A CN202310676071A CN116631626A CN 116631626 A CN116631626 A CN 116631626A CN 202310676071 A CN202310676071 A CN 202310676071A CN 116631626 A CN116631626 A CN 116631626A
- Authority
- CN
- China
- Prior art keywords
- representing
- patient
- offset
- representation
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012502 risk assessment Methods 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 125
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 27
- 230000004913 activation Effects 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 15
- 230000036541 health Effects 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000003875 gradient-accelerated spectroscopy Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000028399 Critical Illness Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 229940124446 critical care medicine Drugs 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pathology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本申请适用于数据处理技术领域,提供了一种患者临床风险评估方法、装置、设备及介质。该评估方法包括:对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;获取绝对偏移量,并获取绝对偏移量的绝对偏移量嵌入表示;获取相对偏移量,并获取相对偏移量的相对偏移量嵌入表示;对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量;利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。本申请的评估方法能提高风险评估的准确性。
Description
技术领域
本申请涉及数据处理技术领域,特别涉及一种患者临床风险评估方法、装置、设备及介质。
背景技术
重症监护病房(ICU,Intensive Care Unit)是应用重症医学科理论与现代化高科技医疗设备的特殊医疗场所,主要为收治急危重症的患者而开设,为避免外界的干扰与污染而采用封闭式设计。配备高端设备的ICU工作单元建造、运行与人力成本高昂,在ICU中的患者需要心电监测仪、呼吸机等多种先进医学设备的密切监护,以及重症医学科(CriticalCare Medicine)高水平医护人员24小时的轮班治疗与照顾。
ICU中的重症患者通常病情复杂多变,对这些患者健康状态的评估主要依赖于拥有丰富临床知识和经验的医护人员的主观判断,并且重症患者长期待在ICU中将会消耗大量的医疗费用和资源,这给ICU中诊疗决策带来了巨大的挑战。如何提高诊疗决策的及时性和准确性,减轻临床医护人员的工作负担,是改善ICU医疗服务质量,提高医疗资源利用率的关键问题之一。因此,如何设计有效的临床辅助决策模型,利用丰富的ICU临床数据对患者的病情做出及时准确的诊断,对于实现有效合理的治疗干预,改善重症患者的预后和提高进一步的治疗质量,提升医疗服务水平具有重要意义。在目前的临床实践预测任务中,人工智能模型通常以单个患者的数据作为输入,经过一系列的推理运算后输出对应患者的临床特征表示向量,该向量即为对应患者在计算机系统中的数据描述,用于对具体的患者疾病风险进行计算预测,现有的医学人工智能的预测存在着患者临床风险评估不够准确的问题。
申请内容
本申请提供了一种患者临床风险评估方法、装置、设备及介质,可以解决患者临床风险评估不够准确的问题。
第一方面,本申请实施例提供了一种患者临床风险评估方法,该评估方法包括:
对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,第T个时刻为当前时刻;
获取用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取绝对偏移量的绝对偏移量嵌入表示;
获取用于反映目标患者的生理指标的稳定性的相对偏移量,并获取相对偏移量的相对偏移量嵌入表示;
对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;
对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;
利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量;
利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
第二方面,本申请实施例提供了一种患者临床风险评估装置,该评估装置包括:
向量生成模块,用于对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,第T个时刻为当前时刻;
第一获取模块,获取用于反映目标患者的生理指标在当前时刻T的当前值与正常值的偏差程度的绝对偏移量,并获取绝对偏移量的绝对偏移量嵌入表示;
第二获取模块,获取用于反映目标患者的生理指标的稳定性的相对偏移量,并获取相对偏移量的相对偏移量嵌入表示;
第一特征提取模块,对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;
第二特征提取模块,对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;
融合模块,利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量;
评估模块,利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的患者临床风险评估方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的患者临床风险评估方法。
本申请的上述方案有如下的有益效果:
在本申请的实施例中,通过对目标患者的电子病例时序数据进行处理,生成患者初级表示向量,然后获取用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取绝对偏移量的绝对偏移量嵌入表示,同时获取用于反映目标患者的生理指标的稳定性的相对偏移量,并获取相对偏移量的相对偏移量嵌入表示,然后对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征,并对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征,然后利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量,最后利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。其中,用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量和用于反映目标患者的生理指标的稳定性的相对偏移量,对患者的表示直接性和精确性高,利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到最终患者表示向量,这种特征融合方式能够生成个性化的患者表示向量,提高表示向量的准确性,能够使患者临床风险评估足够准确。
本申请的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的患者临床风险评估方法的流程图;
图2为本申请一实施例提供的患者临床风险评估系统的框图;
图3为本申请一实施例提供的患者临床风险评估装置的结构示意图;
图4为本申请一实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
接下来对本申请提供的患者临床风险评估方法做示例性说明。
如图1所示,本申请提供的患者临床风险评估方法包括如下步骤:
步骤11,对目标患者的电子病例时序数据进行处理,生成患者初级表示向量。
上述电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,第T个时刻为当前时刻。
具体的,可通过公式h1,h2,…,ht,…,hT=TSM(d1,d2,…,dt,…dT)对目标患者的电子病例时序数据进行处理,得到患者初级表示向量hT。
该患者初级表示向量即为公式中当前时刻T上的医学隐藏表示hT。
其中,TSM表示对目标患者的电子病例时序数据进行处理的时间序列模型,ht表示第t个时刻的医学特征隐藏表示,dt表示目标患者的多个生理指标在第t个时刻的值,t=1,2,...,T。
需要说明的是,上述目标患者的电子病历时序数据中,每个时刻的电子病历时序数据dt由多个生理指标的值组成,即 表示第t个时刻的第i个生理指标的值,i=1,2,...,C,在本申请的一些实施例中,目标患者的电子病历时序数据可采用常见的采集方法采集得到,例如通过医疗设备检测得到。示例性的,上述多个生理指标可以包括血压、心率、体温等。
值得一提的是,通过时间序列建模方法对患者的电子病历时序数据中的动态特征进行捕获,生成患者初级表示向量,以便于后续步骤的计算。
步骤12,获取用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取绝对偏移量的绝对偏移量嵌入表示。
需要说明的是,正常值为理论上认定生理指标正常的值。
在本申请的一些实施例中,通过模仿医生处理患者生理指标当前值的异常偏移量时的思维和行为,计算当前值与正常值得到绝对偏移量,示例性的,若患者的血压当前值超出正常值,则表明该患者可能患有高血压。
值得一提的是,通过上述步骤得到的绝对偏移量能够直观且精确地反映患者生理指标当前值与正常值的偏离程度,而绝对偏移量的数学形式不利于后续计算,因此对绝对偏移量进行计算得到绝对偏移量嵌入表示,以便于后续计算。
步骤13,获取用于反映目标患者的生理指标的稳定性的相对偏移量,并获取相对偏移量的相对偏移量嵌入表示。
在本申请的一些实施例中,通过模仿医生处理患者生理指标的值的异常偏移量时的思维和行为,通过对生理指标的值进行计算得到相对偏移量,示例性的,若患者的心率当前值急剧上升或下降,则表面该患者可能患有为冠心病。
值得一提的是,通过上述步骤得到的相对偏移量能够直观且精确地反映生理指标的稳定性,而相对偏移量的数学形式不利于后续计算,因此对相对偏移量进行计算得到相对偏移量嵌入表示,以便于后续计算。
步骤14,对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征。
在本申请的一些实施例中,可利用长短期记忆网络(LSTM,Long Short TermMemory)模型对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征。
值得一提的是,绝对偏移量是当前生理指标异常程度的量化,异常时间越长,患者的病情就越差,利用LSTM模型对绝对偏移量嵌入表示进行特征提取,可以捕获患者病情的时序变化,突出患者的电子病例时序数据中的异常时间点,得到的绝对偏移量特征准确度高。
步骤15,对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征。
在本申请的一些实施例中,可利用多头自注意模型对相对偏移量嵌入表示进行特征提取。
值得一提的是,由于每个生理指标的采样间隔不规则,在数据预处理时需要在未采样的空白时间点上采用固定值(即最新值或平均值)填充数据,以保持固定的时间窗口大小。这可能导致相对偏移量在两个非零值之间包含大量的连续零值。因此,需要捕获具有较长时间间隔的两个非相邻且非零偏移量之间的相关性,而不是仅仅关注相邻时间点上偏移量之间的关系。然而,传统的循环神经网络并不能直接捕获非相邻时间点之间的相关性,在循环神经网络存储器单元中不断累积零值也可能逐渐稀释时间序列数据中的关键特征。为了解决这个问题,本申请的一些实施例中使用多头自注意力模型对相对偏移量进行特征提取,该模型能同时整合所有时间点上的特征信息,以增强长依赖特征的学习能力。此外,相对偏移量利用隐藏表示作为位置嵌入和补充信息,以此来保证多头自注意力模型能够进一步聚合到原始数据中的时序特征,提高相对偏移量特征的准确性。
步骤16,利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量。
在本申请的一些实施例中,利用患者初级表示向量对绝对偏移量嵌入表示进行计算,得到绝对偏移量特征权重,并利用初级表示向量对相对偏移量嵌入表示进行计算,得到相对偏移量特征权重,再通过绝对偏移量特征权重和相对偏移量特征权重对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量。
值得一提的是,利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行计算,能够充分挖掘绝对偏移量特征和相对偏移量特征之间的关系,基于绝对偏移量特征和相对偏移量特征之间的关系对二者进行融合,能够构建个性化且准确性高的患者最终表示向量。
步骤17,利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
在本申请的一些实施例中,上述临床风险评估模块可以为预测分类器:
其中,表示相关临床风险的预测结果,/>表示患者不存在相关临床风险,表示患者存在相关临床风险,σ表示Sigmoid激活函数,W(10)表示线性层,h(f)表示患者最终表示向量。
使用交叉熵损失作为损失函数进行反向传播参数更新,损失函数为:
其中,Loss表示患者数据的损失值,i=1,2,...,B,B表示患者数据的总数,yi表示该批次中第i个患者的真实结果,yi=0表示患者不存在相关临床风险,yi=1表示患者存在相关临床风险。
需要说明的是,患者最终表示向量可以用于疾病风险预测或者院内死亡风险预测等。
值得一提的是,计算得到用于反映生理指标与正常值的偏离程度的绝对偏移量和用于反映生理指标的稳定性的相对偏移量,对患者的表示直接性和精确性高,将两种向量特征和两种特征权重加权求和,得到最终患者表示向量,这种特征融合方式能够生成更个性化的患者表示向量,提高表示向量的准确性,能够使患者临床风险评估足够准确。
下面结合具体实施例对上述步骤12的具体步骤进行示例性说明。
在本申请的一些实施例中,上述步骤12的具体实现过程包括如下步骤:
步骤12.1,获取用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量。
通过公式计算用于反映目标患者的生理指标在当前时刻T的值与正常值的偏差程度的绝对偏移量。
其中,表示用于反映目标患者的第i个生理指标在第t个时刻的值与正常值的偏差程度的绝对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,T表示当前时间,/>表示第i个生理指标在第t个时刻的值,ni表示第i个生理指标对应的正常值,tanh()表示反三角非线性激活函数。
步骤12.2,获取绝对偏移量的绝对偏移量嵌入表示
在本申请的一些实施例中,可通过多尺度一维卷积的方式对绝对偏移量进行处理,得到多个生理指标在第t个时刻所对应的多个绝对偏移量组成的绝对偏移量嵌入表示矩阵的卷积结果Ea,t,具体计算公式为:
其中, 表示卷积核大小为k时多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果,RT×L表示/>的维度,L为向量维度大小,t=1,2,...,T,T表示当前时刻,Wk表示大小为k的卷积核,eq表示沿着时间维度以k个时刻为单位的Oa中的第q个片段,Oa表示多个生理指标对应的多个绝对偏移量组成的矩阵,q=1,2,...,Q,Q表示片段总数,bk为偏置参数,[·]为拼接操作,/>表示卷积核大小为3时多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果,/>表示卷积核大小为4时多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果,/>表示卷积核大小为5时多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果。
通过再矫正模块计算对Ea,t进行权重的重新分配计算,得到绝对偏移量嵌入表示。
具体的,通过公式计算在第t个时刻的绝对偏移量的绝对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵。
值得一提的是,通过上述步骤得到的绝对偏移量能够直观且精确地反映患者生理指标与正常值的偏离程度,而绝对偏移量的数学形式不利于后续计算,因此对多个生理指标所对应的多个绝对偏移量进行计算,得到绝对偏移量嵌入表示,以便于后续计算。
下面结合具体实施例对上述步骤13的具体步骤进行示例性说明。
在本申请的一下实施例中,上述步骤13的具体实现过程包括如下步骤:
13.1,获取用于反映目标患者的生理指标的稳定性的相对偏移量。
通过公式:
计算用于反映目标患者的生理指标的稳定性的相对偏移量;
其中,表示用于反映目标患者的第i个生理指标在第t个时刻的稳定性的相对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,T表示当前时刻,/>表示第i个生理指标在第t个时刻的值,/>表示第i个生理指标在t-1时刻的值,tanh()表示反三角非线性激活函数。
13.2,获取相对偏移量的相对偏移量嵌入表示
在本申请的一些实施例中,可通过多尺度一维卷积的方式对相对偏移量进行处理,得到多个生理指标在第t个时刻所对应的多个相对偏移量组成的相对偏移量嵌入表示矩阵的卷积结果Er,t,具体计算公式为:
其中, 表示卷积核大小为k时多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果,RT×L表示/>的维度,L为向量维度大小,t=1,2,...,T,T表示当前时刻,Wk表示大小为k的卷积核,eq表示沿着时间维度以k个时刻为单位的Oa中的第q个片段,Oa表示多个生理指标对应的多个相对偏移量组成的矩阵,q=1,2,...,Q,Q表示片段总数,bk为偏置参数,[·]为拼接操作,/>表示卷积核大小为3时多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果,/>表示卷积核大小为4时多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果,/>表示卷积核大小为5时多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果。
通过再矫正模块计算对Er,t进行权重的重新分配计算,得到相对偏移量嵌入表示。
具体的,通过公式计算在第t个时刻相对偏移量的相对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵。
值得一提的是,通过上述步骤得到的相对偏移量能够直观且精确地反映生理指标的稳定性,而相对偏移量的数学形式不利于后续计算,因此对多个生理指标所对应的多个绝对偏移量进行计算,得到相对偏移量嵌入表示,以便于后续计算。
下面结合具体实施例对上述步骤14的具体步骤进行示例性说明。
在本申请的一下实施例中,上述步骤14的具体实现过程包括如下步骤:
第一步,利用再矫正模块对患者的电子病例时序数据进行计算,得到在第t个时刻电子病例时序数据的嵌入表示具体的,计算公式如下:
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,dt表示目标患者的多个生理指标在第t个时刻的值。
第二步,利用LSTM模型时绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征h(a),且/>
需要说明的是,绝对偏移量特征h(a)为绝对偏移量嵌入表示在当前时刻T的引导表示
其中,表示绝对偏移量嵌入表示在第t个时刻的引导表示,/>表示绝对偏移量嵌入表示于t-1时刻的引导表示,t=1,2,...,T,T表示当前时刻,/>表示在第t个时刻绝对偏移量的绝对偏移量嵌入表示,LSTM()表示LSTM模型运算,[·]表示拼接操作。
值得一提的是,绝对偏移量是生理指标异常程度的量化,异常时间越长,患者的病情就越差,利用LSTM模型对绝对偏移量嵌入表示进行特征提取,可以捕获患者病情的时序变化,突出患者的电子病例时序数据中的异常时间点,得到的绝对偏移量特征准确度高。
下面结合具体实施例对上述步骤15的具体步骤进行示例性说明。
在本申请的一下实施例中,上述步骤15的具体实现过程包括如下步骤:
步骤15.1,通过公式计算多头自注意力的权重
其中,表示第g个头在第t个时刻的权重,g=1,2,...,G,G表示多头自注意力中头的总数量,Softmax()表示激活函数,/> 表示第g个头在第t个时刻的标准自注意力的查询向量,t=1,2,...,T,T表示当前时刻,W(g,q)表示参数矩阵,Yt表示在第t个时刻的相对偏移量和电子病例时序数据,/>W(5)表示参数矩阵,/>表示在第t个时刻相对偏移量的相对偏移量嵌入表示,ht表示在第t个时刻的患者原始数据,[·]表示拼接操作,/> 表示第g个头在第1个时刻的标准自注意力的键向量,W(g,k)表示参数矩阵,/>Y1表示在第1个时刻的相对偏移量和电子病例时序数据,/>表示在第1个时刻相对偏移量的相对偏移量嵌入表示,h1表示在第1个时刻的医学特征隐藏表示,/> 表示第g个头在当前时刻T的标准自注意力的键向量,/>YT表示在当前时刻T的相对偏移量和电子病例时序数据,/>表示在当前时刻T的相对偏移重的相对偏移重嵌入表示,hT表示患者初级表示向量,S表示向量维度的总数量。
步骤15.2,通过公式:
计算相对偏移量自注意力表示
其中,表示在第t个时刻的相对偏移量自注意力表示,/>表示第1个头在第t个时刻的的权重,/>表示第1个头在第t个时刻的标准自注意力的值向量,/>W(1 ,v)表示参数矩阵,/>表示第G个头在第t个时刻的权重,/>表示第G个头在第t个时刻的标准自注意力的值向量,/>W(G,v)表示参数矩阵,Tran表示转置操作,||表示拼接操作。
步骤15.3,通过公式:
计算相对偏移量特征h(r)。
值得一提的是,由于每个生理指标的采样间隔不规则,在数据预处理时需要在未采样的空白时间点上采用固定值(即最新值或平均值)填充数据,以保持固定的时间窗口大小。这可能导致相对偏移量在两个非零值之间包含大量的连续零值。因此,需要捕获具有较长时间间隔的两个非相邻且非零偏移量之间的相关性,而不是仅仅关注相邻时间点上偏移量之间的关系。然而,传统的循环神经网络并不能直接捕获非相邻时间点之间的相关性,在循环神经网络存储器单元中不断累积零值也可能逐渐稀释时间序列数据中的关键特征。因此,使用多头自注意力模型对相对偏移量进行特征提取,该模型能同时整合所有时间点上的特征信息,以增强长依赖特征的学习能力。此外,相对偏移量利用隐藏表示作为位置嵌入和补充信息,以此来保证多头自注意力模型能够进一步聚合到原始数据中的时序特征,提高相对偏移量特征的准确性。
下面结合具体实施例对上述步骤16的具体步骤进行示例性说明。
在本申请的一下实施例中,上述步骤16的具体实现过程包括如下步骤:
步骤16.1,利用患者初级表示向量计算绝对偏移量特征权重。
具体的,通过公式:
计算在第t个时刻绝对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,hT表示患者初级表示向量,W(6)表示线性层,L表示向量维度大小,Softmax()表示激活函数,表示第t个时刻的绝对偏移量嵌入表示,t=1,2,...,T,T表示当前时刻;
通过公式计算绝对偏移量的上下文特征ka;
通过公式μ(a)=σ(W(8)ka)计算绝对偏移量特征权重μ(a)。
其中,W(8)表示线性层。
步骤16.2,利用患者初级表示向量计算相对偏移量特征权重。
具体的,通过公式:
计算在第t个时刻相对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,W(7)表示线性层,表示第t个时刻的相对偏移量嵌入表示;
通过公式计算相对偏移量的上下文特征kx;
通过公式μ(r)=σ(W(9)kr)计算相对偏移量特征权重μ(r);
其中,W(9)表示线性层。
步骤16.3,通过绝对偏移量特征权重和相对偏移量特征权重对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量。
具体的,通过公式:
计算患者最终表示向量h(f)。
其中,h(a)表示绝对偏移量特征,h(r)表示相对偏移量特征。
值得一提的是,利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行计算,能够充分挖掘绝对偏移量特征和相对偏移量特征之间的关系,基于绝对偏移量特征和相对偏移量特征之间的关系对二者进行融合,能够构建个性化且准确性高的患者最终表示向量。
下面结合一具体实例对上述患者临床风险评估方法进行示例性说明。
如图2所示,本申请一具体示例提供的患者临床风险评估系统的工作流程为,时序数据(即上述患者的电子病例时序数据)进入时序嵌入模块,通过时序模型的计算,得到患者初级表示向量,该患者表示向量进入自适应模块中。同时时序数据进入绝对偏移量表示模块中,经过其中的绝对偏移量提取器,得到绝对偏移量,绝对偏移量经过一维卷积神经网络和再矫正模块的计算,得到绝对偏移量嵌入表示,绝对偏移量嵌入表示经过LSTM的计算,得到绝对偏移量特征,同时该绝对偏移量嵌入表示进入自适应模块,与患者初级表示向量一起计算,得到绝对偏移量特征权重。时序数据进入相对偏移量表示模块中,经过其中的相对偏移量提取器,得到相对偏移量,相对偏移量经过一维卷积神经网络和再矫正模块的计算,得到相对偏移量嵌入表示,相对偏移量嵌入表示经过多头自注意力的计算,得到相对偏移量特征,同时该相对偏移量嵌入表示进入自适应模块,与患者初级表示向量一起计算,得到相对偏移量特征权重。在自适应融合模块中,对上述绝对偏移量特征权重、相对偏移量特征权重、绝对偏移量特征和相对偏移量特征进行计算,得到患者最终表示向量,并将患者最终表示向量传递给预测模块,患者最终表示向量经过预测模块中的多层感知机,得到预测结果。
值得一提的是,上述系统能够很好地实现本申请提供的患者临床风险评估方法,并得到评估结果。
基于上述系统对本申请提供的患者临床风险评估方法进行实验验证。
MIMIC-III数据集是一个大型数据库,记录了2001年至2012年间入住医疗中心重症监护室的40000多名患者相关的健康相关数据,本实验采用MIMIC-III数据集标准化后的数据预测患者的院内死亡风险。使用患者进入重症监护室的前48小时的时间窗口,从患者实时生命体征表和患者实时实验室测试结果表中收集17个生理指标,使用的标签为患者是否发生院内死亡。本实验将数据集随机分成训练集、验证集和测试集,比例为60%:10%:30%。
eICU-CRD数据集是一个多中心数据库,包含2014年至2015年间全美超过200000名重症监护室住院患者的健康数据。本实验基于eICU-CRD数据进行死亡率预测,使用患者进入重症监护室的前24小时的时间窗口。本实验从eICU-CRD数据集标准化后的数据表中选定14个生理指标,并过滤掉时间序列长度小于24的样本,使用的标签为患者是否发生院内死亡。分为训练集、验证集和测试集,比例为60%:10%:30%。
使用召回和精度的调和平均值(F1-Score)、特征曲线下面积(AUROC,AreaUnderthe Receiver Operating Characteristic Curve)、精确-召回曲线下的区域(AUPRC,AreaUnderthe Precision-recall Curve)以及灵敏度和精确率的最小值Min(Se,P+)来评估PARSE和每个基线模型,上述4个评价指标均为数值越大说明预测性能越好。
F1-Score是判断二元分类方法性能的最直接评估度量,AUROC和AUPRC是处理二元分类任务中不平衡数据集时信息量更大的评估度量。Min(Se,P+)为召回曲线上Min(灵敏度,精确率)的最大值。F1-Score定义如下:
其中TP、FN和FP分别为以0.5为阈值的混淆矩阵中真阴性、假阴性和假阳性数量。
除了上述的数据采用和评估参数,本实验还选用了若干个先进的模型作为对比的基线模型,门控循环单元(GRU,gated recurrent unit):可以从时间序列数据中学习长期特征。RETAIN:通过以相反的时间顺序查看电子健康记录(EHR,electronic healthrecord)数据来模仿医生的实际诊断过程,并使用两级注意力来生成患者的表示。Dipole:使用双向长短期记忆网络(Bi-LSTM,Bi-directional Long Short-Term Memory)来学习患者诊断数据的时间特征,并引入就诊级别的注意力以提取出时序依赖特征。Transformer:引入了多头自注意力机制,以捕获时间序列数据中时间步之间的关系。在本实验中,使用Transformer的编码器部分和平均运算来生成患者的表示。ConCare:使用GRU为每个临床变量(包括时间序列数据和静态数据)建模时间感知特征,然后应用多头自注意力机制来聚合所有特征。为了公平比较,本实验使用仅以时间序列数据作为输入的版本ConCareMC-。AdaCare:使用具有多尺度感受野的空洞卷积来提取局部时序临床特征,并应用GRU来捕获时间步之间的时序依赖性。贪心随机自适应搜索算法(GRASP,Greedy RandomizedAdaptive Search Procedures):同时考虑当前患者的临床信息和使用K均值(K-Means)算法从相似患者中提取的辅助信息,以提高患者表示的准确性。在本实验中,根据原论文中的对比实验结果,采用ConCare作为GRASP中时间特征提取模块的骨干模型。
为了更好地验证本申请的性能,对图2的患者临床风险评估系统,本实验实现了三个不同版本,它们分别在时序嵌入模块中使用不同的时间序列模型来获得初级的时序特征,并分别命名为PARSE(GRU)、PARSE(Trans.)、PARSE(AdaCare)。
本实验的结果如下表所示。
可以看出,本申请提供的患者临床风险评估方法能够使患者临床风险评估足够准确。
下面对本申请提供的患者临床风险评估装置进行示例性说明。
如图3所示,本申请实施例提供了一种患者临床风险评估装置,该患者临床风险评估装置300,包括:向量生成模块301、第一获取模块302、第二获取模块303、第一特征提取模块304、第二特征提取模块305、融合模块306、评估模块307。
其中,向量生成模块301,用于对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,T时刻为当前时刻;
第一获取模块302,用于对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,T时刻为当前时刻;
第二获取模块303,用于获取用于反映目标患者的生理指标的稳定性的相对偏移量,并获取相对偏移量的相对偏移量嵌入表示;
第一特征提取模块304,用于对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;
第二特征提取模块305,用于对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;
融合模块306,用于利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量;
评估模块307,用于利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
可选的,向量生成模块301包括向量生成单元,所述向量生成单元,用于通过公式h1,h2,...,ht,...,hT=TSM(d1,d2,...,dt,...dT)对目标患者的电子病例时序数据进行处理,得到患者初级表示向量hT;
其中,TSM表示对目标患者的电子病例时序数据进行处理的时间序列模型,ht表示第t个时刻的医学特征隐藏表示,dt表示目标患者的多个生理指标在第t个时刻的值,t=1,2,...,T。
可选的,第一获取模块302包括第一计算单元和第二计算单元;
所述第一计算单元,用于通过公式计算用于反映目标患者的生理指标在当前时刻T的值与正常值的偏差程度的绝对偏移量;
其中,表示用于反映目标患者的第i个生理指标在第t个时刻的值与正常值的偏差程度的绝对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,T表示当前时刻,/>表示第i个生理指标在第t个时刻的值,ni表示第i个生理指标对应的正常值,tanh()表示反三角非线性激活函数;
所述第二计算单元,用于通过公式计算在第t个时刻的绝对偏移量的绝对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,Ea,t表示多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果。
可选的,第二获取模块303包括第一计算单元和第二计算单元,
所述第一计算单元,用于通过公式:
计算用于反映目标患者的生理指标的稳定性的相对偏移量;
其中,表示用于反映目标患者的第i个生理指标在第t个时刻的稳定性的相对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,T表示当前时刻,/>表示第i个生理指标在第t个时刻的值,/>表示第i个生理指标在t-1时刻的值,tanh()表示反三角非线性激活函数;
所述第二计算单元,用于通过公式计算在第t个时刻相对偏移量的相对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,Er,t表示多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果。
可选的,第一特征提取模块304包括第一特征提取单元,所述第一特征提取单元,用于利用LSTM模型对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征h(a),且/>
其中,表示绝对偏移量嵌入表示在第t个时刻的引导表示,/>表示绝对偏移量嵌入表示于t-1时刻的引导表示,/>表示绝对偏移量嵌入表示于当前时刻T的引导表示,t=1,2,...,T,/>表示在第t个时刻绝对偏移量的绝对偏移量嵌入表示,/>表示在第t个时刻电子病例时序数据的嵌入表示,LSTM()表示LSTM模型运算,[·]表示拼接操作。
可选的,第二特征提取模块305包括第一计算单元、第二计算单元和第三计算单元;
所述第一计算单元,用于通过公式计算多头自注意力的权重
其中,表示第g个头在第t个时刻的权重,g=1,2,...,G,G表示多头自注意力中头的总数量,Softmax()表示激活函数,/> 表示第g个头在第t个时刻的标准自注意力的查询向量,t=1,2,...,T,T表示当前时刻,W(g,q)表示参数矩阵,Yt表示在第t个时刻的相对偏移量和电子病例时序数据,/>W(5)表示参数矩阵,/>表示在第t个时刻相对偏移量的相对偏移量嵌入表示,ht表示在第t个时刻的患者原始数据,[·]表示拼接操作,/> 表示第g个头在第1个时刻的标准自注意力的键向量,W(g,k)表示参数矩阵,/>Y1表示在第1个时刻的相对偏移量和电子病例时序数据,/>表示在第1个时刻相对偏移量的相对偏移量嵌入表示,h1表示在第1个时刻的医学特征隐藏表示,/> 表示第g个头在当前时刻T的标准自注意力的键向量,/>YT表示在当前时刻T的相对偏移量和电子病例时序数据,/>表示在当前时刻T的相对偏移量的相对偏移量嵌入表示,hT表示患者初级表示向量,S表示向量维度的总数量;
所述第二计算单元,用于通过公式:
计算相对偏移量自注意力表示
其中,表示在第t个时刻的相对偏移量自注意力表示,/>表示第1个头在第t个时刻的的权重,/>表示第1个头在第t个时刻的标准自注意力的值向量,/>W(1,v)表示参数矩阵,/>表示第G个头在第t个时刻的权重,/>表示第G个头在第t个时刻的标准自注意力的值向量,/>W(G,v)表示参数矩阵,Tran表示转置操作,||表示拼接操作;
所述第三计算单元,用于通过公式:
计算相对偏移量特征h(r)。
可选的,融合模块306包括融合单元,所述融合单元,
所述第一计算单元,用于通过公式:
计算在第t个时刻绝对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,hT表示患者初级表示向量,W(6)表示线性层,L表示向量维度大小,Softmax()表示激活函数,表示第t个时刻的绝对偏移量的绝对偏移量嵌入表示,t=1,2,...,T,T表示当前时刻;
通过公式计算绝对偏移量的上下文特征ka;
通过公式μ(a)=σ(W(8)ka)计算绝对偏移量特征权重μ(a);
其中,W(8)表示线性层;
所述第二计算单元,用于通过公式:
计算在第t个时刻相对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,W(7)表示线性层,表示第t个时刻的相对偏移量的相对偏移量嵌入表示;
通过公式计算相对偏移量的上下文特征kr;
通过公式μ(r)=σ(W(9)kr)计算相对偏移量特征权重μ(r);
其中,W(9)表示线性层;
所述第三计算单元,用于通过公式:
计算患者最终表示向量h(f);
其中,h(a)表示绝对偏移量特征,h(r)表示相对偏移量特征。
可选的,评估模块307包括评估单元,所述评估单元,用于利用临床风险评估模块对患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
如图4所示,本申请的实施例提供了一种终端设备,该实施例的终端设备D10包括:至少一个处理器D100(图4中仅示出一个处理器)、存储器D101以及存储在所述存储器D101中并可在所述至少一个处理器D100上运行的计算机程序D102,所述处理器D100执行所述计算机程序D102时实现上述任意各个方法实施例中的步骤。
具体的,所述处理器D100执行所述计算机程序D102时,用于实现对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;获取用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取绝对偏移量的绝对偏移量嵌入表示;获取用于反映目标患者的生理指标的稳定性的相对偏移量,并获取相对偏移量的相对偏移量嵌入表示;对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;对相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到患者最终表示向量;利用临床风险评估模块对患者最终表示向量进行计算,得到患者的临床风险结果。
其中,电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,T时刻为当前时刻。
可选的,所述处理器D100执行所述计算机程序D102时,还用于实现通过公式h1,h2,...,ht,..,hT=TSM(d1,d2,...,dt,...dT)对目标患者的电子病例时序数据进行处理,得到患者初级表示向量hT。
其中,TSM表示对目标患者的电子病例时序数据进行处理的时间序列模型,ht表示第t个时刻的医学特征隐藏表示,dt表示目标患者的多个生理指标在第t个时刻的值,t=1,2,...,T。
可选的,所述处理器D100执行所述计算机程序D102时,还用于实现通过公式计算用于反映目标患者的生理指标在当前时刻T的值与正常值的偏差程度的绝对偏移量;
其中,表示用于反映目标患者的第i个生理指标在第t个时刻的值与正常值的偏差程度的绝对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,T表示当前时刻,/>表示第i个生理指标在第t个时刻的值,ni表示第i个生理指标对应的正常值,tanh()表示反三角非线性激活函数;
通过公式计算在第t个时刻的绝对偏移量的绝对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,Ea,t表示多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果。
可选的,所述处理器D100执行所述计算机程序D102时,还用于实现通过公式:
计算用于反映目标患者的生理指标的稳定性的相对偏移量;
其中,表示用于反映目标患者的第i个生理指标在第t个时刻的稳定性的相对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,T表示当前时刻,/>表示第i个生理指标在第t个时刻的值,/>表示第i个生理指标在t-1时刻的值,tanh()表示反三角非线性激活函数;
通过公式计算在第t个时刻相对偏移量的相对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,Er,t表示多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果。
可选的,所述处理器D100执行所述计算机程序D102时,还用于实现利用LSTM模型对绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征h(a),且/>
其中,表示绝对偏移量嵌入表示在第t个时刻的引导表示,/>表示绝对偏移量嵌入表示于t-1时刻的引导表示,/>表示绝对偏移量嵌入表示于当前时刻T的引导表示,t=1,2,...,T,/>表示在第t个时刻绝对偏移量的绝对偏移量嵌入表示,/>表示在第t个时刻电子病例时序数据的嵌入表示,LSTM()表示LSTM模型运算,[·]表示拼接操作。
可选的,所述处理器D100执行所述计算机程序D102时,还用于实现通过公式计算多头自注意力的权重
其中,表示第g个头在第t个时刻的权重,g=1,2,...,G,G表示多头自注意力中头的总数量,Softmax()表示激活函数,/> 表示第g个头在第t个时刻的标准自注意力的查询向量,t=1,2,...,T,T表示当前时刻,W(g,q)表示参数矩阵,Yt表示在第t个时刻的相对偏移量和电子病例时序数据,/>W(5)表示参数矩阵,/>表示在第t个时刻相对偏移量的相对偏移量嵌入表示,ht表示在第t个时刻的患者原始数据,[·]表示拼接操作,/> 表示第g个头在第1个时刻的标准自注意力的键向量,W(g,k)表示参数矩阵,/>Y1表示在第1个时刻的相对偏移量和电子病例时序数据,/>表示在第1个时刻相对偏移量的相对偏移量嵌入表示,h1表示在第1个时刻的医学特征隐藏表示,/> 表示第g个头在当前时刻T的标准自注意力的键向量,/>YT表示在当前时刻T的相对偏移量和电子病例时序数据,/>表示在当前时刻T的相对偏移量的相对偏移量嵌入表示,hT表示患者初级表示向量,S表示向量维度的总数量;
通过公式:
计算相对偏移量自注意力表示
其中,表示在第t个时刻的相对偏移量自注意力表示,/>表示第1个头在第t个时刻的的权重,/>表示第1个头在第t个时刻的标准自注意力的值向量,/>W(1 ,v)表示参数矩阵,/>表示第G个头在第t个时刻的权重,/>表示第G个头在第t个时刻的标准自注意力的值向量,/>W(G,v)表示参数矩阵,Tran表示转置操作,||表示拼接操作;
通过公式:
计算相对偏移量特征h(r)。
可选的,所述处理器D100执行所述计算机程序D102时,还用于实现通过公式:
计算在第t个时刻绝对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,hT表示患者初级表示向量,W(6)表示线性层,L表示向量维度大小,Softmax()表示激活函数,表示第t个时刻的所述绝对偏移量的绝对偏移量嵌入表示,t=1,2,...,T,T表示当前时刻;
通过公式计算绝对偏移量的上下文特征ka;
通过公式μ(a)=σ(W(8)ka)计算绝对偏移量特征权重μ(a);
其中,W(8)表示线性层;
通过公式:
计算在第t个时刻相对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,W(7)表示线性层,表示第t个时刻的相对偏移量的相对偏移量嵌入表示;
通过公式计算相对偏移量的上下文特征kr;
通过公式μ(r)=σ(W(9)kr)计算相对偏移量特征权重μ(r);
其中,W(9)表示线性层;
通过公式:
计算患者最终表示向量h(f);
其中,h(a)表示绝对偏移量特征,h(r)表示相对偏移量特征。
值得一提的是,由于用于反映目标患者的生理指标的值与正常值的偏差程度的绝对偏移量和用于反映目标患者的生理指标的稳定性的相对偏移量,对患者的表示直接性和精确性高,利用患者初级表示向量对绝对偏移量特征和相对偏移量特征进行融合,得到最终患者表示向量,这种特征融合方式能够生成个性化的患者表示向量,提高表示向量的准确性,能够使患者临床风险评估足够准确。
所称处理器D100可以是中央处理单元(CPU,Central Processing Unit),该处理器D100还可以是其他通用处理器、数字信号处理器(DSP,Digital Signal Processor)、专用集成电路(ASIC,Application Specific Integrated Circuit)、现成可编程门阵列(FPGA,Field-Programmable Gate Array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器D101在一些实施例中可以是所述终端设备D10的内部存储单元,例如终端设备D10的硬盘或内存。所述存储器D101在另一些实施例中也可以是所述终端设备D10的外部存储设备,例如所述终端设备D10上配备的插接式硬盘,智能存储卡(SMC,SmartMedia Card),安全数字(SD,Secure Digital)卡,闪存卡(Flash Card)等。进一步地,所述存储器D101还可以既包括所述终端设备D10的内部存储单元也包括外部存储设备。所述存储器D101用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器D101还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到患者临床风险评估方法装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种患者临床风险评估方法,其特征在于,包括:
对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;所述电子病例时序数据包括:所述目标患者的多个生理指标在T个时刻的值,第T个时刻为当前时刻;
获取用于反映所述目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取所述绝对偏移量的绝对偏移量嵌入表示;
获取用于反映所述目标患者的生理指标的稳定性的相对偏移量,并获取所述相对偏移量的相对偏移量嵌入表示;
对所述绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;
对所述相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;
利用所述患者初级表示向量对所述绝对偏移量特征和所述相对偏移量特征进行融合,得到患者最终表示向量;
利用临床风险评估模块对所述患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
2.根据权利要求1所述的评估方法,其特征在于,所述对目标患者的电子病例时序数据进行处理,生成患者初级表示向量,包括:
通过公式h1,h2,…,ht,…,hT=TSM(d1,d2,…,dt,…dT)对所述目标患者的电子病例时序数据进行处理,得到患者初级表示向量hT;
其中,TSM表示对所述目标患者的电子病例时序数据进行处理的时间序列模型,ht表示第t个时刻的医学特征隐藏表示,dt表示所述目标患者的多个生理指标在第t个时刻的值,t=1,2,...,T。
3.根据权利要求1所述的评估方法,其特征在于,所述获取用于反映所述目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取所述绝对偏移量的绝对偏移量嵌入表示,包括:
通过公式计算所述用于反映所述目标患者的生理指标的值与正常值的偏差程度的绝对偏移量;
其中,表示用于反映所述目标患者的第i个生理指标在第t个时刻的值与正常值的偏差程度的绝对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T/>表示第i个生理指标在第t个时刻的值,ni表示第i个生理指标对应的正常值,tanh()表示反三角非线性激活函数;
通过公式计算在第t个时刻的所述绝对偏移量的绝对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,Ea,t表示所述多个生理指标在第t个时刻所对应的多个绝对偏移量/>组成的绝对偏移量嵌入表示矩阵的卷积结果。
4.根据权利要求1所述的评估方法,其特征在于,所述获取用于反映所述目标患者的生理指标的稳定性的相对偏移量,并获取所述相对偏移量的相对偏移量嵌入表示,包括:
通过公式:
计算所述用于反映所述目标患者的生理指标的稳定性的相对偏移量;
其中,表示用于反映所述目标患者的第i个生理指标在第t个时刻的稳定性的相对偏移量,i=1,2,...,C,C表示生理指标的总数,t=1,2,...,T,/>表示第i个生理指标在第t个时刻的值,/>表示第i个生理指标在第t-1个时刻的值,tanh( )表示反三角非线性激活函数;
通过公式计算在第t个时刻所述相对偏移量的相对偏移量嵌入表示/>
其中,σ()和ReLU()均表示非线性激活函数,和/>均为参数矩阵,Er,t表示所述多个生理指标在第t个时刻所对应的多个相对偏移量/>组成的相对偏移量嵌入表示矩阵的卷积结果。
5.根据权利要求1所述的评估方法,其特征在于,所述对所述绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征包括:
利用LSTM模型对所述绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征h(a),且/>
其中,表示所述绝对偏移量嵌入表示在t时刻的引导表示,/>表示所述绝对偏移量嵌入表示于t-1时刻的引导表示,/>表示所述绝对偏移量嵌入表示于当前时刻T的引导表示,t=1,2,...,T,/>表示在第t个时刻所述绝对偏移量的绝对偏移量嵌入表示,/>表示在第t个时刻所述电子病例时序数据的嵌入表示,LSTM()表示LSTM模型运算,[·]表示拼接操作。
6.根据权利要求1所述的评估方法,其特征在于,所述对所述相对偏移量嵌入表示进行特征提取,得到相对偏移量特征,包括:
利用多头自注意模型对所述相对偏移量嵌入表示进行特征提取;
通过公式计算多头自注意力的权重
其中,表示第g个头在第t个时刻的权重,g=1,2,...,G,G表示多头自注意力中头的总数量,Softmax()表示激活函数,/> 表示第g个头在第t个时刻的标准自注意力的查询向量,t=1,2,...,T,T表示当前时刻,W(g,q)表示参数矩阵,Yt表示在第t个时刻的所述相对偏移量和所述电子病例时序数据,/>W(5)表示参数矩阵,/>表示在第t个时刻所述相对偏移量的相对偏移量嵌入表示,ht表示在第t个时刻的患者原始数据,[·]表示拼接操作,/> 表示第g个头在第1个时刻的标准自注意力的键向量,W(g,k)表示参数矩阵,/>Y1表示在第1个时刻的所述相对偏移量和所述电子病例时序数据,/>表示在第1个时刻所述相对偏移量的相对偏移量嵌入表示,h1表示在第1个时刻的医学特征隐藏表示,/> 表示第g个头在当前时刻T的标准自注意力的键向量,/>YT表示在当前时刻T的所述相对偏移量和所述电子病例时序数据,/>表示在当前时刻T的所述相对偏移量的相对偏移量嵌入表示,hT表示所述患者初级表示向量,S表示向量维度的总数量;
通过公式:
计算相对偏移量自注意力表示
其中,表示在第t个时刻的相对偏移量自注意力表示,/>表示第1个头在第t个时刻的的权重,/>表示第1个头在第t个时刻的标准自注意力的值向量,/>W(1,v)表示参数矩阵,/>表示第G个头在第t个时刻的权重,/>表示第G个头在第t个时刻的标准自注意力的值向量,/>W(G,v)表示参数矩阵,Tran表示转置操作,||表示拼接操作;
通过公式:
计算相对偏移量特征h(r)。
7.根据权利要求1所述的评估方法,其特征在于,所述利用所述患者初级表示向量对所述绝对偏移量特征和所述相对偏移量特征进行融合,得到患者最终表示向量,包括:
通过公式:
计算在第t个时刻所述绝对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,hT表示所述患者初级表示向量,W(6)表示线性层,L表示向量维度大小,Softmax()表示激活函数,表示第t个时刻的所述绝对偏移量的绝对偏移量嵌入表示,t=1,2,...,T,T表示当前时刻;
通过公式计算所述绝对偏移量的上下文特征ka;
通过公式μ(a)=σ(W(8)ka)计算所述绝对偏移量特征权重μ(a);
其中,W(8)表示线性层;
通过公式:
计算在第t个时刻所述相对偏移量的信息对患者最终健康状态的重要程度δa,t;
其中,W(7)表示线性层,表示第t个时刻的所述相对偏移量的相对偏移量嵌入表示;
通过公式计算所述相对偏移量的上下文特征kr;
通过公式μ(r)=σ(W(9)kr)计算所述相对偏移量特征权重μ(r);
其中,W(9)表示线性层;
通过公式:
计算所述患者最终表示向量h(f);
其中,h(a)表示所述绝对偏移量特征,h(r)表示所述相对偏移量特征。
8.一种基于时间序列数据的患者临床风险的评估装置,其特征在于,包括:
向量生成模块,用于对目标患者的电子病例时序数据进行处理,生成患者初级表示向量;电子病例时序数据包括:目标患者的多个生理指标在T个时刻的值,第T个时刻为当前时刻;
第一获取模块,用于获取用于反映所述目标患者的生理指标的值与正常值的偏差程度的绝对偏移量,并获取所述绝对偏移量的绝对偏移量嵌入表示;
第二获取模块,用于获取用于反映所述目标患者的生理指标的稳定性的相对偏移量,并获取所述相对偏移量的相对偏移量嵌入表示;
第一特征提取模块,用于对所述绝对偏移量嵌入表示进行特征提取,得到绝对偏移量特征;
第二特征提取模块,用于对所述相对偏移量嵌入表示进行特征提取,得到相对偏移量特征;
融合模块,利用所述患者初级表示向量对所述绝对偏移量特征和所述相对偏移量特征进行融合,得到患者最终表示向量;
评估模块,利用临床风险评估模块对所述患者最终表示向量进行计算,得到患者在当前时刻T的临床风险结果。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的患者临床风险评估方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的患者临床风险评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310676071.2A CN116631626A (zh) | 2023-06-08 | 2023-06-08 | 一种患者临床风险评估方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310676071.2A CN116631626A (zh) | 2023-06-08 | 2023-06-08 | 一种患者临床风险评估方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116631626A true CN116631626A (zh) | 2023-08-22 |
Family
ID=87641716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310676071.2A Pending CN116631626A (zh) | 2023-06-08 | 2023-06-08 | 一种患者临床风险评估方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116631626A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117612732A (zh) * | 2023-10-19 | 2024-02-27 | 江苏睿博信息科技股份有限公司 | 基于深度学习的多模态健康管理方案生成方法及其系统 |
-
2023
- 2023-06-08 CN CN202310676071.2A patent/CN116631626A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117612732A (zh) * | 2023-10-19 | 2024-02-27 | 江苏睿博信息科技股份有限公司 | 基于深度学习的多模态健康管理方案生成方法及其系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lyu et al. | A multimodal transformer: Fusing clinical notes with structured EHR data for interpretable in-hospital mortality prediction | |
Yu et al. | Monitoring ICU mortality risk with a long short-term memory recurrent neural network | |
Czabanski et al. | Detection of atrial fibrillation episodes in long-term heart rhythm signals using a support vector machine | |
CN109659033A (zh) | 一种基于循环神经网络的慢性疾病病情变化事件预测装置 | |
Sandhiya et al. | An effective disease prediction system using incremental feature selection and temporal convolutional neural network | |
JP2018068752A (ja) | 機械学習装置、機械学習方法及びプログラム | |
CN109171754B (zh) | 血糖预测模型的训练方法、装置、终端及存储介质 | |
US11182411B2 (en) | Combined data driven and knowledge driven analytics | |
CN116631626A (zh) | 一种患者临床风险评估方法、装置、设备及介质 | |
CN117438087A (zh) | 基于健康监测数据分析的健康管理方法及系统 | |
CN116864140A (zh) | 一种心内科术后护理监测数据处理方法及其系统 | |
CN118098482A (zh) | 基于5g技术的智慧医疗管理系统及方法 | |
CN113744845A (zh) | 基于人工智能的医学影像处理方法、装置、设备及介质 | |
Sheikhalishahi et al. | Benchmarking machine learning models on eICU critical care dataset | |
Shrestha et al. | Supervised machine learning for early predicting the sepsis patient: modified mean imputation and modified chi-square feature selection | |
Xiao et al. | A deep feature fusion network for fetal state assessment | |
Liao et al. | Recognizing diseases with multivariate physiological signals by a DeepCNN-LSTM network | |
Wu | Optimizing Diabetes Prediction with Machine Learning: Model Comparisons and Insights | |
CN116564539B (zh) | 基于信息抽取和实体归一的医学相似病例推荐方法和系统 | |
Kuila et al. | ECG signal classification using DEA with LSTM for arrhythmia detection | |
CN116543917A (zh) | 一种针对异构时间序列数据的信息挖掘方法 | |
Al-Shammary et al. | Efficient ECG classification based on the probabilistic Kullback-Leibler divergence | |
Konnova et al. | Convolutional neural networks application in cardiovascular decision support systems | |
Akbilgic et al. | Categorizing atrial fibrillation via symbolic pattern recognition | |
Turbé et al. | InterpretTime: a new approach for the systematic evaluation of neural-network interpretability in time series classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |