CN116434968B - 一种层级聚类约束的多标签细粒度术后并发症预测装置 - Google Patents

一种层级聚类约束的多标签细粒度术后并发症预测装置 Download PDF

Info

Publication number
CN116434968B
CN116434968B CN202310699832.6A CN202310699832A CN116434968B CN 116434968 B CN116434968 B CN 116434968B CN 202310699832 A CN202310699832 A CN 202310699832A CN 116434968 B CN116434968 B CN 116434968B
Authority
CN
China
Prior art keywords
fine
layer
prediction
complication
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310699832.6A
Other languages
English (en)
Other versions
CN116434968A (zh
Inventor
胡丹青
吴楠
程乐超
刘冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Beijing Cancer Hospital
Original Assignee
Zhejiang Lab
Beijing Cancer Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab, Beijing Cancer Hospital filed Critical Zhejiang Lab
Priority to CN202310699832.6A priority Critical patent/CN116434968B/zh
Publication of CN116434968A publication Critical patent/CN116434968A/zh
Application granted granted Critical
Publication of CN116434968B publication Critical patent/CN116434968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种层级聚类约束的多标签细粒度术后并发症预测装置,属于医疗数据挖掘领域,包括:根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;构建预测模型,包括底层网络、次层网络、中间网络、预测网络;构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;基于损失函数对预测模型进行参数优化;利用优化的预测模型进行术后并发症预测。该装置通过引入层级聚类图构建网络架构,进而预测精准度。

Description

一种层级聚类约束的多标签细粒度术后并发症预测装置
技术领域
本发明属于医疗数据挖掘领域,特别涉及癌症术后并发症预测方面,具体为一种层级聚类约束的多标签细粒度术后并发症预测装置。
背景技术
肺癌是一种急性疾病,其由细胞变异导致异常生长并可能侵袭周围组织器官,并远距离转移。对于早期肺癌,手术治疗是唯一实现根治的方法。但手术切除是有创治疗方式,会引发各种并发症,如肺部感染、肺不张、肺栓塞等,给术后患者带来了严重的伤害,同时增加了经济负担。
尽管众多研究利用患者术前及术中数据,结合统计学、机器学习方法,构建并发症预测模型已成为当今医疗领域的研究热点,但是现有的预测模型仍然存在一些问题。其中最突出的问题是缺乏细粒度的预测信息。大多数相关研究(Wang, C., Wang, S., Li, Z.et al. A Multiple-Center Nomogram to Predict Pneumonectomy Complication Riskfor Non-Small Cell Lung Cancer Patients. Ann Surg Oncol 29, 561–569 (2022).https://doi.org/10.1245/s10434-021-10504-1)将所有并发症合并在一起,而忽略了它们之间的差异性,这使得预测模型只能告诉医生患者是否存在并发症的风险,而无法具体指出哪些并发症可能发生。因此,这样的预测模型在临床实践中的实用性很有限。
此外,另外一个问题是现有技术中的预测模型未充分考虑细粒度术后并发症与是否发生并发症之间的约束关系,例如Alexander, B. et al. Assessing the utility ofdeep neural networks in predicting postoperative surgical complications: aretrospective study. The Lancet Digital Health 3, e471-e485 (2021). https://doi.org/10.1016/S2589-7500(21)00084-4。虽然一些研究采用了多标签分类方法来预测患者会发生哪些并发症,但是这些方法并没有考虑到不同并发症之间的相互制约关系。例如,某些并发症的发生可能导致其他并发症的发生概率降低,而某些并发症的发生则可能增加其他并发症的发生概率。因此,如果预测模型能够考虑到这些约束关系,就可以提高预测的准确性和可靠性,更好地指导医生进行临床决策。
发明内容
鉴于上述,为解决现有术后并发症预测中存在的问题,本发明提供一种层级聚类约束的多标签细粒度术后并发症预测方法和装置,通过引入层级聚类图构建网络架构,进而预测精准度。
为实现上述发明目的,本发明实施例提供了一种层级聚类约束的多标签细粒度术后并发症预测装置,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,处理器执行计算机程序时实现以下步骤:
根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;
构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;
基于损失函数对预测模型进行参数优化;
利用优化的预测模型进行术后并发症预测。
在一个实施例中,所述层次聚类图的构建采用团聚型层次聚类的方式,利用余弦距离或欧氏距离计算不同细粒度术后并发症之间的距离,然后利用全连接算法、单链接算法或平均连接算法对不同细粒度术后并发症进行层次聚类,构建每个系统并发症下各个细粒度有并发症之间的层次聚类图。
在一个实施例中,所述底层网络采用全连接层+ReLU激活函数或transformer编码层,通过全连接层+ReLU激活函数或transformer编码层对临床诊疗数据进行映射以获得底层隐藏特征,该底层隐藏特征作为次层网络的输入值;
所述次层网络的分支数量与系统并发症数量相等,每个分支采用全连接层+ReLU激活函数或transformer编码层,将底层隐藏特征映射为次层隐藏特征,该次层隐藏特征作为中间层网络的输入值。
在一个实施例中,所述中间网络包含多个子网络,每个子网络与一个系统并发症对应的层次聚类图对应,且子网络的拓扑关系与对应层次聚类图的拓扑关系相同,子网络的层数与层次聚类图的最大深度相等;
每个子网络采用全连接层+ReLU激活函数或transformer编码层,将输入的次层隐藏特征映射为中间隐藏特征,该中间隐藏特征作为预测网络的输入值。
在一个实施例中,所述预测网络包括映射层和相对应的Sigmoid激活函数,用于对输入的中间隐藏特征进行映射后再通过Sigmoid激活函数作非线性变换,预测并输出细粒度术后并发症概率。
在一个实施例中,所述基于次层隐藏特征预测的整体并发症概率通过以下方式得到:将所有次层网络隐藏特征拼接为次层拼接网络隐藏特征,通过映射层和相应的sigmoid层对次层拼接网络隐藏特征进行映射,预测并输出整体并发症概率。
在一个实施例中,所述预测损失包括:各细粒度术后并发症概率与各细粒度术后并发症的真实标签之间的二分类交叉熵损失,整体并发症概率与是否发生整体并发症的标签之间的二分类交叉熵损失。
在一个实施例中,是否发生整体并发症的标签通过以下方式获得:
利用各细粒度术后并发症的真实标签进行或运算,得到是否发生整体并发症的标签。
在一个实施例中,所述自下而上的层级约束损失的构建方式包括:当没有整体并发症发生时,不会有一项细粒度术后并发症,以此逻辑构建自下而上的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部;
所述自上而下的层级约束损失的构建方式包括:当有任意一项细粒度术后并发症发生时,会发生整体并发症,以此逻辑构建自上而下的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部。
为实现上述发明目的,实施例还提供了一种层级聚类约束的多标签细粒度术后并发症预测装置,包括数据获取单元、模型构建单元、损失函数构建单元、训练单元、应用单元,
所述数据获取单元用于根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
所述模型建构单元用于构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;
所述损失函数构建单元用于构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;
所述训练单元用于基于损失函数对预测模型进行参数优化;
所述应用单元用于利用优化的预测模型进行术后并发症预测。
与现有技术相比,本发明具有的有益效果至少包括:
首先利用医学先验知识将并发症按系统并发症这一大类进行分类;然后利用层级聚类构建每个系统并发症相对于各细粒度术后并发症的层次聚类图;再依据各层次聚类图构建网络架构,在构建损失函数时,通过添加是否发生整体并发症的辅助预测任务,并利用次层隐藏特征来进行预测;最后通过设计两种层级约束损失,来实现细粒度术后并发症与是否发生整体并发症之间的约束关系,从而可实现更为精准的细粒度术后并发症预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测方法的流程图;
图2是本发明实施例提供的构建层次聚类图的流程图;
图3是本发明实施例提供的层次聚类图的一个示例图;
图4是本发明实施例提供的预测模型的结构示意图;
图5是本发明实施例提供的预测模型的一个实例图;
图6是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测装置的结构图;
图7是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测装置的另一结构图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
本发明的发明构思为:为了解决现有技术中对细粒度术后并发症预测不精确的问题,本发明实施例提供了一种层级聚类约束的多标签细粒度术后并发症预测方法和装置,利用细粒度术后并发症之间的相关性以及与是否发生整体并发症之间的约束,来实现更为精准的细粒度术后并发症预测。
图1是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测方法的流程图。如图1所示,实施例提供的层级聚类约束的多标签细粒度术后并发症预测,包括以下步骤:
S110,根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图。
实施例中,针对待预测的Z种细粒度术后并发症,构建层次聚类图的过程包括:如图2所示,S1101,按照医学先验知识将多种细粒度术后并发症分类为不同系统并发症,例如分类为呼吸系统并发症、心血管系统并发症等N种不同系统并发症;S1102,利用层次聚类方法为每个系统并发症构建对应的层次聚类图,所有层次聚类图中的最大深度记为M。
具体地,为构建每个大类对应的系统并发症下,各细粒度术后并发症之间的相关关系,采用团聚型层次聚类(agglomerative)方式,利用余弦距离或欧氏距离计算不同细粒度术后并发症之间的距离,然后利用全连接算法、单链接算法或平均连接算法对不同细粒度术后并发症进行层次聚类,构建每个系统并发症下各个细粒度术后并发症之间的层次聚类图。
示例性地,利用上述S1101和S1102所示的层次聚类图构建方式,构建如图3所述的呼吸系统并发症的层次聚类图和心血管系统并发症的层次聚类图,其中,呼吸系统并发症的层次聚类图的深度为2,对应的细粒度术后并发症包括肺不张y1,哮喘发作y2,胸腔积液y3,肺部感染y4。心血管系统并发症的层次聚类图的深度为3,对应的细粒度术后并发症包括肺栓塞y5,神经脉血栓y6,心律失常y7,心绞痛y8
S120,构建预测模型,包括底层网络、次层网络、中间网络以及预测网络。
实施例中,根据每个系统并发症的层次聚类图构建预测模型,如图4所示,整个预测模型包括底层网络、次层网络、中间网络以及预测网络,其中,底层网络用于将临床诊疗数据映射为底层隐藏特征,次层网络与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征,中间网络与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征,预测网络用于依据各中间隐藏特征预测各细粒度术后并发症概率。
实施例中,底层网络采用全连接层+ReLU激活函数或transformer编码层,通过全连接层+ReLU激活函数或transformer编码层对临床诊疗数据进行映射以获得底层隐藏特征,该底层隐藏特征作为次层网络的输入值。
具体地,如图5所示,利用一层全连接层将原始的临床诊疗数据X进行映射,再 经过ReLU激活函数进行非线性变换,得到底层隐藏特征,对应整个预测模型的根节 点,其中的上标为网络的层数,小标为该层网络的个数。
实施例中,次层网络的分支数量与系统并发症数量相等,每个分支采用全连接层+ReLU激活函数或transformer编码层,将底层隐藏特征线性映射为次层隐藏特征,该次层隐藏特征作为中间层网络的输入值。
具体地,次层网络中,利用N个全连接层{,…,}将底层隐藏特征作为输入,将输出经过ReLU激活函数后,得到N个次层隐藏特征{,…,},对应于N个系统并发症的节点,也即对应N个层次聚类图的父节点。示例性地,如图 5所示,次层网络的分支数量为2,与呼吸系统并发症和心血管系统并发症两个系统并发症 的数量对应相等,即利用2个全连接层{}和ReLU激活函数将输入的底层隐藏特征映射得到2个次层隐藏特征{}。
实施例中,中间网络包含多个子网络,每个子网络与一个系统并发症对应的层次聚类图对应,且子网络的拓扑关系与对应层次聚类图的拓扑关系相同,子网络的层数与层次聚类图的最大深度相等;每个子网络采用全连接层+ReLU激活函数或transformer编码层,将输入的次层隐藏特征映射为中间隐藏特征,该中间隐藏特征作为预测网络的输入值。
具体地,根据每种系统并发症对应的次级隐藏特征{,…,}, 和每种系统并发症的层次聚类图,构建对应的中间网络。构建过程为:
(a)针对每个层次聚类图的每个最底层父节点,将父节点对应的隐藏特征 作为两个新网络层的输入,并经过ReLU激活函数变换后,得到关于两个分支的 第三层隐藏特征,分别利用遍历所有全部层级聚类图的所有父节点得到 全部第三层隐藏特征{,…,},
(b)判断当前隐藏特征层数m是否小于M+2。实施例中,步骤(b)为判断当前与层级聚类图对应的中间网络是否已经完成构建,即达到最大深度。若m小于M+2,则表明还有隐藏特征未达到最大深度,隐藏特征对应在层次聚类图中的节点还有非叶子节点,则执行(c)。若m等于M+2,则表明所有隐藏特征均对应于层次聚类图中的叶子节点,中间网络构建完成,则执行构建预测网络。
(c)判断当前第m层的隐藏特征是否均根据层次聚类图中对应节点的分裂情况来构建相应的网络结构。实施例中,步骤(c)判断当前第m层隐藏特征是否都根据层次聚类图中对应节点分类情况进行了特征提取处理。当还有未处理的隐藏特征时,则执行步骤(d)。如果均已特征提取处理时,则执行步骤(g)。
(d)针对当前未处理的隐藏特征,判断其在对应层次聚类图中节点的分裂 状态。实施例中,步骤(d)为根据层次聚类图中的分裂状态判断当前隐藏特征后续如何连接 新一层网络层。当当前隐藏特征对应的节点继续分裂时,则执行步骤(e)。若当前隐藏特征 对应的节点已经对应叶子节点,不在分裂时,则执行步骤(f)。
(e)针对第m层当前还未处理的隐藏特征,添加两个新网络层,得到 新隐藏特征。实施例中,步骤(e)通过两个网络层得到当前隐藏特征对 应的下一层分裂后的两个隐藏特征。
(f)针对第m层当前还未处理的隐藏特征,添加一个新网络层,得到新隐藏特 征。实施例中,步骤(f)通过一个网络层得到当前隐藏特征对应的下一层分裂后的 一个隐藏特征,保证提前成为叶子节点的隐藏特征也能经过最大层数的网络层。
(g)针对第m层所有的隐藏特征,都根据层次聚类图的分类状态进行处理,则将m+1赋值给m。实施例中,步骤(g)到最新隐藏特征层数,执行步骤(b)判断是否已经达到最深网络层数,即是否所有隐藏特征均对应于层次聚类图中的叶子节点。
经过上述步骤(a)-步骤(g)循环构建得到对应层次聚类图拓扑分类情况的中间网络,中间网络的每个网络层可以采用全连接层+ReLU激活函数或transformer编码层。
实施例中,预测网络包括映射层(如全连接层)和相对应的Sigmoid激活函数,用于对输入的中间隐藏特征进行映射后再通过Sigmoid激活函数作非线性变换,预测并输出细粒度术后并发症概率。
具体地,在构建得到Z个叶子节点的隐藏特征之后,分别连接一层全连接层和 sigmoid层,用于预测各个细粒度术后并发症概率, ,其中S为患者 样本数量,Z为细粒度术后并发症数量。
S130,构建损失函数,包括预测损失、自下而上的层级约束损失和自上而下的层级约束损失。
实施例中,构建的损失函数包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失。其中,基于次层隐藏特征预测的整体并发症概率通过以下方式得到:
将所有次层网络隐藏特征拼接为次层拼接网络隐藏特征,通过映射层(如全连接 层)和相应的sigmoid层对次层拼接网络隐藏特征进行映射,预测并输出整体并发症概率。 具体地,将次级层隐藏特征{,…,}进行拼接得到次层拼接网络隐藏 特征,之后连接一层映射层(如全连接层)和sigmoid层作为二分类辅助任务,基于 二分类辅助任务预测并输出是整体并发症概率,依据取值大小确定是否发生 整体并发症。
将整体并发症概率与是否发生整体并发症的标签之间的二分类交叉熵损失作为 预测损失的一部分,将各个细粒度并发症预测概率与各细粒度术后并发症的真实标 签之间的二分类交叉熵损失作为的另一部分,以此来构建预测损失
其中,整体并发症概率对应的是否发生整体并发症的标签通过以下方式获得:利用各细粒度术后并发症的真实标签进行或运算,得到是否发生整体并发症的标签。
实施例中,还根据各个细粒度并发症预测概率以及根据辅助任务是否发生整体并发症概率,构建层级约束损失函数,该层级约束损失函数包括自下而上的层级约束损失和自下而上的层级约束损失函数。
自下而上的层级约束损失的构建方式包括:当没有整体并发症发生时,不会有一 项细粒度术后并发症,以此逻辑构建自下而上的层级约束损失函数,构建过程中,选择任一 预测的细粒度术后并发症概率参与计算,并非全部。具体地,构建的自下而上的层级约束损 失用公式表示为:
自下而上的层级约束损失通过最小化优化时,使得底层是否发生整体 并发症的标签为0的患者样本,其对应的细粒度并发症概率也趋向于0。
自上而下的层级约束损失的构建方式包括:当有任意一项细粒度术后并发症发生 时,会发生整体并发症,以此逻辑构建自上而下的层级约束损失函数,构建过程中,选择任 一预测的细粒度术后并发症概率参与计算,并非全部。具体地,构建的自上而下的层级约束 损失用公式表示为:
自上而下的层级约束损失通过最小化优化时,使得顶层细粒度术后并 发症的真实标签为1的患者样本,其对应的整体并发症概率也趋向于1。
最终构建的损失函数为各损失的加权和,用公式表示为:
其中,为权重因子,控制两个层级约束损失对于预测模型的影响程度。
S140,基于损失函数对预测模型进行参数优化。
实施例中,将包含临床诊疗数据的数据集划分为训练数据和测试集,在训练数据上采用多重交叉验证,得到多组训练集和验证集。基于构建的损失函数利用训练集对预测模型以及构建辅助任务的网络层进行训练,并在验证集上进行提前终止防止过拟合。最后,将每一重交叉验证训练中在验证集上效果最好的预测模型进行集成作为最终的预测模型,将其输出结果平均最为最终的预测结果,并在测试集上进行验证。
S150,利用优化的预测模型进行术后并发症预测。
实施例中,在应用时,将临床诊疗数据输入至参数优化的预测模型中,经过计算得到各细粒度术后并发症概率和整体并发症概率。
对于现有并发症预测模型无法给出具体是什么并发症可能发生,欠缺临床实用性以及未充分考虑细粒度术后并发症与是否发生并发症之间的约束关系的问题,上述实施例提供的层级聚类约束的多标签细粒度术后并发症预测中,首先利用医学先验知识将并发症按大类进行分类,并在每一大类中利用层级聚类构建各个细粒度术后并发症的层次聚类图;然后依据各层次聚类图构建网络架构;接着添加是否发生并发症的辅助预测任务,并利用底层隐藏特征来进行预测;最后通过设计了两种层级约束损失函数,来实现细粒度术后并发症与是否发生并发症之间的约束关系。从而可实现更为精准的细粒度术后并发症预测。
基于同样的发明思路,实施例还提供了一种层级聚类约束的多标签细粒度术后并发症预测装置,如图6所示,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,处理器执行计算机程序时实现上述层级聚类约束的多标签细粒度术后并发症预测方法,包括以下步骤:
S110,根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
S120,构建预测模型,包括底层网络、次层网络、中间网络以及预测网络;
S130,构建损失函数,包括预测损失、自下而上的层级约束损失和自上而下的层级约束损失;
S140,基于损失函数对预测模型进行参数优化;
S150,利用优化的预测模型进行术后并发症预测。
实施例中,存储器可以为在近端的易失性存储器,如RAM,还可以是非易失性存储器,如ROM,FLASH,软盘,机械硬盘等,还可以是远端的存储云。处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)、或现场可编程门阵列(FPGA),即可以通过这些处理器实现层级聚类约束的多标签细粒度术后并发症预测方法的步骤。
基于同样的发明思路,如图7所示,实施例还提供了一种层级聚类约束的多标签细粒度术后并发症预测装置700,包括数据获取单元710、模型构建单元720、损失函数构建单元730、训练单元740、应用单元740,
其中,数据获取单元710用于根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;模型建构单元720用于构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;损失函数构建单元730用于构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;训练单元740用于基于损失函数对预测模型进行参数优化;应用单元750用于利用优化的预测模型进行术后并发症预测。
需要说明的是,上述实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测模型的构建装置在进行术后并发症预测时,应以上述各功能单元的划分进行举例说明,可以根据需要将上述功能分配由不同的功能单元完成,即在终端或服务器的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测装置与一种层级聚类约束的多标签细粒度术后并发症预测方法实施例属于同一构思,其具体实现过程详见一种层级聚类约束的多标签细粒度术后并发症预测方法实施例,这里不再赘述。
实施例还提供一个实验例对上一种层级聚类约束的多标签细粒度术后并发症预测方法进行验证。以验证方法的效果。获取临床诊疗数据作为数据集,该临床诊疗数据包括术后非小细胞肺癌患者的性别、年龄、吸烟史、饮酒史、肿瘤史、家族史、术前检查、术前治疗、手术方式、肿瘤大小、肿瘤位置、病理类型、淋巴结转移情况、术后pTNM分期等临床信息。根据患者术后在院期间是否发生肺不张、哮喘发作、胸腔积液、肺部感染、肺栓塞、深静脉血栓、心律失常、心绞痛的情况,定义八种细粒度术后并发症。然后将发生任意一种上述并发症的患者定义为发生并发症的患者。
实验例中选择全连接层作为预测模型构建过程中的网络层;采用3折交叉验证机 制将数据集划分为三组训练测试集;然后在每组训练测试集的训练集上采用4折交叉验证 来进行模型训练和超参选择,得到在验证集上性能最好的4个模型,将4个模型的结果平均 作为输出结果,在3折交叉验证中的每一折测试集上进行测试;采用受试者工作特征曲线下 面积(AUC)作为评估指标;同时单标签算法、多标签算法作为基线算法进行比较。实验结果 如表1所示。根据表1实验结果能够看到,本方法针对八种细粒度术后并发症以及是否发生 并发症所有九个预测问题,取得了最佳的综合预测性能,平均AUC值为0.654,显著超过其他 基线方法。特别地,将本发明方法的损失函数中去掉时,发现预测 效果会下降,证明了本发明提出的层级聚类约束的有效性。
表1实验结果
肺不张 胸腔积液 哮喘发作 肺部感染 肺栓塞 深静脉血栓 心律失常 心绞痛 平均值
LR 0.655 0.536 0.757 0.672 0.654 0.324 0.612 0.544 0.594
RF 0.627 0.602 0.541 0.709 0.368 0.275 0.611 0.483 0.527
SVM 0.497 0.501 0.483 0.467 0.470 0.695 0.526 0.391 0.504
MLARAM 0.535 0.439 0.419 0.489 0.401 0.581 0.553 0.479 0.487
MLKNN 0.519 0.457 0.547 0.509 0.486 0.475 0.540 0.467 0.500
CC 0.634 0.579 0.713 0.686 0.590 0.466 0.581 0.573 0.603
LP 0.579 0.582 0.682 0.699 0.652 0.472 0.572 0.575 0.602
RAKELD 0.615 0.575 0.603 0.670 0.707 0.516 0.574 0.559 0.602
本专利方法(无层级约束) 0.665 0.762 0.707 0.644 0.554 0.624 0.599 0.612 0.646
本专利方法 0.677 0.687 0.752 0.652 0.595 0.657 0.604 0.609 0.654
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种层级聚类约束的多标签细粒度术后并发症预测装置,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,其特征在于,处理器执行计算机程序时实现以下步骤:
根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;
构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;
基于损失函数对预测模型进行参数优化;
利用优化的预测模型进行术后并发症预测。
2.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述层次聚类图的构建采用团聚型层次聚类的方式,利用余弦距离或欧氏距离计算不同细粒度术后并发症之间的距离,然后利用全连接算法、单链接算法或平均连接算法对不同细粒度术后并发症进行层次聚类,构建每个系统并发症下各个细粒度有并发症之间的层次聚类图。
3.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述底层网络采用全连接层+ReLU激活函数或transformer编码层,通过全连接层+ReLU激活函数或transformer编码层对临床诊疗数据进行映射以获得底层隐藏特征,该底层隐藏特征作为次层网络的输入值;
所述次层网络的分支数量与系统并发症数量相等,每个分支采用全连接层+ReLU激活函数或transformer编码层,将底层隐藏特征映射为次层隐藏特征,该次层隐藏特征作为中间层网络的输入值。
4.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述中间网络包含多个子网络,每个子网络与一个系统并发症对应的层次聚类图对应,且子网络的拓扑关系与对应层次聚类图的拓扑关系相同,子网络的层数与层次聚类图的最大深度相等;
每个子网络采用全连接层+ReLU激活函数或transformer编码层,将输入的次层隐藏特征映射为中间隐藏特征,该中间隐藏特征作为预测网络的输入值。
5.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述预测网络包括映射层和相对应的Sigmoid激活函数,用于对输入的中间隐藏特征进行映射后再通过Sigmoid激活函数作非线性变换,预测并输出细粒度术后并发症概率。
6.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述基于次层隐藏特征预测的整体并发症概率通过以下方式得到:将所有次层网络隐藏特征拼接为次层拼接网络隐藏特征,通过映射层和相应的sigmoid层对次层拼接网络隐藏特征进行映射,预测并输出整体并发症概率。
7.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述预测损失包括:各细粒度术后并发症概率与各细粒度术后并发症的真实标签之间的二分类交叉熵损失,整体并发症概率与是否发生整体并发症的标签之间的二分类交叉熵损失。
8.根据权利要求7所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,是否发生整体并发症的标签通过以下方式获得:
利用各细粒度术后并发症的真实标签进行或运算,得到是否发生整体并发症的标签。
9.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述自下而上的层级约束损失的构建方式包括:当没有整体并发症发生时,不会有一项细粒度术后并发症,以此逻辑构建自下而上的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部;
所述自上而下的层级约束损失的构建方式包括:当有任意一项细粒度术后并发症发生时,会发生整体并发症,以此逻辑构建自上而下的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部。
10.一种层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,包括数据获取单元、模型构建单元、损失函数构建单元、训练单元、应用单元,
所述数据获取单元用于根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
所述模型建构单元用于构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;
所述损失函数构建单元用于构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;
所述训练单元用于基于损失函数对预测模型进行参数优化;
所述应用单元用于利用优化的预测模型进行术后并发症预测。
CN202310699832.6A 2023-06-14 2023-06-14 一种层级聚类约束的多标签细粒度术后并发症预测装置 Active CN116434968B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310699832.6A CN116434968B (zh) 2023-06-14 2023-06-14 一种层级聚类约束的多标签细粒度术后并发症预测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310699832.6A CN116434968B (zh) 2023-06-14 2023-06-14 一种层级聚类约束的多标签细粒度术后并发症预测装置

Publications (2)

Publication Number Publication Date
CN116434968A CN116434968A (zh) 2023-07-14
CN116434968B true CN116434968B (zh) 2023-08-25

Family

ID=87091154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310699832.6A Active CN116434968B (zh) 2023-06-14 2023-06-14 一种层级聚类约束的多标签细粒度术后并发症预测装置

Country Status (1)

Country Link
CN (1) CN116434968B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933284A (zh) * 2020-09-27 2020-11-13 平安科技(深圳)有限公司 一种并发症风险预测系统、方法、装置、设备及介质
CN113192633A (zh) * 2021-05-24 2021-07-30 山西大学 基于注意力机制的胃癌细粒度分类方法
WO2021152173A1 (en) * 2020-01-31 2021-08-05 Deutsches Zentrum Für Neurodegenerative Erkrankungen E.V. (Dzne) Methods for assigning a phenotypic signature for diagnostic and therapeutic applications
CN113724880A (zh) * 2021-11-03 2021-11-30 深圳先进技术研究院 一种异常脑连接预测系统、方法、装置及可读存储介质
CN114203306A (zh) * 2021-12-03 2022-03-18 医渡云(北京)技术有限公司 医疗事件预测模型训练方法、医疗事件预测方法及装置
CN115240803A (zh) * 2021-04-25 2022-10-25 华中科技大学同济医学院附属协和医院 模型训练方法、并发症预测方法及系统、设备和介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220199266A1 (en) * 2020-12-10 2022-06-23 DataRobot, Inc. Systems and methods for using machine learning with epidemiological modeling

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021152173A1 (en) * 2020-01-31 2021-08-05 Deutsches Zentrum Für Neurodegenerative Erkrankungen E.V. (Dzne) Methods for assigning a phenotypic signature for diagnostic and therapeutic applications
CN111933284A (zh) * 2020-09-27 2020-11-13 平安科技(深圳)有限公司 一种并发症风险预测系统、方法、装置、设备及介质
CN115240803A (zh) * 2021-04-25 2022-10-25 华中科技大学同济医学院附属协和医院 模型训练方法、并发症预测方法及系统、设备和介质
CN113192633A (zh) * 2021-05-24 2021-07-30 山西大学 基于注意力机制的胃癌细粒度分类方法
CN113724880A (zh) * 2021-11-03 2021-11-30 深圳先进技术研究院 一种异常脑连接预测系统、方法、装置及可读存储介质
CN114203306A (zh) * 2021-12-03 2022-03-18 医渡云(北京)技术有限公司 医疗事件预测模型训练方法、医疗事件预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Hierarchical cluster analysis based on diseaseassociated manifestations of patients with lymphangioleiomyomatosis: An analysis of the national database of designated intractable diseases of Japan";Mie Hayashida et al.;《respiratory investigation》;第60卷;第570-577页 *

Also Published As

Publication number Publication date
CN116434968A (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
Cosma et al. A survey on computational intelligence approaches for predictive modeling in prostate cancer
Pathan et al. Analyzing the impact of feature selection on the accuracy of heart disease prediction
Wang et al. A tree ensemble-based two-stage model for advanced-stage colorectal cancer survival prediction
Patil et al. Hybrid prediction model for type-2 diabetic patients
Austin et al. Logistic regression had superior performance compared with regression trees for predicting in-hospital mortality in patients hospitalized with heart failure
CN112633601B (zh) 疾病事件发生概率的预测方法、装置、设备及计算机介质
Saikumar et al. A machine intelligence technique for predicting cardiovascular disease (CVD) using Radiology Dataset
CN113113130A (zh) 一种肿瘤个体化诊疗方案推荐方法
CN114420309B (zh) 建立药物协同作用预测模型的方法、预测方法及对应装置
Ting et al. Decision tree based diagnostic system for moderate to severe obstructive sleep apnea
Theerthagiri Predictive analysis of cardiovascular disease using gradient boosting based learning and recursive feature elimination technique
Li et al. Predicting clinical outcomes with patient stratification via deep mixture neural networks
CN116259415A (zh) 一种基于机器学习的患者服药依从性预测方法
Nassif et al. Score as you lift (SAYL): A statistical relational learning approach to uplift modeling
Hossen Heart disease prediction using machine learning techniques
CN116434968B (zh) 一种层级聚类约束的多标签细粒度术后并发症预测装置
CN113990454A (zh) 基于联邦学习和特征提取的恶意行为识别方法
Vukicevic et al. Automated development of artificial neural networks for clinical purposes: Application for predicting the outcome of choledocholithiasis surgery
Mueller et al. Subgroup discovery for test selection: a novel approach and its application to breast cancer diagnosis
CN115985513A (zh) 一种基于多组学癌症分型的数据处理方法、装置及设备
AU2021102593A4 (en) A Method for Detection of a Disease
Sankaravadivel et al. Feature based analysis of endometriosis using machine learning
CN113936804A (zh) 一种肺癌切除术后持续漏气风险预测模型构建系统
Kudari Data analytics to predict, detect, and monitor chronic autoimmune diseases using machine learning algorithms: Preventing diseases with the power of machine learning
Bahrami et al. Heart attack detection in internet of things: modeling with health markov game theory

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant