CN117409968A - 基于层次注意力的癌症动态生存分析方法及系统 - Google Patents

基于层次注意力的癌症动态生存分析方法及系统 Download PDF

Info

Publication number
CN117409968A
CN117409968A CN202311408202.5A CN202311408202A CN117409968A CN 117409968 A CN117409968 A CN 117409968A CN 202311408202 A CN202311408202 A CN 202311408202A CN 117409968 A CN117409968 A CN 117409968A
Authority
CN
China
Prior art keywords
patient
cancer
time
survival
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311408202.5A
Other languages
English (en)
Other versions
CN117409968B (zh
Inventor
邱航
阳旭菻
陈翁祥
李妍初
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202311408202.5A priority Critical patent/CN117409968B/zh
Publication of CN117409968A publication Critical patent/CN117409968A/zh
Application granted granted Critical
Publication of CN117409968B publication Critical patent/CN117409968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0985Hyperparameter optimisation; Meta-learning; Learning-to-learn
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明属于医疗信息技术领域,公开了基于层次注意力的癌症动态生存分析方法及系统。本发明通过自适应区间算法可以自动计算出癌症患者需要进行预测的时间区间,缩短了模型的训练时间。同时,本发明使用基于层次注意力的癌症动态生存分析模型为不同时刻患者特征分配不同的注意力权重,从而能在长时间序列特征中提取到最为关键的信息,提高预测准确性。

Description

基于层次注意力的癌症动态生存分析方法及系统
技术领域
本发明属于医疗信息技术领域,具体涉及基于层次注意力的癌症动态生存分析方法及系统。
背景技术
癌症生存分析是指通过对患者的临床病理资料及其他生物学特征进行分析,预测患者在接下来的时间段内生存的概率。生存分析与传统分类和回归任务最大的不同在于纳入了删失患者的信息。对癌症患者的生存进行精准的预测可以帮助医生更好地制定治疗策略,提高患者的治疗效果和生存率。
生存分析方法分为统计学的方法,机器学习的方法和深度学习的方法这三类。Cox比例风险(CPH)是统计学方法中使用范围最广的生存分析方法,传统上经常被用来预测癌症患者未来的生存。但是,由于CPH存在比例风险和线性对数风险这两个较强的假设,因此难以适应现代海量的高纬数据。自上世纪90年代以来,由于机器学习具有处理非线性数据的能力,大量的基于机器学习的生存分析方法被用来代替CPH预测癌症患者的生存。近几年,神经网络因其表现出来的强大特征提取和特征交互能力,被越来越多的学者用来进行癌症生存分析。除此之外,一些学者还将图学习、对比学习和主动学习等技巧应用于癌症生存分析领域。
目前癌症生存分析方法有以下不足。第一:癌症患者在出院之后往往会经历多次随访,然而目前的大部分癌症生存分析方法仅使用患者在住院时的特征,而没有使用患者在动态随访过程中的时序特征。临床及其他生物学特征的变化情况已被证明能为预测死亡风险提供信息,因此纳入患者时序数据将产生更精准的预测结果。第二:目前的癌症生存分析方法使用循环神经网络及其变体来提取患者时序特征,然而循环神经网络在处理长时间序列特征时会出现梯度消失和爆炸,从而影响预测的准确度。第三:目前的离散型癌症生存分析方法均把时间区间的大小看作超参数,并使用交叉验证的方式对时间区间的大小进行调优,但是这样会增加模型的训练时间。第四:在癌症生存分析过程中经常出现患者删失,然而目前的方法存在难以有效处理数据高度删失的情况。
鉴于此,特提出本发明。
发明内容
本发明实施例提供基于层次注意力的癌症动态生存分析方法,解决以上至少一个技术问题。
第一方面,本发明实施例提供基于层次注意力的癌症动态生存分析方法,包含:
获取癌症患者的动态生存数据,并将所述动态生存数据随机划分为训练集和测试集,所述动态生存数据包含患者时序特征、患者的随访时间和患者最终结局;
根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间,所述自适应时间区间包含TN个时间区间;
构建基于层次注意力的癌症动态生存分析模型;
根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据;
利用训练集中患者时序特征、TN个时间区间的右边界值和所述标签数据训练基于层次注意力的癌症动态生存分析模型;
利用训练后的基于层次注意力的癌症动态生存分析模型,预测该患者在自适应时间区间上的生存概率。
优选的,根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间具体包含:
使用患者的随访时间和患者最终结局训练Kaplan-Meier模型;
将Kaplan-Meier模型预测的生存概率进行升序或降序排列,得到生存概率数组;
将所述生存概率数组等距离划分为Q个子数组,Q为大于等于2的正整数;
计算相邻两个子数组对应的患者组的Log-Rank统计量,判断该Log-Rank统计量是否具有显著性差异,若不存在显著性差异,则将所述相邻两个子数组合并后与下一相邻子数组计算对应的患者组的Log-Rank统计量;若存在显著性差异则不进行合并,直接计算所述相邻两个子数组中后一子数组与下一相邻子数组对应的患者组的Log-Rank统计量,直至完成所有子数组的计算;
最终计算得到TN个合并与未合并的子数组,即为含有TN个时间区间的自适应时间区间。
优选的,根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据具体包含:
将TN个时间区间的右边界值记作TI;
建立初始化长度为训练集中患者数量,宽度为TN的全零数二维矩阵,记作ytrain
对ytrain的每行每列依次进行计算,最终所得矩阵即为自适应时间区间的标签数据;
所述对ytrain的每行每列依次进行计算的方法为:
若si大于TIj,则ytrain[i][j]=0;若si等于TIj并且ei不等于0,则ytrain[i][j]=ei;若si等于TIj并且ei等于0,则ytrain[i][j]=0;若si小于TIj并且ei等于0,则ytrain[i][j]=emax+1;若si小于TIj并且ei不等于0,则ytrain[i][j]=ei
其中,i为第i个患者,j为TN个时间区间中第j个时间区间,si为患者第i个随访时间,ei为患者第i个最终的结局,emax为患者最终结局的最大值,TIj为第j个时间区间的右边界值。
优选的,所述基于层次注意力的癌症动态生存分析模型包含1个编码器和2个解码器,所述编码器用于将输入的训练集中患者时序特征和TN个时间区间的右边界值映射到高维空间,映射后的向量分别经过特征层次自注意力层和时间层次注意力层后与时间区间的右边界值的映射向量按位相加后再输出;
所述解码器用于接收编码器的输出信息,其中一个解码器进行特征提取后输出癌症患者在自适应时间区间上的生存概率,另一个解码器进行特征提取后输出癌症患者的生存时间。
优选的,训练集中患者时序特征映射到高维空间后的向量经过特征层次自注意力层输出,所述特征层次自注意力层的注意力计算公式为a∈{1,2,…,P·F},b∈{1,2,…,P·F};其中,ha为第a个患者时序特征的高维映射向量,/>为ha的转置,hb为第b个患者时序特征的高维映射向量,P为癌症患者特征的个数,F为对癌症患者的随访次数。
优选的,训练集中TN个时间区间的右边界值映射到高维空间后形成时间嵌入te,时间嵌入te经过时间层次注意力层输出,所述时间层次注意力层的注意力计算公式为:c∈{1,2,…,F},d∈{1,2,…,TN},其中tc为癌症患者第c个时序向量,/>为tc的转置,ted为癌症患者第d个时间嵌入,F为对癌症患者的随访次数;
所述tc的计算公式为:c∈{1,2,…,F},e∈{1,2,…,P},P为癌症患者特征的个数,h为患者时序特征映射到高维空间形成的向量。
优选的,训练基于层次注意力的癌症动态生存分析模型过程中,损失函数L1用来实现充分利用删失患者的信息,L1的公式为:
其中,xc为删失患者的特征,为删失患者的预测值;xuc为非删失患者的特征,/>为非删失患者的预测值,cos(·)为余弦相似度函数,m为用于模型训练的患者数量,i为用于模型训练的患者中第i个患者。
优选的,训练基于层次注意力的癌症动态生存分析模型过程中,损失函数L2用来实现提高生存时间预测的准确性,L2的公式为:
其中,Ts为患者的真实生存时间,/>为模型预测患者的生存时间,Ts[i]为第i个患者的真实生存时间,/>为模型预测第i个患者的生存时间,m为用于模型训练的患者数量,/>为指示函数,满足条件就为1,反之为0。
优选的,训练基于层次注意力的癌症动态生存分析模型过程中,损失函数L3用来让模型区分开高风险人群和低风险人群,L3的公式为:
其中,m为用于模型训练的患者数量,ys为患者的真实存活情况,为模型预测的生存概率,ys[i][j]表示第i个患者在第j个时间区间内的真实存活情况,/>表示模型预测第i个患者在第j个时间区间内的生存概率,k∈{ys[k][j]=1}表示在j时刻已经出现最终结局的患者,/>为指示函数,满足条件就为1,反之为0。
第二方面,本发明实施例提供了基于层次注意力的癌症动态生存分析系统,包含:
获取模块,用于获取癌症患者的动态生存数据,并将所述动态生存数据随机划分为训练集和测试集,所述动态生存数据包含患者时序特征、患者的随访时间和患者最终结局;
计算模块,用于根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间,所述自适应时间区间包含TN个时间区间;
构建模块,用于构建基于层次注意力的癌症动态生存分析模型;
生成模块,用于根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据;
训练模块,用于利用训练集中患者时序特征、TN个时间区间的右边界值和所述标签数据训练基于层次注意力的癌症动态生存分析模型;
预测模块,用于利用训练后的基于层次注意力的癌症动态生存分析模型,预测该患者在自适应时间区间上的生存概率。
与现有技术相比,本发明具有以下有益效果:
本发明通过自适应区间算法可以自动计算出癌症患者需要进行预测的时间区间,缩短了模型的训练时间。同时,本发明使用基于层次注意力的癌症动态生存分析模型为不同时刻患者特征分配不同的注意力权重,从而能在长时间序列特征中提取到最为关键的信息,提高预测准确性。
本发明提供了一个基于患者相似性的损失函数来充分利用删失患者的信息,从而进一步提高预测的准确性。
本发明在原始预测癌症患者未来不同时刻的生存概率的基础上增加了一个预测生存时间的辅助任务,从而提高了癌症生存分析模型的泛化能力,降低了过拟合的风险。
附图说明
图1为本发明实施例提供的基于层次注意力的癌症动态生存分析方法的流程示意图;
图2为本发明实施例提供的基于层次注意力的癌症动态生存分析模型的网络结构图;
图3为本发明实施例提供的基于层次注意力的癌症动态生存分析系统的结构示意图;
图4为本发明实施例提供的示例电子设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明第一方面实施例提供了基于层次注意力的癌症动态生存分析方法,图1为本申请实施例所提供的基于层次注意力的癌症动态生存分析方法的流程示意图。
如图1所示,基于层次注意力的癌症动态生存分析方法具体包含以下步骤:
S101,获取癌症患者的动态生存数据,并将所述动态生存数据随机划分为训练集和测试集,所述动态生存数据包含患者时序特征、患者的随访时间和患者最终结局。
具体来说,每个癌症患者的动态生存数据可以包含:患者时序特征(xf)、患者的随访时间(s)和患者最终结局(e)。xf为患者在第f次随访时的特征,一般包括患者的人口统计学、肿瘤病理学及其他生物学特征。使用符号P表示患者特征的个数,xfp为患者在第f次随访时第p个特征,p∈{1,2,…P}。e为患者最终结局,癌症患者的结局是指癌症患者生存、死亡和癌症转移等,可由研究人员根据其研究目的自行确定。若用符号K表示患者结局的个数,则e的取值范围为:{0,1,2,…K-1},e的最大取值记作emax。若用符号N表示收集到的动态生存数据的数量,则整个癌症患者的动态生存数据集D可以表示为:F为对癌症患者随访的次数。
可理解的,将所述动态生存数据随机划分为训练集和测试集,及指对上述动态生存数据集D进行划分,至于划分的数据比例,为本领域常用的比例,无特殊限定,例如可以为训练集:测试集=8:2,也可以为训练集:测试集=7:3等。
S102,根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间,所述自适应时间区间包含TN个时间区间。
离散型生存分析方法会直接预测出癌症患者在未来不同时间区间内的存活概率。如果时间区间数量过多,会导致模型复杂度过高;如果时间区间数量过少,会导致模型预测性能下降。如何确定时间区间的数量和大小是一个具有挑战性的问题。现有的做法是将时间区间的大小看作是一个超参数,且保持每个时间区间的长度一致,并使用交叉验证对其进行调优。然而,这样的简单的做法不仅耗时,还难以找到最优的时间区间。针对此问题,本发明实施例提出了一种自适应时间区间算法,来自动计算出合适的时间区间的数量和大小。
在一具体实施方式中,计算自适应时间区间的方法包含以下步骤:
使用患者的随访时间和患者最终结局训练Kaplan-Meier模型;
将Kaplan-Meier模型预测的生存概率进行升序或降序排列,得到生存概率数组;
将所述生存概率数组等距离划分为Q个子数组,Q为大于等于2的正整数;
计算相邻两个子数组对应的患者组的Log-Rank统计量,判断该Log-Rank统计量是否具有显著性差异,若不存在显著性差异,则将所述相邻两个子数组合并后与下一相邻子数组计算对应的患者组的Log-Rank统计量;若存在显著性差异则不进行合并,直接计算所述相邻两个子数组中后一子数组与下一相邻子数组对应的患者组的Log-Rank统计量,直至完成所有子数组的计算;
最终计算得到TN个长度不同的合并与未合并的子数组,即为含有TN个时间区间的自适应时间区间。
其中,使用患者的随访时间和患者最终结局训练Kaplan-Meier模型的具体方法包括:获取训练集中所有患者的随访时间(s_train)和最终结局(e_train);若e_train为0或者e_max(也即emax),则e_train=0;否则e_train=1;使用获取到的strain和etrain训练Kaplan-Meier模型。
将Kaplan-Meier模型预测的生存概率按照大小进行升序或降序排列,得到生存概率数组,用符号Ssort表示排好序的生存概率数组。将Ssort等距离划分为多个子数组,用符号Sg表示这些子数组。需要说明的是,划分的子数组的个数Q没有特别限定,Q为大于等于2的正整数即可,Q值越小计算的准确程度越低,Q值越大计算的准确程度越高,但同时计算时间越来越长,本领域技术人员可以根据实际需要进行设定,例如常用的子数组个数可以为80个、100个、120个、150个、200个等。
在一具体实施例中,计算相邻两个子数组对应的患者组的Log-Rank统计量,判断该Log-Rank统计量是否具有显著性差异,若不存在显著性差异,则将所述相邻两个子数组合并后与下一相邻子数组计算对应的患者组的Log-Rank统计量;若存在显著性差异则不进行合并,直接计算所述相邻两个子数组中后一子数组与下一相邻子数组对应的患者组的Log-Rank统计量,直至完成所有子数组的计算。具体的算法为:
S102-1:初始化循环标记符w为0。
S102-2:判断w是否小于Sg的长度减一,若不是,跳转到S102-5;若是,跳转到S102-3。
S102-3:计算Sg的第w个子数组对应的患者组与第w+1个子数组对应的患者组的Log-Rank统计量。Log-Rank统计量的具体计算公式为:
其中,g用以区分不同的患者组。g=1表示患者组1,g=2表示患者组2。Dg表示患者组g中实际的死亡患者的数量,Eg表示患者组g中理论的死亡患者数量。Eg的值为患者组中处于风险的患者比例乘以两个组中死亡的患者数量,以E1为例,E1的计算公式为:
其中,r1表示患者组1中处于风险的患者数量,r2表示患者组2中处于风险的患者数量,d1表示患者组1中死亡的患者数量,d2表示患者组2中死亡的患者数量。
S102-4:判断Log-Rank统计量是否小于P值(例如3.84),若是,w自增1,并跳转到S102-1;若不是,患者组w将合并患者组w+1中的患者,并跳转到S102-2。
S102-5:此时的Sg数组即为所求的时间区间,算法结束。
步骤S102利用训练集中患者的随访时间和患者最终结局训练Kaplan-Meier模型,预测得到生存概率,将生存概率排序后等间距划分为多个子数组,通过比较相邻子数组的生存曲线是否存在显著性差异,来判断是否对比较的子数组进行合并,将不存在显著性差异的相邻子数组进行合并,存在显著性差异的相邻子数组不合并,最终得到的数组中各子数组长度不一致,也即各时间区间长度不一致,通过以上自适应时间区间算法自动得到癌症患者需要进行预测的时间区间。
S103:构建基于层次注意力的癌症动态生存分析模型。
图2为本发明一实施例提供的基于层次注意力的癌症动态生存分析模型的网络结构图。如图2所示,所述基于层次注意力的癌症动态生存分析模型包含1个编码器和2个解码器,所述编码器用于将输入的训练集中患者时序特征和TN个时间区间的右边界值的输出向量映射到高维空间,映射后的向量分别经过特征层次自注意力层和时间层次注意力层输出后经过向量拼接再输出。所述解码器中一个解码器用于接收编码器的输出信息,进行特征提取后输出癌症患者在自适应时间区间上的生存概率;另一个解码器用于接收编码器的输出信息,进行特征提取后输出癌症患者的生存时间。
具体来说,编码器的输入为患者的时序特征和自适应时间区间算法计算出来的时间区间右边界值TI。
用F表示对癌症患者进行随访的次数,P表示癌症患者特征的个数,对于F个时刻的P个特征,使用P个全连接层将其映射到高维空间。对于TI,同样使用TN个全连接层将其映射到高维空间,形成时间嵌入te。为了使得映射的效果更好,将映射特征再次输入到一个全连接层来预测原始特征的值。
使用特征层次自注意力层来计算第a个特征的映射向量对第b个特征的映射向量的注意力βab,具体计算公式为:a∈{1,2,…,P·F},b∈{1,2,…,P·F};其中,ha为第a个患者时序特征的高维映射向量,/>为ha的转置,hb为第b个患者时序特征的高维映射向量。
接着,将特征高维映射向量按照时间区间的大小聚合成时序向量t,具体计算公式为:c∈{1,2,…,F},e∈{1,2,…,P},tc为癌症患者第c个时序向量,h为患者时序特征映射到高维空间形成的向量。
使用时间层次注意力层来计算第c个时序向量对第d个时间嵌入的注意力γcd,具体计算公式为:c∈{1,2,…,F},d∈{1,2,…,TN};/>为tc的转置,ted为癌症患者第d个时间嵌入。
将经过特征层次自注意力层和时间层次注意力层的时序特征和时间嵌入进行向量拼接,得到编码器的输出。
将编码器的输出分别输入到解码器1和解码器2中进行解码。解码器1将编码信息输入到循环神经网络和全连接网络中进行特征提取,最后输出患者在TN个时间区间上的生存概率。
解码器2的Flatten层将输入的编码信息拉平成一维向量,接着再输入到全连接层中进行特征抽取,最后输出患者的生存时间。解码器2是一个辅助解码器,通过预测患者生存时间这样的辅助任务,让编码器提取的编码信息更加具有泛化能力,避免了模型过拟合。
S104:根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据。
具体来说,生成标签数据的方法包含:
将TN个时间区间的右边界值记作TI;
建立初始化长度为训练集中患者数量,宽度为TN的全零数二维矩阵,记作ytrain
对ytrain的每行每列依次进行计算,最终所得矩阵即为自适应时间区间的标签数据;
所述对ytrain的每行每列依次进行计算的方法为:
若si大于TIj,则ytrain[i][j]=0;若si等于TIj并且ei不等于0,则ytrain[i][j]=ei;若si等于TIj并且ei等于0,则ytrain[i][j]=0;若si小于TIj并且ei等于0,则ytrain[i][j]=emax+1;若si小于TIj并且ei不等于0,则ytrain[i][j]=ei
其中,i为第i个患者,j为TN个时间区间中第j个时间区间,si为患者第i个随访时间,ei为患者第i个最终的结局,TIj为第j个时间区间的右边界值。
对ytrain的每行每列依次进行计算的具体算法为:
S104-1:用符号Ntrain表示训练集中的患者数量,初始化循环标记i为1。
S104-2:判断i是否小于等于Ntrain,如果是,则跳转到S104-3;如果不是,此时所得矩阵即为所求标签数据。
S104-3:初始化循环标记j为1。
S104-4:判断j是否小于等于TN,如果是,则跳转到S104-5;如果不是,则跳转到S104-2。
S104-5:如果si大于TIj,那么ytrain[i][j]=0;如果si等于TIj并且ei不等于0,那么ytrain[i][j]=ei;如果si等于TIj并且ei等于0,那么ytrain[i][j]=0;如果si小于TIj并且ei等于0,那么ytrain[i][j]=emax+1;如果si小于TIj并且ei不等于0,那么ytrain[i][j]=ei,随后跳转到S104-2。
S105:利用训练集中患者时序特征、TN个时间区间的右边界值和所述标签数据训练基于层次注意力的癌症动态生存分析模型。
在一优选实施例中,由于基于层次注意力的癌症动态生存分析模型有许多超参数,因此使用网格搜索法并配合五折交叉验证搜索出其最优的超参数。使用最优超参数重新训练模型,并保存训练好的模型参数。
具体的训练步骤为本领域常用的步骤,但训练过程该模型的部分损失函数为本发明首次提出。
举例来说,训练步骤为:
S105-1:设置模型的以下超参数:自注意力层数、自注意力层的输出维度、全连接的神经元个数、优化器Optimizer、学习率α、训练轮数epoch、批处理大小m、和4个损失函数的权重。初始化训练轮数epoch_count为0。
S105-2:将m个训练样本输入到模型中。
S105-3:计算模型的损失。
S105-4:根据计算出的损失函数更新模型的参数。用符号θS表示模型的可学习参数,每批次θS的更新为:θs=Optimizer(L,θs,α);其中,θs为癌症动态生存分析模型的参数,α为学习率,L为总损失函数,L的计算公式为:L=λ1·L12·L2+…+λy·Ly,其中,y为损失函数的个数,Ly表示第y个损失函数,λ1,λ2…λy分别为y个损失函数的权重,是超参数。
S105-5:判断是否已经使用了所有的训练样本,如果是,跳转到S105-6;如果不是,跳转到S105-2。
S105-6:判断epoch_count是否等于epoch,若是,结束训练;若不是,epoch_count自增1,并返回到S105-2。
上述训练步骤为模型训练常用的步骤。但本发明实施例中S105-3中计算模型的损失是根据本发明进行设计的。
具体来说,为了充分利用删失的癌症患者的信息,本发明具体实施例提供了损失函数L1,L1表示为:
其中,xc为删失患者的特征,/>为删失患者的预测值;xuc为非删失患者的特征,/>为非删失患者的预测值,m为用于模型训练的患者数量,i为用于模型训练的患者中第i个患者。Cos(·)为余弦相似度函数,例如求a和b的余弦相似度的公式为:/>优化L1损失函数会使特征越相似的患者预测结果也越相似,因此能充分利用删失患者的信息。
为了进一步提高生存时间预测的准确性,本发明另一具体实施例还提供了损失函数L2,L2表示为:
其中,Ts为患者的真实生存时间,/>为模型预测患者的生存时间,Ts[i]为第i个患者的真实生存时间,/>为模型预测第i个患者的生存时间,m为用于模型训练的患者数量,/>为指示函数,满足条件就为1,反之为0。通过预测患者生存时间这样的辅助任务,让模型更加具有泛化能力,避免了模型过拟合。
为了使模型能区分开高风险人群和低风险人群,本发明另一具体实施例还提供了损失函数L3,L3表示为:
其中,m为用于模型训练的患者数量,ys为患者的真实存活情况,为模型预测的生存概率,ys[i][j]表示第i个患者在第j个时间区间内的真实存活情况,/>表示模型预测第i个患者在第j个时间区间内的生存概率,k∈{ys[k][j]=1}表示在j时刻已经出现最终结局的患者,/>为指示函数,满足条件就为1,反之为0。优化该损失函数会使得存活时间更长的患者的生存概率更高,从而让模型能够区分低风险和高风险的癌症患者。
除以上具体实施例提供的损失函数外,本发明还公开了其他常用的损失函数。
例如,为了使得模型学习不同时刻结局发生概率和癌症患者时序特征之间的关系,还提供了损失函数L4,L4表示为:
其中,ys为患者的真实存活情况,ys[i][j]表示第i个患者在第j个时间区间内的真实存活情况;为模型预测的生存概率,/>表示模型预测第i个患者在第j个时间区间内的生存概率;/>是一个指示函数,满足条件就为1,反之为0,/>表示患者如果此刻已经删失,将不会计算其损失。
例如,为了提高患者时序特征高维映射的效果,还提供了损失函数L5,L5表示为:
其中,yx为输入的特征,yx[i][j][k]表示第i个患者的第j个时刻的第k个特征的真实值;yr为输入特征的预测值,yr[i][j][k]表示模型对第i个患者的第j个时刻的第k个特征的预测值,m为用于模型训练的患者数量,P为癌症患者特征的个数,F为对癌症患者的随访次数。通过预测输入特征的值,使得特征映射到高维空间的效果更好。
S106:利用训练后的基于层次注意力的癌症动态生存分析模型,预测该患者在自适应时间区间上的生存概率。
可理解地,加载训练好的模型,把癌症患者的时序特征输入到模型中后,即可预测出该患者在自适应时间区间(也即TN个时间区间)上的生存概率。
本发明第二方面实施例提供了基于层次注意力的癌症动态生存分析系统。图3为本申请实施例所提供的基于层次注意力的癌症动态生存分析系统的结构示意图。
基于层次注意力的癌症动态生存分析系统300,包括获取模块301、计算模块302、构建模块303、生成模块304、训练模块305、预测模块306,具体如下:
获取模块301,用于获取癌症患者的动态生存数据,并将所述动态生存数据随机划分为训练集和测试集,所述动态生存数据包含患者时序特征、患者的随访时间和患者最终结局.
计算模块302,用于根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间,所述自适应时间区间包含TN个时间区间;
构建模块303,用于构建基于层次注意力的癌症动态生存分析模型;
生成模块304,用于根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据;
训练模块305,用于利用训练集中患者时序特征、TN个时间区间的右边界值和所述标签数据训练基于层次注意力的癌症动态生存分析模型;
预测模块306,用于利用训练后的基于层次注意力的癌症动态生存分析模型,预测该患者在自适应时间区间上的生存概率。
本发明实施例提供的系统,能够自动计算出癌症患者需要进行预测的时间区间,即自适应时间区间,缩短了模型的训练时间,该系统基于层次注意力的癌症动态生存分析模型为不同时刻患者特征分配不同的注意力权重,能够在较长的时间序列特征中提取到最为关键的信息。该系统能够充分利用删失患者的信息,提高预测的准确性。
基于上述实施例,本发明还提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面实施例中基于层次注意力的癌症动态生存分析方法中的步骤。
图4示出了可以用来实施本发明的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,该电子设备400可以包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM403中,还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/0)接口405也连接至总线404。
设备400中的多个部件连接至I/0接口405,包括:输入单元406,例如键盘﹑鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU),图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如组学数据处理方法或用于组学数据处理的模型训练方法。例如,在一些实施例中,组学数据处理方法或用于组学数据处理的模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备800上。当计算机程序加载到RAM 403并由计算单元401执行时,可以执行上文描述的组学数据处理方法或用于组学数据处理的模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行组学数据处理方法或用于组学数据处理的模型训练方法。
基于上述实施例,本发明还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本发明实施例公开的基于层次注意力的癌症动态生存分析方法。
基于上述实施例,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本发明实施例公开的基于层次注意力的癌症动态生存分析方法的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置,和该至少一个输出装置。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.基于层次注意力的癌症动态生存分析方法,其特征在于,包含:
获取癌症患者的动态生存数据,并将所述动态生存数据随机划分为训练集和测试集,所述动态生存数据包含患者时序特征、患者的随访时间和患者最终结局;
根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间,所述自适应时间区间包含TN个时间区间;
构建基于层次注意力的癌症动态生存分析模型;
根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据;
利用训练集中患者时序特征、TN个时间区间的右边界值和所述标签数据训练基于层次注意力的癌症动态生存分析模型;
利用训练后的基于层次注意力的癌症动态生存分析模型,预测该患者在自适应时间区间上的生存概率。
2.如权利要求1所述的基于层次注意力的癌症动态生存分析方法,其特征在于,根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间具体包含:
使用患者的随访时间和患者最终结局训练Kaplan-Meier模型;
将Kaplan-Meier模型预测的生存概率进行升序或降序排列,得到生存概率数组;
将所述生存概率数组等距离划分为Q个子数组,Q为大于等于2的正整数;计算相邻两个子数组对应的患者组的Log-Rank统计量,判断该Log-Rank统计量是否具有显著性差异,若不存在显著性差异,则将所述相邻两个子数组合并后与下一相邻子数组计算对应的患者组的Log-Rank统计量;若存在显著性差异则不进行合并,直接计算所述相邻两个子数组中后一子数组与下一相邻子数组对应的患者组的Log-Rank统计量,直至完成所有子数组的计算;最终计算得到TN个合并与未合并的子数组,即为含有TN个时间区间的自适应时间区间。
3.如权利要求1所述的基于层次注意力的癌症动态生存分析方法,其特征在于,根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据具体包含:
将TN个时间区间的右边界值记作TI;
建立初始化长度为训练集中患者数量,宽度为TN的全零数二维矩阵,记作ytrain
对ytrain的每行每列依次进行计算,最终所得矩阵即为自适应时间区间的标签数据;
所述对ytrain的每行每列依次进行计算的方法为:
若si大于TIj,则ytrain[i][j]=0;若si等于TIj并且ei不等于0,则ytrain[i][j]=ei
若si等于TIj并且ei等于0,则ytrain[i][j]=0;若si小于TIj并且ei等于0,则ytrain[i][j]=emax+1;若si小于TIj并且ei不等于0,则ytrain[i][j]=ei
其中,i为第i个患者,j为TN个时间区间中第j个时间区间,si为患者第i个随访时间,ei为患者第i个最终的结局,emax为患者最终结局的最大值,TIj为第j个时间区间的右边界值。
4.如权利要求1所述的基于层次注意力的癌症动态生存分析方法,其特征在于,所述基于层次注意力的癌症动态生存分析模型包含1个编码器和2个解码器,所述编码器用于将输入的训练集中患者时序特征和TN个时间区间的右边界值映射到高维空间,映射后的向量经过特征层次自注意力层和时间层次注意力层后与时间区间的右边界值的映射向量按位相加后再输出;
所述解码器用于接收编码器的输出信息,其中一个解码器进行特征提取后输出癌症患者在自适应时间区间上的生存概率,另一个解码器进行特征提取后输出癌症患者的生存时间。
5.如权利要求4所述的基于层次注意力的癌症动态生存分析方法,其特征在于,训练集中患者时序特征映射到高维空间后的向量经过特征层次自注意力层输出,所述特征层次自注意力层的注意力计算公式为 其中,ha为第a个患者时序特征的高维映射向量,/>为ha的转置,hb为第b个患者时序特征的高维映射向量,P为癌症患者特征的个数,F为对癌症患者的随访次数。
6.如权利要求4所述的基于层次注意力的癌症动态生存分析方法,其特征在于,训练集中TN个时间区间的右边界值映射到高维空间后形成时间嵌入te,时间嵌入te经过时间层次注意力层输出,所述时间层次注意力层的注意力计算公式为:其中tc为癌症患者第c个时序向量,/>为tc的转置,ted为癌症患者第d个时间嵌入,F为对癌症患者的随访次数;
所述tc的计算公式为:
P为癌症患者特征的个数,h为患者时序特征映射到高维空间形成的向量。
7.如权利要求1所述的基于层次注意力的癌症动态生存分析方法,其特征在于,训练基于层次注意力的癌症动态生存分析模型过程中,损失函数L1用来实现充分利用删失患者的信息,L1的公式为:
其中,xc为删失患者的特征,为删失患者的预测值;xuc为非删失患者的特征,/>为非删失患者的预测值,cos(·)为余弦相似度函数,m为用于模型训练的患者数量,i为用于模型训练的患者中第i个患者。
8.如权利要求1所述的基于层次注意力的癌症动态生存分析方法,其特征在于,训练基于层次注意力的癌症动态生存分析模型过程中,损失函数L2用来实现提高生存时间预测的准确性,L2的公式为:
其中,Ts为患者的真实生存时间,为模型预测患者的生存时间,Ts[i]为第i个患者的真实生存时间,/>为模型预测第i个患者的生存时间,m为用于模型训练的患者数量,
为指示函数,满足条件就为1,反之为0。
9.如权利要求1所述的基于层次注意力的癌症动态生存分析方法,其特征在于,训练基于层次注意力的癌症动态生存分析模型过程中,损失函数L3用来让模型区分开高风险人群和低风险人群,L3的公式为:
其中,m为用于模型训练的患者数量,ys为患者的真实存活情况,为模型预测的生存概率,ys[i][j]表示第i个患者在第j个时间区间内的真实存活情况,/>表示模型预测第i个患者在第j个时间区间内的生存概率,k∈{ys[k][j]=1}表示在j时刻已经出现最终结局的患者,/>为指示函数,满足条件就为1,反之为0。
10.基于层次注意力的癌症动态生存分析系统,其特征在于,包含:
获取模块,用于获取癌症患者的动态生存数据,并将所述动态生存数据随机划分为训练集和测试集,所述动态生存数据包含患者时序特征、患者的随访时间和患者最终结局;
计算模块,用于根据训练集中患者的随访时间和患者最终结局计算出自适应时间区间,所述自适应时间区间包含TN个时间区间;
构建模块,用于构建基于层次注意力的癌症动态生存分析模型;
生成模块,用于根据所述患者的随访时间、患者最终结局和TN个时间区间生成基于层次注意力的癌症动态生存分析模型的标签数据;
训练模块,用于利用训练集中患者时序特征、TN个时间区间的右边界值和所述标签数据训练基于层次注意力的癌症动态生存分析模型;
预测模块,用于利用训练后的基于层次注意力的癌症动态生存分析模型,预测该患者在自适应时间区间上的生存概率。
CN202311408202.5A 2023-10-27 2023-10-27 基于层次注意力的癌症动态生存分析方法及系统 Active CN117409968B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311408202.5A CN117409968B (zh) 2023-10-27 2023-10-27 基于层次注意力的癌症动态生存分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311408202.5A CN117409968B (zh) 2023-10-27 2023-10-27 基于层次注意力的癌症动态生存分析方法及系统

Publications (2)

Publication Number Publication Date
CN117409968A true CN117409968A (zh) 2024-01-16
CN117409968B CN117409968B (zh) 2024-05-03

Family

ID=89490419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311408202.5A Active CN117409968B (zh) 2023-10-27 2023-10-27 基于层次注意力的癌症动态生存分析方法及系统

Country Status (1)

Country Link
CN (1) CN117409968B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117831789A (zh) * 2024-03-05 2024-04-05 北京市肿瘤防治研究所 癌症治疗反应预测系统及其控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312393A (zh) * 2020-01-14 2020-06-19 之江实验室 一种结合主动学习的时序深度生存分析系统
CN113409946A (zh) * 2021-07-02 2021-09-17 中山大学 一种高维删失数据下预测癌症预后风险的系统和方法
CN115565669A (zh) * 2022-10-11 2023-01-03 电子科技大学 一种基于gan和多任务学习的癌症生存分析方法
CN115631860A (zh) * 2022-10-27 2023-01-20 重庆大学 一种基于多任务学习的肝癌预后分析方法、系统及设备
CN116580848A (zh) * 2023-05-15 2023-08-11 湖南大学 一种基于多头注意力机制的分析癌症多组学数据方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312393A (zh) * 2020-01-14 2020-06-19 之江实验室 一种结合主动学习的时序深度生存分析系统
CN113409946A (zh) * 2021-07-02 2021-09-17 中山大学 一种高维删失数据下预测癌症预后风险的系统和方法
CN115565669A (zh) * 2022-10-11 2023-01-03 电子科技大学 一种基于gan和多任务学习的癌症生存分析方法
CN115631860A (zh) * 2022-10-27 2023-01-20 重庆大学 一种基于多任务学习的肝癌预后分析方法、系统及设备
CN116580848A (zh) * 2023-05-15 2023-08-11 湖南大学 一种基于多头注意力机制的分析癌症多组学数据方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117831789A (zh) * 2024-03-05 2024-04-05 北京市肿瘤防治研究所 癌症治疗反应预测系统及其控制方法
CN117831789B (zh) * 2024-03-05 2024-05-28 北京市肿瘤防治研究所 癌症治疗反应预测系统及其控制方法

Also Published As

Publication number Publication date
CN117409968B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
Capra et al. Hardware and software optimizations for accelerating deep neural networks: Survey of current trends, challenges, and the road ahead
Liang et al. Pruning and quantization for deep neural network acceleration: A survey
Sze et al. Efficient processing of deep neural networks: A tutorial and survey
Mehnatkesh et al. An intelligent driven deep residual learning framework for brain tumor classification using MRI images
Köster et al. Flexpoint: An adaptive numerical format for efficient training of deep neural networks
Tjandra et al. Compressing recurrent neural network with tensor train
Marinó et al. Deep neural networks compression: A comparative survey and choice recommendations
Lopes et al. Towards adaptive learning with improved convergence of deep belief networks on graphics processing units
Kıymaç et al. A novel automated CNN arrhythmia classifier with memory-enhanced artificial hummingbird algorithm
Peng et al. Hierarchical Harris hawks optimizer for feature selection
CN110210618A (zh) 动态修剪深度神经网络权重和权重共享的压缩方法
CN117409968B (zh) 基于层次注意力的癌症动态生存分析方法及系统
Spathis et al. Self-supervised transfer learning of physiological representations from free-living wearable data
JP2024506529A (ja) 心電図信号を基にした慢性疾患の予測方法
Hu et al. The MBPEP: a deep ensemble pruning algorithm providing high quality uncertainty prediction
CN113222139A (zh) 神经网络训练方法和装置、设备,及计算机存储介质
CN117437494B (zh) 一种图像分类方法、系统、电子设备及存储介质
Wu et al. SBNN: Slimming binarized neural network
CN116129193B (zh) 一种类器官生长预测方法、系统及设备
Dong et al. An improved binary dandelion algorithm using sine cosine operator and restart strategy for feature selection
CN114565617A (zh) 基于剪枝U-Net++的乳腺肿块图像分割方法及系统
Wang et al. Adaptive integer quantisation for convolutional neural networks through evolutionary algorithms
Liu et al. Artificial neural networks condensation: A strategy to facilitate adaption of machine learning in medical settings by reducing computational burden
KR102664502B1 (ko) 자가 학습식 순서형 회귀 네트워크를 이용한 세포핵 영역화 및 유형 분류 방법 및 장치
CN116882461B (zh) 一种基于神经元可塑性的神经网络评估优化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant