CN111063442A - 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 - Google Patents

基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 Download PDF

Info

Publication number
CN111063442A
CN111063442A CN201911194547.9A CN201911194547A CN111063442A CN 111063442 A CN111063442 A CN 111063442A CN 201911194547 A CN201911194547 A CN 201911194547A CN 111063442 A CN111063442 A CN 111063442A
Authority
CN
China
Prior art keywords
matrix
task
prediction
feature
convex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911194547.9A
Other languages
English (en)
Other versions
CN111063442B (zh
Inventor
王凌胜
陈蕾
查思明
李平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201911194547.9A priority Critical patent/CN111063442B/zh
Priority to PCT/CN2020/070259 priority patent/WO2021103287A1/zh
Publication of CN111063442A publication Critical patent/CN111063442A/zh
Application granted granted Critical
Publication of CN111063442B publication Critical patent/CN111063442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Nuclear Medicine (AREA)

Abstract

本发明公开了一种基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统,包括依次连接的数据采集单元、离线处理单元、进程预测单元,通过对由多位受试者在baseline时测得的多个模态数据进行预处理;利用多任务直推式矩阵补全模型,将多个时间点的疾病状态预测建模为一个多任务回归问题;选择出task‑share特征和task‑specific特征,利用这两种特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测。

Description

基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统
技术领域
本发明涉及人工智能和机器学习领域,具体涉及一种基于弱监督多任务矩阵补全模型的脑疾病进程预测方法。
背景技术
阿尔茨海默病(Alzheimer’s disease,AD)是一种不可逆的神经退行性疾病,其特征是神经元及其连接受损,导致患者渐进性记忆丧失和认知能力下降,最终死亡。最近的研究表明,全世界大约有2660万名AD患者,到2050年,每85人中将有1人将受到AD的影响。准确地预测AD的疾病进程,便能根据预测结果,及时对患者进行有效的针对性治疗,较大地延缓和改善病情,对于AD的临床诊断和预后具有重要意义。
许多临床/认知测量被设计用来评估患者的认知状态,并作为可能的AD临床诊断的重要标准,例如简易精神状态量表(Mini-mental State Examination,MMSE)和阿尔茨海默病评估量表-认知子量表(Alzheimer’s Disease Assessment Scale-Cognitivesection,ADAS-Cog)。MMSE已被证明与潜在的AD病理学和功能的逐步恶化相关。ADAS-Cog则是评估AD药物试验认知功能的主要标准。在传统的疾病进程预测研究中,大部分人采用回归模型进行预测,如Stonnington等人,使用了相关向量回归(relevance vectorregression,RVR)方法来测量结构变化和神经心理学测试之间的相互作用关系。另一部分人采用生存模型,如Pearson等人,将疾病进程预测建模成典型的生存分析问题。这些方法在样本维度较小时取得了较好的效果,但是当维度较高,如使用医学影像作为输入特征时,他们的效果并不理想。为此,研究者通常采用降维技术来处理高维问题,如Duchesne等人,使用主成分分析(Principal Component Analysis,PCA)技术将高维数据映射到低维空间中。周涛等人将高维基因型数据和表现型图像数据共同映射到由诊断标签引导的联合潜在特征空间来处理高维问题。同时,现有研究大多集中在对单个时间点,如baseline(患者第一次到医院接受检查的时间)或者baseline一年以后的状态预测上,但是,对多个时间点的数据进行联合分析可以利用其之间的关联性提高预测效果,尤其是当样本数较少且样本维度较大时。
为了充分利用多个时间点疾病状态的关联性,许多人将多任务学习思想应用到疾病进程预测上。多任务学习的目的是通过同时学习多个相关任务,挖掘任务之间的内在关联性,提高泛化性能。由于神经影像学数据的珍贵和稀少,Jabason等人将弱监督学习思想与疾病进程预测相结合,充分挖掘样本潜在的结构信息。同时,现有的大部分论文在进行特征选择时仅考虑了选择与所有任务相关的公共特征子集,并没有考虑到每个任务所独有的特征,也没有考虑到样本存在噪声。
发明内容
发明目的:为了克服现有疾病进程预测研究中存在的样本过拟合问题和特征含噪问题,提出一种基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统,该方法能有效利用多个时间点疾病状态的内在关联性,充分挖掘出样本之间的低秩性及结构分布信息,选择出task-share特征和task-specific特征,解决过拟合问题,并对样本进行去噪,从而获得较高的预测准确率。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于弱监督多任务矩阵补全的脑疾病进程预测方法,包括以下步骤:
步骤1:对受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征。
步骤2:利用多任务直推式矩阵补全模型,将对第一次去医院接受检查之后每个时间点的疾病状态预测都视作一个单任务回归任务,从而多个时间点的疾病状态预测建模为一个多任务回归问题,并对特征矩阵进行去噪,在标记部分缺失的情况下预测出认知评分矩阵。
步骤2具体包括如下步骤:
步骤2-1,基于特征矩阵X的低秩性假设和X与Y之间的线性关联假设,补全后得到的矩阵Z=[ZX,ZY]也是低秩的,其中,矩阵ZX是对应于矩阵X的真实潜在的特征矩阵,ZY是对应于矩阵Y的真实潜在的评分矩阵。通过对Z矩阵使用核范数约束,并对补全前的特征矩阵X和补全后的特征矩阵ZX之间使用F范数约束作为保真项,其公式如下:
Figure BDA0002294359230000021
其中,
Figure BDA0002294359230000022
Z是一个维度为n×(d+t)的矩阵,
Figure BDA0002294359230000023
表示实数,d代表特征数,n代表样本数,t代表任务数,W表示权重矩阵,λ12和λ3是正则化参数,‖Z‖*表示矩阵Z的核范数,P是一个mask矩阵,Pij表示矩阵P中第i行第j列的元素,当第i个样本在第j个时间点的认知评分缺失时,Pij=0,反之则为1,⊙表示哈达玛积。
步骤2-2,疾病进程预测的目的是预测出受试者在第一次去医院接受检查后一段时间的疾病状态,对第一次去医院接受检查后每隔一定时间间隔的特定时间点的疾病状态进行预测。采用简易精神状态量表MMSE和阿尔茨海默病评估量表-认知子量表ADAS-Cog的认知评分来表示受试者的疾病状态。
步骤3:利用混合稀疏组Lasso特征选择方法选择出所有任务共享的task-share特征和每个任务所独有的task-specific特征,利用task-share特征、task-specific特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测。
步骤3具体包括如下步骤:
步骤3-1,对系数矩阵
Figure BDA0002294359230000031
使用
Figure BDA0002294359230000039
范数约束,使得W行稀疏,通过训练得到W,其中,W的每一行对应一个特征,每一列对应一个任务,W的非零行所对应的特征即为task-share特征。
步骤3-2,对系数矩阵
Figure BDA0002294359230000032
使用
Figure BDA00022943592300000310
范数约束,使得W任意稀疏,使得W的非零行中出现随机的零值,所以W的非零行对应的特征即为非零行中非零值对应任务的task-specific特征。
步骤3-3,引入时序平滑正则化项对相邻时间点评分预测的较大偏差进行惩罚。
步骤3-4,结合步骤3-1、步骤3-2、步骤3-3中的范数约束,关于task-share特征和task-specific特征的特征选择项,又称混合稀疏组Lasso项:
Figure BDA0002294359230000033
步骤3-5,结合步骤3-1和步骤3-4中的直推式矩阵补全模型和混合稀疏组Lasso项,得到如下模型:
Figure BDA0002294359230000034
步骤3-6,将步骤3-4中的模型改进为如下的非凸多任务回归形式:
Figure BDA0002294359230000035
Figure BDA0002294359230000036
步骤3-7,结合快速迭代收缩阈值算法和DC规划方法设计步骤3-6所提出模型的求解方法。
通过交替迭代以下两个子问题来求解出W和Z:
Figure BDA0002294359230000037
其中,公式(5)中的子问题1用FISTA方法来求解,令:
Figure BDA0002294359230000038
其中,F(Z,W)表示公式(5)中除了核范数的可导项的集合。
那么子问题1就用如下方式求解:
Figure BDA0002294359230000041
其中,
Figure BDA0002294359230000042
表示核范数的近邻算子,
Figure BDA0002294359230000043
表示步长,而Lipschitz连续常数
Figure BDA0002294359230000044
求解如下:
Figure BDA0002294359230000045
其中,σ1(·)表示括号中矩阵的最大奇异值,T表示矩阵的转置,Id×d表示维度为d×d的单位矩阵。
此外,梯度
Figure BDA0002294359230000046
计算如下:
Figure BDA0002294359230000047
其中,ΔX和ΔY分别表示ZX中ZY元素下标集合,
Figure BDA0002294359230000048
Wk-1
Figure BDA0002294359230000049
分别表示在第k-1次迭代过程中ZX,W和ZY的值。
公式(6)中的子问题2是一个非凸优化问题,利用DC规划方法来利用凸松弛近似非凸公式,DC规划方法基本原理简述如下:
Figure BDA00022943592300000410
其中,
Figure BDA00022943592300000417
和h(W)表示一般式的函数,
Figure BDA00022943592300000416
和h(W)是凸的,很容易证明
Figure BDA00022943592300000411
形式也是凸的,接着设
Figure BDA00022943592300000418
Figure BDA00022943592300000412
公式(11)表示成f(W)和g(h(W))之差的形式:
minwf(W)-g(h(W)) (12)
然后利用在许多非凸问题中常用的CCCP理论,将函数g(h(W))在当前的点W′处一阶泰勒展开:
Figure BDA00022943592300000413
这是非凸问题的凸上界,接下来,在每次迭代中使用CCCP算法最小化凸上界:
Figure BDA00022943592300000414
公式(6)对应于公式(14)凸松弛形式:
Figure BDA00022943592300000415
其中,Wk+1表示第k+1次迭代过程中W的值,
Figure BDA0002294359230000051
ε是一个避免分母为零的较小常数项,wi表示矩阵W的第i行,wi(t)表示第k次迭代中wi的值,λ4表示特征选择项的超参数,d表示特征数。
优选的:步骤1中得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征的方法如下:
步骤1-1,对磁共振成像MRI依次使用前连合AC–后连合PC矫正、强度不均匀性校正、头骨剥离、基于阿特拉斯配准的小脑摘除术、空间分割,得到基于Jacob模板的具有93个手动标记感兴趣区ROI的标记图像,并分别计算这93个手动标记感兴趣区ROI的灰质体积作为磁共振成像特征。
步骤1-2,对于每个正电子发射断层显像PET,使用仿射配准将正电子发射断层显像PET图像与其各自的磁共振成像MRI对齐,然后,利用相应的磁共振脑掩模得到颅骨剥离图像,并计算出正电子发射断层显像PET图像中每个手动标记感兴趣区ROI的平均强度作为正电子发射断层显像特征。
步骤1-3,对于脑脊液CSF,使用CSF Aβ42,CSFt-tau和CSFp-tau三项的测量值作为脑脊液特征。
优选的:在预测时,加入人口统计学特征,人口统计学特征包括受试者的年龄、受教育情况、性别。
优选的:步骤2-2中第一次去医院接受检查后每隔一定时间间隔的特定时间点包括第一次去医院接受检查后06个月、12个月、24个月、36个月、48个月。
一种基于弱监督多任务矩阵补全的脑疾病进程预测系统,包括依次连接的数据采集单元、离线处理单元、进程预测单元,其中:
所述数据采集单元用于采集受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值。
所述离线处理单元包括数据预处理模块和构建模型模块,其中,所述数据预处理模块用于对采集到的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征。所述构建模型模块用于利用预处理后的数据来训练所提出的基于弱监督多任务矩阵补全的脑疾病进程预测模型。
所述进程预测单元用于根据训练好的基于弱监督多任务矩阵补全的脑疾病进程预测模型对新待诊断的受试者进行脑疾病进程预测。
本发明相比现有技术,具有以下有益效果:
(1)能够解决脑疾病诊断所常需要面临的过拟合问题
我们使用多任务直推式矩阵补全MTMC来解决过拟合问题。它可以充分利用特征矩阵潜在的低秩特性,同时对特征矩阵进行去噪,以此来得到更好的预测精度。在挖掘不同任务之间固有的关联性方面,MTMC也具有多任务学习共同的优点。
(2)能够处理样本含噪和标记部分缺失问题
由于获取充足的带标记数据昂贵且耗时,为了解决这个问题,我们的模型基于弱监督学习思想,联合使用带标记训练样本和无标记测试样本来建立样本流形内蕴的几何结构。
(3)能够选择出对阿尔茨海默病进程预测有较高判别性的生物标志物特征。
我们通过对系数矩阵进行
Figure BDA0002294359230000061
范数正则化来选择出task-share特征和task-specific特征。这对于神经退行性疾病的诊断尤其重要,因为我们是从大脑的不同区域提取特征,但实际上只有某些特定的区域与AD相关。因此,通过结合混合稀疏组Lasso特征选择方法,我们的模型可以选择出对疾病进程中不同时间点的疾病状态预测最具判别性的特征。
附图说明
图1是本发明系统结构示意图。
图2是本发明处理流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于弱监督多任务矩阵补全的脑疾病进程预测方法,如图2所示,包括以下步骤:
步骤1:在对由多位受试者在baseline时测得的磁共振成像(MRI)、正电子发射断层显像(PET)和脑脊液(CSF)测量值等多个模态数据进行预处理,具体包括如下步骤:
步骤1-1,对磁共振成像(MRI)依次使用前连合(AC)–后连合(PC)矫正、强度不均匀性校正、头骨剥离、基于阿特拉斯配准的小脑摘除术、空间分割等技术,得到基于Jacob模板的具有93个手动标记感兴趣区(ROI)的标记图像,并分别计算这93个ROI的灰质体积作为特征。其中,baseline指的是受试者第一次去医院接受检查的时间。
步骤1-2,对于每个正电子发射断层显像(PET),我们首先使用仿射配准将PET图像与其各自的MRI对齐。然后,利用相应的磁共振脑掩模得到颅骨剥离图像,并计算出PET图像中每个ROI的平均强度作为特征。
步骤1-3,对于脑脊液(CSF),我们使用CSF Aβ42,CSFt-tau和CSFp-tau三项的测量值作为CSF特征。
步骤1-4,同时也可以加入一些人口统计学特征,如受试者的年龄,受教育情况,性别等,有研究表明,人口统计学特征对于脑疾病进程也有一定的影响。
步骤2:利用多任务直推式矩阵补全模型,将对baseline之后每个时间点的疾病状态预测都视作一个单任务回归任务,从而多个时间点的疾病状态预测建模为一个多任务回归问题,并对特征矩阵进行去噪,在标记部分缺失的情况下预测出认知评分矩阵,具体包括如下步骤:
步骤2-1,根据多任务直推式矩阵补全理论,首先,它假设X和Y之间存在线性关联,即Y=XW,其中
Figure BDA0002294359230000071
是一个隐式的系数矩阵。其次,它假设矩阵X是低秩的,即原始高维数据实际位于低维流形结构上。并且,根据rank(Z)≤rank(X),可以得出矩阵Z=[ZX,ZY]同样是低秩的,其中,矩阵ZX是对应于矩阵X的真实潜在的特征矩阵,ZY是对应于矩阵Y的真实潜在的评分矩阵。通过对Z矩阵使用核范数约束,并对补全前的特征矩阵X和补全后的特征矩阵ZX之间使用F范数约束作为保真项,其公式如下:
Figure BDA0002294359230000072
其中,
Figure BDA0002294359230000073
d代表特征数,n代表样本数,t代表任务数,W表示权重矩阵,λ12和λ3是正则化参数,P是一个mask矩阵,当第i个样本在第j个时间点的认知评分缺失时,Pij=0,反之则为1,⊙表示哈达玛积(Hadamard product)。
步骤2-1,疾病进程预测的目的是预测出受试者在baseline后一段时间的疾病状态,本发明中我们对baseline后每隔一定时间间隔的特定时间点(如baseline后06、12、24、36、48个月等)的疾病状态进行预测。而对于受试者疾病状态的评价方法,许多临床/认知测量已被设计出来,并作为可能的AD的临床诊断的重要标准,如简易精神状态量表(MMSE)和阿尔茨海默病评估量表-认知子量表(ADAS-Cog),本发明用这两种认知评分来表示受试者的疾病状态。在实际研究中,训练样本的数量往往不足,且存在评分数据部分缺失的现象。
步骤3:与此同时,利用混合稀疏组Lasso特征选择策略选择出所有任务共享的task-share特征和每个任务所独有的task-specific特征,利用这两种特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测,具体包括如下步骤:
步骤3-1,为了得到所有任务共享的task-share特征,对系数矩阵
Figure BDA0002294359230000074
使用
Figure BDA0002294359230000076
范数约束,使得W行稀疏,通过训练得到W,其中W的每一行对应一个特征,每一列对应一个任务,W的非零行所对应的特征即为task-share特征。
步骤3-2,与此同时,为了得到每个任务所独有的task-specific特征,对系数矩阵
Figure BDA0002294359230000075
使用
Figure BDA0002294359230000089
范数约束,使得W任意稀疏,使得W的非零行中出现随机的零值,所以W的非零行对应的特征即为非零行中非零值对应任务的task-specific特征。
步骤3-3,为了充分利用疾病进程预测问题中常见的时序平滑先验特性,即相邻时间点的临床认知评分应该相近,我们将时序平滑正则化项引入疾病进程建模中,对相邻时间点评分预测的较大偏差进行惩罚。
步骤3-4,结合步骤3-1,步骤3-2和步骤3-3中的范数约束,关于task-share特征和task-specific特征的特征选择项,又称混合稀疏组Lasso项:
Figure BDA0002294359230000081
步骤3-5,结合(3-1)和(4-4)中的直推式矩阵补全模型和混合稀疏组Lasso特征选择项,得到如下模型:
Figure BDA0002294359230000082
步骤3-6,许多先前的研究表明,将
Figure BDA0002294359230000087
正则化项和
Figure BDA0002294359230000088
正则化项进行简单的组合并不是最优的,而且,众所周知,稀疏惩罚会导致有偏估计。为了解决这一问题,我们将步骤3-4中的模型改进为如下的非凸多任务回归形式:
Figure BDA0002294359230000083
步骤3-7,结合快速迭代收缩阈值算法(Fast Iterative Shrinkage-Thresholding Algorithm,FISTA)和DC规划方法(difference of convex programmingtechniques)设计本发明所提出模型的求解方法,求解方法的详细过程如下:
通过交替迭代以下两个子问题来求解出W和Z:
Figure BDA0002294359230000084
其中,公式(5)中的子问题1可以用FISTA方法来求解,其收敛性由已Beck等人证明。具体来说,我们令:
Figure BDA0002294359230000085
那么子问题1就可以用如下方式求解:
Figure BDA0002294359230000086
其中
Figure BDA0002294359230000091
表示核范数的近邻算子,
Figure BDA0002294359230000092
表示步长,而Lipschitz连续常数
Figure BDA0002294359230000093
求解如下:
Figure BDA0002294359230000094
此外,梯度
Figure BDA0002294359230000095
计算如下:
Figure BDA0002294359230000096
其中ΔX和ΔY分别表示ZX中ZY元素下标集合。
公式(6)中的子问题2是一个非凸优化问题,因此我们利用著名的DC规划方法来利用凸松弛近似非凸公式。具体地说,公式(6)中可以表示为:
Figure BDA0002294359230000097
其中,
Figure BDA0002294359230000098
和h(W)是凸的,很容易证明
Figure BDA0002294359230000099
形式也是凸的。接着设
Figure BDA00022943592300000910
Figure BDA00022943592300000911
Figure BDA00022943592300000912
公式(11)可以表示成f(W)和g(h(W))之差的形式:
minWf(W)-g(h(W)) (12)
然后利用在许多非凸问题中常用的CCCP理论(convex-concave procedurealgorithm),将函数g(h(W))在当前的点W′处一阶泰勒展开:
Figure BDA00022943592300000913
这是非凸问题的凸上界。接下来,我们在每次迭代中使用CCCP算法最小化凸上界:
Figure BDA00022943592300000914
公式(6)对应于公式(14)凸松弛形式:
Figure BDA00022943592300000915
一种基于弱监督多任务矩阵补全的脑疾病进程预测系统,如图1所示,包括依次连接的数据采集单元、离线处理单元、进程预测单元,其中:
所述数据采集单元用于采集受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值。对于多位受试者,我们在baseline时间点对受试者进行核磁共振检查,正电子发射断层现象检查和脑脊液测量,从而获得受试者的MRI、PET脑图像,以及三种脑脊液的测量值,我们将这三个模态的数据作为训练数据。
分别用核磁共振仪和正子扫描仪进行核磁共振和正电子断层显像,得到原始的MRI和PET脑图像数据。由医生进行腰椎穿刺操作来获得脑脊液样本,此操作简单且危险性小,临床最为常用。
所述离线处理单元包括数据预处理模块和构建模型模块,其中,所述数据预处理模块用于对采集到的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征。所述构建模型模块用于利用预处理后的数据来训练所提出的基于弱监督多任务矩阵补全的脑疾病进程预测模型(公式(4))。
所述进程预测单元用于根据训练好的基于弱监督多任务矩阵补全的脑疾病进程预测模型对新待诊断的受试者进行脑疾病进程预测。对于新的待诊断的受试者,我们按照数据采集单元中的方法采集数据,然后离线处理单元中的方法对采集到的数据进行预处理,最后利用离线处理单元中训练出的脑疾病进程预测模型来预测出待诊断受试者的脑疾病进程。
对于新的待诊断的受试者,利用数据采集单元采集得到原始数据,然后利用离线处理单元中数据预处理模块对原始数据进行预处理,得到新受试者的样本特征。将新受试者的样本数据作为测试样本,输入到离线处理单元中构建模型模块训练出的脑疾病进程预测模型中,该样本对应的评分矩阵中的那一行即为进程预测结果。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于弱监督多任务矩阵补全的脑疾病进程预测方法,其特征在于,包括以下步骤:
步骤1:对受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征;
步骤2:利用多任务直推式矩阵补全模型,将对第一次去医院接受检查之后每个时间点的疾病状态预测都视作一个单任务回归任务,从而多个时间点的疾病状态预测建模为一个多任务回归问题,并对特征矩阵进行去噪,在标记部分缺失的情况下预测出认知评分矩阵;
步骤2具体包括如下步骤:
步骤2-1,基于特征矩阵X的低秩性假设和X与Y之间的线性关联假设,补全后得到的矩阵Z=[ZX,ZY]也是低秩的,其中,矩阵ZX是对应于矩阵X的真实潜在的特征矩阵,ZY是对应于矩阵Y的真实潜在的评分矩阵;通过对Z矩阵使用核范数约束,并对补全前的特征矩阵X和补全后的特征矩阵ZX之间使用F范数约束作为保真项,其公式如下:
Figure FDA0002294359220000011
其中,
Figure FDA0002294359220000012
Z是一个维度为n×(d+t)的矩阵,
Figure FDA0002294359220000015
表示实数,d代表特征数,n代表样本数,t代表任务数,W表示权重矩阵,λ12和λ3是正则化参数,‖Z‖*表示矩阵Z的核范数,P是一个mask矩阵,Pij表示矩阵P中第i行第j列的元素,当第i个样本在第j个时间点的认知评分缺失时,Pij=0,反之则为1,⊙表示哈达玛积;
步骤2-2,疾病进程预测的目的是预测出受试者在第一次去医院接受检查后一段时间的疾病状态,对第一次去医院接受检查后每隔一定时间间隔的特定时间点的疾病状态进行预测;采用简易精神状态量表MMSE和阿尔茨海默病评估量表-认知子量表ADAS-Cog的认知评分来表示受试者的疾病状态;
步骤3:利用混合稀疏组Lasso特征选择方法选择出所有任务共享的task-share特征和每个任务所独有的task-specific特征,利用task-share特征、task-specific特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测;
步骤3具体包括如下步骤:
步骤3-1,对系数矩阵
Figure FDA0002294359220000013
使用l2,1范数约束,使得W行稀疏,通过训练得到W,其中,W的每一行对应一个特征,每一列对应一个任务,W的非零行所对应的特征即为task-share特征;
步骤3-2,对系数矩阵
Figure FDA0002294359220000014
使用l1范数约束,使得W任意稀疏,使得W的非零行中出现随机的零值,所以W的非零行对应的特征即为非零行中非零值对应任务的task-specific特征;
步骤3-3,引入时序平滑正则化项对相邻时间点评分预测的较大偏差进行惩罚;
步骤3-4,结合步骤3-1、步骤3-2、步骤3-3中的范数约束,关于task-share特征和task-specific特征的特征选择项,又称混合稀疏组Lasso项:
Figure FDA0002294359220000021
步骤3-5,结合步骤3-1和步骤3-4中的直推式矩阵补全模型和混合稀疏组Lasso项,得到如下模型:
Figure FDA0002294359220000022
其中,稀疏矩阵
Figure FDA0002294359220000023
定义如下:
Figure FDA0002294359220000024
其他元素为零;
步骤3-6,将步骤3-4中的模型改进为如下的非凸多任务回归形式:
Figure FDA0002294359220000025
步骤3-7,结合快速迭代收缩阈值算法和DC规划方法设计步骤3-6所提出模型的求解方法;
通过交替迭代以下两个子问题来求解出W和Z:
Figure FDA0002294359220000026
其中,公式(5)中的子问题1用FISTA方法来求解,令:
Figure FDA0002294359220000027
其中,F(Z,W)表示公式(5)中除了核范数的可导项的集合;
那么子问题1就用如下方式求解:
Figure FDA0002294359220000028
其中,
Figure FDA0002294359220000029
表示核范数的近邻算子,
Figure FDA00022943592200000210
表示步长,而Lipschitz连续常数
Figure FDA00022943592200000211
求解如下:
Figure FDA00022943592200000212
其中,σ1(·)表示括号中矩阵的最大奇异值,T表示矩阵的转置,Id×d表示维度为d×d的单位矩阵;
此外,梯度
Figure FDA0002294359220000031
计算如下:
Figure FDA0002294359220000032
其中,ΔX和ΔY分别表示ZX中ZY元素下标集合,
Figure FDA0002294359220000033
Wk-1
Figure FDA0002294359220000034
分别表示在第k-1次迭代过程中ZX,W和ZY的值;
公式(6)中的子问题2是一个非凸优化问题,利用DC规划方法来利用凸松弛近似非凸公式,包括如下步骤:
Figure FDA0002294359220000035
其中,l(W)和h(W)表示一般式的函数,l(W)和h(W)是凸的,很容易证明
Figure FDA0002294359220000036
形式也是凸的,接着设f(W)=l(W)+e(W)和
Figure FDA0002294359220000037
公式(11)表示成f(W)和g(h(W))之差的形式:
minWf(W)-g(h(W)) (12)
然后利用在许多非凸问题中常用的CCCP理论,将函数g(h(W))在当前的点W′处一阶泰勒展开:
Figure FDA0002294359220000038
这是非凸问题的凸上界,接下来,在每次迭代中使用CCCP算法最小化凸上界:
Figure FDA0002294359220000039
公式(6)对应于公式(14)凸松弛形式:
Figure FDA00022943592200000310
其中,Wk+1表示第k+1次迭代过程中W的值,
Figure FDA00022943592200000311
ε是一个避免分母为零的较小常数项,wi表示矩阵W的第i行,wi(t)表示第k次迭代中wi的值,λ4表示特征选择项的超参数,d表示特征数。
2.根据权利要求1所述基于弱监督多任务矩阵补全的脑疾病进程预测方法,其特征在于:步骤1中得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征的方法如下:
步骤1-1,对磁共振成像MRI依次使用前连合AC–后连合PC矫正、强度不均匀性校正、头骨剥离、基于阿特拉斯配准的小脑摘除术、空间分割,得到基于Jacob模板的具有93个手动标记感兴趣区ROI的标记图像,并分别计算这93个手动标记感兴趣区ROI的灰质体积作为磁共振成像特征;
步骤1-2,对于每个正电子发射断层显像PET,使用仿射配准将正电子发射断层显像PET图像与其各自的磁共振成像MRI对齐,然后,利用相应的磁共振脑掩模得到颅骨剥离图像,并计算出正电子发射断层显像PET图像中每个手动标记感兴趣区ROI的平均强度作为正电子发射断层显像特征;
步骤1-3,对于脑脊液CSF,使用CSF Aβ42,CSF t-tau和CSF p-tau三项的测量值作为脑脊液特征。
3.根据权利要求1所述基于弱监督多任务矩阵补全的脑疾病进程预测方法,其特征在于:在预测时,加入人口统计学特征,人口统计学特征包括受试者的年龄、受教育情况、性别。
4.根据权利要求1所述基于弱监督多任务矩阵补全的脑疾病进程预测方法,其特征在于:步骤2-2中第一次去医院接受检查后每隔一定时间间隔的特定时间点包括第一次去医院接受检查后06个月、12个月、24个月、36个月、48个月。
5.一种基于弱监督多任务矩阵补全的脑疾病进程预测系统,其特征在于:包括依次连接的数据采集单元、离线处理单元、进程预测单元,其中:
所述数据采集单元用于采集受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值;
所述离线处理单元包括数据预处理模块和构建模型模块,其中,所述数据预处理模块用于对采集到的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征;所述构建模型模块用于利用预处理后的数据来训练所提出的基于弱监督多任务矩阵补全的脑疾病进程预测模型;
所述进程预测单元用于根据训练好的基于弱监督多任务矩阵补全的脑疾病进程预测模型对新待诊断的受试者进行脑疾病进程预测。
CN201911194547.9A 2019-11-28 2019-11-28 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 Active CN111063442B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911194547.9A CN111063442B (zh) 2019-11-28 2019-11-28 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统
PCT/CN2020/070259 WO2021103287A1 (zh) 2019-11-28 2020-01-03 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911194547.9A CN111063442B (zh) 2019-11-28 2019-11-28 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统

Publications (2)

Publication Number Publication Date
CN111063442A true CN111063442A (zh) 2020-04-24
CN111063442B CN111063442B (zh) 2022-07-15

Family

ID=70299340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911194547.9A Active CN111063442B (zh) 2019-11-28 2019-11-28 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统

Country Status (2)

Country Link
CN (1) CN111063442B (zh)
WO (1) WO2021103287A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933284A (zh) * 2020-09-27 2020-11-13 平安科技(深圳)有限公司 一种并发症风险预测系统、方法、装置、设备及介质
CN112489801A (zh) * 2020-12-04 2021-03-12 北京睿思昆宁科技有限公司 一种确定疾病风险的方法、装置和设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903456B (zh) * 2021-10-21 2024-05-14 江苏大学 一种基于核集成回归的抑郁症预测方法
CN114510966B (zh) * 2022-01-14 2023-04-28 电子科技大学 一种基于图神经网络的端到端大脑因果网络构建方法
CN115905837B (zh) * 2022-11-17 2023-06-30 杭州电子科技大学 异常自动检测的半监督自适应标记回归脑电情感识别方法
CN117786536B (zh) * 2024-02-23 2024-05-10 北京壹永科技有限公司 大语言模型训练方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156484A (zh) * 2016-06-08 2016-11-23 中国科学院自动化研究所 基于磁共振影像的脑疾病个体化预测方法和系统
CN109166626A (zh) * 2018-10-29 2019-01-08 中山大学 一种消化性溃疡病人的医疗指标缺失数据补全方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506797A (zh) * 2017-08-25 2017-12-22 电子科技大学 一种基于深度神经网络和多模态影像阿尔兹海默病分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156484A (zh) * 2016-06-08 2016-11-23 中国科学院自动化研究所 基于磁共振影像的脑疾病个体化预测方法和系统
CN109166626A (zh) * 2018-10-29 2019-01-08 中山大学 一种消化性溃疡病人的医疗指标缺失数据补全方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933284A (zh) * 2020-09-27 2020-11-13 平安科技(深圳)有限公司 一种并发症风险预测系统、方法、装置、设备及介质
CN111933284B (zh) * 2020-09-27 2021-01-05 平安科技(深圳)有限公司 一种并发症风险预测系统、方法、装置、设备及介质
CN112489801A (zh) * 2020-12-04 2021-03-12 北京睿思昆宁科技有限公司 一种确定疾病风险的方法、装置和设备

Also Published As

Publication number Publication date
WO2021103287A1 (zh) 2021-06-03
CN111063442B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN111063442B (zh) 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统
Shoeibi et al. Applications of deep learning techniques for automated multiple sclerosis detection using magnetic resonance imaging: A review
Dinsdale et al. Learning patterns of the ageing brain in MRI using deep convolutional networks
Zeng et al. A new deep belief network-based multi-task learning for diagnosis of Alzheimer’s disease
Liu et al. Towards clinical diagnosis: Automated stroke lesion segmentation on multi-spectral MR image using convolutional neural network
Basheera et al. Convolution neural network–based Alzheimer's disease classification using hybrid enhanced independent component analysis based segmented gray matter of T2 weighted magnetic resonance imaging with clinical valuation
CN109770932B (zh) 多模态脑部神经影像特征的处理方法
Dabiri et al. Muscle segmentation in axial computed tomography (CT) images at the lumbar (L3) and thoracic (T4) levels for body composition analysis
Ke et al. Exploring the structural and strategic bases of autism spectrum disorders with deep learning
Basheera et al. A novel CNN based Alzheimer’s disease classification using hybrid enhanced ICA segmented gray matter of MRI
CN108288070B (zh) 一种神经指纹提取分类方法及系统
Bron et al. Standardized evaluation of algorithms for computer-aided diagnosis of dementia based on structural MRI: the CADDementia challenge
CN111488914B (zh) 一种基于多任务学习的阿尔茨海默症分类及预测系统
Tagaris et al. Machine learning for neurodegenerative disorder diagnosis—survey of practices and launch of benchmark dataset
Yue et al. Auto-detection of Alzheimer's disease using deep convolutional neural networks
Zhang et al. Deep learning with attention supervision for automated motion artefact detection in quality control of cardiac T1-mapping
JP2022547722A (ja) 細胞検出およびセグメンテーションのための弱教師ありマルチタスク学習
Ngo et al. Predicting individual task contrasts from resting‐state functional connectivity using a surface‐based convolutional network
Vakli et al. Predicting body mass index from structural MRI brain images using a deep convolutional neural network
CN113658721A (zh) 阿尔兹海默疾病进程预测方法
Attye et al. TractLearn: A geodesic learning framework for quantitative analysis of brain bundles
Jia et al. Deep learning and multimodal feature fusion for the aided diagnosis of Alzheimer's disease
Yang et al. Diagnosis of Parkinson’s disease based on 3D ResNet: The frontal lobe is crucial
Jiang et al. Transfer learning on T1-weighted images for brain age estimation
Kushol et al. SF2Former: Amyotrophic lateral sclerosis identification from multi-center MRI data using spatial and frequency fusion transformer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant