CN114711721A - 基于特征信息聚集模型的ad诊断及风险要素确定方法 - Google Patents

基于特征信息聚集模型的ad诊断及风险要素确定方法 Download PDF

Info

Publication number
CN114711721A
CN114711721A CN202210339756.3A CN202210339756A CN114711721A CN 114711721 A CN114711721 A CN 114711721A CN 202210339756 A CN202210339756 A CN 202210339756A CN 114711721 A CN114711721 A CN 114711721A
Authority
CN
China
Prior art keywords
gene
brain
brain region
convolution
information aggregation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210339756.3A
Other languages
English (en)
Inventor
毕夏安
岳玲霞
胡溪
曾彬
徐露允
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Normal University
Original Assignee
Hunan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Normal University filed Critical Hunan Normal University
Priority to CN202210339756.3A priority Critical patent/CN114711721A/zh
Publication of CN114711721A publication Critical patent/CN114711721A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7246Details of waveform analysis using correlation, e.g. template matching or determination of similarity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Surgery (AREA)
  • Neurology (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Veterinary Medicine (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychology (AREA)
  • Neurosurgery (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于特征信息聚集模型的AD诊断及风险要素确定方法,所述方法包括:根据被试者的脑影像数据和基因数据,构建该被试者的脑区‑基因网络;将所述脑区‑基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区‑基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息,并提取特征后输出分类结果;根据该模型输出的结果,诊断该被试者是否为阿尔茨海默症AD患者;其中,所述特征信息聚集模型是以多个LMCI患者的脑区‑基因网络和AD患者的脑区‑基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块以及特征提取分类模块。应用本发明可以对阿尔茨海默症做精准的诊断。

Description

基于特征信息聚集模型的AD诊断及风险要素确定方法
技术领域
本发明涉及计算机技术领域,特别是指一种基于特征信息聚集模型的AD 诊断及风险要素确定方法。
背景技术
阿尔茨海默病以一系列显著的痴呆症状为特征,常见于老年人。AD的发病机制复杂,其发病因素横跨宏观到微观多个层次,例如,大脑功能与结构的病变与基因的异常表达密切相关,因此,找到大脑宏观病变与微观变异的关联模式有助于揭示阿尔茨海默症的多层次发病机制。一些研究人员构建网络,将基因或大脑区域抽象为节点,以研究致病因素之间的功能相关性。 Huang等人定义了每个脑区的嵌入表示,并提出了一种新的度量评估两个区域之间的相似性,使测量结果更加合理。Lella等人在分析大脑网络时引入了沟通距离,提供了新的3种方法发现与AD发展相关的隐藏模式。
然而,现有技术基于目前方法分析得到的脑区网络和基因网络进行AD 诊断的准确率比较低,有必要提供一种AD诊断准确率更高的AD诊断方法。
发明内容
有鉴于此,本发明的目的在于提出一种基于特征信息聚集的阿尔茨海默症的诊断方法和装置,可以对阿尔茨海默症做精准的诊断。
基于上述目的,本发明提供一种基于特征信息聚集模型的AD诊断方法,包括:
根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;
将所述脑区-基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区-基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息,并提取特征后输出分类结果;
根据该模型输出的结果,诊断该被试者是否为阿尔茨海默症AD患者;
其中,所述特征信息聚集模型是以多个正常人的脑区-基因网络和AD患者的脑区-基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块以及特征提取分类模块。
较佳地,所述卷积模块中的每个图卷积层是用于进行一次特征信息聚集的:
所述特征信息聚集模型中的一个图卷积层,对输入其的脑区-基因网络的特征矩阵进行“边-点”卷积与“点-边”卷积,以使得所述脑区-基因网络中每个节点能够聚集邻接节点与相似节点的信息,输出经过一次特征信息聚集的脑区-基因网络的特征矩阵。
较佳地,所述“边-点”卷积,具体包括:
以所述脑区-基因网络的权重矩阵作为“卷积核”,与输入的脑区-基因网络的特征矩阵进行卷积操作,以使得所述脑区-基因网络中每个节点能够聚集邻接节点的信息。
较佳地,所述“点-边”卷积,具体包括:
以所述脑区-基因网络的相似矩阵作为“卷积核”,与输入的脑区-基因网络的特征矩阵进行卷积操作,以使得所述脑区-基因网络中每个节点能够聚集相似节点的信息。
较佳地,所述特征提取分类模块中具体包括:
平坦层,用于将所述卷积模块输出的二维的特征矩阵展平为一维特征数据;
两个完全连接层,用于对所述一维特征数据进行线性组合与非线性变换,提取更高级的特征;
输出层,用于根据完全连接层提取的特征,输出正常人与AD患者的分类结果。
本发明还提供一种基于特征信息聚集模型的AD风险要素确定方法,包括:
将正常人和AD患者的脑区-基因网络通过所述特征信息聚集模型进行多次特征信息聚集,并提取特征后输出分类结果;
将经过多次特征信息聚集的正常人的脑区-基因网络和AD患者的脑区-基因网络进行比较;
将比较结果中有显著差异的节点确定为AD风险要素;
其中,所述特征信息聚集模型是以多个LMCI患者的脑区-基因网络和AD 患者的脑区-基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块和特征提取分类模块。
较佳地,所述将经过多次特征信息聚集的正常人的脑区-基因网络和AD 患者的脑区-基因网络进行比较;将比较结果中有显著差异的脑区与基因确定为AD风险要素,具体包括:
基于全梯度显著性图机制,根据所述特征信息聚集模型对正常人和AD患者的脑区-基因网络输出的结果与真实情况的接近程度,计算所述特征信息聚集模型中特征提取分类模块中的神经元的重要度;
根据计算的神经元的重要度,确定脑区-基因网络中各节点的重要度;
根据节点的重要度,确定出所述脑区-基因网络中作为AD风险要素的节点。
较佳地,所述根据节点的重要度,确定出所述脑区-基因网络中作为AD 风险要素的节点,具体包括:
对所述脑区-基因网络中所有节点,按照重要度分别进行脑区与基因的降序排序,并使用增量搜索法进一步筛选出最优的脑区特征子集与基因特征子集;
将筛选出的最优的脑区特征子集中的节点确定为为AD风险要素中的病变脑区,将筛选出的最优的基因特征子集中的节点确定为为AD风险要素中的风险基因。
进一步,所述方法还包括:
将确定出的病变脑区与风险基因两两任意组合成为脑区-基因对,并进行显著性检验;
将显著性检验结果小于阈值的脑区-基因对,确定为具有关联关系的病变脑区与风险基因。
本发明还提供一种电子设备,包括中央处理单元、信号处理和存储单元,以及存储在信号处理和存储单元上并可在中央处理单元上运行的计算机程序,其中,所述中央处理单元执行如上所述的基于特征信息聚集模型的AD诊断方法或基于特征信息聚集模型的AD风险要素确定方法。
本发明的技术方案中,根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;将所述脑区-基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区-基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息,并提取特征后输出分类结果;根据该模型输出的结果,诊断该被试者是否为阿尔茨海默症AD患者;其中,所述特征信息聚集模型是以多个正常人的脑区-基因网络和AD患者的脑区-基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块以及特征提取分类模块。由于特征信息聚集模型可以对输入的脑区-基因网络进行多次特征信息聚集,使得多次特征信息聚集后的正常人与AD患者的脑区-基因网络差异显著,从而提高特征信息聚集模型识别AD患者的脑区-基因网络的准确性,即可以对阿尔茨海默症做精准的诊断。
本发明的技术方案,将正常人和AD患者的脑区-基因网络通过所述特征信息聚集模型进行多次特征信息聚集,并提取特征后输出分类结果;将经过多次特征信息聚集的正常人的脑区-基因网络和AD患者的脑区-基因网络进行比较;将比较结果中有显著差异的节点确定为AD风险要素,即AD的病变脑区和风险基因,以便助力靶向药物开发和针对性经颅磁治疗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的正常人与AD患者的脑区-基因网络的一次特征信息聚集过程示意图;
图2a、图2b为本发明提供的特征信息聚集模型的内部结构示意图;
图3为本发明提供的相似矩阵的构建示意图;
图4为本发明提供的一阶“边-点”卷积的操作示意图;
图5为本发明提供的相似矩阵与隐藏边的构建示意图;
图6为本发明提供的一阶“点-边”卷积的操作示意图;
图7为本发明提供的一阶图卷积示意图;
图8为本发明提供的二阶“边-点”卷积的操作示意图;
图9为本发明提供的二阶“点-边”卷积的操作示意图;
图10为本发明提供的二阶图卷积示意图;
图11为本发明提供的平坦层、完全连接层与输出层的结构示意图;
图12为本发明提供的一种特征信息聚集模型的训练方法流程图;
图13为本发明实施例一提供的一种基于特征信息聚集模型的AD诊断方法流程图;
图14为本发明实施例二提供的一种基于特征信息聚集模型的AD风险要素确定方法流程图;
图15为本发明实施例二提供的确定AD风险要素的具体方法流程图;
图16为本发明实施例二提供的特征提取流程图;
图17为本发明实施例二提供的特征提取的矩阵示例图;
图18为本发明实施例二提供的特征提取的流程示例图;
图19为本发明实施例提供的电子设备硬件结构示意图;
图20为本发明实施例提供的实验结果对比示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本发明的发明人发现,AD患者的大脑发生了质的变化,例如,部分脑区出现萎缩,功能连接出现大量异常。大脑的这些宏观病变与微观层面基因的异常表达密切相关,揭示从宏观到微观发病因素的关联机制。因此,根据患者的脑影像数据和基因数据,分别构建脑区网络和基因网络后,再进一步将两者融合得到的脑区-基因网络,可以体现大脑的这些宏观病变与微观层面基因的异常表达之间的关系。
本发明的发明人考虑到,在脑区-基因网络中,脑区或基因一般是两个或多个之间共同协作来完成任务。如果两个脑区或基因共享许多邻居,它们往往联系紧密,并且如果其中一个脑区或基因发生变化,另一个脑区或基因能够接收到变化的信息,甚至也可能会发生相应的变化。基于以上规律,本发明对脑区-基因网络中节点特征信息的传递过程建立特征信息聚集模型,本文将特征信息聚集模型简称为FAGCN。
特征信息聚集模型设计的思想是:对于每个节点,以聚集其邻域节点与相似节点的特征信息这种方式更新节点自身的特征信息。经过n次特征信息聚集,每个节点能够聚集到其n阶邻域内所有节点以及相似节点的特征信息,进而生成新的节点表示。
经过训练后的特征信息聚集模型可以实现在多次特征信息聚集后,正常人的脑区-基因网络和AD患者的脑区-基因网络具有更为显著的差异,从而可以提高特征信息聚集模型对正常人和AD患者进行分类的准确性,也就是说,可以提高AD诊断的准确性。
此外,经过训练后的特征信息聚集模型可以实现在多次特征信息聚集后,正常人的脑区-基因网络和AD患者的脑区-基因网络具有更为显著的差异,基于此还可以更精准地找到大脑的病变脑区与风险基因,进而捕捉病变脑区与风险基因之间的关联模式,从而掌握疾病从微观到宏观的发病机制,从而有助于针对性经颅磁治疗和靶向药物开发。
下面基于正常人与AD患者的脑区-基因网络阐述特征信息聚集的过程。如图1所示,图1中的(a)图是AD患者脑区-基因网络的一次特征信息聚集过程,图1中的(b)图是正常人脑区-基因网络的一次特征信息聚集过程。一次特征信息聚集过程包括邻接节点信息的聚集与相似节点信息的聚集,分别用实线连接与虚线连接表示,在虚线框中的蓝色区域为中心节点V1的一阶邻域。在AD患者的脑区-基因网络中,每经过一次特征信息聚集,病变节点聚集了其病变的邻接节点与相似节点的信息,病变程度逐渐加深;而在正常人的脑区-基因网络中不存在病变节点,因此经过特征信息聚集后依然不会存在病变节点,通过多次特征信息聚集,AD患者与正常人的脑区-基因网络中有显著差异的节点都是病变节点。也就是说,模型可以通过多次的特征信息聚集精准地进行正常人与AD的分类,也可捕获病变脑区与风险基因,并且进一步可以发现它们之间的关联模式。
下面结合附图详细说明本发明的技术方案。
下面针对脑区-基因网络建立特征信息聚集模型,模型的要素包括如下:
脑区-基因网络集合:G={Gi|i=1,2,...,m},Gi表示正常人NC或AD患者的第i个脑区-基因网络,由第i个被试者的脑影像数据与基因数据构建。
节点的特征信息:
Figure BDA0003578640030000081
表示脑区-基因网络初始状态时第i个节点的特征信息,
Figure BDA0003578640030000082
表示第t次特征信息聚集后第i个节点的特征信息。当节点为脑区时,节点的特征信息是脑区的时间序列值,即在固定时间点下扫描所述脑区得到的血氧依赖水平值;当节点为基因时,节点的特征信息是基因的编码序列值。
边的权重:W={Wij|i,j=1,2,...,N},Wij表示节点i与节点j之间边的权重,通过计算它们的皮尔逊相关系数得到,权重越大表明节点i与节点j之间的邻近程度越紧密。
节点间的相似值:S={Sij|i,j=1,2,...,N},Sij为节点i与节点j之间的相似值,表示节点i与节点j之间的相似性,
Figure BDA0003578640030000083
Common(i,j)表示节点i与节点j共有的邻接节点个数,N表示脑区-基因网络中节点的总数,两个节点共有的邻域节点个数越多,它们越相似。
根据以上模型要素,在每一次特征信息聚集的过程中,脑区-基因网络的每个节点聚集其邻接节点与相似节点的特征信息,一次特征信息聚集分为两个步骤:(1)聚集邻域节点的特征信息更新自身特征信息;(2)聚集相似节点的特征信息更新自身特征信息。经过n次特征信息聚集后,节点聚集了其n阶邻接节点与相似节点的特征信息。脑区-基因网络中节点的第t次特征信息聚集过程如下:
第一步:聚集邻域节点的特征信息更新自身特征信息。脑区-基因网络中每个节点都会聚集来自相邻节点,即邻接节点的特征信息,进而更新自身特征信息。在第t次特征信息聚集中,节点聚集的邻接节点的特征信息
Figure BDA0003578640030000091
的计算方式如公式一所示:
Figure BDA0003578640030000092
其中,
Figure BDA0003578640030000093
表示节点j聚集其邻接节点(包括节点j自身)的特征信息之和。
第二步:聚集相似节点的特征信息更新自身特征信息。两个节点越相似,互相影响的程度就越大,互相可以聚集的信息就越多。在第t次特征信息聚集后,节点聚集的相似节点的特征信息H(t)的计算方式如公式二所示:
Figure BDA0003578640030000094
其中,
Figure BDA0003578640030000095
表示节点j聚集其相似节点(包括节点j自身)的特征信息之和。
经过n次特征信息聚集后,模型能够捕捉到正常人与病人脑区-基因网络之间的差异,可以完成正常人与AD患者的分类任务,如公式三所示:
P=Classify(H(n)) (公式三)
其中,H(0)表示脑区-基因网络初始状态时的特征信息矩阵,H(n)表示脑区-基因网络经过n次特征信息聚集后节点的特征信息;Classify(·)表示分类函数;P表示分类结果为病人或者正常人的概率,是一个大小为2×1的向量。
最后,根据分类结果找出正常人与病人之间具有显著差异的脑区与基因,即病变脑区与风险基因,特征提取的公式如公式四所示:
Score=Feature_extract(P,H(n))(公式四)
其中,P表示分类结果;H(n)表示脑区-基因网络经过n次特征信息聚集后节点的特征信息;Feature_extract表示特征提取函数,结果为脑区或基因的重要性分数,分数越大表明该脑区或基因在正常人与病人之间差异越大,因此分数大的脑区或基因就是模型捕获的病变脑区与风险基因。将这些病变脑区与风险基因两两任意组合成为脑区-基因对,并进行显著性检验;将显著性检验结果小于阈值,比如,显著性检验结果p<0.05的脑区-基因对,确定为具有关联关系的病变脑区与风险基因。
综上所述,将公式一~公式四联立,用以下方程组来表示脑区-基因网络的特征信息聚集模型及其应用:
Figure BDA0003578640030000101
公式一与公式二表示第t次特征信息聚集中节点聚集其邻接节点与相似节点的信息,公式三表示基于n次特征信息聚集后节点的特征信息对正常人与AD患者分类,公式四表示利用分类结果与节点特征信息提取AD患者的病变脑区与风险基因。
基于上述的分析,本发明提供的基于神经网络的特征信息聚集模型的内部结构如图2a所示,包括:卷积模块201和特征提取分类模块202。
其中,卷积模块201为模型的核心卷积部分,用于将所述脑区-基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区-基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息;
具体地,卷积模块201中包含多个图卷积层,每个图卷积层是用于进行一次特征信息聚集的:所述特征信息聚集模型中的一个图卷积层,对输入其的脑区-基因网络的特征矩阵进行“边-点”卷积与“点-边”卷积,以使得所述脑区-基因网络中每个节点能够聚集邻接节点与相似节点的信息,输出经过一次特征信息聚集的脑区-基因网络的特征矩阵。此外,每个图卷积层还对经过一次特征信息聚集的脑区-基因网络的特征矩阵进行激活函数运算。
比如,如图2b所示,卷积模块201中可以包括两个图卷积层GCN1、 GCN2,即一阶图卷积层L1与二阶图卷积层L2;L1与L2这两层图卷积层中都包含了两种卷积,分别是“边-点”(Edge-Node,E-N)卷积与“点-边” (Node-Edge,N-E)卷积,以及激活函数运算;这两层图卷积层的主要目的是使得脑区-基因网络中每个节点能够聚集邻接节点与相似节点的信息。
特征提取分类模块202是模型的全连接层部分,包含平坦层(Flatten Layer)L3、两个完全连接层(FC Layer)L4与L5,以及输出层(softmax Layer) L6。
L3平坦层的主要目的是将脑区-基因网络经过卷积模块201的卷积操作后得到的二维的特征矩阵展平为一维特征数据;L4、L5完全连接层主要将得到的一维特征数据进行线性组合与非线性变换,从而提取更高级的特征;最后,利用L6层Softmax实现正常人与AD患者的分类任务。
具体地,输入到特征信息聚集模型中的脑区-基因网络的特征矩阵可以表示为
Figure BDA0003578640030000111
在脑区-基因网络中,脑区节点的特征信息由其时间序列的值表示,基因节点的特征信息由其编码序列的值表示,由此构造的输入到特征信息聚集模型中的脑区-基因网络的特征信息矩阵
Figure BDA0003578640030000112
表达式如公式五所示:
Figure BDA0003578640030000121
其中,
Figure BDA0003578640030000122
为初始状态时脑区-基因网络中每个节点的特征维数;N表示脑区-基因网络中节点的总数,T表示转置,
Figure BDA0003578640030000123
表示第k个节点的序列的转置。
构建的脑区-基因网络的权重矩阵W∈RN×N。Wij表示节点i与节点j之间边的权重,用皮尔逊相关系数计算得到,定义Peari,j为第i,j个节点间的皮尔逊相关系数,则权重矩阵W可表示为公式六:
Figure BDA0003578640030000124
构建的脑区-基因网络的相似矩阵S∈RN×N。如图3所示,图3中的(a)表示有N个节点的脑区-基因网络。根据每个节点拥有的邻接节点的情况对其进行二进制编码得到N×N的0-1邻接矩阵,如图3中的(b)所示。比较两两节点的二进制编码在相同位置上同为1的数目,该数目在总节点数中的占比即为两个节点的相似值。一个节点与其他所有节点的相似值构成该节点的相似向量,所有节点的相似向量最后构成一个N×N的相似矩阵S,如图3中的(c)所示。此外,通过一个设定值ε来对相似值进行筛选得到更新后的相似矩阵S中的元素,如公式七所示;亦即相似值大于等于设定值ε的两个节点判定为相似节点;
Figure BDA0003578640030000125
其中,Sij表示第i,j个节点间的相似值。
基于上述构建的特征矩阵H(0)、权重矩阵W与相似矩阵S,脑区-基因网络经过第一次特征信息聚集后,每个节点聚集了一阶邻接节点与一阶相似节点的特征信息后得到新的特征矩阵H(1),计算公式如公式八所示:
H(1)=ReLU(S(WH(0)β(0)) (公式八)
其中,
Figure BDA0003578640030000131
表示一阶图卷积的系数矩阵,包含
Figure BDA0003578640030000132
个可学习的参数;ReLU(·)是激活函数;
Figure BDA0003578640030000133
为初始状态时脑区-基因网络中每个节点的特征维数,
Figure BDA0003578640030000134
为经过一阶降维后每个节点的特征维数。
一阶图卷积层L1中的具体卷积操作,包含一阶E-N卷积与一阶N-E卷积:
(1)一阶E-N卷积,用来计算公式八中的WH(0)
一阶E-N卷积的输入是大小为|N|×|U|的脑区-基因网络的特征矩阵 H(0),输出是大小为|N|×|U|的特征矩阵WH(0)。一阶E-N卷积中以大小为 |N|×|N|的脑区-基因网络的权重矩阵W作为“卷积核”。其中,U为初始的所述脑区-基因网络中每个节点的特征维数。
以一个具有7个节点的脑区-基因网络为例解释一阶E-N卷积操作。如图 4所示,图4的(a)中V1为将要进行一阶E-N卷积操作的中心节点,V3、V4、 V6为该中心节点的一阶邻接节点。图4的(c)-(e)是对节点V1的一阶E-N 卷积操作。图4的(b)与(c)为脑区-基因网络的权重矩阵W∈R7×7,第一行的数值表示节点V1与节点V1-V7之间的联系程度,值越大表示联系越紧密,将其作为权重一一对应赋予给图4的(d)中的特征矩阵H(0)∈R7×6的每1 列,再进行加权求和得到节点V1相应的值,完成对节点V1的一阶E-N卷积操作。以此类推,对其它节点也进行一阶E-N卷积操作,得到图4的(e)中矩阵WH(0)∈R7×6
(2)一阶N-E卷积,用来计算公式八中的S(WH(0)(0)
一阶N-E卷积的输入是一阶E-N卷积后得到的大小为|N|×|U|的特征矩阵WH(0),输出是大小为|N|×|P|(|P|<|U|)的特征矩阵S(WH(0)(0)。一阶 N-E卷积中以大小为|N|×|N|的脑区-基因网络的相似矩阵S作为“卷积核”。其中,P为经过一阶图卷积层L1后的脑区-基因网络中每个节点的特征维数。
以一个具有7个节点的脑区-基因网络为例解释一阶N-E卷积的操作:如图5所示,图5的(a)中节点V1为将要进行一阶N-E卷积操作的中心节点。 V1的邻接节点有V3、V4、V6,其二进制编码为1011010,以此类推得到0-1 邻接矩阵如图5的(b)所示。V1的二进制编码与V5的二进制编码在相同位置上同为1的数目为3,占总节点数的比例约等于0.43,因此节点V1与节点V5的相似度为0.43,以此类推得到相似矩阵S如图5的(c)所示。假设设定的阈值为0.4,小于等于0.4的置0,等于1的也置0,图5的(d)为更新后的相似矩阵S。可以发现V1的一阶相似节点是V5,因此在V1与V5之间建立一条隐藏边E15,如图5的(e)所示。
进而利用建立的隐藏边来对经过一阶E-N卷积操作后的图进行一阶N-E 卷积,如图6所示,图6中的(a)所示脑区-基因网络加入了一条隐藏边E15。图6中的(b)与(c)为脑区-基因网络的相似矩阵S∈R7×7,第一行的数值表示节点V1与节点V1-V7之间的相似程度,值越大表示越相似。将相似矩阵S 与图6中(d)的特征矩阵X(1)∈R7×6做卷积,X(1)为上述一阶E-N卷积的输出结果,以及完成对节点V1的一阶N-E卷积操作。以此类推,对其它节点也进行一阶“点-边”卷积操作,即图6中(e)的矩阵S(WH(0))∈R7×6。图6中 (f)为一阶图卷积层L1的系数矩阵β0∈R6×5,将图6中(e)矩阵的第一行与系数矩阵的每一列分别进行加权求和得到最后的特征矩阵 S(WH(0)0∈R7×5,如图6中(g)所示;S(WH(0)0经过激活函数ReLU(·) 运算后得到公式八的H(1)
一阶E-N卷积的意义:在E-N卷积过程中,一个节点与其所有邻接节点之间的边的权重决定了这些邻接节点有多少信息传递给该节点,也就是说邻接节点的信息是沿着边将信息传送给该节点。在脑区-基因网络中,脑区或基因一般是两个或多个之间共同协作来完成任务,而基因可以通过基因表达影响脑区的功能与结构。本发明设计的E-N卷积能够很好捕捉脑区或基因与其邻接节点之间的联系,从而使每个脑区或基因都聚集来自本身及其邻接节点的信息。如图7中的(a)所示,表示一阶E-N卷积操作。以图中节点V1为例,虚线框出来的蓝色区域为节点V1的一阶邻域。经过一阶E-N卷积,该节点聚集了自身及其一阶邻接节点的信息。
一阶N-E卷积的意义:没有邻接关系的两个节点之间也可能因为有着相似的一阶邻域而互相关联,称这两个节点互为一阶相似节点,并在它们间构建一条隐藏的边。在脑区-基因网络中,如果两个脑区或基因共享许多邻接节点,它们往往相似,并且如果其中一个脑区或基因发生变化,另一个脑区或基因很可能发生相应的变化。本发明设计的N-E卷积能够很好地捕捉脑区或基因与其相似节点之间的联系,从而使每个脑区或基因都能够聚集来自相似节点的信息。如图7中的(b)所示,表示一阶N-E卷积操作。以图7中(b) 所示节点V1、V5为例,紫色虚线框出来的区域为V1的一阶邻域,蓝色虚线框出来的区域为节点V5的一阶邻域,这两个节点的一阶邻域的交集包含3个节点,因此认为它们互为一阶相似节点,绿色虚线是在它们之间建立的一条隐藏边。经过一阶N-E卷积,V1聚集了其一阶相似节点V5的信息。
基于经过一次特征信息聚集后得到的特征矩阵H(1),以及权重矩阵W与相似矩阵S,脑区-基因网络经过第二次特征信息聚集后,每个节点聚集了二阶邻接节点与二阶相似节点的特征信息,得到新的特征矩阵H(2)的计算公式如公式九所示:
H(2)=softmax(S(WG(1)(1)) (公式九)
其中,
Figure BDA0003578640030000161
表示二阶图卷积的系数矩阵,包含
Figure BDA0003578640030000162
个可学习的参数;softmax(·)是激活函数,
Figure BDA0003578640030000163
为经过二阶降维后每个节点的特征维数。
下面介绍二阶图卷积层L2的具体卷积操作,包含二阶E-N卷积与二阶 N-E卷积:
(1)二阶E-N卷积,用来计算公式九中的WH(1)
二阶E-N卷积的输入是大小为|N|×|P|的特征矩阵H(1)=S(WH(0)(0),输出是大小为|N|×|P|的特征矩阵WH(1)。与一阶E-N卷积一样,二阶E-N 卷积中以大小为|N|×|N|的脑区-基因网络的权重矩阵W作为“卷积核”。
以图8为例解释二阶E-N卷积操作,在一阶图卷积层输出的具有7个点的脑区-基因网络的基础上,在外层又加了一圈节点,以表示V1-V7的二阶邻居节点,而为了简化计算步骤,后续操作还是只针对V1-V7。图8中(a)的V1为将要进行二阶E-N卷积操作的中心节点。与一阶E-N卷积同理,将权重矩阵W与特征矩阵H(1)做卷积,得到节点V1的二阶E-N卷积结果,以此类推,最后得到特征矩阵WH(1)∈R7×5,如图8中(e)所示。
(2)二阶N-E卷积,用来计算公式九中的S(WH(1)(1)
二阶N-E卷积的输入是上述二阶E-N卷积后得到的大小为|N|×|P|的特征矩阵WH(1),输出是大小为|N|×|Q|(|Q|<|P|)的特征矩阵S(WH(1)(1)。其中,Q为经过二阶图卷积层L2后的脑区-基因网络中每个节点的特征维数。
与一阶N-E卷积一样,二阶N-E卷积中以大小为|N|×|N|的脑区-基因网络的相似矩阵S作为“卷积核”。以二阶E-N卷积输出的脑区-基因网络为例解释二阶N-E卷积操作。如图9所示,图9中(a)的节点V1为将要进行二阶 N-E卷积操作的中心节点。与一阶N-E卷积同理,将相似矩阵S与特征矩阵H(1)做卷积,得到节点V1的二阶N-E卷积结果,以此类推,最后得到特征矩阵 S(WH(1))∈R7×5,如图9中(e)所示。图9中(f)为二阶图卷积层L2的系数矩阵β(1)∈R5×4,将S(WH(1))与β(1)相乘得到最后的特征矩阵 S(WH(1)(1)∈R7×4,如图9中(g)所示;S(WH(1)(1)经过激活函数 softmax(·)运算后得到公式九中的H(2)
二阶E-N卷积的意义:不同于一阶E-N卷积,二阶E-N卷积能够聚集除了一阶邻居节点以外的二阶邻居节点的信息。具体地,每个节点经过一阶E-N 卷积,都能够聚集其一阶邻域节点的信息,此时对这些节点再进行一阶E-N 卷积就使得每个节点聚集了其二阶邻居节点的信息,故称二阶E-N卷积。如图10中(a)所示,表示二阶E-N卷积操作。以图10中(a)节点V1为例,虚线框出来的蓝色区域为节点V1的二阶邻域。经过二阶E-N卷积,该节点不仅聚集了一阶邻域节点的信息,而且聚集了二阶邻域节点的信息。
二阶N-E卷积的意义:经过一阶N-E卷积之后每个节点都聚集了其一阶相似节点的信息,那么对这些节点再次进行N-E卷积,得到的结果就相当于聚集了二阶相似节点的信息,因为是在一阶的基础再进行一阶N-E卷积,所以称这个过程为二阶N-E卷积。如图10中(b)所示,表示二阶N-E卷积操作。以图中节点V1为例,V1与V5互为一阶相似节点,V5与V7互为一阶相似节点,绿色虚线是在它们之间建立的隐藏边。经过二阶N-E卷积,节点V1不仅聚集了其一阶相似节点V5的信息,而且聚集了其二阶相似节点V7的信息。
通过二阶图卷积层,得到的是一个大小为|N|×|Q|的二维特征矩阵;通过特征提取分类模块202的平坦层L3用于将二维特征矩阵展平为一维特征数据,这个过程叫做Flatten(平坦)。如图11中的a部分所示,平坦层L3 将矩阵每一行1×|Q|的特征向量转变为|Q|×1的特征向量,再从上到下,将后一行特征向量接在上一行特征向量的后面,依次类推,最后得到大小为(|N|×|Q|×1的一维特征向量。
完全连接层由若干个神经元组成,每个神经元连接着上一层的神经元。本发明提供的一个实施方式中设置了两个完全连接层L4与L5,如图11中的 b部分所示,对L3层输出的一维特征数据进行线性组合与非线性变换,从而提取更高级的特征,最后得到一个特征向量,维度是2×1。
输出层L6的Softmax函数,即归一化函数的作用是使得每个神经元的输出结果都大于0,小于1,然后选取概率选择结果最大的值所对应的标签作为最后的预测标签。输出层L6根据完全连接层提取的特征,输出正常人与AD 患者的归一化的分类概率,即正常人与AD患者的分类结果。
比如有一数组G,一共有n个元素,通过公式十计算得到数组中每个元素所对应的值:
Figure BDA0003578640030000181
通过Softmax函数将经过完全连接层得到的大小为2×1的特征向量映射成为(0,1)的两个值,结果最大的对应的标签即为被试者的预测标签,即分类标签。
上述的特征信息聚集模型是以多个LMCI患者的脑区-基因网络和AD患者的脑区-基因网络作为样本训练得到的。本发明提供的一种特征信息聚集模型的训练方法,流程如图12所示,包括如下步骤:
步骤S1201:生成训练样本。
具体地,以正常人的脑影像(fMRI)数据和基因数据分别构建脑网络和基因网络,进而将构建的脑网络和基因网络根据现有方法进行融合,得到正常人的脑区-基因网络;
以AD患者的脑影像(fMRI)数据和基因数据分别构建脑网络和基因网络,进而将构建的脑网络和基因网络进行融合,得到AD患者的脑区-基因网络。
具体地,以脑区和基因为节点,采用现有的皮尔逊相关分析方法计算节点之间边的权重,若边权重大于阈值则保留该边,反之去掉该边,以此构建脑区-基因网络,实现脑网络和基因网络的融合。
本步骤中,以多个正常人的脑影像(fMRI)数据和基因数据,分别构建多个正常人脑区-基因网络作为样本;以及以多个AD患者的脑影像(fMRI) 数据和基因数据,分别构建多个AD脑区-基因网络作为样本。
步骤S1202:根据所述样本对所述特征信息聚集模型进行训练。
本步骤中,将样本中正常人的脑区-基因网络或AD患者的脑区-基因网络输入到特征信息聚集模型;
根据特征信息聚集模型输出的分类结果与真实情况的差异对特征信息聚集模型的参数进行调整;
通过多次参数调整,使得特征信息聚集模型输出的分类结果越来越接近真实情况,直到特征信息聚集模型收敛。
基于上述预先训练得到的特征信息聚集模型,本发明提供两个具体的应用实施例。其中,实施例一的技术方案中,通过特征信息聚集模型实现AD 诊断;实施例二的技术方案中,通过特征信息聚集模型确定AD的风险要素,即病变脑区和风险基因。
实施例一
基于预先训练得到的上述特征信息聚集模型,本发明实施例一提供的一种基于特征信息聚集模型的AD诊断方法,流程如图13所示,包括如下步骤:
步骤S1301:根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;
具体地,根据被试者的脑影像数据和基因数据,分别构建脑网络和基因网络,进而将构建的脑网络和基因网络根据现有方法进行融合,得到被试者的脑区-基因网络。
步骤S1302:将构建的脑区-基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区-基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息,并提取特征后输出分类结果;
具体地,特征信息聚集模型对所述脑区-基因网络的特征矩阵进行多次特征信息聚集并提取特征后,输出的分类结果为:被试者为AD患者,或正常人的概率。
步骤S1303:根据该模型输出的结果,诊断该被试者是否为阿尔茨海默症AD患者。
具体地,若该模型输出的结果中,AD患者的概率大于正常人的概率,则诊断被试者为阿尔茨海默症AD患者。
本发明实施例一的技术方案中,根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;将所述脑区-基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区-基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息,并提取特征后输出分类结果;根据该模型输出的结果,诊断该被试者是否为阿尔茨海默症AD患者;其中,所述特征信息聚集模型是以多个正常人的脑区-基因网络和AD患者的脑区-基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块以及特征提取分类模块。由于特征信息聚集模型可以对输入的脑区-基因网络进行多次特征信息聚集,使得多次特征信息聚集后的正常人与AD患者的脑区-基因网络差异显著,从而提高特征信息聚集模型识别AD患者的脑区-基因网络的准确性,即可以对阿尔茨海默症做精准的诊断。
实施例二
基于预先训练得到的上述特征信息聚集模型,本发明实施例二提供的一种基于特征信息聚集模型的AD风险要素确定方法,流程如图14所示,包括如下步骤:
步骤S1401:将正常人和AD患者的脑区-基因网络通过所述特征信息聚集模型进行多次特征信息聚集,并提取特征后输出分类结果;
本步骤中,将多个被试者的脑区-基因网络通过所述特征信息聚集模型进行多次特征信息聚集,并提取特征后输出分类结果;其中,被试者包括正常人和AD患者。
步骤S1402:将经过多次特征信息聚集的正常人的脑区-基因网络和AD患者的脑区-基因网络进行比较;将比较结果中有显著差异的节点确定为AD风险要素。
具体地,由于上述的特征信息聚集模型能够达到很好的分类性能,再进一步进行特征提取,找到贡献度大的特征,即AD风险要素,对应的是风险基因和病变脑区,以便助力靶向药物开发和针对性经颅磁治疗。特征提取的两个基本原则解释如下:
基本原则1:全梯度显著性图机制,通过显著性图将输出分数重新分配到各个输入特征,为每个输入特征分配一个重要度。
基本原则2:两个相邻层之间权重的线性组合原则,即第l层某个神经元的重要性是由第l+1层中所有神经元的重要性通过线性组合得到的。
结合上述两个基本原则,步骤S1402中确定AD风险要素的具体流程,如图15所示,包括如下步骤:
步骤S1501:基于全梯度显著性图机制,根据所述特征信息聚集模型对正常人和AD患者的脑区-基因网络输出的结果与真实情况的接近程度,计算所述特征信息聚集模型中特征提取分类模块中的神经元的重要度;
具体过程如图16所示,对于特征信息聚集模型的输出结果,计算Prob如公式十一所示:
Prob=Ts×Ps (公式十一)
其中,Ts是第s个被试者的真实标签,Ts为一个1×2的向量,当值为(1,0) 时表示第s个被试者正常人,当值为(0,1)时表示第s个被试者AD患者。Ps为特征信息聚集模型输出的分类结果,具体一个2×1的向量
Figure 1
表示特征信息聚集模型输出的第s个被试者为正常人的概率,
Figure 2
表示特征信息聚集模型输出的第s个被试者为AD患者的概率。因此,Prob为一个具体数值,表示特征信息聚集模型的输出与真实情况的接近程度。
若特征信息聚集模型输出的结果Ps为(0.8,0.2)T,当被试者s为正常人,Ts为 (1,0),此时,Prob=Ts×Ps=0.8,表示特征信息聚集模型输出的结果Ps为正常人的几率是0.8,它反映特征信息聚集模型输出的结果与真实情况的接近程度比较大;当被试者s为AD患者,Ts为(0,1),此时,Prob=Ts×Ps=0.2,表示特征信息聚集模型输出的结果为AD患者的几率是0.2,它反映特征信息聚集模型输出的结果与真实情况的接近程度比较小。
然后采用基本原则1,计算特征信息聚集模型中完全连接层L5的第i个神经元的重要度如公式十二所示:
Figure BDA0003578640030000223
进而利用基本原则2计算完全连接层L4的第j个神经元的重要度如公式十三:
Figure BDA0003578640030000224
其中,CL5为完全连接层L5的神经元个数,
Figure BDA0003578640030000225
为完全连接层L5中第i个神经元的权重,即重要度。
步骤S1502:根据计算的神经元的重要度,确定脑区-基因网络中各节点的重要度;
具体地,根据完全连接层L4、L5的神经元的权重(即重要度),计算平坦层L3第k个特征的重要度
Figure BDA0003578640030000226
如公式十四所示:
Figure BDA0003578640030000231
其中,CL4为完全连接层L4的神经元个数,
Figure BDA0003578640030000232
为完全连接层L4中第j个神经元的权重,即重要度;
计算L3平坦层第q个节点所对应的脑区-基因网络中的节点的重要度
Figure BDA0003578640030000233
即把该节点所有特征的重要度进行累加如公式十五所示:
Figure BDA0003578640030000234
以一个具有3个节点的脑区-基因网络为例,假设经过一阶图卷积层L1与二阶图卷积层L2后,该脑区-基因网络的特征矩阵H∈R3×3,将其放入平坦层 L3展平后得到一个9×1的一维向量,经过完全连接层L4、L5(假设分别包含 6个与2个神经元),得到一个2×1的一维向量,最后经过L6中的Softmax运算得到分类结果Ps。假设一被试者的真实结果Ts为正常人(1,0),FAGCN 的分类结果Ps为(0.8,0.2)。假设根据公式十二求得完全连接层L5中2个神经元的重要度gradientL5,如图17中的(a)所示。假设完全连接层L4、L5之间的连接权重矩阵WL5∈R6×2,如图17中的(b)所示;根据公式十三求得完全连接层L4中6个神经元的重要度gradientL4,如图17中的(c)所示。假设 L3、L4之间的连接权重矩阵WL4∈R9×6,如图17中的(d)所示;根据公式十四求得L3中9个特征的重要度
Figure BDA0003578640030000235
如图17中的(e)所示。根据公式十五将对应节点特征的重要性进行累加得到每个节点的重要度
Figure BDA0003578640030000236
如图17中的(f)所示。综上,图18展示了特征提取的总体流程。
步骤S1503:根据节点的重要度,确定出所述脑区-基因网络中作为AD风险要素的节点。
本步骤中,对所述脑区-基因网络中所有节点,按照重要度分别进行脑区与基因的降序排序,并使用增量搜索法进一步筛选出最优的脑区特征子集与基因特征子集;将筛选出的最优的脑区特征子集中的节点确定为为AD风险要素中的病变脑区,将筛选出的最优的基因特征子集中的节点确定为为AD风险要素中的风险基因。
具体地,对所述脑区-基因网络中所有节点,按照重要度分别进行脑区与基因的降序排序,得到一个包括N1=116个脑区作为特征的脑区特征集,以及一个包括N2=45个基因作为特征的基因特征集,脑区/基因重要度越大表明该脑区/基因对分类的贡献越大,使用增量搜索法进一步筛选出最优的脑区特征子集与基因特征子集。
具体地,从脑区特征集中选取前5个特征组成第1个脑区特征子集
Figure BDA0003578640030000241
以1为增量,依次选择前6,7,...,N1个特征组成多个特征子集,最终得到(N1-4)个脑区特征子集;
同理,采用相同方法从基因特征集中选取得到(N2-4)个基因特征子集。接着,将(N1-4)个脑区特征子集与(N2-4)个基因特征子集两两任意组合得到(N1-4)×(N2-4)个组合,通过特征信息聚集模型来测试这 (N1-4)×(N2-4)个组合的分类准确率Acc,最高准确率对应的组合即为最优脑区特征子集与基因特征子集,寻找最优脑区特征子集与基因特征子集的函数表示如公式十六所示:
Figure 3
s.t.1≤i≤N1-4,1≤j≤N2-4 (公式十六)
该公式十六表示寻找最优脑区特征子集SubsetBrain与基因特征子集 SubsetGene,使得分类准确率Acc最大;s.t.表示受限条件,i表示脑区特征子集的编号,j表示基因特征子集的编号。最优脑区特征子集中的节点对应的脑区即为确定出的AD风险要素中的变脑区;最优基因特征子集中的节点对应的基因即为确定出的AD风险要素中的风险基因。
例如,针对上述具有3个节点的脑区-基因网络为例,对所有节点的重要度按照脑区与基因分别进行降序排序,脑区排序结果为:V2、V1,基因排序结果为:V3。选取第1个脑区组成第1个脑区特征子集,前2个脑区组成第2个脑区特征子集;再选取第1个基因组成第1个基因特征子集。将2个脑区特征子集和1个基因特征子集两两任意组合得到2个组合。用FAGCN来测试这2个组合的分类准确率,假设第2个组合的准确率最高,那么该组合中第2个脑区特征子集中的节点V2和V1对应的脑区即为模型捕获的病变脑区,第1个基因特征子集中的节点V3对应的基因即为模型捕获的风险基因。
步骤S1504:将确定出病变脑区与风险基因两两任意组合成为脑区-基因对,并进行显著性检验;
步骤S1505:将显著性检验结果小于阈值的脑区-基因对,确定为具有关联关系的病变脑区与风险基因。
例如,将显著性检验结果p<0.05的脑区-基因对确定为具有关联关系的病变脑区与风险基因。
本发明实施例二的技术方案,将正常人和AD患者的脑区-基因网络通过所述特征信息聚集模型进行多次特征信息聚集,并提取特征后输出分类结果;将经过多次特征信息聚集的正常人的脑区-基因网络和AD患者的脑区-基因网络进行比较;将比较结果中有显著差异的节点确定为AD风险要素,即AD 的病变脑区和风险基因,以便助力靶向药物开发和针对性经颅磁治疗。
进一步,本发明实施例二的技术方案,还可进一步确定出具有关联关系的病变脑区与风险基因。
图19示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的基于特征信息聚集模型的AD诊断方法或基于特征信息聚集模型的AD风险要素确定方法。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、 RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,可以与非线性接收机相连,从非线性接收机接收信息,实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器 1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本文的实验数据源于ADNI发布的数据库,其中包括从正常个体(NC) 和AD患者获得的各种医学成像和遗传数据,包括233名AD患者和237名 NC的脑影像(fMRI)数据和基因数据。
为了检验FAGCN模型,同时,采用分类准确率ACC、SEN、SPE和BAC 等指标对模型分类性能进行综合评价。所有结果均通过10倍交叉验证生成。比较方法的选择如下:一方面,选择了几种在生物医学数据分析中广泛应用的典型机器学习方法进行比较,包括随机森林(Random Forest,RF)和支持向量机(Support Vector Machine,SVM)。特别地,包括两种传统的深度学习方法,即CNN和GCN。另一方面,为了测试FAGCN中几处改进的效率,将FAGCN的两种变体拿来比较。第一种是将FAGCN中的相似矩阵去掉 (W-GCN),这意味着不存在点-边卷积。第二种是将FAGCN中的权重矩阵去掉(S-GCN),即将相邻矩阵而不是权重矩阵作为FAGCN的输入。
图20示出了ROC曲线,是基于fMRI和基因数据的AD与NC任务。表 1列出了不同任务和不同分类方法之间对比实验的所有结果。
表1
Figure BDA0003578640030000271
Figure BDA0003578640030000281
从图20和表1中,可以观察到在多组数据下,RF、SVM、CNN、GCN、 W-GCN、S-GCN以及本章提出方法FAGCN在NC vs AD分类任务中的性能分别是65.96%、68.09%、72.34%、76.60%、82.98%、85.10%以及89.36%,本发明提出的方法性能最好,并且在所有情况下的性能都是最好的,证明所提出的方法可以通过聚合来自节点的信息来正确调整特征的权重,从而准确分类样本。同时,FAGCN及其两个变体,即W-GCN和S-GCN,都优于普通的GCN方法,这表明本发明方法使用的权重矩阵和相似矩阵的有效性。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于特征信息聚集模型的AD诊断方法,其特征在于,包括:
根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;
将所述脑区-基因网络通过特征信息聚集模型进行多次特征信息聚集,使得所述脑区-基因网络中每个节点能够聚集多阶邻接节点与相似节点的信息,并提取特征后输出分类结果;
根据该模型输出的结果,诊断该被试者是否为阿尔茨海默症AD患者;
其中,所述特征信息聚集模型是以多个正常人的脑区-基因网络和AD患者的脑区-基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块以及特征提取分类模块。
2.根据权利要求1所述的方法,其特征在于,所述卷积模块中的每个图卷积层是用于进行一次特征信息聚集的:
所述特征信息聚集模型中的一个图卷积层,对输入其的脑区-基因网络的特征矩阵进行“边-点”卷积与“点-边”卷积,以使得所述脑区-基因网络中每个节点能够聚集邻接节点与相似节点的信息,输出经过一次特征信息聚集的脑区-基因网络的特征矩阵。
3.根据权利要求2所述的方法,其特征在于,所述“边-点”卷积,具体包括:
以所述脑区-基因网络的权重矩阵作为“卷积核”,与输入的脑区-基因网络的特征矩阵进行卷积操作,以使得所述脑区-基因网络中每个节点能够聚集邻接节点的信息。
4.根据权利要求2所述的方法,其特征在于,所述“点-边”卷积,具体包括:
以所述脑区-基因网络的相似矩阵作为“卷积核”,与输入的脑区-基因网络的特征矩阵进行卷积操作,以使得所述脑区-基因网络中每个节点能够聚集相似节点的信息。
5.根据权利要求1-4任一所述的方法,其特征在于,所述特征提取分类模块中具体包括:
平坦层,用于将所述卷积模块输出的二维的特征矩阵展平为一维特征数据;
两个完全连接层,用于对所述一维特征数据进行线性组合与非线性变换,提取更高级的特征;
输出层,用于根据完全连接层提取的特征,输出正常人与AD患者的分类结果。
6.一种基于特征信息聚集模型的AD风险要素确定方法,其特征在于,包括:
将正常人和AD患者的脑区-基因网络通过所述特征信息聚集模型进行多次特征信息聚集,并提取特征后输出分类结果;
将经过多次特征信息聚集的正常人的脑区-基因网络和AD患者的脑区-基因网络进行比较;
将比较结果中有显著差异的节点确定为AD风险要素;
其中,所述特征信息聚集模型是以多个LMCI患者的脑区-基因网络和AD患者的脑区-基因网络作为样本预先训练得到的,包括包含多个图卷积层的卷积模块和特征提取分类模块。
7.根据权利要求6所述的方法,其特征在于,所述将经过多次特征信息聚集的正常人的脑区-基因网络和AD患者的脑区-基因网络进行比较;将比较结果中有显著差异的脑区与基因确定为AD风险要素,具体包括:
基于全梯度显著性图机制,根据所述特征信息聚集模型对正常人和AD患者的脑区-基因网络输出的结果与真实情况的接近程度,计算所述特征信息聚集模型中特征提取分类模块中的神经元的重要度;
根据计算的神经元的重要度,确定脑区-基因网络中各节点的重要度;
根据节点的重要度,确定出所述脑区-基因网络中作为AD风险要素的节点。
8.根据权利要求6所述的方法,其特征在于,所述根据节点的重要度,确定出所述脑区-基因网络中作为AD风险要素的节点,具体包括:
对所述脑区-基因网络中所有节点,按照重要度分别进行脑区与基因的降序排序,并使用增量搜索法进一步筛选出最优的脑区特征子集与基因特征子集;
将筛选出的最优的脑区特征子集中的节点确定为为AD风险要素中的病变脑区,将筛选出的最优的基因特征子集中的节点确定为为AD风险要素中的风险基因。
9.根据权利要求6所述的方法,其特征在于,还包括:
将确定出的病变脑区与风险基因两两任意组合成为脑区-基因对,并进行显著性检验;
将显著性检验结果小于阈值的脑区-基因对,确定为具有关联关系的病变脑区与风险基因。
10.一种电子设备,包括中央处理单元、信号处理和存储单元,以及存储在信号处理和存储单元上并可在中央处理单元上运行的计算机程序,其特征在于,所述中央处理单元执行所述程序时实现如权利要求1-9任一所述的方法。
CN202210339756.3A 2022-04-01 2022-04-01 基于特征信息聚集模型的ad诊断及风险要素确定方法 Withdrawn CN114711721A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210339756.3A CN114711721A (zh) 2022-04-01 2022-04-01 基于特征信息聚集模型的ad诊断及风险要素确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210339756.3A CN114711721A (zh) 2022-04-01 2022-04-01 基于特征信息聚集模型的ad诊断及风险要素确定方法

Publications (1)

Publication Number Publication Date
CN114711721A true CN114711721A (zh) 2022-07-08

Family

ID=82242382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210339756.3A Withdrawn CN114711721A (zh) 2022-04-01 2022-04-01 基于特征信息聚集模型的ad诊断及风险要素确定方法

Country Status (1)

Country Link
CN (1) CN114711721A (zh)

Similar Documents

Publication Publication Date Title
Arif et al. [Retracted] Brain Tumor Detection and Classification by MRI Using Biologically Inspired Orthogonal Wavelet Transform and Deep Learning Techniques
Zhuang LadderNet: Multi-path networks based on U-Net for medical image segmentation
Khan et al. Stomach deformities recognition using rank-based deep features selection
Meng et al. Tongue images classification based on constrained high dispersal network
CN111563533A (zh) 基于图卷积神经网络融合多种人脑图谱的受试者分类方法
CN113191390B (zh) 一种图像分类模型的构建方法、图像分类方法及存储介质
CN113781385B (zh) 用于大脑医学影像自动分类的联合注意力图卷积方法
Arora et al. A comparative study of fourteen deep learning networks for multi skin lesion classification (MSLC) on unbalanced data
CN114694832A (zh) 一种确定阿尔茨海默症的风险要素的电子设备
Dillshad et al. D2LFS2Net: Multi‐class skin lesion diagnosis using deep learning and variance‐controlled Marine Predator optimisation: An application for precision medicine
Shamrat et al. Analysing most efficient deep learning model to detect COVID-19 from computer tomography images
Shirazi et al. Deep learning in the healthcare industry: theory and applications
Venkatesan et al. NFU-Net: an automated framework for the detection of neurotrophic foot ulcer using deep convolutional neural network
Egusquiza et al. Analysis of few-shot techniques for fungal plant disease classification and evaluation of clustering capabilities over real datasets
CN114664446A (zh) 一种阿尔茨海默症的预测方法和装置
CN117591953A (zh) 基于多组学数据的癌症分类方法、系统及电子设备
Ghosh et al. Two-Phase Evolutionary Convolutional Neural Network Architecture Search for Medical Image Classification
CN113449791A (zh) 基于深度学习的肺炎图像分类方法及系统
Devi Detection and automated classification of brain tumor types in MRI images using convolutional neural network with grid search optimization
Dittimi et al. Mobile phone based ensemble classification of deep learned feature for medical image analysis
Assmi et al. Alzheimer’s disease classification: a comprehensive study
CN114711721A (zh) 基于特征信息聚集模型的ad诊断及风险要素确定方法
KR102504319B1 (ko) 영상 객체 속성 분류 장치 및 방법
CN114999664A (zh) 一种提取阿兹海默症的显著特征的电子设备
Gairola et al. Multi-feature Fusion Deep Network for Skin Disease Diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220708

WW01 Invention patent application withdrawn after publication