CN115019971A - 一种基于超图结构信息聚集模型的电子设备 - Google Patents

一种基于超图结构信息聚集模型的电子设备 Download PDF

Info

Publication number
CN115019971A
CN115019971A CN202210641651.3A CN202210641651A CN115019971A CN 115019971 A CN115019971 A CN 115019971A CN 202210641651 A CN202210641651 A CN 202210641651A CN 115019971 A CN115019971 A CN 115019971A
Authority
CN
China
Prior art keywords
gene
hypergraph
brain region
edge
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210641651.3A
Other languages
English (en)
Inventor
毕夏安
陈可
邢兆旭
徐露允
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Normal University
Original Assignee
Hunan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Normal University filed Critical Hunan Normal University
Priority to CN202210641651.3A priority Critical patent/CN115019971A/zh
Publication of CN115019971A publication Critical patent/CN115019971A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Physiology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于超图结构信息聚集模型的电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时用于实现:根据被试者的脑影像数据和基因数据,构建被试者的脑区‑基因超图;通过超图结构信息聚集模型将脑区‑基因超图转换为脑区‑基因边图和点图,将分别进行边级特征信息聚集与点级特征信息聚集后的边图和点图融合得到低阶脑区‑基因子超图;对脑区‑基因超图进行高阶边级‑点级结构信息聚集,得到高阶脑区‑基因子超图;根据将低阶和高阶脑区‑基因子超图融合得到的关键脑区‑基因超图输出被试者为AD概率的判断结果。应用本发明可以辅助于对AD做精准的诊断。

Description

一种基于超图结构信息聚集模型的电子设备
技术领域
本发明涉及计算机技术领域,特别是指一种基于超图结构信息聚集模型的电子设备。
背景技术
阿尔茨海默症(AD)以一系列显著的痴呆症状为特征,常见于老年人。AD的发病机制复杂,其发病因素横跨宏观到微观多个层次,例如,大脑功能与结构的病变与基因的异常表达密切相关,因此,找到大脑宏观病变与微观变异的关联模式有助于揭示阿尔茨海默症的多层次发病机制。一些研究人员构建网络,将基因或大脑区域抽象为节点,以研究致病因素之间的功能相关性。Huang等人定义了每个脑区的嵌入表示,并提出了一种新的度量评估两个区域之间的相似性,使测量结果更加合理。Lella等人在分析大脑网络时引入了沟通距离,提供了新的3种方法发现与AD发展相关的隐藏模式。
然而,现有技术基于目前方法分析得到的脑区网络和基因网络进行AD诊断的准确率比较低,有必要提供一种有助于提高诊断准确率的AD诊断方法。
发明内容
有鉴于此,本发明的目的在于提出一种基于超图结构信息聚集模型的电子设备,可以辅助于对阿尔茨海默症做更精准的诊断。
基于上述目的,本发明提供一种基于超图结构信息聚集模型的电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时用于实现:
根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;
基于所述脑区-基因网络中节点的邻居节点,构建节点之间的超边;基于所述节点及节点之间的超边形成脑区-基因超图;
通过超图结构信息聚集模型将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;以及
对所述脑区-基因超图进行多次高阶边级-点级结构信息聚集,得到高阶脑区-基因子超图;将低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图;以及
根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果;
其中,所述超图结构信息聚集模型是以多个正常人的脑区-基因超图和AD患者的脑区-基因超图作为样本预先训练得到的。
较佳地,所述超图结构信息聚集模型包括:
生成器,用于将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;进而对所述低阶脑区-基因子超图进行结构信息扩散得到重构的脑区-基因超图;
判别器,用于对重构的脑区-基因超图进行多次边级-点级结构信息聚集得到高阶脑区-基因子超图;将所述高阶脑区-基因子超图和低阶脑区-基因子超图进行融合得到关键脑区-基因超图;进而根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果。
较佳地,所述生成器中包括:
转换层模块,用于将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并输出所述脑区-基因边图的边权重矩阵和脑区-基因点图的点权重矩阵;
边卷积层模块,用于对所述脑区-基因边图的边权重矩阵进行多次边级特征信息聚集,得到关键脑区-基因边图的边权重矩阵;
点卷积层模块,用于对所脑区-基因点图的点权重矩阵进行多次点级特征信息聚集,得到关键脑区-基因点图的点权重矩阵;
第一融合层模块,用于将所述关键脑区-基因边图的边权重矩阵和关键脑区-基因点图的点权重矩阵进行融合得到低阶脑区-基因子超图的关联权重矩阵;
反卷积模块,用于对低阶脑区-基因子超图的关联权重矩阵通过反卷积操作进行结构信息扩散,得到重构的脑区-基因超图的关联权重矩阵。
较佳地,所述判别器中包括:
边点卷积层模块,用于对重构的脑区-基因超图的关联权重矩阵进行多次边级-点级结构信息聚集得到高阶脑区-基因子超图的关联权重矩阵;
第二融合层模块,用于将所述高阶脑区-基因子超图的关联权重矩阵和低阶脑区-基因子超图的关联权重矩阵进行融合得到关键脑区-基因超图的关联权重矩阵;
全连接层模块,用于将所述关键脑区-基因超图的关联权重矩阵平铺为一维特征向量,并对平铺后的一维特征向量提取特征,进而根据提取的特征输出该被试者为AD患者的概率的判断结果。
进一步,所述中央处理单元执行所述程序还实现:对所述所述超图结构信息聚集模型进行训练:
根据所述样本对所述生成器和判别器进行多次迭代的优化和训练;其中,在一次迭代过程中,包括:
固定所述生成器的参数后,根据所述样本对所述判别器进行优化;
固定所述判别器的参数后,根据所述样本对所述生成器进行训练;
在对所述生成器和判别器进行多次迭代的优化和训练后,得到由所述生成器和判别器构成的、训练后的超图结构信息聚集模型。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行上述的电子设备的操作。
本发明的技术方案中,根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;基于所述脑区-基因网络中节点的邻居节点,构建节点之间的超边;基于所述节点及节点之间的超边形成脑区-基因超图;通过超图结构信息聚集模型将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;以及对所述脑区-基因超图进行多次高阶边级-点级结构信息聚集,得到高阶脑区-基因子超图;将低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图;以及根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果;其中,所述超图结构信息聚集模型是以多个正常人的脑区-基因超图和AD患者的脑区-基因超图作为样本预先训练得到的。由于对脑区-基因超图进行低阶结构信息和高阶结构信息的聚集得到的关键脑区-基因超图,更能体现AD与正常个体的判断性特征;因此,根据关键脑区-基因超图判断被试者是正常人还是AD的概率更为准确,可以辅助于对阿尔茨海默症做更精准的诊断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的超图结构信息聚集的过程的示意图;
图2为本发明实施例一提供的超图结构信息聚集模型的内部结构框图;
图3为本发明提供一的脑网络构建示意图;
图4为本发明提供一的基因网络构建示意图;
图5为本发明提供一的脑区-基因超图构建示意图;
图6为本发明实施例一提供的生成器的内部结构示意图;
图7为本发明实施例一提供的脑区-基因边图转换示意图;
图8为本发明实施例一提供的脑区-基因点图转换示意图;
图9为本发明实施例一提供的第t阶边卷积层的边卷积操作示意图;
图10为本发明实施例一提供的t阶边卷积操作示意图;
图11为本发明实施例一提供的第t阶边卷积层的点卷积操作示意图;
图12为本发明实施例一提供的t阶点卷积操作示意图;
图13为本发明实施例一提供的t阶扩散反卷积操作示意图;
图14为本发明实施例一提供的扩散反卷积操作的意义的示意图;
图15为本发明实施例一提供的判别器的内部结构示意图;
图16为本发明实施例一提供的t阶边点卷积操作示意图;
图17为本发明实施例一提供的边点卷积操作的意义的示意图;
图18为本发明实施例一提供的全连接层模块的内部结构示意图;
图19为本发明实施例二提供的超图结构信息聚集模型的训练方法流程图;
图20为本发明实施例二提供的对所述生成器和判别器进行一次迭代的优化和训练的方法流程图;
图21为本发明实施例二提供的对判别器进行优化的方法流程图;
图22为本发明实施例二提供的对生成器进行训练的方法流程图;
图23为本发明实施例三提供的基于结构信息聚集模型的阿尔茨海默症的判断方法的流程图;
图24为本发明实施例四提供的电子设备硬件结构示意图;
图25为本发明提供的多种生成对抗网络的实验结果对比示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本发明的发明人考虑到,脑区-基因超图中的每个节点代表着一个脑区或基因,脑区或基因越异常,对应的节点及连接这些节点的超边越能代表网络的特征性结构信息,也越能作为区分AD与正常个体的判断性特征。通过超图结构信息聚集模型对脑区-基因超图进行低阶结构信息和高阶结构信息的聚集得到的关键脑区-基因超图,更能体现AD与正常个体的判断性特征;因此,根据关键脑区-基因超图判断被试者是正常人还是AD的概率更为准确,可以辅助于对阿尔茨海默症做更精准的诊断。
对于低阶结构信息,首先,将脑区-基因超图转换为脑区-基因边图和脑区-基因点图;其次,分别使边图与点图经过多次(比如T1次)边级特征信息聚集与点级特征信息聚集;最后,将信息聚集后的边图与点图融合,得到代表低阶结构信息的低阶脑区-基因子超图。对于高阶结构信息,对脑区-基因超图进行多次(比如T2次)边级-点级结构信息聚集,得到代表高阶结构信息的高阶脑区-基因子超图;最后,将低阶脑区-基因子超图和高阶脑区-基因子超图融合,得到关键脑区-基因超图。
下面结合附图详细说明本发明实施例的技术方案。
对脑区-基因超图进行超图结构信息聚集的过程,如图1所示。一次超图结构信息聚集可分为高阶结构信息聚集和低阶结构信息聚集两个部分。图1中(a)和(b)分别展示的是高阶结构信息聚集和低阶结构信息聚集的过程。具体地,首先,在脑区-基因超图的基础上进行多次高阶边级-点级结构信息聚集,得到代表着高阶结构信息的高阶脑区-基因子超图;其次,将初始的脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别让它们经过多次边级结构信息聚集和点级结构信息聚集,得到关键脑区-基因边图和关键脑区-基因点图,融合关键边图和点图得到代表低阶结构信息的低阶脑区-基因子超图;最后,将低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图。在得到关键脑区-基因超图演变的过程中,原本的超图中所含的高阶和低阶结构信息得到聚集,从而更能体现AD与正常个体的判断性特征;因此,根据关键脑区-基因超图可以找到致病基因和病变脑区及其间的关联模式,根据关键脑区-基因超图判断被试者是正常人还是AD的概率更为准确,可以辅助于对阿尔茨海默症做更精准的诊断。
下面针对脑区-基因超图建立超图结构信息聚集模型,模型的要素包括如下:
(1)脑区-基因超图:Hi表示第i个被试者的脑区-基因超图,由第i个被试者的基因数据和脑影像数据构建,i=1,...,m,其中m为被试者的个数。
(2)脑区-基因边图:
Figure BDA0003684371630000061
表示第i个被试者的脑区-基因边图,由第i个被试者的脑区-基因超图Hi进行边图转换得到。边图中每一个节点对应超图中的一条超边,边权重的计算方法后述。
(3)脑区-基因点图:
Figure BDA0003684371630000062
表示第i个被试者的脑区-基因点图,由第i个被试的脑区-基因超图Hi进行点图转换得到。点图中的节点与超图中一致,但边权重需重新计算,具体公式后述。
(4)脑区-基因边图
Figure BDA0003684371630000063
中连边
Figure BDA0003684371630000064
的权重:
Figure BDA0003684371630000065
其中N为脑区-基因超图中节点总数,边
Figure BDA0003684371630000066
表示的是超边ep和eq之间的边,
Figure BDA0003684371630000067
表示初始脑区-基因边图中边
Figure BDA0003684371630000068
的权重,通过计算脑区-基因超图中同时与超边ep和eq相连的节点与两超边所连节点总数的占比得到。
Figure BDA0003684371630000069
表示第i个被试者在第t1次边级结构信息聚集后边
Figure BDA00036843716300000610
的权重,权重越大表明超边ep和eq之间的联系程度越紧密。T1为边级特征信息聚集次数总数。
(5)脑区-基因点图
Figure BDA00036843716300000611
中连边
Figure BDA00036843716300000612
的权重:
Figure BDA0003684371630000071
其中N为脑区-基因超图中节点总数,也是脑区-基因点图中节点总数;边
Figure BDA0003684371630000072
表示的是脑区-基因点图中节点vp和vq之间的边,
Figure BDA0003684371630000073
表示初始脑区-基因点图中边
Figure BDA0003684371630000074
的权重,通过计算脑区-基因超图中同时与节点vp和vq共连的超边与两节点所连超边总数的占比得到。
Figure BDA0003684371630000075
表示第i个被试者第t1次点级结构信息聚集后边
Figure BDA0003684371630000076
的权重,权重越大表明节点vp和vq之间的联系程度越紧密。T1为点级特征信息聚集次数总数。
(6)低阶脑区-基因子超图:
Figure BDA0003684371630000077
Figure BDA0003684371630000078
表示第i个被试者的低阶脑区-基因子超图,由第i个被试者的脑区-基因点图权重
Figure BDA0003684371630000079
和脑区-基因边图权重
Figure BDA00036843716300000710
融合得到,
Figure BDA00036843716300000711
表示节点vp和超边eq之间的边。
Figure BDA00036843716300000712
表示第i个被试者的低阶脑区-基因子超图中节点vp与超边eq之间的关联权重。
(7)脑区-基因超图中节点vp与超边eq间的关联权重:
Figure BDA00036843716300000713
Figure BDA00036843716300000714
表示节点vp与超边eq的关联权重,
Figure BDA00036843716300000715
表示初始脑区-基因超图中vp与eq间的关联权重,值为1时表示vp与eq存在关联,值为0时表示vp与eq没有关联。
Figure BDA00036843716300000716
表示在第t2次信息聚集后vp与eq的关联权重。T2为边级-点级结构信息聚集次数总数。
(8)高阶脑区-基因子超图:
Figure BDA00036843716300000717
Figure BDA00036843716300000718
表示第i个被试者的高阶脑区-基因子超图,由第i个被试者的脑区-基因超图HGi经过T2次边级-点级结构信息聚集得到,
Figure BDA00036843716300000719
表示节点vp和超边eq之间的边,
Figure BDA00036843716300000720
表示第i个被试者的高阶脑区-基因子超图中节点vp和超边eq之间的关联权重。
(9)关键脑区-基因超图:
Figure BDA00036843716300000721
Figure BDA00036843716300000722
表示第i个被试者的关键脑区-基因超图,由高阶脑区-基因子超图
Figure BDA00036843716300000723
阳低阶脑区-基因子超图
Figure BDA00036843716300000724
融合得到,
Figure BDA0003684371630000081
表示节点vp和超边eq之间的边,
Figure BDA0003684371630000082
表示第i个被试者的关键脑区-基因超图中节点vp和超边eq之间的关联权重。
根据以上模型要素,超图结构信息聚集模型可分为以下四步:(1)脑区-基因超图进行低阶结构信息聚集得到低阶脑区-基因子超图;(2)脑区-基因超图进行高阶结构信息聚集得到高阶脑区-基因子超图;(3)融合低阶和高阶脑区-基因子超图得到关键脑区-基因超图;(4)分析关键脑区-基因超图,提取判断性特征。
第一步:被试的脑区-基因超图进行低阶结构信息聚集得到低阶脑区-基因子超图。首先,脑区-基因超图进行边图和点图转换得到脑区-基因边图和脑区-基因点图,分别提取低阶的边级和点级结构信息,第i个超图转化的公式如公式1所示:
Figure BDA0003684371630000083
其中Hi表示第i个被试者的脑区-基因超图;Conv_v(·)表示点图转换函数;Conv_e(·)表示边图转换函数;
Figure BDA0003684371630000084
表示脑区-基因点图;
Figure BDA0003684371630000085
表示脑区-基因边图。
其次,脑区-基因边图和脑区-基因点图分别进行边级结构信息聚集和点级结构信息聚集,得到关键脑区-基因边图和关键脑区-基因点图。每次边级结构信息聚集过程中,脑区-基因边图中每条边聚集其邻域内的边级结构信息,进而更新自身边的权重,经过多次边级结构信息聚集后,原始的脑区-基因边图逐渐演变为关键脑区-基因边图。在第n次边级结构信息聚集过程中,第i个被试的脑区-基因边图中边权重
Figure BDA0003684371630000086
的计算方式如公式2所示:
Figure BDA0003684371630000087
其中
Figure BDA0003684371630000088
表示聚集脑区-基因边图中超边eq的边级结构信息。
类似地,每次点级结构信息聚集过程中,脑区-基因点图中每条边聚集其邻域内的点级结构信息并更新自身边权重,多次信息聚集后,原始的脑区-基因点图演变为关键脑区-基因点图。在第t1次点级结构信息聚集过程中,第i个脑区-基因点图中边权重
Figure BDA0003684371630000089
的计算方式如公式3所示:
Figure BDA0003684371630000091
其中
Figure BDA0003684371630000092
表示聚集脑区-基因点图中节点vp的点级结构信息。
最后,将经过了T1次特征信息更新后的权重
Figure BDA0003684371630000093
Figure BDA0003684371630000094
融合得到低阶脑区-基因子超图的关联权重
Figure BDA0003684371630000095
公式如公式4所示:
Figure BDA0003684371630000096
其中,Fuse(·)表示图融合函数;表示低阶脑区-基因子超图的关联权重。
第二步:被试的脑区-基因超图进行高阶结构信息聚集得到高阶脑区-基因子超图。对每一个脑区-基因超图,在每次高阶结构信息聚集过程中,每条超边聚集其邻域内的高阶结构信息并更新自身的权重,经过多次信息聚集后,原始的脑区-基因超图逐渐演变为高阶脑区-基因子超图。在第t2次高阶结构信息聚集过程中第i个脑区-基因超图中边权重
Figure BDA0003684371630000097
的计算方式如公式5所示:
Figure BDA0003684371630000098
其中,
Figure BDA0003684371630000099
表示聚集
Figure BDA00036843716300000910
所连接超边ep一阶邻域内的边级结构信息;
Figure BDA00036843716300000911
聚集
Figure BDA00036843716300000912
所连接节点vp一阶邻域内的点级结构信息;
Figure BDA00036843716300000913
表示边
Figure BDA00036843716300000914
聚集了其t2阶邻域内的结构信息。
经过T2次高阶结构信息聚集后,得到高阶脑区-基因子超图的关联权重
Figure BDA00036843716300000915
如公式6所示:
Figure BDA00036843716300000916
第三步:被试者的低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图。将聚集了低阶结构信息的低阶脑区-基因子超图关联权重
Figure BDA00036843716300000917
与聚集了高阶结构信息的高阶脑区-基因子超图的关联权重H(i,n)进行融合,进而得到关键脑区-基因超图的关联权重
Figure BDA0003684371630000101
Figure BDA0003684371630000102
其中,Fuse(*)表示图融合函数;
Figure BDA0003684371630000103
表示关键脑区-基因超图的关联权重。
第四步:经过结构信息聚集得到的关键脑区-基因超图蕴含着AD患者与正常人之间的区别性信息,可以完成正常人和AD患者的分类任务,公式如下:
Figure BDA0003684371630000104
其中,
Figure BDA0003684371630000105
表示经过超图结构信息聚集后的关键脑区-基因超图的关联权重;Classify(·)表示分类函数;Pi为判断结果,含义为第i个被试者为正常人(NC)或AD的概率,是一个二维向量。
根据判断结果提取出正常人和AD患者之间的判断性特征,即致病基因和病变脑区以及它们的关联模式,特征提取的公式如公式9所示:
Figure BDA0003684371630000106
其中,Pi表示判断结果;
Figure BDA0003684371630000107
表示关键脑区-基因超图的关联权重;Feat_extract表示特征提取函数;PG、PB和AM分别表示致病基因、病变脑区和它们之间的关联模式;Score(·)为重要度分数,分数越大表明提取的特征在正常人和AD之间差异越大。
综上所述,将公式1~公式9联立,用以下方程组表示脑区-基因超图的超图结构信息聚集模型和应用:
Figure BDA0003684371630000108
在这些公式中,公式1表示脑区-基因超图进行边图和点图转换得到脑区-基因边图和脑区-基因点图,公式2表示脑区-基因边图中的边聚集其邻域内的边级结构信息之和,公式3表示脑区-基因点图中的点聚集其邻域内的点级结构信息之和,公式4表示利用
Figure BDA0003684371630000111
Figure BDA0003684371630000112
融合构建低阶脑区-基因子超图关联权重
Figure BDA0003684371630000113
公式5表示脑区-基因超图中的边聚集其邻域内的高阶边级-点级结构信息之和,公式7表示融合低阶脑区-基因子超图关联权重
Figure BDA0003684371630000114
和高阶脑区-基因子超图关联权重H(i,n)得到关键脑区-基因超图关联权重
Figure BDA0003684371630000115
公式8表示基于关键脑区-基因超图对正常人和AD患者分类,公式9表示利用判断结果和关键脑区-基因超图提取AD患者的致病基因和病变脑区及其间的关联模式。
实施例一
基于上述的超图结构信息聚集模型的要素,本发明实施例一提供了一种基于生成对抗网络的超图结构信息聚集模型,其内部结构如图2所示,包括:生成器201和判别器202;
其中,生成器201用于将输入的脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;进而对所述低阶脑区-基因子超图进行结构信息扩散得到重构的脑区-基因超图;
判别器202用于对重构的脑区-基因超图进行多次边级-点级结构信息聚集得到高阶脑区-基因子超图;将所述高阶脑区-基因子超图和低阶脑区-基因子超图进行融合得到关键脑区-基因超图;进而根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果。
在由生成器201和判别器202组成的超图结构信息聚集模型中,生成器的输入是正常人或AD患者的脑区-基因超图,并由卷积部分和反卷积部分组成。卷积部分的作用是将脑区-基因超图转换为脑区-基因边图和脑区-基因点图,通过点卷积与边卷积分别聚集边级和点级结构信息,并将卷积后的边图与点图融合得到低阶脑区-基因子超图;反卷积部分的作用是通过扩散反卷积操作将低阶脑区-基因子超图逐步重构得到生成脑区-基因超图作为生成器的输出。
判别器的输入有两种:由样本的原始数据构建的真实的脑区-基因超图和通过生成器得到的生成的脑区-基因超图,判别器的作用有三个,第一,通过边点卷积操作聚集超图中的高阶边级-点级结构信息得到高阶脑区-基因超图,并与低阶脑区-基因超图融合为关键脑区-基因超图;第二,判断输入的脑区-基因超图真假,即判断超图是由原始数据得到的还是通过生成器生成的;第三,预测样本的类别,即预测一个样本为AD患者或正常个体的概率。根据生成对抗网络的原理,在模型训练的过程中,判别器的目标是尽可能地提升超图的分类准确率,而生成器的目标是使生成的超图与真实的脑区-基因超图尽可能接近,从而使判别器难以分辨真假。训练过程中的二者存在相互对抗关系,同时网络中的参数会不断调优,直至整个网络收敛。训练结束后,生成对抗网络提取出的关键脑区-基因超图能够准确聚集AD疾病的特征信息,进而可以提取出致病基因和病变脑区以及它们之间的关联模式。
如图3所示,以脑区为节点,脑区之间的连接为边,脑区和脑区之间的欧氏距离为边的权重。脑区和脑区之间欧式距离计算公式如公式10所示:
Figure BDA0003684371630000121
其中,Dis(bi,bj)表示脑区节点bi和bj之间的欧式距离;l1表示脑区的时间序列长度;
Figure BDA0003684371630000122
表示节点bi的第k个特征(脑区时间序列值);N1为脑网络中节点的总数。
如图4所示,以基因为节点,基因之间的连接为边,基因和基因之间的欧式距离为边的权重。基因和基因之间欧式距离计算公式如下:
Figure BDA0003684371630000123
其中,Dis(gi,gj)表示基因节点gi和gj之间的欧式距离;l2表示基因节点特征信息的长度;
Figure BDA0003684371630000124
表示节点gi的第k个特征(基因序列值);N2为基因网络中节点的总数。
将被试者(可以是正常人,也可以是AD患者)的脑网络和基因网络进行融合,得到该被试者的脑区-基因网络:以脑区和基因为节点,采用现有的皮尔逊相关分析方法计算节点之间边的权重,若边权重大于阈值则保留该边,反之去掉该边,以此构建脑区-基因网络,实现脑网络和基因网络的融合。
如图5所示,基于被试者的脑网络和基因网络构建的脑区-基因网络,以每一个脑区节点或基因节点为中心节点,选择该中心节点的最近的k个邻居节点,形成一条超边:即选择k个欧式距离上与中心节点最近的邻居节点,将所述中心节点与选择的邻居节点之间的连接构成一条超边,即所述中心节点与选择的邻居节点共同作为所述超边所连接的节点。其中,k为本领域技术人员根据经验设置,比如,设置为3或5等。由于脑区-基因网络中有N个节点,因此,构建的脑区-基因超图含有N条超边,并对应一个关联权重矩阵H∈RN×N,其中关联权重矩阵的行表示脑区或基因节点,列表示超边,关联权重矩阵中的元素
Figure BDA0003684371630000131
表示节点vp与超边eq的关联权重;若节点vp是超边eq上的一个节点,则表示vp与eq存在关联,
Figure BDA0003684371630000132
值为1;否则,
Figure BDA0003684371630000133
值为0,表示vp与eq没有关联。最后,通过关联权重矩阵H构建脑区-基因超图。相比于脑区-基因网络,在构建的脑区-基因超图中脑区或基因越异常,对应的节点及连接这些节点的超边越能代表网络的特征性结构信息,也越能作为区分AD与正常个体的判断性特征。因此,基于脑区-基因超图进行是否为AD的判断,相比于基于脑区-基因网络的AD的判断,具有更高的准确性。
在一个较优的实施方式中,如图6所示,生成器201包括转换部分、卷积部分、融合部分和反卷积部分;具体地,生成器201中的转换部分包括:转换层模块601;生成器201中的卷积部分包括:边卷积层模块602、点卷积层模块603;生成器201中的融合部分包括:第一融合层模块604;生成器201中的反卷积部分包括:反卷积模块605。
其中,转换层模块601用于将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图;
边卷积层模块602用于对所述脑区-基因边图进行多次边级特征信息聚集,得到关键脑区-基因边图;
点卷积层模块603用于对所脑区-基因点图进行多次点级特征信息聚集,得到关键脑区-基因点图;
第一融合层模块604用于将所述关键脑区-基因边图和关键脑区-基因点图进行融合得到低阶脑区-基因子超图;
反卷积模块605用于对低阶脑区-基因子超图通过反卷积操作进行结构信息扩散,得到重构的脑区-基因超图。
生成器201中的边卷积和点卷积实现从脑区-基因边图和脑区-基因点图逐步演化并融合为低阶脑区-基因子超图的过程。如前文所述,卷积部分包括边卷积和点卷积两部分。每经过一次边卷积,脑区-基因边图的权重矩阵都会更新,进而使脑区-基因边图的拓扑结构发生变化;每经过一次点卷积,脑区-基因点图的权重矩阵都会更新,进而使脑区-基因点图的拓扑结构发生变化。下面分别描述边卷积和点卷积的具体过程。
图7展示了转换层模块601中将脑区-基因超图转换得到脑区-基因边图,并确定脑区-基因边图的边权重矩阵的过程。具体地,脑区-基因超图中的每条超边ei(i=1,...,N)都对应脑区-基因边图中的一个节点ei;对于脑区-基因超图中任意的两条超边,若此两条超边至少存在一个公共节点,则将此两条超边在脑区-基因边图中所对应的两个节点之间连接一条边,并根据此两条超边的公共节点个数,确定这两个节点之间连接的边的权重值。得到的脑区-基因边图中的节点集合表示为Ve={e1,...,eN},边集合表示为
Figure BDA0003684371630000141
脑区-基因边图中每条边
Figure BDA0003684371630000142
对应的权重
Figure BDA0003684371630000143
的计算公式如公式12所示:
Figure BDA0003684371630000144
其中,ep∩eq表示超边ep连接的节点的集合与eq连接的节点的集合的交集;ep∪eq表示超边ep连接的节点的集合与eq连接的节点的集合的并集;
根据脑区-基因边图的每条边
Figure BDA0003684371630000145
的权重
Figure BDA0003684371630000146
值构建脑区-基因边图的边权重矩阵WE∈RN×N,则WE可以表示为公式13:
Figure BDA0003684371630000147
图8展示了转换层模块601中将脑区-基因超图通过点图转换得到脑区-基因点图,并确定脑区-基因点图的点权重矩阵的过程。具体地,转换层模块601中将脑区-基因超图中的每个节点vi(l=1,...,N)在脑区-基因点图中创建对应节点vi;对于脑区-基因超图中任意的两个节点,若此两个节点至少存在一个公共超边,则将此两个节点在脑区-基因点图中所对应的节点之间连接一条边,并根据脑区-基因超图中此两个节点的公共超边个数,确定脑区-基因点图中所对应的节点之间连接的边的权重值。得到的脑区-基因点图的节点集合Vv={v1,...,vN},边集合
Figure BDA0003684371630000148
脑区-基因点图中每条边
Figure BDA0003684371630000149
对应的权重
Figure BDA00036843716300001410
的计算方式如公式14所示:
Figure BDA0003684371630000151
根据脑区-基因点图的每条边
Figure BDA0003684371630000152
的权重
Figure BDA0003684371630000153
值构建脑区-基因点图的点权重矩阵WV∈RN×N,则WV可以表示为公式15所示:
Figure BDA0003684371630000154
边卷积层模块602中具体可以包括T1阶边卷积层,用于对所述脑区-基因边图的边权重矩阵进行T1次边卷积,从而实现对所述脑区-基因边图的T1次边级特征信息聚集,得到关键脑区-基因边图的边权重矩阵;其中,T1为大于1的自然数。
其中,第t阶边卷积层用于对输入的边权重矩阵
Figure BDA0003684371630000155
进行一次边卷积,得到并输出更新后的边权重矩阵
Figure BDA0003684371630000156
如公式16所示:
Figure BDA0003684371630000157
其中,
Figure BDA0003684371630000158
Figure BDA0003684371630000159
I∈RN×N为N阶单位矩阵;
Figure BDA00036843716300001510
表示对
Figure BDA00036843716300001511
归一化后得到的权重矩阵;A(t)表示第t阶边卷积层的卷积核,为可学习的参数矩阵;ReLU(·)是激活函数;
Figure BDA00036843716300001512
表示边权重矩阵
Figure BDA00036843716300001513
经过t-1阶边卷积层的t-1次边卷积后得到的边权重矩阵;
Figure BDA00036843716300001514
表示由所述转换层模块601输出到边卷积层模块602中的所述脑区-基因边图的边权重矩阵。其中,T1为大于1的自然数,t为小于等于T1的自然数。
脑区-基因边图的边权重矩阵,经过t阶边卷积后,在脑区-基因边图中作为节点的每条超边将聚集其t阶邻域内的边级结构信息,得到更新后的边权重矩阵
Figure BDA00036843716300001515
下面以一个具有6个节点的脑区-基因边图为例介绍第t阶边卷积层的边卷积的具体操作。如图9所示,以图9中(a)所示的脑区-基因边图的e1为中心超边,e2、e3、e4和e6为该中心超边的邻接超边,图9中(b)是第t阶边卷积层的卷积核A(t),图9中(c)是对超边e1的t阶边卷积操作。权重矩阵
Figure BDA0003684371630000161
的第一列表示超边e1与其邻接超边的联系程度,权重越大表示联系越紧密。将
Figure BDA0003684371630000162
的第一列中元素以卷积核A(t)的第一行中的元素作为权重进行加权求和,表示超边e1从相邻超边聚集到的边级结构信息总量。以此类推,计算出脑区-基因超图中每条超边聚集到的结构信息。最终通过De进行归一化,得到最终的边权重矩阵
Figure BDA0003684371630000163
t阶边卷积的意义:在脑区-基因边图中,节点为脑区-基因超图中的超边,边图中的超边互相连接,形成能区分AD与正常个体的边级结构信息。具体地,超图中的超边越异常,则该超边在边图中就越能代表疾病的特征性结构信息。在t阶边卷积的过程中,脑区-基因边图中每条超边能够从相邻的超边中聚集到边级结构信息,而由于此时每条超边已通过t-1次边卷积聚集到了t-1阶邻域内的边级结构信息,因此在t阶边卷积过程中,边图中的每条超边能够聚集到t阶邻域内的边级结构信息。本发明设计的边卷积操作能通过脑区-基因边图捕捉超边与其它超边之间的联系,从而高效实现边级结构信息的聚集。图10展示了脑区-基因边图的t阶边卷积操作,以图中超边e1为例,虚框内为超边e1的一阶邻域。由于图中的每条超边都聚集了t-1阶邻域内的边级结构信息,因此在经过此次边卷积后,超边e1将聚集到t阶邻域内的边级结构信息。
点卷积层模块603中具体可以包括T1阶点卷积层,用于对所述脑区-基因点图的点权重矩阵进行T1次点卷积,从而实现对所述脑区-基因点图的T1次点级特征信息聚集,得到关键脑区-基因点图的点权重矩阵;其中,T1为大于1的自然数。
其中,第t阶点卷积层用于对输入的点权重矩阵
Figure BDA0003684371630000164
进行一次点卷积,得到并输出更新后的点权重矩阵
Figure BDA0003684371630000165
如公式17所示:
Figure BDA0003684371630000166
其中,
Figure BDA0003684371630000171
Figure BDA0003684371630000172
I∈RN×N为N阶单位矩阵;
Figure BDA0003684371630000173
表示对
Figure BDA0003684371630000174
归一化后得到的矩阵;B(n)表示第t阶点卷积层的卷积核,为可学习的参数矩阵;ReLU(·)是激活函数;
Figure BDA0003684371630000175
表示点权重矩阵
Figure BDA0003684371630000176
经过t-1阶点卷积层的t-1次点卷积后得到的点权重矩阵;
Figure BDA0003684371630000177
表示由所述转换层模块601输出到点卷积层模块603中的所述脑区-基因点图的点权重矩阵。
所述脑区-基因点图的点权重矩阵,经过第t次点卷积后,每个节点将聚集其t阶邻域内的点级结构信息,得到更新后的点权重矩阵
Figure BDA0003684371630000178
下面以一个具有6个节点的脑区-基因点图为例解释t阶点卷积操作。如图11所示,图11中(a)所示的脑区-基因点图的节点v3为将要进行点卷积操作的节点,v1、v2、v4、v5为该中心节点的一阶邻接节点,图11中(b)是第t阶点卷积层的卷积核B(t)。图11中(c)是对节点v3的t阶点卷积操作。脑区-基因点图的点权重矩阵
Figure BDA0003684371630000179
的第三行表示节点v3与邻接节点的联系程度,值越大表示联系越紧密,将卷积核B(t)的第三列作为权重一一对应赋予给
Figure BDA00036843716300001710
的第三行,再进行加权求和得到节点v3相应的值,完成对节点v3的t阶点卷积操作。以此类推,对每个节点进行t阶点卷积操作,最终进行归一化操作得到更新的权重矩阵
Figure BDA00036843716300001711
t阶点卷积的意义:脑区-基因点图中的节点,与脑区-基因超图中的节点一致,节点之间的低阶联系形成了能够区分AD与正常个体的点级结构信息。具体地,一个节点越异常,则该节点在脑区-基因点图中就越能代表疾病的特征性结构信息。在t阶点卷积的过程中,脑区-基因点图中每个节点从相邻的节点中聚集到点级结构信息,而由于此时每个节点已通过之前的t-1次点卷积聚集到了t-1阶邻域内的点级结构信息,因此在t阶点卷积过程中,脑区-基因点图中的每个节点能够聚集到其t阶邻域内的点级结构信息。本发明设计的点卷积操作能通过脑区-基因点图捕捉节点与其它节点之间的低阶关联,从而高效实现低阶点级结构信息的聚集。图12展示了脑区-基因点图的t阶点卷积操作,以图中节点v3为例,虚框区域为节点v3的一阶邻域。由于图中的每各节点都聚集了t-1阶邻域内的边级结构信息,因此在经过此次点卷积后,节点v3将聚集到t阶邻域内的点级结构信息。
第一融合层模块604具体用于将所述关键脑区-基因边图的边权重矩阵和关键脑区-基因点图的点权重矩阵进行融合得到低阶脑区-基因子超图的关联权重矩阵,如公式18所示:
Figure BDA0003684371630000181
其中,
Figure BDA0003684371630000182
表示脑区-基因点图的初始的点权重矩阵;
Figure BDA0003684371630000183
表示脑区-基因边图的初始的边权重矩阵;H表示脑区-基因超图的关联矩阵;
Figure BDA0003684371630000184
表示点卷积层模块603经过T1次点卷积得到的关键脑区-基因点图的点权重矩阵;
Figure BDA0003684371630000185
表示边卷积层模块602经过T1次边卷积得到的关键脑区-基因边图的边权重矩阵;HL表示计算得到的低阶脑区-基因子超图的关联权重矩阵。
本发明设计扩散反卷积实现基于低阶脑区-基因子超图得到生成脑区-基因超图的过程,如图6所示。反卷积模块605中具体可以包括T1阶反卷积层,用于对低阶脑区-基因子超图的关联权重矩阵,进行T1次反卷积操作,实现对低阶脑区-基因子超图的多次结构信息扩散,得到重构的T1阶生成的脑区-基因超图的关联权重矩阵。
每经过一次扩散反卷积操作,低阶脑区-基因子超图的关联权重矩阵都会得到更新,进而使其拓扑结构发生变化。下面以t-1阶生成脑区-基因超图经过第t次扩散反卷积得到t阶生成脑区-基因超图为例,描述扩散反卷积的具体过程。
经过T1次扩散反卷积后,低阶脑区-基因子超图的关联权重矩阵得到了更新。我们将低阶脑区-基因子超图定义为一种结构信息的压缩表示,并认为即使节点和超边在低阶脑区-基因子超图中不存在关联关系,其间也存在潜在的联系。我们定义“潜在边”描述潜在的节点-超边的联系。作为对比,对于在超图中存在连接的节点和超边,定义“真实边”描述这种节点-超边的联系。在第t次扩散反卷积的过程中,低阶脑区-基因子超图中每条真实边将自身的结构信息扩散到其t阶邻域内的真实边(真实的节点-超边的关联关系)和潜在边(潜在的节点-超边的关联关系)上,进而更新这些边(节点-超边的关联关系)的权重。当潜在边更新后的信息量高于一定阈值时,就会转换为真实边;同样,当真实边更新后的信息量低于一定阈值时,就会转换为潜在边。因此,扩散反卷积能够引起网络拓扑结构的更新。在结构信息扩散的过程中,待更新边的结构信息变化量等于该边一阶邻域内所有真实边扩散到该边的总和,具体可以通过反卷积层中的矩阵运算得到。
反卷积模块605中第t阶反卷积层,用于对输入的关联权重矩阵
Figure BDA0003684371630000191
进行一次反卷积操作,输出更新的关联权重矩阵
Figure BDA0003684371630000192
在此过程中,对t-1阶生成的脑区-基因超图的关联权重矩阵
Figure BDA0003684371630000193
进行t阶扩散反卷积使每条真实边和潜在边聚集到其t阶邻域内的结构信息,得到更新的关联权重矩阵
Figure BDA0003684371630000194
其中,
Figure BDA0003684371630000195
是关联权重矩阵
Figure BDA0003684371630000196
经过t-1阶反卷积层的t-1次反卷积后得到的关联权重矩阵;
Figure BDA0003684371630000197
表示由第一融合层模块604融合得到并输出至反卷积模块605的低阶脑区-基因子超图的关联权重矩阵。
其中,
Figure BDA0003684371630000198
的计算公式如公式19所示:
Figure BDA0003684371630000199
其中,b(t)是第t阶反卷积层的偏置,为第t阶反卷积层中可学习的参数;C(t)∈RN×N是第t阶反卷积层的扩散反卷积核,为第t阶反卷积层中可学习的参数矩阵;
Figure BDA00036843716300001910
表示关联权重矩阵
Figure BDA00036843716300001911
中第r行第i列的值;
Figure BDA00036843716300001912
表示C(t)中第r行第i列的值;
Figure BDA00036843716300001913
表示关联权重矩阵
Figure BDA00036843716300001914
中第i行第c列的值;
Figure BDA00036843716300001915
表示C(t)中第i行第c列的值;
其中,
Figure BDA00036843716300001916
表示位于第r行第C列的元素接收到的信息总量,计算方法是将
Figure BDA00036843716300001917
和C(t)中的第r行和C列对应相乘然后求和;f(·)是激活函数,本文采用的是ReLU函数,即当某条边更新后的信息值小于或等于0时,将该边的权重置为0;
Figure BDA00036843716300001918
Figure BDA00036843716300001919
经过t阶扩散反卷积更新后的值。换言之,每个元素更新后的值由该元素所在行与所在列的所有元素相加得到。
如图13所示,图13中(a)为脑区-基因超图以及它的关联权重矩阵
Figure BDA0003684371630000201
图中
Figure BDA0003684371630000202
是将要进行t阶扩散反卷积操作的边,图13中(b)是第t阶反卷积层的扩散反卷积核C(t)。图13中(c)展示了边
Figure BDA0003684371630000203
的t阶扩散反边卷积操作,
Figure BDA0003684371630000204
的元素
Figure BDA0003684371630000205
表示节点v1和超边e3的关联程度。一方面,若将边
Figure BDA0003684371630000206
视为信息发送者,t阶反卷积核C(t)的第一行第三列的值作为权重赋予给
Figure BDA0003684371630000207
中对应位置的
Figure BDA0003684371630000208
上,再将其加到
Figure BDA0003684371630000209
的第一行和第三列中的每一个元素上,即扩散到其一阶邻域内的所有边上,完成对边
Figure BDA00036843716300002010
的t阶边扩散反卷积操作。另一方面,将边
Figure BDA00036843716300002011
视为信息接收者,
Figure BDA00036843716300002012
将接收到
Figure BDA00036843716300002013
的第一行和第三列中的每个元素传播的信息,由此完成自身的信息更新。
t阶扩散反卷积的意义:在t阶扩散反卷积的过程中,t-1阶生成脑区-基因超图中的每条潜在边与真实边吸收其一阶邻域内的结构信息,由于此时网络图中的每条潜在边与真实边已经接收到了t-1阶邻域内的信息,因此t阶扩散反卷积能使每条边聚集到其t阶邻域内的结构信息。在低阶脑区-基因子超图中,超边与脑区或基因等节点互相连接形成疾病独有的结构信息,本文设计的扩散反卷积能够很好地捕捉低阶脑区-基因子超图中边与其邻域内其他边之间的关系。图14表示的是t-1阶生成脑区-基因超图的t阶扩散反卷积操作,此时网络中的每条边都吸收了t-1阶邻域内的结构信息。以图14中边
Figure BDA00036843716300002014
为例,节点v2~v6为边
Figure BDA00036843716300002015
的一阶邻域内的节点,超边e1,e2,e4~e6为边
Figure BDA00036843716300002016
的一阶邻域内的超边,经过t阶扩散反卷积,边
Figure BDA00036843716300002017
将其自身吸收到的t-1阶结构信息扩散到其一阶邻域内的节点和超边上,也就是说,边
Figure BDA00036843716300002018
一阶邻域内的节点和超边吸收了其t阶邻域内的结构信息。
上述的判别器202的作用有三个,第一,通过边点卷积操作聚集超图中的高阶边级-点级结构信息得到高阶脑区-基因超图,并与低阶脑区-基因超图融合为关键脑区-基因超图;第二,判断输入的脑区-基因超图真假,即判断超图是由原始数据得到的还是通过生成器生成的;第三,预测样本的类别,即预测一个样本为AD患者或正常个体的概率。对抗训练结束后,网络中的各参数值被调至最优,最终使判别器能够精准分类,并提取到AD患者的关键结构信息。
在一个较优的实施方式中,判别器202中包括了边点卷积层,融合层和全连接层。具体地,边点卷积层用于捕获脑区-基因超图的高阶边级-点级结构信息,融合层用于将高阶信息与低阶信息融合得到脑区-基因关键超图,全连接层用于判断输入的脑区-基因超图的真假与样本的类别。首先,输入生成脑区-基因超图或真实脑区-基因超图;其次,通过边点卷积层捕获输入超图中的高阶边级-点级结构信息,得到高阶脑区-基因子超图;再次,融合高阶脑区-基因子超图与低阶脑区-基因子超图得到关键脑区-基因超图,实现不同层次结构信息的融合,最后,经过全连接层输出对关键脑区-基因超图真假以及样本类别的判断结果。下面分别介绍上述各层中的具体操作。
如图15所示,判别器202可以包括:边点卷积层模块1501、第二融合层模块1502和全连接层模块1503;
其中,边点卷积层模块1501用于对输入判别器202的脑区-基因超图进行多次边级-点级结构信息聚集得到高阶脑区-基因子超图;具体地,边点卷积层模块1501中可以包括T2阶边点卷积层,用以对输入判别器202的脑区-基因超图的关联权重矩阵进行T2次边点卷积层,得到高阶脑区-基因子超图的关联权重矩阵,从而实现使脑区-基因超图逐步演化为高阶脑区-基因子超图。
如图15所示,输入到边点卷积层模块1501的脑区-基因超图可以是生成器201生成的(重构的)脑区-基因超图,也可以是真实的脑区-基因超图。
输入到边点卷积层模块1501中的脑区-基因超图的关联权重矩阵,每经过一次边点卷积,脑区-基因超图会聚集高阶的边级-点级结构信息,更新关联权重矩阵,进而使脑区-基因超图的拓扑结构发生变化,最终输出高阶脑区-基因子超图。下面以t-1阶脑区-基因超图经过t阶边点卷积得到t阶脑区-基因超图为例,描述边点卷积的具体过程。其中,T2为大于1的自然数,t为小于等于T2的自然数。
其中,边点卷积层模块1501中的第t阶边点卷积层,用于对输入的关联权重矩阵H(t-1),进行一次边点卷积操作后,得到并输出更新的关联权重矩阵H(t);亦即,t-1阶脑区-基因超图经过t阶边点卷积后,每条边聚集了t阶邻域内的边级-点级结构信息,得到更新的关联权重矩阵H(t),如公式20所示:
Figure BDA0003684371630000211
其中,H(t-1)表示t-1阶脑区-基因超图的关联权重矩阵,即关联权重矩阵H(0)经过t-1阶边点卷积层的t-1次边点卷积后得到的关联权重矩阵;H(0)为输入判别器202的脑区-基因超图的关联权重矩阵;
Figure BDA0003684371630000221
Figure BDA0003684371630000222
分别表示第t阶边点卷积层中的边卷积核与点卷积核,二者均为可学习的参数矩阵;ReLU(·)是激活函数;H(t)为t阶边点卷积的输出结果。
下面以一个具有6个节点的脑区-基因超图为例解释t阶边点卷积操作。如图16所示,图16中(a)为脑区-基因超图及其关联权重矩阵H(t-1),图中边
Figure BDA0003684371630000223
是将要进行t阶边点卷积操作的边,图16中(b)是t阶边卷积核
Figure BDA0003684371630000224
和t阶点卷积核
Figure BDA0003684371630000225
图(c)是对边
Figure BDA0003684371630000226
的t阶边点卷积操作。脑区-基因超图的关联权重矩阵H(t-1)
Figure BDA0003684371630000227
表示节点v1和超边e1的关联权重,值越大表示联系越紧密。首先,将t阶边卷积核
Figure BDA0003684371630000228
的第一行作为权重赋给H(t-1)的第一列得到聚集边级结构信息的中间矩阵U,其次,将t阶点卷积核
Figure BDA0003684371630000229
的第一列作为权重赋给中间矩阵U的第一行,完成对边
Figure BDA00036843716300002210
的t阶边点卷积操作。以此类推,对每个节点进行上述卷积操作,得到更新的关联权重矩阵H(t)
t阶边点卷积的意义:在t阶边点卷积过程中,t-1阶脑区-基因超图中每条超边聚集到其一阶邻域内的边级-点级结构信息,而由于此时所有的超边已经在它们各自的t-1阶邻域内聚集到了边级-点级结构信息,所以t阶边点卷积过程可以使每条超边聚集其t阶邻域内的边级-点级结构信息。在疾病的脑区-基因超图中,超边将异常的节点(脑区或基因)连接起来形成疾病独有的高阶边级-点级结构信息,脑区或基因节点越异常,连接它们的边就越能够代表该疾病特征的边级-点级结构信息。本文设计的边点卷积能够很好地捕捉脑区-基因超图中节点与超边之间的高阶关联。图17展示的是t阶边点卷积操作,此时图中的每条边都聚集了t-1阶边级-点级结构信息。以边
Figure BDA00036843716300002211
为例,经过t阶边点卷积,边
Figure BDA00036843716300002212
能够分别通过超边e1和节点v1聚集到t阶边级结构信息与点级结构信息,图17中(a)展示的是超边e1的一阶邻域内的边级结构信息聚集过程,图17中(b)展示的是节点v1的一阶邻域内的点级结构信息聚集过程。
判别器的边点卷积层模块1501中,边点卷积层共有T2层,即总共进行T2次边级-点级结构信息聚集。T2阶点边卷积的输出结果
Figure BDA00036843716300002213
即为高阶脑区-基因子超图的关联矩阵,如公式21所示:
Figure BDA0003684371630000231
判别器的第二融合层模块1502用于对的边点卷积层模块1501输出的高阶脑区-基因子超图和生成器生成的低阶脑区-基因子超图进行融合,输出为融合了高阶和低阶结构信息的关键脑区-基因超图。
具体地,第二融合层模块1502对边点卷积层模块1501输出的高阶脑区-基因子超图的关联权重矩阵HH和生成器输出的低阶脑区-基因子超图的关联权重矩阵HL进行融合,输出为融合了高阶和低阶结构信息的关键脑区-基因超图的关联权重矩阵HK,如公式22所示:
HK=θHH+(1-θ)HL (公式22)
其中,θ为设定的融合因子。
如图18所示,全连接层模块1503中包括平坦层、全连接层和输出层;全连接层模块1503的输入为关键脑区-基因超图,并输出针对输入判别器202的脑区-基因超图的真假判断结果与属于AD或NC的概率的判断结果。首先,全连接层模块1503中的平坦层将经过融合层得到的关键脑区-基因超图的关联权重矩阵HK平铺为一维特征向量X(0);全连接层模块1503中的全连接层包含多层,都使用的是激活函数ReLU(·),用于对平铺后的一维特征向量X(0)提取特征;最后,全连接层模块1503中的输出层根据提取的特征通过激活函数Sigmoid(·)和Softmax(·)分别输出真假和NC/AD的判断结果,上述过程如公式23-25所示:
X(t+1)=ReLU(W(t)X(t)+b(t)),t≤L-1 (公式23)
p=softmax(W(t)X(t)+b(t)),t=L (公式24)
q=sigma(W(t)X(t)+b(t)),t=L (公式25)
其中,全连接层的输入为X(0)=Ran(HK),Ran(·)为矩阵的按行平铺函数,Ran(HK)表示将关键脑区-基因超图二维关联权重矩阵HK平铺得到一维向量。q是全连接层模块1503中的输出层输出的有关超图的真假的判断结果,使用的激活函数为Sigmoid(·),p是全连接层模块1503中的输出层输出的AD或NC类别的概率的判断结果,使用的激活函数为Softmax(·);W(t)表示第t层全连接层的权重矩阵;X(t)和X(t+1)分别表示第t层和第t+1层全连接层的一维向量;b(t)表示第t层全连接层的偏置;L表示全连接层的总层数。
实施例二
在对基于生成对抗网络的超图结构信息聚集模型进行训练时,判别器的输入有两种:真实的脑区-基因超图和生成器生成的(重构的)脑区-基因超图;判别器的作用有两个,第一是判断输入的脑区-基因超图的真假性,即判断输入的脑区-基因超图是真实的,还是生成器生成的;第二是判断输入的脑区-基因超图是正常人(NC)的还是AD的。判别器和生成器互相训练,不断调优,直至生成对抗网络收敛。此时,关键结构子网络能够聚集被试脑区-基因网络的特征信息,从而根据关键结构子网络进行AD的判断,可以辅助于对阿尔茨海默症做精准的诊断。
本发明实施例二提供的一种训练上述基于生成对抗网络的超图结构信息聚集模型的具体方法,流程如图19所示,包括如下步骤:
步骤S1901:生成训练样本。
具体地,以正常人的脑影像(fMRI)数据和基因数据分别构建脑网络和基因网络,进而将构建的脑网络和基因网络根据现有方法进行融合,得到正常人的脑区-基因网络;具体地,以脑区和基因为节点,采用现有的皮尔逊相关分析方法计算节点之间边的权重,若边权重大于阈值则保留该边,反之去掉该边,以此构建脑区-基因网络,实现脑网络和基因网络的融合;进而基于构建的脑区-基因网络生成正常人的脑区-基因超图。
以AD患者的脑影像(fMRI)数据和基因数据分别构建脑网络和基因网络,进而将构建的脑网络和基因网络进行融合,得到AD患者的脑区-基因网络;基于得到的脑区-基因网络,生成AD患者的脑区-基因超图。
本步骤中,以多个正常人的脑影像(fMRI)数据和基因数据,分别构建多个正常人的脑区-基因超图作为样本;以及以多个AD患者的脑影像(fMRI)数据和基因数据,分别构建多个AD患者的脑区-基因超图作为样本。
步骤S1902:根据所述样本对所述生成器和判别器进行多次迭代的优化和训练;
具体地,在模型训练过程中,判别器和生成器始终维持着对立与抗争关系,前者期盼重构的脑区-基因网络非常接近真实的脑区-基因网络,以此瞒过后者,而后者期盼能够精准判断生成的脑区-基因网络和真实的脑区-基因网络;由此,本步骤中对所述生成器和判别器进行多次迭代的优化和训练,使得二者不断进行对抗博弈,生成能力和判断能力分别得到增强,直到模型收敛,最终使得生成器能够更好地完成生成任务。
其中,对所述生成器和判别器进行一次迭代的优化和训练的过程,具体流程如图20所示包括如下子步骤:
子步骤S2001:固定所述生成器的参数后,根据所述样本对所述判别器进行优化;
子步骤S2002:固定所述判别器的参数后,根据所述样本对所述生成器进行训练。
步骤S1903:在对所述生成器和判别器进行多次迭代的优化和训练后,将由所述生成器和判别器组成的生成对抗网络作为训练得到的结构信息聚集模型。
具体地,上述子步骤S2001中提到的固定所述生成器的参数后,根据所述样本对所述判别器进行优化的具体方法流程,如图21所示,包括如下步骤:
步骤S2101:固定所述生成器的参数后,将样本中的正常人的脑区-基因超图或AD患者的脑区-基因超图输入到所述生成器中,由所述生成器根据输入的脑区-基因超图重构变化的脑区-基因超图;
步骤S2102:将所述生成器重构的脑区-基因超图或者样本中的正常人或AD患者的脑区-基因超图输入判别器;
步骤S2103:根据所述判别器输出的判断结果,对所述判别器的参数进行优化。
在根据所述判别器输出的判断结果与真实标签之间的差异,对所述判别器的参数进行优化时,是通过损失函数的计算结果进行判别器的参数优化,使得判别器区分真实脑区-基因超图和生成脑区-基因超图能力达到最佳。其中,所述真实标签反映的是输入到判别器的脑区-基因超图的真实情况。
例如,pi是判别器根据输入其的第i个脑区-基因网络输出的判断结果;pi为一个二维列向量
Figure BDA0003684371630000251
Figure BDA0003684371630000252
表示判断结果为正常人的概率,
Figure BDA0003684371630000253
表示判断结果为AD患者的概率。
ti是对应于pi的真实标签;ti为一个二维行向量,当值取(1,0)时表示输入到判别器的脑区-基因超图的真实标签为正常人,当值取(0,1)时表示输入到判别器的脑区-基因超图的真实标签为AD患者,当值取(0,0)时表示输入到判别器的脑区-基因超图的真实标签为重构的脑区-基因超图。
根据pi与ti之间的差异,对所述判别器的参数进行优化。
损失函数是评估模型的性能与预期的结果接近程度,损失函数值的大小与模型预测性能成反比。
本发明定义的损失函数Loss,如公式26所示:
Figure BDA0003684371630000261
其中,生成器和判别器分别用G和D表示;E(·)表示求取变量的期望值;x表示正常人或AD患者的脑区-基因超图(即真实的脑区-基因超图),Pdata(x)表示x的分布,D(x)表示判别器判断x为真实脑区-基因超图的概率;G(z)表示生成器生成的(重构的)脑区-基因超图,Pz(Z)表示数据z的分布,D(G(z))表示判断G(z)为真实脑区-基因超图的概率。
本步骤中,对所述判别器的参数进行优化时,使公式27达到最佳:
Figure BDA0003684371630000262
判别器的优化目标是区分真实脑区-基因超图和生成脑区-基因超图,公式中D(x)表示x为真实脑区-基因超图的概率,1-D(G(z))表示G(z)为生成脑区-基因超图的概率。log(·)为单调增函数,当D(x)和1-D(G(z))趋近1时,公式27达到最大值,判别器的区分能力达到最佳。
具体地,上述子步骤S2002中提到的固定所述判别器的参数后,根据所述样本对所述生成器进行训练的具体方法流程,如图22所示,包括如下步骤:
步骤S2201:在固定所述判别器的参数后,将样本中的正常人或AD患者的脑区-基因网络输入到所述生成器中,由所述生成器根据输入的脑区-基因网络重构变化的脑区-基因网络;
步骤S2202:将所述生成器重构的脑区-基因网络输入到所述判别器;
步骤S2203:根据所述判别器输出的判断结果对所述生成器的参数进行调整。
本步骤中,根据判别器的判断结果与真实标签之间的差异,对所述生成器的参数进行调整,使生成器重构尽可能真实的脑区-基因网络来欺骗判别器。
在本步骤中固定判别器优化生成器的参数时,使公式28达到最佳:
Figure BDA0003684371630000263
生成器G的优化目标是使生成器能够拟合真实脑区-基因超图的分布。公式中的G(z)表示生成脑区-基因超图,D(G(z))表示判别器判断G(z)为真实脑区-基因超图的概率,log(·)为单调增函数,当D(G(z))接近于1时,1-D(G(z))接近于0,公式28达到最小值,此时真实脑区-基因超图分布足够接近生成脑区-基因超图分布。
通过反复迭代上述图21、图22所示的流程过程,判别器的判断能力和生成器的重构能力不断提高,直至生成对抗网络收敛。
实施例三
基于预先训练得到的超图结构信息聚集模型,本发明实施例三提供的一种阿尔茨海默症的判断方法,具体流程如图23所示,包括如下步骤:
步骤S2301:根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因超图。
本步骤中,根据被试者的脑影像数据和基因数据,分别构建脑网络和基因网络,进而将构建的脑网络和基因网络根据现有方法进行融合,得到被试者的脑区-基因网络;具体地,以脑区和基因为节点,采用现有的皮尔逊相关分析方法计算节点之间边的权重,若边权重大于阈值则保留该边,反之去掉该边,以此构建脑区-基因网络,实现脑网络和基因网络的融合;进而,基于所述脑区-基因网络生成被试者的脑区-基因超图。
步骤S2302:将该脑区-基因超图输入到通过上述方法预先训练得到的超图结构信息聚集模型中。
步骤S2303:通过超图结构信息聚集模型进行该被试者是否为阿尔茨海默症AD患者的判断。
具体地,通过超图结构信息聚集模型中上述的生成器,将被试者的脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;以及
通过超图结构信息聚集模型中上述的判别器对所述脑区-基因超图进行多次高阶边级-点级结构信息聚集,得到高阶脑区-基因子超图;将低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图;根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果。
例如,超图结构信息聚集模型输出的判断结果为pi,为一个二维列向量
Figure BDA0003684371630000271
Figure BDA0003684371630000281
表示判断结果为正常人的概率,
Figure BDA0003684371630000282
表示判断结果为AD患者的概率。
实施例四
图24示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理单元)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的阿尔茨海默症的判断方法。
此外,所述处理器执行所述计算机程序时还可实现本说明书实施例所提供的超图结构信息聚集模型的训练方法。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,可以与非线性接收机相连,从非线性接收机接收信息,实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质其上存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行实现实施例中的电子设备的操作。
本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,简称为SMC),安全数字(Secure Digital,简称为SD)卡,闪存卡(Flash Card)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例中语音视频连线方法的程序代码等。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。
为了验证基于生成对抗网络训练得到的超图结构信息聚集模型对阿尔茨海默症的判断性能,本文从ADNI网站上的在线数据库采集用于实验的受试者数据;所选受试者的基本信息如表1所示。为了全面探讨本文提出的方法的效率和优越性,我们从几个不同的类别中对受试者进行了分类。除AD患者和健康对照组(NCs)外,还选择了MCI患者,包括早期MCI(Early MCI,EMCI)和晚期MCI(Late MCI,LMCI LMCI)。我们对性别和年龄等其他因素进行了统计测试,未发现明显差异。
表1
Figure BDA0003684371630000291
本文所用的影像数据为fMRI数据,为了进行数据预处理,本研究使用了基于MATLAB平台的DPARSF工具。具体步骤有:转换原始DCM文件为NIFTI格式、删除最初的10个时间点、头动矫正、消除随时间增加或减少的残余噪声、滤波以保持波动在0.01Hz±0.08Hz范围内等。
本文使用的SNP数据通过PLINK工具进行预处理,在本研究中选择并编码SNP最多的基因,并基于次要等位基因频率原则[8]实现基因序列的编码。最后,如方法学部分所述,所有基因序列和时间序列的长度统一确定为70。
本文提出的超图结构信息聚集模型(HSIA-GAN)的应用是基于影像遗传学的样本分类,为了验证HSIA-GAN的优越性,本发明进行了对比试验,实验的具体设置如下:
首先,使用六种种常见的评价指标来评估分类性能,分别为:分类准确率(Accuracy,ACC)、敏感性(Sensitivity,SEN)、精度(Precision,PRE)、特异性(Specificity,SPE)、F1分数(F1-score,F1),以及受试者工作特性(Receiver OperatingCharacteristic,ROC)曲线的曲线下面积(Area Under the Curve,AUC),公式如下所示:
Figure BDA0003684371630000301
Figure BDA0003684371630000302
Figure BDA0003684371630000303
Figure BDA0003684371630000304
Figure BDA0003684371630000305
其中,TP、TN、FP和FP分别表示真阳率、真阴率、假阳率和假阴率。
其次,用于对比的方法可分为两组。一组是经典的方法,包括支持向量机(SupportVector Machine,SVM)、深度神经网络(Deep Neural Network,DNN)和卷积神经网络(Convolution Neural Networks,CNN);另一组则包括本发明提出的HSIA-GAN的三个变体:G-GAN使用平凡图卷积来实现生成器和鉴别器,HSIA-GAN(without Nconv)是去除了点卷积的HSIA-GAN,HSIA-GAN(without Econv)是去除了边卷积的HSIA-GAN。
最后,测试了各方法的AD判断任务性能。所有方法都在分别在单模态和多模态数据集下进行测试。表2总结了所有方法的判断性能结果,图25使用雷达图描述了各个指标的大小关系。可以看出,在所有评价指标中,所提出的HSIA-GCN在所有方法中表现均为最好,这证明了方法的优越性。
表2
Figure BDA0003684371630000306
Figure BDA0003684371630000311
此外,还可以得出其他几个重要结论。首先,与传统的机器学习和深度学习方法相比,基于图卷积的方法总是具有更好的性能,表明图卷积可以更好地提取包含在图或超图结构中的结构信息。第二,HSIA-GAN的表现总是优于G-GAN,这表明超图比普通图具有更丰富的结构信息,可以更精确地实现判断。
本发明的技术方案中,根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;基于所述脑区-基因网络中节点的邻居节点,构建节点之间的超边;基于所述节点及节点之间的超边形成脑区-基因超图;通过超图结构信息聚集模型将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;以及对所述脑区-基因超图进行多次高阶边级-点级结构信息聚集,得到高阶脑区-基因子超图;将低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图;以及根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果;其中,所述超图结构信息聚集模型是以多个正常人的脑区-基因超图和AD患者的脑区-基因超图作为样本预先训练得到的。由于对脑区-基因超图进行低阶结构信息和高阶结构信息的聚集得到的关键脑区-基因超图,更能体现AD与正常个体的判断性特征;因此,根据关键脑区-基因超图判断被试者是正常人还是AD的概率更为准确,可以辅助于对阿尔茨海默症做更精准的诊断。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于超图结构信息聚集模型的电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时用于实现:
根据被试者的脑影像数据和基因数据,构建该被试者的脑区-基因网络;
基于所述脑区-基因网络中节点的邻居节点,构建节点之间的超边;基于所述节点及节点之间的超边形成脑区-基因超图;
通过超图结构信息聚集模型将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;以及
对所述脑区-基因超图进行多次高阶边级-点级结构信息聚集,得到高阶脑区-基因子超图;将低阶脑区-基因子超图和高阶脑区-基因子超图融合得到关键脑区-基因超图;以及
根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果;
其中,所述超图结构信息聚集模型是以多个正常人的脑区-基因超图和AD患者的脑区-基因超图作为样本预先训练得到的。
2.根据权利要求1所述的电子设备,其特征在于,所述超图结构信息聚集模型包括:
生成器,用于将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并分别对所述脑区-基因边图和脑区-基因点图进行多次边级特征信息聚集与点级特征信息聚集,将信息聚集后的边图和点图进行融合得到低阶脑区-基因子超图;进而对所述低阶脑区-基因子超图进行结构信息扩散得到重构的脑区-基因超图;
判别器,用于对重构的脑区-基因超图进行多次边级-点级结构信息聚集得到高阶脑区-基因子超图;将所述高阶脑区-基因子超图和低阶脑区-基因子超图进行融合得到关键脑区-基因超图;进而根据所述关键脑区-基因超图输出该被试者为阿尔茨海默症AD患者的概率的判断结果。
3.根据权利要求2所述的电子设备,其特征在于,所述生成器中包括:
转换层模块,用于将所述脑区-基因超图转换为脑区-基因边图和脑区-基因点图,并输出所述脑区-基因边图的边权重矩阵和脑区-基因点图的点权重矩阵;
边卷积层模块,用于对所述脑区-基因边图的边权重矩阵进行多次边级特征信息聚集,得到关键脑区-基因边图的边权重矩阵;
点卷积层模块,用于对所脑区-基因点图的点权重矩阵进行多次点级特征信息聚集,得到关键脑区-基因点图的点权重矩阵;
第一融合层模块,用于将所述关键脑区-基因边图的边权重矩阵和关键脑区-基因点图的点权重矩阵进行融合得到低阶脑区-基因子超图的关联权重矩阵;
反卷积模块,用于对低阶脑区-基因子超图的关联权重矩阵通过反卷积操作进行结构信息扩散,得到重构的脑区-基因超图的关联权重矩阵。
4.根据权利要求2所述的电子设备,其特征在于,所述判别器中包括:
边点卷积层模块,用于对重构的脑区-基因超图的关联权重矩阵进行多次边级-点级结构信息聚集得到高阶脑区-基因子超图的关联权重矩阵;
第二融合层模块,用于将所述高阶脑区-基因子超图的关联权重矩阵和低阶脑区-基因子超图的关联权重矩阵进行融合得到关键脑区-基因超图的关联权重矩阵;
全连接层模块,用于将所述关键脑区-基因超图的关联权重矩阵平铺为一维特征向量,并对平铺后的一维特征向量提取特征,进而根据提取的特征输出该被试者为AD患者的概率的判断结果。
5.根据权利要求3所述的电子设备,其特征在于,所述边卷积层模块中包括T1阶边卷积层;
其中,第t阶边卷积层,用于对输入的边权重矩阵
Figure FDA0003684371620000021
进行一次边卷积,输出更新的边权重矩阵
Figure FDA0003684371620000022
其中,
Figure FDA0003684371620000023
是边权重矩阵
Figure FDA0003684371620000024
经过t-1阶边卷积层的t-1次边卷积后得到的边权重矩阵;
Figure FDA0003684371620000025
表示由所述转换层模块输出到所述边卷积层模块中的所述脑区-基因边图的边权重矩阵;以及
所述点卷积层模块中包括T1阶点卷积层;
其中,第t阶点卷积层,用于对输入的点权重矩阵
Figure FDA0003684371620000026
进行一次点卷积操作后,输出更新的权重矩阵
Figure FDA0003684371620000027
其中,
Figure FDA0003684371620000028
表示点权重矩阵
Figure FDA0003684371620000029
经过t-1阶点卷积层的t-1次点卷积后得到的点权重矩阵;
Figure FDA00036843716200000210
表示由所述转换层模块输出的所述脑区-基因点图的点权重矩阵;以及
所述反卷积模块中包括T1阶反卷积层;
其中,第t阶反卷积层,用于对输入的关联权重矩阵
Figure FDA0003684371620000031
进行一次反卷积操作后,输出更新的权重矩阵
Figure FDA0003684371620000032
其中,
Figure FDA0003684371620000033
是关联权重矩阵
Figure FDA0003684371620000034
经过t-1阶反卷积层的t-1次反卷积后得到的关联权重矩阵;
Figure FDA0003684371620000035
表示由第一融合层模块融合得到并输出的低阶脑区-基因子超图的关联权重矩阵;
其中,T1为大于1的自然数,t为小于等于T1的自然数。
6.根据权利要求4所述的电子设备,其特征在于,所述边点卷积层模块中包括T2阶边点卷积层;
其中,第t阶边点卷积层,用于对输入的关联权重矩阵H(t-1),进行一次边点卷积操作后,得到并输出更新的关联权重矩阵H(t);其中,H(t-1)表示关联权重矩阵H(0)经过t-1阶边点卷积层的t-1次边点卷积后得到的关联权重矩阵;H(0)为输入所述判别器的脑区-基因超图的关联权重矩阵;
其中,T2为大于1的自然数,t为小于等于T2的自然数。
7.根据权利要求2所述的电子设备,其特征在于,所述中央处理单元执行所述程序还实现:对所述所述超图结构信息聚集模型进行训练:
根据所述样本对所述生成器和判别器进行多次迭代的优化和训练;其中,在一次迭代过程中,包括:
固定所述生成器的参数后,根据所述样本对所述判别器进行优化;
固定所述判别器的参数后,根据所述样本对所述生成器进行训练;
在对所述生成器和判别器进行多次迭代的优化和训练后,得到由所述生成器和判别器构成的、训练后的超图结构信息聚集模型。
8.根据权利要求7所述的电子设备,其特征在于,所述中央处理单元执行所述程序在实现对所述判别器进行优化时,具体包括:
将样本中的正常人或AD患者的脑区-基因超图输入到所述生成器中,由所述生成器根据输入的脑区-基因超图重构变化的脑区-基因超图;
将所述生成器重构的脑区-基因超图或样本中的正常人或AD患者的脑区-基因超图输入到所述判别器;
根据所述判别器输出的判断结果,对所述判别器的参数进行优化。
9.根据权利要求8所述的电子设备,其特征在于,所述中央处理单元执行所述程序在实现对所述生成器进行训练时,具体包括:
将样本中的正常人或AD患者的脑区-基因超图输入到所述生成器中,由所述生成器重构变化的脑区-基因超图;
将所述生成器重构的脑区-基因超图输入到所述判别器;
根据所述判别器输出的判断结果对所述生成器的参数进行调整。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行权利要求1-9中任意一项所述的电子设备的操作。
CN202210641651.3A 2022-06-08 2022-06-08 一种基于超图结构信息聚集模型的电子设备 Withdrawn CN115019971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210641651.3A CN115019971A (zh) 2022-06-08 2022-06-08 一种基于超图结构信息聚集模型的电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210641651.3A CN115019971A (zh) 2022-06-08 2022-06-08 一种基于超图结构信息聚集模型的电子设备

Publications (1)

Publication Number Publication Date
CN115019971A true CN115019971A (zh) 2022-09-06

Family

ID=83073295

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210641651.3A Withdrawn CN115019971A (zh) 2022-06-08 2022-06-08 一种基于超图结构信息聚集模型的电子设备

Country Status (1)

Country Link
CN (1) CN115019971A (zh)

Similar Documents

Publication Publication Date Title
US11645541B2 (en) Machine learning model interpretation
CN108231201B (zh) 一种疾病数据分析处理模型的构建方法、系统及应用方法
Xia et al. Complete random forest based class noise filtering learning for improving the generalizability of classifiers
US20190005384A1 (en) Topology aware graph neural nets
CN110659723B (zh) 基于人工智能的数据处理方法、装置、介质及电子设备
CN112966114A (zh) 基于对称图卷积神经网络的文献分类方法和装置
CN112037179B (zh) 一种脑疾病诊断模型的生成方法、系统及设备
CN107480702A (zh) 面向hcc病理图像识别的特征选择与特征融合方法
EP4273754A1 (en) Neural network training method and related device
CN116959725A (zh) 一种多模态数据融合的疾病风险预测方法
Cheung et al. Hybrid evolution of convolutional networks
Thakur et al. Artificial intelligence-based image classification techniques for hydrologic applications
Swarna et al. Detection of colon cancer using inception v3 and ensembled cnn model
CN116759067A (zh) 一种基于重建和Tabular数据的肝病诊断方法
CN115019971A (zh) 一种基于超图结构信息聚集模型的电子设备
CN117010480A (zh) 模型训练方法、装置、设备、存储介质及程序产品
CN114999664A (zh) 一种提取阿兹海默症的显著特征的电子设备
Christodoulou et al. Improving the performance of classification models with fuzzy cognitive maps
Manimegalai et al. Deep Learning Based Approach for Identification of Parkinson’s Syndrome
CN112270996A (zh) 一种可用于多变量医疗传感数据流的分类方法
CN114494753A (zh) 聚类方法、装置、电子设备及计算机可读存储介质
CN114758772A (zh) 一种基于结构信息聚集模型的电子设备
Fombellida et al. Application of artificial metaplasticity fundamentals to WBCD breast cancer database classification method
CN114711721A (zh) 基于特征信息聚集模型的ad诊断及风险要素确定方法
Liew et al. Hierarchical parallel genetic optimization fuzzy ARTMAP ensemble

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220906

WW01 Invention patent application withdrawn after publication