CN115641955B - 基于深度学习的胃癌分期判别系统及存储介质 - Google Patents

基于深度学习的胃癌分期判别系统及存储介质 Download PDF

Info

Publication number
CN115641955B
CN115641955B CN202211280416.4A CN202211280416A CN115641955B CN 115641955 B CN115641955 B CN 115641955B CN 202211280416 A CN202211280416 A CN 202211280416A CN 115641955 B CN115641955 B CN 115641955B
Authority
CN
China
Prior art keywords
gene
gastric cancer
matrix
network
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211280416.4A
Other languages
English (en)
Other versions
CN115641955A (zh
Inventor
许伊宁
赵天意
刘博�
王亚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202211280416.4A priority Critical patent/CN115641955B/zh
Publication of CN115641955A publication Critical patent/CN115641955A/zh
Application granted granted Critical
Publication of CN115641955B publication Critical patent/CN115641955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Image Analysis (AREA)

Abstract

基于深度学习的胃癌分期判别系统及存储介质,属于癌症辅助判识技术领域。本发明为了解决现有的胃癌分期判别准确率低的问题,本发明首先通过组学特征相关系数计算单元对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,并得到组学特征矩阵;然后通过胃癌标记基因筛选单元:计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,并与用户输入的原始数据加权,得到特征矩阵Sq*r;胃癌分期预测单元基于该特征矩阵,利用神经网络对胃癌分期进行预测。本发明用于胃癌的分期判别。

Description

基于深度学习的胃癌分期判别系统及存储介质
技术领域
本发明属于癌症辅助判识技术领域,具体涉及一种胃癌分期判别系统及存储介质。
背景技术
胃癌是实质固体癌的一种,由胃上皮细胞恶性增殖导致,胃癌的综合治疗主要以病理分期(TNM)为依据。其中T(tumor)分期根据肿瘤浸润胃壁组织的深度判断,N(node)分期根据淋巴结转移检出数量判断,M(metastasis)分期根据远位器官、淋巴结、腹膜转移是否检出判断。
胃癌TNM分期的临床不足和检测难点在于以下方面:
胃癌诊疗关键学科发展不平衡,病理、影像、内镜等传统支撑学科发展相对滞后,特别是胃癌组织病理学诊断的专业化、规范化程度有待提高,我国存在地区性病理组织取材、检测技术及诊断水平差异,这对我国胃癌整体诊疗水平造成较大掣肘。
判断T分期时,仅靠肉眼可见癌灶取材、取材不足等技术缺陷会造成浅表广泛型早期胃癌、多发早期胃癌的分级误判,低T1-T2期胃癌分级会导致后期治疗方案的错误制定,延误最佳治疗时机;此外,对于T3-T4期的胃癌常见术中病理分期误判,导致中晚期胃癌切除手术预后不佳。
判断N分期时根据淋巴结捡取数判断,并根据淋巴结捡取转移检出比例优化,临床上淋巴结捡取数不足是导致N分期偏移的重要影响因素。
判断M分期时,腹膜转移是胃癌最为常见的转移形式,早期诊断困难,预后极差,临床采用腹膜冲洗液检测是否含有腹腔内脱落癌细胞,依此判断是否有腹膜转移,然而腹膜冲洗液检测敏感性低,为了提高腹膜转移检测能力,常采用胃癌标记基因辅助检测。
发明内容
本发明为了解决现有的胃癌分期判别准确率低的问题。
一种基于深度学习的胃癌分期判别系统,包括:
组学特征相关系数计算单元:针对输入的实例,针对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,将单一组学对应的特征相似性系数构成的相似性矩阵作为组学特征矩阵F,或者将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵F;
胃癌标记基因筛选单元:针对将基因i和基因j作为节点i和节点j的图注意力网络,计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,与用户输入的原始数据加权,原始数据有q个基因,得到新的特征矩阵Sq*r
胃癌分期预测单元:用胃癌分期预测网络预测胃癌分期;胃癌分期预测网络的输入为输入特征矩阵Sq*r,或者特征矩阵Sq*r和胃癌临床影像学图像;
所述胃癌分期预测网络包括第一卷积层、第一残差层、第二卷积层、第二残差层、第三卷积层、flatten层、第一Dense层、BN层、Dropout层、第二Dense层和输出层;
胃癌分期预测网络的输出为胃癌分期的预测结果。
进一步地,所述的一种基于深度学习的胃癌分期判别系统,还包括基因间关系网络调取单元,用于调取基因间关系网络,基因间关系网络用于生成基因间关系;
进一步地,所述基因间关系网络通过以下步骤确定:
(1)从基因-基因调控关系数据库获取成对基因关系以及基因的调控关系网络,用genei和genej表示基因i和基因j;
(2)从蛋白质-蛋白质相互作用关系数据库获取成对蛋白质关系以及蛋白质相互作用网络,蛋白质在细胞生命过程中由基因表达产生,蛋白质的关系因此能够映射到基因;
(3)基因调控网络和蛋白质相互作用网络得到基因间关系网络。
进一步地,计算每个组学的任意两个基因的特征相似性系数,得到组学特征矩阵的过程包括以下步骤:
将每一个输入实例的特征表示为一个1*q维向量,q为基因组成长度,即q个基因;m个实例的特征表示为m*q维的特征矩阵,即m个实例*q维特征;
根据如下公式计算每个组学的任意两个基因间相似性系数,生成相似性矩阵Fq*q,相似性矩阵Fq*q中的元素:
Figure BDA0003897755850000021
其中,genei,genej表示任意两个基因;分子表示基因genei,genej在全部实例中的协方差;分母
Figure BDA0003897755850000022
表示基因genei,genej在全部实例中的标准差的积。
进一步地,基因在全部实例中的标准差如下:
Figure BDA0003897755850000023
Figure BDA0003897755850000024
其中,x表示全部实例中的基因;τx为基因在全部实例中的标准差。
进一步地,将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵的过程如下:
将每个组学特征对应的相似性矩阵Fq*q记为FO,然后根据如下公式计算特征矩阵平均值得到组学特征矩阵F;
Figure BDA0003897755850000031
其中,FO表示O个组学特征矩阵中的每个组学特征矩阵。
进一步地,胃癌标记基因筛选单元中计算图注意力网络中节点i和节点j的注意力系数如下:
Figure BDA0003897755850000032
其中,基因i和基因j即genei和genej;αij代表genei对genej的注意力系数;i为基因i在基因关系网络中的一阶邻域,即基因间关系网络中与genei相连的节点,图注意力网络认为节点能够感知相邻的节点状态,与实际基因-基因关系相对应,k∈Neighbori指基因i在基因间关系网络中链接到的邻居genek;hi为基因i的组学特征;记Fi、Fj、Fk分别为组学特征矩阵的第i、j、k行或列,
Figure BDA0003897755850000033
Figure BDA0003897755850000034
是每个基因对应节点上的线性变换映射,通过矩阵乘法W*h把q维特征映射到q′维;(·||·)是连接操作,把经过矩阵乘法映射的两个q′维特征连接到一起,组成一个2q′维的特征;
Figure BDA0003897755850000035
是注意力映射,通过乘法把特征映射为一个实数;σ为激活函数,σ=LeakyReLU(·)。
进一步地,第一残差层和第二残差层均为以残差模块对应的“残差”函数形式处理的卷积层;“残差”函数形式如下:
Figure BDA0003897755850000036
其中,D(·)是“残差”函数,z(l)是残差层l的输出,x(l-1)是残差层前一层,即第l-1层的输出,
Figure BDA0003897755850000037
为滤波矩阵。
进一步地,当胃癌分期预测网络的输入为特征矩阵Sq*r和胃癌临床影像学图像时,需要将胃癌临床影像学图像数据表示为矩阵,矩阵的每个点为图像上对应像素的灰度值,把胃癌临床影像学图像resize到尺寸q*r的图像矩阵,与特征矩阵Sq*r尺寸相等,在把特征Sq*r和图像矩阵叠加。
一种计算机存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并运行以实现一种基于深度学习的胃癌分期判别系统。
有益效果:
临床胃癌图像由于不同机构检测能力不同,存在取材不全面,关键信息模糊/缺失等问题,本发明使用残差网络增强图像中的模糊信息。同时本发明对于基因组学、转录组学中的n维特征,采用皮尔森相关性系数和图注意力网络生成特征相似性系数,最终生成增强图像和特征,并使用卷积神经网络判别胃癌分期,可以极大地提高胃癌分期判别的准确率。
本发明结合先验知识,接收临床中取得的影像学数据、基因组学数据、转录组学数据、癌症标记物特征,辅助胃癌的分期诊断。
附图说明
图1为胃癌分期判别流程示意图。
图2为胃癌分期预测网络结构示意图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,
本实施方式为一种基于深度学习的胃癌分期判别系统,包括:
基因间关系网络调取单元,用于调取基因间关系网络,基因间关系网络用于生成基因间关系。
所述的基因间关系网络是预先建立的好的,为了充分说明本发明,本实施方式对生成基因间关系网络的过程进行说明,在实际的胃癌分期判别时,生成基因间关系网络的过程相当于准备工作;生成基因间关系网络的过程包括以下步骤:
(1)获取基因调控网络:
基因-基因调控关系来自HumanNetV3(https://www.inetbio.org/humannet/),从上述网站获取成对基因关系,所有基因调控关系中涉及到的基因组成长度为q的基因集合,用genei和genej表示上述基因集中的基因i和基因j,i,j∈q。
这q个基因的调控关系网络用q*q的矩阵Nreg∈[0,1]q*q表示;
其中,[0,1]q*q代表Nreg为q*q的方阵,且数值仅包含元素0和1;Nreg(i,j)的值为0代表genei不调控genej,Nreg(i,j)的值为1代表genei调控genej,因为关系“genei调控genej”不等价于“genej调控genei”,所以基因调控网络是一个有向网络,Nreg是一个不对称矩阵。
(2)获取蛋白质相互作用网络:
蛋白质-蛋白质相互作用关系来自ConsensusPathDB(Protein-ProteinInteraction Network,http://cpdb.molgen.mpg.de/),从上述网站获取成对蛋白质关系,蛋白质在细胞生命过程中由基因表达产生,蛋白质的关系因此可以映射到基因。所有蛋白质相互作用关系中涉及到的基因组成长度为q的基因集合,用genei和genej表示上述基因集中的基因i和基因j,i,j∈q。
这Q个基因的相互作用关系网络用q*q的矩阵Nppi∈[0,1]q*q表示;
其中,[0,1]q*q代表Nppi为q*q的方阵,且数值仅包含元素0和1;Nppi(i,j)的值为0代表genei与genej不存在相互作用关系,Nppi(i,j)的值为1代表genei与genej存在相互作用关系,因为关系“genei与genej相互作用”等价于“genej与genei相互作用”,所以基因相互作用网络是一个无向网络,Nppi是对称矩阵,最后把Nppi的主对角线值赋为1,代表基因与自身存在相互作用关系。
(3)通过以下方法整合基因调控网络和蛋白质相互作用网络得到基因间关系网络N∈[0,1]q*q,对于N中位点N(i,j),如果该位点在Nreg或Nppi中的对应位置值为1,则该位点在N中值也为1,代表genei与genej存在关系,因为Nreg为不对称矩阵,所以N也为不对称矩阵。
基因调控网络和蛋白质相互作用网络可以是完全对应,也可以不完全对应,不完全对应时可以采取以下处理方案:(1)取基因交集,仅处理同时存在于两个网络中的基因节点关系;(2)取基因并集,处理两个网络中的全部基因节点关系;(3)自定义基因集,从两个网络中获取包含于自定义基因集中的基因关系。本系统默认采用方案(1)。
组学特征相关系数计算单元,基于输入的实例,针对单一组学特征或多组学(指多个单一组学)计算每个组学的任意两个基因的特征相似性系数,得到组学特征矩阵;
所述多组学特征是指多个单一组学特征,本实施方式中记为O个;将每一个输入实例的特征表示为一个1*q维向量,m个实例的特征表示为m*q维的特征矩阵,即m个实例*q维特征,一共有O个组学时,就有O个m*q的特征矩阵。如果O等于1则就是单一组学特征。
计算特征相关系数需要由大量实例作为数据支持,本系统采用TCGA数据库中全部有明确胃癌分期标签的实例作为数据支持,胃癌分期实例多组学数据从网站(https://portal.gdc.cancer.gov/)获取。
本实施方式中使用下列3个组学数据:基因表达量(GE),基因突变率(MR),基因甲基化水平(METH)。
本实施方式共涉及到m个实例(用户使用时输入1个实例,剩余实例从TCGA获取),q个基因,3个组学,每个实例由q个基因描述,每个基因由三个组学数据描述。
通过公式(1)计算每个组学的任意两个基因(genei,genej)间相似性系数,生成相似性矩阵Fq*q,相似性矩阵Fq*q中的元素:
Figure BDA0003897755850000061
公式分子表示基因i、j在全部实例中的协方差;分母表示基因i、j在全部实例中的标准差的积。
本实施方式中一共有O=3相似性矩阵,记作F1、F2、F3,这些特征矩阵的维度都是q*q。
对于n个x的均值:
Figure BDA0003897755850000062
Figure BDA0003897755850000063
其中,x表示全部实例中的基因;τx为基因在全部实例中的标准差;
有O个组学特征输入时,计算特征矩阵平均值,得到全局特征矩阵,记为组学特征矩阵;
Figure BDA0003897755850000064
其中,Fo表示O个组学特征矩阵中的每个组学特征矩阵。
F维度仍然是q*q,这个特征矩阵的每一行表示一个基因的特征,q行代表q个基因的特征。
胃癌标记基因筛选单元:
筛选胃癌标记还需要明确金标准数据集,用COSMIC数据库的CGC子数据集,作为癌症相关基因的金标准。
COSMIC数据库的CGC子集网址为:https://cancer.sanger.ac.uk/census。COSMIC是受业界广泛认可的体细胞突变数据库,包含非编码突变、基因融合、拷贝数变异和耐药突变,以及基础研究、医学报告和药物开发的癌症遗传学标准。CGC是癌症相关驱动基因精选目录,目前收录了719个基因,详细描述了每个基因的功能和驱动癌症的过程,共分为10个癌症功能,之一是“转移相关”,共有329个基因带有这一功能标签。
图注意力网络中节点i(基因genei)和节点j(基因genej)的注意力系数由下式计算:
Figure BDA0003897755850000071
其中,αij代表genei对genej的注意力系数;i为基因i在基因关系网络中的一阶邻域(Neighbor),即基因间关系网络中与genei相连的节点,图注意力网络认为节点可以感知相邻的节点状态,与实际基因-基因关系相对应,k∈Neighbori指基因i在基因间关系网络中链接到的邻居genek;hi为基因i的组学特征,在前面中已经计算过组学特征矩阵了,记Fi、Fj、Fk分别为组学特征矩阵的第i、j、k行或列,易知
Figure BDA0003897755850000072
Figure BDA0003897755850000073
是每个基因对应节点上的线性变换映射,通过矩阵乘法W*j把q维特征映射到q′维;(·||·)是连接操作,把经过矩阵乘法映射的两个q′维特征连接到一起,组成一个2q′维的特征;/>
Figure BDA0003897755850000074
是注意力映射,通过乘法把特征映射为一个实数;σ为激活函数,在这里σ=LeakyReLU(·),用于获取非线性。W和A都是预先训练好的参数。
通过上述方法计算出q个基因与其它所有基因的注意力系数,针对每个基因选取其中系数最高的前r个作为参数,与用户输入的原始数据加权,原始数据有q个基因,从此得到新的特征矩阵Sq*r(特征矩阵S的标注q*r可以类比为图像数据长和宽)输入下一步分类器,q即q个基因,r代表每个基因有r个参数。
用户输入1个实例,有q个基因,维度是(1*q),这一步算出来的权值矩阵是(q*r),用这个权值矩阵mask原始数据,数据维度变成(q*r)。
胃癌分期预测单元:用胃癌分期预测网络预测胃癌分期;胃癌分期预测网络为使用了两个残差模块的CNN网络。
胃癌分期预测网络如图2所示,图中数据经过每一个框都要进行框内操作;连线代表数据流;“+”代表残差操作,来自不同层的数据在这里相加,再输入下一层。胃癌分期预测网络的具体结构如下:
胃癌分期预测网络可以为两种情况:
一、输入特征矩阵Sq*r;二、输入特征矩阵Sq*r和胃癌临床影像学图像;
实际上直接属于胃癌临床影像学图像,本发明的胃癌分期预测网络也是能够处理的,不过基于预测准确率的考量,本发明选择以上两种情况作为输入。由于情况二的准确率会更好,同时由于无论是情况二,还是情况一作为输入,胃癌分期预测网络的处理过程都是相同的(区别仅在于两种情况的训练过程有所不同,即两种情况下的胃癌分期预测网络是在各自对应的输入情况下的数据作为训练集进行训练的),情况二还要涉及到输入特征矩阵Sq*r和胃癌临床影像学图像叠加的过程,因此本实施方式以情况二作为输入进行说明:
除了特征矩阵Sq*r外,还增加了一层胃癌临床影像学图像,把胃癌临床影像学图像数据表示为矩阵,矩阵的每个点为图像上对应像素的灰度值,这里把胃癌临床影像学图像resize到尺寸q*r,与特征矩阵Sq*r尺寸相等,把特征Sq*r和图像矩阵叠加,作为胃癌分期预测网络的输入;
所述胃癌分期预测网络包括第一卷积层、第一残差层、第二卷积层、第二残差层、第三卷积层、flatten层、第一Dense层、BN层、Dropout层、第二Dense层和输出层;
conv即卷积层,第一卷积层为“3*3,conv,128”,3*3代表这个卷积层的感受区域大小是3*3,在图像上是像素,矩阵里是元素;128是批尺寸(batchsize),即一次训练时使用的样本量。第二卷积层的含义参照第一卷积层。
第一残差层和第二残差层即以残差模块对应的“残差”函数形式处理的卷积层。
现代神经网络一般是通过基于梯度的BP算法来优化,对前馈神经网络而言,一般需要前向传播输入信号,然后反向传播误差并使用梯度方法更新参数。然而,在神经网络可以收敛的前提下,随着网络深度增加,网络的表现先是逐渐增加至饱和,然后迅速下降,这就是网络退化现象,对于局部不清晰的网络,退化现象会导致模型感知图像能力下降。导致这种情况的原因是神经网络不易拟合恒等映射,一种解决办法是构造一个恒等映射:
z(l)=H(x(l-1))=x(l-1)+D(x(l-1))
D(·)就是“残差”函数,是一种映射,残差网络中输入信号可以从任意低层直接传播到高层,由于包含了一个天然的恒等映射,一定程度上可以解决网络退化问题。这里z(l)是第l层输出,x(l-1)是第l-1层输出,H()是网络映射。在残差网络中引入滤波矩阵
Figure BDA0003897755850000081
有:
Figure BDA0003897755850000082
其中,
Figure BDA0003897755850000083
由预先学习TCGA中已有胃癌实例得到。
用通俗的语言讲,残差网络就是在网络训练中,提取浅层结果,由于网络传播过程中数据结构没有变化,所以可以把浅层结果与深层结果直接对位相加,相当于使用浅层网络对深层网络进行了信号放大操作,由于网络传播过程中每层数据使用激活函数,所以这种相加操作不会导致网络退化。
用更通俗的语言将,上文涉及到的名词“映射”可以理解为乘法,对输入矩阵的每个位点乘以相应权值,初始权值随机设置,通过使用大量数据对网络进行训练,也就是对权值训练。用户使用时,网络中权值已经固定了,不需要再对网络进行训练,直接输出预测结果。
“flatten”层把二维数据(矩阵、图片等点阵)重新排列变成一维数据(数列)。
第一Dense层为“Dense,16”层,进行全连接操作,全连接就是对所有获取的数据分配一个权值,数字仍然是批尺寸。第二Dense层参照第一Dense层理解。
BN层即“BatchNormalization”,进行批量标准化操作。
“Dropout 0.3”层随机丢弃一些神经元,后面的数字0.3是比例,即30%的神经元在这一层被随机丢弃了,适当drop可以防止过拟合。
具体实施方式二:
本实施方式为一种计算机存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并运行以实现所述的一种基于深度学习的胃癌分期判别系统。
应当理解,包括本发明描述的任何方法对应的可以被提供为计算机程序产品、软件或计算机化方法,其可以包括其上存储有指令的非暂时性机器可读介质,所述指令可以用于编程计算机系统,或其他电子装置。存储介质可以包括但不限于磁存储介质,光存储介质;磁光存储介质包括:只读存储器ROM、随机存取存储器RAM、可擦除可编程存储器(例如,EPROM和EEPROM)以及闪存层;或者适合于存储电子指令的其他类型的介质。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (6)

1.一种基于深度学习的胃癌分期判别系统,其特征在于,包括:
基因间关系网络调取单元,用于调取基因间关系网络,基因间关系网络用于生成基因间关系;
组学特征相关系数计算单元:针对输入的实例,针对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,将单一组学对应的特征相似性系数构成的相似性矩阵作为组学特征矩阵F,或者将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵F;
所述计算每个组学的任意两个基因的特征相似性系数,得到组学特征矩阵的过程包括以下步骤:
将每一个输入实例的特征表示为一个1*q维向量,q为基因组成长度,即q个基因;m个实例的特征表示为m*q维的特征矩阵,即m个实例*q维特征;
根据如下公式计算每个组学的任意两个基因间相似性系数,生成相似性矩阵Fq*q,相似性矩阵Fq*q中的元素:
Figure FDA0004225896470000011
其中,genei,genej表示任意两个基因;分子表示基因genei,genej在全部实例中的协方差;分母
Figure FDA0004225896470000012
表示基因genei,hemej在全部实例中的标准差的积;
所述将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵的过程如下:
将每个组学特征对应的相似性矩阵Fq*q记为FO,然后根据如下公式计算特征矩阵平均值得到组学特征矩阵F;
Figure FDA0004225896470000013
其中,FO表示O个组学特征矩阵中的每个组学特征矩阵;
胃癌标记基因筛选单元:针对将基因i和基因j作为节点i和节点j的图注意力网络,计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,与用户输入的原始数据加权,原始数据有q个基因,得到新的特征矩阵Sq*r
计算图注意力网络中节点i和节点j的注意力系数如下:
Figure FDA0004225896470000014
其中,基因i和基因j即genei和genej;αij代表genei对genej的注意力系数;Neighbori为基因i在基因关系网络中的一阶邻域,即基因间关系网络中与genei相连的节点,图注意力网络认为节点能够感知相邻的节点状态,与实际基因-基因关系相对应,k∈Neighborii指基因i在基因间关系网络中链接到的邻居genek;hi为基因i的组学特征;记Fi、Fj、Fk分别为组学特征矩阵的第i、j、k行或列,
Figure FDA0004225896470000021
Figure FDA0004225896470000022
是每个基因对应节点上的线性变换映射,通过矩阵乘法W*h把q维特征映射到q′维;(·||·)是连接操作,把经过矩阵乘法映射的两个q′维特征连接到一起,组成一个2q′维的特征;/>
Figure FDA0004225896470000023
是注意力映射,通过乘法把特征映射为一个实数;σ为激活函数,σ=LeakyReLU(·);
胃癌分期预测单元:用胃癌分期预测网络预测胃癌分期;胃癌分期预测网络的输入为特征矩阵Sq*r和胃癌临床影像学图像;
所述胃癌分期预测网络包括第一卷积层、第一残差层、第二卷积层、第二残差层、第三卷积层、flatten层、第一Dense层、BN层、Dropout层、第二Dense层和输出层;
胃癌分期预测网络的输出为胃癌分期的预测结果。
2.根据权利要求1所述的一种基于深度学习的胃癌分期判别系统,其特征在于,基因间关系网络通过以下步骤确定:
(1)从基因-基因调控关系数据库获取成对基因关系以及基因的调控关系网络,用genei和genej表示基因i和基因j;
(2)从蛋白质-蛋白质相互作用关系数据库获取成对蛋白质关系以及蛋白质相互作用网络,蛋白质在细胞生命过程中由基因表达产生,蛋白质的关系因此能够映射到基因;
(3)基因调控网络和蛋白质相互作用网络得到基因间关系网络。
3.根据权利要求2所述的一种基于深度学习的胃癌分期判别系统,其特征在于,基因在全部实例中的标准差如下:
Figure FDA0004225896470000024
Figure FDA0004225896470000025
其中,x表示全部实例中的基因;τx为基因在全部实例中的标准差。
4.根据权利要求3所述的一种基于深度学习的胃癌分期判别系统,其特征在于,第一残差层和第二残差层均为以残差模块对应的“残差”函数形式处理的卷积层;“残差”函数形式如下:
Figure FDA0004225896470000031
其中,D(·)是“残差”函数,z(l)是残差层l的输出,x(l-1)是残差层前一层,即第l-1层的输出,
Figure FDA0004225896470000032
为滤波矩阵。
5.根据权利要求4所述的一种基于深度学习的胃癌分期判别系统,其特征在于,当胃癌分期预测网络的输入为特征矩阵Sq*r和胃癌临床影像学图像时,需要将胃癌临床影像学图像数据表示为矩阵,矩阵的每个点为图像上对应像素的灰度值,把胃癌临床影像学图像resize到尺寸q*r的图像矩阵,与特征矩阵Sq*r尺寸相等,在把特征Sq*r和图像矩阵叠加。
6.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并运行以实现如权利要求1至5之一所述的一种基于深度学习的胃癌分期判别系统。
CN202211280416.4A 2022-10-19 2022-10-19 基于深度学习的胃癌分期判别系统及存储介质 Active CN115641955B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211280416.4A CN115641955B (zh) 2022-10-19 2022-10-19 基于深度学习的胃癌分期判别系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211280416.4A CN115641955B (zh) 2022-10-19 2022-10-19 基于深度学习的胃癌分期判别系统及存储介质

Publications (2)

Publication Number Publication Date
CN115641955A CN115641955A (zh) 2023-01-24
CN115641955B true CN115641955B (zh) 2023-06-20

Family

ID=84945777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211280416.4A Active CN115641955B (zh) 2022-10-19 2022-10-19 基于深度学习的胃癌分期判别系统及存储介质

Country Status (1)

Country Link
CN (1) CN115641955B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028939A (zh) * 2019-11-15 2020-04-17 华南理工大学 一种基于深度学习的多组学智能诊断系统
CN112906720A (zh) * 2021-03-19 2021-06-04 河北工业大学 基于图注意力网络的多标签图像识别方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178449B (zh) * 2019-12-31 2021-11-05 浙江大学 结合计算机视觉特征和影像组学特征的肝癌图像分类方法
US20210374499A1 (en) * 2020-05-26 2021-12-02 International Business Machines Corporation Iterative deep graph learning for graph neural networks
WO2022041222A1 (en) * 2020-08-31 2022-03-03 Top Team Technology Development Limited Process and system for image classification
CN113744799B (zh) * 2021-09-06 2023-10-13 中南大学 一种基于端到端学习的化合物和蛋白质相互作用与亲和力预测方法
CN114334014A (zh) * 2021-12-31 2022-04-12 徐州医科大学 一种基于自注意力深度学习的癌症亚型识别方法和系统
CN114329232A (zh) * 2022-01-06 2022-04-12 河海大学 一种基于科研网络的用户画像构建方法和系统
CN115019883A (zh) * 2022-02-13 2022-09-06 昆明理工大学 一种基于多网络图卷积的癌症驱动基因识别方法
CN114969304A (zh) * 2022-05-09 2022-08-30 昆明理工大学 基于要素图注意力的案件舆情多文档生成式摘要方法
CN115019891B (zh) * 2022-06-08 2023-07-07 郑州大学 一种基于半监督图神经网络的个体驱动基因预测方法
CN115171779B (zh) * 2022-07-13 2023-09-22 浙江大学 基于图注意力网络和多组学融合的癌症驱动基因预测装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028939A (zh) * 2019-11-15 2020-04-17 华南理工大学 一种基于深度学习的多组学智能诊断系统
CN112906720A (zh) * 2021-03-19 2021-06-04 河北工业大学 基于图注意力网络的多标签图像识别方法

Also Published As

Publication number Publication date
CN115641955A (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
US11328430B2 (en) Methods, systems, and media for segmenting images
CN110889852B (zh) 基于残差-注意力深度神经网络的肝脏分割方法
CN112863696B (zh) 基于迁移学习和图神经网络的药物敏感性预测方法和装置
WO2021062904A1 (zh) 基于病理图像的tmb分类方法、系统及tmb分析装置
CN112687327B (zh) 一种基于多任务和多模态的癌症生存分析系统
CN109887546B (zh) 基于二代测序的单基因或多基因拷贝数检测系统及方法
CN116312782B (zh) 一种融合影像基因数据的空间转录组spot区域聚类方法
Shao et al. Automatic microarray image segmentation with clustering-based algorithms
CN112907555A (zh) 一种基于影像基因组学的生存预测方法和系统
CN113674292B (zh) 一种基于部分实例标注的半监督骨髓瘤细胞实例分割方法
CN111563549B (zh) 基于多任务进化算法的医学图像聚类方法
US20220101135A1 (en) Systems and methods for using a convolutional neural network to detect contamination
Tang et al. A deep-learning-based method can detect both common and rare genetic disorders in fetal ultrasound
CN115641955B (zh) 基于深度学习的胃癌分期判别系统及存储介质
CN111553250B (zh) 一种基于人脸特征点的精准面瘫程度评测方法及装置
CN117437423A (zh) 基于sam协同学习和跨层特征聚合增强的弱监督医学图像分割方法及装置
CN115346599B (zh) H&e图像基因和细胞异质性预测方法、系统和存储介质
CN111178174B (zh) 基于深度卷积神经网络的尿液有形成分图像识别方法
Karaletsos et al. ShapePheno: unsupervised extraction of shape phenotypes from biological image collections
CN117912679B (zh) 基于病理图像的结直肠癌生物标志物状态预测方法及设备
Nait Saada et al. Inference of coalescence times and variant ages using convolutional neural networks
CN115713107A (zh) 用于变体识别的神经网络
Kim et al. Topological data analysis can extract sub-groups with high incidence rates of Type 2 diabetes
US20230326013A1 (en) Method for predicting epidermal growth factor receptor mutations in lung adenocarcinoma
Asif A Fuzzy Minkowski Distance-based fusion of convolutional neural networks for gastrointestinal disease detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant