CN115641955A - 基于深度学习的胃癌分期判别系统及存储介质 - Google Patents
基于深度学习的胃癌分期判别系统及存储介质 Download PDFInfo
- Publication number
- CN115641955A CN115641955A CN202211280416.4A CN202211280416A CN115641955A CN 115641955 A CN115641955 A CN 115641955A CN 202211280416 A CN202211280416 A CN 202211280416A CN 115641955 A CN115641955 A CN 115641955A
- Authority
- CN
- China
- Prior art keywords
- gene
- gastric cancer
- matrix
- network
- genes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000005718 Stomach Neoplasms Diseases 0.000 title claims abstract description 91
- 206010017758 gastric cancer Diseases 0.000 title claims abstract description 91
- 201000011549 stomach cancer Diseases 0.000 title claims abstract description 91
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 202
- 239000011159 matrix material Substances 0.000 claims abstract description 94
- 239000000439 tumor marker Substances 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 20
- 238000013507 mapping Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 230000033228 biological regulation Effects 0.000 claims description 15
- 238000003384 imaging method Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 10
- 230000006916 protein interaction Effects 0.000 claims description 10
- 102000004169 proteins and genes Human genes 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 3
- 230000004850 protein–protein interaction Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 101150010487 are gene Proteins 0.000 claims 1
- 230000004069 differentiation Effects 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 claims 1
- 206010028980 Neoplasm Diseases 0.000 abstract description 14
- 201000011510 cancer Diseases 0.000 abstract description 11
- 238000013528 artificial neural network Methods 0.000 abstract description 5
- 206010027476 Metastases Diseases 0.000 description 8
- 230000009401 metastasis Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 210000001165 lymph node Anatomy 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 201000011591 microinvasive gastric cancer Diseases 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012333 histopathological diagnosis Methods 0.000 description 1
- 238000003704 image resize Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011369 optimal treatment Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 210000003200 peritoneal cavity Anatomy 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Abstract
基于深度学习的胃癌分期判别系统及存储介质,属于癌症辅助判识技术领域。本发明为了解决现有的胃癌分期判别准确率低的问题,本发明首先通过组学特征相关系数计算单元对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,并得到组学特征矩阵;然后通过胃癌标记基因筛选单元:计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,并与用户输入的原始数据加权,得到特征矩阵Sq*r;胃癌分期预测单元基于该特征矩阵,利用神经网络对胃癌分期进行预测。本发明用于胃癌的分期判别。
Description
技术领域
本发明属于癌症辅助判识技术领域,具体涉及一种胃癌分期判别系统及存储介质。
背景技术
胃癌是实质固体癌的一种,由胃上皮细胞恶性增殖导致,胃癌的综合治疗主要以病理分期(TNM)为依据。其中T(tumor)分期根据肿瘤浸润胃壁组织的深度判断,N(node)分期根据淋巴结转移检出数量判断,M(metastasis)分期根据远位器官、淋巴结、腹膜转移是否检出判断。
胃癌TNM分期的临床不足和检测难点在于以下方面:
胃癌诊疗关键学科发展不平衡,病理、影像、内镜等传统支撑学科发展相对滞后,特别是胃癌组织病理学诊断的专业化、规范化程度有待提高,我国存在地区性病理组织取材、检测技术及诊断水平差异,这对我国胃癌整体诊疗水平造成较大掣肘。
判断T分期时,仅靠肉眼可见癌灶取材、取材不足等技术缺陷会造成浅表广泛型早期胃癌、多发早期胃癌的分级误判,低T1-T2期胃癌分级会导致后期治疗方案的错误制定,延误最佳治疗时机;此外,对于T3-T4期的胃癌常见术中病理分期误判,导致中晚期胃癌切除手术预后不佳。
判断N分期时根据淋巴结捡取数判断,并根据淋巴结捡取转移检出比例优化,临床上淋巴结捡取数不足是导致N分期偏移的重要影响因素。
判断M分期时,腹膜转移是胃癌最为常见的转移形式,早期诊断困难,预后极差,临床采用腹膜冲洗液检测是否含有腹腔内脱落癌细胞,依此判断是否有腹膜转移,然而腹膜冲洗液检测敏感性低,为了提高腹膜转移检测能力,常采用胃癌标记基因辅助检测。
发明内容
本发明为了解决现有的胃癌分期判别准确率低的问题。
一种基于深度学习的胃癌分期判别系统,包括:
组学特征相关系数计算单元:针对输入的实例,针对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,将单一组学对应的特征相似性系数构成的相似性矩阵作为组学特征矩阵F,或者将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵F;
胃癌标记基因筛选单元:针对将基因i和基因j作为节点i和节点j的图注意力网络,计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,与用户输入的原始数据加权,原始数据有q个基因,得到新的特征矩阵Sq*r;
胃癌分期预测单元:用胃癌分期预测网络预测胃癌分期;胃癌分期预测网络的输入为输入特征矩阵Sq*r,或者特征矩阵Sq*r和胃癌临床影像学图像;
所述胃癌分期预测网络包括第一卷积层、第一残差层、第二卷积层、第二残差层、第三卷积层、flatten层、第一Dense层、BN层、Dropout层、第二Dense层和输出层;
胃癌分期预测网络的输出为胃癌分期的预测结果。
进一步地,所述的一种基于深度学习的胃癌分期判别系统,还包括基因间关系网络调取单元,用于调取基因间关系网络,基因间关系网络用于生成基因间关系;
进一步地,所述基因间关系网络通过以下步骤确定:
(1)从基因-基因调控关系数据库获取成对基因关系以及基因的调控关系网络,用genei和genej表示基因i和基因j;
(2)从蛋白质-蛋白质相互作用关系数据库获取成对蛋白质关系以及蛋白质相互作用网络,蛋白质在细胞生命过程中由基因表达产生,蛋白质的关系因此能够映射到基因;
(3)基因调控网络和蛋白质相互作用网络得到基因间关系网络。
进一步地,计算每个组学的任意两个基因的特征相似性系数,得到组学特征矩阵的过程包括以下步骤:
将每一个输入实例的特征表示为一个1*q维向量,q为基因组成长度,即q个基因;m个实例的特征表示为m*q维的特征矩阵,即m个实例*q维特征;
根据如下公式计算每个组学的任意两个基因间相似性系数,生成相似性矩阵Fq*q,相似性矩阵Fq*q中的元素:
进一步地,基因在全部实例中的标准差如下:
其中,x表示全部实例中的基因;τx为基因在全部实例中的标准差。
进一步地,将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵的过程如下:
将每个组学特征对应的相似性矩阵Fq*q记为FO,然后根据如下公式计算特征矩阵平均值得到组学特征矩阵F;
其中,FO表示O个组学特征矩阵中的每个组学特征矩阵。
进一步地,胃癌标记基因筛选单元中计算图注意力网络中节点i和节点j的注意力系数如下:
其中,基因i和基因j即genei和genej;αij代表genei对genej的注意力系数;i为基因i在基因关系网络中的一阶邻域,即基因间关系网络中与genei相连的节点,图注意力网络认为节点能够感知相邻的节点状态,与实际基因-基因关系相对应,k∈Neighbori指基因i在基因间关系网络中链接到的邻居genek;hi为基因i的组学特征;记Fi、Fj、Fk分别为组学特征矩阵的第i、j、k行或列, 是每个基因对应节点上的线性变换映射,通过矩阵乘法W*h把q维特征映射到q′维;(·||·)是连接操作,把经过矩阵乘法映射的两个q′维特征连接到一起,组成一个2q′维的特征;是注意力映射,通过乘法把特征映射为一个实数;σ为激活函数,σ=LeakyReLU(·)。
进一步地,第一残差层和第二残差层均为以残差模块对应的“残差”函数形式处理的卷积层;“残差”函数形式如下:
进一步地,当胃癌分期预测网络的输入为特征矩阵Sq*r和胃癌临床影像学图像时,需要将胃癌临床影像学图像数据表示为矩阵,矩阵的每个点为图像上对应像素的灰度值,把胃癌临床影像学图像resize到尺寸q*r的图像矩阵,与特征矩阵Sq*r尺寸相等,在把特征Sq*r和图像矩阵叠加。
一种计算机存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并运行以实现一种基于深度学习的胃癌分期判别系统。
有益效果:
临床胃癌图像由于不同机构检测能力不同,存在取材不全面,关键信息模糊/缺失等问题,本发明使用残差网络增强图像中的模糊信息。同时本发明对于基因组学、转录组学中的n维特征,采用皮尔森相关性系数和图注意力网络生成特征相似性系数,最终生成增强图像和特征,并使用卷积神经网络判别胃癌分期,可以极大地提高胃癌分期判别的准确率。
本发明结合先验知识,接收临床中取得的影像学数据、基因组学数据、转录组学数据、癌症标记物特征,辅助胃癌的分期诊断。
附图说明
图1为胃癌分期判别流程示意图。
图2为胃癌分期预测网络结构示意图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,
本实施方式为一种基于深度学习的胃癌分期判别系统,包括:
基因间关系网络调取单元,用于调取基因间关系网络,基因间关系网络用于生成基因间关系。
所述的基因间关系网络是预先建立的好的,为了充分说明本发明,本实施方式对生成基因间关系网络的过程进行说明,在实际的胃癌分期判别时,生成基因间关系网络的过程相当于准备工作;生成基因间关系网络的过程包括以下步骤:
(1)获取基因调控网络:
基因-基因调控关系来自HumanNetV3(https://www.inetbio.org/humannet/),从上述网站获取成对基因关系,所有基因调控关系中涉及到的基因组成长度为q的基因集合,用genei和genej表示上述基因集中的基因i和基因j,i,j∈q。
这q个基因的调控关系网络用q*q的矩阵Nreg∈[0,1]q*q表示;
其中,[0,1]q*q代表Nreg为q*q的方阵,且数值仅包含元素0和1;Nreg(i,j)的值为0代表genei不调控genej,Nreg(i,j)的值为1代表genei调控genej,因为关系“genei调控genej”不等价于“genej调控genei”,所以基因调控网络是一个有向网络,Nreg是一个不对称矩阵。
(2)获取蛋白质相互作用网络:
蛋白质-蛋白质相互作用关系来自ConsensusPathDB(Protein-ProteinInteraction Network,http://cpdb.molgen.mpg.de/),从上述网站获取成对蛋白质关系,蛋白质在细胞生命过程中由基因表达产生,蛋白质的关系因此可以映射到基因。所有蛋白质相互作用关系中涉及到的基因组成长度为q的基因集合,用genei和genej表示上述基因集中的基因i和基因j,i,j∈q。
这Q个基因的相互作用关系网络用q*q的矩阵Nppi∈[0,1]q*q表示;
其中,[0,1]q*q代表Nppi为q*q的方阵,且数值仅包含元素0和1;Nppi(i,j)的值为0代表genei与genej不存在相互作用关系,Nppi(i,j)的值为1代表genei与genej存在相互作用关系,因为关系“genei与genej相互作用”等价于“genej与genei相互作用”,所以基因相互作用网络是一个无向网络,Nppi是对称矩阵,最后把Nppi的主对角线值赋为1,代表基因与自身存在相互作用关系。
(3)通过以下方法整合基因调控网络和蛋白质相互作用网络得到基因间关系网络N∈[0,1]q*q,对于N中位点N(i,j),如果该位点在Nreg或Nppi中的对应位置值为1,则该位点在N中值也为1,代表genei与genej存在关系,因为Nreg为不对称矩阵,所以N也为不对称矩阵。
基因调控网络和蛋白质相互作用网络可以是完全对应,也可以不完全对应,不完全对应时可以采取以下处理方案:(1)取基因交集,仅处理同时存在于两个网络中的基因节点关系;(2)取基因并集,处理两个网络中的全部基因节点关系;(3)自定义基因集,从两个网络中获取包含于自定义基因集中的基因关系。本系统默认采用方案(1)。
组学特征相关系数计算单元,基于输入的实例,针对单一组学特征或多组学(指多个单一组学)计算每个组学的任意两个基因的特征相似性系数,得到组学特征矩阵;
所述多组学特征是指多个单一组学特征,本实施方式中记为O个;将每一个输入实例的特征表示为一个1*q维向量,m个实例的特征表示为m*q维的特征矩阵,即m个实例*q维特征,一共有O个组学时,就有O个m*q的特征矩阵。如果O等于1则就是单一组学特征。
计算特征相关系数需要由大量实例作为数据支持,本系统采用TCGA数据库中全部有明确胃癌分期标签的实例作为数据支持,胃癌分期实例多组学数据从网站(https://portal.gdc.cancer.gov/)获取。
本实施方式中使用下列3个组学数据:基因表达量(GE),基因突变率(MR),基因甲基化水平(METH)。
本实施方式共涉及到m个实例(用户使用时输入1个实例,剩余实例从TCGA获取),q个基因,3个组学,每个实例由q个基因描述,每个基因由三个组学数据描述。
通过公式(1)计算每个组学的任意两个基因(genei,genej)间相似性系数,生成相似性矩阵Fq*q,相似性矩阵Fq*q中的元素:
公式分子表示基因i、j在全部实例中的协方差;分母表示基因i、j在全部实例中的标准差的积。
本实施方式中一共有O=3相似性矩阵,记作F1、F2、F3,这些特征矩阵的维度都是q*q。
对于n个x的均值:
其中,x表示全部实例中的基因;τx为基因在全部实例中的标准差;
有O个组学特征输入时,计算特征矩阵平均值,得到全局特征矩阵,记为组学特征矩阵;
其中,Fo表示O个组学特征矩阵中的每个组学特征矩阵。
F维度仍然是q*q,这个特征矩阵的每一行表示一个基因的特征,q行代表q个基因的特征。
胃癌标记基因筛选单元:
筛选胃癌标记还需要明确金标准数据集,用COSMIC数据库的CGC子数据集,作为癌症相关基因的金标准。
COSMIC数据库的CGC子集网址为:https://cancer.sanger.ac.uk/census。COSMIC是受业界广泛认可的体细胞突变数据库,包含非编码突变、基因融合、拷贝数变异和耐药突变,以及基础研究、医学报告和药物开发的癌症遗传学标准。CGC是癌症相关驱动基因精选目录,目前收录了719个基因,详细描述了每个基因的功能和驱动癌症的过程,共分为10个癌症功能,之一是“转移相关”,共有329个基因带有这一功能标签。
图注意力网络中节点i(基因genei)和节点j(基因genej)的注意力系数由下式计算:
其中,αij代表genei对genej的注意力系数;i为基因i在基因关系网络中的一阶邻域(Neighbor),即基因间关系网络中与genei相连的节点,图注意力网络认为节点可以感知相邻的节点状态,与实际基因-基因关系相对应,k∈Neighbori指基因i在基因间关系网络中链接到的邻居genek;hi为基因i的组学特征,在前面中已经计算过组学特征矩阵了,记Fi、Fj、Fk分别为组学特征矩阵的第i、j、k行或列,易知 是每个基因对应节点上的线性变换映射,通过矩阵乘法W*j把q维特征映射到q′维;(·||·)是连接操作,把经过矩阵乘法映射的两个q′维特征连接到一起,组成一个2q′维的特征;是注意力映射,通过乘法把特征映射为一个实数;σ为激活函数,在这里σ=LeakyReLU(·),用于获取非线性。W和A都是预先训练好的参数。
通过上述方法计算出q个基因与其它所有基因的注意力系数,针对每个基因选取其中系数最高的前r个作为参数,与用户输入的原始数据加权,原始数据有q个基因,从此得到新的特征矩阵Sq*r(特征矩阵S的标注q*r可以类比为图像数据长和宽)输入下一步分类器,q即q个基因,r代表每个基因有r个参数。
用户输入1个实例,有q个基因,维度是(1*q),这一步算出来的权值矩阵是(q*r),用这个权值矩阵mask原始数据,数据维度变成(q*r)。
胃癌分期预测单元:用胃癌分期预测网络预测胃癌分期;胃癌分期预测网络为使用了两个残差模块的CNN网络。
胃癌分期预测网络如图2所示,图中数据经过每一个框都要进行框内操作;连线代表数据流;“+”代表残差操作,来自不同层的数据在这里相加,再输入下一层。胃癌分期预测网络的具体结构如下:
胃癌分期预测网络可以为两种情况:
一、输入特征矩阵Sq*r;二、输入特征矩阵Sq*r和胃癌临床影像学图像;
实际上直接属于胃癌临床影像学图像,本发明的胃癌分期预测网络也是能够处理的,不过基于预测准确率的考量,本发明选择以上两种情况作为输入。由于情况二的准确率会更好,同时由于无论是情况二,还是情况一作为输入,胃癌分期预测网络的处理过程都是相同的(区别仅在于两种情况的训练过程有所不同,即两种情况下的胃癌分期预测网络是在各自对应的输入情况下的数据作为训练集进行训练的),情况二还要涉及到输入特征矩阵Sq*r和胃癌临床影像学图像叠加的过程,因此本实施方式以情况二作为输入进行说明:
除了特征矩阵Sq*r外,还增加了一层胃癌临床影像学图像,把胃癌临床影像学图像数据表示为矩阵,矩阵的每个点为图像上对应像素的灰度值,这里把胃癌临床影像学图像resize到尺寸q*r,与特征矩阵Sq*r尺寸相等,把特征Sq*r和图像矩阵叠加,作为胃癌分期预测网络的输入;
所述胃癌分期预测网络包括第一卷积层、第一残差层、第二卷积层、第二残差层、第三卷积层、flatten层、第一Dense层、BN层、Dropout层、第二Dense层和输出层;
conv即卷积层,第一卷积层为“3*3,conv,128”,3*3代表这个卷积层的感受区域大小是3*3,在图像上是像素,矩阵里是元素;128是批尺寸(batchsize),即一次训练时使用的样本量。第二卷积层的含义参照第一卷积层。
第一残差层和第二残差层即以残差模块对应的“残差”函数形式处理的卷积层。
现代神经网络一般是通过基于梯度的BP算法来优化,对前馈神经网络而言,一般需要前向传播输入信号,然后反向传播误差并使用梯度方法更新参数。然而,在神经网络可以收敛的前提下,随着网络深度增加,网络的表现先是逐渐增加至饱和,然后迅速下降,这就是网络退化现象,对于局部不清晰的网络,退化现象会导致模型感知图像能力下降。导致这种情况的原因是神经网络不易拟合恒等映射,一种解决办法是构造一个恒等映射:
z(l)=H(x(l-1))=x(l-1)+D(x(l-1))
D(·)就是“残差”函数,是一种映射,残差网络中输入信号可以从任意低层直接传播到高层,由于包含了一个天然的恒等映射,一定程度上可以解决网络退化问题。这里z(l)是第l层输出,x(l-1)是第l-1层输出,H()是网络映射。在残差网络中引入滤波矩阵有:
用通俗的语言讲,残差网络就是在网络训练中,提取浅层结果,由于网络传播过程中数据结构没有变化,所以可以把浅层结果与深层结果直接对位相加,相当于使用浅层网络对深层网络进行了信号放大操作,由于网络传播过程中每层数据使用激活函数,所以这种相加操作不会导致网络退化。
用更通俗的语言将,上文涉及到的名词“映射”可以理解为乘法,对输入矩阵的每个位点乘以相应权值,初始权值随机设置,通过使用大量数据对网络进行训练,也就是对权值训练。用户使用时,网络中权值已经固定了,不需要再对网络进行训练,直接输出预测结果。
“flatten”层把二维数据(矩阵、图片等点阵)重新排列变成一维数据(数列)。
第一Dense层为“Dense,16”层,进行全连接操作,全连接就是对所有获取的数据分配一个权值,数字仍然是批尺寸。第二Dense层参照第一Dense层理解。
BN层即“BatchNormalization”,进行批量标准化操作。
“Dropout 0.3”层随机丢弃一些神经元,后面的数字0.3是比例,即30%的神经元在这一层被随机丢弃了,适当drop可以防止过拟合。
具体实施方式二:
本实施方式为一种计算机存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并运行以实现所述的一种基于深度学习的胃癌分期判别系统。
应当理解,包括本发明描述的任何方法对应的可以被提供为计算机程序产品、软件或计算机化方法,其可以包括其上存储有指令的非暂时性机器可读介质,所述指令可以用于编程计算机系统,或其他电子装置。存储介质可以包括但不限于磁存储介质,光存储介质;磁光存储介质包括:只读存储器ROM、随机存取存储器RAM、可擦除可编程存储器(例如,EPROM和EEPROM)以及闪存层;或者适合于存储电子指令的其他类型的介质。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。
Claims (10)
1.一种基于深度学习的胃癌分期判别系统,其特征在于,包括:
组学特征相关系数计算单元:针对输入的实例,针对单一组学特征或多组学计算每个组学的任意两个基因的特征相似性系数,将单一组学对应的特征相似性系数构成的相似性矩阵作为组学特征矩阵F,或者将多组学对应的多个特征相似性系数构成的相似性矩阵融合作为组学特征矩阵F;
胃癌标记基因筛选单元:针对将基因i和基因j作为节点i和节点j的图注意力网络,计算图注意力网络中节点i和节点j的注意力系数,计算出q个基因与其它所有基因的注意力系数之后针对每个基因选取其中系数最高的前r个作为参数,与用户输入的原始数据加权,原始数据有q个基因,得到新的特征矩阵Sq*r;
胃癌分期预测单元:用胃癌分期预测网络预测胃癌分期;胃癌分期预测网络的输入为输入特征矩阵Sq*r,或者特征矩阵Sq*r和胃癌临床影像学图像;
所述胃癌分期预测网络包括第一卷积层、第一残差层、第二卷积层、第二残差层、第三卷积层、flatten层、第一Dense层、BN层、Dropout层、第二Dense层和输出层;
胃癌分期预测网络的输出为胃癌分期的预测结果。
2.根据权利要求1所述的一种基于深度学习的胃癌分期判别系统,其特征在于,还包括基因间关系网络调取单元,用于调取基因间关系网络,基因间关系网络用于生成基因间关系;
3.根据权利要求2所述的一种基于深度学习的胃癌分期判别系统,其特征在于,基因间关系网络通过以下步骤确定:
(1)从基因-基因调控关系数据库获取成对基因关系以及基因的调控关系网络,用genei和genej表示基因i和基因j;
(2)从蛋白质-蛋白质相互作用关系数据库获取成对蛋白质关系以及蛋白质相互作用网络,蛋白质在细胞生命过程中由基因表达产生,蛋白质的关系因此能够映射到基因;
(3)基因调控网络和蛋白质相互作用网络得到基因间关系网络。
7.根据权利要求6所述的一种基于深度学习的胃癌分期判别系统,其特征在于,胃癌标记基因筛选单元中计算图注意力网络中节点i和节点j的注意力系数如下:
其中,基因i和基因j即genei和genej;αij代表genei对genej的注意力系数;i为基因i在基因关系网络中的一阶邻域,即基因间关系网络中与genei相连的节点,图注意力网络认为节点能够感知相邻的节点状态,与实际基因-基因关系相对应,k∈Neighbori指基因i在基因间关系网络中链接到的邻居genek;hi为基因i的组学特征;记Fi、Fj、Fk分别为组学特征矩阵的第i、j、k行或列, 是每个基因对应节点上的线性变换映射,通过矩阵乘法W*h把q维特征映射到q′维;(·||·)是连接操作,把经过矩阵乘法映射的两个q′维特征连接到一起,组成一个2q′维的特征;是注意力映射,通过乘法把特征映射为一个实数;σ为激活函数,σ=LeakyReLU(·)。
9.根据权利要求8所述的一种基于深度学习的胃癌分期判别系统,其特征在于,当胃癌分期预测网络的输入为特征矩阵Sq*r和胃癌临床影像学图像时,需要将胃癌临床影像学图像数据表示为矩阵,矩阵的每个点为图像上对应像素的灰度值,把胃癌临床影像学图像resize到尺寸q*r的图像矩阵,与特征矩阵Sq*r尺寸相等,在把特征Sq*r和图像矩阵叠加。
10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并运行以实现如权利要求1至7之一所述的一种基于深度学习的胃癌分期判别系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211280416.4A CN115641955B (zh) | 2022-10-19 | 2022-10-19 | 基于深度学习的胃癌分期判别系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211280416.4A CN115641955B (zh) | 2022-10-19 | 2022-10-19 | 基于深度学习的胃癌分期判别系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115641955A true CN115641955A (zh) | 2023-01-24 |
CN115641955B CN115641955B (zh) | 2023-06-20 |
Family
ID=84945777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211280416.4A Active CN115641955B (zh) | 2022-10-19 | 2022-10-19 | 基于深度学习的胃癌分期判别系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115641955B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028939A (zh) * | 2019-11-15 | 2020-04-17 | 华南理工大学 | 一种基于深度学习的多组学智能诊断系统 |
CN112906720A (zh) * | 2021-03-19 | 2021-06-04 | 河北工业大学 | 基于图注意力网络的多标签图像识别方法 |
US20210200988A1 (en) * | 2019-12-31 | 2021-07-01 | Zhejiang University | Method and equipment for classifying hepatocellular carcinoma images by combining computer vision features and radiomics features |
US20210374499A1 (en) * | 2020-05-26 | 2021-12-02 | International Business Machines Corporation | Iterative deep graph learning for graph neural networks |
CN113744799A (zh) * | 2021-09-06 | 2021-12-03 | 中南大学 | 一种基于端到端学习的化合物和蛋白质相互作用与亲和力预测方法 |
WO2022041222A1 (en) * | 2020-08-31 | 2022-03-03 | Top Team Technology Development Limited | Process and system for image classification |
CN114334014A (zh) * | 2021-12-31 | 2022-04-12 | 徐州医科大学 | 一种基于自注意力深度学习的癌症亚型识别方法和系统 |
CN114329232A (zh) * | 2022-01-06 | 2022-04-12 | 河海大学 | 一种基于科研网络的用户画像构建方法和系统 |
CN114969304A (zh) * | 2022-05-09 | 2022-08-30 | 昆明理工大学 | 基于要素图注意力的案件舆情多文档生成式摘要方法 |
CN115019891A (zh) * | 2022-06-08 | 2022-09-06 | 郑州大学 | 一种基于半监督图神经网络的个体驱动基因预测方法 |
CN115019883A (zh) * | 2022-02-13 | 2022-09-06 | 昆明理工大学 | 一种基于多网络图卷积的癌症驱动基因识别方法 |
CN115171779A (zh) * | 2022-07-13 | 2022-10-11 | 浙江大学 | 基于图注意力网络和多组学融合的癌症驱动基因预测装置 |
-
2022
- 2022-10-19 CN CN202211280416.4A patent/CN115641955B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028939A (zh) * | 2019-11-15 | 2020-04-17 | 华南理工大学 | 一种基于深度学习的多组学智能诊断系统 |
US20210200988A1 (en) * | 2019-12-31 | 2021-07-01 | Zhejiang University | Method and equipment for classifying hepatocellular carcinoma images by combining computer vision features and radiomics features |
US20210374499A1 (en) * | 2020-05-26 | 2021-12-02 | International Business Machines Corporation | Iterative deep graph learning for graph neural networks |
WO2022041222A1 (en) * | 2020-08-31 | 2022-03-03 | Top Team Technology Development Limited | Process and system for image classification |
CN112906720A (zh) * | 2021-03-19 | 2021-06-04 | 河北工业大学 | 基于图注意力网络的多标签图像识别方法 |
CN113744799A (zh) * | 2021-09-06 | 2021-12-03 | 中南大学 | 一种基于端到端学习的化合物和蛋白质相互作用与亲和力预测方法 |
CN114334014A (zh) * | 2021-12-31 | 2022-04-12 | 徐州医科大学 | 一种基于自注意力深度学习的癌症亚型识别方法和系统 |
CN114329232A (zh) * | 2022-01-06 | 2022-04-12 | 河海大学 | 一种基于科研网络的用户画像构建方法和系统 |
CN115019883A (zh) * | 2022-02-13 | 2022-09-06 | 昆明理工大学 | 一种基于多网络图卷积的癌症驱动基因识别方法 |
CN114969304A (zh) * | 2022-05-09 | 2022-08-30 | 昆明理工大学 | 基于要素图注意力的案件舆情多文档生成式摘要方法 |
CN115019891A (zh) * | 2022-06-08 | 2022-09-06 | 郑州大学 | 一种基于半监督图神经网络的个体驱动基因预测方法 |
CN115171779A (zh) * | 2022-07-13 | 2022-10-11 | 浙江大学 | 基于图注意力网络和多组学融合的癌症驱动基因预测装置 |
Non-Patent Citations (2)
Title |
---|
覃桂敏;刘佳妍;殷雨;杨璐琼;: "基因调控网络中的癌症标记物预测方法", no. 06 * |
钱宝鑫;肖志勇;宋威;: "改进的卷积神经网络在肺部图像上的分割应用", no. 08 * |
Also Published As
Publication number | Publication date |
---|---|
CN115641955B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11935152B2 (en) | Determining biomarkers from histopathology slide images | |
AU2020248416A1 (en) | Determining biomarkers from histopathology slide images | |
CN112687327B (zh) | 一种基于多任务和多模态的癌症生存分析系统 | |
US11348239B2 (en) | Predicting total nucleic acid yield and dissection boundaries for histology slides | |
Hu et al. | Classification of metaphase chromosomes using deep convolutional neural network | |
CN116312782B (zh) | 一种融合影像基因数据的空间转录组spot区域聚类方法 | |
CN115346599B (zh) | H&e图像基因和细胞异质性预测方法、系统和存储介质 | |
CN115985503B (zh) | 基于集成学习的癌症预测系统 | |
Zhang et al. | Pulmonary nodule detection based on 3D feature pyramid network with incorporated squeeze‐and‐excitation‐attention mechanism | |
WO2022147503A1 (en) | Predicting total nucleic acid yield and dissection boundaries for histology slides | |
US20070078606A1 (en) | Methods, software arrangements, storage media, and systems for providing a shrinkage-based similarity metric | |
Islam et al. | Detection of renal cell hydronephrosis in ultrasound kidney images: a study on the efficacy of deep convolutional neural networks | |
Somasundaram et al. | Straightening of highly curved human chromosome for cytogenetic analysis | |
CN116958535B (zh) | 一种基于多尺度残差推理的息肉分割系统及方法 | |
CN115641955A (zh) | 基于深度学习的胃癌分期判别系统及存储介质 | |
Martin et al. | A graph based neural network approach to immune profiling of multiplexed tissue samples | |
Carson et al. | Automated pipeline for atlas-based annotation of gene expression patterns: Application to postnatal day 7 mouse brain | |
RS | CoC-ResNet-classification of colorectal cancer on histopathologic images using residual networks | |
US20230326013A1 (en) | Method for predicting epidermal growth factor receptor mutations in lung adenocarcinoma | |
CN118471527A (zh) | 乳腺癌症患者预后预测方法和装置、电子设备及存储介质 | |
Liao et al. | Deep Learning on Abnormal Chromosome Segments: An Intelligent Copy Number Variants Detection System Design | |
Koohbanani | Working with scarce annotations in computational pathology | |
CN117422919A (zh) | 基于可分离卷积块和空间缩减注意力机制的图像分类方法 | |
Liang et al. | HSG-MGAF Net: Heterogeneous subgraph-guided multiscale graph attention fusion network for interpretable prediction of whole-slide image | |
Sun | Application and Challenges of Statistical Methods in Biological Genetics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |