CN113643269A - 基于无监督学习的乳腺癌分子分型方法、装置及系统 - Google Patents

基于无监督学习的乳腺癌分子分型方法、装置及系统 Download PDF

Info

Publication number
CN113643269A
CN113643269A CN202110972195.6A CN202110972195A CN113643269A CN 113643269 A CN113643269 A CN 113643269A CN 202110972195 A CN202110972195 A CN 202110972195A CN 113643269 A CN113643269 A CN 113643269A
Authority
CN
China
Prior art keywords
data set
molecular typing
training
breast cancer
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110972195.6A
Other languages
English (en)
Other versions
CN113643269B (zh
Inventor
谢元忠
聂生东
孙榕
李秀娟
孔雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CENTRAL HOSPITAL OF TAIAN
University of Shanghai for Science and Technology
Original Assignee
CENTRAL HOSPITAL OF TAIAN
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CENTRAL HOSPITAL OF TAIAN, University of Shanghai for Science and Technology filed Critical CENTRAL HOSPITAL OF TAIAN
Priority to CN202110972195.6A priority Critical patent/CN113643269B/zh
Publication of CN113643269A publication Critical patent/CN113643269A/zh
Application granted granted Critical
Publication of CN113643269B publication Critical patent/CN113643269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • G06T2207/10096Dynamic contrast-enhanced magnetic resonance imaging [DCE-MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30068Mammography; Breast
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Processing (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于无监督学习的乳腺癌分子分型方法、装置及系统,所述方法包括如下步骤:获得待预测的乳腺DCE‑MRI影像,提取该影像中多种规格的序列影像的感兴趣区域;利用一采用无监督学习训练获得的分子分型预测模型预测获得各种所述序列影像的对应的分子亚型分类概率;采用集成学习融合,获得最终对应的分子亚型分类结果;所述分子分型预测模型进行训练时,通过无监督学习预训练网络和迁移学习微调网络的思想,前一阶段充分利用乳腺良性肿瘤影像构建无标签的源域数据集,增强模型提取特征的能力;后一阶段采用乳腺恶性肿瘤影像构建有标签的目标域数据集对带有预训练权重的模型微调。与现有技术相比,本发明显著提高了乳腺癌分子分型的预测精度。

Description

基于无监督学习的乳腺癌分子分型方法、装置及系统
技术领域
本发明涉及计算机辅助医学领域,具体涉及一种基于无监督学习的乳腺癌分子分型方法、装置及系统。
背景技术
据2021年世界卫生组织国际癌症研究机构最新数据显示,乳腺癌已取代肺癌成为全球发病率最高的癌症。作为一种异质性极为显著的恶性肿瘤,即使患者的临床分期、病理类型相同,其治疗疗效及预后也存在很大的差异。当前,免疫组织化学标记技术或基因表达谱已成为精准判定乳腺癌分子亚型的主要方式,然而该操作方式复杂有创,且未能做到“早发现、早诊断、早治疗”。现代医学影像学的蓬勃发展为乳腺癌的早期筛查与诊疗创造了有利条件。除常见的乳腺钼靶和超声成像外,磁共振成像因为能够保持乳腺软组织高分辨率,也逐渐受到了临床的广泛青睐。近年来,联合多模态磁共振成像序列,从影像数据的角度深入分析乳腺癌分子分型的相关特征已成为该领域的一大研究热点。
从目前的国内外研究现状来看,基于MRI的乳腺癌分子分型的研究可依据方法的主要技术路线分为两类:一是基于统计学分析的分子分型关联性研究,利用统计学回归模型,分析医学影像中病灶表型特征、表观扩散系数以及血流动力学参数与各亚型的关系。但通过这类方法获得的浅层次的可视化特征很难深入分析与肿瘤异质性之间的相关程度,且研究样本量较小,降低了结果的借鉴意义。二是通过影像组学,研究特征与乳腺癌分子分型的内在关联,以构建合理的乳腺癌分子分型预测模型。然而在该类方法中,为保证感兴趣区域勾画以及特征提取优化时精准有效,需要经过放射科医师的多次确认,再次降低分子分型检出的时效性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种预测灵敏且精度较高的基于无监督学习的乳腺癌分子分型方法、装置及系统。
本发明的目的可以通过以下技术方案来实现:
一种基于无监督学习的乳腺癌分子分型方法,该方法包括如下步骤:
步骤S1,获得待预测的乳腺DCE-MRI影像,提取该影像中多种规格的序列影像的感兴趣区域;
步骤S2,利用一采用无监督学习训练获得的分子分型预测模型预测获得各种所述序列影像的对应的分子亚型分类概率;
步骤S3,采用集成学习融合,获得最终对应的分子亚型分类结果;
所述分子分型预测模型的训练过程包括:
获取用于训练的乳腺DCE-MRI影像,按照影像中病变良恶性划分形成互不相交的一源域数据集和一目标域数据集,所述源域数据集包含的是无标签样本,所述目标域数据集包含的是有标签样本;
分别提取源域数据集和目标数据集中多种规格的序列影像的感兴趣区域;
采用所获得源域数据集中多种序列影像的感兴趣区域,分别对所构建的一分子分型预测模型进行无监督学习预训练,获得模型权重;
采用所获得目标域数据集中多种序列影像的感兴趣区域,分别对所述预训练的分子分型预测模型进行迁移学习微调,更新模型权重,完成训练。
优选地,所述感兴趣区域的提取具体为:
读取乳腺DCE-MRI影像对应的肿瘤标记及临床诊断数据,确定肿瘤形态及位置;
基于所述肿瘤形态及位置将影像裁剪为若干个多尺度图像块,获得所述感兴趣区域。
优选地,所述分子亚型分类结果包括管腔上皮型和非管腔上皮型。
优选地,所述分子分型预测模型基于2D深度学习卷积神经网络模型构建,所述2D深度学习卷积神经网络模型包含一个初始卷积块、三个引入注意力机制和深度残差收缩机制的卷积池化单元、一个特征融合单元、一个全局平均池化层和一个分类层。
优选地,所述分子分型预测模型的无监督学习预训练具体为:
将所述源域数据集的感兴趣区域输入到分子分型预测模型中,获得正样本的低阶特征及高阶特征;
随机打乱所述正样本的低阶特征及高阶特征的通道排列,获得伪样本的低阶特征及高阶特征;
构建判别器,分别计算正伪样本间低阶特征和高阶特征的深度互信息,训练获得模型权重。
优选地,对所述分子分型预测模型进行无监督学习预训练时使用的优化目标函数数学表达式为:
Figure BDA0003226237430000031
其中,W×H为低阶特征的尺寸,
Figure BDA0003226237430000032
代表互信息计算函数,α、β、γ为权重因子,KL[·||·]代表相对熵损失项,
Figure BDA0003226237430000034
为输出特征服从的编码分布,
Figure BDA0003226237430000033
为标准正态分布,G(x)与Lij(x)分别为全局特征和局部特征。
优选地,对所述分子分型预测模型进行迁移学习微调时,加载预训练权重,使用较小学习率,通过目标域数据集分别进行微调和重新训练。
优选地,使用加权投票策略对获得的多种序列影像所对应的分子亚型分类概率进行所述集成学习的融合。
本发明还提供一种基于无监督学习的乳腺癌分子分型装置,包括:
训练数据集获取模块,获取用于训练的乳腺DCE-MRI影像,按照影像中病变良恶性划分形成互不相交的一源域数据集和一目标域数据集,所述源域数据集包含的是无标签样本,所述目标域数据集包含的是有标签样本;
感兴趣区域提取模块,用于提取多种规格的乳腺DCE-MRI序列影像的感兴趣区域;
无监督学习预训练模块,采用所获得源域数据集中多种序列影像的感兴趣区域,分别对所构建的一分子分型预测模型进行无监督学习预训练,获得模型权重;
迁移学习微调模块,采用所获得目标域数据集中多种序列影像的感兴趣区域,分别对所述预训练的分子分型预测模型进行迁移学习微调,更新模型权重;
分类模块,以训练好的分子分型预测模型对待预测乳腺DCE-MRI影像的多种规格的感兴趣区域进行处理,并采用集成学习融合,获得最终对应的分子亚型分类结果。
本发明还提供一种基于无监督学习的乳腺癌分子分型计算机系统,包括:
一个或多个命令处理器;
与处理器关联的存储器;
其中,所述命令处理器执行时调用存储器中的程序指令,以实现如所述方法中的步骤。
与现有技术相比,本发明具有以下有益效果:
1、本发明提出的乳腺癌分子分型方法通过无监督学习预训练网络和迁移学习微调网络的思想,前一阶段充分利用乳腺良性肿瘤影像构建无标签的源域数据集,增强模型提取特征的能力;后一阶段采用乳腺恶性肿瘤影像构建有标签的目标域数据集对带有预训练权重的模型微调,有效提升分类层鉴别特征的准确率。相对于从ImageNet迁移学习的传统方法而言,该二阶段的乳腺癌分子分型方法也大大降低了“负迁移”现象的发生。
2、本发明采用基于加权投票的集成学习策略融合DCE-MRI三种序列影像对应的分子亚型分类概率,从而充分提取像素点不同时间维度上的特征以进行深度特征互补,显著提高了乳腺癌分子分型预测精度。
3、本发明对深度学习卷积神经网络模型设计了有效的无监督学习目标优化函数,提升了模型预测鲁棒性。
附图说明
图1为本发明乳腺癌分子分型方法的整体流程图;
图2为本发明采用的深度学习卷积神经网络模型的结构示意图;
图3为本发明卷积神经网络模型中卷积单元1的示意图;
图4为本发明卷积神经网络模型无监督学习预训练过程示意图;
图5为本发明卷积神经网络模型迁移学习微调及分型过程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
参考图1所示,本实施例提供一种基于无监督学习的乳腺癌分子分型方法,该方法包括如下步骤:
步骤S1,获得待预测的乳腺DCE-MRI影像,提取该影像中多种规格的序列影像的感兴趣区域,本实施例中,采用DCE-MRI TPs 1、TPs 2、TPs 3三种序列影像;
步骤S2,利用一采用无监督学习训练获得的分子分型预测模型预测获得各种所述序列影像的对应的分子亚型分类概率;
步骤S3,采用集成学习融合,获得最终对应的分子亚型分类结果。
上述步骤S2中,分子分型预测模型的训练过程具体包括如下步骤:
步骤S201,获取用于训练的乳腺DCE-MRI影像,按照影像中病变良恶性划分形成互不相交的一源域数据集和一目标域数据集,所述源域数据集包含的是无标签样本,所述目标域数据集包含的是有标签样本。
本实施例中,首先根据病理图像查询报告将用于训练的乳腺DCE-MRI影像序列进行良恶性划分,构成互不相交的一源域数据集和一目标域数据集。其中,源域数据集包含567例乳腺良性病变患者的DCE-MRI影像数据,目标域数据集包含266例乳腺恶性病变患者的DCE-MRI影像数据以及免疫组化标记信息;然后,根据表1对目标域数据集中乳腺DCE-MRI影像进行分子亚型的标注。
表1乳腺癌分子分型的免疫组化特征
Figure BDA0003226237430000051
步骤S202,分别提取源域数据集和目标数据集中多种规格的序列影像的感兴趣区域。
首先,参照影像诊断技师提供的肿瘤标注文件,采用MATLAB软件确定乳腺病灶起始到终止间的影像序列段以及肿瘤具体位置;对于病灶起始终止影像段中的每张影像,以不同尺度分别于肿瘤质心处截取多个ROI正方形外接图像块,采用双线性插值算法重新调整正方形图像块的尺寸至64*64像素大小。此外,按照病人随机抽取预处理后目标域数据集的80%作为训练集,用于迁移学习网络的微调;20%作为测试集,用于网络性能的验证。
步骤S203,采用所获得源域数据集中多种序列影像的感兴趣区域,分别对所构建的一分子分型预测模型进行无监督学习预训练,获得模型权重。
本实施例的分子分型预测模型基于2D深度学习卷积神经网络模型(Convolutional neural network,CNN)构建,如图2所示,神经网络模型包括一个初始卷积块、三个引入注意力机制和深度残差收缩机制的卷积池化单元(SE_Inception_CM)、一个特征融合单元、一个全局平均池化层和一个分类层。如图3所示,卷积单元包含两个分支,上分支由大小分别为1×1及3×3等对称卷积核组成,下分支由大小分别为1×3及3×1等非对称卷积核构成,用于多尺度提取肿瘤的层次特征。注意力机制通过自适应学习自动获取每个特征的重要程度,而深度残差收缩机制则在此基础上进一步将特征软阈值化,抑制冗余特征,增强重要特征,同时减小模型训练时梯度弥散或梯度爆炸的风险。特征融合单元用于重构卷积单元1输出特征大小,以实现与卷积单元3输出特征通道的拼接。
如图4所示,在无监督学习预训练过程中,首先将源域数据集的感兴趣区域作为正样本输入到卷积神经网络模型中,卷积单元1输出作为正样本的低阶特征,而全局平均池化层输出作为高阶特征;然后,随机打乱每一正样本的低阶特征及高阶特征的通道排列,获得伪样本的低阶特征及高阶特征;接着,构建判别器,分别计算正伪样本间低阶特征和高阶特征的深度互信息,其中,高阶特征判别器与低阶特征判别器均由三层全连接层所构成,通道数为128、64和1。
整个无监督学习预训练过程中,通过训练大量无标签样本,使得高低阶特征间深度互信息最大化,同时神经网络编码空间要求尽可能服从高斯先验分布,以获得最优化网络连接权重。使用的优化目标函数数学表达式为:
Figure BDA0003226237430000061
其中,W×H为低阶特征的尺寸,
Figure BDA0003226237430000062
代表互信息计算函数,α、β、γ为权重因子,KL[·||·]代表相对熵损失项,
Figure BDA0003226237430000064
为输出特征服从的编码分布,
Figure BDA0003226237430000063
为标准正态分布,G(x)与Lij(x)分别为全局特征和局部特征,超参数α=1.0,β=1.25,γ=0.01。
步骤S204,采用所获得目标域数据集中多种序列影像的感兴趣区域,分别对所述预训练的分子分型预测模型进行迁移学习微调,更新模型权重,完成训练。
如图5所示,首先,加载网络中全局平均池化层及其以上所有层的预训练权重,移除低阶特征和高阶特征判别器。然后,设置各层学习率lr=3×10e-4,通过目标域数据集进行微调,选择学习率衰减法和早停法作为模型的回调函数,当模型训练20轮loss未下降,学习率降低10%;当30次的微调后loss仍未明显下降,模型便停止训练,以抑制过拟合现象。
上述步骤S3中,使用加权投票策略对获得的多种序列影像所对应的分子亚型分类预测概率(Prediction probabilities)进行所述集成学习(Ensemble learning)的融合,如图5所示。
将目标域测试集中三种DCE-MRI时间序列影像分别输入模型,获得患者乳腺癌分子分型分类结果;然后,计算各模型预测准确率作为分类性能权值,计算表达式为:
Figure BDA0003226237430000071
其中,wi是模型的分类性能权值,下同。Acci是模型预测准确率。
将各模型的预测结果与其分类性能权值相乘并求和,输出最高概率类则为该模型最佳预测类。在这里,为简化计算,我们直接计算各模型预测单张影像为管腔上皮型乳腺癌的概率P,最终集成模型的输出类别
Figure BDA0003226237430000072
为:
Figure BDA0003226237430000073
其中,pi是各模型对某一样本的预测概率。
Figure BDA0003226237430000074
其中,luminal和non_luminal为管腔上皮型和非管腔上皮型乳腺癌。
上述方法在目标域数据集DCE-MRI TPs 1序列影像上进行了测试(集成模型前)。所得单一模型的特异性为95.3%,准确率为88.0%,精准率为95.7%,AUC为0.888,相对于基线模型而言(特异性为97.7%,准确率为76.2%,精准率为97.0%,AUC为0.785),具有更好的分子分型预测效果。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
实施例2
本实施例提供一种基于无监督学习的乳腺癌分子分型预测装置,包括:训练数据集获取模块,获取用于训练的乳腺DCE-MRI影像,按照影像中病变良恶性划分形成互不相交的一源域数据集和一目标域数据集,所述源域数据集包含的是无标签样本,所述目标域数据集包含的是有标签样本;感兴趣区域提取模块,用于提取多种规格的乳腺DCE-MRI序列影像的感兴趣区域;无监督学习预训练模块,采用所获得源域数据集中多种序列影像的感兴趣区域,分别对所构建的一分子分型预测模型进行无监督学习预训练,获得模型权重;迁移学习微调模块,采用所获得目标域数据集中多种序列影像的感兴趣区域,分别对所述预训练的分子分型预测模型进行迁移学习微调,更新模型权重;分类模块,以训练好的分子分型预测模型对待预测乳腺DCE-MRI影像的多种规格的感兴趣区域进行处理,并采用集成学习融合,获得最终对应的分子亚型分类结果。其余同实施例1。
实施例3
本实施例提供一种本发明还提供了一种基于无监督学习的乳腺癌分子分型预测计算机系统,包括:一个或多个命令处理器和与处理器关联的存储器;其中,所述命令处理器执行时调用存储器中的程序指令,以实现如实施例1所述方法中的步骤。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于无监督学习的乳腺癌分子分型方法,其特征在于,该方法包括如下步骤:
步骤S1,获得待预测的乳腺DCE-MRI影像,提取该影像中多种规格的序列影像的感兴趣区域;
步骤S2,利用一采用无监督学习训练获得的分子分型预测模型预测获得各种所述序列影像的对应的分子亚型分类概率;
步骤S3,采用集成学习融合,获得最终对应的分子亚型分类结果;
所述分子分型预测模型的训练过程包括:
获取用于训练的乳腺DCE-MRI影像,按照影像中病变良恶性划分形成互不相交的一源域数据集和一目标域数据集,所述源域数据集包含的是无标签样本,所述目标域数据集包含的是有标签样本;
分别提取源域数据集和目标数据集中多种规格的序列影像的感兴趣区域;
采用所获得源域数据集中多种序列影像的感兴趣区域,分别对所构建的一分子分型预测模型进行无监督学习预训练,获得模型权重;
采用所获得目标域数据集中多种序列影像的感兴趣区域,分别对所述预训练的分子分型预测模型进行迁移学习微调,更新模型权重,完成训练。
2.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,所述感兴趣区域的提取具体为:
读取乳腺DCE-MRI影像对应的肿瘤标记及临床诊断数据,确定肿瘤形态及位置;
基于所述肿瘤形态及位置将影像裁剪为若干个多尺度图像块,获得所述感兴趣区域。
3.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,所述分子亚型分类结果包括管腔上皮型和非管腔上皮型。
4.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,所述分子分型预测模型基于2D深度学习卷积神经网络模型构建,所述2D深度学习卷积神经网络模型包含一个初始卷积块、三个引入注意力机制和深度残差收缩机制的卷积池化单元、一个特征融合单元、一个全局平均池化层和一个分类层。
5.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,所述分子分型预测模型的无监督学习预训练具体为:
将所述源域数据集的感兴趣区域输入到分子分型预测模型中,获得正样本的低阶特征及高阶特征;
随机打乱所述正样本的低阶特征及高阶特征的通道排列,获得伪样本的低阶特征及高阶特征;
构建判别器,分别计算正伪样本间低阶特征和高阶特征的深度互信息,训练获得模型权重。
6.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,对所述分子分型预测模型进行无监督学习预训练时使用的优化目标函数数学表达式为:
Figure FDA0003226237420000021
其中,W×H为低阶特征的尺寸,
Figure FDA0003226237420000022
代表互信息计算函数,α、β、γ为权重因子,KL[·||·]代表相对熵损失项,
Figure FDA0003226237420000023
为输出特征服从的编码分布,
Figure FDA0003226237420000024
为标准正态分布,G(x)与Lij(x)分别为全局特征和局部特征。
7.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,对所述分子分型预测模型进行迁移学习微调时,加载预训练权重,使用较小学习率,通过目标域数据集分别进行微调和重新训练。
8.根据权利要求1所述的基于无监督学习的乳腺癌分子分型方法,其特征在于,使用加权投票策略对获得的多种序列影像所对应的分子亚型分类概率进行所述集成学习的融合。
9.一种基于无监督学习的乳腺癌分子分型装置,其特征在于,包括:
训练数据集获取模块,获取用于训练的乳腺DCE-MRI影像,按照影像中病变良恶性划分形成互不相交的一源域数据集和一目标域数据集,所述源域数据集包含的是无标签样本,所述目标域数据集包含的是有标签样本;
感兴趣区域提取模块,用于提取多种规格的乳腺DCE-MRI序列影像的感兴趣区域;
无监督学习预训练模块,采用所获得源域数据集中多种序列影像的感兴趣区域,分别对所构建的一分子分型预测模型进行无监督学习预训练,获得模型权重;
迁移学习微调模块,采用所获得目标域数据集中多种序列影像的感兴趣区域,分别对所述预训练的分子分型预测模型进行迁移学习微调,更新模型权重;
分类模块,以训练好的分子分型预测模型对待预测乳腺DCE-MRI影像的多种规格的感兴趣区域进行处理,并采用集成学习融合,获得最终对应的分子亚型分类结果。
10.一种基于无监督学习的乳腺癌分子分型计算机系统,其特征在于,包括:
一个或多个命令处理器;
与处理器关联的存储器;
其中,所述命令处理器执行时调用存储器中的程序指令,以实现如权利要求1-8中任一项所述方法中的步骤。
CN202110972195.6A 2021-08-24 2021-08-24 基于无监督学习的乳腺癌分子分型方法、装置及系统 Active CN113643269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110972195.6A CN113643269B (zh) 2021-08-24 2021-08-24 基于无监督学习的乳腺癌分子分型方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110972195.6A CN113643269B (zh) 2021-08-24 2021-08-24 基于无监督学习的乳腺癌分子分型方法、装置及系统

Publications (2)

Publication Number Publication Date
CN113643269A true CN113643269A (zh) 2021-11-12
CN113643269B CN113643269B (zh) 2023-10-13

Family

ID=78423507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110972195.6A Active CN113643269B (zh) 2021-08-24 2021-08-24 基于无监督学习的乳腺癌分子分型方法、装置及系统

Country Status (1)

Country Link
CN (1) CN113643269B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114255878A (zh) * 2021-12-07 2022-03-29 广东省人民医院 一种疾病分型模型的训练方法、系统、装置及存储介质
CN114511564A (zh) * 2022-04-19 2022-05-17 天津市肿瘤医院(天津医科大学肿瘤医院) 基于dce-mri对乳腺癌残存肿瘤负荷的影像分析方法
CN114663875A (zh) * 2022-03-31 2022-06-24 上海易康源医疗健康科技有限公司 文字检测系统、检测方法及训练方法
CN114708471A (zh) * 2022-06-06 2022-07-05 中国科学院自动化研究所 跨模态图像生成方法、装置、电子设备与存储介质
CN116415649A (zh) * 2023-04-07 2023-07-11 首都医科大学附属北京天坛医院 基于多模态超声影像自监督学习的乳腺微小癌分析方法
CN116883995A (zh) * 2023-07-07 2023-10-13 广东食品药品职业学院 一种乳腺癌分子亚型的识别系统
CN117976038A (zh) * 2023-12-12 2024-05-03 深圳市人民医院 一种基于深度学习的乳腺癌基因分型预测方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114130A1 (zh) * 2019-12-11 2021-06-17 中国科学院深圳先进技术研究院 一种无监督自适应乳腺病变分割方法
CN113034436A (zh) * 2021-02-26 2021-06-25 中山大学孙逸仙纪念医院 基于乳腺mr影像组学的乳腺癌分子分型变化预测装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114130A1 (zh) * 2019-12-11 2021-06-17 中国科学院深圳先进技术研究院 一种无监督自适应乳腺病变分割方法
CN113034436A (zh) * 2021-02-26 2021-06-25 中山大学孙逸仙纪念医院 基于乳腺mr影像组学的乳腺癌分子分型变化预测装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
任湘;张朋;范明;厉力华;: "基于卷积神经网络的乳腺癌分子分型预测研究", 杭州电子科技大学学报(自然科学版), no. 05 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114255878A (zh) * 2021-12-07 2022-03-29 广东省人民医院 一种疾病分型模型的训练方法、系统、装置及存储介质
CN114663875A (zh) * 2022-03-31 2022-06-24 上海易康源医疗健康科技有限公司 文字检测系统、检测方法及训练方法
CN114511564A (zh) * 2022-04-19 2022-05-17 天津市肿瘤医院(天津医科大学肿瘤医院) 基于dce-mri对乳腺癌残存肿瘤负荷的影像分析方法
CN114511564B (zh) * 2022-04-19 2023-01-24 天津市肿瘤医院(天津医科大学肿瘤医院) 基于dce-mri对乳腺癌残存肿瘤负荷的影像分析方法
CN114708471A (zh) * 2022-06-06 2022-07-05 中国科学院自动化研究所 跨模态图像生成方法、装置、电子设备与存储介质
CN114708471B (zh) * 2022-06-06 2022-09-06 中国科学院自动化研究所 跨模态图像生成方法、装置、电子设备与存储介质
CN116415649A (zh) * 2023-04-07 2023-07-11 首都医科大学附属北京天坛医院 基于多模态超声影像自监督学习的乳腺微小癌分析方法
CN116415649B (zh) * 2023-04-07 2023-10-27 首都医科大学附属北京天坛医院 基于多模态超声影像自监督学习的乳腺微小癌分析方法
CN116883995A (zh) * 2023-07-07 2023-10-13 广东食品药品职业学院 一种乳腺癌分子亚型的识别系统
CN116883995B (zh) * 2023-07-07 2024-07-16 广东食品药品职业学院 一种乳腺癌分子亚型的识别系统
CN117976038A (zh) * 2023-12-12 2024-05-03 深圳市人民医院 一种基于深度学习的乳腺癌基因分型预测方法及装置

Also Published As

Publication number Publication date
CN113643269B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
CN113643269B (zh) 基于无监督学习的乳腺癌分子分型方法、装置及系统
CN112241766B (zh) 基于样本生成和迁移学习的肝脏ct图像多病变分类方法
CN107886514B (zh) 基于深度残差网络的乳腺钼靶图像肿块语义分割方法
CN111985536B (zh) 一种基于弱监督学习的胃镜病理图像分类方法
CN112017198B (zh) 基于自注意力机制多尺度特征的右心室分割方法及装置
WO2021203795A1 (zh) 一种基于显著性密集连接扩张卷积网络的胰腺ct自动分割方法
CN112101451B (zh) 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法
CN111476793B (zh) 动态增强磁共振成像处理方法、系统、存储介质、终端
CN109949304B (zh) 图像检测学习网络的训练和获取方法、图像检测装置和介质
Wu et al. Ultrasound image segmentation method for thyroid nodules using ASPP fusion features
Ström et al. Pathologist-level grading of prostate biopsies with artificial intelligence
CN112132827A (zh) 病理图像的处理方法、装置、电子设备及可读存储介质
CN114783604A (zh) 一种乳腺癌前哨淋巴结转移的预测方法、系统及存储介质
Sengan et al. A fuzzy based high-resolution multi-view deep CNN for breast cancer diagnosis through SVM classifier on visual analysis
CN112614093A (zh) 基于多尺度空间注意力网络的乳腺病理图像分类方法
Debnath et al. Brain tumour segmentation using memory based learning method
CN116883341A (zh) 一种基于深度学习的肝脏肿瘤ct图像自动分割方法
CN110458842A (zh) 基于双通道三维密集连接网络的脑肿瘤分割方法
Radhi et al. An automatic segmentation of breast ultrasound images using u-net model
CN112233106A (zh) 一种基于残差胶囊网络的甲状腺癌超声影像分析方法
CN116228732A (zh) 一种乳腺癌分子分型预测方法、系统、介质、设备及终端
CN113658151B (zh) 一种乳腺病变磁共振图像分类方法、设备及可读存储介质
Lu et al. Prediction of breast cancer metastasis by deep learning pathology
CN113191413B (zh) 基于中央凹残差网络的前列腺多模mr图像分类方法和系统
CN115393378A (zh) 一种低成本高效的细胞核图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant