CN115526331A - 一种基于病变类别感知的数字病理图像的表征学习方法 - Google Patents
一种基于病变类别感知的数字病理图像的表征学习方法 Download PDFInfo
- Publication number
- CN115526331A CN115526331A CN202210980645.0A CN202210980645A CN115526331A CN 115526331 A CN115526331 A CN 115526331A CN 202210980645 A CN202210980645 A CN 202210980645A CN 115526331 A CN115526331 A CN 115526331A
- Authority
- CN
- China
- Prior art keywords
- characterization
- learning
- branch
- digital pathological
- pathological image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Radiology & Medical Imaging (AREA)
- Image Analysis (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
Abstract
本发明公开了一种基于病变类别感知的数字病理图像的表征学习方法,包括以下步骤:S1.获取数据集;S2.基于弱监督的对比学习预训练;S3.队列更新后得到针对数字病理图像的特征提取器;本发明针对现有框架的不足,提出一种数字病理图像的表征学习方法,该方法不依赖于专家的精细标注,仅需切片级的分类标签,利用获取代价最小的标注信息学习得到鲁棒的、具有区分度的图像表征,并且在下游任务中标签优于现有的先进方法。
Description
技术领域
本发明涉及医学图像处理技术领域,更具体的说是涉及一种基于病变类别感知的数字病理图像的表征学习方法。
背景技术
癌症是人类健康的一大威胁,在医学领域,对于数字病理图像的诊断是癌症诊断过程中至关重要的步骤。随着计算机与显微成像技术的快速发展,数字病理图像的获取便捷与快速,适用于数字病理全切片图像的计算机自动分析算法成为近年来该方向的一个研究热点。基于全切片图像(WSI)分析的研究在计算病理学领域逐渐流行,然而由于硬件资源的限制,WSI很难直接输入深度神经网络(DNN)进行训练。典型的解决方案是在推理之前通过聚合局部组织表示来生成WSI级别的表示。
在算法方面,目前大多数算法都依赖于精细标注进行监督学习,而数字病理图像因其分辨率远高于自然场景图像,并且结构复杂,类型多变,导致数字病理图像的标注工作十分繁重,大规模标注难以实现。为了解决上述矛盾,迁移学习是一种广为接受的局部组织表征学习方式。例如现有技术中公开了直接利用ImageNet上预训练的模型提取组织表征,并将该表征用于下游全切片分类任务中的技术方案。然而,自然图像和组织病理学图像之间存在“域差异”。一些弱监督学习方法倾向于通过多实例学习(MIL)来转换特征域,例如采用多实例学习方法,使用CNN预测每个数据包内实例的阳性概率,根据阳性概率筛选出置信度搞得一些样本进行训练,但此类方法的上限受限于模型在训练数据域之外的性能。
基于此,自监督学习方法逐渐被引入用于学习病理组织得表征。现有技术中有方案提出SimTriplet,利用自监督对比学习方法学习病理组织的表征。同时重新考虑了对比学习方法在病理图像上的适用性,重新构建了正例样本构建策略,从领域组织区域中采样正样本,强化了局部组织的空间相关性。
现有技术方案大都遵循监督学习范式,其性能依赖于大规模的精细标注。一些弱监督学习方法不注重表征的优劣,大都针对下游任务进行设计,并且数据包的建模方式只适用于二分类任务,很少有关于多分类任务的研究工作。自监督学习方法虽然在自然图像分析任务中取得了巨大的成功,但由于病理图像的模式与自然场景图像存在差异,因此现有的技术方案仍然存在较大的改进空间。
因此,如何提供一种不再依赖于大规模的精细标注的基于病变类别感知的数字病理图像的表征学习方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于病变类别感知的数字病理图像的表征学习方法,该方法不依赖于专家的精细标注,仅需切片级的分类标签,利用获取代价最小的标注信息学习得到鲁棒的、具有区分度的图像表征,并且在下游任务中标签优于现有的先进方法。
为了实现上述目的,本发明采用如下技术方案:
一种基于病变类别感知的数字病理图像的表征学习方法,包括以下步骤:
S2.基于弱监督的对比学习预训练:
S21.对x进行数据增强后得到两个不同的增强视图vq和vk;
S22.将vq和vk分别输入至对比学习网络的查询分支和关键分支中,通过所述查询分支和所述关键分支内的编码器,分别对应生成表征zq=fq(vq)和zk=fk(vk),并分别通过所述查询分支和所述关键分支内的投影器将表征映射到应用对比损失的空间,得到q=Pq(zq)和k+=Pk(zk),其中k+为正样本,q为负样本;
S23.将所述负样本的表征zq=fq(vq)存储于病变存储队列M中,分别更新所述查询分支的权重θq和所述关键分支的权重θk;
S3.更新所述队列M中所述负样本的表征,更新后得到针对数字病理图像的特征提取器:使用平均KL散度来确定要更新的样本集合,具体方式如下:
其中,B代表一个训练批次包含的表征集合,U代表一个训练批次中需要被更新的表征集合,DKL(·)是KL散度函数,P(x)表示待更新的k+与队列中的表示之间的相似度分布,Q(x)表示预期分布,i为M中的各类样本的个数。
优选的,所述编码器包括卷积神经网络,所述投影器包括多层感知器,所述多层感知器依次包括第一线性层、ReLU层和第二线性层。
优选的,病变存储队列M表示为:
M={ki0,ki1,...,kiN|i=0,1,...,K}
其中,N为每一个切片类别的存储容量,K代表切片类别总数。
优选的,更新所述查询分支的权重θq的方法为:
通过最小化InfoNCE损失来更新查询分支的权重参数:
优选的,更新所述关键分支的权重θk的方法为:
通过指数移动平均机制从所述查询分支通过如下公式进行更新:
通过指数移动平均机制进行更新:
θk=mθk+(1-m)θq,m∈[0,1)
其中,m是动量更新参数。
优选的,P(x)和Q(x)表示为:
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于病变类别感知的数字病理图像的表征学习方法,仅利用切片级标注信息作为弱监督信息进行模型训练,极大地缓解了数字病理切片大规模标注困难的问题。模型不依赖于病理专家的精细标注,因此模型可以迅速对大规模数据进行更新迭代,同时在一定程度上缓解了监督学习模型因强监督信息所带来的对训练环境严重依赖、泛化能力差的问题。本发明缓解了数字病理切片大规模标注困难与模型精度依赖于监督的信息的矛盾,同时针对现有病理图像表征学习方法的不足提出改进,将语义信息嵌入图像表征中。这一优势意味着本发明可以利用获取代价低的切片级标注信息获取得到鲁棒的并具有区分度的图像表征,并且适用于大规模数据的预训练。。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种基于病变类别感知的数字病理图像的表征学习方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于病变类别感知的数字病理图像的表征学习方法,包括以下步骤:
S2.基于弱监督的对比学习预训练:
S21.对x进行数据增强后得到两个不同的增强视图vq和vk;
S22.将vq和vk分别输入至对比学习网络的查询分支和关键分支中,通过查询分支和关键分支内的编码器,分别对应生成表征zq=fq(vq)和zk=fk(vk),并分别通过查询分支和关键分支内的投影器将表征映射到应用对比损失的空间,得到q=Pq(zq)和k+=Pk(zk),其中k+为正样本,q为负样本;
S23.将负样本的表征zq=fq(vq)存储于病变存储队列M中,分别更新查询分支的权重θq和关键分支的权重θk;
S3.更新队列M中负样本的表征,更新后得到针对数字病理图像的特征提取器:基于同一类样本之间的特征距离小于不同类样本之间的特征距离的假设,本发明使用平均Kullback-Leibler(KL)散度来确定要更新的样本集合,具体方式如下:
其中,B代表一个训练批次包含的表征集合,U代表一个训练批次中需要被更新的表征集合,DKL(·)是KL散度函数,P(x)表示待更新的k+与队列中的表示之间的相似度分布,Q(x)表示预期分布,i为M中的各类样本的个数。
需要说明的是:
对于S1,在本事实例中可以使用滑窗法将数字病理切片裁剪为256×256的图像块。
对于S2,对比学习方法旨在从图像内容中挖掘类内相似性和类间差异。如图1所示,本发明所使用的对比学习网络架构是一个由两个分支组成的孪生网络,即查询分支和键分支,查询分支与键分支有相同的结构。所述查询分支由编码器fq和投影器pq组成,它们由一组可训练的权重θq确定;所属键分支由编码器fk和投影器pk组成,它们由一组不可训练的权重θk定义。
对于S3,为了确保各类别的存储队列中的表征在训练过程中能够代表相应的类,需要有选择地更新每个队列。本发明提出了一种新颖的队列更新策略(QRS),如图1(b)所示。本发明策略旨在提纯队列,使每个队列由相应类的最具代表性的表征组成。本发明使用Kullback-Leibler(K-L)散度来寻找潜在的噪声样本。
为了进一步实施上述技术方案,编码器包括卷积神经网络,投影器包括多层感知器,多层感知器依次包括第一线性层、ReLU层和第二线性层。
为了进一步实施上述技术方案,病变存储队列M表示为:
M={ki0,ki1,...,kiN|i=0,1,...,K}
其中,N为每一个切片类别的存储容量,K代表切片类别总数。
为了进一步实施上述技术方案,更新查询分支的权重θq的方法为:
通过最小化InfoNCE损失来更新查询分支的权重参数:
为了进一步实施上述技术方案,更新关键分支的权重θk的方法为:
通过指数移动平均机制从查询分支通过如下公式进行更新:
通过指数移动平均机制进行更新:
θk=mθk+(1-m)θq,m∈[0,1)
其中,m是动量更新参数。
为了进一步实施上述技术方案,P(x)和Q(x)表示为:
该方法还可以包括:S4.下游任务迁移
按照上述S1~S3,可以训练得到一个针对数字病理图像的特征提取器,对数字病理图像进行特征提取。
后续可将该特征提取器利用少量标注信息进行微调,通过少量标注信息获得特定任务下具有更好特征表示的新模型;或者可直接迁移到下游具体任务,进行切片级的分类获得切片的粗诊断信息,或者迁移到分割任务中获得病变区域的粗分割信息以供医生进行参考。
下面将结合具体实验来对本发明进行进一步说明:
本实施例中,在子宫内膜癌病理数据集(共有698张切片),以及EGFR数据集(共有754张切片)中对本发明方法进行了验证。使用TransMIL作为全切片分类框架,对本发明方法所学习得到的表征与其他表征学习方法进行比较。对比结果如表1和表2所示:
表1子宫内膜癌病理数据集分类平均精度对比
表2 EFGR病理数据集分类平均精度对比
实验结果表明,本发明引入切片级标签作为监督信息,将语义信息嵌入到图像表征中,有效地提升了所学习表征在下游任务上的表现,相比于其他先进的迁移学习、自监督学习表征学习方法,本发明方法在下游任务上取得了最好的性能。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种基于病变类别感知的数字病理图像的表征学习方法,其特征在于,包括以下步骤:
S2.基于弱监督的对比学习预训练:
S21.对x进行数据增强后得到两个不同的增强视图vq和vk;
S22.将vq和vk分别输入至对比学习网络的查询分支和关键分支中,通过所述查询分支和所述关键分支内的编码器,分别对应生成表征zq=fq(vq)和zk=fk(vk),并分别通过所述查询分支和所述关键分支内的投影器将表征映射到应用对比损失的空间,得到q=Pq(zq)和k+=Pk(zk),其中k+为正样本,q为负样本;
S23.将所述负样本的表征zq=fq(vq)存储于病变存储队列M中,分别更新所述查询分支的权重θq和所述关键分支的权重θk;
S3.更新所述队列M中所述负样本的表征,更新后得到针对数字病理图像的特征提取器:使用平均KL散度来确定要更新的样本集合,具体方式如下:
其中,B代表一个训练批次包含的表征集合,U代表一个训练批次中需要被更新的表征集合,DKL(·)是KL散度函数,P(x)表示待更新的k+与队列中的表征之间的相似度分布,Q(x)表示预期分布,i为M中的各类样本的个数。
2.根据权利要求1所述的一种基于病变类别感知的数字病理图像的表征学习方法,其特征在于,所述编码器包括卷积神经网络,所述投影器包括多层感知器,所述多层感知器依次包括第一线性层、ReLU层和第二线性层。
3.根据权利要求1所述的一种基于病变类别感知的数字病理图像的表征学习方法,其特征在于,病变存储队列M表示为:
M={ki0,ki1,...,kiN|i=0,1,...,K}
其中,N为每一个切片类别的存储容量,K代表切片类别总数。
5.根据权利要求1所述的一种基于病变类别感知的数字病理图像的表征学习方法,其特征在于,更新所述关键分支的权重θk的方法为:
通过指数移动平均机制进行更新:
θk=mθk+(1-m)θq,m∈[0,1)
其中,m是动量更新参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210980645.0A CN115526331A (zh) | 2022-08-16 | 2022-08-16 | 一种基于病变类别感知的数字病理图像的表征学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210980645.0A CN115526331A (zh) | 2022-08-16 | 2022-08-16 | 一种基于病变类别感知的数字病理图像的表征学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115526331A true CN115526331A (zh) | 2022-12-27 |
Family
ID=84695301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210980645.0A Pending CN115526331A (zh) | 2022-08-16 | 2022-08-16 | 一种基于病变类别感知的数字病理图像的表征学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115526331A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117831612A (zh) * | 2024-03-05 | 2024-04-05 | 安徽省立医院(中国科学技术大学附属第一医院) | 基于人工智能的gist靶向药物类型选择预测方法及系统 |
-
2022
- 2022-08-16 CN CN202210980645.0A patent/CN115526331A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117831612A (zh) * | 2024-03-05 | 2024-04-05 | 安徽省立医院(中国科学技术大学附属第一医院) | 基于人工智能的gist靶向药物类型选择预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Visual saliency guided complex image retrieval | |
Li et al. | A composite model of wound segmentation based on traditional methods and deep neural networks | |
CN108132968B (zh) | 网络文本与图像中关联语义基元的弱监督学习方法 | |
CN112966691B (zh) | 基于语义分割的多尺度文本检测方法、装置及电子设备 | |
CN110674866A (zh) | 迁移学习特征金字塔网络对X-ray乳腺病灶图像检测方法 | |
Feng et al. | A color image segmentation method based on region salient color and fuzzy c-means algorithm | |
CN110188763B (zh) | 一种基于改进图模型的图像显著性检测方法 | |
Wang et al. | Pixel classification based color image segmentation using quaternion exponent moments | |
Fernandes et al. | Deep image segmentation by quality inference | |
Tahir et al. | Novel round-robin tabu search algorithm for prostate cancer classification and diagnosis using multispectral imagery | |
CN114723583A (zh) | 基于深度学习的非结构化电力大数据分析方法 | |
Taheri et al. | Effective features in content-based image retrieval from a combination of low-level features and deep Boltzmann machine | |
CN114783604A (zh) | 一种乳腺癌前哨淋巴结转移的预测方法、系统及存储介质 | |
CN114581451A (zh) | 一种基于散射图神经网络的大脑磁共振图像分割方法 | |
CN115526331A (zh) | 一种基于病变类别感知的数字病理图像的表征学习方法 | |
CN114093507B (zh) | 边缘计算网络中基于对比学习的皮肤病智能分类方法 | |
Khalaf et al. | Robust partitioning and indexing for iris biometric database based on local features | |
Gururaj et al. | Fundus image features extraction for exudate mining in coordination with content based image retrieval: A study | |
CN114565035A (zh) | 一种舌象分析方法、终端设备及存储介质 | |
Rao et al. | An efficient content-based medical image retrieval based on a new Canny steerable texture filter and Brownian motion weighted deep learning neural network | |
Wu et al. | A new multiple‐distribution GAN model to solve complexity in end‐to‐end chromosome karyotyping | |
CN113642668A (zh) | 基于改进麻雀搜索算法的抑制式粗糙直觉模糊聚类方法 | |
Peng et al. | Fully convolutional neural networks for tissue histopathology image classification and segmentation | |
Bommisetty et al. | Video superpixels generation through integration of curvelet transform and simple linear iterative clustering | |
CN116884597A (zh) | 基于自监督预训练和多示例学习的病理图像乳腺癌分子分型方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |