CN113657479B - 一种新型多尺度深宽结合的病理图片分类方法、系统及介质 - Google Patents

一种新型多尺度深宽结合的病理图片分类方法、系统及介质 Download PDF

Info

Publication number
CN113657479B
CN113657479B CN202110923812.3A CN202110923812A CN113657479B CN 113657479 B CN113657479 B CN 113657479B CN 202110923812 A CN202110923812 A CN 202110923812A CN 113657479 B CN113657479 B CN 113657479B
Authority
CN
China
Prior art keywords
feature
width
matrix
node
sample group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110923812.3A
Other languages
English (en)
Other versions
CN113657479A (zh
Inventor
韩楚
林佳泰
韩国强
刘再毅
梁长虹
石镇维
潘细朋
李振辉
陈鑫
赵可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong General Hospital
Original Assignee
Guangdong General Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong General Hospital filed Critical Guangdong General Hospital
Priority to CN202110923812.3A priority Critical patent/CN113657479B/zh
Publication of CN113657479A publication Critical patent/CN113657479A/zh
Application granted granted Critical
Publication of CN113657479B publication Critical patent/CN113657479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种新型多尺度深宽结合的病理图片分类方法、系统及介质,方法包括:多尺度病理切片采样,得到包含子图的样本组;将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵;将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;根据特征矩阵和宽度增强节点进行病理分型推理。本发明结合深度和宽度两种机器学习方法,提出一种新的模型以达到两者优势互补的作用,既预训练后的深度学习特征提取器提取深度语义特征、深度语义特征转化为宽度特征节点利用宽度学习架构快速拟合特征与输出标签的映射关系,在较短时间内获得更多的特征信息,从而达到病理图片分类的目的。

Description

一种新型多尺度深宽结合的病理图片分类方法、系统及介质
技术领域
本发明属于病理图片处理的技术领域,具体涉及一种新型多尺度深宽结合的病理图片分类方法、系统及介质。
背景技术
组织病理学是疾病诊断的金标准,尤其针对癌症的诊断是任何别的检查项目所无法替代的;医生可以通过全视野切片对肿瘤的良恶性进行判断并确定诊疗方案。然而,病理学分析十分依赖于医生的专业知识以及临床经验,这导致不同的医生通过分析得到的结果会有很大的差距。为了解决这个问题,机器学习算法被应用去辅助病理医生进行全视野切片全分析;但是,全视野切片(whole slide images)病理图片的智能分析还面临着数据量巨大的挑战,导致无法直接应用常规的深度模型直接进行智能分析任务。近年内,科研工作者研发了一系列计算机辅助的全视野切片智能分析模型以面对这个挑战。
在过去的十年,解决WSI病理图片自动化分析的方案一般都是基于深度学习的图片块分类策略,这种策略的基本步骤包括:(1)先通过掩码的方式把病理图片的组织区域和不同病变区域提取出来;(2)在掩码中随机取点作为中心点取特定分辨率下图片块;(3)图片块根据掩码的类别得到一个图片块的分类标签;(4)搭建一个深度卷积网络并随机初始化;(5)采样获得的数据集送入网络进行迭代训练;(6)训练完成一个分类模型的学习即可输入测试图片块得到分类标签;以上是现有处理全视野切片数据的一般步骤。基于该策略又衍生出了各种基于深度卷积网络的处理全视野切片的模型,由于现有的方法都是完全依赖于深度卷积的迭代训练,这使得深度学习系统的耗时问题一直存在整个模型的训练过程中。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种新型多尺度深宽结合的病理图片分类方法、系统及介质,该方法结合深度网络和宽度网络的优点,达到了优势互补的作用,深度卷积网络作为特征提取器弥补了宽度学习系统原始架构对图像特征提取能力不足的缺点,而宽度学习架构以极小的时间代价提升了深度卷积网络的拟合程度,节省了大量的训练时间。
为了达到上述目的,本发明采用以下技术方案:
本发明一方面公开了一种新型多尺度深宽结合的病理图片分类方法,包括下述步骤:
多尺度病理切片采样,得到包含子图的样本组;
将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵;
将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;
根据特征矩阵和宽度增强节点进行病理分型推理。
作为优选的技术方案,所述多尺度病理切片采样,得到包含子图的样本组,具体步骤为:
利用颜色相关性算法生成组织掩码,利用区域标注生成不同癌变区域的掩码;
利用组织掩码和癌变区域掩码生成非癌变区域掩码;
在癌变区域掩码和非癌变区域掩码中生成采样中心点;
利用采样中心点在全视野切片不同的放大倍率下,采集同样大小的图片块作为样本组。
作为优选的技术方案,所述在全视野切片不同的放大倍率下采集的图片块具备不同的感受野;
将同一个采样中心点下采集的不同放大倍率的图片块作为一个样本组,表示为:
Figure BDA0003208449180000021
一个样本组Xi对应一个分类标签Yii,即{Xi,Yi},其中一个样本组包含P个从不同放大倍率下获取的子图,i表示样本组序号,
Figure BDA0003208449180000022
表示第i个样本组中的子图,P为子图序号,n为样本数量。
作为优选的技术方案,所述预训练好的深度卷积模型提前在不同尺度的单子图样本中进行预训练,训练后的模型在此作为特征提取器不再需要进行参数更新。
作为优选的技术方案,所述将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵,具体步骤为:
对于输入的一个子图x,经过深度卷积模型的映射,在不同的卷积阶段中得到多张不同尺度的特征图,公式为:
f1,f2,……,fk=fCNN(x)
其中,f1,f2,……,k为深度卷积模型每个卷积阶段输出的中间层特征图,总的卷积阶段数量为k,fCNN()表示特征提取器,即预训练好的深度卷积模型;
不同深度的特征图含有不同的通道数量,经过一个全局平均池化的特征压缩过程使每个通道获得一个凝练的特征点,公式为:
Figure BDA0003208449180000023
其中,ek表示第k个特征图的特征点,fsqueeze()表示全局平均池化,把多通道特征图压缩为一个特征向量,即每张单通道特征图得到一个全局平均值,hk,wk分别代表第k个特征图的高和宽,fk(l,m)为第k个特征图,其中l,m为该特征图每个值的索引;
并联所有深度特征点为一个宽度特征向量,表示为:
z=[e1,e2,……,ek]
其中,z为输入的子图x对应的宽度特征子向量,每个宽度特征节点为k个通道级别特征向量e组成;
对于n个输入样本组中n×P个子图的宽度特征子向量进行整合,提取总的特征矩阵Ztotal,其表示为:
Figure BDA0003208449180000031
其中,n为样本组数量,P为每个样本组中所包含的子图个数,n×d为总的特征矩阵的维度,d为所有样本组得到的特征维度。
作为优选的技术方案,所述将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点,具体为:
将特征矩阵中的特征节点通过一个随机全连接激活过程获得宽度增量节点,计算公式为:
H=f(ZtotalWenhanceenhance)
其中,Ztotal为所述特征矩阵,Wenhance和βenhance分别是随机全连接激活的权重和阈值,是宽度学习中特殊的增强节点,其在初始化时随机生成,生成后固定并且不需要更新,f()为非线性激活函数sigmoid。
作为优选的技术方案,所述根据特征矩阵和宽度增强节点进行病理分型推理,具体为:
根据特征矩阵中的宽度特征节点和宽度增强节点映射输出节点;
把所有节点进行并联,得到总节点矩阵A,公式为:
A=[Ztotal,H]
其中,Ztotal为所述特征矩阵,H为宽度增强节点;
所述总节点矩阵A的维度为Rn×d,即样本组数量n并联每组输入的样本提取的特征d及增量节点后的维度;
将总节点矩阵输入所述预训练好的深度卷积模型中的最后一个全连接层,推理样本组的病理分型得到推理结果。
作为优选的技术方案,所述推理样本组病理分型得到推理结果,具体为:
将所述总节点矩阵划分为训练样本组Atrain和测试样本集Atest
根据伪逆值算法更新权重参数Wbls,计算训练样本集总节点矩阵的伪逆特征矩阵
Figure BDA0003208449180000041
Figure BDA0003208449180000042
其中,I为单位矩阵,λ为伪逆值算法常数值,
Figure BDA0003208449180000043
为Atrain的转置;
根据宽度学习系统伪逆值求解法计算输出层权重
Figure BDA0003208449180000044
其中Ytrain为对应输入训练样本集的标签;
求得病理分型的推理结果Ytest,公式为:
Ytest=AtestWbls
其中,Atest为测试集样本组所提取的特征矩阵。
本发明另一方提供了一种新型多尺度深宽结合的病理切片分类系统,应用于所述的一种新型多尺度深宽结合的病理图片分类方法,包括采样模块、特征提取模块、节点映射模块、推理模块;
所述采样模块,用于多尺度病理切片采样,得到包含子图的样本组;
所述特征提取模块,用于将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵;
所述节点映射模块,用于将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;
所述推理模块,用于根据特征矩阵和宽度增强节点进行病理分型推理。
本发明又一方面提供了一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现所述的一种新型多尺度深宽结合的病理切片分类方法。
本发明与现有技术相比,具有如下优点和有益效果:
1、现有技术使用卷积神经网络,都是仅仅利用其最后一层最深处的语义特征进行全连接层后得到分类结果,但是本发明利用预训练好的深度卷积模型作为深度特征提取器,并摊平深度网络以宽度的形式提取中间层深度特征,化深度特征为宽度特征,并利用多个深度模型分别提取其对应尺度的深度特征,能得到更多的特征信息;
2、传统深度结构是增加中间层以增加模型拟合能力,而原始宽度学习系统是横向映射特征节点组和增量节点组增加最后输出全连接层的拟合能力。本发明结合深度网络和宽度网络的优点,达到了优势互补的作用,深度卷积网络作为特征提取器弥补了宽度学习系统原始架构对图像特征提取能力不足的缺点,而宽度学习架构以极小的时间代价提升了深度卷积网络的拟合程度,节省了大量的训练时间。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种新型多尺度深宽结合的病理图片分类方法的流程图;
图2为本发明实施例一种新型多尺度深宽结合的病理图片分类方法的结构图;
图3为本发明实施例宽度特征提取的示意图;
图4为本发明实施例一种新型多尺度深宽结合的病理图片分类系统的方框图;
图5为本发明实施例计算机可读存储介质的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
如图1、图2所示,本实施例提供的一种新型多尺度深宽结合的病理图片分类方法,包括以下步骤:
S1、多尺度病理切片采样,得到包含子图的样本组,具体为:
S101、利用颜色相关性算法生成组织掩码,利用区域标注生成不同癌变区域的掩码;
S102、利用组织掩码和癌变区域掩码生成非癌变区域掩码;
S103、在癌变区域掩码和非癌变区域掩码中生成采样中心点;
S104、利用采样中心点在全视野切片不同的放大倍率下,采集同样大小的图片块作为样本组;
更具体的,在全视野切片不同的放大倍率下采集的图片块具备不同的感受野;将同一个采样中心点下采集的不同放大倍率的图片块作为一个样本组,表示为:
Figure BDA0003208449180000061
一个样本组Xi对应一个分类标签Yi,即{Xi,Yi},其中一个样本组包含P个从不同放大倍率下获取的子图,Xi表示第i个样本组,i表示样本组序号,
Figure BDA0003208449180000062
表示第i个样本组中的子图,P为子图序号,n为样本数量,P是可选择的,通常使用最大的三个倍率下的尺度便可;
本实施例中采集同一个采样中心点三个放大倍率下的224×224分辨率图片块作为一个样本组,分别取得40×、20×、10×放大倍率下的图像块作为样本组子图。
S2、将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵,如图3所示,具体步骤为:
S201、对于输入的一个子图x,经过深度卷积模型的映射,在不同的卷积阶段中得到多张不同尺度的特征图,公式为:
f1,f2,……,fk=fCNN(x)
其中,f1,f2,……,fk为深度卷积模型每个卷积阶段输出的中间层特征图,总的卷积阶段数量为k,fCNN()表示特征提取器,即预训练好的深度卷积模型,本模型提前在不同尺度的单子图样本中进行预训练,训练后作为特征提取器不需要进行参数更新;
S202、不同深度的特征图含有不同的通道数量,经过一个全局平均池化的特征压缩过程使每个通道获得一个凝练的特征点,公式为:
Figure BDA0003208449180000063
其中,ek表示第k个特征图的特征点,fsqueeze()表示全局平均池化,把输入的多通道特征图压缩为一个特征向量,即每张单通道特征图得到一个全局平均值,由于多通道特征图中,每个通道含有一个二维的图,每个图被全局池化为一个值,所以最后这个特征向量的维度即为通道的数量;hk,wk分别代表第k个特征图的高和宽,fk(l,m)为第k个特征图,其中l,m为该特征图每个值的索引;
S203、并联所有深度特征点为一个宽度特征向量,表示为:
z=[e1,e2,……,ek]
其中,z为输入的子图x对应的宽度特征子向量,每个宽度特征节点为k个通道级别特征向量e组成;
S204、对于n个输入样本组中n×P个子图的宽度特征子向量进行整合,提取总的特征矩阵Ztotal,其表示为:
Figure BDA0003208449180000071
其中,n为样本组数量,P为每个样本组中所包含的子图个数,n×d为总的特征矩阵的维度,d为所有样本组得到的特征维度。
本实施例中使用的预训练好的深度卷积模型是提前预训练好的ResNet18模型,其作为特征提取器进行宽度特征提取;将每一个样本组包含的三个子图分别送入ResNet18中通过上述特征提取方法计算得到z1、z2和z3分别对应40×、20×和10×放大倍率子图的宽度特征节点;由于ResNet18拥有四个卷积阶段并且通道数量分别是64、128、256、512,因此每张子图对应的宽度特征节点的维度都是960维度,于是所有样本组可得到特征矩阵:
Figure BDA0003208449180000072
其中,n指的是样本组的数量。
S3、将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点,具体步骤为:
将特征矩阵中的特征节点通过一个随机全连接激活过程获得宽度增量节点,计算公式为:
H=f(ZtotalWenhanceenhance)
其中,Ztotal为步骤S2中得到的特征矩阵,Wenhance和βenhance分别是随机全连接激活的权重和阈值,是宽度学习中特殊的增强节点,其在初始化时随机生成,生成后固定并且不需要更新,f()为非线性激活函数sigmoid。
本实施例由特征矩阵指定映射210维的增量节点H。
S4、根据特征矩阵和宽度增强节点进行病理分型推理,具体为:
根据特征矩阵中的宽度特征节点和宽度增强节点映射输出节点;
把所有节点进行并联,得到总节点矩阵A,公式为:
A=[Ztotal,H]
其中,Ztotal为特征矩阵,H为宽度增强节点;
总节点矩阵A的维度为Rn×d,即样本组数量n并联每组输入的样本提取的特征d及增量节点后的维度;本实施例中的总节点矩阵的维度为n×(2880+210),也就是n×3090的维度;
将总节点矩阵输入所述预训练好的深度卷积模型中的最后一个全连接层,推理样本组的病理分型得到推理结果;
更具体的,将总节点矩阵划分为训练样本组Atrain和测试样本集Atest
根据伪逆值算法更新权重参数Wbls,计算训练样本集总节点矩阵的伪逆特征矩阵
Figure BDA0003208449180000081
Figure BDA0003208449180000082
其中,I为单位矩阵,λ为伪逆值算法常数值,
Figure BDA0003208449180000083
为Atrain的转置;
根据宽度学习系统伪逆值求解法计算输出层权重
Figure BDA0003208449180000084
其中Ytrain为对应输入训练样本集的标签;
求得病理分型的推理结果Ytest,公式为:
Ytest=AtestWbls
其中,Atest为测试集样本组所提取的特征矩阵。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
基于与上述实施例中的一种新型多尺度深宽结合的病理图片分类方法相同的思想,本发明还提供一种新型多尺度深宽结合的病理切片分类系统,该系统可用于执行上述一种新型多尺度深宽结合的病理切片分类方法。为了便于说明,一种新型多尺度深宽结合的病理切片分类系统实施例的结构示意图中,仅仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,在本申请的另一个实施例中,提供了一种新型多尺度深宽结合的病理切片分类系统100,该系统包括采样模块101、特征提取模块102、节点映射模块103、推理模块104;
采样模块101,用于多尺度病理切片采样,得到包含子图的样本组;
特征提取模块102,用于将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵;
节点映射模块103,用于将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;
推理模块104,用于根据特征矩阵和宽度增强节点进行病理分型推理。
需要说明的是,本发明的一种新型多尺度深宽结合的病理切片分类系统与本发明的一种新型多尺度深宽结合的病理切片分类方法一一对应,在上述一种新型多尺度深宽结合的病理切片分类方法的实施例阐述的技术特征及其有益效果均适用于一种新型多尺度深宽结合的病理切片分类系统的实施例中,具体内容可参见本发明方法实施例中的叙述,此处不再赘述,特此声明。
此外,上述实施例的一种新型多尺度深宽结合的病理切片分类系统的实施方式中,各程序模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的程序模块完成,即将所述一种新型多尺度深宽结合的病理切片分类系统的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分功能。
如图5所示,在一个实施例中,提供了一种计算机可读存储介质200,存储有程序于存储器201中,所述程序被处理器202执行时,实现所述的一种新型多尺度深宽结合的病理切片分类方法,具体为:
多尺度病理切片采样,得到包含子图的样本组;
将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵;
将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;
根据特征矩阵和宽度增强节点进行病理分型推理。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种新型多尺度深宽结合的病理图片分类方法,其特征在于,包括下述步骤:
多尺度病理切片采样,得到包含子图的样本组,具体步骤为:
利用颜色相关性算法生成组织掩码,利用区域标注生成不同癌变区域的掩码;
利用组织掩码和癌变区域掩码生成非癌变区域掩码;
在癌变区域掩码和非癌变区域掩码中生成采样中心点;
利用采样中心点在全视野切片不同的放大倍率下,采集同样大小的图片块作为样本组;
述在全视野切片不同的放大倍率下采集的图片块具备不同的感受野;
将同一个采样中心点下采集的不同放大倍率的图片块作为一个样本组,表示为:
Figure DEST_PATH_IMAGE001
一个样本组X i 对应一个分类标签Y i ,即{X i Y i },其中一个样本组包含P个从不同放大倍率下获取的子图,i表示样本组序号,
Figure 451056DEST_PATH_IMAGE002
表示第i个样本组中的子图,P为子图数量,n为样本数量;
将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵,具体步骤为:
对于输入的一个子图x,经过深度卷积模型的映射,在不同的卷积阶段中得到多张不同尺度的特征图,公式为:
Figure DEST_PATH_IMAGE003
其中,
Figure 864327DEST_PATH_IMAGE004
为深度卷积模型每个卷积阶段输出的中间层特征图,总的卷积阶段数量为k
Figure DEST_PATH_IMAGE005
表示特征提取器,即预训练好的深度卷积模型;
不同深度的特征图含有不同的通道数量,经过一个全局平均池化的特征压缩过程使每个通道获得一个凝练的特征点,公式为:
Figure 477711DEST_PATH_IMAGE006
其中,
Figure DEST_PATH_IMAGE007
表示第k个特征图的特征点,
Figure 637559DEST_PATH_IMAGE008
表示全局平均池化,把多通道特征图压缩为一个特征向量,即每张单通道特征图得到一个全局平均值,
Figure DEST_PATH_IMAGE009
分别代表第k个特征图的高和宽,
Figure 784113DEST_PATH_IMAGE010
为第k个特征图,其中lm为该特征图每个值的索引;
并联所有深度特征点为一个宽度特征向量,表示为:
Figure DEST_PATH_IMAGE011
其中,z为输入的子图x对应的宽度特征子向量,每个宽度特征节点为k个通道级别特征向量e组成;
对于n个输入样本组中
Figure 338591DEST_PATH_IMAGE012
个子图的宽度特征子向量进行整合,提取总的特征矩阵
Figure DEST_PATH_IMAGE013
,其表示为:
Figure 737474DEST_PATH_IMAGE014
其中,n为样本组数量,P为每个样本组中所包含的子图个数,
Figure DEST_PATH_IMAGE015
为总的特征矩阵的维度,d为所有样本组得到的特征维度;
将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;
根据特征矩阵和宽度增强节点进行病理分型推理,具体为:
根据特征矩阵中的宽度特征节点和宽度增强节点映射输出节点;
把所有节点进行并联,得到总节点矩阵A,公式为:
Figure 137231DEST_PATH_IMAGE016
其中,
Figure DEST_PATH_IMAGE017
为所述特征矩阵,H为宽度增强节点;
所述总节点矩阵A的维度为Rn×d,即样本组数量n并联每组输入的样本提取的特征d及增量节点后的维度;
将总节点矩阵输入所述预训练好的深度卷积模型中的最后一个全连接层,推理样本组的病理分型得到推理结果;
所述推理样本组病理分型得到推理结果,具体为:
将所述总节点矩阵划分为训练样本组A train 和测试样本集A test
根据伪逆值算法更新权重参数W bls ,计算训练样本集总节点矩阵的伪逆特征矩阵
Figure 403871DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
其中,I为单位矩阵,λ为伪逆值算法常数值,
Figure 598092DEST_PATH_IMAGE020
A train 的转置;
根据宽度学习系统伪逆值求解法计算输出层权重
Figure DEST_PATH_IMAGE021
,其中
Figure 953112DEST_PATH_IMAGE022
为对应输入训练样本集的标签;
求得病理分型的推理结果
Figure DEST_PATH_IMAGE023
,公式为:
Figure 687719DEST_PATH_IMAGE024
其中,A test 为测试集样本组所提取的特征矩阵。
2.根据权利要求1所述一种新型多尺度深宽结合的病理图片分类方法,其特征在于,所述预训练好的深度卷积模型提前在不同尺度的单子图样本中进行预训练,训练后的模型在此作为特征提取器不再需要进行参数更新。
3.根据权利要求1所述一种新型多尺度深宽结合的病理图片分类方法,其特征在于,所述将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点,具体为:
将特征矩阵中的特征节点通过一个随机全连接激活过程获得宽度增量节点,计算公式为:
Figure DEST_PATH_IMAGE025
其中,
Figure 808865DEST_PATH_IMAGE026
为所述特征矩阵,
Figure DEST_PATH_IMAGE027
Figure 501883DEST_PATH_IMAGE028
分别是随机全连接激活的权重和阈值,是宽度学习中特殊的增强节点,其在初始化时随机生成,生成后固定并且不需要更新,
Figure DEST_PATH_IMAGE029
为非线性激活函数sigmoid。
4.一种新型多尺度深宽结合的病理切片分类系统,其特征在于,应用于权利要求1-3中任一项所述的一种新型多尺度深宽结合的病理图片分类方法,包括采样模块、特征提取模块、节点映射模块、推理模块;
所述采样模块,用于多尺度病理切片采样,得到包含子图的样本组,具体为:利用颜色相关性算法生成组织掩码,利用区域标注生成不同癌变区域的掩码;利用组织掩码和癌变区域掩码生成非癌变区域掩码;在癌变区域掩码和非癌变区域掩码中生成采样中心点;利用采样中心点在全视野切片不同的放大倍率下,采集同样大小的图片块作为样本组;述在全视野切片不同的放大倍率下采集的图片块具备不同的感受野;将同一个采样中心点下采集的不同放大倍率的图片块作为一个样本组,表示为:
Figure 813041DEST_PATH_IMAGE001
一个样本组X i 对应一个分类标签Y i ,即{X i Y i },其中一个样本组包含P个从不同放大倍率下获取的子图,i表示样本组序号,
Figure 757864DEST_PATH_IMAGE002
表示第i个样本组中的子图,P为子图数量,n为样本数量;
所述特征提取模块,用于将样本组中的每个子图分别输入预训练好的深度卷积模型,进行宽度特征提取,得到特征矩阵,具体步骤为:
对于输入的一个子图x,经过深度卷积模型的映射,在不同的卷积阶段中得到多张不同尺度的特征图,公式为:
Figure 172664DEST_PATH_IMAGE030
其中,
Figure DEST_PATH_IMAGE031
为深度卷积模型每个卷积阶段输出的中间层特征图,总的卷积阶段数量为k
Figure 558557DEST_PATH_IMAGE032
表示特征提取器,即预训练好的深度卷积模型;
不同深度的特征图含有不同的通道数量,经过一个全局平均池化的特征压缩过程使每个通道获得一个凝练的特征点,公式为:
Figure 58808DEST_PATH_IMAGE033
其中,
Figure DEST_PATH_IMAGE034
表示第k个特征图的特征点,
Figure 308786DEST_PATH_IMAGE035
表示全局平均池化,把多通道特征图压缩为一个特征向量,即每张单通道特征图得到一个全局平均值,
Figure 374831DEST_PATH_IMAGE009
分别代表第k个特征图的高和宽,
Figure 550598DEST_PATH_IMAGE010
为第k个特征图,其中lm为该特征图每个值的索引;
并联所有深度特征点为一个宽度特征向量,表示为:
Figure 833418DEST_PATH_IMAGE011
其中,z为输入的子图x对应的宽度特征子向量,每个宽度特征节点为k个通道级别特征向量e组成;
对于n个输入样本组中
Figure DEST_PATH_IMAGE036
个子图的宽度特征子向量进行整合,提取总的特征矩阵
Figure 182360DEST_PATH_IMAGE037
,其表示为:
Figure DEST_PATH_IMAGE038
其中,n为样本组数量,P为每个样本组中所包含的子图个数,
Figure 869955DEST_PATH_IMAGE015
为总的特征矩阵的维度,d为所有样本组得到的特征维度;
所述节点映射模块,用于将特征矩阵通过随机全连接激活过程进行增量节点映射,得到宽度增强节点;
所述推理模块,用于根据特征矩阵和宽度增强节点进行病理分型推理,具体为:
根据特征矩阵中的宽度特征节点和宽度增强节点映射输出节点;
把所有节点进行并联,得到总节点矩阵A,公式为:
Figure 216623DEST_PATH_IMAGE039
其中,
Figure DEST_PATH_IMAGE040
为所述特征矩阵,H为宽度增强节点;
所述总节点矩阵A的维度为Rn×d,即样本组数量n并联每组输入的样本提取的特征d及增量节点后的维度;
将总节点矩阵输入所述预训练好的深度卷积模型中的最后一个全连接层,推理样本组的病理分型得到推理结果;
所述推理样本组病理分型得到推理结果,具体为:
将所述总节点矩阵划分为训练样本组A train 和测试样本集A test
根据伪逆值算法更新权重参数W bls ,计算训练样本集总节点矩阵的伪逆特征矩阵
Figure 753784DEST_PATH_IMAGE041
Figure DEST_PATH_IMAGE042
其中,I为单位矩阵,λ为伪逆值算法常数值,
Figure 467268DEST_PATH_IMAGE020
A train 的转置;
根据宽度学习系统伪逆值求解法计算输出层权重
Figure 445589DEST_PATH_IMAGE043
,其中
Figure 730202DEST_PATH_IMAGE022
为对应输入训练样本集的标签;
求得病理分型的推理结果
Figure DEST_PATH_IMAGE044
,公式为:
Figure 315510DEST_PATH_IMAGE045
其中,A test 为测试集样本组所提取的特征矩阵。
5.一种计算机可读存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1-3任一项所述的一种新型多尺度深宽结合的病理切片分类方法。
CN202110923812.3A 2021-08-12 2021-08-12 一种新型多尺度深宽结合的病理图片分类方法、系统及介质 Active CN113657479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110923812.3A CN113657479B (zh) 2021-08-12 2021-08-12 一种新型多尺度深宽结合的病理图片分类方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110923812.3A CN113657479B (zh) 2021-08-12 2021-08-12 一种新型多尺度深宽结合的病理图片分类方法、系统及介质

Publications (2)

Publication Number Publication Date
CN113657479A CN113657479A (zh) 2021-11-16
CN113657479B true CN113657479B (zh) 2022-12-06

Family

ID=78479513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110923812.3A Active CN113657479B (zh) 2021-08-12 2021-08-12 一种新型多尺度深宽结合的病理图片分类方法、系统及介质

Country Status (1)

Country Link
CN (1) CN113657479B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI836926B (zh) * 2023-03-03 2024-03-21 中山醫學大學 應用多面向並聯ai判讀架構判讀卵巢惡性腫瘤之方法
CN116741347B (zh) * 2023-05-12 2024-06-04 中山大学附属第一医院 一种病理图像patches提取与深度学习建模方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537227A (zh) * 2018-03-21 2018-09-14 华中科技大学 一种基于宽度学习和广角显微图像的商品离线鉴伪方法
CN108921877A (zh) * 2018-07-25 2018-11-30 大连海事大学 一种基于宽度学习的长期目标跟踪算法
CN110322969A (zh) * 2019-07-03 2019-10-11 北京工业大学 一种基于宽度学习的fMRI数据分类方法
CN110389663A (zh) * 2019-06-24 2019-10-29 广东工业大学 一种基于小波宽度学习系统的sEMG手势识别方法
CN110827255A (zh) * 2019-10-31 2020-02-21 杨本强 一种基于冠状动脉ct图像的斑块稳定性预测方法及系统
CN111160392A (zh) * 2019-12-03 2020-05-15 广东工业大学 一种基于小波宽度学习系统的高光谱分类方法
CN112308159A (zh) * 2020-11-05 2021-02-02 湖南科技大学 基于预测增量宽度学习的图像识别分类方法
CN112508192A (zh) * 2020-12-21 2021-03-16 华南理工大学 一种具有深度结构的增量堆叠式宽度学习系统
CN112561925A (zh) * 2020-12-02 2021-03-26 中国联合网络通信集团有限公司 图像分割方法、系统、计算机设备及存储介质
CN112766360A (zh) * 2021-01-15 2021-05-07 浙江工业大学 一种基于时序二维化和宽度学习的时间序列分类方法和系统
CN113052228A (zh) * 2021-03-22 2021-06-29 山西三友和智慧信息技术股份有限公司 一种基于SE-Inception的肝癌病理切片分类方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209825B (zh) * 2019-06-17 2021-02-12 大连海事大学 一种基于宽度学习系统的快速网络表征学习方法
CN112633482B (zh) * 2020-12-30 2023-11-28 广州大学华软软件学院 一种高效宽度图卷积神经网络模型系统及训练方法
CN112598080B (zh) * 2020-12-30 2023-10-13 广州大学华软软件学院 基于注意力的宽度图卷积神经网络模型系统及训练方法
CN113011493B (zh) * 2021-03-18 2023-03-21 华南理工大学 基于多核宽度学习脑电情绪分类方法、装置、介质及设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537227A (zh) * 2018-03-21 2018-09-14 华中科技大学 一种基于宽度学习和广角显微图像的商品离线鉴伪方法
CN108921877A (zh) * 2018-07-25 2018-11-30 大连海事大学 一种基于宽度学习的长期目标跟踪算法
CN110389663A (zh) * 2019-06-24 2019-10-29 广东工业大学 一种基于小波宽度学习系统的sEMG手势识别方法
CN110322969A (zh) * 2019-07-03 2019-10-11 北京工业大学 一种基于宽度学习的fMRI数据分类方法
CN110827255A (zh) * 2019-10-31 2020-02-21 杨本强 一种基于冠状动脉ct图像的斑块稳定性预测方法及系统
CN111160392A (zh) * 2019-12-03 2020-05-15 广东工业大学 一种基于小波宽度学习系统的高光谱分类方法
CN112308159A (zh) * 2020-11-05 2021-02-02 湖南科技大学 基于预测增量宽度学习的图像识别分类方法
CN112561925A (zh) * 2020-12-02 2021-03-26 中国联合网络通信集团有限公司 图像分割方法、系统、计算机设备及存储介质
CN112508192A (zh) * 2020-12-21 2021-03-16 华南理工大学 一种具有深度结构的增量堆叠式宽度学习系统
CN112766360A (zh) * 2021-01-15 2021-05-07 浙江工业大学 一种基于时序二维化和宽度学习的时间序列分类方法和系统
CN113052228A (zh) * 2021-03-22 2021-06-29 山西三友和智慧信息技术股份有限公司 一种基于SE-Inception的肝癌病理切片分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于宽度学习和深度集成的图像分类》;贾贺姿;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200215(第2期);第4.6节以及图4.7,第4.2.1节最后一段,第2.13节和第2.1.4节,第2.2.2节,第4.2.2节,图2.4 *

Also Published As

Publication number Publication date
CN113657479A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN109345575B (zh) 一种基于深度学习的图像配准方法及装置
CN110120040B (zh) 切片图像处理方法、装置、计算机设备和存储介质
CN113657479B (zh) 一种新型多尺度深宽结合的病理图片分类方法、系统及介质
CN111028923B (zh) 数字病理图像染色归一化方法、电子装置及存储介质
CN111951281B (zh) 图像分割方法、装置、设备及存储介质
CN113706487A (zh) 基于自监督特征小样本学习的多器官分割方法
Yan et al. A hybrid convolutional and recurrent deep neural network for breast cancer pathological image classification
CN110472049B (zh) 疾病筛查文本分类方法、计算机设备和可读存储介质
CN111583210A (zh) 基于卷积神经网络模型集成的乳腺癌图像自动识别方法
CN114841947A (zh) 肺腺癌h&e染色病理图像肿瘤区域多尺度特征提取与预后分析方法、装置
CN112837357B (zh) 医学影像配准方法、装置、计算机设备及存储介质
CN112434172A (zh) 一种病理图像预后特征权重计算方法及系统
CN113643269A (zh) 基于无监督学习的乳腺癌分子分型方法、装置及系统
CN111899259A (zh) 一种基于卷积神经网络的前列腺癌组织微阵列分级方法
CN110570394A (zh) 医学图像分割方法、装置、设备及存储介质
CN114783604A (zh) 一种乳腺癌前哨淋巴结转移的预测方法、系统及存储介质
CN109447147B (zh) 基于双图稀疏的深度矩阵分解的图像聚类方法
CN112990339A (zh) 胃病理切片图像分类方法、装置及存储介质
CN111783796A (zh) 一种基于深度特征融合的pet/ct影像识别系统
Lin et al. Looking from shallow to deep: Hierarchical complementary networks for large scale pest identification
CN115937590A (zh) 一种并联融合CNN和Transformer的皮肤病图像分类方法
CN116189785A (zh) 基于空间转录组学数据特征提取的空间域识别方法
CN114299342B (zh) 一种基于深度学习的多标记图片分类中未知标记分类方法
CN115115734A (zh) 基于结构分解和重染色的病理图像颜色标准化方法及装置
CN115760769A (zh) 一种基于改进cnn的乳腺病理图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant