CN110728666B - 基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统 - Google Patents

基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统 Download PDF

Info

Publication number
CN110728666B
CN110728666B CN201910951178.7A CN201910951178A CN110728666B CN 110728666 B CN110728666 B CN 110728666B CN 201910951178 A CN201910951178 A CN 201910951178A CN 110728666 B CN110728666 B CN 110728666B
Authority
CN
China
Prior art keywords
image
small
pathological
model
eosinophil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910951178.7A
Other languages
English (en)
Other versions
CN110728666A (zh
Inventor
杨钦泰
韩蓝青
任勇
吴庆武
陈健宁
邓慧仪
孙悦奇
袁联雄
王玮豪
郑瑞
洪海裕
孔维封
黄雪琨
袁田
邱惠军
李�权
黄桂芳
叶俊杰
王伦基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute Of Tsinghua Pearl River Delta
Third Affiliated Hospital Sun Yat Sen University
Original Assignee
Research Institute Of Tsinghua Pearl River Delta
Third Affiliated Hospital Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Institute Of Tsinghua Pearl River Delta, Third Affiliated Hospital Sun Yat Sen University filed Critical Research Institute Of Tsinghua Pearl River Delta
Priority to CN201910951178.7A priority Critical patent/CN110728666B/zh
Publication of CN110728666A publication Critical patent/CN110728666A/zh
Application granted granted Critical
Publication of CN110728666B publication Critical patent/CN110728666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Evolutionary Computation (AREA)
  • Neurology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Epidemiology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了基于数字病理玻片进行慢性鼻窦炎的分型方法,包括下列步骤:图像采集,对慢性鼻窦炎鼻息肉玻片获取到数字化病理图像并进行勾画,生成大掩膜图像;图像预处理,得到小病理图和小掩膜图;建立训练集数据;建立深度学习量化预测模块,采用Inception V3模型及其在ImageNet数据集上进行训练得到模型参数,去掉此模型最后一层全连接层FC,并增加一层全连接层FC且其内只有一个神经元,不采用任何激活函数,设置损失函数采用均方误差MSE,设置学习率lr;整合玻片上所有小病理图片的嗜酸性粒细胞比例值,得到最终辅助诊断结果。本发明还公开了其系统。本发明通过学习训练快速得到病理图片上的嗜酸性粒细胞占比值,给出客观的、准确性高的辅助诊断结果。

Description

基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统
技术领域
本发明涉及医学处理手段的技术领域,具体涉及一种基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统的技术。
背景技术
慢性鼻窦炎(CRS)在临床上可分为不伴鼻息肉(CRSsNP)和伴鼻息肉(CRSwNP)两类。慢性鼻窦炎伴鼻息肉(CRSwNP)又细分为嗜酸性粒细胞性鼻息肉(eCRSwNP)和非嗜酸性粒细胞性鼻息肉(neCRSwNP)两个亚型。嗜酸性粒细胞性鼻息肉(eCRSwNP)对激素治疗敏感,而非嗜酸性粒细胞性鼻息肉(neCRSwNP)则对大环内脂类抗生素治疗敏感。临床上,对于如何界定嗜酸性粒细胞性鼻息肉(eCRSwNP)和非嗜酸性粒细胞性鼻息肉(neCRSwNP),病理科医生通常随机采取患者鼻息肉玻片标本的10个高倍镜视野下嗜酸性粒细胞占比的平均值,并以10%为截点值这一诊断标准,得出分类诊断(≥10%为嗜酸性慢性鼻窦炎,<10%为非嗜酸性慢性鼻窦炎)。
但是,由于一个玻片标本通常包含数百上千的视野,标本不同位置的嗜酸性粒细胞占炎症细胞的比例会有较大抽样差异。申请人前期研究结果也表明,随机选取10个视野的抽样估计值与标本总体的真实值确实存在不少抽样误差。一个标本包含的视野越多,抽样误差也会越大。此外,不同医生因为经验不同,或者同一个医生不同时间,随机选取视野所得到的抽样估计值也不尽相同,即人工随机抽样计数还可能存在测量偏差。
对整个玻片标本进行嗜酸性粒细胞占炎症细胞比例的统计能够更加准确的诊断,避免抽样误差,然而病理科医生需要花费2~4小时才能完整统计一个玻片标本,时间成本极高。
临床上诊断慢性鼻窦炎,现阶段完全依靠病理科医生的经验,缺少一种客观的、较高的准确性和时效性的辅助诊断方法及其系统。
发明内容
为了解决现有技术的不足,本发明提供一种基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统,通过学习训练快速准确得到病理图片上的嗜酸性粒细胞占比值,给出客观的、准确性高的辅助诊断结果。
本发明通过以下技术方案来实现:
基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于包括下列步骤:
图像采集:
1)对慢性鼻窦炎鼻息肉玻片进行完整扫描获取到数字化病理图像;
2)将所述数字化病理图像勾画出病变区域,从而得到勾画区域,并将所述勾画区域的位置生成xml格式的文件进行保存;
3)生成一个与所述数字化病理图像的分辨率一致的大掩膜图像,并根据所述xml对其进行赋值,xml区域内为1,区域外为0,即勾画区域对应的像素值为1,其他区域对应的像素值为0;
图像预处理:
设置切图的图片分辨率,读取所述数字化病理图像和所述大掩膜图像,并按照所述设置的切图的图片分辨率分别对所述数字化病理图像和所述大掩膜图像进行切图,分别得到小病理图和小掩膜图,并且小病理图和小掩膜图的位置一一对应;计算每个小掩膜图的像素平均值P,并设定阈值G,并只保存小掩膜图的像素的平均值P≥G所对应的小病理图;若小掩膜图的像素的平均值P<G所对应的小病理图则丢弃,其中P,G取值范围均是0到1;所述大掩膜图、小掩膜图就是指mask图像,所述mask图像是将所述数字化病理图像中的病变区域的轮廓信息在坐标系中由x、y坐标值表示出来;
设计训练数据集:每张小病理图片记做X,统计每张小病理图片的嗜酸性粒细胞个数及所有炎症细胞个数,嗜酸性粒细胞占炎症细胞的比例=嗜酸性粒细胞个数/所有炎症细胞个数,统计的嗜酸性粒细胞数目N,非嗜酸性粒细胞数目M,每张图片对应的嗜酸性粒细胞比例S计算为:S=N/(N+M),取值范围0%~100%,其中没有嗜酸性粒细胞为0%,全是嗜酸性粒细胞为100%,对前述的所有小病理图片,按照设定的比例分成训练集数据和测试集数据;
建立深度学习量化预测模块:首先,采用深度学习keras框架下的Inception V3模型及其在ImageNet数据集上进行训练得到模型参数,该模型最后一层全连接层FC,有进行分类的神经元,并且采用softmax激活函数,去掉此模型所述的最后一层全连接层FC,并增加一层全连接层FC,该新增全连接层FC只有一个神经元,不采用任何激活函数,然后设置InceptionV3的模型的损失函数loss=‘mse’,即采用均方误差MSE,设置学习率lr,用ImageNet数据集训练得到的开源参数对InceptionV3模型进行参数初始化,最后用步骤(2)所述训练集数据重新训练InceptionV3模型的参数,训练次数设定为n轮,每一轮均用所述测试集数据进行测试,将测试图片输入当前得到的模型进行预测得到嗜酸性粒细胞比例的预测值P1,并将所述预测值P1与测试数据的真实标签值即所述嗜酸性粒细胞比例S,计算平均绝对误差MAE,即每个图片的所述预测值P1与所述嗜酸性粒细胞比例S之差的绝对值的平均值;将n轮中MAE最小时对应的模型参数进行保存,从而得到嗜酸性粒细胞占比模型,所述n为自然数,n大于1,按照前述训练次数的要求进行训练;整合玻片上所有小病理图片的嗜酸性粒细胞比例值,得到慢性鼻窦炎鼻息肉玻片的最终辅助诊断结果:设定玻片由N张小病理图片组成,N为自然数,分别由所述嗜酸性粒细胞占比模型训练得到每张小病理图片的嗜酸性粒细胞占比值Si,i为(1,N),则该玻片最终诊断结果为N个值的平均值,D=∑Si/N。
图像采集中步骤2)中使用开源的ASAP进行勾画,形成曲线围成的区域,所述勾画出病变区域的位置是指所述曲线的位置,所述ASAP是Automated silde analysisplatform,即自动玻片分析平台;图像采集中步骤3)中调用ASAP自带的“multiresolutionimageinterface”库,生成所述大掩膜图像;图像处理中采用开源的openslide软件进行切图处理。
所述设置切图的图片分辨率包括有256*256格式、512*512格式与1024*1024格式。
所述阈值G:0.8≤G<1。
利用所述得到的嗜酸性粒细胞占比模型对鼻息肉数字病理图像中任何一个分辨率不超过1024*1024的小病理图片给出嗜酸性粒细胞比例值,范围是0%~100%。
建立深度学习量化预测模块中,按下表进行设计:
表中conv表示卷积核为卷积层,pool表示池化层,Inception代表模型模块,FC代表全连接层,softmax代表分类的激活函数,(3*3)代表卷积核大小,(8*8)代表池化核的大小,1000代表1000个神经元,1代表1个神经元。
Figure GDA0003699211030000041
一种基于所述基于数字病理玻片进行慢性鼻窦炎的分型方法的系统,其特征在于包括下列模块:
图像采集模块:对慢性鼻窦炎鼻息肉玻片进行完整扫描获取到数字化病理图像WSI,通过开源的自动玻片分析平台ASAP软件,勾画出病变区域得到勾画区域,并将所述勾画区域的位置生成xml格式的文件进行保存;
图像预处理模块:设置切图的图片分辨率,读取所述数字化病理图像和大掩膜图像,并按照所述设置的切图的图片分辨率分别对所述数字化病理图像和所述大掩膜图像进行切图,分别得到小病理图和小掩膜图,并且小病理图和小掩膜图的位置一一对应;计算每个小掩膜图的像素平均值P,并设定阈值G,并只保存小掩膜图的像素的平均值P≥G所对应的小病理图;若小掩膜图的像素的平均值P<G所对应的小病理图则丢弃,其中P,G取值范围均是0到1,所述大掩膜图、小掩膜图就是指mask图像,所述mask图像是将所述数字化病理图像中的病变区域的轮廓信息在坐标系中由x、y坐标值表示出来;
训练数据集设计模块:针对每张小病理图进行统计嗜酸性粒细胞数目N,非嗜酸性粒细胞数目M,每张图片对应的嗜酸性粒细胞比例S计算为:S=N/(N+M),取值范围0%~100%,其中没有嗜酸性粒细胞为0%,全是嗜酸性粒细胞为100%,对前述的所有小病理图片,按照设定的比例分成训练集数据和测试集数据;
深度学习量化预测模块:采用深度学习keras框架下的Inception V3模型及其在ImageNet数据集上进行训练得到模型参数,该模型最后一层全连接层FC,有进行分类的神经元,并且采用softmax激活函数,去掉此模型所述的最后一层全连接层FC,并增加一层全连接层FC,该新增全连接层FC只有一个神经元,不采用任何激活函数;设置InceptionV3的模型的损失函数loss=‘mse’,即采用均方误差MSE,设置学习率lr,用ImageNet数据集训练得到的开源参数对InceptionV3模型进行参数初始化;用所述训练集数据重新训练InceptionV3模型的参数,训练次数设定为n轮,每一轮均用所述测试集数据进行测试,将测试图片输入当前得到的模型进行预测得到嗜酸性粒细胞比例的预测值P1,并将所述预测值P1与测试数据的真实标签值即所述嗜酸性粒细胞比例S,计算平均绝对误差MAE,即每个图片的所述预测值P1与所述嗜酸性粒细胞比例S之差的绝对值的平均值;将n轮中MAE最小时对应的模型参数进行保存,从而得到嗜酸性粒细胞占比模型,所述n为自然数,n大于1时,按照前述训练次数的要求进行训练;
结果输出模块:利用所述得到的嗜酸性粒细胞占比模型对鼻息肉数字病理图像中每一个小病理图片给出嗜酸性粒细胞比例值,整合所有小病理图片的嗜酸性粒细胞比例值,得到慢性鼻窦炎鼻息肉玻片的最终辅助诊断结果。
本发明的有益效果是:
本发明的核心由于是利用鼻息肉病理图片建立了嗜酸性粒细胞占比模型,因此只要将鼻息肉制作成玻片,然后通过数字病理仪扫描得到WSI图,将WSI进行切图,得到小病理图片,由所述嗜酸性粒细胞占比模型训练得到每张小病理图片的嗜酸性粒细胞占比值Si,i为(1,N),则该玻片最终诊断结果为N个值的平均值,D=∑Si/N,故可以通过学习训练,快速准确得到病理图片上的嗜酸性粒细胞占比值。
鉴于现有临床病理学采用对慢性鼻窦炎鼻息肉玻片标本进行随机抽样得出的诊断可能存在漏诊及误诊这一现状,本发明采用监督式深度学习回归算法,能够基于数字病理玻片对慢性鼻窦炎患者进行准确且快速地诊断,判断其是否为嗜酸性。根据临床实际比较,本发明的辅助诊断结果与“金标准”完全符合,而临床上现有的随机抽样的方法有20%以上的可能性存在漏诊或误诊。另一方面,本发明所述系统能够在5分钟内得出对整个鼻息肉玻片的诊断结果,而医生需要花费2~4小时,因此本发明所述系统具有很高效率。最后,本发明所述系统支持外地医院远程阅片,远程诊断,可以大幅度提高基层医联体医院的鼻息肉病理诊断水平,具有极强的社会效益。
附图说明
图1为本发明流程图;
图2为本发明系统图;
图3为本发明系统模块示意图;
图4为本发明病理WSI勾画示意图。
图5为本发明生成的mask示意图即掩膜图;
图6为本发明诊断正确对比图;
图7为本发明慢性鼻窦炎深度学习流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明基于数字病理玻片进行慢性鼻窦炎的分型方法,主要包括下列技术措施:
(一)病理图片的处理,包括下列步骤:
图像采集:
1)对慢性鼻窦炎鼻息肉玻片进行完整扫描获取到数字化病理图像;
2)将所述数字化病理图像勾画出病变区域,从而得到勾画区域,并将所述勾画区域的位置生成xml格式的文件进行保存;
3)生成一个与所述数字化病理图像的分辨率一致的mask图像即大掩膜图像,并根据所述xml对其进行赋值,xml区域内为1,区域外为0,即勾画区域对应的像素值为1,其他区域对应的像素值为0。
图像处理:
设置切图的图片分辨率,一般设置的格式256*256,512*512,1024*1024三种,读取所述数字化病理图像和所述大掩膜图像,并按照所述设置的切图的图片分辨率分别对所述数字化病理图像和所述大掩膜图像进行切图,分别得到小病理图和小掩膜图,并且小病理图和小掩膜图的位置一一对应;计算每个小掩膜图的像素平均值P,并设定阈值G,并只保存小掩膜图的像素的平均值P≥G所对应的小病理图;若小掩膜图的像素的平均值P<G所对应的小病理图则丢弃;阈值G越接近1,则保存的小病理图中病变区域占比越高,阈值G越接近0,则保存的小病理图中病变区域占比越低。其中P,G取值范围均是0到1,一般0.8≤G<1;小掩膜图与大掩膜图像均是mask图像,mask图像即是将所述数字化病理图像的病变区域的轮廓信息在坐标系中由x、y坐标值表示出来。阈值G就是像素平均值P的取值范围,为便于表述而给出的一个专业术语。
图像采集中步骤2)中使用开源的ASAP进行勾画,形成曲线围成的区域,所述勾画出病变区域的位置是指所述曲线的位置,所述ASAP是Automated silde analysisplatform,即自动玻片分析平台。图像采集中步骤3)中调用ASAP自带的“multiresolutionimageinterface”库,生成大掩膜图像。图像处理中采用开源的openslide软件进行切图处理。
下面结合附图更加详细说明。
首先通过开源的ASAP(Automated silde analysis platform,自动玻片分析平台)软件,由病理科医生对数字化病理图像(WSI,whole slide image)勾画出病变区域,如图4为病理WSI勾画示意图,即勾画区域:曲线围成的区域;勾画区域的位置由生成的xml格式的文件保存。
接下来,调用ASAP自带的“multiresolutionimageinterface”库(https://github.com/computationalpathologygroup/ASAP),根据xml生成大掩膜图,如图5为生成的mask示意图即掩膜图,掩膜图白色区域(勾画区域)对应的像素值为1,黑色的其他区域对应的像素值为0,整个掩膜图的分辨率与WSI图即数字病理玻片(whole slide image)相同。
接着用开源的“openslide”库(https://openslide.org/)读取WSI,和对应的大掩膜图,并按照设置的分辨率如512*512分别对WSI和对应的大掩膜图进行切图,分别得到小病理图和小掩膜图,并且小病理图和小掩膜图的位置是一一对应的。
最后,按照设定的小图片分辨率,用滑动窗口将原始的WSI及对应的大掩膜图切成数个小病理图片和小掩膜图片,分别计算每个小掩膜图的像素平均值P(范围0到1),并设定阈值G(范围0到1),并只保存小掩膜图像素的平均值P≥G所对应的小病理图,而小掩膜图的像素的平均值P<G所对应的小病理图则丢弃。
简而言之,本发明病理图片的处理,即是自动切图算法:将传统玻片通过数字病理扫描仪数字化后的WSI影像通常有2~4GB,最大分辨率对应约上亿个像素点。首先通过开源的ASAP软件,请病理科医生勾画出感兴趣区域(ROI区域),生成xml文件,然后用multiresolutionimageinterface库生成此区域对应的掩膜(mask),接着用开源的openslide库确定需要切图的放大倍数(level)及图片分辨率,最后按照按照确定的level及分辨率在mask区域自动切图,比如一张数字病理WSI的ROI区域在level=0时可以自动切出数千到上万张256*256分辨率的图片。
综合运用以上方法,这样就能够对一张慢性鼻窦炎鼻息肉玻片的原始的WSI图,在医生把需要分析的区域勾出后,自动进行生成掩膜,切图,最后只保存感兴趣区域的小病理图,方便后面的深度学习训练模块处理。
上述病理图片的处理方法,通过下列模块处理:
图像采集模块:首先得到慢性鼻窦炎鼻息肉玻片的数字化病理图像(WSI,wholeslide image)。倍数≥400倍,分辨率≥20000*20000像素。然后病理科医生通过开源的ASAP软件,勾画出鼻息肉玻片中固有层的区域,通过XML格式的文件进行保存。
图像预处理模块:基于ASAP软件再次读取XML文件,生成一个与原数字病理图像分辨率一致的掩膜图像层,如图2,掩膜层即前述的掩膜图的像素设为1,掩膜层区域以外设为0。然后采用滑动窗口按照分辨率为1024*1024,或者512*512的窗口依次对整个数字病理图像进行扫描,计算掩膜层该窗口的平均像素值P(范围0到1),及设定的阈值G,一般0.8≤G<1,若G≥0.8,则调用opensilde软件(https://openslide.org/)对该掩膜窗口对应的病理数字图像进行切图得到相应的小图片即小病理图并保存。保存的小图片分辨率为1024*1024,或者512*512。
总之,本发明将传统玻片通过数字病理扫描仪数字化后的WSI影像通常有2~4GB,最大分辨率对应约上亿个像素点,首先通过开源的ASAP(Automated silde analysisplatform,自动玻片分析平台,https://github.com/computationalpathologygroup/ ASAP)软件,由病理科医生勾画出感兴趣区域(ROI区域),生成xml文件,然后用multiresolutionimageinterface库生成此区域对应的掩膜(mask),接着用开源的openslide(https://openslide.org/)库确定需要切图的放大倍数(level)及图片分辨率,最后按照确定的level及分辨率在mask区域自动切图,比如一张数字病理WSI的ROI区域在level=0时可以自动切出数千到上万张256*256分辨率的图片,方便后面的深度学习算法模块处理。
(二)利用鼻息肉病理图片建立嗜酸性粒细胞占比模型的方法,包括下列步骤:
(1)数据准备:通过前述病理图片的处理得到数字化病理图像WSI的小病理图片;
(2)数据标记:每张小病理图片记做x,统计每张小病理图片的嗜酸性粒细胞个数及所有炎症细胞个数,嗜酸性粒细胞占炎症细胞的比例=嗜酸性粒细胞个数/所有炎症细胞个数,统计的嗜酸性粒细胞数目N,非嗜酸性粒细胞数目M,每张图片对应的嗜酸性粒细胞比例S计算为:S=N/(N+M),取值范围0%~100%,其中没有嗜酸性粒细胞为0%,全是嗜酸性粒细胞为100%,对前述的所有小病理图片,按照设定的比例分成训练集数据和测试集数据,最为常用的训练集数据和测试集数据的设定比例是9:1或8:2,本比例设计,仅仅是举例,根据实际情况进行设置;
(3)建模算法:首先,采用深度学习keras框架下的Inception V3模型及其在ImageNet数据集上进行训练得到模型参数,该模型最后一层全连接层FC,有1000个神经元,采用softmax激活函数,用于对自然界1000类进行分类,然后去掉此模型最后一层,并增加一层全连接层FC,该新增全连接层FC只有一个神经元,不采用任何激活函数,然后设置InceptionV3的模型的损失函数loss=‘mse’,即采用均方误差MSE(mean square error),设置学习率lr=0.0008(经验值),用ImageNet数据集(此数据集是开源的非医学数据集)训练得到的开源参数对InceptionV3模型进行参数初始化(在keras框架汇中以hdf5格式存在),最后用所述训练集数据重新训练InceptionV3模型的参数,训练次数设定为训练次数设定为n轮,所述n为自然数,n大于1,按照前述训练次数的要求进行训练,例如训练次数设定为50-200轮或其它设计值,每一轮均用所述测试集数据进行测试,将测试图片输入当前得到的模型(参数)进行预测得到嗜酸性粒细胞比例的预测值P1,并将预测值P1与测试数据的真实标签值S即所述嗜酸性粒细胞比例S,计算平均绝对误差MAE(mean absoluteerror),即每个图片的预测值P1与真实标签值S之差的绝对值的平均值。将100轮中MAE最小时对应的模型参数以hdf5格式进行保存,从而得到一个嗜酸性粒细胞占比模型。
利用所述得到的嗜酸性粒细胞占比模型对鼻息肉数字病理图像中每一个分辨率不超过1024*1024的小病理图片给出嗜酸性粒细胞比例值,范围是0%~100%。
步骤(3)建模算法中,按下表进行设计:
Figure GDA0003699211030000101
表中conv表示卷积核为卷积层,pool表示池化层,Inception代表模型模块,FC代表全连接层,softmax代表分类的激活函数,(3*3)代表卷积核大小,(8*8)代表池化核的大小,1000代表1000个神经元,1代表1个神经元。
整合玻片上所有小图片的嗜酸性粒细胞比例值,得到玻片的最终辅助诊断结果,设定玻片由N张小病理图片组成,N为自然数,分别由所述嗜酸性粒细胞占比模型训练得到每张小病理图片的嗜酸性粒细胞占比值Si,i为(1,N),则该玻片最终诊断结果为N个值的平均值,D=∑Si/N。N为1时,表示挑选1张小病理图片,实际中是有很多小病理图片组成,通过平均值D会得到更加准确的结果。
可见本发明采用监督式深度学习方法,数据是鼻息肉数字病理WSI经过切图模块得到的众多图片,每张图片X都可由三名病理科医生统计得到嗜酸性粒细胞占炎症细胞的比例值,将这个值作为此图片的标签y,将这样的一对(x,y)数据输入深度学习算法进行训练得到模型。具体算法是首先,采用开源的Inception V3(https://keras.io/ applications/#inceptionv3)模型,并加载此模型在ImageNet(http://www.image- net.org/)数据集上已经训练好的参数,可以对自然界1000类物体进行分类,然后,采用迁移学习技术,去掉此模型最后一层,并增加只包含一个神经元的全连接层,不采用激活函数,损失函数改为均方差(MSE),学习率(lr)设为0.0008,采用此回归算法建立一个可预测鼻息肉病理图片的嗜酸性粒细胞占比的模型。
采用了上述监督式深度学习回归算法建立了人工智能模型,对每个小图片(patch)的嗜酸性粒细胞占炎症细胞比例进行预测,最后综合所有小图片(patch)得到患者一张数字病理图片的最终嗜酸性粒细胞占炎症细胞比例。
本发明基于数字病理玻片(whole slide image),能够对整个玻片进行完整扫描,鉴于一张数字病理玻片约2~4GB,当前GPU无法直接处理,利用本发明的切图算法,可将一张数字病理分割为数百至数千张任意分辨率的小图片(patch),其次,采用监督式深度学习回归算法建立了人工智能模型即嗜酸性粒细胞占比模型对每个小图片(patch)的嗜酸性粒细胞占炎症细胞比例进行预测,最后综合所有小图片(patch)得到患者一张数字病理图片的最终嗜酸性粒细胞占炎症细胞比例。
图1为本发明流程图,鼻息肉手术;制作病理玻片;数字病理扫描仪数字化后的WSI影像,即数字病理玻片图像;切图后得到的数百至数千张任意分辨率的小图片(patch),即图片(1)、图片(2)、图片(3)...;监督式深度学习回归模型即所述嗜酸性粒细胞占比的模型;利用所述嗜酸性粒细胞占比的模型进行学习训练得到预测值,即预测(1)、预测(2)、预测(3)...;最后,得到基于数字病理玻片的诊断结果。
图3为本发明系统模块示意图;(1)慢性鼻窦炎鼻息肉玻片数字图像;(2)对鼻息肉玻片数字图像进行勾画、生成小图片即小病理图;(3)基于深度学习量化预测模块即利用所述嗜酸性粒细胞占比模型,对每个小图片预测嗜酸性粒细胞数目占比;(4)结果输出模块,综合所有小图片预测结果得出最终结果。
如图6,诊断正确对比图:横轴代表参与测试的患者(共16人),纵轴是嗜酸性粒细胞占比值(取值范围是0%~100%),红色水平的虚线指的是临床诊断标准(≥10%为嗜酸性鼻窦炎,<为非嗜酸性)。患者的鼻息肉嗜酸性粒细胞的真实值是金标准(蓝色线),通过本发明预测的(黄色线)均能准确诊断患者,而在医生随机选择10个视野小图片诊断时(黑点),有可能存在误诊(红圈)或漏诊(漏诊)。
针对图6的诊断正确对比图,下面更加详细描述:基于数字病理玻片整体统计,能够更准确的诊断患者是否为嗜酸性慢性鼻窦炎,而传统临床诊断方法由于是抽样统计可能存在漏诊和误诊(尤其是在10%的诊断分界线附近)。
横轴是16个患者,纵轴是嗜酸性粒细胞占比,红色虚线是10%的诊断线,高于它代表诊断为嗜酸性,低于它代表非嗜酸性,蓝色线是医生对整个玻片统计后得出的真实的嗜酸性粒细胞占比值,橙色是本发明的深度学习的方法得到的嗜酸性粒细胞占比值,每个病人对应50个黑点,每个黑点代表从医生随机选择10个位置进行抽样统计。举例:对于ID为6的患者,真实的(蓝色)值是小于10%,本发明的方法得出的值也是小于10%,因此都是正确诊断为非嗜酸性患者,然而对于医生随机抽样(黑点),有的黑点却超过了10%,代表误诊为嗜酸性。同样,对于ID为8的患者,真实的(蓝色)值是大于10%,本发明的方法得出的值也是大于10%,因此都是正确诊断为嗜酸性患者,然而对于医生随机抽样(黑点),有个黑点却低于10%,代表误诊为非嗜酸性。
如图7,是将小图片1和小图片2输入慢性鼻窦炎深度学习预测模型,输出将分别得到小图片1和小图片2的嗜酸性粒细胞占比值。
下面是三种方法所需时间对比表,采用现有的医生随机抽样10个点所需时间约12分钟,采用医生人工对整个玻片进行完整统计所需时间约150分钟,而采用我们的深度学习的方法对整个玻片进行统计只需要约5分钟。
Figure GDA0003699211030000121
综上所述,本发明有如下优点:
本发明第一个优点是:基于数字病理玻片整体统计,能够更准确的诊断患者是否为嗜酸性慢性鼻窦炎,而传统临床诊断方法由于是抽样统计可能存在漏诊和误诊(尤其是在10%的诊断分界线附近)。
本发明第二个优点是:基于Nvidia-DGX的GPU超算平台,可以实现5分钟内完成一个数字病理玻片的完成统计,而病理科医生需要2~4小时,具有极高时效性。
本发明第三个优点是:如图2,外地医院玻片与本院玻片的应用图,本院利用光纤高速互联网,可以为基层医疗机构即外地医院进行慢性鼻窦炎数字病理玻片远程阅片,远程诊断,提高基层医疗机构慢性鼻窦炎诊断能力。
以上所述仅为发明较佳的实施例,并非因此限制本发明的申请专利范围,所以凡运用本发明说明书及图示内容所作出的等效结构变化,均包含在本发明的保护范围内。

Claims (7)

1.一种基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于包括下列步骤:
图像采集:
1)对慢性鼻窦炎鼻息肉玻片进行完整扫描获取到数字化病理图像;
2)将所述数字化病理图像勾画出病变区域,从而得到勾画区域,并将所述勾画区域的位置生成xml格式的文件进行保存;
3)生成一个与所述数字化病理图像的分辨率一致的大掩膜图像,并根据所述xml对其进行赋值,xml区域内为1,区域外为0,即勾画区域对应的像素值为1,其他区域对应的像素值为0;
图像预处理:
设置切图的图片分辨率,读取所述数字化病理图像和所述大掩膜图像,并按照所述设置的切图的图片分辨率分别对所述数字化病理图像和所述大掩膜图像进行切图,分别得到小病理图和小掩膜图,并且小病理图和小掩膜图的位置一一对应;计算每个小掩膜图的像素平均值P,并设定阈值G,并只保存小掩膜图的像素的平均值P≥G所对应的小病理图;若小掩膜图的像素的平均值P<G所对应的小病理图则丢弃,其中P,G取值范围均是0到1;
所述大掩膜图、小掩膜图均指mask图像,mask图像是将所述数字化病理图像中的病变区域的轮廓信息在坐标系中由x、y坐标值表示出来;
设计训练数据集:每张小病理图片记做X,统计每张小病理图片的嗜酸性粒细胞个数及所有炎症细胞个数,嗜酸性粒细胞占炎症细胞的比例=嗜酸性粒细胞个数/所有炎症细胞个数,统计的嗜酸性粒细胞数目N,非嗜酸性粒细胞数目M,每张图片对应的嗜酸性粒细胞比例S计算为:S=N/(N+M),取值范围0%~100%,其中没有嗜酸性粒细胞为0%,全是嗜酸性粒细胞为100%,对前述的所有小病理图片,按照设定的比例分成训练集数据和测试集数据;
建立深度学习量化预测模块:首先,采用深度学习keras框架下的Inception V3模型及其在ImageNet数据集上进行训练得到模型参数,该模型最后一层全连接层FC,其内有进行分类的神经元,并且采用softmax激活函数,去掉此模型所述的最后一层全连接层FC,并增加一层全连接层FC,新增全连接层FC只有一个神经元,不采用任何激活函数,然后设置InceptionV3的模型的损失函数loss=‘mse’,即采用均方误差MSE,设置学习率lr,用ImageNet数据集训练得到的开源参数对InceptionV3模型进行参数初始化,最后用所述训练集数据重新训练InceptionV3模型的参数,训练次数设定为n轮,每一轮均用所述测试集数据进行测试,将测试图片输入当前得到的模型进行预测得到嗜酸性粒细胞比例的预测值P1,并将所述预测值P1与测试数据的真实标签值即所述嗜酸性粒细胞比例S,计算平均绝对误差MAE,即每个图片的所述预测值P1与所述嗜酸性粒细胞比例S之差的绝对值的平均值;将n轮中MAE最小时对应的模型参数进行保存,从而得到嗜酸性粒细胞占比模型,所述n为自然数,且n大于1,按照前述训练次数的要求进行训练;
整合玻片上所有小病理图片的嗜酸性粒细胞比例值,得到慢性鼻窦炎鼻息肉玻片的最终辅助诊断结果:设定所述慢性鼻窦炎鼻息肉玻片由N张小病理图片组成,N为自然数,分别由所述嗜酸性粒细胞占比模型训练得到每张小病理图片的嗜酸性粒细胞占比值Si,i为(1,N),则该玻片最终诊断结果为N个值的平均值,D=∑Si/N。
2.根据权利要求1所述基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于:
图像采集中步骤2)中使用开源的ASAP进行勾画,形成曲线围成的区域,所述勾画出病变区域的位置是指所述曲线的位置,所述ASAP是Automated silde analysis platform,即自动玻片分析平台;图像采集中步骤3)中调用ASAP自带的“multiresolutionimageinterface”库,生成所述大掩膜图像;图像预处理中采用开源的openslide软件进行切图处理。
3.根据权利要求1所述基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于:所述设置切图的图片分辨率包括有256*256格式、512*512格式与1024*1024格式。
4.根据权利要求1所述基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于所述阈值G:0.8≤G<1。
5.根据权利要求1所述基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于:利用所述得到的嗜酸性粒细胞占比模型对鼻息肉数字病理图像中任何一个分辨率不超过1024*1024的小病理图片给出嗜酸性粒细胞比例值,范围是0%~100%。
6.根据权利要求1所述基于数字病理玻片进行慢性鼻窦炎的分型方法,其特征在于:建立深度学习量化预测模块中,按下表进行设计:
Figure FDA0003699211020000031
表中conv表示卷积核为卷积层,pool表示池化层,Inception代表模型模块,FC代表全连接层,softmax代表分类的激活函数,(3*3)代表卷积核大小,(8*8)代表池化核的大小,1000代表1000个神经元,1代表1个神经元。
7.一种基于权利要求1所述基于数字病理玻片进行慢性鼻窦炎的分型方法的系统,其特征在于包括下列模块:
图像采集模块:对慢性鼻窦炎鼻息肉玻片进行完整扫描获取到数字化病理图像WSI,通过开源的自动玻片分析平台ASAP软件,勾画出病变区域得到勾画区域,并将所述勾画区域的位置生成xml格式的文件进行保存;
图像预处理模块:设置切图的图片分辨率,读取所述数字化病理图像和大掩膜图像,并按照所述设置的切图的图片分辨率分别对所述数字化病理图像和所述大掩膜图像进行切图,分别得到小病理图和小掩膜图,并且小病理图和小掩膜图的位置一一对应;计算每个小掩膜图的像素平均值P,并设定阈值G,并只保存小掩膜图的像素的平均值P≥G所对应的小病理图;若小掩膜图的像素的平均值P<G所对应的小病理图则丢弃,其中P,G取值范围均是0到1,所述大掩膜图、小掩膜图就是指mask图像,所述mask图像是将所述数字化病理图像中的病变区域的轮廓信息在坐标系中由x、y坐标值表示出来;
训练数据集设计模块:针对每张小病理图进行统计嗜酸性粒细胞数目N,非嗜酸性粒细胞数目M,每张图片对应的嗜酸性粒细胞比例S计算为:S=N/(N+M),取值范围0%~100%,其中没有嗜酸性粒细胞为0%,全是嗜酸性粒细胞为100%,对前述的所有小病理图片,按照设定的比例分成训练集数据和测试集数据;
深度学习量化预测模块:采用深度学习keras框架下的Inception V3模型及其在ImageNet数据集上进行训练得到模型参数,该模型最后一层全连接层FC,有进行分类的神经元,并且采用softmax激活函数,去掉此模型所述的最后一层全连接层FC,并增加一层全连接层FC,新增全连接层FC只有一个神经元,不采用任何激活函数;设置InceptionV3的模型的损失函数loss=‘mse’,即采用均方误差MSE,设置学习率lr,用ImageNet数据集训练得到的开源参数对InceptionV3模型进行参数初始化;用所述训练集数据重新训练InceptionV3模型的参数,训练次数设定为n轮,每一轮均用所述测试集数据进行测试,将测试图片输入当前得到的模型进行预测得到嗜酸性粒细胞比例的预测值P1,并将所述预测值P1与测试数据的真实标签值即所述嗜酸性粒细胞比例S,计算平均绝对误差MAE,即每个图片的所述预测值P1与所述嗜酸性粒细胞比例S之差的绝对值的平均值;将n轮中MAE最小时对应的模型参数进行保存,从而得到嗜酸性粒细胞占比模型,所述n为自然数,n大于1,按照前述训练次数的要求进行训练;
结果输出模块:利用所述得到的嗜酸性粒细胞占比模型对鼻息肉数字病理图像中每一个小病理图片给出嗜酸性粒细胞比例值,整合所有小病理图片的嗜酸性粒细胞比例值,得到慢性鼻窦炎鼻息肉玻片的最终辅助诊断结果。
CN201910951178.7A 2019-10-08 2019-10-08 基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统 Active CN110728666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910951178.7A CN110728666B (zh) 2019-10-08 2019-10-08 基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910951178.7A CN110728666B (zh) 2019-10-08 2019-10-08 基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统

Publications (2)

Publication Number Publication Date
CN110728666A CN110728666A (zh) 2020-01-24
CN110728666B true CN110728666B (zh) 2022-08-02

Family

ID=69220728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910951178.7A Active CN110728666B (zh) 2019-10-08 2019-10-08 基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统

Country Status (1)

Country Link
CN (1) CN110728666B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113436206B (zh) * 2021-06-17 2022-03-15 易普森智慧健康科技(深圳)有限公司 一种基于聚类分割的病理组织切片扫描区域定位方法
CN113591919B (zh) * 2021-06-29 2023-07-21 复旦大学附属中山医院 基于ai对早期肝细胞癌术后复发预后的分析方法及系统
CN114240836B (zh) * 2021-11-12 2024-06-25 杭州迪英加科技有限公司 一种鼻息肉病理切片分析方法、系统和可读存储介质
CN117793479B (zh) * 2023-12-26 2024-05-14 北京中科大洋科技发展股份有限公司 一种平滑过渡视频掩膜快速生成方法
CN117994595A (zh) * 2024-04-07 2024-05-07 首都医科大学附属北京儿童医院 一种鼻窦炎的分析方法和相关设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108771530B (zh) * 2017-05-04 2021-03-30 深圳硅基智能科技有限公司 基于深度神经网络的眼底病变筛查系统
CN107633255B (zh) * 2017-08-11 2021-05-25 天津大学 一种深度学习模式下的岩石岩性自动识别分类方法
CN108288506A (zh) * 2018-01-23 2018-07-17 雨声智能科技(上海)有限公司 一种基于人工智能技术的癌症病理辅助诊断方法
CN108596882B (zh) * 2018-04-10 2019-04-02 中山大学肿瘤防治中心 病理图片的识别方法及装置
CN108564123B (zh) * 2018-04-10 2021-11-02 复旦大学附属肿瘤医院 一种甲状腺肿瘤细胞学涂片图像分类方法及其装置
CN109815974A (zh) * 2018-12-10 2019-05-28 清影医疗科技(深圳)有限公司 一种细胞病理玻片分类方法、系统、设备、存储介质
CN109754398A (zh) * 2019-01-14 2019-05-14 武汉兰丁医学高科技有限公司 一种基于计算机的骨髓白细胞自动标记方法及系统
CN110084803B (zh) * 2019-04-29 2024-02-23 靖松 基于人类视觉系统的眼底图像质量评估方法

Also Published As

Publication number Publication date
CN110728666A (zh) 2020-01-24

Similar Documents

Publication Publication Date Title
CN110728666B (zh) 基于数字病理玻片进行慢性鼻窦炎的分型方法及其系统
WO2021104410A1 (zh) 血涂片全视野智能分析方法血细胞分割模型及识别模型的构造方法
CN109670510B (zh) 一种基于深度学习的胃镜活检病理数据筛查系统
CN112101451B (zh) 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法
WO2021139258A1 (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
CN108288506A (zh) 一种基于人工智能技术的癌症病理辅助诊断方法
CN108596046A (zh) 一种基于深度学习的细胞检测计数方法及系统
Zhang et al. Automated semantic segmentation of red blood cells for sickle cell disease
CN112380900A (zh) 基于深度学习的子宫颈液基细胞数字图像分类方法及系统
CN111291825B (zh) 病灶分类模型训练方法、装置、计算机设备和存储介质
CN112132817A (zh) 一种混合注意力机制的眼底图像视网膜血管分割方法
JP2021512446A (ja) 画像処理方法、電子機器および記憶媒体
CN111242233B (zh) 一种基于融合网络的阿尔兹海默病分类方法
CN115909006B (zh) 基于卷积Transformer的乳腺组织图像分类方法及系统
CN112420170B (zh) 一种提高计算机辅助诊断系统图片分类准确度的方法
CN110729045A (zh) 一种基于上下文感知残差网络的舌图像分割方法
CN110739051B (zh) 利用鼻息肉病理图片建立嗜酸性粒细胞占比模型的方法
CN112884788A (zh) 基于丰富上下文网络的视杯视盘分割方法及成像方法
CN115661459A (zh) 一种使用差异信息的2D mean teacher模型
CN113361353A (zh) 一种基于DeepLabV3Plus的斑马鱼形态学评分方法
CN114445356A (zh) 基于多分辨率的全视野病理切片图像肿瘤快速定位方法
CN113538422B (zh) 一种基于染色强度矩阵的病理图像自动分类方法
CN113362360B (zh) 基于流体速度场的超声颈动脉斑块分割方法
CN114140437A (zh) 一种基于深度学习的眼底硬渗出物分割方法
CN114283406A (zh) 细胞图像识别方法、装置、设备、介质及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant