CN115346076B - 病理图像识别方法及其模型训练方法、系统和存储介质 - Google Patents

病理图像识别方法及其模型训练方法、系统和存储介质 Download PDF

Info

Publication number
CN115346076B
CN115346076B CN202211272240.8A CN202211272240A CN115346076B CN 115346076 B CN115346076 B CN 115346076B CN 202211272240 A CN202211272240 A CN 202211272240A CN 115346076 B CN115346076 B CN 115346076B
Authority
CN
China
Prior art keywords
image
pathological
loss function
neural network
sliding window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211272240.8A
Other languages
English (en)
Other versions
CN115346076A (zh
Inventor
张楚康
张皓
张行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ankon Technologies Co Ltd
Original Assignee
Ankon Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ankon Technologies Co Ltd filed Critical Ankon Technologies Co Ltd
Priority to CN202211272240.8A priority Critical patent/CN115346076B/zh
Publication of CN115346076A publication Critical patent/CN115346076A/zh
Application granted granted Critical
Publication of CN115346076B publication Critical patent/CN115346076B/zh
Priority to PCT/CN2023/125221 priority patent/WO2024083152A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7753Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明揭示了一种病理图像识别方法及其模型训练方法、系统和存储介质,模型训练方法包括:接收样本图像集合;根据样本图像集合,调用第一神经网络模型依次执行有监督训练和遍历推理,并调用第二神经网络模型基于推理结果进行有监督训练,计算得到第一损失函数;根据样本图像集合,调用第二神经网络模型依次执行有监督训练和遍历推理,并调用第一神经网络模型基于推理结果进行有监督训练,计算得到第二损失函数;根据第一损失函数和第二损失函数对第一神经网络模型和第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。本发明提供的模型训练方法,能够减少对有限数据的依赖性,增强模型稳定性和性能。

Description

病理图像识别方法及其模型训练方法、系统和存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种病理图像识别方法及其模型训练方法、系统和存储介质。
背景技术
如何高效准确地分析病理影像数据,特别是分析消化道恶性肿瘤的病理图像数据,一直是医学领域备受关注的课题。当前针对病理影像的人工智能应用大致可以分为定性诊断和病变识别两个大方向。由于计算机负载能力限制,建模思路通常为基于有监督学习(Supervised Learning)模型框架来建模,如此,模型算法的训练优化需要大量而丰富的标注数据;如要准确分割预测出目标病灶区域,则需要临床专业人员对训练数据标本图像进行像素级别的精细标注,从而需要投入大量的人力和时间成本。由此,人工智能和深度学习技术在病理影响数据分析上的应用受阻,特别是在对消化系统中已经产生的病灶进行识别、对消化系统癌前病变进行识别和预警等场景下,很难搭建得到合适的模型并快速输出运算结果。
此外,现有技术中对于耗费高成本建立的多组有标记数据,通常只令其参与一轮模型的迭代训练过程,然而为了提升模型训练的准确度,又不得不将模型训练的迭代次数提高,导致单组有标记数据对模型训练过程的贡献和影响力减弱,模型的素质不能得到较好地提升,接着就需要工作者再次向模型输送有标记数据,造成了恶性循环。
发明内容
本发明的目的之一在于提供一种病理图像识别模型训练方法,以解决现有技术中模型训练对用于进行有监督训练的有标记数据的依赖性过高,对其使用率低下,无法充分利用数据进行训练、训练效果差、成本高的技术问题。
本发明的目的之一在于提供一种病理图像识别模型训练系统。
本发明的目的之一在于提供一种存储介质。
本发明的目的之一在于提供一种病理图像识别方法。
为实现上述发明目的之一,本发明一实施方式提供一种病理图像识别模型训练方法,所述方法包括:接收样本图像集合;根据所述样本图像集合,调用第一神经网络模型依次执行有监督训练和遍历推理,并调用第二神经网络模型基于推理结果进行有监督训练,计算得到第一损失函数;根据所述样本图像集合,调用所述第二神经网络模型依次执行有监督训练和遍历推理,并调用所述第一神经网络模型基于推理结果进行有监督训练,计算得到第二损失函数;根据所述第一损失函数和所述第二损失函数对所述第一神经网络模型和所述第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。
作为本发明一实施方式的进一步改进,所述样本图像集合包括有标注样本图像集合和无标注样本图像集合。
作为本发明一实施方式的进一步改进,所述方法具体包括:根据所述有标注样本图像集合,调用所述第一神经网络模型执行有监督训练后,根据所述无标注样本图像集合,调用所述第一神经网络模型执行遍历推理,得到对应于所述无标注样本图像集合的第一识别伪标签集合;根据所述无标注样本图像集合和所述第一识别伪标签集合,调用所述第二神经网络模型执行有监督训练,并计算得到所述第一损失函数;根据所述有标注样本图像集合,调用所述第二神经网络模型执行有监督训练后,根据所述无标注样本图像集合,调用所述第二神经网络模型执行遍历推理,得到对应于所述无标注样本图像集合的第二识别伪标签集合;根据所述无标注样本图像集合和所述第二识别伪标签集合,调用所述第一神经网络模型执行有监督训练,并计算得到所述第二损失函数。
作为本发明一实施方式的进一步改进,所述方法还包括:接收参考病理图像集合;对所述参考病理图像集合依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到标准病理图像集合;其中,所述标准病理图像集合包括有标注病理图像集合和无标注病理图像集合;对所述有标注病理图像集合进行分组,将第一有标注图像集合与所述无标注病理图像集合组合构成样本图像训练集,并根据第二有标注图像集合形成样本图像验证集;根据所述样本图像训练集和所述样本图像验证集,生成所述样本图像集合。
作为本发明一实施方式的进一步改进,所述方法具体包括:接收癌前病变标本图像和非癌前病变标本图像;对部分癌前病变标本图像进行像素标注,得到病变标注掩膜;根据所述癌前病变标本图像、对应的病变标注掩膜,以及所述非癌前病变标本图像,生成所述参考病理图像集合;所述方法具体包括:对所有标注病变标本图像依次执行尺寸标准化处理和颜色迁移标准化处理,并根据处理后的标注病变标本图像,运算得到所述有标注病理图像集合;其中,所述标注病变标本图像对应于具有对应病变标注掩膜的癌前病变标本图像;对所有无标注病变标本图像和所有非癌前病变标本图像,依次执行尺寸标准化处理和颜色迁移标准化处理,并根据处理后的无标注病变标本图像和非癌前病变标本图像,运算得到所述无标注病理图像集合;其中,所述无标注病变标本图像对应于不具有对应病变标注掩膜的癌前病变标本图像。
作为本发明一实施方式的进一步改进,所述标注病变标本图像的数量占所有癌前病变标本图像的数量的30%;所有非癌前病变标本图像的数量占所有癌前病变标本图像的数量的20%。
作为本发明一实施方式的进一步改进,所述方法还包括:对完成尺寸标准化处理和颜色迁移标准化处理的参考病理图像执行滑窗区域分割,得到并根据多组滑窗区域图像组,运算得到所述标准病理图像集合;其中,所述滑窗区域分割具体包括:构建预设尺寸的图像区域滑窗,并使所述图像区域滑窗按照预设步长对标注标准化图像和对应的所述病变标注掩膜执行遍历分割,得到多组标注滑窗图像组和标注滑窗掩膜组;其中,所述标注标准化图像为完成标准化处理后的标注病变标本图像;遍历、分析并根据标注滑窗掩膜组中所有标注滑窗掩膜的病灶区域占比,筛选更新所述标注滑窗图像和对应的标注滑窗掩膜;使所述图像区域滑窗按照所述预设步长对无标注标准化图像和非病变标准化图像执行遍历分割,得到多组无标注滑窗图像组和非病变滑窗图像组;其中,所述无标注标准化图像为完成标准化处理后的无标注病变标本图像,所述非病变标准化图像为完成标准化处理后的非癌前病变标本图像;遍历、分析并根据无标注滑窗图像和非病变滑窗图像的组织区域占比,筛选更新所述无标注滑窗图像和所述非病变滑窗图像。
作为本发明一实施方式的进一步改进,所述方法具体包括:对所述标注滑窗图像和对应的标注滑窗掩膜执行随机数据增广处理,得到所述有标注病理图像集合;对所述无标注滑窗图像和所述非病变滑窗图像执行随机数据增广处理,得到所述无标注病理图像集合;其中,所述随机数据增广具体包括:按照预设概率对图像矩阵进行水平翻转、垂直翻转、预设角度旋转和转置至少其中一种。
作为本发明一实施方式的进一步改进,所述病变标注掩膜包括对应于癌前病变标本图像中每个像素的独热编码标签,所述独热编码标签包含分别表征背景判断标注、上皮内瘤变判断标注和肠上皮化生判断标注的第一编码位、第二编码位和第三编码位。
作为本发明一实施方式的进一步改进,所述方法具体包括:对所述参考病理图像集合执行尺寸标准化处理,统一所有参考病理图像至预设放大倍数;所述方法具体包括:接收基准染色图像,对其执行色彩空间转换,并计算得到基准染色向量矩阵;接收参考病理图像,对其执行色彩空间转换,并计算得到参考颜色密度矩阵;根据所述基准染色向量矩阵和所述参考颜色密度矩阵,生成对应于所述参考病理图像的颜色迁移图像。
作为本发明一实施方式的进一步改进,所述方法具体包括:接收基准染色图像,进行光密度矩阵转换处理,得到基准光密度矩阵;对所述基准光密度矩阵执行奇异值分解,选择第一奇异极值和第二奇异极值创建投影平面;确定至少一个参考奇异值及其在所述投影平面上的参考平面轴,将所述基准光密度矩阵投影至所述投影平面,拟合投影后的基准光密度矩阵上所有数值点与所述投影平面的原点的连接线,并计算所述连接线与所述参考平面轴的夹角,求取所有夹角中的极大值,得到极大夹角数据;计算对应于所述极大夹角数据的光密度矩阵,对该光密度矩阵执行归一化运算后,得到所述基准染色向量矩阵。
作为本发明一实施方式的进一步改进,所述方法具体包括:接收参考病理图像,对其依次执行光密度矩阵转换、奇异值分解、平面投影和极大夹角数据求取,计算得到对应于所述参考病理图像的参考光密度矩阵和参考染色向量矩阵;根据所述参考染色向量矩阵和所述参考光密度矩阵,计算得到对应于所述参考病理图像的所述参考颜色密度矩阵。
作为本发明一实施方式的进一步改进,所述方法具体包括:对所述参考病理图像执行下采样插值,设定所述参考病理图像的放大倍数为10倍;其中,所述下采样插值为最邻近插值。
作为本发明一实施方式的进一步改进,所述方法还包括:选取以全卷积网络为结构基础的语义分割骨干模型作为基础骨干模型;分别根据第一权重配置参数和第二权重配置参数,基于所述基础骨干模型执行模型初始化,得到所述第一神经网络模型和所述第二神经网络模型;其中,所述第一神经网络模型和所述第二神经网络模型,均搭载有softmax激活函数,且配置为具有相同的优化器和学习率调整策略。
作为本发明一实施方式的进一步改进,所述基础骨干模型配置为基于U-Net网络架构,所述第一权重配置参数设置为基于Xavier参数初始化策略生成,所述第二权重配置参数设置为基于Kaiming参数初始化策略生成;所述第一神经网络模型和所述第二神经网络模型配置为包括随机梯度下降优化器,所述学习率调整策略配置为模型学习率值随迭代次数的增加而减小。
作为本发明一实施方式的进一步改进,所述模型学习率值等于剩余迭代次数与总迭代次数之比的预设指数次幂,与基础学习率值之积。
作为本发明一实施方式的进一步改进,所述第一损失函数配置为第一有监督损失函数与第一伪标签损失函数的加权之和,其中,所述第一有监督损失函数指向所述第一神经网络模型基于样本图像集合进行的有监督训练过程,所述第一伪标签损失函数指向所述第二神经网络模型基于推理结果进行的有监督训练过程;所述第二损失函数配置为第二有监督损失函数与第二伪标签损失函数的加权之和,其中,所述第二有监督损失函数指向所述第二神经网络模型基于所述样本图像集合进行的有监督训练过程,所述第二伪标签损失函数指向所述第一神经网络模型基于推理结果进行的有监督训练过程。
作为本发明一实施方式的进一步改进,所述第一有监督损失函数配置为第一有监督交叉熵损失函数与第一有监督交并比损失函数之和;其中,所述第一有监督交叉熵损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类概率之间的差距,所述第一有监督交并比损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类类别之间的差距;所述第一伪标签损失函数包括第一伪标签交叉熵损失函数;其中,所述第一伪标签交叉熵损失函数表征所述第一神经网络模型对所述样本图像集合的推理分类概率,与所述第二神经网络模型对所述样本图像集合的推理分类类别之间的差距;所述第二有监督损失函数配置为第二有监督交叉熵损失函数与第二有监督交并比损失函数之和;其中,所述第二有监督交叉熵损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类概率之间的差距,所述第二有监督交并比损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类类别之间的差距;所述第二伪标签损失函数包括第二伪标签交叉熵损失函数;其中,所述第二伪标签交叉熵损失函数表征所述第二神经网络模型对所述样本图像集合的推理分类概率,与所述第一神经网络模型对所述样本图像集合的推理分类类别之间的差距。
作为本发明一实施方式的进一步改进,样本图像表征上皮内瘤变情况和肠上皮化生情况;所述第一有监督交叉熵损失函数、所述第一伪标签交叉熵损失函数、所述第二有监督交叉熵损失函数和所述第二伪标签交叉熵损失函数,指向样本图像中背景区域、上皮内瘤变区域和肠上皮化生区域;所述第一有监督交并比损失函数和所述第二有监督交并比损失函数,指向样本图像中上皮内瘤变区域和肠上皮化生区域。
作为本发明一实施方式的进一步改进,所述第一伪标签损失函数和所述第二伪标签损失函数具有相等的预设权重值,所述预设权重值配置为随迭代次数的增加而增大。
作为本发明一实施方式的进一步改进,所述预设权重值等于权重最大值与预设递增函数的乘积,所述预设递增函数配置为函数值无限趋近于1。
作为本发明一实施方式的进一步改进,样本图像表征上皮内瘤变情况和肠上皮化生情况。
为实现上述发明目的之一,本发明一实施方式提供一种病理图像识别模型训练系统,配置为执行上述任一种技术方案所述的病理图像识别模型训练方法。
为实现上述发明目的之一,本发明一实施方式提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种技术方案所述的病理图像识别模型训练方法。
为实现上述发明目的之一,本发明一实施方式提供一种病理图像识别方法,所述方法包括:执行上述任一种技术方案所述的病理图像识别模型训练方法,得到第一模型训练参数和第二模型训练参数至少其中之一;将模型训练参数搭载至对应的神经网络模型中,构建病理图像识别模型;接收待测病理图像数据并进行预处理,将预处理后的待测病理图像数据输入所述病理图像识别模型中进行遍历预测,得到病理识别数据。
作为本发明一实施方式的进一步改进,所述方法具体包括:对所述待测病理图像数据依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到待测病理图像集合;将所述待测病理图像集合输入所述病理图像识别模型中进行遍历预测,得到病理识别像素区;将所述病理识别像素区叠加显示于待测病理图像上,形成病理判断图像。
作为本发明一实施方式的进一步改进,所述方法具体包括:对完成尺寸标准化处理和颜色迁移标准化处理的待测病理图像数据执行滑窗区域分割,根据待测滑窗图像中低灰度值区域占比情况,筛选得到所述待测病理图像集合。
作为本发明一实施方式的进一步改进,所述病理识别数据包括癌前病变判定信息,所述方法具体包括:对所述病理识别像素区中分别指向上皮内瘤变和肠上皮化生的像素值进行降序排列,计算预设数量范围内的像素平均值,得到第一平均值和第二平均值,并判断所述第一平均值和所述第二平均值与预设癌前病变判定阈值之间的数值大小关系;若所述第一平均值和所述第二平均值其中之一大于所述癌前病变判定阈值,则判定该病理识别像素区对应的待测病理图像所表征的位置发生癌前病变,输出癌前病变判定信息。
与现有技术相比,本发明提供的病理图像识别模型训练方法,通过构建第一神经网络模型和第二神经网络模型两个并行的学习模型,利用产生的两组损失函数,相对照地进行模型的训练和优化,从而充分利用有限的图像数据进行训练,并使神经网络模型的性能更为稳定;利用样本图像集合依次进行前一模型到后一模型的训练,以及利用样本图像集合依次进行后一模型到前一模型的训练,复合一般有监督训练和基于伪标签的有监督训练,能够减少对有标记数据等稀缺数据类型的依赖性,将无标记数据也当作有标记数据参与模型的训练过程,从而大幅提升了训练得到的模型的性能、降低成本并提高了训练速度。
附图说明
图1是本发明一实施方式中病理图像识别模型训练系统的结构示意图。
图2是本发明一实施方式中病理图像识别模型训练方法的步骤示意图。
图3是本发明一实施方式中病理图像识别模型训练方法的第一实施例的步骤示意图。
图4是本发明另一实施方式中病理图像识别模型训练方法的部分步骤示意图。
图5是本发明另一实施方式中病理图像识别模型训练方法的第一实施例的部分步骤示意图。
图6是本发明另一实施方式中病理图像识别模型训练方法的第一实施例的一具体示例的部分步骤示意图。
图7是本发明再一实施方式中病理图像识别模型训练方法的部分步骤示意图。
图8是本发明再一实施方式中病理图像识别模型训练方法的第一实施例的部分步骤示意图。
图9是本发明又一实施方式中执行病理图像识别模型训练方法时图像数据的转化流程示意图。
图10是本发明一实施方式中病理图像识别方法及其第一实施例的步骤示意图。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
需要说明的是,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明的核心技术路线在于,通过构建两套并行的神经网络模型,相互交替地执行有监督训练和基于有监督训练后的推测结果来进行有监督训练,从而达到充分利用样本图像集合内容、输出训练参数素质表现稳定,以及提升模型预测准确度的技术效果。同时,本发明后文提出的、诸如对图像的标准化、分组、滑窗分割等附加技术特征,还能够从样本图像集合自身素质、用于训练的图像集构建和资源占用等方面,形成对模型训练方法的进一步优化。值得强调地,下文多种实施方式、实施例或具体示例之间可以相互组合,由此形成的新的技术方案能够被包含于本发明的保护范围内。
本发明一实施方式为了解决技术问题和实现技术效果,提供了一种存储介质,可以具体是一种计算机可读存储介质,从而,所述存储介质可以设置于计算机中并存储有计算机程序。所述计算机存储介质可以是计算机能够存取的任何可用介质,或可以是包含一个或多个可用介质集成的服务器、数据中心等存储设备。所述可用介质可以是例如软盘、硬盘、磁带等的磁性介质,或例如DVD(Digital Video Disc,高密度数字视频光盘)等的光介质,或例如SSD(Solid State Disk,固态硬盘)等的半导体介质。所述计算机程序被计算机中任一处理器执行时,实施一种病理图像识别模型训练方法,以至少执行:样本图像集合的接收,第一神经网络模型、第二神经网络模型的调用和训练,第一损失函数、第二损失函数的计算,以及第一模型训练参数和第二模型训练参数至少其中之一的生成。
本发明一实施方式进一步提供一种如图1所示的病理图像识别模型训练系统100,该病理图像识别模型训练系统100包括处理器11、通信接口12、存储器13以及通信总线14。处理器11、通信接口12、存储器13通过通信总线14完成相互间的通信。
其中,存储器13用于存放应用程序;处理器11用于执行存储器13上存放的应用程序,该应用程序可以是前文所述的、存储于存储介质上的应用程序,也即上述存储介质可以是包含于存储器13的。在执行该应用程序时,同样可以实现诸如前文所述的功能和步骤,并达到对应的技术效果。
其他结构特征,例如可能存在的功能分区和模块的调整,可以是根据其所搭载的应用程序进行划分的。具体地,在病理图像识别模型训练系统100中,或在一种病理图像识别模型训练装置中,可以包括用于获取样本图像集合的数据获取模块,可以包括用于构建第一神经网络模型和第二神经网络模型的模型构建模块,可以包括用于运算第一损失函数和第二损失函数的数据运算模块,也可以包括用于对第一神经网络模型和第二神经网络模型进行迭代训练的迭代训练模块。
本发明一实施方式提供一种如图2所示的病理图像识别模型训练方法,该方法应用的程序或指令,可以搭载于上述存储介质和/或上述病理图像识别模型训练系统和/或上述病理图像识别模型训练装置中,以实现对病理图像识别模型进行训练的技术效果。病理图像识别模型训练方法具体包括下述步骤。
步骤21,接收样本图像集合。
步骤22,根据样本图像集合,调用第一神经网络模型依次执行有监督训练和遍历推理,并调用第二神经网络模型基于推理结果进行有监督训练,计算得到第一损失函数。
步骤23,根据样本图像集合,调用第二神经网络模型依次执行有监督训练和遍历推理,并调用第一神经网络模型基于推理结果进行有监督训练,计算得到第二损失函数。
步骤24,根据第一损失函数和第二损失函数对第一神经网络模型和第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。
所述样本图像集合,可以具体解释为用于进行病理图像识别模型训练的图像集合或图像数据集合,其内容可以指向任何需要进行病理图像识别和分析的部位,例如,可以指向消化系统中胃部、肠道等部位。基于其自身用途的限制,样本图像集合中至少可以包含指向病变部位或病变前部位的部分图像。
在将训练后的病理图像识别模型用于对消化系统癌变进行前期预警的场景下,样本图像集合中至少部分样本图像可以配置为,表征上皮内瘤变情况和肠上皮化生情况等。其中,所述肠上皮化生一般被认为是发生癌变的前期表现,可以分为小肠型上皮化生、结肠上皮化生两大类型。进一步地,考虑到结肠上皮化生发生恶性癌变风险较高,因此可以将样本图像集合中表征结肠上皮化生的样本图像数量配置得更多,或在训练中赋予其更高的权重。
优选地,所述样本图像集合包括有标注样本图像集合和无标注样本图像集合。对于有标注样本图像集合而言,本发明并不限制样本图像标注的方式,可以是对部分区域提供统一的标签。同理,本发明也并不限制样本图像标注的形式。作为较优的实施方式,样本图像的标注可以是对每个像素进行类别划分,并最终形成一张与样本图像尺寸相适应的掩膜,从而该样本图像与对应的掩膜共同组成所述有标注样本图像集合。所述有标注样本图像集合应当至少包含部分指向病变部位和病变前部位的样本图像,而对于无标注样本图像集合,则可以包括指向病变部位或病变前部位的样本图像,也可以包括不包含病变或病变前特征的样本图像。
所述第一神经网络模型和所述第二神经网络模型可以是任何一种可以支持有监督训练和推理预测的神经网络模型。所述第一损失函数表征,在依次调用第一神经网络模型和第二神经网络模型进行训练的过程中,模型推理情况和实际分类情况的偏差。所述第二损失函数表征,在依次调用第二神经网络模型和第一神经网络模型进行训练的过程中,模型推理情况和实际分类情况的偏差。
基于此,本发明提供一较优的实施例,旨在搭建一个较优的神经网络模型以适应病理图像识别的应用场景,并提升模型训练的效率。该实施例具体包括步骤:选取以全卷积网络为结构基础的语义分割骨干模型作为基础骨干模型;分别根据第一权重配置参数和第二权重配置参数,基于所述基础骨干模型执行模型初始化,得到所述第一神经网络模型和所述第二神经网络模型。
如此,以全卷积网络(FCN,Fully Convolutional Network)为结构基础,能够用反卷积操作替代传统卷积神经网络(CNN,Convolutional Neural Networks)最后的全连接层,从而在训练、推理和预测过程中,保持图像输出尺寸与输入尺寸的一致性,以适应精细化预测(例如,对每个像素点进行预测)的需要。
此外,选用支持语义分割的骨干模型作为基础骨干模型,能够实现像素级别的分类,从而在应对多样化的分类需求时,能够准确地将病变或病变前区域与背景区域分割出来,提供医疗工作者更为准确可靠的参考。
所述第一权重参数和所述第二权重参数优选配置为基于不同的参数初始化策略生成,使得对应的第一神经网络模型和第二神经网络模型在保持训练并行的基础上,具有相互独立的内部特性,如此,提升最终生成的第一模型训练参数或第二模型训练参数的泛化能力。又因为第一神经网络模型和第二神经网络模型配置为基于同一基础骨干模型构建而成,因此无需对输入的样本图像集合进行针对模型的适应性调整,输出数据信息的形式也相仿,从而更方便相互形成对照,并计算总体损失函数来进行性能评价。
作为优选地,所述第一神经网络模型和所述第二神经网络模型,均搭载有softmax激活函数,且配置为具有相同的优化器和学习率调整策略。从而,能够进一步保证两个神经网络模型的基本配置保持一致,能够相互对照地并行训练。其中,利用softmax激活函数适应数量更多的分类需求,例如,可以对单个像素或像素区域进行背景、上皮内瘤变和肠上皮化生共计三种类别的识别判定。判定信息的形式可以是分类概率值。
在一种优选的具体示例中,所述基础骨干模型配置为基于U-Net网络架构。相比于传统的全卷积网络的跨层连接(skip connect),U-Net网络架构在进行尺寸调整时选择对特征进行叠加,从而使得通道(channel)数量翻倍,并且具有兼顾全局特征和局部特征,从而适应多尺度预测和深度监督(Deep Supervision)。
所述第一权重配置参数优选设置为基于Xavier参数初始化策略生成,所述第二权重配置参数优选设置为基于Kaiming参数初始化策略生成。前者在tanh激活函数层面表现得更好,能够在一定程度上解决高斯分布随神经网络深度增加所造成的梯度消失的问题,后者则更侧重于对relu激活函数等非线性激活函数层面的能力,也能够一定程度上改善数据方差逐层递减的问题。在一种应用场景下,上述参数初始化策略可以是基于PyTorch学习库实现,从而,上述第一权重配置参数和所述第二权重配置参数,可以进一步解释为具有不同的张量参数(tensor)。从而,可以不被限定于必须采用上述两种参数初始化策略来生成。
此外,所述第一神经网络模型和所述第二神经网络模型可以配置为具有相同的随机梯度下降(SGD,Stochastic Gradient Descent)优化器,以使神经网络模型的性能能够被实时评估,并且赋予其更快的学习速度。当然,本发明并不排斥采用批量梯度下降、小批量梯度下降等方式构建优化器。所述学习率调整策略配置为模型学习率值随迭代次数的增加而减小,从而使得神经网络模型的性能逐渐趋向于稳定。对于所述模型学习率值,可以在初始化之时为其设定一个最大的模型学习率值作为基础学习率值。该基础学习率值优选为0.01。
优选地,为了增强学习率在迭代过程中变化的平稳性,可以具体将所述模型学习率值配置为,等于剩余迭代次数与总迭代次数之比的预设指数次幂,与所述基础学习率值之积。定义当前迭代次数为n,总迭代次数为max_iter,预设指数值为i,基础学习率值为Li,则所述模型学习率值至少配置为满足:
Figure 6792DEST_PATH_IMAGE001
具体地,所述基础学习率值可以配置为0.01,所述预设指数值可以配置为0.9,则所述模型学习率值可以至少配置为满足:
Figure 288869DEST_PATH_IMAGE002
在基于上述实施方式提供的第一实施例中,本发明根据样本图像集合中的有标注样本图像集合和无标注样本图像集合,对应第一神经网络模型和第二神经网络模型配置了不同的训练策略,以有监督训练和推理为主,将伪标签推理结果作为第二层有监督训练的基础,并进一步充分利用样本图像集合,特别是其中较为稀缺的有标注样本图像集合,提高了模型的泛化识别能力和预测准确性。如图3所示,该第一实施例具体包括下述步骤。
步骤21,接收样本图像集合。
步骤221,根据有标注样本图像集合,调用第一神经网络模型执行有监督训练后,根据无标注样本图像集合,调用第一神经网络模型执行遍历推理,得到对应于无标注样本图像集合的第一识别伪标签集合。
步骤222,根据无标注样本图像集合和第一识别伪标签集合,调用第二神经网络模型执行有监督训练,并计算得到第一损失函数。
步骤231,根据有标注样本图像集合,调用第二神经网络模型执行有监督训练后,根据无标注样本图像集合,调用第二神经网络模型执行遍历推理,得到对应于无标注样本图像集合的第二识别伪标签集合。
步骤232,根据无标注样本图像集合和第二识别伪标签集合,调用第一神经网络模型执行有监督训练,并计算得到第二损失函数。
步骤24,根据第一损失函数和第二损失函数对第一神经网络模型和第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。
如此,一方面,能够以“从第一神经网络模型到第二神经网络模型”和“从第二神经网络模型到第一神经网络模型”两个方向进行模型训练;另一方面,能够经由有监督训练后的模型对无标注样本图像集合进行推理,得到并以识别伪标签和无标注样本图像集合作为“有标注样本图像集合”再进行有监督训练,提升模型的效能,经过迭代得到精确度和稳定性更好的模型训练参数,并减小对大量有标注样本图像集合需求的依赖性。
优选地,对于该实施方式或该实施方式之下的任一种实施例,或对于下文提及的任何一种实施方式,所述第一损失函数和所述第二损失函数还可以具有下述配置。首先,所述第一损失函数配置为第一有监督损失函数与第一伪标签损失函数的加权之和,所述第二损失函数配置为第二有监督损失函数与第二伪标签损失函数的加权之和,如此,能够利用第一损失函数和第二损失函数分别作为针对于步骤22和步骤23的模型总体评价参量,囊括上述两个方向下训练的全过程,增强迭代训练的效果。
具体地,所述第一有监督损失函数指向所述第一神经网络模型基于样本图像集合进行的有监督训练过程,所述第一伪标签损失函数指向所述第二神经网络模型基于推理结果进行的有监督训练过程。优选地,所述“基于推理结果进行”在上述实施方式的第一实施例中,可以被具体解释为“基于第一识别伪标签集合进行”。所述第二有监督损失函数指向所述第二神经网络模型基于所述样本图像集合进行的有监督训练过程,所述第二伪标签损失函数指向所述第一神经网络模型基于推理结果进行的有监督训练过程。同样优选地,所述“基于推理结果进行”在上述实施方式的第一实施例中,可以被具体解释为“基于第二识别伪标签集合进行”。
如此,可以在构建步骤整体对应的损失函数作为评价参量的基础上,囊括基于有标签数据和伪标签数据的有监督训练过程,提升模型的泛化识别能力,减小对有标签数据的需求量。
上述提供的技术方案旨在对损失函数所对应的训练过程进行对应,而对于损失函数的具体类型,在一种具体示例中,可以将上述任一种损失函数配置为交叉熵损失函数,或交叉熵损失函数与交并比损失函数的组合。优选地,在以反映模型整体效能为先的情况下,可以采用后一种组合方案来配置损失函数,在以保持训练过程的稳定性和确定性为先的情况下,可以采用前一种单一方案来配置损失函数。
基于此,本发明提供一种优选的方案,针对上述不同损失函数的作用来进行损失函数类型的配置。在该优选方案中,所述第一有监督损失函数配置为第一有监督交叉熵损失函数与第一有监督交并比损失函数之和。其中,所述第一有监督交叉熵损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类概率之间的差距,所述第一有监督交并比损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类类别之间的差距。
在所述样本图像集合包括有标注样本图像集合的实施方式中,所述已知标签数据可以是所述有标注样本图像集合中诸如掩膜的标签数据。所述已知标签数据对应的推理分类概率,可以是第一神经网络模型对有标注样本图像中所有像素的推理分类概率。所述已知标签数据对应的推理分类类别,可以是第一神经网络模型对有标注样本图像中所有像素的推理分类类别。
所述第一伪标签损失函数配置为包括第一伪标签交叉熵损失函数。其中,所述第一伪标签交叉熵损失函数表征所述第一神经网络模型对所述样本图像集合的推理分类概率,与所述第二神经网络模型对所述样本图像集合的推理分类类别之间的差距。
在所述样本图像集合包括无标注样本图像集合的实施方式中,所述第一伪标签交叉熵损失函数可以表征,第一神经网络模型对无标注样本图像中所有像素的推理分类概率,与第二神经网络模型对无标注样本图像中所有像素的推理分类类别之间的差距。
所述第二有监督损失函数配置为第二有监督交叉熵损失函数与第二有监督交并比损失函数之和。其中,所述第二有监督交叉熵损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类概率之间的差距。所述第二有监督交并比损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类类别之间的差距。具体地,所述已知标签数据对应的推理分类概率,可以是第二神经网络模型对有标注样本图像中所有像素的推理分类概率。所述已知标签数据对应的推理分类类别,可以是第二神经网络模型对有标注样本图像中所有像素的推理分类类别。
所述第二伪标签损失函数包括第二伪标签交叉熵损失函数。其中,所述第二伪标签交叉熵损失函数表征所述第二神经网络模型对所述样本图像集合的推理分类概率,与所述第一神经网络模型对所述样本图像集合的推理分类类别之间的差距。具体地,所述第二伪标签交叉熵损失函数可以表征,第二神经网络模型对无标注样本图像中所有像素的推理分类概率,与第一神经网络模型对无标注样本图像中所有像素的推理分类类别之间的差距。
定义有标注样本图像对应的已知标签数据(可以是图像对应的病变标注掩膜,或该掩膜上对应于每个像素的分类编码标签)为
Figure 255688DEST_PATH_IMAGE003
;定义第一神经网络模型对有标注样本图像中全部像素的推理分类概率为
Figure 230597DEST_PATH_IMAGE004
,第一神经网络模型对有标注样本图像中全部像素的推理分类类别为
Figure 883033DEST_PATH_IMAGE005
,第一神经网络模型对无标注样本图像中全部像素的推理分类概率为
Figure 234380DEST_PATH_IMAGE006
,第一神经网络模型对无标注样本图像中全部像素的推理分类类别为
Figure 55706DEST_PATH_IMAGE007
(也即,所述第一识别伪标签集合);定义第二神经网络模型对有标注样本图像中全部像素的推理分类概率为
Figure 467095DEST_PATH_IMAGE008
,第一神经网络模型对有标注样本图像中全部像素的推理分类类别为
Figure 373872DEST_PATH_IMAGE009
,第一神经网络模型对无标注样本图像中全部像素的推理分类概率为
Figure 997751DEST_PATH_IMAGE010
,第一神经网络模型对无标注样本图像中全部像素的推理分类类别为
Figure 939162DEST_PATH_IMAGE011
(也即,所述第二识别伪标签集合)。
则,所述第一有监督损失函数至少满足:
Figure 19988DEST_PATH_IMAGE012
其中,所述
Figure 148481DEST_PATH_IMAGE013
为所述第一有监督交叉熵损失函数,所述
Figure 576052DEST_PATH_IMAGE014
为所述第一有监督交并比损失函数。
所述第一伪标签损失函数至少满足:
Figure 106390DEST_PATH_IMAGE015
其中,所述
Figure 859583DEST_PATH_IMAGE016
为所述第一伪标签交叉熵损失函数。
所述第二有监督损失函数至少满足:
Figure 740951DEST_PATH_IMAGE017
其中,所述
Figure 494185DEST_PATH_IMAGE018
为所述第二有监督交叉熵损失函数,所述
Figure 144609DEST_PATH_IMAGE019
为所述第二有监督交并比损失函数。
所述第二伪标签损失函数至少满足:
Figure 537544DEST_PATH_IMAGE020
其中,所述
Figure 906209DEST_PATH_IMAGE021
为所述第二伪标签交叉熵损失函数。
在上文提及的一种实施方式中,所述样本图像集合中的样本图像表征上皮内瘤变情况和肠上皮化生情况。从而,所述第一有监督交叉熵损失函数、所述第一伪标签交叉熵损失函数、所述第二有监督交叉熵损失函数和所述第二伪标签交叉熵损失函数,指向样本图像中背景区域、上皮内瘤变区域和肠上皮化生区域,也即将其配置为三分类平均交叉熵损失(cross-entropy loss)函数。所述第一有监督交并比损失函数和所述第二有监督交并比损失函数,指向样本图像中上皮内瘤变区域和肠上皮化生区域,也即将其配置为二分类平均交并比损失(dice loss)函数。
对于第一损失函数中第一伪标签损失函数的权重,以及第二损失函数中第二伪标签损失函数的权重,可以优选将其配置为具有相等的预设权重值,从而增强两种训练方向下模型评价的一致性。进一步地,可以将该预设权重值配置为随着训练迭代次数的增加而增大,也即两者配置为正相关。如此,逐渐提高对伪标签损失函数的置信度,使模型训练过程逐渐趋于稳定。当然,本发明并不排斥将所述预设权重值配置为定值的技术方案,如此,能够将伪标签损失函数参与模型评价过程的程度保持在一个稳定的范围内。
具体地,对于将预设权重值配置为动态变化值的技术方案而言,本发明提供一优选的配置方式,将所述预设权重值配置为等于权重最大值与预设递增函数的乘积,所述预设递增函数配置为函数值无限趋近于1。优选地,所述预设递增函数配置为由0开始平缓增大,且以较小的斜率无限趋近于1。
基于此,在一种实施方式中,可以利用欧拉数作为底数构建随迭代次数变化的指数函数,从而实现上述配置方式。定义权重最大值为
Figure 675581DEST_PATH_IMAGE023
,当前迭代次数为n,则所述预设权重值至少满足:
Figure 446091DEST_PATH_IMAGE024
其中,符号“//”代表向下取整整除,用于返回整除结果的整数部分。基于上述配置,可以使预设权重值具有更为平缓的变化趋势。所述权重最大值优选为0.1。
当然,本发明还可以利用线性函数来作为上述预设递增函数,定义当前迭代次数为n,总迭代次数为max_iter,则所述预设权重值至少满足:
Figure 9928DEST_PATH_IMAGE025
如此,可以实现前80%的训练步骤对预设权重值进行递增配置,后20%保持预设权重值不变。
可以理解地,本发明上述实施方式虽然将“得到第一模型训练参数和第二模型训练参数至少其中之一”作为最后步骤,但并不意味着执行本发明提供的技术方案只能得到模型训练参数,本领域技术人员当然可以根据该模型训练参数生成对应的神经网络模型,以用于进行病理图像识别。基于此,本发明还可以包括在步骤24之后的补充步骤:加载所述第一模型训练参数对所述第一神经网络模型进行初始化,和/或加载所述第二模型训练参数对所述第二神经网络模型进行初始化,得到病理图像识别模型。
可以理解地,上述迭代训练过程的终止条件可以被具体配置为,当损失函数降低并稳定在预设区间范围内即停止。
需要说明地,本发明提供的病理图像识别模型训练方法的推理测试过程,可以是在单独的验证集上进行,且配置为在完成每轮训练后即对训练得到的神经网络模型进行验证,从而得到与上文相对应的损失函数指标,从而进行最优节点(也即上文所述模型训练参数)的选取。由此可见,本发明提供的病理图像识别模型训练方法并不仅仅包含在训练集上的迭代过程,更包括在验证集上进行模型评估选择的过程。此外,定义迭代总轮数为epoch,则总迭代次数max_iter,可以对应等于迭代总轮数epoch与遍历样本图像集合中所有数据所需迭代次数的乘积。
同理,本发明也并不限制所述步骤21之前不能包含其他前置步骤,例如,在本发明另一种实施方式中,提供了所述样本图像集合的生成过程,将形态特征各异的参考病理图像集合进行标准化处理后,分组形成训练集和验证集,从而便于后续训练过程的进行。结合图2和图4所示,该另一实施方式具体包括下述步骤。
步骤31,接收参考病理图像集合。
步骤32,对参考病理图像集合依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到标准病理图像集合。其中,所述标准病理图像集合包括有标注病理图像集合和无标注病理图像集合。
步骤33,对有标注病理图像集合进行分组,将第一有标注图像集合与无标注病理图像集合组合构成样本图像训练集,并根据第二有标注图像集合形成样本图像验证集。
步骤34,根据样本图像训练集和样本图像验证集,生成样本图像集合。
步骤21,接收样本图像集合。
步骤22,根据样本图像集合,调用第一神经网络模型依次执行有监督训练和遍历推理,并调用第二神经网络模型基于推理结果进行有监督训练,计算得到第一损失函数。
步骤23,根据样本图像集合,调用第二神经网络模型依次执行有监督训练和遍历推理,并调用第一神经网络模型基于推理结果进行有监督训练,计算得到第二损失函数。
步骤24,根据第一损失函数和第二损失函数对第一神经网络模型和第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。
如此,能够将参考病理图像集合中每组图像或图像数据,处理成具有统一的尺寸和染色情况的图像或图像数据,避免由于染色等外部因素,影响后续的模型训练过程和模型训练参数的准确性。同时,将样本图像训练集配置为同时包含有标注病理图像和无标注病理图像,能够适应后续对训练过程的特殊配置,降低对有标注病理图像的需求。
所述参考病理图像集合中的参考病理图像,可以解释为至少包含部分经过标注的标本图像的参考图像集合。所述参考图像集合用于生成所述样本图像集合,并投入模型训练中。基于所述样本图像集合包括样本图像训练集和样本图像验证集,上文提及的任何关于在训练集上进行迭代训练的步骤,即可对应配置为在所述样本图像训练集上进行,任何关于在验证集上进行评估选择的步骤,即可对应配置为在所述样本图像验证集上进行,本发明并不对此进行展开描述。
本发明基于上述另一实施方式提供其第一实施例,将参考病理图像集合配置为根据不同种类的病变标本图像选择性进行像素标注而生成,并针对由此形成的多种图像分别进行标准化处理,从而得到标准病理图像集合中的不同组成部分。结合图2和图5,该第一实施例具体包括下述步骤。
步骤301,接收癌前病变标本图像和非癌前病变标本图像。
步骤302,对部分癌前病变标本图像进行像素标注,得到病变标注掩膜。
步骤303,根据癌前病变标本图像、对应的病变标注掩膜,以及非癌前病变标本图像,生成参考病理图像集合。
步骤31,接收参考病理图像集合。
步骤32,对参考病理图像集合依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到标准病理图像集合。所述步骤32具体包括:
步骤321,对所有标注病变标本图像依次执行尺寸标准化处理和颜色迁移标准化处理,并根据处理后的标注病变标本图像,运算得到有标注病理图像集合;其中,所述标注病变标本图像对应于具有对应病变标注掩膜的癌前病变标本图像;
步骤322,对所有无标注病变标本图像和所有非癌前病变标本图像,依次执行尺寸标准化处理和颜色迁移标准化处理,并根据处理后的无标注病变标本图像和非癌前病变标本图像,运算得到无标注病理图像集合;其中,所述无标注病变标本图像对应于不具有对应病变标注掩膜的癌前病变标本图像。
步骤33,对有标注病理图像集合进行分组,将第一有标注图像集合与无标注病理图像集合组合构成样本图像训练集,并根据第二有标注图像集合形成样本图像验证集。
步骤34,根据样本图像训练集和样本图像验证集,生成样本图像集合。
步骤21,接收样本图像集合。
步骤22,根据样本图像集合,调用第一神经网络模型依次执行有监督训练和遍历推理,并调用第二神经网络模型基于推理结果进行有监督训练,计算得到第一损失函数。
步骤23,根据样本图像集合,调用第二神经网络模型依次执行有监督训练和遍历推理,并调用第一神经网络模型基于推理结果进行有监督训练,计算得到第二损失函数。
步骤24,根据第一损失函数和第二损失函数对第一神经网络模型和第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。
在上述病理图像识别模型训练方法应用于消化系统前期预警的场景下时,所述癌前病变标本图像可以被解释为:存在上皮内瘤变或肠上皮化生现象的标本图像。所述非癌前病变标本图像则可以对应解释为:不包含上述现象的标本图像。实施上述技术方案,可以只对部分癌前病变标本图像进行像素标注,从而减少成本消耗。
优选地,对于上述图像或图像数据的数量或数据量的配置,可以具体是:所述标注病变标本图像的数量占所有癌前病变标本图像的数量的30%。相较于完全有监督训练所要求的100%而言,能够大幅降低成本,提高效率和标注数据的利用率。此外,所有非癌前病变标本图像的数量占所有癌前病变标本图像的数量的20%,能够增强模型的泛化识别能力。
为了保证后续模型训练的顺利进行,本发明基于上述第一实施例,还提供了一种针对步骤321和步骤322的具体示例。在该具体示例中,所述步骤32具体包括步骤:对完成尺寸标准化处理和颜色迁移标准化处理的参考病理图像执行滑窗区域分割,得到并根据多组滑窗区域图像组,运算得到标准病理图像集合。如此,能够将参考病理图像切分为适合作为模型输入的尺寸,从而方便模型进行遍历和迭代训练。
优选地,所述滑窗区域图像组中的滑窗区域图像,具有256*256的尺寸大小。执行滑窗区域分割的步长可以是滑窗区域图像任一边的0.25至0.5倍中的任一像素尺寸,例如可以是128像素。从而,在遍历过程中形成50%的重叠,使其有效涵盖各种边缘特征。
具体地,如图6所示,所述“滑窗区域分割”可以包括:
步骤3211,构建预设尺寸的图像区域滑窗,并使图像区域滑窗按照预设步长对标注标准化图像和对应的病变标注掩膜执行遍历分割,得到多组标注滑窗图像组和标注滑窗掩膜组;
步骤3212,遍历、分析并根据标注滑窗掩膜组中所有标注滑窗掩膜的病灶区域占比,筛选更新标注滑窗图像和对应的标注滑窗掩膜;
步骤3221,使图像区域滑窗按照预设步长对无标注标准化图像和非病变标准化图像执行遍历分割,得到多组无标注滑窗图像组和非病变滑窗图像组;
步骤3222,遍历、分析并根据无标注滑窗图像和非病变滑窗图像的组织区域占比,筛选更新无标注滑窗图像和非病变滑窗图像。
其中,所述标注标准化图像为完成标准化处理后的标注病变标本图像。所述无标注标准化图像为完成标准化处理后的无标注病变标本图像。所述非病变标准化图像为完成标准化处理后的非癌前病变标本图像。如此,能够得到对应标注病变标本图像的滑窗区域图像组、对应于病变标注掩膜的滑窗区域掩膜组、对应于无标注病变标本图像的滑窗区域图像组,以及对应于非癌前病变标本图像的滑窗区域图像组,以分别作为模型的数据输入。
一方面,上述滑窗区域图像组中滑窗区域图像,可以是RGB图像。因此,输入到神经网络模型中进行迭代的数据类型,可以是RGB图像对应的RGB矩阵,并具体可以是(256,256,T)的多通道RGB矩阵。通道数T可以根据待识别类别的数量来确定,对于上述消化系统癌变前期预警的应用场景而言,通道数T=3,分别指代背景、上皮内瘤变和肠上皮化生三种。
进一步地,在标注滑窗掩膜中,可以利用RGB值(0,0,255)指向的蓝色表示背景,利用RGB值(255,0,0)指向的红色表示上皮内瘤变,利用RGB值(0,255,0)指向的绿色表示肠上皮化生。此外,上述标本图像可以具体是由统一的染色方法制成(例如,苏木素-伊红染色法,H&E Staining),并保存为统一的格式(例如,svs格式或kfb格式等)。对应生成的标注滑窗掩膜,可以配置为PNG(Portable Network Graphics,便携式网络图形)文件。进行标注的方式,可以具体是通过ASAP(Automated Slide Analysis Platform,自动载玻片分析平台)或labelme等工具标注。
另一方面,对标注滑窗图像和对应的标注滑窗掩膜进行更新筛选的过程,可以具体配置为根据中心区域病灶部位覆盖程度进行筛选,筛选保留覆盖程度高于预设百分比的标注滑窗图像和标注滑窗掩膜。在上述消化系统的场景下,在滑窗图像尺寸为256*256时,可以截取标注滑窗掩膜上中心位置64*64像素大小的区域,在其中任一病灶覆盖面积大于等于该区域的三分之一时,则保留该区域对应的标注滑窗图像和标注滑窗掩膜。所述任一病灶可以解释为上皮内瘤变或肠上皮化生其中之一。如此,可以减少筛选更新过程中的数据处理量,选择更能够概括标注滑窗图像内容的中心区域进行分析,加快整体工作效率。
对无标注滑窗图像和非病变滑窗图像进行更新筛选的过程,可以具体配置为根据整体的组织区域占比来进行,筛选保留阻值区域占比高于预设百分比的无标注滑窗图像和非病变滑窗图像。在上述消化系统的场景下,可以计算其中灰度值较低(诸如,灰度值低于210)的区域来作为组织区域,计算该区域在整体图像中的占比并与预设的30%或其他数值进行比较。若大于30%,则予以保留。可以理解地,由于此部分并不包含病灶或其他需要进行分类的特征,因此可以将无标注滑窗图像和非病变滑窗图像整体设置为背景色(例如,蓝色)。
再一方面,除了直接利用上述滑窗区域图像组和标注滑窗掩膜组进行训练以外(也即,将更新后的标注滑窗图像和对应的标注滑窗掩膜直接作为标注病理图像集合,将更新后的无标注滑窗图像和非病变滑窗图像直接作为无标注病理图像集合),在该具体示例中,还可以对上述数据进行增广处理,从而进一步增强模型的泛化识别能力。具体地,继续如图6所示,所述步骤3212之后可以包括步骤3213:对标注滑窗图像和对应的标注滑窗掩膜执行随机数据增广处理,得到有标注病理图像集合。所述步骤3222之后可以包括步骤3223:对无标注滑窗图像和非病变滑窗图像执行随机数据增广处理,得到无标注病理图像集合。
具体地,所述“随机数据增广”可以包括步骤:按照预设概率对图像矩阵进行水平翻转、垂直翻转、预设角度旋转和转置至少其中一种。从而,通过调整图像的形态来生成基于此的不同数据。所述预设概率优选为50%。所述预设角度优选为90°。
对于上述病变标注掩膜的形式,除了可以配置为PNG文件格式以外,其上用于对像素进行标注的内容,可以具体配置为独热编码标签的形式。换言之,所述病变标注掩膜包括对应于癌前病变标本图像中每个像素的独热编码标签。具体地,所述独热编码标签包含分别表征背景判断标注、上皮内瘤变判断标注和肠上皮化生判断标注的第一编码位、第二编码位和第三编码位。例如,在某一像素对应的独热编码标签为(0,0,1)时,表征该像素归属于背景部分,若为(1,0,0)则表征该像素归属于上皮内瘤变部分,若为(0,1,0)则表征该像素归属于肠上皮化生部分。
该实施方式与前文中通过RGB值形成的不同颜色进行类别划分的技术方案并不矛盾,上述独热编码标签可以被解释为经由RGB图像或RGB矩阵归一化后得到的。基于此,本发明对应位置还可以包括对于病变标注掩膜或标注滑窗掩膜进行归一化处理的步骤。
对于步骤32及其衍生步骤中提出的尺寸标准化和颜色迁移标准化处理过程,本发明再一实施方式中提供了下述优选方案。
首先,所述尺寸标准化处理可以具体配置为对参考病理图像的放大倍数进行调整,也即所述步骤32及其衍生步骤可以具体包括步骤:对所述参考病理图像集合执行尺寸标准化处理,统一所有参考病理图像至预设放大倍数。优选地,所述预设放大倍数为10倍,参考病理图像的初始放大倍数可能是5倍、10倍、20倍或40倍。
进一步地,在所述参考病理图像配置为RGB图像时,为了保证处理后的、与参考病理图像中癌前病变标本图像对应的病变标注掩膜只包含有既定类别的像素值(RGB层面为蓝、红、绿),其下采样插值方法可以选用最近邻(nearest neighbor)插值法。
其次,所述颜色迁移标准化处理可以包括如图7所示的细化步骤,也即图4中的步骤32及其衍生步骤,可以具体包括下述步骤。
步骤41,接收基准染色图像,对其执行色彩空间转换,并计算得到基准染色向量矩阵。
步骤42,接收参考病理图像,对其执行色彩空间转换,并计算得到参考颜色密度矩阵。
步骤43,根据基准染色向量矩阵和参考颜色密度矩阵,生成对应于所述参考病理图像的颜色迁移图像。
如此,无需进行复杂的迁移系数计算,直接根据基准染色向量矩阵即可完成颜色迁移过程,具有更佳的颜色迁移效果,且不会过分增加运算量,简化了运算逻辑。
在基于上述再一实施方式的第一实施例中,所述上述步骤41可以具体包括图8所示的下述步骤。
步骤411,接收基准染色图像,进行光密度矩阵转换处理,得到基准光密度矩阵。
步骤412,对基准光密度矩阵执行奇异值分解,选择第一奇异极值和第二奇异极值创建投影平面。
步骤413,确定至少一个参考奇异值及其在投影平面上的参考平面轴,将基准光密度矩阵投影至投影平面,拟合投影后的基准光密度矩阵上所有数值点与投影平面的原点的连接线,并计算连接线与参考平面轴的夹角,求取所有夹角中的极大值,得到极大夹角数据。
步骤414,计算对应于极大夹角数据的光密度矩阵,对该光密度矩阵执行归一化运算后,得到基准染色向量矩阵。
如此,能够以较高的效率,将苏木素-伊红染色法染色形成的基准染色图像进行染色层面上的分离,将其中表征染色程度的基准染色向量矩阵提取出来,从而在后续步骤中进行直接替换,达到颜色迁移的效果。
所述基准染色图像可以解释为,具有较优染色质量的参考病理图像。从而,可以以此作为基准,对其他参考病理图像做颜色迁移标准化处理。所述光密度矩阵转换处理可以解释为将RGB颜色域下的基准染色图像,转换为OD(Optical Density)光密度域下的基准光密度矩阵。在此过程中,还可以包括对光密度值小于预设光密度阈值像素点的移除过程。
所述奇异值分解可以被解释为,将基准光密度矩阵分解成一个酉矩阵
Figure 364424DEST_PATH_IMAGE026
、一个特征值平方根
Figure 203067DEST_PATH_IMAGE027
和另一个酉矩阵
Figure 437870DEST_PATH_IMAGE028
的转置的乘积的形式。基于此,本发明即利用特征值平方根
Figure 703766DEST_PATH_IMAGE027
来建立投影平面,并具体地,利用其中较为典型的特征值以表征两种染色剂的染色倾向,从而提取基准染色向量矩阵。此时,奇异值向量中两个最大的向量,也即所述第一奇异极值和所述第二奇异极值则可以作为用于计算该较为典型的特征值的参考量。
所述“将基准光密度矩阵投影至投影平面”还可以包括对投影后的数值进行归一化处理。在此之后进行夹角极值的计算,能够简化运算步骤并在一定程度上减小误差。所述“至少一个参考奇异值”可以是投影平面上任何一个奇异值,优选可以是所述第一奇异极值和所述第二奇异极值其中之一,所述“其在投影平面上的参考平面轴”,则对应可以是所述第一奇异极值在投影平面上形成的数轴或所述第二奇异极值在投影平面上形成的数轴。
最终生成的基准染色向量矩阵,则记载了该基准染色图像的染色倾向,并将其他组织区域内容清洗掉。此时,所述基准染色向量矩阵中的向量元素,则体现了苏木精和伊红染剂两种染色剂的染色程度。
换言之,所述基准光密度矩阵满足
Figure 561870DEST_PATH_IMAGE029
,其中,
Figure 702739DEST_PATH_IMAGE030
为基准染色图像的基准颜色密度矩阵,
Figure 182262DEST_PATH_IMAGE031
为基准染色图像的基准染色向量矩阵,经过上述步骤,则可以将所述基准染色向量矩阵提取出来。
在基于上述再一实施方式的第一实施例中,所述上述步骤42可以具体包括图8所示的下述步骤。
步骤421,接收参考病理图像,对其依次执行光密度矩阵转换、奇异值分解、平面投影和极大夹角数据求取,计算得到对应于参考病理图像的参考光密度矩阵和参考染色向量矩阵。
步骤422,根据参考染色向量矩阵和参考光密度矩阵,计算得到对应于参考病理图像的参考颜色密度矩阵。
步骤421中“光密度矩阵转换”、“奇异值分解”、“平面投影”和“极大夹角数据求取”等部分,可以替换地实施上述步骤411至步骤414的技术方案及相关解释,此处不再赘述。
对于参考病理图像而言,其参考光密度矩阵同样满足
Figure 353480DEST_PATH_IMAGE032
。其中,
Figure 292355DEST_PATH_IMAGE033
为参考染色图像的参考颜色密度矩阵,
Figure 207221DEST_PATH_IMAGE034
为参考染色图像的参考染色向量矩阵。经过步骤421,则可以将所述参考染色向量矩阵提取出来,经过步骤422,则可以根据上述运算关系计算得到参考颜色密度矩阵。从而,可以将参考颜色密度矩阵和基准染色向量矩阵进行“叉乘”重组,生成颜色迁移后的光密度矩阵(也即,
Figure 541251DEST_PATH_IMAGE035
)。从而,执行相对于步骤41的色彩空间转换的反变换,将颜色迁移后的光密度矩阵还原至RGB颜色域,最终得到所述颜色迁移图像。
本发明提供的上述多种实施方式、实施例或具体示例之间可以相互进行组合,从而最终形成多个更优的实施方式。图9则对应示出了在执行所述更优的实施方式中的一种时,相关图像或图像数据的转化过程。
在接收到所述癌前病变标本图像后,通过病变区域标记会对应形成所述标注病变标本图像和所述无标注病变标本图像。对于所述标注病变标本图像,其还包括对应的病变标注掩膜,标注病变标本图像经过尺寸标准化、颜色迁移标准化等处理后生成所述标注标准化图像,并进一步经过滑窗区域分割,产生所述标注滑窗图像组。在此过程中,病变标注掩膜同样经过上述对应步骤,最终产生与所述标注滑窗图像组相对应的标注滑窗掩膜组,两者共同组成所述有标注病理图像集合。继续地,经过预设的训练集、验证集占比关系,可以将有标注病理图像集合分为第一有标注图像集合(或称,有标注样本图像集合)和第二有标注图像集合,前者参与所述样本图像训练集的构成,后者作为所述样本图像验证集参与模型的评估选择环节。
基于癌前病变标本图像生成的所述无标注病变标本图像,经过尺寸标准化、颜色迁移标准化等处理后生成所述无标注标准化图像,并进一步经过滑窗区域分割,产生所述无标注滑窗图像组。此外,在接受到所述非癌前病变标本图像后,会经过尺寸标准化、颜色迁移标准化等处理后生成所述非病变标准化图像,并进一步经过滑窗区域分割,产生所述非病变滑窗图像组。所述无标注滑窗图像组和所述非病变滑窗图像组,共同组成所述无标注病理图像集合(或称,无标注样本图像集合),从而,与所述第一有标注图像集合共同构成所述样本图像训练集。
本发明一实施方式为了准确识别和对病理图像中不同区域进行分类,提供了一种病理图像识别系统和如图10所示的病理图像识别方法。
对应于上述病理图像识别方法,本发明首先提供一种存储介质,可以具有与对应于病理图像识别模型训练方法的存储介质相同或相类似的配置方案,甚至可以将病理图像识别方法和病理图像识别模型训练方法的应用程序设置于同一个存储介质中。同理,所述病理图像识别系统的配置方案也可以具有与病理图像识别模型训练系统相同或类似的配置方案,此处不再赘述。
对应地,本发明一实施方式提供的病理图像识别方法,同样可以搭载于上述存储介质和/或上述病理图像识别系统中。病理图像识别方法具体包括下述步骤。
步骤51,执行一种病理图像识别模型训练方法,得到第一模型训练参数和第二模型训练参数至少其中之一。
步骤52,将模型训练参数搭载至对应的神经网络模型中,构建病理图像识别模型。
步骤53,接收待测病理图像数据并进行预处理,将预处理后的待测病理图像数据输入病理图像识别模型中进行遍历预测,得到病理识别数据。
所述病理图像识别模型训练方法可以是前文任一种实施方式、实施例或具体示例所提供的模型训练方法,本领域技术人员可以参照前文所述,以步骤51至步骤53作为基础产生多种衍生的实施方式,此处不再赘述。
所述对应的神经网络模型可以解释为与第一模型训练参数和第二模型训练参数至少其中之一相对应的神经网络模型。举例而言,该神经网络模型可以是所述第一神经网络模型,则对应搭载训练得到的第一模型训练参数到所述第一神经网络模型中,构建得到病理图像识别模型。该神经网络模型是所述第二神经网络模型时同理。但可以理解地,所述病理图像识别模型也可以配置为同时包含并行的第一神经网络模型和第二神经网络模型。
值得说明地,所述待测病理图像数据可以具有与所述样本图像集合中的样本图像具有相类似的格式、内容形式配置。尤其可以与无标注样本图像集合中的无标注样本图像具有相类似的形式,此处不再赘述。
本发明基于上述实施方式,提供其第一实施例,该第一实施例提供了对于步骤53的优选技术方案。所述第一实施例中的步骤53可以具体包括下述步骤。
步骤531,对待测病理图像数据依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到待测病理图像集合。
步骤532,将待测病理图像集合输入病理图像识别模型中进行遍历预测,得到病理识别像素区。
步骤533,将病理识别像素区叠加显示于待测病理图像上,形成病理判断图像。
所述尺寸标准化处理和所述颜色迁移标准化处理可以参照前文提供的技术方案,并优选将待测病理图像或其数据进行尺寸放大比例的调整,以及染色风格倾向的统一化处理,实现提高预测准确度的效果。
所述病理识别像素区可以解释为,对应于待测病理图像上每个像素的判断结果分布情况。病理识别像素区可以具体包括背景识别像素区、上皮内瘤变识别像素区和肠上皮化生像素区,针对每个像素依次具有背景判断标注、上皮内瘤变判断标注和肠上皮化生判断标注。所述病理识别像素区的表现形式可以是与所述病变标注掩膜等相类似的掩膜,可以是与待测病理图像相对应的图像,也可以是单纯指向待测病理图像上某些确定区域的数据组。
在本实施方式中,虽然生成了病理判断图像,但并不限定将病理判断图像作为所述病理识别数据,其可以作为中间数据呈现。当然,也可以取消对步骤533的设置,替换实施其他技术方案。
优选地,同样可以对完成标准化处理的待测病理图像数据执行分割和筛选处理,从而得到所述待测病理图像集合作为神经网络模型的输入。换言之,所述“运算得到待测病理图像集合”可以具体包括步骤:对完成尺寸标准化处理和颜色迁移标准化处理的待测病理图像数据执行滑窗区域分割,根据待测滑窗图像中低灰度值区域占比情况,筛选得到所述待测病理图像集合。所述筛选规则,可以参照前文对无标注滑窗图像和非病变滑窗图像筛选更新的技术方案。
当然,本发明并不排斥在上述特征处与前文提供的技术方案形成区别。由此产生的技术方案同样应该被认为落入本发明所保护的范围内。例如,进行滑窗区域分割的步长可以被配置为与图像区域滑窗的边长相等,并优选为256像素。
为规避分割结果里假阳性对标本定性诊断的影响,上述第一实施例中的病理识别数据可以具体配置为包括癌前病变判定信息。基于此,所述步骤53还可以进一步包括下述步骤。
步骤534,对病理识别像素区中分别指向上皮内瘤变和肠上皮化生的像素值进行降序排列,计算预设数量范围内的像素平均值,得到第一平均值和第二平均值,并判断第一平均值和第二平均值与预设癌前病变判定阈值之间的数值大小关系。
步骤535,若第一平均值和第二平均值其中之一大于癌前病变判定阈值,则判定该病理识别像素区对应的待测病理图像所表征的位置发生癌前病变,输出癌前病变判定信息。
优选地,所述癌前病变判定阈值为0.5,所述预设数量范围为10000个像素范围内或15000个像素范围内。当然,本发明还隐含地包括步骤:若第一平均值和第二平均值均不大于癌前病变判定阈值,则判定该病理识别像素区对应的待测病理图像所表征的位置未发生癌前病变,输出癌前病变判定信息。
综上,本发明提供的病理图像识别模型训练方法,通过构建第一神经网络模型和第二神经网络模型两个并行的学习模型,并用产生的两组损失函数,相对照地进行模型的训练和优化,从而充分利用有限的图像数据进行训练,并使神经网络模型的性能更为稳定;利用样本图像集合依次进行前一模型到后一模型的训练,以及利用样本图像集合依次进行后一模型到前一模型的训练,结合一般有监督训练和基于伪标签的有监督训练,能够减少对有标记数据等稀缺数据类型的依赖性,隐性地将无标记数据也当作有标记数据参与模型的训练过程,从而大幅提升了训练得到的模型的性能、降低成本并提高了训练速度。
同理,应用基于上述训练过程生成的病理图像识别模型(或模型训练数据)所构成的病理图像识别方法,自然可以兼顾高泛化识别率、低稀缺数据依赖性,以及高成本和低性能等优势。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (26)

1.一种病理图像识别模型训练方法,其特征在于,所述方法包括:
接收样本图像集合;其中,所述样本图像集合为用于进行病理图像识别模型训练的图像集合或图像数据集合,其内容指向需要进行病理图像识别和分析的部位;所述样本图像集合包括有标注样本图像集合和无标注样本图像集合;
根据所述有标注样本图像集合,调用第一神经网络模型执行有监督训练后,根据所述无标注样本图像集合,调用第一神经网络模型执行遍历推理,得到对应于所述无标注样本图像集合的第一识别伪标签集合;
根据所述无标注样本图像集合和所述第一识别伪标签集合,调用第二神经网络模型执行有监督训练,并计算得到第一损失函数;
根据所述有标注样本图像集合,调用所述第二神经网络模型执行有监督训练后,根据所述无标注样本图像集合,调用所述第二神经网络模型执行遍历推理,得到对应于所述无标注样本图像集合的第二识别伪标签集合;
根据所述无标注样本图像集合和所述第二识别伪标签集合,调用所述第一神经网络模型执行有监督训练,并计算得到第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述第一神经网络模型和所述第二神经网络模型进行迭代训练,得到第一模型训练参数和第二模型训练参数至少其中之一。
2.根据权利要求1所述的病理图像识别模型训练方法,其特征在于,在所述“接收样本图像集合”之前,所述方法还包括:
接收参考病理图像集合;
对所述参考病理图像集合依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到标准病理图像集合;其中,所述标准病理图像集合包括有标注病理图像集合和无标注病理图像集合;
对所述有标注病理图像集合进行分组,将第一有标注图像集合与所述无标注病理图像集合组合构成样本图像训练集,并根据第二有标注图像集合形成样本图像验证集;
根据所述样本图像训练集和所述样本图像验证集,生成所述样本图像集合。
3.根据权利要求2所述的病理图像识别模型训练方法,其特征在于,在所述“接收参考病理图像集合”之前,所述方法具体包括:
接收癌前病变标本图像和非癌前病变标本图像;
对部分癌前病变标本图像进行像素标注,得到病变标注掩膜;
根据所述癌前病变标本图像、对应的病变标注掩膜,以及所述非癌前病变标本图像,生成所述参考病理图像集合;
所述“对所述参考病理图像集合依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到标准病理图像集合”具体包括:
对所有标注病变标本图像依次执行尺寸标准化处理和颜色迁移标准化处理,并根据处理后的标注病变标本图像,运算得到所述有标注病理图像集合;其中,所述标注病变标本图像对应于具有对应病变标注掩膜的癌前病变标本图像;
对所有无标注病变标本图像和所有非癌前病变标本图像,依次执行尺寸标准化处理和颜色迁移标准化处理,并根据处理后的无标注病变标本图像和非癌前病变标本图像,运算得到所述无标注病理图像集合;其中,所述无标注病变标本图像对应于不具有对应病变标注掩膜的癌前病变标本图像。
4.根据权利要求3所述的病理图像识别模型训练方法,其特征在于,所述标注病变标本图像的数量占所有癌前病变标本图像的数量的30%;所有非癌前病变标本图像的数量占所有癌前病变标本图像的数量的20%。
5.根据权利要求3所述的病理图像识别模型训练方法,其特征在于,所述方法还包括:
对完成尺寸标准化处理和颜色迁移标准化处理的参考病理图像执行滑窗区域分割,得到并根据多组滑窗区域图像组,运算得到所述标准病理图像集合;
其中,所述滑窗区域分割具体包括:
构建预设尺寸的图像区域滑窗,并使所述图像区域滑窗按照预设步长对标注标准化图像和对应的所述病变标注掩膜执行遍历分割,得到多组标注滑窗图像组和标注滑窗掩膜组;其中,所述标注标准化图像为完成标准化处理后的标注病变标本图像;
遍历、分析并根据标注滑窗掩膜组中所有标注滑窗掩膜的病灶区域占比,筛选更新所述标注滑窗图像和对应的标注滑窗掩膜;
使所述图像区域滑窗按照所述预设步长对无标注标准化图像和非病变标准化图像执行遍历分割,得到多组无标注滑窗图像组和非病变滑窗图像组;其中,所述无标注标准化图像为完成标准化处理后的无标注病变标本图像,所述非病变标准化图像为完成标准化处理后的非癌前病变标本图像;
遍历、分析并根据无标注滑窗图像和非病变滑窗图像的组织区域占比,筛选更新所述无标注滑窗图像和所述非病变滑窗图像。
6.根据权利要求5所述的病理图像识别模型训练方法,其特征在于,在“遍历、分析并根据标注滑窗掩膜组中所有标注滑窗掩膜的病灶区域占比,筛选更新所述标注滑窗图像和对应的标注滑窗掩膜”之后,所述方法具体包括:
对所述标注滑窗图像和对应的标注滑窗掩膜执行随机数据增广处理,得到所述有标注病理图像集合;
在所述“遍历、分析并根据无标注滑窗图像和非病变滑窗图像的组织区域占比,筛选更新所述无标注滑窗图像和所述非病变滑窗图像”之后,所述方法具体包括:
对所述无标注滑窗图像和所述非病变滑窗图像执行随机数据增广处理,得到所述无标注病理图像集合;
其中,所述随机数据增广具体包括:
按照预设概率对图像矩阵进行水平翻转、垂直翻转、预设角度旋转和转置至少其中一种。
7.根据权利要求3所述的病理图像识别模型训练方法,其特征在于,所述病变标注掩膜包括对应于癌前病变标本图像中每个像素的独热编码标签,所述独热编码标签包含分别表征背景判断标注、上皮内瘤变判断标注和肠上皮化生判断标注的第一编码位、第二编码位和第三编码位。
8.根据权利要求2所述的病理图像识别模型训练方法,其特征在于,所述尺寸标准化处理具体包括:
对所述参考病理图像集合执行尺寸标准化处理,统一所有参考病理图像至预设放大倍数;
所述颜色迁移标准化处理具体包括:
接收基准染色图像,对其执行色彩空间转换,并计算得到基准染色向量矩阵;
接收参考病理图像,对其执行色彩空间转换,并计算得到参考颜色密度矩阵;
根据所述基准染色向量矩阵和所述参考颜色密度矩阵,生成对应于所述参考病理图像的颜色迁移图像。
9.根据权利要求8所述的病理图像识别模型训练方法,其特征在于,所述“接收基准染色图像,对其执行色彩空间转换,并计算得到基准染色向量矩阵”具体包括:
接收基准染色图像,进行光密度矩阵转换处理,得到基准光密度矩阵;
对所述基准光密度矩阵执行奇异值分解,选择第一奇异极值和第二奇异极值创建投影平面;
确定至少一个参考奇异值及其在所述投影平面上的参考平面轴,将所述基准光密度矩阵投影至所述投影平面,拟合投影后的基准光密度矩阵上所有数值点与所述投影平面的原点的连接线,并计算所述连接线与所述参考平面轴的夹角,求取所有夹角中的极大值,得到极大夹角数据;
计算对应于所述极大夹角数据的光密度矩阵,对该光密度矩阵执行归一化运算后,得到所述基准染色向量矩阵。
10.根据权利要求9所述的病理图像识别模型训练方法,其特征在于,所述“接收参考病理图像,对其执行色彩空间转换,并计算得到参考颜色密度矩阵”具体包括:
接收参考病理图像,对其依次执行光密度矩阵转换、奇异值分解、平面投影和极大夹角数据求取,计算得到对应于所述参考病理图像的参考光密度矩阵和参考染色向量矩阵;
根据所述参考染色向量矩阵和所述参考光密度矩阵,计算得到对应于所述参考病理图像的所述参考颜色密度矩阵。
11.根据权利要求8所述的病理图像识别模型训练方法,其特征在于,所述方法具体包括:
对所述参考病理图像执行下采样插值,设定所述参考病理图像的放大倍数为10倍;其中,所述下采样插值为最邻近插值。
12.根据权利要求1所述的病理图像识别模型训练方法,其特征在于,在所述“根据所述有标注样本图像集合,调用第一神经网络模型执行有监督训练后,根据所述无标注样本图像集合,调用第一神经网络模型执行遍历推理,得到对应于所述无标注样本图像集合的第一识别伪标签集合”之前,所述方法还包括:
选取以全卷积网络为结构基础的语义分割骨干模型作为基础骨干模型;
分别根据第一权重配置参数和第二权重配置参数,基于所述基础骨干模型执行模型初始化,得到所述第一神经网络模型和所述第二神经网络模型;其中,所述第一神经网络模型和所述第二神经网络模型,均搭载有softmax激活函数,且配置为具有相同的优化器和学习率调整策略。
13.根据权利要求12所述的病理图像识别模型训练方法,其特征在于,所述基础骨干模型配置为基于U-Net网络架构,所述第一权重配置参数设置为基于Xavier参数初始化策略生成,所述第二权重配置参数设置为基于Kaiming参数初始化策略生成;
所述第一神经网络模型和所述第二神经网络模型配置为包括随机梯度下降优化器,所述学习率调整策略配置为模型学习率值随迭代次数的增加而减小。
14.根据权利要求13所述的病理图像识别模型训练方法,其特征在于,所述模型学习率值等于剩余迭代次数与总迭代次数之比的预设指数次幂,与基础学习率值之积。
15.根据权利要求1所述的病理图像识别模型训练方法,其特征在于,所述第一损失函数配置为第一有监督损失函数与第一伪标签损失函数的加权之和,其中,所述第一有监督损失函数指向所述第一神经网络模型基于样本图像集合进行的有监督训练过程,所述第一伪标签损失函数指向所述第二神经网络模型基于推理结果进行的有监督训练过程;
所述第二损失函数配置为第二有监督损失函数与第二伪标签损失函数的加权之和,其中,所述第二有监督损失函数指向所述第二神经网络模型基于所述样本图像集合进行的有监督训练过程,所述第二伪标签损失函数指向所述第一神经网络模型基于推理结果进行的有监督训练过程。
16.根据权利要求15所述的病理图像识别模型训练方法,其特征在于,所述第一有监督损失函数配置为第一有监督交叉熵损失函数与第一有监督交并比损失函数之和;其中,所述第一有监督交叉熵损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类概率之间的差距,所述第一有监督交并比损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类类别之间的差距;
所述第一伪标签损失函数包括第一伪标签交叉熵损失函数;其中,所述第一伪标签交叉熵损失函数表征所述第一神经网络模型对所述样本图像集合的推理分类概率,与所述第二神经网络模型对所述样本图像集合的推理分类类别之间的差距;
所述第二有监督损失函数配置为第二有监督交叉熵损失函数与第二有监督交并比损失函数之和;其中,所述第二有监督交叉熵损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类概率之间的差距,所述第二有监督交并比损失函数表征所述样本图像集合中的已知标签数据和对应的推理分类类别之间的差距;
所述第二伪标签损失函数包括第二伪标签交叉熵损失函数;其中,所述第二伪标签交叉熵损失函数表征所述第二神经网络模型对所述样本图像集合的推理分类概率,与所述第一神经网络模型对所述样本图像集合的推理分类类别之间的差距。
17.根据权利要求16所述的病理图像识别模型训练方法,其特征在于,样本图像表征上皮内瘤变情况和肠上皮化生情况;
所述第一有监督交叉熵损失函数、所述第一伪标签交叉熵损失函数、所述第二有监督交叉熵损失函数和所述第二伪标签交叉熵损失函数,指向样本图像中背景区域、上皮内瘤变区域和肠上皮化生区域;所述第一有监督交并比损失函数和所述第二有监督交并比损失函数,指向样本图像中上皮内瘤变区域和肠上皮化生区域。
18.根据权利要求15所述的病理图像识别模型训练方法,其特征在于,所述第一伪标签损失函数和所述第二伪标签损失函数具有相等的预设权重值,所述预设权重值配置为随迭代次数的增加而增大。
19.根据权利要求18所述的病理图像识别模型训练方法,其特征在于,所述预设权重值等于权重最大值与预设递增函数的乘积,所述预设递增函数配置为函数值无限趋近于1。
20.根据权利要求1所述的病理图像识别模型训练方法,其特征在于,样本图像表征上皮内瘤变情况和肠上皮化生情况。
21.一种病理图像识别模型训练系统,其特征在于,配置为执行权利要求1-20任一项所述的病理图像识别模型训练方法。
22.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-20任一项所述的病理图像识别模型训练方法。
23.一种病理图像识别方法,其特征在于,所述方法包括:
执行权利要求1-20任一项所述的病理图像识别模型训练方法,得到第一模型训练参数和第二模型训练参数至少其中之一;
将模型训练参数搭载至对应的神经网络模型中,构建病理图像识别模型;
接收待测病理图像数据并进行预处理,将预处理后的待测病理图像数据输入所述病理图像识别模型中进行遍历预测,得到病理识别数据。
24.根据权利要求23所述的病理图像识别方法,其特征在于,所述方法具体包括:
对所述待测病理图像数据依次执行尺寸标准化处理和颜色迁移标准化处理,运算得到待测病理图像集合;
将所述待测病理图像集合输入所述病理图像识别模型中进行遍历预测,得到病理识别像素区;
将所述病理识别像素区叠加显示于待测病理图像上,形成病理判断图像。
25.根据权利要求24所述的病理图像识别方法,其特征在于,所述方法具体包括:
对完成尺寸标准化处理和颜色迁移标准化处理的待测病理图像数据执行滑窗区域分割,根据待测滑窗图像中低灰度值区域占比情况,筛选得到所述待测病理图像集合。
26.根据权利要求24所述的病理图像识别方法,其特征在于,所述病理识别数据包括癌前病变判定信息,所述方法具体包括:
对所述病理识别像素区中分别指向上皮内瘤变和肠上皮化生的像素值进行降序排列,计算预设数量范围内的像素平均值,得到第一平均值和第二平均值,并判断所述第一平均值和所述第二平均值与预设癌前病变判定阈值之间的数值大小关系;
若所述第一平均值和所述第二平均值其中之一大于所述癌前病变判定阈值,则判定该病理识别像素区对应的待测病理图像所表征的位置发生癌前病变,输出癌前病变判定信息。
CN202211272240.8A 2022-10-18 2022-10-18 病理图像识别方法及其模型训练方法、系统和存储介质 Active CN115346076B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211272240.8A CN115346076B (zh) 2022-10-18 2022-10-18 病理图像识别方法及其模型训练方法、系统和存储介质
PCT/CN2023/125221 WO2024083152A1 (zh) 2022-10-18 2023-10-18 病理图像识别方法及其模型训练方法、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211272240.8A CN115346076B (zh) 2022-10-18 2022-10-18 病理图像识别方法及其模型训练方法、系统和存储介质

Publications (2)

Publication Number Publication Date
CN115346076A CN115346076A (zh) 2022-11-15
CN115346076B true CN115346076B (zh) 2023-01-17

Family

ID=83956978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211272240.8A Active CN115346076B (zh) 2022-10-18 2022-10-18 病理图像识别方法及其模型训练方法、系统和存储介质

Country Status (2)

Country Link
CN (1) CN115346076B (zh)
WO (1) WO2024083152A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115346076B (zh) * 2022-10-18 2023-01-17 安翰科技(武汉)股份有限公司 病理图像识别方法及其模型训练方法、系统和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598658A (zh) * 2020-12-29 2021-04-02 哈尔滨工业大学芜湖机器人产业技术研究院 基于轻量级孪生卷积神经网络的病识别方法
CN113128613A (zh) * 2021-04-29 2021-07-16 南京大学 一种基于迁移学习的半监督异常检测方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10817779B2 (en) * 2017-08-30 2020-10-27 International Business Machines Corporation Bayesian network based hybrid machine learning
CN108197666A (zh) * 2018-01-30 2018-06-22 咪咕文化科技有限公司 一种图像分类模型的处理方法、装置及存储介质
CN111178432B (zh) * 2019-12-30 2023-06-06 武汉科技大学 多分支神经网络模型的弱监督细粒度图像分类方法
CN111598182B (zh) * 2020-05-22 2023-12-01 北京市商汤科技开发有限公司 训练神经网络及图像识别的方法、装置、设备及介质
CN112183577A (zh) * 2020-08-31 2021-01-05 华为技术有限公司 一种半监督学习模型的训练方法、图像处理方法及设备
CN112396605B (zh) * 2021-01-21 2021-04-23 北京安德医智科技有限公司 网络训练方法及装置、图像识别方法和电子设备
CN114419363A (zh) * 2021-12-23 2022-04-29 北京三快在线科技有限公司 基于无标注样本数据的目标分类模型训练方法及装置
CN114022718B (zh) * 2022-01-07 2022-03-22 安翰科技(武汉)股份有限公司 消化系统病理图像识别方法、系统及计算机存储介质
CN114581434A (zh) * 2022-03-24 2022-06-03 生仝智能科技(北京)有限公司 基于深度学习分割模型的病理图像处理方法、电子设备
CN115130650A (zh) * 2022-04-27 2022-09-30 腾讯科技(深圳)有限公司 一种模型训练方法及相关装置
CN115346076B (zh) * 2022-10-18 2023-01-17 安翰科技(武汉)股份有限公司 病理图像识别方法及其模型训练方法、系统和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598658A (zh) * 2020-12-29 2021-04-02 哈尔滨工业大学芜湖机器人产业技术研究院 基于轻量级孪生卷积神经网络的病识别方法
CN113128613A (zh) * 2021-04-29 2021-07-16 南京大学 一种基于迁移学习的半监督异常检测方法

Also Published As

Publication number Publication date
WO2024083152A1 (zh) 2024-04-25
CN115346076A (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN107636693B (zh) 针对人工神经网络的相关性分数指派
CN109389129B (zh) 一种图像处理方法、电子设备及存储介质
Agarwal et al. Explaining image classifiers by removing input features using generative models
CN108647641A (zh) 基于双路模型融合的视频行为分割方法和装置
CN111260055A (zh) 基于三维图像识别的模型训练方法、存储介质和设备
US20210326638A1 (en) Video panoptic segmentation
CN111340745B (zh) 一种图像生成方法、装置、存储介质及电子设备
CN114022718B (zh) 消化系统病理图像识别方法、系统及计算机存储介质
CN112990222B (zh) 一种基于图像边界知识迁移的引导语义分割方法
WO2022133627A1 (zh) 图像分割方法、装置、设备及存储介质
CN115346076B (zh) 病理图像识别方法及其模型训练方法、系统和存储介质
US11688061B2 (en) Interpretation of whole-slide images in digital pathology
CN114004328A (zh) Ai模型更新的方法、装置、计算设备和存储介质
CN112001939B (zh) 基于边缘知识转化的图像前景分割算法
CN110874590A (zh) 基于适配器互学习模型的训练及可见光红外视觉跟踪方法
CN115048969A (zh) 用于评估、理解和改进深度神经网络的视觉分析系统
Ali et al. Supervised versus unsupervised deep learning based methods for skin lesion segmentation in dermoscopy images
CN114639102B (zh) 基于关键点与尺寸回归的细胞分割方法和装置
Szemenyei et al. Real-time scene understanding using deep neural networks for RoboCup SPL
CN115641317B (zh) 面向病理图像的动态知识回溯多示例学习及图像分类方法
CN110942463B (zh) 一种基于生成对抗网络的视频目标分割方法
CN111476226A (zh) 一种文本定位方法、装置及模型训练方法
CN115688234A (zh) 一种基于条件卷积的建筑布局生成方法、装置及介质
CN112567466A (zh) 诊断结果生成系统及其方法
Wang et al. Overlapping cell segmentation of cervical cytology images based on nuclear radial boundary enhancement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant