CN113077876B - 数字病理图像标注方法、装置、计算机设备及存储介质 - Google Patents
数字病理图像标注方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113077876B CN113077876B CN202110345956.5A CN202110345956A CN113077876B CN 113077876 B CN113077876 B CN 113077876B CN 202110345956 A CN202110345956 A CN 202110345956A CN 113077876 B CN113077876 B CN 113077876B
- Authority
- CN
- China
- Prior art keywords
- target
- training
- image
- area
- small
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种数字病理图像标注方法,包括:获取数字病理图像中已标注的目标区域和已标注的非目标区域;根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;将所述待标注区域进行切割,得到多个待标注的小区域图像;将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。本方案只需医生进行少量的标注,便可完成对整个数字病理图像的标注,大大提高了工作效率以及标注准确度。
Description
技术领域
本发明涉及数字病理图像标注技术领域,尤其是涉及一种数字病理图像标注方法、装置、计算机设备及存储介质。
背景技术
病理诊断指病理医生对手术切除的标本通过肉眼观察大体的改变及显微镜下做出诊断。病理诊断是肿瘤诊断的主要方法,是肿瘤诊断的金标准。病理图像通常指病理切片经过HE染色后制作而成的切片。目前通过数字病理扫描仪进行数字化扫描,生产数字病理图像。随着人工智能技术在机器视觉领域的进步与发展。
病理学图像不同于一般的自然图像和CT等影像学图像。往往仅有病理医生可以参与标注工作,而国内的病理医生人数稀缺,日常临床工作负荷较重,参与到标注工作中可能人力资源和时间投入都显现出严重的不足。单张病理图像的大小从几百M到十几G左右,病理医生打开图片后,无法实现在短时间内的标注,而且标注区域的轮廓又往往边界不规则及十分复杂,造成了病理医生在人为标注的过程中,无法保证在不同时间、不同人员之间的重复性。同时,在病理图像中,因为部分区域图像清晰度、组织变形、细胞与组织不典型等诸多因素,还会造成少数区域可能无法准确分类的情况出现。
因此,如何最大化的降低病理医生投入到图像标注的繁琐工作中的平均时间,并且保证标注数据要求的准确性是现有技术面临的主要问题。
发明内容
基于此,有必要针对上述问题,提供一种既可以降低病理医生投入到图像标注的繁琐工作中的平均时间,又能够保证标注数据要求的准确性的数字病理图像标注方法、装置、计算机设备及存储介质。
第一方面,本发明提供一种数字病理图像标注方法,所述方法包括:
获取数字病理图像中已标注的目标区域和已标注的非目标区域;
根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
将所述待标注区域进行切割,得到多个待标注的小区域图像;
将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;
根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
第二方面,本发明提供一种病理图像标注装置,所述装置包括:
第一获取模块,用于获取数字病理图像中已标注的目标区域和已标注的非目标区域;
第二获取模块,用于根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
切割模块,用于将所述待标注区域进行切割,得到多个待标注的小区域图像;
预测模块,用于将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;
标注模块,用于根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
第三方面,本发明提供一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被该处理器执行时,使得该处理器执行如下步骤:
获取数字病理图像中已标注的目标区域和已标注的非目标区域;
根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
将所述待标注区域进行切割,得到多个待标注的小区域图像;
将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;
根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
第四方面,本发明提供一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时,使得该处理器执行如下步骤:
获取数字病理图像中已标注的目标区域和已标注的非目标区域;
根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
将所述待标注区域进行切割,得到多个待标注的小区域图像;
将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;
根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
本申请涉及一种数字病理图像标注方法、装置、计算机设备及存储介质,通过首先获取数字病理图像中已标注的目标区域和已标注的非目标区域,并根据已标注的目标区域和已标注的非目标区域确定所述数字病理图像中的待标注区域;然后将待标注区域进行切割,得到多个待标注的小区域图像,并将多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;最后根据每个小区域图像对应的预测结果,对每个小区域图像进行标注。本方案只需医生进行少量的标注,便可完成对整个数字病理图像的标注,最大化的降低病理医生投入到图像标注的繁琐工作中的平均时间的同时,还提高了标注数据要求的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为一个实施例中数字病理图像标注方法的流程图;
图2为一个实施例中数字病理图像标注方法的流程图;
图3为又一实施例中数字病理图像标注方法的流程图;
图4为一个实施例中数字病理图像标注方法的流程图;
图5为一个实施例中数字病理图像标注方法的流程图;
图6为一个实施例中数字病理图像标注装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明提供一种数字病理图像标注方法,所述方法包括:
步骤102,获取数字病理图像中已标注的目标区域和已标注的非目标区域,。
其中,数字病理图像是通过数字病理扫描仪对病理图像进行数字化扫描得到的。
其中,在进行数字病理图像标注之前,需要先通过病理医生标注出少量的目标区域与非目标区域。可以理解的,在本方案中,目标区域与非目标区域除了可以为任一类型的细胞区域,示例性的,目标区域可以为病变区域,非目标区域可以为非病变区域。
步骤104,根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域。
其中,数字病理图像上的除已标注的目标区域与已标注的非目标区域之外的其它区域即为待标注区域,获取到病理医生标注出少量的目标区域与非目标区域后即可获得。
步骤106,将所述待标注区域进行切割,得到多个待标注的小区域图像。
其中,确定了数字病理图像中的待标注区域后,为了对待标注区域进行准确的标注,需要将数字病理图像中的待标注区域进行切割,分为多个待标注的小区域图像。示例性的,对待标注区域进行256×256或512×512等像素大小的切割,可理解的,区域大小可根据实际需求进行切割。
步骤108,将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的。
其中,待标注区域是通过预测模型进行标注的。具体的,将待标注区域切割得到的多个待标注的小区域图像输入到预测模型后,预测模型经过预测,输出与每个小区域图像对应的预测结果。示例性的,对待标注区域进行256×256或512×512等像素大小的切割后,将多个256×256或512×512等像素大小的小区域图像分别作为预测模型的输入,获取预测模型输出的与每个小区域图像对应的预测结果。
其中,预测模型是基于已标注的目标区域和已标注的非目标区域进行训练得到的。
步骤110,根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
其中,预测结果为每个小区域图像与目标区域或非目标区域的相同概率。根据与目标区域或非目标区域的相同概率将小区域图像标注为新的目标区域或非目标区域。
本申请涉及一种数字病理图像标注方法,通过首先获取数字病理图像中已标注的目标区域和已标注的非目标区域,并根据已标注的目标区域和已标注的非目标区域确定所述数字病理图像中的待标注区域;然后将待标注区域进行切割,得到多个待标注的小区域图像,并将多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;最后根据每个小区域图像对应的预测结果,对每个小区域图像进行标注。本方案只需医生进行少量的标注,便可完成对整个数字病理图像的标注,最大化的降低病理医生投入到图像标注的繁琐工作中的平均时间的同时,还提高了标注数据要求的准确性及精确性。
在一个实施例中,如图2所示,所述预测模型是基于所述已标注的目标区域和所述非目标区域进行训练得到,包括:
步骤202,获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域。
其中,训练数字病理图像集是根据从病例库中筛选的多张数字病理图像建立的。具体的训练数字病理图像集中的多张数字病理图像已经通过病理医生标注了目标区域和非目标区域。
在一个实施例中,对于一张病理图像上已标注的目标区域和已标注的非目标区域,需要保证区域内标注的分类是完全正确的,不混杂其他类型的标注信息。示例性的,当病理类型是乳腺癌时,在病理医生所标注的目标区域内,大于95%或99%的面积内均为乳腺癌的肿瘤细胞,可以含有少量空隙、间质、血管,但是比例不宜超过5%。
步骤204,将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集。
其中,获取到训练数字病理图像后,将训练数字病理图像中已标注的目标区域进行切割,得到多张训练目标小区域图像,将多张训练目标小区域图像作为正向训练标签集,即得到目标区域的训练集。
步骤206,将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集。
其中,获取到训练数字病理图像后,将训练数字病理图像中已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将多张训练非目标小区域图像作为负向训练标签集,即得到非目标区域的训练集。
步骤208,基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型。
其中,将正向训练标签集和负向训练标签集输入到预测模型进行训练,得到训练好的预测模型。
在本实施例中,通过获取训练数字病理图像集中的多张训练数字病理图像,建立正向训练标签集和负向训练标签集,并训练得到训练好的预测模型。通过预测模型,基于病理医生少量的标注,便可完成对整个数字病理图像的标注,可以大大提升数字病理图像标注的效率与准确性。
在一个实施例中,如图3所示,所述预测结果包括:目标区域预测概率和非目标区域预测概率;所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注,包括:
步骤302,获取目标区域预测概率阈值;获取非目标区域预测概率阈值。
其中,目标区域预测概率是指对待标注区域每个小区域图像预测为目标区域的概率值;非目标区域预测概率是指对待标注区域每个小区域图像预测为非目标区域的概率值。在一个实施例中,目标区域预测概率阈值与非目标区域预测概率阈值是预设的,可以根据实际需求进行调节。
步骤304,根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注。
其中,根据目标区域预测概率阈值与目标区域预测概率判断每个小区域图像是否为目标区域;根据非目标区域预测概率阈值与非目标区域预测概率判断每个小区域图像是否为非目标区域。
在一个实施例中,目标区域预测概率阈值为0.9,非目标区域预测概率阈值为0.8,若小区域图像的目标区域预测概率大于0.9,则将该小区域图像标注为目标区域;若小区域图像的非目标区域预测概率大于0.8,则将该小区域图像标注为非目标区域。
在一个实施例中,所述目标区域预测概率阈值包括目标区域预测概率最大值与目标区域预测概率最小值,所述非目标区域预测概率阈值包括非目标区域预测概率最大值与非目标区域预测概率最小值;所述根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注,包括:若所述目标区域预测概率大于所述目标区域预测概率最大值,且所述非目标区域预测概率小于所述非目标区域预测概率最小值,则将所述小区域图像标注为目标区域;若所述目标区域预测概率小于所述目标区域预测概率最小值,且所述非目标区域预测概率大于所述非目标区域预测概率最大值,则将所述小区域图像标注为非目标区域。
在一个实施例中,Pa为目标区域预测概率,且Pa最大值为0.9,最小值为0.1;Pb为非目标区域预测概率,Pb最大值为0.8,最小值为0.2。若Pa>0.9且Pb<0.2,则将所述小区域图像标注为目标区域;若Pa<0.1且Pb>0.8,则将所述小区域图像标注为非目标区域。
在一个实施例中,如图4所示,所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注之前,还包括:
步骤402,获取与所述每个小区域图像对应的审核结果。
其中,根据目标区域预测概率阈值、目标区域预测概率、非目标区域预测概率阈值以及非目标区域预测概率,判断待标注区域每个小区域图像是目标区域或非目标区域后,还需要病理医生进行审核,以去除错误判断。
步骤404,若所述审核结果为通过,则进入根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注的步骤。
其中,如哦审核结果为通过时,则系统根据每个小区域图像对应的预测结果,对每个小区域图像进行标注;若审核不通过,则需要重新预测判断,并通过病理医生进行再次审核。
在本实施例中,通过获取与每个小区域图像对应的病理医生的审核结果,能够有效避免错误标注,提高标注的准确度。
在一个实施例中,如图5所示,所述获取训练数字病理图像集之前,还包括:
步骤502,确定病理类型,并根据所述病理类型,获取病例库中与所述病理类型对应的的初始数字病理图像。
其中,在进行预测模型训练之前,需要确认病理类型,并从病例库中获取与病理类型对应的的初始数字病理图像;从而训练出与病理类型对应的预测模型。
在一个实施例中,确定病理类型为乳腺癌,则从病例库中筛选出乳腺癌的病理病理图像,从而训练出与乳腺癌对应的预测模型。
步骤504,获取与所述病理类型对应的标准参数;所述标准参数至少包括组织总量、染色及制片效果、历史脱色是否严重中的一种。
其中,组织总量是指数字病理图像中的生物组织量是否充足;染色及制片效果是指数字病理图像中染图像是否完整或是否存在气泡;历史脱色是否严重是指数字病理图像是否由脱色严重的病理切片扫描得到。
步骤506,根据所述标准参数,确定所述初始数字病理图像中的训练数字病理图像。
其中,根据标准参数,去除掉组织总量少、染色及制片效果不佳、存在大量小气泡、历史脱色严重的病例,从而从初始数字病理图像中筛选出训练数字病理图像。可以理解的,标准参数是预先设置好的,示例性的,标准参数还可以包括有效肿瘤含量,从初始数字病理图像中筛选出训练数字病理图像时去除有效肿瘤含量少的数字病理图像。
步骤508,根据所述训练数字病理图像建立所述训练数字病理图像集。
其中,根据标准参数,从初始数字病理图像中筛选出训练数字病理图像后,根据多张训练数字病理图像建立训练数字病理图像集,用于对预测模型的训练。
如图6所示,本发明提出了一种病理图像标注装置,所述装置包括:
第一获取模块602,用于获取数字病理图像中已标注的目标区域和已标注的非目标区域;
第二获取模块604,用于根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
切割模块606,用于将所述待标注区域进行切割,得到多个待标注的小区域图像;
预测模块608,用于将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;
标注模块610,用于根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
在一个实施例中,一种病理图像标注装置还包括模型训练模块,用于首先获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域;然后将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集;接下来将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集;最后基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型。
如图7所示,在一个实施例中计算机设备的内部结构图。该计算机设备可以是一种数字病理图像标注装置、或与一种数字病理图像标注装置连接的终端或服务器。如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器、和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现一种数字病理图像标注方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种数字病理图像标注方法。网络接口用于与外接进行通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的一种数字病理图像标注方法可以实现为一种计算机程序的形式,计算机程序可在如图7所示的计算机设备上运行。计算机设备的存储器中可存储组成该基于多事件分发处理装置的各个程序模板。比如,第一获取模块602,第二获取模块604,切割模块606,预测模块608,标注模块610。
一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被该处理器执行时,使得该处理器执行如下步骤:获取数字病理图像中已标注的目标区域和已标注的非目标区域;根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;将所述待标注区域进行切割,得到多个待标注的小区域图像;将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
在一个实施例中,所述预测模型是基于所述已标注的目标区域和所述非目标区域进行训练得到,包括:获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域;将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集;将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集;基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型。
在一个实施例中,所述预测结果包括:目标区域预测概率和非目标区域预测概率;所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注,包括:获取目标区域预测概率阈值;获取非目标区域预测概率阈值;根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注。
在一个实施例中,所述目标区域预测概率阈值包括目标区域预测概率最大值与目标区域预测概率最小值,所述非目标区域预测概率阈值包括非目标区域预测概率最大值与非目标区域预测概率最小值;所述根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注,包括:若所述目标区域预测概率大于所述目标区域预测概率最大值,且所述非目标区域预测概率小于所述非目标区域预测概率最小值,则将所述小区域图像标注为目标区域;若所述目标区域预测概率小于所述目标区域预测概率最小值,且所述非目标区域预测概率大于所述非目标区域预测概率最大值,则将所述小区域图像标注为非目标区域。
在一个实施例中,所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注之前,还包括:获取与所述每个小区域图像对应的审核结果;若所述审核结果为通过,则进入根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注的步骤。
在一个实施例中,所述获取训练数字病理图像集之前,还包括:确定病理类型,并根据所述病理类型,获取病例库中与所述病理类型对应的的初始数字病理图像;获取与所述病理类型对应的标准参数;所述标准参数至少包括组织总量、染色及制片效果、历史脱色是否严重中的一种;根据所述标准参数,确定所述初始数字病理图像中的训练数字病理图像;根据所述训练数字病理图像建立所述训练数字病理图像集。
一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时,使得该处理器执行如下步骤:获取数字病理图像中已标注的目标区域和已标注的非目标区域;根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;将所述待标注区域进行切割,得到多个待标注的小区域图像;将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
在一个实施例中,所述预测模型是基于所述已标注的目标区域和所述非目标区域进行训练得到,包括:获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域;将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集;将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集;基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型。
在一个实施例中,所述预测结果包括:目标区域预测概率和非目标区域预测概率;所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注,包括:获取目标区域预测概率阈值;获取非目标区域预测概率阈值;根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注。
在一个实施例中,所述目标区域预测概率阈值包括目标区域预测概率最大值与目标区域预测概率最小值,所述非目标区域预测概率阈值包括非目标区域预测概率最大值与非目标区域预测概率最小值;所述根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注,包括:若所述目标区域预测概率大于所述目标区域预测概率最大值,且所述非目标区域预测概率小于所述非目标区域预测概率最小值,则将所述小区域图像标注为目标区域;若所述目标区域预测概率小于所述目标区域预测概率最小值,且所述非目标区域预测概率大于所述非目标区域预测概率最大值,则将所述小区域图像标注为非目标区域。
在一个实施例中,所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注之前,还包括:获取与所述每个小区域图像对应的审核结果;若所述审核结果为通过,则进入根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注的步骤。
在一个实施例中,所述获取训练数字病理图像集之前,还包括:确定病理类型,并根据所述病理类型,获取病例库中与所述病理类型对应的的初始数字病理图像;获取与所述病理类型对应的标准参数;所述标准参数至少包括组织总量、染色及制片效果、历史脱色是否严重中的一种;根据所述标准参数,确定所述初始数字病理图像中的训练数字病理图像;根据所述训练数字病理图像建立所述训练数字病理图像集。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上该实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种数字病理图像标注方法,其特征在于,所述方法包括:
获取数字病理图像中已标注的目标区域和已标注的非目标区域;
根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
将所述待标注区域进行切割,得到多个待标注的小区域图像;
将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;所述预测模型是基于所述已标注的目标区域和所述非目标区域进行训练得到,包括:获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域;将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集;将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集;基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型;所述获取训练数字病理图像集之前,还包括:确定病理类型,并根据所述病理类型,获取病例库中与所述病理类型对应的初始数字病理图像;获取与所述病理类型对应的标准参数;所述标准参数至少包括组织总量、染色及制片效果、历史脱色是否严重中的一种;根据所述标准参数,确定所述初始数字病理图像中的训练数字病理图像;根据所述训练数字病理图像建立所述训练数字病理图像集;
根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
2.如权利要求1所述的方法,其特征在于,所述预测结果包括:目标区域预测概率和非目标区域预测概率;所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注,包括:
获取目标区域预测概率阈值;获取非目标区域预测概率阈值;
根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注。
3.如权利要求2所述的方法,其特征在于,所述目标区域预测概率阈值包括目标区域预测概率最大值与目标区域预测概率最小值,所述非目标区域预测概率阈值包括非目标区域预测概率最大值与非目标区域预测概率最小值;所述根据所述目标区域预测概率阈值、所述目标区域预测概率、所述非目标区域预测概率阈值以及所述非目标区域预测概率对所述每个小区域图像进行标注,包括:
若所述目标区域预测概率大于所述目标区域预测概率最大值,且所述非目标区域预测概率小于所述非目标区域预测概率最小值,则将所述小区域图像标注为目标区域;
若所述目标区域预测概率小于所述目标区域预测概率最小值,且所述非目标区域预测概率大于所述非目标区域预测概率最大值,则将所述小区域图像标注为非目标区域。
4.如权利要求1所述的方法,其特征在于,所述根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注之前,还包括:
获取与所述每个小区域图像对应的审核结果;
若所述审核结果为通过,则进入根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注的步骤。
5.一种病理图像标注装置,其特征在于,所述装置包括:
第一获取模块,用于获取数字病理图像中已标注的目标区域和已标注的非目标区域;
第二获取模块,用于根据所述已标注的目标区域和所述已标注的非目标区域确定所述数字病理图像中的待标注区域;
切割模块,用于将所述待标注区域进行切割,得到多个待标注的小区域图像;
预测模块,用于将所述多个待标注的小区域图像分别作为预测模型的输入,获取所述预测模型输出的与每个小区域图像对应的预测结果,所述预测模型是基于所述已标注的目标区域和所述已标注的非目标区域进行训练得到的;所述预测模型是基于所述已标注的目标区域和所述非目标区域进行训练得到,包括:获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域;将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集;将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集;基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型;所述获取训练数字病理图像集之前,还包括:确定病理类型,并根据所述病理类型,获取病例库中与所述病理类型对应的初始数字病理图像;获取与所述病理类型对应的标准参数;所述标准参数至少包括组织总量、染色及制片效果、历史脱色是否严重中的一种;根据所述标准参数,确定所述初始数字病理图像中的训练数字病理图像;根据所述训练数字病理图像建立所述训练数字病理图像集;
标注模块,用于根据所述每个小区域图像对应的预测结果,对所述每个小区域图像进行标注。
6.如权利要求5所述的装置,其特征在于,所述装置还包括模型训练模块,用于首先获取训练数字病理图像集,所述训练数字病理图像集中包括多张训练数字病理图像,所述训练数字病理图像中包括已标注的目标区域和已标注的非目标区域;然后将所述已标注的目标区域进行切割,得到多张训练目标小区域图像,将所述多张训练目标小区域图像作为正向训练标签集;接下来将所述已标注的非目标区域进行切割,得到多张训练非目标小区域图像,将所述多张训练非目标小区域图像作为负向训练标签集;最后基于所述正向训练标签集和所述负向训练标签集对所述预测模型进行训练,得到训练完成的预测模型。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述方法的步骤。
8.种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110345956.5A CN113077876B (zh) | 2021-03-31 | 2021-03-31 | 数字病理图像标注方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110345956.5A CN113077876B (zh) | 2021-03-31 | 2021-03-31 | 数字病理图像标注方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113077876A CN113077876A (zh) | 2021-07-06 |
CN113077876B true CN113077876B (zh) | 2023-02-03 |
Family
ID=76614088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110345956.5A Active CN113077876B (zh) | 2021-03-31 | 2021-03-31 | 数字病理图像标注方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113077876B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021003938A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335250A (zh) * | 2019-05-31 | 2019-10-15 | 上海联影智能医疗科技有限公司 | 网络训练方法、装置、检测方法、计算机设备和存储介质 |
CN112132166B (zh) * | 2019-06-24 | 2024-04-19 | 杭州迪英加科技有限公司 | 一种数字细胞病理图像智能分析方法、系统及装置 |
CN110659692B (zh) * | 2019-09-26 | 2023-04-18 | 重庆大学 | 基于强化学习和深度神经网络的病理图像自动标注方法 |
CN111127471B (zh) * | 2019-12-27 | 2023-08-29 | 之江实验室 | 一种基于双标签损失的胃癌病理切片图像分割方法及系统 |
CN112508010A (zh) * | 2020-11-30 | 2021-03-16 | 广州金域医学检验中心有限公司 | 数字病理切片目标区域的识别方法、系统、设备及介质 |
-
2021
- 2021-03-31 CN CN202110345956.5A patent/CN113077876B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021003938A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113077876A (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11869185B2 (en) | Systems and methods for processing images to prepare slides for processed images for digital pathology | |
CN112508010A (zh) | 数字病理切片目标区域的识别方法、系统、设备及介质 | |
CN109712163B (zh) | 冠脉提取方法、装置、图像处理工作站和可读存储介质 | |
CN110909646B (zh) | 数字病理切片图像的采集方法、装置、计算机设备及存储介质 | |
CN110348477A (zh) | 医疗图像处理方法、存储介质及计算机设备 | |
CN112614573A (zh) | 基于病理图像标注工具的深度学习模型训练方法及装置 | |
CN111161212B (zh) | 数字病理切片有丝核分裂象统计方法、装置、设备和介质 | |
CN111951265A (zh) | 基于脑ct影像的脑梗评分方法、装置、计算机设备和存储介质 | |
CN114511547A (zh) | 病理切片图像质控方法、装置、设备及存储介质 | |
CN109978849B (zh) | 基于数字病理图像的基线细胞确定方法、装置及可读介质 | |
CN113077876B (zh) | 数字病理图像标注方法、装置、计算机设备及存储介质 | |
CN114255462A (zh) | 用于分析组织病理学图像数据的方法和设备 | |
CN111862001B (zh) | Ct影像的半自动标注方法及装置、电子设备、存储介质 | |
CN117036305A (zh) | 一种用于咽喉检查的图像处理方法、系统及存储介质 | |
CN111161240A (zh) | 血管分类方法、计算机设备和可读存储介质 | |
CN114170178A (zh) | 一种图像分割方法及存储介质 | |
Aubreville et al. | Field of Interest Proposal for Augmented Mitotic Cell Count: Comparison of Two Convolutional Networks. | |
CN110738664B (zh) | 图像定位方法、装置、计算机设备和存储介质 | |
CN113657558B (zh) | 一种针对骶髂关节ct图像的分类评级方法及装置 | |
CN114926465B (zh) | 一种存储介质和结直肠癌淋巴结转移预测模型构建系统 | |
CN116152806B (zh) | 一种基于卷积神经网络的骨髓细胞识别方法及系统 | |
CN113962991B (zh) | 医学图像的处理方法、装置、计算机设备及存储介质 | |
US20230098732A1 (en) | Systems and methods to process electronic images to selectively hide structures and artifacts for digital pathology image review | |
KR20240032031A (ko) | 블러 강건성을 제공하도록 전자 이미지를 처리하는 시스템 및 방법 | |
CN117315649A (zh) | 病理图片的解读方法及装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 510700 No. 10, helix 3 Road, International Biological Island, Huangpu District, Guangzhou City, Guangdong Province Applicant after: GUANGZHOU KINGMED CENTER FOR CLINICAL LABORATORY Address before: 510330 Guangdong Guangzhou Haizhuqu District Xingang East Road 2429, 3rd floor. Applicant before: GUANGZHOU KINGMED CENTER FOR CLINICAL LABORATORY |
|
GR01 | Patent grant | ||
GR01 | Patent grant |