CN116524295A - 一种图像处理方法、装置、设备及可读存储介质 - Google Patents
一种图像处理方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN116524295A CN116524295A CN202310410179.7A CN202310410179A CN116524295A CN 116524295 A CN116524295 A CN 116524295A CN 202310410179 A CN202310410179 A CN 202310410179A CN 116524295 A CN116524295 A CN 116524295A
- Authority
- CN
- China
- Prior art keywords
- feature
- target
- training sample
- image processing
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 287
- 238000012545 processing Methods 0.000 claims abstract description 165
- 238000000605 extraction Methods 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims description 70
- 230000004927 fusion Effects 0.000 claims description 40
- 238000010586 diagram Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 14
- 230000003190 augmentative effect Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 238000013434 data augmentation Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 230000003416 augmentation Effects 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000003902 lesion Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000002591 computed tomography Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000002603 single-photon emission computed tomography Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000013421 nuclear magnetic resonance imaging Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
Abstract
本说明书公开了一种图像处理方法、装置、设备及可读存储介质,将待处理的医学图像输入图像处理模型,通过特征提取单元得到目标特征,基于图像处理任务,从图像处理模型包含的各类型的预测单元中选择目标类型的预测单元,并将目标特征输入目标类型的预测单元,得到目标类型的预测单元输出的预测结果。由于图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到,各类型的预测单元是分别基于训练的特征提取单元和带各类型的标注的医学图像训练得到,因此,只需要获取少量带各类型的标注的医学图像,即可训练得到精度较高的多任务通用模型,实现对医学图像的各类型的图像处理任务,提高了对医学图像处理的效率。
Description
技术领域
本说明书涉及医疗技术领域,尤其涉及一种图像处理方法、装置、设备及可读存储介质。
背景技术
随着人工智能技术的发展,可以采用机器学习的方法,将用户的医学图像输入到预先训练的模型中,完成对医学图像的分类、分割或者检测等不同类型的任务。目前可以基于有标注的医学图像作为训练样本,对模型进行训练。但是由于获取医学图像的准确标注需要耗费大量人工,导致带有准确标注的训练样本的规模通常较小,从而使得模型的精度有限。
基于此,本说明书提供了一种图像处理方法。
发明内容
本说明书提供一种图像处理方法、装置、设备及可读存储介质,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种图像处理方法,图像处理模型包括预训练的特征提取单元和多个类型的预测单元;其中,不同类型的预测单元对应于不同类型的图像处理任务;所述方法包括:
响应于图像处理请求,获取待处理的医学图像;
将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征;
根据所述图像处理请求对应的图像处理任务,从各类型的预测单元中选择目标类型的预测单元;
将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果;
其中,所述图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到的,所述图像处理模型中各类型的预测单元是分别基于预训练的特征提取单元和带各类型的标注的医学图像训练得到的。
可选地,所述特征提取单元包括编码器和解码器;
将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征,具体包括:
将所述待处理的医学图像输入到所述图像处理模型,通过所述编码器得到第一特征图和第二特征图,其中,所述第一特征图的尺寸大于所述第二特征图的尺寸;
将所述第一特征图和所述第二特征图分别输入所述解码器,得到所述待处理的医学图像的第一特征和所述待处理的医学图像的第二特征;
将所述第一特征和所述第二特征进行特征融合,得到所述待处理的医学图像的目标特征。
可选地,将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果之前,所述方法还包括:
判断所述待处理医学图像的目标特征是否满足预设条件;
若否,通过所述编码器重新得到第二特征图,将重新得到的第二特征图输入所述解码器,重新确定第二特征,并根据重新确定的第二特征和上一次特征融合得到的目标特征,重新进行特征融合得到重新确定的目标特征,直到所述目标特征满足所述预设条件;
其中,所述重新得到的第二特征图的尺寸小于上一次得到的第二特征图的尺寸。
可选地,将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果之前,所述方法还包括:
将所述待处理医学图像输入所述解码器,得到所述解码器输出的所述待处理医学图像的第三特征;
将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果,具体包括:
将所述待处理医学图像的目标特征以及所述第三特征作为输入,输入到所述目标类型的预测层,得到所述目标类型的预测层输出的所述待处理医学图像的预测结果。
可选地,所述特征提取单元包括编码器和解码器;所述特征提取单元通过下述方式训练得到:
预先获取无标注的医学图像作为第一训练样本;
对所述第一训练样本进行数据增广得到增广样本;
根据所述增广样本,通过待训练的编码器和待训练的解码器,得到所述增广样本的复原图像;
以所述增广样本的复原图像和所述第一训练样本之间的差异的最小化为优化目标,调整所述编码器的参数和所述解码器的参数。
可选地,所述方法还包括:
根据所述第一训练样本中的目标区域,构建所述第一训练样本的正样本,并根据所述第一训练样本中除所述目标区域外的其余区域,构建所述第一训练样本的负样本;
根据所述第一训练样本、所述正样本和所述负样本,构建训练样本组;
将所述训练样本组包含的第一训练样本、正样本和负样本分别输入所述编码器,得到所述第一训练样本的特征、所述正样本的特征和所述负样本的特征;
以所述第一训练样本的特征和所述正样本的特征之间的相似度的最大化,以及所述第一训练样本的特征和所述负样本的特征之间的相似度的最小化为训练目标,训练所述编码器。
可选地,所述各类型的预测单元通过下述方式训练得到:
将获取到的带标注的医学图像作为第二训练样本,并确定所述第二训练样本对应于各类型的图像处理任务的标注;
将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征;
针对每个类型,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果;
根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,训练该类型的预测单元。
可选地,根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,训练该类型的预测单元,具体包括:
根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,确定该类型的损失;
以该类型的损失最小化为训练目标,训练该类型的预测层。
可选地,所述方法还包括:
根据所述各类型的损失确定总损失;
以所述总损失最小化为训练目标,调整所述解码器的参数。
可选地,将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征,具体包括:
将所述第二训练样本输入预训练的特征提取单元,通过所述特征提取单元中的编码器,得到所述第二训练样本的第一特征图和第二特征图;其中,所述第二训练样本的第一特征图的尺寸大于所述第二训练样本的第二特征图的尺寸;
根据所述第二训练样本的第一特征图和第二特征图,通过所述特征提取单元中的解码器,得到所述第二训练样本的第一特征和第二特征;
将所述第一特征和所述第二特征进行特征融合,得到所述第二训练样本的目标特征。
可选地,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果之前,所述方法还包括:
判断所述第二训练样本的目标特征是否满足预设条件;
若否,通过所述编码器重新得到所述第二训练样本的第二特征图,将重新得到的第二特征图重新输入到所述解码器,重新确定所述第二训练样本的第二特征,并根据重新确定的所述第二训练样本的第二特征和上一次特征融合得到的目标特征,重新进行特征融合得到重新确定的目标特征,直到所述第二训练样本的目标特征满足预设条件;
其中,所述重新得到的所述第二训练样本的第二特征图的尺寸小于上一次得到的第二特征图的尺寸。
可选地,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果之前,所述方法还包括:
将所述第二训练样本输入所述解码器,得到所述解码器输出的所述第二训练样本的第三特征;
将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果,具体包括:
将所述待处理医学图像的目标特征以及所述第二训练样本的第三特征作为输入,输入该类型的预测单元,得到该类型的预测单元输出的预测结果。
本说明书提供了一种图像处理装置,图像处理模型包括特征提取单元和多个类型的预测单元;其中,不同类型的预测单元对应于不同类型的图像处理任务;所述装置包括:
获取模块,用于响应于图像处理请求,获取待处理的医学图像;
目标特征确定模块,用于将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征;
选择模块,用于根据所述图像处理请求对应的图像处理任务,从各类型的预测单元中选择目标类型的预测单元;
预测模块,用于将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果;
其中,所述图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到的,所述图像处理模型中各类型的预测单元是分别基于预训练的特征提取单元和带各类型的标注的医学图像训练得到的。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像处理方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图像处理方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
本说明书提供的图像处理方法中,将待处理的医学图像输入图像处理模型,通过特征提取单元得到目标特征,基于图像处理任务,从图像处理模型包含的各类型的预测单元中选择目标类型的预测单元,并将目标特征输入目标类型的预测单元,得到目标类型的预测单元输出的预测结果。由于图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到,各类型的预测单元是分别基于训练的特征提取单元和带各类型的标注的医学图像训练得到因此,只需要获取少量带各类型的标注的医学图像,即可训练得到精度较高的多任务通用模型,实现对医学图像的各类型的图像处理任务,提高了对医学图像处理的效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附
图中:
图1为本说明书中一种图像处理方法的流程示意图;
图2为本说明书中一种图像处理模型的示意图;
图3为本说明书中一种图像处理模型的示意图;
图4为本说明书中一种图像处理方法的流程示意图;
图5为本说明书中一种图像处理模型的示意图;
图6为本说明书中一种图像处理方法的流程示意图;
图7为本说明书中一种图像处理方法的流程示意图;
图8为本说明书中一种图像处理方法的流程示意图;
图9为本说明书中一种图像处理方法的流程示意图;
图10为本说明书提供的一种图像处理装置的示意图;
图11为本说明书提供的对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
另外,需要说明的是,本说明书中所有获取信号、信息或数据的动作都是在遵照所在地相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
随着人工智能的发展,目前,大型视觉模型(Large Image Model,LIM)已经广泛应用于自然图像上,以实现不同类型的基于自然图像的图像处理任务。LIM的训练过程如下:首先基于大量的无标注的自然图像数据通过无监督(或者自监督)学习的方式,预训练图像处理模型的编码器,然后基于少量有标注的特定下游任务的图像数据,在预训练的编码器的基础上对不同类型的下游任务的任务组件(用于输出图像处理结果的模型网络)的模型参数进行微调。通过上述方案,LIM既可以通过大量无标注的训练样本具备从图像中提取丰富的语义信息,还可以实现基于少量无标注的训练样本适应于不同类型的图像处理任务。
但是,在医疗图像领域中,由于医疗图像涉及用户隐私,医疗图像的规模通常较小。并且,由于医疗图像表征的是人体组织的信息,而不同用户的相同部位的人体组织信息是极其相似的,因此,不同用户的医疗图像非常相似,仅在细微的细节处存在不同。这就导致基于自然图像训练得到的LIM无法直接应用在医疗图像领域,而且,由于医疗图像所表征的语义信息和自然图像所表征的语义信息存在较大的差异,仅将LIM中用于提取图像特征的部分网络迁移到医疗图像领域也可能会导致从医疗图像中提取的特征无法充分表征医疗图像的语义信息。
基于此,本说明书提供一种图像处理方法,该方法所采用的图像处理模型包含特征提取单元和预测单元,其中,特征提取单元用于从用户的医疗图像中提取图像特征,预测单元用于根据图像特征得到预测结果,以便采用预测结果执行相应的图像处理任务。其中,特征提取单元是基于无标注的医疗图像训练得到的,预测单元是基于少量有标注的医疗图像训练得到的。并且,图像处理模型包含的预测单元可以是多个,不同类型的预测单元对应于执行不同类型的图像处理任务。通过在图像处理模型中,配置特征提取单元为通用的公共网络,以及配置预测单元为特定的任务网络的模型结构,实现既具备了丰富的特征表达能力和高度的泛化能力,又适应于特定领域的任务的目的。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书提供的一种图像处理方法的流程示意图。
S100:响应于图像处理请求,获取待处理的医学图像。
本说明书实施例中提供的一种图像处理方法,该方法所采用的图像处理模型的模型训练方法的执行过程可由用于模型训练的服务器等电子设备执行。在图像处理模型训练完成后,所涉及到的基于训练完成的图像处理模型对医学影像执行图像处理方法的电子设备和执行图像处理模型的模型训练过程的电子设备可以相同也可以不同,本说明书对此不做限定。
其中,图像处理模型包括预训练的特征提取单元和多个类型的预测单元;其中,不同类型的预测单元对应于不同类型的图像处理任务,具体的图像处理模型的模型结构可如图2所示。
在实际应用中,可以基于机器学习模型对用户的医学影像进行不同类型的图像处理,并将图像处理结果作为参考结果反馈给医生,辅助医生对用户进行临床诊断。例如,对医学图像进行图像分割,得到医学图像中包含的用户的病灶区域,或者是对医学图像进行图像分类,确定该医学图像所表征的是用户的何种具体的人体部位,又或者是对医学图像进行检测和识别,对医学图像中的病灶区域进行病例类型的识别。
在本说明书一个或多个实施例中所涉及的医学图像可以是不同模态下的医学图像。其中,不同模态的医学图像可包括X射线、计算机断层扫描(Computed Tomography,CT)、单光子发射计算机断层扫描(Singlephoton Emission Computed Tomography,SPECT)、超声波(ultrasound,US)、磁共振成像(Nuclear Magnetic Resonance Imaging,MRI)、功能磁共振成像(functional Magnetic Resonance Imaging,fMRI)红外和紫外线、正电子发射断层扫描(Positron Emission Computed Tomography,PET)等。不同模态的医学图像能够从不同的维度或角度反映出用户的人体部位包含的病变的位置、大小、形态以及它在附近组织中引起的形态和结构变化。由于本说明书提供的图像处理方法所采用的图像处理模型在训练的过程中,就可以采用不同模态的医学图像作为训练样本,也即,图像处理模型可以是适用于多模态医学图像的图像处理模型。因此,在采用训练完成的图像处理模型进行对待处理的医学图像进行图像处理时,待处理的医学图像也可以是现有的任一模态的医学图像,本说明书对此不做限定。
需要说明的是,在本说明书一个或多个实施例中,基于训练完成的图像处理模型和待处理的医学图像得到的预测结果,仅作为参考结果或参考性的临床指标提供给医生,辅助医生对用户做出临床判断。该预测结果仅能够体现待处理的医学图像所表征的客观情况,无法作为诊断结果直接对用户进行诊断。另外,本说明书对医生基于预测结果做出诊断的具体方式不做限定。
另外,由本说明书提供的图像处理方法中所采用的图像处理模型包含多个类型的预测单元,并且,不同类型的预测单元对应于不同类型的图像处理任务,因此,医生(或其他医疗技术人员)可以基于实际需要,选择需要进行的图像处理任务。进而基于图像处理任务生成图像处理请求。这其中,基于图像处理任务生成图像处理请求的电子设备,与执行图像处理方法的电子设备可以相同,也可以不同,本说明书对此不做限定。
S102:将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征。
具体的,由于图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到的,因此,特征提取单元具备从图像中提取特征的能力,将待处理的医学图像输入预训练的特征提取单元中,可以得到待处理的医学图像的目标特征,其中,目标特征中可以包含待处理的医学图像的较为底层的特征,如图像的纹理、灰度的变化、边缘的轮廓等信息,也可以包含待处理的医学图像的较为高层的语义特征,如待处理的医学图像所表征的人体部位整体对象的信息。
由于特征提取单元是基于无标注的医学图像进行训练的,虽然由于医学图像涉及用户隐私,本身规模较小,但是基于无标注的医学图像进行训练得到的特征提取单元可以更好的适应于医学图像的领域。并且,相较于有标注的医学图像而言,无标注的医学图像的获取难度更低,因此,无标注的医学图像的规模比有标注的医学图像的规模更大,因此,对特征提取单元采用无标注的医学图像通过无监督(和/或自监督)学习的方式进行训练,相比于直接采用有标注的医学图像通过有监督学习的方式进行训练,所能够使用的训练样本的规模更大,因此,特征提取单元的精度更高。
S104:根据所述图像处理请求对应的图像处理任务,从各类型的预测单元中选择目标类型的预测单元。
具体的,医生(或医疗技术人员)可以基于实际需要选择需要进行的图像处理任务,进而基于图像处理任务生成图像处理请求。因此,执行图像处理方法的电子设备可以根据图像处理请求确定图像处理任务。并且,由于图像处理模型中的不同类型的预测单元对应于不同类型的图像处理任务,因此,可基于从图像处理请求中解析得到的图像处理任务的类型,从各类型的预测单元中选择目标类型的预测单元,从而在后续基于预测单元得到预测结果时,可以基于目标类型的预测单元,得到符合图像处理请求所对应的图像处理任务的预测结果。
另外,本说明书并不限制图像处理请求对应的图像处理任务的数量,也即,可以基于多个图像处理任务生成图像处理请求,从而在根据图像处理请求确定图像处理任务时,可得到多个类型的图像处理任务,并进而从各类型的预测单元中选择多个目标类型的预测单元,此时,各个目标类型的预测单元之间的类型不互相同。例如,医生基于实际需要,预先选择了病灶区域分割任务和人体部位识别任务这两种任务,那么,可以基于这两种任务,生成一个图像处理请求,该图像处理请求表征针对同一个(或同一组)待处理的医学图像分别执行病灶区域分割任务和人体部位识别任务这两种任务。并在特征提取单元确定待处理的医学图像的目标特征之后,可以将目标特征分别输入病灶区域分割任务对应的预测单元,以及人体部位识别任务对应的预测单元,分别得到待处理的医学图像中的病灶区域,以及待处理的医学图像所表征的人体部位信息。
S106:将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果。
其中,所述图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到的,所述图像处理模型中各类型的预测单元是分别基于预训练的特征提取单元和带各类型的标注的医学图像训练得到的。
通过将目标特征输入目标类型的预测单元,由目标类型的预测单元输出待处理的医学图像的预测结果,基于预测结果执行目标类型的预测单元所对应的图像处理任务。由于本说明书提供的图像处理方法所采用的图像处理模型采用了以特征提取单元作为通用的公共网络,以各类型的预测单元分别作为特定图像处理任务对应的特征网络为模型结构,实现了自动化地分析待处理的医学图像所表征的病灶区域和异常情况,包括不同的癌症、肿瘤的分类检测和病灶区域的分割等等,从而提高了临床效率和精度。
本说明提供的图像处理方法中,将待处理的医学图像输入图像处理模型,通过特征提取单元得到目标特征,基于图像处理任务,从图像处理模型包含的各类型的预测单元中选择目标类型的预测单元,并将目标特征输入目标类型的预测单元,得到目标类型的预测单元输出的预测结果。由于图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到,各类型的预测单元是分别基于训练的特征提取单元和带各类型的标注的医学图像训练得到因此,只需要获取少量带各类型的标注的医学图像,即可训练得到精度较高的多任务通用模型,实现对医学图像的各类型的图像处理任务,提高了对医学图像处理的效率。
在实际应用中,医学图像反映的是人体组织的信息,而人体组织本身相似度极高,仅在细微结构上存在差异。并且,在基于医学图像执行图像处理任务时,往往是基于医学图像反映的细微结构上的差异进行的。这就需要图像处理模型具备从相似的医学图像中提取细微特征的能力。为了进一步提从医学图像中提取细微特征,在本说明书一个或多个实施例中,可以在如图2所示的图像处理模型的基础上,通过特征提取单元包含的编码器输出的不同尺寸的特征图,并基于特征提取单元包含的解码器对不同尺寸的特征图进行解码,得到表征医学图像在不同维度上的语义信息的多个特征,并将这多个特征进行融合,从而得到包含各维度上的语义信息的目标特征。由此,本说明书实施例中,图像处理模型的模型结构可以细化为如图3所示的图像识别模型的示意图,基于图3所示的图像处理模型得到待处理图像的目标特征的具体方案如下,如图4所示:
S200:将所述待处理的医学图像输入到所述图像处理模型,通过所述编码器得到第一特征图和第二特征图,其中,所述第一特征图的尺寸大于所述第二特征图的尺寸。
具体的,在此做步骤中,将待处理医学图像输入特征提取单元的编码器,可以得到尺寸不相同的第一特征图和第二特征图,其中,第一特征图的尺寸大于第二特征图的尺寸。
另外,第一特征图的尺寸与待处理医学图像的原始尺寸可以相同,也可以不同,如果第一特征图的尺寸与待处理的医学图像的尺寸不同的话,一般的,为了得到精度较高的特征图,通常通过编码器得到下采样特征图的方式,因此,第一特征图的尺寸可以是小于待处理的医学图像的尺寸的。
在本说明书实施例中,由于不同尺寸的特征图所表征的待处理图像的语义信息不互相同,特征图的尺寸越大,越能表征细节和细微的微观特征;反之,尺寸越小,越能够表征整体的、对象级的、主要的宏观语义特征。因此,通过编码器得到不同尺寸的第一特征图和第二特征图,目的在于融合不同维度的待处理医学图像的特征信息,以丰富目标特征的信息。
S202:将所述第一特征图和所述第二特征图分别输入所述解码器,得到所述待处理的医学图像的第一特征和所述待处理的医学图像的第二特征。
具体的,在此步骤中,将第一特征图输入解码器,解码器输出第一特征图对应的第一特征。将第二特征图输入解码器,解码器输出第二特征图对应的第二特征。其中,第一特征的尺度与第二特征的尺度不同。也即,第一特征包含的待处理的医学图像的特征信息更为细节和微观,而第二特征包含的待处理的医学图像的特征信息更为宏观和整体。
基于本说明书提供的编解码器结构的特征提取单元,可以从待处理的医学图像中提取出不同尺度的特征,不同尺度的特征可以表征待处理的医学图像的不同维度的信息。在后续步骤中通过融合不同尺度的特征,可以丰富目标特征所包含的待处理的医学图像的特征信息,提高目标特征的精度,进一步使得目标类型的预测单元能够基于精度更高的目标特征得到更为精准的预测结果,提高预测结果作为参考信息的有效性,并提高临床效率。
S204:将所述第一特征和所述第二特征进行特征融合,得到所述待处理的医学图像的目标特征。
在本说明书实施例中,第一特征和第二特征的特征融合方式可以现有的任意融合方式,如加权融合、拼接等,本说明书对此不做限定。
更进一步的,在实际应用中,可能存在仅通过如图4所示的方案依然无法得到满足实际需求的目标特征,可以在如图4所示的方案的基础上,扩增得到目标特征所需要进行的特征融合的次数,即,通过编码器得到两个以上的不同尺寸的特征图,并基于解码器得到两个以上的特征,再将这多个特征分别进行融合,最终获得满足实际需求的目标特征,此时,图像处理模型的模型结构可扩增为如图5所示的示意图,基于图5所示的图像处理模型得到目标特征的具体方案可在上述如图4所示步骤S204所示得到将所述第一特征和所述第二特征进行特征融合,得到所述待处理的医学图像的目标特征之后,继续实施,因此,在如图4所示的方案的基础上,进行多次迭代得到待处理图像的目标特征的完整方案如下,如图6所示:
S300:将所述待处理的医学图像输入到所述图像处理模型,通过所述编码器得到第一特征图,并将所述第一特征图输入所述解码器,得到所述待处理的医学图像的第一特征。
此步骤与上述如图4所示步骤S200和S202类似,此处不做赘述。
S302:根据所述待处理医学图像,通过所述编码器得到第二特征图,并将所述第二特征图输入所述解码器,得到所述待处理的医学图像的第二特征,其中,所述第一特征图的尺寸大于所述第二特征图的尺寸。
此步骤与上述如图4所示步骤S200和S202类似,此处不做赘述。
需要说明的是,当通过下述步骤S306返回重新执行步骤S302时,通过编码器重新得到的第二特征图的尺寸小于上一次通过编码器得到的第二特征图的尺寸。
步骤S302与步骤S304与上述如图4所示步骤S202类似,此处不做赘述。
S304:将第二特征与上一次特征融合得到的目标特征进行特征融合,得到所述待处理的医学图像的目标特征。其中,在第一次特征融合时,将第一特征与第二特征进行特征融合,得到所述待处理的医学图像的目标特征。
上述如图4步骤S204所示仅为将第一特征和第二特征这两个不同尺度的特征进行融合得到目标特征。而在实际应用中,可能存在待处理的医学图像所能够表征的特征存在多个尺度的情况,即可以通过编码器得到多个不同尺寸的特征图,并通过解码器基于这多个不同尺寸的特征图,得到多个尺度的待处理的医学图像的特征,并以此将这多个尺度的特征依次融合,从而使得融合得到的目标特征能够包含多个不同尺度的特征,从而获得包含丰富特征信息的目标特征。
因此,在进行特征融合时,将第二特征与上一次特征融合得到的目标特征进行特征融合,确定当前特征融合得到的目标特征。
S306:判断所述待处理医学图像的目标特征是否满足预设条件。若是,执行步骤S308,若否,返回重新执行步骤S302。
如上述步骤S302所述,返回执行步骤S302时,通过编码器重新得到的第二特征图的尺寸可小于上一次通过编码器得到的第二特征图的尺寸,也就是说,基于重新编码的第二特征图再次得到的第二特征,相较于上一次得到的第二特征,所表征的特征更为宏观和整体,并且包含更为高层的语义信息,将重新得到的第二特征与上一次特征融合得到的目标特征进行特征融合,可以将不同尺度、不同层级的待处理的医学图像的特征信息融合到目标特征中,从而赋予目标特征更为丰富的特征信息。
其中,目标特征所需要满足的预设条件可以是人工预先设置的,预设条件具体可以是得到目标特征所需要的特征融合的次数、得到目标特征所需要获得的第二特征图的尺寸等条件,本说明书对此不做限定。
S308:将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果。
此步骤与如图1所示步骤S106相同,此处不再赘述。
在本说明书一个可选的实施例中,为了保证目标特征包含待处理的医学图像包含的底层信息,如纹理、形状等信息,在如图1所示步骤S106所示将所述待处理的医学图像的目标特征输入所述目标类型的预测单元之前,或者在如图6所示步骤S308所示的将所述待处理的医学图像的目标特征输入所述目标类型的预测单元之前,还可以将待处理的医学图像直接输入编码器,得到包含图像底层信息的第三特征,进而将第三特征和目标特征均作为预测单元的输入,使得预测单元能够基于待处理的医学图像的底层信息,和不同维度的语义信息,得到预测结果。
具体的,首先,在将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果之前,将所述待处理医学图像输入所述解码器,得到所述解码器输出的所述待处理医学图像的第三特征。
然后,将所述待处理医学图像的目标特征以及所述第三特征作为输入,输入到所述目标类型的预测层,得到所述目标类型的预测层输出的所述待处理医学图像的预测结果。
在本说明书一个或多个实施例中,如图1~图6所涉及的图像识别模型至少包含特征提取单元和多个不同类型的预测单元,其中,特征提取单元可以包括编码器和解码器,并且,编码器和解码器可以基于无标注的医学图像进行预训练,因此,特征提取单元的训练方案如图7所示,具体包含以下步骤:
S400:预先获取无标注的医学图像作为第一训练样本。
在实际应用中,由于医学图像通常涉及用户的隐私,因此,相对于自然图像的规模而言,医学图像的规模较小。并且,由于医学图像的准确标注通常基于人工标注得到,不仅存在隐私安全问题,还存在耗费人工的问题,因此,带有准确标注的医学图像更加难以获取。为此,在本说明书实施例中,为了使得图像识别模型更为适应于医疗图像领域,采用无标注的医学图像作为特征提取单元的第一训练样本。虽然,第一训练样本的规模比自然图像的规模小,但基于第一训练样本训练得到的特征提取单元与医疗图像领域更加适配,因此,在医学图像上的特征提取的准确度更高。
S402:对所述第一训练样本进行数据增广得到增广样本。
基于无标注的医学图像的规模仍然较小的问题,在本说明书实施例中,采用现有的任一数据增广方式,对第一训练样本进行数据增广,得到增广样本,从而基于增广样本训练特征提取单元的编码器和解码器。其中,数据增广的方式可以是对第一训练样本进行旋转、移位、增加噪声、遮蔽等数据增广的方式,本说明书对此不做限定。
S404:根据所述增广样本,通过待训练的编码器和待训练的解码器,得到所述增广样本的复原图像。
基于增广样本训练编码器和解码器的方式,可以是通过编码器提取增广样本的图像特征,然后将增广样本的图像特征输入解码器,通过解码器得到增广样本的复原图像,通过复原图像和原始的第一训练样本之间的差异,训练编码器和解码器。
S406:以所述增广样本的复原图像和所述第一训练样本之间的差异的最小化为优化目标,调整所述编码器的参数和所述解码器的参数。
具体的,可以基于增广样本的复原图像和第一训练样本之间的差异确定损失,并以损失的最小化为训练目标,训练编码器和解码器。
另外,在上述如图7所示步骤S406调整编码器的参数时,除了可以基于所述增广样本的复原图像和所述第一训练样本之间的差异的最小化为优化目标,还可以基于对比学习的思想,根据第一训练样本构建训练样本组,并基于训练样本组,以及增广样本的复原图像和所述第一训练样本之间的差异,对编码器的参数进行优化,具体方案如下,如图8所示:
S500:根据所述第一训练样本中的目标区域,构建所述第一训练样本的正样本,并根据所述第一训练样本中除所述目标区域外的其余区域,构建所述第一训练样本的负样本。
具体的,编码器还可以基于对比学习的思想进行训练,为此需要基于第一训练样本构建三元组,即训练样本组。训练样本组中可包含第一训练样本、第一训练样本的正样本和第一训练样本的负样本。其中,构成第一训练样本的正样本所采用的第一训练样本中的目标区域,可以是第一训练样本中包含实际意义的区域,例如病灶区域、人体部位区域等。从第一训练样本中获取目标区域的方法可以是基于人工标注或者其他用于区域划分的机器学习模型得到,本说明书对此不做限定。
根据目标区域构建第一训练样本的正样本的方法可以是将其他医学影像与目标区域进行融合得到,相对应的,根据除目标区域外的其他区域构建第一训练样本的负样本的方法可以是将与目标区域形状大小近似的其他医学影像,与除目标区域外的其他区域进行融合得到。
于是,第一训练样本的正样本与第一训练样本都包含有目标区域,第一训练样本的负样本与第一训练样本都包含有除目标区域外的其他区域。这样,在基于训练样本组训练编码器的过程中,编码器可以通过学习第一训练样本和正样本之间共同的目标区域的特征。
S502:根据所述第一训练样本、所述正样本和所述负样本,构建训练样本组。
S504:将所述训练样本组包含的第一训练样本、正样本和负样本分别输入所述编码器,得到所述第一训练样本的特征、所述正样本的特征和所述负样本的特征。
S506:以所述第一训练样本的特征和所述正样本的特征之间的相似度的最大化,以及所述第一训练样本的特征和所述负样本的特征之间的相似度的最小化为训练目标,训练所述编码器。
需要说明的是,在本说明书中,特征提取单元中编码器的训练方式可以是基于上述图7所示的步骤S400至S406,也可以是基于上述如图8所示步骤S500至S506,当然还可以是图7所示的步骤S400至S406与图8所示步骤S500至S506的结合,本说明书对此不做限定。
在本说明书一个或多个实施例中,如图1~图6所涉及的图像识别模型至少包含特征提取单元和多个不同类型的预测单元,不同类型的预测单元对应于不同的图像处理任务,为此需要基于带有标注的医学图像作为训练样本进行训练,预测单元的训练方案如图9所示,具体包含以下步骤:
S600:将获取到的带标注的医学图像作为第二训练样本,并确定所述第二训练样本对应于各类型的图像处理任务的标注。
在实际应用中,可以对医学图像进行目标区域的分割、分类或者识别,确定医学图像所表征的用户的人体部位或健康状况。因此,图像处理模型中各类型的预测单元可对应于不同的图像处理任务,各类型的图像处理任务可以是针对医学图像中目标区域的分割(如分割出病灶区域)、针对医学图像进行分类,识别医学图像所表征的人体部位等任务。为了提高模型的准确性,在本说明书实施例中,各类型的预测单元采用有监督学习的方式进行训练。因此,需要获取第二训练样本对应于各类型的图像处理任务的标注,其中,第二训练样本对应于各类型的图像处理任务的标注可以来源于人工标注、通过其他现有的机器学习模型进行标注等现有的任意标注获取方法,本说明书对此不做限定。
S602:将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征。
在此步骤中,将第二训练样本输入预训练的特征提取单元时,该预训练的特征提取单元可以是现有任一用于特征提取的网络结构,如编解码器结构,本说明书对此不做限定。
S604:针对每个类型,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果。
S606:根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,训练该类型的预测单元。
具体的,可以基于该类型的预测单元输出的预测结果,以及第二训练样本对应于该类型的图像处理任务的标注之间的差异,以所述差异最小化为训练目标训练该类型的预测单元。
可选地,根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,确定该类型的损失,以该类型的损失最小化为训练目标,训练该类型的预测层。
在本说明书一个可选的实施例中,还可以基于各类型的预测单元在训练过程中分别得到的各类型的损失,对特征提取单元的解码器的模型参数进行微调,实现解码器与各类型的预测单元的联合训练,具体的:
首先,根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,确定该类型的损失。
其次,根据各类型的损失,确定总损失;
然后,以总损失的最小化为优化目标,调整解码器的模型参数。
通过上述方案,在各类型的预测单元的训练过程中,还对特征提取单元的解码器的模型参数进行微调,通过各类型的预测单元和解码器的联合训练,使得特征提取单元的解码器更适用于具体执行医学图像领域的各类型的图像处理任务,从而提高图像处理模型得到各类型的预测结果的准确性。
在本说明书一个或多个实施例中,图像处理模型在训练过程中也可以采用与上述图4所示的各步骤类似的特征融合的方案,然后再基于特征融合得到的训练样本的目标特征,执行预测单元的训练过程,通过这种方式训练得到的预测单元,才能够针对待处理的医学图像的目标特征得到适应于不同类型的图像处理任务的预测结果。基于此,在上述如图9步骤S602所示将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征,具体可通过下述方案得到:
第一步:将所述第二训练样本输入预训练的特征提取单元,通过所述特征提取单元中的编码器,得到所述第二训练样本的第一特征图和第二特征图。其中,所述第二训练样本的第一特征图的尺寸大于所述第二训练样本的第二特征图的尺寸。
第二步:根据所述第二训练样本的第一特征图和第二特征图,通过所述特征提取单元中的解码器,得到所述第二训练样本的第一特征和第二特征。
第三步:将所述第一特征和所述第二特征进行特征融合,得到所述第二训练样本的目标特征。
进一步的,基于与如图6所示的图像处理方法同样的思想,在预测单元的训练过程中,所得到的第二训练样本的目标特征还可以是在第一特征和第二特征融合的基础上,再进行多次特征融合,以便将第二训练样本包含的各个维度的语音信息都包含在目标特征中,使得预测单元能够基于更为全面的特征学习到更加精准的预测能力,从而提高图像处理模型的准确性,具体方案如下:
第一步:将所述第二训练样本输入预训练的特征提取单元,通过特征提取单元中的编码器得到第二训练样本的第一特征图,并将所述述第二训练样本的第一特征图输入所述解码器,得到所述第二训练样本的第一特征。
第二步:根据所述第二训练样本,通过所述编码器得到第二训练样本的第二特征图,并将所述第二训练样本的第二特征图输入所述解码器,得到所述第二训练样本的第二特征,其中,所述第一特征图的尺寸大于所述第二特征图的尺寸。
第三步:将第二训练样本的第二特征与上一次特征融合得到的第二训练样本的目标特征进行特征融合,得到所述第二训练样本的目标特征。其中,在第一次特征融合时,将第二训练样本的第一特征与第二训练样本的第二特征进行特征融合,得到所述第二训练样本的目标特征。
第四步:判断所述第二训练样本的目标特征是否满足预设条件,若是,执行第五步,否则返回第二步。
需要说明的是,当通过第四步返回重新执行步骤第二步时,通过编码器重新得到的第二训练样本的第二特征图的尺寸小于上一次通过编码器得到的第二特征图的尺寸。
第五步:将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果。
在本说明书一个可选的实施例中,为了在图像处理模型的训练过程中,基于更为全面的图像信息训练各类型的预测单元,需要保证目标特征包含待第二训练样本的底层信息,如纹理、形状等信息。因此,在上述步骤所示将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果之前,还可以将第二训练样本直接输入编码器,得到包含图像底层信息的第二训练样本的第三特征,进而将第三特征和目标特征均作为待训练的各类型的预测单元的输入,使得预测单元能够基于第二训练样本的底层信息和不同维度的语义信息,得到预测结果。
图10为本说明书提供的一种图像处理装置示意图,其中,图像处理模型包括特征提取单元和多个类型的预测单元;其中,不同类型的预测单元对应于不同类型的图像处理任务;所述装置包括:
获取模块700,用于响应于图像处理请求,获取待处理的医学图像;
目标特征确定模块702,用于将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征;
选择模块704,用于根据所述图像处理请求对应的图像处理任务,从各类型的预测单元中选择目标类型的预测单元;
预测模块706,用于将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果;
其中,所述图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到的,所述图像处理模型中各类型的预测单元是分别基于预训练的特征提取单元和带各类型的标注的医学图像训练得到的。
可选地,所述特征提取单元包括编码器和解码器;
可选地,所述目标特征确定模块702具体用于,将所述待处理的医学图像输入到所述图像处理模型,通过所述编码器得到第一特征图和第二特征图,其中,所述第一特征图的尺寸大于所述第二特征图的尺寸;将所述第一特征图和所述第二特征图分别输入所述解码器,得到所述待处理的医学图像的第一特征和所述待处理的医学图像的第二特征;将所述第一特征和所述第二特征进行特征融合,得到所述待处理的医学图像的目标特征。
可选地,所述装置还包括:
融合模块708,具体用于判断所述待处理医学图像的目标特征是否满足预设条件;若否,通过所述编码器重新得到第二特征图,将重新得到的第二特征图输入所述解码器,重新确定第二特征,并根据重新确定的第二特征和上一次特征融合得到的目标特征,重新进行特征融合得到重新确定的目标特征,直到所述目标特征满足所述预设条件;其中,所述重新得到的第二特征图的尺寸小于上一次得到的第二特征图的尺寸。
可选地,所述装置还包括:
第三特征确定模块710,具体用于将所述待处理医学图像输入所述解码器,得到所述解码器输出的所述待处理医学图像的第三特征;
可选地,所述预测模块706具体用于,将所述待处理医学图像的目标特征以及所述第三特征作为输入,输入到所述目标类型的预测层,得到所述目标类型的预测层输出的所述待处理医学图像的预测结果。
可选地,所述特征提取单元包括编码器和解码器;
可选地,所述装置还包括:
第一训练模块712,具体用于预先获取无标注的医学图像作为第一训练样本;对所述第一训练样本进行数据增广得到增广样本;根据所述增广样本,通过待训练的编码器和待训练的解码器,得到所述增广样本的复原图像;以所述增广样本的复原图像和所述第一训练样本之间的差异的最小化为优化目标,调整所述编码器的参数和所述解码器的参数。
可选地,所述装置还包括:
第二训练模块714,具体用于根据所述第一训练样本中的目标区域,构建所述第一训练样本的正样本,并根据所述第一训练样本中除所述目标区域外的其余区域,构建所述第一训练样本的负样本;根据所述第一训练样本、所述正样本和所述负样本,构建训练样本组;将所述训练样本组包含的第一训练样本、正样本和负样本分别输入所述编码器,得到所述第一训练样本的特征、所述正样本的特征和所述负样本的特征;以所述第一训练样本的特征和所述正样本的特征之间的相似度的最大化,以及所述第一训练样本的特征和所述负样本的特征之间的相似度的最小化为训练目标,训练所述编码器。
可选地,所所述装置还包括:
第三训练模块716,将获取到的带标注的医学图像作为第二训练样本,并确定所述第二训练样本对应于各类型的图像处理任务的标注;将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征;针对每个类型,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果;根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,训练该类型的预测单元。
可选地,所述第三训练模块716具体用于,根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,确定该类型的损失;以该类型的损失最小化为训练目标,训练该类型的预测层。
可选地,所述第三训练模块716还用于根据所述各类型的损失确定总损失;以所述总损失最小化为训练目标,调整所述解码器的参数。
可选地,所述第三训练模块716具体用于,将所述第二训练样本输入预训练的特征提取单元,通过所述特征提取单元中的编码器,得到所述第二训练样本的第一特征图和第二特征图;其中,所述第二训练样本的第一特征图的尺寸大于所述第二训练样本的第二特征图的尺寸;根据所述第二训练样本的第一特征图和第二特征图,通过所述特征提取单元中的解码器,得到所述第二训练样本的第一特征和第二特征;将所述第一特征和所述第二特征进行特征融合,得到所述第二训练样本的目标特征。
可选地,所述第三训练模块716还用于,判断所述第二训练样本的目标特征是否满足预设条件;若否,通过所述编码器重新得到所述第二训练样本的第二特征图,将重新得到的第二特征图重新输入到所述解码器,重新确定所述第二训练样本的第二特征,并根据重新确定的所述第二训练样本的第二特征和上一次特征融合得到的目标特征,重新进行特征融合得到重新确定的目标特征,直到所述第二训练样本的目标特征满足预设条件;其中,所述重新得到的所述第二训练样本的第二特征图的尺寸小于上一次得到的第二特征图的尺寸。
可选地,所述第三训练模块716还用于,将所述第二训练样本输入所述解码器,得到所述解码器输出的所述第二训练样本的第三特征;
可选地,所述预测模块706具体用于,将所述待处理医学图像的目标特征以及所述第二训练样本的第三特征作为输入,输入该类型的预测单元,得到该类型的预测单元输出的预测结果。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1所示的图像处理方法。
本说明书还提供了图11所示的电子设备的示意结构图。如图11所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所示的图像处理方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种图像处理方法,其特征在于,图像处理模型包括预训练的特征提取单元和多个类型的预测单元;其中,不同类型的预测单元对应于不同类型的图像处理任务;所述方法包括:
响应于图像处理请求,获取待处理的医学图像;
将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征;
根据所述图像处理请求对应的图像处理任务,从各类型的预测单元中选择目标类型的预测单元;
将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果;
其中,所述图像处理模型中的特征提取单元是基于无标注的医学图像预训练得到的,所述图像处理模型中各类型的预测单元是分别基于预训练的特征提取单元和带各类型的标注的医学图像训练得到的。
2.如权利要求1所述的方法,其特征在于,所述特征提取单元包括编码器和解码器;
将所述待处理的医学图像输入到所述图像处理模型,通过所述特征提取单元得到所述待处理的医学图像的目标特征,具体包括:
将所述待处理的医学图像输入到所述图像处理模型,通过所述编码器得到第一特征图和第二特征图,其中,所述第一特征图的尺寸大于所述第二特征图的尺寸;
将所述第一特征图和所述第二特征图分别输入所述解码器,得到所述待处理的医学图像的第一特征和所述待处理的医学图像的第二特征;
将所述第一特征和所述第二特征进行特征融合,得到所述待处理的医学图像的目标特征。
3.如权利要求2所述的方法,其特征在于,将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果之前,所述方法还包括:
判断所述待处理医学图像的目标特征是否满足预设条件;
若否,通过所述编码器重新得到第二特征图,将重新得到的第二特征图输入所述解码器,重新确定第二特征,并根据重新确定的第二特征和上一次特征融合得到的目标特征,重新进行特征融合得到重新确定的目标特征,直到所述目标特征满足所述预设条件;
其中,所述重新得到的第二特征图的尺寸小于上一次得到的第二特征图的尺寸。
4.如权利要求1所述的方法,其特征在于,将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果之前,所述方法还包括:
将所述待处理医学图像输入特征提取单元中的解码器,得到所述解码器输出的所述待处理医学图像的第三特征;
将所述待处理的医学图像的目标特征输入所述目标类型的预测单元,得到所述目标类型的预测单元输出的所述待处理的医学图像的预测结果,具体包括:
将所述待处理医学图像的目标特征以及所述第三特征作为输入,输入到所述目标类型的预测层,得到所述目标类型的预测层输出的所述待处理医学图像的预测结果。
5.如权利要求1所述的方法,其特征在于,所述各类型的预测单元通过下述方式训练得到:
将获取到的带标注的医学图像作为第二训练样本,并确定所述第二训练样本对应于各类型的图像处理任务的标注;
将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征;
针对每个类型,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果;
根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,训练该类型的预测单元。
6.如权利要求5所述的方法,其特征在于,根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,训练该类型的预测单元,具体包括:
根据该类型的预测单元输出的预测结果,以及所述第二训练样本对应于该类型的图像处理任务的标注,确定该类型的损失;
以该类型的损失最小化为训练目标,训练该类型的预测层。
7.如权利要求5所述的方法,其特征在于,将所述第二训练样本输入预训练的特征提取单元,得到所述特征提取单元输出的所述第二训练样本的目标特征,具体包括:
将所述第二训练样本输入预训练的特征提取单元,通过所述特征提取单元中的编码器,得到所述第二训练样本的第一特征图和第二特征图;其中,所述第二训练样本的第一特征图的尺寸大于所述第二训练样本的第二特征图的尺寸;
根据所述第二训练样本的第一特征图和第二特征图,通过所述特征提取单元中的解码器,得到所述第二训练样本的第一特征和第二特征;
将所述第一特征和所述第二特征进行特征融合,得到所述第二训练样本的目标特征。
8.如权利要求7所述的方法,其特征在于,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果之前,所述方法还包括:
判断所述第二训练样本的目标特征是否满足预设条件;
若否,通过所述编码器重新得到所述第二训练样本的第二特征图,将重新得到的第二特征图重新输入到所述解码器,重新确定所述第二训练样本的第二特征,并根据重新确定的所述第二训练样本的第二特征和上一次特征融合得到的目标特征,重新进行特征融合得到重新确定的目标特征,直到所述第二训练样本的目标特征满足预设条件;
其中,所述重新得到的所述第二训练样本的第二特征图的尺寸小于上一次得到的第二特征图的尺寸。
9.如权利要求5所述的方法,其特征在于,将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果之前,所述方法还包括:
将所述第二训练样本输入所述特征提取单元中的解码器,得到所述解码器输出的所述第二训练样本的第三特征;
将所述第二训练样本的目标特征输入该类型的预测单元,得到该类型的预测单元输出的预测结果,具体包括:
将所述待处理医学图像的目标特征以及所述第二训练样本的第三特征作为输入,输入该类型的预测单元,得到该类型的预测单元输出的预测结果。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310410179.7A CN116524295A (zh) | 2023-04-17 | 2023-04-17 | 一种图像处理方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310410179.7A CN116524295A (zh) | 2023-04-17 | 2023-04-17 | 一种图像处理方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116524295A true CN116524295A (zh) | 2023-08-01 |
Family
ID=87389553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310410179.7A Pending CN116524295A (zh) | 2023-04-17 | 2023-04-17 | 一种图像处理方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116524295A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117036830A (zh) * | 2023-10-07 | 2023-11-10 | 之江实验室 | 一种肿瘤分类模型训练方法、装置、存储介质及电子设备 |
-
2023
- 2023-04-17 CN CN202310410179.7A patent/CN116524295A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117036830A (zh) * | 2023-10-07 | 2023-11-10 | 之江实验室 | 一种肿瘤分类模型训练方法、装置、存储介质及电子设备 |
CN117036830B (zh) * | 2023-10-07 | 2024-01-09 | 之江实验室 | 一种肿瘤分类模型训练方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112862805B (zh) | 听神经瘤图像自动化分割方法及系统 | |
CN112784857B (zh) | 一种模型训练以及图像处理方法及装置 | |
CN111161279A (zh) | 医学图像分割方法、装置及服务器 | |
CN116168258B (zh) | 一种目标物分类方法、装置、设备及可读存储介质 | |
CN116524295A (zh) | 一种图像处理方法、装置、设备及可读存储介质 | |
CN116342888B (zh) | 一种基于稀疏标注训练分割模型的方法及装置 | |
CN117409466B (zh) | 一种基于多标签控制的三维动态表情生成方法及装置 | |
CN117880444A (zh) | 一种长短时特征引导的人体康复运动视频数据生成方法 | |
CN116030247B (zh) | 一种医学图像样本生成方法、装置、存储介质及电子设备 | |
CN113160165A (zh) | 一种血管分割方法、装置以及设备 | |
CN116168154A (zh) | 一种预测方法、装置、设备及可读存储介质 | |
CN115082405B (zh) | 颅内病灶的检测模型的训练方法、检测方法、装置及设备 | |
CN116229218B (zh) | 一种模型训练、图像配准方法及装置 | |
CN115552464A (zh) | 通过预测有符号距离图进行形状感知器官分割 | |
CN116152246B (zh) | 一种图像识别方法、装置、设备及存储介质 | |
CN116188469A (zh) | 一种病灶检测方法、装置、可读存储介质及电子设备 | |
CN117036830B (zh) | 一种肿瘤分类模型训练方法、装置、存储介质及电子设备 | |
CN116935055B (zh) | 一种基于注意力掩码的弱监督语义分割方法及装置 | |
CN117635912A (zh) | 一种感兴趣部位生长预测的方法、装置、介质及设备 | |
CN117726907B (zh) | 一种建模模型的训练方法、三维人体建模的方法以及装置 | |
CN116152600A (zh) | 一种模型训练方法、装置、设备及可读存储介质 | |
CN117788953A (zh) | 一种感兴趣区域的识别方法、装置、存储介质及电子设备 | |
CN116309430A (zh) | 一种管状器官的检测方法、装置、存储介质及设备 | |
CN116824247A (zh) | 一种图像识别的方法、装置、存储介质及电子设备 | |
CN117133019A (zh) | 一种数据处理的方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |