CN109978886B - 图像处理方法及装置、电子设备和存储介质 - Google Patents
图像处理方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN109978886B CN109978886B CN201910258038.1A CN201910258038A CN109978886B CN 109978886 B CN109978886 B CN 109978886B CN 201910258038 A CN201910258038 A CN 201910258038A CN 109978886 B CN109978886 B CN 109978886B
- Authority
- CN
- China
- Prior art keywords
- result
- convolution
- segmentation
- processing
- positioning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 38
- 238000003860 storage Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 213
- 230000011218 segmentation Effects 0.000 claims abstract description 207
- 238000000034 method Methods 0.000 claims abstract description 129
- 230000008569 process Effects 0.000 claims abstract description 78
- 238000012549 training Methods 0.000 claims description 60
- 238000010586 diagram Methods 0.000 claims description 48
- 238000013528 artificial neural network Methods 0.000 claims description 46
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005520 cutting process Methods 0.000 claims description 8
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims 4
- 230000006870 function Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 206010003658 Atrial Fibrillation Diseases 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000011298 ablation treatment Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000001746 atrial effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000005242 cardiac chamber Anatomy 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002837 heart atrium Anatomy 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/143—Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B2576/00—Medical imaging apparatus involving image processing or analysis
- A61B2576/02—Medical imaging apparatus involving image processing or analysis specially adapted for a particular organ or body part
- A61B2576/023—Medical imaging apparatus involving image processing or analysis specially adapted for a particular organ or body part for the heart
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30048—Heart; Cardiac
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Surgery (AREA)
- Heart & Thoracic Surgery (AREA)
- Pathology (AREA)
- Psychiatry (AREA)
- Physiology (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种图像处理方法及装置、电子设备和存储介质,所述方法包括:对待处理图像进行逐级卷积处理,得到卷积结果;根据所述卷积结果,通过定位处理得到定位结果;对所述定位结果进行逐级反卷积处理,得到反卷积结果;对所述反卷积结果进行分割处理,从所述待处理图像中分割出目标对象。本公开实施例可实现在一次图像处理的过程中同时实现目标对象的定位和分割,提高图像处理精度的同时保障图像处理的速度。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法及装置、电子设备和存储介质。
背景技术
在图像技术领域,对感兴趣区域或目标区域进行分割,是进行图像分析和目标识别的基础。例如,在医学图像中通过分割,清晰地识别一个或多个器官或病灶之间的边界。准确地分割三维医学图像对于许多临床应用而言是至关重要的。
发明内容
本公开提出了一种图像处理技术方案。
根据本公开的一方面,提供了一种图像处理方法,包括:对待处理图像进行逐级卷积处理,得到卷积结果;根据所述卷积结果,通过定位处理得到定位结果;对所述定位结果进行逐级反卷积处理,得到反卷积结果;对所述反卷积结果进行分割处理,从所述待处理图像中分割出目标对象。
在一种可能的实现方式中,所述对待处理图像进行逐级卷积处理,得到卷积结果,包括:对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为所述卷积结果。
在一种可能的实现方式中,所述对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为所述卷积结果,包括:对待处理图像进行卷积处理,所得到的特征图作为待卷积特征图;在所述待卷积特征图的分辨率未达到第一阈值时,对所述待卷积特征图进行卷积处理,并将得到的结果再次作为待卷积特征图;在所述待卷积特征图的分辨率达到第一阈值时,将得到的分辨率逐渐递减的所有特征图作为所述卷积结果。
在一种可能的实现方式中,所述根据所述卷积结果,通过定位处理得到定位结果,包括:根据所述卷积结果进行分割处理,得到分割结果;根据所述分割结果,对所述卷积结果进行定位处理,得到定位结果。
在一种可能的实现方式中,所述根据所述卷积结果进行分割处理,得到分割结果,包括:对所述卷积结果中分辨率最低的特征图进行分割处理,得到分割结果。
在一种可能的实现方式中,所述根据所述分割结果,对所述卷积结果进行定位处理,得到定位结果,包括:根据所述分割结果,确定所述目标对象在所述卷积结果中对应的位置信息;根据所述位置信息,对所述卷积结果进行定位处理,得到定位结果。
在一种可能的实现方式中,所述根据所述分割结果,确定所述目标对象在卷积结果中对应的位置信息,包括:读取所述分割结果的坐标位置;将所述坐标位置作为区域中心,分别确定所述卷积结果内,每个分辨率下的特征图中可全部覆盖所述目标对象的区域位置,作为所述目标对象在卷积结果中对应的位置信息。
在一种可能的实现方式中,所述根据所述位置信息,对所述卷积结果进行定位处理,得到定位结果,包括:根据所述位置信息,对所述卷积结果中每个分辨率下的特征图分别进行裁切处理,得到定位结果。
在一种可能的实现方式中,所述对所述定位结果进行逐级反卷积处理,得到反卷积结果,包括:将所述定位结果中包含的所有特征图中分辨率最低的特征图作为待反卷积特征图;在所述待反卷积特征图的分辨率未达到第二阈值时,对所述待反卷积特征图进行反卷积处理,得到反卷积处理结果;按照分辨率逐渐递增的顺序,确定所述定位结果中所述待反卷积特征图的下一特征图;将所述反卷积处理结果与所述下一特征图进行融合,将所述融合结果再次作为待反卷积特征图;在所述待反卷积特征图的分辨率达到第二阈值时,将所述待反卷积特征图作为反卷积结果。
在一种可能的实现方式中,所述分割处理包括:将待分割对象通过softmax回归,得到回归结果;通过对所述回归结果进行最大值比较,完成对所述待分割对象的分割处理。
在一种可能的实现方式中,所述方法通过神经网络实现,所述神经网络包括第一分割子网络及第二分割子网络,其中,所述第一分割子网络用于对所述待处理图像进行逐级卷积处理及分割处理,所述第二分割子网络用于对所述定位结果进行逐级反卷积处理及分割处理。
在一种可能的实现方式中,所述神经网络的训练过程,包括:根据预设的训练集,训练所述第一分割子网络;根据所述预设的训练集以及已训练的第一分割子网络,训练所述第二分割子网络。
在一种可能的实现方式中,所述对所述待处理图像进行逐级卷积处理,得到卷积结果之前,还包括:将所述待处理图像调整至预设分辨率。
在一种可能的实现方式中,所述待处理图像为三维医学图像。
根据本公开的一方面,提供了一种图像处理装置,包括:卷积模块,用于对待处理图像进行逐级卷积处理,得到卷积结果;定位模块,用于根据所述卷积结果,通过定位处理得到定位结果;反卷积模块,用于对所述定位结果进行逐级反卷积处理,得到反卷积结果;目标对象获取模块,用于对所述反卷积结果进行分割处理,从所述待处理图像中分割出目标对象。
在一种可能的实现方式中,所述卷积模块用于:对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为所述卷积结果。
在一种可能的实现方式中,所述卷积模块进一步用于:对待处理图像进行卷积处理,所得到的特征图作为待卷积特征图;在所述待卷积特征图的分辨率未达到第一阈值时,对所述待卷积特征图进行卷积处理,并将得到的结果再次作为待卷积特征图;在所述待卷积特征图的分辨率达到第一阈值时,将得到的分辨率逐渐递减的所有特征图作为所述卷积结果。
在一种可能的实现方式中,所述定位模块包括:分割子模块,用于根据所述卷积结果进行分割处理,得到分割结果;定位子模块,用于根据所述分割结果,对所述卷积结果进行定位处理,得到定位结果。
在一种可能的实现方式中,所述分割子模块用于:对所述卷积结果中分辨率最低的特征图进行分割处理,得到分割结果。
在一种可能的实现方式中,所述定位子模块用于:根据所述分割结果,确定所述目标对象在所述卷积结果中对应的位置信息;根据所述位置信息,对所述卷积结果进行定位处理,得到定位结果。
在一种可能的实现方式中,所述定位子模块进一步用于:读取所述分割结果的坐标位置;将所述坐标位置作为区域中心,分别确定所述卷积结果内,每个分辨率下的特征图中可全部覆盖所述目标对象的区域位置,作为所述目标对象在卷积结果中对应的位置信息。
在一种可能的实现方式中,所述定位子模块进一步用于:根据所述位置信息,对所述卷积结果中每个分辨率下的特征图分别进行裁切处理,得到定位结果。
在一种可能的实现方式中,所述反卷积模块用于:将所述定位结果中包含的所有特征图中分辨率最低的特征图作为待反卷积特征图;在所述待反卷积特征图的分辨率未达到第二阈值时,对所述待反卷积特征图进行反卷积处理,得到反卷积处理结果;按照分辨率逐渐递增的顺序,确定所述定位结果中所述待反卷积特征图的下一特征图;将所述反卷积处理结果与所述下一特征图进行融合,将所述融合结果再次作为待反卷积特征图;在所述待反卷积特征图的分辨率达到第二阈值时,将所述待反卷积特征图作为反卷积结果。
在一种可能的实现方式中,所述分割处理包括:将待分割对象通过softmax回归,得到回归结果;通过对所述回归结果进行最大值比较,完成对所述待分割对象的分割处理。
在一种可能的实现方式中,所述装置通过神经网络实现,所述神经网络包括第一分割子网络及第二分割子网络,其中,所述第一分割子网络用于对所述待处理图像进行逐级卷积处理及分割处理,所述第二分割子网络用于对所述定位结果进行逐级反卷积处理及分割处理。
在一种可能的实现方式中,所述装置还包括训练模块,用于:根据预设的训练集,训练所述第一分割子网络;根据所述预设的训练集以及已训练的第一分割子网络,训练所述第二分割子网络。
在一种可能的实现方式中,所述卷积模块之前还包括分辨率调整模块,用于:将所述待处理图像调整至预设分辨率。
在一种可能的实现方式中,所述待处理图像为三维医学图像。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行上述图像处理方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述图像处理方法。
在本公开实施例中,通过对待处理图像进行逐级卷积处理和分割处理得到分割结果,并基于分割结果得到定位结果,再通过对定位结果进行逐级反卷积处理后再进行分割处理,可以从待处理图像中分割出目标对象。通过上述过程可以在一次图像处理的过程中同时实现目标对象的定位和分割,提高图像处理精度的同时保障图像处理的速度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开一实施例的图像处理方法的流程图。
图2示出根据本公开一实施例的图像处理方法的流程图。
图3示出根据本公开一实施例的图像处理方法的流程图。
图4示出根据本公开一实施例的图像处理方法的流程图。
图5示出根据本公开一实施例的图像处理方法的流程图。
图6示出根据本公开一实施例的图像处理方法的流程图。
图7示出根据本公开一实施例的图像处理方法的流程图。
图8示出根据本公开一应用示例的示意图。
图9示出根据本公开一实施例的图像处理装置的框图。
图10示出根据本公开实施例的一种电子设备的框图。
图11示出根据本公开实施例的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开一实施例的图像处理方法的流程图,该方法可以应用于图像处理装置,图像处理装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
在一些可能的实现方式中,该图像处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
如图1所示,所述图像处理方法可以包括:
步骤S11,对待处理图像进行逐级卷积处理,得到卷积结果。
步骤S12,根据卷积结果,通过定位处理得到定位结果。
步骤S13,对定位结果进行逐级反卷积处理,得到反卷积结果。
步骤S14,对反卷积结果进行分割处理,从待处理图像中分割出目标对象。
本公开实施例的图像处理方法,通过逐级卷积处理和分割处理,对待处理图像中的目标对象进行初步分割,从而得到反映目标对象在待处理图像的基本分布位置的定位结果,基于这一定位结果,可以再通过逐级反卷积处理和分割处理,实现待处理图像内目标对象的高精度分割,通过这一过程,在定位结果的基础上实现对目标对象的分割,与直接对待处理图像进行目标分割相比,可以有效提升图像处理的精度;同时,上述方法可以在一次图像处理过程中,先后实现对图像的目标定位和分割,而避免了将图像的目标定位和分割过程割裂开来,从而减少了图像处理的耗时,也降低了图像处理过程中可能存在的存储消耗。
其中,本公开实施例的图像处理方法可以应用于三维医学图像的处理,例如,用于识别医学图像中的目标区域,该目标区域可以是器官、病灶、组织等等。在一种可能的实现方式中,待处理图像可以是心脏器官的三维医学图像,也就是说,本公开实施例的图像处理方法可以应用于心脏病的治疗过程中,在一个示例中,该图像处理方法可以应用于心房纤维化颤动治疗过程,通过精确分割心房图像,从而理解和分析心房纤维化的病因,继而制定针对性的心房纤维化颤动的手术消融治疗方案,提升心房纤维化颤动的治疗效果。
需要说明的是,本公开实施例的图像处理方法不限于应用在三维医学图像处理,可以应用于任意的图像处理,本公开对此不作限定。
在一种可能的实现方式中,待处理图像可以包括多张图片,根据该多张图片可以识别出一个或多个三维的器官。
步骤S11的实现方式不受限定,任何可以得到用于进行分割处理的特征图的方式都可以作为步骤S11的实现方式。在一种可能的实现方式中,步骤S11可以包括:对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为卷积结果。
如何通过逐级卷积处理来得到多个分辨率逐渐递减的特征图,其具体的处理过程同样不受限定,图2示出根据本公开一实施例的图像处理方法的流程图,如图所示,在一种可能的实现方式中,对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为卷积结果,可以包括:
步骤S111,对待处理图像进行卷积处理,所得到的特征图作为待卷积特征图。
步骤S112,在待卷积特征图的分辨率未达到第一阈值时,对待卷积特征图进行卷积处理,并将得到的结果再次作为待卷积特征图。
步骤S113,在待卷积特征图的分辨率达到第一阈值时,将得到的分辨率逐渐递减的所有特征图作为卷积结果。
通过上述步骤可以看出,在本公开实施例中,通过对待处理图像进行一次卷积处理,可以得到初始分辨率下的特征图,再对初始分辨率下的特征图再进行一次卷积处理,可以得到下一分辨率下的特征图,以此类推,通过对待处理图像进行多次卷积处理,可以得到一系列分辨率逐渐递减的特征图,这些特征图可以作为卷积结果用于后续步骤的进行。这一过程的迭代次数不受限制,可以在得到的最小分辨率的特征图达到第一阈值时停止,第一阈值可以根据需求和实际情况进行设定,在此不限定具体值。由于第一阈值不受限定,因此得到的卷积结果中包含的特征图的个数和每一张特征图的分辨率均不受限定,可以根据实际情况进行具体选择。
在一种可能的实现方式中,卷积处理的过程和实现方式不受限定,在一个示例中,卷积处理的过程可以包括将待处理对象通过卷积、池化、批量归一化(BatchNormalization)或是参数线性整流单元(PReLU,Parametric Rectified Linear Unit)中的一个或多个。在一个示例中,可以采用3D U-Net全卷积神经网络中的编码器结构来实现,在一个示例中,也可以通过V-Net全卷机神经网络中的编码器结构来实现。本公开对卷积处理的具体方式不作限制。
根据卷积结果,通过定位处理来得到定位结果的过程可以存在多种实现方式,图3示出根据本公开一实施例的图像处理方法的流程图,如图所示,在一种可能的实现方式中,步骤S12可以包括:
步骤S121,根据卷积结果进行分割处理,得到分割结果。
步骤S122,根据分割结果,对卷积结果进行定位处理,得到定位结果。
步骤S121的过程同样不受限定,通过上述公开实施例可以得知,卷积结果中可以包含多张特征图,因此分割结果是通过对卷积结果中的哪一特征图进行分割处理来得到的,可以根据实际情况进行确定。在一种可能的实现方式中,步骤S121可以包括:对卷积结果中分辨率最低的特征图进行分割处理,得到分割结果。
分割处理的处理方式不受限定,任何可以从特征图中分割出目标的方式均可以作为本公开示例中分割处理的方法。
在一种可能的实现方式中,分割处理可以为通过softmax层来实现图像分割,具体过程可以包括:将待分割对象通过softmax回归,得到回归结果;通过对回归结果进行最大值比较,完成对待分割对象的分割处理。在一个示例中,上述通过回归结果进行最大值比较来实现对待分割对象进行分割处理的具体过程可以为:回归结果的形式可以为与待分割对象具有相同分辨率的输出数据,输出数据与待分割对象的像素位置一一对应,在每个对应的像素位置处,输出数据包含一个概率值,用以表明待分割对象在这一像素位置处作为分割目标的概率,基于输出数据中包含的概率可以进行最大值比较,从而确定每一像素位置是否为分割目标位置,继而实现从待分割对象中提取出分割目标的操作,最大值比较的具体方式不受限定,可以设定为概率较大的值所代表的像素位置处对应分割目标,也可以设定为概率较小的值所代表的的像素位置处对应分割目标,根据实际情况进行设定即可,在此不做限定。基于上述各公开实施例可知,在一个示例中,分割结果的得到过程可以为:将卷积结果中分辨率最低的特征图通过softmax层,并将得到的结果进行最大值比较,从而得到分割结果。
基于分割结果,可以通过步骤S122对卷积结果进行定位处理,来得到定位结果,步骤S122的实现过程不受限定,图4示出根据本公开一实施例的图像处理方法的流程图,如图所示,在一种可能的实现方式中,步骤S122可以包括:
步骤S1221,根据分割结果,确定目标对象在卷积结果中对应的位置信息。
步骤S1222,根据位置信息,对卷积结果进行定位处理,得到定位结果。
其中,位置信息为可以表明在卷积结果的各特征图内,目标对象所处位置的信息,其具体表现形式不受限定,在一个示例中,位置信息可以通过位置坐标集合的形式存在,在一个示例中,位置信息可以通过坐标+面积的形式存在,可以根据实际情况灵活选择位置信息的表现形式。由于位置信息的表现形式不受限定,因此步骤S1221的具体过程也可以随着位置信息的表现形式灵活确定。图5示出根据本公开一实施例的图像处理方法的流程图,如图所示,在一种可能的实现方式中,步骤S1221可以包括:
步骤S12211,读取分割结果的坐标位置。
步骤S12212,将坐标位置作为区域中心,分别确定卷积结果内,每个分辨率下的特征图中可全部覆盖目标对象的区域位置,作为目标对象在卷积结果中对应的位置信息。
其中,步骤S12211读取的分割结果的坐标位置,可以是表明分割结果位置的任意坐标,在一个示例中,这一坐标可以是分割结果上某固定位置的坐标值;在一个示例中,这一坐标可以是分割结果上某几个固定位置的坐标值;在一个示例中,这一坐标可以是分割结果重心位置的坐标值。基于读取的坐标位置,可以通过步骤S12212,在卷积结果中每张特征图下对应的位置处,定位到目标对象,继而得到完全覆盖目标对象的区域位置,这一区域位置的表现形式同样不受限定,在一个示例中,这一区域位置的表现形式可以是区域所有顶点的坐标集合,在一个示例中,这一区域位置的表现形式可以是区域位置的中心坐标与区域位置的覆盖面积集合。步骤S12212的具体过程可以根据区域位置的表现形式不同而随之灵活改变,在一个示例中,步骤S12212的过程可以为:基于分割结果在所在特征图内的重心坐标,依据分割结果所在特征图与卷积结果中其余特征图的分辨率比例关系,可以分别确定卷积结果中每张特征图内目标对象的重心坐标;以此重心坐标为中心,在每张特征图中,确定可以完全覆盖目标对象的区域,将此区域的顶点坐标作为目标对象在卷积结果中对应的位置信息。由于卷积结果中各特征图之间存在分辨率的差异,因此卷积结果中各特征图内覆盖目标对象的区域之间也可能存在分辨率的差异。在一个示例中,不同特征图确定的覆盖目标对象的区域之间可以存在比例关系,这一比例关系可以与特征图之间的分辨率比例关系一致,举例说明,在一个示例中,卷积结果中可能存在两个特征图A和B,特征图A中覆盖目标对象的区域被记为区域A,特征图B中覆盖目标对象的区域被记为区域B,其中特征图A的分辨率为特征图分辨率B的2倍,则区域A的面积为区域B的2倍。
基于步骤S1221得到的位置信息,可以通过步骤S1222来得到定位结果,上述公开实施例已表明,位置信息可以存在多种不同的表现形式,随着位置信息表现形式的不同,步骤S1222的具体实施过程也可能存在不同。在一种可能的实现方式中,步骤S1222可以包括:根据位置信息,对卷积结果中每个分辨率下的特征图分别进行裁切处理,得到定位结果。在一个示例中,位置信息可以为卷积结果内各特征图可以覆盖目标对象的区域顶点的坐标集合,基于此坐标集合,可以对卷积结果中的各特征图进行裁切,保留每个特征图中覆盖目标对象的区域作为新的特征图,则这些新的特征图的集合即为定位结果。
通过上述各公开实施例的任意形式组合,可以得到定位结果,这一过程可以有效的对卷积结果中各分辨率下的特征图内的目标对象进行粗略定位,基于此粗略定位可以将原有的卷积结果处理为定位结果,由于定位结果中各分辨率下的特征图内去掉了大部分不包含目标对象的图片信息,因此可以大大减小图像处理过程中的存储消耗,加快计算速度,提升图像处理的效率和速度,同时,由于目标对象在定位结果中所占的信息比例更大,因此基于定位结果进行目标对象分割的效果,相比于直接利用待处理图像进行目标对象分割的效果更好,从而可以提高图像处理的精度。
在得到了定位结果后,可以基于此定位结果来实现目标对象的分割,分割的具体实现形式不受限定,可以根据实际情况灵活选择。在一种可能的实现方式中,可以从定位结果中选择某一特征图,再进行进一步的分割处理,来得到目标对象。在另一种可能的实现方式中,可以利用定位结果还原出包含更多目标对象信息的特征图,再利用此特征图进行进一步的分割处理,来得到目标对象。
通过上述步骤中可以看出,在一种可能的实现方式中,利用定位结果实现目标对象分割的过程可以通过步骤S13和S14实现,即先对定位结果进行逐级反卷积处理,来得到包含更多目标对象信息的反卷积结果,再基于此反卷积结果进行分割处理,来得到目标对象。逐级反卷积的过程可以被看作是逐级卷积过程的逆向操作过程,因此其实现过程也如步骤S11一样具有多种可能的实现形式。图6示出根据本公开一实施例的图像处理方法的流程图,如图所示,在一种可能的实现方式中,步骤S13可以包括:
步骤S131,将定位结果中包含的所有特征图中分辨率最低的特征图作为待反卷积特征图。
步骤S132,在待反卷积特征图的分辨率未达到第二阈值时,对待反卷积特征图进行反卷积处理,得到反卷积处理结果。
步骤S133,按照分辨率逐渐递增的顺序,确定定位结果中待反卷积特征图的下一特征图。
步骤S134,将反卷积处理结果与下一特征图进行融合,将融合结果再次作为待反卷积特征图。
步骤S135,在待反卷积特征图的分辨率达到第二阈值时,将待反卷积特征图作为反卷积结果。
上述步骤中,反卷积处理结果是对待反卷积特征图进行反卷积处理得到的处理结果,而下一特征图,则是从定位结果中得到的特征图,即在定位结果中,满足分辨率大于当前反卷积特征图一级这一条件的特征图,可以作为下一特征图,与反卷积处理结果进行融合。因此逐级反卷积处理的过程,可以是从定位结果中分辨率最低的特征图开始,通过反卷积处理,得到分辨率提升一级后的特征图,此时可以将这一分辨率提升一级后得到的特征图作为反卷积处理结果,由于在定位结果中,本身也存在与反卷积处理结果的分辨率相同的特征图,这两张特征图之间均包含目标对象的有效信息,因此可以将这两张特征图进行融合,融合后的特征图包含了这两张特征图内所包含的所有目标对象的有效信息,因此可以将融合后的特征图再次作为新的待反卷积特征图,对这一新的待反卷积特征图进行反卷积处理,并将处理结果再次与定位结果内对应分辨率的特征图进行融合,直至融合后的特征图分辨率达到第二阈值时,停止反卷积处理,此时得到的最终的融合结果,包含了定位结果内每一张特征图中所含有的目标对象的有效信息,因此可以将其作为反卷积结果,用于后续的目标对象分割。在本公开实施例中,第二阈值根据待处理图像原有的分辨率灵活决定,在此并不限定具体值。
通过上述过程中,反卷积结果是通过对定位结果进行逐级反卷积处理来得到的,且反卷积结果用于最终的目标对象分割,因此得到的最终结果,由于存在了目标对象的定位基础,因此可以有效包含目标对象的全局信息,具有更高的准确率;而且也无需将待处理图像进行分割,而是作为整体进行图像处理,因此处理过程也具有更高的效率;同时通过上述过程可以看出,在一次的图像处理过程中,对于目标对象的分割是基于目标对象的定位结果来实现的,无需通过两个独立的过程分别实现目标对象定位和目标对象分割,因此可以大大减小数据的存储、消耗和计算量,继而提升图像处理的速度和效率,减小时间和空间上的消耗。而且逐级反卷积过程可以确保每一个分辨率下特征图所包含的有效信息均保留在了最终得到的反卷积结果内,由于反卷积结果用于最终的图像分割,因此可以大大提升最终得到结果的精度。
在得到了反卷积结果后,可以对反卷积结果进行分割处理,得到的结果可以作为从待处理图像中分割出的目标对象,对反卷积结果进行分割处理的过程,与上述对卷积结果进行分割处理的过程一致,只是被分割处理的对象存在差异,因此可以参考上述公开实施例的过程,在此不再赘述。
在一种可能的实现方式中,可以通过神经网络实现本公开实施例的图像处理方法。通过上述过程中可以看出,本公开实施例的图像处理方法主要包含了两次分割过程,第一次是对待处理图像的粗略分割,第二次是基于粗略分割得到的定位结果来进行的更高精度的分割,因此第二次分割与第一次分割可以通过一个神经网络实现,二者共享一套参数,因此,可以将两次分割看作为一个神经网络下的两个子神经网络,因此,在一种可能的实现方式中,神经网络可以包括第一分割子网络及第二分割子网络,其中,第一分割子网络用于对待处理图像进行逐级卷积处理及分割处理,第二分割子网络用于对定位结果进行逐级反卷积处理及分割处理。神经网络所采用的具体网络结构不受限定,在一个示例中,上述公开实施例中提到的V-Net和3D-U-Net均可以作为神经网络的具体实现方式。任何可以实现第一分割子网络和第二分割子网络功能的神经网络,均可以作为神经网络的实现形式。
图7示出根据本公开实施例的图像处理方法的流程图。在一种可能的实现方式中,如图所示,本公开实施例的方法还可以包括神经网络的训练过程,记为步骤S15,其中,步骤S15可以包括:
步骤S151,根据预设的训练集,训练第一分割子网络。
步骤S152,根据预设的训练集以及已训练的第一分割子网络,训练第二分割子网络。
其中,预设的训练集可以是对样本图片进行手动剪裁等预处理后,并拆分成的多个图片集。拆分成的多个图片集中,相邻的两个图片集可以包括一部分相同的图片,例如,以医学图像为例,可以从医院采集多个样本,一个样本中包括的多个样本图片可以是连续采集的人体某一器官的图片,通过该多个样本图片可以得到器官的三维立体结构,可以沿一个方向进行拆分,第一个图片集可以包括第1-30帧图片,第二个图片集可以包括第16-45帧图片……,这样相邻的两个图片集中有15帧图片是相同的。通过这种重叠拆分的方式,可以提高分割的精确度。
如图7所示,在神经网络的训练过程中,首先可以将预设的训练集作为输入,训练第一分割子网络,根据第一分割子网络的输出结果,可以对训练集中的图片进行定位处理,经由定位处理后的训练集,可以作为第二分割子网络的训练数据,输入到第二分割子网络中进行训练,通过上述过程,最终可以得到训练完成的第一分割子网络和第二分割子网络。
在训练的过程中,确定神经网络的网络损失所使用的函数不受具体限定,在一个示例中,可以通过dice loss函数确定神经网络的网络损失,在一个示例中,可以通过交叉熵函数确定神经网络的网络损失,在一个示例中,也可以通过其他可用的损失函数确定神经网络的网络损失。第一分割子网络和第二分割子网络使用的损失函数可以相同,也可以不同,在此不受限定。
基于上述公开的实施例,在一个示例中,神经网络的完整训练过程可以为:将预设的训练集输入到第一分割子网络的网络模型中,预设的训练集中包含多张待分割图像和与待分割图像对应的掩模Mask,通过任一损失函数计算出图像经过第一分割子网络的网络模型输出的数据与对应的Mask之间的损失,然后通过反向传播算法更新第一分割子网络的网络模型参数,直至第一分割子网络模型收敛,表明第一分割子网络模型完成训练。在第一分割子网络模型完成训练后,将预设的训练集再次通过训练好的第一分割子网络模型,得到多张分割结果,基于这多张分割结果,对第一分割子网络中各分辨率的特征图进行定位处理,将这些定位并裁剪后的特征图与对应的位置的Mask输入到第二分割子网络的网络模型中进行训练,通过任一损失函数计算出定位处理后的图像经过第二分割子网络的网络模型输出的数据与对应的Mask之间的损失,然后通过反向传播算法更新第二分割子网络的网络模型参数,同时交替地更新第一分割子网络和第二分割子网络模型参数,直至整个网络模型收敛,神经网络完成训练。
通过上述各公开实施例可以看出,本公开中的神经网络虽然包含两个子神经网络,但是在训练过程中,只需要通过一套训练集数据即可完成训练,两个子神经网络共享同一套参数,可以节省更多的存储空间。由于训练的两个子神经网络共享同一套参数,因此在该神经网络应用于图像处理方法时,输入的待处理图像直接依次通过两个子神经网络即可得到输出结果,而不是分别输入到两个子神经网络分别得到输出结果后再进行计算,因此本公开中提出的图像处理方法具有更快的处理速度,同时也具有更低的空间消耗和时间消耗。
在一种可能的实现方式中,本公开实施例的方法,在步骤S11之前还可以包括:将待处理图像调整至预设分辨率。将待处理图像调整至预设分辨率的实现方法不受具体限定,在一个示例中,可以通过中心裁剪和扩充的方法,将待处理图像调整到预设分辨率。预设分辨率的具体分辨率数值也不受限定,可以根据实际情况进行灵活设定。
基于这一步骤,在本公开实施例的图像处理方法通过神经网络实现时,也可以将预设的训练集中包含的各训练图片均统一至预设分辨率后,再用于神经网络的训练。
与之相应的,在一种可能的实现方式中,本公开实施例的方法还可以包括:将分割出的目标对象还原至与待处理图像同样大小的空间中,得到最终的分割结果。由于在步骤S11之前可能对待处理图像进行了分辨率的调整,得到的分割结果实际上可能是基于分辨率调整后的图像的分割内容,因此可以将分割的结果还原至与待处理图像同样大小的空间中,得到基于最原始待处理图像的分割结果。与待处理图像同样大小的空间不受限定,根据待处理图像本身的图像性质所决定,在此不受限定,在一个示例中,待处理图像可能是三维图像,因此与待处理图像同样大小的空间可以是三维空间。
在一种可能的实现方式中,在步骤S11之前还可以包括:对待处理图像进行预处理。这一预处理过程不受限定,任何可以提高分割精度的处理方式均可以作为预处理包含的过程,在一个示例中,对待处理图像进行预处理可以包括将待处理图像进行亮度值均衡化。
通过采取同一分辨率的待处理图像作为输入来进行图像处理,可以提高后续对待处理图像依次执行卷积处理、分割处理和逐级反卷积处理的处理效率,缩短整个图像处理过程的时间。通过对待处理图像进行预处理,可以提升图像分割的准确程度,从而提高图像处理结果的精度。
应用场景示例
心脏类疾病是当前致死率最高的疾病之一,比如心房纤维化颤动是当前最为常见的心率紊乱病症之一,在一般人群中出现的概率达到了2%,而在老年人群中的发病率更高并且具有一定的致死率,严重威胁到了人类的健康。而对心房的精确分割是理解和分析心房纤维化的关键,常常被用来辅助制定针对性的心房纤维化颤动的手术消融治疗方案。而心脏的其他腔体的分割对于其他类型的心脏病的治疗和手术规划也具有同样重要的意义。然而针对医学图像中心脏腔体分割的方法仍然面临着准确率不高、计算效率低下等缺点,虽然已经有部分方法实现了较高的准确率,但是仍然存在着一些实际问题,比如缺乏三维信息,分割结果不够平滑;缺乏全局信息,计算效率低下;或是需要分成两个网络进行分割训练,时间空间上都有一定程度的冗余等。
因此,一个精度高、效率高且时空消耗低的分割方法能够极大减少医生的工作量,提高心脏分割的质量,从而提高心脏相关疾病的治疗效果。
图8示出根据本公开一应用示例的示意图,如图所示,本公开实施例提出了一种图像处理方法,这一处理方法是基于训练好的一套神经网络来实现的。从图中可以看出,这套神经网络的具体训练过程可以为:
首先对预设的训练数据进行处理,预设的训练数据包含多张输入图像和对应的Mask,通过中心裁剪和扩充的方法将多张输入图像的分辨率统一为同样大小,在本示例中统一后的分辨率为576×576×96。
在将多张输入图像统一分辨率后,可以利用这些输入图像对第一分割子网络进行训练,具体的训练过程可以为:
采用类似基于V-Net或者3D-U-Net的三维全卷积神经网络中的编码器结构,对输入图像进行多次卷积处理,本示例中卷积处理的过程可以包括卷积,池化,batch norm以及PRelu,通过多次卷积处理,每次卷积处理的输入均采用上次卷积处理得到的结果,本示例中共执行了4次卷积处理,因此可以分别生成分辨率大小为576×576×96,288×288×48,144×144×24,以及72×72×12的特征图,并且输入图像的特征通道从8个提升到128个;
在得到了上述4个特征图后,针对其中分辨率最小的特征图,本示例中为72×72×12的特征图,将其通过一个softmax层,可以得到两个分辨率为72×72×12的概率输出,这两个概率输出分别代表像素相关位置是否为目标腔体的概率,这两个概率输出可以作为第一分割子网络的输出结果,利用dice loss、交叉熵或者其他损失函数,可以计算该输出结果与直接降采样为72×72×12的mask之间的损失,基于计算出的损失,可以利用反向传播算法更新第一分割子网络的网络参数,直到第一分割子网络的网络模型收敛,此时可以代表第一分割子网络训练完成。
在第一分割子网络训练完成后,可以将统一分辨率后的多张输入图像通过训练完成的第一分割子网络,得到分辨率大小为576×576×96,288×288×48,144×144×24,以及72×72×12的4个特征图,以及2个分辨率为72×72×12的概率输出,根据低分辨率的概率输出,利用最大值比较可以得到心脏腔体的粗略分割结果,其分辨率为72×72×12,基于这一粗略分割结果,可以计算心脏腔体的重心坐标,并以此为中心裁剪出在576×576×96,288×288×48,144×144×24,以及72×72×12这4个特征图中,足够完全覆盖目标腔体的固定大小区域,在一个示例中,72×72×12的特征图中可以裁剪30×20×12大小区域,144×144×24的特征图中可以裁剪60×40×24大小区域,288×288×48的特征图中可以裁剪120×80×48大小区域,576×576×96的特征图中可以裁剪240×160×96大小区域。
得到上述四个裁剪后的区域图像后,可以利用这些区域图像对第二分割子网络进行训练,具体的训练过程可以为:
利用逐级反卷积处理,可以将区域图像逐步还原到240×160×96分辨率,具体过程可以为:将72×72×12的特征图中裁剪出的30×20×12大小区域,通过反卷积处理得到分辨率为60×40×24的特征图,并将这一特征图与之前144×144×24的特征图中裁剪出的60×40×24大小区域进行融合,得到融合后的分辨率60×40×24的特征图,再将这一特征图进行反卷积处理,得到分辨率为120×80×48的特征图,将其余之前288×288×48的特征图中裁剪出的120×80×48大小区域进行融合,得到融合后的分辨率为120×80×48的特征图,将融合后的特征图再进行反卷积处理,得到分辨率为240×160×96的特征图,将其再与576×576×96的特征图中裁剪出的240×160×96大小区域进行融合,得到逐级反卷积处理后的最终图像,则这一最终图像中包含心脏腔体的局部和全局信息,将这一最终图像通过一个softmax层,可以得到两个分辨率为576×576×96的概率输出,这两个概率输出分别代表像素相关位置是否为目标腔体的概率,这两个概率输出可以作为第二分割子网络的输出结果,然后利用dice loss、交叉熵或者其他损失函数,可以计算该输出结果与mask之间的损失,基于计算的损失,可以利用反向传播算法更新第二分割子网络的网络参数,直到第二分割子网络的网络模型收敛,此时可以代表第二分割子网络训练完成。
经过以上步骤,可以得到一个训练完成的用于心脏腔体分割的神经网络,对于心脏腔体的定位和分割可以在这同一个神经网络中同时完成,可以从图像输入经过网络后直接得到。因此,基于这一训练完成的神经网络对心脏腔体的分割过程具体可以为:
首先利用中心裁剪和扩充的方法将待进行心脏腔体分割的待分割图像的分辨率调整为神经网络的预设大小,在本示例中为576×576×96,然后将这一待分割图像数据输入上述训练好的神经网络中,待分割图像在训练好的神经网络中,经历与训练过程相似的过程,即先通过卷积处理生成4个分辨率大小的特征图,然后得到粗略分割结果,基于此粗略分割结果对上述4个分辨率大小的特征图进行裁剪,再对裁剪结果进行反卷积处理得到反卷积结果,这一反卷积结果再通过分割处理得到目标腔体的分割结果,这一分割结果即作为神经网络的输出结果进行输出,再将这一输出的分割结果映射到与输入的待分割图像同样的维度大小上,即得到最终的心脏腔体分割结果。
采用本公开的图像处理方法,可以利用一个三维网络同时进行心脏腔体的定位和分割,定位和分割共享同一套参数,将心脏腔体的定位和分割统一到同一个网络当中,因此可以从输入一步直接得到分割结果,具有更快的速度,也可以节省更多的存储空间,同时可以得到更加平滑的三维模型分割表面。
需要说明的是,本公开实施例的图像处理方法不限于应用在上述心脏腔体图像处理,可以应用于任意的图像处理,本公开对此不作限定。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
图9示出根据本公开实施例的图像处理装置的框图。该图像处理装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal DigitalAssistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
在一些可能的实现方式中,该图像处理装置可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
如图9所示,所述图像处理装置可以包括:卷积模块21,用于对待处理图像进行逐级卷积处理,得到卷积结果;定位模块22,用于根据卷积结果,通过定位处理得到定位结果;反卷积模块23,用于对定位结果进行逐级反卷积处理,得到反卷积结果;目标对象获取模块24,用于对反卷积结果进行分割处理,从待处理图像中分割出目标对象。
在一种可能的实现方式中,卷积模块用于:对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为卷积结果。
在一种可能的实现方式中,卷积模块进一步用于:对待处理图像进行卷积处理,所得到的特征图作为待卷积特征图;在待卷积特征图的分辨率未达到第一阈值时,对待卷积特征图进行卷积处理,并将得到的结果再次作为待卷积特征图;在待卷积特征图的分辨率达到第一阈值时,将得到的分辨率逐渐递减的所有特征图作为卷积结果。
在一种可能的实现方式中,定位模块包括:分割子模块,用于根据卷积结果进行分割处理,得到分割结果;定位子模块,用于根据分割结果,对卷积结果进行定位处理,得到定位结果。
在一种可能的实现方式中,分割子模块用于:对卷积结果中分辨率最低的特征图进行分割处理,得到分割结果。
在一种可能的实现方式中,定位子模块用于:根据分割结果,确定目标对象在卷积结果中对应的位置信息;根据位置信息,对卷积结果进行定位处理,得到定位结果。
在一种可能的实现方式中,定位子模块进一步用于:读取分割结果的坐标位置;将坐标位置作为区域中心,分别确定卷积结果内,每个分辨率下的特征图中可全部覆盖目标对象的区域位置,作为目标对象在卷积结果中对应的位置信息。
在一种可能的实现方式中,定位子模块进一步用于:根据位置信息,对卷积结果中每个分辨率下的特征图分别进行裁切处理,得到定位结果。
在一种可能的实现方式中,反卷积模块用于:将定位结果中包含的所有特征图中分辨率最低的特征图作为待反卷积特征图;在待反卷积特征图的分辨率未达到第二阈值时,对待反卷积特征图进行反卷积处理,得到反卷积处理结果;按照分辨率逐渐递增的顺序,确定定位结果中待反卷积特征图的下一特征图;将反卷积处理结果与下一特征图进行融合,将融合结果再次作为待反卷积特征图;在待反卷积特征图的分辨率达到第二阈值时,将待反卷积特征图作为反卷积结果。
在一种可能的实现方式中,分割处理包括:将待分割对象通过softmax回归,得到回归结果;通过对回归结果进行最大值比较,完成对待分割对象的分割处理。
在一种可能的实现方式中,装置通过神经网络实现,神经网络包括第一分割子网络及第二分割子网络,其中,第一分割子网络用于对待处理图像进行逐级卷积处理及分割处理,第二分割子网络用于对定位结果进行逐级反卷积处理及分割处理。
在一种可能的实现方式中,装置还包括训练模块,用于:根据预设的训练集,训练第一分割子网络;根据预设的训练集以及已训练的第一分割子网络,训练第二分割子网络。
在一种可能的实现方式中,卷积模块之前还包括分辨率调整模块,用于:将待处理图像调整至预设分辨率。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图10是根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图10,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图11是根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图11,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (26)
1.一种图像处理方法,其特征在于,包括:
对待处理图像进行逐级卷积处理,得到卷积结果;
根据所述卷积结果进行分割处理,得到分割结果;
根据所述分割结果,对所述卷积结果进行定位处理,得到定位结果;
对所述定位结果进行逐级反卷积处理,得到反卷积结果;
对所述反卷积结果进行分割处理,从所述待处理图像中分割出目标对象;
所述对所述定位结果进行逐级反卷积处理,得到反卷积结果,包括:
将所述定位结果中包含的所有特征图中分辨率最低的特征图作为待反卷积特征图;
在所述待反卷积特征图的分辨率未达到第二阈值时,对所述待反卷积特征图进行反卷积处理,得到反卷积处理结果;
按照分辨率逐渐递增的顺序,确定所述定位结果中所述待反卷积特征图的下一特征图;
将所述反卷积处理结果与所述下一特征图进行融合,将所述融合结果再次作为待反卷积特征图;
在所述待反卷积特征图的分辨率达到第二阈值时,将所述待反卷积特征图作为反卷积结果。
2.根据权利要求1所述的方法,其特征在于,所述对待处理图像进行逐级卷积处理,得到卷积结果,包括:
对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为所述卷积结果。
3.根据权利要求2所述的方法,其特征在于,所述对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为所述卷积结果,包括:
对待处理图像进行卷积处理,所得到的特征图作为待卷积特征图;
在所述待卷积特征图的分辨率未达到第一阈值时,对所述待卷积特征图进行卷积处理,并将得到的结果再次作为待卷积特征图;
在所述待卷积特征图的分辨率达到第一阈值时,将得到的分辨率逐渐递减的所有特征图作为所述卷积结果。
4.根据权利要求1所述的方法,其特征在于,所述根据所述卷积结果进行分割处理,得到分割结果,包括:
对所述卷积结果中分辨率最低的特征图进行分割处理,得到分割结果。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述根据所述分割结果,对所述卷积结果进行定位处理,得到定位结果,包括:
根据所述分割结果,确定所述目标对象在所述卷积结果中对应的位置信息;
根据所述位置信息,对所述卷积结果进行定位处理,得到定位结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述分割结果,确定所述目标对象在卷积结果中对应的位置信息,包括:
读取所述分割结果的坐标位置;
将所述坐标位置作为区域中心,分别确定所述卷积结果内,每个分辨率下的特征图中可全部覆盖所述目标对象的区域位置,作为所述目标对象在卷积结果中对应的位置信息。
7.根据权利要求5或6所述的方法,其特征在于,所述根据所述位置信息,对所述卷积结果进行定位处理,得到定位结果,包括:
根据所述位置信息,对所述卷积结果中每个分辨率下的特征图分别进行裁切处理,得到定位结果。
8.根据权利要求1-7中任意一项所述的方法,其特征在于,所述分割处理包括:
将待分割对象通过softmax回归,得到回归结果;
通过对所述回归结果进行最大值比较,完成对所述待分割对象的分割处理。
9.根据权利要求1-8中任意一项所述的方法,其特征在于,所述方法通过神经网络实现,所述神经网络包括第一分割子网络及第二分割子网络,
其中,所述第一分割子网络用于对所述待处理图像进行逐级卷积处理及分割处理,所述第二分割子网络用于对所述定位结果进行逐级反卷积处理及分割处理。
10.根据权利要求9所述的方法,其特征在于,所述神经网络的训练过程,包括:
根据预设的训练集,训练所述第一分割子网络;
根据所述预设的训练集以及已训练的第一分割子网络,训练所述第二分割子网络。
11.根据权利要求1-10中任意一项所述的方法,其特征在于,所述对所述待处理图像进行逐级卷积处理,得到卷积结果之前,还包括:
将所述待处理图像调整至预设分辨率。
12.根据权利要求1-11中任意一项所述的方法,其特征在于,所述待处理图像为三维医学图像。
13.一种图像处理装置,其特征在于,包括:
卷积模块,用于对待处理图像进行逐级卷积处理,得到卷积结果;
定位模块,用于根据所述卷积结果,通过定位处理得到定位结果;
反卷积模块,用于对所述定位结果进行逐级反卷积处理,得到反卷积结果;
目标对象获取模块,用于对所述反卷积结果进行分割处理,从所述待处理图像中分割出目标对象;其中,所述定位模块包括:
分割子模块,用于根据所述卷积结果进行分割处理,得到分割结果;
定位子模块,用于根据所述分割结果,对所述卷积结果进行定位处理,得到定位结果;
所述反卷积模块用于:
将所述定位结果中包含的所有特征图中分辨率最低的特征图作为待反卷积特征图;
在所述待反卷积特征图的分辨率未达到第二阈值时,对所述待反卷积特征图进行反卷积处理,得到反卷积处理结果;
按照分辨率逐渐递增的顺序,确定所述定位结果中所述待反卷积特征图的下一特征图;
将所述反卷积处理结果与所述下一特征图进行融合,将所述融合结果再次作为待反卷积特征图;
在所述待反卷积特征图的分辨率达到第二阈值时,将所述待反卷积特征图作为反卷积结果。
14.根据权利要求13所述的装置,其特征在于,所述卷积模块用于:
对待处理图像进行逐级卷积处理,得到多个分辨率逐渐递减的特征图,作为所述卷积结果。
15.根据权利要求14所述的装置,其特征在于,所述卷积模块进一步用于:
对待处理图像进行卷积处理,所得到的特征图作为待卷积特征图;
在所述待卷积特征图的分辨率未达到第一阈值时,对所述待卷积特征图进行卷积处理,并将得到的结果再次作为待卷积特征图;
在所述待卷积特征图的分辨率达到第一阈值时,将得到的分辨率逐渐递减的所有特征图作为所述卷积结果。
16.根据权利要求13所述的装置,其特征在于,所述分割子模块用于:
对所述卷积结果中分辨率最低的特征图进行分割处理,得到分割结果。
17.根据权利要求13至16中任意一项所述的装置,其特征在于,所述定位子模块用于:
根据所述分割结果,确定所述目标对象在所述卷积结果中对应的位置信息;
根据所述位置信息,对所述卷积结果进行定位处理,得到定位结果。
18.根据权利要求17所述的装置,其特征在于,所述定位子模块进一步用于:
读取所述分割结果的坐标位置;
将所述坐标位置作为区域中心,分别确定所述卷积结果内,每个分辨率下的特征图中可全部覆盖所述目标对象的区域位置,作为所述目标对象在卷积结果中对应的位置信息。
19.根据权利要求17或18所述的装置,其特征在于,所述定位子模块进一步用于:
根据所述位置信息,对所述卷积结果中每个分辨率下的特征图分别进行裁切处理,得到定位结果。
20.根据权利要求13-19中任意一项所述的装置,其特征在于,所述分割处理包括:
将待分割对象通过softmax回归,得到回归结果;
通过对所述回归结果进行最大值比较,完成对所述待分割对象的分割处理。
21.根据权利要求13-20中任意一项所述的装置,其特征在于,所述装置通过神经网络实现,所述神经网络包括第一分割子网络及第二分割子网络,
其中,所述第一分割子网络用于对所述待处理图像进行逐级卷积处理及分割处理,所述第二分割子网络用于对所述定位结果进行逐级反卷积处理及分割处理。
22.根据权利要求21所述的装置,其特征在于,所述装置还包括训练模块,用于:
根据预设的训练集,训练所述第一分割子网络;
根据所述预设的训练集以及已训练的第一分割子网络,训练所述第二分割子网络。
23.根据权利要求13-22中任意一项所述的装置,其特征在于,所述卷积模块之前还包括分辨率调整模块,用于:
将所述待处理图像调整至预设分辨率。
24.根据权利要求13-23中任意一项所述的装置,其特征在于,所述待处理图像为三维医学图像。
25.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行权利要求1至12中任意一项所述的方法。
26.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至12中任意一项所述的方法。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910258038.1A CN109978886B (zh) | 2019-04-01 | 2019-04-01 | 图像处理方法及装置、电子设备和存储介质 |
PCT/CN2019/107844 WO2020199528A1 (zh) | 2019-04-01 | 2019-09-25 | 图像处理方法及装置、电子设备和存储介质 |
JP2021539065A JP2022517571A (ja) | 2019-04-01 | 2019-09-25 | 画像処理方法及び装置、電子機器並びに記憶媒体 |
SG11202106290TA SG11202106290TA (en) | 2019-04-01 | 2019-09-25 | Image processing method and apparatus, electronic device, and storage medium |
TW108137213A TWI750518B (zh) | 2019-04-01 | 2019-10-16 | 影像處理方法及影像處理裝置、電子設備和電腦可讀儲存媒體 |
TW110140808A TWI758233B (zh) | 2019-04-01 | 2019-10-16 | 影像處理方法及影像處理裝置、電子設備和電腦可讀儲存媒體 |
TW110140810A TWI758234B (zh) | 2019-04-01 | 2019-10-16 | 影像處理方法及影像處理裝置、電子設備和電腦可讀儲存媒體 |
US17/356,398 US20210319560A1 (en) | 2019-04-01 | 2021-06-23 | Image processing method and apparatus, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910258038.1A CN109978886B (zh) | 2019-04-01 | 2019-04-01 | 图像处理方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109978886A CN109978886A (zh) | 2019-07-05 |
CN109978886B true CN109978886B (zh) | 2021-11-09 |
Family
ID=67082222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910258038.1A Active CN109978886B (zh) | 2019-04-01 | 2019-04-01 | 图像处理方法及装置、电子设备和存储介质 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210319560A1 (zh) |
JP (1) | JP2022517571A (zh) |
CN (1) | CN109978886B (zh) |
SG (1) | SG11202106290TA (zh) |
TW (3) | TWI750518B (zh) |
WO (1) | WO2020199528A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978886B (zh) * | 2019-04-01 | 2021-11-09 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110807463B (zh) * | 2019-09-17 | 2022-10-11 | 珠海格力电器股份有限公司 | 图像分割方法、装置、计算机设备和存储介质 |
US11335045B2 (en) * | 2020-01-03 | 2022-05-17 | Gyrfalcon Technology Inc. | Combining feature maps in an artificial intelligence semiconductor solution |
KR20210101903A (ko) * | 2020-02-11 | 2021-08-19 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN113706548B (zh) * | 2020-05-09 | 2023-08-22 | 北京康兴顺达科贸有限公司 | 基于ct影像对胸部前纵隔病灶自动分割的方法 |
CN113298819A (zh) * | 2020-06-09 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 一种视频的处理方法、装置及电子设备 |
CN113516614A (zh) | 2020-07-06 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 脊柱影像的处理方法、模型训练方法、装置及存储介质 |
CN113902654A (zh) | 2020-07-06 | 2022-01-07 | 阿里巴巴集团控股有限公司 | 一种图像处理方法、装置、电子设备以及存储介质 |
CN112150449B (zh) * | 2020-09-29 | 2022-11-25 | 太原理工大学 | 一种脑卒中病灶分割方法和系统 |
CN112233194B (zh) * | 2020-10-15 | 2023-06-02 | 平安科技(深圳)有限公司 | 医学图片优化方法、装置、设备及计算机可读存储介质 |
CN112308867B (zh) * | 2020-11-10 | 2022-07-22 | 上海商汤智能科技有限公司 | 牙齿图像的处理方法及装置、电子设备和存储介质 |
US11461989B2 (en) * | 2020-12-04 | 2022-10-04 | Himax Technologies Limited | Monitor method and monitor system thereof wherein mask is used to cover image for detecting object |
TWI768759B (zh) * | 2021-03-11 | 2022-06-21 | 瑞昱半導體股份有限公司 | 具有超解析放大機制的影像放大裝置及方法 |
CN113225226B (zh) * | 2021-04-30 | 2022-10-21 | 上海爱数信息技术股份有限公司 | 一种基于信息熵的云原生系统观测方法及系统 |
CN113012178A (zh) * | 2021-05-07 | 2021-06-22 | 西安智诊智能科技有限公司 | 一种肾脏肿瘤图像分割方法 |
US11475158B1 (en) * | 2021-07-26 | 2022-10-18 | Netskope, Inc. | Customized deep learning classifier for detecting organization sensitive data in images on premises |
CN114092712B (zh) * | 2021-11-29 | 2024-07-26 | 北京字节跳动网络技术有限公司 | 图像生成方法、装置、可读介质和电子设备 |
TWI843109B (zh) * | 2022-05-24 | 2024-05-21 | 鴻海精密工業股份有限公司 | 醫學圖像檢測方法、電腦設備及電腦可讀儲存介質 |
CN114708608B (zh) * | 2022-06-06 | 2022-09-16 | 浙商银行股份有限公司 | 一种银行票据全自动化特征工程方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016172612A1 (en) * | 2015-04-23 | 2016-10-27 | Cedars-Sinai Medical Center | Automated delineation of nuclei for three dimensional (3-d) high content screening |
CN106530320A (zh) * | 2016-09-30 | 2017-03-22 | 深圳大学 | 一种端到端的图像分割处理方法及系统 |
CN107016681A (zh) * | 2017-03-29 | 2017-08-04 | 浙江师范大学 | 基于全卷积网络的脑部mri肿瘤分割方法 |
CN108682015A (zh) * | 2018-05-28 | 2018-10-19 | 科大讯飞股份有限公司 | 一种生物图像中的病灶分割方法、装置、设备及存储介质 |
CN108765422A (zh) * | 2018-06-13 | 2018-11-06 | 云南大学 | 一种视网膜图像血管自动分割方法 |
CN108776969A (zh) * | 2018-05-24 | 2018-11-09 | 复旦大学 | 基于全卷积网络的乳腺超声图像肿瘤分割方法 |
CN108986891A (zh) * | 2018-07-24 | 2018-12-11 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
CN109035261A (zh) * | 2018-08-09 | 2018-12-18 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
CN109166130A (zh) * | 2018-08-06 | 2019-01-08 | 北京市商汤科技开发有限公司 | 一种图像处理方法及图像处理装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7058210B2 (en) * | 2001-11-20 | 2006-06-06 | General Electric Company | Method and system for lung disease detection |
US7899514B1 (en) * | 2006-01-26 | 2011-03-01 | The United States Of America As Represented By The Secretary Of The Army | Medical image processing methodology for detection and discrimination of objects in tissue |
JP6814276B2 (ja) * | 2016-03-17 | 2021-01-13 | イメージア サイバーネティックス インコーポレイテッドImagia Cybernetics Inc. | 情報不足に対しての堅牢性を有するタスク処理用の方法及びシステム |
JP6688536B2 (ja) * | 2016-09-07 | 2020-04-28 | エレクタ、インク.Elekta, Inc. | 放射線療法治療計画のモデルを学習して放射線療法の線量分布を予測するためのシステムおよび方法 |
JP6965343B2 (ja) * | 2016-10-31 | 2021-11-10 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 制御フィードバックを用いる画像セグメンテーションの方法及びシステム |
TWI624804B (zh) * | 2016-11-07 | 2018-05-21 | 盾心科技股份有限公司 | 利用超解析重建法生成高解析度影像的方法與系統 |
JP6787196B2 (ja) * | 2017-03-09 | 2020-11-18 | コニカミノルタ株式会社 | 画像認識装置及び画像認識方法 |
JP6972757B2 (ja) * | 2017-08-10 | 2021-11-24 | 富士通株式会社 | 制御プログラム、制御方法、及び情報処理装置 |
CN108986115B (zh) * | 2018-07-12 | 2020-12-18 | 佛山生物图腾科技有限公司 | 医学图像分割方法、装置及智能终端 |
CN109063609A (zh) * | 2018-07-18 | 2018-12-21 | 电子科技大学 | 一种基于光流特征与全卷积语义分割特征结合的异常行为检测方法 |
CN109145769A (zh) * | 2018-08-01 | 2019-01-04 | 辽宁工业大学 | 融合图像分割特征的目标检测网络设计方法 |
CN109191476B (zh) * | 2018-09-10 | 2022-03-11 | 重庆邮电大学 | 基于U-net网络结构的生物医学图像自动分割新方法 |
CN109493317B (zh) * | 2018-09-25 | 2020-07-07 | 哈尔滨理工大学 | 基于级联卷积神经网络的3d多椎骨分割方法 |
CN109493343A (zh) * | 2018-12-29 | 2019-03-19 | 上海鹰瞳医疗科技有限公司 | 医疗图像异常区域分割方法及设备 |
CN109978886B (zh) * | 2019-04-01 | 2021-11-09 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
-
2019
- 2019-04-01 CN CN201910258038.1A patent/CN109978886B/zh active Active
- 2019-09-25 SG SG11202106290TA patent/SG11202106290TA/en unknown
- 2019-09-25 WO PCT/CN2019/107844 patent/WO2020199528A1/zh active Application Filing
- 2019-09-25 JP JP2021539065A patent/JP2022517571A/ja active Pending
- 2019-10-16 TW TW108137213A patent/TWI750518B/zh not_active IP Right Cessation
- 2019-10-16 TW TW110140808A patent/TWI758233B/zh active
- 2019-10-16 TW TW110140810A patent/TWI758234B/zh active
-
2021
- 2021-06-23 US US17/356,398 patent/US20210319560A1/en not_active Abandoned
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016172612A1 (en) * | 2015-04-23 | 2016-10-27 | Cedars-Sinai Medical Center | Automated delineation of nuclei for three dimensional (3-d) high content screening |
CN106530320A (zh) * | 2016-09-30 | 2017-03-22 | 深圳大学 | 一种端到端的图像分割处理方法及系统 |
CN107016681A (zh) * | 2017-03-29 | 2017-08-04 | 浙江师范大学 | 基于全卷积网络的脑部mri肿瘤分割方法 |
CN108776969A (zh) * | 2018-05-24 | 2018-11-09 | 复旦大学 | 基于全卷积网络的乳腺超声图像肿瘤分割方法 |
CN108682015A (zh) * | 2018-05-28 | 2018-10-19 | 科大讯飞股份有限公司 | 一种生物图像中的病灶分割方法、装置、设备及存储介质 |
CN108765422A (zh) * | 2018-06-13 | 2018-11-06 | 云南大学 | 一种视网膜图像血管自动分割方法 |
CN108986891A (zh) * | 2018-07-24 | 2018-12-11 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
CN109166130A (zh) * | 2018-08-06 | 2019-01-08 | 北京市商汤科技开发有限公司 | 一种图像处理方法及图像处理装置 |
CN109035261A (zh) * | 2018-08-09 | 2018-12-18 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TWI758233B (zh) | 2022-03-11 |
TW202207156A (zh) | 2022-02-16 |
TW202209343A (zh) | 2022-03-01 |
TWI758234B (zh) | 2022-03-11 |
SG11202106290TA (en) | 2021-07-29 |
TW202038188A (zh) | 2020-10-16 |
JP2022517571A (ja) | 2022-03-09 |
CN109978886A (zh) | 2019-07-05 |
US20210319560A1 (en) | 2021-10-14 |
WO2020199528A1 (zh) | 2020-10-08 |
TWI750518B (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978886B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109829920B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110647834B (zh) | 人脸和人手关联检测方法及装置、电子设备和存储介质 | |
CN110047078B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110674719B (zh) | 目标对象匹配方法及装置、电子设备和存储介质 | |
CN109816764B (zh) | 图像生成方法及装置、电子设备和存储介质 | |
JP7178514B2 (ja) | 場面深度とカメラ運動を予測する方法及び装置、機器、媒体並びにプログラム | |
CN110705626A (zh) | 一种图像处理方法及装置、电子设备和存储介质 | |
CN112541928A (zh) | 网络训练方法及装置、图像分割方法及装置和电子设备 | |
CN112967291B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111091610B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN114820584B (zh) | 肺部病灶定位装置 | |
CN112597944B (zh) | 关键点检测方法及装置、电子设备和存储介质 | |
CN111860388A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
JP2022548453A (ja) | 画像分割方法及び装置、電子デバイス並びに記憶媒体 | |
CN111724364B (zh) | 基于肺叶及气管树的方法及装置、电子设备和存储介质 | |
CN111640114B (zh) | 图像处理方法及装置 | |
CN112767288A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111724361A (zh) | 实时显示病灶的方法及装置、电子设备和存储介质 | |
CN112613447B (zh) | 关键点检测方法及装置、电子设备和存储介质 | |
CN112767541B (zh) | 三维重建方法及装置、电子设备和存储介质 | |
CN112200820A (zh) | 三维图像处理方法及装置、电子设备和存储介质 | |
CN112308867A (zh) | 牙齿图像的处理方法及装置、电子设备和存储介质 | |
CN115457024A (zh) | 冷冻电镜图像处理方法、装置、电子设备及存储介质 | |
CN112734015B (zh) | 网络生成方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40004462 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |