CN114820576A - 乳腺特征提取、检测模型的训练方法、装置 - Google Patents
乳腺特征提取、检测模型的训练方法、装置 Download PDFInfo
- Publication number
- CN114820576A CN114820576A CN202210579797.XA CN202210579797A CN114820576A CN 114820576 A CN114820576 A CN 114820576A CN 202210579797 A CN202210579797 A CN 202210579797A CN 114820576 A CN114820576 A CN 114820576A
- Authority
- CN
- China
- Prior art keywords
- image
- model
- area
- replaced
- replacement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000001514 detection method Methods 0.000 title claims abstract description 78
- 238000000605 extraction Methods 0.000 title claims abstract description 63
- 210000005075 mammary gland Anatomy 0.000 title claims abstract description 50
- 210000000481 breast Anatomy 0.000 claims abstract description 128
- 238000012545 processing Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 20
- 230000009466 transformation Effects 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 21
- 238000002372 labelling Methods 0.000 description 12
- 238000003709 image segmentation Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 206010006272 Breast mass Diseases 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10116—X-ray image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10132—Ultrasound image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种乳腺特征提取、检测模型的训练方法、装置。所述方法包括:将原始乳腺图像划分为多个区域;从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像;其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定;利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像;根据还原图像与原始乳腺图像之间的差异,确定第一差异;以缩小第一差异为目标,调整初始特征模型;基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。该方法可为训练提供大量样本,保证训练精度、节省训练时间。
Description
技术领域
本申请涉及医学图像处理技术领域,特别是涉及一种乳腺特征提取、检测模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术
在对乳腺组织进行检查时,可以采用钼靶筛查、计算机断层扫描、超声或核磁共振对乳腺进行成像。在成像后,可以通过人工对乳腺成像进行勾画,以标识出可能存在异常的区域。但是,该方式过于费时费力,并且主观性较强,导致判别异常的准确率不高。为了解决该问题,传统技术中引入了基于深度学习、神经网络等构建的检测模型进行异常自动判别。这类检测模型在处理过程中需要进行特征提取,而特征提取的效果与最后的检测准确度息息相关。但是,由于缺少大量的样本集,使得检测模型在训练过程中难以学习并确定哪些区域和乳腺异常相关,从而忽略某些重要区域的特征没有提取,导致检测模型仍无法达到较高的检测精度。
发明内容
基于此,有必要针对上述技术问题,提供一种能够以较少样本量训练出精度较高模型的乳腺特征提取、检测模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本发明实施例提供一种乳腺特征提取模型的训练方法,用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练方法包括:将原始乳腺图像划分为多个区域;从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像;其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定;利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像;根据还原图像与原始乳腺图像之间的差异,确定第一差异;以缩小第一差异为目标,调整初始特征模型;基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。
在其中一个实施例中,区域属性包括正样本属性和负样本属性,具有正样本属性的区域所包含感兴趣图像的比例大于或等于预设比例阈值,具有负样本属性的区域所包含感兴趣图像的比例小于预设比例阈值,待替换区域包括第一待替换区域和第二待替换区域,目标区域包括第一目标区域和第二目标区域,替换图像包括第一替换图像和第二替换图像;
从多个区域中确定至少一个待替换区域和目标区域包括:
以至少一个具有负样本属性的区域为第一待替换区域,并以至少一个具有正样本属性的区域为第一目标区域;以至少一个具有正样本属性的区域为第二待替换区域,并以至少一个具有负样本属性的区域为第二目标区域;
将待替换区域的图像替换为目标区域的图像,以得到多个替换图像包括:
将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。
在其中一个实施例中,初始特征模型还包括区域替换模型,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像包括:将原始乳腺图像输入区域替换模型,以通过区域替换模型将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。
在其中一个实施例中,以缩小第一差异为目标,调整初始特征模型前还包括:根据多个替换图像与对应的原始乳腺图像之间差异,确定第二差异,和/或根据第一替换图像与第二替换图像之间的差异,确定第三差异;
以缩小第一差异为目标,调整初始特征模型包括:
以缩小第一差异、且扩大第二差异和/或第三差异为目标,调整初始特征模型。
在其中一个实施例中,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像包括:对第一目标区域的图像进行图像变换处理;将第一待替换区域的图像替换为经过图像变换处理后第一目标区域的图像,得到第一替换图像。
在其中一个实施例中,在将原始乳腺图像划分为多个区域之前还包括:对原始乳腺图像进行边界分割处理,以去除原始乳腺图像中的背景。
第二方面,本发明实施例提供一种乳腺检测模型的训练方法,用于训练初始检测模型,初始检测模型包括特征识别模型和如上述的训练方法得到的乳腺特征提取模型,训练方法包括:将标注乳腺图像输入乳腺特征提取模型,得到图像特征;标注乳腺图像中的标注用于反映感兴趣图像的检测结果;将图像特征输入特征识别模型,得到预测检测结果;根据预测检测结果与标注乳腺图像的标注之间的差异,确定第四差异;以缩小第四差异为目标,调整初始检测模型,基于训练结束后的初始检测模型得到乳腺检测模型。
第三方面,本发明实施例提供一种乳腺特征提取模型的训练装置,用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练装置包括:区域划分模块,用于将原始乳腺图像划分为多个区域;替换图像获取模块,用于从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像;其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定;图像处理模块,用于利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像;差异确定模块,用于根据还原图像与原始乳腺图像之间的差异,确定第一差异;参数调整模块,用于以缩小第一差异为目标,调整初始特征模型;模型确定模块,用于基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。
第四方面,本发明实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法的步骤,或上述的方法的步骤。
第五方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。
第六方面,本发明实施例一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。
基于上述任一实施例,对原始乳腺图像进行区域替换处理,得到与原始乳腺图像对应的多个替换图像,再利用初始特征模型对替换图像进行特征提取以及还原。在调整初始特征模型的过程中,使得还原图像和原始乳腺图像之间的差异逐渐减小,以逐渐提高编码器模型的特征提取能力,保证编码器模型可以关注到易被忽略区域的特征。该方法应用于原始乳腺图像较少,导致训练样本数量不足的场景下,通过区域替换处理可以得到许多有学习价值的图像,为训练提供了大量样本,既保证了高训练精度、节省训练时间,能够以较少的原始乳腺图像进行训练达到和使用大量原始乳腺图像进行训练同样的效果。
附图说明
图1为一个实施例中乳腺特征提取模型的训练方法的流程示意图;
图2为一个实施例中对原始乳腺图像进行区域替换的流程示意图;
图3为另一个实施例中对原始乳腺图像进行区域替换的流程示意图;
图4为一个实施例中乳腺检测模型的训练方法的流程示意图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的乳腺特征提取模型以及乳腺检测模型的训练方法可以应用于终端、物理服务器或云服务器。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。物理服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在乳腺检测模型训练完成后将其布置在终端、物理服务器或云服务器,可以用于对乳腺图像中进行检测,检测任务包括但不限于图像分割、目标检测、图像分类等。在另一种可能实现方式中,终端、物理服务器或云服务器也可以在有检测任务时调用其它终端、物理服务器或云服务器上的乳腺检测模型执行检测任务的过程,本申请实施例对此不作限定。
在一个实施例中,如图1所示,提供了一种乳腺特征提取模型的训练方法,该方法可用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练方法包括步骤S102至步骤S112。
S102,将原始乳腺图像划分为多个区域。
通过医疗影像技术对乳腺组织进行成像可得到乳腺成像,对乳腺成像中的感兴趣图像进行标注即可得到原始乳腺图像。感兴趣图像处的乳腺组织可能出现了病变,根据感兴趣图像的位置确定对应乳腺组织的位置,从而进行进一步的化验检查。标注可以是对乳腺成像进行人工、自动、半自动地勾画进行的。原始乳腺图像中感兴趣图像的标注可以是在乳腺成像上的实际标注框,也可以是感兴趣图像的位置,如坐标。另外,由于原始乳腺图像的尺寸较大,为了保证处理速度,先将原始乳腺图像划分为多个区域,对每个区域的图像分别进行处理可保证效率。可选地,可以通过滑窗法、随机采样法、网格法等方式对原始乳腺图像进行区域划分。另外,本实施例中的输入编码器模型,并不一定是对原始乳腺图像进行了实际的图像裁剪。可以根据初始特征模型的结构,确定是否需要进行实际上的图像裁剪。例如,当初始特征模型采用transformer结构,则需要将输入模型的图像裁剪为小块。但如果初始特征模型采用卷积神经网络的结构且计算性能较好,可以不进行图像裁剪。
S104,从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像。
其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定。具体而言,区域属性包括正样本属性和负样本属性,具有正样本属性的区域所包含感兴趣图像的比例大于或等于预设比例阈值,具有负样本属性的区域所包含感兴趣图像的比例小于预设比例阈值。预设比例阈值可以根据实际情况自行设定,例如选择预设比例阈值为10%。由于原始乳腺图像中存在关于感兴趣图像的标注,因此,可以基于标注确定划分后的每个区域中所包含感兴趣图像的比例。例如,在标注为标注框时,可以确定本区域内的标注框所圈定的感兴趣图像的像素点数量与本区域内所有像素点数量之间的比例。或者在标注为感兴趣图像的位置时,可以确定感兴趣图像位置与本区域的位置的重合比例。
由于对乳腺成像进行标注较为费时费力,所以原始乳腺图像的数量较少。所以可用于进行模型训练的样本数量不足,而本实施例对原始乳腺图像进行区域替换,得到与该原始乳腺图像对应的多个有学习价值的替换图像。具体而言,当待替换区域为具有正样本属性的区域时,该待替换区域对应的目标区域为具有负样本属性的区域,反之也类似。待替换区域与目标区域之间的对应关系可以为一一对应或者两个以上的待替换区域对应一个目标区域,本实施例中不做限定。为了基于一个原始乳腺图像得到多个不同的替换图像,替换的方式有很多。例如,对于同一待替换区域,分别使用不同的目标区域进行替换,可得到多个替换图像。又如,选择不同的待替换区域,使用相同或不同的目标区域进行替换,可得到多个替换图像。替换的方式不限于上述举例,可以使用多种替换方式中的一种或多种只要能得到不同的替换图像即可。
S106,利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像。
S108,根据还原图像与原始乳腺图像之间的差异,确定第一差异。
S110,以缩小第一差异为目标,调整初始特征模型。
可以理解,传统技术中包括自编码器神经网络,其由编码器模型和解码器模型组成。对于训练好的自编码器神经网络,将一个对象输入编码器模型进行特征提取,而解码器模型可以将特征提取还原为输入对象。基于该种神经网络技术,本实施例将替换图像输入编码器模型,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像。
与常规自编码器神经网络不同的是,本实施例中对初始特征模型的训练并非是希望将替换图像输入后得到的还原图像接近于替换图像,而是希望还原图像可以接近于原始乳腺图像。这是因为,由于替换图像是经过区域替换的原始乳腺图像,如果想将被替换区域的图像还原,则需要从与被替换区域具有相同区域属性的区域学习到该区域属性所具有的特征,才能基于该特征实现还原。所以以缩小第一差异为目标对初始特征模型进行调整的过程中,编码器模型可以了解到具有正样本属性或负样本属性的区域中那些特征最为重要,从而迫使编码器能关注到在样本量较少时未关注到但具有重要特征的区域。
因此,随着第一差异的减小,编码器模型对乳腺相关图像进行特征提取的能力越强,即根据其输出的图像特征与更容易准确判断区域内感兴趣图像的相关情况。具体而言,对初始特征模型进行调整可以基于第一差异构建第一损失函数,以缩小第一损失函数的值为目标,分别调整编码器模型对应的第一参数和解码器模型对应的第二参数。第一损失函数可以为均方差(Mean Squared Error,MSE)损失函数、平均绝对误差(Mean AbsoluteError,MAE)损失函数、dice损失函数、交叉熵损失函数等形式。可以采用其中的一种或多种的组合,在采用多种形式的损失函数时,还可为不同损失函数设定对应的权重。
S112,基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。
在整个训练过程中,步骤S102至S110可以重复多次执行,即可以针对某一原始乳腺图像重复执行,也可以是在重新选择另一原始乳腺图像后重复多次执行,本实施例中不做限定。训练结束的条件可以根据实际情况进行设计,如第一差异小于第一阈值、迭代的次数达到第一预设次数等。训练结束后的编码器模型可以关注到被传统特征提取模型忽略的区域,从而更全面的提取特征。基于训练结束后的编码器模型所得到的乳腺特征提取模型可用于进一步的乳腺检测,例如用于对乳腺图像进行分类、目标检测、图像分割等,由于乳腺特征提取模型的特征提取能力很强,为提高乳腺检测的精准度打下了基础。
基于本实施例中的乳腺特征提取模型的训练方法,对原始乳腺图像进行区域替换处理,得到与原始乳腺图像对应的多个替换图像,再利用初始特征模型对替换图像进行特征提取以及还原。在调整初始特征模型的过程中,使得还原图像和原始乳腺图像之间的差异逐渐减小,以逐渐提高编码器模型的特征提取能力,保证编码器模型可以关注到易被忽略区域的特征。该方法应用于原始乳腺图像较少,导致训练样本数量不足的场景下,通过区域替换处理可以得到许多有学习价值的图像,为训练提供了大量样本,既保证了高训练精度、节省训练时间,能够以较少的原始乳腺图像进行训练达到和使用大量原始乳腺图像进行训练同样的效果。
在其中一个实施例中,待替换区域包括第一待替换区域和第二待替换区域。目标区域包括第一目标区域和第二目标区域。替换图像包括第一替换图像和第二替换图像。请参阅图2,从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像包括S202至步骤S206。
S202,以至少一个具有负样本属性的区域为第一待替换区域,并以至少一个具有正样本属性的区域为第一目标区域。
从具有负样本属性的区域中选择一个或多个作为第一待替换区域。第一待替换区域中所包含区域的数量与具有负样本属性的区域的总数之间的比可以为第一预设比例。第一预设比例的大小会影响替换图像与原始乳腺图像之间的差异。第一预设比例越大,说明被替换的区域越多,由此得到的替换图像与原始乳腺图像之间的差异越大,反之类似,不再赘述。
S204,以至少一个具有正样本属性的区域为第二待替换区域,并以至少一个具有负样本属性的区域为第二目标区域。
从具有正样本属性的区域中选择一个或多个作为第二待替换区域。第二待替换区域中所包含区域的数量与具有正样本属性的区域的总数之间的比可以为第二预设比例。第二预设比例的大小会影响替换图像与原始乳腺图像之间的差异。第二预设比例越大,说明被替换的区域越多,由此得到的替换图像与原始乳腺图像之间的差异越大,反之类似,不再赘述。
S206,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。
仅对原始乳腺图像中具有负样本属性的区域进行替换可以得到第一替换图像,基于第一替换图像可以进行很好的还原,则说明编码器模型可以从第二替换图像中提取出与正常乳腺组织的图像相关的特征。仅对原始乳腺图像中具有正样本属性的区域进行替换可以得到第二替换图像,基于第二替换图像可以进行很好的还原,则说明编码器模型可以提取出感兴趣图像相关的重要特征。
在其中一个实施例中,初始特征模型还包括区域替换模型,即区域替换的相关处理可以由初始特征模型这一神经网络中的区域替换模型实现。具体而言,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像包括:将原始乳腺图像输入区域替换模型,以通过区域替换模型将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并通过区域替换模型将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。
即本实施例中区域替换处理也是由初始特征模型中的一个部分实现的,因此可以在训练初始特征模型的过程中一并调整区域替换模型,从而在多种替换方式中找到学习效果较佳的替换方式。
在其中一个实施例中,以缩小第一差异为目标,调整初始特征模型前还包括:根据多个替换图像与对应的原始乳腺图像之间差异,确定第二差异,和/或根据第一替换图像与第二替换图像之间的差异,确定第三差异。以缩小第一差异为目标,调整初始特征模型包括:以缩小第一差异、且扩大第二差异和/或第三差异为目标,调整初始特征模型。
为了找到较好的区域替换方式,需要在调整编码器模型和解码器模型时一并调整区域替换模型,而为了提高编码器模型和解码器模型的能力,应加大还原难度。因此,区域替换模型可调整的方向即为,将替换图像与原始乳腺图像之间的差异扩大,和/或将第一替换图像和第二替换图像之间的差异扩大。这两种调整方向均可以为还原增加难度,如果编码器模型和解码器模型可以实现完成难度较大的还原任务,则说明编码器模型和解码器模型的能力进一步增强了。具体而言,在构建第一损失函数时,除了第一差异对应的损失项以外,还应增加第二差异和/或第三差异的损失项。但如果是以缩小第一损失函数的值为目标,分别调整编码器模型对应的第一参数、解码器模型对应的第二参数以及区域替换模型对应的第三参数,则应取第二差异和/或第三差异的损失项的负值加入第一损失函数中,才可实现缩小第一差异、且扩大第二差异和/或第三差异。其中,由于第一预设比例或第二预设比例均与替换图像和原始乳腺图像之间的差异相关,第三参数可包括第一预设比例和/或第二预设比例,从而选择出较为合适的第一预设比例和/或第二预设比例。可选地,为了评估上述第一差异、第二差异或第三差异,可以使用常见的图像质量评价指标,例如,PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)、SSIM(Structural Similarity,结构相似性)、MSE(Mean Square Error,均方误差)等。
在其中一个实施例中,请参阅图3,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像包括S302至步骤S304。
S302,对第一目标区域的图像进行图像变换处理。
S304,将第一待替换区域的图像替换为经过图像变换处理后第一目标区域的图像,得到第一替换图像。
具体而言,由于感兴趣图像在整个原始乳腺图像中的比例较小,所以具有正样本属性的区域的数量较少,使得可用于替换负样本区域的区域数量也较少,从而难以得到大量第一替换图像。为了解决该问题,可以对选择出来的第一目标区域的图像进行图像变换处理,例如随机旋转、翻转、缩放、镜像等,通过图像变换处理拓展了具有正样本属性的区域的数量,无需重新进行乳腺成像以及标注,就可得到额外的具有正样本属性的区域。在通过区域替换模型进行区域替换处理的情况下,本实施例中的步骤也可以由区域替换模型进行。
类似地,在一个实施例中,将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像包括:对第二目标区域的图像进行图像变换处理;将第二待替换区域的图像替换为经过图像变换处理后第二目标区域的图像,得到第二替换图像。考虑到具有负样本属性的区域数量较多,在有些实施例中可以不经过上述图像变换处理进行拓展。
在其中一个实施例中,在将原始乳腺图像划分为多个区域之前还包括:对原始乳腺图像进行边界分割处理,以去除原始乳腺图像中的背景。可以理解,背景指的是与乳腺组织无关的图像,例如有些原始乳腺图像中包括的面积较大的黑色背景,从而导致在训练过程中初始特征模型需要处理较多无用图像,影响处理速度。因此,本实施例中通过边界分割处理将背景去除,加快训练速度。而边界分割处理可采用重采样法、阈值限制法、灰度直方图归一化法等进行。
在一个实施例中,如图4所示,提供了一种乳腺检测模型的训练方法,用于训练初始检测模型,初始检测模型包括特征识别模型和如上述的训练方法得到的乳腺特征提取模型,训练方法包括步骤S402至步骤S410。
S402,将标注乳腺图像输入乳腺特征提取模型,得到图像特征。
标注乳腺图像中的标注用于反映感兴趣图像的检测结果。标注可以是对乳腺成像进行人工、自动、半自动等方式进行的。标注乳腺图像中的标注可以是在乳腺成像上对感兴趣图像的标注框,也可以是感兴趣图像的位置,如坐标,还可以是对感兴趣图像的性质分类,如感兴趣图像为良性或恶性、乳腺图像中是否包含感兴趣图像等。感兴趣图像可以为乳腺钙化组织图像、乳腺肿块组织图像等。由于乳腺特征提取模型是经过上述乳腺特征提取模型的训练方法所得到,所以其提取出的图像特征忽略了和感兴趣图像相关的特征的可能性很小,为提高乳腺检测的精准度打下基础。
S404,将图像特征输入特征识别模型,得到预测检测结果。
可以理解,特征识别模型用于根据图像特征输出预测检测结果。预测检测结果有多种形式,可根据需要执行的检测任务以及标注乳腺图像中检测结果的类别选择合适的特征识别模型,以得到对应的预测检测结果。可选地,在标注为标注框或感兴趣图像的位置时,特征识别模型可以为图像分割模型,图像分割模型可将乳腺图像中包含的感兴趣图像分割出来。特征识别模型还可以为目标检测模型,目标检测模型可将乳腺图像中包含的感兴趣图像检测出来。目标检测模型和图像分割模型的差别主要在于,目标检测模型的输出结果可直接在乳腺图像上框选出感兴趣图像,即可在乳腺图像上打上标注框,而图像分割模型的输出为掩膜图像,掩膜图像中感兴趣图像处的像素与其他非感兴趣图像不同,实现图像的分割。图像分割还具体包括语义分割、实例分割等,可根据实际需要选择对应的图像分割模型。可选地,当标注为性质分类时,特征识别模型可以为分类模型,分类模型可对乳腺图像进行分类,例如整个乳腺图像是否包含感兴趣图像、对标注乳腺图像所标注出的感兴趣图像为良性或恶性等。
S406,根据预测检测结果与标注乳腺图像的标注之间的差异,确定第四差异。
确定第四差异的方式与选择的特征识别模型相关。例如,当特征识别模型为分割模型时,可以根据分割结果所得到的感兴趣图像与标注乳腺图像所标注出的感兴趣图像之间的重合度确定第四差异。当特征识别模型为目标检测模型时,可以根据目标检测结果中的标注框与标注乳腺图像的标注框之间差异确定第四差异。当特征识别模型为分类模型时,还可比较分类模型的分类结果与标注中的实际分类之间的差异确定第四差异。
S408,以缩小第四差异为目标,调整初始检测模型。
可以理解,由于注乳腺图像的标注可以准确反映感兴趣图像的检测结果,随着第四差异的减小,由初始检测模型预测出来的预测检测结果与准确的检测结果逐渐接近,使得自动检测的准确度逐渐提高。具体而言对初始检测模型进行调整,可以基于第四差异构建第二损失函数,以缩小第二损失函数的值为目标,分别调整乳腺特征提取模型对应的第四参数和特征识别模型对应的第五参数。第二损失函数可以为均方差(Mean SquaredError,MSE)损失函数、平均绝对误差(Mean Absolute Error,MAE)损失函数、dice损失函数、交叉熵损失函数等形式,在采用多种形式的损失函数时,还可为不同损失函数设定对应的权重。可选地,考虑到乳腺特征提取模型已经过初步训练,在本实施例中的调整过程中,先不对第四参数进行调整而仅调整第五参数,在满足预设训练条件后(可以为迭代次数达到第二预设次数后、第四差异小于第二阈值等),再同时对第四参数和第五参数进行微调。
S410,基于训练结束后的初始检测模型得到乳腺检测模型。
在整个训练过程中,步骤S402至S408可以重复多次执行,即可以针对某一标注乳腺图像重复执行,也可以是在重新选择另一标注乳腺图像后重复多次执行,本实施例中不做限定。训练结束的条件可以根据实际情况进行设计,如第四差异小于第三阈值、迭代的次数达到第三预设次数等。第三阈值大于或等于第二阈值。第三预设次数大于或等于第二预设次数。
基于本实施例中的乳腺检测模型的训练方法,对包含乳腺特征提取模型和特征识别模型的初始检测模型进行训练,由于乳腺特征提取模型具有很强的特征提取能力,在训练样本数量不足的情况下,仍可保证高训练精度、节省训练时间,能够以较少的标注乳腺图像进行训练达到和使用大量标注乳腺图像进行训练同样的效果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
本发明实施例提供一种乳腺特征提取模型的训练装置,用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练装置包括区域划分模块、替换图像获取模块、图像处理模块、差异确定模块、参数调整模块以及模型确定模块,其中:
区域划分模块,用于将原始乳腺图像划分为多个区域。
替换图像获取模块,用于从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像。其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定。
图像处理模块,用于利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像。
差异确定模块,用于根据还原图像与原始乳腺图像之间的差异,确定第一差异。
参数调整模块,用于以缩小第一差异为目标,调整初始特征模型。
模型确定模块,用于基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。
在其中一个实施例中,待替换区域包括第一待替换区域和第二待替换区域。目标区域包括第一目标区域和第二目标区域。替换图像包括第一替换图像和第二替换图像。替换图像获取模块用于以至少一个具有负样本属性的区域为第一待替换区域,并以至少一个具有正样本属性的区域为第一目标区域;以至少一个具有正样本属性的区域为第二待替换区域,并以至少一个具有负样本属性的区域为第二目标区域;将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。
区域替换处理的过程可以由替换图像获取模块独立执行。在初始特征模型这一神经网络中包括区域替换模型时,区域替换模型可用于进行区域替换处理。因此,替换图像获取模块也可以将原始乳腺图像发送至区域替换模型,通过区域替换模型对原始乳腺图像进行区域替换,替换图像获取模块获取区域替换模型输出的多个替换图像。具体而言,在其中一个实施例中,初始特征模型还包括区域替换模型。替换图像获取模块用于将原始乳腺图像输入区域替换模型,以通过区域替换模型将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并通过区域替换模型将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。
在其中一个实施例中,差异确定模块用于根据多个替换图像与对应的原始乳腺图像之间差异,确定第二差异,和/或根据第一替换图像与第二替换图像之间的差异,确定第三差异。参数调整模块用于以缩小第一差异、且扩大第二差异和/或第三差异为目标,调整初始特征模型。
在其中一个实施例中,区域替换模型用于对第一目标区域的图像进行图像变换处理;将第一待替换区域的图像替换为经过图像变换处理后第一目标区域的图像,得到第一替换图像。
在其中一个实施例中,区域替换模型用于对第二目标区域的图像进行图像变换处理;将第二待替换区域的图像替换为经过图像变换处理后第二目标区域的图像,得到第二替换图像。
在其中一个实施例中,乳腺特征提取模型的训练装置还包括边界分割模块。边界分割模块用于对原始乳腺图像进行边界分割处理,以去除原始乳腺图像中的背景。
本发明实施例提供一种乳腺检测模型的训练装置,用于训练初始检测模型,初始检测模型包括特征识别模型和如上述的训练方法得到的乳腺特征提取模型。训练装置包括特征提取模块、预测模块、差异确定模块、参数调整模块以及模型确定模块,其中:
特征提取模块,用于将标注乳腺图像输入乳腺特征提取模型,得到图像特征。
预测模块,用于将图像特征输入特征识别模型,得到预测检测结果。
差异确定模块,用于根据预测检测结果与标注乳腺图像的标注之间的差异,确定第四差异。
参数调整模块,用于以缩小第四差异为目标,调整初始检测模型。
模型确定模块,用于基于训练结束后的初始检测模型得到乳腺检测模型。
上述乳腺特征提取模型以及乳腺检测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例提供一种计算机设备,该计算机设备可以是服务器、终端等。其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和通信接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种乳腺检测模型或乳腺特征提取模型的训练方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的区域图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。
本发明实施例一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种乳腺特征提取模型的训练方法,其特征在于,所述训练方法包括:
将原始乳腺图像划分为多个区域;
从所述多个区域中确定至少一个待替换区域和目标区域,并将所述待替换区域的图像替换为所述目标区域的图像,以得到多个替换图像;其中,所述目标区域与所述待替换区域的区域属性不同,所述区域属性由该区域所包含感兴趣图像的比例确定;
利用初始特征模型中的编码器模型对所述替换图像进行特征提取,并利用所述初始特征模型中的解码器模型根据所述特征提取的结果进行图像还原,得到还原图像;
根据所述还原图像与所述原始乳腺图像之间的差异,确定第一差异;
以缩小所述第一差异为目标,调整所述初始特征模型;
基于训练结束后的所述编码器模型得到乳腺特征提取模型。
2.根据权利要求1所述的训练方法,其特征在于,所述区域属性包括正样本属性和负样本属性,具有正样本属性的区域所包含所述感兴趣图像的比例大于或等于预设比例阈值,具有负样本属性的区域所包含所述感兴趣图像的比例小于所述预设比例阈值,所述待替换区域包括第一待替换区域和第二待替换区域,所述目标区域包括第一目标区域和第二目标区域,所述替换图像包括第一替换图像和第二替换图像;
所述从所述多个区域中确定至少一个待替换区域和目标区域包括:
以至少一个具有负样本属性的区域为所述第一待替换区域,并以至少一个具有正样本属性的区域为所述第一目标区域;
以至少一个具有正样本属性的区域为所述第二待替换区域,并以至少一个具有负样本属性的区域为所述第二目标区域;
所述将所述待替换区域的图像替换为所述目标区域的图像,以得到多个替换图像包括:
将所述第一待替换区域的图像替换为所述第一目标区域的图像,得到所述第一替换图像,并将所述第二待替换区域的图像替换为所述第二目标区域的图像,得到所述第二替换图像。
3.根据权利要求2所述的训练方法,其特征在于,所述初始特征模型还包括区域替换模型,所述将所述第一待替换区域的图像替换为所述第一目标区域的图像,得到所述第一替换图像,并将所述第二待替换区域的图像替换为所述第二目标区域的图像,得到所述第二替换图像包括:
将所述原始乳腺图像输入所述区域替换模型,以通过所述区域替换模型将所述第一待替换区域的图像替换为所述第一目标区域的图像,得到所述第一替换图像,并通过所述区域替换模型将所述第二待替换区域的图像替换为所述第二目标区域的图像,得到所述第二替换图像。
4.根据权利要求3所述的训练方法,其特征在于,所述以缩小所述第一差异为目标,调整所述初始特征模型前还包括:
根据所述多个替换图像与对应的所述原始乳腺图像之间差异,确定第二差异,和/或根据所述第一替换图像与所述第二替换图像之间的差异,确定第三差异;
所述以缩小所述第一差异为目标,调整所述初始特征模型包括:
以缩小所述第一差异、且扩大所述第二差异和/或所述第三差异为目标,调整所述初始特征模型。
5.根据权利要求2所述的训练方法,其特征在于,所述将所述第一待替换区域的图像替换为所述第一目标区域的图像,得到所述第一替换图像包括:
对所述第一目标区域的图像进行图像变换处理;
将所述第一待替换区域的图像替换为经过所述图像变换处理后所述第一目标区域的图像,得到所述第一替换图像。
6.根据权利要求1-5任一项所述的训练方法,其特征在于,在将原始乳腺图像划分为多个区域之前还包括:
对所述原始乳腺图像进行边界分割处理,以去除所述原始乳腺图像中的背景。
7.一种乳腺检测模型的训练方法,其特征在于,用于训练初始检测模型,所述初始检测模型包括特征识别模型和如权利要求1至6任一项所述的训练方法得到的所述乳腺特征提取模型,所述训练方法包括:
将标注乳腺图像输入所述乳腺特征提取模型,得到图像特征;所述标注乳腺图像中的标注用于反映对感兴趣图像的检测结果;
将所述图像特征输入所述特征识别模型,得到预测检测结果;
根据所述预测检测结果与所述标注乳腺图像的标注之间的差异,确定第四差异;
以缩小所述第四差异为目标,调整所述初始检测模型,基于训练结束后的所述初始检测模型得到乳腺检测模型。
8.一种乳腺特征提取模型的训练装置,其特征在于,用于训练初始特征模型,所述初始特征模型包括编码器模型和解码器模型,所述训练装置包括:
区域划分模块,用于将原始乳腺图像划分为多个区域;
替换图像获取模块,用于从所述多个区域中确定至少一个待替换区域和目标区域,并将所述待替换区域的图像替换为所述目标区域的图像,以得到多个替换图像;其中,所述目标区域与所述待替换区域的区域属性不同,所述区域属性由该区域所包含感兴趣图像的比例确定;
图像处理模块,用于利用所述编码器模型对所述替换图像进行特征提取,并利用所述解码器模型根据所述特征提取的结果进行图像还原,得到还原图像;
差异确定模块,用于根据所述还原图像与所述原始乳腺图像之间的差异,确定第一差异;
参数调整模块,用于以缩小所述第一差异为目标,调整所述初始特征模型;
模型确定模块,用于基于训练结束后的所述初始特征模型中的所述编码器模型得到乳腺特征提取模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤,或权利要求7所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤,或权利要求7所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210579797.XA CN114820576B (zh) | 2022-05-26 | 2022-05-26 | 乳腺特征提取、检测模型的训练方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210579797.XA CN114820576B (zh) | 2022-05-26 | 2022-05-26 | 乳腺特征提取、检测模型的训练方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114820576A true CN114820576A (zh) | 2022-07-29 |
CN114820576B CN114820576B (zh) | 2024-08-23 |
Family
ID=82518016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210579797.XA Active CN114820576B (zh) | 2022-05-26 | 2022-05-26 | 乳腺特征提取、检测模型的训练方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114820576B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115294400A (zh) * | 2022-08-23 | 2022-11-04 | 北京医准智能科技有限公司 | 图像分类模型的训练方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961302A (zh) * | 2018-07-16 | 2018-12-07 | Oppo广东移动通信有限公司 | 图像处理方法、装置、移动终端及计算机可读存储介质 |
CN110335250A (zh) * | 2019-05-31 | 2019-10-15 | 上海联影智能医疗科技有限公司 | 网络训练方法、装置、检测方法、计算机设备和存储介质 |
CN111354059A (zh) * | 2020-02-26 | 2020-06-30 | 北京三快在线科技有限公司 | 图像处理方法及装置 |
US20210019551A1 (en) * | 2018-08-23 | 2021-01-21 | Tencent Technology (Shenzhen) Company Limited | Image processing method and apparatus, computer-readable storage medium, and computer device |
CN113920032A (zh) * | 2021-10-29 | 2022-01-11 | 上海商汤智能科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-05-26 CN CN202210579797.XA patent/CN114820576B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961302A (zh) * | 2018-07-16 | 2018-12-07 | Oppo广东移动通信有限公司 | 图像处理方法、装置、移动终端及计算机可读存储介质 |
US20210019551A1 (en) * | 2018-08-23 | 2021-01-21 | Tencent Technology (Shenzhen) Company Limited | Image processing method and apparatus, computer-readable storage medium, and computer device |
CN110335250A (zh) * | 2019-05-31 | 2019-10-15 | 上海联影智能医疗科技有限公司 | 网络训练方法、装置、检测方法、计算机设备和存储介质 |
CN111354059A (zh) * | 2020-02-26 | 2020-06-30 | 北京三快在线科技有限公司 | 图像处理方法及装置 |
CN113920032A (zh) * | 2021-10-29 | 2022-01-11 | 上海商汤智能科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115294400A (zh) * | 2022-08-23 | 2022-11-04 | 北京医准智能科技有限公司 | 图像分类模型的训练方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114820576B (zh) | 2024-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110321920B (zh) | 图像分类方法、装置、计算机可读存储介质和计算机设备 | |
CN111311578B (zh) | 基于人工智能的对象分类方法以及装置、医学影像设备 | |
CN111260055B (zh) | 基于三维图像识别的模型训练方法、存储介质和设备 | |
WO2021233021A1 (zh) | 一种图像区域分割模型训练方法、分割方法和装置 | |
CN111524137B (zh) | 基于图像识别的细胞识别计数方法、装置和计算机设备 | |
CN108629772B (zh) | 图像处理方法及装置、计算机设备和计算机存储介质 | |
CN111738244A (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
CN111291825A (zh) | 病灶分类模型训练方法、装置、计算机设备和存储介质 | |
CN111192678B (zh) | 病理显微图像诊断、模型训练方法、装置、设备及介质 | |
CN115908363B (zh) | 肿瘤细胞统计方法、装置、设备和存储介质 | |
CN114758137A (zh) | 超声图像分割方法、装置及计算机可读存储介质 | |
CN113177592B (zh) | 一种图像分割方法、装置、计算机设备及存储介质 | |
CN116563285B (zh) | 一种基于全神经网络的病灶特征识别与分割方法及系统 | |
Fu et al. | Quality assessment of retargeted images using hand-crafted and deep-learned features | |
Ramella | Saliency-based segmentation of dermoscopic images using colour information | |
CN114820576B (zh) | 乳腺特征提取、检测模型的训练方法、装置 | |
Wagner et al. | River water segmentation in surveillance camera images: A comparative study of offline and online augmentation using 32 CNNs | |
CN113850834B (zh) | 一种肿瘤区域微血管分割方法、装置 | |
CN115359005A (zh) | 图像预测模型生成方法、装置、计算机设备和存储介质 | |
WO2018120043A1 (zh) | 图像重建方法及装置 | |
CN114913135B (zh) | 基于级联VNet-S网络和三维条件随机场的肝脏分割系统 | |
CN115239688B (zh) | 基于磁共振对比增强3d-t1wi图像的脑转移瘤识别方法与系统 | |
CN117351196B (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
US20230178220A1 (en) | Method and apparatus for outputting information related to a pathological slide image | |
CN113706376B (zh) | 一种图像超分辨率重建方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |