CN114581382A - 一种针对乳腺病灶的训练方法、装置及计算机可读介质 - Google Patents
一种针对乳腺病灶的训练方法、装置及计算机可读介质 Download PDFInfo
- Publication number
- CN114581382A CN114581382A CN202210156933.4A CN202210156933A CN114581382A CN 114581382 A CN114581382 A CN 114581382A CN 202210156933 A CN202210156933 A CN 202210156933A CN 114581382 A CN114581382 A CN 114581382A
- Authority
- CN
- China
- Prior art keywords
- breast
- classification
- training
- focus
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 190
- 210000000481 breast Anatomy 0.000 title claims abstract description 157
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000003902 lesion Effects 0.000 title claims abstract description 48
- 238000013145 classification model Methods 0.000 claims abstract description 82
- 230000004927 fusion Effects 0.000 claims abstract description 70
- 230000003211 malignant effect Effects 0.000 claims abstract description 25
- 238000002604 ultrasonography Methods 0.000 claims abstract description 22
- 238000007499 fusion processing Methods 0.000 claims abstract description 11
- 210000005075 mammary gland Anatomy 0.000 claims description 39
- 238000000605 extraction Methods 0.000 claims description 38
- 238000004422 calculation algorithm Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 13
- 230000010354 integration Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 208000026310 Breast neoplasm Diseases 0.000 abstract description 32
- 206010006187 Breast cancer Diseases 0.000 abstract description 31
- 230000000875 corresponding effect Effects 0.000 description 21
- 238000012706 support-vector machine Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000007477 logistic regression Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000000391 smoking effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 201000000736 Amenorrhea Diseases 0.000 description 1
- 206010001928 Amenorrhoea Diseases 0.000 description 1
- 208000018672 Dilatation Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 231100000540 amenorrhea Toxicity 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 201000003149 breast fibroadenoma Diseases 0.000 description 1
- 208000011803 breast fibrocystic disease Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000035606 childbirth Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002657 hormone replacement therapy Methods 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000030776 invasive breast carcinoma Diseases 0.000 description 1
- 230000005865 ionizing radiation Effects 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 229940127234 oral contraceptive Drugs 0.000 description 1
- 239000003539 oral contraceptive agent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
本发明公开了一种针对乳腺病灶的训练方法、装置及计算机可读介质,本发明一实施例的方法首先将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;其次针对训练样本数据中任一训练样本:对训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;之后将训练样本中影响因素量化值和乳腺图像特征进行融合处理,得到病灶融合特征;最后对病灶融合特征进行有监督的分类学习,生成病灶分类模型。由此,充分融合了乳腺图像特征和乳腺癌的影响因素量化值,从而提高了模型训练的准确性,使得病灶分类模型能够对乳腺病灶进行准确预测。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种针对乳腺病灶的训练方法、装置及计算机可读介质。
背景技术
乳腺癌是最常见的癌症类型之一,对全世界所有年龄段女性的生活都有负面影响。据报道,美国女性在某个时间患乳腺癌的几率为13%;到2021年,美国可能将有43,600人死于乳腺癌;而且乳腺癌有极大的可能会影响男性。预计到2021年,将诊断出约2,650例新的男性浸润性乳腺癌病例。男性一生中患乳腺癌的几率约为833分之一。根据世界卫生组织的数据。引发乳腺癌的风险因素包括高龄、肥胖、重饮酒、乳腺癌家族史、辐射暴露史、生育史、吸烟和绝经后激素治疗等。
在当今世界,识别乳腺癌的方法主要是基于乳房超声检查以确定一个人是否患有乳腺肿瘤。乳腺肿瘤分为两种类型:恶性和良性。恶性肿瘤和良性肿瘤在形式和质地方面具有不同的形态。因此,医生通常可以通过分析肿瘤的外观来确定乳腺癌的种类或存在。但是如果仅依靠乳腺超声图像来判断良恶性略显不可靠,且对于年资较低的医生来说,是一件非常有挑战的事情。
近几年随着AI技术的发展,涌现出许多非常成熟的机器学习分类模型,且有较多已用在乳腺癌的判断上。然而现有模型通常仅针对图像数据进行反复学习训练,没有充分利用其他信息进行模型训练,例如影响乳腺癌的高危因素等,这对于临床应用来说数据略显单一,极大地影响了乳腺癌的准确判断。
发明内容
为了解决上述现有技术存在的问题,本发明实施例提供一种针对乳腺病灶的训练方法、装置及计算机可读介质,能够基于乳腺图像特征和乳腺癌的影响因素量化值进行模型训练,从而提高了模型的准确性,进而使得模型能够对乳腺病灶进行准确预测。
为实现上述目的,根据本发明实施例第一方面,提供一种针对乳腺病灶的训练方法,所述方法包括:将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;针对所述训练样本数据中任一所述训练样本:对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理,得到病灶融合特征;对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型。
可选的,所述对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型,包括:基于第一算法对所述病灶融合特征进行有监督的分类学习,生成第一分类模型;基于第二算法对所述病灶融合特征进行有监督的分类学习,生成第二分类模型;基于第三算法对所述病灶融合特征进行有监督的分类学习,生成第三分类模型;基于权重搜索的方式,对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成,生成病灶分类模型。
可选的,所述对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;包括:将所述训练样本中乳腺超声图像作为子训练样本;基于若干所述子训练样本,利用算法对图像特征提取进行有监督的训练,生成图像特征提取模型;基于所述图像特征提取模型,对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征。
可选的,所述的方法还包括:获取待测乳腺数据;其中,所述待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值;利用所述图像特征提取模型对所述待测乳腺超声图像进行图像特征提取,生成待测乳腺图像特征;将所述待测乳腺图像特征和对应的所述影响因素量化值进行融合处理,得到待测病灶融合特征;利用病灶分类模型对所述待测病灶融合特征进行预测,得到病灶分类结果。
可选的,所述利用病灶分类模型对所述待测病灶融合特征进行预测,得到病灶分类结果,包括:利用第一分类模型对所述待测病灶融合特征进行预测,得到第一分类结果;利用第二分类模型对所述待测病灶融合特征进行预测,得到第二分类结果;利用第三分类模型对所述待测病灶融合特征进行预测,得到第三分类结果;对所述第一分类结果、所述第二分类结果和所述第三分类结果分别施加不同的权重,并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理,得到病灶分类结果。
可选的,所述将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据,包括:对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第一训练样本数据;对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第二训练样本数据;基于所述第一训练样本数据和所述第二训练样本数据,得到训练样本数据。
为实现上述目的,根据本发明实施例第二方面提供一种针对乳腺病灶的训练装置,所述装置包括:样本模块,用于将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;特征融合模块,用于针对所述训练样本数据中任一所述训练样本:对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理,得到病灶融合特征;分类训练模块,用于对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型。
可选的,所述分类训练模块包括:第一分类训练单元,用于基于第一算法对所述病灶融合特征进行有监督的分类学习,生成第一分类模型;第二分类训练单元,用于基于第二算法对所述病灶融合特征进行有监督的分类学习,生成第二分类模型;第三分类训练单元,用于基于第三算法对所述病灶融合特征进行有监督的分类学习,生成第三分类模型;模型集成单元,用于基于权重搜索的方式,对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成,生成病灶分类模型。
可选的,所述特征融合模块包括:样本单元,用于将所述训练样本中乳腺超声图像作为子训练样本;训练单元,用于基于若干所述子训练样本,利用算法对图像特征提取进行有监督的训练,生成图像特征提取模型;特征提取单元,用于基于所述图像特征提取模型,对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征。
为实现上述目的,根据本发明实施例第三方面提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。
与现有技术相比,本发明实施例提供一种针对乳腺病灶的训练方法,首先将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;其次,针对训练样本数据中任一训练样本:对训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;之后,将训练样本中影响因素量化值和乳腺图像特征进行融合处理,得到病灶融合特征;最后,对病灶融合特征进行有监督的分类学习,生成病灶分类模型。由此,采用多样化的训练数据,充分融合了乳腺图像特征和乳腺癌的影响因素量化值,从而提高了模型训练的准确性,进而使得模型预测与临床诊断预测乳腺癌思想相一致,具有一定的可解释性。
理解的是,本发明的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明一实施例针对乳腺病灶的训练方法的示意性流程图;
图2为本发明另一实施例针对乳腺病灶的训练方法的示意性流程图;
图3为本发明再一实施例针对乳腺病灶的训练方法的示意性流程图;
图4为本发明一实施例中乳腺癌影响因素量化值的表格示意图;
图5为本发明另一实施例针对乳腺病灶的训练方法的过程示意图;
图6为本发明一实施例针对乳腺病灶的训练装置的示意性结构图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
如图1所示,本发明一实施例针对乳腺病灶的训练方法的示意性流程图。如图4所示,本发明一实施例中乳腺癌影响因素量化值的表格示意图。一种针对乳腺病灶的训练方法,至少包括如下操作流程:
S101,将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;
S102,针对训练样本数据中任一训练样本:对训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将训练样本中影响因素量化值和乳腺图像特征进行融合处理,得到病灶融合特征;
S103,对病灶融合特征进行有监督的分类学习,生成病灶分类模型。
在S101中,良性标签是指不具有乳腺癌的标签;恶性标签是指具有乳腺癌的标签。对应病例的影响因素用于指示与乳腺癌患病风险高度相关的因素,即乳腺癌高危因素。影响因素包括:年龄、受教育程度、工作时间、生活压力、吸烟史(每天吸一支以上并连续或累计6个月以上者定义为吸烟)、二手烟暴露史、体育锻炼、绝闭经、分娩史(包括自然分娩和剖腹产)、哺乳史、良性乳腺疾病史(乳腺增生、结节、导管扩张、良性纤维腺瘤、感染等)、血缘亲属乳腺癌史、血缘亲属卵巢癌史、口服避孕药、暴露于治疗电离辐射等。除了年龄对应的量化指标本身就是量化值,其他影响因素对应的量化指标全部采用one-hot编码的形式进行量化。由此,通过对影响乳腺癌病因的高危因素进行统计量化,从而有利于模型训练,提高了病灶分类模型预测的准确性。
对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第一训练样本数据;对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第二训练样本数据;基于第一训练样本数据和第二训练样本数据,得到训练样本数据。在这里,数据扩充处理包括对乳腺超声图像进行旋转或者亮度调整,例如对乳腺超声图像进行45°、90°、135°、180°、225°、和270°的旋转,或者对乳腺超声图像进行系数0.5或者1.3倍的亮度调整,最终得到224*224尺寸的第一训练样本数据和第二训练样本数据。
在S102中,可以基于已训练好的图像特征提取模型对训练样本中乳腺超声图像进行图像特征提取,也可以是基于神经网络算法对训练样本中乳腺超声图像进行图像特征提取。将乳腺图像特征和影响因素量化值拼接成一个547维向量,得到病灶融合特征。
在S103中,利用SVM模型,和/或AdaBoost模型,和/或Logistic Regression模型分别对病灶融合特征进行有监督的分类学习,生成病灶分类模型。
本发明实施例通过将具有良恶性标签的乳腺数据作为训练样本,并对训练样本中乳腺超声图像进行图像特征提取,之后将提取的乳腺图像特征和影响因素量化值进行融合处理,从而得到病灶融合特征;最后基于病灶融合特征进行有监督的分类学习,生成病灶分类模型。由此,基于乳腺图像特征和影响因素量化值进行模型训练,从而使得病灶分类模型的预测更加符合临床诊断预测乳腺癌思想,提高了病灶分类模型对乳腺癌预测的准确性。
如图2所示,本发明另一实施例针对乳腺病灶的训练方法的示意性流程图;如图5所示,本发明另一实施例针对乳腺病灶的训练方法的过程示意图。本实施例的方法是在前述实施例的基础上进一步优化得到的。一种针对乳腺病灶的训练方法,至少包括如下操作流程:
S201,将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;
S202,针对训练样本数据中任一训练样本:将训练样本中乳腺超声图像作为子训练样本;基于若干子训练样本,利用算法对图像特征提取进行有监督的训练,生成图像特征提取模型;基于图像特征提取模型,对训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将训练样本中影响因素量化值和乳腺图像特征进行融合处理,得到病灶融合特征;
S203,基于第一算法对病灶融合特征进行有监督的分类学习,生成第一分类模型;基于第二算法对病灶融合特征进行有监督的分类学习,生成第二分类模型;基于第三算法对病灶融合特征进行有监督的分类学习,生成第三分类模型;
S204,基于权重搜索的方式,对第一分类模型、第二分类模型和第三分类模型进行集成,生成病灶分类模型。
具体地,每个病例的乳腺数据包括一张乳腺超声图像和对应病例的影响因素量化值。乳腺数据被标记乳腺癌良性标签或者乳腺癌恶性标签。构建基于卷积神经网络框架Pytorch的模型结构,通过在Pytorch中使用连接层直接实本发明网络模型。
首先,将训练样本中乳腺超声图像作为子训练样本;其次,基于若干子训练样本,利用CNN模型对每个子训练样本中图像特征提取进行有监督的训练,生成图像特征提取模型;之后,将训练样本中乳腺超声图像输入图像特征提取模型并保存sigmoid前一层的乳腺图像特征,得到一个512维的向量。最后将影响因素量化值和乳腺图像特征拼接成一个547维向量,得到病灶融合特征;将病灶融合特征进行归一化后分别输入支持向量机(SupportVector Machines,缩写SVM)模型、自适应提升(Adaptive Boosting,缩写AdaBoost)模型和逻辑回归(Logistic Regression)模型进行有监督的分类学习,并基于参数搜索的方式对SVM模型、AdaBoost模型和Logistic Regression模型的输出结果进行集成,得到最终分类结果(良性或者恶性)。集成过程采用权重搜索的方式,具体公式如式(1)所示:
总得分=x1×SVM模型得分+x2×AdaBoost模型得分+x3×LogisticRegression模型得分 式(1);
其中,x1+x2+x3=1,0<x1,x2,x3<1,实验中采用0.05的间隔遍历0~1中的参数空间,搜索到使得预测结果最优的权重值x1,x2,x3,从而计算出最终分类结果。
SVM、AdaBoost和Logistic Regression三个模型分别采用交叉熵损失,交叉熵损失具体如式(2)所示:
其中,yi是乳腺数据的良恶性标签,良性为0,恶性为1,pi是一个病例乳腺数据经过卷积神经网络后输出的概率值,这个概率值指示乳腺数据良恶性的概率,N是一个向前传播批次里的所有训练样本。一个向前传播批次包括若干训练样本。对一个向前传播批次里的所有训练样本按照式(2)求对数平均损失,平均损失越大说明预测离真实标签差距越大,平均损失越小说明预测离真实标签差距越小,越接近真实值;最后基于损失反向传播来优化分类模型参数。由此,基于模型集成和参数搜索的方式使得模型预测结果更加准确。
本实施例在预设范围内基于参数搜索的方式进行搜索,由此不仅能够搜索到最优参数,而且使得遍历到的所有参数数量不至于太多,节省了模型训练时间。
本实施例采用训练样本数据中部分训练样本训练一个较优的CNN模型,由此可以节省模型训练时间。训练出较优的CNN模型后,为了获取所有训练样本数据的图像特征,需要将所有训练样本数据输入CNN模型并提取特定层(一般为计算交叉熵的前一层)的特征作为乳腺图像特征。最后基于每个病例对应的乳腺图像特征和影响因素量化值进行模型训练,得到病灶分类模型,由此提高了模型训练的准确性。
SVM模型能够使内积核函数代替特征向高维空间映射,减少了计算复杂度;最终的决策函数只由少数的支持向量所确定,避免了维数灾难。因此它对于解决小样本、非线性和高维的二分类问题效果很好。
AdaBoost模型能够利用弱分类器进行级联,可以将不同的分类算法作为弱分类器,且通过不断训练将弱分类器迭代为强分类器。
Logistic Regression模型是一个广泛使用的较为简单的分类器,它非常高效,不需要太大的计算量,又通俗易懂,不需要缩放输入特征,不需要任何调整,且很容易调整,并且输出校准好的预测概率。
由此,基于上述三种不同的分类模型不仅减少了模型训练的计算量,而且提高了最终模型预测的准确率。
在乳腺数据集上进行了测试,乳腺数据集共1000个病例,包含1000张乳腺超声图像和1000个影响因素量化值。按照6:1:3的比例把乳腺数据集随机划分成了训练集、验证集以及测试集。在训练时使用验证集选取参数,使用测试集测试最后训练出来模型的效果,指标选取的是平均准确率(Accuracy),敏感性(Sensitivity)特异性(Specificity),实验结果见下表:
表1各个模型的评价指标
模型 | 平均准确率 | 敏感性 | 特异性 |
CNN | 83.21 | 79.34 | 86.50 |
SVM | 63.89 | 72.13 | 80.77 |
AdaBoost | 62.54 | 70.34 | 75.33 |
Logistic Regression | 60.11 | 68.21 | 76.12 |
病灶分类模型 | 91.87 | 85.45 | 92.59 |
由此可知,本实施例得到的病灶分类模型结果跟现有方法相比具有明显的提升。
如图3所示,为本发明再一实施例针对乳腺病灶的训练方法的示意性流程图。本实施例的方法是在前述实施例的基础上进一步优化得到的。结合预测阶段对乳腺病灶的训练方法进行详细描述,该方法至少包括如下操作流程:
S301,获取待测乳腺数据;其中,待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值;
S302,利用图像特征提取模型对待测乳腺超声图像进行图像特征提取,生成待测乳腺图像特征;
S303,将待测乳腺图像特征和对应的影响因素量化值进行融合处理,得到待测病灶融合特征;
S304,利用第一分类模型对待测病灶融合特征进行预测,得到第一分类结果;利用第二分类模型对待测病灶融合特征进行预测,得到第二分类结果;利用第三分类模型对待测病灶融合特征进行预测,得到第三分类结果;
S305,对第一分类结果、第二分类结果和第三分类结果分别施加不同的权重,并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理,得到病灶分类结果。
病灶分类结果=x1×第一分类结果+x2×第二分类结果+x3×第三分类结果
由此,本实施例充分融合了乳腺图像特征与影响乳腺癌的影响因素量化值,并通过模型集成和参数搜索的方法使得预测的病灶分类结果更加准确,提高了乳腺癌病灶分类结果预测的准确性。
如图6所示,为本发明一实施例针对乳腺病灶的训练装置的示意性结构图。一种针对乳腺病灶的训练装置,该装置600包括:样本模块601,用于将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;特征融合模块602,用于针对所述训练样本数据中任一所述训练样本:对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理,得到病灶融合特征;分类训练模块603,用于对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型。
在可选的实施例中,所述分类训练模块603包括:第一分类训练单元,用于基于第一算法对所述病灶融合特征进行有监督的分类学习,生成第一分类模型;第二分类训练单元,用于基于第二算法对所述病灶融合特征进行有监督的分类学习,生成第二分类模型;第三分类训练单元,用于基于第三算法对所述病灶融合特征进行有监督的分类学习,生成第三分类模型;模型集成单元,用于基于权重搜索的方式,对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成,生成病灶分类模型。
在可选的实施例中,所述特征融合模块602包括:样本单元,用于将所述训练样本中乳腺超声图像作为子训练样本;训练单元,用于基于若干所述子训练样本,利用算法对图像特征提取进行有监督的训练,生成图像特征提取模型;特征提取单元,用于基于所述图像特征提取模型,对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征。
在可选的实施例中,所述装置还包括:获取模块,用于获取待测乳腺数据;其中,所述待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值;特征提取模块,用于利用所述图像特征提取模型对所述待测乳腺超声图像进行图像特征提取,生成待测乳腺图像特征;特征融合模块,用于将所述待测乳腺图像特征和对应的所述影响因素量化值进行融合处理,得到待测病灶融合特征;预测模块,用于利用病灶分类模型对所述待测病灶融合特征进行预测,得到病灶分类结果。
在可选的实施例中,预测模块包括:第一分类单元,用于利用第一分类模型对所述待测病灶融合特征进行预测,得到第一分类结果;第二分类单元,用于利用第二分类模型对所述待测病灶融合特征进行预测,得到第二分类结果;第三分类单元,用于利用第三分类模型对所述待测病灶融合特征进行预测,得到第三分类结果;加权单元,用于对所述第一分类结果、所述第二分类结果和所述第三分类结果分别施加不同的权重,并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理,得到病灶分类结果。
在可选的实施例中,样本模块601包括:第一数据扩充单元,用于对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第一训练样本数据;第二数据扩充单元,用于对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第二训练样本数据;样本单元,用于基于所述第一训练样本数据和所述第二训练样本数据,得到训练样本数据。
上述装置可执行本发明一实施例所提供的针对乳腺病灶的训练方法,具备执行针对乳腺病灶的训练方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的针对乳腺病灶的训练方法。
根据本发明再一实施例,还提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当该一个或多个程序被该一个或多个处理器执行,使得该一个或多个处理器实现本发明上述实施例提供的针对乳腺病灶的训练方法。
本发明实施例另一方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,使得所述处理器至少执行如下所述的操作步骤:S101,将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;S102,针对所述训练样本数据中任一所述训练样本:对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理,得到病灶融合特征;S103,对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种针对乳腺病灶的训练方法,其特征在于,包括:
将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;
针对所述训练样本数据中任一所述训练样本:对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理,得到病灶融合特征;
对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型。
2.根据权利要求1所述的方法,其特征在于,所述对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型,包括:
基于第一算法对所述病灶融合特征进行有监督的分类学习,生成第一分类模型;
基于第二算法对所述病灶融合特征进行有监督的分类学习,生成第二分类模型;
基于第三算法对所述病灶融合特征进行有监督的分类学习,生成第三分类模型;
基于权重搜索的方式,对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成,生成病灶分类模型。
3.根据权利要求1所述的方法,其特征在于,所述对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;包括:
将所述训练样本中乳腺超声图像作为子训练样本;
基于若干所述子训练样本,利用算法对图像特征提取进行有监督的训练,生成图像特征提取模型;
基于所述图像特征提取模型,对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取待测乳腺数据;其中,所述待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值;
利用所述图像特征提取模型对所述待测乳腺超声图像进行图像特征提取,生成待测乳腺图像特征;
将所述待测乳腺图像特征和对应的所述影响因素量化值进行融合处理,得到待测病灶融合特征;
利用病灶分类模型对所述待测病灶融合特征进行预测,得到病灶分类结果。
5.根据权利要求4所述的方法,其特征在于,所述利用病灶分类模型对所述待测病灶融合特征进行预测,得到病灶分类结果,包括:
利用第一分类模型对所述待测病灶融合特征进行预测,得到第一分类结果;
利用第二分类模型对所述待测病灶融合特征进行预测,得到第二分类结果;
利用第三分类模型对所述待测病灶融合特征进行预测,得到第三分类结果;
对所述第一分类结果、所述第二分类结果和所述第三分类结果分别施加不同的权重,并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理,得到病灶分类结果。
6.根据权利要求1所述的方法,其特征在于,所述将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据,包括:
对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第一训练样本数据;
对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理,得到第二训练样本数据;
基于所述第一训练样本数据和所述第二训练样本数据,得到训练样本数据。
7.一种针对乳腺病灶的训练装置,其特征在于,包括:
样本模块,用于将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本,得到训练样本数据;其中,所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值;
特征融合模块,用于针对所述训练样本数据中任一所述训练样本:对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征;将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理,得到病灶融合特征;
分类训练模块,用于对所述病灶融合特征进行有监督的分类学习,生成病灶分类模型。
8.根据权利要求7所述的装置,其特征在于,所述分类训练模块包括:
第一分类训练单元,用于基于第一算法对所述病灶融合特征进行有监督的分类学习,生成第一分类模型;
第二分类训练单元,用于基于第二算法对所述病灶融合特征进行有监督的分类学习,生成第二分类模型;
第三分类训练单元,用于基于第三算法对所述病灶融合特征进行有监督的分类学习,生成第三分类模型;
模型集成单元,用于基于权重搜索的方式,对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成,生成病灶分类模型。
9.根据权利要求7所述的装置,其特征在于,所述特征融合模块包括:
样本单元,用于将所述训练样本中乳腺超声图像作为子训练样本;
训练单元,用于基于若干所述子训练样本,利用算法对图像特征提取进行有监督的训练,生成图像特征提取模型;
特征提取单元,用于基于所述图像特征提取模型,对所述训练样本中乳腺超声图像进行图像特征提取,得到乳腺图像特征。
10.一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210156933.4A CN114581382B (zh) | 2022-02-21 | 2022-02-21 | 一种针对乳腺病灶的训练方法、装置及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210156933.4A CN114581382B (zh) | 2022-02-21 | 2022-02-21 | 一种针对乳腺病灶的训练方法、装置及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114581382A true CN114581382A (zh) | 2022-06-03 |
CN114581382B CN114581382B (zh) | 2023-02-21 |
Family
ID=81773401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210156933.4A Active CN114581382B (zh) | 2022-02-21 | 2022-02-21 | 一种针对乳腺病灶的训练方法、装置及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114581382B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114999569A (zh) * | 2022-08-03 | 2022-09-02 | 北京汉博信息技术有限公司 | 一种针对病灶基质的分型方法、装置及计算机可读介质 |
CN115240844A (zh) * | 2022-07-15 | 2022-10-25 | 北京医准智能科技有限公司 | 辅助诊断模型的训练方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106169084A (zh) * | 2016-07-08 | 2016-11-30 | 福州大学 | 一种基于高斯核参数选择的svm乳腺分类方法 |
CN111179227A (zh) * | 2019-12-16 | 2020-05-19 | 西北工业大学 | 基于辅助诊断和主观美学的乳腺超声图像质量评价方法 |
CN112734723A (zh) * | 2021-01-08 | 2021-04-30 | 温州医科大学 | 一种面向多源数据的乳腺肿瘤图像分类预测方法及装置 |
US20210224603A1 (en) * | 2020-01-17 | 2021-07-22 | Ping An Technology (Shenzhen) Co., Ltd. | Device and method for universal lesion detection in medical images |
CN113269225A (zh) * | 2021-04-08 | 2021-08-17 | 浙江大学 | 基于影像组学的非侵入式肝脏上皮样血管平滑肌脂肪瘤图像分类装置 |
CN114004806A (zh) * | 2021-10-29 | 2022-02-01 | 深圳大学 | 一种乳腺肿瘤检测模型的训练方法及乳腺肿瘤检测方法 |
-
2022
- 2022-02-21 CN CN202210156933.4A patent/CN114581382B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106169084A (zh) * | 2016-07-08 | 2016-11-30 | 福州大学 | 一种基于高斯核参数选择的svm乳腺分类方法 |
CN111179227A (zh) * | 2019-12-16 | 2020-05-19 | 西北工业大学 | 基于辅助诊断和主观美学的乳腺超声图像质量评价方法 |
US20210224603A1 (en) * | 2020-01-17 | 2021-07-22 | Ping An Technology (Shenzhen) Co., Ltd. | Device and method for universal lesion detection in medical images |
CN112734723A (zh) * | 2021-01-08 | 2021-04-30 | 温州医科大学 | 一种面向多源数据的乳腺肿瘤图像分类预测方法及装置 |
CN113269225A (zh) * | 2021-04-08 | 2021-08-17 | 浙江大学 | 基于影像组学的非侵入式肝脏上皮样血管平滑肌脂肪瘤图像分类装置 |
CN114004806A (zh) * | 2021-10-29 | 2022-02-01 | 深圳大学 | 一种乳腺肿瘤检测模型的训练方法及乳腺肿瘤检测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115240844A (zh) * | 2022-07-15 | 2022-10-25 | 北京医准智能科技有限公司 | 辅助诊断模型的训练方法、装置、电子设备及存储介质 |
CN114999569A (zh) * | 2022-08-03 | 2022-09-02 | 北京汉博信息技术有限公司 | 一种针对病灶基质的分型方法、装置及计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114581382B (zh) | 2023-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sori et al. | DFD-Net: lung cancer detection from denoised CT scan image using deep learning | |
CN109447940B (zh) | 卷积神经网络训练方法、超声图像识别定位方法及系统 | |
CN108464840B (zh) | 一种乳腺肿块自动检测方法及系统 | |
CN114581382B (zh) | 一种针对乳腺病灶的训练方法、装置及计算机可读介质 | |
CN112070119A (zh) | 超声切面图像质量控制方法、装置和计算机设备 | |
CN111768366A (zh) | 超声成像系统、bi-rads分级方法及模型训练方法 | |
CN111709446B (zh) | 基于改进的密集连接网络的x线胸片分类装置 | |
Swapnarekha et al. | Covid CT-net: A deep learning framework for COVID-19 prognosis using CT images | |
CN110459303B (zh) | 基于深度迁移的医疗影像异常检测装置 | |
Visalaxi et al. | Automated prediction of endometriosis using deep learning | |
CN116830121A (zh) | 用于髋部x射线图像中骨矿物质密度估计的半监督学习的方法、设备和存储介质 | |
Makhdoomi et al. | Machine learning techniques for medical images in PCOS | |
Antony et al. | Feature learning to automatically assess radiographic knee osteoarthritis severity | |
Kumar et al. | A Novel Approach for Breast Cancer Detection by Mammograms | |
Nagarajan et al. | Automatic Classification of Ovarian Cancer Types from CT Images Using Deep Semi-Supervised Generative Learning and Convolutional Neural Network. | |
CN110414562B (zh) | X光片的分类方法、装置、终端及存储介质 | |
Lantang et al. | Convolutional neural network for predicting the spread of cancer | |
Farea | Breast Cancer classification by adaptive weighted average ensemble of previously trained models | |
Yang et al. | Tumor detection from breast ultrasound images using mammary gland attentive u-net | |
Muthulakshmi et al. | CNN-based dermoscopic analysis of vascular skin lesions in the prognosis of skin lesion sarcoma based on ensemble learning | |
Reguieg et al. | Ultrasound breast tumoral classification by a new adaptive pre-trained convolutive neural networks for computer-aided diagnosis | |
Sumon et al. | Using Deep Learning Systems for Imaging Methods for Recognising Brain Tumors | |
Deng et al. | A Self-improving Skin Lesions Diagnosis Framework Via Pseudo-labeling and Self-distillation | |
Tumuluru et al. | Combining Multi-Features for Lung Cancer Detection in Computed Tomography Images: A Feature Fusion Model | |
Joshi et al. | Breast Cancer Detection Using Variational Mode Decomposition (VMD) and Weighted Bidirectional Extreme Learning Machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: Room 3011, 2nd Floor, Building A, No. 1092 Jiangnan Road, Nanmingshan Street, Liandu District, Lishui City, Zhejiang Province, 323000 Patentee after: Zhejiang Yizhun Intelligent Technology Co.,Ltd. Address before: No. 1202-1203, 12 / F, block a, Zhizhen building, No. 7, Zhichun Road, Haidian District, Beijing 100083 Patentee before: Beijing Yizhun Intelligent Technology Co.,Ltd. |
|
CP03 | Change of name, title or address |