CN114581382A

CN114581382A - 一种针对乳腺病灶的训练方法、装置及计算机可读介质

Info

Publication number: CN114581382A
Application number: CN202210156933.4A
Authority: CN
Inventors: 李小星; 马璐; 丁佳; 吕晨翀
Original assignee: Beijing Yizhun Medical AI Co Ltd
Current assignee: Zhejiang Yizhun Intelligent Technology Co.,Ltd.
Priority date: 2022-02-21
Filing date: 2022-02-21
Publication date: 2022-06-03
Anticipated expiration: 2042-02-21
Also published as: CN114581382B

Abstract

本发明公开了一种针对乳腺病灶的训练方法、装置及计算机可读介质，本发明一实施例的方法首先将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；其次针对训练样本数据中任一训练样本：对训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；之后将训练样本中影响因素量化值和乳腺图像特征进行融合处理，得到病灶融合特征；最后对病灶融合特征进行有监督的分类学习，生成病灶分类模型。由此，充分融合了乳腺图像特征和乳腺癌的影响因素量化值，从而提高了模型训练的准确性，使得病灶分类模型能够对乳腺病灶进行准确预测。

Description

一种针对乳腺病灶的训练方法、装置及计算机可读介质

技术领域

本发明涉及图像处理技术领域，尤其涉及一种针对乳腺病灶的训练方法、装置及计算机可读介质。

背景技术

乳腺癌是最常见的癌症类型之一，对全世界所有年龄段女性的生活都有负面影响。据报道，美国女性在某个时间患乳腺癌的几率为13％；到2021年，美国可能将有43,600人死于乳腺癌；而且乳腺癌有极大的可能会影响男性。预计到2021年，将诊断出约2,650例新的男性浸润性乳腺癌病例。男性一生中患乳腺癌的几率约为833分之一。根据世界卫生组织的数据。引发乳腺癌的风险因素包括高龄、肥胖、重饮酒、乳腺癌家族史、辐射暴露史、生育史、吸烟和绝经后激素治疗等。

在当今世界，识别乳腺癌的方法主要是基于乳房超声检查以确定一个人是否患有乳腺肿瘤。乳腺肿瘤分为两种类型：恶性和良性。恶性肿瘤和良性肿瘤在形式和质地方面具有不同的形态。因此，医生通常可以通过分析肿瘤的外观来确定乳腺癌的种类或存在。但是如果仅依靠乳腺超声图像来判断良恶性略显不可靠，且对于年资较低的医生来说，是一件非常有挑战的事情。

近几年随着AI技术的发展，涌现出许多非常成熟的机器学习分类模型，且有较多已用在乳腺癌的判断上。然而现有模型通常仅针对图像数据进行反复学习训练，没有充分利用其他信息进行模型训练，例如影响乳腺癌的高危因素等，这对于临床应用来说数据略显单一，极大地影响了乳腺癌的准确判断。

发明内容

为了解决上述现有技术存在的问题，本发明实施例提供一种针对乳腺病灶的训练方法、装置及计算机可读介质，能够基于乳腺图像特征和乳腺癌的影响因素量化值进行模型训练，从而提高了模型的准确性，进而使得模型能够对乳腺病灶进行准确预测。

为实现上述目的，根据本发明实施例第一方面，提供一种针对乳腺病灶的训练方法，所述方法包括：将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；针对所述训练样本数据中任一所述训练样本：对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理，得到病灶融合特征；对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型。

可选的，所述对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型，包括：基于第一算法对所述病灶融合特征进行有监督的分类学习，生成第一分类模型；基于第二算法对所述病灶融合特征进行有监督的分类学习，生成第二分类模型；基于第三算法对所述病灶融合特征进行有监督的分类学习，生成第三分类模型；基于权重搜索的方式，对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成，生成病灶分类模型。

可选的，所述对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；包括：将所述训练样本中乳腺超声图像作为子训练样本；基于若干所述子训练样本，利用算法对图像特征提取进行有监督的训练，生成图像特征提取模型；基于所述图像特征提取模型，对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征。

可选的，所述的方法还包括：获取待测乳腺数据；其中，所述待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值；利用所述图像特征提取模型对所述待测乳腺超声图像进行图像特征提取，生成待测乳腺图像特征；将所述待测乳腺图像特征和对应的所述影响因素量化值进行融合处理，得到待测病灶融合特征；利用病灶分类模型对所述待测病灶融合特征进行预测，得到病灶分类结果。

可选的，所述利用病灶分类模型对所述待测病灶融合特征进行预测，得到病灶分类结果，包括：利用第一分类模型对所述待测病灶融合特征进行预测，得到第一分类结果；利用第二分类模型对所述待测病灶融合特征进行预测，得到第二分类结果；利用第三分类模型对所述待测病灶融合特征进行预测，得到第三分类结果；对所述第一分类结果、所述第二分类结果和所述第三分类结果分别施加不同的权重，并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理，得到病灶分类结果。

可选的，所述将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据，包括：对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第一训练样本数据；对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第二训练样本数据；基于所述第一训练样本数据和所述第二训练样本数据，得到训练样本数据。

为实现上述目的，根据本发明实施例第二方面提供一种针对乳腺病灶的训练装置，所述装置包括：样本模块，用于将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；特征融合模块，用于针对所述训练样本数据中任一所述训练样本：对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理，得到病灶融合特征；分类训练模块，用于对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型。

可选的，所述分类训练模块包括：第一分类训练单元，用于基于第一算法对所述病灶融合特征进行有监督的分类学习，生成第一分类模型；第二分类训练单元，用于基于第二算法对所述病灶融合特征进行有监督的分类学习，生成第二分类模型；第三分类训练单元，用于基于第三算法对所述病灶融合特征进行有监督的分类学习，生成第三分类模型；模型集成单元，用于基于权重搜索的方式，对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成，生成病灶分类模型。

可选的，所述特征融合模块包括：样本单元，用于将所述训练样本中乳腺超声图像作为子训练样本；训练单元，用于基于若干所述子训练样本，利用算法对图像特征提取进行有监督的训练，生成图像特征提取模型；特征提取单元，用于基于所述图像特征提取模型，对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征。

为实现上述目的，根据本发明实施例第三方面提供一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现如第一方面所述的方法。

与现有技术相比，本发明实施例提供一种针对乳腺病灶的训练方法，首先将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；其次，针对训练样本数据中任一训练样本：对训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；之后，将训练样本中影响因素量化值和乳腺图像特征进行融合处理，得到病灶融合特征；最后，对病灶融合特征进行有监督的分类学习，生成病灶分类模型。由此，采用多样化的训练数据，充分融合了乳腺图像特征和乳腺癌的影响因素量化值，从而提高了模型训练的准确性，进而使得模型预测与临床诊断预测乳腺癌思想相一致，具有一定的可解释性。

理解的是，本发明的教导并不需要实现上面所述的全部有益效果，而是特定的技术方案可以实现特定的技术效果，并且本发明的其他实施方式还能够实现上面未提到的有益效果。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中在附图中，相同或对应的标号表示相同或对应的部分。

图1为本发明一实施例针对乳腺病灶的训练方法的示意性流程图；

图2为本发明另一实施例针对乳腺病灶的训练方法的示意性流程图；

图3为本发明再一实施例针对乳腺病灶的训练方法的示意性流程图；

图4为本发明一实施例中乳腺癌影响因素量化值的表格示意图；

图5为本发明另一实施例针对乳腺病灶的训练方法的过程示意图；

图6为本发明一实施例针对乳腺病灶的训练装置的示意性结构图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

如图1所示，本发明一实施例针对乳腺病灶的训练方法的示意性流程图。如图4所示，本发明一实施例中乳腺癌影响因素量化值的表格示意图。一种针对乳腺病灶的训练方法，至少包括如下操作流程：

S101，将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；

S102，针对训练样本数据中任一训练样本：对训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将训练样本中影响因素量化值和乳腺图像特征进行融合处理，得到病灶融合特征；

S103，对病灶融合特征进行有监督的分类学习，生成病灶分类模型。

在S101中，良性标签是指不具有乳腺癌的标签；恶性标签是指具有乳腺癌的标签。对应病例的影响因素用于指示与乳腺癌患病风险高度相关的因素，即乳腺癌高危因素。影响因素包括：年龄、受教育程度、工作时间、生活压力、吸烟史(每天吸一支以上并连续或累计6个月以上者定义为吸烟)、二手烟暴露史、体育锻炼、绝闭经、分娩史(包括自然分娩和剖腹产)、哺乳史、良性乳腺疾病史(乳腺增生、结节、导管扩张、良性纤维腺瘤、感染等)、血缘亲属乳腺癌史、血缘亲属卵巢癌史、口服避孕药、暴露于治疗电离辐射等。除了年龄对应的量化指标本身就是量化值，其他影响因素对应的量化指标全部采用one-hot编码的形式进行量化。由此，通过对影响乳腺癌病因的高危因素进行统计量化，从而有利于模型训练，提高了病灶分类模型预测的准确性。

对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第一训练样本数据；对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第二训练样本数据；基于第一训练样本数据和第二训练样本数据，得到训练样本数据。在这里，数据扩充处理包括对乳腺超声图像进行旋转或者亮度调整，例如对乳腺超声图像进行45°、90°、135°、180°、225°、和270°的旋转，或者对乳腺超声图像进行系数0.5或者1.3倍的亮度调整，最终得到224*224尺寸的第一训练样本数据和第二训练样本数据。

在S102中，可以基于已训练好的图像特征提取模型对训练样本中乳腺超声图像进行图像特征提取，也可以是基于神经网络算法对训练样本中乳腺超声图像进行图像特征提取。将乳腺图像特征和影响因素量化值拼接成一个547维向量，得到病灶融合特征。

在S103中，利用SVM模型，和/或AdaBoost模型，和/或Logistic Regression模型分别对病灶融合特征进行有监督的分类学习，生成病灶分类模型。

本发明实施例通过将具有良恶性标签的乳腺数据作为训练样本，并对训练样本中乳腺超声图像进行图像特征提取，之后将提取的乳腺图像特征和影响因素量化值进行融合处理，从而得到病灶融合特征；最后基于病灶融合特征进行有监督的分类学习，生成病灶分类模型。由此，基于乳腺图像特征和影响因素量化值进行模型训练，从而使得病灶分类模型的预测更加符合临床诊断预测乳腺癌思想，提高了病灶分类模型对乳腺癌预测的准确性。

如图2所示，本发明另一实施例针对乳腺病灶的训练方法的示意性流程图；如图5所示，本发明另一实施例针对乳腺病灶的训练方法的过程示意图。本实施例的方法是在前述实施例的基础上进一步优化得到的。一种针对乳腺病灶的训练方法，至少包括如下操作流程：

S201，将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；

S202，针对训练样本数据中任一训练样本：将训练样本中乳腺超声图像作为子训练样本；基于若干子训练样本，利用算法对图像特征提取进行有监督的训练，生成图像特征提取模型；基于图像特征提取模型，对训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将训练样本中影响因素量化值和乳腺图像特征进行融合处理，得到病灶融合特征；

S203，基于第一算法对病灶融合特征进行有监督的分类学习，生成第一分类模型；基于第二算法对病灶融合特征进行有监督的分类学习，生成第二分类模型；基于第三算法对病灶融合特征进行有监督的分类学习，生成第三分类模型；

S204，基于权重搜索的方式，对第一分类模型、第二分类模型和第三分类模型进行集成，生成病灶分类模型。

具体地，每个病例的乳腺数据包括一张乳腺超声图像和对应病例的影响因素量化值。乳腺数据被标记乳腺癌良性标签或者乳腺癌恶性标签。构建基于卷积神经网络框架Pytorch的模型结构，通过在Pytorch中使用连接层直接实本发明网络模型。

首先，将训练样本中乳腺超声图像作为子训练样本；其次，基于若干子训练样本，利用CNN模型对每个子训练样本中图像特征提取进行有监督的训练，生成图像特征提取模型；之后，将训练样本中乳腺超声图像输入图像特征提取模型并保存sigmoid前一层的乳腺图像特征，得到一个512维的向量。最后将影响因素量化值和乳腺图像特征拼接成一个547维向量，得到病灶融合特征；将病灶融合特征进行归一化后分别输入支持向量机(SupportVector Machines，缩写SVM)模型、自适应提升(Adaptive Boosting，缩写AdaBoost)模型和逻辑回归(Logistic Regression)模型进行有监督的分类学习，并基于参数搜索的方式对SVM模型、AdaBoost模型和Logistic Regression模型的输出结果进行集成，得到最终分类结果(良性或者恶性)。集成过程采用权重搜索的方式，具体公式如式(1)所示：

总得分＝x₁×SVM模型得分+x₂×AdaBoost模型得分+x₃×LogisticRegression模型得分式(1)；

其中，x₁+x₂+x₃＝1，0<x₁，x₂，x₃<1，实验中采用0.05的间隔遍历0～1中的参数空间，搜索到使得预测结果最优的权重值x₁，x₂，x₃，从而计算出最终分类结果。

SVM、AdaBoost和Logistic Regression三个模型分别采用交叉熵损失，交叉熵损失具体如式(2)所示：

其中，y_i是乳腺数据的良恶性标签，良性为0，恶性为1，p_i是一个病例乳腺数据经过卷积神经网络后输出的概率值，这个概率值指示乳腺数据良恶性的概率，N是一个向前传播批次里的所有训练样本。一个向前传播批次包括若干训练样本。对一个向前传播批次里的所有训练样本按照式(2)求对数平均损失，平均损失越大说明预测离真实标签差距越大，平均损失越小说明预测离真实标签差距越小，越接近真实值；最后基于损失反向传播来优化分类模型参数。由此，基于模型集成和参数搜索的方式使得模型预测结果更加准确。

本实施例在预设范围内基于参数搜索的方式进行搜索，由此不仅能够搜索到最优参数，而且使得遍历到的所有参数数量不至于太多，节省了模型训练时间。

本实施例采用训练样本数据中部分训练样本训练一个较优的CNN模型，由此可以节省模型训练时间。训练出较优的CNN模型后，为了获取所有训练样本数据的图像特征，需要将所有训练样本数据输入CNN模型并提取特定层(一般为计算交叉熵的前一层)的特征作为乳腺图像特征。最后基于每个病例对应的乳腺图像特征和影响因素量化值进行模型训练，得到病灶分类模型，由此提高了模型训练的准确性。

SVM模型能够使内积核函数代替特征向高维空间映射，减少了计算复杂度；最终的决策函数只由少数的支持向量所确定，避免了维数灾难。因此它对于解决小样本、非线性和高维的二分类问题效果很好。

AdaBoost模型能够利用弱分类器进行级联，可以将不同的分类算法作为弱分类器，且通过不断训练将弱分类器迭代为强分类器。

Logistic Regression模型是一个广泛使用的较为简单的分类器，它非常高效，不需要太大的计算量，又通俗易懂，不需要缩放输入特征，不需要任何调整，且很容易调整，并且输出校准好的预测概率。

由此，基于上述三种不同的分类模型不仅减少了模型训练的计算量，而且提高了最终模型预测的准确率。

在乳腺数据集上进行了测试，乳腺数据集共1000个病例，包含1000张乳腺超声图像和1000个影响因素量化值。按照6:1:3的比例把乳腺数据集随机划分成了训练集、验证集以及测试集。在训练时使用验证集选取参数，使用测试集测试最后训练出来模型的效果，指标选取的是平均准确率(Accuracy)，敏感性(Sensitivity)特异性(Specificity)，实验结果见下表：

表1各个模型的评价指标

模型	平均准确率	敏感性	特异性
				CNN	83.21	79.34	86.50
SVM	63.89	72.13	80.77
				AdaBoost	62.54	70.34	75.33
Logistic Regression	60.11	68.21	76.12
				病灶分类模型	91.87	85.45	92.59

由此可知，本实施例得到的病灶分类模型结果跟现有方法相比具有明显的提升。

如图3所示，为本发明再一实施例针对乳腺病灶的训练方法的示意性流程图。本实施例的方法是在前述实施例的基础上进一步优化得到的。结合预测阶段对乳腺病灶的训练方法进行详细描述，该方法至少包括如下操作流程：

S301，获取待测乳腺数据；其中，待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值；

S302，利用图像特征提取模型对待测乳腺超声图像进行图像特征提取，生成待测乳腺图像特征；

S303，将待测乳腺图像特征和对应的影响因素量化值进行融合处理，得到待测病灶融合特征；

S304，利用第一分类模型对待测病灶融合特征进行预测，得到第一分类结果；利用第二分类模型对待测病灶融合特征进行预测，得到第二分类结果；利用第三分类模型对待测病灶融合特征进行预测，得到第三分类结果；

S305，对第一分类结果、第二分类结果和第三分类结果分别施加不同的权重，并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理，得到病灶分类结果。

病灶分类结果＝x₁×第一分类结果+x₂×第二分类结果+x₃×第三分类结果

由此，本实施例充分融合了乳腺图像特征与影响乳腺癌的影响因素量化值，并通过模型集成和参数搜索的方法使得预测的病灶分类结果更加准确，提高了乳腺癌病灶分类结果预测的准确性。

如图6所示，为本发明一实施例针对乳腺病灶的训练装置的示意性结构图。一种针对乳腺病灶的训练装置，该装置600包括：样本模块601，用于将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；特征融合模块602，用于针对所述训练样本数据中任一所述训练样本：对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理，得到病灶融合特征；分类训练模块603，用于对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型。

在可选的实施例中，所述分类训练模块603包括：第一分类训练单元，用于基于第一算法对所述病灶融合特征进行有监督的分类学习，生成第一分类模型；第二分类训练单元，用于基于第二算法对所述病灶融合特征进行有监督的分类学习，生成第二分类模型；第三分类训练单元，用于基于第三算法对所述病灶融合特征进行有监督的分类学习，生成第三分类模型；模型集成单元，用于基于权重搜索的方式，对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成，生成病灶分类模型。

在可选的实施例中，所述特征融合模块602包括：样本单元，用于将所述训练样本中乳腺超声图像作为子训练样本；训练单元，用于基于若干所述子训练样本，利用算法对图像特征提取进行有监督的训练，生成图像特征提取模型；特征提取单元，用于基于所述图像特征提取模型，对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征。

在可选的实施例中，所述装置还包括：获取模块，用于获取待测乳腺数据；其中，所述待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值；特征提取模块，用于利用所述图像特征提取模型对所述待测乳腺超声图像进行图像特征提取，生成待测乳腺图像特征；特征融合模块，用于将所述待测乳腺图像特征和对应的所述影响因素量化值进行融合处理，得到待测病灶融合特征；预测模块，用于利用病灶分类模型对所述待测病灶融合特征进行预测，得到病灶分类结果。

在可选的实施例中，预测模块包括：第一分类单元，用于利用第一分类模型对所述待测病灶融合特征进行预测，得到第一分类结果；第二分类单元，用于利用第二分类模型对所述待测病灶融合特征进行预测，得到第二分类结果；第三分类单元，用于利用第三分类模型对所述待测病灶融合特征进行预测，得到第三分类结果；加权单元，用于对所述第一分类结果、所述第二分类结果和所述第三分类结果分别施加不同的权重，并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理，得到病灶分类结果。

在可选的实施例中，样本模块601包括：第一数据扩充单元，用于对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第一训练样本数据；第二数据扩充单元，用于对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第二训练样本数据；样本单元，用于基于所述第一训练样本数据和所述第二训练样本数据，得到训练样本数据。

上述装置可执行本发明一实施例所提供的针对乳腺病灶的训练方法，具备执行针对乳腺病灶的训练方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例所提供的针对乳腺病灶的训练方法。

根据本发明再一实施例，还提供了一种电子设备，该电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当该一个或多个程序被该一个或多个处理器执行，使得该一个或多个处理器实现本发明上述实施例提供的针对乳腺病灶的训练方法。

本发明实施例另一方面提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时，使得所述处理器至少执行如下所述的操作步骤：S101，将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；S102，针对所述训练样本数据中任一所述训练样本：对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理，得到病灶融合特征；S103，对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种针对乳腺病灶的训练方法，其特征在于，包括：

将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；

针对所述训练样本数据中任一所述训练样本：对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理，得到病灶融合特征；

对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型。

2.根据权利要求1所述的方法，其特征在于，所述对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型，包括：

基于第一算法对所述病灶融合特征进行有监督的分类学习，生成第一分类模型；

基于第二算法对所述病灶融合特征进行有监督的分类学习，生成第二分类模型；

基于第三算法对所述病灶融合特征进行有监督的分类学习，生成第三分类模型；

基于权重搜索的方式，对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成，生成病灶分类模型。

3.根据权利要求1所述的方法，其特征在于，所述对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；包括：

将所述训练样本中乳腺超声图像作为子训练样本；

基于若干所述子训练样本，利用算法对图像特征提取进行有监督的训练，生成图像特征提取模型；

基于所述图像特征提取模型，对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征。

4.根据权利要求1所述的方法，其特征在于，还包括：

获取待测乳腺数据；其中，所述待测乳腺数据包括待测乳腺超声图像和对应病例的影响因素量化值；

利用所述图像特征提取模型对所述待测乳腺超声图像进行图像特征提取，生成待测乳腺图像特征；

将所述待测乳腺图像特征和对应的所述影响因素量化值进行融合处理，得到待测病灶融合特征；

利用病灶分类模型对所述待测病灶融合特征进行预测，得到病灶分类结果。

5.根据权利要求4所述的方法，其特征在于，所述利用病灶分类模型对所述待测病灶融合特征进行预测，得到病灶分类结果，包括：

利用第一分类模型对所述待测病灶融合特征进行预测，得到第一分类结果；

利用第二分类模型对所述待测病灶融合特征进行预测，得到第二分类结果；

利用第三分类模型对所述待测病灶融合特征进行预测，得到第三分类结果；

对所述第一分类结果、所述第二分类结果和所述第三分类结果分别施加不同的权重，并将施加权重后的第一分类结果、第二分类结果和第三分类结果进行加权处理，得到病灶分类结果。

6.根据权利要求1所述的方法，其特征在于，所述将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据，包括：

对具有恶性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第一训练样本数据；

对具有良性标签的乳腺数据中乳腺超声图像进行数据扩充处理，得到第二训练样本数据；

基于所述第一训练样本数据和所述第二训练样本数据，得到训练样本数据。

7.一种针对乳腺病灶的训练装置，其特征在于，包括：

样本模块，用于将具有恶性标签的乳腺数据和具有良性标签的乳腺数据均作为训练样本，得到训练样本数据；其中，所述乳腺数据至少包括乳腺超声图像和对应病例的影响因素量化值；

特征融合模块，用于针对所述训练样本数据中任一所述训练样本：对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征；将所述训练样本中影响因素量化值和所述乳腺图像特征进行融合处理，得到病灶融合特征；

分类训练模块，用于对所述病灶融合特征进行有监督的分类学习，生成病灶分类模型。

8.根据权利要求7所述的装置，其特征在于，所述分类训练模块包括：

第一分类训练单元，用于基于第一算法对所述病灶融合特征进行有监督的分类学习，生成第一分类模型；

第二分类训练单元，用于基于第二算法对所述病灶融合特征进行有监督的分类学习，生成第二分类模型；

第三分类训练单元，用于基于第三算法对所述病灶融合特征进行有监督的分类学习，生成第三分类模型；

模型集成单元，用于基于权重搜索的方式，对所述第一分类模型、所述第二分类模型和所述第三分类模型进行集成，生成病灶分类模型。

9.根据权利要求7所述的装置，其特征在于，所述特征融合模块包括：

样本单元，用于将所述训练样本中乳腺超声图像作为子训练样本；

训练单元，用于基于若干所述子训练样本，利用算法对图像特征提取进行有监督的训练，生成图像特征提取模型；

特征提取单元，用于基于所述图像特征提取模型，对所述训练样本中乳腺超声图像进行图像特征提取，得到乳腺图像特征。

10.一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现如权利要求1-6中任一项所述的方法。