CN112257805B

CN112257805B - 一种数据扩充方法

Info

Publication number: CN112257805B
Application number: CN202011194005.4A
Authority: CN
Inventors: 李宏; 孙航; 鲍楠; 马贺; 李晶; 曾庆超; 张春玲; 蒋明宽; 周石
Original assignee: 东北大学
Priority date: 2020-10-30
Filing date: 2020-10-30
Publication date: 2023-06-27
Anticipated expiration: 2040-10-30
Also published as: CN112257805A

Abstract

本发明涉及一种数据扩充方法，包括如下步骤：S1、获取原始图像数据，并给出其标签图像数据；S2、分别将原始图像数据和标签图像数据进行镜像扩充，分别获得n倍原始图像镜像数据集和n倍标签图像镜像数据集；S3、将获得的n倍原始图像镜像数据集和n倍标签图像镜像数据集送入深度学习得到扩充n倍数据的肿瘤分割结果；S4、将扩充n倍数据的肿瘤分割结果进行数据重建得到原始图像对应的图像分割结果。本发明提供的数据扩充方法不仅提高了基于深度学习的肿瘤分割的准确性，而且扩充的数据完全是来源于真实的医学影像数据，保证图像像素之间的空间位置关系不变。

Description

一种数据扩充方法

技术领域

本发明属于影像数据分割技术领域，尤其涉及一种数据扩充方法。

背景技术

生成对抗网络(Generative Adversarial Networks,GANs)是由Goodfellow等人在2014年提出的一种无监督学习方法^[1]。它有两个网络分支结构，分别是生成网络和判别网络，两个分支不断对抗来更新参数提升性能，可以生成人工样本来达到数据扩充的目的，尤其是处理各分类样本数目不平衡的图像数据时效果显著。例如，Wang等人利用GANs提升了ImageNet数据集的识别准确率，其中对狗和金鱼的分类准确率由0.855提升到了0.915，但其他类别的准确率相比传统方法提升不大^[2]；Shrivastava等人在MPIIGaze数据集上，使用GANs对已有的人工样本进行再优化，将眼球角度预测错误率降至7.8％，将手势识别任务的准确率提高到了83.3％^[3]；Lucic等人对原始GANs和众多GANs的衍生模型在统一标准下进行了评价，实验结果是原始GANs相比于当前多数衍生模型拥有更优秀的数据生成能力^[4]。虽然GANs在许多任务中取得了成效，但是由其生成的医学影像数据的可信度存在质疑，在医学图像中，强度通常与某些含义相关联，例如，可以基于CT数据的HU值粗略地对组织类型进行分类，而GANs中并没有这种关联和映射。此外，GANs生成的数据的训练不稳定问题很难处理。

发明内容

(一)要解决的技术问题

为了解决现有技术的上述问题，本发明提供一种数据扩充方法。

(二)技术方案

为了达到上述目的，本发明采用的主要技术方案包括：

一种数据扩充方法，包括如下步骤：

S1、获取原始图像数据，并给出其标签图像数据；

S2、分别将原始图像数据和标签图像数据进行镜像扩充，分别获得n倍原始图像镜像数据集和n倍标签图像镜像数据集；

S3、将获得的n倍原始图像镜像数据和n倍标签图像镜像数据送入深度学习得到扩充n倍数据的图像分割结果；

S4、将扩充n倍数据的图像分割结果进行数据重建得到原始图像对应的图像分割结果。

优选地，所述步骤S2中将原始图像数据进行镜像扩充包括：

找出原始图像数据的切割中心，沿切割中心以角度平均分成n份，然后将每份镜像填充至整张图像，得到n倍的原始图像镜像数据集；

所述原始图像数据为原始肿瘤图像数据。

优选地，所述步骤S2中将标签图像数据进行镜像扩充包括：

找出标签图像数据的切割中心，沿切割中心以角度平均分成n份，然后将每份镜像填充至整张图像，得到n倍的标签图像镜像数据集。

优选地，所述步骤S3还包括：

将镜像扩充后的n倍原始图像镜像数据划分为训练集和测试集；

将训练集及其对应的标签图像镜像数据送入深度学习网络进行训练，获得分割模型；

借助训练获得的分割模型对测试集进行分割，得到扩充n倍数据后的图像分割结果。

优选地，所述步骤S4还包括：

首先，将深度学习得到肿瘤分割图像的边界像素点镜像回到原始图像所在位置，则镜像后每个位置有n条边界，然后将所有边界坐标拟合成一条封闭曲线，最后将拟合好的曲线映射回到原始图像。

优选地，所述步骤S4还包括：

提取经过深度学习得到的肿瘤分割图像数据中肿瘤图像的边界坐标和中心点；

将边界坐标以中心点为中心分为n份，并平移到坐标原点；

分割的边界做镜像扩充的逆过程；

将所有边界坐标拟合成一条封闭曲线；

将拟合好的曲线映射回到原始图像，得到原图像对应的图像分割结果。

优选地，所述n为4。

(三)有益效果

本发明的有益效果是：本发明提供的一种数据扩充方法，具有以下有益效果：提高了基于深度学习的肿瘤分割的准确性。扩充的数据完全是来源于真实的医学影像数据，保证图像像素之间的空间位置关系不变。

附图说明

图1为本发明提供的一种数据扩充方法的实施例中图像均分4份的示意图；

图2为本发明提供的一种数据扩充方法的实施例中原图像扩充示意图(①指左右镜像，②指上下镜像)；

图3为本发明提供的一种数据扩充方法的实施例中标签均分4份示意图；

图4为本发明提供的一种数据扩充方法的实施例中标签图像扩充示意图(①指左右镜像，②指上下镜像)；

图5为本发明提供的一种数据扩充方法的实施例中原图像数据扩充后肿瘤分割结果；

图6为本发明提供的一种数据扩充方法的实施例中深度学习结果中肿瘤的边界和中心；

图7为本发明提供的一种数据扩充方法的实施例中边界分割示意图；

图8为本发明提供的一种数据扩充方法的实施例中边界还原示意图；

图9a为本发明提供的一种数据扩充方法的实施例中极坐标系下的数据点(蓝色)和拟合曲线(红色)；

图9b为本发明提供的一种数据扩充方法的实施例中极坐标系下的数据点(蓝色)和拟合曲线(红色)；

图10为本发明提供的一种数据扩充方法的实施例中直角坐标系下的数据点(蓝色)和拟合曲线(红色)；

图11为本发明提供的一种数据扩充方法的实施例中原图像对应的肿瘤分割结果。

具体实施方式

为了更好的解释本发明，以便于理解，下面结合附图，通过具体实施方式，对本发明作详细描述。

如图1-图11所示：本实施例中公开了一种数据扩充方法，包括如下步骤：

S1、获取原始图像数据，并给出其标签图像数据；

S3、将获得的n倍原始图像镜像数据集和n倍标签图像镜像数据集送入深度学习得到扩充n倍数据的图像分割结果；

本实施例中所述的步骤S2中将原始图像数据进行镜像扩充包括：

所述原始图像数据为原始肿瘤图像数据。

本实施例中所述步骤S2中将标签图像数据进行镜像扩充包括：

本实施例中所述步骤S3还包括：

将镜像扩充后的n倍原始图像镜像数据集划分为训练集和测试集；

将训练集及其对应的标签图像镜像数据集送入深度学习网络进行训练，获得分割模型；

本实施例中所述步骤S4还包括：

将边界坐标以中心点为中心分为n份，并平移到坐标原点；

分割的边界做镜像扩充的逆过程；

将所有边界坐标拟合成一条封闭曲线；

本实施例中所述n为4。

具体地，本实施例中提供的数据扩充方法为将原始图像镜像扩充为4份。找出原始图像切割中心(肿瘤中心)，沿中心以角度平均分成4份，然后将每份镜像填充至整张图像，得到4倍的图像数据集，具体步骤如下：

(1)原图像切割中心点如图1中红线交点所示，以图1中红线交点为切割点，将图像分割为4份，从右下角顺时针分别记4份分割后的图像为F1，F2，F3，F4。

(2)将F1，F2，F3，F4分别依次进行左右镜像和上下镜像，得到扩充后的图像如图2所示。

将标签镜像扩充为4份。

标签处理的步骤与原始图像处理的步骤一致，并且两者的切割中心相同。首先找出标签切割中心，沿中心以角度平均分成4份，然后将每份镜像填充至整张图像，得到4倍的标签数据集，具体步骤如下：

以图3中红线交点为切割点，将标签分割为4份。

(2)将分割为4份的标签图像依次进行左右镜像和上下镜像，得到扩充后的标签，如图4所示。

将原始图像和标签扩充后的数据送入深度学习得到扩充数据的肿瘤分割结果。

将扩充后的图像经过深度学习得到模型，应用该模型对测试集处理得到如图5所示的结果，其中(a)、(b)、(c)、(d)分别为深度学习模型对某例原始图像数据扩充后得到的肿瘤分割结果。

将扩充数据的肿瘤分割结果进行数据重建得到原图像对应的肿瘤分割结果。

首先，将深度学习得到肿瘤分割图像的边界像素点镜像回到原始图像所在位置，则镜像后每个位置有4条边界，然后将所有边界坐标拟合成一条封闭曲线，最后将拟合好的曲线映射回到原始图像，具体步骤如下：

(1)提取图5中的数据扩充后肿瘤分割结果中肿瘤的边界和中心，如图6所示。

(2)将边界坐标点以中心点分为4份，并平移到坐标原点，如图7所示。

(3)对图7中分割的边界做镜像扩充的逆过程，其中蓝色、红色、绿色、黄色边界分别镜像至图1中F1、F2、F3、F4所在位置，如图8所示。

(4)将所有边界坐标拟合成一条封闭曲线。

将边界坐标从直角坐标系转换到极坐标系，得到一组角度在[0°，360°]的数据，如图9(b)中蓝色的数据点；为了使最终拟合结果得到一组闭合曲线且提高拟合效果，将其延展为3个周期的数据，如图9(a)中蓝色的数据点；对图9(a)中蓝色数据拟合得到红色拟合曲线，截取[0°，360°]的数据，得到极坐标下边界拟合曲线，如图9(b)中红色曲线。将9(b)中的拟合曲线转换到直角坐标系下，得到最终的拟合曲线，如图10中红色曲线。

如图11所示，将拟合好的曲线映射回到原始图像。

以上结合具体实施例描述了本发明的技术原理，这些描述只是为了解释本发明的原理，不能以任何方式解释为对本发明保护范围的限制。基于此处解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式，这些方式都将落入本发明的保护范围之内。

Claims

1.一种数据扩充方法，其特征在于，包括如下步骤：

S1、获取原始图像数据，并给出其标签图像数据；

S4、将扩充n倍数据的图像分割结果进行数据重建得到原始图像对应的图像分割结果；

所述步骤S2中将原始图像数据进行镜像扩充包括：

所述原始图像数据为原始肿瘤图像数据；

所述步骤S2中将标签图像数据进行镜像扩充包括：

找出标签图像数据的切割中心，沿切割中心以角度平均分成n份，然后将每份镜像填充至整张图像，得到n倍的标签图像镜像数据集；

所述步骤S4还包括：

2.根据权利要求1述的数据扩充方法，其特征在于，所述步骤S3还包括：

3.根据权利要求1所述的数据扩充方法，其特征在于，所述步骤S4还包括：

将边界坐标以中心点为中心分为n份，并平移到坐标原点；

分割的边界做镜像扩充的逆过程；

将所有边界坐标拟合成一条封闭曲线；

4.根据权利要求1-3任一项所述的数据扩充方法，其特征在于，

所述n为4。