CN111723840A

CN111723840A - 一种用于超声影像的聚类和风格迁移的方法

Info

Publication number: CN111723840A
Application number: CN202010382003.1A
Authority: CN
Inventors: 高洁; 申嘉男; 喻梅; 于瑞国; 李雪威; 刘志强; 贾天豪
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2020-05-08
Filing date: 2020-05-08
Publication date: 2020-09-29

Abstract

本发明公开了一种用于超声影像的聚类和风格迁移的方法，包含以下步骤：步骤一：数据预处理，将超声影像转换为数据向量；步骤二：使用三种聚类算法：K‑means聚类算法、凝聚层次聚类算法和谱聚类算法进行对比实验，选择最优算法；步骤三：根据聚类实验结果，选择风格差异较大的图像；步骤四：基于CycleGAN对网络结构以及损失函数进行设计；步骤五：针对良恶性数据集设计风格迁移实验，并对实验结果进行分析。本发明设计的聚类和风格迁移的算法均有效地避免了噪声对于实验结果的影响，表现出了所使用方法对于噪声图像数据的适应性。

Description

一种用于超声影像的聚类和风格迁移的方法

技术领域

本发明属于机器学习和图像风格迁移技术领域，涉及图像的聚类和风格迁移算法，尤其涉及一种用于超声影像的聚类和风格迁移的方法。

背景技术

聚类是指将一组对象分成由这些对象组成的多个类的过程，与分类不同，聚类在划分类别时不是根据已知的信息将对象划分成不同的类别，而是划分成未知特征的类。基于层次的聚类方法的核心思想是把数据对象构建成一棵树，除了叶子节点外的每个节点都是由其子树的并集构成，根节点包含所有的数据对象。层次分解的过程一般分为两类：凝聚法，即从叶子节点开始每次合并距离最近的两个节点，直到节点中包含所有的数据对象为止；分裂法，即先将所有的数据对象看作一个类，用一个节点表示所有的数据对象，通过迭代每次对节点进行分割，直至每个节点都只包含一个数据对象为止。

风格迁移是指将一种特殊风格的图像转换成另一种风格的过程，如将白天的景色转换成夜晚的景色。

生成式对抗网络(Generative Adversarial Networks,GAN)是一种深度学习的模型。该模型由一个生成模型(Generative Model)G和一个判别模型(DiscriminativeModel)D构成，通过两者之间相互地博弈来达到良好的输出结果。G的主要功能是通过一系列的输入数据，来生成不在原数据集中的新数据G(X)；D的主要功能是判别G(X)是否是可以符合原数据集特征的真实数据，输出D(X)代表数据为真实数据的概率，1代表100％是真实的数据，0代表不可能是真实的数据。通过对两个模型的训练，理想状态下G能够生产以假乱真的数据G(Z)，D难以判别G(Z)是否为真实的数据，即D(G(Z))＝0.5。

基于上述，本申请提供了一种用于超声影像的聚类和风格迁移的方法。

发明内容

本发明的目的在于提供一种用于超声影像的聚类和风格迁移的方法，它可以对不同风格的超声影像进行聚类，以减少风格迁移的图像种类。同时能够在现有超声影像数据集的内容存在难以获得成对数据困难的基础上解决风格迁移的问题。通过统一不同风格的影像之间风格，从而提高智能医疗辅助系统的鲁棒性。

为实现本发明的目的，本发明提供的一种用于超声影像的聚类和风格迁移的方法，包含以下步骤：

步骤一：数据预处理，将超声影像转换为数据向量；

步骤二：使用三种聚类算法：K-means聚类算法、凝聚层次聚类算法和谱聚类算法进行对比实验，选择最优算法；

步骤三：根据聚类实验结果，选择风格差异较大的图像；

步骤四：基于CycleGAN对网络结构以及损失函数进行设计；

步骤五：针对良恶性数据集设计风格迁移实验，并对实验结果进行分析。

其中，步骤一对超声图像进行预处理，具体步骤如下：

由于彩超以外的超声图像均为黑白的单通道图像，可以认为超声图像的数据结构为一个二维矩阵，矩阵中的每个点代表原图中的该点的像素值。因此可以将超声图像转换成数据向量对其进行聚类。

其中，步骤二中分别使用K-means聚类算法、凝聚层次聚类算法和谱聚类算法进行对比实验。

针对K-means聚类算法，使用主成分分析算法(Principal Component Analysis,PCA)对原始的超声图像进行处理，选取每张图像前10个主成分上投影后的系数作为图像的特征向量，使图像能够转换为数据向量进行聚类。在对超声图像进行数据特征的提取后，使用python的scipy库中的矢量量化包sci.cluster.vq中的K-means聚类算法作为对后续K-means算法的具体实现。

凝聚层次聚类在合并类簇时设置一个比例K为90％来防止过度合并，即当数据空间中类的数量与数据对象数量的比例达到90％时暂时停止算法。这样获得的类簇和噪声图像的总数将为数据集大小的十分之一。

对于谱聚类算法，先使用PCA算法提取出图像的特征，将图像转换为向量后再使用谱聚类算法对完成对数据的降维，用拉普拉斯矩阵L的前6个最小的特征值对应的特征向量表示图像的特征，并用K-means算法完成最后的聚类工作。

根据实验结果在三个聚类算法中进行选择。

综合来看，K-means聚类算法的结果相对不错，但在部分类簇中效果不佳，同时K-means算法的实际运行效率较层次聚类和谱聚类差很多。层次聚类在实现时不需要重新调整图片的大小。最终算法输出的类簇树描述出了整体的聚类情况，对于两种结节的图像都有不错的表现。谱聚类算法的结果在两种结节图像中都表现不佳，将很多明显不属于一类的图像划为了一类，相对K-means聚类算法的结果更差。但从效率角度上分析，谱聚类算法由于进一步降低了数据的维数，其运行速度可以与凝聚层次聚类算法媲美，较K-means算法快上很多。从结果和效率两方面综合可得出凝聚层次聚类算法效果最优的结论。

其中，步骤三中，选择风格迁移实验所需图像，具体步骤如下：

在进行了聚类任务后，将属于不同风格但风格差异较小的图像聚为一类，减少了需要进行风格迁移的图像风格种类。从剩余风格的图像中挑选两种风格间差异较为明显的图像进行风格迁移工作。为了避免训练网络时可能出现的模型过拟合风险，并尝试得到更优秀的风格迁移结果，相对于聚类实验扩充了每种数据集的大小，加入了更多真实的超声图像。

其中，步骤四在步骤一、步骤二和步骤三的基础上基于CycleGAN对网络结构以及损失函数进行设计，具体步骤如下：

循环生成式对抗网络(Cycle Generative Adversarial Networks,CycleGAN)能够在完成真实图像间风格迁移的基础上完成不成对数图像间的风格迁移工作。该网络由两个生成式对抗网络组成，构建了一个环形网络。两个生成式对抗网络共享两个生成器G，同时两个生成式对抗网络各自有一个判别器DX和DY，DX的任务为分辨风格域X中的图像和生成器的输出生成的图像，DY的任务为分辨风格域Y中的图像和生成器的输出生成的图像。

网络结构采用CycleGAN的结构，损失函数由三部分组成，最小二乘损失、循环一致性损失和同一性损失，总的损失函数为三者相加。

由于超声图像普遍为单通道的灰度图像，本身不存在色彩间的差异，故减少同一性损失函数对于总的损失函数的贡献，从原始的0.5降低为了0.05，精简训练网络的流程。

其中，步骤五中针对良恶性数据集设计风格迁移实验，并对实验结果进行分析，具体步骤如下：

设计仅使用良性甲状腺结节数据集进行风格迁移、仅使用恶性甲状腺结节数据集进行风格迁移和同时使用两种图像进行风格迁移这三个不同的实验进行对比。

在对超声影像的风格迁移实验中，通过仅使用良性甲状腺结节数据集进行风格迁移、仅使用恶性甲状腺结节数据集进行风格迁移和同时使用两种图像进行风格迁移这三个不同的实验进行对比试验，实验中每组实验总共进行两百次迭代，即使用数据集的全部样本对生成器和判别器总共训练200次。论文将训练时的初始学习率设置为0.002，在前100次训练中将保持同样的学习率；在后100次训练中，学习率会线性地衰减到0。

结果所示的每张图像共由两张子图组成，每张子图上方的图像为将A风格的图像迁移为B风格的图像的实验结果，下方的图像为将B风格的图像迁移为A风格的图像的实验结果，其中A风格代表东芝公司超声仪器拍摄出的超声图像，B风格代表飞利浦公司超声仪器拍摄出的超声图像。每张子图又由三张图像组成，从左到右依次为原始数据集中初始风格的图像，风格迁移后的图像和经过CycleGAN中的生成器重新生成的原始风格的图像。图例中的迁移风格迁移方向给出了该子图中原始数据集的图像所属的风格以及迁移后的图像所属于的风格。

由于设备原因，两种风格的图像都有不少噪声干扰，但由于噪声的表现形式各不相同，因此没有被生成器和判别器识别为不同风格的纹理特征，在进行了风格迁移后，生成图像的噪声得到了有效控制。

图3为良性甲状腺结节图像风格迁移结果、图4为恶性甲状腺结节图像风格迁移结果、图5为综合使用两种甲状腺结节图像风格迁移结果。仔细观察图3和图4风格迁移生成的图像可以发现，生成的图像依然相当完好地显现出了甲状腺结节的结构，在内容上能够保持与原始图像一致。从训练和测试的结果分析，良性结节图像和恶性结节图像没有表现出明显的区别，但同时使用两种数据集的迁移结果较原始图像的变化相比于单独使用一种图像更大，能够更好地完成风格迁移的任务。这也表明相较于不同品牌超声仪器拍摄出的超声图像之间的风格差异，不同性质的甲状腺结节超声图像在风格间的差异不大，其不足以成为一种风格上的差异。

综合看来，经过CycleGAN方法进行风格迁移后的超声图像能够做到不同风格间的统一，且对于不同的数据集均有良好的效果。

实验证明设计的算法在超声图像数据集上具有良好的表现，能够减少不同风格间超声图像的差异性。同时可以有效地识别出不同数据集间较为明显的风格差异，并在实验时能够避免对不明显的风格差异做出改动。

与现有技术相比，本发明的有益效果为：

本发明所述的超声影像的聚类和风格迁移，采用层次聚类作为聚类的算法，分别对良性甲状腺结节超声图像和恶性甲状腺结节超声图像进行了聚类，完成了对风格不同但差异较小的图像聚为一类的任务。根据超声图像数据集为真实图像的特点，以及生成式对抗网络能够不需要数据输入就能够生成图像的特点，选择了基于生成式对抗网络的算法作为风格迁移的算法。同时根据超声图像中由不同超声仪器拍摄出的图像内容不成对的特点，选择了CycleGAN作为风格迁移的算法，对单独使用良性数据集、单独使用恶性数据集和同时使用两种数据集的情况分别进行了实验，从定性分析的角度，取得了较为不错的成果，较好地解决不同厂商仪器拍摄出的超声图像风格不统一的问题。使用的超声图像数据集中包含有部分噪声，其中包括医院医生对图像中部分内容的标注以及部分仪器在拍摄图像时标注上的部分数据等。设计的聚类和风格迁移的算法均有效地避免了噪声对于实验结果的影响，表现出了所使用方法对于噪声图像数据的适应性。

附图说明

图1所示为本申请应用CycleGAN进行超声图像风格迁移的流程示意图。

图2所示为本申请层次聚类实验结果示意图；

图3所示为本申请良性甲状腺结节图像风格迁移结果示意图；

图4所示为本申请中恶性甲状腺结节图像风格迁移结果示意图；

图5所示为本申请中综合使用两种甲状腺结节图像风格迁移结果示意图；

图6所示为本申请的方法流程示意图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用属于“包含”和/或“包括”时，其指明存在特征、步骤、操作、部件或者模块、组件和/或它们的组合。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

如图1-图6所示，

本发明提供了一种超声影像的聚类与风格迁移方法，包括：

步骤S0101：凝聚层次聚类在每次合并类簇的时候需要根据不同类之间的距离选择最相近两个类合并，在计算不同数据之间的距离时，使用平方距离和两个类之间所有点的平均值之间的距离作为计算标准。在对超声图像进行凝聚层次聚类时，先使用直方图统计获取图像的直方图，得到图像的特征，再对数据进行聚类。

步骤S0201：凝聚层次聚类在合并类簇时一般需要设置一个比例K来防止过度合并，即当数据空间中类的数量与数据对象数量的比例达到K时暂时停止算法，将K设为90％，这样获得的类簇和噪声图像的总数将为数据集大小的十分之一。通过凝聚层次聚类得到聚类结果。

步骤S0301：根据聚类结果，选择风格差异较大的图像作为风格迁移实验的数据集。风格迁移的网络结构为CycleGAN网络结构，CycleGAN网络由两个生成式对抗网络组成，构建了一个环形网络。两个生成式对抗网络共享两个生成器G，这两个G的任务不同于原始的生成式对抗网络中的G，将其命名为G和F，其中G的任务为将风格域X中图像转换为风格域Y中的图像，F的任务为将风格域Y中图像转换为风格域X中的图像。同时两个生成式对抗网络各自有一个判别器DX和DY，DX的任务为分辨风格域X中的图像和生成器F的输出生成的图像F(Y)，DY的任务为分辨风格域Y中的图像和生成器G的输出生成的图像G(X)。对于生成器G和其判别器DY组成的网络，存在一个和原始生成式对抗网络的损失函数形式近似的损失函数L_GAN(G，D_Y，X，Y)。

即式3-1。

L_GAN(G，D_Y，X，Y）＝E_y～pdata(y)[log D_Y(y)]+E_x～pdata(x)[log(1-D_Y(G(x)))] (3-1)

对于另外一个由F和其判别器DX组成的网络，同样拥有一个形式相同的损失函数L_GAN(F，D_x,Y，X)。式(3-1)中的x～pdata(x)和y～pdata(y)分别表示的是风格域X中图像的分布和风格域Y中图像的分布。但对于每个生成器而言，如果每个风格域中的图像足够多，它们可以选择将原始风格域中的不同图像对应为目标风格域中的相同图像来减少网络损失。为了避免这种情况，CycleGAN提出了一种循环一致性损失(Cycle Consistency Loss)，目的是使由生成器G的输出G(X)和生成器F的输出F(Y)在通过另一个生成器时可以转换为与原始图像相近的图像，即F(G(X))≈X、同时G(F(Y))≈Y。循环一致性损失的损失函数如公式(3-2)所示；

L_cyc(G，F)＝E_x～pdata(x)[||F(G(X))-x||₁]+E_y～pdata(y)[||G(F(Y))-y||₁] (3-2)

因此对于CycleGAN的训练，总共需要两个损失函数来对网络进行约束。CycleGAN模型中总的损失函数如式(3-3)所示：

min_G，Fmax_DX，DYL(G，F，D_x，D_y)＝L_GAN(G，D_y，X，Y)+L_GAN(F，D_x，Y，X)+λLcyc(G，F) (3-3)

为了使生成器G和F达到更为良好的效果，F(G(X))-x的值和G(F(Y))-y的值应尽可能小，因此循环一致性损失的值也应尽可能小。而两个生成式对抗网络的损失函数与原始生成式对抗网络的损失函数相同。因此对于总的损失函数，应在固定G和F的参数，使取值尽可能大，Dx和Dy的效果尽可能好的基础上取得最小值，使得G和F达到最优。

同时由于在训练G的过程中，容易出现图像风格与目标风格相似但颜色相差较大的情况。为此，采用Taigman等人在其论文中提到的方法，加入了一种同一性损失，损失函数的公式如式(3-4)所示。为了降低生成图像与原始图像间的颜色差别，训练生成器时该损失应该尽可能小。

L_identity(G，F)＝E_y～pdata(y)[||G(Y)-y||₁]+E_x～pdata(x)[||F(X)-x||₁] (3-4)

由于超声图像普遍为单通道的灰度图像，本身不存在色彩间的差异，所以降低了式(3-4)表示的损失函数对于总的损失函数的贡献，从原始的0.5降低为了0.05，精简了训练网络的流程。同时根据上述特点对网络中生成器G和判别器D的结构做了略微的更改，使得生成的图像初始就是单通道图像，判断时也只需基于单通道的特征进行判断，有效地减少了网络训练所需要的时间。

在训练中，为了稳定生成器网络和判别器网络训练的过程，达到更好的效果，在原始理论的基础上对网络结构做出了改进。对于生成器的网络训练采用和CycleGAN原始论文一样的方法，用最小二乘损失代替了生成式对抗网络训练损失中的负对数似然函数，变化后生成式对抗网络的损失函数如式(3-5)所示：

L_GAN（G，D_y，X，Y)＝E_y～pdata(y)[(D_Y(y)-1)²]+E_x～pdata(x)[(D_Y(G(x))²] (3-5)

步骤S0401：为了减少判别器网络训练中震荡，选择使用之前生成的图像而不是最近一次生成的图像作为判别器的输入。为了对判别器的训练进行优化，建立了一个可以容纳50张图像的缓冲区用来对判别器的输入进行更新。式(3-3)中的λ设置为10。并使用Adam优化器作为网络的优化器。在训练时加入了可视化模块，能够直接显示出训练中生成的图像与网络损失函数的取值，可以更为直观地发现训练时期网络模型的表现，并能在训练出现问题时及时发现并修改。进行了仅使用良性甲状腺结节数据集进行风格迁移、仅使用恶性甲状腺结节数据集进行风格迁移和同时使用两种图像进行风格迁移这三个不同的实验进行对比。

以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种用于超声影像的聚类和风格迁移的方法，其特征在于，包含以下步骤：

步骤一：数据预处理，将超声影像转换为数据向量；

步骤三：根据聚类实验结果，选择风格差异较大的图像；

步骤四：基于CycleGAN对网络结构以及损失函数进行设计；

2.根据权利要求1所述的一种用于超声影像的聚类和风格迁移的方法，其特征在于，

所述步骤二中的K-means聚类算法，使用主成分分析算法对原始的超声影像进行处理，选取每张图像前10个主成分上投影后的系数作为图像的特征向量，使图像能够转换为数据向量进行聚类。

3.根据权利要求2所述的一种用于超声影像的聚类和风格迁移的方法，其特征在于，

所述步骤二中的凝聚层次聚类算法在合并类簇时设置一个比例K为90％来防止过度合并，即当数据空间中类的数量与数据对象数量的比例达到90％时暂时停止算法。

4.根据权利要求2所述的一种用于超声影像的聚类和风格迁移的方法，其特征在于，

所述步骤二中谱聚类算法，先使用PCA算法提取出图像的特征，将图像转换为向量后再使用谱聚类算法对完成对数据的降维，用拉普拉斯矩阵L的前K个最小的特征值对应的特征向量表示图像的特征，并用K-means算法完成最后的聚类工作。

5.根据权利要求1所述的一种用于超声影像的聚类和风格迁移的方法，其特征在于，

所述步骤三包括如下步骤：在进行了聚类任务后，将属于不同风格但风格差异较小的图像聚为一类，从剩余风格的图像中挑选两种风格间差异较为明显的图像进行风格迁移工作。

6.根据权利要求1所述的一种用于超声影像的聚类和风格迁移的方法，其特征在于，

所述步骤四中，网络结构采用CycleGAN的结构，损失函数由三部分组成，最小二乘损失、循环一致性损失和同一性损失，总的损失函数为三者相加。