CN110309853B

CN110309853B - 基于变分自编码器的医学图像聚类方法

Info

Publication number: CN110309853B
Application number: CN201910423052.2A
Authority: CN
Inventors: 唐卓; 张琛; 陈建国; 肖正; 吴帆; 李肯立; 李克勤
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2019-05-20
Filing date: 2019-05-20
Publication date: 2022-09-09
Anticipated expiration: 2039-05-20
Also published as: CN110309853A

Abstract

本发明提供了一种基于变分自编码器的医学图像聚类方法。所述基于变分自编码器的医学图像聚类方法包括如下步骤：待聚类医疗图像提出聚类请求；对所述待聚类医疗图像进行预处理形成预处理图像；根据所述预处理图像的像素大小构建基于变分自编码器的聚类模型，并设置所述变分自编码器的损失函数对所述聚类模型进行训练；调节聚类类别个数，并重复前序步骤；比较计算获得最佳的聚类类别数及聚类结果；展示最终聚类结果。与相关技术相比，本发明的基于变分自编码其的医学图像聚类方法训练时间更短，训练正确率更高，普适性更强。

Description

基于变分自编码器的医学图像聚类方法

技术领域

本发明涉及医疗信息处理技术领域，尤其涉及一种基于变分自编码器的医学图像聚类方法。

背景技术

如今计算机技术高速发展，数据信息呈爆炸性增长。医学影像技术在最近几年也经历了快速发展，通过各种医疗器械如电子计算机X射线断层扫描技术(CT)、核磁共振成像技术(MRI)等所获得的医学影像可以辅助医生对病人的病情进行诊断，同时在研究领域，医学科研人员也可以通过医学影像辅助分析病理。在临床上，每时每刻都会产生大量的医学图像，如何通过计算机、人工智能技术对医学图像进行分析，挖掘其内在价值，对医疗发展至关重要。

聚类是人工智能机器学习领域的一个重要组成部分，在生物信息学、web信息检索、数据挖掘中有着广泛应用。如在文本聚类领域，利用聚类方法将主题相近的文章聚在一起，在技术路径及技术预见领域有广泛应用。在医学图像分析领域中，分类任务越来越不能满足需要。每天有大量的医疗图像产生，对图像进行标注将消耗大量的人力物力，训练集构建困难。与图像分类不同，图像聚类是一种无监督学习，不需要提前准备训练集和数据标签，它会根据聚类图像固有的特征分成若干个类目，具有很好的研究及使用价值。

传统的聚类方法，如k-means算法、高斯混合模型、谱聚类在许多问题上具有广泛的应用，在大数据场景下，由于距离度量及原始数据空间限制而表现不佳，因此近来，许多学者致力于图像深度聚类的研究，如改进k-means算法使之能够应用于高维输入空间、联合降维技术和k-means算法对数据进行聚类、基于谱聚类算法研究如何将原始数据进行特征学习进而对其聚类及结合自编码器的深层嵌入方法。

相关技术中，如公告号为CN105139430A的中国专利公开一种基于图熵的医学图像聚类方法，包括：(1)待聚类图像提出聚类请求；(2)图像预处理过程；(3)图的稀疏化；(4)基于图熵的带权无向图聚类；(5)展示结果。利用图熵的方法对医学图像进行聚类，通过将医学图像集抽象成完全图，之后对其进行稀疏化剪枝处理，所留下的边说明两张图像均认为与对方很相似，最后提出带权无向图的聚类方法。通过以上过程对医学图像进行聚类，可以有效的降低聚类时间，利用这种方法可以辅助医生在日常工作中对病人的病情进行诊断。但该方法在预处理过程中假设稀疏化剪枝处理仍能代表初始的医疗图像，仍保存了初始图像的特征信息，在实际应用中缺乏对初始图像整体信息的分析，在高维数据分析中表现不佳。

因此，有必要提供一种新的基于变分自编码器的医学图像聚类方法来解决上述问题。

发明内容

针对相关技术的医疗图像聚类方法在高维数据分析中表现不佳的技术问题，本发明提供了一种普适性强、训练时间短、正确率高的基于变分自编码器的医学图像聚类方法。

一种基于变分自编码器的医学图像聚类方法，其包括如下步骤：

S1、待聚类医疗图像提出聚类请求；

S2、对所述待聚类医疗图像进行预处理形成预处理图像；

S3、根据所述预处理图像的像素大小构建基于变分自编码器的聚类模型，并设置所述变分自编码器的损失函数对所述聚类模型进行训练；

S4、调节聚类类别个数，并重复所述步骤S3；

S5、比较计算获得最佳的聚类类别数及聚类结果；

S6、展示最终聚类结果。

优选的，所述待聚类医疗图像为原始医学图像数据。

优选的，所述预处理包括图像像素大小调整统一及数据归一化处理。

优选的，所述图像像素大小调整统一为选取所需的所述待聚类医疗图片中像素最大的图片最为基准矩阵，其余的所述待聚类医疗图片按照基准矩阵在空白处补零处理；所述归一化处理为将所有像素点均除以255，保证所有数据取值范围在[0，1]之间。

优选的，所述步骤S3为选取卷积神经网络作为变分自编码器的编码器和解码器，选取已经数据所述预处理图像、隐变量及其类别的联合分布的相对熵作为所述变分自编码器的损失函数，所述聚类模型的训练为选取Adam优化算法求解损失函数的最小值。

优选的，所述步骤S5比较计算获得最佳的聚类类别数及聚类结果为使用轮廓系数S来评价聚类效果的好坏，所述轮廓系数S的计算由以下公式决定：

其中，n是所有数据的个数，i是数据点指所需聚类的任意一张所述预处理图像，z代表隐变量，评价时以初始所述预处理图像经所述变分自编码器计算出的与之对应的隐变量作为其聚类特征，S_z(i)为数据点i的轮廓系数，a(i)为数据点i对应的隐变量z_i到所有其属于的簇中其他点的距离的平均值，b(i)为数据点i对应的隐变量z_i到各个非本身簇的所有点的距离平均值的最小值，对于距离的计算为采用欧式距离公式计算所得。

与相关技术相比，本发明提供的基于变分自编码器的医学图像聚类方法利用变分自编码器的深度隐变量表示学习优点，将编码器、解码器与聚类任务同时在一个步骤中进行，克服了传统聚类方法在高维度图像上表现不佳的缺点，同时也比先用训练编码器解码器后得到编码再聚类的方法更具有连贯性，使得本发明提供的基于变分自编码器的医学图像聚类方法的训练时间更短，训练正确率更高，普适性更强。

附图说明

图1为本发明提供的基于变分自编码器的医学图像聚类方法的流程图；

图2为基于变分自编码器的聚类模型架构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请结合参阅图1和图2。本发明提供了一种基于变分自编码器的医学图像聚类方法100用于对医学图像进行聚类，通过变分自编码器将医学图像的隐变量空间对应的分布求出，再根据隐变量分布之间的差异性对隐变量进行聚类，通过大量的数据训练，获得良好的聚类效果。从而有效的提高聚类的准确率，克服传统医疗图像聚类时间长且在高维数据分析中表现不佳的缺点，可以辅助医生在日常工作中对病人病情进行诊断，同时也可以帮助医疗研究人员对某种疾病病理进行研究。

所述基于变分自编码器的医学图像聚类方法100包括如下步骤：

S1、待聚类医疗图像提出聚类请求；

具体的，所述待聚类医疗图像为原始医学图像数据以某种图片格式保存于硬盘中。为了便于理解，在本实施例中，所述待聚类医疗图像为胸部X光图片，且图片大小为128*128*1像素。

S2、对所述待聚类医疗图像进行预处理形成预处理图像；

具体的，所述预处理包括图像像素大小调整统一及数据归一化处理。其中所述图像像素大小调整统一为选取所需的所述待聚类医疗图片中像素最大的图片作为基准矩阵，其余的所述待聚类医疗图片按照基准矩阵在空白处补零处理。所述数据归一化处理为将所有像素点均除以255，保证所有数据取值范围在[0，1]之间。

在本实施例中，以胸部X光图片为例，所输入的维度即为128*128*1像素，原始医学图像的RGB值范围为0～255，将其归一化处理即将所有像素点均除以255，从而保证所有数据取值范围在[0，1]之间。

具体的，所述步骤S3为选取卷积神经网络作为变分自编码器的编码器和解码器，选取已知数据所述预处理图像、隐变量及其类别的联合分布的相对熵作为所述变分自编码器的损失函数，聚类模型的训练选取Adam优化算法求解损失函数的最小值。

在本实施例中，所述基于变分自编码器的聚类模型包括编码器、解码器及聚类模块。所述编码器根据图片的大小可人为设置，所述编码器包括卷积神经网络层和全连接层，所述解码器结构与所述编码器互逆。在本实施例中，以胸部X光图片为例，所述编码器可以设计为四层卷积层、四层池化层和两层全连接层的神经网络，其中所述卷积层的滤波器大小分别为7*7*16，5*5*32，3*3*64，3*3*128，步长为1，池化层滤波器均为2*2，步长为1，全连接层神经元个数分别为1024和128，即隐变量z的维度为128。所述解码器与所述编码器互逆，所述解码器的结构与所述编码器的结构相反。得到隐变量z之后，将其输入到一个全连接层神经网络中，输出为属于各个类别的概率，在本实施例中，以胸部X光图片为例，暂定聚类类别数为16，即此全连接神经网络神经元个数为16，输出维度为16的向量。然后由类别y为输入，输出其对应的隐变量z_y的分布，可以由神经元与隐变量z维数相等的单层神经网络来实现，而z与其分布中心尽可能相等。另一方面，隐变量z经过解码器得到同输入医疗图片大小相同的图片，变分自编码器要求输出的图片与输入的图片尽可能相似。因此，结合变分自编码器和聚类模块，得到模型的损失函数为：

其中x是需要聚类的医疗图片，在本实施例中，即为胸部X光图片；z为x所对应的隐变量，在本实施例中，以胸部X光图片为例，为维度为128的向量；y为聚类的类别，在本实施例中，结合胸部X光图片为例，初步选取类别为16；

为原始医疗图像所具有的天然内在分布，无法直接求得，但客观存在；q(x|z)为均值为G(x)方差为常数的正态分布，即解码器的输出；q(z|y)为均值为μ_y方差为1的正态分布，即由类别y对应的隐变量z的分布；p(z|x)为均值为μ(x)方差为σ²(x)的正态分布，即编码器；p(y|z)是对隐变量的分类器，在本实施例中，可以选取多层神经网络进行代替；q(y)为类别本身的分布，在本实施例中，可假设为均匀分布，KL是指相对熵，表示两个分布间的差异性，计算公式为：

IΕ_z～p(z|x)即为在z分布为p(z|x)的情况下求表达式的期望。得到损失函数后，即可利用Adam优化算法求解损失函数的最小值。

具体的，输入至编码器中的x与解码器输出的x’越接近越好，隐变量z均值与每个类别对应的应变量z的分布越接近越好。

可以理解的是，本发明通过将医疗图像特征表述即隐变量和聚类同时在变分自编码器的框架下实现，该框架下编码器和解码器可用卷积神经网络搭建，普适性强，同时训练时间短，正确率高。

S4、调节聚类类别个数，并重复所述步骤S3；

具体的，在本实施例中，以胸部X光图片为例，根据初选类别个数16，可以再次设计类别数为15，17，18，……。

对所述聚类类别个数的调节可以是手动的或自动的，如通过设定程序使得按照预设参数对聚类类别个数进行自动调节。

S5、比较计算获得最佳的聚类类别数及聚类结果；

可以理解的是，所述步骤S5中比较计算获得最佳的聚类类别数及聚类结果为当S4步骤中运行到满足结束条件时，再进入至所述步骤S5进行比较计算，所述结束条件可为任意人为设定的参数如运行次数或人为手动进行结束等均是可行的。

具体的，所述步骤S5比较计算获得最佳的聚类类别数及聚类结果为使用轮廓系数

来评价聚类效果的好坏，所述轮廓系数S的计算由以下公式决定：

S6、展示最终聚类结果。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本发明的专利保护范围内。