CN111008643A

CN111008643A - 基于半监督学习的图片分类方法、装置和计算机设备

Info

Publication number: CN111008643A
Application number: CN201911037289.3A
Authority: CN
Inventors: 郭晏; 张成奋; 吕彬; 吕传峰; 谢国彤
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-10-29
Filing date: 2019-10-29
Publication date: 2020-04-14
Anticipated expiration: 2039-10-29
Also published as: CN111008643B; WO2021082428A1

Abstract

本申请揭示了一种基于半监督学习的图片分类方法、装置、计算机设备和存储介质，所述方法包括：获取待分类的OCT图片；利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到第一个编码器生成的第一特征向量X；利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；利用所述第二编码器生成第二特征向量Y；根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；若所述相似度值大于预设的相似度阈值，则将待分类的OCT图片分类为阴性图片。从而在无需阳性数据的情况下完成OCT图片分类，并克服了阳性数据收集困难的缺陷。

Description

基于半监督学习的图片分类方法、装置和计算机设备

技术领域

本申请涉及到计算机领域，特别是涉及到一种基于半监督学习的图片分类方法、装置、计算机设备和存储介质。

背景技术

OCT(光学相干断层扫描，optical coherence tomography)影像已经成为临床上比较常见的眼科疾病检查及诊断手段，基于人工智能方法进行基于OCT影像进行眼科疾病筛查具有重要意义。常见的解决方案是将这类问题定义为二分类任务来处理，通过收集一批正常的阴性样本以及异常的阳性样本，即每一张OCT图片都被赋予了标签，然后选择不同的分类模型，通过一定量数据训练之后，自动预测图像正常、异常的类别预测，实现基于OCT图像的眼科疾病筛查。但是这类监督学习方法存在两个明显的缺陷：(1)需要收集大量的样本进行模型训练，特别是异常图片。在医学图像领域，比较容易收集到是正常的阴性样本，而异常样本的收集费时且需要专家标注，成本较大；(2)由于阳性样本收集的难度，非常容易造成样本分布不均衡，即正常样本较多，异常样本较少，训练得到的模型精度难以保证，特别是用于疾病筛查场景，召回率存在着极大风险，有待改善。因此，传统技术在未获取足够量的阳性样本的前提下，无法对OCT图像进行准确的分类。

发明内容

本申请的主要目的为提供一种基于半监督学习的图片分类方法、装置、计算机设备和存储介质，旨在提高OCT图像分类的准确性。

为了实现上述发明目的，本申请提出一种基于半监督学习的图片分类方法，包括以下步骤：

获取待分类的OCT图片；

利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成；

利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；

利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；

根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；

若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。

进一步地，所述OCT图片分类模型还包括辨别器，所述辨别器用于辨别所述OCT图片和所述解码图片是否相同，并且所述特征向量生成器与所述辨别器采用相同的样本数据共同训练，所述利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成的步骤之前，包括：

从预设的训练集中提取指定阴性OCT图片，并将所述指定阴性OCT图片输入所述特征向量生成器中，从而得到所述特征向量生成器的第一编码器生成的第一训练向量A1、第一解码器生成的暂时图片和第二编码器生成的第二训练向量A2；

计算所述第一训练向量A1和所述第二训练向量A2之间的第一向量相似度值，并且利用所述辨别器计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值；

判断所述第一向量相似度值是否大于预设的向量相似阈值，并且判断所述第一图片相似度值是否大于预设的图片相似阈值；

若所述第一向量相似度值大于预设的向量相似阈值，并且所述第一图片相似度值大于预设的图片相似阈值，则不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

进一步地，所述计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值的步骤,包括：

依次对比所述指定阴性OCT图片与所述暂时图片中对应的像素点，并统计相同像素点的数量；

根据公式：相同占比＝相同像素点的数量/所述指定阴性OCT图片中所有像素点的数量，计算得到所述相同占比数值；

将所述相同占比数值记为所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值。

进一步地，所述判断所述第一向量相似度值是否大于预设的向量相似阈值，并且判断所述第一图片相似度值是否大于预设的图片相似阈值的步骤之后，包括：

若所述第一向量相似度值不大于预设的向量相似阈值，或者所述第一图片相似度值不大于预设的图片相似阈值，则采用使所述第一向量相似度值增大或者所述第一图片相似度值增大的原则，并利用反向传导法则共同更新所述OCT图片分类模型中的所述特征向量生成器和所述辨别器的参数；

利用参数更新后的OCT图片分类模型再次对所述指定阴性OCT图片进行处理，得到所述特征向量生成器的第一编码器生成的第一更新向量B1、第一解码器生成的更新图片和第二编码器生成的第二更新向量B2；

计算所述第一更新向量B1和所述第二更新向量B2之间的第二向量相似度值，并且计算所述指定阴性OCT图片与所述更新图片之间的第二图片相似度值；

判断所述第二向量相似度值是否大于预设的向量相似阈值，并且判断所述第二图片相似度值是否大于预设的图片相似阈值；

若所述第二向量相似度值大于预设的向量相似阈值，并且所述第二图片相似度值大于预设的图片相似阈值，则不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

进一步地，所述第一编码器和所述第二编码器均包括多个卷积层，所述OCT图片分类模型还包括卷积图像辨别器，所述利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y的步骤之前，包括：

获取所述第一编码器中的指定卷积层输出的第一卷积图像，以及获取所述第二编码器中与所述指定卷积层对应的卷积层输出的第二卷积图像；

将所述第一卷积图像和所述第二卷积图像输入所述卷积图像辨别器中，从而得到所述卷积图像辨别器输出的辨别结果，并判断所述辨别结果是否为相似；

若所述辨别结果为相似，则生成编码指令，所述编码指令用于指示利用所述第二编码器对所述解码图片进行编码。

进一步地，所述根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值的步骤,包括：

根据公式：

计算得到所述第一特征向量X和所述第二特征向量Y的相似度值dis，其中，xi为所述第一特征向量X的第i个分向量的数值，yi为所述第一特征向量Y的第i个分向量的数值，所述第一特征向量X和所述第二特征向量Y均包括n个分向量；

判断所述相似度值dis是否大于预设的相似度阈值。

进一步地，所述根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值的步骤之后，包括：

若所述相似度值不大于预设的相似度阈值，则将所述待分类的OCT图片输入预设的基于深度卷积对抗生成网络的阳性图片分类模型中进行处理，所述阳性图片分类模型通过半监督学习的训练方法采用样本数据训练而得，其中样本数据仅由阳性OCT图片构成；

获取所述阳性图片分类模型输出的处理结果，并判断所述处理结果是否为阳性；

若所述处理结果为阳性，则将所述待分类的OCT图片分类为阳性图片。

本申请提供一种基于半监督学习的图片分类装置，包括：

OCT图片获取单元，用于获取待分类的OCT图片；

第一特征向量X生成单元，用于利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成；

解码图片获取单元，用于利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；

第二特征向量Y生成单元，用于利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；

相似度阈值判断单元，用于根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；

阴性图片分类单元，用于若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。

本申请提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的基于半监督学习的图片分类方法、装置、计算机设备和存储介质，获取待分类的OCT图片；利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。从而在无需阳性数据的情况下完成OCT图片分类，克服了阳性数据收集困难的缺陷。

附图说明

图1为本申请一实施例的基于半监督学习的图片分类方法的流程示意图；

图2为本申请一实施例的基于半监督学习的图片分类装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例提供一种基于半监督学习的图片分类方法，包括以下步骤：

S1、获取待分类的OCT图片；

S2、利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成；

S3、利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；

S4、利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；

S5、根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；

S6、若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。

本申请的基于半监督学习的图片分类方法用于除疾病的诊断和治疗方法之外的任意可行用途，例如用于对大量的未分类OCT图片进行分析整理，以分类存储不同类别的OCT图片，便于数据存储与数据分析等。

如上述步骤S1所述，获取待分类的OCT图片。OCT图片(光学相干断层扫描图片，optical coherence tomography)是利用光明相干原理进行断层扫描的图片，例如适用于眼部结构探查。OCT图片的初始状态是待分类的，而普通人缺乏足够的知识对OCT图片进行分类。而本申请通过预设的OCT图片分类模型能够实现对待分类的OCT图片进行分类。

如上述步骤S2所述，利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成。其中所述OCT图片分类模型可以为任意结构，例如为基于深度卷积对抗生成网络的网络结构。并且本申请的OCT图片分类模型包括特征向量生成器，所述特征向量生成器用于正常工作时进行OCT图片分类。其中特征向量生成器具有依次连接的第一编码器、第一解码器和第二编码器，这是普通的深度卷积对抗生成网络所不具备的，基于第一编码器、第一解码器和第二编码器，阳性图片传入网络后无法被第一编码器完全提取特征，因此也无法被第一解码器完全重构，因此第一解码器生成的解码图片与阳性图片相比存在特征丢失的现象，最终导致第二编码器生成的特征Y与第一编码器生成的特征X不匹配，而阴性图像得到的特征Y与特征X非常接近，基本匹配，故异常图像得到检出。进一步地，所述OCT图片分类模型还包括辨别器，所述辨别器用于辨别所述OCT图片和所述解码图片是否相似，并且所述特征向量生成器与所述辨别器采用相同的样本数据共同训练。其中所述第一编码器可以为任意结构，例如为由多个卷积层构成的卷积网络，其最终输出为特征向量。

如上述步骤S3所述，利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片。其中所述第一解码器可以为任意结构的解码器，但能够对所述第一特征向量X，例如为能够进行多个卷积和反卷积操作组成的多层网络结构。由于第一解码器是基于第一特征向量X的解码处理，而第一特征向量X是从待分类的OCT图片中提取的，若提取过程的数据损失过多，将导致解码图片与待分类的OCT图片区别过大。若待分类的OCT图片为阴性图片，由于所述OCT图片分类模型是仅由阴性OCT图片构成样本数据训练得到，因此在待分类的OCT图片为阴性图片的前提下，所述第一解码器得到的解码图片与所述待分类的OCT图片是相同或相似的；而若待分类的OCT图片为阳性图片，则所述第一解码器得到的解码图片与所述待分类的OCT图片是不相同的。

如上述步骤S4所述，利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y。其中所述第二编码器可以为任意结构，例如为由多个卷积层构成的卷积网络，其最终输出为特征向量。并且所述第二编码器的结构与所述第一编码器相同，或者与所述第一编码器不相同，但同样能够用于对所述解码图片进行编码，从而生成第二特征向量Y。

如上述步骤S5所述，根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值。其中所述相似度计算方法可以为任意方法，例如为根据公式：

计算得到所述第一特征向量X和所述第二特征向量Y的相似度值dis，其中，xi为所述第一特征向量X的第i个分向量的数值，yi为所述第一特征向量Y的第i个分向量的数值，所述第一特征向量X和所述第二特征向量Y均包括n个分向量。

如上述步骤S6所述，若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。若所述待分类的OCT图片不为阴性图片，则由于第一编码器、第一解码器、第二编码器的一系列处理过程中必然出现的特征丢失(因为本申请是基于半监督学习，仅采用阴性图片进行训练，因此仅在阴性图片的前提下，才可能不出现特征丢失)，最终的相似度值将不大于预设的相似度阈值。据此，若所述相似度值大于预设的相似度阈值，表明所述第一特征向量X和所述第二特征向量Y是相同或是相似的，据此将所述待分类的OCT图片分类为阴性图片。本申请中的生成器部分进行改进，直接以图像作为输入，经过第一编码器将图像转换至特征空间，再经过第一解码器将特征向量重构并生解码图像，之后再连接额外的第二编码器，将生成图像重新转换到特征空间，通过比对第一编码器与第二编码器的输出，以实现OCT图片的分类，从而不仅在检测精度上大大高于传统算法，并且具有更高的测试效率。进一步地，若所述相似度值不大于预设的相似度阈值，则或者将所述待分类的OCT图片直接分类为阳性图片，或者对所述待分类的OCT图片进一步分析是否为阳性图片。

在一个实施方式中，所述OCT图片分类模型还包括辨别器，所述辨别器用于辨别所述OCT图片和所述解码图片是否相同，并且所述特征向量生成器与所述辨别器采用相同的样本数据共同训练，所述利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成的步骤S2之前，包括：

S11、从预设的训练集中提取指定阴性OCT图片，并将所述指定阴性OCT图片输入所述特征向量生成器中，从而得到所述特征向量生成器的第一编码器生成的第一训练向量A1、第一解码器生成的暂时图片和第二编码器生成的第二训练向量A2；

S12、计算所述第一训练向量A1和所述第二训练向量A2之间的第一向量相似度值，并且利用所述辨别器计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值；

S13、判断所述第一向量相似度值是否大于预设的向量相似阈值，并且判断所述第一图片相似度值是否大于预设的图片相似阈值；

S14、若所述第一向量相似度值大于预设的向量相似阈值，并且所述第一图片相似度值大于预设的图片相似阈值，则不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

如上所述，实现了对所述OCT图片分类模型进行训练。其中所述OCT图片分类模型还包括辨别器，所述辨别器用于辨别所述OCT图片和所述解码图片是否相同，并且所述特征向量生成器与所述辨别器采用相同的样本数据共同训练。所述辨别器仅在训练过程中起作用，而在图片分类过程中并不工作，从而优化所述OCT图片分类模型并提高图片分类的速度。并且由于采用的是相同的训练数据进行共同训练，因此所述辨别器与所述特征向量生成器的适应性更高，更具鲁棒性。其中所述训练集中仅包括阴性OCT图片。若基于所述指定阴性OCT图片获得的所述第一向量相似度值大于预设的向量相似阈值，并且所述第一图片相似度值大于预设的图片相似阈值，则表明当前的OCT图片分类模型能够对所述指定阴性OCT图片进行正确分类，据此不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。其中所述辨别器可为任意结构,例如为一系列卷积层、池化层组成的深度卷积分类网络。

在一个实施方式中，所述计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值的步骤S12,包括：

S121、依次对比所述指定阴性OCT图片与所述暂时图片中对应的像素点，并统计相同像素点的数量；

S122、根据公式：相同占比＝相同像素点的数量/所述指定阴性OCT图片中所有像素点的数量，计算得到所述相同占比数值；

S123、将所述相同占比数值记为所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值。

如上所述，实现了计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值。为了计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值，本实施方式采用逐次比对像素点的方式进行判断。若所述指定阴性OCT图片与所述暂时图片是相同的，那么相同像素点的数量应当占绝大多数，即所述相同占比趋近于1。据此，根据公式：相同占比＝相同像素点的数量/所述指定阴性OCT图片中所有像素点的数量，计算得到所述相同占比数值，若所述相同像素点占比大于预设的占比阈值，则判定所述指定阴性OCT图片与所述暂时图片相同。

在一个实施方式中，所述判断所述第一向量相似度值是否大于预设的向量相似阈值，并且判断所述第一图片相似度值是否大于预设的图片相似阈值的步骤S13之后，包括：

S131、若所述第一向量相似度值不大于预设的向量相似阈值，或者所述第一图片相似度值不大于预设的图片相似阈值，则采用使所述第一向量相似度值增大或者所述第一图片相似度值增大的原则，并利用反向传导法则共同更新所述OCT图片分类模型中的所述特征向量生成器和所述辨别器的参数；

S132、利用参数更新后的OCT图片分类模型再次对所述指定阴性OCT图片进行处理，得到所述特征向量生成器的第一编码器生成的第一更新向量B1、第一解码器生成的更新图片和第二编码器生成的第二更新向量B2；

S133、计算所述第一更新向量B1和所述第二更新向量B2之间的第二向量相似度值，并且计算所述指定阴性OCT图片与所述更新图片之间的第二图片相似度值；

S134、判断所述第二向量相似度值是否大于预设的向量相似阈值，并且判断所述第二图片相似度值是否大于预设的图片相似阈值；

S135、若所述第二向量相似度值大于预设的向量相似阈值，并且所述第二图片相似度值大于预设的图片相似阈值，则不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

如上所述，实现了参数更新。若所述第一向量相似度值不大于预设的向量相似阈值，或者所述第一图片相似度值不大于预设的图片相似阈值，表明当前的OCT图片分类模型不能对所述指定阴性OCT图片进行正确的分类，因此需要更新所述OCT图片分类模型的参数。其中参数更新采用反向传导法则进行共同更新。所述反向传导法则建立在梯度下降法的基础上，其输入输出关系实质上是一种映射关系：一个n输入m输出的神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。反向传导法则的网络的信息处理能力来源于简单非线性函数的多次复合，因此具有很强的函数复现能力。其中所述参数更新的原则为：使所述第一向量相似度值变大或者所述第一图片相似度值变大。据此，再次判断所述第二向量相似度值是否大于预设的向量相似阈值，并且判断所述第二图片相似度值是否大于预设的图片相似阈值。若所述第二向量相似度值大于预设的向量相似阈值，并且所述第二图片相似度值大于预设的图片相似阈值，表明所述OCT图片分类模型能对所述指定阴性OCT图片进行正确的分类，据此不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

在一个实施方式中，所述第一编码器和所述第二编码器均包括多个卷积层，所述OCT图片分类模型还包括卷积图像辨别器，所述利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y的步骤S4之前，包括：

S31、获取所述第一编码器中的指定卷积层输出的第一卷积图像，以及获取所述第二编码器中与所述指定卷积层对应的卷积层输出的第二卷积图像；

S32、将所述第一卷积图像和所述第二卷积图像输入所述卷积图像辨别器中，从而得到所述卷积图像辨别器输出的辨别结果，并判断所述辨别结果是否为相似；

S33、若所述辨别结果为相似，则生成编码指令，所述编码指令用于指示利用所述第二编码器对所述解码图片进行编码。

如上所述，实现了利用卷积图像辨别器进一步提高分类准确度。其中所述第一编码器与所述第二编码器的结构可以相同，也可以不同，但是均包括多个卷积层，并且第一编码器包括指定卷积层(用于输出第一卷积图像)，第二编码器包括与所述指定卷积层对应的卷积层(用于输出第二卷积图像)，其中指定卷积层例如为第一编码器的第二层卷积层，相应的与所述指定卷积层对应的卷积层例如为第二编码器的第二层卷积层。卷积图像辨别器接收所述第一卷积图像和所述第二卷积图像，并用于辨别所述第一卷积图像和所述第二卷积图像是否相似。若所述辨别结果为不相似，表明OCT图片分类模型在分类过程中丢失了过多的特征，也即所述待分类的OCT图片不为阴性图片(因为OCT图片分类模型仅由阴性图片训练而成，因此在对非阴性图片进行处理之时，会出动特征丢失的情况)。若所述辨别结果为相似，则需要利用第二编码器进一步进行分类，据此生成编码指令，所述编码指令用于指示利用所述第二编码器对所述解码图片进行编码。从而，以设置卷积图像辨别器的方式，提前识别出非阴性图片，进一步提高分类的准确性。

在一个实施方式中，所述根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值的步骤S5,包括：

S501、根据公式：

S502、判断所述相似度值dis是否大于预设的相似度阈值。

如上所述，实现了根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值。其中预设的相似度计算方法的公式为：

当所述第一特征向量X和所述第二特征向量Y完全相同时，所述相似度值dis等于1，即所述相似度值dis的最大值为1。所述相似度值dis离数值1越远，表明所述第一特征向量X和所述第二特征向量Y越不相似。从而所述相似度值dis能够衡量所述第一特征向量X和所述第二特征向量Y的相似程度。若所述相似度值dis大于预设的相似度阈值，则判定所述第一特征向量X和所述第二特征向量Y相似，也表明所述待分类的OCT图片是所述OCT图片分类模型能够完全识别的，因此所述待分类的OCT图片为阴性图片(因此所述OCT图片分类模型仅由阴性图片训练得到，因此仅能完全识别阴性图片)。

在一个实施方式中，所述根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值的步骤S5之后，包括：

S51、若所述相似度值不大于预设的相似度阈值，则将所述待分类的OCT图片输入预设的基于深度卷积对抗生成网络的阳性图片分类模型中进行处理，所述阳性图片分类模型通过半监督学习的训练方法采用样本数据训练而得，其中样本数据仅由阳性OCT图片构成；

S52、获取所述阳性图片分类模型输出的处理结果，并判断所述处理结果是否为阳性；

S53、若所述处理结果为阳性，则将所述待分类的OCT图片分类为阳性图片。

如上所述，实现了对非阴性图片进一步分类。输入的图片有可能出现误输入的状况，例如将非OCT图片输入所述OCT图片分类模型中，因此分类结果不为阴性，但也不应被分类为阳性。或者输入的图片是特殊的阴性图片(与训练用过的阴性图片区别较大)，因此OCT图片分类模型也无法进行正确分类。为进一步分类，本申请另外设置了基于深度卷积对抗生成网络的阳性图片分类模型中进行处理，所述阳性图片分类模型通过半监督学习的训练方法采用样本数据训练而得，其中样本数据仅由阳性OCT图片构成，从而进一步识别出阳性图片。其中所述阳性图片分类模型的结构可以与所述OCT图片分类模型相同，也可以为传统的深度卷积对抗生成网络的结构。若所述阳性图片分类模型输出的处理结果为阳性，表明阳性图片分类模型能对所述待分类的OCT图片进行准确的识别，并且所述阳性图片分类模型仅由阳性OCT图片训练得到，据此将所述待分类的OCT图片分类为阳性图片。

本申请的基于半监督学习的图片分类方法，获取待分类的OCT图片；利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。从而在无需阳性数据的情况下完成OCT图片分类，克服了阳性数据收集困难的缺陷。

参照图2，本申请实施例提供一种基于半监督学习的图片分类装置，包括：

OCT图片获取单元10，用于获取待分类的OCT图片；

第一特征向量X生成单元20，用于利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成；

解码图片获取单元30，用于利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；

第二特征向量Y生成单元40，用于利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；

相似度阈值判断单元50，用于根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；

阴性图片分类单元60，用于若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。

其中上述单元分别用于执行的操作与前述实施方式的基于半监督学习的图片分类方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述OCT图片分类模型还包括辨别器，所述辨别器用于辨别所述OCT图片和所述解码图片是否相同，并且所述特征向量生成器与所述辨别器采用相同的样本数据共同训练，所述装置，包括：

指定阴性OCT图片提取单元，用于从预设的训练集中提取指定阴性OCT图片，并将所述指定阴性OCT图片输入所述特征向量生成器中，从而得到所述特征向量生成器的第一编码器生成的第一训练向量A1、第一解码器生成的暂时图片和第二编码器生成的第二训练向量A2；

相似度值计算单元，用于计算所述第一训练向量A1和所述第二训练向量A2之间的第一向量相似度值，并且利用所述辨别器计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值；

相似阈值判断单元，用于判断所述第一向量相似度值是否大于预设的向量相似阈值，并且判断所述第一图片相似度值是否大于预设的图片相似阈值；

指定阴性OCT图片删除单元，用于若所述第一向量相似度值大于预设的向量相似阈值，并且所述第一图片相似度值大于预设的图片相似阈值，则不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

在一个实施方式中，所述相似度值计算单元,包括：

相同像素点统计子单元，用于依次对比所述指定阴性OCT图片与所述暂时图片中对应的像素点，并统计相同像素点的数量；

相同占比数值计算子单元，用于根据公式：相同占比＝相同像素点的数量/所述指定阴性OCT图片中所有像素点的数量，计算得到所述相同占比数值；

第一图片相似度值标记子单元，用于将所述相同占比数值记为所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值。

其中上述子单元分别用于执行的操作与前述实施方式的基于半监督学习的图片分类方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述装置，包括：

参数更新单元，用于若所述第一向量相似度值不大于预设的向量相似阈值，或者所述第一图片相似度值不大于预设的图片相似阈值，则采用使所述第一向量相似度值增大或者所述第一图片相似度值增大的原则，并利用反向传导法则共同更新所述OCT图片分类模型中的所述特征向量生成器和所述辨别器的参数；

更新向量获取单元，用于利用参数更新后的OCT图片分类模型再次对所述指定阴性OCT图片进行处理，得到所述特征向量生成器的第一编码器生成的第一更新向量B1、第一解码器生成的更新图片和第二编码器生成的第二更新向量B2；

第二向量相似度值计算单元，用于计算所述第一更新向量B1和所述第二更新向量B2之间的第二向量相似度值，并且计算所述指定阴性OCT图片与所述更新图片之间的第二图片相似度值；

向量相似阈值判断单元，用于判断所述第二向量相似度值是否大于预设的向量相似阈值，并且判断所述第二图片相似度值是否大于预设的图片相似阈值；

删除单元，用于若所述第二向量相似度值大于预设的向量相似阈值，并且所述第二图片相似度值大于预设的图片相似阈值，则不改变所述OCT图片分类模型的参数，并且将所述指定阴性OCT图片从所述训练集中删除。

在一个实施方式中，所述第一编码器和所述第二编码器均包括多个卷积层，所述OCT图片分类模型还包括卷积图像辨别器，所述装置，包括：

卷积图像获取单元，用于获取所述第一编码器中的指定卷积层输出的第一卷积图像，以及获取所述第二编码器中与所述指定卷积层对应的卷积层输出的第二卷积图像；

辨别结果获取单元，用于将所述第一卷积图像和所述第二卷积图像输入所述卷积图像辨别器中，从而得到所述卷积图像辨别器输出的辨别结果，并判断所述辨别结果是否为相似；

编码指令生成单元，用于若所述辨别结果为相似，则生成编码指令，所述编码指令用于指示利用所述第二编码器对所述解码图片进行编码。

在一个实施方式中，所述相似度阈值判断单元50,包括：

相似度值dis计算子单元，用于根据公式：

相似度值dis判断子单元，用于判断所述相似度值dis是否大于预设的相似度阈值。

在一个实施方式中，所述装置，包括：

阳性图片分类模型计算单元，用于若所述相似度值不大于预设的相似度阈值，则将所述待分类的OCT图片输入预设的基于深度卷积对抗生成网络的阳性图片分类模型中进行处理，所述阳性图片分类模型通过半监督学习的训练方法采用样本数据训练而得，其中样本数据仅由阳性OCT图片构成；

阳性判断单元，用于获取所述阳性图片分类模型输出的处理结果，并判断所述处理结果是否为阳性；

阳性图片分类单元，用于若所述处理结果为阳性，则将所述待分类的OCT图片分类为阳性图片。

本申请的基于半监督学习的图片分类装置，获取待分类的OCT图片；利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。从而在无需阳性数据的情况下完成OCT图片分类，克服了阳性数据收集困难的缺陷。

参照图3，本发明实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于半监督学习的图片分类方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于半监督学习的图片分类方法。

上述处理器执行上述基于半监督学习的图片分类方法，其中所述方法包括的步骤分别与执行前述实施方式的基于半监督学习的图片分类方法的步骤一一对应,在此不再赘述。

本领域技术人员可以理解，图中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请的计算机设备，获取待分类的OCT图片；利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。从而在无需阳性数据的情况下完成OCT图片分类，克服了阳性数据收集困难的缺陷。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现基于半监督学习的图片分类方法，其中所述方法包括的步骤分别与执行前述实施方式的基于半监督学习的图片分类方法的步骤一一对应,在此不再赘述。

本申请的计算机可读存储介质，获取待分类的OCT图片；利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；利用所述第一解码器对所述第一特征向量X进行解码处理，得到解码图片；利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y；根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值；若所述相似度值大于预设的相似度阈值，则将所述待分类的OCT图片分类为阴性图片。从而在无需阳性数据的情况下完成OCT图片分类，克服了阳性数据收集困难的缺陷。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种基于半监督学习的图片分类方法，其特征在于，包括：

获取待分类的OCT图片；

2.根据权利要求1所述的基于半监督学习的图片分类方法，其特征在于，所述OCT图片分类模型还包括辨别器，所述辨别器用于辨别所述OCT图片和所述解码图片是否相同，并且所述特征向量生成器与所述辨别器采用相同的样本数据共同训练，所述利用预设的OCT图片分类模型中的特征向量生成器对所述待分类的OCT图片进行处理，得到由所述特征向量生成器的第一个编码器生成的第一特征向量X；其中所述特征向量生成器包括依次连接的第一编码器、第一解码器和第二编码器；所述OCT图片分类模型通过半监督学习的训练方法采用样本数据训练而得，所述样本数据仅由阴性OCT图片构成的步骤之前，包括：

3.根据权利要求2所述的基于半监督学习的图片分类方法，其特征在于，所述计算所述指定阴性OCT图片与所述暂时图片之间的第一图片相似度值的步骤,包括：

4.根据权利要求2所述的基于半监督学习的图片分类方法，其特征在于，所述判断所述第一向量相似度值是否大于预设的向量相似阈值，并且判断所述第一图片相似度值是否大于预设的图片相似阈值的步骤之后，包括：

5.根据权利要求1所述的基于半监督学习的图片分类方法，其特征在于，所述第一编码器和所述第二编码器均包括多个卷积层，所述OCT图片分类模型还包括卷积图像辨别器，所述利用所述第二编码器对所述解码图片进行编码，从而生成第二特征向量Y的步骤之前，包括：

6.根据权利要求1所述的基于半监督学习的图片分类方法，其特征在于，所述根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值的步骤,包括：

根据公式：

判断所述相似度值dis是否大于预设的相似度阈值。

7.根据权利要求1所述的基于半监督学习的图片分类方法，其特征在于，所述根据预设的相似度计算方法，计算所述第一特征向量X和所述第二特征向量Y的相似度值，并判断所述相似度值是否大于预设的相似度阈值的步骤之后，包括：

8.一种基于半监督学习的图片分类装置，其特征在于，包括：

OCT图片获取单元，用于获取待分类的OCT图片；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。