CN115187547A

CN115187547A - 一种基于增量神经网络的社区居民眼部疾病辅助识别方法

Info

Publication number: CN115187547A
Application number: CN202210806964.XA
Authority: CN
Inventors: 郑毅
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2022-07-09
Filing date: 2022-07-09
Publication date: 2022-10-14

Abstract

本发明公开了一种基于增量神经网络的社区居民眼部疾病辅助识别方法，包括获取多张病变眼底图像，建立眼部疾病信息数据库；根据数据库，对神经网络模型进行训练，得到训练好的初始眼部疾病诊断神经网络模型；对社区居民的眼底图像进行采集；对眼底图像进行预处理后，输入网络模型中进行实时眼部疾病诊断，得到诊断结果；并对结果再次判断。本发明结合蒸馏函数、小批次回放以及动态修正向量实现增量学习，使神经网络模型可针对遇到的新情况不断做出更新于修正，在增量学习的过程中尽量抑制灾难性遗忘问题，同时对动态修正向量方法做出改进，减少不必要的计算，降低了增量计算的计算开销与时间开销，同时提供联合计算的功能以解决灾难性遗忘问题。

Description

一种基于增量神经网络的社区居民眼部疾病辅助识别方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于增量神经网络的社区居民眼部疾病辅助识别方法。

背景技术

现有的眼部疾病辅助诊断系统往往只专注于一种疾病的诊断，且往往采用已经离线训练完成的神经网络模型进行诊断，训练得到的神经网络模型难以随着新情况的出现而不断更新，诊断出错后不能根据错误对模型进行动态修正。

申请号为2021116061039，发明名称为一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法，首先使用具有不同卷积核大小的过滤器从眼底图像中提取特征，并给不同尺度的特征赋予不同的权重；同时融合不同尺度的特征，并使用融合了空间和通道信息的注意力机制对融合后的特征进行权重分配，以实现更高精度的分类结果。该方法应用多尺度卷积神经网络诊断糖尿病性视网膜病变，但将其应用至眼部疾病诊断时，由于样本类别增多，结合了注意力机制的多尺度卷积神经网络在眼部疾病诊断任务上会有参数较多、训练困难的问题，而且该方法为离线训练，难以动态修正模型以适应新变化。

申请号为2019113086075，发明名称为一种基于动态修正向量的图像增量学习方法，该方法以ResNet32为基础，首先引入蒸馏函数进行增量学习，然后构建了动态修正向量以在节约计算开销与系统内存的同时进一步提高精度，同时解决预测结果倾向于样本较多的类别的问题。但该方法的模型骨架ResNet32深度较浅且尺度单一，在训练时会出现精准率较低、特征稀释等问题；代表性记忆方法和动态修正向量方法虽然提高了增量学习任务的识别能力，但无法解决灾难性遗忘问题，且考虑到常见眼部疾病的种类相对并不很多，其流程中的一些计算是没有必要的。

申请号为2020114681780，发明名称为一种基于增量学习的眼底病变图像识别方法和系统，该方法用梯度相加将基础模型参数集合和所述优化增量模型参数集合组合，实现对眼底图像识别机器学习模型的增量优化。该方法利用梯度相加方法，但梯度相加方法本质为对未训练完成的模型进行继续训练，其增量过程计算开销与时间开销相对较大且模型收敛困难、对新数据的数量要求较高。

发明内容

本发明的目的是提高诊断精确率的同时，解决现有的眼部疾病辅助诊断系统难以随新情况不断更新和更新开销大的问题，而提供一种基于增量神经网络的社区居民眼部疾病辅助识别方法。

本发明的具体技术方案如下：

一种基于增量神经网络的社区居民眼部疾病辅助识别方法，包括如下步骤：

步骤1：获取多张病变眼底图像，从图像中获得多种眼部疾病的特征信息与每幅图像对应的类别信息，建立眼部疾病信息数据库；

步骤2：根据步骤1建立的眼部疾病信息数据库，以离线的方式对神经网络模型进行训练，以得到训练好的初始眼部疾病诊断神经网络模型；

步骤3：通过智能眼底摄像机对社区居民的眼底图像进行采集，并将采集的眼底图像传送到电子平台，再由电子平台发送至服务器，服务器将社区居民的眼底图像分别存放到各个社区居民对应的眼部疾病数据记录表中；

步骤4：从每个社区居民的眼部疾病数据记录表中提取最新的眼底图像，对该最新的眼底图像进行预处理后，输入步骤2训练好的初始眼部疾病诊断神经网络模型中进行实时眼部疾病诊断，得到诊断结果，服务器将诊断结果存放到眼部疾病数据记录表中，同时将诊断结果和诊断结果对应的眼部疾病的特征信息，发送至相应的电子平台，以向社区医生展示；

步骤5：当用户被诊断为患有某种眼部疾病后，由社区医生进行人工检查，并将检查结果通过电子平台传送回服务器，服务器判断诊断结果是否正确；如果社区医生认为检查结果错误，则说明眼部疾病诊断神经网络模型诊断不准确，如果社区医生认为检查结果正确，则说明眼部疾病诊断神经网络模型诊断准确；

步骤6：当检查结果错误时，将对应社区居民的眼部疾病数据记录表中保存的最新的诊断结果修改为正确的诊断结果，若眼部疾病信息数据库中存在与正确的诊断结果对应的眼部疾病类别，则将该社区居民最新采集的眼底图像保存至眼部疾病信息数据库中对应的眼部疾病类别中，若眼部疾病信息数据库中不存在与正确的诊断结果对应的眼部疾病类别，则在眼部疾病信息数据库中新增一个与正确的诊断结果对应的眼部疾病类别，并将该社区居民最新采集的眼底图像保存至该类别中；

步骤7：当社区医生在电子平台上选择进行增量式训练后，从眼部疾病信息数据库中提取最新保存的眼底图像及其类别信息，执行增量学习算法，对眼部疾病诊断神经网络模型进行动态修正，得到增量眼部疾病诊断神经网络模型，并将增量眼部疾病诊断神经网络模型的评估结果发送至电子平台向社区医生展示，社区医生可根据评估结果选择是否对模型进行联合训练。

进一步地，若医生选择对模型进行联合训练，则根据眼部疾病信息数据库中所有的眼底图像及其类别信息重新对增量眼部疾病诊断神经网络模型进行训练，再次得到新的初始眼部疾病诊断神经网络模型。

本发明优选地，所述神经网络模型为ResNet-101。

具体地，步骤4中提取最新的眼底图像并输入初始眼部疾病诊断神经网络模型进行训练的具体步骤为：

1)对输入眼底图像数据进行预处理，所述预处理包括去噪、尺寸调整与数据归一化，所述尺寸调整具体指将眼底图像尺寸调整为256×256；去噪算法为高斯去噪算法或小波去噪算法；

2)使用16个3×3的卷积核对经过预处理的眼底图像数据进行卷积操作；

3)使用6个改进的残差学习模块对眼底图像数据进行处理，并将输出数据的尺寸除以2，该步骤中单个改进的残差学习模块中多尺度卷积层的卷积核的总数为n；

4)使用6个改进的残差学习模块对眼底图像数据进行处理，并将输出数据的尺寸除以2，该步骤中单个改进的残差学习模块中多尺度卷积层的卷积核的总数为2n；

5)使用6个改进的残差学习模块对眼底图像数据进行处理，并将输出数据的尺寸除以2，该步骤中单个改进的残差学习模块中多尺度卷积层的卷积核的总数为4n；

6)使用6个所述改进的残差学习模块对眼底图像数据进行处理，并将输出数据的尺寸除以2，该步骤中单个所述改进的残差学习模块中多尺度卷积层的卷积核的总数为8n；

7)使用一个全局平均池化层对经过残差学习的数据进行平均池化操作；

8)使用全连接层将计算得到的特征空间映射到样本标记空间，得到对输入眼底图像数据的诊断结果，全连接层采用Softmax函数。

具体地，步骤3)中所述改进的残差学习模块包含五层，第一层包含多个1×1、3×3、5×5的卷积核，且三类卷积核数目相等，第二层为一个连接层，第三层包含多个1×1、3×3、5×5的卷积核，且三类卷积核数目相等，第四层为一个连接层，第五层包含多个1×1的卷积核。

具体地，采用改进的残差学习模块对眼底图像数据进行处理的步骤如下：

1)规定输入眼底图像数据为d_orign，其尺度为h*h*depth，并令d＝d_origin，即d为输入眼底图像数据d_orign的一个副本数据，步骤2)至步骤4)均为对该副本数据d进行的操作；

2)进行第一步卷积，并对卷积的输出结果在第三维上进行连接操作，然后对连接后的眼底图像数据进行Batch Normalization操作，之后再进行Relu激活，该过程的公式如下：

其中，Relu代表激活函数，BN代表Batch Normalization操作，

代表对所有卷积核的输出进行在第三维上的连接操作，C代表该卷积层的卷积核的集合，zoom代表缩放参数，*代表卷积运算，

代表该卷积层第i个卷积核，该卷积核的尺寸为j×j；

3)进行第二步卷积，该步骤的流程与步骤2)相同；

4)通过第四层的1×1的卷积核对d的特征矩阵进行升维操作，将特征矩阵的深度升至与d_orign相同；

5)求和：d＝d+d_orign；

6)输出d。

具体地，步骤7中对眼部疾病诊断神经网络模型进行动态修正的增量学习算法为：

1)将所述眼部疾病诊断神经网络模型中的全连接层的输出个数修改为原有的眼部疾病总类别数和新增的眼部疾病总类别数的和，所述原有的眼部疾病指在眼部疾病信息数据库中原有的眼底图像对应的眼部疾病，所述新增的眼部疾病为新保存至眼部疾病信息数据库中的眼底图像对应的、不属于原有的眼部疾病的眼部疾病；

2)构建原有的眼部疾病眼底图像数据，如公式：

其中，n_old表示所述原有的眼部疾病眼底图像对应的总类别数,N_origin表示所述原有的眼部疾病样本集的样本总数,x_{i_origin}和y_{i_origin}分别表示所述原有的眼部疾病样本集中的第i_origin个眼底图像及其类别信息；

从原有的眼部疾病眼底图像数据中，按照原有的眼部疾病眼底图像对应的类别选择一定数量的眼部疾病眼底图像，构成筛选后的原有的眼部疾病眼底图像数据：

其中，N_old表示所述筛选后的原有的眼部疾病样本集的样本总数,x_{i_old}和y_{i_old}分别表示所述筛选后的原有的眼部疾病样本集中的第i_old个眼底图像及其类别信息,Sift代表筛选函数，筛选后的原有的眼部疾病眼底图像数据即为进行小批量回放所用数据；

构建新增的眼部疾病的眼底图像数据，如公式：

其中，m_new表示所述新增的眼部疾病的总类别数，M_new表示新增的眼部疾病样本集的样本总数，x_{j_new}和y_{j_new}分别表示新增的眼部疾病样本集中的第j_new个眼底图像及其类别信息；

3)针对原有的眼部疾病，构建蒸馏损失函数，如公式：

其中，T代表温度标量；

为第k个类别在所述初始眼部疾病诊断神经网络模型中的全连接层的Softmax输出，

为第k个类别在所述增量眼部疾病诊断神经网络模型中的全连接层的Softmax输出，

为所有原有的类别在所述初始眼部疾病诊断神经网络模型中的全连接层的Softmax输出之和，

为所有原有的类别在所述增量眼部疾病诊断神经网络模型中的全连接层的Softmax输出之和；

针对新增的眼部疾病，构建交叉熵损失函数，如公式：

其中，δ_y＝k为眼底图像数据被归类为第k个类别的概率；δ_y≠k为眼底图像数据被归类为第k个类别以外类别的概率；p_k(x)为新增的眼部疾病眼底图像数据和原有的眼部疾病眼底图像数据中的第k个类别的输出概率；

将蒸馏损失函数和交叉熵函数加权相加，得到总损失函数，如公式：

Loss＝rLoss_D+(1-r)Loss_CE

其中，r为蒸馏损失函数和交叉熵损失函数之间的调节参数；

4)构建修正向量，对总损失函数作出二次修正，如公式：

其中，x_i、y_i分别表示所述原有的眼部疾病样本集以及所述新增的眼部疾病样本集的并集中第i个眼底图像及其类别信息，v_{n_old+m_new}为本次增量过程的修正向量，v_{n_old}为上次增量过程的修正向量，||v_{n_old}||表示v_{n_old}的二范数，pred(y_i)表示所述眼部疾病诊断神经网络模型对所述原有的眼部疾病样本集以及所述新增的眼部疾病样本集的并集中的第i个眼部疾病眼底图像的预测类别信息。

修正后的损失函数如下式：

5)将所述眼部疾病诊断神经网络模型中的损失函数更新为所述总损失函数，进行小批量回放训练，即利用筛选后的原有的眼部疾病眼底图像数据以及新增的眼部疾病的眼底图像数据作为输入，重新训练所述眼部疾病诊断神经网络模型，更新所述眼部疾病诊断神经网络模型的参数；社区医生根据评估结果选择是否对模型进行联合训练。

具体地，所述增量眼部疾病诊断神经网络模型的评估结果，为以下公式的计算结果：

其中，

β为常数。

优选地，筛选函数采用根据原有的眼部疾病样本集中各眼部疾病类别下所包含的样本数进行按比例随机分层筛选。

本发明的有益效果在于：

本发明通过一种改进的残差学习模块构成的神经网络，对眼底图像做出识别与分类，该改进的残差学习模块增加每层卷积核的数量，扩展了残差神经网络的尺度，减少了训练参数，有效抑制梯度消失与特征稀释问题，提高了精确率，同时使得卷积层可以从多个尺度观察数据，从而获得更为丰富的输入特征。

本发明结合蒸馏函数、小批次回放以及动态修正向量实现增量学习，使神经网络模型可针对遇到的新情况不断做出更新于修正，在增量学习的过程中尽量抑制灾难性遗忘问题，同时对动态修正向量方法做出改进，减少不必要的计算，降低了增量计算的计算开销与时间开销，同时提供联合计算的功能以解决灾难性遗忘问题。

附图说明

图1是本发明的整体框架；

图2是改进的残差学习模块。

具体实施方式

本实施例所述多种眼部疾病包括糖尿病视网膜病变、青光眼、白内障、年龄相关性黄斑变性、高度近视、裂孔性视网膜脱离、后巩膜葡萄肿等；所述眼部疾病的特征信息包括该种疾病的类别信息、该种疾病的症状描述、该种疾病的建议治疗方式、该种疾病的建议处方；每种疾病对应的病变眼底图像应不少于500张。

所述神经网络模型的骨架网络模型为ResNet-101。

步骤3：通过智能眼底摄像机对社区居民的眼底图像进行采集，并将采集的眼底图像传送到电子平台，再由电子平台发送至服务器，电子平台与智能眼底摄像机相连，电子平台与服务器相连，连接方式可以为数据线，或是通过无线网络；服务器将社区居民的眼底图像分别存放到各个社区居民对应的眼部疾病数据记录表中；

步骤4：从每个社区居民的眼部疾病数据记录表中提取最新的眼底图像，对该最新的眼底图像进行预处理后，输入步骤2训练好的初始眼部疾病诊断神经网络模型中进行实时眼部疾病诊断，得到诊断结果，服务器将诊断结果存放到眼部疾病数据记录表中，同时将诊断结果发送至相应的电子平台以向社区医生展示；电子平台在向社区医生展示诊断结果之前，从眼部疾病信息数据库中提取诊断结果对应的眼部疾病的特征信息，并与诊断结果一同向社区医生展示。

从眼部疾病信息数据库中提取最新的眼底图像及其类别信息，对步骤2得到的初始眼部疾病诊断神经网络模型进行训练，其具体步骤为：

8)使用全连接层将计算得到的特征空间映射到样本标记空间，得到对输入眼底图像数据的诊断结果，全连接层采用Softmax函数；

将所述骨架网络中的Bottleneck残差学习模块替换为改进的残差学习模块，该改进的残差学习模块包含五层，第一层包含多个1×1、3×3、5×5的卷积核，且三类卷积核数目相等，第二层为一个连接层，第三层包含多个1×1、3×3、5×5的卷积核，且三类卷积核数目相等，第四层为一个连接层，第五层包含多个1×1的卷积核。

采用改进的残差学习模块对眼底图像数据进行处理的步骤如下：

其中，Relu代表激活函数，BN代表Batch Normalization操作，

代表该卷积层第i个卷积核，该卷积核的尺寸为j×j；

3)进行第二步卷积，该步骤的流程与步骤2)相同；

4)通过第四层的1×1的卷积核对特征矩阵进行升维操作，将特征矩阵的深度升至与d_orign相同；

5)求和：d＝d+d_orign；

6)输出d。

采用改进的残差学习模块对眼底图像数据进行处理的步骤，第一步卷积输入数据的深度与输出数据的深度分别为depth与num×zoom，其中num为单位宽度上卷积核的数量，第二步卷积的输入数据的深度与输出数据的深度分别为3×num×zoom，num×zoom，所述对卷积的输出结果在第三维上进行连接后，输出数据的深度将为所有卷积的输出结果的深度之和。

本实施例取n为2×3×32＝192，即若所述改进的残差学习模块中多尺度卷积层的卷积核的总数为n，则单个所述改进的残差学习模块中每层多尺度卷积层均有3×32个卷积核，每类卷积核各有32个。

新增的与正确的诊断结果对应的眼部疾病类别，其对应的特征信息可通过医生手动输入，也可通过网络获得；

步骤7：当社区医生在电子平台上选择进行增量式训练后，从眼部疾病信息数据库中提取最新保存的眼底图像及其类别信息，执行增量学习算法，对眼部疾病诊断神经网络模型进行动态修正，得到增量眼部疾病诊断神经网络模型，并将增量眼部疾病诊断神经网络模型的评估结果发送至电子平台向社区医生展示，社区医生可根据评估结果选择是否对模型进行联合训练；

对眼部疾病诊断神经网络模型进行动态修正的增量学习算法为：

2)构建原有的眼部疾病眼底图像数据，如以下公式：

筛选函数可采用根据原有的眼部疾病样本集中各眼部疾病类别下所包含的样本数进行按比例随机分层筛选；

构建新增的眼部疾病的眼底图像数据，如以下公式：

其中，m_new表示所述新增的眼部疾病的总类别数，M_new表示新增的眼部疾病样本集的样本总数，x_{j_new}和y_{j_new}分别表示新增的眼部疾病样本集中的第j_new个眼底图像及其类别信息。

3)针对原有的眼部疾病，构建蒸馏损失函数，如以下公式：

其中，T代表温度标量；

针对新增的眼部疾病，构建交叉熵损失函数，如以下公式：

将蒸馏损失函数和交叉熵函数加权相加，得到总损失函数，如以下公式：

Loss＝rLoss_D+(1-r)Loss_CE

其中，r为蒸馏损失函数和交叉熵损失函数之间的调节参数；

4)构建修正向量，对总损失函数作出二次修正，如以下公式：

修正后的损失函数如下式：

5)将所述眼部疾病诊断神经网络模型中的损失函数更新为所述总损失函数，进行小批量回放训练，即利用筛选后的原有的眼部疾病眼底图像数据以及新增的眼部疾病的眼底图像数据作为输入，重新训练所述眼部疾病诊断神经网络模型，更新所述眼部疾病诊断神经网络模型的参数；

社区医生可根据评估结果选择是否对模型进行联合训练，所述增量眼部疾病诊断神经网络模型的评估结果，为以下公式的计算结果：

其中，

β为常数，此处取1，即将P与R视为同等重要。

步骤8：若医生选择对模型进行联合训练，则根据眼部疾病信息数据库中所有的眼底图像及其类别信息重新对增量眼部疾病诊断神经网络模型进行训练，再次得到新的初始眼部疾病诊断神经网络模型。

Claims

1.一种基于增量神经网络的社区居民眼部疾病辅助识别方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于增量神经网络的社区居民眼部疾病辅助识别方法，其特征在于，若医生选择对模型进行联合训练，则根据眼部疾病信息数据库中所有的眼底图像及其类别信息重新对增量眼部疾病诊断神经网络模型进行训练，再次得到新的初始眼部疾病诊断神经网络模型。

3.根据权利要求1所述的一种基于增量神经网络的社区居民眼部疾病辅助识别方法，其特征在于，所述神经网络模型为ResNet-101。

4.根据权利要求3所述的一种基于增量神经网络的社区居民眼部疾病辅助识别方法，其特征在于，步骤4中提取最新的眼底图像并输入初始眼部疾病诊断神经网络模型进行训练的具体步骤为：

5.根据权利要求4所述的一种基于增量神经网络的社区居民眼部疾病辅助识别方法，其特征在于，步骤3)中所述改进的残差学习模块包含五层，第一层包含多个1×1、3×3、5×5的卷积核，且三类卷积核数目相等，第二层为一个连接层，第三层包含多个1×1、3×3、5×5的卷积核，且三类卷积核数目相等，第四层为一个连接层，第五层包含多个1×1的卷积核。

6.根据权利要求5所述的一种基于增量神经网络的社区居民眼部疾病辅助识别方法，其特征在于，采用改进的残差学习模块对眼底图像数据进行处理的步骤如下：