WO2021120587A1

WO2021120587A1 - 基于oct的视网膜分类方法、装置、计算机设备及存储介质

Info

Publication number: WO2021120587A1
Application number: PCT/CN2020/099518
Authority: WO
Inventors: 王关政; 王立龙; 王瑞; 范栋轶; 吕传峰
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-05-29
Filing date: 2020-06-30
Publication date: 2021-06-24
Also published as: CN111783830A

Abstract

一种基于OCT的视网膜分类方法、装置、计算机设备及存储介质，涉及人工智能，所述基于OCT的视网膜分类方法包括：从预设数据库中获取样本数据集，其中，样本数据集由q个训练样本构成，训练样本为GCC参数，q为大于1的正整数（S1）；针对样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型（S2）；从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数（S3）；对待识别的GCC参数进行特征提取，得到y个数据特征, 其中，y为大于1的正整数（S4）；将y个所述数据特征导入到视网膜分类模型中进行分类，输出待识别的GCC参数对应的分类结果（S5）。该方法还涉及区块链技术，所述数据特征可存储于区块链中。该方法可以提高GCC参数归类识别的准确性。

Description

基于OCT的视网膜分类方法、装置、计算机设备及存储介质

本申请要求于2020年5月29日提交中国专利局、申请号为202010475698.8，发明名称为“基于OCT的视网膜分类方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能，尤其涉及一种基于OCT的视网膜分类方法、装置、计算机设备及存储介质。

背景技术

目前，眼科疾病患者的常规检查主要是基于光学相干断层扫描仪(OCT)，该设备可以安全的、非接触的获得检查者的眼底视网膜黄斑区GCC的参数值，

通过对GCC的参数值进行识别归类，有助于医生结合归类对视网膜进行诊断，提高诊断效率及准确性，但发明人意识到传统针对GCC的参数值进行识别归类的方式，主要是通过深度神经网络模型进行识别归类，而深度神经网络模型所提取的特征与医生诊断逻辑之间存在一定差异，导致深度神经网络模型识别归类的准确性不高，从而影响医生诊断的准确性，降低医生的工作效率。

发明内容

本申请实施例提供一种基于OCT的视网膜分类方法、装置、计算机设备及存储介质，以解决传统针对GCC参数进行识别归类的方法准确性不高，影响目标用户诊断的准确性以及降低工作效率的问题。

一种基于OCT的视网膜分类方法，包括：

从预设数据库中获取样本数据集，其中，所述样本数据集由q个训练样本构成，所述训练样本为GCC参数，q为大于1的正整数；

针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

对所述待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数；

将y个所述数据特征导入到所述视网膜分类模型中进行分类，输出所述待识别的GCC参数对应的分类结果。

一种基于OCT的视网膜分类装置，包括：

第一获取模块，用于从预设数据库中获取样本数据集，其中，所述样本数据集由q个训练样本构成，所述训练样本为GCC参数，q为大于1的正整数；

构建模块，用于针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

第二获取模块，用于从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

特征提取模块，用于对所述待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数；

分类模块，用于将y个所述数据特征导入到所述视网膜分类模型中进行分类，输出所述待识别的GCC参数对应的分类结果。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现下述基于OCT的视网膜分类方法的步骤：

一种非易失性的计算机可读存储介质，所述非易失性的计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现上述基于OCT的视网膜分类方法的步骤：

上述基于OCT的视网膜分类方法、装置、计算机设备及存储介质，利用获取到的样本数据集进行决策树构建，得到视网膜分类模型，再获取用户经过OCT扫描得到的待识别的GCC参数，对待识别的GCC参数进行特征提取得到数据特征，最后将数据特征导入到视网膜分类模型中进行分类，得到待识别的GCC参数对应的分类结果。通过利用样本数据集进行决策树构建以得到视网膜分类模型的方式，能够利用与目标用户诊断逻辑相似的数据特征对视网膜分类模型进行训练，提高视网膜分类模型识别分类的准确性，保证分类结果的有效性，从而有利于提高目标用户根据分类结果进行诊断的准确性，进一步提高目标用户的工作效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的基于OCT影像的视网膜分类的流程图；

图2是本申请实施例提供的基于OCT影像的视网膜分类中步骤S2的流程图；

图3是本申请实施例提供的基于OCT影像的视网膜分类中步骤S25的流程图；

图4是本申请实施例提供的基于OCT影像的视网膜分类中步骤S253的流程图；

图5是本申请实施例提供的基于OCT影像的视网膜分类中计算目标基尼指数并进行分裂的流程图；

图6是本申请实施例提供的基于OCT影像的视网膜分类装置的示意图；

图7是本申请实施例提供的计算机设备的基本机构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的基于OCT的视网膜分类方法应用于服务端，服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。在一实施例中，如图1所示，提供一种基于OCT的视网膜分类方法，包括如下步骤：

S1：从预设数据库中获取样本数据集，其中，样本数据集由q个训练样本构成，训练样本为GCC参数，q为大于1的正整数。

在本申请实施例中，通过直接从预设数据库中获取样本数据集，其中，预设数据库是指专门用于存储样本数据集的数据库。

需要说明的是，样本数据集包含q个训练样本，训练样本为GCC参数，每个训练样本有其对应的分类特征，且分类特征主要为用户设定的病种类别。

进一步地，训练样本主要是由OCT设备扫描得到的GCC参数，GCC参数由5个GCC厚度对应的数据特征构成，分别为：All Avg、Sup Avg、Inf Avg、FLV、GLV。

S2：针对样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型。

在本申请实施例中，从样本数据集中随机抽取多个训练样本，具体可以采取随机采样的方式，该随机抽样为有放回的随机抽样，重复在样本数据集中进行K轮抽取，每一轮抽取的结果作为一个子训练集，得到K个子训练集，其中，K个子训练集之间相互独立，子训练集中可以存在重复的训练样本。

需要说明的是，抽取训练样本的数量具体可以根据历史经验进行获取，或者根据具体的业务需要进行抽取合适的训练样本，作为子训练集进行机器模型训练，虽然训练的样本数据越多越准确，但是训练成本也越高而且实现方式越难，其具体数量可以根据实际应用的需要进行抽取，此处不作限制。

进一步地，使用随机森林算法进行决策树构建，针对每一个子训练集构建一棵决策树，得到K棵决策树，再根据生成的K棵决策树构造随机森林，得到视网膜分类模型。

S3：从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数。

具体地，通过直接从预设用户库中获取用户经过OCT设备扫描得到的待识别的GCC参数，且在获取到待识别的GCC参数后，将待识别的GCC参数从预设用户库中进行删除处理。其中，预设用户库是指专门用于存储待识别的GCC参数的数据库。

需要说明的是，待识别的GCC参数包含不同的参数及参数对应的标识信息，标识信息主要为GCC厚度和非GCC厚度。

S4：对待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数。

在本申请实施例中，通过对待识别的GCC参数中参数对应的标识信息进行识别，若识别到标识信息为GCC厚度，则对该标识信息对应的参数进行提取，并将提取到的每个参数作为数据特征，最终提取y个数据特征；若识别到标识信息为非GCC厚度，则不做处理。

需要说明的是，待识别的GCC参数中具体可以包含9个非GCC厚度和5个GCC厚度，其中，5个GCC厚度对应的参数分别为All Avg、Sup Avg、Inf Avg、FLV、GLV。

进一步地，通过5个GCC厚度判断待识别的GCC参数对应的视网膜属于何种类型，也可以结合9个非GCC厚度及5个GCC厚度的结果来判断待识别的GCC对应的视网膜属于何种类型。

需要强调的是，为进一步保证上述数据特征的私密和安全性，上述数据特征还可以存储于一区块链的节点中。

S5：将y个数据特征导入到视网膜分类模型中进行分类，输出待识别的GCC参数对应的分类结果。

具体地，将y个数据特征导入到视网膜分类模型中，视网膜分类模型在接收到数据特征后将对数据特征进行分类，并输出数据特征对应的分类特征作为待识别的GCC参数对应的分类结果。

本实施例中，利用获取到的样本数据集进行决策树构建，得到视网膜分类模型，再获取用户经过OCT扫描得到的待识别的GCC参数，对待识别的GCC参数进行特征提取得到数据特征，最后将数据特征导入到视网膜分类模型中进行分类，得到待识别的GCC参数对应的分类结果。通过利用样本数据集进行决策树构建以得到视网膜分类模型的方式，能够利用与目标用户诊断逻辑相似的数据特征对视网膜分类模型进行训练，提高视网膜分类模型识别分类的准确性，保证分类结果的有效性，从而有利于提高目标用户根据分类结果进行诊断的准确性，进一步提高目标用户的工作效率。

在一实施例中，训练样本包含分类特征，如图2所示，步骤S2中，即针对样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型包括如下步骤：

S21：使用随机抽样的方式从样本数据集中抽取训练样本，构建K个子训练集，其中K为大于1的正整数。

在本申请实施例中，使用随机抽样的方式从样本数据集中抽取训练样本，随机采样的方式可以使用重采样技术从样本数据集中抽取训练样本，重采样技术是在样本数据集中进行有放回的抽样，样本数据集中每个训练样本每次被抽到的概率相等，重复在样本数据集中进行K轮抽取，每一轮抽取的结果作为一个子训练集，得到K个子训练集，其中，子训练集中的训练样本数量小于或等于样本数据集中的训练样本数量。

S22：针对每个子训练集，按照公式(1)计算每个分类特征的信息熵：

H(X)＝-∑p(x _i)log(2,p(x _i)) 公式(1)

其中，X为分类特征，H(X)为分类特征的信息熵，i＝1,2,...,n，x _i为第i个分类特征，p(x _i)为第i个分类特征的特征值概率。

S23：根据信息熵，按照公式(2)计算每个分类特征的信息增益：

gain＝H(c)-H(c|X) 公式(2)

其中，gain为分类特征的信息增益，H(c)为按照分类特征X进行分裂之前的信息熵，H(c|X)为按照分类特征X分裂之后的信息熵。

S24：根据信息增益，按照公式(3)和公式(4)计算每个分类特征的信息增益比：

其中，IntI为分类特征的惩罚因子，D为样本数据集中训练样本的总量，W _X为分类特征的训练样本数量，gr为分类特征的信息增益比。

具体地，通过先利用公式(4)计算出分类特征对应的惩罚因子，再采用公式(3)计算分类特征的信息增益比，即分类特征的信息增益比＝分类特征的信息增益/分类特征的惩罚因子。

S25：选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用分裂节点进行分裂。

在本申请实施例中，使用C4.5算法进行构建决策树，根据公式(4)计算得到分类特征的惩罚因子，使用公式(3)计算每个分类特征的信息增益比，并按照最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用分裂节点进行分裂。

需要说明的是，若按照信息增益作为分裂节点进行分裂，决策树的构建倾向于选择信息增益较大的分类特征作为分裂节点，分类特征的信息增益会比较大，但是对于训练集中存在多个分类特征并且有多种取值的情况下，训练得到的决策树的预测准确率较低，而根据分类特征的惩罚因子计算信息增益比，按照最大的信息增益比对应的分类特征作为分裂节点进行分裂，能够有效的规避分布均匀的属性对决策树分裂产生的不利影响，提高决策树构建的质量。

S26：针对待分裂节点对应的分类特征，返回步骤S22继续执行，直到所有分类特征均作为分裂节点完成分裂为止，得到K棵决策树。

在本申请实施例中，针对待分裂节点对应的分类特征，返回步骤S22提及的针对每个子训练集，计算分类特征的信息熵处继续执行，直到所有分类特征均作为分裂节点完成分裂为止，分裂成决策树的多个分支，以递归方式建立K棵决策树。

S27：根据K棵决策树构造随机森林，得到视网膜分类模型。

具体地，根据步骤S22至步骤S26生成的K棵决策树，将K棵决策树组合成为随机森林，得到视网膜分类模型，用于评估GCC参数对应的视网膜属于何种类型。

本实施例中，通过使用有放回的随机抽样的方式从样本数据集集中抽取训练样本，构建多个子训练集，用于进行机器模型训练，增强用于模型训练的数据的不确定性，提高数据特征分类质量；针对每个子训练集，计算分类特征的信息增益比，每次选取最大的信息增益比对应的分类特征作为分裂节点进行分裂，直到所有分类特征均作为分裂节点完成分裂为止，得到K棵决策树，根据生成的多棵决策树构造随机森林，得到视网膜分类模型，使用最大的信息增益比作为分裂节点，能够有效的规避分布均匀的分类特征对决策树分裂产生的不利影响，提高决策树构建的质量，并且由多棵决策树构造随机森林，使得机器模型的分类预测能力增强，提高视网膜分类模型的准确性，从而有利于提高目标用户根据视网膜分类模型获取分类结果进行诊断的准确性，进一步提高目标用户的工作效率。

在一实施例中，如图3所示，S25中，选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用分裂节点进行分裂包括如下步骤：

S251：选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点。

具体地，选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点。

S252：利用基尼指数公式计算分裂节点的基尼指数。

具体地，利用公式(5)计算分裂节点的基尼指数：

其中，G(p)为基尼指数，e为分裂节点对应的预设分类条件，pk为特定分组中相同输入类别所占的比例。

S253：将基尼指数与预设指数进行比较，并根据比较结果进行分裂。

具体地，将基尼指数与预设指数进行比较，并将比较结果与预设规则库中的描述信息进行比较，选取与描述信息相匹配的设定规则进行分裂。其中，预设规则库是指专门用于存储不同的描述信息及描述信息对应的设定规则的数据库。

例如，存在比较结果为基尼指数小于等于预设指数，预设规则库中存在描述信息为基尼指数小于等于预设指数，其对应的设定规则为A规则；存在描述信息为基尼指数大于预设指数，其对应的设定规则为B规则；通过将比较结果与描述信息进行比较，选取A规则进行分裂。

本实施例中，通过选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，再利用公式(5)计算分裂节点对应的基尼指数，最后将基尼指数与预设指数进行比较，并根据比较结果进行分裂。通过结合基尼指数计算的方式，能够在得到所有决策树的情况下，再一次利用基尼指数进一步对部分决策树进行分裂，提高决策树的精确度，进而提高保证后续视网膜分类模型训练的准确性。

在一实施例中，如图4所示，步骤S253中，即将基尼指数与预设指数进行比较，并根据比较结果确定决策树包括如下步骤：

S2531：将基尼指数与预设指数进行比较。

具体地，将基尼指数与预设指数进行比较。

S2532：若基尼指数小于等于预设指数，则不在进行分裂。

在本申请实施例中，根据步骤S2531的比较方式，若基尼指数小于等于预设指数，则表示该基尼指数对应的分裂节点的分类效果好，不在进行分裂。

S2533：若基尼指数大于预设指数，则利用预设分类条件对分裂节点进行分裂，直到达到预设截止条件为止，停止分裂。

在本申请实施例中，根据步骤S2531的比较方式，若基尼指数大于预设指数，表示该基尼指数对应的分裂节点分类效果差，则利用预设分类条件对该分裂节点进行分裂，直到每个分裂后每个节点对应的基尼指数小于等于预设指数或达到预设分裂次数时，分裂结束。

其中，预设分类条件是指根据用户实际需求设定对样本数据集进行分类的条件。

预设指数具体可以是0.2，也可以根据用户实际需求进行设置，此处不做限制。

预设分裂次数是指用户设定停止分裂节点进行分裂的次数。

例如，存在决策树的某个分裂节点为flv<5则分类为U，否则分类为R。如果有100个训练样本根据该分裂节点被分为U，这100个训练样本的标签都是U，那么pk＝1，基尼指数就为0，说明该节点分类效果很好，那么就确定了flv<5为该决策树的分裂节点。如果有100个样本根据该分裂节点被分为U，但这100个训练样本中只有50个的标签是U，那么pk＝0.5，基尼指数就比较大，说明该分裂节点分类效果很差，则利用预设分类条件对该分裂节点进行分裂。

本实施例中，通过将基尼指数与预设指数进行比较，在基尼指数小于等于预设指数的情况下，不在进行分裂；在基尼指数大于预设指数的情况下，利用预设分类条件对分裂节点进行分类，直到达到预设截止条件为止，停止分裂。在不同的比较结果下确定分裂节点是否需要进一步分裂，能够有效避免存在计算失误导致分裂不准确的情况，从而分裂过程的准确性，进一步保证后续视网膜分类模型训练的准确性。

在一实施例中，如图5所示，S26之后，该基于OCT的视网膜分类还包括如下步骤：

S6：将所有决策树对应的基尼指数按照从小到大的顺序进行排序，得到排序结果。

在本申请实施例中，将所有决策树对应的基尼指数按照从小到大的顺序进行排序，即将最小的基尼指数作为第一位，将最大的基尼指数作为最后一位，得到对应的排序结果。

S7：从排序结果中选取排序前a位和排序后b位的基尼指数分别进行权重计算，得到目标基尼指数，其中a和b均为大于1的正整数。

在本申请实施例中，排序前a位是指在步骤S6得到的排序结果中排序第一至第a，排序后b位是指在步骤S6得到的排序结果中排序最后至倒数第b。

具体地，根据步骤S6得到的排序结果，选取排序前a位的基尼指数作为第一基尼指数，选取排序前a位对应的基尼指数作为第一基尼指数，选取排序后b位对应的基尼指数作为第二基尼指数，根据预设第一权重，对每个第一基尼指数进行加倍计算，并将加倍计算后的结果作为目标基尼指数；根据预设第二权重，对每个第二基尼指数进行减半计算，并将减半计算后的结果作为目标基尼指数。

需要说明的是，将排名前a的基尼指数加倍，排名后b的基尼指数减半，能够提高分类的精度，其中，a和b均为大于1的正整数，且存在a与b相同的情况，其具体取值可根据用户实际需求进行设置，此处不做限制。

当一个基尼指数为排名前a的特征时，计算基尼指数时将计算的基尼指数加倍，也就是基尼指数值乘以预设第一权重，例如，原基尼指数值为1，预设第一权重为2，加倍后基尼指数值为2。也就是说重要特征分类错误的代价更大，需要减少重要特征分类错误的情况。

当一个基尼指数为排名后b的特征时，计算基尼指数时将计算的基尼指数减半，也就是基尼指数值乘以预设第二权重，例如，原基尼指数值为1，预设第二权重为0.5，减半后基尼指数值为0.5。也就是说不重要特征分类错误的代价较小，不需要关注不重要的特征分类错误的情况。

S8：根据目标基尼指数对排序前a位和排序后b位的基尼指数对应的决策树进行分裂，得到分裂后的决策树。

具体地，根据步骤S7得到的目标基尼指数，将目标基尼指数与预设指数进行比较，若目标基尼指数小于等于预设指数，则获取该目标基尼指数对应的决策树；若目标基尼指数大于预设指数，则利用预设分类条件对该目标基尼指数对应的决策树进行分裂，直到每个决策树对应的目标基尼指数小于等于预设指数或达到预设目标分裂次数时，分裂结束，并获取分裂结束后的决策树。

本申请实施例中，将所有决策树对应的基尼指数按照从小到大的顺序进行排序以得到排序结果，并从中选取排序前a位和排序后b位的基尼指数分别进行权重计算，得到目标基尼指数，最后根据目标基尼指数对排序前a位和排序后b位的基尼指数对应的决策树进行分裂，得到分裂后的决策树。通过计算目标基尼指数并利用目标基尼指数对决策树进行分裂的方式，分类特征做进一步优化，增加重要分类特征的分析计算，减少不重要分类特征的分析计算，从而提高决策树的准确率，进一步保证后续视网膜分类模型训练的准确性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种基于OCT影像的视网膜分类装置，该基于OCT影像的视网膜分类装置与上述实施例中基于OCT影像的视网膜分类方法一一对应。如图6所示，该基于OCT影像的视网膜分类装置包括第一获取模块61，构建模块62，第二获取模块63，特征提取模块64和分类模块65。各功能模块详细说明如下：

第一获取模块61，用于从预设数据库中获取样本数据集，其中，样本数据集由q个训练样本构成，训练样本为GCC参数，q为大于1的正整数；

构建模块62，用于针对样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

第二获取模块63，用于从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

特征提取模块64，用于对待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数，需要强调的是，为进一步保证上述数据特征的私密和安全性，上述数据特征还可以存储于一区块链的节点中；

分类模块65，用于将y个数据特征导入到视网膜分类模型中进行分类，输出待识别的GCC参数对应的分类结果。

进一步地，构建模块62包括：

子训练集构建子模块，用于使用随机抽样的方式从样本数据集中抽取训练样本，构建K个子训练集，其中K为大于1的正整数；

信息熵计算子模块，用于针对每个子训练集，按照公式(1)计算每个分类特征的信息熵：

H(X)＝-∑p(x _i)log(2,p(x _i)) 公式(1)

其中，X为分类特征，H(X)为分类特征的信息熵，i＝1,2,...,n，x _i为第i个分类特征，p(x _i)为第i个分类特征的特征值概率；

信息增益计算子模块，用于根据信息熵，按照公式(2)计算每个分类特征的信息增益：

gain＝H(c)-H(c|X) 公式(2)

其中，gain为分类特征的信息增益，H(c)为按照分类特征X进行分裂之前的信息熵，H(c|X)为按照分类特征X分裂之后的信息熵；

信息增益比计算子模块，用于根据信息增益，按照公式(3)和公式(4)计算每个分类特征的信息增益比：

其中，IntI为分类特征的惩罚因子，D为样本数据集中训练样本的总量，W _X为分类特征的训练样本数量，gr为分类特征的信息增益比；

分裂节点选取子模块，用于选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用分裂节点进行分裂；

决策树生成子模块，用于针对待分裂节点对应的分类特征，返回步骤S22继续执行，直到所有分类特征均作为分裂节点完成分裂为止，得到K棵决策树；

视网膜分类模型构建子模块，用于根据K棵决策树构造随机森林，得到视网膜分类模型。

进一步地，分裂节点选取子模块包括：

分裂节点确定单元，用于选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点；

基尼指数计算单元，用于利用基尼指数公式计算分裂节点的基尼指数；

分裂单元，用于将基尼指数与预设指数进行比较，并根据比较结果进行分裂。

进一步地，分裂单元包括：

比较子单元，用于将基尼指数与预设指数进行比较；

第一比较子单元，用于若基尼指数小于等于预设指数，则不在进行分裂；

第二比较子单元，用于若基尼指数大于预设指数，则利用预设分类条件对分裂节点进行分裂，直到达到预设截止条件为止，停止分裂。

进一步地，该基于OCT影像的视网膜分类装置还包括：

排序模块，用于将所有决策树对应的基尼指数按照从小到大的顺序进行排序，得到排序结果；

权重计算模块，用于从排序结果中选取排序前a位和排序后b位的基尼指数分别进行权重计算，得到目标基尼指数，其中a和b均为大于1的正整数；

二次分裂模块，用于根据目标基尼指数对排序前a位和排序后b位的基尼指数对应的决策树进行分裂，得到分裂后的决策树。

本申请的一些实施例公开了计算机设备。具体请参阅图7，为本申请的一实施例中计算机设备90基本结构框图。

如图7中所示意的，所述计算机设备90包括通过系统总线相互通信连接存储器91、处理器92、网络接口93。需要指出的是，图7中仅示出了具有组件91-93的计算机设备90，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器91至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器91可以是所述计算机设备90的内部存储单元，例如该计算机设备90的硬盘或内存。在另一些实施例中，所述存储器91也可以是所述计算机设备90的外部存储设备，例如该计算机设备90上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器91还可以既包括所述计算机设备90的内部存储单元也包括其外部存储设备。本实施例中，所述存储器91通常用于存储安装于所述计算机设备90的操作系统和各类应用软件，例如所述基于OCT影像的视网膜分类方法的程序代码等。此外，所述存储器91还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器92在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器92通常用于控制所述计算机设备90的总体操作。本实施例中，所述处理器92用于运行所述存储器91中存储的程序代码或者处理数据，例如运行所述基于OCT影像的视网膜分类方法的程序代码。

所述网络接口93可包括无线网络接口或有线网络接口，该网络接口93通常用于在所述计算机设备90与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式，即提供一种非易失性的计算机可读存储介质，所述非易失性的计算机可读存储介质存储有数据特征信息录入流程，所述数据特征信息录入流程可被至少一个处理器执行，以使所述至少一个处理器执行上述任意一种基于OCT影像的视网膜分类方法的步骤。

需要强调的是，为进一步保证上述数据特征的私密和安全性，上述数据特征还可以存储于一区块链的节点中

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台计算机设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

最后应说明的是，显然以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

一种基于OCT的视网膜分类方法，其中，所述基于OCT的视网膜分类方法包括：

从预设数据库中获取样本数据集，其中，所述样本数据集由q个训练样本构成，所述训练样本为GCC参数，q为大于1的正整数；

针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

对所述待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数；

将y个所述数据特征导入到所述视网膜分类模型中进行分类，输出所述待识别的GCC参数对应的分类结果。
如权利要求1所述的基于OCT的视网膜分类方法，其中，所述训练样本包含所述分类特征，所述针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型的步骤包括：

使用随机抽样的方式从所述样本数据集中抽取所述训练样本，构建K个子训练集，其中K为大于1的正整数；

针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵：

H(X)＝-Σp(x _i)log(2,p(x _i))

其中，X为所述分类特征，H(X)为所述分类特征的信息熵，i＝1,2,...,n，xi为第i个所述分类特征，p(x _i)为第i个所述分类特征的特征值概率；

根据所述信息熵，按照如下公式计算每个所述分类特征的信息增益：

gain＝H(c)-H(c|X)

其中，gain为所述分类特征的信息增益，H(c)为按照分类特征X进行分裂之前的信息熵，H(c|X)为按照所述分类特征X分裂之后的信息熵；

根据所述信息增益，按照如下公式计算每个所述分类特征的信息增益比：

其中，IntI为分类特征的惩罚因子，D为所述样本数据集中训练样本的总量，W _X为分类特征的训练样本数量，gr为所述分类特征的信息增益比；

选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂；

针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树；

根据所述K棵决策树构造随机森林，得到视网膜分类模型。
如权利要求2所述的基于OCT的视网膜分类方法，其中，所述选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂进行分裂的步骤包括：

选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点；

利用基尼指数公式计算所述分裂节点的基尼指数；

将所述基尼指数与预设指数进行比较，并根据比较结果进行分裂。
如权利要求3所述的基于OCT的视网膜分类方法，其中，所述将所述基尼指数与预设指数进行比较，并根据比较结果确定所述决策树的步骤包括：

将所述基尼指数与预设指数进行比较；

若所述基尼指数小于等于预设指数，则不在进行分裂；

若所述基尼指数大于预设指数，则利用预设分类条件对所述分裂节点进行分裂，直到达到预设截止条件为止，停止分裂。
如权利要求2所述的基于OCT影像的视网膜分类方法，其中，所述针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树的步骤之后，所述基于OCT的视网膜分类方法还包括：

将所有所述决策树对应的基尼指数按照从小到大的顺序进行排序，得到排序结果；

从所述排序结果中选取排序前a位和排序后b位的所述基尼指数分别进行权重计算，得到目标基尼指数，其中a和b均为大于1的正整数；

根据所述目标基尼指数对排序前a位和排序后b位的所述基尼指数对应的决策树进行分裂，得到分裂后的决策树。
一种基于OCT影像的视网膜分类装置，其中，所述基于OCT影像的视网膜分类装置包括：

第一获取模块，用于从预设数据库中获取样本数据集，其中，所述样本数据集由q个训练样本构成，所述训练样本为GCC参数，q为大于1的正整数；

构建模块，用于针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

第二获取模块，用于从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

特征提取模块，用于对所述待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数；

分类模块，用于将y个所述数据特征导入到所述视网膜分类模型中进行分类，输出所述待识别的GCC参数对应的分类结果。
如权利要求6所述的基于OCT影像的视网膜分类装置，其中，所述构建模块包括：

子训练集构建子模块，用于使用随机抽样的方式从所述样本数据集中抽取所述训练样本，构建K个子训练集，其中K为大于1的正整数；

信息熵计算子模块，用于针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵：

H(X)＝-Σp(x _i)log(2,p(x _i))

其中，X为所述分类特征，H(X)为所述分类特征的信息熵，i＝1,2,...,n，x _i为第i个所述分类特征，p(x _i)为第i个所述分类特征的特征值概率；

信息增益计算子模块，用于根据所述信息熵，按照如下公式计算每个所述分类特征的信息增益：

gain＝H(c)-H(c|X)

其中，gain为所述分类特征的信息增益，H(c)为按照分类特征X进行分裂之前的信息熵，H(c|X)为按照所述分类特征X分裂之后的信息熵；

信息增益比计算子模块，用于根据所述信息增益，按照如下公式计算每个所述分类特征的信息增益比：

其中，IntI为分类特征的惩罚因子，D为所述样本数据集中训练样本的总量，W _X为分类特征的训练样本数量，gr为所述分类特征的信息增益比；

分裂节点选取子模块，用于选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂；

决策树生成子模块，用于针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树；

视网膜分类模型构建子模块，用于根据所述K棵决策树构造随机森林，得到视网膜分类模型。
如权利要求7所述的基于OCT影像的视网膜分类装置，其中，所述分裂节点选取子模块包括：

分裂节点确定单元，用于选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点；

基尼指数计算单元，用于利用基尼指数公式计算所述分裂节点的基尼指数；

分裂单元，用于将所述基尼指数与预设指数进行比较，并根据比较结果进行分裂。
如权利要求8所述的基于OCT影像的视网膜分类装置，其中，所述分裂单元包括：

比较子单元，用于将所述基尼指数与预设指数进行比较；

第一比较子单元，用于若所述基尼指数小于等于预设指数，则不在进行分裂；

第二比较子单元，用于若所述基尼指数大于预设指数，则利用预设分类条件对所述分裂节点进行分裂，直到达到预设截止条件为止，停止分裂。
如权利要求7所述的基于OCT影像的视网膜分类装置，其中，还包括：

排序模块，用于将所有所述决策树对应的基尼指数按照从小到大的顺序进行排序，得到排序结果；

权重计算模块，用于从所述排序结果中选取排序前a位和排序后b位的所述基尼指数分别进行权重计算，得到目标基尼指数，其中a和b均为大于1的正整数；

二次分裂模块，用于根据所述目标基尼指数对排序前a位和排序后b位的所述基尼指数对应的决策树进行分裂，得到分裂后的决策树。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其中，所述处理器执行所述计算机可读指令时实现如下步骤：

从预设数据库中获取样本数据集，其中，所述样本数据集由q个训练样本构成，所述训练样本为GCC参数，q为大于1的正整数；

针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

对所述待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数；

将y个所述数据特征导入到所述视网膜分类模型中进行分类，输出所述待识别的GCC参数对应的分类结果。
如权利要求11所述的计算机设备，其中，所述训练样本包含所述分类特征，所述针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型的步骤包括：

使用随机抽样的方式从所述样本数据集中抽取所述训练样本，构建K个子训练集，其中K为大于1的正整数；

针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵：

H(X)＝-Σp(x _i)log(2,p(x _i))

其中，X为所述分类特征，H(X)为所述分类特征的信息熵，i＝1,2,...,n，x _i为第i个所述分类特征，p(x _i)为第i个所述分类特征的特征值概率；

根据所述信息熵，按照如下公式计算每个所述分类特征的信息增益：

gain＝H(c)-H(c|X)

其中，gain为所述分类特征的信息增益，H(c)为按照分类特征X进行分裂之前的信息熵，H(c|X)为按照所述分类特征X分裂之后的信息熵；

根据所述信息增益，按照如下公式计算每个所述分类特征的信息增益比：

其中，IntI为分类特征的惩罚因子，D为所述样本数据集中训练样本的总量，W _X为分类特征的训练样本数量，gr为所述分类特征的信息增益比；

选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂；

针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树；

根据所述K棵决策树构造随机森林，得到视网膜分类模型。
如权利要求12所述的计算机设备，其中，所述选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂进行分裂的步骤包括：

选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点；

利用基尼指数公式计算所述分裂节点的基尼指数；

将所述基尼指数与预设指数进行比较，并根据比较结果进行分裂。
如权利要求13所述的计算机设备，其中，所述将所述基尼指数与预设指数进行比较，并根据比较结果确定所述决策树的步骤包括：

将所述基尼指数与预设指数进行比较；

若所述基尼指数小于等于预设指数，则不在进行分裂；

若所述基尼指数大于预设指数，则利用预设分类条件对所述分裂节点进行分裂，直到达到预设截止条件为止，停止分裂。
如权利要求12所述的计算机设备，其中，所述针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树的步骤之后，所述处理器执行所述计算机可读指令时还包括实现如下步骤：

将所有所述决策树对应的基尼指数按照从小到大的顺序进行排序，得到排序结果；

从所述排序结果中选取排序前a位和排序后b位的所述基尼指数分别进行权重计算，得到目标基尼指数，其中a和b均为大于1的正整数；

根据所述目标基尼指数对排序前a位和排序后b位的所述基尼指数对应的决策树进行分裂，得到分裂后的决策树。
一种非易失性的计算机可读存储介质，所述非易失性的计算机可读存储介质存储有计算机可读指令，其中，所述计算机可读指令被一种处理器执行时使得所述一种处理器执行如下步骤：

从预设数据库中获取样本数据集，其中，所述样本数据集由q个训练样本构成，所述训练样本为GCC参数，q为大于1的正整数；

针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型；

从预设用户库中获取用户经过OCT扫描得到的待识别的GCC参数；

对所述待识别的GCC参数进行特征提取，得到y个数据特征，其中，y为大于1的正整数；

将y个所述数据特征导入到所述视网膜分类模型中进行分类，输出所述待识别的GCC参数对应的分类结果。
如权利要求16所述的非易失性的计算机可读存储介质，其中，所述训练样本包含所述分类特征，所述针对所述样本数据集中的训练样本，使用随机森林算法进行决策树构建，得到视网膜分类模型的步骤包括：

使用随机抽样的方式从所述样本数据集中抽取所述训练样本，构建K个子训练集，其中K为大于1的正整数；

针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵：

H(X)＝-Σp(x _i)log(2,p(x _i))

其中，X为所述分类特征，H(X)为所述分类特征的信息熵，i＝1,2,...,n，x _i为第i个所述分类特征，p(x _i)为第i个所述分类特征的特征值概率；

根据所述信息熵，按照如下公式计算每个所述分类特征的信息增益：

gain＝H(c)-H(c|X)

其中，gain为所述分类特征的信息增益，H(c)为按照分类特征X进行分裂之前的信息熵，H(c|X)为按照所述分类特征X分裂之后的信息熵；

根据所述信息增益，按照如下公式计算每个所述分类特征的信息增益比：

其中，IntI为分类特征的惩罚因子，D为所述样本数据集中训练样本的总量，W _X为分类特征的训练样本数量，gr为所述分类特征的信息增益比；

选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂；

针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树；

根据所述K棵决策树构造随机森林，得到视网膜分类模型。
如权利要求17所述的非易失性的计算机可读存储介质，其中，所述选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点，采用所述分裂节点进行分裂进行分裂的步骤包括：

选取最大的信息增益比对应的分类特征作为分裂节点，将其他信息增益比对应的分类特征作为待分裂节点；

利用基尼指数公式计算所述分裂节点的基尼指数；

将所述基尼指数与预设指数进行比较，并根据比较结果进行分裂。
如权利要求18所述的非易失性的计算机可读存储介质，其中，所述将所述基尼指数与预设指数进行比较，并根据比较结果确定所述决策树的步骤包括：

将所述基尼指数与预设指数进行比较；

若所述基尼指数小于等于预设指数，则不在进行分裂；

若所述基尼指数大于预设指数，则利用预设分类条件对所述分裂节点进行分裂，直到达到预设截止条件为止，停止分裂。
如权利要求17所述的非易失性的计算机可读存储介质，其中，所述针对所述待分裂节点对应的分类特征，返回所述针对每个所述子训练集，按照如下公式计算每个所述分类特征的信息熵的步骤继续执行，直到所有所述分类特征均作为所述分裂节点完成分裂为止，得到K棵决策树的步骤之后，所述计算机可读指令被一种处理器执行时，使得所述一种处理器还执行如下步骤：

将所有所述决策树对应的基尼指数按照从小到大的顺序进行排序，得到排序结果；

从所述排序结果中选取排序前a位和排序后b位的所述基尼指数分别进行权重计算，得到目标基尼指数，其中a和b均为大于1的正整数；

根据所述目标基尼指数对排序前a位和排序后b位的所述基尼指数对应的决策树进行分裂，得到分裂后的决策树。