CN111754481A

CN111754481A - 眼底图像识别方法、装置、设备以及存储介质

Info

Publication number: CN111754481A
Application number: CN202010577537.XA
Authority: CN
Inventors: 刘佳; 杨叶辉; 武秉泓; 杨大陆; 王磊
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2020-10-09
Anticipated expiration: 2040-06-23
Also published as: CN111754481B

Abstract

本申请实施例公开了眼底图像识别方法、装置、设备以及存储介质，涉及人工智能、深度学习和图像识别技术领域。该方法的一具体实施方式包括：获取原始眼底图像的目标感兴趣区域ROI信息；从原始眼底图像中分割眼底血管掩膜；基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；对目标ROI图像进行聚类，得到目标ROI图像的类别。该实施方式在降低眼底血管干扰之后分割目标ROI图像，提高了目标ROI图像的分割准确度，进而提升了对眼底图像的识别精准度。

Description

眼底图像识别方法、装置、设备以及存储介质

技术领域

本申请实施例涉及计算机技术领域，具体涉及人工智能、深度学习和图像识别技术领域，尤其涉及眼底图像识别方法、装置、设备以及存储介质。

背景技术

糖尿病视网膜病变(Diabetic Retinopathy，DR)是指由糖尿病引起视网膜血管壁受损，导致视网膜上出现微血管瘤、硬性渗出物和出血等病灶，使视觉功能下降，是主要致盲疾病之一。DR早期没有显著症状，到了晚期即便发现也难以治疗，因此早发现、及时干预具有重要的临床意义。眼底彩色照相方法价格低廉，对药物不敏感，易于记录和保存，被眼科医师认为是最适合DR筛查的方法。DR眼底图像中的病灶主要包括红病灶(微血管瘤和出血)和黄病灶(硬渗和软渗)。眼底图像病灶自动分割技术是指对眼底图像中常见病灶与正常的眼底组织区分识别，能够精准定位到病灶在眼底图像中的位置，并进行分割。目前，对眼底图像的病灶识别主要是全人工识别，即人工识别病灶，并手动勾勒病灶边界。

发明内容

本申请实施例提出了眼底图像识别方法、装置、设备以及存储介质。

第一方面，本申请实施例提出了一种眼底图像识别方法，包括：获取原始眼底图像的目标感兴趣区域ROI信息；从原始眼底图像中分割眼底血管掩膜；基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；对目标ROI图像进行聚类，得到目标ROI图像的类别。

第二方面，本申请实施例提出了一种眼底图像识别装置，包括：获取模块，被配置成获取原始眼底图像的目标感兴趣区域ROI信息；分割模块，被配置成从原始眼底图像中分割眼底血管掩膜；抠除模块，被配置成基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；映射模块，被配置成将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；聚类模块，被配置成对目标ROI图像进行聚类，得到目标ROI图像的类别。

第三方面，本申请实施例提出了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。

第四方面，本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。

本申请实施例提供的眼底图像识别方法、装置、设备以及存储介质，首先获取原始眼底图像的目标感兴趣区域ROI信息；之后从原始眼底图像中分割眼底血管掩膜；而后基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；然后将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；最后对目标ROI图像进行聚类，得到目标ROI图像的类别，从而提升了对眼底图像的识别精准度。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请可以应用于其中的示例性系统架构；

图2是根据本申请的眼底图像识别方法的一个实施例的流程图；

图3是眼底图像识别的技术方案框架图；

图4是ROI信息获取方法的一个实施例的流程图；

图5是ROI信息获取的网络结构图；

图6是眼底血管分割方法的一个实施例的流程图；

图7是眼底图像修复方法的一个实施例的流程图；

图8是眼底图像修复原理的示意图；

图9是ROI图像预处理方法的一个实施例的流程图；

图10是ROI图像聚类方法的一个实施例的流程图；

图11是根据本申请的眼底图像识别装置的一个实施例的结构示意图；

图12是用来实现本申请实施例的眼底图像识别方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的眼底图像识别方法或眼底图像识别装置的实施例的示例性系统架构100。

如图1所示，系统架构100中可以包括存储设备101、网络102和服务器103。网络102用以在存储设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

存储设备101可以通过网络102与服务器103交互。存储设备101中可以提供原始眼底图像，包括但不限于数据库、用户终端等等。

服务器103可以提供各种服务，例如服务器103可以对从存储设备101获取到的原始眼底图像等数据进行分析等处理，生成处理结果(例如目标ROI图像的类别)。

需要说明的是，服务器103可以是硬件，也可以是软件。当服务器103为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器103为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是，本申请实施例所提供的眼底图像识别方法一般由服务器103执行，相应地，眼底图像识别装置一般设置于服务器103中。

应该理解，图1中的存储设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的存储设备、网络和服务器。在服务器103中存储有原始眼底图像的情况下，系统架构100可以不设置存储设备101和网络102。

继续参考图2，其示出了根据本申请的眼底图像识别方法的一个实施例的流程200。该眼底图像识别方法包括以下步骤：

步骤201，获取原始眼底图像的目标感兴趣区域ROI信息。

在本实施例中，眼底图像识别方法的执行主体(例如图1所示的服务器103)可以获取原始眼底图像的目标ROI(region of interest，感兴趣区域)信息。其中，目标ROI信息可以是原始眼底图像中的目标的边框(boundingbox)信息。当原始眼底图像中的眼底发生病变时，目标可以是病变对应的病灶。例如，当眼底发生糖尿病视网膜病变时，目标可以是红病灶或黄病灶。

其中，目标的边框信息获取方式通常包括以下两种。其一，手工标注目标的边框信息。该方式适用于目标没有进行过边框标注，且没有对目标实现检测的边框级别的目标检测算法，无任何数据积累。其二，借助已训练好的目标检测算法。该方式适用于已有对目标实现较高精度检测的边框级别的目标检测算法。具体地，利用目标检测算法获取目标的边框信息。若目标的边框信息标注不完整，还可以手工补标一些边框信息。手工标注常用的开源工具可以例如是Labelme、精灵标注等。其中，Labelme可以支持对图像进行多边形、矩形、圆、折线、点等形式的标注，可用于目标检测、语义分割、图像分类等任务。精灵标注可以支持对图像进行多边形、折线、矩形框等形式的标注，可用于目标检测任务。此外，利用FasterRCNN(Regions with CNN features，区域卷积神经网络)等深度学习算法，也能够实现目标的边框信息的获取。

步骤202，从原始眼底图像中分割眼底血管掩膜。

在本实施例中，上述执行主体可以从原始眼底图像中分割眼底血管掩膜(mask)。其中，眼底血管掩膜可以是由0和1组成的二进制图像，用于对原始眼底图像中的眼底血管进行像素过滤。具体地，眼底血管区域对应的像素值可以是0，而眼底血管区域外对应的像素值可以是1。

为了便捷地获得眼底血管掩膜，不增加标注数据的工作量，采用无监督的血管分割算法。即基于海森矩阵(Hessian Matrix)的血管增强方法，从原始眼底图像中分割眼底血管掩膜。其中，海森矩阵的特征值能够很好地描述原始眼底图像的眼底血管信息。眼底血管是一个管状结构部分，其高斯二阶导的响应值比较大；眼底背景是一个均匀部分，其高斯二阶导的响应值比较小。因此，眼底血管点处的海森矩阵的两个特征值一大一小，眼底血管交叉点处的海森矩阵的两个特征值都很大，眼底背景点处的海森矩阵的两个特征值都很小。因此，利用海森矩阵的最大特征值可以实现增强眼底血管，基于增强后的眼底血管，使用阈值分割，即可分割出眼底血管掩膜。

步骤203，基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像。

在本实施例中，上述执行主体可以基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像。

通常，将原始眼底图像的每个像素点和眼底血管掩膜的每个对应像素点进行与运算，即可抠除眼底血管。

此外，为了将眼底图像中的眼底血管去除，同时又保持眼底图像整体信息的完整性和连续性，上述执行主体可以将扣除区域作为待修复区域，采用基于块匹配的图像修复算法对抠除眼底图像进行信息补全。其中，基于块匹配的图像修复算法思想是先处理待修复区域边缘上的像素点，然后层层向内推进，直到修复完所有的像素点。

步骤204，将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像。

在本实施例中，上述执行主体可以将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像。

步骤205，对目标ROI图像进行聚类，得到目标ROI图像的类别。

在本实施例中，上述执行主体可以对目标ROI图像进行聚类，得到目标ROI图像的类别。

具体地，首先将目标ROI图像添加到ROI图像集合中；然后利用Kmeans(K均值)等无监督的聚类算法对ROI图像集合进行聚类，得到多个簇；最后对目标ROI图像所属的簇进行形态学及灰度值信息识别，即可确定目标ROI图像的类别。

此外，考虑到图像采集过程中容易受到噪声的影响，导致图像信息不连续。为了降低噪声影响，上述执行主体可以在聚类之前对目标ROI图像进行预处理。其中，预处理可以包括但不限于滤波、增强等等。

可选地，基于目标ROI信息和目标ROI图像的类别，对原始眼底图像进行标注，即可生成标注眼底图像。与现有目标像素级标注方法相比，无需对目标进行逐像素、边界勾勒等标注，能够有效减少标注的难度和时间成本。相比于现有目标像素级标注时间缩短30倍。此外，在标注目标边框的弱标注基础上自动分割目标区域，将大量的目标标注数据转换成像素级标注数据，实现了更高精度、更高层级的标注数据转换，为深度学习实现目标自动分割任务提供大量标注数据，提高算法的鲁棒性和性能，帮助实现对目标面积大小的测量，进而掌握眼底疾病的严重程度和疾病进展。

为了便于理解，图3示出了眼底图像识别的技术方案框架图。如图3所示，眼底图像识别的技术方案框架包括目标ROI信息获取和基于边框的目标弱监督分割算法。

对于眼底图像，目标ROI信息获取具体步骤如下：

步骤301，确定是否已有边框标注。

步骤302，若已有边框标注，直接获取目标的边框信息。

步骤303，若没有边框标注，利用Faster RCNN等检测算法，获取目标的边框信息。

然后，基于边框的目标弱监督分割算法具体步骤如下：

步骤304，血管提取，基于海森矩阵的眼底血管提取。

步骤305，血管去除，基于块匹配的图像修复算法去除血管和填充信息。

步骤306，目标ROI图像获取，边框信息映射和ROI抠除。

步骤307，目标分割，基于Kmeans分割及多信息融合。

本申请实施例提供的眼底图像识别方法，首先获取原始眼底图像的目标感兴趣区域ROI信息；之后从原始眼底图像中分割眼底血管掩膜；而后基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；然后将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；最后对目标ROI图像进行聚类，得到目标ROI图像的类别。在降低眼底血管干扰之后分割目标ROI图像，提高了目标ROI图像的分割准确度，进而提升了对眼底图像的识别精准度。

进一步参考图4，其示出了ROI信息获取方法的一个实施例的流程400。该ROI信息获取方法包括以下步骤：

步骤401，将原始眼底图像输入至卷积神经网络，以及前向传播至共享卷积层，得到特征图。

在本实施例中，ROI信息获取方法的执行主体(例如图1所示的服务器103)可以将原始眼底图像输入至CNN(Recurrent Neural Network，卷积神经网络)，以及前向传播至共享卷积层，得到特征图。

通常，原始眼底图像经过CNN，前向传播至共享卷积层。一方面得到特征图，继续执行步骤402；一方面继续前向传播，继续执行步骤403。其中，卷积神经网络可以例如是VGG(Visual Graphics Generator，目视图像生成器)-16，支持任意大小的原始眼底图像的输入。

步骤402，将特征图输入至区域建议网络，得到区域建议和区域得分，对区域得分进行非极大值抑制，选取区域得分排在前N位的区域建议。

在本实施例中，上述执行主体可以将步骤401得到的特征图输入至RPN(RegionProposal Network，区域建议网络)，特征图经过RPN得到区域建议和区域得分。随后，对区域得分进行非极大值抑制，选取区域得分排在前N位的区域建议。其中，非极大值抑制采用的阈值可以例如是0.5，输出Top-N得分的区域建议，N为正整数，例如是100。

步骤403，将特征图继续前向传播至特有卷积层，得到高维特征图。

在本实施例中，上述执行主体可以将步骤401得到的特征图继续前向传播至特有卷积层，得到高维特征图。

步骤404，将所选取的区域建议和高维特征图输入至ROI池化层，提取所选取的区域建议的特征。

在本实施例中，上述执行主体可以将步骤402所选取的区域建议和步骤403得到的高维特征图输入至ROI池化层，提取所选取的区域建议的特征。

步骤405，将所选取的区域建议的特征输入至全连接层，输出所选取的区域建议的分类得分和回归后的边框。

在本实施例中，上述执行主体可以将步骤404得到的所选取的区域建议的特征输入至全连接层，输出所选取的区域建议的分类得分和回归后的边框。

为了便于理解，图5示出了ROI信息获取的网络结构图。如图5所示，ROI信息获取的网络结构包括Faster RCNN网络结构和RPN网络结构。在Faster RCNN网络结构中，对于任意尺寸的眼底图像501，前向传播至共享卷积层502。一方面得到供RPN输入的特征图503；另一方面继续前向传播至特有卷积层504，得到高维特征图505。在RPN网络结构中，特征图503通过滑窗506后，依次经过卷积层/全连接层507和卷积层/全连接层508，得到区域建议509和区域得分510。在Faster RCNN网络结构中，将高维特征图505和区域建议509输入至ROI池化层511，再经过全连接层512，输出分类得分513和边框回归514。

本申请实施例提供的ROI信息获取方法，基于边框的目标弱监督分割算法，能够克服目标形状差异大、边界模糊难以分割的问题。与无监督的传统分割方法不同，增加了边框的弱监督信息，尽可能低成本、高效地排除目标区域周围的干扰信息，提高算法的精度，进而提高像素级标注数据的质量。

进一步参考图6，其示出了眼底血管分割方法的一个实施例的流程400。该眼底血管分割方法包括以下步骤：

步骤601，计算原始眼底图像上的点的海森矩阵。

在本实施例中，眼底血管分割方法的执行主体(例如图1所示的服务器103)可以计算原始眼底图像上的点的海森矩阵。

假设I(x)代表在坐标x＝[x₁,…x_D]^T处的D维图像，则I(x)在x处尺度为s的海森矩阵H_ij(x,s)可以表示为D×D矩阵：

其中，G(x,s)＝(2πs²)^-D/2exp(x^Tx/2s²)，*代表卷积运算。

步骤602，对原始眼底图像上点的海森矩阵进行特征值分解，得到特征值。

在本实施例中，上述执行主体可以对原始眼底图像上点的海森矩阵进行特征值分解，得到特征值。

对于每个x，通过特征值分解获得特征值λ_i，i＝1,...D。由于原始眼底图像是三维的，因此对于每个x均有特征值λ₁,λ₂,λ₃。

步骤603，基于特征值对原始眼底图像中的眼底血管增强，得到增强眼底图像。

在本实施例中，上述执行主体可以基于特征值对原始眼底图像中的眼底血管增强，得到增强眼底图像。

通过分析海森矩阵的特征值的符号和幅度，可以执行与方向无关，并且基于结构的形状和前景相对于背景亮度的局部图像结构的选择性增强。

其中，眼底血管结构的图像增强效果与它们和周围背景的相对亮度关系密切。一般用于眼底血管结构的增强函数可以重新定义眼底血管结构的亮度(与背景相比较暗或亮)的海森特征值。每个特征值λ_i，i＝1,2,3被重新定义为：

血管系统主要由直血管和弯曲血管、分叉和动脉瘤等血管病变等圆形结构组成。为了同时增强三维中的细长和圆形结构，眼底血管增强函数V_F则应该在下面的海森特征值关系指示函数下进行定义：

1_ER:λ₂≈λ₃∧|λ_2，3|？|λ₁|。

基于海森特征值的眼底血管增强函数V_F，具体定义如下：

其中

参数α和κ分别控制R_A和S测量的灵敏度。该眼底血管增强函数V_F可以同时用于暗背景下的亮结构和亮背景下的暗结构。基于该眼底血管增强函数的多尺度滤波器响应介于0和1之间，理想情况下对于非眼底血管结构为0，而对于眼底血管结构为1。因此，该眼底血管增强函数将对典型眼底血管结构产生最高和最均匀的响应。

步骤604，对增强眼底图像进行阈值分割，得到眼底血管掩膜。

在本实施例中，上述执行主体可以对增强眼底图像进行阈值分割，得到眼底血管掩膜。通常，利用阈值法对增强眼底图像进行分割，即可得到眼底血管掩膜。

本申请实施例提供的眼底血管分割方法，考虑到目标的分割易受到眼底血管的干扰，采用眼底血管掩膜进行血管结构去除，能够在不影响分割算法对目标区域的有效判断前提下降低眼底血管干扰，进而提升目标的分割准确率。

进一步参考图7，其示出了眼底图像修复方法的一个实施例的流程700。该眼底图像修复方法包括以下步骤：

步骤701，选取以抠除区域上的点为中心的邻域。

在本实施例中，眼底图像修复方法的执行主体(例如图1所示的服务器103)可以将抠除区域作为待修复区域。对于待修复区域上的点，上述执行主体可以选取以该点为中心的一个小邻域。

步骤702，由邻域上的点计算抠除区域上的点的新像素值。

在本实施例中，上述执行主体可以由邻域上的点计算抠除区域上的点的新像素值。其中，新的像素值通常是由邻域上的所有点的像素值计算得到的。

步骤703，利用新像素值代替抠除区域上的点的原像素值。

在本实施例中，上述执行主体可以利用新像素值代替抠除区域上的点的原像素值。

为了便于理解，图8示出了眼底图像修复原理的示意图。如图8所示，Ω区域是待修复区域，δΩ是Ω区域的边界。假设p点是需要修复的像素点，以p点为中心选取一个小邻域B(ε)，该邻域中的点的像素值都是已知的。q为B(ε)中的一点，由q点计算p的像素值公式如下：

通常，p点的新像素值可以是用B(ε)中的所有点计算的。而B(ε)中的各个像素点所起的作用通常是不同的，也就引入了权值函数来决定不同像素点对新像素值的影响。具体可采用如下公式：

其中，

是权值函数，是用来限定B(ε)中各个像素点的贡献大小。

本申请实施例提供的眼底图像修复方法，在去除眼底血管之后进行信息补充，能够保持眼底图像整体信息的完整性和连续性，进而提高像素级标注数据的质量。

进一步参考图9，其示出了ROI图像预处理方法的一个实施例的流程900。该ROI图像预处理方法可以包括但不限于以下至少一个步骤：

步骤901，对目标ROI图像进行高斯滤波。

在本实施例中，为了降低噪声影响，ROI图像预处理方法的执行主体(例如图1所示的服务器103)可以对目标ROI图像进行高斯滤波。也就是说，采用高斯(Gaussian)滤波器对目标ROI图像进行去噪。

步骤902，将目标ROI图像内超过预设高度的直方图平均的分布到低端的直方图。

在本实施例中，为了解决噪音放大的问题，上述执行主体可以将目标ROI图像内超过预设高度的直方图平均的分布到低端的直方图。这样可以降低累积分布函数的斜度。阈值设置越高，则对比度越高。

步骤903，采用限制对比度自适应直方图均衡化对目标ROI图像的原始绿色通道信息进行图像增强，将增强绿色通道信息和原始绿色通道信息进行重组。

在本实施例中，上述执行主体可以采用CLAHE(Contrast Limited Adaptivehistgram equalization，限制对比度自适应直方图均衡化)对目标ROI图像的原始绿色通道信息进行图像增强，以及将增强绿色通道信息和原始绿色通道信息进行重组。

由于原始眼底图像在采集过程中，原始红色通道和原始蓝色通道的信息易受到采集光照的影响造成信息分布不均匀，因此对原始绿色通道信息Green_ori，采用CLAHE的方法进行图像增强，得到增强绿色通道信息Green_enhanced。同时，为了避免其他通道信息噪声较大的影响，将增强绿通道信息及原始绿通道信息进行重组，作为ROI_pre，具体的步骤见如下伪代码：

ROI_gau＝Gaussian_Blur(ROI)

Red_ori，Green_ori，Blue_ori＝Split(ROI_gau)

Green_enhanced＝CLAHE(Green_ori)

ROI_pre＝Merge(Green_ori，Green_ori，Green_enhanced)

其中，第一行伪代码是高斯滤波步骤，第二行伪代码是通道分离步骤，第三行伪代码是图像增强步骤，第四行伪代码是通道重组步骤。

本申请实施例提供的ROI图像预处理方法，考虑到图像采集过程中易受到噪声的影响，导致图像信息不连续。在聚类之前对目标ROI图像进行预处理，能够降低噪声影响。

进一步参考图10，其示出了ROI图像聚类方法的一个实施例的流程1000。该ROI图像聚类方法包括以下步骤：

步骤1001，利用K均值聚类算法对目标ROI图像进行聚类，得到目标ROI图像所属的簇。

在本实施例中，ROI图像聚类方法的执行主体(例如图1所示的服务器103)可以利用Kmeans聚类算法对目标ROI图像进行聚类，得到目标ROI图像所属的簇。

采用无监督的Kmeans聚类算法，对目标ROI图像进行聚类。例如，设置簇数为4(通过手肘法确定的最优K值)，迭代条件为达到指定的精度(设为0.5)或在指定的迭代次数(设为5)之后停止迭代。重复试验Kmeans聚类算法次数设为5，初始中心设为随机型。

步骤1002，对目标ROI图像所属的簇进行形态学及灰度值信息识别，确定目标ROI图像的类别。

在本实施例中，上述执行主体可以对目标ROI图像所属的簇进行形态学及灰度值信息识别，确定目标ROI图像的类别。

由于Kmeans是一种无监督的聚类算法，因此需要对经过聚类后的每个簇进行分析达到目标的自动识别。将聚类的每个簇的掩膜进行可视化，通过观察可发现，红病灶类别的连通区域与其他类别的连通区域相比，具有如下特点：

1、红病灶连通区域中心更靠近整个目标ROI图像的中心；

2、红病灶连通区域的整体灰度值较其他类别更低；

3、红病灶连通区域的轮廓更规则，致密性(CI)更高。

其中，致密性可以通过如下公式计算：

其中，A为面积，p为周长。当A为肿瘤区域的面积时，P为肿瘤轮廓的周长。通过定义可知，圆被定义为最紧凑的二维形状，因此圆的紧凑性系数为零。较高的紧凑性指数值通常意味着由于凹陷或针状突起而引起的可疑区域为恶性肿瘤。

根据这些特点，建立一个基于融合形态学及灰度值信息的识别方法，具体参见下面伪代码：

Sorted_dis＝Sort(Distance_center(k)),

Sorted_ci＝Sort(1-CI_center(k))

New_value(k)＝Gray_Mean(k)*((Sorted_dis(k)+1)/10))*((Sorted_ci(k)+1)/10))

Class_obj_red＝Index.Min(New_value(k))

Class_obj_yellow＝Index.Max(New_value(k))

k＝0,1,2,3；

其中，第一行伪代码是中心计算步骤，第二行伪代码是紧致度计算步骤，第三行伪代码是灰度值计算步骤，第四行伪代码是聚类得到的红病灶类别，第五行伪代码是聚类得到的黄病灶类别。

通过上式，即可获得聚类的每个簇的病灶类别(Class_obj_red，Class_obj_yellow)。将该类别对应的眼底血管掩膜ROI_mask_final映射到抠除眼底图像中，具体参见下面伪代码：

Mask_ori＝Zeros(Ori_img.shape[0],Ori_img.shape[1])

Mask_ori[bbox[1]:bbox[1]+bbox[3],bbox[0]:bbox[0]+bbox[2]]＝ROI_mask_final

本申请实施例提供的ROI图像聚类方法，采用无监督Kmeans的分割算法，同时考虑到Kmeans是一种无监督的分割方法无法自动识别目标类别，又进一步利用灰度、形态学等信息，实现病灶类别的自动识别，能够快速获取目标的像素标注信息。

进一步参考图11，作为对上述各图所示方法的实现，本申请提供了一种眼底图像识别装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图10所示，本实施例的眼底图像识别装置1000可以包括：获取模块1101、分割模块1102、抠除模块1103、映射模块1104和聚类模块1105。其中，获取模块1101，被配置成获取原始眼底图像的目标感兴趣区域ROI信息；分割模块1102，被配置成从原始眼底图像中分割眼底血管掩膜；抠除模块1103，被配置成基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；映射模块1104，被配置成将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；聚类模块1105，被配置成对目标ROI图像进行聚类，得到目标ROI图像的类别。

在本实施例中，眼底图像识别装置1100中：获取模块1101、分割模块1102、抠除模块1103、映射模块1104和聚类模块1105的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-205的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，获取模块1101进一步被配置成：将原始眼底图像输入至卷积神经网络，以及前向传播至共享卷积层，得到特征图；将特征图输入至区域建议网络，得到区域建议和区域得分，对区域得分进行非极大值抑制，选取区域得分排在前N位的区域建议，其中，N为正整数；将特征图继续前向传播至特有卷积层，得到高维特征图；将所选取的区域建议和高维特征图输入至ROI池化层，提取所选取的区域建议的特征；将所选取的区域建议的特征输入至全连接层，输出所选取的区域建议的分类得分和回归后的边框。

在本实施例的一些可选的实现方式中，分割模块1102进一步被配置成：计算原始眼底图像上的点的海森矩阵；对原始眼底图像上点的海森矩阵进行特征值分解，得到特征值；基于特征值对原始眼底图像中的眼底血管增强，得到增强眼底图像；对增强眼底图像进行阈值分割，得到眼底血管掩膜。

在本实施例的一些可选的实现方式中，眼底图像识别装置1100还包括：修复模块(图中未示出)，被配置成对抠除眼底图像中的抠除区域进行信息修复。

在本实施例的一些可选的实现方式中，修复模块进一步被配置成：选取以抠除区域上的点为中心的邻域；由邻域上的点计算抠除区域上的点的新像素值；利用新像素值代替抠除区域上的点的原像素值。

在本实施例的一些可选的实现方式中，眼底图像识别装置1100还包括：预处理模块(图中未示出)，被配置成对目标ROI图像进行预处理。

在本实施例的一些可选的实现方式中，预处理模块进一步被配置成执行以下至少一项操作：对目标ROI图像进行高斯滤波；将目标ROI图像内超过预设高度的直方图平均的分布到低端的直方图；采用限制对比度自适应直方图均衡化对目标ROI图像的原始绿色通道信息进行图像增强，将增强绿色通道信息和原始绿色通道信息进行重组。

在本实施例的一些可选的实现方式中，聚类模块1105进一步被配置成：利用K均值聚类算法对目标ROI图像进行聚类，得到目标ROI图像所属的簇；对目标ROI图像所属的簇进行形态学及灰度值信息识别，确定目标ROI图像的类别。

在本实施例的一些可选的实现方式中，眼底图像识别装置1000还包括：标注模块(图中未示出)，被配置成基于目标ROI信息和目标ROI图像的类别，对原始眼底图像进行标注，生成标注眼底图像。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图12所示，是根据本申请实施例眼底图像识别方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图12所示，该电子设备包括：一个或多个处理器1201、存储器1202，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器1201为例。

存储器1202即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的眼底图像识别方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的眼底图像识别方法。

存储器1202作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的眼底图像识别方法对应的程序指令/模块(例如，附图11所示的获取模块1101、分割模块1102、抠除模块1103、映射模块1104和聚类模块1105)。处理器1201通过运行存储在存储器1202中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的眼底图像识别方法。

存储器1202可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据眼底图像识别方法的电子设备的使用所创建的数据等。此外，存储器1202可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1202可选包括相对于处理器1201远程设置的存储器，这些远程存储器可以通过网络连接至眼底图像识别方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

眼底图像识别方法的电子设备还可以包括：输入装置1203和输出装置1204。处理器1201、存储器1202、输入装置1203和输出装置1204可以通过总线或者其他方式连接，图12中以通过总线连接为例。

输入装置1203可接收输入的数字或字符信息，以及产生与眼底图像识别方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1204可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请的技术方案，首先获取原始眼底图像的目标感兴趣区域ROI信息；之后从原始眼底图像中分割眼底血管掩膜；而后基于眼底血管掩膜，从原始眼底图像中抠除眼底血管，得到抠除眼底图像；然后将目标ROI信息映射到抠除眼底图像中，得到目标ROI图像；最后对目标ROI图像进行聚类，得到目标ROI图像的类别，在降低眼底血管干扰之后分割目标ROI图像，提高了目标ROI图像的分割准确度，进而提升了对眼底图像的识别精准度。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种眼底图像识别方法，包括：

获取原始眼底图像的目标感兴趣区域ROI信息；

从所述原始眼底图像中分割眼底血管掩膜；

基于所述眼底血管掩膜，从所述原始眼底图像中抠除眼底血管，得到抠除眼底图像；

将所述目标ROI信息映射到所述抠除眼底图像中，得到目标ROI图像；

对所述目标ROI图像进行聚类，得到所述目标ROI图像的类别。

2.根据权利要求1所述的方法，其中，所述获取原始眼底图像的目标感兴趣区域ROI信息，包括：

将所述原始眼底图像输入至卷积神经网络，以及前向传播至共享卷积层，得到特征图；

将所述特征图输入至区域建议网络，得到区域建议和区域得分，对所述区域得分进行非极大值抑制，选取区域得分排在前N位的区域建议，其中，N为正整数；

将所述特征图继续前向传播至特有卷积层，得到高维特征图；

将所选取的区域建议和所述高维特征图输入至ROI池化层，提取所选取的区域建议的特征；

将所选取的区域建议的特征输入至全连接层，输出所选取的区域建议的分类得分和回归后的边框。

3.根据权利要求1所述的方法，其中，所述从所述原始眼底图像中分割眼底血管掩膜，包括：

计算所述原始眼底图像上的点的海森矩阵；

对所述原始眼底图像上点的海森矩阵进行特征值分解，得到特征值；

基于所述特征值对所述原始眼底图像中的眼底血管增强，得到增强眼底图像；

对所述增强眼底图像进行阈值分割，得到所述眼底血管掩膜。

4.根据权利要求1所述的方法，其中，在所述基于所述眼底血管掩膜，从所述原始眼底图像中抠除眼底血管，得到抠除眼底图像之后，还包括：

对所述抠除眼底图像中的抠除区域进行信息修复。

5.根据权利要求4所述的方法，其中，所述对所述抠除眼底图像中的抠除区域进行信息修复，包括：

选取以所述抠除区域上的点为中心的邻域；

由所述邻域上的点计算所述抠除区域上的点的新像素值；

利用所述新像素值代替所述抠除区域上的点的原像素值。

6.根据权利要求1所述的方法，其中，在所述将所述目标ROI信息映射到所述抠除眼底图像中，得到目标ROI图像之后，还包括：

对所述目标ROI图像进行预处理。

7.根据权利要求6所述的方法，其中，所述对所述目标ROI图像进行预处理，包括以下至少一项：

对所述目标ROI图像进行高斯滤波；

将所述目标ROI图像内超过预设高度的直方图平均的分布到低端的直方图；

采用限制对比度自适应直方图均衡化对所述目标ROI图像的原始绿色通道信息进行图像增强，将增强绿色通道信息和所述原始绿色通道信息进行重组。

8.根据权利要求1所述的方法，其中，所述对所述目标ROI图像进行聚类，得到所述目标ROI图像的类别，包括：

利用K均值聚类算法对所述目标ROI图像进行聚类，得到所述目标ROI图像所属的簇；

对所述目标ROI图像所属的簇进行形态学及灰度值信息识别，确定所述目标ROI图像的类别。

9.根据权利要求1-8之一所述的方法，其中，所述方法还包括：

基于所述目标ROI信息和所述目标ROI图像的类别，对所述原始眼底图像进行标注，生成标注眼底图像。

10.一种眼底图像识别装置，包括：

获取模块，被配置成获取原始眼底图像的目标感兴趣区域ROI信息；

分割模块，被配置成从所述原始眼底图像中分割眼底血管掩膜；

抠除模块，被配置成基于所述眼底血管掩膜，从所述原始眼底图像中抠除眼底血管，得到抠除眼底图像；

映射模块，被配置成将所述目标ROI信息映射到所述抠除眼底图像中，得到目标ROI图像；

聚类模块，被配置成对所述目标ROI图像进行聚类，得到所述目标ROI图像的类别。

11.根据权利要求10所述的装置，其中，所述获取模块进一步被配置成：

12.根据权利要求10所述的装置，其中，所述分割模块进一步被配置成：

计算所述原始眼底图像上的点的海森矩阵；

13.根据权利要求10所述的装置，其中，所述装置还包括：

修复模块，被配置成对所述抠除眼底图像中的抠除区域进行信息修复。

14.根据权利要求13所述的装置，其中，所述修复模块进一步被配置成：

选取以所述抠除区域上的点为中心的邻域；

由所述邻域上的点计算所述抠除区域上的点的新像素值；

利用所述新像素值代替所述抠除区域上的点的原像素值。

15.根据权利要求10所述的装置，其中，所述装置还包括：

预处理模块，被配置成对所述目标ROI图像进行预处理。

16.根据权利要求15所述的装置，其中，所述预处理模块进一步被配置成执行以下至少一项操作：

对所述目标ROI图像进行高斯滤波；

17.根据权利要求10所述的装置，其中，所述聚类模块进一步被配置成：

18.根据权利要求10-17之一所述的装置，其中，所述装置还包括：

标注模块，被配置成基于所述目标ROI信息和所述目标ROI图像的类别，对所述原始眼底图像进行标注，生成标注眼底图像。

19.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。