CN107516080A

CN107516080A - 视网膜病变影像的眼球定位方法、装置及电子设备

Info

Publication number: CN107516080A
Application number: CN201710723062.9A
Authority: CN
Inventors: 王闾威; 李正龙; 李慧
Original assignee: BOE Technology Group Co Ltd
Current assignee: BOE Technology Group Co Ltd
Priority date: 2017-08-22
Filing date: 2017-08-22
Publication date: 2017-12-26
Also published as: US10772501B2; US20190059719A1

Abstract

本发明公开了一种视网膜病变影像的眼球定位方法、装置及电子设备，包括：获取视网膜病变影像数据；对视网膜病变影像数据进行数据标注，得到标注数据；建立初始深度学习网络；将视网膜病变影像数据输入初始深度学习网络中，输出得到相应的预测数据；利用损失函数对视网膜病变影像数据相应的标注数据和预测数据进行比较，得到比较结果；根据比较结果，调节初始深度学习网络中的参数，直到比较结果达到预设阈值，得到最终的深度学习网络模型；利用深度学习网络模型对待测视网膜病变影像数据进行处理，得到相应的眼球中心坐标以及眼球直径。本发明提出的视网膜病变影像的眼球定位方法、装置及电子设备，能够较为精确地完成视网膜病变影像的眼球定位。

Description

视网膜病变影像的眼球定位方法、装置及电子设备

技术领域

本发明涉及图像处理技术领域，特别是指一种视网膜病变影像的眼球定位方法、装置及电子设备。

背景技术

视网膜病变，又称Rieger中心性视网膜炎、青年性出血性黄斑病变。该病为发生于黄斑部及其周围的弧立的渗出性脉络膜视网膜病灶，伴有视网膜下新生血管及出血。

为了对视网膜病变进行详细观察，通常需要采集视网膜病变影像以供分析。

但是，本发明的发明人在实现本发明的过程中发现，现有技术至少存在以下问题：

目前，视网膜病变影像的质量并不高，使用传统方法定位眼球位置、眼球区域时，常常会受到视网膜病变影像分辨率低、亮度过低、相机光斑干扰等因素影响，导致眼球定位不准。

发明内容

有鉴于此，本发明实施例的目的之一，在于提出一种视网膜病变影像的眼球定位方法、装置及电子设备，能够较为精确地完成视网膜病变影像的眼球定位。

基于上述目的，本发明实施例的第一个方面，提供了一种视网膜病变影像的眼球定位方法，包括：

获取视网膜病变影像数据；

对所述视网膜病变影像数据进行数据标注，得到标注数据；其中，所述标注数据包括标注的眼球中心坐标以及眼球直径；

建立初始深度学习网络；

将所述视网膜病变影像数据输入所述初始深度学习网络中，输出得到相应的预测数据；

利用损失函数对所述视网膜病变影像数据相应的标注数据和预测数据进行比较，得到比较结果；

根据所述比较结果，调节所述初始深度学习网络中的参数，直到所述比较结果达到预设阈值，得到最终的深度学习网络模型；

利用所述深度学习网络模型对待测视网膜病变影像数据进行处理，得到相应的眼球中心坐标以及眼球直径。

可选的，所述视网膜病变影像的眼球定位方法，还包括：

对所述视网膜病变影像数据进行数据预处理，得到预处理后的视网膜病变影像数据；

所述对所述视网膜病变影像数据进行数据标注，得到标注数据，具体包括：

对所述预处理后的视网膜病变影像数据进行数据标注，得到标注数据。

可选的，所述对所述视网膜病变影像数据进行数据预处理，包括：

对所述视网膜病变影像数据进行图像扩充，和/或，

对所述视网膜病变影像数据进行过采样处理。

可选的，所述对所述视网膜病变影像数据进行图像扩充，包括：

采用随机裁剪、旋转、翻转、缩放、调整亮度、调整对比度中的一种或者多种方式进行图像扩充。

可选的，所述对所述视网膜病变影像数据进行数据标注，包括：

采用人工标注的方式进行数据标注，或者采用图像处理与人工筛选相结合的方式进行数据标注。

可选的，所述初始神经网络模型选自Inception-ResNet模型或GoogLeNet v3模型。

可选的，所述损失函数为：

L(u,v)＝∑_i＝{x,y,d}Smooth_L1(u_i，v_i)；

其中，v＝(v_x,v_y,v_d)为所述标注数据，u＝(u_x,u_y,u_d)为所述初始深度学习网络输出所述标注数据相应的预测数据；v_x,v_y分别为标注的眼球中心坐标，v_d为标注的眼球直径；u_x,u_y分别为所述初始深度学习网络输出的眼球中心坐标，u_d为所述初始深度学习网络输出的眼球直径，z为所述预测数据和标注数据的差值。

可选的，所述调节初始深度学习网络中的参数，包括：

对所述初始深度学习网络的学习率和/或冲量进行调节。

本发明实施例的第二个方面，还提供了一种视网膜病变影像的眼球定位装置，包括：

获取模块，用于获取视网膜病变影像数据；

标注模块，用于对所述视网膜病变影像数据进行数据标注，得到标注数据；其中，所述标注数据包括标注的眼球中心坐标以及眼球直径；

模型建立模块，用于建立初始深度学习网络；将所述视网膜病变影像数据输入所述初始深度学习网络中，输出得到相应的预测数据；利用损失函数对所述视网膜病变影像数据相应的标注数据和预测数据进行比较，得到比较结果；根据所述比较结果，调节所述初始深度学习网络中的参数，直到所述比较结果达到预设阈值，得到最终的深度学习网络模型；

眼球定位模块，用于利用所述深度学习网络模型对待测视网膜病变影像数据进行处理，得到相应的眼球中心坐标以及眼球直径。

本发明实施例的第三个方面，还提供了一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上任意一项所述的方法。

从上面所述可以看出，本发明实施例提供的视网膜病变影像的眼球定位方法、装置及电子设备，利用深度学习的方法定位视网膜病变影像中的眼球中心坐标以及眼球直径，从而得知眼球位置与区域，相比传统方法抗干扰能力更强、精度更高，可用于进一步的计算机辅助诊断等任务的预处理工作。

附图说明

图1为本发明提供的视网膜病变影像的眼球定位方法的一个实施例的流程示意图；

图2为本发明提供的视网膜病变影像的眼球定位方法的另一个实施例的流程示意图；

图3为本发明提供的视网膜病变影像的眼球定位方法的实施例中标注后的眼球影像示意图；

图4为本发明提供的视网膜病变影像的眼球定位装置的一个实施例的结构示意图；

图5为本发明提供的电子设备的一个实施例的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

需要说明的是，本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量，可见“第一”“第二”仅为了表述的方便，不应理解为对本发明实施例的限定，后续实施例对此不再一一说明。

本发明实施例的第一个方面，提供了一种视网膜病变影像的眼球定位方法的一个实施例，能够较为精确地完成视网膜病变影像的眼球定位。如图1所示，为本发明提供的视网膜病变影像的眼球定位方法的一个实施例的流程示意图。

所述视网膜病变影像的眼球定位方法，包括：

步骤101：获取视网膜病变影像数据；可选的，为了使最终建立的深度学习网络模型足够精确，这里的视网膜病变影像数据的数量应当尽可能地多；

步骤102：对所述视网膜病变影像数据进行数据标注，得到标注数据；其中，所述标注数据包括标注的眼球中心坐标以及眼球直径；

步骤103：建立初始深度学习网络；可选的，所述初始神经网络模型选自Inception-ResNet模型或GoogLeNet v3模型等最新的CNN(卷积神经网络)模型，或者对这些模型进行适当修改；

步骤104：将所述视网膜病变影像数据输入所述初始深度学习网络中，输出得到相应的预测数据；

步骤105：利用损失函数对所述视网膜病变影像数据相应的标注数据和预测数据进行比较，得到比较结果；

步骤106：根据所述比较结果，调节所述初始深度学习网络中的参数，直到所述比较结果达到预设阈值，得到最终的深度学习网络模型；这里，所述预设阈值根据所述深度学习网络模型所需的准确度来设置，具体取值不限；

步骤107：利用所述深度学习网络模型对待测视网膜病变影像数据进行处理，得到相应的眼球中心坐标以及眼球直径。

从上述实施例可以看出，本发明实施例提供的视网膜病变影像的眼球定位方法，利用深度学习的方法定位视网膜病变影像中的眼球中心坐标以及眼球直径，从而得知眼球位置与区域，相比传统方法抗干扰能力更强、精度更高，可用于进一步的计算机辅助诊断等任务的预处理工作。

本发明实施例还提供了一种视网膜病变影像的眼球定位方法的另一个实施例，能够较为精确地完成视网膜病变影像的眼球定位。如图2所示，为本发明提供的视网膜病变影像的眼球定位方法的另一个实施例的流程示意图。

所述视网膜病变影像的眼球定位方法，包括：

步骤201：获取视网膜病变影像数据；可选的，为了使最终建立的深度学习网络模型足够精确，这里的视网膜病变影像数据的数量应当尽可能地多；

为了避免数据质量、数据不均衡对于训练精度的影响，首先进行数据预处理，因此，步骤202：对所述视网膜病变影像数据进行数据预处理，得到预处理后的视网膜病变影像数据；

可选的，所述数据预处理包括：

对所述视网膜病变影像数据进行图像扩充(Data Augmentation)；可选的，采用随机裁剪、旋转、翻转、缩放、调整亮度、调整对比度中的一种或者多种方式进行图像扩充；

和/或，对所述视网膜病变影像数据进行过采样(Over-Sampling)处理，这样，对于不均衡数据，通过过采样处理倍增少量样本。

步骤203：对所述预处理后的视网膜病变影像数据进行数据标注，得到标注数据；其中，所述标注数据包括标注的眼球中心坐标(v_x，v_y)以及眼球直径v_d；可选的，采用人工标注的方式进行数据标注，或者采用图像处理与人工筛选相结合的方式进行数据标注，如图3所示。

步骤204：建立初始深度学习网络；可选的，可参考Inception-ResNet，GoogLeNetv3等最新的CNN模型进行修改，或自行搭建CNN网络进行训练与预测。

步骤205：将所述视网膜病变影像数据输入所述初始深度学习网络中，输出得到相应的预测数据；在所述初始深度学习网络中输入所述视网膜病变影像数据，所述初始深度学习网络的输出为所述视网膜病变影像数据的预测数据，所述预测数据包括预测的眼球中心坐标(u_x，u_y)及眼球直径u_d。

步骤206：利用损失函数对所述视网膜病变影像数据相应的标注数据和预测数据进行比较，得到比较结果；这样，所述初始深度学习网络自动将预测数据与标注数据做比较，来训练初始深度学习网络的参数。其中，做比较的标准称为损失函数，可选的，眼球的圆形标注区域的所述损失函数为：

L(u,v)＝∑_i＝{x,y,d}Smooth_L1(u_i，v_i)；

步骤207：根据所述比较结果，调节所述初始深度学习网络中的参数，直到所述比较结果达到预设阈值，得到最终的深度学习网络模型；这里，所述预设阈值根据所述深度学习网络模型所需的准确度来设置，具体取值不限；可选的，所述调节初始深度学习网络中的参数，包括：对所述初始深度学习网络的学习率和/或冲量进行调节，这样，反复对学习率、冲量等参数调优，提高模型精度，优化预测准确度。

步骤208：利用所述深度学习网络模型对待测视网膜病变影像数据进行处理，得到相应的眼球中心坐标以及眼球直径。

从上述实施例可以看出，本发明实施例提供的视网膜病变影像的眼球定位方法，利用深度学习的方法定位视网膜病变影像中的眼球中心坐标以及眼球直径，从而得知眼球位置与区域，相比传统方法抗干扰能力更强、精度更高，可用于进一步的计算机辅助诊断等任务的预处理工作；将最终生成的模型用作眼底图像处理的预处理环节应用，可有效确定眼球的位置及大小。

本发明实施例的第二个方面，还提供了一种视网膜病变影像的眼球定位装置的一个实施例，能够较为精确地完成视网膜病变影像的眼球定位。如图4所示，为本发明提供的视网膜病变影像的眼球定位装置的一个实施例的结构示意图。

所述视网膜病变影像的眼球定位装置，包括：

获取模块301，用于获取视网膜病变影像数据；

标注模块302，用于对所述视网膜病变影像数据进行数据标注，得到标注数据；其中，所述标注数据包括标注的眼球中心坐标以及眼球直径；

模型建立模块303，用于建立初始深度学习网络；将所述标注数据输入所述初始深度学习网络中，输出得到相应的预测数据；利用损失函数对所述标注数据和所述相应的预测数据进行比较，得到比较结果；根据所述比较结果，调节所述初始深度学习网络中的参数，直到所述比较结果达到预设阈值，得到最终的深度学习网络模型；

眼球定位模块304，用于利用所述深度学习网络模型对待测视网膜病变影像数据进行处理，得到相应的眼球中心坐标以及眼球直径。

从上述实施例可以看出，本发明实施例提供的视网膜病变影像的眼球定位装置，利用深度学习的方法定位视网膜病变影像中的眼球中心坐标以及眼球直径，从而得知眼球位置与区域，相比传统方法抗干扰能力更强、精度更高，可用于进一步的计算机辅助诊断等任务的预处理工作。

为了避免数据质量、数据不均衡对于训练精度的影响，首先进行数据预处理，可选的，所述视网膜病变影像的眼球定位装置，还包括：

预处理模块305，用于对所述视网膜病变影像数据进行数据预处理，得到预处理后的视网膜病变影像数据；

所述标注模块302，具体用于对所述预处理后的视网膜病变影像数据进行数据标注，得到标注数据。

可选的，所述预处理模块305，具体用于：

对所述视网膜病变影像数据进行图像扩充，和/或，

对所述视网膜病变影像数据进行过采样处理，这样，对于不均衡数据，通过过采样处理倍增少量样本。

可选的，所述标注模块302，具体用于：

可选的，所述损失函数为：

L(u,v)＝∑_i＝{x,y,d}Smooth_L1(u_i,v_i)；

可选的，所述模型建立模块303，还用于：

对所述初始深度学习网络的学习率和/或冲量进行调节，这样，反复对学习率、冲量等参数调优，提高模型精度，优化预测准确度。

本发明实施例的第三个方面，提出了一种执行所述视网膜病变影像的眼球定位方法的电子设备的一个实施例。如图5所示，为本发明提供的执行所述视网膜病变影像的眼球定位方法的电子设备的一个实施例的硬件结构示意图。

如图4所示，所述电子设备，包括：

一个或多个处理器401以及存储器402，图5中以一个处理器401为例。

所述执行所述视网膜病变影像的眼球定位方法的电子设备还可以包括：输入装置403和输出装置404。

处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接，图4中以通过总线连接为例。

存储器402作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的所述视网膜病变影像的眼球定位方法对应的程序指令/模块(例如，附图4所示的获取模块301、预处理模块305、标注模块302、模型建立模块303和眼球定位模块304)。处理器401通过运行存储在存储器402中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的视网膜病变影像的眼球定位方法。

存储器402可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据视网膜病变影像的眼球定位装置的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器402可选包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至会员用户行为监控装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置403可接收输入的数字或字符信息，以及产生与视网膜病变影像的眼球定位装置的用户设置以及功能控制有关的键信号输入。输出装置404可包括显示屏等显示设备。

所述一个或者多个模块存储在所述存储器402中，当被所述一个或者多个处理器401执行时，执行上述任意方法实施例中的视网膜病变影像的眼球定位方法。所述执行所述视网膜病变影像的眼球定位方法的电子设备的实施例，其技术效果与前述任意方法实施例相同或者类似。

本发明实施例还提供了一种非暂态计算机存储介质，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的列表项操作的处理方法。所述非暂态计算机存储介质的实施例，其技术效果与前述任意方法实施例相同或者类似。

最后需要说明的是，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。所述计算机程序的实施例，其技术效果与前述任意方法实施例相同或者类似。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。

另外，为简化说明和讨论，并且为了不会使本发明难以理解，在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本发明难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本发明的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此，这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本发明的具体实施例对本发明进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态RAM(DRAM))可以使用所讨论的实施例。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种视网膜病变影像的眼球定位方法，其特征在于，包括：

获取视网膜病变影像数据；

对所述视网膜病变影像数据进行数据标注，得到标注数据；

建立初始深度学习网络；

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述视网膜病变影像数据进行数据预处理，包括：

对所述视网膜病变影像数据进行图像扩充，和/或，

对所述视网膜病变影像数据进行过采样处理。

4.根据权利要求3所述的方法，其特征在于，所述对所述视网膜病变影像数据进行图像扩充，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述视网膜病变影像数据进行数据标注，包括：

6.根据权利要求1所述的方法，其特征在于，所述初始神经网络模型选自Inception-ResNet模型或GoogLeNet v3模型。

7.根据权利要求1所述的方法，其特征在于，所述损失函数为：

L(u,v)＝∑_i＝{x,y,d}Smooth_L1(u_i,v_i)；

<mrow> <msub> <mi>Smooth</mi> <mrow> <mi>L</mi> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.5</mn> <msup> <mi>z</mi> <mn>2</mn> </msup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>z</mi> <mo><</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>|</mo> <mi>z</mi> <mo>|</mo> <mo>-</mo> <mn>0.5</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>z</mi> <mo>&GreaterEqual;</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

8.根据权利要求1所述的方法，其特征在于，所述调节初始深度学习网络中的参数，包括：

对所述初始深度学习网络的学习率和/或冲量进行调节。

9.一种视网膜病变影像的眼球定位装置，其特征在于，包括：

获取模块，用于获取视网膜病变影像数据；

10.一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1-8任意一项所述的方法。