CN113158821A

CN113158821A - 基于多模态的眼部检测数据的处理方法、装置及终端设备

Info

Publication number: CN113158821A
Application number: CN202110336202.3A
Authority: CN
Inventors: 张秀兰; 乔宇; 宋迪屏; 熊健; 李飞; 何军军
Original assignee: Shenzhen Institute of Advanced Technology of CAS; Zhongshan Ophthalmic Center
Current assignee: Shenzhen Institute of Advanced Technology of CAS; Zhongshan Ophthalmic Center
Priority date: 2021-03-29
Filing date: 2021-03-29
Publication date: 2021-07-23
Anticipated expiration: 2041-03-29
Also published as: CN113158821B; WO2022205779A1

Abstract

本申请适用于人工智能技术领域，提供了基于多模态的眼部检测数据的处理方法、装置及终端设备，包括：获取待处理至少两种不同的眼部检测数据；采用与至少两种不同的所述眼部检测数据一一对应的特征提取网络，提取每一种所述眼部检测数据对应的数据特征；将至少两种不同的所述眼部检测数据对应的数据特征进行特征融合，得到融合特征；利用分类器对所述融合特征进行分类，得到至少两种不同的所述眼部检测数据的分类结果。通过上述方法，能够得到更准确的分类结果。

Description

基于多模态的眼部检测数据的处理方法、装置及终端设备

技术领域

本申请属于人工智能技术领域，尤其涉及基于多模态的眼部检测数据的处理方法、装置、终端设备及计算机可读存储介质。

背景技术

深度学习的概念源于人工神经网络的研究，深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分，不同的学习框架下建立的学习模型通常是不同的。例如，若一个卷积神经网络(Convolutional neural networks，CNNs)是通过视盘数据进行训练得到，由于该视盘数据是通过对用户的眼睛的视盘进行检测得到的数据，则上述的CNNs输出的是与视盘检测对应的视盘数据的分类结果，研究人员根据该分类结果以及其他数据能够得到被检测眼睛是青光眼或不是青光眼的结论。其中，上述的CNNs是一种深度的监督学习下的机器学习模型。

由于青光眼的表现很复杂，因此，上述CNNs输出的分类结果的准确性较低，对用户的辅助作用较低，故需要提供一种新的分类结果确定方法。

发明内容

本申请实施例提供了一种基于多模态的眼部检测数据的处理方法，可以解决现有的卷积神经网络对眼部检测数据进行分析处理时，所得到的分类结果的准确性较低的问题。

第一方面，本申请实施例提供了一种基于多模态的眼部检测数据的处理方法，包括：

获取待处理至少两种不同的眼部检测数据；

采用与至少两种不同的所述眼部检测数据一一对应的特征提取网络，提取每一种所述眼部检测数据对应的数据特征；

将至少两种不同的所述眼部检测数据对应的数据特征进行特征融合，得到融合特征；

利用分类器对所述融合特征进行分类，得到至少两种不同的所述眼部检测数据的分类结果。

本申请实施例与现有技术相比存在的有益效果是：

本申请实施例中，采用与至少两种不同的所述眼部检测数据一一对应的特征提取网络，提取每一种所述眼部检测数据对应的数据特征，再将至少两种不同的所述眼部检测数据对应的数据特征进行特征融合，得到融合特征，最后利用分类器对所述融合特征进行分类，得到至少两种不同的所述眼部检测数据的分类结果。由于分类结果是对融合特征进行分类后得到，而融合特征又是对至少两种数据特征进行融合后得到，也即该融合特征包含的信息比单独一个眼部检测数据所包含的细节更多，因此，得到的分类结果也比单纯对一个数据特征进行分类所得到的分类结果更准确。

第二方面，本申请实施例提供了一种基于多模态的眼部检测数据的处理装置，包括：

眼部检测数据获取单元，用于获取待处理至少两种不同的眼部检测数据；

数据特征确定单元，用于采用与至少两种不同的所述眼部检测数据一一对应的特征提取网络，提取每一种所述眼部检测数据对应的数据特征；

融合特征确定单元，用于将至少两种不同的所述眼部检测数据对应的数据特征进行特征融合，得到融合特征；

分类结果确定单元，用于利用分类器对所述融合特征进行分类，得到至少两种不同的所述眼部检测数据的分类结果。

第三方面，本申请实施例提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的方法。

第五方面，本申请实施例提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行上述第一方面中所述的方法。

可以理解的是，上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1是本申请实施例一提供的第一种基于多模态的眼部检测数据的处理方法的流程示意图；

图2是本申请实施例一提供的一种神经卷积网络模型的结构示意图；

图3是本申请实施例一提供的第二种基于多模态的眼部检测数据的处理方法的流程示意图；

图4是本申请实施例一提供的PDPs的一种示意图；

图5是本申请实施例一提供的OCT图数据的一种示意图；

图6是本申请实施例一提供的一种与OCT图数据对应的特征提取网络的结构示意图；

图7是本申请实施例一提供的又一种基于多模态的眼部检测数据的处理方法的流程示意图；

图8是本申请实施例二提供的一种基于多模态的眼部检测数据的处理装置的结构框图；

图9是本申请实施例三提供的终端设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。

实施例一：

现有的卷积神经网络模型通常基于视盘数据进行训练，即基于单一模态的数据进行训练，因此，得到的训练后的卷积神经网络模型所输出的分类结果的准确性较低，对用户的辅助作用也较低，为了解决该技术问题，本申请实施例提供了一种基于多模态的眼部检测数据的处理方法，在该方法中，首先获取待处理至少两种不同的眼部检测数据，再根据预训练的特征提取网络分别提取各个眼部检测数据对应的数据特征，再将提取得到的数据特征进行融合，得到融合特征，再通过预训练的分类器对融合特征进行分类，得到对应的分类结果。由于分类结果是对融合特征进行分类后得到，而融合特征又是对至少两种数据特征进行融合后得到，因此，得到的分类结果比单纯对一个数据特征进行分类所得到的分类结果更准确。

下面结合具体附图对本申请实施例提供的基于多模态的眼部检测数据的处理方法进行示例性说明。

图1示出了本申请实施例提供的第一种基于多模态的眼部检测数据的处理方法的流程图，详述如下：

步骤S11，获取待处理至少两种不同的眼部检测数据。

这里的眼部检测数据是指对用户的眼部进行各种检测后所得到的检测数据。例如，若对用户的眼部进行视野(Visual Field，VF)检测时，将得到对应的VF数据；若对用户的眼部进行视盘检测，则得到对应的视盘数据，该视盘全称为视神经盘，也叫视神经乳头；若对用户的眼部进行眼底检测，则得到对应的眼底彩照数据，等等。

本实施例中，获取的眼部检测数据至少包括两种，比如，获取用户的VF数据和视盘数据作为待处理的两种眼部检测数据。

本实施例中，眼部检测数据可从本地获取，或从云端获取。该待处理的眼部检测数据也可以对原始数据进行处理后所得到的数据，例如，假设原始数据为视野检测报告，则对视野检测报告进行处理后得到VF数据。

步骤S12，采用与至少两种不同的眼部检测数据一一对应的特征提取网络，提取每一种眼部检测数据对应的数据特征。

本实施例中，可将获取到的待处理至少两种不同的眼部检测数据输入预训练的神经卷积网络模型中处理，得到分类结果。参见图2，为本申请实施例提供的一种神经卷积网络模型的结构示意图，该神经卷积网络模型2包括分别与各个眼部检测数据一一对应，用于分别提取对应眼部检测数据的特征提取网络21，即该卷积神经网络模型所包含的特征提取网络的个数与眼部检测数据的种类数相同，该神经卷积网络模型还包括用于得到融合特征的注意力模块22以及用于得到分类结果的分类器23。其中，图2仅示出了2个特征提取网络21，在实际情况中，该特征提取网络21可以包括3个，或其他个数(只需大于或等于2即可)，此处不作限定。

在本实施例中，将眼部检测数据(假设包括VF数据、眼底彩照数据和视盘数据)输入预训练的卷积神经网络模型后，则与VF数据对应的特征提取网络将输出该VF数据对应的数据特征，与眼底彩照数据对应的特征提取网络将输出该眼底彩照数据对应的数据特征，与视盘数据对应的特征提取网络将输出该视盘数据对应的数据特征。

步骤S13，将至少两种不同的眼部检测数据对应的数据特征进行特征融合，得到融合特征。

本实施例中，将至少两个数据特征融合为一个特征，即得到一个融合特征。由于该融合特征为至少两种不同的数据特征进行融合后得到，因此，其得到的细节更多。

步骤S14，利用分类器对融合特征进行分类，得到至少两种不同的眼部检测数据的分类结果。

本实施例中，预训练的卷积神经网络模型的分类器根据输入的各个数据特征输出对应的分类结果，该分类结果为青光眼，或为非青光眼。

本申请实施例中，采用与至少两种不同的眼部检测数据一一对应的特征提取网络，提取每一种眼部检测数据对应的数据特征，再将至少两种不同的眼部检测数据对应的数据特征进行特征融合，得到融合特征，最后利用分类器对融合特征进行分类，得到至少两种不同的眼部检测数据的分类结果。由于分类结果是对融合特征进行分类后得到，而融合特征又是对至少两种数据特征进行融合后得到，也即该融合特征包含的细节比单独一个眼部检测数据所包含的细节更多，因此，得到的分类结果也比单纯对一个数据特征进行分类所得到的分类结果更准确。

图3示出了本申请实施例提供的第二种基于多模态的眼部检测数据的处理方法的流程图，本实施例主要对上述的步骤S13进行细化，步骤

步骤S31，获取待处理至少两种不同的眼部检测数据。

步骤S32，采用与至少两种不同的眼部检测数据一一对应的特征提取网络，提取每一种眼部检测数据对应的数据特征。

步骤S33，根据注意力机制确定各个眼部检测数据对应的数据特征的权值，根据确定的各个权值将各个数据特征进行特征融合，得到融合特征。

具体地，采用注意力机制的注意力模块可包括一个或多个注意力子模块，一个注意力子模块为一层全连接层，或为一层卷积层，即该注意力模块可由多个注意力子模块级联组成。假设注意力模块的网络结构是1层全连接层，输入通道数为C(1维向量)，输出通道数为1(标量)，则将注意力模块的网络输出的标量进行sigmoid函数计算(即将变量映射到0与1之间)后，得到数据特征对应的权值。需要指出的是，上述的“级联”是指多次重复这个计算，如A1-A2为级联结构，A1的输入为数据特征f1和数据特征f2，输出为w1，w2，第二级A2的输入为w1×f1，w2×f2，输出为w3，w4。

本实施例中，级联的多个卷积层的网络结构(例如通道数、卷积核大小、步长、填充(padding)、空洞卷积等)可不同，以通过增加卷积层的层数、学习的参数，来增强得到的融合特征。

本实施例中，不同种类的数据特征对应的权值通常不同，通过这样的设置，能够根据实际情况灵活生成对应的融合特征。

在一些实施例中，确定融合特征所采用的融合方式包括以下一种或多种：加法(平均或加权平均)、按位取最大值、拼接等。

其中，加法的融合方式是指将至少两个不同种类的数据特征按位相加后所得到的特征。例如，假设将VF数据与视盘数据对应的数据特征进行加法融合，VF数据对应的数据特征为VF特征，视盘数据对应的数据特征为光学相干断层扫描(Optical CoherenceTomography，OCT)特征，且该VF特征为1×80(即1行80列)，该OCT特征为1×80，则得到的融合特征也为1×80。假设VF特征和OCT特征所采用的融合方式为平均加法，则s＝(w1×f1+w2×f2)/(w1+w2)，其中，s表示融合特征，w1和w2分别表示f1和f2对应的权值，f1和f2分别代表VF特征和OCT特征。

其中，按位取最大值的融合方式是指按位比较至少两个不同种类的数据特征的特征值，取最大值为输出值。假设待比较的两个不同种类的数据特征均为1*80，则最终得到1*80的融合特征。

其中，拼接是将至少两个不同种类的数据特征连到一起，假设待拼接的两个不同种类的数据特征均为1*80，则得到1*160的融合特征。

需要指出的是，在采用上述融合方式确定融合特征时，还需考虑不同数据特征所对应的权值。

步骤S34，利用分类器对融合特征进行分类，得到至少两种不同的眼部检测数据的分类结果。

本申请实施例中，由于融合特征是根据各个数据特征以及该各个数据特征所对应的权值确定，而不同数据特征对应的权值可能不同，因此，能够灵活调整不同的数据特征在融合特征所占据的比重，进而保证得到的融合特征更准确，而当融合特征更准确时，得到的分类结果也更准确。

在一些实施例中，本申请实施例的眼部检测数据包括：VF数据、眼底彩照数据或视盘数据。即获取的至少两种不同的眼部检测数据可以为：获取VF数据和眼底彩照数据，当然，也可以为：获取VF数据、眼底彩照数据和视盘数据。

在一些实施例中，至少两种不同的眼部检测数据包括VF数据，VF数据为模式偏差概率图(Pattern deviation probability plots，PDPs)数据，获取PDPs数据包括：

从待处理的视野检测报告中提取PDPs数据。

本实施例中，从待处理的视野检测报告所对应的格式为pdf的文件或格式为tif的图像中提取PDPs数据，该PDPs数据作为一种待处理的眼部检测数据。其中，一个待处理的视野检测报告包括可靠性指标、视野指数(VFI、MD和PSD)以及PDPs。上述的MD是与同年龄正常人标准参考视野相比，受检眼光敏感度的平均光敏度偏差，该MD只能用于反映整体的普遍缺损情况，无法辨别局部缺损；PSD反映的是由局部视野缺损引起的视野的不规则性，MD和PSD这两个视野指数只能对视野进行概括性判断，并不用于临床诊断，而是用于随访中跟踪检测的指标；VFI反映受检眼总体的视觉功能，VFI的计算结果表示为百分数，等于100％表示视野没有缺损，只能直观、简单地反映视野损害。对一个视野检测报告进行分析时，最有用的信息是PDPs，在青光眼患者的视野测试报告中，PDPs可以解释局部的视野缺损分布。阅读PDPs，可观察到由青光眼或其他疾病导致的局部敏感度下降区域，突出显示有可能被忽略的微小但有临床意义的病变。与概括性的全局指数(MD、PSD和VFI)相比，PDPs保留了视野分区(位置)信息，能够提供更为详细、全面的视野功能信息，是单次视野检测中对青光眼诊断最为有用的分析。

在一些实施例中，在从待处理的视野检测报告中提取PDPs数据之前，先根据各个视野检测报告中的可靠性指标对视野检测报告进行筛选，仅保留可靠性指标合格的视野检测报告作为待处理的视野检测报告。

在一些实施例中，从待处理的视野检测报告中提取PDPs数据，包括：

A1、将待处理的视野检测报告中的指定位置划分为N*N个区块，并确定各个区块的灰度值，N大于或等于9。

其中，这里的指定位置是指待处理的视野检测报告中显示PDPs的区域位置，上述的N是根据上述区域位置所包含的内容项数确定，这里的内容项数包括图标标识的个数和空白格的个数，通常N取10。其中，上述图标标识的个数即视野检测测试的检测位点个数。

A2、根据各个区块的灰度值以及预设的映射表确定各个区块对应的图标标识，得到PDPs数据，其中，预设的映射表用于存储区块的灰度值与图标标识的对应关系，一个图标标识用于唯一标记PDPs中的一个图标。

其中，图4示出了PDPs的一种示意图，在图4中，模式偏差概率图旁边还显示有4种异常概率图标，图标的颜色越深，表明其对应的概率值P越小，即表示该位点的视野是正常的可能性越小。参考图4，0表示空白格子，1-5分别表示5种概率图标(4种异常+1种正常)。例如图标标识“5”表示P<2％(少于2％的正常人会出现这样低敏感度的视野，也就是说该位点的视野98％是异常的)，图标标识“4”表示P<1％(该位点的视野99％是异常的)，图标标识“3”表示P<0.5％(该位点的视野99.5％是异常的)等等。

需要指出的是，在实际情况中，也可以采用其他信息作为图标标识，此处不作限定。

上述A1和A2中，将从指定位置划分出的各个区块的灰度值分别与预设的映射表存储的灰度值比较，确定出相同的灰度值，进而确定该相同的灰度值所对应的图标标识，各个区块的灰度值所对应的各个图标标识组成PDPs数据，该PDPs数据是二维离散数据，也可以视为灰度图。

在一些实施例中，在得到PDPs数据之后，包括：

对PDPs数据进行第一预处理，第一预处理包括归一化处理。

对应地，上述步骤S12(或步骤S32)包括：采用与PDPs数据对应的特征提取网络，提取经过第一预处理后的PDPs数据对应的数据特征。

其中，上述的归一化处理具体是将各个图标标识映射到0～1区间，例如，假设将0～5这6个图标标识进行归一化处理，得到6个在0～1区间的数值“0,075,0.693,0.8825,0.9107,0.9924”。当然，上述6个在0～1区间的数值仅为一个示例，在实际情况中，也可以映射得到在0～1区间的其他数值，此处不作限定。

本申请实施例中，由于对PDPs数据进行了包括归一化处理的第一预处理，因此，使得特征提取网络对经过第一预处理后的PDPs数据进行数据特征提取时更简单。

在一些实施例中，与PDPs数据对应的特征提取网络包括至少两个卷积层，不同卷积层的参数通常不同，这些参数包括通道数、卷积核大小、步长、padding、空洞卷积等。当特征提取网络的层数越多，学习的参数越多，通过该特征提取网络提取到的数据特征的语义性更强，也更抽象。

在一些实施例中，至少两种不同的眼部检测数据包括视盘数据，视盘数据为通过光学相干断层扫描OCT法对视盘图进行环扫描后得到的OCT图数据，获取OCT图数据之后，包括：

对OCT图数据进行第二预处理，第二预处理包括归一化处理和尺度缩放处理。

其中，第二预处理包括的归一化处理是指对OCT图数据的图像像素值进行归一化处理，具体地：(1)预先统计训练数据集中的各个OCT图数据的均值和方差(2)将待处理的眼部检测数据中的OCT图数据的图像像素值减去统计的均值后，再除以统计的方差。

其中，第二预处理包括的尺度缩放处理是指将OCT图数据的尺寸缩放至指定大小。需要指出的是，训练特征提取网络时所采用的OCT图数据样本的尺寸大小为上述的指定大小，且所采用的OCT图数据样本也经过归一化处理。在一些实施例中，为了提高特征提取网络的泛化性能，则训练特征提取网络时所采用的OCT图数据样本为使用不同的光学相干断层扫描仪器得到的样本。

对应地，上述步骤S12(或步骤S32)包括：采用与OCT图数据对应的特征提取网络，提取经过第二预处理后的OCT图数据对应的数据特征。

上述OCT图数据如图5所示，用户从该OCT图数据能够查看视网膜神经纤维层(Retinal Nerve Fibre Layer，RNFL)的厚度。

本申请实施例中，由于在提取数据特征之前，OCT图数据经过了第二预处理，而第二预处理包括归一化处理和尺度缩放处理，因此，与OCT图数据对应的特征提取网络在进行数据特征提取时，无需关注较大的数据范围以及其他尺寸，从而能够快速地从第二预处理后的OCT图数据中提取到对应的数据特征。

在一些实施例中，与OCT图数据对应的特征提取网络包括至少两个卷积层，且至少两个卷积层采用批处理归一化和实例归一化对从经过第二预处理后的OCT图数据提取出的数据进行处理，得到对应的数据特征。

其中，与OCT图数据对应的特征提取网络包括至少两个卷积层，不同卷积层的参数通常不同，这些参数包括通道数、卷积核大小、步长、padding、空洞卷积等。当特征提取网络的层数越多，学习的参数越多，通过该特征提取网络提取到的数据特征的语义性更强，也更抽象。

如图6所示，假设与OCT图数据对应的特征提取网络包括4个卷积层，在图6中，输入的是64通道的x，Conv表示卷积运算，BN和IN分别表示批处理归一化和实例归一化，1×1表示卷积层的卷积核大小为1×1，3×3表示卷积层的卷积核大小为3×3，

表示加法融合，ReLU表示非线性激活函数。通过图6可以看出，在本申请实施例提供的与OCT图数据对应的特征提取网络将批处理归一化和实例归一化统一在一起，由于对该特征提取网络进行上述设置，因此使得该特征提取网络对来自不同光学相干断层扫描仪器的OCT图数据的通用性良好，从而使得后续的分类器进行分类后，取得了近似的且更准确的分类结果，即增强了整个卷积神经网络模型在跨域(一个域相当于一种光学相干断层扫描仪器所得到的OCT图数据)的学习和归纳能力。

为了更清楚地描述本申请实施例提供的基于多模态的眼部检测数据的处理方法，下面以待处理的眼部检测数据包括VF数据和视盘数据(该视频数据为OCT图数据)进行说明。

参考图7：

步骤S71，获取VF数据，主要获取PDPs数据。

步骤S72，对获取的VF数据进行第一预处理，比如进行归一化处理。

步骤S73，通过VFNet(即VF数据数据对应的特征提取网络)提取经过第一预处理后的VF数据的数据特征。

步骤S74，获取OCT图数据。需要指出的是，该步骤S74可与步骤S71并行执行。

步骤S75，对OCT图数据进行第二预处理。

步骤S76，通过OCTNet(即OCT图数据对应的特征提取网络)提取经过第二预处理后的OCT图数据的数据特征。

步骤S77，通过注意力模块得到提取的两个数据特征的融合特征。

步骤S78，将该融合特征输入分类器后，得到该分类器输出的分类结果，该分类结果为青光眼，或为非青光眼。

经过研究可知，青光眼可以在早期表现为功能或结构损害。通过OCT能够评估RNFL的厚度，即能够评估眼部视神经结构是否损伤。然而，生理性大视杯和/或高度近视眼中的RNFL变异可能与青光眼有相当大的重叠，故单纯依靠OCT难以将青光眼与此类疾病区分开。VF缺损通常和RNFL变薄区域相对应，但是，VF在准确检测视野损害的有效性可能受到测试的主观性，结果的可变性以及与年龄混杂因素的影响。故在本申请中，通过OCT图数据和VF数据确定分类结果。实验证明，将OCT图数据与VF数据结合后，得到的分类结果的准确性高于单纯基于VF数据或OCT图数据所得到的分类结果的准确性。同时，由于在OCTNet中应用实例批量归一化块(Instance-Batch Normalization，IBN-b)技术，因此增强了算法在跨域(不同的OCT设备)的学习和归纳能力，目前的医学检查仪器品牌众多，我们的方法支持包括Topcon及Zeiss、Heidelberg等主流厂商的光学相干断层扫描仪器，在来自不同仪器的检查数据上，得到了近似的分类结果。此外，与仅依赖OCT图数据的模型相比，通过融合VF数据与OCT图数据得以减少对OCT图数据的依赖，这样，在面对来自不同OCT设备的OCT图数据时，该预训练的卷积神经网络模型所具有的鲁棒性更好。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

实施例二：

对应于上文实施例一的基于多模态的眼部检测数据的处理方法，图8示出了本申请实施例提供的一种基于多模态的眼部检测数据的处理装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参照图8，该基于多模态的眼部检测数据的处理装置8包括：眼部检测数据获取单元81、数据特征确定单元82、融合特征确定单元83、分类结果确定单元84。其中：

眼部检测数据获取单元81，用于获取待处理至少两种不同的眼部检测数据。

数据特征确定单元82，用于采用与至少两种不同的眼部检测数据一一对应的特征提取网络，提取每一种眼部检测数据对应的数据特征。

融合特征确定单元83，用于将至少两种不同的眼部检测数据对应的数据特征进行特征融合，得到融合特征。

分类结果确定单元84，用于利用分类器对融合特征进行分类，得到至少两种不同的眼部检测数据的分类结果。

在一些实施例中，所述融合特征确定单元83具体用于：

根据注意力机制确定各个眼部检测数据对应的数据特征的权值，根据确定的各个权值将各个数据特征进行特征融合，得到融合特征。

在一些实施例中，至少两种不同的眼部检测数据包括：VF数据、眼底彩照数据或视盘数据。

在一些实施例中，至少两种不同的眼部检测数据包括VF数据，VF数据为模式偏差概率图PDPs数据，眼部检测数据获取单元81在获取PDPs数据时，具体用于：

从待处理的视野检测报告中提取PDPs数据。

将待处理的视野检测报告中的指定位置划分为N*N个区块，并确定各个区块的灰度值，其中，N大于或等于9；根据各个区块的灰度值以及预设的映射表确定各个区块对应的图标标识，得到PDPs数据，其中，预设的映射表用于存储区块的灰度值与图标标识的对应关系，一个图标标识用于唯一标记PDPs中的一个图标。

在一些实施例中，在得到PDPs数据之后，包括：

对PDPs数据进行第一预处理，第一预处理包括归一化处理。

数据特征确定单元包括：

PDPs数据特征确定模块，用于采用与PDPs数据对应的特征提取网络，提取经过第一预处理后的PDPs数据对应的数据特征。

在一些实施例中，至少两种不同的眼部检测数据包括视盘数据，视盘数据为通过光学相干断层扫描OCT法对视盘图进行环扫描后得到的OCT图数据，在获取OCT图数据之后，包括：

第二预处理单元，用于对OCT图数据进行第二预处理，第二预处理包括归一化处理和尺度缩放处理。

数据特征确定单元包括：

OCT图数据确定模块，用于采用与OCT图数据对应的特征提取网络，提取经过第二预处理后的OCT图数据对应的数据特征。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

实施例三：

图9为本申请一实施例提供的终端设备的结构示意图。如图9所示，该实施例的终端设备9包括：至少一个处理器90(图9中仅示出一个处理器)、存储器91以及存储在所述存储器91中并可在所述至少一个处理器90上运行的计算机程序92，所述处理器90执行所述计算机程序92时实现上述任意各个方法实施例中的步骤：

获取待处理至少两种不同的眼部检测数据；

所述终端设备9可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括，但不仅限于，处理器90、存储器91。本领域技术人员可以理解，图9仅仅是终端设备9的举例，并不构成对终端设备9的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括输入输出设备、网络接入设备等。

所称处理器90可以是中央处理单元(Central Processing Unit，CPU)，该处理器90还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器91在一些实施例中可以是所述终端设备9的内部存储单元，例如终端设备9的硬盘或内存。所述存储器91在另一些实施例中也可以是所述终端设备9的外部存储设备，例如所述终端设备9上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器91还可以既包括所述终端设备9的内部存储单元也包括外部存储设备。所述存储器91用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等，例如所述计算机程序的程序代码等。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供了一种网络设备，该网络设备包括：至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在移动终端上运行时，使得移动终端执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种基于多模态眼部检测数据的处理方法，其特征在于，包括：

获取待处理至少两种不同的眼部检测数据；

2.如权利要求1所述的基于多模态的眼部检测数据的处理方法，其特征在于，所述将至少两种不同的所述眼部检测数据对应的数据特征进行特征融合，得到融合特征，包括：

根据注意力机制确定各个所述眼部检测数据对应的数据特征的权值，根据确定的各个所述权值将各个所述数据特征进行特征融合，得到融合特征。

3.如权利要求1或2所述的基于多模态的眼部检测数据的处理方法，其特征在于，所述至少两种不同的所述眼部检测数据包括：VF数据、眼底彩照数据或视盘数据。

4.如权利要求3所述的基于多模态的眼部检测数据的处理方法，其特征在于，至少两种不同的所述眼部检测数据包括所述VF数据，所述VF数据为模式偏差概率图PDPs数据，获取所述PDPs数据包括：

从待处理的视野检测报告中提取所述PDPs数据。

5.如权利要求4所述的基于多模态的眼部检测数据的处理方法，其特征在于，所述从待处理的视野检测报告中提取所述PDPs数据，包括：

将待处理的视野检测报告中的指定位置划分为N*N个区块，并确定各个所述区块的灰度值，N大于或等于9；

根据各个所述区块的灰度值以及预设的映射表确定各个所述区块对应的图标标识，得到所述PDPs数据，其中，所述预设的映射表用于存储区块的灰度值与图标标识的对应关系，一个所述图标标识用于唯一标记所述PDPs中的一个图标。

6.如权利要求5所述的基于多模态的眼部检测数据的处理方法，其特征在于，在所述得到所述PDPs数据之后，包括：

对所述PDPs数据进行第一预处理，所述第一预处理包括归一化处理；

所述采用与至少两种不同的所述眼部检测数据一一对应的特征提取网络，提取每一种所述眼部检测数据对应的数据特征，包括：采用与所述PDPs数据对应的特征提取网络，提取经过所述第一预处理后的所述PDPs数据对应的数据特征。

7.如权利要求3所述的基于多模态的眼部检测数据的处理方法，其特征在于，至少两种不同的所述眼部检测数据包括所述视盘数据，所述视盘数据为通过光学相干断层扫描OCT对视盘进行环扫描后得到的OCT图数据，在获取所述OCT图数据之后，包括：

对所述OCT图数据进行第二预处理，所述第二预处理包括归一化处理和尺度缩放处理；

所述采用与至少两种不同的所述眼部检测数据一一对应的特征提取网络，提取每一种所述眼部检测数据对应的数据特征，包括：采用与所述OCT图数据对应的所述特征提取网络，提取经过所述第二预处理后的所述OCT图数据对应的数据特征。

8.如权利要求7所述的基于多模态的眼部检测数据的处理方法，其特征在于，所述与所述OCT图数据对应的所述特征提取网络包括至少两个卷积层，且所述至少两个卷积层采用批处理归一化和实例归一化对从经过所述第二预处理后的所述OCT图数据提取出的数据进行处理，得到对应的数据特征。

9.一种基于多模态的眼部检测数据的处理装置，其特征在于，包括：

10.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。

11.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。