CN113066544B

CN113066544B - 基于CAA-Net与LightGBM的FVEP特征点检测方法

Info

Publication number: CN113066544B
Application number: CN202110434370.6A
Authority: CN
Inventors: 陈娟娟; 谢辛; 汪成亮
Original assignee: Chongqing Normal University
Current assignee: Chongqing Normal University
Priority date: 2021-04-22
Filing date: 2021-04-22
Publication date: 2022-04-15
Anticipated expiration: 2041-04-22
Also published as: CN113066544A

Abstract

本发明提出了一种基于CAA‑Net与LightGBM的FVEP特征点检测方法，包括以下步骤：S1，数据预处理：对FVEP信号进行标准化，作为神经网络模型的输入；S2，特征点序列生成：S2‑1，经过CAA‑Net模型选出可能为特征点的位置坐标，对可能性小的待选特征点进行过滤；S2‑2，待选特征点序列生成：如果待选特征点集合中的点不是极值点，则在待选特征点集合中的特征点距离小于2的范围进行寻找，若找不到极值点，则舍去该点，若找到极值点，则以其替代待选特征点；然后，根据穷举法生成初步的待选特征点序列集合；S3，特征点序列选择，得到最优特征点序列。本发明能快速有效的得到FVEP波形特征点，从而对病人的病情进行临床分析。

Description

基于CAA-Net与LightGBM的FVEP特征点检测方法

技术领域

本发明涉及于医疗数据检测领域，尤其涉及一种基于CAA-Net与LightGBM的FVEP特征点检测方法。

背景技术

FVEP波形特征点是一个对于临床医生判断病情很重要的依据；但由于病人配合较差，且FVEP波形的个体间差异大，个体内变异大等原因，导致临床分析解释困难。所以研究FVEP波形特征点是一个亟待解决的重要课题。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于CAA-Net与LightGBM的FVEP特征点检测方法。

为了实现本发明的上述目的，本发明提供了基于CAA-Net与LightGBM的FVEP特征点检测方法，包括以下步骤：

S1，数据预处理：对FVEP信号进行标准化，作为神经网络模型的输入；

S2，特征点序列生成：

S2-1，经过CAA-Net模型选出可能为特征点的位置坐标，对可能性小的待选特征点进行过滤；

S2-2，待选特征点序列生成：如果待选特征点集合中的点不是极值点，则在待选特征点集合中的特征点距离小于2的范围进行寻找，若找不到极值点，则舍去该点，若找到极值点，则以其替代待选特征点；然后，根据穷举法生成初步的待选特征点序列集合；

S3，特征点序列选择，得到最优特征点序列。

在本发明的一种优选实施方式中，所述S1包括：

对FVEP数据进行z-score标准化：对于每一条FVEP信号数据，包括被检查者320毫秒中的数据，其中每1毫秒采样一条数据，组成一个序列

其中，

表示第1毫秒采样的数据，

表示第k-1毫秒采样的数据，

表示第k毫秒采样的数据，

表示第k+1毫秒采样的数据，

表示第320毫秒采样的数据；计算X_i的均值

X_i的标准差s，作如下变换：

其中，

表示第i个FVEP波形采样第k毫秒标准化后的值。

在本发明的一种优选实施方式中，所述S2-1包括：

CAA-Net对输入的FVEP信号，先经过一次一维卷积提取局部的特征，然后通过最大池化保留最有用的特征；再增加一个一维卷积最大池化层；此时输出的特征图，送入一层自注意力层；对自注意力层输出，再经过一次一维卷积，得到特征图；然后加入两个分支，其中一个分支添加一个一维卷积，结合sigmoid激活函数，用于提取特征点概率，另外一个分支添加一个一维卷积，结合linear激活函数，用于提取位置的偏置；

所述偏置的计算公式如下：

其中，x为输入点坐标，x_out为经过特征图的坐标，xbias为偏置，[·]表示向下取整，|·|表示绝对值。

在本发明的一种优选实施方式中，所述偏置包括：

为了便于神经网络处理，将偏置进行归一化，即xbias/4。

在本发明的一种优选实施方式中，所述S2-1包括：

使用了一维卷积与自注意力机制：对于提取波形中的局部特征，采用一维卷积；对于探寻特征点与其它的特征点之间的关系，采用注意力机制。

在本发明的一种优选实施方式中，所述S3包括以下步骤：

S3-1，使用多元高斯模型对待选特征点序列计算概率，表示其位置概率，过滤低概率待选序列，保留概率最高的M个待选序列；

S3-2，计算待选序列的形态概率、特征点概率，结合位置概率、年龄以及m个特征点坐标，生成特征点序列特征，采用LightGBM模型进行预测，预测待选序列与真实序列之间的平均绝对误差。

S3-3，从M个待选序列中，选择预测平均绝对误差最低的待选序列，作为最优特征点序列。

在本发明的一种优选实施方式中，所述多元高斯模型包括：

其中y表示特征点序列，μ表示均值向量，∑表示协方差矩阵，|·|表示线性代数中的行列式的值，·^T表示转置，·^-1表示逆矩阵，d表示特征点序列维度。本发明令d＝6。利用训练集数据，进行极大似然估计，计算多元高斯分布参数μ，∑。当有新的特征点序列输入时，可以计算其概率密度。

在本发明的一种优选实施方式中，所述S3中的特征点序列选择包括：

为了检测特征点序列，使得选择的最优特征点序列最接近于真实特征点序列，令待选序列与真实特征点序列之间的平均绝对误差MAE：

其中Y^k表示第k个真实特征点，

表示第k个待选特征点，|·|表示绝对值。

在本发明的一种优选实施方式中，序列平均绝对误差：

序列均方根误差：

序列平均绝对百分比误差：

其中，

表示第i个FVEP信号采样时间为k的预测量，

表示第i个FVEP信号采样时间为k的标记，n为数据集的样本数量，m为特征点向量维度即特征点个数，|·|表示绝对值。

综上所述，由于采用了上述技术方案，本发明的有益效果是：能快速有效的得到FVEP波形特征点，从而对病人的病情进行临床分析。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明ADFP模型训练示意图。

图2是本发明ADFP模型预测示意图。

图3是本发明CAA-Net结构示意图。

图4是本发明多元高斯模型计算序列概率示意图。

图5是本发明FVEP形态概率可视化示意图。

图6是本发明特征与标签示意图。

图7是本发明特征点直方图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

FVEP波形特征点是一个对于临床医生判断病情很重要的依据。本发明提出了一种用于自动检测FVEP信号特征点的框架ADFP，级联了基于卷积神经网络与注意力机制的的神经网络模型CAA-Net，多元高斯模型与LightGBM模型。

本发明提出的ADFP模型在FVEP特征点检测过程中，可以分为以下三个步骤：

S1，预处理。这一步中使用对FVEP信号进行标准化，作为神经网络模型的输入。如图2预处理部分

S2，特征点序列生成。本步骤先经过CAA-Net模型选出可能为特征点的位置坐标，对可能性小的待选特征点进行过滤。如果待选特征点集合中的点不是极值点，则在待选特征点集合中的特征点距离小于2的范围进行寻找，若找不到极值点，则舍去该点，若找到极值点，则以其替代待选特征点。然后，根据穷举法生成初步的待选特征点序列集合。如图2特征点序列生成部分。

S3，特征点序列选择。首先，使用多元高斯模型对待选特征点序列计算概率，表示其位置概率，过滤低概率待选序列，保留概率最高的M个待选序列。然后，计算待选序列的形态概率、特征点概率，结合位置概率、年龄以及m个特征点坐标，生成特征点序列特征，采用LightGBM模型进行预测，预测待选序列与真实序列之间的平均绝对误差。最后，从M个待选序列中，选择预测平均绝对误差最低的待选序列，作为最优特征点序列。如图2，特征点序列选择部分

ADFP模型的训练过程如图1所示，预测过程如图2所示，其中每一给步骤的具体实现将如下：

1.问题定义

对于输入训练集R＝{(X₁,Y₁),...,(X_i,Y_i),...,(X_D,Y_D)}。D是训练集的样本数量，X_i代表一个FVEP信号，Y_i代表m个特征点

将在训练集R中训练，得到模型ADFP，使得输入新的FVEP信号X_new，输出Y_new。

2.数据预处理

在临床中，不同被检查者的FVEP信号幅值差异大，但是其对于医生判断病情意义不大。为了消除这种幅值对神经网络模型的干扰，对FVEP数据进行z-score标准化。对于每一条FVEP信号数据，包括被检查者320毫秒中的数据，其中每1毫秒采样一条数据，组成一个序列

其中，

表示第1毫秒采样的数据，

表示第k-1毫秒采样的数据，

表示第k毫秒采样的数据，

表示第k+1毫秒采样的数据，

表示第320毫秒采样的数据；计算X_i的均值

X_i的标准差s，作如下变换：

其中，

表示第i个FVEP波形采样第k毫秒标准化后的值。

3.CAA-Net网络

用于自动检测FVEP信号中的m个特征点，相对于传统的目标检测任务，有很大的不同。在传统的目标检测任务中，每个被检测目标皆独立于其它目标，不需要考虑他们之间的先后顺序。而在FVEP特征点检测任务中，预测序列

当m取6时，

表示六个特征点为一个序列，每个点都需要依赖于其他点的存在，且特征点N都为波谷，包括特征点N1、N2、N3；特征点P都为波峰，包括特征点P1、P2、P3。此特征使FVEP特征检测任务区别于一般的目标检测任务。

基于序列到序列的神经网络模型CAA-Net，输入为FVEP信号，输出每个位置可能存在特征点的概率，提出的CAA-Net模型结构如图3所示。CAA-Net对输入的FVEP信号，先经过一层一维卷积Con1D，提取局部的特征，然后通过最大池化层MaxPool保留最有用的特征。为了得到更深的感受野，再增加一个一维卷积和最大池化层Con1D-MaxPool结构。此时输出的特征图，送入一层自注意力层。使用自注意力层，将会对特征图中的每一个向量探寻与其它向量的关系。对自注意力层的输出，再经过一层一维卷积Con1D，得到特征图。考虑整个神经网络结构中使用两次最大池化，特征图的输出序列长度维80。相当于每一个特征图的输出向量，对应原始输入的4个点。此时，我们加入两个分支，其中一个分支添加一个一维卷积，结合sigmoid激活函数，以提取特征点概率，另外一个分支添加一个一维卷积，结合linear激活函数，提取位置的偏置。

考虑输入的序列长度为320，输出的特征点概率序列长度为80，即每个输出概率序列的概率，代表输入序列中感受野为4的范围内存在特征点概率，这样不能得到精确的输入序列的对应的位置。为了解决这个问题，加入了一个偏置分支。假设输入点坐标为x，经过特征图，得到坐标x_out，如公式3.3所示，计算其偏置为xbias，如公式3.4所示。为了便于神经网络处理，将偏置进行归一化，即xbias/4。

其中，x为输入点坐标，x_out为经过特征图的坐标，xbias为偏置，[·]表示向下取整，|·|表示绝对值；

对于选择特征点，要考虑两种因素，一是其是否为极值点及其形态特征，二是考虑其在整个序列中的位置以及与其它特征点的关系。为了解决此问题，使用了一维卷积与自注意力机制。对于提取波形中的局部特征，采用一维卷积。相似于图像，前面的卷积层处理低级的特征，后面的卷积层处理高级的特征，在我们的任务中，只需要提取一些低级的感受野范围很小的局部特征。对于探寻特征点与其它的特征点之间的关系，采用注意力机制，它将会使特征图中每一个向量与特征图中所有向量做内积，探寻这种全局关系。

CAA-Net在ADFP模型中有两个功能。第一个功能为CAA-Net模型输出的特征点概率，先对它进行过滤，当其大于阈值τ时，才将它加入待选特征点集合。如果待选特征点集合中的特征点不是极值点，则在待选特征点集合中的特征点距离小于2的范围进行寻找，若找不到极值点，则舍去该点，若找到极值点，则以其替代特征点。然后，遍历待选特征点集合，生成待选特征点序列集合。第二个功能为定义待选特征点序列中CAA-Net输出概率的平均值为特征点概率p_c，将其作为待选特征点序列的一个特征。

4.多元高斯模型

本发明使用多元高斯分布模型对特征点序列建模。首先，定义多元高斯分布P(y,μ,∑)，其中y表示特征点序列，μ表示均值向量，∑表示协方差矩阵，具体如公式3.5所示：

其中|·|表示线性代数中的行列式的值，·^T表示转置，·^-1表示逆矩阵，d表示特征点序列维度，在本发明中，d＝6。利用训练集数据，进行极大似然估计，计算多元高斯分布参数μ，∑。当有新的特征点序列输入时，可以计算其概率密度。如图4所示，当建立多元高斯分布模型后，计算三个特征点序列的概率密度。其中，第一个序列为标记序列，它的概率密度最大。第二个序列相比于第三个序列，在位置上，与标记序列更加接近。可以观察到，第二个序列概率密度也远远高于第三个序列的概率密度。因此，我们定义序列的概率密度为序列位置概率p_α。

多元高斯分布模型在ADFP模型中有两个作用。第一个作用在于对CAA-Net模型生成的特征点序列集合进行初步筛选，保留前M个位置概率最高的待选序列。第二个作用在于其作为特征点序列的一个特征，作为LightGBM模型的输入。

5.形态概率

在ADFP模型中，我们对于特征点检测，同时考虑多种因素，波峰、波谷的形态仅仅作为考虑的特征之一。本发明提出一种计算待选波峰、波谷形态概率的算法，先计算出FVEP信号所有可能的波峰与波谷，即所有的极值点。然后对于每个极值点，计算极值点左右2邻域的范围内的绝对值极差的平均值，再使用最大最小标准化算法对极差平均值进行归一化。

如图5所示，通过算法计算FVEP信号极值点的形态概率。观察可知，特征点的形态概率并不一定是最高的，比如N1点的形态概率很小，才0.04。因此形态概率只能作为判断是否为特征点的依据之一。对于一个待选特征点序列，定义其平均形态特征点概率为特征点序列形态概率。

在ADFP模型中，待选特征点序列的形态概率作为判断是否为特征点的依据之一。在采集的FVEP数据质量很高时，形态概率将在其中起非常重要的作用，因为此时极值点中，特征点与非特征点的形态差异十分明显。相反，在采集的FVEP数据质量不高时，形态概率在其中起的相对会变低。

6.最优序列选择

对最优序列选择问题进行抽象，假设在训练集中，存在N条FVEP特征点序列。经过CAA-Net模型与多元高斯模型处理，每一条FVEP特征点序列，对应M条待选序列，最优序列选择对应于从M条序列中选择最优。我们的目标在于检测特征点序列，使得选择的最优序列最接近于真实特征点序列。定义待选序列与真实特征点序列之间的平均绝对误差MAE：

其中Y^k表示第k个真实特征点，

表示第k个待选特征点，|·|表示绝对值，Y＝(Y¹,Y²,Y³,Y⁴,Y⁵,Y⁶)表示真实特征点序列，Y¹表示第1个真实特征点，Y²表示第2个真实特征点，Y³表示第3个真实特征点，Y⁴表示第4个真实特征点，Y⁵表示第5个真实特征点，Y⁶表示第6个真实特征点；

表示待选序列，

表示第1个待选特征点，

表示第2个待选特征点，

表示第3个待选特征点，

表示第4个待选特征点，

表示第5个待选特征点，

表示第6个待选特征点。如何预测待选序列与真实特征点序列之间的MAE，可以转化为回归问题，即建立一个回归模型，输入为待选序列，位置概率、形态概率与特征点概率，输出为待选序列与真实特征点序列之间的MAE。选择平均绝对值误差作为预测值，而不是均方误差MSE，原因是因为MSE对于异常值比较敏感。若六个特征点中有一个特征点误差很大，会造成整个序列的MSE很大。我们需要一种比较稳定，对异常值不敏感的损失评价方法，因此选择了MAE。最终我们选择了年龄、形态概率、位置概率、特征点概率与六个特征点，建立预测MAE的模型。如图6所示。

确定特征变量与预测变量后，需要一个机器学习回归模型。常见的回归模型包括线性回归、KNN回归、支持向量回归与基于融合的回归模型。选择LightGBM作为回归模型，它是一个实现GBDT算法的高性能的框架。GBDT属于集成学习中的一种方法，其核心思想是采用弱分类器(比如决策树)逐步迭代以致于得到最优模型，拥有训练性能稳定，泛化能力很强，很难过拟合等长处。同样属于GBDT框架的XGBOOST框架，在LightGBM之前被提出使用，它利用了基于决策树算法的预排序技术。其优势之处在于精确地找到决策树的分割点，但是它的劣势也很显而易见：它的空间复杂度高，因为它在训练过程中需要保存大量中间结果。此外，因为XGBOOST在遍历时，需要每次都计算分裂增益，其时间复杂度也很高。为了解决XGBOOST的问题，在保证准确率的情况下，LightGBM采用了一些改良的技术，包括单边梯度采样GOSS，互斥特征捆绑EFB，以及带深度限制的Leaf-wise的叶子生长策略。

在ADFP模型中，LightGBM的作用为从M个待选特征点序列中选择最优特征点序列。首先，利用LightGBM预测待选特征点序列的MAE值，然后，选择预测MAE值最小的待选序列作为最优序列。

在ADFP中，整个步骤分为预处理、特征点序列生成与特征点序列选择。首先，通过CAA-Net模型生成待选特征点。然后生成待选特征点序列集合，利用多元高斯分布模型选择M个待选序列。最后，使用LightGBM模型选择最优序列。

7.数据集

FVEP正常数据集包括于5164条FVEP数据，从采集于1366个被检查者，每个人提供左右两只眼两次检测结果。所有的FVEP数据全部采集于陆军医科大学第一附属医院(西南医院)眼科，时间跨度为2012年7月1日到2020年3月1日，使用的设备为Espion E2眼电生理设备装载Espion E2系统。

其中按照被检查者ID分组，随机选择70％的被检查者的数据作为训练集数据，30％的被检查者的数据作为测试集数据。每一例被检查者的数据，包括FVEP波形数据，特征点位置，性别，年龄，疾病类型。在本发明实验中，将使用波形数据，特征点位置，年龄三种类型的数据。

8.评价指标

本发明模型最后输出为一个序列，包括六个特征点。通过将输出序列与真实序列进行对比评估，可以直观的看到模型检测特征点的能力。假设预测序列

其中

表示第i个样本，特征点向量维度为1的预测量；

表示第i个样本，特征点向量维度为2的预测量；

表示第i个样本，特征点向量维度为m-1的预测量；

表示第i个样本，特征点向量维度为m的预测量。标记序列

其中，

表示第i个样本的第1个标记，

表示第i个样本的第2个标记，

表示第i个样本的第m个标记，

表示第i个样本的第m个标记；为了实现对建立的模型的性能进行评估，我们利用如下四个指标，对模型性能进行评估，分别是：

序列平均绝对误差SMAE：表示预测序列和标记序列之间绝对误差的平均值。其公式如下所示：

序列均方根误差SRMSE：表示预测序列和标记序列之间平方差异平均值的平方根。其公式如下所示：

序列平均绝对百分比误差SMAPE：表示预测值和实际观测之间绝对误差的和除以实际值。实际上，它是误差百分率的平均值。

其中，Y_i ^k表示第i个FVEP信号采样时间为k的预测量，

平均运行时间：表示在数据集中，FVEP从进行预处理到输出特征点序列的平均时间。

9.实验参数

所有的神经网络模型都使用RAdam优化器与余弦退火学习率退火算法。其中RAdam优化器的学习率设置为0.01，批处理大小设置为128，迭代轮数为50轮。余弦学习率退火算法在前10轮选择学习率线性上升，第10轮到50轮进行余弦学习率下降。所有的神经网络模型其损失函数都为Focal Loss。对于神经网络输出特征点概率，设置阈值τ＝0.15，过滤输出概率小于τ的待选特征点。对于神经网络我们选择训练集中训练过程中训练损失最低的模型作为最佳模型。对于多元高斯模型，其M值设置为10。对于LightGBM模型，设置其最大叶子节点数为30，最大深度为10，学习率为0.02，最大饼数为50，每次迭代时选择80％的训练集。

10.实验结果与分析

表3.2检测模型性能对比

本发明实验将对比ADFP模型与其它模型，包括多元高斯模型、LSTM、CAA-Net模型。从表3.2可知，仅仅使用多元高斯模型，其运行时间很慢，是ADFP模型运行时间的三十多倍。分析可知，多元高斯模型需要遍历所有的极值点，其搜索空间巨大，消耗大量计算资源。同时，其只考虑了特征点位置的因素，没有考虑到形态、年龄等特征，其预测精度较低。使用小波变换后，运行时间加快，因为其滤掉了一些噪声，搜索空间大大降低。多元高斯模型结合两种网络结构中，CAA-Net网络预测精度最高，因为其利用了自注意力机制寻找特征点与其他特征点之间的关系，对选择更好的特征点有辅助作用。

ADFP模型(不添加年龄特征)相比于其它模型，预测性能都有明显提升。与CAA-Net模型相比，其SRMSE降低了0.67，SAME降低了0.77，SMAPE降低了0.18，这表明了利用多种特征结合LightGBM进行最优序列选择是高效的。当ADFP模型增加年龄特征，其SRMSE下降0.68，SMAE下降0.46，SMAPE下降0.46，模型的性能显著提升，也说明了年龄特征在特征点检测中的重要性。

表3.4 ADFP模型不同特征点的性能

特征点	MAE	绝对误差中值
			N1	3.86	1.0
P1	6.70	1.0
			N2	8.54	1.0
P2	7.64	1.0
			N3	12.51	5.0
P3	19.48	12.0

表3.4计算了预测序列中每一个特征点的平均绝对误差MAE，以及绝对误差的中值。从表3.4可知，ADFP模型对于各个特征点的预测性能，表现不一。N1，P1，N2，P2四个点的预测性能较好，其MAE皆低于10。六个特征点中，除了N2，P2点，都是越靠近序列后面，预测性能越差。N2点相较于P2点，在序列中更靠前，但是它的MAE值却高于P2点MAE值0.90。如图7所示，数据集中特征点的分布除了N2点，其余都近似于高斯分布，但是N2点有两个波峰，且分布相对于P2点更离散，这是其预测性能较低的原因。MAE为绝对误差的均值，我们可以发现其远远高于绝对误差的中值，这表明存在一些预测性能较差的FVEP序列。在临床应用中，由于FVEP的变异性，N3，P3特征点不作为医生的诊断参考标准，关注的性能指标主要在于P2特征点。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。