CN113469053B

CN113469053B - 眼动轨迹鉴别方法及系统

Info

Publication number: CN113469053B
Application number: CN202110748215.1A
Authority: CN
Inventors: 王亮; 郭奕君; 黄岩; 单彩峰; 李凯
Original assignee: Cas Artificial Intelligence Research Qingdao Co ltd
Current assignee: Cas Artificial Intelligence Research Qingdao Co ltd
Priority date: 2021-07-01
Filing date: 2021-07-01
Publication date: 2024-04-05
Anticipated expiration: 2041-07-01
Also published as: CN113469053A

Abstract

本发明提供一种眼动轨迹鉴别方法及系统，属于及其视觉技术领域，获取待鉴别的眼动轨迹；利用训练好的鉴别模型，对获取的待鉴别的眼动轨迹进行处理，得到所述待鉴别的眼动轨迹是正常或异常的鉴别结果；其中，所述训练好的鉴别模型为利用训练集训练得到，所述训练集包括原始图片以及对应的正常儿童视觉显著性图片和自闭症儿童视觉显著性图片，所述原始图片分别被多个正常儿童和多个自闭症儿童浏览，对注视点位置信息以及注视点时长进行标注。本发明提取眼动轨迹在视觉显著性图上的特征以及注视位置注视点的时间信息和序列依赖关系，最后通过损失函数实现判断所属类别；能很好地根据眼动轨迹在显著性图上的序列对儿童自闭症进行识别。

Description

眼动轨迹鉴别方法及系统

技术领域

本发明涉及机器视觉技术领域，具体涉及一种基于视觉显著性图像差异的眼动轨迹鉴别方法及系统。

背景技术

自闭症谱系障碍(简称自闭症)是一种严重的精神发育障碍，患者通常会表现出人际交往障碍、交流沟通障碍以及兴趣和行为等方面的异常，尤其是在儿童发育早期严重损害儿童精神发育。

传统的自闭症诊断方式为发育筛查及综合诊断评估，均需要医生进行专业的诊断。然而，这些方法严重依赖专业的医师凭专业知识进行判断，耗时耗力，且主观性强，这会导致许多患者并不能及时确诊，从而无法尽早得到治疗。而对于自闭症的治疗，治疗时机非常关键，越早进行干预治疗，自闭症患儿的恢复效果也会越好。

近年来，随着人工智能技术的发展，深度神经网络已被用来解决许多有挑战性的难题，例如人脸识别、步态识别、行人重识别等。同时，深度神经网络也在可视化数据分析的各种应用中得到了广泛的应用，并取得了良好的效果。因此，利用计算机视觉领域相关神经网络技术寻找正常儿童群体和患有自闭症儿童群体的眼动轨迹差异，从而判断儿童是否患有自闭症，将对儿童自闭症的早期诊断起到更加快速有效的作用。

发明内容

本发明的目的在于提供一种速度快、判断准确的眼动轨迹鉴别方法及系统，从而对，以解决上述背景技术中存在的至少一项技术问题。

为了实现上述目的，本发明采取了如下技术方案：

第一方面，本发明提供一种眼动轨迹鉴别方法，包括：

获取待鉴别的眼动轨迹；

利用训练好的鉴别模型，对获取的待鉴别的眼动轨迹进行处理，得到所述待鉴别的眼动轨迹是正常或异常的鉴别结果；其中，所述训练好的鉴别模型为利用训练集训练得到，所述训练集包括原始图片以及对应的正常儿童视觉显著性图片和自闭症儿童视觉显著性图片，所述原始图片分别被多个正常儿童和多个自闭症儿童浏览，对注视点位置信息以及注视点时长进行标注。

优选的，训练所述鉴别模型包括：

根据原始图片被浏览时的眼动轨迹序列，分别依次在正常儿童视觉显著性图和自闭症儿童视觉显著性图上进行裁剪操作；

根据眼动轨迹顺序，依次将裁剪操作后的数据送入多层卷积神经网络进行特征提取，得到所有图块特征向量；

结合提取到的所有图块特征向量，分别得到眼动轨迹分别在正常儿童视觉显著性图上的表达和自闭症儿童视觉显著性图上的表达；

将所获取的眼动轨迹在各自的视觉显著性图片上的表达延时间顺序分别通过一个全连接层，并将各自全连接层的输出累加后各自经一个激活函数层，得到各自的眼动轨迹序列的类属分数；

将得到的眼动轨迹在正常儿童视觉显著性图和眼动轨迹在自闭症儿童视觉显著性图的两个类属分数进行损失函数计算，获得训练好的鉴别模型。

优选的，将提取到的所有图块特征向量依次输入双层长短期记忆神经网络，利用长短期记忆神经网络获取眼动轨迹的时序信息和序列间依赖关系，得到眼动轨迹分别在正常儿童视觉显著性图上的表达和自闭症儿童视觉显著性图上的表达。

优选的，浏览原始图像后记录视线点在图片中的坐标以及时间序列信息组成所述眼动轨迹序列。

优选的，对于原始数据中眼动轨迹序列长度不足的部分，进行补零操作，使裁剪处理后的眼动轨迹序列长度一致。

优选的，将提取到的所有图块特征向量依次输入双层长短期记忆神经网络，获取眼动轨迹的时间信息和序列依赖关系，并将每个图块的特征向量集合在一起，得到眼动轨迹在视觉显著性图片上的表达。

优选的，将获取的眼动轨迹在视觉显著性图片上的表达延时间顺序通过一个全连接层，其输出为：

其中，W表示相应的连接权重；表示前向层隐含状态；/>表示反向层隐含状态。

将全连接层输出沿时间轴进行累加，即：

其输出累加后经一个激活函数层，得到序列的类属分数，即：

其中，score_i表示序列的类属分数。

优选的，眼动轨迹在正常儿童视觉显著性图和眼动轨迹在自闭症儿童视觉显著性图的两个类属分数进行损失函数计算，根据输出结果判定输入分数所属类别，即：

其中，是眼动轨迹在第i张正常儿童显著性图上的最终类属分数，/>是眼动轨迹在自闭症儿童显著性图上获得的最终类属分数，Δ表示间隔参数。

第二方面，本发明提供一种眼动轨迹鉴别系统，包括：

获取模块，用于获取待鉴别的眼动轨迹；

鉴别模块，用于利用训练好的鉴别模型，对获取的待鉴别的眼动轨迹进行处理，得到所述待鉴别的眼动轨迹是正常或异常的鉴别结果；其中，所述训练好的鉴别模型为利用训练集训练得到，所述训练集包括原始图片以及对应的正常儿童视觉显著性图片和自闭症儿童视觉显著性图片，所述原始图片分别被多个正常儿童和多个自闭症儿童浏览，对注视点位置信息以及注视点时长进行标注。

第三方面，本发明提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质包括用于执行如上所述的眼动轨迹鉴别方法的指令。

第四方面，本发明提供一种电子设备，包括如上所述的非暂态计算机可读存储介质；以及能够执行所述非暂态计算机可读存储介质的所述指令的一个或多个处理器。

本发明有益效果：无需经过复杂的处理，可直接根据受试者观测图片的眼动轨迹对其是否患有儿童自闭症进行识别；卷积神经网络和长短期记忆神经网络的结合，提取眼动轨迹在视觉显著性图上的特征以及注视位置注视点的时间信息和序列依赖关系，最后通过损失函数实现判断所属类别；能很好地根据眼动轨迹在显著性图上的序列对儿童自闭症进行识别。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所述的实施例所述的基于眼动轨迹识别的儿童自闭症检测方法模型架构图。

图2为本发明实施例所述的采用的Saliency4ASD数据集示意图。

图3为本发明实施例所述的在Saliency4ASD数据集上的实验结果示意图。

具体实施方式

下面详细叙述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。

还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

为便于理解本发明，下面结合附图以具体实施例对本发明作进一步解释说明，且具体实施例并不构成对本发明实施例的限定。

本领域技术人员应该理解，附图只是实施例的示意图，附图中的部件并不一定是实施本发明所必须的。

实施例1

本发明实施例1提供一种眼动轨迹鉴别系统，该系统包括：

获取模块，用于获取待鉴别的眼动轨迹；

在本实施例1中，利用上述的系统，实现了眼动轨迹鉴别方法，包括：

利用获取模块，获取待鉴别的眼动轨迹；

利用鉴别模块，基于训练好的鉴别模型，对获取的待鉴别的眼动轨迹进行处理，得到所述待鉴别的眼动轨迹是正常或异常的鉴别结果；其中，所述训练好的鉴别模型为利用训练集训练得到，所述训练集包括原始图片以及对应的正常儿童视觉显著性图片和自闭症儿童视觉显著性图片，所述原始图片分别被多个正常儿童和多个自闭症儿童浏览，对注视点位置信息以及注视点时长进行标注。

训练所述鉴别模型包括：

将提取到的所有图块特征向量依次输入双层长短期记忆神经网络，利用长短期记忆神经网络获取眼动轨迹的时序信息和序列间依赖关系，得到眼动轨迹分别在正常儿童视觉显著性图上的表达和自闭症儿童视觉显著性图上的表达。

浏览原始图像后记录视线点在图片中的坐标以及时间序列信息组成所述眼动轨迹序列。

在本实施例1中，根据原始数据受试者眼动轨迹序列，分别依次在正常儿童视觉显著性图和自闭症儿童视觉显著性图上进行裁剪操作，为准确表达视线点在显著性图上的信息。

所谓的受试者眼动轨迹序列，可以是由例如眼动仪等眼动轨迹捕获装置所获取的高精度眼动轨迹序列信息，由受试者浏览原始图像后记录视线点在图片中的坐标以及时间序列信息组成，即：

P_i＝(x_i,y_i)

x_i∈[1,H]

y_i∈[1,W]

其中，P_i是受试者眼动轨迹中第i个视线点的坐标(x_i,y_i)，W和H分别为原始图像I的宽度和高度，由于视觉显著性图像与原始图像大小一致，所以也等同于视觉显著性图像S的宽度和高度。

通过裁剪视觉显著性图像S来生成第i个图块P_i(S,p^lt,p^rb)，即：

p^lt＝(x_i-a,y_i-a)；

p^rb＝(x_i+a,y_i+a)

其中，p^lt是图块左上角的坐标，p^rb是图块右下角的坐标，裁剪图块为正方形图像，2a+1是裁剪图块边长。

对于原始数据中眼动轨迹序列长度不足的部分，进行补零操作，使裁剪处理后的眼动轨迹序列长度一致。

将提取到的所有图块特征向量依次输入双层长短期记忆神经网络，获取眼动轨迹的时间信息和序列依赖关系，并将每个图块的特征向量集合在一起，得到眼动轨迹在视觉显著性图片上的表达。

将获取的眼动轨迹在视觉显著性图片上的表达延时间顺序通过一个全连接层，其输出为：

将全连接层输出沿时间轴进行累加，即：

其中，score_i表示序列的类属分数。

眼动轨迹在正常儿童视觉显著性图和眼动轨迹在自闭症儿童视觉显著性图的两个类属分数进行损失函数计算，根据输出结果判定输入分数所属类别，即：

实施例2

如图1所示，本实施例2中，提供一种基于眼动轨迹识别的儿童自闭症检测方法，该方法中对网络进行训练获得了眼动轨迹的鉴别模型，训练的网络主要包含由3个卷积层、2个池化层和一个全连接层组成的卷积深网络以及由1个双层长短期记忆网络层，一个全连接层和一个Sigmoid层组成的长短期记忆网络构成。模型包括训练和识别两个过程：

所述训练过程和识别过程均采用Saliency4ASD数据集，如图2所示，图2(a)为数据集原始图片，受试者浏览原始图片后记录眼动轨迹即视线点坐标及时间信息，图2(b)为图2(a)所对应的可供参考的自闭症儿童视觉显著性图，图2(c)为图2(a)所对应的可供参考的正常儿童视觉显著性图。

所述训练过程进一步包括以下步骤：

步骤S1，根据原始数据受试者眼动轨迹序列，分别依次在正常儿童视觉显著性图和自闭症儿童视觉显著性图上进行裁剪操作，为准确表达视线点在显著性图上的信息，原则上图块像素不低于200*200。

P_i＝(x_i,y_i)

x_i∈[1,H]

y_i∈[1,W]

p^lt＝(x_i-a,y_i-a)；

p^rb＝(x_i+a,y_i+a)

步骤S2，对于原始数据中眼动轨迹序列长度N不足的部分，进行补零操作，使S1处理后的数据长度一致，所取序列长度L至少能够准确地反映对应眼动的动态信息，即：

如果N<L，利用补零操作强制所有图块P_i序列是相同的长度L。

步骤S3，根据眼动轨迹顺序，依次将S2所获取的数据送入多层卷积神经网络进行特征向量F的提取，本实施例2中，用到的卷积神经网络结构如下表1所示：

表1

其中，层类型表示每个神经网络层的类型，池化层为平均池化层，表中的每一行都是模型中的一个层，对于相邻的两个层，上一层的输入是下一层的输入，在每个卷积层之后添加规范层可避免模型过拟合。模型最终产生1024维的视觉特征向量，即第i个图块的特征向量F_i。

步骤S4，将S3中提取到的所有图块特征向量依次输入长度为L的双层长短期记忆神经网络，利用长短期记忆神经网络获取眼动轨迹的时间信息和序列依赖关系，并将每个图块的特征向量集合在一起，得到眼动轨迹在视觉显著性图片上的表达，即：

c^t＝f^tc^t-1+i^ttanh(W_Icx^t+W_hcc^t+b_c)

o^t＝σ(W_IoI^t+W_hoh^t-1+W_coc^t+o)

h^t＝o^ttanh(c^t)

其中，i、o、f、c分别表示输入控制门(Input gate)状态、输出控制门(Outputgate)状态、遗忘门(Forget gate)状态和记忆单元(cell)状态，W表示相应连接权重，b为偏置向量，h为隐含层状态。

最大池化层用于收集长短期记忆网络的输出。

步骤S5，将S4所获取的眼动轨迹在视觉显著性图片上的表达延时间顺序通过一个全连接层，其输出为：

将全连接层输出沿时间轴进行累加，即：

其中，score_i表示序列的类属分数。其中，在每个全连接层后添加丢失层，以避免模型过拟合。

步骤S6，将S5得到的眼动轨迹在正常儿童视觉显著性图和眼动轨迹在自闭症儿童视觉显著性图的两个类属分数进行损失函数计算，根据输出结果判定输入分数所属类别，即：

所述识别过程进一步包括以下步骤：

步骤1：按模型训练过程步骤S1所述，根据原始数据受试者眼动轨迹序列，分别依次在正常儿童视觉显著性图和自闭症儿童视觉显著性图上进行裁剪操作。

步骤2：按模型训练过程S2-S5所述，将裁剪后的图块先进行补零操作，再通过多层卷积神经网络进行特征提取，接着通过双层长短期记忆网络获取眼动轨迹的时间信息和序列依赖关系并得到眼动轨迹在视觉显著性图片上的表达，最后获得类属分数。

步骤3：根据步骤S6中得到的类属分数进行损失函数计算后最终判断所属类别。

本实施例2中，应用于一个公开的数据集Salency4ASD中训练，对本实施例2的方法进行验证，该数据及包含300张图片，包括原始图片以及对应可供参考的正常儿童视觉显著性图片和自闭症儿童视觉显著性图片，每张原始图片分别被14个正常儿童和14个自闭症儿童浏览，注视点位置信息以及注视点时长被记录。选择该数据集前240张图片作为训练集用来训练模型，并用剩下的60张图片作为验证集来验证本发明的有效性。

图3是本发明在Saliency4ASD数据集中所选取验证集上的实验结果。实验表明，该方法在验证过程中，分类判断准确率达到97％以上，且方法操作简单，便于实际应用。

实施例3

本发明实施例3提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质包括用于执行眼动轨迹鉴别方法的指令，该方法包括：

获取待鉴别的眼动轨迹；

实施例4

本发明实施例4提供一种电子设备，该电子设备包括一种非暂态计算机可读存储介质；以及能够执行所述非暂态计算机可读存储介质的所述指令的一个或多个处理器。所述非暂态计算机可读存储介质包括用于执行眼动轨迹鉴别方法的指令，该方法包括：

获取待鉴别的眼动轨迹；

综上所述，本发明实施例所述的眼动轨迹鉴别方法及系统，可实现基于眼动轨迹识别的儿童自闭症检测无需经过复杂的处理，可直接根据受试者观测图片的眼动轨迹对其是否患有儿童自闭症进行识别。尤其是卷积神经网络和长短期记忆神经网络的结合可以很好地提取眼动轨迹在视觉显著性图上的特征以及注视位置注视点的时间信息和序列依赖关系，最后通过损失函数实现判断所属类别。能很好地根据眼动轨迹在显著性图上的序列对儿童自闭症进行识别，为未来的实际应用提供了算法条件。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明公开的技术方案的基础上，本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形，都应涵盖在本发明的保护范围之内。

Claims

1.一种眼动轨迹鉴别方法，其特征在于，包括：

获取待鉴别的眼动轨迹；

利用训练好的鉴别模型，对获取的待鉴别的眼动轨迹进行处理，得到所述待鉴别的眼动轨迹是正常或异常的鉴别结果；其中，所述训练好的鉴别模型为利用训练集训练得到，所述训练集包括原始图片以及对应的正常儿童视觉显著性图片和自闭症儿童视觉显著性图片，所述原始图片分别被多个正常儿童和多个自闭症儿童浏览，对注视点位置信息以及注视点时长进行标注；

训练所述鉴别模型包括：

将提取到的所有图块特征向量依次输入双层长短期记忆神经网络，利用长短期记忆神经网络获取眼动轨迹的时序信息和序列间依赖关系，分别得到眼动轨迹分别在正常儿童视觉显著性图上的表达和自闭症儿童视觉显著性图上的表达；

2.根据权利要求1所述的眼动轨迹鉴别方法，其特征在于，浏览原始图像后记录视线点在图片中的坐标以及时间序列信息组成所述眼动轨迹序列。

3.根据权利要求1所述的眼动轨迹鉴别方法，其特征在于，对于原始数据中眼动轨迹序列长度不足的部分，进行补零操作，使裁剪处理后的眼动轨迹序列长度一致。

4.根据权利要求1所述的眼动轨迹鉴别方法，其特征在于，将提取到的所有图块特征向量依次输入双层长短期记忆神经网络，获取眼动轨迹的时间信息和序列依赖关系，并将每个图块的特征向量集合在一起，得到眼动轨迹在视觉显著性图片上的表达。

5.根据权利要求1所述的眼动轨迹鉴别方法，其特征在于，将获取的眼动轨迹在视觉显著性图片上的表达延时间顺序通过一个全连接层，其输出为：

其中，W表示相应的连接权重；表示前向层隐含状态；/>表示反向层隐含状态；

将全连接层输出沿时间轴进行累加，即：

其中，score_i表示序列的类属分数。

6.根据权利要求1所述的眼动轨迹鉴别方法，其特征在于，眼动轨迹在正常儿童视觉显著性图和眼动轨迹在自闭症儿童视觉显著性图的两个类属分数进行损失函数计算，根据输出结果判定输入分数所属类别，即：

7.一种眼动轨迹鉴别系统，采用如权利要求1所述的一种眼动轨迹鉴别方法，其特征在于，包括：

获取模块，用于获取待鉴别的眼动轨迹；

8.一种电子设备，其特征在于，包括非暂态计算机可读存储介质；以及能够执行所述非暂态计算机可读存储介质的指令的一个或多个处理器；所述非暂态计算机可读存储介质包括用于执行如权利要求1-6任一项所述的眼动轨迹鉴别方法的指令。