CN112560583A

CN112560583A - 一种数据集生成方法、装置

Info

Publication number: CN112560583A
Application number: CN202011350199.2A
Authority: CN
Inventors: 周平红; 李全林; 诸炎
Original assignee: Zhongshan Hospital Fudan University
Current assignee: Zhongshan Hospital Fudan University
Priority date: 2020-11-26
Filing date: 2020-11-26
Publication date: 2021-03-26

Abstract

本发明的一个技术方案是提供了一种数据集生成方法。本发明的另一个技术方案是提供了一种数据集生成装置，其特征在于，包括：图像数据采集模块；时间间隔获取模块；关联模块；训练数据生成模块。根据本发明的方法及装置训练得到的数据集主要用于训练图像识别模型，所述图像识别模型的用途包括对目标对象的运动方向进行识别，从而所述图像识别模型能够采用本方法生成的数据集进行训练，得到更加准确的目标对象运动方向的识别结果。

Description

一种数据集生成方法、装置

技术领域

本发明涉及一种数据集生成方法及数据集生成装置，尤其适用于训练图像识别。

背景技术

当前，为了探测逼仄、狭窄、肉眼难以直接观察的空间(例如隧道，涵洞，食道、消化道、胃肠道等)，往往采用可控制的探头(内窥镜)进行观察，为了不伤及探头或待探测的空间，往往需要对探头的运动方向和速度进行精确地控制，这对操作人员有着非常高的要求，需要拥有大量经验积累的操作人员操刀，这无疑会耗费很高人力资源成本。得益于机器视觉技术的发展，申请人发现可以采用机器视觉预测探头的运动方向和速度进而辅助操作人员进行遥控或直接由设备基于机器视觉控制探头运动。但是采用机器视觉对运动方向和速度进行预测需要大量的数据训练相应的模型，训练数据的质量往往对模型最终的识别效果影响重大，如何低成本的获取高质量的训练数据集是当前亟待解决的问题。

发明内容

本发明的目的是：通过基于预设方式获取到更加准确的标准时间间隔，并根据所述标准时间间隔将图像数据和正确的操作关联，使得生成的数据集中图像数据与操作更加准确地对应了起来，从而显著提高图像识别模型的识别精度。

为了达到上述目的，本发明的一个技术方案是提供了一种数据集生成方法，其特征在于，包括以下步骤：

获取图像采集设备采集到的图像数据；

根据预设方式获取标准操作反应时间间隔；

基于标准操作反应时间间隔将图像数据与对应的操作关联；

基于与对应的操作关联后的图像数据生成训练数据集。

优选地，所述图像采集设备包括带有摄像模块的可移动设备，其中，所述带有摄像模块的可移动设备包括飞机、汽车、水下机器人和内窥镜中的一种。

优选地，根据所述预设方式获取所述标准操作反应时间间隔，包括以下步骤：

通过显示设备显示包括多个特定图像的图像数据并实时记录与特定图像相关联的操作反应的时间点；

根据操作反应的时间点和与操作反应相关联的特定图像的时间点确定所述标准反应时间间隔。

优选地，包括多个所述特定图像的图像数据为固定时间长度的视频数据，视频数据中包括多个所述特定图像，每一所述特定图像与相邻的所述特定图像的间隔不小于预设的时间长度。

优选地，所述特定图像在所述视频数据的固定时间点显示。

优选地，根据所述操作反应的时间点和与所述操作反应相关联的所述特定图像的所述时间点确定所述标准反应时间间隔，包括以下步骤：

根据所述视频数据中包括的多个所述特定图像的显示时间构建第一矩阵；

根据实时记录的与所述视频数据中的多个所述特定图像相关联的操作反应的时间点构建第二矩阵；

基于第一矩阵和第二矩阵计算得到时间差矩阵；

基于时间差矩阵计算得到所述标准反应时间间隔。

优选地，确定所述标准反应时间间隔之前，所述数据集生成方法还包括：

获取与所述特定图像相关联的操作反应中的有效操作反应；

根据有效操作反应的时间点和与所述有效操作反应相关联的所述特定图像的时间点确定所述标准反应时间间隔。

优选地，根据所述操作反应的时间点和与所述操作反应相关联的所述特定图像的时间点确定所述标准反应时间间隔，包括以下步骤：

计算与所述视频数据中出现所述特定图像的时间点距离最近的所述操作反应的时间点的索引；

根据索引构建所述特定图像与所述操作反应一一匹配的对照矩阵；

基于对照矩阵中确定索引有效且所述特定图像与所述操作反应一一匹配的时间差矩阵；

基于时间差矩阵计算得到所述标准反应时间间隔。

优选地，计算与所述视频数据中出现所述特定图像的时间点距离最近的所述操作反应的时间点的所述索引，包括以下步骤：

构建元素为所述视频数据中出现多个所述特定图像的各个时间点的第三列矩阵；

构建元素为实时记录的各个所述操作反应的时间点的第四列矩阵；

根据第三列矩阵和第四列矩阵计算得到所述索引。

优选地，所述索引是否有效由以下方式确定：

若所述第四列矩阵与所述第三列矩阵中对应行的元素之差在第一阈值范围内，则确定所述索引为有效；

若所述第四列矩阵与所述第三列矩阵中对应行的元素之差不在第一阈值范围内，则确定所述索引为无效。

优选地，基于所述标准操作反应时间间隔将所述图像数据与对应的操作关联，包括以下步骤：

通过显示设备显示所述图像采集设备采集到的图像数据；

实时采集针对于图像数据的操作反应并记录所述操作反应的时间点；

针对于所述图像数据中的每一帧图像进行分析得到其中的运动数据，并记录当前帧的时间；

基于所述标准时间间隔叠加当前帧的时间作为当前帧的参考时间；

若实时记录的操作反应时间点在前一帧图像的参考时间和后一帧图像的参考时间之间，则将所述实时采集的操作反应与包括运动数据的所述图像数据关联存储。

本发明的另一个技术方案是提供了一种数据集生成装置，其特征在于，包括：

图像数据采集模块，用于获取图像采集设备采集到的图像数据；

时间间隔获取模块，用于根据预设方式获取标准操作反应时间间隔；

关联模块，用于根据时间间隔获取模块获取的标准操作反应的时间间隔将图像数据采集模块获得的图像数据与对应的操作相关联；

训练数据生成模块，用于基于关联模块获得的图像数据与对应操作之间的关联生成训练数据集。

优选地，所述时间间隔获取模块还用于：

根据操作反应的时间点和与所述操作反应相关联的特定图像的时间点确定标准反应时间间隔。

优选地，包括多个所述特定图像的所述图像数据为固定时间长度的视频数据，视频数据中包括多个所述特定图像，每一所述特定图像与相邻的所述特定图像的间隔不小于预设的时间长度。

优选地，所述特定图像在所述视频数据的固定时间点显示。

优选地，所述时间间隔获取模块包括：

第一矩阵构建单元，用于根据所述视频数据中包括的多个所述特定图像的显示时间构建第一矩阵；

第二矩阵构建单元，用于根据实时记录的与所述视频数据中的多个所述特定图像相关联的操作反应的时间点构建第二矩阵；

时间差矩阵计算单元，用于基于第一矩阵和第二矩阵计算得到时间差矩阵；

时间间隔计算单元，用于基于时间差矩阵计算得到标准反应时间间隔。

优选地，所述时间间隔获取模块还包括：

有效操作反应获取单元，用于获取与所述特定图像相关联的操作反应中的有效操作反应；

有效时间间隔计算单元，用于根据有效操作反应的时间点和与所述有效操作反应相关联的特定图像的时间点确定标准反应时间间隔。

优选地，所述时间间隔获取模块还包括：

时间索引获取单元，用于计算与所述视频数据中出现特定图像的时间点距离最近的操作反应的时间点的索引；

对照矩阵构建单元，用于根据索引构建特定图像与操作反应一一匹配的对照矩阵；

索引时间差矩阵计算单元，用于基于对照矩阵中确定索引有效且特定图像与操作反应一一匹配的时间差矩阵；

索引时间间隔计算单元，用于基于时间差矩阵计算得到标准反应时间间隔。

优选地，所述时间索引获取单元包括：

第三列矩阵构建子单元，用于构建元素为所述视频数据中出现多个所述特定图像的各个时间点的第三列矩阵；

第四列矩阵构建子单元，用于构建元素为实时记录的各个操作反应的时间点的第四列矩阵；

索引计算子单元，用于根据第三列矩阵和第四列矩阵计算得到所述索引。

优选地，所述索引是否有效由以下方式确定：

优选地，所述关联模块包括：

图像数据显示单元，用于通过显示设备显示所述图像数据采集模块采集到的图像数据；

操作反应采集单元，用于实时采集针对于所述图像数据的操作反应并记录所述操作反应的时间点；

运动数据采集单元，用于针对于所述图像数据中的每一帧图像进行分析得到其中的运动数据，并记录当前帧的时间；

参考时间获取单元，用于基于所述标准时间间隔叠加当前帧的时间作为当前帧的参考时间；

关联存储单元，用于当实时记录的操作反应时间点在前一帧图像的参考时间和后一帧图像的参考时间之间时，则将所述实时采集的操作反应与包括运动数据的所述图像数据关联存储。

根据本发明的方法及装置训练得到的数据集主要用于训练图像识别模型，所述图像识别模型的用途包括对目标对象的运动方向进行识别，从而所述图像识别模型能够采用本方法生成的数据集进行训练，得到更加准确的目标对象运动方向的识别结果，所述目标对象可以是采集图像数据的图像采集设备或者搭载所述图像采集设备的载具，从而基于本发明得到的数据集，能够训练出一种图像识别模型，所述图像识别模型可以根据采集到的图像数据的变化情况判断出采集所述图像数据的设备的运动方向。另外本发明提供的方法非常简单，容易实施，减少了生成数据集的成本。

附图说明

图1为本发明一实施例提供的数据集生成方法的应用场景示意图；

图2为本发明一实施例提供的数据集生成方法的流程示意图；

图3为根据本发明的实施方式提供的一种标注设备的示意图；

图4为本发明一实施例的显示图像数据和同步记录标注的流程示意图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

在进行人工数据标注时，需要一定的反应时间，即大脑下发控制指令后，控制手指触碰方向标注(用于对反应和认知时间进行标定和记录的设备)设备按键的时间。并且人类动作极大概率会存在漏标的行为，从而造成标注不准的后果。申请人通过一系列技术手段极力避免数据标注时以上情况的发生，并且在计算标准时间间隔时充分考虑了漏标的情况，从而得到最佳的标准时间间隔，具体的技术手段参照以下具体实施例。

本实施例公开的一种数据集生成方法的具体步骤如图2所示：

首先，在步骤S210中，获取图像采集设备采集到的图像数据。所述图像采集设备包括带有摄像模块的可移动设备。所述带有摄像模块的可移动设备包括飞机、汽车、水下机器人和内窥镜中的一种。在本申请的以下实施方式中，以内窥镜为例进行详细说明。

接下来，执行步骤S220，根据预设方式获取标准操作反应时间间隔。所述标准操作反应时间间隔即为反应时间，例如大脑下发控制指令后，控制手指触碰方向标注(用于对反应和认知时间进行标定和记录的设备)设备按键的时间。所述方向标注设备可以是能够运行方向标注程序的计算设备，例如手机、电脑、平板电脑等终端，也可以是特制的专用于方向标注的设备，参照图3。图中所示的设备表面设置有6个专用于指示方向的按键和一个暂停键，在某个按键被触发时，所述按键对应的指令或标注结果即被发送至相应的处理设备以便进行标注处理。在本实施方式的一个实施例中，所述设备通过可以RJ45口或RS485口将某个按键对应的指令或标注结果发送至相应的处理设备。可以理解的是，制作为包括多个指示方向的按钮较为节约制造成本，但并不意味着仅仅可以实施为图3所示的外观和结构。所述按键还可以通过触摸屏上的虚拟按钮实现，本实施方式对此不做限定，例如可以通过计算机程序在手机或平板电脑的屏幕上显示类似于图3 中的各个方向的虚拟按钮，或者还可以将计算机设备的外设(键盘或鼠标)上的某些输入部件映射为所述方向按钮。类似地，在需要进行数据或指令传输时，也不仅仅限于RJ45口或RS485口，其还可以通过其他有线或无线的方式进行传输，作为一种实例，比如蓝牙、RFID、WIFI等无线传输模块可以集成在所述设备中，在某个方向按钮被触发后即可通过上述无线技术进行数据或指令的传输。

在本申请的各个实施方式中，用户可以根据实际情况选用各种设备实现方向标注，在准备工作完成后，用户可以根据图像数据做出方向判断(做出操作反应)，根据预设方式获取标准操作反应时间间隔，具体包括：

通过显示设备显示包括多个特定图像的图像数据并实时记录与所述特定图像相关联的操作反应的时间点；

具体而言，所述包括多个特定图像的图像数据可以是包括多个特定画面的视频，所述视频可以是事先制作的，专门用于采集操作反应时间间隔的视频。所述特定图像可以是显示方向标识的画面。所述方向标识可以是相应的文字，例如“左上”，或者所述方向标识可以是相应的符号，例如“→”代表向右。作为一个具体的实例，所述视频可以是内容为黑色静止背景，并在固定的视频长度中的固定时间点(例如：从开始后的第10秒)，展示停留500ms的居中白色字符(例如： “左上”，“前进”，“后退”)，所述白色字符每次停留的时间间隔需大于3秒，从而方便用户根据视频中的内容进行操作。需要说明的是，为了使得获取到的标准操作反应时间间隔更加具有代表性，更能适用于各种不同的场景，代表各种人群，所述用户并不是单单指代某一个人或某一类人，而是各式各样的人群的总称，在本实施方式的一个实施例中，将采集多个用户基于所述视频所做出的标注(即操作反应)从而得到更加具有普适性的标准操作反应时间间隔。为了方便理解上述实施例中所记载的标注过程，这里可以参考图4，图4中展示了用户根据固定长度的视频当前播放的内容进行标注的过程。

接下来，根据操作反应的时间点和与所述操作反应相关联的特定图像的时间点确定标准反应时间间隔。

可以理解的是，为了方便操作，上述实施例中所举的例子，包括多个特定图像的图像数据为固定时间长度的视频数据，所述视频中包括多个特定图像，为了方便区分用户根据不同的特定图像进行的不同反应，每一特定图像与相邻的特定图像的间隔不小于预设的时间长度(即上述实施例中所列举的白色字符每次停留的时间间隔需大于3秒)。可以理解的是，上述实施例中所列举的3秒仅仅是优选示例，并不代表仅限于此，其还可以是2秒、4秒、5秒等等，本实施方式对此不做限定。

在上述实施例中，为了方便进行操作反应时间间隔的统计，所述特定图像在所述视频的固定时间点显示，但是并不代表仅限于此，在本实施方式的其他实施例中，所述特定图像还可以在所述视频的随机时间点显示，只要相邻两个特定图像的显示时间间隔大于(用户最小反应时间)预设阈值即可，例如上述实施例中所列举的3秒。

在本实施方式中，为了方便说明，所述特定图像在所述视频的固定时间点显示，根据操作反应的时间点和与所述操作反应相关联的特定图像的时间点确定标准反应时间间隔，包括：

根据视频数据中包括的多个特定图像的显示时间构建第一矩阵；

根据实时记录的与所述视频数据中的多个特定图像相关联的操作反应的时间点构建第二矩阵；

基于所述第一矩阵和第二矩阵计算得到时间差矩阵；

基于所述时间差矩阵计算得到标准反应时间间隔。

具体来说，假设预先设置好所述视频的长度和每个时间点出现的按钮值，并将其设置为常量矩阵(即所述第一矩阵)，格式如下：

T(n)＝[t₁，t₂，...，t_n]

X(n)＝[x₁，x₂，...，x_n]

其中：T(n)是从视频开始到时间点t的时间长度的数组(矩阵)，单位为ms (毫秒，1秒等于1000毫秒)；X(n)是按钮按键的值x的数组(矩阵)；每个时间点的间隔大于3秒，即有t_k-t_k-1＞3，k＝1，2，...，n；n为时间间隔的总数， 0＜n＜L/3，L为视频的长度(单位为秒)。

按钮按下后传递的按钮按键值记录遍历矩阵(即所述第二矩阵)内容如下：

T′(m)＝[t′₁，t′₂，...，t′_m]

Y(m)＝[y₁，y₂，...，y_m]

其中：T′(n)为从视频开始到时间点t′的时间长度，单位为ms；Y(m)是按钮按键的值y的数组，m为按按钮总数。

由此，在本实施方式的一个实施例中，即可根据上述的数组(矩阵)T(n)和 T′(m)对应计算各个操作反应时间间隔，从而将各个操作反应时间间隔的平均值作为最终的标准操作反应时间间隔。

考虑到人类动作可能会存在漏标的行为，所以矩阵(即所述第一矩阵和第二矩阵)中的元素个数不一定会相同，故而不能直接通过矩阵减法计算时间差，确定标准反应时间间隔之前，所述方法还包括：

获取与所述特定图像相关联的操作反应中的有效操作反应。

所述有效操作反应即为特定图像中显示的内容与用户在对应时间点的标注行为一致，具体来说，在某个时间点视频中的画面显示“左上”，在所述画面出现后的3秒内，用户进行了左上的标注，即用户按下了代表左上的按钮按键，则可以将用户的标注行为记为有效。按照以上示例，在本实施例中，可以根据视频的内容对所述第二矩阵记录的内容进行逐个筛查，从而确保在计算标准时间间隔时的源数据准确，即根据有效操作反应的时间点进行标准时间间隔的计算。

接下来，根据有效操作反应的时间点和与所述有效操作反应相关联的特定图像的时间点确定标准反应时间间隔。

为了使得计算更加准确高效，在本实施方式的一个实施例中，根据操作反应的时间点和与所述操作反应相关联的特定图像的时间点确定标准反应时间间隔，包括：

计算与视频中出现特定图像的时间点距离最近的操作反应的时间点的索引；具体而言，包括：

构建元素为所述视频中出现多个特定图像的各个时间点的第三列矩阵；

构建元素为实时记录的各个操作反应的时间点的第四列矩阵；

根据第三列矩阵和第四列矩阵计算得到所述索引；

所述索引是否有效由以下方式确定：

若第四列矩阵与第三列矩阵中对应行的元素之差在第一阈值范围内，则确定所述索引为有效；

若第四列矩阵与第三列矩阵中对应行的元素之差不在第一阈值范围内，则确定所述索引为无效。

根据所述索引构建特定图像与操作反应一一匹配的对照矩阵；

基于所述对照矩阵中确定索引有效且特定图像与操作反应一一匹配的时间差矩阵；

基于所述时间差矩阵计算得到标准反应时间间隔。

延续上一实例，下面详细说明以上实施例中如何计算索引并确定标准反应时间间隔，首先计算距离视频固定时间点最近的操作(标注)时间点的索引，过程如下：

U(k)＝T′(m)^T-tt(k)

其中，T′(m)^T即为所述第四列矩阵；tt(k)是包含m行t_k的一维矩阵，即所述第三列矩阵；U(k)计算的是第k个固定时间点t_k与所有操作时间点tt(k)的差组成的一维矩阵；i是U(i)最小值的索引，得到按键时间点tt(k)中最接近的固定时间点t_k的固定时间点索引I(i)。

S是按下按钮后，最接近固定时间点1至n对应的时间点在数组T′(m)中的索引的对照值一维矩阵(即所述对照矩阵)。

得到提示内容按键内容一致，且索引有效的索引按键时间差矩阵，内容如下：

式中，Nv是固定时间点按键时间和手动出发时间点时间差和相同按键组成的矩阵；s[k]≠-1，k＝1，2，...n；x_k＝y_k表示显示器上显示上x＝上，人按按键y＝上，中间有t′_S[1]-t₁的延时，说明按键按对了，x_k为上位机已知视频的长度和每个时间点出现的按钮值，y_k为按钮按下后传递上位机记录。提取中间列，得到时间差矩阵，内容如下：

式中，N′是拆分Nv中间列得到时间差矩阵。索引无效，或索引相同但索引内按键不相同的内容如下：

其中，Ni是不符合要求的无效按键的下标组成的索引矩阵，无效说明按键按错了，显示器上出现x＝上，按键按了一个下，则x不等于y，Nv包括有效输入N′和错误输入Ni，最终只计算有效输入的平均误差，错误的不进行计算；s[k]＝-1， k＝1，2，...n；x_k≠y_k。

需要计算Nv内有效索引的时间差，并通过计算得到操作反应的平均时间，具体流程如下：

其中

为用户操作的平均反应时间(即所述标准操作反应时间间隔)。

可以理解的是，以上过程中的用户可以是同一用户，则根据以上实施例最终可以得到某一个用户的平均反应时间，接下来可以根据以上实施例得到多个不同用户的平均反应时间，继而由多个不同用户的平均反应时间进行平均计算得到所述标准操作反应时间间隔。或者以上实施例中也可以是多个不同用户交替进行的操作，由此，上述实施例中最终得到的也可以是基于多个不同用户的标准操作反应时间间隔。

在基于预设方式取得所述标准操作反应时间间隔后，基于所述标准操作反应时间间隔将所述图像数据与对应的操作关联，包括：

通过显示设备显示所述图像采集设备采集到的图像数据；

实时采集针对于所述图像数据的操作反应并记录所述操作反应的时间点；

具体来说，所述图像采集设备采集到的图像数据视应用场景各有不同，在所述图像采集设备搭载在汽车上时，采集到的图像数据可以是行车过程中的道路数据，在所述图像采集设备是内窥镜时，采集到的图像数据可以是相应器官的图像；所述图像采集设备可以直接通过有线或无线方式与所述显示设备连接，或者所述图像显示设备还可以通过中间设备中转与所述图像采集设备连接；接下来，即可将图像采集设备采集到的图像数据显示，从而方便用户标注，以便生成相应的训练数据集，可以立即的是，所述训练数据集可以不仅仅包括图像和标注结果，还包括基于所述图像识别出的运动特征数据，例如向量平均距离标量AvgL，向量平均速度标量AvgV，拟合向量平均距离标量AvgLF，拟合向量平均速度标量AvgVF，具体的运动数据分析方式不属于本申请的重点，不论是否包括以上运动数据的内容，都不影响训练数据集的生成。

在上述实施例中，可以将标注数据按“右上”、“右下”、“进”、“退”、“左上”和“左下”的顺序，分别转换为数字：0、1、2、3、4和5存入标签中，加上当前时间t₁，作为当前视频的标注数据集R₁。

同时视频内容可以包括向量平均距离标量AvgL，向量平均速度标量AvgV，拟合向量平均距离标量AvgLF，拟合向量平均速度标量AvgVF，当然也可以不包括以上运动特征数据，而仅仅是图像。在本实施例中，记当前时间为t₂，每帧的视频数据集为R₂。

其中，由于t₁比t₂具有T(所述标准操作时间间隔)时间的延时，则将t₂重新赋值为t₂+T。

遍历所有的标注数据和视频内容，比较t₁和t₂，如果t₂(前一帧时间)≤t₁≤t₂ (后一帧时间)，则将t₁所在的标注结果标签复制到视频数据集R₂中作为训练数据集。

根据本发明的方法可以得到高精度的数据集，所述高精度的数据集可以用于训练图像识别模型，所述图像识别模型的用途包括对目标对象的运动方向进行识别，从而所述图像识别模型能够采用本方法生成的数据集进行训练，得到更加准确的目标对象运动方向的识别结果，所述目标对象可以是采集图像数据的图像采集设备或者搭载所述图像采集设备的载具，从而基于本发明得到的数据集，能够训练出一种图像识别模型，所述图像识别模型可以根据采集到的图像数据的变化情况判断出采集所述图像数据的设备的运动方向。

Claims

1.一种数据集生成方法，其特征在于，包括以下步骤：

获取图像采集设备采集到的图像数据；

根据预设方式获取标准操作反应时间间隔；

基于标准操作反应时间间隔将图像数据与对应的操作关联；

基于与对应的操作关联后的图像数据生成训练数据集。

2.如权利要求1所述的数据集生成方法，其特征在于，所述图像采集设备包括带有摄像模块的可移动设备，其中，所述带有摄像模块的可移动设备包括飞机、汽车、水下机器人和内窥镜中的一种。

3.如权利要求1所述的数据集生成方法，其特征在于，根据所述预设方式获取所述标准操作反应时间间隔，包括以下步骤：

4.如权利要求3所述的数据集生成方法，其特征在于，包括多个所述特定图像的图像数据为固定时间长度的视频数据，视频数据中包括多个所述特定图像，每一所述特定图像与相邻的所述特定图像的间隔不小于预设的时间长度。

5.如权利要求4所述的数据集生成方法，其特征在于，所述特定图像在所述视频数据的固定时间点显示。

6.如权利要求4或5所述的数据集生成方法，其特征在于，根据所述操作反应的时间点和与所述操作反应相关联的所述特定图像的所述时间点确定所述标准反应时间间隔，包括以下步骤：

基于第一矩阵和第二矩阵计算得到时间差矩阵；

基于时间差矩阵计算得到所述标准反应时间间隔。

7.如权利要求4或5所述的数据集生成方法，其特征在于，确定所述标准反应时间间隔之前，所述数据集生成方法还包括：

获取与所述特定图像相关联的操作反应中的有效操作反应；

8.如权利要求4或5所述的数据集生成方法，其特征在于，根据所述操作反应的时间点和与所述操作反应相关联的所述特定图像的时间点确定所述标准反应时间间隔，包括以下步骤：

基于时间差矩阵计算得到所述标准反应时间间隔。

9.如权利要求8所述的数据集生成方法，其特征在于，计算与所述视频数据中出现所述特定图像的时间点距离最近的所述操作反应的时间点的所述索引，包括以下步骤：

根据第三列矩阵和第四列矩阵计算得到所述索引。

10.如权利要求9所述的数据集生成方法，其特征在于，所述索引是否有效由以下方式确定：

11.如权利要求9或10所述的数据集生成方法，其特征在于，基于所述标准操作反应时间间隔将所述图像数据与对应的操作关联，包括以下步骤：

通过显示设备显示所述图像采集设备采集到的图像数据；

12.一种数据集生成装置，其特征在于，包括：

13.如权利要求12所述的数据集生成装置，其特征在于，所述图像采集设备包括带有摄像模块的可移动设备，其中，所述带有摄像模块的可移动设备包括飞机、汽车、水下机器人和内窥镜中的一种。

14.如权利要求12所述的数据集生成装置，其特征在于，所述时间间隔获取模块还用于：

15.如权利要求14所述的数据集生成装置，其特征在于，包括多个所述特定图像的所述图像数据为固定时间长度的视频数据，视频数据中包括多个所述特定图像，每一所述特定图像与相邻的所述特定图像的间隔不小于预设的时间长度。

16.如权利要求15所述的数据集生成装置，其特征在于，所述特定图像在所述视频数据的固定时间点显示。

17.如权利要求15或16所述的数据集生成装置，其特征在于，所述时间间隔获取模块包括：

18.如权利要求15或16所述的数据集生成装置，其特征在于，所述时间间隔获取模块还包括：

19.如权利要求15或16所述的数据集生成装置，其特征在于，所述时间间隔获取模块还包括：

20.如权利要求19所述的数据集生成装置，其特征在于，所述时间索引获取单元包括：

21.如权利要求20所述的数据集生成装置，其特征在于，所述索引是否有效由以下方式确定：

22.如权利要求20或21所述的数据集生成装置，其特征在于，所述关联模块包括：