CN111695622B

CN111695622B - 变电作业场景的标识模型训练方法、标识方法及装置

Info

Publication number: CN111695622B
Application number: CN202010518643.0A
Authority: CN
Inventors: 于海; 彭林; 钱堃; 李凯; 徐敏; 王刚; 鲍兴川; 侯战胜; 王鹤; 刘睿; 朱亮; 韩海韵; 何志敏; 刘伟; 孙蓉; 邵剑
Original assignee: State Grid Corp of China SGCC; Southeast University; Global Energy Interconnection Research Institute; Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; Southeast University; Global Energy Interconnection Research Institute; Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Priority date: 2020-06-09
Filing date: 2020-06-09
Publication date: 2023-08-11
Anticipated expiration: 2040-06-09
Also published as: WO2021249575A1; CN111695622A

Abstract

本发明公开了一种变电作业场景的标识模型训练方法、标识方法及装置，其中，变电作业场景的标识方法包括：采集待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息；对关键帧图像进行图像分类，确定各子区域的关键帧图像的场景信息；根据物体信息及场景信息确定待测区域的物体特征、场景特征及历史场景特征；根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。通过实施本发明，避免了因单一信息来源而导致场景误分类，提高了场景识别的准确性。

Description

变电作业场景的标识模型训练方法、标识方法及装置

技术领域

本发明涉及电力技术领域，具体涉及一种变电作业场景的标识模型训练方法、标识方法及装置。

背景技术

在变电站作业环境中，越来越复杂的变电设备和相互之间的逻辑关系、以及各种特定功能的区域，增加了作业人员的认知负担。现有技术中通常利用视觉SLAM技术对电力作业环境进行扫描建模，得到整个环境空间的稠密地图或稀疏地图，然而其包含的粗略信息并不足以帮助作业人员判断环境区域和掌控任务情势。尽管通过电力巡检机器人可以进行环境区域识别，但是电力巡检机器人仅能进行环境区域识别而不能对环境区域进行理解，导致电力巡检机器人仍主要扮演环境监测数据采集的角色，不具备根据任务和环境区域进行自主推理规划的能力，对于复杂变电作业环境则无法进行准确的场景识别。

发明内容

本发明的主要目的在于提供一种变电作业场景的标识模型训练方法、标识方法及装置，以解决现有技术中复杂变电作业环境下场景识别的准确性不佳的问题。

根据第一方面，本发明实施例提供了一种变电作业场景的标识模型训练方法，包括以下步骤：采集目标区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取训练关键帧图像，并根据所述训练关键帧图像进行目标检测，获取所述训练关键帧图像的训练物体信息；对所述训练关键帧图像进行图像分类，确定各所述子区域的所述训练关键帧图像的训练场景信息；根据所述训练物体信息及训练场景信息确定所述目标区域的物体特征、场景特征及历史场景特征；根据所述物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。

结合第一方面，在第一方面的第一实施方式中，所述根据所述训练关键帧图像进行目标检测，获取所述目标区域中的所述训练关键帧图像的训练物体信息，包括：获取所述训练关键帧图像中与所述目标区域对应的训练物体，确定所述训练物体的物体数据，生成物体数据文件；根据所述物体数据文件对第二神经网络模型进行训练，得到目标检测模型；调用所述目标检测模型对所述训练关键帧图像中的所述训练物体进行识别，得到与所述训练物体对应的所述训练物体信息。

结合第一方面第一实施方式，在第一方面的第二实施方式中，所述对所述训练关键帧图像进行图像分类，确定各所述子区域的所述训练关键帧图像的训练场景信息，包括：获取所述训练关键帧图像中与所述目标区域对应的第一场景数据，对所述第一场景数据进行训练，获取训练后的第二场景数据；根据所述第二场景数据，对所述训练关键帧图像进行图像分类，得到与各所述子区域的所述训练关键帧图像对应的训练场景信息。

结合第一方面，在第一方面的第三实施方式中，所述根据所述训练物体信息及训练场景信息确定所述目标区域的物体特征、场景特征及历史场景特征，包括：以所述训练关键帧图像作为节点，建立场景区域识别模型，所述场景区域识别模型包括多个节点；根据所述训练物体信息确定各节点对应的所述目标区域的物体特征；根据所述训练场景信息确定各节点对应的所述目标区域的场景特征；根据当前节点对应的所述目标区域的场景特征以及前一节点对应的所述目标区域的场景特征确定所述目标区域的历史场景特征。

结合第一方面，在第一方面的第四实施方式中，所述根据所述物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型，包括：根据所述场景区域识别模型的各节点的所述物体特征、所述场景特征及所述历史场景特征确定与所述场景区域识别模型的各所述节点对应的能量函数；根据所述各所述节点对应的能量函数，确定所述场景区域识别模型对应的总能量函数；根据所述总能量函数，确定所述场景区域识别模型对应的目标函数；以所述各所述节点的所述物体特征、所述场景特征及所述历史场景特征作为输入样本，以所述目标函数作为输出，对所述第一神经网络模型进行训练，生成所述场景标识模型。

根据第二方面，本发明实施例提供了一种变电作业场景的标识方法，包括：采集待测区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取关键帧图像，并根据所述关键帧图像进行目标检测，获取所述关键帧图像的物体信息；对所述关键帧图像进行图像分类，确定各所述子区域的所述关键帧图像的场景信息；根据所述物体信息及场景信息确定所述待测区域的物体特征、场景特征及历史场景特征；根据所述物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。

结合第二方面，在第二方面的第一实施方式中，还包括：根据各所述子区域的所述关键帧图像的目标场景信息，生成语义地图；获取所述关键帧图像的深度图像信息，根据所述关键帧图像对应的物体信息以及所述关键帧图像的深度图像信息，在所述语义地图中标识目标物体。

结合第二方面第一实施方式，在第二方面的第二实施方式中，所述根据各所述子区域的所述关键帧图像的目标场景信息，生成语义地图，获取所述关键帧图像的深度图像信息，包括：根据各所述子区域的所述关键帧图像的目标场景信息，确定各所述子区域对应的RGB数值；根据各所述子区域对应的RGB数值，生成语义地图。

结合第二方面第二实施方式，在第二方面的第三实施方式中，所述根据各所述子区域的所述关键帧图像的目标场景信息，确定各所述子区域对应的RGB数值的计算公式为：

其中，i表示当前子区域的关键帧图像的目标场景信息。

结合第二方面第二实施方式，在第二方面的第四实施方式中，所述根据所述关键帧图像对应的物体信息以及所述关键帧图像的深度图像信息，在所述语义地图中标识目标物体，包括：获取所述关键帧图像对应的物体信息；根据所述物体信息与所述深度图像信息，确定所述目标物体的空间位置；根据所述空间位置在所述语义地图中确定所述目标区域中不同子区域的所述目标物体。

根据第三方面，本发明实施例提供了一种变电作业场景的标识模型训练装置，包括：第一采集模块，用于采集目标区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取训练关键帧图像，并根据所述训练关键帧图像进行目标检测，获取所述训练关键帧图像的训练物体信息；分类模块，用于对所述训练关键帧图像进行图像分类，确定各所述子区域的所述训练关键帧图像的训练场景信息；特征提取模块，用于根据所述训练物体信息及训练场景信息确定所述目标区域的物体特征、场景特征及历史场景特征；模型生成模块，用于根据所述物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。

根据第四方面，本发明实施例提供了一种变电作业场景的标识装置，包括：物体信息获取模块，用于采集待测区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取关键帧图像，并根据所述关键帧图像进行目标检测，获取所述关键帧图像的物体信息；场景信息获取模块，用于对所述关键帧图像进行图像分类，确定各所述子区域的所述关键帧图像的场景信息；特征确定模块，用于根据所述物体信息及场景信息确定所述待测区域的物体特征、场景特征及历史场景特征；生成模块，用于根据所述物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。

根据第五方面，本发明实施例提供了一种计算机设备，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行第一方面或第一方面任一实施方式中所述的变电作业场景的标识模型训练方法或执行第二方面或第二方面任一实施方式中所述的变电作业场景的标识方法。

根据第六方面，本发明实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行第一方面或第一方面任一实施方式中所述的变电作业场景的标识模型训练方法或执行第二方面或第二方面任一实施方式中所述的变电作业场景的标识方法。

本发明技术方案，具有如下优点：

1.本发明提供的变电作业场景的标识模型训练方法及装置，针对复杂的变电作业环境，通过采集复杂的变电作业场景中不同子区域中的连续图像，建立图像数据集，从该图像数据集中提取用于训练标识模型的训练关键帧图像，并根据训练关键帧图像进行目标检测，获取训练关键帧图像的训练物体信息，对训练关键帧图像进行图像分类，确定各子区域的训练关键帧图像的训练场景信息，根据训练物体信息及训练场景信息确定目标区域的物体特征、场景特征及历史场景特征；根据物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。基于目标区域的各子区域的训练关键帧图像的训练物体信息和训练场景信息结合神经网络模型确定场景标识模型，避免出现场景误分类的情况，提高了场景识别的准确性。

2.本发明提供的变电作业场景的标识方法及装置，通过采集变电作业环境中待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息，对关键帧图像进行图像分类，确定各子区域的关键帧图像对应的场景信息，根据关键帧图像对应的物体信息及场景信息确定变电作业场景中待测区域的物体特征、场景特征及历史场景特征，再根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。根据待测区域中的关键帧图像对应的物体信息和场景信息结合场景标识模型确定目标场景信息，避免了因单一信息来源而导致场景误分类，提高了场景识别的准确性。

3.本发明提供的变电作业场景的标识方法及装置，根据关键帧图像对应的目标场景信息，建立语义地图，根据变电作业场景中关键帧图像对应的物体信息、场景信息和深度图像信息，标注出目标物体在语义地图中的场景信息和位置信息，实现了对变电作业环境区域的抽象语义表达，提高了该标识方法的应用性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本发明实施例中变电作业场景的标识模型训练方法的流程图；

图2为本发明实施例中关键帧的共视结构示意图；

图3为本发明实施例中CRF场景区域识别模型的结构示意图；

图4为本发明实施例中变电作业场景的标识方法的流程图；

图5为本发明实施例中变电作业场景的标识方法的流程图；

图6为本发明实施例中变电作业场景的标识模型训练装置的原理框图；

图7为本发明实施例中变电作业场景的标识装置的原理框图；

图8为本发明实施例中计算机设备的结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

实施例1

本实施例提供一种变电作业场景的标识模型训练方法，可应用于复杂的变电作业环境以进行场景识别，如图1所示，该方法包括如下步骤：

S11，采集目标区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取训练关键帧图像，并根据训练关键帧图像进行目标检测，获取训练关键帧图像的训练物体信息。

示例性地，目标区域可以为变电作业环境中的任一待测区域，任一待测区域可以对应包含多个子区域，目标区域中不同子区域的连续图像可以采用RGB-D传感器获取，将获取的目标区域的连续图像组合成图像数据集。基于视觉即时定位与地图构建(simultaneous localization and mapping，SLAM)技术从图像数据集中提取训练关键帧图像，对训练关键帧图像中的物体进行识别，获取训练关键帧图像的训练物体信息。

S12，对训练关键帧图像进行图像分类，确定各子区域的训练关键帧图像的训练场景信息。

示例性地，根据变电作业环境选取的区域不同，对应得到的训练关键帧图像不同，对得到的训练关键帧图像进行图像分类。基于选取的区域不同可以为不同区域设定场景类别标签，其不同区域对应的场景类别标签可以使用数字表示，其场景类别标签集合可以表示为K_s＝{0,1,2,...,L-1}，其中，L为场景类别总数。根据训练关键帧图像的图像分类结果，进而确定各子区域的训练关键帧图像的训练场景信息。

S13，根据训练物体信息及训练场景信息确定目标区域的物体特征、场景特征及历史场景特征。

示例性地，根据生成的目标检测模型对变电作业环境中获取的训练关键帧图像进行实时物体检测，获取目标区域的物体特征；根据训练得到的与各子区域的训练关键帧图像对应的训练场景信息中提取目标区域的场景特征；以当前训练关键帧图像对应的场景特征与前一训练关键帧图像对应的场景特征作差，得到历史场景特征。

S14，根据物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。

示例性地，第一神经网络模型为场景区域识别模型，通过构建的场景区域识别模型可以得到对应各节点的物体特征、场景特征及历史场景特征的输入特征向量，以每个训练关键帧图像的输入特征向量作为输入样本，场景类别标签值作为输出样本对场景区域识别模型进行训练，生成场景标识模型。

本实施例提供的变电作业场景的标识模型训练方法，针对复杂的变电作业环境，通过采集复杂的变电作业场景中不同子区域中的连续图像，建立图像数据集，从该图像数据集中提取用于训练标识模型的训练关键帧图像，并根据训练关键帧图像进行目标检测，获取训练关键帧图像的训练物体信息，对训练关键帧图像进行图像分类，确定各子区域的训练关键帧图像的训练场景信息，根据训练物体信息及训练场景信息确定目标区域的物体特征、场景特征及历史场景特征；根据物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。基于目标区域的各子区域的训练关键帧图像的训练物体信息和训练场景信息结合神经网络模型确定场景标识模型，避免出现场景误分类的情况，提高了场景识别的准确性。

作为本申请一个可选的实施方式，步骤S11中根据训练关键帧图像进行目标检测，获取目标区域中的训练关键帧图像的训练物体信息，包括：

步骤1，获取训练关键帧图像中与目标区域对应的训练物体，确定训练物体的物体数据，生成物体数据文件。

示例性地，从训练关键帧图像中提取与变电作业环境中目标区域对应的训练物体，比如一次设备、二次设备，确定物体类别标签及其对应的类别数字集合K_o＝{0,1,2,...,N-1}，其中，N为物体标签总数。利用图片标注工具框对图片中的物体进行标注并赋予相应物体标签，生成物体数据文件。

步骤2，根据物体数据文件对第二神经网络模型进行训练，得到目标检测模型。

示例性地，将生成的物体数据文件用来训练第二神经网络模型，确定目标检测模型。第二神经网络模型可以根据训练样本确定，本领域技术人员可以根据实际需要确定。若训练样本较少，可以利用公共对象(Common Objects in Context，COCO)数据集上预训练的yolo3权重，针对具体变电作业环境下所采集到的连续图像及采用图片标注工具框标注的物体数据，在yolo3-coco权重的基础上进行微调，最终得到目标检测模型。

步骤3，调用目标检测模型对训练关键帧图像中的训练物体进行识别，得到与训练物体对应的训练物体信息。

示例性地，训练物体信息为训练关键帧图像中的训练物体所对应的物体置信度向量。基于视觉SLAM技术生成的训练关键帧图像，调用上述生成的目标检测模型识别训练关键帧图像中的物体，输出每个训练关键帧图像中所包含的各个训练物体的物体类别及其置信度，组成一个N维物体置信度向量。设第n个类别物体的置信度为o_n，其中n∈K_o，则第i个训练关键帧图像的物体置信度向量为v_{obj_i}＝(o₀,o₁,...,o_N-1)，未检测到的训练物体对应的物体置信度为0。

作为本申请一个可选的实施方式，上述步骤S12，可以包括：

步骤1，获取训练关键帧图像中与目标区域对应的第一场景数据，对第一场景数据进行训练，获取训练后的第二场景数据。

示例性地，第一场景数据为对应目标区域获取的训练关键帧图像的场景类别标签集合，第二场景数据为训练关键帧图像对应的各子区域的场景类别标签的置信度向量。根据第一场景数据的样本数量选取神经网络模型进行训练，在进行训练时需要将第一场景数据转换成对应所选取神经网络模型相应的数据格式，若第一场景数量的训练数据量较少，则可以采用场景预训练模型place205的场景数据集上预训练的模型权重进行微调，获取微调后的场景预训练模型，直接对目标区域中训练关键帧图像进行图片分类，得到训练关键帧图像对应的各子区域的场景类别标签的置信度向量，即得到第二场景数据。其中，第i个训练关键帧图像对应的各子区域的场景类别标签的置信度向量表示为v_{scene_i}＝(s₀,s₁,...,s_L-1)，第l个场景的场景类别标签的置信度为s_l，其中，l∈K_s。

步骤2，根据第二场景数据，对训练关键帧图像进行图像分类，得到与各子区域的训练关键帧图像对应的训练场景信息。

示例性地，训练场景信息为训练关键帧图像对应的各子区域的场景类别标签的置信度向量，基于视觉SLAM生成的训练关键帧图像之间的共视关系可以调整训练关键帧图像对应的各子区域的场景类别标签的置信度结果，共视关系即两个或多个训练关键帧图像观测到了同样的3D地图点，如图2所示。将训练关键帧图像i与训练关键帧图像j的共视程度表示为其中count_i,j为训练关键帧图像i和训练关键帧图像j共有的3D点数量，count_j为训练关键帧图像j所有的3D点数量，利用与训练关键帧图像i共视的所有训练关键帧图像集合更新训练关键帧图像对应的各子区域的场景类别标签的置信度向量，并将更新的训练关键帧图像对应的各子区域的场景类别标签的置信度向量表示为：/>

在获取目标区域的物体特征、场景特征及历史场景特征之前，需要建立场景区域识别模型，作为本申请一个可选的实施方式，上述步骤S13，包括：

步骤1，以训练关键帧图像作为节点，建立场景区域识别模型，场景区域识别模型包括多个节点。

示例性地，以训练关键帧图像作为节点，每个节点只受到前一个节点的影响，且每个节点的观测节点为相应的物体信息和场景信息的集合。由于目标区域对应多个训练关键帧图像，因此，生成的场景区域识别模型包括多个节点。将节点表示为场景类别随机变量V，节点之间的边代表各节点之间的相互关系。假设场景类别标签集合K_s＝{0,1,2,...,L-1}，L为场景类别总数，则可以将场景类别随机变量赋予标签定义：其中，x_i表示为任意两个节点之间的依赖关系。

构造包含一节点及其前一个节点的条件随机场(conditional random field,CRF)的场景区域识别模型，如图3所示。图中O₁、O₂、O₃代表在第i-1帧训练关键帧图像(第i-1个节点)中观测到的训练物体，i为正整数，O₁、O₂、O₄代表在第i帧训练关键帧图像(第i个节点)中观测到的训练物体，则第i个节点的能量函数Eⁱ(x,y)等于该节点的物体能量场景能量/>和历史环境能量/>场景能量用来反映通过卷积神经网络(Convolutional NeuralNetworks，CNNs)直接对训练关键帧图像进行场景分类得到的全局特征，物体能量用来表示此训练关键帧图像节点中检测物体得到的局部特征，历史环境能量表征了前一帧训练关键帧图像节点对当前训练关键帧图像节点的影响，反映了场景类别标签的时空连续性。最终所有节点的总能量E(x,y)见下式，其中V是待标记的节点数目。

需要说明的是，条件随机场CRF是概率图模型的一种，用图G＝(V,E)的形式表示元素之间的关系，V代表该图的所有顶点集，每个顶点表示一个随机变量，E代表图中所有边的集合，每条边表示两个随机变量之间的一种依赖关系。利用CRF可以将对未知变量的估计或推测问题转换为概率分布的计算问题，即构建出CRF场景区域识别模型后，可以求解出在当前的观测条件x下，属于每一个场景类别y的概率，使得该条件概率最大的区域类别即为当前最可能的区域类别。此过程的概率求解公式如下：

其中，P(y|x)是观察值x和真实标签y的联合分布，P(x)是观察值x的概率，为定值。因此使得该条件概率最大时的标签估计等于联合分布概率最大值时对应的标签估计/>即：

条件随机场CRF具有马尔科夫性质，即假设有一个随机变量序列X＝{x₁,x₂,...,x_n}，则每个状态只依赖于它之前的状态：

P(x_i|x₁,x₂,...,x_n)＝P(x_i|x_i-1)

对于任意两个节点之间有边连接的图的部分被称为团，CRF使用势函数和团来定义条件概率，假设整个CRF的分布含有k个团，每个团记为x_{k}，{k}代表该团所含有的节点结合，Φ_k(x_{k})表示该团的势函数，则该CRF可写为所有团的势函数的乘积式：

其中Z为归一化常数，为了满足非负性，将Φ_k(x_{k})写为对数线性模型：

Φ_k(x_{k})＝exp(-w_kφ_k(x_{k}))

为了便于分离变量和求解，将条件概率分布写为能量函数的形式：

其中φ表示该团映射到实数的势函数，w代表权值，E(x)表示关于随机变量的能量函数。能量函数通常写成一元变量和二元变量的形式：

则条件概率最大时的标签估计即为使得能量函数最小的随机变量X＝{x₁,x₂,...,x_n}的标签集。

步骤2，根据训练物体信息确定各节点对应的目标区域的物体特征。

示例性地，根据上述步骤中生成的目标检测模型对训练关键帧图像中的训练物体进行实时检测，进而可以获取到目标区域中第i个训练关键帧图像检测到的所有物体信息v_{obj_i}＝(o₀,o₁,...,o_N-1)，确定目标区域的物体特征φ_o。以φ_o(i)表示为第i个节点观测到的物体类别，其置信度φ_o(i)＝v_{obj_i}，未观测到的物体置信度为0，从而得到维度为N的物体特征数据，N是物体标签总数。

步骤3，根据训练场景信息确定各节点对应的目标区域的场景特征。

示例性地，利用选取神经网络模型对第一场景数据进行训练以进行场景区域分类，进而可以得到训练后的第二场景数据v'_{scene_i}＝(s'₀,s′₁,...,s'_L-1)，结合训练关键帧图像之间的共视关系对场景区域分类结果进行初步改进，得到目标区域的场景特征φ_s。以φ_s(i)表示为对第i个节点对应场景类别，其置信度φ_s(i)＝v'_{scene_i}，从而得到维度为L的场景特征数据，L是场景标签总数。

步骤4，根据当前节点对应的目标区域的场景特征以及前一节点对应的目标区域的场景特征确定目标区域的历史场景特征。

示例性地，通过场景区域识别模型确定各节点的场景特征，选择当前节点的场景特征φ_s(i)减去前一个节点的场景特征φ_s(i-1)，作为当前节点的历史环境特征φ_t(i)，第0个节点的历史环境特征等于其场景特征φ_t(0)。

通过将场景区域识别模型中前一帧训练关键帧图像中包含的场景特征数据融入当前帧的训练关键帧图像中进行场景类别判断，可以有效提高场景区域识别的准确性。

作为本申请一个可选的实施方式，上述步骤S14，包括：

步骤1，根据场景区域识别模型的各节点的物体特征、场景特征及历史场景特征确定与场景区域识别模型的各节点对应的能量函数。

示例性地，根据场景区域识别模型的各节点的物体特征、场景特征及历史场景特征确定各节点对应的物体特征向量、场景特征向量和历史场景特征向量，根据节点对应的物体特征向量、场景特征向量和历史场景特征向量可以确定与场景区域识别模型的各节点对应的能量函数，该能量函数可以表达为带有权值参数的特征线性组合的形式：

其中，E_o表示物体特征能量函数，E_s表示场景特征能量函数，E_t表示历史场景特征能量函数；i表示第i个节点，V标识为待标签的节点数。K_o＝{0,1,2,...,N-1}表示物体类别标签集合，N为物体标签总数，K_s＝{0,1,2,...,L-1}表示场景类别标签集合，L为场景标签总数。φ表示将团映射到实数的势函数，即确定的与场景区域识别模型的各节点对应的物体特征、场景特征及历史场景特征，φ_o表示物体特征、φ_s表示场景特征、φ_t表示历史环境特征；w是权值向量。是一个二进制变量，其定义为：

步骤2，根据各节点对应的能量函数，确定场景区域识别模型对应的总能量函数。

示例性地，根据各节点对应的能量函数，确定总能量函数。总能量函数可以表达为：

其中，E(x,y)为总能量。

步骤3，根据总能量函数，确定场景区域识别模型对应的目标函数。

示例性地，根据各节点建立的总能量函数，可以确定场景区域识别模型对应的目标函数为：

其中y为场景类别标签集合，为能量函数最大时对应的场景类别标签取值。

步骤4，以各节点的物体特征、场景特征及历史场景特征作为输入样本，以目标函数作为输出，对第一神经网络模型进行训练，生成场景标识模型。

示例性地，根据构造的CRF场景区域识别模型确定能量函数以及目标函数之后，就可以利用结构支持向量机(Structural SVM)训练CRF场景区域识别模型，并获取场景区域识别模型的参数，训练场景区域识别模型时输入特征向量x＝(φ_o(i),φ_s(i),φ_t(i))^T，该特征向量可以表示为各部分特征向量的集合，训练场景区域识别模型时将每个训练关键帧图像对应的特征向量x作为一个输入样本，其真实的场景类别标签作为输出样本，采用Structural SVM训练CRF场景区域识别模型，生成场景标识模型，并获得场景标识模型对应的所有参数权重。

在视觉SLAM的框架下，在建立CRF场景标识模型中融合物体信息和场景信息，在实现场景区域识别的基础上进一步提高了场景区域识别和物体识别的准确性。

实施例2

本实施例提供一种变电作业场景的标识方法，应用于复杂的变电作业环境的场景识别，用于车载或头戴RGB-D传感器的巡检机器人或巡检作业人员，在电力作业环境中对不同场景进行区域类别识别和对各种变电设备类别进行识别，以在创建的环境3D地图中标注出区域和设备类别的语义信息，如图4所示，该方法包括如下步骤：

S21，采集待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息。

示例性地，待测区域为变电作业环境中的需要检测的区域，对于关键帧图像的物体信息的获取方式与上述实施例的步骤S11的获取方式一致，详细内容请参见上述实施例中与步骤S11相关的描述，在此不再赘述。

S22，对关键帧图像进行图像分类，确定各子区域的关键帧图像的场景信息。详细内容请参见上述实施例中与步骤S12相关的描述，在此不再赘述。

S23，根据物体信息及场景信息确定待测区域的物体特征、场景特征及历史场景特征。详细内容请参见上述实施例中与步骤S13相关的描述，在此不再赘述。

S24，根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。预设的场景标识模型根据上述实施例步骤S11～S14训练得到，将获取的物体特征、场景特征及历史场景特征输入至预设的场景标识模型，输出目标场景信息。

本实施例提供的变电作业场景的标识方法，通过采集变电作业环境中待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息，对关键帧图像进行图像分类，确定各子区域的关键帧图像对应的场景信息，根据关键帧图像对应的物体信息及场景信息确定变电作业场景中待测区域的物体特征、场景特征及历史场景特征，再根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。根据待测区域中的关键帧图像对应的物体信息和场景信息结合场景标识模型确定目标场景信息，避免了因单一信息来源而导致场景误分类，提高了场景识别的准确性。

作为本申请一个可选的实施方式，如图5所示，该变电作业场景的标识方法还包括：

S25，根据各子区域的关键帧图像的目标场景信息，生成语义地图。

示例性地，通过场景标识模型获取到关键帧图像的目标场景信息后，对该目标场景信息赋予不同的RGB数值，根据不同颜色的关键帧图像生成语义地图。

具体的，步骤S25，包括：

步骤1，根据各子区域的关键帧图像的目标场景信息，确定各子区域对应的RGB数值。

示例性地，设当前某子区域的关键帧图像的目标场景信息对应的场景类别标签为i，则该子区域对应的RGB数值计算方法如下：

其中，i表示当前子区域的关键帧图像的目标场景信息对应的场景类别标签。

步骤2，根据各子区域对应的RGB数值，生成语义地图。

示例性地，通过上述RGB数值计算方法可以完成27种场景类别标签的颜色分配。结合视觉SLAM方法生成的包含关键帧图像和地图点的稀疏地图上，对不同场景的关键帧图像和地图点渲染不同的颜色。由于地图点通常可以被多个关键帧检测到，由此可以利用关键帧图像的场景信息进一步决定地图点的语义标签。根据关键帧图像的场景类别标签的置信度向量v'_{scene_i}＝(s'₀,s′₁,...,s'_L-1)，可以确定地图点p的置信度向量v_p为：

其中P为观察到地图点p的关键帧图像集合，n为该集合中关键帧图像总数，求得max{v_p}所对于的标签即为该地图点的最终语义标签，根据最终确定的语义标签确定生成的语义地图。

S26，获取关键帧图像的深度图像信息，根据关键帧图像对应的物体信息以及关键帧图像的深度图像信息，在语义地图中标识目标物体。

示例性地，根据获取的关键帧图像，提取关键帧图像对应的深度图像信息，通过目标检测模型可以获取对应关键帧图像的物体信息，根据获取的物体信息和深度图像信息之间的对应关系，可以在语义地图中对目标物体进行标识。并结合关键帧对应的深度信息和物体信息在语义地图中标识出各个物体。

根据关键帧图像对应的目标场景信息，建立语义地图，根据变电作业场景中关键帧图像对应的物体信息、场景信息和深度图像信息，标注出目标物体在语义地图中的场景信息和位置信息，实现了对变电作业环境区域的抽象语义表达，在提高场所区域识别准确性的同时改善了运算性能，提高了该标识方法的应用性。

作为本申请一个可选的实施方式，上述步骤S26，包括：

步骤1，获取关键帧图像对应的物体信息以及对应的关键帧图像的深度图像信息。

示例性地，关键帧图像对应的物体信息以及关键帧图像的深度图像信息可以通过目标检测模型进行获取。

步骤2，根据物体信息与深度图像信息，确定目标物体的空间位置。

示例性地，根据目标检测模型获得的物体信息和相应关键帧图像的深度图像信息，可以通过当前相机位姿对目标物体的空间位置进行确定，进而可以确定目标物体的不同类别。

步骤3，根据空间位置在语义地图中标识目标区域中不同子区域的目标物体。

示例性地，根据获取的空间位置在语义地图中标注目标物体，若在连续关键帧图像的相近位置中检测到同一类别的目标物体时，可以根据不同关键帧图像之间的欧式距离确定是否连续关键帧图像中检测到的同一类别的目标物体是否为同一目标物体，若连续关键帧图像中检测到的同一类别的目标物体为同一目标物体，则在语义地图中对该目标物体进行标识。

将上述变电作业场景的标识方法应用于在含有会议室、走廊、设备间、办公室四种区域类型的室内场所中进行测试确定其区域类别识别率，如表1所示。分别采用三种方法对会议室、走廊、设备间、办公室四种区域进行识别，其中，方法1是仅采用在场景数据集下训练得到的深度卷积神经网络Resnet50模型作为场景分类器；方法2是采用本技术方案提出的场景特征结合CRF模型的方法，但是不包含物体特征；方法3是采用本技术方案提出的变电作业场景的标识方法，即场景特征、物体特征结合CRF模型的方法。通过对比三种方法的区域类别识别率，可见本技术方案提出的方法在四种场景类别的识别率上是三种方法中最高的，相比仅采用深度卷积神经网络作为场景分类器的方法有了明显提升。

表1四种场所类别下的区域类别识别率

由此，在视觉SLAM的框架下，通过在建立CRF场景标识模型中融合物体信息和场景信息，能够在实现场景区域识别的基础上进一步提高场景区域识别和物体识别的准确率。

实施例3

本实施例提供一种变电作业场景的标识模型训练装置，可应用于复杂的变电作业环境以进行场景识别，如图6所示，该装置包括：

第一采集模块31，用于采集目标区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取训练关键帧图像，并根据训练关键帧图像进行目标检测，获取训练关键帧图像的训练物体信息。详细内容请参见上述任意方法实施例的步骤S11的相关描述，在此不再赘述。

分类模块32，用于对训练关键帧图像进行图像分类，确定各子区域的训练关键帧图像的训练场景信息。详细内容请参见上述任意方法实施例的步骤S12的相关描述，在此不再赘述。

特征提取模块33，用于根据训练物体信息及训练场景信息确定目标区域的物体特征、场景特征及历史场景特征。详细内容请参见上述任意方法实施例的步骤S13的相关描述，在此不再赘述。

模型生成模块34，用于根据物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。详细内容请参见上述任意方法实施例的步骤S14的相关描述，在此不再赘述。

本实施例提供的变电作业场景的标识模型训练装置，针对复杂的变电作业环境，通过采集复杂的变电作业场景中不同子区域中的连续图像，建立图像数据集，从该图像数据集中提取用于训练标识模型的训练关键帧图像，并根据训练关键帧图像进行目标检测，获取训练关键帧图像的训练物体信息，对训练关键帧图像进行图像分类，确定各子区域的训练关键帧图像的训练场景信息，根据训练物体信息及训练场景信息确定目标区域的物体特征、场景特征及历史场景特征；根据物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。基于目标区域的各子区域的训练关键帧图像的训练物体信息和训练场景信息结合神经网络模型确定场景标识模型，避免出现场景误分类的情况，提高了场景识别的准确性。

作为本申请一个可选的实施方式，上述第一采集模块31，包括：

数据文件生成子模块，用于获取训练关键帧图像中与目标区域对应的训练物体，确定训练物体的物体数据，生成物体数据文件。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

目标检测模型确定子模块，用于根据物体数据文件对第二神经网络模型进行训练，得到目标检测模型。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

调用子模块，用于调用目标检测模型对训练关键帧图像中的训练物体进行识别，得到与训练物体对应的训练物体信息。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

作为本申请一个可选的实施方式，上述分类模块32，包括：

第一获取子模块，用于获取训练关键帧图像中与目标区域对应的第一场景数据，对第一场景数据进行训练，获取训练后的第二场景数据。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

第二获取子模块，用于根据第二场景数据，对训练关键帧图像进行图像分类，得到与各子区域的训练关键帧图像对应的训练场景信息。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

作为本申请一个可选的实施方式，上述特征提取模块33，包括：

场景区域识别模型建立子模块，用于以训练关键帧图像作为节点，建立场景区域识别模型，场景区域识别模型包括多个节点。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

第一确定子模块，用于根据训练物体信息确定各节点对应的目标区域的物体特征。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

第二确定子模块，用于根据训练场景信息确定各节点对应的目标区域的场景特征。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

第三确定子模块，用于根据当前节点对应的目标区域的场景特征以及前一节点对应的目标区域的场景特征确定目标区域的历史场景特征。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

本实施例提供的变电作业场景的标识模型训练装置，通过将场景区域识别模型中前一帧训练关键帧图像中包含的场景特征数据融入当前帧的训练关键帧图像中进行场景类别判断，可以有效提高场景区域识别的准确性。

作为本申请一个可选的实施方式，上述模型生成模块34，包括：

第四确定子模块，用于根据场景区域识别模型的各节点的物体特征、场景特征及历史场景特征确定与场景区域识别模型的各节点对应的能量函数。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

第五确定子模块，用于根据各所述节点对应的能量函数，确定场景区域识别模型对应的总能量函数。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

第六确定子模块，用于根据总能量函数，确定场景区域识别模型对应的目标函数。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

训练子模块，用于以各节点的物体特征、场景特征及历史场景特征作为输入样本，以目标函数作为输出，对第一神经网络模型进行训练，生成场景标识模型。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

本实施例提供的变电作业场景的标识模型训练装置，通过在视觉SLAM的框架下建立CRF场景标识模型，在建立CRF场景标识模型中融合物体信息和场景信息，在实现场景区域识别的基础上进一步提高了场景区域识别和物体识别的准确性。

实施例4

本实施例提供一种变电作业场景的标识装置，应用于复杂的变电作业环境的场景识别，如图7所示，该装置包括：

物体信息获取模块41，用于采集待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息。详细内容请参见上述任意方法实施例的步骤S21的相关描述，在此不再赘述。

场景信息获取模块42，用于对关键帧图像进行图像分类，确定各子区域的关键帧图像的场景信息。详细内容请参见上述任意方法实施例的步骤S22的相关描述，在此不再赘述。

特征确定模块43，用于根据物体信息及场景信息确定待测区域的物体特征、场景特征及历史场景特征。详细内容请参见上述任意方法实施例的步骤S23的相关描述，在此不再赘述。

生成模块44，用于根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。详细内容请参见上述任意方法实施例的步骤S24的相关描述，在此不再赘述。

本实施例提供的变电作业场景的标识装置，通过采集变电作业环境中待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息，对关键帧图像进行图像分类，确定各子区域的关键帧图像对应的场景信息，根据关键帧图像对应的物体信息及场景信息确定变电作业场景中待测区域的物体特征、场景特征及历史场景特征，再根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。根据待测区域中的关键帧图像对应的物体信息和场景信息结合场景标识模型确定目标场景信息，避免了因单一信息来源而导致场景误分类，提高了场景识别的准确性。

作为本申请一个可选的实施方式，该变电作业场景的标识装置还包括：

语义地图生成模块，用于根据各子区域的关键帧图像的目标场景信息，生成语义地图。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

标识模块，用于获取关键帧图像的深度图像信息，根据关键帧图像对应的物体信息以及关键帧图像的深度图像信息，在所述语义地图中标识目标物体。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

作为本申请一个可选的实施方式，上述语义地图生成模块，包括：

RGB数值确定子模块，用于根据各子区域的关键帧图像的目标场景信息，确定各子区域对应的RGB数值。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

生成子模块，用于根据各子区域对应的RGB数值，生成语义地图。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

作为本申请一个可选的实施方式，上述RGB数值确定子模块进行RGB数值计算的公式为：

其中，i表示当前子区域的关键帧图像的目标场景信息。

作为本申请一个可选的实施方式，上述标识模块，包括：

信息获取子模块，用于获取关键帧图像对应的物体信息以及对应的关键帧图像的深度图像信息。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

空间位置确定子模块，用于根据物体信息与深度图像信息，确定目标物体的空间位置。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

目标物体确定子模块，用于根据空间位置在语义地图中确定目标区域中不同子区域的目标物体。详细内容请参见上述方法实施例的相关描述，在此不再赘述。

本发明实施例还提供了一种计算机设备，如图7所示，该设备包括处理器51和存储器52，其中处理器51和存储器52可以通过总线或者其他方式连接，图8中以通过总线50连接为例。

处理器51可以为中央处理器(Central Processing Unit，CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、图形处理器(Graphics Processing Unit，GPU)、嵌入式神经网络处理器(Neural-network ProcessingUnit，NPU)或者其他专用的深度学习协处理器、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

存储器52作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本发明实施例中的变电作业场景的标识模型训练方法对应的程序指令/模块(例如，图6所示的第一采集模块31、分类模块32、特征提取模块33和模型生成模块34)或本发明实施例中的变电作业场景的标识方法对应的程序指令/模块(例如，图7所示的物体信息获取模块41、场景信息获取模块42、特征确定模块43和生成模块44)。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的变电作业场景的标识模型训练方法和变电作业场景的标识方法。

存储器52可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储处理器51所创建的数据等。此外，存储器52可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器52可选包括相对于处理器51远程设置的存储器，这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器52中，当被所述处理器51执行时，执行如图1-图5所示实施例中的变电作业场景的标识模型训练方法或变电作业场景的标识方法。

针对复杂的变电作业环境，通过采集复杂的变电作业场景中不同子区域中的连续图像，建立图像数据集，从该图像数据集中提取用于训练标识模型的训练关键帧图像，并根据训练关键帧图像进行目标检测，获取训练关键帧图像的训练物体信息，对训练关键帧图像进行图像分类，确定各子区域的训练关键帧图像的训练场景信息，根据训练物体信息及训练场景信息确定目标区域的物体特征、场景特征及历史场景特征；根据物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型。基于目标区域的各子区域的训练关键帧图像的训练物体信息和训练场景信息结合神经网络模型确定场景标识模型，避免出现场景误分类的情况，提高了场景识别的准确性。

通过采集变电作业环境中待测区域中不同子区域的连续图像，建立图像数据集，从图像数据集中提取关键帧图像，并根据关键帧图像进行目标检测，获取关键帧图像的物体信息，对关键帧图像进行图像分类，确定各子区域的关键帧图像对应的场景信息，根据关键帧图像对应的物体信息及场景信息确定变电作业场景中待测区域的物体特征、场景特征及历史场景特征，再根据物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息。根据待测区域中的关键帧图像对应的物体信息和场景信息结合场景标识模型确定目标场景信息，避免了因单一信息来源而导致场景误分类，提高了场景识别的准确性。

上述计算机设备具体细节可以对应参阅图1至图7所示的实施例中对应的相关描述和效果进行理解，此处不再赘述。

本发明实施例还提供一种非暂态计算机存储介质，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的变电作业场景的标识模型训练方法和/或变电作业场景的标识方法。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-StateDrive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种变电作业场景的标识模型训练方法，其特征在于，包括以下步骤：

采集目标区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取训练关键帧图像，并根据所述训练关键帧图像进行目标检测，获取所述训练关键帧图像的训练物体信息；

对所述训练关键帧图像进行图像分类，确定各所述子区域的所述训练关键帧图像的训练场景信息；

根据所述训练物体信息及训练场景信息确定所述目标区域的物体特征、场景特征及历史场景特征；

根据所述物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型；

其中，所述根据所述训练物体信息及训练场景信息确定所述目标区域的物体特征、场景特征及历史场景特征，包括：以所述训练关键帧图像作为节点，建立场景区域识别模型，所述场景区域识别模型包括多个节点；根据所述训练物体信息确定各节点对应的所述目标区域的物体特征；根据所述训练场景信息确定各节点对应的所述目标区域的场景特征；根据当前节点对应的所述目标区域的场景特征以及前一节点对应的所述目标区域的场景特征确定所述目标区域的历史场景特征；

其中，所述根据所述物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型，包括：根据所述场景区域识别模型的各节点的所述物体特征、所述场景特征及所述历史场景特征确定与所述场景区域识别模型的各所述节点对应的能量函数；根据所述各所述节点对应的能量函数，确定所述场景区域识别模型对应的总能量函数；根据所述总能量函数，确定所述场景区域识别模型对应的目标函数；以所述各所述节点的所述物体特征、所述场景特征及所述历史场景特征作为输入样本，以所述目标函数作为输出，对所述第一神经网络模型进行训练，生成所述场景标识模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述训练关键帧图像进行目标检测，获取所述目标区域中的所述训练关键帧图像的训练物体信息，包括：

获取所述训练关键帧图像中与所述目标区域对应的训练物体，确定所述训练物体的物体数据，生成物体数据文件；

根据所述物体数据文件对第二神经网络模型进行训练，得到目标检测模型；

调用所述目标检测模型对所述训练关键帧图像中的所述训练物体进行识别，得到与所述训练物体对应的所述训练物体信息。

3.根据权利要求2所述的方法，其特征在于，所述对所述训练关键帧图像进行图像分类，确定各所述子区域的所述训练关键帧图像的训练场景信息，包括：

获取所述训练关键帧图像中与所述目标区域对应的第一场景数据，对所述第一场景数据进行训练，获取训练后的第二场景数据；

根据所述第二场景数据，对所述训练关键帧图像进行图像分类，得到与各所述子区域的所述训练关键帧图像对应的训练场景信息。

4.一种变电作业场景的标识方法，其特征在于，包括：

采集待测区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取关键帧图像，并根据所述关键帧图像进行目标检测，获取所述关键帧图像的物体信息；

对所述关键帧图像进行图像分类，确定各所述子区域的所述关键帧图像的场景信息；

根据所述物体信息及场景信息确定所述待测区域的物体特征、场景特征及历史场景特征；

根据所述物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息；

其中，所述预设的场景标识模型基于权利要求1-3任一项所述的变电作业场景的标识模型训练方法得到。

5.根据权利要求4所述的方法，其特征在于，还包括：

根据各所述子区域的所述关键帧图像的目标场景信息，生成语义地图；

获取所述关键帧图像的深度图像信息，根据所述关键帧图像对应的物体信息以及所述关键帧图像的深度图像信息，在所述语义地图中标识目标物体。

6.根据权利要求5所述的方法，其特征在于，所述根据各所述子区域的所述关键帧图像的目标场景信息，生成语义地图，包括：

根据各所述子区域的所述关键帧图像的目标场景信息，确定各所述子区域对应的RGB数值；

根据各所述子区域对应的RGB数值，生成语义地图。

7.根据权利要求6所述的方法，其特征在于，所述根据各所述子区域的所述关键帧图像的目标场景信息，确定各所述子区域对应的RGB数值的计算公式为：

其中，i表示当前子区域的关键帧图像的目标场景信息。

8.根据权利要求6所述的方法，其特征在于，所述获取所述关键帧图像的深度图像信息，根据所述关键帧图像对应的物体信息以及所述关键帧图像的深度图像信息，在所述语义地图中标识目标物体，包括：

获取所述关键帧图像对应的物体信息以及对应的关键帧图像的深度图像信息；

根据所述物体信息与所述深度图像信息，确定所述目标物体的空间位置；

根据所述空间位置在所述语义地图中确定所述目标区域中不同子区域的所述目标物体。

9.一种变电作业场景的标识模型训练装置，其特征在于，包括：

第一采集模块，用于采集目标区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取训练关键帧图像，并根据所述训练关键帧图像进行目标检测，获取所述训练关键帧图像的训练物体信息；

分类模块，用于对所述训练关键帧图像进行图像分类，确定各所述子区域的所述训练关键帧图像的训练场景信息；

特征提取模块，用于根据所述训练物体信息及训练场景信息确定所述目标区域的物体特征、场景特征及历史场景特征；

模型生成模块，用于根据所述物体特征、场景特征及历史场景特征对第一神经网络模型进行训练，生成场景标识模型；

其中，所述特征提取模块，包括：

场景区域识别模型建立子模块，用于以所述训练关键帧图像作为节点，建立场景区域识别模型，所述场景区域识别模型包括多个节点；

第一确定子模块，用于根据所述训练物体信息确定各节点对应的所述目标区域的物体特征；

第二确定子模块，用于根据所述训练场景信息确定各节点对应的所述目标区域的场景特征；

第三确定子模块，用于根据当前节点对应的所述目标区域的场景特征以及前一节点对应的所述目标区域的场景特征确定所述目标区域的历史场景特征；

其中，所述模型生成模块，包括：

第四确定子模块，用于根据所述场景区域识别模型的各节点的所述物体特征、所述场景特征及所述历史场景特征确定与所述场景区域识别模型的各所述节点对应的能量函数；

第五确定子模块，用于根据所述各所述节点对应的能量函数，确定所述场景区域识别模型对应的总能量函数；

第六确定子模块，用于根据所述总能量函数，确定所述场景区域识别模型对应的目标函数；

训练子模块，用于以所述各所述节点的所述物体特征、所述场景特征及所述历史场景特征作为输入样本，以所述目标函数作为输出，对所述第一神经网络模型进行训练，生成所述场景标识模型。

10.一种变电作业场景的标识装置，其特征在于，包括：

物体信息获取模块，用于采集待测区域中不同子区域的连续图像，建立图像数据集，从所述图像数据集中提取关键帧图像，并根据所述关键帧图像进行目标检测，获取所述关键帧图像的物体信息；

场景信息获取模块，用于对所述关键帧图像进行图像分类，确定各所述子区域的所述关键帧图像的场景信息；

特征确定模块，用于根据所述物体信息及场景信息确定所述待测区域的物体特征、场景特征及历史场景特征；

生成模块，用于根据所述物体特征、场景特征及历史场景特征及预设的场景标识模型进行场景标识，生成目标场景信息；

11.一种计算机设备，其特征在于，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行权利要求1-3中任一项所述的变电作业场景的标识模型训练方法或执行权利要求4-8中任一项所述的变电作业场景的标识方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行权利要求1-3中任一项所述的变电作业场景的标识模型训练方法或执行权利要求4-8中任一项所述的变电作业场景的标识方法。