CN112990442A

CN112990442A - 基于空间位置的数据确定方法、装置及电子设备

Info

Publication number: CN112990442A
Application number: CN202110432992.5A
Authority: CN
Inventors: 不公告发明人
Original assignee: Beijing Real AI Technology Co Ltd
Current assignee: Beijing Real AI Technology Co Ltd
Priority date: 2021-04-21
Filing date: 2021-04-21
Publication date: 2021-06-18
Anticipated expiration: 2041-04-21
Also published as: CN112990442B

Abstract

本申请提供一种基于空间位置的数据确定方法、装置及电子设备，涉及检测数据处理领域。所述基于空间位置的数据确定方法包括：获取多个检测位置中的目标检测位置的实际检测数据；基于实际检测数据和多个检测位置的空间位置，建立多维数据结构；将多维数据结构输入到预先训练好的机器学习模型，获得多个检测位置的预测数据，其中，机器学习模型包括数据压缩网络和数据还原网络；基于预测数据，确定多个检测位置的目标检测数据。根据本申请的基于空间位置的数据确定方法、装置及电子设备，解决了检测数据缺失或者异常的问题，可以在考虑多个检测位置的空间位置的情况下确定检测数据，并且可提高所确定的检测数据的准确度和可信度。

Description

基于空间位置的数据确定方法、装置及电子设备

技术领域

本申请涉及检测数据处理领域，尤其是涉及一种基于空间位置的数据确定方法、装置及电子设备。

背景技术

在大型基础设施中，需要实时监测并独立分析不同位置的传感器信号，用于监测设施的使用状态，从而在出现异常情况时能够及时进行维护。

由于大型基础设施占地面积广且设备体积庞大，因此需要布置传感器的位置较多且较为分散，在现有的传感布置中，在不同位置处的传感器通常是互不通信的独立个体，仅负责采集各自所属范围内的状态信息。在此情况下，当个别传感器由于外界或者自身因素发生故障时，则会出现检测数据的缺失或者异常，这会导致无法对该传感器感测的局部区域或者基础设施整体的运行状况进行准确地监控和评估，在一些情况下，甚至会威胁到该基础设施周边人员的安全。

发明内容

鉴于在现有的传感布置中可能会出现部分检测位置的检测数据缺失或者异常的问题，本申请提出一种基于空间位置的数据确定方法、装置及电子设备。根据本申请的基于空间位置的数据确定方法、装置及电子设备可以在考虑多个检测位置的空间位置的情况下确定检测数据，并且可提高所确定的检测数据的准确度和可信度。

根据本申请的第一方面提供一种基于空间位置的数据确定方法，所述基于空间位置的数据确定方法包括：获取多个检测位置中的目标检测位置的实际检测数据；基于所述实际检测数据和所述多个检测位置的空间位置，建立多维数据结构；将所述多维数据结构输入到预先训练好的机器学习模型，获得所述多个检测位置的预测数据，其中，所述机器学习模型包括数据压缩网络和数据还原网络；基于所述预测数据，确定所述多个检测位置的目标检测数据。

可选地，基于所述实际检测数据和所述多个检测位置的空间位置，建立多维数据结构的步骤可以包括：根据所述多个检测位置之间的空间距离，建立多维数据网格，其中，所述多维数据网格中的每个格点对应一个计算位置，所述计算位置包括所述多个检测位置和空白位置，所述多个检测位置包括预测位置；将所述目标检测位置的实际检测数据填充到所述多维数据网格中的与所述目标检测位置对应的格点，将空白数据填充到所述多维数据网格中的与预测位置和空白位置对应的格点；根据填充有所述实际检测数据和所述空白数据的多维数据网格，确定所述多维数据结构。

可选地，根据填充有所述实际检测数据和所述空白数据的多维数据网格，确定所述多维数据结构的步骤可以包括：根据所述预先训练好的机器学习模型的数据尺寸，调整填充有所述实际检测数据和所述空白数据的多维数据网格的数据尺寸，将调整后的多维数据网格确定为所述多维数据结构。

可选地，可以通过以下方式对所述预先训练好的机器学习模型进行训练：基于多个卷积层，建立所述数据压缩网络；基于与所述多个卷积层对应的多个反卷积层，建立所述数据还原网络；基于所述数据压缩网络和所述数据还原网络，训练所述机器学习模型。

可选地，根据所述数据压缩网络和所述数据还原网络，训练所述机器学习模型的步骤可以包括：获取所述多个检测位置的历史检测数据，基于所述历史检测数据，根据所述多个检测位置的空间位置，按照时间序列建立对应于不同时间点的历史多维数据结构；将所述历史多维数据结构输入到所述数据压缩网络，获得从所述数据压缩网络输出的编码数据，并将所述编码数据输入到所述数据还原网络，获得从所述数据还原网络输出的解码数据；比较所述历史多维数据结构和所述解码数据，根据比较结果训练所述机器学习模型。

可选地，基于与所述多个卷积层对应的多个反卷积层，建立所述数据还原网络的步骤可以包括：将所述多个反卷积层中的倒数第n个反卷积层的输出与所述多个卷积层中的第n个卷积层的输出相加，并将相加结果作为所述多个反卷积层中的第n+1个反卷积层的输入，其中，n为正整数。

可选地，基于所述预测数据，确定所述多个检测位置的目标检测数据的步骤可以包括：确定与所述目标检测位置对应的预测数据；利用与所述目标检测位置对应的预测数据替换所述多维数据结构中的所述目标检测位置的所述实际检测数据。

根据本申请的第二方面提供一种基于空间位置的数据确定装置，所述基于空间位置的数据确定装置包括：获取单元，获取多个检测位置中的目标检测位置的实际检测数据；数据结构建立单元，基于所述实际检测数据和所述多个检测位置的空间位置，建立多维数据结构；计算单元，将所述多维数据结构输入到预先训练好的机器学习模型，获得所述多个检测位置的预测数据，其中，所述机器学习模型包括数据压缩网络和数据还原网络；确定单元，基于所述预测数据，确定所述多个检测位置的目标检测数据。

根据本申请的第三方面提供一种电子设备，所述电子设备包括：处理器；存储器，存储有计算机程序，当所述计算机程序被处理器执行时，实现根据本申请的第一方面所述的基于空间位置的数据确定方法。

根据本申请的第四方面提供一种存储有计算机程序的计算机可读存储介质，当所述计算机程序被处理器执行时实现根据本申请的第一方面所述的基于空间位置的数据确定方法。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了根据本申请实施例的基于空间位置的数据确定方法的流程示意图；

图2示出了根据本申请实施例的机器训练模型的示意图；

图3示出了根据本申请实施例的基于空间位置的数据确定装置的示意性框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

本申请的一个方面涉及一种基于空间位置的数据确定方法。该基于空间位置的数据确定方法可以根据多个检测位置中的目标检测位置的实际检测数据确定多个检测位置的预测数据，从而在多个检测位置中的一些检测位置的检测数据缺失或异常的情况下可以基于预测数据准确确定这些检测位置的检测数据。

值得注意的是，在本申请提出申请之前，现有的对检测数据（也可称为传感数据）的补全或异常检测方法仅是针对单个传感器进行的，具体来说，可以通过统计单个传感器在历史时间段内的多个时间点的历史检测数据，确定在该历史时间段内的其他时间点的检测数据，以利用所确定的检测数据补全或替换在该时间点缺失或异常的数据。然而，上述方法仅能对单个传感器的检测数据进行处理，而无法应用到多传感器情况下的数据处理。

本申请提供一种基于空间位置的数据确定方法，该方法可以根据多个检测位置中的目标检测位置的实际检测数据来获得多个检测位置的预测数据，从而可基于预测数据确定多个检测位置中的任意检测位置的检测数据，例如，可确定多个检测位置中的检测数据缺失或异常的检测位置的检测数据。

如图1所示，根据本申请实施例的基于空间位置的数据确定方法包括以下步骤：

S1、获取多个检测位置中的目标检测位置的实际检测数据。

在该步骤中，检测位置可以指的是需要采集数据的位置。检测位置可以为多个。实际检测数据可以是被检测的信息，其可以呈电信号、光信号或任意其他所需的信息形式。目标检测位置的实际检测数据可以通过布置在目标检测位置的实体传感器直接采集得到，然而其不限于此，例如实际检测数据也可以通过虚拟传感器获得，这里，虚拟传感器可以通过建模对待测信息的相关量进行测量并对测得的相关量数据进行处理，以间接确定待测信息。作为示例，根据本申请实施例的多个检测位置的检测数据可以是相同类型的检测数据，例如其表征相同的物理量。

S2、基于实际检测数据和多个检测位置的空间位置，建立多维数据结构。

多个检测位置之间在空间维度上可具有预定的位置关系，例如在一些大型基础设施中，出于对设施的全面监测等多种因素的综合考虑，多个检测位置在空间上可以被均匀分布在平面网格或者立体网格中。

作为示例，步骤S2可以包括：

S21、根据多个检测位置之间的空间距离，建立多维数据网格，其中，多维数据网格中的每个格点对应一个计算位置，计算位置包括多个检测位置和空白位置，多个检测位置包括预测位置。

具体来说，可以确定多个检测位置之间的二维或三维空间距离，基于该空间距离建立相应的二维或三维数据网格结构。

可以按照多个检测位置之间的空间距离等比例对应到多维数据网格，使得每个检测位置对应于多维数据网格中的一个格点。这里，多个检测位置可包括目标检测位置和预测位置，预测位置可以是指缺少实际检测数据或者实际检测数据的准确性无法确定（例如，实际检测数据异常）的检测位置。

具体来说，可以将多个检测位置中水平距离或竖直距离最小的两个检测位置之间的距离值对应于数据网格的单元格的边长，当两个检测位置之间的距离大于该最小距离时，可以表示为最小距离的整数倍，即，其相应的检测数据在数据网格中的位置可间隔整数个单元格。这里，当两个检测位置之间的距离无法被最小距离整除时，可根据四舍五入的方式约化为整数，以能够每个检测位置均对应到数据网格的格点。

由于在多个检测位置的空间分布较为分散的情况下将每个检测位置一一对应到数据网格的格点可能会使得数据网格的尺寸较大，其中，多个检测位置之间可能存在用于占位以确保多个检测位置之间的空间相对关系的空白位置，在数据网格中，会出现与空白位置对应的空余格点（即，无检测位置与其对应的格点），这些空余格点也会参与到后续的计算中，为了便于后续计算，可适当缩小数据网格的尺寸，例如，删除整行或者整列的空杯位置。

具体来说，可以设置检测位置的间距阈值，当两个检测位置之间的距离小于该间距阈值时，可根据两个检测位置的实际距离来形成数据网格；当两个检测位置之间的距离大于或等于该间距阈值时，可将该间距阈值作为二者的间距来形成数据网格。例如，该间距阈值可以是检测位置之间的最小距离的整数倍。这样，可以使得数据结构更加紧凑，便于提高计算速度。

此外，在根据多个检测位置之间的空间距离建立多维数据网格的步骤中，可根据关联影响因子来对多维数据网格进行调整。具体来说，关联影响因子可以指的是对不同检测位置的检测数据之间的关联性产生影响的因素。可将检测位置之间的关联影响因子加权到检测位置之间的空间距离上，在建立多维数据网格时，可在确保多维数据网格整体形状不变的前提下，基于关联影响因子，增大或减小检测位置的检测数据之间的距离，例如可增加或减小一行/列空白格点。

作为示例，检测位置之间的物理连接结构对检测数据的关联性会产生影响，具体来说，不同的物理连接结构对诸如振动的力的传递能力不同，使得检测位置的检测数据之间的关联性不同。例如，与两个检测位置形成在同一平坦的表面上的情况相比，在两个检测位置之间的表面存在诸如横梁等的突起结构的情况下，突起结构会影响振动的传递，使得两个检测位置的检测数据关联性变弱，相当于增大了两个检测位置的空间距离。因此，可将该影响因子加权到两个检测位置之间的空间距离上，在建立多维数据网格时，可在确保多维数据网格整体形状不变的前提下，增大这两个检测位置的检测数据之间的距离，例如可增加一行/列空白格点。

S22、将目标检测位置的实际检测数据填充到多维网格中的与目标检测位置对应的格点，将空白数据填充到多维数据网格中的与预测位置和空白位置对应的格点。

根据建立的多维数据网格，可以将对相应格点对应的检测位置的检测数据填充在该格点处。在相邻的两个检测位置的距离可大于上面所述的最小距离的情况下，在数据网格中，这两个检测位置对应的格点之间可存在一个或多个空余格点，这些格点确保了检测位置之间的相对关系。可以在与空白位置对应的空余格点中填充占位的空数据，以在计算中保持这种相对关系，作为示例，空数据可以是0值。

需要说明的是，多维数据网格中的与多个检测位置中的预测位置对应的格点，可以用零值或其他任意值填充。

S23、根据填充有实际检测数据和空白数据的多维数据网格，确定多维数据结构。

在该步骤中，在多维数据网格中填充实际检测数据和空白数据后，可形成完整的多维数据结构，例如，形成诸如二维矩阵形式的平面分布的二维数据结构，或者形成诸如三维矩阵形式的立体分布的三维数据结构。

在一种情况下，可根据填充有实际检测数和空白数据的多维数据网格，查找或构建具有与该多维数据网格的数据尺寸匹配的数据尺寸的预先训练好的机器学习模型。

具体来说，预先训练好的机器学习模型可以是基于历史检测数据预先训练得到的，其具体的训练过程将在下文中详细描述。可从已有的机器学习模型中查找到的具有与该多维数据网格的数据尺寸最接近或完全匹配的数据尺寸的机器学习模型，或者可根据多维数据网格构建尺寸匹配的机器学习模型。对于查找到的机器学习模型，或者在构建机器学习模型的过程中，可对机器学习模型的数据尺寸进行调整，以将其数据尺寸调整为与多维数据网格的数据尺寸相匹配。例如，可以通过调整机器学习模型中的神经网络的卷积核尺寸来调整预先训练好的机器学习模型的数据尺寸，以使得机器学习模型的数据尺寸与多维数据网格的数据尺寸匹配。

在查找或构建出具有与该多维数据网格的数据尺寸匹配的数据尺寸的预先训练好的机器学习模型时，可将当前的多维数据网格确定为多维数据结构，以供输入到所查找或构建出的机器学习模型中。

在另一种情况下，经过数据尺寸调整后的机器学习模型的数据尺寸可能仍与多维数据网格的数据尺寸存在差异，未实现完全匹配，在此情况下，步骤S23也可以包括：根据预先训练好的机器学习模型的数据尺寸，调整填充有实际检测数据和空白数据的多维数据网格的数据尺寸，将调整后的多维数据网格确定为多维数据结构。

具体来说，在机器学习模型训练好后，可以确定其输入数据的标准尺寸，可以根据标准尺寸，调整时间戳对齐后的原始检测数据的数据尺寸，以使得调整后的数据可以满足机器学习模型的计算要求。例如，机器学习模型的输入数据的标准尺寸可以为128×128×3（三维网格数据），而根据多个检测位置的空间位置建立的多维数据网格的数据尺寸为127×125×3，在此情况下，可将多维数据网格的数据尺寸调整为128×128×3，增加的数据结构部分可以通过padding填充，例如用0值进行填充。

S3、将多维数据结构输入到预先训练好的机器学习模型，获得多个检测位置的预测数据，其中，机器学习模型包括数据压缩网络和数据还原网络。

作为示例，可以通过以下方式对预先训练好的机器学习模型进行训练：

S31、基于多个卷积层，建立数据压缩网络；

S32、基于与多个卷积层对应的多个反卷积层，建立数据还原网络；

S33、基于数据压缩网络和数据还原网络，训练机器学习模型。

在步骤S31中，数据压缩网络可以是卷积神经网络，其可以对输入的数据进行自编码，例如，数据压缩网络可以是采用CNN卷积层的卷积自编码器。数据压缩网络的卷积层数量、卷积核尺寸、激活函数种类和池化层大小可以根据待确定目标检测数据的多个检测位置的样本检测数据调整。例如，数据压缩网络是数据编码网络。

如图2所示的实施例，样本检测数据尺寸可以为128×128×3，对此，可设置两层卷积层，其中，第一卷积层可采用8个5×5卷积核，其步长可设置为3，第二卷积层可采用16个4×4卷积核，其步长可设置为2。在此情况下，当尺寸为128×128×3的样本检测数据输入到第一卷积层后，输出的数据尺寸可被压缩为42×42×8，经过第一卷积层压缩的数据输入到第二卷积层后，输出的数据尺寸可被压缩为20×20×16，从而可将第二卷积层的输出作为特征编码，以用于作为数据还原网络的输入。

尽管图2中示出了一个示例的数据压缩网络，但是数据压缩网络中的卷积层数量、卷积核尺寸、激活函数种类和池化层大小可以根据具体的需求做调整。例如，样本检测数据的尺寸相对较大的情况下，卷积层数量、卷积核尺寸也可增大。池化层的大小可根据计算能力来确定，在计算能力一般的情况下，设置池化层可以减少计算量，例如，池化层可用于成比例地减小数据尺寸，例如，每个卷积层后可设置池化层，其可以压缩数据尺寸，例如将数据尺寸压缩为1/2、1/3或1/5。在计算能力足够的情况下，也可以不设置池化层，这样，可以保留输入数据的原始信息，从而可提高输出结果的准确度。

根据本申请实施例的基于空间位置的数据确定方法，通过改变卷积层的尺寸大小，可以方便地调控邻近检测位置影响范围的大小，而无需通过特征的重新选择。

在步骤S32中，数据还原网络可以是反卷积神经网络，其可以对输入的特征编码进行解码，以还原（在下文中也称为解码）得到与初始的数据网格维度和规模一致的数据。

数据还原网络的结构根据数据压缩网络的结构而变化。如图2所示的实施例，数据还原网络可包括两层反卷积层，其中，第一反卷积层可采用8个4×4卷积核，其步长可设置为2，第二反卷积层可采用3个5×5卷积核，其步长可设置为3。在此情况下，从数据压缩网络输出的尺寸为20×20×16的特征编码输入到第一反卷积层中，输出的数据尺寸可以被还原为42×42×8，经过第一反卷积层还原的数据输入到第二反卷积层后，输出的数据尺寸可以被还原为128×128×3，padding可分别为2和2。例如，数据还原网络是数据解码网络。

基于与多个卷积层对应的多个反卷积层，建立数据还原网络，可以确保在每个反卷积层输出的数据和数据压缩网络中与该反卷积层对应的卷积层输出的数据尺寸大小相同。

此外，根据本申请的实施例，步骤S222还可以包括：将多个反卷积层中的倒数第n个反卷积层的输出与多个卷积层中的第n个卷积层的输出相加，并将相加结果作为多个反卷积层中的第n+1个反卷积层的输入，其中，n为正整数。

具体来说，以图2为例，可以将第二卷积层的输入与第一反卷积层的输入相加，并且可将相加得到的数据输入到第二反卷积层中。

通过上述操作，可以在最后一次还原数据之前，将数据压缩过程中的信息补充到还原的数据中，以提高还原数据的准确性。

在步骤S33中，基于数据压缩网络和数据还原网络，训练机器学习模型的步骤可以包括：

S331、获取多个检测位置的历史检测数据，基于历史检测数据，根据多个检测位置的空间位置，按照时间序列建立对应于不同时间点的历史多维数据结构；

在该步骤中，可以获取待确定检测数据的多个检测位置的在预定历史时间段内的历史检测数据，可建立在该预定历史时间段内的不同时间点的多个检测位置的历史检测数据之间的历史多维数据结构。

作为示例，步骤S331可以包括：

S3311、获取多个检测位置的原始历史检测数据，对原始历史检测数据进行预处理，获得预处理后的检测数据；

S3312、基于预处理后的检测数据，根据多个检测位置的空间位置，按照时间序列建立对应于不同时间点的历史多维数据结构。

在步骤S3311中，预处理可以包括以下项中的至少一者：

对原始历史检测数据进行时间戳对齐；

对原始历史检测数据中的缺失值进行填充；

调整原始历史检测数据的尺寸；

对原始历史检测数据进行标准化处理。

时间戳对齐可以包括：确定多个时间点，将原始历史检测数据对应到多个时间点。

具体来说，不同检测位置的历史检测数据的采集时间可能不是完全对应的，例如，设置在不同检测位置的传感器的采集频率不同，使得不同传感器之间采集的数据存在时间差，在此情况下，可在采集原始历史检测数据的历史时间段中选择多个时间点，可将不同检测位置的在时序上的检测数据变换到多个时间点。例如可以通过诸如线性插值、非线性插值等算法的数学计算将某时间点之前和之后的检测数据变换到与该时间点对应的检测数据。

缺失值填充可以包括对多个检测位置中的至少一个检测位置的在特定时间点的数据进行填充。

具体来说，部分检测位置在部分历史时间点的检测数据可能会缺失，例如由于不同检测位置处的传感器的安装时间不同，使得一部分传感器的安装时间晚于另一部分传感器的安装时间，从而缺少与安装时间差异时间段对应的检测数据。为了利用多个检测位置在所选择的多个时间点中的所有时间点的完整检测数据对模型进行训练，可以对缺失的检测数据进行填充。作为示例，缺失值填充可以对时间戳对齐后的检测数据执行。

作为示例，可以通过以下项中的至少一者对缺失的检测数据进行填充：

使用历史检测数据的历史统计量对缺失的检测数据进行填充。

具体来说，历史统计量可以是对历史检测数据在时序上进行统计得到的检测数据，例如，历史统计量填充可以包括均值填充、中位数填充或众数填充，具体来说，可以使用历史检测数据的历史平均值、中位数或众数作为缺失数据的替代值。

使用滑动窗口的统计量对缺失的检测数据进行填充。

具体来说，可以通过固定长度的滑动窗口在时序上对历史检测数据取值，从而在包括缺失值的窗口内，可以利用缺失值的在时序时的前后的历史检测数据的统计量来估计缺失值，例如可将均值、中位数或众数作为缺失值。在该填充方法中，可消减与缺失值无关的检测数据产生的影响，提高缺失值估计的准确性。

根据线性插值/多项式插值，对缺失的检测数据进行填充。

具体来说，可以利用缺失值的在时序时的前后的历史检测数据做线性或多项式回归处理来填充缺失值。

基于LSTM时序方法预测，对缺失的检测数据进行填充。

具体来说，利用检测数据自身的时序性特点，可利用LSTM方法预测缺失值大小，从而基于预测的值对缺失的检测数据进行填充。

调整原始历史检测数据的尺寸是为了使得其能够适应于输入到机器学习模型中。例如，原始历史检测数据的尺寸可以为127×125×3，机器学习模型的特征输入的标准尺寸为128×128×3，在此情况下，可将原始历史检测数据的尺寸调整为128×128×3，增加的数据结构部分可以通过padding填充，例如用0值进行填充。作为示例，尺寸调整可以对缺失值填充后的检测数据执行。

标准化处理是将原有数据转换为均值为0、标准差为1的新数据，但本申请不限于此，其也可以采用其他任意的处理方法，如归一化（将数据线性转换到0~1分布的新数据）。作为示例，标准化处理可以对尺寸调整后的检测数据执行。

在现有的检测数据确定方法的模型训练过程中，作为特征输入的检测数据不能为空或异常值，否则拟合出的数值极有可能也为异常值，结果可信度不高，并且无法一开始就判定其他传感器数据是否为异常。而在根据本申请实施例的方法中，由于针对全体检测位置的检测数据采用下采样策略以及利用周围检测位置的检测数据之间的相关性策略，使得能够容忍一些检测位置的检测数据缺失或为异常值，对用于模型训练的原始检测数据的要求降低，提高了模型的训练效率。

在步骤S3312中，可以针对所确定的多个时间点中的每个时间点分别建立历史多维数据结构，多个历史多维数据结构可构成数据训练集，用于对机器学习模型进行训练。

这里，可以通过以下方式建立每个时间点的历史多维数据结构：

根据多个检测位置之间的空间距离，建立多维数据网格。

该步骤建立多维数据网格的操作与上面步骤S21中描述的相似，在此不再赘述。

将单个时间点的历史检测数据填充到多维数据网格中的对应格点，在多维数据网格中的未对应有检测位置的格点中填充空白数据。

该步骤填充历史检测数据和空白数据的操作与上面步骤S22中描述的相似，在此不再赘述。

根据填充有检测数据和空白数据的单个时间点的多维数据网格，确定单个时间点的多维数据结构。

在确定多个时间点中的每个时间点的多维数据结构之后，可按照时间序列建立对应于包括多个时间点的多维数据结构的历史多维数据结构。在本申请实施例中，由于可获得单个时间点的多维数据结构，并且可基于多个时间点的多维数据结构构成历史多维数据结构，其可类似于视频处理过程，具体来说，单个时间点的多维数据结构可对应于视频处理中的单帧图像，多个时间点的多维数据结构构成的历史多维数据结构可对应于视频段，因为本申请对数据的预处理也可适当地采用部分使用与图片处理的方法，如高斯模糊、高通滤波等。

S332、将历史多维数据结构输入到数据压缩网络，获得从数据压缩网络输出的编码数据，并将编码数据输入到数据还原网络，获得从数据还原网络输出的解码数据。

在该步骤中，解码数据结构是通过数据还原网络还原的数据，其数据维度、尺寸可以与输入到数据压缩网络的历史多维数据结构相同。最后，再通过逆标准化还原得到多个检测位置的预测数据。

S333、比较历史多维数据结构和解码数据，根据比较结果训练机器学习模型。

作为示例，根据比较结果训练机器学习模型可以包括：基于比较结果确定损失函数，并根据损失函数训练机器学习模型。

例如，损失函数可以表示为loss=(1/N)×∑|ŷ-y|²，其中，N为样本检测数据的总数量，ŷ为解码数据，y为历史多维数据结构。

此外，在该步骤中，解码数据ŷ和历史多维数据结构y可以排除用于占位而添加的空白数据。

返回图1，S4、基于预测数据，确定多个检测位置的目标检测数据。

作为一示例，可确定与多个检测位置中的除了目标检测位置之外的检测位置（在上文中，也被称为预测位置）对应的预测数据，并利用所述预测数据填充到多维数据结构中的与预测位置对应的格点，从而可与已填充在多维数据结构中的与目标检测位置对应的实际检测数据一起构成完整的多维数据结构。

具体来说，基于机器学习模型获得的多个检测位置中的预测位置的检测数据可以作为对预测位置的检测数据的填充值。

例如，当缺失预测位置的检测数据时，可将机器学习模型输出的预测数据中的与预测位置对应的预测数据填充到多维数据结构中的相应位置，以使多维数据结构中存储完整的检测数据。

作为另一示例，可确定与目标检测位置对应的预测数据，利用与目标检测位置对应的预测数据替换多维数据结构中的目标检测位置的实际检测数据。

具体来说，在将多维数据结构中的目标检测位置的实际检测数据输入到预先训练好的机器学习模型后，机器学习模型不仅可输出多维数据结构中的预测位置的预测数据，也输出目标检测位置的预测数据，目标检测位置的预测数据可以用于异常值检测。

作为示例，可比较输入的实际检测数据和输出的预测数据，当比较结果超过设定阈值时，可认为输入的实际检测数据出现异常，可以用相应的预测数据修正多维数据结构中的实际检测数据。作为示例，可以计算输入的实际检测数据和输出的预测数据之间的残差，并且通过残差判断实际检测数据中是否出现异常值。当出现异常值时，可用预测数据替换被判断为异常值的实际检测数据。

例如，在预测数据ŷ与多维数据结构y的差值中的特定元素超过设定阈值δ可以认为该特定元素是异常值。

在现有的检测数据确定方法中，在一次计算中，仅能针对单个检测位置做检测数据缺失值补全和异常值检测，而在本申请实施例的方法中，通过预先训练好的机器学习模型，可经过一次计算即可对全部检测位置的检测数据做缺失值补全和异常值检测，例如，在存在3000个检测位置的情况下，在时间上可至少提升3000倍。

在现有的检测数据确定方法中，仅能在时间维度上针对单个检测位置训练模型，对于这样的方法，一方面，其没有考虑多个检测位置之间的空间相关性，得到的检测数据准确性不高；另一方面，在基础设施规模巨大的情况下，检测位置数量急剧提升后，需要针对多个检测位置逐一训练模型，使得模型的个数、模型的参数数量、硬件需求和时间成本均会显著提升。

相比之下，根据本申请实施例的基于空间位置的数据确定方法，可根据多个检测位置的空间位置，从周围检测位置的数据中提取到更多的有用信息，达到提高缺失值补全和异常值检测准确度和可信度的效果，此外，根据本申请实施例的基于空间位置的数据确定方法可仅训练一个模型对全体传感器数据进行缺失值补全和异常值检测。此外，由于诸如卷积神经网络的数据压缩网络有参数共享的优势，使得模型训练的参数数量也不会随着检测位置数量的增加而发生变化，当检测位置达到一定数量后模型参数的数量也会比现有的检测数据确定方法少很多，在硬件需求和时间成本方面均能维持不变，保持在低水平。

本申请的另一方面涉及一种基于空间位置的数据确定装置。图3示出了根据本申请示例性实施例的基于空间位置的数据确定装置的示意性框图。

如图3所示，根据本申请示例性实施例的基于空间位置的数据确定装置包括获取单元100、数据结构建立单元200、计算单元300和确定单元400。

获取单元100可用于获取多个检测位置中的目标检测位置的实际检测数据。

数据结构建立单元200可用于基于实际检测数据和多个检测位置的空间位置，建立多维数据结构。

计算单元300可用于将多维数据结构输入到预先训练好的机器学习模型，获得多个检测位置的预测数据。这里，机器学习模型可包括数据压缩网络和数据还原网络。

确定单元400可用于基于预测数据，确定多个检测位置的目标检测数据。

获取单元100、数据结构建立单元200、计算单元300和确定单元400可以根据如上述图1和图2所示的方法实施例中的基于空间位置的数据确定方法执行所述方法中的相应步骤，例如通过获取单元100、数据结构建立单元200、计算单元300和确定单元400可执行的机器可读指令来实现，获取单元100、数据结构建立单元200、计算单元300和确定单元400的具体实现方式可参见上面描述的方法实施例，在此不再赘述。

本申请实施例还提供一种电子设备，电子设备包括处理器和存储器。存储器存储有计算机程序。当该计算机程序被处理器执行时，电子设备可以根据如上述图1和图2所示的方法实施例中的基于空间位置的数据确定方法执行所述方法中的相应步骤，例如通过电子设备可执行的机器可读指令来实现，电子设备的具体实现方式可参见上面描述的方法实施例，在此不再赘述。

本申请实施例还提供一种存储有计算机程序的计算机可读存储介质，当该计算机程序被处理器执行时可以执行如上述图1和图2所示的方法实施例中的基于空间位置的数据确定方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请的实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-OnlyMemory，ROM）、随机存取存储器（Random Access Memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

根据本申请的基于空间位置的数据确定方法、装置及电子设备，可以根据多个检测位置的空间位置，利用多个检测位置的目标检测位置的实际检测数据确定多个检测位置的预测数据，并且引入数据压缩网络和数据还原网络，从而可在考虑多个检测位置的空间位置的情况下确定检测数据，并且可提高所确定的检测数据的准确度和可信度。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于空间位置的数据确定方法，其特征在于，所述基于空间位置的数据确定方法包括：

获取多个检测位置中的目标检测位置的实际检测数据；

基于所述实际检测数据和所述多个检测位置的空间位置，建立多维数据结构；

将所述多维数据结构输入到预先训练好的机器学习模型，获得所述多个检测位置的预测数据，其中，所述机器学习模型包括数据压缩网络和数据还原网络；

基于所述预测数据，确定所述多个检测位置的目标检测数据。

2.根据权利要求1所述的基于空间位置的数据确定方法，其特征在于，基于所述实际检测数据和所述多个检测位置的空间位置，建立多维数据结构，包括：

根据所述多个检测位置之间的空间距离，建立多维数据网格，其中，所述多维数据网格中的每个格点对应一个计算位置，所述计算位置包括所述多个检测位置和空白位置，所述多个检测位置包括预测位置；

将所述目标检测位置的实际检测数据填充到所述多维数据网格中的与所述目标检测位置对应的格点，将空白数据填充到所述多维数据网格中的与预测位置和空白位置对应的格点；

根据填充有所述实际检测数据和所述空白数据的多维数据网格，确定所述多维数据结构。

3.根据权利要求2所述的基于空间位置的数据确定方法，其特征在于，根据填充有所述实际检测数据和所述空白数据的多维数据网格，确定所述多维数据结构，包括：

根据所述预先训练好的机器学习模型的数据尺寸，调整填充有所述实际检测数据和所述空白数据的多维数据网格的数据尺寸，将调整后的多维数据网格确定为所述多维数据结构。

4.根据权利要求1所述的基于空间位置的数据确定方法，其特征在于，通过以下方式对所述预先训练好的机器学习模型进行训练：

基于多个卷积层，建立所述数据压缩网络；

基于与所述多个卷积层对应的多个反卷积层，建立所述数据还原网络；

基于所述数据压缩网络和所述数据还原网络，训练所述机器学习模型。

5.根据权利要求4所述的基于空间位置的数据确定方法，其特征在于，根据所述数据压缩网络和所述数据还原网络，训练所述机器学习模型，包括：

获取所述多个检测位置的历史检测数据，基于所述历史检测数据，根据所述多个检测位置的空间位置，按照时间序列建立对应于不同时间点的历史多维数据结构；

将所述历史多维数据结构输入到所述数据压缩网络，获得从所述数据压缩网络输出的编码数据，并将所述编码数据输入到所述数据还原网络，获得从所述数据还原网络输出的解码数据；

比较所述历史多维数据结构和所述解码数据，根据比较结果训练所述机器学习模型。

6.根据权利要求4或5所述的基于空间位置的数据确定方法，其特征在于，基于与所述多个卷积层对应的多个反卷积层，建立所述数据还原网络，包括：

将所述多个反卷积层中的倒数第n个反卷积层的输出与所述多个卷积层中的第n个卷积层的输出相加，并将相加结果作为所述多个反卷积层中的第n+1个反卷积层的输入，其中，n为正整数。

7.根据权利要求1所述的基于空间位置的数据确定方法，其特征在于，基于所述预测数据，确定所述多个检测位置的目标检测数据，包括：

确定与所述目标检测位置对应的预测数据；

利用与所述目标检测位置对应的预测数据替换所述多维数据结构中的所述目标检测位置的所述实际检测数据。

8.一种基于空间位置的数据确定装置，其特征在于，所述基于空间位置的数据确定装置包括：

获取单元，获取多个检测位置中的目标检测位置的实际检测数据；

数据结构建立单元，基于所述实际检测数据和所述多个检测位置的空间位置，建立多维数据结构；

计算单元，将所述多维数据结构输入到预先训练好的机器学习模型，获得所述多个检测位置的预测数据，其中，所述机器学习模型包括数据压缩网络和数据还原网络；

确定单元，基于所述预测数据，确定所述多个检测位置的目标检测数据。

9.一种电子设备，其特征在于，所述电子设备包括：

处理器；

存储器，存储有计算机程序，当所述计算机程序被处理器执行时，实现根据权利要求1至7中的任一项所述的基于空间位置的数据确定方法。

10.一种存储有计算机程序的计算机可读存储介质，其特征在于，当所述计算机程序被处理器执行时实现根据权利要求1至7中的任一项所述的基于空间位置的数据确定方法。