WO2020108573A1

WO2020108573A1 - 视频图像遮挡方法、装置、设备及存储介质

Info

Publication number: WO2020108573A1
Application number: PCT/CN2019/121644
Authority: WO
Inventors: 车军; 陈畅怀; 陆海先; 任烨; 朱江
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2018-11-28
Filing date: 2019-11-28
Publication date: 2020-06-04
Also published as: CN111241872A; CN111241872B

Abstract

一种视频图像遮挡方法、装置、设备及存储介质，属于视频处理技术领域。所述方法包括：基于视频的多帧视频图像，获取该视频内出现的各个目标的运动轨迹信息，该运动轨迹信息包括该各个目标在该多帧视频图像中的位置信息和尺寸信息（101）；确定该各个目标中需要遮挡的第一目标（102）；根据该第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在的区域进行遮挡，该第一目标所在的区域为该第一目标的位置信息和尺寸信息所对应的区域（103）。所述方法可以实现对需要遮挡的目标进行准确有效的遮挡。

Description

视频图像遮挡方法、装置、设备及存储介质

本公开要求于2018年11月28日提交的申请号为201811435929.1、发明名称为“视频图像遮挡方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及视频处理技术领域，尤其涉及一种视频图像遮挡方法、装置、设备及存储介质。

背景技术

随着近年来安防产业的发展，视频监控已经遍及我们生活的方方面面，我们在享受视频监控带来的安全的同时，对于隐私保护的需求也越来越迫切，尤其当一些视频在网络上或电视上公开时，需要对视频图像中的某些目标进行遮挡，防止隐私泄露的事件发生。

目前，相关技术实现视频图像遮挡的方法如下：通过摄像机采集当前监控场景下的视频，根据预先配置的固定区域，对该视频的每帧视频图像中的同一固定区域进行遮挡。

上述技术通过配置固定区域的方式，对视频图像中的固定区域进行遮挡，从而达到对固定区域中目标的遮挡效果。但是，如果需要遮挡的目标发生位置变化，如移出该固定区域，此时仍然对视频图像中的固定区域进行遮挡时，会导致需要遮挡的目标未被遮挡，从而发生隐私泄露问题，因此，亟需一种视频图像遮挡方法，来对需要遮挡的目标进行准确有效的遮挡。

发明内容

本公开实施例提供了一种视频图像遮挡方法、装置、设备及存储介质，可以解决相关技术需要遮挡的目标未被遮挡的问题。所述技术方案如下：

第一方面，提供了一种视频图像遮挡方法，所述方法包括：

基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，所述各个目标的运动轨迹信息包括所述各个目标在所述多帧视频图像中的位置信息和尺寸信息；

确定所述各个目标中需要遮挡的第一目标；

根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，所述第一目标所在的区域为所述第一目标的位置信息和尺寸信息所对应的区域。

在一种可能实现方式中，所述基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，包括：

对于所述多帧视频图像中的每帧视频图像，对所述视频图像进行目标检测，确定所述视频图像中的多个目标；

获取所述多个目标在所述视频图像中的位置信息和尺寸信息。

在一种可能实现方式中，所述对所述视频图像进行目标检测，确定所述视频图像中的多个目标之后，所述方法还包括：

当所述视频图像为所述多帧视频图像中的第一帧视频图像时，生成所述多个目标中每个目标的唯一标识；

所述获取所述多个目标在所述视频图像中的位置信息和尺寸信息之后，所述方法还包括：

将所述多个目标中每个目标在所述视频图像中的位置信息和尺寸信息与所述每个目标的唯一标识对应存储。

当所述视频图像为所述多帧视频图像中除第一帧视频图像以外的视频图像时，确定所述多个目标中的已知目标和未知目标，所述已知目标为所述视频图像的上一帧视频图像中包含的目标，所述未知目标为所述上一帧视频图像中未包含的目标；

生成所述未知目标的唯一标识；

将所述已知目标在所述视频图像中的位置信息和尺寸信息与所述已知目标的唯一标识对应存储；

将所述未知目标在所述视频图像中的位置信息和尺寸信息与所述未知目标的唯一标识对应存储。

提取所述视频图像中所述多个目标的图像特征；

将所述多个目标的图像特征与所述多个目标的唯一标识对应存储。

在一种可能实现方式中，所述提取所述视频图像中所述多个目标的图像特征，包括：

获取所述视频图像中所述多个目标的评价信息，所述评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；

从所述多个目标中，选取评价信息满足预设评价条件的目标；

提取所选取的目标的图像特征。

在一种可能实现方式中，所述确定所述各个目标中需要遮挡的第一目标，包括：

将所述各个目标进行展示；

当检测到第一选择事件时，将所述第一选择事件对应的目标确定为所述第一目标，所述第一选择事件用于从所述各个目标中选择需要遮挡的目标；

当检测到第二选择事件时，将除所述第二选择事件对应的目标以外的目标确定为所述第一目标，所述第二选择事件用于从所述各个目标中选择不需要遮挡的目标。

在一种可能实现方式中，所述根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，包括：

确定所述各个目标中与所述第一目标为同一个真实目标的目标；

根据所述目标和所述第一目标在所述多帧视频图像中的位置信息和尺寸信息，对所述多帧视频图像中所述目标和所述第一目标所在的区域进行遮挡。

在一种可能实现方式中，所述确定所述各个目标中与所述第一目标为同一个真实目标的目标，包括：

将所述第一目标的图像特征和所述各个目标的图像特征进行比对，获取所述各个目标与所述第一目标的相似度；

根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标。

在一种可能实现方式中，所述根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标，包括：

根据所述各个目标与所述第一目标的相似度，将所述各个目标进行排列展示，相似度越大排列越靠前；

当检测到目标确认事件时，将所述目标确认事件对应的目标确定为与所述第一目标为同一个真实目标的目标，所述目标确认事件用于从所述各个目标中选择与所述第一目标为同一个真实目标的目标。

根据所述各个目标与所述第一目标的相似度，将与所述第一目标的相似度大于预设阈值的目标确定为与所述第一目标为同一个真实目标的目标。

第二方面，提供了一种视频图像遮挡装置，所述装置包括：

获取模块，用于基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，所述各个目标的运动轨迹信息包括所述各个目标在所述多帧视频图像中的位置信息和尺寸信息；

确定模块，用于确定所述各个目标中需要遮挡的第一目标；

遮挡模块，用于根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，所述第一目标所在的区域为所述第一目标的位置信息和尺寸信息所对应的区域。

在一种可能实现方式中，所述获取模块用于对于所述多帧视频图像中的每帧视频图像，对所述视频图像进行目标检测，确定所述视频图像中的多个目标；获取所述多个目标在所述视频图像中的位置信息和尺寸信息。

在一种可能实现方式中，所述装置还包括：

第一生成模块，用于当所述视频图像为所述多帧视频图像中的第一帧视频图像时，生成所述多个目标中每个目标的唯一标识；

第一存储模块，用于将所述多个目标中每个目标在所述视频图像中的位置信息和尺寸信息与所述每个目标的唯一标识对应存储。

在一种可能实现方式中，所述装置还包括：

所述确定模块还用于当所述视频图像为所述多帧视频图像中除第一帧视频图像以外的视频图像时，确定所述多个目标中的已知目标和未知目标，所述已知目标为所述视频图像的上一帧视频图像中包含的目标，所述未知目标为所述上一帧视频图像中未包含的目标；

第二生成模块，用于生成所述未知目标的唯一标识；

第二存储模块，用于将所述已知目标在所述视频图像中的位置信息和尺寸信息与所述已知目标的唯一标识对应存储；将所述未知目标在所述视频图像中的位置信息和尺寸信息与所述未知目标的唯一标识对应存储。

在一种可能实现方式中，所述装置还包括：

提取模块，用于提取所述视频图像中所述多个目标的图像特征；

第三存储模块，用于将所述多个目标的图像特征与所述多个目标的唯一标识对应存储。

在一种可能实现方式中，所述提取模块用于获取所述视频图像中所述多个目标的评价信息，所述评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；从所述多个目标中，选取评价信息满足预设评价条件的目标；提取所选取的目标的图像特征。

在一种可能实现方式中，所述确定模块用于将所述各个目标进行展示；当检测到第一选择事件时，将所述第一选择事件对应的目标确定为所述第一目标，所述第一选择事件用于从所述各个目标中选择需要遮挡的目标；当检测到第二选择事件时，将除所述第二选择事件对应的目标以外的目标确定为所述第一目标，所述第二选择事件用于从所述各个目标中选择不需要遮挡的目标。

在一种可能实现方式中，所述遮挡模块用于确定所述各个目标中与所述第一目标为同一个真实目标的目标；根据所述目标和所述第一目标在所述多帧视频图像中的位置信息和尺寸信息，对所述多帧视频图像中所述目标和所述第一目标所在的区域进行遮挡。

在一种可能实现方式中，所述确定模块用于将所述第一目标的图像特征和所述各个目标的图像特征进行比对，获取所述各个目标与所述第一目标的相似度；根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标。

在一种可能实现方式中，所述确定模块用于根据所述各个目标与所述第一目标的相似度，将所述各个目标进行排列展示，相似度越大排列越靠前；当检测到目标确认事件时，将所述目标确认事件对应的目标确定为与所述第一目标为同一个真实目标的目标，所述目标确认事件用于从所述各个目标中选择与所述第一目标为同一个真实目标的目标。

在一种可能实现方式中，所述确定模块用于根据所述各个目标与所述第一目标的相似度，将与所述第一目标的相似度大于预设阈值的目标确定为与所述第一目标为同一个真实目标的目标。

第三方面，提供了一种电子设备，包括处理器和存储器；所述存储器，用于存放至少一条指令；所述处理器，用于执行所述存储器上所存放的至少一条指令，实现第一方面任一种实现方式所述的方法步骤。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有至少一条指令，所述至少一条指令被处理器执行时实现第一方面任一种实现方式所述的方法步骤。

第五方面，提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机实现上述第一方面任一种实现方式所述的方法步骤。

本公开实施例提供的技术方案带来的有益效果至少包括：

获取视频内出现的各个目标的运动轨迹信息，由于目标的运动轨迹信息可以包括目标在多帧视频图像中的位置信息和尺寸信息，因而在确定需要遮挡的第一目标后，可以根据第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在区域进行遮挡，每帧视频图像中该第一目标所在的区域可以不同，从而实现对需要遮挡的目标进行准确有效的遮挡。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种视频图像遮挡方法的流程图；

图2是本公开实施例提供的一种视频图像遮挡方法的流程图；

图3是本公开实施例提供的一种生成遮挡视频的流程示意图；

图4是本公开实施例提供的一种视频图像遮挡装置的结构示意图；

图5是本公开实施例提供的一种视频图像遮挡装置的结构示意图；

图6是本公开实施例提供的一种视频图像遮挡装置的结构示意图；

图7是本公开实施例提供的一种视频图像遮挡装置的结构示意图；

图8是本公开实施例提供的一种电子设备800的结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

在对本公开实施例提供的视频图像遮挡方法进行详细介绍之前，先对本公开实施例涉及的执行主体进行简单介绍。本公开实施例提供的视频图像遮挡方法可以由电子设备来执行，作为一种示例，该电子设备可以配置有摄像头，或者可以通过数据线与摄像头连接，以通过摄像头进行视频监控，得到视频，即该电子设备可以具有视频采集功能。或者，该电子设备还可以从其他前端设备接收待处理的视频。在一些实施例中，该电子设备可以为智能摄像设备、计算机设备等，本公开实施例对此不做限定。

在介绍完本公开实施例涉及的执行主体后，接下来将结合附图对本公开实施例提供的视频图像遮挡方法进行详细介绍。

图1是本公开实施例提供的一种视频图像遮挡方法的流程图。参见图1，该方法包括：

101、基于视频的多帧视频图像，获取该视频内出现的各个目标的运动轨迹信息，该各个目标的运动轨迹信息包括该各个目标在该多帧视频图像中的位置信息和尺寸信息。

102、确定该各个目标中需要遮挡的第一目标。

103、根据该第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在的区域进行遮挡，该第一目标所在的区域为该第一目标的位置信息和尺寸信息所对应的区域。

在本公开实施例中，获取视频内出现的各个目标的运动轨迹信息，由于目标的运动轨迹信息可以包括目标在多帧视频图像中的位置信息和尺寸信息，因而在确定需要遮挡的第一目标后，可以根据第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在区域进行遮挡，每帧视频图像中该第一目标所在的区域可以不同，从而实现对需要遮挡的目标进行准确有效的遮挡。

在一种可能实现方式中，基于视频的多帧视频图像，获取该视频内出现的各个目标的运动轨迹信息，包括：

对于该多帧视频图像中的每帧视频图像，对该视频图像进行目标检测，确定该视频图像中的多个目标；

获取该多个目标在该视频图像中的位置信息和尺寸信息。

在一种可能实现方式中，对该视频图像进行目标检测，确定该视频图像中的多个目标之后，该方法还包括：

当该视频图像为该多帧视频图像中的第一帧视频图像时，生成该多个目标中每个目标的唯一标识；

该获取该多个目标在该视频图像中的位置信息和尺寸信息之后，该方法还包括：

将该多个目标中每个目标在该视频图像中的位置信息和尺寸信息与该每个目标的唯一标识对应存储。

当该视频图像为该多帧视频图像中除第一帧视频图像以外的视频图像时，确定该多个目标中的已知目标和未知目标，该已知目标为该视频图像的上一帧视频图像中包含的目标，该未知目标为该上一帧视频图像中未包含的目标；

生成该未知目标的唯一标识；

将该已知目标在该视频图像中的位置信息和尺寸信息与该已知目标的唯一标识对应存储；

将该未知目标在该视频图像中的位置信息和尺寸信息与该未知目标的唯一标识对应存储。

提取该视频图像中该多个目标的图像特征；

将该多个目标的图像特征与该多个目标的唯一标识对应存储。

在一种可能实现方式中，提取该视频图像中该多个目标的图像特征，包括：

获取该视频图像中该多个目标的评价信息，该评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；

从该多个目标中，选取评价信息满足预设评价条件的目标；

提取所选取的目标的图像特征。

在一种可能实现方式中，确定该各个目标中需要遮挡的第一目标，包括：

将该各个目标进行展示；

当检测到第一选择事件时，将该第一选择事件对应的目标确定为该第一目标，该第一选择事件用于从该各个目标中选择需要遮挡的目标；

当检测到第二选择事件时，将除该第二选择事件对应的目标以外的目标确定为该第一目标，该第二选择事件用于从该各个目标中选择不需要遮挡的目标。

在一种可能实现方式中，根据该第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在的区域进行遮挡，包括：

确定该各个目标中与该第一目标为同一个真实目标的目标；

根据该目标和该第一目标在该多帧视频图像中的位置信息和尺寸信息，对该多帧视频图像中该目标和该第一目标所在的区域进行遮挡。

在一种可能实现方式中，确定该各个目标中与该第一目标为同一个真实目标的目标，包括：

将该第一目标的图像特征和该各个目标的图像特征进行比对，获取该各个目标与该第一目标的相似度；

根据该各个目标与该第一目标的相似度，确定该各个目标中与该第一目标为同一个真实目标的目标。

在一种可能实现方式中，根据该各个目标与该第一目标的相似度，确定该各个目标中与该第一目标为同一个真实目标的目标，包括：

根据该各个目标与该第一目标的相似度，将该各个目标进行排列展示，相似度越大排列越靠前；

当检测到目标确认事件时，将该目标确认事件对应的目标确定为与该第一目标为同一个真实目标的目标，该目标确认事件用于从该各个目标中选择与该第一目标为同一个真实目标的目标。

根据该各个目标与该第一目标的相似度，将与该第一目标的相似度大于预设阈值的目标确定为与该第一目标为同一个真实目标的目标。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

图2是本公开实施例提供的一种视频图像遮挡方法的流程图。参见图2，该方法包括：

201、基于视频的多帧视频图像，获取该视频内出现的各个目标的运动轨迹信息，各个目标的运动轨迹信息包括该各个目标在该多帧视频图像中的位置信息和尺寸信息。

其中，各个目标可以包括多种类型，如目标的类型可以为人，也可以为人脸和人体，当然，目标的类型也可以为物，本公开实施例对目标的类型不做具体限定。

其中，该多帧视频图像可以包括该视频中所有的视频图像，或者，该多帧视频图像也可以包括该视频中的部分视频图像，在实施中，可以根据预先设定的获取策略从视频中获取该多帧视频图像，示例性地，可以获取该视频中的第一帧视频图像至第n帧视频图像，得到该多帧视频图像，其中，该n可以根据实际需求进行设置。

在一种可能实现方式中，该步骤201以及后续步骤可以由电子设备执行。

在执行该步骤201之前，电子设备需要先获取到该视频的多帧视频图像。以该电子设备具有视频采集功能为例，该电子设备可以对某个监控区域进行视频采集，得到该视频，并获取该视频的多帧视频图像。当然，电子设备也可以接收前端设备(如监控摄像头)发送的视频，并获取该视频的多帧视频图像。

在一种可能实现方式中，该步骤201可以包括：对于该多帧视频图像中的每帧视频图像，对该视频图像进行目标检测，确定该视频图像中的多个目标；获取该多个目标在该视频图像中的位置信息和尺寸信息。

具体地，对于当前进行目标检测的视频图像，当该视频图像为该多帧视频图像中的第一帧视频图像时，电子设备在对该第一帧视频图像进行目标检测，确定该第一帧视频图像中的多个目标之后，可以生成该多个目标中每个目标的唯一标识，该唯一标识可以用ID(Identification，身份标识)来表示。电子设备在获取该第一帧视频图像中多个目标的位置信息和尺寸信息后，可以将该多个目标中每个目标在该视频图像中的位置信息和尺寸信息与每个目标的唯一标识对应存储。

对于当前进行目标检测的视频图像，当该视频图像为该多帧视频图像中除第一帧视频图像以外的视频图像时，电子设备在对该视频图像进行目标检测，确定该视频图像中的多个目标之后，可以确定该多个目标中的已知目标和未知目标，并生成该未知目标的唯一标识。电子设备在获取该视频图像中多个目标的位置信息和尺寸信息后，可以将该已知目标在该视频图像中的位置信息和尺寸信息与该已知目标的唯一标识对应存储，将该未知目标在该视频图像中的位置信息和尺寸信息与该未知目标的唯一标识对应存储。其中，该已知目标为该视频图像的上一帧视频图像中包含的目标，也即是，已获取其在上一帧视频图像中的位置信息和尺寸信息的目标，该未知目标为该上一帧视频图像中未包含的目标，也即是，未获取其在上一帧视频图像中的位置信息和尺寸信息的目标。

对于该多帧视频图像中的第一帧视频图像，电子设备在对该第一帧视频图像进行目标检测后，会为检测到的所有目标各自生成一个唯一标识。而对于第一帧视频图像以后的各帧视频图像，电子设备在对当前视频图像进行目标检测后，会判断检测出的所有目标中哪些是已在上一帧视频图像中检测到的目标(即已知目标)，哪些是未在上一帧视频图像中检测到的目标(即未知目标)，对于未知目标，电子设备会认为是一个新的目标，因而针对该未知目标，生成一个新的唯一标识。

上述过程实际上是进行目标检测和目标跟踪的过程。当目标在第一时刻进入视频画面，在第二时刻离开视频画面，则在第一时刻采集到的视频图像中可以检测到该目标，并且，在第一时刻和第二时刻之间的时刻采集到的视频图像中也可以检测到该目标，而在第二时刻采集到的视频图像中则不会检测到该目标。

在一种可能实现方式中，对于该多帧视频图像中的每帧视频图像，电子设备在对该视频图像进行目标检测，确定该视频图像中的多个目标之后，可以提取该视频图像中该多个目标的图像特征，并将该多个目标的图像特征与该多个目标的唯一标识对应存储。例如，电子设备可以采用特征提取模型，来提取图像中能够描述目标的图像特征，该图像特征可以用一串2进制码来表示。该特征提取模型可以采用机器学习的方法，通过大量样本训练得到。

具体地，电子设备可以对该多个目标中的每个目标均进行图像特征的提取，也可以仅对其中的某一些目标进行图像特征的提取。例如，电子设备可以先对视频图像中的目标进行评价后，再对满足预设评价条件的目标进行图像特征提取，满足预设评价条件的目标一般能够提取到准确完整描述该目标的图像特征，可以减少无意义的图像特征提取所带来的资源消耗。

其中，该预设评价条件由用户可以根据实际需求进行设置，或者，也可以由该电子设备默认设置，本公开实施例对此不做限定。

在一种可能实现方式中，对于该多帧视频图像中的每帧视频图像，电子设备可以获取该视频图像中多个目标的评价信息，该评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；从该多个目标中，选取评价信息满足预设评价条件的目标；提取所选取的目标的图像特征。其中，姿态是指图像中目标所处的姿态，如坐着、站着等；尺寸是指目标在图像中成像的尺寸；成像条件可以包括目标在图像中的成像有无阴影等；遮挡情况可以包括不同程度的遮挡，如无遮挡、部分遮挡和严重遮挡等；拍摄角度可以包括拍摄高度、拍摄方向和拍摄距离等。

不同类型的目标可以对应不同的预设评价条件，相应地，该从该多个目标中，选取评价信息满足预设评价条件的目标，包括：根据该多个目标的评价信息和该多个目标的类型，选取评价信息满足预设评价条件的目标。例如，人脸和人体这两种类型的目标可以对应不同的预设评价条件。

该步骤201中的各个目标可以是所有ID所属的各个目标，该各个目标中不同ID的目标可能为同一个真实目标，也即是，同一个真实目标可能具有多个ID。以该视频为监控区域的视频为例，当同一目标多次进出监控区域时，电子设备会认为该目标为多个目标，通过目标跟踪算法，生成多个ID。以目标A为例，如果目标A在t0时刻进入该监控区域，电子设备会针对该目标A生成ID1，并对其进行跟踪。如果在t1时刻，目标A离开该监控区域，则t1时刻之前采集到的视频图像中该目标A的位置信息、尺寸信息以及图像特征与该ID1会作为一个目标对应存储。如果在t2时刻，目标A再次进入该监控区域，则电子设备会认为该目标A是一个新的目标，针对该目标A生成一个新的ID2，并对其进行跟踪以及重新提取图像特征。这样，目标A可以包括ID1和ID2这两个ID。

需要说明的是，上述仅是以多个视频图像中的每个视频图像包括多个目标为例进行说明，在另一实施例中，该多个视频图像中的某些视频图像还可能仅包括一个目标，此时的实现原理与上述视频图像包括多个目标的实现相同或类似，即同样可以按照本公开实施例提供的方式对该一个目标进行相应的处理，这里不做过多介绍。

202、确定该各个目标中需要遮挡的第一目标。

在一种可能实现方式中，确定该各个目标中需要遮挡的第一目标包括：将该各个目标进行展示；当检测到第一选择事件时，将该第一选择事件对应的目标确定为该第一目标，该第一选择事件用于从该各个目标中选择需要遮挡的目标；当检测到第二选择事件时，将除第二目标以外的目标确定为该第一目标，该第二选择事件用于从该各个目标中选择不需要遮挡的该第二目标。

针对步骤201中该各个目标可以是所有ID所属的各个目标。在该步骤202中，如果电子设备具有显示功能，则可以在用户交互界面上展示该各个目标的局部图像，如从某一帧视频图像中截取的包含该目标的局部图像。如果电子设备没有显示功能，则可以将该各个目标的局部图像发送给用户设备，由用户设备在用户交互界面上展示该各个目标的局部图像。

当视频分析结束后，电子设备与用户进行交互，将该视频中所有出现的目标都通过用户交互界面展示给用户，用户可以通过浏览选择需要遮挡或者不需要遮挡的目标，电子设备可以根据用户的选择确定需要遮挡的第一目标或者不需要遮挡的第二目标，该第一目标是用户不想关注或不感兴趣的无关目标，第二目标是用户希望关注或感兴趣的目标。

203、确定该各个目标中与该第一目标为同一个真实目标的目标。

针对步骤201中当同一目标多次进出监控区域时，电子设备会认为该目标为多个目标的情况，该各个目标中的有些目标可能为同一个真实目标。

因此，对于需要进行遮挡的第一目标，为了保证遮挡的全面性，电子设备可以通过目标对比，从该各个目标中找到与该第一目标为同一个真实目标的目标。其中，目标对比可以是将两个目标的图像特征利用预设计算方法，得到它们之间的相似度。在一种可能实现方式中，电子设备可以通过各个目标与第一目标的相似度，来确定与该第一目标为同一个真实目标的目标。具体地，电子设备可以将该第一目标的图像特征和该各个目标的图像特征进行比对，获取该各个目标与该第一目标的相似度；根据该各个目标与该第一目标的相似度，确定该各个目标中与该第一目标为同一个真实目标的目标。

当用户选定第一目标后，电子设备可以根据第一目标的ID，获取与该ID对应存储的该第一目标的一个或多个图像特征，然后将视频中所有目标的图像特征与该第一目标的图像特征进行两两对比，计算相似度。例如，电子设备可以利用欧式距离计算两个图像特征的相似度，欧式距离越小相似度越大。当然，相似度的计算不限于欧式距离，如还可以是余弦相似度，本公开实施例对相似度的计算方式不做具体限定。

电子设备根据该各个目标与该第一目标的相似度，确定该各个目标中与该第一目标为同一个真实目标的目标包括但不限于以下两种可能实现方式：

第一种方式、根据该各个目标与该第一目标的相似度，将该各个目标进行排列展示，相似度越大排列越靠前；当检测到目标确认事件时，将该目标确认事件对应的目标确定为与该第一目标为同一个真实目标的目标，该目标确认事件用于从该各个目标中选择与该第一目标为同一个真实目标的目标。

该方式是电子设备根据用户的确认操作，来确定与该第一目标为同一个真实目标的目标。针对步骤201描述的一个真实目标存在多个ID的情况，通过将比对后的目标，按照相似度从高到低的排序展示给用户，由用户根据比对结果确认排序靠前的目标是否为同一个真实目标，并进行选择，如选择与第一目标为同一个真实目标的多个目标(多个ID)。

通过将视频分析与简单的人工确认结合，可以高效准确的找到所有需要遮挡的目标，进而高效的实现对视频中无关目标进行有效的隐私遮挡，同时对感兴趣的目标不进行遮挡。

第二种方式、根据该各个目标与该第一目标的相似度，将与该第一目标的相似度大于预设阈值的目标确定为与该第一目标为同一个真实目标的目标。

其中，该预设阈值可以由用户根据实际需求进行设置，或者，也可以由该电子设备默认设置，本公开实施例对此不做限定。

该方式是电子设备根据各个目标与该第一目标的相似度大小，来确定与该第一目标为同一个真实目标的目标，可以减少用户操作。当任一目标与该第一目标的相似度大于预设阈值时，电子设备可以认为该目标与该第一目标为同一个真实目标，均是需要遮挡的目标。

204、根据该目标和该第一目标在该多帧视频图像中的位置信息和尺寸信息，对该多帧视频图像中该目标和该第一目标所在的区域进行遮挡。

其中，该目标所在的区域为该目标的位置信息和尺寸信息所对应的区域。

本公开实施例中，电子设备在确定与需要遮挡的第一目标为同一个真实目标的目标后，可以获取已存储的第一目标以及与第一目标为同一个真实目标的所有目标的运动轨迹信息，从而进行隐私遮挡操作。隐私遮挡是指在图片中或视频中采用某种技术手段对敏感的目标进行遮挡。

如电子设备可以在该多帧图像中的每帧图像中，将与第一目标为同一个真实目标的所有目标进行遮挡，从而生成遮挡视频，遮挡视频是指对原视频中的特定目标进行遮挡后得到的视频。具体地，对于每个需要遮挡的目标，电子设备可以根据该目标在每帧视频图像中的位置信息和尺寸信息，在每帧视频图像中对该目标进行遮挡。其中，遮挡方式包括但不限于在相应区域叠加不透明的遮挡块，这个遮挡块可以设置为目标颜色或马赛克形式，只要能起到遮挡作用即可。

需要说明的是，该步骤203和步骤204是根据该第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在的区域进行遮挡的一种可能实现方式，该第一目标所在的区域为该第一目标的位置信息和尺寸信息所对应的区域。通过将与第一目标为同一个真实目标的所有目标进行遮挡，可以保证遮挡的全面性。在另一实施例中，根据该第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在的区域进行遮挡还可以包括其他可能的实现方式，譬如，可以直接根据该第一目标的运动轨迹信息在该多帧视频图像中确定需要遮挡的区域，然后在该多帧视频图像中对所确定的区域进行遮挡。

参见图3，图3是本公开实施例提供的一种生成遮挡视频的流程示意图。如图3所示，整个过程可以由数据提取单元、数据存储单元、遮挡处理单元和用户交互单元来实现，其中，数据提取单元包括对视频进行目标检测、目标跟踪、目标评价和目标特征提取。数据提取单元负责提取给定视频中的所有目标，对其进行跟踪，跟踪的每个目标生成唯一标识ID，在跟踪过程中获取每个目标在时序上的轨迹，譬如，获取每个目标在每帧视频图像中的位置和尺寸。在目标跟踪过程中，对目标进行实时评价，示例性地，进行实时评价的评价指标可以包含但不限于姿态、尺寸、成像条件、遮挡因素、角度等，并根据目标类型挑选满足评价条件的一个或多个目标来提取图像特征。数据存储单元可以采用元数据(Metadata)的形式进行数据存储，将数据提取单元提取出来的每个目标的ID、运动轨迹信息和图像特征存储起来。遮挡处理单元结合用户交互单元提供半自动的隐私遮挡操作，包括提供目标预览，由用户选择关注目标，获取该目标的图像特征，进行特征比对，人工对比对结果进行复核筛选，然后获取已存储的该目标的运动轨迹信息，最后生成遮挡视频。

需要说明的是，本公开实施例是以步骤201至步骤204以电子设备执行为例进行说明，也即是，该电子设备上可以集成有图3中数据提取单元、数据存储单元、遮挡处理单元和用户交互单元所实现的各个功能。当然，该步骤201至步骤204也可以由不同的设备执行，也即是，图3中的各个单元所实现的各个功能可以分别集成在不同的设备上。

通过利用图像特征比对来确定与需要遮挡的目标为同一个真实目标的所有目标，可以实现对需要遮挡的所有目标进行遮挡，对不需要遮挡的所有目标不进行遮挡的功能。同时，还可以实现同一个真实目标多次进出同一场景的简易遮挡方法，该方法还可以用于不同场景下对同一目标的遮挡。例如，如该不同场景可以是同一监控区域内不同摄像头拍摄到不同视频的场景，针对不同场景的不同视频均可以通过上述步骤201至步骤204来实现对该监控区域内同一目标的遮挡。相比于相关技术中人工对视频中需要遮挡的目标逐帧添加坐标信息，最终根据每帧的坐标信息进行遮挡，本公开实施例提供的技术方案在处理视频量较大的情况下，可以大幅降低用户的人工操作成本。

图4是本公开实施例提供的一种视频图像遮挡装置的结构示意图。参照图4，该装置包括：

获取模块401，用于基于视频的多帧视频图像，获取该视频内出现的各个目标的运动轨迹信息，该各个目标的运动轨迹信息包括该各个目标在该多帧视频图像中的位置信息和尺寸信息；

确定模块402，用于确定该各个目标中需要遮挡的第一目标；

遮挡模块403，用于根据该第一目标的运动轨迹信息，对该多帧视频图像中该第一目标所在的区域进行遮挡，该第一目标所在的区域为该第一目标的位置信息和尺寸信息所对应的区域。

在一种可能实现方式中，该获取模块用于对于该多帧视频图像中的每帧视频图像，对该视频图像进行目标检测，确定该视频图像中的多个目标；获取该多个目标在该视频图像中的位置信息和尺寸信息。

在一种可能实现方式中，参见图5，该装置还包括：

第一生成模块404，用于当该视频图像为该多帧视频图像中的第一帧视频图像时，生成该多个目标中每个目标的唯一标识；

第一存储模块405，用于将该多个目标中每个目标在该视频图像中的位置信息和尺寸信息与该每个目标的唯一标识对应存储。

在一种可能实现方式中，参见图6，该装置还包括：

该确定模块402还用于当该视频图像为该多帧视频图像中除第一帧视频图像以外的视频图像时，确定该多个目标中的已知目标和未知目标，该已知目标为该视频图像的上一帧视频图像中包含的目标，该未知目标为该上一帧视频图像中未包含的目标；

第二生成模块406，用于生成该未知目标的唯一标识；

第二存储模块407，用于将该已知目标在该视频图像中的位置信息和尺寸信息与该已知目标的唯一标识对应存储；将该未知目标在该视频图像中的位置信息和尺寸信息与该未知目标的唯一标识对应存储。

在一种可能实现方式中，参见图7，该装置还包括：

提取模块408，用于提取该视频图像中该多个目标的图像特征；

第三存储模块409，用于将该多个目标的图像特征与该多个目标的唯一标识对应存储。

在一种可能实现方式中，该提取模块408用于获取该视频图像中该多个目标的评价信息，该评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；从该多个目标中，选取评价信息满足预设评价条件的目标；提取所选取的目标的图像特征。

在一种可能实现方式中，该确定模块402用于将该各个目标进行展示；当检测到第一选择事件时，将该第一选择事件对应的目标确定为该第一目标，该第一选择事件用于从该各个目标中选择需要遮挡的目标；当检测到第二选择事件时，将除该第二选择事件对应的目标以外的目标确定为该第一目标，该第二选择事件用于从该各个目标中选择不需要遮挡的目标。

在一种可能实现方式中，该遮挡模块403用于确定该各个目标中与该第一目标为同一个真实目标的目标；根据该目标和该第一目标在该多帧视频图像中的位置信息和尺寸信息，对该多帧视频图像中该目标和该第一目标所在的区域进行遮挡。

在一种可能实现方式中，该确定模块402用于将该第一目标的图像特征和该各个目标的图像特征进行比对，获取该各个目标与该第一目标的相似度；根据该各个目标与该第一目标的相似度，确定该各个目标中与该第一目标为同一个真实目标的目标。

在一种可能实现方式中，该确定模块402用于根据该各个目标与该第一目标的相似度，将该各个目标进行排列展示，相似度越大排列越靠前；当检测到目标确认事件时，将该目标确认事件对应的目标确定为与该第一目标为同一个真实目标的目标，该目标确认事件用于从该各个目标中选择与该第一目标为同一个真实目标的目标。

在一种可能实现方式中，该确定模块402用于根据该各个目标与该第一目标的相似度，将与该第一目标的相似度大于预设阈值的目标确定为与该第一目标为同一个真实目标的目标。

需要说明的是：上述实施例提供的视频图像遮挡装置在视频图像遮挡时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的视频图像遮挡装置与视频图像遮挡方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图8是本公开实施例提供的一种电子设备800的结构示意图，该电子设备800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)801和一个或一个以上的存储器802，其中，该存储器802中存储有至少一条指令，该至少一条指令由该处理器801加载并执行以实现上述各个方法实施例提供的视频图像遮挡方法。当然，该电子设备800还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该电子设备800还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种存储有至少一条指令的计算机可读存储介质，例如存储有至少一条指令的存储器，上述至少一条指令被处理器执行时实现上述实施例中的视频图像遮挡方法。例如，该计算机可读存储介质可以是只读内存(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory，RAM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，上述程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

上述仅为本公开的较佳实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

一种视频图像遮挡方法，其特征在于，所述方法包括：

基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，所述各个目标的运动轨迹信息包括所述各个目标在所述多帧视频图像中的位置信息和尺寸信息；

确定所述各个目标中需要遮挡的第一目标；

根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，所述第一目标所在的区域为所述第一目标的位置信息和尺寸信息所对应的区域。
根据权利要求1所述的方法，其特征在于，所述基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，包括：

对于所述多帧视频图像中的每帧视频图像，对所述视频图像进行目标检测，确定所述视频图像中的多个目标；

获取所述多个目标在所述视频图像中的位置信息和尺寸信息。
根据权利要求2所述的方法，其特征在于，所述对所述视频图像进行目标检测，确定所述视频图像中的多个目标之后，所述方法还包括：

当所述视频图像为所述多帧视频图像中的第一帧视频图像时，生成所述多个目标中每个目标的唯一标识；

所述获取所述多个目标在所述视频图像中的位置信息和尺寸信息之后，所述方法还包括：

将所述多个目标中每个目标在所述视频图像中的位置信息和尺寸信息与所述每个目标的唯一标识对应存储。
根据权利要求2所述的方法，其特征在于，所述对所述视频图像进行目标检测，确定所述视频图像中的多个目标之后，所述方法还包括：

当所述视频图像为所述多帧视频图像中除第一帧视频图像以外的视频图像时，确定所述多个目标中的已知目标和未知目标，所述已知目标为所述视频图像的上一帧视频图像中包含的目标，所述未知目标为所述上一帧视频图像中未包含的目标；

生成所述未知目标的唯一标识；

所述获取所述多个目标在所述视频图像中的位置信息和尺寸信息之后，所述方法还包括：

将所述已知目标在所述视频图像中的位置信息和尺寸信息与所述已知目标的唯一标识对应存储；

将所述未知目标在所述视频图像中的位置信息和尺寸信息与所述未知目标的唯一标识对应存储。
根据权利要求3或4所述的方法，其特征在于，所述对所述视频图像进行目标检测，确定所述视频图像中的多个目标之后，所述方法还包括：

提取所述视频图像中所述多个目标的图像特征；

将所述多个目标的图像特征与所述多个目标的唯一标识对应存储。
根据权利要求5所述的方法，其特征在于，所述提取所述视频图像中所述多个目标的图像特征，包括：

获取所述视频图像中所述多个目标的评价信息，所述评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；

从所述多个目标中，选取评价信息满足预设评价条件的目标；

提取所选取的目标的图像特征。
根据权利要求1所述的方法，其特征在于，所述确定所述各个目标中需要遮挡的第一目标，包括：

将所述各个目标进行展示；

当检测到第一选择事件时，将所述第一选择事件对应的目标确定为所述第一目标，所述第一选择事件用于从所述各个目标中选择需要遮挡的目标；

当检测到第二选择事件时，将除所述第二选择事件对应的目标以外的目标确定为所述第一目标，所述第二选择事件用于从所述各个目标中选择不需要遮挡的目标。
根据权利要求1或7所述的方法，其特征在于，所述根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，包括：

确定所述各个目标中与所述第一目标为同一个真实目标的目标；

根据所述目标和所述第一目标在所述多帧视频图像中的位置信息和尺寸信息，对所述多帧视频图像中所述目标和所述第一目标所在的区域进行遮挡。
根据权利要求8所述的方法，其特征在于，所述确定所述各个目标中与所述第一目标为同一个真实目标的目标，包括：

将所述第一目标的图像特征和所述各个目标的图像特征进行比对，获取所述各个目标与所述第一目标的相似度；

根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标。
根据权利要求9所述的方法，其特征在于，所述根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标，包括：

根据所述各个目标与所述第一目标的相似度，将所述各个目标进行排列展示，相似度越大排列越靠前；

当检测到目标确认事件时，将所述目标确认事件对应的目标确定为与所述第一目标为同一个真实目标的目标，所述目标确认事件用于从所述各个目标中选择与所述第一目标为同一个真实目标的目标。
根据权利要求9所述的方法，其特征在于，所述根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标，包括：

根据所述各个目标与所述第一目标的相似度，将与所述第一目标的相似度大于预设阈值的目标确定为与所述第一目标为同一个真实目标的目标。
一种视频图像遮挡装置，其特征在于，所述装置包括：

获取模块，用于基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，所述各个目标的运动轨迹信息包括所述各个目标在所述多帧视频图像中的位置信息和尺寸信息；

确定模块，用于确定所述各个目标中需要遮挡的第一目标；

遮挡模块，用于根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，所述第一目标所在的区域为所述第一目标的位置信息和尺寸信息所对应的区域。
根据权利要求12所述的装置，其特征在于，所述获取模块用于对于所述多帧视频图像中的每帧视频图像，对所述视频图像进行目标检测，确定所述视频图像中的多个目标；获取所述多个目标在所述视频图像中的位置信息和尺寸信息。
根据权利要求13所述的装置，其特征在于，所述装置还包括：

第一生成模块，用于当所述视频图像为所述多帧视频图像中的第一帧视频图像时，生成所述多个目标中每个目标的唯一标识；

第一存储模块，用于将所述多个目标中每个目标在所述视频图像中的位置信息和尺寸信息与所述每个目标的唯一标识对应存储。
根据权利要求13所述的装置，其特征在于，所述装置还包括：

所述确定模块还用于当所述视频图像为所述多帧视频图像中除第一帧视频图像以外的视频图像时，确定所述多个目标中的已知目标和未知目标，所述已知目标为所述视频图像的上一帧视频图像中包含的目标，所述未知目标为所述上一帧视频图像中未包含的目标；

第二生成模块，用于生成所述未知目标的唯一标识；

第二存储模块，用于将所述已知目标在所述视频图像中的位置信息和尺寸信息与所述已知目标的唯一标识对应存储；将所述未知目标在所述视频图像中的位置信息和尺寸信息与所述未知目标的唯一标识对应存储。
根据权利要求14或15所述的装置，其特征在于，所述装置还包括：

提取模块，用于提取所述视频图像中所述多个目标的图像特征；

第三存储模块，用于将所述多个目标的图像特征与所述多个目标的唯一标识对应存储。
根据权利要求16所述的装置，其特征在于，所述提取模块用于获取所述视频图像中所述多个目标的评价信息，所述评价信息包括姿态、尺寸、成像条件、遮挡情况和拍摄角度中至少一项；从所述多个目标中，选取评价信息满足预设评价条件的目标；提取所选取的目标的图像特征。
根据权利要求12所述的装置，其特征在于，所述确定模块用于将所述各个目标进行展示；当检测到第一选择事件时，将所述第一选择事件对应的目标确定为所述第一目标，所述第一选择事件用于从所述各个目标中选择需要遮挡的目标；当检测到第二选择事件时，将除所述第二选择事件对应的目标以外的目标确定为所述第一目标，所述第二选择事件用于从所述各个目标中选择不需要遮挡的目标。
根据权利要求12或18所述的装置，其特征在于，所述遮挡模块用于确定所述各个目标中与所述第一目标为同一个真实目标的目标；根据所述目标和所述第一目标在所述多帧视频图像中的位置信息和尺寸信息，对所述多帧视频图像中所述目标和所述第一目标所在的区域进行遮挡。
根据权利要求19所述的装置，其特征在于，所述确定模块用于将所述第一目标的图像特征和所述各个目标的图像特征进行比对，获取所述各个目标与所述第一目标的相似度；根据所述各个目标与所述第一目标的相似度，确定所述各个目标中与所述第一目标为同一个真实目标的目标。
根据权利要求20所述的装置，其特征在于，所述确定模块用于根据所述各个目标与所述第一目标的相似度，将所述各个目标进行排列展示，相似度越大排列越靠前；当检测到目标确认事件时，将所述目标确认事件对应的目标确定为与所述第一目标为同一个真实目标的目标，所述目标确认事件用于从所述各个目标中选择与所述第一目标为同一个真实目标的目标。
根据权利要求20所述的装置，其特征在于，所述确定模块用于根据所述各个目标与所述第一目标的相似度，将与所述第一目标的相似度大于预设阈值的目标确定为与所述第一目标为同一个真实目标的目标。
一种电子设备，其特征在于，包括处理器和存储器；所述存储器，用于存放至少一条指令；所述处理器，用于执行所述存储器上所存放的至少一条指令：

基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，所述各个目标的运动轨迹信息包括所述各个目标在所述多帧视频图像中的位置信息和尺寸信息；

确定所述各个目标中需要遮挡的第一目标；

根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，所述第一目标所在的区域为所述第一目标的位置信息和尺寸信息所对应的区域。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有至少一条指令，所述至少一条指令被处理器执行：

基于视频的多帧视频图像，获取所述视频内出现的各个目标的运动轨迹信息，所述各个目标的运动轨迹信息包括所述各个目标在所述多帧视频图像中的位置信息和尺寸信息；

确定所述各个目标中需要遮挡的第一目标；

根据所述第一目标的运动轨迹信息，对所述多帧视频图像中所述第一目标所在的区域进行遮挡，所述第一目标所在的区域为所述第一目标的位置信息和尺寸信息所对应的区域。