CN109740517A

CN109740517A - 一种确定待识别对象的方法及装置

Info

Publication number: CN109740517A
Application number: CN201811643419.3A
Authority: CN
Inventors: 万一木; 徐珺
Original assignee: Chengdu Yitu Network Technology Co Ltd; Shanghai Is According To Figure Network Technology Co Ltd
Current assignee: Chengdu Yitu Network Technology Co Ltd; Shanghai Is According To Figure Network Technology Co Ltd; Shanghai Yitu Network Science and Technology Co Ltd
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2019-05-10

Abstract

本申请实施例提供了一种确定待识别对象的方法及装置，涉及视频处理技术领域，该方法包括：从治安平台的监控设备中获取待处理的视频，所述待处理视频包括N帧图像；N大于等于2；所述监控设备设置于车辆通行区域；将第一图像输入至分类模型，得到所述第一图像中各识别对象；所述识别对象包括识别对象的类型及识别对象对应的图像信息；所述识别对象的类型包括行人、非机动车和机动车；所述第一图像是所述N帧图像中的任一个；从所述待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型。利用提取后的待识别对象特征的信息进行属性检测的方法，从而降低了计算量，同时提高了效率。

Description

一种确定待识别对象的方法及装置

技术领域

本发明实施例涉及视频处理技术领域，尤其涉及一种确定待识别对象的方法及装置。

背景技术

当今社会中，出于安防管理的需要，监控设备布满了街道、社区、楼宇等各种公共场合。在发生警情时，先从监控设备采集的视频数据中确定出嫌疑人或嫌疑车辆的图像，然后由警务人员根据嫌疑人或嫌疑车辆的图像搜捕嫌疑人或嫌疑车辆。

现有技术中，监控设备采集视频流后，多采用对视频流中的每帧图像进行检测和识别，确定每帧图像中的人脸或车辆等对象，然后再将各帧图像中检测出的对象进行匹配，确定出一个对象的所有图像，该方法由于需要对每帧图像进行检测和识别，计算量较大，效率低。

发明内容

由于现有技术中，从视频流中确定同一对象的图像时，对每帧图像进行检测和识别，且需要将每帧图像的全部信息进行检测和识别，计算量较大且效率较低，基于上述问题，本申请实施例提供了一种确定待识别对象的方法及装置。

一方面，本申请实施例提供了一种确定待识别对象的方法，该方法包括：

从治安平台的监控设备中获取待处理的视频，所述待处理视频包括N帧图像；N大于等于2；所述监控设备设置于车辆通行区域；

将第一图像输入至分类模型，得到所述第一图像中各识别对象；所述识别对象包括识别对象的类型及识别对象对应的图像信息；所述识别对象的类型包括行人、非机动车和机动车；所述第一图像是所述N帧图像中的任一个；

从所述待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型。

可选地，所述第一图像为检测帧图像，所述方法还包括：

获取第二图像，所述第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像；

针对所述第一图像中的第一识别对象，在所述第二图像中查找相似度大于预设阈值的预测图像区域，作为所述第一识别对象在所述第二图像中对应的图像信息；所述第一识别对象为所述第一图像中的任一识别对象。

可选地，所述方法还包括：

获取第三图像，所述第三图像为所述第二图像的下一帧图像且所述第三图像为预测帧图像；

针对所述第二图像中的所述第一识别对象，在所述第三图像中查找相似度大于所述预设阈值的预测图像区域，作为所述第一识别对象在所述第三图像中对应的图像信息。

可选地，所述从所述待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型之后，还包括：

根据第一识别对象的类型，将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型，得到所述第一识别对象对应的各属性类别的属性值。

可选地，所述属性分类模型包括多个第一分类模型和第二分类模型；各第一分类模型对应的属性类别均不同；所述第二分类模型对应于所有属性类别；

所述将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型，得到所述第一识别对象对应的各属性类别的属性值，包括：

将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型，根据每个第一分类模型的预测结果，得到所述第三图像信息对应的多个属性类别的属性值的置信度；所述第三图像信息为所述各图像信息中的任一个；

将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型，得到所述第一识别对象对应各属性类别的属性值。

一方面，本申请实施例提供了一种确定待识别对象的装置，包括：

获取单元，从治安平台的监控设备中获取待处理的视频，所述待处理视频包括N帧图像；N大于等于2；所述监控设备设置于车辆通行区域；

待识别对象确定单元，用于将第一图像输入至分类模型，得到所述第一图像中各识别对象；所述识别对象包括识别对象的类型及识别对象对应的图像信息；所述识别对象的类型包括行人、非机动车和机动车；所述第一图像是所述N帧图像中的任一个；从所述待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型。

可选地，所述第一图像为检测帧图像，所述获取单元还用于：

所述待识别对象确定单元还用于：

可选地，所述获取单元还用于：

所述待识别对象确定单元还用于：

可选地，所述装置还包括属性确定单元，用于根据第一识别对象的类型，将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型，得到所述第一识别对象对应的各属性类别的属性值。

所述属性确定单元用于：

一方面，本申请实施例提供了一种确定待识别对象的设备，包括至少一个处理单元、以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行确定待识别对象的方法的步骤。

一方面，本申请实施例提供了一种计算机可读介质，其存储有可由确定待识别对象的设备执行的计算机程序，当所述程序在确定待识别对象的设备上运行时，使得所述确定待识别对象的设备执行确定待识别对象的方法的步骤。

本申请实施例中，通过将监控视频中的每帧图像进行多个待识别对象特征的提取，并利用提取后的待识别对象特征的信息进行属性检测的方法，解决了现有技术中需要将整帧图像进行识别的问题，并且通过确定检测帧以及预测帧的方法，不需要对每帧图像进行检测，从而降低了确定待识别图像中的待识别对象的计算量，同时提高了效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例适用的系统架构图；

图2为本申请实施例提供的一种确定待识别对象的方法的流程示意图；

图3为本申请实施例提供的一种确定待识别对象的示意图；

图4为本申请实施例提供的一种确定待识别对象的示意图；

图5为本申请实施例一种确定待识别对象的装置的结构示意图；

图6为本申请实施例一种确定待识别对象的设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1示例性示出了本申请实施例适用的系统架构，在该系统架构中包括监控设备101、服务器102。监控设备101实时采集视频流，然后将采集的视频流发送至服务器102，服务器102中包括确定待识别对象的装置，服务器102从视频流中获取待识别图像，然后确定待识别图像中的待识别对象对应的图像区域。监控设备101通过无线网络与服务器102连接，监控设备是具备采集图像功能的电子设备，比如摄像头、摄像机、录像机等。服务器102是一台服务器或若干台服务器组成的服务器集群或云计算中心。

基于图1所示的系统架构，本申请实施例提供了一种确定待识别对象的方法的流程，该方法的流程可以由确定待识别对象的装置执行，确定待识别对象的装置可以是图1所示的服务器102，如图2所示，包括以下步骤：

步骤201，从治安平台的监控设备中获取待处理的视频，所述待处理视频包括N帧图像；N大于等于2；所述监控设备设置于车辆通行区域；

监控设备实时采集视频流，视频流由多帧待识别图像组成。

步骤202，将第一图像输入至分类模型，得到所述第一图像中各识别对象；所述识别对象包括识别对象的类型及识别对象对应的图像信息；所述识别对象的类型包括行人、非机动车和机动车；所述第一图像是所述N帧图像中的任一个；

本发明实施例中，将监控设备获取的待处理的视频中的任一帧图像输入到分类模型中，通过分类模型，能够得到该帧图像中具有的多识别对象的类型以及该识别对象对应的图像信息；在本发明实施例中，识别对象的类型包括行人、非机动车和机动车，所以在本发明实施例中，针对一帧图像，若该帧图像中包括每种识别对象的类型，则将该帧图像输入至分类器后，可以确定出该帧图像中包括行人、非机动车和机动车，且能够确定出针对每个识别对象的识别区域。

在步骤203中，确定了各识别对象对应的图像信息后，对个图像信息进行标记，可选的，在本发明实施例中，可以使用框形结构对图像信息进行标记，如图3所示，图3中包括行人以及机动车，通过框形结构将行人以及机动车进行标记。

可选的，在本发明实施例中，在形成检测框时，首先会在该帧图像上形成大量的候选框，然后判断候选框中的图像信息是否为类型的候选框对应的图像类型，该候选框对应的图像类型为前景，其它图像信息为背景，根据前景以及背景确定识别对象的区域，并进行标记。

可选的，在本发明实施例中，当输入一帧图像进入分类模型后，输出的内容为多个识别对象对应的图像信息，且图像信息使用检测框进行覆盖，如图4所示，将图4(a)的图像输入到分类模型中，得到图4(b)中的结果。

可选的，在本发明实施例中，当从待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型后，将得到的各识别对象输入至该识别对象对应的属性分类模型中，得到该识别对象在对应属性分类中的属性值。

例如，在本发明实施例中，将行人的图像信息输入至行人属性分类模型中，得到关于行人的属性值。

可选的，属性分类模型包括多个第一分类模型和第二分类模型；各第一分类模型对应的属性类别均不同；所述第二分类模型对应于所有属性类别；

举个例子，以第一识别对象为行人为例，设定多个第一分类模型分别包括用于识别行人性别的第一分类模型、用于识别行人年龄的第一分类模型、用于识别行人上衣颜色的第一分类模型、用于识别行人上衣款式的第一分类模型、用于识别行人下衣颜色的第一分类模型、用于识别行人下衣款式的第一分类模型、用于识别行人鞋子颜色的第一分类模型、用于识别行人是否戴眼镜的第一分类模型及用于识别行人是否背包的第一分类模型。可以将行人的识别图像分别输入以上各第一分类模型，从而得到该行人的识别图像对应的不同性别的置信度、不同年龄层的置信度、不同上衣颜色的置信度、不同上衣款式的置信度、不同下衣颜色的置信度、不同下衣款式的置信度、不同鞋子颜色的置信度、是否戴眼镜的置信度及是否背包的置信度。进而，可以将行人的识别图像分别对应的上述不同类别的属性值的置信度输入第二分类模型，从而得到对应的多个类别的属性值。

可选的，在本发明实施例中，为了减少每帧图像都需要进入分类模型进行待识别对象的检测的计算量，可以使用检测帧来输入至分类模型确定待识别对象，使用检测帧来确定预测帧中的待识别对象。

具体的，第一图像为检测帧图像，获取第二图像，第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像；

示例性的，设定一段视频流中包括10帧图像，将第一帧图像和第五帧图像标记为检测帧图像，第二帧图像至第四帧图像标记为预测帧图像，第六帧至第十帧标记为预测帧图像。

可选的，在本发明实施例中，通过在检测帧中确定关键点以及预测帧中的关键点的位置，确定预测帧中的待识别对象。

具体地，关键点是用于识别对象的关键点，比如行人的关键点为头部、四肢、上半身、下半身等。车的关键点包括车牌、车窗、车轮等。

可选的，可以先根据检测帧中各识别对象对应的图像区域，预测各识别对象在预测帧中对应的图像区域，进而可以预测各识别对象在预测帧中对应图像区域中的图像信息，即各识别对象在预测帧中对应的图像信息。

具体地，针对检测帧中的任一识别对象对应的图像区域，从预测帧中确定出与该识别对象对应的图像区域的相似度大于预设阈值的图像区域，作为该识别对象在预测帧中对应的预测图像区域。

举个例子，设定已知检测帧中各识别对象对应的图像框，针对检测帧中识别对象A对应的图像框，从预测帧中确定出与待识别对象A的图像框的相似度大于预设阈值的图像框，作为待识别对象A在预测帧中的图像框。

可选的，在本发明实施例中，当获取了第三图像，第三图像的上一帧为通过检测帧确定待识别对象的预测帧，则通过该预测帧以及预测帧上的关键点在第三图像中查找相似度大于所述预设阈值的预测图像区域。

为了更好的解释本发明实施例，下面结合具体的实施场景描述本申请实施例提供的一种确定待识别对象的方法，该方法可以由确定待识别对象的装置执行。

设定视频流中包括10帧待识别图像，其中第一帧待识别图像为检测帧图像，将第一帧待识别图像输入至分类模型中，得到行人、机动车以及非机动车的图像信息，根据第一帧图像中的各类图像信息确定第二帧待识别图像、第三帧待识别图像……第十帧待识别图像中的各待识别对象的图像信息。

具体的，若待识别对象为行人，将第一帧待识别图像输入至分类模型中，确定第一帧待识别图像中的各行人的第一行人检测框。针对第一帧待识别图像中行人A的第一行人检测框，先对第一行人检测框中行人A的关键点进行检测，根据检测的关键点调整第一行人检测框。然后判断行人A的第一行人检测框是否为行人图像，若是，则预测行人A的第一行人检测框在第二帧待识别图像对应的第二行人预测框。对第二行人预测框中行人A的关键点进行检测，根据检测的关键点调整第二行人预测框。之后再判断行人A的第二行人预测框是否为行人图像，若是，则预测行人A的第二行人预测框在第三帧待识别图像中对应的第三行人预测框，对第三行人预测框中行人A的关键点进行检测，直到对第十帧待识别图像中的各行人进行预测框标记。

将待处理视频得到的10帧待识别图像中每个行人的检测框的图像信息输入到行人属性分类模型中，得到针对行人属性分类的属性值。

基于相同的技术构思，本发明实施例提供了一种确定待识别对象的装置，如图5所示，该装置500包括：

获取模块501，用于获取单元，从治安平台的监控设备中获取待处理的视频，所述待处理视频包括N帧图像；N大于等于2；所述监控设备设置于车辆通行区域；

待识别对象确定单元502，用于将第一图像输入至分类模型，得到所述第一图像中各识别对象；所述识别对象包括识别对象的类型及识别对象对应的图像信息；所述识别对象的类型包括行人、非机动车和机动车；所述第一图像是所述N帧图像中的任一个；从所述待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型。

可选地，所述第一图像为检测帧图像，所述获取单元501还用于：

所述待识别对象确定单元502还用于：

可选地，所述获取单元501还用于：

所述待识别对象确定单元502还用于：

可选地，所述装置还包括属性确定单元503，用于根据第一识别对象的类型，将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型，得到所述第一识别对象对应的各属性类别的属性值。

可选地，述属性分类模型包括多个第一分类模型和第二分类模型；各第一分类模型对应的属性类别均不同；所述第二分类模型对应于所有属性类别；

所述属性确定单元503具体用于：

基于相同的技术构思，本申请实施例提供了一种确定待识别对象的设备，如图6所示，包括至少一个处理器601，以及与至少一个处理器连接的存储器602，本申请实施例中不限定处理器601与存储器602之间的具体连接介质，图6中处理器601和存储器602之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。

在本申请实施例中，存储器602存储有可被至少一个处理器601执行的指令，至少一个处理器601通过执行存储器602存储的指令，可以执行前述确定待识别对象的方法中所包括的步骤。

其中，处理器601是确定待识别对象的设备的控制中心，可以利用各种接口和线路连接确定待识别对象的设备的各个部分，通过运行或执行存储在存储器602内的指令以及调用存储在存储器602内的数据，从而确定待识别对象。可选的，处理器601可包括一个或多个处理单元，处理器601可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器601中。在一些实施例中，处理器601和存储器602可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器601可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器602作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器602可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器602还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

基于同一发明构思，本申请实施例提供了一种计算机可读介质，其存储有可由确定待识别对象的设备执行的计算机程序，当程序在确定待识别对象的设备上运行时，使得确定待识别对象的设备执行确定待识别对象的方法的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种确定待识别对象的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一图像为检测帧图像，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述从所述待处理视频中提取各识别对象对应的图像信息，并标记各图像信息对应的识别对象的类型之后，还包括：

5.根据权利要求4所述的方法，其特征在于，所述属性分类模型包括多个第一分类模型和第二分类模型；各第一分类模型对应的属性类别均不同；所述第二分类模型对应于所有属性类别；

6.一种确定待识别对象的装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，所述第一图像为检测帧图像，所述获取单元还用于：

所述待识别对象确定单元还用于：

8.如权利要求7所述的装置，其特征在于，所述获取单元还用于：

所述待识别对象确定单元还用于：

9.如权利要求6所述的装置，其特征在于，所述装置还包括属性确定单元，用于根据第一识别对象的类型，将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型，得到所述第一识别对象对应的各属性类别的属性值。

10.如权利要求9所述的装置，其特征在于，所述属性分类模型包括多个第一分类模型和第二分类模型；各第一分类模型对应的属性类别均不同；所述第二分类模型对应于所有属性类别；

所述属性确定单元具体用于：

11.一种确定待识别对象的设备，其特征在于，包括至少一个处理单元、以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行权利要求1～5任一权利要求所述方法的步骤。

12.一种计算机可读介质，其特征在于，其存储有可由确定待识别对象的设备执行的计算机程序，当所述程序在确定待识别对象的设备上运行时，使得所述确定待识别对象的设备执行权利要求1～5任一所述方法的步骤。