CN109740517A - 一种确定待识别对象的方法及装置 - Google Patents

一种确定待识别对象的方法及装置 Download PDF

Info

Publication number
CN109740517A
CN109740517A CN201811643419.3A CN201811643419A CN109740517A CN 109740517 A CN109740517 A CN 109740517A CN 201811643419 A CN201811643419 A CN 201811643419A CN 109740517 A CN109740517 A CN 109740517A
Authority
CN
China
Prior art keywords
image
identification object
image information
attribute
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811643419.3A
Other languages
English (en)
Inventor
万一木
徐珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Yitu Network Technology Co Ltd
Shanghai Is According To Figure Network Technology Co Ltd
Shanghai Yitu Network Science and Technology Co Ltd
Original Assignee
Chengdu Yitu Network Technology Co Ltd
Shanghai Is According To Figure Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Yitu Network Technology Co Ltd, Shanghai Is According To Figure Network Technology Co Ltd filed Critical Chengdu Yitu Network Technology Co Ltd
Priority to CN201811643419.3A priority Critical patent/CN109740517A/zh
Publication of CN109740517A publication Critical patent/CN109740517A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请实施例提供了一种确定待识别对象的方法及装置,涉及视频处理技术领域,该方法包括:从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型。利用提取后的待识别对象特征的信息进行属性检测的方法,从而降低了计算量,同时提高了效率。

Description

一种确定待识别对象的方法及装置
技术领域
本发明实施例涉及视频处理技术领域,尤其涉及一种确定待识别对象的方法及装置。
背景技术
当今社会中,出于安防管理的需要,监控设备布满了街道、社区、楼宇等各种公共场合。在发生警情时,先从监控设备采集的视频数据中确定出嫌疑人或嫌疑车辆的图像,然后由警务人员根据嫌疑人或嫌疑车辆的图像搜捕嫌疑人或嫌疑车辆。
现有技术中,监控设备采集视频流后,多采用对视频流中的每帧图像进行检测和识别,确定每帧图像中的人脸或车辆等对象,然后再将各帧图像中检测出的对象进行匹配,确定出一个对象的所有图像,该方法由于需要对每帧图像进行检测和识别,计算量较大,效率低。
发明内容
由于现有技术中,从视频流中确定同一对象的图像时,对每帧图像进行检测和识别,且需要将每帧图像的全部信息进行检测和识别,计算量较大且效率较低,基于上述问题,本申请实施例提供了一种确定待识别对象的方法及装置。
一方面,本申请实施例提供了一种确定待识别对象的方法,该方法包括:
从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;
将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;
从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型。
可选地,所述第一图像为检测帧图像,所述方法还包括:
获取第二图像,所述第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像;
针对所述第一图像中的第一识别对象,在所述第二图像中查找相似度大于预设阈值的预测图像区域,作为所述第一识别对象在所述第二图像中对应的图像信息;所述第一识别对象为所述第一图像中的任一识别对象。
可选地,所述方法还包括:
获取第三图像,所述第三图像为所述第二图像的下一帧图像且所述第三图像为预测帧图像;
针对所述第二图像中的所述第一识别对象,在所述第三图像中查找相似度大于所述预设阈值的预测图像区域,作为所述第一识别对象在所述第三图像中对应的图像信息。
可选地,所述从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型之后,还包括:
根据第一识别对象的类型,将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值。
可选地,所述属性分类模型包括多个第一分类模型和第二分类模型;各第一分类模型对应的属性类别均不同;所述第二分类模型对应于所有属性类别;
所述将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值,包括:
将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型,根据每个第一分类模型的预测结果,得到所述第三图像信息对应的多个属性类别的属性值的置信度;所述第三图像信息为所述各图像信息中的任一个;
将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型,得到所述第一识别对象对应各属性类别的属性值。
一方面,本申请实施例提供了一种确定待识别对象的装置,包括:
获取单元,从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;
待识别对象确定单元,用于将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型。
可选地,所述第一图像为检测帧图像,所述获取单元还用于:
获取第二图像,所述第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像;
所述待识别对象确定单元还用于:
针对所述第一图像中的第一识别对象,在所述第二图像中查找相似度大于预设阈值的预测图像区域,作为所述第一识别对象在所述第二图像中对应的图像信息;所述第一识别对象为所述第一图像中的任一识别对象。
可选地,所述获取单元还用于:
获取第三图像,所述第三图像为所述第二图像的下一帧图像且所述第三图像为预测帧图像;
所述待识别对象确定单元还用于:
针对所述第二图像中的所述第一识别对象,在所述第三图像中查找相似度大于所述预设阈值的预测图像区域,作为所述第一识别对象在所述第三图像中对应的图像信息。
可选地,所述装置还包括属性确定单元,用于根据第一识别对象的类型,将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值。
可选地,所述属性分类模型包括多个第一分类模型和第二分类模型;各第一分类模型对应的属性类别均不同;所述第二分类模型对应于所有属性类别;
所述属性确定单元用于:
将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型,根据每个第一分类模型的预测结果,得到所述第三图像信息对应的多个属性类别的属性值的置信度;所述第三图像信息为所述各图像信息中的任一个;
将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型,得到所述第一识别对象对应各属性类别的属性值。
一方面,本申请实施例提供了一种确定待识别对象的设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行确定待识别对象的方法的步骤。
一方面,本申请实施例提供了一种计算机可读介质,其存储有可由确定待识别对象的设备执行的计算机程序,当所述程序在确定待识别对象的设备上运行时,使得所述确定待识别对象的设备执行确定待识别对象的方法的步骤。
本申请实施例中,通过将监控视频中的每帧图像进行多个待识别对象特征的提取,并利用提取后的待识别对象特征的信息进行属性检测的方法,解决了现有技术中需要将整帧图像进行识别的问题,并且通过确定检测帧以及预测帧的方法,不需要对每帧图像进行检测,从而降低了确定待识别图像中的待识别对象的计算量,同时提高了效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例适用的系统架构图;
图2为本申请实施例提供的一种确定待识别对象的方法的流程示意图;
图3为本申请实施例提供的一种确定待识别对象的示意图;
图4为本申请实施例提供的一种确定待识别对象的示意图;
图5为本申请实施例一种确定待识别对象的装置的结构示意图;
图6为本申请实施例一种确定待识别对象的设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示例性示出了本申请实施例适用的系统架构,在该系统架构中包括监控设备101、服务器102。监控设备101实时采集视频流,然后将采集的视频流发送至服务器102,服务器102中包括确定待识别对象的装置,服务器102从视频流中获取待识别图像,然后确定待识别图像中的待识别对象对应的图像区域。监控设备101通过无线网络与服务器102连接,监控设备是具备采集图像功能的电子设备,比如摄像头、摄像机、录像机等。服务器102是一台服务器或若干台服务器组成的服务器集群或云计算中心。
基于图1所示的系统架构,本申请实施例提供了一种确定待识别对象的方法的流程,该方法的流程可以由确定待识别对象的装置执行,确定待识别对象的装置可以是图1所示的服务器102,如图2所示,包括以下步骤:
步骤201,从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;
监控设备实时采集视频流,视频流由多帧待识别图像组成。
步骤202,将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;
本发明实施例中,将监控设备获取的待处理的视频中的任一帧图像输入到分类模型中,通过分类模型,能够得到该帧图像中具有的多识别对象的类型以及该识别对象对应的图像信息;在本发明实施例中,识别对象的类型包括行人、非机动车和机动车,所以在本发明实施例中,针对一帧图像,若该帧图像中包括每种识别对象的类型,则将该帧图像输入至分类器后,可以确定出该帧图像中包括行人、非机动车和机动车,且能够确定出针对每个识别对象的识别区域。
在步骤203中,确定了各识别对象对应的图像信息后,对个图像信息进行标记,可选的,在本发明实施例中,可以使用框形结构对图像信息进行标记,如图3所示,图3中包括行人以及机动车,通过框形结构将行人以及机动车进行标记。
可选的,在本发明实施例中,在形成检测框时,首先会在该帧图像上形成大量的候选框,然后判断候选框中的图像信息是否为类型的候选框对应的图像类型,该候选框对应的图像类型为前景,其它图像信息为背景,根据前景以及背景确定识别对象的区域,并进行标记。
可选的,在本发明实施例中,当输入一帧图像进入分类模型后,输出的内容为多个识别对象对应的图像信息,且图像信息使用检测框进行覆盖,如图4所示,将图4(a)的图像输入到分类模型中,得到图4(b)中的结果。
可选的,在本发明实施例中,当从待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型后,将得到的各识别对象输入至该识别对象对应的属性分类模型中,得到该识别对象在对应属性分类中的属性值。
例如,在本发明实施例中,将行人的图像信息输入至行人属性分类模型中,得到关于行人的属性值。
可选的,属性分类模型包括多个第一分类模型和第二分类模型;各第一分类模型对应的属性类别均不同;所述第二分类模型对应于所有属性类别;
所述将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值,包括:
将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型,根据每个第一分类模型的预测结果,得到所述第三图像信息对应的多个属性类别的属性值的置信度;所述第三图像信息为所述各图像信息中的任一个;
将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型,得到所述第一识别对象对应各属性类别的属性值。
举个例子,以第一识别对象为行人为例,设定多个第一分类模型分别包括用于识别行人性别的第一分类模型、用于识别行人年龄的第一分类模型、用于识别行人上衣颜色的第一分类模型、用于识别行人上衣款式的第一分类模型、用于识别行人下衣颜色的第一分类模型、用于识别行人下衣款式的第一分类模型、用于识别行人鞋子颜色的第一分类模型、用于识别行人是否戴眼镜的第一分类模型及用于识别行人是否背包的第一分类模型。可以将行人的识别图像分别输入以上各第一分类模型,从而得到该行人的识别图像对应的不同性别的置信度、不同年龄层的置信度、不同上衣颜色的置信度、不同上衣款式的置信度、不同下衣颜色的置信度、不同下衣款式的置信度、不同鞋子颜色的置信度、是否戴眼镜的置信度及是否背包的置信度。进而,可以将行人的识别图像分别对应的上述不同类别的属性值的置信度输入第二分类模型,从而得到对应的多个类别的属性值。
可选的,在本发明实施例中,为了减少每帧图像都需要进入分类模型进行待识别对象的检测的计算量,可以使用检测帧来输入至分类模型确定待识别对象,使用检测帧来确定预测帧中的待识别对象。
具体的,第一图像为检测帧图像,获取第二图像,第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像;
针对所述第一图像中的第一识别对象,在所述第二图像中查找相似度大于预设阈值的预测图像区域,作为所述第一识别对象在所述第二图像中对应的图像信息;所述第一识别对象为所述第一图像中的任一识别对象。
示例性的,设定一段视频流中包括10帧图像,将第一帧图像和第五帧图像标记为检测帧图像,第二帧图像至第四帧图像标记为预测帧图像,第六帧至第十帧标记为预测帧图像。
可选的,在本发明实施例中,通过在检测帧中确定关键点以及预测帧中的关键点的位置,确定预测帧中的待识别对象。
具体地,关键点是用于识别对象的关键点,比如行人的关键点为头部、四肢、上半身、下半身等。车的关键点包括车牌、车窗、车轮等。
可选的,可以先根据检测帧中各识别对象对应的图像区域,预测各识别对象在预测帧中对应的图像区域,进而可以预测各识别对象在预测帧中对应图像区域中的图像信息,即各识别对象在预测帧中对应的图像信息。
具体地,针对检测帧中的任一识别对象对应的图像区域,从预测帧中确定出与该识别对象对应的图像区域的相似度大于预设阈值的图像区域,作为该识别对象在预测帧中对应的预测图像区域。
举个例子,设定已知检测帧中各识别对象对应的图像框,针对检测帧中识别对象A对应的图像框,从预测帧中确定出与待识别对象A的图像框的相似度大于预设阈值的图像框,作为待识别对象A在预测帧中的图像框。
可选的,在本发明实施例中,当获取了第三图像,第三图像的上一帧为通过检测帧确定待识别对象的预测帧,则通过该预测帧以及预测帧上的关键点在第三图像中查找相似度大于所述预设阈值的预测图像区域。
为了更好的解释本发明实施例,下面结合具体的实施场景描述本申请实施例提供的一种确定待识别对象的方法,该方法可以由确定待识别对象的装置执行。
设定视频流中包括10帧待识别图像,其中第一帧待识别图像为检测帧图像,将第一帧待识别图像输入至分类模型中,得到行人、机动车以及非机动车的图像信息,根据第一帧图像中的各类图像信息确定第二帧待识别图像、第三帧待识别图像……第十帧待识别图像中的各待识别对象的图像信息。
具体的,若待识别对象为行人,将第一帧待识别图像输入至分类模型中,确定第一帧待识别图像中的各行人的第一行人检测框。针对第一帧待识别图像中行人A的第一行人检测框,先对第一行人检测框中行人A的关键点进行检测,根据检测的关键点调整第一行人检测框。然后判断行人A的第一行人检测框是否为行人图像,若是,则预测行人A的第一行人检测框在第二帧待识别图像对应的第二行人预测框。对第二行人预测框中行人A的关键点进行检测,根据检测的关键点调整第二行人预测框。之后再判断行人A的第二行人预测框是否为行人图像,若是,则预测行人A的第二行人预测框在第三帧待识别图像中对应的第三行人预测框,对第三行人预测框中行人A的关键点进行检测,直到对第十帧待识别图像中的各行人进行预测框标记。
将待处理视频得到的10帧待识别图像中每个行人的检测框的图像信息输入到行人属性分类模型中,得到针对行人属性分类的属性值。
基于相同的技术构思,本发明实施例提供了一种确定待识别对象的装置,如图5所示,该装置500包括:
获取模块501,用于获取单元,从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;
待识别对象确定单元502,用于将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型。
可选地,所述第一图像为检测帧图像,所述获取单元501还用于:
获取第二图像,所述第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像;
所述待识别对象确定单元502还用于:
针对所述第一图像中的第一识别对象,在所述第二图像中查找相似度大于预设阈值的预测图像区域,作为所述第一识别对象在所述第二图像中对应的图像信息;所述第一识别对象为所述第一图像中的任一识别对象。
可选地,所述获取单元501还用于:
获取第三图像,所述第三图像为所述第二图像的下一帧图像且所述第三图像为预测帧图像;
所述待识别对象确定单元502还用于:
针对所述第二图像中的所述第一识别对象,在所述第三图像中查找相似度大于所述预设阈值的预测图像区域,作为所述第一识别对象在所述第三图像中对应的图像信息。
可选地,所述装置还包括属性确定单元503,用于根据第一识别对象的类型,将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值。
可选地,述属性分类模型包括多个第一分类模型和第二分类模型;各第一分类模型对应的属性类别均不同;所述第二分类模型对应于所有属性类别;
所述属性确定单元503具体用于:
将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型,根据每个第一分类模型的预测结果,得到所述第三图像信息对应的多个属性类别的属性值的置信度;所述第三图像信息为所述各图像信息中的任一个;
将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型,得到所述第一识别对象对应各属性类别的属性值。
基于相同的技术构思,本申请实施例提供了一种确定待识别对象的设备,如图6所示,包括至少一个处理器601,以及与至少一个处理器连接的存储器602,本申请实施例中不限定处理器601与存储器602之间的具体连接介质,图6中处理器601和存储器602之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本申请实施例中,存储器602存储有可被至少一个处理器601执行的指令,至少一个处理器601通过执行存储器602存储的指令,可以执行前述确定待识别对象的方法中所包括的步骤。
其中,处理器601是确定待识别对象的设备的控制中心,可以利用各种接口和线路连接确定待识别对象的设备的各个部分,通过运行或执行存储在存储器602内的指令以及调用存储在存储器602内的数据,从而确定待识别对象。可选的,处理器601可包括一个或多个处理单元,处理器601可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。在一些实施例中,处理器601和存储器602可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器601可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器602作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器602可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器602还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于同一发明构思,本申请实施例提供了一种计算机可读介质,其存储有可由确定待识别对象的设备执行的计算机程序,当程序在确定待识别对象的设备上运行时,使得确定待识别对象的设备执行确定待识别对象的方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种确定待识别对象的方法,其特征在于,包括:
从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;
将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;
从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型。
2.根据权利要求1所述的方法,其特征在于,所述第一图像为检测帧图像,所述方法还包括:
获取第二图像,所述第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像;
针对所述第一图像中的第一识别对象,在所述第二图像中查找相似度大于预设阈值的预测图像区域,作为所述第一识别对象在所述第二图像中对应的图像信息;所述第一识别对象为所述第一图像中的任一识别对象。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取第三图像,所述第三图像为所述第二图像的下一帧图像且所述第三图像为预测帧图像;
针对所述第二图像中的所述第一识别对象,在所述第三图像中查找相似度大于所述预设阈值的预测图像区域,作为所述第一识别对象在所述第三图像中对应的图像信息。
4.根据权利要求1所述的方法,其特征在于,所述从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型之后,还包括:
根据第一识别对象的类型,将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值。
5.根据权利要求4所述的方法,其特征在于,所述属性分类模型包括多个第一分类模型和第二分类模型;各第一分类模型对应的属性类别均不同;所述第二分类模型对应于所有属性类别;
所述将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值,包括:
将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型,根据每个第一分类模型的预测结果,得到所述第三图像信息对应的多个属性类别的属性值的置信度;所述第三图像信息为所述各图像信息中的任一个;
将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型,得到所述第一识别对象对应各属性类别的属性值。
6.一种确定待识别对象的装置,其特征在于,包括:
获取单元,从治安平台的监控设备中获取待处理的视频,所述待处理视频包括N帧图像;N大于等于2;所述监控设备设置于车辆通行区域;
待识别对象确定单元,用于将第一图像输入至分类模型,得到所述第一图像中各识别对象;所述识别对象包括识别对象的类型及识别对象对应的图像信息;所述识别对象的类型包括行人、非机动车和机动车;所述第一图像是所述N帧图像中的任一个;从所述待处理视频中提取各识别对象对应的图像信息,并标记各图像信息对应的识别对象的类型。
7.如权利要求6所述的装置,其特征在于,所述第一图像为检测帧图像,所述获取单元还用于:
获取第二图像,所述第二图像为所述第一图像的下一帧图像且所述第二图像为预测帧图像;
所述待识别对象确定单元还用于:
针对所述第一图像中的第一识别对象,在所述第二图像中查找相似度大于预设阈值的预测图像区域,作为所述第一识别对象在所述第二图像中对应的图像信息;所述第一识别对象为所述第一图像中的任一识别对象。
8.如权利要求7所述的装置,其特征在于,所述获取单元还用于:
获取第三图像,所述第三图像为所述第二图像的下一帧图像且所述第三图像为预测帧图像;
所述待识别对象确定单元还用于:
针对所述第二图像中的所述第一识别对象,在所述第三图像中查找相似度大于所述预设阈值的预测图像区域,作为所述第一识别对象在所述第三图像中对应的图像信息。
9.如权利要求6所述的装置,其特征在于,所述装置还包括属性确定单元,用于根据第一识别对象的类型,将所述第一识别对象对应的各图像信息输入所述第一识别对象的类型对应的属性分类模型,得到所述第一识别对象对应的各属性类别的属性值。
10.如权利要求9所述的装置,其特征在于,所述属性分类模型包括多个第一分类模型和第二分类模型;各第一分类模型对应的属性类别均不同;所述第二分类模型对应于所有属性类别;
所述属性确定单元具体用于:
将所述第一识别对象的第三图像信息分别输入所述多个第一分类模型,根据每个第一分类模型的预测结果,得到所述第三图像信息对应的多个属性类别的属性值的置信度;所述第三图像信息为所述各图像信息中的任一个;
将所述第三图像信息和所述第三图像信息对应的多个属性类别的属性值的置信度输入所述第二分类模型,得到所述第一识别对象对应各属性类别的属性值。
11.一种确定待识别对象的设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~5任一权利要求所述方法的步骤。
12.一种计算机可读介质,其特征在于,其存储有可由确定待识别对象的设备执行的计算机程序,当所述程序在确定待识别对象的设备上运行时,使得所述确定待识别对象的设备执行权利要求1~5任一所述方法的步骤。
CN201811643419.3A 2018-12-29 2018-12-29 一种确定待识别对象的方法及装置 Pending CN109740517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811643419.3A CN109740517A (zh) 2018-12-29 2018-12-29 一种确定待识别对象的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811643419.3A CN109740517A (zh) 2018-12-29 2018-12-29 一种确定待识别对象的方法及装置

Publications (1)

Publication Number Publication Date
CN109740517A true CN109740517A (zh) 2019-05-10

Family

ID=66362641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811643419.3A Pending CN109740517A (zh) 2018-12-29 2018-12-29 一种确定待识别对象的方法及装置

Country Status (1)

Country Link
CN (1) CN109740517A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889437A (zh) * 2019-11-06 2020-03-17 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备及存储介质
CN111046974A (zh) * 2019-12-25 2020-04-21 珠海格力电器股份有限公司 一种物品分类方法、装置、存储介质及电子设备
CN111178323A (zh) * 2020-01-10 2020-05-19 北京百度网讯科技有限公司 基于视频的群体行为识别方法、装置、设备及存储介质
CN111209807A (zh) * 2019-12-25 2020-05-29 航天信息股份有限公司 一种基于yolov3的视频结构化方法及系统
CN111507278A (zh) * 2020-04-21 2020-08-07 浙江大华技术股份有限公司 一种检测路障的方法、装置及计算机设备
CN111783724A (zh) * 2020-07-14 2020-10-16 上海依图网络科技有限公司 一种目标对象识别方法和装置
CN111976593A (zh) * 2020-08-21 2020-11-24 大众问问(北京)信息科技有限公司 一种对车外对象的语音提示方法、装置、设备及存储介质
CN112016413A (zh) * 2020-08-13 2020-12-01 南京领行科技股份有限公司 对象间异常行为的检测方法及装置
CN112347985A (zh) * 2020-11-30 2021-02-09 广联达科技股份有限公司 一种物料类别检测方法及装置
CN113129597A (zh) * 2019-12-31 2021-07-16 深圳云天励飞技术有限公司 一种机动车道违法车辆识别方法及装置
CN115131617A (zh) * 2022-07-27 2022-09-30 上海闪马智能科技有限公司 对象类别的确定方法、装置、存储介质及电子装置
WO2023179031A1 (zh) * 2022-03-24 2023-09-28 商汤集团有限公司 一种图像处理方法、装置、电子设备、存储介质及计算机程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400157A (zh) * 2013-07-23 2013-11-20 青岛海信网络科技股份有限公司 一种基于视频分析的道路行人及非机动车检测方法
CN105872477A (zh) * 2016-05-27 2016-08-17 北京旷视科技有限公司 视频监控方法和视频监控系统
CN106326837A (zh) * 2016-08-09 2017-01-11 北京旷视科技有限公司 对象追踪方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400157A (zh) * 2013-07-23 2013-11-20 青岛海信网络科技股份有限公司 一种基于视频分析的道路行人及非机动车检测方法
CN105872477A (zh) * 2016-05-27 2016-08-17 北京旷视科技有限公司 视频监控方法和视频监控系统
CN106326837A (zh) * 2016-08-09 2017-01-11 北京旷视科技有限公司 对象追踪方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐诗: "基于车载视频的道路车辆及行人检测", 《中国优秀硕士学位论文全文数据库工程科技II期》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889437A (zh) * 2019-11-06 2020-03-17 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备及存储介质
CN110889437B (zh) * 2019-11-06 2022-11-11 北京达佳互联信息技术有限公司 一种图像处理方法、装置、电子设备及存储介质
CN111046974A (zh) * 2019-12-25 2020-04-21 珠海格力电器股份有限公司 一种物品分类方法、装置、存储介质及电子设备
CN111209807A (zh) * 2019-12-25 2020-05-29 航天信息股份有限公司 一种基于yolov3的视频结构化方法及系统
CN113129597A (zh) * 2019-12-31 2021-07-16 深圳云天励飞技术有限公司 一种机动车道违法车辆识别方法及装置
CN111178323A (zh) * 2020-01-10 2020-05-19 北京百度网讯科技有限公司 基于视频的群体行为识别方法、装置、设备及存储介质
CN111178323B (zh) * 2020-01-10 2023-08-29 北京百度网讯科技有限公司 基于视频的群体行为识别方法、装置、设备及存储介质
CN111507278A (zh) * 2020-04-21 2020-08-07 浙江大华技术股份有限公司 一种检测路障的方法、装置及计算机设备
CN111507278B (zh) * 2020-04-21 2023-05-16 浙江大华技术股份有限公司 一种检测路障的方法、装置及计算机设备
CN111783724A (zh) * 2020-07-14 2020-10-16 上海依图网络科技有限公司 一种目标对象识别方法和装置
CN111783724B (zh) * 2020-07-14 2024-03-26 上海依图网络科技有限公司 一种目标对象识别方法和装置
CN112016413A (zh) * 2020-08-13 2020-12-01 南京领行科技股份有限公司 对象间异常行为的检测方法及装置
CN112016413B (zh) * 2020-08-13 2022-06-07 南京领行科技股份有限公司 对象间异常行为的检测方法及装置
CN111976593A (zh) * 2020-08-21 2020-11-24 大众问问(北京)信息科技有限公司 一种对车外对象的语音提示方法、装置、设备及存储介质
CN112347985A (zh) * 2020-11-30 2021-02-09 广联达科技股份有限公司 一种物料类别检测方法及装置
WO2023179031A1 (zh) * 2022-03-24 2023-09-28 商汤集团有限公司 一种图像处理方法、装置、电子设备、存储介质及计算机程序产品
CN115131617A (zh) * 2022-07-27 2022-09-30 上海闪马智能科技有限公司 对象类别的确定方法、装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN109740517A (zh) 一种确定待识别对象的方法及装置
CN109815842A (zh) 一种确定待识别对象的属性信息的方法及装置
CN108596277B (zh) 一种车辆身份识别方法、装置和存储介质
CN109800679A (zh) 一种确定待识别对象的属性信息的方法及装置
CN110869936B (zh) 用于自动驾驶车辆中的分布式学习与适应的方法和系统
CN112016464B (zh) 检测人脸遮挡的方法、装置、电子设备及存储介质
CN105320923B (zh) 车型识别方法及装置
CN108038176B (zh) 一种路人库的建立方法、装置、电子设备及介质
CN109800682B (zh) 驾驶员属性识别方法及相关产品
CN110852269B (zh) 一种基于特征聚类的跨镜头人像关联分析方法及装置
CN109887283B (zh) 一种基于卡口数据的道路拥堵预测方法、系统及装置
CN109740004A (zh) 一种归档方法及装置
US20210350180A1 (en) Systems and methods for distributed data analytics
CN111507278B (zh) 一种检测路障的方法、装置及计算机设备
CN106096542A (zh) 基于距离预测信息的图像视频场景识别方法
CN110147731B (zh) 车辆类型识别方法及相关产品
CN109800675A (zh) 一种确定人脸对象的识别图像的方法及装置
TWI759099B (zh) 一種針對篡改圖像的檢測方法及裝置
Hossain et al. Fast-D: When non-smoothing color feature meets moving object detection in real-time
CN112651996A (zh) 目标检测跟踪方法、装置、电子设备和存储介质
CN109800678A (zh) 一种视频中对象的属性确定方法及装置
Ding et al. Mit-avt clustered driving scene dataset: Evaluating perception systems in real-world naturalistic driving scenarios
CN112418303B (zh) 一种识别状态模型的训练方法、装置及计算机设备
CN109800684A (zh) 一种视频中对象的确定方法及装置
CN116664873B (zh) 图像信息处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190510

RJ01 Rejection of invention patent application after publication