CN108229314A - 目标人物的搜索方法、装置和电子设备 - Google Patents
目标人物的搜索方法、装置和电子设备 Download PDFInfo
- Publication number
- CN108229314A CN108229314A CN201711219178.5A CN201711219178A CN108229314A CN 108229314 A CN108229314 A CN 108229314A CN 201711219178 A CN201711219178 A CN 201711219178A CN 108229314 A CN108229314 A CN 108229314A
- Authority
- CN
- China
- Prior art keywords
- image
- pedestrian
- facial
- target person
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本申请实施例提供了一种目标人物的搜索方法、装置和电子设备,其中,所述方法包括:获取目标人物的图像;利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。本申请实施例提高了目标人物搜索的准确率。
Description
技术领域
本申请实施例涉及计算机视觉技术领域,尤其涉及一种目标人物的搜索方法、装置和电子设备。
背景技术
目前,针对目标人物的搜索方案,通常是在预先建立的图像库中搜索得到与目标人物的图像相同或相近的人物图像,将搜索得到的人物图像作为目标人物的搜索结果。
申请内容
本申请实施例提供了目标人物搜索技术方案。
根据本申请实施例的第一方面,提供了一种目标人物的搜索方法,包括:获取目标人物的图像;利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。
可选地,所述利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,包括:确定所述目标人物的图像的第一人脸特征向量;根据所述第一人脸特征向量,从所述人脸图像库存储的多个人脸图像中确定所述第一人脸图像。
可选地,所述根据所述第一人脸特征向量,从所述人脸图像库存储的多个人脸图像中确定所述第一人脸图像,包括:确定所述第一人脸特征向量与所述多个人脸图像对应的多个第二人脸特征向量中每个第二人脸特征向量之间的距离;将所述多个第二人脸特征向量中与所述第一人脸特征向量之间的距离最小或者小于或等于第一阈值的第二人脸特征向量所对应的至少一个人脸图像确定为所述第一人脸图像。
可选地,所述多个人脸图像中的至少两个人脸图像形成对应于同一人脸的人脸轨迹,所述至少两个人脸图像对应的第二人脸特征向量为所述至少两个人脸图像形成的人脸轨迹的平均特征向量。
可选地,所述根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,包括:获取与所述第一人脸图像对应的第一行人图像;利用所述第一行人图像搜索所述行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像。
可选地,所述利用所述第一行人图像搜索所述行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,包括:确定所述第一行人图像的第一行人特征向量;根据所述第一行人特征向量,从所述行人图像库存储的多个行人图像中确定与所述第一行人图像匹配的至少一个行人图像,并将与所述第一行人图像匹配的至少一个行人图像确定为所述目标行人图像。
可选地,所述根据所述第一行人特征向量,从所述行人图像库存储的多个行人图像中确定与所述第一行人图像匹配的至少一个行人图像,包括:确定所述第一行人特征向量与所述多个行人图像对应的多个第二行人特征向量中每个第二行人特征向量之间的距离;将所述多个第二行人特征向量中与所述第一行人特征向量之间的距离最小或者小于或等于第二阈值的第二行人特征向量所对应的至少一个行人图像确定为与所述第一行人图像匹配的至少一个行人图像。
可选地,所述多个行人图像中的至少两个行人图像形成对应于同一行人的行人轨迹,所述至少两个行人图像对应的第二行人特征向量为所述至少两个行人图像形成的行人轨迹的平均特征向量。
可选地,所述获取与所述第一人脸图像对应的第一行人图像,包括:确定所述第一人脸图像所属的第一视频以及所述第一人脸图像的帧号信息和图像位置信息;根据所述第一人脸图像的帧号信息和图像位置信息,获取所述第一视频中与所述第一人脸图像对应的第一行人图像。
可选地,所述根据所述第一人脸图像的帧号信息和图像位置信息,获取所述第一视频中与所述第一人脸图像对应的第一行人图像,包括:若所述第一视频中存在帧号与所述第一人脸图像的帧号信息对应且包含所述第一人脸图像的行人图像,将所述包含所述第一人脸图像的行人图像确定为与所述第一人脸图像对应的第一行人图像。
可选地,所述方法还包括:若所述第一视频中不存在帧号与所述第一人脸图像的帧号信息对应且包含所述第一人脸图像的行人图像,将所述第一人脸图像在第一视频图像中按照预设比例进行扩展处理,得到与所述第一人脸图像对应的第一行人图像,其中,所述第一视频图像在所述第一视频中的帧号对应于所述第一人脸图像的帧号信息。
可选地,在所述根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像之后,所述方法还包括:对所述至少一个目标行人图像进行筛选,得到所述目标人物的的搜索结果。
可选地,所述对所述至少一个目标行人图像进行筛选,得到所述目标人物的搜索结果,包括:根据所述至少一个目标行人图像中每个目标行人图像的特征向量,将所述至少一个目标行人图像划分成至少一组行人图像,每组行人图像包括所述至少一个目标行人图像中的至少一个行人图像;根据所述至少一组行人图像中每组行人图像包括的行人图像的特征向量,确定所述每组行人图像的筛选统计数据;根据所述至少一组行人图像中每组行人图像的筛选统计数据,将所述至少一组行人图像中的一组或多组行人图像中的行人图像确定为所述搜索结果。
可选地,在所述利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像之前,所述方法还包括:对至少一个视频中的每个视频包括的视频图像进行人脸检测处理,得到多个人脸图像;将所述多个人脸图像以及所述多个人脸图像中每个人脸图像的信息存储至所述人脸图像库,其中,所述人脸图像的信息包括下列中的至少一种:所述人脸图像所属的视频信息、所述人脸图像的帧号信息、所述人脸图像在视频图像中的图像位置信息。
可选地,所述方法还包括:对所述多个人脸图像进行人脸跟踪处理,得到至少一个人脸轨迹,其中,每个人脸轨迹包括所述多个人脸图像中的至少两个人脸图像;根据所述至少一个人脸轨迹中每个人脸轨迹包括的至少两个人脸图像,确定所述每个人脸轨迹的平均特征向量;将所述至少一个人脸轨迹中每个人脸轨迹的平均特征向量存储至所述人脸图像库。
可选地,在所述根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像之前,所述方法还包括:对至少一个视频中的每个视频进行行人检测处理,得到多个行人图像;将所述多个行人图像以及所述多个行人图像中每个行人图像的信息存储至所述行人图像库,其中,所述行人图像的信息包括下列中的至少一种:所述行人图像所属的视频信息、所述行人图像的帧号信息、所述行人图像在视频图像中的图像位置信息。
可选地,所述方法还包括:对所述多个行人图像进行行人跟踪处理,得到至少一个行人轨迹,其中,每个行人轨迹包括所述多个行人图像中的至少两个行人图像;根据所述至少一个行人轨迹中每个行人轨迹包括的至少两个行人图像,确定所述每个行人轨迹的平均特征向量;将所述至少一个行人轨迹中每个行人轨迹的平均特征向量存储至所述人脸图像库。
根据本申请实施例的第二方面,提供了一种目标人物的搜索装置,包括:获取模块,用于获取目标人物的图像;人脸搜索模块,用于利用所述获取模块获取的所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;行人搜索模块,用于根据所述人脸搜索模块得到的所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。
可选地,所述人脸搜索模块用于:确定所述目标人物的图像的第一人脸特征向量;根据所述第一人脸特征向量,从所述人脸图像库存储的多个人脸图像中确定所述第一人脸图像。
可选地,所述人脸搜索模块用于:确定所述第一人脸特征向量与所述多个人脸图像对应的多个第二人脸特征向量中每个第二人脸特征向量之间的距离;将所述多个第二人脸特征向量中与所述第一人脸特征向量之间的距离最小或者小于或等于第一阈值的第二人脸特征向量所对应的至少一个人脸图像确定为所述第一人脸图像。
可选地,所述多个人脸图像中的至少两个人脸图像形成对应于同一人脸的人脸轨迹,所述至少两个人脸图像对应的第二人脸特征向量为所述至少两个人脸图像形成的人脸轨迹的平均特征向量。
可选地,所述行人搜索模块用于:获取与所述第一人脸图像对应的第一行人图像;利用所述第一行人图像搜索所述行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像。
可选地,所述行人搜索模块用于:确定所述第一行人图像的第一行人特征向量;根据所述第一行人特征向量,从所述行人图像库存储的多个行人图像中确定与所述第一行人图像匹配的至少一个目标行人图像,并将与所述第一行人图像匹配的至少一个目标行人图像确定为所述目标行人图像。
可选地,所述行人搜索模块用于:确定所述第一行人特征向量与所述多个行人图像对应的多个第二行人特征向量中每个第二行人特征向量之间的距离;将所述多个第二行人特征向量中与所述第一行人特征向量之间的距离最小或者小于或等于第二阈值的第二行人特征向量所对应的至少一个行人图像确定为与所述第一行人图像匹配的至少一个目标行人图像。
可选地,所述多个行人图像中的至少两个行人图像形成对应于同一行人的行人轨迹,所述至少两个行人图像对应的第二行人特征向量为所述至少两个行人图像形成的行人轨迹的平均特征向量。
可选地,所述行人搜索模块用于:确定所述第一人脸图像所属的第一视频以及所述第一人脸图像的帧号信息和图像位置信息;根据所述第一人脸图像的帧号信息和图像位置信息,获取所述第一视频中与所述第一人脸图像对应的第一行人图像。
可选地,所述行人搜索模块用于:若所述第一视频中存在帧号与所述第一人脸图像的帧号信息对应且包含所述第一人脸图像的行人图像,将所述包含所述第一人脸图像的行人图像确定为与所述第一人脸图像对应的第一行人图像。
可选地,所述行人搜索模块用于:若所述第一视频中不存在帧号与所述第一人脸图像的帧号信息对应且包含所述第一人脸图像的行人图像,将所述第一人脸图像在第一视频图像中按照预设比例进行扩展,得到与所述第一人脸图像对应的第一行人图像,其中,所述第一视频图像在所述第一视频中的帧号对应于所述第一人脸图像的帧号信息。
可选地,所述装置还包括:筛选模块,用于在所述行人搜索模块根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像之后,对与所述目标人物的图像匹配的至少一个目标行人图像进行筛选,得到所述目标人物的的搜索结果。
可选地,所述筛选模块用于:根据所述至少一个目标行人图像中每个目标行人图像的特征向量,将所述至少一个目标行人图像划分成至少一组行人图像;根据所述至少一组行人图像中每组行人图像包括的行人图像的特征向量,确定所述每组行人图像的筛选统计数据;根据所述至少一组行人图像中每组行人图像的筛选统计数据,将所述至少一组行人图像中的一组或多组行人图像中的行人图像确定为所述目标人物的搜索结果。
可选地,所述装置还包括:人脸检测模块,用于在所述人脸搜索模块利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像之前,对至少一个视频中的每个视频进行人脸检测处理,得到多个人脸图像;将所述多个人脸图像以及所述多个人脸图像中每个人脸图像的信息存储至所述人脸图像库,其中,所述人脸图像的信息包括下列中的至少一种:所述人脸图像所属的视频信息、所述人脸图像的帧号信息、所述人脸图像在视频图像中的图像位置信息。
可选地,所述装置还包括:人脸跟踪模块,用于对所述多个人脸图像进行人脸跟踪处理,得到至少一个人脸轨迹,其中,每个人脸轨迹包括所述多个人脸图像中的至少两个人脸图像;根据所述至少一个人脸轨迹中每个人脸轨迹包括的至少两个人脸图像,确定所述每个人脸轨迹的平均特征向量;将所述至少一个人脸轨迹中每个人脸轨迹的平均特征向量存储至所述人脸图像库。
可选地,所述装置还包括:行人检测模块,用于在所述行人搜索模块根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像之前,对至少一个视频中的每个视频进行行人检测处理,得到多个行人图像;将所述多个行人图像以及所述多个行人图像中每个行人图像的信息存储至所述行人图像库,其中,所述行人图像的信息包括下列中的至少一种:所述行人图像所属的视频信息、所述行人图像的帧号信息、所述行人图像在视频图像中的图像位置信息。
可选地,所述装置还包括:行人跟踪模块,用于对所述多个行人图像进行行人跟踪处理,得到至少一个行人轨迹,其中,每个行人轨迹包括所述多个行人图像中的至少两个行人图像;根据所述至少一个行人轨迹中每个行人轨迹包括的至少两个行人图像,确定所述每个行人轨迹的平均特征向量;将所述至少一个行人轨迹中每个行人轨迹的平均特征向量存储至所述人脸图像库。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器和存储器;所述存储器用于存放至少一个可执行指令,所述可执行指令使所述处理器执行如第一方面所述的目标人物的搜索方法。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有:用于获取目标人物的图像的可执行指令;用于利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像的可执行指令,其中,所述人脸图像库包括多个人脸图像;用于根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像的可执行指令,其中,所述行人图像库包括多个行人图像。
根据本申请实施例的第五方面,提供了一种计算机程序产品,包括:至少一个可执行指令,所述可执行指令被处理器执行时用于实现如第一方面所述的目标人物的搜索方法。
本申请实施例使用人脸搜索结合行人搜索的联合搜索策略,先基于人脸图像库搜索得到与目标人物的图像匹配的第一人脸图像,再基于行人图像库和第一人脸图像获取与目标人物的图像匹配的至少一个目标行人图像,提高了目标人物搜索的准确率。
附图说明
图1是根据本申请实施例一的目标人物的搜索方法流程图;
图2是根据本申请实施例二的目标人物的搜索方法流程图;
图3是根据本申请实施例二的目标人物的搜索方法的逻辑框图;
图4是根据本申请实施例三的目标人物的搜索装置的结构框图;
图5是根据本申请实施例四的目标人物的搜索装置的结构框图;
图6是根据本申请实施例五的电子设备的结构示意图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本申请实施例的具体实施方式作进一步详细说明。以下实施例用于说明本申请,但不用来限制本申请的范围。
本领域技术人员可以理解,本申请实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
实施例一
参照图1,示出了根据本申请实施例一的目标人物的搜索方法流程图。
S100、获取目标人物的图像。
本申请实施例中,目标人物的图像可以指包含有目标人物的人脸的图像,可以包括人脸的静态图像或视频中包括人脸的视频帧图像。例如,目标人物的图像可以为视频帧图像,可以是来源于图像采集设备的视频序列中的图像帧,也可以为单独的一帧图像或者一幅图像,还可以来源于其他设备,本申请实施例对目标人物的图像的属性、来源和获得途径等具体实现不做限制。
S102、利用目标人物的图像,搜索人脸图像库,得到与目标人物的图像匹配的第一人脸图像。
本申请实施例中,人脸图像库可以是预先建立的用于存储人脸图像的图像库。人脸图像库中可以包含一个或多个人物的多个人脸图像,每个人物可以对应一个或多个人脸图像。
可选地,该人脸图像库中包括的人脸图像可以是通过对一个或多个视频中的视频图像进行人脸检测处理得到的,或者,人脸图像库包括的人脸图像也可以是通过对静态图像进行人脸检测处理得到的,本申请实施例对人脸图像库中包括的人脸图像的来源不作限定。
可选地,该第一人脸图像的个数可以为一个或多个,也就是说,可以利用目标人物的图像搜索人脸图像库,得到与目标人物的图像匹配的至少一个第一人脸图像。
例如,人脸图像库L中存储有多个人物的人脸图像,每个人物的人脸图像可以为一个或多个,基于人脸图像库L搜索与目标人物的图像P匹配的第一人脸图像l1、l2和l3。第一人脸图像l1、l2和l3为与目标人物的图像P对应于同一个人物的人脸图像。
S104、根据第一人脸图像和行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像。
本申请实施例中,行人图像库可以是预先建立的用于存储行人图像的图像库。行人图像库中可以包含一个或多个人物的多个行人图像,每个人物可以对应一个或多个行人图像。
可选地,行人图像库中包括的行人图像可以是通过对一个或多个视频中的视频图像进行行人检测处理得到的,其中,行人图像库中的行人图像的视频来源可以与人脸图像库中的人脸图像的视频来源完全重叠、部分重叠或无重叠;或者,行人图像库中的行人图像可以是通过对静态图像进行行人检测处理得到的,本申请实施例对行人图像库中包括的行人图像的来源不作限定。
可选地,可以根据每个第一人脸图像和行人图像库,得到至少一个目标行人图像。该目标行人图像可以是通过搜索行人图像库得到的,但本申请实施例对此不作限定。
例如,行人图像库X中可以存储有一个或多个人物的行人图像,每个人物的行人图像可以为多个,根据行人图像库X和第一人脸图像l1可以获取与目标人物的图像P匹配的行人图像x1和x2,根据行人图像库X和第一人脸图像l2可以获取与目标人物的图像P匹配的行人图像x3,根据行人图像库X和第一人脸图像l3可以获取与目标人物的图像P匹配的行人图像x4和x5。这样,可以得到与目标人物的图像匹配的五个目标行人图像x1~x5。
本申请实施例中,上述S102可以认为是人脸搜索过程,S104可以认为是行人搜索过程。
通常,同一个人物的人脸是不随着时间变化而变化的,人脸搜索适用的时间跨度非常长,可以跨越数月甚至数年。而行人搜索关注的更多是行人的衣着、背包等信息,因此行人搜索适用的时间跨度往往只有几个小时,最多一两天。而且,在人脸图像库中的人脸图像的数量,以及行人图像库中的行人图像的数量达到一定程度后(如十万量级或者百万量级),人脸搜索的精度远远大于行人搜索的精度。然而,在智能视频监控应用中,期望的搜索结果是与目标人物的图像对应的所有搜索结果。而人脸搜索所能获取到的只有人脸图像(考虑背对摄像机的人根本不会被拍到人脸的情况),因此,人脸搜索的召回率在智能视频监控应用中低于行人搜索的召回率。其中,召回率又叫做查全率,用于衡量期望搜索结果中存在被搜索出目标的比例。
本申请实施例使用人脸搜索结合行人搜索的联合搜索策略,先基于人脸图像库搜索得到与目标人物的图像匹配的第一人脸图像,再基于行人图像库和第一人脸图像获取与目标人物的图像匹配的至少一个目标行人图像,既具有人脸搜索的时间跨度长、精确度高的优点,又具有行人搜索的召回率高的优点,提高了目标人物搜索的准确率。
实施例二
参照图2,示出了根据本申请实施例二的目标人物的搜索方法流程图。
S200、建立人脸图像库和行人图像库。
本申请实施例中,人脸图像库和行人图像库的建立过程可以相互独立、互不干扰,可以并行执行或以任意先后顺序执行,本申请实施例对此不做限制。下面将分别介绍人脸图像库和行人图像库的建立过程。
(一)建立人脸图像库
1)人脸检测处理
可以对至少一个视频中的每个视频包括的视频图像进行人脸检测处理,得到多个人脸图像,并将多个人脸图像以及多个人脸图像中每个人脸图像的信息存储至人脸图像库。
作为一个例子,人脸图像的信息可以包括下列中的至少一种:人脸图像所属的视频信息、人脸图像的帧号信息、人脸图像在视频图像中的图像位置信息等。
人脸图像的帧号信息可以指示人脸图像所属的视频图像,或者,人脸图像所属的视频图像也可以利用其它信息指示。可选地,人脸图像在视频图像中的图像位置信息可以指示人脸图像在视频图像中的位置,例如,人脸图像在视频图像中的图像位置信息可以包括人脸图像的标识框位置信息。可选地,人脸图像的信息还可以包括其他信息,本申请实施例对此不作限定。
例如,可以将视频S1进行分帧处理,得到两帧视频图像Y1和Y2。然后,可以对视频图像Y1和Y2进行人脸检测处理,从视频图像Y1中得到人脸图像y1、y2和y3,从视频图像Y2中得到人脸图像y4和y5,并获取各个人脸图像的信息。其中,人脸图像y1的信息包括:样本图像Y1的信息,如样本图像Y1的名称、编号、占用空间、时长等,视频图像Y1的对应的帧号t1,人脸图像y1在样本图像Y1中的位置信息,等等。人脸图像y2、y3、y4和y5的信息与人脸图像y1的信息相似,在此不再赘述。最后,可以将人脸图像y1、y2、y3、y4和y5及各自的信息存储至人脸图像库L。
2)人脸跟踪处理
对上述人脸检测处理得到的多个人脸图像进行人脸跟踪处理,得到至少一个人脸轨迹,其中,每个人脸轨迹包括多个人脸图像中的至少两个人脸图像。
人脸轨迹包括的至少两个人脸图像可以对应于同一人物。
可选地,可以将用于指示该多个人脸图像与该至少一个人脸轨迹之间的对应关系的信息存储至人脸图像库。
作为一个可选例子,可以将该至少一个人脸轨迹中每个人脸轨迹的信息存储至人脸图像库。
可选地,人脸轨迹的信息可以包括人脸轨迹包括的人脸图像的标识信息。
可选地,可以根据至少一个人脸轨迹中每个人脸轨迹包括的至少两个人脸图像,确定每个人脸轨迹的平均特征向量,并将至少一个人脸轨迹中每个人脸轨迹的平均特征向量存储至人脸图像库。
例如,可以对人脸图像y1、y2、y3、y4和y5进行人脸跟踪处理,得到人脸轨迹g1和g2,其中,人脸轨迹g1包括人脸图像y1、y3和y5,人脸轨迹g2包括人脸图像y2和y4。可以分别计算人脸图像y1、y3和y5的特征向量,并将人脸图像y1、y3和y5的特征向量的平均值作为人脸轨迹g1的平均特征向量gt1,分别计算人脸图像y2和y4的特征向量,并将人脸图像y2和y4的特征向量的平均值作为人脸轨迹g2的平均特征向量gt2。最后,将人脸轨迹g1的平均特征向量gt1和人脸轨迹g2的平均特征向量gt2存储至人脸图像库L。
应理解,在上述例子中以人脸轨迹包括的多个人脸图像的特征向量的平均值作为人脸轨迹的平均特征向量,在本申请实施例中,人脸轨迹的平均特征向量可以是通过对人脸轨迹包括的至少两个人脸图像的特征向量进行处理得到的,本申请实施例对处理的具体实现不作限定。
作为另一个可选例子,可以将人脸图像所属的人脸轨迹的信息作为人脸图像的信息存储至人脸图像库,例如人脸图像的信息包括人脸图像所属的人脸轨迹的标识信息和/或平均特征向量,本申请实施例对此不作限定。
可选地,在建立人脸图像库的过程中,可以采用神经网络模型等进行人脸检测处理和人脸跟踪处理,本申请实施例对人脸检测处理和人脸跟踪处理所采用的技术手段不做限制。
(二)建立行人图像库
1)行人检测处理
对至少一个视频中的每个视频中的视频图像进行行人检测处理,得到多个行人图像,并将多个行人图像以及多个行人图像中每个行人图像的信息存储至行人图像库。
作为一个例子,行人图像的信息可以包括下列中的至少一种:行人图像所属的视频信息、行人图像的帧号信息、行人图像在视频图像中的图像位置信息。
行人图像的帧号信息可以指示行人图像所属的视频图像,或者,行人图像所属的视频图像也可以利用其它信息指示。可选地,行人图像在视频图像中的图像位置信息可以指示行人图像在视频图像中的位置,例如,行人图像在视频图像中的图像位置信息可以包括行人图像的标识框位置信息。可选地,行人图像的信息还可以包括其他信息,本申请实施例对此不作限定。
行人检测处理的执行过程可以参照上述人脸检测处理的执行过程,在此不再赘述。
2)行人跟踪处理
对多个行人图像进行行人跟踪处理,得到至少一个行人轨迹,其中,每个行人轨迹包括多个行人图像中的至少两个行人图像。
行人轨迹包括的至少两个行人图像可以对应于同一人物。
可选地,可以将用于指示该多个行人图像与该至少一个行人轨迹之间的对应关系的信息存储至人脸图像库。
作为一个可选例子,可以将该至少一个行人轨迹中每个行人轨迹的信息存储至人脸图像库。
可选地,行人轨迹的信息可以包括行人轨迹包括的行人图像的标识信息。
可选地,可以确定行人轨迹中包括的至少两个行人图像中每个行人图像的特征向量,并根据行人轨迹包括的每个行人图像的特征向量,确定行人轨迹的平均特征向量。其中,行人轨迹的平均特征向量可以是通过对该行人轨迹包括的至少两个行人图像中每个行人图像的特征向量进行处理得到的,例如平均处理或均方差处理,等等,本申请实施例对行人轨迹的平均特征向量的具体实现不做限定。
作为一个例子,可以根据至少一个行人轨迹中每个行人轨迹包括的至少两个行人图像,确定每个行人轨迹的平均特征向量,并将至少一个行人轨迹中每个行人轨迹的平均特征向量存储至人脸图像库。
作为另一个可选例子,可以将行人图像所属的行人轨迹的信息作为行人图像的信息存储至人脸图像库,例如行人图像的信息包括行人图像所属的行人轨迹的标识信息和/或平均特征向量,本申请实施例对此不作限定。
行人跟踪处理的执行过程可以参照上述人脸跟踪处理的执行过程,在此不再赘述。
一种可选的实施方式中,对视频中的视频图像进行人脸/行人检测处理可以指利用人脸/行人检测算法对视频中的每一帧图像进行分析,得到每一帧图像中的人脸/行人区域。对视频中的视频图像进行人脸/行人跟踪处理可以指利用人脸/行人跟踪算法检测视频中对应于同一人物的人脸/行人图像,但本申请实施例对此不做限定。
S202、获取目标人物的图像。
S204、利用目标人物的图像,搜索人脸图像库,得到与目标人物的图像匹配的第一人脸图像。
可选地,S204可以包括如下步骤。
S2040、确定目标人物的图像的第一人脸特征向量。
本申请实施例中,将目标人物的图像的特征向量称为第一人脸特征向量。可选地,可以基于人脸识别模型确定目标人物的图像的第一人脸特征向量,其中,人脸识别模型用于计算人脸特征向量。在一种可选的实施方式中,人脸识别模型可以为神经网络模型。例如,基于人脸识别模型获取目标人物的图像的第一人脸特征向量,第一人脸特征向量可以是256维或者512维向量,具体的维数与人脸识别模型相关,第一人脸特征向量的每一位数值可以是一个实数,取值可以在-10到10之间,如果对第一人脸特征向量进行归一化处理,则每一位的取值可以在-1到1之间,但本申请实施例不限于此。
S2041、根据第一人脸特征向量,从人脸图像库存储的多个人脸图像中确定第一人脸图像。
作为一个例子,可以分别确定第一人脸特征向量与多个人脸图像对应的多个第二人脸特征向量中每个第二人脸特征向量之间的距离(如余弦距离);将多个第二人脸特征向量中与第一人脸特征向量之间的距离最小或者距离小于或等于第一阈值的第二人脸特征向量所对应的至少一个人脸图像确定为第一人脸图像。
这里将人脸图像库中的人脸图像的特征向量称为第二人脸特征向量。可选地,多个人脸图像中的每个人脸图像可以对应于一个第二人脸特征向量,而该多个人脸图像中的不同人脸图像对应的第二人脸特征向量可以相同或不同。可选地,该多个人脸图像中对应于同一人脸轨迹的至少两个人脸图像具有相同的第二人脸特征向量。例如,该至少两个人脸图像的第二人脸特征向量可以为该至少两个人脸图像所属人脸轨迹的平均特征向量,但本申请实施例不限于此。
例如,人脸图像y1、y2、y3、y4和y5中的人脸图像y1、y3和y5属于人脸轨迹g1,人脸图像y2和y4不属于任何人脸轨迹,则人脸图像y1对应的第二人脸特征向量、人脸图像y3对应的第二人脸特征向量和人脸图像y5对应的第二人脸特征向量均为人脸轨迹g1的平均特征向量gt1,人脸图像y2的第二人脸特征向量可以为人脸图像y2的特征向量。
可选地,可以将多个第二人脸特征向量中最小的第二人脸特征向量所对应的至少一个人脸图像确定为第一人脸图像,或者可以将多个第二人脸特征向量中小于或等于第一阈值的至少一个第二人脸特征向量所对应的至少一个人脸图像确定为第一人脸图像,其中,第一阈值可以根据实际需要预先设置,本申请对其具体实现不做限定。
S206、根据第一人脸图像和行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像。
可选地,S206可以包括如下步骤。
S2060、获取与第一人脸图像对应的第一行人图像。
本申请实施例中,可以从人脸图像库中获取第一人脸图像的信息,并根据获取的信息,确定与第一人脸图像对应的第一行人图像。可选地,第一人脸图像的信息可以包括第一人脸图像所属的视频的信息和/或第一人脸图像的帧号信息,或者还可以进一步包括第一人脸图像的图像位置信息。作为一个可选例子,可以确定第一人脸图像所属的第一视频以及第一人脸图像的帧号信息和图像位置信息,并根据第一人脸图像的帧号信息和图像位置信息,获取第一视频中与第一人脸图像对应的第一行人图像。
第一人脸图像的帧号信息可以指示第一人脸图像在第一视频中所在的帧,可以根据第一人脸图像的帧号信息获取第一视频中包括第一人脸图像的第一视频图像,其中,第一视频图像在第一视频中所属的帧对应于该第一人脸图像的帧号信息。
第一人脸图像的图像位置信息可以指示第一人脸图像在所属的视频图像中的位置,例如,第一人脸图像的标识框在第一视频图像中的坐标信息,但本申请实施例不限于此。
可选地,在获取第一行人图像的过程中,具体可以按照如下两种情况执行。
情况一、若第一视频中存在帧号与第一人脸图像的帧号信息对应且包含第一人脸图像的行人图像,将包含第一人脸图像的行人图像确定为与第一人脸图像对应的第一行人图像。
例如,第一人脸图像l1在第一视频M1的第10帧视频图像中,在第一视频M1的第10帧视频图像中存在完全包含第一人脸图像l1的行人图像x1,则将行人图像x1确定为与第一人脸图像l1对应的第一行人图像。
情况二、若第一视频中不存在帧号与第一人脸图像的帧号信息对应且包含第一人脸图像的行人图像,将第一人脸图像在第一视频图像中按照预设比例进行扩展,得到与第一人脸图像对应的第一行人图像,其中,第一视频图像在第一视频中的帧号对应于第一人脸图像的帧号信息。
例如,第一人脸图像l2在第一视频M2的第13帧视频图像中,在第一视频M2的第13帧视频图像中不存在完全包含第一人脸图像l2的行人图像,则可以将第一人脸图像l2在第一视频图像即第13帧视频图像中按照预设比例(如8倍的比例)进行扩展,并将扩展后的区域确定为与第一人脸图像l2对应的第一行人图像。
S2061、利用第一行人图像搜索行人图像库,得到与第一行人图像匹配的至少一个行人图像。
本申请实施例中,可选地,可以确定第一行人图像的第一行人特征向量,并根据第一行人特征向量,从行人图像库存储的多个行人图像中确定与第一行人图像匹配的至少一个行人图像。
这里将第一行人图像的特征向量称为第一行人特征向量。可选地,在从行人图像库存储的多个行人图像中确定与第一行人图像匹配的至少一个行人图像时,可以确定第一行人特征向量与多个行人图像对应的多个第二行人特征向量中每个第二行人特征向量之间的距离,并将多个第二行人特征向量中与第一行人特征向量之间的距离最小或者小于或等于第二阈值的第二行人特征向量所对应的至少一个行人图像确定为与第一行人图像匹配的至少一个行人图像。
可选地,多个行人图像中的每个行人图像可以对应于一个第二行人特征向量,而该多个行人图像中的不同行人图像对应的第二行人特征向量可以相同或不同。可选地,该多个行人图像中对应于同一行人轨迹的至少两个行人图像具有相同的第二行人特征向量。例如,该至少两个行人图像的第二行人特征向量可以为该至少两个行人图像所属行人轨迹的平均特征向量,但本申请实施例不限于此。
可选地,可以将多个第二行人特征向量中最小的第二行人特征向量所对应的至少一个行人图像确定为与第一行人图像匹配的行人图像,或者可以将多个第二行人特征向量中小于或等于第二阈值的至少一个第二行人特征向量所对应的至少一个行人图像确定为与第一行人图像匹配的行人图像,其中,第二阈值可以根据实际需要预先设置,本申请对其具体实现不做限定。
作为一个可选例子,可以将与第一行人图像匹配的至少一个行人图像确定为与目标人物的图像匹配的目标行人图像。
作为另一个可选例子,S206还可以进一步包括:对与第一行人图像匹配的至少一个行人图像进行筛选,得到与目标人物的图像匹配的至少一个目标行人图像。
作为另一个可选例子,在本申请实施例中,可以将与目标人物的图像匹配的至少一个目标行人图像确定为目标人物的搜索结果。也可以首先确定与目标人物的图像匹配的至少一个目标行人图像,然后对与目标人物的图像匹配的至少一个目标行人图像进行筛选,得到目标人物的搜索结果,本申请实施例对此不做限定。
S208、对与目标人物的图像匹配的至少一个目标行人图像进行筛选,得到目标人物的搜索结果。
可选地,S208可以按照如下两种方式中的至少一种方式实现。
1)、根据时间筛选条件和视频筛选条件中的至少一种对与目标人物的图像匹配的至少一个目标行人图像进行筛选。
一种可选的实施方式中,可以手动设定筛选条件,例如,根据时间筛选条件(如从某日的某个时间段内)、视频筛选条件(如来源于哪个监控设备)对目标人物的图像匹配的至少一个目标行人图像进行筛选。
本申请实施例中,筛选条件包括但不限于时间筛选条件和视频筛选条件,还可以包括人物筛选条件,如性别、年龄等等,本申请实施例对此不做限定。
2)、对与目标人物的图像匹配的至少一个目标行人图像的特征向量对该至少一个目标行人图像进行聚类,并根据聚类结果进行筛选。
可选地,根据与目标人物的图像匹配的至少一个目标行人图像中每个目标行人图像的特征向量,将至少一个目标行人图像划分成至少一组行人图像,每组行人图像可以包括至少一个行人图像;根据该至少一组行人图像中每组行人图像包括的至少一个行人图像的特征向量,确定该每组行人图像的筛选统计数据;根据该至少一组行人图像中每组行人图像的筛选统计数据,将该至少一组行人图像中的一组或多组行人图像包括的行人图像确定为目标人物的搜索结果。
作为一个例子,一组行人图像的筛选统计数据可以包括该组行人图像包括的至少一个行人图像的特征向量的平均值或均方差,但本申请实施例不限于此。
作为一个例子,可以根据每组行人图像的筛选统计数据,对至少一组行人图像按序排列,并将排列在最前或最后的一组或多组行人图像删除,得到目标人物的搜索结果。
在一种可选的实施方式中,可以采用k-means聚类算法对与目标人物的图像匹配的至少一个目标行人图像的特征向量进行聚类,得到k个分组的特征向量,对于每个分组中的特征向量,计算其对应的轨迹的数量、特征向量的方差等筛选统计数据,并根据筛选统计数据确定哪些分组是噪音(如方差最大的组为噪音组)。例如,假设与目标人物的图像匹配的至少一个目标行人图像具体为100个行人轨迹,每个行人轨迹包括若干个行人图像,则可以通过k-means聚类算法将100个行人轨迹的特征向量划分为10个分组,具体地,可以对100个行人轨迹的100个特征向量进行多轮迭代k-means聚类运算,分成10个组,其中每组中包括的行人轨迹的数量可以相同或不同,其中,第10组中只有5个行人轨迹,且特征向量的方差最大,则可以确定第10组中的5个行人轨迹为噪音,并从结果中去除第10组中的5个行人轨迹中包括的行人图像,剩余结果即为搜索结果。
基于本申请实施例的上述介绍,本申请实施例的目标人物的搜索方法的逻辑框图如图3所示,预先对大量的视频(如监控视频)进行视频结构化操作(主要包括人脸/行人检测处理和人脸/行人跟踪处理),建立人脸图像库和行人图像库。在对包含人脸的目标人物的图像进行搜索时,先基于人脸图像库进行人脸搜索,得到第一人脸图像,再基于行人图像库对第一人脸图像进行行人搜索,得到若干行人图像,然后对若干行人图像进行筛选处理,最终得到目标人物的搜索结果。
本申请实施例使用人脸搜索结合行人搜索的联合搜索策略,先基于人脸图像库搜索得到与目标人物的图像匹配的第一人脸图像,再基于行人图像库和第一人脸图像获取与目标人物的图像匹配的至少一个目标行人图像。本申请实施例既具有人脸搜索的时间跨度长、精确度高的优点,又具有行人搜索的召回率高的优点,提高了目标人物搜索的准确率。
实施例三
参照图4,示出了根据本申请实施例三的目标人物的搜索装置的结构框图。
本申请实施例提供的目标人物的搜索装置包括:获取模块400,用于获取目标人物的图像;人脸搜索模块401,用于利用获取模块400获取的目标人物的图像,搜索人脸图像库,得到与目标人物的图像匹配的第一人脸图像,其中,人脸图像库包括多个人脸图像;行人搜索模块402,用于根据人脸搜索模块401得到的第一人脸图像和行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像,其中,行人图像库包括多个行人图像。
本申请实施例的目标人物的搜索装置用于实现上述实施例中相应的目标人物的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。
实施例四
参照图5,示出了根据本申请实施例四的目标人物的搜索装置的结构框图。
本申请实施例提供的目标人物的搜索装置包括:获取模块500,用于获取目标人物的图像;人脸搜索模块501,用于利用获取模块500获取的目标人物的图像,搜索人脸图像库,得到与目标人物的图像匹配的第一人脸图像,其中,人脸图像库包括多个人脸图像;行人搜索模块502,用于根据人脸搜索模块501得到的第一人脸图像和行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像,其中,行人图像库包括多个行人图像。
可选地,人脸搜索模块501用于:确定目标人物的图像的第一人脸特征向量;根据第一人脸特征向量,从人脸图像库存储的多个人脸图像中确定第一人脸图像。
可选地,人脸搜索模块501用于:确定第一人脸特征向量与多个人脸图像对应的多个第二人脸特征向量中每个第二人脸特征向量之间的距离;将多个第二人脸特征向量中与第一人脸特征向量之间的距离最小或者小于或等于第一阈值的第二人脸特征向量所对应的至少一个人脸图像确定为第一人脸图像。
可选地,多个人脸图像中的至少两个人脸图像形成对应于同一人脸的人脸轨迹,至少两个人脸图像对应的第二人脸特征向量为至少两个人脸图像形成的人脸轨迹的平均特征向量。
可选地,行人搜索模块502用于:获取与第一人脸图像对应的第一行人图像;利用第一行人图像搜索行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像。
可选地,行人搜索模块502用于:确定第一行人图像的第一行人特征向量;根据第一行人特征向量,从行人图像库存储的多个行人图像中确定与第一行人图像匹配的至少一个目标行人图像,并将与第一行人图像匹配的至少一个目标行人图像确定为与目标人物的图像匹配的至少一个目标行人图像。
可选地,行人搜索模块502用于:确定第一行人特征向量与多个行人图像对应的多个第二行人特征向量中每个第二行人特征向量之间的距离;将多个第二行人特征向量中与第一行人特征向量之间的距离最小或者小于或等于第二阈值的第二行人特征向量所对应的至少一个行人图像确定为与第一行人图像匹配的至少一个目标行人图像。
可选地,多个行人图像中的至少两个行人图像形成对应于同一行人的行人轨迹,至少两个行人图像对应的第二行人特征向量为至少两个行人图像形成的行人轨迹的平均特征向量。
可选地,行人搜索模块502用于:确定第一人脸图像所属的第一视频以及第一人脸图像的帧号信息和图像位置信息;根据第一人脸图像的帧号信息和图像位置信息,获取第一视频中与第一人脸图像对应的第一行人图像。
可选地,行人搜索模块502用于:若第一视频中存在帧号与第一人脸图像的帧号信息对应且包含第一人脸图像的行人图像,将包含第一人脸图像的行人图像确定为与第一人脸图像对应的第一行人图像。
可选地,行人搜索模块502用于:若第一视频中不存在帧号与第一人脸图像的帧号信息对应且包含第一人脸图像的行人图像,将第一人脸图像在第一视频图像中按照预设比例进行扩展,得到与第一人脸图像对应的第一行人图像,其中,第一视频图像在第一视频中的帧号对应于第一人脸图像的帧号信息。
可选地,本申请实施例提供的目标人物的搜索装置还包括:筛选模块503,用于在行人搜索模块502根据第一人脸图像和行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像之后,对与目标人物的图像匹配的至少一个目标行人图像进行筛选,得到目标人物的搜索结果。
可选地,筛选模块503用于:根据至少一个目标行人图像中每个目标行人图像的特征向量,将至少一个目标行人图像划分成至少一组行人图像;根据至少一组行人图像中每组行人图像包括的行人图像的特征向量,确定每组行人图像的筛选统计数据;根据至少一组行人图像中每组行人图像的筛选统计数据,将至少一组行人图像中的一组或多组行人图像中的行人图像确定为目标人物的搜索结果。
可选地,本申请实施例提供的目标人物的搜索装置还包括:人脸检测模块504,用于在人脸搜索模块501利用目标人物的图像,搜索人脸图像库,得到与目标人物的图像匹配的第一人脸图像之前,对至少一个视频中的每个视频进行人脸检测处理,得到多个人脸图像;将多个人脸图像以及多个人脸图像中每个人脸图像的信息存储至人脸图像库,其中,人脸图像的信息包括下列中的至少一种:人脸图像所属的视频信息、人脸图像的帧号信息、人脸图像在视频图像中的图像位置信息。
可选地,本申请实施例提供的目标人物的搜索装置还包括:人脸跟踪模块505,用于对多个人脸图像进行人脸跟踪处理,得到至少一个人脸轨迹,其中,人脸轨迹包括多个人脸图像中的至少两个人脸图像;根据至少一个人脸轨迹中每个人脸轨迹包括的至少两个人脸图像,确定每个人脸轨迹的平均特征向量;将至少一个人脸轨迹中每个人脸轨迹的平均特征向量存储至人脸图像库。
可选地,本申请实施例提供的目标人物的搜索装置还包括:行人检测模块506,用于在行人搜索模块502根据第一人脸图像和行人图像库,得到与目标人物的图像匹配的至少一个目标行人图像之前,对至少一个视频中的每个视频进行行人检测处理,得到多个行人图像;将多个行人图像以及多个行人图像中每个行人图像的信息存储至行人图像库,其中,行人图像的信息包括下列中的至少一种:行人图像所属的视频信息、行人图像的帧号信息、行人图像在视频图像中的图像位置信息。
可选地,本申请实施例提供的目标人物的搜索装置还包括:行人跟踪模块507,用于对多个行人图像进行行人跟踪处理,得到至少一个行人轨迹,其中,每个行人轨迹包括多个行人图像中的至少两个行人图像;根据至少一个行人轨迹中每个行人轨迹包括的至少两个行人图像,确定每个行人轨迹的平均特征向量;将至少一个行人轨迹中每个行人轨迹的平均特征向量存储至人脸图像库。
本申请实施例的目标人物的搜索装置用于实现上述实施例中相应的目标人物的搜索方法,该搜索装置中的各个模块和/或单元可以用于执行上述方法实施例中的各个步骤,为了简洁,在此不再赘述。
实施例五
本申请实施例还提供了一种电子设备,例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图6,其示出了适于用来实现本申请实施例的目标人物的搜索装置的电子设备600的结构示意图:如图6所示,电子设备600可以包括存储器和处理器。具体地,电子设备600包括一个或多个处理器、通信元件等,所述一个或多个处理器例如:一个或多个中央处理单元(CPU)601,和/或一个或多个图像处理器(GPU)613等,处理器可以根据存储在只读存储器(ROM)602中的可执行指令或者从存储部分608加载到随机访问存储器(RAM)603中的可执行指令而执行各种适当的动作和处理。通信元件包括通信组件612和/或通信接口609。其中,通信组件612可包括但不限于网卡,所述网卡可包括但不限于IB(Infiniband)网卡,通信接口609包括诸如LAN卡、调制解调器等的网络接口卡的通信接口,通信接口609经由诸如因特网的网络执行通信处理。
处理器可与只读存储器602和/或随机访问存储器603中通信以执行可执行指令,通过通信总线604与通信组件612相连、并经通信组件612与其他目标设备通信,从而完成本申请实施例提供的任一项目标人物的搜索方法对应的操作,例如,获取目标人物的图像;利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。
此外,在RAM603中,还可存储有装置操作所需的各种程序和数据。CPU601或GPU613、ROM602以及RAM603通过通信总线604彼此相连。在有RAM603的情况下,ROM602为可选模块。RAM603存储可执行指令,或在运行时向ROM602中写入可执行指令,可执行指令使处理器执行上述通信方法对应的操作。输入/输出(I/O)接口605也连接至通信总线604。通信组件612可以集成设置,也可以设置为具有多个子模块(例如多个IB网卡),并在通信总线链接上。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信接口609。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
需要说明的,如图6所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图6的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如GPU和CPU可分离设置或者可将GPU集成在CPU上,通信元件可分离设置,也可集成设置在CPU或GPU上,等等。这些可替换的实施方式均落入本申请的保护范围。
本申请实施例的电子设备可以用于实现上述实施例中相应的目标人物的搜索方法,该电子设备中的各个器件可以用于执行上述方法实施例中的各个步骤,例如,上文中描述的目标人物的搜索方法可以通过电子设备的处理器调用存储器存储的相关指令来实现,为了简洁,在此不再赘述。
实施例六
根据本申请实施例,上文参考流程图描述的过程可以被实现为计算机程序产品。例如,本申请实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码,程序代码可包括对应执行本申请实施例提供的方法步骤对应的指令,例如,获取目标人物的图像;利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。在这样的实施例中,该计算机程序可以通过通信元件从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器执行时,执行本申请实施例的方法中公开的功能。
需要说明的是,本申请各实施例描述的部分均有所侧重,某实施例未详尽描述的部分可参见本申请其他实施例中的介绍和说明,不再一一赘述。
可能以许多方式来实现本申请的方法和装置、电子设备和存储介质。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请实施例的方法和装置、电子设备和存储介质。用于方法的步骤的上述顺序仅是为了进行说明,本申请实施例的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本申请实施为记录在记录介质中的程序,这些程序包括用于实现根据本申请实施例的方法的机器可读指令。因而,本申请还覆盖存储用于执行根据本申请实施例的方法的程序的记录介质。
本申请实施例的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本申请限于所公开的形式,很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本申请的原理和实际应用,并且使本领域的普通技术人员能够理解本申请从而设计适于特定用途的带有各种修改的各种实施例。
Claims (10)
1.一种目标人物的搜索方法,其特征在于,包括:
获取目标人物的图像;
利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;
根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。
2.根据权利要求1所述的方法,其特征在于,所述利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,包括:
确定所述目标人物的图像的第一人脸特征向量;
根据所述第一人脸特征向量,从所述人脸图像库存储的多个人脸图像中确定所述第一人脸图像。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一人脸特征向量,从所述人脸图像库存储的多个人脸图像中确定所述第一人脸图像,包括:
确定所述第一人脸特征向量与所述多个人脸图像对应的多个第二人脸特征向量中每个第二人脸特征向量之间的距离;
将所述多个第二人脸特征向量中与所述第一人脸特征向量之间的距离最小或者小于或等于第一阈值的第二人脸特征向量所对应的至少一个人脸图像确定为所述第一人脸图像。
4.根据权利要求3所述的方法,其特征在于,所述多个人脸图像中的至少两个人脸图像形成对应于同一人脸的人脸轨迹,所述至少两个人脸图像对应的第二人脸特征向量为所述至少两个人脸图像形成的人脸轨迹的平均特征向量。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,包括:
获取与所述第一人脸图像对应的第一行人图像;
利用所述第一行人图像搜索所述行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像。
6.根据权利要求5所述的方法,其特征在于,所述利用所述第一行人图像搜索所述行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,包括:
确定所述第一行人图像的第一行人特征向量;
根据所述第一行人特征向量,从所述行人图像库存储的多个行人图像中确定与所述第一行人图像匹配的至少一个行人图像,并将与所述第一行人图像匹配的至少一个行人图像确定为所述目标行人图像。
7.一种目标人物的搜索装置,其特征在于,包括:
获取模块,用于获取目标人物的图像;
人脸搜索模块,用于利用所述获取模块获取的所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像,其中,所述人脸图像库包括多个人脸图像;
行人搜索模块,用于根据所述人脸搜索模块得到的所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像,其中,所述行人图像库包括多个行人图像。
8.一种电子设备,其特征在于,包括:处理器和存储器;
所述存储器用于存放至少一个可执行指令,所述可执行指令使所述处理器执行如权利要求1-6任一项所述的目标人物的搜索方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有:
用于获取目标人物的图像的可执行指令;
用于利用所述目标人物的图像,搜索人脸图像库,得到与所述目标人物的图像匹配的第一人脸图像的可执行指令,其中,所述人脸图像库包括多个人脸图像;
用于根据所述第一人脸图像和行人图像库,得到与所述目标人物的图像匹配的至少一个目标行人图像的可执行指令,其中,所述行人图像库包括多个行人图像。
10.一种计算机程序产品,其特征在于,包括:至少一个可执行指令,所述可执行指令被处理器执行时用于实现如权利要求1至6中任一项所述的目标人物的搜索方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711219178.5A CN108229314B (zh) | 2017-11-28 | 2017-11-28 | 目标人物的搜索方法、装置和电子设备 |
JP2019553914A JP6853379B2 (ja) | 2017-11-28 | 2018-10-29 | 対象人物の検索方法および装置、機器、プログラム製品ならびに媒体 |
PCT/CN2018/112420 WO2019105163A1 (zh) | 2017-11-28 | 2018-10-29 | 目标人物的搜索方法和装置、设备、程序产品和介质 |
SG11201909885Q SG11201909885QA (en) | 2017-11-28 | 2018-10-29 | Methods and apparatuses for searching for target person, devices, program products, and media |
CN201880018948.6A CN110431560B (zh) | 2017-11-28 | 2018-10-29 | 目标人物的搜索方法和装置、设备和介质 |
US16/457,083 US10891465B2 (en) | 2017-11-28 | 2019-06-28 | Methods and apparatuses for searching for target person, devices, and media |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711219178.5A CN108229314B (zh) | 2017-11-28 | 2017-11-28 | 目标人物的搜索方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108229314A true CN108229314A (zh) | 2018-06-29 |
CN108229314B CN108229314B (zh) | 2021-05-04 |
Family
ID=62653021
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711219178.5A Active CN108229314B (zh) | 2017-11-28 | 2017-11-28 | 目标人物的搜索方法、装置和电子设备 |
CN201880018948.6A Active CN110431560B (zh) | 2017-11-28 | 2018-10-29 | 目标人物的搜索方法和装置、设备和介质 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880018948.6A Active CN110431560B (zh) | 2017-11-28 | 2018-10-29 | 目标人物的搜索方法和装置、设备和介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10891465B2 (zh) |
JP (1) | JP6853379B2 (zh) |
CN (2) | CN108229314B (zh) |
SG (1) | SG11201909885QA (zh) |
WO (1) | WO2019105163A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108924491A (zh) * | 2018-07-04 | 2018-11-30 | 深圳市商汤科技有限公司 | 视频流处理方法及装置、电子设备和存储介质 |
CN109359570A (zh) * | 2018-09-30 | 2019-02-19 | 广东司法警官职业学院 | 一种视频人物鉴定的方法 |
WO2019105163A1 (zh) * | 2017-11-28 | 2019-06-06 | 深圳市商汤科技有限公司 | 目标人物的搜索方法和装置、设备、程序产品和介质 |
CN110263830A (zh) * | 2019-06-06 | 2019-09-20 | 北京旷视科技有限公司 | 图像处理方法、装置和系统及存储介质 |
CN110851636A (zh) * | 2018-07-24 | 2020-02-28 | 杭州海康威视数字技术股份有限公司 | 一种图像搜索系统、方法及装置 |
CN110852269A (zh) * | 2019-11-11 | 2020-02-28 | 青岛海信网络科技股份有限公司 | 一种基于特征聚类的跨镜头人像关联分析方法及装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107516105B (zh) * | 2017-07-20 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 图像处理方法及装置 |
CN111159476B (zh) * | 2019-12-11 | 2022-12-16 | 智慧眼科技股份有限公司 | 目标对象的搜索方法、装置、计算机设备及存储介质 |
CN111767783A (zh) * | 2020-04-22 | 2020-10-13 | 杭州海康威视数字技术股份有限公司 | 行为检测、模型训练方法、装置、电子设备及存储介质 |
CN114092955A (zh) * | 2020-07-29 | 2022-02-25 | 华为技术有限公司 | 数据库更新方法、设备以及存储介质 |
CN112597953B (zh) * | 2020-12-28 | 2024-04-09 | 深圳市捷顺科技实业股份有限公司 | 检测视频中通道闸区域行人的方法、装置、设备及介质 |
CN112651369A (zh) * | 2020-12-31 | 2021-04-13 | 南京视察者智能科技有限公司 | 一种监控场景下行人识别的方法及装置 |
US20240119605A1 (en) * | 2021-02-09 | 2024-04-11 | Nippon Telegraph And Telephone Corporation | Object detection device, method, and program |
US11514719B1 (en) * | 2021-05-18 | 2022-11-29 | Fortinet, Inc. | Systems and methods for hierarchical facial image clustering |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100138155A (ko) * | 2009-06-24 | 2010-12-31 | (주)로봇에버 | 미아찾기 시스템 및 그 방법 |
CN101996328A (zh) * | 2010-10-14 | 2011-03-30 | 浙江农林大学 | 一种木材识别方法 |
CN105760832A (zh) * | 2016-02-14 | 2016-07-13 | 武汉理工大学 | 基于Kinect传感器的逃犯识别方法 |
CN106874347A (zh) * | 2016-12-26 | 2017-06-20 | 深圳市深网视界科技有限公司 | 一种匹配人体特征与mac地址的方法及系统 |
CN106980844A (zh) * | 2017-04-06 | 2017-07-25 | 武汉神目信息技术有限公司 | 一种基于人脸识别系统的人物关系挖掘系统及方法 |
CN106991395A (zh) * | 2017-03-31 | 2017-07-28 | 联想(北京)有限公司 | 信息处理方法、装置及电子设备 |
CN107341445A (zh) * | 2017-06-07 | 2017-11-10 | 武汉大千信息技术有限公司 | 监控场景下行人目标的全景描述方法及系统 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000030033A (ja) * | 1998-07-09 | 2000-01-28 | Matsushita Electric Ind Co Ltd | 人物検出方法 |
US7139411B2 (en) * | 2002-06-14 | 2006-11-21 | Honda Giken Kogyo Kabushiki Kaisha | Pedestrian detection and tracking with night vision |
CN100478979C (zh) * | 2002-11-26 | 2009-04-15 | 中国科学院计算技术研究所 | 利用身材信息辅助人脸信息的身份识别方法 |
JP4085959B2 (ja) * | 2003-11-14 | 2008-05-14 | コニカミノルタホールディングス株式会社 | 物体検出装置、物体検出方法、および記録媒体 |
JP2006236260A (ja) * | 2005-02-28 | 2006-09-07 | Toshiba Corp | 顔認証装置、顔認証方法および入退場管理装置 |
JP4375570B2 (ja) * | 2006-08-04 | 2009-12-02 | 日本電気株式会社 | 顔認識方法およびシステム |
JP2008108243A (ja) * | 2006-09-28 | 2008-05-08 | Toshiba Corp | 人物認識装置および人物認識方法 |
JP4263737B2 (ja) * | 2006-11-09 | 2009-05-13 | トヨタ自動車株式会社 | 歩行者検知装置 |
JP5398301B2 (ja) * | 2009-03-02 | 2014-01-29 | 株式会社東芝 | 通行管理装置、及び通行管理方法 |
JP5422330B2 (ja) * | 2009-10-09 | 2014-02-19 | クラリオン株式会社 | 歩行者検出システム |
JP5401257B2 (ja) * | 2009-10-23 | 2014-01-29 | クラリオン株式会社 | 遠赤外線歩行者検知装置 |
TW201137765A (en) * | 2010-04-29 | 2011-11-01 | Hon Hai Prec Ind Co Ltd | Image capturing device and method for obtaining clear images using the image capturing device |
CN102324022B (zh) * | 2011-09-05 | 2013-03-20 | 辽宁工程技术大学 | 一种基于复合梯度向量的人脸识别方法 |
KR101503788B1 (ko) * | 2013-12-27 | 2015-03-19 | 숭실대학교산학협력단 | 적분영상을 기반으로 하는 특징 정보 예측을 통한 보행자 검출 방법, 이를 수행하기 위한 기록 매체 및 단말기 |
KR101798979B1 (ko) * | 2017-01-17 | 2017-11-17 | 오동근 | 스마트 횡단보도 신호등 시스템 |
CN108229314B (zh) * | 2017-11-28 | 2021-05-04 | 深圳市商汤科技有限公司 | 目标人物的搜索方法、装置和电子设备 |
-
2017
- 2017-11-28 CN CN201711219178.5A patent/CN108229314B/zh active Active
-
2018
- 2018-10-29 SG SG11201909885Q patent/SG11201909885QA/en unknown
- 2018-10-29 JP JP2019553914A patent/JP6853379B2/ja active Active
- 2018-10-29 CN CN201880018948.6A patent/CN110431560B/zh active Active
- 2018-10-29 WO PCT/CN2018/112420 patent/WO2019105163A1/zh active Application Filing
-
2019
- 2019-06-28 US US16/457,083 patent/US10891465B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100138155A (ko) * | 2009-06-24 | 2010-12-31 | (주)로봇에버 | 미아찾기 시스템 및 그 방법 |
CN101996328A (zh) * | 2010-10-14 | 2011-03-30 | 浙江农林大学 | 一种木材识别方法 |
CN105760832A (zh) * | 2016-02-14 | 2016-07-13 | 武汉理工大学 | 基于Kinect传感器的逃犯识别方法 |
CN106874347A (zh) * | 2016-12-26 | 2017-06-20 | 深圳市深网视界科技有限公司 | 一种匹配人体特征与mac地址的方法及系统 |
CN106991395A (zh) * | 2017-03-31 | 2017-07-28 | 联想(北京)有限公司 | 信息处理方法、装置及电子设备 |
CN106980844A (zh) * | 2017-04-06 | 2017-07-25 | 武汉神目信息技术有限公司 | 一种基于人脸识别系统的人物关系挖掘系统及方法 |
CN107341445A (zh) * | 2017-06-07 | 2017-11-10 | 武汉大千信息技术有限公司 | 监控场景下行人目标的全景描述方法及系统 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019105163A1 (zh) * | 2017-11-28 | 2019-06-06 | 深圳市商汤科技有限公司 | 目标人物的搜索方法和装置、设备、程序产品和介质 |
CN110431560A (zh) * | 2017-11-28 | 2019-11-08 | 深圳市商汤科技有限公司 | 目标人物的搜索方法和装置、设备、程序产品和介质 |
US10891465B2 (en) | 2017-11-28 | 2021-01-12 | Shenzhen Sensetime Technology Co., Ltd. | Methods and apparatuses for searching for target person, devices, and media |
CN110431560B (zh) * | 2017-11-28 | 2023-12-19 | 深圳市商汤科技有限公司 | 目标人物的搜索方法和装置、设备和介质 |
CN108924491A (zh) * | 2018-07-04 | 2018-11-30 | 深圳市商汤科技有限公司 | 视频流处理方法及装置、电子设备和存储介质 |
CN108924491B (zh) * | 2018-07-04 | 2020-08-25 | 深圳市商汤科技有限公司 | 视频流处理方法及装置、电子设备和存储介质 |
CN110851636A (zh) * | 2018-07-24 | 2020-02-28 | 杭州海康威视数字技术股份有限公司 | 一种图像搜索系统、方法及装置 |
CN110851636B (zh) * | 2018-07-24 | 2023-05-02 | 杭州海康威视数字技术股份有限公司 | 一种图像搜索系统、方法及装置 |
CN109359570A (zh) * | 2018-09-30 | 2019-02-19 | 广东司法警官职业学院 | 一种视频人物鉴定的方法 |
CN110263830A (zh) * | 2019-06-06 | 2019-09-20 | 北京旷视科技有限公司 | 图像处理方法、装置和系统及存储介质 |
CN110852269A (zh) * | 2019-11-11 | 2020-02-28 | 青岛海信网络科技股份有限公司 | 一种基于特征聚类的跨镜头人像关联分析方法及装置 |
CN110852269B (zh) * | 2019-11-11 | 2022-05-20 | 青岛海信网络科技股份有限公司 | 一种基于特征聚类的跨镜头人像关联分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
SG11201909885QA (en) | 2019-11-28 |
US20190325197A1 (en) | 2019-10-24 |
JP2020515983A (ja) | 2020-05-28 |
CN110431560A (zh) | 2019-11-08 |
CN108229314B (zh) | 2021-05-04 |
US10891465B2 (en) | 2021-01-12 |
WO2019105163A1 (zh) | 2019-06-06 |
JP6853379B2 (ja) | 2021-03-31 |
CN110431560B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229314A (zh) | 目标人物的搜索方法、装置和电子设备 | |
CN108229355B (zh) | 行为识别方法和装置、电子设备、计算机存储介质 | |
CN108460338B (zh) | 人体姿态估计方法和装置、电子设备、存储介质、程序 | |
CN110516705A (zh) | 基于深度学习的目标跟踪方法、装置及计算机可读存储介质 | |
CN104680144B (zh) | 基于投影极速学习机的唇语识别方法和装置 | |
CN107679447A (zh) | 面部特征点检测方法、装置及存储介质 | |
CN112465071A (zh) | 图像多标签分类方法、装置、电子设备及介质 | |
CN110738101A (zh) | 行为识别方法、装置及计算机可读存储介质 | |
CN107944020A (zh) | 人脸图像查找方法及装置、计算机装置和存储介质 | |
CN108681695A (zh) | 视频动作识别方法及装置、电子设备和存储介质 | |
CN108288051A (zh) | 行人再识别模型训练方法及装置、电子设备和存储介质 | |
CN108564102A (zh) | 图像聚类结果评价方法和装置 | |
CN110162599A (zh) | 招聘面试方法、装置及计算机可读存储介质 | |
CN106991355A (zh) | 基于拓扑保持的解析型字典学习模型的人脸识别方法 | |
CN108205684A (zh) | 图像消歧方法、装置、存储介质和电子设备 | |
CN110084222A (zh) | 一种基于多目标角点池化神经网络的车辆检测方法 | |
CN108198172A (zh) | 图像显著性检测方法和装置 | |
CN111047406B (zh) | 一种电信套餐推荐方法、装置、存储介质和设备 | |
CN107402878A (zh) | 测试方法和装置 | |
CN108830139A (zh) | 人体关键点的深度前后关系预测方法、装置、介质及设备 | |
CN112528903A (zh) | 人脸图像获取方法、装置、电子设备及介质 | |
CN110428012A (zh) | 脑网络模型建立方法、脑图像分类方法、装置及电子设备 | |
CN113255456B (zh) | 非主动活体检测方法、装置、电子设备及存储介质 | |
CN108229306A (zh) | 服饰检测和神经网络训练的方法、装置、存储介质和设备 | |
CN103605989B (zh) | 一种基于语义最大间隔聚类的多视角行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |