CN108629233A - 一种行人检索方法及装置 - Google Patents

一种行人检索方法及装置 Download PDF

Info

Publication number
CN108629233A
CN108629233A CN201710166417.9A CN201710166417A CN108629233A CN 108629233 A CN108629233 A CN 108629233A CN 201710166417 A CN201710166417 A CN 201710166417A CN 108629233 A CN108629233 A CN 108629233A
Authority
CN
China
Prior art keywords
feature data
high dimensional
characteristic
pedestrian
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710166417.9A
Other languages
English (en)
Inventor
张伟
陈茂林
白博
牟宪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201710166417.9A priority Critical patent/CN108629233A/zh
Priority to EP18771586.7A priority patent/EP3582138A4/en
Priority to PCT/CN2018/078022 priority patent/WO2018171412A1/zh
Publication of CN108629233A publication Critical patent/CN108629233A/zh
Priority to US16/576,158 priority patent/US11250250B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • G06F16/152File search processing using file content signatures, e.g. hash values
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种行人检索方法及装置,属于视频监控领域。该方法包括:提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,该目标行人图像为待检索的行人的图像,第一特征数据、第二特征数据和第三特征数据分别包括目标行人图像的多个全身高维特征数据、多个上半身高维特征数据和多个下半身高维特征数据;基于第一特征数据、第二特征数据和第三特征数据,对存储的高维特征数据进行筛选,得到目标特征数据集合,并通过目标特征数据集合确定行人检索结果。由于提取的高维特征数据包括全身、上半身和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,提高了检索的精度。

Description

一种行人检索方法及装置
技术领域
本申请涉及视频监控领域,特别涉及一种行人检索方法及装置。
背景技术
随着建设平安城市的需求越来越迫切,视频监控产品也越来越智能化。由于通过视频监控产品录制到的监控视频中往往包含大量的视频帧图像,且每张视频帧图像中又可能会包括多张行人图像,行人图像是指行人在视频帧图像中所占的图像区域,因此,通过视频监控产品录制监控视频之后,会获取到海量的行人图像。当用户需要从海量的行人图像中查找目标行人图像时,可以通过智能视频分析技术中的行人检索方法进行查找。
由于视频监控产品录制监控视频之后,可能会将监控视频存储在自身的存储空间中以便于后续进行行人检索,当然,也有可能会存储在其他具有视频处理功能的设备中,为了便于说明,将执行行人检索方法的装置称为行人检索装置。相关技术中,行人检索装置可以通过词袋模型来进行行人检索,具体为:从海量的行人图像中提取大量的高维特征数据,并将提取到的高维特征数据进行聚类,从而将高维特征数据划分至多个子空间集合,并得到每个子空间集合的聚类中心。检索时,用户可以在行人检索装置中输入目标行人图像和指定查询条件,行人检索装置便可以对输入的目标行人图像进行高维特征数据提取,并计算该目标行人图像的高维特征数据与多个子空间集合的聚类中心之间的距离,从该多个子空间集合中选择与该目标行人图像的高维特征数据之间的距离最小的子空间集合,并根据选择的子空间集合包括的高维特征数据和指定查询条件确定行人检索结果,该行人检索结果可以为监控视频中目标行人的行人图像,也可以为包含有目标行人的视频帧图像或者视频片段等。
在实际应用中,在视频监控场景下拍摄得到的海量行人图像,由于行人姿态、光照等因素的影响,同一个行人的多张行人图像之间的相似性可能较小,因此,从该多张行人图像中提取的高维特征数据往往不具有良好的聚类效果,从而导致行人检索的精度较低。
发明内容
为了解决现有技术中行人检索精度较低的问题,本发明实施例提供了一种行人检索方法及装置。所述技术方案如下:
第一方面,提供了一种行人检索方法,所述方法包括:
提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,所述目标行人图像为待检索的行人的图像,所述第一特征数据包括所述目标行人图像的至少一个全身高维特征数据,所述第二特征数据包括所述目标行人图像的至少一个上半身高维特征数据,所述第三特征数据包括所述目标行人图像的至少一个下半身高维特征数据;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据,对存储的高维特征数据进行筛选,得到目标特征数据集合,并通过所述目标特征数据集合确定行人检索结果,所述目标特征数据集合包括筛选出的与所述第一特征数据、所述第二特征数据和所述第三特征数据均匹配的行人图像的高维特征数据。
其中,当接收到目标行人图像时,可以提取该目标行人图像的一种特征的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,从而得到一个全身高维特征数据、包括一个上半身高维特征数据和一个下半身高维特征数据,当然,也可以提取该目标行人图像的多种特征的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,从而得到包括有多个全身高维特征数据的第一特征数据、包括多个上半身高维特征数据的第二特征数据和包括多个下半身高维特征数据的第三特征数据。也即是,至少一个可以为一个,也可以为多个。其中,该目标行人图像的多种特征可以包括该目标图像的颜色特征、纹理特征和通过深度网络学习到的深度特征等。
在本发明实施例中,由于提取的高维特征数据包括全身高维特征数据、上半身高维特征数据和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,保证了检索的精度。另外,由于提取的高维特征数据可以包括目标行人图像多种特征的高维特征数据,因此,确定的行人检索结果与目标行人图像的多种特征均可以达到相似,进一步地提高了检索的精度。
可选地,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据,对存储的高维特征数据进行筛选,得到目标特征数据集合,包括:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对所述存储的高维特征数据进行筛选,得到所述目标特征数据集合,所述目标特征数据集合中包括的任一高维特征数据对应的局部敏感哈希值与所述第一特征数据、所述第二特征数据和所述第三特征数据中至少一个特征数据对应的局部敏感哈希值相同。
需要说明的是,当提取到第一特征数据、第二特征数据和第三特征数据之后,可以根据第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值对存储的高维特征数据进行筛选,从而得到目标特征数据集合,并根据目标特征数据集合确定行人检索结果。由于通过局部敏感哈希值对存储的高维特征数据进行了筛选,因此,过滤掉了高维特征数据中与目标行人图像不匹配的高维特征数据,这样,在获取目标特征数据集合时,可以减少特征数据加载时间,在前述保证精度的前提下,保证了检索效率。
可选地,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对所述存储的高维特征数据进行筛选,得到所述目标特征数据集合,包括:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码;
从存储的全身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第一特征数据对应的局部敏感哈希值相同的表项,得到第一表项,所述全身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的上半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第二特征数据对应的局部敏感哈希值相同的表项,得到第二表项,所述上半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的下半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第三特征数据对应的局部敏感哈希值相同的表项,得到第三表项,所述下半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
基于所述第一表项中存储的多个特征数据标识,从存储的全身特征数据标识与二进制码之间的对应关系中,确定多个第一二进制码,基于所述第二表项中存储的多个特征数据标识,从存储的上半身特征数据标识与二进制码之间的对应关系中,确定多个第二二进制码,基于所述第三表项中存储的多个特征数据标识,从存储的下半身特征数据标识与二进制码之间的对应关系中,确定多个第三二进制码;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码,以及所述多个第一二进制码、所述多个第二二进制码和所述多个第三二进制码,从所述存储的高维特征数据中确定所述目标特征数据集合。
在本发明实施例中,不仅可以通过局部敏感哈希值对存储的高维特征数据进行筛选,还可以通过局部敏感哈希值和二进制码的结合对存储的高维特征数据进行两层筛选。由于两层筛选过滤掉了更多的噪声数据,因此,减少了获取目标特征数据集合时所需加载的数据量,提高了检索效率。
可选地,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码,以及所述多个第一二进制码、所述多个第二二进制码和所述多个第三二进制码,从所述存储的高维特征数据中确定所述目标特征数据集合,包括:
确定所述第一特征数据对应的二进制码与所述多个第一二进制码之间的海明距离,得到多个第一海明距离,生成第一特征数据标识集合,所述第一特征数据标识集合包括用于确定所述多个第一海明距离中小于第一阈值的海明距离的第一二进制码对应的特征数据标识;
确定所述第二特征数据对应的二进制码与所述多个第二二进制码之间的海明距离,得到多个第二海明距离,生成第二特征数据标识集合,所述第二特征数据标识集合包括用于确定所述多个第二海明距离中小于第二阈值的海明距离的第二二进制码对应的特征数据标识;
确定所述第三特征数据对应的二进制码与所述多个第三二进制码之间的海明距离,得到多个第三海明距离,生成第三特征数据标识集合,所述第三特征数据标识集合包括用于确定所述多个第三海明距离中小于第三阈值的海明距离的第三二进制码对应的特征数据标识;
对所述第一特征数据标识集合、所述第二特征数据标识集合和所述第三特征数据标识集合中相同的特征数据标识去重,得到第四特征数据标识集合,其中,同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
基于所述第四特征数据标识集合中的每个特征数据标识,从所述存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到所述目标特征数据集合。
需要说明的是,为了将根据局部敏感哈希值筛选得到的多个特征数据标识再进行一次筛选,以过滤掉更多噪声数据的特征数据标识,可以将经过局部敏感哈希值筛选得到的特征数据标识对应的二进制码与第一特征数据、第二特征数据和第三特征数据对应的二进制码分别进行比较,计算二者之间的海明距离,当两个二进制码之间的海明距离越小时,可以确定两个二进制码越相似。
可选地,所述通过所述目标特征数据集合确定行人检索结果,包括:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别与所述目标特征数据集合中同一特征数据标识对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据之间的卡方距离,得到多个全身距离、多个上半身距离和多个下半身距离;
将所述多个全身距离、所述多个上半身距离和所述多个下半身距离中,属于同一特征数据标识对应的全身距离、上半身距离和下半身距离按照预设权重加权运算,得到所述目标特征数据集合包括的高维特征数据所属的每个特征数据标识对应的加权距离;
基于存储的行人标识与特征数据标识之间的对应关系,从所述目标特征数据集合包括的高维特征数据所属的特征数据标识中选择属于同一行人标识的特征数据标识,得到多组特征数据标识,每组特征数据标识对应同一行人标识;
从所述多组特征数据标识中的每组特征数据标识对应的加权距离中选择最小的加权距离,得到多个最小加权距离,并对所述多个最小加权距离进行排序,得到排序结果;
基于所述多个最小加权距离对应的特征数据标识,确定所述行人检索结果,并基于所述排序结果,显示所述行人检索结果。
当通过筛选得到目标特征数据集合之后,可以将该目标特征数据集合中的属于同一特征数据标识的高维特征数据与目标行人图像的第一特征数据、第二特征数据和第三特征数据进行比较,并根据二者之间距离的大小进行排序,得到排序结果,该排序结果也即是目标行人图像的第一特征数据、第二特征数据和第三特征数据与相匹配的行人图像的高维特征数据的匹配度排序。当然,为了给用户更多选择,可以将最终确定的行人检索结果按照该排序结果进行显示。
可选地,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对存所述储的高维特征数据进行筛选,得到所述目标特征数据集合之前,还包括:
获取监控视频包含的视频帧图像中的行人图像,得到多个行人图像;
对于所述多个行人图像中的每个行人图像,分别提取所述行人图像的第四特征数据、第五特征数据和第六特征数据,所述第四特征数据包括所述行人图像的至少一个全身高维特征数据,所述第五特征数据包括所述行人图像的至少一个上半身高维特征数据,所述第六特征数据包括所述行人图像的至少一个下半身高维特征数据;
确定所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码;
为所述多个行人图像中每个行人图像的高维特征数据分配特征数据标识,且同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
基于每个行人图像的高维特征数据的特征数据标识以及所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码,创建所述全身局部敏感哈希表、所述上半身局部敏感哈希表和所述下半身局部敏感哈希表以及所述全身特征数据标识与二进制码之间的对应关系、所述上半身特征数据标识与二进制码之间的对应关系和所述下半身特征数据标识与二进制码之间的对应关系。
需要说明的是,在通过目标行人图像进行检索之前,需要构建索引,这样,当接收到检索请求时,才能根据检索请求携带的目标行人图像通过构建的索引进行检索。在本发明实施例中,索引构建时所提取的多个行人图像的高维特征数据与检索时提取的目标行人图像的高维特征数据的类型是一致的,且为了保证检索时,能够通过局部敏感哈希值或二进制码或局部敏感哈希值和二进制码的结合三种方式对存储的高维特征数据的筛选,在构建索引时,可以基于行人图像的高维特征数据的特征数据标识以及高维特征数据分别对应的局部敏感哈希值和二进制码,创建全身局部敏感哈希表、上半身局部敏感哈希表和下半身局部敏感哈希表以及全身特征数据标识与二进制码之间的对应关系、上半身特征数据标识与二进制码之间的对应关系和下半身特征数据标识与二进制码之间的对应关系。
可选地,所述基于每个行人图像的高维特征数据的特征数据标识以及所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码,创建所述全身局部敏感哈希表、所述上半身局部敏感哈希表和所述下半身局部敏感哈希表以及所述全身特征数据标识与二进制码之间的对应关系、所述上半身特征数据标识与二进制码之间对应关系和所述下半身特征数据标识与二进制码之间的对应关系,包括:
将所述多个行人图像的第四特征数据划分为多组,且每组第四特征数据对应的局部敏感哈希值相同,并将同一组第四特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述全身局部敏感哈希表,将所述多个行人图像的第五特征数据划分为多组,且每组第五特征数据对应的局部敏感哈希值相同,并将同一组第五特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述上半身局部敏感哈希表,将所述多个行人图像的第六特征数据划分为多组,且每组第六特征数据对应的局部敏感哈希值相同,并将同一组第六特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述下半身局部敏感哈希表;
将所述多个行人图像的第四特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述全身特征数据标识与二进制码之间的对应关系,将所述多个行人图像的第五特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述上半身特征数据标识与二进制码之间的对应关系,将所述多个行人图像的第六特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述下半身特征数据标识与二进制码之间的对应关系。
需要说明的是,在创建局部敏感哈希表时,每个表项对应一个局部敏感哈希值,且每个表项中存储有多个特征数据标识,也即是,一个局部敏感哈希值可以对应多个特征数据标识。另外,每个高维特征数据都对应有一个二进制码,即每个高维特征数据的特征数据标识都对应有一个二进制码,由此得到特征数据标识与二进制码的对应关系。
第二方面,提供了一种行人检索装置,所述行人检索装置具有实现上述第一方面中行人检索方法的功能。该行人检索装置包括至少一个模块,该至少一个模块用于实现上述第一方面所提供的行人检索方法。
第三方面,提供了一种行人检索装置,所述行人检索装置的结构中包括处理器和存储器,所述存储器用于存储支持行人检索装置执行上述第一方面所提供的行人检索方法的程序,以及存储用于实现上述第一方面所提供的行人检索方法所涉及的数据。所述处理器被配置为用于执行所述存储器中存储的程序。所述存储设备的操作装置还可以包括通信总线,该通信总线用于该处理器与存储器之间建立连接。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的行人检索方法。
第五方面,本发明实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的行人检索方法。
上述第二方面、第三方面、第四方面和第五方面所获得的技术效果与第一方面中对应的技术手段获得的技术效果近似,在这里不再赘述。
本发明实施例提供的技术方案带来的有益效果是:根据提取到的目标行人图像的多个全身高维特征数据、上半身高维特征数据和下半身高维特征数据,对存储的高维特征数据进行筛选,从而确定行人检索结果。由于提取的高维特征数据包括全身高维特征数据、上半身高维特征数据和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,提高了检索的精度。
附图说明
图1是本发明实施例提供的行人检索装置的结构示意图;
图2是本发明实施例提供的一种计算节点的结构示意图;
图3是本发明实施例提供的一种行人检索方法的流程图;
图4是本发明实施例提供的一种行人检索方法的流程图;
图5是本发明实施例提供的一种行人检索方法的流程图;
图6A是本发明实施例提供的一种行人检索装置示意图;
图6B是本发明实施例提供的另一种行人检索装置示意图
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本发明实施例提供的一种行人检索装置的结构示意图,如图1所示,该行人检索装置包括总调度模块101、特征提取模块102、构建索引模块103和查询索引模块104,各个模块可以部署在同一计算节点上,也可以分布在不同的计算节点上。当各个模块分布在同一计算节点上时,该计算节点还可以包括视频图像采集设备;当各个模块分布在不同的计算节点上时,特征提取模块102所在的计算节点中可以包括视频图像采集设备,而总调度模块101、构建索引模块103和查询索引模块104所在的计算节点则可以不包括视频图像采集设备。
其中,总调度模块101用于向特征提取模块102下达智能视频分析任务和向查询索引模块104下达行人检索任务。特征提取模块102可以接收视频图像采集设备实时采集并发送的监控视频,也可以通过其所在的计算节点上的通信接口接收网络上的监控视频。当特征提取模块102接收到总调度模块101下达的智能视频分析任务时,则可以从接收到的监控视频中获取行人图像,提取行人图像的高维特征数据,并将行人图像和高维特征数据发送至构建索引模块103。构建索引模块103基于接收到的行人图像和高维特征数据生成索引文件、特征文件和图像文件,并将其分别存储在磁盘阵列中,形成索引库、特征库和图像库。之后,当用户通过客户端操作界面触发携带目标行人图像的检索请求时,总调度模块101可以向查询索引模块104下达行人检索任务。查询索引模块104提取该目标行人图像的高维特征数据,同时,向索引库请求索引文件并加载索引文件到内存;通过该索引文件,基于提取的目标行人图像的高维特征数据,得到索引检索结果;之后,查询索引模块104根据索引检索结果从特征库获取特征数据集合,并根据该特征数据集合从图像库中获取对应的行人检索结果。
具体地,将行人检索装置中多个模块各自的功能阐述如下:
总调度模块101,用于下达智能视频分析任务和行人检索任务。
特征提取模块102,获取监控视频包含的视频帧图像中的行人图像,得到多个行人图像;对于多个行人图像中的每个行人图像,分别提取行人图像的第四特征数据、第五特征数据和第六特征数据,第四特征数据包括行人图像的多个全身高维特征数据,第五特征数据包括行人图像的多个上半身高维特征数据,第六特征数据包括行人图像的多个下半身高维特征数据。
其中,特征提取模块102可以通过其所在的计算节点中包括的视频图像采集设备,获取监控视频,并获取监控视频中包含的大量视频帧图像以及视频帧图像中的行人图像;当特征提取模块102提取行人图像的第四特征数据、第五特征数据和第六特征数据之后,可以将获取到的视频帧图像、行人图像以及提取到的高维特征数据发送至构建索引模块103。
构建索引模块103,用于确定第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码;为多个行人图像中每个行人图像的高维特征数据分配特征数据标识,且同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;基于每个行人图像的高维特征数据的特征数据标识以及第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码,创建局部敏感哈希表以及全身高维特征数据、上半身高维特征数据和下半身高维特征数据分别对应的特征数据标识与二进制码之间的对应关系。
其中,构建索引模块103基于特征提取模块102发送的高维特征数据,得到局部敏感哈希表和对应关系后,根据该局部敏感哈希表和对应关系,生成索引文件,并将该索引文件存储在磁盘阵列上,形成索引库。之后,对于接收到的高维特征数据,构建索引模块103基于该高维特征数据生成特征文件,并将该特征文件存储在磁盘阵列上,形成特征库。另外,构建索引模块103还可以基于特征提取模块102发送的视频帧图像和行人图像,生成图像文件,并将该图像文件存储在磁盘阵列上,形成图像库。
查询索引模块104,用于提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,目标行人图像为待检索的行人的图像,第一特征数据包括目标行人图像的多个全身高维特征数据,第二特征数据包括目标行人图像的多个上半身高维特征数据,第三特征数据包括目标行人图像的多个下半身高维特征数据;确定第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值和二进制码;基于第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值和二进制码,对存储的高维特征数据进行筛选,得到目标特征数据集合,并通过目标特征数据集合确定行人检索结果,目标特征数据集合为筛选出与目标行人图像相似的行人图像的高维特征数据的集合。
图2是本发明实施例提供的一种计算节点的结构示意图。图1中的行人检索装置可以通过图2所示的计算节点来实现,且该计算节点可以为终端,也可以为服务器。参见图2,该计算节点包括至少一个处理器201,通信总线202,存储器203以及至少一个通信接口204。
处理器201可以是通用CPU、微处理器、特定应用集成电路(Application-SpecificIntegrated Circuit,ASIC),或者一个或多个用于控制本申请方案程序执行的集成电路。
通信总线202可包括一通路,在上述组件之间传送信息。
存储器203可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、可存储静态信息和指令的其它类型的静态存储设备、可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM),或者其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质,或者其它磁存储设备,或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由该物理服务器存取的任何其它介质,但不限于此。存储器203可以是独立存在,或者通过通信总线202与处理器201相连接,或者和处理器201集成在一起。
通信接口204使用任何收发器一类的装置,用于与其它设备或通信网络通信,如以太网、无线接入网(Radio Access Network,RAN)、无线局域网(Wireless Local AreaNetworks,WLAN)等。
在具体实现中,作为一种实施例,处理器201可以包括一个或多个CPU,例如图2中所示的CPU0和CPU1。
在具体实现中,作为一种实施例,该计算节点可以包括多个处理器,例如图2中所示的处理器201和处理器205。这些处理器中的每一个可以是一个单核处理器(single-CPU),也可以是一个多核处理器(multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据的处理核。
在具体实现中,作为一种实施例,计算节点还可以包括视频图像采集设备206、输入设备207和输出设备208。视频图像采集设备206与处理器201通信,可以输入采集到的监控视频。例如,视频图像采集设备206可以是能够将模拟视频信号转化为数字信号的数字摄像头,也可以是直接拍摄得到模拟视频信号的模拟摄像头。输入设备207与处理器201通信,可以以多种方式接收用户的输入。例如,输入设备207可以是鼠标、键盘、触摸屏设备或传感设备等。输出设备208和处理器201通信,可以以多种方式来显示信息。例如,输出设备208可以是液晶显示器(liquid crystal display,LCD),发光二级管(light emitting diode,LED)显示设备,阴极射线管(cathode ray tube,CRT)显示设备,或投影仪(projector)等。
其中,存储器203用于存储执行本申请方案的程序代码209,处理器201用于执行存储器203中存储的程序代码209。程序代码209中可以包括一个或多个软件模块(例如:总调度模块、特征提取模块、构建索引模块和查询索引模块等),图1中所示的行人检索装置可以通过处理器201以及存储器203中的程序代码209中的一个或多个软件模块,来确定行人检索结果。
需要说明的是,行人检索装置也可以由多个上述计算节点来实现,其中,行人检索装置中的总调度模块、特征提取模块、构建索引模块的查询索引模块分别设置在不同的计算节点中。多个计算节点之间可以通过网络进行通信。
在本申请中,当行人检索装置接收到待检索的目标行人图像时,可以根据该目标行人图像的第一特征数据、第二特征数据和第三特征数据对存储的高维特征数据进行筛选。其中,行人检索装置可以通过局部敏感哈希值对存储的高维特征数据进行筛选,也可以通过二进制码对存储的高维特征数据进行筛选,当然还可以将上述两种方式进行结合,通过局部敏感哈希值和二进制码对存储的高维特征数据进行两层筛选。当通过局部敏感哈希值和二进制码对存储的高维特征数据进行筛选时,由于两层筛选过滤掉了更多的噪声数据,因此,减少了获取目标特征数据集合时所需加载的数据量。针对上述三种不同的对存储的高维特征数据进行筛选的方式,本发明实施例将通过以下三个实施例对本申请的行人检索方法进行具体说明。
图3是本发明实施例提供的一种行人检索方法的流程图,该行人检索方法应用于行人检索装置中,且在该方法中,行人检索装置通过局部敏感哈希值和二进制码对存储的高维特征数据进行两层筛选,参见图3,该方法包括:
301:获取监控视频包含的视频帧图像中的行人图像,得到多个行人图像。
行人检索装置可以接收视频图像采集设备实时采集的监控视频,也可以通过网络通信获取存储的监控视频。监控视频中往往包含大量的视频帧图像,而每张视频帧图像中又可以包括多个行人图像。当获取到监控视频后,通过行人检测和跟踪技术对监控视频进行分析,以得到监控视频中每张视频帧图像中包含的多个行人图像。其中,由于同一个行人可能出现在监控视频的多张视频帧图像中,因此,同一个行人可以对应多个行人图像。
302:对于该多个行人图像中的每个行人图像,分别提取该行人图像的第四特征数据、第五特征数据和第六特征数据,第四特征数据包括该行人图像的至少一个全身高维特征数据,第五特征数据包括该行人图像的至少一个上半身高维特征数据,第六特征数据包括该行人图像的至少一个下半身高维特征数据。
当获取到行人图像后,行人检索装置可以对每个行人图像进行特征数据提取。其中,当同一个行人对应多个行人图像时,可以从该行人对应的多个行人图像中选取预设个数的行人图像进行特征数据提取。
通常,在进行行人检索时,行人图像与待检索的行人的图像很可能只是全身相似,或者只是上半身相似,或者只是下半身相似,如果只根据全身相似或者上半身相似或者下半身相似来确定行人检索结果,那么得到的行人检索结果的准确性则会比较低。而当待检索的行人的图像的全身、上半身和下半身与行人图像的全身、上半身和下半身同时相似时,由此得到的行人检索结果的准确性将显著提高。另外,行人图像中往往包含有多种特征,如颜色特征、纹理特征等。在检索时,行人检索装置可以只通过单一的特征对行人图像进行过滤。当然,由于只通过单一的特征对行人图像进行过滤,得到的检索结果很有可能因为其他特征相差甚远而并不是很准确,因此,为了避免上述情况,进一步提高行人检索结果的准确性,行人检索装置也可以通过多种特征对行人图像进行过滤。
当通过单一的特征对行人图像进行过滤时,行人检索装置可以从多个行人图像包含的多种特征中选择任一特征,并根据该选择的特征对每个行人图像提取一个全身高维特征数据、一个上半身高维特征数据和一个下半身高维特征数据。
当通过多种特征对行人图像进行筛选时,行人检索装置可以对每个行人图像中的颜色特征、纹理特征等分别提取全身高维特征数据、上半身高维特征数据和下半身高维特征数据,从而得到包括多个全身高维特征数据的第四特征数据、包括多个上半身高维特征数据的第五特征数据和包括多个下半身高维特征数据的第六特征数据。
当行人检索装置对行人图像中的任一特征进行全身高维特征数据、上半身高维特征数据和下半身高维特征数据提取时,首先可以通过部件分割或者固定比例的分割技术,对行人图像进行分割。具体地,行人检索装置可以将行人图像分为头部、上半身、下半身三个部分;之后,针对头部、上半身和下半身三个部分统一进行高维特征数据提取,得到全身高维特征数据;单独对上半身部分进行高维特征数据提取,得到上半身高维特征数据;单独对下半身部分进行高维特征数据提取,得到下半身高维特征数据。
需要说明的是,行人检索装置在对行人图像进行高维特征数据提取时,还可以获取该行人图像在视频帧图像中所处的位置信息以及该行人图像拍摄的时间信息,并且,可以将获取到的位置信息和时间信息作为高维特征数据的一部分进行存储。其中,高维特征数据的长度是固定的。
303:确定第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码。
当提取到第四特征数据、第五特征数据和第六特征数据之后,行人检索装置可以根据第四特征数据、第五特征数据和第六特征数据包含的多个高维特征数据分别计算每个高维特征数据对应的局部敏感哈希值和二进制码。
在一种可能的实现方式中,以任一高维特征数据x为例,行人检索装置可以通过下述计算公式(1)计算x对应的局部敏感哈希值:
其中,在上述公式(1)中,h(x)为高维特征数据x对应的局部敏感哈希值,a为预设的向量,且该向量中的元素是从高斯分布中随机采样获得的,参数w为预设的正实数。
之后,行人检索装置可以计算高维特征数据x对应的二进制码,在一种可能实现的方式中,当该高维特征数据x为全身高维特征数据时,行人检索装置可以生成与该高维特征数据的维度相同的随机向量r,随机向量r中的元素是从高斯分布中生成的随机数。当想要高维特征数据的二进制码为N位时,则需要对应的生成N个随机向量,并通过如下公式(2)计算得到二进制码:
当高维特征数据x为上半身高维特征数据或者下半身高维特征数据时,行人检索装置则可以从提取到的高维特征数据中随机选择一个高维特征数据r'作为参考点,之后,计算高维特征数据x和高维特征数据r'之间的距离d(x,r'),并根据如下公式(3)计算二进制码:
其中,在上述公式(2)中,hr(x)为高维特征数据x为全身高维特征数据时的局部敏感哈希值,rT为对随机向量r进行转置得到的转置向量,在上述公式(3)中,hr'(x)为高维特征数据x为上半身高维特征数据或者下半身高维特征数据时的局部敏感哈希值,距离d(x,r')可以为诸如卡方距离、欧几里得距离等可以度量两个高维特征数据之间距离的距离,tr'为预设阈值。
304:为该多个行人图像中每个行人图像的高维特征数据分配特征数据标识,且同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同。
当行人检索装置提取第四特征数据、第五特征数据和第六特征数据之后,可以按照对各个行人图像提取高维特征数据的提取顺序,将提取到的高维特征数据和高维特征数据对应的行人图像存储在磁盘阵列中。其中,为了便于后续检索时,行人检索装置能够根据特征数据标识,快速准确的确定对应的高维特征数据是全身、上半身还是下半身高维特征数据,行人检索装置对每个行人图像提取全身高维特征数据、上半身高维特征数据、下半身高维特征数据的提取顺序可以是固定的,且对每个行人图像提取何种特征的高维特征数据的顺序也可以是固定的,另外,对于同一个行人对应的多个行人图像的高维特征数据可以集中存储。之后,行人检索装置可以为每个行人图像的高维特征数据分配特征数据标识,同时,行人检索装置还可以为每个行人图像的高维特征数据分配该行人图像对应的行人标识。
表1是本发明实施例示出的一种高维特征数据存储顺序,仅以一种特征如颜色特征提取的高维特征数据为例,假设当前提取到的高维特征数据来自4张行人图像,分别为行人图像A、B、C、D,对4张行人图像提取高维特征数据的顺序分别为行人图像B、A、D、C,假设对每张行人图像均先提取全身高维特征数据,后提取上半身高维特征数据,最后提取下半身高维特征数据,且上述4张行人图像中,行人图像A和行人图像C属于同一行人,那么,针对该4张行人图像提取到的高维特征数据的存储顺序则如表1中所示。
表1 高维特征数据存储顺序
行人检索装置可以按照表1中的顺序,将提取到的大量的高维特征数据以表格的形式进行存储,当然,行人检索装置也可以直接将每个高维特征数据按照上述顺序存储在磁盘阵列上,并在每个高维特征数据之前存储该高维特征数据对应的行人标识和特征数据标识。
另外,如表1中所示,当为每个高维特征数据进行特征数据标识分配时,按照各个行人图像的高维特征数据在磁盘阵列上的存储顺序,依次为每个行人图像的高维特征数据分配特征数据标识,该特征数据标识可以指示每个行人图像的高维特征数据在磁盘阵列上所处的位置。
305:基于每个行人图像的高维特征数据的特征数据标识以及第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码,创建全身局部敏感哈希表、上半身局部敏感哈希表和下半身局部敏感哈希表以及全身特征数据标识与二进制码之间的对应关系、上半身特征数据标识与二进制码之间的对应关系和下半身特征数据标识与二进制码之间的对应关系。
通过步骤303和步骤304,当行人检索装置确定了第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码以及每个行人图像的特征数据标识之后,行人检索装置可以根据第四特征数据对应的局部敏感哈希值,将多个行人图像的第四特征数据划分为多组,并且将同一组第四特征数据的特征数据标识存储在同一表项中,从而创建得到包括多个表项的全身局部敏感哈希表。其中,每组第四特征数据对应的局部敏感哈希值相同。之后,行人检索装置可以将该多个行人图像的第五特征数据划分为多组,且每组第五特征数据对应的局部敏感哈希值相同,并将同一组第五特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的上半身局部敏感哈希表,将该多个行人图像的第六特征数据划分为多组,且每组第六特征数据对应的局部敏感哈希值相同,并将同一组第六特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的下半身局部敏感哈希表。
需要说明的是,针对不同的特征,行人检索装置可以创建针对该特征的全身局部敏感哈希表、上半身局部敏感哈希表和下半身局部敏感哈希表。例如,当第四特征数据、第五特征数据和第六特征数据均包括针对颜色特征和纹理特征的两个高维特征数据,那么,基于第四特征数据,将创建得到全身颜色特征局部敏感哈希表和全身纹理特征局部敏感哈希表两个局部敏感哈希表;同理,基于第五特征数据和第六特征数据,也将分别创建得到两个局部敏感哈希表。
表2是本发明实施例提供的一种全身局部敏感哈希表,假设第四特征数据包括颜色特征的全身高维特征数据和纹理特征的全身高维特征数据,那么,基于第四特征数据中颜色特征的高维特征数据创建得到的全身颜色特征局部敏感哈希表即如表2中所示。由表2中可知,特征数据标识为ID1,ID4,ID5的三个颜色特征的全身高维特征数据的哈希值均为H1,因此,将该三个高维特征数据的特征数据标识存储在一个表项中,按照这种方式,可以得到多个表项,由该多个表项即组成了一个全身局部敏感哈希表。
表2 全身颜色特征局部敏感哈希表
哈希值 特征数据标识
H1 ID1,ID4,ID5
H2 ID3
H3 ID2,ID6,ID7,ID10
H4 ID8,ID9
…… ……
当创建得到全身局部敏感哈希表、上半身局部敏感哈希表和下半身局部敏感哈希表之后,行人检索装置可以将该多个行人图像的第四特征数据的特征数据标识和对应的二进制码对应存储,以创建得到全身特征数据标识与二进制码之间的对应关系,将该多个行人图像的第五特征数据的特征数据标识和对应的二进制码对应存储,以创建得到上半身特征数据标识与二进制码之间的对应关系,将该多个行人图像的第六特征数据的特征数据标识和对应的二进制码对应存储,以创建得到下半身特征数据标识与二进制码之间的对应关系。
其中,以第四特征数据为例,当第四特征数据包括多种特征的全身高维特征数据时,行人检索装置可以将该多个行人图像的每一种特征的全身高维特征数据的特征数据标识与对应的二进制码进行对应存储,得到该种特征的全身特征数据标识与二进制码的对应关系。也即是,假设第四特征数据包括颜色特征和纹理特征的全身高维特征数据,那么,行人检索装置可以将颜色特征的全身高维特征数据的特征数据标识与对应的二进制码进行对应存储,得到颜色特征的全身特征数据标识与二进制码之间的对应关系,将纹理特征的全身高维特征数据的特征数据标识与对应的二进制码进行对应存储,得到纹理特征的全身特征数据标识与二进制码之间的对应关系。
通过步骤301-305,行人检索装置根据从监控视频中获取到的多个行人图像,提取得到大量的高维特征数据,并根据提取的大量高维特征数据创建得到了局部敏感哈希表和高维特征数据的特征数据标识与二进制码的对应关系,其中,行人检索装置可以将该局部敏感哈希表和对应关系存储在磁盘阵列上的索引库中,将大量的高维特征数据存储在特征库中,将高维特征数据对应的行人图像存储在图像库中,这样,行人检索装置就完成了索引构建,当接收到检索请求时,行人检索装置就可以通过步骤306-308,基于检索请求中携带的目标行人图像,根据索引库中存储的局部敏感哈希表和对应关系,从特征库和图像库中获取行人检索结果。
306:提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,该目标行人图像为待检索的行人的图像,第一特征数据包括目标行人图像的至少一个全身高维特征数据,第二特征数据包括目标行人图像的至少一个上半身高维特征数据,第三特征数据包括目标行人图像的至少一个下半身高维特征数据。
通常,当用户进行行人检索时,可以将待检索的行人的图像输入至行人检索装置,从而触发检索请求,该待检索的行人的图像即为目标行人图像。当行人检索装置接收到检索请求和目标行人图像时,可以提取目标行人图像的第一特征数据、第二特征数据和第三特征数据。如果通过步骤301-305构建得到的索引中,第四特征数据、第五特征数据和第六特征数据均包含的是针对颜色特征和纹理特征的高维特征数据,那么,对目标行人图像进行提取时,则提取目标行人图像的颜色特征的全身高维特征数据和纹理特征的全身高维特征数据,得到第一特征数据,提取目标行人图像的颜色特征的上半身高维特征数据和纹理特征的上半身高维特征数据,得到第二特征数据,提取目标人物图像的颜色特征的下半身高维特征数据和纹理特征的下半身高维特征数据,得到第三特征数据。当然,如果第四特征数据、第五特征数据和第六特征数据包含的是针对一种特征的高维特征数据,那么,对目标行人图像进行提取时,也只提取针对这种特征的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,从而得到第一特征数据、第二特征数据和第三特征数据,也即是说,对目标行人图像提取的特征种类应与步骤301-305中构建索引时提取的特征种类是相同的。
基于上述描述,当对目标行人图像提取多种特征的高维特征数据时,第一特征数据、第二特征数据和第三特征数据均包括多个高维特征数据;当对目标行人图像提取一种特征的高维特征数据时,第一特征数据、第二特征数据和第三特征数据均包括一个高维特征数据。
其中,行人图像的特征种类不限于颜色特征和纹理特征,还可以包括通过深度网络学习到的深度特征等。另外,在对目标行人图像进行特征提取之前,也需要对目标行人图像进行分割,以便行人检索装置对目标行人图像进行第一特征数据、第二特征数据和第三特征数据的提取。其中,对目标行人图像进行分割的方式可以参考步骤302中对多个行人图像进行分割的方法。
还需要说明的是,对目标行人图像提取全身高维特征数据、上半身高维特征数据和下半身高维特征数据的提取顺序也是固定的,且与前述构建索引时,对每个行人图像提取全身高维特征数据、上半身高维特征数据、下半身高维特征数据的提取顺序相同。另外,对目标行人图像提取何种特征的高维特征数据的提取顺序也是固定的,且该提取顺序与前述构建索引时,对每个行人图像提取何种特征的高维特征数据的提取顺序相同。
307:确定第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值和二进制码。
当提取到目标行人图像的第一特征数据、第二特征数据和第三特征数据之后,行人检索装置可以基于第一特征数据,计算得到第一特征数据包含的多个全身高维特征数据对应的多个局部敏感哈希值;基于第二特征数据,计算得到第二特征数据包含的多个上半身高维特征数据对应的多个局部敏感哈希值;基于第三特征数据,计算得到第三特征数据包含的多个下半身高维特征数据对应的局部敏感哈希值。之后,行人检索装置可以计算每个高维特征数据对应的二进制码。其中,行人检索装置基于高维特征数据计算对应的局部敏感哈希值和二进制码的方法可以参照步骤303中的方法进行计算,本发明实施例不再赘述。
308:基于第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值和二进制码,对存储的高维特征数据进行筛选,得到目标特征数据集合,该目标特征数据集合包括筛选出的与第一特征数据、第二特征数据和第三特征数据均匹配的行人图像的高维特征数据。
当确定第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值和二进制码之后,行人检索装置可以从存储的全身局部敏感哈希表包括的多个表项中,选择对应的敏感哈希值与第一特征数据对应的局部敏感哈希值相同的表项,得到第一表项,该全身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;从存储的上半身局部敏感哈希表包括的多个表项中,选择对应的敏感哈希值与第二特征数据对应的局部敏感哈希值相同的表项,得到第二表项,该上半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;从存储的下半身局部敏感哈希表包括的多个表项中,选择对应的敏感哈希值与第三特征数据对应的局部敏感哈希值相同的表项,得到第三表项,该下半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;基于第一表项中存储的多个特征数据标识,从存储的全身特征数据标识与二进制码之间的对应关系中,确定多个第一二进制码,基于第二表项中存储的多个特征数据标识,从存储的上半身特征数据标识与二进制码之间的对应关系中,确定多个第二二进制码,基于第三表项中存储的多个特征数据标识,从存储的下半身特征数据标识与二进制码之间的对应关系,确定多个第三二进制码;基于第一特征数据、第二特征数据和第三特征数据分别对应的二进制码,以及多个第一二进制码、多个第二二进制码和多个第三二进制码,从存储的高维特征数据中确定目标特征数据集合。
例如,假设第一特征数据包括颜色特征的全身高维特征数据和纹理特征的全身高维特征数据,那么,行人检索装置可以根据颜色特征的全身高维特征数据对应的局部敏感哈希值H1,从全身颜色特征局部敏感哈希表中查找局部敏感哈希值为H1的表项,然后根据纹理特征的全身高维特征数据对应的局部敏感哈希值H2,从全身纹理特征局部敏感哈希表中查找局部敏感哈希值为H2的表项,之后,行人检索装置获取局部敏感哈希值H1对应的表项中的全部特征数据标识和局部敏感哈希值为H2对应的表项中的全部特征数据标识,得到第一表项。由于对于同一个行人图像,该行人图像的所有高维特征数据的特征数据标识均相同,因此,如果将获取到的所有特征数据标识混在一起,那么,后续通过特征数据标识确定对应的二进制码时,就无法确定该特征数据标识到底为颜色特征还是纹理特征的全身特征数据标识。为了避免上述问题,行人检索装置可以按照预设的特征提取顺序,分别获取不同特征对应的特征数据标识作为子表项,从而得到第一表项,以上述为例,即可以获取局部敏感哈希值H1对应的特征数据标识,得
到子表项1,获取局部敏感哈希值H2对应的特征数据标识,得到子表项2,由该子表项1和子表项2共同组成第一表项。
按照上述获取得到第一表项的方式,分别获取对应的局部敏感哈希值与第二特征数据和第三特征数据分别对应的局部敏感哈希值相同的表项中的特征数据标识,得到第二表项和第三表项。
当得到第一表项、第二表项和第三表项之后,行人检索装置首先可以从存储的全身特征数据标识与二进制码的对应关系中,获取第一表项中的特征数据标识对应的多个第一二进制码。显然的,当第一表项中包含有多个子表项时,行人检索装置可以按照子表项在第一表项中所处的序号,确定该子表项对应的特征,并获取确定的特征的特征数据标识的二进制码,得到第一二进制码。此时,为了后续与目标行人图像的二进制码计算距离时,能准确的区分不同的特征的二进制码,可以将该多个第一二进制码按照对应的特征种类进行分组。之后,行人检索装置可以按照上述方式,分别根据第二表项和第三表项中特征数据标识,得到多个第二二进制码和第三二进制码。
当确定第一二进制码、第二二进制码和第三二进制码之后,行人检索装置可以通过以下操作确定目标特征数据集合,具体为:确定第一特征数据对应的二进制码与多个第一二进制码之间的海明距离,得到多个第一海明距离,从多个第一海明距离中选择小于第一阈值的海明距离,并基于选择的海明距离的第一二进制码对应的特征数据标识生成第一特征数据标识集合;确定第二特征数据对应的二进制码与多个第二二进制码之间的海明距离,得到多个第二海明距离,从多个第二海明距离中选择小于第二阈值的海明距离,并基于选择的海明距离的第二二进制码对应的特征数据标识生成第二特征数据标识集合;确定第三特征数据对应的二进制码与多个第三二进制码之间的海明距离,得到多个第三海明距离,从多个第三海明距离中选择小于第三阈值的海明距离,并基于选择的海明距离的第三二进制码对应的特征数据标识生成第三特征数据标识集合;对第一特征数据标识集合、第二特征数据标识集合和第三特征数据标识集合中相同的特征数据标识去重,得到第四特征数据标识集合,其中,同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;基于第四特征数据标识集合中的每个特征数据标识,从存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到目标特征数据集合。
其中,以第一特征数据为例进行解释说明。当第一特征数据包含有多种特征的高维特征数据时,行人检索装置可以计算每种特征的全身高维特征数据对应的二进制码与多个第一二进制码中对应的特征的二进制码之间的海明距离,得到多个第一海明距离。例如,假设第一特征数据包括颜色特征和纹理特征的全身高维特征数据,且对应的二进制码分别为M1、M2,计算得到的多个第一二进制码中,颜色特征的多个第一二进制码为(a1,a2,a3,a4),纹理特征对应的多个第一二进制码(a5,a6,a7,),那么,行人检索装置即可以计算M1与a1,a2,a3,a4之间的海明距离,M2与a5,a6,a7,之间的海明距离,从而得到7个第一海明距离。
另外,由于同一行人图像的所有高维特征数据对应的特征数据标识均相同,因此,得到的第一特征数据标识集合、第二特征数据标识集合和第三特征数据标识集合中可能存在有相同的特征数据标识,并且,由于后续确定目标特征数据集合中,对于同一行人图像的不同高维特征数据,通过一个特征数据标识就能获取得到,因此,行人检索装置可以将第一特征数据标识集合、第二特征数据标识集合和第三特征数据标识集合中相同的特征数据标识去重,得到第四特征数据标识集合。
需要说明的是,由于第四特征数据标识集合是通过局部敏感哈希值和二进制码两次筛选得到的,因此滤除了大量的噪声数据的特征数据标识。这样,当通过该第四特征数据标识集合去获取目标特征数据时,行人检索装置就可以减少加载高维特征数据的次数,从而提高了检索效率。同时,由于对存储的大量高维特征数据通过两种不同的方式进行了筛选,因此,也保证了最终确定的目标特征数据集合的准确性。
当得到第四特征数据标识集合之后,由步骤304可知,特征数据标识是按照特征数据在磁盘阵列上存储的顺序进行分配的,因此,根据第四特征数据标识集合中的每个特征数据标识,就可以计算得到在特征库中每个特征数据的偏移量,也即是,每个特征数据在特征库中的存储位置,从而查找获取到该第四特征数据标识集合中每个特征数据标识对应的行人图像的全部高维特征数据,从而得到目标特征数据集合。
需要说明的是,在行人检索时,不同用户的检索侧重点也不尽相同。例如,有的用户期望检索时能够对全身的特征的筛选更严格,也即是说,最终获得的行人检索结果,全身特征更为相似,而有的用户可能认为下半身外观变化较小,特征差距小,因此期望可以对下半身特征进行更严格的筛选以去除更多的噪声数据。因此,针对不同的检索要求,可以控制第一阈值、第二阈值和第三阈值之间的数值大小关系来实现上述目的。当第一阈值小于第二阈值,且小于第三阈值时,即对全身特征采用更严格的筛选阈值,在这种情况下,得到的将是与目标行人图像的全身特征更为相似行人检索结果;当第二阈值小于第一阈值,且小于第三阈值时,即对上半身特征采用更严格的筛选阈值,此时,得到的将是与目标行人图像的上半身特征更为相似的行人检索结果;当第三阈值小于第一阈值,且小于第二阈值时,即对下半身特征采用了更加严格的筛选阈值,此时,得到的将是与目标行人图像的上半身特征更为相似的行人检索结果。
可选地,由于第一特征数据、第二特征数据和第三特征数据可以包括多种特征的高维特征数据,因此,行人检索装置还可以首先针对多种特征中第一种特征的高维特征数据,确定得到第一表项、第二表项和第三表项,之后,根据第一表项、第二表项和第三表项确定得到该种特征的第一二进制码、第二二进制码和第三二进制码,并基于确定的第一二进制码、第二二进制码和第三二进制码确定得到第一特征数据标识集合、第二特征数据标识集合和第三特征数据标识集合。其次,行人检索装置可以针对多种特征中的第二种特征,按照上述方式得到三个特征数据标识集合。依次类推,当针对所有特征的高维特征数据均确定了特征数据标识集合之后,在将确定的所有特征数据标识集合中的相同特征数据标识集合去重,得到第四特征数据标识集合,之后,基于第四特征数据标识集合中的特征数据标识,获取对应的行人图像的全部高维特征数据,得到目标特征数据集合。
其中,确定第一表项、第二表项和第三表项的方法、确定第一二进制码、第二二进制码和第三二进制码的方法、确定第一特征标识结合、第二特征标识集合和第三特征标识集合的方法以及根据第四特征数据标识集合确定目标特征数据集合的方法均可参考本步骤中前述的方法,本发明实施例不再赘述。
309:通过该目标特征数据集合确定行人检索结果。
通过步骤306-308,行人检索装置可以确定得到目标特征数据集合,该目标特征数据集合中的高维特征数据是经过局部敏感哈希值和二进制码两层筛选得到的,也即是,该目标特征数据集合中的高维特征数据即是筛选出的与目标行人图像相似的行人图像的高维特征数据。此时,行人检索装置通过该目标特征数据集合确定的行人检索结果即为与目标行人图像相似的行人检索结果。
具体的,行人检索装置通过目标特征数据集合确定行人检索结果的操作可以为:确定第一特征数据、第二特征数据和第三特征数据分别与目标特征数据集合中同一特征数据标识对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据之间的卡方距离,得到多个全身距离、多个上半身距离和多个下半身距离;将该多个全身距离、多个上半身距离和多个下半身距离中,属于同一特征数据标识对应的全身距离、上半身距离和下半身距离按照预设权重加权运算,得到目标特征数据集合包括的高维特征数据所属的每个特征数据标识对应的加权距离;基于存储的行人标识与特征数据标识之间的对应关系,从目标特征数据集合包括的高维特征数据所属的特征数据标识中选择属于同一行人标识的特征数据标识,得到多组特征数据标识,其中,每组特征数据标识对应同一行人标识;从多组特征数据标识中的每组特征数据标识对应的加权距离中选择最小的加权距离,得到多个最小加权距离,并对多个最小加权距离进行排序,得到排序结果;基于多个最小加权距离对应的特征数据标识,确定行人检索结果,并基于排序结果,显示行人检索结果。
其中,以第一特征数据为例,当第一特征数据包括多种特征的全身高维特征数据时,行人检索装置可以分别计算每一种特征的全身高维特征数据与目标特征数据集合中每个特征数据标识对应的该种特征的全身高维特征数据之间的卡方距离,从而得到每个特征数据标识对应的多种特征的全身距离,之后,行人检索装置可以将每个特征数据标识对应的多种特征的全身距离直接加和,得到多个全身距离,也可以将每个特征数据标识对应的多种特征的全身距离乘以预设的特征权重之后加和,得到多个全身距离,其中,多种特征的特征权重之和为1。
例如,假设第一特征数据包括颜色特征的全身高维特征数据x1和纹理特征的全身高维特征数据x2,目标特征数据集合中包括特征数据标识为ID1的颜色特征的全身高维特征数据y1和纹理特征的全身高维特征数据w1,行人检索装置可以计算x1与y1之间的卡方距离d1,计算x2与w1之间的卡方距离d2,之后,行人检索装置可以将d1与d2直接相加,得到特征数据标识ID1对应的全身距离为(d1+d2)。当然,如果每种特征均有预设的特征权重,例如,颜色特征的特征权重为p1,纹理特征的特征权重为p2,那么,得到特征数据标识ID1对应的全身距离可以为(p1d1+p2d2),其中,p1+p2=1。
需要说明的是,确定第二特征数据和第三特征数据分别与目标特征数据集合中同一特征数据标识对应的上半身高维特征数据和下半身高维特征数据之间的卡方距离,得到多个上半身距离和多个下半身距离的方式可以参照上述确定多个全身距离的方式。
另外,当确定了多个全身距离、多个上半身距离和多个下半身距离之后,行人检索装置可以将每个特征数据标识对应的全身距离乘以预设的全身权重,得到全身加权距离,将每个特征数据标识对应的上半身距离乘以预设的上半身权重,得到上半身加权距离,将每个特征数据标识对应的下半身距离乘以预设的下半身权重,得到下半身加权距离,之后,将得到的属于同一特征数据标识的全身加权距离、上半身加权距离和下半身加权距离相加,得到目标特征数据集合包括的高维特征数据所属的每个特征数据标识对应的加权距离。其中,全身权重、上半身权重和下半身权重之和为1。
由于同一行人可以对应多张行人图像,因此,目标特征数据集合中的某几个特征数据标识对应的高维特征数据很可能属于同一行人,为了最终输出的行人检索结果能为用户提供更多的选择性,且为了保证输出的行人检索结果中的每个行人的行人图像都是该行人的多个行人图像中与目标行人图像最相似的,行人检索装置可以基于存储的行人标识与特征数据标识之间的对应关系,从目标特征数据集合包括的高维特征数据所属的特征数据标识中选择属于同一行人标识的特征数据标识,得到多组特征数据标识,之后,从该多组特征数据标识中的每组特征数据标识对应的加权距离中选择最小的加权距离,得到多个最小加权距离。该多个最小加权距离对应的特征数据标识所对应的行人图像,即为每个行人的多张行人图像中与目标行人图像最为匹配的行人图像。之后,行人检索装置可以对该多个最小加权距离进行排序,得到排序结果,并按照该排序结果将行人检索结果依次进行显示。当然,如果确定的最小加权距离个数较多,那么,行人检索装置也可以根据排序结果,选取该排序结果中位于预设位数之前的最小加权距离对应的特征数据标识,确定行人检索结果,并将该行人检索结果按照排序结果中的顺序进行显示。
需要说明的是,行人检索装置可以基于多个最小加权距离对应的特征数据标识,从图像库中获取该特征数据标识对应的行人图像,同时,行人检索装置还可以根据特征数据标识对应的行人标识,从特征库中确定该行人在监控视频中所有出现的位置和时间等信息。之后,行人检索装置可以按照排序结果,将每个行人对应的行人图像、位置信息和时间信息进行显示。
在本发明实施例中,行人检索装置可以对多个行人图像提取多个全身高维特征数据、上半身高维特征数据和下半身高维特征数据,并通过局部敏感哈希值和二进制码构建索引,之后,当行人检索装置接收到检索请求时,可以根据目标行人图像,对存储的大量高维特征数据通过局部敏感哈希值和二进制码进行筛选,从而得到与目标行人图像相似的行人图像的目标特征数据集合,之后,行人检索装置可以根据该目标特征数据集合确定行人检索结果。由于行人检索结果是通过局部敏感哈希值和二进制码两种方式筛选得到的,因此保证了行人检索结果的精度,同时,由于提取的高维特征数据包括全身高维特征数据、上半身高维特征数据和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,也即是保证了检索的精度。另外,由于提取的高维特征数据包括不同特征的高维特征数据,因此,确定的行人检索结果与目标行人图像的多个特征均可以达到相似,进一步地提高了检索的精度。在上述保证了检索精度的基础上,由于行人检索装置对大量的高维特征数据的特征数据标识进行了两层筛选,因此,过滤掉了更多的噪声数据的特征数据标识,之后,基于该过滤后的特征数据标识获取高维特征数据以及行人检索结果时,极大的减少了数据加载的时间,提高了检索效率。
图4是本发明实施例提供的一种行人检索方法的流程图,该行人检索方法用于行人检索装置中,且在该方法中,行人检索装置通过局部敏感哈希值对存储的高维特征数据进行筛选。
在本发明实施例中,行人检索装置首先可以根据图3所示的步骤301-305的方法来构建索引。之后,通过步骤401-403来确定行人检索结果。
步骤401:提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,该目标行人图像为待检索的行人的图像,第一特征数据包括目标行人图像的至少一个全身高维特征数据,第二特征数据包括目标行人图像的至少一个上半身高维特征数据,第三特征数据包括目标行人图像的至少一个下半身高维特征数据。
其中,行人检索装置在接收到目标行人图像后,提取目标行人图像的第一特征数据、第二特征数据和第三特征数据的方法可以参考图3所示的步骤306中的方法,本发明实施例不再赘述。
步骤402:确定第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值。
当提取到目标行人图像的第一特征数据、第二特征数据和第三特征数据之后,行人检索装置可以基于第一特征数据,计算得到第一特征数据包含的多个全身高维特征数据对应的多个局部敏感哈希值;基于第二特征数据,计算得到第二特征数据包含的多个上半身高维特征数据对应的多个局部敏感哈希值;基于第三特征数据,计算得到第三特征数据包含的多个下半身高维特征数据对应的局部敏感哈希值。
其中,行人检索装置根据第一特征数据、第二特征数据和第三特征数据计算局部敏感哈希值的方法可以参照图3所示的方法中步骤303中计算局部敏感哈希值的方法进行计算,本发明实施例不再赘述。
步骤403:基于第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值,对存储的高维特征数据进行筛选,得到目标特征数据集合,并通过该目标特征数据集合确定行人检索结果,该目标特征数据集合中包括的高维特征数据对应的局部敏感哈希值与第一特征数据、第二特征数据和第三特征数据中任一特征数据对应的局部敏感哈希值相同。
当确定第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值之后,行人检索装置可以通过以下操作来对存储的高维特征数据进行筛选,从而得到目标特征数据集合。
(1)从存储的全身局部敏感哈希表包括的多个表项中,选择对应的敏感哈希值与第一特征数据对应的局部敏感哈希值相同的表项,得到第一表项,其中,全身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储有多个特征数据标识。
(2)从存储的上半身局部敏感哈希表包括的多个表项中,选择对应的敏感哈希值与第二特征数据对应的局部敏感哈希值相同的表项,得到第二表项,该上半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识。
(3)从存储的下半身局部敏感哈希表包括的多个表项中,选择对应的敏感哈希值与第三特征数据对应的局部敏感哈希值相同的表项,得到第三表项,该下半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识。
(4)当得到第一表项、第二表项和第三表项之后,由于同一行人图像的所有高维特征数据对应的特征数据标识均相同,因此,得到的第一表项、第二表项和第三表项中可能存在有相同的特征数据标识,因此,行人检索装置可以将第一表项、第二表项和第三表项中相同的特征数据标识去重,得到第五特征数据标识集合。
(5)基于第五特征数据标识集合中的每一个特征数据标识,从存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到目标特征数据集合。
其中,上述(1)-(5)的具体实现方法可以参考图3所示的步骤308中相关方法,本发明实施例不再赘述。
需要说明的是,由于第五特征数据标识集合是通过局部敏感哈希值筛选得到的,因此滤除了大量的噪声数据的特征数据标识。这样,当通过该第五特征数据标识集合去获取目标特征数据时,行人检索装置就可以减少加载高维特征数据的次数,从而提高了检索效率。
当确定了目标特征数据集合之后,行人检索装置可以根据图3所示的步骤309中的方法,确定行人检索结果。
在本发明实施例中,行人检索装置可以根据提取到的目标行人图像的多个全身高维特征数据、上半身高维特征数据和下半身高维特征数据,通过局部敏感哈希值对存储的高维特征数据进行筛选,从而确定行人检索结果。由于提取的高维特征数据包括全身高维特征数据、上半身高维特征数据和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,保证了检索的精度。同时,行人检索装置可以通过局部敏感哈希值对大量的高维特征数据的特征数据标识进行了筛选,因此,过滤掉了噪声数据的特征数据标识,之后,基于该过滤后的特征数据标识获取高维特征数据以及行人检索结果时,减少了数据加载的时间,提高了检索效率。
图5是本发明实施例提供的一种行人检索方法的流程图,该方法用于行人检索装置,在该方法中,行人检索装置通过二进制码对存储的高维特征数据进行筛选,参见图5,该方法包括:
在本发明实施例中,行人检索装置首先可以根据图3所示的步骤301-305中的方法来构建索引。之后,通过步骤501-503来确定行人检索结果。
步骤501:提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,该目标行人图像为待检索的行人的图像,第一特征数据包括该目标行人图像的至少一个全身高维特征数据,第二特征数据包括该目标行人图像的至少一个上半身高维特征数据,第三特征数据包括该目标行人图像的至少一个下半身高维特征数据。
其中,行人检索装置在接收到目标行人图像后,提取目标行人图像的第一特征数据、第二特征数据和第三特征数据的方法可以参考图3所示的步骤306的方法,本发明实施例不再赘述。
步骤502:确定第一特征数据、第二特征数据和第三特征数据分别对应的二进制码。
当提取到目标行人图像的第一特征数据、第二特征数据和第三特征数据之后,行人检索装置可以基于第一特征数据,计算得到第一特征数据包含的多个全身高维特征数据对应的多个二进制码;基于第二特征数据,计算得到第二特征数据包含的多个上半身高维特征数据对应的二进制码;基于第三特征数据,计算得到第三特征数据包含的多个下半身高维特征数据对应的二进制码。
其中,行人检索装置可以通过图3所示的步骤303中的公式(2)计算第一特征数据包含的多个全身高维特征数据对应的多个二进制码,根据图3所示的步骤303中的公式(3)分别计算第二特征数据和第三特征数据对应的多个二进制码。
步骤503:基于第一特征数据、第二特征数据和第三特征数据分别对应的二进制码,对存储的高维特征数据进行筛选,得到目标特征数据集合,并通过该目标特征数据集合确定行人检索结果,该目标特征数据集合包括筛选出的与第一特征数据、第二特征数据和第三特征数据均匹配的行人图像的高维特征数据。
当确定第一特征数据、第二特征数据和第三特征数据分别对应的二进制码之后,行人检索装置可以通过以下操作来对存储的高维特征数据进行筛选,从而得到目标特征数据集合。
(1)从存储的全身特征数据标识与二进制码的对应关系中获取存储的高维特征数据中全身高维特征数据对应的二进制码,并确定第一特征数据对应的二进制码与获取到的二进制码之间的海明距离,得到多个第四海明距离,生成第六特征数据标识集合。该第六特征数据标识集合包括用于确定多个第四海明距离中小于第一阈值的海明距离的二进制码对应的特征数据标识。
(2)从存储的上半身特征数据标识与二进制码的对应关系中获取存储的高维特征数据中上半身高维特征数据对应的二进制码,并确定第二特征数据对应的二进制码与获取到的二进制码之间的海明距离,得到多个第五海明距离,生成第七特征数据标识集合。该第七特征数据标识集合包括用于确定多个第五海明距离中小于第二阈值的海明距离的二进制码对应的特征数据标识。
(3)从存储的下半身特征数据标识与二进制码的对应关系中获取存储的高维特征数据中下半身高维特征数据对应的二进制码,并确定第三特征数据对应的二进制码与获取到的二进制码之间的海明距离,得到多个第六海明距离,生成第八特征数据标识集合。该第八特征数据标识集合包括用于确定多个第六海明距离中小于第三阈值的海明距离的二进制码对应的特征数据标识。
(4)当得到第六特征数据标识集合、第七特征数据标识集合和第八特征数据标识集合之后,由于同一行人图像的所有高维特征数据对应的特征数据标识均相同,因此,得到的第六特征数据标识集合、第七特征数据标识集合和第八特征数据标识集合中可能存在有相同的特征数据标识,因此,行人检索装置可以将第六特征数据标识集合、第七特征数据标识集合和第八特征数据标识集合中相同的特征数据标识去重,得到第九特征数据标识集合。
(5)基于第九特征数据标识集合中的特征数据标识,从存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到目标特征数据集合。
其中,上述(1)-(5)的具体实现方法可以参考图3所示的步骤308中相关方法,本发明实施例不再赘述。
需要说明的是,由于第九特征数据标识集合是通过二进制码筛选得到的,因此滤除了大量的噪声数据的特征数据标识。这样,当通过该第九特征数据标识集合去获取目标特征数据时,行人检索装置就可以减少加载高维特征数据的次数,从而提高了检索效率。
当确定了目标特征数据集合之后,行人检索装置可以根据图3所示的步骤309中的方法,确定行人检索结果。
在本发明实施例中,行人检索装置可以根据提取到的目标行人图像的多个全身高维特征数据、上半身高维特征数据和下半身高维特征数据,通过二进制码对存储的高维特征数据进行筛选,从而确定行人检索结果。由于提取的高维特征数据包括全身高维特征数据、上半身高维特征数据和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,保证了检索的精度。同时,行人检索装置可以通过二进制码对大量的高维特征数据的特征数据标识进行了筛选,因此,过滤掉了部分噪声数据的特征数据标识,之后,基于该过滤后的特征数据标识获取高维特征数据以及行人检索结果时,减少了特征数据加载的时间,提高了检索效率。
图6A是本发明实施例提供的一种行人检索装置示意图,参见图6A,该行人检索装置用于执行上述图3或图4或图5所示的方法,该行人检索装置包括第一提取模块601、筛选模块602和第一确定模块603:
第一提取模块601,用于执行上述实施例中步骤306或步骤401或步骤501;
筛选模块602,用于执行上述实施例中步骤307-308,或者步骤402-403,或者步骤502-503;
第一确定模块603,用于执行上述实施例中步骤309。
可选地,筛选模块602包括:
第一确定单元,用于确定第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值;
筛选单元,用于基于第一特征数据、第二特征数据和第三特征数据分别对应的局部敏感哈希值,对存储的高维特征数据进行筛选,得到目标特征数据集合,目标特征数据集合中包括的任一高维特征数据对应的局部敏感哈希值与第一特征数据、第二特征数据和第三特征数据中至少一个特征数据对应的局部敏感哈希值相同。
可选地,筛选单元具体用于:
确定第一特征数据、第二特征数据和第三特征数据分别对应的二进制码;
从存储的全身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与第一特征数据对应的局部敏感哈希值相同的表项,得到第一表项,全身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的上半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与第二特征数据对应的局部敏感哈希值相同的表项,得到第二表项,上半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的下半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与第三特征数据对应的局部敏感哈希值相同的表项,得到第三表项,下半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
基于第一表项中存储的多个特征数据标识,从存储的全身特征数据标识与二进制码之间的对应关系中,确定多个第一二进制码,基于第二表项中存储的多个特征数据标识,从存储的上半身特征数据标识与二进制码之间的对应关系中,确定多个第二二进制码,基于第三表项中存储的多个特征数据标识,从存储的下半身特征数据标识与二进制码之间的对应关系中,确定多个第三二进制码;
基于第一特征数据、第二特征数据和第三特征数据分别对应的二进制码,以及多个第一二进制码、多个第二二进制码和多个第三二进制码,从存储的高维特征数据中确定目标特征数据集合。
可选地,筛选单元还用于:
确定第一特征数据对应的二进制码与多个第一二进制码之间的海明距离,得到多个第一海明距离,生成第一特征数据标识集合,第一特征数据标识集合包括用于确定多个第一海明距离中小于第一阈值的海明距离的第一二进制码对应的特征数据标识;
确定第二特征数据对应的二进制码与多个第二二进制码之间的海明距离,得到多个第二海明距离,生成第二特征数据标识集合,第二特征数据标识集合包括用于确定多个第二海明距离中小于第二阈值的海明距离的第二二进制码对应的特征数据标识;
确定第三特征数据对应的二进制码与多个第三二进制码之间的海明距离,得到多个第三海明距离,生成第三特征数据标识集合,第三特征数据标识集合包括用于确定多个第三海明距离中小于第三阈值的海明距离的第三二进制码对应的特征数据标识;
对第一特征数据标识集合、第二特征数据标识集合和第三特征数据标识集合中相同的特征数据标识去重,得到第四特征数据标识集合,其中,同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
基于第四特征数据标识集合中的每个特征数据标识,从存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到目标特征数据集合。
可选地,第一确定模块603包括:
第二确定单元,用于确定第一特征数据、第二特征数据和第三特征数据分别与目标特征数据集合中同一特征数据标识对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据之间的卡方距离,得到多个全身距离、多个上半身距离和多个下半身距离;
运算单元,用于将多个全身距离、多个上半身距离和多个下半身距离中,属于同一特征数据标识对应的全身距离、上半身距离和下半身距离按照预设权重加权运算,得到目标特征数据集合包括的高维特征数据所属的每个特征数据标识对应的加权距离;
第一选择单元,用于基于存储的行人标识与特征数据标识之间的对应关系,从目标特征数据集合包括的高维特征数据所属的特征数据标识中选择属于同一行人标识的特征数据标识,得到多组特征数据标识,每组特征数据标识对应同一行人标识;
第二选择单元,用于从多组特征数据标识中的每组特征数据标识对应的加权距离中选择最小的加权距离,得到多个最小加权距离;
排序单元,用于对多个最小加权距离进行排序,得到排序结果;
第三确定单元,用于基于多个最小加权距离对应的特征数据标识,确定行人检索结果;
显示单元,用于基于排序结果,显示行人检索结果。
可选地,参见图6B,该行人检索装置还包括:
获取模块604,用于获取监控视频包含的视频帧图像中的行人图像,得到多个行人图像;
第二提取模块605,用于对于多个行人图像中的每个行人图像,分别提取行人图像的第四特征数据、第五特征数据和第六特征数据,第四特征数据包括行人图像的至少一个全身高维特征数据,第五特征数据包括行人图像的至少一个上半身高维特征数据,第六特征数据包括行人图像的至少一个下半身高维特征数据;
第二确定模块606,用于确定第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码;
分配模块607,用于为多个行人图像中每个行人图像的高维特征数据分配特征数据标识,且同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
创建模块608,用于基于每个行人图像的高维特征数据的特征数据标识以及第四特征数据、第五特征数据和第六特征数据分别对应的局部敏感哈希值和二进制码,创建全身局部敏感哈希表、上半身局部敏感哈希表和下半身局部敏感哈希表以及全身特征数据标识与二进制码之间的对应关系、上半身特征数据标识与二进制码之间的对应关系和下半身特征数据标识与二进制码之间的对应关系。
可选地,创建模块608包括:
第一创建单元,用于将多个行人图像的第四特征数据划分为多组,且每组第四特征数据对应的局部敏感哈希值相同,并将同一组第四特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的全身局部敏感哈希表,将多个行人图像的第五特征数据划分为多组,且每组第五特征数据对应的局部敏感哈希值相同,并将同一组第五特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的上半身局部敏感哈希表,将多个行人图像的第六特征数据划分为多组,且每组第六特征数据对应的局部敏感哈希值相同,并将同一组第六特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的下半身局部敏感哈希表;
第二创建单元,用于将多个行人图像的第四特征数据的特征数据标识和对应的二进制码对应存储,以创建得到全身特征数据标识与二进制码之间的对应关系,将多个行人图像的第五特征数据的特征数据标识和对应的二进制码对应存储,以创建得到上半身特征数据标识与二进制码之间的对应关系,将多个行人图像的第六特征数据的特征数据标识和对应的二进制码对应存储,以创建得到下半身高特征数据标识与二进制码之间的对应关系。
综上所述,在本发明实施例中,行人检索装置可以对多个行人图像提取多个全身高维特征数据、上半身高维特征数据和下半身高维特征数据,并通过局部敏感哈希值和二进制码构建索引,之后,当行人检索装置接收到检索请求时,可以根据目标行人图像,对存储的大量高维特征数据通过局部敏感哈希值和二进制码进行筛选,从而得到与目标行人图像相似的行人图像的目标特征数据集合,之后,行人检索装置可以根据该目标特征数据集合确定行人检索结果。由于提取的高维特征数据包括全身高维特征数据、上半身高维特征数据和下半身高维特征数据,因此,基于提取到的高维特征数据确定的行人检索结果可以保证全身、上半身和下半身同时相似,保证了检索的精度。同时,由于行人检索结果是通过局部敏感哈希值和二进制码两种方式筛选得到的,进一步保证了行人检索结果的精度,另外,由于提取的高维特征数据包括不同特征的高维特征数据,因此,确定的行人检索结果与目标行人图像的多个特征均可以达到相似,进一步地提高了检索的精度。在上述保证了检索精度的基础上,由于行人检索装置对大量的高维特征数据的特征数据标识进行了两层筛选,因此,过滤掉了更多的噪声数据的特征数据标识,之后,基于该过滤后的特征数据标识获取高维特征数据以及行人检索结果时,极大的减少了数据加载的时间,提高了检索效率。
需要说明的是:上述实施例提供的行人检索装置在进行行人检索时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将行人检索装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的行人检索装置与行人检索方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如:同轴电缆、光纤、数据用户线(Digital Subscriber Line,DSL))或无线(例如:红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如:软盘、硬盘、磁带)、光介质(例如:数字通用光盘(Digital Versatile Disc,DVD))、或者半导体介质(例如:固态硬盘(Solid State Disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述为本申请提供的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (14)

1.一种行人检索方法,其特征在于,所述方法包括:
提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,所述目标行人图像为待检索的行人的图像,所述第一特征数据包括所述目标行人图像的至少一个全身高维特征数据,所述第二特征数据包括所述目标行人图像的至少一个上半身高维特征数据,所述第三特征数据包括所述目标行人图像的至少一个下半身高维特征数据;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据,对存储的高维特征数据进行筛选,得到目标特征数据集合,并通过所述目标特征数据集合确定行人检索结果,所述目标特征数据集合包括筛选出的与所述第一特征数据、所述第二特征数据和所述第三特征数据均匹配的行人图像的高维特征数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据,对存储的高维特征数据进行筛选,得到目标特征数据集合,包括:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对所述存储的高维特征数据进行筛选,得到所述目标特征数据集合,所述目标特征数据集合中包括的任一高维特征数据对应的局部敏感哈希值与所述第一特征数据、所述第二特征数据和所述第三特征数据中至少一个特征数据对应的局部敏感哈希值相同。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对所述存储的高维特征数据进行筛选,得到所述目标特征数据集合,包括:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码;
从存储的全身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第一特征数据对应的局部敏感哈希值相同的表项,得到第一表项,所述全身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的上半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第二特征数据对应的局部敏感哈希值相同的表项,得到第二表项,所述上半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的下半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第三特征数据对应的局部敏感哈希值相同的表项,得到第三表项,所述下半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
基于所述第一表项中存储的多个特征数据标识,从存储的全身特征数据标识与二进制码之间的对应关系中,确定多个第一二进制码,基于所述第二表项中存储的多个特征数据标识,从存储的上半身特征数据标识与二进制码之间的对应关系中,确定多个第二二进制码,基于所述第三表项中存储的多个特征数据标识,从存储的下半身特征数据标识与二进制码之间的对应关系中,确定多个第三二进制码;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码,以及所述多个第一二进制码、所述多个第二二进制码和所述多个第三二进制码,从所述存储的高维特征数据中确定所述目标特征数据集合。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码,以及所述多个第一二进制码、所述多个第二二进制码和所述多个第三二进制码,从所述存储的高维特征数据中确定所述目标特征数据集合,包括:
确定所述第一特征数据对应的二进制码与所述多个第一二进制码之间的海明距离,得到多个第一海明距离,生成第一特征数据标识集合,所述第一特征数据标识集合包括用于确定所述多个第一海明距离中小于第一阈值的海明距离的第一二进制码对应的特征数据标识;
确定所述第二特征数据对应的二进制码与所述多个第二二进制码之间的海明距离,得到多个第二海明距离,生成第二特征数据标识集合,所述第二特征数据标识集合包括用于确定所述多个第二海明距离中小于第二阈值的海明距离的第二二进制码对应的特征数据标识;
确定所述第三特征数据对应的二进制码与所述多个第三二进制码之间的海明距离,得到多个第三海明距离,生成第三特征数据标识集合,所述第三特征数据标识集合包括用于确定所述多个第三海明距离中小于第三阈值的海明距离的第三二进制码对应的特征数据标识;
对所述第一特征数据标识集合、所述第二特征数据标识集合和所述第三特征数据标识集合中相同的特征数据标识去重,得到第四特征数据标识集合,其中,同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
基于所述第四特征数据标识集合中的每个特征数据标识,从所述存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到所述目标特征数据集合。
5.根据权利要求1-4任一所述的方法,其特征在于,所述通过所述目标特征数据集合确定行人检索结果,包括:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别与所述目标特征数据集合中同一特征数据标识对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据之间的卡方距离,得到多个全身距离、多个上半身距离和多个下半身距离;
将所述多个全身距离、所述多个上半身距离和所述多个下半身距离中,属于同一特征数据标识对应的全身距离、上半身距离和下半身距离按照预设权重加权运算,得到所述目标特征数据集合包括的高维特征数据所属的每个特征数据标识对应的加权距离;
基于存储的行人标识与特征数据标识之间的对应关系,从所述目标特征数据集合包括的高维特征数据所属的特征数据标识中选择属于同一行人标识的特征数据标识,得到多组特征数据标识,每组特征数据标识对应同一行人标识;
从所述多组特征数据标识中的每组特征数据标识对应的加权距离中选择最小的加权距离,得到多个最小加权距离,并对所述多个最小加权距离进行排序,得到排序结果;
基于所述多个最小加权距离对应的特征数据标识,确定所述行人检索结果,并基于所述排序结果,显示所述行人检索结果。
6.根据权利要求3-4任一所述的方法,其特征在于,所述基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对所述存储的高维特征数据进行筛选,得到所述目标特征数据集合之前,还包括:
获取监控视频包含的视频帧图像中的行人图像,得到多个行人图像;
对于所述多个行人图像中的每个行人图像,分别提取所述行人图像的第四特征数据、第五特征数据和第六特征数据,所述第四特征数据包括所述行人图像的至少一个全身高维特征数据,所述第五特征数据包括所述行人图像的至少一个上半身高维特征数据,所述第六特征数据包括所述行人图像的至少一个下半身高维特征数据;
确定所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码;
为所述多个行人图像中每个行人图像的高维特征数据分配特征数据标识,且同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
基于每个行人图像的高维特征数据的特征数据标识以及所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码,创建所述全身局部敏感哈希表、所述上半身局部敏感哈希表和所述下半身局部敏感哈希表以及所述全身特征数据标识与二进制码之间的对应关系、所述上半身特征数据标识与二进制码之间的对应关系和所述下半身特征数据标识与二进制码之间的对应关系。
7.根据权利要求6所述的方法,其特征在于,所述基于每个行人图像的高维特征数据的特征数据标识以及所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码,创建所述全身局部敏感哈希表、所述上半身局部敏感哈希表和所述下半身局部敏感哈希表以及所述全身特征数据标识与二进制码之间的对应关系、所述上半身特征数据标识与二进制码之间对应关系和所述下半身特征数据标识与二进制码之间的对应关系,包括:
将所述多个行人图像的第四特征数据划分为多组,且每组第四特征数据对应的局部敏感哈希值相同,并将同一组第四特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述全身局部敏感哈希表,将所述多个行人图像的第五特征数据划分为多组,且每组第五特征数据对应的局部敏感哈希值相同,并将同一组第五特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述上半身局部敏感哈希表,将所述多个行人图像的第六特征数据划分为多组,且每组第六特征数据对应的局部敏感哈希值相同,并将同一组第六特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述下半身局部敏感哈希表;
将所述多个行人图像的第四特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述全身特征数据标识与二进制码之间的对应关系,将所述多个行人图像的第五特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述上半身特征数据标识与二进制码之间的对应关系,将所述多个行人图像的第六特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述下半身特征数据标识与二进制码之间的对应关系。
8.一种行人检索装置,其特征在于,所述装置包括:
第一提取模块,用于提取目标行人图像的第一特征数据、第二特征数据和第三特征数据,所述目标行人图像为待检索的行人的图像,所述第一特征数据包括所述目标行人图像的至少一个全身高维特征数据,所述第二特征数据包括所述目标行人图像的至少一个上半身高维特征数据,所述第三特征数据包括所述目标行人图像的至少一个下半身高维特征数据;
筛选模块,用于基于所述第一特征数据、所述第二特征数据和所述第三特征数据,对存储的高维特征数据进行筛选,得到目标特征数据集合,所述目标特征数据集合包括筛选出的与所述第一特征数据、所述第二特征数据和所述第三特征数据均匹配的行人图像的高维特征数据;
第一确定模块,用于通过所述目标特征数据集合确定行人检索结果。
9.根据权利要求8所述的装置,其特征在于,所述筛选模块包括:
第一确定单元,用于确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值;
筛选单元,用于基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的局部敏感哈希值,对所述存储的高维特征数据进行筛选,得到所述目标特征数据集合,所述目标特征数据集合中包括的任一高维特征数据对应的局部敏感哈希值与所述第一特征数据、所述第二特征数据和所述第三特征数据中至少一个特征数据对应的局部敏感哈希值相同。
10.根据权利要求9所述的装置,其特征在于,所述筛选单元具体用于:
确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码;
从存储的全身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第一特征数据对应的局部敏感哈希值相同的表项,得到第一表项,所述全身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的上半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第二特征数据对应的局部敏感哈希值相同的表项,得到第二表项,所述上半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
从存储的下半身局部敏感哈希表包括的多个表项中,选择对应的局部敏感哈希值与所述第三特征数据对应的局部敏感哈希值相同的表项,得到第三表项,所述下半身局部敏感哈希表包括的多个表项与多个局部敏感哈希值一一对应,且每个表项中存储多个特征数据标识;
基于所述第一表项中存储的多个特征数据标识,从存储的全身特征数据标识与二进制码之间的对应关系中,确定多个第一二进制码,基于所述第二表项中存储的多个特征数据标识,从存储的上半身特征数据标识与二进制码之间的对应关系中,确定多个第二二进制码,基于所述第三表项中存储的多个特征数据标识,从存储的下半身特征数据标识与二进制码之间的对应关系中,确定多个第三二进制码;
基于所述第一特征数据、所述第二特征数据和所述第三特征数据分别对应的二进制码,以及所述多个第一二进制码、所述多个第二二进制码和所述多个第三二进制码,从所述存储的高维特征数据中确定所述目标特征数据集合。
11.根据权利要求10所述的装置,其特征在于,所述筛选单元还用于:
确定所述第一特征数据对应的二进制码与所述多个第一二进制码之间的海明距离,得到多个第一海明距离,生成第一特征数据标识集合,所述第一特征数据标识集合包括用于确定所述多个第一海明距离中小于第一阈值的海明距离的第一二进制码对应的特征数据标识;
确定所述第二特征数据对应的二进制码与所述多个第二二进制码之间的海明距离,得到多个第二海明距离,生成第二特征数据标识集合,所述第二特征数据标识集合包括用于确定所述多个第二海明距离中小于第二阈值的海明距离的第二二进制码对应的特征数据标识;
确定所述第三特征数据对应的二进制码与所述多个第三二进制码之间的海明距离,得到多个第三海明距离,生成第三特征数据标识集合,所述第三特征数据标识集合包括用于确定所述多个第三海明距离中小于第三阈值的海明距离的第三二进制码对应的特征数据标识;
对所述第一特征数据标识集合、所述第二特征数据标识集合和所述第三特征数据标识集合中相同的特征数据标识去重,得到第四特征数据标识集合,其中,同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
基于所述第四特征数据标识集合中的每个特征数据标识,从所述存储的高维特征数据中获取对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据,得到所述目标特征数据集合。
12.根据权利要求8-11任一所述的装置,其特征在于,所述第一确定模块包括:
第二确定单元,用于确定所述第一特征数据、所述第二特征数据和所述第三特征数据分别与所述目标特征数据集合中同一特征数据标识对应的全身高维特征数据、上半身高维特征数据和下半身高维特征数据之间的卡方距离,得到多个全身距离、多个上半身距离和多个下半身距离;
运算单元,用于将所述多个全身距离、所述多个上半身距离和所述多个下半身距离中,属于同一特征数据标识对应的全身距离、上半身距离和下半身距离按照预设权重加权运算,得到所述目标特征数据集合包括的高维特征数据所属的每个特征数据标识对应的加权距离;
第一选择单元,用于基于存储的行人标识与特征数据标识之间的对应关系,从所述目标特征数据集合包括的高维特征数据所属的特征数据标识中选择属于同一行人标识的特征数据标识,得到多组特征数据标识,每组特征数据标识对应同一行人标识;
第二选择单元,用于从所述多组特征数据标识中的每组特征数据标识对应的加权距离中选择最小的加权距离,得到多个最小加权距离;
排序单元,用于对所述多个最小加权距离进行排序,得到排序结果;
第三确定单元,用于基于所述多个最小加权距离对应的特征数据标识,确定所述行人检索结果;
显示单元,用于基于所述排序结果,显示所述行人检索结果。
13.根据权利要求10-11任一所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取监控视频包含的视频帧图像中的行人图像,得到多个行人图像;
第二提取模块,用于对于所述多个行人图像中的每个行人图像,分别提取所述行人图像的第四特征数据、第五特征数据和第六特征数据,所述第四特征数据包括所述行人图像的至少一个全身高维特征数据,所述第五特征数据包括所述行人图像的至少一个上半身高维特征数据,所述第六特征数据包括所述行人图像的至少一个下半身高维特征数据;
第二确定模块,用于确定所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码;
分配模块,用于为所述多个行人图像中每个行人图像的高维特征数据分配特征数据标识,且同一行人图像的全身高维特征数据、上半身高维特征数据和下半身高维特征数据的特征数据标识相同;
创建模块,用于基于每个行人图像的高维特征数据的特征数据标识以及所述第四特征数据、所述第五特征数据和所述第六特征数据分别对应的局部敏感哈希值和二进制码,创建所述全身局部敏感哈希表、所述上半身局部敏感哈希表和所述下半身局部敏感哈希表以及所述全身特征数据标识与二进制码之间的对应关系、所述上半身特征数据标识与二进制码之间的对应关系和所述下半身特征数据标识与二进制码之间的对应关系。
14.根据权利要求13所述的装置,其特征在于,所述创建模块包括:
第一创建单元,用于将所述多个行人图像的第四特征数据划分为多组,且每组第四特征数据对应的局部敏感哈希值相同,并将同一组第四特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述全身局部敏感哈希表,将所述多个行人图像的第五特征数据划分为多组,且每组第五特征数据对应的局部敏感哈希值相同,并将同一组第五特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述上半身局部敏感哈希表,将所述多个行人图像的第六特征数据划分为多组,且每组第六特征数据对应的局部敏感哈希值相同,并将同一组第六特征数据的特征数据标识存储在同一个表项中,以创建得到包括多个表项的所述下半身局部敏感哈希表;
第二创建单元,用于将所述多个行人图像的第四特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述全身特征数据标识与二进制码之间的对应关系,将所述多个行人图像的第五特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述上半身特征数据标识与二进制码之间的对应关系,将所述多个行人图像的第六特征数据的特征数据标识和对应的二进制码对应存储,以创建得到所述下半身特征数据标识与二进制码之间的对应关系。
CN201710166417.9A 2017-03-20 2017-03-20 一种行人检索方法及装置 Pending CN108629233A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710166417.9A CN108629233A (zh) 2017-03-20 2017-03-20 一种行人检索方法及装置
EP18771586.7A EP3582138A4 (en) 2017-03-20 2018-03-05 PEDESTRIAN SEARCHING METHOD AND APPARATUS
PCT/CN2018/078022 WO2018171412A1 (zh) 2017-03-20 2018-03-05 一种行人检索方法及装置
US16/576,158 US11250250B2 (en) 2017-03-20 2019-09-19 Pedestrian retrieval method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710166417.9A CN108629233A (zh) 2017-03-20 2017-03-20 一种行人检索方法及装置

Publications (1)

Publication Number Publication Date
CN108629233A true CN108629233A (zh) 2018-10-09

Family

ID=63584942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710166417.9A Pending CN108629233A (zh) 2017-03-20 2017-03-20 一种行人检索方法及装置

Country Status (4)

Country Link
US (1) US11250250B2 (zh)
EP (1) EP3582138A4 (zh)
CN (1) CN108629233A (zh)
WO (1) WO2018171412A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222775A (zh) * 2019-06-10 2019-09-10 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN110334687A (zh) * 2019-07-16 2019-10-15 合肥工业大学 一种基于行人检测、属性学习和行人识别的行人检索增强方法
CN111178369A (zh) * 2019-12-11 2020-05-19 中国科学院苏州生物医学工程技术研究所 一种医学影像的识别方法及系统、电子设备、存储介质
CN111476070A (zh) * 2019-01-24 2020-07-31 深圳市商汤科技有限公司 图像处理方法、装置、电子设备以及计算机可读存储介质
CN112528078A (zh) * 2020-12-16 2021-03-19 杭州海康威视数字技术股份有限公司 一种图像归档方法、装置及设备
WO2022021956A1 (zh) * 2020-07-29 2022-02-03 华为技术有限公司 数据库更新方法、设备以及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711267A (zh) * 2018-12-03 2019-05-03 浙江大华技术股份有限公司 一种行人重识别、行人运动轨迹生成方法及装置
CN109670419B (zh) * 2018-12-04 2023-05-23 天津津航技术物理研究所 一种基于周界安防视频监控系统的行人检测方法
CN113821630B (zh) * 2020-06-19 2023-10-17 菜鸟智能物流控股有限公司 一种数据聚类的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207898A (zh) * 2013-03-19 2013-07-17 天格科技(杭州)有限公司 一种基于局部敏感哈希的相似人脸快速检索方法
KR20140077409A (ko) * 2012-12-14 2014-06-24 포항공과대학교 산학협력단 다수의 특징을 이용한 순차적 바이너리 코드 학습 방법 및 학습 장치
CN104199827A (zh) * 2014-07-24 2014-12-10 北京大学 基于局部敏感哈希的大规模多媒体数据的高维索引方法
CN105630906A (zh) * 2015-12-21 2016-06-01 苏州科达科技股份有限公司 一种人员搜索方法、装置及系统
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241377A (ja) * 2006-03-06 2007-09-20 Sony Corp 検索システム、撮像装置、データ保存装置、情報処理装置、撮像画像処理方法、情報処理方法、プログラム
CN101859320B (zh) 2010-05-13 2012-05-30 复旦大学 一种基于多特征签名的海量图像检索方法
CN102385695A (zh) * 2010-09-01 2012-03-21 索尼公司 人体三维姿势识别方法和装置
JP5712968B2 (ja) * 2012-05-31 2015-05-07 株式会社デンソー 人検出装置
JP6100635B2 (ja) * 2012-12-13 2017-03-22 株式会社デンソー 移動体検出装置
CN103336801B (zh) 2013-06-20 2016-08-10 河海大学 基于多特征lsh索引组合的遥感图像检索方法
SG11201607875WA (en) * 2014-03-31 2016-11-29 Hitachi Int Electric Inc Personal safety verification system and similarity search method for data encrypted for confidentiality
CN104376334B (zh) * 2014-11-12 2018-05-29 上海交通大学 一种多尺度特征融合的行人比对方法
CN104484425A (zh) 2014-12-20 2015-04-01 辽宁师范大学 基于多特征的彩色图像检索方法
CN105095435A (zh) * 2015-07-23 2015-11-25 北京京东尚科信息技术有限公司 一种图像高维特征的相似比较方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140077409A (ko) * 2012-12-14 2014-06-24 포항공과대학교 산학협력단 다수의 특징을 이용한 순차적 바이너리 코드 학습 방법 및 학습 장치
CN103207898A (zh) * 2013-03-19 2013-07-17 天格科技(杭州)有限公司 一种基于局部敏感哈希的相似人脸快速检索方法
CN104199827A (zh) * 2014-07-24 2014-12-10 北京大学 基于局部敏感哈希的大规模多媒体数据的高维索引方法
CN105630906A (zh) * 2015-12-21 2016-06-01 苏州科达科技股份有限公司 一种人员搜索方法、装置及系统
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吕月明: "基于非对称哈希算法的大规模图像检索的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111476070A (zh) * 2019-01-24 2020-07-31 深圳市商汤科技有限公司 图像处理方法、装置、电子设备以及计算机可读存储介质
CN110222775A (zh) * 2019-06-10 2019-09-10 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN110334687A (zh) * 2019-07-16 2019-10-15 合肥工业大学 一种基于行人检测、属性学习和行人识别的行人检索增强方法
CN111178369A (zh) * 2019-12-11 2020-05-19 中国科学院苏州生物医学工程技术研究所 一种医学影像的识别方法及系统、电子设备、存储介质
CN111178369B (zh) * 2019-12-11 2023-12-19 中国科学院苏州生物医学工程技术研究所 一种医学影像的识别方法及系统、电子设备、存储介质
WO2022021956A1 (zh) * 2020-07-29 2022-02-03 华为技术有限公司 数据库更新方法、设备以及存储介质
CN112528078A (zh) * 2020-12-16 2021-03-19 杭州海康威视数字技术股份有限公司 一种图像归档方法、装置及设备
CN112528078B (zh) * 2020-12-16 2023-04-25 杭州海康威视数字技术股份有限公司 一种图像归档方法、装置及设备

Also Published As

Publication number Publication date
EP3582138A1 (en) 2019-12-18
US20200012849A1 (en) 2020-01-09
EP3582138A4 (en) 2020-03-25
US11250250B2 (en) 2022-02-15
WO2018171412A1 (zh) 2018-09-27

Similar Documents

Publication Publication Date Title
CN108629233A (zh) 一种行人检索方法及装置
US7826657B2 (en) Automatically generating a content-based quality metric for digital images
US8643646B2 (en) Constructing a cell-based cluster of data records of a scatter plot
US10074027B2 (en) Density sampling map data
CN109447186A (zh) 聚类方法及相关产品
CN109871208A (zh) 软件系统生成方法、装置、计算机可读存储介质及服务器
CN104598557A (zh) 数据栅格化、用户行为分析的方法和装置
CN109582849A (zh) 一种基于知识图谱的网络资源智能检索方法
CN112463859B (zh) 基于大数据和业务分析的用户数据处理方法及服务器
CN107729848A (zh) 对象检测方法及装置
CN108566620A (zh) 一种基于wifi的室内定位方法
CN108737979A (zh) 一种室内定位方法
CN109934194A (zh) 图片分类方法、边缘设备、系统及存储介质
CN111414410A (zh) 数据处理方法、装置、设备和存储介质
CN108154024A (zh) 一种数据检索方法、装置及电子设备
CN108197203A (zh) 一种门脸头图挑选方法、装置、服务器和存储介质
JP2011107795A (ja) 画像検索システム
CN109661671A (zh) 使用边界位图对图像分类的改善
CN110119456A (zh) 检索图像的方法及装置
CN109241316A (zh) 图像检索方法、装置、电子设备及存储介质
CN109934072A (zh) 人员统计方法及装置
CN114078269A (zh) 一种人脸图像聚类方法、装置、服务器和存储介质
CN107103060A (zh) 一种传感数据的存储方法及系统
US20130156323A1 (en) Systems and methods for efficient feature extraction accuracy using imperfect extractors
JP2005235041A (ja) 検索画像表示方法および検索画像表示プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181009

RJ01 Rejection of invention patent application after publication