CN114937246A - 一种行人识别方法、电子设备及存储介质 - Google Patents

一种行人识别方法、电子设备及存储介质 Download PDF

Info

Publication number
CN114937246A
CN114937246A CN202210786467.8A CN202210786467A CN114937246A CN 114937246 A CN114937246 A CN 114937246A CN 202210786467 A CN202210786467 A CN 202210786467A CN 114937246 A CN114937246 A CN 114937246A
Authority
CN
China
Prior art keywords
target
video frame
target video
attitude
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210786467.8A
Other languages
English (en)
Other versions
CN114937246B (zh
Inventor
唐红武
章凡寿
薄满辉
王殿胜
籍焱
王仲侯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Mobile Technology Co Ltd
Original Assignee
China Travelsky Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Mobile Technology Co Ltd filed Critical China Travelsky Mobile Technology Co Ltd
Priority to CN202210786467.8A priority Critical patent/CN114937246B/zh
Publication of CN114937246A publication Critical patent/CN114937246A/zh
Application granted granted Critical
Publication of CN114937246B publication Critical patent/CN114937246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种行人识别方法、电子设备及存储介质,包括:获取目标视频帧集合P;持续监控所述目标视频帧集合中目标视频帧的数量,当所述目标视频帧集合内的目标视频帧的数量大于预设阈值时,确定所述目标视频帧集合中所述目标人物对应的姿态类型的数量;获取所述目标视频帧集合对应的目标姿态集合V;根据P获取V1对应的第一目标特征向量TV1;从第一数据库获取第一候选特征向量集合YV1;确定TV1和YV1中每一候选特征向量的相似度,得到第一相似度集合SV1;若max(SV1)大于或等于相似度阈值λ,则建立max(SV1)对应的候选身份信息与所述目标视频帧集合之间的关联关系。本申请能够针对性的从第一数据库中选取同姿态类型的候选特征向量进行相似度对比。

Description

一种行人识别方法、电子设备及存储介质
技术领域
本申请涉及数据处理领域,尤其涉及一种行人识别方法、电子设备及存储介质。
背景技术
行人重识别(Person re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。近年来,跨镜头的行人重识别是安防和管理领域的研究重点,其目的是能够整合出同一目标在不同镜头内的行动轨迹。现有的跨镜头的行人重识别需要使用离线的方式,将数据库中存储的所有视频帧进行两两对比,以此确定出每个视频帧中行人的身份是否是同一个人,最终确定出一个行人的完整运行轨迹。但这种方式处理量巨大,需要占用大量的计算资源。
发明内容
有鉴于此,本申请提供一种行人识别方法、电子设备及存储介质,至少部分解决现有技术中存在的问题。
根据本申请的一个方面,提供一种行人识别方法,包括:
步骤S100,响应于目标人物进入目标摄像头的拍摄范围,使用单镜头跟踪器对所述目标人物进行跟踪拍摄,以获取所述目标人物对应的目标视频帧集合P={(P1,ZP1),(P2,ZP2),(P3,ZP3),...,(Pn,ZPn)};其中,Pi为包含所述目标人物的第i个目标视频帧,ZPi为Pi中所述目标人物的姿态类型,1≤i≤n;所述目标视频帧集合内的目标视频帧的数量随所述目标人物在所述拍摄范围内停留时间的增长而增加,n为P中目标视频帧集的数量;
步骤S200,持续监控所述目标视频帧集合中目标视频帧的数量,当所述目标视频帧集合内的目标视频帧的数量大于预设阈值时,确定所述目标视频帧集合中所述目标人物对应的姿态类型的数量;
步骤S300,在所述姿态类型的数量大于1的情况下,根据预设的姿态类型优先级列表,获取所述目标视频帧集合对应的目标姿态集合V={V1,V2,...,Vm},m≥2,其中,Vj为目标视频帧集合中包含的第j个目标姿态类型,1≤j≤m;V中的m个目标姿态类型按姿态类型优先级从高到低的顺序排列;
步骤S400,根据P获取V1对应的第一目标特征向量TV1
步骤S500,从第一数据库获取第一候选特征向量集合YV1={YV1 1,YV1 2,YV1 3,...,YV1 H (V1)};其中,YV1 k为第k个对应的姿态类型为V1的候选特征向量,H(V1)为第一数据库中对应的姿态类型为V1的候选特征向量的数量,1≤k≤H(V1);在所述第一数据库中,每一候选特征向量均具有唯一对应的候选身份信息和唯一对应的姿态类型,每一候选身份信息具有至少一个对应的候选特征向量;
步骤S600,确定TV1和YV1中每一候选特征向量的相似度,得到第一相似度集合SV1={SV1 1,SV1 2,SV1 3,...,SV1 H(V1)},其中,SV1 k为TV1和YV1 k之间的相似度;
步骤S700,若max(SV1)大于或等于相似度阈值λ,则建立max(SV1)对应的候选身份信息与所述目标视频帧集合之间的关联关系,max()为预设的最大值确定函数。
在本申请的一种示例性实施例中,在所述步骤S700之后,所述方法还包括:
步骤S800,响应于所述目标人物离开所述目标摄像头的拍摄范围,将所述目标视频帧集合存储至第二数据库。
在本申请的一种示例性实施例中,所述步骤S700,还包括:
步骤S710,若max(SV1)小于相似度阈值λ,根据P获取V2对应的第二目标特征向量TV2
步骤S710,从第一数据库获取第二候选特征向量集合YV2={YV2 1,YV2 2,YV2 3,...,YV2 H (V2)};其中,YV2 c为第c个对应的姿态类型为V2的候选特征向量,H(V2)为第一数据库中对应的姿态类型为V2的候选特征向量的数量,1≤c≤H(V2);
步骤S720,确定TV2和YV2中每一候选特征向量的相似度,得到第二相似度集合SV2={SV2 1,SV2 2,SV2 3,...,SV2 H(V2)},其中,SV2 c为TV2和YV2 c之间的相似度;
步骤S730,若max(SV2)大于或等于相似度阈值λ,则建立max(SV2)对应的候选身份信息与所述目标视频帧集合之间的关联关系。
在本申请的一种示例性实施例中,所述步骤S400,包括:
步骤S410,根据V1对P进行遍历,对姿态类型与V1相同的目标视频帧进行提取,得到待处理视频帧集合W={W1,W2,W3,...,Wf(V1)};其中,Wb为P中第b个对应的姿态类型为V1的目标视频帧,f(V1)为P中对应的姿态类型为V1的目标视频帧的数量,1≤b≤f(V1);
步骤S420,根据W,得到原始目标特征向量集合U={UW1,UW2,UW3,...,UWf(V1)};其中,UWb为对Wb中目标人物进行特征提取得到的原始目标特征向量;
步骤S430,获取TV1=Avg(U),Avg()为预设的平均向量确定函数。
在本申请的一种示例性实施例中,在所述步骤S700之后,所述方法还包括:
步骤S910,根据max(SV1)对应的候选身份信息从第一数据库中,获取历史姿态集合L;L由第一数据库中,max(SV1)对应的候选身份信息所关联的所有历史姿态类型组成;
步骤S920,确定姿态差集Q是否为空集,Q=L-V;则根据P中对应姿态类型与Q中历史姿态类型相同的目标视频帧,确定出Q中每一历史姿态类型对应的补充姿态向量;
步骤S930,将至少一个所述补充姿态向量存储至所述第一数据库,并建立max(SV1)对应的候选身份信息与所述补充姿态向量对应的关联关系。
在本申请的一种示例性实施例中,SV1 k=(||TV1||×||YV1 k||-TV1·YV1 k)/||TV1||×||YV1 k||。
在本申请的一种示例性实施例中,λ∈[0.75,0.99]。
在本申请的一种示例性实施例中,λ=0.85。
根据本申请的一个方面,提供一种电子设备,包括处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行上述任一项所述方法的步骤。
根据本申请的一个方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行上述任一项所述方法的步骤。
本申请提供的行人识别方法,在获取目标视频帧的同时会获取每一目标视频帧中目标人物的姿态类型,并在目标视频帧集合中的目标视频帧的数量大于预设阈值后,确定出目标视频帧集合中包含的姿态类型的数量。若姿态类型的数量的大于1,则先获取姿态类型优先级最高的目标姿态类型V1对应的第一目标特征向量,然后从第一数据库中,获取姿态类型与V1相同的所有候选特征向量,并分别于TV1进行相似度对比。最终若max(SV1)大于或等于相似度阈值λ,则将max(SV1)对应的候选身份信息与目标视频帧集合建立关联关系,以此确定目标人物的身份信息。由此,本申请提供的行人识别方法,在确定目标人物的身份信息时,可以通过提取出的姿态类型,针对性的从第一数据库中选取同姿态类型的候选特征向量进行相似度对比,以此确定出目标人物的身份信息,而不用将所有目标视频帧与所有历史上获得的视频帧或特征向量进行对比,大大减少了处理数量。同时,在目标视频帧集合中的目标姿态类型大于1的情况下,还会优先使用姿态类型优先级更高的第一目标特征向量来进行相似度对比,进一步减少了处理数量。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种行人识别方法所应用的摄像监控系统的结构框图。
具体实施方式
下面结合附图对本申请实施例进行详细描述。
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
请参考图1,根据本申请的一个方面,提供一种行人识别方法,本方案可应用于摄像监控系统,该系统包括若干摄像头、处理服务器、第一数据库和第二数据库。
该方法具体包括以下步骤:
步骤S100,响应于目标人物进入目标摄像头的拍摄范围,使用单镜头跟踪器对所述目标人物进行跟踪拍摄,以获取所述目标人物对应的目标视频帧集合P={(P1,ZP1),(P2,ZP2),(P3,ZP3),...,(Pn,ZPn)};其中,Pi为包含所述目标人物的第i个目标视频帧,ZPi为Pi中所述目标人物的姿态类型,1≤i≤n;所述目标视频帧集合内的目标视频帧的数量随所述目标人物在所述拍摄范围内停留时间的增长而增加,n为P中目标视频帧集的数量。目标摄像头可以为多个,每个目标摄像头具有独立的单镜头跟踪器,以对进入自身拍摄范围的目标人物进行跟踪拍摄。单镜头跟踪器每获取到一个新的目标视频帧后,可以通过预设的姿态确定模块,对目标视频帧内的目标人物进行姿态识别,以获取每一目标视频帧对应的姿态类型。本实施例中,姿态类型可以包括7种,按优先级排序如下:正面直立姿态、侧面直立姿态、背面直立姿态、正面坐立姿态、侧面坐立姿态、背面坐立姿态和部分遮挡姿态。其中,若Pi中所述目标人物的姿态类型为正面直立姿态,则ZPi=1;若Pi中所述目标人物的姿态类型为侧面直立姿态,则ZPi=2;以此类推。目标摄像头可以为若干摄像头中的任一个。
具体的,单镜头跟踪器可以采用yolov5检测器来判断当前帧的视频之中,是否出现目标人物。若出现则返回目标人物的检测框以及对应该目标人物的姿态类型,其姿态类型是通过将检测框中的目标人物的特征送入检测器的全连接层得到其姿态类型。然后使用deepsort模块进行跟踪拍摄。
步骤S200,持续监控所述目标视频帧集合中目标视频帧的数量,当所述目标视频帧集合内的目标视频帧的数量大于预设阈值时,确定所述目标视频帧集合中所述目标人物对应的姿态类型的数量。具体的,本实施例中,预设阈值的取值范围为50-300。优选的,本实施例中,预设阈值为150。确定所述目标视频帧集合中所述目标人物对应的姿态类型的数量具体为,确定所述目标视频帧集合相互不同的姿态类型的数量,具体通过对P进行遍历并对姿态类型进行去重后得到。
步骤S300,在所述姿态类型的数量大于1的情况下,根据预设的姿态类型优先级列表,获取所述目标视频帧集合对应的目标姿态集合V={V1,V2,...,Vm},m≥2,其中,Vj为目标视频帧集合中包含的第j个目标姿态类型,1≤j≤m;V中的m个目标姿态类型按姿态类型优先级从高到低的顺序排列。姿态类型优先级列表可以预存在配置表中,用于规定不同的姿态类型之间的优先级,具体的优先级顺序见前文。
步骤S400,根据P获取V1对应的第一目标特征向量TV1
具体的,所述步骤S400,包括:
步骤S410,根据V1对P进行遍历,对姿态类型与V1相同的目标视频帧进行提取,得到待处理视频帧集合W={W1,W2,W3,...,Wf(V1)};其中,Wb为P中第b个对应的姿态类型为V1的目标视频帧,f(V1)为P中对应的姿态类型为V1的目标视频帧的数量,1≤b≤f(V1)。
步骤S420,根据W,得到原始目标特征向量集合U={UW1,UW2,UW3,...,UWf(V1)};其中,UWb为对Wb中目标人物进行特征提取得到的原始目标特征向量。每一原始目标特征向量的向量维度相同。
步骤S430,获取TV1=Avg(U),Avg()为预设的平均向量确定函数,用于求取U中所有原始目标特征向量的平均向量。
本实施例中,TV1是根据目标视频帧集合中所有姿态类型为V1的目标视频帧中目标人物的原始特征向量得到的平均特征向量。能够更好地反应出目标人物的人物特征。
步骤S500,从第一数据库获取第一候选特征向量集合YV1={YV1 1,YV1 2,YV1 3,...,YV1 H (V1)};其中,YV1 k为第k个对应的姿态类型为V1的候选特征向量,H(V1)为第一数据库中对应的姿态类型为V1的候选特征向量的数量,1≤k≤H(V1);在所述第一数据库中,每一候选特征向量均具有唯一对应的候选身份信息和唯一对应的姿态类型,每一候选身份信息具有至少一个对应的候选特征向量。
具体的,第一数据库用于存储已经确定好身份信息的人物的特征向量(即候选特征向量)和对应的姿态类型。且,每一候选人物信息可以对应多个姿态类型,每一姿态类型仅具有一个对应的候选特征向量。如此,保证第一数据库中不需要存储大量的数据。本实施例中还设置有第二数据库,第二数据库中存储了所有历史上的目标人物的目标视频帧集合,及对应的身份信息。故而,第一数据库是用于存储确定新的目标人物的身份信息所需要的数据的。二第二数据库中,则用于存储所有视频帧及每一视频帧对应的身份信息,从而可以根据身份信息确定出一个人物对应的所有视频帧。但进行新的目标人物的身份确定时,不需要和第二数据库中的所有视频帧进行对比,只需要与第一数据库中的候选特征向量进行对比即可。具体的,第一数据库中的候选特征向量的获得当时可以参考第一目标特征向量的获得方式,此处不加赘述。
步骤S600,确定TV1和YV1中每一候选特征向量的相似度,得到第一相似度集合SV1={SV1 1,SV1 2,SV1 3,...,SV1 H(V1)},其中,SV1 k为TV1和YV1 k之间的相似度。
其中,SV1 k=(||TV1||×||YV1 k||-TV1·YV1 k)/||TV1||×||YV1 k||。SV1 k越大表示TV1和YV1 k之间的相似度越高。
步骤S700,若max(SV1)大于或等于相似度阈值λ,则建立max(SV1)对应的候选身份信息与所述目标视频帧集合之间的关联关系,max()为预设的最大值确定函数。本实施例中,λ∈[0.75,0.99]。优选的,λ=0.85。
进一步的,所述步骤S700,还包括:
步骤S710,若max(SV1)小于相似度阈值λ,根据P获取V2对应的第二目标特征向量TV2
步骤S710,从第一数据库获取第二候选特征向量集合YV2={YV2 1,YV2 2,YV2 3,...,YV2 H (V2)};其中,YV2 c为第c个对应的姿态类型为V2的候选特征向量,H(V2)为第一数据库中对应的姿态类型为V2的候选特征向量的数量,1≤c≤H(V2);
步骤S720,确定TV2和YV2中每一候选特征向量的相似度,得到第二相似度集合SV2={SV2 1,SV2 2,SV2 3,...,SV2 H(V2)},其中,SV2 c为TV2和YV2 c之间的相似度;
步骤S730,若max(SV2)大于或等于相似度阈值λ,则建立max(SV2)对应的候选身份信息与所述目标视频帧集合之间的关联关系。
步骤S800,响应于所述目标人物离开所述目标摄像头的拍摄范围,将所述目标视频帧集合存储至第二数据库。其中,关联关系目标视频帧集和其具有关联关系的身份信息(候选身份信息)的关联关系,可以以映射表或二元组的形式进行存储,可以存储在第一数据库和/或第二数据库中。
可以理解的是,若max(SV2)小于相似度阈值λ,则可参考步骤S700-步骤S730的步骤,选取再第一级优先级的目标姿态类型进行后续处理,直至处理到优先级最低的目标特征类型。
进一步的,若V中所有的目标特征类型对应的目标特征向量均未能完成匹配,则为目标视频帧建立一个唯一对应的身份信息并建立关联关系,以及将V中所有的目标特征类型对应的目标特征向量存储至第一数据库。
本实施例中,建立关联关系表示目标视频帧集合对应的目标人物被确认了身份(即对应的身份信息或候选身份信息)。依次,能够对应的身份信息从第二数据库中获取目标人物的所有视频帧(即行动轨迹)。
本实施例提供的行人识别方法,在获取目标视频帧的同时会获取每一目标视频帧中目标人物的姿态类型,并在目标视频帧集合中的目标视频帧的数量大于预设阈值后,确定出目标视频帧集合中包含的姿态类型的数量。若姿态类型的数量的大于1,则先获取姿态类型优先级最高的目标姿态类型V1对应的第一目标特征向量,然后从第一数据库中,获取姿态类型与V1相同的所有候选特征向量,并分别于TV1进行相似度对比。最终若max(SV1)大于或等于相似度阈值λ,则将max(SV1)对应的候选身份信息与目标视频帧集合建立关联关系,以此确定目标人物的身份信息。由此,本实施例提供的行人识别方法,在确定目标人物的身份信息时,可以通过提取出的姿态类型,针对性的从第一数据库中选取同姿态类型的候选特征向量进行相似度对比,以此确定出目标人物的身份信息,而不用将所有目标视频帧与所有历史上获得的视频帧或特征向量进行对比,大大减少了处理数量。同时,在目标视频帧集合中的目标姿态类型大于1的情况下,还会优先使用姿态类型优先级更高的第一目标特征向量来进行相似度对比,进一步减少了处理数量。
在本申请的一种示例性实施例中,在所述步骤S700之后,所述方法还包括:
步骤S910,根据max(SV1)对应的候选身份信息从第一数据库中,获取历史姿态集合L;L由第一数据库中,max(SV1)对应的候选身份信息所关联的所有历史姿态类型组成;
步骤S920,确定姿态差集Q是否为空集,Q=L-V;若否,则根据P中对应姿态类型与Q中历史姿态类型相同的目标视频帧,确定出Q中每一历史姿态类型对应的补充姿态向量;
步骤S930,将至少一个所述补充姿态向量存储至所述第一数据库,并建立max(SV1)对应的候选身份信息与所述补充姿态向量对应的关联关系。
由于第一数据库中每一候选身份信息仅存储了历史的视频帧中包含的姿态类型对应的候选特征向量,但同一目标人物在不同的摄像头下会产生新的姿态类型。故而,本实施例中,在确定出目标视频帧集合对应的身份信息(候选身份信息)后,会通过判断Q是否为空集,确定出V中是否包含第一数据库中当前没有的姿态类型,若Q不为空集,则说明存在,且Q中的姿态类型,就是第一数据库中当前没有的姿态类型。此时,会根据Q中的每一姿态类型从目标视频帧集合中,确定出姿态类型对应的目标视频帧,再采用与获取TV1、TV2等目标特征向量相同的方法,确定出至少一个补充姿态向量,存储至第一数据库中,以作为后续处理中的候选特征向量。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。
其中,所述储存器存储有程序代码,所述程序代码可以被所述处理器执行,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(RAM)和/或高速缓存储存器,还可以进一步包括只读储存器(ROM)。
储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线可以为表示几类总线结构中的一种或多种,包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口进行。并且,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种行人识别方法,其特征在于,包括:
步骤S100,响应于目标人物进入目标摄像头的拍摄范围,使用单镜头跟踪器对所述目标人物进行跟踪拍摄,以获取所述目标人物对应的目标视频帧集合P={(P1,ZP1),(P2,ZP2),(P3,ZP3),...,(Pn,ZPn)};其中,Pi为包含所述目标人物的第i个目标视频帧,ZPi为Pi中所述目标人物的姿态类型,1≤i≤n;所述目标视频帧集合内的目标视频帧的数量随所述目标人物在所述拍摄范围内停留时间的增长而增加,n为P中目标视频帧集的数量;
步骤S200,持续监控所述目标视频帧集合中目标视频帧的数量,当所述目标视频帧集合内的目标视频帧的数量大于预设阈值时,确定所述目标视频帧集合中所述目标人物对应的姿态类型的数量;
步骤S300,在所述姿态类型的数量大于1的情况下,根据预设的姿态类型优先级列表,获取所述目标视频帧集合对应的目标姿态集合V={V1,V2,...,Vm},m≥2,其中,Vj为目标视频帧集合中包含的第j个目标姿态类型,1≤j≤m;V中的m个目标姿态类型按姿态类型优先级从高到低的顺序排列;
步骤S400,根据P获取V1对应的第一目标特征向量TV1
步骤S500,从第一数据库获取第一候选特征向量集合YV1={YV1 1,YV1 2,YV1 3,...,YV1 H(V1)};其中,YV1 k为第k个对应的姿态类型为V1的候选特征向量,H(V1)为第一数据库中对应的姿态类型为V1的候选特征向量的数量,1≤k≤H(V1);在所述第一数据库中,每一候选特征向量均具有唯一对应的候选身份信息和唯一对应的姿态类型,每一候选身份信息具有至少一个对应的候选特征向量;
步骤S600,确定TV1和YV1中每一候选特征向量的相似度,得到第一相似度集合SV1={SV1 1,SV1 2,SV1 3,...,SV1 H(V1)},其中,SV1 k为TV1和YV1 k之间的相似度;
步骤S700,若max(SV1)大于或等于相似度阈值λ,则建立max(SV1)对应的候选身份信息与所述目标视频帧集合之间的关联关系,max()为预设的最大值确定函数。
2.根据权利要求1所述的行人识别方法,其特征在于,在所述步骤S700之后,所述方法还包括:
步骤S800,响应于所述目标人物离开所述目标摄像头的拍摄范围,将所述目标视频帧集合存储至第二数据库。
3.根据权利要求1所述的行人识别方法,其特征在于,所述步骤S700,还包括:
步骤S710,若max(SV1)小于相似度阈值λ,根据P获取V2对应的第二目标特征向量TV2
步骤S710,从第一数据库获取第二候选特征向量集合YV2={YV2 1,YV2 2,YV2 3,...,YV2 H(V2)};其中,YV2 c为第c个对应的姿态类型为V2的候选特征向量,H(V2)为第一数据库中对应的姿态类型为V2的候选特征向量的数量,1≤c≤H(V2);
步骤S720,确定TV2和YV2中每一候选特征向量的相似度,得到第二相似度集合SV2={SV2 1,SV2 2,SV2 3,...,SV2 H(V2)},其中,SV2 c为TV2和YV2 c之间的相似度;
步骤S730,若max(SV2)大于或等于相似度阈值λ,则建立max(SV2)对应的候选身份信息与所述目标视频帧集合之间的关联关系。
4.根据权利要求1所述的行人识别方法,其特征在于,所述步骤S400,包括:
步骤S410,根据V1对P进行遍历,对姿态类型与V1相同的目标视频帧进行提取,得到待处理视频帧集合W={W1,W2,W3,...,Wf(V1)};其中,Wb为P中第b个对应的姿态类型为V1的目标视频帧,f(V1)为P中对应的姿态类型为V1的目标视频帧的数量,1≤b≤f(V1);
步骤S420,根据W,得到原始目标特征向量集合U={UW1,UW2,UW3,...,UWf(V1)};其中,UWb为对Wb中目标人物进行特征提取得到的原始目标特征向量;
步骤S430,获取TV1=Avg(U),Avg()为预设的平均向量确定函数。
5.根据权利要求1所述的行人识别方法,其特征在于,在所述步骤S700之后,所述方法还包括:
步骤S910,根据max(SV1)对应的候选身份信息从第一数据库中,获取历史姿态集合L;L由第一数据库中,max(SV1)对应的候选身份信息所关联的所有历史姿态类型组成;
步骤S920,确定姿态差集Q是否为空集,Q=L-V;若否,则根据P中对应姿态类型与Q中历史姿态类型相同的目标视频帧,确定出Q中每一历史姿态类型对应的补充姿态向量;
步骤S930,将至少一个所述补充姿态向量存储至所述第一数据库,并建立max(SV1)对应的候选身份信息与所述补充姿态向量对应的关联关系。
6.根据权利要求1所述的行人识别方法,其特征在于,
SV1 k=(||TV1||×||YV1 k||-TV1·YV1 k)/||TV1||×||YV1 k||。
7.根据权利要求1所述的行人识别方法,其特征在于,λ∈[0.75,0.99]。
8.根据权利要求1所述的行人识别方法,其特征在于,λ=0.85。
9.一种电子设备,其特征在于,包括处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至8任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至8任一项所述方法的步骤。
CN202210786467.8A 2022-07-06 2022-07-06 一种行人识别方法、电子设备及存储介质 Active CN114937246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210786467.8A CN114937246B (zh) 2022-07-06 2022-07-06 一种行人识别方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210786467.8A CN114937246B (zh) 2022-07-06 2022-07-06 一种行人识别方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114937246A true CN114937246A (zh) 2022-08-23
CN114937246B CN114937246B (zh) 2023-02-07

Family

ID=82867997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210786467.8A Active CN114937246B (zh) 2022-07-06 2022-07-06 一种行人识别方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114937246B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599791A (zh) * 2022-11-15 2023-01-13 以萨技术股份有限公司(Cn) 一种Milvus数据库参数确定方法、设备及存储介质
CN117496195A (zh) * 2023-11-03 2024-02-02 青岛以萨数据技术有限公司 一种目标匹配图像的确定方法、电子设备及存储介质
CN117496195B (zh) * 2023-11-03 2024-05-31 青岛以萨数据技术有限公司 一种目标匹配图像的确定方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325456A (zh) * 2018-09-29 2019-02-12 佳都新太科技股份有限公司 目标识别方法、装置、目标识别设备及存储介质
CN109934104A (zh) * 2019-01-29 2019-06-25 武汉烽火众智数字技术有限责任公司 基于行人重识别的跨镜头的行人检索方法及系统
CN111161320A (zh) * 2019-12-30 2020-05-15 浙江大华技术股份有限公司 一种目标跟踪方法、目标跟踪装置及计算机可读介质
CN111414840A (zh) * 2020-03-17 2020-07-14 浙江大学 步态识别方法、装置、设备及计算机可读存储介质
US20210209350A1 (en) * 2020-01-06 2021-07-08 Kaia Health Software GmbH Ml model arrangement and method for evaluating motion patterns

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325456A (zh) * 2018-09-29 2019-02-12 佳都新太科技股份有限公司 目标识别方法、装置、目标识别设备及存储介质
CN109934104A (zh) * 2019-01-29 2019-06-25 武汉烽火众智数字技术有限责任公司 基于行人重识别的跨镜头的行人检索方法及系统
CN111161320A (zh) * 2019-12-30 2020-05-15 浙江大华技术股份有限公司 一种目标跟踪方法、目标跟踪装置及计算机可读介质
US20210209350A1 (en) * 2020-01-06 2021-07-08 Kaia Health Software GmbH Ml model arrangement and method for evaluating motion patterns
CN111414840A (zh) * 2020-03-17 2020-07-14 浙江大学 步态识别方法、装置、设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于洪涛主编: "《网络行为分析与网络智慧治理》", 31 August 2020, 西安电子科学技术大学出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599791A (zh) * 2022-11-15 2023-01-13 以萨技术股份有限公司(Cn) 一种Milvus数据库参数确定方法、设备及存储介质
CN115599791B (zh) * 2022-11-15 2023-03-10 以萨技术股份有限公司 一种Milvus数据库参数确定方法、设备及存储介质
CN117496195A (zh) * 2023-11-03 2024-02-02 青岛以萨数据技术有限公司 一种目标匹配图像的确定方法、电子设备及存储介质
CN117496195B (zh) * 2023-11-03 2024-05-31 青岛以萨数据技术有限公司 一种目标匹配图像的确定方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN114937246B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN108776787B (zh) 图像处理方法及装置、电子设备、存储介质
JP4891197B2 (ja) 画像処理装置および画像処理方法
CN113382279B (zh) 直播推荐方法、装置、设备、存储介质以及计算机程序产品
CN111031348B (zh) 一种视频加扰方法、装置、服务器和存储介质
US20220084209A1 (en) Reducing structural redundancy in automatic image segmentation
CN114612759B (zh) 视频处理方法、查询视频的方法和模型训练方法、装置
KR102592551B1 (ko) Ar장치를 위한 객체 인식 처리 장치 및 방법
CN108664914B (zh) 人脸检索方法、装置及服务器
CN107992366B (zh) 对多个目标对象进行检测和跟踪的方法、系统和电子设备
CN114937246B (zh) 一种行人识别方法、电子设备及存储介质
CN113810765B (zh) 视频处理方法、装置、设备和介质
CN112561954B (zh) 目标对象跟踪轨迹的确定方法和装置、存储介质
CN111339364A (zh) 视频分类方法、介质、装置和计算设备
CN113537148B (zh) 人体动作识别方法及装置、可读存储介质、电子设备
CN114639143B (zh) 基于人工智能的人像归档方法、设备及存储介质
KR20210018586A (ko) 등장인물의 생체특징을 이용하는 비디오 콘텐트 식별 방법 및 장치
CN110634155A (zh) 一种基于深度学习的目标检测方法和装置
CN115984977A (zh) 活体检测方法和系统
CN112949777B (zh) 相似图像确定方法及装置、电子设备和存储介质
CN115273148A (zh) 行人重识别模型训练方法、装置、电子设备及存储介质
CN115359542A (zh) 基于人脸识别和行人重识别的人员身份确定方法及系统
CN107861979A (zh) 一种基于人脸识别的伴随人员获取方法及系统
CN114245232A (zh) 一种视频摘要生成方法、装置、存储介质及电子设备
US20220261642A1 (en) Adversarial example detection system, method, and program
CN112989869A (zh) 人脸质量检测模型的优化方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant