CN111914658A - 一种行人识别方法、装置、设备及介质 - Google Patents
一种行人识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111914658A CN111914658A CN202010640777.XA CN202010640777A CN111914658A CN 111914658 A CN111914658 A CN 111914658A CN 202010640777 A CN202010640777 A CN 202010640777A CN 111914658 A CN111914658 A CN 111914658A
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- pedestrian
- loss value
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012549 training Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请提供了一种行人识别方法、装置、设备及介质。本申请在进行行人识别时,将待检测的第一图像和目标人物的第二图像输入到预先训练完成的行人识别模型中,基于该行人识别模型,获取该第一图像和第二图像是否属于同一行人的图像的第一标识信息,当根据该第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。由于本申请中基于该行人识别模型,获取该第一图像和第二图像是否属于同一行人的图像的第一标识信息,因此可以准确的识别出输入图像是否为属于同一行人的图像,该过程中无需用户参与,提高了行人识别的效率和准确度。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种行人识别方法、装置、设备及介质。
背景技术
越来越多图像采集设备的使用,产生了海量图像,在对目标人物进行相关分析时,一般基于保存这些图像的图像数据库进行。在图像数据库中检索目标人物的图像时,例如抓捕嫌疑犯,寻找走失老人、儿童时,一般采用以图搜图的方式。但是如何快速有效的在图像数据库中识别出目标人物的图像是一个非常具有挑战的问题。目前在基于以图搜图的方式搜索目标人物时,一般采用人脸识别方法。但是在实际场景中,由于环境复杂,图像采集设备的分辨率低等,很难得到清晰的人脸图像,人脸识别方法并不能快速准确的识别出目标人物的图像。
现有的以图搜图中,通过给定目标人物的图像,根据图像内容信息或指定查询标准,在图像数据库中搜索并查找出符合查询条件的所有图像。将查找到的所有图像按照其与目标人物的图像的相似度从高到低进行排列,在由人工根据相似度进行筛选。为了减少人工筛选的复杂度,可以由人工预先设置相似度阈值,从而只展示相似度大于该相似度阈值的图像,根据阈值筛选图像。
但无论哪种以图搜图的方式,都需要用户参与,并且因为图像数据库中的同一个行人的图像可能是正面、侧面或者背面图像,因此在基于人脸识别方法进行以图搜图时,将会影响识别的精度。
发明内容
本申请提供了一种行人识别方法、装置、设备及介质,用以解决基于以图搜图方法进行行人识别时,需要用户干预并且识别精度低的问题。
本申请实施例提供一种行人识别方法,所述方法包括:
获取待检测的第一图像及目标人物的第二图像;
基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息;
若根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
在一种可能的实施方式中,所述基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息包括:
基于预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二张图像中包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
在一种可能的实施方式中,所述行人识别模型通过如下方式进行训练:
获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;
通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;
根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整包括:
根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;
根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;
根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;
根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
在一种可能的实施方式中,所述根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值包括:
针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息和第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;
根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
本申请实施例还提供一种行人识别装置,所述装置包括:
获取模块,用于获取待检测的第一图像及目标人物的第二图像。
处理模块,用于通过预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息。
识别模块,用于根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
在一种可能的实施方式中,所述处理模块,具体用于通过预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二图像中所包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
在一种可能的实施方式中,所述装置包括:
训练模块,获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述训练模块,具体用于根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述训练模块,具体用于针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
在一种可能的实施方式中,所述训练模块,具体用于针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
在一种可能的实施方式中,所述训练模块,具体用于针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息与第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
本申请实施例还提供一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述行人识别方法的步骤。
本申请实施例还提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述行人识别方法的步骤。
本申请在进行行人识别时,将待检测的第一图像和目标人物的第二图像输入到预先训练完成的行人识别模型中,基于该行人识别模型,获取该第一图像和第二图像是否属于同一行人的图像的第一标识信息,当根据该第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。由于本申请中基于该行人识别模型,获取该第一图像和第二图像是否属于同一行人的图像的第一标识信息,因此可以准确的识别出输入图像是否为属于同一行人的图像,该过程中无需用户参与,提高了行人识别的效率和准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实例提供的一种行人识别检测过程示意图;
图2为神经网络系统的识别流程示意图;
图3为本申请实施例提供的一种行人识别装置结构示意图;
图4为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为了避免了操作者手动设置阈值,提高行人识别的效率和准确度,本申请提供了一种行人识别方法、装置、设备及介质。
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本发申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
实施例1:
图1为本申请提供的一种行人识别过程示意图,该过程包括以下步骤:
S101:获取待检测的第一图像及目标人物的第二图像。
本申请提供的行人识别方法应用于电子设备,该电子设备可以是图像采集设备,PC或者服务器等智能设备。
在进行行人识别时,一般是基于目标人物进行的,也就是基于搜索的需求在获取到的行人的图像中进行识别的,为了方便进行行人的识别,需要获取到该目标人物的第二图像,该目标人物的第二图像中包含该目标人物的图像信息,例如包含该目标人物的正面的图像信息。基于该目标人物的第二图像,在图像数据库保存的图像中进行识别。该图像数据库中保存的图像为各进行监控的图像采集设备采集的。
针对该图像数据库中保存的任一图像,将该图像作为待检测的第一图像,基于该第一图像和第二图像,进行行人识别。
S102:基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息。
为了提高行人识别的精度,本申请中预先训练有行人识别模型,该行人识别模型可以是CNN网络模型,或者其他网络模型。
当预先对该行人识别模型训练完成后,在进行行人识别时,将第一图像和第二图像输入到该行人识别模型中,该行人识别模型基于该第一图像和第二图像进行处理,并输出该第一图像和第二图像是否属于同一行人的图像的第一标识信息。
S103:根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
具体的,每种标识信息代表的含义在对该行人识别模型进行训练时,预先进行了设置,因此当电子设备获取到该行人识别模型输出的第一标识信息后,可以基于该第一标识信息,确定第一图像和第二图像是否为基于同一行人的图像。
例如,第一标识信息为1,则表示该第一图像与第二图像为属于同一行人的图像,第一标识信息为0,则表示该第一图像与第二图像为属于不同行人的图像。
因此基于该行人识别模型输出的第一标识信息,电子设备可以确定该第一图像和第二图像是否为属于同一行人的图像,如果基于该第一标识信息,确定该第一图像和第二图像为属于同一行人的图像,则确定识别到所述目标人物的图像。之后基于该第一图像进行相应的处理,从而方便获取到该目标人物的行踪信息。识别到目标人物后的后续处理过程,在本申请实施例中不再进行赘述。
由于本申请在进行行人识别时,需要将待检测的图像和目标人物图像输入到预先训练完成的行人识别模型中,行人识别模型会判定待检测图像是否为目标人物,当行人识别模型判断待检测图像是目标人物时,输出端输出是,当行人识别模型判断待检测图像不是目标人物时,输出端输出否,避免了操作者手动设置阈值,提高了行人识别的效率和准确度。
实施例2:
为了获取到进行识别的行人的详细信息,在上述实施例的基础上,在本申请中,所述基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息包括:
基于预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二张图像中包含的行人的姿态标识和所述第一图像和第二张图像中包含的行人的ID中的至少一个。
为了获取输入的第一图像和第二图像所包含的行人的详细信息,在本申请中,当将第一图像和第二图像输入到该行人识别模型中后,该行人识别模型对第一图像和第二图像进行处理,不仅能够输出该第一图像和第二图像是否属于同一行人的第一标识信息,并且该行人识别模型还可以输出该第一图像和第二图像包含的行人的姿态标识,以及该第一图像和第二图像所包含行人的ID中的至少一个。
即该行人识别模型可以输出第一图像和第二图像是否属于同一行人的第一标识信息,以及第一图像和第二图像包含的行人的姿态标识,例如该行人识别模型输出第一图像和第二图像属于同一行人的第一标识信息,以及第一图像中包含的行人的姿态为正面的姿态标识,第二图像中包含的行人的姿态为背面的姿态标识。
该行人识别模型还可以输出第一图像和第二图像是否属于同一行人的第一标识信息,以及第一图像和第二图像包含的行人的ID。例如该行人识别模型输出第一图像和第二图像属于同一行人的第一标识信息,以及第一图像中包含的行人的ID1,第二图像中包含的行人的ID2。
当然,该行人识别模型还可以输出第一图像和第二图像是否属于同一行人的第一标识信息,第一图像和第二图像包含的行人的姿态标识,以及第一图像和第二图像包含的行人的ID。例如该行人识别模型输出第一图像和第二图像属于同一行人的第一标识信息,第一图像中包含的行人的姿态为正面的姿态标识,第二图像中包含的行人的姿态为背面的姿态标识,第一图像中包含的行人的ID1,以及第二图像中包含的行人的ID2。
因为本申请中的行人识别模型不仅可以输出第一图像和第二图像是否属于同一行人的第一标识信息,还可以输出第一图像和第二图像包含的行人的姿态标识,以及第一图像和第二图像包含的行人的ID,因此能够在对行人识别时,获取到更加详细的行人信息,保证了行人识别的准确性。
实施例3:
为了能够进行行人的识别,在上述各实施例的基础上,在本申请中,所述行人识别模型通过如下方式进行训练:
获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;
通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;
根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
为了实现对行人识别模型的训练,本申请实施例中保存有进行训练用的样本集,该样本集中的任一样本图像对应有姿态标识、ID、以及该样本图像与其他任一样本图像是否属于同一行人的图像的第二标识信息等。其中该姿态标识可以标识该样本图像中包含的行人的姿态,ID为该样本图像中包含的行人的标识。
例如样本集的样本图像M中包含有行人A的正面图像,则该样本图像M对应的姿态标识为标识行人为正面的姿态标识,对应的ID为行人A的ID。如果该样本图像M与另一样本图像N都包含有行人A,则该样本图像M对应有与样本图像N包含同一行人的标识信息。
在本申请该行人识别模型包括多个卷积层和池化层,具体的在本申请实施例中对行人识别模型的结构不进行限定。
为了使本申请中的行人识别模型能够针对输入的目标行人的图像进行识别,在对原始行人识别模型进行训练时,可以采用至少两张样本图像作为该行人识别模型的输入,并且每次输入到该原始行人识别模型中的样本图像的数量可以相同,也可以不同,例如将样本集中的样本图像划分为多个组,每个组中包含的样本图像的数量可以是2个、3个、4个等,并且同一个样本图像可以位于不同的组中。
在获取到样本集中的至少两张样本图像及每张样本图像对应的第一姿态标识、第一ID和与该至少两张样本图像中其他样本图像对应的第二标识信息后,将每张样本图像、第一姿态标识、第一ID和第二标识信息输入到原始行人识别模型中,该原始行人识别模型输出该样本图像包含的行人的第二姿态标识、第二ID以及第三标识信息对应的行人的第一标识信息。
例如获取到三张样本图像,其中样本图像1对应第一姿态标识为1、第一ID为ID1,该样本图像1相对样本图像2的第二标识为0,相对样本图像3的标识信息为1;样本图像2对应的第一姿态标识为1、第一ID为ID2,该样本图像2相对样本图像1的第二标识为0,相对样本图像3的标识信息为0;样本图像3对应的第一姿态标识为2、第一ID为ID1,样本图像3相对样本图像1的第二标识信息为1,相对样本图像2对应第二标识信息为0。
在该原始行人识别模型输出样本图像对应的第二姿态标识、第二ID以及第三标识信息后,根据每张样本图像对应的第一姿态标识、第一ID和第二标识信息,以及原始行人识别模型输出的第二姿态标识、第二ID以及第三标识信息,对该原始行人识别模型进行训练。
对行人识别模型采用上述方式进行训练,当满足预设的条件时,得到训练完成的行人识别模型。其中,该预设的条件可以是,样本集中的样本图像通过原始行人识别模型训练后得到的第二姿态标识、第二ID以及第三标识信息与第一姿态标识、第一ID和第二标识信息一致的样本图像的数量大于设定数量;也可以是对原始行人识别模型进行训练的迭代次数达到设置的最大迭代次数等。具体的,本申请实施例对此不做限制。
下面结果一个具体实施例,对本申请中的行人识别模型的训练过程进行详细说明。
图2为本申请实例提供了一种行人识别模型的训练过程示意图,获取三张样本图像,将这三张样本图像输入到原始行人识别模型,其中输入的三张样本图像中每张有对应包含的用户的第一ID,以及包含用户的姿态对应的第一姿态标识,另外,每两张样本图像还可以对应包含是否位于同一行人的第二标识信息。
该原始行人识别模型是基于CNN网络的模型,该原始行人识别模型中的特征提取层提取该三张图像的特征f1、f2、f3,将该特征提取层得到的特征f1、f2、f3两两连接起来,传输到一个全连接(fc)层,最后全连接层会输出每张样本图像包含的用户的第二ID,每张样本图像对应的第二姿态标识,以及任意两张样本图像是否为同一行人图像的第三标识信息。
根据第一ID和第二ID是否一致,确定ID损失,根据第一姿态标识和第二姿态标识是否一致,确定姿态损失,根据第二标识信息和第三标识信息是否一致,确定判别损失,并根据确定的ID损失、姿态损失以及判别损失,确定总损失值,通过反向传播算法,将总损失值回传,对原始行人识别模型的参数进行调整。
实施例4:
为了进一步提高行人识别的精度,在上述各实施例的基础上,在本申请中,所述根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整包括:
根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;
根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;
根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;
根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
原始行人识别模型确定出样本图像中包含的行人的第二姿态标识、第二ID以及第三标识信息,因为对每张样本图像进行了预先标注,该样本图像对应有第一姿态标识、第一ID和第二标识信息,因此根据第二姿态标识、第二ID以及第三标识信息与对应的第一姿态标识、第一ID和第二标识信息之间存在的误差,对原始行人模型的参数进行调整。
具体的,可以根据每张样本图像的第一ID和第二ID是否一致,确定第一损失值;根据每张样本图像的第一姿态标识和第二姿态标识是否一致,确定第二损失值;根据样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值。
根据第一损失值、第二损失值和第三损失值之和确定总损失值。在确定总损失值时,还可以根据第一损失值、第二损失值和第三损失值以及对应权重值的加权和,确定总损失值。其中每个损失值对应的权重值可以相同,也可以不同,具体使用时,可以根据需要灵活设定。
实施例5:
为了保证行人识别模型识别的准确性,在上述各实施例的基础上,在本申请中,所述根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
在行人识别模型进行训练时,样本集中每张样本图像可能会被多次识别,一张样本图像每被识别一次就会产生一个第二ID,第二ID就会与第一ID产生损失,通过计算该样本图像第二ID与该样本图像的第一ID一致的次数,并且根据样本集中包含的样本图像的总数量,确定该样本图像对应的第一子损失值,再根据样本图像中的所有图像所对应的第一子损失值,确定第一损失值。
本申请中,第一损失值可以通过如下公式确定:
其中,Lid为第一损失值,q(i)为第一损失值对应的归一化函数,当样本图像j的第二ID与该样本图像j的第一ID一致时,pj为1,否则pj为0,K为样本集中包含的样本图像的数量。
实施例6:
为了保证行人识别模型识别的准确性,在上述各实施例的基础上,在本申请中,所述根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
在对原始行人识别模型进行训练时,样本集中每张样本图像可能会被多次识别,一张样本图像每被识别一次就会产生一个第二姿态标识,第二姿态标识就会与第一姿态标识产生损失,通过计算该样本图像第二姿态标识与该样本图像的第一姿态标识一致的次数,并且根据样本集中包含的样本图像的总数量,确定该样本图像对应的第二子损失值,再根据样本图像中的所有图像所对应的第二子损失值,确定第二损失值。
本申请中,第二损失值的计算可以通过如下公式确定:
其中,Lpos为第二损失值,r(j,k)为第二损失值对对应的归一化函数,当该样本图像j的第二ID与该样本图像j的第一ID一致、且第二姿态标识与第一姿态标识一致tjk为1,否则tjk为0,K为样本集中包含的样本图像的数量。
实施例7:
为了保证行人识别模型识别的准确性,在上述各实施例的基础上,在本申请中,所述根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值包括:
针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息与第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;
根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
在行人识别模型进行训练时,样本集中每两张样本图像可能会被多次识别,每两张样本图像每被识别一次就会产生一个第三标识信息,第三标识信息就会与第二标识信息产生损失,通过计算该两张样本图像第三标识信息与该两张样本图像的第二标识信息一致的次数,并且根据样本集中包含的样本图像的总数量,确定该两张样本图像对应的第三子损失值,再根据样本图像中的任意两张图像所对应的第三子损失值,确定第三损失值。
本申请中,第三损失值的计算可以通过如下公式确定:
其中,Lve为第三损失值,b(i)为第三损失值对应的归一化函数,当该样本图像v和样本图像e对应的第三标识信息与该样本图像v和样本图像e对应的第二标识信息一致时,fj为1,否则为0,K为样本集中包含的样本图像的数量。
根据第一损失值、第二损失值和第三损失值,确定总损失值,总损失值可以通过如下公式进行计算:
L=Lid+λ1Lpos+λ2Lve
公式中,λ1和λ2分别为第二损失值和第三损失值对应的权重值。
实施例8:
图3为本申请一些实施例提供的一种行人识别装置的结构示意图,该装置包括:
获取模块31,用于获取待检测的第一图像及目标人物的第二图像;
处理模块32,用于通过预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息;
识别模块33,用于根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
在一种可能的实施方式中,所述处理模块32,具体用于通过预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二图像中所包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
在一种可能的实施方式中,所述装置包括:
训练模块34,获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述训练模块34,具体用于根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述训练模块34,具体用于针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
在一种可能的实施方式中,所述训练模块34,具体用于针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
在一种可能的实施方式中,所述训练模块34,具体用于针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息与第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
实施例9:
图4为本申请实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本申请实施例还提供了一种电子设备,如图4所示,包括:处理器41、通信接口42、存储器43和通信总线44,其中,处理器41,通信接口42,存储器43通过通信总线44完成相互间的通信;
所述存储器43中存储有计算机程序,当所述程序被所述处理器41执行时,使得所述处理器41执行如下步骤:
获取待检测的第一图像及目标人物的第二图像;
基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息;
若根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
在一种可能的实施方式中,所述处理器,还用于基于预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二张图像中包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
在一种可能的实施方式中,所述行人识别模型通过如下方式进行训练:
获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;
通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;
根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整包括:
根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;
根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;
根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;
根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
在一种可能的实施方式中,所述根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值包括:
针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息和第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;
根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
由于上述电子设备解决问题的原理与行人识别方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口42用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例10:
在上述各实施例的基础上,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
获取待检测的第一图像及目标人物的第二图像;
基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息;
若根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
在一种可能的实施方式中,所述基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息包括:
基于预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二张图像中包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
在一种可能的实施方式中,所述行人识别模型通过如下方式进行训练:
获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;
通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;
根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整包括:
根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;
根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;
根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;
根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
在一种可能的实施方式中,所述根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
在一种可能的实施方式中,所述根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值包括:
针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息和第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;
根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
由于本申请中基于该行人识别模型,获取该第一图像和第二图像是否属于同一行人的图像的第一标识信息,因此可以准确的识别出输入图像是否为属于同一行人的图像,该过程中无需用户参与,提高了行人识别的效率和准确度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (16)
1.一种行人识别方法,其特征在于,所述方法包括:
获取待检测的第一图像及目标人物的第二图像;
基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息;
若根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
2.根据权利要求1所述的方法,其特征在于,所述基于预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息包括:
基于预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二张图像中包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
3.根据权利要求2所述的方法,其特征在于,所述行人识别模型通过如下方式进行训练:
获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;
通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;
根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
4.根据权利要求3所述的方法,其特征在于,所述根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整包括:
根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;
根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;
根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;
根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
5.根据权利要求4所述的方法,其特征在于,所述根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
6.根据权利要求4所述的方法,其特征在于,所述根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值包括:
针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;
根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
7.根据权利要求4所述的方法,其特征在于,所述根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值包括:
针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息和第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;
根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
8.一种行人识别装置,其特征在于,所述装置包括:
获取模块,用于获取待检测的第一图像及目标人物的第二图像;
处理模块,用于通过预先训练完成的行人识别模型,根据所述第一图像及所述第二图像,确定所述第一图像和第二图像是否属于同一行人的图像的第一标识信息;
识别模块,用于根据所述第一标识信息,确定所述第一图像和第二图像为属于同一行人的图像,则确定检测到所述目标人物的图像。
9.根据权利要求8所述的装置,其特征在于,所述处理模块,具体用于通过预先训练完成的行人识别模型,确定所述第一图像和所述第二图像是否同一行人的第一标识信息,并确定所述第一图像和所述第二图像中所包含的行人的姿态标识和所述第一图像和第二图像中所包含的行人的ID中的至少一个。
10.根据权利要求9所述的装置,其特征在于,所述装置包括:
训练模块,用于获取样本集中至少两张样本图像,其中每张样本图像对应有其包含的行人的第一ID,每张样本图像包含的行人的第一姿态标识,以及每两张样本图像是否属于同一行人的图像的第二标识信息;通过原始行人识别模型,根据所述至少两张样本图像,获取每张样本图像包含的行人的第二ID,每张样本图像包含的行人的第二姿态标识,以及每两张样本图像是否属于同一行人的图像的第三标识信息;根据所述样本集中每张样本图像所述第一ID、第二ID、第一姿态标识、第二姿态标识,以及任意两张样本图像的第二标识信息和第三标识信息,对所述原始行人识别模型的参数进行调整。
11.根据权利要求10所述的装置,其特征在于,所述训练模块,具体用于根据所述样本集中每张样本图像所述第一ID和第二ID是否一致,确定第一损失值;根据所述样本集中每张样本图像第一姿态标识和第二姿态标识是否一致,确定第二损失值;根据所述样本集中任意两张样本图像的第二标识信息和第三标识信息是否一致,确定第三损失值;根据所述第一损失值、第二损失值和第三损失值,确定总损失值,根据所述总损失值,对所述原始行人识别模型的参数进行调整。
12.根据权利要求11所述的装置,其特征在于,所述训练模块,具体用于针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;根据所述样本集中每个样本图像对应的子损失值,确定所述第一损失值。
13.根据权利要求11所述的装置,其特征在于,所述训练模块,具体用于针对所述样本集中的每张样本图像,统计该样本图像作为输入时,所述原始行人识别模型输出的该样本图像的第二ID与该样本图像的第一ID一致并且所述原始行人识别模型输出的该样本图像的第二姿态标识与该样本图像的第一姿态标识一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该样本图像对应的子损失值;根据所述样本集中每个样本图像对应的子损失值,确定所述第二损失值。
14.根据权利要求11所述的装置,其特征在于,所述训练模块,具体用于针对所述样本集中的任意两张样本图像,统计该两张样本图像作为输入时,所述原始行人识别模型输出的该两张样本图像的第二标识信息与第三标识信息一致的次数,根据该次数以及样本集中包含的样本图像的总数量,确定该两张样本图像对应的子损失值;根据所述样本集中任意两张样本图像对应的子损失值,确定所述第三损失值。
15.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现根据权利要求1-7中任一所述行人识别方法的步骤。
16.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-7中任一所述行人识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010640777.XA CN111914658B (zh) | 2020-07-06 | 2020-07-06 | 一种行人识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010640777.XA CN111914658B (zh) | 2020-07-06 | 2020-07-06 | 一种行人识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914658A true CN111914658A (zh) | 2020-11-10 |
CN111914658B CN111914658B (zh) | 2024-02-02 |
Family
ID=73227411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010640777.XA Active CN111914658B (zh) | 2020-07-06 | 2020-07-06 | 一种行人识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914658B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018054283A1 (zh) * | 2016-09-23 | 2018-03-29 | 北京眼神科技有限公司 | 人脸模型的训练方法和装置、人脸认证方法和装置 |
CN109190470A (zh) * | 2018-07-27 | 2019-01-11 | 北京市商汤科技开发有限公司 | 行人重识别方法及装置 |
CN109711281A (zh) * | 2018-12-10 | 2019-05-03 | 复旦大学 | 一种基于深度学习的行人重识别与特征识别融合方法 |
CN110175527A (zh) * | 2019-04-29 | 2019-08-27 | 北京百度网讯科技有限公司 | 行人再识别方法及装置、计算机设备及可读介质 |
CN110263697A (zh) * | 2019-06-17 | 2019-09-20 | 哈尔滨工业大学(深圳) | 基于无监督学习的行人重识别方法、装置及介质 |
WO2019218824A1 (zh) * | 2018-05-15 | 2019-11-21 | 腾讯科技(深圳)有限公司 | 一种移动轨迹获取方法及其设备、存储介质、终端 |
CN110807361A (zh) * | 2019-09-19 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 人体识别方法、装置、计算机设备及存储介质 |
CN111209776A (zh) * | 2018-11-21 | 2020-05-29 | 杭州海康威视系统技术有限公司 | 同行人识别方法、装置、处理服务器、存储介质及系统 |
CN111259859A (zh) * | 2020-02-14 | 2020-06-09 | 大连海事大学 | 一种基于联合变量图片生成的行人重识别方法 |
-
2020
- 2020-07-06 CN CN202010640777.XA patent/CN111914658B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018054283A1 (zh) * | 2016-09-23 | 2018-03-29 | 北京眼神科技有限公司 | 人脸模型的训练方法和装置、人脸认证方法和装置 |
WO2019218824A1 (zh) * | 2018-05-15 | 2019-11-21 | 腾讯科技(深圳)有限公司 | 一种移动轨迹获取方法及其设备、存储介质、终端 |
CN109190470A (zh) * | 2018-07-27 | 2019-01-11 | 北京市商汤科技开发有限公司 | 行人重识别方法及装置 |
CN111209776A (zh) * | 2018-11-21 | 2020-05-29 | 杭州海康威视系统技术有限公司 | 同行人识别方法、装置、处理服务器、存储介质及系统 |
CN109711281A (zh) * | 2018-12-10 | 2019-05-03 | 复旦大学 | 一种基于深度学习的行人重识别与特征识别融合方法 |
CN110175527A (zh) * | 2019-04-29 | 2019-08-27 | 北京百度网讯科技有限公司 | 行人再识别方法及装置、计算机设备及可读介质 |
CN110263697A (zh) * | 2019-06-17 | 2019-09-20 | 哈尔滨工业大学(深圳) | 基于无监督学习的行人重识别方法、装置及介质 |
CN110807361A (zh) * | 2019-09-19 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 人体识别方法、装置、计算机设备及存储介质 |
CN111259859A (zh) * | 2020-02-14 | 2020-06-09 | 大连海事大学 | 一种基于联合变量图片生成的行人重识别方法 |
Non-Patent Citations (2)
Title |
---|
ZONGJING CAO等: "Multi-task network based pedestrian re-identification", 2019 6TH INTERNATIONAL CONFERENCE ON SYSTEMS AND INFORMATICS (ICSAI), pages 1324 - 1328 * |
宋宗涛;陈岳林;蔡晓东;曾燕;: "基于多分块三重损失计算的行人识别方法", 电视技术, no. 4 * |
Also Published As
Publication number | Publication date |
---|---|
CN111914658B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107545262B (zh) | 一种在自然场景图像中检测文本的方法及装置 | |
CN108038176B (zh) | 一种路人库的建立方法、装置、电子设备及介质 | |
KR20180104609A (ko) | 다수의 이미지 일치성을 바탕으로 보험클레임 사기 방지를 실현하는 방법, 시스템, 기기 및 판독 가능 저장매체 | |
CN110969166A (zh) | 一种巡检场景下小目标识别方法和系统 | |
CN111275060B (zh) | 识别模型更新处理方法、装置、电子设备及存储介质 | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN110390229B (zh) | 一种人脸图片筛选方法、装置、电子设备及存储介质 | |
CN111639653B (zh) | 一种误检图像确定方法、装置、设备和介质 | |
CN112184508A (zh) | 一种用于图像处理的学生模型的训练方法及装置 | |
CN113111844B (zh) | 一种作业姿态评估方法、装置、本地终端及可读存储介质 | |
CN109840503B (zh) | 一种确定种类信息的方法及装置 | |
CN112446363A (zh) | 一种基于视频抽帧的图像拼接与去重方法及装置 | |
CN109815823B (zh) | 数据处理方法及相关产品 | |
CN109284700B (zh) | 图像中多个人脸检测的方法、存储介质、设备及系统 | |
CN110866428A (zh) | 目标跟踪方法、装置、电子设备及存储介质 | |
CN113256683B (zh) | 目标跟踪方法及相关设备 | |
US20220300774A1 (en) | Methods, apparatuses, devices and storage media for detecting correlated objects involved in image | |
CN111914658B (zh) | 一种行人识别方法、装置、设备及介质 | |
CN115037790B (zh) | 异常注册识别方法、装置、设备及存储介质 | |
CN110197143B (zh) | 一种结算台物品识别方法、装置及电子设备 | |
CN114743048A (zh) | 检测异常秸秆图片的方法和检测装置 | |
CN110751065B (zh) | 训练数据的采集方法及装置 | |
CN114627319A (zh) | 目标数据的上报方法、装置、存储介质及电子装置 | |
CN110008940B (zh) | 一种图像中移除目标物体的方法、装置及电子设备 | |
CN114529852A (zh) | 一种基于视频数据的遗留物检测分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |