CN112036333A - 移动目标的再识别方法及装置 - Google Patents

移动目标的再识别方法及装置 Download PDF

Info

Publication number
CN112036333A
CN112036333A CN202010914438.6A CN202010914438A CN112036333A CN 112036333 A CN112036333 A CN 112036333A CN 202010914438 A CN202010914438 A CN 202010914438A CN 112036333 A CN112036333 A CN 112036333A
Authority
CN
China
Prior art keywords
moving target
feature
image
network model
moving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010914438.6A
Other languages
English (en)
Inventor
胡翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eye Control Technology Co Ltd
Original Assignee
Shanghai Eye Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eye Control Technology Co Ltd filed Critical Shanghai Eye Control Technology Co Ltd
Priority to CN202010914438.6A priority Critical patent/CN112036333A/zh
Publication of CN112036333A publication Critical patent/CN112036333A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供一种移动目标的再识别方法及装置,本实施例提供的移动目标的再识别方法,包括:利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征;利用预设训练模型提取第二图像中待识别移动目标的第二特征,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征;根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标,通过本公开实施例提供的移动目标的再识别方法,以提高行人再识别Re‑id技术中的目标特征提取的准确性从而增强对目标的判断识别能力。

Description

移动目标的再识别方法及装置
技术领域
本公开涉及图像识别领域,尤其涉及一种移动目标的再识别方法及装置。
背景技术
行人再识别Re-id技术作为计算机视觉中的一个重要分支,广泛应用在智慧城市、智慧交通等领域。举例来说,一个行人先后出现在不同的摄像头中,当需要检测多个摄像头中是否同时存在这个行人时,即应用Re-id技术进行识别处理。
现有的Re-id技术中的目标特征提取主要采用深度学习算法模型,在实际应用场景中,不同摄像头因拍摄参数、摆放位置差异导致采集到的图像像素、大小、远近等各有不同,同时受行人的穿着、尺寸、遮挡、姿态等影响,待识别处理的行人数据非常复杂,导致现有的Re-id技术在应用深度学习算法模型提取目标特征进行判断识别时,得到的识别结果准确率并不高。
因此,如何提高行人再识别Re-id技术中的目标特征提取的准确性从而增强对目标的判断识别能力是一个亟待解决的问题。
发明内容
本公开提供一种移动目标的再识别方法,以提高行人再识别Re-id技术中的目标特征提取的准确性从而增强对目标的判断识别能力。
第一方面,本公开提供一种移动目标的再识别方法,包括:
利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征;
利用预设训练模型提取第二图像中待识别移动目标的第二特征,第二图像中包括多个移动目标,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征;
根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标。
在一种可能的设计中,利用预设训练模型提取第一图像中参照移动目标的第一特征,包括:
利用基础分类网络模型提取第一图像中参照移动目标的第一整体特征,第一整体特征表示为N个通道的矩阵,N为大于0的整数;
对第一整体特征进行通道去均值处理,得到第一处理结果;
根据第一处理结果以及神经网络模型提取参照移动目标的第一局部特征;
将第一整体特征和第一局部特征融合,以确定第一特征。
在一种可能的设计中,利用预设训练模型提取第二图像中待识别移动目标的第二特征,包括:
利用基础分类网络模型提取第二图像中待识别移动目标的第二整体特征,第二整体特征表示为M个通道的矩阵,M为大于0的整数;
对第二整体特征进行通道去均值处理,得到第二处理结果;
根据第二处理结果以及神经网络模型提取待识别移动目标的第二局部特征;
将第二整体特征和第二局部特征融合,以确定第二特征。
在一种可能的设计中,对第一整体特征进行通道去均值处理,得到第一处理结果;根据第一处理结果以及神经网络模型提取参照移动目标的第一局部特征,包括:
根据第一整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;
根据坐标位置,应用欧式距离算法,将所有通道聚类为K组,K为大于0的整数;
对K组中的每一组通道的矩阵,应用预设的均值算法,确定第一均值特征矩阵;
根据第一均值特征矩阵,应用归一化和二值化处理,确定K个特征矩阵;
根据K个特征矩阵,应用神经网络模型,确定每个特征矩阵的第一权重;
根据K个特征矩阵和第一权重,确定参照移动目标的第一局部特征。
在一种可能的设计中,对第二整体特征进行通道去均值处理,得到第二处理结果;根据第二处理结果以及神经网络模型提取待识别移动目标的第二局部特征,包括:
根据第二整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;
根据坐标位置,应用欧式距离算法,将所有通道聚类为L组,L为大于0的整数;
对L组中的每一组通道的矩阵,应用均值算法,确定第二均值特征矩阵;
根据第二均值特征矩阵,应用归一化和二值化处理,确定L个特征矩阵;
根据L个特征矩阵,应用神经网络模型,确定每个特征矩阵的第二权重;
根据L个特征矩阵和第二权重,确定待识别移动目标的第二局部特征。
在一种可能的设计中,根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标,包括:
根据第一特征、第二特征以及欧式距离算法,确定第二图像中的任一移动目标与参照移动目标之间的欧式距离值;
对欧式距离值排序,以确定最小欧式距离值;
确定最小欧式距离值对应的第二特征,以确定第二图像中的结果移动目标。
在一种可能的设计中,参照移动目标为行人,结合行人的图像数据,判断不同摄像头中的待识别移动目标是否为行人;或者,
参照移动目标为车辆,结合车辆的图像数据,判断不同摄像头中的待识别移动目标是否为车辆。
第二方面,本公开还提供一种模型训练方法,包括:
获取第一移动目标,第一移动目标为训练集中任一图像中的任一移动目标;
根据第一移动目标,应用基础分类网络模型,提取第一移动目标的第一整体特征,第一整体特征表示为Q个通道的矩阵,Q为大于0的整数;
对第一整体特征进行通道去均值处理,得到处理结果;
根据处理结果,应用待训练神经网络模型进行训练,以确定待训练神经网络模型的第一损失函数参数a,a为大于0的整数。
在一种可能的设计中,获取第一移动目标之后,还包括:
根据第一移动目标,应用待训练基础分类网络模型进行训练,确定待训练基础分类网络模型的第二损失函数参数b,b为大于0的整数。
在一种可能的设计中,还包括:
对第一损失函数参数a和第二损失函数参数b求和,确定和值为sum,sum为大于0的整数;
当对待训练基础分类网络模型进行训练以及对待训练神经网络模型进行训练时,根据和值,应用梯度下降法,确定第一损失函数参数的第一最终值和第二损失函数参数的第二最终值;
根据第一最终值,确定待训练基础分类网络模型的最终基础分类网络模型;
根据第二最终值,确定待训练神经网络模型的最终神经网络模型。
在一种可能的设计中,第一移动目标为行人或车辆。
第三方面,本公开还提供一种移动目标的再识别装置,包括:
第一处理模块,用于利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征;
第二处理模块,用于利用预设训练模型提取第二图像中待识别移动目标的第二特征,第二图像中包括多个移动目标,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征;
确定模块,用于根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标。
在一种可能的设计中,第一处理模块,用于:
利用基础分类网络模型提取第一图像中参照移动目标的第一整体特征,第一整体特征表示为N个通道的矩阵,N为大于0的整数;
对第一整体特征进行通道去均值处理,得到第一处理结果;
根据第一处理结果以及神经网络模型提取参照移动目标的第一局部特征;
将第一整体特征和第一局部特征融合,以确定第一特征。
在一种可能的设计中,第二处理模块,用于:
利用基础分类网络模型提取第二图像中待识别移动目标的第二整体特征,第二整体特征表示为M个通道的矩阵,M为大于0的整数;
对第二整体特征进行通道去均值处理,得到第二处理结果;
根据第二处理结果以及神经网络模型提取待识别移动目标的第二局部特征;
将第二整体特征和第二局部特征融合,以确定第二特征。
在一种可能的设计中,第一处理模块,具体用于:
根据第一整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;
根据坐标位置,应用欧式距离算法,将所有通道聚类为K组,K为大于0的整数;
对K组中的每一组通道的矩阵,应用预设的均值算法,确定第一均值特征矩阵;
根据第一均值特征矩阵,应用归一化和二值化处理,确定K个特征矩阵;
根据K个特征矩阵,应用神经网络模型,确定每个特征矩阵的第一权重;
根据K个特征矩阵和第一权重,确定参照移动目标的第一局部特征。
在一种可能的设计中,第二处理模块,具体用于:
根据第二整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;
根据坐标位置,应用欧式距离算法,将所有通道聚类为L组,L为大于0的整数;
对L组中的每一组通道的矩阵,应用均值算法,确定第二均值特征矩阵;
根据第二均值特征矩阵,应用归一化和二值化处理,确定L个特征矩阵;
根据L个特征矩阵,应用神经网络模型,确定每个特征矩阵的第二权重;
根据L个特征矩阵和第二权重,确定待识别移动目标的第二局部特征。
在一种可能的设计中,确定模块,具体用于:
根据第一特征、第二特征以及欧式距离算法,确定第二图像中的任一移动目标与参照移动目标之间的欧式距离值;
对欧式距离值排序,以确定最小欧式距离值;
确定最小欧式距离值对应的第二特征,以确定第二图像中的结果移动目标。
在一种可能的设计中,参照移动目标为行人,结合行人的图像数据,判断不同摄像头中的待识别移动目标是否为行人;或者,
参照移动目标为车辆,结合车辆的图像数据,判断不同摄像头中的待识别移动目标是否为车辆。
第四方面,本公开还提供一种模型训练装置,包括:
获取模块,用于获取第一移动目标,第一移动目标为训练集中任一图像中的任一移动目标;
第一处理模块,用于根据第一移动目标,应用基础分类网络模型,提取第一移动目标的第一整体特征,第一整体特征表示为Q个通道的矩阵,Q为大于0的整数;
第二处理模块,用于对第一整体特征进行通道去均值处理,得到处理结果;
确定模块,用于根据处理结果,应用待训练神经网络模型进行训练,以确定待训练神经网络模型的第一损失函数参数a,a为大于0的整数。
在一种可能的设计中,第一处理模块,还用于:
根据第一移动目标,应用待训练基础分类网络模型进行训练,确定待训练基础分类网络模型的第二损失函数参数b,b为大于0的整数。
在一种可能的设计中,确定模块,还用于:
对第一损失函数参数a和第二损失函数参数b求和,确定和值为sum,sum为大于0的整数;
当对待训练基础分类网络模型进行训练以及对待训练神经网络模型进行训练时,根据和值,应用梯度下降法,确定第一损失函数参数的第一最终值和第二损失函数参数的第二最终值;
根据第一最终值,确定待训练基础分类网络模型的最终基础分类网络模型;
根据第二最终值,确定待训练神经网络模型的最终神经网络模型。
在一种可能的设计中,第一移动目标为行人或车辆。
第五方面,本公开还提供一种识别系统,包括:
处理器;以及,
存储器,用于存储处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行第一方面中任意一种移动目标的再识别方法。
第六方面,本公开还提供一种模型训练系统,包括:
处理器;以及,
存储器,用于存储处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行第二方面中任意一种模型训练方法。
第七方面,本公开实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意一种移动目标的再识别方法。
第八方面,本公开实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第二方面中任意一种模型训练方法。
本公开提供一种移动目标的再识别方法及装置,通过利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征;利用预设训练模型提取第二图像中待识别移动目标的第二特征,第二图像中包括多个移动目标,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征;根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标,以提高行人再识别Re-id技术中的目标特征提取的准确性从而增强对目标的判断识别能力。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开根据一示例实施例示出的移动目标的再识别方法的应用场景图;
图2为本公开根据一示例实施例示出的移动目标的再识别方法的流程示意图;
图3为本公开根据一示例实施例示出的模型训练方法的流程示意图;
图4为本公开根据一示例实施例示出的移动目标的再识别装置的结构示意图;
图5为本公开根据一示例实施例示出的模型训练装置的结构示意图;
图6为本公开根据一示例实施例示出的识别系统的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本公开的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面将结合附图,对本公开的实施例进行描述。
图1为本公开根据一示例实施例示出的移动目标的再识别方法的应用场景图,如图1所示,第一图像101为参照移动目标:行人,对第一图像101应用基础分类网络模型提取出第一整体特征;再根据第一整体特征进行通道去均值处理,即根据第一整体特征中每个通道的矩阵数据的最大值以及最大值的坐标位置,应用欧式距离算法,将所有通道聚类为K组,K为大于0的整数;对K组中的每一组通道的矩阵,应用预设的均值算法,确定第一均值特征矩阵;根据第一均值特征矩阵,应用归一化和二值化处理,确定K个特征矩阵;由于二值化处理后的K个特征矩阵中的数值仅为0或1,因此对每一个特征矩阵,将数值为1的位置作为前景,将数值为0的位置作为背景,得出包含前景的最小外接矩形框。再根据最小外接矩形框映射的特征图,应用神经网络模型,确定每个特征矩阵的第一权重;根据K个特征矩阵和第一权重,确定参照移动目标的第一局部特征。将第一整体特征和第一局部特征融合,以确定第一特征,从而提高行人再识别Re-id技术中的目标特征提取的准确性以增强对目标的判断识别能力。
图2为本公开根据一示例实施例示出的移动目标的再识别方法的流程示意图;如图2所示,本实施例提供的移动目标的再识别方法,包括:
步骤201、利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征。
具体的,第一图像中仅包括一个移动目标,即参照移动目标,利用基础分类网络模型提取第一图像中参照移动目标的第一整体特征,第一整体特征表示为N个通道的矩阵,N为大于0的整数;对第一整体特征进行通道去均值处理,得到第一处理结果;根据第一处理结果以及神经网络模型提取参照移动目标的第一局部特征;将第一整体特征和第一局部特征融合,以确定第一特征。
进一步具体的,根据第一整体特征得到第一局部特征的具体处理过程如下。根据第一整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;根据坐标位置,应用欧式距离算法,将所有通道聚类为K组,K为大于0的整数;对K组中的每一组通道的矩阵,应用预设的均值算法,确定第一均值特征矩阵;根据第一均值特征矩阵,应用归一化和二值化处理,确定K个特征矩阵;由于二值化处理后的K个特征矩阵中的数值仅为0或1,因此对每一个特征矩阵,将数值为1的位置作为前景,将数值为0的位置作为背景,得出包含前景的最小外接矩形框;根据最小外接矩形框映射的特征图,应用神经网络模型,确定每个特征矩阵的第一权重;根据K个特征矩阵和第一权重,确定参照移动目标的第一局部特征。
举例来说,第一图像中的参照移动目标为行人,应用基础分类网络模型提取出参照移动目标第一整体特征为6个通道的矩阵,分别是
Figure BDA0002664498590000091
Figure BDA0002664498590000101
Figure BDA0002664498590000102
确定这6个通道的矩阵中数据的最大值以及最大值的坐标位置分别为5、(1,0);4、(0,0);5、(1,0);6、(1,1);3、(0,1);4、(1,1);根据坐标位置,应用欧式距离算法,计算出两两坐标点之间的距离,并根据距离的远近将这6个通道的矩阵聚类为4组,得到的4组矩阵为:
Figure BDA0002664498590000103
Figure BDA0002664498590000104
Figure BDA0002664498590000105
以及
Figure BDA0002664498590000106
对4组中每一个通道的矩阵应用预设的均值算法分别求出各组的均值特征矩阵,即当每组中有多个通道的矩阵存在时,将多个矩阵对应位置的数值取平均得到一个总的均值特征矩阵,得到的均值特征矩阵为
Figure BDA0002664498590000107
Figure BDA0002664498590000108
对4组均值特征矩阵根据各自矩阵中的最大值、最小值做归一化处理,处理结果为
Figure BDA0002664498590000109
Figure BDA00026644985900001010
再进行二值化处理,设定阈值为0.5,当矩阵中的数值大于或等于阈值0.5时,将数值更改为1;当数值小于0.5时,将数值更改为0,得到的4个特征矩阵分别为
Figure BDA00026644985900001011
Figure BDA00026644985900001012
Figure BDA00026644985900001013
进一步的,根据这4个特征矩阵中数值1的位置,得出包含前景的最小外接矩形框,其中将数值为1的位置作为前景,将数值为0的位置作为背景。从而保证得到的最小外接矩形框能更准确的确定出所需分析的特征图。再根据最小外接矩形框映射的特征图,应用神经网络模型,得到4组尺寸一致的特征图,并确定出每组特征图的权重值;将每组的特征图以及对应的权重值进行加权处理,最终得到参照移动目标的第一局部特征。
步骤202、利用预设训练模型提取第二图像中待识别移动目标的第二特征,第二图像中包括多个移动目标,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征。
具体的,利用基础分类网络模型提取第二图像中待识别移动目标的第二整体特征,第二整体特征表示为M个通道的矩阵,M为大于0的整数;对第二整体特征进行通道去均值处理,得到第二处理结果;根据第二处理结果以及神经网络模型提取待识别移动目标的第二局部特征;将第二整体特征和第二局部特征融合,以确定第二特征。
进一步具体的,根据第二整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;根据坐标位置,应用欧式距离算法,将所有通道聚类为L组,L为大于0的整数;对L组中的每一组通道的矩阵,应用均值算法,确定第二均值特征矩阵;根据第二均值特征矩阵,应用归一化和二值化处理,确定L个特征矩阵;根据L个特征矩阵,应用神经网络模型,确定每个特征矩阵的第二权重;根据L个特征矩阵和第二权重,确定待识别移动目标的第二局部特征。
其中,对待识别移动目标提取第二整体特征和第二局部特征以及最终融合得到第二特征的处理方法与步骤201中对参照移动目标的处理方法相同,在此不再赘述。不同点在于,第二图像中有多个待识别移动目标,对每个待识别移动目标都需要提取得出对应的特征。
通过上述步骤201-202的方法,已经得到了参照移动目标的第一特征,每个待识别移动目标的特征,接下来通过这些得到的特征从待识别移动目标中确定是否存在与参照移动目标相同的结果移动目标,处理过程如下。
步骤203、根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标。
具体的,根据第一特征、第二特征以及欧式距离算法,确定第二图像中的任一移动目标与参照移动目标之间的欧式距离值;对欧式距离值排序,以确定最小欧式距离值;确定最小欧式距离值对应的第二特征,以确定第二图像中的结果移动目标。
进一步具体的,上述处理过程中的参照移动目标为行人,通过结合行人的图像数据,判断不同摄像头中的待识别移动目标是否为行人;或者,参照移动目标为车辆,通过结合车辆的图像数据,判断不同摄像头中的待识别移动目标是否为车辆。
通过上述步骤201-203的方法,利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征;利用预设训练模型提取第二图像中待识别移动目标的第二特征,第二图像中包括多个移动目标,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征;根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标,以提高行人再识别Re-id技术中的目标特征提取的准确性从而增强对目标的判断识别能力。
进一步具体的,上述步骤201-203的方法中应用到的预设训练模型有两个,分别是基础分类网络模型和神经网络模型,在实际应用这两个模型提取图像特征之前,需要经过大量的图像数据训练以得出合适、精确的模型参数,从而能够提高图像特征提取的准确性。因此,下面的实施例将展开模型训练的方法步骤,具体详情如下。
图3为本公开根据一示例实施例示出的模型训练方法的流程示意图;如图3所示,本实施例提供的模型训练方法,包括:
步骤301、获取第一移动目标,第一移动目标为训练集中任一图像中的任一移动目标。
具体的,第一移动目标为训练集中任一图像的任一移动目标,训练集中的训练数据可以以元组(x_i,p_i,c_i)表示,其中,i表示第i个训练数据,x表示图像本身,p表示该图像中移动目标的编号,c表示该图像是哪一个摄像头所拍摄的)。在实际训练过程中,我们可以一次读取多个训练数据,这些数据共同组成一个批次。在对第一移动目标进行训练前,可以对图像进行预处理,包括但不限于:将图像大小调整为固定尺寸等。
步骤302、根据第一移动目标,应用基础分类网络模型,提取第一移动目标的第一整体特征,第一整体特征表示为Q个通道的矩阵,Q为大于0的整数。
具体的,预设初始的基础分类网络模型参数,根据第一移动目标,应用基础分类网络模型,提取第一移动目标的第一整体特征;为了优化得到更合适的基础分类网络模型参数,根据第一移动目标,应用待训练基础分类网络模型进行训练,更新确定待训练基础分类网络模型的第二损失函数参数b,b为大于0的整数。
步骤303、对第一整体特征进行通道去均值处理,得到处理结果。
步骤304、根据处理结果,应用待训练神经网络模型进行训练,以确定待训练神经网络模型的第一损失函数参数a,a为大于0的整数。
具体的,步骤303-304中得到处理结果的方法可参见上文中步骤202得到最小外接矩形框映射的特征图的过程,在此不再赘述。预设初始的神经网络模型参数,对得到的最小外接矩形框映射的特征图应用待训练神经网络模型进行训练,更新确定待训练神经网络模型的第一损失函数参数a。
进一步具体的,对第一损失函数参数a和第二损失函数参数b求和,确定和值为sum,sum为大于0的整数;对待训练基础分类网络模型以及待训练神经网络模型进行训练时,根据和值,应用梯度下降法进行参数优化分析,当两个损失函数参数都不再下降时,说明待训练基础分类网络模型和待训练神经网络模型都已稳定,这时的参数值可确定为第一损失函数参数的第一最终值和第二损失函数参数的第二最终值;根据第一最终值,确定待训练基础分类网络模型的最终基础分类网络模型;根据第二最终值,确定待训练神经网络模型的最终神经网络模型。
进一步具体的,训练集中的第一移动目标为行人或车辆。
图4为本公开根据一示例实施例示出的移动目标的再识别装置的结构示意图。如图4所示,本实施例提供的移动目标的再识别装置40,包括:
第一处理模块401,用于利用预设训练模型提取第一图像中参照移动目标的第一特征,第一图像中仅包括一个移动目标,第一特征用于表征参照移动目标的整体特征和/或局部特征;
第二处理模块402,用于利用预设训练模型提取第二图像中待识别移动目标的第二特征,第二图像中包括多个移动目标,待识别移动目标为第二图像中任意一个移动目标,第二特征用于表征待识别移动目标的整体特征和/或局部特征;
确定模块403,用于根据第一特征以及第二特征从第二图像的多个移动目标中确定出参照移动目标所对应的一个结果移动目标。
在一种可能的设计中,第一处理模块401,用于:
利用基础分类网络模型提取第一图像中参照移动目标的第一整体特征,第一整体特征表示为N个通道的矩阵,N为大于0的整数;
对第一整体特征进行通道去均值处理,得到第一处理结果;
根据第一处理结果以及神经网络模型提取参照移动目标的第一局部特征;
将第一整体特征和第一局部特征融合,以确定第一特征。
在一种可能的设计中,第二处理模块402,用于:
利用基础分类网络模型提取第二图像中待识别移动目标的第二整体特征,第二整体特征表示为M个通道的矩阵,M为大于0的整数;
对第二整体特征进行通道去均值处理,得到第二处理结果;
根据第二处理结果以及神经网络模型提取待识别移动目标的第二局部特征;
将第二整体特征和第二局部特征融合,以确定第二特征。
在一种可能的设计中,第一处理模块401,具体用于:
根据第一整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;
根据坐标位置,应用欧式距离算法,将所有通道聚类为K组,K为大于0的整数;
对K组中的每一组通道的矩阵,应用预设的均值算法,确定第一均值特征矩阵;
根据第一均值特征矩阵,应用归一化和二值化处理,确定K个特征矩阵;
根据K个特征矩阵,应用神经网络模型,确定每个特征矩阵的第一权重;
根据K个特征矩阵和第一权重,确定参照移动目标的第一局部特征。
在一种可能的设计中,第二处理模块402,具体用于:
根据第二整体特征,确定每个通道的矩阵中数据的最大值以及最大值的坐标位置;
根据坐标位置,应用欧式距离算法,将所有通道聚类为L组,L为大于0的整数;
对L组中的每一组通道的矩阵,应用均值算法,确定第二均值特征矩阵;
根据第二均值特征矩阵,应用归一化和二值化处理,确定L个特征矩阵;
根据L个特征矩阵,应用神经网络模型,确定每个特征矩阵的第二权重;
根据L个特征矩阵和第二权重,确定待识别移动目标的第二局部特征。
在一种可能的设计中,确定模块403,具体用于:
根据第一特征、第二特征以及欧式距离算法,确定第二图像中的任一移动目标与参照移动目标之间的欧式距离值;
对欧式距离值排序,以确定最小欧式距离值;
确定最小欧式距离值对应的第二特征,以确定第二图像中的结果移动目标。
在一种可能的设计中,参照移动目标为行人,结合行人的图像数据,判断不同摄像头中的待识别移动目标是否为行人;或者,
参照移动目标为车辆,结合车辆的图像数据,判断不同摄像头中的待识别移动目标是否为车辆。
图5为本公开根据一示例实施例示出的模型训练装置的结构示意图。如图5所示,本实施例提供的模型训练装置50,包括:
获取模块501,用于获取第一移动目标,第一移动目标为训练集中任一图像中的任一移动目标;
第一处理模块502,用于根据第一移动目标,应用基础分类网络模型,提取第一移动目标的第一整体特征,第一整体特征表示为Q个通道的矩阵,Q为大于0的整数;
第二处理模块503,用于对第一整体特征进行通道去均值处理,得到处理结果;
确定模块504,用于根据处理结果,应用待训练神经网络模型进行训练,以确定待训练神经网络模型的第一损失函数参数a,a为大于0的整数。
在一种可能的设计中,第一处理模块502,还用于:
根据第一移动目标,应用待训练基础分类网络模型进行训练,确定待训练基础分类网络模型的第二损失函数参数b,b为大于0的整数。
在一种可能的设计中,确定模块504,还用于:
对第一损失函数参数a和第二损失函数参数b求和,确定和值为sum,sum为大于0的整数;
当对待训练基础分类网络模型进行训练以及对待训练神经网络模型进行训练时,根据和值,应用梯度下降法,确定第一损失函数参数的第一最终值和第二损失函数参数的第二最终值;
根据第一最终值,确定待训练基础分类网络模型的最终基础分类网络模型;
根据第二最终值,确定待训练神经网络模型的最终神经网络模型。
在一种可能的设计中,第一移动目标为行人或车辆。
图6为本公开根据一示例实施例示出的识别系统的结构示意图。如图6所示,本实施例提供的一种识别系统60,包括:
处理器601;以及,
存储器602,用于存储处理器的可执行指令,该存储器还可以是flash(闪存);
其中,处理器601配置为经由执行可执行指令来执行上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器602既可以是独立的,也可以跟处理器601集成在一起。
当存储器602是独立于处理器601之外的器件时,识别系统60,还可以包括:
总线603,用于连接处理器601以及存储器602。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。

Claims (17)

1.一种移动目标的再识别方法,其特征在于,包括:
利用预设训练模型提取第一图像中参照移动目标的第一特征,所述第一图像中仅包括一个移动目标,所述第一特征用于表征所述参照移动目标的整体特征和/或局部特征;
利用所述预设训练模型提取第二图像中待识别移动目标的第二特征,所述第二图像中包括多个移动目标,所述待识别移动目标为所述第二图像中任意一个移动目标,所述第二特征用于表征所述待识别移动目标的整体特征和/或局部特征;
根据所述第一特征以及所述第二特征从所述第二图像的多个移动目标中确定出所述参照移动目标所对应的一个结果移动目标。
2.根据权利要求1所述的移动目标的再识别方法,其特征在于,所述利用预设训练模型提取第一图像中参照移动目标的第一特征,包括:
利用基础分类网络模型提取所述第一图像中所述参照移动目标的第一整体特征,所述第一整体特征表示为N个通道的矩阵,N为大于0的整数;
对所述第一整体特征进行通道去均值处理,得到第一处理结果;
根据所述第一处理结果以及神经网络模型提取所述参照移动目标的第一局部特征;
将所述第一整体特征和所述第一局部特征融合,以确定所述第一特征。
3.根据权利要求2所述的移动目标的再识别方法,其特征在于,所述利用所述预设训练模型提取第二图像中待识别移动目标的第二特征,包括:
利用基础分类网络模型提取所述第二图像中所述待识别移动目标的第二整体特征,所述第二整体特征表示为M个通道的矩阵,M为大于0的整数;
对所述第二整体特征进行通道去均值处理,得到第二处理结果;
根据所述第二处理结果以及所述神经网络模型提取所述待识别移动目标的第二局部特征;
将所述第二整体特征和所述第二局部特征融合,以确定所述第二特征。
4.根据权利要求2所述的移动目标的再识别方法,其特征在于,所述对所述第一整体特征进行通道去均值处理,得到第一处理结果;根据所述第一处理结果以及神经网络模型提取所述参照移动目标的第一局部特征,包括:
根据所述第一整体特征,确定每个通道的矩阵中数据的最大值以及所述最大值的坐标位置;
根据所述坐标位置,应用欧式距离算法,将所有通道聚类为K组,K为大于0的整数;
对所述K组中的每一组通道的矩阵,应用预设的均值算法,确定第一均值特征矩阵;
根据所述第一均值特征矩阵,应用归一化和二值化处理,确定K个特征矩阵;
根据所述K个特征矩阵,应用所述神经网络模型,确定每个特征矩阵的第一权重;
根据所述K个特征矩阵和所述第一权重,确定所述参照移动目标的第一局部特征。
5.根据权利要求3所述的移动目标的再识别方法,其特征在于,所述对所述第二整体特征进行通道去均值处理,得到第二处理结果;根据所述第二处理结果以及所述神经网络模型提取所述待识别移动目标的第二局部特征,包括:
根据所述第二整体特征,确定每个通道的矩阵中数据的最大值以及所述最大值的坐标位置;
根据所述坐标位置,应用所述欧式距离算法,将所有通道聚类为L组,L为大于0的整数;
对所述L组中的每一组通道的矩阵,应用所述均值算法,确定第二均值特征矩阵;
根据所述第二均值特征矩阵,应用所述归一化和所述二值化处理,确定L个特征矩阵;
根据所述L个特征矩阵,应用所述神经网络模型,确定每个特征矩阵的第二权重;
根据所述L个特征矩阵和所述第二权重,确定所述待识别移动目标的第二局部特征。
6.根据权利要求1、3或5所述的移动目标的再识别方法,其特征在于,所述根据所述第一特征以及所述第二特征从所述第二图像的多个移动目标中确定出所述参照移动目标所对应的一个结果移动目标,包括:
根据所述第一特征、所述第二特征以及所述欧式距离算法,确定所述第二图像中的任一移动目标与所述参照移动目标之间的欧式距离值;
对所述欧式距离值排序,以确定最小欧式距离值;
确定所述最小欧式距离值对应的第二特征,以确定所述第二图像中的所述结果移动目标。
7.根据权利要求1所述的移动目标的再识别方法,其特征在于,
所述参照移动目标为行人,结合所述行人的图像数据,判断不同摄像头中的所述待识别移动目标是否为所述行人;或者,
所述参照移动目标为车辆,结合所述车辆的图像数据,判断不同摄像头中的所述待识别移动目标是否为所述车辆。
8.一种模型训练方法,其特征在于,包括:
获取第一移动目标,所述第一移动目标为训练集中任一图像中的任一移动目标;
根据所述第一移动目标,应用基础分类网络模型,提取所述第一移动目标的第一整体特征,所述第一整体特征表示为Q个通道的矩阵,Q为大于0的整数;
对所述第一整体特征进行通道去均值处理,得到处理结果;
根据所述处理结果,应用待训练神经网络模型进行训练,以确定所述待训练神经网络模型的第一损失函数参数a,a为大于0的整数。
9.根据权利要求8所述的模型训练方法,其特征在于,所述获取第一移动目标之后,还包括:
根据所述第一移动目标,应用待训练基础分类网络模型进行训练,确定所述待训练基础分类网络模型的第二损失函数参数b,b为大于0的整数。
10.根据权利要求9所述的模型训练方法,其特征在于,还包括:
对所述第一损失函数参数a和所述第二损失函数参数b求和,确定和值为sum,sum为大于0的整数;
当对所述待训练基础分类网络模型进行训练以及对所述待训练神经网络模型进行训练时,根据所述和值,应用梯度下降法,确定所述第一损失函数参数的第一最终值和所述第二损失函数参数的第二最终值;
根据所述第一最终值,确定所述待训练基础分类网络模型的最终基础分类网络模型;
根据所述第二最终值,确定所述待训练神经网络模型的最终神经网络模型。
11.根据权利要求8-10中任意一项所述的方法,其特征在于,
所述第一移动目标为行人或车辆。
12.一种移动目标的再识别装置,其特征在于,包括:
第一处理模块,用于利用预设训练模型提取第一图像中参照移动目标的第一特征,所述第一图像中仅包括一个移动目标,所述第一特征用于表征所述参照移动目标的整体特征和/或局部特征;
第二处理模块,用于利用所述预设训练模型提取第二图像中待识别移动目标的第二特征,所述第二图像中包括多个移动目标,所述待识别移动目标为所述第二图像中任意一个移动目标,所述第二特征用于表征所述待识别移动目标的整体特征和/或局部特征;
确定模块,用于根据所述第一特征以及所述第二特征从所述第二图像的多个移动目标中确定出所述参照移动目标所对应的一个结果移动目标。
13.一种模型训练装置,其特征在于,包括:
获取模块,用于获取第一移动目标,所述第一移动目标为训练集中任一图像中的任一移动目标;
第一处理模块,用于根据所述第一移动目标,应用基础分类网络模型,提取所述第一移动目标的第一整体特征,所述第一整体特征表示为Q个通道的矩阵,Q为大于0的整数;
第二处理模块,用于对所述第一整体特征进行通道去均值处理,得到处理结果;
确定模块,用于根据所述处理结果,应用待训练神经网络模型进行训练,以确定所述待训练神经网络模型的第一损失函数参数a,a为大于0的整数。
14.一种识别系统,其特征在于,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任一项所述移动目标的再识别方法。
15.一种模型训练系统,其特征在于,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求8至11中任一项所述模型训练方法。
16.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任一项所述移动目标的再识别方法。
17.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求8至11中任一项所述模型训练方法。
CN202010914438.6A 2020-09-03 2020-09-03 移动目标的再识别方法及装置 Pending CN112036333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010914438.6A CN112036333A (zh) 2020-09-03 2020-09-03 移动目标的再识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010914438.6A CN112036333A (zh) 2020-09-03 2020-09-03 移动目标的再识别方法及装置

Publications (1)

Publication Number Publication Date
CN112036333A true CN112036333A (zh) 2020-12-04

Family

ID=73591763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010914438.6A Pending CN112036333A (zh) 2020-09-03 2020-09-03 移动目标的再识别方法及装置

Country Status (1)

Country Link
CN (1) CN112036333A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784166A (zh) * 2018-12-13 2019-05-21 北京飞搜科技有限公司 行人重识别的方法及装置
CN110689043A (zh) * 2019-08-22 2020-01-14 长沙千视通智能科技有限公司 一种基于多重注意力机制的车辆细粒度识别方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784166A (zh) * 2018-12-13 2019-05-21 北京飞搜科技有限公司 行人重识别的方法及装置
CN110689043A (zh) * 2019-08-22 2020-01-14 长沙千视通智能科技有限公司 一种基于多重注意力机制的车辆细粒度识别方法及装置

Similar Documents

Publication Publication Date Title
CN108710865B (zh) 一种基于神经网络的司机异常行为检测方法
CN108960245B (zh) 轮胎模具字符的检测与识别方法、装置、设备及存储介质
CN108520226B (zh) 一种基于躯体分解和显著性检测的行人重识别方法
CN109272509B (zh) 一种连续图像的目标检测方法、装置、设备及存储介质
CN108717524B (zh) 一种基于双摄手机和人工智能系统的手势识别系统
CN107633226B (zh) 一种人体动作跟踪特征处理方法
CN104200228B (zh) 一种安全带识别方法与系统
CN111461170A (zh) 车辆图像检测方法、装置、计算机设备及存储介质
CN111814661A (zh) 基于残差-循环神经网络的人体行为识别方法
Wang et al. Combined use of FCN and Harris corner detection for counting wheat ears in field conditions
CN104615986A (zh) 利用多检测器对场景变化的视频图像进行行人检测的方法
CN111046789A (zh) 一种行人重识别方法
CN111914642A (zh) 一种行人重识别方法、装置、设备及介质
CN112381092B (zh) 跟踪方法、装置及计算机可读存储介质
CN111914762A (zh) 基于步态信息的身份识别方法及装置
CN111723773A (zh) 遗留物检测方法、装置、电子设备及可读存储介质
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN112200056A (zh) 人脸活体检测方法、装置、电子设备及存储介质
CN112633221A (zh) 一种人脸方向的检测方法及相关装置
CN114663769A (zh) 一种基于YOLO v5的水果识别方法
CN111160107A (zh) 一种基于特征匹配的动态区域检测方法
CN111753610A (zh) 天气识别方法及装置
CN113963295A (zh) 视频片段中地标识别方法、装置、设备及存储介质
CN111738310B (zh) 物料分类方法、装置、电子设备和存储介质
CN117437691A (zh) 一种基于轻量化网络的实时多人异常行为识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination