CN112215200A - 身份识别的方法和装置 - Google Patents
身份识别的方法和装置 Download PDFInfo
- Publication number
- CN112215200A CN112215200A CN202011176467.3A CN202011176467A CN112215200A CN 112215200 A CN112215200 A CN 112215200A CN 202011176467 A CN202011176467 A CN 202011176467A CN 112215200 A CN112215200 A CN 112215200A
- Authority
- CN
- China
- Prior art keywords
- target
- target object
- target image
- distance
- identifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 17
- 230000015654 memory Effects 0.000 claims description 44
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000001360 synchronised effect Effects 0.000 description 10
- 238000003062 neural network model Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000001174 ascending effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 241001310793 Podium Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种身份识别的方法和装置,包括:获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息;根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象;根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。本申请提供的方案,可以提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员敏感信息的泄露。
Description
技术领域
本申请实施例涉及信息技术领域,并且更具体地,涉及一种身份识别的方法和装置。
背景技术
在对课堂质量进行算法监测时,教师身份的识别及跟踪是监测技术的根本,受限于摄像头等硬件条件,现有方法不能有效的识别教师身份,错检率和漏检率较高。
目前关于教师身份的识别可以通过以下方式实现:(1)、规定教师活动范围以及教师持有可识别特征物体等,以识别教师身份,然而由于教师在课堂上的行动比较随机,基于规则的方法容易错检或漏检,且在特殊情况下没有处理能力。
(2)、根据数据库录入的信息对已有人员的特征进行模型训练,对待识别图像进行特征提取与匹配,以识别待识别图像的身份,但是这种方法需要搭建数据库,并且需要长期更新系统录入信息,无法实时更新人员特征,且存在个人隐私泄露风险以及安全隐患。
(3)、通过高清硬件设备,对教室无死角覆盖采集图片,并通过高清质量图像样本,进行基于人体人脸等特征的匹配搜索,这种方法搭建和维护成本较高,受限于网络速度等硬件因素,无法广泛落地实行,且存在个人隐私泄露风险以及安全隐患。
因此,如何提高身份识别的效率和准确率,同时降低识别成本以及减少人员敏感信息的泄露是一项需要解决的问题。
申请内容
本申请实施例提供一种身份识别的方法和装置,可以提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员敏感信息的泄露。
第一方面,提供一种身份识别的方法,包括:获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息;根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象;根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。
本申请提供的方案,通过对第一目标图像的目标对象进行分类,并根据分类后获得的第一分类数据集识别第二目标图像中与第一目标对象身份相同的对象,即识别第二目标图像中的身份为教师的目标对象,可以提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员敏感信息的泄露。进一步地,可以基于识别的目标对象的身份检测目标对象的行为,提高监管的准确率和效率。
结合第一方面,在一些可能的实现方式中,所述方法还包括:获取所述第一目标对象和所述第二目标图像中的目标对象的第二特征信息,所述第二特征信息包括以下信息中的一种或多种:纹理、轮廓、颜色;所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:将所述第二特征信息输入识别模型,以获得所述第一目标对象的第一置信度值和所述第二目标图像中的目标对象的第二置信度值;根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
本申请实施例提供的方案,通过获取已识别的身份为教师的第一目标对象的第二特征信息和待识别的第二目标图像中的目标对象的第二特征信息,并基于获取的第二特征信息和识别模型识别第二目标图像中与第一目标对象的身份相同的对象,可以进一步提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员的敏感信息泄露。
结合第一方面,在一些可能的实现方式中,所述根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:计算所述第一置信度值和所述第二置信度值的目标距离;根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
结合第一方面,在一些可能的实现方式中,所述目标距离包括欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
结合第一方面,在一些可能的实现方式中,所述根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:将所述目标距离中大于或等于第一阈值的距离所对应的对象识别为与所述第一目标对象身份相同的对象。
结合第一方面,在一些可能的实现方式中,所述根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:对所述目标距离进行排序,以获得第一排序结果;按照所述第一排序结果从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
本申请实施例提供的方案,通过根据获得的目标距离识别第二目标图像中与第一目标对象身份相同的对象,可以进一步提高身份识别的效率和准确率。
结合第一方面,在一些可能的实现方式中,所述方法还包括:
在所述第二目标图像包括多张图像的情况下,对所述多张图像的目标距离进行排序,以获得第二排序结果;
从所述第二排序结果中确定第三目标图像,所述第三目标图像为排名小于或等于第二阈值所对应的目标图像,或者,所述第三目标图像为排名为大于或等于第三阈值所对应的目标图像;
所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:
根据所述第一分类数据集,基于杰卡德距离从所述第三目标图像中识别与所述第一目标对象身份相同的对象。
本申请提供的方案,通过对多张图像每一张目标图像中最大的目标距离进行排序,并从第二排序结果中确定第三目标图像,识别第三目标图像中与第一目标身份相同的对象,可以减少错误样本噪声,提高识别的鲁棒性和准确性。结合第一方面,在一些可能的实现方式中,在所述根据所述第一特征信息对所述目标对象进行分类后,所述方法还包括:获取所述第一目标图像中的目标对象的第三特征信息,所述第三特征信息包括所述第一目标图像中的目标对象所佩戴的设备和/或所述第一目标图像中的目标对象的颜色;所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:根据所述第三特征信息对所述第一分类数据集和第二分类数据集中的目标对象识别,所述第二分类数据集为所述第一目标图像中除所述第一分类数据集中的目标对象外的目标对象;根据识别后的所述第一分类数据集从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
本申请实施例提供的方案,通过获取的第三特征信息重新对第一分类数据集和第二分类数据集中的目标对象进行识别,并基于识别后获得的第一分类数据集识别第二目标图像中与第一目标对象身份相同的对象,可以进一步提高身份识别的准确率。
结合第一方面,在一些可能的实现方式中,所述获取第一目标图像中的目标对象的第一特征信息,包括:获取所述目标对象的部分骨骼点信息。
本申请实施例提供的方案,通过获取目标对象的部分骨骼点信息,并根据该部分骨骼点信息识别目标对象的身份,可以进一步提高身份识别的准确率和效率。
第二方面,提供一种身份识别的装置,包括:所述装置包括存储器和处理器;所述存储器用于存储程序代码;所述处理器,调用所述程序代码,当程序代码被执行时,用于执行以下操作:获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息;根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象;根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。
结合第二方面,在一些可能的实现方式中,所述处理器进一步用于:获取所述第一目标对象和所述第二目标图像中的目标对象的第二特征信息,所述第二特征信息包括以下信息中的一种或多种:纹理、轮廓、颜色;将所述第二特征信息输入识别模型,以获得所述第一目标对象的第一置信度值和所述第二目标图像中的目标对象的第二置信度值;根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
结合第二方面,在一些可能的实现方式中,所述处理器进一步用于:计算所述第一置信度值和所述第二置信度值的目标距离;根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
结合第二方面,在一些可能的实现方式中,所述目标距离包括欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
结合第二方面,在一些可能的实现方式中,将所述目标距离中大于或等于第一阈值的距离所对应的对象识别为与所述第一目标对象身份相同的对象。
结合第二方面,在一些可能的实现方式中,所述处理器进一步用于:对所述目标距离进行排序,以获得第一排序结果;按照所述第一排序结果从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
结合第二方面,在一些可能的实现方式中,所述处理器进一步用于:在所述第二目标图像包括多张图像的情况下,对所述多张图像的目标距离进行排序,以获得第二排序结果;从所述第二排序结果中确定第三目标图像,所述第三目标图像为排名小于或等于第二阈值所对应的目标图像,或者,所述第三目标图像为排名为大于或等于第三阈值所对应的目标图像;根据所述第一分类数据集,基于杰卡德距离从所述第三目标图像中识别与所述第一目标对象身份相同的对象。结合第二方面,在一些可能的实现方式中,在所述根据所述第一特征信息对所述目标对象进行分类后,所述处理器进一步用于:获取所述第一目标图像中的目标对象的第三特征信息,所述第三特征信息包括所述第一目标图像中的目标对象所佩戴的设备和/或所述第一目标图像中的目标对象的颜色;根据所述第三特征信息对所述第一分类数据集和第二分类数据集中的目标对象识别,所述第二分类数据集为所述第一目标图像中除所述第一分类数据集中的目标对象外的目标对象;根据识别后的所述第一分类数据集从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
结合第二方面,在一些可能的实现方式中,所述处理器进一步用于:获取所述第一目标图像中的目标对象的部分骨骼点信息。
第二方面的有益效果可以参考第一方面的有益效果,在此不再赘述。
第三方面,提供了一种计算机可读存储介质,用于存储计算机程序,该计算机程序包括用于执行第一方面或第一方面的任意可能的实现方式中的方法的指令。
第四方面,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述第一方面或第一方面的各实现方式中的方法。
第五方面,提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面的任一可能的实现方式中的方法。
第六方面,提供一种芯片,用于实现上述第一方面或其各实现方式中的方法。
具体地,该芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片的设备执行如上述第一方面或其各实现方式中的方法。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是应用本申请实施例的用于身份识别的方法的一个场景的示意图;
图2是本申请一实施例提供的一种身份识别的方法的示意性流程图;
图3是本申请另一实施例提供的一种身份识别的方法的示意性流程图;
图4是本申请又一实施例提供的一种身份识别的方法的示意性流程图;
图5是本申请一实施例提供的一种身份识别的装置的示意性结构图;
图6是本申请另一实施例提供的一种身份识别的装置的示意性结构图;
图7是本申请实施例提供的一种芯片的示意性结构图。
具体实施方式
下面将结合附图,对本申请实施例中的技术方案进行描述。
应理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
还应理解,本说明书中描述的各种实施方式,既可以单独实施,也可以组合实施,本申请实施例对此不作限定。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
下面结合图1,对本申请实施例的应用场景进行举例说明。
图1示出了应用本申请实施例的用于身份识别的方法的一个场景的示意图。如图1所示,身份识别的装置110与输入设备120通信连接,待处理图像通过输入设备120输入至装置110,装置110可以对输入的待处理图像进行处理。
例如,待处理图像可以是摄像头拍摄的视频中的图像,此时对待处理图像的处理可以是对待处理图像中的对象进行识别。
输入设备120中可以输入一份视频图像也可以同时输入多份视频图像,本申请实施例对此不作限定。
装置110可以是具有信息处理能力的电子设备或系统,例如计算机。
装置110包括处理器,用于实现图像的处理,例如,根据获取的图像确定被处理图像的对象识别情况。处理器可以为任意种类的处理器,本申请实施例对此不作限定。
装置110还可以包括存储器。该存储器可用于存储信息和指令,例如,实现本申请实施例的技术方法的计算机可执行指令。该存储器可以为任意种类的存储器,本申请实施例对此也不作限定。
装置110还可以包括通信接口,通过通信接口与输入设备120通信连接,该通信连接可以是有线方式,也可以是无线方式。
装置110还可以包括显示设备,用于显示处理结果,例如待处理图像中的对象的身份识别情况。
以对教师身份识别为例,在对课堂质量进行算法监测时,教师身份的识别及跟踪是监测技术的根本,受限于摄像头等硬件条件,现有方法不能有效的识别教师身份,错检率和漏检率较高。
本申请提供一种身份识别的方法和装置,可以提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员敏感信息的泄露。
如图2所示,为本申请一实施例提供的一种身份识别的方法200,该方法200可以由图1中的装置110执行,该方法200包括步骤210-230。
210,获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息。
本申请实施例中的第一目标图像可以为电子设备拍摄的任一张图片,也可以为从电子设备拍摄的视频中分帧后的某一帧图像,本申请对此不作具体限制。其中,电子设备可以为摄像头或手机等,不予限制。
可以理解的是,本申请实施例中的目标对象可以为1个或多个对象。
220,根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象。
示例性地,以教室这种场景为例,本申请实施例中的位置信息可以是基于讲台或黑板为参照物的信息,例如,若某一目标对象A位于讲台上,则可以初步识别该目标对象A的身份为教师;或者,若某一目标对象位于黑板的旁边,则可以初步识别该目标对象B的身份为教师。
本申请实施例中的姿态信息可以是区分目标对象站立或者坐着的信息,例如,若某一目标对象C处于站立状态,则可以初步识别该目标对象C的身份为教师。
本申请实施例中,可以基于快速的区域卷积神经网络(Faster-RegionConvolutional Neural Networks,faster-RCNN)模型或基于回归的卷积神经网络模型,如YOLO(You Only Look Once)算法、单发多盒探测(Single Shot MultiBox Detector,SSD)算法等获取目标对象的位置信息;可以根据空间金字塔池化卷积网络(Spatial PyramidPooling Convolutional Networks,SPPNET)、openpose等获取目标对象的骨骼点信息。
230,根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。
本申请实施例中,在获得第一分类数据集后,可以根据该第一分类数据集对第二目标图像中的目标对象进行识别,以识别出与第一目标图像中的第一目标对象身份相同的对象,即识别第二目标图像中身份也为教师的目标对象。
本申请实施例中的第二目标图像与第一目标图像可以是针对同一场景的图像,例如,第二目标图像与第一目标图像可以是拍摄的同一教师上课的场景的图像。
在一些实施例中,第二目标图像与第一目标图像也可以是拍摄的公司开会的场景图像等,本申请对此不作具体限定。
本申请提供的方案,通过对第一目标图像的目标对象进行分类,并根据分类后获得的第一分类数据集识别第二目标图像中与第一目标对象身份相同的对象,即识别第二目标图像中的身份为教师的目标对象,可以提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员敏感信息的泄露。进一步地,可以基于识别的目标对象的身份检测目标对象的行为,提高监管的准确率和效率。
可选地,在一些实施例中,所述方法200还包括:获取所述第一目标对象和所述第二目标图像中的目标对象的第二特征信息,所述第二特征信息包括以下信息中的一种或多种:纹理、轮廓、颜色;
所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:
将所述第二特征信息输入识别模型,以获得所述第一目标对象的第一置信度值和所述第二目标图像中的目标对象的第二置信度值;根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
本申请实施例中的识别模型可以为孪生神经网络模型或双生神经网络模型等。可以通过针对同一场景线下采集的多张图片进行训练,例如,可以对采集的多张图片进行骨骼点关键信息分割,将人体特征分割为多个特征图,此处特征图可以根据深度残差网络提取得到,根据相同人体之间存在度量空间相似性,训练孪生神经网络模型或双生神经网络模型。
需要说明的是,在训练的过程中,可以根据concatenatea层对多个特征进行基于channel的合并,在将第二特征信息输入识别模型中进行识别的过程中,可以降低模型算力要求并且提升模型运行速度。
示例性地,若采集到的图片包括的像素点的个数为224*224,则可以剔除部分像素点,假设剔除图片中的一半的像素点,则待识别的图像包括的像素点的个数为112*224,从而可以降低模型算力要求并且提升模型运行速度。
其中,孪生神经网络模型是基于两个人工神经网络建立的耦合构架。孪生神经网络模型可以以两个样本为输入,输出其嵌入高维度空间的表征(可以理解为上文中的置信度值),以比较两个样本的相似程度。
具体地,在获取第一目标对象和第二目标图像中的目标对象的第二特征信息后,可以将第一目标对象的第二特征信息和第二目标图像中的目标对象的第二特征信息输入至识别模型中,从而可以得到第一目标对象的第一置信度值和第二目标对象中所包括的目标对象的第二置信度值,并根据第一置信度值和第二置信度值识别第二目标图像中身份也为教师的对象。
可以理解的是,若第一目标对象为m个目标对象,则本申请实施例中的第一置信度值为m个;若第二目标图像中包括n个目标对象,则本申请实施例中的第二置信度值的数量也为n个。
本申请实施例提供的方案,通过获取已识别的身份为教师的第一目标对象的第二特征信息和待识别的第二目标图像中的目标对象的第二特征信息,并基于获取的第二特征信息和识别模型识别第二目标图像中与第一目标对象的身份相同的对象,可以进一步提高身份识别的效率和准确率,同时可以降低识别成本,而且不会导致人员的敏感信息泄露。
可选地,在一些实施例中,所述根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:计算所述第一置信度值和所述第二置信度值的目标距离;根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述目标距离包括欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
以欧式距离为例,欧式距离(也可以称为欧几里得度量或欧几里得距离)是一个通常采用的距离定义,指在n维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离就是两点之间的实际距离。
欧式距离(下文以ρ表示)可以基于以下公式(1)计算:
其中,上文中提到的第一置信度值和第二置信度值可以分别为X和Y的分量。
上文指出,可以根据目标距离识别与第一目标对象身份相同的对象,下文将对具体实现方式进行介绍。
方式一:
可选地,在一些实施例中,所述根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:将所述目标距离中大于或等于第一阈值的距离所对应的对象识别为与所述第一目标对象身份相同的对象。
方式二:
可选地,在一些实施例中,所述根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:对所述目标距离进行排序,以获得第一排序结果;按照所述第一排序结果从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
本申请实施例中的第一阈值可以是固定的,也可以是不断调整的,本申请对此不作具体限定。
如上所述,本申请实施例中的目标距离可以为欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
本申请以欧式距离为例,对可能出现的情况进行说明。
情况一:
示例性地,假设第一目标对象的数量为1个,第二目标图像中的目标对象的数量为5个(分别为目标对象A、目标对象B、目标对象C、目标对象D和目标对象E),则第一置信度值的数量可以为1个,第二置信度值的数量也可以包括5个。若基于上述识别模型获得的第一置信度值为3,第二置信度值分别为6、11、5、2、5,则可以通过上述式(1)分别计算第二目标图像中的这5个目标对象与第一目标对象的欧式距离。
目标对象A与第一目标对象的欧式距离:
目标对象B与第一目标对象的欧式距离:
目标对象C与第一目标对象的欧式距离:
目标对象D与第一目标对象的欧式距离:
目标对象E与第一目标对象的欧式距离:
若基于方式一进行识别,假设第一阈值为5,由于目标对象B所对应的欧氏距离大于第一阈值5,则可以认为目标对象B是与第一目标对象身份相同的对象,即目标对象B的身份也是教师。
若基于方式二进行识别,可以先对获得的欧式距离进行排序,例如,若按照降序方式进行排列,则排列后的顺序为8>3>2=2>1,则可以认为排序第一的距离所对应的目标对象B是与第一目标对象身份相同的对象,即目标对象B的身份也是教师。
若按照升序方式进行排列,则排列后的顺序为1<2=2<3<8,则可以认为排序在最后的距离所对应的目标对象B是与第一目标对象身份相同的对象,即目标对象B的身份也是教师。
情况二:
示例性地,假设第一目标对象的数量为2个(目标对象a、目标对象b),第二目标图像中的目标对象的数量为5个(分别为目标对象A、目标对象B、目标对象C、目标对象D和目标对象E),则第一置信度的数量和第二置信度值的数量分别包括2个和5个。若基于上述识别模型获得的第一置信度值为3和9,第二置信度值分别为6、11、5、2、5,则可以通过上述式(1)分别计算这5个目标对象与第一目标对象的欧式距离。
针对目标对象A:
目标对象A与目标对象a的欧式距离:
目标对象A与目标对象b的欧式距离:
则目标对象A与第一目标对象的欧式距离可以为上述两个值的平均值,该平均值可以为算术平均值或均方根值等,不予限制。
以算术平均值为例,则目标对象A与第一目标对象的欧式距离为:
ρ1=(3+3)/2=3
针对目标对象B:
目标对象B与目标对象a的欧式距离:
目标对象B与目标对象b的欧式距离:
则目标对象B与第一目标对象的欧式距离为:
ρ2=(8+2)/2=5
针对目标对象C:
目标对象C与目标对象a的欧式距离:
目标对象C与目标对象b的欧式距离:
则目标对象C与第一目标对象的欧式距离为:
ρ3=(2+4)/2=3
针对目标对象D:
目标对象D与目标对象a的欧式距离:
目标对象D与目标对象b的欧式距离:
则目标对象D与第一目标对象的欧式距离为:
ρ4=(1+7)/2=4
针对目标对象E:
目标对象E与目标对象a的欧式距离:
目标对象E与目标对象b的欧式距离:
则目标对象E与第一目标对象的欧式距离为:
ρ5=(2+4)/2=3
若基于方式一进行识别,假设第一阈值为5,则可以认为目标对象B是与第一目标对象身份相同的对象,即目标对象B的身份也是教师。
若基于方式二进行识别,可以先对获得的欧式距离进行排序,例如,按照降序方式进行排列,则排列后的顺序为5>4>3=3=3,则排序第一的距离所对应的目标对象B是与第一目标对象身份相同的对象,即目标对象B的身份也是教师。
若按照升序方式进行排列,则排列后的顺序为3=3=3<4<5,则可以认为排序最后的距离所对应的目标对象B是与第一目标对象身份相同的对象,即目标对象B的身份也是教师。
本申请实施例提供的方案,通过根据获得的目标距离识别第二目标图像中与第一目标对象身份相同的对象,可以进一步提高身份识别的效率和准确率。
在上述方式中,通过先对获得的欧式距离进行排序,并基于第一排序结果确定第二目标图像中与第一目标对象身份相同的对象。为了减少错误样本噪声,提高识别的鲁棒性,可以进一步基于其它方式确定第二目标图像中与第一目标对象身份相同的对象。
可选地,在一些实施例中,所述方法200还包括:
在所述第二目标图像包括多张图像的情况下,对所述多张图像的目标距离进行排序,以获得第二排序结果;
从所述第二排序结果中确定第三目标图像,所述第三目标图像为排名小于或等于第二阈值所对应的目标图像,或者,所述第三目标图像为排名为大于或等于第三阈值所对应的目标图像;
所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:
根据所述第一分类数据集,基于杰卡德距离从所述第三目标图像中识别与所述第一目标对象身份相同的对象。
示例性地,以第二目标图像包括4个目标图像(分别为目标图像1、目标图像2、目标图像3和目标图像4)为例,假设第一目标图像的数量为1个,第二目标图像中各个目标图像所包括的目标对象的数量分别为5、6、4、5个,则基于上述识别模型和上述式(1)可以分别获得这4个目标图像与第一目标对象的欧式距离,具体过程可以参考上述方式一和方式二的内容,在此不再赘述。
假设根据上述方式得到第二目标图像中各个目标图像中的目标对象与第一目标图像的欧式距离分别为:目标图像1中5个目标对象与第一目标对象的欧式距离分别为3、8、2、1、2;目标图像2中6个目标对象与第一目标对象的欧式距离分别为4、5、4、3、6、2;目标图像3中4个目标对象与第一目标对象的欧式距离分别为5、6、2、4;目标图像4中5个目标对象与第一目标对象的欧式距离分别为4、3、2、3、5。
则目标图像1中最大的欧式距离为8;目标图像2中最大的欧式距离为6;目标图像3中最大的欧式距离为6;目标图像4中最大的欧式距离为5。
若按照降序对其进行排列,则第二排序结果为:8>6=6>5;若按照升序进行排列,则第二排序结果为5<6=6<8。
假设本申请中的第二阈值和第三阈值均为6,则第三目标图像包括目标图像1、目标图像2以及目标图像3。
需要说明的是,本申请中的第二阈值可以相同,也可以不同,不予限制。
进一步地,可以基于杰卡德距离识别目标图像1、目标图像2以及目标图像3与第一目标对象身份相同的对象。
杰卡德距离用来度量两个集合之间的差异性,它是杰卡德的相似系数的补集,被定义为1减去杰卡德相似系数,可以通过公式(2)进行表示。
其中,A表示第一目标图像形成的集合,B表示第二目标图像形成的集合,A∩B表示A与B交集的元素个数,A∪B表示A与B并集的元素个数。
本申请提供的方案,通过对多张图像每一张目标图像中最大的目标距离进行排序,并从第二排序结果中确定第三目标图像,识别第三目标图像中与第一目标身份相同的对象,可以减少错误样本噪声,提高识别的鲁棒性和准确性。
在具体识别过程中,可以根据整体数据总量以及项目中的教师检测模型结果获取动态先验权重对两种距离进行加权相加,具体请参见下文。
若已确认身份为教师的图像的数量与整体的图像的数量的比值大于0.1,则杰卡德距离的权重可以基于以下公式确定:
杰卡德距离的权重=(已确认身份为教师的图像的数量/整体的图像的数量)*(min(1,1/视频采样率))
通过上述两种距离进行加权得到的距离为:
加权后的距离=杰卡德距离的权重*杰卡德距离+(1-杰卡德距离的权重)*欧式距离
示例性地,假设包括的整体的图像的数量为100张,已确认身份为教师的图像的数量为20张,视频采样率为5,则杰卡德距离的权重为:20/100*(min(1,1/5))=0.4,则加权后的距离为:
加权后的距离=0.4*杰卡德距离+0.6*欧式距离
仍然以上述示例为例,目标图像1、目标图像2以及目标图像3所包括的目标对象与第一目标对象的杰卡德距离分别为0.3、0.5、0.2、0.1、0.1;0.4、0.5、0.2、0.3、0.5、0.2;0.5、0.4、0.2、0.4。
目标图像1、目标图像2以及目标图像3所包括的目标对象与第一目标对象的欧式分别为3、8、2、1、2;4、5、4、3、6、2;5、6、2、4。
则目标图像1中5个目标对象加权后的距离分别为:
0.4*0.3+0.6*3=1.92;
0.4*0.5+0.6*8=5.0;
0.4*0.2+0.6*2=1.28;
0.4*0.1+0.6*1=0.64;
0.4*0.1+0.6*2=0.64。
目标对象2中6个目标对象加权后的距离分别为:
0.4*0.4+0.6*4=0.40;
0.4*0.5+0.6*5=0.50;
0.4*0.2+0.6*4=0.32;
0.4*0.3+0.6*3=0.30;
0.4*0.5+0.6*6=3.8;
0.4*0.2+0.6*2=1.28。
则目标图像3中4个目标对象加权后的距离分别为:
0.4*0.5+0.6*5=0.5;
0.4*0.4+0.6*6=0.52;
0.4*0.2+0.6*2=1.28;
0.4*0.4+0.6*4=2.56。
若设定的阈值为3,则目标图像1中加权后的距离为5所对应的目标对象与第一目标对象的身份相同,目标图像2中加权后的距离为3.8所对应的目标对象与第一目标对象的身份相同,目标对象3中无第一目标对象的身份相同的对象。
需要说明的是,上述数值仅为举例说明,还可以为其它数值,不应对本申请造成特别限定。如上所述,可以根据第一特征信息对第一图像中的目标对象进行分类,获得第一分类数据集,然而单纯根据第一特征信息对目标对象进行分类有可能出现分类错误的情况,因此,可以进一步对已分类的第一目标图像中的目标对象进行识别,具体请参见下文。
可选地,在一些实施例中,如图3所示,为申请另一实施例提供的身份识别的方法200,在所述根据所述第一特征信息对所述目标对象进行分类后,该方法200还可以包括步骤240。
240,获取所述第一目标图像中的目标对象的第三特征信息,所述第三特征信息包括所述第一目标图像中的目标对象所佩戴的设备和/或所述第一目标图像中的目标对象的颜色。
步骤230中所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:根据所述第三特征信息对所述第一分类数据集和第二分类数据集中的目标对象识别,所述第二分类数据集为所述第一目标图像中除所述第一分类数据集中的目标对象外的目标对象;根据识别后的所述第一分类数据集从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
本申请实施例中,在根据第一特征信息获得第一分类数据集后,有可能会出现误判或错判的情况,可以进一步获取其它信息对已分类的第一目标图像中的目标对象识别。例如,可以获取第一目标图像中的目标对象的第三特征信息,并根据第三特征信息对该第一分类数据集和第二分类数据集中的目标对象进行识别,以及基于识别后的第一分类数据集从第二目标图像中识别与第一目标对象身份相同的对象。
示例性地,假设第一目标图像中和第二目标图像中均包括5个对象,其中,第一目标图像中的目标对象分别包括目标对象a、目标对象b、目标对象c、目标对象d、目标对象e;第二目标图像中的目标对象分别包括目标对象A、目标对象B、目标对象C、目标对象D和目标对象E。
假设根据第一特征信息初步识别第一分类数据集中的第一目标对象包括目标对象a和目标对象b,即目标对象a和目标对象b的身份为教师,其它目标对象为未识别的对象。但是有可能目标对象a为到黑板答题的学生,此时误将该学生识别为教师;或者,目标对象a可能为挂在凳子上的衣服,此时也有可能误将该衣服识别为教师;从而导致分类错误。
此外,在一些实施例中,也有可能教师走到讲台以外的地方,如学生座位区域,此时可能误将教师识别为第二数据集中的目标对象,从而导致分类错误。
因此,本申请实施例通过根据获取的第一目标图像中的目标对象的第三特征信息对第一分类数据集和第二分类数据集中的目标对象进行识别,并基于识别后的第一分类数据集识别第二目标图像中身份为教师的对象。
在对第一分类数据集和第二分类数据集中的目标对象进行识别的过程中,可以根据目标对象是否佩戴麦克风和根据目标对象的颜色进行重叠判定,也可以根据目标对象是否佩戴麦克风和根据目标对象的颜色作为整体进行判定。
示例性地,若第三特征信息为第一目标图像中的目标对象所佩戴的设备,假设目标对象a未佩戴麦克风,而目标对象b佩戴麦克风,此时可以识别目标对象b的身份为教师,而目标对象a的身份为学生。则第一分类数据集中的第一目标对象为目标对象b,第二分类数据集中的目标对象包括目标对象a、目标对象c、目标对象d、目标对象e。除此之外,假设目标对象c佩戴麦克风,此时可以识别目标对象c的身份为教师,则第一分类数据集中的第一目标对象包括目标对象b和目标对象c,第二分类数据集中的目标对象包括目标对象a、目标对象d、目标对象e。
示例性地,若第三特征信息为第一目标图像中的目标对象的颜色,假设目标对象a的手的颜色不是人体皮肤的颜色,而目标对象b的手的颜色为人体皮肤的颜色,此时可以识别目标对象b的身份为教师,而目标对象a的身份为学生。则第一分类数据集中的第一目标对象包括目标对象b,第二分类数据集中的目标对象包括目标对象a、目标对象c、目标对象d、目标对象e。
示例性地,若第三特征信息为第一目标图像中的目标对象所佩戴的设备和目标对象的颜色,同样地,也可以识别第一分类数据集中的第一目标对象包括目标对象b和目标对象c,第二分类数据集中的目标对象包括目标对象a、目标对象d、目标对象e。
基于此,在识别后的第一分类数据集中的第一目标对象包括目标对象b和目标对象c的基础上,则可以根据识别后的第一数据集从第二目标图像中识别与目标对象b和目标对象c的身份相同的对象。
仍然以欧式距离为例,如上所述,根据第三特征信息重新识别后的第一分类数据集中的第一目标对象包括目标对象b和目标对象c,第二目标图像中的目标对象的数量为5个(分别为目标对象A、目标对象B、目标对象C、目标对象D和目标对象E),则第一置信度的数量和第二置信度值的数量分别包括2个和3个,若基于上述识别模型获得的第一置信度值为9和5,第二置信度值分别为6、11、5、2、5,则可以通过上述式(1)分别计算这5个目标对象与第一目标对象的欧式距离。
针对目标对象A:
目标对象A与目标对象b的欧式距离:
目标对象A与目标对象c的欧式距离:
则目标对象A与第一目标对象的欧式距离可以为上述两个值的平均值,该平均值可以为算术平均值或均方根值等,不予限制。
以算术平均值为例,则目标对象A与第一目标对象的欧式距离为:
ρ1=(3+1)/2=2
针对目标对象B:
目标对象B与目标对象b的欧式距离:
目标对象B与目标对象c的欧式距离:
则目标对象B与第一目标对象的欧式距离为:
ρ2=(2+6)/2=4
针对目标对象C:
目标对象C与目标对象b的欧式距离:
目标对象C与目标对象a的欧式距离:
则目标对象C与第一目标对象的欧式距离为:
ρ3=(4+0)/2=2
针对目标对象D:
目标对象D与目标对象b的欧式距离:
目标对象D与目标对象a的欧式距离:
则目标对象D与第一目标对象的欧式距离为:
ρ4=(7+3)/2=5
针对目标对象E:
目标对象E与目标对象b的欧式距离:
目标对象E与目标对象a的欧式距离:
则目标对象E与第一目标对象的欧式距离为:
ρ5=(4+0)/2=2
若基于上述方式一进行识别,仍然假设第一阈值为5,由于目标对象D的目标距离等于第一阈值5,此时可以认为目标对象D是与第一目标对象身份相同的对象,即目标对象D的身份是教师。
若基于上述方式二进行识别,可以先对获得的欧式距离进行排序,例如,按照降序方式进行排列,则排列后的顺序为5>4>2=2=2,则排序第一的距离所对应的目标对象D是与第一目标对象身份相同的对象,即目标对象D的身份也是教师。
若按照升序方式进行排列,则排列后的顺序为2=2=2<4<5,则可以认为排序最后的距离所对应的目标对象D是与第一目标对象身份相同的对象,即目标对象D的身份也是教师。
可以看出,根据第一特征信息获得的第一分类数据集识别出的第二目标图像中的目标对象B的身份是教师;而根据第三特征信息对第一分类数据集和第二分类数据集的目标对象进行识别后,并根据识别后的第一分类数据集识别出的第二目标图像中的目标对象D的身份是教师。因此,本申请实施例提供的方案,通过获取的第三特征信息重新对第一分类数据集和第二分类数据集中的目标对象进行识别,并基于识别后获得的第一分类数据集识别第二目标图像中与第一目标对象身份相同的对象,可以进一步提高身份识别的准确率。
可选地,在一些实施例中,所述获取第一目标图像中的目标对象的第一特征信息,包括:获取所述目标对象的部分骨骼点信息。
本申请实施例中,获取目标对象的部分骨骼点信息,可以理解为获取的目标对象的骨骼点信息并不是目标对象的完整或所有骨骼点信息,而是局部或部分骨骼点信息。
示例性地,以教室场景为例,在这种场景下,由于桌椅对教室或学生的遮挡,因此,可以摒弃人体的下半部分特征,只获取人体的上半部分特征信息,以识别目标对象的身份。
本申请实施例提供的方案,通过获取目标对象的部分骨骼点信息,并根据该部分骨骼点信息识别目标对象的身份,可以进一步提高身份识别的准确率和效率。
如图4所示,为本申请又一实施例提供的一种身份识别的方法400,该方法400可以包括步骤410-432。
410,获取线下课堂视频数据。
412,视频抽帧为单帧图片序列。
414,云存储图片数据。
416,获取人体目标特征信息。
418,通过获取的人体目标特征信息对人体分类,获得第一分类数据集。
420,根据额外特定信息识别人体,以获得识别后的第一分类数据集。
422,多张真实线下课堂图片数据集。
424,根据深度残差网络提取生物特征,获取先验知识。
426,根据相同人体之间存在度量空间相似性,训练孪生神经网络。
428,通过孪生神经网络对人体特征信息进行度量特征提取,通过高置信度值对低置信度值候选信息进行匹配,清除无用信息。
430,相关度度量特征重排序,根据相关性重组,获取高置信度特征。
432,获取到真实教师信息。
具体内容请参考上文中身份识别的方法200的描述,为了简洁,这里不再赘述。
上文结合图1-图4,详细描述了本申请的方法实施例,下面结合图5-图7,描述本申请的装置实施例,装置实施例与方法实施例相互对应,因此未详细描述的部分可参见前面各部分方法实施例。
图5为本申请一实施例提供的一种身份识别装置500,该装置500可以包括存储器510和处理器520。
所述存储器510用于存储程序代码;
所述处理器520,调用所述程序代码,当程序代码被执行时,用于执行以下操作:
获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息;
根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象;
根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述处理器520进一步用于:
获取所述第一目标对象和所述第二目标图像中的目标对象的第二特征信息,所述第二特征信息包括以下信息中的一种或多种:纹理、轮廓、颜色;
将所述第二特征信息输入识别模型,以获得所述第一目标对象的第一置信度值和所述第二目标图像中的目标对象的第二置信度值;
根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述处理器520进一步用于:
计算所述第一置信度值和所述第二置信度值的目标距离;
根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述目标距离包括欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
可选地,在一些实施例中,所述处理器520进一步用于:
将所述目标距离中大于或等于第一阈值的距离所对应的对象识别为与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述处理器520进一步用于:
对所述目标距离进行排序,以获得第一排序结果;
按照所述第一排序结果从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述处理器520进一步用于:
在所述第二目标图像包括多张图像的情况下,对所述多张图像的目标距离进行排序,以获得第二排序结果;
从所述第二排序结果中确定第三目标图像,所述第三目标图像为排名小于或等于第二阈值所对应的目标图像,或者,所述第三目标图像为排名为大于或等于第三阈值所对应的目标图像;
根据所述第一分类数据集,基于杰卡德距离从所述第三目标图像中识别与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,在所述根据所述第一特征信息对所述目标对象进行分类后,所述处理器520进一步用于:
获取所述第一目标图像中的目标对象的第三特征信息,所述第三特征信息包括所述第一目标图像中的目标对象所佩戴的设备和/或所述第一目标图像中的目标对象的颜色;
根据所述第三特征信息对所述第一分类数据集和第二分类数据集中的目标对象识别,所述第二分类数据集为所述第一目标图像中除所述第一分类数据集中的目标对象外的目标对象;
根据识别后的所述第一分类数据集从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
可选地,在一些实施例中,所述处理器520进一步用于:获取所述第一目标图像中的目标对象的部分骨骼点信息。
本申请实施例还提供了一种计算机可读存储介质,用于存储计算机程序。
可选的,该计算机可读存储介质可应用于本申请实施例中的身份识别的装置,并且该计算机程序使得计算机执行本申请实施例的各个方法中由身份识别的装置实现的相应流程,为了简洁,在此不再赘述。
本申请实施例还提供了一种计算机程序产品,包括计算机程序指令。
可选的,该计算机程序产品可应用于本申请实施例中的身份识别的装置,并且该计算机程序指令使得计算机执行本申请实施例的各个方法中由身份识别的装置实现的相应流程,为了简洁,在此不再赘述。
本申请实施例还提供了一种计算机程序。
可选的,该计算机程序可应用于本申请实施例中的身份识别的装置,当该计算机程序在计算机上运行时,使得计算机执行本申请实施例的各个方法中由身份识别的装置实现的相应流程,为了简洁,在此不再赘述。
图6是本申请另一实施例提供的身份识别的装置的示意性结构图。图6所示的装置600包括处理器610,处理器610可以从存储器中调用并运行计算机程序,以实现本申请实施例中所述的方法。
可选地,如图6所示,身份识别的装置600还可以包括存储器620。其中,处理器610可以从存储器620中调用并运行计算机程序,以实现本申请实施例中的方法。
其中,存储器620可以是独立于处理器610的一个单独的器件,也可以集成在处理器610中。
可选地,如图6所示,身份识别的装置600还可以包括收发器630,处理器610可以控制该收发器630与其他装置进行通信,具体地,可以向其他装置发送信息或数据,或接收其他装置发送的信息或数据。
图7是本申请实施例的芯片的示意性结构图。图7所示的芯片700包括处理器710,处理器710可以从存储器中调用并运行计算机程序,以实现本申请实施例中的方法。
可选地,如图7所示,芯片700还可以包括存储器720。其中,处理器710可以从存储器720中调用并运行计算机程序,以实现本申请实施例中的方法。
其中,存储器720可以是独立于处理器710的一个单独的器件,也可以集成在处理器1710中。
可选地,该芯片700还可以包括输入接口730。其中,处理器710可以控制该输入接口730与其他装置或芯片进行通信,具体地,可以获取其他装置或芯片发送的信息或数据。
可选地,该芯片700还可以包括输出接口740。其中,处理器710可以控制该输出接口740与其他装置或芯片进行通信,具体地,可以向其他装置或芯片输出信息或数据。
应理解,本申请实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
应理解,本申请实施例的处理器可能是一种集成电路图像处理系统,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
应理解,上述存储器为示例性但不是限制性说明,例如,本申请实施例中的存储器还可以是静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch Link DRAM,SLDRAM)以及直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)等等。也就是说,本申请实施例中的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本申请实施例中的存储器可以向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。该处理器可以用于执行存储器中存储的指令,并且该处理器执行该指令时,该处理器可以执行上述方法实施例中与终端设备对应的各个步骤。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器执行存储器中的指令,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
还应理解,上文对本申请实施例的描述着重于强调各个实施例之间的不同之处,未提到的相同或相似之处可以互相参考,为了简洁,这里不再赘述。
应理解,在本申请实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (19)
1.一种身份识别的方法,其特征在于,包括:
获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息;
根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象;
根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述第一目标对象和所述第二目标图像中的目标对象的第二特征信息,所述第二特征信息包括以下信息中的一种或多种:纹理、轮廓、颜色;
所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:
将所述第二特征信息输入识别模型,以获得所述第一目标对象的第一置信度值和所述第二目标图像中的目标对象的第二置信度值;
根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:
计算所述第一置信度值和所述第二置信度值的目标距离;
根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
4.根据权利要求3所述的方法,其特征在于,所述目标距离包括欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:
将所述目标距离中大于或等于第一阈值的距离所对应的对象识别为与所述第一目标对象身份相同的对象。
6.根据权利要求3或4所述的方法,其特征在于,所述根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象,包括:
对所述目标距离进行排序,以获得第一排序结果;
按照所述第一排序结果从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
在所述第二目标图像包括多张图像的情况下,对所述多张图像每一张目标图像中最大的目标距离进行排序,以获得第二排序结果;
从所述第二排序结果中确定第三目标图像,所述第三目标图像为排名小于或等于第二阈值所对应的目标图像,或者,所述第三目标图像为排名为大于或等于第三阈值所对应的目标图像;
所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:
根据所述第一分类数据集,基于杰卡德距离从所述第三目标图像中识别与所述第一目标对象身份相同的对象。
8.根据权利要求1至7中任一项所述的方法,其特征在于,在所述根据所述第一特征信息对所述目标对象进行分类后,所述方法还包括:
获取所述第一目标图像中的目标对象的第三特征信息,所述第三特征信息包括所述第一目标图像中的目标对象所佩戴的设备和/或所述第一目标图像中的目标对象的颜色;
所述根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象,包括:
根据所述第三特征信息对所述第一分类数据集和第二分类数据集中的目标对象识别,所述第二分类数据集为所述第一目标图像中除所述第一分类数据集中的目标对象外的目标对象;
根据识别后的所述第一分类数据集从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述获取第一目标图像中的目标对象的第一特征信息,包括:
获取所述第一目标图像中的目标对象的部分骨骼点信息。
10.一种身份识别装置,其特征在于,所述装置包括存储器和处理器;
所述存储器用于存储程序代码;
所述处理器,调用所述程序代码,当程序代码被执行时,用于执行以下操作:
获取第一目标图像中的目标对象的第一特征信息,所述第一特征信息包括以下信息中的一种或多种:位置信息、姿态信息、骨骼点信息;
根据所述第一特征信息对所述目标对象进行分类,以获得第一分类数据集,所述第一分类数据集包括已识别身份为教师的第一目标对象;
根据所述第一分类数据集识别第二目标图像中与所述第一目标对象身份相同的对象。
11.根据权利要求10所述的装置,其特征在于,所述处理器进一步用于:
获取所述第一目标对象和所述第二目标图像中的目标对象的第二特征信息,所述第二特征信息包括以下信息中的一种或多种:纹理、轮廓、颜色;
将所述第二特征信息输入识别模型,以获得所述第一目标对象的第一置信度值和所述第二目标图像中的目标对象的第二置信度值;
根据所述第一置信度值和所述第二置信度值从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
12.根据权利要求11所述的装置,其特征在于,所述处理器进一步用于:
计算所述第一置信度值和所述第二置信度值的目标距离;
根据所述目标距离从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
13.根据权利要求12所述的装置,其特征在于,所述目标距离包括欧式距离、曼哈顿距离、切比雪夫距离、海明距离中的一种或多种。
14.根据权利要求12或13所述的装置,其特征在于,所述处理器进一步用于:
将所述目标距离中大于或等于第一阈值的距离所对应的对象识别为与所述第一目标对象身份相同的对象。
15.根据权利要求12或13所述的装置,其特征在于,所述处理器进一步用于:
对所述目标距离进行排序,以获得排序结果;
按照所述排序结果从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
16.根据权利要求10至15中任一项所述的装置,其特征在于,所述处理器进一步用于:
在所述第二目标图像包括多张图像的情况下,对所述多张图像的目标距离进行排序,以获得第二排序结果;
从所述第二排序结果中确定第三目标图像,所述第三目标图像为排名小于或等于第二阈值所对应的目标图像,或者,所述第三目标图像为排名为大于或等于第三阈值所对应的目标图像;
根据所述第一分类数据集,基于杰卡德距离从所述第三目标图像中识别与所述第一目标对象身份相同的对象。
17.根据权利要求10至16中任一项所述的装置,其特征在于,在所述根据所述第一特征信息对所述目标对象进行分类后,所述处理器进一步用于:
获取所述第一目标图像中的目标对象的第三特征信息,所述第三特征信息包括所述第一目标图像中的目标对象所佩戴的设备和/或所述第一目标图像中的目标对象的颜色;
根据所述第三特征信息对所述第一分类数据集和第二分类数据集中的目标对象识别,所述第二分类数据集为所述第一目标图像中除所述第一分类数据集中的目标对象外的目标对象;
根据识别后的所述第一分类数据集从所述第二目标图像中识别与所述第一目标对象身份相同的对象。
18.根据权利要求10至17中任一项所述的装置,其特征在于,所述处理器进一步用于:
获取所述第一目标图像中的目标对象的部分骨骼点信息。
19.一种计算机可读存储介质,其特征在于,包括用于执行权利要求1至9中任一项所述的身份识别的方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176467.3A CN112215200A (zh) | 2020-10-28 | 2020-10-28 | 身份识别的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176467.3A CN112215200A (zh) | 2020-10-28 | 2020-10-28 | 身份识别的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112215200A true CN112215200A (zh) | 2021-01-12 |
Family
ID=74057429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011176467.3A Pending CN112215200A (zh) | 2020-10-28 | 2020-10-28 | 身份识别的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215200A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156755A (zh) * | 2016-07-29 | 2016-11-23 | 深圳云天励飞技术有限公司 | 一种人脸识别中的相似度计算方法及系统 |
CN107451607A (zh) * | 2017-07-13 | 2017-12-08 | 山东中磁视讯股份有限公司 | 一种基于深度学习的典型人物的身份识别方法 |
US20180173940A1 (en) * | 2016-12-19 | 2018-06-21 | Canon Kabushiki Kaisha | System and method for matching an object in captured images |
CN108717520A (zh) * | 2018-04-10 | 2018-10-30 | 新智数字科技有限公司 | 一种行人重识别方法及装置 |
CN109711320A (zh) * | 2018-12-24 | 2019-05-03 | 兴唐通信科技有限公司 | 一种值班人员违规行为检测方法及系统 |
CN110532921A (zh) * | 2019-08-21 | 2019-12-03 | 江南大学 | 基于ssd检测广义标签多伯努利视频多目标跟踪方法 |
CN110532886A (zh) * | 2019-07-31 | 2019-12-03 | 国网江苏省电力有限公司 | 一种基于孪生神经网络的目标检测算法 |
CN110781843A (zh) * | 2019-10-29 | 2020-02-11 | 首都师范大学 | 课堂行为检测方法及电子设备 |
CN111738042A (zh) * | 2019-10-25 | 2020-10-02 | 北京沃东天骏信息技术有限公司 | 识别方法、设备及存储介质 |
-
2020
- 2020-10-28 CN CN202011176467.3A patent/CN112215200A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156755A (zh) * | 2016-07-29 | 2016-11-23 | 深圳云天励飞技术有限公司 | 一种人脸识别中的相似度计算方法及系统 |
US20180173940A1 (en) * | 2016-12-19 | 2018-06-21 | Canon Kabushiki Kaisha | System and method for matching an object in captured images |
CN107451607A (zh) * | 2017-07-13 | 2017-12-08 | 山东中磁视讯股份有限公司 | 一种基于深度学习的典型人物的身份识别方法 |
CN108717520A (zh) * | 2018-04-10 | 2018-10-30 | 新智数字科技有限公司 | 一种行人重识别方法及装置 |
CN109711320A (zh) * | 2018-12-24 | 2019-05-03 | 兴唐通信科技有限公司 | 一种值班人员违规行为检测方法及系统 |
CN110532886A (zh) * | 2019-07-31 | 2019-12-03 | 国网江苏省电力有限公司 | 一种基于孪生神经网络的目标检测算法 |
CN110532921A (zh) * | 2019-08-21 | 2019-12-03 | 江南大学 | 基于ssd检测广义标签多伯努利视频多目标跟踪方法 |
CN111738042A (zh) * | 2019-10-25 | 2020-10-02 | 北京沃东天骏信息技术有限公司 | 识别方法、设备及存储介质 |
CN110781843A (zh) * | 2019-10-29 | 2020-02-11 | 首都师范大学 | 课堂行为检测方法及电子设备 |
Non-Patent Citations (3)
Title |
---|
J. MIAO, ET AL: "Pose-Guided Feature Alignment for Occluded Person Re-Identification", 2019 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), 27 October 2019 (2019-10-27), pages 542 - 551, XP033723833, DOI: 10.1109/ICCV.2019.00063 * |
周千里, 等: "面向个体人员特征的跨模态目标跟踪算法", 北京航空航天大学学报, vol. 46, no. 9, 30 September 2020 (2020-09-30), pages 1635 - 1642 * |
李姣,等: "多置信度重排序的行人再识别算法", 模式识别与人工智能, vol. 30, no. 11, 30 November 2017 (2017-11-30), pages 995 - 1002 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021077984A1 (zh) | 对象识别方法、装置、电子设备及可读存储介质 | |
CN109508688B (zh) | 基于骨架的行为检测方法、终端设备及计算机存储介质 | |
WO2020253629A1 (zh) | 检测模型训练方法、装置、计算机设备和存储介质 | |
CN107742100B (zh) | 一种考生身份验证方法及终端设备 | |
CN111754396B (zh) | 脸部图像处理方法、装置、计算机设备和存储介质 | |
US20150092978A1 (en) | Method and system for recognition of abnormal behavior | |
CN108171158B (zh) | 活体检测方法、装置、电子设备及存储介质 | |
CN111626123A (zh) | 视频数据处理方法、装置、计算机设备及存储介质 | |
CN108009466B (zh) | 行人检测方法和装置 | |
CN109448007A (zh) | 图像处理方法、图像处理装置及存储介质 | |
CN111061898A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN109815823B (zh) | 数据处理方法及相关产品 | |
CN106156777A (zh) | 文本图片检测方法及装置 | |
Chandran et al. | Missing child identification system using deep learning and multiclass SVM | |
CN110929687A (zh) | 一种基于关键点检测的多人行为识别系统及工作方法 | |
CN113205002B (zh) | 非受限视频监控的低清人脸识别方法、装置、设备及介质 | |
CN111353399A (zh) | 篡改视频检测方法 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN111353325A (zh) | 关键点检测模型训练方法及装置 | |
CN115862113A (zh) | 陌生人异常识别方法、装置、设备及存储介质 | |
CN103745242A (zh) | 一种跨设备生物特征识别方法 | |
CN111597921A (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN113557546B (zh) | 图像中关联对象的检测方法、装置、设备和存储介质 | |
CN115937971B (zh) | 一种举手投票识别方法及装置 | |
CN115018886B (zh) | 运动轨迹识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |