CN112825145B - 人体朝向检测方法、装置、电子设备和计算机存储介质 - Google Patents

人体朝向检测方法、装置、电子设备和计算机存储介质 Download PDF

Info

Publication number
CN112825145B
CN112825145B CN201911143057.6A CN201911143057A CN112825145B CN 112825145 B CN112825145 B CN 112825145B CN 201911143057 A CN201911143057 A CN 201911143057A CN 112825145 B CN112825145 B CN 112825145B
Authority
CN
China
Prior art keywords
human body
sample image
body orientation
image
orientation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911143057.6A
Other languages
English (en)
Other versions
CN112825145A (zh
Inventor
李逍
许经纬
程光亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sensetime Intelligent Technology Co Ltd
Original Assignee
Shanghai Sensetime Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Sensetime Intelligent Technology Co Ltd filed Critical Shanghai Sensetime Intelligent Technology Co Ltd
Priority to CN201911143057.6A priority Critical patent/CN112825145B/zh
Priority to JP2021531125A priority patent/JP2022510963A/ja
Priority to KR1020217016720A priority patent/KR20210087494A/ko
Priority to PCT/CN2020/114105 priority patent/WO2021098346A1/zh
Publication of CN112825145A publication Critical patent/CN112825145A/zh
Application granted granted Critical
Publication of CN112825145B publication Critical patent/CN112825145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/62Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本实施例公开了一种人体朝向检测方法、装置、电子设备和计算机存储介质,该方法包括:对待处理图像进行特征提取,得到所述待处理图像的特征;基于所述待处理图像的特征确定人体关键点和初步的人体朝向;根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向。如此,在本公开实施例中,最终的人体朝向是在综合考虑人体关键点和初步的人体朝向的基础上得出的,因而,可以基于人体关键点提升最终的人体朝向的准确度和可利用性。

Description

人体朝向检测方法、装置、电子设备和计算机存储介质
技术领域
本公开涉及计算机视觉处理技术,尤其涉及一种人体朝向检测方法、装置、电子设备和计算机存储介质。
背景技术
随着计算机视觉处理技术的发展,行人朝向检测逐渐称为计算机视觉领域重要的研究问题;行人朝向检测的方案可以是,对摄像机得到的图像进行处理,以预测图像中每一个人的身体和/或面部的朝向;然而,相关技术中,如何提高行人朝向检测的准确度和可利用性,是亟待解决的问题。
发明内容
本公开实施例期望提供人体朝向检测的技术方案。
本公开实施例提供了一种人体朝向检测方法,所述方法包括:
对待处理图像进行特征提取,得到所述待处理图像的特征;
基于所述待处理图像的特征确定人体关键点和初步的人体朝向;
根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向。
可选地,所述根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:
响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向相符的情况,将所述初步的人体朝向确定为所述最终的人体朝向。
可选地,所述根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:
响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向不相符的情况,将所述确定的人体关键点表征的人体朝向确定为所述最终的人体朝向。
可选地,对待处理图像进行特征提取得到所述待处理图像的特征,以及基于所述待处理图像的特征确定人体关键点和初步的人体朝向的步骤由神经网络执行,所述神经网络采用第一样本图像和第二样本图像训练得到,所述第一样本图像中包括第一人体图像和标注的人体关键点,所述第二样本图像包括第二人体图像和标注的人体朝向。
可选地,所述神经网络采用第一样本图像和第二样本图像训练得到,包括:
对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像和所述第二样本图像的特征;根据所述第一样本图像的特征进行行人关键点检测,得到所述第一类样本图像的人体关键点;基于所述第二样本图像的特征进行朝向检测,得到所述第二样本图像的人体朝向;
根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值。
可选地,所述对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像和所述第二样本图像的特征,包括:
将所述第一样本图像和所述第二样本图像进行拼接,对拼接后的图像数据进行特征提取,得到拼接后的图像数据的特征;
按照所述第一样本图像和所述第二样本图像的拼接方式,将所述拼接后的图像数据的特征拆分为所述第一样本图像的特征和所述第二样本图像的特征。
可选地,将所述第一样本图像和所述第二样本图像进行拼接,包括:所述第一样本图像和所述第二样本图像沿批维度拼接;
在将所述第一样本图像和所述第二样本图像进行拼接之前,所述方法还包括:
将所述第一样本图像和所述第二样本图像在通道、高和宽三个维度上分别调整至相同。
可选地,所述根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值,包括:
根据所述检测的人体关键点和所述标注的人体关键点,得出所述神经网络的第一损失值,所述第一损失值表示所述检测的人体关键点和所述标注的人体关键点的差异;
根据所述检测的人体朝向和所述标注的人体朝向,得出所述神经网络的第二损失值,所述第二损失值表示所述检测的人体朝向和所述标注的人体朝向的差异;
根据所述第一损失值和所述第二损失值,调整所述神经网络的网络参数值。
本公开实施例还提供了一种人体朝向检测装置,所述装置包括提取模块和处理模块,其中,
提取模块,用于对待处理图像进行特征提取,得到所述待处理图像的特征;
处理模块,用于基于所述待处理图像的特征确定人体关键点和初步的人体朝向;根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向。
可选地,所述处理模块,用于根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向相符的情况,将所述初步的人体朝向确定为所述最终的人体朝向。
可选地,所述处理模块,用于根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向不相符的情况,将所述确定的人体关键点表征的人体朝向确定为所述最终的人体朝向。
可选地,对待处理图像进行特征提取得到所述待处理图像的特征,以及基于所述待处理图像的特征确定人体关键点和初步的人体朝向的步骤由神经网络执行,所述神经网络采用第一样本图像和第二样本图像训练得到,所述第一样本图像中包括第一人体图像和标注的人体关键点,所述第二样本图像包括第二人体图像和标注的人体朝向。
可选地,所述装置还包括训练模块,所述训练模块,用于采用第一样本图像和第二样本图像训练所述神经网络,包括:
对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像和所述第二样本图像的特征;根据所述第一样本图像的特征进行行人关键点检测,得到所述第一类样本图像的人体关键点;基于所述第二样本图像的特征进行朝向检测,得到所述第二样本图像的人体朝向;
根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值。
可选地,所述训练模块,用于对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像和所述第二样本图像的特征,包括:
将所述第一样本图像和所述第二样本图像进行拼接,对拼接后的图像数据进行特征提取,得到拼接后的图像数据的特征;
按照所述第一样本图像和所述第二样本图像的拼接方式,将所述拼接后的图像数据的特征拆分为所述第一样本图像的特征和所述第二样本图像的特征。
可选地,所述训练模块用于将所述第一样本图像和所述第二样本图像进行拼接,包括:所述第一样本图像和所述第二样本图像沿批维度拼接;
所述训练模块,还用于在将所述第一样本图像和所述第二样本图像进行拼接之前,将所述第一样本图像和所述第二样本图像在通道、高和宽三个维度上分别调整至相同。
可选地,所述训练模块,用于根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值,包括:
根据所述检测的人体关键点和所述标注的人体关键点,得出所述神经网络的第一损失值,所述第一损失值表示所述检测的人体关键点和所述标注的人体关键点的差异;
根据所述检测的人体朝向和所述标注的人体朝向,得出所述神经网络的第二损失值,所述第二损失值表示所述检测的人体朝向和所述标注的人体朝向的差异;
根据所述第一损失值和所述第二损失值,调整所述神经网络的网络参数值。
本公开实施例还提供了一种电子设备,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序以执行上述任意一种人体朝向检测方法。
本公开实施例还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一种人体朝向检测方法。
本公开实施例提出的人体朝向检测方法、装置、电子设备和计算机存储介质中,对待处理图像进行特征提取,得到所述待处理图像的特征;基于所述待处理图像的特征确定人体关键点和初步的人体朝向;根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向。如此,在本公开实施例中,最终的人体朝向是在综合考虑人体关键点和初步的人体朝向的基础上得出的,因而,可以基于人体关键点提升最终的人体朝向的准确度和可利用性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1为本公开实施例的人体朝向检测方法的流程图;
图2为本公开实施例的训练完成的神经网络的架构示意图;
图3为本公开实施例中涉及的人体关键点的示意图;
图4为本公开实施例的人体朝向示意图;
图5为本公开实施例神经网络训练方法的流程图;
图6为本公开实施例的神经网络训练的架构示意图;
图7为本公开实施例中图像数据拼接的示意图;
图8为本公开实施例中图像特征拆分的示意图;
图9为本公开实施例的人体朝向检测装置的组成结构示意图;
图10为本公开实施例的电子设备的结构示意图。
具体实施方式
以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本公开,并不用于限定本公开。另外,以下所提供的实施例是用于实施本公开的部分实施例,而非提供实施本公开的全部实施例,在不冲突的情况下,本公开实施例记载的技术方案可以任意组合的方式实施。
需要说明的是,在本公开实施例中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其他要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元,例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。
例如,本公开实施例提供的人体朝向检测方法包含了一系列的步骤,但是本公开实施例提供的人体朝向检测方法不限于所记载的步骤,同样地,本公开实施例提供的人体朝向检测装置包括了一系列模块,但是本公开实施例提供的装置不限于包括所明确记载的模块,还可以包括为获取相关信息、或基于信息进行处理时所需要设置的模块。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
本公开实施例可以应用于终端和/或服务器组成的计算机系统中,并可以与众多其它通用或专用计算系统环境或配置一起操作。这里,终端可以是瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统,等等,服务器可以是服务器计算机系统小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
基于上述记载的内容,在本公开的一些实施例中,提出了一种人体朝向检测的技术方案,本公开实施例应用的场景包括但不限于自动驾驶、机器人导航等场景。
图1为本公开实施例的人体朝向检测方法的流程图,如图1所示,该流程可以包括:
步骤101:对待处理图像进行特征提取,得到所述待处理图像的特征。
在实际应用中,可以从本地存储区域或网络获取待处理图像,待处理图像的格式可以是联合图像专家小组(Joint Photographic Experts GROUP,JPEG)、位图(Bitmap,BMP)、便携式网络图形(Portable Network Graphics,PNG)或其他格式;需要说明的是,这里仅仅是对待处理图像的格式和来源进行了举例说明,本发明实施例并不对待处理图像的格式和来源进行限定。
在实际应用中,可以将待处理图像输入至特征提取网络,利用特征提取网络对待处理图像进行特征提取,得到待处理图像的特征;本公开实施例中,特征提取网络为用于提取图像特征的神经网络,特征提取网络可以包括卷积层等结构;这里,并不对特征提取网络的种类进行限定,例如,特征提取网络可以是深度残差网络(Resnet)或其它用于进行图像特征提取的神经网络。
本公开实施例并不对待处理图像的特征的表示形式进行限定,例如,待处理图像的特征的表示形式可以是特征图或其它表示形式。
步骤102:基于待处理图像的特征确定人体关键点和初步的人体朝向。
对于本步骤的实现方式,示例性地,基于待处理图像的特征进行人体关键点检测,得到人体关键点;基于待处理图像的特征进行人体朝向检测,得到初步的人体朝向。
对于对待处理图像的特征进行人体关键点检测的实现方式,示例性地,可以通过对待处理图像的特征进行卷积和上采样处理,得到人体关键点。
在一个具体的示例中,在得到待处理图像的特征后,可以将待处理图像的特征输入至特征金字塔网络(Feature Pyramid Networks,FPN)中,利用FPN对待处理图像的特征进行处理,得到人体关键点;基于FPN的图像特征处理方式,可以在不同尺寸的特征图上提取特征,然后又将不同尺寸的特征图进行融合,可以提取到多尺度的特征,进而通过融合这些多尺度的特征可以准确地得出人体关键点。
对于对待处理图像的特征进行人体朝向检测的实现方式,示例性地,可以通过对待处理图像的特征进行卷积处理,得到初步的人体朝向。在实际应用中,在得到待处理图像的特征后,可以将待处理图像的特征输入至少一个卷积层组成的神经网络中,然后,在该神经网络中通过卷积操作,将待处理图像的特征转换为初步的人体朝向检测结果。
在实际应用中,步骤101至步骤102可以基于训练完成的神经网络实现,图2为本公开实施例的训练完成的神经网络的架构示意图,如图2所示,训练完成的神经网络包括底层网络和上层网络两个部分,其中,底层网络是上述的特征提取网络,在实际实施时,底层网络的输入为待处理图像,利用底层网络对待处理图像进行特征提取后,可以得到相比待处理图像表达能力更强的中高层特征;上层网络包括人体关键点检测的上层网络和人体朝向检测的上层网络;利用人体关键点检测的上层网络对待处理图像的特征进行处理,可以得到人体关键点;利用人体朝向检测的上层网络对待处理图像的特征进行处理,可以得到初步的人体朝向。
步骤103:根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向。
在实际应用中,步骤101至步骤103可以利用电子设备中的处理器实现,上述处理器可以为特定用途集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital SignalProcessing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、中央处理器(Central ProcessingUnit,CPU)、控制器、微控制器、微处理器中的至少一种。
在相关技术中,仅在人体朝向检测的基础上判断人体的朝向,得出的人体朝向的精度较低;而在本公开实施例中,最终的人体朝向是在综合考虑人体关键点和初步的人体朝向的基础上得出的,而人体关键点可以判断人体朝向的一个依据,因而,基于人体关键点对初步的人体朝向进行优化,提升最终的人体朝向的准确度和可利用性。
另外,在本公开实施例中,人体关键点检测和人体朝向检测任务中的图像特征提取,均是在同一个图像特征提取网络上实现的,因而,本公开实施例可以在耗费较少的计算资源的基础上,同时实现人体关键点检测和人体朝向检测任务,有利于满足人体关键点检测和人体朝向检测任务的实时性要求。并且利用人体关键点的检测结果和人体朝向的检测结果共同判定人体朝向,从而提高人体朝向检测的准确性。
对于步骤103的实现方式,在一个示例中,响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向相符的情况,将所述初步的人体朝向确定为所述最终的人体朝向。
在实际应用中,可以判断确定的人体关键点表征的人体朝向与初步的人体朝向是否相符,得出判断结果;在确定的人体关键点表征的人体朝向与初步的人体朝向相符的情况下,可以认为初步的人体朝向是较为准确地,因而,将初步的人体朝向确定为最终的人体朝向,可以准确地得出最终的人体朝向。
下面通过附图对本公开实施例的效果进行举例说明。
图3为本公开实施例中涉及的人体关键点的示意图,如图3所示,数字0至17表示可以通过人体关键点检测得到的人体关键点,当能够检测到全部的人体关键点时,人体朝前或者朝后;当只检测到左侧关键点时,人体朝左;当只检测到右侧的关键点时,人体朝右;图4为本公开实施例的人体朝向示意图,图4中,数字1至8表示不同的人体朝向,在人体朝向检测中,将人体朝向分为8个方向,这要比根据关键点确定的人体朝向要更加精确,因此,采用关键点的检测结果来修正朝向检测结果可以提高朝向检测结果的准确度。
结合图3和图4可以看出,当人体朝向不同时,能够检测到的人体关键点的数量和位置也不相同,例如,当能够检测到人体左侧的所有关键点,而右侧的关键点只能检测到部分或者检测不到时,而初步的人体朝向同样为朝向左侧,那么就可以判断该初步的人体朝向是准确的,进而,通过将初步的人体朝向确定为最终的人体朝向,有利于将最终的人体朝向的准确度保持在较高的水平。
对于步骤103的实现方式,在另一个示例中,响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向不相符的情况,将所述确定的人体关键点表征的人体朝向确定为所述最终的人体朝向。
可以看出,在确定的人体关键点表征的人体朝向与初步的人体朝向不相符的情况下,可以认为初步的人体朝向的准确度较低,在此基础上,将确定的人体关键点表征的人体朝向确定为所述最终的人体朝向,可以提升最终的人体朝向的准确度。
例如,结合图3和图4,当人体关键点中只有人体侧面的几个点有效时,而初步的人体朝向却为正面或者背面,那么就可以判断该初步的人体朝向不准确,即,通过人体关键点,可以有效判断人体朝向的有效性与准确性;进而,结合人体关键点对初步的人体朝向进行优化,可以提升最终的人体朝向的准确度和可利用性。
在一些实施例中,步骤101至步骤102可以由神经网络执行,上述神经网络采用第一样本图像和第二样本图像训练得到,第一样本图像中包括第一人体图像和标注的人体关键点,第二样本图像包括第二人体图像和标注的人体朝向。
在实际应用中,可以从本地存储区域或网络获取第一样本图像或第二样本图像,第一样本图像或第二样本图像的格式可以是JPEG、BMP、PNG或其他格式;需要说明的是,这里仅仅是对第一样本图像或第二样本图像的格式和来源进行了举例说明,本发明实施例并不对第一样本图像或第二样本图像的格式和来源进行限定。
在一个具体的示例中,第一样本图像和第二样本图像可以从不同的数据集中获取,第一样本图像和第二样本图像对应的数据集可以没有重叠部分。
可以看出,本公开实施例中,可以基于神经网络得出人体关键点和初步的人体朝向,具有易于实现的特点。
下面通过附图示例性地说明上述神经网络的训练过程。
图5为本公开实施例的神经网络训练方法的流程图,如图5所示,该流程可以包括:
步骤501:获取第一样本图像和第二样本图像。
本步骤的实现方式已经在前述记载的内容中作出说明,这里不再赘述。
步骤502:将第一样本图像和第二样本图像输入至神经网络中,基于神经网络执行以下步骤:对第一样本图像和第二样本图像进行特征提取,得到第一样本图像和第二样本图像的特征;根据第一样本图像的特征进行行人关键点检测,得到第一样本图像的人体关键点;基于第二样本图像的特征进行朝向检测,得到第二样本图像的人体朝向。
在实际应用中,可以将第一样本图像和第二样本图像输入至特征提取网络,利用特征提取网络对第一样本图像和第二样本图像进行特征提取,得到第一样本图像和第二样本图像的特征。
本公开实施例并不对第一样本图像和第二样本图像的特征的表示形式进行限定,例如,第一样本图像和第二样本图像的特征的表示形式可以是特征图或其它表示形式。
对于对第一样本图像和第二样本图像进行特征提取,得到第一样本图像和第二样本图像的特征的实现方式,示例性地,可以将第一样本图像和第二样本图像进行图像数据拼接,对拼接后的图像数据进行特征提取,得到拼接后的图像数据的特征;按照第一样本图像和第二样本图像的图像数据拼接方式,将拼接后的图像数据的特征拆分为第一样本图像和第二样本图像的特征。
可以看出,通过对第一样本图像和第二样本图像的图像数据拼接,有利于对拼接后的图像数据统一进行特征提取,便于实现;通过对拼接后的图像数据的特征的拆分,有利于分别针对第一样本图像和第二样本图像的特征,进行人体关键点检测和人体朝向检测,便于实现。
对于将第一样本图像和第二样本图像进行图像数据拼接的实现方式,示例性地,可以将第一样本图像和第二样本图像沿批维度拼接;在将第一样本图像和第二样本图像进行拼接之前,可以将第一样本图像和第二样本图像在在通道、高和宽三个维度上分别调整至相同;然后,可以在批维度,将调整后的第一样本图像和第二样本图像进行拼接。
这里,图像的通道数表示进行图像特征提取的通道个数,批维度表示图像的数量维度;本公开实施例中,在将第一样本图像和第二样本图像的通道数、高和宽调整至相同大小时,可以将不同数量的调整后的第一样本图像和第二样本图像,沿着批维度进行图像数据拼接。
图6为本公开实施例的神经网络训练的架构示意图,图7为本公开实施例中图像数据拼接的示意图,图7中,实线矩形框表示第一样本图像,虚线矩形框表示第二样本图像;本公开实施例中,第一样本图像和第二样本图像的数据格式可以表示为[B C H W],其中,B表示批维度的大小,C表示通道维度的大小,H表示高,W表示宽;由于图像特征提取的过程中涉及的卷积等运算均是在通道维度、高维度和宽维度上进行计算,因而,参照图6和图7,可以沿着批维度对第一类样本图像和第二类样本图像进行图像数据拼接。
参照图6,可以利用底层网络拼接后的图像数据进行特征提取,得到相应的图像特征;然后需要对底层网络输出的图像特征进行拆分。
图8为本公开实施例中图像特征拆分的示意图,图8中,实线矩形框(对应C1)表示第一样本图像的图像特征,虚线矩形框(对应C2)表示第二样本图像的图像特征;本公开实施例中,可以按照第一样本图像和第二样本图像的图像数据拼接方式,沿着批维度对拼接后的图像数据的特征进行拆分,得到第一样本图像的图像特征和第二样本图像的图像特征;这里,第一样本图像的图像特征和第二样本图像的图像特征均通过特征图进行表示。
参照图6,可以将第一样本图像的图像特征输入至人体关键点检测的上层网络,人体关键点检测的上层网络对输入的图像特征进行处理后,输出第一样本图像的人体关键点;还可以将第二样本图像的图像特征输入至人体朝向检测的上层网络,人体朝向检测的上层网络对输入的图像特征进行处理后,输出第二样本图像的人体朝向。
进一步地,参照图6,在得出第一样本图像的人体关键点后,还可以计算神经网络的第一损失,第一损失表示第一样本图像的人体关键点和标注的人体关键点的差异;在得出第二样本图像的人体朝向后,还可以计算神经网络的第二损失,第二损失表示第二样本图像的人体朝向和标注的人体朝向的差异。
本公开实施例中,基于第一样本图像的特征进行人体关键点检测的实现方式,与步骤102中基于待处理图像的特征进行人体关键点检测的实现方式相同,这里不再赘述;基于第二样本图像的特征进行人体朝向检测的实现方式,与步骤102中基于待处理图像的特征进行人体朝向检测的实现方式相同,这里不再赘述。
可以看出,神经网络的应用和测试过程(步骤101至步骤103)与神经网络的训练过程相比,无需要进行图像数据的拼接和图像特征的拆分,只需要对待处理图像通过底层网络和两个上层网络进行处理,便可以得出待处理图像的人体关键点和初步的人体朝向。
步骤503:根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整神经网络的网络参数值。
对于本步骤的实现方式,示例性地,可以根据检测的人体关键点(即第一样本图像的人体关键点)和标注的人体关键点,得出神经网络的第一损失;根据检测的人体朝向(即第二样本图像的人体朝向)和标注的人体朝向,得出神经网络的第二损失;根据上述第一损失和第二损失,调整神经网络的网络参数值。
在具体实现时,可以将第一损失与第二损失之和作为神经网络的总损失,也可以将第一损失与第二损失的加权和作为神经网络的总损失,第一损失与第二损失的权重可以根据实际应用需求预先设置。
在得出神经网络的总损失后,可以根据神经网络的总损失,调整神经网络的网络参数值。
步骤504:判断网络参数值调整后的初始神经网络对图像的处理是否满足设定的精度需求,如果否,则重新执行步骤501至步骤504;如果是,则执行步骤505。
本公开实施例中,设定的精度需求可以是预先设置的;示例性地,设定的精度需求与第一损失和第二损失相关,在第一个示例中,设定的精度需求可以是上述神经网络的总损失小于第一设定阈值,第二个示例中,设定的精度需求可以是第一损失小于第二设定阈值,且第二损失小于第三设定阈值。
在实际应用中,第一设定阈值、第二设定阈值和第三设定阈值均可以根据实际应用需求预先设置。
步骤505:将网络参数值调整后的神经网络作为训练完成的神经网络。
在实际应用中,步骤501至步骤505可以利用电子设备中的处理器实现,上述处理器可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
可以看出,在本公开实施例中,在对神经网络进行训练时,无需针对第一样本图像或第二样本图像分别进行人体关键点检测和人体朝向检测,人体关键点检测和人体朝向检测任务,均是在相同的图像特征提取过程的基础上实现的,因而,可以使得训练完成的神经网络在耗费较少的计算资源的基础上,同时实现人体关键点检测和人体朝向检测任务,有利于满足人体关键点检测和人体朝向检测任务的实时性要求。
在对神经网络进行训练的过程中,在一个示例中,可以充分利用第一样本图像和第二样本图像的数据相似性(即二者都包含了人体图像),通过对第一样本图像和第二样本图像的图像数据拼接,有利于对拼接后的图像数据统一进行特征提取,便于实现;并且可以利用人体关键点检测和人体朝向检测的神经网络的相似性(即都需要提取人体图像中的特征),在人体关键点检测的神经网络和人体朝向检测的神经网络中,提取共同的底层网络用于进行统一的图像特征提取,进而,可以使得通过同一个训练完成的神经网络同时进行人体关键点检测和人体朝向检测。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定
在前述实施例提出的人体朝向检测方法的基础上,本公开实施例提出了一种人体朝向检测装置。
图9为本公开实施例的人体朝向检测装置的组成结构示意图,如图9所示,该装置可以包括提取模块901和处理模块902,其中,
提取模块901,用于对待处理图像进行特征提取,得到所述待处理图像的特征;
处理模块902,用于基于所述待处理图像的特征确定人体关键点和初步的人体朝向;根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向。
可选地,所述处理模块902,用于根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向相符的情况,将所述初步的人体朝向确定为所述最终的人体朝向。
可选地,所述处理模块902,用于根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向不相符的情况,将所述确定的人体关键点表征的人体朝向确定为所述最终的人体朝向。
可选地,对待处理图像进行特征提取得到所述待处理图像的特征,以及基于所述待处理图像的特征确定人体关键点和初步的人体朝向的步骤由神经网络执行,所述神经网络采用第一样本图像和第二样本图像训练得到,所述第一样本图像中包括第一人体图像和标注的人体关键点,所述第二样本图像包括第二人体图像和标注的人体朝向。
可选地,所述装置还包括训练模块,所述训练模块,用于采用第一样本图像和第二样本图像训练所述神经网络,包括:
对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像和所述第二样本图像的特征;根据所述第一样本图像的特征进行行人关键点检测,得到所述第一类样本图像的人体关键点;基于所述第二样本图像的特征进行朝向检测,得到所述第二样本图像的人体朝向;
根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值。
可选地,所述训练模块,用于对所述第一样本图像和所述第二样本图像进行特征提取,得到所述第一样本图像和所述第二样本图像的特征,包括:
将所述第一样本图像和所述第二样本图像进行拼接,对拼接后的图像数据进行特征提取,得到拼接后的图像数据的特征;
按照所述第一样本图像和所述第二样本图像的拼接方式,将所述拼接后的图像数据的特征拆分为所述第一样本图像的特征和所述第二样本图像的特征。
可选地,所述训练模块用于将所述第一样本图像和所述第二样本图像进行拼接,包括:所述第一样本图像和所述第二样本图像沿批维度拼接;
所述训练模块,还用于在将所述第一样本图像和所述第二样本图像进行拼接之前,将所述第一样本图像和所述第二样本图像在通道、高和宽三个维度上分别调整至相同。
可选地,所述训练模块,用于根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值,包括:
根据所述检测的人体关键点和所述标注的人体关键点,得出所述神经网络的第一损失值,所述第一损失值表示所述检测的人体关键点和所述标注的人体关键点的差异;
根据所述检测的人体朝向和所述标注的人体朝向,得出所述神经网络的第二损失值,所述第二损失值表示所述检测的人体朝向和所述标注的人体朝向的差异;
根据所述第一损失值和所述第二损失值,调整所述神经网络的网络参数值。
实际应用中,提取模块901和处理模块902均可以利用电子设备中的处理器实现,上述处理器可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
另外,在本实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
具体来讲,本实施例中的一种人体朝向检测方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与一种人体朝向检测方法对应的计算机程序指令被一电子设备读取或被执行时,实现前述实施例的任意一种人体朝向检测方法。
基于前述实施例相同的技术构思,参见图10,其示出了本公开实施例提供的一种电子设备10,可以包括:存储器1001和处理器1002;其中,
所述存储器1001,用于存储计算机程序和数据;
所述处理器1002,用于执行所述存储器中存储的计算机程序,以实现前述实施例的任意一种人体朝向检测方法。
在实际应用中,上述存储器1001可以是易失性存储器(volatile memory),例如RAM;或者非易失性存储器(non-volatile memory),例如ROM,快闪存储器(flash memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,并向处理器1002提供指令和数据。
上述处理器1002可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本公开实施例不作具体限定。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述
本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (14)

1.一种人体朝向检测方法,其特征在于,所述方法包括:
采用神经网络对待处理图像进行特征提取,得到所述待处理图像的特征;所述神经网络采用第一样本图像和第二样本图像训练得到;采用所述神经网络基于所述待处理图像的特征确定人体关键点和初步的人体朝向;根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向;
所述神经网络采用第一样本图像和第二样本图像训练得到,包括:将所述第一样本图像和所述第二样本图像进行拼接,对拼接后的图像数据进行特征提取,得到拼接后的图像数据的特征;
按照所述第一样本图像和所述第二样本图像的拼接方式,将所述拼接后的图像数据的特征拆分为所述第一样本图像的特征和所述第二样本图像的特征;根据所述第一样本图像的特征进行行人关键点检测,得到所述第一样本图像的人体关键点;基于所述第二样本图像的特征进行朝向检测,得到所述第二样本图像的人体朝向;
根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值。
2.根据权利要求1所述的方法,其特征在于,所述根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:
响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向相符的情况,将所述初步的人体朝向确定为所述最终的人体朝向。
3.根据权利要求1所述的方法,其特征在于,所述根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:
响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向不相符的情况,将所述确定的人体关键点表征的人体朝向确定为所述最终的人体朝向。
4.根据权利要求1-3任一所述的方法,其特征在于,所述第一样本图像中包括第一人体图像和标注的人体关键点,所述第二样本图像包括第二人体图像和标注的人体朝向。
5.根据权利要求1所述的方法,其特征在于,将所述第一样本图像和所述第二样本图像进行拼接,包括:
所述第一样本图像和所述第二样本图像沿批维度拼接;
在将所述第一样本图像和所述第二样本图像进行拼接之前,所述方法还包括:
将所述第一样本图像和所述第二样本图像在通道、高和宽三个维度上分别调整至相同。
6.根据权利要求1所述的方法,其特征在于,所述根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值,包括:
根据所述检测的人体关键点和所述标注的人体关键点,得出所述神经网络的第一损失值,所述第一损失值表示所述检测的人体关键点和所述标注的人体关键点的差异;
根据所述检测的人体朝向和所述标注的人体朝向,得出所述神经网络的第二损失值,所述第二损失值表示所述检测的人体朝向和所述标注的人体朝向的差异;
根据所述第一损失值和所述第二损失值,调整所述神经网络的网络参数值。
7.一种人体朝向检测装置,其特征在于,所述装置包括提取模块和处理模块,其中,
提取模块,用于采用神经网络对待处理图像进行特征提取,得到所述待处理图像的特征;所述神经网络采用第一样本图像和第二样本图像训练得到;
处理模块,用于采用所述神经网络基于所述待处理图像的特征确定人体关键点和初步的人体朝向;根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向;
训练模块,用于采用第一样本图像和第二样本图像训练所述神经网络,包括:将所述第一样本图像和所述第二样本图像进行拼接,对拼接后的图像数据进行特征提取,得到拼接后的图像数据的特征;
按照所述第一样本图像和所述第二样本图像的拼接方式,将所述拼接后的图像数据的特征拆分为所述第一样本图像的特征和所述第二样本图像的特征;根据所述第一样本图像的特征进行行人关键点检测,得到所述第一样本图像的人体关键点;基于所述第二样本图像的特征进行朝向检测,得到所述第二样本图像的人体朝向;
根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值。
8.根据权利要求7所述的装置,其特征在于,所述处理模块,用于根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向相符的情况,将所述初步的人体朝向确定为所述最终的人体朝向。
9.根据权利要求7所述的装置,其特征在于,所述处理模块,用于根据确定的人体关键点和初步的人体朝向,确定最终的人体朝向,包括:响应于所述确定的人体关键点表征的人体朝向与所述初步的人体朝向不相符的情况,将所述确定的人体关键点表征的人体朝向确定为所述最终的人体朝向。
10.根据权利要求7-9任一所述的装置,其特征在于,所述第一样本图像中包括第一人体图像和标注的人体关键点,所述第二样本图像包括第二人体图像和标注的人体朝向。
11.根据权利要求7所述的装置,其特征在于,所述训练模块用于将所述第一样本图像和所述第二样本图像进行拼接,包括:所述第一样本图像和所述第二样本图像沿批维度拼接;
所述训练模块,还用于在将所述第一样本图像和所述第二样本图像进行拼接之前,将所述第一样本图像和所述第二样本图像在通道、高和宽三个维度上分别调整至相同。
12.根据权利要求7所述的装置,其特征在于,所述训练模块,用于所述根据检测的人体关键点、标注的人体关键点、检测的人体朝向和标注的人体朝向,调整所述神经网络的网络参数值,包括:
根据所述检测的人体关键点和所述标注的人体关键点,得出所述神经网络的第一损失值,所述第一损失值表示所述检测的人体关键点和所述标注的人体关键点的差异;
根据所述检测的人体朝向和所述标注的人体朝向,得出所述神经网络的第二损失值,所述第二损失值表示所述检测的人体朝向和所述标注的人体朝向的差异;
根据所述第一损失值和所述第二损失值,调整所述神经网络的网络参数值。
13.一种电子设备,其特征在于,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序以执行权利要求1至6任一项所述的方法。
14.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的方法。
CN201911143057.6A 2019-11-20 2019-11-20 人体朝向检测方法、装置、电子设备和计算机存储介质 Active CN112825145B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201911143057.6A CN112825145B (zh) 2019-11-20 2019-11-20 人体朝向检测方法、装置、电子设备和计算机存储介质
JP2021531125A JP2022510963A (ja) 2019-11-20 2020-09-08 人体向き検出方法、装置、電子機器及びコンピュータ記憶媒体
KR1020217016720A KR20210087494A (ko) 2019-11-20 2020-09-08 인체 방향 검출 방법, 장치, 전자 기기 및 컴퓨터 저장 매체
PCT/CN2020/114105 WO2021098346A1 (zh) 2019-11-20 2020-09-08 人体朝向检测方法、装置、电子设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911143057.6A CN112825145B (zh) 2019-11-20 2019-11-20 人体朝向检测方法、装置、电子设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN112825145A CN112825145A (zh) 2021-05-21
CN112825145B true CN112825145B (zh) 2022-08-23

Family

ID=75907133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911143057.6A Active CN112825145B (zh) 2019-11-20 2019-11-20 人体朝向检测方法、装置、电子设备和计算机存储介质

Country Status (4)

Country Link
JP (1) JP2022510963A (zh)
KR (1) KR20210087494A (zh)
CN (1) CN112825145B (zh)
WO (1) WO2021098346A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862074B (zh) * 2023-02-28 2023-05-30 科大讯飞股份有限公司 人体指向确定、屏幕控制方法、装置及相关设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201400941D0 (en) * 2014-01-20 2014-03-05 Apical Ltd A method of object orientation detection
CN105678779A (zh) * 2016-01-15 2016-06-15 上海交通大学 基于椭圆匹配的人体朝向角度实时检测方法
CN109359526A (zh) * 2018-09-11 2019-02-19 深圳大学 一种人脸姿态估计方法、装置和设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3822482B2 (ja) * 2001-10-31 2006-09-20 株式会社東芝 顔向き計算方法及びその装置
JP4785416B2 (ja) * 2005-05-11 2011-10-05 キヤノン株式会社 位置姿勢計測方法及び装置
WO2011046128A1 (ja) * 2009-10-16 2011-04-21 日本電気株式会社 人物服装特徴抽出装置、人物検索装置、及びその処理方法
CN102043943B (zh) * 2009-10-23 2012-11-07 华为技术有限公司 人脸姿态参数获取方法及装置
JP5396287B2 (ja) * 2010-01-14 2014-01-22 本田技研工業株式会社 顔向き検知装置
WO2015001791A1 (ja) * 2013-07-03 2015-01-08 パナソニックIpマネジメント株式会社 物体認識装置及び物体認識方法
CN108229288B (zh) * 2017-06-23 2020-08-11 北京市商汤科技开发有限公司 神经网络训练及衣服颜色检测方法、装置、存储介质、电子设备
CN107767416B (zh) * 2017-09-05 2020-05-22 华南理工大学 一种低分辨率图像中行人朝向的识别方法
CN108205654B (zh) * 2017-09-30 2021-06-04 北京市商汤科技开发有限公司 一种基于视频的动作检测方法及装置
CN108268894A (zh) * 2018-01-10 2018-07-10 浙江工业大学 一种基于网络可视图的人体朝向检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201400941D0 (en) * 2014-01-20 2014-03-05 Apical Ltd A method of object orientation detection
CN105678779A (zh) * 2016-01-15 2016-06-15 上海交通大学 基于椭圆匹配的人体朝向角度实时检测方法
CN109359526A (zh) * 2018-09-11 2019-02-19 深圳大学 一种人脸姿态估计方法、装置和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Orientation and Occlusion Aware Multi-Person Pose Estimation using Multi-Task Deep Learning Network;Huiyang Zhang etal.;《2019 IEEE International Conference on Consumer Electronics (ICCE)》;20190307;全文 *
基于姿态和骨架信息的行为识别方法研究与实现;马静;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20190115;第2018年卷(第12期);全文 *

Also Published As

Publication number Publication date
WO2021098346A1 (zh) 2021-05-27
JP2022510963A (ja) 2022-01-28
KR20210087494A (ko) 2021-07-12
CN112825145A (zh) 2021-05-21

Similar Documents

Publication Publication Date Title
US11423633B2 (en) Image processing to detect a rectangular object
WO2019051941A1 (zh) 车型识别方法、装置、设备及计算机可读存储介质
US20170032217A1 (en) Online per-feature descriptor customization
CN110348393B (zh) 车辆特征提取模型训练方法、车辆识别方法及设备
CN110287936B (zh) 图像检测方法、装置、设备及存储介质
CN109102026B (zh) 一种车辆图像检测方法、装置及系统
CN113989616A (zh) 一种目标检测方法、装置、设备和存储介质
CN115035347A (zh) 图片识别方法、装置及电子设备
CN110210314B (zh) 人脸检测方法、装置、计算机设备及存储介质
CN112825145B (zh) 人体朝向检测方法、装置、电子设备和计算机存储介质
CN112785595A (zh) 目标属性检测、神经网络训练及智能行驶方法、装置
CN114266901A (zh) 文档轮廓提取模型构建方法、装置、设备及可读存储介质
CN112287905A (zh) 车辆损伤识别方法、装置、设备及存储介质
CN112287923A (zh) 卡证信息识别方法、装置、设备及存储介质
CN111507420A (zh) 轮胎信息获取方法、装置、计算机设备和存储介质
CN111950415A (zh) 一种图像检测方法和装置
US20220122341A1 (en) Target detection method and apparatus, electronic device, and computer storage medium
US20240331418A1 (en) Image processing device, image processing method, and recording medium
CN114065868B (zh) 文本检测模型的训练方法、文本检测方法及装置
CN111310561B (zh) 车辆配置识别方法及装置
CN113191401A (zh) 基于视觉显著性共享的用于三维模型识别的方法及装置
CN114241044A (zh) 回环检测方法、装置、电子设备和计算机可读介质
CN113139617A (zh) 一种输电线路自主定位方法、装置及终端设备
CN108764333B (zh) 一种用于语义分割的学习器训练方法、系统、终端和存储介质
CN117576109B (zh) 一种缺陷检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant