CN112949576A - 姿态估计方法、装置、设备及存储介质 - Google Patents

姿态估计方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112949576A
CN112949576A CN202110336352.4A CN202110336352A CN112949576A CN 112949576 A CN112949576 A CN 112949576A CN 202110336352 A CN202110336352 A CN 202110336352A CN 112949576 A CN112949576 A CN 112949576A
Authority
CN
China
Prior art keywords
image data
face image
detected
attitude estimation
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110336352.4A
Other languages
English (en)
Other versions
CN112949576B (zh
Inventor
魏书琪
欧歌
杜志宏
蒲灵峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Beijing BOE Technology Development Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Beijing BOE Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd, Beijing BOE Technology Development Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN202110336352.4A priority Critical patent/CN112949576B/zh
Publication of CN112949576A publication Critical patent/CN112949576A/zh
Application granted granted Critical
Publication of CN112949576B publication Critical patent/CN112949576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/50Maintenance of biometric data or enrolment thereof
    • G06V40/53Measures to keep reference information secret, e.g. cancellable biometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本申请公开了一种姿态估计方法、装置、设备以及存储介质。姿态估计方法包括:获取待测人脸图像数据,根据预设加密算法对待测人脸图像数据处理并计算得到与待测人脸图像数据相关的矩阵化加密数据,根据训练好的姿态估计模型将矩阵化加密数据进行计算得到姿态估计结果,姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。本申请实施方式的姿态估计方法中,通过对待检测人脸图像数据进行加密处理,避免了直接通过人脸图像数据得到姿态估计结果,降低了人脸图像数据因泄露而暴露用户隐私的风险。

Description

姿态估计方法、装置、设备及存储介质
技术领域
本申请涉及图像识别领域,特别涉及一种姿态估计方法、姿态估计装置、姿态估计设备及计算机可读存储介质。
背景技术
目前,人脸识别的相关应用日趋成熟,基于深度学习的人脸识别算法能够得到较高的识别准确率。但大多应用均需要在大量人脸数据的驱动下进行模型的训练。在包含人脸数据在内的个人数据保护措施愈加严格的环境下,如何解决数据泄漏与模型训练之间的矛盾成了亟待解决的问题。
发明内容
有鉴于此,本申请提供一种姿态估计方法、姿态估计装置、姿态估计设备及非失易性计算机可读存储介质。
本申请的姿态估计方法包括:
获取待测人脸图像数据;
根据预设加密算法对所述待测人脸图像数据处理生成与所述待测人脸图像数据相关的矩阵化加密数据;和
根据训练好的姿态估计模型将所述矩阵化加密数据进行计算得到姿态估计结果,所述姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
在某些实施方式中,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
提取所述待测人脸图像数据中多个特征点;
以坐标转换算法将每个所述特征点的坐标进行坐标转换以生成转换点;
根据所述转换点的坐标进行矩阵转换生成所述矩阵化加密数据。
在某些实施方式中,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
提取所述待测人脸图像数据中多个特征点;
根据欧式距离算法计算多个所述特征点之间的欧氏距离以得到第一特征向量;
将所述第一特征向量进行矩阵转换生成所述矩阵化加密数据。
在某些实施方式中,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
提取所述待测人脸图像数据中多个特征点;
根据尺度不变特征变换算法计算出所述特征点的第二特征向量;
将所述第二特征向量进行矩阵转换成生成所述矩阵化加密数据。
在某些实施方式中,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
通过深度卷积神经网络模型将所述待测人脸图像数据处理以生成多个第三特征向量;
将所述第三特征向量进行矩阵转换成生成所述矩阵化加密数据。
在某些实施方式中,所述姿态估计模型包括姿态估计算法,所述姿态估计算法包括卷积层、池化层、展平层和全连接层,所述根据预设姿态估计算法对所述矩阵化加密数据处理得到姿态估计结果包括:
所述卷积层和所述池化层用于对所述矩阵化加密数据进行处理得到特征图,每层卷积层卷积后进行ReLU激活操作;所述展平层用于将所述特征图展平得到特征向量;所述全连接层用于对所述特征向量进行两层全连接运算得到所述姿态估计。
在某些实施方式中,所述姿态估计方法还包括:
通过所述姿态估计算法将所述训练矩阵化加密数据计算得到训练姿态估计结果;
采用log-cosh损失函数对所述姿态估计算法得到的所述训练姿态估计结果进行损失值计算优化所述姿态估计模型。
本申请的姿态估计装置包括:
获取模块,用于获取待测人脸图像数据;
生成模块,根据预设加密算法对所述待测人脸图像数据处理生成与所述待测人脸图像数据相关的矩阵化加密数据;和
计算模块,用于根据训练好的姿态估计模型将加密数据进行计算得到姿态估计结果,所述姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
本申请的姿态估计设备,包括处理器和存储器;所述存储器中存储有程序,并且所述程序被所述处理器执行,所述程序包括用于执行上述的姿态估计方法的指令。所述姿态估计方法包括:获取待测人脸图像数据;根据预设加密算法对所述待测人脸图像数据处理生成与所述待测人脸图像数据相关的矩阵化加密数据;根据训练好的姿态估计模型将加密数据进行计算得到姿态估计结果,所述姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
本申请的计算机可读存储介质,包括计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行上述的所述的姿态估计方法。所述姿态估计方法包括:获取待测人脸图像数据;根据预设加密算法对所述待测人脸图像数据处理生成与所述待测人脸图像数据相关的矩阵化加密数据;根据训练好的姿态估计模型将加密数据进行计算得到姿态估计结果,所述姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
本申请实施方式的姿态估计方法、装置、设备及可读存储介质中,通过对待测人脸图像数据进行加密处理得到矩阵化的加密数据,再根据训练好的姿态估计模型对矩阵化加密数据进行姿态估计运算得到估计姿态结果,如此,在保证姿态估计结果准确性的同时,还避免了直接采用人脸数据进行姿态估计运算而导致人脸图像数据泄露的风险,增加了数据的保密性。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请某些实施方式的姿态估计方法的流程示意图;
图2是本申请某些实施方式的姿态估计装置的模块示意图;
图3是本申请某些实施方式的姿态估计设备的模块示意图;
图4是本申请某些实施方式通过姿态估计算法对矩阵化加密数据处理过程的场景示意图;
图5是本申请某些实施方式姿态估计方法的流程示意图
图6是本申请某些实施方式的获取特征点的场景示意图;
图7是本申请某些实施方式的转换点排序的场景示意图;
图8-9是本申请某些实施方式的姿态估计方法的流程示意图;
图10是本申请某些实施方式的获取特征点的场景示意图;
图11是本申请某些实施方式的姿态估计方法的流程示意图;
图12是本申请某些实施方式的VGG-16网络结构算法的结构示意图;
图13是本申请某些实施方式的姿态估计方法的流程示意图;
图14是本申请某些实施方式的存储介质与处理器连接的模块示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
请参阅图1,本申请提供一种姿态估计方法,包括步骤:
S12,获取待测人脸图像数据;
S14,根据预设加密算法对待测人脸图像数据处理并计算得到与待测人脸图像数据相关的矩阵化加密数据;和
S16,根据训练好的姿态估计模型将矩阵化加密数据进行计算得到姿态估计结果,姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
请参阅图2,本申请实施方式提供了一种姿态估计装置10。姿态估计装置10包括获取模块12、生成模块14、计算模块16。
S12可以由获取模块12实现,S14可以由生成模块14实现,S16可以由计算模块16实现。
或者说,获取模块12可以用于获取待测人脸图像数据。
生成模块14可以用于根据预设加密算法对待测人脸图像数据处理并计算得到与待测人脸图像数据相关的矩阵化加密数据。
计算模块16可以用于根据训练好的姿态估计模型将矩阵化加密数据进行计算得到姿态估计结果,姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
请结合图3,本申请还提供了一种姿态估计设备,包括处理器20。处理器20用于获取待测人脸图像数据,处理器20用于根据预设加密算法对待测人脸图像数据处理并计算得到与待测人脸图像数据相关的矩阵化加密数据,处理器20还用于根据训练好的姿态估计模型将矩阵化加密数据进行计算得到姿态估计结果,姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
本申请的姿态估计方法、姿态估计装置和姿态估计设备中,通过对待测人脸图像数据进行加密处理得到矩阵化的加密数据,再根据训练好的姿态估计模型对矩阵化加密数据进行姿态估计运算得到估计姿态结果,如此,在保证姿态估计结果准确性的同时,还避免了直接采用人脸数据进行姿态估计运算以及采用人脸数据进行模型训练而导致人脸图像数据泄露的风险,增加了数据的保密性。
需要说明的是,预设加密算法可包括但不限于坐标转换算法、欧式距离算法、尺度不变特征变换(Scale-Invariant Feature Transform,sift)算法或深度神经网络(DeepNeural Network,DNN)算法等。也即是,处理器20可通过预设坐标转换算法、欧式距离算法、尺度不变特征变换算法或者深度神经网络算法分别对人脸图像数据进行处理生成矩阵化加密数据。
相关领域技术人员可以理解,尺度不变特征变换算法是指在计算机视觉领域中检测和描述图像中局部特征的算法,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声保持一定程度的稳定。深度神经网络是机器学习(Machine Learning,ML)领域中一种技术。
还需要说明的是,矩阵化加密数据是指加密数据是以矩阵形式排布。训练矩阵化加密数据是指用于对姿态估计模型进行训练的矩阵化加密数据。待测人脸图像数据是指当前待检测的人脸图像数据,训练人脸图像数据是指用于对姿态估计模型进行训练的人脸图像数据。
姿态估计结果可以是欧拉角,也即是,本申请通过训练好的姿态估计模型对矩阵化加密数据进行处理计算得到欧拉角。欧拉角是用来唯一地确定定点转动刚体位置的三个一组独立角参量,由翻滚角、俯仰角、偏航角组成。
可以理解,由于人脸姿态估计结果主要是获得脸部朝向的角度信息。一般可以用旋转矩阵、旋转向量、四元数或欧拉角表示,一般而言,欧拉角可读性强,使用广泛,因此,本申请可采用欧拉角进行姿态估计。
请结合图4,姿态估计模型包括有姿态估计算法,通过姿态估计算法可将矩阵化加密数据进行处理得到姿态估计结果。
姿态估计算法主要由3层卷积层(Convolutional layer)、1层池化层(Poolinglayer)、1层展平层和1层全连接层组组成,在通过姿态估计算法对矩阵化加密数据进行计算处理得到姿态估计结果的过程中,先通过卷积层和池化层对矩阵化加密数据进行处理得到特征图,每层卷积层卷积后进行ReLU激活操作,进而,通过展平层将特征图展平得到第四特征向量,再通过全连接层对第四特征向量进行两层全连接运算得到欧拉角数据(姿态估计结果)。
需要说明的是,姿态估计算法可根据不同加密算法选择不同输入尺寸进行运算,图4仅是以坐标转换算法作为预设坐标算法得到的矩阵化加密数据进行姿态估计运算得到姿态估计结果为例。
请参阅图5,在某些实施方式中,步骤S14包括子步骤:
S141,提取待测人脸图像数据中多个特征点;
S142,以坐标转换算法将每个特征点的坐标进行坐标转换以生成多个转换点;
S143,根据转换点的坐标进行矩阵转换生成矩阵化加密数据。
请进一步结合图2,在某些实施方式中,子步骤S141、S142和S143可以由生成模块14实现。
或者说,生成模块14可以用于提取待测人脸图像数据中多个特征点。生成模块14还可以用于以坐标转换算法将每个特征点的坐标进行坐标转换以生成多个转换点以及根据转换点的坐标进行矩阵转换生成矩阵化加密数据。
请进一步结合图3,在某些实施方式中,处理器20可以用于提取待测人脸图像数据中多个特征点,处理器20还可以用于以坐标转换算法将每个特征点的坐标进行坐标转换以生成多个转换点以及根据转换点的坐标进行矩阵转换生成矩阵化加密数据。
处理器20可通过神经网络来提取待测人脸图像数据中的多个特征点,特征点的数量不设限制,可由预设加密算法确定。例如,以坐标转换算法或欧式距离算法获取的特征点可以为72个,而以尺度不变特征变换算法获取的特征点数量为5个。
在本实施方式中,采用坐标转换算法来对待测人脸图像数据计算得到多个矩阵化加密数据。
请结合图6,具体地,处理器20可在每张人脸图像数据中建立计算机屏幕坐标系,其中,左上角为原点,向右为x轴正方向,向下为y轴正方向。进而,处理器20通过神经网络来提取待测人脸图像数据中不同位置依次取72个特征点,并且根据点对方式对每个特征点坐标进行存储,每个特征点的坐标使用一行数据表示,x坐标与y坐标之间采用空格分隔,特征点序号与行号对应。
进一步地,处理器20根据坐标转换算法将获取的多个特征点进行数据平移生成对应的转换点,如此,隐去了待测人脸图像数据中的像素数据以及非特征点的坐标信息,使得泄密风险大大降低。
坐标转换算法包括:
Figure BDA0002997851770000061
其中,x,y为分别为特征点的横坐标和纵坐标,α为缩放因子;
可以理解,由于人脸偏航角改变或脸型差异的不同个体均会使关键点发生x坐标相对偏移,因此,α为缩放因子可采取固定经验值,例如,在本申请中,α=200。
进一步地,请结合图7,处理器20将转换点之间的关联关系得以挖掘,对转换点进行分组,每6个转换点的坐标为一组,将转换点分为12组,同组转换点的坐标按行排列以得到矩阵化加密数据。
如此,处理器20通过姿态训练模型对矩阵化加密数据进行运算得到姿态估计结果。
请参阅图8,在某些实施方式中,步骤S14包括子步骤:
S141,提取待测人脸图像数据中多个特征点;
S144,根据欧式距离算法计算多个特征点之间的欧氏距离以得到第一特征向量;
S145,将第一特征向量进行矩阵转换生成矩阵化加密数据。
在某些实施方式中,子步骤S141、S144和S145可以由生成模块14完成。或者说,生成模块14可以用于提取待测人脸图像数据中多个特征点,生成模块14还可以用于根据欧式距离算法计算多个特征点之间的欧氏距离以得到第一特征向量,并将第一特征向量进行矩阵转换生成矩阵化加密数据。
在某些实施方式中,处理器20可以用于提取待测人脸图像数据中多个特征点以及根据欧式距离算法计算多个特征点之间的欧氏距离以得到第一特征向量,并将第一特征向量进行矩阵转换生成矩阵化加密数据。
需要说明的是,在本实施方式中,采用欧式距离算法来根据待测人脸图像数据得到与待测人脸图像数据相关的矩阵化加密数据。并且,处理器20从待测人脸图像数据中获取的特征点的个数为72个。
具体地,在处理器20获取到待测人脸图像数据中多个特征点后,根据各特征点的空间分布,计算各个特征点的欧式距离(每两个特征点之间形成一个向量x),得到2556个列向量x。
处理器20还可设置有预设向量转换公式:
Figure BDA0002997851770000071
其中,xi为列向量x中任意一个向量值,
Figure BDA0002997851770000072
为列向量x的平均向量值。
处理器20可将列向量x以预设向量转换公式得到2601列向量Y,并将2601列向量Y进行矩阵转换,转换成51*51的矩阵数据以得到矩阵化加密数据。
请参阅图9,在某些实施方式中,步骤S14包括子步骤:
S141,提取待测人脸图像数据中多个特征点;
S146,根据尺度不变特征变换算法计算出特征点的第二特征向量;
S147,将第二特征向量进行矩阵转换成生成矩阵化加密数据。
请进一步结合图2,在某些实施方式中,子步骤S141、S146和S147可以由生成模块14实现。
或者说,生成模块14可以用于提取待测人脸图像数据中多个特征点。
生成模块14可以用于根据尺度不变特征变换算法计算出特征点的第二特征向量。
生成模块14还可以用于将第二特征向量进行矩阵转换成生成矩阵化加密数据。
在某些实施方式中,处理器20可以用于提取待测人脸图像数据中多个特征点,处理器20可以用于根据尺度不变特征变换算法计算出特征点的第二特征向量。处理器20还可以用于将第二特征向量进行矩阵转换成生成矩阵化加密数据。
需要说明的是,在本实施方式中,采用尺度不变特征变换算法来根据待测人脸图像数据得到与待测人脸图像数据相关的矩阵化加密数据。特征点的数量可以为5个
请结合图10,具体地,处理器20可从待测人脸图像数据中提取眼睛瞳孔、鼻尖、嘴角等五个位置点并依次标号生成5个特征点。进而采用尺度不变特征变换算法分别对5个特征点进行关键点描述(每个特征点采用4*4*8=128维向量表征),得到5*128个第二特征向量。
进一步地,处理器20可以以特征点的标号对每个特征点的第二特征向量排序并进行矩阵转换,得到5*128大小的矩阵化加密数据。
请参阅图11,在某些实施方式中,在某些实施方式中,深度神经网络算法包括深度卷积神经网络模型,步骤S14还包括子步骤:
S141,提取待测人脸图像数据中多个特征点;
S148,通过深度卷积神经网络模型将待测人脸图像数据处理以生成多个第三特征向量;
S149,将第三特征向量进行矩阵转换成生成矩阵化加密数据。
在某些实施方式中,子步骤S141、S148和S149可以由生成模块14实现。
或者说,生成模块14可以用于提取待测人脸图像数据中多个特征点。
生成模块14可以用于通过深度卷积神经网络模型将待测人脸图像数据处理以生成多个第三特征向量。
生成模块14还可以用于将将第三特征向量进行矩阵转换成生成矩阵化加密数据。
在某些实施方式中,处理器20可以用于提取待测人脸图像数据中多个特征点,
处理器20可以用于通过深度卷积神经网络模型将待测人脸图像数据处理以生成多个第三特征向量。处理器20还可以用于将将第三特征向量进行矩阵转换成生成矩阵化加密数据。
请结合图12,需要说明的是,在本申请中,深度卷积神经网络模型可以为VGG-16网络构架算法,VGG-16网络构架算法是牛津大学计算机视觉组和Google DeepMind公司研究员一起研发的一种深度卷积神经网络模型。在VGG-16网络构架算法中,其中,VGG是指(Visual Geometry Group Network,视觉几何群网络),16是指VGG网络结构中包括有13个卷积层和3个全链接层。
具体地,处理器20可将待测人脸图像数据输入VGG-16网络构架算法中,并得到4096列第三特征向量,将4096列第三特征向量排序并进行矩阵转换,以得到64*64大小的矩阵化加密数据。
请结合图13,在某些实施方式中,姿态估计方法还包括:
S11,通过姿态估计算法将训练矩阵化加密数据计算得到训练姿态估计结果;
S13,采用log-cosh损失函数对姿态估计算法得到的训练姿态估计结果进行损失值计算以优化姿态估计模型。
在某些实施方式中,步骤S11和步骤S13可以由计算模块16实现。
或者说,计算模块16可以用于通过姿态估计算法将训练矩阵化加密数据计算得到训练姿态估计结果;
计算模块16还可以用于采用log-cosh损失函数对姿态估计算法得到的训练姿态估计结果进行损失值计算以优化姿态估计模型。
在某些实施方式中,处理器20可以用于通过姿态估计算法将训练矩阵化加密数据计算得到训练姿态估计结果。处理器20还可以用于采用log-cosh损失函数对姿态估计算法得到的训练姿态估计结果进行损失值计算以优化姿态估计模型。
需要说明的是,log-cosh损失函数是应用于回归任务中的一种损失函数,它比L2损失函数损失更平滑。Log-cosh是预测误差的双曲余弦的对数。
损失函数计算公式为:
Figure BDA0002997851770000091
其中,y是直接由人脸图像数据计算得到的真实姿态估计结果,yp为通过对训练人脸图像数据处理得到的训练矩阵化加密数据,再将矩阵化加密数据通过姿态估计算法计算得到的姿态估计结果。
由于对于很小的误差来说log(cosh(x))与
Figure BDA0002997851770000092
很相近,而对于很大的误差则与abs(x)-log2很相近,因此,log-cosh损失函数可以在拥有均方误差(MSE)优点的同时也不会受到异常值的太多影响。它拥有平滑平均绝对误差(Huber)损失函数的所有优点,并且在每一个点都是二次可导的。
在对待测人脸数据进行加密处理生成矩阵化加密数据以通过训练好的姿态估计模型输出姿态估计结果前,处理器20还可对姿态估计模型进行优化训练,从而保证通过姿态估计模型根据矩阵化加密数据计算得到的姿态估计结果准确。
具体地,将训练人脸图像数据通过预设加密算法生成训练矩阵化加密数据,进而将训练矩阵化加密数据通过姿态估计模型中的姿态估计算法计算得到训练姿态估计结果,并将训练姿态估计结果以及训练人脸图像数据的真实姿态估计结果通过log-cosh损失函数计算出损失值,进而根据损失值优化姿态估计模型。
请进一步地参阅图3,本申请的姿态估计设备100,还包括处理器20和存储器30;存储器30存储有一个或多个程序32,并且被处理器20执行,程序32被处理器20执行上述姿态估计方法的指令。
请参阅图14,本申请实施方式还提供了一种非易失性计算机可读存储介质40,可读存储介质40存储有计算机程序,当计算机程序被一个或多个处理器20执行时,使得处理器20执行上述的姿态估计方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其他任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种姿态估计方法,其特征在于,包括:
获取待测人脸图像数据;
根据预设加密算法对所述待测人脸图像数据处理生成与所述待测人脸图像数据相关的矩阵化加密数据;和
根据训练好的姿态估计模型将所述矩阵化加密数据进行计算得到姿态估计结果,所述姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
2.如权利要求1所述的姿态估计方法,其特征在于,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
提取所述待测人脸图像数据中多个特征点;
以坐标转换算法将每个所述特征点的坐标进行坐标转换以生成转换点;
根据所述转换点的坐标进行矩阵转换生成所述矩阵化加密数据。
3.如权利要求1所述的姿态估计方法,其特征在于,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
提取所述待测人脸图像数据中多个特征点;
根据欧式距离算法计算多个所述特征点之间的欧氏距离以得到第一特征向量;
将所述第一特征向量进行矩阵转换生成所述矩阵化加密数据。
4.如权利要求1所述的姿态估计方法,其特征在于,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
提取所述待测人脸图像数据中多个特征点;
根据尺度不变特征变换算法计算出所述特征点的第二特征向量;
将所述第二特征向量进行矩阵转换成生成所述矩阵化加密数据。
5.如权利要求1所述的姿态估计方法,其特征在于,所述根据预设加密算法对所述待测人脸图像数据处理并计算得到与所述待测人脸图像数据相关的矩阵化加密数据包括:
通过深度卷积神经网络模型将所述待测人脸图像数据处理以生成多个第三特征向量;
将所述第三特征向量进行矩阵转换成生成所述矩阵化加密数据。
6.如权利要求1所述的姿态估计方法,其特征在于,所述姿态估计模型包括姿态估计算法,所述姿态估计算法包括卷积层、池化层、展平层和全连接层,所述根据训练好的姿态估计模型将所述矩阵化加密数据进行计算得到姿态估计结果包括:
通过所述卷积层和所述池化层对所述矩阵化加密数据进行处理得到特征图,每层所述卷积层卷积后进行ReLU激活操作;
通过所述展平层将所述特征图展平得到第四特征向量;
通过所述全连接层对所述第四特征向量进行两层全连接运算得到所述姿态估计结果。
7.如权利要求6所述的姿态估计方法,其特征在于,所述姿态估计方法还包括:
通过所述姿态估计算法将所述训练矩阵化加密数据计算得到训练姿态估计结果;
采用log-cosh损失函数对所述姿态估计算法得到的所述训练姿态估计结果进行损失值计算以优化所述姿态估计模型。
8.一种姿态估计装置,其特征在于,包括:
获取模块,用于获取待测人脸图像数据;
生成模块,根据预设加密算法对所述待测人脸图像数据处理生成与所述待测人脸图像数据相关的矩阵化加密数据;和
计算模块,用于根据训练好的姿态估计模型将所述矩阵化加密数据进行计算得到姿态估计结果,所述姿态估计模型由训练人脸图像数据处理得到的训练矩阵化加密数据训练生成。
9.一种姿态估计设备,其特征在于,包括处理器和存储器,所述存储器存储有至少一个程序,并且所述程序被所述处理器执行,所述程序包括用于执行根据权利要求1-7任意一项所述的姿态估计方法的指令。
10.一种计算机程序的非易失性计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-7中任一项所述的姿态估计方法。
CN202110336352.4A 2021-03-29 2021-03-29 姿态估计方法、装置、设备及存储介质 Active CN112949576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110336352.4A CN112949576B (zh) 2021-03-29 2021-03-29 姿态估计方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110336352.4A CN112949576B (zh) 2021-03-29 2021-03-29 姿态估计方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112949576A true CN112949576A (zh) 2021-06-11
CN112949576B CN112949576B (zh) 2024-04-23

Family

ID=76227324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110336352.4A Active CN112949576B (zh) 2021-03-29 2021-03-29 姿态估计方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112949576B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550235A (zh) * 2022-01-17 2022-05-27 合肥的卢深视科技有限公司 姿态角检测方法、系统、电子设备及存储介质
WO2024007095A1 (zh) * 2022-07-04 2024-01-11 嘉兴尚坤科技有限公司 一种门禁系统人脸数据的安全加密方法和系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886235A (zh) * 2014-03-03 2014-06-25 杭州电子科技大学 一种正面人脸图像生物密钥生成方法
WO2015029982A1 (ja) * 2013-08-29 2015-03-05 日本電気株式会社 画像処理装置、画像処理方法、及びプログラム
KR20170053069A (ko) * 2015-11-05 2017-05-15 수원대학교산학협력단 포즈 추정 기반 포즈변화에 강인한 얼굴 인식 방법
CN109359526A (zh) * 2018-09-11 2019-02-19 深圳大学 一种人脸姿态估计方法、装置和设备
CN110163087A (zh) * 2019-04-09 2019-08-23 江西高创保安服务技术有限公司 一种人脸姿态识别方法及系统
CN110427849A (zh) * 2019-07-23 2019-11-08 深圳前海达闼云端智能科技有限公司 人脸姿态确定方法、装置、存储介质和电子设备
CN110633650A (zh) * 2019-08-22 2019-12-31 首都师范大学 基于隐私保护的卷积神经网络人脸识别方法及装置
WO2020173442A1 (zh) * 2019-02-26 2020-09-03 腾讯科技(深圳)有限公司 用于三维人脸模型生成的计算机应用方法、装置、计算机设备及存储介质
CN111967033A (zh) * 2020-08-28 2020-11-20 深圳康佳电子科技有限公司 基于人脸识别的图片加密方法、装置、终端及存储介质
CN112257578A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 人脸关键点检测方法、装置、电子设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015029982A1 (ja) * 2013-08-29 2015-03-05 日本電気株式会社 画像処理装置、画像処理方法、及びプログラム
CN103886235A (zh) * 2014-03-03 2014-06-25 杭州电子科技大学 一种正面人脸图像生物密钥生成方法
KR20170053069A (ko) * 2015-11-05 2017-05-15 수원대학교산학협력단 포즈 추정 기반 포즈변화에 강인한 얼굴 인식 방법
CN109359526A (zh) * 2018-09-11 2019-02-19 深圳大学 一种人脸姿态估计方法、装置和设备
WO2020173442A1 (zh) * 2019-02-26 2020-09-03 腾讯科技(深圳)有限公司 用于三维人脸模型生成的计算机应用方法、装置、计算机设备及存储介质
CN110163087A (zh) * 2019-04-09 2019-08-23 江西高创保安服务技术有限公司 一种人脸姿态识别方法及系统
CN110427849A (zh) * 2019-07-23 2019-11-08 深圳前海达闼云端智能科技有限公司 人脸姿态确定方法、装置、存储介质和电子设备
CN110633650A (zh) * 2019-08-22 2019-12-31 首都师范大学 基于隐私保护的卷积神经网络人脸识别方法及装置
CN111967033A (zh) * 2020-08-28 2020-11-20 深圳康佳电子科技有限公司 基于人脸识别的图片加密方法、装置、终端及存储介质
CN112257578A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 人脸关键点检测方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550235A (zh) * 2022-01-17 2022-05-27 合肥的卢深视科技有限公司 姿态角检测方法、系统、电子设备及存储介质
WO2024007095A1 (zh) * 2022-07-04 2024-01-11 嘉兴尚坤科技有限公司 一种门禁系统人脸数据的安全加密方法和系统

Also Published As

Publication number Publication date
CN112949576B (zh) 2024-04-23

Similar Documents

Publication Publication Date Title
JP7373554B2 (ja) クロスドメイン画像変換
Zhou et al. Sparse representation for 3D shape estimation: A convex relaxation approach
CN108227912B (zh) 设备控制方法和装置、电子设备、计算机存储介质
Vemulapalli et al. R3DG features: Relative 3D geometry-based skeletal representations for human action recognition
EP3417425B1 (en) Leveraging multi cues for fine-grained object classification
CN110705478A (zh) 人脸跟踪方法、装置、设备及存储介质
CN111680678B (zh) 目标区域识别方法、装置、设备及可读存储介质
CN110363817B (zh) 目标位姿估计方法、电子设备和介质
CN109919077B (zh) 姿态识别方法、装置、介质和计算设备
Xu et al. Spherical DNNs and Their Applications in 360$^\circ $∘ Images and Videos
CN110992243B (zh) 椎间盘截面图像构建方法、装置、计算机设备及存储介质
KR20150111641A (ko) 계층적 패턴 구조에 기반한 기술자 생성 방법 및 이를 이용한 객체 인식 방법과 장치
CN112949576B (zh) 姿态估计方法、装置、设备及存储介质
CN105550641B (zh) 基于多尺度线性差分纹理特征的年龄估计方法和系统
CN115311730B (zh) 一种人脸关键点的检测方法、系统和电子设备
Park et al. Recognition of partially occluded objects using probabilistic ARG (attributed relational graph)-based matching
US20200005078A1 (en) Content aware forensic detection of image manipulations
CN112907569A (zh) 头部图像区域的分割方法、装置、电子设备和存储介质
CN112651380A (zh) 人脸识别方法、人脸识别装置、终端设备及存储介质
Lee et al. Robust PCA based on incoherence with geometrical interpretation
CN112733641A (zh) 物体尺寸测量方法、装置、设备及存储介质
CN113177432A (zh) 基于多尺度轻量化网络的头部姿态估计方法、系统、设备及介质
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
Hutchcroft et al. CoVisPose: Co-visibility pose transformer for wide-baseline relative pose estimation in 360∘ indoor panoramas
CN113469091B (zh) 人脸识别方法、训练方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant