CN114399785B

CN114399785B - 人体身高识别方法、装置、计算机设备及存储介质

Info

Publication number: CN114399785B
Application number: CN202111273777.1A
Authority: CN
Inventors: 尹高
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2023-02-21
Anticipated expiration: 2041-10-29
Also published as: CN114399785A

Abstract

本申请公开一种人体身高识别方法、装置、计算机设备及存储介质，包括：采集拍摄图片；根据Mask R‑CNN网络判断拍摄图片是否存在标尺框信息及人体信息；当存在标尺框信息以及人体信息时，分割拍摄图片，得到标尺框图片以及人体图片；提取标尺框图片的0‑1像素的mask图片，得到标尺框预处理图片；提取人体图片的0‑1像素的mask图片，得到人体预处理图片；将标尺框预处理图片与人体预处理图片合并，得到训练图片；根据ResNet18网络训练模型提取训练图片的人体身高特征信息；将人体身高特征信息输入由两层全连接构成的回归网络中，并根据回归网络，计算人体身高的估计值。

Description

人体身高识别方法、装置、计算机设备及存储介质

技术领域

本发明实施例涉及人工智能领域，尤其是一种人体身高识别方法、装置、计算机设备及存储介质。

背景技术

在如今信息科技的高速发展下，人脸识别技术已经研究得相对比较成熟，人脸识别准确率已经高于人眼的识别准确率，人脸识别技术得到广泛的推广应用，如高铁站及各式各样的门禁，都大量使用人脸识别技术，通过人脸识别技术，人们通过刷脸系统即可实现高铁站的安检通关以及门禁的开启；有些城市甚至在银行取钱都可以通过人脸识别技术直接刷脸进行业务办理。

随着信息科技的持续高速发展，目前存在大量的通过拍脸部图片来识别性别和年龄的技术方案，也就是通过人脸识别技术识别人们的性别和年龄，这样提高了人们的办事效率，也减轻了工作人员的工作压力。同样的，在人体身高的识别领域，如能通过科技的力量实现快速精准识别，也可以极大地提高人们的办事效率，减轻工作人员的工作压力。但是，受限于目前技术发展的障碍，人体身高的识别还需要专用的设备单项进行身高识别检测。因此，若在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，增加人体身高的识别，无疑是一项重要的技术创新。

发明内容

基于此，本发明实施例提供一种能够不会侵犯用户隐私即可预测出人的身高信息的人体身高识别方法、装置、计算机设备及存储介质。

为解决上述技术问题，本发明创造的实施例采用的一个技术方案是：提供一种人体身高识别方法，包括：

采集拍摄图片；

根据Mask R-CNN网络判断拍摄图片是否存在标尺框信息及人体信息；

当同时存在标尺框信息以及人体信息时，分割所述拍摄图片，得到标尺框图片以及人体图片；

提取所述标尺框图片的0-1像素的mask图片，得到标尺框预处理图片；

提取所述人体图片的0-1像素的mask图片，得到人体预处理图片；

将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片；

根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息；

将所述人体身高特征信息输入由两层全连接构成的回归网络中，并根据所述回归网络，计算人体身高的估计值。

可选地，所述采集拍摄图片的步骤，包括：

获取摄像头的安装位置信息；

根据所述安装位置信息判断所述摄像头的拍摄范围是否覆盖预设标尺框；

若是，则启动所述摄像头进行拍摄；

若否，则发送调整指令调整所述摄像头的拍摄角度，直至所述摄像头的拍摄范围覆盖预设标尺框后，启动所述摄像头进行拍摄；

获取所述摄像头的拍摄数据，得到拍摄图片。

可选地，所述根据Mask R-CNN网络判断拍摄图片是否存在标尺框信息及人体信息的步骤包括：

将拍摄图片输入Mask R-CNN网络中；

根据Mask R-CNN网络中的历史训练数据检测拍摄图片；

当拍摄图片中存在有与历史训练数据匹配的特征时，则确定拍摄图片中存在标尺框信息及人体信息。

可选地，所述当存在标尺框信息以及人体信息时，分割所述拍摄图片，得到标尺框图片以及人体图片的步骤，包括：

当存在标尺框信息以及人体信息时，将所述拍摄图片进行坐标模型设置；

根据所述历史训练数据，检测所述拍摄图片中的标尺框的位置坐标以及人体的位置坐标；

读取所述拍摄图片中对应的所述标尺框的位置坐标以及所述人体的位置坐标，

根据所述标尺框的位置坐标以及所述人体的位置坐标，分别分割所述拍摄图片，得到所述标尺框图片以及所述人体图片。

可选地，所述提取所述标尺框图片的0-1像素的mask图片，得到标尺框预处理图片的步骤，包括：

将所述标尺框图片进行mask二值化；

保存经过mask二值化后的0-1像素的mask图片，得到标尺框预处理图片。

可选地，所述提取所述人体图片的0-1像素的mask图片，得到人体预处理图片的步骤，包括：

将所述人体图片进行mask二值化；

保存经过mask二值化后的0-1像素的mask图片，得到人体预处理图片。

可选地，所述将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片的步骤，包括：

根据所述标尺框的位置坐标以及所述人体的位置坐标，将所述拍摄图片划分为标尺区以及人体区；

以所述标尺区以及所述人体区为基准，将所述标尺框预处理图片以及所述人体预处理图片合并为所述训练图片。

可选地，所述根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息的步骤，包括：

将所述训练图片输入所述ResNet18网络训练模型中；

读取所述ResNet18网络训练模型中的浅层特征数据以及深层特征数据；

合并所述浅层特征数据以及所述深层特征数据，得到所述人体身高特征信息。

为解决上述技术问题，本发明实施例还提供一种基于拍照的人体身高识别装置，包括：

采集模块，用于采集拍摄图片；

判断模块，用于根据Mask R-CNN网络判断拍摄图片是否存在标尺框信息及人体信息；

分割模块，用于当存在标尺框信息以及人体信息时，分割所述拍摄图片，得到标尺框图片以及人体图片；

第一提取模块，用于提取所述标尺框图片的0-1像素的mask图片，得到标尺框预处理图片；

第二提取模块，用于提取所述人体图片的0-1像素的mask图片，得到人体预处理图片；

合成模块，用于将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片；

处理模块，用于根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息；

执行模块，用于将所述人体身高特征信息输入由两层全连接构成的回归网络中，并根据所述回归网络，计算人体身高的估计值。

可选地，所述采集模块包括：

第一采集子模块，用于获取摄像头的安装位置信息；

第一判断子模块，根据所述安装位置信息判断所述摄像头的拍摄范围是否覆盖预设标尺框；

第一控制子模块，用于当所述安装位置信息判断所述摄像头的拍摄范围覆盖预设标尺框时，启动所述摄像头进行拍摄；

第二控制子模块，用于当所述安装位置信息判断所述摄像头的拍摄范围没有覆盖预设标尺框时，发送调整指令调整所述摄像头的拍摄角度，直至所述摄像头的拍摄范围覆盖预设标尺框后，启动所述摄像头进行拍摄；

第二采集子模块，获取所述摄像头的拍摄数据，得到拍摄图片。

可选地，所述判断模块包括：

第一输入子模块，用于将拍摄图片输入Mask R-CNN网络中；

第一检测子模块，用于根据Mask R-CNN网络中的历史训练数据检测拍摄图片；

第二判断子模块，用于当拍摄图片中存在有与历史训练数据匹配的特征时，拍摄图片中存在标尺框信息及人体信息。

可选地，所述分割模块包括：

第一设置子模块，用于将所述拍摄图片进行坐标模型设置；

第二检测子模块，用于根据所述历史训练数据，检测所述拍摄图片中的标尺框的位置坐标以及人体的位置坐标；

第一读取子模块，用于读取所述拍摄图片中对应的所述标尺框的位置坐标以及所述人体的位置坐标，

第一分割子模块，用于根据所述标尺框的位置坐标以及所述人体的位置坐标，分别分割所述拍摄图片，得到所述标尺框图片以及所述人体图片。

可选地，所述第一提取模块包括：

第一二值化子模块，用于将所述标尺框图片进行mask二值化；

第一储存子模块，用于保存经过mask二值化后的0-1像素的mask图片，得到标尺框预处理图片。

可选地，所述第二提取模块包括：

第二二值化子模块，用将所述人体图片进行mask二值化；

第二储存子模块，用于保存经过mask二值化后的0-1像素的mask图片，得到人体预处理图片。

可选地，所述合成模块包括：

第一划分子模块，用于根据所述标尺框的位置坐标以及所述人体的位置坐标，将所述拍摄图片划分为标尺区以及人体区；

第一合成子模块，用于以所述标尺区以及所述人体区为基准，将所述标尺框预处理图片以及所述人体预处理图片合并为所述训练图片。

可选地，所述处理模块包括：

第二输入子模块，用于将所述训练图片输入所述ResNet18网络训练模型中；

第二读取子模块，用于读取所述ResNet18网络训练模型中的浅层特征数据以及深层特征数据；

第二合成子模块，用于合并所述浅层特征数据以及所述深层特征数据，得到所述人体身高特征信息。

为解决上述技术问题本发明实施例还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行上述所述人体身高识别方法的步骤。

为解决上述技术问题本发明实施例还提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述所述人体身高识别方法的步骤。

本发明实施例的有益效果是：对拍摄图片进行Mask R-CNN网络判断，排除非正常拍摄的图片的干扰，提高识别效率；对拍摄图片进行分割，将标尺框图片以及人体图片单独分割后，提取0-1像素的mask图片，提高了获取mask 图片的精准度，有效去除背景信息的干扰，保护个人的隐私信息；将合并了标尺框预处理图片与人体预处理图片的训练图片送入ResNet18网络训练模型，由 ResNet18网络训练模型对人体身高特征信息进行提取，可快速准确的提取出人体身高特征信息；最后由两层全连接构成的回归网络对提取出的人体身高特征信息进行计算，从而得到人体身高的估计值；如此，在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，增加人体身高的识别，无需专用的设备单项进行身高识别检测，降低使用成本；并且可以对不同肤色的人都适用，有效地解决了个人隐私数据收集难的问题。这样，在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，人体身高的识别也能得到广泛的推广应用。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请一个具体实施例的人体身高识别方法的基本流程示意图；

图2为本申请一个具体实施例的人体身高识别方法的采集场景示意图；

图3为本申请一个具体实施例的人体身高识别方法的标尺框的位置坐标标识示意图；

图4为本申请一个具体实施例的采集拍摄图片的流程示意图；

图5为本申请一个具体实施例的Mask R-CNN网络的判断流程示意图；

图6为本申请一个具体实施例的分割拍摄图片的流程示意图；

图7为本申请一个具体实施例的标尺框预处理的流程示意图；

图8为本申请一个实施例的基于拍照的人体身高识别装置基本结构示意图；

图9为本申请一个实施例的计算机设备的基本结构框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本申请的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式"一"、 "一个"、"所述"和"该"也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞"包括"是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解，这里所使用的"终端"既包括无线信号接收器的设备，其仅具备无发射能力的无线信号接收器的设备，又包括接收和发射硬件的设备，其具有能够在双向通信链路上，执行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备；PCS(Personal Communications Service，个人通信系统)，其可以组合语音、数据处理、传真和/ 或数据通信能力；PDA(Personal Digital Assistant，个人数字助理)，其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或 GPS(Global Positioning System，全球定位系统)接收器；常规膝上型和/或掌上型计算机或其他设备，其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的"终端"可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的，或者适合于和/或配置为在本地运行，和/或以分布形式，运行在地球和/或空间的任何其他位置运行。这里所使用的"终端"还可以是通信终端、上网终端、音乐/视频播放终端，例如可以是PDA、MID(Mobile Internet Device，移动互联网设备)和/或具有音乐/视频播放功能的移动电话，也可以是智能电视、机顶盒等设备。

请参阅图1，图1为本实施例人体身高识别方法的基本流程示意图。如图1 所示，本发明一实施例中，提供了一种人体身高识别方法，该方法包括：

S1100：采集拍摄图片。

具体地，拍摄图片由摄像头启动后进行拍摄得到，摄像头启动拍摄后将该拍摄图片以单帧图像的形式存储在摄像机的存储介质中。设置摄像头的启动触发指令，当摄像头启动拍摄后，同步获取摄像机的存储介质中的拍摄图片。也可以采用实时同步传输的方式，直接采集摄像头实时获取的图像。

在一实施中，在采集拍摄图片步骤前，还包括：获取摄像头的实时聚焦数据；当聚焦数据稳定在预设阈值范围时，发送拍摄指令至摄像头以启动摄像头进行拍摄。本实施例中的目的是使得后续采集拍摄图片的步骤中，能采集到人体处于稳定状态时的图像。

为了使得采集的拍摄图片具备使用价值，需要在特定的场合，设计人体数据采集场景，以使得摄像头限定在该场景中进行拍摄。而该场景的布置显得较为重要。因此，在采集拍摄图片的步骤之前，如图2和图3所示，人体身高识别方法还包括：在预设竖直平面上设置预设宽度和高度的标尺框，并在距离所述预设竖直平面的预设位置设置摄像头，其中，所述标尺框的高度计算起点与所述摄像头的高度计算起点位于同一水平面上。该步骤中需要人工或者智能机器人参与，因而该实施例中人体身高识别方法除了计算机的参与外，还需要智能机器人或人工参与，共同解决本实施例的技术问题，以使得采集的拍摄图片具备使用价值，也就是说，使得采集的拍摄图片能直接被下一步骤执行，从而提高人体身高识别的效率。

实际采集过程中，在背景墙上用胶带贴出一个1m宽，2.5m高的标尺框，人直立居中站立在标尺框内，调整摄像头的安装位置，使得采集画面的高度刚好为标尺框的高度大小，在等摄像头稳定状态后，获取人体的正视图照片，此时，完成拍摄图片的采集工作。

S1200：根据Mask R-CNN网络判断所述拍摄图片是否存在标尺框信息及人体信息。

具体地，Mask R-CNN网络是一个利用深度神经网络，通过自动学习，然后进行目标检测的算法架构。具体到本实施例中，Mask R-CNN是一个实例分割模型，它能确定图片中各个目标的位置和类别，给出像素级预测。Mask R-CNN网络架构模型的建立，首先，通过拍摄了大量训练图片(即人体以不同姿势站在标尺框内的图片)，并对图片中的人体和标尺框进行标注；然后，利用标注后的图片对Mask R-CNN网络进行上千次训练，并从训练中筛选出最佳的Mask R-CNN网络模型，使得模型在新拍摄的图片上(即采集的拍摄图片)可以精准地检测出标尺框(即胶带区域)以及人体。

为提高Mask R-CNN网络判断的准确性，在一些实施例中，在S1200步骤之后，在S1300步骤之前，还包括步骤：将所述拍摄图片再次输入所述Mask R-CNN网络中，由所述Mask R-CNN网络二次判断所述拍摄图片是否存在标尺框信息及人体信息。也就是通过本实施例中的步骤，再次检测判断所述拍摄图片是否存在标尺框信息及人体信息。可以理解，第一次的判断则自然作为了Mask R-CNN网络的一个训练图片，而当二次的判断结果均为检测到标尺框和人体时，方得到结论：存在标尺框信息以及人体信息。如此，通过本实施例的二次判断步骤，一方面是丰富Mask R-CNN网络的训练图片，另一方面是避免无关因素的干扰导致一次判断失误，从而提高了判断的准确性。

S1300：当同时存在标尺框信息以及人体信息时，分割所述拍摄图片，得到标尺框图片以及人体图片。

具体地，利用Mask R-CNN网络可以精准地检测出采集的拍摄图片中的标尺框以及人体，并根据检测的坐标位置，利用Mask R-CNN网络继续进行对采集的拍摄图片进行分割，从而得到标尺框图片以及人体图片。也就是说，利用 Mask R-CNN网络检测标尺框的位置，并分割得到标尺框图片；利用Mask R-CNN 网络检测人体的位置，并分割得到人体图片。如图2所示，本实施例中，利用 Mask R-CNN进行人体的分割得到的人体图片是整个人体所在平面所占据的宽度和高度的一个长方形框，这样的好处是能更加清晰整个分割过程，且分割得到的人体图片可在后续步骤中更好的去除非感兴趣区域像素。当然，这也是得益于Mask R-CNN网络是Faster R-CNN和FCN的结合，前者负责物体检测(分类标签以及窗口)，后者负责确定目标轮廓。

可以理解，只有当同时存在标尺框信息以及人体信息时，分割所述拍摄图片才有实际的意义。因为在如下两种情况下是无法实现人体身高识别的，第一种是只存在标尺框信息不存在人体信息，说明此情况下摄像头并未识别到人体，或者人体没有位于标尺框，此情况下不在本申请的人体身高识别方法的范凑内；第二种不存在标尺框信息而只存在人体信息，说明此情况下摄像头识别到人体，但是用于辅助识别人体身高的背景却未完成布置，即标尺框没有事先设定，此情况下也不在本申请的人体身高识别方法的范凑内。

S1400：提取所述标尺框图片的0-1像素的mask图片，得到标尺框预处理图片。

具体地，标尺框预处理图片提取成0-1像素的mask图片是为了更方便的计算，提高识别效率。可知，mask图片只有0-1像素，类似于光学图像处理中的掩模，是用选定的掩模，对处理的图像(全部或局部)进行遮挡形成的图，光学图像处理中，掩模可以是胶片、滤光片等，数字图像处理中，掩模为二维矩阵数组，有时也用多值图像，数字图像处理中，图像掩模主要用于屏蔽作用，用掩模对图像上某些区域作屏蔽，使其不参加处理或不参加处理参数的计算，或仅对屏蔽区做处理或统计，有效地去除背景信息的干扰，提高计算效率。

S1500：提取所述人体图片的0-1像素的mask图片，得到人体预处理图片。

具体地，如S1400所述，mask图片只有0-1像素，类似于光学图像处理中的掩模，是用选定的掩模，对处理的图像(全部或局部)进行遮挡形成的图，光学图像处理中，掩模可以是胶片、滤光片等，数字图像处理中，掩模为二维矩阵数组，有时也用多值图像，数字图像处理中，图像掩模主要用于屏蔽作用，用掩模对图像上某些区域作屏蔽，使其不参加处理或不参加处理参数的计算，或仅对屏蔽区做处理或统计，起到保护隐私的作用。标尺框图片的0-1像素的 mask图片的提取过程可利用Mask R-CNN网络的目标轮廓检测功能，对人体轮廓内的区域以0-1像素进行覆盖，从而保护用户个人的隐私信息。

人体预处理图片也即是人体图片的0-1像素的mask图片，该图片有效地去除背景信息的干扰，也即是无论该人体是何人种或何肤色，进过此步骤后均成为0-1像素的mask图片而不掺杂有任何人种或肤色的标签信息，使得本实施例中的人体身高识别方法具有较高的泛化能力，极大提高了适用范围。

S1600：将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片。

具体地，在步骤S1300中对拍摄图片的分割，是为了分别去除标尺框图片和人体图片的干扰因素，解决了个人隐私数据收集难的问题。分割的目的是为了更好的合并，也就是此步骤的合并所述标尺框预处理图片与所述人体预处理图片，而得到训练图片。值得一提的是，本实施例中的训练图片并非Mask R-CNN 网络的训练图片，而是输入下一步骤中ResNet18网络的训练图片。由于本实施例中的训练图片也为0-1像素的mask图片，因此可通过显示器对外展示给用户，从而打消用户对个人隐私的忌讳问题，进一步地提高人体身高识别方法的泛化能力和适用范围。

S1700：根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息。

具体地，经过步骤S1600后得到的是一张图片，且是一张为0-1像素的mask 图片，而ResNet18网络训练模型可对输入的图片进行特征提取。首先，ResNet18 网络是一个包含5层卷积层和一层全连接层的深度网络，其结构是得到众多科研人员反复修正后的最优架构之一。第1层基础卷积层，负责提取图片中的浅层特征，即表面轮廓之类的特征，第2-5层卷积主要负责提取深层特征，即图片中不同位置之间的关系特征，而且，从第2层卷积至第5层卷积分别提取不同位置的深层特征。因此，将一张人体图片(本实施例中为0-1像素的mask图片) 输入该网络后，最后一层卷积层出来的数据就是身高特征信息。

因为只有一张图片，为了确保提取较全面的信息，选择ResNet18作为特征提取网络，由于ResNet18网络结构中的short-cut连接的特点，其提取的特征相当于综合了浅层和深层特征，也即图片的表面信息和抽象信息。

S1800：将所述人体身高特征信息输入由两层全连接构成的回归网络中，并根据所述回归网络，计算人体身高的估计值。

具体地，在我们利用ResNet18网络训练模型提取到身高特征信息之后，将身高特征信息送入后续的两层全连接网络，两层全连接网络可以被看成是一个数学上的高阶的非线性函数，其参数值已经在训练阶段产生，因此，经过这样的复杂变换之后，即可得到最终的身高，进而输出人体身高的估计值。

上述人体身高识别方法，对拍摄图片进行Mask R-CNN网络判断，排除非正常拍摄的图片的干扰，提高识别效率；对拍摄图片进行分割，将标尺框图片以及人体图片单独分割后，提取0-1像素的mask图片，提高了获取mask图片的精准度，有效去除背景信息的干扰，保护个人的隐私信息；将合并了标尺框预处理图片与人体预处理图片的训练图片送入ResNet18网络训练模型，由 ResNet18网络训练模型对人体身高特征信息进行提取，可快速准确的提取出人体身高特征信息；最后由两层全连接构成的回归网络对提取出的人体身高特征信息进行计算，从而得到人体身高的估计值；如此，在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，增加人体身高的识别，无需专用的设备单项进行身高识别检测，降低使用成本；并且可以对不同肤色的人都适用，有效地解决了个人隐私数据收集难的问题。这样，在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，人体身高的识别也能得到广泛的推广应用。

可以理解，基于单张图片的人体身高估计技术，通过设定特定尺寸的标尺框，人站立在标尺框内，调整相机使得采集照片的高度正好为标尺框的高度大小。然后，利用检测与分割网络，得到标尺框的0-1像素mask图片与人体的0-1 像素mask图片，该步的处理是一方面是为了去除背景信息的干扰，另一方面是为了保护个人的隐私信息；将人体0-1mask图片与标尺框图片按照设定好的相对位置进行合并，送入身高特征提取网络与身高的回归网络，即可预测出人的身高信息。在推理过程中，该方案只用到了0-1像素的mask图片，不仅使计算更加简单快速，同时不会侵犯用户隐私。而且，使用0-1像素mask图片的另一个关键优势是，训练完成的模型对不同肤色的人都适用，有效地解决了个人隐私数据收集难的问题。

在一些实施方式中，采集拍摄图片时，需要调整摄像头的位置进行拍摄采集。请参阅图4，图4为本实施例采集拍摄图片的流程示意图。

如图4所示。S1100包括：

S1110：获取摄像头的安装位置信息。

具体地，本实施例中，拍摄图片的采集是通过摄像头进行的，而摄像头的安装位置直接影响采集的拍摄图片是否符合要求，也就是是否能准确地拍摄正确的图片。本实施例中，可以通过采用多个安装在摄像头上的测距传感器获取摄像头的位置信息。例如，通过二个方向各异且相互垂直设置在摄像头上的测距传感器获得摄像头的位置，其中，一个测距传感器垂直朝向贴设有标尺框的竖直平面，另一个垂直朝向所述摄像头的高度计算起点的水平面上。也就是说，一个测距传感器垂直朝向贴设有标尺框的背景墙，另一个测距传感器垂直朝向摄像头放置处的地面。

为提高精度，一些实施例中，通过采用三个安装在摄像头上的测距传感器获取摄像头的位置信息，如通过三个方向设置在摄像头上的超声波测距传感器获得摄像头的位置。如通过三个设置在摄像头上的激光测距传感器获得摄像头的位置。本实施例中，采用三个测距传感器获取摄像头的位置信息时，第三个测距传感器垂直朝向贴设有标尺框的竖直平面，也就是说，第一个测距传感器垂直朝向贴设有标尺框的竖直平面，第二个垂直朝向所述摄像头的高度计算起点的水平面，第三个测距传感器垂直朝向贴设有标尺框的竖直平面。这样通过两个传感器共同计算摄像头与标尺框的竖直平面之间的距离，可以进一步提高位置信息的计算精确度，从另一侧面也提高了人体身高的识别效率。

S1120：根据所述安装位置信息判断所述摄像头的拍摄范围是否覆盖预设标尺框。

具体地，由于安装位置信息与预设标尺框之间存在关联，即使摄像头具备变焦功能，摄像头的安装位置也依旧需要符合拍摄范围的要求。本实施例中，以拍摄范围覆盖预设标尺框为准，这样可以使得拍摄图片涵盖了标尺框。该预设标尺框也就是在背景墙上用胶带贴出一个1m宽、2.5m高的标尺框。

S1130：若是，则启动所述摄像头进行拍摄。

具体地，当摄像头的拍摄范围覆盖预设标尺框时，可以发送拍摄指令至摄像头的控制器以启动摄像头进行拍摄。

S1140：若否，则发送调整指令调整所述摄像头的拍摄角度，直至所述摄像头的拍摄范围覆盖预设标尺框后，启动所述摄像头进行拍摄。

具体地，当摄像头的拍摄范围没有覆盖预设标尺框时，意味着摄像头的拍摄角度出错，此时需要对摄像头的拍摄角度进行调整，此时发送调整指令调整所述摄像头的拍摄角度，以校正摄像头的拍摄角度。可以理解，本发明是从计算机角度进行描述的，而计算机是可以通过发送和接受指令完成对摄像头的调度的，至于如何完成摄像头的拍摄角度的校正，则可以通过步进马达或者往复式直行电机或者万向电动滚轮实现，而该机械构造不再本申请的创新范围内，故不赘述。而后，再次判断所述摄像头的拍摄范围是否覆盖预设标尺框，并重复上述步骤，直至摄像头的拍摄范围覆盖预设标尺框时，发送拍摄指令至摄像头的控制器以启动摄像头进行拍摄。

S1150：获取所述摄像头的拍摄数据，得到拍摄图片。

具体地，由于摄像头启动拍摄后将该拍摄图片以单帧图像的形式存储在摄像机的存储介质中，获取所述摄像头的拍摄数据，也即设置摄像头的启动触发指令，当摄像头启动拍摄后，同步获取摄像机的存储介质中的拍摄图片。也可以采用实时同步传输的方式，直接采集摄像头实时获取的图像。

在一些实施方式中，采集到拍摄图片后，需要判断拍摄图片是否存在标尺框信息及人体信息。请参阅图5，图5为本实施例Mask R-CNN网络的判断流程示意图。

如图5所示。S1200包括：

S1210：将拍摄图片输入Mask R-CNN网络中。

具体地，Mask R-CNN网络能确定图片中各个目标的位置和类别，给出像素级预测，从摄像机的存储介质中读取拍摄图片后，将其输入Mask R-CNN网络中；或者将同步在计算机存储介质的拍摄图片输入Mask R-CNN网络中。

S1220：根据Mask R-CNN网络中的历史训练数据检测拍摄图片。

具体地，历史训练数据是由前期大量输入Mask R-CNN网络中的训练图片组成。这些训练图片集成了各种人体以不同姿势站在标尺框内的图片，且这些图片分别人工地前期进行了人体和标尺框的标注，利用标注后的图片对Mask R-CNN网络进行上千次训练，并从训练中筛选出最佳的Mask R-CNN网络模型，当拍摄图片输入Mask R-CNN网络中后，模型在新拍摄的图片上可以精准地检测出标尺框以及人体。

S1230：当拍摄图片中存在有与历史训练数据匹配的特征时，拍摄图片中存在标尺框信息及人体信息。

具体地，Mask R-CNN网络模型经过上千次训练后，可以精准地检测出标尺框以及人体，因此，在检测过程中，若存在有与历史训练数据匹配的特征，则可得出拍摄图片中存在标尺框信息及人体信息。也就是说，根据历史训练数据检测拍摄图片的过程中，若能同时检测出标尺框及人体，则得出肯定结论，拍摄图片中存在标尺框信息及人体信息。若只能检测出标尺框或者人体，则说明该拍摄图片为非正常图片，也即得出否定结论，该拍摄图片中不同时存在标尺框信息及人体信息，此拍摄图片不能作为后续的步骤进行人体身高识别。

在一些实施方式中，判断拍摄图片存在标尺框信息及人体信息后，需要分割出拍摄图片，得到标尺框图片以及人体图片。请参阅图6，图6为本实施例分割拍摄图片的流程示意图。

如图6所示。S1300包括：

S1310：当存在标尺框信息以及人体信息时，将所述拍摄图片进行坐标模型设置。

具体地，当存在标尺框信息以及人体信息时，根据计算机显示器的像素点，可对处于屏幕中的拍摄图片进行坐标模型设置。如将拍摄图片的坐下角作为二维坐标的起点，进而定义整个拍摄图片中各个区域的坐标值，这样的目的是对拍摄图片进行预处理，利用坐标模型将拍摄图片进行像素级细化，以更好地将标尺框和人体所对应的区域进行规划，后期精准地将标尺框和人体分割出来。

S1320：根据所述历史训练数据，检测所述拍摄图片中的标尺框的位置坐标以及人体的位置坐标。

具体地，历史训练数据涵盖了人体以不同姿势站在标尺框内的大量图片，而MaskR-CNN网络能根据历史训练数据精准识别出标尺框和人体，因此，在步骤S1310中将所述拍摄图片进行坐标模型设置后，标尺框所在拍摄图片中的区域以及人体所在拍摄图片中的区域分别所对应的坐标区域即是标尺框的位置坐标以及人体的位置坐标。也就是说，标尺框所在拍摄图片中的区域即是标尺框的位置坐标，人体所在拍摄图片中的区域即是人体的位置坐标。

S1330：读取所述拍摄图片中对应的所述标尺框的位置坐标以及所述人体的位置坐标。

具体地，坐标模型的设置，是便于将利用史训练数据检测出的拍摄图片中的标尺框的位置坐标以及人体的位置坐标转换为可执行的数据，并以此反馈至拍摄图片本身，进而读取该数据而获得标尺框的位置坐标以及人体的位置坐标。

S1340：分别根据所述标尺框的位置坐标以及所述人体的位置坐标，对所述拍摄图片进行分割，得到所述标尺框图片以及所述人体图片。

具体地，读取拍摄图片中对应的标尺框的位置坐标以及人体的位置坐标后，在根据计算机显示器的像素点对应设置的坐标模型，分割拍摄图片，由标尺框的位置坐标对应分割出标尺框图片，由人体的位置坐标对应分割出人体图片。

在一些实施方式中，在分割拍摄图片后，需要预处理所提取的拍摄图片，以便统一像素进行后续步骤的处理。请参阅图7，图7为本实施例标尺框预处理的流程示意图。

如图7所示。S1400包括：

S1410：将所述标尺框图片进行mask二值化。

具体地，mask二值化是将从拍摄图片单独对标尺框提取出来的标尺框图片进行二值化掩膜，进一步地去除背景信息的干扰，因为，单独提取的标尺框图片虽然不会包含人体部分，但还是会掺杂其他无关因素，需要去除该部分，只保留该有的标尺框区域部分。相当于滤波一样的。一幅图是从0-255的，有所有的颜色，而感兴趣的只是其中的一种颜色，如标尺框的颜色，此时将其他颜色变为0，而将感兴趣的颜色范围定为1，从而去掉非感兴趣颜色，后续只需对感兴趣的再进行处理。

S1420：保存经过mask二值化后的0-1像素的mask图片，得到标尺框预处理图片。

具体地，实际上，在mask二值化的过程后，得到的就是0-1像素的mask 图片，而0-1像素的mask图片将作为后续步骤的数据图片，最后将其以mask 图片的形式进行保存在计算机存储介质中。

在一些实施方式中，在分割拍摄图片后，为避免出现隐私问题，需要预处理所提取的拍摄图片。在步骤S1500中，提取所述人体图片的0-1像素的mask 图片，得到人体预处理图片。本实施例中，S1500包括：将所述人体图片进行 mask二值化；保存经过mask二值化后的0-1像素的mask图片，得到人体预处理图片。也即是，利用mask-rcnn网络检测人体的位置，并将其分割出来，只保留0-1像素的mask图片，为了保护个人隐私，我们只用到人体的mask图片，并不需要人体本身的图片。

在一些实施方式中，步骤S1600中，所述将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片的步骤，包括：根据所述标尺框的位置坐标以及所述人体的位置坐标，将所述拍摄图片划分为标尺区以及人体区；以所述标尺区以及所述人体区为基准，将所述标尺框预处理图片以及所述人体预处理图片合并为所述训练图片。具体到本实施例中，保证人体mask图与标尺框的上下相对位置，将提取出来的人体mask图片与标尺框的图片进行合并，合成的图片作为后续网络的输入。

在一些实施方式中，步骤S1700中，根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息的步骤，包括：将所述训练图片输入所述ResNet18 网络训练模型中；读取所述ResNet18网络训练模型中的浅层特征数据以及深层特征数据；合并所述浅层特征数据以及所述深层特征数据，得到所述人体身高特征信息。因为只有一张图片，为了确保提取较全面的信息，选择resnet18作为特征提取网络，由于resnet18网络结构中的short-cut连接的特点，其提取的特征相当于综合了浅层和深层特征，也即图片的表面信息和抽象信息。而回归网络由两层全连接构成，将resnet18提取得到的人体身高特征作为输入送入回归网络，输出人体身高的估计结果。

为解决上述技术问题，本发明实施例还提供一种基于拍照的人体身高识别装置，具体请参阅图8，图8为本实施例基于拍照的人体身高识别装置基本结构示意图。如图8所示，一种基于拍照的人体身高识别装置包括：采集模块1100、判断模块1200、分割模块1300、第一提取模块1400、第二提取模块1500、合成模块1600、处理模块1700以及执行模块1800。其中，采集模块1100用于采集拍摄图片；判断模块1200用于根据Mask R-CNN网络判断拍摄图片是否存在标尺框信息及人体信息；分割模块1300用于当存在标尺框信息以及人体信息时，分割所述拍摄图片，得到标尺框图片以及人体图片；第一提取模块1400用于提取所述标尺框图片的0-1像素的mask图片，得到标尺框预处理图片；第二提取模块1500用于提取所述人体图片的0-1像素的mask图片，得到人体预处理图片；合成模块1600用于将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片；处理模块1700用于根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息；执行模块1800用于将所述人体身高特征信息输入由两层全连接构成的回归网络中，并根据所述回归网络，计算人体身高的估计值。

基于拍照的人体身高识别装置对拍摄图片进行Mask R-CNN网络判断，排除非正常拍摄的图片的干扰，提高识别效率；对拍摄图片进行分割，将标尺框图片以及人体图片单独分割后，提取0-1像素的mask图片，提高了获取mask 图片的精准度，有效去除背景信息的干扰，保护个人的隐私信息；将合并了标尺框预处理图片与人体预处理图片的训练图片送入ResNet18网络训练模型，由 ResNet18网络训练模型对人体身高特征信息进行提取，可快速准确的提取出人体身高特征信息；最后由两层全连接构成的回归网络对提取出的人体身高特征信息进行计算，从而得到人体身高的估计值；如此，可以对不同肤色的人都适用，有效地解决了个人隐私数据收集难的问题。这样，在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，人体身高的识别也能得到广泛的推广应用。

在一些实施方式中，所述采集模块1100包括：第一采集子模块、第一判断子模块、第一控制子模块、第二控制子模块以及第二采集子模块。其中，第一采集子模块用于获取摄像头的安装位置信息；第一判断子模块用于根据所述安装位置信息判断所述摄像头的拍摄范围是否覆盖预设标尺框；第一控制子模块用于当所述安装位置信息判断所述摄像头的拍摄范围覆盖预设标尺框时，启动所述摄像头进行拍摄；第二控制子模块用于当所述安装位置信息判断所述摄像头的拍摄范围没有覆盖预设标尺框时，发送调整指令调整所述摄像头的拍摄角度，直至所述摄像头的拍摄范围覆盖预设标尺框后，启动所述摄像头进行拍摄；第二采集子模块用于获取所述摄像头的拍摄数据，得到拍摄图片。

在一些实施方式中，所述判断模块1200包括：第一输入子模块、第一检测子模块以及第二判断子模块。其中，第一输入子模块用于将拍摄图片输入Mask R-CNN网络中；第一检测子模块用于根据Mask R-CNN网络中的历史训练数据检测拍摄图片；第二判断子模块用于当拍摄图片中存在有与历史训练数据匹配的特征时，拍摄图片中存在标尺框信息及人体信息。

在一些实施方式中，所述分割模块1300包括：第一设置子模块、第二检测子模块、第一读取子模块以及第一分割子模块。其中，第一设置子模块用于将所述拍摄图片进行坐标模型设置；第二检测子模块用于根据所述历史训练数据，检测所述拍摄图片中的标尺框的位置坐标以及人体的位置坐标；第一读取子模块用于读取所述拍摄图片中对应的所述标尺框的位置坐标以及所述人体的位置坐标；第一分割子模块用于根据所述标尺框的位置坐标以及所述人体的位置坐标，分别分割所述拍摄图片，得到所述标尺框图片以及所述人体图片。

在一些实施方式中，所述第一提取模块1400包括：第一二值化子模块以及第一储存子模块。其中，第一二值化子模块用于将所述标尺框图片进行mask二值化；第一储存子模块用于保存经过mask二值化后的0-1像素的mask图片，得到标尺框预处理图片。

在一些实施方式中，所述第二提取模块1500包括：第二二值化子模块以及第二储存子模块。其中，第二二值化子模块用将所述人体图片进行mask二值化；第二储存子模块用于保存经过mask二值化后的0-1像素的mask图片，得到人体预处理图片。

在一些实施方式中，所述合成模块1600包括：第一划分子模块以及第一合成子模块。其中，第一划分子模块用于根据所述标尺框的位置坐标以及所述人体的位置坐标，将所述拍摄图片划分为标尺区以及人体区；第一合成子模块用于以所述标尺区以及所述人体区为基准，将所述标尺框预处理图片以及所述人体预处理图片合并为所述训练图片。

在一些实施方式中，所述处理模块1700包括：第二输入子模块、第二读取子模块以及第二合成子模块。其中，第二输入子模块，用于将所述训练图片输入所述ResNet18网络训练模型中；第二读取子模块用于读取所述ResNet18网络训练模型中的浅层特征数据以及深层特征数据；第二合成子模块用于合并所述浅层特征数据以及所述深层特征数据，得到所述人体身高特征信息。

为解决上述技术问题，本发明实施例还提供计算机设备。具体请参阅图9，图9为本实施例计算机设备基本结构框图。

如图9所示，计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中，该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种基于人工智能的屏幕控制法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种基于人工智能的屏幕控制法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本实施方式中处理器用于执行图8中采集模块1100、判断模块1200、分割模块1300、第一提取模块1400、第二提取模块1500、合成模块1600、处理模块1700以及执行模块1800的具体功能，存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有人脸图像关键点检测装置中执行所有子模块所需的程序代码及数据，服务器能够调用服务器的程序代码及数据执行所有子模块的功能。

计算机设备对拍摄图片进行Mask R-CNN网络判断，排除非正常拍摄的图片的干扰，提高识别效率；对拍摄图片进行分割，将标尺框图片以及人体图片单独分割后，提取0-1像素的mask图片，提高了获取mask图片的精准度，有效去除背景信息的干扰，保护个人的隐私信息；将合并了标尺框预处理图片与人体预处理图片的训练图片送入ResNet18网络训练模型，由ResNet18网络训练模型对人体身高特征信息进行提取，可快速准确的提取出人体身高特征信息；最后由两层全连接构成的回归网络对提取出的人体身高特征信息进行计算，从而得到人体身高的估计值；如此，可以对不同肤色的人都适用，有效地解决了个人隐私数据收集难的问题。这样，在基于人脸识别技术的基础上，在识别性别和年龄技术的成熟发展下，人体身高的识别也能得到广泛的推广应用。

本发明还提供一种存储有计算机可读指令的存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述任一实施例基于人工智能的屏幕控制法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory， ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM) 等。

本技术领域技术人员可以理解，本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种人体身高识别方法，其特征在于，包括：

采集拍摄图片；

2.根据权利要求1所述的人体身高识别方法，其特征在于，所述采集拍摄图片的步骤，包括：

获取摄像头的安装位置信息；

若是，则启动所述摄像头进行拍摄；

获取所述摄像头的拍摄数据，得到拍摄图片。

3.根据权利要求1所述的人体身高识别方法，其特征在于，所述根据Mask R-CNN网络判断拍摄图片是否存在标尺框信息及人体信息的步骤包括：

将拍摄图片输入Mask R-CNN网络中；

根据Mask R-CNN网络中的历史训练数据检测拍摄图片；

4.根据权利要求3所述的人体身高识别方法，其特征在于，所述当存在标尺框信息以及人体信息时，分割所述拍摄图片，得到标尺框图片以及人体图片的步骤，包括：

分别根据所述标尺框的位置坐标以及所述人体的位置坐标对所述拍摄图片进行分割，得到所述标尺框图片以及所述人体图片。

5.根据权利要求1所述的人体身高识别方法，其特征在于，所述提取所述标尺框图片的0-1像素的mask图片，得到标尺框预处理图片的步骤，包括：

将所述标尺框图片进行mask二值化；

6.根据权利要求4所述的人体身高识别方法，其特征在于，所述将所述标尺框预处理图片与所述人体预处理图片合并，得到训练图片的步骤，包括：

7.根据权利要求6所述的人体身高识别方法，其特征在于，所述根据ResNet18网络训练模型提取所述训练图片的人体身高特征信息的步骤，包括：

将所述训练图片输入所述ResNet18网络训练模型中；

8.一种人体身高识别装置，其特征在于，包括：

采集模块，用于采集拍摄图片；

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如权利要求1至7中任一项权利要求所述人体身高识别方法的步骤。

10.一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述人体身高识别方法的步骤。