CN111368806B

CN111368806B - 一种基于人工智能的工人施工状态监测方法

Info

Publication number: CN111368806B
Application number: CN202010248170.7A
Authority: CN
Inventors: 李子奇; 李冬生
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2020-04-01
Filing date: 2020-04-01
Publication date: 2023-06-13
Anticipated expiration: 2040-04-01
Also published as: CN111368806A

Abstract

本发明属于人工智能领域，涉及一种基于人工智能的工人施工状态监测方法。本发明运用深度学习姿态估计框架Openpose来获取工人的骨架关节点坐标，将坐标进行向量化处理，将向量化处理后的坐标运用LSTM网络进行训练，以此模型输出建筑工人的行为。同时运用目标检测框架Yolov3检测出工人所在画面中的标志物，将之前检测出的工人行为与工地上的标志物作为新特征，将其对应的工人施工状态作为标签，训练xgboost网络模型，最后实现实时施工状态实时监测。本发明可以基于人工智能理论准确的监测施工现场工人的施工状态，减少了施工时对于人力的需求。

Description

一种基于人工智能的工人施工状态监测方法

技术领域

本发明属于人工智能领域，涉及一种基于人工智能的工人施工状态监测方法。

背景技术

随着人工智能的飞速发展，其在各个工程领域中应用越来越广泛。在建筑工程中也有人工智能算法应用于其中，例如计算机视觉、深度学习、机器学习等等。

工人的施工状态识别对于建筑工程中有重要的意义，通过对于工人施工状态的识别，可以了解工人的工作进度，工人是否具有安全风险以及操作是否规范。

在现有的施工管理技术中，对于工人施工状态的监控都是由施工现场管理人员来完成，但是管理人员的数量和精力有限，很难做到对于工人施工状态的实时监控。若使用以往的行为监测技术只针对于人物本身进行监测，这样当工人有相似动作时很难分辨工人具体的施工状态。

发明内容

为解决上述问题，本发明提出了一种基于人工智能的施工状态监测方法，运用深度学习姿态估计框架Openpose来获取工人的骨架关节点坐标，将坐标进行向量化处理，将向量化处理后的坐标运用LSTM网络进行训练，以此模型输出建筑工人的行为。同时运用目标检测框架Yolov3检测出工人所在画面中的标志物，将之前检测出的工人行为与工地上的标志物作为新特征，将其对应的工人施工状态作为标签，训练xgboost网络模型，最后实现实时施工状态实时监测。

本发明的技术方案：

一种基于人工智能的工人施工状态监测方法，具体步骤如下：

步骤一、采集数据集

采集建筑工程中工人施工时的状态的视频作为数据集，每一个工人施工状态采集至少一百段视频；将视频做上三个类别标签，标签包含工人的行为、视频画面中工人附近的标志物和工人施工状态；其中，工人的行为包括蹲着、站立、俯身和抬手，视频画面中工人附近的标志物包括钢筋、墙、砖、梁、板和柱，工人施工状态包括砌砖、支模板和绑扎钢筋；将视频采用k折交叉法分为k个子数据集，然后将其中一个子数据集作为测试集进行模型评估，剩余k-1个作为训练集。

步骤二、提取特征

运用深度学习姿态估计框架Openpose对步骤一中的视频进行识别，使其输出视频中工人18个关节点坐标，关节点包括鼻子、左肘、左膝盖、颈部、左腕、左踝、右肩、右臀、右眼、右肘、右膝、左眼、右腕、右踝、右耳、左肩、左臀部和左耳朵，若部分身体关节点被遮挡，则无需识别。

步骤三、向量化处理

将步骤二产生的工人关节点坐标进行向量化处理，每个向量为相邻两个关节点坐标之差，代表一节骨架，被遮挡的骨架用零向量代替，一共产生17个2维向量。

步骤四、训练LSTM网络模型

搭建LSTM网络模型，输入层设置17个神经元对应17个二维向量，设置隐藏层以及与最后一层连接的Softmax分类器，并设定损失函数和优化器，用步骤三生成的向量及其所属标签训练搭建好的LSTM模型，使其输出工人行为。

步骤五、训练Yolov3网络模型

搭建Yolov3网络模型，将步骤一中的数据集以及所属标签用对其进行训练，使其识别出视频画面中的标志物。

步骤六、制作施工状态数据集

将步骤四中输出的工人行为以及步骤五中识别的标志物作为新的特征，将工人施工状态作为标签，制作数据集。

步骤七、搭建xgboost网络模型

搭建xgboost网络模型，输入步骤六中的数据集进行训练，使用训练好的xgboost网络模型对视频画面中的行为及标志物进行打分，xgboost网络模型依据得分输出工人最可能的施工状态。

本发明有益效果：

(1)本发明可以基于人工智能理论准确的监测施工现场工人的施工状态，减少了施工时对于人力的需求。

(2)相对于传统行为识别方式，加入了标志物识别，将标志物信息与工人行为综合考虑，得到工人的准确施工状态。

附图说明

图1为本发明的流程图；

图2为人体关节点对应图；

图3为工人施工状态数据集示意图。

具体实施方式

以下结合附图和技术方案，进一步说明本发明的具体实施方式。

本发明的一种基于人工智能的工人施工状态监测方法，如图1所示，具体步骤如下：

步骤一、采集数据集

在建筑工地安装摄像头，拍摄200段工人施工时的视频，将拍摄的视频进行分段，将每一个完整行为作为一段视频，每一段视频做好三个标签，分别为工人行为(蹲着、站立、俯身、抬手等)、视频画面中工人附近的标志物(钢筋、墙、砖、梁、柱等)以及工人所处施工状态(砌砖、支模板、绑扎钢筋等)。将视频采用k折交叉法分为10个子集，然后将其中1个子数据集作为测试集进行模型评估，剩余9个作为训练集。

步骤二、提取关节坐标

将步骤一中数据集作为输入端用Openpose框架进行识别，输出关节点坐标，关节点编号与人体部位对应关系如图2所示。

步骤三、向量化处理

将步骤二产生的工人关节点坐标进行向量化处理，每个向量为相邻两个关节点坐标之差，一共17个2维向量。例如图2中7节点坐标为(x₇，y₇)，6节点坐标为(x₆，y₆)，则6-7骨架向量为(x₇-x₆，y₇-y₆)，依此方法求出17个骨架向量，被遮挡的骨架用零向量代替。

步骤四、训练LSTM网络模型

将步骤三所得17个二维向量作为LSTM网络的输入端，分别对应网络中首层(输入层)的17个神经元，然后设置隐藏层，然后设置损失函数和优化器，在最后一层连接Softmax分类器，输出工人的行为。

步骤五、训练YOLOV3网络模型

将步骤一中抽帧后所得的图片作为数据集，对图片中的工人操作的物体作为标志物，用深度学习目标识别框架YOLOV3进行训练，使其可以输出图片中的标志物。

步骤六、制作施工状态数据集

将步骤四中输出的工人行为以及步骤五中输出的标志物作为新的特征，将工人的施工状态作为标签，创建数据集，例如图3中的工人，其特征为蹲着、钢筋，标签为绑扎钢筋。

步骤六、训练xgboost网络模型

搭建xgboost网络模型，输入步骤六中数据集进行训练，使训练好的模型对照片中的行为及标志物进行打分，模型会输出得分最高的工作状态即为工人此时的施工状态。

Claims

1.一种基于人工智能的工人施工状态监测方法，其特征在于，具体步骤如下：

步骤一、采集数据集

采集建筑工程中工人施工时的状态的视频作为数据集，每一个工人施工状态采集至少一百段视频；将视频做上三个类别标签，标签包含工人的行为、视频画面中工人附近的标志物和工人施工状态；其中，工人的行为包括蹲着、站立、俯身和抬手，视频画面中工人附近的标志物包括钢筋、墙、砖、梁、板和柱，工人施工状态包括砌砖、支模板和绑扎钢筋；将视频采用k折交叉法分为k个子数据集，然后将其中一个子数据集作为测试集进行模型评估，剩余k-1个作为训练集；

步骤二、提取特征

运用深度学习姿态估计框架Openpose对步骤一中的视频进行识别，使其输出视频中工人18个关节点坐标，关节点包括鼻子、左肘、左膝盖、颈部、左腕、左踝、右肩、右臀、右眼、右肘、右膝、左眼、右腕、右踝、右耳、左肩、左臀部和左耳朵，若部分身体关节点被遮挡，则无需识别；

步骤三、向量化处理

将步骤二产生的工人关节点坐标进行向量化处理，每个向量为相邻两个关节点坐标之差，代表一节骨架，被遮挡的骨架用零向量代替，一共产生17个2维向量；

步骤四、训练LSTM网络模型

搭建LSTM网络模型，输入层设置17个神经元对应17个二维向量，设置隐藏层以及与最后一层连接的Softmax分类器，并设定损失函数和优化器，用步骤三生成的向量及其所属标签训练搭建的LSTM模型，使其输出工人行为；

步骤五、训练Yolov3网络模型

搭建Yolov3网络模型，将步骤一中的数据集以及所属标签用对其进行训练，使其识别出视频画面中的标志物；

步骤六、制作施工状态数据集

将步骤四中输出的工人行为以及步骤五中识别的标志物作为新的特征，将工人施工状态作为标签，制作数据集；

步骤七、搭建xgboost网络模型