CN113111756B

CN113111756B - 基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法

Info

Publication number: CN113111756B
Application number: CN202110362569.2A
Authority: CN
Inventors: 孟利民; 童若望; 应颂翔; 蒋维; 林梦嫚
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2024-05-03
Anticipated expiration: 2041-04-02
Also published as: CN113111756A

Abstract

基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，包括：获取人体不同行为的视频数据；利用OpenPose对视频进行处理，将视频转换成一帧一帧的PNG图像，最后得到视频中每一帧图像中人体骨架关节点数据；在提取出人体骨架关键点后，利用特征向量的均值和标准差对特征向量进行归一化，以降低数据的方差；对数据集中的每个视频构造每个子序列数据，获得的每个子序列数据都有一个行为标签，并将所有子序列数据共同构成样本集；建立长短期记忆人工神经网络；将样本集划分为模型训练集和模型验证集，利用模型训练集训练长短期记忆人工神经网络模型，并在验证集上进行模型验证；利用训练好的长短期记忆人工神经网络模型识别摔倒获得识别结果。

Description

基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法

技术领域

随着社会的发展，全球的老龄人口在不断增加，使老年人的医疗健康成为社会关注的问题之一。美国疾病控制和防疫中心的调查结果表明，摔倒已经成为导致65岁以上老年人意外死亡和伤害的最大诱因。Noury等的研究显示，老年人摔倒后，如能得到及时的救助，可以有效降低80％的死亡风险和26％的住院长期治疗风险。而根据全国老年办统计数据显示，现有大量的老人远离子女独自生活。因此，迫切需要为老年人开发智能监控系统，该系统可以自动并立即检测跌倒事件并通知护理人员或家属。

为了解决该问题，已经进行了将动作识别应用于通过计算机识别人类活动的视频监视系统的研究。跌倒涉及人体的一部分接触或跌落到地面上。一些跌落的情况可能会导致简单的瘀伤，但可能导致严重的伤害，例如滑盘和骨折。与一般的跌倒事故不同，如果一个人由于心脏病发作而跌倒，则最初的反应非常重要。因此，必须准确而迅速地识别到跌倒。

发明内容

为了克服现有技术的上述缺点，本发明提供了一种基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，其目的是建立一种能够准确及时识别出摔倒并及时进行应对处理的方法。

本发明为解决上述技术问题采取的技术方案是：

步骤一、获取人体不同行为的视频数据，该过程收集2D RGB视频数据；并从CRFD数据集中收集人类摔倒视频和人类日常生活视频；

步骤二、利用OpenPose对视频进行处理，将视频转换成一帧一帧的PNG图像，最后得到视频中每一帧图像中人体骨架关节点数据；

步骤三、在提取出人体骨架关键点后，利用特征向量的均值和标准差对特征向量进行归一化，以降低数据的方差。

步骤四、对数据集中的每个视频构造每个子序列数据，获得的每个子序列数据都有一个行为标签。并将所有子序列数据共同构成样本集。

步骤五、建立长短期记忆人工神经网络；

步骤六、将样本集划分为模型训练集和模型验证集，利用模型训练集训练长短期记忆人工神经网络模型，并在验证集上进行模型验证；

步骤七、利用训练好的长短期记忆人工神经网络模型识别摔倒获得识别结果；

所述步骤三中，归一化方法如下：

用M＝(m₁,m₂,…,m_n)∈N^n×2表示二维特征向量，包含n个元素，其中每个元素m_i∈Nⁿ,1≤i≤n代表一个人体的关键点，而元素包含两个整数/>和/>分别是在视频帧中关键点m_i的x坐标和y坐标。从特征向量M中可以提取两个特征向量如下：

简单来说，分别收集关键点的x坐标和y坐标，同时保持顺序，然后将 x坐标和y坐标向量归一化：

其中是M_x的平均值，σ(M_x)是M_x的标准差。而/>也是类似于/>计算出来的。最后将两个归一化的向量连接起来，形成最终的特征向量/>

所述步骤四中，使用窗口滑动方法获得子序列数据，标签包括日常生活动作，摔倒和躺下。

所述步骤五中，所构建的长短期记忆人工神经网络，包括 InputLayer层，masking层，lstm层，BN层，Dropout层和Dense层； InputLayer层输入的是关键点的二维坐标信息；masking层是使用给定的值对输入的序列数据进行“屏蔽”，用以定位所需要的时间步；lstm层用于提取输入的变长的序列特征；BN层的设置有两个作用，一是加快训练和收敛速度，二是防止训练过拟合；Dropout层主要作用也是防止训练过拟合；Dense层是一个100个神经元的全连接层，并且通过softmax激活函数激活，输出各类别的分类得分。

所述步骤六中，利用训练集中每个子序列数据对应的类别标签，训练长短期记忆人工神经网络模型，并在验证集上进行验证，使用准确率作为模型的评估标准，选择在验证集具有最高准确率的迭代周期，获取该迭代周期下的模型参数得到最终的长短期记忆人工神经网络模型。

所述步骤七中，使用openpose对视频进行处理，获得视频中每一帧图像中人体骨架关节点数据，并进行归一化；采用滑动窗口方法获得子序列数据，将数据片段输入训练好的长短期记忆人工神经网络，检测出当前是否摔倒。

本发明的优点是：对人体摔倒的识别更为准确、高效。

附图说明

图1是OpenPose提取的人体骨架关节点示意图；

图2是本发明行为识别方法流程示意图；

图3是本发明的长短期记忆人工神经网络模型结构示意图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1～图3，一种基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，包括以下步骤：

步骤一、获取人体不同行为的视频数据，该过程收集2D RGB视频数据；本实施方法使用CRFD公开数据集，数据集视频包括人类摔倒视频和人类日常生活视频；

步骤二、利用OpenPose对视频进行处理，将视频转换成一帧一帧的PNG图像，最后得到视频中每一帧图像中人体骨架关键点数据，包括身体18个关键点；关键点及部位名称如下：0(鼻)、1(颈)、2(右肩)、3(右肘)、4(右腕)、5(左肩)、6(左肘)、7(左腕)、8、9(左膝)、10(左脚)、11、12(右膝)、13(右脚)、14(右眼)、15(左眼)、16(右耳)、17(左耳)；

步骤三、在提取出人体骨架关键点后，需要进行归一化：用M＝(m₁,m₂,…,m_n)∈N^n×2表示二维特征向量，包含n个元素，其中每个元素m_i∈Nⁿ,1≤i≤n代表一个人体的关键点，而元素包含两个整数/>和/>分别是在视频帧中关键点m_i的x坐标和y坐标。从特征向量M中可以提取两个特征向量如下：

步骤四、使用窗口滑动方法对数据集中的每个视频构造每个子序列数据，获得的每个子序列数据都有一个行为标签，标签包括日常生活动作，摔倒和躺下。并将所有子序列数据共同构成样本集。

步骤五、建立长短期记忆人工神经网络，长短期记忆人工神经网络模型结构如图3所示，包括InputLayer层，masking层，lstm层，BN 层，Dropout层和Dense层；InputLayer层输入的是关键点的二维坐标信息；masking层是使用给定的值对输入的序列数据进行“屏蔽”，用以定位所需要的时间步；lstm层用于提取输入的变长的序列特征； batch_normalization层的设置有两个作用，一是加快训练和收敛速度，二是防止训练过拟合；Dropout层主要作用也是防止训练过拟合；Dense层是一个100个神经元的全连接层，并且通过softmax激活函数激活，输出各类别的分类得分；

步骤六、将步骤四中的样本集中的70％划分为训练集，30％划分为验证集，利用模型训练集训练长短期记忆人工神经网络模型，采用的是多分类对数函数(categoricalcrossentropy)，使用Adam优化器用于训练更新网络权值和偏置，根据数据集的大小设定batch为256，最大的epoch为200，设置初始学习率为0.001，并在训练过程中，每 10个epoch衰减一次，衰减因子为0.2。还使用了概率为0.3的dropout 正则化用来防止训练过拟合；最终在验证集上进行模型验证；

步骤七、利用训练好的长短期记忆人工神经网络模型识别摔倒获得识别结果。使用openpose对视频进行处理，获得视频中每一帧图像中人体骨架关节点数据，并进行归一化；采用滑动窗口方法获得子序列数据，将数据片段输入训练好的长短期记忆人工神经网络，检测出当前是否摔倒。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.一种基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，包括以下步骤：

步骤三、在提取出人体骨架关键点后，利用特征向量的均值和标准差对特征向量进行归一化，以降低数据的方差；所述归一化方法如下：

用M＝(m₁,m₂,…,m_n)∈N^n×2表示二维特征向量，包含n个元素，其中每个元素m_i∈Nⁿ,1≤i≤n代表一个人体的关键点，而元素包含两个整数/>和/>分别是在视频帧中关键点m_i的x坐标和y坐标；从特征向量M中可以提取两个特征向量如下：

简单来说，分别收集关键点的x坐标和y坐标，同时保持顺序，然后将x坐标和y坐标向量归一化：

其中是M_x的平均值，σ(M_x)是M_x的标准差；而/>也是类似于/>计算出来的；最后将两个归一化的向量连接起来，形成最终的特征向量/>

步骤四、对数据集中的每个视频构造每个子序列数据，获得的每个子序列数据都有一个行为标签；并将所有子序列数据共同构成样本集；

步骤五、建立长短期记忆人工神经网络；所述的长短期记忆人工神经网络，包括InputLayer层，masking层，BN层，lstm层Dropout层和Dense层；InputLayer层输入的是关键点的二维坐标信息；masking层是使用给定的值对输入的序列数据进行“屏蔽”，用以定位所需要的时间步；lstm层用于提取输入的变长的序列特征；BN层的设置有两个作用，一是加快训练和收敛速度，二是防止训练过拟合；Dropout层主要作用也是防止训练过拟合；Dense层是一个100个神经元的全连接层，并且通过softmax激活函数激活，输出各类别的分类得分；

步骤七、利用训练好的长短期记忆人工神经网络模型识别摔倒获得识别结果。

2.根据权利要求1所述的一种基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，其特征在于：步骤四中，使用窗口滑动方法获得子序列数据，标签包括日常生活动作，摔倒和躺下。

3.根据权利要求1所述的一种基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，其特征在于：步骤六中，利用训练集中每个子序列数据对应的类别标签，训练长短期记忆人工神经网络模型，并在验证集上进行验证，使用准确率作为模型的评估标准，选择在验证集具有最高准确率的迭代周期，获取该迭代周期下的模型参数得到最终的长短期记忆人工神经网络模型。

4.根据权利要求1所述的一种基于人体骨架关键点和长短期记忆人工神经网络的人体摔倒识别方法，其特征在于：步骤七中，使用openpose对视频进行处理，获得视频中每一帧图像中人体骨架关节点数据，并进行归一化；采用滑动窗口方法获得子序列数据，将数据片段输入训练好的长短期记忆人工神经网络，检测出当前是否摔倒。