CN114581843B - 一种基于深度学习的扶梯乘客危险行为识别方法 - Google Patents
一种基于深度学习的扶梯乘客危险行为识别方法 Download PDFInfo
- Publication number
- CN114581843B CN114581843B CN202210161104.5A CN202210161104A CN114581843B CN 114581843 B CN114581843 B CN 114581843B CN 202210161104 A CN202210161104 A CN 202210161104A CN 114581843 B CN114581843 B CN 114581843B
- Authority
- CN
- China
- Prior art keywords
- skeleton
- frame
- passengers
- coordinates
- escalator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 74
- 230000003044 adaptive effect Effects 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 11
- 230000003321 amplification Effects 0.000 claims description 9
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 7
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 5
- 238000007500 overflow downdraw method Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 206010000117 Abnormal behaviour Diseases 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 230000004927 fusion Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B29/00—Safety devices of escalators or moving walkways
- B66B29/005—Applications of security monitors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B50/00—Energy efficient technologies in elevators, escalators and moving walkways, e.g. energy saving or recuperation technologies
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的扶梯乘客危险行为识别方法,通过位于扶梯楼层板上方的摄像机拍摄含有乘客的扶梯视频段,使用目标检测、跟踪及关节点提取算法获得骨架序列,对骨架序列进行归一化、插帧处理制作数据集,同时将2S‑AGCN网络进行改进以提高骨架关节点连接的合理性,增强模型拟合能力,以用于对骨架序列进行行为分类,并对训练集进行数据扩增后训练该网络模型,在测试阶段,使用插帧及归一化方法保证数据分布与训练集一致,且根据连续多帧的分类结果决定当前帧乘客的行为类别,最终得到稳定的扶梯乘客危险行为识别结果。本发明可以快速准确的判断扶梯上是否存在乘客出现危险行为,保护乘客的人身安全不受威胁。
Description
技术领域
本发明涉及扶梯乘客危险行为识别的技术领域,尤其是指一种基于深度学习的扶梯乘客危险行为识别方法。
背景技术
在现代社会,各种高层建筑不断出现,为了方便人们不同楼层间的变换,扶梯成为一个必不可少的设备,相比垂直电梯具有载客量大的优点,被广泛运用于各种场合,尤其是商场、地铁等客流量大的场所。然而,由于一些乘客的不规范乘坐可能会出现一些意想不到的情况发生,尤其是发生摔倒情况时,容易导致衣服或者头发被卷入扶梯,如果扶梯不能及时停止,将会促使情况恶化,严重威胁人的生命安全。目前,虽然扶梯大都具有防止侧面防夹的设备,但其主要依赖于扶梯侧面挡板的形变,对于摔倒这种情况只有当乘客被卷入很多时才可能触发,此时已经造成了严重代价,保护性不足。目前扶梯出入口处大都配有摄像机,通常用于检测地铁客流量或对乘客进行人脸识别以方便政府部门对特定人员的查找,并未用于乘客摔倒等异常行为的检测,不能充分利用监控信息。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于深度学习的扶梯乘客危险行为识别方法,该方法对扶梯上乘客的骨架进行检测并跟踪获得乘客的骨架序列,通过改进的2S-AGCN图卷积网络对骨架序列进行分类,完成乘客异常行为的检测,能够及时发现扶梯上乘客的危险行为,避免造成有进一步的人身损害。
为实现上述目的,本发明所提供的技术方案为:一种基于深度学习的扶梯乘客危险行为识别方法,包括以下步骤:
1)获取位于扶梯楼层板上方的摄像机拍摄的含有乘客的扶梯视频段,将所有的扶梯视频段进行处理生成所需的数据集,再将数据集进行处理生成所需的数据集,再将数据集按比例划分原始训练集和原始验证集,并进行乘客异常行为类别标注;
2)对原始训练集和原始验证集进行坐标归一化,将所有乘客的关节坐标统一到同一数据分布下,得到归一化后的训练集和验证集;
3)对归一化后的训练集进行数据扩增,加入噪声生成新的图像并赋予相应的标签,作为最终训练集;
4)使用最终训练集训练改进的2S-AGCN网络,并使用归一化后的验证集验证模型精度以选取最优模型参数,其中对2S-AGCN网络的改进是使用自适应的多阶邻接矩阵融合方法,以及使用自学习的邻接矩阵获取骨架中关节点的连接关系;
5)对待检测视频的每一帧进行乘客骨架提取并跟踪,将得到的所有乘客的骨架序列送入训练好的改进2S-AGCN网络进行行为分类,并根据连续的多个骨架序列识别结果得到最终的乘客行为类别。
进一步,在步骤1)中,数据集生成及标注方法如下:
1.1)将乘客P1,在视频中的动作起始帧一直到结束帧间的视频段截取出来,同时该视频段的类别就标记为乘客P1的行为类别;
1.2)对视频段的每一帧图像使用目标检测网络框选出图中所有乘客并进行跟踪,然后使用骨架提取网络提取出所有乘客的骨架信息,从而得到所有乘客在全部帧的骨架检测结果,并将其按时间顺序组成骨架序列,然后只保存该视频段对应乘客P1的骨架序列;
1.3)使用插帧算法对骨架序列进一步处理,假设乘客P1的骨架序列的帧数为FP1,而帧数必须为改进2S-AGCN网络缩放倍率Fcount的整数倍,故需要对P1的骨架序列进行插帧处理,需要增加的帧数其中[·]表示向下取整操作,则在处各插入一帧,而插入帧的骨架信息通过对相邻前后两帧的骨架位置求平均获得,从而得到插帧后的骨架序列;
1.4)将乘客P1的行为类别,作为其对应插帧后骨架序列的类别标签,即插帧后骨架序列及其行为类别共同作为数据集的一个样本。
进一步,在步骤2)中,坐标归一化方法如下:
针对每一个骨架序列的某一帧,假设其骨架中包含K个关节点,所有关节点在图像中的坐标为{(xi,yi),i∈[1,K]},(xi,yi)为第i个关节点的横坐标和纵坐标,则该骨架的外接矩形框坐标为(xmin,ymin,xmax,ymax)=(min({(xi)}),min({(yi)}),max({(xi)}),max({(yi)})),i∈[1,K],其中,(xmin,ymin)为外接矩形左上角的横坐标和纵坐标,(xmax,ymax)为外接矩形右下角的横坐标和纵坐标,min({·})、max({·})分别为集合{·}的最小值和最大值;则归一化后的关节点坐标为
进一步,在步骤3)中,数据扩增方法如下:
3.1)以设定概率对整个骨架序列进行翻转,翻转方法为:假设归一化后骨架序列的关节点坐标为其中,K为骨架的关节点个数,T为骨架序列的帧数,/>为第t帧第i个关节点的横坐标和纵坐标,则翻转后的关节点坐标为
3.2)对于骨架序列的第t帧,随机选取N个关节点,其中选取的第j个关节点的坐标为/>在[-0.01,0.01]之间按照高斯分布随机选取两个数/>则添加位移噪声后的关节点坐标为从而添加随机位移噪声;
3.3)对于骨架序列的第t帧,随机选取M个关节点,其中选取的第j个关节点的坐标为/>则擦除该关节点后,其坐标为用于模拟因为遮挡而导致的关节点检测不全的情况。
进一步,在步骤4)中,改进的2S-AGCN网络的具体改进如下:
4.1)使用自适应多阶邻接矩阵融合方法:假设骨架图先验的连接关系,即先验邻接矩阵为则k阶邻接矩阵/>其中/>表示先验邻接矩阵/>的k次幂,最终使用的自适应多阶邻接矩阵/>其中H表示最高阶次数,/>是最大阶次为H的自适应多阶邻接矩阵,αk为k阶邻接矩阵对应的权值,该值初始化为1,然后随着模型的训练自适应调整,因此,最终得到的自适应多阶矩阵是多阶矩阵的加权和,而权值是经过所有的训练数据统计得到的,能够有效提升网络模型的效果;
4.2)使用自学习邻接矩阵:由步骤4.1)得到自适应多阶邻接矩阵设置一个与行列数目完全一致的自学习邻接矩阵BH,且BH初始化为0阵,该矩阵的元素全部为可训练参数,能够根据训练数据获得/>中不存在的连接关系,则最终用于特征提取的邻接矩阵为其中β为一个可学习参数,初始值为0,保证训练前期骨架连接关系偏向于先验邻接矩阵,训练后期骨架连接关系偏向于自学习的邻接矩阵,从而能够得到更优的邻接矩阵,即得到更合理的骨架连接关系,有效提高模型的分类性能。
进一步,在步骤5)中,对待检测视频中的乘客行为分类方法如下:
5.1)对每一帧图像使用目标检测及跟踪算法获得乘客的轨迹信息,同时对乘客的每一帧图像使用关键点提取网络提取乘客的骨架信息,从而获得乘客在连续帧内的原始骨架序列信息,如果骨架序列的帧数小于改进2S-AGCN网络缩放倍率Fcount,不进行分类,否则执行5.2);
5.2)首先利用插帧算法对骨架序列进行调整,而后将调整后的骨架序列使用归一化方法进行处理,再送入训练好的改进2S-AGCN网络进行分类,同时统计截止当前帧连续D帧的分类结果,取其中出现次数最多的类别作为该帧的行为类别,以得到稳定的分类结果。
本发明与现有技术相比,具有如下优点与有益效果:
1、以位于扶梯出入口的摄像机作为信息采集装置,无需增加新的设备,充分利用了扶梯上的图像信息,且不影响其它图像任务的执行,节约硬件成本,同时该方法处理的是图像信息,在乘客摔倒时可以立即检测出,从而可以采取紧急措施,有效防止情况的进一步恶化,保证乘客的生命安全。
2、使用乘客的骨架信息进行行为分类,相比使用原始图像数据,丢弃了大量的无用特征,即减少了计算量,也提高了算法的检测准确度。
3、利用提出的归一化方法,以及训练集的数据扩增方法,极大的丰富了数据的多样性,且充分模拟了实际检测过程中乘客遮挡的情况,促使模型更加关注重要的特征,提高了最终模型的泛化性。
4、对2S-AGCN网络进行改进,对邻接矩阵进行自适应多阶融合极大的提高了不同距离关节点之间的特征融合效果,而自学习矩阵与先验邻接矩阵的整合,即在训练前期利用了先验连接关系加速模型收敛,又在训练后期使用学习出的连接关系提高模型的特征提取性能。
附图说明
图1为改进的2S-AGCN网络的训练流程示意图。
图2为本发明方法实际运用时的逻辑流程示意图。
图3为自适应多阶邻接矩阵融合示意图。
图4为自学习邻接矩阵与先验矩阵融合示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1和图2所示,本实施例所提供的基于深度学习的扶梯乘客危险行为识别方法,其具体情况如下:
步骤1:获取位于扶梯楼层板上方的摄像机拍摄的含有乘客的扶梯视频段,利用这些视频段来生成训练集以及验证集,具体的方法如下:
1.1)将每个乘客,比如乘客P1,在视频中的动作起始帧一直到结束帧间的视频段截取出来,同时该视频段的类别就标记为乘客P1的行为类别。
1.2)对视频段的每一帧图像使用目标检测网络框选出图中所有乘客并进行跟踪,然后使用骨架提取网络提取出所有乘客的骨架信息,从而得到所有乘客在全部帧的骨架检测结果,并将其按时间顺序组成骨架序列,然后只保存该视频段对应乘客P1的骨架序列。
1.3)使用插帧算法对骨架序列进一步处理,假设乘客P1的骨架序列的帧数为FP1,而帧数必须为改进2S-AGCN网络缩放倍率Fcount的整数倍,故需要对P1的骨架序列进行插帧处理,需要增加的帧数其中[·]表示向下取整操作,则在处各插入一帧,而插入帧的骨架信息通过对相邻前后两帧的骨架位置求平均获得,从而得到插帧后的骨架序列。
1.4)将乘客P1的行为类别,作为其对应插帧后骨架序列的类别标签,即插帧后骨架序列及其行为类别共同作为数据集的一个样本,然后将所有的样本按照9:1的比例分为原始训练集和原始验证集。
步骤2:由于乘客在图像中的位置是不固定的,而这些关节点的绝对位置对动作识别毫无意义,所以考虑使用归一化方法,去除骨架序列中的绝对位置信息,具体的归一化方法如下:
针对每一个骨架序列的某一帧,假设其骨架中包含K个关节点,所有关节点在图像中的坐标为{(xi,yi),i∈[1,K]},(xi,yi)为第i个关节点的横坐标和纵坐标,则该骨架的外接矩形框坐标为(xmin,ymin,xmax,ymax)=(min({(xi)}),min({(yi)}),max({(xi)}),max({(yi)})),i∈[1,K],其中,(xmin,ymin)为外接矩形左上角的横坐标和纵坐标,(xmax,ymax)为外接矩形右下角的横坐标和纵坐标,min({·})、max({·})分别为集合{·}的最小值和最大值;则归一化后的关节点坐标为
步骤3:由于训练集规模有限,通过在已有训练集的基础上进行数据扩增以模拟更多的现实场景,可以有效提高数据的丰富性以及最终训练模型的泛化性,具体的数据扩增方法如下:
3.1)以一定概率对整个骨架序列进行翻转,翻转方法为:假设归一化后骨架序列的关节点坐标为其中,K为骨架的关节点个数,T为骨架序列的帧数,/>为第t帧第i个关节点的横坐标和纵坐标,则翻转后的关节点坐标为
3.2)对于骨架序列的第t帧,随机选取N个关节点,其中选取的第j个关节点的坐标为/>在[-0.01,0.01]之间按照高斯分布随机选取两个数/>则添加位移噪声后的关节点坐标为/>从而添加随机位移噪声。
3.3)对于骨架序列的第t帧,随机选取M个关节点,其中选取的第j个关节点的坐标为/>则擦除该关节点后,其坐标为用于模拟因为遮挡而导致的关节点检测不全的情况。
步骤4:利用数据扩增后的训练集训练提出的改进的2S-AGCN网络,该网络的具体改进如下:
4.1)使用自适应多阶邻接矩阵融合方法:假设骨架图先验的连接关系,即先验邻接矩阵为则k阶邻接矩阵/>其中/>表示先验邻接矩阵/>的k次幂,最终使用的自适应多阶邻接矩阵/>其中H表示最高阶次数,/>是最大阶次为H的自适应多阶邻接矩阵,αk为k阶邻接矩阵对应的权值,该值初始化为1,然后随着模型的训练自适应调整,因此,最终得到的自适应多阶矩阵是多阶矩阵的加权和,而权值是经过所有的训练数据统计得到的,可以有效提升网络模型的效果。如图3所示,图中颜色的深浅代表该处数值的大小,其中白色为0,纯黑色为1,a为k=1时的邻接矩阵,b为k=2时的邻接矩阵,c为k=3时的邻接矩阵,假设他们对应的灰色块值分别为0.8、0.2、0.5,d为K=3时的多阶邻接矩阵自适应融合的结果,其中d为a、b、c三个邻接矩阵的加和。
4.2)使用自学习邻接矩阵:由步骤4.1)得到自适应多阶邻接矩阵设置一个与行列数目完全一致的自学习邻接矩阵BH,且BH初始化为0阵,该矩阵的元素全部为可训练参数,能够根据训练数据获得/>中不存在的连接关系,则最终用于特征提取的邻接矩阵为其中β为一个可学习参数,初始值为0,保证训练前期骨架连接关系偏向于先验邻接矩阵,训练后期骨架连接关系偏向于自学习的邻接矩阵,表面自学习邻接矩阵以及自学习参数β的引入可以得到更优的邻接矩阵,即得到更合理的骨架连接关系,有效提高模型的分类性能。如图4所示,图中颜色的深浅代表该处数值的大小,其中白色为0,纯黑色为1,a为先验邻接矩阵,b为自学习邻接矩阵,假设他们对应的灰色块值都为1,c为β=0.3时自学习邻接矩阵与先验邻接矩阵的融合结果。
利用数据扩增后的训练集训练改进的2S-AGCN网络,训练中采用Adam优化方法、0.001的初始学习率进行训练,每10个epoch使用验证集验证一次当前模型的性能,并选取前100个epoch中验证集准确率最高的模型参数作为预测模型。
步骤5:使用训练好的改进2S-AGCN网络对待测视频进行行为分类,其主要包括以下步骤:
5.1)获取乘客骨架信息。对每一帧图像使用目标检测及跟踪算法获得乘客的轨迹信息,同时对乘客的每一帧图像使用关键点提取网络提取乘客的骨架信息,从而获得乘客在连续帧内的原始骨架序列信息,如果骨架序列的帧数小于改进2S-AGCN网络缩放倍率Fcount,则不对该骨架序列进行分类,否则执行步骤5.2)。
5.2)首先利用插帧算法对骨架序列进行调整,使其骨架序列的帧数变为Fcount的整数倍,而后将调整后的骨架序列使用归一化方法进行处理,再送入训练好的改进2S-AGCN网络进行分类,同时统计截止当前帧连续D帧的分类结果,取其中出现次数最多的类别作为该帧的行为类别,以得到稳定的分类结果。
综上所述,在采用以上方案,本发明为扶梯上乘客危险行为的检测提供的新的方法,采用深度学习方法实现了对乘客危险行为的实时检测,保护乘客的人身安全不受威胁,提高扶梯的安全系数,具有实际推广价值,值得推广。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (5)
1.一种基于深度学习的扶梯乘客危险行为识别方法,其特征在于,包括以下步骤:
1)获取位于扶梯楼层板上方的摄像机拍摄的含有乘客的扶梯视频段,将所有的扶梯视频段进行处理生成所需的数据集,再将数据集按比例划分原始训练集和原始验证集,并进行乘客异常行为类别标注;
2)对原始训练集和原始验证集进行坐标归一化,将所有乘客的关节坐标统一到同一数据分布下,得到归一化后的训练集和验证集;
3)对归一化后的训练集进行数据扩增,加入噪声生成新的图像并赋予相应的标签,作为最终训练集;
4)使用最终训练集训练改进的2S-AGCN网络,并使用归一化后的验证集验证模型精度以选取最优模型参数,其中对2S-AGCN网络的改进是使用自适应的多阶邻接矩阵融合方法,以及使用自学习的邻接矩阵获取骨架中关节点的连接关系;
改进的2S-AGCN网络的具体改进如下:
4.1)使用自适应多阶邻接矩阵融合方法:假设骨架图先验的连接关系,即先验邻接矩阵为则k阶邻接矩阵/>其中/>表示先验邻接矩阵/>的k次幂,最终使用的自适应多阶邻接矩阵/>其中H表示最高阶次数,/>是最大阶次为H的自适应多阶邻接矩阵,αk为k阶邻接矩阵对应的权值,该权值初始化为1,然后随着模型的训练自适应调整,因此,最终得到的自适应多阶矩阵是多阶矩阵的加权和,而权值是经过所有的训练数据统计得到的,能够有效提升网络模型的效果;
4.2)使用自学习邻接矩阵:由步骤4.1)得到自适应多阶邻接矩阵设置一个与/>行列数目完全一致的自学习邻接矩阵BH,且BH初始化为0阵,该矩阵的元素全部为可训练参数,能够根据训练数据获得/>中不存在的连接关系,则最终用于特征提取的邻接矩阵为其中β为一个可学习参数,初始值为0,保证训练前期骨架连接关系偏向于先验邻接矩阵,训练后期骨架连接关系偏向于自学习的邻接矩阵,从而能够得到更优的邻接矩阵,即得到更合理的骨架连接关系,有效提高模型的分类性能;
5)对待检测视频的每一帧进行乘客骨架提取并跟踪,将得到的所有乘客的骨架序列送入训练好的改进2S-AGCN网络进行行为分类,并根据连续的多个骨架序列识别结果得到最终的乘客行为类别。
2.根据权利要求1所述的一种基于深度学习的扶梯乘客危险行为识别方法,其特征在于:在步骤1)中,数据集生成及标注方法如下:
1.1)将乘客P1,在视频中的动作起始帧一直到结束帧间的视频段截取出来,同时该视频段的类别就标记为乘客P1的行为类别;
1.2)对视频段的每一帧图像使用目标检测网络框选出图中所有乘客并进行跟踪,然后使用骨架提取网络提取出所有乘客的骨架信息,从而得到所有乘客在全部帧的骨架检测结果,并将其按时间顺序组成骨架序列,然后只保存该视频段对应乘客P1的骨架序列;
1.3)使用插帧算法对骨架序列进一步处理,假设乘客P1的骨架序列的帧数为FP1,而帧数必须为改进2S-AGCN网络缩放倍率Fcount的整数倍,故需要对P1的骨架序列进行插帧处理,需要增加的帧数其中[·]表示向下取整操作,则在处各插入一帧,而插入帧的骨架信息通过对相邻前后两帧的骨架位置求平均获得,从而得到插帧后的骨架序列;
1.4)将乘客P1的行为类别,作为其对应插帧后骨架序列的类别标签,即插帧后骨架序列及其行为类别共同作为数据集的一个样本。
3.根据权利要求1所述的一种基于深度学习的扶梯乘客危险行为识别方法,其特征在于:在步骤2)中,坐标归一化方法如下:
针对每一个骨架序列的某一帧,假设其骨架中包含K个关节点,所有关节点在图像中的坐标为{(xi,yi),i∈[1,K]},(xi,yi)为第i个关节点的横坐标和纵坐标,则该骨架的外接矩形框坐标为(xmin,ymin,xmax,ymax)=(min({(xi)}),min({(yi)}),max({(xi)}),max({(yi)})),i∈[1,K],其中,(xmin,ymin)为外接矩形左上角的横坐标和纵坐标,(xmax,ymax)为外接矩形右下角的横坐标和纵坐标,min({·})、max({·})分别为集合{·}的最小值和最大值;则归一化后的关节点坐标为
4.根据权利要求1所述的一种基于深度学习的扶梯乘客危险行为识别方法,其特征在于:在步骤3)中,数据扩增方法如下:
3.1)以设定概率对整个骨架序列进行翻转,翻转方法为:假设归一化后骨架序列的关节点坐标为其中,K为骨架的关节点个数,T为骨架序列的帧数,为第t帧第i个关节点的横坐标和纵坐标,则翻转后的关节点坐标为
3.2)对于骨架序列的第t帧,随机选取N个关节点,其中选取的第j个关节点的坐标为/>在[-0.01,0.01]之间按照高斯分布随机选取两个数则添加位移噪声后的关节点坐标为从而添加随机位移噪声;
3.3)对于骨架序列的第t帧,随机选取M个关节点,其中选取的第j个关节点的坐标为/>则擦除该关节点后,其坐标为用于模拟因为遮挡而导致的关节点检测不全的情况。
5.根据权利要求1所述的一种基于深度学习的扶梯乘客危险行为识别方法,其特征在于:在步骤5)中,对待检测视频中的乘客行为分类方法如下:
5.1)对每一帧图像使用目标检测及跟踪算法获得乘客的轨迹信息,同时对乘客的每一帧图像使用关键点提取网络提取乘客的骨架信息,从而获得乘客在连续帧内的原始骨架序列信息,如果骨架序列的帧数小于改进2S-AGCN网络缩放倍率Fcount,不进行分类,否则执行5.2);
5.2)首先利用插帧算法对骨架序列进行调整,而后将调整后的骨架序列使用归一化方法进行处理,再送入训练好的改进2S-AGCN网络进行分类,同时统计截止当前帧连续D帧的分类结果,取其中出现次数最多的类别作为该帧的行为类别,以得到稳定的分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210161104.5A CN114581843B (zh) | 2022-02-22 | 2022-02-22 | 一种基于深度学习的扶梯乘客危险行为识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210161104.5A CN114581843B (zh) | 2022-02-22 | 2022-02-22 | 一种基于深度学习的扶梯乘客危险行为识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114581843A CN114581843A (zh) | 2022-06-03 |
CN114581843B true CN114581843B (zh) | 2024-04-26 |
Family
ID=81773500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210161104.5A Active CN114581843B (zh) | 2022-02-22 | 2022-02-22 | 一种基于深度学习的扶梯乘客危险行为识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114581843B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746311B (zh) * | 2023-10-16 | 2024-08-02 | 无锡八英里电子科技有限公司 | 一种基于图像跟踪和深度学习的乘客手扶梯危险行为识别方法 |
CN117789301B (zh) * | 2023-12-28 | 2024-06-21 | 淮阴工学院 | 一种应用于车站乘客的危险动作识别方法及系统 |
CN118512173A (zh) * | 2024-07-19 | 2024-08-20 | 南昌大学第二附属医院 | 一种基于深度学习的儿童听力检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109460702A (zh) * | 2018-09-14 | 2019-03-12 | 华南理工大学 | 基于人体骨架序列的乘客异常行为识别方法 |
CN110929637A (zh) * | 2019-11-20 | 2020-03-27 | 中国科学院上海微系统与信息技术研究所 | 一种图像识别方法、装置、电子设备及存储介质 |
CN111401144A (zh) * | 2020-02-26 | 2020-07-10 | 华南理工大学 | 一种基于视频监控的手扶电梯乘客行为识别方法 |
CN113111760A (zh) * | 2021-04-07 | 2021-07-13 | 同济大学 | 基于通道注意力的轻量化图卷积人体骨架动作识别方法 |
-
2022
- 2022-02-22 CN CN202210161104.5A patent/CN114581843B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109460702A (zh) * | 2018-09-14 | 2019-03-12 | 华南理工大学 | 基于人体骨架序列的乘客异常行为识别方法 |
CN110929637A (zh) * | 2019-11-20 | 2020-03-27 | 中国科学院上海微系统与信息技术研究所 | 一种图像识别方法、装置、电子设备及存储介质 |
CN111401144A (zh) * | 2020-02-26 | 2020-07-10 | 华南理工大学 | 一种基于视频监控的手扶电梯乘客行为识别方法 |
CN113111760A (zh) * | 2021-04-07 | 2021-07-13 | 同济大学 | 基于通道注意力的轻量化图卷积人体骨架动作识别方法 |
Non-Patent Citations (1)
Title |
---|
时空域融合的骨架动作识别与交互研究;钟秋波等;《智能系统学报》;20200818(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114581843A (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114581843B (zh) | 一种基于深度学习的扶梯乘客危险行为识别方法 | |
CN110765964B (zh) | 基于计算机视觉的电梯轿厢内异常行为的检测方法 | |
CN111241959B (zh) | 一种通过工地视频流检测未佩戴安全帽人员的方法 | |
CN104063722B (zh) | 一种融合hog人体目标检测和svm分类器的安全帽识别方法 | |
CN111832608B (zh) | 一种基于单阶段检测模型yolov3的铁谱图像多磨粒识别方法 | |
CN110728225B (zh) | 一种用于考勤的高速人脸搜索方法 | |
CN113537099B (zh) | 一种公路隧道火灾烟雾动态检测方法 | |
CN111860160B (zh) | 一种室内检测口罩佩戴的方法 | |
CN110414400B (zh) | 一种施工现场安全帽穿戴自动检测方法及系统 | |
CN111209892A (zh) | 一种基于卷积神经网络的人群密度及数量估计方法 | |
CN110796643A (zh) | 一种铁轨扣件缺陷检测方法和系统 | |
CN111401311A (zh) | 一种基于图像检测的高空抛物识别方法 | |
CN113903081A (zh) | 一种水电厂图像视觉识别人工智能报警方法及装置 | |
CN109255326B (zh) | 一种基于多维信息特征融合的交通场景烟雾智能检测方法 | |
CN110781723A (zh) | 一种群体异常行为识别方法 | |
CN107483894A (zh) | 基于场景判断实现客运管理的高铁车站视频监控系统 | |
Szczodrak et al. | Behavior analysis and dynamic crowd management in video surveillance system | |
CN112651371A (zh) | 着装安全检测方法、装置、存储介质及计算机设备 | |
CN112818871A (zh) | 一种基于半分组卷积的全融合神经网络的目标检测方法 | |
CN115661757A (zh) | 一种受电弓拉弧自动检测方法 | |
CN108830882A (zh) | 视频异常行为实时检测方法 | |
CN117612249A (zh) | 一种基于改进OpenPose算法的井下矿工危险行为识别方法和装置 | |
CN104077571B (zh) | 一种采用单类序列化模型的人群异常行为检测方法 | |
CN114155551A (zh) | 基于YOLOv3改进的复杂环境下的行人检测方法及装置 | |
CN112183532A (zh) | 基于弱监督协同学习算法的安全帽识别方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |