CN111507277A

CN111507277A - 一种作业流程规范性识别模型的构建方法及应用

Info

Publication number: CN111507277A
Application number: CN202010315545.7A
Authority: CN
Inventors: 王坤; 姚兰波; 吴松; 王军燕; 张永奈; 曹世雄
Original assignee: State Grid Anhui Electric Power Co Ltd
Current assignee: State Grid Anhui Electric Power Co Ltd
Priority date: 2020-04-20
Filing date: 2020-04-20
Publication date: 2020-08-07
Anticipated expiration: 2040-04-20
Also published as: CN111507277B

Abstract

本发明提供了一种作业流程规范性识别模型的构建方法，基于历史数据建立建模数据集，包含工人的规范和非规范施工流程视频；获取视频序列中的关键点，并基于关键点的局部领域构建关键点的时空特征描述，可以有效减少视频数据规模，并且保留了有效信息；对数据集中每个视频进行时域划分，使之单个时域区间内的视频内容更具逻辑性，避免了长时序视频的处理复杂度；基于单个时域区间的关键点构建特征图，则每个视频将由一串顺序的特征图表示，既保留了空间位置信息，还包括一定时序信息；由视频的特征图序列来建模和优化SVM分类器，并应用训练后的分类器识别作业流程是否规范；可以有效应用于工人作业的操作规范流程鉴别。

Description

一种作业流程规范性识别模型的构建方法及应用

技术领域

本发明涉及基于视频数据的行为识别技术领域，尤其涉及一种作业流程规范性识别模型的构建方法及应用。

背景技术

由于不断发展的日常生活需求和各个行业用电需求，导致我国变电站呈现出数量大、分布广等特点，随之而来的管理难度也不断增加。由于变电站内的电气设备都带有高压、特高压，在对其进行日常维护、检修过程中，稍一不注意，就会引发重大安全事故，目前变电站管理引出了一套工作管理制度，对操作流程有严格的规定；但是其主要通过人工的方式进行监督，具有主观性，不能排除因监督者身体状态或精神不集中的原因导致监管不利的情况出现。为了避免和解决上述问题，我们希望利用机器来代替人工进行监管，其中最主要的就是视频监控，早期的视频监控仅仅是常规工作流程和维护的被动监控，只是相对提高了变电站工作流程和规范行为的管理效率，未对人员姿态、人员动态行为跟踪和所工作的区域及工作行为规范进行细分管理。

发明内容

本发明所要解决的技术问题在于提供一种能够同时关注行为的空间信息和时序信息的行为规范性识别模型的构建方法和应用该模型进行行为规范性识别的方法。

本发明是通过以下技术方案解决上述技术问题的：一种作业流程规范性识别模型的构建方法，包括以下步骤：

步骤A：获取工人作业的历史视频数据，并用户人工评判得到每个历史视频的标签信息；

步骤B：对所有历史视频提取时空特征点和jets描述子，并将每个历史视频划分成多个子视频；

步骤C：基于时空特征点和jets描述子为每个子视频构建特征图，基于所有子视频的特征图得到所有历史视频的特征图序列；

步骤D：将所有历史视频的特征图序列输入SVM分类器训练得到识别模型，其中SVM分类器中核函数采用动态时间规整函数DTW构建，即k(G_i,G_j)＝DTW(G_i,G_j)，G_i和G_j为任意两个历史视频的特征图序列表示。

本发明基于历史数据建立建模数据集，包含工人的规范和非规范施工流程视频；针对数据集中每个视频，采用时空特征点探测器获取视频序列中的关键点，并基于关键点的局部领域构建关键点的时空特征描述，以此可以有效减少视频数据规模，并且保留了有效信息；对数据集中每个视频进行时域划分，使之单个时域区间内的视频内容更具逻辑性，即表示一个子动作，从而避免了长时序视频的处理复杂度；然后基于单个时域区间的关键点构建特征图，其他视频区间同样类似处理，则每个视频将由一串顺序的特征图表示，即特征图序列，该表示方法不仅保留了空间位置信息，还包括一定时序信息；最后由数据集中视频的特征图序列来建模和优化SVM分类器，其中核函数是通过动态时间规整DTW函数构建；根据上述方法构建的工人作业视频特征表示及作业流程规范性识别方法，不仅包含操作行为的空间信息，还包含了时序逻辑信息，因此可以有效应用于工人作业的操作规范流程鉴别。

优选的，步骤A所述的历史视频数据还包括预处理成统一分辨率规格的步骤，得到历史视频数据集V＝{v₁,v₂,…,v_N}；基于作业标准对历史视频数据进行人工评判得到集合V的标签数据集Y＝{y₁,y₂,…,y_N}，其中v_i和y_i表示第i个作业视频和对应的标签信息，N为数据集规模。

优选的，步骤B中使用3D-Harris角点探测器提取所述时空特征点和jets描述子，

计算时空特征点：将一个历史视频看做一个函数映射

即f(x,y,t)，表示t时刻视频帧图像中(x,y)处的像素值；

为了得到时空尺度上不变的时空特征点，需要将视频与高斯核函数进行卷积操作，得到视频f(x,y,t)在时空尺度上的表达式

其中，

表示空间尺度，

表示时间尺度，高斯核函数的形式为

对

进行一阶求偏导形成3×3的矩阵，并用高斯函数对其进行加权得到：

其中L_x、L_y和L_t为函数L(·)关于x、y和t的一阶偏导，

根据矩阵的特征值得到函数H：

H＝det(μ)-k·trace³(μ)＝λ₁λ₂λ₃-k·(λ₁+λ₂+λ₃)³

其中det(μ)为矩阵的行列式计算，trace(μ)为矩阵的迹，特征值λ₁、λ₂和λ₃的大小体现了该点在时空邻域内的变化强度，在不同的时空尺度下，视频中的任意时空点均能计算出对应的H值，如果H值大于预设的阈值则该点为时空特征点；

计算jets特征描述子：将时空特征点对应的

进行1-4阶求偏导数，其数学表示为：

jet＝(L_x,L_y,L_t

L_xx,L_xy,L_xt,L_yy,L_yt,L_tt

L_xxx,L_xxy,L_xxt,L_xyy,L_xyt,L_xtt,L_yyy,L_yyt,L_ytt,L_ttt

从而得到将jets描述子表示为34维特征向量。

优选的，步骤B中将历史视频划分为多个子视频的方法为：

步骤I：利用光流算法得到历史视频v_i的水平方向光流场Ι_x和垂直方向光流场Ι_y，针对光流帧f_j中任意一个像素q，分别计算q的角度θ_q和幅度ψ_q

接着在帧f_i上以水平向右为起始方向，逆时针每隔

度作为统计区间，共形成χ个方向的光流幅度统计，得到χ维度的光流统计直方图

作为光流帧f_j的特征表示，则历史视频v_i可以表示为

其中M为历史视频v_i的光流帧总数；

步骤II：对历史视频逐帧比较相似度，将相邻帧的相似度转化为对应光流统计直方图

和

的比较，即

当

大于事先设定的阈值时，对历史视频进行一次划分，由此将历史视频v_i划分为K_i个子视频。

优选的，步骤C中为子视频构建特征图的方法为：

如果第i个历史视频的第l个子视频

中存在S个时空特征点P＝{p₁,p₂,···,p_s}，则以这些时空特征点为顶点构建全连接图，边权为

其中

表示p_j和p_k的欧式距离，则子视频

的特征图用矩阵表示为

其中S为图的顶点数；则历史视频v_i的特征图序列表示为

优选的，步骤D所述的利用SVM分类器训练识别模型的方法为：

将历史视频的特征图序列G_i和标签数据集Y输入到SVM分类器中，SVM分类器的目标函数为：

其中，W、b为待求解的分类高维超平面的参数，φ(·)为映射函数；将上述问题的求解转化为其对偶的最优化问题，得到

其中α_i为拉格朗日乘子，定义核函数为k(G_i,G_k)＝φ(G_i)^Tφ(G_k)，则上述优化问题转化为：

约束条件不变；

利用DTW计算G_i和G_k的对齐程度作为核函数，即k(G_i,G_k)＝DTW(G_i,G_k)；以φ(·)为规整函数，则G_i和G_k的对齐可以描述子视频序号的对齐，

其中κ(r)∈[1,A]，υ(r)∈[1,B]，A＝|G_i|，B＝|G_k|，R＝A+B，r∈[1,R]；＜κ(r),υ(r)＞表示G_i的第κ(r)个子视频与G_k的第υ(r)个子视频的对齐序号对；通过寻找最优的规整函数φ(·)使得DTW(G_i,G_k)达到最小，实现G_i和G_k的对齐；

其中，

子视频特征图

和

的匹配计分，DTW(G_i,G_k)数值越小，表示特征图序列G_i和G_k越相似，即视频v_i和v_k越相似。

优选的，Γ(·,·)的计算方法为：

以g_α和g_β表示两个子视频的特征图，g_α和g_β的顶点数分别为m和n，匹配矩阵表示为X∈{0,1}^m×n，其元素x_ij＝1表示g_α的第i个顶点与g_β的第j个顶点匹配，反之x_ij＝0表示g_α的第i个顶点与g_β的第j个顶点不匹配；

记集合Ω＝{(u,u′)|u∈g_α,u′∈g_β}，|Ω|＝m*n，表示两个特征图中顶点之间所有可能对应的关系，以Ω中元素为顶点构建亲近关系矩阵M，其规模为|Ω|*|Ω|；矩阵中的元素为

M(a,b),a＝(u,u′)；b＝(z,z′)；u,z∈gα；u′,z′∈g_β

表示不同图结构顶点的匹配关系；从而将图匹配问题转化为一个带约束的优化问题：

其中，x为匹配矩阵X的列主序向量化为一个0-1指派向量，得到的最优指派向量为x^*，即x^*(t)＝1表示Ω中第t个元素是正确的对应关系，反之则不匹配；

在求解过程中将x取值范围松弛到实数，同时对M进行特征值分解，得到最大特征值对应的特征向量x′，再将x′逆序主序向量化为m×n的矩阵X′，首先寻找矩阵X′中的最大值，并将其所在行和所在列的其他元素赋值为0，接着找次最大值，同样对所在行与所在列其他元素赋值为0，以此类推执行min{m,n}次，保留前min{m,n}个最大值，剩下其他元素全部赋值为0；最后对X′中非0元素赋值为1，并对其主序向量化得到近似最优的指派向量x^*，根据公式Γ(g_α,g_β)＝(x^*)^TMx^*得到子视频特征图g_α和g_β的匹配计分。

本发明还提供了一种应用所述作业流程规范性识别模型进行作业流程规范性识别的方法，对待识别的视频经过步骤B和C的处理得到对应的特征图序列表示，并输入训练好的SVM分类器中进行识别，得到识别结果。

本发明提供的作业流程规范性识别模型的构建方法及应用的优点在于：基于历史数据建立建模数据集，包含工人的规范和非规范施工流程视频；针对数据集中每个视频，采用时空特征点探测器获取视频序列中的关键点，并基于关键点的局部领域构建关键点的时空特征描述，以此可以有效减少视频数据规模，并且保留了有效信息；对数据集中每个视频进行时域划分，使之单个时域区间内的视频内容更具逻辑性，即表示一个子动作，从而避免了长时序视频的处理复杂度；然后基于单个时域区间的关键点构建特征图，其他视频区间同样类似处理，则每个视频将由一串顺序的特征图表示，该表示方法不仅保留了空间位置信息，还包括一定时序信息；最后由数据集中视频的特征图序列来建模和优化SVM分类器，其中核函数是通过动态时间规整DTW函数构建；根据上述方法构建的工人作业视频特征表示及作业流程规范性识别方法，不仅包含操作行为的空间信息，还包含了时序逻辑信息，因此可以有效应用于工人作业的操作规范流程鉴别。

附图说明

图1为本发明的实施例提供的作业流程规范性识别模型构建方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明作进一步的详细说明。

如图1所示，本实施例提供了一种作业流程规范性识别模型的构建方法，包括以下步骤：

为了获取工作作业视频，需要在作业现场布置摄影装置，并将视频处理成统一分辨率规格，可采用现有技术中的插值法或下采样方法对视频帧处理成统一的高度和宽度，历史视频内容要尽量多样性，尽可能包括更多的作业工况，最终的到的历史视频数据集记为V＝{v₁,v₂,…,v_N}；基于作业标准对历史视频数据进行人工评判得到集合V的标签数据集Y＝{y₁,y₂,…,y_N}，其中v_i和y_i表示第i个作业视频和对应的标签信息，y_i＝1表示历史视频v_i为合格操作，如果y_i＝-1则表示历史视频v_i为不合格操作；N为数据集规模。

本实施例中使用3D-Harris角点探测器提取所述时空特征点和jets描述子，3D-Harris特征点检测具有尺度不变性，用来检测像素值在局部时空邻域内三个方向(2个空间方法和1个时域方向)上有显著变化的位置，从而得到相应的时空特征点；句、具体方法如下：

计算时空特征点：将一个历史视频看做一个函数映射

即f(x,y,t)，表示t时刻视频帧图像中(x,y)处的像素值；

其中，

表示空间尺度，

表示时间尺度，高斯核函数的形式为

对

其中L_x、L_y和L_t为函数L(·)关于x、y和t的一阶偏导，

本实施例中选取的数值为

根据矩阵特征值得到函数H：

H＝det(μ)-k·trace³(μ)＝λ₁λ₂λ₃-k·(λ₁+λ₂+λ₃)³

其中det(μ)为矩阵的行列式计算，trace(μ)为矩阵的迹，特征值λ₁、λ₂和λ₃的大小体现了该点在时空邻域内的变化强度，本实施例中常数k的取值范围为[0.04，0.06]；在不同的时空尺度下，视频中的任意时空点均能计算出对应的H值，如果H值大于预设的阈值则该点为时空特征点，其中H值的阈值为经验值。

计算jets特征描述子：将时空特征点对应的

进行1-4阶求偏导数，其数学表示为：

jet＝(L_x,L_y,L_t

L_xx,L_xy,L_xt,L_yy,L_yt,L_tt

L_xxx,L_xxy,L_xxt,L_xyy,L_xyt,L_xtt,L_yyy,L_yyt,L_ytt,L_ttt

从而得到将jets描述子表示为34维特征向量。

将历史视频划分为多个子视频的方法为：

接着在帧f_i上以水平向右为起始方向，逆时针每隔

作为光流帧f_j的特征表示，则历史视频v_i可以表示为

其中M为历史视频v_i的光流帧总数；

和

的比较，即

当

为子视频构建特征图的方法为：如果第i个历史视频的第l个子视频

其中

表示p_j和p_k的欧式距离，则子视频

的特征图用矩阵表示为

其中S为图的顶点数；则历史视频v_i的特征图序列表示为

步骤D：将所有历史视频的特征图序列输入SVM分类器训练得到识别模型，其中SVM分类器中核函数采用动态时间规整函数DTW构建，即k(G_i,G_j)＝DTW(G_i,G_j)，G_i和G_j为任意两个历史视频的特征图序列表示；具体方法如下：

约束条件不变；

其中，

为子视频特征图

和

的匹配计分，DTW(G_i,G_k)数值越小，表示特征图序列G_i和G_k越相似，即视频v_i和v_k越相似。本实施例在计算时，对于任意r，令权重

于是时序归一化因子C＝R。

其中匹配计分Γ(·,·)的计算方法如下：

M(a,b),a＝(u,u′)；b＝(z,z′)；u,z∈gα；u′,z′∈g_β

在训练完成SVM分类器的情况下，本实施例还进一步提供了应用该SVM分类器进行作业流程规范性识别的方法，具体为将待识别的视频经过步骤B和C的处理得到对应的特征图序列，并输入训练好的SVM分类器中即可得到识别结果。

本实施例基于历史数据建立建模数据集，包含工人的规范和非规范施工流程视频；针对数据集中每个视频，采用时空特征点探测器获取视频序列中的关键点，并基于关键点的局部领域构建关键点的时空特征描述，以此可以有效减少视频数据规模，并且保留了有效信息；对数据集中每个视频进行时域划分，使之单个时域区间内的视频内容更具逻辑性，即表示一个子动作，从而避免了长时序视频的处理复杂度；然后基于单个时域区间的关键点构建特征图，其他视频区间同样类似处理，则每个视频将由一串顺序的特征图表示，该表示方法不仅保留了空间位置信息，还包括一定时序信息；最后由数据集中视频的特征图序列来建模和优化支持向量机((Support Vector Machine,SVM))分类器，其中核函数是通过动态时间规整(Dynamic Time Warping，DTW)函数构建。根据上述方法构建的工人作业视频特征表示及作业流程规范性识别方法，不仅包含操作行为的空间信息，还包含了时序逻辑信息，因此可以有效应用于工人作业的操作规范流程鉴别。

本实施提供的方法能够自识别工人作业流程的规范性，并给出预警与提示，进而促进工人作业效率、规范性和安全性的提高；视频特征表示既包含了空间结构信息，有包含了时序性信息，同时显著压缩了要处理的视频数据规模，提高了算法效率；本实施例提供的方法可扩展性强，可以兼容不同的相似度度量方法、距离度量方法，图结构方法和时序对齐方法，并且本实施例包含的信息更加全面，避免了传统方法很难兼顾行为的空间信息和时序信息。

Claims

1.一种作业流程规范性识别模型的构建方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种作业流程规范性识别模型的构建方法，其特征在于：步骤A所述的历史视频数据还包括预处理成统一分辨率规格的步骤，得到历史视频数据集V＝{v₁,v₂,···,v_N}；基于作业标准对历史视频数据进行人工评判得到集合V的标签数据集Y＝{y₁,y₂,···,y_N}，其中v_i和y_i表示第i个作业视频和对应的标签信息，N为数据集规模。

3.根据权利要求2所述的一种作业流程规范性识别模型的构建方法，其特征在于：步骤B中使用3D-Harris角点探测器提取所述时空特征点和jets描述子，

计算时空特征点：将一个历史视频看做一个函数映射