CN111046727B

CN111046727B - 视频特征提取方法及装置、电子设备及存储介质

Info

Publication number: CN111046727B
Application number: CN201911057051.7A
Authority: CN
Inventors: 向阳; 顾文扬; 王宁; 苏赟; 熊尚威; 李琳; 徐嵩; 贾磊
Original assignee: Migu Cultural Technology Co Ltd; China Mobile Communications Group Co Ltd
Current assignee: Migu Cultural Technology Co Ltd; China Mobile Communications Group Co Ltd
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2023-10-20
Anticipated expiration: 2039-10-31
Also published as: CN111046727A

Abstract

本发明涉及图像处理领域，公开了一种视频特征提取方法及装置、电子设备及存储介质，其中，视频特征提取方法，包括：获取待检测视频中第k帧视频帧作为检测视频帧，k为大于1的正整数；计算所述检测视频帧各个像素点的行间差值累计值和列间差值累计值；基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域；对多个所述矩形候选区域进行筛选，确定目标区域；对所述目标区域进行视频特征提取。本发明实施方式所提供的视频特征提取方法及装置、电子设备及存储介质，具有减少黑边及画中画对视频特征提取的影响，提升视频特征提取的准确性的优点。

Description

视频特征提取方法及装置、电子设备及存储介质

技术领域

本发明涉及图像处理领域，特别涉及一种视频特征提取方法及装置、电子设备及存储介质。

背景技术

在移动互联网时代，视频内容的传播呈现出国际化、移动化和社交化的趋势。庞大的社交平台在实现视频内容快速传播的同时，也加快了侵权视频的传播速度，给版权检测带来了巨大的挑战。目前，针对视频的版权检测通常基于视频指纹特征的搜索原理进行。视频指纹特征是从视频序列中抽取的标识符，用来代表视频文件的电子标识，能够将一个视频片段与其他视频片段区分开的特征向量。在对视频进行版权检测时，将待检测视频的关键帧视频特征，包括颜色、纹理、形状提取出来，和版权样本库的视频指纹特征进行快速比对，当比对出相同或相似的视频指纹特征时，可初步锁定侵权视频内容。

然而，现有技术中的待检测视频与原始视频相比，往往经过了多次的剪辑、转码、色彩调整、台标、字幕、黑边及画中画等变换。尤其对于黑边和画中画处理后的待检测视频，会造成提取出的视频特征和原始视频的视频指纹相比偏差较大，难以实现准确比对。

发明内容

本发明实施方式的目的在于提供一种视频特征提取方法及装置、电子设备及存储介质，有效减少黑边及画中画对视频特征提取的影响，提升视频特征提取的准确性。

为解决上述技术问题，本发明的实施方式提供了一种视频特征提取方法，包括以下步骤：获取待检测视频中第k帧视频帧作为检测视频帧，k为大于1的正整数；计算所述检测视频帧各个像素点的行间差值累计值和列间差值累计值；基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域；对多个所述矩形候选区域进行筛选，确定目标区域；对所述目标区域进行视频特征提取。

本发明的实施方式还提供了一种视频特征提取装置，包括：视频帧提取模块，用于获取待检测视频中第k帧视频帧作为检测视频帧，k为大于1的正整数；区域提取模块，用于计算所述检测视频帧各个像素点的行间差值累计值和列间差值累计值，并基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域；区域筛选模块，用于对多个所述矩形候选区域进行筛选，确定目标区域；特征提取模块，用于对所述目标区域进行视频特征提取。

本发明的实施方式还提供了一种电子设备，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如前述的视频特征提取方法。

本发明的实施方式还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现如前述的视频特征提取方法。

本发明的实施方式相对于现有技术而言，通过对检测视频帧中各个像素点的行间差值累计值和列间差值累计值的计算，确定多个矩形候选区域，通过对矩形候选区域的筛选，定位目标区域，可以有效的减少目标区域中黑边和画中画，减少黑边和画中画对视频特征提取的影响；此外，由于后续仅对目标区域进行视频提取，还可以有效的提升了视频特征的提取速度。

另外，所述计算所述检测视频帧中各个像素点的行间差值累计值和列间差值累计值，具体包括：计算得到各个所述像素点[i,j]的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]；根据所述平滑行间差值S_r[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的行间差值累计值C_r[i,j]；根据所述平滑列间差值S_c[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的列间差值累计值C_c[i,j]。

另外，所述计算得到各个所述像素点[i,j]的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]，具体包括：计算得到各个所述像素点[i,j]的行间差值、列间差值和帧间差值；根据预设平滑常数和所述行间差值，计算得到所述平滑行间差值；根据所述预设平滑常数和所述列间差值，计算得到所述平滑列间差值；根据所述预设平滑常数和所述帧间差值，计算得到所述平滑帧间差值。在计算行间差值累计值和列间差值累计值时，结合了反映运动目标的帧间差值，有效减少了目标区域中的黑边和画中画，提升了目标区域确定的准确度。

另外，所述计算得到各个所述像素点的行间差值累计值C_r[i,j]，具体包括：初始化所述检测视频帧中各行的首个像素点[i,1]的行间差值累计值C_r[i,1]，根据公式C_r[i,j]＝C_r[i,j-1]+clamp(w_r[i,j-1]·S_r[i,j-1])计算得到各个所述像素点处[i,j]的行间差值累计值C_r[i,j]；其中，w_r[i,j-1]＝min(1,max(S_f[i-1,j-1],S_f[i,j-1])/64)，

clamp(w_r[i,j-1]·S_r[i,j-1])＝X₀·w_r[i,j-1]·S_r[i,j-1]/(X₀+w_r[i,j-1]·S_r[i,j-1])，X₀为常数；所述计算得到各个所述像素点的列间差值累计值C_c[i,j]，具体包括：初始化所述检测视频帧中各列的首个像素点[1,j]的列间差值累计值C_c[1,j]，根据公式C_c[i,j]＝C_c[i-1,j]+

clamp(w_c[i-1,j]·S_c[i-1,j])计算得到各个所述像素点[i,j]的列间累计值C_c[i,j]；其中，

w_c[i-1,j]＝min(1,max(S_f[i-1,j-1],S_f[i-1,j])/64)，

clamp(w_c[i-1,j]·S_r[i-1,j])＝X₀·w_c[i-1,j]·S_r[i-1,j]/(X₀+w_c[i-1,j]·S_r[i-1,j])。

另外，所述对多个所述矩形候选区域进行筛选，具体包括：去除不满足预设条件的所述矩形候选区域；若存在剩余的所述矩形候选区域，将剩余的所述矩形候选区域中面积最大者作为所述目标区域；若不存在剩余的所述矩形候选区域，将所述检测视频帧作为所述目标区域。

另外，所述去除不满足预设条件的所述矩形候选区域，具体包括：去除高度小于预设高度、或宽度小于预设宽度、或宽高比不属于预设宽高比取值范围、或不包含所述检测视频帧中心像素、或边缘得分小于预设边缘得分的所述矩形候选区域；其中，所述边缘得分根据各个所述矩形候选区域的顶点像素点的行间差值累计值h和列间差值累计值计算得到。

另外，所述基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域，具体包括：获取第W列的全部像素点中、列间差值累计值较大的多个像素点作为第二目标像素点，获取各个所述第二目标像素点的行数作为候选行，其中W为所述检测视频帧的最大列数；获取第H行的全部像素点中、行间差值累计值较大的多个像素点作为第一目标像素点，获取各个所述第一目标像素点的列数作为候选列，其中H为所述检测视频帧的最大行数；基于任意两个所述候选行和任意两个所述候选列，形成矩形候选区域，得到多个所述矩形候选区域。基于第W列和第H行的特点进行筛选，按行以及按列进行处理，相对于按像素点来确定目标区域的方法来说，运算量有明显下降，预处理速度更快，可实现实时处理。

附图说明

图1是本发明第一实施方式所提供的视频特征提取方法的程序流程图；

图2是本发明第一实施方式所提供的视频特征提取方法中计算行间差值累计值的程序流程图；

图3是本发明第一实施方式所提供的视频特征提取方法中计算列间差值累计值的程序流程图；

图4是本发明第二实施方式所提供的视频特征提取装置的结构示意图；

图5是本发明第三实施方式所提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请所要求保护的技术方案。

本发明的第一实施方式涉及一种视频特征提取方法，具体流程如图1所示，包括以下步骤：

步骤S101：获取待检测视频中第k帧视频帧作为检测视频帧。

具体的，在本步骤中，对待检测视频进行解码，获取待检测视频中的多个视频帧，按照时间顺序对多个视频帧进行排序，取排序后的第k帧视频帧作为检测视频帧。

进一步的，在本实施方式中，待检测视频可以包括，但不限于：音乐视频、短视频、电视剧、电影、综艺节目视频、动漫视频等等。

优选的，在本实施方式中，k为大于1的正整数，即避免提取到待检测视频的第一帧视频帧。为了避免提取到了待检测视频的第一帧视频帧，所述获取待检测视频中的多个视频帧包括：获取待检测视频的时长；在该时长的预设范围(大于零且小于100％)内随机获取多个视频帧。

例如，假设待检测视频的时长为1分钟，预设范围为时长的30％至80％的时间内，则从待检测视频的第18秒(1分钟·30％)至第48秒(1分钟·80％)之间获取多个视频帧。

步骤S102：计算检测视频帧各个像素点的行间差值累计值和列间差值累计值。

具体的，在本步骤中，计算行间差值累计值的步骤如图2所示，包括以下步骤：

步骤S201：计算得到各个像素点[i,j]的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]。

具体的，在本实施方式中，如图3所示，包括以下步骤：

步骤S301：初始化各个像素点[i,j](i为像素点所在的行数，i为正整数，j为像素点所在的列数，j为正整数)的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]。

具体的，在本步骤中，获取检测视频帧后，首先初始化各个像素点[i,j]的平滑行间差值S_r[i,j]＝0、平滑列间差值S_c[i,j]＝0、平滑帧间差值S_f[i,j]＝0。可以理解的是，初始化平滑行间差值S_r[i,j]＝0、平滑列间差值S_c[i,j]＝0、平滑帧间差值S_f[i,j]＝0仅为本实施方式中的一种具体的举例说明，并不构成限定，在本发明的其它实施方式中，也可以是初始化为1、2、3等其它数值，在此不进行一一列举，具体可以根据实际需要进行灵活的设置。

步骤S302：计算各个像素点[i,j]的行间差值D_r[i,j]、列间差值D_c[i,j]和帧间差值D_f[i,j]。

具体的，行间差值D_r[i,j]等于像素点[i,j]和像素点[i-1,j]的像素差值。其中，像素差值计算公式为：对于两个像素I[i,j]和I[i',j']来说，设其RGB值分别为(R,G,B)和(R',G',B')，其中，R,R',G,G',B,B'均处于0到255之间，定义这两个像素I[i,j]和I[i',j']的像素差值dist(I[i,j],I[i',j'])为：dist(Ik[i,j],Ik'[i',j'])＝min(64,max(|R-R'|,|G-G'|,|B-B'|))。

因此，行间差值D_r[i,j]的计算公式如下：

D_r[i,j]＝dist(I_k[i,j],I_k[i-1,j]),i＝0,...,H,j＝0,...,W-1

以及，列间差值D_c[i,j]等于像素点[i,j]和像素点[i,j-1]的像素差值，计算公式如下：

D_c[i,j]＝dist(I_k[i,j],I_k[i,j-1]),i＝0,...,H-1,j＝0,...,W

进一步的，在本步骤中，帧间差值D_f[i,j]等于第k-1帧视频帧中的像素点[i,j]和第k帧视频帧中的像素点[i,j]的像素差值的平方，计算公式如下：

D_f[i,j]＝dist(I_k[i,j],I_k-1[i,j])²,i＝0,...,H-1,j＝0,...,W-1

需要说明的是，如果i,j不同时处于0<＝i<＝H-1,0<＝j<＝W-1的范围内，则规定相应像素I_k[i,j]为全黑，其RGB值均为0。

步骤S303：根据预设平滑常数和行间差值，计算得到平滑行间差值。

具体的，在本步骤中，计算像素点[i,j]的平滑行间差值S_r[i,j]的具体计算公式为：S_r[i,j]:＝S_r[i,j]+(D_r[i,j]-S_r[i,j])/min(k+1,K₀)，即将S_r[i,j]+(D_r[i,j]-S_r[i,j])/min(k+1,K₀)赋值给S_r[i,j]，从而更新像素点[i,j]的平滑行间差值S_r[i,j]。

步骤S304：根据预设平滑常数和列间差值，计算得到平滑列间差值。

具体的，在本步骤中，计算像素点[i,j]的平滑列间差值S_c[i,j]的具体计算公式为：S_c[i,j]:＝S_c[i,j]+(D_c[i,j]-S_c[i,j])/min(k+1,K₀)，即将S_c[i,j]+(D_c[i,j]-S_c[i,j])/min(k+1,K₀)赋值给S_c[i,j]，从而更新像素点[i,j]的平滑列间差值S_c[i,j]。

步骤S305：根据预设平滑常数和帧间差值，计算得到平滑帧间差值。

进一步的，计算像素点[i,j]的平滑帧间差值S_f[i,j]的具体计算公式为：S_f[i,j]:＝S_f[i,j]+(D_f[i,j]-S_f[i,j])/min(k,K₀)，即将S_f[i,j]+(D_f[i,j]-S_f[i,j])/min(k,K₀)的计算结果赋值给S_f[i,j]，从而更新像素点[i,j]的平滑帧间差值S_f[i,j]。

其中，K₀为常数。其单位为帧。例如对于25帧/秒的待检测视频，K₀可取为30秒内的帧数，即750。

步骤S202：根据所述平滑行间差值S_r[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的行间差值累计值C_r[i,j]。

具体的，在本步骤中，首先，初始化检测视频帧中各行的首个像素点[i,1]的行间差值累计值C_r[i,1]。在本步骤中，初始化C_r[i,1]＝0。可以理解的是，初始化C_r[i,1]＝0仅为本实施方式中的一种具体的举例说明，并不构成限定，在本发明的其它实施方式中，也可以是初始化为1、2、3等其它数值，在此不进行一一列举，具体可以根据实际需要进行灵活的设置。

然后，根据公式C_r[i,j]＝C_r[i,j-1]+clamp(w_r[i,j-1]·S_r[i,j-1])计算得到各个所述像素点处的行间差值累计值C_r[i,j]，其中，w_r[i,j-1]＝min(1,max(S_f[i-1,j-1],S_f[i,j-1])/64)，clamp(w_r[i,j-1]·S_r[i,j-1])＝X₀·w_r[i,j-1]·S_r[i,j-1]/(X₀+w_r[i,j-1]·S_r[i,j-1])，X₀为常数。

具体的，在本实施方式中，X₀＝16。可以理解的是，X₀＝16仅为本实施方式中的一种具体的举例说明，并不构成限定，在本发明的其它实施方式中，也可以是32、64等其它数值，在此不进行一一列举，具体可以根据实际需要进行灵活的设置。

步骤S203：根据所述平滑列间差值S_c[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的列间差值累计值C_c[i,j]。

具体的，在本步骤中，首先，初始化检测视频帧中各列的首个像素点[1,j]的列间差值累计值C_c[1,j]。在本步骤中，初始化C_c[1,j]＝0。可以理解的是，初始化C_c[1,j]＝0仅为本实施方式中的一种具体的举例说明，并不构成限定，在本发明的其它实施方式中，也可以是初始化为1、2、3等其它数值，在此不进行一一列举，具体可以根据实际需要进行灵活的设置。

然后，根据公式C_c[i,j]＝C_c[i-1,j]+clamp(w_c[i-1,j]·S_c[i-1,j])计算得到各个所述像素点[i,j]处的列间累计值C_c[i,j]；其中，w_c[i-1,j]＝min(1,max(S_f[i-1,j-1],S_f[i-1,j])/64)，clamp(w_c[i-1,j]·S_r[i-1,j])＝X₀·w_c[i-1,j]·S_r[i-1,j]/(X₀+w_c[i-1,j]·S_r[i-1,j])，X₀为常数。

步骤S103：基于行间差值累计值和列间差值累计值、确定多个矩形候选区域。

具体的，在本实施方式中，获取第W列的全部像素点中、列间差值累计值较大的多个像素点作为第二目标像素点，获取各个第二目标像素点的行数作为候选行，其中W为检测视频帧的最大列数。获取第H行的全部像素点中、行间差值累计值较大的多个像素点作为第一目标像素点，获取各个第一目标像素点的列数作为候选列，其中H为检测视频帧的最大行数；基于任意两个候选行和任意两个候选列、形成矩形候选区域，得到多个矩形候选区域。

进一步的，在本实施方式中，获取列间差值累计值较大的N个像素点作为第二目标像素点，其中，N＝min(H,16)；获取行间差值累计值较大的M个像素点作为第一目标像素点，其中，M＝min(W+1,16)。可以理解的是，上述仅为本实施方式中的一种具体的举例说明，并不构成限定，在本发明的其它实施方式中，也可以是其它数量的第一目标像素点和第二目标像素点，在此不进行一一列举，具体可以根据实际需要进行灵活的设定。

基于第W列和第H行的特点进行筛选，按行以及按列进行处理，相对于按像素点来确定目标区域的方法来说，运算量有明显下降，预处理速度更快，可实现实时处理。

步骤S104：对多个矩形候选区域进行筛选，确定目标区域。

具体的，在本步骤中，去除不满足预设条件的矩形候选区域；若存在剩余的矩形候选区域，将剩余的矩形候选区域中面积最大者作为目标区域；若不存在剩余的矩形候选区域，将检测视频帧作为所述目标区域。

进一步的，在本实施方式中，预设条件为高度大于或等于预设高度、且宽度大于或等于预设宽度、且宽高比属于预设宽高比取值范围、且包含检测视频帧的中心像素。也就是说，去除不满足预设条件的矩形候选区域即为，去除高度小于预设高度、或宽度小于预设宽度、或宽高比不属于预设宽高比取值范围、或不包含检测视频帧中心像素的矩形候选区域。可以理解的是，上述仅为本实施方式中的一种具体的举例说明，在本发明的其它实施方式中，也可以是选取其中的一个或多个条件作为预设条件，例如，仅去除不包含检测视频帧中心像素的矩形候选区域等，具体可以根据实际需要进行灵活的设定，在此不进行一一列举。

优选的，在本实施方式中，预设条件也可以为矩形候选区域的边缘得分大于或等于预设边缘得分。其中，边缘得分可以根据各个矩形候选区域的顶点像素的行间差值累计值和顶点像素的列间差值累计值计算得到。具体计算方法为：根据公式u_r＝(C_r[i,j']-C_r[i,j])/(j'-j)、u_r'＝(C_r[i',j']-C_r[i',j])/(j'-j)、uc＝(C_c[i',j]-C_c[i,j])/(i'-i)、uc'＝(C_c[i',j']-C_c[i,j'])/(i'-i)，分别计算得到矩形候选区域的上边缘得分u_r、下边缘得分u_r'、左边缘得分u_c、以及右边缘得分u_c'。其中，[i,j]、[i,j']、[i',j]、[i',j']分别为矩形候选区域的四个顶点像素，i和i'为顶点像素所在的行数，i和i'为正整数，j和j'为所述顶点像素所在的列数，j和j'为正整数。去除不满足预设条件的矩形候选区域为，去除上边缘得分u_r、下边缘得分u_r'、左边缘得分u_c、以及右边缘得分u_c'中任意一者小于预设边缘得分的矩形候选区域。

在本实施方式中，预设边缘得分等于8。可以理解的是，预设边缘得分等于8仅为本实施方式中的一种具体的举例说明，并不构成限定，在本发明的其它实施方式中，预设边缘得分也可以是等于16、32等其它数值，在此不进行一一列举，具体可以根据实际需要进行灵活的设定。

步骤S105：对目标区域进行视频特征提取。

具体的，在本实施方式中，将目标区域转化为灰度图像；计算灰度图像中的像素的平均值；当灰度图像内的像素的值大于或者等于平均值时，将该像素的值确定为1；当灰度图像内的像素的值小于平均值时，将该像素的值确定为0；将灰度图像内的像素的值进行组合后得到灰度图像的视频特征。

与现有技术相比，本发明第一实施方式所提供的视频特征提取方法通过对检测视频帧中各个像素点的行间差值累计值和列间差值累计值的计算，确定多个矩形候选区域，通过对矩形候选区域的筛选，定位目标区域，可以有效的减少目标区域中黑边和画中画，减少黑边和画中画对视频特征提取的影响；此外，由于后续仅对目标区域进行视频提取，还可以有效的提升了视频特征的提取速度。

本发明第二实施方式涉及一种视频特征提取装置，如图4所示，包括：视频帧提取模块401，视频帧提取模块401用于获取待检测视频中第k帧视频帧作为检测视频帧，k为大于1的正整数。与视频帧提取模块401相连的区域提取模块402，区域提取模块402用于计算所述检测视频帧各个像素点的行间差值累计值和列间差值累计值，并基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域。与区域提取模块402相连的区域筛选模块403，区域筛选模块403用于对多个所述矩形候选区域进行筛选，确定目标区域。与区域筛选模块403相连的特征提取模块404，特征提取模块404用于对所述目标区域进行视频特征提取。

与现有技术相比，本发明第二实施方式所提供的视频特征提取装置通过视频帧提取模块401提取检测视频帧；然后通过区域提取模块402对检测视频帧中各个像素点的行间差值累计值和列间差值累计值的计算，确定多个矩形候选区域；再然后通过区域筛选模块403对矩形候选区域进行筛选，定位目标区域，可以有效的减少目标区域中黑边和画中画，减少黑边和画中画对视频特征提取的影响；此外，由于后续特征提取模块404仅需要对目标区域进行视频提取，还可以有效的提升了视频特征的提取速度。

本发明第三实施方式涉及一种电子设备，如图5所示，包括：至少一个处理器501；以及，与至少一个处理器501通信连接的存储器502；其中，存储器502存储有可被至少一个处理器501执行的指令，指令被至少一个处理器501执行，以使至少一个处理器501能够执行如上述视频特征提取方法。

其中，存储器502和处理器501采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器501和存储器502的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器501处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器501。

处理器501负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器502可以被用于存储处理器501在执行操作时所使用的数据。

本发明第四实施方式涉及一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

1.一种视频特征提取方法，其特征在于，包括：

获取待检测视频中第k帧视频帧作为检测视频帧，k为大于1的正整数；

计算所述检测视频帧各个像素点的行间差值累计值和列间差值累计值；

基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域；

对多个所述矩形候选区域进行筛选，确定目标区域；

对所述目标区域进行视频特征提取；

所述计算所述检测视频帧中各个像素点的行间差值累计值和列间差值累计值，具体包括：

计算得到各个所述像素点[i,j]的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]；

根据所述平滑行间差值S_r[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的行间差值累计值C_r[i,j]；

根据所述平滑列间差值S_c[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的列间差值累计值C_c[i,j]；

所述计算得到各个所述像素点[i,j]的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]，具体包括：

计算得到各个所述像素点[i,j]的行间差值、列间差值和帧间差值；

根据预设平滑常数和所述行间差值，计算得到所述平滑行间差值；

根据所述预设平滑常数和所述列间差值，计算得到所述平滑列间差值；

根据所述预设平滑常数和所述帧间差值，计算得到所述平滑帧间差值。

2.根据权利要求1所述的视频特征提取方法，其特征在于，所述计算得到各个所述像素点的行间差值累计值C_r[i,j]，具体包括：

初始化所述检测视频帧中各行的首个像素点[i,1]的行间差值累计值C_r[i,1]，根据公式C_r[i,j]＝C_r[i,j-1]+clamp(w_r[i,j-1]·S_r[i,j-1])计算得到各个所述像素点处[i,j]的行间差值累计值C_r[i,j]；

其中，w_r[i,j-1]＝min(1,max(S_f[i-1,j-1],S_f[i,j-1])/64)，

clamp(w_r[i,j-1]·S_r[i,j-1])＝X₀·w_r[i,j-1]·S_r[i,j-1]/(X₀+w_r[i,j-1]·S_r[i,j-1])，X₀为常数；

所述计算得到各个所述像素点的列间差值累计值C_c[i,j]，具体包括：

初始化所述检测视频帧中各列的首个像素点[1,j]的列间差值累计值C_c[1,j]，根据公式C_c[i,j]＝C_c[i-1,j]+clamp(w_c[i-1,j]·S_c[i-1,j])计算得到各个所述像素点[i,j]的列间累计值C_c[i,j]；

其中，w_c[i-1,j]＝min(1,max(S_f[i-1,j-1],S_f[i-1,j])/64)，clamp(w_c[i-1,j]·S_r[i-1,j])＝X₀·w_c[i-1,j]·S_r[i-1,j]/(X₀+w_c[i-1,j]·S_r[i-1,j])。

3.根据权利要求1所述的视频特征提取方法，其特征在于，所述对多个所述矩形候选区域进行筛选，具体包括：

去除不满足预设条件的所述矩形候选区域；

若存在剩余的所述矩形候选区域，将剩余的所述矩形候选区域中面积最大者作为所述目标区域；

若不存在剩余的所述矩形候选区域，将所述检测视频帧作为所述目标区域。

4.根据权利要求3所述的视频特征提取方法，其特征在于，所述去除不满足预设条件的所述矩形候选区域，具体包括：

去除高度小于预设高度、或宽度小于预设宽度、或宽高比不属于预设宽高比取值范围、或不包含所述检测视频帧中心像素、或边缘得分小于预设边缘得分的所述矩形候选区域；

其中，所述边缘得分根据各个所述矩形候选区域的顶点像素点的行间差值累计值h和列间差值累计值计算得到。

5.根据权利要求1所述的视频特征提取方法，其特征在于，所述基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域，具体包括：

获取第W列的全部像素点中、列间差值累计值较大的多个像素点作为第二目标像素点，获取各个所述第二目标像素点的行数作为候选行，其中W为所述检测视频帧的最大列数；

获取第H行的全部像素点中、行间差值累计值较大的多个像素点作为第一目标像素点，获取各个所述第一目标像素点的列数作为候选列，其中H为所述检测视频帧的最大行数；

基于任意两个所述候选行和任意两个所述候选列，形成矩形候选区域，得到多个所述矩形候选区域。

6.一种视频特征提取装置，其特征在于，包括：

视频帧提取模块，用于获取待检测视频中第k帧视频帧作为检测视频帧，k为大于1的正整数；

区域提取模块，用于计算所述检测视频帧各个像素点的行间差值累计值和列间差值累计值，并基于所述行间差值累计值和所述列间差值累计值，确定多个矩形候选区域；

计算得到各个所述像素点[i,j]的平滑行间差值S_r[i,j]、平滑列间差值S_c[i,j]和平滑帧间差值S_f[i,j]；根据所述平滑行间差值S_r[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的行间差值累计值C_r[i,j]；根据所述平滑列间差值S_c[i,j]和所述平滑帧间差值S_f[i,j]，计算得到各个所述像素点的列间差值累计值C_c[i,j]；

所述计算得到各个所述像素点[i,j]的平滑行间差值Sr[i,j]、平滑列间差值Sc[i,j]和平滑帧间差值Sf[i,j]，具体包括：

计算得到各个所述像素点[i,j]的行间差值、列间差值和帧间差值；根据预设平滑常数和所述行间差值，计算得到所述平滑行间差值；根据所述预设平滑常数和所述列间差值，计算得到所述平滑列间差值；根据所述预设平滑常数和所述帧间差值，计算得到所述平滑帧间差值；

区域筛选模块，用于对多个所述矩形候选区域进行筛选，确定目标区域；

特征提取模块，用于对所述目标区域进行视频特征提取。

7.一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至5中任一所述的视频特征提取方法。

8.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的视频特征提取方法。