CN117557893A

CN117557893A - 一种基于残差峰值的静态场景视频真伪鉴定方法及装置

Info

Publication number: CN117557893A
Application number: CN202410039271.1A
Authority: CN
Inventors: 徐一波; 陈友斌; 申意萍; 张志坚
Original assignee: Hubei Micropattern Technology Development Co ltd
Current assignee: Hubei Micropattern Technology Development Co ltd
Priority date: 2024-01-11
Filing date: 2024-01-11
Publication date: 2024-02-13

Abstract

本发明公开一种基于残差峰值的静态场景视频真伪鉴定方法及装置，涉及静态场景视频真伪鉴定技术领域，首先，使用解码器对一段视频流进行解码，得到连续多帧的视频流图像。然后，检测者选择一个需要检测的静态视频画面矩形区域，通常是视频中的背景区域，并从多帧的视频流图像画面中都截取该区域，得到同等尺寸的连续多帧的局部画面。接下来，计算相邻两帧的像素点数值的残差，得到一组残差图像，并计算各残差图像残差绝对值峰值的均值M。最后，查看根据M是否超过既定阈值，超过则判定为真实视频，否则判定为伪造视频。

Description

一种基于残差峰值的静态场景视频真伪鉴定方法及装置

技术领域

本发明涉及静态场景视频真伪鉴定技术领域，尤其是涉及一种基于残差峰值的静态场景视频真伪鉴定方法及装置。

背景技术

近年来，随着数字图像的广泛应用，在视频的可信度和内容的保护方面提出了越来越高的要求。

随着AIGC技术的发展，视频制作技术变得越来越先进，但同时也带来了伪造视频的泛滥。伪造视频是指通过技术手段对原始视频进行篡改、合成或重制，以达到误导观众、传播虚假信息、诈骗等目的。这些伪造视频可能涉及经济、社会等各个领域，对人们的生活和社会秩序造成严重影响。针对伪造视频的检测具有重要意义。现有的伪造视频的检测很多基于声学或光学一致性完成，往往需要结合动态的目标进行检验。运动目标一般会引入较大的信号噪声，影响检测效果。

因此亟需设计一种针对静态背景视频合成检测方法，提升对于利用图片或AIGC生成的静态伪造视频画面的检测效果。

发明内容

为了解决传统视频真伪检测技术对于静态背景视频合成检测效果较差的技术问题，本发明提供一种基于残差峰值的静态场景视频真伪鉴定方法及装置。采用如下的技术方案：

一种基于残差峰值的静态场景视频真伪鉴定方法，包括以下步骤：

步骤1，解码视频帧，对待检测静态场景视频流进行解码得到多帧视频流画面；

步骤2，截取像素矩阵，对步骤1的多帧视频流画面分别截取同一局部区域画面，并分别截取局部区域画面的像素构造矩阵；

步骤3，计算相邻残差峰值，分别根据多帧局部区域画面的像素构造矩阵计算得到残差矩阵，计算所有残差矩阵的各自峰值，并求峰值均值；

步骤4，真伪判定，设定真伪判断阈值，将步骤3中所得峰值均值与真伪判断阈值进行比较，若峰值均值小于真伪判断阈值，则判断待检测静态场景视频是伪造视频，反之则判断待检测静态场景视频是真实拍摄视频。

通过采用上述技术方案，规避了现有常规视频真伪鉴定算法中存在的运动目标信号对视频真伪鉴定的干扰作用，充分挖掘静态画面区域对真伪鉴定的贡献作用，分析视频静态场景中帧画面内容局部单一像素跳动幅度，并建立一个量化模型加以区分真伪视频在静态区域画面单个像素跳动幅度的差异性，相比机器学习等方法具有速度快、泛化性更好的优点。

可选的，步骤1的具体方法是：使用解码器对一段待检测静态场景视频流进行解码，得到连续n帧的视频流画面，分别记为。

通过采用上述技术方案，得到连续n帧的视频流画面为后续的像素矩阵截取提供有效初始数据。

可选的，步骤2的具体方法是：从连续n帧的视频流画面中分别截取同一设定局部区域画面，得到同等尺寸的连续n帧的局部区域画面，分别取局部区域画面的像素构造矩阵，分别记为/>。

可选的，局部区域画面是矩形区域，且局部区域画面的选取避开动态区域。

通过采用上述技术方案，具体检测时，需要选择一个静态视频画面矩形局部区域画面，局部区域画面通常是视频中的背景画面，并从多帧的视频流画面中都截取该区域，得到同等尺寸的连续n帧的局部画面，取画面的像素构造矩阵，记为，虽然是静态视频画面的真伪检测，但是实际上还是会存在时间流等动态区域，该裁剪过程可以有效去除视频中动态的画面，仅仅保留纯静态的画面内容，便于后续进行静态画面是否存在伪造判定。

可选的，步骤3的具体方法是：

分别对步骤2中获得的局部区域画面的像素构造矩阵计算图像像素矩阵的残差，可得到n-1个残差矩阵：

；

计算所有残差矩阵的各自峰值，并求峰值均值M：

；

其中是对矩阵/>元素求绝对值，/>是求矩阵/>中最大的元素，峰值均值M代表相邻视频帧像素扰动幅度。

通过采用上述技术方案，规避了现有常规视频真伪鉴定算法中存在的运动目标信号对视频真伪鉴定的干扰作用，充分挖掘静态画面区域对真伪鉴定的贡献作用，分析视频静态场景中帧画面内容局部单个像素跳动幅度，并建立一个量化模型加以区分真伪视频在静态区域画面单个像素跳动幅度的差异性，相比机器学习等方法具有速度快、泛化性更好的优点。

可选的，步骤4的具体方法是：设定真伪判断阈值T，将步骤3中所得峰值均值M与真伪判断阈值T进行比较，若M＜T，则判断待检测静态场景视频是伪造视频，若M≥T则判断待检测静态场景视频是真实拍摄视频。

通过采用上述技术方案，将步骤3中所得峰值均值与阈值T进行比较，小于阈值T时表明视频静态画面相邻帧的像素差异较小，视频帧几乎无扰动，重复性很高，可判定为计算机合成的伪造视频。反之，说明视频帧在局部范围内存在较大的像素扰动，属于摄像头拍摄的真实拍摄视频。

一种基于残差峰值的静态场景视频真伪鉴定装置，包括数据录入模块、存储器、视觉处理芯片和处理器，所述数据录入模块与存储器通信连接，用于向存储器录入待检测静态场景视频流，所述存储器预装有根据一种基于残差峰值的静态场景视频真伪鉴定方法设计的静态场景视频真伪鉴定程序，视觉处理芯片和处理器和分别与存储器通信连接，视觉处理芯片调用存储器的待检测静态场景视频流执行解码视频帧和截取像素矩阵的视觉处理步骤，所述处理器与视觉处理芯片通信连接，基于视觉处理芯片的分析处理结果，运行静态场景视频真伪鉴定程序得出静态场景视频真伪鉴定结果。

可选的，还包括显示器，所述显示器与处理器通信连接，用于显示静态场景视频真伪鉴定程序的判断结果。

通过上述技术方案，可以实现对待检测静态场景视频流的输入后的自动分析检测，自动输出检测结果，并进行显示。

综上所述，本发明包括以下至少有益技术效果：

本发明能提供一种基于残差峰值的静态场景视频真伪鉴定方法及装置，能高效的对静态场景视频进行真伪鉴定，规避了现有常规视频真伪鉴定算法中存在的运动目标信号对视频真伪鉴定的干扰作用，充分挖掘静态画面区域对真伪鉴定的贡献作用，分析视频静态场景中帧画面内容局部单一像素跳动幅度，并建立一个量化模型加以区分真伪视频在静态区域画面单个像素跳动幅度的差异性，相比机器学习等方法具有速度快、泛化性更好的优点。

附图说明

图1是本发明一种基于残差峰值的静态场景视频真伪鉴定方法的流程示意图；

图2是本发明一种基于残差峰值的静态场景视频真伪鉴定装置的各部件连接示意图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

本发明实施例公开一种基于残差峰值的静态场景视频真伪鉴定方法及装置。

参照图1和图2，一种基于残差峰值的静态场景视频真伪鉴定方法，包括以下步骤：

步骤1的具体方法是：使用解码器对一段待检测静态场景视频流进行解码，得到连续n帧的视频流画面，分别记为。

步骤2的具体方法是：从连续n帧的视频流画面中分别截取同一设定局部区域画面，得到同等尺寸的连续n帧的局部区域画面，分别取局部区域画面的像素构造矩阵，分别记为/>。

局部区域画面是矩形区域，且局部区域画面的选取避开动态区域。

步骤3的具体方法是：

；

计算所有残差矩阵的各自峰值，并求峰值均值M：

；

步骤4的具体方法是：设定真伪判断阈值T，将步骤3中所得峰值均值M与真伪判断阈值T进行比较，若M＜T，则判断待检测静态场景视频是伪造视频，若M≥T则判断待检测静态场景视频是真实拍摄视频。

一种基于残差峰值的静态场景视频真伪鉴定装置，包括数据录入模块、存储器、视觉处理芯片和处理器，数据录入模块与存储器通信连接，用于向存储器录入待检测静态场景视频流，存储器预装有根据一种基于残差峰值的静态场景视频真伪鉴定方法设计的静态场景视频真伪鉴定程序，视觉处理芯片和处理器和分别与存储器通信连接，视觉处理芯片调用存储器的待检测静态场景视频流执行解码视频帧和截取像素矩阵的视觉处理步骤，处理器与视觉处理芯片通信连接，基于视觉处理芯片的分析处理结果，运行静态场景视频真伪鉴定程序得出静态场景视频真伪鉴定结果。

还包括显示器，显示器与处理器通信连接，用于显示静态场景视频真伪鉴定程序的判断结果。

可以实现对待检测静态场景视频流的输入后的自动分析检测，自动输出检测结果，并进行显示。

具体实施例，这里以一段监控视频画面为例进行说明：

解码视频帧：使用解码器对一段640×480视频流进行解码，得到连续5帧的视频流画面，记为。

截取亮度矩阵：选择一个不包括顶部区域动态区域的640×440画面内容，顶部区域动态区域的画面内容为动态的计时器区域；

得到同等尺寸的连续5帧的640×440的局部区域画面。

这里取画面的亮度像素构造矩阵，也还可以取其他颜色分量，即亮度矩阵，记为；

计算相邻残差峰值：计算相邻亮度矩阵的残差，可得到4个640×440残差图像，即残差矩阵。

计算所有残差矩阵的各自峰值，并求峰值均值M。

;

真伪判定：将步骤3中所得峰值均值M与阈值T（如取20）进行比较，小于阈值T时表明视频静态画面相邻帧的像素差异较小，视频帧几乎无扰动，重复性很高，可判定为计算机合成。反之，说明视频帧在局部范围内存在较大的像素扰动，属于摄像头拍摄。

以上均为本发明的较佳实施例，并非以此限制本发明的保护范围，故：凡依本发明的结构、形状、原理所做的等效变化，均应涵盖于本发明的保护范围之内。

Claims

1.一种基于残差峰值的静态场景视频真伪鉴定方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于残差峰值的静态场景视频真伪鉴定方法，其特征在于，步骤1的具体方法是：使用解码器对一段待检测静态场景视频流进行解码，得到连续n帧的视频流画面，分别记为。

3.根据权利要求2所述的一种基于残差峰值的静态场景视频真伪鉴定方法，其特征在于，步骤2的具体方法是：从连续n帧的视频流画面中分别截取同一设定局部区域画面，得到同等尺寸的连续n帧的局部区域画面，分别取局部区域画面的像素构造矩阵，分别记为/>。

4.根据权利要求3所述的一种基于残差峰值的静态场景视频真伪鉴定方法，其特征在于，局部区域画面是矩形区域，且局部区域画面的选取避开动态区域。

5.根据权利要求3所述的一种基于残差峰值的静态场景视频真伪鉴定方法，其特征在于，步骤3的具体方法是：

；

计算所有残差矩阵的各自峰值，并求峰值均值M：

；

6.根据权利要求3所述的一种基于残差峰值的静态场景视频真伪鉴定方法，步骤4的具体方法是：设定真伪判断阈值T，将步骤3中所得峰值均值M与真伪判断阈值T进行比较，若M＜T，则判断待检测静态场景视频是伪造视频，若M≥T则判断待检测静态场景视频是真实拍摄视频。

7.一种基于残差峰值的静态场景视频真伪鉴定装置，其特征在于：包括数据录入模块、存储器、视觉处理芯片和处理器，所述数据录入模块与存储器通信连接，用于向存储器录入待检测静态场景视频流，所述存储器预装有根据权利要求6所述的方法设计的静态场景视频真伪鉴定程序，视觉处理芯片和处理器和分别与存储器通信连接，视觉处理芯片调用存储器的待检测静态场景视频流执行解码视频帧和截取像素矩阵的视觉处理步骤，所述处理器与视觉处理芯片通信连接，基于视觉处理芯片的分析处理结果，运行静态场景视频真伪鉴定程序得出静态场景视频真伪鉴定结果。

8.根据权利要求7所述的一种基于残差峰值的静态场景视频真伪鉴定装置，其特征在于：还包括显示器，所述显示器与处理器通信连接，用于显示静态场景视频真伪鉴定程序的判断结果。