CN116962851A

CN116962851A - 多媒体版权保护方法及装置

Info

Publication number: CN116962851A
Application number: CN202211574706.XA
Authority: CN
Inventors: 徐荣蓉; 包岩; 周晓阳; 应葆华; 陈鹏飞; 赵丹怀
Original assignee: China Mobile Zijin Jiangsu Innovation Research Institute Co ltd; China Mobile Communications Group Co Ltd; China Mobile Group Jiangsu Co Ltd; China Mobile Communications Ltd Research Institute
Current assignee: China Mobile Zijin Jiangsu Innovation Research Institute Co ltd; China Mobile Communications Group Co Ltd; China Mobile Group Jiangsu Co Ltd; China Mobile Communications Ltd Research Institute
Priority date: 2022-12-08
Filing date: 2022-12-08
Publication date: 2023-10-27

Abstract

本申请涉及多媒体领域，提供一种多媒体版权保护方法及装置。所述方法包括：解码并分离待保护多媒体，得到待保护音频流和待保护视频流；根据直方图‑局部二进制模式场景分类算法提取待保护视频流的场景特征，根据场景特征得到第一水印；将第一水印嵌入待保护音频流，得到含水印音频流；根据含水印音频流生成第二水印；将第二水印嵌入待保护视频流，得到含水印视频流；根据含水印音频流和含水印视频流，得到含水印多媒体。本申请实施例提供的多媒体版权保护方法及装置以音视频全局特征生成第一水印和第二水印，并形成水印生成和嵌入的相互嵌套，提高水印对音视频流的各种篡改操作的敏感性，进而提高水印的完整性保护能力。

Description

多媒体版权保护方法及装置

技术领域

本申请涉及多媒体技术领域，具体涉及一种多媒体版权保护方法及装置。

背景技术

一直以来，加密和数字水印技术是数字版权保护的主要手段。加密技术是在数据传输过程中通过加密算法将多媒体数据转变成不可理解的数据，从而达到版权保护的目的，但加密数据解码成功后与原始数据相同并且不再具有保护能力，因此加密技术不能从根本上解决侵权问题。

数字水印技术是通过嵌入算法将认证信息嵌入到多媒体数据中，常见的操作(传输、复制等)并不会对嵌入的信息造成影响，一般在数字媒体的存活周期内具有版权认证的能力，但现有的数字技术大多依赖音视频流的局部特征生成水印，因此对音视频流的各种篡改操作敏感性较差，导致水印的完整性保护能力较弱。

发明内容

本申请实施例提供一种多媒体版权保护方法及装置，用以解决现有的数字技术大多依赖音视频流的局部特征生成水印，因此对音视频流的各种篡改操作敏感性较差，导致水印的完整性保护能力较弱的技术问题。

第一方面，本申请实施例提供一种多媒体版权保护方法，包括：

解码并分离待保护多媒体，得到待保护音频流和待保护视频流；

根据直方图-局部二进制模式场景分类算法提取所述待保护视频流的场景特征，根据所述场景特征得到第一水印；

将所述第一水印嵌入所述待保护音频流，得到含水印音频流；

根据所述含水印音频流生成第二水印；

将所述第二水印嵌入所述待保护视频流，得到含水印视频流；

根据所述含水印音频流和所述含水印视频流，得到含水印多媒体。

在一个实施例中，所述根据直方图-局部二进制模式场景分类算法提取所述待保护视频流的场景特征，包括：

利用直方图场景分类算法对所述待保护视频流进行场景分类，得到直方图帧间差值和；

利用局部二进制模式场景分类算法对所述待保护视频流进行场景分类，得到纹理图谱帧间差值和；

根据所述直方图帧间差值和与所述纹理图谱帧间差值和的调和平均数，提取所述待保护视频流的场景特征。

在一个实施例中，所述将所述第一水印嵌入所述待保护音频流，得到含水印音频流，包括：

解码所述待保护音频流，得到音频流数据；

将所述音频流数据中的左声道数据进行非重叠分帧，得到待处理音频帧数据；

对所述待处理音频帧数据进行三层离散小波变换，得到多个第一低频系数；

对所述多个第一低频系数进行排序，按照排序将所述多个第一低频系数进行分组，通过修改前一组中排序最后的第一低频系数，在每组中嵌入1比特所述第一水印的数据，得到含水印低频系数组；

合并所有含水印低频系数组，得到含水印低频系数集；

根据所述含水印低频系数集经过离散小波逆变换后的数据，得到含水印音频流。

在一个实施例中，所述根据所述含水印音频流生成第二水印，包括：

提取所述含水印音频流的一维MFCC系数，按照特定长度对所述一维MFCC系数进行分割，得到多个MFCC系数段；

根据每个MFCC系数段的方差生成对应的数字水印，并将所有数字水印进行合并，得到所述第二水印。

在一个实施例中，所述将所述第二水印嵌入所述待保护视频流，得到含水印视频流，包括：

根据所述场景特征对所述待保护视频流进行分割，得到L个待处理视频场景；其中，L为大于等于2的整数；

将所述第二水印分割为L个第二水印片段，并在每个第二水印片段末尾处添加结束标志位；

针对所述L个待处理视频场景中的任一视频帧，按照所述任一视频帧各区域的显著性不同进行区域划分，排除显著性最大的三个区域，得到所述任一视频帧的第一非显著区域；

对所述第一非显著区域的亮度分量进行8*8的离散余弦变换，得到第一直流系数，通过修改每个待处理视频场景中各视频帧的第一直流系数将所述L个第二水印片段一一对应嵌入所述L个待处理视频场景中，得到含水印视频场景集；

对所述含水印视频场景集进行离散余弦逆变换，将逆变换后的含水印视频场景集进行合并，得到含水印视频流。

在一个实施例中，所述得到含水印多媒体之后，包括：

解码并分离所述含水印多媒体，得到待验证音频流和待验证视频流；

根据直方图-局部二进制模式场景分类算法对所述待验证视频流进行场景分割，得到L个待验证视频场景；

针对任一待验证视频场景中的前三个视频帧，按照任一视频帧各区域的显著性不同进行区域划分，排除显著性最大的三个区域，得到所述任一视频帧的第二非显著区域；

对所述第二非显著区域的亮度分量进行8*8的离散余弦变换，得到第二直流系数，通过任一待验证视频场景中前三个视频帧的第二直流系数分别提取所述前三个视频帧上的水印片段，直到遇到所述结束标志位时停止提取；

将所述L个待验证视频场景按照时间由先到后进行排序；

根据排序由先到后对相邻两个待验证视频场景的待验证第二水印片段进行取舍；

若第l个待验证视频场景中的第i个待验证第二水印片段w_l(i)与第l-1个待验证视频场景中的第i个待验证第二水印片段w_l-1(i)不相同，则保留w_l(i)和w_l-1(i)；其中，l为大于等于2且小于等于L的整数，i为大于等于1的整数，w_l(i)是根据第l个待验证视频场景中的前三个视频帧上的水印片段得到的；

若第l个待验证视频场景中的第i个待验证第二水印片段w_l(i)与第l-1个待验证视频场景中的第i个待验证第二水印片段w_l-1(i)相同，则保留w_l(i)，舍弃w_l-1(i)；

利用l+1替代l后，返回根据排序由先到后对相邻两个待验证视频场景的待验证第二水印片段进行取舍的步骤，直到l＝L时，完成所有相邻两个待验证视频场景的待验证第二水印片段的取舍；

将所有保留的待验证第二水印片段进行合并，得到待验证第二水印；

从区块链获取预先存储的所述含水印多媒体的可信第二水印，若所述待验证第二水印与所述可信第二水印不一致，则确定所述待验证音频流被篡改，定位篡改类型和篡改位置。

在一个实施例中，所述从区块链获取预先存储的所述含水印多媒体的可信第二水印之后，包括：

若所述待验证第二水印与所述可信第二水印一致，则确定所述待验证音频流未被篡改；

将所述待验证音频流中的左声道数据进行非重叠分帧，得到待验证音频帧数据；

对所述待验证音频帧数据进行三层离散小波变换，得到多个第二低频系数；

对所述多个第二低频系数进行排序，按照排序将所述多个第二低频系数进行分组；

根据任一组内第二低频系数的平均值与所述任一组之前一组中排序最后的第二低频系数之间的关系，在所述任一组内提取待验证第一水印片段；

将所有待验证第一水印片段进行合并，得到待验证第一水印；

从区块链获取预先存储的所述含水印多媒体的可信第一水印，若所述待验证第一水印与所述可信第一水印不一致，则确定所述待验证视频流被篡改，定位篡改类型和篡改位置。

第二方面，本申请实施例提供一种多媒体版权保护装置，包括：

解码分离模块，用于：解码并分离待保护多媒体，得到待保护音频流和待保护视频流；

第一水印生成模块，用于：根据直方图-局部二进制模式场景分类算法提取所述待保护视频流的场景特征，根据所述场景特征得到第一水印；

含水印音频流生成模块，用于：将所述第一水印嵌入所述待保护音频流，得到含水印音频流；

第二水印生成模块，用于：根据所述含水印音频流生成第二水印；

含水印视频流生成模块，用于：将所述第二水印嵌入所述待保护视频流，得到含水印视频流；

含水印多媒体生成模块，用于：根据所述含水印音频流和所述含水印视频流，得到含水印多媒体。

第三方面，本申请实施例提供一种电子设备，包括处理器和存储有计算机程序的存储器，所述处理器执行所述程序时实现第一方面所述的多媒体版权保护方法的步骤。

第四方面，本申请实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现第一方面所述的多媒体版权保护方法的步骤。

本申请提供的多媒体版权保护方法及装置，先解码并分离待保护多媒体，得到待保护音频流和待保护视频流，再根据直方图-局部二进制模式场景分类算法提取待保护视频流的场景特征，根据场景特征得到第一水印，再将第一水印嵌入待保护音频流，得到含水印音频流，再根据含水印音频流生成第二水印，将第二水印嵌入待保护视频流，得到含水印视频流，最后根据含水印音频流和含水印视频流，得到含水印多媒体。本申请利用待保护视频流的场景特征得到第一水印，将第一水印嵌入待保护音频流，再根据嵌入第一水印的待保护音频流生成第二水印，再将第二水印嵌入待保护视频流，以音视频全局特征生成第一水印和第二水印，并形成水印生成和嵌入的相互嵌套，提高水印对音视频流的各种篡改操作的敏感性，进而提高水印的完整性保护能力。

附图说明

为了更清楚地说明本申请或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的多媒体版权保护方法的流程示意图之一；

图2是本申请实施例提供的多媒体版权保护方法的流程示意图之二；

图3是本申请实施例提供的多媒体版权保护方法的流程示意图之三；

图4是本申请实施例提供的多媒体版权保护方法的流程示意图之四；

图5是本申请实施例提供的多媒体版权保护方法的流程示意图之五；

图6是本申请实施例提供的多媒体版权保护方法的流程示意图之六；

图7是本申请实施例提供的多媒体版权保护方法的流程示意图之七；

图8为本申请实施例提供的多媒体版权保护装置的结构示意图；

图9是本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1是本申请实施例提供的多媒体版权保护方法的流程示意图之一。参照图1，本申请实施例提供一种多媒体版权保护方法，可以包括：

101、解码并分离待保护多媒体，得到待保护音频流和待保护视频流；

102、根据直方图-局部二进制模式场景分类算法提取待保护视频流的场景特征，根据场景特征得到第一水印；

103、将第一水印嵌入待保护音频流，得到含水印音频流；

104、根据含水印音频流生成第二水印；

105、将第二水印嵌入待保护视频流，得到含水印视频流；

106、根据含水印音频流和含水印视频流，得到含水印多媒体。

步骤102中，可以将场景特征进行置乱后，再根据置乱后的场景特征得到第一水印，提高第一水印的保密性。

本实施例提供的多媒体版权保护方法，先解码并分离待保护多媒体，得到待保护音频流和待保护视频流，再根据直方图-局部二进制模式场景分类算法提取待保护视频流的场景特征，根据场景特征得到第一水印，再将第一水印嵌入待保护音频流，得到含水印音频流，再根据含水印音频流生成第二水印，将第二水印嵌入待保护视频流，得到含水印视频流，最后根据含水印音频流和含水印视频流，得到含水印多媒体。本实施例利用待保护视频流的场景特征得到第一水印，将第一水印嵌入待保护音频流，再根据嵌入第一水印的待保护音频流生成第二水印，再将第二水印嵌入待保护视频流，以音视频全局特征生成第一水印和第二水印，并形成水印生成和嵌入的相互嵌套，提高水印对音视频流的各种篡改操作的敏感性，进而提高水印的完整性保护能力。

图2是本申请实施例提供的多媒体版权保护方法的流程示意图之二。参照图2，在一个实施例中，根据直方图-局部二进制模式场景分类算法提取待保护视频流的场景特征，可以包括：

201、利用直方图场景分类算法对待保护视频流进行场景分类，得到直方图帧间差值和；

202、利用局部二进制模式场景分类算法对待保护视频流进行场景分类，得到纹理图谱帧间差值和；

203、根据直方图帧间差值和与纹理图谱帧间差值和的调和平均数，提取待保护视频流的场景特征。

步骤201中，直方图场景分类算法能够直观地描述图像中不同的颜色值所占的比重，是表达图像颜色特征的主要方法。在进行视频场景分类时，运用直方图场景分类算法对视频连续两帧进行灰度值统计，然后通过比较两帧的直方图帧间差值和与门限(经验值)的大小，判断视频场景是否发生变换，其缺点是在颜色相似例如沙滩和沙漠的情况下难以分辨场景不同。本步骤中的直方图帧间差值和即为待保护视频流中，加总所有连续两帧的直方图帧间差值，得到的直方图帧间差值和。

步骤202中，局部二进制模式场景分类算法的基本思想是将每个像素点的灰度值与其邻域内的各灰度值做比较，相邻像素点灰度值较中心点小的设为0，反之设为1，然后把这串二进制数，转换成十进制灰度值，最后计算出相邻两帧间的纹理图谱帧间差值和与经验值比较，判断视频场景转换，其缺点在于无法区分纹理相同、颜色不同的场景，例如黑色和白色场景。本步骤中的纹理图谱帧间差值和即为待保护视频流中，加总所有相邻两帧的纹理图谱帧间差值，得到的纹理图谱帧间差值和。

步骤203中，可以根据以下公式计算直方图帧间差值和与纹理图谱帧间差值和的调和平均数：

其中，D_H-LBP为直方图帧间差值和与纹理图谱帧间差值和的调和平均数，Ds为直方图帧间差值和，DLs为纹理图谱帧间差值和。

将D_H-LBP与门限值(经验值0.18)进行比较，若D_H-LBP大于门限值，则确定场景发生改变，反之，确定场景未发生改变，据此识别并提取待保护视频流的场景特征。

在实际应用中，步骤201和步骤202之间没有严格的时序关系；即，可同时执行，或任一步骤先执行，具体根据实际需求而定，此处不做限定。

本实施例利用直方图-局部二进制模式场景分类算法提取待保护视频流的场景特征，对比直方图场景分类算法和局部二进制模式场景分类算法，能够从颜色特征与纹理特征两方面判断场景是否发生改变，有效地解决了直方图场景分类算法在颜色相似场景中的漏检，以及在内容变化快的场景中的误检，并且弥补了局部二进制模式场景分类算法在场景颜色特征检测上的不足。

图3是本申请实施例提供的多媒体版权保护方法的流程示意图之三。参照图3，在一个实施例中，将第一水印嵌入待保护音频流，得到含水印音频流，可以包括：

301、解码待保护音频流，得到音频流数据；

302、将音频流数据中的左声道数据进行非重叠分帧，得到待处理音频帧数据；

303、对待处理音频帧数据进行三层离散小波变换，得到多个第一低频系数；

304、对多个第一低频系数进行排序，按照排序将多个第一低频系数进行分组，通过修改前一组中排序最后的第一低频系数，在每组中嵌入1比特第一水印的数据，得到含水印低频系数组；

305、合并所有含水印低频系数组，得到含水印低频系数集；

306、根据含水印低频系数集经过离散小波逆变换后的数据，得到含水印音频流。

步骤302中，可以将音频流数据中的左声道数据按照每1600帧进行非重叠分帧。

步骤303中，对待处理音频帧数据进行三层离散小波变换，也可以得到多个高频系数。

步骤304中，可以按照时间先后顺序对多个第一低频系数进行排序，当多个第一低频系数的长度一共为200比特时，按照排序将多个第一低频系数分为10组，每组20个系数，每个系数的长度1比特。通过修改前一组中排序最后的第一低频系数，在每组中嵌入1比特第一水印的数据，例如，第一组中有第1至第20个第一低频系数，第二组中有第21至第40个第一低频系数，以此类推，通过修改第一组的第20个第一低频系数，在第二组中嵌入1比特第一水印的数据。

需要说明的时，还可以根据同样的步骤对音频流数据中的右声道数据进行处理，得到完整的含水印音频流。

本实施例通过对低频系数进行分组分别嵌入部分第一水印，完成对整个第一水印的嵌入，能够提高水印嵌入效率，且在水印被攻击时，能够定位被攻击位置。

图4是本申请实施例提供的多媒体版权保护方法的流程示意图之四。参照图4，在一个实施例中，根据含水印音频流生成第二水印，可以包括：

401、提取含水印音频流的一维MFCC系数，按照特定长度对一维MFCC系数进行分割，得到多个MFCC系数段；

402、根据每个MFCC系数段的方差生成对应的数字水印，并将所有数字水印进行合并，得到第二水印。

MFCC系数，即Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient，MFCC)，Mel频率是基于人耳听觉特性提出来的，它与赫兹频率成非线性对应关系。MFCC则是利用它们之间的这种关系，计算得到的赫兹频谱特征，MFCC已经广泛地应用在语音识别领域。由于Mel频率与赫兹频率之间非线性的对应关系，使得MFCC随着频率的提高，其计算精度随之下降。因此，在应用中常常只使用低频MFCC，而丢弃中高频MFCC。

步骤401中，可以按照64比特长度对一维MFCC系数进行分割。

步骤402中，可以根据每个MFCC系数段的方差生成编码，该编码即为对应的数字水印，具体可以基于以下公式生成编码：

其中，T为编码，即数字水印，D(n)为第n个MFCC系数段的方差，n为大于等于1的整数，M为所有MFCC系数段的方差的平均数。

本实施例能够根据多个MFCC系数段的方差进行编码，并将该编码作为对应的数字水印，再将多个数字水印合并得到第二水印。

图5是本申请实施例提供的多媒体版权保护方法的流程示意图之五。参照图5，在一个实施例中，将第二水印嵌入待保护视频流，得到含水印视频流，可以包括：

501、根据场景特征对待保护视频流进行分割，得到L个待处理视频场景；

其中，L为大于等于2的整数；

502、将第二水印分割为L个第二水印片段，并在每个第二水印片段末尾处添加结束标志位；

503、针对L个待处理视频场景中的任一视频帧，按照任一视频帧各区域的显著性不同进行区域划分，排除显著性最大的三个区域，得到任一视频帧的第一非显著区域；

504、对第一非显著区域的亮度分量进行8*8的离散余弦变换，得到第一直流系数，通过修改每个待处理视频场景中各视频帧的第一直流系数将L个第二水印片段一一对应嵌入L个待处理视频场景中，得到含水印视频场景集；

505、对含水印视频场景集进行离散余弦逆变换，将逆变换后的含水印视频场景集进行合并，得到含水印视频流。

步骤502中，前L-1个第二水印片段的长度可以为第一特定整数，最后一个第二水印片段的长度可以为第一特定整数与第二特定整数的和；第一特定整数为第二水印总长度除以L的商，第二特定整数为第二水印总长度除以L的余数，结束标志位的长度可以为8比特。

步骤503中，可以利用Itti视觉显著模型对L个待处理视频场景中的每一帧进行显著性分析，针对L个待处理视频场景中的任一视频帧，按照任一视频帧各区域的显著性不同进行区域划分，排除显著性最大的三个区域，得到任一视频帧的第一非显著区域；

Itti视觉显著模型是根据早期灵长类动物的视觉神经系统设计的一种视觉注意模型。该模型首先利用高斯采样方法构建图像的颜色、亮度和方向的高斯金字塔，然后利用高斯金字塔计算图像的亮度特征图、颜色特征图和方向特征图，最后结合不同尺度的特征图即可获得亮度、颜色和方向显著图，相加得到最终的视觉显著图。

步骤504中，可以利用二进制奇偶量化调制算法，通过修改每个待处理视频场景中各视频帧的第一直流系数将L个第二水印片段一一对应嵌入L个待处理视频场景中。

本实施例通过将待保护视频流和第二水印进行分割，并将分割后得到的第二水印片段一一对应嵌入分割后得到的待处理视频场景中，能够提高水印嵌入效率，且在水印被攻击时，能够定位被攻击位置。

图6是本申请实施例提供的多媒体版权保护方法的流程示意图之六。参照图6，在一个实施例中，得到含水印多媒体之后，得到含水印视频流，可以包括：

601、解码并分离含水印多媒体，得到待验证音频流和待验证视频流；

602、根据直方图-局部二进制模式场景分类算法对待验证视频流进行场景分割，得到L个待验证视频场景；

603、针对任一待验证视频场景中的前三个视频帧，按照任一视频帧各区域的显著性不同进行区域划分，排除显著性最大的三个区域，得到任一视频帧的第二非显著区域；

604、对第二非显著区域的亮度分量进行8*8的离散余弦变换，得到第二直流系数，通过任一待验证视频场景中前三个视频帧的第二直流系数分别提取前三个视频帧上的水印片段，直到遇到结束标志位时停止提取；

605、将L个待验证视频场景按照时间由先到后进行排序；

606、根据排序由先到后对相邻两个待验证视频场景的待验证第二水印片段进行取舍；

607、若第l个待验证视频场景中的第i个待验证第二水印片段w_l(i)与第l-1个待验证视频场景中的第i个待验证第二水印片段w_l-1(i)不相同，则保留w_l(i)和w_l-1(i)；

其中，l为大于等于2且小于等于L的整数，i为大于等于1的整数，w_l(i)是根据第l个待验证视频场景中的前三个视频帧上的水印片段得到的；

608、若第l个待验证视频场景中的第i个待验证第二水印片段w_l(i)与第l-1个待验证视频场景中的第i个待验证第二水印片段w_l-1(i)相同，则保留w_l(i)，舍弃w_l-1(i)；

609、利用l+1替代l后，返回步骤606，直到l＝L时，完成所有相邻两个待验证视频场景的待验证第二水印片段的取舍；

610、将所有保留的待验证第二水印片段进行合并，得到待验证第二水印；

611、从区块链获取预先存储的含水印多媒体的可信第二水印，若待验证第二水印与可信第二水印不一致，则确定待验证音频流被篡改，定位篡改类型和篡改位置。

步骤602中，可以利用Itti视觉显著模型对L个待验证视频场景中的每一帧进行显著性分析，针对任一待验证视频场景中的前三个视频帧，按照任一视频帧各区域的显著性不同进行区域划分，排除显著性最大的三个区域，得到任一视频帧的第二非显著区域；

步骤604中，每个待验证视频场景的前三个视频帧中任一视频帧上的水印片段可以以编码形式表示如下：

其中，w_g(i)为任一待验证视频场景的前三个视频帧中，第g个视频帧上的第i个水印片段，d_g为第g个视频帧上的第二直流系数,Δ为特定常数，floor为向下取整符号，即为不大于/>的最大整数。

步骤607中，第l个待验证视频场景中的第i个待验证第二水印片段，可以以编码形式表示如下：

步骤611中，在得到含水印多媒体之后，可为提供用户可视化操作界面，用于用户侧填写多媒体的相关版权信息，如创作者、创作时间、作品描述等，同时，将该含水印多媒体发送至文件服务器存储，并生成地址信息，另外，根据该含水印多媒体中的含水印视频流和含水印音频流重新生成之前嵌入的第一水印和第二水印，该第一水印和第二水印为可信第一水印和可信第二水印，将该可信第一水印、可信第二水印、含水印多媒体的版权信息以及含水印多媒体的地址信息上传至区块链保存，保证了多媒体的安全性和不可篡改性，有效地解决数字水印被攻击损坏等问题。

若确定待验证音频流被篡改，则可以根据待验证第二水印不一致的部分定位篡改类型和篡改位置。

例如若可信第二水印的长度比待验证第二水印的长度要长，则确定待验证音频流被剪切；还可以将待验证第二水印和可信第二水印逆向恢复成为编码时的方差，根据两者对应方差出现偏差的位置判断待验证音频流被篡改的位置，另外，若低通滤波后待验证第二水印对应的各方差均小于可信第二水印对应的各方差，则确定对待验证音频流的攻击区域为整体音频流，攻击类型为低通滤波。

在实际应用中，步骤607和步骤608之间没有严格的时序关系；即，可同时执行，或任一步骤先执行，具体根据实际需求而定，此处不做限定。

本实施例通过提取得到的待验证第二水印与重新生成的可信第二水印相比较，能够验证待验证音频流的完整性。

图7是本申请实施例提供的多媒体版权保护方法的流程示意图之七。参照图7，在一个实施例中，从区块链获取预先存储的含水印多媒体的可信第二水印之后，包括：

701、若待验证第二水印与可信第二水印一致，则确定待验证音频流未被篡改；

702、将待验证音频流中的左声道数据进行非重叠分帧，得到待验证音频帧数据；

703、对待验证音频帧数据进行三层离散小波变换，得到多个第二低频系数；

704、对多个第二低频系数进行排序，按照排序将多个第二低频系数进行分组；

705、根据任一组内第二低频系数的平均值与该组之前一组中排序最后的第二低频系数之间的关系，在该组内提取待验证第一水印片段；

706、将所有待验证第一水印片段进行合并，得到待验证第一水印；

707、从区块链获取预先存储的含水印多媒体的可信第一水印，若待验证第一水印与可信第一水印不一致，则确定待验证视频流被篡改，定位篡改类型和篡改位置。

步骤704中，可以按照时间顺序由先到后对多个第二低频系数进行排序，按照排序将多个第二低频系数进行分组，当多个第二低频系数的长度一共为200比特时，按照排序将多个第二低频系数分为10组，每组20个系数，每个系数的长度1比特。

步骤705中，在第k组内提取待验证第一水印片段，可以以编码形式表示如下：

其中，W(k)为在第k组内提取的水印编码，即待验证第一水印片段，DWT₀(20×(k-1))为第20×(k-1)个第二低频系数，temp_ave(k)为第k组内第二低频系数的平均值。

步骤706之后，还可以根据同样的步骤对音频流数据中的右声道数据进行处理，得到完整的待验证第一水印。

步骤707中，若确定待验证视频流被篡改，则可以根据待验证第一水印不一致的部分定位篡改类型和篡改位置。

例如：

1、帧删除攻击：

表1帧删除攻击实验结果

表1的帧删除实验结果表明，当待验证视频流受到帧删除攻击后可以100％定位到某一场景是否被修改。例如，当删除待验证视频流中第184帧时，待验证第一水印和可信第一水印的第178位至193位的编码如下表所示：

表2帧删除攻击水印信息对比

水印位置	178	179	180	181	182	183	184	185
									待验证第一水印	1	1	1	1	1	1	1	1
可信第一水印	1	1	1	1	1	1	1	0
									水印位置	186	187	188	189	190	191	192	193
待验证第一水印	0	0	0	0	0	0	0	0
									可信第一水印	0	0	0	0	0	0	0	0

从水印信息整体上来看，待验证第一水印共919比特，而可信第一水印共918比特，由此可以判断视频流受到帧删除攻击，从表2中可以看出第185位水印编码发生变化，从而可以判断184所在场景视频流被删除了一帧数据。删除多帧与删除一帧的情况类似，均可以定位受攻击场景。

2、帧添加攻击：

帧添加与帧删除类似，当攻击发生时，根据重新生成的可信第一水印与提取的待验证第一水印长度不同，可以准确检测出是否受攻击。例如在第180帧至181帧之间插入一帧全黑的图片，待验证第一水印与可信第一水印的178位至193位如下表所示，从表3中可以明显看出第181帧前后视频场景发生变化，由此可以判断第181帧是插入帧。插入多帧与插入一帧的情况类似，通过比对两组水印，可以准确定位插入帧所在位置。

表3帧添加攻击水印信息对比

水印位置	178	179	180	181	182	183	184	185
									待验证第一水印	1	1	1	1	1	1	1	1
可信第一水印	1	1	0	1	1	1	1	1
									水印位置	186	187	188	189	190	191	192	193
待验证第一水印	0	0	0	0	0	0	0	0
									可信第一水印	0	0	0	0	0	0	0	0

帧添加攻击与帧删除攻击的判断过程相似，均可以100％定位攻击位置。

3、帧修改攻击：

帧修改是指对视频帧进行篡改。由于帧修改一般是部分修改，不影响视频帧的观看，实验中模拟了视频帧篡改过程，将待验证视频流的视频帧部分像素点RGB值中的R与B值变成零，G值不变。实验过程中对某些连续帧做了不同程度的篡改，实验结果如下表所示：

表4帧删除攻击实验结果

/>

实验结果表明，当篡改程度达到16.7％时，算法可以100％检测篡改。当修改帧数较多，篡改程度为16.7％时，算法可以检测出视频受到攻击，且可以定位部分受到攻击的场景。

本实施例通过提取得到的待验证第一水印与重新生成的可信第一水印相比较，能够验证待验证视频流的完整性。

下面对本申请实施例提供的多媒体版权保护装置进行描述，下文描述的多媒体版权保护装置与上文描述的多媒体版权保护方法可相互对应参照。

图8为本申请实施例提供的多媒体版权保护装置的结构示意图。参照图8，本申请实施例提供一种多媒体版权保护装置，可以包括：

解码分离模块801，用于：解码并分离待保护多媒体，得到待保护音频流和待保护视频流；

第一水印生成模块802，用于：根据直方图-局部二进制模式场景分类算法提取所述待保护视频流的场景特征，根据所述场景特征得到第一水印；

含水印音频流生成模块803，用于：将所述第一水印嵌入所述待保护音频流，得到含水印音频流；

第二水印生成模块804，用于：根据所述含水印音频流生成第二水印；

含水印视频流生成模块805，用于：将所述第二水印嵌入所述待保护视频流，得到含水印视频流；

含水印多媒体生成模块806，用于：根据所述含水印音频流和所述含水印视频流，得到含水印多媒体。

本实施例提供的多媒体版权保护装置，先解码并分离待保护多媒体，得到待保护音频流和待保护视频流，再根据直方图-局部二进制模式场景分类算法提取待保护视频流的场景特征，根据场景特征得到第一水印，再将第一水印嵌入待保护音频流，得到含水印音频流，再根据含水印音频流生成第二水印，将第二水印嵌入待保护视频流，得到含水印视频流，最后根据含水印音频流和含水印视频流，得到含水印多媒体。本实施例利用待保护视频流的场景特征得到第一水印，将第一水印嵌入待保护音频流，再根据嵌入第一水印的待保护音频流生成第二水印，再将第二水印嵌入待保护视频流，以音视频全局特征生成第一水印和第二水印，并形成水印生成和嵌入的相互嵌套，提高水印对音视频流的各种篡改操作的敏感性，进而提高水印的完整性保护能力。

在一个实施例中，第一水印生成模块802具体用于：

在一个实施例中，含水印音频流生成模块803具体用于：

解码所述待保护音频流，得到音频流数据；

合并所有含水印低频系数组，得到含水印低频系数集；

在一个实施例中，第二水印生成模块804具体用于：

在一个实施例中，含水印视频流生成模块805具体用于：

在一个实施例中，还包括音频完整性验证模块(图中未示出)，用于：

将所述L个待验证视频场景按照时间由先到后进行排序；

在一个实施例中，还包括视频完整性验证模块(图中未示出)，用于：

图9示例了一种电子设备的实体结构示意图，如图9所示，该电子设备可以包括：处理器(processor)910、通信接口(Communication Interface)920、存储器(memory)930和通信总线940，其中，处理器910，通信接口920，存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的计算机程序，以执行多媒体版权保护方法的步骤，例如包括：

根据所述含水印音频流生成第二水印；

此外，上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本申请实施例还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各实施例所提供的多媒体版权保护方法的步骤，例如包括：

根据所述含水印音频流生成第二水印；

另一方面，本申请实施例还提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使处理器执行上述各实施例提供的方法的步骤，例如包括：

根据所述含水印音频流生成第二水印；

所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种多媒体版权保护方法，其特征在于，包括：

根据所述含水印音频流生成第二水印；

2.根据权利要求1所述的多媒体版权保护方法，其特征在于，所述根据直方图-局部二进制模式场景分类算法提取所述待保护视频流的场景特征，包括：

3.根据权利要求1所述的多媒体版权保护方法，其特征在于，所述将所述第一水印嵌入所述待保护音频流，得到含水印音频流，包括：

解码所述待保护音频流，得到音频流数据；

合并所有含水印低频系数组，得到含水印低频系数集；

4.根据权利要求1所述的多媒体版权保护方法，其特征在于，所述根据所述含水印音频流生成第二水印，包括：

5.根据权利要求1所述的多媒体版权保护方法，其特征在于，所述将所述第二水印嵌入所述待保护视频流，得到含水印视频流，包括：

6.根据权利要求5所述的多媒体版权保护方法，其特征在于，所述得到含水印多媒体之后，包括：

将所述L个待验证视频场景按照时间由先到后进行排序；

7.根据权利要求6所述的多媒体版权保护方法，其特征在于，所述从区块链获取预先存储的所述含水印多媒体的可信第二水印之后，包括：

8.一种多媒体版权保护装置，其特征在于，包括：

9.一种电子设备，包括处理器和存储有计算机程序的存储器，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的多媒体版权保护方法的步骤。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7任一项所述的多媒体版权保护方法的步骤。