CN114255767A

CN114255767A - 基于跨媒体感知的音频数字水印技术

Info

Publication number: CN114255767A
Application number: CN202010952398.4A
Authority: CN
Inventors: 李鑫; 彭德中; 王骞; 刘杰; 张利君; 银大伟; 蒋瑞; 付俊英
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2020-09-11
Filing date: 2020-09-11
Publication date: 2022-03-29

Abstract

本发明公开了一种跨媒体感知的音频数字水印技术，包括以下步骤：首先将原始音频文件分成若干帧，然后计算一帧中的高阶差分统计量，构建高阶差分统计量的直方图。直方图可以看作是一种鲁棒性特征，可以进行移位来嵌入水印序列。通过隐藏密钥，水印可以通过移动直方图嵌入到音频文件中。在水印提取过程中，通过隐藏密钥，可以从偏移的直方图中正确提取水印。此外，通过直方图移位的逆操作，可以实现对原始音频文件的无损恢复。

Description

基于跨媒体感知的音频数字水印技术

技术领域

本发明涉及信息安全领域，特别涉及一种基于跨媒体感知的音频数字水印技术。

背景技术

随着互联网技术的飞速发展，版权、个人隐私和数字产品的保护成为数字产品出版首先要解决的问题。数字水印技术可以有效地解决这一问题。可逆水印技术的数字水印技术,使用数字多媒体信息的冗余嵌入水印信息(如数码多媒体载体的特征信息、版权信息,等等)到一个数字多媒体载体,和提取水印信息可以完全可以无失真的恢复原始载体接收者。该技术实现了数字多媒体的内容识别、完整性认证和版权保护，广泛应用于对数字多媒体保密性、安全性、保真度要求较高的领域，如军事和医学图像、法律文件等。可逆图像水印方案大致可分为以下四类:无损压缩、差分扩展、直方图移动和预测误差扩展。

目前，音频作为主要的数字多媒体载体之一，在互联网上广泛传播。大多数数字音频出版商希望在数字音频产品中嵌入数字水印，在不影响音频质量的情况下进行版权保护和完整性认证。可逆音频水印技术为数字音频发布者提供了一种有效的解决方案。可逆音频水印技术适用于对音频质量要求高、含有秘密数据、调查录音、协商录音的音频文件的存储、传输和认证。可逆音频水印技术根据嵌入水印的领域可分为以下三类:时域，变换域，压缩域。

但是可逆音频水印技术一般没有考虑水印的鲁棒性，因此现有的可逆音频水印方案大多脆弱，无法从受噪声或信号处理操作攻击的音频水印中正确提取水印。实际上，水印音频在互联网上传输时，不可避免地会受到噪声和信号处理操作的干扰和攻击，因此在很多应用场景中，音频发布者都希望嵌入的水印具有鲁棒性。因此，鲁棒和可逆水印技术成为信息隐藏领域的另一个重要研究方向。在鲁棒性和可逆水印技术中，如果水印载体完好无损，则水印可以被准确地提取出来，并且可以恢复原始载体而不丢失。即使水印载体受到一定程度的攻击，仍然可以正确地提取水印。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于跨媒体感知的音频数字水印技术。本发明针对现有的方法不足，对音频的高阶差分统计直方图模型进行了研究。原始的音频文件被分成若干不重叠的帧,每一帧由S个采样点组成,然后利用高阶差分统计模型计算每一帧的高阶差分统计量，构造高阶差分统计量的直方图。通过移动直方图，水印可以通过隐藏密钥嵌入到原始音频文件中。在水印提取过程中，通过计算水印文件中每一帧的高阶差分统计量，可以正确提取水印。此外，如果被水印的音频文件是完整的，可以通过直方图移位逆操作对原始音频文件进行无损恢复。当水印文件受到MP3压缩和加性高斯噪声等信号处理操作的攻击时，仍能准确地提取水印，保护版权。实验表明，该方案具有良好的音频质量，对压缩比特率为48Kbps的MP3和信噪比为25dB的加性高斯噪声具有良好的鲁棒性。

为解决上述技术问题，本发明采用的技术方案是：一种基于跨媒体感知的音频数字水印技术，包括以下步骤：

1)首先将原始音频文件分成若干帧：

X→x^l,l∈Z

其中X为原始音频文件，x^l是第l帧。

优选的是，对于一个时域离散的数字音频文件X，将音频文件分成若干个不重叠的帧，每一帧由S个采样点组成。然后将每一帧分成

个抽样点组，每一个抽样点组由n+1个抽样点组成，其中n为差分的阶数，n为正整数。设

M一定是正整数。x^l(k,i)是第k个采样点组中的第i个采样点，该采样点组在第l帧中，第l帧结构如图1所示。

2)计算第l帧中第k个采样点组的高阶差分d^l(k)：

其中，

3)计算每l帧的高阶差分统计量E(l)：

其中，

是第l帧的采样点组的数量。例如，一帧n＝2,S＝420的二阶差分统计量的直方图如图2所示。

4)利用隐藏密钥，平移每一帧的高阶差分统计量E(l)′：

E(l)′＝E(l)+B；

其中B是平移量。优选的是，根据隐藏密钥(T,G)，

5)根据每一帧的高阶差分统计量的平移，可以得到如何修改每一帧的每个采样点组的每个采样点，其中，第l帧的第k个采样点组的第i个采样点x^l(k,i)的修改由下式确定：

其中，β(k)、γ(k)的计算由下式确定：

其中，n为差分的阶数，优选的是，n＝2，对于每个有水印的音频文件,相同信噪比的值,最小MP3压缩比特率是在n＝2时取得，随着n的增大，最小MP3压缩比特率也增加,这意味着水印在n＝2时是最鲁棒的，当n＞2，鲁棒性随着n的增加而降低。

6)将所有修改平移后的帧进行组合，得到带有水印的音频文件。

附图说明

图1为原始音频文件中，第l帧的划分结构示意图。

图2位一帧n＝2,S＝420的二阶差分统计量的直方图示意图。

图3原始音频文件生成水印音频文件示意图。

图4水印音频文件提取原始音频文件示意图。

具体实施方式

下面结合实施例对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它结构或其组合的存在或添加。

本实施例的一种基于跨媒体感知的音频数字水印技术，包括以下步骤：

1)根据图1的结构所示，将原始音频文件分成若干帧，其中每一帧有M个采样点组，每个采样点组有n+1个采样点，n是差分阶数。

2)遍历音频文件的每一帧，遍历每一帧的每一个采样点组，根据下式计算第l帧中第k个采样点组的高阶差分d^l(k)：

其中：

3)根据下式第l帧的高阶差分统计量E(l)：

4)根据给定的隐藏密钥(T,G)，根据下式对每一帧的高阶差分统计量E(l)进行平移：

5)将所有修改平移后的帧进行组合，得到带有水印的音频文件。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节。