CN114255767A - 基于跨媒体感知的音频数字水印技术 - Google Patents

基于跨媒体感知的音频数字水印技术 Download PDF

Info

Publication number
CN114255767A
CN114255767A CN202010952398.4A CN202010952398A CN114255767A CN 114255767 A CN114255767 A CN 114255767A CN 202010952398 A CN202010952398 A CN 202010952398A CN 114255767 A CN114255767 A CN 114255767A
Authority
CN
China
Prior art keywords
frame
cross
order difference
watermark
digital watermarking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010952398.4A
Other languages
English (en)
Inventor
李鑫
彭德中
王骞
刘杰
张利君
银大伟
蒋瑞
付俊英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202010952398.4A priority Critical patent/CN114255767A/zh
Publication of CN114255767A publication Critical patent/CN114255767A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种跨媒体感知的音频数字水印技术,包括以下步骤:首先将原始音频文件分成若干帧,然后计算一帧中的高阶差分统计量,构建高阶差分统计量的直方图。直方图可以看作是一种鲁棒性特征,可以进行移位来嵌入水印序列。通过隐藏密钥,水印可以通过移动直方图嵌入到音频文件中。在水印提取过程中,通过隐藏密钥,可以从偏移的直方图中正确提取水印。此外,通过直方图移位的逆操作,可以实现对原始音频文件的无损恢复。

Description

基于跨媒体感知的音频数字水印技术
技术领域
本发明涉及信息安全领域,特别涉及一种基于跨媒体感知的音频数字水印技术。
背景技术
随着互联网技术的飞速发展,版权、个人隐私和数字产品的保护成为数字产品出版首先要解决的问题。数字水印技术可以有效地解决这一问题。可逆水印技术的数字水印技术,使用数字多媒体信息的冗余嵌入水印信息(如数码多媒体载体的特征信息、版权信息,等等)到一个数字多媒体载体,和提取水印信息可以完全可以无失真的恢复原始载体接收者。该技术实现了数字多媒体的内容识别、完整性认证和版权保护,广泛应用于对数字多媒体保密性、安全性、保真度要求较高的领域,如军事和医学图像、法律文件等。可逆图像水印方案大致可分为以下四类:无损压缩、差分扩展、直方图移动和预测误差扩展。
目前,音频作为主要的数字多媒体载体之一,在互联网上广泛传播。大多数数字音频出版商希望在数字音频产品中嵌入数字水印,在不影响音频质量的情况下进行版权保护和完整性认证。可逆音频水印技术为数字音频发布者提供了一种有效的解决方案。可逆音频水印技术适用于对音频质量要求高、含有秘密数据、调查录音、协商录音的音频文件的存储、传输和认证。可逆音频水印技术根据嵌入水印的领域可分为以下三类:时域,变换域,压缩域。
但是可逆音频水印技术一般没有考虑水印的鲁棒性,因此现有的可逆音频水印方案大多脆弱,无法从受噪声或信号处理操作攻击的音频水印中正确提取水印。实际上,水印音频在互联网上传输时,不可避免地会受到噪声和信号处理操作的干扰和攻击,因此在很多应用场景中,音频发布者都希望嵌入的水印具有鲁棒性。因此,鲁棒和可逆水印技术成为信息隐藏领域的另一个重要研究方向。在鲁棒性和可逆水印技术中,如果水印载体完好无损,则水印可以被准确地提取出来,并且可以恢复原始载体而不丢失。即使水印载体受到一定程度的攻击,仍然可以正确地提取水印。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于跨媒体感知的音频数字水印技术。本发明针对现有的方法不足,对音频的高阶差分统计直方图模型进行了研究。原始的音频文件被分成若干不重叠的帧,每一帧由S个采样点组成,然后利用高阶差分统计模型计算每一帧的高阶差分统计量,构造高阶差分统计量的直方图。通过移动直方图,水印可以通过隐藏密钥嵌入到原始音频文件中。在水印提取过程中,通过计算水印文件中每一帧的高阶差分统计量,可以正确提取水印。此外,如果被水印的音频文件是完整的,可以通过直方图移位逆操作对原始音频文件进行无损恢复。当水印文件受到MP3压缩和加性高斯噪声等信号处理操作的攻击时,仍能准确地提取水印,保护版权。实验表明,该方案具有良好的音频质量,对压缩比特率为48Kbps的MP3和信噪比为25dB的加性高斯噪声具有良好的鲁棒性。
为解决上述技术问题,本发明采用的技术方案是:一种基于跨媒体感知的音频数字水印技术,包括以下步骤:
1)首先将原始音频文件分成若干帧:
X→xl,l∈Z
其中X为原始音频文件,xl是第l帧。
优选的是,对于一个时域离散的数字音频文件X,将音频文件分成若干个不重叠的帧,每一帧由S个采样点组成。然后将每一帧分成
Figure BDA0002677445570000021
个抽样点组,每一个抽样点组由n+1个抽样点组成,其中n为差分的阶数,n为正整数。设
Figure BDA0002677445570000022
M一定是正整数。xl(k,i)是第k个采样点组中的第i个采样点,该采样点组在第l帧中,第l帧结构如图1所示。
2)计算第l帧中第k个采样点组的高阶差分dl(k):
Figure BDA0002677445570000023
其中,
Figure BDA0002677445570000031
3)计算每l帧的高阶差分统计量E(l):
Figure BDA0002677445570000032
其中,
Figure BDA0002677445570000033
是第l帧的采样点组的数量。例如,一帧n=2,S=420的二阶差分统计量的直方图如图2所示。
4)利用隐藏密钥,平移每一帧的高阶差分统计量E(l)′:
E(l)′=E(l)+B;
其中B是平移量。优选的是,根据隐藏密钥(T,G),
Figure BDA0002677445570000034
5)根据每一帧的高阶差分统计量的平移,可以得到如何修改每一帧的每个采样点组的每个采样点,其中,第l帧的第k个采样点组的第i个采样点xl(k,i)的修改由下式确定:
Figure BDA0002677445570000035
其中,β(k)、γ(k)的计算由下式确定:
Figure BDA0002677445570000036
Figure BDA0002677445570000037
其中,n为差分的阶数,优选的是,n=2,对于每个有水印的音频文件,相同信噪比的值,最小MP3压缩比特率是在n=2时取得,随着n的增大,最小MP3压缩比特率也增加,这意味着水印在n=2时是最鲁棒的,当n>2,鲁棒性随着n的增加而降低。
6)将所有修改平移后的帧进行组合,得到带有水印的音频文件。
附图说明
图1为原始音频文件中,第l帧的划分结构示意图。
图2位一帧n=2,S=420的二阶差分统计量的直方图示意图。
图3原始音频文件生成水印音频文件示意图。
图4水印音频文件提取原始音频文件示意图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它结构或其组合的存在或添加。
本实施例的一种基于跨媒体感知的音频数字水印技术,包括以下步骤:
1)根据图1的结构所示,将原始音频文件分成若干帧,其中每一帧有M个采样点组,每个采样点组有n+1个采样点,n是差分阶数。
2)遍历音频文件的每一帧,遍历每一帧的每一个采样点组,根据下式计算第l帧中第k个采样点组的高阶差分dl(k):
Figure BDA0002677445570000041
其中:
Figure BDA0002677445570000042
3)根据下式第l帧的高阶差分统计量E(l):
Figure BDA0002677445570000043
4)根据给定的隐藏密钥(T,G),根据下式对每一帧的高阶差分统计量E(l)进行平移:
Figure BDA0002677445570000044
5)将所有修改平移后的帧进行组合,得到带有水印的音频文件。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。

Claims (6)

1.一种基于跨媒体感知的音频数字水印技术,其特征在于,包括以下步骤:
1)首先将原始音频文件分成若干帧;
2)计算第l帧中第k个采样点组的高阶差分dl(k);
3)计算第l帧的高阶差分统计量E(l):
Figure FDA0002677445560000011
4)利用隐藏密钥,平移每一帧的高阶差分统计量E(l)′
E(l)′=E(l)+B;
其中B是平移量;
5)将所有的帧进行组合,得到带有水印的音频文件。
2.根据权利要求1所述的基于跨媒体感知的音频数字水印技术,其特征在于,其中,对于一个时域离散的数字音频文件X,将音频文件分成若干个不重叠的帧,每一帧由S个采样点组成,然后将每一帧分成
Figure FDA0002677445560000012
个抽样点组,每一个抽样点组由n+1个抽样点组成,其中n为差分的阶数,n为正整数,设
Figure FDA0002677445560000013
M一定是正整数,xl(k,i)是第k个采样点组中的第i个采样点,该采样点组在第l帧中。
3.根据权利要求1所述的基于跨媒体感知的音频数字水印技术,其特征在于,高阶差分dl(k)的计算由下式确定:
Figure FDA0002677445560000014
其中:
Figure FDA0002677445560000015
然后由高阶差分dl(k),根据第1步中的3),得到高阶差分统计量E(l)。
4.根据权利要求1所述的基于跨媒体感知的音频数字水印技术,其特征在于,平移每一帧的高阶差分统计量E(l)′的计算由下式确定:
Figure FDA0002677445560000016
5.根据权利要求1-4所述的基于跨媒体感知的音频数字水印技术,其特征在于,利用隐藏密钥(T,G),平移量B的计算由下式确定:
Figure FDA0002677445560000021
6.根据权利要求1-5所述的基于跨媒体感知的音频数字水印技术,其特征在于,第l帧的第k个采样点组的第i个采样点xl(k,i)的修改由下式确定:
Figure FDA0002677445560000022
其中,β(k)、γ(k)的计算由下式确定:
Figure FDA0002677445560000023
Figure FDA0002677445560000024
CN202010952398.4A 2020-09-11 2020-09-11 基于跨媒体感知的音频数字水印技术 Pending CN114255767A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010952398.4A CN114255767A (zh) 2020-09-11 2020-09-11 基于跨媒体感知的音频数字水印技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010952398.4A CN114255767A (zh) 2020-09-11 2020-09-11 基于跨媒体感知的音频数字水印技术

Publications (1)

Publication Number Publication Date
CN114255767A true CN114255767A (zh) 2022-03-29

Family

ID=80788021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010952398.4A Pending CN114255767A (zh) 2020-09-11 2020-09-11 基于跨媒体感知的音频数字水印技术

Country Status (1)

Country Link
CN (1) CN114255767A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115116453A (zh) * 2022-05-30 2022-09-27 中国科学院自动化研究所 音频水印的嵌入方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745725A (zh) * 2013-12-25 2014-04-23 河海大学 一种基于常数q变换的音频水印嵌入方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745725A (zh) * 2013-12-25 2014-04-23 河海大学 一种基于常数q变换的音频水印嵌入方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XINGYUAN LIANG 等: "Robust reversible audio watermarking based on high­order difference statistics", SIGNAL PROCESSING, no. 173, pages 1 - 5 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115116453A (zh) * 2022-05-30 2022-09-27 中国科学院自动化研究所 音频水印的嵌入方法、装置、电子设备及存储介质
CN115116453B (zh) * 2022-05-30 2023-09-12 中国科学院自动化研究所 音频水印的嵌入方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
El Safy et al. An adaptive steganographic technique based on integer wavelet transform
Liang et al. Robust reversible audio watermarking based on high-order difference statistics
Chetan et al. An efficient and secure robust watermarking scheme for document images using integer wavelets and block coding of binary watermarks
EP1695539B1 (en) Method for robust lossless data hiding and recovering from the integer wavelet representation
Laouamer et al. Performance evaluation of a document image watermarking approach with enhanced tamper localization and recovery
Salah et al. Spatial and frequency approaches for audio file protection
CN114255767A (zh) 基于跨媒体感知的音频数字水印技术
Bedi et al. Robust secure SVD based DCT–DWT oriented watermarking technique for image authentication
Ling et al. Watermarking for image authentication
Li et al. A robust reversible watermarking scheme overcomes the misalignment problem of generalized histogram shifting
Pawar et al. Histogram-based reversible data hiding using block division
Nam et al. WAN: Watermarking attack network
Varghese et al. An efficient DCT-SVD based algorithm for digital image watermarking
Sidqi et al. Image steganography: Review study
Goel et al. ADCT-based robust methodology for image steganography
CN108766449B (zh) 一种音频信号的可逆水印实现方法
Arsalan et al. Intelligent threshold selection for reversible watermarking of medical images
Yu et al. Breaking the YASS algorithm via pixel and DCT coefficients analysis
Madane et al. Watermark logo in digital image using DWT
Cheng et al. Non-ubiquitous digital watermarking for record indexing and integrity protection of medical images
Pal et al. Survey Of Digital Watermarking Using Dct
Yasmeen et al. An efficient image steganography approach based on QR factorization and singular value decomposition in non‐subsampled contourlet transform domain
Madhi et al. Pixel steganography method for grayscale image steganography on colour images
Verma et al. Review Paper on Security Measures in Digital Watermarking
Ramos et al. Watermarking-based image authentication system in the discrete wavelet transform domain

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220329