CN114255767A - 基于跨媒体感知的音频数字水印技术 - Google Patents
基于跨媒体感知的音频数字水印技术 Download PDFInfo
- Publication number
- CN114255767A CN114255767A CN202010952398.4A CN202010952398A CN114255767A CN 114255767 A CN114255767 A CN 114255767A CN 202010952398 A CN202010952398 A CN 202010952398A CN 114255767 A CN114255767 A CN 114255767A
- Authority
- CN
- China
- Prior art keywords
- frame
- cross
- order difference
- watermark
- digital watermarking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008447 perception Effects 0.000 title claims abstract description 13
- 238000005070 sampling Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 8
- 238000013519 translation Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 2
- 230000002441 reversible effect Effects 0.000 description 9
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Editing Of Facsimile Originals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种跨媒体感知的音频数字水印技术,包括以下步骤:首先将原始音频文件分成若干帧,然后计算一帧中的高阶差分统计量,构建高阶差分统计量的直方图。直方图可以看作是一种鲁棒性特征,可以进行移位来嵌入水印序列。通过隐藏密钥,水印可以通过移动直方图嵌入到音频文件中。在水印提取过程中,通过隐藏密钥,可以从偏移的直方图中正确提取水印。此外,通过直方图移位的逆操作,可以实现对原始音频文件的无损恢复。
Description
技术领域
本发明涉及信息安全领域,特别涉及一种基于跨媒体感知的音频数字水印技术。
背景技术
随着互联网技术的飞速发展,版权、个人隐私和数字产品的保护成为数字产品出版首先要解决的问题。数字水印技术可以有效地解决这一问题。可逆水印技术的数字水印技术,使用数字多媒体信息的冗余嵌入水印信息(如数码多媒体载体的特征信息、版权信息,等等)到一个数字多媒体载体,和提取水印信息可以完全可以无失真的恢复原始载体接收者。该技术实现了数字多媒体的内容识别、完整性认证和版权保护,广泛应用于对数字多媒体保密性、安全性、保真度要求较高的领域,如军事和医学图像、法律文件等。可逆图像水印方案大致可分为以下四类:无损压缩、差分扩展、直方图移动和预测误差扩展。
目前,音频作为主要的数字多媒体载体之一,在互联网上广泛传播。大多数数字音频出版商希望在数字音频产品中嵌入数字水印,在不影响音频质量的情况下进行版权保护和完整性认证。可逆音频水印技术为数字音频发布者提供了一种有效的解决方案。可逆音频水印技术适用于对音频质量要求高、含有秘密数据、调查录音、协商录音的音频文件的存储、传输和认证。可逆音频水印技术根据嵌入水印的领域可分为以下三类:时域,变换域,压缩域。
但是可逆音频水印技术一般没有考虑水印的鲁棒性,因此现有的可逆音频水印方案大多脆弱,无法从受噪声或信号处理操作攻击的音频水印中正确提取水印。实际上,水印音频在互联网上传输时,不可避免地会受到噪声和信号处理操作的干扰和攻击,因此在很多应用场景中,音频发布者都希望嵌入的水印具有鲁棒性。因此,鲁棒和可逆水印技术成为信息隐藏领域的另一个重要研究方向。在鲁棒性和可逆水印技术中,如果水印载体完好无损,则水印可以被准确地提取出来,并且可以恢复原始载体而不丢失。即使水印载体受到一定程度的攻击,仍然可以正确地提取水印。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于跨媒体感知的音频数字水印技术。本发明针对现有的方法不足,对音频的高阶差分统计直方图模型进行了研究。原始的音频文件被分成若干不重叠的帧,每一帧由S个采样点组成,然后利用高阶差分统计模型计算每一帧的高阶差分统计量,构造高阶差分统计量的直方图。通过移动直方图,水印可以通过隐藏密钥嵌入到原始音频文件中。在水印提取过程中,通过计算水印文件中每一帧的高阶差分统计量,可以正确提取水印。此外,如果被水印的音频文件是完整的,可以通过直方图移位逆操作对原始音频文件进行无损恢复。当水印文件受到MP3压缩和加性高斯噪声等信号处理操作的攻击时,仍能准确地提取水印,保护版权。实验表明,该方案具有良好的音频质量,对压缩比特率为48Kbps的MP3和信噪比为25dB的加性高斯噪声具有良好的鲁棒性。
为解决上述技术问题,本发明采用的技术方案是:一种基于跨媒体感知的音频数字水印技术,包括以下步骤:
1)首先将原始音频文件分成若干帧:
X→xl,l∈Z
其中X为原始音频文件,xl是第l帧。
优选的是,对于一个时域离散的数字音频文件X,将音频文件分成若干个不重叠的帧,每一帧由S个采样点组成。然后将每一帧分成个抽样点组,每一个抽样点组由n+1个抽样点组成,其中n为差分的阶数,n为正整数。设M一定是正整数。xl(k,i)是第k个采样点组中的第i个采样点,该采样点组在第l帧中,第l帧结构如图1所示。
2)计算第l帧中第k个采样点组的高阶差分dl(k):
其中,
3)计算每l帧的高阶差分统计量E(l):
4)利用隐藏密钥,平移每一帧的高阶差分统计量E(l)′:
E(l)′=E(l)+B;
其中B是平移量。优选的是,根据隐藏密钥(T,G),
5)根据每一帧的高阶差分统计量的平移,可以得到如何修改每一帧的每个采样点组的每个采样点,其中,第l帧的第k个采样点组的第i个采样点xl(k,i)的修改由下式确定:
其中,β(k)、γ(k)的计算由下式确定:
其中,n为差分的阶数,优选的是,n=2,对于每个有水印的音频文件,相同信噪比的值,最小MP3压缩比特率是在n=2时取得,随着n的增大,最小MP3压缩比特率也增加,这意味着水印在n=2时是最鲁棒的,当n>2,鲁棒性随着n的增加而降低。
6)将所有修改平移后的帧进行组合,得到带有水印的音频文件。
附图说明
图1为原始音频文件中,第l帧的划分结构示意图。
图2位一帧n=2,S=420的二阶差分统计量的直方图示意图。
图3原始音频文件生成水印音频文件示意图。
图4水印音频文件提取原始音频文件示意图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它结构或其组合的存在或添加。
本实施例的一种基于跨媒体感知的音频数字水印技术,包括以下步骤:
1)根据图1的结构所示,将原始音频文件分成若干帧,其中每一帧有M个采样点组,每个采样点组有n+1个采样点,n是差分阶数。
2)遍历音频文件的每一帧,遍历每一帧的每一个采样点组,根据下式计算第l帧中第k个采样点组的高阶差分dl(k):
其中:
3)根据下式第l帧的高阶差分统计量E(l):
4)根据给定的隐藏密钥(T,G),根据下式对每一帧的高阶差分统计量E(l)进行平移:
5)将所有修改平移后的帧进行组合,得到带有水印的音频文件。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010952398.4A CN114255767A (zh) | 2020-09-11 | 2020-09-11 | 基于跨媒体感知的音频数字水印技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010952398.4A CN114255767A (zh) | 2020-09-11 | 2020-09-11 | 基于跨媒体感知的音频数字水印技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114255767A true CN114255767A (zh) | 2022-03-29 |
Family
ID=80788021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010952398.4A Pending CN114255767A (zh) | 2020-09-11 | 2020-09-11 | 基于跨媒体感知的音频数字水印技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114255767A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115116453A (zh) * | 2022-05-30 | 2022-09-27 | 中国科学院自动化研究所 | 音频水印的嵌入方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745725A (zh) * | 2013-12-25 | 2014-04-23 | 河海大学 | 一种基于常数q变换的音频水印嵌入方法 |
-
2020
- 2020-09-11 CN CN202010952398.4A patent/CN114255767A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745725A (zh) * | 2013-12-25 | 2014-04-23 | 河海大学 | 一种基于常数q变换的音频水印嵌入方法 |
Non-Patent Citations (1)
Title |
---|
XINGYUAN LIANG 等: "Robust reversible audio watermarking based on highorder difference statistics", SIGNAL PROCESSING, no. 173, pages 1 - 5 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115116453A (zh) * | 2022-05-30 | 2022-09-27 | 中国科学院自动化研究所 | 音频水印的嵌入方法、装置、电子设备及存储介质 |
CN115116453B (zh) * | 2022-05-30 | 2023-09-12 | 中国科学院自动化研究所 | 音频水印的嵌入方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
El Safy et al. | An adaptive steganographic technique based on integer wavelet transform | |
Liang et al. | Robust reversible audio watermarking based on high-order difference statistics | |
Chetan et al. | An efficient and secure robust watermarking scheme for document images using integer wavelets and block coding of binary watermarks | |
EP1695539B1 (en) | Method for robust lossless data hiding and recovering from the integer wavelet representation | |
Laouamer et al. | Performance evaluation of a document image watermarking approach with enhanced tamper localization and recovery | |
Salah et al. | Spatial and frequency approaches for audio file protection | |
CN114255767A (zh) | 基于跨媒体感知的音频数字水印技术 | |
Bedi et al. | Robust secure SVD based DCT–DWT oriented watermarking technique for image authentication | |
Ling et al. | Watermarking for image authentication | |
Li et al. | A robust reversible watermarking scheme overcomes the misalignment problem of generalized histogram shifting | |
Pawar et al. | Histogram-based reversible data hiding using block division | |
Nam et al. | WAN: Watermarking attack network | |
Varghese et al. | An efficient DCT-SVD based algorithm for digital image watermarking | |
Sidqi et al. | Image steganography: Review study | |
Goel et al. | ADCT-based robust methodology for image steganography | |
CN108766449B (zh) | 一种音频信号的可逆水印实现方法 | |
Arsalan et al. | Intelligent threshold selection for reversible watermarking of medical images | |
Yu et al. | Breaking the YASS algorithm via pixel and DCT coefficients analysis | |
Madane et al. | Watermark logo in digital image using DWT | |
Cheng et al. | Non-ubiquitous digital watermarking for record indexing and integrity protection of medical images | |
Pal et al. | Survey Of Digital Watermarking Using Dct | |
Yasmeen et al. | An efficient image steganography approach based on QR factorization and singular value decomposition in non‐subsampled contourlet transform domain | |
Madhi et al. | Pixel steganography method for grayscale image steganography on colour images | |
Verma et al. | Review Paper on Security Measures in Digital Watermarking | |
Ramos et al. | Watermarking-based image authentication system in the discrete wavelet transform domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220329 |