CN108877819B - 一种基于系数自相关度的语音内容取证方法 - Google Patents

一种基于系数自相关度的语音内容取证方法 Download PDF

Info

Publication number
CN108877819B
CN108877819B CN201810734827.3A CN201810734827A CN108877819B CN 108877819 B CN108877819 B CN 108877819B CN 201810734827 A CN201810734827 A CN 201810734827A CN 108877819 B CN108877819 B CN 108877819B
Authority
CN
China
Prior art keywords
watermark
coefficient
frame
autocorrelation
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810734827.3A
Other languages
English (en)
Other versions
CN108877819A (zh
Inventor
李艳丽
孙芳
何俊杰
刘正辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinyang Normal University
Original Assignee
Xinyang Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinyang Normal University filed Critical Xinyang Normal University
Priority to CN201810734827.3A priority Critical patent/CN108877819B/zh
Publication of CN108877819A publication Critical patent/CN108877819A/zh
Application granted granted Critical
Publication of CN108877819B publication Critical patent/CN108877819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Abstract

本发明涉及语音信号处理技术领域,公开了一种基于系数自相关度的语音内容取证方法,包括:原始语音信号预处理,将原始语音信号分为P帧,第i帧记为Ai,将Ai分为M段;系数自相关度特征提取,由DCT系数计算Ai,m的系数自相关度特征;由帧号二值化生成水印;水印嵌入,对量化之后的系数C′i,m进行逆DCT,将水印wm嵌入在Ai,m中;水印提取和篡改定位;若检测到被攻击的语音帧,检测紧接着的连续N个样本,直到找到能通过验证的连续N个样本,然后重构前一个和当前通过验证的帧号,两帧号之差即为被定为的篡改内容,这种基于系数自相关度的语音内容取证方法,需要嵌入的容量较小;能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性。

Description

一种基于系数自相关度的语音内容取证方法
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种基于系数自相关度的语音内容取证方法。
背景技术
数字语音信号作为重要的信息传播载体,在我们生活中发挥着越来越重要的作用。由于数字信号处理技术的发展和编辑攻击的丰富,对数字语音信号的编辑和伪造变得简单易行。伪造的数字语音信号表示的内容和原始信号相比,有着较大的区别,或者表示的意义完全不同。若伪造的语音信号的内容被用户接受,将会带来严重的后果。同时,大量存在的伪造的语音信号,已经影响了数字语音信号所表示内容的认可度。对数字语音的内容取证技术能够鉴别语音内容的真实性,而对该技术的研究也具有研究意义和实用价值。
文献“Centroid-based Semi-fragile Audio Watermarking in Hybrid Domain”(H.X.Wang,M.Q.Fan,Science in China Series F-Information Sciences,vol.53,no.3,PP.619-633,2010)”提出了一种基于质心的语音内容取证方法。由语音信号的质心这样的特征生成水印,并将水印嵌入在基于DWT和DCT的混合域中。该方法中,生成水印的特征和嵌入水印的特征均是公开的。攻击者可以选择任意的一段语音信号,采用同样的方法,将水印嵌入在该段信号中,然后替换含水印的语音信号。验证端将检测不到替换的内容。于是,该方法存在较大的安全隐患。文献“A pseudo-Zernike moments based audio watermarkingscheme robust against desynchronization attacks”(Wang Xiang-yang,Ma Tian-xiao,Niu Pan-pan,Computers and Electrical Engineering,2011,37:425-443)首先在时域基于统计均值嵌入同步码,然后量化伪Zernike矩的幅值嵌入水印,提出了基于伪Zernike矩的抗同步攻击的音频水印算法。该方法中,嵌入同步码和水印的特征均是公开的,攻击者可以使用其它的音频段来替换含水印的音频,然后量化替换后的音频内容,使其满足水印正确提取的条件,对其内容实施攻击,且攻击的内容会被认为是真实的。
由专利申请提出者提出的中国发明专利申请号201610304912.7的《一种基于DWT和DCT的数字语音取证和篡改恢复方法》对音频内容取证技术做出了一定的努力。虽然该方法基于分块思想的整数嵌入方法,但因需要的嵌入容量太大,势必造成对载体信号较大的改变,引起不可听性的降低。本发明以内容取证和篡改定位为目的,仅仅嵌入用于篡改定位的水印信息,需要嵌入容量较小。从取证的角度来看,本发明能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性,弥补了先前专利(中国专利申请号201610304912.7)因需要嵌入容量大而降低不可听性的不足。是取证方法的一个改进。
发明内容
本发明提供一种基于系数自相关度的语音内容取证方法,可以解决现有技术中的上述问题。
本发明提供了一种基于系数自相关度的语音内容取证方法,包括以下步骤:
S1、原始语音信号预处理
将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;
将Ai分为M段,Mmod2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中LA为原始语音信号A的长度;
S2、系数自相关度特征提取
对Ai,m进行离散余弦变换(Discrete Cosine Transform,简称DCT),得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};
根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m
Figure BDA0001721760130000031
公式(1)中Di,m为Ai,m的系数自相关度特征,α和为β系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位,当l+h>N1时,c(l+h)=c(l+h-N1);
S3、生成水印
Wi={w1,w2,…,wM}记为要嵌入在第i帧中的水印,Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i];
S4、水印嵌入
假设wm为嵌入在Ai,m中水印,通过量化系数自相关度特征Di,m来嵌入wm,量化方法如公式(2):
Figure BDA0001721760130000032
公式(2)中D′i,m为量化之后的系数自相关度特征,Δ为量化步长;
由公式(3)量化Ai,m的DCT系数,量化之后的系数记为C′i,m
Figure BDA0001721760130000033
对量化之后的系数C′i,m进行逆DCT,即可将水印wm嵌入在Ai,m中,重复上述步骤,即可完成各帧水印的嵌入,记含水印信号为A′;
S5、水印提取和篡改定位
首先,将含水印信号A′分为长度为N的帧,第i帧记为A′i
然后,将A′i等分为M段,第m段记为A′i,m,1≤m≤M,
对A′i,m进行DCT,根据得到的DCT系数计算A′i,m的系数自相关度特征WDi,m
提取水印w′m
Figure BDA0001721760130000043
1≤m≤M;如果/>
Figure BDA0001721760130000041
则A′i,m是真实的;如果/>
Figure BDA0001721760130000042
则表明A′i,m是被攻击的;/>
若检测到被攻击的语音帧,检测紧接着的连续N个样本,直到找到能通过验证的连续N个样本,然后重构前一个和当前通过验证的帧号,两帧号之差即为定位到的被攻击的内容。
与现有技术相比,本发明的有益效果在于:
本发明以内容取证和篡改定位为目的,仅仅嵌入用于篡改定位的水印信息,需要嵌入的容量较小;从取证的角度来看,本发明能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性。
附图说明
图1为本发明载体信号的分帧方法。
图2为水印嵌入过程框图。
图3为水印提取和内容取证过程框图。
图4为篡改定位方法。
图5为β不同取值时对应的自相关度特征。
图6为本发明选取的含水印音频信号。
图7为删除攻击后的含水印音频信号。
图8为替换攻击后的含水印音频信号。
图9为删除攻击后的篡改定位结果。
图10为替换攻击后的篡改定位结果。
具体实施方式
下面结合附图,对本发明的一个具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
1、载体信号预处理:
(1)将载体信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai
(2)将Ai分为M段,Mmod2=0,第m段记为Ai,m,每段的长为N1,N1=LA/N×M,1≤m≤M。载体信号分帧方法如图1所示。
2、特征提取:
(1)对Ai,m进行DCT,得到的系数记为Ci,m={c(1),c(2),…,c(N1)}。
(2)由下式计算Ai,m的系数自相关度特征:
Figure BDA0001721760130000051
其中Di,m为Ai,m的系数自相关度,α和β为系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位。当l+h>N1时,c(l+h)=c(l+h-N1)。
3、水印嵌入
记Wi={w1,w2,…,wM}为要嵌入在第i帧中的水印。Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i]。假设wm为嵌入在Ai,m中水印。
(1)通过量化系数自相关度来嵌入wm,量化方法如下式:
Figure BDA0001721760130000061
其中D′i,m为量化之后的系数自相关度,Δ为量化步长。
(2)由下式量化Ai,m的DCT系数,量化之后的系数记为C′i,m
Figure BDA0001721760130000062
(3)对量化之后的系数C′i,m进行逆DCT,即可将水印wm嵌入在Ai,m中。
重复上述步骤,即可完成各帧水印的嵌入,记含水印信号为A′。水印嵌入过程框图如图2所示。
4、水印提取和篡改定位
首先将含水印信号A′分为长度为N的帧,第i帧记为A′i。然后将A′i等分为M段,第m段记为A′i,m,1≤m≤M。水印提取过程如图3所示,方法如下:
(1)对A′i,m进行DCT,根据得到的DCT系数,计算A′i,m的系数自相关度特征,记为WDi,m
(2)提取水印w′m
Figure BDA0001721760130000065
1≤m≤M。
(3)如果
Figure BDA0001721760130000063
则A′i,m是真实的;如果/>
Figure BDA0001721760130000064
则表明A′i,m是被攻击的。
(4)若检测到被攻击的语音帧,检测紧接着的连续N个样本,直到找到能通过验证的连续N个样本。然后重构前一个和当前通过验证的帧号,两帧号之差,即为定位到的被攻击的内容。篡改定位方法如图4所示。
本发明的效果可以通过以下的性能分析验证:
1、不可听性
分别在4种不同环境下采用录音笔(SONY PCM-D100)录制的100段语音信号作为测试样本。录制环境包括安静的会议现场,讨论会现场,火车站和空旷的野外,相应的信号分别记为T1,T2,T3和T4。它们是16位量化的采样率为44.1kHz的语音信号,样本长度为150000,每帧长度为15000。其它用的参数取值分别为N1=1875,M=8,h=7,α=1.2,β=0.001,Δ=0.6。
表1为不同类型含水印音频信号的SNR、ODG和SDG值。
表1
Figure BDA0001721760130000071
由表1所给结果可以看出,本方法具有较好的不可听性。
2、安全性
基于公开特征的音频水印算法,嵌入水印的特征易被攻击者获取而带来安全隐患。本发明采用量化系数自相关度特征的方法来嵌入水印。该特征的构造与密钥α和β有关,图5给出了β从0.001到0.009不同取值的对应自相关度特征(α=1.2)。
图5所示结果可得,系数自相关度特征依赖于参数β。相似的,该特征也依赖于参数α。所以,在没有密钥α和β的情况下,攻击者对含水印信号进行攻击,一帧被攻击的信号能通过验证的概率为
Figure BDA0001721760130000072
于是,对一帧信号而言,本发明的抗攻击能力为/>
Figure BDA0001721760130000073
3、篡改定位
对如图6所示的含水印语音信号进行删除攻击和替换攻击。攻击后的语音信号如图7和图8所示,篡改检测结果分别如图9和图10所示,其中TL=1表明第i帧的语音内容是被攻击的。由篡改恢复结果可以看出,一方面,本发明对不同类型的恶意攻击能够有效地篡改检测,另一方面,本发明提高了算法的安全性,弥补了公开特征水印算法的不足。
本发明给出了一种基于系数自相关度的语音内容取证方法,首先给出了保密特征-语音信号系数自相关度的定义,然后将帧号作为水印信息,嵌入在语音信号系数自相关度的特征中。一方面,含水印信号被攻击后,可以通过提取帧号来定位被攻击的内容。另一方面,在没有密钥的前提下,很难获得水印特征并提取水印信息,从而提高取证算法的安全性。
本发明以内容取证和篡改定位为目的,仅仅嵌入用于篡改定位的水印信息,需要嵌入的容量较小;从取证的角度来看,本发明能够对篡改内容进行精确地篡改定位的同时,提高了水印系统的安全性和水印的不可听性。
以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (1)

1.一种基于系数自相关度的语音内容取证方法,其特征在于,包括以下步骤:
S1、原始语音信号预处理
将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;
将Ai分为M段,M mod 2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中,LA为原始语音信号A的长度;
S2、系数自相关度特征提取
对Ai,m进行DCT,得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};
根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m
Figure FDA0001721760120000011
公式(1)中Di,m为Ai,m的系数自相关度特征,α和β为系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位,当l+h>N1时,c(l+h)=c(l+h-N1);
S3、生成水印
Wi={w1,w2,…,wM}记为要嵌入在第i帧中的水印,Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i];
S4、水印嵌入
假设wm为嵌入在Ai,m中水印,通过量化系数自相关度特征Di,m来嵌入wm,量化方法如公式(2):
Figure FDA0001721760120000021
公式(2)中D′i,m为量化之后的系数自相关度特征,Δ为量化步长;
由公式(3)量化Ai,m的DCT系数,量化之后的系数记为C′i,m
Figure FDA0001721760120000022
对量化之后的系数C′i,m进行逆DCT,即可将水印wm嵌入在Ai,m中;
重复上述步骤,即可完成各帧水印的嵌入,记含水印信号为A′;
S5、水印提取和篡改定位
首先,将含水印信号A′分为长度为N的帧,第i帧记为A′i
然后,将A′i等分为M段,第m段记为A′i,m,1≤m≤M,
对A′i,m进行DCT,根据得到的DCT系数计算A′i,m的系数自相关度特征WDi,m
提取水印w′m
Figure FDA0001721760120000025
WDi,m表示A′i,m的系数自相关度特征;1≤m≤M;如果/>
Figure FDA0001721760120000023
则A′i,m是真实的;如果/>
Figure FDA0001721760120000024
则表明A′i,m是被攻击的;
若检测到被攻击的语音帧,检测紧接着的连续N个样本,直到找到能通过验证的连续N个样本,然后重构前一个和当前通过验证的帧号,两帧号之差即为定位到的被攻击的内容。
CN201810734827.3A 2018-07-06 2018-07-06 一种基于系数自相关度的语音内容取证方法 Active CN108877819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810734827.3A CN108877819B (zh) 2018-07-06 2018-07-06 一种基于系数自相关度的语音内容取证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810734827.3A CN108877819B (zh) 2018-07-06 2018-07-06 一种基于系数自相关度的语音内容取证方法

Publications (2)

Publication Number Publication Date
CN108877819A CN108877819A (zh) 2018-11-23
CN108877819B true CN108877819B (zh) 2023-05-26

Family

ID=64299787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810734827.3A Active CN108877819B (zh) 2018-07-06 2018-07-06 一种基于系数自相关度的语音内容取证方法

Country Status (1)

Country Link
CN (1) CN108877819B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999502B (zh) * 2022-05-19 2023-01-06 贵州财经大学 基于自适应字分帧的语音内容水印生成、嵌入方法、语音内容的完整性认证及篡改定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002049363A1 (en) * 2000-12-15 2002-06-20 Agency For Science, Technology And Research Method and system of digital watermarking for compressed audio
WO2005062297A1 (en) * 2003-12-19 2005-07-07 Koninklijke Philips Electronics N.V. Watermark embedding

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692104A (en) * 1992-12-31 1997-11-25 Apple Computer, Inc. Method and apparatus for detecting end points of speech activity
JP3431593B2 (ja) * 2000-10-31 2003-07-28 株式会社東芝 コンテンツ生成装置、電子透かし検出装置、コンテンツ生成方法、電子透かし検出方法及び記録媒体
KR100375822B1 (ko) * 2000-12-18 2003-03-15 한국전자통신연구원 디지털 오디오의 워터마크 삽입/추출 장치 및 방법
CN101115124B (zh) * 2006-07-26 2012-04-18 日电(中国)有限公司 基于音频水印识别媒体节目的方法和装置
CN101101754B (zh) * 2007-06-25 2011-09-21 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN103413552A (zh) * 2013-08-29 2013-11-27 四川大学 一种音频水印嵌入和提取方法及装置
CN105304091B (zh) * 2015-06-26 2018-10-26 信阳师范学院 一种基于dct的语音篡改恢复方法
CN105895109B (zh) * 2016-05-10 2019-02-26 信阳师范学院 一种基于dwt和dct的数字语音取证和篡改恢复方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002049363A1 (en) * 2000-12-15 2002-06-20 Agency For Science, Technology And Research Method and system of digital watermarking for compressed audio
WO2005062297A1 (en) * 2003-12-19 2005-07-07 Koninklijke Philips Electronics N.V. Watermark embedding

Also Published As

Publication number Publication date
CN108877819A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
Fan et al. Chaos-based discrete fractional Sine transform domain audio watermarking scheme
CN101290772B (zh) 基于混合域系数矢量量化的音频零水印嵌入和提取方法
Wang et al. A robust digital audio watermarking based on statistics characteristics
CN107993669B (zh) 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
Dhar et al. A new audio watermarking system using discrete fourier transform for copyright protection
CN101345054A (zh) 用于声频文件的数字水印制作及识别方法
CN108682425B (zh) 一种基于恒定水印的鲁棒数字音频水印嵌入系统
Luo et al. Security analysis on spatial $\pm $1 steganography for JPEG decompressed images
CN106898358B (zh) 从时频分析角度出发的鲁棒数字音频水印算法
Dhar et al. Digital watermarking scheme based on fast Fourier transformation for audio copyright protection
Dhar et al. A new DCT-based watermarking method for copyright protection of digital audio
CN102867513B (zh) 一种基于伪Zernike矩的语音内容认证方法
CN108877819B (zh) 一种基于系数自相关度的语音内容取证方法
CN105895109B (zh) 一种基于dwt和dct的数字语音取证和篡改恢复方法
Al-Yaman et al. Audio-watermarking based ownership verification system using enhanced DWT-SVD technique
Vivekananda et al. Audio watermarking based on mean quantization in cepstrum domain
CN114999502B (zh) 基于自适应字分帧的语音内容水印生成、嵌入方法、语音内容的完整性认证及篡改定位方法
Chen et al. A multipurpose audio watermarking scheme for copyright protection and content authentication
Janardhanan et al. Performance analysis of discrete wavelet transform based audio watermarking on Indian classical songs
Dutta et al. An adaptive robust watermarking algorithm for audio signals using SVD
Pal et al. Survey Of Digital Watermarking Using Dct
Khan et al. A new audio watermarking method based on discrete cosine transform with a gray image
Singh et al. Fast fourier transformation based audio watermarking using random sample
Safitri et al. Audio Watermarking Combined with Compressive Sampling Based on QIM and DST-QR Techniques
Zhao et al. An audio watermarking algorithm for audio authentication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant