CN106601261A - 基于数字水印的回声抑制方法和系统 - Google Patents

基于数字水印的回声抑制方法和系统 Download PDF

Info

Publication number
CN106601261A
CN106601261A CN201510665436.7A CN201510665436A CN106601261A CN 106601261 A CN106601261 A CN 106601261A CN 201510665436 A CN201510665436 A CN 201510665436A CN 106601261 A CN106601261 A CN 106601261A
Authority
CN
China
Prior art keywords
audio
sequence
frequency
information
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510665436.7A
Other languages
English (en)
Inventor
屈振华
马涛
龙显军
郭英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201510665436.7A priority Critical patent/CN106601261A/zh
Publication of CN106601261A publication Critical patent/CN106601261A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本发明公开了一种基于数字水印的回声抑制方法和系统。本实施例的方法包括:根据获取到的远端音频和预先生成的水印信息W计算第一音频信通过音频播放单元播放第一音频信息;利用音频采集单元进行音频采集,以得到第二音频信息;从第二音频信息中提取出特征序列;计算模板音频水印信息与特征序列之间的相关度;根据相关度判断第二音频信息是否为回声;若判断第二音频信息为回声,则将第二音频信息置零。本实施例通过采用基于频域和离散对数变换的水印信息进行回声抑制,不会降低音频质量,并且对于音频的损失具有良好的鲁棒性,有助于在较低嵌入强度下仍能正常检测出水印,从而较为准确的检测回声。

Description

基于数字水印的回声抑制方法和系统
技术领域
本发明涉及语音通信领域,特别涉及一种基于数字水印的回声抑制方法和系统。
背景技术
自从语音通信出现以来,声学回声消除技术就应运而生,并且得到了广泛的重视。目前的大部分声学回声消除技术都是基于自适应滤波器的消除技术,是一种通过LMS算法(Least mean square,最小均方差算法)模拟声学回声参数的过程。但是采用滤波器方法存在以下缺陷,首先,为了更好的回声消除效果,人们往往通过更长的参数序列来模拟真实的回声环境,造成了计算复杂度的提升,也对储存空间提出了很高的要求,考虑到声学回声消除的过程很多情况下需要在硬件计算和存储能力很低的情况下进行该过程,例如在电话会议中,由于扬声器的声音多次反馈到麦克风引起了扬声器声音的叠加,从而造成了声学中的回声,导致通信质量的下降,因此简化回声消除的过程就变得尤为重要。但是现有技术中目前为止尚未发现关于水印嵌入在回声消除方面的应用。
发明内容
本发明实施例所要解决的一个技术问题是:采用水印进行回声消除的问题。
根据本发明实施例的一个方面,提供的一种基于数字水印的回声抑制方法,包括:根据获取到的远端音频s(n)和预先生成的水印信息W计算第一音频信息s'(n);通过音频播放单元播放第一音频信息s'(n);利用音频采集单元进行音频采集,以得到第二音频信息;从第二音频信息中提取出特征序列;计算模板音频水印信息与特征序列之间的相关度c(k);根据相关度判断第二音频信息是否为回声;若判断第二音频信息为回声,则将第二音频信息置零。
在一个实施例中,根据相关度判断第二音频信息是否为回声的步骤包括:判断相关度是否大于预定阈值;若相关度大于预定阈值,则确定第二音频信息为回声。
在一个实施例中,根据获取到的远端音频和预先生成的水印信息W计算第一音频信息s'(n)的步骤包括:对获取到的远端音频进行时频域变换,获得相应的第一频域序列,其中第一频域序列包括第一幅值序列A(x)和第一相位序列θ(x);根据第一幅值序列A(x)和预先生成的水印信息W得到第二幅值序列,以便利用第二幅值序列A'(x)和第一相位序列θ(x)构成第二频域序列;对第二频域序列进行时频域逆变换,获得第一音频信息s'(n)。
在一个实施例中,对获取到的远端音频进行时频域变换,获得相应的第一频域序列的步骤包括:利用公式:DFT(s(n))=A(x)×exp(jθ(x));计算第一频域序列DFT(s(n)),其中,s(n)为获取到的远端音频,A(x)为第一幅值序列,θ(x)为第一相位序列。
在一个实施例中,根据第一幅值序列和预先生成的水印信息W得到第二幅值序列的步骤包括:利用公式:A'(x)=A(x)×(1+α×W(r))计算第二幅值序列A'(x),其中α为水印嵌入强度,b=21/L,L为水印长度。
在一个实施例中,对第二频域序列进行时频域逆变换,获得第一音频信息s'(n)的步骤包括:利用公式:s'(n)=IDFT(A'(x))×exp(jθ(x));计算第一音频信息s'(n),其中IDFT为逆离散傅立叶变换。
在一个实施例中,从第二音频信息中提取出模板音频水印信息的步骤包括:对第二音频信息进行时频域变换,获得相应的第三频率序列,其中第三频域序列包括第三幅值序列和第三相位序列;将原始水印信息W补零,以得到模板音频水印信息,其中模板音频水印信息与特征序列的长度相同。
在一个实施例中,对第二音频信息进行时频域变换,获得相应的第三幅值序列的步骤包括:对第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
在一个实施例中,计算模板音频水印信息与特征序列之间的相关度的步骤包括:利用公式:计算模板音频水印信息与特征序列之间的相关度c(k),其中θu(x)为u(r)的相位谱,G(x)为模板音频水印信息的离散傅立叶变换,*表示对复数取共轭。
在一个实施例中,基于数字水印的回声抑制方法还包括:对获取到的远端音频进行去噪处理;对去噪处理后的音频进行人声侦测,若去噪处理后的音频包括人声音频,则执行根据获取到的远端音频和预先生成的水印信息W计算第一音频信息s(n)的步骤。
根据本发明实施例的一个方面,提供的一种基于数字水印的回声抑制系统,包括:计算单元、音频播放单元、音频采集单元、提取单元、判断单元和回声处理单元;计算单元,用于根据获取到的远端音频s(n)和预先生成的水印信息W计算第一音频信息s'(n);音频播放单元,用于播放第一音频信息s'(n);音频采集单元,用于进行音频采集,以得到第二音频信息;提取单元,用于从第二音频信息中提取出特征序列;计算单元,还用于计算模板音频水印信息与特征序列之间的相关度;判断单元,用于判断根据相关度判断第二音频信息是否为回声;回声处理单元,用于判断第二音频信息为回声时,将第二音频信息置零。
在一个实施例中,判断单元具体用于判断相关度是否大于预定阈值;若相关度大于预定阈值,则确定第二音频信息为回声。
在一个实施例中,计算单元具体用于:对获取到的远端音频进行时频域变换,获得相应的第一频域序列,其中第一频域序列包括第一幅值序列A(x)和第一相位序列θ(x);根据第一幅值序列A(x)和预先生成的水印信息W得到第二幅值序列,以便利用第二幅值序列A'(x)和第一相位序列θ(x)构成第二频域序列;对第二频域序列进行时频域逆变换,获得第一音频信息s'(n)。
在一个实施例中,计算单元具体利用公式:DFT(s(n))=A(x)×exp(jθ(x));计算第一频域序列DFT(s(n)),其中,s(n)为获取到的远端音频,A(x)为第一幅值序列,θ(x)为第一相位序列。
在一个实施例中,计算单元,
具体利用公式:A'(x)=A(x)×(1+α×W(r))
计算第二幅值序列A'(x),其中α为水印嵌入强度,其中,为第二傅里叶幅度序列,b=21/L,L为水印长度。
在一个实施例中,计算单元具体利用公式:s'(n)=IDFT(A'(x))×exp(jθ(x));计算第一音频信息s'(n),其中IDFT为逆离散傅立叶变换。
在一个实施例中,提取单元具体用于对第二音频信息进行时频域变换,获得相应的第三频率序列,其中第三频域序列包括第三幅值序列和第三相位序列;还用于原始水印信息W补零,以得到模板音频水印信息,其中模板音频水印信息与特征序列的长度相同。
在一个实施例中,提取单元,具体用于对所述第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
在一个实施例中,计算单元具体利用公式:
计算模板音频水印信息与特征序列之间的相关度c(k),其中θu(x)为u(r)的相位谱,G(x)为模板音频水印信息的离散傅立叶变换,*表示对复数取共轭。
在一个实施例中,基于数字水印的回声抑制系统还包括:去噪单元和人声侦测单元;去噪单元,用于对获取到的远端音频进行去噪处理;人声侦测单元,用于对去噪处理后的音频进行人声侦测,若去噪处理后的音频包括人声音频,则执行根据获取到的远端音频和预先生成的水印信息W计算第一音频信息s'(n)的步骤。
本实施例通过采用基于频域和离散对数变换的水印信息进行回声抑制,不会降低音频质量,并且对于音频的损失具有良好的鲁棒性,有助于在较低嵌入强度下仍能正常检测出水印,从而较为准确的检测回声。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明的基于数字水印的回声抑制方法的一个实施例的流程示意图。
图2示出本发明的基于数字水印的回声抑制方法计算第一音频信息的一个实施例的流程示意图。
图3示出本发明的基于数字水印的回声抑制方法提取出模板音频水印信息的再一个实施例的流程示意图。
图4示出采用本发明的基于数字水印的回声抑制方法前后的音频对比图。
图5示出本发明的基于数字水印的回声抑制系统的再一个实施例的结构示意图。
图6示出本发明的基于数字水印的回声抑制系统的再一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为本发明的一种基于数字水印的回声抑制方法的一个实施例的流程示意图。参考图1,该实施例的基于数字水印的回声抑制方法包括:
步骤S101,根据获取到的远端音频s(n)和预先生成的水印信息W计算第一音频信s'(n)。
步骤S102,通过音频播放单元播放第一音频信息s'(n)。
步骤S103,利用音频采集单元进行音频采集,以得到第二音频信息。
步骤S104,从第二音频信息中提取出第一特征序列。
步骤S105,计算模板水印信息与第一特征序列的之间的相关度。
步骤S106,根据相关度判断第二音频信息是否为回声。其中,在一个实施例中,根据相关度判断第二音频信息是否为回声的步骤包括:判断相关度是否大于预定阈值;若相关度大于预定阈值,则确定第二音频信息为回声。
步骤S107,若判断第二音频信息为回声,则将第二音频信息置零。
其中,在一个实施例中,本实施的方法还可以包括:
对获取到的远端音频进行去噪处理;对去噪处理后的音频进行人声侦测,若去噪处理后的音频包括人声音频,则执行根据获取到的远端音频和预先生成的水印信息W计算第一音频信息的步骤S201。
在一个实施例中,参考图2,根据获取到的远端音频和预先生成的水印信息W计算第一音频信息的步骤包括:
步骤S201,对获取到的远端音频进行时频域变换,获得相应的第一频域序列,其中第一频域序列包括第一幅值序列和第一相位序列。其中,获得第一频域序列具体采用以下公式计算:
DFT(s(n))=A(x)×exp(jθ(x));
其中,s(n)为获取到的远端音频,A(x)为第一幅值序列,θ(x)为第一相位序列。
步骤S202,根据第一幅值序列和预先生成的水印信息W得到第二幅值序列,以便利用第二幅值序列和第一相位序列构成第二频域序列。其中,在一个实施例中,具体利用公式:
A'(x)=A(x)×(1+α×W(r))
计算第二幅值序列A'(x),其中α为水印嵌入强度,b=21/L,L为水印长度,其中,floor()为向下取整函数,例如floor(x),即为取不大于x的最大整数。
步骤S203,对第二频域序列进行时频域逆变换,获得第一音频信息。其中,在一个实施例中,具体利用公式:
s'(n)=IDFT(A'(x))×exp(jθ(x));
计算第一音频信息s'(n),其中IDFT为逆离散傅立叶变换。
在一个实施例中,参考图3,从第二音频信息中提取出模板音频水印信息的步骤可以包括:
步骤S301,对第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
步骤S302,将原始水印信息W补零,以得到模板音频水印信息,其中模板音频水印信息与特征序列的长度相同。其中,在一个实施例中,对第二音频信息进行时频域变换,获得相应的第三幅值序列的步骤包括:对第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
在一个实施例中,计算模板音频水印信息与特征序列之间的相关度的步骤包括:
利用公式:
计算模板音频水印信息与特征序列之间的相关度c(k),其中θu(x)为u(r)的相位谱,G(x)为模板音频水印信息的离散傅立叶变换,*表示对复数取共轭。
下面通过具体实施例详述基于数字水印的回声抑制方法。
在本实施例中,采用基于数字水印的回声抑制方法,将一段35秒的人物对话中的回声部分消除,音频采用无损的WAV格式,实验中的音频频率为8000Hz,音频序列长度为238000。首先对远端音频进行分割,每段长度为4096。
生成长度L=240,由+1或-1构成的随机水印序列W,将长度为4096的远端音频进行离散傅里叶变换,得到第一幅值序列和第一相位值序列,其中,第一幅值序列和第一相位值序列长度均为4096,将预先设置的水印信息W嵌入第一幅值序列中,从而得到第二幅值序列,以便利用第二幅值序列构成第二频域序列具体采用公式:
A'(x)=A(x)×(1+α×W(r)),
其中α为水印嵌入强度,而b=21/L,其中R=0.2。
对获得的第二频域序列进行傅里叶逆变换,得到第一音频信息。
利用音频采集单元,音频采集单元例如可以为麦克风,进行音频采集。
对采集到的第二音频信息进行傅里叶变换。
对麦克风采集到的每个段声音进行离散傅里叶变换。
将傅里叶系数幅值进行离散对数坐标变换,并计算其u(r),
将预先生成水印序列W补零与u(r)等长得到g(r),然后与u(r)进行运算。得到相关度c(k)。如果c(k)大于预定阈值,则表明该远端音频为远端回声,则将该段音频置零。
参考图4,图4中的上方为回声消除之前的麦克风音频音轨图像,图4中下方的为经过本实施例中的基于数字水印的回声抑制方法处理后的音频音轨图像,从两幅音频音轨图可以看出,绝大多数的远端回声已经被消除。
图5为发明的基于数字水印的回声抑制系统的一个实施例的结构示意图,参考图5,本实施例的基于数字水印的回声抑制系统包括:计算单元501、音频播放单元502、音频采集单元503、提取单元504、判断单元505和回声处理单元506。
计算单元501,用于根据获取到的远端音频S(n)和预先生成的水印信息W计算第一音频信息;还用于计算模板音频水印信息与特征序列之间的相关度。
音频播放单元502,用于播放第一音频信息。
音频采集单元503,用于进行音频采集,以得到第二音频信息。
提取单元504,用于从第二音频信息中提取出模板音频水印信息。
判断单元505,用于判断根据相关度判断第二音频信息是否为回声。
回声处理单元506,用于判断第二音频信息为回声时,将第二音频信息置零。
在一个实施例中,判断单元505,具体用于判断相关度是否大于预定阈值;若相关度大于预定阈值,则确定第二音频信息为回声。
在一个实施例中,计算单元501,具体用于:对获取到的远端音频进行时频域变换,获得相应的第一频域序列,其中第一频域序列包括第一幅值序列和第一相位序列;根据第一幅值序列和预先生成的水印信息W得到第二幅值序列,以便利用第二幅值序列和第一相位序列构成第二频域序列;对第二频域序列进行时频域逆变换,获得第一音频信息。
在一个实施例中,计算单元501,具体利用公式:
DFT(s(n))=A(x)×exp(jθ(x));
计算第一频域序列DFT(s(n)),其中,s(n)为获取到的远端音频,A(x)为第一幅值序列,θ(x)为第一相位序列。
在一个实施例中,计算单元501,具体利用公式:
A'(x)=A(x)×(1+α×W(r))
计算第二幅值序列A'(x),其中α为水印嵌入强度,其中,为第二傅里叶幅度序列,b=21/L,L为水印长度。
在一个实施例中,计算单元501,具体利用公式:
s'(n)=IDFT(A'(x))×exp(jθ(x));
计算第一音频信息s'(n),其中IDFT为逆离散傅立叶变换。
在一个实施例中,提取单元504,具体用于对第二音频信息进行时频域变换,获得相应的第三频率序列,其中第三频域序列包括第三幅值序列和第三相位序列;还用于原始水印信息W补零,以得到模板音频水印信息,其中模板音频水印信息与特征序列的长度相同。
在一个实施例中,提取单元504,具体用于对第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
在一个实施例中,计算单元501,具体利用公式:
计算模板音频水印信息与特征序列之间的相关度c(k),其中θu(x)为u(r)的相位谱,G(x)为模板音频水印信息的离散傅立叶变换,*表示对复数取共轭。
参考图6,在一个实施例中,基于数字水印的回声抑制系统还包括:去噪单元607和人声侦测单元608。
去噪单元607,用于对获取到的远端音频进行去噪处理。
人声侦测单元608,用于对去噪处理后的音频进行人声侦测,若去噪处理后的音频包括人声音频,则执行根据获取到的远端音频和预先生成的水印信息W计算第一音频信息的步骤。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (20)

1.一种基于数字水印的回声抑制方法,其特征在于,包括:
根据获取到的远端音频s(n)和预先生成的水印信息W计算第一音频信息s'(n);
通过音频播放单元播放第一音频信息s'(n);
利用音频采集单元进行音频采集,以得到第二音频信息;
从第二音频信息中提取出特征序列;
计算模板音频水印信息与特征序列之间的相关度c(k);
根据相关度判断第二音频信息是否为回声;
若判断第二音频信息为回声,则将第二音频信息置零。
2.根据权利要求1所述的方法,其特征在于,
根据相关度判断第二音频信息是否为回声的步骤包括:
判断所述相关度是否大于预定阈值;
若所述相关度大于预定阈值,则确定第二音频信息为回声。
3.根据权利要求2所述的方法,其特征在于,
根据获取到的远端音频和预先生成的水印信息W计算第一音频信息s'(n)的步骤包括:
对获取到的远端音频进行时频域变换,获得相应的第一频域序列,其中第一频域序列包括第一幅值序列A(x)和第一相位序列θ(x);
根据所述第一幅值序列A(x)和预先生成的水印信息W得到第二幅值序列,以便利用第二幅值序列A'(x)和第一相位序列θ(x)构成第二频域序列;
对第二频域序列进行时频域逆变换,获得所述第一音频信息s'(n)。
4.根据权利要求3所述的方法,其特征在于,
对获取到的远端音频进行时频域变换,获得相应的第一频域序列的步骤包括:
利用公式:
DFT(s(n))=A(x)×exp(jθ(x));
计算第一频域序列DFT(s(n)),其中,s(n)为获取到的远端音频,A(x)为第一幅值序列,θ(x)为第一相位序列。
5.根据权利要求4所述的方法,其特征在于,
根据所述第一幅值序列和预先生成的水印信息W得到第二幅值序列的步骤包括:
利用公式:
A'(x)=A(x)×(1+α×W(r));
计算第二幅值序列A'(x),其中α为水印嵌入强度,b=21/L,L为水印长度。
6.根据权利要求5所述的方法,其特征在于,
对第二频域序列进行时频域逆变换,获得所述第一音频信息s'(n)的步骤包括:
利用公式:
s'(n)=IDFT(A'(x))×exp(jθ(x));
计算第一音频信息s'(n),其中IDFT为逆离散傅立叶变换。
7.根据权利要求6所述的方法,其特征在于,
从第二音频信息中提取出模板音频水印信息的步骤包括;
对所述第二音频信息进行时频域变换,获得相应的第三频率序列,其中第三频域序列包括第三幅值序列和第三相位序列;
将原始水印信息W补零,以得到模板音频水印信息,其中模板音频水印信息与特征序列的长度相同。
8.根据权利要求7所述的方法,其特征在于,
对所述第二音频信息进行时频域变换,获得相应的特征序列的步骤包括:
对所述第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);
将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
u ( r ) = { Σ r B ( x ) | r = f l o o r ( log b x R ) + L ^ / 2 } .
9.根据权利要求8所述的方法,其特征在于,
计算模板音频水印信息与特征序列之间的相关度的步骤包括:
利用公式:
c ( k ) = r e a l ( I D F T ( G * ( x ) e jθ u ( x ) ) ) ,
计算模板音频水印信息与特征序列之间的相关度c(k),其中θu(x)为u(r)的相位谱,G(x)为模板音频水印信息的离散傅立叶变换,*表示对复数取共轭。
10.根据权利要求1-9中任一项所述的方法,其特征在于,还包括:
对获取到的远端音频进行去噪处理;
对去噪处理后的音频进行人声侦测,若去噪处理后的音频包括人声音频,则执行根据获取到的远端音频和预先生成的水印信息W计算第一音频信息s(n)的步骤。
11.一种基于数字水印的回声抑制系统,其特征在于,其特征在于,包括:计算单元、音频播放单元、音频采集单元、提取单元、判断单元和回声处理单元;
计算单元,用于根据获取到的远端音频s(n)和预先生成的水印信息W计算第一音频信息s'(n);
音频播放单元,用于播放第一音频信息s'(n);
音频采集单元,用于进行音频采集,以得到第二音频信息;
提取单元,用于从第二音频信息中提取出模板音频水印信息;
计算单元,还用于计算模板音频水印信息与特征序列之间的相关度;
判断单元,用于判断根据相关度判断第二音频信息是否为回声;
回声处理单元,用于判断第二音频信息为回声时,将第二音频信息置零。
12.根据权利要求11所述的系统,其特征在于,
所述判断单元具体用于判断所述相关度是否大于预定阈值;若所述相关度大于预定阈值,则确定第二音频信息为回声。
13.根据权利要求12所述的系统,其特征在于,
计算单元具体用于对获取到的远端音频进行时频域变换,获得相应的第一频域序列,其中第一频域序列包括第一幅值序列A(x)和第一相位序列θ(x);
根据所述第一幅值序列A(x)和预先生成的水印信息W得到第二幅值序列,以便利用第二幅值序列A'(x)和第一相位序列θ(x)构成第二频域序列;
对第二频域序列进行时频域逆变换,获得所述第一音频信息s'(n)。
14.根据权利要求13所述的系统,其特征在于,
所述计算单元,具体利用公式:
DFT(s(n))=A(x)exp(jθ(x));
计算第一频域序列DFT(s(n)),其中,s(n)为获取到的远端音频,A(x)为第一幅值序列,θ(x)为第一相位序列。
15.根据权利要求14所述的系统,其特征在于,
所述计算单元具体利用公式:
A'(x)=A(x)×(1+α×W(r))
计算第二幅值序列A'(x),其中α为水印嵌入参数, r = f l o o r ( log b x R ) + L / 2 , b = 2 1 / L , L为水印长度。
16.根据权利要求15所述的系统,其特征在于,
所述计算单元具体利用公式:
s'(n)=IDFT(A'(x))×exp(jθ(x));
计算第一音频信息s'(n),其中IDFT为逆离散傅立叶变换。
17.根据权利要求16所述的系统,其特征在于,
所述提取单元具体用于对所述第二音频信息进行时频域变换获得相应的第三频率序列,其中第三频域序列包括第三幅值序列和第三相位序列;还用于将原始水印信息W补零,以得到模板音频水印信息,其中模板音频水印信息与特征序列的长度相同。
18.根据权利要求17所述的系统,其特征在于,
提取单元,具体用于对所述第二音频信息进行时频域变换,获得相应的第三幅值序列B(x);将具有相同r的B(x)进行累加,以得到特征序列u(r),其中:
u ( r ) = { Σ r B ( x ) | r = f l o o r ( log b x R ) + L ^ / 2 } .
19.根据权利要求18所述的系统,其特征在于,
所述计算单元具体利用公式:
c ( k ) = r e a l ( I D F T ( G * ( x ) e jθ u ( x ) ) ) ,
计算模板音频水印信息与特征序列之间的相关度c(k),其中θu(x)为u(r)的相位谱,G(x)为模板音频水印信息的离散傅立叶变换,*表示对复数取共轭。
20.根据权利要求11-19中任一项所述的系统,其特征在于,还包括:去噪单元和人声侦测单元;
去噪单元,用于对获取到的远端音频进行去噪处理;
人声侦测单元,用于对去噪处理后的音频进行人声侦测,若去噪处理后的音频包括人声音频,则执行根据获取到的远端音频和预先生成的水印信息W计算第一音频信息s'(n)的步骤。
CN201510665436.7A 2015-10-15 2015-10-15 基于数字水印的回声抑制方法和系统 Pending CN106601261A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510665436.7A CN106601261A (zh) 2015-10-15 2015-10-15 基于数字水印的回声抑制方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510665436.7A CN106601261A (zh) 2015-10-15 2015-10-15 基于数字水印的回声抑制方法和系统

Publications (1)

Publication Number Publication Date
CN106601261A true CN106601261A (zh) 2017-04-26

Family

ID=58553413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510665436.7A Pending CN106601261A (zh) 2015-10-15 2015-10-15 基于数字水印的回声抑制方法和系统

Country Status (1)

Country Link
CN (1) CN106601261A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956976A (zh) * 2019-12-17 2020-04-03 苏州科达科技股份有限公司 一种回声消除方法、装置、设备及可读存储介质
WO2020228528A1 (zh) * 2019-05-14 2020-11-19 腾讯科技(深圳)有限公司 背景音频信号滤除方法、装置及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005078658A1 (en) * 2004-02-14 2005-08-25 Koninklijke Philips Electronics N.V. Watermark detection
CN101101754A (zh) * 2007-06-25 2008-01-09 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN101330610A (zh) * 2008-07-22 2008-12-24 华为技术有限公司 水印嵌入方法及装置、提取方法及装置和处理系统
CN101494053A (zh) * 2008-01-21 2009-07-29 汤姆森许可贸易公司 确定添加了水印的信号中是否存在参考图案的方法和设备
CN102208187A (zh) * 2010-03-30 2011-10-05 尼尔森(美国)有限公司 对大致无声的媒体内容呈现加注音频水印的方法和设备
CN102237093A (zh) * 2011-05-23 2011-11-09 南京邮电大学 一种基于前后向回声核的回声隐藏方法
WO2011141292A1 (en) * 2010-05-11 2011-11-17 Thomson Licensing Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal
US20140270194A1 (en) * 2013-03-12 2014-09-18 Comcast Cable Communications, Llc Removal of audio noise
WO2014161785A1 (en) * 2013-04-02 2014-10-09 Thomson Licensing Method and apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise
WO2015108535A1 (en) * 2014-01-17 2015-07-23 Intel Corporation Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005078658A1 (en) * 2004-02-14 2005-08-25 Koninklijke Philips Electronics N.V. Watermark detection
CN101101754A (zh) * 2007-06-25 2008-01-09 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN101494053A (zh) * 2008-01-21 2009-07-29 汤姆森许可贸易公司 确定添加了水印的信号中是否存在参考图案的方法和设备
CN101330610A (zh) * 2008-07-22 2008-12-24 华为技术有限公司 水印嵌入方法及装置、提取方法及装置和处理系统
CN102208187A (zh) * 2010-03-30 2011-10-05 尼尔森(美国)有限公司 对大致无声的媒体内容呈现加注音频水印的方法和设备
WO2011141292A1 (en) * 2010-05-11 2011-11-17 Thomson Licensing Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal
CN102237093A (zh) * 2011-05-23 2011-11-09 南京邮电大学 一种基于前后向回声核的回声隐藏方法
US20140270194A1 (en) * 2013-03-12 2014-09-18 Comcast Cable Communications, Llc Removal of audio noise
WO2014161785A1 (en) * 2013-04-02 2014-10-09 Thomson Licensing Method and apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise
WO2015108535A1 (en) * 2014-01-17 2015-07-23 Intel Corporation Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MALIK H, FARID H.: "Audio forensics from acoustic reverberation", <ICASSP> *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020228528A1 (zh) * 2019-05-14 2020-11-19 腾讯科技(深圳)有限公司 背景音频信号滤除方法、装置及存储介质
CN110956976A (zh) * 2019-12-17 2020-04-03 苏州科达科技股份有限公司 一种回声消除方法、装置、设备及可读存储介质
CN110956976B (zh) * 2019-12-17 2022-09-09 苏州科达科技股份有限公司 一种回声消除方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN104040627B (zh) 用于风噪声检测的方法和设备
KR101798120B1 (ko) 능동 잡음 제거와 지각적 잡음 보상의 결합에 의해 음향 재생의 지각 품질을 향상시키기 위한 장치 및 방법
CN104157295B (zh) 用于检测及抑制瞬态噪声的方法
EP2905778B1 (en) Echo cancellation method and device
US10741195B2 (en) Sound signal enhancement device
EP1891624B1 (en) Multi-sensory speech enhancement using a speech-state model
CN104067339B (zh) 噪音抑制装置
CN105957520A (zh) 一种适用于回声消除系统的语音状态检测方法
KR20120116442A (ko) 노이즈 억제 시스템을 위한 왜곡 측정
CN107924684A (zh) 使用半盲自适应滤波器模型的通信终端的声学击键瞬态消除器
CN112687288A (zh) 回声消除方法、装置、电子设备和可读存储介质
Perez-Meana Advances in Audio and Speech Signal Processing: Technologies and Applications: Technologies and Applications
CN104937955B (zh) 自动的扬声器极性检测
CN106031196A (zh) 信号处理装置、方法以及程序
CN106601261A (zh) 基于数字水印的回声抑制方法和系统
WO2023092955A1 (zh) 音频信号处理方法及装置
CN111223492A (zh) 一种回声路径延迟估计方法及装置
CN110718229A (zh) 录音回放攻击的检测方法及对应检测模型的训练方法
Peer et al. Reverberation matching for speaker recognition
CN111462770A (zh) 一种基于lstm的后期混响抑制方法及系统
JP2010206449A (ja) 発話向き推定装置、方法及びプログラム
JP2004274234A (ja) 音響信号の残響除去方法、装置、及び音響信号の残響除去プログラム、そのプログラムを記録した記録媒体
CN110246516B (zh) 一种语音通信中小空间回声信号的处理方法
JP6305273B2 (ja) 評価値算定方法及び空間特性設計方法
JP6519801B2 (ja) 信号解析装置、方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170426