CN113782041B - 一种基于音频变频域的嵌入和定位水印的方法 - Google Patents

一种基于音频变频域的嵌入和定位水印的方法 Download PDF

Info

Publication number
CN113782041B
CN113782041B CN202111075679.7A CN202111075679A CN113782041B CN 113782041 B CN113782041 B CN 113782041B CN 202111075679 A CN202111075679 A CN 202111075679A CN 113782041 B CN113782041 B CN 113782041B
Authority
CN
China
Prior art keywords
watermark
voice
dct
embedding
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111075679.7A
Other languages
English (en)
Other versions
CN113782041A (zh
Inventor
李平
蒋升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suirui Technology Group Co Ltd
Original Assignee
Suirui Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suirui Technology Group Co Ltd filed Critical Suirui Technology Group Co Ltd
Priority to CN202111075679.7A priority Critical patent/CN113782041B/zh
Publication of CN113782041A publication Critical patent/CN113782041A/zh
Application granted granted Critical
Publication of CN113782041B publication Critical patent/CN113782041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种基于音频变频域的嵌入和定位水印的方法,属于音频数字水印的领域,该嵌入方法包括:S1:对原始音频进行分帧,并且对每个分帧进行采样和DCT变换,得到相应的子带以及其DCT系数;S2:对一帧语音中的频率为6kHz‑7kHZ的高频子带进行VAD检测和拼帧操作,用于获取语音段;其中,VAD检测和拼帧操作包括:获取子带的语音能量谱,生成语音信号的FBANK特征,以及拼帧形成语音数据;S3:在语音段中,根据水印信息和同步信息生成水印位;S4:在语音段中每个水印位嵌入水印,得到带水印的信号;S5:对带水印的信号进行IDCT变换,得到带水印的音频信号。本发明添加的水印具有极好的透明性,没有明显的感知失真。

Description

一种基于音频变频域的嵌入和定位水印的方法
技术领域
本发明属于音频数字水印的领域,具体涉及一种基于音频变频域的嵌入和定位水印的方法。
背景技术
数字水印技术是一种信息隐藏技术,所谓音频数字水印算法,就是将数字水印通过水印嵌入算法,嵌入到音频文件中(如wav,mp3,avi等等),但是又对音频文件原有音质无太大影响,或者人耳感觉不到它的影响。相反的又通过水印提取算法,将音频数字水印从音频宿主文件中完整的提取出来,而这嵌入的水印,和提取出来的水印,就叫音频数字水印。
与图像水印技术相比,在数字音频信号中嵌入水印的技术难度较大,主要是因为人类的听觉系统与视觉系统相比,具有更高的灵敏度。人类的听觉系统对加性噪声特别敏感,如果采用加性法则在时域嵌入水印,很难在水印的鲁棒性和不可感知性之间达到合理的折中。虽然听觉系统的动态范围很大,但是理由其它特性,仍有可能在音频信号中嵌入水印。例如,可利用听觉系统的掩蔽效应、听觉系统对绝对相位不敏感等特性来嵌入水印。听觉系统的掩蔽特性表明了在音频信号中添加水印的可行性。
音频水印基本上可以分为时域和变换域两大类。时域的思想是在时域新号上直接叠加上水印,比如:LSB方法、Echo方法,拼接法,pitch提取方法等。变环域的思想是在计算处理上更加快速和方便,实际上是将一个时域信号变换到其他域上的信号,然后进行加水印,再逆变换到原来域中的信号。如FFT、DCT、DWT、SVD等,而原始的DCT水印算法中会增加过多的伪随机噪声,在人耳听感上很明显,并且水印很容易被攻击。
有鉴于此,特提出本发明。
发明内容
本发明的目的是提供一种基于音频变频域的嵌入和定位水印的方法,其添加的水印具有极好的透明性,没有明显的感知失真。
为了实现上述目的,本发明提供的一种基于音频变频域的嵌入水印的方法,包括以下步骤:
S1:对原始音频进行分帧,并且对每个分帧进行采样和DCT变换,得到相应的子带以及其DCT系数;
S2:对一帧语音中的频率为6kHz-7kHZ的高频子带进行VAD检测和拼帧操作,用于获取语音段;其中,VAD检测和拼帧操作包括:获取子带的语音能量谱,生成语音信号的FBANK特征,以及拼帧形成语音数据;
S3:在语音段中,根据水印信息和同步信息生成水印位;
S4:在语音段中每个水印位嵌入水印,得到带水印的信号;
S5:对带水印的信号进行IDCT变换,得到带水印的音频信号。
进一步地,所述步骤S2还包括以下步骤:判断该语音数据是否为语音段,如果是则进行步骤S3,如果不是则重新选取下一帧进行VAD检测。
进一步地,所述步骤S2具体包括以下步骤:
S201:对高频子带进行加汉宁窗操作,之后进行FFT变换,得到语音能量谱;
S202:将语音能量谱通过一组Mel尺度的三角形滤波器组之后取对数,生成语音信号的FBANK特征,并且根据FBANK特征选择语音能量谱的第2到6频带;
S203:选取2到6频带对应帧作为当前帧,将其前5帧和后5帧进行拼帧,形成11帧的语音数据;
S204:拼帧后的语音数据输入到全连接层,获取语音段。
进一步地,所述步骤S3具体包括:在语音段中,根据水印的二进制数进行扩频,使用噪声发生器根据水印信息和同步信息产生M个线性不相关的AWGN序列作为水印位,相邻序列向量之间的间距等于高频子带的采样点个数的大小。
进一步地,所述步骤S4中,在每个语音段的开始的4帧中依次嵌入同步码、水印、同步码、水印。
进一步地,所述步骤S4包括:
在频率为6kHz-7kHZ的高频子带中对应的采样点中嵌入水印;嵌入的水印需满足以下条件:当前水印大于0时,如果当前水印的平均值比之前一帧的水印值小,则FrameDCT=DCT/Var_Dct_value*Pre_Dct_value,否则,不做任何操作;当水印值小于等于0时,不做任何操作;
其中,FrameDCT为当前子带范围内嵌入的水印值;DCT为当前子带的采样点值;Var_Dct_value为当前子带对应的采样点的均值;Pre_Dct_value为前一个子带的采样点的均值。
更进一步地,所述步骤S5中的IDCT变换为步骤S1中DCT变换的逆。
本发明还提供了一种基于音频变频域的定位水印的方法,包括以下步骤:
S11:对带水印的音频进行分帧,并且对每个分帧进行采样和DCT变换,得到每个采样点对应的频域子带;
S12:对一帧语音中的所有频带进行VAD检测和拼帧操作,得到语音段;其中,VAD检测和拼帧操作包括:获取子带的语音能量谱,生成语音信号的FBANK特征,以及拼帧形成语音数据;
S13:利用语音段中的同步码,检测与设置的同步码是否一致,以判断是否为同步帧,如果为同步帧,则进行步骤S14,如果不为同步帧,则返回步骤S12,选择下一帧语音进行判定;
S14:基于同步码识别水印段,进而通过计算DCT系数获取当前水印的位置。
进一步地,所述步骤S12具体包括以下步骤:
S1201:对一帧语音中的所有频带进行加汉宁窗操作,之后进行FFT变换,得到语音能量谱;
S1202:将语音能量谱通过一组Mel尺度的三角形滤波器组之后取对数,生成语音信号的FBANK特征,并且选根据FBANK特征选择语音能量谱的第2到6频带;
S1203:取2到6频带对应帧作为当前帧,将其前5帧和后5帧进行拼帧,形成11帧的语音数据;
S1204:拼帧后的语音数据输入到全连接层,如果全连接层的输出结果是0,则判断拼帧后的语音为不是语音段;如果全连接层的输出结果是1,则判断拼帧后的语音为是语音段。
更进一步地,所述步骤S14中,所述DCT系数与伪随机噪声块之间的相关性的计算方法如下所示:
RSg=S(W).G(W)
其中,S(W)表示带水印信号的DCT的频域系数矩阵,G(W)代表伪随机噪声块的矩阵,两个矩阵相乘,得到互相关向量RSg
本发明提供的一种基于音频变频域的嵌入和定位水印的方法,对比现有技术中的算法,提出的在全频带进行vad操作,使得解水印的时候更加准确;根据筛选出符合条件的子带,根据加水印系统步骤的算法进行添加更加少量的伪随机码噪声,可在水印的透明性更加好,人的不可感知性更强。
附图说明
图1为本具体实施方式中的基于音频变频域的嵌入水印的方法的流程图。
图2为本具体实施方式中的基于音频变频域的定位水印的方法的流程图。
图3为本具体实施方式中的使用的汉明窗函数的示意图。
图4为本具体实施方式中的实用的全连接层的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合具体实施方式对本发明作进一步的详细说明。
如图1所示,本发明的一实施方式为一种基于音频变频域的嵌入水印的方法,其通过对VAD操作选取特定频带进行拼帧,并且选取前5帧和后5帧拼帧形成11帧的语音数据来嵌入水印;并且在指定的带宽采样点中嵌入水印,实现新的嵌入水印的方法。
该嵌入水印的方法具体包括以下步骤:
S1:对原始音频进行分帧,并且对每个分帧进行采样和DCT变换(Discrete CosineTransform,离散余弦变换),得到每个采样点对应的频域子带以及每帧的DCT系数。
该DCT系数的计算方法如下:
其中,C(0)表示第0个DCT系数;N为信号采样点个数,本发明中,选取N为1024,C(i)表示第i个DCT系数,i=1,2,3,…,N-1;y(x)表示原始信号。
S2:对一帧语音中的DCT指定的高频子带范围进行VAD检测(Voice ActivityDetection,语音活动检测)和拼帧操作,用于获取语音段。本步骤的目的是从语音信号流里识别和消除长时间的静音期。其中,DCT指定的高频子带的频率分为为6kHz-7kHZ。
在该步骤中,VAD检测和拼帧操作包括:获取子带的语音能量谱,生成语音信号的FBANK特征,以及拼帧形成语音数据;之后判断该语音数据是否为语音段,如果是则进行步骤S3,如果不是则重新选取下一帧进行VAD检测。
具体地,该步骤S2具体包括以下步骤:
S201:对DCT指定的高频子带(6kHz-7kHZ)进行加汉宁窗操作,之后进行FFT变换(Fast Fourier Transform,快速傅里叶变换),得到语音能量谱。
其中,本步骤中使用的汉宁窗函数如图3所示。
并且,本步骤中,加窗操作即与汉宁窗函数相乘;加窗之后是为了进行傅里叶展开。加窗之后的音频分帧具有以下优点:全局更加连续,避免出现吉布斯效应;加窗时候,原本没有周期性的语音信号呈现出周期函数的部分特征。
S202:将语音能量谱通过一组Mel尺度的三角形滤波器组之后取对数,生成语音信号的FBANK特征,并且根据FBANK特征选择语音能量谱的第2到6频带。
S203:选取2到6频带对应帧作为当前帧,将其前5帧和后5帧进行拼帧,形成11帧的语音数据。
S204:拼帧后的语音数据输入到全连接层,如果全连接层的输出结果是0,则判断拼帧后的语音为不是语音段;如果全连接层的输出结果是1,则判断拼帧后的语音为是语音段。
其中,全连接层如图4所示,拼帧后的数据经过全连接层,第一层是128个节点,第二层是128个节点,第三层是64个节点,第四层是64个节点,第五层是32个节点,第六层是32个节点,第七层是2个节点,最后输出的标签是0或者1。
S3:在语音段中,根据同步码信息和水印信息生成水印位。
其中,每个语音段的开始的4帧中依次嵌入同步码、水印、同步码、水印,嵌入信息结构如下表格中所示:
同步码 水印 同步码 水印
在提取水印的时候,通过同步码信息能够精准定位到当前数据中包含水印,区别于水印信息。
具体地,在语音段中,根据水印的二进制数进行扩频,并且根据水印信息和同步信息产生M个线性不相关([-1,1])的序列向量作为水印位,相邻序列向量之间的间距等于DCT指定的高频子带(6kHz-7kHZ)的采样点个数的大小。
S4:在语音段中每个水印位嵌入水印,得到带水印的信号。
具体地,在频率为6kHz-7kHZ的高频子带中对应的采样点中嵌入水印;嵌入的水印需满足以下条件:当前水印值大于0时,如果当前水印的平均值比之前一帧的水印值小,则FrameDCT=DCT/Var_Dct_value*Pre_Dct_value,否则,不做任何操作;当水印值小于等于0时,不做任何操作。
其中,FrameDCT为当前子带范围内嵌入的水印值;DCT为当前子带的采样点值;Var_Dct_value为当前子带对应的采样点的均值;Pre_Dct_value为前一个子带的采样点的均值。
S5:对带水印的信号进行IDCT变换(逆离散余弦变换),得到带水印的音频信号。
IDCT变换的计算方法如下:
其具体算法相当于步骤S1中DCT变换的逆,得到的结果为嵌入水印后的音频信号。
通过上述基于音频变频域的嵌入水印的方法,能够对字频进行VAD操作,能够筛选出合适的子带进行添加水印,并且通过步骤S4来嵌入水印时,能够添加更少量的伪随机码噪声,水印的透明度更高。
此外,如图2所示,本发明的一实施方式为一种基于音频变频域的定位水印的方法,其通过对全频道进行VAD操作以进行拼帧,并且形成11帧的语音数据来读取水印。
该定位水印的方法具体包括以下步骤:
S11:对带水印的音频进行分帧,并且对每个分帧进行采样和DCT变换,得到每个采样点对应的频域子带。
S12:对一帧语音中的所有频带进行VAD检测和拼帧操作,得到语音段。其中,VAD检测和拼帧操作包括:获取子带的语音能量谱,生成语音信号的FBANK特征,以及拼帧形成语音数据。
具体地,该VAD检测操作包括以下步骤:
S1201:对一帧语音中的所有频带进行加汉宁窗操作,之后进行FFT变换(FastFourier Transform,快速傅里叶变换),得到语音能量谱。
其中,本步骤中使用的汉宁窗函数如图3所示。
并且,本步骤中,加窗操作即与汉宁窗函数相乘;加窗之后是为了进行傅里叶展开。加窗之后的音频分帧具有以下优点:全局更加连续,避免出现吉布斯效应;加窗时候,原本没有周期性的语音信号呈现出周期函数的部分特征。
S1202:将语音能量谱通过一组Mel尺度的三角形滤波器组之后取对数,生成语音信号的FBANK特征,并且选根据FBANK特征选择语音能量谱的第2到6频带。
S1203:取2到6频带对应帧作为当前帧,将其前5帧和后5帧进行拼帧,形成11帧的语音数据。
S1204:拼帧后的语音数据输入到全连接层,如果全连接层的输出结果是0,则判断拼帧后的语音为不是语音段;如果全连接层的输出结果是1,则判断拼帧后的语音为是语音段。
其中,全连接层如图4所示,拼帧后的数据经过全连接层,第一层是128个节点,第二层是128个节点,第三层是64个节点,第四层是64个节点,第五层是32个节点,第六层是32个节点,第七层是2个节点,最后输出的标签是0或者1。
S13:利用语音段中的同步码,检测与设置的同步码是否一致,如果一致,则找到同步帧的位置,则判定为同步帧并进行步骤S41,如果不一致,则不为同步帧并返回步骤S12,选择下一帧语音进行判定。
S14:基于同步码识别水印段,进而通过计算DCT系数获取当前水印的位置。
具体地,基于同步码识别水印段,然后计算水印段的DCT系数、对应子带的DCT系数与伪随机噪声块之间的相关性,提取最大相关的向量索引值,作为当前水印的bit位。
该DCT系数的计算方法如下:
其中,C(0)表示第0个DCT系数;N为信号采样点个数;C(i)表示第i个DCT系数,i=1,2,3,…,N-1;y(x)表示原始信号。
该DCT系数与伪随机噪声块之间的相关性的计算方法如下所示:
RSg=S(W).G(W)
其中,S(W)表示带水印信号的DCT的频域系数矩阵,G(W)代表伪随机噪声块的矩阵,两个矩阵相乘,得到互相关向量RSg
通过上述基于音频变频域的定位水印的方法通过在全频带进行VAD操作,进而识别语音段,能够快速地筛选出语音段,进而对水印进行识别。
本文中应用了具体个例对发明构思进行了详细阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离该发明构思的前提下,所做的任何显而易见的修改、等同替换或其他改进,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于音频变频域的嵌入水印的方法,其特征在于, 包括以下步骤:
S1:对原始音频进行分帧,并且对每个分帧进行采样和DCT变换,得到相应的子带以及其DCT系数;
S2:对一帧语音中的频率为6kHz-7kHZ的高频子带进行VAD检测和拼帧操作,用于获取语音段;其中,VAD检测和拼帧操作包括:获取子带的语音能量谱,生成语音信号的FBANK特征,以及拼帧形成语音数据;
S3:在语音段中,根据水印信息和同步信息生成水印位;
S4:在语音段中每个水印位嵌入水印,得到带水印的信号;所述步骤S4包括:
在频率为6kHz-7kHZ的高频子带中对应的采样点中嵌入水印;嵌入的水印需满足以下条件:当前水印大于0时,如果当前水印的平均值比之前一帧的水印值小,则FrameDCT=DCT/Var_Dct_value *Pre_Dct_value,否则,不做任何操作;当水印值小于等于0时,不做任何操作;
其中,FrameDCT为当前子带范围内嵌入的水印值;DCT为当前子带的采样点值;Var_Dct_value为当前子带对应的采样点的均值;Pre_Dct_value为前一个子带的采样点的均值;
S5:对带水印的信号进行IDCT变换,得到带水印的音频信号。
2.根据权利要求1所述的基于音频变频域的嵌入水印的方法,其特征在于,所述步骤S2还包括以下步骤:判断该语音数据是否为语音段,如果是则进行步骤S3,如果不是则重新选取下一帧进行VAD检测。
3.根据权利要求1所述的基于音频变频域的嵌入水印的方法,其特征在于,所述步骤S2具体包括以下步骤:
S201:对高频子带进行加汉宁窗操作,之后进行FFT变换,得到语音能量谱;
S202:将语音能量谱通过一组Mel尺度的三角形滤波器组之后取对数,生成语音信号的FBANK特征,并且根据FBANK特征选择语音能量谱的第2到6频带;
S203:选取2到6频带对应帧作为当前帧,将其前5帧和后5帧进行拼帧,形成11帧的语音数据;
S204:拼帧后的语音数据输入到全连接层,获取语音段。
4.根据权利要求1所述的基于音频变频域的嵌入水印的方法,其特征在于,所述步骤S3具体包括:在语音段中,根据水印的二进制数进行扩频,使用噪声发生器根据水印信息和同步信息产生M个线性不相关的AWGN序列作为水印位,相邻序列向量之间的间距等于高频子带的采样点个数的大小。
5.根据权利要求1所述的基于音频变频域的嵌入水印的方法,其特征在于,所述步骤S4中,在每个语音段的开始的4帧中依次嵌入同步码、水印、同步码、水印。
6.根据权利要求1所述的基于音频变频域的嵌入水印的方法,其特征在于,所述步骤S5中的IDCT变换为步骤S1中DCT变换的逆。
CN202111075679.7A 2021-09-14 2021-09-14 一种基于音频变频域的嵌入和定位水印的方法 Active CN113782041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111075679.7A CN113782041B (zh) 2021-09-14 2021-09-14 一种基于音频变频域的嵌入和定位水印的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111075679.7A CN113782041B (zh) 2021-09-14 2021-09-14 一种基于音频变频域的嵌入和定位水印的方法

Publications (2)

Publication Number Publication Date
CN113782041A CN113782041A (zh) 2021-12-10
CN113782041B true CN113782041B (zh) 2023-08-15

Family

ID=78843706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111075679.7A Active CN113782041B (zh) 2021-09-14 2021-09-14 一种基于音频变频域的嵌入和定位水印的方法

Country Status (1)

Country Link
CN (1) CN113782041B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999502B (zh) * 2022-05-19 2023-01-06 贵州财经大学 基于自适应字分帧的语音内容水印生成、嵌入方法、语音内容的完整性认证及篡改定位方法
CN116434762B (zh) * 2023-06-14 2023-09-08 北京中电慧声科技有限公司 一种听觉无感的音频模拟水印加注方法及装置
CN116524940B (zh) * 2023-07-04 2023-09-08 北京中电慧声科技有限公司 语音生成过程听觉无感模拟水印嵌入方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
CA2444151A1 (en) * 2002-10-04 2004-04-04 Heping Ding Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
WO2004051918A1 (en) * 2002-11-27 2004-06-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Watermarking digital representations that have undergone lossy compression
CN1585020A (zh) * 2004-05-28 2005-02-23 中山大学 一种数字音频防篡改方法
CA2527011A1 (en) * 2004-11-19 2006-05-19 Lg Electronics Inc. Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same
KR20060059112A (ko) * 2004-11-26 2006-06-01 강희조 디지털 워터마크 데이터 삽입 및 추출방법
WO2010021966A1 (en) * 2008-08-21 2010-02-25 Dolby Laboratories Licensing Corporation Feature optimization and reliability estimation for audio and video signature generation and detection
CN103208289A (zh) * 2013-04-01 2013-07-17 上海大学 一种可抵抗重录音攻击的数字音频水印方法
WO2014120685A1 (en) * 2013-02-04 2014-08-07 Dolby Laboratories Licensing Corporation Systems and methods for detecting a synchronization code word
CN104795071A (zh) * 2015-04-18 2015-07-22 广东石油化工学院 一种盲音频水印嵌入及水印提取的处理方法
CN105632506A (zh) * 2015-12-28 2016-06-01 辽宁师范大学 基于极谐变换的鲁棒数字音频水印嵌入及检测方法
CN106373078A (zh) * 2016-08-31 2017-02-01 南京师范大学 一种基于定位块机制的含水印瓦片遥感影像定位方法
CN106504757A (zh) * 2016-11-09 2017-03-15 天津大学 一种基于听觉模型的自适应音频盲水印方法
CN111028850A (zh) * 2018-10-10 2020-04-17 中国移动通信集团浙江有限公司 一种音频水印的嵌入方法和提取方法
CN112712811A (zh) * 2020-12-08 2021-04-27 天津大学 自适应量化均值去同步攻击鲁棒音频水印方法
CN113179407A (zh) * 2021-04-23 2021-07-27 山东大学 基于帧间dct系数相关性的视频水印嵌入和提取方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720249B2 (en) * 1993-11-18 2010-05-18 Digimarc Corporation Watermark embedder and reader

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
CA2444151A1 (en) * 2002-10-04 2004-04-04 Heping Ding Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
WO2004051918A1 (en) * 2002-11-27 2004-06-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Watermarking digital representations that have undergone lossy compression
CN1585020A (zh) * 2004-05-28 2005-02-23 中山大学 一种数字音频防篡改方法
CA2527011A1 (en) * 2004-11-19 2006-05-19 Lg Electronics Inc. Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same
KR20060059112A (ko) * 2004-11-26 2006-06-01 강희조 디지털 워터마크 데이터 삽입 및 추출방법
WO2010021966A1 (en) * 2008-08-21 2010-02-25 Dolby Laboratories Licensing Corporation Feature optimization and reliability estimation for audio and video signature generation and detection
WO2014120685A1 (en) * 2013-02-04 2014-08-07 Dolby Laboratories Licensing Corporation Systems and methods for detecting a synchronization code word
CN103208289A (zh) * 2013-04-01 2013-07-17 上海大学 一种可抵抗重录音攻击的数字音频水印方法
CN104795071A (zh) * 2015-04-18 2015-07-22 广东石油化工学院 一种盲音频水印嵌入及水印提取的处理方法
CN105632506A (zh) * 2015-12-28 2016-06-01 辽宁师范大学 基于极谐变换的鲁棒数字音频水印嵌入及检测方法
CN106373078A (zh) * 2016-08-31 2017-02-01 南京师范大学 一种基于定位块机制的含水印瓦片遥感影像定位方法
CN106504757A (zh) * 2016-11-09 2017-03-15 天津大学 一种基于听觉模型的自适应音频盲水印方法
CN111028850A (zh) * 2018-10-10 2020-04-17 中国移动通信集团浙江有限公司 一种音频水印的嵌入方法和提取方法
CN112712811A (zh) * 2020-12-08 2021-04-27 天津大学 自适应量化均值去同步攻击鲁棒音频水印方法
CN113179407A (zh) * 2021-04-23 2021-07-27 山东大学 基于帧间dct系数相关性的视频水印嵌入和提取方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于DCT变换的数字音频水印算法;严春来;《电脑知识与技术》;第11卷(第34期);第45-48页 *

Also Published As

Publication number Publication date
CN113782041A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN113782041B (zh) 一种基于音频变频域的嵌入和定位水印的方法
Lei et al. Blind and robust audio watermarking scheme based on SVD–DCT
JP4906230B2 (ja) オーディトリーイベントに基づく特徴付けを使ったオーディオ信号の時間調整方法
JP4896455B2 (ja) データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
Dhar et al. A new audio watermarking system using discrete fourier transform for copyright protection
Yuan et al. Robust Mel-Frequency Cepstral coefficients feature detection and dual-tree complex wavelet transform for digital audio watermarking
Huang et al. Optimization-based embedding for wavelet-domain audio watermarking
Kaur et al. Localized & self adaptive audio watermarking algorithm in the wavelet domain
Maha et al. DCT based blind audio watermarking scheme
Cvejic et al. Robust audio watermarking in wavelet domain using frequency hopping and patchwork method
Attari et al. Robust audio watermarking algorithm based on DWT using Fibonacci numbers
Park et al. Speech authentication system using digital watermarking and pattern recovery
Li et al. An audio watermarking technique that is robust against random cropping
Wu et al. Audio watermarking algorithm with a synchronization mechanism based on spectrum distribution
CN111292756B (zh) 一种抗压缩音频无声水印嵌入和提取方法及系统
KR20070061285A (ko) 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법
JP6316288B2 (ja) 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
EP3680901A1 (en) A sound processing apparatus and method
Lin et al. Audio watermarking techniques
KR20110014871A (ko) 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법
Singh et al. Multiplicative watermarking of audio in DFT magnitude
Luo et al. Dual-domain audio watermarking algorithm based on flexible segmentation and adaptive embedding
Wu et al. Adaptive audio watermarking based on SNR in localized regions
Dhar et al. An audio watermarking scheme using discrete fourier transformation and singular value decomposition
He et al. A novel audio watermarking algorithm robust against recapturing attacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant