CN112290975B - 一种用于音频信息隐藏系统的噪声估计接收方法和装置 - Google Patents

一种用于音频信息隐藏系统的噪声估计接收方法和装置 Download PDF

Info

Publication number
CN112290975B
CN112290975B CN201910672812.3A CN201910672812A CN112290975B CN 112290975 B CN112290975 B CN 112290975B CN 201910672812 A CN201910672812 A CN 201910672812A CN 112290975 B CN112290975 B CN 112290975B
Authority
CN
China
Prior art keywords
audio signal
frequency
receiving
noise
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910672812.3A
Other languages
English (en)
Other versions
CN112290975A (zh
Inventor
彭涛
许岳青
熊贝尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201910672812.3A priority Critical patent/CN112290975B/zh
Publication of CN112290975A publication Critical patent/CN112290975A/zh
Application granted granted Critical
Publication of CN112290975B publication Critical patent/CN112290975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/69Spread spectrum techniques
    • H04B1/707Spread spectrum techniques using direct sequence modulation
    • H04B1/7073Synchronisation aspects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Abstract

本发明实施方式公开了一种用于音频信息隐藏系统的噪声估计接收方法和装置。该方法包括:接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;基于所述多个音频信号段的高频段部分计算估计噪声功率;基于所述估计噪声功率确定接收门限;从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息。增加接收时有效信号的占比,从而提高系统接收性能。

Description

一种用于音频信息隐藏系统的噪声估计接收方法和装置
技术领域
本发明涉及隐蔽通信技术领域,尤其涉及一种用于音频信息隐藏系统的噪声估计接收方法和装置。
背景技术
音频信息隐藏技术,是将人们需要的各种信息隐藏在音频载体中,让信息足够隐蔽,从而实现以音频为载体的信息隐蔽传输。近年来,音频信息隐藏技术在多个领域得到了广泛应用,如数字音源的版权保护和认证,以音频信号为载体的隐蔽通信等。版权保护领域通常把信息隐藏称之为数字水印技术,将版权等认证信息作为水印信息嵌入于数字音频,以确保数字音源的正版认证和销售;在隐蔽通信领域,同样地将秘密信息嵌入于音频信号,由接收机提取并恢复。信息隐藏技术不同于传统的密码学,密码学用于将信息加密,但第三方可以获知信息的存在,而信息隐藏技术可以将信息隐藏于某种介质或载体,即使知情者也无法感知信息是否存在,这也决定了其天然的保密性。
现有的音频信息隐藏系统,通常都会用到扩频技术,信息隐藏系统中的扩频技术有它独特的优势,它能将需要的信息的能量均匀分散到一个扩频序列中,再对原始信号进行符合序列极性的修改,使信号总体能量没有太大的改动,同时也将原音频的失真程度控制在某个范围内。早期的扩频信息隐藏,是对时域波形进行修改,这一点和扩频通信的概念类似。后来Ingemar J.Cox等人提出了将信息隐藏放在DCT域进行,即对频域信号进行修改。至今的很多算法都将信息隐藏放在变换域,以频域和DCT域居多,这是因为音频信号在频域上能更好地表现人耳的听觉特性,同时也能利用频域的很多特性进行算法层面的优化。
信息隐藏技术有三个方面的性能指标:隐蔽性、信息容量、鲁棒性。隐蔽性即人们对隐藏信息的不可感知能力,用音质的好坏程度来衡量;信息容量,即单位时间内嵌入信息的多少;而鲁棒性主要体现在对抗噪声攻击的能力,高强度的噪声环境对于接收性能的影响是致命的,而一个优良的接收方法,可以充分提升系统抵御噪声的能力。
传统的解扩方法利用扩频序列完美的自相关特性,但未考虑信号以及噪声在频谱上的分布情况,因此在信道噪声干扰较大时,很难实现高性能解调。比如,在发送端采用频域扩频技术的音频信息隐藏系统中,接收时都使用相干解扩的方式,将接收信号与和发送端相同的扩频序列进行全序列的相关运算,以恢复一帧音频中嵌入的信息,这在扩频通信中是默认和广泛应用的。然而,由于信道噪声的攻击,接收信号矢量会含有不同程度的噪声分量,直接导致接收解扩时,全序列的相关运算结果并不能准确得到嵌入信息的极性。在没有原始音频先验信息的盲检测系统(接收端未知原始音频)中,很难消除噪声的恶劣影响。在基于频域扩频的音频信息隐藏系统中,这种接收方式很难抵抗噪声的攻击,这是由于音频在高频段信号能量极少,而噪声则全频域覆盖且具有随机性,因此接收时高频段的频点极易被噪声淹没,从而极大降低解扩后码字信息的恢复能力,系统鲁棒性得不到保障。
发明内容
本发明实施例提出一种用于音频信息隐藏系统的噪声估计接收方法和装置。
本发明实施例的技术方案如下:
一种用于音频信息隐藏系统的噪声估计接收方法,该方法包括:
接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;
将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;
基于所述多个音频信号段的高频段部分计算估计噪声功率;
基于所述估计噪声功率确定接收门限;
从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息。
在一个实施方式中,
所述估计噪声功率Navg为嵌入相同隐藏信息的所有音频信号段的高频段部分的平均能量Eavg的平均值;
其中
Figure GDA0003106180980000031
其中Eavg_m为第m个音频信号段中的高频段部分平均能量,M是嵌入相同隐藏信息的音频信号段的总数目。
在一个实施方式中,
所述高频段部分的范围为(b*N,N),其中N为音频信号变换到频域的频点数;b为预设参数,b的取值范围为(0,1);
每个音频信号段的高频部分平均能量为Eavg,其中:
Figure GDA0003106180980000032
其中i为频点索引;s(i)为所述音频信号段第i频点的能量值。
在一个实施方式中,基于接收门限系数
Figure GDA0003106180980000033
对所述Navg进行微调,以得到接收门限Thr;
其中
Figure GDA0003106180980000034
在一个实施方式中,
所述中低频段部分的范围为(0,a*N),其中a是取值范围为(0,b)的预设参数;所述选取的频点集合为A,其中:
A={i|s(i)>Thr,i<a*N}。
一种用于音频信息隐藏系统的噪声估计接收装置,包括:
接收模块,用于接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;
噪声功率估计模块,用于基于所述多个音频信号段的高频段部分计算估计噪声功率;
接收门限确定模块,用于基于所述估计噪声功率确定接收门限;
频点选取模块,用于从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息。
在一个实施方式中,
所述估计噪声功率Navg为嵌入相同隐藏信息的所有音频信号段的高频段部分的平均能量Eavg的平均值;
其中
Figure GDA0003106180980000041
其中Eavg_m为第m个音频信号段中的高频段部分平均能量,M是嵌入相同隐藏信息的音频信号段的总数目。
在一个实施方式中,
所述高频段部分的范围为(b*N,N),其中N为音频信号变换到频域的频点数;b为预设参数,b的取值范围为(0,1);
每个音频信号段的高频部分平均能量为Eavg,其中:
Figure GDA0003106180980000051
在一个实施方式中,
接收门限确定模块,用于基于接收门限系数
Figure GDA0003106180980000052
对所述Navg进行微调,以得到接收门限Thr,其中
Figure GDA0003106180980000053
在一个实施方式中,
所述中低频段部分的范围为(0,a*N);其中a是取值范围为(0,b)的预设参数;所述选取的频点集合为A,其中:
A={i|s(i)>Thr,i<a*N}。
从上述技术方案可以看出,本发明实施方式中,接收经过噪声环境的、在发送端基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;基于所述多个音频信号段的高频段部分的总频点信号强度计算估计噪声功率;基于所述估计噪声功率确定接收门限;从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息。可见,在本发明实施方式中,利用音频信号和噪声的本身特性对信道噪声进行一定的估计,以此作为接收门限,抛弃掉噪声强度大的频点,以此来区分各频点对隐蔽信息的贡献程度,以增加接收时有效信号的占比,从而提高系统接收性能。
附图说明
图1为音频信息隐藏系统的发送端的处理示意图。
图2为音频信息隐藏系统的带噪信号接收示意图。
图3为本发明用于音频信息隐藏系统的噪声估计接收方法的流程图。
图4为本发明的频点接收规则示意图。
图5为本发明与现有技术的同步效率与信噪比关系的对比示意图。
图6为本发明与现有技术的译码效率与信噪比关系的对比示意图。
图7为本发明用于音频信息隐藏系统的噪声估计接收装置的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
为了描述上的简洁和直观,下文通过描述若干代表性的实施方式来对本发明的方案进行阐述。实施方式中大量的细节仅用于帮助理解本发明的方案。但是很明显,本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案,一些实施方式没有进行细致地描述,而是仅给出了框架。下文中,“包括”是指“包括但不限于”,“根据……”是指“至少根据……,但不限于仅根据……”。由于汉语的语言习惯,下文中没有特别指出一个成分的数量时,意味着该成分可以是一个也可以是多个,或可理解为至少一个。
首先,对主流的音频信息隐藏系统与其接收方法进行简要介绍。作为一类通信系统,音频信息隐藏系统分为发送端、信道和接收端。发送端负责信息的嵌入(隐藏),通常对信息采用扩频的方式,将信息调制到载波音频信号上,对音频信号进行某种小幅度修改,这个过程本质上是将信息嵌入载体音频,形成复合信源。经由信道传输后,接收端接收信号并进行解调译码。由于扩频序列具有良好的自相关特性,在接收时使用与发送端相同的扩频序列进行相干解扩,以得到相应的码字信息。这种基于扩频的信息隐藏系统在当下具有广泛的应用。
扩频技术在信息隐藏中,最早是用于将信息调制到音频的时域波形上,来实现信息嵌入。更优化的做法,是将信号分帧后变换至频域信号,将信息调制到频域信号上,通过修改频域信号的幅值,来做信息嵌入。相比于时域,频域信号能较直接地体现信号的短时频谱特性,可以结合心理声学的频域掩蔽效应,来保证信息在音频中的隐蔽性。发送端的频域扩频调制对应接收时的频域解扩解调。首先,接收端需要把接收信号分帧并变换至频域信号,然后使用与发送端相同的扩频序列与频域信号内积,来实现频域解扩,将信息从音频中解调出来,实现判决译码。传统的解扩方法利用了扩频序列完美的自相关特性,但未考虑信号以及噪声在频谱上的分布情况,因此在信道噪声干扰较大时,很难实现高性能解调。
现有技术中的相干解扩接收方法,大都是进行全序列的相关运算,并没有考虑信号和噪声的本身特性,没有对噪声强度进行评估和计算,这样的接收性能是有限的,尤其在高强度噪声环境下,很难恢复出隐藏信息。
在本发明实施方式中,利用音频信号和噪声的本身特性对信道噪声进行一定的估计,以此作为接收门限,抛弃掉噪声强度大的频点,以此来区分各频点对隐蔽信息的贡献程度,以增加接收时有效信号的占比,从而提高系统接收性能。
本发明实施方式提出的嵌入有隐藏信息的音频信号的接收方法,包括对同步码字和信息码字的接收,因此除了对隐蔽信息的解调准确性有提升外,对同步过程的效率也有一定的提高。本发明实施方式的本质是利用信号与噪声的频率分布特性,将噪声的统计特性从带噪信号中估计出来,对其信噪成分进行评估和处理,充分利用了信源和信道本身的特性,尤其在高强度的噪声环境中,能够明显地改善接收性能。
本发明实施方式意在提高音频信息隐藏系统的接收性能,这会直接提高隐藏信息的恢复能力,使系统鲁棒性得到保障。在发送端,由于音频信号对于音频的小幅度修改具有很高的敏感度,以音频为载体的信号比其他多媒体信号更难做信息隐藏(隐蔽性更差),现有的技术大都专注于对信息隐藏算法本身做优化,而本发明实施方式专注于分析噪声与信号的特性,对接收时的解扩过程加以优化,以此来改善接收性能,提高系统抵御噪声的能力,使音频在高强度噪声环境下传输后也能正确获得隐藏信息。
音频信息隐藏系统包括了发送端、信道、接收端三个部分,本发明实施方式的实施重点在接收端,包含整个接收系统,重点是经噪声估计优化的解扩接收方法。
为了更好地理解本发明实施方式,首先需要对音频信息隐藏系统的整体架构和用到的关键技术做出介绍。
图1为音频信息隐藏系统的发送端的处理示意图。
在图1中,原始音频经过分帧形成短时信号后,一路进入心理声学模型,用于确定每个频点能够嵌入的信息的强度;另一路进行FFT变换并取模,求得频域信号幅值。需要嵌入的信息分为同步信息和码字信息,同步信息用于接收时的同步操作,码字信息是真正需要的信息,将信息比特扩频为一组扩频码字,嵌入在频域信号的幅值频点上,结合心理声学模型给出的每个频点可以嵌入信息的强度,得到嵌入后的频域信号,通过IFFT变回时域音频信号,完成信息嵌入。
图2为音频信息隐藏系统的带噪信号接收示意图。
其中,发送接收系统中用到的关键技术有:
(1)、频域扩频技术
利用扩频序列p,将需要嵌入的信息比特“0”映射为p,“1”映射为-p。得到单位信息b={0,1}的扩频码字pb={±p}。扩频码字pb的长度N逐一对应到频域信号的频点,若原始音频分帧的长度为L,则经过FFT变换后的有效频点数为L/2,除去不嵌入信息的直流点,有N=L/2-1长度的频点需要嵌入信息。
(2)、心理声学模型
基于ISO/IEC 11173,心理声学模型的作用是确定信息嵌入强度,使因信息嵌入引起的声音失真最大程度地不受人耳察觉,极大提升系统的隐蔽性。设模型给出的一帧信号最大可隐藏信息量为m,结合频域扩频技术,可以得到嵌入比特b的表达式:
Figure GDA0003106180980000091
其中x是信息嵌入前的频域信号幅值,y是信息嵌入后的频域信号幅值,
Figure GDA0003106180980000092
为笛卡尔积,即矢量m与pb逐元素的乘积(矢量长度均为N)。
(3)、差分结构。
在盲检测系统中,接收端不能先验得知原始音频信号,原始音频与扩频序列的相关性无法得知,所以在进行解扩的相关运算时,载体音频本身也成为一个干扰项。本专利采用如下差分设计的方式来抑制载体音频干扰。
发送端将相邻的前后两帧嵌入相反的信息,前帧表达为“f”(front),后帧表达为“r”(rear),前后帧嵌入信息过程可表示为:
Figure GDA0003106180980000093
设接收到的带噪信号为s=y+n,其中n为信道噪声。接收端对接收到的相邻两帧信号解扩,再用后帧的解扩结果减去前帧,得到差分的检测判决量rb表示为:
Figure GDA0003106180980000094
其中“·”为内积符号,Δx是由后帧减去前帧得到的信号差。可以默认信号在两帧时间内变化不大,故Δx是一个接近零的值,Δx·p可以忽略,mtotal为这两帧信号输出的整体嵌入强度,Δn是由后帧减去前帧得到的噪声差。此时rb可表示为:
Figure GDA0003106180980000095
若求得的rb为正极性,则认为pb=p,嵌入的比特为“0”;若rb为负极性,则认为pb=-p,嵌入的比特为“1”。
(4)、同步译码的循环嵌套设计。
隐藏的信息包括同步信息和码字信息。对于信号的收发,由于接收端不知道信息的位置,发送端每个码字信息前都插入同步信息,接收端先解同步信息(进行同步),系统认为达到同步后再解码字信息(进行译码)。为了保证不漏检信息,每一次信息的同步译码包含有内外两层循环,外循环负责粗同步,粗同步的作用是找到嵌入信息的大体位置,但精度较低,直接译码可能失败,此时就需要内循环进行数次译码尝试,在到达粗同步的位置附近覆盖一到两帧的范围内,进行数次译码尝试,直到解出该数据包嵌入的信息,系统认为本次译码完成,在之后的位置进行下个数据包的同步。若一直没有解出信息,接收系统认为本次译码失败,则将数据游标退回一定长度的数据点,重新本次数据包的同步
在本发明实施方式的相干解扩的过程中,接收端使用与发送端相同的扩频序列,对接收到的频域信号进行相关运算,获得判决信息。不同于传统方法接收全频点,本发明实施方式只选取那些需要接收的频点,计算这部分频点的内积和。频点的选取规则充分利用了噪声和信号的频谱分布特点,以确保接收到的频点中包含更多的隐藏信息分量,提高接收性能。
申请人发现:无噪信号在高频部分的频点能量很低,而带噪信号的噪声能量在高频段占主导。申请人归纳出音频信号和噪声频谱分布的下列两个特性,并以这两个特性为依据,给出了噪声估计接收算法的计算步骤。
特性一:音频信号有其独特的性质,对于绝大多数声音而言,无论是人声还是频率分量丰富的音乐,其能量总是集中在某个范围内的低频、中频,高频部分的能量极少,这是音频信号本身的频率分布特性;
特性二:噪声不同于一般的声音信号,其频率分布是不均匀且随机的,对于常见的通信系统,噪声的分布情况可用满足一定统计特性的高斯分布来表示,且默认噪声信号的一阶矩存在并且能量有限。
图3为根据本发明实施方式用于音频信息隐藏系统的噪声估计接收方法,
如图3所示,该方法包括:
步骤301:接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步。
步骤302:将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域。
步骤303:基于所述多个音频信号的高频段部分计算估计噪声功率。
步骤304:基于所述估计噪声功率确定接收门限。
步骤305:从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息。
在一个实施方式中,估计噪声功率Navg为所有音频信号段的高频段部分的平均能量Eavg的平均值;
其中
Figure GDA0003106180980000111
其中Eavg_m为第m个音频信号段中的高频段部分平均能量,M是嵌入相同隐藏信息的音频信号段的总数目。
在一个实施方式中,所述高频段部分的范围为(b*N,N),其中N为音频信号变换到频域的频点数;b为预设参数,b的取值范围为(0,1);
每个音频信号段的高频部分的平均能量为Eavg,其中:
Figure GDA0003106180980000112
其中i为频点索引;s(i)为所述音频信号段的第i频点的能量值。
在一个实施方式中,该方法还包括:
基于接收门限系数
Figure GDA0003106180980000121
对所述Navg进行微调,以得到接收门限Thr;
其中
Figure GDA0003106180980000122
在一个实施方式中,所述中低频段部分的范围为(0,a*N);其中a是取值范围为(0,b)的预设参数;所述选取的频点集合为A,其中:
A={i|s(i)>Thr,i<a*N}。
具体的,噪声估计接收算法的计算步骤可以包含下列步骤:
步骤一:使用多个音频信号段的高频段部分的频点信号能量来估计噪声水平。高频段部分的信号能量较低、噪声能量占主导,可直接计算高频段部分的总能量近似为噪声能量。对于嵌入了相反数据的前后两帧信号,首先分别计算高频段部分的平均能量(设为Eavg),然后对前后帧信号作算术平均,得到该帧的噪声估计水平Navg
设带噪接收信号s(i)=y(i)+n(i),频点索引为i,计算的高频段频点范围可以为
Figure GDA0003106180980000123
可以认为这部分频点上信号强度可忽略不计,其中:
Figure GDA0003106180980000124
其中,
Figure GDA0003106180980000125
仅为高频段部分的示范性的举例范围,并不用于限定本发明实施方式的保护范围。
其中角标“f”和“r”分别表示嵌入了相反信息的相邻前后两帧。
步骤二:由于噪声是一个随机信号,估计出的噪声有时不能准确表达噪声水平,所以噪声水平需要进行一定程度的微调。用
Figure GDA0003106180980000126
表示依据实际情况微调的噪声水平参数,
Figure GDA0003106180980000127
可以为预设常数,噪声水平更新为:
Figure GDA0003106180980000128
步骤三:设立接收门限,选取需要接收的频点。对于中低频部分,一般认为是索引在
Figure GDA0003106180980000129
的频点,这部分频点所含的信号能量较强,可能的嵌入信息较多,从这些频点中选取一部分进行接收。选取规则是将步骤二计算出的噪声估计水平当做接收门限Thr,其中
Figure GDA0003106180980000131
只接收频点能量强度高于这个门限的频点。其中,
Figure GDA0003106180980000132
仅为中低频段部分的示范性的举例范围,并不用于限定本发明实施方式的保护范围。
本发明实施方式可以用集合A来表示满足要求的频点集合,其中,A={i|s(i)>Thr,i<a*N}。
图4为本发明的频点接收规则示意图。
可见,频谱的最大频率为500,中低频范围为[0,125]。图4所示为一帧数据的频谱。基于高频段(范围为[375,500])的总频点信号强度所估计出的噪声门限用虚线41描出。在中低频范围内接收高于噪声门限的频点,即处于方框42的范围之内的频点;在中低频范围内频点强度在噪声门限以下的频点,即处于方框43的范围圈内的频点,由于受噪声影响较大,不参与解扩时的相关运算。
通过上述计算步骤,可以实现基于噪声估计的解扩接收。相比于没有噪声估计的解扩方法,本发明实施方式在接收性能上有较大优势。
下面对本发明实施方式与现有技术的性能表现,给出评估与对比。
本发明实施方式提出了一种用于音频信息隐藏的优化的接收方法,该方法利用了音频信号和信道噪声本身的频率分布特点进行噪声估计,在解扩时对接收到的频点进行选择性接收,以达到提高有效信号接收比例的目的。
本发明实施方式对三种算法的接收性能进行了对照实验。其中:算法1是传统的相干解扩方法,即接收所有频点;算法2是公开号US8041073B2提出的方法;算法3是本发明实施方式的算法。
可以从两个角度来比较这三种算法的性能,第一是所有信息完成译码后同步过程的时耗,用同步计算的次数来表示。第二是译码过程的效率,用判决极性的正确率来衡量。仿真结果和分析如下。
图5为本发明与现有技术的同步效率与信噪比关系的对比示意图。
在图5中,曲线51为算法1的同步效率与信噪比的关系曲线;曲线52为算法2的同步效率与信噪比的关系曲线;曲线53为算法3的同步效率与信噪比的关系曲线。
图5表达了同步效率随噪声信噪比变化的关系。接收端的主要时耗集中在同步过程的循环体,可以看出噪声信噪比降低时,同步计算次数增长,本专利提出的方法,同步计算次数都比算法1和算法2要少。由于算法2需要计算15%的低幅值点,需用到top K的计算方法,时间复杂度最低为O(nlogK),而算法1的时间复杂度仅为O(n),故算法2的实际时耗要大于算法1。而本专利提出的方法只需要计算估计噪声的能量,设立门限接收频点,其时间复杂度也为O(n)。
综上所述,算法3(即本发明实施方式)的时耗更少。
图6为本发明与现有技术的译码效率与信噪比关系的对比示意图。
在图6中,曲线61为算法3的译码效率与信噪比关系的关系曲线;曲线62为算法1的译码效率与信噪比关系的关系曲线;曲线63为算法2的译码效率与信噪比关系的关系曲线。
图6表达了译码效率随信噪比变化的关系。由于在高频段,信号强度本身就很低,被噪声污染后几乎没有了有效信号分量,因此不能保证幅值小的频点一定是噪声相对较强的频点,反而幅值高的频点也可能是噪声强度。在低信噪比时,算法2舍弃掉的幅值小的点可能是被噪声污染的信号分量,舍弃掉较多信号分量会导致性能下降。而在高信噪比时,算法2舍弃掉的幅值小的点更多的是噪声分量,所以性能会比算法1要好。而对于本专利提出的噪声估计接收方法,在任何信噪比下都优于算法1和算法2,噪声估计的方法很大程度上剔除了噪声强度大的频点,因此能得到更加完美的相关峰值极性和峰值旁瓣比,无论是同步的准确性还是硬判决正确率,都表现出更佳的性能。
因此,本发明实施方式具有更强的抗噪声能力。算法2的优化只是经验式的选择性接收,没有利用音频信号本身的频谱特性,因此性能难以从本质上提升。本发明实施方式提出的接收方法,利用了高频段的随机噪声,对其进行能量估计,将估计的噪声能量作为接收门限,选择性接收信号分量大的频点。经验证,在已实验的任意信噪比噪声环境下,噪声估计的接收方法显示出更好的接收性能,能为音频信息隐藏系统提供更高的鲁棒性。
而且,本发明实施方式具有更好的实时性。算法2在程序设计上的算法复杂度要高于本发明实施方式,在实时通信需求高涨的今天,一个快速而准确的接收算法能够实现信息的实时获取。
还有,本发明实施方式适用场景多,对于任意的扩频系统,只要存在能量相对于噪声可以忽略不计的子频带,就可以进行统计意义上的噪声估计,设立接收门限,一定程度上分离出噪声分量和信号分量。无论是同步还是解码过程都用到了这种优化,可以提升整个系统的接收性能。
图7为本发明用于音频信息隐藏系统的噪声估计接收装置的结构图。
如图7所示,用于音频信息隐藏系统的噪声估计接收装置,包括:
接收模块,用于接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;
噪声功率估计模块,用于基于所述多个音频信号段的高频段部分计算估计噪声功率;
接收门限确定模块,用于基于所述估计噪声功率确定接收门限;
频点选取模块,用于从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息。
在一个实施方式中,所述估计噪声功率Navg为嵌入相同隐藏信息的所有音频信号段的高频段部分的平均能量Eavg的平均值;
其中
Figure GDA0003106180980000161
其中Eavg_m为第m个音频信号段中的高频段部分的平均能量,M是嵌入相同隐藏信息的音频信号段的总数目。
在一个实施方式中,所述高频段部分的范围为(b*N,N),其中N为音频信号变换到频域的频点数;b为预设参数,b的取值范围为(0,1);
每个音频信号段的高频部分平均能量为Eavg,其中:
Figure GDA0003106180980000162
在一个实施方式中,
接收门限确定模块,用于基于接收门限系数
Figure GDA0003106180980000163
对所述Navg进行微调,以得到接收门限Thr,其中
Figure GDA0003106180980000164
在一个实施方式中,所述中低频段部分的范围为(0,a*N);其中a是取值范围为(0,b)的预设参数;所述选取的频点集合为A,其中:
A={i|s(i)>Thr,i<a*N}。
综上所述,本发明实施方式提出基于噪声估计的接收解扩方法。该解扩方法出现在同步过程和译码尝试过程中,直接影响整个接收系统的性能。其原理是利用音频信号固有的频率分布特点,对高频段的噪声能进行估计,由于噪声全频域随机覆盖,可以得到全频段的噪声估计值,将噪声和信号分量区分开来。设立接收门限,舍弃掉噪声强度大的频点,保留接收信号分量大的频点。能够在各种强度的噪声环境中保持很高的接收性能,比传统算法和以往的接收算法更能抵抗噪声,鲁棒性更强。本发明实施方式提出基于译码尝试的接收同步方法。该同步方法包括了同步过程和译码尝试过程,即整个接收系统的逻辑架构。其循环结构较为巧妙地考虑了多种接收情况,做了相应的判决机制,设计精度较为复杂。对于同步门限的设定,可以在不同的场景下进行相应调控,极大减少同步循环中出现信息漏检或虚警的可能性。
本发明实施方式适用于音频信息隐藏系统,也包括一切具有能量空白段,能够进行环境噪声估计的数字通信系统。
需要说明的是,上述各流程和各结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分,实际实现时,一个模块可以分由多个模块实现,多个模块的功能也可以由同一个模块实现,这些模块可以位于同一个设备中,也可以位于不同的设备中。
各实施方式中的硬件模块可以以机械方式或电子方式实现。例如,一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器,如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式,或是采用专用的永久性电路,或是采用临时配置的电路(如由软件进行配置)来实现硬件模块,可以根据成本和时间上的考虑来决定。
本发明还提供了一种机器可读的存储介质,存储用于使一机器执行如本申请所述方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施方式的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。此外,还可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作。还可以将从存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施方式中任一实施方式的功能。
用于提供程序代码的存储介质实施方式包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机或云上下载程序代码。
在本文中,“示意性”表示“充当实例、例子或说明”,不应将在本文中被描述为“示意性”的任何图示、实施方式解释为一种更优选的或更具优点的技术方案。为使图面简洁,各图中的只示意性地表示出了与本发明相关部分,而并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”并不表示将本发明相关部分的数量限制为“仅此一个”,并且“一个”不表示排除本发明相关部分的数量“多于一个”的情形。在本文中,“上”、“下”、“前”、“后”、“左”、“右”、“内”、“外”等仅用于表示相关部分之间的相对位置关系,而非限定这些相关部分的绝对位置。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,而并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方案或变更,如特征的组合、分割或重复,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用于音频信息隐藏系统的噪声估计接收方法,其特征在于,该方法包括:
接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;
将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;
基于所述多个音频信号段的高频段部分计算估计噪声功率;
基于所述估计噪声功率确定接收门限;
从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息;
其中所述估计噪声功率为嵌入相同隐藏信息的所有音频信号段的高频段部分的平均能量的平均值;
Figure FDA0003106180970000011
其中Eavg_m为第m个音频信号段中的高频段部分平均能量,M是嵌入相同隐藏信息的音频信号段的总数目;Navg为所述估计噪声功率。
2.根据权利要求1所述的用于音频信息隐藏系统的噪声估计接收方法,其特征在于,
所述高频段部分的范围为(b*N,N),其中N为音频信号变换到频域的频点数;b为预设参数,b的取值范围为(0,1);
每个音频信号段的高频部分平均能量为Eavg,其中:
Figure FDA0003106180970000012
其中i为频点索引;s(i)为所述音频信号段第i频点的能量值。
3.根据权利要求1或2所述的用于音频信息隐藏系统的噪声估计接收方法,其特征在于:
基于接收门限系数
Figure FDA0003106180970000021
对所述Navg进行微调,以得到接收门限Thr;
其中
Figure FDA0003106180970000022
4.根据权利要求3所述的用于音频信息隐藏系统的噪声估计接收方法,其特征在于,所述中低频段部分的范围为(0,a*N),其中a是取值范围为(0,b)的预设参数;所述选取的频点集合为A,其中:
A={i|s(i)>Thr,i<a*N}。
5.一种用于音频信息隐藏系统的噪声估计接收装置,其特征在于,包括:
接收模块,用于接收经过噪声环境的、发送端在频域基于扩频序列嵌入有隐藏信息的音频信号,并对所述音频信号进行同步;将同步的音频信号在时域上分割成多个音频信号段,并通过时频变换将所述多个音频信号段从时域变换到频域;
噪声功率估计模块,用于基于所述多个音频信号段的高频段部分计算估计噪声功率;
接收门限确定模块,用于基于所述估计噪声功率确定接收门限;
频点选取模块,用于从所述多个音频信号段的中低频段部分中选取频点信号强度高于所述接收门限的频点,采用与发送端相同的扩频序列对所选取的频点做相关运算得到嵌入的隐藏信息;
其中所述估计噪声功率为嵌入相同隐藏信息的所有音频信号段的高频段部分的平均能量的平均值;
Figure FDA0003106180970000023
其中Eavg_m为第m个音频信号段中的高频段部分平均能量,M是嵌入相同隐藏信息的音频信号段的总数目;Navg为所述估计噪声功率。
6.根据权利要求5所述的用于音频信息隐藏系统的噪声估计接收装置,其特征在于,
所述高频段部分的范围为(b*N,N),其中N为音频信号变换到频域的频点数;b为预设参数,b的取值范围为(0,1);
每个音频信号段的高频部分平均能量为Eavg,其中:
Figure FDA0003106180970000031
7.根据权利要求5或6所述的用于音频信息隐藏系统的噪声估计接收装置,其特征在于,
接收门限确定模块,用于基于接收门限系数
Figure FDA0003106180970000032
对所述Navg进行微调,以得到接收门限Thr,其中
Figure FDA0003106180970000033
8.根据权利要求7所述的用于音频信息隐藏系统的噪声估计接收装置,其特征在于,
所述中低频段部分的范围为(0,a*N);其中a是取值范围为(0,b)的预设参数;所述选取的频点集合为A,其中:
A={i|s(i)>Thr,i<a*N}。
CN201910672812.3A 2019-07-24 2019-07-24 一种用于音频信息隐藏系统的噪声估计接收方法和装置 Active CN112290975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910672812.3A CN112290975B (zh) 2019-07-24 2019-07-24 一种用于音频信息隐藏系统的噪声估计接收方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910672812.3A CN112290975B (zh) 2019-07-24 2019-07-24 一种用于音频信息隐藏系统的噪声估计接收方法和装置

Publications (2)

Publication Number Publication Date
CN112290975A CN112290975A (zh) 2021-01-29
CN112290975B true CN112290975B (zh) 2021-09-03

Family

ID=74418737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910672812.3A Active CN112290975B (zh) 2019-07-24 2019-07-24 一种用于音频信息隐藏系统的噪声估计接收方法和装置

Country Status (1)

Country Link
CN (1) CN112290975B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11955132B2 (en) 2021-11-09 2024-04-09 Acer Incorporated Identifying method of sound watermark and sound watermark identifying apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101160620A (zh) * 2005-07-11 2008-04-09 株式会社Ntt都科摩 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101160620A (zh) * 2005-07-11 2008-04-09 株式会社Ntt都科摩 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《An Optimized Anti-Noise Receiving Method Based on Spreading Spectrum Audio Watermarking System》;Bei"er Xiong等;《2018 IEEE 4th International Conference on Computer and Communications (ICCC)》;20181210;1351-1355 *
《基于扩频的音频信息隐藏算法的性能分析》;马文君等;《计算机应用》;20100831;2272-2274 *

Also Published As

Publication number Publication date
CN112290975A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
Wu et al. Efficiently self-synchronized audio watermarking for assured audio data transmission
RU2624549C2 (ru) Формирование сигнала водяного знака и встраивание водяного знака
JP5717621B2 (ja) 狭帯域干渉を受けるofdm信号を復号する方法
CN109412993A (zh) 一种基于深度学习的具有抑制自干扰的全双工认知水声通信信号检测方法
CN103917886A (zh) 使用附水印音频信号和麦克风阵列的到达方向估计
JP5567150B2 (ja) 差分符号化を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
CN110163787B (zh) 基于双树复小波变换的音频数字鲁棒盲水印嵌入方法
KR101520454B1 (ko) 개별 값 데이터에 기반한 워터마킹된 신호를 제공하는 방법, 워터마크 발생기, 워터마크 디코더 및 워터마킹된 신호에 기반하여 개별 값 데이터를 제공하는 방법
JP2013527933A (ja) 改善された同期の概念を使用するウォーターマーク生成器、ウォーターマーク復号器、ウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
CN109347568A (zh) 一种仿海豚哨声连续相位多元频率调制水声通信方法
CN108682425B (zh) 一种基于恒定水印的鲁棒数字音频水印嵌入系统
Kim et al. Selective correlation detector for additive spread spectrum watermarking in transform domain
CN112290975B (zh) 一种用于音频信息隐藏系统的噪声估计接收方法和装置
CN112910816A (zh) 基于相位加权共轭对称的滤波器组多载波定时同步方法
CN1848829B (zh) 一种自同步的音频水印方法
Li et al. Adaptive information hiding method based on feature extraction for visible light communication
CN107276654B (zh) 信号处理方法和系统
Chowdhury A Robust Audio Watermarking In Cepstrum Domain Composed Of Sample's Relation Dependent Embedding And Computationally Simple Extraction Phase
Khalil et al. Audio watermarking system based on frequency hopping modulation
Yan et al. Blind SINR Estimation Based on Graph Sparsity
Ginanjar et al. High-capacity and transparent digital audio watermarking using rounding reduced-arc mpsk and a genetic algorithm
CN107277913B (zh) 定时同步方法、装置和系统
Zhang et al. MPSK signal modulation recognition based on wavelet transformation
JP2004236065A (ja) Ofdm通信装置
Pal et al. A Robust Audio Steganographic Scheme in Time Domain (RASSTD)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant