CN1575492A - 利用减少的带宽在传输通道上传输宽带音频信号的方法 - Google Patents

利用减少的带宽在传输通道上传输宽带音频信号的方法 Download PDF

Info

Publication number
CN1575492A
CN1575492A CNA02821028XA CN02821028A CN1575492A CN 1575492 A CN1575492 A CN 1575492A CN A02821028X A CNA02821028X A CN A02821028XA CN 02821028 A CN02821028 A CN 02821028A CN 1575492 A CN1575492 A CN 1575492A
Authority
CN
China
Prior art keywords
audio signal
spectrum
signal
portions
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA02821028XA
Other languages
English (en)
Other versions
CN1288626C (zh
Inventor
R·塔奥里
A·J·格里特斯
R·J·斯鲁特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1575492A publication Critical patent/CN1575492A/zh
Application granted granted Critical
Publication of CN1288626C publication Critical patent/CN1288626C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种窄带音频信号(9)包括以可识别的失真出现用于将该信号处理成宽带信号的信息。在将宽带音频信号(1)处理成窄带信号(9)的方法中,第一频谱部分(4)在窄带信号中保持不变,并且通过以可识别的方式使所述第一频谱部分失真并且优选地作为水印来嵌入(8)可用于恢复剩余的频谱部分(5)的信息(7),优选地以感觉上听不到的方式。公开了一种用于将宽带音频信号(1)编码成窄带信号(9)的编码器、和一种用于解码窄带音频信号的解码器,以及一种通过窄带传输通道来传输宽带音频信号的系统,一种将宽带音频信号存储在存储介质上并且从存储设备中恢复该宽带信号的系统,和一种承载窄带音频信号的存储介质。

Description

利用减少的带宽在传输通道上传输宽带音频信号的方法
本发明涉及宽带音频信号的处理,以便提供适合于在诸如电话网络的窄带基础设施上传输的窄带音频信号。
从德国专利申请号DE3418297号,公知一种通过窄带传输通道传输宽带音频信号的方法。
宽带音频信号被分成低频带和高频带。该高频带被分成多个子带并且对于每个子带确定瞬时信号功率值。以倍增因数的形式提供了分布在这些子带上的瞬时信号功率的信息,该倍增因数识别所述功率值的最大幅度以及其余子带的相关信号功率值。这些信息被转换成数字字,通过普通的窄带传输通道将该数字字与所述的低频带一起传输,该信息以导频信号的形式被嵌入在该低频带信号中,该导频信号是处于或者低于最低的可感觉到的声级。
该方法的缺点在于包含高频带的信息的该导频信号不是建立在真实的明确的基础上的,因为该导频信号只在信号功率分布的基础之上提供。因此有时候已公开的方法对于不同的输入将很可能给出相同的输出,并且因此将很可能给出错误的补偿频谱分量,在这种情况下导致该窄带信号的衰减而不是增强。
从C.McElroy等人的会议论文,“7.2kb/s的宽带语音编码(Wideband Speech Coding in 7.2kb/s)”,1993 IEEE关于声音、语音和信号处理的国际会议(IEEE International Conference onAcoustics,Speech,and Signal Processing)4月27-30日,1993(ICASSP-93),明尼阿波利斯(Minneapolis),明尼苏达州(Minnesota)(美国),公知一种将宽带语音信号编码成媒体比特率信号的方法。
同样,该宽带信号被分成低频带和高频带。使用每个编码器将这些带编码成每个比特流;使用公知的CELP(码激励线性预测)编码器来编码低频带,并且使用二阶线性预测器和非常低比特率的增益形状矢量数字转换器(shape vector quantiser)来编码该高频带。
使用特定的语法将两个比特流合并;该结果是具有比特率为7.2kb/s的数字信号。在远端必须使用所述的语法以在该比特流被分别解码成高频段音频信号和低频段音频信号之前将该比特流分成高频段比特流和低频段比特流,并且然后组合成所期望的宽带语音信号。
这个方法的缺点在于该合成的比特流不适合于通过现有的窄带网络诸如电话中继线或者电话线或者电话交换机进行传输。
从欧洲专利第658874号,公知用于加宽窄带音频信号带宽的一种方法和一种电路。
在该专利中,借助于短期频谱分析来分析窄带音频信号;将该合成的频谱与所存储的频谱相比较;并且用不包含在该合成频谱中的频谱分量对该合成的频谱进行补偿。
该合成的频谱和所存储的频谱都是以线性预测方式(LPC;线性预测编码)被编码。该所存储的频谱是宽带的,并且被立即用来确定将被用作对于窄带信号的补偿的频谱分量。调节所存储的频谱的幅度以便获得窄频带中所存储的频谱和窄带音频信号之间的最大匹配。
所述方法和电路的缺点在于,从所存储的频谱中得到的并且被添加到窄带信号的频谱分量不是建立在真实明确的基础之上,这是因为该将被添加的频谱分量是仅仅从比较被分析的频谱与有限个频谱中而确定的。因此有时候所公开的方法和电路将很可能提供不正确的补偿频谱分量而导致窄带信号的衰减而不是增强。
从Michiel van der Veen等人的会议论文“稳定的、多功能和高质量音频水印技术(Robust,Multi Functional and High QualityAudio Watermarking Technology)”,音频工程协会(AudioEngineering Society)第110届大会,2001年5月12-15,阿姆斯特丹(Amsterdam)(NL),公知将承载有效负荷的水印嵌入在音频信号中的方法和检测这种水印中的有效负荷存在和提取这种水印中的有效负荷的方法。
基于用在图像和视频水印中的现有技术,在论文中提出了稳固的、多功能的和高质量的音频水印技术。该嵌入的算法工作在频域,在该频域稍微修改了傅立叶系数的幅度。水印检测依赖于互相关技术,在该技术中不仅检测水印的存在而且检测它的有效负荷。
实验证明对于在所述论文中公开的特定的水印,客观的和主观的音频质量测量非常好地关联。对于感觉的音频质量和坚固性的组合分析指示特定水印参数可以被优化用于不同应用。其范围从复制管理(有限的信息容量、高稳定性和非常高的音频质量)到广播监视(中等信息容量到大信息容量,中等稳定性,中等音频质量到高的音频质量)。
本发明的目的在于提供高质量地将宽带音频信号编码成窄带音频信号和相应的解码,以及相关的设施,诸如用于执行必要处理的设备。
在含有用于将窄带音频信号处理成相应的宽带音频信号的信息的窄带音频信号中,由于在窄带音频信号中的所述信息是作为可识别的失真存在的因此实现了该目标。
对根据本发明实施方案的信号的实验已经表明超出对应的窄带音频信号带宽的、包含在宽带音频信号中的信息可以被嵌入在该窄带音频信号的非常小的失真中。
实验进一步表明可能以可靠的方式通过互相关方法可靠地提取作为失真嵌入在窄带音频信号中的信息。
优选地,该编码的窄带音频信号与现有的窄带设备和基础设施是兼容的,以便1)在没有恶化或者损失宽带信息的质量的情况下,通过现有的窄带设备可传输、和借助于现有的窄带设备可记录的和/或可存储该窄带音频信号,以及2)在该信号的窄带内容质量没有严重恶化的情况通过现有的窄带设备以窄带的形式应可接收和所复制该窄带音频信号。
可以使得这样失真的窄带音频信号与诸如电话连接的窄带信号基础设施相兼容,因为在窄带音频信号的带宽内的失真将不受影响地通过所述基础设施。
当窄带音频信号存储在存储介质上时,它将比相应的宽带音频信号占据较少的空间并且因此表现为宽带音频信号的压缩形式,而节省了存储空间。
优点在于,通过传统的窄带设备使得这种存储的、压缩的信号容易可读,因此当譬如对于音频信号引入新的存储介质时,确保向后兼容。
将所述信息作为水印嵌入在窄带音频信号中,优选地以在感觉上听不到的方式。因此当制作窄带音频信号时,能利用用于水印音频信号的可获得的电路和方法。
在将宽带音频信号处理成基本上包含与该宽带音频信号相同的信息的窄带音频信号的方法中,位于所述标准化的频率界限内的宽带音频信号的第一频谱部分在窄带音频信号中基本保持不变,并且优选地以在感觉上听不到的方式将可用于恢复宽带音频信号的剩余的频谱部分的恢复信息嵌入到所述第一频谱部分,满足本发明的目的在于通过以可识别的方式使所述第一频谱部分失真,将所述恢复信息嵌入到所述第一频谱部分以获得所述窄带音频信号。
本发明实施方案的实验已经表明包含在超出相应的窄带音频信号带宽的宽带音频信号中的信息可以被嵌入在该窄带音频信号的非常小的失真中。
基本上,宽带音频信号的全部音频信息内容可以被包括在窄带音频信号中。
实验进一步表明可以使得接近听不到的或者感觉上听不到的可识别的失真包含足够的信息量,以能够可靠地、高质量地重构该宽带音频信号的剩余的频谱部分。
优选的是,所述恢复信息被嵌入在所述第一频谱部分作为水印,该水印承载作为有效负荷的所述恢复信息。
因此,当执行本发明的方法时,能够使用用于水印音频信号的可获得的电路和方法。
特别优选的是通过下述步骤将所述水印嵌入到所述第一频谱部分:
以数字形式提供所述第一频谱部分和所述剩余的频谱部分;
将所述第一频谱部分组织成帧;
将每帧变换到频域,并且执行所述帧的傅立叶变换;
根据所述水印修改傅立叶系数;
对修改的傅立叶系数进行逆傅立叶变换来获得频域、加了水印的帧;以及
优选地将所述频域、加了水印的帧变换到时域。
这种水印嵌入方案的使用已被证明提供了稳定的水印,该水印可以承载包括恢复信息的期望的有效负荷。
在优选的实施方案中,将所述窄带音频信号重新处理成宽带音频信号,优选的是在通过传输通道传输所述窄带音频信号或者将它存储在存储介质上之后。
这样,从本发明增加的益处在于没有必要对于基础设施进行任意改进,通过现有的窄带基础设施就能容易地传输高质量的音频信号。
在将宽带音频信号编码成基本上包含与该宽带音频信号相同的信息的窄带音频信号的编码器中,由于编码器包括下列部件从而满足了本发明的目的,该编码器包括:
滤波器,用于从宽带音频信号中提取第一频谱部分,所述第一频谱部分位于标准化的频率界限内;
信息产生电路,用于从宽带音频信号中或者从该宽带音频信号的剩余频谱部分中提取恢复信息,所述信息可被用于恢复该宽带音频信号的所述剩余频谱部分;
嵌入器,优选地以承载作为有效负荷的所述恢复信息的水印的形式,将所述恢复信息作为可识别的失真嵌入到所述第一频谱部分,以用于获得所述窄带音频信号。
通过这些措施,编码器将能产生基本上包含宽带音频信号的全部信息和频谱内容的窄带音频信号,该窄带音频信号是与窄带信号的基础设施相兼容的。
在优选的实施方案中,所述信息产生电路包括:
外推器,用于将所述第一频谱部分外推到被外推的音频信号中,该被外推的音频信号具有基本上与宽带音频信号的频率界限相对应的频率界限;以及
比较器,用于比较所述被外推的音频信号与宽带音频信号,并且根据该比较来提供所述恢复信息。
这样,借助于信号处理的相当原始的形式将该被外推的第一频谱部分重新处理成宽带音频信号。因此提供的该被外推(宽带)音频信号将不满足所期望的质量水平,但是使用合适的信号处理功率的量将可以提供以满足所期望的质量水平。
由于这种被外推的音频信号相对于原始宽带音频信号将是确定性的,因此它不需要沿着窄带音频信号进行传输,并且只有宽带音频信号和被外推的音频信号之间的区别需要被嵌入到第一频谱部分。这样,可以降低对嵌入器的处理功率需求。
在将包含用于处理信号的恢复信息的窄带音频信号解码为相应宽带音频信号的解码器中,通过解码器满足了本发明的目的,该解码器包括:
提取器,用于提取所述恢复信息,优选的是用于提取以水印形式存在的恢复信息的水印提取器;
恢复电路,使用所述恢复信息来恢复一个或者多个频谱音频信号部分,并且将所述频谱音频信号部分与所述窄带音频信号合并,以获得所述相应的宽带音频信号。
通过这些措施,解码器将能非常忠实地恢复该原始宽带音频信号,所恢复的宽带音频信号基本上包含原始宽带音频信号的全部信息和频谱内容。
在优选的实施方案中,所述恢复电路包括:
外推器,用于将所述窄带音频信号被外推到被外推的音频信号中,该被外推的音频信号具有基本上与相应的宽带音频信号的频率界限相对应的频率界限;以及
校正器,用于根据所述恢复信息修改所述外推器的特征,该校正器优选的是被并入到外推器中。
这样,使用合适的信号处理功率量,该外推提供了原始宽带音频信号的剩余频谱部分的基本部分。因此,只有宽带音频信号和被外推的音频信号之间的区别需要从被嵌入到第一频谱部分的可识别的失真中恢复。这样,可以降低对提取器的处理功率需求。
在通过窄带传输通道传输宽带音频信号的系统中,通过这个系统满足本发明的目的,该系统包括根据本发明在传输端用于将宽带音频信号处理成窄带音频信号的编码器,和根据本发明在接收端用于将所述窄带音频信号重新处理成宽带音频信号的解码器。
通过这些措施,在不需要将该传输信道从窄带升级到宽带状态的情况下,建立了用于传输宽带音频信号的完整的系统。这样,仅仅需要在该整个传输通道的发送端和接收端安装新的系统。
根据本发明的实施方案,这种新的安装优选地是暂时性的,原因在于它们可能是出于一个或者多个传输目的而被安装的,诸如通过电话线的无线电节目的高质量传输,或者这种新的安装可以并入在诸如与公共电话网络相连的电话机或者移动电话的装置中,这样当与具有相同设施的远端装置相连时,给用户提供了增强的传输质量。
因为窄带音频信号在存储介质中将占据比宽带音频信号更小的存储空间,所以明显地增加了用于存储音频信号的任意存储介质的有效容量。
当使用这样一种存储介质时,根据本发明的实施方案当然必须配置用于存储和恢复的系统,但是因为不管存储介质的容量有多大只需要配置一个这种系统,对于具有更大容量的存储介质而言经济效益将很大。
出于存储目的而不是传输目的,分别使用用于窄带音频信号或者第一频谱部分的其他频率界限都落入在本发明和权利要求书的范围之内。
出于传输的目的,优选地窄带音频信号将被给出与传输通道相同的频率界限,这样降低了将被嵌入到第一频谱部分中的信息量。
然而出于存储的目的,使用本发明的存储系统,对于期望的重放质量水平,提供最大压缩比的本发明的窄带音频信号的频率界限将不必与用于传输目的的所述优选频率界限相同。
下面,将借助于实施方案的实例和参考附图更加详细的解释本发明,其中
图1说明根据本发明实施方案的编码器的原理;
图2说明根据本发明实施方案的解码器的原理;
图3是图1中编码器的优选实施方案的示意图;以及
图4是图2中解码器的优选实施方案的示意图。
在图1中,在输入端存在宽带音频信号1。该信号被输送到两个滤波器即带通滤波器2和带阻滤波器3的输入端。带通滤波器2允许宽带音频信号的第一频谱部分通过,而这部分构成了窄带音频信号4。对于带通滤波器2的频率界限或者截止频率分别是例如300Hz和3.4kHz。窄带音频信号4将具有对应于滤波器2的频率界限的频率界限。
优选地,带阻滤波器3的频率界限或者截止频率是对应于带通滤波器2的频率界限或者截止频率。因此带阻滤波器3将允许未包含在窄带音频信号4中的宽带音频信号1的剩余的频谱部分5通过。
该宽带音频信号1可以是例如范围从20或100Hz到10或者20kHz的满带音频信号。在那种情况下,带阻滤波器3将具有与带通滤波器2相同的截止频率,例如300Hz和3.4kHz。然后通过从20或100Hz到300Hz和从3.4kHz到10或者20kHz的频带将构成该剩余的频谱部分5。
该宽带音频信号1也可以是包括频率从例如300Hz到8kHz的中频带语音信号;在那种情况下,剩余的频谱部分5将是从3.4kHz到8kHz的频带,并且带阻滤波器3将被替换为3.4kHz的高通滤波器。
用信息产生器或者信息产生电路6来处理剩余的频谱部分5。这个电路6以适当的格式将剩余频谱部分5的内容上的信息7输送到嵌入器8。根据本发明,所述信息7适合于作为用于恢复剩余频谱部分5的基础,但是优选地构成比剩余频谱部分5本身要小的信息量。
在没有增加所述部分4的频率界限的情况下,嵌入器8将信息7嵌入到第一频谱部分4,优选地以感觉上听不到的方式,因此来自嵌入器8的输出构成具有对应于带通滤波器2的截止频率的频率界限的窄带音频信号9。
存在几种用于这种嵌入的可用的方法,一种优选的方法是水印,此处信息7优选地作为水印的“有效负荷”而被嵌入。
图1中的编码器的一个目的是以如此一种方式将信息7嵌入到第一频谱部分中,以致全部信息7从信号9中明确地恢复,并且同时确保不会听到窄带音频信号9中的嵌入的信息,或者至少将不会明显地干扰人们去收听该窄带音频信号9。
因为窄带音频信号9不包含超出带通滤波器2的频率界限的频率,所以它将容易地被设计用于处理窄带音频信号的任意基础设施处理或者传输。在所提到的情况下,带通滤波器2的频率界限及因此音频信号9的频率界限分别为300Hz和3.4kHz,在没有明显的频谱衰减的情况下,可以通过例如公共电话系统来传输窄带音频信号9。
现在转向参考图2,在图1中的诸如信号9的编码窄带音频信号20出现在输入端。窄带音频信号20被传送到提取器21,在提取器21处从该信号中提取嵌入信息22。这样信息是例如对应于图1中的信息7,并且优选地作为水印出现在信号20中。对于这种提取嵌入的信息,方法和设备本身是公知的。
在这个信息22的基础上,剩余的频谱部分24被恢复器23恢复。这些频谱部分与窄带音频信号20在合并电路26中合并以获得宽带音频信号27。这个信号27是例如对应于图1中的宽带音频信号1。
图1的编码器和图2的解码器是例如并且优选地分别在诸如电话线的窄带传输通道的发送端和接收端起作用。
现在达到了这样的程度即传输通道保持了被传输的窄带音频信号的质量,并且还达到了这样的程度即图1中的信息产生(6)和嵌入(7)保持了宽带音频信号1的剩余频谱部分的质量,随后是图2中的提取(21)和恢复(23),在没有明显地质量损失特别是频谱质量损失的情况下,通过窄带传输通道现在可以传输这个宽带信号并且如上所述被再次恢复。
用于这样一个传输信道的调制和解调原理的选择将不会影响本发明的窄带音频信号的可传送性。
这种调制可以是例如使用GSM移动电话网络或者传统的模拟电话网络。在前一种情况下,调制器可以是在发送端的GSM移动电话,解调器可以是在接收端的GSM移动电话。沿着传输通道现在可以使用多种类型的调制。
例如,通过使用传统形式的模拟调制的传统长途模拟电话网络,可以将在发送端服务于移动电话的GSM网络之间的连接连接到在接收端服务于移动电话的GSM网络。
明显的是,这种通过现有的窄带基础设施传输宽带音频信号将提供巨大的经济价值。公共电话系统提供了用于标准化的窄带音频信号的几乎通用分布的传输系统。用于任意传输宽带音频信号的这种系统的使用将省略在许多情况下不必要的用于宽带音频信号的特殊的传输服务,并且因此节省了成本。
本发明的明显的优点在于编码的窄带音频信号9、20是直接与现有的传统窄带音频信号处理方法和设备兼容的。正如所提到的,优选地该嵌入信息在本发明的窄带音频信号9、20中是听不到的,或者至少几乎听不到或者感觉上听不到。
这意味着窄带音频信号9将可容易地由现有的窄带终端,即连接到现有的窄带基础设施的任何以前公知的终端设备播放或接收。在这种设备中,将识别本发明的窄带音频信号并且将其作为传统的信号处理。嵌入的信息对于这种设备将没有用处,但是它确实也没有产生干扰,如果它是可闻的,则将以噪声出现。
上述说明的本发明的编码器和解码器的有前途的应用可以是电话设备,该电话设备包括电话机和移动电话。如果本发明的编码器和解码器被构建到这种电话中,当这种设备连接到公共电话网络时,宽带语音连接将容易地成为可能。
如果在这种电话和传统的电话之间建立了电话连接,那么这种连接当然将是窄带连接。传统的电话将可以把嵌入的信息再现为非常轻的噪声,而本发明的电话将仅从传统的电话中再现窄带音频信号,因为没有出现信息22(图2)并且因此没有剩余的频谱部分24会合并到窄带音频信号,但是毫无问题这种连接将是成功的。
然而无论何时本发明的两部电话连接在一起,随后将是宽带电话连接并且因此电话用户将可以体验到非常高的信号质量。这种增强的连接质量证明是在仍然增长的移动电话市场上重要的竞争因素。
当传输演讲者或者相应的评论时,诸如用于互连广播演播室的特殊的终端设备也将能从本发明中受益。迄今,这种连接最经常通过公共电话网络进行,造成传输质量非常的差。在这样的设备中使用本发明将提供有很大改进的广播音频质量。
在图3中示出了本发明的编码器的一种优选的实施方案。在A/D转换器41中模拟宽带音频信号40被转换成数字宽带音频信号,并且随后在两个数字滤波器42、43处滤波。数字滤波器43是提供第一频谱部分51的带通滤波器,该第一频谱部分51构成窄带音频信号,并且数字滤波器42可以是带阻滤波器或者高通滤波器,该带阻滤波器或者高通滤波器提供宽带音频信号40的剩余的频谱部分52。
第一频谱部分51和剩余的频谱部分52被传送到信息发生器55。在此处,第一频谱部分51在外推器53中被外推以形成伪信号57。伪信号57可以在比较器54中与剩余的频谱部分52进行比较,该比较器54在其输出端输出差信号56。
在图3中的实施方案的第一方案中,由外推器53输送的伪信号57包括对应于宽带音频信号40的那些频率的频率,而这些频率是没有包含在第一频谱部分51中的。也就是说,伪信号的频谱是与剩余的频谱部分52的频谱对应的。
外推器应当理解成相对简单的电路。这种电路在先前是公知的,并且目的在于增强窄带音频信号,以便获得较高质量的宽带音频信号;然而通常结果不能令人满意。
在比较器54中将伪信号57与剩余的频谱部分52进行比较,产生了上面提到的差信号。
这种布置的目的在于减少将被嵌入到第一频谱部分中的信息量。即使伪信号57可能对于剩余的频谱部分52的较差的模拟,但是这可足够好以至于差信号56中的信息量明显的少于剩余的频谱部分52中的信息量。
在图3实施方案的第二方案中,由外推器53输送的伪信号57包括宽带音频信号40的整个频谱。
在这种情况下,将伪信号57与真正的宽带音频信号40进行比较,并且因此省略了数字滤波器42。在该第二方案中,差信号56不一定是与第一方案中的差信号相同,但是尽管如此差信号56通常表示剩余的频谱部分52与伪信号57的对应的频谱部分之间的差别。
该第一频谱部分51也被传送到除法电路或者帧调节器44,该除法电路或者帧调节器44将第一频谱部分分段成多个帧。这些帧46被继续传送到嵌入器45。
在嵌入器45中,在快速傅立叶变换电路47中每个帧首先从时域变换到频域。该傅立叶系数被传送到调节器48,在该调节器处根据差信号56对傅立叶系数进行修改,这样将差信号56中的信息嵌入到频域的第一频谱部分中。
该修改的傅立叶系数被传送到逆傅立叶变换电路49,在逆傅立叶变换电路49处将修改的第一频谱部分从频域又变换回到时域。
合成的时域信号50除了被分段成多个帧之外,与第一频谱部分51是相类似的,并且该时域信号50还具有嵌入其中的差信号56。
出于所使用的嵌入原理的目的,将第一频谱部分分段成多个帧的步骤首先并入到在本发明的解码器的实施方案中的。然而数字音频信号的分段也可以用于其他的目的。
在图3实施方案的第三方案中,无需信息发生器,剩余的频谱部分52被直接传送到嵌入器而不是差信号56被直接传送到嵌入器。这样就简化了编码器,但是同时明显增加了将被嵌入的信息量。
在调节器48中,通过将来自公知的二进制字序列(特定的“水印”)的样本添加到傅立叶系数的绝对值,差信号56或者剩余的频谱部分52可以分别优选地在修改的傅立叶系数中表示。所述序列将优选地包括对应于每个帧46中的信号样本数量的多个二进制字。
分别根据差信号56或者剩余的频谱部分52的值可以优选地将用于每个帧46的所述样本序列进行循环移位,从而所述值事实上由水印样本序列的移动量来表示。
当通过传统的窄带设备来重新产生信号时,实验已经表明根据本发明将产生窄带音频信号的被嵌入在第一频谱部分的差信号不会恶化窄带音频信号50到任何明显的程度。
在图4中示出本发明的解码器的一个优选的实施方案,根据本发明在输入终端接收数字、成帧的窄带音频信号70,并且该窄带音频信号70被传送到提取器71,在提取器71处从窄带音频信号70提取根据本发明的任意嵌入的信息。
在提取器71中,将成帧的窄带音频信号70进行离散的傅立叶变换,并且该傅立叶系数被传送到互相关电路73。
在对应于图3中的嵌入器45的优选实施方案的这个电路的优选实施方案中,对于在嵌入器45中使用的水印字的每个可能的循环移位值,建立了傅立叶系数和公知水印(如在图3中的相同的二进制字位列)之间的相关性。
当循环移位是与在嵌入处所使用的移位相同时,该相关性将呈现明显的值,并且这样该嵌入的值(“有效负荷”)可以被识别并且因此被提取。该提取是通过在图4中的表示有效负荷提取电路的方框75来符号表示的。分别对应于差信号56或者剩余的频谱部分52的被提取的有效负荷将出现在图4中的终端76处,并且从终端76处连同接收到的窄带音频信号70一起提供给恢复器79。
在恢复器中,该接收到的窄带音频信号70被传送到外推器80,该外推器提供了外推的伪信号74。这个伪信号74被提供给校正器81,在校正器81处根据提取的有效负荷76来修改该伪信号。实质上伪信号74是对应于图3中的伪信号57的。
在图4实施方案的第一方案中,通过外推器80传送的伪信号74包括对应于宽带音频信号40的那些频率的频率,而这些频率是没有包含在第一频谱部分51中的,采用的方式是对应于图3中的编码器的第一方案。
在这种方案中,有效负荷76将构成要被添加到伪信号74的差信号,并且和信号82将对应于剩余的频谱部分52。在合并电路83中这些信号将与接收到的窄带音频信号70进行合并,并且来自合并电路83的输出信号84将构成恢复的宽带音频信号。
在图4中的实施方案的第二方案将与图3中的编码器的第二方案一起使用,由外推器80传送的伪信号74包括原始宽带音频信号40的整个频谱。
在那种情况下,有效负荷76将仍然通常表示剩余的频谱部分52和对应的伪信号74的频谱部分之间的差。将这个差添加到伪信号74将再次产生对应于剩余的频谱部分52的和信号82,该和信号82与接收到的窄带音频信号70合并以得到恢复的宽带音频信号84。
在图4解码器的第三方案中(其对应于图3中的编码器的第三方案),有效负荷将对应于整个剩余频谱部分52,并且将被直接传送到合并电路83。在这种情况下,将省略恢复器79。
图3的编码器的三种方案和图4的解码器的对应方案现在构成根据本发明的编码器-解码器对的三个实施方案,用于沿着窄带基础设施来传送宽带音频信号。该宽带音频信号在发送端被编码并且在接收端被解码。
然而,窄带基础设施不必是传输通道,而能是任意的窄带结构诸如存储器系统。在那种情况下,宽带音频信号可以以根据本发明的窄带音频信号的形式被存储,并且如参考图2和4说明的从解码成宽带形式的存储器中进行恢复。从而获得了宽带音频信号的有效压缩。在本说明书的第一部分中已经讨论了从该系统中的受益之处。
对于第一频谱部分来设计频率界限是位于本发明的范围之内的,对于任意期望的再现质量水平该第一频谱部分提供更大的压缩程度。
类似的,本发明的窄带音频信号可以进行任何其他形式的窄带音频信号处理或者结构,提供了相应的益处。
尽管上面参考了将恢复信息嵌入到第一频谱部分的特定方法,包括使用从信号的水印中已知的嵌入方法,使用任意的方法将恢复信息嵌入到第一频谱部分及随后所述信息的提取都落入在本发明的范围内。
尽管上面已经总体上涉及宽带音频信号,但是将本发明应用于宽带语音信号是特别有利的。
语音构成音频信号,在该音频信号处对于理解语音信息所必须的信号的必不可少的部分包含在信号的已定义好的频谱部分中,即300-3.400Hz频带。在没有改变的情况下,当使用本发明时这些带可以分别被传输或者存储,从而剩余的频谱部分不一定需要忠实地如同300-3.400Hz频带而被再现。
因此,当再现语音信号而不是音乐时,可以以较低的标准来再现剩余的频谱部分。这样,可以使用本发明来选择较低的但仍然是可接受的将被使用的再现质量,并且因此节省处理功率。
应当注意的是上面提到的实施方案是说明而不是限制本发明,并且本领域的技术人员在没有背离附属权利要求书的范围的情况下通史设计许多修改的实施方案。在权利要求书中,任意位于括号之间的参考标记不应当解释为限制本发明。术语“包括”不排除在权利要求中列出的那些其他的单元或者步骤。借助于包括几种不同的单元的硬件和借助于适当编程的计算机能够实施本发明。在枚举几种装置的设备权利要求中,这些装置中的几个装置可以通过相同的硬件来实现。在互不相同的从属权利要求中记载的某些措施并非表示不能从这些措施的组合中获益。

Claims (15)

1.一种窄带音频信号(9;50),包括可用于将窄带音频信号处理成对应的宽带音频信号(27;84)的信息,其特征在于所述信息作为可识别的失真出现在窄带音频信号中。
2.根据权利要求1的窄带音频信号(50),其中所述信息作为水印被嵌入到窄带音频信号中,优选地以感觉上听不到的方式。
3.用于将宽带音频信号(1;40)处理成基本上包括与宽带音频信号相同的信息的窄带音频信号(9;50)的方法,其中位于所述标准化的频率界限之内的宽带音频信号的第一频谱部分(4;51)在窄带音频信号中基本保持不变,而可用于恢复宽带音频信号的剩余的频谱部分(5;52)的恢复信息(7;56)被嵌入到所述第一频谱部分,其特征在于为了获得所述窄带音频信号通过以可识别的方式使所述第一频谱部分失真将所述恢复信息嵌入到所述第一频谱部分中。
4.根据权利要求3的方法,其中所述恢复信息(7;56)作为水印被嵌入到所述第一频谱部分(4;51)中,该水印作为有效负荷承载了所述恢复信息。
5.根据权利要求4的方法,其中通过下述步骤将所述水印嵌入到所述第一频谱部分中:
-以数字形式提供所述第一频谱部分(51)和所述剩余的频谱部分(52);
-将所述第一频谱部分(51)组织成帧(46);
-对所述帧进行傅立叶变换(47);
-根据所述水印修改(48)傅立叶系数;以及
-对修改后的傅立叶系数进行逆傅立叶变换(49)以获得时域的、加了水印的帧。
6.根据权利要求3-5任意一个的方法,其中所述窄带音频信号被重新处理成宽带音频信号,优选地在通过传输通道传输所述窄带音频信号之后或者是将其存储到存储介质上之后。
7.一种用于将宽带音频信号(1;40)编码成基本上包括与宽带音频信号相同的信息的窄带音频信号(9;50)的编码器,其特征在于包括:
-滤波器(2;43),用于从宽带音频信号中提取第一频谱部分(4;51),所述第一频谱部分位于标准化的频谱界限内;
-信息产生电路(6;55),用于从宽带音频信号中或者从宽带音频信号的剩余的频谱部分(5;52)中提取恢复信息(7;56),所述信息可用于恢复宽带音频信号的所述剩余的频谱部分;
-嵌入器(8;45),用于将所述恢复信息嵌入在所述第一频谱部分,优选地以水印的形式,该水印承载作为有效负荷的所述恢复信息,以获得所述窄带音频信号。
8.根据权利要求7的编码器,其中所述信息产生电路(55)包括:
-外推器(53),用于将所述第一频谱部分(51)外推到被外推的音频信号(57),该音频信号(57)具有基本上对应于宽带音频信号的频率界限的频率界限;以及
-比较器(54),用于将所述被外推的音频信号同宽带音频信号(40)或者同所述剩余的频谱部分(52)进行比较,并且根据该比较提供所述的恢复信息(56)。
9.用于解码窄带音频信号(20;70)的解码器,该窄带音频信号包括可用于将该窄带音频信号处理成对应的宽带音频信号(27;84)的恢复信息,其特征在于包括:
-提取器(21;71),用于提取所述恢复信息(22;76),
-恢复电路(23;79),使用所述恢复信息来恢复一个或者多个频谱音频信号部分(24;82),并且将所述频谱音频信号部分与所述窄带音频信号进行合并(26;83)以获得所述对应的宽带音频信号。
10.根据权利要求9的解码器,其中所述恢复电路(79)包括:
-外推器(80),用于将所述窄带音频信号外推到被外推的音频信号(74),该被外推的音频信号(74)具有基本上对应于相应的宽带音频信号的频率界限的频率界限;以及
-校正器(81),用于根据所述恢复信息来修改所述被外推的音频信号的特性。
11.一种通过窄带传输通道来传输宽带音频信号的系统,其特征在于在发送端包括根据权利要求7的编码器,用于将宽带音频信号处理成窄带音频信号,并且在接收端包括根据权利要求9的解码器,用于将所述窄带音频信号重新处理成宽带音频信号。
12.一种用于将宽带音频信号存储在存储介质上并且从存储设备中恢复宽带音频信号的系统,其特征在于包括根据权利要求7的编码器,用于在存储之前将宽带音频信号处理成窄带音频信号,并且包括根据权利要求9的解码器,用于在存储设备中恢复之后将所存储的窄带音频信号重新处理成宽带音频信号。
13.一种存储介质,承载有根据权利要求1的窄带音频信号。
14.一种再现设备,包括权利要求9所述的解码器。
15.一种发射机,包括权利要求7所述的编码器。
CNB02821028XA 2001-10-25 2002-10-10 利用减少的带宽在传输通道上传输宽带音频信号的方法 Expired - Fee Related CN1288626C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01204075.4 2001-10-25
EP01204075 2001-10-25

Publications (2)

Publication Number Publication Date
CN1575492A true CN1575492A (zh) 2005-02-02
CN1288626C CN1288626C (zh) 2006-12-06

Family

ID=8181137

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB02821028XA Expired - Fee Related CN1288626C (zh) 2001-10-25 2002-10-10 利用减少的带宽在传输通道上传输宽带音频信号的方法

Country Status (9)

Country Link
US (1) US20030088327A1 (zh)
EP (1) EP1446797B1 (zh)
JP (1) JP2005506584A (zh)
KR (1) KR20040048978A (zh)
CN (1) CN1288626C (zh)
AT (1) ATE363121T1 (zh)
BR (1) BR0206194A (zh)
DE (1) DE60220307T2 (zh)
WO (1) WO2003036624A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101911501A (zh) * 2008-01-24 2010-12-08 日本电信电话株式会社 编码方法、解码方法及其装置、以及其程序和记录介质
CN102522092A (zh) * 2011-12-16 2012-06-27 大连理工大学 一种基于g.711.1的语音带宽扩展的装置和方法
CN101715549B (zh) * 2007-05-29 2013-03-06 英特拉松尼克斯有限公司 嵌入在音频信号中的隐藏数据的恢复
CN103299364A (zh) * 2011-02-07 2013-09-11 高通股份有限公司 用于编码和解码带水印信号的装置
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2268112T3 (es) * 2001-11-14 2007-03-16 Matsushita Electric Industrial Co., Ltd. Codificacion y descodificacion de audio.
US7036024B2 (en) * 2002-07-09 2006-04-25 Kaleidescape, Inc. Detecting collusion among multiple recipients of fingerprinted information
WO2004006579A1 (en) * 2002-07-09 2004-01-15 Kaleidescape, Inc. Content and key distribution system for digital content representing media streams
JP2005071522A (ja) * 2003-08-27 2005-03-17 Sony Corp コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法
US20060034299A1 (en) * 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
US7450570B1 (en) 2003-11-03 2008-11-11 At&T Intellectual Property Ii, L.P. System and method of providing a high-quality voice network architecture
US8019449B2 (en) * 2003-11-03 2011-09-13 At&T Intellectual Property Ii, Lp Systems, methods, and devices for processing audio signals
US20060034481A1 (en) * 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
EP1837875A1 (en) * 2006-03-22 2007-09-26 Deutsche Thomson-Brandt Gmbh Method and apparatus for correlating two data sections
EP2234400A1 (en) * 2009-03-23 2010-09-29 Sony Corporation Method and device for providing a multimedia content stream embedding processing information for the content
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
EP2709102A1 (en) * 2012-09-12 2014-03-19 Thomson Licensing Method and apparatus for determining an optimum frequency range within a full frequency range of a watermarked input signal
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10707905B2 (en) 2015-06-23 2020-07-07 Skyworks Solutions, Inc. Wideband multiplexer for radio-frequency applications
KR101722885B1 (ko) 2016-08-23 2017-04-03 백기출 덧버선 편직방법 및 덧버선 편직장치 및 덧버선
CN114679192B (zh) * 2020-12-24 2023-06-09 海能达通信股份有限公司 一种宽窄带多模终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3418297A1 (de) * 1984-05-17 1985-11-21 Europäische Rundfunk- und Fernseh AG - EUROPA 1, 6600 Saarbrücken Verfahren zur uebertragung breitbandiger tonsignale ueber einen uebertragungskanal mit verminderter uebertragungsbandbreite
ATE214524T1 (de) * 1994-11-04 2002-03-15 Koninkl Philips Electronics Nv Kodierung und dekodierung eines breitbandigen digitalen informationssignals
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6557103B1 (en) * 1998-04-13 2003-04-29 The United States Of America As Represented By The Secretary Of The Army Spread spectrum image steganography
US6871180B1 (en) * 1999-05-25 2005-03-22 Arbitron Inc. Decoding of information in audio signals
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101715549B (zh) * 2007-05-29 2013-03-06 英特拉松尼克斯有限公司 嵌入在音频信号中的隐藏数据的恢复
CN101911501A (zh) * 2008-01-24 2010-12-08 日本电信电话株式会社 编码方法、解码方法及其装置、以及其程序和记录介质
CN101911501B (zh) * 2008-01-24 2013-07-10 日本电信电话株式会社 编码方法、解码方法及其装置、以及其程序和记录介质
CN103299364A (zh) * 2011-02-07 2013-09-11 高通股份有限公司 用于编码和解码带水印信号的装置
CN103299364B (zh) * 2011-02-07 2015-05-27 高通股份有限公司 用于编码和解码带水印信号的装置
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
CN102522092A (zh) * 2011-12-16 2012-06-27 大连理工大学 一种基于g.711.1的语音带宽扩展的装置和方法
CN102522092B (zh) * 2011-12-16 2013-06-19 大连理工大学 一种基于g.711.1的语音带宽扩展的装置和方法

Also Published As

Publication number Publication date
ATE363121T1 (de) 2007-06-15
EP1446797A1 (en) 2004-08-18
JP2005506584A (ja) 2005-03-03
EP1446797B1 (en) 2007-05-23
CN1288626C (zh) 2006-12-06
KR20040048978A (ko) 2004-06-10
DE60220307T2 (de) 2008-02-07
DE60220307D1 (de) 2007-07-05
WO2003036624A1 (en) 2003-05-01
BR0206194A (pt) 2004-02-03
US20030088327A1 (en) 2003-05-08

Similar Documents

Publication Publication Date Title
CN1288626C (zh) 利用减少的带宽在传输通道上传输宽带音频信号的方法
CN1148901C (zh) 广播编码的系统和方法
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CA2444151C (en) Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
CN1065381C (zh) 数字音频信号编码和/或译码方法
CN1144179C (zh) 声音信号解码方法和装置、声音信号编码方法和装置
CN1129114C (zh) 附加信息嵌入方法和设备,以及附加信息解调方法和设备
CN1030129C (zh) 高效数字数据编码和译码装置
CN1103141C (zh) 信息编码方法和设备、信息解码方法和设备、信息传输方法
CN1950883A (zh) 可伸缩性解码装置及增强层丢失的隐藏方法
CN1808568A (zh) 具有水印插入/提取功能的音频编码/解码设备及其方法
CN1272259A (zh) 采用频带复现增强源编码
CN1638479A (zh) 数字音频水印插入/检测装置及方法
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
CN1529882A (zh) 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
CN1291375C (zh) 声信号编码方法和设备、解码方法和设备
CN1231890C (zh) 编码设备、解码设备和广播系统
CN1795493A (zh) 用于采用子带滤波来嵌入水印的装置和方法
MX2014003610A (es) Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2").
CN100346577C (zh) 信号编码装置和信号解码装置,以及信号编码方法和信号解码方法
KR101381602B1 (ko) 계층적 부호화 및 복호화 방법 및 장치
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
CN1290078C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
CN1497879A (zh) 广播编码的系统和方法
Neubauer et al. Robustness evaluation of transactional audio watermarking systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee