CN1240048C - 音频编码 - Google Patents

音频编码 Download PDF

Info

Publication number
CN1240048C
CN1240048C CNB028012763A CN02801276A CN1240048C CN 1240048 C CN1240048 C CN 1240048C CN B028012763 A CNB028012763 A CN B028012763A CN 02801276 A CN02801276 A CN 02801276A CN 1240048 C CN1240048 C CN 1240048C
Authority
CN
China
Prior art keywords
sound signal
signal
parameter
sampling frequency
audio stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028012763A
Other languages
English (en)
Other versions
CN1461467A (zh
Inventor
L·M·范德凯克霍夫
A·W·J·欧门
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pendragon wireless limited liability company
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1461467A publication Critical patent/CN1461467A/zh
Application granted granted Critical
Publication of CN1240048C publication Critical patent/CN1240048C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供了一种音频信号(x)的编码,其中编码比特流(AS)的语义和语法都于与一个特定的抽样频率无关。这样,再生音频信号(x)所需的所有的比特流参数(CT,CS,CN),包括象帧长度这样的隐含参数,都与绝对频率和绝对时间有关,与抽样频率无关。

Description

音频编码
技术领域
本发明涉及音频信号的编码和解码。尤其是,本发明涉及在电晶管音频或互联网音频中使用的低比特率音频编码。
背景技术
知觉编码依赖于被称为掩蔽的人类听觉系统现象。平均人耳对一个较宽的频率范围较为敏感。但是,当在一个频率上具有多个信号能量的时候,人耳不能听到临近频率的低能量信号,就是说,较高的频率掩蔽了较低的频率,这样较高的频率被称为掩蔽,较低的频率被称为目标。知觉编码通过将有关掩蔽频率的信息丢掉来节省信号带宽。其结果与原始信号不同,但是却具有合适的估量,人耳无法听出其差别。知觉编码的两个特别的类型是变换编码和子带编码。
在变换编码中,通常,一个输入的音频信号被编码成一个包含有一个或多个帧的比特流,每一帧都含有一个或多个段。编码器将信号分成在一个给定的抽样频率所需的抽样块(段),这些块被变换成频率域用于识别信号频谱特性。产生的系数并不被完全精确的传送,而是被量化,这样尽管降低了精度但是节省了字长。解码器执行相反的变换从而产生一个原始信号的版本,该信号具有较高的成型的噪声平面。应当注意到,通常,系数频率值是由变换长度和抽样频率隐含定义的,或者换句话说,与变换系数相应的频率(范围)与抽样率直接相关。
子带编码(SBC)与变换编码的操作方式相同,但是这里变换成频率域是通过子带滤波器进行的。子带信号在传输之前被量化和编码,每一子带的中央频率和带宽再次被滤波器的结构和抽样频率所隐含定义。
在上述两种情况中,通常在变换编码中,尤其在子带编码中,所用的滤波器的分辨率利用变换或者子带滤波的操作的抽样频率直接测量。
但是许多信号不仅包含一个确定的成分,还包含一个不确定的成分或者随机噪声成分,线性预测编码(LPC)是一种用于表示这种类型的频谱形状或信号成分的技术。通常,基于编码的LPC从噪声成分或信号中取出抽样块并产生表示抽样块的频谱形状的滤波参数。然后解码器能够在以相同的抽样率产生合成噪声并且利用根据原始信号计算的滤波参数产生具有一个接近原始信号的频谱形状的信号。但是,能够看出这样的编码器是为了一个特定的抽样频率而设计的,在这个频率上解码器利用与原始抽样频率相关的滤波系数运行。预测滤波器参数仅是对于该抽样频率是有效的,这样在该特定的抽样频率下产生一个预测误差从而产生正确的输出信号。(在一些特别的情况下,在其它的抽样频率运行解码器也是可能的,例如正好在抽样的频率的一半上。)
但是在目前的说明书中包括通常上面所描述的以及在例如PCT国际申请No.WO97/21310中所描述的当前低比特率音频编码系统都存在着下述问题:编码器产生的比特流与编码器产生比特流所利用的抽样频率有关,在该频率下解码器不得不运行产生时间域PCM(脉冲编码调制)输出信号。这样,在解码器中所使用的抽样频率既可以包含在合成比特流中作为解码器的参数,又可以以其它的方式为解码器所知。
而且,解码器硬件需要能够在能够被编码器所用的任何抽样频率上运行的时钟电路,从而产生一个编码的比特流。就解码器的计算负载而言通过测量输出抽样频率的可分级性是不存在的,或者被限制在一些离散的步骤中。
发明内容
本发明提供了一种编码音频信号的方法,该方法包括步骤:在一个第一抽样频率对音频信号进行抽样,产生抽样的信号值;分析抽样的信号值从而产生一个表示音频信号的参数;以及产生一个包括表示所述的音频信号的表征参数并与所述的第一抽样频率相独立的音频流,这样就使所述的音频信号独立于所述的抽样频率而被合成。
这样,再生音频信号所需的编码比特流语义和语法,包括象帧长度这样的隐含参数,就与绝对频率和绝对时间有关,这样就与抽样频率无关。
这样,解码器的输出抽样频率不需要与输入到编码器的输入信号的抽样频率有关,这样编码器和解码器能够彼此独立的在一个用户选择的抽样频率下工作。
因此,解码器能够在例如,由解码器硬件的时钟电路所支持的单一抽样频率下工作,或者在解码器硬件平台的处理器能量所支持的最高抽样频率下工作。
在本发明的一个优选实施例中,参数表征的成分包括瞬时信号成分的位置和形状参数以及链接信号成分的轨迹表征。在这种情况下,参数被编码为绝对时间和频率或者独立于编码抽样频率的绝对时间和频率的表示符。而且,在该实施例中,参数表征的成分包括表示独立于原始编码抽样频率的音频信号的噪声成分的线性频谱频率。这些线性谱频频率都由绝对频率值表示。
根据本发明,提供一种编码一种音频信号的方法,该方法包括步骤:
(a)以第一抽样频率对音频信号(x)抽样,产生抽样的信号值,分析该抽样的信号值以产生音频信号的参数表示;以及
(b)产生一个编码音频流,该音频流包括表示所述的音频信号的参数表示并独立于所述的第一抽样频率,从而允许所述的音频信号独立于所述的抽样频率而被合成,
其中步骤(a)和(b)进一步包括以下步骤:
(c)估测音频信号中瞬时信号成分的位置;
(d)将具有形状参数和位置参数的形状函数与所述瞬时信号相匹配,其中所述位置参数是所述音频信号中所述瞬时信号成分的绝对时间位置的表示;以及
(e)在所述音频流中包括描述所述形状函数的位置和形状参数。
根据本发明,提供一种解码一个音频流以产生相应的音频信号的方法,该方法包括步骤:
(a)读取一个表示音频信号的编码的音频流,该音频流包括一个与编码器抽样频率相独立的参数表示;
(b)在解复用器中解复用该音频流以产生相应的码流(;以及
(c)将所述码流提供给瞬时合成器、正弦合成器和噪声合成器(33)以便独立于所述抽样频率合成所述音频信号,
其中
(d)所述音频流包括表示包括在所述音频信号中的瞬时信号成分的绝对时间位置的位置参数,该瞬时成分由同样包括在所述音频流中的具有形状参数的形状函数表示。
根据本发明,提供一种音频编码器,包括:
(a)抽样器,用于以第一抽样频率对音频信号进行抽样,从而产生抽样的信号值;
(b)瞬时编码器,正弦编码器和噪声编码器,用于处理抽样的信号值,并产生所述音频信号的且独立于所述第一抽样频率的相应参数表示以允许所述音频信号独立于所述抽样频率而被合成;以及
(c)比特流产生器,用于产生编码的音频流,该音频流包括表示所述的音频信号的参数表示,其中编码器和产生器可操作用于:
(d)估测音频信号中瞬时信号成分的位置;
(e)将具有形状参数和位置参数的形状函数与所述瞬时信号相匹配,其中所述位置参数是所述音频信号中所述瞬时信号成分的绝对时间位置的表示;以及
(f)在所述音频流中包括描述所述形状函数的位置和形状参数。
根据本发明,提供一种音频播放器,包括
合成器,布置用于处理表示音频信号的编码的音频流,该音频信号包括独立于编码器抽样频率的参数表示,所述合成器可操作用于独立于所述抽样频率地合成所述音频信号,
其中所述音频流包括表示包括在所述音频信号中的瞬时信号成分的绝对时间位置的位置参数,该瞬时成分由同样包括在所述音频流中的具有形状参数的形状函数表示。
附图说明
下面将参照附图描述本发明的优选实施例。其中:
附图1示出了根据本发明的音频编码器的实施例。
附图2示出了根据本发明的音频播放器的实施例。
附图3示出了包含有音频编码器和音频播放器的系统。
具体实施方式
在本发明的优选实施例中,附图1中,编码器是在欧洲专利申请No.00200937.7,申请日为2000.3.15(代理卷号:PH-NL00120)中所描述的正弦类型编码器。在较早的情况下以及在目前的优选实施例中,音频编码器1在一个特定的抽样频率上对一个输入的音频信号进行抽样,结果产生了音频信号的一个数字表示x(t)。这表示时间量度t随抽样率而改变。编码器1然后将抽样的输入信号分成三种成分:瞬时信号成分,持续确定成分以及持续随机成分。音频编码器1包括一个瞬时编码器11,一个正弦编码器13以及一个噪声编码器14,。音频编码器随意的包含一个增益压缩器件(GC)12。
在本发明的优选实施例中,瞬时编码是在持续编码之前执行的。由于瞬时信号成分是无效的,并且是在持续编码中随意编码的,因此这样做是有利的。如果持续编码器被用于编码瞬时信号成分,就需要许多编码努力;例如,人们可以想象,仅利用持续的正弦编码瞬时的信号成分是多么困难。因此,在持续编码之前从将被编码的音频信号中移走瞬时信号成分是有利的。将会看出在瞬时编码器中得到的瞬时开始位置能够在持续编码器中使用用于适应性的分割(适应成帧)。
但是,本发明并不限于在欧洲专利申请No.00200939.7中所公开的瞬时编码的特别应用,这里仅是为了解释的目的。
瞬时编码器11包括一个瞬时检测器(TD)110,一个瞬时分析器(TA)111,以及一个瞬时合成器(TS)112。首先,信号x(t)进入瞬时检测器110。该检测器110估测是否存在一个瞬时信号成分以及它的位置。该信息被馈送到瞬时分析器111。该信息也被正弦编码器13和噪声编码器14所使用从而获得有利的引导分割信号。如果确定了瞬时信号成分的位置,瞬时分析器111努力抽取(主要部分)瞬时信号成分。它将一个形状函数与信号段相匹配,该信号段最好是在一个估计的开始位置开始,并且利用例如一些(少量)正弦成分来确定形状函数下的成分。该信号被包含在瞬时编码流CT中,关于产生瞬时编码流CT的更为详细的描述在欧洲专利申请No.00200939.7中有所记载。在任何情况下,可以看出,例如瞬时分析器利用类似形状函数的Meixner,然后瞬时编码流CT包括在瞬时开始处的开始位置;基本表示初始上升率的参数;以及基本表示延时率的参数。除了频率,还有瞬时的正弦成分的幅度和相位数据。这样,为了实现本发明,开始位置应当以时间值,而不是例如在一帧内的抽样数被传输;正弦频率应当以绝对值或者使用绝对值的表示符,而不是仅来源于或者与传输抽样频率成比例的值来传输。在现有技术中,后面的选择通常被选为,离散值,它们直观上更易被编码和压缩。但是,这需要解码器能够再生抽样频率,从而再生音频信号。
可以看出,在瞬时信号成分是一个在幅度包上类似阶跃变化的情况下,形状函数也可以包含一个阶跃表示。在这种情况下,瞬时位置只会影响在正弦与噪声模型合成的过程中的分割。而且,但是,类似阶跃变化的位置被编码成时间值而不是抽样数目,其将与抽样频率有关。
瞬时编码CT被提供到瞬时合成器112。合成的瞬时信号成分在减法器16中从输入信号x(t)中减掉,产生了信号x1。在这种情况下,GC12被忽略,x1=x2。信号x2被提供到正弦编码器13,其被正弦分析器(SA)130分析,它确定了(确定)正弦成分。产生的信号被包含在正弦编码CS中,在PCT专利申请No.PCT/EP00/05344(代理人卷号Ref:N017502)中示出了一个更为详尽的典型正弦信号CS的产生实施例。此外,在“基于正弦表示的语音分析/合成”,R.McAulay与t.Quartieri,IEEE Trans,Acoust.,speech,信号处理.,43:744-754,1986或者“根据University of Hannover and Deutsche BundespostTelekom AG(revised)的MPEG-4音频编码协议的技术描述”,B.Edler,H.Purnhagen和C.Ferekidis,Technical notempeg95/0414r,Int.Oranisation fou standardisation ISO/IECJTC1/SC29/WG11,1996中也描述了一个基本的设备。
总之,但是,优选实施例的正弦编码将输入信号X2编码成从一个帧段到下一个相连接的正弦成分的轨迹。轨迹最初被在一个给定的段-出生的正弦开始的开始频率,开始幅度,开始相位所表示。以后,轨迹被接下来的段的频率差,幅度差,以及可能的相位差(连续的)表示,直至轨迹结束(死亡)。实际上,可以发现在编码相位差中几乎没有增益。这样,相位信息就根本不需要连续的编码并且相位信息可以使用连续的相位重建而再生。而且,为了实现本发明,在正弦码流CS中开始频率被编码成绝对值或者绝对频率的表示符表示从而保证编码信号独立于抽样频率。
根据正弦码流CS,正弦信号成分被正弦合成器(SS)131重建。该信号在减法器17中从输入到正弦编码器13中的信号中减掉,导致了剩余信号x3中缺乏(大的)瞬时信号成分以及(主要的)确定正弦成分。
剩下的信号x3被假设为主要包含噪声并且优选实施例的噪声分析器14产生了一个表示该噪声的噪声编码CN。通常,例如在PCT专利申请No.PCT/EP00/04599,2000,5,19日申请的(代理人卷号:Ref:PHNL000287)中,根据等效矩形带宽(EBR)级,噪声编码器以及合并的AR(自动回归)MA(运动平均)滤波参数(pi,qi)模仿噪声频谱。在解码器中,附图2所示,滤波参数被馈送到噪声合成器NS33,其主要是一个滤波器,具有与近似噪声频谱的频谱响应。NS33通过利用ARMA滤波参数(pi,qi)滤波白噪声信号产生重建的噪声yN,接下来将其加到合成的瞬时yT和正弦yS信号中。
但是,ARMA滤波参数(pi,qi)还是随噪声分析器的抽样频率而定,并且这样来执行本发明,这些参数被在编码以前被转换成如已知的线性频谱对(LSP)的线性频谱频率(LSF)。这些LSF参数能够被表示成绝对频率栅格或者与ERB级或bark级有关的栅格。有关LSP的更多的信息能够在F.K.Soong以及B.H.Juang,ICASSP,PP.1.10.1,1984的“线性频谱对(LSP)以及语音数据压缩”中找到。在任何情况下,将随着编码抽样频率变化的情况下的(pi,qi)的线性预测滤波类型的系数转换成在解码器中所需的与抽样频率独立的LSFs,以及相反的变换都是已知的,这里不在对其进行讨论。但是,可以看出,在解码器中将LSFs变换成滤波参数(p’i,q’i)可以参照噪声合成器33所产生的白噪声抽样频率进行,这样就能够在解码器中产生与先前抽样的形式所独立的噪声信号yN。
可以看出,与正弦编码器13的情况类似,噪声分析器14也可以使用瞬时信号成分的开始位置作为一个新的分析块的开始位置。这样,正弦分析器130和噪声分析器14的段的尺寸就不需要相等了。
最好,在复用器15中,形成了一个包括码流CT,CS和CN的音频流AS。音频流AS被提供到例如数据总线,天线系统,存储介质等。
附图2示出了根据本发明的音频播放器3。一个例如由根据图1所示的编码器产生的音频流AS’可以从数据总线,天线系统或者存储介质等获得。音频流AS’在解复用器30中解复用从而获得码流CT,CS以及CN。这些码流分别被提供到瞬时合成器31,正弦合成器32以及噪声合成器33。根据瞬时编码流CT,瞬时信号成分在瞬时合成器31中被计算。在瞬时码流表示一个形状函数的情况下,该形状被根据接收到的参数进行计算。而且,形状内容根据正弦成分的频率和幅度进行计算。如果瞬时码流CT表示一个阶跃,就没有瞬时被计算。整个瞬时信号Yt是所有瞬时的加和。
如果使用适应帧,然后根据瞬时位置,计算正弦合成器SS32和噪声合成器NS33的分割。正弦码CS被用于产生信号Ys,描述为在一个给定段上的正弦的和。噪声码CN被用于产生一个噪声信号yN。为此,帧分割的线性谱频频率被首先变换成ARMA滤波参数(p’i,q’i)专用于由噪声合成器在此频率上产生白噪声,并且这些与白噪声值合并用于产生音频信号的噪声成分。在任何情况下,接下来的帧段被例如重叠增加方法被增加。
总的信号y(t)包括瞬时信号Yt,解压缩幅度的乘积,正弦信号yS的和以及噪声信号yN四者的和。音频播放器包括两个加法器36和37分别用于将信号相加。整个信号被提供到一个输出单元35。例如一个扬声器。
附图3示出了根据本发明包含有一个图1所示的音频编码器1以及图2所示的音频播放器3的音频系统。这样的音频系统具有播放和记录的功能。音频流AS通过通信频道2从音频编码器流入到音频播放器,通信频道可以是一个无线连结,一个数据总线20或者一个存储介质。在通信频道2为一个存储介质的情况下,存储介质可以被固定在系统中或者也可以是一个可移动的盘,存储棒等。通信频道2可以是音频系统的一部分,但是也经常在音频系统之外。
总之,能够看到优选实施例的编码器是根据将宽带音频信号分为三种类型的成分:
-正弦成分,其绝对频率在比特流中传送,
-瞬时成分,其在一个帧段中的瞬时位置的绝对位置被传送,瞬时包特定在一个绝对时间测量上,并且其绝对频率的正弦成分在比特流中被传送。
-噪声成分,其线性频谱频率在比特流中传送。
而且,帧长度可以由绝对时间来定义,而不是由现有技术中的抽样的数目来定义。
利用这样的编码器,解码器能够在任何频率上运行。但是,如果抽样频率至少是包含在比特流中的任何成分的最高频率的两倍,才能获得整个带宽。对于一个特定的应用,预先定义在解码器中使用的最小带宽(或抽样频率)从而在比特流中获得可用的整个带宽是可能的。在一个更为优越的实施例中,推荐的最小带宽(或抽样频率)被包含在比特流中,例如以一个或多个比特的表示符的形式。该推荐最小带宽能够在一个合适的解码器中使用用于确定将被使用的最小带宽/抽样频率从而在比特流中获得可用的整个带宽。
应当看到,时间测量和补丁移动是由这样的系统所固有支持的。时间测量仅包括利用一个与编码器所选择的不同的绝对帧长度。补丁移动能够通过由一个特定的参数复用所有绝对频率来简单的实现。
应当注意本发明可以利用专用的硬件来实现,用软件在DSP(数字信号处理)上运行或者在一个普通的计算机上执行。本发明能够在一个实际的例如一个CD-ROM或者一个DVD-ROM这样的携带用于执行本发明的编码方法的计算机程序的媒体上执行。本发明也可以被用作在一个诸如互联网的数据网络上传送的信号,或者被广播服务所传送的信号。
应当注意上面描述的实施例只是用于示例,而不是用于限制本发明,并且本领域的技术人员能够在不背离追加的权利要求的范围内设计出多种变形的实施例。在权利要求中,放在括号中任何的参考数字都不能用于限制该权利要求。词语“包括”不排除在权利要求中列出的其它元件或步骤的出现。本发明可以通过包含几个分离元件的硬件设备来实现,也可以利用合适编程的计算机来实现。在一个设备权利要求中列举了几个装置,它们中的几个可以利用一个或同样条目的硬件来实现。在彼此不同的从属权利要求中记载的特定的措施并不表示这些措施的组合不能被有利的应用。
总之,这里提供了一种编码比特流的语义和语法与特定的抽样频率无关的音频信号的编码。这样,再生一个音频信号所需的所有比特流的参数,包括象帧长度那样的隐含参数都与绝对频率和绝对时间相关,这样就不与抽样频率相关。

Claims (9)

1.一种编码一种音频信号(x)的方法,该方法包括步骤:
(a)以第一抽样频率对音频信号(x)抽样,产生抽样的信号值,分析该抽样的信号值以产生音频信号的参数表示;以及
(b)产生一个编码音频流(AS),该音频流包括表示所述的音频信号的参数表示并独立于所述的第一抽样频率,从而允许所述的音频信号独立于所述的抽样频率而被合成,
其中步骤(a)和(b)进一步包括以下步骤:
(c)估测音频信号中瞬时信号成分的位置;
(d)将具有形状参数和位置参数的形状函数与所述瞬时信号相匹配,其中所述位置参数是所述音频信号(x)中所述瞬时信号成分的绝对时间位置的表示;以及
(e)在所述音频流(AS)中包括描述所述形状函数的位置和形状参数。
2.一种如权利要求1所述的方法,该方法进一步包括:
(f)通过确定一个滤波器的ARMA滤波参数(pi,qi)模仿音频信号的噪声成分,该滤波器具有与噪声成分的目标频谱近似的频率响应,
(g)将滤波参数变换成与第一抽样频率独立的参数。
3.一种如权利要求2所述的方法,其中所述的滤波参数是自动回归(pi)和运动平均(qi)参数,以及所述的独立参数是线性频谱的表示。
4.一种如权利要求3所述的方法,其中所述的独立参数以绝对频率,Bark级或者ERB级中的一个所表示。
5.一种如权利要求1所述的方法,其中所述的匹配步骤响应于所述的在幅度上类似阶跃变化的瞬时信号成分,从而提供一个表示阶跃瞬时的形状函数。
6.一种如权利要求1所述的方法,其中产生一个编码的比特流的步骤(b)包括在比特流中包括一个在解码器中使用的一个推荐的最小带宽或者一个第一抽样频率的表示符。
7.解码一个音频流以产生相应的音频信号(x)的方法,该方法包括步骤:
(a)读取一个表示音频信号(x)的编码的音频流(AS’),该音频流包括一个与编码器抽样频率相独立的参数表示(CT,CS,CN);
(b)在解复用器(30)中解复用该音频流以产生相应的码流(CT,CS,CN);以及
(c)将所述码流(CT,CS,CN)提供给瞬时合成器(31)、正弦合成器(32)和噪声合成器(33)以便独立于所述抽样频率合成所述音频信号,
其中
(d)所述音频流包括表示包括在所述音频信号(x)中的瞬时信号成分的绝对时间位置的位置参数,该瞬时成分由同样包括在所述音频流中的具有形状参数的形状函数表示。
8.音频编码器(1),包括:
(a)抽样器(10),用于以第一抽样频率对音频信号(x)进行抽样,从而产生抽样的信号值;
(b)瞬时编码器(11),正弦编码器(13)和噪声编码器(14),用于处理抽样的信号值,并产生所述音频信号的且独立于所述第一抽样频率的相应参数表示以允许所述音频信号独立于所述抽样频率而被合成;以及
(c)比特流产生器,用于产生编码的音频流(AS),该音频流包括表示所述的音频信号的参数表示,其中编码器(11,13,14)和产生器(15)可操作用于:
(d)估测音频信号中瞬时信号成分的位置;
(e)将具有形状参数和位置参数的形状函数与所述瞬时信号相匹配,其中所述位置参数是所述音频信号(x)中所述瞬时信号成分的绝对时间位置的表示;以及
(f)在所述音频流(AS)中包括描述所述形状函数的位置和形状参数。
9.音频播放器(3),包括
合成器(31,32,33),布置用于处理表示音频信号(x)的编码的音频流(AS’),该音频信号(x)包括独立于编码器抽样频率的参数表示(CT,CS,CN),所述合成器(31,32,33)可操作用于独立于所述抽样频率地合成所述音频信号,
其中所述音频流(AS’)包括表示包括在所述音频信号(x)中的瞬时信号成分的绝对时间位置的位置参数,该瞬时成分由同样包括在所述音频流(AS’)中的具有形状参数的形状函数表示。
CNB028012763A 2001-04-18 2002-04-09 音频编码 Expired - Fee Related CN1240048C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01201404 2001-04-18
EP01201404.9 2001-04-18

Publications (2)

Publication Number Publication Date
CN1461467A CN1461467A (zh) 2003-12-10
CN1240048C true CN1240048C (zh) 2006-02-01

Family

ID=8180169

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028012763A Expired - Fee Related CN1240048C (zh) 2001-04-18 2002-04-09 音频编码

Country Status (8)

Country Link
US (1) US7197454B2 (zh)
EP (1) EP1382035A1 (zh)
JP (1) JP2004519741A (zh)
KR (1) KR20030011912A (zh)
CN (1) CN1240048C (zh)
BR (1) BR0204834A (zh)
PL (1) PL365018A1 (zh)
WO (1) WO2002084646A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
KR20050086762A (ko) * 2002-11-27 2005-08-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 정현파 오디오 코딩
US7548852B2 (en) * 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
ATE425533T1 (de) * 2003-07-18 2009-03-15 Koninkl Philips Electronics Nv Audiocodierung mit niedriger bitrate
WO2005024784A1 (en) * 2003-09-09 2005-03-17 Koninklijke Philips Electronics N.V. Encoding of transient audio signal components
WO2006000951A1 (en) * 2004-06-21 2006-01-05 Koninklijke Philips Electronics N.V. Method of audio encoding
EP1851752B1 (en) * 2005-02-10 2016-09-14 Koninklijke Philips N.V. Sound synthesis
KR20070025905A (ko) * 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
KR101317269B1 (ko) * 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55153159A (en) * 1979-05-15 1980-11-28 Sony Corp Digital signal recorder
US4710959A (en) * 1982-04-29 1987-12-01 Massachusetts Institute Of Technology Voice encoder and synthesizer
JP3559588B2 (ja) * 1994-05-30 2004-09-02 キヤノン株式会社 音声合成方法及び装置
JP3548230B2 (ja) * 1994-05-30 2004-07-28 キヤノン株式会社 音声合成方法及び装置
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
WO1997021310A2 (en) 1995-12-07 1997-06-12 Philips Electronics N.V. A method and device for encoding, transferring and decoding a non-pcm bitstream between a digital versatile disc device and a multi-channel reproduction apparatus
JPH10187195A (ja) * 1996-12-26 1998-07-14 Canon Inc 音声合成方法および装置
US6356569B1 (en) * 1997-12-31 2002-03-12 At&T Corp Digital channelizer with arbitrary output sampling frequency
EP0957579A1 (en) * 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals

Also Published As

Publication number Publication date
BR0204834A (pt) 2003-06-10
CN1461467A (zh) 2003-12-10
JP2004519741A (ja) 2004-07-02
US7197454B2 (en) 2007-03-27
US20020156619A1 (en) 2002-10-24
PL365018A1 (en) 2004-12-27
WO2002084646A1 (en) 2002-10-24
EP1382035A1 (en) 2004-01-21
KR20030011912A (ko) 2003-02-11

Similar Documents

Publication Publication Date Title
CN1240048C (zh) 音频编码
RU2437172C1 (ru) Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках
KR100561869B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
CN1210873C (zh) 实施不同编码法则的发送系统
KR100773539B1 (ko) 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
CN1878001B (zh) 对音频数据编码及解码的设备及方法
RU2326450C2 (ru) Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью
KR101175651B1 (ko) 다중 압축 부호화 방법 및 장치
CN1248824A (zh) 音频信号编码装置和方法以及解码装置和方法
CN1623185A (zh) 可伸缩音频编码的有效改进
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
CN101615396A (zh) 音频编码设备、音频解码设备及其方法
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
CN105913851A (zh) 对音频/语音信号进行编码和解码的方法和设备
CN101432802A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
EP2220646A1 (en) Audio coding apparatus and method thereof
JP2011059504A (ja) コンテンツ同定方法、コンテンツ同定システム、コンテンツ検索装置及びコンテンツ利用装置
CN1890713B (zh) 用于数字信号压缩编码的多脉冲字典的索引间的编码转换的方法及系统
CN1188832C (zh) 过滤语言帧的多脉冲内插编码
CN1237507C (zh) 音频信号的编辑
US20030195746A1 (en) Speech coding/decoding method and apparatus
JP2010506207A (ja) エンコード方法、デコード方法、エンコーダ、デコーダ、及びコンピュータプログラム製品
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2011008250A (ja) ビット率拡張音声符号化及び復号化装置とその方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: IPG ELECTRONICS 503 CO., LTD.

Free format text: FORMER OWNER: ROYAL PHILIPS ELECTRONICS CO., LTD.

Effective date: 20090821

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090821

Address after: British Channel Islands

Patentee after: Koninkl Philips Electronics NV

Address before: Holland Ian Deho Finn

Patentee before: Koninklike Philips Electronics N. V.

ASS Succession or assignment of patent right

Owner name: PENDRAGON WIRELESS CO., LTD.

Free format text: FORMER OWNER: IPG ELECTRONICS 503 LTD.

Effective date: 20130107

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130107

Address after: Washington State

Patentee after: Pendragon wireless limited liability company

Address before: British Channel Islands

Patentee before: Koninkl Philips Electronics NV

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060201

Termination date: 20140409