CN1119376A - 对来自多个信道的输入数字音频信号自适应编码的装置 - Google Patents

对来自多个信道的输入数字音频信号自适应编码的装置 Download PDF

Info

Publication number
CN1119376A
CN1119376A CN95101259A CN95101259A CN1119376A CN 1119376 A CN1119376 A CN 1119376A CN 95101259 A CN95101259 A CN 95101259A CN 95101259 A CN95101259 A CN 95101259A CN 1119376 A CN1119376 A CN 1119376A
Authority
CN
China
Prior art keywords
frame
bit
frequency
division section
frame group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95101259A
Other languages
English (en)
Inventor
金钟一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WiniaDaewoo Co Ltd
Original Assignee
Daewoo Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daewoo Electronics Co Ltd filed Critical Daewoo Electronics Co Ltd
Publication of CN1119376A publication Critical patent/CN1119376A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

自适应地对来自N个信道的输入数字音频信号进行编码的装置,包括:并联的N个分频段滤波器,用于对输入音频信号一分频段一分频段地进行滤波;为每个分频段、每帧估算感觉参数的估算器;比特分配单元,基于估算的信号对掩蔽比数据,感觉熵和平均值与标准偏差参数为各分频段确定比特及产生比特分配信息;N个并联的量化器,响应于各分频段的比特分配信息,为N个信道的已滤波分频段音频信号进行量化;用于与比特分配信息一起对已量化的音频信号进行格式化的电路。

Description

对来自多个信道的输入数字音频信号 自适应编码的装置
本发明涉及一种数字音频编码装置,更具体地讲,涉及一种改进的对来自多个信道的输入数字音频信号自适应编码的装置,其编码是基于与人的听觉感觉相一致的每个输入数字音频信号的感觉熵进行的。
数字化的音频信号传输使其有可能获得与光盘和/或数字音频磁带相媲美的高质量音频信号。当以数字形式表示音频信号时,需要传输一个基本的数据总量,特别是在高清晰度电视(HDTV)系统中。然而,分配给这种数字音频信号的可用频带宽度是有限的,为了通过有限的,例如约128KHz的音频带宽传输基本的数字数据的总量,例如对于以48KHz取样频率的16比特PCM(脉冲编码调制)音频信号而言是每信道768kbps,从而压缩该数字音频信号是不可避免的。
在各种音频压缩装置或技术中,使用一种音质评价算法的称之为MPEG(运动图象专家组,Moving Pictures Expert Group)-音频算法已被建议用于HDTV的应用。
MPEG-音频算法使用了四个主要部分:即分频段滤波、音质评价模型、量化与编码、和帧格式化。分频段滤波是一个输入数字音频信号从时域到频域的映射过程。可以利用具有B(例如32)个分频段的滤波器库。在每个分频段中,12或36个样值被分组,以便对其进行处理;且来自所述B个分频段,即D×12或36个分组样值构成一个“帧”,对于音频信号的编码、传输、和解码而言,帧是一个处理单元。音质评价模型产生一个数据组,例如SMR(信号对掩蔽比)数据,用于每个分频段或一组分频段控制其量化与编码。然后,在量化分频段的样值过程中参照SMR各可用比特被自适应地分配给帧的每个分频段。帧格式化器以适当的形式将量化的数据与其它要求的辅助信息一起格式化以便传输。
但是,在上述MPEG音频技术中,因为固定数目的比特被分配到每个帧,不能反映如可能在帧中连续变化的输入数字音频信号的平均和标准偏移及感觉熵这样的统计特性。另外,在具有不同的感觉熵的输入数字音频信号被提供给利用这种现有技术的常规装置的情况下,该装置在没有考虑任何感觉熵的情况下编码输入数字信号,导致人的听觉感觉差。
因此,本发明的一个主要目的是提供能够对多个信道自适应地编码输入数字音频信号的新颖的装置,其编码是根据每个输入数字音频信号的感觉熵进行的,从而提高了编码效率和音频质量。
按照本发明,提供一种自适应地对N个数目的信道的输入数字音频信号进行编码的新颖装置,其中每个输入数字音频信号包括多个帧且每个帧包括多个分频段,这里N是一个正整数,该装置包括:并联安排的N个分频段滤波装置,用于分别按一个分频段一个分频段地分别接收和滤波输入数字音频信号;第一估算装置,用于为包括在每个输入数字音频信号中的各相应分频段估算信号掩蔽比数据、声压水平和掩蔽阀值;第二估算装置,用于为包括在每个输入数字音频信号的各个帧估算感觉熵,该估算是基于估算的信号对掩蔽比数据、声压水平和掩蔽阀进行的,和用于为总的N个信道的包括N×M个当前和以前帧的一个帧组得到一个平均值和一个标准偏差参数,该值对应于估算的感觉熵,其中M是正整数;比特分配装置,用于根据估算的信号对掩蔽比数据、感觉熵、平均值和标准偏差参数自适应地为该帧群的各个分频段确定比特和用于对应于确定的比特为该帧群的各个分频段产生比特分配信息;并联安排的数目为N的量化装置,用于响应于产生的比特分配信息为该帧群的各个分频段量化N个信道的滤波分频段音频信号;和用于格式化与比特分配信息一起的已量化数字音频信号的装置。
本发明的上述和其他目的及特点从下面结合附图的对优选实施例的描述中将变得更为明显,其中:
图1表示按照本发明的用于自适应地编码来自多个信道的输入数字音频信号的新颖装置的示意性框图;
图2描述如图1所示的第二感觉参数估算器的详细框图;
图3表示如图1所示的第一比特分配单元的详细框图。
参照图1,示出了说明按照本发明的编码装置100的示意性框图。
编码装置100包括分频段滤波装置10、第一和第二感觉参数估算器20和30、第一和第二比特分配单元40和50、量化装置60和格式化电路70。
在编码装置100中,通过N个,例如两个,即第一(或左)和第二(或右)信道接收的第i帧(或目前帧)的输入数字音频信号X1(m、i)和X2(s,i)被加到第一感觉参数估算器20和分频段滤波装置10,其中各个输入数字音频信号包括M和S个样值,以便m=0、1、2、…,M-1;S=0.1、…、S-1,且M和S是正整数。这里所用的“帧”表示对应于固定数目音频样值的一部分数字音频信号且是用于数字音频信号的编码和解码的一个处理单元。
如所示,分频段滤波装置10包括多个分频段滤波器,例如两个分频段滤波器11和12,它们是并联连接的以便同时接收各当前帧的输入数字信号并利用现有技术中,例如公开在出版物ISO IEC JTCI/SC2/WG11,“第三部分,Audio proposal”,CD-11172-3(1991)所公开的称之为MPEG音频算法中的分频段滤波技术对来自第一和第二信道的输入数字音频信号进行滤波。亦即,分频段滤波器11和12用作以fs/B的取样频率均匀分开的分频段利用取样频率fs将输入数字音频信号分解为B份,例如32份且将分解为分频段的音频样值提供给量化装置60。
另一方面,第一感觉参数估算器20接收来自第一和第二信道的当前帧的输入数字音频信号且利用在例如在MPEG音频算法中所讨论的音质评价模型对包括在来自第一和第二信道的当前帧的各个分频段同时执行信号对掩蔽比(SMR)数据SMR1和SMR2、声压水平P1和P2和掩蔽阈M1和M2的估算。按照下式得到来自第一信道的每个分频段的SMR1:
      SMRl(r)=P1(r)-Ml(r)    (1)其中r是分频段指数,r=0、1……B-1,B是在一帧中分频段的总数;SMR1(r)是第一信道的分频段r的信号对掩蔽比;P1(r)是由FFT(快速付利叶变换)估算的第一信道的r分频段的声压水平;M1(r)是第一信道r分频段的掩蔽阀值;并且SMR1(r)、P1(r)和M1(r)都是以dB(分贝)为单位。
同样,来自第二信道的每个分频段的SMR2可以按下式得到:
SMR2(r)==P2(r)-M2(r)dB
                             (2)其中r具有与前面定义的相同含义。
掩蔽阀值表示一个可闻极限,它是一个声音的内部可闻极限或阀值和由音频信号的其他声音的与非声音的分量的压力引起的增量之和。然后在第一感觉参数估算器20估算的第一和第二信道的各信号对掩蔽比数据SMR1(r)和SMR2(r)被送到第二比特分配单元50,同时第一和第二信道的各声压水平P1(r)和P2(r)和各掩蔽阀值M1(r)和M2(r)被耦合到第二感觉参数估算器30。
第二感觉参数估算器30根据从第一感觉参数估算器20送来的声压水平P1(r)和P2(r)和掩蔽阀值M1(r)和M2(r)为第i个(或当前的)第一和第二信道的帧自适应估算感觉熵PE1(i)和PE2(i),且根据估算的感觉熵为包括在第一和第二信道的当前和其以前帧的帧群得到代表统计特性的平均的和标准编移参数PEm和PEstd。第二感觉参数估算器30的详情将在下面参照图2予以描述。
包括在帧群中第p个帧的感觉熵PE(p)和在第二感觉参数估算器30估算的平均值与标准偏移参数PEm和PEstd而后被送到第一比特分配单元40。第一比特分配单元40根据感觉熵和来自第二感觉参数估算器30的平均值与标准偏移参数起到为包括在该帧群中的每个帧确定比特的作用,和向第二比特分配单元50与格式化电路70提供对应于为第一和第二信道的各个帧确定的比特的比特分配信息FB1和FB2。第一比特分配单元40的详情将在下文参照图3予以描述。
参照图2,其表示出如图1所示的第二感觉参数估算器30的详细框图。第二感觉参数估算器30包括感觉熵计算器32和平均值与标准偏移计算器34。
感觉熵计算器32接收馈自如图1所示的第一感觉参数估算器20的第一和第二信道的声压水平P1(r)和P2(r)以及掩蔽阀值M1(r)和M2(r)并为第一与第二信道的第i帧计算感觉熵PE1(i)和PE2(i)。第一信道的第i帧的感觉熵PE(i),正如现有技术已公知的那样,可以表示为: PE 1 ( i ) = 1 B Σ r = 0 B - 1 MAX [ 0 , 1 2 log 2 P 1 ( r ) M 1 ( r ) ] dB - - - - ( 3 ) 其中r、i和B具有与以前定义的相同含义。
类似地,对于第二信道的第i帧的感觉熵PE2(i),如同现有技术一样,可以表示为: PE 2 ( i ) = 1 B Σ r = 0 B - 1 MAX [ 0 , 1 2 log 2 P 2 ( r ) M 2 ( r ) ] dB - - - - ( 4 ) 其中r、i和B具有如以前定义的相同的含义。
公式(3)和(4)可以通过应用称为比率失真理论来获得;且对应于基于人的听觉感觉的感觉熵。在感觉熵计算器32中计算的第一和第二信道的第i帧的感觉熵而后被送到平均值与标准偏差计算器34。
平均值与标准偏差计算器34适于分组计算的感觉熵,即第一和第二信道的当前的和其前面帧的数目为Q,例如4的PE1(i-1)和PEi(i),和PE2(i-1)和PE2(i),这些感觉熵是从感觉熵计算器32送来的,以便按照第一比特分配单元40的处理,在它们之中自适应地分配比特,该第一比特分配单元将在下面参照图3详细描述;及利用该帧群总的感觉熵计算代表它们的统计特性的平均值和标准偏差参数。正如现有技术中公知的那样,对于该帧群的总感觉熵的平均参数PEm可以按下式计算: PEm = 1 Q Σ p = 0 Q - 1 PE ( p ) - - - - ( 5 ) 其中p是用于该帧群中的帧指数,p=0、1、……Q-1,Q是该帧群的总帧数;PE(p)代表在该帧群中第P帧的感觉熵。
因此,用于该帧群的总感觉熵的标准偏差参数PEstd与现有技术中公知的一样,可以按下式得到: PEstd = 1 Q Σ P = 0 Q - 1 [ PE ( p ) - PEm ] 2 - - - - ( 6 ) 其中p和Q具与先前定义的同样含义。
第p帧的感觉熵PE(p)和在平均和标准偏差计算器32中被分组与被计算的平均值与标准偏差参数PEm和PEstd而后被送到如图1所示的第一比特分配单元40。
现参照图3,其示出了图1所示的第一比特分配单元40的详细框图。比特分配单元40包括判决电平估算器42和比特分配装置44。该判决电平估算器42自适应地为比特分配装置44估算该帧群的最佳判决电平,取决于来自图2所示的平均值与标准偏差计算器34的平均值和标准偏差参数PEm和PEstd,自适应地分配比特到该帧群的每一帧中。按照本发明的优选实施例,通过下式可以得到该帧群的第j个判决电平D(j):
       D(j)=PEm+j·PEstd·W
                                       (7)其中j是判决电平指数,j=-q至q,q是正整数,而W是该帧群中的一个加权因子。
正如从公式(7)可以看到,第p帧的第j个判决电平D(j)与第(j-1)个判决电平D(j-1)之间的电平间隔取决于来自平均和标准偏差计算器34的标准偏差PEstd和该帧群的加权因子W,同时确定了判决电平的总数,即2q+1。在判决电平估算器42中所用的该帧群的加权W最好通过使用来自平均和标准偏差计算器34的平均值和标准偏参数PEm与PEstd确定,以便得到该帧群的最佳决判电平,该电平与人的听觉感觉非常一致。按照本发明,该帧群的加权因子最好基于如表1所示代表该帧群的统计特性的平均值和标准偏参数PEm与PEstd来获得。
正如从表1可以看到那样,如果,PEstd小于第一预定阀值,例如,0.0125和PEm小于第二预定阀值,例如,0.15,则其中加权因子W可以被确定为0;另外,可以参照上面表1从任何一个加权因子中选择。即,如果PEstd相对地小和PEm相对地大,可以选择加权因子W较大的值,而如果PEstd相对大和PEm较小,则选择较小的值。
应当理解为,判决电平的数目,平均值与标准偏差参数的阀值和加权因子最好根据要求的编码效率和编码装置声音质量来确定。
接下来,在判决电平估算器42中,被估算和被确定的判决电平D(j)和总的判决电平数,即2q+1和来自图2所示平均与标准偏差计算器34的感觉熵PE(p)被同时提供到比特分配装置44。
比特分配44利用来自判决电平估算器42的判决电平和判决电平的总数和来自图2的平均与标准偏差计算器34的第p帧的感觉熵为该帧群的各个帧确定比特,和将对应于在该帧群中第一和第二信道为相应各帧确定的比特的比特分配信息FBI1和FBI2提供给图1所示的第二比特分配单元50和格式化电路70。在本发明的优选实施例中,为在该帧群中第p帧的比特分配FB(p)可以按下式确定: FB ( p ) = FBm + BV 2 q + 1 · I - - - - ( 8 ) 其中p具有与以前定义的相同含义;FBm为平均比特,例如对于在每信道128kbps数据传输速率下以48KHz取样频率的16比特PCM(脉冲编码调制)的音频数据中每帧3072比特;BV是预定的比特变化值;2qt1是预定判决电平的总数;I是第p帧的电平指数。
正如从公式(8)可以看到的那样,第p帧的比特分配FB(p)可以通过平均比特数增加从其第二项得到可变比特数确定。其中预定的比特可变值BV可以作为按公式(8)确定的对于一帧的平均比特相同的值确定的;和在该帧群中第p帧的电平指数I可以根据来自判决电平估算器42的判决电平D(j)和来自图2所示的平均与标准偏差计算器34的感觉熵PE(p)得到。按照本发明优选实施例,该帧群中第p帧的电平指数I可以表示为如表2所示(其中假设判决电平的间隔是1.27和判决电平指数j是-2到2):
正如从表2可以看出的那样,如果PE(p)在判决电平-2.55和-1.28之间,则电平指数I可以选为-1;如果PE(p)在判决电平-1.27和1.26之间,则电平指数I可以选为0,和以此类推。以这种方式,第p帧的比特分配FB(p)可以有益地利用公式(8)来确定。
接下来,在比特分配装置44中对应于该帧群的各个帧确定的比特的第一和第二信道的比特分配信息FBI1与FBI2和来自如图1所示的第一感觉参数估算器20的信号对掩蔽比数据SMR1(r)与SMR2(r)被同时送到第二比特分配单元50;且用于各个帧的比特分配信息FBI1与FDI2被送到格式化电路70。
再参照图1,第二比特分配单元50接收从第一感觉参数估算器20送来的信号对掩蔽比数据SMR1与SMR2和从第一比特分配单元40送来的用于各个帧的比特分配信息FBI1与FBI2,为包括在该帧群的每帧中的每个分频段确定比特,和分别提供对应于为第一和第二信道的各个分频段确定的比特的第一和第二信道比特分配信息SBI1与SBI2到量化装置60和格式化电路70。第二比特分配单元50所用的原理在于一帧的总掩蔽对噪声比数据的优化,不得不使所用比特数不超过第一比特分配单元40转换来的那个帧的可用比特数目。接下来,来自第二比特分配单元50的用于第一和第二信道的各个分频段的比特分配信息SBI1和SBI2和来自每个分频段滤波器11和12的分路分频段音频样值被送到包括多个量化器,例如61和62的量化装置60。
每个量化器61与62用作基于来自第二比特分配单元50相应比特分配信息对来自每个分频段滤波器11和12的对应分路分频段音频样值进行自适应量化和将第一和第二信道的每个信道的已量化音频信号提供给式化电路70。
在格式化电路70中,来自每个量化器61与62的已量化音频信号和来自第一与第二比特分配单元40与50的比特分配信息被传递到一个发送机(未示出)以便将其发送,从而改善了来自第一与第二信道的输入数字音频信号的编码效率及音频质量。第二比特分配单元50、量化器61与62和格式化电路70基本上与在MPEG音频算法中可以看到的相同。
在参照该具体的实施例本发明被表示与描述的同时,对于本专业的技术人员来说,在不脱离按所附的权利要求所限定的本发明的精神与范围的情况下,可能做出许多改变和改进是显而易见的。
                                    表1
    PEstdPEm  0.0125~0.125  0.126~0.25  0.26~0.375  0.376~
 0.15~0.63  10  0.5  0.25  0.125
  0.64~1.26  100  1  0.5  0.25
  1.27~1.89  1000  2  1  0.5
  1.90~  1000  4  2  1
                                        表2
判决电平D的范围     电平指数(I)
~-2.56      -2
-2.55~1.28      -1
-1.27~-1.26       0
 1.27~2.54       1
 2.55~       2

Claims (4)

1、一种对来自N个信道的输入数字音频信号进行自适应编码的装置,其中每个输入数字音频信号包括多个帧并且每个帧包括多个分频段,其中N是正整数,该装置包括:
并联安排的N个分频段滤波装置,用于按一个分频段一个分频段地分别接收和滤波该输入数字音频信号;
第一估算装置,用于对包括在每个输入数字音频信号中的各个分频段估算信号对掩蔽比数据、声压水平和掩蔽阀值;
第二估算装置,用于基于所估算的信号对掩蔽比数据、声压水平和掩蔽阀值对包括在每个输入数字音频信号中的各个帧估算感觉熵和用于对包括总信道数为N的M×N个当前的与以前的帧的一个帧群导出一个平均值和一个标准偏移参数,它们对应于估算的感觉熵,其中M是正整数;
比特分配装置,用于根据估算的信号对掩蔽比数据、感觉熵、和平均值与标准偏差参数为该帧群的各个分频段自适应地确定比特,和用于为该帧群的各个分频段产生对应于确定的比特的比特分配信息;
并联安排的N个量化装置,响应于为该帧群的各个分频段产生的相应比特分配信息,对N个信道的已滤波的分频段音频信息进行量化;和
用于对已量化的数字音频信号与比特分配信息一起进行格式化的装置。
2、按照权利要求1所要求的装置,其中所述比特分配装置包括:
用于基于估算的平均值与标准偏差参数估算该帧群的判决电平的装置;
第一比特分配装置,用于基于估算的判决电平、判决电平的总数、感觉熵和预定的平均比特,为该帧群的各个帧确定比特,和用于产生对应于为每个帧确定的比特产生比特分配信息;和
第二比特分配装置,用于基于估算的信号对掩蔽比数据和产生的比特分配信息为每个帧的各个分频段确定比特,和用于对应于为每个分频段确定的比特,产生比特分配信息。
3、按照权利要求2的装置,其中,该帧群的每个判决电平D是按照下式确定的:
       D=PEm+j·PEstd·W其中j是判决电平指数,j=-q到q,q是正整数,W是该帧群中的加权因子,PEm是该帧群的平均值参数;PEstd是该帧群的标准偏差参数。
4、按照权利要求3的装置,其中第p帧的比特分配FB(p)是按照下式得到的: FB ( P ) = FBm + BV 2 q + 1 · I 其中p是该帧群的帧指数;FBm是对于一帧的平均比特函数;BV是预定比特变化值;2q+1是预定判决电平总数;和I是第p帧的电平指数。
CN95101259A 1994-01-18 1995-01-16 对来自多个信道的输入数字音频信号自适应编码的装置 Pending CN1119376A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR784/94 1994-01-18
KR1019940000784A KR960012475B1 (ko) 1994-01-18 1994-01-18 디지탈 오디오 부호화장치의 채널별 비트 할당 장치

Publications (1)

Publication Number Publication Date
CN1119376A true CN1119376A (zh) 1996-03-27

Family

ID=19375804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95101259A Pending CN1119376A (zh) 1994-01-18 1995-01-16 对来自多个信道的输入数字音频信号自适应编码的装置

Country Status (5)

Country Link
US (1) US5613035A (zh)
EP (1) EP0663740A3 (zh)
JP (1) JP2908270B2 (zh)
KR (1) KR960012475B1 (zh)
CN (1) CN1119376A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100435485C (zh) * 2002-08-21 2008-11-19 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
CN1538351B (zh) * 2003-04-01 2010-06-09 微软公司 为视频序列生成视频缩略图的方法和计算机
CN1947340B (zh) * 2004-03-10 2010-09-08 大卫·阿舍·贾法 用于对个体的表现进行评级的系统和方法
CN101061534B (zh) * 2004-11-18 2011-04-06 佳能株式会社 音频信号编码装置及方法

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
KR0144011B1 (ko) * 1994-12-31 1998-07-15 김주용 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법
JP2820117B2 (ja) * 1996-05-29 1998-11-05 日本電気株式会社 音声符号化装置
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6005893A (en) * 1997-09-23 1999-12-21 Telefonaktiebolaget Lm Ericsson Reduced complexity bit allocation to subchannels in a multi-carrier, high speed data transmission system
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
CA2249792C (en) 1997-10-03 2009-04-07 Matsushita Electric Industrial Co. Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
IL134182A (en) 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
US6753929B1 (en) * 2000-06-28 2004-06-22 Vls Com Ltd. Method and system for real time motion picture segmentation and superposition
US6744818B2 (en) * 2000-12-27 2004-06-01 Vls Com Ltd. Method and apparatus for visual perception encoding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7079633B2 (en) * 2002-01-15 2006-07-18 Howard Leventhal Coding a masked data channel in a radio signal
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
CN100349207C (zh) * 2003-01-14 2007-11-14 北京阜国数字技术有限公司 高频耦合的伪小波5声道音频编/解码方法
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
EP1873753A1 (en) * 2004-04-01 2008-01-02 Beijing Media Works Co., Ltd Enhanced audio encoding/decoding device and method
US7903902B2 (en) 2004-07-26 2011-03-08 Sheraizin Semion M Adaptive image improvement
US7639892B2 (en) * 2004-07-26 2009-12-29 Sheraizin Semion M Adaptive image improvement
US7526142B2 (en) * 2005-02-22 2009-04-28 Sheraizin Vitaly S Enhancement of decompressed video
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
CN104282311B (zh) * 2014-09-30 2018-04-10 武汉大学深圳研究院 一种音频编码带宽扩展中子带划分的量化方法及装置
US10666289B1 (en) 2019-01-16 2020-05-26 International Business Machines Corporation Data compression using dictionary encoding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2389277A1 (fr) * 1977-04-29 1978-11-24 Ibm France Procede de quantification a allocation dynamique du taux de bits disponible, et dispositif de mise en oeuvre dudit procede
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
CA1253255A (en) * 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5539829A (en) * 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
US5331414A (en) * 1991-12-23 1994-07-19 Intel Corporation Method and apparatus for encoding a digital motion video signal using pyramid specific filtering
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
DE4222623C2 (de) * 1992-07-10 1996-07-11 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern von digitalisierten Tonsignalen

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100435485C (zh) * 2002-08-21 2008-11-19 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
CN100452657C (zh) * 2002-08-21 2009-01-14 广州广晟数码技术有限公司 对多声道数字音频信号进行压缩编码的编码方法
CN1538351B (zh) * 2003-04-01 2010-06-09 微软公司 为视频序列生成视频缩略图的方法和计算机
CN1947340B (zh) * 2004-03-10 2010-09-08 大卫·阿舍·贾法 用于对个体的表现进行评级的系统和方法
CN101061534B (zh) * 2004-11-18 2011-04-06 佳能株式会社 音频信号编码装置及方法

Also Published As

Publication number Publication date
JPH0851366A (ja) 1996-02-20
KR960012475B1 (ko) 1996-09-20
JP2908270B2 (ja) 1999-06-21
EP0663740A3 (en) 1998-08-19
US5613035A (en) 1997-03-18
KR950024447A (ko) 1995-08-21
EP0663740A2 (en) 1995-07-19

Similar Documents

Publication Publication Date Title
CN1119376A (zh) 对来自多个信道的输入数字音频信号自适应编码的装置
US7110941B2 (en) System and method for embedded audio coding with implicit auditory masking
DE69834010T2 (de) Skalierbares stereo Tonkodierungs- und Tondekodierungsverfahren und Vorrichtung dafür
US5732391A (en) Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
EP0720316B1 (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
CN1095253C (zh) 宽带数字信息信号的编码和解码设备和方法
CN1151705C (zh) 多声道低比特率编码解码方法和设备
CN1249671C (zh) 量化噪声整形方法及装置
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
CN1116348A (zh) 自适应数字音频编码系统
EP0721257B1 (en) Bit allocation for multichannel audio coder based on perceptual entropy
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
EP0931386A1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
CN101160726A (zh) 对参数进行自适应分组以获得提高的编码效率
EP1933305A1 (en) Audio encoding device and audio encoding method
Yang et al. High-fidelity multichannel audio coding with Karhunen-Loeve transform
US5761636A (en) Bit allocation method for improved audio quality perception using psychoacoustic parameters
WO2001033555A1 (en) Method of encoding an audio signal using a quality value for bit allocation
CN1099097C (zh) 编码数字音频信号的方法
CN1108023C (zh) 自适应数字音频编码装置及其一种位分配方法
CN1110955C (zh) 自适应地编码来自多条通道的输入数字音频信号的装置
EP1055289B1 (en) A neural network based method for exponent coding in a transform coder for high quality audio
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JPH06268606A (ja) 音声符号化通信方式及びその装置
JPH08179794A (ja) サブバンド符号化方法及び装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned