CN1092420C - 音频数据解码装置及音频数据编码解码系统 - Google Patents

音频数据解码装置及音频数据编码解码系统 Download PDF

Info

Publication number
CN1092420C
CN1092420C CN97114604A CN97114604A CN1092420C CN 1092420 C CN1092420 C CN 1092420C CN 97114604 A CN97114604 A CN 97114604A CN 97114604 A CN97114604 A CN 97114604A CN 1092420 C CN1092420 C CN 1092420C
Authority
CN
China
Prior art keywords
frequency
mentioned
circuit
audio data
correcting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN97114604A
Other languages
English (en)
Other versions
CN1170203A (zh
Inventor
福地弘行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Laboratories Licensing Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Publication of CN1170203A publication Critical patent/CN1170203A/zh
Application granted granted Critical
Publication of CN1092420C publication Critical patent/CN1092420C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明的音频数据解码装置包括:用于将经时间/频率变换处理变换成频域信号后再进行编码的音频数据进行解码的频率/时间变换电路;以及用于对进行频率/时间变换之前的频域信号中的一定的频率成分进行加重校正的校正装置,由于在频域内进行校正,故处理将容易进行。本发明的音频数据编码解码系统具有编码装置和解码装置,上述的编码装置包括对于一定的频率成分的信号分配给较多的位数的位分配装置;而上述的解码装置则包括对一定频率成分进行加重校正的校正装置。

Description

音频数据解码装置及音频数据编码解码系统
技术领域
本发明涉及一种用于使以压缩状态传送或者记录在记录媒体上的音频数据在其再生时进行扩展的音频数据解码装置,以及一种在将音频数据压缩后传送或者记录在记录媒体上、同时在将经压缩的数据再生时使其扩展的音频数据编码解码系统。
背景技术
目前已知的音频数据编码方式有许多种类,其中一例是使用将时域信号变换成频域信号的时间/频率变换使音频信号进行变换,在频域中进行编码。作为时间/频率变换的方式,可以举出(比方说)使用副边带滤波器或MDCT(经改进的离散余弦变换)的例子。
副边带滤波器编码方式或MDCT编码方式的概要内容在(举例来说)位于美国纽约的马赛尔·戴卡(Marcel Dekkar)出版社于1991年出版的由古井和桑迪(Furui & Sondhi)编辑的“语音信号处理的发展(Advancesin Speech Signal Processing)一书的第109页至140页上有所记载。作为副边带滤波器编码方式的例子,有被称为MPEG音频方式的国际标准规格ISO/IEC 11172-3。MDCT编码方式的例子有AC-3编码方式。
图11是表示一例现有的音频编码装置的示意图。
在图11中,输入至输入端子31的数字音频信号由时间/频率变换电路32每隔一定的时间(该时间以下称之为变换块长度)从时域信号变换成频域信号。另外,为了提高编码效率,将频带分割成多个频带区域。
经以上变换后的频域音频信号被加到量化电路33上。该量化电路33对于每个分割出的频带区域进行浮动处理和量化处理。这里的浮动处理是为了提高其后进行的量化处理的精度,使上述的分割出的频带区域内的各数据乘以一个共同的值,进行进位和退位,从而使数据的实际有效部分的值增大的一种处理。在不考虑量化精度的前提下,这种浮动处理可以不进行。
作为浮动处理的一个具体例子,可以先找出各频带区域中所含的各个数据的绝对值中的最大值,然后在该最大值不饱和(即不超过“1”)的范围内使用能使上述绝对值尽可能变大的浮动系数进行浮动处理。图12中示出了上面提到的ISO/IEC 11172-3中使用的浮动系数的一个例子。
图11中所示的编码装置使用图12中的浮动系数中的适当值进行浮动处理。举例来说,当某一频带区域内各数据的最大绝对值为0.75时,从图12的浮动系数中选择一个在其倒数乘以0.75后不超过“1”的前提下为最大的系数即0.79370052598410为浮动系数,用该浮动系数的倒数与该频带区域内的各数据相乘,进行浮动处理。
另外,编码装置内使用的浮动系数实际上通过其相应的指数值(上述例子中的情况下为“4”)来表示和传送。也就是说,指数值“4”被作为量化电路33的浮动处理中所选定的浮动系数送往多路复合电路34。解码时,使用图12中的相同的浮动系数来进行。
输入到输入端子31上的数字音频信号也供给自适应位分配电路35。在自适应位分配电路35中,对输入信号的特性进行计算,并且利用该信号特性来确定各个频带区域的位分配数。比方说,可以利用人的听觉特性来与根据分辨程度的难易相适应地改变量化精度,再来确定各频率成分的位分配数。
这里所述的人的听觉特性是指,由于在频率较低的区域内人的听觉不太敏感,故当音量较低时存在频率低的声音将变得难于听到的最小可听特性以及在频谱尖峰附近的频率的感觉听到的程度下降的屏蔽特性。
之所以利用这样的人的听觉特性来进行位分配,是为了将人的听觉对于各频率成分的易听到程度和不易听到程度模型化,对于不易听到的频率成分减少其位分配数,从而达到削减总信息量的目的。
在上述的自适应位分配电路35中确定的位分配数作为位长信息输出到量化电路33中。对于施行了浮动处理后的数据,量化电路33在各个频带区域内以相适应的位长进行量化处理。接下来,在量化电路33中经量化的音频数据、浮动系数以及位长信息在多路复合电路34中进行多路复合处理,然后作为编码后的数据从输出端子37输出。
图13是表示一例现有的音频数据解码装置的示意图,该图示出了用于将被上述的图11中所示的音频数据编码装置压缩过的音频数据加以扩展的装置构成。另外,图14为表示图13中的音频数据解码电路51的详细构成的示意图。
图13中,供给输入端子1的经编码的音频数据被输入至音频数据解码电路51。如图14所示,经编码的音频数据被输入到设在音频数据解码电路51的输入段中的多路分离电路11中。在多路分离电路11中,在多个频带区域的每一个内多路复合的各频带区域的音频数据与浮动系数和位长信息被分离开来。
此处分离出来的音频数据被供给逆量化电路12,对各个频带区域进行逆量化处理和逆浮动处理。逆量化处理根据从多路分离电路11中分离出来的各频率成分的位长信息来进行。此外,逆浮动处理通过对于各个频带区域中的经逆量化的数据乘上从多路分离电路11中分离出来的、图12中的指数值所表示的浮动系数来进行。
在逆量化电路12中经过逆量化处理和逆浮动处理的音频数据接下来在频率/时间变换电路14中被从频域信号变换成时域信号。然后,如上所述的那样已解码成为时域信号的数字音频信号从输出端子15输出,供给下面的D/A转换电路3。
在音频数据解码电路51中如上所述的那样再次形成的数字音频信号在D/A转换电路3中被转换成模拟信号,然后经音量调节电路4进行音量电平调节后通过输出校正电路52从输出端子5输出。这里的音量调节是指,音频解码装置的使用者利用图中未示出的音量调节钮将音量自由地调节成自己希望的音量。
如上所述,由于人的听觉音量较小时具有不易听到低频区域中的成分的特性,因此在以较小的音量来再生出音频信号时,低音的频率成分听起来完全被消除了一样,从而听觉上会产生音质恶化的现象。为了消除这一现象,在输出校正电路52可以进行根据设定的输出音量信息来使较低区域中的频率成分得到加重的校正处理。
这种输出校正电路52的一个例子是美国专利4,739,514号中所公开的电路。该美国专利中使用了通过对低频成分进行模拟处理来对时域信号进行动态校正的带通滤波器。但是,这样的电路必须设置多个运算放大器等模拟电路元件,存在着电路规模大而且电路复杂的问题。
另外,不光是低频成分,在人的听觉特性中也存在高频成分在进行小音量再生时声音同样也难于听到的特性。但上面提到的那个美国专利中只对低频成分进行了校正。结果,由于与高频成分有关的校正没有进行,因此虽然进行了低频成分方面的校正,但是存在着音质总体上听起来劣化的问题。
此外,音频信号在编码时虽然是利用了上述的人体听觉特性进行位分配的,但是再生时输出校正电路52却是与原来的信号成分无关地对低频成分进行加重的,因此再生信号具有与编码时计算出来的听觉模型不同的性质。由于这一缘故,低频区域内的量化杂音被加重,因而该量化杂音能被听到,故还有音质有时听起来反而劣化了的问题。
发明内容
本发明就是为了解决上述问题而作出的,其目的在于提供一种通过简单的电路构成实现听起来音质优异的输出校正的音频数据编码装置以及音频数据编码解码系统。
根据本发明的第1观点,提供了一种音频数据解码装置,该音频数据解码装置包括:用于将经时间/频率变换处理变换成频域信号后再进行编码的音频数据进行解码的频率/时间变换电路;以及
用于对由上述的频率/时间变换电路进行频率/时间变换之前的频域信号中的一定的频率成分进行加重校正的校正装置。
如果采用本发明的话,由于在进行频率/时间变换处理之前在频域内对一定的频率成分进行了加重校正,因此比起在时域内对一定的频率成分进行加重校正的先有技术来处理比较简单。
特别是,由于考虑了人耳在小音量时对低频和高频成分不易听出的特性,不仅对低频成分,而且对高频成分也进行了加重校正,因此,在音量设定得较小时,低频和高频成分的声音都能平衡地得到输出。
根据本发明的第2观点,提供了一种音频数据编码解码系统,该系统具有把音频信号通过时间/频率变换处理变换为频域信号后再使用量化处理进行编码的编码装置;和将经上述的编码装置编码后的音频数据进行解码的解码装置,其特征在于:上述的编码装置包括在为了进行上述的量化处理而对各个频率成分的信号进行位分配时,对于一定的频率成分的信号分配给比根据人的听觉特性计算出来的位分配数多的位数的位分配装置;上述的解码装置包括在进行频率/时间变换处理前的逆量化处理时对于上述频域信号中的上述的一定频率成分进行加重校正的校正装置。
在本发明中,由于在编码装置一侧对于根据人的听觉特性计算出来的位分配数在低频和高频信号区域预先分配了附加的位数,因此,通过在解码装置中进行加重校正,能够抑制因与原有的信号成分不同的成分被加重而产生的低频和高频成分量化杂音,从而能够提供音质。
附图简述
图1为表示本发明的一个实施例中的音频数据解码装置的构成实例的方框图。
图2为表示图1中所示的带校正功能的音频解码电路的一个构成实例的方框图。
图3为表示图2中所示的校正电路的构成实例的方框图。
图4为表示图3中所示的比较电路的构成实例的方框图。
图5为表示图1中所示的带校正功能的音频解码电路的另一个构成实例的方框图。
图6为表示图5中所示的带有校正的逆量化电路的构成实例的方框图。
图7为由加重校正处理产生的频率成分变化的一个例子的示意图。
图8为表示本发明的一个实施例中的音频数据编码装置的构成实例的方框图。
图9为表示图8中所示的自适应位分配电路的构成实例的方框图。
图10为表示图8中所示的位分配校正电路的构成实例的方框图。
图11为表示现有的音频数据编码装置的构成实例的方框图。
图12为表示浮动系数的实例的一个表。
图13为表示现有的音频数据解码装置的构成实例的方框图。
图14为表示图13中所示的音频解码装置的构成实例的方框图。
实施发明的具体方式
下面,根据附图来说明本发明的最佳实施例。
图1为表示本实施例中的音频数据解码装置的构成的方框图。另外,图2为表示图1中所示的带校正功能的音频数据解码电路2的一个详细构成例的方框图。
在图1中,加到输入端子1上的经编码的音频数据输入到带校正功能的音频数据解码电路2中。在带校正功能的音频数据解码电路2中,经编码的音频数据被进行解码处理。在进行解码处理时,还从后面的音量调节电路4接受表示设定的输出音量大小的输出音量信息,进行如下所述的校正。
由带校正功能的音频数据解码电路2再生出来的数字音频信号在D/A转换电路3中被转换成模拟信号,然后由音量调节电路4进行音量电平调节后通过输出端子5输出。这里的音量调节是指,音频解码装置的使用者利用图中未示出的音量调节钮将音量自由地调节成自己希望的音量。
下面,参照附图2详细说明带校正功能的音频数据解码电路及音频数据解码和校正方法。图2中,加到输入端子1上的经编码的音频数据被输入到多路分离电路11中。在多路分离电路11中,对于多个频带区域中的每一个,将各频带区域内的音频数据和位长信息分离开来。如果编码装置一侧进行过浮动处理,则把浮动系数也分离出来。
此处分离出来的音频数据被送到逆量化电路12中,针对每个频带区域进行逆量化处理和逆浮动处理。逆量化处理根据多路分离电路11中分离出来的各个频率成分中每一个的位长信息来进行。另外,逆浮动处理则通过在多个频带区域的每一个中的经逆量化处理的数据上乘上多路分离电路11中分离出来的、由表1中的指数值所表示的浮动系数来进行。
在上述的逆量化电路12中进行过逆量化处理以及(有必要时)逆浮动处理的音频信号被供给校正电路13,对频率高的成分和低的成分进行加重校正。这样经过校正后的音频信号接下来在频率/时间变换电路14中从频域信号变换成时域信号,这样再次形成的数字音频信号经输出端子15输出,供给至下面的D/A转换电路3。
上述的校正电路1 3中进行的校正处理是指,根据从输入端子16输入的输出音量信息对一定的频率成分进行加重校正。
图3为表示实现上述的加重校正的校正电路13的一个构成例的方框图。该实例示出了对由逆量化电路12进行逆量化处理和逆浮动处理后再解码后的音频信号进行校正时的情形。
在图3中,从输入端子21输入的经逆量化的音频信号被送入乘法电路22中,另外,从输入端子16输入的输出音量信息被输入到比较电路24中,指定输出音量和频率后对校正乘数表电路23进行输出。校正乘数表电路23中存贮了各种与输出音量和频率相对应的校正乘数。亦即,校正乘数表电路23中以表信息的形式存贮了当输出音量电平较小时对低频和高频成分进行加重校正用的校正乘数。在这种情况下,既可以对小于某一值的输出音量存贮一个固定的校正乘数(如0.2),也可以存贮使较小的输出音量电平增大的校正乘数。另外,输出音量电平信息可以从比方说调节音量用的音量钮的旋转角度位置或者与该角度相对应的电阻值来得到。
图4中示出了图3中所示的比较电路24的详细构成。
该比较电路24具有:接受送往校正电路13的输入信号即输出音量信息并将它与分别设定好的基准值进行比较的2个比较电路241及242;以及根据这二个比较电路241,242的比较结果为校正乘数表电路23产生地址数据的地址发生电路243。
这里,如果将对输出音量完全没有必要校正的大音量电平的基准值设为THR1,有必要进行较强的校正的音量电平的基准值设为THR2,则校正系数为:
    输出>THR1时,        1.0
    THR1≥输出>THR2时,2.0
    THR2≥输出时,        4.0此外,这些校正系数被存贮在校正乘数表电路2 3中,与这些校正系数相对应的地址数据在地址发生电路243中根据比较电路241和242的比较结果来形成并且输出。举例来说,比较电路241的基准值设定为THR1,音量电平大于此值时输出“1”,小于此值时输出“0”;同样,比较电路242的基准值设定为THR2,音量电平大于此值时输出“1”,小于此值时输出“0”;将这些输出的组合“00”、“01”、“11”对于校正乘数表电路23分别可以用作地址数据。
另外,当读出校正系数时,进一步增加比较对象和基准值例如读出不同于低频成分和高频成分的校正系数再加以输出也是可以的。
这样,比较电路24根据其输出从存贮在校正乘数表电路23中的各种校正系数中选出若干,将其读出,并供给乘法电路22。
乘法电路22将上述的经逆量化的音频信号与根据比较电路24的输出选择出的校正系数进行乘法运算,作为结果得到的经校正的音频信号从输出端子25进行输出。这里,校正系数为1.0时,即相当于上述的输出音量电平不太小以及位于低频和高频区域以外的区域内,因此来自校正电路13的经逆量化音频信号将直接被输出。
在本实例中虽然示出的是乘法电路22,但是采用结构更简单的移位电路也是可以的。另外,为了使校正乘数表电路23的构成规模减小,还可以通过在频域内将经逆量化的音频信号每隔一定的单位进行分块处理,并使存贮的校正乘数值在块内通用,这样也可以减少校正系数的数量。
这样,由于在本发明中是通过对频域信号中的低频和高频成分进行数字处理来进行加重校正的,因此,与现有技术相比,电路规模小而且简单。另外,在本发明中,由于不仅对低频成分的声音而且对高频成分的声音也进行了加重校正,所以低频成分和高频成分的声音都能很容易地听到,故在听觉上音质能得到提高。
图5为表示图1中所示的带校正功能的音频数据解码电路2的另一个详细构成例的方框图。
在图5中,输入到输入端子1上的经编码的音频数据在多路分离电路11中被分离,音频数据被供给带校正的逆量化电路17,位长信息和浮动信息作为控制逆量化的信息输入到逆量化电路17。逆量化电路17对各个频带区域进行逆量化处理和逆浮动处理。此外,在这个带校正的逆量化电路17中,对于频域中的音频信号中的低频和高频成分还进行加重校正。
经过这样的校正处理的音频信号接下来在频率/时间变换电路14中从频域信号变换成时域信号,象这样再次形成的数字音频信号经输出端子15供给到下面的D/A变换电路3上。
在上述的带校正的逆量化电路17中进行的校正处理方法中,(举例来说)比较代表的有:
(1)对进行逆浮动处理之前的经逆量化处理的音频信号乘上一个根据输出音量电平预先决定的系数的方法,和
(2)对浮动系数乘上一个预先决定的系数的方法。
其中,根据(2)中的方法对浮动系数旋行校正处理的话,还可以构成电路规模更小的校正电路。亦即,正如在现有技术方案中说明过的那样,在编码时,不仅将浮动系数而且把参照表的指数值也和音频数据一起进行多路复合。
因此,在使用如图12中所示的表的场合下,如果想要浮动系数为2.0时,通过在校正时使该多路复合的指数值只减小3,就能得到在浮动系数上乘上2.0同样的效果。在处理中可以不用乘法电路而只用加法电路来减小校正,能把电路的规模抑制得非常小。
图6为表示带有以对浮动系数进行校正处理的形式的校正的逆量化电路的构成实例的方框图。
来自多路分离电路11的输出音量信息被加到2个比较电路171和172上,与各自的基准值的比较结果被加到地址发生电路173上。它们的构成及工作情况与图4中所示的比较电路24相同,故省略对它们的说明。
地址发生电路173根据来自比较电路24的比较结果对指数值校正表174输出地址数据,指数值校正表174将与该地址数据对应的校正值输出到加法电路175中。加法电路175将这个校正值与来自多路分离电路11的浮动信息相加,相加得到的和作为指数供给至浮动系数表176。该浮动系数表176中以表的形式存贮了与各个指数相对应的浮动系数,与加法电路175输出的并经校正的指数相对应的浮动系数被输出至作为逆浮动处理电路的乘法电路177中。来自多路分离电路11的音频数据也输入至该乘法电路177中,。通过在该音频数据上乘上浮动系数的运算进行逆浮动处理,其输出加到逆量化电路178上。该逆量化电路178利用自多路分离电路11输出的位长信息对输入数据进行逆量化,并将经逆量化的音频数据进行输出。
图7A和7B中的频谱图示出了由上述的加重校正处理而形成的频率成分变化的一个例子。举例来说,具有图7A中所示的频率成分的经逆量化的音频信号输入到图2所示的校正电路13中。在校正电路13中,图7B中粗线表示的频率成分被进行了加重校正。作为一个例子来说,通过将1KHz以下和10KHz以上的频率成分加重4~10dB,就可以提高小音量再生时的音质。
另外,在以上的说明中,本实施例中的音频解码装置含有D/A转换电路3,该音频解码装置的输出为模拟信号,但这不是必须的,整个装置由数字电路来构成也是可以的。
下面说明基于本发明的其他观点的音频编码装置。
图8为表示本发明的音频编码装置的一个实施例的构成实例的方框图。输入到输入端子31的数字音频信号由时间/频率变换电路32每隔一定的时间被从时域信号变换成频域信号。这期间,为了提高编码效率,频带被分割成了多个频带区域。
经这样变换后的频域音频信号被供给至量化电路33。量化电路33对于各个分割出的频带区域中的每一个进行浮动处理和量化处理。这里的浮动处理使用从上面说明过的图12中的浮动系数中选出的适当值来进行。
另外,输入到输入端子31的数字音频信号还输入到自适应位分配电路35中。
图9中的方框图示出了35的一个例子。
从输入端子31输入的数字音频信号首先在高速富里叶变换器(FFT)35 1中进行傅立叶变换,然后在乘积求和电路352中进行乘积求和运算。然后,由减法电路354得出上述乘积求和电路352的输出与存贮着从听觉特性得到的校正值的听觉特性表353的输出之间的差值,减法电路354的输出加到乘积求和电路356上。在该乘积求和电路356中,对存贮着每个频带区域中可以使用的位数的存贮器355的输出进行乘积求和运算,其输出加到下面的位分配校正电路36中。
因此,在自适应位分配电路35中确定每个频带区域的位分配数时,利用了人的听觉特性,使与听清的难易程度相对应的量化精度作适应性变换。
利用了人的听觉特性进行位分配时,低频和高频成分的量化程度较粗。因此,当在解码装置一侧进行上述的加重校正时,有时量化噪声也被加重并能被听到,音质反而恶化了。
为解决这一问题,本发明的编码装置中将自适应位分配电路的输出加到位分配校正电路36上,给低频和高频成分分配另外的位(例如1位),从而预先将量化精度加以提高。
图10为表示上述的位分配校正电路36的一构成实例的示意图。
图10中,从自适应位分配电路35通过输入端子41输入的各频带区域中根据人的听觉特征确定的位分配数被送至加法电路42。存贮在校正位数表电路43中的各频带区域中的校正位数由读出电路44加以读出,并供给至加法电路42。在加法电路42中,对于每个频带区域将上述的根据人的听觉特性确定的位分配数与上述的校正位数相加,其相加结果经输出端子45输出至量化电路33和多路复合电路34。在量化电路33中,对施行过浮动处理的数据在各频带区域中用校正后的位长进行量化。
在本实施例中,无校正的必要时,校正位数可以设为0。另外,对于低频和高频区域可以设置不同的校正位数。
此外,在图6中,自适应位分配电路35和位分配校正电路36是分别设置的,但只设置一个从最初开始就能设定其中含有考虑了量化杂音的校正量的位分配数的位分配电路也可以。
综上所述,在本实施例中,在编码装置一侧对低频和高频成分的位分配数的高端进行了校正,在解码装置一侧进行上述的加强校正。因此,可以防止先有技术中存在的再生时低频和高频成分被与原来的信号成分的性质无关地加强的问题,并能抑制量化杂音。

Claims (15)

1.一种音频数据解码装置,包括:用于将经时间/频率变换处理变换成频域信号后再进行编码的音频数据进行解码的频率/时间变电路,其特征在于还包括:
用于对由上述的频率/时间变换电路进行频率/时间变换之前的频域信号中的一个或多个一定的频率成分进行加重校正的校正装置;
上述的校正装置是根据从解码后的音频数据中得到的音量信息对上述一个或多个一定的频率成分的强度进行加重校正的。
2.如权利要求1中所记载的音频数据解码装置,其特征在于:上述的一定频率成分是人的听觉特性中小音量时难于所到的低频和高频成分。
3.如权利要求1中所记载的音频数据解码装置,其特征在于还包括:音量调节装置,上述校正装置根据从上述的音量调节装置得到的输出音量信息来对上述的一定频率成分进行加重校正。
4.如权利要求3中所记载的音频数据解码装置,其特征在于还包括:将在上述的频率/时间变换电路中变换到时域中的数字音频信号转换成模拟信号的D/A转换器,
上述的音量调节装置用于对由上述D/A转换器得到的模拟信号的音量进行调节。
5.如权利要求3中所记载的音频数据解码装置,其特征在于上述的校正电路包括:
将上述输出音量信息与基准值进行比较的比较电路,
以上述比较电路的输出为地址,在该地址位置上存贮校正乘数的存贮电路,以及
将从上述存贮电路读出的校正乘数与音频信号相乘的运算电路。
6.一种音频数据解码装置,包括:将通过时间/频率变换处理变换成频域信号、并使用伴有浮动处理的量化处理进行编码的音频数据解码的频率/时间变换电路,其特征在于还包括:
在通过频率/时间变换电路进行频率/时间变换之前进行逆量化的逆量化电路,以及
设在上述的逆量化电路和频率/时间变换电路之间的、用来对音频信号的一个或多个一定的频率成分的强度进行加重校正的校正装置,该校正装置基于从音频数据中得到的音量信号对上述一个或多个一定的频率成分进行加重校正。
7.如权利要求6中所记载的音频数据解码装置,其特征在于:上述的校正装置在进行上述的频率/时间变换处理之前的逆量化处理之际,对一定频率成分的量化数据进行加重校正。
8.如权利要求7中所记载的音频数据解码装置,其特征在于:上述的校正装置在进行上述的频率/时间变换处理之前的逆量化处理之际,对一定频率成分的浮动系数进行加重校正。
9.如权利要求6中所记载的音频数据解码装置,其特征在于:上述的一定频率成分是人的听觉特性中小音量时难于听到的低频和高频成分。
10.如权利要求6中所记载的音频数据解码装置,其特征在于:上述的逆量化电路和上述的校正电路成一体化构成。
11.一种音频数据编码解码系统,该系统具有把音频信号通过时间/频率变换处理变换为频域信号后再使用量化处理进行编码的编码装置;和将经上述的编码装置编码后的音频数据进行解码的解码装置,其特征在于:
上述的编码装置包括,在为了进行上述的量化处理而对各个频率成分的信号进行位分配时,对于一定的频率成分的信号分配给比根据人的听觉特性计算出来的位分配数多的位数的位分配装置;
上述的解码装置包括,在进行频率/时间变换处理前的逆量化处理时,对于上述频域信号中的上述的一定频率成分的强度进行加重校正的校正装置,该校正装置基于从音频数据中得到的音量信号对上述一个或多个一定的频率成分进行加重校正。
12.如权利要求11中所记载的音频数据编码解码系统,其特征在于:上述的一定频率成分是人的听觉特性中小音量时难于听到的低频和高频成分。
13.如权利要求11中所记载的音频数据编码解码系统,其特征在于:
上述的解码装置还包括对输出音量进行调节的音量调节装置,
上述解码装置中的校正装置在上述音量调节装置中设定了小音量的输出音量信息时,对于进行频率/时间变换处理之前的频域信号中人的听觉特性中小音量时不易听到的低频和高频成分进行加重校正。
14.如权利要求12中所记载的音频数据编码解码系统,其特征在于:
上述编码装置中进行的量化处理是伴有浮动处理的量化处理,
上述解码装置中的校正装置在进行逆量化处理之际,对上述低频及高频成分的量化数据进行加重校正。
15.如权利要求14中所记载的音频数据编码解码系统,其特征在于:
上述编码装置中进行的量化处理是伴有浮动处理的量化处理,
上述解码装置中的校正装置在进行逆量化处理之际,对上述低频及高频成分的浮动系数进行加重校正。
CN97114604A 1996-07-09 1997-07-08 音频数据解码装置及音频数据编码解码系统 Expired - Lifetime CN1092420C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP198443/96 1996-07-09
JP19844396A JP3765622B2 (ja) 1996-07-09 1996-07-09 オーディオ符号化復号化システム

Publications (2)

Publication Number Publication Date
CN1170203A CN1170203A (zh) 1998-01-14
CN1092420C true CN1092420C (zh) 2002-10-09

Family

ID=16391182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97114604A Expired - Lifetime CN1092420C (zh) 1996-07-09 1997-07-08 音频数据解码装置及音频数据编码解码系统

Country Status (3)

Country Link
US (1) US6240388B1 (zh)
JP (1) JP3765622B2 (zh)
CN (1) CN1092420C (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123486A (ja) * 1998-10-21 2000-04-28 Pioneer Electronic Corp 記録装置
US8618085B2 (en) * 2000-04-28 2013-12-31 Koasn Biosciences Incorporated Therapeutic formulations of desoxyepothilones
MXPA03005133A (es) * 2001-11-14 2004-04-02 Matsushita Electric Ind Co Ltd Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos.
SG185134A1 (en) * 2003-05-28 2012-11-29 Dolby Lab Licensing Corp Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI397901B (zh) * 2004-12-21 2013-06-01 Dolby Lab Licensing Corp 控制音訊信號比響度特性之方法及其相關裝置與電腦程式
CN102276769B (zh) * 2005-04-18 2013-12-04 巴斯夫欧洲公司 一种呈由至少三种不同的单烯属不饱和单体构成的聚合物形式的共聚物
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
WO2007120452A1 (en) * 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
CA2648237C (en) 2006-04-27 2013-02-05 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
RU2413357C2 (ru) 2006-10-20 2011-02-27 Долби Лэборетериз Лайсенсинг Корпорейшн Обработка динамических свойств аудио с использованием перенастройки
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CN101790758B (zh) * 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
KR101433701B1 (ko) 2009-03-17 2014-08-28 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
WO2017183563A1 (ja) * 2016-04-19 2017-10-26 日本電気株式会社 デジタルフィルタ装置、デジタルフィルタ処理方法およびプログラム記録媒体
ES2853936T3 (es) * 2017-01-10 2021-09-20 Fraunhofer Ges Forschung Decodificador de audio, codificador de audio, método para proporcionar una señal de audio decodificada, método para proporcionar una señal de audio codificada, flujo de audio, proveedor de flujos de audio y programa informático que utiliza un identificador de flujo
KR102491646B1 (ko) * 2017-11-30 2023-01-26 삼성전자주식회사 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1119375A (en) * 1913-04-14 1914-12-01 Eugene H Taylor Paster for paper-box machines.
US4739514A (en) * 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US5170437A (en) * 1990-10-17 1992-12-08 Audio Teknology, Inc. Audio signal energy level detection method and apparatus
US5511128A (en) * 1994-01-21 1996-04-23 Lindemann; Eric Dynamic intensity beamforming system for noise reduction in a binaural hearing aid

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69629986T2 (de) * 1995-07-27 2004-07-15 Victor Company of Japan, Ltd., Yokohama Verfahren und Gerät zum Kodieren digitaler akustischer Signale
US5867503A (en) * 1996-01-30 1999-02-02 Mitsubishi Denki Kabushiki Kaisha Digital sound broadcasting receiver and automatic phase controlling method therefor
US5825826A (en) * 1996-09-30 1998-10-20 Motorola, Inc. Method and apparatus for frequency domain ripple compensation for a communications transmitter

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1119375A (en) * 1913-04-14 1914-12-01 Eugene H Taylor Paster for paper-box machines.
US4739514A (en) * 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US5170437A (en) * 1990-10-17 1992-12-08 Audio Teknology, Inc. Audio signal energy level detection method and apparatus
US5511128A (en) * 1994-01-21 1996-04-23 Lindemann; Eric Dynamic intensity beamforming system for noise reduction in a binaural hearing aid

Also Published As

Publication number Publication date
JPH1028057A (ja) 1998-01-27
US6240388B1 (en) 2001-05-29
JP3765622B2 (ja) 2006-04-12
CN1170203A (zh) 1998-01-14

Similar Documents

Publication Publication Date Title
CN1092420C (zh) 音频数据解码装置及音频数据编码解码系统
CN1146203C (zh) 用于音频编码的动态位分配装置和方法
CN1030129C (zh) 高效数字数据编码和译码装置
US7136418B2 (en) Scalable and perceptually ranked signal coding and decoding
CN1038089C (zh) 信号编码或译码装置及信号编码或译码方法
JP3782103B2 (ja) アダプティブディザを減算し、埋没チャンネルビットを挿入し、フィルタリングすることによりマルチビット符号ディジタル音声を符号化する方法及び装置、及びこの方法のための符号化及び復号化装置。
CN1150516C (zh) 语音编码方法和语音编码器
CN1271597C (zh) 对声源信号进行编码/解码的方法和装置
CN1154085C (zh) 可变规模语音编码/解码的方法和装置
CN1065381C (zh) 数字音频信号编码和/或译码方法
CN1135486C (zh) 数字音频信号处理设备和数字音频信号处理方法
CN1099777C (zh) 数字信号的编码装置、解码装置和编码方法
CN1132153C (zh) 改善增强语声的滤波器,用该滤波器的装置、系统和方法
CN1132317C (zh) 用于记录、再生、传输和/或接收压缩数据的方法
CN101968781B (zh) 在音频编码过程中根据mdct数据进行视窗类型判定的方法
CN1571993A (zh) 用于改善高频重建的方法
CN1669072A (zh) 低比特速率音频编码
US20090106030A1 (en) Method of signal encoding
CN1647154A (zh) 立体声信号编码
CN1781141A (zh) 使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法
CN1248824A (zh) 音频信号编码装置和方法以及解码装置和方法
CN101055720A (zh) 对音频信号编码和解码的方法和设备
CN1161750C (zh) 语音编码译码方法和装置、电话装置、音调变换方法和介质
CN1408146A (zh) 音频信号的参数编码
CN1051099A (zh) 信号能量参数优化的数字语声编码器

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: UNION ELEMENT CO., LTD.

Free format text: FORMER OWNER: NEW NIPPON STEEL CO., LTD.

Effective date: 20100115

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20100115

Address after: American California

Patentee after: Joint component Limited by Share Ltd.

Address before: Tokyo, Japan

Patentee before: NIPPON STEEL Corp.

ASS Succession or assignment of patent right

Owner name: DOLBY LAB LICENSING CORP.

Free format text: FORMER OWNER: JOINT ELECTRON DEVICE INC.

Effective date: 20101130

Owner name: DOLBY INTERNATIONAL CO., LTD.

Free format text: FORMER OWNER: DOLBY LAB LICENSING CORP.

Effective date: 20101130

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: CALIFORNIA, USA TO: AMSTERDAM, NETHERLANDS

TR01 Transfer of patent right

Effective date of registration: 20101130

Address after: Amsterdam, The Netherlands

Patentee after: DOLBY INTERNATIONAL AB

Address before: American California

Patentee before: DOLBY LABORATORIES LICENSING Corp.

Effective date of registration: 20101130

Address after: American California

Patentee after: DOLBY LABORATORIES LICENSING Corp.

Address before: American California

Patentee before: Joint component Limited by Share Ltd.

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 19980114

Assignee: GUANGZHOU HUADUO NETWORK TECHNOLOGY Co.,Ltd.

Assignor: Via licensing Co.

Contract record no.: 2014990000616

Denomination of invention: Audio data decoding apparatus and audio data coding/decoding system

Granted publication date: 20021009

License type: Common License

Record date: 20140804

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20021009