信号编码或译码装置、信号 编码或译码方法、及记录载体
技术领域
本发明是关于经由所谓的高效编码对输入数字数据进行编码后,传送、记录再生译码后得到再生信号的数字数据等的信息编码或译码适用的信号编码或译码装置、信号编码或译码方法、以及记录编码后的信号的记录载体。技术背景
历来,音频或声音等信号的高效率编码有各种方法,例如,不以具有时间轴上的音频信号等的单位时间进行分组来分割成多个频段进行编码的非成组频段分割方式的频段分割编码(副波段编码:SBC),以及以具有时间轴信号的单位时间进行分组并对每一组变换为频率轴上的信号(频谱变换)后分割为多个频段,从而对各频段进行编码的分组频段分割方式的所谓变换编码等。此外,还可以考虑将上述频段分割编码与转换编码进行组合的高效编码的方法,这时例如,利用上述频段分割编码进行频段分割后,将各频段的信号进行频谱变换,变换为频率轴上的信号,再对经过该频谱变换的各频段进行编码。
其中,作为上述频段分割编码及上述组合的高效编码的方法等所用的频段分割用滤波器,例如有所谓的QMF等滤波器,该滤波器例如已于1976年在R.E.Crochiere的“Digital Coding of Speechin Subbands(副波段中的数字语音编码)Bell Syst.Tech.J.Vol.55,No.8,1976”中作了介绍。另外例如在“Joseph H.Rothweiler的“Polyphase Quadrature filters-A new Subband Codingtechnique(多相正交滤波器-一种新型副波段编码技术)ICASSP 83,BOSTON”中还介绍了等带宽滤波器分割法。
另外,作为上述频谱变换,例如有将输入音频信号按指定单位时间(帧)进行分组,通过对该每一组进行离散傅里叶变换(DFT)、余弦变换(DCT)、改进DCT变换(MDCT)等将时间轴变换成频率轴的频谱转换。对于上述MDCT,已在J.P.Princen,A.B.Bradley的“Subband/Transform Coding Using Filter Bank DesignsBased on Time Domain Aliasing Cancellation(采用基于时域假信号补偿的滤波器组设计的副频段/变换编码)Univ.ofSurrey Royal Melbourne Inst.of Tech.,ICASSP 1987”中进行了描述。
这样,通过将由滤波器和频谱变换分割成每一频段的信号进行量子化,就能控制发生量子化噪声的频段,利用屏蔽效果等性质就能进行在听觉上更高效率的编码。另外,这里在进行量子化之前,对各频段例如按其频段内的信号成分的最大绝对值进行规格化,便可进行更高效率的编码。
另外,作为对经过频段分割的各频率成分进行量子化的频率划分宽度,例如,进行考虑人类的听觉特性的频段划分,亦就是说,通常,有按照愈是称为临界频段的高频,带宽越宽的频带宽度将音频信号分割成多个频段(例如25频段)。将这时的每一频段的数据进行编码时,对每一频段,进行按指定的位分配或者适合于每一频段的位分配的编码。例如,利用上述位分配对经过上述MDCT处理后得到的系数数据进行编码时,对于利用上述各组的MDCT处理而得到的每一频段的MDCT系数数据,就按相应的分配位数进行编码。
这里,作为上述位分配方法,已知有下面二种方法,亦即,例如在“Speech and Signal Processing,(语言及信号处理)IEEETransactions of Accoustics,Vol.ASSP-25,No.4,August1977”一文中,根据各频段的信号的大小进行位分配。采用这种方式,虽然量子化噪声频谱变得平坦,噪声能量减至最小,但由于在听觉上没有利用屏蔽效果,所以,实际的噪音感觉并不理想。另外,例如在M.A.Kransner的“The critical band Coder-digital encodingof the Perceptual requirements of the auditory System(临界频段编码器-音频系统感觉规格的数字编码),ICASSP 1980MIT”中,介绍了通过利用听觉屏蔽,对每一频段取得必需的信噪比后进行固定的位分配的方法。然而,在这种方法中,即使用正弦波输入测量特性时,由于位分配是固定的,所以,其特性值也不可能很好。
为解决这些问题,在“EUROPEAN PATENT APPLICATION,Publication number 0525809A2,Date of publication ofapplication 03.02.93 Bulletin 93/05”中提出了一种将可能用于位分配的全部位分割为对各小分组预先确定的固定位分配格式部分和进行与各分组的信号大小有关的位分配的部分使用,并使这一分割比取决于与输入信号相关的信号从而使上述信号的频谱越平坦,向上述固定位分配格式部分的分配比例越增大的高效编码装置。
如果用这一方法,和正弦波输入那样,能量集中于特定的频谱时,通过将较多的位分配给包含该频谱的分组中,便可显著改善整体的信噪比特性。通常,由于人的听觉对具有陡峭频谱成分的信号极为敏感,所以,借助这样的方法来改善信噪比,不仅可以改善信噪比特性提高测量上的数值,而且在听觉上改善音质也是有效的。
对于位分配方法人们还提出了其他许多方法,并且,只要与听觉有关的模型越精细越能提高编码装置的功能,从听觉方面看来,就能进行更高效的编码。
下面,利用图18以后的各图说明先有的信号编码装置。在图18中,通过端子100输入的声音信号波形由变换电路101变换成信号频率成分后,由信号成分编码电路102对各成分进行编码,然后再由代码生成电路103生成代码串,从端子104输出。
图19是图18的变换电路101的具体结构。在图19中,通过端子200输入的信号(通过图18的端子100的信号)由二级频段分割滤波器201、202分割为三个频段。在频段分割滤波器201中,通过端子200输入的信号间抽为
在频段分割滤波器202中,由上述频段分割滤波器201间抽为
后的一边的信号再次间抽
(端子200的信号被间抽为1/4)。亦就是说,由频段分割滤波器202输出的二个信号的频段宽度成为从端子200输出的信号的频段宽度的1/4。
由这些频段分割滤波器201、202按上述方式分割成三个频段的各频段的信号,分别由进行MDCT等频谱变换的顺频谱变换电路203、204、205变换为频谱信号成分。这些顺频谱变换电路203、204、205的输出传送至上述图18的信号成分编码电路102。
图20是图18的信号成分编码电路102的具体结构。
在图20中,输给端子300的上述变换电路101的输出,由规格化电路301对每一指定的频段进行规格化之后,输给量子化电路303。另外输给上述端子300的信号还输给量子化精度确定电路302。
在上述量子化电路303中,根据量子化精度确定电路302由通过上述端子300的信号所计算的量子化精度,对上述规格化电路输出的信号进行量子化处理。该量子化电路303的输出从端子304输出后,传送至图18的代码串生成电路103。在端子304输出的信号中,除了由上述量子化电路303进行量子化处理后的信号成分外,还包含上述规格化电路301的规格化系数信息和上述量子化精度确定电路302的量子化精度信息。
图21是根据由图18所示结构的编码装置生成的代码串对声音信号进行译码并输出的译码装置的结构概略图。
在图21中,从通过端子400提供的由图18的结构生成的代码串中,由代码串分解电路401抽出各信号成分的代码。由信号成分译码电路402根据这些代码将各信号成分还原,然后再由反变换电路403进行与图18的变换电路101的变换对应的反变换。这样,便可得到声波信号,并从端子404输出该声波信号。
图22是图21的反变换电路403的具体结构。
图22的结构与图19所示的变换电路的结构示例相对应,通过端子501、502、503从信号成分译码电路402提供的信号,分别由进行与图19的顺频谱变换对应的反频谱变化的反频谱变换电路504、505、506进行变换。由这些反频谱变换电路504、505、506所得到的各频段的信号,由二级频段合成滤波器进行合成。
亦就是说,反频谱变换电路505和506的输出传送给频段合成滤波器507进行合成,此频段合成滤波器507的输出与上述反频谱变换电路504的输出在频段合成滤波器508中进行合成。该频段合成滤波器508的输出从端子509(图21的端子404)输出。
图23是用于说明在图18所示的编码装置中以往进行的编码方法的图。在图23的示例中,频谱信号是由图19的变换电路所得到的,图23是将MDCT的频谱信号的绝对值的电平变换成dB值表示的情况。
在图23中,输入信号按每一指定时间区变换为64个频谱信号,它们按图23中的b1至b5所示的五个指定的频段为一组(这里将其称之为编码单元)进行规格化和量子化。这里,各编码单元的频段宽度在低频端较窄,而在高频端较宽,从而可以控制发生与听觉性质符合的量子化噪声。
但是,在上述以往使用的方法中,对频率成分进行量子化的频段是固定的。因此,例如,在频谱集中于数个特定的频率附近时。若要对这些频谱成分以足够的精度进行量子化,就必须对这些频谱成分和属于相同频段的多个频谱分配许多位。
亦即,由上述图23也可以看出若对每一指定的频段进行规格化,例如,在信号中包含声调成分的图中b3的频段中,规格化系数值是根据由声调性成分所决定的很大的规格化系数值进行规格化的。
此时,通常在频谱能量集中于特定频率上的声调声音信号中所含有的噪音,与加在能量连续均匀地分布在很宽的频段中的声信号上的噪音相对较,更易于到达人身中,从而成为听觉上很大的障碍。而且,如果对具有很大能量的频谱成分即音调成分不进行足够精确的量子化,将这些频谱成分恢复为时间轴上的波形信号、与前后的时区相合成时,各时区间的失真就会很大(在与相邻时区的波形信号相合成时产生很大的连接失真),仍然会成为很大的听觉上的干扰。因此,为了音调成分的编码,必须以足够的位数进行量子化,但是,如上述那样对各指定频段确定量子化精度时,对包含音调性成分的编码单元内的多个频谱必须分配较多的位进行量子化,这样,编码效率将降低。因此,以往,特别是对于音调的声信号,要不使音质变坏,便难于提高编码效率。
为此,本发明的目的就在于提供:特别是针对音调信号不使其音质变坏同时又能提高编码效率的信号编码装置或信号编码方法;以及记录由这些信号编码装置等处理过的信号的记录媒体和将由该记录媒体再生的或从信号编码装置传送来的编码信号进行译码的信号译码装置或信号译码方法。发明的公开
本发明的输入信号的信号编码方法的特征是:将输入信号变换成频率成分,将上述频率成分分离为由音调成分所组成的第一信号和由其它成分组成的第二信号,对上述第一信号进行编码,对与上述第二信号对应的信号进行编码。
为此,在本发明的信号编码方法中,上述变换为频谱变换,对上述音调成分的频率轴上的位置信息进行编码,或者,对上述音调性成分的指定范围内的数量信息进行编码。另外,与上述第二信号对应的信号是使包含频率成分的上述第一信号的音调成分的主要部分的编码单元的信号为0的信号,或者,使上述频率成分的上述第一信号及其邻近的频率成分为0的信号。上述分离步骤包括将上述音调成分进行编码以及对上述经过编码的音调成分进行译码并从上述输入信号的频率成分中将上述经过译码的音调成分减去而生成差分信号的步骤,上述第二信号就是上述差分信号。上述第一信号的编码步骤和与上述第二信号对应的信号的编码步骤中,至少与上述第二信号对应的信号的编码步骤包括将输入的信号规格化为各编码单元并对经过规格化的信号进行量子化的步骤。上述第一信号的编码步骤和与上述第二信号对应的信号的编码步骤中,至少与上述第二信号对应的信号的编码步骤包括对输入的信号进行可变长编码的步骤。上述分离步骤是只从上述频率成分的高频区分离上述第一信号。上述变换步骤进行使低频侧的频率分辨率高于高频侧的频率分辨率的变换。上述输入信号为声音信号。上述位置信息包括表示当前时区的位置信息与其他时区位置信息之差的信息。对于上述第一信号的各频率成分,上述使成为0的频率成分的数量,高频侧较之低频侧要多。对于上述第一信号中的一个频率成分,上述使成为0的频率成分的数量,以上述第一信号内的一个频率成分为中心,在高频侧与低频侧是不对称的。上述分离步骤至少包括一次对上述差分信号的音调成分进行编码以及将上述经过编码的音调成分进行译码和从上述差分信号中将上述经过译码的音调成分减去而生成新的差分信号、并将上述新的差分信号作为上述差分信号的步骤。上述第二信号就是上述新的差分信号。
本发明的对输入信号进行编码的编码装置的特征是:具有将输入信号变换成频率成分的变换装置、将上述频率成分分离为由音调成分构成的第一信号以及由其他成分构成的第二信号的分离装置、对上述第一信号进行编码的第一编码装置和对与上述第二信号对应的信号进行编码的第二编码装置。
这里,在本发明的信号译码装置中,上述变换为频谱变换,具有对上述音调成分的频率轴上的位置信息进行编码的位置信息编码器,或者,对上述音调成分的指定范围内的数量信息进行编码的编码器。上述与第二信号对应的信号是使包含频率成分的上述第一信号的音调成分的主要部分的编码单元的信号为0的信号,或者,使上述频率成分的上述第一信号及其邻近的频率成分为0的信号。上述分离装置包括对上述音调成分进行编码的编码器设备、将上述经过编码的音调成分进行译码的译码器和从上述输入信号的频率成分中将上述经过译码的音调成分减去而生成差分信号的装置。上述第二信号即为上述差分信号。上述第一编码装置和上述第二编码装置中,至少上述第二编码装置包括将输入的信号按各个编码单元进行规格化的规格化装置和将经过规格化的信号进行量子化的量子化装置。上述第一编码装置和上述第二编码装置中,至少上述第二编码装置包括对输入的信号进行可变长编码的可变长编码器。上述分离装置只从上述频率成分的高频区内分离出上述第一信号。上述变换装置进行使低频侧的频率分辨率高于高频侧的频率分辨率的变换。上述输入信号为声音信号。上述位置信息包含表示当前时区的位置信息与其他时区的位置信息之差的信息,对于上述第一信号的各频率成分,上述使成为0的频率成分的数量高频侧多于低频侧。对于上述第一信号内的一个频率成分,上述使成为0的频率成分的数量,以上述第一信号中的一个频率成分为中心高频侧与低频侧是不对称的。上述分离装置包括对上述差分信号的音调性成分进行编码的编码器、将上述经过编码的音调成分进行译码的译码器和从上述差分信号中将上述经过译码的音调成分减去而生成新的差分信号并将上述新的差分信号作为上述差分信号而输出的装置。上述第二信号即为上述新的差分信号。
本发明的记录经过编码的信号的信号记录载体是用来记录将输入信号变换成频率成分以及将上述频率成分分离为由音调成分构成的第一信号和由其他成分构成的第二信号并对上述第一信号进行编码和对与上述第二信号对应的信号进行编码的上述第一和第二信号。
这里,在本发明的信号记录载体中,上述变换为频谱变换,将上述音调性成分的频率轴上的位置信息进行编码,记录经过编码的位置信息。另外,将上述音调成分的指定范围内的数量信息进行编码,记录经过编码的数量信息。上述与第二信号对应的信号是使包含频率成分的上述第一信号的音调成分的主要部分的编码单元的信号为0的信号。上述与第二信号对应的信号是使上述频率信号成分的上述第一信号及其邻近频率成分为0的信号。上述分离步骤包括对上述音调成分进行编码以及将上述经过编码的音调成分进行译码并从上述输入信号的频率成分中将上述经过译码的音调成分减去而生成差分信号的步骤。上述第二信号即为上述差分信号。上述第一信号的编码步骤及与上述第二信号对应的信号的编码步骤中,至少与上述第二信号对应的信号的编码步骤包括将输入的信号按各个编码单元进行规格化并对经过规格化的信号进行量子化的步骤。上述第一信号的编码步骤和与上述第二信号对应的信号的编码步骤中,至少与上述第二信号对应的信号的编码步骤,包括对输入信号进行可变长编码的步骤。上述分离步骤只从上述频率成分的高频区分离上述第一信号。上述变换步骤进行使低频侧的频率分辨率高于高频侧的频率分辨率的变换。上述输入信号为声音信号。上述位置信息包含表示当前时区的位置信息与其他时区的位置信息之差的信息。对于上述第一信号各频率成分的上述使成为0的频率成分的数量,高频侧多于低频一侧。对于上述第一信号中一个频率成分的上述使成分0的频率成分的数量,以上述第一信号中的一个频率成分为中心,高频侧与低频侧之间是不对称的。上述分离步骤至少包含一次对上述差分信号的音调成分进行编码以及将上述经过编码的音调成分进行译码和从上述差分信号中将上述经过译码的音调成分减去而生成新的差分信号并将上述新的差分信号作为上述差分信号的步骤。上述第二信号即为上述新的差分信号,再有,本发明的用于记录经过编码的信号的信号记录载体,还记录分别与音调成分相关的音调成分信息和与噪声成分相关的噪声成分信息。
这里,在本发明的信号记录载体中,上述音调性成分信息包括上述音调成分的频率轴上的位置信息或者上述音调成分的指定范围内的数量信息。上述音调成分信息及上述噪声成分信息中,至少噪声成分信息包含规格化系数信息及量子化精度信息。
本发明的编码信号的信号译码方法的特征在于:将由音调成分所构成的第一信号进行译码生成第一译码信号,将由噪声成分构成的第二信号进行译码生成第二译码信号,将上述第一及第二译码信号合成后进行反变换的合成反变换,或者将上述第一及第二译码信号分别作反变换后进行合成的合成反变换。
这里,在本发明的信号译码方法中,上述合成反变换步骤是根据上述音调成分的频率轴上的位置信息进行合成或反变换的。另外,在本发明的信号译码方法中,还包括根据上述音调成分的指定范围内的数量信息将上述第一信号与上述第二信号分离的步骤。在上述生成第一译码信号的步骤与生成第二译码信号的步骤中,至少生成上述第二译码信号的步骤,根据规格化信息及量子化精度信息对输入的信号进行反量子化和解除规格化,上述经过编码的信号为声音信号。
本发明的编码信号的信号译码装置具有:对由音调性成分组成的第一信号进行译码生成第一译码信号的第一译码装置、对由噪声性成分组成的第二信号进行译码生成第二译码信号的第二译码装置和进行将上述第一及第二译码信号合成后进行反变换的合成反变换或者对上述第一及第二译码信号分别进行反变换后进行合成的合成反变换的合成反变换装置。
这里,在本发明的信号译码装置中,上述合成反变换装置是根据上述音调成分的频率轴上的位置信息进行合成或反变换的。具有根据上述音调成分的指定范围内的数量信息将上述第一信号与上述第二信号分离的分离装置。上述第一译码装置及上述第二译码装置具有根据规格化信息及量子化精度信息对输入的信号进行反量子化及解除规格化的装置。上述经过编码的信号为声音信号。
因此,按照本发明,通过将输入的例如声音信号分离为能量集中于特定频率的信号成分和能量均匀分布于很宽频段的信号成分进行编码,就能实现高效率编码。附图的概述
图1是表示本发明实施例的编码装置的概要结构的电路框图;
图2是表示本发明实施例的译码装置的概要结构的电路框图;
图3是合成反变换单元的电路框图;
图4是表示本发明实施例的信号成分分离电路中的处理过程的流程图;
图5是用于说明本实施例的信号编码中的音调性成分的图;
图6是用于说明本实施例的信号编码中的噪声性成分的图;
图7是用于说明本实施例的信号编码中被分离的音调性成分的图;
图8是用于说明本实施例的信号编码的其他例子的图;
图9是表示用于说明本实施例的信号编码方法的信号编码装置的概要结构的电路框图;
图10是用于说明本实施例的信号编码中从原来的频谱信号中减去将音调性成分进行编码并再译码而得到的信号后进行编码的方法的图;
图11是本实施例的信号编码中从原来的频谱信号中减去将音调性成分进行编码并再译码而得到的信号的状态图;
图12是用于说明本实施例的信号编码中只从高频区域抽出音调性成分的频段时的图;
图13是用于说明利用本实施例的信号编码进行编码而得到的代码串的记录的图;
图14本实施例的信号编码中某一时区中的频谱信号的状态图;
图15是本实施例的信号编码中与某一时区相邻的时区中的频谱信号的状态图;
图16是用于说明将本实施例的时区的频谱信号中音调性成分信息的中心位置信息以2位进行编码的例子;
图17是用于说明将本实施例的中心位置信息记录到记录载体上时的记录状态;
图18是先有的编码装置的概要结构的电路框图;
图19是本实施例和先有的编码装置的变换电路的具体结构的电路框图;
图20是本实施例和先有的编码装置的信号成分编码电路的具体结构的电路框图;
图21是先有的译码装置的概要结构的电路框图;
图22是本实施例和先有的译码装置的反变换电路的具体结构的电路框图;
图23是用于说明利用先有技术的编码方法的图。发明的最佳实施例
下面,参照附图说明本发明的最佳的实施例。
图1是应用本发明的信号编码方法的本发明实施例的信号编码装置的概要结构。
在图1中,声波信号输给端子600。此声波信号由变换电路601变换成信号频率成分后,输给信号成分分离电路602。
在该信号成分分离电路602中,由变换电路601得到的信号频率成分分离为具有陡峭的频谱分布的音调成分和具有除此以外的信号频率成分即平坦的频谱分布的噪声成分。在这些分离过的频率成分中,具有上述陡峭的频谱分布的音调成分由音调成分编码化电路603进行编码、作为除此以外的信号频率成分的上述噪声成分由噪声成分编码化电路604进行编码。这些音调成分编码化电路603及噪声成分编码化电路604的输出信号由代码串生成电路605生成代码串后进行输出。ECC编码器606给代码串生成电路608输出的代码串附加上纠错码。ECC编码器606的输出由EFM电路607进行调制后输给记录头608。记录头608将从EFM电路607输出的代码串记录到盘609上。盘609例如可以是光磁盘或变相化盘。另外,还可以用IC(集成电路)卡等等代替盘609。
变换电路601可以使用与前述的图17同样的结构,当然,作为图1的变换电路601的具体结构,除上述图17的结构以外,还可以考虑多种形式例如,可以利用MDCT直接将输入信号变换为频谱信号,频谱变换还可以不用MDCT而使用DFT或DCT等。
另外,如前所述,虽然可以利用频段分割滤波器将信号分割成频段成分,但由于本发明的方法对于能量集中于特定的频率的情况特别有效,所以,若多个频率成分采用利用以比较少的演算量得到的上述频谱变换变换为频率成分的方法则更好。
音调成分编码电路603和噪声成分编码电路604基本上也可以利用与前述图18相同的结构来实现。
另一方面,图2是应用对利用图1的编码装置编码后的信号进行译码的本发明的信号译码方法实施例的信号译码装置的概要结构。
在图2中,经再生头708从盘609再生的代码串输送给EFM解调电路709。EFM解调电路709对输入的代码串进行解调。经过解调的代码串传送给ECC编码器710进行误码校正。代码串分解电路701根据经过误码校正后的代码串中的音调成分信息数,识别代码串的哪一部分是音调成分代码,并将输入的代码串分离为音调成分代码和噪声成分代码。另外,代码串分离电路701还从输入的代码串中分离出音调成分的位置信息,并输出给下级的合成电路704。上述音调性成分代码传送给音调性成分译码电路702,上述噪声成分代码传送给噪声成分译码电路703,分别进行反量子化及解除规格化处理后进行译码。然后,从音调成分译码电路702和噪声成分译码电路703输出的译码信号传送给进行与在上述图1的信号成分分离电路602中进行的分离相对应的合成的合成电路704。合成电路704根据从代码串分离电路701输入的音调成分的位置信息,通过将音调成分的译码信号与噪声成分译码信号的指定位置进行加法运算,进行噪声成分与音调成分在频率轴上的合成。合成后的译码信号由进行与在上述图1的变换电路601中进行的变换相对应的反变换的反变换电路708进行反变换处理后,从频率轴上的信号恢复成原来的时间轴上的波形信号。该反变换电路705的输出波形信号,从端子707输出。
而且,反变换与合成的处理顺序也可以反过来,此时,图2中的合成反变换电路711就成为图3所示的结构。在图3中,反变换电路712将从噪声成分译码电路703输出的频率轴上的噪声成分译码信号反变换为时间轴上的噪声成分信号。反变换电路713,将从音调成分译码电路702输出的音调成分的译码信号分配到从代码串分离电路701输入的音调成分的位置信息表示的频率轴上的位置,将其进行反变换后生成时间轴上的音调成分信号。合成电路714将反变换电路714输出的时间轴上的噪声成分信号与反变换电路713输出的时间轴上的音调成分信号进行合成,生成原来的波形信号。
上述反变换电路705、712、713可以使用与前述图22相同的结构。
这里,图4是在图1的编码装置的信号成分分离电路602中用于分离音调性成分的具体处理的流程。
在图4中,I表示频谱信号的序号,N表示频谱信号的总数,P、R为指定的系数。上述音调成分,在当某一频谱信号的绝对值从局部看来大于其他频谱成分,而且,与该时区(频谱变换时的时区)中频谱信号的绝对值最大值相比较,超过指定的大小进而与此频谱相邻的频谱(例如相邻两侧的频谱)的能量之和相对于包含该频谱在内的指定频段内的能量超过一定的比例时,即认为该频谱信号和例如其相邻两侧的频谱信号为音调性成分。此时,作为将能量分布的比例进行比较的指定的频段,考虑听觉的性质后,例如可以与临界频段宽度符合的在低频区取得较窄在高频区取得较宽。
亦即,在图4中,首先,在步骤S1将最大频谱绝对值代入变数A0,在步骤S2使频谱信号的序号I为1。在步骤S3将某时区内的某一频谱绝对值代入变数A。
在步骤S4,判断上述频谱绝对值从局部看来是否为比其他频谱成分大的极大绝对值频谱,不是极大绝对值频谱时(No),就进入步骤S10,是极大绝对值频谱时(Yes),便进入步骤S5。
在步骤S5,将包含该极大绝对值频谱在内的该时区中的该极大绝对值频谱的变数A与最大频谱绝对值的变数A0之比,与表示指定大小的系数P进行大小比较(A/A0>P?),A/A0大于P时(Yes),就进入步骤S6,A/A0小于P时(NO)便进入步骤S10。
在步骤S6,将上述频谱绝对值的频谱(极大绝对值频谱)的邻近频谱的能量值(例如相邻两侧频谱的能量和)代入变数X,然后在步骤S7将包含该极大绝对值频谱及其邻近频谱在内的指定频段内的能量值代入变数Y。
接着,在步骤S8,将上述能量值的变数X与指定频段内的能量值变数Y之比,与表示指定比例的系数R进行比较(X/Y>R?),X/Y大于R(Yes)时,就进入步骤S9,X/Y小于R(No)时,便进入步骤S10。
在步骤S9,在上述极大绝对值频谱及其邻近频谱的上述能量相对于包含这些频谱在内的指定频段的能量,大于指定的比例时,即认为该极大绝对值频谱信号与例如其相邻两侧的频谱信号为音调性成分,并进行记录。接着,在步骤S10,判断在上述步骤S9记录的频谱信号的序号I与频谱信号的总数N是否相等(I=N?),相等时(Yes)处理即告结束,不相等时(No)就进入步骤S11。在步骤S11,赋值I=I+1,逐个使频谱信号的序号加1,然后,返回到步骤S3,反复进行上述处理。
信号成分分离电路602将利用上述处理判定为音调性成分的频率成分输给音调性成分编码代电路603,将除此以外的频率成分作为噪声性成分输给噪声性成分编码化电路604。另外,信号成分分离电路602还将判定为音调性成分的频率信息的数量及其位置信息输给代码串生成电路605。
图5是按上述方式将音调成分从频率成分中分离出来的一个例子的情况。
在图5所示的示例中,图中抽出TCA、TCB、TCC、TCD所示的四个音调成分。这里,该音调成分,如图5的例子所示的那样,由于集中分布在少数频谱信号中,所以即使对这些成分进行高精度的量子化从总体上来说也不需要太多的位数。另外,虽然通过将音调成分暂时规格化后进行量子化可以提高编码的效率,但由于构成音调成分的频谱信号较少,所以也可以省略掉规格化和再量子化处理而使装置简化。
图6表示从原来的频谱信号中除去音调成分后的噪声成分的例子。
如图6所示,在各频段b1~b5中,由于由从上述原来的频谱信号中如上所述除去了音调成分,各编码单元的规格化系数就成为很小的值,因此,以很少的位数产生的量子化噪声也可以减小。
这里,如利用听觉的性质,还可以更有效地改进上述噪声成分的编码。亦即,在频率轴上,在音调信号的附近,屏蔽效果很有效。因此,即使将抽出的附近的噪声成分(上述音调成分附近的噪声成分)作为0进行编码,其在以后译码后的声音信号与原来的声音在听觉上也感觉不到大的差别。
下面,利用图7说明利用这一性质的噪音成分编码电路604中的编码方法的具体例子。
在图7中,将存在上述音调成分(TCA、TCB、TCC、TCD)的主要部分的编码单元的噪音成分取作0。因此,在各频段的噪声成分中,实际进行编码的只是频段b5的编码单元。这一方法,在编码单元以临界频段宽度为其准时可以用极其简单的方法进行压缩。
下面,利用图8说明利用这一性质的编码方法的另一个具体的例子。
在图8中,不取编码单元的噪声成分为0,而取各音调成分(TCA、TCB、TCC、TCD)的邻近的指定数量的频谱成分为0。这一指定的数量根据听觉性质随其音调成分的频率而变化,可以在低频区取得少,在高频区取得多。在这一具体例子中,结果是频段b4的编码单元的噪声成分全部为0),频段b4噪声成分实际上不进行编码。利用这一具体例子的方法,还可以采取比较简单的措施有效地进行在听觉上取得良好效果的压缩。利用音调成分的屏蔽对高频区有较强的作用,所以使噪声成分为0的范围可以是不对称的。
在代码串产生电路605中,还可以将噪声性成分进行例如“D.A.Huffman:A Method for Construction of Minimum Redundancycodes,(最小冗余量代码的组成方法)Proc I.R.E.,40,P.1098,(1952)”所述的所谓的可变长编码法进行编码。采用这种编码方法,通过向频率高的模式分配短的代码长度可提高编码效率,使用这种编码时,如前所述,取噪声成分为0的方法有效。亦就是说,由于0的成分出现得多,所以,通过给0分配较短长度的代码,便可提高编码效率。
上面,对将音调成分分离并使音调成分及其附近的信号取为0后,将噪声成分进行译码的本实施例的方法,进行了说明,但也可以采用从原来的频谱信号中减去将音调成分编码后再进行译码的信号后的信号进行编码的方法。
下面,参照图9说明采用这种方法的信号编码装置。对于与图1相同的结构,标以相同的符号并省略其说明。
由变换电路601得到的频谱信号,通过由控制电路808控制的开关801输给音调成分提取电路802。音调成分提取电路802利用上述图4的处理判别音调成分并仅将判定的音调成分输给音调成分编码电路603。音调成分提取电路802还将音调成分信息的数量及其中心位量信息输给代码串生成电路605。音调成分编码电路603,对输入的音调成分进行规格化及量子化,并将经过规格化和量子化的音调成分传送给代码串生成电路605和本地译码器804。本地译码器804对经过规格化及量子化的音调成分进行反量子化处理和解除规格化,并对原来的音调成分的信号进行译码。但是,此时,在译码信号中含有量子化噪声。本地译码器804的输出作为第一次的译码信号输给加法器805。另外从变换电路601输出的原来的频谱信号也通过由开关控制电路808控制的开关806输给加法器805。加法器805从原来的频谱信号中减去第一次的译码信号后,输出第一次的差分信号。在完成一次对音调成分的提取、编码、译码、差分化处理时,此第一次差分信号作为噪声成分,通过由开关控制电路808控制的开关807输给噪声成分编码电路604。反复进行音调成分的提取、编码、译码、差分化处理时,第一次差分信号便通过开关801输给音调成好提取电路802,音调成分提取电路802、音调成分编码电路603、本地译码器804进行与上述相同的处理,并将得到的第二次译码信号输给加法器805。另外,第一次差分信号还通过开关806输给加法器805。加法器805从第一次差分信号中减去第二次译码信号后输出第二次差分信号。在完成二次音调成分的提取、编码、译码、差分处理时,此第二次的差分信号作为噪声成分,通过开关807输给噪声信号成分编码电路604。再次反复进行音调成分的提取、编码、译码、差分处理时,由音调成分提取电路802、音调成分编码电路603、本地译码器804、加法器805进行与上述同样的处理。开关控制电路808保持音调成分信息数量的阈值,从音调成分提取电路得到的音调成分信息数量超过该阈值时,则控制开关807结束音调成分的提取、编码和译码处理。另外,在音调成分编码电路603中,在提取不出音调成分时,也可以使音调成分的提取、编码、译码和差分化处理结束。
图10和图11是用这种方法进行编码时的例子,图11是从图10的频谱信号中减去时一个音调成分进行编码后再译码的信号的情况。
通过从图11的频谱信号中进一步提取出图中用虚线表示的成分作为音调成分进行编码化,可以提高频谱信号的编码精度,通过反复进行这一操作,便可进行高精度的编码。利用这种方法时,即使将用于使音调成分量子化的位数的上限设定得很低,也可以大大提高编码精度,因此可以减少用于记录量子化位数的位数。另外,这种多级提取音调成分的方法,不仅适合于从原来的频谱信号中减去与将音调成分编码后再译码的信号相同的信号的情况,而且也可以应用于使提取出的音调成分的频谱信号为0的情况,在本发明的说明中,“将音调成分分离后的信号”这一表述含这两者。
图12是提取音调成分的频段只在高频区的具体例子。
这里,通常进行频谱变换时为了在低频区获得足够的频率分辨率,必须极大地增大频谱变换的变换区间长度,这在小型装置中是很难实现的。另外,为了对音调成分进行编码,虽然必须对该音调成分的位置信息及规格化信息进行编码,但在低频区分离度差的音调成分很多时,只记录提取这些信息后的音调成分的数量,对提高编码效率是十分不利的。因此,在低频区频率分辨率不足时,也可以像图12所示的那样,仅在高频区分离音调成分进行编码。
还有,为了确保低频区足够的频率分辨率,还可以变更低频区和高频区的频率分辨率。例如,在应用于实施例图1的变换电路601中的前述图10的变换电路中,虽然频段分割滤波器202的二个频段输出信号的比率间抽为传送给频段分割滤波器201的顺频谱变换电路203的信号比率的一半,但是如果在顺频谱变换电路203、204、205中对同一数量的输入信号进行顺频谱变换,则从顺频谱变换电路204、205输出的频谱信号的频率分辨率就可以提高为顺频谱变换电路203输出的频谱信号的分辨率的二倍。
图13是按照本发明实施例的方法将图8的频谱信号进行编码时的代码串(记录到记录载体上的代码)的具体例子。
在图13中,开始,先将音调成分信息数tcn(在图8的例中为4)记录到记录载体上,然后再顺序记录与图8的音调成分TCA、TCB、TCC、TCD对应的音调成分信息tcA、tcB、tcC、tcD和与图8的各频段b1-b5对应的噪声成分信息nc1、nc2、nc3、nc4,nc5。
这里,上述音调成分信息中,表示该音调成分的中心频谱的位置的中心位置信息CP(例如在音调成分TCB时为15)、表示用于量子化的位数的量子化精度信息(例如在音调成分TCB时为6)和规格化系数信息与经过规格化及量子化的各信号成分信息(例如信息SC1、SC2、SC3)一起记录到记录载体上。例如,在按频率固定地确定量子化精度时,自然不必记录量子化精度信息。
另外,在上述实施例中,作为音调成分的位置信息,虽然使用了各音调成分的中心频谱的位置,但是,也可以记录各音调成分的最低频区的频谱的位置(例如,在音调成分TCB时为14)。
在上述噪声成分信息中,量子化精度信息和规格化系数信息,与经过规格化和量子化的各信号成分信息(例如信息SC1、SC2…SC8)一起记录到记录载体上。量子化精度信息为0时(图13的噪声成分信息nc4),表示在该编码单元中实际上不进行编码,此时,在按照频段固定地确定量子化精度时虽然不必记录量子化精度信息,但是,此时例如像频段b4那样实际上不能指定不进行编码的编码单元。这时,例如可以在各编码单元中附加1位表示是否实际上进行编码的标志信息。
如上所述,为了按照本发明实施例的方法将音调成分信息记录到记录载体上,必须以某种方法记录该音调成分的位置,但是,对此也可以用以下方法进行高效率记录。
图14和图15是相邻时区中的频谱信号,图15的频谱信号表示图14的下一时区的信号。
在图14和图15中,例如由MDCT所得到的频谱信号,虽然由于其时区内的相位及波形信号的若干起伏在各时区有所变化,但音调成分的位置与前面的时区基本上相同,与图14中TCA、TCB、TCC、TCD的音调成分对应地,在图15中分别表现为TCE、TCF、TCG、TCH音调成分。因此,可以在与前面时区的音调成分的中心位置信息的相对位置高效率记录音调成分的中心位置信息,其具体例子如图16、17所示。
在图16中,假定图14的时区中的音调成分信息是按tcA、tcB、tcC、tcD的顺序记录的。这里,例如在图15的时区的频谱信号内,作为图15中TCF的音调成分信息tcF的中心位置信息CP可以如图17所示的那样记录将与TCB的音调成分的中心位置差信息CP按照图16中所示的那样以2位进行编码的中心位置信息CP1。这样,很多音调成分的中心位置信息CP,通过求取与其他时区例如前一个时区的音调成分的对应关系便可用短的代码进行表示,从而可以高效率地进行编码。但是,虽然TCH的音调成分是TCD的音调成分变化后的成分,由于在图16的中心位置差信息中并不表示出这一点,所以暂时使TCD的音调成分信息无效,而使用中心位置信息CP2记录TCH的音调成分的信息。图17所示的代码是一个例子,例如,由于音调成分信息数tcn1根据前面的时区的信息可以知道,所以也可以将其省略掉。
上面对声音信号以应用本发明实施例的方法的例子为中心进行了说明,但是,本发明实施例的方法也可以应用于一般的信号波形的编码。但是对于声音信号的情况,音调成分信息在听觉上具有特别重要的意义,可以非常有效地应用本发明实施例的方法。
由以上说明可知,如采用本发明的信号编码或译码装置和信号编码或译码方法,可以将输入信号中的音调成分与其它成分分离开进行高效率编码。特别是将本发明应用于声音信号的编码时,可以对听觉上重要的音调成分以很高的精度进行编码,并且使听觉上不太重要的噪声成分减小到最低限度,从而可以进行效率极高的信号压缩。因此,如将此压缩过的信号记录到记录载体上,便可有效地利用记录容量,并且将从该记录载体再生而得到信号进行译码后,可以获得良好的声音信号。