CN1756446A

CN1756446A - 音频信号处理装置及用于其的方法

Info

Publication number: CN1756446A
Application number: CNA200510105168XA
Authority: CN
Inventors: 山田裕司; 冲本越
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2004-09-28
Filing date: 2005-09-28
Publication date: 2006-04-05
Also published as: EP1640973A2; EP1640973A3; US7672466B2; JP2006100869A; US20060067541A1; KR20060051592A

Abstract

本发明提供了一种音频信号处理装置。该装置包括：分裂单元，用于将第一系统的音频信号和第二系统的另一音频信号分裂为多个频带分量；水平比较单元，用于计算第一系统的每个频带和第二系统的每个频带之间的水平比或水平差；和输出控制单元，用于从第一和第二系统中的至少一个移除下述频带分量，由所述水平比较单元计算出的所述频带分量的水平比或水平差等于或基本等于预定值。

Description

音频信号处理装置及用于其的方法

技术领域

本发明涉及音频信号处理装置，以及用于以这样的方式处理音频信号的方法，所述方式为：对应于预定声源的音频信号从第一和第二系统的时序音频信号被移除，其中所述时序音频信号由来自多个声源的音频信号组成。

背景技术

唱片和光盘将声音记录为左声道和右声道立体声音频信号。左声道和右声道音频信号常常从多个声源生成。通常，每个声道中的立体声音频信号的水平(level)彼此不同，所以，当使用两个扬声器来播放立体声音频信号时，声源的声像(sound source)被定位于这两个扬声器之间的位置。

例如，如果分别来自5个声源1到5的信号S1到S5被记录为左声道音频信号SL和右声道音频信号SR，则信号S1到S5可以以不同的水平被累积混合到音频信号SL和SR中，使得音频信号SL和SR表示为：

SL＝S1+0.9S2+0.7S3+0.4S4并且

SR＝S5+0.4S2+0.7S3+0.9S4。

如果上述一般的两声道立体声音频信号包括歌声和器乐，则通过从这些音频信号中移除歌声，移除了歌声后的器乐可以用于卡拉OK机。

图18的框图示出了这种歌声移除装置的结构。在立体声音乐中，歌声通常定位于左声道和右声道的其他声音的中间。因此，通过在图18示出的歌声移除装置中从右声道减去左声道音频信号，或者相反，从而可以从立体声输出移除歌声。

在图18中，上述原理只被应用于歌声的音频波段。左声道音频信号SL和右声道音频信号SR被发送到减法电路1和带阻滤波器2及3，以移除对应于歌声音频波段的频带分量(例如，300Hz到5kHz)。然后，右声道音频信号减去左声道音频信号或者左声道音频信号减去右声道音频信号的结果从减法电路1被输出到带通滤波器4，以分离对应于歌声音频波段的频带分量。

来自带阻滤波器2的输出信号和来自带通滤波器4的输出信号在加法电路5处被相加，以获得不包括对应于歌声的音频分量的左声道输出信号SOL。来自带阻滤波器3的输出信号和来自带通滤波器4的输出信号在加法电路6处被相加，以获得不包括对应于歌声的音频分量的右声道音频信号SOR。

对于更进一步的细节，可以参考日本未实审专利申请公开No.2000-354299。

发明内容

然而，当使用这种用于移除歌声的方法时，对应于歌声频带的所获得的音乐部分(其不包括歌声)将是单声道信号，这致使丢失了立体声效果。此外，使用该方法，难以完全移除歌声。

本发明解决了与已知方法和装置相关联的上述或其他问题，并且提供了用于处理音频信号的音频信号处理装置和方法，其能够充分移除预定声源的音频信号，例如上述歌声。

根据本发明的实施例的一种音频信号处理装置包括：分裂单元，配置为将第一系统的音频信号和第二系统的另一音频信号分裂为多个频带分量；水平比较单元，配置为计算第一系统的每个频带和第二系统的每个频带之间的水平比或水平差；和输出控制单元，配置为从第一和第二系统中的至少一个移除下述频带，由所述水平比较单元计算出的所述频带分量的水平比或水平差等于或基本等于预定值。

根据本发明的实施例应用了两个系统的音频信号是以预定水平比或水平差组合的这一事实。根据一个实施例，两个系统的音频信号被分片为多个频带。两个系统的音频信号的频带的水平比或水平差被计算出。然后，从这两个系统的音频信号中的至少一个移除下述频带的音频分量，所述频带的音频分量具有等于预定值或基本等于该预定值的水平比或水平差。

如果水平比或水平差的预定值是针对混合在两个系统的音频信号中的预定声源的音频信号的水平比或水平差，则组成该预定声源的音频信号的频谱分量被从至少两个系统的音频信号中的至少一个移除。换言之，预定声源的音频信号被移除。

根据本发明另一实施例的一种音频信号处理装置包括：第一转换单元，配置为将来自第一系统的时序音频信号转换为频域信号；第二转换单元，配置为将来自第二系统的时序音频信号转换为频域信号；水平计算单元，配置为计算来自第一转换单元的频谱分量与来自第二转换单元的频谱分量之间的水平比或水平差，所述来自第一转换单元的频谱分量与所述来自第二转换单元的频谱分量彼此对应；输出控制单元，配置为基于水平计算单元的计算结果来控制从第一转换单元和第二转换单元中的至少一个获得的频谱分量的水平，并且从第一和第二转换单元中的至少一个移除下述频谱分量，由水平比较单元计算出的所述频谱分量的水平比或水平差等于或基本等于预定值；和逆转换单元，配置为将来自输出控制单元的频域信号转换为时序信号。

根据另一实施例，两个系统的时序音频信号被第一和第二转换单元转换为频域信号，并且然后被转换为多个频谱分量。

根据另一实施例，来自第一和第二转换单元的对应频谱分量的水平比或水平差被计算出。基于所计算出的结果，对从第一和第二转换单元中的至少一个获得的频谱分量的水平进行控制，以移除具有等于或近似等于预定值的水平比或水平差的频谱分量。然后，在移除之后，频域信号被转换为时序信号。

根据另一实施例的音频信号处理装置还包括相位差计算单元，其配置为计算来自第一转换单元的频谱分量与来自第二转换单元的频谱分量之间的相位差，其中来自第一转换装置的频谱分量与来自第二转换装置的频谱分量彼此对应，并且其中输出控制单元基于水平计算单元的计算结果和由相位计算单元计算出的相位差来控制第一和第二转换单元中的至少一个获得的频谱分量的水平，并且从第一系统的频谱分量和第二系统的频谱分量中的至少一个移除下述频谱分量，所述频谱分量的相位差等于或基本等于预定值。

根据另一实施例，两个系统的时序音频信号被第一和第二转换单元转换为频域信号，然后再被转换为多个频谱分量。

根据另一实施例，来自第一和第二转换单元的对应频谱分量的相位差被计算出。基于所计算出的结果，对从第一和第二转换单元中的至少一个获得的频谱分量的水平进行控制，以移除具有等于或近似等于预定值的相位差的频谱分量。然后，在移除之后，频域信号被转换为时序信号。

如果相位差的预定值是针对混合在两个系统的音频信号中的预定声源的音频信号的相位差，则组成该预定声源的音频信号的频谱分量被从至少两个系统的音频信号中的至少一个移除。换言之，预定声源的音频信号被移除。

根据本发明实施例，下述音频信号被两个系统中的至少一个的音频信号完全移除，所述音频信号是与两个系统的音频信号混合的声源的音频信号，它们具有预定水平比、预定水平差或预定相位差。

附图说明

图1是根据本发明第一实施例的音频信号处理装置的框图；

图2是应用根据第一实施例的音频信号处理装置的卡拉OK机的框图；

图3A到图3D示出了为图1示出的频谱控制单元的移除系数生成单元设置的函数的示例；

图4是根据本发明第二实施例的音频信号处理装置的框图；

图5A到图5D示出了为图4示出的频谱控制单元的乘法系数生成单元设置的函数的示例；

图6是根据本发明第三实施例的音频信号处理装置的框图；

图7是根据本发明第四实施例的音频信号处理装置的框图；

图8是根据本发明第五实施例的音频信号处理装置的框图；

图9是根据本发明第六实施例的音频信号处理装置的框图；

图10是根据图9示出的第六实施例的音频信号处理装置的主要组件的框图；

图11A到图11E示出了为图10示出的乘法系数生成单元设置的函数的示例；

图12是根据本发明第七实施例的音频信号处理装置的框图；

图13是根据本发明第八实施例的音频信号处理装置的框图；

图14是根据本发明第九实施例的音频信号处理装置的框图；

图15示出了根据本发明第九实施例的音频信号处理装置；

图16是根据本发明第十实施例的音频信号处理装置的框图；

图17示出了根据本发明第十实施例的音频信号处理装置；

图18是示出了用于移除歌声的已知方法的框图。

具体实施方式

下面参考附图描述根据本发明实施例的音频信号处理装置和用于处理音频信号的方法。

下面将描述从包括左声道音频信号SL和右声道音频信号SR的立体声音频信号移除声源的方法。

例如，如果分别来自5个声源1到5的信号S1到S5被记录为左声道音频信号SL和右声道音频信号SR，则信号S1到S5可以以不同的水平被累加混合到音频信号SL和SR中，使得音频信号SL和SR表示为：

SL＝S1+0.9S2+0.7S3+0.4S4 (1)

SR＝S5+0.4S2+0.7S3+0.9S4 (2)

来自声源1到5的音频信号S1到S5被分配在左声道音频信号SL和右声道音频信号SR中，它们的水平差由公式1和公式2表示。因此，如果声源1到5可以再次基于由公式1和公式2所表示的分配比率而被分配在左声道音频信号SL和/或右声道音频信号SR中，则原始声源1到5可以从左声道音频信号SL和/或右声道音频信号SR分离或移除。

一般来说，每个声源包括不同的频谱分量。基于此，在下述实施例中，利用具有足够分辨率的快速傅立叶变换(FFT)处理将左声道和右声道的立体声音频信号转换为频域信号，从而分割为多个频谱分量。然后，确定左声道和右声道的音频信号的对应频谱分量之间的水平比或水平差，此后检测出要被分离的频谱分量，其中，要被分离的频谱分量具有与由声源的音频信号的公式1和公式2表示的分配比相对应的水平比或水平差。这样，所检测出的频谱分量可以被分离。因此，可以在受其他声源影响极小的情况下分离这些声源。

图2示出了包括根据本发明第一实施例的音频信号处理装置的卡拉OK机的结构。在此卡拉OK机中，首先，在根据第一实施例的音频信号处理装置中，与器乐谐调的歌声的音频信号从立体声音频信号被移除，其中该歌声以在两个声道中相同的水平被混合在左右声道中。随后，不包括歌声的器乐的音频信号从根据第一实施例的音频信号处理装置输出。器乐的音频信号被与用户的歌声音频信号相混合，然后从扬声器输出。

更具体地说，如图2所示，左声道音频信号SL和右声道音频信号SR被发送到根据第一实施例的音频信号处理装置10，如下所述，原始记录的歌声的音频信号被移除。不包括原始歌声的音频信号的左声道输出信号SOL和右声道输出信号SOR从音频信号处理装置10分别被发送到数/模(D/A)转换器11L和11R。在被转换为模拟音频信号后，输出信号SOL和SOR分别被发送到构成混合电路12的加法电路121和122。

用户的歌声是通过麦克风13拾取的。在麦克风13中拾取的音频信号通过放大器14被发送到加法电路121和122。用户歌声的音频信号被发送到加法电路121和122，并且与来自D/A转换器11L和11R的器乐的音频信号相混合。

来自加法电路121和122的混合后的输出音频信号分别经由放大器15L和15R而被提供给左声道扬声器16L和右声道扬声器16R，从而输出为声音。收听者17可以听到该输出声。

根据第一实施例的音频信号处理装置的结构

图1是根据第一实施例的音频信号处理装置的框图。两声道立体声信号的右声道音频信号SR被发送给作为转换单元的FFT单元101。如果该右声道音频信号SR是模拟信号，则其被转换为数字信号。然后，执行快速傅立叶变换(FFT)来将该时序音频信号转换为频域信号。如果该右声道音频信号SR是数字信号，则在FFT单元101处不必对该音频信号SR执行模/数转换。

两声道立体声信号的左声道音频信号SL被发送给作为转换单元的FFT单元102。如果该左声道音频信号SL是模拟信号，则其被转换为数字信号。然后，执行快速傅立叶变换(FFT)来将该时序音频信号转换为频域信号。如果音频信号SL是数字信号，则在FFT单元102处不必对该音频信号SL执行模/数转换。

根据本实施例的FFT单元101和102具有类似的结构，并且都能够将时序音频信号SR和SL分割为多个具有不同频率的频谱分量。在这里，要生成的频谱分量的数目取决于用于划分声源的FFT单元101和102的能力。例如，优选地生成500或更多个频谱分量，或者更优选地生成4,000或更多个频谱分量。频谱分量的数目等于FFT单元的点(tap)数。

分别来自FFT单元101和FFT单元102的频谱分量F1和F2被发送到频谱比较单元103和频谱控制单元104。

频谱比较单元103对同一频率的来自FFT单元101的频谱分量F1和来自FFT单元102的频谱分量F2的水平比进行计算。计算出的水平比被发送给频谱控制单元104。

频谱控制单元104接收到来自频谱比较单元103的关于水平比的信息，并且只从FFT单元101和102的输出移除预定水平比的频谱分量。频谱控制单元104将结果输出FexR和FexL分别发送到逆FFT单元105和106。

要由频谱控制单元104分离的声源的频谱分量的水平比是用户预先设置的。这样，频谱控制单元104只分离以由用户设置的水平比分配在左声道和右声道中的声源的音频信号的频谱分量。

逆FFT单元105和106将来自频谱控制单元104的结果输出FexR和FexL的频谱分量恢复为时序信号。所获得的时序信号被输出为输出信号SOR和SOL，这些输出信号不包括用户设置为要被移除的声源的音频信号。

根据第一实施例的频谱比较单元的结构

根据本实施例的频谱比较单元103在功能上包括下述组件，这些组件被包括在图1中用虚线包围的区域中。换言之，频谱比较单元103包括水平检测单元21和22、水平比计算单元23和24、以及选择器25。

水平检测单元21检测出来自FFT单元101的频谱分量F1的水平，并且输出检测结果D1。水平检测单元22检测出来自FFT单元102的频谱分量F2的水平，并且输出检测结果D2。根据该实施例，要检测出频谱分量的水平，就要检测出振幅谱。除了振幅谱外，还可以检测出功率谱。

水平比计算单元23计算水平比D1/D2。水平比计算单元24计算倒数水平比D2/D1。在水平比计算单元23和24中计算出的水平比被发送给选择器25。在选择器25中，水平比D1/D2或D2/D1被输出为水平比r。

选择控制信号SEL被发送到选择器25。该选择控制信号SEL控制选择器25，以根据用户设置的要被移除的声源的音频信号和这些音频信号的水平比来选择来自水平比计算单元23和24的输出之一。来自选择器25的水平比r输出被发送给频谱控制单元104。

在根据本实施例的频谱控制单元104处，要被移除的声源的音频信号的水平比一般是小于等于1的值(水平比≤1)。更具体地说，发送到频谱控制单元104的水平比r是通过用较高水平的频谱分量除较低水平的频谱分量确定的。

因此，要移除在右声道音频信号SR中分配的比在左声道音频信号SL中分配的多的声源的音频信号，则频谱控制单元104使用在水平比计算单元23中计算出的水平比。相反，要移除在左声道音频信号SL中分配的比在右声道音频信号SR中分配的多的声源的音频信号，则频谱控制单元104使用在水平比计算单元24中计算出的水平比.

如果左声道和右声道的音频信号的分配比值PL和PR(它们都是小于1的值)将由设置要移除的声源的音频信号的水平比的用户输入，则选择控制信号SEL控制选择器25，使得如果所设置的分配比值PL和PR具有关系PL/PR≤1则选择来自水平比计算单元23的输出(D2/D1)作为水平比r，反之，如果所设置的分配比值PL和PR具有关系PL/PR＞1则选择来自水平比计算单元24的输出(D1/D2)作为水平比r。

如果用户输入的分配比值PL和PR相等(即，水平比r＝1)，则25可以选择来自水平比计算单元23的输出或者来自水平比计算单元24的输出。

根据第一实施例的频谱控制单元的结构

如图1所示，根据本实施例的频谱控制单元104在功能上包括下述组件，这些组件被包括在图1中用虚线包围的区域中。换言之，频谱控制单元104包括作为乘法系数生成单元的移除系数生成单元31、右声道乘法单元32R和左声道乘法单元32L。

右声道乘法单元32R接收来自FFT单元101的频谱分量F1和来自移除系数生成单元31的移除系数w(乘法系数)。频谱分量F1和移除系数w相乘的结果从频谱控制单元104被输出为右声道频谱分量的输出FexR。

左声道乘法单元32L接收来自FFT单元102的频谱分量F2和来自移除系数生成单元31的移除系数w。频谱分量F2和移除系数w相乘的结果从频谱控制单元104被输出为左声道频谱分量的输出FexL。

移除系数生成单元31接收自频谱比较单元103的选择器25输出的水平比r，并且根据该水平比r生成移除系数w。移除系数生成单元31例如包括函数生成电路，用于生成与移除系数w有关的函数，其中水平比r为变量。该用于移除系数生成单元31的函数是根据下述内容被选择出的，所述内容是对应于要被移除的声源的、由用户输入的分配比值PL和PR。

由于发送到移除系数生成单元31的水平比r针对每个频谱分量而变，所以在移除系数生成单元31处生成的移除系数w也针对每个频谱分量而变。

因此，在右声道乘法单元32R处，移除系数w控制来自FFT单元101的频谱分量的水平，并且在左声道乘法单元32L处，移除系数w控制来自FFT单元102的频谱分量的水平。

图3A到图3D示出了用于移除系数生成单元31的函数生成电路的函数的示例。根据本实施例，其声像被定位于左声道和右声道的声像中央的歌声音频信号S3从由公式1和2所表示的左声道音频信号SL和右声道音频信号SR被移除。因此，能够生成具有图3A或图3B示出的特性的函数的函数生成电路被用于移除系数生成单元31。

根据图3A和图3B中示出的函数的特性，当左声道和右声道的水平比r等于或者近似等于1时，即，当左声道和右声道的频谱分量处于相同或者近似相同的水平时，移除系数w等于或者近似等于0，然而，当这些频谱分量处于水平比r外的其他水平比时，该移除系数等于1。

根据图3A示出的函数的特性，当左声道和右声道的水平比r小于0.6(r＜0.6)时，移除系数w等于1，并且当左声道和右声道的水平比r大于0.6小于0.8(0.6＜r＜0.8)时，该移除系数w从1线性改变到0。根据图3B示出的函数的特性，当左声道和右声道的水平比r小于0.8(r＜0.8)时，移除系数w等于1，并且当左声道和右声道的水平比r大于等于0.8(0.8≤r)时，该移除系数w等于0。

因此，对于与发送自选择器25的等于或近似等于1的水平比r相对应的频谱分量，移除系数w为0或者近似为0。从而，不从乘法单元32R和32L输出这些频谱分量。

另一方面，对于与发送自选择器25的小于0.6的水平比r相对应的频谱分量，移除系数w为1。从而，这些频谱分量以其原始水平从乘法单元32R和32L被输出。

换言之，在左声道和右声道中处于相同或者基本相同水平的频谱分量(即，歌声音频信号的频谱分量)从多个频谱分量中被移除，并且不从乘法单元32R和32L输出，相反，在左声道和右声道中处于不同水平的频谱分量以其原始水平从乘法单元32R和32L被输出。

结果，所得到的结果频谱分量不包括音频信号S3的频谱分量，其中，音频信号S3是在左声道音频信号SL和右声道音频信号SR中以相同水平分配的声源的音频信号。这些结果频谱分量作为来自频谱控制单元104的输出FexR和FexL，分别从乘法单元32R和32L被分别发送到逆FFT单元105和106。

在逆FFT单元105和106中，频域信号的频谱分量被转换为数字音频信号，然后被输出为输出信号SOR和SOL。

如上所述，在根据本实施例的音频信号处理装置10中，获得了输出信号SOR和SOL，它们不包括在左声道和右声道中以相同水平分配的歌声的音频信号。

在此情形下，根据本实施例的音频信号处理装置10从左声道音频信号SL和右声道音频信号SR移除歌声的音频分量。结果，如同在已知的音频信号处理装置中一样，立体声效果未丢失。此外，可以以满意的方式将要被移除的声源(在该情形中是歌声)移除。

如上所述，由于根据第一实施例的音频信号处理装置被包括在卡拉OK机器中，所以移除系数生成单元31生成这样的移除系数，以用于移除以相同水平分配在左声道和右声道中的声源的音频分量。用于移除系数生成单元31的函数生成电路可以被如此改变，以使得可以移除下述声源的音频分量，其中，所述声源以预定水平比分配在左声道和右声道中，或者在左声道和右声道中具有预定水平差。

例如，要从由公式1和2所表示的左声道音频信号SL和右声道音频信号SR分离以预定水平差分配在左声道和右声道中的音频信号S2或S4，则可以将具有图3C示出的特性的函数生成电路用于移除系数生成单元31。

更具体地说，音频信号S2以水平比D1/D2(＝SR/SL)＝0.4/0.9＝0.44被分配在左声道和右声道中，而音频信号S4以水平比D2/D1(＝SL/SR)＝0.4/0.9＝0.44被分配在左声道和右声道中。

根据本实施例，要分离音频信号S2，则用户将要被移除的声源的左右分配比设置为PL∶PR＝0.9∶0.4，或者输入设置，以使得PL＝0.9，并且PR＝0.4。如果用户设置上述分配比，则PR/PL＜1。结果，控制选择器25来选择来自水平比计算单元24的水平比的选择控制信号SEL被发送到选择器25。

要分离音频信号S4，则用户将要被移除的声源的左右分配比设置为PL∶PR＝0.4∶0.9，或者输入设置，以使得PL＝0.4，并且PR＝0.9。如果用户设置上述分配比，则PR/PL＞1。结果，控制选择器25来选择来自水平比计算单元23的水平比的选择控制信号SEL被发送到选择器25。

根据具有图3C示出的特性的函数，当左声道和右声道的水平比r等于或近似等于D1/D2(＝PR/PL)＝0.4/0.9＝0.44时，移除系数w等于或近似等于0，并且，当左声道和右声道的水平比r不等于0.44或近似0.44时，该移除系数等于1。

因此，对于处于0.44或近似0.44的水平比r的频谱分量，发送自选择器25的移除系数w等于或近似等于0。结果，不从乘法单元32R和32L输出这些频谱分量。另一方面，对于处于大于或小于0.44的水平比r的频谱分量，发送自选择器25的移除系数w等于或近似等于1。结果，这些频谱分量以其原始水平从乘法单元32R和32L被输出。

换言之，处于0.44或近似0.44的水平比的左声道和右声道的频谱分量从多个频谱分量中被移除，并且不从乘法单元32R和32L输出，而处于大于或小于0.44的水平比的左声道和右声道的频谱分量以其原始水平被输出。

结果，左声道音频信号SL和右声道音频信号SR不包括以0.44的水平比分配的声源的音频信号S2或S4的频谱分量。

如上所述，根据本实施例，可以基于预定分配比从左声道和右声道移除以该分配比分配在左声道和右声道中的声源的音频信号。

在上述实施例中，要被移除的音频信号从两个声道被分离。然而，并不是必须从两个声道移除音频信号，也可以只从一个声道移除。

在上述实施例中，基于分配在两个系统中的声源的音频信号的水平比，该声源的音频信号从分配在这两个系统中的音频信号中被移除。然而，也可以基于两个系统的音频信号的水平差，来只从这两个系统中的至少一个的音频信号中移除声源的音频信号。

在上面，描述了根据公式1和2分配在左声道和右声道中的声源的两声道立体声信号。然而，通过使用根据要被移除的声源的音频信号的水平比或水平差的移除函数，可以以与图3示出的相同的方式移除有意不分配在左声道和右声道中的声源的立体声音乐信号。

通过改变移除函数的特性，可以选择出(即，可以增加或减少)对应于预定水平比范围的要被移除的声源的音频信号范围。例如，除了对应于预定水平比范围的要被移除的音频信号的范围被改变外，具有图3D示出的特性的移除函数与图3C示出的相同。

许多立体声音乐信号都由具有不同频谱的声源构成。也可以以与上述相同的方式将这种立体声音乐信号移除。

对于具有包括彼此重叠区域的频谱的声源，通过提高FFT单元101和102的频率分辨率，例如通过使用4,000点或更高的FFT电路，从而可以提高声源移除的质量。

根据第二实施例的音频信号处理装置

在第二实施例中，分离出要分别从来自FFT单元101和102的频谱分量F1和F2移除的声源的音频分量。然后，分别从来自FFT单元101和102的频谱分量F1和F2减去所分离出的声源的音频分量。这样，目标声源的音频分量可以被移除。

图4是示出了根据第二实施例的音频信号处理装置的结构的框图。在第二实施例中，乘法系数生成单元33被用来替换移除系数生成单元31，并且减法单元107和108分别被插入在乘法单元32R和逆FFT单元105之间，以及乘法单元32L和逆FFT单元106之间。

分别来自乘法单元32R和32L的输出FexR和FexL分别被提供给减法单元107和108，并且自FFT单元101输出的频谱分量F1和自FFT单元102输出的频谱分量F2分别被提供给减法单元107和108。在减法单元107处，从频谱分量F1减去来自乘法单元32R的输出FexR。然后，结果输出被发送给逆FFT单元105。在减法单元108处，从频谱分量F2减去来自乘法单元32L的输出FexL。然后，结果输出被发送给逆FFT单元106。

水平比r从选择器25被发送到乘法系数生成单元33，然后，乘法系数w从乘法系数生成单元33被发送到乘法单元32R和32L。乘法系数生成单元33生成用于分离要被移除的声源的音频分量的乘法系数w，而不是移除系数。

图5A到图5D示出了乘法系数生成单元33的函数生成电路所生成的函数的特性。例如，如果要移除的音频信号是声源MS3的音频信号S3，则使用具有图5A或图5B示出的特性的函数生成电路。

根据图5A或图5B示出的特性，当左声道和右声道的水平比r为1或近似为1时，即，对于在左声道和右声道中处于相同或近似相同水平的频谱分量，乘法系数w为1或近似为1。当左声道和右声道的水平比r既不等于1也不近似等于1时，该乘法系数w为0。

因此，当用于从选择器25发送的水平比r为1或近似为1的频谱分量的乘法系数w为1或近似为1时，自乘法单元32L和32R发送的这些频谱分量基本以原始水平被输出，相反，当用于从选择器25发送的水平比既不为1也不近似为1的水平比r的频谱分量的乘法系数w为0时，自乘法单元32L和32R发送的这些频谱分量的输出水平被减少至0，从而不输出这些分量。

换言之，在多个频谱分量中，在左声道和右声道中处于相同或近似相同水平的频谱分量基本以它们的原始水平从乘法单元32L和32R被输出，相反，由于在左声道和右声道之间具有极大水平差的频谱分量的输出水平被减少至0，所以不输出这些频谱分量。结果，在乘法单元32R和32L处，只获得了以相同水平分配在左声道音频信号SL和右声道音频信号SR中的声源MS3的音频信号S3的频谱分量。

这样，在减法单元107处，通过从频谱分量F1减去声源MS3的音频信号S3的分量，从而获得输出。然后，所获得的输出被发送到逆FFT单元105。在减法单元108处，通过从频谱分量F2减去声源MS3的音频信号S3的分量，从而获得另一个输出。然后，所获得的输出被发送到逆FFT单元106。

结果，根据第二实施例，可以从右声道音频信号SR和左声道音频信号SL独立地移除用户选择的声源的分量。

根据第三实施例的音频信号处理装置

根据第一实施例的音频信号处理装置10从左声道音频信号SL和右声道音频信号SR移除相同声源的音频分量。然而，可以从左声道音频信号SL和右声道音频信号SR独立地移除不同声源的音频分量。根据第三实施例的音频信号处理装置10能够移除不同声源的音频分量。

图6是根据第三实施例的音频信号处理装置10的结构的框图。在图6中，对于与图1示出的根据第一实施例的组件相同的组件，用相同的标号表示出。

根据第三实施例的频谱比较单元的结构

根据第三实施例的频谱比较单元103包括水平检测单元21和22、水平比计算单元23和24、以及选择器25和26。根据第三实施例，选择器25输出对应于要从右声道移除的声源的音频信号的水平比rR，选择器26输出对应于要从左声道移除的声源的音频信号的水平比rL。

更具体地说，在水平比计算单元23和24处计算出的水平比被发送到选择器25和26。在选择器25和26处，水平比D1/D2或D2/D1被输出为水平比rR或rL。

在根据本实施例的音频信号处理装置10中，可以独立地选择出要从左声道移除的声源的音频信号和要从右声道移除的声源的音频信号。因此，选择器25和26分别被提供给右声道和左声道，以分别获得右声道和左声道的水平比rR和rL。

根据用户选择的要从左声道和右声道移除的声源的音频信号和它们的水平比，分别用于选择来自水平比计算单元23和24的输出的选择控制信号SELR和SELL分别被发送到选择器25和26。在选择器25和26处获得的水平比rR和rL被发送给频谱控制单元104。

例如，如果用户要分别输入左声道和右声道的分配比值PL和PR(它们都是小于1的值)作为要被移除的声源的音频信号的水平比，并且如果所输入的分配比值PL和PR具有关系PL/PR≤1，则选择控制信号SELR和SELL控制选择器25和26，以选择来自水平比计算单元23的输出(D2/D1)作为水平比rR和rL的值，相反，如果所输入的分配比值PL和PR具有关系PL/PR＞1，则选择控制信号SELR和SELL控制选择器25和26，以选择来自水平比计算单元24的输出(D1/D2)作为水平比rR和rL的值。

如果用户选择出的分配比值PL和PR彼此相等(rR＝rL＝1)，则来自水平比计算单元23的输出或来自水平比计算单元24的输出可以从选择器25和26被发送。

根据第三实施例的频谱控制单元的结构

根据本实施例的频谱控制单元104包括用于右声道的移除系数生成单元31R和乘法单元32R，以及用于左声道的移除系数生成单元31L和乘法单元32L。

乘法单元32R接收来自FFT单元101的频谱分量F1和来自系数生成单元31R的移除系数wR。频谱分量F1和移除系数wR的乘积被定义为来自频谱控制单元104的右声道频谱输出FexR。

乘法单元32L接收来自FFT单元102的频谱分量F2和来自系数生成单元31L的移除系数wL。频谱分量F2和移除系数wL的乘积被定义为来自频谱控制单元104的左声道频谱输出FexL。

系数生成单元31R接收来自频谱比较单元103的选择器25的水平比rR，并且生成对应于该水平比rR的移除系数wR。系数生成单元31L接收来自频谱比较单元103的选择器26的水平比rL，并且生成对应于该水平比rL的移除系数wL。

系数生成单元31R和31L例如由下述函数生成电路构成，这些函数生成电路用于生成与移除系数wR或wL有关的函数，其中水平比rR或rL为变量。这些用于系数生成单元31R和31L的函数是根据下述内容选择出的，所述内容是根据要被分离的声源由用户选择出的分配比值PL和PR。

发送到系数生成单元31R和31L的水平比rR和rL针对每个频谱分量而变。因此，分别来自系数生成单元31R和31L的移除系数wR和wL也针对每个频谱分量而变。

结果，在乘法单元32R处，来自FFT单元101的频谱分量的水平由水平比rR控制，并且在乘法单元32L处，来自FFT单元102的频谱分量的水平由水平比rL控制。

例如，如果在选择器25处，来自水平比计算单元23的水平比被选择为水平比rR，并且具有图3A示出的特性的函数生成电路被用于系数生成单元31R，则不包括歌声音频信号S3的右声道音频信号分量从乘法单元32R被输出。

类似地，例如，如果在选择器26处，来自水平比计算单元24的水平比被选择为水平比rL，并且具有图3C示出的特性的函数生成电路被用于系数生成单元31L，则不包括歌声音频信号S4的左声道音频信号分量从乘法单元32L被输出。

也可以将水平比从同一个水平比计算单元(23或24)发送到选择器25和26，以输出水平比rR和rL，并且将具有相同特性的函数生成电路用于系数生成单元31R和31L。在这种情形中，可以获得与图1示出的音频信号处理装置的优点相同的优点。

如上所述，根据第三实施例的音频信号处理装置10能够从右声道音频信号SR和左声道音频信号SL独立地移除声源的音频信号。

通过提供生成用于分离要被移除的声源的音频分量的乘法系数的乘法系数生成单元，并且在乘法单元32R和逆FFT单元105之间，以及在乘法单元32L和逆FFT单元106之间插入减法单元，来替换系数生成单元31R和31L，从而可以以与根据第二实施例的音频信号处理装置10相对于根据第一实施例的音频信号处理装置10的修改相类似的方式提供对第三实施例的修改。这样，在与上述第三实施例相类似的方式中，通过从频谱分量F1和F2减去在频谱控制单元104处分离出的左声道和右声道的声源的音频分量，从而可以从右声道音频信号SR和左声道音频信号SL移除要被移除的声源的音频分量。

根据第四实施例的音频信号处理装置

根据第四实施例的音频信号处理装置10能够动态改变由用户选择出的要从两个声道的音频信号中移除的声源。

更具体地说，除了根据第四实施例的音频信号处理装置10允许用户动态独立地选择要从左声道音频信号SL和右声道音频信号SR移除的声源(不同的或相同的声源)之外，根据第四实施例的音频信号处理装置10具有与根据第三实施例的音频信号处理装置相同的结构。

图7是根据第四实施例的音频信号处理装置10的结构的框图。根据第四实施例，频谱控制单元104包括用于右声道的多个系数生成单元31R1、31R2…31Rn，以及用于选择在系数生成单元31R1、31R2…31Rn中的一个处生成的移除系数wR并将该移除系数wR发送到乘法单元32R的开关电路34R。

频谱控制单元104还包括用于左声道的多个系数生成单元31L1、31L2…31Ln，以及用于选择在系数生成单元31L1、31L2…31Ln中的一个处生成的移除系数wL并将该移除系数wL发送到乘法单元32L的开关电路34L。

例如，用于分离各左声道和右声道水平比的声源的水平比/移除系数函数是针对每个系数生成单元31L1、31L2…31Ln和31R1、31R2…31Rn而设置的。

频谱比较单元103包括选择分配电路27，用于接收自水平比计算单元23和24输出的水平比计算结果之一，并且将所选择出的水平比计算结果提供给系数生成单元31L1、31L2…31Ln和31R1、31R2…31Rn中的每个。

根据第四实施例，提供了声源选择信号生成单元109。如下所述，声源选择信号生成单元109接收与用户利用选择单元选择要被分离的声源的操作相对应的信号Ma，生成要被发送到选择分配电路27的选择信号SELT，并且还生成用于切换开关电路34L的信号SWL和用于切换开关电路34R的信号SWR。

尽管在附图中未示出，但是根据本实施例的音频信号处理装置10允许用户通过例如选择旋钮、按钮或者图形用户界面(例如，具有触摸板的液晶显示器)来选择要被移除的声源。在这种情形中，用户可以从下述多个声源中选择声源，所述多个声源是可以利用为系数生成单元31L1、31L2…31Ln和31R1、31R2…31Rn设置的函数分离出的声源。

例如，通过移除预定声源，可以在左声道的声像的位置与在右声道的声像的位置之间逐渐移动声像的位置。

在这种情形中，用户可以针对左声道和右声道独立地选择出要被移除的声源。

例如，如果用户使用旋纽、按钮或图形用户界面来选择要使用来自左声道移除系数生成单元31L1的移除系数从左声道音频信号SL分离的声源时，与用户执行的该操作相对应的信号Ma被发送到声源选择信号生成单元109。然后，声源选择信号生成单元109生成对应于该信号Ma的切换控制信号SWL和选择信号SELT。

此刻，来自声源选择信号生成单元109的切换控制信号SWL使开关电路34L进行切换，以选择系数生成单元31L1。选择分配电路27接收到选择信号SELT，并且选择水平比计算单元23或水平比计算单元24(任一个都具有小于1的水平比)，然后将选择出的水平比发送到系数生成单元31L1。

结果，乘法单元32L输出音频信号FexL，其不包括所选择出的声源的频谱分量。输出音频信号FexL在逆FFT单元106处被转换为原始时序音频信号，并且被输出为输出信号SOL。

以同样的方式，用户所选择出的声源的音频信号也被从右声道移除。

根据图7示出的第四实施例的音频信号处理装置10能够从左声道和右声道分离预定声源的音频信号(以与根据第二实施例的音频信号处理装置10相同的方式)。然而，根据第四实施例的结构也可以被应用于根据第一实施例和下述其他实施例的结构。

更具体地说，当根据第四实施例的结构被应用到根据如图1所示的第一实施例的结构时，提供多个移除系数生成单元31L1、31L2…31Ln和31R1、31R2…31Rn来替换移除系数生成单元31，并且在这多个移除系数生成单元31L1、31L2…31Ln和乘法单元32L之间、多个移除系数生成单元31R1、31R2…31Rn和乘法单元32R之间提供开关电路34L和34R，以从多个移除系数生成单元31L1、31L2…31Ln或31R1、31R2…31Rn中的一个提供移除系数。此外，还提供了声源选择信号生成单元109。声源选择信号生成单元109能够接收来自用户的选择信号Ma，并且使开关电路进行切换，并且生成用于控制水平比计算单元23和24的信号，以使来自水平比计算单元23和24的输出中的一个更适合的输出被发送到移除系数生成单元31L1、31L2…31Ln或31R1、31R2…31Rn。

通过提供生成用于分离要被移除的声源的音频分量的乘法系数的乘法系数生成单元，并且在乘法单元32R和逆FFT单元105之间，以及在乘法单元32L和逆FFT单元106之间插入减法单元，来替换系数生成单元31R和31L，从而可以以与根据第二实施例的音频信号处理装置10相对于根据第一实施例的音频信号处理装置10的修改相类似的方式提供对第四实施例的修改。这样，在与上述第四实施例相类似的方式中，通过从频谱分量F1和F2减去在频谱控制单元104处分离出的左声道和右声道的声源的音频分量，从而可以从右声道音频信号SR和左声道音频信号SL移除要被移除的声源的音频分量。

根据第五实施例的音频信号处理装置

在上述实施例中，如果声源的多个音频信号以相同的水平比或水平差分配并混合在左声道和右声道中，则所有这些音频信号都被移除。根据第五实施例，可以移除基于水平比和/或水平差难以移除的声源的预定音频信号。

根据第五实施例，当基于水平比和/或水平差难以移除的声源的音频分量的主频带不同时，则可以基于它们的频带差移除这些声源的音频分量。

图8是根据第五实施例的音频信号处理装置10的结构的框图。根据第五实施例，在FFT单元101和FFT单元102的输出侧分别提供了带通滤波器110和111，用于分离包括要被移除的声源的音频分量的频带的信号分量。此外，在FFT单元101和FFT单元102的输出侧分别还提供了低通/高通滤波器112和113，用于分离除了下述频带之外的频带的信号分量，所述频带主要包括要被移除的声源的音频分量。

此外，加法单元114被插入在频谱控制单元104的乘法单元32R和逆FFT单元105之间，并且加法单元115被插入在频谱控制单元104的乘法单元32L和逆FFT单元106之间。

自FFT单元101输出的频谱分量F1被发送到带通滤波器110和低通/高通滤波器112。在带通滤波器110处，主要包括要被移除的声源的音频分量的频带的信号分量被分离出，并且被发送到频谱比较单元103的水平检测单元21和频谱控制单元104的乘法单元32R。

在低通/高通滤波器112处，除了下述频带之外的频带的信号分量被分离，并且被发送到加法单元114，所述频带主要包括要被移除的声源的音频分量。加法单元114也接收到来自频谱控制单元104的输出FexR。在加法单元114处所获得的相加的结果被发送到逆FFT单元105。

自FFT单元102输出的频谱分量F2被发送到带通滤波器111和低通/高通滤波器113。在带通滤波器111处，主要包括要被移除的声源的音频分量的频带的音频信号分量被分离出，并且被发送到频谱比较单元103的水平检测单元22和频谱控制单元104的乘法单元32L。

在低通/高通滤波器113处，除了下述频带之外的频带的音频信号分量被分离，并且被发送到加法单元115，所述频带主要包括要被移除的声源的音频分量。加法单元115也接收到来自频谱控制单元104的输出FexL。在加法单元115处所获得的相加的结果被发送到逆FFT单元106。

根据第五实施例的频谱比较单元103和频谱控制单元104只移除除了下述频带之外的频带的信号分量，所述频带主要包括要被移除的声源的音频分量。然后，在加法单元114和115处，结果输出FexR和FexL被加到未被处理来移除声源的频带分量，相加的结果分别被发送到逆FFT单元105和106。

因此，即使音频信号的多个声源分量以相同的水平比或者具有相同的水平差被分配在两个声道中，只要包括声源的音频分量的主频带不同，就可以通过应用根据第五实施例的结构来从每个声道移除要被移除的声源的音频分量。

通过提供生成用于分离要被移除的声源的音频分量的乘法系数的乘法系数生成单元，并且在乘法单元32R和加法单元114之间，以及在乘法单元32L和加法单元115之间插入减法单元，来替换系数生成单元31R和31L，从而可以以与根据第二实施例的音频信号处理装置10相对于根据第一实施例的音频信号处理装置10的修改相类似的方式提供对第五实施例的修改。这样，在与上述第五实施例相类似的方式中，通过从频谱分量F1和F2减去在频谱控制单元104处分离出的左声道和右声道的声源的音频分量，从而可以从右声道音频信号SR和左声道音频信号SL移除要被移除的声源的音频分量。

根据第六实施例的音频信号处理装置

根据第六实施例，当只基于水平比和/或水平差难以移除声源的音频分量时，预定音频分量被移除。

在上述实施例中，声源的音频信号以相同的相位分配在两个声道中。然而，在其他情形中，音频信号可以以相反相位分配在两个声道中。下面将描述由公式3和4所表示的示例情形，其中，来自6个声源MS1到MS6的音频信号S1到S6分配在左声道和右声道中作为立体声音频信号SL和SR。

SL＝S1+0.9S2+0.7S3+0.4S4+0.7S6 (3)

SR＝S5+0.4S2+0.7S3+0.9S4-0.7S6 (4)

更具体地说，来自声源MS3的音频信号S3和来自声源MS6的音频信号S6以相同的水平分配在左声道和右声道中。然而，来自声源MS3的音频信号S3以相同的相位分配在左声道和右声道中，但是来自声源MS6的音频信号S6以不同的相位分配在左声道和右声道中。

如果要只基于水平比和/或水平差来移除来自声源MS3的音频信号S3或来自声源MS6的音频信号S6，而不考虑在左声道和右声道中音频信号S3和S6的相位，则由于音频信号S3和S6都以相同的水平分配在左声道和右声道中，所以音频信号S3和S6之一难以被移除。

根据第六实施例，首先使用两个声道的水平比和/或水平差、然后使用相位差来分离声源的音频分量。从来自FFT单元101和102的输出F1和F2分别减去所分离出的声源的音频分量，以移除预定声源的音频分量。

图9是根据第六实施例的音频信号处理装置10的结构的框图。根据第六实施例的音频信号处理装置10包括频谱比较单元103、水平比较单元1031和相位比较单元1032。

根据第六实施例的频谱控制单元104包括第一频谱控制单元1041和第二频谱控制单元1042，用于基于相位差来分离声源的音频信号。

图10是频谱比较单元103和频谱控制单元104的详细结构的框图。频谱比较单元103的水平比较单元1031的结构类似于根据第一实施例的频谱比较单元103的结构，并且包括水平检测单元21和22、水平比计算单元23和24、以及选择器25。

频谱控制单元104的第一频谱控制单元1041具有与根据第二实施例的上述频谱控制单元的结构基本相同的结构，并且包括乘法系数生成单元301和声源分离单元，其中声源分离单元包括乘法单元302和303。

如图9和图10所示，来自水平比较单元1031的水平比输出r以与根据第一实施例的方式类似的方式被发送到第一频谱控制单元1041的乘法系数生成单元301。然后，乘法系数生成单元301生成与为乘法系数生成单元301设置的函数相对应的乘法系数wr。所生成的乘法系数wr被发送到乘法单元302和303。

乘法单元302接收到来自FFT单元101的频谱分量F1，并且获得频谱分量F1和乘法系数wr的相乘结果。乘法单元303接收到来自FFT单元102的频谱分量F2，并且获得频谱分量F2和乘法系数wr的相乘结果。

换言之，乘法单元302和303根据来自移除系数生成单元31的乘法系数wr，分别控制来自FFT单元101和102的频谱分量F1和F2的水平，并且输出这些频谱分量F1和F2。

类似于第二实施例，乘法系数生成单元301由函数生成电路构成，该函数生成电路有关生成乘法系数wr的函数，其中水平比r是变量。用于乘法系数生成单元301的函数是基于要被分离的声源在左声道和右声道中的音频信号选择出的。

如上所述，与具有在图5A到图5D中示出的特性的乘法系数wr的水平比相关的函数被设置来用于乘法系数生成单元301。例如，具有图5A示出的特性的预定函数如上所述被设置来用于乘法系数生成单元301，以分离以相同水平分配在左声道和右声道中的声源的音频信号。

根据第六实施例，乘法单元302和303的输出被发送到频谱比较单元103的相位比较单元1032和频谱控制单元104的第二频谱控制单元1042。

如图10所示，相位比较单元1032包括相位差检测单元28，用于检测来自乘法单元302和303的输出的相位差φ。相位比较单元1032将关于相位差的信息发送到第二频谱控制单元1042。

第二频谱控制单元1042包括乘法系数生成单元304、乘法单元305和306、减法单元307和308。

乘法单元305接收来自第一频谱控制单元1041的乘法单元302的输出，以及来自乘法系数生成单元304的乘法系数wp。来自乘法单元302的输出和乘法系数wp的相乘结果从乘法单元305被发送到减法单元307。减法单元307接收到来自FFT单元101的输出F1，并且从该输出F1减去来自乘法单元305的输出，相减的结果从频谱控制单元104输出为第一输出(右声道)FexR。

乘法单元306接收来自第一频谱控制单元1041的乘法单元303的输出，以及来自乘法系数生成单元304的乘法系数wp。来自乘法单元303的输出和乘法系数wp的相乘结果从乘法单元306被发送到减法单元308。减法单元308接收到来自FFT单元102的频谱分量F2，并且从该频谱分量F2减去来自乘法单元306的输出。相减的结果从频谱控制单元104输出为第二输出(左声道)FexL。

乘法系数生成单元304从相位差检测单元28接收到关于相位差φ的信息，并且生成对应于该相位差φ的乘法系数wp。乘法系数生成单元304由函数生成电路构成，该函数生成电路用于生成有关乘法系数wp的函数，其中相位差φ为变量。要用于乘法系数生成单元304的函数是由用户根据左声道和右声道之间的声源的音频信号相位差选择出的。

发送到乘法系数生成单元304的相位差φ随频谱分量的频率分量增加而变。因此，在乘法单元305和306处，来自乘法单元302和303的频谱分量的水平由乘法系数wp控制。

图11A到图11E示出了用于乘法系数生成单元304的函数生成电路的函数的示例。

根据具有图11A示出的特性的函数，如果左声道和右声道的相位差φ为0或近似为0，即，如果左声道和右声道的频谱分量的相位相同或近似相同，则乘法系数wp为1或近似为1，相反，如果左声道和右声道的相位差φ大于约π/4，则乘法系数wp为0。

例如，如果具有图11A示出的特性的函数被设置来用于乘法系数生成单元304，则对应于下述频谱分量的乘法系数wp为1或近似为1，所述频谱分量具有在相位差检测单元28处获得的为0的相位差φ。因此，乘法单元305和306以这些频谱分量的原始水平输出这些频谱分量。相反，由于对应于下述频谱分量的乘法系数wp为0，所述频谱分量具有来自相位差检测单元28的大于约π/4的相位差φ，所以要从乘法单元305和306输出的频谱分量的输出水平为0，因此这些频谱分量未被输出。

更具体地说，乘法单元305和306以其原始水平输出处于相同相位或者近似处于相同相位的频谱分量，并且通过将具有大相位差的频谱分量的输出水平设置为0而不输出它们。结果，只有以相同相位分配在左声道音频信号SL和右声道音频信号SR中的频谱分量从乘法单元305和306输出。

换言之，具有图11A示出的特性的函数被用来分离在左声道和右声道中以相同相位分配的声源的信号。

根据具有图11B示出的特性的函数，如果左声道和右声道的相位差φ为π或近似为π，即，如果左声道和右声道的频谱分量处于相反或近似相反相位，则乘法系数wp为1或近似为1，相反，如果左声道和右声道的相位差φ小于3π/4，则乘法系数wp为0。

例如，如果具有图11B示出的特性的函数被设置来用于乘法系数生成单元301，则对应于下述频谱分量的乘法系数wp为1或近似为1，所述频谱分量具有在相位差检测单元28处获得的为π或近似为π的相位差φ。因此，乘法单元305和306以这些频谱分量的原始水平输出这些频谱分量。相反，由于对应于下述频谱分量的乘法系数wp为0，所述频谱分量具有小于约3π/4的来自相位差检测单元28的相位差φ，所以要从乘法单元305和306输出的频谱分量的输出水平为0，因此这些频谱分量未被输出。

更具体地说，乘法单元305和306以其原始水平输出处于反相位或者近似处于反相位的频谱分量，并且通过将具有小相位差的频谱分量的输出水平设置为0而不输出它们。结果，只有以相同相位分配在左声道音频信号SL和右声道音频信号SR中的频谱分量从乘法单元305和306输出。

换言之，具有图11B示出的特性的函数被用来分离在左声道和右声道中以反相位分配的声源的信号。

类似地，根据具有图11C示出的特性的函数，如果左声道和右声道的相位差φ为π/2或近似为π/2，则乘法系数wp为1或近似为1，相反，如果左声道和右声道的相位差φ为约π/2之外的其他值，或者近似为π，则乘法系数wp为0。这样，具有图11C示出的特性的函数用来分离下述声源信号，所述声源信号在左声道和右声道中以约π/2的相位差分配。

另外，具有图11D和图11E示出的特性的函数可以根据要被分离的声源的音频信号被分配时的相位差而被设置来用于乘法单元305和306。

根据第六实施例，如果声源MS3的音频信号S3以相同的水平和相同的相位被分配在左声道和右声道中，并且声源MS6的音频信号S6以相同的水平但是相反的相位被分配左声道和右声道中，则要只从由公式3和公式4所表示的左声道音频信号SL和右声道音频信号SR中移除声源MS3的音频信号S3，则具有图5A示出的特性的函数被设置来用于第一频谱控制单元1041的乘法系数生成单元301，并且具有图11B示出的特性的函数被设置来用于第二频谱控制单元1042的乘法系数生成单元304。

这样，如图9和图10所示，在频谱控制单元104的第一频谱控制单元1041的乘法单元302处，获得包括在通过对右声道音频信号SR执行快速傅立叶变换(FFT)所获得的频谱分量F1中的频谱分量(S3-S6)，在乘法单元303处，获得包括在通过对左声道音频信号SL执行快速傅立叶变换(FFT)所获得的频谱分量F2中的频谱分量(S3+S6)。换言之，信号S3和S6以相同的水平被分配在左声道和右声道中，在第一频谱控制单元1041处信号S3和S6未被移除，而是被输出。

根据第六实施例，基于信号S3和S6以反相位分配在左声道和右声道中这一事实，信号S3和S6被分离出。

更具体地说，来自乘法单元302和303的输出被发送到构成频谱比较单元103的相位比较单元1032的相位差检测单元28，并且输出的相位差φ被检测。然后，关于在相位差检测单元28处检测出的相位差φ的信息被发送到乘法系数生成单元304。

由于具有图11A示出的特性的函数被设置来用于乘法系数生成单元304，所以乘法单元305和306分离出以相同相位分配在左声道和右声道中的音频信号S3。更具体地说，在乘法单元305和306处，获得以同相位被包括在频谱分量(S3+S6)和频谱分量(S3-S6)中的声源MS3的音频信号S3的频谱分量，然后这些频谱分量被发送到减法单元307和308。

因此，输出信号FexR(其是通过从频谱分量F1移除了声源MS3的音频信号S3的频谱分量获得的)从减法单元307被导出，并且被发送到逆FFT单元105。输出信号FexL(其是通过从频谱分量F2移除了声源MS3的音频信号S3的频谱分量获得的)从减法单元308被导出，并且被发送到逆FFT单元106。在逆FFT单元105和106处，这些输出被转换为时序信号，并且被输出为输出信号SOR和SOL。

根据图9和图10示出的第六实施例，在第一频谱控制单元1041处使用水平比难以分离出的信号S3和S6，可以在第二频谱控制单元1042处通过使用乘法系数和乘法单元而被分离出，这是由于信号S6处于与S3相反的相位中。然而，也可以通过使用相位差φ和乘法系数而分离出使用水平比难以分离出的两个信号中的一个，并且通过从来自第一频谱控制单元1041的信号的和(通过将乘法单元302和303的输出相加所获得的信号)减去所分离出的信号，从而分离出两个信号中的另一个信号。

根据第七实施例的音频信号处理装置

根据本发明第七实施例，基于左声道和右声道的频谱分量的相位差分离出预定声源。图12是根据第七实施例的音频信号处理装置10的框图。

在第七实施例中，频谱比较单元103包括相位差检测单元29。来自FFT单元101的频谱分量F1和来自FFT单元102的频谱分量F2被发送到相位差检测单元29和频谱控制单元104。与图1示出的类似，频谱控制单元104包括移除系数生成单元35、乘法单元32R和32L。然而，不同于图1所示出的，移除系数生成单元35接收相位差φ作为输入，并且输出移除系数wp。

如果用相位比较单元1032和第二频谱控制单元1042中的移除系数生成单元替换乘法系数生成单元，则根据第七实施例的音频信号处理装置10的操作与根据第六实施例的音频信号处理装置10的操作完全相同。

更具体地说，向移除系数生成单元35提供了函数生成电路，用于生成具有下述特性的函数：其中，当要被移除的声源的音频分量以相位差φ被分配在左声道和右声道中时，移除系数wp为0，并且当相位差不是φ时，移除系数wp为1。例如，对应由公式3和公式4所表示的左声道音频信号SL和右声道音频信号SR，如果用于生成具有图11B示出的特性的函数的函数生成电路被提供给移除系数生成单元35，则来自频谱控制单元104的输出不包括以反相位分配在左声道和右声道中的声源MS6的音频信号S6。

通过用乘法系数生成单元替换移除系数生成单元35，并且在频谱控制单元104和逆FFT单元105及106之间插入减法单元，从而可以以与第二实施例类似的方式构造对第七实施例的修改，其中，乘法系数生成单元用于分离包括在频谱分量F1和F2中的预定声源的音频信号，减法单元用于从频谱分量F1和F2中减去来自频谱控制单元104的乘法单元32R和32L的输出。

根据第八实施例的音频信号处理装置

图13是根据本发明第八实施例的音频信号处理装置10的结构的框图。在图13中，使用数字滤波器将以预定水平比或具有预定水平差而分配在左声道和右声道中的声源的音频信号从左声道音频信号SL和右声道音频信号SR之一(即，图中示出的左声道音频信号SL的情形)中移除。

更具体地说，经由用于调节信号定时的延迟单元41，左声道音频信号SL(在该情形中其是数字信号)被发送到数字滤波器42。如下所述，数字滤波器42接收基于要被移除的声源的音频信号的水平比而生成的滤波器系数(对应于移除系数)。然后，数字滤波器42输出信号SOL，该信号是通过从左声道音频信号SL移除要被移除的声源的音频信号而生成的。

滤波器系数是如下所述生成的。首先，左声道音频信号SL和右声道音频信号SR(数字信号)分别被发送到FFT单元43和FFT单元44，并且进行快速傅立叶变换(FFT)处理，以使得时序音频信号被转换为频域数据。FFT单元43和44分别输出频谱分量F1和F2。这多个频谱分量F1和F2具有彼此不同的频率。

来自FFT单元43和44的频谱分量分别被发送到水平检测单元45和46，其中，幅度谱或功率谱被检测出来，以确定频谱分量的水平。然后，在水平检测单元45和46处分别检测出的水平值D1和D2被发送给水平比计算单元47，在水平比计算单元47中，水平比D1/D2或D2/D1被计算出来。

在水平比计算单元47处计算出的水平比值被发送到加权系数生成单元48。加权系数生成单元48对应于根据上述实施例的移除系数生成单元，并且对于要被移除的声源的左声道和右声道的音频信号的混合水平比，或者近似等于混合水平比的水平比，输出等于零或者极小值的加权系数。在其他水平比处，加权系数生成单元48输出等于1或等于极大值的加权系数。针对FFT单元43和44的输出的频谱分量的每个频率，都确定出加权系数。

在加权系数生成单元48处生成的频域的加权系数被发送到滤波系数生成单元49，并且被转换为时间轴域的滤波系数。滤波系数生成单元49通过执行逆快速傅立叶变换(逆FFT)生成要被发送到数字滤波器42的滤波系数。

来自滤波系数生成单元49的滤波系数被发送到数字滤波器42。数字滤波器42输出不包括与由加权系数生成单元48设置的函数相对应的音频信号分量的输出SOL。延迟单元41调整处理延迟时间，即，调整针对左声道音频信号SL生成要被发送到数字滤波器42的滤波系数的定时。

在上述描述中，只参考图13描述了左声道音频信号SL。对于右声道音频信号SR，可以以与左声道音频信号SL相同的方式移除预定声源的音频分量，其中，提供用于经由延迟单元接收右声道音频信号SR的数字滤波器系统，并且滤波系数从滤波系数生成单元49被发送到右声道数字滤波器。

在图13示出的结构中，只处理水平比。然而，也可以提供只处理相位差、或者处理组合的水平比和相位差的结构。更具体地说，尽管在附图中未示出，当组合处理水平比和相位差时，来自FFT单元43和44的输出也被发送到相位差检测单元，并且所检测出的相位差也被发送到加权系数生成单元。在此情形中，加权系数生成单元包括生成加权系数的函数生成电路，在函数中，变量不仅包括要被移除的声源的左声道和右声道的音频信号水平差，而且包括相位差。

换言之，在此情形中，当水平比等于或近似等于要被移除的声源的左声道和右声道的音频信号水平比，并且相位差等于或近似等于要被移除的声源的左声道和右声道的音频信号相位差时，加权系数生成单元生成大加权系数；而当水平比和相位差等于任何其他值时，生成小加权系数。

通过对在加权系数生成单元处生成的加权系数执行逆快速傅立叶(逆FFT)变换，该加权系数被转换为用于数字滤波器42的滤波系数。根据其他实施例的音频信号处理装置

在上述实施例中，难以对作为长时序信号的输入音频信号执行快速傅立叶变换(FFT)，例如，音乐信号。因此，时序信号被分割为预定数量的分析片断，并且对这些片断中的每个执行快速傅立叶变换(FFT)。

然而，如果时序信号仅仅被分割为具有预定长度的片断，并且在移除了预定声源之后通过执行逆快速傅立叶变换(逆FFT)而被重组，则会在重组点形成不连续的波形，并且在声音中产生噪声。

如图14所示，根据第九实施例，为了获得片断数据，生成每个都具有相同长度的单位片断：片断1、片断2、片断3、片断4…。每个片断的片断数据被例如如此读取，以使得相邻单位片断的1/2长度彼此重叠。图14示出了数字音频信号的采样数据项x1、x2、x3…xn。

通过执行上述处理，具有以与上述实施例相同的方式分离出的声源并且利用逆傅立叶变换(逆FFT)处理过的时序数据将使重叠部分作为输出片断数据项1和2，如图15所示。

如图15所示，根据第九实施例，对彼此相邻的输出片断数据项(例如，输出片断数据项1和2)的重叠部分执行基于窗口函数1和2的开窗口处理，其中窗口函数1和2具有三角形窗口的特性，如图15所示。然后，在输出片断数据项1和2中的重叠部分中的同一时刻的数据被相加来获得组合的输出数据，如图15所示。这样，就获得了不包括预定声源、并且在波形中不具有不连续点、也没有噪声的音频信号。

如图16所示，根据第十实施例，为了获得片断数据，生成了彼此重叠的预定片断，例如，片断1、片断2、片断3和片断4。同时，在执行快速傅立叶变换(FFT)之前，对这些片断的片断数据项执行基于三角形窗口函数1、2、3和4(如图16所示)的开窗口处理。

如图16所示，在执行开窗口处理之后，快速傅立叶变换(FFT)被执行。然后，对分离出预定声源的信号执行逆快速傅立叶变换(FFT)，以获得输出片断数据项1和2，如图17所示。由于已对输出片断数据项的重叠部分执行了开窗口处理，所以仅仅通过将片断数据项的重叠部分相加就可以在输出单元处获得不包括预定声源、并且在波形中不具有任何不连续点、也没有噪声的音频信号。

除了三角形窗口外，Hanning窗口、Hamming窗口和Blackman窗口也可以被用作在上述开窗口处理中使用的窗口函数。

在上述实施例中，对转换来获得频域信号的时间离散信号和立体声声道的频谱分量进行了比较。相反，在原理上，可以在时域中用多个带通滤波器对信号进行分段，并且可以对这些频带执行相同的处理。然而，通过执行上述快速傅立叶变换(FFT)来增加频率分辨率并提高声源分离的质量更容易。因此，更实际的是执行快速傅立叶变换(FFT)。

根据上述实施例，两声道立体声信号被用作两系统音频信号。然而，可以使用任何两个音频信号，只要声源的音频信号以预定水平比或预定水平差分配在两个系统中。对于相位差也相同。

根据上述实施例，确定了两个系统的音频信号的频谱分量的水平比，并且使用了移除系数生成单元和使用水平比/乘法系数的函数的乘法系数生成单元。然而，也可以确定两个系统的音频信号的频谱分量的水平差，并且可以使用移除系数生成单元和使用水平差/乘法系数的函数的乘法系数生成单元。

配置为将时序信号转换为频域信号的转换单元不限于FFT处理单元，并且可以使用任何单元，只要该单元能够比较频谱分量的水平和相位。

本领域的技术人员应当注意，取决于设计需求和其他因素，可以作出各种修改、组合、子组合和替换，只要它们在所附权利要求及其等同的范围内。

本发明包含涉及2004年9月28日向日本专利局提交的日本专利申请JP 2004-280820的主题，其全部内容通过参考结合于此。

Claims

1.一种音频信号处理装置，包括：

分裂装置，用于将第一系统的音频信号和第二系统的另一音频信号分裂为多个频带分量；

水平比较装置，用于计算所述第一系统的每个频带和所述第二系统的每个频带之间的水平比或水平差；和

输出控制装置，用于从所述第一和第二系统中的至少一个移除下述频带分量，由所述水平比较装置计算出的所述频带分量的水平比或水平差等于或基本等于预定值。

2.一种音频信号处理装置，包括：

第一转换装置，用于将来自第一系统的时序音频信号转换为频域信号；

第二转换装置，用于将来自第二系统的时序音频信号转换为频域信号；

水平计算装置，用于计算来自所述第一转换装置的频谱分量与来自所述第二转换装置的频谱分量之间的水平比或水平差，所述来自第一转换装置的频谱分量与所述来自第二转换装置的频谱分量彼此对应；

输出控制装置，用于基于所述水平计算装置的计算结果来控制从所述第一和第二转换装置中的至少一个获得的所述频谱分量的水平，并且用于从所述第一系统的频谱分量和所述第二系统的频谱分量中的至少一个移除下述频谱分量，由所述水平比较装置计算出的所述频谱分量的水平比或水平差等于或基本等于预定值；和

逆转换装置，用于将来自所述输出控制装置的频域信号转换为时序信号。

3.如权利要求2所述的音频信号处理装置，还包括：

相位差计算装置，用于计算所述来自第一转换装置的频谱分量与所述来自第二转换装置的频谱分量之间的所述相位差，所述来自第一转换装置的频谱分量与所述来自第二转换装置的频谱分量彼此对应，

其中，所述输出控制装置基于所述水平计算装置的计算结果和由所述相位差计算装置计算出的相位差来控制从所述第一和第二转换装置中的至少一个获得的所述频谱分量的水平，并且从所述第一系统的频谱分量和所述第二系统的频谱分量中的至少一个移除下述频谱分量，所述频谱分量的相位差等于或基本等于预定值。

4.如权利要求2所述的音频信号处理装置，其中，所述输出控制装置包括

用于生成乘法系数的乘法系数生成单元，所述乘法系数被设置为所述在水平计算装置处计算出的水平比或水平差的函数，和

乘法单元，用于通过将所述在乘法系数生成单元处生成的乘法系数与所述频谱分量相乘，从而确定从所述第一转换装置和所述第二转换装置中的至少一个获得的所述频谱分量的输出水平。

5.如权利要求3所述的音频信号处理装置，其中，所述输出控制装置包括

用于生成乘法系数的乘法系数生成单元，所述乘法系数被设置为所述在相位差计算装置处计算出的相位差的函数，和

乘法单元，用于通过将所述在乘法系数生成单元处生成的乘法系数与所述频谱分量相乘，从而确定从所述第一转换装置和所述第二转换装置中的至少一个获得的频谱分量的输出水平。

6.如权利要求2所述的音频信号处理装置，

其中，所述输出控制装置包括多个乘法系数生成单元和多个乘法单元，所述乘法系数生成单元用于生成被设置为所述在水平计算装置处计算出的水平比或水平差的函数的乘法系数，所述乘法单元用于通过将所述在乘法系数生成单元处生成的乘法系数与所述频谱分量相乘，从而确定从所述第一转换装置和所述第二转换装置中的至少一个获得的频谱分量的输出水平，并且

其中，所述逆转换装置包括多个逆转换部分，用于将所述来自多个乘法单元的输出转换为时序信号。

7.如权利要求2所述的音频信号处理装置，其中，所述输出控制装置包括

多个乘法系数生成单元，用于生成被设置为所述在水平计算装置处计算出的水平比或水平差的函数的乘法系数，

选择单元，用于选择所述在多个乘法系数生成单元处生成的乘法系数之一，和

乘法单元，用于通过将所述在选择单元处选择出的乘法系数与所述频谱分量相乘，从而确定从所述第一转换装置和所述第二转换装置中的至少一个获得的频谱分量的输出水平。

8.如权利要求2所述的音频信号处理装置，还包括：

分片装置，用于通过将第一和第二系统的时序信号分片为预定片断来生成片断数据项，使相邻片断数据项的部分重叠，并且将所述片断数据项提供给所述第一和第二转换装置；和

输出装置，用于对与所述片断数据项相对应的自所述逆转换装置输出的时序信号执行开窗口操作，将对应于同一时刻的每个所述时序信号相加，并且输出所述相加的结果。

9.如权利要求2所述的音频信号处理装置，还包括：

分片装置，用于通过将第一和第二系统的时序信号分片为预定片断来生成片断数据项，使相邻片断数据项的部分重叠，对所述片断数据项执行开窗口操作，并且将所述片断数据项提供给所述第一和第二转换装置；和

输出装置，用于将对应于同一时刻的来自所述逆转换装置的每个时序信号相加，并且输出所述相加的结果。

10.一种音频信号处理方法，包括下述步骤：

分裂步骤，用于将第一系统的音频信号和第二系统的另一音频信号分裂为多个频带分量；

计算步骤，用于计算所述第一系统的每个频带和所述第二系统的每个频带之间的水平比或水平差；和

移除步骤，用于从所述第一和第二系统中的至少一个移除下述频带分量，在所述计算步骤中计算出的所述频带分量的水平比或水平差等于或基本等于预定值。

11.一种音频信号处理方法，包括下述步骤：

获取步骤，用于通过将第一和第二系统的时序音频信号转换为频域信号，从而获得所述第一和第二系统的频谱分量；

计算步骤，用于计算在所述获取步骤中获得的所述第一系统的频谱分量与所述第二系统的频谱分量之间的水平比或水平差，所述第一系统的频谱分量与所述第二系统的频谱分量彼此对应；

控制步骤，用于基于在所述计算步骤中获得的计算结果来控制在所述获取步骤中获得的所述第一系统的频谱分量和所述第二系统的频谱分量中的至少一个的水平，并且用于从所述第一和第二系统中的至少一个移除下述频谱分量，在所述计算步骤中计算出的所述频谱分量的水平比或水平差等于或基本等于预定值；和

转换步骤，用于将所述在控制步骤中获得的频域信号转换为时序信号。

12.如权利要求11所述的音频信号处理方法，还包括下述步骤：

相位差计算步骤，用于计算所述在获取步骤中获得的频谱分量之间的相位差，所述第一系统的频谱分量与所述第二系统的频谱分量彼此对应，

其中，所述控制步骤包括下述步骤，通过基于所述在计算步骤中获得的计算结果和所述在相位差计算步骤中计算出的相位差来控制在所述获取步骤中获得的所述第一和第二系统的频谱分量的水平，从而从所述第一和第二系统中的至少一个移除下述频谱分量，所述频谱分量的相位差等于或基本等于预定值。

13.一种音频信号处理装置，包括：

分裂单元，配置为将第一系统的音频信号和第二系统的另一音频信号分裂为多个频带分量；

水平比较单元，配置为计算所述第一系统的每个频带和所述第二系统的每个频带之间的水平比或水平差；和

输出控制单元，配置为从所述第一和第二系统中的至少一个移除下述频带，由所述水平比较单元计算出的所述频带分量的水平比或水平差等于或基本等于预定值。

14.一种音频信号处理装置，包括：

第一转换单元，配置为将来自第一系统的时序音频信号转换为频域信号；

第二转换单元，配置为将来自第二系统的时序音频信号转换为频域信号；

水平计算单元，配置为计算来自所述第一转换单元的频谱分量与来自所述第二转换单元的频谱分量之间的水平比或水平差，所述来自第一转换单元的频谱分量与所述来自第二转换单元的频谱分量彼此对应；

输出控制单元，配置为基于所述水平计算单元的计算结果来控制从所述第一转换单元和所述第二转换单元中的至少一个获得的所述频谱分量的水平，并且从所述第一和第二转换单元中的至少一个移除下述频谱分量，由所述水平比较单元计算出的所述频谱分量的水平比或水平差等于或基本等于预定值；和

逆转换单元，配置为将来自所述输出控制单元的频域信号转换为时序信号。