CN101807894A

CN101807894A - 音量校正装置，音量校正方法，音量校正程序以及电子设备

Info

Publication number: CN101807894A
Application number: CN201010107485A
Authority: CN
Inventors: 野口雅义
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2009-02-16
Filing date: 2010-02-09
Publication date: 2010-08-18
Anticipated expiration: 2030-02-09
Also published as: ATE552702T1; US8681998B2; EP2219371B1; US20100208918A1; JP2010192954A; CN101807894B; JP5120288B2; EP2219371A3; EP2219371A2

Abstract

一种音量校正装置，其包括：可变增益装置，其用于根据增益控制信号控制提供给输入音频信号的增益；连续相关声音区间检测装置，其用于检测输入音频信号中的连续相关声音区间，其中存在一组短暂相邻的连续相关声音；平均等级检测装置，其用于检测在所述连续相关声音区间期间获得的输入音频信号的平均等级，平均等级检测装置的用于平均等级检测的时间常数在连续相关声音区间的超前时段内比剩余时段内设为更小的值；以及，增益控制信号发生装置，其用于产生增益控制信号，从而使平均等级等于基准等级，并将产生的增益控制信号提供给可变增益装置。本发明在出现大等级差的音频区间内以及稳态音频区间内可以对输入音频信号进行令人满意的音量控制。

Description

音量校正装置，音量校正方法，音量校正程序以及电子设备

相关申请的交叉引用

本申请包含了与2009年2月16日在日本专利局提交的日本专利申请JP2009-032272相关的主题并要求其优先权，将该申请的全部内容通过引用并入此处。

技术领域

本发明涉及最好适用于诸如电视机等电子设备的音频输出部的音量校正装置、音量校正方法以及音量校正程序。

背景技术

当切换由电视机接收的广播频道时，或者当在视听AV系统中的视听(AV)中心处切换多个输入装置时，由于内容之间的等级差，输出音量可能变化很大。

这种情况下，如果用户想要获得他/她想要的音量，就必须使用遥控器等装置进行音量调节操作以控制音量，于是会发觉很耗时间。

专利文件1(日本专利3475476号)揭示了一种解决上述问题的技术的示例。根据所述专利文件1，当在接收电视广播的时候进行频道切换时、当切换多个输入装置时、或当切换信号等级有很大差异的内容时，需预先获取有关频道间等级差的信息或有关切换的信息。此后，根据所述专利文件1，基于所述预先获得的有关频道间等级差的信息或有关切换的信息来进行音量的校正。

作为解决上述问题的音量校正方法的另一种示例，基于自动增益控制(AGC)(可称为AGC方法)的音量控制方法广为人知。

图38是表示采用AGC方法的音量校正部的配置示例的框图。在图38所示的示例中，对左右两个声道的输入音频信号SiL与SiR进行音量校正。

即，在该示例中，将左右两个声道的输入音频信号SiL与SiR提供给可变增益放大器1L与1R，基于增益控制信号对可变增益放大器1L与1R的增益进行变化或者控制。

由加法器2将左右两个声道的输入音频信号SiL与SiR彼此相加。来自加法器2的相加输出信号通过放大器3使增益减半，并随后提供给平均等级检测单元4，且由平均等级检测单元4检测相加输出信号的平均等级。

将由平均等级检测单元4检测到的平均等级提供给增益控制信号发生单元5。增益控制信号发生单元5对来自平均等级检测单元4的平均等级与预定的基准等级进行比较，比较结果用来产生增益控制信号，根据该增益控制信号使信号等级之间的差为零。然后，该增益控制信号被提供给可变增益放大器1L与1R。

可变增益放大器1L与1R的增益随着来自增益控制信号发生单元5的增益控制信号而变化或者被控制。这种情况下，通过对提供给左右两个声道的输入音频信号SiL与SiR的增益进行控制，从而使来自加法器2的相加输出信号的平均等级等于可变增益放大器1L与1R的基准等级。

因此，自动校正从可变增益放大器1L与1R获得的左右两个声道的输出音频信号SoL与SoR以表示特定的音量等级。即，若该输出音频信号表示小音量，则将该音量调大。若该输出音频信号表示大音量，将该音量调小。从而，不会输出大声音，而使听不见的小声音变得听得见。

除了所述基于AGC的音量校正方法，还提出了各种音量校正方法。例如，专利文件2(日本专利3321820号)已经公开了一种方法，该方法是：包括压缩器，当输入高等级音频信号时，通过将该输出音频信号的等级控制为小于输入等级，以将音量控制在特定范围之内。

发明内容

上述问题不仅发生在表示切换多个输入装置和接收频道之前和之后获得的不同内容的信号具有等级差之时，也发生在接收同一内容之时。

具体地，例如，即使是接收相同的广播频道或广播节目，输出音量也会在广告部分(CM)中变化或者随着场景之间的变化而变化，从而令人感觉不舒服。

根据上述采用AGC方法实现的音量控制，甚至于相同内容的音量也可以通过将代表该内容的整个音频信号的平均等级作为基准加以控制。输出音量将保持恒定。然而，现有的采用AGC方法实现的音量控制面临着下述问题。

具体地，现有的采用AGC方法实现的音量控制是这样的，利用专为检测而指定的预定时间常数来检测整个音频信号的平均等级，所述检测到的平均等级被用于对整个音频信号实施音量控制。

当将用于检测音频信号的平均等级的时间常数设为小值时，通过迅速应对音频信号的输出音量的变化可以保持输出音量的恒定。从而，例如，在广告部分的超前时刻，在场景变化之时或在等级差显著的时刻，使输出音量的变化为零，以保持输出音量的恒定。

然而，当通过将用于检测平均等级的时间常数设置为小值而迅速应对音频信号的平均等级的变化以实施音量控制时，由于始终跟随等级的变化，即使是在稳态音频区间期间也可能出现声音的抖动。

相反，当将用于检测音频信号的平均等级的时间常数设为大值时，由于不会跟随该音频信号等级的瞬间变化，所以可以避免在稳态音频区间期间的声音抖动。从而，可以对音量进行控制使人听着舒服。

然而，这种情况下，会发生以下问题：在切换多个输入设备或接收频道之时，在广告部分的超前时刻或在场景改变的时刻，对这种情况下发生的大的等级差变化的响应会恶化。

因而，需要一种能在出现大的等级差的音频区间内，例如在切换频道或出现广告部分的超前时刻，以及在稳态音频区间内实施令人满意的音量控制的装置和方法。

根据本发明的一个实施例，提供一种音量校正装置，其包括：

可变增益装置，其用于根据增益控制信号控制提供给输入音频信号的增益；

连续相关声音区间检测装置，其用于检测输入音频信号中的连续相关声音区间，在所述连续相关声音区间中存在在一组短暂相邻的连续相关声音；

平均等级检测装置，其用于检测在由连续相关声音区间检测装置检测到的连续相关声音区间期间获得的输入音频信号的平均等级，平均等级检测装置的用于平均等级检测的时间常数在开始于连续相关声音区间的超前时刻的特定时段内比在连续相关声音区间的剩余时段内设为更小的值；以及，

增益控制信号发生装置，其用于产生增益控制信号，并将产生的增益控制信号提供给可变增益装置，其中，根据该增益控制信号对提供给输入音频信号的增益进行控制，从而使由平均等级检测装置检测到的平均等级等于基准等级。

根据本发明的一个实施例，连续相关声音区间检测装置检测输入音频信号中的连续相关声音区间，在该连续相关声音区间中存在一组短暂相邻的连续相关声音。平均等级检测装置检测在连续相关声音区间期间的输入音频信号的平均等级。用于平均等级检测的时间常数在开始于连续相关声音区间的超前时刻的特定时段内比在连续相关声音区间的剩余时段内设为更小的值。

因此，在开始于连续相关声音区间的超前时刻的特定时段内，平均等级检测装置检测输入音频信号的平均等级以迅速应对音频信号等级的变化。在开始于连续相关声音区间的超前时刻的特定时段之后的稳态音频区间期间，平均等级检测设备检测输入音频信号的平均等级，而不会跟随音频信号等级的瞬间变化。

综上所述，基于由平均等级检测装置检测到的平均等级，增益控制信号发生装置产生增益控制信号，其中，根据增益控制信号控制对提供给输入音频信号的进行增益，并将产生的增益控制信号提供给可变增益装置。

因此，在开始于可能出现大等级差的连续相关声音区间的超前时刻的特定时段期间，该可变增益装置对输入音频信号进行增益控制以迅速抑制该大等级差。因此，即使在每个连续相关信号区间的超前时刻，相邻的连续相关信号区间之间的等级差也得到快速校正。

在开始于连续相关声音区间的超前时刻的特定时段之后并且音频信号的等级发生稳定的变化的区间内，该可变增益装置不跟随音频信号等级的瞬间变化，而是通过控制提供给该输入音频信号的增益以使该音频信号的平均等级保持恒定。因此，可以避免在稳态音频区间期间出现声音抖动。

根据本发明的一个实施例，在出现大等级差的音频区间内，比如，在切换频道或广告部分的超前时刻来临时，以及在稳态音频区间内可以实现令人满意的音量控制。

根据本发明的另一个实施例，在根据所述一个实施例的音量校正装置中，在开始于连续相关声音区间的超前时刻的特定时段期间，平均等级检测装置对由该平均等级检测装置检测到的平均等级与该输入音频信号的平均等级进行比较，并根据比较结果改变在该特定时段期间指定的用于平均等级检测的时间常数。

在本发明的另一个实施例中，在开始于连续相关声音区间的超前时刻的特定时段期间，将在连续相关声音区间期间获得的输入音频信号的平均等级与由平均等级检测装置检测到的在上一个所述连续相关声音区间期间获得的该输入音频信号的平均等级进行比较。基于该比较结果，来改变或控制在开始于连续相关声音区间的超前时刻的特定时段内指定的用于检测平均等级的时间常数。

例如，和旨在降低音量的增益校正相比，为了加快旨在提高音量的增益校正，当该输入音频信号的平均等级高于在上一个连续相关声音区间期间获得的该输入音频信号的平均等级时，则减小在特定时段内指定的用于检测平均等级的时间常数。从而，音量校正可如此地实现：相对于上一个所述连续相关声音区间的等级差能够得到令人满意的补偿，并能抑制因等级变化而引起的抖动。

根据本发明的又一个实施例，提供一种音量校正装置，其包括：

连续相关声音区间检测装置，其用于检测输入音频信号中的连续相关声音区间，在该连续相关声音区间中存在一组短暂相邻的连续相关声音；

语音区间检测装置，其用于检测语音区间，该语音区间是一个在所述输入音频信号包含代表人声的音频信号的时间区间；

语音平均等级检测装置，其用于检测在由该语音区间检测装置检测到的语音区间期间获得的该输入音频信号的平均等级，该语音平均等级检测装置的用于检测平均等级的时间常数在开始于所述连续相关声音区间的超前时刻的特定时段内比所述连续相关声音区间的剩余时段内设为更小的值；以及，

增益控制信号发生装置，其用于产生增益控制信号，并将产生的增益控制信号提供给该可变增益装置，其中，根据该增益控制信号对提供给该输入音频信号的增益进行控制，从而使由该语音平均等级检测装置检测到的平均等级等于基准等级。

根据本发明的又一个实施例，该语音平均等级检测装置检测该输入音频信号的平均等级，即，仅检测在语音区间检测装置检测到的时间区间内以及在该输入音频信号中包含代表人声的音频信号的时间区间内的语音平均等级。

因此，提供了与所述一个实施例相同的优点。此外，由于将人声的音量校正到具有特定的等级，所以使得言语等听起来变得舒服。

根据本发明的再一个实施例，在根据所述又一个实施例的音量校正装置中，在开始于连续相关声音区间的超前时刻的特定时段期间，该语音平均等级检测装置对由该语音平均等级检测装置检测到的平均等级与在语音区间期间获得的该输入音频信号的平均等级进行比较，并根据该比较结果改变在特定时段期间指定的用于平均等级检测的时间常数。

根据本发明的所述再一个实施例，与本发明的所述另一个实施例相似，通过实施音量控制，相对于上一个连续相关声音区间的等级差得到满意的补偿，并抑制了因语调而引起的抖动。

根据本发明的进一步的实施例，提供一种音量校正装置，其包括：

语音平均等级检测装置，其用于检测在由语音区间检测装置检测到的语音区间期间获得的输入音频信号的平均等级，该语音平均等级检测装置的用于检测平均等级的时间常数在开始于所述连续相关声音区间的超前时刻的特定时段内比所述连续相关声音区间的剩余时段内设为更小的值；以及，

非语音平均等级检测装置，其用于检测输入音频信号中包含的表示除了人声和静音之外的其他声音的音频信号的平均等级；

增益控制信号发生装置，其用于当由所述非语音平均等级检测装置检测到的非语音平均等级不高于由所述语音平均等级检测装置检测到的语音平均等级一个特定大小时产生增益控制信号，其中，根据该增益控制信号控制对提供给所述输入音频信号的增益进行控制，从而使由所述语音平均等级检测装置检测到的语音平均等级等于基准等级，而当由所述非语音平均等级检测装置检测到的非语音平均等级高于由所述语音平均等级检测装置检测到的语音平均等级一个特定大小时，所述增益控制信号发生装置产生增益控制信号，其中，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使由所述非语音平均等级检测装置检测到的非语音平均等级等于所述基准等级，并将所产生的增益控制信号提供给所述可变增益装置。

根据本发明的所述进一步的实施例，当输入除语音外的大声音时，通过实现音量校正以迅速降低音频信号的等级，从而校正该音量。

根据本发明的各个实施例，在出现大等级差的音频区间期间，比如，在切换频道或广告部分的超前时刻来临时，以及在稳态音频区间期间可以对输入音频信号进行令人满意的音量控制。

附图说明

图1是表示根据本发明的第一实施例的音量校正装置的配置示例的框图；

图2是表示采用了根据本发明的实施例的音量校正装置的电子设备的示例的框图；

图3是表示图1中所示的实施例中采用的连续相关声音区间检测模块的配置示例的框图；

图4是用于描述具有图3所示配置的连续相关声音区间检测模块中执行的动作的时序图的示意图；

图5是表示图1所示的实施例中采用的连续相关声音区间检测模块的另一种配置示例的框图；

图6是用于描述具有图5所示配置的连续相关声音区间检测模块中执行的动作的时序图的示意图；

图7是表示图1所示的实施例中采用的超前连续相关声音时段检测模块的配置示例的框图；

图8是用于描述图1所示的实施例中采用的平均等级发生模块的配置示例的框图；

图9是用于描述根据本发明的第一实施例的音量校正装置的时序图的示意图；

图10是表示根据本发明的第二实施例的音量校正装置的主要部分的配置示例的框图；

图11是表示根据本发明的第二实施例的音量校正装置的时序图；

图12是表示根据本发明的第三实施例的音量校正装置的配置示例的框图；

图13是表示根据本发明的第三实施例的音量校正装置的部分配置示例的详细配置示例的框图；

图14是根据本发明的第三实施例的音量校正装置的部分配置示例的详细配置示例的框图；

图15是表示在图14所示的配置中执行的处理动作的示意图；

图16A和16B是表示图13所示的部分配置的示意图；

图17是表示图13所示的部分配置的示意图；

图18是表示图13所示的部分配置的详细配置示例的框图；

图19A和19B是表示图18所示的配置的示意图；

图20是表示图18所示的配置的示意图；

图21是表示图18所示的配置的示意图；

图22是表示图18所示的配置的示意图；

图23是表示图18所示的配置的示意图；

图24是表示图18所示的配置的示意图；

图25是表示在图18所示的配置中执行的处理动作的波形图；

图26是表示本发明的第三实施例中采用的超前连续相关声音时段检测模块的配置示例的框图；

图27是表示本发明的第三实施例中采用的语音平均等级发生模块的配置示例的框图；

图28是表示根据本发明的第三实施例的音量校正装置的时序图的示意图；

图29是表示根据本发明的第四实施例的音量校正装置的主要部分的配置示例的框图；

图30是表示根据本发明的第四实施例的音量校正装置的时序图的示意图；

图31是表示根据本发明的第五实施例的音量校正装置的配置示例的框图；

图32是表示本发明的第五实施例中采用的总平均等级发生模块的配置示例的框图；

图33是表示根据本发明的第五实施例的音量校正装置的时序图的示意图；

图34是表示本发明的第五实施例中采用的总平均等级发生模块的配置示例的框图；

图35是采用根据本发明的任意实施例的音量校正装置的电子设备的另一种示例的示意图；

图36是表示根据本发明的另一个实施例的音量校正装置的框图；

图37是表示根据本发明的又一个实施例的音量校正装置的框图；以及，

图38是表示相关技术中的音量校正装置的框图。

具体实施方式

下面，参照附图描述根据本发明的实施例的音量校正装置。在以下描述的实施例中，音量校正装置适用于电视机的音频输出部。

图2是表示电视机的配置示例的框图。图2所示的电视机包括由微型计算机所形成的控制部10。遥控接收部11连接于控制部10。遥控接收部11接收来自遥控发射器12的遥控信号，并将所接收的遥控信号发送给控制部10。控制部10根据所接收的遥控信号进行处理控制。

控制部10将控制信号提供给电视机的各个部件，接收电视广播信号，并且执行用于视频再现以及音频再现的各种处理。

调谐部13从电视广播信号中选择并提取广播频道的信号，该广播频道指定有响应于用户的遥控操作而由控制部10提供的频道选择控制信号。调谐部13对来自于选定并提取出的广播频道的信号中的视频信号以及音频信号进行解调并解码，并将视频信号提供给视频信号处理部14，并将音频信号提供给音频信号处理部15。

视频信号处理部14在控制部10的控制下对视频信号进行预定的处理，并将处理后的视频信号经由显示控制部16提供给例如液晶显示器等显示器17。于是，显示器17上会显示所选定的广播频道的广播节目的图像。

音频信号处理部15在控制部10的控制下对音频信号进行预定的处理。在本实施例中，音频信号处理部15从来自调谐部13的音频信号中产生左右两个声道的音频信号SiL与SiR，并将处理后的音频信号SiL与SiR提供给音量校正部18。

音量校正部18是应用了根据本实施例的音量校正装置的部件。对输入音频信号SiL与SiR进行如下所述的音量校正，并输出为输出音频信号SoL与SoR。将来自音量校正部18的输出音频信号SoL与SoR提供给扬声器19L与19R，从而再现为声音。于是，所选定的频道上的广播节目的声音通过扬声器19L与19R释放出来。

下面以音量校正部18为例描述根据本实施例的音量校正装置。

第一实施例

图1是表示作为根据本发明的第一实施方式的音量校正装置的音量校正部18的整体配置的框图。

如图1所示，即使是在本实施例中，将左右两个声道的输入音频信号SiL与SiR提供给可变增益放大器21L与21R，根据增益控制信号对可变增益放大器21L与21R的增益进行变化或者控制。

将左右两个声道的输入音频信号SiL与SiR提供给平均等级检测单元22。如下所述，检测在连续相关声音区间期间所获得的整个音频信号的平均等级，所述整个音频信号是左右两个声道的输入音频信号SiL与SiR相加得到的信号。

在输入音频信号SiL与SiR相加得到的信号中，称为连续相关声音区间的是这样一个区间，即在该区间中存在音频信号。若连续相关声音区间包括多个区间，该多个区间为一组短暂相邻并彼此相关的音频信号区间。

例如，就电视广播节目而言，作为与场景相关的音频区间的场景关联音频区间被视为连续相关声音区间。声音与视频场景关联。当场景变化时，会产生比较长的静音区间。在一场景中，即使所述静音区间只是一段短暂的时间，音频信号存在区间会短暂地与该静音区间相邻。

在本实施例中，一个或多个短暂相邻的音频信号存在区间被认为是与一个场景相关的区间(场景关联音频区间)或互相关音频区间，并被视为连续相关声音区间。

若是电视广播节目，在播放广告的时间之前通常会产生比较长的静音区间。因此，开始播放广告的时间与连续相关声音区间的超前时刻相关联。

当切换频道时，由于输入音频信号中会产生静音区间，频道切换时间被视为连续相关声音区间的断点。

平均等级检测单元22检测在时域上离散地产生的每一个连续相关声音区间期间的音频信号的平均等级。在连续相关声音区间之间的静音区间期间，平均等级检测单元22保持在刚刚在前的连续相关声音区间期间所检测到的平均等级。从而，平均等级检测单元22检测输入音频信号的总平均等级。

如下所述，本实施例中包括的平均等级检测单元22具有用于检测平均等级的时间常数，该时间常数在开始于连续相关声音区间的超前时刻的特定时段内设为更小值，从而可以迅速检测到输入音频信号的平均等级。因此，短暂相邻的连续相关声音区间之间的等级差可以得到迅速补偿。

进一步地，本实施例中采用的平均等级检测单元22设有用于检测平均等级的时间常数，该时间常数在开始于连续相关声音区间的超前时刻的特定时段之后而不在该特定时段期间的剩余时段内设为更大值，从而不会跟随音频信号等级的瞬间变化。

将由平均等级检测单元22检测到的平均等级提供给增益控制信号发生单元23。该增益控制信号发生单元23对由平均等级检测单元22检测到的音频信号的平均等级与预定基准等级进行比较，并根据比较结果产生增益控制信号，该增益控制信号使平均等级之间的差异为零。该增益控制信号发生单元23将产生的增益控制信号提供给可变增益放大器21L与21R。

该可变增益放大器21L与21R自身具有随着来自增益控制信号发生单元23的增益控制信号而变化或者进行控制的增益。这种情况下，可变增益放大器21L与21R对提供给左右两个声道的输入音频信号SiL与SiR的增益进行控制，从而使在连续相关声音区间期间获得的左右两个声道的输入音频信号SiL与SiR的相加信号的平均等级等于基准等级。

如上所述，将由平均等级检测单元22在连续相关声音区间期间检测到的音频信号平均等级作为基准，对可变增益放大器21L和21R的输出进行自动音量控制。

扬声器19L与19R接收来自可变增益放大器21L与21R的左右两个声道的输出音频信号SoL与SoR从而再现声音。这种情况下，在产生大的等级差的音频区间期间，比如在切换频道或再现广告部分的前导部分期间，以及在稳态音频区间期间，该再现声音的音量会得到令人满意的控制。

在本实施例中，如图1所示配置平均等级检测单元22。

首先，利用加法器31将左右两个声道的输入音频信号SiL与SiR相加。来自加法器31的相加输出信号通过放大器32使增益减半。将来自放大器32的相加输出信号Sm提供给包络检测模块33。该包络检测模块33检测用于表示该相加输出信号Sm的波形的包络，并输出包络信号Semv。将表示由包络检测模块33检测到的相加输出信号Sm的包络的包络信号Semv提供给平均等级发生模块36。

将来自放大器32的相加输出信号Sm提供给连续相关声音区间检测模块34。如图3所示，连续相关声音区间检测模块34包括：音频信号存在/不存在检测模块341和检测结果延伸模块342。该检测结果延伸模块342产生表示音频信号存在区间的信号，其中该音频信号存在区间是由来自音频信号存在/不存在检测模块341的检测输出信号来表示的，并通过将音频信号存在区间的终止时刻延迟特定的时段来延伸该音频信号存在区间。

[连续相关声音区间检测模块34的配置示例]

图3表示连续相关声音区间检测模块34的基本配置示例。音频信号存在/不存在检测模块341包括：基准等级发生器3411和比较器3412。该比较器3412将来自放大器32的相加输出信号Sm(参见图4(A))与来自基准等级发生器3411的基准阈值等级θc(参见图4(A))进行比较。

该比较器3412输出检测输出Cmp(参见图4(B))至该检测结果延伸模块342，当相加输出信号Sm大于基准阈值等级θc时，该检测输出Cmp表示为1，当相加输出信号Sm小于基准阈值等级θc时，该检测输出Cmp表示为0。换句话说，在音频信号存在区间期间，将来自比较器3412的音频信号存在/不存在检测输出Cmp设为1，并在音频信号不存在区间(非信号区间)期间设为0。将该比较器3412的检测输出Cmp提供给检测结果延伸模块342。

该检测结果延伸模块342将该检测输出Cmp的下降时刻延迟一个预定的延伸时间DL以延伸该检测输出的时长。换句话说，该检测结果延伸模块342将由检测输出Cmp表示的音频信号存在区间，也就是将设为“1”的区间延迟一个预定的延伸时间DL。

因此，该音频信号存在/不存在检测模块341的检测输出Cmp为0的区间短于该预定延伸时间DL。如图4(C)所示，相邻的音频信号存在区间，也就是设为“1”的区间几乎连接在一起。当该音频信号存在/不存在检测模块341的检测输出Cmp为0的区间长于该预定延伸时间DL时，如图4(C)所示，该检测结果延伸模块342的输出下降至0。

当音频信号存在区间之间的时间短于该延伸时间DL时，将所述区间内的音频信号所表示的声音检测为一组相互关联的连续相关声音。该检测结果延伸模块342的输出为指示连续相关声音区间的连续相关声音区间检测标记SFLG(参见图4(C))。

为该检测结果延伸模块342所指定的该延伸时间DL被设置为一定的时间长度，该时间长度使得可能以固定的方式例如将场景关联音频区间预先识别为连续相关声音区间。通过调节该延伸时间DL，可以调节被检测为连续相关声音区间的音频区间。

在图3所示的示例中，具有重要意义的是将用于检测相加输出信号Sm中的音频信号存在区间的基准阈值等级θc设置为何值。如果该基准阈值等级θc的值设得太小，甚至不是音频信号的噪音也会被检测为音频信号。如果该基准阈值等级θc的值设得太大，就不能恰当地检测音频信号的存在或不存在。

在本实施例中，随着音频信号等级的变化而动态变化的阈值等级θd取代了被设定为固定值的阈值等级θc。因此，可以恰当地检测音频信号的存在或不存在。

图5表示当采用动态变化的阈值等级θd时所采用的连续相关声音区间检测模块34的配置示例。

如图5所示，连续相关声音区间检测模块34的音频信号存在/不存在检测模块341包括：第一平均等级检测器3413、第二平均等级检测器3414、衰减器3415和比较器3416。检测结果延伸模块342的配置和将音频信号存在/不存在检测输出从该音频信号存在/不存在检测模块341提供给该检测结果延伸模块342的路径都与图3所示示例中的配置和路径相同。

下面参见图6描述在具有图5所示的配置的音频信号存在/不存在检测模块341中进行的音频信号存在/不存在检测动作。

第一平均等级检测器3413在成功地跟随等级变化的同时检测相加输出信号Sm(参见图6(A))的平均等级，该输出信号Sm是第一平均等级检测器3413的输入信号，并且该第一平均等级检测器3413自身具有用于检测平均等级的时间常数，该时间常数被设置为小值。

第二平均等级检测器3414检测相加输出信号Sm的平均等级以指定阈值等级θd，该阈值等级θd随着相加输出信号Sm的等级的变化而变化，并且该第二平均等级检测器3414自身具有用于检测平均等级的时间常数，该时间常数被设置为大值。

将由该第一平均等级检测器3413检测到的相加输出信号Sm的平均等级Avr(参见图6(B))提供给比较器3416。利用衰减器3415来降低由该第二平均等级检测器3414检测到的相加输出信号Sm的平均等级，并将该降低后的平均等级作为阈值等级θd(参见图6(C))提供给比较器3416。

比较器3416将相加输出信号Sm的平均等级Avr超过了阈值等级θd的时段检测为音频信号存在区间，并输出在该音频信号存在区间期间被设置为1的检测输出Cmp(参见图6(D)。

将来自该比较器3416的检测输出Cmp提供给检测结果延伸模块342。该检测结果延伸模块342输出连续相关声音区间检测标记SFLG(参见图6(E))，连续相关声音区间检测标记SFLG指示当来自比较器3416的检测输出表示为1并被延伸一个延伸时间DL的区间。

如上所述，将连续相关声音区间检测模块34输出的该连续相关声音区间检测标记SFLG提供给平均等级发生模块36，同样提供给超前连续相关声音时段检测模块35。

超前连续相关声音时段检测模块35产生并输出超前时段检测标记HD，该超前时段检测标记HD指示在由连续相关声音区间检测模块34检测到的连续相关声音区间的超前时刻起始的预定时间长度的时段。

[超前连续相关声音时段检测模块35的配置示例]

在本实施例中，该超前连续相关声音时段检测模块35的配置如图7所示。即，该超前连续相关声音时段检测模块35包括：计数器351、比较器352和基准计数值发生器353。

将来自图中未标出的时钟发生器的时钟信号CLK提供给计数器351的时钟端。将来自连续相关声音区间检测模块34的连续相关声音区间检测标记SFLG提供给该计数器351的使能端EN，同样提供给该计数器351的重置端RS。

相应地，在连续相关声音区间检测标记SFLG设置为1的连续相关声音区间期间，该计数器351对时钟信号CLK的周期的重复次数进行计数。该计数值随着连续相关声音区间检测标记SFLG的下降而被重置。

将计数器351的计数值输出CNT提供给比较器352。同时也将来自基准计数值发生器353的基准计数值提供给该比较器352。

该比较器352将该计数值输出CNT与基准计数值进行比较，产生并输出超前时段检测标记HD，在当计数器351的计数值输出CNT达到该基准计数值的期间，该超前时段检测标记HD被设置为1，在随后的时段里被重置为0。换句话说，该超前时段检测标记HD是一种仅在开始于连续相关声音区间的超前时刻的特定时段内被设置为1的信号。

因此，从该超前连续相关声音时段检测模块35中获得仅在开始于连续相关声音区间的超前时刻的特定时段内被设置为1的超前时段检测标记HD。将该超前时段检测标记HD提供给平均等级发生模块36。

在连续相关声音区间检测标记SFLG被设置为1的连续相关声音区间中，平均等级发生模块36利用来自包络检测模块31的包络信号来检测相加输出信号Sm的平均等级。

在由平均等级发生模块36实施的平均等级检测中，在开始于连续相关声音区间的超前时刻并由超前时段检测标记HD所指示的特定时段期间，用于检测平均等级的时间常数被设置为小值，从而使平均等级发生模块36能迅速跟随相加输出信号Sm的平均等级的变化。在除了开始于连续相关声音区间的超前时刻的特定时段之外的时段，平均等级发生模块36的用于检测平均等级的时间常数被设置为大值，以避免平均等级发生模块36跟随音频信号的瞬间变化。

在上一个和后一个连续相关声音区间之间的时间(静音区间)内，平均等级发生模块36保持在上一个连续相关声音区间中检测到的平均等级。

[平均等级发生模块36的配置示例]

图8表示执行上述处理动作的平均等级发生模块36的配置示例。即，本实施例中所采用的平均等级发生模块36包括：选择器361、积分器362和积分时间常数变化控制器363。

将来自包络检测模块33的包络信号Semv提供给选择器361的输入端之一，将连续相关声音区间检测标记SFLG作为选择信号提供给选择器361。选择器361的输出信号提供给积分器362。积分器362的输出信号被提供给选择器361的其他输入端，并被输出为平均等级发生模块36的输出信号Vavr1。

该积分器362在积分结果上加上输入信号以获得该输入信号的积分，于是检测该输入信号的平均等级。这种情况下，无论该积分输出增加或减少，该积分器362的积分输出都不会超过该输入信号的等级。由该积分器362执行的积分算术表达式如下：

Y_t＝1/N(Y_(t-1)×(N-1)+X_t)

＝Y_(t-1)×(N-1)/N+X_t×1/N...(1)

其中，Y_t是用于当前采样X_t的积分输出，Y_(t-1)是立即在前的积分输出，X_t是输入采样。下标t是分配给依次输入的每个输入采样的采样号。

在表达式(1)中，当立即在前的积分输出Y_(t-1)和输入采样X_t的值相同时，等式Y_t＝Y_(t-1)成立。即，无论积分结果增加或减少，该积分结果不会超过该输入采样的值。

在表达式(1)中，N是积分时间常数。该积分时间常数N是本实施例中用于平均等级检测的时间常数的一种示例。这种情况下，当积分时间常数N为大值时，新的输入采样对先前的积分结果的反作用是有限的。积分进行得很舒缓。这意味着输入信号的瞬间变化未被跟随。

当积分时间常数N为小值时，新的输入采样对积分结果有很大的影响。因此积分进行得迅速，积分输出对输入信号的变化作出迅速反映。

在图8所示的示例中，利用来自积分时间常数变化控制器363的控制信号来改变或控制该积分器362的积分时间常数。具体地，将超前时段检测标记HD提供给积分时间常数变化控制器363。在开始于连续相关声音区间的超前时刻并且该超前时段检测标记HD被设置为1的特定时段内，该积分器362的积分时间常数被设置为小值，比如，N＝100。

在开始于连续相关声音区间的超前时刻并且该超前时段检测标记HD被重置为0的特定时段之后的时段，该积分时间常数变化控制器363将该积分器362的积分时间常数设为大值，比如，N＝1000。

基于连续相关声音区间检测标记SFLG，选择器361在连续相关声音区间期间选择来自包络检测模块33的包络信号Semv，并将此包络信号提供给积分器362。

在连续相关声音区间期间，积分器362对来自包络检测模块33的包络信号Semv进行积分，并产生表示该包络信号的平均等级的信号。

这种情况下，在开始于连续相关声音区间的超前时刻的特定时段内，由于积分时间常数为小值，该积分器362执行积分，从而使该积分器的输出可以迅速达到该包络信号Semv的等级。在开始于连续相关声音区间的超前时刻的特定时段之后的时段，由于积分时间常数为大值，该积分器362执行积分，从而使该积分器的输出可以舒缓地达到该包络信号Semv的等级。

在除了连续相关声音区间之外的区间中，选择器361选择该积分器362的输出信号，并将该输出信号提供给积分器362。因此，在除了连续相关声音区间之外的区间中，积分器362维持(保持)其自身的输出信号的等级。

如上所述，该积分器362提供了表示在离散的连续相关声音区间内获得的平均等级的平均等级输出Vavr1。

紧接着，下面参照图9描述平均等级检测单元22中执行的处理动作。

假设来自放大器32的相加输出信号Sm比如是图9(A)所示的波，那么来自包络检测模块33的包络信号Semv便是图9(I)所示的波。

在图9(A)所示的相加输出信号Sm中，短暂相邻的音频信号存在区间被连续相关声音区间检测模块34检测出。由此产生图9(B)所示的连续相关声音区间检测标记SFLG。

当连续相关声音区间开始时，超前连续相关声音时段检测模块35中所包括的计数器351开始对时钟信号CLK的周期的重复次数进行计数。如图9(C)所示，计数值CNT逐渐增加。该超前连续相关声音时段检测模块35检测开始于连续相关声音区间的超前时刻并终止于计数值CNT达到计数值阈值的时刻的特定时段，并输出如图9(D)所示的指示特定时段的超前时段检测标记HD。

平均等级发生模块36接收来自包络检测模块33的包络信号Semv、连续相关声音区间检测标记SFLG和超前时段检测标记HD，并执行上述积分动作。

这种情况下，在平均等级发生模块36中，相邻连续相关声音区间之间的时段为连续相关声音区间检测标记SFLG被重置为0的区间，该区间被认为是保持时段，在该保持时段中，积分器362的积分输出被保持，并用如图9(E)所示的粗线标示。

在平均等级发生模块36中，超前时段检测标记HD被设置为1的连续相关声音区间的超前时段被认为是第一时间常数时段，在该第一时间常数时段中，将该积分器362的积分时间常数设为小值，并用如图9(F)所示的粗线标示。

在平均等级发生模块36中，在连续相关声音区间内，由超前时段检测标记HD表示的超前时段之外的时段被认为是第二时间常数时段，在该第二时间常数时段中，将该积分器362的积分时间常数设为大值，并如图9(G)所示的粗线标示。

平均等级发生模块36获取连续的平均等级输出Vavr1(参见图9(H))，作为表示在每一个连续相关声音区间期间获得的音频信号的平均等级的平均等级检测输出。

将平均等级输出Vavr1提供给增益控制信号发生单元23。

该增益控制信号发生单元23对来自平均等级检测单元22的语音平均等级信号Vavr与预定基准等级进行比较，并根据比较结果产生使等级间的差异为零的增益控制信号。

将由增益控制信号发生单元23产生的增益控制信号提供给可变增益放大器21L与21R。根据该增益控制信号对可变增益放大器21L与21R自身的增益进行控制，从而使输入音频信号SiL与SiR的平均等级与基准等级相等。因此，对由可变增益放大器21L与21R提供的增益进行控制，从而使输出音频信号SoL与SoR基本保持恒定。

如上所产生的平均等级发生模块36的输出信号Vavr表示在每一个连续相关声音区间中获得的音频信号的平均等级。在连续相关声音区间的超前部分期间，输出信号Vavr迅速跟随输入音频信号的平均等级，这意味着，通过执行音量控制以使在连续相关声音区间内发生的音频信号的等级变化为零。

在连续相关声音区间的超前部分之后的时段内，由于用于检测平均等级的时间常数(上述示例中的积分时间常数)被设置为大值，发生在连续相关声音区间中的语音的瞬间变化未被跟随，并发出了令人听着舒服的输出声音。

在以上描述中，平均等级发生模块36通过对来自包络检测模块33的包络信号Semv进行积分来检测相加输出信号Sm的平均等级。然而，在第一实施例中，可不提供包络检测模块33，但平均等级发生模块36可以接收该相加输出信号Sm并通过积分检测平均等级。

第二实施例

第二实施例是上述第一实施例的一种变化。在第一实施例中，在连续相关声音区间的超前时段中所采用的用于检测平均等级的时间常数仅包括一种时间常数。在第二实施例中，在连续相关声音区间的超前时段中采用的用于检测平均等级的时间常数根据在后一个连续相关声音区间中检测到的平均等级是否高于或低于在前一个连续相关声音区间中检测到的平均等级而有所不同。

例如，当音频信号的等级突然增加，若实施音量控制以迅速抑制该增加时，在等级变化时刻会出现声音抖动，该声音抖动恐怕会引起不舒服的感觉。当在后一个连续相关声音区间内获得的平均等级变高时，用于检测平均等级的时间常数的值比当在后一个连续相关声音区间内获得的平均等级变低时采用的值大。这目的是为了减缓积分。

相反，当音频信号的等级变得比在前一个连续相关声音区间内获得的等级低时，若信号等级增加过快，会出现缺陷。为了补偿该缺陷，用于检测平均等级的时间常数与在后一个连续相关声音区间中检测到的平均等级是较高或者较低之间成反比关系。换句话说，当在后一个连续相关声音区间中检测到的平均等级较低时，用于检测平均等级的时间常数设为比当在后一个连续相关声音区间内获得的平均等级较高时采用的用于检测平均等级的时间常数大。

可根据广播节目的内容或用户的喜好来决定采用前一种方法或是后一种方法。

下面描述的示例是关于前一种方法的，在该方法中，当音频信号的等级突然增加时，音频输出的等级得以有效保持恒定，无任何缺陷。

第二实施例与第一实施例的不同之处仅在于平均等级发生模块36的配置。图10表示第二实施例中所采用的平均等级发生模块36的配置示例。在第二实施例中，除了平均等级发生模块36之外，平均等级检测单元22的各个部件的配置与第一实施例中的相同。

如图10所示，第二实施例中的平均等级发生模块36包括：选择器361、积分器362、比较器364和积分时间常数变化控制器365。由于选择器361和积分器362具有与如图8所示的第一实施例中的选择器和积分器相同的构造，所以给选择器和积分器赋予相同的附图标记。

在第二实施例中，将包络信号Semv和在本示例中作为积分器362的积分输出的平均等级输出Vavr2提供给比较器364。作为积分器362的积分输出的平均等级输出Vavr2表示在立即在前的连续相关声音区间内获得的平均等级。包络信号Semv为表示在当前连续相关声音区间内获得的平均等级的信号。

因此，该比较器364检测在当前连续相关声音区间内获得的音频信号的平均等级是否高于或低于在上一个连续相关声音区间内获得的音频信号的平均等级。

该比较器364将表示比较器的结果输出至积分时间常数变化控制器365。与第一实施例中的操作相似，也将来自超前连续相关声音时段检测模块35的超前时段检测标记HD提供给该积分时间常数变化控制器365。

当比较器364的比较结果输出指示当前平均等级高于在连续相关声音区间的超前时段处的上一个平均等级时，该积分时间常数变化控制器365将在超前时段内采用的该积分器362的积分时间常数设为大值。当比较器364的比较结果输出指示当前平均等级低于上一个平均等级时，该积分时间常数变化控制器365将在超前时段内采用的该积分器362的积分时间常数设为小值。

其他处理动作与第一实施例中的相同。参照图11所示的时序图，下面描述由第二实施例中平均等级检测单元22执行的处理动作。

图11(A)～(E)与表示第一实施例中采用的信号和标记的图9(A)～(E)相同。如图11(G)所示，在连续相关声音区间的超前时段之外的时段内，与第一实施例中的操作相似(参见图9(G))，用于检测平均等级的时间常数被设置为比在该超前时段(本示例中，更大的积分时间常数)中采用的时间常数更大的值，如比，设置为N＝1000。

在第二实施例中，如图11(H)和(I)所示，比较器364将积分器362的积分输出Vavr2与连续相关声音区间的每一个超前时段Phd1、Phd2和Phd3内的包络信号Semv进行比较。基于比较结果输出，如图11(F)所示，该积分时间常数变化控制器365对在第一时间常数时段(超前时段)内采用的积分器362的时间常数进行控制。

具体地，在图11所示示例中，由于积分输出Vavr2和包络信号Semv在第一超前时段Phd1内彼此相等，该比较器364将指示该事实的比较结果输出提供给积分时间常数变化控制器365。该积分时间常数变化控制器365依次将在连续相关声音区间的超前时段内采用的该积分器362的第一时间常数(积分时间常数)设为大时间常数，比如设为N＝120，该大时间常数是在超前时段内采用的时间常数。

在第二超前时段Phd2内，表示在当前连续相关声音区间内获得的平均等级的包络信号Semv比表示在上一个连续相关声音区间内获得的平均等级的积分输出Vavr2要小。因此，比较器364将指示该事实的比较结果输出提供给积分时间常数变化控制器365。该积分时间常数变化控制器365依次将在连续相关声音区间的超前时段内采用的该积分器362的第一时间常数(积分时间常数)设为小时间常数，比如，N＝80，作为在超前时段内采用的时间常数，该小时间常数是小的。在该第二超前时段Phd2中，该积分器362执行积分动作，从而使其输出能更快地跟随音频信号的等级。即，通过实现音量控制以使小音量增加至特定等级。

在第三超前时段Phd3中，由于包络信号Semv的等级比积分输出Vavr2的等级高，比较器364将指示该事实的比较结果输出提供给该积分时间常数变化控制器365。该积分时间常数变化控制器365依次将在连续相关声音区间的超前时段内采用的该积分器362的第一时间常数(积分时间常数)设为大时间常数，作为在超前时段内采用的时间常数，该大时间常数是很大的。因此，通过实现音量控制，从而将音频信号的高等级抑制到特定等级，而在等级变化时刻不发生声音抖动。

根据第二实施例的音量校正装置，通过实施音量校正，从而使相对于上一个连续相关声音区间的等级差得以迅速补偿，并且因音频信号的等级变化而导致的抖动也得以抑制。

第三实施例

例如，当提到记录于记录介质的电视广播或电影内容，音频信号表示多种多样的声音，例如包括人声、背景音乐(BGM)以及音效等。当用户使用遥控器等手动控制音量时，音频信号的等级通常随着作为基准的表示人声的音频信号成分的信号等级进行调节，从而可以恰当地听见言语。

上述音量校正方法是通过监控整个音频信号的等级来实现音量控制的方法。例如，当以音频信号的平均等级作为基准，基于AGC方法实施音量控制时，对整个音频信号实施音量控制，从而不会释放太大的声音或使听不见的小音量的声音能够听得见。

然而，当人声的音量需要专心致志才能听到时，该人声的音量通常没有保持在特定等级。言语听起来也不舒服。

在下面描述的第三实施例中，对用音频信号成分表示的人声予以关注，获取信号成分的平均等级以使言语等听起来舒服。

图12表示第三实施例中采用的音量控制部18的配置示例的框图。在图12中，与上述第一实施例中相同的部件赋予相同的附图标记。省略重复的描述。

包括与图1所示第一实施例中相同的部件在内，第三实施例还包括语音区间检测模块37，并将第一实施例中的超前连续相关声音时段检测模块35替换为超前连续相关声音时段检测模块38。进一步地，将第一实施例中的平均等级发生模块36替换为语音平均等级发生模块39。

将来自放大器32的相加输出信号Sm提供给包络检测模块33和连续相关声音区间检测模块34，也同样将其提供给语音区间检测模块37。

如下所述，该语音区间检测模块37检测语音区间，该语音区间是来自放大器32的相加输出信号Sm中包含表示人声的音频信号的时段。本实施例中采用的语音区间检测模块37检测语音区间，该语音区间是左右两个声道的每一个输入音频信号SiL和SiR中包含表示人声的音频信号的时段。

在本实施例中，语音区间检测模块37利用人声信号的特征量来检测语音区间。人声信号的特征量有多种类型。本实施例中采用的语音区间检测模块37基于人声信号的多种特征量中的每一种进行语音区间的检测，并计算检测结果的“与”。因此，提高了检测到的语音区间的精度。

语音区间检测模块37产生并输出用于指示检测到的语音区间的语音区间检测标记VFLG。语音区间检测模块37将该语音区间检测标记VFLG提供给超前连续相关声音时段检测模块38，也同样将其提供给语音平均等级发生模块39。

将来自包络检测模块33的包络信号Semv、来自连续相关声音区间检测模块34的连续相关声音区间检测标记SFLG以及来自超前连续相关声音时段检测模块38的超前时段检测标记HD提供该语音平均等级发生模块39。

基本上，语音平均等级发生模块39执行与第一实施例中相同的动作。然而，第三实施例与第一实施例的不同之处在于一点：在连续相关声音区间内，该语音平均等级发生模块39检测占据了由语音区间检测模块37检测到的语音区间的音频信号成分的平均等级，而不检测整个音频信号的平均等级。与上述第一实施例相似，用于检测平均等级的时间常数在开始于连续相关声音区间的超前时刻的特定时段和随后的时段之间变化。

[语音区间检测模块37的配置示例]

如上所述，该语音区间检测模块37标记出人声信号的特征量，并检测语音区间，该语音区间是表示在输入音频信号Sm中包含表示人声的信号成分的时段。在本实施例中，该语音区间检测模块37标记出该人声信号有多种特征量，并基于多种特征量中的每一种进行语音区间的检测。基于作为检测结果的语音区间，该语音区间检测模块37产生并输出语音区间检测标记VFLG。因此提高了检测到的语音区间的精度。

图13表示本实施例中的语音区间检测模块37的配置示例的框图。

本实施例中，该语音区间检测模块37包括三种检测模块：语音周期检测模块40、语音频带集中检测模块50和中央定位检测模块60。三种检测模块40、50和60中的每一种检测人声信号的多个特征量之一，以用于指定语音区间。计算三种检测模块40、50和60的三种检测输出的“与”以提高语音区间检测的精度。下面对该三种检测模块40、50和60进行描述。

<语音周期检测模块40>

人声信号包括多种特征频率成分，人声信号的特征在于其波形的基频成分的波峰被强化，该基频成分决定音高。该波形在一个元音时段内持续。该基频成分的波峰限定出山形的包络，该包络的山脊与元音相关联，并重复出现在同一周期的区间中。因此，检测出输入音频信号的波形的波峰，并检测出被测波峰的周期的连续性。于是，存在语音的区间可以通过低负荷处理很容易地指定。即，将人声信号中的同一波峰周期的连续性用作检测语音区间的一种特征量。于是，可以检测出语音区间。

波峰周期与逐渐上升和逐渐下降的坡度有关。然而，相邻波峰周期之间的差异很小。因此，当在特定的允许范围内检测到相邻波峰周期之间的相同性时，同时当避免了因波峰周期变化引起的反作用时，可以检测到出现人声的语音区间。

相应地，在本实施例中，该语音周期检测模块40包括：波峰周期检测器41、连续相同周期检测器42和频率检测器43。

波峰周期检测器41检测输入音频信号Sm的波峰，并检测该被测波峰的周期。

连续相同周期检测器42判定由波峰周期检测器41检测到的波峰的相邻周期是否彼此相同。如波峰周期彼此相同，将波峰的周期的相同性视作是连续的。这种情况下，只有当波峰的相邻周期为落入语音频带内的相邻波峰周期时，连续相同周期检测器42才判定该相邻波峰周期是否彼此相同。例如，当波峰周期的范围为大约1ms到大约10ms，则判定相邻波峰周期之间存在相同性。

频率检测器43提供该连续相同周期检测器42的被延迟了一个波峰周期的三个或更多输出，并对多个输出作出多数判定。从而，消除了因波峰周期变化而引起的反作用。具体地，当波峰周期变化时，虽然出现变化时刻的一个或多个波峰周期会被该连续相同周期检测器42检测为由该连续相同周期限定的语音区间，但是该一个或多个波峰周期不会被检测为连续相同周期。该频率检测器43防止将该一个或多个周期检测为非连续的，从而获得指示连续相同周期的稳定检测输出。

图14表示语音周期检测模块40的详细配置示例的示意图。该波峰周期检测器41包括：波峰检测器411和周期测量计数器412。连续相同周期检测器42包括：周期比较器421和延迟电路422。

频率检测器43包括两个延迟电路431和432，它们用于将连续相同周期检测器42的输出信号延迟一个波峰周期，还包括多数逻辑电路433。

下面参照图15所示的语音波形图描述语音周期检测模块40中执行的动作。图15(B)表示在图15(A)所示的相加音频信号Sm的成分的持续时间内占据了语音区间的音频信号的波形。在图15(A)中，由等距条纹所指示的区域为人声语音区间，黑色区域为非人声区间。

波峰周期检测器41中的波峰检测器40检测本示例中如图15(A)所示的输入音频信号Sm的正波峰，并输出表示该波峰的检测时刻(被测位置)的波峰检测输出Pk(参见图15(C))。波峰检测器411例如将超过预定阈值的峰值检测为波峰。

将来自波峰检测器411的波峰检测输出Pk提供给该周期测量计数器412。将频率远高于每秒的语音信号的波峰周期的个数的时钟信号CLK提供给该周期测量计数器412。在由波峰检测输出Pk表示的相邻检测时刻之间的时间内，对时钟信号CLK的周期的重复次数进行计数，由此测量波峰周期。因此，该周期测量计数器412将波峰周期输出为时钟信号CLK的周期的重复次数的计数值。

将用作周期测量计数器412的波峰周期检测输出的计数值Tc提供给连续相同周期检测器42。

在该连续相同周期检测器42中，将作为来自周期测量计数器412的波峰周期检测输出的计数值Tc照原样提供给周期比较器421。将计数值Tc通过延迟电路422延迟后，然后提供给周期比较器421。

该延迟电路422构成为锁存器，将波峰检测输出Pk作为时钟提供给该锁存器，该延迟电路422将来自周期测量计数器412的计数值Tc延迟一个波峰周期，并将该计数值提供给周期比较器421。

在本示例中，该周期比较器421首先检查来自周期测量计数器412的计数值Tc是否为与从1ms到10ms的波峰周期相一致的计数值。若该计数值Tc不是与从1ms到10ms的波峰周期相一致的计数值，该周期比较器421不执行周期比较，而是在本示例中将输出CT驱动至低电平(0)。若该计数值Tc是与从1ms到10ms的波峰周期相一致的计数值，该周期比较器421执行如下描述的对相邻的在前和在后波峰周期彼此进行比较的比较操作。

具体地，该周期比较器421对计数值Tcp和计数值Tcb进行比较，其中，计数值Tcp和当前时刻的波峰周期一致并且来自于周期测量计数器412，计数值Tcb与立即在前的波峰周期一致，周期比较器421还判定波峰周期是否彼此相同。不仅当与在前的以及在后的波峰周期一致的计数值Tcp和Tcb彼此相同时，而且当计数值之间的差值小到落在可允许的范围之内时，或换句话说，当该差值如此之小以至于可认为计数值彼此相同时，该周期比较器421判定波峰周期彼此相同。基于语音区间检测所允许的精度，预先定义该用于判定计数值彼此相同的计数值之间所允许的差值。

周期比较器421输出连续相同周期检测标记CT(参见图15(D))。如果判定出和在前的以及在后的波峰周期一致的计数值Tcp和Tcb彼此相同，则将该连续相同周期检测标记CT驱动至高电平(1)。若判定出计数值Tcp和Tcb彼此不同，则将该连续相同周期检测标记CT驱动至低电平(0)。

将该连续相同周期检测标记CT提供给该频率检测器43。如上所示，在本示例中，该频率检测器43包括：两个延迟电路431和432和多数逻辑电路433。

延迟电路431和432构成为锁存器，将该波峰检测输出Pk作为时钟提供给该锁存器，该延迟电路431和432将输入信号延迟一个波峰周期。

延迟电路431接收来自该连续相同周期检测器42的连续相同周期检测标记CT作为输入信号，并输出通过将该连续相同周期检测标记CT延迟一个波峰周期所产生的信号CTd1(参见图15(E))。

延迟电路432接收来自延迟电路431的输出信号CTd1，并输出通过将该输出信号CTd1延迟一个波峰周期所产生的信号CTd2(参见图15(F))。

将该连续相同周期检测标记CT、单波峰周期延迟信号CTd1以及双波峰周期延迟信号CTd2这三种信号提供给该多数逻辑电路433。

该多数逻辑电路433产生并输出语音周期检测标记FLGa(参见图15(G))。当三种信号CT、CTd1和CTd2中的两种处于高电平(1)时，将该语音周期检测标记FLGa设为1。否则，将该语音周期检测标记FLGa重置为0。

根据频率检测器43，即使当连续相同周期检测器42因波峰周期之间的变化而未能将语音区间中的一些波峰周期检测为连续相同周期，也能输出表示覆盖了波峰周期的语音区间的语音周期检测标记FLGa。

如上所示，将通过语音周期检测模块40的检测而产生的该语音周期检测标记FLG提供给与门370。

在上述实施例中，频率检测器43利用两个延迟电路来对彼此相差一个波峰周期的三种信号进行多数判定。或者，该频率检测器43可利用三个或更多延迟电路来进行多数判定。这种情况下，该多数判定可能不再是个简单的多数判定，而是指定一个阈值，并对超过该阈值的信号进行多数判定。例如，可利用四个延迟电路来对彼此相差一个波峰周期的五种信号进行多数判定。这种情况下，只有当四个以上信号表示为1，而不是三个以上信号表示为1时，才能将该语音周期检测标记FLGa设为1。

在上述示例中，该语音周期检测模块40检测语音波的正波峰。或者，可检测负波峰，也可检测正负两种波峰。可使用正负波峰的“或”。

<语音频带集中检测模块50>

表示元音的人声信号的主要成分所在的频带通常为范围在100Hz到1KHz之间的中频带。因此，存在人声的区间可通过检测范围在100Hz到1KHz之间的频带中的信号成分大于其他成分的时段而进行指定。换句话说，表示元音的人声信号的主要成分的频带可用作检测语音区间的特征量以检测语音区间。

包含很多表示除人声之外的背景噪声和猝发声的频率成分的信号被排除。在本实施例中，采用覆盖元音的频带作为人声的频带。表示辅音的频率成分被排除。这是因为表示元音的信号等级被从主观上认为是人声的音量。

在本实施例中，如图13所示，该语音频带集中检测模块50包括：带通滤波器(BPF)51、带阻滤波器(BEF)52、平均等级检测器53和54、放大器55和比较器56。

如图16A所示，在本示例中，该带通滤波器51为具有如下通过特性的滤波器，该通过特性是指该带通滤波器将频带范围处于100Hz～1kHz并且人声也落在其中的频带提供为通带。如图16B所示，该带阻滤波器52为具有如下通过特性的滤波器，该通过特性是指该带阻滤波器将频带范围处于100Hz～1kHz并且人声也落在其中的频带作为非通带。即，该带阻滤波器52是将人声没有落入的频带作为通带的滤波器。

将来自放大器的左右两个声道的输入音频信号SiL和SiR的相加输出信号Sm提供给带通滤波器51和带阻滤波器52。

该带通滤波器51对来自相加输出信号Sm的信号成分进行采样，该信号成分落在人声所在的频带内，并且大于等于100Hz且小于等于1kHz。将该信号成分提供给平均等级检测器53。平均等级检测器53检测落在大于等于100Hz且小于等于1KHz的频带中的相加输出信号Sm的信号成分的平均等级。表示检测到的平均等级的平均等级信号BPFavr(参见图17中的实线所示的波)从平均等级检测器53输出。

该带阻滤波器52对来自相加输出信号Sm的信号成分进行采样，该信号成分落在小于等于100Hz且大于等于1KHz的频带中且不覆盖人声，并将该信号成分提供给平均等级检测器54。平均等级检测器54检测落在小于等于100Hz且大于等于1KHz的频带中且不覆盖人声的相加输出信号Sm的信号成分的平均等级。表示检测到的平均等级的平均等级信号BEFavr(参见图17中的虚线所示的波)从平均等级检测器54输出。

将来自平均等级检测器53的平均等级信号BPFavr照原样提供给比较器56，同时将来自平均等级检测器54的平均等级信号BEFavr通过放大器55加权后提供给比较器56。在此，放大器55提供的权重与语音区间检测中的精度有关。在本示例中，放大器55提供的权重越大，检测为语音区间的区间越短。也可对平均等级检测器53的输出BPFavr进行加权。

当主要覆盖了语音的频带中的平均等级信号BPFavr超过了通过对未覆盖语音的频带中的平均等级信号BEFavr进行加权而获得的等级时，比较器56设置语音频带集中标记FLGb以表示检测到语音频带集中的区间。在本示例中，如图17所示，在该检测到的语音频带集中的区间中，将该语音频带集中标记FLGb驱动到高电平(1)。

如上所述，将该语音频带集中检测模块50通过检测而提供的该语音频带集中标记FLGb提供给与门370。

如上所述，采用了带通滤波器51和带阻滤波器52。然而，作为对主要覆盖了语音的频带中的信号和对未覆盖语音的频带中的信号进行采样的装置并不局限于带通滤波器51和带阻滤波器52。其他滤波器，比如低通滤波器和高通滤波器也可用来分离频带。

该比较器56可对主要覆盖了人声的频带中的信号或未覆盖人声的频带中的信号与输入信号自身进行比较。否则，可将主要覆盖了人声的频带中的信号或未覆盖人声的频带中的信号与输入信号之间的差值与主要覆盖了人声的频带中的信号或未覆盖人声的频带中的信号进行比较。

<中央定位检测模块60>

例如，就立体声收音机或电视广播的内容来说，大多数的言语都定位于中央声道，力图使言语听起来舒服。因此，在出现人声的区间中，定位方向分布集中于中央声道。

因此，在立体声音频信号中，指定信号成分定位于中央声道的区间。从而指定存在语音的区间。具体地，将定位于中央声道的立体声音频信号的成分用作检测语音区间的特征量。从而可以检测出语音区间。当对定位于中央声道的立体声音频信号的成分进行采样时，除了代表人声并定位于中央声道的信号成分之外的信号成分可被排除，比如延伸到左右两个声道的音乐信号成分可被排除。

如图13所示，中央定位检测模块60包括：定位分布检测器61和中央集中定位检测器62。将左右两个声道的输入音频信号SiL和SiR提供给该定位分布检测器61，该定位分布检测器61对输入音频信号成分的按时间顺序变化的定位方向分布进行检测。

将该定位分布检测器61检测到的关于定位方向分布的信息提供给该中央集中定位检测器62。该中央集中定位检测器62检测定位于中央声道的成分集中的时段。中央集中定位检测器62输出中央集中定位检测标记FLGc，该检测标记FLGc指示定位于中央声道的成分集中的时段。

如图18所示，定位分布检测器61包括带限滤波器611和612、定位方向检测器613以及定位方向分布测量电路614。

例如，带限滤波器611和612从输入到中央定位检测模块60的左右两个声道的输入音频信号SiL与SiR中将成分的定位方向不被特别察觉到的频带中的成分去除，例如将其低频成分等去除。

将频带被带限滤波器611和612限制的两个声道的输入音频信号SiL和SiR提供给定位方向检测器613。该定位方向检测器613根据频带受限制的两个声道的输入音频信号SiL和SiR各自的等级的大小来检测定位方向，该定位方向是在预定周期的区间处检测定位方向时的两个声道的输入音频信号SiL与SiR表现出的定位方向。

具体地说，在预定的采样周期区间，定位方向检测器613对频带被限制的两个频道的输入音频信号SiL与SiR的等级(振幅)进行采样。在该示例中，定位方向检测器613将在最后的采样时刻的定位方向检测为当前时刻的定位方向。

这种情况下，定位方向检测器613使用输入音频信号SiL与SiR在最后的采样时刻的等级以及在之前的采样时刻的等级，来检测最后的采样时刻的定位方向。

当两个频道的输入音频信号SiL与SiR为数字音频信号时，采样周期等于数字音频信号的采样周期。采样周期可能不等于数字音频信号的一个采样周期，而是可以等于多个采样周期。当定位方向检测器613的输入音频信号为模拟信号时，可在定位方向检测器613的输入级将模拟信号转换为数字音频信号。

下面参照图19A和19B描述定位方向检测器613中检测定位方向的方法。图19A和19B表示坐标空间，其中X轴表示左声道输入音频信号SiL的幅值，而Y轴表示右声道输入音频信号SiR的幅值。

定位方向检测器613在检测采样周期的区间时的定位方向检测时刻得到两个声道的输入音频信号SiL与SiR的等级，并在图19A与19B所示的坐标空间中绘制对应的坐标点，如点P1、P2、P3以及P4。在该示例中，P4是最后的检测时刻的坐标点。

当由y＝k·x(其中k是常量)表达的直线(通过X轴与Y轴的交点Z的直线)以交点Z作为中心旋转±90°时，即，当改变y＝k·x中的常量k时，定位方向检测器613进行计算，以找到沿着哪条由不同k值所决定的直线(具有不同斜率的直线)，绘制出的坐标点P1、P2、P3以及P4最接近于该直线。换言之，就是计算出表示直线的方程中的常量k，该常量k能使该直线到坐标点P1、P2、P3以及P4的距离Da1、Da2、Da3以及Da4或者距离Db1、Db2、Db3以及Db4的总和最小。

定位方向检测器613将计算出的由表示直线的方程中的常量k所表示的斜率识别为当前检测时刻的定位方向。在图19A与19B的示例中，X轴上的角度，也即向着左声道的定位方向(向左方向)的角度视为0°，且相对于X轴的角度θ(下面，称为“定位角度”)被检测为定位方向。

在图19A中，对于坐标点P1、P2、P3以及P4，定位角度检测为θa。在图19B中，对于坐标点P1、P2、P3以及P4，定位角度检测为θb。

在本实施例中，定位方向检测器613针对在当前时刻(在最后的采样时刻)的两个声道的输入音频信号的等级以及在先前的采样时刻的两个声道的输入音频信号的等级不使用相同的权重。在本实施方式中，定位方向检测器613针对在最接近于当前时刻的采样时刻的两个声道的输入音频信号的等级分配较大的权重。

因此，对于两个声道的输入音频信号的等级的采样值，定位方向检测器613采用具有由指数曲线表示的特征的时间窗口WD1，从而如图20所示，随着时间接近于当前时刻(在该示例中为最后的采样时刻tn)，权重变大。

在上面的描述中，用作处理对象信号时刻的当前时刻被视为最后的采样时刻(最后的采样时刻)。或者，可在输入音频信号SiL、SiR与可变增益放大器21L、21R的输入端之间设置用于延迟预定时间τ的延迟电路，以将作为处理对象的信号被重现的当前时刻设为比输入音频信号SiL与SiR被重现的时刻晚了时间τ的时刻。

这种情况下，定位方向检测器613可使用作为处理对象时刻的当前时刻之后的时刻(未来)再现的两个频道的输入音频信号SiL与SiR来检测定位方向。例如，在图19A与19B所示的示例中，作为处理对象信号时刻的当前时刻是点P2或者P3。

这种情况下，使用具有由图21所示的指数曲线所表示的特征的时间窗口WD2来替代时间窗口WD1。时间窗口WD2具有这样的指数曲线特征，即在作为处理对象信号时刻的当前时刻tp的权重最大，而在过去和未来的方向上权重变小。

对过去和未来的采样时刻的两个声道的输入音频信号SiL与SiR的等级可不加改变地使用，即不进行加权。

如上所述，定位方向检测器613可将两个频道的输入音频信号SiL与SiR在当前时刻的定位方向检测为定位角度θ。

然而，当前时刻的定位角度θ将一个时刻的输入音频信号的定位方向限定在一个方向，而不反映各个方向上的信号的强度。因此，在本实施方式中，因此，将在当前时刻由定位方向检测器613检测的两个声道的输入音频信号SiL与SiR的定位方向的检测结果(定位角度θ)提供给定位方向分布测量电路614。

定位方向分布测量电路614在预定的时间区间d内计算由定位方向检测器613检测的每一个定位角度θ的所有方位值的分布，并测量在各个角度方向上两个声道的输入音频信号的定位方向值的比率。

这种情况下，预定的时间区间d的范围例如为几毫秒到几百毫秒，且在该示例中为几十毫秒。在本实施方式中，定位方向分布测量电路614以与定位方向检测器613采用的由加权系数所表示的特征相同的方式，在预定的时间区间d内对由定位方向检测器613检测出的定位角度θ的值进行加权。

具体说来，定位方向分布测量电路614使用时间窗口WD3(见图22)进行加权操作，从而随着接近于当前时刻tp(在该示例中，tp＝tn(最后的采样时刻))，定位角度以指数方式增加。

如上所述，当对输入音频信号进行延时τ，且如图21所示的时间窗口被用作定位方向检测器613进行加权的时间窗口，类似于图21所示的时间窗口被用作定位方向分布测量电路614的时间窗口。这种情况下，时间区间d是覆盖了当前时刻tp的未来与过去的时间区间。而且，定位角度的值可以在未加权的情况下使用。

图23是表示定位方向分布P(θ)的示例的图，该定位方向分布P(θ)是由定位方向分布测量电路614计算出的定位角度θ值的分布，其中横轴表示将X轴(向着左声道的定位方向)视为基准的情况下所获得的定位角度θ的值，而纵轴表示定位角度值的出现频率的值(＜1)。在本实施方式中，计算出定位方向分布P(θ)，从而所有定位角度θ的值和总和为1。

即∑P(θ)＝1

定位角度θ与音频信号的定位方向之间的关系如图24所示。图24所示的前、左和右是相对于收听者确定的方向。

如上所述，在当前时刻(当前取样时刻或者作为处理对象信号时刻的当前采样时刻)，定位方向分布测量电路614提供关于图23所示的定位方向分布P(θ)的信息。

将关于定位方向分布P(θ)的信息提供给中央集中定位检测器62。中央集中定位检测器62通过对由定位分布检测器61计算出的定位方向分布P(θ)进行加权，主要在向着中央声道的方向上计算中央集中定位信号。

假设左声道的音频信号SiL和右声道的音频信号SiR为图25(A)和(B)所示的信号。在图25(A)和(B)中，等距条纹所指示的区域为存在定位于中央声道的人声成分的区间。其它黑色区域为存在人声成分之外的信号成分的区间。

在图25所示的示例中，由中央集中定位检测器62计算出的中央集中定位信号为图25(C)所示的波。

中央集中定位检测器62将计算出的中央集中定位信号的值与预定的基准值REF相比较，并将中央集中定位信号的值超过该预定的基准值REF的区间检测为中央定位检测区间。在图25所示的示例中，该预定的基准值REF设为0.8(80％)。中央集中定位检测器62输出指示检测到的中央定位检测区间的中央定位检测标记FLGc。

将中央集中定位检测器62产生的中央定位检测标记FLGc提供给与门370。

通过计算中央集中定位信号而检测语音区间的技术不局限于采用定位分布检测器61和中央集中定位检测器62的技术。例如，简单地说，可将中央集中定位信号提取为两个声道的音频信号SiL和SiL的总和，将提取到的中央集中定位信号超过预定基准值的区间检测为语音区间。

<语音区间检测标记VFLG的产生>

与门370输出语音区间检测标记VFLG，该语音区间检测标记VFLG表示语音周期检测标记FLGa、语音频带集中检测标记FLGb和中央定位检测标记FLGc的“与”信号，其中，语音周期检测标记FLGa来自语音周期检测模块40，语音频带集中检测标记FLGb来自语音频带集中检测模块50，以及中央定位检测标记FLGc来自中央定位检测模块60。

语音周期检测标记FLGa、语音频带集中检测标记FLGb和中央定位检测标记FLGc分别为指示用于检测语音区间的特征量的存在的标记。与门370计算三种标记FLGa，FLGb和FLGc的“与”，以产生语音区间检测标记VFLG，该语音区间检测标记VFLG为指示人声区间的检测输出。从而，语音区间检测的精度得以提高。

[超前连续相关声音时段检测模块38的配置示例]

在本实施例中，超前连续相关声音时段检测模块38具有如图26所示的配置。

超前连续相关声音时段检测模块38包括：计数器381、比较器382、基准计数值发生器383和与门384。计数器381、比较器382和基准计数值发生器383的各个部件与图37所示的第一实施例中的超前连续相关声音时段检测模块35的各个部件相同，即与计算器351、比较器352和基准计数值发生器353相同。即，第三实施例中的超前连续相关声音时段检测模块38与图7所示的第一实施例中的超前连续相关声音时段检测模块35的唯一不同之处就在于其包括了与门384。

在第三实施例中，将连续相关声音区间检测标记SFLG和语音区间检测标记VFLG提供给与门384，并由与门384提供作为各个标记的“与”的输出。将来自与门384的“与”输出提供给计数器381的使能端EN。

因此，在第三实施例中，在连续相关声音区间和仅一个语音区间中，该计数器381对时钟信号CLK的周期的重复次数进行计数。因此，不同于第一实施例和第二实施例，第三实施例中由超前时段检测标记HD指示的连续相关声音区间的超前时段不是非可变时段，而是随着连续相关声音区间中的语音区间而变化。

例如，假设来自放大器32的相加输出信号Sm是图28(A)所示的波，在图28(A)中，等距条纹所指示的区域为人声语音区间，其他黑色区域为非人声区间。

这种情况下，来自包络检测模块33的包络信号Semv为图28(J)所示的波。

即使是在图28(A)所示的相加输出信号Sm中，通过连续相关声音区间检测模块34检测短暂相邻的音频信号存在区间。从而产生如图28(B)的波所示的连续相关声音区间检测标记SFLG。

由于语音区间检测模块37检测出了相加输出信号Sm中的语音区间，该语音区间检测模块37产生如图28(C)的波所示的语音区间检测标记VFLG。

当连续相关声音区间出现时，超前连续相关声音时段检测模块38中的计数器381开始对时钟信号CLK的周期的重复次数进行计数。如图9(D)所示，该计数值CNT逐渐增加。

在第三实施例中，由于将与门384的“与”输出提供给了计数器381的使能端EN，该计数器381在连续相关区间和语音区间中对时钟信号CLK的周期的重复次数进行计数。即，计数器381的计数值输出CNT为图28(D)所示的波。

该超前连续相关声音时段检测模块38检测从连续相关声音区间的超前时刻到计数值CNT达到基准计数值的时刻之间的时段，并输出指示该时段的超前时段检测标记HD。因此，该超前时段检测标记HD为图28(E)所示的波。

[语音平均等级发生模块39的配置示例]

在本实施例中，语音平均等级发生模块39具有图27所示的配置。该语音平均等级发生模块39包括：选择器391、积分器392、积分时间常数变化控制器393和与门394。

包括选择器391、积分器392和积分时间常数变化控制器393的配置与图8所示的第一实施例中采用的包含选择器361、积分器362和积分时间常数变化控制器363的平均等级发生模块36的配置相同。这些部件执行相同的处理动作。

该语音平均等级发生模块39与图8所示的第一实施例中采用的平均等级发生模块36的不同之处在于，语音区间检测标记VFLG涉及到由选择器391执行的选择动作，并涉及到由积分时间常数变化控制器393执行的对积分时间常数变化的控制。

具体地，将来自包络检测模块33的包络信号Semv提供给选择器391的输入端之一，将积分器392的输出信号提供给选择器391的另一个输入端。将选择器391的输出提供给积分器392。

将连续相关声音区间检测标记SFLG和语音区间检测标记VFLG提供给与门394。将与门394的输出作为选择信号提供给选择器391。

进一步地，将语音区间检测标记VFLG以及超前时段检测标记HD一起提供给积分时间常数变化控制器393。

在连续相关声音区间内的语音区间期间，选择器391根据与门394的输出选择来自包络检测模块33的包络信号Semv，并将包络信号提供给积分器392。在连续相关声音区间内的语音区间之外的时段期间，选择器391选择积分器392的输出信号，并将该输出信号提供给积分器392。

因此，与上述实施例相似，在连续相关声音区间内的语音区间期间，积分器392通过对来自包络检测模块33的包络信号Semv进行积分并对该积分进行平均来产生信号。在连续相关声音区间内的语音区间之外的时段期间，积分器392维持(保持)其自身的输出等级信号。

具体地，如图28(F)中的粗线所示，连续相关声音区间检测标记SFLG重置为0的非连续相关声音区间和语音区间检测标记VFLG重置为0的非语音区间都被认为是保持时段，积分器362的积分输出在该保持时段中被保持。

如下所述，通过积分时间常数变化控制器393改变积分器392的积分时间常数。

具体地，在语音区间检测标记VFLG设为1的语音区间期间，同时在超前时段检测标记HD设为1的连续相关声音区间的超前时段之内，积分时间常数变化控制器393将积分器392的积分时间常数设为小值。比如，将积分时间常数设为N＝100。在图28所示的示例中，语音区间与图28(G)中用粗线标示出来的第一时间常数时段相对应。

在语音区间检测标记VFLG设为1的语音区间期间，同时在连续相关声音区间的超前时段之后的每一个时段内，积分时间常数变化控制器393将积分器392的积分时间常数设为大值。比如，将积分时间常数设为N＝1000。在图28所示的示例中，语音区间与图28(H)中用粗线标示出来的第二时间常数时段相对应。

语音平均等级发生模块39产生如图28(I)的波所示的语音平均等级信号Vavr3，并将其提供给增益控制信号发生单元23。

将由增益控制信号发生单元23产生的增益控制信号提供给可变增益放大器21L和21R。可变增益放大器21L和21R自身具有基于该增益控制信号而被控制的增益，从而使输入音频信号SiL和SiR的语音平均等级与基准等级相等。

在图28所示的示例中，语音平均等级信号Vavr3为图28(I)所示的波。通过控制增益以使语音平均等级信号Vavr3的等级与基准等级相等。因此，提供给可变增益放大器21L和21R的输出音频信号SoL和SoR的增益受到控制，从而使该输出音频信号SoL和SoR的等级基本保持恒定。

如上所述，根据第三实施例，可以获得在语音区间检测标记VFLG表示的语音区间期间获得的输入音频信号的平均等级。因此，表示输入音频信号的人声或言语的成分的等级受到控制以使其保持恒定。最终，使言语听起来舒服。

在上述第三实施例中，语音区间检测模块37基于三种用来检测人声区间的特征量来产生三种标记FLGa、FLGb和FLGc，并计算出这些标记的“与”以产生语音区间检测标记VFLG，该标记VFLG是指示人声区间的检测输出。

然而，从简化处理过程来说，基于三种特征量的任意一种而产生的标记都可作为该语音区间检测标记VFLG。三种特征量中的任意两种可组合使用，并且可以计算基于其中两种特征量而产生的标记的“与”，以产生该语音区间检测标记VFLG。

当采用三种特征量中的一种或两种特征量的组合时，可设置一种用于选择的选择操作装置。用户可利用该选择操作装置手动选择任意特征量。

该语音区间检测模块37可进一步包括：静音检测器，其用于检测由输入音频信号Sm表示的静音。在由静音检测器检测到的静音区间中，可将语音区间检测标记VFLG屏蔽以避免将静音区间用作语音区间。这种情况下，可将不代表任何信息的成分或代表背景噪音的成分清除。最终，进一步提高语音区间的检测精度。

被用于检测语音区间的关于语音信号的特征量并不局限于上述三种特征量。不必说，任何其他特征量都可使用。

第四实施例

第四实施例是上述第三实施例的一种变化。在第三实施例中，在连续相关声音区间的超前时段中仅采用一个时间常数作为检测平均等级的时间常数。相反，在第四实施例中，用于在连续相关声音区间的超前时段中采用的用于检测平均等级的时间常数根据在后一个连续相关声音区间中检测到的平均等级是否高于或低于在前一个连续相关声音区间中检测到的平均等级而有所不同。

也就是说，就如同第二实施例是第一实施例的一种变化，第四实施例也是第三实施例的一种变化。

第四实施例与第三实施例的不同之处仅在于语音平均等级发生模块39的配置。图29表示第四实施例中采用的语音平均等级发生模块39的配置示例。在第四实施例中，除了语音平均等级发生模块39之外，平均等级检测单元22的各个部件的配置与第三实施例相同。

如图29所示，第四实施例中采用的语音平均等级发生模块39包括：选择器391、积分器392、与门394、比较器395和积分时间常数变化控制器396。由于选择器391、积分器392和与门394的配置与图27中第三实施例的相同，给选择器、积分器和与门赋予相同的附图标记。

在第四实施例中，将包络信号Semv和作为积分器392的积分输出的平均等级输出Vavr4提供给比较器395。作为积分器392的积分输出的平均等级输出Vavr4表示在立即在前的连续相关声音区间中获得的平均等级。包络信号Semv为表示在当前连续相关声音区间中获得的平均等级的信号。

相应地，比较器395检测在当前连续相关声音区间中获得的音频信号的平均等级是否高于或低于在上一个连续相关声音区间内获得的音频信号的平均等级。

比较器395将比较结果输出提供给积分时间常数变化控制器396。与第三实施例中的操作相似，也将来自超前连续相关声音时段检测模块35的超前时段检测标记HD提供给该积分时间常数变化控制器396。

在本示例中，若比较器395的比较结果输出指示当前平均等级高于上一个平均等级时，该积分时间常数变化控制器396将在超前时段内采用的该积分器392的积分时间常数设为大值。若比较器395的比较结果输出指示当前平均等级低于上一个平均等级时，该积分时间常数变化控制器396将在超前时段内采用的该积分器392的积分时间常数设为小值。

其他处理动作与第三实施例中的相同。参照图30所示的时序图，下面描述第四实施例中平均等级检测单元22执行的处理动作。

图30(A)-(F)表示与图28(A)-(F)所示的第三实施例中采用的相同的信号和标记。如图30(H)所示，在连续相关声音区间的超前时段之外的时段内，与第三实施例中的操作相似(参见图28(H))，用于检测平均等级的时间常数被设置为大值(本示例中为大的积分时间常数)，例如，设置为N＝1000。

在第四实施例中，如图30(I)和(J)所示，比较器395将积分器392的积分输出Vavr4与连续相关声音区间的每一个超前时段Phd1，Phd2和Phd3内的包络信号Semv进行比较。基于比较结果输出，如图30(G)所示，该积分时间常数变化控制器396对在第一时间常数时段(超前时段)内采用的积分器392的时间常数进行控制。

具体地，在图30所示的示例中，由于积分输出Vavr4和包络信号Semv在第一超前时段Phd1内彼此相等，该比较器395将指示该事实的比较结果输出提供给该积分时间常数变化控制器396。该积分时间常数变化控制器396接着将在连续相关声音区间的超前时段内采用的该积分器392的第一时间常数(积分时间常数)设为大时间常数，比如，N＝120，该大时间常数是在超前时段内采用的时间常数。

在第二超前时段Phd2内，表示当前平均等级的包络信号Semv小于表示在上一个连续相关声音区间内获得的平均等级的积分输出Vavr4的等级。因此，比较器395将指示该事实的比较结果输出提供给该积分时间常数变化控制器396。该积分时间常数变化控制器396依次将在连续相关声音区间的超前时段内采用的该积分器392的第一时间常数(积分时间常数)设为小时间常数，比如，N＝80，该小时间常数对于超前时段是小的。相应地，在该第二超前时段Phd2中，该积分器392执行积分动作以迅速跟随音频信号的等级。具体地说，通过实施音量控制以将表示小声音的音频信号增加至特定等级。

在第三超前时段Phd3中，包络信号Semv的等级比积分输出Vavr4的等级高。因此，比较器395将指示该事实的比较结果输出提供给该积分时间常数变化控制器396。该积分时间常数变化控制器396接着将在连续相关声音区间的超前时段内采用的该积分器392的第一时间常数(积分时间常数)设为大时间常数，该大时间常数是在超前时段内采用的时间常数。因此，通过实施音量控制以使音频信号的高等级被抑制到特定等级，从而在等级变化时刻不发生声音抖动。

第四实施例的音量校正装置具有与第三实施例中音量校正装置相同的优点。此外，通过实施音量校正，从而使相对于上一个连续相关声音区间的等级差得以迅速补偿，并且因音频信号的等级变化而导致的抖动也得以抑制。

第五实施例

在第三和第四实施例中，对提供给输入音频信号的增益进行控制，从而使人声信号的平均等级与基准等级相等。因此，当人声信号的平均等级变低时，增加提供给整个输入音频信号的增益。相应地，若人声信号之外的音频信号成分的等级高于人声信号的等级，并且两种等级之间存在大的差值，那么由人声信号之外的音频信号成分的等级所表示的音量就会太大。当遇到人声的内容空缺时，人声之外的声音的音量就会尤其大。

第五实施例是用于解决上述问题的一种示例。与第三和第四实施例相似，下面描述的第五实施例适用于如图2所示电视机的音量校正部18。

图31是表示根据第五实施例的音量校正部18的整体配置的一个示例的框图，并且涉及到该配置应用于第三实施例的情形。在图31中，将与图12所示第三实施例中音量校正部18相同的部件赋予相同的附图标记。

在第五实施例中，包括上述第三实施例中的语音平均等级发生模块39在内，还包括非语音平均等级发生模块71和总平均等级发生模块72。非语音平均等级发生模块71产生表示在除语音信号成分以外的信号成分存在的区间内获得的相加输出信号Sm的平均等级的平均等级信号NVavr。

在本实施例中，非语音平均等级发生模块71具有与图27所示的语音平均等级发生模块39相同的硬件配置。

与语音平均等级发生模块39相似，将包络信号Semv、连续相关声音区间检测标记SFLG和超前时段检测标记HD提供给非语音平均等级发生模块71。将表示语音区间检测标记VFLG的极性的非语音区间检测标记NVFLG提供给非语音平均等角发生模块71，该语音区间检测标记VFLG来自语音区间检测模块37，非语音区间检测标记NVFLG的极性取决于极性翻转电路73。即，非语音平均等角发生模块71的配置与语音平均等级发生模块39的区别仅仅在于输入的是非语音区间检测标记NVFLG，而不是语音区间检测标记VFLG。

由于将非语音区间检测标记NVFLG而不是将语音区间检测标记VFLG提供给了非语音平均等角发生模块71，所以在连续相关声音区间中对占据了非语音区间的音频信号进行积分。检测出了音频信号的平均等级，并产生平均等级信号。

将作为非语音平均等级发生模块71的输出信号的非语音平均等级信号NVavr和作为语音平均等级发生模块39的输出信号的语音平均等级信号Vavr3提供给总平均等级发生模块72。

总平均等级发生模块72利用该语音平均等级信号Vavr3和非语音平均等级信号NVavr产生混合等级信号GVavr。

在本实施例中，总平均等级发生模块72判定该非语音平均等级信号NVavr是否比该语音平均等级信号Vavr3的等级高一个预定的等级。若总平均等级发生模块72判定该非语音平均等级信号NVavr没有比该语音平均等级信号Vavr3的等级高一个预定的等级，其输出语音平均等级信号Vavr3作为该混合等级信号GVavr。若总平均等级发生模块72判定该非语音平均等级信号NVavr比该语音平均等级信号Vavr3的等级高一个预定的等级，其输出非语音平均等级信号NVavr作为该混合等级信号GVavr。

然后，总平均等级发生模块72将该混合等级信号GVavr提供给增益控制信号发生单元23。

在第五实施例中，增益控制信号发生单元23产生使来自总平均等级发生模块72的混合等级信号的等级与基准等级相等的增益控制信号，并将该增益控制信号提供给可变增益放大器21L和21R。

<总平均等级发生模块72>

图32表示本实施例中总平均等级发生模块72的配置示例。

本实施例中的总平均等级发生模块72包括：选择器721、加权放大器722和等级比较器723。将来自语音平均等级发生模块39的语音平均等级信号Vavr3提供给选择器721的输入端中的一个输入端A。将来自非语音平均等级发生模块71的非语音平均等级信号NVavr提供给选择器721的另一个输入端B。

将通过加权放大器722对来自语音平均等级发生模块39的语音平均等级信号Vavr3进行加权而产生的信号以及来自非语音平均等级发生模块71的非语音平均等级信号NVavr提供给等级比较器723。

由放大器722提供的权重用于通过增益控制来指定一个大于或等于表示除了语音之外的声音的音频信号等级的等级，该等级表示小于过大音量的音量，并且例如将放大倍率设置为2倍(×2)。

等级比较器723对信号的等级彼此进行比较。将比较结果输出CMP作为选择控制信号提供给选择器721。当非语音平均等级信号NVavr的等级低于作为语音平均等级信号Vavr3的两倍的阈值等级θth时，比较结果输出CMP例如表示为1，这表示输入到输入端A的语音平均等级信号Vavr3从选择器721中输出。

当非语音平均等级信号NVavr的等级高于作为语音平均等级信号Vavr3的两倍的阈值等级θth时，比较结果输出CMP比如表示为0，这表示输入到另一个输入端B的非语音平均等级信号NVavr从选择器721中输出。

因此，如果非语音平均等级信号NVavr的等级不超过作为语音平均等级信号Vavr3的等级的两倍的等级(在NVavr＜2Vavr3的条件下)，则从选择器721中选定语音平均等级信号Vavr3并将其提供给增益控制信号发生单元23。

在上述条件(NVavr＜2Vavr3)下，与第三实施例相似，对可变增益放大器21L和21R提供的增益进行控制，从而使语音平均等级信号Vavr3与基准等级相等。因此，通过实施等级控制，从而使例如言语的人声听起来舒服。

如果非语音平均等级信号NVavr的等级超过了作为语音平均等级信号Vavr3的等级的两倍的等级(在NVavr≥2Vavr3的条件下)，则从选择器721中选定非语音平均等级信号NVavr并将其提供给增益控制信号发生单元23。在NVavr≥2Vavr3的条件下，对可变增益放大器21L和21R提供的增益进行控制，从而使非语音平均等级信号NVavr与基准等级相等。从而，避免了语音之外的声音非正常地大。

下面参照图33描述第五实施例包含的平均等级检测单元22中执行的动作。

即使在第五实施例中，若相加输出信号Sm为图33(A)所示的波，则连续相关声音区间检测标记SFLG为图33(B)所示的波。语音区间检测标记VFLG为图33(C)所示的波。进一步地，超前连续相关声音时段检测标记HD为图33(D)所示的波。

在图33所示的示例中，语音平均等级信号Vavr3为图33(E)所示的波，且非语音平均等级信号NVavr为图33(F)所示的波。

因而，总平均等级信号GVavr为图33(G)所示的波，具体地，当非语音平均等级信号NVavr的等级低于作为语音平均等级信号Vavr3等级的两倍的阈值等级θth时，将语音平均等级信号Vavr3作为总平均等级信号GVavr从总平均等级发生模块72中输出。

当非语音平均等级信号NVavr的等级高于或等于作为语音平均等级信号Vavr3等级的两倍的阈值等级θth时，将非语音平均等级信号NVavr作为总平均等级信号GVavr从总平均等级发生模块72中输出。从而，避免了语音之外的声音非正常地大。

[总平均等级发生模块72的另一示例]

在图32中，将非语音平均等级信号NVavr与通过对语音平均等级信号Vavr3进行加权而产生的信号进行比较。基于该比较结果输出，将非语音平均等级信号NVavr或语音平均等级信号Vavr3提供给增益控制信号发生单元23。

然而，如图34所示，可对图32所示的语音平均等级发生模块39、非语音平均等级发生模块71和总平均等级发生模块72进行变化。

与图31所示示例相似，图34所示的示例中包含了非语音平均等级发生模块71。在图34所示的示例中，总平均等级发生模块73代替了语音平均等级发生模块39和总平均等级发生模块72。

如图34所示，与语音平均等级发生模块39相似，总平均等级发生模块73包括：选择器731、积分器732、积分时间常数变化控制器733和与门734。该总平均等级发生模块73包括加权放大器735和比较器736。

将积分器732的输出信号(总平均等级信号GVavr)提供给选择器731的输入端A。将来自包络检测模块33的包络信号Semv提供给选择器731的输入端B。将来自与门734的连续相关声音区间检测标记SFLG和语音检测标记VFLG的“与”输出提供给选择器731的选择控制端SEL。

将选择器731根据与门734的“与”输出而选择的输出信号提供给积分器732。在本示例中，积分器732的输出信号的等级被加权放大器735加倍，然后提供给比较器736。将作为非语音平均等级发生模块71包含的积分器712的输出信号的非语音平均等级信号NVavr也提供给比较器736。

将作为非语音平均等级发生模块71包含的积分器712的输出信号的非语音平均等级信号NVavr提供给积分器732，并将比较器736的比较结果输出信号CTL提供给积分器732。当比较器736的比较结果输出信号CTL表示已满足如后所述的条件时，积分器732将自身的积分输出值改为来自非语音平均等级发生模块71的非语音平均等级信号NVavr。

下面描述图34所示示例中执行的处理动作。

在图34所示的示例中，总平均等级发生模块73和非语音平均等级发生模块71对来自包络检测模块33的包络信号Semv执行上述积分动作。

在总平均等级发生模块73中，该包络信号Semv在由语音区间检测标记VFLG表示的语音区间期间从选择器731输出。积分器732将总平均等级GVavr作为初始值执行积分动作。在人声区间之外的区间期间，积分器732的输出信号从选择器731中输出。总平均等级GVavr的值维持(预保持)为积分器732的输出。

在非语音平均等级发生模块71中，该包络信号Semv在由非语音区间检测标记NVFLG表示的非语音区间期间从选择器711输出。积分器712将非语音平均等级信号NVavr的等级作为初始值执行积分动作。在人声区间期间，积分器712的输出信号从选择器711中输出。将非语音平均等级NVavr的值维持(预保持)为积分器712的输出。

比较器736对来自总平均等级发生模块73的总平均等级信号GVavr的等级经放大器735放大两倍的值与来自非语音平均等级发生模块71的非语音平均等级信号NVavr的等级进行比较，并将比较输出CTL提供给积分器732。

积分器732参考比较输出CTL以判定非语音平均信号NVavr的等级是否满足如下条件NVavr＜2GVavr：即该非语音平均信号NVavr的等级不超过总平均等级信号GVavr的等级的两倍的值，或者判定是否满足条件NVavr≥2GVavr：即非语音平均信号NVavr的等级超过总平均等级信号GVavr的等级的两倍的值。

若积分器732判定NVavr值不超过两倍的GVavr值(满足条件NVavr＜2GVavr)，则积分器732不改变用于保持积分结果的保持器的值，与第三实施例中的积分器相似，积分器732产生并输出语音平均等级信号Vavr3作为总平均等级信号GVavr。

具体地，当来自比较器736的信号CTL表示满足条件NVavr＜2GVavr时，积分器732忽略来自非语音平均等级发生模块71的非语音平均等级信号NVavr，并执行与第三实施例中包含的积分器相同的处理。

当积分器732判定NVavr值超过两倍的GVavr值(满足条件NVavr≥2GVavr)，则积分器732将用于保持积分结果的保持器的值改变至非语音平均等级信号NVavr。因而，只要NVavr值超过2GVavr(满足条件NVavr≥2GVavr)，非语音平均等级信号NVavr被用作积分器732的输出。

当NVavr值不超过2GVavr(满足条件NVavr＜2GVavr)时，积分器732根据比较输出CTL停止将用于保持积分结果的保持器的值设置到非语音平均等级信号NVavr的动作，并重新开始对选择器731的输出进行积分的处理。

在图34所示的示例中，将来自积分器732的输出信号作为总平均等级信号GVavr提供给增益控制信号发生单元23。增益控制信号发生单元23产生使总平均等级信号GVavr的等级等于基准等级的增益控制信号。

第五实施例是一种将本发明的构成特征应用到第三实施例的情形。不必说，该构成特征也可用于第四实施例。

其他实施例和变化

在上述这些实施例中，对输入音频信号的语音平均等级和非语音平均等级进行实时检测以控制增益。然而，本发明并不局限于实时处理。

例如，可对记录于记录介质中的音频信号的语音平均等级和非语音平均等级进行检测以产生增益控制信号，该增益控制信号可记录为与记录信号相关联。这种情况下，当再现音频信号时，可以使用所记录的增益控制信号来控制由再现的音频信号所表示的音量。

图35表示一种能将电视广播信号记录在诸如硬盘或数字通用光盘(DVD)等记录介质中的本发明适用的记录/再现装置的框图。

具体地，如图35所示的示例，记录/再现装置80包括：广播记录单元81、再现单元82、等级校正/增益发生单元83、控制单元84以及操作单元85。操作单元85例如包括遥控收发单元。控制单元84例如包括微型计算机并根据来自操作单元85的操作输入来控制记录/再现设备80的各个单元。

等级校正/增益发生单元83包括上述实施例中包括的平均等级检测单元22和增益控制信号发生单元23。

当用户使用操作单元85以给出记录指令时，控制单元84控制广播记录单元81以记录已被指令记录的广播节目。

在广播记录单元81中，广播接收模块811接收已被指令进行记录的广播节目的广播波信号，并将所接收的广播波信号提供给解码模块812。在该示例中，由解码模块812对所接收的信号中包含的视频信号V1与音频信号A1进行解码并输出。这里，音频信号A1例如包括左右两个声道的音频信号。

来自解码模块812的视频信号V1与音频信号A1由记录编码模块813进行编码以用于记录，并由写入模块815记录于记录介质816上。例如，使用硬盘驱动器作为记录介质816。

操作单元85设有用于指定记录于记录介质816上的广播节目内容的按键以及用于等级校正/增益生成的指令按键。当用户指定所记录的广播节目内容并操作用于等级校正/增益生成的指令按键时，控制单元84进行等级校正/增益生成的处理，以校正由音频信号表示的指定广播节目内容的再现音量。

具体来说，控制单元84基于来自等级校正/增益生成的指令按键的操作输入，来控制包括于再现单元中的读取模块821、再现解码模块822、等级校正/增益发生单元83以及写入模块815的动作状态。

控制单元84控制读取单元821以从记录介质816读取指定的广播节目的记录信号。读取模块821将读取的记录信号提供给再现解码模块822。再现解码模块822解码记录信号以用于再现，并输出再现视频信号V2与再现音频信号A2。

将来自再现解码模块822的再现音频信号A2提供给等级校正/增益发生单元83。如第一实施例或第二实施例中所述，等级校正/增益发生单元83产生增益控制信号。

等级校正/增益发生单元83将产生的增益控制信号提供给写入模块815。在控制单元84的控制下，写入模块815将来自等级校正/增益发生单元83的增益控制信号记录于记录介质816上，以与再现中的记录信号相关联。

当用户通过使用操作单元85发出再现指令时，控制单元84控制再现单元82以再现被指令再现的广播节目。

控制单元84控制读取模块821以读取指定的广播节目的记录信号以及记录于记录介质816中的与所述记录信号相关联的增益控制信号。读取器821将读取的记录信号提供给解码模块822，并将读取的增益控制信号提供给增益控制信号再现模块826。

再现解码模块822对记录信号进行解码以用于再现，并得到再现视频信号V2与再现音频信号A2。再现视频信号V2从视频输出端827经由视频信号处理模块823输出。显示装置连接于输出端827，且广播节目的再现画面显示于其显示屏上。

将来自再现解码模块822的再现音频信号经由音频信号处理模块824提供给可变增益放大器825。

增益控制信号再现模块826从来自读取模块821的信号中再现增益控制信号。增益控制信号再现模块826将再现的增益控制信号提供给可变增益放大器825，从而控制可变增益放大器所提供的增益。因此，与第一或第二实施例相似，来自可变增益放大器825的音频信号表示听起来舒服的人声，而且其他声音也不会太大。

来自可变增益放大器825的再现音频信号经由音频输出端828提供给扬声器。

在图35所示的示例中，等级校正/增益发生器83具有与上述实施例相同的配置。然而，在图35所示的示例中，由于不必进行实时处理，虽然处理时间增加了，但却可以高度精确地实现处理。

例如，连续相关声音区间检测模块34可能没有上述构造，但可以执行倒谱分析(cepstrum analysis)以通过快速傅立叶变换(FET)获得谱包络，可因此更加精确地检测连续相关声音区间和延伸区间。

当采用第三至第五实施例的构造特征时，若记录/再现设备80设计为具有足够的缓存容量和吞吐量，在自动校正音频信号的同时可检测音高以检测存在人声信号的语音区间。可执行倒谱分析以通过快速傅立叶变换(FET)获得谱包络，从而能更精确地检测存在人声信号的语音区间。

上述示例中，音频信号是指左右两个声道的信号。由于有待平均等级检测单元22处理的目标信号为相加音频信号Sm，不必说，有待音量校正的音频信号可能为单声道音频信号。

近年来，音频信号可以是5.1声道信号组成的环绕声音频信号或是三个以上多声道信号组成的音频信号。若为多声道音频信号，人声信号可主要包含在中央声道的信号中。当采用第三至第五实施例的构成特征时，利用中央声道的音频信号检测语音区间。

图36为表示当输入音频信号为5.1声道环绕声音频信号时采用了第三至第五实施例构造特征的实施例中的音量校正装置的要点的框图。

在本示例中，将前左右声道的音频信号FLi与FRi提供给可变增益放大器921和922。将后左右声道的音频信号RLi与RRi提供给可变增益放大器923和924。将低频的音频信号LFEi(低频效果)提供给可变增益放大器926。

将中央声道的音频信号Ci提供给等级校正/增益发生单元91。该等级校正/增益发生单元91具有与图35所示的等级校正/增益发生单元83相同的构造。然而，等级校正/增益发生单元91根据第三至第五实施例中采用的任何一种技术，将中央声道的音频信号Ci用作相加音频信号Sm，并产生增益控制信号，基于该增益控制信号对可变增益放大器921～926所给定的增益进行控制。

输出音频信号FLo，FRo，RLo，RRo，Co和LFEo从可变增益放大器921～926输出，并且声音从相关的扬声器释放出来。

根据图36所示的示例，5.1声道的输出音频信号FLo，FRo，RLo，RRo，Co和LFo的增益受到等级校正/增益发生单元91产生的增益控制信号的控制。因此，从而使人声听起来舒服，同时避免了人声之外的其他声音过大。

当三个以上多声道的音频信号缩混为两个声道的音频信号时，等级校正/增益发生单元对缩混的两个声道的合成音频信号进行处理。

图37为表示当输入音频信号将5.1声道的环绕音频信号缩混为两个声道的音频信号时的实施例中的音量校正装置的轮廓的框图。

具体地，在图37所示的示例中，将5.1声道FLi、FRi、RLi、RRi、Ci以及LFEi的环绕音频信号提供给缩混单元93，并缩混成左右两个声道的音频信号Li与Ri。

将来自缩混单元93的左右两个声道的输入音频信号Li与Ri分别提供给可变增益放大器951和952，并同样提供给等级校正/增益发生单元94。

等级校正/增益发生单元94具有与图34所示的等级校正/增益发生单元83相同的构造。具体地，在本示例中，该等级校正/增益发生单元94根据上述实施例中采用的任何一种技术从左右两个声道的音频信号Li和Ri中产生增益控制信号，基于该增益控制信号对可变增益放大器951和952所提供的增益进行控制。

即使是在如图37所示的示例中，也提供了与上述示例相同的操作和优点。

其他变化示例

在上述描述中，将平均等级检测单元22配置为包括分散电路模块的硬件。或者，平均等级检测单元22可包括数字信号处理器(DSP)。

不必说，可将平均等级检测单元22配置为软件处理，该软件处理通过安装于计算机中的程序来执行。这种情况下，比如，在图2所示的示例中，控制部10包括作为软件处理设备的平均等级检测单元22。如图2中虚线所示，基于来自控制部10的增益控制信号，对音量校正部18中的可变增益放大器提供的增益进行控制。

假定对音频信号进行数字信号处理时，包括可变增益放大器在内的音量校正部18的所有部件可以由软件处理实现。

不必说，采用了根据本发明的音量校正装置的电子设备不局限于图2所示的电视机。

在上述实施例中，仅使用输入音频信号对连续相关声音区间进行检测。然而，就像在电视广播节目信号中那样，假设视频信号与音频信号相关联，可将语音存在/不存在检测的结果和关于通过使用视频信号的特征量而检测到的场景变化时刻的信息结合起来以检测连续相关声音区间。

本领域的技术人员应当明白，在不脱离所附权利要求及其等同物的范围内，根据设计需要和其它因素可出现各种变化、组合、子组合和替代。

Claims

1.一种音量校正装置，其包括：

连续相关声音区间检测装置，其用于检测所述输入音频信号中的连续相关声音区间，在所述连续相关声音区间中存在一组短暂相邻的连续相关声音；

平均等级检测装置，其用于检测在由所述连续相关声音区间检测装置所检测到的所述连续相关声音区间中获得的所述输入音频信号的平均等级，所述平均等级检测装置的用于平均等级检测的时间常数在所述连续相关声音区间的超前时段内比所述连续相关声音区间的剩余时段内设为更小的值；以及，

增益控制信号发生装置，其用于产生所述增益控制信号，并将所产生的该增益控制信号提供给所述可变增益装置，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使得由所述平均等级检测装置检测到的所述平均等级等于基准等级。

2.根据权利要求1所述的音量校正装置，其中，在所述连续相关声音区间的超前时段内，所述平均等级检测装置对该平均等级检测装置所检测到的平均等级与所述输入音频信号的平均等级进行比较，并根据所述比较结果改变在所述超前时段内采用的所述用于平均等级检测的时间常数。

3.根据权利要求1所述的音量校正装置，其中，所述连续相关声音区间检测装置包括：

音频信号存在/不存在检测装置，其用于检测所述输入音频信号的存在或不存在；以及，

延伸装置，其用于将所述音频信号存在/不存在检测装置所检测到的存在信号的区间延伸一个特定时间。

4.根据权利要求3所述的音量校正装置，其中，所述音频信号存在/不存在检测装置包括：

第一平均等级检测装置，其用于在设定一个用于平均等级检测的第一时间常数的同时来检测所述输入音频信号的平均等级，并输出第一平均等级输出信号；

第二平均等级检测装置，其用于在设定一个比所述用于平均等级检测的第一时间常数大的用于平均等级检测的时间常数的同时来检测所述输入音频信号的平均等级，并输出第二平均等级输出信号；以及，

比较装置，其用于对所述第一平均等级输出信号的等级与阈值进行比较，所述阈值是通过降低来自所述第二平均等级检测装置的第二平均等级输出信号的等级而获得的信号等级，并将指示所述第一平均等级输出信号的等级高于所述阈值的区间的检测信号输出为指示由所述音频信号存在/不存在检测装置检测到的存在信号的区间的信号。

5.一种音量校正装置，其包括：

语音区间检测装置，其用于检测语音区间，该语音区间是一个在所述输入音频信号中包含代表人声的音频信号的时间区间；

语音平均等级检测装置，其用于检测在由所述语音区间检测装置所检测到的所述语音区间期间获得的所述输入音频信号的平均等级，该语音平均等级检测装置的用于平均等级检测的时间常数在所述连续相关声音区间的超前时段内比所述连续相关声音区间的剩余时段内设为更小的值；以及，

增益控制信号发生装置，其用于产生所述增益控制信号，并将所产生的该增益控制信号提供给所述可变增益装置，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使得由所述语音平均等级检测装置检测到的所述平均等级等于基准等级。

6.根据权利要求5所述的音量校正装置，其中，在所述连续相关声音区间的超前时段期间，所述语音平均等级发生装置对由该语音平均等级检测装置检测到的平均等级与在所述语音区间期间获得的所述输入音频信号的平均等级进行比较，并根据所述比较结果改变在所述超前时段中采用的所述用于平均等级检测的时间常数。

7.一种音量校正装置，其包括：

非语音平均等级检测装置，其用于检测所述输入音频信号中包含的代表除了人声和静音之外的声音的音频信号的平均等级；以及，

8.根据权利要求7所述的音量校正装置，其中所述连续相关声音区间检测装置包括：

9.根据权利要求8所述的音量校正装置，其中所述音频信号存在/不存在检测装置包括：

10.一种由音量校正装置实施的音量校正方法，该音量校正装置包括：可变增益装置，其用于根据增益控制信号控制提供给输入音频信号的增益；连续相关声音区间检测装置；平均等级检测装置；和增益控制信号发生装置，该方法包括以下步骤：

允许所述连续相关声音区间检测装置检测所述输入音频信号中的连续相关声音区间，在所述连续相关声音区间中存在一组短暂相邻的连续相关声音；

允许所述平均等级检测装置检测在所述连续相关声音区间检测步骤中检测到的连续相关声音区间中获得的输入音频信号的平均等级，允许中检测到的所述连续相关声音区间内获得的所述输入音频信号的平均等级，并且将所述连续相关声音区间的超前时段内的用于平均等级检测的时间常数设为比所述连续相关声音区间的剩余时段内更小的值；以及，

允许所述增益控制信号发生装置产生所述增益控制信号，其中，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使在所述平均等级检测步骤中检测到的平均等级等于基准等级，其中，

基于在所述增益控制信号发生步骤中产生的增益控制信号对由所述可变增益装置提供的增益进行控制。

11.一种由音量校正装置实施的音量校正方法，该音量校正装置包括：可变增益装置，其用于根据增益控制信号控制提供给输入音频信号的增益；连续相关声音区间检测装置；语音区间检测装置；语音平均等级检测装置；和增益控制信号发生装置，该方法包括以下步骤：

允许所述语音区间检测装置检测语音区间，该语音区间是一个在所述输入音频信号中包含代表人声的音频信号的时间区间；

允许所述语音平均等级检测装置检测在由所述语音区间检测装置检测到的所述语音区间期间获得的所述输入音频信号的平均等级，并且将所述连续相关声音区间的超前时段内的用于平均等级检测的时间常数设为比所述连续相关声音区间的剩余时段内更小的值；以及，

允许所述增益控制信号发生装置产生增益控制信号，其中，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使在所述语音平均等级检测步骤中检测到的平均等级等于基准等级，其中，

12.一种由音量校正装置实施的音量校正方法，该音量校正装置包括：可变增益装置，其用于根据增益控制信号控制提供给输入音频信号的增益；连续相关声音区间检测装置；语音区间检测装置；语音平均等级检测装置；连续相关声音区间检测装置；语音区间检测装置；语音平均等级检测装置；非语音平均等级检测装置；和增益控制信号发生装置，该方法包括以下步骤：

允许所述语音平均等级检测装置检测在所述语音区间检测步骤中检测到的所述语音区间期间获得的所述输入音频信号的平均等级，并且将所述连续相关声音区间的超前时段内的用于平均等级检测的时间常数设为比所述连续相关声音区间的剩余时段内更小的值；

允许所述非语音平均等级检测装置检测所述输入音频信号中包含的代表人声和静音之外的声音的音频信号的平均等级；以及，

允许所述增益控制信号发生装置当在所述非语音平均等级检测步骤中检测到的非语音平均等级不高于在所述语音平均等级检测步骤中检测到的语音平均等级一个特定大小时产生增益控制信号，其中，根据该增益控制信号控制对提供给所述输入音频信号的增益进行控制，从而使由所述语音平均等级检测装置检测到的语音平均等级等于基准等级，而当在所述非语音平均等级检测步骤中检测到的非语音平均等级高于在所述语音平均等级检测步骤中检测到的语音平均等级一个特定大小时，所述增益控制信号发生装置产生增益控制信号，其中，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使在所述非语音平均等级检测步骤中检测到的非语音平均等级等于所述基准等级，其中，

13.一种音量校正装置，其包括：

可变增益单元，其用于根据增益控制信号控制提供给输入音频信号的增益；

连续相关声音区间检测单元，其用于检测所述输入音频信号中的连续相关声音区间，在所述连续相关声音区间中存在一组短暂相邻的连续相关声音；

平均等级检测单元，其用于检测在由所述连续相关声音区间检测单元所检测到的所述连续相关声音区间中获得的所述输入音频信号的平均等级，所述平均等级检测单元的用于平均等级检测的时间常数在所述连续相关声音区间的超前时段内比所述连续相关声音区间的剩余时段内设为更小的值；以及，

增益控制信号发生单元，其用于产生所述增益控制信号，并将所产生的该增益控制信号提供给所述可变增益单元，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使得由所述平均等级检测单元检测到的所述平均等级等于基准等级。

14.一种音量校正装置，其包括：

语音区间检测单元，其用于检测语音区间，该语音区间是一个在所述输入音频信号中包含代表人声的音频信号的时间区间；

语音平均等级检测单元，其用于检测在由所述语音区间检测单元所检测到的所述语音区间期间获得的所述输入音频信号的平均等级，该语音平均等级检测单元的用于平均等级检测的时间常数在所述连续相关声音区间的超前时段内比所述连续相关声音区间的剩余时段内设为更小的值；以及，

增益控制信号发生单元，其用于产生所述增益控制信号，并将所产生的该增益控制信号提供给所述可变增益单元，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使得由所述语音平均等级检测单元检测到的所述平均等级等于基准等级。

15.一种音量校正装置，其包括：

语音区间检测单元，其用于检测语音区间，该语音区间是一个在所述输入音频信号包含代表人声的音频信号的时间区间；

非语音平均等级检测单元，其用于检测所述输入音频信号中包含的代表除了人声和静音之外的声音的音频信号的平均等级；以及，

增益控制信号发生单元，其用于当由所述非语音平均等级检测单元检测到的非语音平均等级不高于由所述语音平均等级检测单元检测到的语音平均等级一个特定大小时产生增益控制信号，其中，根据该增益控制信号控制对提供给所述输入音频信号的增益进行控制，从而使由所述语音平均等级检测单元检测到的语音平均等级等于基准等级，而当由所述非语音平均等级检测单元检测到的非语音平均等级高于由所述语音平均等级检测单元检测到的语音平均等级一个特定大小时，所述增益控制信号发生单元产生增益控制信号，其中，根据该增益控制信号对提供给所述输入音频信号的增益进行控制，从而使由所述非语音平均等级检测单元检测到的非语音平均等级等于所述基准等级，并将所产生的增益控制信号提供给所述可变增益单元。