CN101388216B - 声音处理装置、控制增益的装置和方法 - Google Patents
声音处理装置、控制增益的装置和方法 Download PDFInfo
- Publication number
- CN101388216B CN101388216B CN2008101491467A CN200810149146A CN101388216B CN 101388216 B CN101388216 B CN 101388216B CN 2008101491467 A CN2008101491467 A CN 2008101491467A CN 200810149146 A CN200810149146 A CN 200810149146A CN 101388216 B CN101388216 B CN 101388216B
- Authority
- CN
- China
- Prior art keywords
- sound
- gain
- signal
- voice signal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 165
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000005236 sound signal Effects 0.000 claims description 32
- 230000008859 change Effects 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000004044 response Effects 0.000 abstract description 3
- 230000015556 catabolic process Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 230000001276 controlling effect Effects 0.000 description 54
- 238000010586 diagram Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 9
- 238000009499 grossing Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Control Of Amplification And Gain Control (AREA)
- Telephone Function (AREA)
Abstract
本发明提供一种使用方向声音接收技术来估算背景噪音的功率的声音处理装置、控制增益的装置和方法,该声音处理装置使用多个声音接收单元,基于所估算的背景噪音的功率和预定的功率目标值计算增益控制值,和输出该增益控制值,从而可减少开始增益控制的延迟时间,以及可阻止语音识别应用程序的慢响应或语音通信程序的语音质量的降低。
Description
技术领域
本发明涉及声音处理装置,更具体地,涉及用于放大从麦克风输入的声音信号和处理该声音信号的声音处理装置、用于控制声音信号的放大增益的增益控制装置、在声音处理装置和增益控制装置中使用的增益控制方法、和存储用以执行声音处理装置和增益控制装置的程序的计算机程序的程序产品。
背景技术
近年来,通过麦克风接收声音、将声音转换成声音信号、将声音信号放大成适用于语音识别处理的音频水平的这种装置的使用变得普及,并且这种装置可基于所放大的声音信号执行关于讲话者的语音的语音识别处理。当过度地增加音频水平(功率)时,声音信号饱和。相反,过度地减少音频水平则导致错误的语音识别。因此,为了获得适当的音频水平,重要的是开发用以控制放大增益的技术。
图22是现有声音处理装置1000的功能框图。现有声音处理装置1000包括:声音接收单元1010,用于从外部接收声音(例如由讲话者发出的语音和噪音);放大器单元1020(例如可变增益放大器),用于放大由声音接收单元1010生成的声音信号;模拟到数字(A/D)转换器1030,用于转换由放大器单元1020放大的模拟声音信号;和控制单元1040,例如数字信号处理器(DSP)。
控制单元1040包括:语音部分检测部1041,根据转换到数字信号的声音信号检测包含由讲话者发出的语音的部分;和应用部1042,基于在检测部中包含的语音执行语音识别处理。控制单元1040还包括:功率估算部1043,基于在检测部中的声音信号估算音频水平(功率);和增益导出部1044,基于所估算的音频水平计算放大器单元1020的增益的控制值。将所计算的增益控制值输出至基于增益控制值来放大声音信号的放大器单元1020。
通过在放大器单元1020中控制用于放大声音信号的增益,以调节声音接收单元1010的灵敏度,可使得用以执行语音识别应用程序所需的声音信号的音频水平接近于在各种噪音环境下的目标值。该特征称为“自动增益控制(AGC)”。在执行例如语音识别应用程序的应用时,使用AGC进行预处理。
日本专利申请No.2000-105599描述了用于从包含噪音和语音的信号中进行语音分离噪音的方法,其中一个技术涉及声音处理。
发明内容
然而,在现有声音处理装置中,为了确定由讲话者发出的包含语音的部分,需要几十到几百毫秒的时间段。因此,在开始增益控制之前,不利的是会出现延迟。在延迟期间,语音水平进入不适当的状态。因此,声音信号可能饱和,或可能发生语音误识的错误。
为了解决这个问题,提出一种方法,用于在确定语音部分和执行增益控制之前累积(缓冲)声音信号。然而,在该方法中,可能会发生处理延迟。因此,可能发生语音识别应用程序的响应延迟,或可能降低通信应用程序的语音质量。
因此,本发明实施例的目的在于提供一种使用方向声音接收技术估算背景噪音的功率的声音处理装置,使用多个声音接收单元,基于所估算的背景噪音的功率和预定的功率目标值来计算增益控制值,和输出该增益控制值,从而可减少开始增益控制的延迟时间,以及可阻止语音识别应用程序的慢响应或语音通信程序的语音质量的降低。本发明实施例的另一目的在于提供一种控制与声音信号的放大有关的增益的增益控制装置、一种控制在声音处理装置和增益控制装置中使用的增益的方法、以及一种实现声音处理装置和增益控制装置的计算机程序。
根据一实施例,提供一种具有以下配置的声音处理装置。所述声音处理装置包括:多个声音接收单元,将输入声音转换成声音信号;多个放大器单元,按预定的增益控制值放大声音信号;分离单元,根据声音信号,基于从预定目标方向到达的声音而分离出第一声音信号、以及基于从目标方向之外的其他方向到达的声音而分离出第二声音信号;估算单元,基于第一和第二声音信号之间的相关性来估算在声音信号中包含的背景噪音的功率;以及导出单元,基于所估算的背景噪音的功率和预定的功率目标值计算向多个放大器单元输出的增益控制值。
声音处理装置可通过平滑在所估算的背景噪音的功率和功率目标值之间的差值中的时间变化来计算增益控制值。
此外,声音处理装置可基于在所计算的差值和先前获得的增益控制值之间的大小关系计算表示平滑化程度的时间常数,以及基于所确定的时间常数平滑在所述差值中的时间变化。
此外,导出单元可被配置为,仅当所估算的背景噪音的功率大于所述功率目标值时或仅当所估算的背景噪音的功率小于所述功率目标值时,计算增益控制值。
所述声音处理装置可包括:选择单元,基于放大器单元的增益的目标值和预存的放大器单元的增益,从声音处理装置的多个放大器单元输出的多个声音信号中选择一个作为处理目标。
根据本发明的另一实施例,提供一种控制增益的方法。该方法包括以下操作:将输入音频信息转换成对应的声音信号;按预定的增益控制值放大声音信号;根据声音信号,基于从预定目标方向到达的声音而分离出第一声音信号、以及基于从目标方向之外的其他方向到达的声音而分离出第二声音信号;基于第一和第二声音信号之间的相关性估算在声音信号中包含的背景噪音的功率;和基于所估算的背景噪音的功率和预定的功率目标值来计算增益控制值。
根据本发明一实施例,由于在不包含语音的噪音部分中的相关性很高,所以基于所估算的背景噪音的功率而计算向放大器单元输出的增益控制值。以这样的方式,就能计算增益控制值,并且基本实时地执行控制。因此,可减少在开始增益控制之前的延迟时间。此外,由于在开始增益控制之前的声音信号不需要累积,所以可减少语音识别应用程序的响应的延迟或语音通信程序的语音质量的降低。
此外,通过平滑时间变化,可阻止增益上的突变。因此,可稳定诸如语音识别等后续处理。具体地,当基于声音信号而以预定时间间隔离散地获得增益控制值时,可阻止增益控制值中阶梯方式的明显变化,而不减小时间间隔。
此外,通过动态确定时间常数,可控制在功率目标值之后的增益控制值的后继性能。
此外,例如,当按下汽车导航系统的语音开关以停止由汽车音频单元引起的噪音,并在随后用户开始讲话时,仅执行用于增加增益的控制。因此,可阻止由于增益的增加而引起的声音接收单元的灵敏度的过度降低。从而可阻止例如语音识别处理或语音通信处理等后续处理的质量的降低。此外,例如,当在频繁改变噪音水平(noise level)的环境中使用声音处理装置时,仅执行用于减少增益的控制。因此,由于不会发生因为增益的增加而引起的音频水平(audio level)的过度增加,所以可阻止声音信号的饱和。
此外,通过调节增益控制值,使得增益的控制带宽处于控制范围内,可在放大器单元的控制范围内执行控制。
此外,由于在不包含语音的噪音部分中的相关性很高,所以基于所估算的背景噪音的功率来计算增益的目标值,并且选择声音信号,从而可获得所计算的增益。以这种方式,就能基本实时地计算增益控制值和基本实时地执行控制。因此,可减少在开始增益控制之前的延迟时间。此外,由于在开始增益控制之前的声音信号不需要累积,所以可减少语音识别应用程序的响应延迟或语音通信程序的语音质量的降低。
附图说明
图1是根据本发明第一示例性实施例的声音处理装置的示例性硬件配置的框图;
图2是根据本发明第一示例性实施例的声音处理装置的示例性特征的功能框图;
图3A和图3B是示出由根据本发明第一示例性实施例的声音处理装置的控制单元接收的声音信号的曲线图;
图4A是示出根据本发明第一示例性实施例在通过声音处理装置的方向声音接收处理分离的语音信号中的时间变化,图4B示出噪音信号中的时间变化;
图5是示出由根据本发明第一示例性实施例的声音处理装置的估算部估算的背景噪音的功率的时间变化曲线图;
图6是示出在根据本发明第一示例性实施例的声音处理装置中背景噪音的功率的时间变化和功率目标值的曲线图;
图7是示出在根据本发明第一示例性实施例的声音处理装置中的原始增益控制值和增益控制值的曲线图;
图8是根据本发明第一示例性实施例的声音处理装置执行的示例性处理的操作图;
图9是根据本发明第二示例性实施例的声音处理装置执行的示例性处理的操作图;
图10是示出根据第三示例性实施例在声音处理装置中的原始增益控制值和增益控制值的时间变化的曲线图;
图11是根据本发明第三示例性实施例的声音处理装置执行的示例性处理的操作图;
图12是根据本发明第四示例性实施例的声音处理装置的示例性特征的功能框图;
图13是根据本发明第四示例性实施例的声音处理装置执行的示例性处理的操作图;
图14是根据本发明第五示例性实施例的声音处理装置的示例性硬件配置的框图;
图15是根据本发明第五示例性实施例的声音处理装置的示例性特征的功能框图;
图16是示出根据本发明第五示例性实施例的声音处理装置中使用的增益表的细节的曲线图;
图17是根据本发明第五实施例的声音处理装置执行的示例性处理的操作图;
图18是根据本发明第六示例性实施例的声音处理装置的示例性特征的功能框图;
图19是根据本发明第七示例性实施例的声音处理装置的示例性特征的功能框图;
图20是根据本发明第八示例性实施例的声音处理系统的示例性硬件配置的框图;
图21是根据本发明第八示例性实施例的声音处理系统的示例性特征的功能框图;以及
图22是现有声音处理装置的功能框图。
具体实施方式
以下将参照附图描述本发明的各个示例性实施例。
第一示例性实施例
图1是根据本发明第一示例性实施例的声音处理装置的示例性硬件配置的框图。声音处理装置1包括:多个声音接收单元10,10,...,用于将包含由讲话者(speaker)发出的语音和噪音的输入声音转换成模拟声音信号;放大器单元11,11,...(例如,可变增益放大器),用于放大声音信号;A/D转换器12,12,...,用于将模拟声音信号转换成数字信号;和控制单元13,例如数字信号处理器(DSP)。
放大器单元11基于预设的增益控制值按放大度(amplification degree)对声音信号进行放大。每个A/D转换器12以例如8000Hz或12000Hz的采样频率对模拟声音信号采样,以将模拟声音信号转换成数字信号。然后,A/D转换器12将数字声音信号输出至控制单元13。声音处理装置1包括:多组声音接收单元10、放大器单元11和A/D转换器12。以下,描述包括两组声音接收单元10、放大器单元11和A/D转换器12的配置。此外,根据需要,将这两个声音接收单元10和10称作“第一声音接收单元10a”和“第二声音接收单元10b”。
控制单元13是包括固件(例如计算机程序100和数据)的算术电路。控制单元13执行以固件形式嵌入的计算机程序100。声音处理装置1还包括多种机构,例如处理机构、操作单元和输出机构,以用做系统,例如汽车导航系统。或者,声音处理装置1可通过使用在汽车导航系统中包括的计算机来实现。
图2是根据本发明第一示例性实施例的声音处理装置1的示例性特征的功能框图。通过执行计算机程序100,控制单元13产生程序模块,这些程序模块被用作:分离部130,基于所到达的方向来分离声音信号;估算部131,基于分离的声音信号来估算在声音信号中包括的背景噪音的功率;导出部132,基于背景噪音的估算功率和预定的功率目标值来计算要输出到放大器单元11的增益控制值;以及应用部133,基于包括讲话者(speaker)的语音的语音信号和通过分离部130分离的语音信号,执行语音识别处理或语音通信处理。这些程序模块的功能可由包括算术电路,例如超大规模集成电路(VLSI)的硬件来实现。
接下来描述根据本发明第一示例性实施例的声音处理装置1执行的信号处理。控制单元13基于由第一声音接收单元10a接收的声音接收数字声音信号,作为第一输入信号in_1(t),并且还基于由第二声音接收单元10b接收的声音接收数字声音信号,作为第二输入信号in_2(t)。变量t表示以例如8000Hz或12000Hz的采样频率对模拟声音信号采样时识别每个采样的采样号,并且将其转换成数字格式。
图3A和图3B是示出由控制单元13接收的声音信号的曲线图。在这些图中,横坐标表示与采样时间对应的采样号,纵坐标表示声音信号的振幅。图3A是第一输入信号in_1(t)的曲线图,图3B是第二输入信号in_2(t)的曲线图。通过配置第一声音接收单元10a和第二声音接收单元10b,以在其间具有适当的间距(spacing),根据声音到达的方向,基于由第一声音接收单元10a接收的声音和第二声音接收单元10b接收的声音而在声音信号之间出现相差。分离部130基于例如在第一输入信号in_1(t)和第二输入信号in_2(t)之间的相差估算声音到达的方向。然后,分离部130执行方向性声音接收处理,将声音信号分离成基于从预定目标方向(例如,朝向讲话者嘴(mouth)的方向)到达的声音的声音信号以及基于从其他方向到达的声音的声音信号。
在由分离部130执行的方向声音接收处理中,通过基于第一输入信号in_1(t)和第二输入信号in_2(t)来执行用以阻止目标方向之外的其他方向到达的声音的同步提取,来提取基于从目标方向(例如,由讲话者发出的语音)到达的声音的声音信号的语音信号signal(t)。随后,通过执行用以抑制(suppressing)从目标方向到达的声音的同步提取,来提取基于从目标方向之外的方向到达的声音的声音信号,即基于背景噪音的噪音信号noise(t)。
图4A和图4B是示出根据本发明第一示例性实施例的声音处理装置1执行的方向声音接收处理分离的声音信号中的时间变化的曲线图。在这些图中,横坐标表示与时间对应的采样号t,纵坐标表示声音信号的振幅。图4A是基于从预定目标方向到达的声音的声音信号,即语音信号signal(t)的曲线图,图4B是基于从预定目标方向之外的其他方向到达的声音的声音信号,即噪音信号noise(t)的曲线图。从语音信号signal(t)和噪音信号noise(t)之间的比较可以看出,针对语音信号的特定的峰值出现在语音信号signal(t)。分离部130将语音信号signal(t)输出至应用部133,应用部133基于语音信号signal(t)执行语音识别处理或语音通信处理。此外,分离部130将语音信号signal(t)和噪音信号noise(t)输出至估算部131。
通过使用输入的语音信号signal(t)和噪音信号noise(t),估算部131在帧对帧的层面上产生语音信号signal(n)和噪音信号noise(n),其中一个帧包括例如512个采样信号。这里,变量n是识别每个帧的帧号。随后,估算部131使用以下等式(1)来估算背景噪音的功率pow_noise(n),所述等式(1)用于计算在基于帧的语音信号signal(n)和基于帧的噪音信号noise(n)之间的关联:
其中pow_noise(n)是背景噪音的功率,n是帧号,signal(n)是语音信号,noise(n)是噪音信号。
图5是示出由声音处理装置1的估算部131估算的背景噪音的功率pow_noise(n)的时间变化曲线图。在该图中,横坐标表示与时间对应的帧号n,纵坐标表示以分贝为单位的背景噪音的功率pow_noise(n)。通过计算基于到达的方向而分离的语音信号signal(n)和噪音信号noise(n)之间的关联,以及通过使用表示与背景噪音有关的信号相关性高于与语音有关的信号相关性的特征,可估算背景噪音的功率pow_noise(n)。此外,通过以这样的方式估算相关性,可减少语音和噪音不规则(erratic)的效果。随后,估算部131将表示背景噪音的功率pow_noise(n)的信息输出至导出部132。
导出部132通过使用背景噪音的功率pow_noise(n)和预定的功率目标值ref以及通过使用以下等式(2)来计算原始增益控制值adj’(n),该值是输出至放大器单元11和11的增益控制值adj(n)的来源,
adj′(n)=ref-pow_noise(n)(2)
其中adj’(n)是原始增益控制值,ref是功率目标值。
图6是示出在声音处理装置1中背景噪音的功率pow_noise(n)和功率目标值ref的时间变化的曲线图。在该图中,横坐标表示与时间对应的帧号n,纵坐标表示以分贝为单位的背景噪音的功率pow_noise(n)和功率目标值ref。在图6中,实线表示背景噪音的功率pow_noise(n),虚线表示功率目标值ref。使用等式(2)获得的原始增益控制值adj’(n)是背景噪音的功率pow_noise(n)与功率目标值之间的差值。在声音处理装置1中,确定放大器单元11和11的增益控制值adj(t),从而背景噪音的功率pow_noise(n)等于功率目标值ref。这样,调节声音接收单元10和10的灵敏度。
此外,导出部132通过使用以下等式对原始增益控制值adj’(n)的时间变化进行平滑来计算向放大器单元11输出的增益控制值adj(t):
adj(t)=α·adj(t-1)+(1-α)·adj′(n)(3)
其中adj(t)是增益控制值,α是大于或等于0和小于1的时间常数。
图7是示出在声音处理装置1中的原始增益控制值adj’(n)和增益控制值adj(t)的曲线图。在该图中,横坐标表示与采样时间对应的采样号t,纵坐标表示以分贝为单位的增益控制的量。在图7中,虚线表示具有帧号n的变量的原始增益控制值adj’(n),实线表示具有采样号t的变量的增益控制值adj(t)。由于原始增益控制值adj’(n)的变量是帧号n,所以将帧号n转换成采样号t。之后,示出该转换。在本实施例所示的实例中,由于512个采样对应于一个帧,所以原始增益控制值adj’(n)的值形成具有以阶梯形式变化的离散值的曲线。然而,由于使用等式(3)进行平滑的增益控制值adj(t)的时间变化针对于采样号t连续变化,所以该增益不是离散的或突然变化的。随后,导出部132输出所计算增益控制值adj(t)至放大器单元11和11,其将输入的增益控制值adj(t)设置为增益。
接下来,参照图8描述由声音处理装置1执行的示例性处理。声音处理装置1基于由第一声音接收单元10a和第二声音接收单元10b接收的声音产生声音信号,如操作S101。然后,声音处理装置1输出所产生的声音信号中的每一个至放大器单元11和11中对应的一个。
放大器单元11和11中的每一个基于所设置的增益控制值放大由声音接收单元10和10中对应的一个产生的声音信号,如操作S102,并输出所放大的声音信号至A/D转换器12和12中对应的一个。
A/D转换器12和12执行A/D转换处理,用于将模拟声音信号转换成数字信号,如操作S103。之后,A/D转换器12和12输出第一输入信号in_1(t)和第二输入信号in_2(t)至控制单元13。
通过由分离部130执行的处理,控制单元13基于第一输入信号in_1(t)和第二输入信号in_2(t)来估算到达的方向,并且分离出基于从目标方向到达的声音的声音信号,即基于从讲话者发出的语音的语音信号signal(t),以及基于从目标方向之外的其他方向到达的声音的声音信号,即基于背景噪音的噪音信号noise(t),如操作S104。
通过估算部131执行的处理,控制单元13基于语音信号signal(t)和噪音信号noise(t)之间的相关性来估算背景噪音的功率pow_noise(n),如操作S105。
通过导出部132执行的处理,控制单元13基于背景噪音的功率pow_noise(n)和功率目标值ref计算原始增益控制值adj’(n),如操作S106。通过平滑化原始增益控制值adj’(n)的时间变化,控制单元13计算增益控制值adj(t),如操作S107。然后,控制单元13输出所计算的增益控制值adj(t)至放大器单元11和11。
放大器单元11和11基于输入的增益控制值adj(t)设置增益,如操作S108。将操作S104中分离的语音信号signal(t)输出至应用部133。应用部133基于语音信号signal(t)执行语音识别处理或语音通信处理。
第二示例性实施例
基于在第一示例性实施例的配置中背景噪音的功率的估算结果和功率目标值之间的比较结果,第二示例性实施例确定是否需要增益控制值的计算。由于第二示例性实施例的示例性硬件配置和特征与第一示例性实施例中的相同,所以不再重复描述。在以下的说明中,在描述中使用类似的标号描述与上述第一示例性实施例中所用组件类似的组件。
在第二示例性实施例中,导出部132将背景噪音的功率pow_noise(n)与预定的功率目标值ref相比较。仅当大小关系满足预定条件时,导出部132才更新增益控制值adj(t)。更具体地,在第二示例性实施例中,仅当背景噪音的功率pow_noise(n)大于功率目标值ref时,更新增益控制值adj(t)。在第二示例性实施例中,使用以下的条件等式(4)来代替等式(2):
if(pow_noise(n)>ref)
then adj′(n)=ref-pow_noise(n)
else adj′(n)=0(4)
如条件等式(4)所示,在第二示例性实施例中,如果背景噪音的功率pow_noise(n)大于功率目标值ref,则使用与第一示例性实施例中描述的等式(2)类似的等式计算原始增益控制值adj’(n)。然而,如果背景噪音的功率pow_noise(n)小于或等于功率目标值ref,则将原始增益控制值adj’(n)设置为“0”。为了从原始增益控制值adj’(n)获得增益控制值adj(t),使用在第一示例性实施例中描述的等式(3)。因此,在第二示例性实施例中,仅在背景噪音的功率pow_noise(n)大于功率目标值时,才更新增益控制值adj(t)。
接下来,参照图9描述根据第二示例性实施例的声音处理装置1执行的示例性处理。在第二示例性实施例中,用基于上述条件等式(4)的处理来替换图8的操作图中所示的根据第一示例性实施例的操作S106的处理。
首先,声音处理装置1执行在第一示例性实施例中所述的操作S101至S105。随后,通过由导出部132执行的处理,控制单元13确定背景噪音的功率pow_noise(n)是否大于功率目标值ref,如操作S201。
如果在操作S201中背景噪音的功率pow_noise(n)大于功率目标值ref(在操作S201中为“是”),则通过由导出部132执行的处理,控制单元13基于背景噪音的功率pow_noise(n)和功率目标值ref计算原始增益控制值adj’(n),如操作S202。
如果在操作S202中背景噪音的功率pow_noise(n)小于或等于功率目标值ref(在操作S201中为“否”),则由导出部132执行的处理,控制单元13将原始增益控制值adj’(n)设置为“0”,如操作S203。
随后,声音处理装置1执行在第一示例性实施例中所述的操作S107之后的处理。在该方法中,仅当背景噪音的功率pow_noise(n)大于功率目标值ref时,更新增益控制值adj(t)。因此,例如,可在按下汽车导航系统的语音开关以停止由汽车音频单元产生的噪音,并随后用户开始讲话的情况下,采用该方法。这样,由于没有发生因为增益的增加而导致的声音接收单元10和10的灵敏度的过度增加,所以可阻止声音信号的饱和。
仅当背景噪音的功率pow_noise(n)小于功率目标值时,更新增益控制值adj(t),将条件表达式(4)改变成以下条件表达式(5):
if(pow_noise(n)<ref)
then adj′(n)=ref-pow_noise(n)
else adj′(n)=0(5)
在该方法中,通过使用条件表达式(5),仅当背景噪音的功率pow_noise(n)小于功率目标值ref时,更新增益控制值adj(t)。因此,例如,可对于噪音水平频繁改变的情况下使用该方法。因此,由于不会发生增益减少所带来的音频水平的过度减少,所以可阻止声音信号的保护。
第三示例性实施例
在第三示例性实施例中,根据在第一示例性实施例的配置中所获得的原始增益控制值和先前的增益控制值之间的大小关系来确定时间常数。由于第三示例性实施例的示例性硬件配置和特征与第一示例性实施例中的相同,所以不再重复描述。在以下的说明中,在描述中使用类似的标号描述与上述第一示例性实施例中所用组件类似的组件。
在第三示例性实施例中,导出部132将所获得的原始增益控制值adj’(n)和先前的增益控制值adj(t-1)相比较。如果所获得的原始增益控制值adj’(n)小于先前的增益控制值adj(t-1),则使用第一时间常数α1(0≤α1<1)。然而,如果所获得的原始增益控制值adj’(n)大于或等于先前的增益控制值adj(t-1),则使用第二时间常数α2(0≤α2<1)。在第三示例性实施例中,使用以下的条件等式(6)代替等式(3):
if(adj(t-1)<adj′(n))
then adj(t)=α1·adj(t-1)+(1-α1)·adj′(n)
else adj(t)=α2·adj(t-1)+(1-α2)·adj′(n)(6)
其中α1是大于或等于0并且小于1的第一时间常数,α2是大于或等于0并且小于1的第二时间常数。
如条件表达式(6)所示,当增益控制值adj(t)随时间减少时,可通过基于原始增益控制值adj’(n)和先前的增益控制值adj(t-1)来确定时间常数,具体地,通过将第二时间常数α2设置为大于第一时间常数α1的值,来相对增加在平滑化之前随着原始增益控制值adj’(n)的增益控制值adj(t)的后继性能。在将第二时间常数α2设置为小于第一时间常数α1的值的情况下,当增益控制值adj(t)随时间减少时,可相对增加在平滑化之前随着原始增益控制值adj’(n)的增益控制值adj(t)的后继性能。
图10是示出根据本发明第三示例性实施例在声音处理装置1中原始增益控制值adj’(n)和增益控制值adj(t)的时间变化的曲线图。在该图中,横坐标表示与采样时间对应的采样号t,纵坐标表示以分贝为单位上的增益控制的数量。在图10中,虚线表示以帧号n为变量的原始增益控制值adj’(n),实线表示以采样号t为变量的增益控制值adj(t)。由于原始增益控制值adj’(n)的变量是帧号n,所以将帧号n转换成采样号t。之后,示出这种转换。在图10中,第一时间常数α1与第一示例性实施例的时间常数α的值相同,第二时间常数α2大于第一示例性实施例的值。从与第一示例性实施例的图7相比较可以看出,当增益控制值adj(t)随时间减少时,使用大于第一示例性实施例的时间常数α的第二时间常数α2。以这种方式,可增加在平滑化之前跟随在原始增益控制值adj’(n)之后的增益控制值adj(t)的后继性能。
接下来,描述根据本发明第三示例性实施例的由声音处理装置1执行的示例性处理。图11是根据本发明第三示例性实施例的声音处理装置1执行的示例性处理的操作图。在第三示例性实施例中,通过基于上述条件表达式(6)的处理代替在第一示例性实施例中所述的操作图的操作S107中执行的处理。
首先,声音处理装置1执行在第一示例性实施例中所述的操作S101至S106。随后,通过由导出部132执行的处理,声音处理装置1的控制单元13比较原始增益控制值adj’(n)和先前的增益控制值adj(t-1),以确定原始增益控制值adj’(n)是否大于先前的增益控制值adj(t-1),如操作S301。
如果在操作S301中原始增益控制值adj’(n)大于先前的增益控制值adj(t-1)(在操作S301中为“是”),则通过由导出部132执行的处理,声音处理装置1的控制单元13确定要平滑化为第一时间常数α1的时间常数,如操作S302。通过使用所确定的第一时间常数α1来平滑化原始增益控制值adj’(n)的时间变化,控制单元13计算增益控制值adj(t),如操作S303。
然而,如果在操作S301中原始增益控制值adj’(n)小于或等于先前的增益控制值adj(t-1)(在操作S301中为“否”),则通过由导出部132执行的处理,声音处理装置1的控制单元13确定要平滑化为大于第一时间常数α1的第二时间常数α2的时间常数,如操作S304。通过使用所确定的第二时间常数α2来平滑化原始增益控制值adj’(n)的时间变化,控制单元13计算增益控制值adj(t),如操作S305。
之后,声音处理装置1执行在第一示例性实施例所述的操作S108之后的处理。
第四示例性实施例
在第四示例性实施例中,改变在第一示例性实施例中的放大器单元的控制方法。由于第四示例性实施例的示例性硬件配置与第一示例性实施例中的相同,所以不再重复描述。在以下的说明中,在描述中使用类似的标号描述与上述第一示例性实施例中所用组件类似的组件。
图12是根据本发明第四示例性实施例的声音处理装置1的示例性特征的功能框图。通过根据本实施例执行计算机程序100,控制单元13产生用作分离部130、估算部131、导出部132和应用部133的程序模块。
接下来描述根据第四示例性实施例的声音处理装置1执行的信号处理。在第一示例性实施例中,从控制单元13输出至放大器单元11和11的增益控制值adj(t)是增益的相关值,其是针对于在执行校正之前的增益的差值。如果放大器单元11和11具有基于该差值自动校正增益的功能,则可基于输入增益控制值adj(t)执行增益控制,而不会出现问题。然而,如果放大器单元11和11不具有这种功能,并且直接使用输入增益控制值adj(t)用于增益,则需要转换增益控制值adj(t),以变为增益本身。在第四示例性实施例中,根据作为相对值的增益控制值adj(t)来计算出作为绝对值的增益控制值amp_gain(t)。此外,执行使用所计算的增益控制值amp_gain(t)的控制,从而放大器单元11和11中的每个的增益控制范围保持在由最大值和最小值所确定的给定的控制范围内。
在第四示例性实施例中,导出部132使用以下等式根据增益控制值adj(t)计算累加值total_adj(t),其中增益控制值adj(t)是相对于先前的增益控制值adj(t-1)的值,所述等式如下:
total_adj(t)=total_adj(t-1)+adj(t)(7)
其中total_adj(t)是adj(t)的累加值。
此外,导出部132调节累加值,从而使用以下条件等式将增益控制范围保持在由放大器单元11的规格(specification)所确定的最大值max_amp_gain和最小值min_amp_gain之间的给定控制范围内,所述等式如下:
if((total_adj(t)+init_amp_gain)>max_amp_gain)
then total_adj(t)=max_amp_gain-init_amp_gain
if((total_adj(t)+init_amp_gain)<min_amp_gain)
then total_adj(t)=min_amp_gain-init_amp_gain(8)
其中max_amp_gain是放大器单元11和11的增益的最大值,min_amp_gain是放大器单元11和11的增益的最小值,init_amp_gain是放大器单元11和11的增益的初始值。
此外,导出部132使用以下等式计算作为放大器单元11和11的绝对控制值的增益控制值amp_gain(t),所述等式如下:
amp_gain(t)=total_adj(t)+init_amp_gain(9)
其中amp_gain(t)是增益控制值。
接下来描述根据本发明第四示例性实施例的声音处理装置1执行的示例性处理。图13是根据本发明第四示例性实施例的声音处理装置1执行的示例性处理的操作图。在第四示例性实施例中,在完成第一示例性实施例中所述的操作图的操作S107中执行的处理之后,执行基于上述等式(7)至(9)的处理。
首先,声音处理装置1执行在第一示例性实施例中所述的操作S101至S107。随后,通过由导出部132执行的处理,声音处理装置1的控制单元13根据所获得的增益控制值adj(t)和先前的增益控制值adj(t-1)计算累积值total_adj(t),如操作S401。随后,控制单元13调节所计算的累积值total_adj(t),使得累积值total_adj(t)落于由放大器单元11的规格确定的最大值max_amp_gain和最小值min_amp_gain之间的控制范围之内,如操作S402。
之后,通过由导出部132执行的处理,声音处理装置1的控制单元13根据所调节的累积值total_adj(t)和放大器单元11和11的增益的初始值init_amp_gain计算用于控制放大器单元11和11的增益控制值amp_gain(t)的绝对值,如操作S403。然后,控制单元13输出所获得的增益控制值amp_gain(t)至放大器单元11和11。
声音处理装置1的放大器单元11和11将输入增益控制值amp_gain(t)设置为增益,如操作S404。调节累积值total_adj(t)使得累积值total_adj(t)落于最大值max_amp_gain和最小值min_amp_gain之间的给定控制范围之内的方法不限于此。例如,可采用多种其他方法中的一种。
第五示例性实施例
尽管在第一示例性实施例中控制放大器单元的增益,但是在第五示例性实施例中使用了具有不同增益的多组放大器单元。在以下的说明中,在描述中使用类似的标号描述与上述第一示例性实施例中所用组件类似的组件,且不再重复对其的描述。
图14是根据本发明第五示例性实施例的声音处理装置1的示例性硬件配置的框图。根据第五示例性实施例,声音处理装置1包括多组放大器单元11和11...,每组对具有固定增益的声音信号进行放大。各组的增益不同。在假设使用三组放大器单元11、11和11的情况下进行以下说明。根据需要,将具有最大增益的组的放大器单元11和11指定为第一放大器单元11a和11a。将具有第二大增益的组的放大器单元11和11指定为第二放大器单元11b和11b。将具有最小增益的组的放大器单元11和11指定为第三放大器单元11c和11c。此外,A/D转换器12、12...中的每个连接至放大器单元11中对应的一个。将对应于A/D转换器12、12、...中每一个转换成数字信号的每一个声音信号输出至控制单元13。
图15是根据本发明第五示例性实施例的声音处理装置1的示例性特征的功能框图。通过根据本发明实施例执行计算机程序100,控制单元13产生程序模块,用作:多个分离部130、130和130,估算部131、用于计算增益的目标值的导出部132,应用部133,以及基于增益的目标值和放大器单元11、11和11中每一个的增益选择声音信号的选择部134。导出部132包括增益表132a,其表示在增益的目标值和声音信号的选择所需的系数之间的关系。
多个分离部130、130和130分别对应于第一放大器单元11a和11a、第二放大器单元11b和11b、以及第三放大器单元11c和11c。之后,根据需要,将与第一放大器单元11a和11a对应的分离部130指定为第一分离部130a。将与第二放大器单元11b和11b对应的分离部130指定为第二分离部130b。类似地,将与第三放大器单元11c和11c对应的分离部130指定为第三分离部130c。
接下来,描述根据本发明第五示例性实施例的由声音处理装置1执行的示例性处理。在控制单元13中,第一声音接收单元10a接收声音,并且第一放大器单元11a放大声音信号。将所放大的声音信号转换成数字声音信号。第一分离部130a接收数字声音信号作为第一高增益输入信号in_1_H(t)。此外,第二声音接收单元10b接收声音,并且第一放大器单元11a放大声音信号。将所放大的声音信号转换成数字声音信号。第一分离部130a接收数字声音信号作为第二高增益输入信号in_2_H(t)。此外,在控制单元13中,第二放大器单元11b基于由第一声音接收单元10a接收的声音来放大声音信号。将所放大的声音信号转换成数字声音信号。第二分离部130b接收数字声音信号作为第一中增益输入信号in_1_M(t)。此外,第二放大器单元11b基于由第二声音接收单元10b接收的声音放大声音信号。将所放大的声音信号转换成数字声音信号。第二分离部130b接收数字声音信号作为第二中增益输入信号in_2_M(t)。此外,在控制单元13中,第三放大器单元11c基于由第一声音接收单元10a接收的声音来放大声音信号。将所放大的声音信号转换成数字声音信号。第三分离部130c接收数字声音信号作为第一低增益输入信号in_1_L(t)。此外,第三放大器单元11c和11c基于由第二声音接收单元10b接收的声音放大声音信号。将所放大的声音信号转换成数字声音信号。第三分离部130c接收数字声音信号作为第二低增益输入信号in_2_L(t)。
在由第一分离部130a执行的方向声音接收处理中,基于第一高增益输入信号in_1_H(t)和第二高增益输入信号in_2_H(t)来提取基于从目标方向到达的声音(即,基于由讲话者发出的语音)的高增益语音信号signal_H(t)。在由第二分离部130b执行的方向声音接收处理中,基于第一中增益输入信号in_1_M(t)和第二中增益输入信号in_2_M(t)来提取基于从目标方向到达的语音的中增益语音信号signal_M(t)。此外,在由第三分离部130c执行的方向声音接收处理中,基于第一低增益输入信号in_1_L(t)和第二低增益输入信号in_2_L(t)来提取基于从目标方向到达的语音的低增益语音信号signal_L(t)。此外,提取基于从目标方向之外的其他方向到达的声音(即,基于背景噪音)的噪音信号noise(t)。
第一分离部130a、第二分离部130b和第三分离部130c向选择部134分别输出高增益语音信号signal_H(t)、中增益语音信号signal_M(t)和低增益语音信号signal_L(t)。此外,第三分离部130c向估算部131输出低增益语音信号signal_L(t)和噪音信号noise(t)。
估算部131向导出部132输出信息,所述信息表示基于所输入的低增益语音信号signal_L(t)和噪音信号noise(t)估算的背景噪音的功率pow_noise(n)。
导出部132基于背景噪音的功率pow_noise(n)和预定的功率目标值ref计算增益控制值amp_gain(t)。可使用用于获得在第四示例性实施例中所述的增益控制值amp_gain(t)的方法计算增益控制值amp_gain(t)。
此外,导出部132基于增益控制值amp_gain(t)和增益表132a计算用于高增益语音信号signal_H(t)的高增益系数select_gain_H(t)、用于中增益语音信号signal_M(t)的中增益系数select_gain_M(t)以及用于低增益语音信号signal_L(t)的低增益系数select_gain_L(t)。
图16是示出根据本发明第五示例性实施例的声音处理装置1中使用的增益表132a的细节的曲线图。在图16中,横坐标表示增益控制值amp_gain(t),纵坐标表示系数的值。在图16中,实线表示高增益系数select_gain_H(t),虚线表示中增益系数select_gain_M(t),点划线表示低增益系数select_gain_L(t)。通过使用图16中用曲线所示的增益表132a,可计算高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t)。如图16所示,高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t)中每个的范围为从0至1。这些值的总和始终为1。随后,导出部132向选择部134输出高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t)。
选择部134使用以下等式从高增益语音信号signal_H(t)、中增益语音信号signal_M(t)、低增益语音信号signal_L(t)、高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t)产生向应用部133输出的语音信号signal(t),所述等式为:
signal(t)=select_gain_H(t)·signal_H(t)
+select_gain_M(t)·signal_M(t)
+select_gain_L(t)·signal_L(t)(10)
其中signal(t)是语音信号,select_gain_H(t)是高增益系数,signal_H(t)是高增益语音信号,select_gain_M(t)是中增益系数,signal_M(t)是中增益语音信号,select_gain_L(t)是低增益系数,signal_L(t)是低增益语音信号。
接下来,描述根据由本发明第五实施例的声音处理装置1执行的示例性处理。图17是根据本发明第五实施例的声音处理装置1执行的示例性处理的操作图。声音处理装置1基于由第一声音接收单元10a和第二声音接收单元10b接收的声音产生声音信号,如操作S501,并且向第一放大器单元11a和11a、第二放大器单元11b和11b以及第三放大器单元11c和11c输出所产生的声音信号。
声音处理装置1的第一放大器单元11a和11a、第二放大器单元11b和11b以及第三放大器单元11c和11c将声音接收单元10和10产生的声音信号以其各自的固定增益进行放大,如操作S502,并向对应的A/D转换器12、12、...输出所放大的声音信号。
声音处理装置1的A/D转换器12、12、...执行A/D转换处理,如操作S503,并向控制单元13输出第一高增益输入信号in_1_H(t)、第二高增益输入信号in_2_H(t)、第一中增益输入信号in_1_M(t)、第二中增益输入信号in_2_M(t)、第一低增益输入信号in_1_L(t)和第二低增益输入信号in_2_L(t)。
通过由分离部130、130、...执行的处理,声音处理装置1的控制单元将高增益语音信号signal_H(t)、中增益语音信号signal_M(t)、低增益语音信号signal_L(t)和噪音信号noise(t)彼此分离,如操作S504。
通过估算单元131执行的处理,声音处理装置1的控制单元13基于在低增益语音信号signal_L(t)和噪音信号noise(t)之间的相关性估算背景噪音的功率pow_noise(n),如操作S505,以及基于背景噪音的功率pow_noise(n)和功率目标值ref计算原始增益控制值adj’(n),如操作S506。然后,控制单元13通过平滑化在所计算的原始增益控制值adj’(n)中的时间变化计算增益控制值adj(t),如操作S507。
此外,通过估算部131执行的处理,声音处理装置1的控制单元13基于增益控制值adj(t)计算增益控制值amp_gain(t),如操作S508。然后控制单元13基于增益控制值amp_gain(t)和增益表132a计算高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t),如操作S509。随后,控制单元13向选择部134输出高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t)。
此外,通过选择部134执行的处理,声音处理装置1的控制单元13根据高增益语音信号signal_H(t)、中增益语音信号signal_M(t)、低增益语音信号signal_L(t)、高增益系数select_gain_H(t)、中增益系数select_gain_M(t)和低增益系数select_gain_L(t)产生语音signal(t),如操作S510。在操作S510中,从按它们自己的增益放大的声音信号中选择作为处理目标的至少一个语音信号,并且如果选择多个语音信号,则产生具有依据系数的校正水平的语音信号。即,如果一个系数是“1”,则产生与该系数相关的语音信号作为用于处理目标的语音信号signal(t)。例如,当高增益系数select_gain_H(t)是“1”,中增益系数select_gain_M(t)是“0”,低增益系数select_gain_L(t)是“0”时,将高增益语音信号signal_H(t)设置为作为处理目标的signal(t)。或者,如果出现大于“0”并且小于“1”的多个系数,则通过按系数所指示的比例组合与这些系数相关的语音信号来产生语音信号signal(t)。例如,当高增益系数select_gain_H(t)是“0”,中增益系数select_gain_M(t)是“0.4”,低增益系数)是“0.6”时,通过按4:6的比例对中增益语音信号signal_M(t)和低增益语音信号signal_L(t)加权平均来产生语音信号signal(t)。或者,取代选择声音信号,选择部134可选择放大器单元11和11,并且允许仅仅所选择的放大器单元11和11运行,以产生语音信号signal(t)。将操作S510中产生的语音信号signal(t)输出至应用部133。应用部133基于语音信号signal(t)执行语音识别处理或语音通信处理。
第六示例性实施例
在第六示例性实施例中,在考虑增益时,第一示例性实施例的应用部执行处理。由于第六示例性实施例的示例性硬件配置与第一示例性实施例中的相同,所以不再重复描述。在以下的说明中,在描述中使用类似的标号描述与上述第一示例性实施例中所用组件类似的组件。
图18是根据本发明第六示例性实施例的声音处理装置1的示例性特征的功能框图。通过执行根据本发明实施例的计算机程序100,控制单元13产生用作:分离部130、估算部131、导出部132和应用部133的程序模块。
接下来描述根据本发明第六示例性实施例的声音处理装置1执行的信号处理。如在第一至第五示例性实施例中所述,在声音处理装置1中,对于由放大器单元11和11执行的增益控制动态改变向应用部133输入的语音信号signal(t)的增益。因此,第六示例性实施例的声音处理装置1输出由导出部132计算的增益控制值amp_gain(t)至放大器单元11和11。同时,声音处理装置1输出累积值total_adj(t)至应用部133,所述累积值total_adj(t)作为增益控制值adj(t)的累积值。可通过使用用于计算第四示例性实施例中所述的增益控制值amp_gain(t)和累积值total_adj(t)的方法,来获得增益控制值amp_gain(t)和累积值total_adj(t)。
随后,通过利用由增益控制值adj(t)的累积值total_adj(t)表示的增益,应用部133校正语音信号signal(t)。然后,应用部133基于所校正的语音信号signal(t)执行语音识别处理或语音通信处理。
第七示例性实施例
在第七示例性实施例中,将通过考虑增益而校正的语音信号输入至作为第一示例性实施例的扩展的第六示例性实施例的应用部。由于第七示例性实施例的示例性硬件配置与第一示例性实施例中的相同,所以不再重复描述。在以下的说明中,在描述中使用类似的标号描述与上述第六示例性实施例中所用组件类似的组件。
图19是根据本发明第七示例性实施例的声音处理装置1的示例性特征的功能框图。通过执行根据本发明实施例的计算机程序100,控制单元13产生用作分离部130、估算部131、导出部132、应用部133和用于校正语音信号signal(t)的校正部135的程序模块。
接下来描述根据本发明第七示例性实施例的声音处理装置1执行的信号处理。在根据第七示例性实施例的声音处理装置1中,分离部130将语音信号signal(t)输出至校正部135。此外,导出部132将增益控制值adj(t)的累积值total_adj(t)输出至校正部135。
校正部135使用以下等式计算增益的校正值gain_cor(t),所述等式:
gai_cor(t)=10-total_adj(t)/10 (11)
其中gain_cor(t)是增益的校正值,total_adj(t)是增益控制值adj(t)的累积值。
此外,校正部135通过使用以下等式校正语音信号signal(t)产生校正信号signal_cor(t),所述等式:
signal_cor(t)=gain_cor(t)·signal(t)(12)
其中signal_cor(t)是校正信号。
随后,校正部135将校正信号signal_cor(t)输出至应用部133。应用部133基于校正信号signal_cor(t)执行语音识别处理或语音通信处理。
第八示例性实施例
通过给根据使用多个装置的第一示例性实施例配置与声音处理装置对应的系统来实现第八示例性实施例。在以下的说明中,在描述中使用类似的标号描述与上述第一示例性实施例中所用组件类似的组件。
图20是根据本发明第八示例性实施例的声音处理系统的示例性硬件配置的框图。根据本发明第八示例性实施例,声音处理系统包括:声音接收装置2,具有声音接收单元10和10、放大器单元11和11以及A/D转换器12和12;增益控制装置3,例如DSP;和处理装置4,用于执行例如语音识别处理或语音通信处理。
图21是根据本发明第八示例性实施例的声音处理系统的示例性特征的功能框图。增益控制装置3用作分离部130、估算部131和导出部132。处理装置4用作第一示例性实施例的应用部133,用于执行例如语音识别处理或语音通信处理。
由于根据第八示例性实施例的装置的操作与第一示例性实施例的对应配置类似,所以不再重复其描述。
应该理解,上述第一至第八示例性实施例仅是本发明的多个实施例。可对其硬件和软件配置进行适当的确定。此外,除了上述基本处理之外,还可组合多种处理。此外,根据需要,也可以组合某些或所有上述第一至第八示例性实施例。
Claims (8)
1.一种声音处理装置,用于处理所接收的声音,所述声音处理装置包括:
多个声音接收单元,所述多个声音接收单元中的每一个都接收声音,并将所述声音转换成声音信号;
多个放大器,所述多个放大器中的每一个都基于预定的增益控制值来控制用于放大所述声音信号的增益;
分离部,分离由所述多个声音接收单元所转换的所述声音信号,使得所述声音信号被分成与来自预定方向的声音对应的第一声音信号以及来自所述预定方向之外的其他方向的第二声音信号;
估算部,基于所述第一声音信号和第二声音信号之间的相关性,估算在所述第一声音信号和所述第二声音信号中包括的背景噪音的功率;以及
导出部,通过所估算的所述背景噪音的功率以及一功率目标值,导出向所述多个放大器输出的增益控制值,其中,所述多个放大器中的每一个基于所述增益控制值控制所述增益。
2.根据权利要求1所述的声音处理装置,其中所述导出部计算所述背景噪音的功率和所述的功率目标值之间的差值,并通过平滑所述差值的的时间变化来计算所述增益控制值。
3.根据权利要求2所述的声音处理装置,其中所述导出部基于在所计算的差值和先前获得的增益控制值之间的大小关系来计算表示平滑程度的时间常数,并基于所述时间常数来平滑所述差值中的所述时间变化。
4.根据权利要求1所述的声音处理装置,其中仅当所估算的背景噪音的功率大于所述功率目标值时,或仅当所估算的背景噪音的功率小于所述功率目标值时,所述导出部计算增益控制值。
5.根据权利要求1所述的声音处理装置,其中所述导出部计算在所述多个放大器的属性范围内的增益控制值。
6.一种声音处理装置,用于处理所接收的声音,所述声音处理装置包括:
多个声音接收单元,所述多个声音接收单元中的每一个都接收第一声音和第二声音,并输出分别与所接收的第一声音和第二声音对应的第一声音信号和第二声音信号;
多个放大器,所述多个放大器中的每一个都基于增益控制值来放大所述第一声音信号和第二声音信号;
分离部,基于由所述多个放大器中的每一个所放大的第一声音信号和第二声音信号来分离第三声音信号和第四声音信号,所述第三声音信号对应于来自预定方向的声音,所述第四声音信号对应于来自所述预定方向之外的其他方向的声音;
估算部,基于在所述第三声音信号和第四声音信号之间的相关性来估算在所述第三声音信号和第四声音信号中包括的背景噪音的功率;
导出部,通过所估算的所述背景噪音的功率以及一预定的功率目标值,导出向成对的放大器输出的所述增益控制值;以及
选择部,基于目标增益和所存储的与所述多个放大器中的每一个对应的每个增益值,在自所述多个放大器输出的多个所述第一信号和第二信号中选择要处理的所述第一声音信号和第二声音信号。
7.一种增益控制装置,其能够与声音接收装置连接,所述声音接收装置包括放大器,用于放大由多个接收单元接收的声音信号,所述声音信号是在噪音环境下接收的,所述增益控制装置包括:
分离部,基于由所述放大器中的每一个所放大的第一声音信号和第二声音信号来分离第三声音信号和第四声音信号,所述第三声音信号对应于来自预定方向的声音,所述第四声音信号对应于来自所述预定方向之外的其他方向的声音;
估算部,基于在所述第三声音信号和第四声音信号之间的相关性来估算在所述第三声音信号和第四声音信号中包括的背景噪音的功率;以及
导出部,通过所估算的所述背景噪音的功率以及一预定的功率目标值,导出向成对的放大器输出的增益控制值。
8.一种使得计算机控制放大器的增益的方法,所述放大器用于放大自接收声音的声音接收器输出的声音信号,所述方法包括以下操作:
分离操作,基于由所述放大器所放大的声音信号来分离第三声音信号和第四声音信号,所述第三声音信号对应于来自预定方向的声音,所述第四声音信号对应于来自所述预定方向之外的其他方向的声音;
估算操作,基于在所述第三声音信号和第四声音信号之间的相关性,估算在所述声音信号中包含的背景噪音的功率;以及
计算操作,通过所估算的背景噪音的功率以及一预定的功率目标值,计算要给所述放大器设置的增益控制值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007-238144 | 2007-09-13 | ||
JP2007238144A JP4854630B2 (ja) | 2007-09-13 | 2007-09-13 | 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム |
JP2007238144 | 2007-09-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101388216A CN101388216A (zh) | 2009-03-18 |
CN101388216B true CN101388216B (zh) | 2012-06-27 |
Family
ID=40348773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101491467A Active CN101388216B (zh) | 2007-09-13 | 2008-09-12 | 声音处理装置、控制增益的装置和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8473291B2 (zh) |
JP (1) | JP4854630B2 (zh) |
CN (1) | CN101388216B (zh) |
DE (1) | DE102008039276B4 (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130246060A1 (en) * | 2010-11-25 | 2013-09-19 | Nec Corporation | Signal processing device, signal processing method and signal processing program |
JP5857403B2 (ja) * | 2010-12-17 | 2016-02-10 | 富士通株式会社 | 音声処理装置および音声処理プログラム |
EP2485395B1 (en) * | 2011-02-04 | 2013-05-01 | Harman International Industries Ltd. | Audio Mixing Console avoiding Signal Level Overload |
US9037276B2 (en) * | 2011-04-06 | 2015-05-19 | International Business Machines Corporation | Dynamic setting of increments on an amplitude scale |
DE112011105136B4 (de) * | 2011-04-08 | 2018-12-13 | Mitsubishi Electric Corporation | Spracherkennungsvorrichtung und Navigationsvorrichtung |
GB2491173A (en) * | 2011-05-26 | 2012-11-28 | Skype | Setting gain applied to an audio signal based on direction of arrival (DOA) information |
GB2493327B (en) | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
JP5817368B2 (ja) * | 2011-09-13 | 2015-11-18 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
GB2495129B (en) | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
GB2495130B (en) | 2011-09-30 | 2018-10-24 | Skype | Processing audio signals |
GB2495278A (en) | 2011-09-30 | 2013-04-10 | Skype | Processing received signals from a range of receiving angles to reduce interference |
GB2495472B (en) | 2011-09-30 | 2019-07-03 | Skype | Processing audio signals |
GB2495128B (en) | 2011-09-30 | 2018-04-04 | Skype | Processing signals |
GB2495131A (en) | 2011-09-30 | 2013-04-03 | Skype | A mobile device includes a received-signal beamformer that adapts to motion of the mobile device |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
GB201120392D0 (en) | 2011-11-25 | 2012-01-11 | Skype Ltd | Processing signals |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
MY197063A (en) | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
JP2016109725A (ja) * | 2014-12-02 | 2016-06-20 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN107925819B (zh) * | 2015-08-24 | 2020-10-02 | 雅马哈株式会社 | 声音拾取装置和声音拾取方法 |
US10535360B1 (en) * | 2017-05-25 | 2020-01-14 | Tp Lab, Inc. | Phone stand using a plurality of directional speakers |
JP2019205114A (ja) | 2018-05-25 | 2019-11-28 | ヤマハ株式会社 | データ処理装置、及びデータ処理方法。 |
CN109905814B (zh) * | 2019-03-22 | 2020-09-11 | 广州小鹏汽车科技有限公司 | 一种车内多音频播放方法、车载音频系统及车辆 |
CN116168719A (zh) * | 2022-12-26 | 2023-05-26 | 杭州爱听科技有限公司 | 一种基于语境分析的声音增益调节方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000105599A (ja) * | 1998-09-29 | 2000-04-11 | Matsushita Electric Ind Co Ltd | 雑音レベル時間変動率計算方法及び装置と雑音低減方法 及び装置 |
CN1606382A (zh) * | 2003-07-31 | 2005-04-13 | 索尼株式会社 | 通信装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2867425B2 (ja) * | 1989-05-30 | 1999-03-08 | 日本電気株式会社 | 音声認識用前処理装置 |
US5440639A (en) * | 1992-10-14 | 1995-08-08 | Yamaha Corporation | Sound localization control apparatus |
TW247390B (en) * | 1994-04-29 | 1995-05-11 | Audio Products Int Corp | Apparatus and method for adjusting levels between channels of a sound system |
JPH09116362A (ja) * | 1995-10-19 | 1997-05-02 | Matsushita Electric Ind Co Ltd | 自動音量制御装置 |
US5852800A (en) * | 1995-10-20 | 1998-12-22 | Liquid Audio, Inc. | Method and apparatus for user controlled modulation and mixing of digitally stored compressed data |
US5809472A (en) * | 1996-04-03 | 1998-09-15 | Command Audio Corporation | Digital audio data transmission system based on the information content of an audio signal |
JP2003232847A (ja) * | 2002-02-07 | 2003-08-22 | Toshiba Corp | 受信装置および利得制御方法 |
US7092529B2 (en) * | 2002-11-01 | 2006-08-15 | Nanyang Technological University | Adaptive control system for noise cancellation |
JP4247037B2 (ja) * | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
JP2006201286A (ja) * | 2005-01-18 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 車載収音装置及び車内収音情報表示方法 |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
JP4637725B2 (ja) * | 2005-11-11 | 2011-02-23 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法、プログラム |
-
2007
- 2007-09-13 JP JP2007238144A patent/JP4854630B2/ja active Active
-
2008
- 2008-08-23 DE DE102008039276.6A patent/DE102008039276B4/de active Active
- 2008-09-11 US US12/232,177 patent/US8473291B2/en active Active
- 2008-09-12 CN CN2008101491467A patent/CN101388216B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000105599A (ja) * | 1998-09-29 | 2000-04-11 | Matsushita Electric Ind Co Ltd | 雑音レベル時間変動率計算方法及び装置と雑音低減方法 及び装置 |
CN1606382A (zh) * | 2003-07-31 | 2005-04-13 | 索尼株式会社 | 通信装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101388216A (zh) | 2009-03-18 |
DE102008039276A1 (de) | 2009-03-19 |
JP2009069503A (ja) | 2009-04-02 |
JP4854630B2 (ja) | 2012-01-18 |
US20090076810A1 (en) | 2009-03-19 |
DE102008039276B4 (de) | 2016-10-06 |
US8473291B2 (en) | 2013-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101388216B (zh) | 声音处理装置、控制增益的装置和方法 | |
EP3917161B1 (en) | Signal processing system and signal processing method | |
US6868045B1 (en) | Voice control system with a microphone array | |
US8755546B2 (en) | Sound processing apparatus, sound processing method and hearing aid | |
EP2494792B1 (en) | Speech enhancement method and system | |
EP2765787B1 (en) | A method of reducing un-correlated noise in an audio processing device | |
JP4649546B2 (ja) | 補聴器 | |
CN103458348B (zh) | 具有信号增强的助听器 | |
CN104066036A (zh) | 拾音装置及拾音方法 | |
CN103379418A (zh) | 带有协调声音处理的双耳助听器系统 | |
CN103155409B (zh) | 用于向用户提供听力辅助的方法与系统 | |
US20140161277A1 (en) | Compressor augmented array processing | |
CN1988737A (zh) | 用于控制助听器的传递函数的系统 | |
CN102308596A (zh) | 避免啸声和次振荡的谱带替换 | |
JP6065308B2 (ja) | 音量補正装置 | |
CN101567672A (zh) | 获取增益的方法及系统 | |
US11749293B2 (en) | Audio signal processing device | |
TWI393453B (zh) | 適用於自動控制裝置的音調偵測方法及音調偵測裝置 | |
CN113573212A (zh) | 扩声系统、及麦克风通道数据选择方法 | |
US9514765B2 (en) | Method for reducing noise and computer program thereof and electronic device | |
KR101516589B1 (ko) | 이동통신단말기 및 그의 음성신호 처리 방법 | |
CN101263705B (zh) | 一种尤其用于免提电话终端的拾音方法和装置 | |
JP6936860B2 (ja) | 音声信号処理装置 | |
CN104793525A (zh) | 具有限制模块的放大器设备 | |
JP5251473B2 (ja) | 音声処理装置、及び、音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |