JP5105912B2 - Speech intelligibility improving apparatus and noise level estimation method thereof - Google Patents
Speech intelligibility improving apparatus and noise level estimation method thereof Download PDFInfo
- Publication number
- JP5105912B2 JP5105912B2 JP2007063248A JP2007063248A JP5105912B2 JP 5105912 B2 JP5105912 B2 JP 5105912B2 JP 2007063248 A JP2007063248 A JP 2007063248A JP 2007063248 A JP2007063248 A JP 2007063248A JP 5105912 B2 JP5105912 B2 JP 5105912B2
- Authority
- JP
- Japan
- Prior art keywords
- noise level
- value
- output
- unit
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 10
- 238000012545 processing Methods 0.000 claims description 39
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000012937 correction Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Control Of Amplification And Gain Control (AREA)
Description
本発明は音声明瞭度改善装置およびその騒音レベル推定方法に関し、特に、音声の音圧レベルを周囲の騒音等に応じて補正することによって、ユーザに聞こえる音声の明瞭度を改善する技術に関するものである。 The present invention relates to a speech intelligibility improving apparatus and a noise level estimation method thereof, and more particularly to a technique for improving the intelligibility of speech audible to a user by correcting the sound pressure level of speech according to ambient noise or the like. is there.
従来、音声を出力する音声出力装置において、ユーザに聞こえる音声の明瞭度を改善するための音声明瞭度改善装置が用いられている。この音声明瞭度改善装置では、音声出力装置のスピーカから出力された音声と周囲の騒音とをマイクにて入力する。そして、マイクから出力される音声信号を用いて、マイク位置での周囲騒音成分のパワー(音圧レベル)を推定し、その推定値に応じて、音声出力装置から出力する音声のゲインを、人間のラウドネス特性に従って周波数帯域毎に調整する。 2. Description of the Related Art Conventionally, in an audio output device that outputs audio, an audio intelligibility improving device for improving the intelligibility of audio heard by a user has been used. In this voice intelligibility improving apparatus, voice output from a speaker of a voice output apparatus and ambient noise are input by a microphone. Then, using the audio signal output from the microphone, the power (sound pressure level) of the ambient noise component at the microphone position is estimated, and the gain of the audio output from the audio output device is calculated according to the estimated value. Is adjusted for each frequency band in accordance with the loudness characteristics of the.
例えば、ナビゲーション装置の案内音声(以下、ナビゲーション音声という)は、種々の騒音(走行中のエンジン音、ロードノイズ、風切り音等)やカーオーディオの出力音があると、非常に聞き取りにくくなる。そこで、ナビゲーション装置に対して音声明瞭度改善装置を適用し、マイク入力された音声信号をもとにラウドネス補償ゲインを可変制御することにより、騒音の大きさに関わりなく常に適切な音量でナビゲーション音声を再生できるようにしている。 For example, the guidance voice of the navigation device (hereinafter referred to as navigation voice) is very difficult to hear if there are various noises (engine noise during running, road noise, wind noise, etc.) and car audio output sound. Therefore, by applying a speech intelligibility improvement device to the navigation device and variably controlling the loudness compensation gain based on the audio signal input to the microphone, the navigation audio is always kept at an appropriate volume regardless of the noise level. Can be played.
ユーザに聞こえる音声の明瞭度を高めるためには、マイクから出力される音声信号に含まれる騒音成分のレベルをできるだけ正確に推定することが望まれる。騒音レベルの推定誤差を小さくするために、音声出力装置から音声が出力されていないときに、所定時間区間にて推定した騒音レベルの平均値を計算し、これを音声が出力されている時間区間における騒音レベルの推定値として用いる技術が提案されている(例えば、特許文献1参照)。
特許文献1に記載の技術では、音声未出力時に計算される騒音レベルの平均値は、過去に計算した騒音レベルを含めて平均化されたものであるため、当然に過去の騒音レベルの影響を受ける。騒音レベルが時間的に変わらない定常状態では、瞬時値も平均値も殆ど値が変わらないため、平均値を用いたとしても、ほぼ正しく騒音レベルを推定することができる。また、特許文献1では、音声が出力されていないとき(つまり、騒音成分のみ存在するとき)に算出した騒音レベルの平均化をしているため、騒音レベルの推定誤差を小さくすることが可能である。 In the technique described in Patent Document 1, the average value of the noise level calculated when no sound is output is averaged including the noise level calculated in the past. receive. In a steady state where the noise level does not change with time, the instantaneous value and the average value hardly change, so even if the average value is used, the noise level can be estimated almost correctly. Further, in Patent Document 1, since the noise level calculated when no sound is output (that is, when only the noise component exists) is averaged, it is possible to reduce the noise level estimation error. is there.
しかしながら、騒音レベルが時間的に変化する非定常状態では、瞬時値の変化量に対して平均値の変化量に追従遅れが生じてしまう。特に、例えば車両がトンネルの内側から外側に出たときに騒音が大レベルから小レベルへと急激に変化する場合、追従遅れが生じると、本来は補正ゲインも大レベルから小レベルへと変更すべきであるにもかかわらず、連続して音声を出力した際の補正ゲインが適正値に収束できず、音声出力装置から音声が過大補正のまま出力されてしまうことがあった。この状態は、周囲の騒音が小さくなっているにもかかわらず過度に大きい音量の音声が出力されている状態であり、ユーザに不快感を与えてしまうという問題があった。 However, in an unsteady state in which the noise level changes with time, a follow-up delay occurs in the change amount of the average value with respect to the change amount of the instantaneous value. In particular, for example, if the noise suddenly changes from a large level to a small level when the vehicle goes from the inside to the outside of the tunnel, if the tracking delay occurs, the correction gain is also changed from the large level to the small level. In spite of this, the correction gain when the sound is continuously output cannot be converged to an appropriate value, and the sound may be output from the sound output device without being overcorrected. This state is a state in which an excessively loud sound is being output even though the ambient noise is low, and there is a problem that the user is uncomfortable.
図6は、この従来の問題を説明するための図である。図6(a)はナビゲーション音声の信号波形を示し、図6(b)は周囲騒音の信号波形を示している。ここでは、ナビゲーション音声が断続的に出力されている際に、車両がトンネルの内側から外側へ出て騒音レベルが急降下した状況を示している。この場合、推定音声レベルは図6(c)のようになり、推定騒音レベルは図6(d)のようになる。また、これら2つの推定値をもとに算出されるゲイン補償量は図6(e)のようになる。 FIG. 6 is a diagram for explaining this conventional problem. FIG. 6A shows a signal waveform of navigation voice, and FIG. 6B shows a signal waveform of ambient noise. Here, a situation is shown in which when the navigation voice is output intermittently, the vehicle goes out from the inside of the tunnel to the outside and the noise level suddenly drops. In this case, the estimated voice level is as shown in FIG. 6C, and the estimated noise level is as shown in FIG. Further, the gain compensation amount calculated based on these two estimated values is as shown in FIG.
車両がトンネル内にいるときは、図6(d)に示すように推定騒音レベルは大きくなり、図6(e)のようにゲイン補償量も大きな値に設定されている。これに対して、車両がトンネルの外に出ると、図6(b)のように騒音信号レベルが急激に小さくなるので、本来はこれに合わせて推定騒音レベルもゲイン補償量も急激に小さくなるべきである(図6(d)(e)の点線参照)。 When the vehicle is in the tunnel, the estimated noise level is large as shown in FIG. 6 (d), and the gain compensation amount is also set to a large value as shown in FIG. 6 (e). On the other hand, when the vehicle goes out of the tunnel, the noise signal level suddenly decreases as shown in FIG. 6B, so that the estimated noise level and the gain compensation amount are originally suddenly decreased accordingly. (See dotted lines in FIGS. 6D and 6E).
しかしながら、図6(d)に示すように、推定騒音レベルは平均処理の影響で緩やかにしか下降できず、次のナビゲーション音声の発声で本来の適正値まで収束しきれていない。このため、図6(e)に示すように、ゲイン補償量が目標値(点線部)より大きくなって過補償となり、ナビゲーション音声が必要以上に大きく聞こえてしまうことになる。 However, as shown in FIG. 6 (d), the estimated noise level can only be lowered gently due to the influence of the averaging process, and it has not converged to the original proper value by the next utterance of the voice. For this reason, as shown in FIG. 6 (e), the gain compensation amount becomes larger than the target value (dotted line portion), resulting in overcompensation, and the navigation voice is heard more than necessary.
なお、ここでは騒音レベルが急降下する場合を例にとって説明したが、これとは逆に、騒音レベルが急上昇する場合も、平均値として出力される推定騒音レベルに追従遅れが生じてしまう。例えば、車両がトンネルの外側から内側に入ったときに騒音レベルが急上昇する場合、追従遅れが生じると、連続して音声を出力した際の補正ゲインが適正値に収束できず、ナビゲーション音声が過小補正のまま出力されてしまう。この状態は、周囲の騒音が大きくなっているにもかかわらず小さい音量の音声が出力されている状態であり、ナビゲーション音声が聞こえにくくなってしまう。 Here, the case where the noise level suddenly drops has been described as an example, but conversely, when the noise level rapidly increases, a follow-up delay occurs in the estimated noise level output as an average value. For example, if the noise level suddenly rises when the vehicle enters the inside from the outside of the tunnel, if a follow-up delay occurs, the correction gain when the voice is continuously output cannot be converged to an appropriate value, and the navigation voice is too low. It is output with correction. This state is a state in which a sound with a low volume is being output even though ambient noise is high, and it becomes difficult to hear the navigation sound.
本発明は、このような問題を解決するために成されたものであり、騒音の大きさが急激に変化した場合における騒音レベル推定の追従性を向上させ、騒音レベルが急激に変化したときでも適切な補正ゲインを設定できるようにすることを目的とする。 The present invention has been made to solve such a problem, and improves the followability of noise level estimation when the noise level changes abruptly, even when the noise level changes abruptly. The purpose is to enable an appropriate correction gain to be set.
上記した課題を解決するために、本発明では、騒音レベルが定常状態のときは騒音レベルの平均値を現在の推定騒音レベルとして出力し、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きい状態となったことが検出されたときは、当該瞬時値を現在の推定騒音レベルとして出力するように切り替える。そして、当該出力された推定騒音レベルに基づいて、明瞭度改善対象の音声信号に対して加えるゲインを算出し、明瞭度改善対象の音声信号のゲインを調整することにより、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判断されたときに、推定騒音レベルとして出力される瞬時値に基づいて算出されるゲインに応じて、明瞭度改善対象の音声信号のレベルを変えるようにしている。
In order to solve the above-described problem, in the present invention, when the noise level is in a steady state, the average value of the noise level is output as the current estimated noise level, and the difference between the instantaneous value of the noise level and the average value is a predetermined time. When it is detected that the state is continuously larger than the threshold value, the instantaneous value is switched to be output as the current estimated noise level. Then, based on the output estimated noise level, a gain to be added to the speech signal targeted for intelligibility improvement is calculated, and by adjusting the gain of the speech signal to be intelligibly improved, the instantaneous value of the noise level When it is determined that the difference from the average value is continuously larger than the threshold value for a predetermined time or longer, according to the gain calculated based on the instantaneous value output as the estimated noise level, I try to change the level.
上記のように構成した本発明によれば、騒音の大きさが急激に変化すると、それに応じて騒音レベルの瞬時値も急激に変化するが、平均処理では騒音レベルが急変する前の過去の騒音レベルを含めて平均値が求められるので、当該平均値は徐々にしか変化せず、瞬時値と平均値との差は大きくなる。この差が所定時間以上続けて閾値より大きくなると、補正ゲイン算出のために出力される推定騒音レベルが平均値から瞬時値へと切り替えられるので、騒音レベルが急激に変化したときにおける騒音レベル推定の追従性が向上する。これにより、騒音レベルが急激に変化したときでも適切な補正ゲインを設定することができる。 According to the present invention configured as described above, when the noise level changes suddenly, the instantaneous value of the noise level also changes accordingly. Since the average value including the level is obtained, the average value changes only gradually, and the difference between the instantaneous value and the average value increases. If this difference continues for a predetermined time or more and becomes greater than the threshold value, the estimated noise level output for calculating the correction gain is switched from the average value to the instantaneous value, so the noise level estimation when the noise level changes suddenly Followability is improved. Thus, an appropriate correction gain can be set even when the noise level changes abruptly.
以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態による音声明瞭度改善装置の構成例を示すブロック図である。図1に示すように、本実施形態の音声明瞭度改善装置は、音量調整アンプ1、イコライザ2、スピーカ3、マイク4、減算器6、騒音レベル推定部7、ゲイン補正部8、適応フィルタ(ADF)9およびナビ音声レベル算出部10を備えて構成されている。なお、この音声明瞭度改善装置とは別に、図示しないナビゲーション装置が備えられている。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration example of the speech intelligibility improving apparatus according to the present embodiment. As shown in FIG. 1, the speech intelligibility improving apparatus of this embodiment includes a volume adjustment amplifier 1, an equalizer 2, a speaker 3, a microphone 4, a subtracter 6, a noise level estimation unit 7, a gain correction unit 8, an adaptive filter ( ADF) 9 and a navigation voice level calculation unit 10. A navigation device (not shown) is provided separately from the speech intelligibility improving device.
図示しないナビゲーション装置は、ユーザに対して経路や操作を案内するナビゲーション音声を表す案内音声信号を音量調整アンプ1に出力する。音量調整アンプ1は、案内音声信号の全体のゲインを調整する。イコライザ2は、音量調整アンプ1より出力される案内音声信号に対して、周波数帯域毎のゲインを調整する。スピーカ3は、音量調整アンプ1およびイコライザ2によってゲイン調整された案内音声信号に基づいてナビゲーション音声を出力する。 A navigation device (not shown) outputs a guidance voice signal representing navigation voice for guiding the route and operation to the user to the volume adjustment amplifier 1. The volume adjustment amplifier 1 adjusts the overall gain of the guidance voice signal. The equalizer 2 adjusts the gain for each frequency band for the guidance voice signal output from the volume adjustment amplifier 1. The speaker 3 outputs a navigation voice based on the guidance voice signal whose gain is adjusted by the volume adjustment amplifier 1 and the equalizer 2.
マイク4(本発明の音声入力部に相当)は、スピーカ3から出力されるナビゲーション音声および車室内に発生する走行ノイズなどの周囲騒音を入力し、電気信号として減算器6に出力する。以下、マイク4より出力される信号をマイク出力信号と称する。 The microphone 4 (corresponding to the voice input unit of the present invention) inputs navigation voice output from the speaker 3 and ambient noise such as running noise generated in the passenger compartment, and outputs it to the subtractor 6 as an electrical signal. Hereinafter, a signal output from the microphone 4 is referred to as a microphone output signal.
適応フィルタ(ADF)9は、ナビゲーション装置の出力からマイク4の出力までの案内音声信号の伝達系のインパルス応答(伝達関数)を模擬するフィルタであり、同定用フィルタおよび係数更新部を含んで構成されている。同定用フィルタは、音響系のインパルス応答を同定するためのフィルタであり、そのフィルタ係数が係数更新部により設定される。 The adaptive filter (ADF) 9 is a filter that simulates the impulse response (transfer function) of the transmission system of the guidance voice signal from the output of the navigation device to the output of the microphone 4, and includes an identification filter and a coefficient updating unit. Has been. The identification filter is a filter for identifying the impulse response of the acoustic system, and the filter coefficient is set by the coefficient updating unit.
係数更新部は、LMS(Least Mean Square )アルゴリズムやN−LMS(Normalized-LMS)アルゴリズムにより、減算器6から出力される誤差信号のパワーが最小となるように動作して、同定用フィルタのフィルタ係数を算出する。そして、算出したフィルタ係数を同定用フィルタに設定する。これにより、適応フィルタ9に入力される案内音声信号に対して、上述した伝達系と同一の伝達特性を与える。 The coefficient updating unit operates so as to minimize the power of the error signal output from the subtractor 6 by an LMS (Least Mean Square) algorithm or an N-LMS (Normalized-LMS) algorithm, and filters the filter for identification. Calculate the coefficient. The calculated filter coefficient is set in the identification filter. As a result, the same transmission characteristic as that of the above-described transmission system is given to the guidance voice signal input to the adaptive filter 9.
ナビ音声レベル算出部10は、適応フィルタ9より出力される適応フィルタ制御後の案内音声信号のレベル(以下、ナビ音声レベルと称する)を周波数帯域毎に算出し、騒音レベル推定部7およびゲイン補正部8に出力する。減算器6は、マイク4より出力されるマイク出力信号から、適応フィルタ9より出力されるナビ音声の模擬信号を引くことによって誤差信号を演算し、周囲騒音のみを抽出する。 The navigation voice level calculation unit 10 calculates the level of the guidance voice signal after the adaptive filter control output from the adaptive filter 9 (hereinafter referred to as navigation voice level) for each frequency band, and calculates the noise level estimation unit 7 and the gain correction. Output to unit 8. The subtracter 6 calculates an error signal by subtracting the simulated signal of the navigation voice output from the adaptive filter 9 from the microphone output signal output from the microphone 4 and extracts only ambient noise.
騒音レベル推定部7は、減算器6より出力される誤差信号に基づいて、マイク4の位置での騒音レベルを周波数帯域毎に推定する。詳細は後述するが、騒音レベル推定部7は、明瞭度改善対象のナビゲーション音声がマイク4より入力されていないときにおける過去の所定時間区間における騒音レベルの平均値を演算し、これを現在の推定騒音レベルとして出力する。ナビゲーション音声がマイク4より入力されているか否かは、ナビ音声レベル算出部10より出力されるナビ音声レベルに基づいて判定する。 The noise level estimation unit 7 estimates the noise level at the position of the microphone 4 for each frequency band based on the error signal output from the subtractor 6. Although details will be described later, the noise level estimation unit 7 calculates an average value of the noise level in a past predetermined time interval when the navigation speech whose intelligibility is to be improved is not input from the microphone 4, and this is calculated as the current estimation. Output as noise level. Whether or not the navigation voice is input from the microphone 4 is determined based on the navigation voice level output from the navigation voice level calculation unit 10.
ゲイン補正部8は、ナビ音声レベル算出部10により算出された推定ナビ音声レベルと、騒音レベル推定部7により算出された推定騒音レベルとに基づいて、所定のラウドネス補償関数に従って、ナビゲーション装置から出力される制御対象の案内音声信号に対して加える最適のゲイン(音量調整アンプ1のゲインとイコライザ2の周波数帯域毎のゲイン)を算出し、この算出したゲイン値を音量調整アンプ1およびイコライザ2に出力する。 Based on the estimated navigation voice level calculated by the navigation voice level calculation unit 10 and the estimated noise level calculated by the noise level estimation unit 7, the gain correction unit 8 outputs from the navigation device according to a predetermined loudness compensation function. The optimal gain (gain of the volume adjustment amplifier 1 and gain for each frequency band of the equalizer 2) to be added to the guidance voice signal to be controlled is calculated, and the calculated gain value is supplied to the volume adjustment amplifier 1 and the equalizer 2. Output.
図2は、本実施形態による騒音レベル推定部7の構成例を示す図である。図2に示すように、騒音レベル推定部7は、レベル算出部11、平均処理部12、記憶部13、判定処理部14およびスイッチ15,16,17を備えて構成されている。減算器6およびレベル算出部11によって本発明の騒音レベル算出部が構成される。また、2つのスイッチ15,17によって本発明の推定騒音レベル出力部が構成される。 FIG. 2 is a diagram illustrating a configuration example of the noise level estimation unit 7 according to the present embodiment. As shown in FIG. 2, the noise level estimation unit 7 includes a level calculation unit 11, an average processing unit 12, a storage unit 13, a determination processing unit 14, and switches 15, 16, and 17. The subtractor 6 and the level calculation unit 11 constitute a noise level calculation unit of the present invention. The two switches 15 and 17 constitute an estimated noise level output unit of the present invention.
レベル算出部11は、減算器6より出力される誤差信号に基づいて、マイク4の位置での騒音レベルを周波数帯域毎に算出する。平均処理部12は、レベル算出部11により算出された騒音レベルの過去の所定時間区間における平均値を演算する。より具体的には、平均処理部12は、明瞭度改善対象のナビゲーション音声がマイク4より入力されていないときにおける過去の所定時間区間における騒音レベルの平均値を演算する。 The level calculator 11 calculates the noise level at the position of the microphone 4 for each frequency band based on the error signal output from the subtractor 6. The average processor 12 calculates an average value of the noise level calculated by the level calculator 11 in a past predetermined time interval. More specifically, the average processing unit 12 calculates the average value of the noise level in a past predetermined time interval when the navigation voice whose clarity is to be improved is not input from the microphone 4.
例えば、平均処理部12はリングバッファを有しており、レベル算出部11により算出されたの騒音レベルの瞬時値をリングバッファに順次格納できるようになっている。平均処理部12は、このリングバッファに格納されている複数の瞬時値(現在の瞬時値を含めて過去の数個分の瞬時値)を平均化する演算を行い、その結果を騒音レベルの平均値として出力する。 For example, the average processing unit 12 has a ring buffer, and instantaneous values of noise levels calculated by the level calculation unit 11 can be sequentially stored in the ring buffer. The average processing unit 12 performs an operation of averaging a plurality of instantaneous values (several instantaneous values including the current instantaneous value) stored in the ring buffer, and the result is averaged for the noise level. Output as a value.
記憶部13は、平均処理部12により算出された騒音レベルの平均値を格納する。判定処理部14は、レベル算出部11により算出される騒音レベルの瞬時値と平均処理部12により算出される騒音レベルの平均値とを比較し、その瞬時値と平均値との差が所定時間以上連続して閾値より大きいかどうかを判定する。そして、その判定結果に基づいて第1のスイッチ15を制御する。 The storage unit 13 stores the average value of the noise level calculated by the average processing unit 12. The determination processing unit 14 compares the instantaneous value of the noise level calculated by the level calculation unit 11 with the average value of the noise level calculated by the average processing unit 12, and the difference between the instantaneous value and the average value is a predetermined time. It is determined whether or not it is continuously larger than the threshold value. Then, the first switch 15 is controlled based on the determination result.
第1のスイッチ15が有する一方の入力端子aには、平均処理部12により算出された騒音レベルの平均値が入力されている。また、第1のスイッチ15が有する他方の入力端子bには、レベル算出部11により算出された騒音レベルの瞬時値が入力されている。第1のスイッチ15は、通常は入力端子a側に切り替えられているが、瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判定処理部14にて判断された場合は入力端子b側に切り替えられる。また、第1のスイッチ15が有する出力端子は、記憶部13および第3のスイッチ17の入力端子Bに接続されている。 The average value of the noise level calculated by the average processing unit 12 is input to one input terminal a of the first switch 15. The instantaneous value of the noise level calculated by the level calculation unit 11 is input to the other input terminal b of the first switch 15. The first switch 15 is normally switched to the input terminal a side, but when the determination processing unit 14 determines that the difference between the instantaneous value and the average value is continuously greater than the threshold value for a predetermined time or more. It is switched to the input terminal b side. The output terminal of the first switch 15 is connected to the storage unit 13 and the input terminal B of the third switch 17.
第2および第3のスイッチ16,17は、ナビ音声レベル算出部10より出力されるナビ音声レベルに応じて切り替えが制御される。ここで、ナビ音声レベルが所定値以上の場合、つまりマイク4よりナビゲーション音声が入力されている場合は、スイッチ16,17は共に端子A側に切り替えられる。一方、ナビ音声レベルが所定値に満たない場合、つまりマイク4よりナビゲーション音声が入力されていない場合は、スイッチ16,17は共に端子B側に切り替えられる。 Switching of the second and third switches 16 and 17 is controlled according to the navigation voice level output from the navigation voice level calculation unit 10. Here, when the navigation voice level is equal to or higher than a predetermined value, that is, when navigation voice is input from the microphone 4, both the switches 16 and 17 are switched to the terminal A side. On the other hand, when the navigation voice level is less than the predetermined value, that is, when no navigation voice is input from the microphone 4, both the switches 16 and 17 are switched to the terminal B side.
第2のスイッチ16の出力端子Aはどこにも接続されていない。一方、第3のスイッチ17の入力端子Aは、記憶部14に接続されている。上述したように、記憶部14には、平均処理部13により算出された騒音レベルの平均値、より具体的には、ナビゲーション音声がマイク4より入力されていないときにおける過去の所定時間区間における騒音レベルの平均値が格納されている。これにより、マイク4よりナビゲーション音声が入力されているときは、記憶部13に記憶されている過去の騒音レベルの平均値が現在の推定騒音レベルとして騒音レベル推定部7より出力される。 The output terminal A of the second switch 16 is not connected anywhere. On the other hand, the input terminal A of the third switch 17 is connected to the storage unit 14. As described above, in the storage unit 14, the average value of the noise level calculated by the average processing unit 13, more specifically, the noise in the past predetermined time interval when the navigation voice is not input from the microphone 4. The average value of the level is stored. Thereby, when the navigation voice is input from the microphone 4, the average value of the past noise levels stored in the storage unit 13 is output from the noise level estimation unit 7 as the current estimated noise level.
一方、第2のスイッチ16の入力端子はレベル算出部11に接続され、出力端子Bは平均処理部12の入力に接続されている。また、第3のスイッチ17の入力端子Bは、第1のスイッチ15の出力端子に接続されている。これにより、マイク4よりナビゲーション音声が入力されていないときは、第1のスイッチ15により選択された騒音レベル(すなわち、平均処理部12により算出された騒音レベルの平均値か、レベル算出部11により算出された騒音レベルの瞬時値かのいずれか)が現在の推定騒音レベルとして騒音レベル推定部7より出力される。 On the other hand, the input terminal of the second switch 16 is connected to the level calculation unit 11, and the output terminal B is connected to the input of the average processing unit 12. The input terminal B of the third switch 17 is connected to the output terminal of the first switch 15. Thereby, when navigation voice is not input from the microphone 4, the noise level selected by the first switch 15 (that is, the average value of the noise level calculated by the average processing unit 12 or the level calculation unit 11). Any one of the calculated instantaneous noise levels is output from the noise level estimation unit 7 as the current estimated noise level.
すなわち、2つのスイッチ15,17で構成される推定騒音レベル出力部は、通常は平均処理部12により算出された騒音レベルの平均値を推定騒音レベルとして出力するように動作する。つまり、第1のスイッチ15は端子a側、第3のスイッチ17は端子B側を選択する。一方、推定騒音レベル出力部は、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判定処理部14により判断されたときには、レベル算出部11により算出された騒音レベルの瞬時値を推定騒音レベルとして出力するように動作する。つまり、第1のスイッチ15は端子b側、第3のスイッチ17は端子B側を選択する。 That is, the estimated noise level output unit composed of the two switches 15 and 17 normally operates so as to output the average value of the noise level calculated by the average processing unit 12 as the estimated noise level. That is, the first switch 15 selects the terminal a side, and the third switch 17 selects the terminal B side. On the other hand, when the determination processing unit 14 determines that the difference between the instantaneous value and the average value of the noise level is continuously greater than the threshold value for a predetermined time or longer, the estimated noise level output unit calculates the noise calculated by the level calculation unit 11. It operates to output the instantaneous value of the level as the estimated noise level. That is, the first switch 15 selects the terminal b side, and the third switch 17 selects the terminal B side.
次に、上記のように構成した騒音レベル推定部7の動作を説明する。図3および図4は、騒音レベル推定部7の動作を説明するための図である。マイク4よりナビゲーション音声が入力されている場合、第2および第3のスイッチ16,17は、何れも端子A側に切り替えられる。これにより、記憶部13に格納されている過去の騒音レベルの平均値が現在の推定騒音レベルとして騒音レベル推定部7より出力される。 Next, the operation of the noise level estimation unit 7 configured as described above will be described. 3 and 4 are diagrams for explaining the operation of the noise level estimation unit 7. When the navigation voice is input from the microphone 4, both the second and third switches 16 and 17 are switched to the terminal A side. Thereby, the average value of the past noise levels stored in the storage unit 13 is output from the noise level estimation unit 7 as the current estimated noise level.
一方、マイク4よりナビゲーション音声が入力されていない場合、第2および第3のスイッチ16,17は、何れも端子B側に切り替えられる。また、第1のスイッチ15は、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいか否かに応じて、端子a,bの何れかに切り替えられる。これにより、平均処理部12により算出された騒音レベルの平均値か、レベル算出部11により算出された騒音レベルの瞬時値かの何れかが、第1のスイッチ15により選択されて現在の推定騒音レベルとして騒音レベル推定部7より出力される。 On the other hand, when no navigation voice is input from the microphone 4, both the second and third switches 16 and 17 are switched to the terminal B side. The first switch 15 is switched to one of the terminals a and b depending on whether or not the difference between the instantaneous value and the average value of the noise level is continuously larger than the threshold value for a predetermined time or more. As a result, either the average value of the noise level calculated by the average processing unit 12 or the instantaneous value of the noise level calculated by the level calculation unit 11 is selected by the first switch 15 and the current estimated noise level is selected. The level is output from the noise level estimation unit 7.
すなわち、図3の区間Aに示すように、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判定処理部14にて判断されていない場合は、平均処理部12により算出された騒音レベルの平均値が現在の推定騒音レベルとして騒音レベル推定部7より出力される。 That is, as shown in section A of FIG. 3, if the determination processing unit 14 does not determine that the difference between the instantaneous value of the noise level and the average value is continuously greater than the threshold value for a predetermined time or more, the average processing unit 12 is output from the noise level estimation unit 7 as the current estimated noise level.
一方、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判定処理部14にて判断された場合は、図3の区間Bに示すように、レベル算出部11により算出された騒音レベルの瞬時値を現在の推定騒音レベルとして騒音レベル推定部7より出力するように切り替えられる。このとき同時に、記憶部13に格納されている過去の騒音レベルの平均値が、現在の騒音レベルの瞬時値で上書きされる。これにより、例えばその直後にマイク4よりナビゲーション音声が入力されたような場合には、記憶部13に格納された騒音レベルの瞬時値が現在の推定騒音レベルとして騒音レベル推定部7より出力される。 On the other hand, when the determination processing unit 14 determines that the difference between the instantaneous value and the average value of the noise level is continuously larger than the threshold value for a predetermined time or longer, as shown in the section B of FIG. The noise level estimator 7 is switched to output the instantaneous value of the noise level calculated by the above as the current estimated noise level. At the same time, the average value of the past noise levels stored in the storage unit 13 is overwritten with the instantaneous value of the current noise level. Thereby, for example, when navigation voice is input from the microphone 4 immediately after that, the instantaneous value of the noise level stored in the storage unit 13 is output from the noise level estimation unit 7 as the current estimated noise level. .
この図3に示した動作を、図4を用いて詳しく説明する。この図4では、ナビゲーション音声が断続的に出力されている際に、車両がトンネルの内側から外側へ出て騒音レベルが急降下した状況を示している。図4(a)はナビゲーション音声の信号波形、図4(b)は周囲騒音の信号波形、図4(c)はレベル算出部11により算出されるナビ音声レベルを示している。これらは何れも図6(a)〜(c)に示される波形と同じものである。 The operation shown in FIG. 3 will be described in detail with reference to FIG. FIG. 4 shows a situation in which when the navigation sound is output intermittently, the vehicle goes out from the inside of the tunnel to the outside and the noise level suddenly drops. 4A shows the signal waveform of the navigation voice, FIG. 4B shows the signal waveform of the ambient noise, and FIG. 4C shows the navigation voice level calculated by the level calculation unit 11. These are all the same as the waveforms shown in FIGS.
本実施形態の場合、騒音レベル推定部7から出力される推定騒音レベルは、図4(d)の実線で示すようになる。また、図4(c)の推定ナビ音声レベルと図4(d)の推定騒音レベルとをもとにゲイン補正部8により算出されるゲイン補償量は、図4(e)の実線で示すようになる。すなわち、車両がトンネル内にいるときは、図4(d)に示すように推定騒音レベルは大きくなり、図4(e)のようにゲイン補償量も大きな値に設定されている。 In the case of this embodiment, the estimated noise level output from the noise level estimation unit 7 is as shown by the solid line in FIG. Further, the gain compensation amount calculated by the gain correction unit 8 based on the estimated navigation voice level in FIG. 4C and the estimated noise level in FIG. 4D is shown by a solid line in FIG. become. That is, when the vehicle is in the tunnel, the estimated noise level is large as shown in FIG. 4 (d), and the gain compensation amount is also set to a large value as shown in FIG. 4 (e).
これに対して、車両がトンネルの外に出ると、図4(b)のように騒音信号レベルが急激に小さくなる。このとき、図4(d)に示すように、騒音レベルの平均値は緩やかに下降していく。そのため、騒音レベルの瞬時値と平均値との差が時間と共に徐々に大きくなっていく。そして、この瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判定処理部14にて判断されると、それまで平均値が推定騒音レベルとして出力されていた状態から、瞬時値が推定騒音レベルとして出力される状態に切り替えられる。これにより、騒音レベルが急降下したときの追従性が向上し、図4(d)の実線で示すように推定騒音レベルが急激に小さくなるとともに、図4(e)に示すようにゲイン補償量も急激に小さくなり、ナビゲーション音声の発声で本来の適正値まで収束する。 On the other hand, when the vehicle goes out of the tunnel, the noise signal level rapidly decreases as shown in FIG. At this time, as shown in FIG. 4D, the average value of the noise level gradually decreases. Therefore, the difference between the instantaneous value and the average value of the noise level gradually increases with time. When the determination processing unit 14 determines that the difference between the instantaneous value and the average value is continuously greater than the threshold value for a predetermined time or longer, the instantaneous value is instantaneously output from the state where the average value has been output as the estimated noise level. The state is switched to a state in which the value is output as the estimated noise level. As a result, the followability when the noise level suddenly drops is improved, the estimated noise level decreases rapidly as shown by the solid line in FIG. 4 (d), and the gain compensation amount also increases as shown in FIG. 4 (e). It becomes small rapidly and converges to the original proper value by the utterance of the navigation voice.
図5は、騒音レベル推定部7の動作例を示すフローチャートである。図5において、レベル算出部11は、騒音レベルの瞬時値を算出する(ステップS1)。また、騒音レベル推定部7は、ナビ音声レベル算出部10により算出されたナビ音声レベルが所定値α以上か否かを判定する(ステップS2)。ナビ音声レベルが所定値α以上であれば、第2および第3のスイッチが端子A側に切り替えられ、記憶部13に格納されている過去の騒音レベルの平均値が推定騒音レベルとしてゲイン補正部8に出力される(ステップS3)。 FIG. 5 is a flowchart illustrating an operation example of the noise level estimation unit 7. In FIG. 5, the level calculation part 11 calculates the instantaneous value of a noise level (step S1). Moreover, the noise level estimation part 7 determines whether the navigation voice level calculated by the navigation voice level calculation part 10 is more than predetermined value (alpha) (step S2). If the navigation voice level is equal to or higher than the predetermined value α, the second and third switches are switched to the terminal A side, and the average value of the past noise levels stored in the storage unit 13 is used as the estimated noise level and the gain correction unit. 8 (step S3).
一方、ナビ音声レベルが所定値αに満たないと騒音レベル推定部7により判断された場合は、第2および第3のスイッチが端子B側に切り替えられ、ステップS1でレベル算出部11により算出された騒音レベルの瞬時値が平均処理部12に入力される(ステップS4)。平均処理部12は、騒音レベルについて過去の所定時間区間における平均値を算出する(ステップS5)。 On the other hand, when the noise level estimation unit 7 determines that the navigation voice level does not reach the predetermined value α, the second and third switches are switched to the terminal B side, and are calculated by the level calculation unit 11 in step S1. The instantaneous value of the noise level is input to the average processing unit 12 (step S4). The average processing unit 12 calculates an average value in the past predetermined time interval for the noise level (step S5).
次に、判定処理部14は、ステップS1で算出された騒音レベルの瞬時値と、ステップS5で算出された騒音レベルの平均値とを比較し、その差が所定の閾値β[dB]より大きいかどうかを判定する(ステップS6)。瞬時値と平均値との差が閾値β[dB]より大きくないと判定処理部14にて判断された場合は、カウンタの値をゼロに初期化する(ステップS7)。一方、瞬時値と平均値との差が閾値β[dB]より大きいと判定処理部14にて判断された場合は、カウンタの値を1つインクリメントする(ステップS8)。 Next, the determination processing unit 14 compares the instantaneous value of the noise level calculated in step S1 with the average value of the noise level calculated in step S5, and the difference is larger than a predetermined threshold value β [dB]. Whether or not (step S6). If the determination processing unit 14 determines that the difference between the instantaneous value and the average value is not greater than the threshold value β [dB], the counter value is initialized to zero (step S7). On the other hand, when the determination processing unit 14 determines that the difference between the instantaneous value and the average value is larger than the threshold value β [dB], the counter value is incremented by one (step S8).
ここで、判定処理部14は、カウンタの値が所定値γ以上か否かを判定する(ステップS9)。すなわち、ステップS6〜S9では、瞬時値と平均値との差が所定時間γ以上連続して閾値βより大きいかどうかを判定している。そして、騒音レベルの瞬時値と平均値との差が所定時間γ以上連続して閾値βより大きいと判定処理部14にて判断された場合は、第1のスイッチ15が端子a側から端子b側へ切り替えられ、騒音レベルの平均値を推定騒音レベルとして出力している状態から、騒音レベルの瞬時値を推定騒音レベルとして出力する状態へと切り替えられる(ステップS10)。 Here, the determination processing unit 14 determines whether or not the value of the counter is equal to or greater than the predetermined value γ (step S9). That is, in steps S6 to S9, it is determined whether or not the difference between the instantaneous value and the average value is continuously greater than the threshold value β for a predetermined time γ or more. When the determination processing unit 14 determines that the difference between the instantaneous value and the average value of the noise level is continuously greater than the threshold value β for a predetermined time γ or more, the first switch 15 is connected from the terminal a side to the terminal b. Switching from the state where the average value of the noise level is output as the estimated noise level to the state where the instantaneous value of the noise level is output as the estimated noise level (step S10).
その後、判定処理部14のカウンタをゼロに初期化するとともに(ステップS11)、記憶部13に格納されていた騒音レベルの平均値を瞬時値で上書きし、また、リングバッファ等で格納していた過去の所定時間区間の騒音レベルを全て最新の瞬時値で上書きして(ステップS12)、一巡の処理が終了する。以降、ステップS1〜S12の処理が繰り返し実行される。 Thereafter, the counter of the determination processing unit 14 is initialized to zero (step S11), and the average value of the noise level stored in the storage unit 13 is overwritten with an instantaneous value, and is stored in a ring buffer or the like. All the noise levels in the past predetermined time section are overwritten with the latest instantaneous values (step S12), and one round of processing is completed. Thereafter, the processes of steps S1 to S12 are repeatedly executed.
以上詳しく説明したように、本実施形態によれば、騒音レベルが定常状態のときは騒音レベルの平均値を現在の推定騒音レベルとして出力し、騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きい非定常状態となったことが検出されたときは、当該瞬時値を現在の推定騒音レベルとして出力するように切り替えている。 As described above in detail, according to this embodiment, when the noise level is in a steady state, the average value of the noise level is output as the current estimated noise level, and the difference between the instantaneous value of the noise level and the average value is predetermined. When it is detected that an unsteady state that is continuously greater than the threshold value has been detected for more than the time, the instantaneous value is switched to be output as the current estimated noise level.
このように構成した本実施形態によれば、例えば車両がトンネルの内側から外側へ出ることによって騒音レベルが急降下すると、それに応じて騒音レベル推定部7からゲイン補正部8に出力される推定騒音レベルが平均値から瞬時値へと切り替えられるので、騒音レベルが急降下したときにおける騒音レベル推定の追従性を向上させることができる。このため、騒音レベルが急降下したときでも適切な補正ゲインを音量調整アンプ1およびイコライザ2に設定することができる。これにより、周囲の騒音が小さくなっているにもかかわらず、ナビゲーション音声の音量が大きいままでユーザに不快感を与えてしまうという不都合を抑制することができる。 According to this embodiment configured as described above, for example, when the noise level suddenly drops due to the vehicle exiting from the inside to the outside of the tunnel, the estimated noise level output from the noise level estimating unit 7 to the gain correcting unit 8 accordingly. Is switched from the average value to the instantaneous value, it is possible to improve the followability of the noise level estimation when the noise level suddenly drops. For this reason, even when the noise level suddenly drops, an appropriate correction gain can be set in the volume adjustment amplifier 1 and the equalizer 2. Thereby, in spite of the surrounding noise being reduced, it is possible to suppress the inconvenience that the volume of the navigation voice remains high and the user is uncomfortable.
なお、上記実施形態では、騒音レベルが急降下した場合を例にとって説明したが、騒音レベルが急上昇した場合も同様に動作する。例えば、車両がトンネルの外側から内側に入ったときに騒音レベルが急上昇した場合でも、追従遅れは生じず、適切な補正ゲインを音量調整アンプ1およびイコライザ2に設定することができる。これにより、周囲の騒音が大きくなっているにもかかわらず、ナビゲーション音声の音量が小さいままで聞こえにくいという不都合を抑制することができる。 In the above embodiment, the case where the noise level suddenly drops has been described as an example, but the same operation is performed when the noise level suddenly increases. For example, even when the noise level suddenly rises when the vehicle enters from the outside to the inside of the tunnel, no follow-up delay occurs, and appropriate correction gains can be set in the volume adjustment amplifier 1 and the equalizer 2. As a result, it is possible to suppress the inconvenience that it is difficult to hear the navigation sound with a low volume even though the surrounding noise is high.
また、上記実施形態では、明瞭度改善対象の音声がナビゲーション音声である場合を例に挙げて説明したが、これに限定されない。例えば、オーディオ装置から出力されるオーディオ音声を明瞭度改善対象の音声としても良い。 Moreover, although the said embodiment gave and demonstrated the case where the audio | voice of the clarity improvement object was a navigation audio | voice, it is not limited to this. For example, the audio sound output from the audio device may be the speech for which the intelligibility is improved.
その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。 In addition, each of the above-described embodiments is merely an example of implementation in carrying out the present invention, and the technical scope of the present invention should not be construed in a limited manner. In other words, the present invention can be implemented in various forms without departing from the spirit or main features thereof.
6 減算器
7 騒音レベル推定部
11 レベル算出部
12 平均処理部
13 記憶部
14 判定処理部
15,17 スイッチ(推定騒音レベル出力部)
6 Subtractor 7 Noise Level Estimation Unit 11 Level Calculation Unit 12 Average Processing Unit 13 Storage Unit 14 Judgment Processing Unit 15, 17 Switch (Estimated Noise Level Output Unit)
Claims (4)
上記騒音レベル算出部により算出された騒音レベルの過去の所定時間区間における平均値を演算する平均処理部と、
上記騒音レベル算出部により算出される騒音レベルの瞬時値と上記平均処理部により算出される騒音レベルの平均値とを比較し、その差が所定時間以上連続して閾値より大きいかどうかを判定する判定処理部と、
上記平均処理部により算出された騒音レベルの平均値を推定騒音レベルとして出力し、上記騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと上記判定処理部により判断されたときには上記瞬時値を推定騒音レベルとして出力するように切り替える推定騒音レベル出力部と、
上記明瞭度改善対象の音声信号のゲインを調整するゲイン調整部と、
上記推定騒音レベル出力部より出力された上記推定騒音レベルに基づいて、上記明瞭度改善対象の音声信号に対して加えるゲインを算出し、上記ゲイン調整部に出力するゲイン補正部とを備え、
上記騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと上記判定処理部により判断されたときに、上記推定騒音レベル出力部より上記推定騒音レベルとして出力される上記瞬時値に基づいて、上記ゲイン補正部により算出されるゲインに応じて上記明瞭度改善対象の音声信号のレベルを変えるようにしたことを特徴とする音声明瞭度改善装置。 A noise level calculation unit that inputs a voice signal including a voice component to be improved in clarity and surrounding noise components from a voice input unit, and calculates a noise level at the position of the voice input unit using the voice signal; ,
An average processing unit that calculates an average value of noise levels calculated by the noise level calculation unit in a past predetermined time interval;
The instantaneous value of the noise level calculated by the noise level calculation unit is compared with the average value of the noise level calculated by the average processing unit, and it is determined whether or not the difference is continuously greater than a threshold value for a predetermined time or more. A determination processing unit;
The average value of the noise level calculated by the average processing unit is output as an estimated noise level, and the determination processing unit determines that the difference between the instantaneous value of the noise level and the average value is continuously greater than a threshold value for a predetermined time or more. An estimated noise level output unit that switches to output the instantaneous value as an estimated noise level when
A gain adjusting unit that adjusts the gain of the audio signal to be improved for clarity;
Based on the estimated noise level output from the estimated noise level output unit, calculates a gain to be added to the speech signal to be improved for clarity, and includes a gain correction unit that outputs the gain to the gain adjustment unit,
The estimated noise level output from the estimated noise level output unit when the determination processing unit determines that the difference between the instantaneous value and the average value of the noise level is continuously greater than a threshold value for a predetermined time or more. A speech intelligibility improving apparatus characterized in that, based on the instantaneous value, the level of the intelligibility improvement target speech signal is changed according to the gain calculated by the gain correction unit .
上記推定騒音レベル出力部は、上記記憶部に記憶されている値を上記推定騒音レベルとして出力するように成され、上記騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと上記判定処理部により判断されたときに上記記憶部を上記瞬時値で上書きすることを特徴とする請求項1に記載の音声明瞭度改善装置。 A storage unit for storing an average value of the noise level calculated by the average processing unit;
The estimated noise level output unit is configured to output a value stored in the storage unit as the estimated noise level, and a difference between an instantaneous value and an average value of the noise level is a threshold value continuously for a predetermined time or more. 2. The speech intelligibility improving apparatus according to claim 1, wherein the storage unit is overwritten with the instantaneous value when the determination processing unit determines that the value is larger.
上記音声信号を用いて、上記音声入力部の位置での騒音レベルを算出する第1のステップと、
上記騒音レベルについて過去の所定時間区間における平均値を演算する第2のステップと、
上記第1のステップで算出される騒音レベルの瞬時値と上記第2のステップで算出される騒音レベルの平均値とを比較し、その差が所定時間以上連続して閾値より大きいかどうかを判定する第3のステップと、
上記騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判断されたときに、上記第2のステップで算出された騒音レベルの平均値を推定騒音レベルとして出力している状態から、上記瞬時値を推定騒音レベルとして出力する状態へと切り替える第4のステップと、
上記第4のステップで出力された上記推定騒音レベルに基づいて、上記明瞭度改善対象の音声信号に対して加えるゲインを算出する第5のステップと、
上記第5のステップで算出されたゲインに基づいて、上記明瞭度改善対象の音声信号のゲインを調整する第6のステップとを有し、
上記騒音レベルの瞬時値と平均値との差が所定時間以上連続して閾値より大きいと判断されたときに、上記推定騒音レベルとして出力される上記瞬時値に基づいて算出されるゲインに応じて、上記明瞭度改善対象の音声信号のレベルを変えるようにしたことを特徴とする騒音レベル推定方法。 The speech to be improved in clarity and ambient noise are input from the speech input unit, and the noise level at the position of the speech input unit is estimated using the speech signal output from the speech input unit. A method for estimating a noise level of a speech intelligibility improving apparatus that adjusts the correction gain of the speech for which the intelligibility is improved according to an estimated value,
A first step of calculating a noise level at the position of the voice input unit using the voice signal;
A second step of calculating an average value in the past predetermined time interval for the noise level;
The instantaneous value of the noise level calculated in the first step is compared with the average value of the noise level calculated in the second step, and it is determined whether or not the difference is continuously greater than the threshold value for a predetermined time or more. A third step,
When it is determined that the difference between the instantaneous value and the average value of the noise level is continuously larger than the threshold value for a predetermined time or more, the average value of the noise level calculated in the second step is output as the estimated noise level. A fourth step of switching from a state of being output to a state of outputting the instantaneous value as an estimated noise level ;
A fifth step of calculating a gain to be added to the speech signal to be improved for clarity based on the estimated noise level output in the fourth step;
A sixth step of adjusting the gain of the speech signal to be improved for clarity based on the gain calculated in the fifth step,
According to a gain calculated based on the instantaneous value output as the estimated noise level when it is determined that the difference between the instantaneous value and the average value of the noise level is continuously larger than a threshold value for a predetermined time or more. A method for estimating a noise level, characterized in that the level of a speech signal to be improved for clarity is changed .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007063248A JP5105912B2 (en) | 2007-03-13 | 2007-03-13 | Speech intelligibility improving apparatus and noise level estimation method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007063248A JP5105912B2 (en) | 2007-03-13 | 2007-03-13 | Speech intelligibility improving apparatus and noise level estimation method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008225056A JP2008225056A (en) | 2008-09-25 |
JP5105912B2 true JP5105912B2 (en) | 2012-12-26 |
Family
ID=39843757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007063248A Expired - Fee Related JP5105912B2 (en) | 2007-03-13 | 2007-03-13 | Speech intelligibility improving apparatus and noise level estimation method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5105912B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5172580B2 (en) * | 2008-10-02 | 2013-03-27 | 株式会社東芝 | Sound correction apparatus and sound correction method |
JP6401914B2 (en) * | 2014-02-05 | 2018-10-10 | 東日本旅客鉄道株式会社 | Volume control device and station platform broadcasting system |
CN108028048B (en) | 2015-06-30 | 2022-06-21 | 弗劳恩霍夫应用研究促进协会 | Method and apparatus for correlating noise and for analysis |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07104788A (en) * | 1993-10-06 | 1995-04-21 | Technol Res Assoc Of Medical & Welfare Apparatus | Voice emphasis processor |
JP3287747B2 (en) * | 1995-12-28 | 2002-06-04 | 富士通テン株式会社 | Noise sensitive automatic volume control |
JP3484559B2 (en) * | 1996-08-02 | 2004-01-06 | 株式会社リコー | Voice recognition device and voice recognition method |
JP2001267973A (en) * | 2000-03-17 | 2001-09-28 | Matsushita Electric Ind Co Ltd | Noise suppressor and noise suppression method |
JP2004184856A (en) * | 2002-12-05 | 2004-07-02 | Toyota Motor Corp | Voice recognition device |
-
2007
- 2007-03-13 JP JP2007063248A patent/JP5105912B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008225056A (en) | 2008-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7516065B2 (en) | Apparatus and method for correcting a speech signal for ambient noise in a vehicle | |
JP5219522B2 (en) | Speech intelligibility improvement system and speech intelligibility improvement method | |
US8150045B2 (en) | Automatic gain control system applied to an audio signal as a function of ambient noise | |
US10390136B2 (en) | Howling suppression device and howling suppression method | |
US20100239098A1 (en) | Background noise estimation | |
US10681458B2 (en) | Techniques for howling detection | |
WO2016013667A1 (en) | Echo canceller device | |
US7260209B2 (en) | Methods and apparatus for improving voice quality in an environment with noise | |
JP5105912B2 (en) | Speech intelligibility improving apparatus and noise level estimation method thereof | |
JP4888262B2 (en) | Call state determination device and echo canceller having the call state determination device | |
JP4187615B2 (en) | Output sound correction device | |
JP3688934B2 (en) | Microphone system | |
JP5188558B2 (en) | Audio processing device | |
JP5383008B2 (en) | Speech intelligibility improvement system and speech intelligibility improvement method | |
JP2922397B2 (en) | Vehicle sound system | |
JP2001228893A (en) | Speech-recognizing device | |
JP4313294B2 (en) | Audio output device | |
EP3933837B1 (en) | In-vehicle communication support system | |
JP4999267B2 (en) | Voice input device | |
JP4722607B2 (en) | Audio processing device | |
JP2004085963A (en) | Navigation voice compensating device | |
JPWO2010007925A1 (en) | Sound processor | |
US20230137830A1 (en) | Wideband adaptation of echo path changes in an acoustic echo canceller | |
JP2000151313A (en) | Method and device for automatic adjustment of voice level | |
JPH0695693A (en) | Noise reducing circuit for voice recognition device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120718 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121002 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5105912 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |