JP2009015209A - Speech articulation improving system and speech articulation improving method - Google Patents
Speech articulation improving system and speech articulation improving method Download PDFInfo
- Publication number
- JP2009015209A JP2009015209A JP2007179469A JP2007179469A JP2009015209A JP 2009015209 A JP2009015209 A JP 2009015209A JP 2007179469 A JP2007179469 A JP 2007179469A JP 2007179469 A JP2007179469 A JP 2007179469A JP 2009015209 A JP2009015209 A JP 2009015209A
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- filter
- sound
- characteristic
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は音声明瞭度改善システム及び音声明瞭度改善方法に係り、特に周辺の騒音を拾うマイクを話者音声入力マイクと兼用できるようにした音声明瞭度改善システム及び音声明瞭度改善方法に関する。 The present invention relates to a speech intelligibility improvement system and a speech intelligibility improvement method, and more particularly to a speech intelligibility improvement system and a speech intelligibility improvement method in which a microphone that picks up surrounding noise can be used also as a speaker voice input microphone.
スピーカから出力された音声を騒音下でも明瞭に聞こえるようにする音声明瞭度改善システムがある。例えば、車載用ナビゲーション装置では進路案内等の音声がスピーカから車室内に出力されるが、走行中などでエンジン音、ロードノイズ等の騒音が大きいときはマスキング効果でスピーカ出力音声が聞きづらくなる。そこで、スピーカ出力音声に比し騒音が大きいときはスピーカ出力音声にラウドネス補償を施して音声帯域全体のゲインを上げるなどして騒音下でもスピーカ出力音声が明瞭に聞こえるようにしている。 There is a speech intelligibility improvement system that makes it possible to hear sound output from a speaker clearly even under noise. For example, in an in-vehicle navigation device, sound such as route guidance is output from a speaker to a vehicle interior, but when noise such as engine sound and road noise is high during traveling, it is difficult to hear the speaker output sound due to a masking effect. Therefore, when the noise is louder than the speaker output sound, the speaker output sound is clearly audible even under noise by performing loudness compensation on the speaker output sound and increasing the gain of the entire sound band.
図10は従来の音声明瞭度改善システムを含む車載機器の一例を示す構成図である。1は進路案内等の音声信号を出力する音声信号生成手段としての車載用ナビゲーション装置、2は音声信号の明瞭度を改善する音声明瞭度改善システムである。車載用ナビゲーション装置1から出力された進路案内等の案内音声信号は音声明瞭度改善システム2のラウドネス補償を行なうラウドネス補償部としてのゲイン調整部4、パワーアンプ5を経てスピーカ6で音響変換されて車室内に案内音声が出力される。案内音声A、エンジン音やロードノイズ等の周辺の騒音(周辺音という)Nは低域までほぼフラットな周波数特性を有する無指向性のマイク7で拾われて推定部8に出力される。推定部8は案内音声信号とマイク検出信号とから案内音声パワーと周辺音パワーを推定する。この推定部8は案内音声信号をパワーアンプ5の入力側からマイク7の出力側までの伝達特性を模擬した伝達特性模擬フィルタ9に入力して案内音声成分を推定するとともに、パワー計算器10に案内音声成分を通して案内音声パワーを推定する。一方、マイク7に接続したパワー計算器11によりマイク入力のパワーを計算し、加算器12によりマイク入力パワーから案内音声パワーを減算してマイク入力中の周辺音パワーを推定する。ラウドネス補償制御部13は案内音声パワーと周辺音パワーに基づき、周辺音のレベルによらず案内音声が明瞭に聞こえるゲインを人のラウドネス特性により決定し、ゲイン調整部4に対しゲイン調整を行う。
FIG. 10 is a block diagram showing an example of an in-vehicle device including a conventional speech intelligibility improving system.
ところで、車両の騒音は低音域のレベルが非常に大きく、この低音域成分は停車中のアイドリング時にも存在するため、低音域成分まで含めた騒音のトータルなレベルは走行中と停車中のアイドリング時とでそれほど差がない。一方、走行中は中高域の騒音レベルが増加するが、この帯域はスピーカ出力音声とオーバラップするため、停車中のアイドリング時に比べてスピーカ出力音声が聞こえにくくなる。
上記した従来の音声明瞭度改善システム2では、低域までほぼフラットな周波数特性(C特性)を有する無指向性のマイク7を用いて低音域まで含めた周辺音成分を推定している。しかし、フラットな周波数特性を有する無指向性のマイクを用いると自動車騒音の低域レベルが全体の騒音レベルを主に律することになり、音声の聞こえやすさにより強く影響する中高域の騒音レベルの変化を捉えにくくなる。換言すれば、従来の音声明瞭度改善システム2では、中高域の騒音レベルの変化を検出してスピーカ出力音声のゲインを正しく制御することができない問題がある。
By the way, the noise level of the vehicle is very high in the low frequency range, and this low frequency range component exists even when idling while the vehicle is stopped. There is not much difference. On the other hand, the noise level in the mid-high range increases while traveling, but this band overlaps with the speaker output sound, so that the speaker output sound is less audible than when idling while the vehicle is stopped.
In the conventional speech
これとは別に、昨今は車両においても音声認識システム、ハンズフリーテレフォンなど、話者音声入力用のマイクを必要とする種々のシステムが導入されるようになってきている。これら音声認識システム、ハンズフリーテレフォンなどでは、主に単一指向性のマイクが用いられる。単一指向性のマイクは、カージオイドと呼ばれる指向性を形成することで中高域のSN比を向上させると共に、音声とはあまりオーバラップしない低音域の騒音はカットするような特性を持つものが多く、その点でもSN比の向上に有効だからである。一方、従来の音声明瞭度改善システムでは、上述のように低音域まで含めて(C特性)周囲の騒音レベルを推定するため、音声とはあまりオーバラップしない低音域の騒音をカットしてしまうような特性を持つマイクを採用することは難しい。音声明瞭度改善システムのマイクを話者音声入力システムのマイクと兼用できれば、システム全体の構成を簡略化できて有効であるが、以上の理由により従来の音声明瞭度改善システムでは、音声認識やハンズフリーテレフォンなどとマイクを共有することができない問題がある。
従来技術として、マイク感度を高くしたときに周辺の騒音で誤作動しないようにするため、マイク入力の通過周波数帯域を狭くする技術がある(特許文献1)。しかし、この従来技術は上記問題を解決するものではない。
As a conventional technique, there is a technique of narrowing the pass frequency band of a microphone input in order to prevent malfunction due to ambient noise when the microphone sensitivity is increased (Patent Document 1). However, this prior art does not solve the above problem.
以上より、本発明の目的は、音声明瞭度改善システムのマイクと話者音声入力用のマイクを共用できるようにすることである。
本発明の別の目的は中高域の騒音レベルの変化を検出してスピーカ出力音声のゲインを正しく制御できるようにすることである。
本発明の別の目的は、話者入力マイクを用いて中高域の周辺音レベルの変化を的確に捉えてラウドネス補償を適正に行なえるようにした音声明瞭度改善システムおよび音声明瞭度改善方法を提供することである。
In view of the above, an object of the present invention is to make it possible to share the microphone of the speech intelligibility improving system and the microphone for inputting the speaker voice.
Another object of the present invention is to detect a change in the noise level in the mid-high range so that the gain of the speaker output sound can be correctly controlled.
Another object of the present invention is to provide a speech intelligibility improvement system and a speech intelligibility improvement method that can appropriately perform loudness compensation by accurately detecting changes in the level of ambient sounds in the middle and high frequencies using a speaker input microphone. Is to provide.
・音声明瞭度改善システム
本発明の第1は、音声信号生成部が生成した音声信号の音声パワーと周辺音のパワーとに基づき音声信号のゲインを制御する音声明瞭度改善システムである。この音声明瞭度改善システムは、前記音声信号に基づいてスピーカから出力される音声と周辺音を検出する単一指向性のマイク、マイク検出信号と前記音声信号とから音声パワーと周辺音のパワーを推定する推定部、前記マイクと推定部との間に設けられた聴感補正フィルタを備え、マイクから該聴感補正フィルタまでの伝達特性が略A特性となるようにする。
上記音声明瞭度改善システムにおいて、無指向性マイクにA特性フィルタを接続したときのA特性フィルタの出力を周波数領域で表わしたものをY(ω)、無指向性マイクと近接するように設置した単一指向性マイクの出力を周波数領域で表わしたものをX(ω)とするとき、前記聴感補正フィルタの伝達特性H(ω)を、
H(ω)=Y(ω)/X(ω)
となるように決定する。
・音声明瞭度改善方法
本発明の第2は音声信号生成部が生成した音声信号をスピーカで音響変換し、該スピーカから出力された音声と周辺音をマイクで検出し、該マイク検出信号と前記音声信号とから音声パワーと周辺音パワーを推定し、該推定した音声パワーと周辺音パワーとに基づき音声信号のゲインを制御する音声明瞭度改善方法である。この音声明瞭度改善方法において、前記マイクを単一指向性とし、該マイクと前記音声パワーと周辺音パワーを推定する推定部との間に聴感補正フィルタを設けると共に、該マイクから該聴感補正フィルタまでの伝達特性が略A特性となるようにし、前記推定部において前記聴感補正フィルタを介して入力されるマイク検出信号と音声信号とから音声パワーと周辺音パワーを推定する。
上記音声明瞭度改善方法において、無指向性マイクにA特性フィルタを接続したときのA特性フィルタの出力を周波数領域で表わしたものをY(ω)、無指向性マイクと近接するように設置した単一指向性マイクの出力を周波数領域で表わしたものをX(ω)とするとき、前記聴感補正フィルタの伝達特性H(ω)を、
H(ω)=Y(ω)/X(ω)
となるように決定する。
上記音声明瞭度改善方法において、無指向性マイクにA特性フィルタを接続するとともに単一指向性マイクに適応フィルタを接続し、近接するように設置した第1のマイクと第2のマイクに所定の音波を入射させながらA特性フィルタの出力と適応フィルタの出力の誤差が最小となるように適応フィルタのフィルタ係数を更新して学習を行なわせ、前記聴感補正フィルタの伝達特性H(ω)を学習後の適応フィルタの伝達特性にする。
-Voice clarity improvement system The first aspect of the present invention is a voice clarity improvement system that controls the gain of a voice signal based on the voice power of the voice signal generated by the voice signal generation unit and the power of surrounding sounds. This speech intelligibility improving system is a unidirectional microphone that detects sound and ambient sound output from a speaker based on the sound signal, and obtains sound power and peripheral sound power from the microphone detection signal and the sound signal. An estimation unit for estimation, and an auditory correction filter provided between the microphone and the estimation unit are provided, and a transfer characteristic from the microphone to the auditory correction filter is set to a substantially A characteristic.
In the above speech intelligibility improvement system, the output of the A characteristic filter when the A characteristic filter is connected to the omnidirectional microphone is represented in the frequency domain as Y (ω), and is placed close to the omnidirectional microphone. When the output of the unidirectional microphone in the frequency domain is X (ω), the transfer characteristic H (ω) of the audibility correction filter is
H (ω) = Y (ω) / X (ω)
To be determined.
-Voice intelligibility improving method The second of the present invention is that the audio signal generated by the audio signal generation unit is acoustically converted by a speaker, the audio and surrounding sounds output from the speaker are detected by a microphone, and the microphone detection signal and the This is a speech intelligibility improving method that estimates speech power and ambient sound power from a speech signal and controls the gain of the speech signal based on the estimated speech power and ambient sound power. In this speech intelligibility improving method, the microphone is unidirectional, and an auditory correction filter is provided between the microphone and the estimation unit for estimating the voice power and the ambient sound power, and the auditory correction filter is provided from the microphone. So that the transmission characteristic up to approximately A characteristic is obtained, and the estimation unit estimates the sound power and the ambient sound power from the microphone detection signal and the sound signal input via the audibility correction filter.
In the above speech intelligibility improving method, the output of the A characteristic filter when the A characteristic filter is connected to the omnidirectional microphone is expressed in the frequency domain as Y (ω), and is set close to the omnidirectional microphone. When the output of the unidirectional microphone in the frequency domain is X (ω), the transfer characteristic H (ω) of the audibility correction filter is
H (ω) = Y (ω) / X (ω)
To be determined.
In the speech intelligibility improving method, an A characteristic filter is connected to an omnidirectional microphone, an adaptive filter is connected to a unidirectional microphone, and a first microphone and a second microphone installed so as to be close to each other are predetermined. Learning the transfer characteristic H (ω) of the audibility correction filter by updating the filter coefficient of the adaptive filter so that the error between the output of the A characteristic filter and the output of the adaptive filter is minimized while the sound wave is incident. The transfer characteristic of the later adaptive filter is used.
本発明によれば、マイクから聴感補正フィルタまでの伝達特性が人の聴覚特性に基づくA特性に近くなるので、音声の聞こえやすさにより強く影響する中高域の周辺音レベルの変化を的確に捉えて音声明瞭度改善制御が可能となり、ナビゲーション案内音声などの音声を聞き取りやすくできる。
また、本発明によれば、音声明瞭度改善システムのマイクを音声認識、ハンズフリーテレフォン等の話者入力マイクと兼用できるため、話者入力マイクを使用する他の音声入力装置と合わせた全体構成を簡単化できる。
According to the present invention, since the transfer characteristic from the microphone to the auditory correction filter is close to the A characteristic based on the human auditory characteristic, the change in the ambient sound level in the middle and high frequencies that strongly affects the ease of hearing of the sound is accurately captured. Therefore, voice clarity improvement control can be performed, and navigation guidance voice and other voices can be easily heard.
Further, according to the present invention, since the microphone of the speech intelligibility improving system can be used also as a speaker input microphone such as a voice recognition, a hands-free telephone, etc., the overall configuration combined with other voice input devices using the speaker input microphone Can be simplified.
(A)概要
本発明は、従来の音声明瞭度改善システムと異なり、低音域まで含めて(C特性で)周囲の騒音レベルを推定するのではなく、音声の聞こえやすさにより強く影響する中高域の騒音レベルを主に観測する様にする。これは、騒音や音声信号をある種のハイパスフィルタに通してそのレベルを観測することにより実現できる。そこで、ハイパスフィルタとしての特性を持ち、人間が感じる音量感に基づいて考案されたA特性を通して周囲の騒音や音声のレベルを推定するようにする。A特性を通した騒音(周辺音)や音声のレベル推定値に基づくラウドネス補償についての基礎研究は下記文献で示すように既になされているため、実際の制御はこの研究成果に基づいて行えばよい。
[1] Y.Suzuki et al., J. Acoust. Soc. Jpn.(E), 3(2), pp55-65, 1982
[2] Y.Suzuki et al., J. Acoust. Soc. Jpn.(E), 6(3), pp161-170, 1985
次に、音声認識やハンズフリーテレフォンなどで主に用いられる単一指向性のマイクは、音声とはあまりオーバラップしない低音域の騒音をカットするような特性(ハイパスフィルタ特性)をそもそも持つものが多い。そのため、単一指向性のマイクを用い、その出力側に適当なフィルタ処理を入れて全体としての特性がA特性となるようにすれば、このマイクシステムは音声明瞭度改善システムとしても用いることが可能になる。勿論、音声認識やハンズフリーテレフォンなどでは、単一指向性マイクの出力を、フィルタリングしないで用いればよい。しかも、単一指向性のマイク自体がハイパスフィルタとなっているため、従来の様に低音域までフラットな特性を持つマイクとA特性フィルタにより実現する場合に比べ、単一指向性マイクの後に接続するフィルタの規模はより小さくできる。
要約すると、本発明では、
(1)ハイパスフィルタとしての特性を持ち、人間が感じる音量感に基づいて考案されたA特性を通して周囲の騒音や音声のレベルを推定することにより、"音声の聞こえやすさ"により強く影響する中高域の騒音レベルの変化を捉えやすくする。
(2)単一指向性のマイクを用い、その出力側に適当なフィルタ処理を入れて、全体としての特性がA特性となるようにすることで、音声認識やハンズフリーテレフォンなどとマイクを共有できる構成とし、更に、"従来のように低音域までフラットな特性を持つマイクとA特性フィルタとを用いる方法"に比べて、単一指向性マイクの後に接続するフィルタの規模をより小さなものとする。
(A) Outline Unlike the conventional speech intelligibility improvement system, the present invention does not estimate the surrounding noise level (including the C characteristic) including the low frequency range, but rather influences the ease of hearing of the mid-high frequency range. Mainly observe the noise level. This can be realized by observing the level of a noise or voice signal through a certain high-pass filter. Therefore, the ambient noise and voice levels are estimated through the A-characteristic, which has a characteristic as a high-pass filter and is devised based on a sense of volume felt by humans. Since basic research on loudness compensation based on noise (ambient sound) and speech level estimation values through A-characteristics has already been made as shown in the following document, actual control should be based on this research result. .
[1] Y. Suzuki et al., J. Acoust. Soc. Jpn. (E), 3 (2), pp55-65, 1982
[2] Y. Suzuki et al., J. Acoust. Soc. Jpn. (E), 6 (3), pp161-170, 1985
Next, unidirectional microphones, which are mainly used for voice recognition and hands-free telephones, have characteristics (high-pass filter characteristics) that cut low-frequency noise that does not overlap with speech. Many. Therefore, if a unidirectional microphone is used and appropriate filtering is performed on the output side so that the overall characteristic becomes the A characteristic, this microphone system can also be used as a speech intelligibility improvement system. It becomes possible. Of course, the output of the unidirectional microphone may be used without filtering in voice recognition, hands-free telephone, or the like. In addition, since the unidirectional microphone itself is a high-pass filter, it is connected after the unidirectional microphone, compared to the case where a microphone having a flat characteristic up to the low frequency range and an A-characteristic filter are used. The size of the filter to be performed can be made smaller.
In summary, in the present invention,
(1) Medium-high, which has characteristics as a high-pass filter and has a strong influence on “easy to hear” by estimating ambient noise and sound levels through A-weighting designed based on the sense of volume perceived by humans. Make it easier to detect changes in the noise level of the area.
(2) Use a unidirectional microphone and put an appropriate filter process on the output side so that the overall characteristics become A characteristics, so that the microphone is shared with voice recognition and hands-free telephones. In addition, the size of the filter connected after the unidirectional microphone is smaller than the “method of using a microphone having a flat characteristic up to the low frequency range and an A characteristic filter as in the past”. To do.
(B)実施例
次に、図1を参照して本発明の実施例を説明する。図1は本発明に係る音声明瞭度改善システムを含む車載機器の構成を示すブロック図であり、図10と同一の構成部分には同一の符号が付している。
図1において、2Aは音声明瞭度改善システム、7Aはスピーカから出力された案内音声A、エンジン音やロードノイズ等の騒音Nを検出するマイクであり、話者音声入力用のマイクと兼用するため単一指向性を有する。量産向けの単一指向性マイクは、カージオイドと呼ばれる指向性を形成することで中高域のSN比を向上させるとともに、構造上、音声とはあまりオーバラップしない低音域の騒音はカットするような特性を持つ(図2参照)。20は音声認識装置であり、マイク7Aからのマイク入力(話者入力音声)に基づき音声認識を行い、オーディオシステム、ナビゲーションシステムなどの音声制御を行なう。21はマイク7Aと推定部8Aの間に設けられた聴感補正フィルタであり、ここでは図3に示す如く重み付け係数s1、a11、a21、b01、b11、b21が固定の2次のIIRフィルタの1段構成となっている。聴感補正フィルタ21の伝達特性(周波数−振幅特性)は、マイク7Aと聴感補正フィルタ21とを組み合わせた特性が略A特性を示すように決定すれば、音声の聞こえやすさにより強く影響する中高域の周辺音レベルの変化を的確に捉えることが可能となる。
(B) Embodiment Next, an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of an in-vehicle device including a speech intelligibility improving system according to the present invention, and the same components as those in FIG. 10 are denoted by the same reference numerals.
In FIG. 1, 2A is a speech intelligibility improving system, 7A is a guidance voice A output from a speaker, a microphone for detecting noise N such as engine sound and road noise, and is also used as a microphone for inputting a speaker's voice. Unidirectional. The unidirectional microphone for mass production improves the S / N ratio in the mid-high range by forming the directivity called cardioid, and cuts out the low-frequency noise that does not overlap with the voice because of its structure. Has characteristics (see FIG. 2).
推定部8Aは案内音声信号と聴感補正フィルタ21の出力信号から案内音声パワーと周辺音パワーを推定する。すなわち、推定部8Aは、パワーアンプ5の入力側から聴感補正フィルタ21の出力側までの伝達特性を模擬した伝達特性模擬フィルタ8Aに案内音声信号を入力して案内音声成分を求めるとともに、パワー計算器10に該案内音声成分を入力して案内音声パワーを推定する。一方、聴感補正フィルタ21に接続したパワー計算器11はマイク入力信号のパワーを計算し、加算器12はマイク入力パワーから案内音声パワーを減算して周辺音パワーを推定する。ラウドネス補償制御部13は案内音声パワーと周辺音パワーに基づき、周辺音のレベルによらず案内音声が明瞭に聞こえるゲインを人のラウドネス特性により決定し、ゲイン調整部4に対しゲイン調整を行う。このとき、周辺音パワーは聴感補正がされているため、音声の聞こえやすさにより強く影響する中高域の周辺音レベルの変化を的確に捉えることができ、走行中に中高域の周辺音レベルが増大したときにラウドネス補償を適正に行なうことができる。
The estimation unit 8A estimates the guidance voice power and the ambient sound power from the guidance voice signal and the output signal of the
(C)聴感補正フィルタ21の伝達特性設定法
音声明瞭度改善システムにおいて、低域までほぼフラットな特性(図4参照)を有する無指向性マイクを用いる場合、図5に示すように、該無指向性マイクMICに人の周波数別音量感の聴覚特性を考慮したA特性(図6参照)を有するA特性フィルタAFILを直列に接続し、該A特性フィルタAFILの出力を推定部8Aに入力する。このようにすると、音声の聞こえやすさにより強く影響する中高域の周辺音レベルの変化を的確に捉えることができる。なお、A特性フィルタAFILをIIRフィルタで近似する場合、低域の減衰量が急激に大きくなっているので、図7に示すように2次のIIRフィルタの2段構成が必要である。
そこで、マイク7Aと聴感補正フィルタ21とを組み合わせた特性が、図5の無指向性のマイクMICからA特性フィルタAFILまでの伝達特性と略同一となるように、聴感補正フィルタ21の伝達特性(周波数−振幅特性)を設定すれば、マイク7Aと聴感補正フィルタ21との組み合わせで、音声の聞こえやすさにより強く影響する中高域の周辺音レベルの変化を的確に捉えることが可能となる。
(C) Transfer characteristic setting method of
Therefore, the transmission characteristic of the audibility correction filter 21 (the characteristic of the combination of the
(a)聴感補正フィルタのフィルタ特性の第1の決定方法
図8は聴感補正フィルタ21のフィルタ特性の第1の決定方法説明図である。
無指向性のマイクMICと単一指向性のマイク7AをスピーカSPに向けて近接させて並べ、マイクMICの出力側にA特性フィルタ22を接続しておく。スピーカSPから放射させた白色雑音(WN)をマイクMICと7Aで検出したときのA特性フィルタAFILの出力y、マイク7Aの出力xをFFTアナライザANLFFTで周波数分析し、その結果得られるマイクMICにA特性フィルタAFILを接続した系の出力をY(ω)、マイク7Aの出力をX(ω)とするとき、次式
H(ω)=Y(ω)/X(ω)
を満足する伝達関数H(ω)を求める。図1の聴感補正フィルタ21の周波数−振幅特性をこの伝達関数H(ω)の周波数−振幅特性と一致あるいは略一致させる。具体的には、伝達関数H(ω)の周波数−振幅特性を単純化してアナログフィルタ(例えばLPF)の周波数−振幅特性を決定し、s−z変換等の手法により図3に示す1段構成の2次IIRの各重み付け係数s1、a11、a21、b01、b11、b21を決定する。
(A) First Determination Method of Filter Characteristics of Auditory Correction Filter FIG. 8 is an explanatory diagram of a first determination method of filter characteristics of the
An omnidirectional microphone MIC and a
A transfer function H (ω) that satisfies the above is obtained. The frequency-amplitude characteristic of the auditory
(b)聴感補正フィルタのフィルタ特性の第2の決定方法
図9は聴感補正フィルタ21のフィルタ特性の第2の決定方法説明図である。
無指向性のマイクMICと単一指向性のマイク7AをスピーカSPに向けて近接させて並べ、マイクMICの出力側にA特性フィルタAFILを接続し、マイク7Aの出力側に適応フィルタADFを接続する。スピーカSPから白色雑音WNを放射させた状態で、加算器ADDにより、A特性フィルタAFILの出力yと適応フィルタADFの出力xの誤差eを求め、係数更新部CRNWにより、誤差eの2乗値が最小となるようにLMSアルゴリズム等により適応フィルタADFの係数を更新して学習を行なわせる。学習後の適応フィルタADFの周波数−振幅特性を単純化してアナログフィルタ(例えばLPF)の周波数−振幅特性を決定し、s−z変換等の手法により図3に示す1段構成の2次IIRの各重み付け係数s1、a11、a21、b01、b11、b21を決定する。
(B) Second Determination Method of Filter Characteristics of Auditory Correction Filter FIG. 9 is an explanatory diagram of a second determination method of filter characteristics of the
An omnidirectional microphone MIC and a
以上本発明によれば、話者入力と兼用の単一指向性のマイク7Aから聴感補正フィルタ21までの伝達特性が人の聴覚特性を模したA特性に近くなるので、音声の聞こえやすさにより強く影響する中高域の周辺音レベルの変化を的確に捉えてラウドネス補償を適正に行なえるようになる。また、音声明瞭度改善システム2Aのマイク7Aを音声認識装置20の話者音声入力マイクと兼用できるので、マイク構成が簡単となる。
更に、A特性フィルタの低域減衰特性は急峻なのでIIRフィルタでA特性フィルタを具現する場合、2次IIRフィルタの2段構成とする必要があるが、単一指向性のマイク7Aは低音域を減衰させる特性を有するので(図2参照)、聴感補正フィルタ21の低域減衰特性はA特性フィルタより緩やかで良く、2次IIRフィルタの1段構成で具現することができる(図3参照)。
なお、上記した実施例では、聴感補正フィルタは2次IIRの1段構成としたが、本発明は何らこれに限定されるものでなく、2次IIRの2段構成としたり、3次以上のIIRの1段以上の構成としても良い。また、FIRフィルタで構成しても良い。
As described above, according to the present invention, the transfer characteristic from the
Furthermore, since the low-frequency attenuation characteristic of the A-characteristic filter is steep, when implementing the A-characteristic filter with an IIR filter, it is necessary to have a two-stage IIR filter, but the
In the embodiment described above, the auditory sensation correction filter has a secondary IIR one-stage configuration. However, the present invention is not limited to this, and the secondary IIR has a two-stage configuration or a third-order or higher order. It is good also as a structure of 1 step | paragraph or more of IIR. Moreover, you may comprise with a FIR filter.
1 車載用ナビゲーション装置
2A 音声明瞭度改善システム
4 ゲイン調整部
6 スピーカ
7A 単一指向性のマイク
8A 推定部
13 ラウドネス補償制御部
DESCRIPTION OF
Claims (5)
前記音声信号に基づいてスピーカから出力される音声と周辺音を検出する単一指向性のマイク、
マイク検出信号と前記音声信号とから音声パワーと周辺音のパワーを推定する推定部、
前記マイクと推定部との間に設けられた聴感補正フィルタ、
を備え、
マイクから該聴感補正フィルタまでの伝達特性が略A特性となるようにしたことを特徴とする音声明瞭度改善システム。 In the speech intelligibility improvement system that controls the gain of the audio signal based on the audio power of the audio signal generated by the audio signal generation unit and the power of the surrounding sound,
A unidirectional microphone for detecting sound output from a speaker and ambient sound based on the sound signal;
An estimation unit that estimates the sound power and the power of surrounding sounds from the microphone detection signal and the sound signal;
Hearing correction filter provided between the microphone and the estimation unit,
With
A speech intelligibility improvement system characterized in that a transfer characteristic from a microphone to the audibility correction filter is substantially A-characteristic.
H(ω)=Y(ω)/X(ω)
となるように決定する、
ことを特徴とする請求項1記載の音声明瞭度改善システム。 Y (ω) represents the output of the A characteristic filter in the frequency domain when the A characteristic filter is connected to the omnidirectional microphone, and the output of the unidirectional microphone installed close to the omnidirectional microphone. When what is expressed in the frequency domain is X (ω), the transfer characteristic H (ω) of the hearing correction filter is
H (ω) = Y (ω) / X (ω)
Decide to be,
The speech intelligibility improvement system according to claim 1.
前記マイクを単一指向性とし、
該マイクと前記音声パワーと周辺音パワーを推定する推定部との間に聴感補正フィルタを設けると共に、該マイクから該聴感補正フィルタまでの伝達特性が略A特性となるようにし、
前記推定部において前記聴感補正フィルタを介して入力されるマイク検出信号と音声信号とから音声パワーと周辺音パワーを推定する、
ことを特徴とする音声明瞭度改善方法。 The sound signal generated by the sound signal generation unit is acoustically converted by the speaker, the sound output from the speaker and the surrounding sound are detected by the microphone, and the sound power and the surrounding sound power are estimated from the microphone detection signal and the sound signal. In the speech intelligibility improving method for controlling the gain of the audio signal based on the estimated audio power and the ambient audio power,
The microphone is unidirectional,
An audibility correction filter is provided between the microphone and the estimation unit for estimating the sound power and the ambient sound power, and a transfer characteristic from the microphone to the audibility correction filter is substantially A characteristic,
Estimating audio power and ambient sound power from the microphone detection signal and the audio signal input through the auditory correction filter in the estimation unit,
A speech intelligibility improvement method characterized by the above.
H(ω)=Y(ω)/X(ω)
となるように決定する、
ことを特徴とする請求項3記載の音声明瞭度改善方法。 Y (ω) represents the output of the A characteristic filter in the frequency domain when the A characteristic filter is connected to the omnidirectional microphone, and the output of the unidirectional microphone installed close to the omnidirectional microphone. When what is expressed in the frequency domain is X (ω), the transfer characteristic H (ω) of the hearing correction filter is
H (ω) = Y (ω) / X (ω)
Decide to be,
The method of improving speech intelligibility according to claim 3.
ことを特徴とする請求項3記載の音声明瞭度改善方法。 An A characteristic filter is connected to an omnidirectional microphone, an adaptive filter is connected to a unidirectional microphone, and a predetermined sound wave is incident on a first microphone and a second microphone installed so as to be close to each other. Learning is performed by updating the filter coefficient of the adaptive filter so that the error between the output of the adaptive filter and the output of the adaptive filter is minimized, and the transfer characteristic H (ω) of the audibility correction filter is changed to the transfer characteristic of the adaptive filter after learning. To
The method of improving speech intelligibility according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007179469A JP5383008B2 (en) | 2007-07-09 | 2007-07-09 | Speech intelligibility improvement system and speech intelligibility improvement method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007179469A JP5383008B2 (en) | 2007-07-09 | 2007-07-09 | Speech intelligibility improvement system and speech intelligibility improvement method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009015209A true JP2009015209A (en) | 2009-01-22 |
JP5383008B2 JP5383008B2 (en) | 2014-01-08 |
Family
ID=40356133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007179469A Active JP5383008B2 (en) | 2007-07-09 | 2007-07-09 | Speech intelligibility improvement system and speech intelligibility improvement method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5383008B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015080992A (en) * | 2013-10-22 | 2015-04-27 | 山口電機工業株式会社 | Alarm device for vehicle |
JP2015111773A (en) * | 2013-12-06 | 2015-06-18 | 株式会社Jvcケンウッド | Acoustic device, acoustic processing method, and acoustic processing program |
CN110914901A (en) * | 2017-07-18 | 2020-03-24 | 哈曼贝克自动系统股份有限公司 | Verbal signal leveling |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0390594U (en) * | 1989-12-29 | 1991-09-13 | ||
JPH05181489A (en) * | 1991-12-26 | 1993-07-23 | Clarion Co Ltd | Sound field correction device |
JPH10105191A (en) * | 1996-09-30 | 1998-04-24 | Toshiba Corp | Speech recognition device and microphone frequency characteristic converting method |
JPH11166835A (en) * | 1997-12-03 | 1999-06-22 | Alpine Electron Inc | Navigation voice correction device |
JP2001189987A (en) * | 1999-12-28 | 2001-07-10 | Pioneer Electronic Corp | Narrow directivity microphone unit |
JP2001352595A (en) * | 2000-06-08 | 2001-12-21 | Toyota Central Res & Dev Lab Inc | Voice input device |
JP2002078100A (en) * | 2000-09-05 | 2002-03-15 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for processing stereophonic signal, and recording medium with recorded stereophonic signal processing program |
JP2004085963A (en) * | 2002-08-28 | 2004-03-18 | Alpine Electronics Inc | Navigation voice compensating device |
JP2004102095A (en) * | 2002-09-12 | 2004-04-02 | Sony Corp | Signal processing system, apparatus and method for signal processing, recording medium, and program |
WO2006013490A1 (en) * | 2004-07-26 | 2006-02-09 | Koninklijke Philips Electronics N.V. | Sound enhancement |
-
2007
- 2007-07-09 JP JP2007179469A patent/JP5383008B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0390594U (en) * | 1989-12-29 | 1991-09-13 | ||
JPH05181489A (en) * | 1991-12-26 | 1993-07-23 | Clarion Co Ltd | Sound field correction device |
JPH10105191A (en) * | 1996-09-30 | 1998-04-24 | Toshiba Corp | Speech recognition device and microphone frequency characteristic converting method |
JPH11166835A (en) * | 1997-12-03 | 1999-06-22 | Alpine Electron Inc | Navigation voice correction device |
JP2001189987A (en) * | 1999-12-28 | 2001-07-10 | Pioneer Electronic Corp | Narrow directivity microphone unit |
JP2001352595A (en) * | 2000-06-08 | 2001-12-21 | Toyota Central Res & Dev Lab Inc | Voice input device |
JP2002078100A (en) * | 2000-09-05 | 2002-03-15 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for processing stereophonic signal, and recording medium with recorded stereophonic signal processing program |
JP2004085963A (en) * | 2002-08-28 | 2004-03-18 | Alpine Electronics Inc | Navigation voice compensating device |
JP2004102095A (en) * | 2002-09-12 | 2004-04-02 | Sony Corp | Signal processing system, apparatus and method for signal processing, recording medium, and program |
WO2006013490A1 (en) * | 2004-07-26 | 2006-02-09 | Koninklijke Philips Electronics N.V. | Sound enhancement |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015080992A (en) * | 2013-10-22 | 2015-04-27 | 山口電機工業株式会社 | Alarm device for vehicle |
JP2015111773A (en) * | 2013-12-06 | 2015-06-18 | 株式会社Jvcケンウッド | Acoustic device, acoustic processing method, and acoustic processing program |
CN110914901A (en) * | 2017-07-18 | 2020-03-24 | 哈曼贝克自动系统股份有限公司 | Verbal signal leveling |
Also Published As
Publication number | Publication date |
---|---|
JP5383008B2 (en) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7930175B2 (en) | Background noise reduction system | |
JP6017825B2 (en) | A microphone and earphone combination audio headset with means for denoising proximity audio signals, especially for "hands-free" telephone systems | |
JP4767166B2 (en) | Howling suppression device, program, integrated circuit, and howling suppression method | |
US8306234B2 (en) | System for improving communication in a room | |
US20180190258A1 (en) | Adaptations for active noise cancellation inside a vehicle | |
JP3795070B2 (en) | Mobile radio device with hands-free call device | |
US9922636B2 (en) | Mitigation of unstable conditions in an active noise control system | |
JP2016051038A (en) | Noise gate device | |
JP2011205692A (en) | Indoor communication system for vehicular cabin | |
US20160088407A1 (en) | Method of signal processing in a hearing aid system and a hearing aid system | |
JP2007180896A (en) | Voice signal processor and voice signal processing method | |
JP2002051392A (en) | In-vehicle conversation assisting device | |
WO2019158216A1 (en) | Active noise control with feedback compensation | |
JP5383008B2 (en) | Speech intelligibility improvement system and speech intelligibility improvement method | |
JP2008070878A (en) | Voice signal pre-processing device, voice signal processing device, voice signal pre-processing method and program for voice signal pre-processing | |
JP4977551B2 (en) | Active noise control device | |
US20220189450A1 (en) | Audio processing system and audio processing device | |
JP2003333683A (en) | Noise suppression method and microphone unit | |
US11074903B1 (en) | Audio device with adaptive equalization | |
JP2008070877A (en) | Voice signal pre-processing device, voice signal processing device, voice signal pre-processing method and program for voice signal pre-processing | |
CN107833580B (en) | Noise suppression based on dynamic increase of input noise characteristics | |
JP4495581B2 (en) | Audio output device | |
JP3796869B2 (en) | Active noise reduction apparatus and noise reduction method | |
JP2001024459A (en) | Audio device | |
JP6632246B2 (en) | Noise reduction device, noise reduction method, and in-vehicle system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120914 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120925 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20121122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5383008 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |