JP2011035685A - 自動音量制御装置 - Google Patents
自動音量制御装置 Download PDFInfo
- Publication number
- JP2011035685A JP2011035685A JP2009180322A JP2009180322A JP2011035685A JP 2011035685 A JP2011035685 A JP 2011035685A JP 2009180322 A JP2009180322 A JP 2009180322A JP 2009180322 A JP2009180322 A JP 2009180322A JP 2011035685 A JP2011035685 A JP 2011035685A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- unit
- frequency
- level
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
【課題】運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うこと。
【解決手段】自動音量制御装置1は、マイクM1、M2により取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段5と、音声信号における信号レベルと、音楽信号における信号レベルとのレベル差を求めるレベル差検出手段6と、低域側の周波数から高域側の周波数までの帯域幅における音楽信号の信号レベルを、レベル差に対応するレベルだけ低減させる帯域制御手段7とを備えている。
【選択図】図1
【解決手段】自動音量制御装置1は、マイクM1、M2により取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段5と、音声信号における信号レベルと、音楽信号における信号レベルとのレベル差を求めるレベル差検出手段6と、低域側の周波数から高域側の周波数までの帯域幅における音楽信号の信号レベルを、レベル差に対応するレベルだけ低減させる帯域制御手段7とを備えている。
【選択図】図1
Description
本発明は自動音量制御装置に関し、より詳細には、音楽が流されている空間において会話が行われた場合に、発話に応じて音楽の出力レベルを音声帯域のみ低減させることにより、円滑な会話を実現することが可能な自動音量制御装置に関する。
走行中の車両の室内では、運転(走行)に音楽やラジオ番組等を流すことが多い。このような状況において、運転手と同乗者とが会話を行う場合には、音楽等の再生音によって、円滑な会話(会話の聞き取り等)が妨げられてしまうおそれがあった。
一般的な車載用オーディオ装置には、音量を調節するための音量調節スイッチや、音量を一時的に低減させるためのミュートスイッチなどが設けられている(例えば、特許文献1および特許文献2参照)。このため、運転者等は、音量調節スイッチやミュートスイッチを操作することにより、会話を妨げない程度まで音楽等の再生音量を低減させることが多かった。
しかしながら、会話を行う度に音量調節スイッチを操作して再生音を低減する方法では、操作が煩雑になり、かえって円滑な会話を妨げてしまうおそれがあるという問題があった。一方で、ミュートスイッチを用いて音楽の再生音(出力レベル)を低減させる方法では、会話が途切れた状態においてもそのまま音楽の再生音が低減された状態となってしまい、音楽やラジオ番組等を楽しむことができないという問題があった。
このため、音量調節スイッチやミュートスイッチを操作することなく会話が成立するような大きな声を、発話者が発することにより、音楽等を再生させた状態で会話を行うこともしばしば行われるが、会話が続く場合には、発話者はもちろんのこと会話の相手側においても会話に疲労を感じてしまうおそれがあるという問題があった。
本発明は、上記問題に鑑みてなされたものであり、運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うことが可能な自動音量制御装置を提供することを課題とする。
上記課題を解決するために、本発明に係る自動音量制御装置は、マイクにより取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段と、前記音声信号における信号レベルと、前記音楽信号における信号レベルとのレベル差を求めるレベル差検出手段と、前記低域側の周波数から前記高域側の周波数までの帯域幅における前記音楽信号の信号レベルを、前記レベル差に対応するレベルだけ低減させる帯域制御手段とを備えることを特徴とする。
本発明に係る自動音量制御装置では、マイクによって音声信号が取得された場合に、音楽信号において音量制御を行う帯域幅が音声信号の周波数特性に応じて求められ、求められた帯域幅における音楽信号の信号レベルが、音楽信号の信号レベルと音声信号の信号レベルとのレベル差に対応するレベルだけ低減されるので、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
特に、本発明に係る自動音量制御装置では、音楽信号の信号レベルを音声帯域の範囲において低減させることができるので、会話の妨げとなり得る音声と同じ帯域の信号レベル(音量)だけを低減させることができ、音楽の音質を著しく損なうことなく円滑な会話を行うことが可能となる。
また、上述する自動音量制御装置において、前記帯域幅検出手段は、前記マイクにより取得された音声信号に対して高速フーリエ変換を適用し、求められた音声信号の振幅値をFFTサンプル毎に累積して累積分布を求める累積分布算出手段と、求められた累積分布に対して前記音声信号における下限の周波数を決定するための低域スレッショルドと、前記音声信号における上限の周波数を決定するための高域スレッショルドとを、前記累積分布の累積確率に応じて設定するスレッショルド設定手段と、前記低域スレッショルドに対応する前記音声信号の周波数を低域側の周波数として求めると共に、高域スレッショルドに対応する前記音声信号の周波数を高域側の周波数として求める帯域幅判定手段とを有するものであってもよい。
上述した自動音量制御装置によれば、音声信号の振幅値をFFTサンプル毎に累積した累積分布を求め、求められた累積分布に対して音声信号における下限の周波数を決定するための低域スレッショルドと、音声信号における上限の周波数を決定するための高域スレッショルドとを、累積分布の累積確率に応じて設定する。このため、音声信号毎の相対的な振幅確率に基づく累積割合に応じて低域スレッショルドと高域スレッショルドとを設定することができるので、低域スレッショルドに基づいて求められる音声信号の低域側の周波数と、高域スレッショルドに基づいて求められる音声信号の高域側の周波数とは、音声信号の周波数特性を考慮した最適な周波数値として求めることが可能となる。従って、例えば発話者が男性の場合には、男性の周波数特性に応じて最適な低域側の周波数と高域側の周波数とが求められて、男性の音声信号に最適な帯域幅を検出することが可能となり、発話者が女性の場合にも同様にして、女性の音声信号に最適な帯域幅を検出することが可能となる。
さらに、上述した自動音量制御装置において、前記帯域制御手段は、前記帯域幅検出手段により求められた前記低域側の周波数をカットオフ周波数として、前記低域側の周波数以下の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるローシェルフフィルタ手段と、前記帯域幅検出手段により求められた前記高域側の周波数をカットオフ周波数として、前記高域側の周波数以上の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるハイシェルフフィルタ手段と、前記ローシェルフフィルタ手段および前記ハイシェルフフィルタ手段により棚状に信号レベルが増幅された音楽信号を、増幅された前記信号レベル分だけ全体的に信号レベルを低減させる信号レベル低減手段とを有するものであってもよい。
このように、ローシェルフフィルタ手段により低域側の周波数以下の信号レベルをレベル差に対応する信号レベルだけ棚状に増幅させ、また、ハイシェルフフィルタ手段により高域側の周波数以上の信号レベルをレベル差に対応する信号レベルだけ棚状に増幅させることにより、結果として、増幅されなかった低域側の周波数から高域側の周波数までの帯域の信号レベルが、低域側の周波数以下の周波数および高域側の周波数以上の周波数の信号レベルに比べて相対的に低減された状態となる。このように増幅処理された音楽信号を、増幅された信号レベル分に該当するレベルだけ、全体的に信号レベルを低減させることにより、音量制御前の音楽信号に比べて、低域側の周波数から高域側の周波数までの帯域の信号レベルだけがレベル差に対応する信号レベルだけ低減された状態となる。
このようにして、マイクにより取得された音声信号の音声帯域に対応する帯域幅で、レベル差に対応する信号レベルだけ音声信号の信号レベル(音量)が低減されるので、会話の音声に最適な帯域幅でのみ信号レベルの低減を行うことができる。また、会話の帯域幅以外の音楽信号においては信号レベルが低減されないので良質の音楽を楽しむことができ、さらに、音楽の再生が行われていても、会話を妨げうる帯域幅の信号レベルだけを効果的に低減させることができるので、円滑な会話を楽しむことが可能となる。
また、上述した自動音量制御装置において、前記レベル差検出手段は、前記音楽信号の帯域幅を一般的な音楽信号の帯域幅に制限する帯域制限手段と、前記マイクを介して取得された前記音声信号の信号レベルと、前記帯域制限手段により帯域幅の制限が行われた音楽信号の信号レベルとのレベル差を求めるレベル差算出手段とを有するものであってもよい。
このように、レベル差を求める前に音楽信号の帯域幅を一般的な音楽信号の帯域幅に制限することにより、音声信号と同一の帯域幅を備えた音楽信号に基づいて、信号レベルのレベル差を求めることができるので、音量制御時に低減される音楽信号の信号レベルを、実際の音声の音量(音声信号の信号レベル)とのバランスを考慮した状態で求めることが可能となる。
本発明に係る自動音量制御装置では、マイクにより音声信号が取得された場合に、音楽信号の信号レベルを音声帯域の範囲のみにおいて低減させることができるので、会話がなされる場合に会話の妨げとなり得る音声と同じ帯域の信号レベル(音量)だけを低減させることができ、音楽の音質を著しく損なうことなく円滑な会話を行うことが可能となる。
以下、本発明に係る自動音量制御装置について、図面を用いて詳細に説明を行う。
図1は、本実施の形態に係る自動音量制御装置の概略構成を示したブロック図である。なお、本実施の形態では、自動音量制御装置1が車両に設置される場合を一例として示して説明する。本実施の形態に係る自動音量制御装置1を車両に設置することにより、会話の有無に応じて、車載用オーディオ装置より出力される音楽のうち音声帯域の音量のみを自動的に低減させることが可能になる。
本実施の形態に係る自動音量制御装置1は、図1に示すように、音声強調処理部2、メインボリューム部3、音声検出部4、帯域幅検出部(帯域幅検出手段)5、レベル検出部(レベル差検出手段)6、帯域制御フィルタ部(帯域制御手段)7、パワーアンプ部8、マイクM1,M2、スピーカS1,S2により概略構成されている。
[音声強調処理部]
まず、音声強調処理部2について説明する。図2は、音声強調処理部2の概略構成を示したブロック図である。音声強調処理部2は、アレイマイク部10と、オーディオキャンセラ部11と、ノイズキャンセラ部13とを有している。
まず、音声強調処理部2について説明する。図2は、音声強調処理部2の概略構成を示したブロック図である。音声強調処理部2は、アレイマイク部10と、オーディオキャンセラ部11と、ノイズキャンセラ部13とを有している。
[アレイマイク部]
図3は、アレイマイク部10の概略構成を示したブロック図である。アレイマイク部10は、図3に示すように、第1バンドパスフィルタ部21と、第2バンドパスフィルタ部22と、遅延部23と、適応フィルタ部24とを有している。
図3は、アレイマイク部10の概略構成を示したブロック図である。アレイマイク部10は、図3に示すように、第1バンドパスフィルタ部21と、第2バンドパスフィルタ部22と、遅延部23と、適応フィルタ部24とを有している。
第1バンドパスフィルタ部21および第2バンドパスフィルタ部22は、マイクM1とマイクM2を介して入力される音響信号に対して400Hz〜2.4kHz程度の帯域制限を行う役割を有している。従って、第1バンドパスフィルタ部21および第2バンドパスフィルタ部22を通過する音響信号は、マイクM1,M2を介して入力される音響信号のうち音声帯域に対応する信号だけになる。
遅延部23は、適応フィルタ部24における信号の減算処理に対応させるべく、マイクM1側の音響信号の遅延を行う役割を有している。このため、遅延部23は、第1バンドパスフィルタ部21により帯域制限が行われたマイクM1の音響信号に対してのみ適用される。遅延部23により遅延処理が行われた音響信号は、適応フィルタ部24に入力される。
適応フィルタ部24は、マイクM1より入力されて遅延部23により遅延処理が行われた音響信号から、マイクM2より入力された音響信号の減算処理を行う。
適応フィルタ部24は、FIR(Finite Impulse Response Filter)部25とNLMS(Normalized Least Mean Square)部26と、加算部27とを有している。
FIR部25は、有限のインパルス応答フィルタを備えており、NLMS部26によって行われる係数制御に基づいて、マイクM2で集音された音響信号に対してフィルタ処理を施す機能を有している。加算部27は、FIR部25によりフィルタ処理が行われたマイクM2からの音響信号を、位相を反転させた状態で、遅延部23により遅延処理が行われたマイクM1からの音響信号に対して加算する(実質的には、マイクM1の音響信号から、フィルタ処理が行われたマイクM2の音響信号を減算する)。加算部27により加算処理された音響信号は、適応フィルタ部24から出力されるとともに、NLMS部26へ出力される。
NLMS部26は、加算部27より取得した音響信号(マイクM1の音響信号からフィルタ処理が行われたマイクM2の音響信号が減算された信号)と、マイクM2によって集音された音響信号とに基づいて、最小二乗アルゴリズムに基づいてFIR部25におけるフィルタの係数制御を行う。このようにNLMS部26を適応フィルタ部24に設けることによって、適応速度が入力信号の大きさに依存しないという特徴を備えたNLMSアルゴリズムを適用することが可能となる。
マイクM1とマイクM2とは、図4(a)に示すように、車両28の運転席28aおよび助手席28bの上方位置に設けられたサンバイザーに設置されている。マイクM1およびマイクM2は、車両室内における会話を取得するために用いられるものであり、図4(b)に示すように、マイクM1には、無指向性のマイクが用いられ、マイクM2には、単一指向性のマイクが用いられている。このようにして、無指向性のマイクM1により集音された音と、指向性を備えたマイクM2により集音された音とが、それぞれアレイマイク部10に入力される。
無指向性のマイクM1により集音された音と、指向性を備えたマイクM2により集音された音とが、それぞれアレイマイク部10に入力されると、アレイマイク部10の適応フィルタ部24において、マイクM1の音響信号からマイクM2の音響信号が減算されるため、減算結果はマイクM2のヌル方向(マイクM2における指向範囲以外の方向)が残り、結果として、該当する方向の指向性が強調されることになる。
従って、指向性が強調される方向に発話者が位置するようにして、マイクM1とマイクM2とを設置することによって、発話者の音声を効果的に取得することが可能となる。このように発話者の音声を効果的に取得することにより、取得された音声が強調されることになるので、アレイマイク部10において求められる音響信号は、発話者の音声(希望信号D)と車載用オーディオ装置から出力される音楽(非希望信号U)との相対的な比率、すなわちD/Uが改善された信号となる。
なお、アレイマイク部10、マイクM1およびマイクM2の構成は、本実施の形態において説明した構成には限定されず、発話者の音声に対する指向性が強調されて、D/Uを改善することが可能な方式を実現するものであれば、異なる構成となるものであってもよい。
また、図4(a)に示すように、車両28にはスピーカが4カ所、具体的には、右フロントドア、左フロントドア、右リアドア、左リアドアの4カ所にそれぞれ設けられており、右フロントドアおよび右リアドアに設けられるスピーカ(このスピーカがスピーカ10aに該当する)からは、パワーアンプ部8において右側成分の音響効果が強調された音楽信号(右側音楽信号R)が出力され、左フロントドアおよび左リアドアに設けられるスピーカ(このスピーカがスピーカ10bに該当する)からは、パワーアンプ部8において左側成分の音響効果が強調された音楽信号(左側音楽信号L)が出力される。
[オーディオキャンセラ部]
次に、オーディオキャンセラ部11について説明を行う。図5は、オーディオキャンセラ部11の概略構成を示したブロック図である。オーディオキャンセラ部11は、図5に示すように、第1バンドパスフィルタ部31と、第2バンドパスフィルタ部32と、第1遅延部33と、第2遅延部34と、第1適応フィルタ部35と、第2適応フィルタ部36とを有している。
次に、オーディオキャンセラ部11について説明を行う。図5は、オーディオキャンセラ部11の概略構成を示したブロック図である。オーディオキャンセラ部11は、図5に示すように、第1バンドパスフィルタ部31と、第2バンドパスフィルタ部32と、第1遅延部33と、第2遅延部34と、第1適応フィルタ部35と、第2適応フィルタ部36とを有している。
第1バンドパスフィルタ部31および第2バンドパスフィルタ部32は、車載用オーディオ装置より出力された2チャンネルの音楽信号、すなわち左側の音楽信号Lおよび右側の音楽信号Rにおいて、200Hz〜2.6kHz程度の帯域制限を行うことにより、音響信号のうち主に音声帯域の信号のみを通過させる役割を有している。
なお、オーディオキャンセラ部11では、第1バンドパスフィルタ部31および第2バンドパスフィルタ部32において設定される帯域制限幅(200Hz〜2.6kHz程度)を、アレイマイク部10の第1バンドパスフィルタ部21および第2バンドパスフィルタ部22で設定される帯域制限幅(400Hz〜2.4kHz程度)よりも広い帯域幅(但し、400Hz〜2.4kHzを含む)に設定することにより、アレイマイク部10の帯域制限のカットオフ付近、すなわち400Hzや2.4kHzにおけるオーディオキャンセル性能の向上を図っている。
第1遅延部33および第2遅延部34は、第1バンドパスフィルタ部31および第2バンドパスフィルタ部32により帯域制限処理が行われた音響信号に対して遅延処理を施す役割を有している。第1遅延部33および第2遅延部34による遅延処理によって、アレイマイク部10を通して入力される音響信号の伝搬遅延の補正を行うことが可能となる。
第1適応フィルタ部35は、第1FIR部37、第1LMS部39、第1加算部35aにより概略構成されており、第2適応フィルタ部36は、第2FIR部38、第2LMS部40、第2加算部36aにより概略構成されている。第1適応フィルタ部35および第2適応フィルタ部36は、アレイマイク部10の適応フィルタ部24におけるNLMS部26を第1LMS部39および第2LMS部40に置き換えた構成に該当する。
第1適応フィルタ部35および第2適応フィルタ部36では、第1LMS部39および第2LMS部40において、一般的なLMS(Least Mean Square)アルゴリズムを用いることによって、アレイマイク部10から入力される音響信号から、車載用オーディオ装置により出力された音楽信号Lおよび音楽信号Rを順番に減算する処理を行う。具体的な第1適応フィルタ部35および第2適応フィルタ部36の構成については、図3に示すように、アレイマイク部10の適応フィルタ部24と同様の構成であるため、ここでの詳細な説明を省略する。
なお、オーディオキャンセラ部11では、図5に示すように、第1適応フィルタ部35および第2適応フィルタ部36がカスケード接続されている。従って、オーディオキャンセラ部11では、第1適応フィルタ部35においてアレイマイク部10から入力された音響信号を音楽信号Lで減算処理した後に、第2適応フィルタ部36において第1適応フィルタ部35で減算処理された音響信号を音楽信号Rで減算処理する構成となっている。この場合において、第1適応フィルタ部35は第2適応フィルタ部36よりも早く収束させることが必要となるため、適応速度を大きく設定している。なお、音源が2チャンネル以上ある場合は、チャンネル数に応じて適応フィルタ部の設置数を増加することにより同様の効果を奏することが可能である。
図6は、マイクM1により集音された音響信号の周波数特性と、アレイマイク部10およびオーディオキャンセラ部11を動作させた場合における適応フィルタ部24、第1適応フィルタ部35および第2適応フィルタ部36の出力信号の周波数特性を示した図である。具体的に図6には、アレイマイク部10の適応フィルタ部24を適用させる前のマイクM1の音響信号(図6において「無指向性マイク」で示すグラフ)と、アレイマイク部10の適応フィルタ部24が適用された後の音響信号(図6において「アレイマイク部」で示すグラフ)と、オーディオキャンセラ部11において第1適応フィルタ部35を適用した後の音響信号(図6において「アレイマイク部+オーディオキャンセラ部(L)」で示すグラフ)と、オーディオキャンセラ部11において第2適応フィルタ部36を適用した後の音響信号(図6において「アレイマイク部+オーディオキャンセラ部(L+R)」で示すグラフ)との周波数特性が示されている。
なお、図6に示す場合において、車載用オーディオ装置より出力される音楽信号Lおよび音楽信号Rには長周期のM系列信号が用いられ、音楽信号Lと音楽信号Rとは無相関な信号となっている。また、図7(a)は、アレイマイク部10の適応フィルタ部24で適用されるフィルタ係数を示し、図7(b)は、オーディオキャンセラ部11の第1適応フィルタ部35で適用されるフィルタ係数を示し、図7(c)は、オーディオキャンセラ部11の第2適応フィルタ部36で適用されるフィルタ係数を示している。具体的には、アレイマイク部10の適応フィルタ部24におけるFIR部25のFIRフィルタ長は128tap、オーディオキャンセラ部11の第1適応フィルタ部35におけるFIRフィルタ長および第2適応フィルタ部36のFIRフィルタ長は、それぞれ192tap、また、各FIR部におけるサンプリング周波数は6kHzに設定されている。
それぞれの適応フィルタ部24、35、36を適用する前後の周波数特性を比較すると、図6に示すように、無指向性マイクM1の出力信号の信号レベルに対して、アレイマイク部10における出力信号の信号レベルは、出力値が約10dB程度減衰している。さらに、オーディオキャンセラ部11の第1適応フィルタ部35の出力信号の信号レベルでは、アレイマイク部10における出力信号の信号レベルに対して、約8dB程度減衰し、さらに第2適応フィルタ部36における出力信号の信号レベルでは、第1適応フィルタ部35の出力信号の信号レベルに対して約11dB程度減衰している。
このように、適応フィルタ部24を適用する前の音響信号の信号レベルに比べて、適応フィルタ部24、第1適応フィルタ部35および第2適応フィルタ部36を全て適用した後の信号の信号レベルは、トータルで30dB近く出力値が減衰しており、結果としてD/Uが大きく改善されている。なお、図7(a)〜(c)に示す各適応フィルタのフィルタ係数においては、FIRフィルタの応答が続いていることから、フィルタタップ長をより長くすることにより、さらなるD/Uの改善を期待することができる。
[ノイズキャンセラ部]
ノイズキャンセラ部13は、スペクトル減算法などを用いて、オーディオキャンセラ部11より入力される信号からノイズ信号の除去を行う役割を有している。具体的に説明すると、オーディオキャンセラ部11から出力される信号には、音声信号とノイズ信号(音声以外の信号)とが含まれている。ノイズキャンセラ部13は、周波数スペクトルにおける時間的に定常的な成分(会話が行われていない状況、音声がない区間における成分)
)をノイズパターンとして推定・保持しており、音声信号とノイズ信号とが含まれる入力信号(オーディオキャンセラ部11より入力される信号)の周波数領域において、保持するノイズパターンを減算すると同時に、ノイズパターン自体を更新し続けることにより、入力信号(オーディオキャンセラ部11より入力される信号)からノイズ信号の除去を行う。
ノイズキャンセラ部13は、スペクトル減算法などを用いて、オーディオキャンセラ部11より入力される信号からノイズ信号の除去を行う役割を有している。具体的に説明すると、オーディオキャンセラ部11から出力される信号には、音声信号とノイズ信号(音声以外の信号)とが含まれている。ノイズキャンセラ部13は、周波数スペクトルにおける時間的に定常的な成分(会話が行われていない状況、音声がない区間における成分)
)をノイズパターンとして推定・保持しており、音声信号とノイズ信号とが含まれる入力信号(オーディオキャンセラ部11より入力される信号)の周波数領域において、保持するノイズパターンを減算すると同時に、ノイズパターン自体を更新し続けることにより、入力信号(オーディオキャンセラ部11より入力される信号)からノイズ信号の除去を行う。
[メインボリューム部]
メインボリューム部3は、搭乗者などにより設定された音量(音量調節スイッチの操作量)に応じて、音楽信号の音量調節を行う役割を有している。
メインボリューム部3は、搭乗者などにより設定された音量(音量調節スイッチの操作量)に応じて、音楽信号の音量調節を行う役割を有している。
メインボリューム部3による音量調節は、車載用オーディオ装置において設定される音量に連動して、あるいは、車載用オーディオ装置とは別に設けられる音量調節スイッチの設定に基づいて行われる。また、メインボリューム部3において音量調節が行われた音楽信号は、レベル検出部6および帯域制御フィルタ部7へ出力される。
[音声検出部]
次に、音声検出部4について説明する。図8は、音声検出部4の概略構成を示したブロック図である。音声検出部4は、実効値検出部41と、移動平均部42と、音声検出スレッショルド部43とを有している。
次に、音声検出部4について説明する。図8は、音声検出部4の概略構成を示したブロック図である。音声検出部4は、実効値検出部41と、移動平均部42と、音声検出スレッショルド部43とを有している。
実効値検出部41は、音声強調処理部2の出力信号(音声信号)において所定区間の実効値の検出を行う役割を有している。移動平均部42は、実効値検出部41において実効値の検出が行われた信号に対して、所定区間の移動平均を求める役割を有している。音声検出スレッショルド部43は、予め設定された音声検出スレッショルド(閾値)に基づいて、音声信号の検出を行う役割を有している。
音声検出スレッショルド部43において音声信号の検出を行う場合には、音声強調処理部2のアレイマイク部10とオーディオキャンセラ部11において入力される信号のD/Uが大きく改善されているので、音声検出スレッショルドに基づく音声信号の検出が容易になる。音声検出スレッショルド部43において検出された音声検出信号はレベル検出部6に出力される。
[帯域幅検出部]
次に帯域幅検出部5について説明する。図9は、帯域幅検出部5の概略構成を示したブロック図である。帯域幅検出部5は、図9に示すように、FFT(Fast Fourier Transform)部51と、最大値ホールド部52と、累積分布部(累積分布算出手段)53と、帯域幅判定部(スレッショルド設定手段、帯域幅判定手段)54と、スムージングフィルタ部55と、帯域制御設定部56とを有している。
次に帯域幅検出部5について説明する。図9は、帯域幅検出部5の概略構成を示したブロック図である。帯域幅検出部5は、図9に示すように、FFT(Fast Fourier Transform)部51と、最大値ホールド部52と、累積分布部(累積分布算出手段)53と、帯域幅判定部(スレッショルド設定手段、帯域幅判定手段)54と、スムージングフィルタ部55と、帯域制御設定部56とを有している。
FFT部51は、音声信号に対して所定の間隔で高速フーリエ変換、すなわち、FFT演算を行うことにより、音声信号を周波数領域に変換する役割を有している。最大値ホールド部52は、FFT演算により周波数領域に変換されたFFT出力信号を、FFTサンプル毎に最大値でホールド(保持)する役割を有している。累積分布部53は、最大値ホールドされたFFT出力信号において、累積分布の計算を行う。
図10(a)は、女性の音声信号におけるFFTサンプル(FFT出力)毎の振幅特性を示し、図10(b)は、女性の音声信号における累積分布特性を示した図である。一方で、図11(a)は、男性の音声信号におけるFFTサンプル(FFT出力)毎の振幅特性を示し、図11(b)、男性の音声信号における累積分布特性を示した図である。
図10および図11に示す場合において、サンプリング周波数は12kHz、FFT長は1,024、最大値ホールド長は16サンプルに設定されている。なお、FFT出力の1サンプルは約11.7Hzであり、512サンプルの場合には6kHzに相当することになる。
図10(a)および図11(a)に示すように、女性の音声信号の場合には、FFT出力のサンプル数が高い値を示す部分(つまり、比較的高い周波数帯域)においても振幅値が検出されるのに対して、男性の音声信号の場合には、FFT出力のサンプル数が低い値を示す部分(つまり、比較的低い周波数帯域)においてのみ振幅値が検出されている。一般に、男性の音声に比べて女性の音声の方が相対的に高い周波数帯域の音を発することから、このような違いが示されることになる。
図10(b)および図11(b)に示される累積分布特性においても、図10(a)および図11(a)に示す振幅特性の特徴が反映されており、女性の場合には、累積確率の上昇が男性の場合に比べて緩やかになっている。
帯域幅判定部54は、累積分布部53において計算された累積分布の出力に対して、低域周波数用のスレッショルド(低域スレッショルド)と高域周波数用のスレッショルド(高域スレッショルド)との2つのスレッショルドを設定し、音声の低域周波数部分と高域周波数部分との幅、すなわち音声帯域幅の判定(音楽信号における低域側の周波数と高域側の周波数とを意味し、求められる低域側の周波数と高域側の周波数とを判定値とする)を行う役割を有している。スムージングフィルタ部55は、帯域幅判定部54により判定された音声の音声帯域幅に対して、一次のIIR(Infinite Impulse Response)型のローパスフィルタで積分を行うことにより、変動する判定値の平滑化を行う役割を有している。
図12(a)は、女性の音声信号における低域の音声帯域の判定値(周波数)変化を示し、図12(b)は、女性の音声信号における高域の音声帯域の判定値(周波数)変化を示している。また、図13(a)は、男性の音声信号における低域の音声帯域の判定値(周波数)変化を示し、図13(b)は、男性の音声信号における高域の音声帯域の判定値(周波数)変化を示している。
具体的に、図12(a)に示す女性の音声信号における低域の音声帯域の判定値(周波数)は、図10(b)に示した女性の音声信号における累積分布特性に対し、低域用のスレッショルドとして0.1の値を設定し、このスレッショルドを超える(対応する)FFT出力値を周波数変換して(本実施の形態におけるFFT出力の1サンプルは、上述したように約11.7Hzであるため、図10(b)に示すFFT出力のサンプル数に対して11.7Hzを掛け合わせることにより周波数変換を行うことができる)示した図であり、図12(b)に示した女性の音声信号における高域の音声帯域の判定値は、図10(b)に示した女性の音声信号における累積分布特性に対し、高域用のスレッショルドとして0.99の値を設定し、このスレッショルドを超える(対応する)FFT出力値を周波数変換して示した図である。
また同様に、図13(a)に示す男性の音声信号における低域の音声帯域の判定値(周波数)は、図11(b)に示した男性の音声信号における累積分布特性に対し、低域用のスレッショルドとして0.1の値を設定し、このスレッショルドを超える(対応する)FFT出力値を周波数変換して示した図であり、図13(b)に示した男性の音声信号における高域の音声帯域の判定値(周波数)変化は、図11(b)に示した男性の音声信号における累積分布特性に対し、高域用のスレッショルドとして0.99の値を設定し、このスレッショルドを超える(対応する)FFT出力値を周波数変換して示した図である。
なお、図12および図13に示した音声帯域の判定値は、スムージングフィルタ部55によるフィルタ処理後の値を示しており、スムージングフィルタ部55におけるIIR型のローパスフィルタの正規化カットオフ周波数は0.05に設定されている。
図12および図13を比較すると、女性の音声信号の場合には、低域周波数であっても高域周波数であって、時間経過と共に比較的大きく変動する傾向が示されている。男性の音声信号は、女性の音声信号に比べて低域および高域ともに変動が少なく、検出される周波数が低い値となっていることがわかる。
次に、帯域制御設定部56は、音声信号における低域周波数の判定値(周波数)と高域周波数の判定値(周波数)とに基づいて、帯域制御フィルタ部7における低域フィルタの制御値と高域フィルタの制御値とを設定する役割を有している。従って、帯域制御設定部56では、帯域制御フィルタ部7における低域フィルタの制御値と高域フィルタの制御値とを、音声信号の音声帯域における低域のカットオフ周波数と高域のカットオフ周波数とに対応付ける役割を有することになる。
図14(a)は、女性の音声信号に関して、図12(a)に示すような低域周波数が検出される場合における低域フィルタの制御値を示し、図14(b)は、図12(b)に示すような高域周波数が検出される場合における高域フィルタの制御値を示している。図12(a)と図14(a)とを比較すると明らかなように、図14(a)に示す制御値の変化状態は、図12(a)に示す低域周波数の変化状態に対応している。また、図12(b)と図14(b)とを比較すると明らかなように、図14(b)に示す制御値の変化状態は、図12(b)に示す高域周波数の変化状態に対応している。帯域制御設定部56は、図12(a)に示す低域周波数に対応する1〜10の値を求めて、求められた値に基づいて女性の音声信号に対する低域周波数(低域フィルタ)の制御値を設定する。同様に、帯域制御設定部56は、図12(b)に示す高域周波数に対応する1〜10の値を求めて、求められた値に基づいて女性の音声信号に対する高域周波数(高域フィルタ)の制御値を設定する。
一方で、図15(a)は、男性の音声信号に関して、図13(a)に示すような低域周波数が検出される場合における低域フィルタの制御値を示し、図15(b)は、図13(b)に示すような高域周波数が検出される場合における高域フィルタの制御値を示している。図13(a)と図15(a)とを比較すると明らかなように、図13(a)に示す制御値の変化状態は、図15(a)に示す低域周波数の変化状態に対応している。また、図13(b)と図15(b)とを比較すると明らかなように、図15(b)に示す制御値の変化状態は、図13(b)に示す高域周波数の変化状態に対応している。帯域制御設定部56は、図13(a)に示す低域周波数に対応する1〜10の値を求めて、求められた値に基づいて男性の音声信号に対する低域周波数(低域フィルタ)の制御値を設定する。同様に、帯域制御設定部56は、図13(b)に示す高域周波数に対応する1〜10の値を求めて、求められた値に基づいて男性の音声信号に対する高域周波数(高域フィルタ)の制御値を設定する。
なお、本実施の形態に係る帯域制御設定部56では、低域フィルタの制御値が1の場合には、50Hzのカットオフ周波数が対応し、以後、制御値が1ずつ増加する毎にカットオフ周波数が50Hzずつ増加して、制御値が10の場合には、500Hzのカットオフ周波数が対応することになる。また、高域フィルタの制御値が1の場合には、1,500Hzのカットオフ周波数が対応し、以後、制御値が1ずつ増加する毎にカットオフ周波数が500Hzずつ増加して、制御値が10の場合には、6,000Hzのカットオフ周波数が対応することになる。
図21(a)は、高域のカットオフ周波数が6,000Hz、ゲインが−30dBである場合において、帯域制御設定部56により設定され得る低域フィルタの制御値(1から10まで)に対応する低域のカットオフ周波数(50Hz〜500Hz)のそれぞれのフィルタ特性を一例として示したものである。
また、図21(b)は、低域のカットオフ周波数が100Hz、ゲインが−30dBである場合において、帯域制御設定部56により設定され得る高域フィルタの制御値(1から10まで)に対応する高域のカットオフ周波数(1,500Hz〜6,000Hz)のそれぞれのフィルタ特性を一例として示したものである。
[レベル検出部]
次に、レベル検出部6について説明する。図16は、レベル検出部6の概略構成を示したブロック図である。レベル検出部6は、図16に示すように、帯域制限部(帯域制限手段)61と、実効値検出部62と、最大値ホールド部63と、レベル比較部(レベル差算出手段)64と、スムージングフィルタ部65と、ゲイン制御設定部66とを有している。
次に、レベル検出部6について説明する。図16は、レベル検出部6の概略構成を示したブロック図である。レベル検出部6は、図16に示すように、帯域制限部(帯域制限手段)61と、実効値検出部62と、最大値ホールド部63と、レベル比較部(レベル差算出手段)64と、スムージングフィルタ部65と、ゲイン制御設定部66とを有している。
帯域制限部61は、メインボリューム部3より入力される音楽信号に対して帯域制限を行うことにより音楽信号を音声帯域と同じ帯域となるように制限し、さらに音声信号(例えば48kHz)が音声信号(例えば、12kHz)と同じサンプリング周波数になるようにダウンサンプリング処理を行う役割を有している。
実効値検出部62は、音声強調処理部2より入力される音声信号と、帯域制限部61において帯域制限等の処理が施された音楽信号とのそれぞれに対して、所定区間の実効値の検出を行う役割を有し、最大値ホールド部63は、実効値検出部62において所定区間の実効値検出が行われた音声信号と音楽信号とに対して、所定区間の最大値検出と最大値のホールド(保持)を行う役割を有している。
レベル比較部64は、最大値ホールド部63により最大値検出および最大値ホールドが行われた音声信号および音楽信号について、それぞれの信号レベルの比較を行い、レベル差(音声帯域における音楽信号の信号レベルと音声信号の信号レベルとの差)の値を比較値として出力する役割を有している。スムージングフィルタ部65は、一次のIIR型のローパスフィルタを用いて、レベル比較部64で求められた比較値を積分し、変動する比較値の平滑化を行う役割を有している。
図17は、スムージングフィルタ部65により平滑化処理が行われた女性の音声信号におけるレベル差の比較値を示しており、図18は、同様に平滑化処理が行われた男性の音声信号におけるレベル差の比較値を示している。なお、図17および図18に示した比較値において、実効値検出部62において設定される実効値検出長は、サンプリング周波数12kHzで1024サンプル、最大値ホールド部63において設定される最大値ホールド長は16サンプル、スムージングフィルタ部65におけるIIR型ローパスフィルタの正規化カットオフ周波数は0.05、音楽信号のサンプルとしてホワイトノイズを使用している。
図17および図18におけるレベル差の比較値では、音楽信号よりも音声信号の方がレベル値が大きい場合には、レベル差が0dBよりも大きな値となり、音楽信号よりも音声信号の方がレベル値が小さい場合には、レベル差が0dBよりも小さな値となっている。図17と図18とを比較すると、女性の比較値および男性の比較値は、ともに0dB前後のレベル差で値が変動していることがわかる。なお、本実施の形態に示す例では、図17および図18に示すように、レベル差の変動が同じような状態となるが、入力される音楽信号の大きさなどにより、この値は変動されるため、女性の比較値および男性の比較値が大きく異なる場合も生じ得る。
ゲイン制御設定部66は、レベル差の比較値と、音声検出部4より入力される音声検出信号と、予め設定される音声オフセット値とに基づいて、帯域制御フィルタ部7の制御値を設定する。この制御値は、帯域制御フィルタ部7のゲイン設定部73(図20参照)において最終的なフィルタゲインを設定する際に利用される。
ここで、音声オフセット値とは、レベル差の比較値に対してオフセットを行う値を示しており、ゲイン制御の動作点の設定を行うために用いられる値である。この音声オフセット値により音声信号と音楽信号との基準となる信号レベルが所定値(dB)だけオフセットされる。また、音声検出信号によって、音声検出部4で音声信号が検出されなかったと判断された場合、ゲイン制御設定部66は、帯域制御フィルタ部7の制御値の設定を行わない。制御値の設定が行われない場合、帯域制御フィルタ部7は、フィルタリング処理を行わずに、そのまま音楽信号を通過させる処理を行う。
図19(a)は、図17に示すようなレベル差が求められる場合における女性の音声信号に関する制御値を示し、図19(b)は、図18に示すようなレベル差が求められる場合における男性の音声信号に関する制御値を示している。図17と図19(a)とを比較すると明らかなように、図19(a)に示す制御値の変化状態は、図17に示すレベル差の変化状態に対応している。ゲイン制御設定部66は、図17に示すレベル差に対応するようにして、レベル差の値に対応する1〜11の値(つまり、レベル差を11段階に段階分けした値)を求めて、求められた値に基づいて女性の音声信号に対するゲインの制御値を設定する。図18と図19(b)においても同様であり、ゲイン制御設定部66は、図18に示すレベル差に対応するようにして、レベル差の値に対応する1〜11の値を求めて、求められた値に基づいて男性の音声信号に対するゲインの制御値を設定する。
なお、本実施の形態に係るゲイン制御設定部66では(図19(a)(b)に示す場合には)、音声オフセット値が−20dBに設定されている。また、本実施の形態に係るゲイン制御設定部66では、制御値が1の場合には、−30dBのゲインが対応し、以後、制御値が1ずつ増加する毎にゲインが3ずつ増加して、制御値が11の場合には、0dBのゲインが対応することになる。図21(c)は、低域のカットオフ周波数が200Hz、高域のカットオフ周波数が6,000Hzに設定される場合において、ゲイン制御設定部66により設定され得る制御値(1から11まで)に対応するゲイン(0dB〜−30dB)のそれぞれのフィルタ特性を一例として示したものである。
[帯域制御フィルタ部]
次に、帯域制御フィルタ部7について説明する。図20は、帯域制御フィルタ部7の概略構成を示したブロック図である。帯域制御フィルタ部7は、図20に示すように、第1係数設定部71と、第2係数設定部72と、ゲイン設定部73と、カスケード接続された第1ローシェルフフィルタ部(2nd shelving LPF1、ローシェルフフィルタ手段)74および第2ローシェルフフィルタ部(2nd shelving LPF2、ローシェルフフィルタ手段)75と、同じくカスケード接続された第1ハイシェルフフィルタ部(2nd shelving HPF1、ハイシェルフフィルタ手段)76および第2ハイシェルフフィルタ部(2nd shelving HPF2、ハイシェルフフィルタ手段)77と、乗算部(信号レベル低減手段)78とを有している。
次に、帯域制御フィルタ部7について説明する。図20は、帯域制御フィルタ部7の概略構成を示したブロック図である。帯域制御フィルタ部7は、図20に示すように、第1係数設定部71と、第2係数設定部72と、ゲイン設定部73と、カスケード接続された第1ローシェルフフィルタ部(2nd shelving LPF1、ローシェルフフィルタ手段)74および第2ローシェルフフィルタ部(2nd shelving LPF2、ローシェルフフィルタ手段)75と、同じくカスケード接続された第1ハイシェルフフィルタ部(2nd shelving HPF1、ハイシェルフフィルタ手段)76および第2ハイシェルフフィルタ部(2nd shelving HPF2、ハイシェルフフィルタ手段)77と、乗算部(信号レベル低減手段)78とを有している。
第1係数設定部71は、低域フィルタの制御値とゲインの制御値とに基づいて、第1ローシェルフフィルタ部74と第2ローシェルフフィルタ部75とのフィルタ係数を設定し、第2係数設定部72は、高域フィルタの制御値とゲインの制御値とに基づいて、第1ハイシェルフフィルタ部76と第2ハイシェルフフィルタ部77とのフィルタ係数を設定する役割を有している。ゲイン設定部73は、ゲインの制御値に基づいて、乗算部78に最終的なフィルタゲインを設定する役割を有している。
図21(a)〜(c)は、上述したように帯域制御フィルタ部7において設定され得るフィルタ特性を例示した図である。図21(a)は、高域のカットオフ周波数が6,000Hz、ゲインが−30dBである場合において、低域のカットオフ周波数が50Hz〜500Hzのいずれかに設定される場合のフィルタ特性を示し、(b)は、低域のカットオフ周波数が100Hz、ゲインが−30dBである場合において、高域のカットオフ周波数が1,500Hz〜6,000Hzのいずれかに設定される場合のフィルタ特性を示し、(c)は、低域のカットオフ周波数が200Hz、高域のカットオフ周波数が6,000Hzである場合において、ゲインが0dB〜−30dBのいずれかに設定される場合のフィルタ特性を示した図である。
本実施の形態では、低域のカットオフ周波数が50Hz、高域のカットオフ周波数が6,000Hz、ゲインが−30dBに設定される場合を一例として示して、帯域制御フィルタ部7の動作を説明する。
上述したように、本実施の形態では、低域のカットオフ周波数が50Hz、高域のカットオフ周波数が6,000Hz、ゲインが−30dBに設定されるため、低域のカットオフ周波数が50Hzに設定される場合は、低域フィルタの制御値が1に設定されており、高域のカットオフ周波数が6,000Hzに設定される場合は、高域フィルタの制御値が10に設定されており、ゲインが−30dBに設定される場合は、ゲインの制御値が1に設定されていることになる。
従って、第1係数設定部71には、低域フィルタの制御値として帯域幅検出部5において既に設定された値「1」が入力され、ゲインの制御値としてレベル検出部6で既に設定された値「1」が入力される。第1係数設定部71では、入力された低域フィルタの制御値「1」に基づいて、第1ローシェルフフィルタ部74および第2ローシェルフフィルタ部75におけるカットオフ周波数をそれぞれ50Hzに設定し、入力されたゲインの制御値「1」に基づいて、第1ローシェルフフィルタ部74および第2ローシェルフフィルタ部75におけるゲインを、それぞれ15dB(30dBのゲインを第1ローシェルフフィルタ部74と第2ローシェルフフィルタ部75との2つのフィルタに分配するため)に設定する。
また、同様にして、第2係数設定部72には、高域フィルタの制御値として帯域幅検出部5において既に設定された値「10」が入力され、ゲインの制御値としてレベル検出部6で既に設定された値「1」が入力される。第2係数設定部72では、入力された高域フィルタの制御値「10」に基づいて、第1ハイシェルフフィルタ部76および第2ハイシェルフフィルタ部77におけるカットオフ周波数をそれぞれ6,000Hzに設定し、入力されたゲインの制御値「1」に基づいて、第1ハイシェルフフィルタ部76および第2ハイシェルフフィルタ部77におけるゲインを、それぞれ15dB(30dBのゲインを第1ハイシェルフフィルタ部76と第2ハイシェルフフィルタ部77との2つのフィルタに分配するため)に設定する。
このように第1ローシェルフフィルタ部74、第2ローシェルフフィルタ部75、第1ハイシェルフフィルタ部76および第2ハイシェルフフィルタ部77のフィルタ係数が設定されると、第1ローシェルフフィルタ部74と第2ローシェルフフィルタ部75とは、カスケード接続されているので、図22(a)のような音楽信号(ホワイトノイズを一例として用いた信号)に対して、第1ローシェルフフィルタ部74でフィルタ処理を施すことにより、図22(b)に示すように、入力された音楽信号における50Hz以下の周波数のゲインが15dBだけ棚状に増幅され、さらに第2ローシェルフフィルタ部75でフィルタ処理を施すことにより、図22(c)に示すように、入力された音楽信号における50Hz以下のゲインがさらに15dBだけ棚状に増幅されて、結果として50Hz以下の周波数のゲインが30dBだけ棚状に増幅されることになる。
また、第1ローシェルフフィルタ部74と第2ローシェルフフィルタ部75とによりカットオフ周波数50Hz以下のゲインの増幅処理が行われた音楽信号は、カスケード接続された第1ハイシェルフフィルタ部76においてフィルタ処理が施されることにより、図23(a)に示すように、入力された音楽信号における6,000Hz以上の周波数のゲインが15dBだけ棚状に増幅され、さらに、カスケード接続される第2ハイシェルフフィルタ部77においてフィルタ処理が施されることにより、図23(b)に示すように、入力された音楽信号における6,000Hz以上の周波数のゲインがさらに15dBだけ棚状に増幅されて、結果として50Hz以下の周波数のゲインが30dBだけ増幅され、さらに、6,000Hz以上の周波数のゲインが30dBだけ増幅されることになる。
ゲイン設定部73では、受信したゲインの制御値に基づいて、フィルタ処理が行われた音楽信号に対して乗算部78で乗算処理を行う際に用いる値を設定して、乗算部78に出力する。本実施の形態では、ゲイン制御値が1であるため、ゲイン設定部73では、ゲイン制御値に対応する−30dBの減衰が行われるような値を乗算部78に出力する。乗算部78では、図23(b)に示すように、50Hz以下の周波数および6,000Hz以上の周波数のゲインが30dBだけ増幅された音楽信号に対して、ゲイン設定部73において設定された値を乗算させることにより、音楽信号の信号レベルを相対的に30dB減衰させる処理を行い、結果として、図23(c)に示すように、音楽信号における信号レベルが、50Hzから6,000Hzまでの帯域幅において相対的に−30dB減衰されることになる。
図24(a)は、女性の音声信号の周波数特性を示し、(b)は、音楽信号としてホワイトノイズを使用した場合において、自動音量制御装置1における音量制御を行う前の音楽信号の周波数特性と、音量制御を行った後の音楽信号の周波数特性を示している。また、図25(a)は、男性の音声信号の周波数特性を示し、(b)は、音楽信号としてホワイトノイズを使用した場合において、自動音量制御装置1における音量制御を行う前の音楽信号の周波数特性と、音量制御を行った後の音楽信号の周波数特性を示している。
図24および図25をみると、音量制御を行うことにより、音声信号により検出された帯域幅に応じて、該当する帯域幅の信号レベルが音楽信号において減衰されていることがわかる。この減衰帯域は、音声信号の帯域幅に対応しているため、男性の音声の場合には女性の音声の場合に比べて低い帯域に減衰する帯域がずれていることがわかる。
図26および図27のそれぞれは、図24および図25のそれぞれに対応する周波数特性を示しており、図26および図27の場合には、図24および図25に比べて音声信号の信号レベルが12dB程大きい場合を示している。図26および図27と図24および図25とを比較すると、音声信号の信号レベルが大きい場合には、音楽信号における音声帯域の信号レベルの減衰が小さくなっている。図26および図27から明らかなように、本実施の形態に係る自動音量制御装置1では、レベル検出部6において音楽信号と音声信号とのレベル差を求めてゲインの制御値を決定するので、音楽信号の帯域幅に応じて音声信号における信号レベルの減衰量を最適に変動させることが可能となっている。
図28および図29は、図24および図25において音楽信号がホワイトノイズでなく実際の音楽の信号である場合を示した図である。図28および図29において同様に、音声信号を検出した音声帯域に応じて、音楽信号の音声帯域が減衰されており、音楽のジャンルに関わらず最適に音声帯域の信号レベルだけを低減することが可能となる。
その後、帯域制御フィルタ部7において音量制御が行われた音楽信号を、パワーアンプ部8を介してスピーカS1、S2から出力することにより、音楽が流れている状況であっても、車室内の会話を容易に行うことが可能となる。
上述したように本実施の形態に係る自動音量制御装置1では、マイクM1およびマイクM2において、音声が検出された場合において、車載用オーディオ装置より出力される音楽の出力音量が自動的に低減されるので、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
具体的には、マイクM1、M2より音声が取得された場合には、帯域制御フィルタ部7において音楽信号の信号レベルを、音声帯域の範囲において低減させることができるので、会話がなされる場合に会話の妨げとなり得る音声と同じ帯域の信号レベル(音量)だけを低減させることができ、音楽の音質を著しく損なうことなく円滑な会話を行うことが可能となる。
また、音楽信号の信号レベルを、音声帯域の範囲において低減させる場合において、本実施の形態に係る自動音量制御装置1では、帯域制限部61において音声帯域に帯域制限された音楽信号の信号レベルと、音声強調処理部2においてノイズなどが除去された(D/Uに優れる)音声信号の信号レベルとのレベル差を求め、このレベル差に基づいて低減させるべき音楽信号の信号レベルを決定している。このため、低減される信号レベルが著しく低くなって音楽が全く聞こえなくなったり、または、十分に信号レベルが低減されず円滑な会話を実現することができないという状況になることを防止することが可能となる。
さらに、本実施の形態に係る自動音量制御装置1では、音楽信号の信号レベルを低減させる音声帯域の範囲を判断する場合において、帯域幅検出部5の累積分布部53で、音声信号の振幅特性からFFTサンプル毎の累積分布を求め、この累積分布に応じて音声帯域の低域周波数成分と高域周波数成分を決定している。このため、音声を発する人(発話者)の音声特性に応じてそれぞれ累積分布を求めることにより、信号レベルを低減させる音声帯域の範囲をそれぞれ決定するので、発話者に応じて最適な音声帯域の範囲を決定して(例えば、発話者が男性である場合にはその男性の音声信号に適した音声帯域の範囲で、発話者が女性である場合にはその女性の音声信号に適した音声帯域の範囲で)、音楽信号の信号レベルを低減させることができる。
従って、会話の音声に最適な帯域幅のみで信号レベルの低減を行うことができるので、会話の帯域幅以外の音楽信号においては信号レベルで低減されないまま良質の音楽を楽しむことができ、さらに、音楽の再生が行われていても、会話を妨げうる帯域幅の信号レベルだけを効果的に低減させることができるので、円滑な会話を楽しむことが可能となる。
また、本実施の形態に係る自動音量制御装置1では、無指向性のマイクM1と単一指向性のマイクM2とを用いることにより指向性を強調させる構成を採用しているので、発話者の音声を精度良く取得することが可能である。
さらに、アレイマイク部10の適応フィルタ部24においてNLMS適応アルゴリズムを適用し、さらにオーディオキャンセラ部11の第1適応フィルタ部35および第2適応フィルタ部36においてLMS適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分(ノイズ成分)を効果的かつ高い収束性を確保した上で低減させることができ、音声帯域における音声信号の検出精度の向上を図ることが可能となる。
特に、アレイマイク部10の適応フィルタ部24において、NLMS適応アルゴリズムを適用してノイズ成分の低減を図った上で、さらに音源のチャンネル数に応じて、オーディオキャンセラ部11の第1適応フィルタ部35および第2適応フィルタ部36において、適応フィルタ部をカスケード接続する構成を採用し、各適応フィルタ部でのフィルタ処理においてより早くフィルタ処理を適用する部分毎に適応速度を大きくしているので、フィルタ処理が適用される信号の収束を素早くすることが可能となる。
また、オーディオキャンセラ部11の第1バンドパスフィルタ部31および第2バンドパスフィルタ部32において設定される帯域制限幅が、アレイマイク部10の第1バンドパスフィルタ部21において設定される帯域制限幅よりも広い帯域幅に設定されているため、帯域制限のカットオフ周波数付近のオーディオキャンセル性能を向上させることが可能となる。
上述したような複数の適応アルゴリズムの適用やバンドパスフィルタの適応制限幅の設定により、D(希望信号:音声信号)/U(非希望信号:音楽信号)に優れた音声信号(音響信号)を求めることができる。
以上、本発明に係る自動音量制御装置について、図面を用いて詳細に説明したが、本発明に係る自動音量制御装置は、上述した実施の形態に限定されるものではない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1 …自動音量制御装置
2 …音声強調処理部
3 …メインボリューム部
4 …音声検出部
5 …帯域幅検出部(帯域幅検出手段)
6 …レベル検出部(レベル差検出手段)
7 …帯域制御フィルタ部(帯域制御手段)
8 …パワーアンプ部
10 …(音声強調処理部の)アレイマイク部
11 …(音声強調処理部の)オーディオキャンセラ部
13 …(音声強調処理部の)ノイズキャンセラ部
21 …(アレイマイク部の)第1バンドパスフィルタ部
22 …(アレイマイク部の)第2バンドパスフィルタ部
23 …(アレイマイク部の)遅延部
24 …(アレイマイク部の)適応フィルタ部
25 …(適応フィルタ部の)FIR部
26 …(適応フィルタ部の)NLMS部
27 …(適応フィルタ部の)加算部
28 …車両
28a …運転席
28b …助手席
31 …(オーディオキャンセラ部の)第1バンドパスフィルタ部
32 …(オーディオキャンセラ部の)第2バンドパスフィルタ部
33 …(オーディオキャンセラ部の)第1遅延部
34 …(オーディオキャンセラ部の)第2遅延部
35 …(オーディオキャンセラ部の)第1適応フィルタ部
35a …(第1適応フィルタ部の)第1加算部
36 …(オーディオキャンセラ部の)第2適応フィルタ部
36a …(第2適応フィルタ部の)第2加算部
37 …(第1適応フィルタ部の)第1FIR部
38 …(第2適応フィルタ部の)第2FIR部
39 …(第1適応フィルタ部の)第1LMS部
40 …(第2適応フィルタ部の)第2LMS部
41 …(音声検出部の)実効値検出部
42 …(音声検出部の)移動平均部
43 …(音声検出部の)音声検出スレッショルド部
51 …(帯域幅検出部の)FFT部
52 …(帯域幅検出部の)最大値ホールド部
53 …(帯域幅検出部の)累積分布部(累積分布算出手段)
54 …(帯域幅検出部の)帯域幅判定部(スレッショルド設定手段、帯域幅判定手段)
55 …(帯域幅検出部の)スムージングフィルタ部
56 …(帯域幅検出部の)帯域制御設定部
61 …(レベル検出部の)帯域制限部(帯域制限手段)
62 …(レベル検出部の)実効値検出部
63 …(レベル検出部の)最大値ホールド部
64 …(レベル検出部の)レベル比較部(レベル差算出手段)
65 …(レベル検出部の)スムージングフィルタ部
66 …(レベル検出部の)ゲイン制御設定部
71 …(帯域制御フィルタ部の)第1係数設定部
72 …(帯域制御フィルタ部の)第2係数設定部
73 …(帯域制御フィルタ部の)ゲイン設定部
74 …(帯域制御フィルタ部の)第1ローシェルフフィルタ部(ローシェルフフィルタ手段)
75 …(帯域制御フィルタ部の)第2ローシェルフフィルタ部(ローシェルフフィルタ手段)
76 …(帯域制御フィルタ部の)第1ハイシェルフフィルタ部(ハイシェルフフィルタ手段)
77 …(帯域制御フィルタ部の)第2ハイシェルフフィルタ部(ハイシェルフフィルタ手段)
78 …(帯域制御フィルタ部の)乗算部(信号レベル低減手段)
M1、M2 …マイク
S1、S2 …スピーカ
2 …音声強調処理部
3 …メインボリューム部
4 …音声検出部
5 …帯域幅検出部(帯域幅検出手段)
6 …レベル検出部(レベル差検出手段)
7 …帯域制御フィルタ部(帯域制御手段)
8 …パワーアンプ部
10 …(音声強調処理部の)アレイマイク部
11 …(音声強調処理部の)オーディオキャンセラ部
13 …(音声強調処理部の)ノイズキャンセラ部
21 …(アレイマイク部の)第1バンドパスフィルタ部
22 …(アレイマイク部の)第2バンドパスフィルタ部
23 …(アレイマイク部の)遅延部
24 …(アレイマイク部の)適応フィルタ部
25 …(適応フィルタ部の)FIR部
26 …(適応フィルタ部の)NLMS部
27 …(適応フィルタ部の)加算部
28 …車両
28a …運転席
28b …助手席
31 …(オーディオキャンセラ部の)第1バンドパスフィルタ部
32 …(オーディオキャンセラ部の)第2バンドパスフィルタ部
33 …(オーディオキャンセラ部の)第1遅延部
34 …(オーディオキャンセラ部の)第2遅延部
35 …(オーディオキャンセラ部の)第1適応フィルタ部
35a …(第1適応フィルタ部の)第1加算部
36 …(オーディオキャンセラ部の)第2適応フィルタ部
36a …(第2適応フィルタ部の)第2加算部
37 …(第1適応フィルタ部の)第1FIR部
38 …(第2適応フィルタ部の)第2FIR部
39 …(第1適応フィルタ部の)第1LMS部
40 …(第2適応フィルタ部の)第2LMS部
41 …(音声検出部の)実効値検出部
42 …(音声検出部の)移動平均部
43 …(音声検出部の)音声検出スレッショルド部
51 …(帯域幅検出部の)FFT部
52 …(帯域幅検出部の)最大値ホールド部
53 …(帯域幅検出部の)累積分布部(累積分布算出手段)
54 …(帯域幅検出部の)帯域幅判定部(スレッショルド設定手段、帯域幅判定手段)
55 …(帯域幅検出部の)スムージングフィルタ部
56 …(帯域幅検出部の)帯域制御設定部
61 …(レベル検出部の)帯域制限部(帯域制限手段)
62 …(レベル検出部の)実効値検出部
63 …(レベル検出部の)最大値ホールド部
64 …(レベル検出部の)レベル比較部(レベル差算出手段)
65 …(レベル検出部の)スムージングフィルタ部
66 …(レベル検出部の)ゲイン制御設定部
71 …(帯域制御フィルタ部の)第1係数設定部
72 …(帯域制御フィルタ部の)第2係数設定部
73 …(帯域制御フィルタ部の)ゲイン設定部
74 …(帯域制御フィルタ部の)第1ローシェルフフィルタ部(ローシェルフフィルタ手段)
75 …(帯域制御フィルタ部の)第2ローシェルフフィルタ部(ローシェルフフィルタ手段)
76 …(帯域制御フィルタ部の)第1ハイシェルフフィルタ部(ハイシェルフフィルタ手段)
77 …(帯域制御フィルタ部の)第2ハイシェルフフィルタ部(ハイシェルフフィルタ手段)
78 …(帯域制御フィルタ部の)乗算部(信号レベル低減手段)
M1、M2 …マイク
S1、S2 …スピーカ
Claims (4)
- マイクにより取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段と、
前記音声信号における信号レベルと、前記音楽信号における信号レベルとのレベル差を求めるレベル差検出手段と、
前記低域側の周波数から前記高域側の周波数までの帯域幅における前記音楽信号の信号レベルを、前記レベル差に対応するレベルだけ低減させる帯域制御手段と
を備えることを特徴とする自動音量制御装置。 - 前記帯域幅検出手段は、
前記マイクにより取得された音声信号に対して高速フーリエ変換を適用し、求められた音声信号の振幅値をFFTサンプル毎に累積して累積分布を求める累積分布算出手段と、
求められた累積分布に対して前記音声信号における下限の周波数を決定するための低域スレッショルドと、前記音声信号における上限の周波数を決定するための高域スレッショルドとを、前記累積分布の累積確率に応じて設定するスレッショルド設定手段と、
前記低域スレッショルドに対応する前記音声信号の周波数を低域側の周波数として求めると共に、高域スレッショルドに対応する前記音声信号の周波数を高域側の周波数として求める帯域幅判定手段と
を有することを特徴とする請求項1に記載の自動音量制御装置。 - 前記帯域制御手段は、
前記帯域幅検出手段により求められた前記低域側の周波数をカットオフ周波数として、前記低域側の周波数以下の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるローシェルフフィルタ手段と、
前記帯域幅検出手段により求められた前記高域側の周波数をカットオフ周波数として、前記高域側の周波数以上の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるハイシェルフフィルタ手段と、
前記ローシェルフフィルタ手段および前記ハイシェルフフィルタ手段により棚状に信号レベルが増幅された音楽信号を、増幅された前記信号レベル分だけ全体的に信号レベルを低減させる信号レベル低減手段と
を有することを特徴とする請求項1または請求項2に記載の自動音量制御装置。 - 前記レベル差検出手段は、
前記音楽信号の帯域幅を一般的な音楽信号の帯域幅に制限する帯域制限手段と、
前記マイクを介して取得された前記音声信号の信号レベルと、前記帯域制限手段により帯域幅の制限が行われた音楽信号の信号レベルとのレベル差を求めるレベル差算出手段と
を有することを特徴とする請求項1乃至請求項3のいずれか1項に記載の自動音量制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009180322A JP2011035685A (ja) | 2009-08-03 | 2009-08-03 | 自動音量制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009180322A JP2011035685A (ja) | 2009-08-03 | 2009-08-03 | 自動音量制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011035685A true JP2011035685A (ja) | 2011-02-17 |
Family
ID=43764312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009180322A Pending JP2011035685A (ja) | 2009-08-03 | 2009-08-03 | 自動音量制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011035685A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016167645A (ja) * | 2015-03-09 | 2016-09-15 | アイシン精機株式会社 | 音声処理装置及び制御装置 |
-
2009
- 2009-08-03 JP JP2009180322A patent/JP2011035685A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016167645A (ja) * | 2015-03-09 | 2016-09-15 | アイシン精機株式会社 | 音声処理装置及び制御装置 |
WO2016143340A1 (ja) * | 2015-03-09 | 2016-09-15 | アイシン精機株式会社 | 音声処理装置及び制御装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011015018A (ja) | 自動音量制御装置 | |
US7092529B2 (en) | Adaptive control system for noise cancellation | |
EP3103204B1 (en) | Adaptive gain control in a communication system | |
EP2291002B1 (en) | Acoustic processing apparatus | |
US9020157B2 (en) | Active noise cancellation system | |
JP2016126335A (ja) | 区画別音声抑制を有する音区画設備 | |
JP2016051038A (ja) | ノイズゲート装置 | |
US9532149B2 (en) | Method of signal processing in a hearing aid system and a hearing aid system | |
JP6216553B2 (ja) | 伝搬遅延補正装置及び伝搬遅延補正方法 | |
WO2004045244A1 (en) | Adaptative noise canceling microphone system | |
JP2008263583A (ja) | 低域増強方法、低域増強回路および音響再生システム | |
JP2007312364A (ja) | 音響信号処理における均等化 | |
JP2019533192A (ja) | 動的サウンド調整のための雑音推定 | |
JP2012195801A (ja) | 会話支援装置 | |
US20040125962A1 (en) | Method and apparatus for dynamic sound optimization | |
US11205437B1 (en) | Acoustic echo cancellation control | |
US20040196984A1 (en) | Dynamic noise suppression voice communication device | |
JP2008070878A (ja) | 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム | |
GB2500251A (en) | Active noise cancellation system with wind noise reduction | |
JP2011035685A (ja) | 自動音量制御装置 | |
JP5883580B2 (ja) | フィルタ係数決定装置 | |
JP2003333683A (ja) | ノイズ抑圧方法及びマイクロフォン装置 | |
JP5383008B2 (ja) | 音声明瞭度改善システム及び音声明瞭度改善方法 | |
JP5547432B2 (ja) | 自動音量制御装置 | |
EP1275200B1 (en) | Method and apparatus for dynamic sound optimization |