JP2011035685A

JP2011035685A - 自動音量制御装置

Info

Publication number: JP2011035685A
Application number: JP2009180322A
Authority: JP
Inventors: Takeshi Hashimoto; 武志橋本; Kenji Tokura; 健治都倉
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2009-08-03
Filing date: 2009-08-03
Publication date: 2011-02-17

Abstract

【課題】運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うこと。
【解決手段】自動音量制御装置１は、マイクＭ１、Ｍ２により取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段５と、音声信号における信号レベルと、音楽信号における信号レベルとのレベル差を求めるレベル差検出手段６と、低域側の周波数から高域側の周波数までの帯域幅における音楽信号の信号レベルを、レベル差に対応するレベルだけ低減させる帯域制御手段７とを備えている。
【選択図】図１

Description

本発明は自動音量制御装置に関し、より詳細には、音楽が流されている空間において会話が行われた場合に、発話に応じて音楽の出力レベルを音声帯域のみ低減させることにより、円滑な会話を実現することが可能な自動音量制御装置に関する。

走行中の車両の室内では、運転（走行）に音楽やラジオ番組等を流すことが多い。このような状況において、運転手と同乗者とが会話を行う場合には、音楽等の再生音によって、円滑な会話（会話の聞き取り等）が妨げられてしまうおそれがあった。

一般的な車載用オーディオ装置には、音量を調節するための音量調節スイッチや、音量を一時的に低減させるためのミュートスイッチなどが設けられている（例えば、特許文献１および特許文献２参照）。このため、運転者等は、音量調節スイッチやミュートスイッチを操作することにより、会話を妨げない程度まで音楽等の再生音量を低減させることが多かった。

特開２００８−６２９０６号公報特開２００６−６７４９０号公報

しかしながら、会話を行う度に音量調節スイッチを操作して再生音を低減する方法では、操作が煩雑になり、かえって円滑な会話を妨げてしまうおそれがあるという問題があった。一方で、ミュートスイッチを用いて音楽の再生音（出力レベル）を低減させる方法では、会話が途切れた状態においてもそのまま音楽の再生音が低減された状態となってしまい、音楽やラジオ番組等を楽しむことができないという問題があった。

このため、音量調節スイッチやミュートスイッチを操作することなく会話が成立するような大きな声を、発話者が発することにより、音楽等を再生させた状態で会話を行うこともしばしば行われるが、会話が続く場合には、発話者はもちろんのこと会話の相手側においても会話に疲労を感じてしまうおそれがあるという問題があった。

本発明は、上記問題に鑑みてなされたものであり、運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うことが可能な自動音量制御装置を提供することを課題とする。

上記課題を解決するために、本発明に係る自動音量制御装置は、マイクにより取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段と、前記音声信号における信号レベルと、前記音楽信号における信号レベルとのレベル差を求めるレベル差検出手段と、前記低域側の周波数から前記高域側の周波数までの帯域幅における前記音楽信号の信号レベルを、前記レベル差に対応するレベルだけ低減させる帯域制御手段とを備えることを特徴とする。

本発明に係る自動音量制御装置では、マイクによって音声信号が取得された場合に、音楽信号において音量制御を行う帯域幅が音声信号の周波数特性に応じて求められ、求められた帯域幅における音楽信号の信号レベルが、音楽信号の信号レベルと音声信号の信号レベルとのレベル差に対応するレベルだけ低減されるので、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。

特に、本発明に係る自動音量制御装置では、音楽信号の信号レベルを音声帯域の範囲において低減させることができるので、会話の妨げとなり得る音声と同じ帯域の信号レベル（音量）だけを低減させることができ、音楽の音質を著しく損なうことなく円滑な会話を行うことが可能となる。

また、上述する自動音量制御装置において、前記帯域幅検出手段は、前記マイクにより取得された音声信号に対して高速フーリエ変換を適用し、求められた音声信号の振幅値をＦＦＴサンプル毎に累積して累積分布を求める累積分布算出手段と、求められた累積分布に対して前記音声信号における下限の周波数を決定するための低域スレッショルドと、前記音声信号における上限の周波数を決定するための高域スレッショルドとを、前記累積分布の累積確率に応じて設定するスレッショルド設定手段と、前記低域スレッショルドに対応する前記音声信号の周波数を低域側の周波数として求めると共に、高域スレッショルドに対応する前記音声信号の周波数を高域側の周波数として求める帯域幅判定手段とを有するものであってもよい。

上述した自動音量制御装置によれば、音声信号の振幅値をＦＦＴサンプル毎に累積した累積分布を求め、求められた累積分布に対して音声信号における下限の周波数を決定するための低域スレッショルドと、音声信号における上限の周波数を決定するための高域スレッショルドとを、累積分布の累積確率に応じて設定する。このため、音声信号毎の相対的な振幅確率に基づく累積割合に応じて低域スレッショルドと高域スレッショルドとを設定することができるので、低域スレッショルドに基づいて求められる音声信号の低域側の周波数と、高域スレッショルドに基づいて求められる音声信号の高域側の周波数とは、音声信号の周波数特性を考慮した最適な周波数値として求めることが可能となる。従って、例えば発話者が男性の場合には、男性の周波数特性に応じて最適な低域側の周波数と高域側の周波数とが求められて、男性の音声信号に最適な帯域幅を検出することが可能となり、発話者が女性の場合にも同様にして、女性の音声信号に最適な帯域幅を検出することが可能となる。

さらに、上述した自動音量制御装置において、前記帯域制御手段は、前記帯域幅検出手段により求められた前記低域側の周波数をカットオフ周波数として、前記低域側の周波数以下の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるローシェルフフィルタ手段と、前記帯域幅検出手段により求められた前記高域側の周波数をカットオフ周波数として、前記高域側の周波数以上の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるハイシェルフフィルタ手段と、前記ローシェルフフィルタ手段および前記ハイシェルフフィルタ手段により棚状に信号レベルが増幅された音楽信号を、増幅された前記信号レベル分だけ全体的に信号レベルを低減させる信号レベル低減手段とを有するものであってもよい。

このように、ローシェルフフィルタ手段により低域側の周波数以下の信号レベルをレベル差に対応する信号レベルだけ棚状に増幅させ、また、ハイシェルフフィルタ手段により高域側の周波数以上の信号レベルをレベル差に対応する信号レベルだけ棚状に増幅させることにより、結果として、増幅されなかった低域側の周波数から高域側の周波数までの帯域の信号レベルが、低域側の周波数以下の周波数および高域側の周波数以上の周波数の信号レベルに比べて相対的に低減された状態となる。このように増幅処理された音楽信号を、増幅された信号レベル分に該当するレベルだけ、全体的に信号レベルを低減させることにより、音量制御前の音楽信号に比べて、低域側の周波数から高域側の周波数までの帯域の信号レベルだけがレベル差に対応する信号レベルだけ低減された状態となる。

このようにして、マイクにより取得された音声信号の音声帯域に対応する帯域幅で、レベル差に対応する信号レベルだけ音声信号の信号レベル（音量）が低減されるので、会話の音声に最適な帯域幅でのみ信号レベルの低減を行うことができる。また、会話の帯域幅以外の音楽信号においては信号レベルが低減されないので良質の音楽を楽しむことができ、さらに、音楽の再生が行われていても、会話を妨げうる帯域幅の信号レベルだけを効果的に低減させることができるので、円滑な会話を楽しむことが可能となる。

また、上述した自動音量制御装置において、前記レベル差検出手段は、前記音楽信号の帯域幅を一般的な音楽信号の帯域幅に制限する帯域制限手段と、前記マイクを介して取得された前記音声信号の信号レベルと、前記帯域制限手段により帯域幅の制限が行われた音楽信号の信号レベルとのレベル差を求めるレベル差算出手段とを有するものであってもよい。

このように、レベル差を求める前に音楽信号の帯域幅を一般的な音楽信号の帯域幅に制限することにより、音声信号と同一の帯域幅を備えた音楽信号に基づいて、信号レベルのレベル差を求めることができるので、音量制御時に低減される音楽信号の信号レベルを、実際の音声の音量（音声信号の信号レベル）とのバランスを考慮した状態で求めることが可能となる。

本発明に係る自動音量制御装置では、マイクにより音声信号が取得された場合に、音楽信号の信号レベルを音声帯域の範囲のみにおいて低減させることができるので、会話がなされる場合に会話の妨げとなり得る音声と同じ帯域の信号レベル（音量）だけを低減させることができ、音楽の音質を著しく損なうことなく円滑な会話を行うことが可能となる。

本実施の形態に係る自動音量制御装置の概略構成を示したブロック図である。本実施の形態に係る音声強調処理部の概略構成を示したブロック図である。本実施の形態に係るアレイマイク部の概略構成を示したブロック図である。（ａ）は、本実施の形態に係るマイクおよびスピーカの車両における配設位置を示した図であり、（ｂ）はマイクＭ１の無指向性と、マイクＭ２の単一指向性と、両マイクにより強調される方向を示した図である。本実施の形態に係るオーディオキャンセラ部の概略構成を示したブロック図である。本実施の形態に係るマイクにより集音される音響信号（無指向性マイク）と、本実施の形態に係る適応フィルタ部が適用された後の音響信号（アレイマイク部）と、本実施の形態に係る第１適応フィルタ部を適用した後の音響信号（アレイマイク部＋オーディオキャンセラ部（Ｌ））と、本実施の形態に係る第２適応フィルタ部を適用した後の音響信号（アレイマイク部＋オーディオキャンセラ部（Ｌ＋Ｒ））との周波数特性を示した図である。（ａ）は、本実施の形態に係る適応フィルタ部のフィルタ係数を示し、（ｂ）は、本実施の形態に係る第１適応フィルタ部のフィルタ係数を示し、（ｃ）は、第２適応フィルタ部で適用されるフィルタ係数を示した図である。本実施の形態に係る音声検出部の概略構成を示したブロック図である。本実施の形態に係る帯域幅検出部の概略構成を示したブロック図である。（ａ）は、女性の音声信号におけるＦＦＴサンプル毎の振幅特性を示し、（ｂ）は、女性の音声信号における累積分布特性を示した図である。（ａ）は、男性の音声信号におけるＦＦＴサンプル毎の振幅特性を示し、（ｂ）、男性の音声信号における累積分布特性を示した図である。（ａ）は、女性の音声信号における低域の音声帯域の判定値（周波数）変化を示し、（ｂ）は、女性の音声信号における高域の音声帯域の判定値（周波数）変化を示した図である。（ａ）は、男性の音声信号における低域の音声帯域の判定値（周波数）変化を示し、（ｂ）は、男性の音声信号における高域の音声帯域の判定値（周波数）変化を示した図である。（ａ）は、女性の音声信号に関して、図１２（ａ）に示すような低域周波数が検出される場合における低域フィルタの制御値を示し、（ｂ）は、図１２（ｂ）に示すような高域周波数が検出される場合における高域フィルタの制御値を示した図である。（ａ）は、男性の音声信号に関して、図１３（ａ）に示すような低域周波数が検出される場合における低域フィルタの制御値を示し、（ｂ）は、図１３（ｂ）に示すような高域周波数が検出される場合における高域フィルタの制御値を示した図である。本実施の形態に係るレベル検出部の概略構成を示したブロック図である。本実施の形態に係るスムージングフィルタ部により平滑化処理が行われた女性の音声信号におけるレベル差の比較値を示した図である。本実施の形態に係るスムージングフィルタ部により平滑化処理が行われた男性の音声信号におけるレベル差の比較値を示した図である。（ａ）は、図１７に示すようなレベル差が求められる場合における女性の音声信号に関するゲインの制御値を示し、（ｂ）は、図１８に示すようなレベル差が求められる場合における男性の音声信号に関するゲインの制御値を示した図である。本実施の形態に係る帯域制御フィルタ部の概略構成を示したブロック図である。本実施の形態に係る帯域制御フィルタ部において設定され得るフィルタ特性を例示した図であって、（ａ）は、高域のカットオフ周波数が６，０００Ｈｚ、ゲインが−３０ｄＢである場合において、低域のカットオフ周波数が５０Ｈｚ〜５００Ｈｚのいずれかに設定される場合のフィルタ特性を示し、（ｂ）は、低域のカットオフ周波数が１００Ｈｚ、ゲインが−３０ｄＢである場合において、高域のカットオフ周波数が１，５００Ｈｚ〜６，０００Ｈｚのいずれかに設定される場合のフィルタ特性を示し、（ｃ）は、低域のカットオフ周波数が２００Ｈｚ、高域のカットオフ周波数が６，０００Ｈｚである場合において、ゲインが０ｄＢ〜−３０ｄＢのいずれかに設定される場合のフィルタ特性を示した図である。（ａ）は、ホワイトノイズを音楽信号として用いた場合の周波数特性を模式的に示し、（ｂ）は、第１ローシェルフフィルタ部でフィルタ処理が施された後の音楽信号の周波数特性を示し、（ｃ）は、第２ローシェルフフィルタ部でフィルタ処理が施された後の音楽信号の周波数特性を示した図である。（ａ）は、第２ローシェルフフィルタ部でフィルタ処理が施された後の音楽信号に対して、第１ハイシェルフフィルタ部においてフィルタ処理が施された後の音楽信号の周波数特性を示し、（ｂ）は、第２ハイシェルフフィルタ部においてフィルタ処理が施された後の音楽信号の周波数特性を示し、（ｃ）は、（ｂ）に示した音楽信号の信号レベルを全体的に低減させた状態を示した図である。（ａ）は、女性の音声信号の周波数特性を示し、（ｂ）は、音楽信号としてホワイトノイズを使用した場合において、自動音量制御装置における音量制御を行う前の音楽信号の周波数特性と、音量制御を行った後の音楽信号の周波数特性を示した図である。（ａ）は、男性の音声信号の周波数特性を示し、（ｂ）は、音楽信号としてホワイトノイズを使用した場合において、自動音量制御装置における音量制御を行う前の音楽信号の周波数特性と、音量制御を行った後の音楽信号の周波数特性とを示した図である。（ａ）および（ｂ）は、図２４に示した（ａ）（ｂ）に対応する図であって、音声信号の信号レベルが、図２４に示す場合に比べて１２ｄＢ大きい場合を示した図である。（ａ）および（ｂ）は、図２５に示した（ａ）（ｂ）に対応する図であって、音声信号の信号レベルが、音声信号の信号レベルが図２５に示す場合に比べて１２ｄＢ大きい場合を示した図である。（ａ）および（ｂ）は、図２４に示した（ａ）（ｂ）に対応する図であって、音楽信号がホワイトノイズでなく実際の音楽の信号である場合を示した図である。（ａ）および（ｂ）は、図２５に示した（ａ）（ｂ）に対応する図であって、音楽信号がホワイトノイズでなく実際の音楽の信号である場合を示した図である。

以下、本発明に係る自動音量制御装置について、図面を用いて詳細に説明を行う。

図１は、本実施の形態に係る自動音量制御装置の概略構成を示したブロック図である。なお、本実施の形態では、自動音量制御装置１が車両に設置される場合を一例として示して説明する。本実施の形態に係る自動音量制御装置１を車両に設置することにより、会話の有無に応じて、車載用オーディオ装置より出力される音楽のうち音声帯域の音量のみを自動的に低減させることが可能になる。

本実施の形態に係る自動音量制御装置１は、図１に示すように、音声強調処理部２、メインボリューム部３、音声検出部４、帯域幅検出部（帯域幅検出手段）５、レベル検出部（レベル差検出手段）６、帯域制御フィルタ部（帯域制御手段）７、パワーアンプ部８、マイクＭ１，Ｍ２、スピーカＳ１，Ｓ２により概略構成されている。

［音声強調処理部］
まず、音声強調処理部２について説明する。図２は、音声強調処理部２の概略構成を示したブロック図である。音声強調処理部２は、アレイマイク部１０と、オーディオキャンセラ部１１と、ノイズキャンセラ部１３とを有している。

［アレイマイク部］
図３は、アレイマイク部１０の概略構成を示したブロック図である。アレイマイク部１０は、図３に示すように、第１バンドパスフィルタ部２１と、第２バンドパスフィルタ部２２と、遅延部２３と、適応フィルタ部２４とを有している。

第１バンドパスフィルタ部２１および第２バンドパスフィルタ部２２は、マイクＭ１とマイクＭ２を介して入力される音響信号に対して４００Ｈｚ〜２．４ｋＨｚ程度の帯域制限を行う役割を有している。従って、第１バンドパスフィルタ部２１および第２バンドパスフィルタ部２２を通過する音響信号は、マイクＭ１，Ｍ２を介して入力される音響信号のうち音声帯域に対応する信号だけになる。

遅延部２３は、適応フィルタ部２４における信号の減算処理に対応させるべく、マイクＭ１側の音響信号の遅延を行う役割を有している。このため、遅延部２３は、第１バンドパスフィルタ部２１により帯域制限が行われたマイクＭ１の音響信号に対してのみ適用される。遅延部２３により遅延処理が行われた音響信号は、適応フィルタ部２４に入力される。

適応フィルタ部２４は、マイクＭ１より入力されて遅延部２３により遅延処理が行われた音響信号から、マイクＭ２より入力された音響信号の減算処理を行う。

適応フィルタ部２４は、ＦＩＲ（Finite Impulse Response Filter）部２５とＮＬＭＳ(Normalized Least Mean Square)部２６と、加算部２７とを有している。

ＦＩＲ部２５は、有限のインパルス応答フィルタを備えており、ＮＬＭＳ部２６によって行われる係数制御に基づいて、マイクＭ２で集音された音響信号に対してフィルタ処理を施す機能を有している。加算部２７は、ＦＩＲ部２５によりフィルタ処理が行われたマイクＭ２からの音響信号を、位相を反転させた状態で、遅延部２３により遅延処理が行われたマイクＭ１からの音響信号に対して加算する（実質的には、マイクＭ１の音響信号から、フィルタ処理が行われたマイクＭ２の音響信号を減算する）。加算部２７により加算処理された音響信号は、適応フィルタ部２４から出力されるとともに、ＮＬＭＳ部２６へ出力される。

ＮＬＭＳ部２６は、加算部２７より取得した音響信号（マイクＭ１の音響信号からフィルタ処理が行われたマイクＭ２の音響信号が減算された信号）と、マイクＭ２によって集音された音響信号とに基づいて、最小二乗アルゴリズムに基づいてＦＩＲ部２５におけるフィルタの係数制御を行う。このようにＮＬＭＳ部２６を適応フィルタ部２４に設けることによって、適応速度が入力信号の大きさに依存しないという特徴を備えたＮＬＭＳアルゴリズムを適用することが可能となる。

マイクＭ１とマイクＭ２とは、図４（ａ）に示すように、車両２８の運転席２８ａおよび助手席２８ｂの上方位置に設けられたサンバイザーに設置されている。マイクＭ１およびマイクＭ２は、車両室内における会話を取得するために用いられるものであり、図４（ｂ）に示すように、マイクＭ１には、無指向性のマイクが用いられ、マイクＭ２には、単一指向性のマイクが用いられている。このようにして、無指向性のマイクＭ１により集音された音と、指向性を備えたマイクＭ２により集音された音とが、それぞれアレイマイク部１０に入力される。

無指向性のマイクＭ１により集音された音と、指向性を備えたマイクＭ２により集音された音とが、それぞれアレイマイク部１０に入力されると、アレイマイク部１０の適応フィルタ部２４において、マイクＭ１の音響信号からマイクＭ２の音響信号が減算されるため、減算結果はマイクＭ２のヌル方向（マイクＭ２における指向範囲以外の方向）が残り、結果として、該当する方向の指向性が強調されることになる。

従って、指向性が強調される方向に発話者が位置するようにして、マイクＭ１とマイクＭ２とを設置することによって、発話者の音声を効果的に取得することが可能となる。このように発話者の音声を効果的に取得することにより、取得された音声が強調されることになるので、アレイマイク部１０において求められる音響信号は、発話者の音声（希望信号Ｄ）と車載用オーディオ装置から出力される音楽（非希望信号Ｕ）との相対的な比率、すなわちＤ／Ｕが改善された信号となる。

なお、アレイマイク部１０、マイクＭ１およびマイクＭ２の構成は、本実施の形態において説明した構成には限定されず、発話者の音声に対する指向性が強調されて、Ｄ／Ｕを改善することが可能な方式を実現するものであれば、異なる構成となるものであってもよい。

また、図４（ａ）に示すように、車両２８にはスピーカが４カ所、具体的には、右フロントドア、左フロントドア、右リアドア、左リアドアの４カ所にそれぞれ設けられており、右フロントドアおよび右リアドアに設けられるスピーカ（このスピーカがスピーカ１０ａに該当する）からは、パワーアンプ部８において右側成分の音響効果が強調された音楽信号（右側音楽信号Ｒ）が出力され、左フロントドアおよび左リアドアに設けられるスピーカ（このスピーカがスピーカ１０ｂに該当する）からは、パワーアンプ部８において左側成分の音響効果が強調された音楽信号（左側音楽信号Ｌ）が出力される。

［オーディオキャンセラ部］
次に、オーディオキャンセラ部１１について説明を行う。図５は、オーディオキャンセラ部１１の概略構成を示したブロック図である。オーディオキャンセラ部１１は、図５に示すように、第１バンドパスフィルタ部３１と、第２バンドパスフィルタ部３２と、第１遅延部３３と、第２遅延部３４と、第１適応フィルタ部３５と、第２適応フィルタ部３６とを有している。

第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２は、車載用オーディオ装置より出力された２チャンネルの音楽信号、すなわち左側の音楽信号Ｌおよび右側の音楽信号Ｒにおいて、２００Ｈｚ〜２．６ｋＨｚ程度の帯域制限を行うことにより、音響信号のうち主に音声帯域の信号のみを通過させる役割を有している。

なお、オーディオキャンセラ部１１では、第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２において設定される帯域制限幅（２００Ｈｚ〜２．６ｋＨｚ程度）を、アレイマイク部１０の第１バンドパスフィルタ部２１および第２バンドパスフィルタ部２２で設定される帯域制限幅（４００Ｈｚ〜２．４ｋＨｚ程度）よりも広い帯域幅（但し、４００Ｈｚ〜２．４ｋＨｚを含む）に設定することにより、アレイマイク部１０の帯域制限のカットオフ付近、すなわち４００Ｈｚや２．４ｋＨｚにおけるオーディオキャンセル性能の向上を図っている。

第１遅延部３３および第２遅延部３４は、第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２により帯域制限処理が行われた音響信号に対して遅延処理を施す役割を有している。第１遅延部３３および第２遅延部３４による遅延処理によって、アレイマイク部１０を通して入力される音響信号の伝搬遅延の補正を行うことが可能となる。

第１適応フィルタ部３５は、第１ＦＩＲ部３７、第１ＬＭＳ部３９、第１加算部３５ａにより概略構成されており、第２適応フィルタ部３６は、第２ＦＩＲ部３８、第２ＬＭＳ部４０、第２加算部３６ａにより概略構成されている。第１適応フィルタ部３５および第２適応フィルタ部３６は、アレイマイク部１０の適応フィルタ部２４におけるＮＬＭＳ部２６を第１ＬＭＳ部３９および第２ＬＭＳ部４０に置き換えた構成に該当する。

第１適応フィルタ部３５および第２適応フィルタ部３６では、第１ＬＭＳ部３９および第２ＬＭＳ部４０において、一般的なＬＭＳ(Least Mean Square)アルゴリズムを用いることによって、アレイマイク部１０から入力される音響信号から、車載用オーディオ装置により出力された音楽信号Ｌおよび音楽信号Ｒを順番に減算する処理を行う。具体的な第１適応フィルタ部３５および第２適応フィルタ部３６の構成については、図３に示すように、アレイマイク部１０の適応フィルタ部２４と同様の構成であるため、ここでの詳細な説明を省略する。

なお、オーディオキャンセラ部１１では、図５に示すように、第１適応フィルタ部３５および第２適応フィルタ部３６がカスケード接続されている。従って、オーディオキャンセラ部１１では、第１適応フィルタ部３５においてアレイマイク部１０から入力された音響信号を音楽信号Ｌで減算処理した後に、第２適応フィルタ部３６において第１適応フィルタ部３５で減算処理された音響信号を音楽信号Ｒで減算処理する構成となっている。この場合において、第１適応フィルタ部３５は第２適応フィルタ部３６よりも早く収束させることが必要となるため、適応速度を大きく設定している。なお、音源が２チャンネル以上ある場合は、チャンネル数に応じて適応フィルタ部の設置数を増加することにより同様の効果を奏することが可能である。

図６は、マイクＭ１により集音された音響信号の周波数特性と、アレイマイク部１０およびオーディオキャンセラ部１１を動作させた場合における適応フィルタ部２４、第１適応フィルタ部３５および第２適応フィルタ部３６の出力信号の周波数特性を示した図である。具体的に図６には、アレイマイク部１０の適応フィルタ部２４を適用させる前のマイクＭ１の音響信号（図６において「無指向性マイク」で示すグラフ）と、アレイマイク部１０の適応フィルタ部２４が適用された後の音響信号（図６において「アレイマイク部」で示すグラフ）と、オーディオキャンセラ部１１において第１適応フィルタ部３５を適用した後の音響信号（図６において「アレイマイク部＋オーディオキャンセラ部（Ｌ）」で示すグラフ）と、オーディオキャンセラ部１１において第２適応フィルタ部３６を適用した後の音響信号（図６において「アレイマイク部＋オーディオキャンセラ部（Ｌ＋Ｒ）」で示すグラフ）との周波数特性が示されている。

なお、図６に示す場合において、車載用オーディオ装置より出力される音楽信号Ｌおよび音楽信号Ｒには長周期のＭ系列信号が用いられ、音楽信号Ｌと音楽信号Ｒとは無相関な信号となっている。また、図７（ａ）は、アレイマイク部１０の適応フィルタ部２４で適用されるフィルタ係数を示し、図７（ｂ）は、オーディオキャンセラ部１１の第１適応フィルタ部３５で適用されるフィルタ係数を示し、図７（ｃ）は、オーディオキャンセラ部１１の第２適応フィルタ部３６で適用されるフィルタ係数を示している。具体的には、アレイマイク部１０の適応フィルタ部２４におけるＦＩＲ部２５のＦＩＲフィルタ長は１２８ｔａｐ、オーディオキャンセラ部１１の第１適応フィルタ部３５におけるＦＩＲフィルタ長および第２適応フィルタ部３６のＦＩＲフィルタ長は、それぞれ１９２ｔａｐ、また、各ＦＩＲ部におけるサンプリング周波数は６ｋＨｚに設定されている。

それぞれの適応フィルタ部２４、３５、３６を適用する前後の周波数特性を比較すると、図６に示すように、無指向性マイクＭ１の出力信号の信号レベルに対して、アレイマイク部１０における出力信号の信号レベルは、出力値が約１０ｄＢ程度減衰している。さらに、オーディオキャンセラ部１１の第１適応フィルタ部３５の出力信号の信号レベルでは、アレイマイク部１０における出力信号の信号レベルに対して、約８ｄＢ程度減衰し、さらに第２適応フィルタ部３６における出力信号の信号レベルでは、第１適応フィルタ部３５の出力信号の信号レベルに対して約１１ｄＢ程度減衰している。

このように、適応フィルタ部２４を適用する前の音響信号の信号レベルに比べて、適応フィルタ部２４、第１適応フィルタ部３５および第２適応フィルタ部３６を全て適用した後の信号の信号レベルは、トータルで３０ｄＢ近く出力値が減衰しており、結果としてＤ／Ｕが大きく改善されている。なお、図７（ａ）〜（ｃ）に示す各適応フィルタのフィルタ係数においては、ＦＩＲフィルタの応答が続いていることから、フィルタタップ長をより長くすることにより、さらなるＤ／Ｕの改善を期待することができる。

［ノイズキャンセラ部］
ノイズキャンセラ部１３は、スペクトル減算法などを用いて、オーディオキャンセラ部１１より入力される信号からノイズ信号の除去を行う役割を有している。具体的に説明すると、オーディオキャンセラ部１１から出力される信号には、音声信号とノイズ信号（音声以外の信号）とが含まれている。ノイズキャンセラ部１３は、周波数スペクトルにおける時間的に定常的な成分（会話が行われていない状況、音声がない区間における成分）
）をノイズパターンとして推定・保持しており、音声信号とノイズ信号とが含まれる入力信号（オーディオキャンセラ部１１より入力される信号）の周波数領域において、保持するノイズパターンを減算すると同時に、ノイズパターン自体を更新し続けることにより、入力信号（オーディオキャンセラ部１１より入力される信号）からノイズ信号の除去を行う。

［メインボリューム部］
メインボリューム部３は、搭乗者などにより設定された音量（音量調節スイッチの操作量）に応じて、音楽信号の音量調節を行う役割を有している。

メインボリューム部３による音量調節は、車載用オーディオ装置において設定される音量に連動して、あるいは、車載用オーディオ装置とは別に設けられる音量調節スイッチの設定に基づいて行われる。また、メインボリューム部３において音量調節が行われた音楽信号は、レベル検出部６および帯域制御フィルタ部７へ出力される。

［音声検出部］
次に、音声検出部４について説明する。図８は、音声検出部４の概略構成を示したブロック図である。音声検出部４は、実効値検出部４１と、移動平均部４２と、音声検出スレッショルド部４３とを有している。

実効値検出部４１は、音声強調処理部２の出力信号（音声信号）において所定区間の実効値の検出を行う役割を有している。移動平均部４２は、実効値検出部４１において実効値の検出が行われた信号に対して、所定区間の移動平均を求める役割を有している。音声検出スレッショルド部４３は、予め設定された音声検出スレッショルド（閾値）に基づいて、音声信号の検出を行う役割を有している。

音声検出スレッショルド部４３において音声信号の検出を行う場合には、音声強調処理部２のアレイマイク部１０とオーディオキャンセラ部１１において入力される信号のＤ／Ｕが大きく改善されているので、音声検出スレッショルドに基づく音声信号の検出が容易になる。音声検出スレッショルド部４３において検出された音声検出信号はレベル検出部６に出力される。

［帯域幅検出部］
次に帯域幅検出部５について説明する。図９は、帯域幅検出部５の概略構成を示したブロック図である。帯域幅検出部５は、図９に示すように、ＦＦＴ（Fast Fourier Transform）部５１と、最大値ホールド部５２と、累積分布部（累積分布算出手段）５３と、帯域幅判定部（スレッショルド設定手段、帯域幅判定手段）５４と、スムージングフィルタ部５５と、帯域制御設定部５６とを有している。

ＦＦＴ部５１は、音声信号に対して所定の間隔で高速フーリエ変換、すなわち、ＦＦＴ演算を行うことにより、音声信号を周波数領域に変換する役割を有している。最大値ホールド部５２は、ＦＦＴ演算により周波数領域に変換されたＦＦＴ出力信号を、ＦＦＴサンプル毎に最大値でホールド（保持）する役割を有している。累積分布部５３は、最大値ホールドされたＦＦＴ出力信号において、累積分布の計算を行う。

図１０（ａ）は、女性の音声信号におけるＦＦＴサンプル（ＦＦＴ出力）毎の振幅特性を示し、図１０（ｂ）は、女性の音声信号における累積分布特性を示した図である。一方で、図１１（ａ）は、男性の音声信号におけるＦＦＴサンプル（ＦＦＴ出力）毎の振幅特性を示し、図１１（ｂ）、男性の音声信号における累積分布特性を示した図である。

図１０および図１１に示す場合において、サンプリング周波数は１２ｋＨｚ、ＦＦＴ長は１，０２４、最大値ホールド長は１６サンプルに設定されている。なお、ＦＦＴ出力の１サンプルは約１１．７Ｈｚであり、５１２サンプルの場合には６ｋＨｚに相当することになる。

図１０（ａ）および図１１（ａ）に示すように、女性の音声信号の場合には、ＦＦＴ出力のサンプル数が高い値を示す部分（つまり、比較的高い周波数帯域）においても振幅値が検出されるのに対して、男性の音声信号の場合には、ＦＦＴ出力のサンプル数が低い値を示す部分（つまり、比較的低い周波数帯域）においてのみ振幅値が検出されている。一般に、男性の音声に比べて女性の音声の方が相対的に高い周波数帯域の音を発することから、このような違いが示されることになる。

図１０（ｂ）および図１１（ｂ）に示される累積分布特性においても、図１０（ａ）および図１１（ａ）に示す振幅特性の特徴が反映されており、女性の場合には、累積確率の上昇が男性の場合に比べて緩やかになっている。

帯域幅判定部５４は、累積分布部５３において計算された累積分布の出力に対して、低域周波数用のスレッショルド（低域スレッショルド）と高域周波数用のスレッショルド（高域スレッショルド）との２つのスレッショルドを設定し、音声の低域周波数部分と高域周波数部分との幅、すなわち音声帯域幅の判定（音楽信号における低域側の周波数と高域側の周波数とを意味し、求められる低域側の周波数と高域側の周波数とを判定値とする）を行う役割を有している。スムージングフィルタ部５５は、帯域幅判定部５４により判定された音声の音声帯域幅に対して、一次のＩＩＲ（Infinite Impulse Response）型のローパスフィルタで積分を行うことにより、変動する判定値の平滑化を行う役割を有している。

図１２（ａ）は、女性の音声信号における低域の音声帯域の判定値（周波数）変化を示し、図１２（ｂ）は、女性の音声信号における高域の音声帯域の判定値（周波数）変化を示している。また、図１３（ａ）は、男性の音声信号における低域の音声帯域の判定値（周波数）変化を示し、図１３（ｂ）は、男性の音声信号における高域の音声帯域の判定値（周波数）変化を示している。

具体的に、図１２（ａ）に示す女性の音声信号における低域の音声帯域の判定値（周波数）は、図１０（ｂ）に示した女性の音声信号における累積分布特性に対し、低域用のスレッショルドとして０．１の値を設定し、このスレッショルドを超える（対応する）ＦＦＴ出力値を周波数変換して（本実施の形態におけるＦＦＴ出力の１サンプルは、上述したように約１１．７Ｈｚであるため、図１０（ｂ）に示すＦＦＴ出力のサンプル数に対して１１．７Ｈｚを掛け合わせることにより周波数変換を行うことができる）示した図であり、図１２（ｂ）に示した女性の音声信号における高域の音声帯域の判定値は、図１０（ｂ）に示した女性の音声信号における累積分布特性に対し、高域用のスレッショルドとして０．９９の値を設定し、このスレッショルドを超える（対応する）ＦＦＴ出力値を周波数変換して示した図である。

また同様に、図１３（ａ）に示す男性の音声信号における低域の音声帯域の判定値（周波数）は、図１１（ｂ）に示した男性の音声信号における累積分布特性に対し、低域用のスレッショルドとして０．１の値を設定し、このスレッショルドを超える（対応する）ＦＦＴ出力値を周波数変換して示した図であり、図１３（ｂ）に示した男性の音声信号における高域の音声帯域の判定値（周波数）変化は、図１１（ｂ）に示した男性の音声信号における累積分布特性に対し、高域用のスレッショルドとして０．９９の値を設定し、このスレッショルドを超える（対応する）ＦＦＴ出力値を周波数変換して示した図である。

なお、図１２および図１３に示した音声帯域の判定値は、スムージングフィルタ部５５によるフィルタ処理後の値を示しており、スムージングフィルタ部５５におけるＩＩＲ型のローパスフィルタの正規化カットオフ周波数は０．０５に設定されている。

図１２および図１３を比較すると、女性の音声信号の場合には、低域周波数であっても高域周波数であって、時間経過と共に比較的大きく変動する傾向が示されている。男性の音声信号は、女性の音声信号に比べて低域および高域ともに変動が少なく、検出される周波数が低い値となっていることがわかる。

次に、帯域制御設定部５６は、音声信号における低域周波数の判定値（周波数）と高域周波数の判定値（周波数）とに基づいて、帯域制御フィルタ部７における低域フィルタの制御値と高域フィルタの制御値とを設定する役割を有している。従って、帯域制御設定部５６では、帯域制御フィルタ部７における低域フィルタの制御値と高域フィルタの制御値とを、音声信号の音声帯域における低域のカットオフ周波数と高域のカットオフ周波数とに対応付ける役割を有することになる。

図１４（ａ）は、女性の音声信号に関して、図１２（ａ）に示すような低域周波数が検出される場合における低域フィルタの制御値を示し、図１４（ｂ）は、図１２（ｂ）に示すような高域周波数が検出される場合における高域フィルタの制御値を示している。図１２（ａ）と図１４（ａ）とを比較すると明らかなように、図１４（ａ）に示す制御値の変化状態は、図１２（ａ）に示す低域周波数の変化状態に対応している。また、図１２（ｂ）と図１４（ｂ）とを比較すると明らかなように、図１４（ｂ）に示す制御値の変化状態は、図１２（ｂ）に示す高域周波数の変化状態に対応している。帯域制御設定部５６は、図１２（ａ）に示す低域周波数に対応する１〜１０の値を求めて、求められた値に基づいて女性の音声信号に対する低域周波数（低域フィルタ）の制御値を設定する。同様に、帯域制御設定部５６は、図１２（ｂ）に示す高域周波数に対応する１〜１０の値を求めて、求められた値に基づいて女性の音声信号に対する高域周波数（高域フィルタ）の制御値を設定する。

一方で、図１５（ａ）は、男性の音声信号に関して、図１３（ａ）に示すような低域周波数が検出される場合における低域フィルタの制御値を示し、図１５（ｂ）は、図１３（ｂ）に示すような高域周波数が検出される場合における高域フィルタの制御値を示している。図１３（ａ）と図１５（ａ）とを比較すると明らかなように、図１３（ａ）に示す制御値の変化状態は、図１５（ａ）に示す低域周波数の変化状態に対応している。また、図１３（ｂ）と図１５（ｂ）とを比較すると明らかなように、図１５（ｂ）に示す制御値の変化状態は、図１３（ｂ）に示す高域周波数の変化状態に対応している。帯域制御設定部５６は、図１３（ａ）に示す低域周波数に対応する１〜１０の値を求めて、求められた値に基づいて男性の音声信号に対する低域周波数（低域フィルタ）の制御値を設定する。同様に、帯域制御設定部５６は、図１３（ｂ）に示す高域周波数に対応する１〜１０の値を求めて、求められた値に基づいて男性の音声信号に対する高域周波数（高域フィルタ）の制御値を設定する。

なお、本実施の形態に係る帯域制御設定部５６では、低域フィルタの制御値が１の場合には、５０Ｈｚのカットオフ周波数が対応し、以後、制御値が１ずつ増加する毎にカットオフ周波数が５０Ｈｚずつ増加して、制御値が１０の場合には、５００Ｈｚのカットオフ周波数が対応することになる。また、高域フィルタの制御値が１の場合には、１，５００Ｈｚのカットオフ周波数が対応し、以後、制御値が１ずつ増加する毎にカットオフ周波数が５００Ｈｚずつ増加して、制御値が１０の場合には、６，０００Ｈｚのカットオフ周波数が対応することになる。

図２１（ａ）は、高域のカットオフ周波数が６，０００Ｈｚ、ゲインが−３０ｄＢである場合において、帯域制御設定部５６により設定され得る低域フィルタの制御値（１から１０まで）に対応する低域のカットオフ周波数（５０Ｈｚ〜５００Ｈｚ）のそれぞれのフィルタ特性を一例として示したものである。

また、図２１（ｂ）は、低域のカットオフ周波数が１００Ｈｚ、ゲインが−３０ｄＢである場合において、帯域制御設定部５６により設定され得る高域フィルタの制御値（１から１０まで）に対応する高域のカットオフ周波数（１，５００Ｈｚ〜６，０００Ｈｚ）のそれぞれのフィルタ特性を一例として示したものである。

［レベル検出部］
次に、レベル検出部６について説明する。図１６は、レベル検出部６の概略構成を示したブロック図である。レベル検出部６は、図１６に示すように、帯域制限部（帯域制限手段）６１と、実効値検出部６２と、最大値ホールド部６３と、レベル比較部（レベル差算出手段）６４と、スムージングフィルタ部６５と、ゲイン制御設定部６６とを有している。

帯域制限部６１は、メインボリューム部３より入力される音楽信号に対して帯域制限を行うことにより音楽信号を音声帯域と同じ帯域となるように制限し、さらに音声信号（例えば４８ｋＨｚ）が音声信号（例えば、１２ｋＨｚ）と同じサンプリング周波数になるようにダウンサンプリング処理を行う役割を有している。

実効値検出部６２は、音声強調処理部２より入力される音声信号と、帯域制限部６１において帯域制限等の処理が施された音楽信号とのそれぞれに対して、所定区間の実効値の検出を行う役割を有し、最大値ホールド部６３は、実効値検出部６２において所定区間の実効値検出が行われた音声信号と音楽信号とに対して、所定区間の最大値検出と最大値のホールド（保持）を行う役割を有している。

レベル比較部６４は、最大値ホールド部６３により最大値検出および最大値ホールドが行われた音声信号および音楽信号について、それぞれの信号レベルの比較を行い、レベル差（音声帯域における音楽信号の信号レベルと音声信号の信号レベルとの差）の値を比較値として出力する役割を有している。スムージングフィルタ部６５は、一次のＩＩＲ型のローパスフィルタを用いて、レベル比較部６４で求められた比較値を積分し、変動する比較値の平滑化を行う役割を有している。

図１７は、スムージングフィルタ部６５により平滑化処理が行われた女性の音声信号におけるレベル差の比較値を示しており、図１８は、同様に平滑化処理が行われた男性の音声信号におけるレベル差の比較値を示している。なお、図１７および図１８に示した比較値において、実効値検出部６２において設定される実効値検出長は、サンプリング周波数１２ｋＨｚで１０２４サンプル、最大値ホールド部６３において設定される最大値ホールド長は１６サンプル、スムージングフィルタ部６５におけるＩＩＲ型ローパスフィルタの正規化カットオフ周波数は０．０５、音楽信号のサンプルとしてホワイトノイズを使用している。

図１７および図１８におけるレベル差の比較値では、音楽信号よりも音声信号の方がレベル値が大きい場合には、レベル差が０ｄＢよりも大きな値となり、音楽信号よりも音声信号の方がレベル値が小さい場合には、レベル差が０ｄＢよりも小さな値となっている。図１７と図１８とを比較すると、女性の比較値および男性の比較値は、ともに０ｄＢ前後のレベル差で値が変動していることがわかる。なお、本実施の形態に示す例では、図１７および図１８に示すように、レベル差の変動が同じような状態となるが、入力される音楽信号の大きさなどにより、この値は変動されるため、女性の比較値および男性の比較値が大きく異なる場合も生じ得る。

ゲイン制御設定部６６は、レベル差の比較値と、音声検出部４より入力される音声検出信号と、予め設定される音声オフセット値とに基づいて、帯域制御フィルタ部７の制御値を設定する。この制御値は、帯域制御フィルタ部７のゲイン設定部７３（図２０参照）において最終的なフィルタゲインを設定する際に利用される。

ここで、音声オフセット値とは、レベル差の比較値に対してオフセットを行う値を示しており、ゲイン制御の動作点の設定を行うために用いられる値である。この音声オフセット値により音声信号と音楽信号との基準となる信号レベルが所定値（ｄＢ）だけオフセットされる。また、音声検出信号によって、音声検出部４で音声信号が検出されなかったと判断された場合、ゲイン制御設定部６６は、帯域制御フィルタ部７の制御値の設定を行わない。制御値の設定が行われない場合、帯域制御フィルタ部７は、フィルタリング処理を行わずに、そのまま音楽信号を通過させる処理を行う。

図１９（ａ）は、図１７に示すようなレベル差が求められる場合における女性の音声信号に関する制御値を示し、図１９（ｂ）は、図１８に示すようなレベル差が求められる場合における男性の音声信号に関する制御値を示している。図１７と図１９（ａ）とを比較すると明らかなように、図１９（ａ）に示す制御値の変化状態は、図１７に示すレベル差の変化状態に対応している。ゲイン制御設定部６６は、図１７に示すレベル差に対応するようにして、レベル差の値に対応する１〜１１の値（つまり、レベル差を１１段階に段階分けした値）を求めて、求められた値に基づいて女性の音声信号に対するゲインの制御値を設定する。図１８と図１９（ｂ）においても同様であり、ゲイン制御設定部６６は、図１８に示すレベル差に対応するようにして、レベル差の値に対応する１〜１１の値を求めて、求められた値に基づいて男性の音声信号に対するゲインの制御値を設定する。

なお、本実施の形態に係るゲイン制御設定部６６では（図１９（ａ）（ｂ）に示す場合には）、音声オフセット値が−２０ｄＢに設定されている。また、本実施の形態に係るゲイン制御設定部６６では、制御値が１の場合には、−３０ｄＢのゲインが対応し、以後、制御値が１ずつ増加する毎にゲインが３ずつ増加して、制御値が１１の場合には、０ｄＢのゲインが対応することになる。図２１（ｃ）は、低域のカットオフ周波数が２００Ｈｚ、高域のカットオフ周波数が６，０００Ｈｚに設定される場合において、ゲイン制御設定部６６により設定され得る制御値（１から１１まで）に対応するゲイン（０ｄＢ〜−３０ｄＢ）のそれぞれのフィルタ特性を一例として示したものである。

［帯域制御フィルタ部］
次に、帯域制御フィルタ部７について説明する。図２０は、帯域制御フィルタ部７の概略構成を示したブロック図である。帯域制御フィルタ部７は、図２０に示すように、第１係数設定部７１と、第２係数設定部７２と、ゲイン設定部７３と、カスケード接続された第１ローシェルフフィルタ部（2nd shelving ＬＰＦ１、ローシェルフフィルタ手段）７４および第２ローシェルフフィルタ部（2nd shelving ＬＰＦ２、ローシェルフフィルタ手段）７５と、同じくカスケード接続された第１ハイシェルフフィルタ部（2nd shelving ＨＰＦ１、ハイシェルフフィルタ手段）７６および第２ハイシェルフフィルタ部（2nd shelving ＨＰＦ２、ハイシェルフフィルタ手段）７７と、乗算部（信号レベル低減手段）７８とを有している。

第１係数設定部７１は、低域フィルタの制御値とゲインの制御値とに基づいて、第１ローシェルフフィルタ部７４と第２ローシェルフフィルタ部７５とのフィルタ係数を設定し、第２係数設定部７２は、高域フィルタの制御値とゲインの制御値とに基づいて、第１ハイシェルフフィルタ部７６と第２ハイシェルフフィルタ部７７とのフィルタ係数を設定する役割を有している。ゲイン設定部７３は、ゲインの制御値に基づいて、乗算部７８に最終的なフィルタゲインを設定する役割を有している。

図２１（ａ）〜（ｃ）は、上述したように帯域制御フィルタ部７において設定され得るフィルタ特性を例示した図である。図２１（ａ）は、高域のカットオフ周波数が６，０００Ｈｚ、ゲインが−３０ｄＢである場合において、低域のカットオフ周波数が５０Ｈｚ〜５００Ｈｚのいずれかに設定される場合のフィルタ特性を示し、（ｂ）は、低域のカットオフ周波数が１００Ｈｚ、ゲインが−３０ｄＢである場合において、高域のカットオフ周波数が１，５００Ｈｚ〜６，０００Ｈｚのいずれかに設定される場合のフィルタ特性を示し、（ｃ）は、低域のカットオフ周波数が２００Ｈｚ、高域のカットオフ周波数が６，０００Ｈｚである場合において、ゲインが０ｄＢ〜−３０ｄＢのいずれかに設定される場合のフィルタ特性を示した図である。

本実施の形態では、低域のカットオフ周波数が５０Ｈｚ、高域のカットオフ周波数が６，０００Ｈｚ、ゲインが−３０ｄＢに設定される場合を一例として示して、帯域制御フィルタ部７の動作を説明する。

上述したように、本実施の形態では、低域のカットオフ周波数が５０Ｈｚ、高域のカットオフ周波数が６，０００Ｈｚ、ゲインが−３０ｄＢに設定されるため、低域のカットオフ周波数が５０Ｈｚに設定される場合は、低域フィルタの制御値が１に設定されており、高域のカットオフ周波数が６，０００Ｈｚに設定される場合は、高域フィルタの制御値が１０に設定されており、ゲインが−３０ｄＢに設定される場合は、ゲインの制御値が１に設定されていることになる。

従って、第１係数設定部７１には、低域フィルタの制御値として帯域幅検出部５において既に設定された値「１」が入力され、ゲインの制御値としてレベル検出部６で既に設定された値「１」が入力される。第１係数設定部７１では、入力された低域フィルタの制御値「１」に基づいて、第１ローシェルフフィルタ部７４および第２ローシェルフフィルタ部７５におけるカットオフ周波数をそれぞれ５０Ｈｚに設定し、入力されたゲインの制御値「１」に基づいて、第１ローシェルフフィルタ部７４および第２ローシェルフフィルタ部７５におけるゲインを、それぞれ１５ｄＢ（３０ｄＢのゲインを第１ローシェルフフィルタ部７４と第２ローシェルフフィルタ部７５との２つのフィルタに分配するため）に設定する。

また、同様にして、第２係数設定部７２には、高域フィルタの制御値として帯域幅検出部５において既に設定された値「１０」が入力され、ゲインの制御値としてレベル検出部６で既に設定された値「１」が入力される。第２係数設定部７２では、入力された高域フィルタの制御値「１０」に基づいて、第１ハイシェルフフィルタ部７６および第２ハイシェルフフィルタ部７７におけるカットオフ周波数をそれぞれ６，０００Ｈｚに設定し、入力されたゲインの制御値「１」に基づいて、第１ハイシェルフフィルタ部７６および第２ハイシェルフフィルタ部７７におけるゲインを、それぞれ１５ｄＢ（３０ｄＢのゲインを第１ハイシェルフフィルタ部７６と第２ハイシェルフフィルタ部７７との２つのフィルタに分配するため）に設定する。

このように第１ローシェルフフィルタ部７４、第２ローシェルフフィルタ部７５、第１ハイシェルフフィルタ部７６および第２ハイシェルフフィルタ部７７のフィルタ係数が設定されると、第１ローシェルフフィルタ部７４と第２ローシェルフフィルタ部７５とは、カスケード接続されているので、図２２（ａ）のような音楽信号（ホワイトノイズを一例として用いた信号）に対して、第１ローシェルフフィルタ部７４でフィルタ処理を施すことにより、図２２（ｂ）に示すように、入力された音楽信号における５０Ｈｚ以下の周波数のゲインが１５ｄＢだけ棚状に増幅され、さらに第２ローシェルフフィルタ部７５でフィルタ処理を施すことにより、図２２（ｃ）に示すように、入力された音楽信号における５０Ｈｚ以下のゲインがさらに１５ｄＢだけ棚状に増幅されて、結果として５０Ｈｚ以下の周波数のゲインが３０ｄＢだけ棚状に増幅されることになる。

また、第１ローシェルフフィルタ部７４と第２ローシェルフフィルタ部７５とによりカットオフ周波数５０Ｈｚ以下のゲインの増幅処理が行われた音楽信号は、カスケード接続された第１ハイシェルフフィルタ部７６においてフィルタ処理が施されることにより、図２３（ａ）に示すように、入力された音楽信号における６，０００Ｈｚ以上の周波数のゲインが１５ｄＢだけ棚状に増幅され、さらに、カスケード接続される第２ハイシェルフフィルタ部７７においてフィルタ処理が施されることにより、図２３（ｂ）に示すように、入力された音楽信号における６，０００Ｈｚ以上の周波数のゲインがさらに１５ｄＢだけ棚状に増幅されて、結果として５０Ｈｚ以下の周波数のゲインが３０ｄＢだけ増幅され、さらに、６，０００Ｈｚ以上の周波数のゲインが３０ｄＢだけ増幅されることになる。

ゲイン設定部７３では、受信したゲインの制御値に基づいて、フィルタ処理が行われた音楽信号に対して乗算部７８で乗算処理を行う際に用いる値を設定して、乗算部７８に出力する。本実施の形態では、ゲイン制御値が１であるため、ゲイン設定部７３では、ゲイン制御値に対応する−３０ｄＢの減衰が行われるような値を乗算部７８に出力する。乗算部７８では、図２３（ｂ）に示すように、５０Ｈｚ以下の周波数および６，０００Ｈｚ以上の周波数のゲインが３０ｄＢだけ増幅された音楽信号に対して、ゲイン設定部７３において設定された値を乗算させることにより、音楽信号の信号レベルを相対的に３０ｄＢ減衰させる処理を行い、結果として、図２３（ｃ）に示すように、音楽信号における信号レベルが、５０Ｈｚから６，０００Ｈｚまでの帯域幅において相対的に−３０ｄＢ減衰されることになる。

図２４（ａ）は、女性の音声信号の周波数特性を示し、（ｂ）は、音楽信号としてホワイトノイズを使用した場合において、自動音量制御装置１における音量制御を行う前の音楽信号の周波数特性と、音量制御を行った後の音楽信号の周波数特性を示している。また、図２５（ａ）は、男性の音声信号の周波数特性を示し、（ｂ）は、音楽信号としてホワイトノイズを使用した場合において、自動音量制御装置１における音量制御を行う前の音楽信号の周波数特性と、音量制御を行った後の音楽信号の周波数特性を示している。

図２４および図２５をみると、音量制御を行うことにより、音声信号により検出された帯域幅に応じて、該当する帯域幅の信号レベルが音楽信号において減衰されていることがわかる。この減衰帯域は、音声信号の帯域幅に対応しているため、男性の音声の場合には女性の音声の場合に比べて低い帯域に減衰する帯域がずれていることがわかる。

図２６および図２７のそれぞれは、図２４および図２５のそれぞれに対応する周波数特性を示しており、図２６および図２７の場合には、図２４および図２５に比べて音声信号の信号レベルが１２ｄＢ程大きい場合を示している。図２６および図２７と図２４および図２５とを比較すると、音声信号の信号レベルが大きい場合には、音楽信号における音声帯域の信号レベルの減衰が小さくなっている。図２６および図２７から明らかなように、本実施の形態に係る自動音量制御装置１では、レベル検出部６において音楽信号と音声信号とのレベル差を求めてゲインの制御値を決定するので、音楽信号の帯域幅に応じて音声信号における信号レベルの減衰量を最適に変動させることが可能となっている。

図２８および図２９は、図２４および図２５において音楽信号がホワイトノイズでなく実際の音楽の信号である場合を示した図である。図２８および図２９において同様に、音声信号を検出した音声帯域に応じて、音楽信号の音声帯域が減衰されており、音楽のジャンルに関わらず最適に音声帯域の信号レベルだけを低減することが可能となる。

その後、帯域制御フィルタ部７において音量制御が行われた音楽信号を、パワーアンプ部８を介してスピーカＳ１、Ｓ２から出力することにより、音楽が流れている状況であっても、車室内の会話を容易に行うことが可能となる。

上述したように本実施の形態に係る自動音量制御装置１では、マイクＭ１およびマイクＭ２において、音声が検出された場合において、車載用オーディオ装置より出力される音楽の出力音量が自動的に低減されるので、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。

具体的には、マイクＭ１、Ｍ２より音声が取得された場合には、帯域制御フィルタ部７において音楽信号の信号レベルを、音声帯域の範囲において低減させることができるので、会話がなされる場合に会話の妨げとなり得る音声と同じ帯域の信号レベル（音量）だけを低減させることができ、音楽の音質を著しく損なうことなく円滑な会話を行うことが可能となる。

また、音楽信号の信号レベルを、音声帯域の範囲において低減させる場合において、本実施の形態に係る自動音量制御装置１では、帯域制限部６１において音声帯域に帯域制限された音楽信号の信号レベルと、音声強調処理部２においてノイズなどが除去された（Ｄ／Ｕに優れる）音声信号の信号レベルとのレベル差を求め、このレベル差に基づいて低減させるべき音楽信号の信号レベルを決定している。このため、低減される信号レベルが著しく低くなって音楽が全く聞こえなくなったり、または、十分に信号レベルが低減されず円滑な会話を実現することができないという状況になることを防止することが可能となる。

さらに、本実施の形態に係る自動音量制御装置１では、音楽信号の信号レベルを低減させる音声帯域の範囲を判断する場合において、帯域幅検出部５の累積分布部５３で、音声信号の振幅特性からＦＦＴサンプル毎の累積分布を求め、この累積分布に応じて音声帯域の低域周波数成分と高域周波数成分を決定している。このため、音声を発する人（発話者）の音声特性に応じてそれぞれ累積分布を求めることにより、信号レベルを低減させる音声帯域の範囲をそれぞれ決定するので、発話者に応じて最適な音声帯域の範囲を決定して（例えば、発話者が男性である場合にはその男性の音声信号に適した音声帯域の範囲で、発話者が女性である場合にはその女性の音声信号に適した音声帯域の範囲で）、音楽信号の信号レベルを低減させることができる。

従って、会話の音声に最適な帯域幅のみで信号レベルの低減を行うことができるので、会話の帯域幅以外の音楽信号においては信号レベルで低減されないまま良質の音楽を楽しむことができ、さらに、音楽の再生が行われていても、会話を妨げうる帯域幅の信号レベルだけを効果的に低減させることができるので、円滑な会話を楽しむことが可能となる。

また、本実施の形態に係る自動音量制御装置１では、無指向性のマイクＭ１と単一指向性のマイクＭ２とを用いることにより指向性を強調させる構成を採用しているので、発話者の音声を精度良く取得することが可能である。

さらに、アレイマイク部１０の適応フィルタ部２４においてＮＬＭＳ適応アルゴリズムを適用し、さらにオーディオキャンセラ部１１の第１適応フィルタ部３５および第２適応フィルタ部３６においてＬＭＳ適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分（ノイズ成分）を効果的かつ高い収束性を確保した上で低減させることができ、音声帯域における音声信号の検出精度の向上を図ることが可能となる。

特に、アレイマイク部１０の適応フィルタ部２４において、ＮＬＭＳ適応アルゴリズムを適用してノイズ成分の低減を図った上で、さらに音源のチャンネル数に応じて、オーディオキャンセラ部１１の第１適応フィルタ部３５および第２適応フィルタ部３６において、適応フィルタ部をカスケード接続する構成を採用し、各適応フィルタ部でのフィルタ処理においてより早くフィルタ処理を適用する部分毎に適応速度を大きくしているので、フィルタ処理が適用される信号の収束を素早くすることが可能となる。

また、オーディオキャンセラ部１１の第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２において設定される帯域制限幅が、アレイマイク部１０の第１バンドパスフィルタ部２１において設定される帯域制限幅よりも広い帯域幅に設定されているため、帯域制限のカットオフ周波数付近のオーディオキャンセル性能を向上させることが可能となる。

上述したような複数の適応アルゴリズムの適用やバンドパスフィルタの適応制限幅の設定により、Ｄ（希望信号：音声信号）／Ｕ（非希望信号：音楽信号）に優れた音声信号（音響信号）を求めることができる。

以上、本発明に係る自動音量制御装置について、図面を用いて詳細に説明したが、本発明に係る自動音量制御装置は、上述した実施の形態に限定されるものではない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

１ …自動音量制御装置
２ …音声強調処理部
３ …メインボリューム部
４ …音声検出部
５ …帯域幅検出部（帯域幅検出手段）
６ …レベル検出部（レベル差検出手段）
７ …帯域制御フィルタ部（帯域制御手段）
８ …パワーアンプ部
１０ …（音声強調処理部の）アレイマイク部
１１ …（音声強調処理部の）オーディオキャンセラ部
１３ …（音声強調処理部の）ノイズキャンセラ部
２１ …（アレイマイク部の）第１バンドパスフィルタ部
２２ …（アレイマイク部の）第２バンドパスフィルタ部
２３ …（アレイマイク部の）遅延部
２４ …（アレイマイク部の）適応フィルタ部
２５ …（適応フィルタ部の）ＦＩＲ部
２６ …（適応フィルタ部の）ＮＬＭＳ部
２７ …（適応フィルタ部の）加算部
２８ …車両
２８ａ …運転席
２８ｂ …助手席
３１ …（オーディオキャンセラ部の）第１バンドパスフィルタ部
３２ …（オーディオキャンセラ部の）第２バンドパスフィルタ部
３３ …（オーディオキャンセラ部の）第１遅延部
３４ …（オーディオキャンセラ部の）第２遅延部
３５ …（オーディオキャンセラ部の）第１適応フィルタ部
３５ａ …（第１適応フィルタ部の）第１加算部
３６ …（オーディオキャンセラ部の）第２適応フィルタ部
３６ａ …（第２適応フィルタ部の）第２加算部
３７ …（第１適応フィルタ部の）第１ＦＩＲ部
３８ …（第２適応フィルタ部の）第２ＦＩＲ部
３９ …（第１適応フィルタ部の）第１ＬＭＳ部
４０ …（第２適応フィルタ部の）第２ＬＭＳ部
４１ …（音声検出部の）実効値検出部
４２ …（音声検出部の）移動平均部
４３ …（音声検出部の）音声検出スレッショルド部
５１ …（帯域幅検出部の）ＦＦＴ部
５２ …（帯域幅検出部の）最大値ホールド部
５３ …（帯域幅検出部の）累積分布部（累積分布算出手段）
５４ …（帯域幅検出部の）帯域幅判定部（スレッショルド設定手段、帯域幅判定手段）
５５ …（帯域幅検出部の）スムージングフィルタ部
５６ …（帯域幅検出部の）帯域制御設定部
６１ …（レベル検出部の）帯域制限部（帯域制限手段）
６２ …（レベル検出部の）実効値検出部
６３ …（レベル検出部の）最大値ホールド部
６４ …（レベル検出部の）レベル比較部（レベル差算出手段）
６５ …（レベル検出部の）スムージングフィルタ部
６６ …（レベル検出部の）ゲイン制御設定部
７１ …（帯域制御フィルタ部の）第１係数設定部
７２ …（帯域制御フィルタ部の）第２係数設定部
７３ …（帯域制御フィルタ部の）ゲイン設定部
７４ …（帯域制御フィルタ部の）第１ローシェルフフィルタ部（ローシェルフフィルタ手段）
７５ …（帯域制御フィルタ部の）第２ローシェルフフィルタ部（ローシェルフフィルタ手段）
７６ …（帯域制御フィルタ部の）第１ハイシェルフフィルタ部（ハイシェルフフィルタ手段）
７７ …（帯域制御フィルタ部の）第２ハイシェルフフィルタ部（ハイシェルフフィルタ手段）
７８ …（帯域制御フィルタ部の）乗算部（信号レベル低減手段）
Ｍ１、Ｍ２ …マイク
Ｓ１、Ｓ２ …スピーカ

Claims

マイクにより取得された音声信号の周波数特性に基づいて、音楽信号において音量制御を行う帯域幅の低域側の周波数と高域側の周波数とを求める帯域幅検出手段と、
前記音声信号における信号レベルと、前記音楽信号における信号レベルとのレベル差を求めるレベル差検出手段と、
前記低域側の周波数から前記高域側の周波数までの帯域幅における前記音楽信号の信号レベルを、前記レベル差に対応するレベルだけ低減させる帯域制御手段と
を備えることを特徴とする自動音量制御装置。
前記帯域幅検出手段は、
前記マイクにより取得された音声信号に対して高速フーリエ変換を適用し、求められた音声信号の振幅値をＦＦＴサンプル毎に累積して累積分布を求める累積分布算出手段と、
求められた累積分布に対して前記音声信号における下限の周波数を決定するための低域スレッショルドと、前記音声信号における上限の周波数を決定するための高域スレッショルドとを、前記累積分布の累積確率に応じて設定するスレッショルド設定手段と、
前記低域スレッショルドに対応する前記音声信号の周波数を低域側の周波数として求めると共に、高域スレッショルドに対応する前記音声信号の周波数を高域側の周波数として求める帯域幅判定手段と
を有することを特徴とする請求項１に記載の自動音量制御装置。
前記帯域制御手段は、
前記帯域幅検出手段により求められた前記低域側の周波数をカットオフ周波数として、前記低域側の周波数以下の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるローシェルフフィルタ手段と、
前記帯域幅検出手段により求められた前記高域側の周波数をカットオフ周波数として、前記高域側の周波数以上の信号レベルを、前記レベル差検出手段により求められたレベル差に対応する信号レベルだけ棚状に増幅させるハイシェルフフィルタ手段と、
前記ローシェルフフィルタ手段および前記ハイシェルフフィルタ手段により棚状に信号レベルが増幅された音楽信号を、増幅された前記信号レベル分だけ全体的に信号レベルを低減させる信号レベル低減手段と
を有することを特徴とする請求項１または請求項２に記載の自動音量制御装置。
前記レベル差検出手段は、
前記音楽信号の帯域幅を一般的な音楽信号の帯域幅に制限する帯域制限手段と、
前記マイクを介して取得された前記音声信号の信号レベルと、前記帯域制限手段により帯域幅の制限が行われた音楽信号の信号レベルとのレベル差を求めるレベル差算出手段と
を有することを特徴とする請求項１乃至請求項３のいずれか１項に記載の自動音量制御装置。