JP2017009657A

JP2017009657A - 音声強調装置、および音声強調方法

Info

Publication number: JP2017009657A
Application number: JP2015122045A
Authority: JP
Inventors: 一博中臺; Kazuhiro Nakadai; 武志水本; Takeshi Mizumoto; 圭佑中村; Keisuke Nakamura; 将行瀧ヶ平; Masayuki Takigahira
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2015-06-17
Filing date: 2015-06-17
Publication date: 2017-01-12
Anticipated expiration: 2035-06-17
Also published as: US9875755B2; JP6439174B2; US20160372132A1

Abstract

【課題】雑音抑圧を適切に行うことができる音声強調装置、および音声強調方法を提供することを目的とする。【解決手段】音声強調装置は、音響信号を収音する収音部と、車両の状態を監視する車両状態監視部と、収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部と、収音された音響信号から、ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部と、を備え、ノイズ推定部は、車両状態監視部によって監視された結果に基づいて、累積ヒストグラムをリセットする。【選択図】図１

Description

本発明は、音声強調装置、および音声強調方法に関する。

音響信号に含まれるノイズ成分を抑圧する音声強調装置がある。例えば、ハンズフリー通話や野外での通話を行う携帯電話などへ音声強調装置を適用することが提案されている。

このような音声強調装置では、音検出部によって収音された音響信号に対して周波数毎に、パワー毎の累積ヒストグラムを生成し、生成した累積ヒストグラムに基づいてノイズレベルを推定する。そして、音声強調装置は、収音された音響信号に含まれる音声信号から、推定したノイズレベルに基づくノイズ成分をスペクトル減算によって音声強調を行う（例えば、特許文献１参照）。なお、スペクトル減算とは、周波数毎に音声信号からノイズ成分を減算する処理である。

特開２０１２−８８４０４号公報

しかしながら、特許文献１に記載の技術を、例えば、ノイズ成分の状態が変化する車両に適用した場合には、累積ヒストグラムを適切に生成できない可能性がある。なお、車両では、例えばドアが開いている状態、ドアが閉められている状態等に応じて、ノイズ成分が変化する。特許文献１に記載の技術では、このようにノイズ成分が変化する環境において雑音抑圧を適切に行えない可能性があった。

本発明は上記の点に鑑みてなされたものであり、雑音抑圧を適切に行うことができる音声強調装置、および音声強調方法を提供することを目的とする。

（１）上記目的を達成するため、本発明の一態様に係る音声強調装置は、音響信号を収音する収音部と、車両の状態を監視する車両状態監視部と、前記収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部と、前記収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部と、を備え、前記ノイズ推定部は、前記車両状態監視部によって監視された結果に基づいて、前記累積ヒストグラムをリセットする。

（２）また、本発明の一態様に係る音声強調装置において、前記ノイズ推定部は、前記車両状態監視部によって監視された結果が変化したとき、前記累積ヒストグラムをリセットするようにしてもよい。

（３）また、本発明の一態様に係る音声強調装置は、前記車両の状態毎の前記累積ヒストグラムが記憶されているヒストグラム記憶部を備え、前記ノイズ推定部は、前記リセットした後、前記車両状態監視部によって監視された結果に基づいて、前記ヒストグラム記憶部から前記車両の状態に応じた周波数成分毎の前記累積ヒストグラムを読み出し、読み出した周波数成分毎の前記累積ヒストグラムを用いて周波数成分毎に雑音成分を推定するようにしてもよい。

（４）また、本発明の一態様に係る音声強調装置において、前記ヒストグラム記憶部には、前記車両の状態に、前記累積ヒストグラムにおける雑音成分を判別するための閾値が対応付けられ、前記ノイズ推定部は、前記ヒストグラム記憶部に記憶されている前記閾値を用いて、周波数成分毎に雑音成分を推定するようにしてもよい。

（５）また、本発明の一態様に係る音声強調装置において、前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両が発進および停止のうち、少なくとも１つが行われたときであるようにしてもよい。
（６）また、本発明の一態様に係る音声強調装置において、前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両のドアの開閉があったときであるようにしてもよい。
（７）また、本発明の一態様に係る音声強調装置において、前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両の窓の開閉があったときであるようにしてもよい。

（８）上記目的を達成するため、本発明の一態様に係る音声強調方法は、収音部が、音響信号を収音する収音手順と、車両状態監視部が、車両の状態を監視する車両状態監視手順と、ノイズ推定部が、前記収音手順によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定し、前記車両状態監視手順によって監視された結果に基づいて、前記累積ヒストグラムをリセットするノイズ推定手順と、音声強調部が、前記収音手順によって収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調手順と、を含む。

上述した（１）、（８）の構成によれば、車両の状態が変化する場合であっても雑音抑圧を適切に行うことができる。
また、上述した（２）の構成によれば、車両内のノイズ状態が変化する環境においても雑音抑圧を適切に行うことができる。
また、上述した（３）の構成によれば、環境が変化したときであっても、ヒストグラム記憶部に記憶されている累積ヒストグラムを用いて、直ちに雑音抑圧を適切に行うことができる。

また、上述した（４）の構成によれば、雑音と発話のパワーの大小関係が変化したときであっても、雑音抑圧を適切に行うことができる。
また、上述した（５）、（６）、（７）の構成によれば、車両の状態によって車両内の雑音成分の大小関係が変化する環境においても雑音抑圧を適切に行うことができる。

実施形態に係る音響強調装置の構成を表すブロック図である。実施形態に係るヒストグラム記憶部に車両の状態に対応付けられて記憶されている情報の例を表す図である。実施形態に係る音響強調装置が行う処理のフローチャートである。実施形態に係るヒストグラム更新部によって作成される雑音成分と発話のパワーレベルとの差が大きい場合のヒストグラムと累積ヒストグラムを説明する図である。実施形態に係るヒストグラム更新部よって作成される雑音成分と発話のパワーレベルとの差が小さい場合のヒストグラムと累積ヒストグラムを説明する図である。実施形態に係るノイズ推定部の処理手順を表す図である。実施形態に係るヒストグラム更新部が行う累積ヒストグラムのリセット、変更、更新の処理のフローチャートである。実施形態に係る車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングを説明するための図である。

以下、図面を参照しながら本発明の実施形態について説明する。また、以下の説明では、音声強調装置を車両に設置する例について説明を行う。

＜音声強調装置の構成＞
図１は、本実施形態に係る音響強調装置１の構成を表すブロック図である。
図１に示すように、音響強調装置１は、収音部１１、音響信号取得部１２、音源定位部１３、音源分離部１４、車両状態監視部１５、ヒストグラム記憶部１６、ノイズ推定部１７、音声強調部１８、音声区間検出部１９、および音声認識部２０を備える。音響強調装置１は、車両２に搭載されている。車両２は、ＥＣＵ２０１およびＣＡＮ２０２を備える。なお、以下の説明では、話者が１人であり、車両２の運転者である例を説明する。

ＥＣＵ（ＥｌｅｃｔｒｏｎｉｃＣｏｎｔｒｏｌＵｎｉｔ；電子制御ユニット）２０１は、利用者によって車両２内の各機能が操作されたことを検出し、検出した結果に応じて車両２を制御する。各機能とは、パワーウィンドの開閉、ドアの開閉、ブレーキの操作等である。ＥＣＵ２０１は、検出した結果を示す車両情報を、ＣＡＮ２０２を介して音響強調装置１に出力する。なお、検出情報には、車両の状態を示す情報が含まれている。ここで、車両の状態とは、パワーウィンドが開かれた状態または閉じられた状態、ドアが開かれた状態または閉じられた状態、ブレーキが停止状態または発信状態等のうちの１つの状態である。
ＣＡＮ（ＣｏｎｔｒｏｌＡｒｅａＮｅｔｗｏｒｋ）２０２は、ＣＡＮ規格に準拠した相互接続された機器間のデータ転送に用いられるネットワークである。

収音部１１は、マイクロホンであり、マイクロホン１０１−１〜１０１−Ｎ（Ｎは２以上の整数）を備える。なお、収音部１１は、例えばマイクロフォンアレイである。収音部１１は、例えば、車両２の運転席と助手席との間に取り付けられている。なお、マイクロホン１０１−１〜１０１−Ｎのうちいずれか１つを特定しない場合は、マイクロホン１０１という。収音部１１は、収音した音響信号を電気信号に変換して、変換した音響信号を音響信号取得部１２に出力する。なお、収音部１１は、収録したＮチャネルの音響信号を音響信号取得部１２に無線で送信してもよいし、有線で送信してもよい。送信の際にチャネル間で音響信号が同期していればよい。

音響信号取得部１２は、収音部１１のＮ個のマイクロホン１０１によって収録されたＮ個の音響信号を取得し、取得したＮ個の音響信号を音源定位部１３および音源分離部１４に出力する。

音源定位部１３には、方位毎にマイクロホン１０１から所定の位置までの伝達関数が記憶されている。音源定位部１３は、音響信号取得部１２から入力されたＮ個の音響信号に対して、自部に記憶されている伝達関数を用いて音源の方位角の推定（音源定位を行うともいう）を行う。音源定位部１３は、推定した音源の方位角情報を音源分離部１４に出力する。音源定位部１３は、例えば、ＭＵＳＩＣ（ＭＵｌｔｉｐｌｅＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎ）法を用いて方位角を推定する。なお、方位角の推定には、ビームフォーミング（Ｂｅａｍｆｏｒｍｉｎｇ）法、ＷＤＳ−ＢＦ（ＷｅｉｇｈｔｅｄＤｅｌａｙａｎｄＳｕｍＢｅａｍＦｏｒｍｉｎｇ；重み付き遅延和ビームフォーミング）法、一般化特異値展開を用いたＭＵＳＩＣ（ＧＳＶＤ−ＭＵＳＩＣ；ＧｅｎｅｒａｌｉｚｅｄＳｉｎｇｕｌａｒＶａｌｕｅＤｅｃｏｍｐｏｓｉｔｉｏｎ−ＭｕｌｔｉｐｌｅＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎ）法等の他の音源方向推定方式を用いてもよい。

音源分離部１４には、方位毎にマイクロホン１０１から所定の位置までの伝達関数が記憶されている。音源分離部１４は、音響信号取得部１２が出力したＮ個の音響信号と、音源定位部１３が出力した音源の方位角情報を取得する。音源分離部１４は、自部に記憶されている伝達関数のうち、取得した方位角に対応する伝達関数を読み出す。音源分離部１４は、読み出した伝達関数と、例えばブラインド分離とビームフォーミングのハイブリッドである例えばＧＨＤＳＳ−ＡＳ（ＧｅｏｍｅｔｒｉｃａｌｌｙｃｏｎｓｔｒａｉｎｅｄＨｉｇｈｏｒｄｅｒＤｅｃｏｒｒｅｌａｔｉｏｎｂａｓｅｄＳｏｕｒｃｅＳｅｐａｒａｔｉｏｎｗｉｔｈＡｄａｐｔｉｖｅＳｔｅｐｓｉｚｅｃｏｎｔｒｏｌ）法を用いて取得したＮ個の音響信号から話者の音声信号ｙ（ｔ）を分離する。なお、音源分離部１４は、ビームフォーミング法等を用いて、音源分離処理を行ってもよい。音源分離部１４は、分離した音源毎の音声信号ｙ（ｔ）をノイズ推定部１７に出力する。

車両状態監視部１５は、車両２が出力した車両情報に含まれている車両の状態を示す情報を抽出する。車両状態監視部１５は、抽出した車両の状態を示す情報に基づいて、車両の状態が変化したことを検出した場合、累積ヒストグラム（頻度分布）をリセットし、ヒストグラム記憶部１６から車両の状態に対応するデフォルトの累積ヒストグラムを読み出すリセット指示を生成する。車両状態監視部１５は、生成したリセット指示をノイズ推定部１７に出力する。なお、リセット指示には、車両の状態を示す情報が含まれている。

ヒストグラム記憶部１６には、図２に示すように車両の状態毎にデフォルトの累積ヒストグラムと、後述する閾値Ｓ_ｘとが対応つけられて記憶されている。

図２は、本実施形態に係るヒストグラム記憶部１６に車両の状態に対応付けられて記憶されている情報の例を表す図である。図２に示すように、例えばパワーウィンド（窓）が開かれた状態に、デフォルト１の累積ヒストグラムと、閾値Ｓ_ｘ１とが対応付けられている。また、パワーウィンドが閉じられた状態に、デフォルト２の累積ヒストグラムと、閾値Ｓ_ｘ２とが対応付けられている。なお、デフォルトの累積ヒストグラムそれぞれは、周波数毎の累積ヒストグラムから構成されている。なお、図２に示した例は一例であり、車両の状態は、これに限られない。例えば、パワーウィンドが開いている割合毎にデフォルトの累積ヒストグラムが対応付けられていてもよく、車両の走行速度毎にデフォルトの累積ヒストグラムが対応付けられていてもよい。

図１に戻って、音響強調装置１の説明を続ける。
ノイズ推定部１７は、パワー算出部１７１、雑音推定部１７２、およびヒストグラム更新部１７３を備える。

パワー算出部１７１は、音源分離部１４が出力した音源毎の音声信号ｙ（ｔ）を、周波数領域で表された複素入力スペクトルＹ（ｋ，ｌ）に変換する。なお、ｋは、周波数を表すインデックスである。ｌは、各フレームを表すインデックスである。例えば、パワー算出部１７１は、音響信号ｙ（ｔ）について、例えば、フレームｌ毎に離散フーリエ変換（ＤＦＴ：ＤｉｓｃｒｅｔｅＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）を行う。パワー算出部１７１は、音響信号ｙ（ｔ）に窓関数（例えば、ハミング窓）を乗算して、窓関数が乗算された音声信号について周波数領域で表された複素入力スペクトルＹ（ｋ，ｌ）に変換してもよい。
パワー算出部１７１は、複素入力スペクトルＹ（ｋ，ｌ）に基づいてパワースペクトル｜Ｙ（ｋ，ｌ）｜^２を音源毎に算出する。以下の説明では、パワースペクトルを単にパワーと呼ぶことがある。ここで、｜…｜は、複素数…の絶対値を示す。パワー算出部１７１は、算出した音源毎のパワースペクトル｜Ｙ（ｋ，ｌ）｜^２を雑音推定部１７２、ヒストグラム更新部１７３、および音声強調部１８に出力する。

雑音推定部１７２は、パワー算出部１７１から入力された音源毎のパワースペクトル｜Ｙ（ｋ，ｌ）｜^２に含まれる雑音成分のパワースペクトルλ（ｋ，ｌ）を、ヒストグラム更新部１７３によって更新された累積ヒストグラムを用いて音源毎に算出する。以下の説明では、雑音パワースペクトルλ（ｋ，ｌ）を雑音パワーλ（ｋ，ｌ）と呼ぶことがある。雑音推定部１７２は、例えば、ＨＲＬＥ（Ｈｉｓｔｏｇｒａｍ−ｂａｓｅｄＲｅｃｕｒｓｉｖｅＬｅｖｅｌＥｓｔｉｍａｔｉｏｎ）法（例えば、参考文献１参照）によって、累積ヒストグラムを用いて雑音パワーλ（ｋ，ｌ）を周波数毎に算出する。雑音推定部１７２は、算出した音源毎の雑音パワーλ（ｋ，ｌ）を音声強調部１８に出力する。ＨＲＬＥ法では、対数領域におけるパワースペクトル｜Ｙ（ｋ，ｌ）｜^２のヒストグラムを周波数毎に算出し、その累積分布と予め定めた閾値Ｓ_ｘに基づいて雑音パワーλ（ｋ，ｌ）を周波数毎に算出する。ＨＲＬＥ法を用いて雑音パワーλ（ｋ，ｌ）を算出する処理については後述する。

［参考文献１］ロボット聴覚〜高雑音下でのハンズフリー音声認識〜」、中臺一博、奥乃博、電子情報通信学会、信学技報、２０１１

ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に応じて、雑音推定に用いる周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部１７３は、リセット指示に含まれている車両の状態に応じたデフォルトの周波数毎の累積ヒストグラムをヒストグラム記憶部１６から読み出して、雑音推定に用いる周波数毎の累積ヒストグラムを変更する。また、ヒストグラム更新部１７３は、車両の状態が変化しない期間、パワー算出部１７１が出力するパワースペクトルを用いて、周波数毎の累積ヒストグラムそれぞれの更新を行う。なお、累積ヒストグラムについては後述する。

音声強調部１８は、パワー算出部１７１が出力したパワースペクトル｜Ｙ（ｋ，ｌ）｜^２から、ノイズ推定部１７が出力した雑音パワーλ（ｋ，ｌ）を周波数毎に減算または減算に相当する演算を行うことで、雑音成分を抑圧した音声信号のスペクトル（複素雑音除去スペクトル）を算出する。これにより、音声強調部１８は、音源分離処理では分離しきれない、例えば拡散性雑音などの雑音成分を音声信号に対して抑圧する。
音声強調部１８は、例えばパワースペクトル｜Ｙ（ｋ，ｌ）｜^２と雑音パワーλ（ｋ，ｌ）とを用いて、利得Ｇ_ＳＳ（ｋ，ｌ）を、例えば次式（１）を用いて算出する。

式（１）において、ｍａｘ（α，β）は、実数αとβのうち大きい方の数を与える関数を示す。βは、予め定めた利得Ｇ_ＳＳ（ｋ，ｌ）の最小値である。ここで、関数ｍａｘの左側（実数αの側）は、フレームｌにおける周波数ｋに係る雑音成分が除去されたパワースペクトル｜Ｙ（ｋ，ｌ）｜^２−λ（ｋ，ｌ）の、雑音が除去されていないパワースペクトル｜Ｙ（ｋ，ｌ）｜^２の比に対する平方根を示す。音声強調部１８は、パワー算出部１７１が出力した複素入力スペクトルＹ（ｋ，ｌ）に、算出した利得Ｇ_ＳＳ（ｋ，ｌ）を乗算して複素雑音除去スペクトルＸ’（ｋ，ｌ）を算出する。つまり、複素雑音除去スペクトルＸ’（ｋ，ｌ）は、複素入力スペクトルＹ（ｋ，ｌ）からその雑音成分を示す雑音パワーが減算（抑圧）された複素スペクトルを示す。音声強調部１８は、算出した複素雑音除去スペクトルＸ’（ｋ，ｌ）を時間領域の雑音除去信号ｘ’（ｔ）に変換する。ここで、音声強調部１８は、フレームｌ毎に複素雑音除去スペクトルＸ’（ｋ，ｌ）に対して、例えば逆離散フーリエ変換（ＩｎｖｅｒｓｅＤｉｓｃｒｅｔｅＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ、ＩＤＦＴ）を行って、雑音除去信号ｘ’（ｔ）を算出する。音声強調部１８は、変換した雑音除去信号ｘ’（ｔ）を音声区間検出部１９に出力する。なお、雑音除去信号ｘ’（ｔ）は、音響信号ｙ（ｔ）からノイズ推定部１７で推定された雑音成分が所定の抑圧量で抑圧された音響信号である。
なお、音声強調部１８は、スペクトル減算を行うことによって、雑音成分を抑圧するようにしてもよい。この場合、音源分離部１４は、周波数毎に分離された音声信号を音声強調部１８に出力する。そして、音声強調部１８は、音源分離部１４が出力した音声信号から、ノイズ推定部１７が出力した雑音パワーλ（ｋ，ｌ）を周波数毎にスペクトル減算を行って、雑音除去信号ｘ’（ｔ）を算出するようにしてもよい。

音声区間検出部１９は、音声強調部１８が出力した雑音除去信号ｘ’（ｔ）から、有音区間であるフレームを検出する。音声区間検出部１９は、検出した有音区間であるフレームの雑音除去信号ｘ’（ｔ）を音声認識部２０に出力する。

音声認識部２０は、音声区間検出部１９が出力した雑音除去信号ｘ’（ｔ）について音声認識処理を行い、発話内容、例えば音韻列や単語を認識する。音声認識部２０は、例えば、音響モデルである隠れマルコフモデル（ＨＭＭ：ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ）と単語辞書を備える。音声認識部２０は、補助雑音付加信号ｘ’（ｔ）について音響特徴量、例えば、静的メル尺度対数スペクトル（ＭＳＬＳ：Ｍｅｌ−ＳｃａｌｅＬｏｇＳｐｅｃｔｒｕｍ）、デルタＭＳＬＳ及び１個のデルタパワーを、所定時間（例えば、１０ｍｓ）毎に算出する。音声認識部２０は、算出した音響特徴量から音響モデルを用いて音韻を定め、定めた音韻からなる音韻列から単語辞書を用いて単語を認識する。音声認識部２０は、認識した認識結果を外部装置（不図示）に出力する。外部装置は、例えばカーナビゲーションシステム等である。

なお、上述した例では、話者が１人の例を説明したが、これに限られない。話者が複数の場合、音源定位部１３、音源分離部１４、ノイズ推定部１７、音声強調部１８、音声区間検出部１９、および音声認識部２０は、話者毎に上述した処理を行う。
また、上述した例では、音声区間検出部１９が、有音区間を検出する例を説明したが、有音区間を検出しなくてもよい。この場合、音声強調部１８は、雑音除去信号ｘ’（ｔ）を音声認識部２０に出力するようにしてもよい。

また、音声認識部２０は、音声強調部１８が出力した雑音除去信号ｘ’（ｔ）から、音響特徴量である例えばＭＳＬＳを抽出するようにしてもよい。なお、ＭＳＬＳは、音響認識の特徴量としてスペクトル特徴量を用い、ＭＦＣＣ（メル周波数ケプストラム係数；ＭｅｌＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒｕｍＣｏｅｆｆｉｃｉｅｎｔ）を逆離散コサイン変換することによって得られる。音声認識部２０は、抽出した音響特徴量に基づいて、音声認識するようにしてもよい。

＜音響強調装置１が行う処理手順＞
次に、音響強調装置１が行う処理手順の例を説明する。
図３は、本実施形態に係る音響強調装置１が行う処理のフローチャートである。
（ステップＳ１）音響信号取得部１２は、収音部１１のＮ個のマイクロホン１０１によって収録されたＮ個の音響信号を取得する。

（ステップＳ２）音源定位部１３は、音響信号取得部１２から入力されたＮ個の音響信号に対して、自部に記憶されている伝達関数と、例えばＭＵＳＩＣ法を用いて音源定位を行う。
（ステップＳ３）音源分離部１４は、自部に記憶されている伝達関数のうち、取得した方位角に対応する伝達関数を読み出す。続けて、音源分離部１４は、読み出した伝達関数と、音源分離部１４は、取得したＮ個の音響信号から、例えばＧＨＤＳＳ−ＡＳ法を用いて音声信号を分離する。

（ステップＳ４）ノイズ推定部１７は、車両状態監視部１５が出力したリセット指示に応じて変更したデフォルトの累積ヒストグラムを用いて、音声信号に含まれる雑音成分の雑音パワーλ（ｋ，ｌ）を周波数毎に推定する。
（ステップＳ５）音声強調部１８は、パワー算出部１７１が出力したパワースペクトル｜Ｙ（ｋ，ｌ）｜^２から、ノイズ推定部１７が出力した雑音パワーλ（ｋ，ｌ）を、分離された音声信号毎かつ周波数毎に減算または減算に相当する演算を行うことで、雑音成分を抑圧した雑音除去信号ｘ’（ｔ）を算出する。これにより、音声強調部１８は、音声信号に対して雑音成分を抑圧する。

（ステップＳ６）音声区間検出部１９は、有音区間であるフレームの雑音除去信号ｘ’（ｔ）を音声認識部２０に出力する。続けて、音声認識部２０は、音声区間検出部１９が出力した有音区間であるフレームの雑音除去信号ｘ’（ｔ）を用いて、周知技術によって音声認識する。
音響強調装置１は、例えば、車両２のイグニッションキーがオン状態の間、以上の処理をフレーム毎に行う。

＜ヒストグラム、累積ヒストグラム＞
次に、ノイズ推定部１７が用いるヒストグラム、累積ヒストグラムについて説明する。
雑音推定部１７２は、上述したようにＨＲＬＥ法を用いて雑音パワーλ（ｋ，ｌ）を算出する。ＨＲＬＥ法は、ある周波数について、パワー毎の頻度を計数してヒストグラムを生成し、生成したヒストグラムにおいて計数した頻度をパワーについて累積した累積頻度を算出し、予め定めた閾値Ｓ_ｘを与えるパワーを雑音パワーと定める方法である。この閾値Ｓ_ｘは、収録された音響信号に含まれる背景雑音の雑音パワーを定める変数、言い換えれば音声強調部１８で減算（抑圧）される雑音成分の抑圧量を制御するための制御変数である。従って、閾値Ｓ_ｘが大きいほど、推定される雑音パワーが大きくなり、閾値Ｓ_ｘが小さいほど、推定される雑音パワーが小さくなる。

図４は、本実施形態に係るヒストグラム更新部１７３によって作成される雑音成分と発話のパワーレベルとの差が大きい場合のヒストグラムと累積ヒストグラムを説明する図である。図４のヒストグラムｇ１０１において、横軸はパワーレベルＬ［ｄＢ］であり、縦軸はパワーレベルの個数（頻度ともいう）Ｎ（Ｌ）である。
ヒストグラムｇ１０１に示す例において、Ｌ_０は、パワーレベルの最小値を表し、Ｌ_１００は、パワーレベルの最大値を表している。例えば、車両２のパワーウィンドが閉められ、かつドアが閉められ、ブレーキが走行状態である車両の状態では、ヒストグラムｇ１０１に示すように、雑音成分（以下、単に雑音ともいう）と発話のパワーレベルとの差が大きい。また、ヒストグラムｇ１０１は、パワーの区間毎かつ周波数毎の頻度を示す。頻度は、所定の時間におけるフレーム毎に、算出されたパワー（スペクトル）があるパワーの区間に属すると判定された回数であり、度数とも呼ばれる。

ヒストグラム更新部１７３は、生成したヒストグラムをリセット指示が入力されるまで逐次累積することで、図４の累積ヒストグラムｇ１０２を生成する。累積ヒストグラムｇ１０２において、横軸はパワーレベルＬ［ｄＢ］であり、縦軸は累積したパワーレベルの個数（累積頻度ともいう）Ｓ（Ｌ）である。また、Ｌ_ｘのｘは、累積ヒストグラムｇ１０２の横軸上の位置を表す。また、累積ヒストグラムｇ１０２に示す累積頻度Ｓ（Ｌ）は、パワーの区間毎に、ヒストグラムｇ１０１に示す頻度を最も左側に示されている区間から順次累積した値である。累積頻度Ｓ（Ｌ）は、累積度数とも呼ばれる。
なお、閾値Ｓ_ｘは、累積ヒストグラムにおいて累積頻度の最大値Ｓ_ｍａｘに対する所定の比率（例えばｘ／１００）であってもよい。この場合、ヒストグラム更新部１７３は、所定の比率の累積頻度に対応するパワーの大きさＬ_ｘ（ｔ）に基づいて、推定ノイズパワーを算出するようにしてもよい。

図５は、本実施形態に係るヒストグラム更新部１７３によって作成される雑音成分と発話のパワーレベルとの差が小さい場合のヒストグラムと累積ヒストグラムを説明する図である。図５のヒストグラムｇ１１１における横軸と縦軸は図４のヒストグラムｇ１０１と同様であり、累積ヒストグラムｇ１１２における横軸と縦軸は図４のヒストグラムｇ１０２と同様である。
パワーウィンドが開いている車両の状態では、図５のヒストグラムｇ１１１のように、パワーウィンドが閉じているときより、雑音のパワーレベルが大きくなるので、雑音成分と発話のパワーレベルとの差が小さい。

なお、図４の累積ヒストグラムｇ１０２、図５の累積ヒストグラムｇ１１２は１つの周波数について示したものであり、車両の状態毎に、周波数毎の累積ヒストグラムが、車両の状態に対応付けられてヒストグラム記憶部１６に記憶されている。このような累積ヒストグラムは、車両の状態毎かつ周波数毎に予め測定して、測定の結果を用いて生成され、生成された累積ヒストグラムを車両の状態毎かつ周波数毎にヒストグラム記憶部１６に記憶させておく。

ここで、車両の状態が変化した場合の例を説明する。
例えば、パワーウィンドが閉じられている状態から、パワーウィンドが開けられた状態に変化したとき、雑音のパワーレベルが大きくなる。これにより、累積ヒストグラムの形状が図４のｇ１０２から図５のｇ１１２のように変化し、雑音と発話とを分けるための閾値Ｓ_ｘの値も変化する。しかしながら、パワーウィンドが開けられた状態に変化した後に、パワーウィンドが閉じられている状態の累積ヒストグラムを更新しながら用いた場合は、累積ヒストグラムが適切ではなくなり、閾値Ｓ_ｘの値も適切ではなくなるため、適切に雑音成分のパワーレベルを推定することが困難になる。
このため、本実施形態では、車両の状態が変化したとき、雑音成分を推定するために用いる累積ヒストグラムをリセットし、ヒストグラム記憶部１６に記憶されている車両の状態に対応付けられているデフォルトの累積ヒストグラムに変更する。これにより、車両の状態が変化した場合であっても、雑音成分のパワーを適切に推定することができる。なお、累積ヒストグラムは、周波数毎に変更される。

なお、車両の状態が複数の場合、ヒストグラム更新部１７３は、自部に記憶されている優先度に応じて、車両の状態のうちの１つを選択するようにしてもよい。
例えば、ブレーキが発進の状態、ドアが閉じている状態、パワーウィンドが開いている状態の場合、パワーウィンドが開いていることによって雑音成分が増加するため、ヒストグラム更新部１７３は、複数の車両の状態を示す情報のうち、パワーウィンドが開いている情報に応じたデフォルト１の累積ヒストグラムを選択する。このように、雑音成分に与える影響が最も高い車両の状態の優先度を高く設定しておいてもよい。
または、車両の状態の組み合わせ毎に、デフォルトの累積ヒストグラム、雑音成分と発話のパワーの大小関係、および閾値Ｓ_ｘを対応付けてヒストグラム記憶部１６に記憶させておいてもよい。

＜ノイズ推定処理＞
次に、図３のステップＳ４において、雑音推定部１７２およびヒストグラム更新部１７３が行うノイズ推定処理について説明する。
なお、以下の説明において、式の簡素化のため周波数を省略して説明するが、パラメータを除く変数は周波数の関数であり、周波数毎に独立して同じ処理が行われる。また、雑音推定部１７２は、車両状態監視部１５からリセット指示が入力されたのち、次のリセット指示が入力されるまで、以下の処理を繰り返す。
図６は、本実施形態に係るノイズ推定部１７の処理手順を表す図である。

（ステップＳ１０１）ヒストグラム更新部１７３は、パワー算出部１７１から入力されたパワースペクトル｜Ｙ（ｋ，ｌ）｜^２に基づき対数スペクトルＹ_Ｌ（ｋ，ｌ）を、次式（２）によって算出する。

（ステップＳ１０２）ヒストグラム更新部１７３は、対数スペクトルＹ_Ｌ（ｋ，ｌ）が属するインデックスＩ_ｙ（ｋ、ｌ）を次式（３）によって定める。なお、ヒストグラム更新部１７３は、パワーからインデクスへの変換を、計算量を削減するため変換テーブルを使用して行うようにしてもよい。

なお、式（３）において、ｆｌｏｏｒ（…）は、実数…、又は…よりも小さい最大の整数を与える床関数（ｆｌｏｏｒｆｕｎｃｔｉｏｎ）である。Ｌ_ｍｉｎは、予め定められた対数スペクトルＹ_Ｌ（ｋ，ｌ）の最小レベルを表す。Ｌ_ｓｔｅｐは、ビン（ｂｉｎ）一つ分のレベル幅を表し、予め定められた階級毎のレベル幅を表す。

（ステップＳ１０３）ヒストグラム更新部１７３は、次式（４）によって、ヒストグラムの各頻度Ｎ（ｔ、ｉ）を算出する。

式（４）において、αは、時間減衰係数（ｔｉｍｅｄｅｃａｙｐａｒａｍｅｔｅｒ）である。ここで、α＝１−｛１／（Ｔｒ・Ｆｓ）｝である。ここで、Ｔｒは、予め定めた時定数（ｔｉｍｅｃｏｎｓｔａｎｔ）であり、Ｆｓは、サンプリング周波数である。δ（…）は、ディラックのデルタ関数（Ｄｉｒａｃ’ｓｄｅｌｔａｆｕｎｃｔｉｏｎ）である。即ち、度数Ｎ（ｋ，ｌ，ｉ）は、前フレームｌ−１における階級Ｉ_ｙ（ｋ，ｌ）に対する度数Ｎ（ｋ，ｌ−１，ｉ）にαを乗じて減衰させた値に、１−αを加算して得られる。これにより、階級Ｉ_ｙ（ｋ，ｌ）に対する度数Ｎ（ｋ，ｌ，Ｉ_ｙ（ｋ，ｌ））が加算される。

（ステップＳ１０４）ヒストグラム更新部１７３は、最下位の階級０から階級ｉまで度数Ｎ（ｋ，ｌ，ｉ）を加算して、累積度数Ｓ（ｋ，ｌ，ｉ）を次式（５）によって算出することによって、累積ヒストグラムを生成、更新する。

このようにして作成された累積ヒストグラムは、データの古さにしたがって重みが小さくなるように構成されている。

（ステップＳ１０５）雑音推定部１７２は、車両の状態に応じた閾値Ｓ_ｘを、ヒストグラム記憶部１６から読み出す。続けて、雑音推定部１７２は、閾値Ｓ_ｘに対応する累積度数Ｓ（ｋ，ｌ，Ｉ_ｍａｘ）・Ｓ_ｘに最も近似する累積度数Ｓ（ｋ，ｌ，ｉ）を与える階級ｉを、推定階級Ｉ_ｘ（ｋ，ｌ）として次式（６）のように定める。なお、閾値Ｓ_ｘの値は、車両の状態が異なっていても同じ値であってもよい。

式（６）において、ａｒｇｍｉｎ_ｉ［…］は、…を最小とするｉを与える関数である。

（ステップＳ１０６）雑音推定部１７２は、車両の状態に応じて、ヒストグラム記憶部１６に記憶されている雑音成分と発話のパワーの大小関係を読み出す。続けて、雑音推定部１７２は、次式（７）によって、推定階級Ｉ_ｘ（ｋ，ｌ）を対数レベルλ_ＨＲＬＥ（ｋ，ｌ）に換算する。

（ステップＳ１０７）雑音推定部１７２は、次式（８）によって、線形領域に変換して雑音パワーλ（ｋ，ｌ）を算出する。

なお、上述した例では、ステップＳ１０３でヒストグラムを計算した後に、ステップＳ１０４で累積ヒストグラムを計算する例を説明したが、これに限られない。ヒストグラム更新部１７３は、ステップＳ１０３の処理を行わずに、ステップＳ１０４において、式（５）に式（４）を代入して直接、累積ヒストグラムを計算、更新するようにしてもよい。
また、パラメータＬ_ｍｉｎ、Ｌ_ｓｔｅｐ、Ｉ_ｍａｘそれぞれの値は、例えば−１００ｄＢ、０．２ｄＢ、１０００である。また、時程数Ｔ_ｒは、例えば１０秒である。これらのパラメータは、デフォルトの累積ヒストグラム毎に異なっていてもよい。

＜累積ヒストグラムのリセット、変更、更新の処理手順＞
次に、ヒストグラム更新部１７３が行う累積ヒストグラムのリセット、変更、更新の処理手順について説明する。
図７は、本実施形態に係るヒストグラム更新部１７３が行う累積ヒストグラムのリセット、変更、更新の処理のフローチャートである。

（ステップＳ２０１）ヒストグラム更新部１７３は、リセット指示が車両状態監視部１５から入力されたか否かを判別する。ヒストグラム更新部１７３は、リセット指示が入力された判別した場合（ステップＳ２０１；ＹＥＳ）、ステップＳ２０２に処理を進め、リセット指示が入力されていないと判別した場合（ステップＳ２０１；ＮＯ）、ステップＳ２０１の処理を繰り返す。

（ステップＳ２０２）ヒストグラム更新部１７３は、累積ヒストグラムをリセットする。
（ステップＳ２０３）ヒストグラム更新部１７３は、リセット指示に含まれる車両の状態に応じたデフォルトの累積ヒストグラムを、ヒストグラム記憶部１６から読み出す。続けて、ヒストグラム更新部１７３は、雑音成分の推定に用いる累積ヒストグラムを読み出したデフォルトの累積ヒストグラムに変更する。

（ステップＳ２０４）ヒストグラム更新部１７３は、分離された音声信号に基づいて、ステップＳ２０３で変更された累積ヒストグラムを更新する。
（ステップＳ２０５）ヒストグラム更新部１７３は、リセット指示が車両状態監視部１５から入力されたか否かを判別する。ヒストグラム更新部１７３は、リセット指示が入力された判別した場合（ステップＳ２０５；ＹＥＳ）、ステップＳ２０２に処理を戻し、リセット指示が入力されていないと判別した場合（ステップＳ２０５；ＮＯ）、ステップＳ２０４に処理を戻す。
なお、ヒストグラム更新部１７３は、例えばフレーム毎にステップＳ２０１〜Ｓ２０５の処理を逐次行う。

＜車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングの例＞
次に、車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングの具体例を説明する。
図８は、本実施形態に係る車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングを説明するための図である。図８において、横軸は時刻を表す。
図８に示す例では、時刻ｔ１のときドアが開けられ、時刻ｔ２のときドアが閉められ、時刻ｔ３のときに車両２が発進された例である。

時刻ｔ１において、ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に応じて、周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に含まれる車両の状態を示す情報に応じて、ヒストグラム記憶部１６からデフォルト１（図２）の周波数毎の累積ヒストグラムを読み出し、読み出したデフォルト１の周波数毎の累積ヒストグラムに変更する。
時刻ｔ１〜ｔ２の期間、ヒストグラム更新部１７３は、分離された音声信号に基づいて、デフォルト１の周波数毎の累積ヒストグラムを更新する。雑音推定部１７２は、更新されたデフォルト１の周波数毎の累積ヒストグラムを用いて、雑音成分のパワーレベルを周波数毎に推定する。

時刻ｔ２において、ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に応じて、周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に含まれる車両の状態を示す情報に応じて、ヒストグラム記憶部１６からデフォルト２（図２）の周波数毎の累積ヒストグラムを読み出し、周波数毎の累積ヒストグラムをデフォルト１からデフォルト２に変更する。
時刻ｔ２〜ｔ３の期間、ヒストグラム更新部１７３は、分離された音声信号に基づいて、デフォルト２の周波数毎の累積ヒストグラムを更新する。雑音推定部１７２は、更新されたデフォルト２の周波数毎の累積ヒストグラムを用いて、雑音成分のパワーレベルを周波数毎に推定する。

時刻ｔ３において、ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に応じて、周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部１７３は、車両状態監視部１５が出力したリセット指示に含まれる車両の状態を示す情報に応じて、ヒストグラム記憶部１６からデフォルト６（図２）の周波数毎の累積ヒストグラムを読み出し、周波数毎の累積ヒストグラムをデフォルト２からデフォルト６に変更する。
時刻ｔ３以降、次にリセット指示が入力されるまで、ヒストグラム更新部１７３は、分離された音声信号に基づいて、デフォルト６の周波数毎の累積ヒストグラムを更新する。雑音推定部１７２は、更新されたデフォルト６の周波数毎の累積ヒストグラムを用いて、雑音成分のパワーレベルを周波数毎に推定する。

このように雑音成分を抑圧した音響信号に対して音声認識された認識結果を、例えばカーナビゲーションシステムに出力することで、雑音抑圧された音声信号を用いて、カーナビゲーションの動作を制御することができる。

以上のように、本実施形態の音響強調装置１は、音響信号を収音する収音部１１と、車両の状態を監視する車両状態監視部１５と、収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部１７と、収音された音響信号から、ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部１８と、を備え、ノイズ推定部は、車両状態監視部によって監視された結果に基づいて、累積ヒストグラムをリセットする。

この構成によって、本実施形態の音響強調装置１は、車両の状態を監視した結果に基づいて、ノイズ推定に用いていた累積ヒストグラムをリセットする。これにより、本実施形態の音響強調装置１は、車両の状態に応じて、例えばイグニッションキーによって車両２の電源がオン状態になったとき、リセットされた累積ヒストグラムを用いてノイズ推定を行うことで、過去に更新された累積ヒストグラムの影響を受けない。この結果、本実施形態の音響強調装置１では、車両の状態が変化する場合であっても雑音抑圧を適切に行うことができる。

また、本実施形態の音響強調装置１において、ノイズ推定部１７は、車両状態監視部１５によって監視された結果が変化したとき、累積ヒストグラムをリセットする。
この構成によって、本実施形態の音響強調装置１は、本実施形態の音響強調装置１は、車両の状態が変化した場合に、ノイズ推定に用いていた累積ヒストグラムをリセットする。これにより、本実施形態の音響強調装置１は、車両の状態が変化したとき、車両の状態が変化する前の累積ヒストグラムを用いずにリセットされた累積ヒストグラムを用いてノイズ推定を行う。この結果、本実施形態の音響強調装置１では、車両２内のノイズ状態が変化する環境においても雑音抑圧を適切に行うことができる。

また、本実施形態の音響強調装置１は、車両の状態毎の累積ヒストグラムが記憶されているヒストグラム記憶部１６を備え、ノイズ推定部１７は、リセットした後、車両状態監視部１５によって監視された結果に基づいて、ヒストグラム記憶部から車両の状態に応じた周波数成分毎の累積ヒストグラム（デフォルト１、２、・・・）を読み出し、読み出した周波数成分毎の累積ヒストグラムを用いて周波数成分毎に雑音成分を推定する。

この構成によって、本実施形態の音響強調装置１は、車両の状態に応じた累積ヒストグラムを用いて雑音成分を推定するので、車両２内のノイズ状態が変化する環境においても雑音抑圧を適切に行うことができる。また、本実施形態の音響強調装置１では、車両の状態が変化したとき、ヒストグラムから累積ヒストグラムを新たに生成することなく、ヒストグラム記憶部１６に予め記憶されている車両の状態毎の累積ヒストグラムを用いてノイズ推定を行うことができる。この結果、本実施形態の音響強調装置１では、環境が変化したときであっても、ヒストグラム記憶部に記憶されている累積ヒストグラムを用いて、直ちに雑音抑圧を適切に行うことができる。

また、本実施形態の音響強調装置１において、ヒストグラム記憶部１６には、車両の状態に、前記累積ヒストグラムにおける雑音成分を判別するための閾値Ｓ_ｘが対応付けられ、ノイズ推定部１７は、ヒストグラム記憶部に記憶されている閾値を用いて、周波数成分毎に雑音成分を推定する。

この構成によって、本実施形態の音響強調装置１は、車両の状態毎に予め定められている閾値Ｓ_ｘを用いて、雑音成分のパワーを適切に推定することができる。この結果、本実施形態の音響強調装置１では、雑音と発話のパワーの大小関係が変化したときであっても、雑音抑圧を適切に行うことができる。

また、本実施形態の音響強調装置１において、累積ヒストグラムがリセットされる車両の状態は、車両２が発進および停止のうち、少なくとも１つが行われたときである。
また、本実施形態の音響強調装置１において、累積ヒストグラムがリセットされる車両の状態は、車両２のドアの開閉があったときである。
また、本実施形態の音響強調装置１において、累積ヒストグラムをリセットされる車両の状態は、車両２の窓の開閉があったときである。

この構成によって、本実施形態の音響強調装置１は、車両２が発進、停止、ドアが開閉、窓が開閉されたうちの少なくとも１つのとき、累積ヒストグラムをリセットして、雑音成分を推定する。この結果、本実施形態の音響強調装置１では、車両の状態によって車両２内の雑音成分の大小関係が変化する環境においても雑音抑圧を適切に行うことができる。

また、本実施形態では、車両の状態毎かつ周波数毎に１つの累積ヒストグラムがヒストグラム記憶部１６に記憶されている例を説明したが、これに限られない。例えば、運転席に対応する第１の累積ヒストグラムと、助手席に対応する累積ヒストグラムとが、ヒストグラム記憶部１６に記録されていてもよい。これにより、運転席または助手席に着席している人に合わせて、雑音成分を最適に抑圧することができる。

なお、本実施形態では、音響強調装置１が車両２に取り付けられている例を説明したが、これに限られない。雑音成分と発話のパワーの関係が変化する環境であればよく、例えば列車、飛行機、船舶、家の部屋、店舗等に音響強調装置１を適用することも可能である。
例えば、店舗に適用した場合、店舗のドアの開閉によって雑音成分のパワーが変化する。このような環境であっても、本実施形態によれば、雑音成分の大小関係が変化する環境においても雑音抑圧を適切に行うことができる。

また、例えば、部屋毎に雑音成分が異なる家の部屋に適用した場合、部屋毎に累積ヒストグラムをヒストグラム記憶部１６に記憶させてあるので、各部屋に適した雑音抑圧を行うことができる。これにより、本実施形態によれば、適切に雑音抑圧された音響信号を用いて、家の中で、例えば家電機器の制御を行うことができる。

また、本実施形態の音響強調装置１の一部または全ての構成要素を、スマートフォン、携帯端末、携帯ゲーム機器等によって実現してもよい。また、音響強調装置１が通信機能を有する場合、例えば、ヒストグラム記憶部１６は、ネットワークを介したサーバ装置に格納されていてもよい。

なお、本発明における音響強調装置１の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより雑音成分の推定、音声強調等を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境（あるいは表示環境）を備えたＷＷＷシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（ＲＡＭ）のように、一定時間プログラムを保持しているものも含むものとする。

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

１…音響強調装置、２…車両、１１…収音部、１２…音響信号取得部、１３…音源定位部、１４…音源分離部、１５…車両状態監視部、１６…ヒストグラム記憶部、１７…ノイズ推定部、１８…音声強調部、１９…音声区間検出部、２０…音声認識部、２０１…ＥＣＵ、２０２…ＣＡＮ、１７１…パワー算出部、１７２…雑音推定部、１７３…ヒストグラム更新部

Claims

音響信号を収音する収音部と、
車両の状態を監視する車両状態監視部と、
前記収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部と、
前記収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部と、
を備え、
前記ノイズ推定部は、
前記車両状態監視部によって監視された結果に基づいて、前記累積ヒストグラムをリセットする音声強調装置。
前記ノイズ推定部は、
前記車両状態監視部によって監視された結果が変化したとき、前記累積ヒストグラムをリセットする請求項１に記載の音声強調装置。
前記車両の状態毎の前記累積ヒストグラムが記憶されているヒストグラム記憶部を備え、
前記ノイズ推定部は、
前記リセットした後、前記車両状態監視部によって監視された結果に基づいて、前記ヒストグラム記憶部から前記車両の状態に応じた周波数成分毎の前記累積ヒストグラムを読み出し、読み出した周波数成分毎の前記累積ヒストグラムを用いて周波数成分毎に雑音成分を推定する請求項１または請求項２に記載の音声強調装置。
前記ヒストグラム記憶部には、
前記車両の状態に、前記累積ヒストグラムにおける雑音成分を判別するための閾値が対応付けられ、
前記ノイズ推定部は、
前記ヒストグラム記憶部に記憶されている前記閾値を用いて、周波数成分毎に雑音成分を推定する請求項３に記載の音声強調装置。
前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両が発進および停止のうち、少なくとも１つが行われたときである請求項１から請求項４のいずれか１項に記載の音声強調装置。
前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両のドアの開閉があったときである請求項１から請求項４のいずれか１項に記載の音声強調装置。
前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両の窓の開閉があったときである請求項１から請求項４のいずれか１項に記載の音声強調装置。
収音部が、音響信号を収音する収音手順と、
車両状態監視部が、車両の状態を監視する車両状態監視手順と、
ノイズ推定部が、前記収音手順によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定し、前記車両状態監視手順によって監視された結果に基づいて、前記累積ヒストグラムをリセットするノイズ推定手順と、
音声強調部が、前記収音手順によって収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調手順と、
を含む音声強調方法。