JP5862349B2

JP5862349B2 - ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法

Info

Publication number: JP5862349B2
Application number: JP2012031711A
Authority: JP
Inventors: 孝朗山邊
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2012-02-16
Filing date: 2012-02-16
Publication date: 2016-02-16
Anticipated expiration: 2032-02-16
Also published as: US20130218559A1; CN103260110B; CN103260110A; JP2013168857A

Description

本発明はノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法に関する。

音声信号に含まれるノイズ成分を低減して音声を聞き取りやすくするノイズ低減処理技術がある。ノイズ低減処理技術では、例えば、音声を主に収音するマイクロフォンによって収音された音声信号から、ノイズを主に収音するマイクロフォンによって収音されたノイズ信号（参照信号）を差し引くことで、音声信号に含まれるノイズ成分を除去することができる。

特許文献１には、希望音声の低減を防止して、低減対象の不要音のみを低減するための技術が開示されている。特許文献２には、雑音除去のための適応フィルタによって下がる音声等の明瞭度を改善する技術が開示されている。

特開平６−６７６９２号公報特開平８−１０２６４４号公報

主として音声成分を含む音声信号と主としてノイズ成分を含む参照信号とを用いてノイズ低減処理を実施する場合、ノイズ低減装置の使用状況によっては、参照信号に音声成分も混入する場合がある。このように参照信号に音声成分が混入すると、ノイズ低減処理を実施した際に音声信号に含まれる音声成分もキャンセルされてしまい、ノイズ低減処理後の信号の音圧レベルが低下するという問題があった。

上記課題に鑑み本発明の目的は、音圧レベルの低下を抑制することができるノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法を提供することである。

本発明にかかるノイズ低減装置は、第１の収音信号に基づき音声区間を判定する音声区間判定部と、前記音声区間において、第２の収音信号と前記第１の収音信号とを用いて音声の到来方向を判定する音声方向判定部と、前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減するノイズ低減処理部と、を備え、前記ノイズ低減処理部は、前記音声の到来方向に応じて前記ノイズ低減処理部におけるノイズ低減量を調整する。

前記ノイズ低減処理部は、前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分に対応したノイズ推定信号を生成する適応フィルタと、前記第１の収音信号と前記ノイズ推定信号との演算結果に基づき前記適応フィルタの適応係数を調整する適応係数調整部と、前記音声の到来方向に応じて前記ノイズ推定信号を調整するノイズ低減量調整部と、前記ノイズ低減量調整部で調整された後のノイズ推定信号と前記第１の収音信号とを用いて前記第１の収音信号に含まれるノイズ成分を低減する演算部と、を備えていてもよい。

前記音声方向判定部は、前記第１の収音信号および前記第２の収音信号の位相差に基づき前記音声の到来方向を判定してもよい。

前記音声方向判定部は、前記第１および第２の収音信号のうちの一方を基準信号とする基準信号サンプル群と他方を比較信号とする比較信号サンプル群とを用いて取得された相互相関値から位相差を算出してもよい。

前記ノイズ低減処理部は、前記音声方向判定部において前記第１の収音信号と前記第２の収音信号の位相差が所定の範囲内であると判定された場合、および前記第１の収音信号の位相が前記第２の収音信号の位相よりも遅いと判定された場合の少なくとも一方の場合に、前記ノイズ低減処理部におけるノイズ低減量を低減してもよい。

前記音声方向判定部は、前記第１の収音信号の大きさおよび前記第２の収音信号の大きさの差であるパワー差に基づき前記音声の到来方向を判定してもよい。

前記ノイズ低減処理部は、前記音声方向判定部において前記第１の収音信号の大きさと前記第２の収音信号の大きさとの差であるパワー差が所定の範囲内であると判定された場合、および前記第１の収音信号の大きさが前記第２の収音信号の大きさよりも小さいと判定された場合の少なくとも一方の場合に、前記ノイズ低減処理部におけるノイズ低減量を低減してもよい。

前記音声方向判定部は、前記第１の収音信号および前記第２の収音信号の位相差、並びに前記第１の収音信号の大きさおよび前記第２の収音信号の大きさの差であるパワー差に基づき前記音声の到来方向を判定してもよい。

前記ノイズ低減量調整部は、前記音声の到来方向に応じて前記ノイズ推定信号に０以上１以下の係数を乗算することで前記ノイズ推定信号を調整してもよい。

前記ノイズ低減量調整部は、前記ノイズ推定信号を調整する際に当該ノイズ推定信号が急激に変化することを抑制する緩和処理を実施してもよい。

前記音声区間判定部は、前記第１の収音信号に音声成分が含まれる確率が所定の値以上となった場合に音声区間であると判定してもよい。

前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の母音周波数成分のピークと帯域毎に設定されたノイズレベルとの比が所定の値以上であり、且つ、当該所定の値以上のピークの数が所定数以上である場合に音声区間であると判定してもよい。

前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の子音スペクトルパターンを所定の周波数帯域毎に測定し、前記周波数帯域の増加に従い前記子音スペクトルパターンが増加する場合に音声区間であると判定してもよい。

本発明にかかるノイズ低減装置を備えた音声入力装置において、第１のマイクロフォンは前記音声入力装置の第１の面に設けられ、第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられていてもよい。

本発明にかかるノイズ低減装置を備えた無線通信装置において、第１のマイクロフォンは前記無線通信装置の第１の面に設けられ、第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられていてもよい。

本発明にかかるノイズ低減方法は、第１の収音信号に基づき音声区間を判定し、前記音声区間において、第２の収音信号と前記第１の収音信号とを用いて音声の到来方向を判定し、前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減する際、前記音声の到来方向に応じてノイズ低減量を調整する。

本発明により、音圧レベルの低下を抑制することができるノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法を提供することができる。

実施の形態にかかるノイズ低減装置を示すブロック図である。実施の形態にかかるノイズ低減装置が備える音声区間判定部の一例を示すブロック図である。実施の形態にかかるノイズ低減装置が備える音声区間判定部の他の例を示すブロック図である。実施の形態にかかるノイズ低減装置が備える音声方向判定部の一例を示すブロック図である。実施の形態にかかるノイズ低減装置が備える音声方向判定部の他の例を示すブロック図である。実施の形態にかかるノイズ低減装置が備えるノイズ低減処理部の一例を示すブロック図である。実施の形態にかかるノイズ低減装置のノイズ低減処理を説明するための図である。実施の形態にかかるノイズ低減装置の他の例を示すブロック図である。音声用マイクロフォンに対する音声源の位置と、ノイズ低減処理後の出力信号の音圧レベルとの関係を示す図である（従来技術を用いた場合）。音声用マイクロフォンに対する音声源の位置と、音声用マイクロフォンで収音された収音信号の音圧レベルとの関係を示す図である。音声用マイクロフォンに対する音声源の位置と、ノイズ低減処理後の出力信号の音圧レベルとの関係を示す図である（本発明を用いた場合）。音声源の位置に対するノイズ低減量調整値の一例を示す図である。実施の形態にかかるノイズ低減装置を用いた音声入力装置の一例を示す図である。実施の形態にかかるノイズ低減装置を用いた無線通信装置の一例を示す図である。

以下、図面を参照して本発明の実施の形態について説明する。
図１は、実施の形態にかかるノイズ低減装置を示すブロック図である。図１に示すように、本実施の形態にかかるノイズ低減装置１は、音声区間判定部１１、音声方向判定部１２、およびノイズ低減処理部１３を有する。ノイズ低減処理部１３は、適応フィルタ１４、適応係数調整部１５、ノイズ低減量調整部１６、および加算器１７、１８を備える。

本実施の形態にかかるノイズ低減装置１は、主として音声成分を含む第１の収音信号（音声信号）２１および主としてノイズ成分を含む第２の収音信号（参照信号）２２を入力し、収音信号２１および収音信号２２を用いてノイズ低減処理を実施し、ノイズ低減処理後の信号を出力信号２９として出力する。例えば、収音信号２１および収音信号２２は、図８に示すノイズ低減装置１'が備える音声用マイクロフォン１１１および参照音用マイクロフォン１１２を用いてそれぞれ取得する。

図８に示す音声用マイクロフォン１１１は、主に音声成分を含む音を収音してアナログ信号に変換し、変換後のアナログ信号をＡＤコンバータ１１３に出力する。参照音用マイクロフォン１１２は、主にノイズ成分を含む音を収音してアナログ信号に変換し、変換後のアナログ信号をＡＤコンバータ１１４に出力する。参照音用マイクロフォン１１２で収音された音に含まれるノイズ成分は、音声用マイクロフォン１１１で収音された音に含まれるノイズ成分を低減するために用いられる。

ＡＤコンバータ１１３は、音声用マイクロフォン１１１から出力されたアナログ信号を所定のサンプリングレートでサンプリングしてデジタル信号に変換し、収音信号２１を生成する。ＡＤコンバータ１１４は、参照音用マイクロフォン１１２から出力されたアナログ信号を所定のサンプリングレートでサンプリングしてデジタル信号に変換し、収音信号２２を生成する。

例えば、音声用マイクロフォン１１１および参照音用マイクロフォン１１２に入力される音声の周波数帯域は、おおよそ１００Ｈｚから４０００Ｈｚ程度である。よって、ＡＤコンバータ１１３、１１４におけるサンプリング周波数を８ｋＨｚ〜１２ｋＨｚ程度とすることで、音声成分を含むアナログ信号をデジタル信号として取り扱うことができる。

図１に示すように、収音信号２１は、音声区間判定部１１、音声方向判定部１２、およびノイズ低減処理部１３の加算器１７、１８に供給される。また、収音信号２２は音声方向判定部１２および適応フィルタ１４に供給される。なお、本明細書では、主に音声成分を含む収音信号２１を音声信号とも記載し、主にノイズ成分を含む収音信号２２を参照信号（ノイズ信号）とも記載する。

音声区間判定部１１は、供給された収音信号２１に基づき音声区間を判定する。そして、音声区間判定部１１は、音声区間を示す音声区間情報２３を、音声方向判定部１２および適応係数調整部１５にそれぞれ出力する。例えば、音声区間判定部１１は、収音信号２１に音声成分が含まれる確率が所定の値以上となった場合に音声区間であると判定する。

音声区間判定部１１における音声区間判定処理には任意の技術を用いることができる。なお、ノイズレベルが高い環境下でノイズ低減装置が使用される場合は、高い精度で音声区間を判定することが好ましく、例えば、後述する音声区間判定技術Ａや音声区間判定技術Ｂを用いることで、音声区間を高い精度で判定することができる。音声には人の声以外の音も含まれるが、これらの例では、主に人の声を検出する。なお、音声区間判定技術Ａは、一例として、特願２０１０−２６０７９８に基づく優先権を主張する出願である特願２０１１−２５４５７８にも記載されている。また、音声区間判定技術Ｂは、一例として、特願２０１１−０２０４５９にも記載されている。

最初に、音声区間判定技術Ａについて説明する。音声区間判定技術Ａでは、音声の主要部分である母音成分の持つ周波数スペクトルに着目し、音声区間を判定している。音声区間判定技術Ａでは、適切なノイズレベルを帯域毎に設定し、母音周波数成分のピークとの信号対ノイズレベル比を求め、信号対ノイズレベル比が所定のレベル比かつ所定のピーク数であるか否かを観察することで、音声区間を判定している。

図２は、音声区間判定技術Ａを用いた音声区間判定部１１'の一例を示すブロック図である。図２に示す音声区間判定部１１'は、フレーム化部３１、スペクトル生成部３２、帯域分割部３３、周波数平均部３４、保持部３５、時間平均部３６、ピーク検出部３７、および音声判定部３８を備える。

フレーム化部３１は、収音信号２１を予め定められた時間幅を有するフレーム単位（所定サンプル数長）で順次切り出し、フレーム単位の入力信号（以下、フレーム化入力信号と称す）を生成する。

スペクトル生成部３２は、フレーム化部３１から出力されたフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴ（Fast Fourier Transform）やＤＣＴ（Discrete Cosine Transform）等の直交変換法を用いるとよい。本実施の形態において、スペクトル生成部３２は、少なくとも２００Ｈｚから７００Ｈｚのスペクトルパターンを生成する。

後述する音声判定部３８が音声区間を判定する際に検出する対象である、音声の特徴を示すスペクトル（以下、フォルマントと称す）には、通常、基音に相当する第１フォルマントから、その倍音部分である第ｎフォルマント（ｎは自然数）まで複数ある。このうち、第１フォルマントや第２フォルマントは２００Ｈｚ未満の周波数帯域に存在することが多い。しかし、この帯域には、低域ノイズ成分が比較的高いエネルギーで含まれているため、フォルマントが埋没し易い。また７００Ｈｚ以上のフォルマントは、フォルマント自体のエネルギーが低いため、やはりノイズ成分に埋没し易い。そのため、ノイズ成分に埋没し難い２００Ｈｚから７００Ｈｚのスペクトルパターンを音声区間の判定に用いることで、判定対象を絞り、効率的に音声区間の判定を行うことができる。

帯域分割部３３は、適切な周波数帯域単位で音声に特徴的なスペクトルを検出するため、スペクトルパターンの各スペクトルを、予め定められた帯域幅で分割された周波数帯域である複数の分割周波数帯域に分割する。本実施の形態において、予め定められた帯域幅は、１００Ｈｚから１５０Ｈｚ程度の帯域幅とする。

周波数平均部３４は、分割周波数帯域毎の平均エネルギーを求める。本実施の形態では、周波数平均部３４は、分割周波数帯域毎に、分割周波数帯域におけるすべてのスペクトルのエネルギーを平均するが、演算負荷軽減のためスペクトルのエネルギーの代わりにスペクトルの最大または平均振幅値（絶対値）を代用してもよい。

保持部３５は、ＲＡＭ（Random Access Memory）、ＥＥＰＲＯＭ（Electrically Erasable and Programmable Read Only Memory）、フラッシュメモリ等の記憶媒体で構成され、帯域毎の平均エネルギーを過去の予め定められた数（本実施の形態においてはＮとする）のフレーム分保持する。

時間平均部３６は、分割周波数帯域毎に、周波数平均部３４で導出された平均エネルギーの時間方向の複数のフレームに渡る平均である帯域別エネルギーを導出する。すなわち、帯域別エネルギーは、分割周波数帯域毎の平均エネルギーの時間方向の複数のフレームに渡る平均値である。また、時間平均部３６は、直前のフレームの分割周波数帯域毎の平均エネルギーに、重み付け係数と時定数を用いて平均化に準じる処理をして、帯域別エネルギーの代用値を求めてもよい。

ピーク検出部３７は、スペクトルパターンの各スペクトルと、そのスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比（ＳＮＲ：Signal to Noise ratio）を導出する。そして、ピーク検出部３７は、スペクトル毎のＳＮＲと、予め定められた第１閾値とを比較し、第１閾値を超えるか否かを判定する。ＳＮＲが第１閾値を超えるスペクトルがあると、このスペクトルをフォルマントとみなし、フォルマントが検出された旨を示す情報を、音声判定部３８に出力する。

音声判定部３８は、フォルマントが検出されたという情報をピーク検出部３７から受け付けると、ピーク検出部３７の判定結果に基づいて、該当フレームのフレーム化入力信号が音声であるか否か判定する。音声判定部３８は、フレーム化入力信号が音声であると判定した場合、音声方向判定部１２および適応係数調整部１５に音声区間情報２３を出力する。

図２に示す音声区間判定部１１'は、分割周波数帯域毎に、その分割周波数帯域の帯域別エネルギーを設定している。そのため、音声判定部３８は、他の分割周波数帯域のノイズ成分の影響を受けずに、それぞれの分割周波数帯域毎にフォルマントの有無を精度よく判定することができる。

上述したように、フォルマントには、第１フォルマントから、その倍音部分である第ｎフォルマントまで複数ある。したがって、任意の分割周波数帯域の帯域別エネルギー（ノイズレベル）が上昇し、フォルマントの一部がノイズに埋没しても、他の複数のフォルマントを検出できる場合がある。特に、周囲ノイズは低域に集中するため、基音に相当する第１フォルマントや２倍音に相当する第２フォルマントが低域のノイズに埋没していても、３倍音以上のフォルマントを検出できる可能性がある。よって、音声判定部３８は、ＳＮＲが第１閾値を超えるスペクトルが所定数以上である場合、フレーム化入力信号が音声であると判定することで、よりノイズに強い音声区間の判定を行うことができる。

以上で説明したように、音声区間判定技術Ａを用いた音声区間判定部１１'は、入力信号を予め定められた時間幅を有するフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部３１と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部３２と、スペクトルパターンの各スペクトルと、予め定められた帯域幅で分割された周波数帯域である複数の分割周波数帯域のうちスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比が、予め定められた第１閾値を超えるか否かを判定するピーク検出部３７と、ピーク検出部の判定結果に基づいて、フレーム化入力信号が音声であるか否か判定する音声判定部３８と、スペクトルパターンの各分割周波数帯域におけるスペクトルの周波数方向の平均エネルギーを導出する周波数平均部３４と、分割周波数帯域毎に、平均エネルギーの時間方向の平均である前記帯域別エネルギーを導出する時間平均部３６と、を備える。

例えば、音声判定部３８は、エネルギー比が第１閾値を超えるスペクトルが予め定められた数以上であると、フレーム化入力信号が音声であると判定する。

次に、音声区間判定技術Ｂについて説明する。音声区間判定技術Ｂでは、子音の特徴であるスペクトルパターンが右上がりになる傾向があるという性質に着目して、音声区間を判定している。音声区間判定技術Ｂでは、子音のスペクトルパターンを中高域の周波数帯において測定し、更に部分的にノイズ成分によって埋没してしまった子音の周波数分布の特徴を、ノイズの影響があまり無かった帯域に特化して抽出することで、音声区間を高精度で判定することを可能にしている。

図３は、音声区間判定技術Ｂを用いた音声区間判定部１１''の一例を示すブロック図である。音声区間判定部１１''は、フレーム化部４１、スペクトル生成部４２、帯域分割部４３、平均導出部４４、ノイズレベル導出部４５、判定選択部４６、および子音判定部４７を備える。

フレーム化部４１は、収音信号２１を予め定められた時間幅を有するフレーム単位で順次切り出し、フレーム単位の入力信号であるフレーム化入力信号を生成する。

スペクトル生成部４２は、フレーム化部４１から出力されたフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴやＤＣＴ等の直交変換法を用いるとよい。

帯域分割部４３は、スペクトル生成部４２が生成したスペクトルパターンの各スペクトルを、予め定められた帯域幅毎に分割し、複数の分割周波数帯域を生成する。本実施の形態において、帯域分割部４３は、例えば、８００Ｈｚ〜３．５ｋＨｚの周波数範囲について、例えば、１００Ｈｚ〜３００Ｈｚ程度の帯域幅毎に分割する。

平均導出部４４は、スペクトルパターンにおける、連接する、帯域分割部４３が分割した分割周波数帯域（バンド）毎の平均エネルギーである帯域別平均エネルギーを導出する。

子音判定部４７は、平均導出部４４が導出した帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、そのフレーム化入力信号に子音が含まれると判定する。

一般的に、子音はスペクトルパターンが右上がりになる傾向がある。そこで、音声区間判定技術Ｂを用いた音声区間判定部１１''は、スペクトルパターンにおける帯域別平均エネルギーを導出し、その帯域別エネルギー同士を比較することで子音に特徴的な、スペクトルパターンにおける右上がりの傾向を検出する。そのため、音声区間判定部１１''は、入力信号に子音が含まれる子音区間を精度よく検出することができる。

子音判定部４７は、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた第１閾値以上であると、子音が含まれると判定する第１判定手段を備える。また、子音判定部４７は、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計測し、更にこの組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であると、子音が含まれると判定する第２判定手段を備える。子音判定部４７は、第１判定手段と第２判定手段をそれぞれノイズレベルに応じて使い分ける。

ここで、第１判定手段と第２判定手段とを適宜選択すべく、ノイズレベル導出部４５は、フレーム化入力信号のノイズレベルを導出する。例えば、ノイズレベルは、フレーム化入力信号のすべての周波数帯域の帯域別平均エネルギーの平均値とする。また、ノイズレベル導出部４５は、フレーム化入力信号毎にノイズレベルを導出してもよいし、所定時間分のフレーム化入力信号のノイズレベルの平均値を用いてもよい。判定選択部４６は、導出されたノイズレベルが所定の閾値未満の場合、第１判定手段を選択し、所定の閾値以上の場合、第２判定手段を選択する。

以上で説明したように、音声区間判定技術Ｂを用いた音声区間判定部１１''は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部４１と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部４２と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部４４と、導出された帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、フレーム化入力信号に子音が含まれると判定する子音判定部４７と、を備える。

例えば、子音判定部４７は、スペクトルパターンの隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた閾値以上であると、子音が含まれると判定する。

なお、本実施の形態にかかるノイズ低減装置に上記の音声区間判定技術Ａ、Ｂを適用する場合、製品毎にパラメータを設定することができる。すなわち、より確実な音声区間の判定が要求される製品に音声区間判定技術Ａ、Ｂを適用する場合、音声区間判定のパラメータとしてより厳しい閾値を設定することができる。

図１に示すノイズ低減装置１が備える音声方向判定部１２は、収音信号２１、２２を用いて音声の到来方向を判定し、音声方向情報２４をノイズ低減量調整部１６に出力する。例えば、音声の到来方向は音声用マイクロフォンに対する音声の入射角に対応している。音声の到来方向を判定する方法は、例えば収音信号２１と収音信号２２の位相差に基づいて音声の到来方向を判定する方法や、音声用マイクロフォン１１１で収音された音（収音信号２１）の大きさと参照音用マイクロフォン１１２で収音された音（収音信号２２）の大きさの差や比（パワー差やパワー比であり、これらを総称してパワー情報と称す）に基づき、音声の到来方向を判定する方法等がある。このとき、音声方向判定部１２は、音声区間判定部１１が音声区間と判定した場合に、音声の到来方向を判定している。つまり、音声方向判定部１２は、音声が到来している音声区間において音声方向を判定し、音声区間以外のときは音声方向を判定していない。

また、例えば、トランシーバーのような携帯機器や、無線通信装置に付属するスピーカーマイクロフォンのような小型機器に、本実施の形態にかかるノイズ低減装置を適用する場合、音声を拾い易い表側に音声用マイクロフォン１１１を設け、音声を拾い難い裏側に参照音用マイクロフォン１１２を設ける。これにより、音声用マイクロフォン１１１では音声成分を主に収音し、参照音用マイクロフォン１１２ではノイズ成分を主に収音することができる。

上記の無線通信装置や音声入力装置は、一般的に人間の握りこぶしよりも少し小さい程度の大きさである。よって、音源と音声用マイクロフォン１１１との距離と、音源と参照音用マイクロフォン１１２との距離の差は、機器毎やマイクロフォンの配置により異なるものの、５〜１０ｃｍ程度であると考えられる。ここで、音声の空間伝達速度を３４０００ｃｍ／ｓとすると、サンプリング周波数が８ｋＨｚの場合、１サンプル間において音声が伝達する距離は３４０００÷８０００＝４．２５であるので、４．２５ｃｍとなる。仮に、音声用マイクロフォン１１１と参照音用マイクロフォン１１２との距離が５ｃｍであれば、サンプリング周波数が８ｋＨｚでは音声の方向を推定するには不十分である。

この場合、サンプリング周波数を８ｋＨｚの３倍である２４ｋＨｚとすると、３４０００÷２４０００≒１．４２ｃｍとなり、５ｃｍの間に３〜４点の位相差ポイントを測定することができる。よって、収音信号２１と収音信号２２の位相差に基づいて音声の到来方向を判定する場合は、音声方向判定部１２に入力される収音信号２１と収音信号２２のサンプリング周波数を２４ｋＨｚ以上にするとよい。

図８に示すノイズ低減装置１'において、例えばＡＤコンバータ１１３、１１４から出力された収音信号２１、２２のサンプリング周波数が８〜１２ｋＨｚである場合は、ＡＤコンバータ１１３、１１４と音声方向判定部１２との間に、サンプリング周波数変換器を設け、音声方向判定部１２に供給される収音信号２１、２２のサンプリング周波数を２４ｋＨｚ以上に変換してもよい。

一方、例えばＡＤコンバータ１１３、１１４から出力された収音信号２１、２２のサンプリング周波数が２４ｋＨｚ以上である場合は、ＡＤコンバータ１１３と音声区間判定部１１との間、およびＡＤコンバータ１１３、１１４とノイズ低減処理部１３との間に、サンプリング周波数変換器を設け、音声区間判定部１１およびノイズ低減処理部１３に供給される収音信号２１、２２のサンプリング周波数を８〜１２ｋＨｚに変換してもよい。

まず、収音信号２１と収音信号２２の位相差（つまり、収音信号２１と収音信号２２の入力時刻の違い）に基づいて音声の到来方向を判定する場合について説明する。図４は、本実施の形態にかかるノイズ低減装置１が備える音声方向判定部の一例を示すブロック図である。図４に示す音声方向判定部１２'は、基準信号バッファ５１、基準信号抽出部５２、比較信号バッファ５３、比較信号抽出部５４、相互相関値算出部５５、および位相差情報取得部５６を備える。基準信号バッファ５１は、収音信号２１を一時的に蓄積する。比較信号バッファ５３は、収音信号２２を一時的に蓄積する。

通常、ある瞬間に収音された収音信号は様々な周囲音を含んでおり、各マイクロフォン１１１、１１２への伝達経路が異なるため各マイクロフォン１１１、１１２で検出される位相や振幅値は異なる。しかし、音声の音源（音声源）は一つであるため、各マイクロフォン１１１、１１２で検出される音声成分の位相や振幅値は類似しており相関性は非常に高いといえる。特に、本実施の形態では、音声区間において音声の到来方向を判定しているので、各マイクロフォン１１１、１１２で検出される音声成分の相関性は非常に高いといえる。よって、この相関性を測定することで位相差を求めることができ、音声源の方向を推定することができる。２つのマイクロフォン１１１、１１２の間における位相差は、例えば相互相関関数や最小二乗法を用いて算出する。

２つの信号波形ｘ１（ｔ）とｘ２（ｔ）の相互相関関数は次の式で表すことができる。

基準信号抽出部５２は、収音信号（基準信号）２１に含まれる信号波形ｘ１（ｔ）を抽出して固定する。比較信号抽出部５４は、収音信号（比較信号）２２に含まれる信号波形ｘ２（ｔ）を抽出し、当該信号波形ｘ２（ｔ）を移動する。相互相関値算出部５５は、信号波形ｘ１（ｔ）と信号波形ｘ２（ｔ）とに対して畳み込み演算（積和演算）を実施することで、収音信号２１と収音信号２２の相関が高いポイントを判断する。このとき、収音信号２２のサンプリング周波数とマイクロフォン１１１、１１２の空間的な距離から算出される最大位相差分に応じて、信号波形ｘ２（ｔ）を前後にシフトしながら畳み込み演算値を計算する。畳み込み演算値が最大となるポイントは符号が一致する場所であり最も相関が高いと判断することができる。

また、最小二乗法を用いる場合は、次の式を用いることができる。

最小二乗法を用いる場合、基準信号抽出部５２は、収音信号（基準信号）２１に含まれる信号波形を抽出して固定する。比較信号抽出部５４は、収音信号（比較信号）２２に含まれる信号波形を抽出し、当該信号波形を移動する。相互相関値算出部５５は、収音信号２１に含まれる信号波形と収音信号２２に含まれる信号波形との差分値の二乗和を計算する。この二乗和が最小となるポイントは、収音信号２１に含まれる信号波形と収音信号２２に含まれる信号波形とが互いに相似形となる（重なり合う）場所であり、最も相関が高いと判断することができる。最小二乗法を用いる場合は基準信号と比較信号の大きさを揃えることが望ましく、一方を基準として予め正規化しておくのが好ましい。

相互相関値算出部５５は、上記の演算により得られた、基準信号と比較信号の相関関係に関する情報を位相差情報取得部５６に出力する。すなわち、相互相関値算出部５５で相関が高いと判断された２つの信号波形（つまり、収音信号２１に含まれる信号波形と収音信号２２に含まれる信号波形）は、音源を同一とする音声の信号波形である可能性が高い。よって、位相差情報取得部５６は、相関が高いと判断された２つの信号波形の位相差を求めることで、音声用マイクロフォン１１１で収音された音声成分と参照音用マイクロフォン１１２で収音された音声成分の位相差を求めることができる。

そして、音声用マイクロフォン１１１で収音された音に含まれる音声成分の位相（つまり、収音信号２１の音声成分の位相）が、参照音用マイクロフォン１１２で収音された音に含まれる音声成分の位相（つまり、収音信号２２の音声成分の位相）よりも早い場合（つまり、位相差がプラスの場合）、参照音用マイクロフォン１１２よりも音声用マイクロフォン１１１に近い位置に音声源がある（つまり、音声用マイクロフォン１１１に向かって話者が話している）と推測することができる。

一方、音声用マイクロフォン１１１で収音された音に含まれる音声成分の位相が、参照音用マイクロフォン１１２で収音された音に含まれる音声成分の位相よりも遅い場合（つまり、位相差がマイナスの場合）、音声用マイクロフォン１１１よりも参照音用マイクロフォン１１２に近い位置に音声源がある（つまり、参照音用マイクロフォン１１２に向かって話者が話している）と推測することができる。

また、音声用マイクロフォン１１１で収音された音に含まれる音声成分の位相と、参照音用マイクロフォン１１２で収音された音に含まれる音声成分の位相との位相差が所定の範囲内である場合（−Ｔ＜位相差＜Ｔ、つまり、位相差の絶対値が所定の値Ｔよりも小さい場合）、音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間付近に音声源が位置していると推測することができる。

位相差情報取得部５６は、取得した位相差情報を音声方向情報２４として、ノイズ低減量調整部１６に出力する。

音声方向判定部１２は、音声区間判定部１１が音声区間と判定した場合に、音声の到来方向を判定している。よって、ノイズが混入した場合であっても、音声区間判定部１１が音声区間と判定した場合は、音声用マイクロフォン１１１で収音される音声成分と参照音用マイクロフォン１１２で収音される音声成分の位相差を精度よく算出することができるので、音声方向を高精度に判定することができる。

次に、収音信号２１と収音信号２２のパワー情報に基づいて音声の到来方向を判定する場合について説明する。図５は、本実施の形態にかかるノイズ低減装置１が備える音声方向判定部の他の例を示すブロック図である。図５に示す音声方向判定部１２''は、音声信号バッファ６１、音声信号パワー算出部６２、参照信号バッファ６３、参照信号パワー算出部６４、パワー差算出部６５、およびパワー情報取得部６６を備える。図５に示す音声方向判定部１２''は、ある一定の単位時間における収音信号２１および収音信号２２のパワー情報（図５に示す場合は、パワー差）を求めることができる。

音声信号バッファ６１は、単位時間分の収音信号２１を蓄積するために、供給された収音信号２１を一時的に蓄積する。参照信号バッファ６３は、単位時間分の収音信号２２を蓄積するために、供給された収音信号２２を一時的に蓄積する。

音声信号パワー算出部６２は、音声信号バッファ６１に蓄積された単位時間分の収音信号を用いて、単位時間当たりのパワー値を算出する。また、参照信号パワー算出部６４は、参照信号バッファ６３に蓄積された単位時間分の収音信号を用いて、単位時間当たりのパワー値を算出する。

ここで、単位時間当たりのパワー値とは、単位時間における収音信号２１、２２の大きさであり、例えば、単位時間における収音信号２１、２２の振幅の最大値や、単位時間における収音信号２１、２２の振幅の積分値等を用いる。なお、本実施の形態では、収音信号２１、２２の大きさを示す値であれば、パワー値として上記の最大値や積分値以外の値を用いてもよい。

パワー差算出部６５は、音声信号パワー算出部６２で求めた収音信号のパワー値と、参照信号パワー算出部６４で求めた収音信号のパワー値とのパワー差を算出し、算出されたパワー差をパワー情報取得部６６に出力する。

パワー情報取得部６６は、パワー差算出部６５から出力されたパワー差に基づいて、収音信号２１と収音信号２２のパワー情報を取得する。

例えば、音声用マイクロフォン１１１で収音された音の大きさが、参照音用マイクロフォン１１２で収音された音の大きさよりも大きい場合、つまり、収音信号２１の大きさ（パワー値）が収音信号２２の大きさよりも大きい場合、参照音用マイクロフォン１１２よりも音声用マイクロフォン１１１に近い位置に音声源がある（つまり、音声用マイクロフォン１１１に向かって話者が話している）と推測することができる。

一方、音声用マイクロフォン１１１で収音された音の大きさが、参照音用マイクロフォン１１２で収音された音の大きさよりも小さい場合、つまり、収音信号２１の大きさが収音信号２２の大きさよりも小さい場合、音声用マイクロフォン１１１よりも参照音用マイクロフォン１１２に近い位置に音声源がある（つまり、参照音用マイクロフォン１１２に向かって話者が話している）と推測することができる。

また、音声用マイクロフォン１１１で収音された音の大きさと、参照音用マイクロフォン１１２で収音された音の大きさとの差が所定の範囲内である場合（−Ｐ＜パワー差＜Ｐ、つまり、パワー差の絶対値が所定の値Ｐよりも小さい場合）、音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間付近に音声源が位置していると推測することができる。

パワー情報取得部６６は、取得したパワー情報（つまり、パワー差に関する情報）を音声方向情報２４として、ノイズ低減量調整部１６に出力する。

以上で説明したように、音声方向判定部１２は、収音信号２１と収音信号２２の位相差に基づいて音声の到来方向を判定する方法や、収音信号２１と収音信号２２のパワー情報に基づいて音声の到来方向を判定する方法を用いることができる。位相差を用いる方法とパワー情報を用いる方法は、それぞれ単独で使用してもよいし、互いに組み合わせて使用してもよい。例えば、トランシーバーのような携帯機器（無線通信装置）や、無線通信装置に付属するスピーカーマイクロフォン（音声入力装置）のような小型機器は、持ち方によりマイク開口部が手で塞がれたり、衣服などによってマイク開口部が遮蔽されたりする場合がある。よって、位相差を用いる方法とパワー情報を用いる方法を組み合わせて使用することで、音声方向をより高精度に判定することができる。

図１に示すノイズ低減処理部１３は、収音信号２２を用いて収音信号２１に含まれるノイズ成分を低減するノイズ低減処理を実施する。このとき、ノイズ低減処理部１３は、音声の到来方向に応じてノイズ低減量を調整することができる。ノイズ低減処理部１３は、適応フィルタ１４、適応係数調整部１５、ノイズ低減量調整部１６、および加算器１７、１８を備える。

適応フィルタ１４は、主としてノイズ成分を含む収音信号２２を用いて収音信号２１に含まれるノイズ成分に対応したノイズ推定信号２５を生成する。つまり、適応フィルタ１４は、収音信号２２を用いて、収音信号２１に含まれている可能性があるノイズ成分を擬似的に生成し、ノイズ推定信号２５として出力する。ここで、ノイズ推定信号２５は、収音信号２１に対して位相反転された信号である。

加算器１７は、収音信号２１と位相反転されたノイズ推定信号２５とを加算することで、フィードバック信号（誤差信号）２６を生成し、適応係数調整部１５に出力する。換言すると、加算器１７は、収音信号２１からノイズ推定信号２５を差し引くことで、フィードバック信号（誤差信号）２６を生成することができる。なお、本実施の形態では、加算器１７を用いて収音信号２１と位相反転されたノイズ推定信号２５とを加算しているが、加算器の代わりに減算器を用いて収音信号２１からノイズ推定信号２５（この場合は位相反転されていない）を減算するように構成してもよい。

適応係数調整部１５は、収音信号２１とノイズ推定信号２５との演算により求めたフィードバック信号２６に基づき適応フィルタ１４の適応係数を調整する。このとき、適応係数調整部１５は、音声区間情報２３に応じて適応フィルタ１４の係数を調整することができる。つまり、適応係数調整部１５は、音声区間情報２３が音声区間を示さない場合（ノイズ区間の場合）、適応誤差が少なくなるように係数を調整する。一方、音声区間情報２３が音声区間を示している場合、適応フィルタ１４の係数を維持するか、または係数を微調整するのみとする。

ノイズ低減量調整部１６は、音声の到来方向を示す音声方向情報２４に応じてノイズ推定信号２５を調整し、調整後のノイズ推定信号２８を加算器１８に出力する。

例えば、ノイズ低減量調整部１６は、音声方向判定部１２において収音信号２１および収音信号２２の位相差が所定の範囲内（−Ｔ＜位相差＜Ｔ）であると判定された場合、ノイズ推定信号２５を低減する。また、ノイズ低減量調整部１６は、収音信号２１の位相が収音信号２２の位相よりも遅いと判定された場合（つまり、位相差がマイナスの場合）、ノイズ推定信号２５を低減する。ノイズ低減量調整部１６でノイズ推定信号２５を低減することで、ノイズ低減処理部１３におけるノイズ低減量を低減する。

また、例えば、ノイズ低減量調整部１６は後述する図１２に示すような、音声源の位置に対するノイズ低減量調整値を記憶しておく。そして、ノイズ低減量調整部１６は、音声方向判定部１２を用いて判定された音声の到来方向（音声源の位置）により、記憶した音声源の位置に対するノイズ低減量調整値を参照して、ノイズ推定信号２５に乗算するノイズ低減量調整値を決めて、ノイズ推定信号２５に乗算する。このようにして、ノイズ低減量調整部１６はノイズ推定信号２５の大きさを調整し、ノイズ低減処理部１３におけるノイズ低減量を低減する。例えば、ノイズ低減量調整値を１とした場合はノイズ推定信号２５がそのままの大きさで出力され、ノイズ低減量調整値を０とした場合はノイズ推定信号２５がゼロとなる（つまり、ノイズ低減処理が実施されない）。

また、例えば、ノイズ低減量調整部１６は、音声方向判定部１２において収音信号２１の大きさおよび収音信号２２の大きさの差であるパワー差が所定の範囲内であると判定された場合（−Ｐ＜パワー差＜Ｐ）、ノイズ推定信号２５を低減することができる。また、ノイズ低減量調整部１６は、収音信号２１の大きさが収音信号２２の大きさよりも小さいと判定された場合（つまり、パワー差がマイナスの場合）、ノイズ推定信号２５を低減する。この場合も、ノイズ低減量調整部１６でノイズ推定信号２５を低減することで、ノイズ低減処理部１３におけるノイズ低減量を低減する。

加算器（演算部）１８は、ノイズ低減量調整部１６で調整された後のノイズ推定信号２８と収音信号２１とを用いて収音信号２１に含まれるノイズ成分を低減する。つまり、加算器１８は、収音信号２１と位相反転された調整後のノイズ推定信号２８とを加算することで、ノイズ低減処理された信号を生成し、生成された信号を出力信号２９として出力する。換言すると、加算器１８は、収音信号２１から調整後のノイズ推定信号２８を差し引くことで、ノイズ低減処理された出力信号２９を生成することができる。なお、本実施の形態では、加算器１８を用いて収音信号２１と位相反転された調整後のノイズ推定信号２８とを加算しているが、加算器の代わりに減算器を用いて収音信号２１から調整後のノイズ推定信号２８（この場合は位相反転されていない）を減算するように構成してもよい。

図６は、本実施の形態にかかるノイズ低減装置が備えるノイズ低減処理部１３の一例を示すブロック図である。図６では、適応フィルタ１４をＦＩＲ（Finite Impulse Response）フィルタで構成した例を示している。なお、ノイズ低減量調整部１６、および加算器１７、１８については、上記で説明した場合と同様である。

図６に示す適応フィルタ１４は、遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、および加算器７３_１〜７３_ｎを備える。遅延素子７１_１〜７１_ｎ、乗算器７２_１〜７２_ｎ＋１、および加算器７３_１〜７３_ｎを用いて収音信号２２を処理することで、ノイズ推定信号２５が生成される。

適応係数調整部１５は、乗算器７２_１〜７２_ｎ＋１の係数を調整する。つまり、適応係数調整部１５は、音声区間情報２３が音声区間を示さない場合（ノイズ区間の場合）、ノイズ推定信号２５と収音信号２１との差分（フィードバック信号２６）が最小化されるように適応フィルタ１４の係数を調整する。これにより、適応フィルタ１４から出力されるノイズ推定信号２５を、収音信号２１に含まれるノイズ成分に近づけることができる。

一方、音声区間情報２３が音声区間を示している場合は、収音信号２１に音声成分が含まれている。この場合は、音声成分の影響により適応フィルタ１４の係数がノイズ成分に適応せず収束しないおそれもある。よって、安定的に適応フィルタ１４の係数を更新するためには、音声区間情報２３が音声区間を示している場合は、適応フィルタ１４の係数を維持するか、または係数を微調整するのみとすることが望ましい。

換言すると、音声区間判定部１１から出力された音声区間情報２３は、適応係数調整部１５における適応係数の学習スピードを調整する働きをしている。また、音声区間情報２３は、ノイズ低減装置が配置された環境における空間音響特性（音声用マイクロフォン１１１と参照音用マイクロフォン１１２との間の伝達特性）を正確に取得するためにも、適応フィルタ１４にとって重要な情報となる。

ここで、適応フィルタ１４を用いたノイズ低減処理では、収音信号（ノイズ信号）２２に音声成分が含まれると、適応フィルタ１４において音声の逆位相成分を含むノイズ推定信号２５が生成されるため、ノイズ低減処理後の出力信号においてエコー感が発生したり音声の音圧レベルが低下したりするという問題がある。

図７は、本実施の形態にかかるノイズ低減装置のノイズ低減処理を説明するための図であり、ノイズ低減装置１'が配置された環境における空間音響特性を説明するための図である。図７に示すノイズ低減装置１'には音声用マイクロフォン１１１と参照音用マイクロフォン１１２とが互いに逆向きとなるように配置されている。パターンＡでは、ノイズ源のみが存在する場合を示している。パターンＢでは、パターンＡと同一の位置にノイズ源があり、また音声源が理想の位置にある場合、つまり音声源が音声用マイクロフォン１１１と向かい合う位置にある場合を示している。パターンＣでは、パターンＡと同一の位置にノイズ源があり、また音声源が音声用マイクロフォン１１１と参照音用マイクロフォン１１２との中間の位置にある場合を示している。なお、図７ではノイズ源を点状の音源として表しているが、複数のノイズ源が存在し、複数のノイズが混じった環境として扱うこともできる。

ノイズ源におけるノイズ信号をＮ（ｔ）、音声源における音声信号をＶ（ｔ）、音声用マイクロフォン１１１で収音された収音信号をＲａ（ｔ）、Ｒｂ（ｔ）、参照音用マイクロフォン１１２で収音された収音信号をＸａ（ｔ）、Ｘｂ（ｔ）とする。また、音声用マイクロフォン１１１と参照音用マイクロフォン１１２との間の伝達特性をＨ、音声用マイクロフォン１１１で収音される音声およびノイズの空間音響特性モデルをそれぞれＣＶ１、ＣＮ１、参照音用マイクロフォン１１２で収音される音声およびノイズの空間音響特性モデルをそれぞれＣＶ２、ＣＮ２とする。また、ノイズ低減処理後の出力信号をＹ（ｔ）とする。なお、ｔは時間を表す変数である。

パターンＡの場合、音声用マイクロフォン１１１で収音された収音信号Ｒａ（ｔ）および参照音用マイクロフォン１１２で収音された収音信号Ｘａ（ｔ）は、次のように表すことができる。

Ｒａ（ｔ）＝ＣＮ１×Ｎ（ｔ）・・・式３
Ｘａ（ｔ）＝ＣＮ２×Ｎ（ｔ）・・・式４

ここで、ノイズ推定信号２５と音声用マイクロフォン１１１で収音された収音信号Ｒａ（ｔ）とが一致するので、伝達特性Ｈを用いると、次のように表すことができる。
Ｙａ（ｔ）＝Ｒａ（ｔ）−Ｈ×Ｘａ（ｔ）＝０・・・式５

よって、式３〜式５を用いることで、次の関係を導くことができる。

Ｈ＝ＣＮ１／ＣＮ２・・・式６

次に、音声源が加えられたパターンＢについて説明する。適応フィルタ１４にて生成されるノイズ推定信号の伝達特性Ｈは、ノイズ成分のみに適応されると仮定すると、モデルが共通であるので伝達特性Ｈに変化はない。よって、パターンＢの場合は、下記のように表すことができる。

Ｒｂ（ｔ）＝ＣＮ１×Ｎ（ｔ）＋ＣＶ１×Ｖ（ｔ）・・・式７
Ｘｂ（ｔ）＝ＣＮ２×Ｎ（ｔ）＋ＣＶ２×Ｖ（ｔ）・・・式８

そして、式５〜式８を用いることで、下記の式を導くことができる。

Ｙｂ（ｔ）＝ＣＮ１×Ｎ（ｔ）＋ＣＶ１×Ｖ（ｔ）−Ｈ×（ＣＮ２×Ｎ（ｔ）＋ＣＶ２×Ｖ（ｔ））
＝ＣＶ１×Ｖ（ｔ）−Ｈ×ＣＶ２×Ｖ（ｔ）・・・式９

パターンＢのように、話者（音声源）が音声用マイクロフォン１１１側から音声を発している場合は、空間音響特性ＣＶ２は空間音響特性ＣＶ１と比べて大きく減衰し、更に音声の到来時間差により遅延量が加わる。よって、式９におけるノイズ推定信号に含まれる音声成分である"Ｈ×ＣＶ２×Ｖ（ｔ）"は小さくなり、ノイズ低減処理後の出力信号Ｙｂ（ｔ）の音声の明瞭性は維持される。

一方、パターンＣの場合は、話者（音声源）の位置が音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間の位置となっている。この場合、空間音響特性はＣＶ１≒ＣＶ２となり、式９におけるノイズ推定信号に含まれる音声成分である"Ｈ×ＣＶ２×Ｖ（ｔ）"が大きくなるため、ノイズ低減処理後の出力信号Ｙｂ（ｔ）の音声の音圧レベルが低下する。

伝達特性Ｈはノイズ源の位置に依存する。例えば、ノイズ源がパターンＣの音声源と同じように音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間の位置に存在している場合や、支配的なノイズ源がなく全方向からのノイズ成分に対して均等に適応する場合は、伝達特性ＨがＨ≒１となり、出力信号Ｙｂ（ｔ）は参照信号Ｘｂ（ｔ）に近い信号となる。このような条件が重なることで、音声源の位置に応じ音声の音圧レベルは大きく低下し、音声の明瞭性が損なわれる。

このような音声の音圧レベルの低下は、空間音響特性ＣＶ１と空間音響特性ＣＶ２の差が大きく、更に音声源の空間音響特性ＣＶ２（又はＣＶ１）とノイズ源の空間音響特性ＣＮ２（又はＣＮ１）の差が大きい場合には生じにくい。よって、これ以外の場合、つまり、空間音響特性ＣＶ１と空間音響特性ＣＶ２の差が小さい場合や、音声源の空間音響特性ＣＶ２（又はＣＶ１）とノイズ源の空間音響特性ＣＮ２（又はＣＮ１）の差が小さい場合を検出することで、音声の音圧レベルが低下する現象を予測することができる。

しかしながら、ノイズ環境下において各々のマイクロフォンにおける音声の伝達特性を正確に求めることは困難であり、現実的ではない。そこで、本実施の形態にかかるノイズ低減装置では、空間音響特性ＣＶ１、ＣＶ２を求める代わりに、音声方向判定部１２を用いて音声の到来方向を検出している。

例えば、音声方向判定部１２は、収音信号２１と収音信号２２の位相差に基づいて音声の到来方向を判定する。つまり、収音信号２１と収音信号２２の位相差がプラスの場合は、音声源が音声用マイクロフォン１１１側にあると判定することができる（パターンＢ）。また、位相差がマイナスの場合は、音声源が参照音用マイクロフォン１１２側にあると判定することができる。また、位相差が所定の範囲内である場合は、音声源が音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間付近にあると判定することができる（パターンＣ）。

また、例えば、音声方向判定部１２は、収音信号２１の大きさと収音信号２２の大きさとの差であるパワー差に基づいて音声の到来方向を判定する。つまり、収音信号２１と収音信号２２のパワー差がプラスの場合は、音声源が音声用マイクロフォン１１１側にあると判定することができる（パターンＢ）。また、パワー差がマイナスの場合は、音声源が参照音用マイクロフォン１１２側にあると判定することができる。また、パワー差が所定の範囲内である場合は、音声源が音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間付近にあると判定することができる（パターンＣ）。

そして、本実施の形態にかかるノイズ低減装置では、ノイズ低減処理後の出力信号２９において音声の音圧レベルが低下する可能性があると判定された場合、ノイズ低減量調整部１６においてノイズ推定信号２５を低減することで、ノイズ低減処理部１３におけるノイズ低減量を低減している。これにより、ノイズ低減後の出力信号２９において音声の音圧レベルが低下することを抑制することができる。換言すると、式９におけるノイズ推定信号に含まれる音声成分である"Ｈ×ＣＶ２×Ｖ（ｔ）"をノイズ低減量調整部１６において低減することで、ノイズ低減後の出力信号２９において音声の音圧レベルが低下することを抑制することができる。よって、本実施の形態にかかるノイズ低減装置により、収音信号（音声信号）２１に含まれるノイズを低減しつつ、出力信号２９の音圧レベルの低下を抑制することができるノイズ低減装置を提供することができる。

ここで、ノイズ低減処理後の出力信号２９において音声の音圧レベルが低下する可能性があると判定された場合とは、例えば、音声源が音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間付近にあると判定された場合（パターンＣ）や、音声源が参照音用マイクロフォン１１２側にあると判定された場合などである。

図９は、従来技術にかかるノイズ低減装置を用いた際の、音声用マイクロフォンに対する音声源の位置と、ノイズ低減処理後の出力信号の音圧レベルとの関係を示す図である。図１０は、音声用マイクロフォンに対する音声源の位置と、音声用マイクロフォンで収音された収音信号の音圧レベルとの関係を示す図である。ノイズ低減装置の音声用マイクロフォンおよび参照音用マイクロフォンは、図７に示すように、互いに逆向きになるように配置されている。音声用マイクロフォンに対する音声源の位置は、ノイズ低減装置を中心として、音声用マイクロフォンと参照音用マイクロフォンとを結んだ直線上の音声用マイクロフォン側に音声源がある場合を０度とし、当該直線上の参照音用マイクロフォン側に音声源がある場合を１８０度としている。音声用マイクロフォンおよび参照音用マイクロフォンの中間の位置にある場合は、９０度または２７０度となる。図９、図１０では、話者が同じフレーズを発話しながら、ノイズ低減装置を中心としてノイズ低減装置と一定の距離を保ちながら３６０度移動した場合の出力信号の音圧レベルを測定した結果を示している。また、図９に示す関係を測定する場合、ノイズ源の位置とノイズ低減装置の位置を固定している。

図１０に示すように、音声源が９０度付近から２７０度付近に位置している場合（つまり音声源が音声用マイクロフォンの側面や背面にある場合）は、音声源が音声用マイクロフォンの影になる影響や音声源と音声用マイクロフォンとの距離が遠くなる影響で、若干の音圧レベルの低下が見られる。しかし、音声用マイクロフォンで収音された収音信号自体の音圧レベルが大きく低下することはないため、音声の明瞭性が損なわれることはない。

一方、図９に示すように、従来技術にかかるノイズ低減装置を用いてノイズ低減処理を実施した場合は、全体としてノイズレベルが低下するが、参照音用マイクロフォンに混入する音声信号の影響が如実に現れる。つまり、図９に示す波形と図１０に示す波形を比較すると、音声源が９０度付近および２７０度付近にあるとき、つまり、音声源が音声用マイクロフォンおよび参照音用マイクロフォンの中間の位置付近にあるときに、出力信号の音圧レベルが低下している。これは、音声源が９０度付近および２７０度付近にあるときには、参照音用マイクロフォンにも音声成分が混入するためである（図７のパターンＣ参照）。なお、図９では、音声源が１８０度付近にある場合であっても出力信号の音圧レベルが低下していないように見える。しかし、この場合の出力信号は音声の逆位相成分（ノイズ推定信号に対応する）を含むため、実際の音声は不明瞭となる場合もある。また、ノイズ源の方向により音声が減衰する角度も異なるものの、参照音用マイクロフォンに音声が混入することで、音声の音圧レベルの低下や明瞭性の低下は避けられない。

これに対して、本実施の形態にかかるノイズ低減装置を用いた場合は、図１１に示すように、音声源が９０度付近および２７０度付近にある場合であっても、出力信号の音圧レベルが著しく低下することはない。すなわち、本実施の形態にかかるノイズ低減装置では、音声方向判定部１２を用いて音声の到来方向を判定し、例えば音声源が９０度付近および２７０度付近にあると判定された場合、ノイズ低減量調整部１６においてノイズ推定信号２５を低減している。これにより、ノイズ低減処理部１３におけるノイズ低減量を低減することができ、結果的に音声の音圧レベルを音声源の位置に依存することなくほぼ一定に保つことができる。

図１２は、音声源の位置に対するノイズ低減量調整値の一例を示す図である。本実施の形態にかかるノイズ低減装置では、例えば、図１２に示す音声源の位置に対するノイズ低減量調整値をノイズ低減量調整部１６において記憶しておく。そして、ノイズ低減量調整部１６は、音声方向判定部１２を用いて判定された音声の到来方向（音声源の位置）により、記憶した音声源の位置に対するノイズ低減量調整値を参照して、ノイズ推定信号２５に乗算するノイズ低減量調整値を決める。ここで、音声源の位置は、音声用マイクロフォンに対する音声の入射角に対応しており、収音信号２１および収音信号２２の位相差やパワー差に対応している。ノイズ低減量調整値は、例えば０以上１以下の値とする。ノイズ低減量調整部１６は、ノイズ推定信号２５に０以上１以下のノイズ低減量調整値を乗算することで、ノイズ推定信号２５の大きさを調整することができる。なお、ノイズ低減量調整値を１とした場合はノイズ推定信号２５がそのままの大きさで出力され、ノイズ低減量調整値を０とした場合はノイズ推定信号２５がゼロとなる（つまり、ノイズ低減処理が実施されない）。

図１２では、音声源が音声用マイクロフォン側から参照音用マイクロフォン側へ移動するに従い、ノイズ低減量調整値を小さくしている。つまり、音声源が約６０度の位置から約９０度の位置に近づくにつれて、また約３００度の位置から約２７０度の位置に近づくにつれてノイズ低減量調整値を徐々に小さくし、約９０度〜約２７０度の範囲ではノイズ低減量調整値を約０．２程度としている。

また、音声方向情報２４（位相差やパワー差）が急激に変化した場合は、ノイズ低減量調整値も急激に変化する。このため、出力信号の音圧レベルも急激に変化し、使用者に違和感を与える可能性がある。よって、このような場合は、所定の時定数を用いてノイズ低減量調整値が急激に変化することを抑制する緩和処理を実施してもよい。時定数をＴ、基準となるノイズ低減量調整値をＡｂａｓｅ、緩和処理後のノイズ低減量調整値をＡ、緩和処理直前のノイズ低減量調整値をＡｌａｓｔとすると、例えば緩和処理は次の式を用いて実施する。

Ａ＝Ａｂａｓｅ×（１／Ｔ）＋Ａｌａｓｔ×（（Ｔ−１）／Ｔ）・・・式１０

背景技術で説明したように、ノイズ低減処理技術では、例えば、音声を主に収音するマイクロフォンによって収音された音声信号から、ノイズを主に収音するマイクロフォンによって収音されたノイズ信号（参照信号）を差し引くことで、音声信号に含まれるノイズ成分を除去している。

しかしながら、主として音声成分を含む音声信号と主としてノイズ成分を含む参照信号とを用いてノイズ低減処理を実施する場合、ノイズ低減装置の使用状況によっては、参照信号に音声成分も混入する場合があった。このように参照信号に音声成分が混入すると、ノイズ低減処理を実施した際に音声信号に含まれる音声成分もキャンセルされてしまい、ノイズ低減処理後の信号の音圧レベルが低下するという問題があった。

すなわち、例えば、作業用機械の動作音などのかなり大きな騒音が発生している工場内や雑踏や交差点などで用いられることが多い、トランシーバーのような携帯型の無線通信装置（図１４参照）では、マイクロフォンに混入するノイズ成分の低減が必要となる。携帯電話と違い、本体側のスピーカーから送信される音声を耳元から離した状態で聞くといった使われ方をする無線通信装置は、一般的に身体から離れた状態で所持する。また、無線通信装置の持ち方にも様々なスタイルがある。

更に、無線通信装置本体から収音部と再生部を分離し携帯性を高めたスピーカーマイクロフォン装置（図１３に示す音声入力装置を参照）は、利便性のある使用形態を提供可能である。例えば、音声入力装置を首からぶら下げたり肩に置いたりなど、話者がマイクロフォンに向かうこと意識することなく会話を行うような使用形態や、音声入力装置の表側よりむしろ音声入力装置の背面に近い方向からしゃべるような使用形態もある。このような場合は、音声の到来方向は理想的な到来方向（例えば、音声用マイクロフォンの正面方向）とはならない。

したがって、トランシーバー（音声入力装置や無線通信装置）のような装置に対して適応フィルタを用いたノイズ低減処理を実施する場合は、参照信号にも音声成分が含まれることを前提としなければならず、音声信号の音圧レベルの低下を抑制する技術が必要となる。

特許文献１には、適応フィルタにおけるフィルタ係数を観察し、音声成分が打ち消される状態を検出することで、音声の明瞭性を維持する方法が開示されている。この方法によれば、主として音声を収音する音声用マイクロフォンと、音声の到来方向に対し感度が低い主としてノイズを収音する参照音用マイクロフォンを配置している。そして、適応フィルタにて処理をする際に、音声の到来方向に近い成分をノイズキャンセル信号として生成する状況になった場合、適応フィルタ係数全体にかかる利得因子を調整して適応フィルタ処理に制限をかけることで、音声成分の音圧レベルの低下を防止している。

しかしながら、特許文献１にかかる技術では、音声用マイクロフォン側に音声源が存在することを前提としている。また、参照音用マイクロフォンに指向性を持たせているため、参照音用マイクロフォンに音声成分が混入する可能性があるトランシーバーで使用することは困難である。

また、特許文献２にかかる技術では、誤差信号の音圧レベルまたは入力信号の音圧レベルを調整することで音声信号の音圧レベルの低下を防止している。しかしながら、音声の音圧レベルを維持するために雑音信号である誤差信号の音圧レベルを制御するか、又は雑音信号が混入した入力信号（遅延信号を含む）の音圧レベルを制御するかの何れかを実施するため、音声信号の音圧レベルを維持する一方、ノイズ低減効果が得られないという問題がある。

更に、特許文献２に開示されている適応フィルタを用いたノイズ低減処理では、自らの信号を用いてフィルタリング処理によるノイズキャンセル処理を実施している。このため、混入する音声信号の影響を強く受け、音声信号区間中のノイズ成分を減ずることができない。また、システムの構成上、適応フィルタ出力信号に誤差信号を加算してシステム出力信号としている。しかし、音声信号区間中の適応フィルタ出力信号若しくは入力信号と誤差信号をそのまま加算してもノイズ低減効果は得られず、音圧レベル制御を付加したからといって音声の明瞭度は向上しない。

このように、特許文献１や特許文献２に開示されている技術を用いたとしても、音声の音圧レベルを十分に維持することができないという問題があった。

そこで本実施の形態にかかるノイズ低減装置では、音声方向判定部１２で判定された音声の到来方向に応じて、ノイズ低減処理部１３におけるノイズ低減量を調整している。つまり、音声源が音声用マイクロフォン１１１と参照音用マイクロフォン１１２の中間付近にあると判定された場合や、音声源が参照音用マイクロフォン１１２側にあると判定された場合に、ノイズ低減処理部１３におけるノイズ低減量を低減している。これにより、ノイズ低減処理後の出力信号２９において音声の音圧レベルが低下することを抑制することができる。

また、本実施の形態にかかるノイズ低減装置では、加算器１７と加算器１８を独立に設けている。よって、適応フィルタ１４の係数の更新に必要なフィードバック信号（誤差信号）２６は、ノイズ低減量調整部１６におけるノイズ低減量の調整の影響を受けることはない。よって、周囲のノイズ信号に随時適応するように適応フィルタ１４の係数を更新することができるので、適応フィルタ１４は常に最大限の能力を発揮することができる。したがって、話者が複数いる場合、つまり音声の到来方向が複数ある場合であっても、話者の位置が良好な条件を満たしていれば、適切にノイズ低減処理を実施することができる。また、仮に話者の位置が良好な条件から外れていたとしても、音声方向情報２４に応じてノイズ低減処理部１３におけるノイズ低減量を低減することで、音声の音圧レベルを維持することができる。よって、様々な環境下においても十分なノイズ低減効果を発揮しつつ、音声の明瞭度を向上させることができるノイズ低減装置を提供することができる。

次に、本実施の形態にかかるノイズ低減装置を用いた音声入力装置について説明する。図１３は、本実施の形態にかかるノイズ低減装置を用いた音声入力装置５００の一例を示す図である。図１３（ａ）は、音声入力装置５００の前面図であり、図１３（ｂ）は、音声入力装置５００の背面図である。図１３に示すように、音声入力装置５００はコネクタ５０３を介して無線通信装置５１０に接続可能に構成されている。無線通信装置５１０は一般的な無線機であり、所定の周波数において他の無線通信装置と通信可能に構成されている。無線通信装置５１０には音声入力装置５００を介して話者の音声が入力される。

音声入力装置５００は、本体５０１、コード５０２、及びコネクタ５０３を有する。本体５０１は、話者の手で把持されるのに適するサイズ及び形状に構成されており、マイクロフォン、スピーカー、電子回路、ノイズ低減装置を内蔵する。図１３（ａ）に示すように、本体５０１の前面にはスピーカー５０６および音声用マイクロフォン５０５が設けられている。図１３（ｂ）に示すように、本体５０１の背面には参照音用マイクロフォン５０８およびベルトクリップ５０７が設けられている。本体５０１の頂面には、ＬＥＤ５０９が設けられている。本体５０１の側面にはＰＴＴ（Push To Talk）５０４が設けられている。ＬＥＤ５０９は、音声入力装置５００による話者の音声の検出状態を話者に対して報知する。ＰＴＴ５０４は、無線通信装置５１０を音声送信状態とするためのスイッチであり、突起状部分が筐体内に押し込まれることを検出する。

本実施の形態にかかるノイズ低減装置１'（図８参照）は音声入力装置５００に内蔵されており、ノイズ低減装置１'が備える音声用マイクロフォン１１１が音声入力装置５００の音声用マイクロフォン５０５に対応し、ノイズ低減装置１'が備える参照音用マイクロフォン１１２が音声入力装置５００の参照音用マイクロフォン５０８に対応している。また、ノイズ低減装置１'から出力される出力信号２９は、音声入力装置５００のコード５０２を経由して無線通信装置５１０に供給される。すなわち、音声入力装置５００は、ノイズ低減装置１'でノイズ低減処理された後の出力信号２９を、無線通信装置５１０に供給する。よって、無線通信装置５１０から他の無線通信装置に送信される音声はノイズ低減処理された音声となる。

次に、本実施の形態にかかるノイズ低減装置を用いた無線通信装置（トランシーバー）６００について説明する。図１４は、本実施の形態にかかるノイズ低減装置を用いた無線通信装置６００の一例を示す図である。図１４（ａ）は、無線通信装置６００の前面図であり、図１４（ｂ）は、無線通信装置６００の背面図である。図１４に示すように、無線通信装置６００は、入力ボタン６０１、表示部６０２、スピーカー６０３、音声用マイクロフォン６０４、ＰＴＴ（Push To Talk）６０５、スイッチ６０６、アンテナ６０７、参照音用マイクロフォン６０８、および蓋６０９を備える。

本実施の形態にかかるノイズ低減装置１'（図８参照）は無線通信装置６００に内蔵されており、ノイズ低減装置１'が備える音声用マイクロフォン１１１が無線通信装置６００の音声用マイクロフォン６０４に対応し、ノイズ低減装置１'が備える参照音用マイクロフォン１１２が無線通信装置６００の参照音用マイクロフォン６０８に対応している。また、ノイズ低減装置１'から出力される出力信号２９は、無線通信装置６００の内部回路において高周波処理されて、アンテナ６０７から他の無線通信装置に無線送信される。ここで、ノイズ低減装置１'から出力される出力信号２９はノイズ低減処理が実施された信号であるので、他の無線通信装置に送信される音声はノイズ低減処理された音声となる。ユーザによるＰＴＴ６０５の押下により音の送信が開始されたときに、ノイズ低減処理を開始し、ユーザがＰＴＴ６０８の押下を中止して、音の送信が終了したときに、ノイズ低減処理を終了する。

以上、本発明を上記実施形態に即して説明したが、上記実施形態の構成にのみ限定されるものではなく、本願特許請求の範囲の請求項の発明の範囲内で当業者であればなし得る各種変形、修正、組み合わせを含むことは勿論である。例えば、参照音用マイクロフォンは２つ以上の参照音用マイクロフォンから１つを選択するものであってもよい。

１１音声区間判定部
１２音声方向判定部
１３ノイズ低減処理部
１４適応フィルタ
１５適応係数調整部
１６ノイズ低減量調整部
１７、１８加算器
２１収音信号（音声信号）
２２収音信号（参照信号）
２３音声区間情報
２４音声方向情報
２５ノイズ推定信号
２６フィードバック信号
２８調整後のノイズ推定信号
２９出力信号
１１１音声用マイクロフォン
１１２参照音用マイクロフォン

Claims

第１の収音信号に基づき音声区間を判定する音声区間判定部と、
前記音声区間において、第２の収音信号と前記第１の収音信号とを用いて音声の到来方向を判定する音声方向判定部と、
前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減すると共に、前記音声の到来方向に応じてノイズ低減量を調整するノイズ低減処理部と、を備え、
前記ノイズ低減処理部は、
前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分に対応したノイズ推定信号を生成する適応フィルタと、
前記第１の収音信号と前記ノイズ推定信号との演算結果に基づき前記適応フィルタの適応係数を調整する適応係数調整部と、
前記音声の到来方向に応じて前記ノイズ推定信号を調整するノイズ低減量調整部と、
前記ノイズ低減量調整部で調整された後のノイズ推定信号と前記第１の収音信号とを用いて前記第１の収音信号に含まれるノイズ成分を低減する演算部と、を備える、
ノイズ低減装置。
前記音声方向判定部は、前記第１の収音信号および前記第２の収音信号の位相差に基づき前記音声の到来方向を判定する、請求項１に記載のノイズ低減装置。
前記音声方向判定部は、前記第１および第２の収音信号のうちの一方を基準信号とする基準信号サンプル群と他方を比較信号とする比較信号サンプル群とを用いて取得された相互相関値から位相差を算出する、請求項２に記載のノイズ低減装置。
前記ノイズ低減処理部は、前記音声方向判定部において前記第１の収音信号と前記第２の収音信号の位相差が所定の範囲内であると判定された場合、および前記第１の収音信号の位相が前記第２の収音信号の位相よりも遅いと判定された場合の少なくとも一方の場合に、前記ノイズ低減処理部におけるノイズ低減量を低減する、請求項２または３に記載のノイズ低減装置。
前記音声方向判定部は、前記第１の収音信号の大きさおよび前記第２の収音信号の大きさの差であるパワー差に基づき前記音声の到来方向を判定する、請求項１に記載のノイズ低減装置。
前記ノイズ低減処理部は、前記音声方向判定部において前記第１の収音信号の大きさと前記第２の収音信号の大きさとの差であるパワー差が所定の範囲内であると判定された場合、および前記第１の収音信号の大きさが前記第２の収音信号の大きさよりも小さいと判定された場合の少なくとも一方の場合に、前記ノイズ低減処理部におけるノイズ低減量を低減する、請求項５に記載のノイズ低減装置。
前記音声方向判定部は、前記第１の収音信号および前記第２の収音信号の位相差、並びに前記第１の収音信号の大きさおよび前記第２の収音信号の大きさの差であるパワー差に基づき前記音声の到来方向を判定する、請求項１に記載のノイズ低減装置。
前記ノイズ低減量調整部は、前記音声の到来方向に応じて前記ノイズ推定信号に０以上１以下の係数を乗算することで前記ノイズ推定信号を調整する、請求項１乃至７のいずれか一項に記載のノイズ低減装置。
前記ノイズ低減量調整部は、前記ノイズ推定信号を調整する際に当該ノイズ推定信号が急激に変化することを抑制する緩和処理を実施する、請求項８に記載のノイズ低減装置。
前記音声区間判定部は、前記第１の収音信号に音声成分が含まれる確率が所定の値以上となった場合に音声区間であると判定する、請求項１乃至９のいずれか一項に記載のノイズ低減装置。
前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の母音周波数成分のピークと帯域毎に設定されたノイズレベルとの比が所定の値以上であり、且つ、当該所定の値以上のピークの数が所定数以上である場合に音声区間であると判定する、請求項１乃至９のいずれか一項に記載のノイズ低減装置。
前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の子音スペクトルパターンを所定の周波数帯域毎に測定し、前記周波数帯域の増加に従い前記子音スペクトルパターンが増加する場合に音声区間であると判定する、請求項１乃至９のいずれか一項に記載のノイズ低減装置。
請求項１乃至１２のいずれか一項に記載のノイズ低減装置を備えた音声入力装置であって、
第１のマイクロフォンは前記音声入力装置の第１の面に設けられ、
第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられている、
音声入力装置。
請求項１乃至１２のいずれか一項に記載のノイズ低減装置を備えた無線通信装置であって、
第１のマイクロフォンは前記無線通信装置の第１の面に設けられ、
第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられている、
無線通信装置。
第１の収音信号に基づき音声区間を判定するステップと、
前記音声区間において、第２の収音信号と前記第１の収音信号とを用いて音声の到来方向を判定するステップと、
前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減すると共に、前記音声の到来方向に応じてノイズ低減量を調整するステップと、を備え、
前記ノイズ成分を低減するステップは、
前記第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分に対応したノイズ推定信号を生成するステップと、
前記第１の収音信号と前記ノイズ推定信号との演算結果に基づき、前記ノイズ推定信号を生成する際に用いる適応フィルタの適応係数を調整するステップと、
前記音声の到来方向に応じて前記ノイズ推定信号を調整するステップと、
前記調整された後のノイズ推定信号と前記第１の収音信号とを用いて前記第１の収音信号に含まれるノイズ成分を低減するステップと、を備える、
ノイズ低減方法。