JP5233914B2 - ノイズ低減装置およびノイズ低減プログラム - Google Patents

ノイズ低減装置およびノイズ低減プログラム Download PDF

Info

Publication number
JP5233914B2
JP5233914B2 JP2009198989A JP2009198989A JP5233914B2 JP 5233914 B2 JP5233914 B2 JP 5233914B2 JP 2009198989 A JP2009198989 A JP 2009198989A JP 2009198989 A JP2009198989 A JP 2009198989A JP 5233914 B2 JP5233914 B2 JP 5233914B2
Authority
JP
Japan
Prior art keywords
input
voice
voice input
unit
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009198989A
Other languages
English (en)
Other versions
JP2011048302A (ja
Inventor
桂樹 岡林
利知 金岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009198989A priority Critical patent/JP5233914B2/ja
Publication of JP2011048302A publication Critical patent/JP2011048302A/ja
Application granted granted Critical
Publication of JP5233914B2 publication Critical patent/JP5233914B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

この発明は、ノイズ低減装置およびノイズ低減プログラムに関する。
従来より、ショッピングセンタなどの公共スペースにおいて、音声コミュニケーションを使った対人サービスを行うサービス提供装置が存在する。このサービス提供装置は、発話者から入力される発話音声について音声認識処理や音声合成処理を実行し、発話者の発話内容を認識することにより、音声コミュニケーションによる対人サービスを実現する。
そして、このサービス提供装置に関し、発話者から入力される発話音声を正確に認識することを目的として、例えば、発話音声とともに入力される周囲のノイズを低減する技術が提案されている。例えば、指向性マイクを利用したり、複数のマイクでアレイマスクを構成したりすることにより、発話音声の入力方向外の音を低減する技術などがある。
特開2008−304498号公報
しかしながら、上記の指向性マイクを用いた技術では、発話者と同じ方向から入力されるノイズを低減できないという問題点があった。そのため、例えば、指向性マイクを用いた技術を上述したサービス提供装置に適用した場合には、発話音声の認識率が低下する。また、例えば、指向性マイクを用いた技術をハンズフリーフォンに適用した場合には、発話音声の復元精度が低下する。
開示の技術は、上記に鑑みてなされたものであって、発話者と同じ方向から入力されるノイズを低減することが可能なノイズ低減装置およびノイズ低減プログラムを提供することを目的とする。
本願の開示する技術は、一つの態様において、指向性の角度が重ならないように配置される複数の音声入力装置から音声をそれぞれ入力する音声入力部と、前記音声入力部を介して入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、前記複数の音声入力装置から音声入力装置を一つ選択する選択部と、所定周波数ごとに、前記選択部により選択された音声入力装置から前記音声入力部を介して入力された音声の入力値と、前記選択された音声入力装置以外の音声入力装置から前記音声入力部を介して入力された音声の入力値との差をそれぞれ算出する算出部と、前記算出部により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する判定部と、前記選択された音声入力装置から前記音声入力部を介して入力された音声が有する周波数成分のうち、前記判定部により前記入力値の差が所定の閾値以下であると判定された時の所定周波数に対応する成分を抑制する抑制部とを有する。
本願の開示する技術の一つの態様によれば、発話者と同じ方向から入ってくるノイズを低減できる。
図1は、実施例1に係るノイズ低減装置を示す図である。 図2は、実施例2に係るノイズ低減装置を説明する図である。 図3は、実施例2に係るノイズ低減装置の構成を示す図である。 図4は、実施例2に係るメインマイクとサブマイクのある周波数におけるパワー差を示す図である。 図5は、実施例2に係るノイズ低減装置による処理の流れを示す図である。 図6は、実施例3に係るノイズ低減装置の構成を示す図である。 図7は、ノイズ低減プログラムを実行するコンピュータを示す図である。
以下に、図面を参照しつつ、本願の開示するノイズ低減装置およびノイズ低減プログラムの一実施形態について詳細に説明する。なお、以下では、本願の開示するノイズ低減装置およびノイズ低減プログラムの一実施形態として後述する実施例により、本願が開示する技術が限定されるものではない。
図1は、実施例1に係るノイズ低減装置を示す図である。同図に示すように、実施例1に係るノイズ低減装置は、音声入力部と、選択部と、算出部と、判定部と、抑制部とを有する。
音声入力部は、指向性の角度が重ならないように配置する複数の音声入力装置から音声をそれぞれ入力する。選択部は、音声入力部を介して入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、複数の音声入力装置から音声入力装置を一つ選択する。算出部は、所定周波数ごとに、選択部により選択された音声入力装置を介して入力された音声の入力値と、当該選択された音声入力装置以外の音声入力装置を介して入力された音声の入力値との差をそれぞれ算出する。判定部は、算出部により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する。抑制部は、選択部により選択された音声入力装置を介して入力された音声が有する周波数から、判定部により入力値の差が所定の閾値以下であると判定された所定周波数の成分を抑制する。
すなわち、実施例1に係るノイズ低減装置は、処理対象となる音声を入力する音声入力装置を選択する。そして、実施例1に係るノイズ低減装置は、入力値の差が所定の閾値を越えていると判定部により判定された所定周波数に対応する周波数成分はノイズであるとして、先に選択した音声入力装置から入力する音声の周波数成分から抑制する。このようなことから、実施例1に係るノイズ低減装置は、発話者と同じ方向から入ってくるノイズを低減できる。
図2は、実施例2に係るノイズ低減装置を説明する図である。同図には、指向性の角度が重ならないように配置する複数の超指向性マイクであるマイク1〜3、近くの音源、遠くの音源の配置例を示す。また、マイク1〜3からノイズ低減装置に入力される同一周波数の音声のパワー(電圧値または電力値)を音源ごとに示す。
図2に示すように、音源が近い時、すなわち、マイク1〜3を介して発話者から音声が入力されるのと同様のケースでは、マイク1〜3からノイズ低減装置に入力される音声のパワー差は大きい。一方、音源が遠い時、すなわち、マイク1〜3の近くに発話者が存在せず、マイク1〜3を介してBGMやアナウンスなどが入力されるのと同様のケースでは、マイク1〜3からノイズ低減装置に入力される音声のパワー差は小さい。
そこで、実施例2に係るノイズ低減装置は、この点に着目して、マイク1〜3から入力される各音声のパワー差が小さい音声の周波数成分は、遠くの音源からの音声、すなわち、BGMやアナウンスなど、発話音声以外のノイズであると判定する。そして、入力される音声が処理対象音声となるメインマイクから入力される音声の周波数成分のうち、音声のパワー差が小さいと判定された周波数成分を抑制する。このようにして、実施例2に係るノイズ低減装置は、発話者と同一の方向から入力されるノイズを低減する。
[ノイズ低減装置の構成(実施例2)]
図3は、実施例2に係るノイズ低減装置の構成を示す図である。なお、以下では、実施例2に係るノイズ低減装置を、ショッピングセンタなどの公共スペースにおいて、音声コミュニケーションを使った対人サービスを行う対人サービスロボットに適用した場合の一実施形態について説明する。
図3に示すように、対人サービスロボット100は、超指向性のマイク110〜130と、ノイズ低減装置140と、音声認識部150と、ロボットコントローラ160と、スピーカ170とを有する。
マイク110〜130は、指向性の角度が重ならないように配置され、発話者からの発話音声や、BGMや場内アナウンスなどの音声の入力を受け付ける。
ノイズ低減装置140は、図3に示すように、フーリエ変換部141〜143およびノイズ低減制御部144を有する。
フーリエ変換部141〜143は、マイク110〜130により入力が受け付けられた各音声データをフーリエ変換し、周波数ごとのパワーを算出する。例えば、フーリエ変換部141は、マイク110により入力が受け付けられた音声データをフーリエ変換して、マイク110により入力が受け付けられた音声データを周波数とパワー(例えば、電圧値や電力値)からなる音声データに変換する。同様に、フーリエ変換部142は、マイク120により入力が受け付けられた音声データをフーリエ変換して、マイク120により入力が受け付けられた音声データを周波数とパワーからなる音声データに変換する。同様に、フーリエ変換部143は、マイク130により入力が受け付けられた音声データをフーリエ変換して、マイク130により入力が受け付けられた音声データを周波数とパワーからなる音声データに変換する。
ノイズ低減制御部144は、メインマイク選択処理部144a、周波数パワー比較部144bおよびノイズ抑制処理部144cを有する。なお、ノイズ低減制御部144は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA (Field Programmable Gate Array)などの集積回路であってもよい。また、ノイズ低減制御部144は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路であってもよい。
メインマイク選択処理部144aは、フーリエ変換部141〜143によりフーリエ変換された各音声データに基づいて、認識処理の対象となる音声が入力されるメインマイクを選択する。例えば、メインマイク選択処理部144aは、マイク110〜130から入力される各音声データのパワーを各音声データが有する所定周波数ごとに加算し、加算された値が各所定周波数において最も大きいマイクをメインマイクとして選択する。
周波数パワー比較部144bは、所定周波数ごとに、メインマイクから入力されるパワー(例えば、電圧値や電力値)と、メインマイク以外のマイクであるサブマイクから入力されるパワーとを比較し、メインマイクのパワーとサブマイクのパワー差を算出する。そして、周波数パワー比較部144bは、算出したパワー差が所定の閾値よりも小さいか否かを判定し、判定結果に応じて、メインマイクから入力される音声の周波数成分に対する抑制指示を後述するノイズ抑制処理部144cに送る。
例えば、周波数パワー比較部144bは、処理対象となる最初の処理対象周波数を選択し、選択した処理対象周波数に対応する周波数のパワーを、メインマイクおよびサブマイクの各々から入力された音声からそれぞれ取得する。メインマイクおよびサブマイクの音声のパワー取得後、周波数パワー比較部144bは、メインマイクおよびサブマイクの各々から取得した処理対象周波数に対応する周波数の音声のパワー差を算出する。
音声のパワー差算出後、周波数パワー比較部144bは、算出したパワー差の中で最大のパワー差が所定の閾値よりも小さいか否かを判定する。図4は、実施例2に係るメインマイクとサブマイクのある周波数におけるパワー差を示す図である。同図の縦軸は、マイクに入力されるパワーを示し、同図の横軸は、マイクの種別(マイク1〜3)を示す。また、同図では、ある処理対象周波数「fm」に関し、メインマイクおよびサブマイクの各々から入力される音声のパワーの一例を示す。同図に示すように、周波数パワー比較部144bは、処理対象周波数が「fm(mは整数)」である時のマイク2(メイン)とマイク1(サブ)とのパワー差、マイク2(メイン)とマイク3(サブ)とのパワー差をそれぞれ算出する。そして、周波数パワー比較部144bは、算出したパワー差のうち、大きい方のパワー差であるマイク2とマイク1とのパワー差(tmax)が所定の閾値より小さいか否か判定することとなる。なお、上記の処理対象周波数「fm」として、例えば、5Hz、10Hz、15Hzなど、5Hz刻みの周波数を設定してもよい。また、マイク1〜3から入力される音声をフーリエ変換したときに、各音声のパワー(ピーク)が現れる周波数を、小さい周波数から順に処理対象周波数として設定してもよい。
判定の結果、パワー差が所定の閾値よりも小さい場合には、周波数パワー比較部144bは、メインマイクから入力される音声の周波数成分のうち、現在の処理対象である処理対象周波数に対応する成分の抑制指示を後述するノイズ抑制処理部144cに送る。一方、判定の結果、パワー差が所定の閾値以上である場合には、周波数パワー比較部144bは、処理対象となる全ての周波数について処理が完了しているか否かを判定する。
判定の結果、処理対象となる全ての周波数について処理が完了していない場合には、周波数パワー比較部144bは、次の処理対象周波数を選択し、上述した処理と同様の処理を実行する。これとは反対に、判定の結果、処理対象となる全ての周波数について処理が完了している場合には、周波数パワー比較部144bは、ノイズ抑制処理部144cに、現在までの処理結果を出力するように指示する。
また、周波数パワー比較部144bは、後述するノイズ抑制処理部144cから、次の処理対象周波数について、メインマイクおよびサブマイクの音声のパワー差を算出するように指示を受け付けた場合にも、上述した処理と同様の処理を実行する。
ノイズ抑制処理部144cは、周波数パワー比較部144bから抑制指示を受け付けると、メインマイクから入力される音声の周波数成分のうち、現在の処理対象周波数に対応する周波数の成分を抑制する。例えば、ノイズ抑制処理部144cは、「Pmfm=Pmfm−αPsfm」の数式を用いた演算処理を行うことにより、処理対象周波数に対応する周波数の成分を抑制する。ここで、「Pmfm」はメインマイクの周波数fmにおけるパワーを示し、「Psfm」はサブマイクの周波数fmにおけるパワーを示し、「α」は抑制ゲインを示す。なお、周波数成分とは、例えば、その周波数のパワー(例えば、電圧値や電力値)を示す。
ノイズ抑制処理部144cは、周波数パワー比較部144bから抑制指示に応じて、抑制指示された処理対象周波数に対応する周波数の成分を抑制した後、処理対象となる全ての周波数について処理が完了しているか否かを判定する。判定の結果、処理対象となる全ての周波数について処理が完了していない場合には、ノイズ抑制処理部144cは、次の処理対象周波数を選択し、メインマイクとサブマイクのパワー差を算出するように周波数パワー比較部144bに指示を送る。
一方、判定の結果、処理対象となる全ての周波数について処理が完了している場合には、ノイズ抑制処理部144cは、次のように処理を行う。すなわち、ノイズ抑制処理部144cは、メインマイクから入力される音声の周波数成分のうち、抑制指示の対象となる周波数成分が全て抑制されたメインマイクの音声データを処理結果として後述する音声認識部150に出力する。また、ノイズ抑制処理部144cは、周波数パワー比較部144bから、処理結果を出力するように指示を受け付けた場合にも、処理結果を音声認識部150に出力する。
音声認識部150は、ノイズ抑制処理部144cから音声データを受け付けると、受け付けた音声データの認識処理を実行し、認識処理結果をロボットコントローラに送る。ロボットコントローラ160は、音声認識部150から受け付けた認識処理結果に返答する音声データを生成し、生成した音声データをスピーカ170を介して出力する。
[ノイズ低減装置による処理(実施例2)]
図5は、実施例2に係るノイズ低減装置により処理の流れを示す図である。同図に示すように、マイク110〜130により音声の入力が受け付けられると(ステップS1肯定)、フーリエ変換部141〜143は、マイク110〜130から入力された各音声データをフーリエ変換し、周波数ごとのパワーを算出する(ステップS2)。
メインマイク選択処理部144aは、フーリエ変換部141〜143によりフーリエ変換された各音声データに基づいて、入力される音声が認識処理の対象となるメインマイクを選択する選択処理を実行する(ステップS3)。メインマイクの選択後、メインマイク選択処理部144aは、処理対象周波数「fm」に処理番号(m=0,1,2・・・n)を付与する(ステップS4)。例えば、5Hz、10Hz、15Hzなど、5Hz刻みの周波数を小さい方から順に処理番号を付与し、「fm(m=0):5Hz」、「fm(m=1):10Hz」、「fm(m=2):15Hz」など、5Hz刻みに処理対象周波数として設定する。
周波数パワー比較部144bは、処理対象となる最初の周波数「fm(m=0)」を選択する(ステップS5)。そして、周波数パワー比較部144bは、選択した周波数「fm」に対応する周波数のパワーを、メインマイクおよびサブマイクの各々から入力された音声からそれぞれ取得する(ステップS6)。メインマイクおよびサブマイクの音声のパワー取得後、周波数パワー比較部144bは、メインマイクおよびサブマイクの各々から取得した周波数「fm」に対応する周波数の音声のパワー差を算出する(ステップS7)。
音声のパワー差算出後、周波数パワー比較部144bは、算出したパワー差の中で最大のパワー差(tmax)が所定の閾値(Td)よりも小さいか否かを判定する(ステップS8)。周波数パワー比較部144bは、パワー差が所定の閾値よりも小さいと判定した場合には(ステップS8肯定)、メインマイクから入力される音声の周波数成分のうち、現在の処理対象周波数「fm」に対応する成分の抑制指示をノイズ抑制処理部144cに送る。
ノイズ抑制処理部144cは、周波数パワー比較部144bから抑制指示を受け付けると、メインマイクから入力される音声の周波数成分のうち、処理対象である現在の周波数「fm」に対応する周波数の成分を抑制する(ステップS9)。
ノイズ抑制処理部144cは、処理対象周波数に対応する周波数の成分を抑制した後、処理対象となる全ての周波数について処理が完了しているか否か(m>n)を判定する(ステップS10)。ノイズ抑制処理部144cは、処理対象となる全ての周波数について処理が完了していると判定した場合には(ステップS10肯定)、ノイズ抑制処理部144cは、抑制指示の対象となる周波数成分が全て抑制されたメインマイクの音声データを処理結果として音声認識部150に出力する(ステップS11)。
一方、ノイズ抑制処理部144cは、処理対象となる全ての周波数について処理が完了していないと判定した場合には(ステップS10否定)、処理対象となる次の周波数「fm(m=m+1)」を選択する(ステップS12)。そして、ノイズ抑制処理部144cは、メインマイクとサブマイクのパワー差を算出するように周波数パワー比較部144bに指示を送る。
以後、上述したステップS7〜10の処理が実行される。すなわち、周波数パワー比較部144bは、ノイズ抑制処理部144cからの指示に応じて、処理対象となる次の周波数「fm(m=m+1)」について、メインマイクとサブマイクのパワー差を算出する(ステップS7)。次に、ノイズ抑制処理部144cは、算出したパワー差の中で最大のパワー差(tmax)が所定の閾値(Td)よりも小さいか否かを判定する(ステップS8)。周波数パワー比較部144bにより、パワー差が所定の閾値よりも小さいと判定された場合には(ステップS8肯定)、ノイズ抑制処理部144cは、メインマイクから入力される音声の周波数成分のうち、現在の周波数「fm」に対応する周波数の成分を抑制する(ステップS9)。一方、パワー差が所定の閾値よりも小さくないと判定した場合には(ステップS8否定)、周波数パワー比較部144bは、処理対象となる全ての周波数について処理が完了しているか否かを判定する(ステップS10)。なお、処理対象となる次の周波数「fm(m=m+1)」について、メインマイクおよびサブマイクにパワーが存在しない場合には、次の処理対象となる次の周波数「fm(m=m+2)」を選択する。
ここで、ステップS8の説明に戻ると、周波数パワー比較部144bは、パワー差が所定の閾値よりも小さくないと判定した場合には(ステップS8否定)、上述したステップS10〜12と同様の処理を実行する。すなわち、周波数パワー比較部144bは、処理対象となる全ての周波数について処理が完了しているか否かを判定する(ステップS10)。周波数パワー比較部144bにより、処理対象となる全ての周波数について処理が完了していると判定された場合には(ステップS10肯定)、ノイズ抑制処理部144cは、処理結果を音声認識部150に出力する(ステップS11)。一方、周波数パワー比較部144bは、処理対象となる全ての周波数について処理が完了していないと判定した場合には(ステップS10否定)、周波数パワー比較部144bは、処理対象となる次の周波数「fm(m=m+1)」を選択する(ステップS12)。そして、周波数パワー比較部144bは、処理対象となる次の周波数「fm(m=m+1)」について、メインマイクとサブマイクのパワー差を算出するメインマイクとサブマイクのパワー差を算出する。
なお、上述してきた実施例2に係るノイズ低減装置140の処理の流れでは、パワー差が所定の閾値よりも小さいと判定されるごとに、メインマイクから入力される音声の周波数成分から、処理対象の周波数に対応する周波数成分を抑制する場合を説明した。例えば、図5に示すステップS7〜ステップ10、ステップS12までの処理がこれに該当する。しかしながら、図5に示すステップS7〜ステップ10、ステップS12までの処理の流れに限定されるものではない。例えば、ノイズ抑制処理部144cは、周波数パワー比較部144bから抑制指示があるごとに保留しておく。そして、ノイズ抑制処理部144cは、周波数パワー比較部144bからの抑制指示が全て受け付けられるのを待って、抑制指示された処理対象周波数に対応する周波数の成分を一度に抑制するようにしてもよい。
[実施例2による効果]
上述してきたように、実施例2によれば、ノイズ低減装置140は、指向性の角度が重ならないように配置されたマイク110〜130から音声をそれぞれ入力し、入力された各音声のパワーを処理対象となる周波数ごとに比較する。そして、ノイズ低減装置140は、入力される音声が認識処理の対象となるメインマイクを選択する。メインマイクの選択後、ノイズ低減装置140は、処理対象周波数ごとに、メインマイクから入力された音声のパワーと、サブマイクから入力された音声のパワーとの差をそれぞれ算出する。パワー差の算出後、ノイズ低減装置140は、算出したパワー差が所定の閾値を越えているか否かを処理対象周波数ごとに判定する。そして、ノイズ低減装置140は、メインマイクから入力された音声が有する周波数成分のうち、パワー差が所定の閾値以下であると判定された時の処理対象周波数に対応する周波数成分を抑制する。
すなわち、ノイズ低減装置140は、メインマイクから入力された音声が有する周波数成分のうち、パワー差が所定の閾値以下であると判定された時の処理対象周波数を、発話音声以外のノイズに対応する周波数成分とする。そして、メインマイクから入力される音声の周波数成分のうち、パワー差が所定の閾値以下であると判定された時の処理対象周波数に対応する周波数成分を抑制する。このようなことから、実施例2によれば、発話者と同一の方向から入力されるノイズであっても低減できる。
また、実施例2によれば、対人サービスロボット100は、発話者と同一の方向から入力されるノイズを低減した音声データを音声認識処理できるので、利用者に対して良質なサービスを提供できる。
上述した実施例2に係るノイズ低減装置140は、ハンズフリーフォンに同様に適用することができる。図6は、実施例3に係るノイズ低減装置240の構成を示す図である。同図に示すように、ハンズフリーフォン200は、超指向性のマイク210〜230と、ノイズ低減装置240と、逆フーリエ変換部250とを有する。そして、ノイズ低減装置240は、実施例2に係るノイズ低減装置140と同様の構成である。
ノイズ低減装置240は、図6に示すように、フーリエ変換部241〜243およびノイズ低減制御部244を有する。なお、フーリエ変換部241〜243は、上述した図2に示すフーリエ変換部141〜143にそれぞれ対応し、ノイズ低減制御部244は、上述した図2に示すノイズ低減制御部144に対応する。
また、ノイズ低減制御部244は、図6に示すように、メインマイク選択処理部244a、周波数パワー比較部244bおよびノイズ抑制処理部244cを有する。なお、メインマイク選択処理部244a、周波数パワー比較部244bおよびノイズ抑制処理部244cは、上述した図2に示すメインマイク選択処理部144a、周波数パワー比較部144bおよびノイズ抑制処理部144cにそれぞれ対応する。フーリエ変換部241〜243およびノイズ低減制御部244は、実施例2において説明したフーリエ変換部141〜143およびノイズ低減制御部144と同様の処理機能を有し、同様の処理を実行する。
すなわち、フーリエ変換部241〜243は、マイク210〜230により入力が受け付けられた各音声データをフーリエ変換し、周波数ごとのパワーを算出する。
メインマイク選択処理部244aは、フーリエ変換部141〜143によりフーリエ変換された各音声データに基づいて、入力する音声が認識処理の対象となるメインマイクを選択する。
周波数パワー比較部244bは、処理対象周波数ごとに、メインマイクから入力されるパワー(例えば、電圧値や電力値)と、サブマイクから入力されるパワーとを比較し、メインマイクのパワーとサブマイクのパワー差を算出する。そして、周波数パワー比較部244bは、算出したパワー差が所定の閾値よりも小さいか否かを判定し、判定結果に応じて、メインマイクから入力される音声の周波数成分に対する抑制指示をノイズ抑制処理部244cに送る。
ノイズ抑制処理部244cは、周波数パワー比較部244bから抑制指示を受け付けると、メインマイクから入力される音声の周波数成分のうち、パワー差が所定の閾値よりも小さいと判定された時の処理対象周波数に対応する周波数の成分を抑制する。そして、ノイズ抑制処理部244cは、ノイズに対応する周波数成分を抑制したメインマイクの音声データを処理結果として逆フーリエ変換部250に出力する。
逆フーリエ変換部250は、ノイズ抑制処理部244cから受け付けた音声データを逆フーリエ変換して、逆フーリエ変換した音声データを接続先の端末に伝送する。
上述してきたように、実施例3によれば、ハンズフリーフォン200は、発話者と同一の方向から入力されるノイズを低減した音声データを接続先に伝送できるので、利用者に対して良質な音声サービスを提供できる。
以下、本願の開示するノイズ低減装置およびノイズ低減プログラムの他の実施形態を説明する。
(1)メインマイクの選択方法
上述した実施例2では、ノイズ低減装置140は、マイク110〜130から入力される各音声データのパワーを各音声データが有する所定周波数ごとに加算し、加算された値が各所定周波数において最も大きいマイクをメインマイクとして選択する場合を説明した。しかしながら、ノイズ低減装置140によるメインマイクの選択方法は、これに限定されるものではない。
例えば、ノイズ低減装置140は、マイク110〜130から入力された各音声のパワーの差を当該各音声が有する周波数ごとに算出する。そして、ノイズ低減装置は、算出したパワーの差が所定の閾値を超える周波数に対応する各音声のパワーを各音声ごとに加算し、加算された値が最大である音声の入力が行われたマイクをメインマイクとして選択するようにしてもよい。このようなことから、音声データのうち、パワー差がある周波数のデータのみを用いることにより、より発話音声を入力しているマイクをメインマイクとして精度良く選択できる。
また、例えば、ノイズ低減装置140は、マイク110〜130から一定時間内に入力された音声ごとに音圧の平均値を算出し、算出された音圧の平均値が最大である音声の入力が行われたマイクをメインマイクとして選択するようにしてもよい。このようなことから、音声のパワー(例えば、電圧値や電力値)以外の音声のパラメータに基づいて、メインマイクを選択できる。
(2)装置構成等
例えば、図2に示したノイズ低減装置140の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、ノイズ低減装置140の分散・統合の具体的形態は図示のものに限られず、例えば、周波数パワー比較部144bおよびノイズ抑制処理部144cを機能的および/または物理的に統合する。このように、ノイズ低減装置140の全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
(3)ノイズ低減プログラム
また、例えば、上記の実施例で説明したノイズ低減装置140の各種の処理(例えば、図5等参照)は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することもできる。
そこで、以下では、図7を用いて、上記の実施例で説明したノイズ低減装置140と同様の機能を有するノイズ低減プログラムを実行するコンピュータの一例を説明する。図7は、ノイズ低減プログラムを実行するコンピュータを示す図である。
同図に示すように、ノイズ低減装置としてコンピュータ300は、入出力制御部310、HDD320、RAM330およびCPU340をバス400で接続して構成される。
ここで、入出力制御部310は、各種データの入出力を制御する。HDD320は、CPU340による各種処理の実行に必要な情報を記憶する。RAM330は、各種情報を一時的に記憶する。CPU340は、各種演算処理を実行する。
そして、HDD320には、図7に示すように、例えば、図2に示したノイズ低減装置140の各処理部と同様の機能を発揮するノイズ低減プログラム321と、ノイズ低減用データ322とがあらかじめ記憶されている。なお、このノイズ低減プログラム321を適宜分散させて、ネットワークを介して通信可能に接続された他のコンピュータの記憶部に記憶させておくこともできる。
そして、CPU340が、このノイズ低減プログラム321をHDD320から読み出してRAM330に展開することにより、図7に示すように、ノイズ低減プログラム321はノイズ低減プロセス331として機能するようになる。
すなわち、ノイズ低減プロセス331は、ノイズ低減用データ322等をHDD320から読み出して、RAM330において自身に割り当てられた領域に展開し、この展開したデータ等に基づいて各種処理を実行する。
なお、ノイズ低減プロセス331は、例えば、図2に示したノイズ低減装置140の各処理部において実行される処理に対応する。例えば、図2に示すノイズ低減制御部144(メインマイク選択処理部144a、周波数パワー比較部144bおよびノイズ抑制処理部144c)において実行される処理に対応する。
なお、上記したノイズ低減プログラム321については、必ずしも最初からHDD320に記憶させておく必要はない。
例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ300がこれらから各プログラムを読み出して実行するようにしてもよい。
さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ300に接続される「他のコンピュータ(またはサーバ)」などに各プログラムを記憶させておく。そして、コンピュータ300がこれらから各プログラムを読み出して実行するようにしてもよい。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)指向性の角度が重ならないように配置される複数の音声入力装置から音声をそれぞれ入力する音声入力部と、
前記音声入力部を介して入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、前記複数の音声入力装置から音声入力装置を一つ選択する選択部と、
所定周波数ごとに、前記選択部により選択された音声入力装置から前記音声入力部を介して入力された音声の入力値と、前記選択された音声入力装置以外の音声入力装置から前記音声入力部を介して入力された音声の入力値との差をそれぞれ算出する算出部と、
前記算出部により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する判定部と、
前記選択された音声入力装置から前記音声入力部を介して入力された音声が有する周波数成分のうち、前記判定部により前記入力値の差が所定の閾値以下であると判定された時の所定周波数に対応する成分を抑制する抑制部と
を有することを特徴とするノイズ低減装置。
(付記2)前記選択部は、前記音声入力部を介して入力された音声ごとに、各音声が有する所定周波数ごとの入力値を加算し、当該加算された値が最大である音声の入力が行われた音声入力装置を選択することを特徴とする付記1に記載のノイズ低減装置。
(付記3)前記選択部は、前記音声入力部を介して入力された各音声の入力値の差を当該各音声が有する所定周波数ごとに算出し、当該算出した入力値の差が所定の閾値を超える所定周波数に対応する前記各音声の入力値を当該各音声ごとに加算し、当該加算された値が最大である音声の入力が行われた音声入力装置を選択することを特徴とする付記1に記載のノイズ低減装置。
(付記4)前記選択部は、前記音声入力部を介して一定時間内に入力された音声ごとに音圧の平均値を算出し、当該算出された音圧の平均値が最大である音声の入力が行われた音声入力装置を選択することを特徴とする付記1に記載のノイズ低減装置。
(付記5)コンピュータに、
指向性の角度が重ならないように配置される複数の音声入力装置から入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、前記複数の音声入力装置から音声入力装置を一つ選択する選択手順と、
所定周波数ごとに、前記選択手順により選択された音声入力装置を介して入力された音声の入力値と、前記選択された音声入力装置以外の音声入力装置を介して入力された音声の入力値との差をそれぞれ算出する算出手順と、
前記算出手順により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する判定手順と、
前記選択された音声入力装置を介して入力された音声が有する周波数成分のうち、前記判定部により前記入力値の差が所定の閾値以下であると判定された時の所定周波数に対応する成分を抑制する抑制手順と
を実行させることを特徴とするノイズ低減プログラム。
(付記6)指向性の角度が重ならないように配置される複数の音声入力装置から音声をそれぞれ入力する音声入力部と、
前記音声入力部を介して入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、前記複数の音声入力装置から音声入力装置を一つ選択する選択部と、
所定周波数ごとに、前記選択部により選択された音声入力装置から前記音声入力部を介して入力された音声の入力値と、前記選択された音声入力装置以外の音声入力装置から前記音声入力部を介して入力された音声の入力値との差をそれぞれ算出する算出部と、
前記算出部により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する判定部と、
前記選択された音声入力装置から前記音声入力部を介して入力された音声が有する周波数から、前記判定部により前記入力値の差が所定の閾値以下であると判定された所定周波数の成分を抑制する抑制部と、
前記選択された音声入力装置から前記音声入力部を介して入力された音声が有する周波数成分のうち、前記抑制部により前記入力値の差が所定の閾値以下であると判定された時の所定周波数に対応する成分を抑制された音声を認識する認識部と
を有することを特徴とする音声認識装置。
100 対人サービスロボット
110〜130 マイク
140 ノイズ低減装置
141〜143 フーリエ変換部
144 ノイズ低減制御部
144a メインマイク選択処理部
144b 周波数パワー比較部
144c ノイズ抑制処理部
150 音声認識部
160 ロボットコンローラ
170 スピーカ
200 ハンズフリーフォン
210〜230 マイク
240 ノイズ低減装置
241〜243 フーリエ変換部
244 ノイズ低減制御部
244a メインマイク選択処理部
244b 周波数パワー比較部
244c ノイズ抑制処理部
250 逆フーリエ変換部
300 コンピュータ
310 入出力制御部
320 HDD(Hard Disk Drive)
321 ノイズ低減プログラム
322 ノイズ低減用データ
330 RAM(Random Access Memory)
331 ノイズ低減プロセス
340 CPU(Central Processing Unit)
400 バス

Claims (5)

  1. 指向性の角度が重ならないように配置される複数の音声入力装置から音声をそれぞれ入力する音声入力部と、
    前記音声入力部を介して入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、前記複数の音声入力装置から音声入力装置を一つ選択する選択部と、
    所定周波数ごとに、前記選択部により選択された音声入力装置から前記音声入力部を介して入力された音声の入力値と、前記選択された音声入力装置以外の音声入力装置から前記音声入力部を介して入力された音声の入力値との差をそれぞれ算出する算出部と、
    前記算出部により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する判定部と、
    前記選択された音声入力装置から前記音声入力部を介して入力された音声が有する周波数成分のうち、前記判定部により前記入力値の差が所定の閾値以下であると判定された時の所定周波数に対応する成分を抑制する抑制部と
    を有することを特徴とするノイズ低減装置。
  2. 前記選択部は、前記音声入力部を介して入力された音声ごとに、各音声が有する所定周波数ごとの入力値を加算し、当該加算された値が最大である音声の入力が行われた音声入力装置を選択することを特徴とする請求項1に記載のノイズ低減装置。
  3. 前記選択部は、前記音声入力部を介して入力された各音声の入力値の差を当該各音声が有する所定周波数ごとに算出し、当該算出した入力値の差が所定の閾値を超える所定周波数に対応する前記各音声の入力値を当該各音声ごとに加算し、当該加算された値が最大である音声の入力が行われた音声入力装置を選択することを特徴とする請求項1に記載のノイズ低減装置。
  4. 前記選択部は、前記音声入力部を介して一定時間内に入力された音声ごとに音圧の平均値を算出し、当該算出された音圧の平均値が最大である音声の入力が行われた音声入力装置を選択することを特徴とする請求項1に記載のノイズ低減装置。
  5. コンピュータに、
    指向性の角度が重ならないように配置されて複数の音声入力装置から入力された各音声の入力値を当該各音声が有する所定周波数ごとに比較し、当該比較結果に基づいて、前記複数の音声入力装置から音声入力装置を一つ選択する選択手順と、
    所定周波数ごとに、前記選択手順により選択された音声入力装置を介して入力された音声の入力値と、前記選択された音声入力装置以外の音声入力装置を介して入力された音声の入力値との差をそれぞれ算出する算出手順と、
    前記算出手順により所定周波数ごとに算出された入力値の差が所定の閾値を越えているか否かを当該所定周波数ごとに判定する判定手順と、
    前記選択された音声入力装置を介して入力された音声が有する周波数成分のうち、前記判定部により前記入力値の差が所定の閾値以下であると判定された時の所定周波数に対応する成分を抑制する抑制手順と
    を実行させることを特徴とするノイズ低減プログラム。
JP2009198989A 2009-08-28 2009-08-28 ノイズ低減装置およびノイズ低減プログラム Expired - Fee Related JP5233914B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009198989A JP5233914B2 (ja) 2009-08-28 2009-08-28 ノイズ低減装置およびノイズ低減プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009198989A JP5233914B2 (ja) 2009-08-28 2009-08-28 ノイズ低減装置およびノイズ低減プログラム

Publications (2)

Publication Number Publication Date
JP2011048302A JP2011048302A (ja) 2011-03-10
JP5233914B2 true JP5233914B2 (ja) 2013-07-10

Family

ID=43834658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009198989A Expired - Fee Related JP5233914B2 (ja) 2009-08-28 2009-08-28 ノイズ低減装置およびノイズ低減プログラム

Country Status (1)

Country Link
JP (1) JP5233914B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5801638B2 (ja) * 2011-07-28 2015-10-28 株式会社ジャパンディスプレイ タッチパネル
JP5862349B2 (ja) * 2012-02-16 2016-02-16 株式会社Jvcケンウッド ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
JP2016515342A (ja) 2013-03-12 2016-05-26 ヒア アイピー ピーティーワイ リミテッド ノイズ低減法、およびシステム
CN105976829B (zh) * 2015-03-10 2021-08-20 松下知识产权经营株式会社 声音处理装置、声音处理方法
KR101993991B1 (ko) * 2017-10-30 2019-06-27 주식회사 시그널비젼 잡음 제거 방법 및 그 장치
JP7245034B2 (ja) * 2018-11-27 2023-03-23 キヤノン株式会社 信号処理装置、信号処理方法およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4518817B2 (ja) * 2004-03-09 2010-08-04 日本電信電話株式会社 収音方法、収音装置、収音プログラム
JP4929703B2 (ja) * 2005-12-19 2012-05-09 ヤマハ株式会社 放収音装置
JP2007295085A (ja) * 2006-04-21 2007-11-08 Kobe Steel Ltd 音源分離装置及び音源分離方法

Also Published As

Publication number Publication date
JP2011048302A (ja) 2011-03-10

Similar Documents

Publication Publication Date Title
CN109599124B (zh) 一种音频数据处理方法、装置及存储介质
JP5233914B2 (ja) ノイズ低減装置およびノイズ低減プログラム
US9286908B2 (en) Method and system for noise reduction
KR101970370B1 (ko) 오디오 신호의 처리 기법
JP6397158B1 (ja) 協調的なオーディオ処理
WO2016027680A1 (ja) 音声処理装置、音声処理方法、並びにプログラム
US10395644B2 (en) Speech recognition method, speech recognition apparatus, and non-transitory computer-readable recording medium storing a program
TW201401269A (zh) 基於系統狀態調整音訊波束成形設定
WO2013107307A1 (zh) 降噪方法及设备
JP2018533051A (ja) 協調的なオーディオ処理
JP5027127B2 (ja) 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上
JP6800809B2 (ja) 音声処理装置、音声処理方法およびプログラム
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
WO2018167960A1 (ja) 音声処理装置、音声処理システム、音声処理方法、および音声処理プログラム
WO2018193826A1 (ja) 情報処理装置、情報処理方法、音声出力装置、および音声出力方法
JP2017153065A (ja) 音声認識方法、音声認識装置及びプログラム
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
WO2019160006A1 (ja) ハウリング抑圧装置、その方法、およびプログラム
JP2009020471A (ja) 音処理装置およびプログラム
JP2012063614A (ja) マスキング音生成装置
KR101722686B1 (ko) 벨소리 출력 장치 및 방법
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
KR20190047885A (ko) 잡음 제거 방법 및 그 장치
JP2005157086A (ja) 音声認識装置
JP5054477B2 (ja) 補聴装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120510

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130311

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees