JP2011071702A - 収音処理装置、収音処理方法、及びプログラム - Google Patents
収音処理装置、収音処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2011071702A JP2011071702A JP2009220467A JP2009220467A JP2011071702A JP 2011071702 A JP2011071702 A JP 2011071702A JP 2009220467 A JP2009220467 A JP 2009220467A JP 2009220467 A JP2009220467 A JP 2009220467A JP 2011071702 A JP2011071702 A JP 2011071702A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound collection
- directivity
- information
- sounding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
【解決手段】収音処理部30は、相対位置が固定されている複数のマイクロフォンを備えたマイクアレイ2で収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号を生成する。発音体情報取得部10は、マイクアレイ2の収音範囲内に存在する発音体の数及び配置の情報の入力を取得する。収音指向性範囲設定部20は、マイクアレイ2から発音体に向ける収音指向性の向きを、発音体情報取得部10が取得した発音体についての配置の情報に基づき発音体の各々について設定する。更に、発音体に向ける収音指向性の鋭さについても、発音体情報取得部10が取得した発音体についての数の情報に基づき発音体の各々について設定する。収音処理部30は、収音指向性範囲設定部20が設定した向き及び鋭さに収音指向性を制御した出力音の信号を生成して出力する。
【選択図】図1
Description
マイクアレイ2は、複数のマイクロフォンを例えば水平方向に一列に並べて構成されている。なお、マイクアレイ2を構成している各マイクロフォン間の相対位置は固定されている。
発音体情報取得部10は、マイクアレイ2の収音範囲内に存在する発音体の数及び配置の情報の入力を取得する。なお、発音体としては、音を発するものであれば、例えば犬や猫などの動物でもよく、更には、スピーカを備えた放音装置や、あるいは、発音を本来の目的としてしない、騒音として動作音を発する機械などであってもよい。但し、図1の収音システムでは、マイクアレイ2の収音範囲内に存在する発音体として、発声を行う人間を想定しており、発音体情報取得部10は、マイクアレイ2の収音範囲内に存在する人間の数及び配置の情報の入力を顔の位置検出システム4から取得する。
指向性受音処理部31は、まず、マイクアレイ2で収音した上記の複数の収音信号の各々をアナログ−デジタル変換して、時間領域の収音信号データとする。次に、この収音信号データに対し、例えば高速フーリエ変換のような時間−周波数変換を施すことで、各収音信号の周波数スペクトルデータを求める。
次に、各スペクトル周波数について先に求めた位相差と、その位相差範囲との関係に基づき、重み付け値を設定する。例えば、位相差がその位相差範囲内であってその範囲の中心から所定値以内の近さであるスペクトルについては、この重み付け値を「1.0」に設定し、位相差がその位相差範囲外のスペクトルについては、この重み付け係数を「0.0」に設定する。また、位相差がその位相差範囲内であるがその範囲の中心から上記所定値以上に離れたものについては、「1.0」から「0.0」の範囲でその中心からの距離に応じた例えば一次補間を行い、範囲の境界で上述の設定値と連続するように重み付け値を設定する。
なお、位相差及び位相差範囲と上述した重み付け設定値との関係が予め示されているテーブルをスペクトル周波数毎に予めデータベース化して指向性受音処理部31に格納しておくようにしてもよい。この場合には、指向性受音処理部31は、このデータベースを参照して、各スペクトルにおける位相差及び位相差範囲に対応付けられている重み付け値をテーブルから読み出して設定する。
収音処理部30は以上のように構成されている。
収音装置1は以上の構成要素を備えている。
検出システム4は、まず、カメラ3での撮影画像から、人間の顔の像の検出処理を行う。この顔検出の手法には周知の技術を用いる。本実施形態では、画像から切り出した部分領域の画像と、予め用意しておいた顔パターンのデータベースから読み出した顔パターン画像の各々とを照合して両者の相関度を算出する処理を行う。この相関度は、例えば、顔の輪郭、目・鼻・口の相対位置、顔の色彩などに基づき総合的に算出する。そして、この相関度が所定値よりも高いものが存在した場合には、その部分領域を、人間の顔の像の検出結果とする。この処理を、部分領域の位置及び大きさを変えながら撮影画像の全体に亘って行うことで、撮影画像に含まれる顔の像の数と、各顔の像の撮影画像における位置及び大きさを検出する。このうちの撮影画像に含まれる顔の像の数の検出結果は、マイクアレイ2の収音範囲を撮影した画像から得られた、マイクアレイ2の収音範囲内に存在する発音体の数の情報として、検出システム4から出力される。
この図3では、カメラ3の撮影範囲内(すなわちマイクアレイ2の収音範囲内)に人間が二人(人A及び人B)在る場合を示している。ここで、検出システム4は、以上の処理により、図3に示されている人Aの方向角θA 、距離dA 、及び顔の角度θ2Aと、人Bの方向角θB 、距離dB 、及び顔の角度θ2Bとを求める。
図1の収音システムは、以上の構成要素を有している。
マイクアレイ2の収音範囲内に存在する人間が一人のみの場合には、収音指向性範囲設定部20は、この設定処理の実行により、収音指向性の鋭さを、その人への向きを中心とする±θMAX の角度に設定する。図4の(1)の例では、方向角θA が0°に位置する人Aに対し、収音指向性範囲設定部20は、±θMAX の角度に収音指向性の鋭さを設定する。
θA −θdef <−θMAX
θB +θdef >θMAX
の場合である。(マイクアレイ2から人Aまでの距離とマイクアレイ2から人Bまでの距離とは同一とする。)このような場合には、収音指向性範囲設定部20は、設定処理の実行により、人A及び人Bそれぞれについての収音指向性の角度範囲を示す方位角α及びβを、下記の数式で示される範囲内に設定する。
−θMAX < α <θA +θdef
θB −θdef < β <θMAX
−θA +θB <2θdef
の場合である。このような場合には、収音指向性範囲設定部20は、設定処理の実行により、人A及び人Bそれぞれについての収音指向性の角度範囲α及びβを、下記の数式で示される範囲内とする。
θA −θdef < α <(−θA +θB )/2
(−θA +θB )/2< β <θB +θdef
収音指向性範囲設定部20による収音指向性の向き及び鋭さの設定は、以上のようにして行われる。
除外発音体抽出部40は、まず、マイクアレイ2の収音範囲内に存在する発音体(人間)の配置の情報として、図3を用いて説明した各人についての方向角θ、距離d、及び顔の角度θ2 の各データとを、発音体情報取得部10から取得する処理を行う。
例えば、検出システム4が、撮影画像より検出した人の顔の像における口の動きの有無の情報を出力する場合には、収音指向性範囲設定部20は、前述の収音指向性の向き及び鋭さを、この口の動きの有無の情報に基づき設定するようにすることができる。
図1のように構成されている収音システムは、各構成要素が以上のように動作することで、複数の発音体による同時の発音の明瞭な収音が可能になる。
前述したように、指向性受音処理部31は、収音指向性範囲設定部20が設定した向き及び鋭さの収音指向性を得るための重み付けが与えられた収音信号の周波数スペクトルを出力し、出力音声信号生成部32は、これを時間領域の音声信号データに変換する。従って、指向性受音処理部31が出力する周波数スペクトルは、出力音声信号生成部32から出力される出力音声の信号の周波数スペクトルである。
図9のように構成されている収音システムは、以上のように動作する。
このコンピュータ50は、MPU51、ROM52、RAM53、ハードディスク装置54、入力装置55、表示装置56、インタフェース装置57、及び記録媒体駆動装置58を備えている。なお、これらの構成要素はバス59を介して接続されており、MPU51の管理の下で各種のデータを相互に授受することができる。
ROM(Read Only Memory)52は、所定の基本制御プログラムが予め記録されている読み出し専用半導体メモリである。MPU51は、この基本制御プログラムをコンピュータ50の起動時に読み出して実行することにより、このコンピュータ50の各構成要素の動作制御が可能になる。
インタフェース装置57は、このコンピュータ50に接続される各種機器との間での各種データの授受の管理を行う。より具体的には、検出システム4から送られてくるデータの受信、マイクアレイ2を構成しているマイクの各々から出力される収音信号のアナログ−デジタル変換と変換後の収音信号データの一時的なバッファリング、出力音声データの後続機器への送信などを行う。
図11において、この制御処理の実行が開始されると、まず、S101では、マイクアレイ2の収音範囲内の発音体の数と収音指向性の鋭さを示す角度との関係を定義する角度テーブルと、収音指向性の鋭さの最大値及び基準距離との初期設定処理が行われる。この処理では、上述した角度テーブルと、収音指向性の鋭さの最大値θMAX と、その発音体とマイクアレイ2との距離の基準値ddef とを入力装置55から取得してハードディスク装置54に格納する処理が行われる。なお、この処理は、収音指向性範囲設定部20としての動作のための処理である。
ここで、変化量の算出結果が所定の閾値を上回っていた場合、顔の向きが所定の閾値範囲外であった場合、あるいは、人間の口の動きが無かった場合には、そのような場合に該当した発音体を、出力音声の信号の音源から除外するものとして抽出する処理を行う。
この処理では、まず、S106の処理によりRAM53に格納しておいたマイク毎の収音信号データを読み出し、その各々について時間−周波数変換(例えばフーリエ変換)を施して、各収音信号の周波数スペクトルデータを求める処理が行われる。次に、収音信号のうちのひとつの周波数スペクトルデータを基準としたときの、その他の各収音信号の周波数スペクトルデータとの間でのスペクトルの位相差を、各スペクトル周波数について算出する処理が行われる。
S112では、出力音声生成処理が行われる。この処理は、出力音声信号生成部32としての動作のための処理である。この処理では、S109の指向性受音処理により重み付けが与えられた収音信号の周波数スペクトルに対し、指向性受音処理で行われた変換に対する逆変換(例えば高速フーリエ逆変換)を施して時間領域の音声信号データに変換して出力する処理が行われる。MPU51は、このS112の処理を終えたときには、S114に処理を進める。
なお、本発明は、これまでに説明した実施の形態に限定されるものではなく、実施段階では、その要旨を変更しない範囲で種々変形したり組み合わせたりすることが可能である。
(付記1)
相対位置が固定されている複数のマイクロフォンを備えたマイクアレイで収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号を生成する収音処理手段と、
該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報の入力を取得する取得手段と、
該マイクアレイから該発音体に向ける該収音指向性の向きを、該取得手段が取得した該発音体についての配置の情報に基づき該発音体の各々について設定すると共に、該発音体に向ける該収音指向性の鋭さを、該取得手段が取得した該発音体についての数の情報に基づき該発音体の各々について設定する収音指向性範囲設定手段と、
を有し、
該収音処理手段は、該収音指向性範囲設定手段が設定した向き及び鋭さに該収音指向性を制御した出力音の信号を生成して出力する、
ことを特徴とする収音装置。
(付記2)
該取得手段が取得する該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報は、該マイクアレイの収音範囲を撮影した画像から得られたものであること特徴とする付記1に記載の収音装置。
(付記3)
該収音指向性範囲設定手段は、該発音体に向ける該収音指向性の鋭さを、該取得手段が取得した該発音体についての数の情報に基づくと共に、更に、該取得手段が取得した該発音体についての配置の情報にも基づき、該発音体の各々について設定することを特徴とする付記1又は2に記載の収音装置。
(付記4)
該収音指向性範囲設定手段が該発音体に向ける該収音指向性の鋭さを設定する基礎とする該発音体についての配置の情報は、該マイクアレイの収音範囲内に存在する発音体同士の配置間隔の情報であることを特徴とする付記3に記載の収音装置。
(付記5)
該収音指向性範囲設定手段が該発音体に向ける該収音指向性の鋭さを設定する基礎とする該発音体についての配置の情報は、該発音体と該マイクアレイとの距離の情報であることを特徴とする付記3に記載の収音装置。
(付記6)
該収音指向性範囲設定手段は、該発音体と該マイクアレイとの距離が長い場合と比較して、該距離が短い場合に収音指向性の鋭さをより狭い角度に設定することを特徴とする付記5に記載の収音装置。
(付記7)
該取得手段が取得した該発音体の配置の情報に基づいて、該収音処理手段が生成する出力音の音源から除外する発音体を抽出する除外発音体抽出手段を更に有し、
該収音指向性範囲設定手段は、該収音指向性の向き及び鋭さを、該発音体のうち該除外発音体抽出手段により抽出されたもの以外のものについての情報に基づき設定する、
こと特徴とする付記1から6のうちのいずれか一項に記載の収音装置。
(付記8)
該除外発音体抽出手段は、該取得手段が取得した該発音体の配置の情報の変化量に基づき、該収音処理手段が生成する出力音の信号の音源から除外する発音体を抽出する、
ことを特徴とする付記7に記載の収音装置。
(付記9)
該発音体は人間であり、
該除外発音体抽出手段は、該取得手段が取得した該人間の配置の情報のうちの該人間の顔の向きの情報に基づいて、該収音処理手段が生成する出力音声の信号の音源から除外する発音体を抽出する、
ことを特徴とする付記7に記載の収音装置。
(付記10)
該発音体は人間であり、
該除外発音体抽出手段は、該取得手段が取得した該人間の口の動きの有無の情報に基づいて、該収音処理手段が生成する出力音声の信号の音源から除外する発音体を抽出する、
ことを特徴とする付記7に記載の収音装置。
(付記11)
該マイクアレイの収音範囲内に存在する発音体による発音の有無を検出する発音検出手段を更に有し、
該収音処理手段は、該発音検出手段により発音が検出されているときの該出力音の信号を出力する、
ことを特徴とする付記1から10のうちのいずれか一項に記載の収音装置。
(付記12)
該発音検出手段は、該出力音における所定の周波数帯の振幅レベルに基づいて、該発音体による発音の有無を検出することを特徴とする付記11に記載の収音装置。
(付記13)
該発音体は人間であり、
該所定の周波数帯が、人間の第一フォルマントの周波数帯に設定されている、
ことを特徴とする付記12に記載の収音装置。
(付記14)
該収音処理手段は、該マイクアレイで収音した収音信号の周波数スペクトルに対し、該収音指向性範囲設定手段が設定した向き及び鋭さの該収音指向性を得るための重み付けをスペクトル毎に与え、該重み付けが与えられた周波数スペクトルを時間軸情報に変換することによって、該出力音の信号を生成し、
該発音検出手段は、該重み付けが与えられた周波数スペクトルにおいてスペクトルが所定値以上であるものについての該スペクトルの加算合計値に基づいて、該発音体による発音の有無を検出する、
ことを特徴とする付記11に記載の収音装置。
(付記15)
該収音処理手段は、該マイクアレイで収音した収音信号の周波数スペクトルに対し、該収音指向性範囲設定手段が設定した向き及び鋭さの該収音指向性を得るための重み付けをスペクトル毎に与え、該重み付けが与えられた周波数スペクトルを時間領域の音声信号に変換することによって、該出力音の信号を生成し、
該発音検出手段は、該重み付けが与えられた周波数スペクトルにけるスペクトルの最大値に基づいて、該発音体による発音の有無を検出する、
ことを特徴とする付記11に記載の収音装置。
(付記16)
相対位置が固定されている複数のマイクロフォンを備えたマイクアレイで収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号を生成する収音方法であって、
該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報の入力を取得し、
該マイクアレイから該発音体に向ける該収音指向性の向きを、取得された該発音体についての配置の情報に基づき該発音体の各々について設定すると共に、該発音体に向ける該収音指向性の鋭さを、取得された該発音体についての数の情報に基づき該発音体の各々について設定し、
設定された向き及び鋭さに該収音指向性を制御した出力音の信号を生成して出力する、
ことを特徴とする収音方法。
(付記17)
相対位置が固定されている複数のマイクロフォンを備えたマイクアレイで収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号の生成をコンピュータに行わせるためのプログラムであって、該コンピュータに実行させることによって、
該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報の入力を取得する取得処理と、
該マイクアレイから該発音体に向ける該収音指向性の向きを、該取得処理で取得された該発音体についての配置の情報に基づき該発音体の各々について設定すると共に、該発音体に向ける該収音指向性の鋭さを、該取得処理により取得された該発音体についての数の情報に基づき該発音体の各々について設定する収音指向性範囲設定処理と、
該収音指向性範囲設定処理により設定された向き及び鋭さに該収音指向性を制御した出力音の信号を生成して出力する収音処理と、
を該コンピュータに行わせるためのプログラム。
2 マイクアレイ
3 カメラ
4 顔の位置検出システム
10 発音体情報取得部
20 収音指向性範囲設定部
30 収音処理部
31 指向性受音処理部
32 出力音声信号生成部
33 発音検出部
40 除外発音体抽出部
50 コンピュータ
51 MPU
52 ROM
53 RAM
54 ハードディスク装置
55 入力装置
56 表示装置
57 インタフェース装置
58 記録媒体駆動装置
59 バス
60 可搬型記録媒体
Claims (7)
- 相対位置が固定されている複数のマイクロフォンを備えたマイクアレイで収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号を生成する収音処理手段と、
該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報の入力を取得する取得手段と、
該マイクアレイから該発音体に向ける該収音指向性の向きを、該取得手段が取得した該発音体についての配置の情報に基づき該発音体の各々について設定すると共に、該発音体に向ける該収音指向性の鋭さを、該取得手段が取得した該発音体についての数の情報に基づき該発音体の各々について設定する収音指向性範囲設定手段と、
を有し、
該収音処理手段は、該収音指向性範囲設定手段が設定した向き及び鋭さに該収音指向性を制御した出力音の信号を生成して出力する、
ことを特徴とする収音装置。 - 該取得手段が取得した該発音体の配置の情報に基づいて、該収音処理手段が生成する出力音の音源から除外する発音体を抽出する除外発音体抽出手段を更に有し、
該収音指向性範囲設定手段は、該収音指向性の向き及び鋭さを、該発音体のうち該除外発音体抽出手段により抽出されたもの以外のものについての情報に基づき設定する、
こと特徴とする請求項1に記載の収音装置。 - 該除外発音体抽出手段は、該取得手段が取得した該発音体の配置の情報の変化量に基づき、該収音処理手段が生成する出力音の信号の音源から除外する発音体を抽出する、
ことを特徴とする請求項2に記載の収音装置。 - 該発音体は人間であり、
該除外発音体抽出手段は、該取得手段が取得した該人間の配置の情報のうちの該人間の顔の向きの情報に基づいて、該収音処理手段が生成する出力音の信号の音源から除外する発音体を抽出する、
ことを特徴とする請求項2に記載の収音装置。 - 該マイクアレイの収音範囲内に存在する発音体による発音の有無を検出する発音検出手段を更に有し、
該収音処理手段は、該発音検出手段により発音が検出されているときの該出力音の信号を出力する、
ことを特徴とする請求項1から4のうちのいずれか一項に記載の収音装置。 - 相対位置が固定されている複数のマイクロフォンを備えたマイクアレイで収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号を生成する収音方法であって、
該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報の入力を取得し、
該マイクアレイから該発音体に向ける該収音指向性の向きを、取得された該発音体についての配置の情報に基づき該発音体の各々について設定すると共に、該発音体に向ける該収音指向性の鋭さを、取得された該発音体についての数の情報に基づき該発音体の各々について設定し、
設定された向き及び鋭さに該収音指向性を制御した出力音の信号を生成して出力する、
ことを特徴とする収音方法。 - 相対位置が固定されている複数のマイクロフォンを備えたマイクアレイで収音した複数の収音信号に基づいて収音指向性を制御した出力音の信号の生成をコンピュータに行わせるためのプログラムであって、該コンピュータに実行させることによって、
該マイクアレイの収音範囲内に存在する発音体の数及び配置の情報の入力を取得する取得処理と、
該マイクアレイから該発音体に向ける該収音指向性の向きを、該取得処理で取得された該発音体についての配置の情報に基づき該発音体の各々について設定すると共に、該発音体に向ける該収音指向性の鋭さを、該取得処理により取得された該発音体についての数の情報に基づき該発音体の各々について設定する収音指向性範囲設定処理と、
該収音指向性範囲設定処理により設定された向き及び鋭さに該収音指向性を制御した出力音の信号を生成して出力する収音処理と、
を該コンピュータに行わせるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009220467A JP5564873B2 (ja) | 2009-09-25 | 2009-09-25 | 収音処理装置、収音処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009220467A JP5564873B2 (ja) | 2009-09-25 | 2009-09-25 | 収音処理装置、収音処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011071702A true JP2011071702A (ja) | 2011-04-07 |
JP5564873B2 JP5564873B2 (ja) | 2014-08-06 |
Family
ID=44016551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009220467A Active JP5564873B2 (ja) | 2009-09-25 | 2009-09-25 | 収音処理装置、収音処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5564873B2 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013135433A (ja) * | 2011-12-27 | 2013-07-08 | Fujitsu Ltd | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
JP2013179585A (ja) * | 2012-02-01 | 2013-09-09 | Nikon Corp | 音処理装置および音処理プログラム |
WO2014132533A1 (ja) * | 2013-03-01 | 2014-09-04 | シャープ株式会社 | 音声入力装置およびその音声入力装置を備えた画像表示装置 |
JP2014175996A (ja) * | 2013-03-12 | 2014-09-22 | Oki Electric Ind Co Ltd | パラメータ推定装置、パラメータ推定プログラム、機器決定システム及び機器決定プログラム |
JP2014207589A (ja) * | 2013-04-15 | 2014-10-30 | シャープ株式会社 | 音声入力装置、および画像表示装置 |
JP2015100125A (ja) * | 2012-12-27 | 2015-05-28 | パナソニックIpマネジメント株式会社 | 音声処理システム及び音声処理方法 |
JP2016021650A (ja) * | 2014-07-14 | 2016-02-04 | パナソニックIpマネジメント株式会社 | 収音制御装置及び収音システム |
JP2016181789A (ja) * | 2015-03-24 | 2016-10-13 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法、及び、プログラム |
JP2017126906A (ja) * | 2016-01-14 | 2017-07-20 | 株式会社リコー | 音声処理装置、音声処理方法及び音声処理プログラム |
JP2017521902A (ja) * | 2014-05-26 | 2017-08-03 | シャーマン, ウラディミールSHERMAN, Vladimir | 取得した音響信号のための回路デバイスシステム及び関連するコンピュータで実行可能なコード |
JP2020053920A (ja) * | 2018-09-28 | 2020-04-02 | 沖電気工業株式会社 | 収音装置、収音プログラム及び収音方法 |
CN112860065A (zh) * | 2021-02-05 | 2021-05-28 | Oppo广东移动通信有限公司 | 拾音控制方法、拾音控制装置、存储介质及电子设备 |
CN113767432A (zh) * | 2020-06-29 | 2021-12-07 | 深圳市大疆创新科技有限公司 | 音频处理方法、音频处理装置、电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0564290A (ja) * | 1991-09-04 | 1993-03-12 | Matsushita Electric Ind Co Ltd | 収音装置 |
JPH1141577A (ja) * | 1997-07-18 | 1999-02-12 | Fujitsu Ltd | 話者位置検出装置 |
JP2009156888A (ja) * | 2007-12-25 | 2009-07-16 | Sanyo Electric Co Ltd | 音声補正装置及びそれを備えた撮像装置並びに音声補正方法 |
-
2009
- 2009-09-25 JP JP2009220467A patent/JP5564873B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0564290A (ja) * | 1991-09-04 | 1993-03-12 | Matsushita Electric Ind Co Ltd | 収音装置 |
JPH1141577A (ja) * | 1997-07-18 | 1999-02-12 | Fujitsu Ltd | 話者位置検出装置 |
JP2009156888A (ja) * | 2007-12-25 | 2009-07-16 | Sanyo Electric Co Ltd | 音声補正装置及びそれを備えた撮像装置並びに音声補正方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013135433A (ja) * | 2011-12-27 | 2013-07-08 | Fujitsu Ltd | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
JP2013179585A (ja) * | 2012-02-01 | 2013-09-09 | Nikon Corp | 音処理装置および音処理プログラム |
JP2015100125A (ja) * | 2012-12-27 | 2015-05-28 | パナソニックIpマネジメント株式会社 | 音声処理システム及び音声処理方法 |
JP2015122756A (ja) * | 2012-12-27 | 2015-07-02 | パナソニックIpマネジメント株式会社 | 音声処理システム及び音声処理方法 |
WO2014132533A1 (ja) * | 2013-03-01 | 2014-09-04 | シャープ株式会社 | 音声入力装置およびその音声入力装置を備えた画像表示装置 |
JPWO2014132533A1 (ja) * | 2013-03-01 | 2017-02-02 | シャープ株式会社 | 音声入力装置およびその音声入力装置を備えた画像表示装置 |
JP2014175996A (ja) * | 2013-03-12 | 2014-09-22 | Oki Electric Ind Co Ltd | パラメータ推定装置、パラメータ推定プログラム、機器決定システム及び機器決定プログラム |
JP2014207589A (ja) * | 2013-04-15 | 2014-10-30 | シャープ株式会社 | 音声入力装置、および画像表示装置 |
JP2017521902A (ja) * | 2014-05-26 | 2017-08-03 | シャーマン, ウラディミールSHERMAN, Vladimir | 取得した音響信号のための回路デバイスシステム及び関連するコンピュータで実行可能なコード |
JP2016021650A (ja) * | 2014-07-14 | 2016-02-04 | パナソニックIpマネジメント株式会社 | 収音制御装置及び収音システム |
JP2016181789A (ja) * | 2015-03-24 | 2016-10-13 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法、及び、プログラム |
JP2017126906A (ja) * | 2016-01-14 | 2017-07-20 | 株式会社リコー | 音声処理装置、音声処理方法及び音声処理プログラム |
JP2020053920A (ja) * | 2018-09-28 | 2020-04-02 | 沖電気工業株式会社 | 収音装置、収音プログラム及び収音方法 |
JP7158976B2 (ja) | 2018-09-28 | 2022-10-24 | 沖電気工業株式会社 | 収音装置、収音プログラム及び収音方法 |
CN113767432A (zh) * | 2020-06-29 | 2021-12-07 | 深圳市大疆创新科技有限公司 | 音频处理方法、音频处理装置、电子设备 |
CN112860065A (zh) * | 2021-02-05 | 2021-05-28 | Oppo广东移动通信有限公司 | 拾音控制方法、拾音控制装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP5564873B2 (ja) | 2014-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5564873B2 (ja) | 収音処理装置、収音処理方法、及びプログラム | |
JP6464449B2 (ja) | 音源分離装置、及び音源分離方法 | |
JP6526083B2 (ja) | 源信号分離のためのシステム及び方法 | |
US9197974B1 (en) | Directional audio capture adaptation based on alternative sensory input | |
JP4376902B2 (ja) | 音声入力システム | |
JP4191518B2 (ja) | 直交円形マイクアレイシステム及びこれを用いた音源の3次元方向検出方法 | |
KR101456866B1 (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
US11190900B2 (en) | Spatial audio array processing system and method | |
JP6450139B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
Gao et al. | Echowhisper: Exploring an acoustic-based silent speech interface for smartphone users | |
KR20130084298A (ko) | 원거리 다중 음원 추적 및 분리 시스템, 방법, 장치 및 컴퓨터-판독가능 매체 | |
GB2529509A (en) | Adaptive beam forming devices, methods, and systems | |
KR20130116299A (ko) | 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법 | |
JP2007221300A (ja) | ロボット及びロボットの制御方法 | |
CN111935573B (zh) | 音频增强方法、装置、存储介质及可穿戴设备 | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
JP6540730B2 (ja) | 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法 | |
CN111078185A (zh) | 录制声音的方法及设备 | |
CN107452398B (zh) | 回声获取方法、电子设备及计算机可读存储介质 | |
JP2011061461A (ja) | 撮像装置、指向性制御方法及びそのプログラム | |
KR101976937B1 (ko) | 마이크로폰 어레이를 이용한 회의록 자동작성장치 | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
JP6881267B2 (ja) | 制御装置、変換装置、制御方法、変換方法、およびプログラム | |
JP2005303574A (ja) | 音声認識ヘッドセット |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130402 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140310 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140320 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5564873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |