JP6460676B2 - 信号処理装置および信号処理方法 - Google Patents

信号処理装置および信号処理方法 Download PDF

Info

Publication number
JP6460676B2
JP6460676B2 JP2014159761A JP2014159761A JP6460676B2 JP 6460676 B2 JP6460676 B2 JP 6460676B2 JP 2014159761 A JP2014159761 A JP 2014159761A JP 2014159761 A JP2014159761 A JP 2014159761A JP 6460676 B2 JP6460676 B2 JP 6460676B2
Authority
JP
Japan
Prior art keywords
signal processing
information
microphone
parameter
acquired
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014159761A
Other languages
English (en)
Other versions
JP2016039410A5 (ja
JP2016039410A (ja
Inventor
典朗 多和田
典朗 多和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014159761A priority Critical patent/JP6460676B2/ja
Priority to US14/811,387 priority patent/US9781509B2/en
Publication of JP2016039410A publication Critical patent/JP2016039410A/ja
Publication of JP2016039410A5 publication Critical patent/JP2016039410A5/ja
Application granted granted Critical
Publication of JP6460676B2 publication Critical patent/JP6460676B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Studio Devices (AREA)

Description

本発明は、音響処理を行う信号処理装置および信号処理方法に関する。
音響信号から不要な雑音を除去する技術は、音響信号に含まれる目的音に対する聴感を改善し、また、音声認識においては認識率を高めるために重要な技術である。音響信号の雑音を除去する技術として代表的なものにビームフォーマがある。これは、複数のマイク素子で収音した複数チャンネルのマイク信号にそれぞれフィルタリングを施してから加算し、単一の出力信号を得るものである。上記のフィルタリングと加算の処理が、複数のマイク素子で指向性、すなわち方向選別性を持つ空間的なビームパターンを形成することに対応するため、ビームフォーマと呼ばれる。
ビームパターンの感度(ゲイン)がピークとなる部分をメインローブといい、メインローブが目的音の方向を向くようにビームフォーマを構成すれば、目的音を強調し、同時に目的音と異なる方向に存在する雑音を抑制することができる。しかしながら、ビームパターンのメインローブは、特にマイク素子数が少ない場合に広い幅を持つなだらかな曲線となる。このため、ビームパターンのそのようなメインローブを目的音の方向に向けても、目的音に近接するような雑音を十分に除去することはできない。
そこでメインローブではなく、ビームパターンの感度がディップとなる部分である、ヌル(死角)を利用した雑音除去の方法が提案されている。すなわち、鋭いヌルを雑音の方向に向けることで、近接する目的音を削ることなく、雑音のみを十分に除去することができる。このように、特定の方向に固定的にヌルを形成するビームフォーマを固定ビームフォーマと呼ぶ。ここで、ヌルを向ける方向が正確でないと、雑音除去の性能が大きく劣化するため、音源方向の推定が重要となってくる。
固定ビームフォーマに対し、ビームパターンのヌルが自動的に形成されるビームフォーマを適応ビームフォーマと呼び、適応ビームフォーマを音源方向の推定に用いることができる。目的音や雑音をパワーが空間的に一点に集中した方向性音源と考えれば、出力パワーを最小化する規範に基づく適応ビームフォーマを用いることで、音源方向にヌルを自動的に形成するようなフィルタ係数が得られる。よって、音源方向を知るためには、適応ビームフォーマのフィルタ係数で形成されるビームパターンを算出して、そのヌル方向を求めればよい。ビームパターンは、アレイ・マニフォールド・ベクトルと呼ばれる各方向の音源と各マイク素子間の伝達関数を、フィルタ係数に掛け合わせることで算出することができる。例えば、方向−180°から180°まで1°刻みのアレイ・マニフォールド・ベクトルを用いて、フィルタ係数が何度の方向に、感度のディップであるヌルを持っているかを調べる。
ここで、一般にビームフォーマのような音源分離においては、マイクが自由空間に配置されたものと仮定して、自由空間の理論式によるアレイ・マニフォールド・ベクトルを用いることが多い。自由空間では遮るものなく理想的に音が伝搬するため、例えばマイク素子間の伝搬遅延時間差、すなわちアレイ・マニフォールド・ベクトル要素間の周波数ごとの位相差は、幾何的にマイク間隔をパラメータとする理論式で求められる。一方、マイクが自由空間ではなく、筐体の近傍や内部に配置された場合は、筐体による音の回折・遮断・散乱などが生じるため、上記位相差は自由空間の理論値から乖離する。また、各音源方向に対するマイク素子間の信号の振幅差も、マイク素子が配置される筐体の影響を受ける。
以上のように、マイク素子間の振幅差や位相差は、マイクが配置される筐体の影響によって大きく変化するため、各方向の音源と各マイク素子間の伝達関数であるアレイ・マニフォールド・ベクトルも、筐体の影響によって変化する。ビームパターンの算出に用いられるアレイ・マニフォールド・ベクトルがそのような変化に追従していないと、音源方向の正確な推定ができなくなる。特許文献1では、独立成分分析を利用して筐体の影響を含むアレイ・マニフォールド・ベクトルを推定することが示されている。また、特許文献2では、折り畳み式携帯電話などで筐体可動部にマイクが付けられた場合に、筐体可動部の開閉状態に応じて変化するマイク位置座標を逐次取得し、音源分離処理のパラメータとして用いることが記載されている。
特開2011−199474号公報 特開2010−278918号公報
しかしながら、特許文献1,2に記載された方法では、依然として音源推定の精度を維持できない場合がある。特許文献1の方法は、例えばカムコーダの内蔵マイクを使う場合は、カムコーダの筐体の影響を含むアレイ・マニフォールド・ベクトルを推定して用いることができると考えられる。しかし、音響信号の取得に用いるマイクを内蔵マイクから外部マイクに切り替えるような場合、外部マイクはカムコーダから離れることで、カムコーダの筐体の影響を受けにくくなる。すなわち、内蔵マイクと外部マイクとではアレイ・マニフォールド・ベクトルは大きく変化する。特許文献1では、このようなマイクが切り替わる場合を想定したアレイ・マニフォールド・ベクトルの選択について何等考慮されていない。
また、特許文献2の方法は、マイク位置座標を音源分離処理のパラメータとしているため、自由空間を想定していると考えられる。しかし、実際のカムコーダなどの音響処理においては、音響処理に用いるアレイ・マニフォールド・ベクトルが筐体による回折等の影響を受ける。さらに、たとえマイク位置座標が変化しなかったとしても、例えばカムコーダのレンズ交換やズームによって筐体の形状が変化すると、それに伴ってアレイ・マニフォールド・ベクトルも変化すると考えられる。しかしながら、特許文献2では、このような筐体の形状変化による回折等への影響を考慮した、アレイ・マニフォールド・ベクトルの選択については考えられていない。
本発明は上述した問題を解決するためになされたものであり、高精度な音響処理を実現する信号処理装置および信号処理方法を提供することを目的とする。
上記目的を達成するための本発明の一態様による信号処理装置は以下の構成を有する。すなわち、
形状が可変である所定の機器を装着可能な信号処理装置であって、
記信号処理装置が有するマイクから複数チャネルの音響信号を取得する音取得手段と、
前記信号処理装置に装着された前記機器の形状の変化に伴って変化するパラメータを取得するパラメータ取得手段と、
向に応じた音の伝搬特性を表す情報であって前機器の形状に応じた伝搬特性を表す情報を、前記パラメータ取得手段により取得されたパラメータに基づいて取得する情報取得手段と、
前記音取得手段により取得された音響信号を、前記情報取得手段により取得された情報を用いて処理する処理手段と、を有する
本発明によれば、機器の状態の変化に応じてアレイ・マニフォールド・ベクトルが選択されるので、高精度な音響処理を実現することができる。
実施形態に係る信号処理装置の構成例を示すブロック図。 筐体がアレイ・マニフォールド・ベクトルに及ぼす影響を説明する図。 アレイ・マニフォールド・ベクトルの選択がビームパターンに及ぼす影響を説明する図。 音源方向の推定精度が雑音除去の性能に及ぼす影響を説明する図。 実施形態に係る音響処理を説明するフローチャート。 実施形態に係る平均ビームパターン算出処理を示すフローチャート。 実施形態に係る外部マイク間隔推定処理を説明する図。 実施形態に係る外部マイク間隔推定処理を説明する図。 実施形態に係る外部マイク間隔推定処理のフローチャート。 実施形態に係る代用アレイ・マニフォールド・ベクトル選択処理のフローチャート。
以下、添付の図面を参照して、本発明の好適な実施形態の一例を詳細に説明する。なお、以下の実施形態において示される構成等は一例に過ぎず、本発明は実施形態において記載され、図示された構成に限定されるものではない。なお、図面において各方向の音源と各マイク素子間の伝達関数を示すアレイ・マニフォールド・ベクトル(Array Manifold Vector)はAMVと略記している。
まず、筐体の影響によるマイク素子間の位相差の理論値からの乖離について図2を参照して説明する。図2(a)の細線は、2つのマイク素子を内蔵マイクとして持つカムコーダについて、無響室のトラバース装置で実測した、各音源方向に対するマイク素子間の位相差を周波数ごとに示したものである。ここで、2つの内蔵マイク素子を結ぶ線分の垂直二等分線の方向に、カムコーダの撮影方向である正面0°がある。また、周波数については187.5Hzから187.5Hzおきに1875Hzまで表示しており、周波数が高いほど位相差も大きくなる傾向がある。一方、図2(a)の滑らかな太線は、上記内蔵マイクの間隔をパラメータとして用いた、周波数ごとの自由空間の理論値を表している。各周波数において、2つのマイク素子を結ぶ線分の方向である±90°方向で、幾何的に位相差が最大となっている。ここで、同じ周波数における位相差の理論値と実測値を比較すると、カムコーダの筐体による回折等の影響によって、実測値は自由空間の理論値より大きくなる傾向があることが分かる。
同様に図2(b)の細線は、上記カムコーダについて、各音源方向に対するマイク素子間の振幅差の実測値を、周波数ごとに示したものである。ここで、振幅差は振幅和によって正規化されており、−1から1の範囲を取るものとする。位相差と同様に、周波数が高いほど、また横方向である±90°付近で、振幅差が大きくなる傾向がある。一方、図2(b)の太線は、逆二乗則による距離減衰を考慮した自由空間の理論値であるが、数cm程度のマイク間隔ではほとんど振幅差を生じないことが分かる。以上のように、マイク素子間の振幅差や位相差は、マイクが配置される筐体の影響を受けて大きく変化する。
次に、アレイ・マニフォールド・ベクトルの選択がビームパターンに及ぼす影響について具体的に説明する。図3は、適応ビームフォーマのビームパターンの算出に用いるアレイ・マニフォールド・ベクトルの選択が、ビームパターンおよび音源方向推定に及ぼす影響を示したものである。ここで、ビームパターンは周波数ごとに得られるが、図3の細線はその一部として、750Hzから750Hzおきに7500Hzまでのビームパターンを表示している。また、図3の太線は、各周波数のビームパターンを平均化した、平均ビームパターンを表示したものである。
図3(a)は、−30°方向に音源を配置し、自由空間に配置したマイクで音響信号を取得して適応ビームフォーマのフィルタ係数を算出し、そのビームパターンを算出・表示したものである。ここで、アレイ・マニフォールド・ベクトルは、マイク間隔をパラメータとする自由空間の理論式により生成したものを用いている。これにより、マイクの自由空間配置という音響信号取得時の状態に対応するアレイ・マニフォールド・ベクトルを選択して用いていることと等価になる。この結果、図3(a)の太線のように、音源方向である−30°方向にヌルが形成された平均ビームパターンが得られ、図3(a)の縦点線で示される平均ビームパターンのヌル方向から音源方向を正確に知ることができる。なお、−90°から0°を通って90°までのビームパターンと、−90°から±180°を通って90°までのビームパターンは対称形となる。
一方、図3(b)および図3(c)は、−40°方向に音源を配置し、カムコーダの内蔵マイクで音響信号を取得して適応ビームフォーマのフィルタ係数を算出し、そのビームパターンを算出・表示したものである。図3(b)では、この内蔵マイクの間隔をパラメータとして用いて自由空間の理論式で生成したアレイ・マニフォールド・ベクトルを用いている。この状況は、カムコーダの筐体の影響を受けている音響信号取得時の状態とは異なるアレイ・マニフォールド・ベクトルを選択して用いていることになる。この結果、たとえば図3(b)の太線のように、平均ビームパターンは−90°を中心として広く浅くへこんでいるだけとなり、適切にヌルが形成されているとは言い難い。このため、平均ビームパターンのヌル方向から正確に音源方向を推定することはできない。
図3(c)では、各方向の音源とカムコーダの内蔵マイク間の伝達関数として、無響室で実測したアレイ・マニフォールド・ベクトルを用いている。これは、カムコーダの筐体の影響を受けている音響信号取得時の状態に対応するアレイ・マニフォールド・ベクトルを選択して用いていることを意味する。この結果、図3(c)の太線のように、音源方向である−40°方向にヌルが形成された平均ビームパターンが得られ、図3(c)の縦点線で示される平均ビームパターンのヌル方向から、音源方向を正確に知ることができる。なお、カムコーダのように筐体の形状が撮影方向に対して概ね対称形である場合は、−90°から0°を通って90°までのビームパターンと、−90°から±180°を通って90°までのビームパターンも概ね対称形となる。
以上から、ビームフォーマのビームパターン算出において、音響信号取得時の状態に対応するアレイ・マニフォールド・ベクトルを選択して用いることが、ビームパターンのヌルから音源方向を推定する上で重要となることが分かる。ここで、音響信号取得時の状態は、筐体の形状などの影響を受ける。
図4はさらに、アレイ・マニフォールド・ベクトルの選択と音源方向の推定精度が、雑音除去の性能に及ぼす影響を示した図である。たとえば、ピアノの演奏会をカムコーダで撮影をしていたときに、図4(a)で示されるような正面方向のピアノの音に加えて、図4(b)で示されるような観客の咳の音が、−40°方向から飛び込んできたような場合を考える。この場合、カムコーダの内蔵マイクで取得される音響信号の各チャンネルは、図4(c)のようにピアノの音と咳の音が混合したものとなる。そこで、このような音響信号から雑音である咳の音を除去することを考える。
図4の太線401で囲まれる部分では咳の音が卓越しているため、このときの音響信号から適応ビームフォーマを構成すれば、咳の方向にヌルを自動的に形成するようなフィルタ係数が得られる。よって、このフィルタ係数で形成されるビームパターンを算出することで、そのヌル方向から咳の方向を推定できる。しかしながら、上述したように、カムコーダの内蔵マイクで音響信号を取得しているのにもかかわらず、自由空間の理論式で生成したアレイ・マニフォールド・ベクトルを用いてしまうと、たとえば図3(b)に示したように適切にヌルが形成されない。一方、カムコーダの筐体の影響を含むアレイ・マニフォールド・ベクトルを用いれば、たとえば図3(c)のように平均ビームパターンのヌル方向から、咳の方向を−40°と正確に推定することができる。
図4(d)は、図3(b)の縦点線で示される−90°をとりあえずのヌル方向として、その方向に固定ビームフォーマでヌルを向けた結果である。しかしながら、ヌルを向けた方向(−90°)が咳の方向(−40°)とずれているため、咳の音を効果的に除去することができていない。一方、図4(e)は、図3(c)の縦点線で示される−40°に固定ビームフォーマでヌルを向けた結果である。ヌルを向けた方向が咳の方向と一致しているため、咳の音を効果的に除去できている。
以上のように、音源方向の推定精度は、雑音除去の性能に大きく影響する。また、音源方向推定に加え、上記固定ビームフォーマのフィルタ係数の算出には、ヌルを向ける方向のアレイ・マニフォールド・ベクトルが必要となる。そのため、固定ビームフォーマのフィルタ係数の算出にもアレイ・マニフォールド・ベクトルの選択の適否が影響してくる。したがって、雑音除去のような音響処理においては、筐体の形状など、マイク素子による収音時の環境に適したアレイ・マニフォールド・ベクトルを選択することが肝要となる。以上を踏まえ、本実施形態では、雑音除去のような音響処理において、筐体の影響で大きく変化する音響信号取得時の状態に対応するアレイ・マニフォールド・ベクトルを選択して用いることが可能な信号処理装置を開示する。
図1は、実施形態によるビデオカメラ(カムコーダ)の構成例を示すブロック図である。信号処理装置100は、全構成要素の統御を行うシステム制御部101、各種データを記憶しておく記憶部102、信号の解析処理を行う信号解析部103を備える。
ビデオカメラにおいて、収音系の機能を実現する要素としては、内蔵マイク111、音響信号入力部112を備える。また、任意の外部マイク119が、信号処理装置100に接続可能である。本実施形態において内蔵マイク111および外部マイク119は、2つのマイク素子が間隔を持って配置された2chステレオマイクでそれぞれ構成されるものとする。なお、マイク素子の数はそれぞれ複数であればよく、3個以上でも構わない。すなわち、本発明はマイク素子の数が2個の場合に限定されるものではない。
音響信号入力部112は、外部マイク119の接続を検出し、外部マイク119が接続されている場合は、内蔵マイク111ではなく外部マイク119から音響信号を入力する。また、音響信号入力部112は、内蔵マイク111または外部マイク119の、各マイク素子からのアナログ音響信号に増幅およびAD変換を施して、所定の音響サンプリングレートに対応する周期でデジタル音響信号である2chマイク信号を生成する。
ビデオカメラにおいて、撮像系の機能を実現する要素としては、レンズ部120、映像信号入力部124を備える。レンズ部120はさらに、光学レンズ121、レンズ制御部122、レンズ内記憶部123を備える。レンズ部120は、光学レンズ121に入射する光に光電変換を施して、アナログ映像信号を生成する。映像信号入力部124は、レンズ部120からのアナログ映像信号にAD変換とゲイン調整を施して、所定の映像フレームレートに対応する周期でデジタル映像信号を生成する。レンズ制御部122は、システム制御部101と通信を行い、光学レンズ121を駆動制御したり、レンズ部120に係る情報をやり取りしたりする。レンズ内記憶部123は、レンズ部120に係る情報を保持している。本実施形態においてレンズ部120は、交換可能かつ、ズーム倍率に応じてレンズ筐体が伸縮する交換レンズで構成されるものとする。また、本実施形態のビデオカメラは、ユーザの操作を受け付けたり、ユーザに操作メニューや映像信号などを提示したりするための要素として、入出力UI部131を備える。入出力UI部131は、たとえばタッチパネルで構成される。
以上のような構成を備えた本実施形態のビデオカメラ(信号処理装置100)による音響信号の処理について、以下、詳細に説明する。はじめに、信号処理装置100での撮影に先立って、撮影時の音響処理に用いる種々のアレイ・マニフォールド・ベクトルの取得が行われる。
非撮影時に外部マイク119が接続されると、音響信号入力部112により検出される。この検出は、音響信号入力部112からシステム制御部101に伝えられる。次に、システム制御部101からの指示によって、入出力UI部131は、外部マイク119のマイク素子間の間隔である外部マイク間隔の入力をユーザに促す。そして、ユーザによって例えばmm単位で入力された数値は、外部マイク119の外部マイク間隔として設定され、記憶部102に保持される。マイク間隔が既知であれば、自由空間の理論式によりアレイ・マニフォールド・ベクトルを生成することが可能である。なお、外部マイク間隔がどのくらいかユーザが把握できていない場合は、外部マイク間隔を未設定のままとすることもできる。
また、非撮影時にレンズ交換によってレンズ部120が装着されると、該装着がシステム制御部101により検出される。次に、システム制御部101は、レンズ部120のレンズ制御部122と通信を行い、装着されているレンズ部120のタイプを識別する。さらに、システム制御部101は、レンズ制御部122を介して、レンズ内記憶部123が保持している複数のアレイ・マニフォールド・ベクトルのうち、信号処理装置100用のアレイ・マニフォールド・ベクトルを取得して、記憶部102に保存する。信号処理装置100用のアレイ・マニフォールド・ベクトルとは、レンズ部120が信号処理装置100に装着された状態で、信号処理装置100の内蔵マイク111により音響信号を取得する場合のアレイ・マニフォールド・ベクトルである。なお、レンズ内記憶部123に複数のアレイ・マニフォールド・ベクトルが記憶されているのは、筐体形状が異なる複数種類のビデオカメラに対応するためである。
また、一般に、交換レンズには、焦点距離や絞り値等が異なる様々なタイプがあり、タイプごとにレンズ筐体の形状が異なる。このため、信号処理装置100に装着されると、タイプごとに信号処理装置100の筐体形状が変化することと同義であるため、レンズ部120のタイプごとにアレイ・マニフォールド・ベクトルも変化すると考えられる。さらに、レンズがズームレンズである場合には、ズーム倍率によってレンズ筐体の形状が伸縮する。これは、ズーム倍率によってビデオカメラ(信号処理装置100)の筐体形状が変化することと同義であるため、レンズ部120のズーム倍率によってアレイ・マニフォールド・ベクトルも変化すると考えられる。よって、レンズ部120がズームレンズである場合は、システム制御部101は、ズーム倍率ごとのアレイ・マニフォールド・ベクトルを取得し、記憶部102に保存する。
こうして、レンズ部120から取得された種々のアレイ・マニフォールド・ベクトルは、交換レンズのタイプ(レンズ部120のタイプ)やズーム倍率と対応付けられて、記憶部102に保存される。なお、信号処理装置100にデフォルトで装着されているレンズ、信号処理装置100に装着され得る代表的な交換レンズ、レンズが装着されていない状態などに対応するアレイ・マニフォールド・ベクトルは、記憶部102が予め保持するようにしてもよい。
なお、信号処理装置100の筐体の影響を含むアレイ・マニフォールド・ベクトルは、レンズ部120のタイプやズーム倍率ごとに、無響室のトラバース装置などで、内蔵マイク111を用いて実測できる。またはCADデータをもとに、有限要素法や境界要素法といった、波動性を考慮したシミュレーションにより、アレイ・マニフォールド・ベクトルを生成してもよい。
なお、方向別伝達関数であるアレイ・マニフォールド・ベクトルは、周波数領域のデータであるが、レンズ部120のレンズ内記憶部123では、もととなる方向別インパルス応答の形で保持しておいてもよい。そして、方向別インパルス応答を記憶部102に取り込んだ際に、信号処理装置100で行う音響処理の周波数解像度に合わせて、信号解析部103でフーリエ変換し、得られたアレイ・マニフォールド・ベクトルを記憶部102に保存するようにしてもよい。
次に、信号処理装置100による撮影動作について説明する。入出力UI部131の画面上には、撮像系が捉えている映像信号がリアルタイムに映し出されている。このとき、ズーム倍率を示す画面上のスライダバーのつまみを動かすことで、その指定値がシステム制御部101に伝えられる。そして、システム制御部101からの指示によって、レンズ制御部122は光学レンズ121を駆動制御し、指定ズーム倍率に応じた光学ズーム処理を行う。
ユーザは、撮影を開始したいシチュエーションになったら、入出力UI部131上に表示されているメニューから、「REC」をタッチして選択する。この選択に応じて、信号処理装置100は、撮像系で捉えている映像信号および、収音系で捉えている音響信号の記憶部102への記録を開始する。収音系で取得した音響信号である2chマイク信号は、記憶部102へ逐次記録され、図5のフローチャートに沿って、本実施形態の音響処理である音源方向推定処理および雑音除去処理が行われる。なお、音響サンプリングレートは48kHzとして説明を行う。
ビームフォーマにおいてマイク信号のフィルタリングを行う信号サンプル単位を時間ブロックと呼び、本実施形態では時間ブロックの長さを1024サンプル(約21ms)とする。また、この時間ブロック長の半分である512サンプル(約11ms)ずつ信号サンプル範囲をシフトしながら、時間ブロックループの中でマイク信号のフィルタリングを行っていく。すなわち、第1時間ブロックではマイク信号の第1サンプルから第1024サンプルを、第2時間ブロックでは第513サンプルから第1536サンプルをフィルタリングする。図5のフローチャートは、時間ブロックループ内のひとつの時間ブロックにおける処理を表すものとする。
S501では、システム制御部101が音響信号入力部112と通信を行い(結線不図示)、外部マイク119が接続されているかを調べる。外部マイク119が接続されている、すなわち外部マイク119で音響信号を取得している場合は、S502へ進む。S502では、システム制御部101が外部マイク119の外部マイク間隔が設定されているかを調べ、外部マイク間隔が設定されている場合はS503へ進む。
S503では、信号解析部103が、設定されている外部マイク間隔をパラメータとしてアレイ・マニフォールド・ベクトルを生成する。生成されたアレイ・マニフォールド・ベクトルは、外部マイク119で現在取得している時間ブロックの音響信号の処理に用いるためのアレイ・マニフォールド・ベクトルとして選択される。外部マイク119は信号処理装置100から離れているため、信号処理装置100の筐体の影響を受けにくいと考えられる。よって、以下の式(1)で表される自由空間の理論式と外部マイク間隔によりアレイ・マニフォールド・ベクトルa(f,θ)を生成し、これを後の音響処理のために選択する。
Figure 0006460676
ここで、jは虚数単位を、fは周波数を表す。また、外部マイク119の、2つのマイク素子の真ん中を中心とする単位球面を考える。すると、単位球面上の方位角θの点から、各マイク素子までの伝搬遅延時間は、τi(θ,d)(i=1,2)のように方位角θおよび外部マイク間隔dの関数となり、まとめてベクトルτ(θ)=[τ1(θ) τ2(θ)]Tと置いている。ここで上付きのTは転置を表す。なお、2つの外部マイク素子を結ぶ線分の垂直二等分線の方向に信号処理装置100の撮影方向である正面(θ=0°)があるものとする。
一方、S501で外部マイク119が接続されていない、すなわち内蔵マイク111で音響信号を取得している場合は、S504へ進む。S504では、システム制御部101がレンズ部120のレンズ制御部122と通信を行い、レンズ部120のタイプおよび、現在のズーム倍率である現ズーム倍率を取得する。S505では、システム制御部101が、S504で取得したレンズ部120のタイプに対応するアレイ・マニフォールド・ベクトルを、記憶部102が保持しているか調べ、保持している場合、処理はS506へ進む。
S506では、信号解析部103が、内蔵マイク111で取得している現時間ブロックの音響信号の処理に用いるための、アレイ・マニフォールド・ベクトルを選択する。すなわち、S504で取得したレンズ部120のタイプおよび現ズーム倍率に対応する、アレイ・マニフォールド・ベクトルをa(f,θ)選択する。ここでも、2つの内蔵マイク素子を結ぶ線分の垂直二等分線の方向に、信号処理装置100の撮影方向である正面(θ=0°)があるものとする。
なお、ズーム倍率については、現ズーム倍率と完全に一致するアレイ・マニフォールド・ベクトルがあるとは限らない。したがって、本実施形態では、現ズーム倍率と最も近いズーム倍率のアレイ・マニフォールド・ベクトルを選択することとする。もしくは、複数のズーム倍率(例えば2倍と3倍)のアレイ・マニフォールド・ベクトルを振幅および位相上で補間することで、現ズーム倍率(例えば2.5倍)に対応するアレイ・マニフォールド・ベクトルを生成して選択するようにしてもよい。なお、レンズが交換中で、レンズ部120が信号処理装置100に装着されていないような場合は、レンズが装着されていない状態のアレイ・マニフォールド・ベクトルを選択するようにしてもよい。
以上のようにしてS503またはS506の処理を終えると、処理はS507へ進む。S507以降の処理は、信号解析部103が中心となって行う。S507において、信号解析部103は、平均ビームパターン算出処理を行う。平均ビームパターン算出処理について、図6のフローチャートを参照して詳細に説明する。
S601において、信号解析部103は、現在の時間ブロックの2chマイク信号をフーリエ変換して、複素数であるフーリエ係数を取得する。このとき時間ブロック長によって、フーリエ変換における時間解像度および周波数解像度が決まる。次のステップであるS602において空間相関行列が算出されるが、統計量である空間相関行列の算出には平均化処理が必要なため、現在の時間ブロックを基準として時間フレームという単位が導入される。
時間フレーム長は時間ブロック長と同じ1024サンプルであり、現在の時間ブロックの信号サンプル範囲を基準として、所定の時間フレームシフト長ずつシフトした信号サンプル範囲を時間フレームとする。本実施形態では時間フレームシフト長を32サンプルとし、上記平均化の回数に相当する時間フレーム数を128とする。すなわち第1時間ブロックにおいて、第1時間フレームは第1時間ブロックと同じくマイク信号の第1サンプルから第1024サンプルを対象とし、第2時間フレームは第33サンプルから第1056サンプルを対象とする。こうして、第128時間フレームは第4065サンプルから第5088サンプルを対象とするため、第1時間ブロックの空間相関行列は、第1サンプルから第5088サンプルの106msのマイク信号から算出されることになる。なお、時間フレームは現在の時間ブロックより前の信号サンプル範囲としてもよい。
以上を踏まえてS601では、第iチャンネルのマイク信号の現時間ブロックに関する、周波数f、時間フレームkにおけるフーリエ係数を、Zi(f,k)(i=1,2、k=1〜128)のように得る。なお、フーリエ変換の前にマイク信号に対して窓掛けを行うのが好適であり、窓掛けは逆フーリエ変換によって再び時間信号に戻した後にも行う。このため、50%ずつオーバーラップする時間ブロックに対し、2回の窓掛けにおける再構成条件を考慮して、窓関数にはサイン窓などを用いる。
S602からS604は周波数ごとの処理であり、周波数ループの中で行われる。S602では、信号解析部103は、マイク信号の空間的性質を表す統計量である、空間相関行列を算出する。まず、S601で得た各チャンネルのフーリエ係数をまとめてベクトル化し、z(f,k)=[Z1(f,k) Z2(f,k)]Tのように置く。z(f,k)を用いて、周波数f、時間フレームkにおける行列Rk(f)を式(2)のように定める。ここで、上付きのHは複素共役転置を表す。
Figure 0006460676
なお、空間相関行列R(f)は、Rk(f)を全ての時間フレームに関して平均化、すなわちR1(f)からR128(f)を足して128で割ることで得られる。
S603において、信号解析部103は、適応ビームフォーマのフィルタ係数を算出する。第iチャンネルのマイク信号をフィルタリングするフィルタ係数をWi(f)(i=1,2)とし、ビームフォーマのフィルタ係数ベクトルをw(f)=[W1(f) W2(f)]Tのように置く。ここでは、信号解析部103は、適応ビームフォーマのフィルタ係数を最小ノルム法で算出する。これは、出力パワー最小化の規範に基づくものであり、w(f)を非零ベクトルとするための制約条件を、フィルタ係数ノルムの指定によって記述する。ビームフォーマの周波数fにおける平均出力パワーはwH(f)R(f)w(f)で表されるため、最小ノルム法による適応ビームフォーマのフィルタ係数は、式(3)の制約付き最適化問題の解として得られる。
Figure 0006460676
これは、エルミート行列であるR(f)を係数行列とする二次形式の最小化問題であるため、R(f)の最小固有値に対応する固有ベクトルが、最小ノルム法で算出される適応ビームフォーマのフィルタ係数ベクトルwMN(f)となる。
S604では、信号解析部103は、S603で算出した適応ビームフォーマのフィルタ係数wMN(f)と、現時間ブロックで選択されているアレイ・マニフォールド・ベクトルa(f,θ)を用いて、適応ビームフォーマのビームパターンを算出する。ビームパターンの方位角θ方向の値Ψ(f,θ)は、式(4)で得られる。
Figure 0006460676
a(f,θ)のθを、例えば−180°から180°まで1°刻みで変えながらΨ(f,θ)を計算することで、水平方向のビームパターンが得られる。なお、計算量を抑えるために、ビームパターンの対称性に着目して、−90°から0°を通って90°までのビームパターンのみを算出するようにしてもよい。また、Ψが小さくなるヌル付近のみθの刻みを密にして、音源方向を知る上で大切なヌル付近をより正確に把握するようにしてもよい。
S605では、S604で算出した周波数ごとのビームパターンを平均化して、平均ビームパターンを算出する。なお、必ずしも全周波数について平均化する必要はなく、例えば目的音の主要周波数帯の周波数のみ平均化してもよい。以上でS507の平均ビームパターン算出処理を終える。
他方、S502で、外部マイク119の外部マイク間隔が未設定であった場合は、処理はS520へ進む。S520では、外部マイク間隔推定処理を行う。はじめに、外部マイク間隔推定処理の考え方について説明する。
外部マイク間隔dを少しずつ大きくしながら、式(1)で表される自由空間の理論式によりアレイ・マニフォールド・ベクトルを生成し、平均ビームパターン算出処理を行う。図7Aに示すように、外部マイク間隔を(a)の5mm、(b)の10mm、(c)の15mmと大きくしていくに従って、横点線で示される平均ビームパターンの最小値が小さくなり、縦点線で示されるヌル方向も変わって行くことが分かる。これらの関係をグラフにしたのが、図7Bの(d)および(e)である。この場合、正解の外部マイク間隔は15mm、音源方向は−30°であるが、図7Bの(d)よりdが概ね正解に達したときに、平均ビームパターンの最小値が底を打って収束する傾向があることが分かる。このような収束時のdを外部マイク間隔として設定することで、図7Bの(e)のようにそのときのヌル方向から、音源方向を正確に推定することができる。
上記の考え方に基づく、外部マイク間隔推定処理(S520)について、図8のフローチャートを参照して説明する。S801では、信号解析部103は、外部マイク間隔をd=d0(例えば1mm)のように初期化する。S802において、信号解析部103は、現在のdをパラメータとして用い、式(1)で表される自由空間の理論式によりアレイ・マニフォールド・ベクトルを生成して、次のステップで用いるものとして選択する。
S803では、S802で選択したアレイ・マニフォールド・ベクトルを用いて、平均ビームパターン算出処理を行う。平均ビームパターン算出処理は図6のフローチャートにより説明したとおりである。なお、図6のフローチャートで表されるS803の平均ビームパターン算出処理において、S601からS603までの処理は、最初のd=d0のときのみ行えばよい。また、外部マイク間隔推定処理(S520)が実行された場合は、当該処理内で平均ビームパターン算出処理が行われるのでS507の平均ビームパターン算出処理を省略可能である。
S804では、S803で算出した平均ビームパターンの最小値が収束したかを判定し、収束していない場合はS805へ進む。たとえば、信号解析部103は、S803において、d=t-n〜d=t(tは現在のdの値、n≧1)の、n+1個の平均ビームパターンの最小値が所定範囲内に収まっている場合、平均ビームパターンの最小値が収束したと判定する。収束していないと判定された場合、処理はS805へ進み、信号解析部103は、d=d+1のように外部マイク間隔をインクリメントし、処理をS802へ戻す。S804で、平均ビームパターンの最小値が収束したと判定された場合は、処理はS806へ進む。S806では、信号解析部103は、平均ビームパターンの最小値が収束したときのdを、外部マイク119の外部マイク間隔として設定する。
図5に戻り、S505で、レンズ部120のタイプに対応するアレイ・マニフォールド・ベクトルを保持していない場合は、処理はS530へ進む。S530では、信号解析部103は、代用のアレイ・マニフォールド・ベクトルを選択する処理を行う。レンズ筐体の形状がレンズ部120と全く異なるようなレンズに対応するアレイ・マニフォールド・ベクトルを用いると、図3(b)のようになり、平均ビームパターンのヌルが適切に形成されず、ヌルは浅く、広がってしまう。一方、レンズ筐体の形状が、レンズ部120と比較的近いレンズに対応するアレイ・マニフォールド・ベクトルを用いれば、図3(c)のように平均ビームパターンのヌルが深くなると考えられる。そこで、レンズ部120のタイプに対応するアレイ・マニフォールド・ベクトルを保持していない場合は、その代わりとして用いるアレイ・マニフォールド・ベクトルを、平均ビームパターンのヌルの深さから決定する。
上記の考え方に基づく、代用アレイ・マニフォールド・ベクトルの選択処理(S530)について、図9のフローチャートを参照して説明する。S901からS903は、記憶部102が保持しているアレイ・マニフォールド・ベクトルごとの処理であり、アレイ・マニフォールド・ベクトルループの中で行う。
S901では、処理ループ(AMVループ)で対象とするアレイ・マニフォールド・ベクトルを選択する。S902では、信号解析部103は、S901で選択したアレイ・マニフォールド・ベクトルを用いて、平均ビームパターン算出処理を行う。平均ビームパターン算出処理は図6のフローチャートで説明したとおりである。但し、S902で実行される平均ビームパターン算出処理において、S601からS603までは、AMVループの最初の一回のみ行えばよい。また、代用アレイ・マニフォールド・ベクトルの選択処理(S530)が実行された場合は、当該処理内で平均ビームパターン算出処理が行われるので、S507の平均ビームパターン算出処理を省略可能である。
S903において、信号解析部103は、S902で算出した平均ビームパターンのヌルの深さを算出する。ヌルの深さは、図3(c)の双方向矢印で示すように、平均ビームパターンの最大値と最小値の差とすればよいが、より簡単には最小値のみで考えてもよい。S904では、信号解析部103は、S903で算出したヌルの深さをもとに、ヌルが最も深かったときのアレイ・マニフォールド・ベクトルを、代用アレイ・マニフォールド・ベクトルとして選択する。
なお、必ずしも記憶部102が保持する全てのアレイ・マニフォールド・ベクトルを図9に示されるAMVループの対象としなくてもよい。例えば、焦点距離がレンズ部120に近く、レンズ筐体の形状もレンズ部120に近いと考えられるレンズに対応するアレイ・マニフォールド・ベクトルのみをAMVループの処理対象としてもよい。またズーム倍率についても、現ズーム倍率に近いズーム倍率に対応するアレイ・マニフォールド・ベクトルのみをAMVループの対象としてもよい。さらに、ヌルの深さが所定値(例えば10dB)以上となった時点でAMVループを抜け、そのときのアレイ・マニフォールド・ベクトルを、代用アレイ・マニフォールド・ベクトルとして選択するようにしてもよい。
図5のフローチャートに戻り、S508において、信号解析部103は、平均ビームパターン算出処理(S507、S803、S902)で算出した平均ビームパターンのヌル方向から、音源方向を推定する。すなわち、平均ビームパターンが極小値を取る点、より簡単には最小値を取る点から、ヌル方向θnullを決定し、推定音源方向とする。
本実施形態においては、内蔵マイク111と外部マイク119の切り替えによる筐体の影響の変化や、レンズ部120のタイプやズーム倍率による筐体の形状変化に応じて、時間ブロックごとに適切なアレイ・マニフォールド・ベクトルが選択される。このため、図3(a)や図3(c)のように、筐体の形状変化等の影響の有無にかかわらず平均ビームパターンのヌルが適切に音源方向に形成され、高精度な音源方向推定ができるようになる。
なお、上記の音源方向推定においては、式(3)を用いることにより適応ビームフォーマのフィルタ係数は最小ノルム法で算出したがこれに限られるものではなく、たとえば、最小分散法(Capon法)などを用いてもよい。最小分散法も、最小ノルム法と同じく出力パワー最小化の規範に基づくものであるが、フィルタ係数ベクトルを非零ベクトルとするための制約条件として、メインローブの方向θmainを適当に指定する。最小分散法による適応ビームフォーマのフィルタ係数wMV(f)は、式(5)のように得られる。
Figure 0006460676
また、上記においては、式(4)に示される音源方向に感度のディップ(ヌル)を形成するビームパターンΨ(f,θ)から音源方向を推定したが、代わりに、音源方向に感度のピークを形成する空間スペクトルP(f,θ)を用いてもよい。たとえば、最小ノルム法を用いた場合の空間スペクトルPMN(f,θ)は、式(6)で得られる。
Figure 0006460676
また、最小ノルム法では、空間相関行列の最小固有値に対応する固有ベクトルを用いた。さらに、雑音部分空間に属する全ての固有ベクトルを並べた行列をEnと置き、信号部分空間に属するアレイ・マニフォールド・ベクトルとの直交性を考えれば、MUSIC法の空間スペクトルPMU(f,θ)が式(7)で得られる。
Figure 0006460676
また、最小分散法を用いた場合の空間スペクトルPMV(f,θ)は、式(8)で得られる。
Figure 0006460676
以上のように、本実施形態の音源方向推定は、アレイ・マニフォールド・ベクトルと音響信号の空間相関行列を用いて音源方向に感度の極値を持つビームパターンや空間スペクトルといった感度曲線を算出し、感度曲線の極値点から音源方向を推定するものである。
図5に戻り、S509では、信号解析部103は、S508で推定した推定音源方向が、目的音の範囲外であるかを調べる。推定音源方向が目的音の範囲外である場合は、現時間ブロックにおいて推定音源方向にある雑音が卓越していると見なされ、処理はS510、S511の雑音除去処理へと進む。他方、S509で推定音源方向が目的音の範囲外でない、すなわち目的音の範囲内である場合は、現時間ブロックにおいて推定音源方向にある目的音が卓越していると見なされ、処理はS510、S511の雑音除去処理をスキップしてS512へ進む。なお、目的音の範囲は、例えば信号処理装置100の撮影方向である正面±30°のように定めておいてもよいし、現ズーム倍率に応じて変化する撮像系の画角範囲としてもよい。また、入出力UI部131を介してユーザが設定するようにしてもよい。以下、雑音除去処理について説明する。
S510、S511の処理は周波数ごとの処理であり、周波数ループの中で行われる。S510において、信号解析部103は、S508で推定した推定音源方向θnullに鋭いヌルを形成するための固定ビームフォーマのフィルタ係数wfix(f)を算出する。固定ビームフォーマのビームパターンにおいて、推定音源方向θnullにヌルを形成する条件は、アレイ・マニフォールド・ベクトルa(f,θnull)を用いて式(9)のように表される。
Figure 0006460676
ただし、式(9)だけでは解が零ベクトルとなってしまうため、メインローブ方向θmainにメインローブを形成する条件として式(10)を加える。ここで、メインローブ方向θmainは、目的音範囲の中心である正面0°などに定める。
Figure 0006460676
式(9)および式(10)をまとめて行列A(f)=[a(f,θnull) a(f,θmain)]を用いて表現すれば、式(11)のようになる。
Figure 0006460676
よって、式(11)の両辺に左からAH(f)の逆行列を掛けることで、固定ビームフォーマのフィルタ係数wfix(f)が式(12)のように得られる。
Figure 0006460676
ここで、wfix(f)のノルムは周波数ごとに異なるため、最小ノルム法のwMN(f)と同様に、ノルムが1となるよう正規化するのが好適である。なお、フィルタ係数ベクトルwfix(f)の要素数、すなわち収音系のマイク素子の数と、式(9)、式(10)のようなビームパターン上の制御点の数が異なる場合は、A(f)が正方行列ではないため一般化逆行列を用いる。
S511では、S510で算出した固定ビームフォーマのフィルタ係数を用いてフィルタリングを行い、雑音が除去されたマイク信号のフーリエ係数を取得する。一般に、ビームフォーマによるフィルタリングは、マイク信号に対して式(13)のように行う。ここで、z(f)=z(f,1)であり、Y(f)が雑音除去信号のフーリエ係数である。
Figure 0006460676
ただし、これでは雑音除去信号がモノラル信号になってしまうため、再び2chマイク信号に戻すためのProjection Backを行う。具体的には、行ベクトルであるwH fixを横長行列と見なし、その一般化逆行列を式(13)の両辺に左から掛けることで、式(14)のように雑音除去された2chマイク信号のフーリエ係数zPJ(f)を取得する。
Figure 0006460676
ここで、上付きの+は一般化逆行列を表すものとする。
以上のように、本実施形態によれば、適切なアレイ・マニフォールド・ベクトルの選択によって音源方向を正確に推定することができる。そして、正確に推定された雑音方向に鋭いヌルを形成する固定ビームフォーマを用いることで、雑音が目的音に近接するような場合でも、雑音のみを高精度に除去することができる。なお、本実施形態では雑音消去を説明したが、正確に推定された音源方向を音源の分離に用いることも可能である。
S512では、2chマイク信号のフーリエ係数を逆フーリエ変換し、現時間ブロックにおけるマイク信号を取得する。これを窓掛けして前時間ブロックまでのマイク信号にオーバーラップ加算していき、得られるマイク信号を記憶部102へ逐次記録する。以上のようにして得られたマイク信号は、記憶部102と相互に結ばれた、不図示のデータ入出力部を介して外部に出力したり、イヤホン、ヘッドホン、スピーカといった不図示の音響再生系によって再生したりすることができる。
なお、上記説明においては簡単のため、方向として方位角θのみを考えていたが、仰角φも考えることができる。すなわち、方位角θおよび仰角φごとの伝達関数としてアレイ・マニフォールド・ベクトルa(f,θ,φ)を用意し、方位角θだけでなく、仰角φも0°以外に−90°から90°まで変えながら、ビームパターンΨ(f,θ,φ)を算出する。そして、平均ビームパターンの極値点から、水平方向だけでなく垂直方向含む全方位の音源方向を推定することができる。
さらに、方向に加えて距離rも考えることができる。すなわち、方位角θ、仰角φ、距離rごとの伝達関数としてアレイ・マニフォールド・ベクトルa(f,θ,φ,r)を用意し、方位角θ、仰角φに加えて、距離rも例えば0.5mから5mまで変えながら、ビームパターンΨ(f,θ,φ,r)を算出する。そして、平均ビームパターンの極値点から、音源方向に加えて音源距離も推定することができる。
なお、音響処理において、雑音除去処理には固定ビームフォーマ以外の手法を用いても構わない。例えば、マイク信号のチャンネル間の位相差を周波数ごとに求め、推定音源方向に対応する位相差範囲の場合に、抑圧するようなマスク処理を用いてもよい。この場合も、推定音源方向に対応する位相差範囲の算出にはアレイ・マニフォールド・ベクトルが必要となるため、本実施形態のアレイ・マニフォールド・ベクトル選択を適用することができる。なお、適応ビームフォーマによる音源方向推定処理を行わず、固定ビームフォーマのみによって所定方向の雑音を除去するようにしてもよい。
また、上記において、アレイ・マニフォールド・ベクトルの取得は非撮影時に行われるものとしていたが、撮影時の音響処理における割り込み処理として動的に行われるようにしてもよい。
また、上記説明においては、音響信号取得時である撮影時に全ての音響処理を行っているが、これに限られるものではない。たとえば、各時間ブロックで選択するアレイ・マニフォールド・ベクトルを特定できるような付加情報とともに音響信号を記録しておくことで、非撮影時に後処理として音源方向推定処理や雑音除去処理を行うこともできる。そのような付加情報としては、たとえば、外部マイク119と内蔵マイク111の切り替えを示す外部マイク接続情報、外部マイク間隔、レンズ部120のタイプやズーム倍率、またはアレイ・マニフォールド・ベクトル識別IDなどが挙げられる。
また、外部マイク119が、レンズ部120と同様に不図示の外部マイク制御部や外部マイク内記憶部を備える場合は、システム制御部101が外部マイク制御部と通信を行うことで、外部マイク119のタイプを識別することができる。さらに、システム制御部101は、外部マイク制御部を介して外部マイク間隔を取得し、外部マイクのタイプと対応付けて記憶部102に保存することができる。
また、外部マイクの場合は、信号処理装置100の筐体の影響を受けにくいとして、自由空間の理論式によるアレイ・マニフォールド・ベクトルを選択していた。しかし、外部マイク自体の筐体の影響によって、アレイ・マニフォールド・ベクトルが自由空間の理論値から乖離するような場合も考えられる。そこで、外部マイク筐体の影響を含むアレイ・マニフォールド・ベクトルを外部マイク内記憶部が保持しておき、システム制御部101が外部マイク制御部を介して取得して、外部マイクのタイプと対応付けて記憶部102に保存するようにしてもよい。
また、種々のアレイ・マニフォールド・ベクトルの取得方法は、上記した方法に限られるものではない。たとえば、アレイ・マニフォールド・ベクトルをデータ入出力部を介して任意の外部記憶部から取得したり、ネットワーク上のデータベースから取得したりするようにしてもよい。
また、レンズ部120が交換レンズでなく、ズーム倍率によってもレンズ筐体の形状が伸縮しないような場合は、外部マイク用と、内蔵マイク用のデフォルトのアレイ・マニフォールド・ベクトルを切り替えるだけとなる。また、外部マイクを接続しないで内蔵マイクのみを用いる場合は、レンズ部120のタイプやズーム倍率によって筐体形状が変化する場合のみ、アレイ・マニフォールド・ベクトルを切り替えることになる。これらの場合も本発明に含まれることは言うまでもない。
また、内蔵マイクと外部マイクの切り替えに限らず、使用マイク素子の変更等による内蔵マイク同士の切り替えや外部マイク同士の切り替えなど、任意のマイク切り替えにおけるアレイ・マニフォールド・ベクトル切り替えにも対応可能としてよい。
また、上記説明においてシステム制御部101は、レンズ部120による信号処理装置100の筐体の形状変化を検出する検出手段として機能し、その検出結果に応じて信号解析部103がアレイ・マニフォールド・ベクトルを選択していた。これと同様に、次のような場合も本発明の範囲に含まれる。例えば入出力UI部131を構成するタッチパネルが開閉式である場合は、その開閉状態に応じて信号処理装置100の筐体形状が変化すると見なすことができる。そこで、タッチパネルの開閉状態を検出し、それに応じてアレイ・マニフォールド・ベクトルを選択するようにしてもよい。この考え方は、例えば折り畳み式携帯電話にも用いることができる。
また、信号処理装置100には、レンズ部120以外にもストロボ等の様々なアクセサリが装着され得るため、その着脱状態に応じて信号処理装置100の筐体形状が変化すると見なすことができる。そこで、任意のアクセサリの着脱状態を検出し、それに応じてアレイ・マニフォールド・ベクトルを選択するようにしてもよい。
以上説明した本発明によれば、マイクの切り替えや筐体の形状変化に応じてアレイ・マニフォールド・ベクトルを選択することで、高精度な音響処理を実現することができる。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。係る記憶媒体は言うまでもなく、コンピュータ読み取り可能な記憶媒体である。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
100:信号処理装置、101:システム制御部、102:記憶部、103:信号解析部、111:内蔵マイク、112:音響信号入力部、119:外部マイク、120:レンズ部

Claims (23)

  1. 形状が可変である所定の機器を装着可能な信号処理装置であって、
    記信号処理装置が有するマイクから複数チャネルの音響信号を取得する音取得手段と、
    前記信号処理装置に装着された前記機器の形状の変化に伴って変化するパラメータを取得するパラメータ取得手段と、
    向に応じた音の伝搬特性を表す情報であって前機器の形状に応じた伝搬特性を表す情報を、前記パラメータ取得手段により取得されたパラメータに基づいて取得する情報取得手段と、
    前記音取得手段により取得された音響信号を、前記情報取得手段により取得された情報を用いて処理する処理手段と、を有することを特徴とする信号処理装置。
  2. 前記パラメータ取得手段は、前記信号処理装置としてのカメラに前記所定の機器としてのズームレンズが装着された場合に、前記ズームレンズの形状の変化に伴って変化するパラメータとして、ズーム倍率を表すパラメータを取得することを特徴とする請求項1に記載の信号処理装置。
  3. 前記パラメータ取得手段は、前記ズームレンズと通信することにより前記ズーム倍率を表すパラメータを取得することを特徴とする請求項2に記載の信号処理装置。
  4. 前記音取得手段により取得された音響信号に対する前記処理手段による処理の結果に基づいて、当該音響信号に係る音源の方向を推定する推定手段を有することを特徴とする請求項1乃至3の何れか1項に記載の信号処理装置。
  5. 前記音取得手段により取得された音響信号から、前記推定手段により推定された方向に対応する音響信号を分離する分離手段を有することを特徴とする請求項に記載の信号処理装置。
  6. 前記伝搬特性を表す情報はアレイ・マニフォールド・ベクトルを示す情報であることを特徴とする請求項乃至の何れか1項に記載の信号処理装置。
  7. 前記情報取得手段は、複数の所定のアレイ・マニフォールド・ベクトルのうち、各アレイ・マニフォールド・ベクトルに対応する感度曲線の極値に基づいて選択されたアレイ・マニフォールド・ベクトルを、前記伝搬特性を表す情報として取得することを特徴とする請求項1乃至5の何れか1項に記載の信号処理装置。
  8. 前記情報取得手段は、保持部により保持される複数のアレイ・マニフォールド・ベクトルのうち、前記パラメータ取得手段により取得されたパラメータに対応するアレイ・マニフォールド・ベクトルを、前記伝搬特性を表す情報として取得することを特徴とする請求項1乃至5の何れか1項に記載の信号処理装置。
  9. 前記情報取得手段は、前記パラメータ取得手段により取得されたパラメータに対応するアレイ・マニフォールド・ベクトルが前記保持部により保持されていない場合には、前記保持部により保持されるアレイ・マニフォールド・ベクトルに対応するパラメータと前記パラメータ取得手段により取得されたパラメータとの差に基づいて選択されたアレイ・マニフォールド・ベクトルを、前記伝搬特性を表す情報として取得することを特徴とする請求項8に記載の信号処理装置。
  10. 前記情報取得手段は、前記パラメータ取得手段により取得されたパラメータに対応するアレイ・マニフォールド・ベクトルが前記保持部により保持されていない場合には、前記保持部により保持される2以上のアレイ・マニフォールド・ベクトルを用いた補間処理により生成されたアレイ・マニフォールド・ベクトルを、前記伝搬特性を表す情報として取得することを特徴とする請求項8に記載の信号処理装置。
  11. 前記音取得手段は、
    少なくとも一部が前記信号処理装置の筐体内に存在する第1マイクから複数チャネルの音響信号を取得する第1取得手段と、
    前記筐体の外部に備えられる第2マイクから複数チャネルの音響信号を取得する第2取得手段と、を有し
    前記処理手段は、前記第1取得手段により取得された音響信号を処理する場合には、方向に応じた音の伝搬特性を表す第1情報を用いて音響信号を処理し、前記第2取得手段により取得された音響信号を処理する場合には、方向に応じた音の伝搬特性を表す第2情報であって前記第1情報が表す伝搬特性とは異なる伝搬特性を表す第2情報を用いて音響信号を処理するとを特徴とする請求項1乃至10の何れか1項に記載の信号処理装置。
  12. 前記第1情報は前記筐体の影響を含む伝搬特性を表し、前記第2情報は前記筐体の影響を含まない伝搬特性を表すことを特徴とする請求項11に記載の信号処理装置。
  13. 前記第1情報を用いて音響信号を処理するか前記第2情報を用いて音響信号を処理するかを選択する選択手段を有することを特徴とする請求項11又は12に記載の信号処理装置。
  14. 前記第2情報は、前記筐体の影響を含まない音の伝搬特性であって前記第2マイクが有する複数のマイク素子の間隔に基づいて決まる伝搬特性を表すことを特徴とする請求項11乃至13の何れか1項に記載の信号処理装置。
  15. 前記第2マイクが有する複数のマイク素子の間隔を示す情報を取得する第3取得手段をさらに備え、
    前記処理手段は、前記第2取得手段により取得された音響信号を処理する場合には、前記第3取得手段により取得される情報に基づいて取得される前記第2情報を用いて音響信号を処理することを特徴とする請求項11乃至14の何れか1項に記載の信号処理装置。
  16. 複数パターンのマイク素子の間隔に対応する複数の感度曲線の極値に基づいて、前記第2マイクが有する複数のマイク素子の間隔を推定する第2推定手段をさらに備えることを特徴とする請求項14に記載の信号処理装置。
  17. 前記第2情報を前記第2マイクから取得する第4取得手段を有することを特徴とする請求項11乃至16の何れか1項に記載の信号処理装置。
  18. 前記筐体の形状を判定する判定手段をさらに備え、
    前記第1情報は、前記判定手段による判定結果に対応する伝搬特性を表すことを特徴とする請求項11乃至17のいずれか1項に記載の信号処理装置。
  19. 形状が可変である所定の機器を装着可能な信号処理装置により実行される信号処理方法であって、
    記信号処理装置が有するマイクから複数チャネルの音響信号を取得する音取得工程と、
    前記信号処理装置に装着された前記機器の形状の変化に伴って変化するパラメータを取得するパラメータ取得工程と、
    向に応じた音の伝搬特性を表す情報であって前機器の形状に応じた伝搬特性を表す情報を、前記パラメータ取得工程において取得されたパラメータに基づいて取得する情報取得工程と、
    前記音取得工程において取得された音響信号を、前記情報取得工程において取得された情報を用いて処理する処理工程と、を有することを特徴とする信号処理方法。
  20. 前記パラメータ取得工程は、前記信号処理装置としてのカメラに前記所定の機器としてのズームレンズが装着された場合に、前記ズームレンズの形状の変化に伴って変化するパラメータとして、ズーム倍率を表すパラメータを取得することを特徴とする請求項19に記載の信号処理方法。
  21. 前記情報取得工程は、保持部に保持される複数のアレイ・マニフォールド・ベクトルのうち、前記パラメータ取得工程において取得されたパラメータに対応するアレイ・マニフォールド・ベクトルを、前記伝搬特性を表す情報として取得することを特徴とする請求項19又は20に記載の信号処理方法。
  22. 前記情報取得工程は、前記パラメータ取得工程において取得されたパラメータに対応するアレイ・マニフォールド・ベクトルが前記保持部により保持されていない場合には、前記保持部により保持される2以上のアレイ・マニフォールド・ベクトルを用いた補間処理により生成されたアレイ・マニフォールド・ベクトルを、前記伝搬特性を表す情報として取得することを特徴とする請求項21に記載の信号処理方法。
  23. コンピュータを、請求項1乃至18のいずれか1項に記載の信号処理装置の各手段として機能させるためのプログラム。
JP2014159761A 2014-08-05 2014-08-05 信号処理装置および信号処理方法 Active JP6460676B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014159761A JP6460676B2 (ja) 2014-08-05 2014-08-05 信号処理装置および信号処理方法
US14/811,387 US9781509B2 (en) 2014-08-05 2015-07-28 Signal processing apparatus and signal processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014159761A JP6460676B2 (ja) 2014-08-05 2014-08-05 信号処理装置および信号処理方法

Publications (3)

Publication Number Publication Date
JP2016039410A JP2016039410A (ja) 2016-03-22
JP2016039410A5 JP2016039410A5 (ja) 2017-08-31
JP6460676B2 true JP6460676B2 (ja) 2019-01-30

Family

ID=55268451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014159761A Active JP6460676B2 (ja) 2014-08-05 2014-08-05 信号処理装置および信号処理方法

Country Status (2)

Country Link
US (1) US9781509B2 (ja)
JP (1) JP6460676B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107121669B (zh) * 2016-02-25 2021-08-20 松下电器(美国)知识产权公司 声源探测装置、声源探测方法及非瞬时性记录介质
JP2019020530A (ja) 2017-07-13 2019-02-07 キヤノン株式会社 信号処理装置、制御方法、及びプログラム
CN107527609B (zh) * 2017-07-25 2020-10-20 浙江大学 一种降低背景噪声的吸隔声装置
CN107633845A (zh) * 2017-09-11 2018-01-26 清华大学 一种鉴别式局部信息距离保持映射的说话人确认方法
CN107920303B (zh) * 2017-11-21 2019-12-24 北京时代拓灵科技有限公司 一种音频采集的方法及装置
EP4147458A4 (en) 2020-05-08 2024-04-03 Microsoft Technology Licensing, LLC SYSTEM AND METHOD FOR DATA AMPLIFICATION FOR MULTI-MICROPHONE SIGNAL PROCESSING
CN112714383B (zh) * 2020-12-30 2022-03-11 西安讯飞超脑信息科技有限公司 麦克风阵列的设置方法、信号处理装置、系统及存储介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5130812A (en) * 1989-01-20 1992-07-14 Sony Corporation Apparatus for recording on a disk an audio signal that is recorded after the recording of a video signal thereon
EP0457476B1 (en) * 1990-05-14 1996-07-03 Gold Star Co. Ltd Camcorder
US7119267B2 (en) * 2001-06-15 2006-10-10 Yamaha Corporation Portable mixing recorder and method and program for controlling the same
JP2005026868A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 音声信号記録装置
JP4629388B2 (ja) * 2004-08-27 2011-02-09 ソニー株式会社 音響生成方法、音響生成装置、音響再生方法及び音響再生装置
JP4051408B2 (ja) * 2005-12-05 2008-02-27 株式会社ダイマジック 収音・再生方法および装置
US20070242839A1 (en) * 2006-04-13 2007-10-18 Stanley Kim Remote wireless microphone system for a video camera
TWI322625B (en) * 2006-07-17 2010-03-21 Fortemedia Inc Electronic device capable of receiving sound in different mode via external microphone and sound-receiving method
KR101409169B1 (ko) * 2007-09-05 2014-06-19 삼성전자주식회사 억제 폭 조절을 통한 사운드 줌 방법 및 장치
JP5392827B2 (ja) 2009-05-29 2014-01-22 Necカシオモバイルコミュニケーションズ株式会社 音データ処理装置
JP5451188B2 (ja) 2009-06-02 2014-03-26 キヤノン株式会社 定在波検出装置およびその制御方法
JP5345025B2 (ja) * 2009-08-28 2013-11-20 富士フイルム株式会社 画像記録装置及び方法
JP5374427B2 (ja) * 2010-03-18 2013-12-25 株式会社日立製作所 音源分離装置、音源分離方法およびそのためのプログラム、並びにそれを用いたビデオカメラ装置およびカメラ付き携帯電話装置
JP5523178B2 (ja) * 2010-04-14 2014-06-18 オリンパスイメージング株式会社 記録装置
JP5606234B2 (ja) 2010-09-13 2014-10-15 キヤノン株式会社 音響装置
US11120818B2 (en) * 2010-11-12 2021-09-14 Nokia Technologies Oy Processing audio with a visual representation of an audio source
JP5762782B2 (ja) * 2011-03-24 2015-08-12 オリンパス株式会社 記録装置、記録方法、およびプログラム
JP2013017160A (ja) * 2011-06-06 2013-01-24 Panasonic Corp カメラ本体およびカメラ本体に装着可能な交換レンズ
US20130044901A1 (en) * 2011-08-16 2013-02-21 Fortemedia, Inc. Microphone arrays and microphone array establishing methods
US9857451B2 (en) * 2012-04-13 2018-01-02 Qualcomm Incorporated Systems and methods for mapping a source location
JP5950749B2 (ja) * 2012-08-10 2016-07-13 キヤノン株式会社 撮像装置
JP6074263B2 (ja) * 2012-12-27 2017-02-01 キヤノン株式会社 雑音抑圧装置及びその制御方法
US9426573B2 (en) * 2013-01-29 2016-08-23 2236008 Ontario Inc. Sound field encoder
US9107011B2 (en) * 2013-07-03 2015-08-11 Sonetics Holdings, Inc. Headset with fit detection system
JP6371516B2 (ja) 2013-11-15 2018-08-08 キヤノン株式会社 音響信号処理装置および方法
CN105981409B (zh) * 2014-02-10 2019-06-14 伯斯有限公司 会话辅助系统

Also Published As

Publication number Publication date
US20160044411A1 (en) 2016-02-11
US9781509B2 (en) 2017-10-03
JP2016039410A (ja) 2016-03-22

Similar Documents

Publication Publication Date Title
JP6460676B2 (ja) 信号処理装置および信号処理方法
Khaykin et al. Acoustic analysis by spherical microphone array processing of room impulse responses
KR101415026B1 (ko) 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치
JP6129316B2 (ja) 情報に基づく多チャネル音声存在確率推定を提供するための装置および方法
JP5814476B2 (ja) 空間パワー密度に基づくマイクロフォン位置決め装置および方法
KR101724514B1 (ko) 사운드 신호 처리 방법 및 장치
EP2647221B1 (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
JP6074263B2 (ja) 雑音抑圧装置及びその制御方法
Thiergart et al. On the spatial coherence in mixed sound fields and its application to signal-to-diffuse ratio estimation
Gaubitch et al. Calibration of distributed sound acquisition systems using TOA measurements from a moving acoustic source
JP2018107697A (ja) 信号処理装置、信号処理方法及びプログラム
JP3862685B2 (ja) 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
JP6041244B2 (ja) 音響処理装置および音響処理方法
Kowalczyk Raking early reflection signals for late reverberation and noise reduction
Doblinger Localization and tracking of acoustical sources
JP2019054340A (ja) 信号処理装置およびその制御方法
Schrammen Front-end signal processing for far-field speech communication
Ramamurthy Experimental evaluation of modified phase transform for sound source detection
WO2022047606A1 (en) Method and system for authentication and compensation
De Lucia Implementation of a low-cost acoustic camera using arrays of MEMS microphones
JP2008022069A (ja) 音声収録装置および音声収録方法
Ma et al. Using a reflection model for modeling the dynamic feedback path of digital hearing aids
Zou et al. Speech enhancement with an acoustic vector sensor: an effective adaptive beamforming and post-filtering approach
He On the beamforming design
Benesty et al. Multichannel Noise Reduction in the STFT Domain

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170720

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170720

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181225

R151 Written notification of patent or utility model registration

Ref document number: 6460676

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151