JP5908199B2 - 音響処理装置及び集音装置 - Google Patents

音響処理装置及び集音装置 Download PDF

Info

Publication number
JP5908199B2
JP5908199B2 JP2009122658A JP2009122658A JP5908199B2 JP 5908199 B2 JP5908199 B2 JP 5908199B2 JP 2009122658 A JP2009122658 A JP 2009122658A JP 2009122658 A JP2009122658 A JP 2009122658A JP 5908199 B2 JP5908199 B2 JP 5908199B2
Authority
JP
Japan
Prior art keywords
sound
frequency component
sound source
unit
stereo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009122658A
Other languages
English (en)
Other versions
JP2010273062A (ja
Inventor
智岐 奥
智岐 奥
吉田 昌弘
昌弘 吉田
誠 山中
誠 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xacti Corp
Original Assignee
Xacti Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xacti Corp filed Critical Xacti Corp
Priority to JP2009122658A priority Critical patent/JP5908199B2/ja
Publication of JP2010273062A publication Critical patent/JP2010273062A/ja
Application granted granted Critical
Publication of JP5908199B2 publication Critical patent/JP5908199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic Arrangements (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、入力される音響信号に所定の処理を施して出力する音響処理装置や、当該音響処理装置を備えた集音装置に関する。
動画を撮像するデジタルビデオカメラに代表される撮像装置や、IC(Integrated Circuit)レコーダに代表される音響記録装置など、集音により音響信号を生成する集音装置の中に、音響信号に種々の処理を施す音響処理装置を備えるものがある。このような音響処理装置として、音の到来方向(音源の位置)を音響信号に反映させてステレオ感を強調する処理(以下、ステレオ感強調処理とする)を行うものがある。例えば、複数のマイクを用いて集音することにより得られる複数のチャンネルの音響信号を適宜遅延させ、遅延させたあるチャンネルの音響信号を異なるチャンネルの音響信号に合成する処理(以下、遅延合成とする)を行うことで、ステレオ感強調処理を行うものがある。
しかしながら、集音装置の構造によっては、この遅延合成によるステレオ感強調処理の効果が十分に得られない場合が生じ得る。具体的に例えば、集音装置に実装される二つのマイクが、空間サンプリング定理(マイク間隔d(mm)<音速(略340m/s)/サンプリング周波数(kHz)、サンプリング周波数が48kHzであればd<略7.1)を満たさない場合、音響信号の高周波数の帯域で十分な効果が得られない、または逆効果となる場合が生じ得る。
これについて図面を参照して説明する。図8は、遅延合成によるステレオ感強調処理を施して得られる音響信号のグラフである。図8(a)は、上記定理を満たす集音装置(d=7)で集音されて遅延合成によるステレオ感強調処理が施された音響信号のグラフである。図8(b)は、上記定理を満たさない集音装置(d=10)で集音されて遅延合成によるステレオ感強調処理が施された音響信号のグラフである。また図9は、音源とマイクとの位置関係について説明する図である。
図8(a)及び(b)のグラフの横軸は周波数、縦軸は音響信号のレベル差(図9において、一方のマイクMLより得られるステレオ感強調処理後の音響信号のレベルから、他方のマイクMRより得られるステレオ感強調処理後の音響信号のレベルを減算した値)である。また、グラフ中に示されるそれぞれの曲線は、音源Sの位置毎に得られる音響信号の状態をそれぞれ示したものである。図9に示すように、音源Sの位置は、二つのマイクML,MRの中心と音源Sとを結ぶ直線L0°〜L90°と、二つのマイクML,MRを結ぶ直線に対して垂直(マイクML,MRの正面方向)となる直線LFと、の成す角度で表現する。なお、ここでは音源Sが他方のマイクMRより一方のマイクMLに近い場合の音源Sの位置を、正の角度で表現する。
図8(a)に示すように、上記定理を満たす集音装置で集音された音響信号に対してステレオ感強調処理を施して得られる音響信号は、音源Sが二つのマイクML,MRの正面方向(0°)から一方のマイクML側に寄った位置になるほど(角度が大きくなるほど)、レベル差が大きくなっている。即ち、実際の音源Sの位置が正しく表現された音響信号が生成されている。一方、図8(b)に示すように、上記定理を満たさない集音装置で集音された音響信号に対してステレオ感強調処理を施して得られる音響信号では、音源Sの位置を示す角度が大きくなると、15kHz以上の高周波数の帯域で折り返し(レベル差の反転)が生じる。このような折り返しが生じる帯域では、音源から遠い他方のマイクMRのレベルの方が一方のマイクMLのレベルよりも大きくなる場合が生じ得るため、ステレオ感強調処理が逆効果となることがある。
そこで、例えば特許文献1では、音響信号の低周波数の帯域に対して選択的にステレオ感強調処理を施す集音装置が提案されている。
特開平4−27298号公報
特許文献1で提案される集音装置では、高周波数の帯域に遅延合成によるステレオ感強調処理を施さないため、折り返しが発生することによってステレオ感強調処理が逆効果となることを抑制することができる。しかしながら、高周波数の帯域に対してステレオ感強調処理を施すことができないため、十分なステレオ感を得ることができず、問題となる。
なお、サンプリング定理を満たすようにマイクを配置すれば、上述した従来の遅延合成を用いたステレオ感強調処理を行うこととしても、音響信号の周波数の全帯域でステレオ感強調処理の効果を得ることができる。しかしながら、集音装置の構造が制限されるため、問題となる。
そこで本発明は、音響信号の周波数の全帯域においてステレオ感強調処理の効果を得るとともに、構造の自由度を向上させる音響処理装置及び集音装置を提供することを目的とする。
上記目的を達成するために本発明の音響処理装置は、集音して得られる複数のチャンネルの音響信号に対してステレオ感強調処理を施して出力する音響処理装置において、前記音響信号の所定の周波数以下の低域成分に対して低域成分用ステレオ感強調処理を施すとともに、所定の周波数以上の高域成分に対して高域成分用ステレオ感強調処理を施すステレオ感強調処理部を備えることを特徴とする。
また、上記構成の音響処理装置において、前記ステレオ感強調処理部が、前記音響信号から前記低域成分と前記高域成分とを分離して得る分離部と、前記分離部で得られた前記低域成分に前記低域成分用ステレオ感強調処理を施して出力する低域成分ステレオ感強調部と、前記分離部で得られた前記高域成分に前記高域成分用ステレオ感強調処理を施して出力する高域成分ステレオ感強調部と、前記低域成分ステレオ感強調部から出力される前記低域成分と、前記高域成分ステレオ感強調部から出力される前記高域成分と、を結合する結合部と、を備えることとしても構わない。
このように構成すると、音響信号から低域成分及び高域成分をそれぞれ分離して得ることが可能となる。そのため、低域成分用ステレオ感強調処理及び高域成分用ステレオ感強調処理をそれぞれ独立した処理として、低域成分及び高域成分のそれぞれに対して施すことが可能となる。なお、以下の実施形態では、分離部の一例としてHPF及びLPFまたはFFT部を挙げ、結合部の一例として合成部またはIFFT部を挙げて、それぞれ説明している。
また、上記構成の音響処理装置において、前記ステレオ感強調処理部が、前記低域成分に基づいて、前記音響信号に含まれる音を発した音源の状態を示す音源情報を生成する音源情報生成部を備え、前記低域成分用ステレオ感強調処理及び前記高域成分用ステレオ感強調処理の少なくとも一方が、前記音源情報に基づいた処理であることとしても構わない。
このように構成すると、低域成分や高域成分に対して、音源の状態に基づいた効果的な低域成分用ステレオ感強調処理や高域成分用ステレオ感強調処理を施すことが可能となる。また、高域成分ではマイクの感度特性のばらつきによる影響が大きくなるため、低域成分に基づいて音源情報を生成することにより、精度よく音源情報を生成することが可能となる。
また、上記構成の音響処理装置において、前記音源情報に、前記音響信号を集音した複数のマイクに対する前記音源の方向を示す情報が含まれることとしても構わない。また、前記音源が発する音の周波数を示す情報が含まれることとしても構わない。
また、上記構成の音響処理装置において、前記高域成分用ステレオ感強調処理が、複数のチャンネルの前記高域成分のレベル比を制御するものであることとしても構わない。
また、上記構成の音響処理装置において、前記低域成分が、前記音響信号の略4kHz以下の成分であるとともに、前記高域成分が前記音響信号の略4kHz以上の成分であり、前記低域成分用ステレオ感強調処理が、複数チャンネルの前記低域成分の位相差を用いた制御を行うものであり、前記高域成分用ステレオ感強調処理が、複数チャンネルの前記高域成分のレベル比を用いた制御を行うものであることとしても構わない。
略4kHz以下の低域成分では位相差(時間差)が音源方向の知覚に強く寄与し、略4kHz以上の高域成分ではレベル差(レベル比)が音源方向の知覚に強く寄与する。そのため、このように構成することで、ステレオ感強調処理をより効果的に行うことが可能となる。
また、本発明の集音装置は、集音して複数のチャンネルの音響信号を生成する複数のマイクと、前記複数のマイクで集音して得られる前記音響信号を処理する上記のいずれかに記載の音響処理装置と、を備えることを特徴とする。
また、上記構成の集音装置において、前記複数のマイクが無指向性のマイクであることとしても構わない。
このように構成すると、集音時に指向性が制御されていない音響信号に対して、音響処理装置がステレオ感強調処理を施すこととなる。そのため、音響処理装置の設計を容易にすることが可能となる。
本発明によると、低域成分用ステレオ感強調処理と高域成分用ステレオ感強調処理とを別々に行うことによって、周波数の全帯域においてステレオ感強調処理の効果が得られる音響信号を生成することが可能となる。そのため、音響信号を集音するマイクの配置などによらず、どのように集音して得られた音響信号に対しても、ステレオ感強調処理を施すことが可能となる。そのため、集音装置の構造の自由度を向上させることが可能となる。
は、本発明の実施形態における撮像装置の構成について示すブロック図である。 は、本発明の実施形態における撮像装置の音響処理部に備えられるステレオ感強調処理部の構成を示すブロック図である。 は、音源情報生成部の構成例について示すブロック図である。 は、低域成分ステレオ感強調部の構成例について示すブロック図である。 は、低域成分ステレオ感強調部の構成の別例について示すブロック図である。 は、高域成分ステレオ感強調部の構成例について示すブロック図である。 は、レベル比制御部の設定レベル比を示す表である。 は、遅延合成によるステレオ感強調処理を施して得られる音響信号のグラフである。 は、音源とマイクとの位置関係について説明する図である。
本発明の実施形態について、以下に図面を参照して説明する。最初に、本発明における音響処理部(音響処理装置)を備えた集音装置の一例として撮像装置を挙げて、具体的に説明する。
<<撮像装置>>
まず、撮像装置の構成について、図1を参照して説明する。図1は、本発明の実施形態における撮像装置の構成について示すブロック図である。なお、以下では説明の具体化のため、ステレオマイク(二つのマイクを備え、Lch及びRchの2つのチャンネルの音響信号を生成する)を備えた撮像装置について説明する。
図1に示すように、撮像装置1は、入射される光学像を電気信号に変換するCCD(Charge Coupled Device)またはCMOS(Complimentary Metal Oxide Semiconductor)センサなどの固体撮像素子から成るイメージセンサ2と、被写体の光学像をイメージセンサ2に結像させるとともに光量などの調整を行うレンズ部3と、を備える。レンズ部3とイメージセンサ2とで撮像部が構成され、この撮像部によって画像信号が生成される。なお、レンズ部3は、ズームレンズやフォーカスレンズなどの各種レンズ(不図示)や、イメージセンサ2に入力される光量を調整する絞り(不図示)などを備える。
さらに、撮像装置1は、イメージセンサ2から出力されるアナログ信号である画像信号をデジタル信号に変換するとともにゲインの調整を行うAFE(Analog Front End)4と、入力される音を電気信号に変換するマイク5L,5Rと、マイク5L,5Rからそれぞれ出力されるアナログ信号である音響信号をデジタル信号にそれぞれ変換するADC(Analog to Digital Converter)6と、ADC6から出力される音響信号に対して各種音響処理を施して出力する音響処理部7と、AFE4から出力される画像信号に対して各種画像処理を施して出力する画像処理部8と、画像処理部8から出力される画像信号と音響処理部7から出力される音響信号とに対してMPEG(Moving Picture Experts Group)圧縮方式などの動画用の圧縮符号化処理を施す圧縮処理部9と、圧縮処理部9で圧縮符号化された圧縮符号化信号を記録する外部メモリ11と、画像信号を外部メモリ11に記録したり読み出したりするドライバ部10と、ドライバ部10において外部メモリ11から読み出した圧縮符号化信号を伸長して復号する伸長処理部12と、を備える。
また、音響処理部7は、入力されるそれぞれの音響信号にステレオ感強調処理を施して出力するステレオ感強調処理部70を備える。なお、ステレオ感強調処理部70の構成の詳細については、後述する。
また、撮像装置1は、伸長処理部12で復号された画像信号をモニタなどの表示装置(不図示)で表示可能な形式の信号に変換する画像信号出力回路部13と、伸長処理部12で復号された音響信号をスピーカなどの出力装置(不図示)で出力可能な形式の信号に変換する音響信号出力回路部14と、を備える。
また、撮像装置1は、撮像装置1内全体の動作を制御するCPU(Central Processing Unit)15と、各処理を行うための各プログラムを記憶するとともにプログラム実行時の信号の一時保管を行うメモリ16と、撮像を開始するボタンや各種設定の決定を行うボタンなどのユーザからの指示が入力される操作部17と、各部の動作タイミングを一致させるためのタイミング制御信号を出力するタイミングジェネレータ(TG)部18と、CPU15と各部との間で信号のやりとりを行うためのバス19と、メモリ16と各部との間で信号のやりとりを行うためのバス20と、を備える。
なお、外部メモリ11は画像信号や音響信号を記録することができればどのようなものでも構わない。例えば、SD(Secure Digital)カードのような半導体メモリ、DVDなどの光ディスク、ハードディスクなどの磁気ディスクなどをこの外部メモリ11として使用することができる。また、外部メモリ11を撮像装置1から着脱自在としても構わない。
次に、撮像装置1の基本動作について図1を参照して説明する。まず、撮像装置1は、レンズ部3より入射される光をイメージセンサ2において光電変換することによって、電気信号である画像信号を生成する。イメージセンサ2は、TG部18から入力されるタイミング制御信号に同期して、所定のフレーム周期(例えば、1/30秒)で順次AFE4に画像信号を出力する。そして、AFE4によってアナログ信号からデジタル信号へと変換された画像信号は、画像処理部8に入力される。画像処理部8では、画像信号がYUVを用いた信号に変換されるとともに、階調補正や輪郭強調等の各種画像処理が施される。また、メモリ16はフレームメモリとして動作し、画像処理部8が処理を行なう際に画像信号を一時的に保持する。
また、マイク5L,5Rは、音を集音し電気信号である音響信号に変換してLch及びRchの音響信号をそれぞれ生成し、出力する。マイク5L,5Rからそれぞれ出力される音響信号はADC6に入力されて、アナログ信号からデジタル信号へと変換される。さらに、ADC6によってデジタル信号へと変換された音響信号は音響処理部7に入力され、ノイズ除去などの各種音響処理が施される。このとき、ステレオ感強調処理部70によって、音響信号にステレオ感強調処理が施される。なお、ステレオ感強調処理の詳細については、後述する。
画像処理部8から出力される画像信号と、音響処理部7から出力される音響信号と、はともに圧縮処理部9に入力され、圧縮処理部9において所定の圧縮方式で圧縮される。このとき、画像信号と音響信号とは時間的に関連付けられており、再生時に画像と音とがずれないように構成される。そして、圧縮された画像信号及び音響信号はドライバ部10を介して外部メモリ11に記録される。なお、音響信号のみを記録する場合、音響信号のみが圧縮処理部9において所定の圧縮方法で圧縮され、外部メモリ11に記録される。
外部メモリ11に記録された圧縮後の画像信号及び音響信号は、ユーザの指示に基づいて伸長処理部12に読み出される。伸長処理部12では、圧縮された画像信号及び音響信号を伸長し、画像信号を画像信号出力回路部13、音響信号を音響信号出力回路部14にそれぞれ出力する。そして、画像信号出力回路部13や音響信号出力回路部14において、表示装置やスピーカで表示または出力可能な形式の信号に変換されて出力される。
なお、表示装置やスピーカは、撮像装置1と一体となっているものでも構わないし、別体となっており、撮像装置1に備えられる端子とケーブル等を用いて接続されるようなものでも構わない。
また、マイク5L,5Rを無指向性のマイクとしても構わない。音響処理部7に入力される音響信号を指向性が制御されていないものとすると、音響処理部7やステレオ感強調処理部70の設計を容易にすることが可能となるため、好ましい。また、マイク5L,5Rを、デジタル信号の音響信号を出力するデジタルマイクとして、ADC6を備えない構成としても構わない。
<ステレオ感強調処理部>
次に、図1に示した音響処理部7に備えられるステレオ感強調処理部70の構成及び動作の詳細について図面を参照して説明する。図2は、本発明の実施形態における撮像装置の音響処理部に備えられるステレオ感強調処理部の構成を示すブロック図である。なお、以下では、図1に示すマイク5Lで集音されて得られる音響信号をLch、マイク5Rで集音されて得られる音響信号をRchとして説明する。
図2に示すように、ステレオ感強調処理部70は、入力されるLchの音響信号から所定の周波数以下となる帯域成分(以下、低域成分とする)を取得して出力するLPF(Low Pass Filter)71Lと、入力されるRchの音響信号から低域成分を取得して出力するLPF71Rと、入力されるRchの音響信号から所定の周波数以上となる帯域成分(以下、高域成分とする)を取得して出力するHPF(High Pass Filter)72Lと、入力されるRchの音響信号から高域成分を取得して出力するHPF72Rと、LPF71Lから出力されるLchの低域成分とLPF71Rから出力されるRchの低域成分とを比較して音源情報を生成し出力する音源情報生成部73と、LPF71Lから出力されるLchの低域成分とLPF71Rから出力されるRchの低域成分とのそれぞれに対して音源情報生成部73から出力される音源情報に基づいたステレオ感強調処理を施して出力する低域成分ステレオ感強調部74と、HPF72Lから出力されるLchの高域成分とHPF72Rから出力されるRchの高域成分とのそれぞれに対して音源情報生成部73から出力される音源情報に基づいたステレオ感強調処理を施して出力する高域成分ステレオ感強調部75と、低域成分ステレオ感強調部74から出力されるLchの低域成分と高域成分ステレオ感強調部75から出力されるLchの高域成分とを合成してLchの音響信号を生成し出力する合成部76Lと、低域成分ステレオ感強調部74から出力されるRchの低域成分と高域成分ステレオ感強調部75から出力されるRchの高域成分とを合成してRchの音響信号を生成し出力する合成部76Rと、を備える。
図2に示すように、ステレオ感強調処理部70は、まずLPF71L,71Rが、入力されるLch及びRchの音響信号から低域成分をそれぞれ取得する。同様に、HPF72L,72Rが、入力されるLch及びRchの音響信号から高域成分をそれぞれ取得する。そして、音源情報生成部73が、LPF71L,71Rから出力されるLch及びRchの低域成分を用いて音源情報を生成する。なお、音源情報には、例えばマイク5L,5Rに対する音源の存在方向(以下、音源方向とする)や、音源が発する音の周波数などの情報が含まれ得る。
低域成分ステレオ感強調部74は、LPF71L,71Rから出力されるLch及びRchのそれぞれの低域成分に対し、音源情報に基づいた低域成分用のステレオ感強調処理を施す。また、高域成分ステレオ感強調部75は、HPF72L,72Rから出力されるLch及びRchの高域成分に対し、音源情報に基づいた高域成分用のステレオ感強調処理を施す。このように、本例のステレオ感強調処理部70は、音響信号の低域成分と高域成分とに対して、別々にステレオ感強調処理を施す。
そして、低域成分ステレオ感強調部74及び高域成分ステレオ感強調部75でステレオ感強調処理が施されたLchの低域成分及び高域成分を、合成部76Lで合成(例えば、加算合成)してLchの音響信号を生成し、ステレオ感強調処理部70から出力する。同様に、ステレオ感強調処理が施されたRchの低域成分及び高域成分を、合成部76Rで合成してRchの音響信号を生成し、ステレオ感強調処理部70から出力する。
なお、低域成分及び高域成分を、略4kHzで分けることとしても構わない。人間の音の方向定位(音源方向の知覚)は、略4kHzを境目として、高周波数と低周波数とで強く寄与する因子が異なる。特に、低周波数の音では位相差(時間差)が音源方向の知覚に強く寄与し、高周波数の音では音圧(レベル)差が音源方向の知覚に強く寄与する(例えば“西山静男他,音響振動工学,コロナ社,1979”の2.2.5章参照)。そのため、略4kHzで低域成分と高域成分とを分離し、低域成分ステレオ感強調部74及び高域成分ステレオ感強調部75のそれぞれにおいて音源方向が知覚されやすくなるようなステレオ感強調処理を施すこととすると、より効果的なステレオ感強調処理を行うことが可能となるため、好ましい(詳細については後述する)。
[音源情報生成部]
次に、図2に示したステレオ感強調処理部70の音源情報生成部73、低域成分ステレオ感強調部74及び高域成分ステレオ感強調部75の具体的な構成及び動作について、以下図面を参照して説明する。まず、音源情報生成部73について、図3を参照して説明する。図3は、音源情報生成部の構成例について示すブロック図である。
図3に示すように、音源情報生成部73は、入力されるLchの低域成分を高速フーリエ変換(Fast Fourier Transform、以下FFTとする)して出力するFFT部731Lと、入力されるRchの低域成分をFFTして出力するFFT部731Rと、FFT部731L,731Rから出力されるそれぞれの信号を所定の周波数の帯域([1]〜[n])毎に比較して帯域([1]〜[n])毎に位相差を算出するn個の位相差算出部7321〜732nと、位相差算出部7321〜732nのそれぞれで算出される帯域([1]〜[n])毎の位相差に基づいて音源情報を算出する音源情報算出部733と、を備える。
FFT部731L,731Rは、入力されるLch及びRchの低域成分をそれぞれFFTし、時間軸の信号から周波数軸の信号へとそれぞれ変換する。位相差算出部7321〜732nは、FFT部731L,731Rから出力されるLch及びRchの低域成分の周波数軸の信号を、それぞれの帯域毎で比較する(例えば、帯域毎にLch及びRchの信号の相関を求めるなど)。これにより、マイク5L,5Rで集音される音の位相差(または時間差、音源とマイク5L,5Rのそれぞれとの距離差とも解釈し得る)を算出する。
音源情報算出部733は、位相差算出部7321〜732nで算出されるそれぞれの位相差に基づいて、音源方向や音源が発する音の周波数を算出する。例えば、音源方向は、マイク5L,5Rの間隔と位相差とを用いることにより、角度として算出することができる。
また例えば、音源が発する音の周波数は、人の声や楽器などの音が調波構造を取ることを利用することにより、算出することができる。具体的には、略等しい位相差(音源方向)が確認された帯域(周波数)が所定の周期となる場合、それらの周波数を音源が発する音の基本周波数または倍音の周波数とみなして、音源が発する音の周波数を算出することができる。
このように、Lch及びRchの低域成分を用いて音源情報(音源方向や音源が発する音の周波数)を生成することとすると、音源情報を精度よく生成することが可能となる。特に、安価なマイクの場合、高周波数(例えば、10kHz以上)の帯域で製品毎に感度特性のばらつきが大きくなる(例えば、レベルで±10dB程度)ことが多いため、位相差によるレベルの差異と感度特性のばらつきとを区別して音源情報を算出することが困難となる。したがって、音源情報を生成する際に低域成分を使用することによって、マイク5L,5Rの感度特性のばらつきに起因する音源情報の精度低下を抑制することが可能となる。
なお、音源情報算出部733が、帯域([1]〜[n])毎の音源方向を示す情報を、そのまま音源情報として出力することとしても構わない。
[低域成分ステレオ感強調部]
低域成分ステレオ感強調部74について、図4を参照して説明する。図4は、低域成分ステレオ感強調部の構成例について示すブロック図である。
図4に示すように、低域成分ステレオ感強調部74は、入力されるLchの低域成分をFFTして出力するFFT部741Lと、入力されるRchの低域成分をFFTして出力するFFT部741Rと、音源情報に基づいてFFT部741Lから出力される信号のレベルを所定の周波数の帯域毎に制御する帯域別レベル制御部742Lと、音源情報に基づいてFFT部741Rから出力される信号のレベルを所定の周波数の帯域毎に制御する帯域別レベル制御部742Rと、帯域別レベル制御部742Lから出力される信号を逆高速フーリエ変換(Inverse Fast Fourier Transform、以下IFFTとする)してLchの低域成分として出力するIFFT部743Lと、帯域別レベル制御部742Rから出力される信号をIFFTしてRchの低域成分として出力するIFFT部743Rと、を備える。
FFT部741L,741Rは、入力されるLch及びRchの低域成分をそれぞれFFTし、時間軸の信号から周波数軸の信号へとそれぞれ変換する。帯域別レベル制御部742L,742Rは、音源情報生成部73から出力される音源情報に基づいて、FFT部741L,741Rから出力されるLch及びRchの低域成分の周波数軸の信号のレベルをそれぞれの帯域毎に制御する。
例えば、帯域別レベル制御部742L,742Rは、音源情報から音源が発する音の周波数を確認し、当該周波数(帯域)のレベルを大きくする制御を行う。レベルを大きくする制御とは、当該帯域のレベルを増幅させて絶対的に大きくする制御だけでなく、当該帯域以外の帯域のレベルを抑制して当該帯域のレベルを相対的に大きくする制御や、これらの両方を行う制御をも含むものとする。またこのとき、音源情報から音源方向を確認し、音源が近い方のマイク5L,5Rから得られた信号(LchまたはRch)のレベルが大きくなるように制御する。なお、後述する高域成分ステレオ感強調部75と同様に、帯域別レベル制御部742L,742Rが、音源方向に応じたレベルの制御を行うこととしても構わない。
そして、IFFT部743L,743Rが、帯域別レベル制御部742L,742Rから出力されるLch及びRchのそれぞれの周波数軸の信号をIFFTして、時間軸の信号に変換する。これにより、ステレオ感を強調したLch及びRchの低域成分を得る。
このように構成すると、音源情報に基づいて確認される音源が発する音を、精度よく強調することが可能となる。そのため、効果的にステレオ感強調処理を行うことが可能となる。特に、上記のように帯域毎にレベルを制御することによって、音源が複数存在する場合であっても、個々の音源が発する音毎にレベルを制御することが可能となる。
なお、図3に示すFFT部731L,731Rと、図4に示すFFT部741L,741Rとを共通のものとして、一方を省略しても構わない。
(低域成分ステレオ感強調処理部の別例)
また、図4に示す低域成分ステレオ感強調処理部74の代わりに、図5に示す低域成分ステレオ感強調処理部74aを用いても構わない。図5は、低域成分ステレオ感強調部の構成の別例について示すブロック図である。
図5に示すように、低域成分ステレオ感強調処理部74aは、入力されるLchの低域成分を音源情報に基づいた時間だけ遅延させて出力する遅延部744Lと、入力されるRchの低域成分を音源情報に基づいた時間だけ遅延させて出力する遅延部744Rと、入力されるLchの低域成分から遅延部744Rより出力されるRchの低域成分を減算する合成部745Lと、入力されるRchの低域成分から遅延部744Lより出力されるLchの低域成分を減算する合成部745Rと、を備える。
例えば、マイク5Rよりもマイク5Lに近い音源が発する音は、マイク5Lで集音された後、所定の時間が経過してからマイク5Rで集音される。本例の構成では、遅延部744Lがこの所定の時間を音源情報から求めるとともに、合成部745Rが、Rchの低域成分から遅延部744Lによって所定の時間だけ遅延させたLchの低域成分を減算する。これにより、Rchの低域成分から上記音源が発した音が相殺され、音源が発する音がLchの低域成分で相対的に大きいものとなる。そのため、ステレオ感を強調することが可能となる。なお、音源がマイク5Lよりもマイク5Rに近い場合も同様であり、音源が発する音がRchの低域成分で相対的に大きくなる。
このような構成としても、低域成分のステレオ感を強調することが可能となる。また、上述のように略4kHz以下の低域成分では位相差(時間差)が音源方向の知覚に強く寄与するため、本例のように位相差(時間差)を利用することで、効果的なステレオ感強調処理を行うことが可能となる。また、低域成分ステレオ感強調部74aを簡易な構成とすることが可能となる。
なお、上述の例では遅延部744L,744Rが遅延させる時間を音源情報に基づいたものとしたが、音源情報によらない一定の時間としても構わない。このように構成しても、ステレオ感を強調することは可能である。
[高域成分ステレオ感強調部]
高域成分ステレオ感強調部75について、図6を参照して説明する。図6は、高域成分ステレオ感強調部の構成例について示すブロック図である。
図6に示すように、高域成分ステレオ感強調部75は、入力されるLchの高域成分をFFTして出力するFFT部751Lと、入力されるRchの高域成分をFFTして出力するFFT部751Rと、FFT部751L,751Rから出力されるそれぞれの信号のレベル比を所定の周波数の帯域([1]〜[m])毎に制御して出力するm個のレベル比制御部7521〜752mと、レベル比制御部7521〜752mのそれぞれから出力されるLchの信号をIFFTしてLchの高域成分として出力するIFFT部753Lと、レベル比制御部7521〜752mのそれぞれから出力されるRchの信号をIFFTしてRchの高域成分として出力するIFFT部753Rと、を備える。
FFT部751L,751Rは、入力されるLch及びRchの高域成分をそれぞれFFTし、時間軸の信号から周波数軸の信号へとそれぞれ変換する。レベル比制御部7521〜752mは、音源情報生成部73から出力される音源情報に基づいて、FFT部751L,751Rから出力されるLch及びRchの高域成分の周波数軸の信号のレベルの比をそれぞれの帯域毎に制御する。
レベル比制御部7521〜752mは、例えば図7に示す設定レベル比となるように、それぞれの信号のレベル比を制御する。具体的には、音源情報に基づいて音源が発する音の周波数を確認し、当該周波数の帯域におけるLch及びRchの信号のレベル比を制御する。レベル比制御部7521〜752mが制御するレベル比の大きさは、図7に示すように音源方向に応じたものである。なお、図7に示す音源方向の角度は、図9に示した角度と同様に表現されるものである。例えば、図7中の左60°とは、図9のL60°に相当する方向を示すものである。また例えば、図7中の右60°とは、図9の直線LFから角度が負となる(マイクMRに近づく)方に60°傾いた方向に相当する方向を示すものである。
具体的に例えば、音源情報が、音源方向が左30°であり当該音源が発する音の基本周波数が500Hzであることを示すものである場合、レベル比制御部7521〜752mは、500Hzの整数倍(即ち倍音、例えば4000Hz、4500Hzなど)の帯域におけるLch及びRchのレベル比を制御する。図7に示す表を適用する場合であれば、該当する帯域のLchの信号のレベルがRchの信号のレベルの4倍となるように、それぞれの信号のレベルを制御する。
そして、IFFT部753L,753Rが、レベル比制御部7521〜752mから出力されるLch及びRchのそれぞれの周波数軸の信号をIFFTして、時間軸の信号に変換する。これにより、ステレオ感を強調したLch及びRchの高域成分を得る。
このように構成すると、空間サンプリング定理を満たさないようにマイク5L,5Rを配置したとしても、遅延合成を行うことなくステレオ感強調処理を行うことが可能となるため、図8(b)に示すような折り返しが生じることを抑制することが可能となる。また、上述のように略4kHz以上の高域成分ではレベル差(レベル比)が音源方向の知覚に強く寄与するため、本例のようにレベル比を利用することで、効果的なステレオ感強調処理を行うことが可能となる。
また、上記のように帯域毎にレベル比を制御することによって、音源が複数存在する場合であっても、個々の音源が発する音毎にレベルを制御することが可能となる。
なお、複数の音源が存在する場合において、マイク5Lに近い音源とマイク5Rに近い音源とが同時に存在することがあり、さらにこれらの音源が発する音の基本周波数の倍音となる帯域が重なる(公倍数となる)場合が生じ得る。このような場合、重なる帯域においてはLch及びRchのレベル比が1:1になるように設定しても構わないし、それぞれの音源が発する音の平均レベルに応じたレベル比となるように設定しても構わない。
以上のように、ステレオ感強調処理部70を、低域成分と高域成分とに対して別々にステレオ感強調処理を施すように構成することによって、周波数の全帯域においてステレオ感強調処理の効果が得られる音響信号を生成することが可能となる。また、マイク5L,5Rの配置などによらず、どのように集音して得られた音響信号に対しても、ステレオ感強調処理を施すことが可能となる。そのため、撮像装置1の集音に関する部分の構造(集音装置の構造)の自由度を向上させることが可能となる。
なお、上述したステレオ感強調処理部70は、Lch及びRchの2つのチャンネルの音響信号に対してステレオ感強調処理を施すものであるが、3つ以上の多チャンネルの音響信号に対してステレオ感強調処理を施すものとしても構わない。
また、図2に示すLPF71L,71R及びHPF72L,72Rに代えて、Lch及びRchの音響信号をそれぞれFFTして時間軸の信号から周波数軸の信号にそれぞれ変換するFFT部を備え、図3の音源情報生成部73のFFT部731L,731R、図4の低域成分ステレオ感強調部74のFFT部741L,741R及び図6の高域成分ステレオ感強調部75のFFT部751L,751Rを備えないこととしても構わない。同様に、図4の低域成分ステレオ感強調部74のIFFT部743L,743R及び図6の高域成分ステレオ感強調部75のIFFT部753L,753Rを備えず、図2の合成部76L,76Rに代えて、低域成分ステレオ感強調部74及び高域成分ステレオ感強調部75から出力されるLch及びRchの周波数軸の信号をそれぞれIFFTし時間軸の信号に変換してLch及びRchの音響信号をそれぞれ生成するIFFT部を備えることとしても構わない。このような構成にすると、音響信号の全体に対してまとめてFFTやIFFTをすることが可能となる。そのため、低域成分及び高域成分に対して個別にFFTやIFFTをする図2〜図4及び図6の構成と比較して、構成及び処理の簡略化を図ることが可能となる。
<<その他変形例>>
ステレオ感強調処理を集音時に行い処理後の音響信号を記録する撮像装置1(集音装置)に本発明を適用する場合について主に説明したが、本発明は、記録した音響信号の再生時に上述したステレオ感強調処理を行う再生装置に適用することも可能である。ただし、上述した撮像装置1と同様に、記録されている音響信号が複数の無指向性マイクで集音されたものであると、好ましい。
また、本発明の実施形態における撮像装置1について、音響処理部7の動作を、マイコンなどの制御装置が行うこととしても構わない。さらに、このような制御装置によって実現される機能の全部または一部をプログラムとして記述し、当該プログラムをプログラム実行装置(例えばコンピュータ)上で実行することによって、その機能の全部または一部を実現するようにしても構わない。
また、上述した場合に限らず、図1の音響処理部7や図2のステレオ感強調処理部70は、ハードウェア、あるいは、ハードウェア及びソフトウェアの組み合わせによって実現可能である。また、ソフトウェアを用いて音響処理部7やステレオ感強調処理部70を構成する場合、ソフトウェアによって実現される部位についてのブロック図は、その部位の機能ブロック図を表すこととする。
以上、本発明の実施形態についてそれぞれ説明したが、本発明の範囲はこれに限定されるものではなく、発明の主旨を逸脱しない範囲で種々の変更を加えて実行することができる。
本発明は、入力される音響信号に所定の処理を施して出力する音響処理装置や、当該音響処理装置を備えた撮像装置やICレコーダに代表される集音装置に関する。
7 音響処理部
70 ステレオ感強調処理部
71L,71R LPF
72L,72R HPF
73 音源情報生成部
731L,731R FFT部
7321〜732n 位相差算出部
733 音源情報算出部
74,74a 低域成分ステレオ感強調処理部
741L,741R FFT部
742L,742R 帯域別レベル制御部
743L,743R IFFT部
744L,744R 遅延部
745L,745R 合成部
75 高域成分ステレオ感強調処理部
751L,751R FFT部
7521〜752m レベル比制御部
753L,753R IFFT部
76L,76R 合成部

Claims (2)

  1. 集音して得られる複数のチャンネルの音響信号に対してステレオ感強調処理を施して出力する音響処理装置において、
    前記音響信号の所定の周波数以下の低域成分に対して低域成分用ステレオ感強調処理を施すとともに、所定の周波数以上の高域成分に対して高域成分用ステレオ感強調処理を施すステレオ感強調処理部と、
    前記低域成分に基づいて、前記音響信号に含まれる音を発した音源の状態を示す
    音源方向の角度、及び、音源が発する音の周波数を音源情報として生成する音源情報生成部とを備え、
    前記低域成分用ステレオ感強調処理及び前記高域成分用ステレオ感強調処理が、前記音源情報に基づいた処理であることを特徴とする音響処理装置。
  2. 前記低域成分が、前記音響信号の略4kHz以下の成分であるとともに、前記高域成分が前記音響信号の略4kHz以上の成分であり、
    前記低域成分用ステレオ感強調処理は、前記音源情報に基づいた処理であり、複数チャンネルの前記低域成分の位相差を用いた制御を行うものであり、
    前記高域成分用ステレオ感強調処理は、前記音源情報に基づいた処理であり、複数チャンネルの前記高域成分のレベル比を用いた制御を行うものであることを特徴とする請求項1に記載の音響処理装置。

JP2009122658A 2009-05-21 2009-05-21 音響処理装置及び集音装置 Active JP5908199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009122658A JP5908199B2 (ja) 2009-05-21 2009-05-21 音響処理装置及び集音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009122658A JP5908199B2 (ja) 2009-05-21 2009-05-21 音響処理装置及び集音装置

Publications (2)

Publication Number Publication Date
JP2010273062A JP2010273062A (ja) 2010-12-02
JP5908199B2 true JP5908199B2 (ja) 2016-04-26

Family

ID=43420751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009122658A Active JP5908199B2 (ja) 2009-05-21 2009-05-21 音響処理装置及び集音装置

Country Status (1)

Country Link
JP (1) JP5908199B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2516056B (en) 2013-07-09 2021-06-30 Nokia Technologies Oy Audio processing apparatus
JP6931296B2 (ja) * 2017-06-05 2021-09-01 キヤノン株式会社 音声処理装置及びその制御方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3663461B2 (ja) * 1997-03-13 2005-06-22 スリーエス テック カンパニー リミテッド 周波数選択的空間感向上システム
JP4940671B2 (ja) * 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
JP4901542B2 (ja) * 2007-03-20 2012-03-21 三洋電機株式会社 音声信号生成装置及び方法

Also Published As

Publication number Publication date
JP2010273062A (ja) 2010-12-02

Similar Documents

Publication Publication Date Title
JP5801026B2 (ja) 画像音響処理装置及び撮像装置
US8428275B2 (en) Wind noise reduction device
US9622012B2 (en) Audio signal processing apparatus, movie capturing apparatus, and control method for the same
US20080219470A1 (en) Signal processing apparatus, signal processing method, and program recording medium
US20080212794A1 (en) Audio processing apparatus
JP5056157B2 (ja) ノイズ低減回路
WO2014010280A1 (ja) 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
JP2008263498A (ja) 風雑音低減装置、音響信号録音装置及び撮像装置
JP2008245254A (ja) 音声処理装置
JP5908199B2 (ja) 音響処理装置及び集音装置
US10535363B2 (en) Audio processing apparatus and control method thereof
JP5349062B2 (ja) 音響処理装置及びそれを備えた電子機器並びに音響処理方法
JP5063489B2 (ja) 判定装置及びそれを備えた電子機器並びに判定方法
JP4952368B2 (ja) 収音装置
JP6985821B2 (ja) 音声処理装置及びその制御方法
JP6929137B2 (ja) 音声処理装置及びその制御方法
JP5171369B2 (ja) 集音環境判定装置及びそれを備えた電子機器並びに集音環境判定方法
JP5162858B2 (ja) 音声記録装置および音声記録方法と、プログラム
JP5683820B2 (ja) 撮像装置
JP2009005157A (ja) 音声信号補正装置
JP2011035708A (ja) 音響信号処理装置、及び撮像装置
JP6886352B2 (ja) 音声処理装置及びその制御方法
JP6931296B2 (ja) 音声処理装置及びその制御方法
JP5317936B2 (ja) 音声信号処理装置
JP6877246B2 (ja) 音声処理装置及びその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120420

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20130404

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151112

R155 Notification before disposition of declining of application

Free format text: JAPANESE INTERMEDIATE CODE: R155

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160323

R150 Certificate of patent or registration of utility model

Ref document number: 5908199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250