JP2017046322A - 信号処理装置及びその制御方法 - Google Patents

信号処理装置及びその制御方法 Download PDF

Info

Publication number
JP2017046322A
JP2017046322A JP2015169731A JP2015169731A JP2017046322A JP 2017046322 A JP2017046322 A JP 2017046322A JP 2015169731 A JP2015169731 A JP 2015169731A JP 2015169731 A JP2015169731 A JP 2015169731A JP 2017046322 A JP2017046322 A JP 2017046322A
Authority
JP
Japan
Prior art keywords
directivity
sound
directional
signal processing
directions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015169731A
Other languages
English (en)
Other versions
JP2017046322A5 (ja
JP6613078B2 (ja
Inventor
典朗 多和田
Noriaki Tawada
典朗 多和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015169731A priority Critical patent/JP6613078B2/ja
Priority to US15/237,707 priority patent/US9967660B2/en
Publication of JP2017046322A publication Critical patent/JP2017046322A/ja
Publication of JP2017046322A5 publication Critical patent/JP2017046322A5/ja
Application granted granted Critical
Publication of JP6613078B2 publication Critical patent/JP6613078B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】音源の方向感の明瞭化、及び、各方向の音量バランスの均一化に有利な技術を提供する。【解決手段】信号処理装置は、複数の収音部で収音された音響信号から指向方向ごとの方向音を取得する取得手段と、取得手段により取得される方向音の周波数に応じて、取得手段により取得される方向音に対応する指向方向の数である指向方向数を制御する制御手段とを有する。【選択図】図1

Description

本発明は、音響信号処理技術に関する。
複数のマイクロホン素子(マイクロホンアレイ)で録音した複数チャネルの音響信号から、方向ごとの音(以下「方向音」という。)を取得する技術が知られている。この技術を用いて、全方位の方向音が各方向から再生されているようにユーザに提示できれば、あたかも録音現場にいるかのような高臨場感を実現することができる。
特許文献1には、指向性約45°の8本の指向性マイクロホンを放射状に並べた指向性マイクロホンアレイで指向方向ごとの方向音を取得し、各指向方向に45°間隔で配置した8台の周囲スピーカで再生を行う全方位録音・再生システムが開示されている。
方向音を取得する方法としては、指向性マイクロホンアレイを用いる方法の他に、フィルタリングに基づく方法がある。すなわち、(無指向性)マイクロホンアレイで録音した複数チャネルの音響信号に、所望の指向方向に対応する指向性形成のフィルタ係数を適用して加算することで、任意の指向方向の方向音を生成することができる。特許文献2では、8本のマイクロホンで構成されるマイクロホンアレイで録音した8ch音響信号をフィルタリング(遅延制御)することで、ユーザが要求する指向性マイクロホンと同じになるよう指向性を形成し、ユーザが要求する数の方向音を生成している。
また、全方位の方向音が各方向から再生されているようにユーザに提示する方法としては、ユーザの周囲にスピーカを配置する方法の他に、ヘッドホンで立体音響再生を行う方法がある。すなわち、各方向音に各指向方向に対応する方向の左右耳の頭部伝達関数を適用し、左右それぞれ加算してヘッドホンから再生することで、仮想スピーカをユーザの周囲に配置するような効果が得られる。
特許第2515101号公報 特開平9−55925号公報
一般に方向音の取得において、指向性マイクロホンアレイを用いる場合もフィルタリングで指向性を形成する場合も、形成できる指向性のビームパターンは、低周波数域では鈍くなり、逆に高周波数域では鋭くなる傾向がある。このとき、全方位録音・再生を行うために、所定の指向方向数で均等配置した各指向方向の方向音を取得し、例えばヘッドホンで立体音響再生を行うと、以下のような課題が生じる。
すなわち、低周波数域では各指向性のビームパターンの重なりが増えるため、(点)音源の方向感が不明瞭になり、音量も過多になる傾向がある。また高周波数域では、各指向性のビームパターンの重なりが減り、各ビームパターンを合成した合成ビームパターンにおいて、各指向方向の間で凹みが生じる。このため、音源間(例えば全方位に配置した楽器間)の音量バランスが崩れ、全方位の雰囲気音(拡散音源)も方向ごとに音量感が変わってしまう。
特許文献1,2には、このような周波数ごとの指向性の違いに起因する課題を解決できる手法は開示されていない。
本発明は、音源の方向感の明瞭化、及び、各方向の音量バランスの均一化に有利な技術を提供することを目的とする。
本発明の一側面によれば、複数の収音部で収音された音響信号から指向方向ごとの方向音を取得する取得手段と、前記取得手段により取得される方向音の周波数に応じて、前記取得手段により取得される方向音に対応する前記指向方向の数である指向方向数を制御する制御手段とを有する信号処理装置が提供される。
本発明によれば、音源の方向感の明瞭化、及び、各方向の音量バランスの均一化に有利な技術を提供することができる。
第1実施形態に係る信号処理装置のブロック図。 第1実施形態に係る信号処理を示すフローチャート。 指向方向数が5の場合のビームパターンの例を示す図。 指向方向数が9の場合のビームパターンの例を示す図。 指向方向数が17の場合のビームパターンの例を示す図。 周波数ごとの指向方向数の説明図。 頭部伝達関数の周波数別方向感度の説明図。 第2実施形態に係る信号処理装置のブロック図。 第2実施形態に係る信号処理を示すフローチャート。
以下、図面を参照して本発明の実施形態について詳細に説明する。なお、本発明は以下の実施形態に限定されるものではなく、また、実施形態の中で説明されている特徴の組み合わせの全てが本発明の課題解決のために必須のものであるとは限らない。なお、同一の構成については、同じ符号を付して説明する。
<第1実施形態>
図1は、第1実施形態に係る信号処理装置100の構成を示すブロック図である。信号処理装置100は、各構成要素を統括的に制御するシステム制御部101、各種データを記憶しておく記憶部102、信号の解析処理を行う信号解析処理部103を備える。記憶部102は、複数のマイクロホン素子(収音部)を有するマイクロホンアレイ106で収音された音響信号を保持している。音響信号入力部107は、マイクロホンアレイ106からの音響信号を入力する。
信号処理装置100は、ユーザの周囲に方向音の音像である方向音像を生成する再生系を有する。本実施形態において、再生系は、音響信号出力部104、ヘッドホン105を含む。この再生系は、後述するように、各方向音に各指向方向に対応する方向の頭部伝達関数(HRTF(Head-Related Transfer Function))を適用して、ユーザの両耳近傍で再生することができる。信号解析処理部103は、後述する信号解析処理によって、ヘッドホン105から再生するヘッドホン再生信号を生成する。音響信号出力部104は、ヘッドホン再生信号にD/A変換および増幅を施した信号を、ヘッドホン105に出力する。
以下、本実施形態における信号処理について、図2のフローチャートに沿って説明する。なお、図2のフローチャートに対応するプログラムは例えば記憶部102に保持され、特に別記しない限り信号解析処理部103によって実行されるものとする。
S201では、記憶部102が保持している、M個のマイクロホン素子(Mチャネルマイクロホンアレイ)で録音したMチャネル音響信号を取得し、チャネルごとにフーリエ変換することで周波数領域のデータ(フーリエ係数)であるz(f)を得る。ここで、各周波数のz(f)はM個の要素を持つベクトルである。
S202〜S216は周波数ごとの処理であり、周波数ループの中で行う。
S202では、現在の周波数ループの周波数における指向方向数D(f)をD(f)=1のように初期化する。S203では、指向方向数D(f)を用いて各指向性の指向方向θd(f)[d=1〜D(f)]を算出する。ここでは複数の指向性で水平全方位をカバーするため、音響信号を録音したマイクロホンアレイの座標系における正面0°を基準方向として、水平の指向方向(方位角)を、θd(f)=(d-1)×360°/D(f)のように算出する。なお、180°を超える指向方向についてはθd(f)←θd(f)-360°のように表現するものとする。
S204〜S205は、S203で指向方向を算出した指向性ごとの処理であり、指向性ループの中で行う。
S204では、現在の指向性ループで対象としている指向性を形成するための指向性形成フィルタのフィルタ係数を取得する。ここでは、記憶部102があらかじめ保持している指向性形成フィルタのフィルタ係数から、指向方向θd(f)に対応するwd(f)を取得する。ここで、フィルタ係数(ベクトル)wd(f)は周波数領域のデータ(フーリエ係数)であり、M個の要素で構成される。なお、マイクロホンアレイの構成が異なればフィルタ係数も異なるため、録音に用いたマイクロホンアレイの種別IDを音響信号の付加情報として録音時に記録しておき、そのマイクロホンアレイに対応するフィルタ係数を本ステップで用いるようにしてもよい。
指向性形成フィルタのフィルタ係数の算出には、各方向(方位角θ)の音源と各マイクロホン素子間の伝達関数であるアレイ・マニフォールド・ベクトルa(f,θ)が一般に用いられる。ここで、a(f,θ)は周波数領域のデータ(フーリエ係数)であり、M個の要素で構成される。指向方向θd(f)に指向性のメインローブを向ける方法として、例えば遅延和法ならθd(f)方向のアレイ・マニフォールド・ベクトルad(f)を用いて、wd(f)=ad(f)/(ad H(f)ad(f))のようにフィルタ係数が得られる。
S205では、S204で取得した指向性形成フィルタのフィルタ係数wd(f)と、アレイ・マニフォールド・ベクトルa(f,θ)を用いて指向性のビームパターンを算出する。ビームパターンの方位角θ方向の値bd(f,θ)は、式(1)で得られる。
a(f,θ)のθを、例えば−180°から180°まで1°刻みで変えながらbd(f,θ)を計算することで、水平全方位のビームパターンが得られる。なお、音響信号の録音に用いたマイクロホンアレイの構造によっては、自由空間や剛球等の理論式により、任意の解像度でアレイ・マニフォールド・ベクトルa(f,θ)を算出できる。なお、円状等間隔マイクロホンアレイなどマイクロホン素子が等方的に配置されている場合は、指向方向が正面0°の場合のビームパターンb1(f,θ)を回転させることで、他の指向性のビームパターンbd(f,θ)[d=2〜]を得ることもできる。
S206では、S205で算出した各指向性のビームパターンbd(f,θ)[d=1〜D(f)]を合成することで、式(2)のように合成ビームパターンbsum(f,θ)を算出する。
ここで、現在の周波数で形成される指向性に対して指向方向数D(f)が不足していると、図3[D(f)=5の例]のように、指向方向301〜305にそれぞれメインローブを向けた各指向性のビームパターン311〜315の重なりが減る。この結果、各ビームパターンを合成した合成ビームパターン316において、各指向方向301〜305の間で凹みが生じるため、音源間の音量バランスが崩れ、全方位の雰囲気音も方向ごとに音量感が変わってしまう。
そこでS207では、S206で算出した合成ビームパターンbsum(f,θ)の凹み量の目安として標準偏差σbsum(f)を算出し、その値が閾値以下であるか否かを判定する。この閾値をδ1とする。算出された標準偏差σbsum(f)が閾値δ1以下でなければ、指向方向数D(f)が不足しているとして処理はS208へ進み、δ1以下であれば、処理はS209へ進む。なお、標準偏差σbsum(f)は例えばdB表現のbsum(f,θ)から算出するものとする。なお、bsum(f,θ)の最大値と最小値の差(図3の例では双方向矢印317)を凹み量の目安とし、その値を閾値δ2と比較するようにしてもよい。このとき、bsum(f,θ)は各指向方向で最大値をとり、隣接する指向方向の真ん中で最小値をとる。
S208へ進んだ場合は、指向方向数D(f)をD(f)←D(f)+1のようにインクリメントし、S203へ戻る。
S209へ進んだ場合は、指向方向数が適切な範囲に入ったとして、このときの指向方向数D(f)を現周波数の指向方向数の下限値である下限指向方向数Dmin(f)と決定する。
現在の周波数で形成される指向性に対して指向方向数D(f)が適切となると、図4[D(f)=9の例]のように、合成ビームパターン334の凹みが消え略円形となる。
次に、現在の周波数で形成される指向性に対して指向方向数D(f)が過剰となると、図5[D(f)=17の例]のように、各指向性のビームパターンの重なりが増えるため、音源の方向感が不明瞭になり、音量も過多になる傾向がある。ただし、指向方向数が過剰な場合については、指向方向数が不足の場合のような合成ビームパターンの乱れは生じず、図5の合成ビームパターン366のように略円形となるため、別の評価法を考える必要がある。ただし、ビームパターンの形状(面積)は描画における表示範囲の設定(図3の場合−30dBから+10dB)に依存するため、評価指標として各ビームパターンのオーバーラップ部分の面積比などは適さない。
そこで、所定の方向における各ビームパターンの値の比を評価指標に用いることを考える。式(3)のように、各方向でビームパターンの値が最大となる指向性のインデックスをdmax(f,θ)とする。
そして、各方向で最大のビームパターンの値をbdmax(f,θ)とすると、各方向におけるビームパターンの最大値とそれ以外の値との比r(f,θ)は、例えば式(4)のように表される。
ここで、図4のように指向方向数が適切な場合は、例えば指向方向321に音源があるとすると、この指向方向θ1(f)=0°におけるr(f,θ1)は、例えば8dBといった正の値をとる。すなわち、指向方向321にメインローブを向けたビームパターン331が捉える音のエネルギー341が、指向方向322〜323にメインローブを向けたビームパターン332〜333が捉える音のエネルギー342〜343の和よりも大きい。つまり、ある方向に音源がある場合に、その方向にメインローブを向けた指向性が捉える音のエネルギーが、他の方向にメインローブを向けた指向性が捉える音のエネルギーの和より大きいため、適切な状態であるといえる。
一方、図5のように指向方向数が過剰な場合は、例えば指向方向351に音源があるとすると、この指向方向θ1(f)=0°におけるr(f,θ1)は、例えば0dB未満の小さな値をとる。すなわち、指向方向351にメインローブを向けたビームパターン361が捉える音のエネルギー371より、指向方向352〜355にメインローブを向けたビームパターン362〜365が捉える音のエネルギー372〜375の和の方が大きい。つまり、ある方向に音源がある場合に、その方向にメインローブを向けた指向性が捉える音のエネルギーより、他の方向にメインローブを向けた指向性が捉えるエネルギーの和の方が大きいため、不適切な状態であるといえる。
以上を踏まえ、S210では、指向方向θd(f)におけるビームパターンの最大値とそれ以外の値との比r(f,θd(f))を算出し、その値が閾値以上であるか否かを判定する。ここではその閾値をδ3とする。算出された比の値が閾値δ3(例えば0dB)以上であれば、指向方向数D(f)はまだ適切な範囲内であるとして処理はS208へ進み、閾値δ3未満であれば処理はS211へ進む。なお、指向方向θd(f)以外の方向におけるr(f,θ)を閾値δ4と比較するようにしてもよいが、r(f,θ)は指向方向θd(f)で最大となるため、本実施形態では、例えば、δ4<δ3とする。
なお、各指向性のビームパターンの重なりが増えると、図5のように合成ビームパターン366の値が大きくなるため、音量も過多になる傾向がある。そこで、合成ビームパターンの最大値bsum(f,θd(f))と、各ビームパターンの最大値bd(f,θd(f))[正規化されていれば0dB]との差(図5の例では双方向矢印367)を、閾値δ5と比較するようにしてもよい。すなわち、bsum(f,θd(f))-bd(f,θd(f))がδ5以下であれば、指向方向数D(f)はまだ適切な範囲内であるとしてS208へ、δ5より大きければS211へ進むようにしてもよい。
S208へ進んだ場合は、指向方向数D(f)をD(f)←D(f)+1のようにインクリメントし、S203へ戻る。ただし、指向方向数の下限値Dmin(f)は既に決定しているため、以降はS207とS209をスキップするものとする。
S211へ進んだ場合は、指向方向数が適切な範囲から外れたとして、このときの指向方向数D(f)から1を引いたD(f)-1を現在の周波数の指向方向数の上限値である上限指向方向数Dmax(f)と決定する。
一般に、低周波数域では形成できる指向性のビームパターンが鈍くなり、逆に高周波数域では鋭くなる傾向がある。このため、上記S207、210のように周波数ごとにビームパターンを評価すると、図6(a)に模式的に示すように、低周波数域より高周波数域で下限指向方向数Dmin(f)および上限指向方向数Dmax(f)が大きくなる。そこで、周波数ごとの指向方向数を例えば次式を用いてD(f)=Dmean(f)のように決定する。
このようにすれば、低周波数域より高周波数域の指向方向数が多くなり、全ての周波数で指向方向数が適切な範囲内となるため、音源の方向感が明瞭となり、各方向の音量バランスも均一となる。
ここでさらに、人の音源方向に対する周波数ごとの感度特性を考慮して、各周波数の指向方向数D(f)をDmin(f)〜Dmax(f)の範囲内で適切に決定することを考える。
図7(a)は、HRTFから算出した周波数ごとの両耳間レベル差(ILD)について、音源方向が0°から180°の場合まで1°ごとに、計181本のグラフで描画したものである。なお、音源方向が0°から−180°の場合のグラフは、概ね図7(a)を符号反転(上下反転)したものとなる。また、図7(a)のグラフの周波数ごとの標準偏差σILD(f)を図7(b)に示している。
ここで、人の音源方向に対する感度(方向感度)は、HRTFの両耳間レベル差の方向に対する変化量に対応する。例えば、σILD(f)が大きい周波数、すなわち方向によるILDの変化が大きい周波数は、人の音源方向に対する感度(方向感度)が高い周波数である。そこで、点線501のようにσILD(f)が大きい周波数では、人が方向ごとの差が分かりやすいと考えられるため、指向方向数をDmax(f)寄りの値とする。一方、図7(b)の点線502のようにσILD(f)が小さい周波数では、人が方向ごとの差が分かりにくいと考えられるため、指向方向数をDmin(f)寄りの値とする。
具体的には、例えば図7(b)のようにσILD(f)が概ね0〜15dBの値をとる場合は、15で割ることで正規化し、0〜1の値をとるHRTFの周波数別の方向感度s(f)と定義する。そして、例えば式(6)を用いることで、人の周波数別の方向感度を考慮した指向方向数を、D(f)=Dsens(f)のようにDmin(f)〜Dmax(f)の範囲内で決定することができる。
なお、音源方向0°〜180°のHRTFからs(f)を算出しているため、これは全方位に対する平均的な方向感度であると解釈できる。これは特に、後述するヘッドホン再生信号の生成において、ユーザの頭部運動に応じたHRTFの切り替え(ヘッドトラッキング処理)を行う場合は、全方位のHRTFが使用され得るため妥当であるといえる。
なお、人が音を知覚しにくい例えば15kHz以上においては、HRTFから算出したs(f)に適当な減衰カーブを適用することで、Dsens(f)を小さくするようにしてもよい。図6(a)にDsens(f)の例を曲線で模式的に示す。なお、指向方向数に対応する図6(a)の4本のグラフは、整数値をとるため実際には階段状のグラフとなる。
以上を踏まえ、S212では、Dmin(f)〜Dmax(f)の範囲内で各周波数の指向方向数をD(f)=Dmean(f)[式(5)]やD(f)=Dsens(f)[式(6)]のように決定する。なお、式(6)のs(f)は、あらかじめHRTFから算出して記憶部102が保持しているものを取得して用いればよい。
S213では、S212で決定した指向方向数D(f)を用いて、S203と同様に各指向性の指向方向θd(f)=(d-1)×360°/D(f)[d=1〜D(f)]を算出する。なお、180°を超える指向方向についてはθd(f)←θd(f)-360°のように表現するものとする。
S214〜S216は、S213で指向方向を算出した指向性ごとの処理であり、指向性ループの中で行う。
S214では、S204と同様に、現在の指向性ループで対象としている指向性を形成するためのフィルタ係数を取得する。すなわち、記憶部102があらかじめ保持している指向性形成フィルタのフィルタ係数から、指向方向θd(f)に対応するwd(f)を取得する。
S215では、S201で取得したMチャネル音響信号のフーリエ係数z(f)に、S214で取得した指向性形成フィルタのフィルタ係数wd(f)を適用する。これにより、現在の指向性ループに対応する指向方向θd(f)の方向音Yd(f)を式(7)のように生成する。ここで、Yd(f)は周波数領域のデータ(フーリエ係数)である。
S216では、S215で取得した指向方向θd(f)の方向音のフーリエ係数Yd(f)に、指向方向θd(f)と同じ方向の左右耳のHRTF[HL(f,θd(f)),HR(f,θd(f))]を適用する。そして、式(8)のように左右それぞれのヘッドホン再生信号XL(f),XR(f)に加算して行く。ここで、XL(f),XR(f)は周波数領域のデータ(フーリエ係数)である。なお、HRTFはあらかじめ記憶部102が保持しているものを取得して用いればよい。
指向性ループの中で本ステップの処理を行うことで、各指向方向の方向音を再生する仮想スピーカをユーザの周囲に順次配置していくことになる。さらに周波数ループの中で本ステップの処理を行うことで、S212で決定した指向方向数D(f)に対応して、仮想スピーカの数も周波数ごとに制御することになる。すなわち、低周波数域より高周波数域の仮想スピーカ数が多くなり、全ての周波数で仮想スピーカ数が適切な範囲内となるため、音源の方向感が明瞭となり、各方向の音量バランスも均一となる。
なお、周波数ごとに指向方向数D(f)を適切に制御することで、各周波数の合成ビームパターンのレベルは概ね揃うようになるが、より厳密に、全周波数で合成ビームパターンのレベルを一定値にするような周波数ごとのゲイン調整を行ってもよい。
なお、ユーザの頭部運動を検出可能なセンサを、例えばヘッドホン105が備えていてもよい。そして、例えば音響信号の所定の時間フレーム長(音響フレーム)ごとに、頭部運動に応じて使用するHRTFを切り替えて行くヘッドトラッキング処理を行ってもよい。
S217では、S216で生成したヘッドホン再生信号のフーリエ係数XL(f),XR(f)をそれぞれ逆フーリエ変換することで、時間波形であるヘッドホン再生信号xL(t),xR(t)を取得する。
S218では、音響信号出力部104が、S217で取得したヘッドホン再生信号xL(t),xR(t)にDA変換および増幅を施し、ヘッドホン105から再生する。
なお、例えばS202〜S213の周波数ごとの各指向方向の決定までは、あらかじめ処理して結果を記憶部102に保持しておいてもよい。そして、S201の音響信号の取得に合わせて、例えば音響フレームごとにS214〜S218の音響レンダリング・再生処理のみリアルタイムに行うようにしてもよい。
なお、例えばシステム制御部101と相互に結ばれた不図示のGUI部を介して、指向方向数D(f)を例えば低域・中域・高域ごとにユーザが制御できるようにしてもよい。
なお、第1実施形態では、S215で指向方向θd(f)の方向音のみを生成し、S216で指向方向θd(f)と同じ方向に、生成した方向音と同じ数の仮想スピーカを配置していた。しかし、S215で指向方向θd(f)の方向音だけでなく、例えば1°間隔で水平全方位にメインローブを向けた360°の方向音を生成しておいてもよい。そして、S216でそのうち指向方向θd(f)の方向音のみを選択的に用いて、指向方向θd(f)と同じ方向のみに仮想スピーカを配置するようにしてもよい。
<第2実施形態>
上記した第1実施形態では、(無指向性)マイクロホンアレイでの指向性形成フィルタリングによる方向音生成と、ヘッドホンでの立体音響再生の組み合わせで、周波数ごとに指向方向数および仮想スピーカ数を制御した。第2実施形態では、指向性マイクロホンアレイによる方向音取得と、周囲スピーカ再生の組み合わせにおいて、周波数ごとに指向方向数および使用スピーカ数を制御する。
図8は、本実施形態に係る信号処理装置600の構成を示すブロック図である。信号処理装置600は、各構成要素を統括的に制御するシステム制御部101、各種データを記憶しておく記憶部102、信号の解析処理を行う信号解析処理部103を備える。また、信号処理装置600は、ユーザの周囲に方向音の音像である方向音像を生成する生成手段としての再生系を有する。本実施形態において、再生系は例えば、音響信号出力部604、ユーザの周囲(水平周囲)に配置された複数チャネル(例えば12チャネル)を構成する複数のスピーカ611〜622を含む。記憶部102は、スピーカ611〜622の配置数・方向に合わせて12本の指向性マイクロホンを放射状に並べた、12チャネルの指向性マイクロホンアレイ605で音響信号入力部107を介して録音された12チャネル音響信号を保持している。なお、本発明は、特定のスピーカの数に限定されるものではない。なお、録音に用いた指向性マイクロホンの配置数・方向に合わせて、周囲スピーカを配置するようにしてもよい。
信号解析処理部103は、後述する信号解析処理によって、スピーカ611〜622から再生するスピーカ再生信号を生成する。音響信号出力部104は、生成されたスピーカ再生信号にDA変換および増幅を施し、スピーカ611〜622から再生する。
以下、本実施形態の信号解析処理について、図9のフローチャートに沿って説明する。なお、図9のフローチャートに対応するプログラムは例えば記憶部102に保持され、特に別記しない限り信号解析処理部103によって実行されるものとする。
S701では、記憶部102があらかじめ保持しているスピーカ611〜622の配置と再生可能帯域を取得し、そこから各周波数で全方位再生に使用可能なスピーカ数の組み合わせを決定して、後のステップで選択可能な指向方向数Dsp(f)とする。なお、周囲スピーカの配置や再生可能帯域は、ユーザの位置であるリスニングポイントに備えたマイクロホンで音響測定を行い算出してもよい。
選択可能な指向方向数Dsp(f)は、複数のスピーカのそれぞれの再生可能帯域に応じて決定されうる。図8において、大型スピーカ611,614,617,620は低域から高域まで、中型スピーカ613,615,619,621は中域から高域まで、小型スピーカ612,616,618,622は高域のみが再生可能とする。これより、均等配置が可能で全方位再生に使用可能な周波数ごとのスピーカ数の組み合わせ、すなわち後のステップで選択可能な指向方向数Dsp(f)は、以下のようになる。
Dsp(f)={1,2,4}[f<fM]、
Dsp(f)={1,2,3,4,6}[fM≦f<fH]、
Dsp(f)={1,2,3,4,6,12}[fH≦f]
ここで、fMは低域と中域の境界周波数、fHは中域と高域の境界周波数とする。
S702の処理は、第1実施形態のS201と同様であるため説明を省略する。
S703〜S715は周波数ごとの処理であり、周波数ループの中で行う。
S703〜S704の処理は、第1実施形態のS202〜S203と同じであるため説明を省略する。
S705は、S704で指向方向を算出した指向性ごとの処理であり、指向性ループの中で行う。
S705では、現在の指向性ループで対象としている指向性のビームパターンを取得する。すなわち、記憶部102があらかじめ保持している、指向性マイクロホンを指向方向θd(f)に向けた場合のビームパターンbd(f,θ)を取得する。なお、指向性マイクロホンのビームパターンは測定やシミュレーション等により得られる。なお、指向性マイクロホンの種別によってビームパターンは異なる。そのため、録音に用いた指向性マイクロホンの種別IDを音響信号の付加情報として録音時に記録しておき、その指向性マイクロホンに対応するビームパターンを本ステップで取得するようにしてもよい。なお、指向性マイクロホンを正面0°に向けた場合のビームパターンb1(f,θ)を回転させることで、指向性マイクロホンを他の指向方向θd(f)に向けた場合のビームパターンbd(f,θ)[d=2〜]を得ることができる。
S706〜S711の処理は、第1実施形態のS206〜S211と同じであるため説明を省略する。
S712では、第1実施形態のS212と同様に、各周波数の指向方向数をDmean(f)[式(5)]やDsens(f)[式(6)]のように決定する。ここで決定した指向方向数を「所定の指向方向数」という。
S713では、S712で決定した所定の指向方向数との差が小さくなるように(例えば最小となるように)、S701で決定した選択可能な指向方向数Dsp(f)の中から、各周波数の指向方向数D(f)を決定する。例えば所定の指向方向数がDmean(f)の場合、図6(b)の太横線で示すように、D(f)=4[f<fM]、D(f)=6[fM≦f<fD]、D(f)=12[fD≦f]となる。ここで、fDはDmean=(6+12)/2=9となるような周波数である。また、所定の指向方向数がDsens(f)の場合は、指向方向数が同じ値となる周波数は必ずしも連続せず、飛び飛びになり得る。
S714の処理は、第1実施形態のS213と同じであるため説明を省略する。
S715では、S702で取得した音響信号から指向方向θd(f)の方向音を取得して、対応するスピーカ再生信号に割り当てる。本実施形態では音響信号が指向性マイクロホンアレイで録音されており、指向方向θd(f)に対応するチャネルの音響信号がそのまま方向音となる。そのため、それを対応するチャネルのスピーカ再生信号に割り当てればよい。
12チャネル音響信号のフーリエ係数(ベクトル)z(f)について、そのm番目の要素をzm(f)[m=1〜12]とする。また、12チャネルのスピーカ611〜622について、各スピーカ再生信号のフーリエ係数をXs(f)[s=1〜12]とする。ここで、指向方向数D(f)=4で、各指向方向で次のようになる周波数を考える。
θ1(f)=0°,
θ2(f)=90°,
θ3(f)=180°,
θ4(f)=-90°
この場合は、
Xi(f)=zi(f)[i=1,4,7,10]、
Xj(f)=0[j=2,3,5,6,8,9,11,12]
となる。
また、指向方向数D(f)=6で、各指向方向が次のようになる周波数を考える。
θ1(f)=0°,
θ2(f)=60°,
θ3(f)=120°,
θ4(f)=180°,
θ5(f)=-120°,
θ6(f)=-60°
この場合は、
Xi(f)=zi(f)[i=1,3,5,7,9,11]、
Xj(f)=0[j=2,4,6,8,10,12]
となる。
また、指向方向数D(f)=12で、各指向方向が次のようになる周波数を考える。
θ1(f)=0°,
θ2(f)=30°,
θ3(f)=60°,
θ4(f)=90°,
θ5(f)=120°,
θ6(f)=150°,
θ7(f)=180°,
θ8(f)=-150°,
θ9(f)=-120°,
θ10(f)=-90°,
θ11(f)=-60°,
θ12(f)=-30°
この場合は、
Xi(f)=zi(f)[i=1〜12]
となる。
図6(b)の太横線で示すように、D(f)=4[f<fM]、D(f)=6[fM≦f<fD]、D(f)=12[fD≦f]の場合、周波数fM未満の方向音は、4つのスピーカ611,614,617,620から再生される。また、周波数fM以上fD未満の方向音は、6つのスピーカ611,613,615,617,619,621から再生される。また、周波数fD以上の方向音は、全12のスピーカ611〜622から再生される。これは、高域ほど使用するスピーカの数が多くなる、新しいタイプのサラウンド構成である。
S716では、S715で生成したスピーカ再生信号のフーリエ係数Xs(f)をそれぞれ逆フーリエ変換することで、時間波形であるスピーカ再生信号xs(t)[s=1〜12]を取得する。
S717では、音響信号出力部104が、S716で取得したスピーカ再生信号xs(t)にD/A変換および増幅を施し、スピーカ611〜622から再生する。
以上説明した実施形態によれば、周波数ごとに指向方向数を制御することで、音源の方向感が明瞭となり、各方向の音量バランスも均一となる。
なお、上記実施形態において記憶部102があらかじめ保持しているとした各種データは、システム制御部101と相互に結ばれた不図示のデータ入出力部を介して、外部から入力するようにしてもよい。
また、上記第1実施形態と第2実施形態を適宜組み合わせれば、以下のような実施形態が構成可能であり、これらの実施形態も本発明の範囲に含まれる。すなわち、(無指向性)マイクロホンアレイでの指向性形成フィルタリングによる方向音生成と、周囲スピーカ再生の組み合わせにおいて、周波数ごとに指向方向数および使用スピーカ数を制御する実施形態が構成可能である。また、指向性マイクロホンアレイによる方向音取得と、ヘッドホンでの立体音響再生の組み合わせにおいて、周波数ごとに指向方向数および仮想スピーカ数を制御する実施形態が構成可能である。
なお、信号処理装置100が再生(ヘッドホン、スピーカ)の機能に加えて、録音(マイクロホンアレイ)や撮影(カメラ)・表示(ディスプレイ)の機能を備えていてもよい。このとき、撮影・録音系と表示・再生系がそれぞれ遠隔地で同期的に動作すれば、遠隔ライブシステムを実現することができる。
なお、上記実施形態では、水平全方位で音源の方向感が明瞭となり、音量バランスも均一となるようにしていたが、対象とする方向範囲を任意に設定してもよい。例えば、水平方向だけでなく、仰角方向も含めた全方位を対象方向範囲としてもよいし、水平前方半面や、撮影した映像信号の画角範囲などに限定してもよい。この場合、例えば合成ビームパターンの凹み量の目安である標準偏差は、水平全方位ではなく対象方向範囲の合成ビームパターンから算出する。
(他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100:信号処理装置、101:システム制御部、102:記憶部、103:信号解析処理部、104:音響信号出力部、105:ヘッドホン

Claims (16)

  1. 複数の収音部で収音された音響信号から指向方向ごとの方向音を取得する取得手段と、
    前記取得手段により取得される方向音の周波数に応じて、前記取得手段により取得される方向音に対応する前記指向方向の数である指向方向数を制御する制御手段と、
    を有することを特徴とする信号処理装置。
  2. 前記取得手段は、前記音響信号に前記指向方向に対応する指向性形成フィルタを適用することで前記方向音を取得することを特徴とする請求項1に記載の信号処理装置。
  3. 前記複数の収音部は指向性マイクロホンであり、
    前記取得手段は、前記指向方向に対応するチャネルの前記音響信号を前記方向音として取得する
    ことを特徴とする請求項1に記載の信号処理装置。
  4. 前記制御手段は、低周波数域より高周波数域の指向方向数を多くすることを特徴とする請求項1乃至3のいずれか1項に記載の信号処理装置。
  5. 前記制御手段は、各指向方向の方向音を取得する各指向性のビームパターンを合成した合成ビームパターンの凹み量が閾値以下となるように、前記指向方向数の下限値である下限指向方向数を決定することを特徴とする請求項1乃至4のいずれか1項に記載の信号処理装置。
  6. 前記制御手段は、各指向方向の方向音を取得する各指向性のビームパターンの重なりが過多とならないように、前記指向方向数の上限値である上限指向方向数を決定することを特徴とする請求項1乃至5のいずれか1項に記載の信号処理装置。
  7. 前記上限指向方向数は、各指向性のビームパターンの指向方向の値について、最大値とそれ以外との比が閾値以上となるように決定することを特徴とする請求項6に記載の信号処理装置。
  8. ユーザの周囲に前記方向音の音像である方向音像を生成する生成手段を更に有することを特徴とする請求項1乃至7のいずれか1項に記載の信号処理装置。
  9. 前記生成手段は、各方向音に各指向方向に対応する方向の頭部伝達関数を適用して、ユーザの両耳近傍で再生することを特徴とする請求項8に記載の信号処理装置。
  10. 前記生成手段は、ユーザの周囲に配置される複数のスピーカを含むことを特徴とする請求項8に記載の信号処理装置。
  11. 前記制御手段は、頭部伝達関数の周波数別の方向感度に応じて前記指向方向数を決定することを特徴とする請求項8乃至10のいずれか1項に記載の信号処理装置。
  12. 前記方向感度は、前記頭部伝達関数の両耳間レベル差の方向に対する変化量であることを特徴とする請求項11に記載の信号処理装置。
  13. 前記制御手段は、選択可能な指向方向数の中から、所定の指向方向数との差が小さくなるように指向方向数を決定することを特徴とする請求項10に記載の信号処理装置。
  14. 前記選択可能な指向方向数は、前記複数のスピーカのそれぞれの再生可能帯域に応じて決定されることを特徴とする請求項13に記載の信号処理装置。
  15. 複数の収音部で収音された音響信号から指向方向ごとの方向音を取得する際に、取得される方向音の周波数に応じて、前記指向方向の数を制御することを特徴とする信号処理方法。
  16. コンピュータを請求項1乃至14のいずれか1項に記載の信号処理装置が有する各手段として機能させるためのプログラム。
JP2015169731A 2015-08-28 2015-08-28 信号処理装置及びその制御方法 Active JP6613078B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015169731A JP6613078B2 (ja) 2015-08-28 2015-08-28 信号処理装置及びその制御方法
US15/237,707 US9967660B2 (en) 2015-08-28 2016-08-16 Signal processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015169731A JP6613078B2 (ja) 2015-08-28 2015-08-28 信号処理装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2017046322A true JP2017046322A (ja) 2017-03-02
JP2017046322A5 JP2017046322A5 (ja) 2018-10-11
JP6613078B2 JP6613078B2 (ja) 2019-11-27

Family

ID=58104496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015169731A Active JP6613078B2 (ja) 2015-08-28 2015-08-28 信号処理装置及びその制御方法

Country Status (2)

Country Link
US (1) US9967660B2 (ja)
JP (1) JP6613078B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021205601A1 (ja) * 2020-04-09 2021-10-14 三菱電機株式会社 音声信号処理装置及び音声信号処理方法、並びにプログラム及び記録媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10175335B1 (en) * 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
JP6789690B2 (ja) 2016-06-23 2020-11-25 キヤノン株式会社 信号処理装置、信号処理方法、及びプログラム
EP3322200A1 (en) * 2016-11-10 2018-05-16 Nokia Technologies OY Audio rendering in real time
WO2019231630A1 (en) 2018-05-31 2019-12-05 Shure Acquisition Holdings, Inc. Augmented reality microphone pick-up pattern visualization
JP7245034B2 (ja) 2018-11-27 2023-03-23 キヤノン株式会社 信号処理装置、信号処理方法およびプログラム
US11270712B2 (en) 2019-08-28 2022-03-08 Insoundz Ltd. System and method for separation of audio sources that interfere with each other using a microphone array

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2515101B2 (ja) * 1986-06-27 1996-07-10 ヤマハ株式会社 映像および音響空間記録再生方法
JPH0541897A (ja) * 1991-08-07 1993-02-19 Pioneer Electron Corp スピーカ装置およびその指向性制御方法
JPH0955925A (ja) 1995-08-11 1997-02-25 Nippon Telegr & Teleph Corp <Ntt> 画像システム
JP2001166025A (ja) * 1999-12-14 2001-06-22 Matsushita Electric Ind Co Ltd 音源の方向推定方法および収音方法およびその装置
JP2005197896A (ja) * 2004-01-05 2005-07-21 Yamaha Corp スピーカアレイ用のオーディオ信号供給装置
US20090048517A1 (en) 2004-05-25 2009-02-19 Hiroshi Fukukita Ultrasonic diagnostic apparatus
JP5024792B2 (ja) 2007-10-18 2012-09-12 独立行政法人情報通信研究機構 全方位周波数指向性音響装置
US9554203B1 (en) * 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
JP6251054B2 (ja) 2014-01-21 2017-12-20 キヤノン株式会社 音場補正装置及びその制御方法、プログラム
JP5648760B1 (ja) 2014-03-07 2015-01-07 沖電気工業株式会社 収音装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021205601A1 (ja) * 2020-04-09 2021-10-14 三菱電機株式会社 音声信号処理装置及び音声信号処理方法、並びにプログラム及び記録媒体
JPWO2021205601A1 (ja) * 2020-04-09 2021-10-14
JP7199601B2 (ja) 2020-04-09 2023-01-05 三菱電機株式会社 音声信号処理装置及び音声信号処理方法、並びにプログラム及び記録媒体

Also Published As

Publication number Publication date
US20170064444A1 (en) 2017-03-02
JP6613078B2 (ja) 2019-11-27
US9967660B2 (en) 2018-05-08

Similar Documents

Publication Publication Date Title
JP6613078B2 (ja) 信号処理装置及びその制御方法
US10382849B2 (en) Spatial audio processing apparatus
US10645518B2 (en) Distributed audio capture and mixing
US9578439B2 (en) Method, system and article of manufacture for processing spatial audio
JP6789690B2 (ja) 信号処理装置、信号処理方法、及びプログラム
KR101547035B1 (ko) 다중 마이크에 의한 3차원 사운드 포착 및 재생
WO2018008395A1 (ja) 音場形成装置および方法、並びにプログラム
CN109804559A (zh) 空间音频系统中的增益控制
US10555108B2 (en) Filter generation device, method for generating filter, and program
WO2018008396A1 (ja) 音場形成装置および方法、並びにプログラム
GB2545222A (en) An apparatus, method and computer program for rendering a spatial audio output signal
KR20090082977A (ko) 음향 시스템, 음향 재생 장치, 음향 재생 방법, 스피커장착 모니터, 스피커 장착 휴대폰
JP2019047478A (ja) 音響信号処理装置、音響信号処理方法および音響信号処理プログラム
KR20220038478A (ko) 공간 변환 도메인에서 음장 표현을 처리하기 위한 장치, 방법 또는 컴퓨터 프로그램
US20210105571A1 (en) Sound image reproduction device, sound image reproduction method, and sound image reproduction program
JP6147636B2 (ja) 演算処理装置、方法、プログラム及び音響制御装置
JP2019134314A (ja) 信号処理装置、信号処理方法、及びプログラム
CN109688531B (zh) 获取高音质音频变换信息的方法、电子装置及记录介质
JP2020167471A (ja) 情報処理装置、情報処理方法、及びプログラム
WO2021212287A1 (zh) 音频信号处理方法、音频处理装置及录音设备
RU2793625C1 (ru) Устройство, способ или компьютерная программа для обработки представления звукового поля в области пространственного преобразования
KR101089108B1 (ko) 음향 재생 장치
JP2017195581A (ja) 信号処理装置、信号処理方法およびプログラム
JP2015119393A (ja) 音響信号受聴装置
CN116092513A (zh) 声像重现方法、装置、集成芯片及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180827

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191101

R151 Written notification of patent or utility model registration

Ref document number: 6613078

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151