JP2024043430A - 音場臨場感再現装置及び音場臨場感再現方法 - Google Patents

音場臨場感再現装置及び音場臨場感再現方法 Download PDF

Info

Publication number
JP2024043430A
JP2024043430A JP2022148618A JP2022148618A JP2024043430A JP 2024043430 A JP2024043430 A JP 2024043430A JP 2022148618 A JP2022148618 A JP 2022148618A JP 2022148618 A JP2022148618 A JP 2022148618A JP 2024043430 A JP2024043430 A JP 2024043430A
Authority
JP
Japan
Prior art keywords
sound
signal
reproduction
sound field
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022148618A
Other languages
English (en)
Inventor
宏正 大橋
Hiromasa Ohashi
邦昭 大澤
Kuniaki Osawa
古賀 淳一
Junichi Koga
仁 岩泉
Hitoshi Iwaizumi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2022148618A priority Critical patent/JP2024043430A/ja
Publication of JP2024043430A publication Critical patent/JP2024043430A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】アンビソニックスマイクを用いて収音した収音空間内の客席側臨場感の雰囲気を少なくとも1つのサテライト会場内において高精度に再現する。【解決手段】音場臨場感再現装置は、収音空間内に配置される収音デバイスにより収音される収音信号と、収音空間内の1以上の音源の音源信号とを取得する取得部と、音源信号を参照信号とし、収音信号に含まれる参照信号の成分を消去する消去処理を実行する消去部と、消去処理後の信号を符号化処理する符号化部と、符号化処理後の信号に基づいて、収音空間とは異なる再現空間内に配置される複数のスピーカごとに、収音空間内の音場臨場感を再現空間内において再現するためのスピーカ駆動信号を生成する生成部と、複数のスピーカのそれぞれから、スピーカごとのスピーカ駆動信号を出力する音場再生部と、を備える。【選択図】図5

Description

本開示は、音場臨場感再現装置及び音場臨場感再現方法に関する。
昨今、リアルタイムに音場再現(再生)を行うためにシーンベース立体音響再生技術が注目されている。シーンベース立体音響再生技術とは、複数の無指向性マイク素子が剛球上に又は複数の指向性マイクが中空球面上に配置されているアンビソニックスマイクを用いて収音した多チャンネル信号に対して信号処理を施すことにより、視聴環境(空間)を取り囲むように配置されたスピーカを用いてあたかもリスナー(聴取者)がアンビソニックスマイクの設置箇所に存在しているかのような立体的な音場をリアルタイムに再現(再生)する方式である。
音場再現に関する先行技術として、例えば特許文献1が知られている。特許文献1は、被写体に装着されたワイヤレスマイクの収音信号を受信し、複数のマイクロフォンにより音声を収音した各音声信号を基にしてマルチチャネル音声信号を生成する音声収録装置を開示している。この音声収録装置は、ワイヤレスマイクの収音信号をマルチチャネル音声信号の1つ以上の任意のチャネルに割り当て、それぞれ任意の合成比で合成して撮像画像信号とともに記録媒体に記録する。
特開2006-314078号公報
ここで、上述したシーンベース立体音響再生技術を用いて、例えば広範なコンサートホール等のライブ会場の客席側にアンビソニックスマイク(上述参照)を配置し、メインステージ等で繰り広げられている演劇等の上演中の客席側の拍手、どよめき、ざわめき、歓声等の臨場感(以下、「客席側臨場感」と称する場合がある)を収音し、その客席側臨場感をライブ会場とは異なる1つ以上のサテライト会場において再現することを想定する。特許文献1には、マイクロフォンにより収音された音場の雰囲気とワイヤレスマイクにより収音された音場の雰囲気との関係が詳細に開示されておらず、上述した想定の実現に特許文献1の技術を適用することが困難であると考えられる。また、アンビソニックスマイクは、客席側に配置されたとしても、客席側臨場感だけでなく例えばステージ上の役者等の演者の台詞等の発話音声、効果音、BGM(Background Music)、独自音源等の演奏音がライブ会場内の空間を伝播した音信号を収音する可能性が高い。この場合、ライブ会場内の客席側臨場感以外の他の音成分が混入するため、サテライト会場にいる聴取者に向けて客席側臨場感の音場を高精度に再現することが困難であったと考えられる。特許文献1では、上述したライブ会場内を収音した客席側臨場感による音場をサテライト会場内において高感度に再現するための解決の道筋が提示されていない。
本開示は、上述した従来の状況に鑑みて案出され、アンビソニックスマイクを用いて収音した収音空間内の客席側臨場感の雰囲気を少なくとも1つのサテライト会場内において高精度に再現する音場臨場感再現装置及び音場臨場感再現方法を提供することを目的とする。
本開示は、収音空間内に配置される収音デバイスにより収音される収音信号と、前記収音空間内の1以上の音源の音源信号とを取得する取得部と、前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行する消去部と、前記消去処理後の信号を符号化処理する符号化部と、前記符号化処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成する生成部と、前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力する音場再生部と、を備える、音場臨場感再現装置を提供する。
また、本開示は、収音空間内に配置される収音デバイスにより収音される収音信号を少なくとも取得する取得部と、前記収音空間内の1以上の音源の音源信号を符号化処理する符号化部と、前記符号化処理後の前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行する消去部と、前記消去処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成する生成部と、前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力する音場再生部と、を備える、音場臨場感再現装置を提供する。
また、本開示は、収音空間内に配置される収音デバイスにより収音される収音信号と、前記収音空間内の1以上の音源の音源信号とを取得するステップと、前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行するステップと、前記消去処理後の信号を符号化処理するステップと、前記符号化処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成するステップと、前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力するステップと、を有する、音場臨場感再現方法を提供する。
また、本開示は、収音空間内に配置される収音デバイスにより収音される収音信号を少なくとも取得するステップと、前記収音空間内の1以上の音源の音源信号を符号化処理するステップと、前記符号化処理後の前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行するステップと、前記消去処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成するステップと、前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力するステップと、を有する、音場臨場感再現方法を提供する。
なお、これらの包括的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示によれば、アンビソニックスマイクを用いて収音した収音空間内の客席側臨場感の雰囲気を少なくとも1つのサテライト会場内において高精度に再現できる。
アンビソニックスマイクを用いたシーンベース立体音響再生技術における音場収音から音場再現までの概念を模式的に示す図 次数n及び度数mに対する球面調和関数展開に基づくアンビソニックス成分の基底の一例を示す図 音場臨場感再現システムの動作概要例を模式的に示す図 実施の形態1に係る音場臨場感再現システムのシステム構成例を示すブロック図 図4の音場臨場感再現システムにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図 実施の形態1に係る音場臨場感再現装置による音場臨場感再現の動作手順例を時系列に示すフローチャート 実施の形態1の変形例に係る音場臨場感再現システムのシステム構成例を示すブロック図 図7の音場臨場感再現システムにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図 実施の形態1の変形例に係る音場臨場感再現装置による音場臨場感再現の動作手順例を時系列に示すフローチャート 実施の形態2に係る音場臨場感再現システムのシステム構成例を示すブロック図 図10の音場臨場感再現システムにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図 実施の形態2に係る音場臨場感再現装置による音場臨場感再現の動作手順例を時系列に示すフローチャート 実施の形態2の変形例に係る音場臨場感再現システムのシステム構成例を示すブロック図 図13の音場臨場感再現システムにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図 実施の形態2の変形例に係る音場臨場感再現装置による音場臨場感再現の動作手順例を時系列に示すフローチャート
以下、図面を適宜参照して、本開示に係る音場臨場感再現装置及び音場臨場感再現方法を具体的に開示した実施の形態について、詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明及び実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の記載の主題を限定することは意図されていない。
以下の実施の形態では、収音空間(例えばライブ会場)内の音、音楽、人の声等の音源信号を収音する収音デバイスとしてアンビソニックスマイクを用いたシーンベース立体音響再生技術を例示して説明する。このシーンベース立体音響再生技術では、アンビソニックスマイクを構成する複数のマイク素子で収音した信号(収音信号)或いはモノラル信号として表現可能な点音源を、球面調和関数を用いた中間表現ITMR1(図1参照)或いはBフォーマット信号として表現する(エンコードする)ことにより、全方位から到来する音場をアンビソニックス信号領域(後述参照)において統一的に取り扱う。更に、この中間表現をデコード(復号化)することによりスピーカ駆動信号を生成し、再現空間(例えばサテライト会場)内での所望の音場再現を実現する。
以下、「音場」とは、音が広がる空間(場所を含む)のことと定義する。音場内に伝播する音には、対象となる空間内で伝播している1以上の音源からの音が含まれる。ここで、音源とは、例えばライブ会場LV1等の収音空間のメインステージ上で行われている各種の演奏(例えばバンド演奏、ミュージカル演劇)の音源だけでなく、ライブ会場LV1内のメインステージから離れた客席側で生じる歓声、ざわめき、どよめき、拍手等の臨場感を与える音も含まれる。
(実施の形態1)
まず、図1を参照して、シーンベース立体音響再生技術の概念について説明する。図1は、アンビソニックスマイクAMB1を用いたシーンベース立体音響再生技術における音場収音から音場再現までの概念を模式的に示す図である。アンビソニックスマイクAMB1は、収音空間(例えばライブ会場LV1)内の客席側所定位置に配置される。ライブ会場LV1では、その空間内を伝搬している音信号がアンビソニックスマイクAMB1により収音される。例えば、ライブ会場LV1のメインステージで複数人によるバンド演奏がなされていれば、ボーカル(歌声)、ベース、ギター、ドラム等の各種の音源による音信号が収音される。また、ミュージカル演劇がなされていれば、1人以上の役者等の演者(音源)の発話による音声信号が収音される。一方、客席側で生じる歓声、ざわめき、どよめき、拍手等の客席側臨場感を与える音信号も、アンビソニックスマイクAMB1により収音される。
収音デバイスの一例としてのアンビソニックスマイクAMB1は、4つのマイク素子Mc1、Mc2、Mc3、Mc4を備える。マイク素子Mc1~Mc4のそれぞれは、方向Dr1を正面方向とした場合に、図1中の立方体CB1の中心から4つの頂点を向くように中空配置され、各頂点方向に対する単一指向性を有している。マイク素子Mc1は、アンビソニックスマイクAMB1の前方左上(FLU:Front Left Up)を向き、その前方左上(FLU)の方向の音を主に収音する。マイク素子Mc2は、アンビソニックスマイクAMB1の前方右下(FRD:Front Right Down)を向き、その前方右下(FRD)の方向の音を主に収音する。マイク素子Mc3は、アンビソニックスマイクAMB1の後方左下(BLD:Back Left Down)を向き、その後方左下の方向の音を主に収音する。マイク素子Mc4は、アンビソニックスマイクAMB1の後方右上(BRU:Back Right Up)を向き、その後方右上の方向の音を主に収音する。
これらの4方向(つまり、FLU、FRD、BLD、BRU)の音の収音信号は、Aフォーマット信号と呼ばれる。Aフォーマット信号は、そのままでは使用できず、指向特性(指向性)を有する中間表現ITMR1としてのBフォーマット信号に変換される。Bフォーマット信号は、例えば、全方向(全方位)の音のBフォーマット信号W、前後方向の音のBフォーマット信号X、左右方向の音のBフォーマット信号Y、上下方向の音のBフォーマット信号Zを有する。Aフォーマット信号は、次に示す変換式により、Bフォーマット信号に変換される。
W=FLU+FRD+BLD+BRU
X=FLU+FRD-BLD-BRU
Y=FLU-FRD+BLD-BRU
Z=FLU-FRD-BLD+BRU
Bフォーマット信号W、X、Y、Zを合成することにより、前後、左右、上下の全方位の音の信号が得られる。そして、Bフォーマット信号W、X、Y、Zのそれぞれの信号レベルを変更させて合成することにより、前後、左右、上下の全方位のうち任意の指向特性を有する音の信号を生成することができる。例えば図1に示すように、立方体でモデル化される再現空間(例えばサテライト会場STL1)内の各頂点部分に、合計8つのサテライトスピーカSPk1、SPk2、SPk3、SPk4、SPk5、SPk6、SPk7、SPk8が配置され、収音空間(例えばライブ会場LV1)と同様(つまり、前後、左右、上下の方向が平行或いは同方向)の3次元座標系を考える。なお、ここでは説明を分かり易くするために、サテライトスピーカの個数を8であると例示しているが、その個数は8に限定されないことは言うまでもない。
なお、サテライトスピーカSPk1~SPk8のそれぞれの位置は、再現空間(例えばサテライト会場STL1)の基準位置(例えば中心位置LSP1)からの既定距離と角度(方位角θ及び仰角φ)とにより特定可能である。図1において、iは再現空間(例えばサテライト会場STL1)内に配置されているサテライトスピーカを示す変数であり、図1の例では1から8までのいずれかの整数をとる。
再現空間(例えばサテライト会場STL1)の中心位置LSP1にユーザであるリスナー(聴取者)が存在し、正面方向(Front)を向いているとする。このような状況下において、収音空間(例えばライブ会場LV1)内で収音されたAフォーマット信号を用いた符号化処理により得られたBフォーマット信号W、X、Y、Zのデータと再現空間(例えばサテライト会場STL1)内のサテライトスピーカSPk1~SPk8のそれぞれの方向とに基づいて、収音空間(例えばライブ会場LV1)内の音場を再現空間(例えばサテライト会場STL1)内で自由に再現することができる。つまり、再現空間(例えばサテライト会場STL1)にユーザであるリスナー(聴取者)が存在する場合に、リスナーの正面方向を基準方向とし、その基準方向から任意の3次元方向の音を再現出力することが可能となる。
次に、図2を参照して、次数n及び度数mに対する球面調和関数展開に基づくアンビソニックス成分の基底について説明する。図2は、次数n及び度数mに対する球面調和関数展開に基づくアンビソニックス成分の基底の一例を示す図である。
図2の横軸(m)は度数(degree)を示し、図2の縦軸(n)は次数(order)を示す。度数mは、-nから+nまでの値をとる。n=N次までの球面調和関数は合計(N+1)個の基底を含む。例えば、n=N=0である場合、1個の基底(つまり、全方位のBフォーマット信号W)が得られる。また例えば、n=N=1である場合、4個の基底(つまり、(n、m)=(0、0)に対応する全方位のBフォーマット信号W、(n、m)=(1、-1)に対応する前後方向のBフォーマット信号X、(n、m)=(1、0)に対応する上下方向のBフォーマット信号Z、(n、m)=(1、1)に対応する左右方向のBフォーマット信号Y)が得られる。なお、n=N=2以降も同様であるため、説明を省略する。
球面調和関数はnとmの増加に対して空間的な周期性が増す性質を有することが知られている。このため、nとmの組み合わせによって異なる方向パターン(指向特性)のBフォーマット信号を表現することが可能となる。次数n及び度数mに対する次元をアンビソニックスチャネルナンバリング(ACN:Ambisonics Channel Numbering)に基づいてK=n(n+1)+mと定義すると、球面調和関数を式(1)のようにベクトル形式で表現可能である。式(1)において、上添字のTは転置を示す。
Figure 2024043430000002
Figure 2024043430000003
Figure 2024043430000004
Figure 2024043430000005
次に、図3を参照して、音場臨場感再現システムの動作概要例について説明する。図3は、音場臨場感再現システムの動作概要例を模式的に示す図である。図3では、アンビソニックスマイクAMB1が配置される収音空間は、例えばボーカル、ベース、ギター、ドラム等の各種の音源によるバンド演奏が行われるライブ会場LV1を例示して説明する。但し、上述したように、収音空間であるライブ会場LV1ではバンド演奏に限らず、1人以上の役者等の演者が演じているミュージカルの上演、複数の楽器の演奏によるコンサート若しくはオーケストラの演奏であってもよく、以下同様である。
図3に示すように、ライブ会場LV1にはメインステージSTG1が設けられ、このメインステージSTG1上においてバンド演奏が行われている。バンド演奏では、例えばボーカル(音源の一例)による歌声等の音声信号SS2、ベース(音源の一例)によるベース音の音信号SS1、ギター(音源の一例)によるギター音の音信号SS3が広くライブ会場LV1内の空間内を伝搬して客席側に到達する。これらの信号は各音源位置から直接空間内を伝達して客席側に到達することもあれば、ライブ会場LV1内に備えられたスピーカなどの拡声装置を通じて再生されて客席側に到達することもある。アンビソニックスマイクAMB1は、客席側臨場感の音を主に収音することを目的として、ライブ会場LV1の客席側所定位置(例えば客席の中心位置)に配置されている。このため、アンビソニックスマイクAMB1は、上述したバンド演奏中の客席側の歓声、どよめき、ざわつき、拍手等の客席側臨場感を与える音を主に収音する。
ところが、上述したように、バンド演奏中のベースの音信号SS1、ボーカルの音声信号SS2、ギターの音信号SS3は、ライブ会場LV1の空間内を伝搬する。このため、音信号SS1、音声信号SS2、音信号SS3の拡散音(残響音を含む。以下同様。)の成分DS1、DS2、DS3がアンビソニックスマイクAMB1により音信号として収音されてしまう。従って、アンビソニックスマイクAMB1には、本来収音されて欲しくない拡散音の成分DS1、DS2、DS3が収音されることにより、従来のシーンベース立体音響再生技術では、サテライト会場STL1においてライブ会場LV1の客席側臨場感の音を高精度に再現することは難しかった。
そこで、以下の実施の形態では、アンビソニックスマイクを用いて収音した収音空間内の客席側臨場感の雰囲気を少なくとも1つのサテライト会場内において高精度に再現する音場臨場感再現システムの例を説明する。
次に、図4及び図5を参照して、実施の形態1に係る音場臨場感再現システム100のシステム構成並びに動作概要について説明する。図4は、実施の形態1に係る音場臨場感再現システム100のシステム構成例を示すブロック図である。図5は、図4の音場臨場感再現システム100における音場臨場感収音から音場臨場感再現までの動作概要例を示す図である。
音場臨場感再現システム100は、音場臨場感収音装置10と、音場臨場感再現装置20とを含む。音場臨場感収音装置10と音場臨場感再現装置20とはネットワークNW1を介して互いにデータ通信が可能に接続されている。ネットワークNW1は、有線ネットワークでもよいし、無線ネットワークでもよい。有線ネットワークは、例えば有線LAN(Local Area Network)、有線WAN(Wide Area Network)、電力線通信(PLC:Power Line Communication)のうち少なくとも1つが該当し、他の有線通信可能なネットワーク構成でもよい。一方、無線ネットワークは、Wi-Fi(登録商標)等の無線LAN、無線WAN、Bluetooth(登録商標)等の近距離無線通信、4G或いは5G等の移動体携帯通信網のうち少なくとも1つが該当し、他の無線通信可能なネットワーク構成でもよい。
音場臨場感収音装置10は、収音空間(例えばライブ会場LV1)に配置され、アンビソニックスマイクAMB1と、A/D変換部7と、個別収音マイクM1、…、Mnとを含む。ここでいうnは、ライブ会場LV1内の個別音源(例えばバンド演奏であればボーカル、ベース、ギター等の独立した音源)の数を示し、具体的には2以上の整数である。なお、音場臨場感収音装置10は、少なくともアンビソニックスマイクAMB1を有していればよく、A/D変換部7は音場臨場感再現装置20に設けられてもよい。
アンビソニックスマイクAMB1は、4つのマイク素子Mc1、Mc2、Mc3、Mc4を備え、マイク素子Mc1において前方左上方向(図1参照)の音を収音し、マイク素子Mc2において前方右下方向(図1参照)の音を収音し、マイク素子Mc3において後方左下方向(図1参照)の音を収音し、後方右上方向(図1参照)の音を収音する。なお、アンビソニックスマイクAMB1は、中空配置された4つのマイク素子Mc1、Mc2、Mc3、Mc4よりも多くの単一指向性を有するマイク素子を備えていてもよく、また、剛球上に配置された無指向性を有するマイク素子を備えていても良い。多数のマイク素子を備えたアンビソニックスマイクを用いることにより、音場臨場感再現装置20の符号化部13において、2次以上オーダーのアンビソニックス信号を合成することが可能となる。アンビソニックスマイクAMB1を構成する各マイク素子により収音された信号(収音信号)は、A/D変換部7に入力される。
少なくともA/D変換部7は、例えばCPU(Central Processing Unit)、DSP(Digital Signal Processor)、GPU(Graphical Processing Unit)、FPGA(Field Programmable Gate Array)等の電子デバイスのうち少なくとも1つが実装された半導体チップ若しくは専用のハードウェアにより構成される。
A/D変換部7は、アンビソニックスマイクAMB1を構成する各マイク素子からのアナログ形式の収音信号をディジタル形式の収音信号に変換する。この変換後の収音信号は、音場臨場感収音装置10が備える通信インターフェース(図示略)及びネットワークNW1を介して、音場臨場感再現装置20に送信される。
個別収音マイクM1は、ライブ会場LV1のメインステージSTG1(図3参照)上のバンド演奏或いはミュージカル演劇等のイベント発生中のユニークな音源(例えばバンド演奏のボーカル、或いはミュージカル演劇の演者)から生じる個別音源音(第1の音源)を収音する。個別収音マイクM1は、例えばバンド演奏のボーカル、或いはミュージカル演劇の演者により装着されるヘッドセットマイクでよい。個別収音マイクM1により収音された個別音源音信号は、音場臨場感収音装置10が備える通信インターフェース(図示略)及びネットワークNW1を介して、音場臨場感再現装置20に送信される。
同様に、個別収音マイクMnは、ライブ会場LV1のメインステージSTG1(図3参照)上のバンド演奏或いはミュージカル演劇等のイベント発生中のユニークな音源(例えばバンド演奏のギター、或いはミュージカル演劇中の効果音若しくはBGM(Background Music))から生じる個別音源音(第nの音源)を収音する。個別収音マイクMnは、例えばバンド演奏のギター奏者により装着されるヘッドセットマイク、或いはミュージカル演劇中の効果音若しくはBGMを収音可能なマイクでよい。個別収音マイクMnにより収音された個別音源音信号は、音場臨場感収音装置10が備える通信インターフェース(図示略)及びネットワークNW1を介して、音場臨場感再現装置20に送信される。
音場臨場感再現装置20は、再現空間(例えばサテライト会場STL1)に配置され、エコーキャンセル部21、…、2nと、符号化部22と、マイク素子方向指定部23と、スピーカ方向指定部24と、復号化部25と、音場再生部26と、サテライトスピーカSPk1、…、SPkpとを含む。ここでいうpは、サテライト会場STL1内に配置されるサテライトスピーカの数を示し、具体的には2以上の整数である。また、エコーキャンセル部21~2nの個数を示すnと、個別収音マイクM1~Mnの個数を示すnとは同一である。つまり、個別収音マイクが収音する音源の種類数と同数のエコーキャンセル部が音場臨場感再現装置20内に設けられる。
エコーキャンセル部21は、音場臨場感収音装置10(A/D変換部7側)から送られたアンビソニックスマイクAMB1のマイク素子ごとの収音信号を入力し、更に、音場臨場感収音装置10(個別収音マイクM1側)から送られた第1の音源(上述参照)の個別音源音信号を第1の参照信号M1Sとして入力する。エコーキャンセル部21は、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる第1の参照信号M1S(つまり、個別収音マイクM1が収音した個別音源音信号)の成分を消去するための消去処理(例えばエコーキャンセル処理)を実行する。エコーキャンセル部21は、消去処理後の信号(第1の収音信号)を符号化部22に出力する。
同様に、エコーキャンセル部2nは、音場臨場感収音装置10(A/D変換部7側)から送られたアンビソニックスマイクAMB1のマイク素子ごとの収音信号を入力し、更に、音場臨場感収音装置10(個別収音マイクMn側)から送られた第nの音源(上述参照)の個別音源音信号を第nの参照信号MnSとして入力する。エコーキャンセル部2nは、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる第nの参照信号MnS(つまり、個別収音マイクMnが収音した個別音源音信号)の成分を消去するための消去処理(例えばエコーキャンセル処理)を実行する。エコーキャンセル部2nは、消去処理後の信号(第nの収音信号)を符号化部22に出力する。
ここで、エコーキャンセル部21~2nのそれぞれは、例えば時間領域上で動作する適応フィルタを用いたエコーキャンセラとして構成してよい。このエコーキャンセラは、例えばSingle Channel EchoCancellerとして構成することができる。従って、図5に示すように、エコーキャンセル部21~2nのそれぞれは、アンビソニックスマイクAMB1のマイク素子の数(例えば4)と同数のSingle Channel EchoCancellerを用いて構成可能である。このSingle Channel EchoCancellerは、例えば参考非特許文献において開示されている構成でよい。この構成を用いることにより、特に参照信号間に相関が無い場合(言い換えると、クロストーク成分が実質的に含まれないと見做せる程度の所定閾値未満となる場合)には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる参照信号(つまり、個別収音マイクが収音した個別音源音信号)の成分を高精度に消去(抑圧)することが可能となる。また、エコーキャンセル部21~2nは時間領域信号をDFT(Discrete Fourier Transform)などにより順変換した上で周波数領域上やサブバンド領域上の適応フィルタを用いたエコーキャンセル処理として実現しても良く、キャンセル後の信号をIFFT(Inverse Fast Fourier Transform)などにより時間領域へと逆変換した上で後段の処理を行っても良い。
<参考非特許文献> 5章 音響エコーキャンセラ、「適応フィルタの構成例」(図5・2参照)、p4/(17)、電子情報通信学会、2012年、[令和4年9月2日検索]、インターネット<URL:https://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf>
なお、エコーキャンセル部21~2nのそれぞれは収音空間(例えばライブ会場LV1)内を伝搬した個別音源音を消去(抑圧)することを目的として設けられる。このため、エコーキャンセル部21~2nのそれぞれは、符号化部22とともに収音空間(例えばライブ会場LV1)側に設けられてもよいし、符号化部22とともに再現空間(例えばサテライト会場STL)側に設けられていてもよい。この場合、収音空間(例えばライブ会場LV1)側に設けた場合、符号化部22の出力である1次オーダーアンビソニックス信号(つまり、客席側臨場感)の成分のみが音場臨場感再現装置20に送られることになる。一方、再現空間(例えばサテライト空間STL1)側に設けた場合、符号化部22の出力である1次オーダーアンビソニックス信号(つまり、客席側臨場感)の成分と個別音源音信号とが音場臨場感再現装置20に送られることになる。また、エコーキャンセル部21~2nのみを収音空間(例えばライブ会場LV1)側に設け、符号化部22を再現空間(例えばサテライト会場STL)に設けても良い。この場合、エコーキャンセル部2nの出力信号の成分のみが音場臨場感再現装置20に送られることになる。
また、再現空間(例えばサテライト会場STL1)側では、音場臨場感再現装置20は、音場臨場感収音装置10の個別収音マイクM1~Mnのそれぞれにより収音された個別音源音信号を音場臨場感の再現目的のためにサテライトスピーカSPk1~SPkpのそれぞれ、或いは個別音源音信号用に設けた他のサテライトスピーカ(図示略)から出力してもよい。
Figure 2024043430000006
Figure 2024043430000007
ここで、符号化部22による符号化処理の詳細について説明する。
一般的に、球面上の任意の角度(θ、φ)に対し半径rの位置で観測(収音)される音圧pは波動方程式の球面調和関数領域における内部問題の解として、波数kに対し式(2)の球面調和関数を基底として式(4)と展開されることが知られている。式(4)において、A は展開係数であり、R(kr)は動径関数項である。また、次数nに関する無限和は有限次数Nで打ち切ることで近似され、この打ち切り次数Nに応じて音場再現の精度が変化する。以下、打ち切り次数をNとして表現する。
Figure 2024043430000008
Figure 2024043430000009
Figure 2024043430000010
Figure 2024043430000011
式(6)において、iは虚数単位であり、j(kr)はn次の球ベッセル関数、j (kr)はその導関数である。本開示においては、この平面波に対する展開係数ベクトルγ を、符号化部22による符号化処理の出力であるBフォーマット信号(中間表現)として取り扱う。以下、この展開係数ベクトルを、時間領域と異なるアンビソニックス領域上のアンビソニックス領域信号(ambisonics domain signal)又は単にアンビソニックス信号と称する場合がある。
より具体的には、符号化部22による符号化処理では、エコーキャンセル部21~2nのそれぞれから出力された参照信号の成分の消去処理後の時間領域信号(time domain signal)である収音信号をアンビソニックス信号(例えば1次オーダーアンビソニックス信号)へと変換し、このアンビソニックス信号(例えば1次オーダーアンビソニックス信号)は復号化部25によりデコード処理されてスピーカ駆動信号に変換される。
Figure 2024043430000012
Figure 2024043430000013
Figure 2024043430000014
Figure 2024043430000015
Figure 2024043430000016
Figure 2024043430000017
Figure 2024043430000018
音場再生部26は、復号化部25から出力されたサテライトスピーカごとのディジタル形式のスピーカ駆動信号をアナログ形式のスピーカ駆動信号に変換して信号増幅し、対応するサテライトスピーカから出力(再生)する。
サテライトスピーカSPk1、…、SPkpは、立方体でモデル化される再現空間(例えばサテライト会場STL1)の各頂点部分(図1参照)に配置され、音場再生部26からのスピーカ駆動信号に基づいて音場を再生(再現)する。なお、スピーカ設置数は再現したい音場によって変化させてよく、特定の方位に対する再現を行わない場合や、トランスオーラルシステムやVBAP(Vector Based Amplitude Panning)法など一般的に知られた仮想音像生成方式を組み合わせることによりp個(例えば図1の例では8個)よりも少ないサテライトスピーカを用いて音場再現を行っても良い。逆に、p個(例えば図1の例では8個)よりも多くのサテライトスピーカを用いた音場再現を行っても良い。また、スピーカ設置位置はサテライト会場STL1の基準位置(例えば中心位置LSP1)を取り囲むように設置されていれば再現空間(例えばサテライト会場STL1)の各頂点部分以外であっても良い。音場再生部26はサテライトスピーカの代わりに聴取者(ユーザ)が装着しているヘッドホンやイヤホンなどの両耳への再生装置に信号を出力しても良い。また、音場再生部28は、聴取者(ユーザ)の両耳への再生装置(例えば、上述したヘッドホンやイヤホン)に信号を供給する際は後述するデコード処理によって方位角+-90°に対応した再生信号を生成しても良いし、頭部を包囲する複数の方向に対して仮想音像を生成し、それら複数の角度に対応したHRTF(Head Related Transfer Function)などの立体音像をユーザに知覚させるための伝達特性を対応した方向の仮想音像に対して周波数領域で乗算又は時間領域で畳み込むことで再生信号を生成しても良い。これにより、サテライト会場STL1に配置されたサテライトスピーカSPk1~SPkpのそれぞれからに限った音場再現となるのではなく、サテライト会場STL1に配置された聴取者(ユーザ)が装着している再生装置(例えば、上述したヘッドホンやイヤホン)への音場再現も可能となる。
ここで、復号化部25による処理の詳細について説明する。
Figure 2024043430000019
Figure 2024043430000020
次に、図6を参照して、音場臨場感再現装置20による音場臨場感再現の動作手順について説明する。図6は、実施の形態1に係る音場臨場感再現装置20による音場臨場感再現の動作手順例を時系列に示すフローチャートである。
図6において、音場臨場感収音装置10のアンビソニックスマイクAMB1は、収音空間(例えばライブ会場LV1)内で配置されている客席側所定位置の周囲で生じている音(例えば客席側臨場感を与える音)を収音する(ステップSt21)。このステップSt21で収音されたアンビソニックスマイクAMB1のマイク素子ごとの収音信号は、音場臨場感再現装置20Bに送信される。但し、上述したように、ステップSt21で収音される音には、客席側臨場感を与える音だけでなく、収音空間(例えばライブ会場LV1)のメインステージSTG1(図3参照)での演奏或いは演劇等による1以上の音源からの音も含まれる。また、収音空間(例えばライブ会場LV1)のメインステージSTG1(図3参照)での演奏或いは演劇等による1以上の音源からの個別収音マイクM1~Mnのそれぞれにより収音された個別音源音(言い換えると、第1の参照信号M1S~第nの参照信号MnS)も音場臨場感再現装置20に送信される(ステップSt21)。
音場臨場感再現装置20は、エコーキャンセル部21~2nのそれぞれにおいて、アンビソニックスマイクAMB1のマイク素子ごとの収音信号を主信号、個別収音マイクM1~Mnのそれぞれの収音信号を参照信号としたエコーキャンセル処理(上述参照)を時間軸上で参照信号ごとに繰り返して実行する(ステップSt22)。より具体的には、音場臨場感再現装置20のエコーキャンセル部21は、ステップSt21で送られた各種の信号(具体的には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号、対応する第1の参照信号M1S)を入力し、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる第1の参照信号M1S(つまり、個別収音マイクM1が収音した個別音源音信号)の成分を消去するための消去処理(例えばエコーキャンセル処理)を時間軸上で実行する(ステップSt22)。同様に、音場臨場感再現装置20のエコーキャンセル部2nは、ステップSt21で送られた各種の信号(具体的には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号、対応する第nの参照信号MnS)を入力し、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる第nの参照信号MnS(つまり、個別収音マイクMnが収音した個別音源音信号)の成分を消去するための消去処理(例えばエコーキャンセル処理)を時間軸上で実行する(ステップSt22)。
Figure 2024043430000021
Figure 2024043430000022
以上により、実施の形態1に係る音場臨場感再現装置20は、収音空間(ライブ会場LV1)内に配置される収音デバイス(アンビソニックスマイクAMB1)により収音される収音信号(拡散音の成分DS1~DS3)と、収音空間内の1以上の音源の音源信号(音信号SS1、音声信号SS2、音信号SS3)とを取得する取得部(エコーキャンセル部21~2n)と、その音源信号を参照信号とし、収音信号に含まれる参照信号の成分を消去する消去処理を時間軸上で実行する消去部(エコーキャンセル部21~2n)と、消去処理後の信号を符号化処理する符号化部22と、符号化処理後の信号に基づいて、収音空間とは異なる再現空間(サテライト会場STL1)内に配置される複数のスピーカ(サテライトスピーカSPk1~SPkp)ごとに、収音空間内の音場臨場感を再現空間内において再現するためのスピーカ駆動信号を生成する生成部(復号化部25)と、複数のスピーカのそれぞれから、スピーカごとのスピーカ駆動信号を出力する音場再生部26と、を備える。これにより、実施の形態1に係る音場臨場感再現装置20は、アンビソニックスマイクAMB1が主に収音した収音空間(ライブ会場LV1)内の客席側臨場感の雰囲気を、アンビソニックスマイクAMB1により収音されるライブ会場LV1内の1以上の個別音源(参照信号)の成分を時間軸上で消去することにより、少なくとも1つのサテライト会場内において高精度に再現することができる。
また、音場臨場感再現装置20は、収音デバイス(アンビソニックスマイクAMB1)が備える複数のマイク素子Mc1~Mc4の方向情報を指定するマイク素子方向指定部23を更に備える。符号化部22は、複数のマイク素子Mc1~Mc4のそれぞれの方向情報と消去処理後の信号とを用いて、符号化処理を実行する。これにより、音場臨場感再現装置20は、アンビソニックスマイクAMB1が備えるマイク素子Mc1~Mc4のそれぞれの方向情報を加味して複数の方向解像度(図1のBフォーマット信号参照)を有するアンビソニックス信号を生成できる。
また、音場臨場感再現装置20は、再現空間(サテライト会場STL1)内の複数のスピーカ(サテライトスピーカSPk1~SPkp)の方向情報を指定するスピーカ方向指定部24を更に備える。生成部(復号化部25)は、複数のスピーカのそれぞれの方向情報と符号化処理後の信号とを用いて、複数のスピーカのそれぞれごとのスピーカ駆動信号をアンビソニックス領域上で生成する。これにより、音場臨場感再現装置20は、サテライト会場STL1の空間内に配置されている複数のサテライトスピーカSPk1~SPkpのそれぞれの基準位置(例えば聴取者の位置に相当する中心位置LSP1参照)からの方向情報を加味してライブ会場LV1内の客席側臨場感を再現可能なスピーカ駆動信号を生成できる。
また、音場臨場感再現装置20の消去部(エコーキャンセル部21~2n)は、収音デバイス(アンビソニックスマイクAMB1)が備えるマイク素子Mc1~Mc4の数と音源の数とに基づいて定められる個数分のシングルエコーキャンセラ(図5参照)により構成される。それぞれのシングルエコーキャンセラは、対応する音源の音源信号(例えば個別収音マイクによる音信号若しくは音声信号)を入力して消去処理(エコーキャンセル処理)を時間軸上で実行する。これにより、特に参照信号間に相関が無い場合(言い換えると、クロストーク成分が実質的に含まれないと見做せる程度の所定閾値未満となる場合)には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる参照信号(つまり、個別収音マイクMnが収音した個別音源音信号)の成分を高精度に消去(抑圧)することが可能となる。クロストーク成分が実質的に含まれないとは、例えばメインステージSTG1(図3参照)上にいるボーカルが歌った時の音声が他の個別収音マイクにより収音されない或いは収音されてもその音圧レベルが上述した所定閾値未満となる場合が該当する。
(実施の形態1の変形例)
実施の形態1では、音場臨場感再現装置において、エコーキャンセル部21~2nのそれぞれをSingle EchoCancellerとして構成した例を説明した。実施の形態1の変形例では、音場臨場感再現装置において、エコーキャンセル部21~2nの代わりに、複数の音声チャネルを取り扱うマルチチャンネルエコーキャンセラとして構成した例を説明する。なお、実施の形態1の変形例において、実施の形態1と重複する構成、内容については対応する共通の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
まず、図7及び図8を参照して、実施の形態1の変形例に係る音場臨場感再現システム100Aのシステム構成並びに動作概要について説明する。図7は、実施の形態1の変形例に係る音場臨場感再現システム100Aのシステム構成例を示すブロック図である。図8は、図7の音場臨場感再現システム100Aにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図である。
音場臨場感再現システム100Aは、音場臨場感収音装置10と、音場臨場感再現装置20Aとを含む。音場臨場感収音装置10と音場臨場感再現装置20AとはネットワークNW1を介して互いにデータ通信が可能に接続されている。
音場臨場感再現装置20Aは、再現空間(例えばサテライト会場STL1)に配置され、マルチチャンネルエコーキャンセル部21Aと、符号化部22と、マイク素子方向指定部23と、スピーカ方向指定部24と、復号化部25と、音場再生部26と、サテライトスピーカSPk1、…、SPkpとを含む。つまり、実施の形態1の変形例では、実施の形態1のエコーキャンセル部21~2nの代わりに、n個の個別収音マイクのそれぞれが収音する音源の音源信号を入力するマルチチャンネルエコーキャンセル部21Aが音場臨場感再現装置20A内に設けられる。
マルチチャンネルエコーキャンセル部21Aは、音場臨場感収音装置10(A/D変換部7側)から送られたアンビソニックスマイクAMB1のマイク素子ごとの収音信号を入力し、更に、音場臨場感収音装置10(個別収音マイクM1側)から送られた第1の音源(上述参照)~第nの音源(上述参照)のそれぞれの個別音源音信号を第1の参照信号M1S~第nの参照信号MnSとして入力する。マルチチャンネルエコーキャンセル部21Aは、アンビソニックスマイクAMB1の収音信号に含まれる、第1の参照信号M1S(つまり、個別収音マイクM1が収音した個別音源音信号)~第nの参照信号MnS(つまり、個別収音マイクMnが収音した個別音源音信号)のそれぞれの成分を消去するための消去処理(例えばマルチチャンネルエコーキャンセル処理)を時間領域上で実行する。マルチチャンネルエコーキャンセル部21Aは、消去処理後の信号(第1の収音信号~第nの収音信号)を符号化部22に出力する。
ここで、マルチチャンネルエコーキャンセル部21Aは、例えば時間領域上で動作する適応フィルタを用いたエコーキャンセラとして構成してよい。このエコーキャンセラは、例えばMulti Channel EchoCancellerとして構成することができる。なお、このMulti Channel EchoCancellerの構成としては、参考非特許文献に示されるステレオエコーキャンセラを参考にしてよく、このステレオエコーキャンセラはMulti Channel EchoCancellerに入力される参照信号の数を2つ設けた場合の例となる。従って、図8に示すように、マルチチャンネルエコーキャンセル部21Aは、アンビソニックスマイクAMB1のマイク素子の数(例えば4)と同数のMulti Channel EchoCanceller若しくはステレオエコーキャンセラを用いて構成可能である。このMulti Channel EchoCanceller若しくはステレオエコーキャンセラは、例えば参考非特許文献において開示されている構成或いはその構成を参照することで得られる構成でよい。この構成を用いることにより、たとえ参照信号間に相関がある場合(言い換えると、クロストーク成分が含まれないと見做せる程度の所定閾値以上となる場合)でも、アンビソニックスマイクAMB1の収音信号に含まれる参照信号(つまり、個別収音マイクMnが収音した個別音源音信号)の成分を高精度に消去(抑圧)することが可能となる。また、マルチチャンネルエコーキャンセル部21Aは時間領域信号をDFTなどにより順変換した上で周波数領域上やサブバンド領域上の適応フィルタを用いたエコーキャンセル処理として実現しても良く、キャンセル後の信号をIFFTなどにより時間領域へと逆変換した上で後段の処理を行っても良い。
<参考非特許文献> 5章 音響エコーキャンセラ、「ステレオエコーキャンセラの構成例」(図5・8参照)、電子情報通信学会、2012年、[令和4年9月2日検索]、インターネット<URL:https://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf>
次に、図9を参照して、音場臨場感再現装置20Aによる音場臨場感再現の動作手順について説明する。図9は、実施の形態1の変形例に係る音場臨場感再現装置による音場臨場感再現の動作手順例を時系列に示すフローチャートである。図9の説明において、図6の説明と重複する内容については同一のステップ番号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
図9において、音場臨場感再現装置20Aは、マルチチャンネルエコーキャンセル部21Aにおいて、アンビソニックスマイクAMB1の収音信号を主信号、個別収音マイクM1~Mnのそれぞれの収音信号を参照信号としたマルチチャンネルエコーキャンセル処理(上述参照)を時間領域上で実行する(ステップSt22A)。より具体的には、音場臨場感再現装置20Aのマルチチャンネルエコーキャンセル部21Aは、ステップSt21で送られた各種の信号(具体的には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号、第1の参照信号M1S~第nの参照信号MnS)を入力し、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる、第1の参照信号M1S(つまり、個別収音マイクM1が収音した個別音源音信号)の成分~第nの参照信号MnS(つまり、個別収音マイクMnが収音した個別音源音信号)の成分を消去するための消去処理(例えばマルチチャンネルエコーキャンセル処理)を時間軸上で実行する(ステップSt22A)。ステップSt22A以降の処理は図6と重複するので、説明は省略する。
以上により、実施の形態1の変形例に係る音場臨場感再現システム100Aでは、音場臨場感再現装置20Aの消去部(マルチチャンネルエコーキャンセル部21A)は、収音デバイス(アンビソニックスマイクAMB1)が備えるマイク素子Mc1~Mc4の数に基づいて定められる個数分のマルチチャンネルエコーキャンセラにより構成される(図8参照)。それぞれのマルチチャンネルエコーキャンセラは、複数の音源のそれぞれに対応する音源信号(音源音信号)を入力して消去処理(マルチキャンセルエコーキャンセル処理)を実行する。これにより、たとえ参照信号間に相関がある場合(言い換えると、クロストーク成分が含まれないと見做せる程度の所定閾値以上となる場合)でも、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に含まれる参照信号(つまり、個別収音マイクが収音した個別音源音信号)の成分を高精度に消去(消去)することが可能となる。
(実施の形態2)
実施の形態1では、音場臨場感再現装置において、1次オーダーアンビソニックス信号を生成するための符号化処理を実行する前に、アンビソニックスマイクAMB1のマイク素子ごとの収音信号と収音空間(例えばライブ会場LV1)内の音源ごとの音源音信号(参照信号)とを用いて時間領域上でエコーキャンセル処理を実行する例を説明した。実施の形態2では、音場臨場感再現装置において、1次オーダーアンビソニックス信号と収音空間(例えばライブ会場LV1)内の音源ごとの方向指定別の音源音信号とを用いてアンビソニックス領域上でエコーキャンセル処理を実行する例を説明する。なお、実施の形態2において、実施の形態1と重複する構成、内容については対応する共通の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
まず、図10及び図11を参照して、実施の形態2に係る音場臨場感再現システム100Bのシステム構成並びに動作概要について説明する。図10は、実施の形態2に係る音場臨場感再現システム100Bのシステム構成例を示すブロック図である。図11は、図10の音場臨場感再現システム100Bにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図である。
音場臨場感再現システム100Bは、音場臨場感収音装置10Bと、音場臨場感再現装置20Bとを含む。音場臨場感収音装置10Bと音場臨場感再現装置20BとはネットワークNW1を介して互いにデータ通信が可能に接続されている。
音場臨場感収音装置10Bは、収音空間(例えばライブ会場LV1)に配置され、アンビソニックスマイクAMB1と、A/D変換部7と、符号化部8と、マイク素子方向指定部9と、個別収音マイクM1、…、Mnと、を含む。なお、音場臨場感収音装置10は、少なくともアンビソニックスマイクAMB1を有していればよく、A/D変換部7、符号化部8及びマイク素子方向指定部9は音場臨場感再現装置20Bに設けられてもよい。
Figure 2024043430000023
Figure 2024043430000024
音場臨場感再現装置20Bは、再現空間(例えばサテライト会場STL1)に配置され、エコーキャンセル部21B、…、2nBと、符号化部31、…、3nと、音源位置指定部41、…、4nと、スピーカ方向指定部24と、復号化部25Bと、音場再生部26と、サテライトスピーカSPk1、…、SPkpとを含む。また、エコーキャンセル部21~2nの個数を示すnと、符号化部31~3nの個数を示すnと、音源位置指定部41~4nの個数を示すnと、個別収音マイクM1~Mnの個数を示すnとは同一である。つまり、個別収音マイクが収音する音源の種類数と同数のエコーキャンセル部、符号化部及び音源位置指定部が音場臨場感再現装置20B内に設けられる。
Figure 2024043430000025
Figure 2024043430000026
Figure 2024043430000027
Figure 2024043430000028
Figure 2024043430000029
Figure 2024043430000030
ここで、エコーキャンセル部21B~2nBのそれぞれは、例えばアンビソニックス領域で動作する適応フィルタを用いたエコーキャンセラとして構成してよい。このエコーキャンセラは、例えばSingle Channel EchoCancellerとして構成することができる。従って、図11に示すように、エコーキャンセル部21B~2nBのそれぞれは、アンビソニックスマイクAMB1のマイク素子の数(例えば4)と同数のSingle Channel EchoCancellerを用いて構成可能である。このSingle Channel EchoCancellerは、例えば参考非特許文献において開示されている構成でよい。この構成を用いることにより、たとえ参照信号間に相関が無い場合(言い換えると、クロストーク成分が実質的に含まれないと見做せる程度の所定閾値未満となる場合)には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に基づく信号成分(例えば図1に示すW、X、Y、Zの各方向解像度を有する信号)に含まれる参照信号(つまり、個別収音マイクが収音した個別音源音信号)の成分を高精度に消去(抑圧)することが可能となる。
<参考非特許文献> 5章 音響エコーキャンセラ、「適応フィルタの構成例」(図5・2参照)、p4/(17)、電子情報通信学会、2012年、[令和4年9月2日検索]、インターネット<URL:https://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf>
Figure 2024043430000031
次に、図12を参照して、音場臨場感再現装置20Bによる音場臨場感再現の動作手順について説明する。図12は、実施の形態2に係る音場臨場感再現装置20Bによる音場臨場感再現の動作手順例を時系列に示すフローチャートである。図12の説明において、図6の説明と重複する内容については同一のステップ番号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
Figure 2024043430000032
Figure 2024043430000033
Figure 2024043430000034
Figure 2024043430000035
以上により、実施の形態2に係る音場臨場感再現システム100Bにおいて、音場臨場感再現装置20Bは、収音空間(ライブ会場LV1)内に配置される収音デバイス(アンビソニックスマイクAMB1)により収音される収音信号(拡散音の成分DS1~DS3)を少なくとも取得する取得部(エコーキャンセル部21B~2nB)と、収音空間内の1以上の音源の音源信号(音信号SS1、音声信号SS2、音信号SS3)を符号化処理する符号化部31~3nと、符号化処理後の音源信号を参照信号とし、収音信号に含まれる参照信号の成分を消去する消去処理を実行する消去部(エコーキャンセル部21B~2nB)と、消去処理後の信号に基づいて、収音空間とは異なる再現空間(サテライト会場STL1)内に配置される複数のスピーカ(サテライトスピーカSPk1~SPkp)ごとに、収音空間内の音場臨場感を再現空間内において再現するためのスピーカ駆動信号を生成する生成部(復号化部25B)と、複数のスピーカのそれぞれから、スピーカごとのスピーカ駆動信号を出力する音場再生部26と、を備える。これにより、実施の形態2に係る音場臨場感再現装置20Bは、アンビソニックスマイクAMB1が主に収音した収音空間(ライブ会場LV1)内の客席側臨場感の雰囲気を、アンビソニックスマイクAMB1により収音されるライブ会場LV1内の1以上の個別音源(参照信号)の成分を時間領域上ではなくアンビソニックス領域上で消去することにより、高い方向解像度を有して少なくとも1つのサテライト会場内において高精度に再現することができる。
また、取得部(エコーキャンセル部21B~2nB)により取得される収音信号は、収音デバイス(アンビソニックスマイクAMB1)が備える複数のマイク素子Mc1~Mc4のそれぞれの方向情報を用いて符号化処理された信号である。これにより、音場臨場感再現装置20Bは、消去部(エコーキャンセル部21B~2nBのそれぞれ)における消去処理の対象として入力する信号として、高い方向解像度を有する1次オーダーアンビソニックス信号を取得できる。
また、音場臨場感再現装置20Bは、再現空間(サテライト会場STL1)内の複数のスピーカ(サテライトスピーカSPk1~SPkp)の方向情報を指定するスピーカ方向指定部24を更に備える。生成部(復号化部25B)は、複数のスピーカのそれぞれの方向情報と消去処理後の信号とを用いて、複数のスピーカのそれぞれごとのスピーカ駆動信号を生成する。これにより、音場臨場感再現装置20Bは、アンビソニックス領域上での消去処理後の信号を用いて復号化処理を施すことにより、複数のサテライトスピーカSPk1~SPkpのそれぞれの基準位置(例えば聴取者の位置に相当する中心位置LSP1参照)からの方向情報を加味してライブ会場LV1内の客席側臨場感を再現可能であってかつ高い方向解像度を有するスピーカ駆動信号を高精度に生成できる。
また、音場臨場感再現装置20Bは、収音空間(ライブ会場LV1)内の1以上の音源の位置情報を指定する音源位置指定部41~4nを更に備える。符号化部31~3nのそれぞれは、対応する音源の音源信号及び位置情報を用いて、符号化処理を実行する。これにより、音場臨場感再現装置20Bは、ライブ会場LV1内の個別音源の存在する方向を加味して消去部(エコーキャンセル部21B~2nB)の消去処理に必要となる高精度な参照信号を生成できる。
また、消去部(エコーキャンセル部21B~2nB)は、収音デバイス(アンビソニックスマイクAMB1)が備えるマイク素子Mc1~Mc4の数(例えば4)と音源の数(例えばn個)とに基づいて定められる個数分(例えば4n(=4×n)個)のシングルエコーキャンセラにより構成される。シングルエコーキャンセラは、対応する音源の音源信号が符号化処理された後の信号を入力して消去処理を実行する。これにより、音場臨場感再現装置20Bは、特に参照信号間に相関が無い場合(言い換えると、クロストーク成分が実質的に含まれないと見做せる程度の所定閾値未満となる場合)には、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に基づく信号成分(例えば図1に示すW、X、Y、Zの各方向解像度を有する信号)に含まれる参照信号(つまり、個別収音マイクMnが収音した個別音源音信号と個別音源方向とに基づく1次オーダーアンビソニックス信号)の成分を高精度に消去(抑圧)することが可能となる。
(実施の形態2の変形例)
実施の形態2では、音場臨場感再現装置において、エコーキャンセル部21B~2nBのそれぞれをSingle EchoCancellerとして構成した例を説明した。実施の形態2の変形例では、音場臨場感再現装置において、エコーキャンセル部21B~2nBの代わりに、時間領域上ではなくアンビソニックス領域上において複数の音声チャネルを取り扱うマルチチャンネルエコーキャンセラとして構成した例を説明する。なお、実施の形態2の変形例において、実施の形態1、2と重複する構成、内容については対応する共通の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
まず、図13及び図14を参照して、実施の形態2の変形例に係る音場臨場感再現システム100Cのシステム構成並びに動作概要について説明する。図13は、実施の形態2の変形例に係る音場臨場感再現システム100Cのシステム構成例を示すブロック図である。図14は、図13の音場臨場感再現システム100Cにおける音場臨場感収音から音場臨場感再現までの動作概要例を示す図である。
音場臨場感再現システム100Cは、音場臨場感収音装置10B(図10参照)と、音場臨場感再現装置20Cとを含む。音場臨場感収音装置10Bと音場臨場感再現装置20CとはネットワークNW1を介して互いにデータ通信が可能に接続されている。
Figure 2024043430000036
Figure 2024043430000037
ここで、マルチチャンネルエコーキャンセル部21Cは、例えばアンビソニックス領域で動作する複数の適応フィルタを用いたエコーキャンセラとして構成してよい。このエコーキャンセラは、例えばMulti Channel EchoCancellerとして構成することができる。なお、このMulti Channel EchoCancellerの構成としては、参考非特許文献に示されるステレオエコーキャンセラを参考にしてよく、このステレオエコーキャンセラはMulti Channel EchoCancellerに入力される参照信号の数を2つ設けた場合の例となる。従って、図14に示すように、マルチチャンネルエコーキャンセル部21Cは、アンビソニックスマイクAMB1のマイク素子の数(例えば4)と同数のMulti Channel EchoCanceller若しくはステレオエコーキャンセラを用いて構成可能である。このMulti Channel EchoCanceller若しくはステレオエコーキャンセラは、例えば参考非特許文献において開示されている構成或いはその構成を参照することで得られる構成でよい。この構成を用いることにより、たとえ参照信号間に相関がある場合(言い換えると、クロストーク成分が含まれないと見做せる程度の所定閾値以上となる場合)でも、アンビソニックスマイクAMB1の収音信号に基づく信号成分(例えば図1に示すW、X、Y、Zの各方向解像度を有する信号)に含まれる参照信号(つまり、個別収音マイクMnが収音した個別音源音信号)の成分を高精度に消去(抑圧)することが可能となる。
<参考非特許文献> 5章 音響エコーキャンセラ、「ステレオエコーキャンセラの構成例」(図5・8参照)、電子情報通信学会、2012年、[令和4年9月2日検索]、インターネット<URL:https://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf>
Figure 2024043430000038
次に、図15を参照して、音場臨場感再現装置20Cによる音場臨場感再現の動作手順について説明する。図15は、実施の形態2の変形例に係る音場臨場感再現装置20Cによる音場臨場感再現の動作手順例を時系列に示すフローチャートである。図15の説明において、図6、図9或いは図12の説明と重複する内容については同一のステップ番号を付与して説明を簡略化或いは省略し、異なる内容について説明する。
Figure 2024043430000039
Figure 2024043430000040
以上により、実施の形態2の変形例に係る音場臨場感再現装置20Cにおいて、消去部(マルチチャンネルエコーキャンセル部21C)は、収音デバイス(アンビソニックスマイクAMB1)が備えるマイク素子Mc1~Mc4の数に基づいて定められる個数分のマルチチャンネルエコーキャンセラにより構成される。マルチチャンネルエコーキャンセラは、複数の音源のそれぞれに対応する音源信号が符号化処理された後の信号を入力して消去処理(マルチチャンネルエコーキャンセル処理)を実行する。これにより、音場臨場感再現装置20Cは、たとえ参照信号間に相関がある場合(言い換えると、クロストーク成分が含まれないと見做せる程度の所定閾値以上となる場合)でも、アンビソニックスマイクAMB1のマイク素子ごとの収音信号に基づく信号成分(例えば図1に示すW、X、Y、Zの各方向解像度を有する信号)に含まれる参照信号(つまり、個別収音マイクが収音した個別音源音信号)の成分をアンビソニックス領域上で高精度に消去(抑圧)することが可能となる。
以上、添付図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。
本開示は、アンビソニックスマイクを用いて収音した収音空間内の客席側臨場感の雰囲気を少なくとも1つのサテライト会場内において高精度に再現する音場臨場感再現装置及び音場臨場感再現方法として有用である。
7 A/D変換部
8、22、31、3n 符号化部
9、23 マイク素子方向指定部
10、10B 音場臨場感収音装置
20、20A、20B、20C 音場臨場感再現装置
21、2n、21B、2nB エコーキャンセル部
21A、21C マルチチャンネルエコーキャンセル部
24 スピーカ方向指定部
25、25B、25C 復号化部
26 音場再生部
41、4n 音源位置指定部
100、100A、100B、100C 音場臨場感再現システム
AMB1 アンビソニックスマイク
M1、Mn 個別収音マイク
SPk1、SPkp サテライトスピーカ

Claims (13)

  1. 収音空間内に配置される収音デバイスにより収音される収音信号と、前記収音空間内の1以上の音源の音源信号とを取得する取得部と、
    前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行する消去部と、
    前記消去処理後の信号を符号化処理する符号化部と、
    前記符号化処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成する生成部と、
    前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力する音場再生部と、を備える、
    音場臨場感再現装置。
  2. 前記収音デバイスが備える複数のマイク素子の方向情報を指定するマイク素子方向指定部、を更に備え、
    前記符号化部は、前記複数のマイク素子のそれぞれの方向情報と前記消去処理後の信号とを用いて、前記符号化処理を実行する、
    請求項1に記載の音場臨場感再現装置。
  3. 前記再現空間内の前記複数のスピーカの方向情報を指定するスピーカ方向指定部、を更に備え、
    前記生成部は、前記複数のスピーカのそれぞれの方向情報と前記符号化処理後の信号とを用いて、前記複数のスピーカのそれぞれごとの前記スピーカ駆動信号を生成する、
    請求項1に記載の音場臨場感再現装置。
  4. 前記消去部は、前記収音デバイスが備えるマイク素子の数と前記音源の数とに基づいて定められる個数分のシングルエコーキャンセラにより構成され、
    前記シングルエコーキャンセラは、対応する前記音源の音源信号を入力して前記消去処理を実行する、
    請求項1に記載の音場臨場感再現装置。
  5. 前記消去部は、前記収音デバイスが備えるマイク素子の数に基づいて定められる個数分のマルチチャンネルエコーキャンセラにより構成され、
    前記マルチチャンネルエコーキャンセラは、複数の前記音源のそれぞれに対応する前記音源信号を入力して前記消去処理を実行する、
    請求項1に記載の音場臨場感再現装置。
  6. 収音空間内に配置される収音デバイスにより収音される収音信号を少なくとも取得する取得部と、
    前記収音空間内の1以上の音源の音源信号を符号化処理する符号化部と、
    前記符号化処理後の前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行する消去部と、
    前記消去処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成する生成部と、
    前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力する音場再生部と、を備える、
    音場臨場感再現装置。
  7. 前記収音信号は、前記収音デバイスが備える複数のマイク素子の方向情報を用いて符号化処理された信号である、
    請求項6に記載の音場臨場感再現装置。
  8. 前記再現空間内の前記複数のスピーカの方向情報を指定するスピーカ方向指定部、を更に備え、
    前記生成部は、前記複数のスピーカのそれぞれの方向情報と前記消去処理後の信号とを用いて、前記複数のスピーカのそれぞれごとの前記スピーカ駆動信号を生成する、
    請求項6に記載の音場臨場感再現装置。
  9. 前記収音空間内の1以上の前記音源の位置情報を指定する音源位置指定部、を更に備え、
    前記符号化部は、対応する前記音源の音源信号及び前記位置情報を用いて、前記符号化処理を実行する、
    請求項6に記載の音場臨場感再現装置。
  10. 前記消去部は、前記収音デバイスが備えるマイク素子の数と前記音源の数とに基づいて定められる個数分のシングルエコーキャンセラにより構成され、
    前記シングルエコーキャンセラは、対応する前記音源の音源信号が前記符号化処理された後の信号を入力して前記消去処理を実行する、
    請求項9に記載の音場臨場感再現装置。
  11. 前記消去部は、前記収音デバイスが備えるマイク素子の数に基づいて定められる個数分のマルチチャンネルエコーキャンセラにより構成され、
    前記マルチチャンネルエコーキャンセラは、複数の前記音源のそれぞれに対応する前記音源信号が前記符号化処理された後の信号を入力して前記消去処理を実行する、
    請求項9に記載の音場臨場感再現装置。
  12. 収音空間内に配置される収音デバイスにより収音される収音信号と、前記収音空間内の1以上の音源の音源信号とを取得するステップと、
    前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行するステップと、
    前記消去処理後の信号を符号化処理するステップと、
    前記符号化処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成するステップと、
    前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力するステップと、を有する、
    音場臨場感再現方法。
  13. 収音空間内に配置される収音デバイスにより収音される収音信号を少なくとも取得するステップと、
    前記収音空間内の1以上の音源の音源信号を符号化処理するステップと、
    前記符号化処理後の前記音源信号を参照信号とし、前記収音信号に含まれる前記参照信号の成分を消去する消去処理を実行するステップと、
    前記消去処理後の信号に基づいて、前記収音空間とは異なる再現空間内に配置される複数のスピーカごとに、前記収音空間内の音場臨場感を前記再現空間内において再現するためのスピーカ駆動信号を生成するステップと、
    前記複数のスピーカのそれぞれから、前記スピーカごとの前記スピーカ駆動信号を出力するステップと、を有する、
    音場臨場感再現方法。
JP2022148618A 2022-09-16 2022-09-16 音場臨場感再現装置及び音場臨場感再現方法 Pending JP2024043430A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022148618A JP2024043430A (ja) 2022-09-16 2022-09-16 音場臨場感再現装置及び音場臨場感再現方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022148618A JP2024043430A (ja) 2022-09-16 2022-09-16 音場臨場感再現装置及び音場臨場感再現方法

Publications (1)

Publication Number Publication Date
JP2024043430A true JP2024043430A (ja) 2024-03-29

Family

ID=90418215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022148618A Pending JP2024043430A (ja) 2022-09-16 2022-09-16 音場臨場感再現装置及び音場臨場感再現方法

Country Status (1)

Country Link
JP (1) JP2024043430A (ja)

Similar Documents

Publication Publication Date Title
JP7367785B2 (ja) 音声処理装置および方法、並びにプログラム
US10674262B2 (en) Merging audio signals with spatial metadata
USRE44611E1 (en) System and method for integral transference of acoustical events
KR100964353B1 (ko) 오디오 데이터를 처리하기 위한 방법 및 이에 따른 사운드수집 장치
TWI555412B (zh) 整合幾何空間音源編碼串流之設備及方法
CN112205006B (zh) 音频内容的自适应再混合
TW202016925A (zh) 用於編碼、解碼、場景處理及與以指向性音訊編碼為基礎之空間音訊編碼有關的其他程序之裝置、方法及電腦程式
WO2022014326A1 (ja) 信号処理装置および方法、並びにプログラム
JP5338053B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
Braasch et al. A loudspeaker-based projection technique for spatial music applications using virtual microphone control
JP3916087B2 (ja) 疑似ステレオ化装置
JP2005157278A (ja) 全周囲音場創生装置、全周囲音場創生方法、及び全周囲音場創生プログラム
US20240163624A1 (en) Information processing device, information processing method, and program
JP2024043430A (ja) 音場臨場感再現装置及び音場臨場感再現方法
JP2024043429A (ja) 臨場感音場再生装置及び臨場感音場再生方法
Grazioli et al. Preliminary evaluation of a sound system employing a cancelling auralizer for producing virtual rooms in a modern recording studio
WO2024070127A1 (ja) 音場再現装置、音場再現方法及び音場再現システム
WO2024038702A1 (ja) 音場再現装置、音場再現方法及び音場再現システム
US20240056735A1 (en) Stereo headphone psychoacoustic sound localization system and method for reconstructing stereo psychoacoustic sound signals using same
JP5590169B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
WO2024024468A1 (ja) 情報処理装置および方法、符号化装置、音声再生装置、並びにプログラム
Mores 12. Music Studio Studio Technology
Etlinger A musically motivated approach to spatial audio for large venues