JP2009218655A - 音響信号変換装置、その方法及びそのプログラム - Google Patents

音響信号変換装置、その方法及びそのプログラム Download PDF

Info

Publication number
JP2009218655A
JP2009218655A JP2008057331A JP2008057331A JP2009218655A JP 2009218655 A JP2009218655 A JP 2009218655A JP 2008057331 A JP2008057331 A JP 2008057331A JP 2008057331 A JP2008057331 A JP 2008057331A JP 2009218655 A JP2009218655 A JP 2009218655A
Authority
JP
Japan
Prior art keywords
acoustic
signal
sound field
original
physical quantity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008057331A
Other languages
English (en)
Other versions
JP4922211B2 (ja
Inventor
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2008057331A priority Critical patent/JP4922211B2/ja
Publication of JP2009218655A publication Critical patent/JP2009218655A/ja
Application granted granted Critical
Publication of JP4922211B2 publication Critical patent/JP4922211B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】本発明は、音響信号のチャンネル数を任意に変換できると共に、変換した音響信号を再生する際、良好なリスニング環境を提供できる音響信号変換装置を提供する。
【解決手段】音響信号変換装置1は、フーリエ変換手段10と、原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成手段20と、原音響物理量信号を再生音響物理量信号に変換する音響信号変換手段30と、再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成手段40と、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定する変換行列設定手段50と、フーリエ逆変換手段60と、記憶手段70と、を備える。
【選択図】図1

Description

本発明は、あるチャンネル数に対応する音響信号を、そのチャンネル数と異なるチャンネル数に対応する音響信号に変換する音響信号換装置、その方法及びそのプログラムに関する。
従来から、5.1チャンネルサラウンドシステム用の音響信号を、2チャンネルステレオシステム用の音響信号に変換するダウンミックス法は、ITU−R(国際電気通信連合 無線通信部門)によって規格化されている(例えば、非特許文献1参照)。
また、この規格とは別に、ダウンミックスを行う発明が開示されている(例えば、特許文献1参照)。特許文献1に記載されたダウンミックス装置は、ダウンミックス前の音響信号から、3次元的な定位を正確に再現したダウンミックス後の音響信号を生成するものである。
また、音響信号を3次元的にパンニングする発明も開示されている(例えば、特許文献2,3参照)。特許文献2に記載された3次元的パンニング装置は、スピーカの配置にかかわらず音響信号を3次元的にパンニングするものである。また、特許文献3に記載された3次元的パンニング装置は、音源の3次元的なパンニングを、複数のスピーカが放射する音響信号によって形成される音響のパンニングとして再生するものである。
特開2007−53624号公報 特開2007−194900号公報 特開2007−329746号公報 RECOMMENDATION ITU−R BS.775−2「MULTICHANNEL STEREOPHONIC SOUND SYSTEM WITH AND WITHOUT ACCOMPANYING PICTURE」
しかし、音響信号のチャンネル数を任意に変換すること、例えば、5.1チャンネルサラウンドシステム用の音響信号を、スーパーハイビジョン用の22.2チャンネル音響システム用の音響信号又はWFS(Wave Field Synthesis)等の波面合成音響システム用の音響信号に変換することは一般的でない。そこで、音響コンテンツの流通を促進するため、音響信号を送信又は収録するチャンネル数や音響信号を再生するチャンネル数を制限されることなく、音響信号のチャンネル数を任意に変換したいという要望がなされている。
また、特許文献1〜3に記載の発明は、1点を示す受音点(通常、利用者の頭部付近)において、良好なリスニング環境となるように音響信号を変換している。このため、特許文献1〜3に記載の発明では、利用者が体を少し動かすだけで頭部が受音点から外れてしまうので、利用者の動きや、複数の利用者が同じ空間で同じ音楽を聴きたいときに対応できず、良好なリスニング環境を提供できていない問題がある。
本発明は、音響信号のチャンネル数を任意に変換できると共に、変換した音響信号を再生する際、良好なリスニング環境を提供できる音響信号変換装置、その方法及びそのプログラムを提供することを目的とする。
前記した課題を解決するため、請求項1に係る音響信号変換装置は、1以上のチャンネル数に対応する原音響信号を、原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換装置であって、フーリエ変換手段と、原音場ベクトル生成手段と、音響信号変換手段と、再生音場ベクトル生成手段と、変換行列設定手段と、フーリエ逆変換手段と、を備える構成とした。
かかる構成において、音響信号変換装置は、フーリエ変換手段によって、入力された原音響信号を、原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換する。このように、原音響信号をフーリエ変換することで、音響信号変換装置は、原音場での音響物理量を扱うことができる。ここで、音響物理量は、音圧又は粒子速度の少なくとも一方を含む。また、音響信号変換装置は、原音場ベクトル生成手段によって、フーリエ変換手段がフーリエ変換した原音響物理量信号に基づいて、原音場での音響物理量を成分とする原音場ベクトルを生成する。
また、音響信号変換装置は、音響信号変換手段によって、フーリエ変換手段がフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する。このように、原音響物理量信号を変換することで、音響信号変換装置は、再生音場での音響物理量を扱うことができる。ここでは、音響信号変換装置は、再生音響物理量信号を得るために、初期値としての変換行列を用いる。
また、音響信号変換装置は、再生音場ベクトル生成手段によって、音響信号変換手段が変換した再生音響物理量信号に基づいて、再生音場での音響物理量を成分とする再生音場ベクトルを生成する。また、音響信号変換装置は、変換行列設定手段によって、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定する。ここで、受音領域は、利用者の数、利用者の頭部位置その他リスニング環境に応じて、その形状や大きさを任意に設定、例えば、縦0.4m×横0.4mの正方形である平面又は縦0.4m×横0.4m×高さ0.4の立方体である空間として設定する。
また、音響信号変換装置は、音響信号変換手段によって、変換行列設定手段が設定した変換行列に基づいて、原音響物理量信号を再生音響物理量信号に再変換する。このように、原音響物理量信号を再変換することで、音響信号変換装置は、原音場での音響物理量と再生音場での音響物理量との二乗誤差を最小にすることができる。また、音響信号変換装置は、フーリエ逆変換手段によって、音響信号変換手段が変換した再生音響物理量信号を、再生音響信号にフーリエ逆変換する。これによって、音響信号変換装置は、原音響信号と略同じ又は可能な限り近似した再生音響信号を得ることができる。さらに、音響信号変換装置は、1点を示す受音点よりも広い受音領域に対応するため、利用者の動きや、複数の利用者が同じ空間で同じ音楽を聴きたいときにも対応できる。
請求項2に係る音響信号変換装置は、原音響信号のチャンネルに対応する原スピーカの位置と、再生音響信号のチャンネルに対応する再生スピーカの位置とを記憶する記憶手段、をさらに備え、変換行列設定手段が、再生スピーカが22.2チャンネル音響システムのように3次元に配置されている場合、記憶手段が記憶する原スピーカの位置と再生スピーカの位置とに基づいて、再生音場で隣接する3個以上の再生スピーカに囲まれる分割領域を求め、受音領域までの仮想線が分割領域を通過する原スピーカについて、原スピーカに対応する原音響信号のチャンネルを、3個以上の再生スピーカに対応する再生音響信号のチャンネルに割り当てる変換行列を設定することを特徴とする。
一方、再生スピーカが5.1チャンネルサラウンドシステムのように2次元に配置されている場合、変換行列設定手段は、2個以上の再生スピーカに囲まれる分割領域を用いても良い。
かかる構成において、音響信号変換装置は、原音場でのあるチャンネルの音が聞こえる方向と、再生音場でそのチャンネルの音が聞こえる方向とが全く異なってしまう事態を防ぐことができる。
請求項3に係る音響信号変換装置は、フーリエ変換手段が、原音響信号を、原音場での音響物理量として、スカラー量である原音場での音圧と3次元ベクトル量である原音場での粒子速度とを含む原音響物理量信号にフーリエ変換し、原音場ベクトル生成手段が、原音場での音圧と原音場での粒子速度とを成分とする4次元ベクトルである原音場ベクトルを生成し、音響信号変換手段が、原音響物理量信号を、再生音場での音響物理量として、スカラー量である再生音場での音圧と3次元ベクトル量である再生音場での粒子速度とを含む再生音響物理量信号に変換し、再生音場ベクトル生成手段が、再生音場での音圧と再生音場での粒子速度とを成分とする4次元ベクトルである再生音場ベクトルを生成することを特徴とする。
かかる構成において、音響信号変換装置は、原音場ベクトル及び再生音場ベクトルとして、音圧と粒子速度とを成分とする4次元ベクトルを扱うことができる。これによって、音響信号変換装置は、スカラー量である音圧を、3次元ベクトルに変換する必要がない。
また、前記した課題を解決するため、請求項4に係る音響信号変換方法は、1以上のチャンネル数に対応する原音響信号を、原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換方法であって、フーリエ変換ステップと、原音場ベクトル生成ステップと、音響信号変換ステップと、再生音場ベクトル生成ステップと、変換行列設定ステップと、音響信号再変換ステップと、フーリエ逆変換ステップと、を備える構成とした。
また、前記した課題を解決するため、請求項5に係る音響信号変換プログラムは、1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換するために、コンピュータを、フーリエ変換手段、原音場ベクトル生成手段、音響信号変換手段、再生音場ベクトル生成手段、変換行列設定手段、フーリエ逆変換手段、として機能させる構成とした。
本発明に係る音響信号変換装置、その方法及びそのプログラムによれば、以下のような優れた効果を奏する。
請求項1,4,5に係る発明によれば、原音響信号と略同じ又は可能な限り近似した再生音響信号を得ることができ、利用者の動きや、複数の利用者が同じ空間で同じ音楽を聴きたいときにも対応できるため、音響信号のチャンネル数を任意に変換できると共に、変換した再生音響信号を再生する際、良好なリスニング環境を提供することができる。
請求項2に係る発明によれば、原音場であるチャンネルの音が聞こえる方向と、再生音場でそのチャンネルの音が聞こえる方向とが全く異なってしまう事態を防げるため、リスニング環境をより良好にすることができる。
請求項3に係る発明によれば、スカラー量をそのまま扱うことができるため、音圧を3次元ベクトルに変換して扱う必要がない。
以下、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の機能を有する手段及び同一の部材には同一の符号を付し、説明を省略した。
[音響信号変換装置の概略]
まず、本発明に係る音響信号変換装置の概略について、簡単に説明する。
音圧は、音波が到達した際、空気圧の微小な変化量であり、スカラー量として与えられる。音の響きがさほど大きくない空間では、ある音源から所定の距離だけ離れた受音点の音圧のフーリエ変換は、式(1)で表される。
粒子速度は、音波が到達した際、流体(空気)が微小に振動する速度であり、3次元のベクトル量として与えられる。また、音波と同じ条件において、粒子速度のフーリエ変換は、式(2)で表される。
従って、音圧と粒子速度との両者を制御して音響信号の変換を行う場合、音圧と、粒子速度のx,y,z軸方向(3次元方向)の各成分を要素とする4次元である音場ベクトルを生成し、音場ベクトルの二乗誤差が最小となるように変換すれば良い。つまり、本発明に係る音響信号変換装置は、音場ベクトルの二乗誤差が最小となる変換行列を求めるものである。なお、スピーカが複数の場合、受音点において、各スピーカの音場ベクトルを足し合わせることで、全スピーカで音を再生するときの音場ベクトルを得ることができる。
[音響信号変換装置の構成]
次に、図1を参照して、音響信号変換装置の構成について、詳細に説明する。図1は、本発明の実施形態に係る音響信号変換装置のブロック図である。音響信号変換装置1は、後記する各機能を実現するために、フーリエ変換手段10と、原音場ベクトル生成手段20と、音響信号変換手段30と、再生音場ベクトル生成手段40と、変換行列設定手段50と、フーリエ逆変換手段60と、記憶手段70と、を備える。
図1では、原音響信号をs(t)、原音響物理量信号をs(ω)、原音場ベクトルをΦ及び変換行列をWで示した。また、再生音響信号をq(t)、再生音響物理量信号をq(ω)及び再生音場ベクトルをΦで示した。ここで、原音響信号s(t)は、原音響信号のチャンネル数、例えば、5.1チャンネルサラウンドシステムに対応するものであれば、6チャンネル入力される(不図示)。また、再生音響信号q(t)は、再生音響信号のチャンネル数、例えば、22.2チャンネル音響システムに対応するものであれば、24チャンネル出力される(不図示)。
フーリエ変換手段10は、入力された原音響信号を、原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するものである。また、フーリエ変換手段10は、原音響信号を、原音場での音響物理量として、スカラー量である原音場での音圧と3次元ベクトル量である原音場での粒子速度とを含む原音響物理量信号にフーリエ変換する。
ここで、フーリエ変換手段10は、原音響信号を、式(3)を用いて、原音場での音圧にフーリエ変換する。
また、フーリエ変換手段10は、原音響信号を、式(4)を用いて、原音場での粒子速度にフーリエ変換する。
原音場ベクトル生成手段20は、フーリエ変換手段10がフーリエ変換した原音響物理量信号に基づいて、原音場での音響物理量を成分とする原音場ベクトルを生成するものである。また、原音場ベクトル生成手段20は、原音場での音圧と原音場での粒子速度とを成分とする4次元ベクトルである原音場ベクトルを生成する。
ここで、原音場ベクトル生成手段20は、式(5)で表される原音場ベクトルを生成する。
音響信号変換手段30は、所定の変換行列に基づいて、フーリエ変換手段10がフーリエ変換した原音響物理量信号を、再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換するものである。また、音響信号変換手段30は、原音響物理量信号を、再生音場での音響物理量として、スカラー量である再生音場での音圧と3次元ベクトル量である再生音場での粒子速度とを含む再生音響物理量信号に変換する。
このとき、原音響物理量信号を再生音響物理量信号に変換するために、変換行列が必要となる。しかし、音響信号変換装置1を初めて使用する場合や音響信号変換装置1を新たな音響システムに対応させる場合等、変換行列が設定されていない場合が考えられる。このため、初期値としての変換行列を記憶手段70に記憶させておき、音響信号変換手段30は、初期値としての変換行列を用いて、原音響物理量信号を再生音響物理量信号に変換する。そして、後記する変換行列設定手段50が、二乗誤差が最小となる変換行列を設定し、音響信号変換手段30は、この変換行列に基づいて、原音響物理量信号を再生音響物理量信号に再変換する。
ここで、音響信号変換手段30は、原音響物理量信号を、式(6)を用いて、再生音場での音圧に変換する。
また、音響信号変換手段30は、原音響物理量信号を、式(7)を用いて、再生音場での粒子速度に変換する。
以上より、音響信号変換手段30は、原音響物理量信号を、式(8)を用いて、再生音響物理量信号に変換する。
再生音場ベクトル生成手段40は、音響信号変換手段30が変換した再生音響物理量信号に基づいて、再生音場での音響物理量を成分とする再生音場ベクトルを生成するものである。また、再生音場ベクトル生成手段40は、再生音場での音圧と再生音場での粒子速度とを成分とする4次元ベクトルである再生音場ベクトルを生成する。ここで、再生音場ベクトル生成手段40は、式(9)で表される再生音場ベクトルを生成する。このとき、式(10)で表される定義を用いる。
ここで、音響物理量として、スカラー量である音圧のみを扱う場合、例えば、特許文献1〜3のように、スカラー量である音圧を3次元ベクトルに変換する必要がある。
一方、音響信号変換装置1は、音圧に加えて粒子速度を利用することにより、スカラー量である音圧をそのまま扱うことができ、このような変換を不要としている。
変換行列設定手段50は、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定するものである。また、変換行列設定手段50は、領域分割して変換行列を設定することができるが、この具体例は、後記する。
ここで、変換行列設定手段50は、式(11)で表される二乗誤差が最小となる変換行列を求める。
ここで、式(11)が原音響信号に依存するため、二乗誤差を算出する誤差関数を式(12)で定義する。そして、式(12)より、誤差関数が最小となる変換行列は、式(13)で表される。
さらに、受音領域に対する誤差関数として、式(14)を定義する。つまり、式(14)では、ある1点(受音点)を受音領域内で移動させながら誤差関数を求めていることになる。以上より、変換行列設定手段50は、式(15)を用いて、誤差関数が最小となる変換行列を設定する。そして、前記したように、音響信号変換手段30が、この変換行列に基づいて、原音響物理量信号を再生音響物理量信号に再変換する。
フーリエ逆変換手段60は、音響信号変換手段30が変換した再生音響物理量信号を、再生音響信号にフーリエ逆変換するものである。ここでは、フーリエ逆変換手段60は、式(3)及び式(4)に対してのフーリエ逆変換を行う。
記憶手段70は、原音響信号のチャンネルに対応する原スピーカの位置と、再生音響信号のチャンネルに対応する再生スピーカの位置とを記憶するスピーカ座標記憶手段71を備える。また、記憶手段70は、原音響信号のチャンネルに対応する原スピーカの数と、再生音響信号のチャンネルに対応する再生スピーカの数とを記憶するスピーカ数記憶手段72と、受音領域の形状、大きさ及び音場内での受音領域の位置を記憶する受音領域記憶手段73とを備えても良い。
ここで、原スピーカの位置及び再生スピーカの位置は、任意の方法で特定することができる。例えば、これらの位置は、空間内のある点を基準とした相対的な3次元座標としても良い。また、屋外のコンサート会場に適用する場合には、スピーカの位置をGPS測位し、その座標としても良い。
音響信号変換装置1は、原スピーカの位置、再生スピーカの位置、原スピーカの数、再生スピーカ、受音領域その他必要な情報を入力するためのキーボード、マウス等の入力手段を備えても良い(不図示)。また、音響信号変換装置1は、原スピーカの位置等の情報を表示するためのディスプレイ等の表示手段を備えても良い。
なお、フーリエ変換手段10、原音場ベクトル生成手段20、音響信号変換手段30、再生音場ベクトル生成手段40、変換行列設定手段50及びフーリエ逆変換手段60は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access Memory)で構成することができる。また、記憶手段70は、例えば、HDD(Hard Disk Drive)で構成することができる。
[領域分割の具体例]
以下、領域分割の具体例について、詳細に説明する(適宜図1参照)。図2は、本発明における領域分割を説明するために、スピーカが配置された平面を上面視した説明図である。図2では、原スピーカを白丸で示し、再生スピーカを黒丸で示した。また、図2では、原スピーカを符号ξ(1)〜ξ(4)で示し、再生スピーカを符号ζ(1)〜ζ(7)で示し、受音領域を符号Lで示し、分割領域を符号Rで示し、受音領域Lと原スピーカを結ぶ仮想線を一点鎖線で示した。また、分割領域Rは、ハッチングで示した。なお、図2において、受音領域Lは、利用者の頭部を含む範囲で設定している。
ここでは、音響信号変換装置1が10チャンネル(10個のスピーカ)に対応する原音響信号を領域分割し、7チャンネル(7個のスピーカ)に対応する再生音響信号に変換する例を示すが、説明のため、図2には、原スピーカのうち、4個のみを示した。
ここでは、変換行列設定手段50は、記憶手段70が記憶する再生スピーカの位置に基づいて、再生音場で隣接する再生スピーカに囲まれる分割領域Rを求める。ここでは、図2に示すように、分割領域Rは、再生スピーカζ(1)〜ζ(3)で囲まれる三角形状の範囲となる(再生音響信号q(ω)〜q(ω)に対応)。
また、変換行列設定手段50は、記憶手段70が記憶する原スピーカの位置に基づいて、受音領域Lまでの仮想線が分割領域Rを通過する原スピーカを判別する。ここでは、図2に示すように、4個の原生スピーカξ(1)〜ξ(4)の仮想線が分割領域Rを通過する(原生音響信号s(ω)〜s(ω)に対応)。
そして、変換行列設定手段50は、受音領域Lまでの仮想線が分割領域Rを通過する原スピーカについて、原スピーカに対応する原音響信号のチャンネルを、3個以上の再生スピーカに対応する再生音響信号のチャンネルに割り当てる変換行列を設定する。ここでは、変換行列設定手段50は、4個の原生スピーカξ(1)〜ξ(4)に対応する原音響信号のチャンネルを、3個の再生スピーカζ(1)〜ζ(3)に対応する再生音響信号のチャンネルに割り当てる変換行列を設定する。
このような領域分割は、式(16)で表される。式(16)において、変換行列の1行目が、原生音響信号s(ω)と再生音響信号q(ω)〜q(ω)との対応を示す要素w11,w21,w31以外を0となる。また、原生音響信号s(ω)〜s(ω)に対応する変換行列の2行目〜4行目についても、変換行列の1行目と同様である。そして、0以外の要素について、変換行列設定手段50は、二乗誤差を最小とする値を求め、変換行列を設定する。
以上のように、最適化問題を領域分割して局所的に扱うことで、原音場でのあるチャンネルの音が聞こえる方向と、再生音場でそのチャンネルの音が聞こえる方向とが全く異なる事態を防ぐことができる。
ここでは、3個の再生スピーカζ(1)〜ζ(3)で囲まれる分割領域Rについて説明したが、変換行列設定手段50は、他の再生スピーカで囲まれた分割領域に対して、前記した領域分割を行っても良い。さらに、変換行列設定手段50は、2個の再生スピーカに囲まれる分割領域又は4個以上の再生スピーカで囲まれる分割領域に対して、前記した領域分割を行っても良い。なお、2個の再生スピーカに囲まれる分割領域は、線状の領域となる。
[音響信号変換装置の動作]
以下、音響信号変換装置の動作について、説明する(適宜図1参照)。図3は、図1の音響信号変換装置の動作を示すフローチャートである。
音響信号変換装置1は、フーリエ変換手段10によって、入力された原音響信号を、原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換する(ステップS1)。また、音響信号変換装置1は、原音場ベクトル生成手段20によって、フーリエ変換手段10がフーリエ変換した原音響物理量信号に基づいて、原音場での音響物理量を成分とする原音場ベクトルを生成する(ステップS2)。
ステップS2に続き、音響信号変換装置1は、音響信号変換手段30によって、所定の変換行列に基づいて、フーリエ変換手段10がフーリエ変換した原音響物理量信号を、再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する(ステップS3)。ステップS3では、音響信号変換装置1は、音響信号変換手段30によって、初期値としての変換行列を用いて、原音響物理量信号を再生音響物理量信号に変換する。
ステップS3に続き、音響信号変換装置1は、再生音場ベクトル生成手段40によって、音響信号変換手段30が変換した再生音響物理量信号に基づいて、再生音場での音響物理量を成分とする再生音場ベクトルを生成する(ステップS4)。また、音響信号変換装置1は、変換行列設定手段50によって、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定する(ステップS5)。ステップS5において、音響信号変換装置1は、変換行列設定手段50によって、前記した領域分割を行っても良い。
そして、ステップS5で設定した変換行列に基づいて、音響信号変換装置1は、音響信号変換手段30によって、原音響物理量信号を再生音響物理量信号に再変換する(ステップS6)。また、音響信号変換装置1は、フーリエ逆変換手段60によって、音響信号変換手段30が再変換した再生音響物理量信号を、再生音響信号にフーリエ逆変換する(ステップS7)。
[音響信号の変換結果]
以下、音響信号変換装置による音響信号の変換結果について、従来技術と対比して説明する。図4は、22.2チャンネルの中間層における原音響信号の10チャンネル(スピーカと受音領域中心点又は受音点の距離が3m)を、5.1チャンネルサラウンドにおける再生音響信号の5チャンネル(スピーカと受音領域中心点又は受音点の距離が2m)に変換した場合の二乗誤差の上限を示すグラフ図であり、(a)は、従来技術における受音点で二乗誤差を最小とした場合のグラフであり、(b)は、本発明における受音領域で二乗誤差を最小とした最適化した場合のグラフである。また、図4では、縦軸は正規化した二乗誤差を示し、横軸がx−y平面内での位置を示す。
ここで、図4は、実験により得られた二乗誤差(式(12)参照)を正規化し、各受音点毎に示したものである。また、図4(a)では、x−y平面の原点を受音点に設定し、図4(b)では、x−y平面の原点を中心とする縦0.4m×横0.4mの受音領域を設定した。
図4(a)では、平面の原点(受音点)の二乗誤差が小さいが、受音点の周囲の二乗誤差が大きくなっている。つまり、1点を示す受音点で二乗誤差を最小とした場合では、受音点の周囲が、良好なリスニング環境になっていないと考えられる。一方、図4(b)では、平面の原点及びその周囲でも二乗誤差が小さい。つまり、本発明のように受音領域で二乗誤差を最小とした場合では、平面の原点及びその周囲を含め、良好なリスニング環境となっていると考えられる。
なお、各実施形態では、本発明に係る音響信号変換装置を独立した装置として説明したが、本発明では、一般的なコンピュータを、前記した各手段として機能させるプログラムによって動作させることもできる。このプログラムは、通信回線を介して配布しても良く、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布しても良い。
なお、各実施形態では、音響物理量として、音圧と粒子速度とを制御する例を説明したが、本発明に係る音響信号変換装置は、音響物理量として、音圧又は粒子速度の何れか一方を制御しても良く、音圧と粒子速度との積である瞬時音響インテンシティや、瞬時音響インテンシティの時間平均である音響インテンシティ等の音響物理量を制御しても良い。
本発明の実施形態に係る音響信号変換装置のブロック図である。 本発明における領域分割を説明するために、スピーカが配置された平面を上面視した説明図である。 図1の音響信号変換装置の動作を示すフローチャートである。 22.2チャンネルの中間層における原音響信号の10チャンネルを、5.1チャンネルサラウンドにおける再生音響信号の5チャンネルに変換した場合の二乗誤差の上限を示すグラフ図であり、(a)は、従来技術における受音点で二乗誤差を最小とした場合のグラフであり、(b)は、本発明における受音領域で二乗誤差を最小とした最適化した場合のグラフである。
符号の説明
1 音響信号変換装置
10 フーリエ変換手段
20 原音場ベクトル生成手段
30 音響信号変換手段
40 再生音場ベクトル生成手段
50 変換行列設定手段
60 フーリエ逆変換手段
70 記憶手段

Claims (5)

  1. 1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換装置であって、
    入力された前記原音響信号を、当該原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するフーリエ変換手段と、
    前記フーリエ変換手段がフーリエ変換した原音響物理量信号に基づいて、前記原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成手段と、
    前記フーリエ変換手段がフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、前記再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する音響信号変換手段と、
    前記音響信号変換手段が変換した再生音響物理量信号に基づいて、前記再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成手段と、
    所定の受音領域において、前記原音場ベクトルと前記再生音場ベクトルとの二乗誤差が最小となる前記変換行列を設定する変換行列設定手段と、
    前記音響信号変換手段が変換した再生音響物理量信号を、前記再生音響信号にフーリエ逆変換するフーリエ逆変換手段と、を備え、
    前記音響信号変換手段は、前記変換行列設定手段が設定した変換行列に基づいて、前記原音響物理量信号を前記再生音響物理量信号に再変換することを特徴とする音響信号変換装置。
  2. 前記原音響信号のチャンネルに対応する原スピーカの位置と、前記再生音響信号のチャンネルに対応する再生スピーカの位置とを記憶する記憶手段、をさらに備え、
    前記変換行列設定手段は、
    前記記憶手段が記憶する原スピーカの位置と再生スピーカの位置とに基づいて、前記再生音場で隣接する2個以上の前記再生スピーカに囲まれる分割領域を求め、前記受音領域までの仮想線が当該分割領域を通過する前記原スピーカについて、当該原スピーカに対応する前記原音響信号のチャンネルを、前記2個以上の再生スピーカに対応する前記再生音響信号のチャンネルに割り当てる前記変換行列を設定することを特徴とする請求項1に記載の音響信号変換装置。
  3. 前記フーリエ変換手段は、前記原音響信号を、前記原音場での音響物理量として、スカラー量である前記原音場での音圧と3次元ベクトル量である前記原音場での粒子速度とを含む前記原音響物理量信号にフーリエ変換し、
    前記原音場ベクトル生成手段は、前記原音場での音圧と前記原音場での粒子速度とを成分とする4次元ベクトルである前記原音場ベクトルを生成し、
    前記音響信号変換手段は、前記原音響物理量信号を、前記再生音場での音響物理量として、スカラー量である前記再生音場での音圧と3次元ベクトル量である前記再生音場での粒子速度とを含む前記再生音響物理量信号に変換し、
    前記再生音場ベクトル生成手段は、前記再生音場での音圧と前記再生音場での粒子速度とを成分とする4次元ベクトルである前記再生音場ベクトルを生成することを特徴とする請求項1又は2に記載の音響信号変換装置。
  4. 1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換方法であって、
    入力された前記原音響信号を、当該原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するフーリエ変換ステップと、
    前記フーリエ変換ステップでフーリエ変換した原音響物理量信号に基づいて、前記原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成ステップと、
    前記フーリエ変換ステップでフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、前記再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する音響信号変換ステップと、
    前記音響信号変換ステップで変換した再生音響物理量信号に基づいて、前記再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成ステップと、
    所定の受音領域において、前記原音場ベクトルと前記再生音場ベクトルとの二乗誤差が最小となる前記変換行列を設定する変換行列設定ステップと、
    前記変換行列設定ステップで設定した変換行列に基づいて、前記原音響物理量信号を前記再生音響物理量信号に再変換する音響信号再変換ステップと、
    前記音響信号変換ステップで再変換した再生音響物理量信号を、前記再生音響信号にフーリエ逆変換するフーリエ逆変換ステップと、
    を備えることを特徴とする音響信号変換方法。
  5. 1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換するために、コンピュータを、
    入力された前記原音響信号を、当該原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するフーリエ変換手段、
    前記フーリエ変換手段がフーリエ変換した原音響物理量信号に基づいて、前記原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成手段、
    前記フーリエ変換手段がフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、前記再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する音響信号変換手段、
    前記音響信号変換手段が変換した再生音響物理量信号に基づいて、前記再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成手段、
    所定の受音領域において、前記原音場ベクトルと前記再生音場ベクトルとの二乗誤差が最小となる前記変換行列を設定する変換行列設定手段、
    前記音響信号変換手段が変換した再生音響物理量信号を、前記再生音響信号にフーリエ逆変換するフーリエ逆変換手段、として機能させ、
    前記音響信号変換手段は、前記変換行列設定手段が設定した変換行列に基づいて、前記原音響物理量信号を前記再生音響物理量信号に再変換することを特徴とする音響信号変換プログラム。
JP2008057331A 2008-03-07 2008-03-07 音響信号変換装置、その方法及びそのプログラム Active JP4922211B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008057331A JP4922211B2 (ja) 2008-03-07 2008-03-07 音響信号変換装置、その方法及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008057331A JP4922211B2 (ja) 2008-03-07 2008-03-07 音響信号変換装置、その方法及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2009218655A true JP2009218655A (ja) 2009-09-24
JP4922211B2 JP4922211B2 (ja) 2012-04-25

Family

ID=41190139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008057331A Active JP4922211B2 (ja) 2008-03-07 2008-03-07 音響信号変換装置、その方法及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4922211B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011221362A (ja) * 2010-04-12 2011-11-04 Alpine Electronics Inc 音場制御装置および音場制御方法
WO2012032845A1 (ja) * 2010-09-07 2012-03-15 シャープ株式会社 音声信号変換装置、方法、プログラム、及び記録媒体
CN102823277A (zh) * 2010-03-26 2012-12-12 汤姆森特许公司 解码用于音频回放的音频声场表示的方法和装置
CN102984642A (zh) * 2012-12-18 2013-03-20 武汉大学 一种五个扬声器的三维平移方法
CN107222824A (zh) * 2012-03-28 2017-09-29 杜比国际公司 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08130793A (ja) * 1994-11-01 1996-05-21 Mitsubishi Electric Corp 音響再生装置
JP2006295592A (ja) * 2005-04-12 2006-10-26 Nippon Hoso Kyokai <Nhk> スピーカ装置
JP2007053624A (ja) * 2005-08-18 2007-03-01 Nippon Hoso Kyokai <Nhk> ダウンミックス装置およびダウンミックスプログラム
JP2007104060A (ja) * 2005-09-30 2007-04-19 Matsushita Electric Ind Co Ltd 音声の指向性制御機能を有するテレビジョン受信機システム
JP2007194900A (ja) * 2006-01-19 2007-08-02 Nippon Hoso Kyokai <Nhk> 3次元パンニング装置
JP2007329746A (ja) * 2006-06-08 2007-12-20 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置
JP2008017117A (ja) * 2006-07-05 2008-01-24 Nippon Hoso Kyokai <Nhk> 音像形成装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08130793A (ja) * 1994-11-01 1996-05-21 Mitsubishi Electric Corp 音響再生装置
JP2006295592A (ja) * 2005-04-12 2006-10-26 Nippon Hoso Kyokai <Nhk> スピーカ装置
JP2007053624A (ja) * 2005-08-18 2007-03-01 Nippon Hoso Kyokai <Nhk> ダウンミックス装置およびダウンミックスプログラム
JP2007104060A (ja) * 2005-09-30 2007-04-19 Matsushita Electric Ind Co Ltd 音声の指向性制御機能を有するテレビジョン受信機システム
JP2007194900A (ja) * 2006-01-19 2007-08-02 Nippon Hoso Kyokai <Nhk> 3次元パンニング装置
JP2007329746A (ja) * 2006-06-08 2007-12-20 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置
JP2008017117A (ja) * 2006-07-05 2008-01-24 Nippon Hoso Kyokai <Nhk> 音像形成装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9100768B2 (en) 2010-03-26 2015-08-04 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
KR101755531B1 (ko) 2010-03-26 2017-07-07 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
CN102823277A (zh) * 2010-03-26 2012-12-12 汤姆森特许公司 解码用于音频回放的音频声场表示的方法和装置
US11948583B2 (en) 2010-03-26 2024-04-02 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation
JP2013524564A (ja) * 2010-03-26 2013-06-17 トムソン ライセンシング オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置
JP2014161122A (ja) * 2010-03-26 2014-09-04 Thomson Licensing オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置
US10522159B2 (en) 2010-03-26 2019-12-31 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation
US9460726B2 (en) 2010-03-26 2016-10-04 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation for audio playback
US10629211B2 (en) 2010-03-26 2020-04-21 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation
US9767813B2 (en) 2010-03-26 2017-09-19 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation for audio playback
US11217258B2 (en) 2010-03-26 2022-01-04 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation
US10037762B2 (en) 2010-03-26 2018-07-31 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation
US10134405B2 (en) 2010-03-26 2018-11-20 Dolby Laboratories Licensing Corporation Method and device for decoding an audio soundfield representation
JP2011221362A (ja) * 2010-04-12 2011-11-04 Alpine Electronics Inc 音場制御装置および音場制御方法
WO2012032845A1 (ja) * 2010-09-07 2012-03-15 シャープ株式会社 音声信号変換装置、方法、プログラム、及び記録媒体
CN107222824A (zh) * 2012-03-28 2017-09-29 杜比国际公司 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置
CN107222824B (zh) * 2012-03-28 2020-02-21 杜比国际公司 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置
US11172317B2 (en) 2012-03-28 2021-11-09 Dolby International Ab Method and apparatus for decoding stereo loudspeaker signals from a higher-order ambisonics audio signal
US10433090B2 (en) 2012-03-28 2019-10-01 Dolby International Ab Method and apparatus for decoding stereo loudspeaker signals from a higher-order ambisonics audio signal
CN102984642A (zh) * 2012-12-18 2013-03-20 武汉大学 一种五个扬声器的三维平移方法

Also Published As

Publication number Publication date
JP4922211B2 (ja) 2012-04-25

Similar Documents

Publication Publication Date Title
JP7367785B2 (ja) 音声処理装置および方法、並びにプログラム
CN108370487B (zh) 声音处理设备、方法和程序
WO2018008395A1 (ja) 音場形成装置および方法、並びにプログラム
JP5826996B2 (ja) 音響信号変換装置およびそのプログラム、ならびに、3次元音響パンニング装置およびそのプログラム
EP3026936B1 (en) Information processing device and method, and program
JP4922211B2 (ja) 音響信号変換装置、その方法及びそのプログラム
JP2010252220A (ja) 3次元音響パンニング装置およびそのプログラム
JP6663490B2 (ja) スピーカシステム、音声信号レンダリング装置およびプログラム
JP5010148B2 (ja) 3次元パンニング装置
JP6834985B2 (ja) 音声処理装置および方法、並びにプログラム
CN108476365B (zh) 音频处理装置和方法以及存储介质
WO2017119321A1 (ja) 音声処理装置および方法、並びにプログラム
Braasch A loudspeaker-based 3D sound projection using Virtual Microphone Control (ViMiC)
JP2018120007A (ja) 音声信号変換装置、その方法、及びプログラム
US20240056758A1 (en) Systems and Methods for Rendering Spatial Audio Using Spatialization Shaders
JP2019146086A (ja) 音響処理装置及びプログラム
JP2020522189A (ja) インコヒーレント冪等アンビソニックスレンダリング
WO2018211984A1 (ja) スピーカアレイ、および信号処理装置
JPWO2020100670A1 (ja) 信号処理装置および方法、並びにプログラム
JP2022111723A (ja) 音響用座標変換装置及びプログラム
Sladeczek et al. Object-Based Audio as Platform Technology in Vehicles
CN116193196A (zh) 虚拟环绕声渲染方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120203

R150 Certificate of patent or registration of utility model

Ref document number: 4922211

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250