JP2011002574A - 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム - Google Patents

3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム Download PDF

Info

Publication number
JP2011002574A
JP2011002574A JP2009144450A JP2009144450A JP2011002574A JP 2011002574 A JP2011002574 A JP 2011002574A JP 2009144450 A JP2009144450 A JP 2009144450A JP 2009144450 A JP2009144450 A JP 2009144450A JP 2011002574 A JP2011002574 A JP 2011002574A
Authority
JP
Japan
Prior art keywords
signal
dimensional
sound
basic
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009144450A
Other languages
English (en)
Inventor
Akio Ando
彰男 安藤
Yasushige Nakayama
靖茂 中山
Kaoru Watanabe
馨 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2009144450A priority Critical patent/JP2011002574A/ja
Publication of JP2011002574A publication Critical patent/JP2011002574A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】元の音質及び音の空間的印象を保ち、かつ所用ビットレートも抑制することのできる、3次元音響符号化装置、3次元音響復号装置及びプログラムを提供する。
【解決手段】3次元音響システムの信号を、3次元音響システムのチャネル数をダウンミックスした仮想音響システムの信号に割り当てるための重み係数を算出する重み係数算出部と103、前記仮想音響システムの信号を表す基本信号を、前記3次元音響システムの信号及び前記重み係数から算出する基本信号算出部104と、前記基本信号とともに線形演算によって前記3次元音響システムの信号を再現する補助信号を、前記3次元音響システムの信号及び前記重み係数から算出する補助信号算出部105と、基本信号及び補助信号を符号化する符号化部106と備える。
【選択図】図1

Description

本発明は、多数のチャネルによって構成される3次元音響システムの信号を符号化する符号化装置・符号化プログラム、3次元音響信号を復号する復号装置・復号プログラムに関する。
従来、音響信号の符号化方式として、低ビットレートの符号化では、MP3に基づく方式が知られている。これらは、元の信号を2chにダウンミックスした信号と、ダウンミックス信号から元の信号を復元するためのパラメータを備えたパラメトリックな符号化方式である。
また、CD(コンパクトディスク)の品質を保ったまま符号化する方式として、AAC(Adovanced Audio Coding)方式が知られている。2011年からの高度BS放送では、22.2チャネル音響を符号化・伝送するために、既存のAAC符号化を用いる方式が標準化される予定である。さらに、AAC方式を改良し、絶対可聴閾値の設定を可変とする技法が知られている(例えば、特許文献1参照)。
特開2001−343997号公報
しかし、MP3に基づく方式は、3次元音響を2chにダウンミックスした時点で、音の空間印象が劣化するだけでなく、パラメトリック方式の特徴として、伝送レートは圧縮できるが音質も劣化するという問題があった。
また、AAC方式に基づく方式は、従来の2次元オーディオ符号化に基づくものであるため、22.2チャネル音響のような3次元音響を符号化する場合には、高い圧縮率を実現することができないという問題があった。
本発明の目的は、上記問題を解決するため、元の音質だけでなく、元の音の空間的印象も保ちながら、かつ所用ビットレートも抑制することのできる、新たな3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラムを提供することにある。
上記課題を解決するため、本発明に係る3次元音響符号化装置は、多数のチャネルによって構成される3次元音響システムの各チャネル信号を符号化する3次元音響符号化装置であって、3次元音響システムの各チャネル信号について、前記3次元音響システムのチャネル数を所定の受音点を基準にして少ないチャネル数の仮想音響システムに変換して符号化する際に、該仮想音響システムの各チャネルに対応する信号を基本信号とし、前記基本信号から3次元音響システムの各チャネル信号への復元を補助する信号を補助信号とし、前記基本信号及び前記補助信号に用いる重み付けの情報を重み係数として規定しており、前記3次元音響システムの各チャネル信号を入力する手段と、前記仮想音響システムの各チャネルに近傍する前記3次元音響システムの各チャネルから選定された複数のチャネル信号を前記重み係数に従ってダウンミックスして、前記基本信号の各々を生成する手段と、復号側で解凍すべき、前記3次元音響システムのチャネル数に相当する数の独立した方程式を構成するように、前記基本信号とは別に前記3次元音響システムのチャネル数と前記基本信号の数との差に相当する数の前記補助信号を生成する手段と、前記基本信号及び前記補助信号を符号化する符号化手段とを備え、復号側で前記重み係数、前記基本信号及び前記補助信号から前記3次元音響システムを復元できるようにしたことを特徴とする。
また、本発明に係る3次元音響符号化装置において、前記受音点における前記3次元音響システムの音響インテンシティ及び音圧、並びに前記受音点における前記仮想システムの音響インテンシティ及び音圧が一致するように、前記重み係数を決定する重み係数算出手段を備えることを特徴とする。
また、本発明に係る3次元音響符号化装置において、前記符号化手段は、前記基本信号及び前記補助信号の各符号化ビット割り当てについて、前記基本信号に割り当てる割当て量を高くして符号化することを特徴とする。
さらに、上記課題を解決するため、本発明に係る3次元音響復号装置は、請求項1に記載された符号化装置によって符号化された前記基本信号及び前記補助信号を復号する復号手段と、前記復号手段によって復号した前記基本信号及び前記補助信号並びに前記重み係数から前記3次元音響システムの各チャネル信号を、前記方程式を解凍して復元する信号復元手段と、を備えることを特徴とする。
さらに、上述の課題を解決するために、本発明は請求項1に記載の3次元音響符号化装置として構成するコンピュータに、(a)前記3次元音響システムの各チャネル信号を入力するステップと、(b)前記仮想音響システムの各チャネルに近傍する前記3次元音響システムの各チャネルから選定された複数のチャネル信号を前記重み係数に従ってダウンミックスして、前記基本信号の各々を生成するステップと、(c)復号側で解凍すべき、前記3次元音響システムのチャネル数に相当する数の独立した方程式を構成するように、前記基本信号とは別に前記3次元音響システムのチャネル数と前記基本信号の数との差に相当する数の前記補助信号を生成するステップと、(d)前記基本信号及び前記補助信号を符号化するステップと、を実行させるためのプログラムとしても特徴付けられる。
また、上述の課題を解決するために、本発明は、請求項4に記載の3次元音響復号装置として構成するコンピュータに、(a)請求項1に記載された符号化装置によって符号化された前記基本信号及び前記補助信号を復号するステップと、(b)前記復号手段によって復号した前記基本信号及び前記補助信号並びに前記重み係数から前記3次元音響システムの各チャネル信号を、前記方程式を解凍して復元するステップと、を実行させるためのプログラムとしても特徴付けられる。
本発明によれば、3次元音響信号を、基本信号と補助信号とに分離し、基本信号のみでも受音点での音響物理量を再現できるため、補助信号に対するビットレートを削減することにより、元の音質だけでなく、元の音の空間的印象も保ちながら、かつ所用ビットレートも抑制して伝送することができるようになる。
本発明による一実施例の3次元音響符号化装置の構成図である。 本発明による一実施例の3次元音響復号装置の構成図である。 本発明による一実施例の3次元音響システムをダウンミックスした仮想音響システムのスピーカ配置例を示す図である。 本発明による一実施例の、3次元音響システム信号の仮想音響システム信号への割り当てを説明する図である。 本発明による一実施例の3次元音響符号化装置の動作を示すフローチャートである。 本発明による一実施例の3次元音響復号装置の動作を示すフローチャートである。 本発明による3次元音響符号化装置及び3次元音響復号装置を用いたシステムの概略図である。
ある方向から到来する音は、音圧や粒子速度などの音響物理量で表される。これらの物理量のうち、音響インテンシティは、単位面積を通過する音響エネルギーと、その方向性を表すベクトル量として知られており、音源方向の推定などの分野で、その有効性が示されている。
3次元音響システムで音を再生した場合に対して、受聴点(受音点)で観測した音響インテンシティや音圧を等しく保ちつつ、チャネル数を減らすことができれば、チャネル数を減らしたことによる音の空間的印象の劣化を抑えることができる。しかし、このようにしてチャネル数を減らしても、チャネル数を減らす段階で設定した受聴点とはずれた位置で、再生音を聴いた場合には、その音の空間的な印象が劣化してしまう。そこで、3次元音響信号を高品質に伝送する場合には、特定の受聴点で音響インテンシティなどの音響物理量を一定に保ちながら少ないチャネル数に変換した信号(以下、「基本信号」という)の他に、再生時に空間的印象を再現するための信号(以下、「補助信号」という)が必要となる。
本発明は、このように、3次元音響信号を、基本信号と補助信号とに分けて伝送することを特徴とする方式である。また、3次元音響信号を上記のような基本信号と補助信号とに分けることができれば、符号化(量子化)する際に、基本信号に重点的にビットを割り当て、補助信号への割り当てを少なくすることにより、元の音の空間的印象を保ったままビットレートを圧縮することが可能となる。
以下、本発明について、図面を参照して詳細に説明する。まず、本発明の3次元音響符号化装置及び3次元音響復号装置について説明する。
[3次元音響符号化装置及び3次元音響復号装置の構成]
図7は、本発明の3次元音響符号化装置及び3次元音響復号装置を用いたシステムの概略図である。本システムは3次元音響符号化装置10と、送信装置11と、受信装置12と、3次元音響復号装置13とを備える。3次元音響符号化装置10は、3次元音響信号の符号化処理を行い、送信装置11に出力する。送信装置11は、3次元音響符号化装置10から出力される信号を変調し、受信装置12に送信する。受信装置12は、送信装置11から送信される信号を受信して復調し、3次元音響復号装置13に出力する。3次元音響復号装置13は、受信装置12から出力される信号の復号処理を行う。
図1は、本発明の3次元音響符号化装置10の構成図である。3次元音響符号化装置10は、音響信号入力部101と、スピーカ位置情報記憶部102と、重み係数算出部103と、基本信号算出部104と、補助信号算出部105と、符号化部106と、多重化部107とを備える。
音響信号入力部101は、入力される元の3次元音響システムの各スピーカからの音響信号をA/D変換し、デジタル形式の音響信号を基本信号算出部104に出力する。
スピーカ位置情報記憶部102は、3次元音響システムの各スピーカの極座標における位置情報ξ=(σ,θ,φ)が予め記憶される。また、3次元音響システムのチャネル数をより少ないチャネル数にダウンミックスした時の3次元音響システム(以下、「仮想音響システム」という)の各スピーカの極座標における位置情報
Figure 2011002574
j=1,…,m、も予め記憶される。
重み係数算出部103は、スピーカ位置情報記憶部102に記憶されたスピーカ位置情報に基づいて、基本信号及び補助信号に用いられる重み係数を算出し、基本信号算出部104に出力する。重み係数は、後述するように、3次元音響システムと仮想音響システムの音響インテンシティ及び音圧が等しくなるように定められる。
基本信号算出部104は、音響信号入力部101から出力される音響信号、及び重み係数算出部102から出力される重み係数から、基本信号の演算式に基づいて基本信号を算出し、補助信号算出部105及び符号化部106に出力する。基本信号の演算式については後述する。
補助信号算出部105は、音響信号入力部101から出力される音響信号、及び重み係数算出部102から出力される重み係数から、補助信号の演算式に基づいて補助信号を算出し、符号化部106に出力する。補助信号の演算式については後述する。
符号化部106は、基本信号算出部104で算出した基本信号、及び補助信号算出部105で算出した補助信号を量子化し、符号化する。符号化(量子化)する際には、基本信号にはビット数を多く、補助信号にはビット数を少なく割り当てる。なお、重み係数については、変数ではなく情報量が多くないため、符号化しなくてもよい。
多重化部107は、符号化部106で符号化した基本信号及び補助信号を多重化し、送信装置11に出力する。なお、重み係数を多重化せずに予め伝送することや、基本信号及び補助信号の多重化処理を行わずに伝送することも可能である。
図2は、本発明の3次元音響復号装置13の構成図である。3次元音響復号装置13は、逆多重化部131と復号部132と信号復元部133とを備える。
逆多重化部131は、受信装置12から出力される多重化信号を逆多重化し、基本信号及び補助信号を復号部132に出力する。なお、受信装置12から出力される信号が多重化されていない場合には、逆多重化処理は不要である。
復号部132は、逆多重化部131から出力される基本信号及び補助信号についてそれぞれ復号処理をし、信号復元部133に出力する。
信号復元部133は、復号部132から出力される基本信号及び補助信号並びに重み係数から、3次元音響システムの音響信号s(t)を算出する。
次に、重み係数算出部102における、重み係数の算出方法について説明する。
[重み係数算出方法]
響きを無視できる空間では、位置ξ=(ξx ξy ξz上にある音源による、受音点r=(xyz)上の音圧のフーリエ変換p(r,ω)は、音源信号(音響信号)をs(t)とすると、式(1)で与えられる。ここに、Tはベクトル又は行列の転置を表す。
Figure 2011002574
ここに、s(ω)はs(t)のフーリエ変換、k=2π/λは、位相定数、波長定数、波数などと呼ばれる係数、λは音波の波長、Gは音源から単位距離の点での音圧と音源入力との比を表す定数である。
また、同じ点における音の粒子速度のフーリエ変換u(r,ω)は、式(2)で表される。
Figure 2011002574
このとき、受音点rにおける時間平均音響インテンシティ(以下、単に「音響インテンシティ」という)は、式(3)で表される。音響インテンシティは、単位面積を通過する音のパワーの1周期にわたる平均を表す量である。
Figure 2011002574
今、受音点rを原点とする極座標を利用し、音源位置ξの座標を(σ,θ,φ)とする。但し、σは原点からの距離、θは方位角、φは仰角である。このとき、式(3)は、式(4)表される。
Figure 2011002574
従って、3次元音響システムを構成するスピーカの中から、1つを選んで、この位置をξとすると、式(4)は、このスピーカに、対応するチャネルの信号s(t)を入力したときに、受音点で観測される音響インテンシティを表すこととなる。
次に、3次元音響システムの信号を、受音点での音響インテンシティを保ちながら、より少ないチャネル数の仮想音響システムに変換する方法について述べる。仮想音響システムのスピーカの数をm個、スピーカの設置位置の極座標を
Figure 2011002574
j=1,…,m、スピーカの入力信号をqj(t)、j=1,…,mとする。このとき、仮想音響システムのスピーカから3個のスピーカを選び、これらのスピーカの再生音によって、3次元音響システムのあるチャネルの音を再現する場合を考える。この場合の受音点における音響インテンシティは、式(5)で表される。
Figure 2011002574
ここで、仮想音響システムのスピーカ入力信号q(t)が、3次元音響システムのあるチャネルの音源信号(音響信号)s(t)と重み係数wとによって、式(6)で表されるとする。
Figure 2011002574
すると、式(6)は、式(7)に変形される。
Figure 2011002574
従って、もし、式(4)と式(7)の音響インテンシティが等しい場合には、3個のスピーカによって、3次元音響システムのスピーカ位置ξに、そのスピーカに対応するチャネル信号s(t)の音像を定位させることが可能となる。本発明の実施例は、このような原理に基づいて、重み係数wを求めることにより、少ないチャネル数への変換を行うものである。
今、式(4)と式(7)の右辺を等しいとおくと、次式を得る。
Figure 2011002574
この式は、w1,w2,w3に関する2次の連立方程式であるため、このままでは解くことができない。そこで、それぞれの第1、2成分を、第3成分で除すことにより、式(9)を得る。
Figure 2011002574
さらに、拘束条件として、式(10)で表わされる受音点における音圧の一致を加える。
Figure 2011002574
式(10)から、式(11)の条件式が得られる。
Figure 2011002574
式(9)及び式(11)より、式(12)で表される線形連立方程式を得る。
Figure 2011002574
ここに、
Figure 2011002574
である。式(12)の解は、式(13)で表される。
Figure 2011002574
式(13)によって求められる重み係数w〜wを用いることにより、3次元音響システムの1つのチャネル信号を、仮想音響システムの3個のスピーカによって形成することができるようになる。
次に、3次元音響システムの1つのチャネル信号を、仮想音響システムの4個のスピーカによって形成する方法について説明する。4個のスピーカを用いる場合、受音点における音響インテンシティは、式(7)と同様に、式(14)で与えられる。
Figure 2011002574
式(14)と式(4)が一致する条件から、式(9)と同様な式(15)を得る。
Figure 2011002574
これに、式(16)の音圧一致条件を加えても、まだ拘束条件が不足している。
Figure 2011002574
そこで、4番目のスピーカの利得を調整するための制御パラメータ(パンニング重み)gを導入する。この結果、次の連立方程式(17)を得る。
Figure 2011002574
ここに、
Figure 2011002574
である。式(17)の解は、式(18)で与えられる。
Figure 2011002574
式(18)によって求められる重み係数w1〜w4を用いることにより、3次元音響システムの1つのチャネル信号を、4個のスピーカによって形成することができるようになる。
さらに、複数のパンニング重みを導入することにより、5個以上のスピーカで仮想音像を形成することができる。例えば、5個のスピーカを用いる場合には、2つの重みパラメータg,gが必要であり、このときの式(12)、式(17)に対応する方程式は、式(19)で表される。
Figure 2011002574
式(19)を解けば、5個のスピーカに対するパンニング重みが得られる。
次に、基本信号算出部104によって、基本信号を算出する方法について説明する。
[基本信号算出方法]
上述の方法により、3次元音響システムのあるチャネル信号を、仮想音響システムの複数のチャネル信号に変換することができる。この方法を、3次元音響システムの各チャネル信号に適用し、得られた結果を重ね合わせることによって、3次元音響システムの信号を、仮想音響システムの基本信号に変換することができるようになる。基本信号は、上記算出例から分かるように、受音点における音響インテンシティと音圧の情報を保持している。
また、3次元音響システムの各チャネル信号を変換する際に、3次元音響システムの信号を、3次元音響システムのスピーカを囲む仮想音響システムのスピーカに対応するチャネルに分配する場合には、音の方向性が保たれたまま変換されるため、空間的印象を損なうことがない。
以下、一例として、3次元音響システムの22.2ch信号を8ch信号に変換し、仮想音響システムの8chのスピーカから出力される信号を基本信号とする場合について説明する。なお、0.2chとして表現される2つのLFE(Low Frequency Effect)チャネルについては、三次元音響ではないため、0.2chを除く22chを8chに変換するものとする。
図3は、22チャネル音響信号のスピーカ位置と、これを8つのスピーカで再現する場合のスピーカ位置を示す図である。横軸は水平角、縦軸は仰角である。水平角は、受音位置から見て右側を原点とし、反時計方向に角度を示している。図中の白丸は22chのスピーカ位置、黒丸は変換後の8chシステムのスピーカ位置、二重丸は変換前後のスピーカ位置が重なっている位置を示す。上述した重み係数を用いて、3次元音響システムの22チャネル(ch1〜ch22)の各信号を、仮想音響システムの8チャネル(nch1〜nch8)の複数の信号に近似的に割り当てることができる。
3次元音響システムの各チャネル信号は、3次元音響システムのチャネルに近傍する仮想音響システムの複数のチャネルに割り当てる。例えば、図4(a)に示すように、仮想音響システムのch_a,ch_b,ch_cのスピーカの極座標位置をζa、ζb、ζcとしたとき、原点Oからζa、ζb、ζc方向にそれぞれ伸ばした線によって分けられた空間内の位置ξnに、3次元音響システムのch_nのスピーカが位置するとき、ch_nの信号を、ch_a,ch_b,ch_cの信号に割り当てることができる。また、図4(b)に示すように、同一平面上に、仮想音響システムのch_a,ch_bのスピーカと3次元音響システムのch_nのスピーカとが位置し、原点Oからζa、ζb方向にそれぞれ伸ばした線によって分けられた平面内にch_nのスピーカが位置するとき、ch_nの信号を、ch_a,ch_bの信号に割り当てることができる。また、3次元音響システムのch_nのスピーカ位置と同じ位置に、仮想音響システムのch_aのスピーカが配置される場合には、ch_nの信号を、ch_aの信号に割り当てる。
このようにして、3次元音響システムのch_i(1≦i≦22)の信号を仮想音響システムのch_j(1≦j≦8)の信号に割り当てることができる。この例を、[表1]に示す。表1の左の列に、3次元音響システムの各チャネルを示す。表1の中央の列は、左の列に示された3次元音響システムのチャネルに近傍する仮想音響システムのチャネルであり、3次元音響システムのチャネル信号が重み係数に従って割り当てられる。表1の右の列は、3次元音響システムの各チャネルを仮想音響システムの各チャネルに割り当てる際に用いられる重み係数の値である。ここで、wj,iはch_iをch_jに割り当てる際の重み係数を表す。
Figure 2011002574
今、3次元音響システムの22ch信号をs1(t)〜s22(t)、基本信号をb1(t)〜b8(t)とすると、式(20)が得られる。
Figure 2011002574
次に、補助信号算出部14によって、補助信号a(t)を算出する方法について説明する。
基本信号b(t)及び補助信号a(t)に関する式から3次元音響システムの信号を算出することができるようにするためには、基本信号数と補助信号数の合計を、3次元音響システムの信号数と等しくする必要がある。実施例では、3次元音響システムの信号数が22で、基本信号数が8なので、補助信号として、基本信号と異なる信号が14個必要となる。そして、線形演算によって、元の3次元信号が復元できるように、例えば、式(21)に示す補助信号を採用する。重み係数wj,iは、基本信号で用いた重み係数と同じものが用いられる。
Figure 2011002574
式(20)、式(21)より、式の数が、3次元音響システムの信号数と等しいため、重み係数wj,iの情報を用いれば、式(20)、式(21)を連立することにより、元信号s1(t)〜s22(t)を算出することができる。従って、重み係数wj,i、基本信号b1(t)〜b8(t)及び補助信号a1(t)〜a14(t)を伝送することで、元信号s1(t)〜s22(t)を復元することができる。なお、係数wj,iは予め3次元音響復号装置13に伝送しておいてもよい。
また、基本信号b(t)のみで、受音点における音響インテンシティ及び音圧は復元されているので、補助信号a(t)に対するビット割り当てを少なくすることにより、効率的な符号化を実現することができるようになる。例えば、2011年からの高度BS放送で採用される予定のAAC符号化方式ではビットレートは約2Mbpsであるが、本符号化装置を用いれば、音質を同程度に保ったまま、基本信号のビットレートを約2/3Mbps、補助信号のビットレートを約1/3Mbpsに低減することができる。
次に、本発明の3次元音響符号化装置10及び3次元音響復号装置13の動作について説明する。
[3次元音響符号化装置及び3次元音響復号装置の動作]
図5は、3次元音響符号化装置10の動作を示すフローチャートである。ステップS501にて、スピーカ位置情報記憶部102は、3次元音響システムの各スピーカの極座標における位置情報と、仮想音響システムの各スピーカの極座標における位置情報とが予め記憶される。
ステップS502にて、重み係数算出部103は、スピーカ位置情報記憶部102に記憶されたスピーカ位置情報に基づいて、重み係数を算出する。重み係数は音響信号の入力前に決定される。また、基本信号を算出するための演算式、及び補助信号を算出するための演算式も、音響信号の入力前に決定される。
ステップS503にて、音響信号入力部101は、入力される3次元音響システムの各スピーカからの音響信号をA/D変換する。
ステップS504にて、基本信号算出部104は、ステップS503で得たデジタル形式の音響信号、及びステップS501で算出される重み係数から、基本信号の演算式に基づいて基本信号を算出する。
ステップS505にて、補助信号算出部105は、ステップS503で得たデジタル形式の音響信号、及びステップS501で算出される重み係数から、補助信号の演算式に基づいて補助信号を算出する。
ステップS506にて、符号化部106は、ステップS505で算出した基本信号、及びステップS505で算出した補助信号を符号化する。
ステップS507にて、多重化部107は、ステップS506で符号化した基本信号及び補助信号を多重化し、送信装置11に出力する。
図6は、3次元音響復号装置13の動作を示すフローチャートである。ステップS501にて、逆多重化部131は、受信装置12から出力される多重化信号を逆多重化し、基本信号及び補助信号を抽出する。
ステップS602にて、復号部132は、ステップS601で逆多重化した基本信号及び補助信号について復号処理をする。
ステップS603にて、信号復元部133は、ステップS602で復号処理した基本信号及び補助信号、並びに重み係数から、3次元音響システムの音響信号s(t)を算出する。
ここで、3次元音響符号化装置10として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、音響信号入力部101と、スピーカ位置情報記憶部102と、重み係数算出部103と、基本信号算出部104と、補助信号算出部105と、符号化部106と、多重化部107とを機能させるための制御部を中央演算処理装置(CPU)と、少なくとも1つのメモリで構成される記憶部で実現できる。
また、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、音響信号入力部101と、スピーカ位置情報記憶部102と、重み係数算出部103と、基本信号算出部104と、補助信号算出部105と、符号化部106と、多重化部107の有する機能を実現させることができる。更に、音響信号入力部101と、スピーカ位置情報記憶部102と、重み係数算出部103と、基本信号算出部104と、補助信号算出部105と、符号化部106と、多重化部107の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納することができる。そのような記憶部は、コンピュータ内部のRAMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、3次元音響符号化装置10としてのコンピュータで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。
さらに、3次元音響符号化装置10として機能させるコンピュータを、本発明の各構成要素としての手段として機能させるためのプログラムは、コンピュータ読取り可能な記録媒体に記録することができる。
同様に、3次元音響復号装置13として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、逆多重化部131と復号部132と信号復元部133とを機能させるための制御部を中央演算処理装置(CPU)と、少なくとも1つのメモリで構成される記憶部で実現できる。
また、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、逆多重化部131と復号部132と信号復元部133の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納することができる。そのような記憶部は、コンピュータ内部のRAMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、3次元音響復号装置13としてのコンピュータで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。
さらに、3次元音響復号装置13として機能させるコンピュータを、本発明の各構成要素としての手段として機能させるためのプログラムは、コンピュータ読取り可能な記録媒体に記録することができる。
上述の実施例は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。従って、本発明は上述の実施例によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、図3に示すダウンミックスを行って基本信号を算出する例を示したが、本発明において、ダウンミックス時のチャネル数、チャネル位置(スピーカ位置)を任意に設定することができる。
また、補助信号は、補助信号の数が、(3次元音響システムのチャネル数)−(基本信号の数)であり、かつ線形演算によって元の3次元音響信号を復元できるとう条件を満たす範囲内で任意に定めることができる。基本信号は加算演算により算出されることを考慮すれば、符号化効率を向上させるために、補助信号の演算式には減算する項が多く含まれるようにするのが好適である。
このように、本発明によれば、多数のチャネルによって構成される3次元音響システムの信号をより少ない信号にダウンミックスすることができるので、音響信号を符号化及び復号する任意の用途に有用である。
101 音響信号入力部
102 スピーカ位置情報記憶部
103 重み係数算出部
104 基本信号算出部
105 補助信号算出部
106 符号化部
107 多重化部
131 逆多重化部
132 復号部
133 信号復元部

Claims (6)

  1. 多数のチャネルによって構成される3次元音響システムの各チャネル信号を符号化する3次元音響符号化装置であって、
    3次元音響システムの各チャネル信号について、前記3次元音響システムのチャネル数を所定の受音点を基準にして少ないチャネル数の仮想音響システムに変換して符号化する際に、該仮想音響システムの各チャネルに対応する信号を基本信号とし、前記基本信号から3次元音響システムの各チャネル信号への復元を補助する信号を補助信号とし、前記基本信号及び前記補助信号に用いる重み付けの情報を重み係数として規定しており、
    前記3次元音響システムの各チャネル信号を入力する手段と、
    前記仮想音響システムの各チャネルに近傍する前記3次元音響システムの各チャネルから選定された複数のチャネル信号を前記重み係数に従ってダウンミックスして、前記基本信号の各々を生成する手段と、
    復号側で解凍すべき、前記3次元音響システムのチャネル数に相当する数の独立した方程式を構成するように、前記基本信号とは別に前記3次元音響システムのチャネル数と前記基本信号の数との差に相当する数の前記補助信号を生成する手段と、
    前記基本信号及び前記補助信号を符号化する符号化手段とを備え、
    復号側で前記重み係数、前記基本信号及び前記補助信号から前記3次元音響システムを復元できるようにしたことを特徴とする3次元音響符号化装置。
  2. 前記受音点における前記3次元音響システムの音響インテンシティ及び音圧、並びに前記受音点における前記仮想システムの音響インテンシティ及び音圧が一致するように、前記重み係数を決定する重み係数算出手段を備えることを特徴とする、請求項1に記載の3次元音響符号化装置。
  3. 前記符号化手段は、前記基本信号及び前記補助信号の各符号化ビット割り当てについて、前記基本信号に割り当てる割当て量を高くして符号化することを特徴とする、請求項1から2のいずれか一項に記載の3次元音響符号化装置。
  4. 多数のチャネルによって構成される3次元音響システムの各チャネル信号を復号する3次元音響復号装置であって、
    請求項1に記載された符号化装置によって符号化された前記基本信号及び前記補助信号を復号する復号手段と、
    前記復号手段によって復号した前記基本信号及び前記補助信号並びに前記重み係数から前記3次元音響システムの各チャネル信号を、前記方程式を解凍して復元する信号復元手段と、
    を備えることを特徴とする3次元音響復号装置。
  5. 請求項1に記載の3次元音響符号化装置として構成するコンピュータに、
    (a)前記3次元音響システムの各チャネル信号を入力するステップと、
    (b)前記仮想音響システムの各チャネルに近傍する前記3次元音響システムの各チャネルから選定された複数のチャネル信号を前記重み係数に従ってダウンミックスして、前記基本信号の各々を生成するステップと、
    (c)復号側で解凍すべき、前記3次元音響システムのチャネル数に相当する数の独立した方程式を構成するように、前記基本信号とは別に前記3次元音響システムのチャネル数と前記基本信号の数との差に相当する数の前記補助信号を生成するステップと、
    (d)前記基本信号及び前記補助信号を符号化するステップと、
    を実行させるためのプログラム。
  6. 請求項4に記載の3次元音響復号装置として構成するコンピュータに、
    (a)請求項1に記載された符号化装置によって符号化された前記基本信号及び前記補助信号を復号するステップと、
    (b)前記復号手段によって復号した前記基本信号及び前記補助信号並びに前記重み係数から前記3次元音響システムの各チャネル信号を、前記方程式を解凍して復元するステップと、
    を実行させるためのプログラム。
JP2009144450A 2009-06-17 2009-06-17 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム Pending JP2011002574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009144450A JP2011002574A (ja) 2009-06-17 2009-06-17 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009144450A JP2011002574A (ja) 2009-06-17 2009-06-17 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム

Publications (1)

Publication Number Publication Date
JP2011002574A true JP2011002574A (ja) 2011-01-06

Family

ID=43560585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009144450A Pending JP2011002574A (ja) 2009-06-17 2009-06-17 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム

Country Status (1)

Country Link
JP (1) JP2011002574A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123090A (ja) * 2010-12-07 2012-06-28 Nippon Hoso Kyokai <Nhk> 音響符号化装置及び復号装置、並びにこれらのプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
JP2007053624A (ja) * 2005-08-18 2007-03-01 Nippon Hoso Kyokai <Nhk> ダウンミックス装置およびダウンミックスプログラム
JP2007519349A (ja) * 2004-01-20 2007-07-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル出力信号を構築する装置および方法またはダウンミックス信号を生成する装置および方法
JP2008505368A (ja) * 2004-07-09 2008-02-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル出力信号を生成するための装置及び方法
WO2008046531A1 (en) * 2006-10-16 2008-04-24 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP2008529056A (ja) * 2005-02-23 2008-07-31 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007519349A (ja) * 2004-01-20 2007-07-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル出力信号を構築する装置および方法またはダウンミックス信号を生成する装置および方法
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
JP2008505368A (ja) * 2004-07-09 2008-02-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル出力信号を生成するための装置及び方法
JP2008529056A (ja) * 2005-02-23 2008-07-31 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
JP2007053624A (ja) * 2005-08-18 2007-03-01 Nippon Hoso Kyokai <Nhk> ダウンミックス装置およびダウンミックスプログラム
WO2008046531A1 (en) * 2006-10-16 2008-04-24 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP2010507115A (ja) * 2006-10-16 2010-03-04 ドルビー スウェーデン アクチボラゲット 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN5012003096; Giovanni Del Galdo, et al.: '"Efficient Methods for High Quality Merging of Spatial Audio Streams in Directional Audio Coding"' Convention Paper Presented at the 126th Convention No.7733, 200905, pp.981-993, Audio Engineering Society *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123090A (ja) * 2010-12-07 2012-06-28 Nippon Hoso Kyokai <Nhk> 音響符号化装置及び復号装置、並びにこれらのプログラム

Similar Documents

Publication Publication Date Title
JP7174810B6 (ja) 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置
JP7378440B2 (ja) 圧縮されたhoa信号をデコードする方法および装置
JP7374969B2 (ja) 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置
AU2019392988A1 (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using low-order, mid-order and high-order components generators
KR20140016780A (ko) 오디오 신호 처리 방법 및 장치
CN112823534B (zh) 信号处理设备和方法以及程序
JP5345024B2 (ja) 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP2011002574A (ja) 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP5680391B2 (ja) 音響符号化装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130409