JP5680391B2 - 音響符号化装置及びプログラム - Google Patents

音響符号化装置及びプログラム Download PDF

Info

Publication number
JP5680391B2
JP5680391B2 JP2010272392A JP2010272392A JP5680391B2 JP 5680391 B2 JP5680391 B2 JP 5680391B2 JP 2010272392 A JP2010272392 A JP 2010272392A JP 2010272392 A JP2010272392 A JP 2010272392A JP 5680391 B2 JP5680391 B2 JP 5680391B2
Authority
JP
Japan
Prior art keywords
signal
acoustic
channels
basic
auxiliary signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010272392A
Other languages
English (en)
Other versions
JP2012123090A (ja
Inventor
安藤 彰男
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2010272392A priority Critical patent/JP5680391B2/ja
Publication of JP2012123090A publication Critical patent/JP2012123090A/ja
Application granted granted Critical
Publication of JP5680391B2 publication Critical patent/JP5680391B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、22.2チャネル音響などの3次元音響信号を符号化・伝送する音響符号化装置及びその復号装置、並びにこれらのプログラムに関する。
社団法人 電波産業会(ARIB)では、22.2チャネル音響を伝送・符号化するために、既存のAAC(Advanced Audio Coding)符号化を用いる方式が標準化された。AAC方式は、CD(コンパクトディスク)の品質を保ったまま符号化、伝送する方式であるが、従来の2チャネルステレオの符号化に基づくものであるため、22.2チャネル音響のような、3次元音響を符号化・伝送する方式としては、必ずしも効率的な方式とはいえない。
一方、低ビットレートのオーディオ符号化では、MP3に基づく方式が開発されている。これらは、元の信号を2チャネルにダウンミックスした信号と、ダウンミックス信号からもとの信号を復元するためのパラメータを備えたパラメトリックな符号化・伝送方式であるが、3次元音響を2チャネルにダウンミックスした時点で、音の3次元空間印象が劣化するだけでなく、パラメトリック方式の特徴として、伝送レートは圧縮できるが音質も劣化するという問題点を持っていた。
高度BS放送では、22.2チャネル音響を符号化・伝送するために、既存のAAC符号化を用いる方式が標準化される予定である。さらに、AAC方式を改良し、絶対可聴閾値の設定を可変とする技法が知られている(例えば、特許文献1参照)。
特開2001−343997号公報
将来、スーパーハイビジョンを放送する場合には、スーパーハイビジョン音響である22.2チャネル音響をどのような方式で伝送するかが課題となる。
3次元音響システムで音を再生した場合に対して、受音点で観測した音響物理量を等しくできるようにチャネル数を減らすことができれば、受音者である人間は、チャネル数を減らしたことによる音の3次元空間的印象の劣化を、あまり感じることができない。これに対し、チャネル数を減らす段階で設定した受音点とは異なる場所で、再生音を聞いた場合には、その音の3次元空間的な印象が著しく劣化する。
そこで、本発明の目的は、上述の問題を鑑みて、元の3次元音響信号の音質や3次元空間的印象を高品質に保ったまま符号化・伝送する音響符号化装置及びその復号装置、並びにこれらのプログラムを提供することにある。
本発明では、所定の受音点で、音響物理量を一定に保ちながら、少ないチャネル数に変換した信号を基本信号とし、3次元音響信号を高品質に伝送するために、この基本信号の他に、再生時に必要となる3次元空間的印象を再現するための補助信号を伝送する。この補助信号は、3次元音響の符号化・復号でのビットレート圧縮の観点からすると、少ないビットレートでも音質が劣化しない性質を持つことが望ましいため、補助信号を、元の3次元音響システムの信号と基本信号とを音響再生した場合の音の3次元空間的な差分から計算することによって、補助信号のビットレートを減らした場合でも、再生時の音質の劣化を軽減させるものである。
本発明の具体的な例については実施例で明らかとなるが、本発明では、例えば22.2チャネルをダウンミックスして得た少ないチャネル数の基本信号と、基本信号の3次元空間情報を補完するための補助信号とに分離して伝送する際に、補助信号の算出に工夫を施すことにより、従来の技術を改善し、高品質な3次元音響の伝送・符号化を行う新たな3次元符号化方式として、元の音質だけでなく、音の3次元空間的印象も保ちながら、符号化ビットレートも抑制することができるようにした。
即ち、本発明の音響符号化装置は、複数のチャネルを有する3次元音響システムの音響信号を符号化する音響符号化装置であって、所定の受音点における予め定めた音響特徴量を一定に保ったまま、当該複数のチャネルの音響信号を前記複数のチャネルよりも少ないチャネル数の基本信号となるように、前記3次元音響システムのチャネルに対応するスピーカ配置と前記基本信号のチャネルに対応するスピーカ配置から一意に決定される基本信号変換係数を用いて、当該複数のチャネルの音響信号を前記基本信号に変換する基本信号算出部と、当該複数のチャネルの音響信号と前記基本信号とを音響再生した際の3次元空間的な差分に対応するチャネル数の補助信号となるように予め決定した補助信号変換係数を用いて、当該複数のチャネルの音響信号を前記補助信号に変換する補助信号算出部と、前記補助信号へのビット割り当てを前記基本信号のビット割り当てよりも少なく設定して、前記基本信号及び前記補助信号を符号化する符号化部と、前記基本信号変換係数及び前記補助信号変換係数からなる変換行列の条件数を少なくするように前記補助信号変換係数に関する所定の目的関数を用いて前記補助信号変換係数を算出する変換行列生成部と、を備えることを特徴とする。
また、本発明の音響符号化装置において、前記変換行列生成部は、前記基本信号の単位時間あたりの平均エネルギーに対して前記補助信号の単位時間あたりの平均エネルギーが小さくなるように前記補助信号変換係数を算出することを特徴とする。
また、本発明の音響符号化装置において、前記変換行列生成部は、前記変換行列の条件数の減少と、前記基本信号に対する前記補助信号の単位時間あたりの平均エネルギー比の減少の双方が成立するように、前記変換行列の条件数と前記平均エネルギー比を因数とする目的関数を用いて、前記目的関数の値が最小になる前記補助信号変換係数を算出することを特徴とする。
さらに、本発明のプログラムは、複数のチャネルを有する3次元音響システムの音響信号を符号化する音響符号化装置として構成するコンピュータに、所定の受音点における予め定めた音響特徴量を一定に保ったまま、当該複数のチャネルの音響信号を前記複数のチャネルよりも少ないチャネル数の基本信号となるように、前記3次元音響システムのチャネルに対応するスピーカ配置と前記基本信号のチャネルに対応するスピーカ配置から一意に決定される基本信号変換係数を用いて、当該複数のチャネルの音響信号を前記基本信号に変換するステップと、当該複数のチャネルの音響信号と前記基本信号とを音響再生した際の3次元空間的な差分に対応するチャネル数の補助信号となるように予め決定した補助信号変換係数を用いて、当該複数のチャネルの音響信号を前記補助信号に変換するステップと、前記補助信号へのビット割り当てを前記基本信号のビット割り当てよりも少なく設定して、前記基本信号及び前記補助信号を符号化するステップと、前記基本信号変換係数及び前記補助信号変換係数からなる変換行列の条件数を少なくするように前記補助信号変換係数に関する所定の目的関数を用いて前記補助信号変換係数を算出するステップと、を実行させるためのプログラムである。
本発明によれば、例えば、スーパーハイビジョン用の元の22チャネル音響信号を、8チャネルの基本信号と14チャネルの補助信号に分離して伝送する際に、基本信号のみでも受音点での音響物理量を再現できる利点を生かし、ビットレート劣化に対する耐性の強い補助信号を算出及び設定することにより、補助信号に対するビットレートを基本信号よりも削減することを可能としつつ高い再生音質を保つことができるため、伝送効率を従来の技術より改善することができるようになる。
本発明による一実施例の音響符号化装置のブロック図である。 本発明による一実施例の音響符号化装置の動作フロー図である。 3次元音響信号である22.2チャネル音響信号のLFEチャネルを除く22チャネルのスピーカ配置例を示す図である。 本発明による一実施例の3次元音響システムをダウンミックスした仮想音響システムのスピーカ配置例を示す図である。 本発明による一実施例の音響符号化装置におけるsimulated annealing法による変換行列Gの最適化計算を示すフロー図である。 本発明による一実施例の音響符号化装置における変換行列Gの算出例を示す図である。 本発明による一実施例の復号装置のブロック図である。 本発明による一実施例の復号装置の動作フロー図である。
以下、図面を参照して、本発明による一実施例の音響符号化装置及びその復号装置を説明する。
本実施例の音響符号化装置及びその復号装置は、元の3次元音響信号の音質や3次元空間的印象を高品質に保ったまま符号化・伝送する音響符号化装置及びその復号装置である。
〔音響符号化装置の構成〕
図1は、本発明による一実施例の音響符号化装置のブロック図である。本実施例の音響符号化装置100は、音響信号入力部1と、基本信号算出部2と、補助信号算出部3と、変換行列記憶部4と、符号化部5と、送信部6と、基本信号変換係数設定部7と、補助信号変換係数設定部8と、スピーカ位置情報記憶部9と、変換行列生成部10とを備える。
ここで、音響符号化装置100として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、音響符号化装置100の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
音響信号入力部1は、入力される元の3次元音響システム(制作者が定める音響空間システムであり、例えば22.2チャネル音響システム)用の3次元音響信号s(t)をA/D変換し、デジタル形式の音響信号s(t)を、基本信号算出部2及び補助信号算出部3に出力する。
基本信号算出部2は、基本信号変換係数設定部7によって設定される基本信号変換係数Wを用いて、元の3次元音響信号のチャネル数よりも少ないチャネル数にダウンミックスする所定の基本信号の演算式に基づいて、音響信号入力部1から入力される音響信号s(t)から基本信号y(t)を算出し、符号化部5に出力する。基本信号変換係数Wは、所定の受音点における音響特徴量(例えば、基本周波数、エネルギー、持続時間、フォルマント周波数及びスペクトルのうちの少なくとも1つ以上で定義される特徴量)を一定に保ったまま、元の信号をダウンミックスして少ないチャネル数に変換するための係数である。所定の基本信号の演算式については、後述する式(1)を満たすものであればよい。
補助信号算出部3は、補助信号変換係数設定部8によって設定される補助信号変換係数Wを用いて、元の3次元音響信号のチャネル数と基本信号のチャネル数の差分のチャネル数に相当するチャネル数の所定の補助信号の演算式に基づいて、音響信号入力部1から入力される音響信号s(t)から補助信号y(t)を算出し、符号化部5に出力する。補助信号変換係数Wは、元の3次元音響信号と基本信号とを音響再生した際の3次元空間的な差分に対応するチャネル数の補助信号となるように予め決定した係数である。所定の補助信号の演算式については、後述する式(2)を満たすものであればよい。
変換行列記憶部4は、基本信号変換係数設定部7及び補助信号変換係数設定部8によってそれぞれ読み出される基本信号変換係数W及び補助信号変換係数Wを変換行列Gとして格納している。
符号化部5は、基本信号算出部2から得られる基本信号y(t)と、補助信号算出部3から得られる補助信号y(t)とを符号化する。符号化部5は、符号化する際に、基本信号には単位時間あたりのビット数を多く、補助信号には単位時間あたりのビット数を少なく割り当て、それぞれ符号化した基本信号y’(t)及び補助信号y’(t)を送信部6に送出する。
送信部6は、符号化部5で符号化した基本信号及び補助信号を多重化して受信側に送信する。尚、送信部6は、変換行列記憶部4に格納している基本信号変換係数W及び補助信号変換係数Wからなる変換行列Gを読出し、送信する機能を有する。この変換行列Gの情報は、単位時間あたりに変化させる場合には、基本信号及び補助信号とともに多重化して送信するように構成することも可能であるが、単位時間あたりに変化させない場合には、基本信号及び補助信号より前に1回だけ送信しておくように構成することもできる。
基本信号変換係数設定部7は、音響信号s(t)を符号化して送信する前に、変換行列記憶部4に格納している変換行列Gのうちの基本信号変換係数Wを読み出して基本信号算出部2に設定する。
補助信号変換係数設定部8は、音響信号s(t)を符号化して送信する前に、変換行列記憶部4に格納している変換行列Gのうちの補助信号変換係数Wを読み出して補助信号算出部3に設定する。
スピーカ位置情報記憶部9は、3次元音響システムの各スピーカの極座標における位置情報と、ダウンミックスする受信対象の3次元音響システム(以下、「仮想音響システム」と称する)の各スピーカの極座標における位置情報とを格納している。
変換行列生成部10は、音響信号s(t)を符号化して送信する前に、スピーカ位置情報記憶部9から3次元音響システムの各スピーカの極座標における位置情報と、仮想音響システムの各スピーカの極座標における位置情報とを読み出し、予め用意した学習用の音響信号を用いて変換行列Gを生成し、変換行列記憶部4に格納する機能を有する。変換行列Gの生成は、詳細に後述する。
次に、本実施例の音響符号化装置100の動作を説明する。
〔音響符号化装置の動作〕
図2は、本発明による一実施例の音響符号化装置の動作フロー図である。先ず、本実施例の音響符号化装置100は、3次元音響システムの各スピーカの極座標における位置情報と、ダウンミックスする受信対象の仮想音響システムの各スピーカの極座標における位置情報とを格納している(S1)。
次に、本実施例の音響符号化装置100は、事前に、音響信号s(t)を符号化して送信する前に、スピーカ位置情報記憶部9から3次元音響システムの各スピーカの極座標における位置情報と、仮想音響システムの各スピーカの極座標における位置情報とを読み出し、予め用意した学習用の音響信号を用いて変換行列Gを生成し(S2)、変換行列記憶部4に格納する(S3)。
次に、本実施例の音響符号化装置100は、音響信号s(t)を符号化して送信する前に、変換行列記憶部4に格納している変換行列Gのうちの基本信号変換係数Wを読み出して基本信号算出部2に設定するとともに、音響信号s(t)を符号化して送信する前に、変換行列記憶部4に格納している変換行列Gのうちの補助信号変換係数Wを読み出して補助信号算出部3に設定する(S4,S5)。
次に、本実施例の音響符号化装置100は、設定された基本信号変換係数Wを用いて、元の3次元音響信号のチャネル数よりも少ないチャネル数にダウンミックスする所定の基本信号の演算式に基づいて、入力される音響信号s(t)から基本信号y(t)を算出するとともに、設定された補助信号変換係数Wを用いて、元の3次元音響信号のチャネル数と基本信号のチャネル数の残差分のチャネル数に相当するチャネル数の所定の補助信号の演算式に基づいて、入力される音響信号s(t)から補助信号y(t)を算出し、符号化部5に出力する(S6)。
次に、本実施例の音響符号化装置100は、基本信号算出部2から得られる基本信号y(t)と、補助信号算出部3から得られる補助信号y(t)とを符号化する際に、基本信号には単位時間あたりのビット数を多く、補助信号には単位時間あたりのビット数を少なく割り当て符号化する(S7)。
次に、本実施例の音響符号化装置100は、符号化した基本信号及び補助信号を多重化して受信側に送信する(S8)。
以下、22.2チャネル音響信号のうちLFEチャネルを除いた22チャネルの音響信号を、8チャネルにダウンミックスした基本信号と、14チャネルの補助信号に変換して伝送する場合を例に、より具体的に説明する。
変換行列生成部10は、基本信号変換係数Wを算出するために、スピーカ位置情報記憶部9に格納された22チャネルの3次元音響システムのチャネル数とスピーカ配置、及び8チャネルの仮想音響システムのチャネル数とスピーカ配置の情報を取得して、受音点Sにおいて、22チャネルの3次元音響システムにて22チャネル音源信号ベクトルs(t)を再生した場合と同じ音響物理量が得られるように、8チャネルの仮想音響システムの信号を得るための基本信号変換係数Wを算出する。
例えば、22チャネルの3次元音響システムの各チャネルch_i(i=1,・・・,22)の信号を仮想音響システムの各チャネルnch_j(j=1,・・・,8)の信号に割り当てるときの例を、表1に示す。表1の左の列に、22チャネルの3次元音響システムの各チャネルを示す。表1の中央の列は、左の列に示された3次元音響システムのチャネルに近傍する仮想音響システムのチャネルであり、表1の右の列は、3次元音響システムの各チャネルを仮想音響システムの各チャネルに割り当てる際に用いられる基本信号変換係数Wの値を示し、表1では、wj,iはch_iをnch_jに割り当てる際の基本信号変換係数Wを表す。
即ち、基本信号算出部2は、予め定めた変換前後のスピーカ配置の情報から一意に求めることができる基本信号変換係数Wの値を用いて、式(1)により、入力される音響信号s(t)から基本信号の信号ベクトルy(t)を算出する。ここで、式(1)にて、元の3次元音響システムのチャネル数をN、元の3次元音響システムの信号をs1(t)〜sN(t)、仮想音響システムのチャネル数、すなわち基本信号のチャネル数をMとし、元の3次元音響システムのi番目のチャネルを仮想音響システムのj番目のチャネルに変換する際の基本信号変換係数をwj,i、j=1,・・・,M、i=1,・・・,Nとしている。
一方、補助信号算出部3は、詳細に後述するが、変換行列生成部10によって算出した補助信号変換係数Wによって、式(2)にしたがって14チャネルの補助信号y(t)の信号ベクトルを算出する。補助信号変換係数Wは、aj,i、j=1,・・・,N−M、i=1,・・・,N−1としている。
以下、変換行列生成部10による補助信号変換係数Wにについて詳しく述べる。受音点Sから見た方向を、方位角θと仰角φの対(θ,φ)で表す(図3参照)。方向関数を式(3)のように定義する。尚、図3は、3次元音響信号である22.2チャネル音響信号のLFEチャネルを除く22チャネルのスピーカ配置例を示す図である。また、図4は、本発明による一実施例の3次元音響システムをダウンミックスした仮想音響システムのスピーカ配置例を示す図である。
このとき、22チャネルシステムによる(θ,φ)方向の音の成分は、式(4)で表される。
この(θ,φ)方向の音の成分は、式(5)で表される。
そこで、方向における22チャネルシステムの再生音と8チャネルシステムの再生音の差は、式(6)に示すものとなる。
式(6)に示す差を、14方向(θ,φ)、(i=1,・・・,14)で求め、これをベクトル表現することにより、式(7)を得る。
ここに、Woは、式(8)で表される。
また、補助信号変換係数Wは、式(9)に示すように表される。
したがって、補助信号変換係数Wは、式(10)を演算することで、14チャネルの3次元空間的な差分信号を生成することができる。
ここで、変換行列Gを式(11)のように与える。
ここに、基本信号変換係数Wは8×22行列、補助信号変換係数Wは14×22行列であり、Gは22×22正方行列となる。式(1)と(10)より、ベクトルy(t)を式(12)で与えて、式(13)を得る。
従って、元の信号s(t)は、式(14)によって復元される。
ところで、式(9)によって得られた補助信号変換係数Wによって式(11)で変換行列Gを構成した場合に、変換行列Gにおける補助信号変換係数Wの値によっては、その逆行列G−1が数値的に安定した値で求まらない場合も考えられる。また、このような変換行列Gによって、式(13)から基本信号y(t)と補助信号y(t)を算出した場合に、補助信号の単位時間あたりの平均エネルギーが、基本信号のものに対して十分に小さくできず、結果として、補助信号へのビット割り当てを減らすと音質が劣化する場合も考えられる。そこで、これらの問題を解決するために、変換行列生成部10は、以下のようにして変換行列Gにおける補助信号変換係数Wを決定する。
逆行列G−1を数値的に求める際の安定性を示す量として、条件数が知られている。ここに行列の条件数とは、その行列の最大固有値と最小固有値の比で表される。条件数は、単位行列で1(最小)、特異行列で無限大となり、小さいほど、逆行列計算を安定に行うことができる。以下、行列Gの条件数をκ(G)で表す。一方、基本信号y(t)と補助信号y(t)の単位時間あたりのエネルギー比ρ(G)を式(15)のように定義する。
このとき、本発明の目的にとって好ましい変換行列Gは、κ(G)とρ(G)をともに小さくするものである。ところが、ρ(G)を小さくする変換行列Gが、必ずしもκ(G)を小さくするとは限らない。たとえば、補助信号変換係数Wの要素をすべて0とすると、ρ(G)は最小値0となるが、変換行列Gは特異行列となり、κ(G)は無限大となる。そこで、本発明の実施例では、目的関数E(G)=f(κ(G),ρ(G))を式(16)と定義する。
ここで、図5を参照して、例えばsimulated annealing法によって、目的関数E(G)を最少化する変換行列Gを探索する例を説明する。図5は、simulated annealing法による変換行列Gの最適化計算を示すフロー図である。尚、γは相対的な重要度を示す値であるので0以上無限大までの任意の値を設定可能であるが、本実施例では、ρ(G)をより小さくすることを考慮して、γ=1/2と設定して算出している。すなわち、初期の補助信号変換係数W(0)を式(9)で与え、これによって式(11)に従って初期変換行列Gを算出し、初期誤差関数E(G)を式(17)から算出する。
まず、行列変数GにGを代入し、最大N回(例えば、10000回)の繰返し回数n=0とする(S101)。次に、式(8)の行列W,Wの要素に乱数を用いて摂動を与え、式(9)と式(11)から変換行列G’を構成する(S102)。
E(G)とE(G’)を比較して、E(G’)<E(G)ならば行列変数GにG’の値を代入する(S103,S106)。そうでない場合には、0又は1の一様乱数ζを生成し(S104)、この一様乱数ζが、次式を満たす場合に、変換行列GにG’の値を代入する(S105,S106)。
ここに、Tは、次式で定義されるいわゆる温度パラメータである。
温度パラメータαは、一般に、0<α≦1で設定されるため、本実施例では、パラメータα=0.1と設定した。以上の処理を、繰り返し数nの値を1つずつ増やしながら、目的関数E(G)が十分収束するまで(本例では10000回まで)繰り返し(S107,S108,S109)、最終的に、目的関数E(G)を最小化したGminを変換行列Gとして採用する(S110)。図6は、変換行列Gの算出例を示す図である。
この変換行列生成部10の処理によって、逆行列が安定で、かつ基本信号に対する補助信号のエネルギーを抑えることができる変換行列Gを生成することができる。
尚、このような最適化を行う場合に、22チャネル音響の3次元空間的特徴を良く表現する音声の学習用音響信号を用いるのが好適であり、事前に、この学習用音響信号を用いて補助信号変換係数Wを求めておいて、符号化・復号時には、この補助信号変換係数Wを用いることとなる。この学習により、変換行列Gは予め求められるので、符号化側から復号側へ1回伝送すれば、それ以上送る必要がない。
次に、本発明による一実施例の復号装置について説明する。
〔復号装置の構成〕
図7は、本発明による一実施例の復号装置のブロック図である。本実施例の復号装置20は、受信部21と、復号部22と、信号復元部23とを備える。
受信部21は、入力される変換行列G、基本信号及び補助信号をそれぞれ受信して逆多重化して分離する。尚、変換行列Gについては、1回受信するのみでよいものであることから、符号化側の処理に応じて、基本信号及び補助信号の受信に先立って受信するような態様とすることもできる。
復号部22は、受信部22から入力される基本信号及び補助信号についてそれぞれ復号処理を施し、信号復元部23に出力する。
信号復元部23は、変換行列Gの逆行列を用いて、復号部22から入力される基本信号及び補助信号を用いて前述の式(1)及び式(2)に対応する連立方程式を解くことにより、元の3次元音響システムの音響信号s(t)を復元する。
〔復号装置の動作〕
図8は、本発明による一実施例の復号装置の動作フロー図である。本実施例の復号装置20は、入力される変換行列G、基本信号及び補助信号をそれぞれ受信して逆多重化して分離し(S11)、基本信号及び補助信号についてそれぞれ復号処理を施し(S12)、基本信号及び補助信号を用いて元の3次元音響システムの音響信号s(t)を復元する(S13)。
ここで、復号装置20として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、コンピュータとして構成することができ、復号装置20の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
以上、特定の実施例について説明したが、22.2マルチチャネル音響信号のうち、LFEを除く22チャネル信号から、8チャネルにダウンミックスした基本信号と14チャネルの補助信号を算出する例を示したが、本発明は、LFEを含む場合に対しても有効であるだけでなく、22.2マルチチャネル音響以外の信号や、8チャネル以外のチャネル数を持つ基本信号に適用可能であることは云うまでもない。また、目的関数の設計や摂動の与え方、simulated annealingを用いた最適化演算などを例示したが、この他の目的関数や摂動を与える方法を用いる最適化演算を利用可能なことは勿論である。
また、本実施例では、基本信号および補助信号を帯域分割しないで符号化/復号する例を示したが、基本信号および補助信号と、それぞれQMFフィルタバンクなどの帯域通信フィルタ群を用いて帯域に分割し、各帯域ごとに符号化行列を求めることによって、補助信号の単位時間あたりの平均エネルギーのさらなる減少と、ビットレートを削減した符号化により、復号・復元時に生じる雑音を帯域内に押し込むことが可能であることは云うまでもない。
本発明によれば、例えば、スーパーハイビジョン用の元の22チャネル音響信号の伝送において高ビットレートを可能としつつ高い再生音質を保つことができるため、3次元音響信号を伝送する用途に有用である。
1 音響信号入力部
2 基本信号算出部
3 補助信号算出部
4 変換行列記憶部
5 符号化部
6 送信部
7 基本信号変換係数設定部
8 補助信号変換係数設定部
9 スピーカ位置情報記憶部
10 変換行列生成部
20 復号装置
21 受信部
22 復号部
23 信号復元部
100 音響符号化装置

Claims (4)

  1. 複数のチャネルを有する3次元音響システムの音響信号を符号化する音響符号化装置であって、
    所定の受音点における予め定めた音響特徴量を一定に保ったまま、当該複数のチャネルの音響信号を前記複数のチャネルよりも少ないチャネル数の基本信号となるように、前記3次元音響システムのチャネルに対応するスピーカ配置と前記基本信号のチャネルに対応するスピーカ配置から一意に決定される基本信号変換係数を用いて、当該複数のチャネルの音響信号を前記基本信号に変換する基本信号算出部と、
    当該複数のチャネルの音響信号と前記基本信号とを音響再生した際の3次元空間的な差分に対応するチャネル数の補助信号となるように予め決定した補助信号変換係数を用いて、当該複数のチャネルの音響信号を前記補助信号に変換する補助信号算出部と、
    前記補助信号へのビット割り当てを前記基本信号のビット割り当てよりも少なく設定して、前記基本信号及び前記補助信号を符号化する符号化部と、
    前記基本信号変換係数及び前記補助信号変換係数からなる変換行列の条件数を少なくするように前記補助信号変換係数に関する所定の目的関数を用いて前記補助信号変換係数を算出する変換行列生成部と、
    を備えることを特徴とする音響符号化装置。
  2. 前記変換行列生成部は、前記基本信号の単位時間あたりの平均エネルギーに対して前記補助信号の単位時間あたりの平均エネルギーが小さくなるように前記補助信号変換係数を算出することを特徴とする、請求項に記載の音響符号化装置。
  3. 前記変換行列生成部は、前記変換行列の条件数の減少と、前記基本信号に対する前記補助信号の単位時間あたりの平均エネルギー比の減少の双方が成立するように、前記変換行列の条件数と前記平均エネルギー比を因数とする目的関数を用いて、前記目的関数の値が最小になる前記補助信号変換係数を算出することを特徴とする、請求項又はに記載の音響符号化装置。
  4. 複数のチャネルを有する3次元音響システムの音響信号を符号化する音響符号化装置として構成するコンピュータに、
    所定の受音点における予め定めた音響特徴量を一定に保ったまま、当該複数のチャネルの音響信号を前記複数のチャネルよりも少ないチャネル数の基本信号となるように、前記3次元音響システムのチャネルに対応するスピーカ配置と前記基本信号のチャネルに対応するスピーカ配置から一意に決定される基本信号変換係数を用いて、当該複数のチャネルの音響信号を前記基本信号に変換するステップと、
    当該複数のチャネルの音響信号と前記基本信号とを音響再生した際の3次元空間的な差分に対応するチャネル数の補助信号となるように予め決定した補助信号変換係数を用いて、当該複数のチャネルの音響信号を前記補助信号に変換するステップと、
    前記補助信号へのビット割り当てを前記基本信号のビット割り当てよりも少なく設定して、前記基本信号及び前記補助信号を符号化するステップと、
    前記基本信号変換係数及び前記補助信号変換係数からなる変換行列の条件数を少なくするように前記補助信号変換係数に関する所定の目的関数を用いて前記補助信号変換係数を算出するステップと、
    を実行させるためのプログラム。
JP2010272392A 2010-12-07 2010-12-07 音響符号化装置及びプログラム Expired - Fee Related JP5680391B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010272392A JP5680391B2 (ja) 2010-12-07 2010-12-07 音響符号化装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010272392A JP5680391B2 (ja) 2010-12-07 2010-12-07 音響符号化装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2012123090A JP2012123090A (ja) 2012-06-28
JP5680391B2 true JP5680391B2 (ja) 2015-03-04

Family

ID=46504619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010272392A Expired - Fee Related JP5680391B2 (ja) 2010-12-07 2010-12-07 音響符号化装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5680391B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108206022B (zh) * 2016-12-16 2020-12-18 南京青衿信息科技有限公司 利用aes/ebu信道传输三维声信号的编解码器及其编解码方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2316154C2 (ru) * 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
JP4886242B2 (ja) * 2005-08-18 2012-02-29 日本放送協会 ダウンミックス装置およびダウンミックスプログラム
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
JP2011002574A (ja) * 2009-06-17 2011-01-06 Nippon Hoso Kyokai <Nhk> 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム

Also Published As

Publication number Publication date
JP2012123090A (ja) 2012-06-28

Similar Documents

Publication Publication Date Title
US20200335115A1 (en) Audio encoding and decoding
US20210195356A1 (en) Audio signal processing method and apparatus
US9478225B2 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
CN105556992B (zh) 声道映射的装置,方法和存储介质
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
US20140086416A1 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US8090587B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
WO2008046530A2 (en) Apparatus and method for multi -channel parameter transformation
CN101406074A (zh) 根据多通道信号的参数表示产生空间缩混
CN107077861B (zh) 音频编码器和解码器
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
CN112823534B (zh) 信号处理设备和方法以及程序
TW201629951A (zh) 音頻訊號的參數混合
JP5949270B2 (ja) オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
JP5680391B2 (ja) 音響符号化装置及びプログラム
JP5345024B2 (ja) 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP5483813B2 (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
JP6694755B2 (ja) チャンネル数変換装置およびそのプログラム
JP2011002574A (ja) 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
KR102195976B1 (ko) 오디오 신호 처리 방법 및 장치
JP2013050658A (ja) 多チャネル音響符号化装置およびそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140902

TRDD Decision of grant or rejection written
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20141202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150107

R150 Certificate of patent or registration of utility model

Ref document number: 5680391

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees