JP2013167783A - 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム - Google Patents

多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム Download PDF

Info

Publication number
JP2013167783A
JP2013167783A JP2012031368A JP2012031368A JP2013167783A JP 2013167783 A JP2013167783 A JP 2013167783A JP 2012031368 A JP2012031368 A JP 2012031368A JP 2012031368 A JP2012031368 A JP 2012031368A JP 2013167783 A JP2013167783 A JP 2013167783A
Authority
JP
Japan
Prior art keywords
signal
transmission
unit
restored
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012031368A
Other languages
English (en)
Inventor
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2012031368A priority Critical patent/JP2013167783A/ja
Priority to PCT/JP2013/000837 priority patent/WO2013121793A1/ja
Publication of JP2013167783A publication Critical patent/JP2013167783A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】多チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音を低減する。
【解決手段】本発明に係る多チャネル音響システムは、多チャネル音響方式に対応した伝送装置1及び受信装置2を備える多チャネル音響システムであって、伝送装置1は、原信号と復元信号との差分である量子化雑音信号を復元信号の関数としてモデル化してモデルパラメータを求め、符号化信号とモデルパラメータとを受信装置2に伝送し、受信装置2は、モデルパラメータに基づき量子化雑音信号を復元信号の関数としてモデル化して推定し、復元信号から推定した量子化雑音信号を除去する。
【選択図】図1

Description

この発明は、多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラムに関し、特に、多チャネル音響信号を行列変換した伝送信号に対して人間の聴覚特性に基づく符号化方式を適用する際に生じる量子化雑音の低減に関するものである。
社団法人電波産業会(ARIB)では、22.2チャネル音響を伝送・符号化するために、既存のAAC(Advanced Audio Coding)符号化を用いる方式が標準化されている。AAC方式は、人間の聴覚特性に基づき、CD(コンパクトディスク)の品質を保ったまま1/10程度のビットレートで符号化可能な方式である(例えば、非特許文献1参照)。
22.2チャネル音響の伝送・符号化を行う際に、伝送チャネル数を増やさずに従来の2チャネルステレオなどとの互換性を確保するためには、行列変換などの信号変換を行う必要がある。行列変換を用いた従来のAAC符号化について図6を用いて説明する。図6は、行列変換により22.2チャネル音響信号である入力信号を2チャネルの伝送信号に変換してAAC伝送する処理の概要を示す図である。まず、送信ブロックでは、22.2チャネルの原信号が行列変換され、例えば、基本信号および補助信号の2つのチャネルを含む伝送信号に変換される。ここで、基本信号とは、22.2チャネル音響信号の主要な空間情報を表す8〜10チャネルの信号であり、補助信号とは、基本信号を補完して元の22.2チャネル音響信号を復元するための信号である。
次に、送信ブロックにおいては、基本信号および補助信号のAAC符号化がそれぞれ独立に行われる。ここで、AAC符号化では、各伝送信号を周波数分析した後、顕著な周波数成分の検出を行い、この成分によって聞き取れなくなる(マスクされる)周波数成分の上限を表すマスキング曲線を算出し、マスキング曲線以下の周波数成分に対するビット割当てを削減するとともに、マスキング曲線以下に収まる量子化雑音を許容したビット割当てが行われる。
送信ブロックから受信ブロックにAAC符号化された伝送信号が伝送されると、受信ブロックでは、基本信号および補助信号に対しそれぞれ独立にAAC復号が行われ、逆行列変換により22.2チャネル音響信号が復元される。
Marina Bosi, Richard E. Goldberg, "Introduction to Digital Audio Coding and Standards" Springer, 2002-12-31
ここで、従来のAAC符号化では、22.2チャネル音響の入力信号をよりチャネル数の少ない伝送信号に変換して伝送する場合のように、行列変換を伴う信号の符号化に対する処理が検討されていない。
例えば、図6に示す従来のAAC符号化では、送信ブロックにおいて、行列変換後の伝送信号の各チャネル(基本信号および補助信号)が独立して処理される。即ち、複数の多チャネル音響信号が行列変換により混在している伝送信号に対して、行列変換後のチャネル毎に、個別にマスキング曲線に基づくビット割当て処理が行われることになる。このため、行列変換後のチャネルによっては、特定の成分が残されたり消去されなかったりする現象が起こり、本来はマスキングされて聴こえなかった量子化雑音が逆行列処理によって可聴化するという問題があった。
したがって、かかる点に鑑みてなされた本発明の目的は、多チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音を低減可能な、多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラムを提供することである。
上述した諸課題を解決すべく、本発明に係る多チャネル音響システムは、多チャネル音響方式に対応した伝送装置及び受信装置を備える多チャネル音響システムであって、前記伝送装置は、前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、前記伝送信号を符号化した符号化信号を生成する符号化部と、前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、前記原信号と前記復元信号との差分である量子化雑音信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、前記符号化信号と、前記モデルパラメータとを前記受信装置に伝送する伝送部と、を備え、前記受信装置は、前記符号化信号と、前記モデルパラメータとを受信する受信部と、前記符号化信号を復号して復号信号を生成する復号部と、前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、前記モデルパラメータに基づき、前記量子化雑音信号を前記復元信号の関数としてモデル化して推定する量子化雑音信号生成部と、前記復元信号から推定した前記量子化雑音信号を除去する合成部と、を備える。
また、本発明に係る多チャネル音響システムは、多チャネル音響方式に対応した伝送装置及び受信装置を備える多チャネル音響システムであって、前記伝送装置は、前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、前記伝送信号を符号化した符号化信号を生成する符号化部と、前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、前記原信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、前記符号化信号と、前記モデルパラメータとを前記受信装置に伝送する伝送部と、を備え、前記受信装置は、前記符号化信号と、前記モデルパラメータとを受信する受信部と、前記符号化信号を復号して復号信号を生成する復号部と、前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、前記モデルパラメータに基づき、前記原信号を前記復元信号の関数としてモデル化して推定する原信号生成部と、を備える。
また、前記モデル生成部は、周波数帯域毎に前記モデル化して前記モデルパラメータを求める、ことが好ましい。
また、前記モデル生成部は、前記周波数帯域毎に、前記モデル化の要否を判定する、ことが好ましい。
また、前記モデル生成部は、前記モデル化を多項式で行い、前記周波数帯域毎に前記多項式の次数を決定する、ことが好ましい。
また、前記モデル生成部は、高い周波数帯域ほど次数が低くなるように、前記多項式の次数を決定する、ことが好ましい。
また、本発明に係る伝送装置は、多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、前記伝送信号を符号化した符号化信号を生成する符号化部と、前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、前記原信号と前記復元信号との差分である量子化雑音信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、前記符号化信号と、前記モデルパラメータとを伝送する伝送部と、を備える。
また、本発明に係る受信装置は、多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信する受信部と、前記符号化信号を復号して復号信号を生成する復号部と、前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、前記モデルパラメータに基づき、前記量子化雑音信号を前記復元信号の関数としてモデル化して推定する量子化雑音信号生成部と、前記復元信号から推定した前記量子化雑音信号を除去する合成部と、を備える。
また、本発明に係る伝送用プログラムは、多チャネル音響方式に対応した伝送装置に、前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換するステップと、前記伝送信号を符号化した符号化信号を生成するステップと、前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成するステップと、前記原信号と前記復元信号との差分である量子化雑音信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるステップと、前記符号化信号と、前記モデルパラメータとを伝送するステップと、を実行させる。
また、本発明に係る受信用プログラムは、多チャネル音響方式に対応した受信装置に、前記多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信するステップと、前記符号化信号を復号して復号信号を生成するステップと、前記復号信号を逆行列変換して復元信号を生成するステップと、前記モデルパラメータに基づき、前記量子化雑音信号を前記復元信号の関数としてモデル化して推定するステップと、前記復元信号から推定した前記量子化雑音信号を除去するステップと、を実行させる。
また、本発明に係る伝送装置は、多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、前記伝送信号を符号化した符号化信号を生成する符号化部と、前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、前記原信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、前記符号化信号と、前記モデルパラメータとを伝送する伝送部と、を備える。
また、本発明に係る受信装置は、多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信する受信部と、前記符号化信号を復号して復号信号を生成する復号部と、前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、前記モデルパラメータに基づき、前記原信号を前記復元信号の関数としてモデル化して推定する原信号生成部と、を備える。
また、本発明に係る伝送用プログラムは、多チャネル音響方式に対応した伝送装置に、前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換するステップと、前記伝送信号を符号化した符号化信号を生成するステップと、前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成するステップと、前記原信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるステップと、前記符号化信号と、前記モデルパラメータとを伝送するステップと、を実行させる。
また、本発明に係る受信用プログラムは、多チャネル音響方式に対応した受信装置に、前記多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信するステップと、前記符号化信号を復号して復号信号を生成するステップと、前記復号信号を逆行列変換して復元信号を生成するステップと、前記モデルパラメータに基づき、前記原信号を前記復元信号の関数としてモデル化して推定するステップと、を実行させる。
本発明に係る多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラムによれば、多チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音を低減することが可能となる。
第1の実施形態に係る伝送装置の機能ブロック図である。 第1の実施形態に係る受信装置の機能ブロック図である。 第2の実施形態に係る伝送装置の機能ブロック図である。 第2の実施形態に係る受信装置の機能ブロック図である。 第1の実施形態に係る多チャネル音響システムの実験結果の一例を示す図である。 行列変換を用いた従来のAAC符号化の概要を示す図である。
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。ここで、以下の説明においては、多チャネル音響方式として、スーパーハイビジョン用の音響方式である22.2チャネル音響を例に説明を行うが、本発明は22.2チャネル音響のみに限定されるものではない点に留意されたい。
本発明の実施形態に係る多チャネル音響システムは、22.2チャネル音響信号を行列変換及び符号化して伝送する伝送装置1と、伝送装置1からの信号を復号及び逆行列変換して22.2チャネル音響信号を復元する受信装置2とから構成される。伝送装置1は、例えば22.2チャネル音響信号を伝送する放送局の放送用設備であり、受信装置2は、例えばテレビ、携帯電話、タブレット端末など22.2チャネル音響信号を受信して視聴するための機器である。
(第1の実施形態)
第1の実施形態において、伝送装置1及び受信装置2は、22.2チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音信号について、当該量子化雑音信号を表すモデルの基礎的な情報を予め共有している。例えば、伝送装置1及び受信装置2は、量子化雑音信号を表すモデルとして、M次の多項式を用いるといった情報を予め共有している。伝送装置1は、符号化した伝送信号に加え、量子化雑音信号のモデルパラメータ(例えば多項式の係数)を送信することにより、受信装置2は、モデルパラメータを反映させたモデルより量子化雑音信号を推定し、復号した22.2チャネル音響信号から量子化雑音信号の影響を除去することが可能となる。
図1は、本発明の第1の実施形態に係る伝送装置1の機能ブロック図である。伝送装置1は、音響信号入力部11と、行列変換部12と、符号化部13と、復元用復号部15及び復元用逆行列変換部16を含む復元部14と、量子化雑音モデル生成部17と、伝送部18とを備える。
音響信号入力部11は、入力される22.2チャネル音響信号をA/D変換し、デジタル形式の音響信号を、原信号として行列変換部12及び量子化雑音モデル生成部17に出力する。
行列変換部12は、22.2チャネル音響信号である原信号を行列変換により原信号よりチャネル数の少ない伝送信号に変換する。例えば、行列変換部12は、22.2チャネル音響信号を、8.1チャネルの基本信号を含むチャネルと、14.1チャネルの基本信号とを含むチャネルとの計2チャネルの伝送信号に行列変換する。行列変換部12は、行列変換後の伝送信号を符号化部13に出力する。なお、ここでいう行列変換とは、22.2チャネル音響信号である原信号を原信号よりチャネル数の少ない伝送信号に変換する信号変換全般を含むものである。
符号化部13は、チャネル毎に伝送信号を符号化した符号化信号を生成し、符号化信号を伝送部18及び復元部14に出力する。符号化部13は、例えば人間の聴覚特性に応じた符号化方式であるAAC符号化により伝送信号の符号化(ビット割当)を行う。
復元部14は、復元用復号部15及び復元用逆行列変換部16を備え、符号化信号の復号及び逆行列変換を行い原信号の復元信号を生成する。具体的には、復元用復号部15は、符号化信号を復号して復号信号を生成し、復号信号を復元用逆行列変換部16に出力する。復元用逆行列変換部16は、復号信号に対して逆行列変換を行い原信号の復元信号を生成し、復元信号を量子化雑音モデル生成部17に出力する。
量子化雑音モデル生成部17は、音響信号入力部11からの原信号及び復元部14(復元用逆行列変換部16)からの復元信号に基づき、原信号と復元信号との差分である量子化雑音信号を復元信号の関数としてモデル化してモデルパラメータを求める。
量子化雑音モデル生成部17によるモデルパラメータの算出法として、以下に非線形推定による実施例を述べる。原信号をs(t)、復元信号をx(t)とすると、量子化雑音信号y(t)は式(1)により表される。
Figure 2013167783
ここで、本実施形態では、量子化雑音信号y(t)を式(2)に示す多項式でモデル化する。
Figure 2013167783
ここで、時間区間[0,T]上で、量子化雑音信号y(t)と式(2)によりモデル化した量子化雑音信号との差分を示す式(3)を最小化するモデルパラメータA、A、A、A・・・を求める。
Figure 2013167783
式(3)を各モデルパラメータAで偏微分して0と置くことにより、モデルパラメータAの推定式として式(4)、式(5)が得られる。
Figure 2013167783
量子化雑音モデル生成部17は、式(4)および式(5)で表される量子化雑音信号のモデルパラメータを伝送部18に出力する。
伝送部18は、符号化部13からの符号化信号と、量子化雑音モデル生成部17からのモデルパラメータとを受信装置2に送信する。
図2は、本発明の第1の実施形態に係る受信装置2の機能ブロック図である。受信装置2は、受信部21と、復号部22と、逆行列変換部23と、量子化雑音信号生成部24と、合成部25と、音響信号出力部26とを備える。
受信部21は、伝送装置1から符号化信号とモデルパラメータとを受信し、符号化信号を復号部22に出力し、モデルパラメータを量子化雑音信号生成部24に出力する。
復号部22は、符号化信号を復号して復号信号を生成し、復号信号を逆行列変換部23に出力する。
逆行列変換部23は、復号信号を逆行列変換して22.2チャネル音響信号の復元信号を生成し、復元信号を量子化雑音信号生成部24及び合成部25に出力する。
量子化雑音信号生成部24は、モデルパラメータに基づき、符号化により生じる量子化雑音信号を復元信号の関数としてモデル化して推定する。具体的には、量子化雑音信号生成部24は、伝送装置1から受信した式(4)及び式(5)で表されるモデルパラメータにより、量子化雑音信号を式(6)により推定し、推定した量子化雑音信号を合成部25に出力する。なお、Mは予め設定された多項式の次数である。
Figure 2013167783
合成部25は、逆行列変換部23からの復元信号及び量子化雑音信号生成部24が推定した量子化雑音信号に基づき、復元信号から量子化雑音信号を除去した22.2チャネル音響方式の再生用信号を生成する。具体的には、合成部25は、式(7)により、再生用信号を合成する。
Figure 2013167783
音響信号出力部26は、スピーカなどの報知装置を通じて、再生用信号を視聴者に音として出力する。
このように、本実施形態によれば、伝送装置1は、原信号と復元信号との差分である量子化雑音信号を復元信号の関数としてモデル化し、モデルパラメータを受信装置2に伝送する。受信装置2は、モデルパラメータに基づき量子化雑音信号を推定し、復元信号から推定した量子化雑音信号を除去する。このため、多チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音を低減することが可能となる。特に、例えば、スーパーハイビジョン用の22.2チャネル音響信号を伝送する場合において、伝送信号の最初の2チャネル信号として2チャネルステレオ信号を伝送し、最初の6チャネル信号から5.1チャネル信号を復元可能とすることにより、2チャネルあるいは5.1チャネル用受像機の回路規模を縮小可能とする場合においても、高品質かつ1/10程度のビットレートで符号化・伝送することが可能となる。また、例えば、スーパーハイビジョン用の22.2チャネル音響信号を、主要な空間情報を表す8〜10チャネルの基本信号と、元の信号を復元するための補助信号に分離して伝送し、主要な空間情報に対しては高いビットレートを割当て、補助信号に対してはビットレートを抑制するような場合に対しても、量子化雑音の少ない符号化・伝送が可能となる。
(第2の実施形態)
第2の実施形態において、伝送装置1及び受信装置2は、22.2チャネル音響方式の原信号について、当該原信号を表すモデルの基礎的な情報を予め共有している。例えば、伝送装置1及び受信装置2は、原信号を表すモデルとして、M次の多項式を用いるといった情報を予め共有している。伝送装置1は、符号化した22.2チャネル音響信号に加え、原信号のモデルパラメータ(例えば多項式の係数)を送信することにより、受信装置2は、モデルパラメータを反映させたモデルより原信号を推定することが可能となる。
図3は、本発明の第2の実施形態に係る伝送装置1の機能ブロック図である。第2の実施形態に係る伝送装置1は、第1の実施形態に係る伝送装置1の量子化雑音モデル生成部17を、原信号モデル生成部19に置き換えて構成されたものである。第1の実施形態と同じ参照符号で示す機能ブロックについては、第1の実施形態と同様の動作をするものであり、重複する説明は省略する。
原信号モデル生成部19は、音響信号入力部11からの原信号及び復元部14(復元用逆行列変換部16)からの復元信号に基づき、原信号を復元信号の関数としてモデル化してモデルパラメータを求める。
原信号モデル生成部19によるモデルパラメータの算出法として、以下に非線形推定による実施例を述べる。原信号をs(t)、復元信号をx(t)とし、本実施形態では、原信号s(t)を式(8)に示す多項式でモデル化する。
Figure 2013167783
ここで、時間区間[0,T]上で、原信号s(t)と式(8)によりモデル化した原信号との差分を示す式(9)を最小化するモデルパラメータA、A、A、A・・・を求める。
Figure 2013167783
式(9)を各モデルパラメータAで偏微分して0と置くことにより、モデルパラメータAの推定式として式(10)、式(11)が得られる。
Figure 2013167783
原信号モデル生成部19は、式(10)および式(11)で表される原信号のモデルパラメータを伝送部18に出力する。
伝送部18は、符号化部13からの符号化信号と、原信号モデル生成部19からのモデルパラメータとを受信装置2に送信する。
図4は、本発明の第2の実施形態に係る受信装置2の機能ブロック図である。第2の実施形態に係る受信装置2は、第1の実施形態に係る受信装置2の量子化雑音信号生成部24及び合成部25を原信号生成部27に置き換えて構成されたものである。第1の実施形態と同じ参照符号で示す機能ブロックについては、第1の実施形態と同様の動作をするものであり、重複する説明は省略する。
原信号生成部27は、モデルパラメータに基づき、原信号を復元信号の関数としてモデル化して推定する。具体的には、原信号生成部27は、伝送装置1から受信した式(10)及び式(11)で表されるモデルパラメータにより、原信号を式(12)により推定し、推定した原信号を再生用信号として音響信号出力部26に出力する。なお、Mは予め設定された多項式の次数である。
Figure 2013167783
このように、本実施形態によれば、伝送装置1は、原信号を復元信号の関数としてモデル化したモデルパラメータを受信装置2に伝送し、受信装置2は、モデルパラメータに基づき原信号を推定する。このため、量子化雑音のない原信号を直接推定できるため、多チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音を低減することが可能となる。
(実験例)
図5は、第1の実施形態に係る多チャネル音響システムの実験結果の一例を示す図である。本実験は、22.2チャネル音響の原信号を行列変換により2チャネルの伝送信号に変換し、伝送信号をAAC符号化して伝送するものであり、0Hz〜24kHzの帯域の信号を1kHzの等帯域幅で分割した24種類の信号を原信号として実験を行っている。図5に示す帯域番号mは、(m−1)KHzからmKHzまでの帯域の信号を示すものであって、例えば帯域番号3の原信号は、2KHzから3KHzまでの帯域の信号を示すものである。
本実験において、量子化雑音信号のモデル化には多項式近似を用い、多項式の次数(推定次数)を変化させ各原信号における量子化雑音の変化の評価を行った。量子化雑音の変化の評価には、量子化雑音の除去を行わない場合(即ち、多項式の次数が0である場合)を1、量子化雑音がない場合を0として正規化した正規化雑音エネルギーを用いた。即ち、正規化雑音エネルギーが1に近いほど量子化雑音の除去が進んでおらず、0に近いほど量子化雑音の除去が進んでいることを表す。
図5(a)は全チャネルの正規化雑音エネルギーの平均を示すものであり、図5(b)は量子化雑音が顕著なチャネルの正規化雑音エネルギーを示すものである。図5(a)(b)いずれも、例えば帯域番号1、3など、比較的周波数が低い帯域の原信号は、正規化雑音エネルギーが1に近い値となっている。これは、AAC符号化においては、人間の聴覚に影響を与えやすい周波数帯では符号化が高精度に行われるため、発生する量子化雑音自体が少なく、結果的に、多項式の次数によらず、正規化雑音エネルギーの減少が抑えられるためである。一方、帯域番号6、9、16など、比較的周波数が高い帯域の原信号では、多項式の次数に応じて正規化雑音エネルギーが減少している。これは、AAC符号化においては、人間の聴覚に影響を与えにくい周波数帯では符号化の精度が低下するため、発生する量子化雑音が大きくなるが、多項式を用いたモデル化を行うことにより、正規化雑音エネルギーが減少していることを示すものである。
上記結果より、AAC符号化など人間の聴覚特性に基づく符号化方式においては、量子化雑音モデル生成部17は、量子化雑音信号のモデル化の要否を、原信号の周波数帯域毎に判定することが有効といえる。即ち、量子化雑音モデル生成部17は、原信号のうち、符号化が高精度に行われる周波数帯域の原信号については、量子化雑音信号のモデル化を行わず、符号化の精度が低い周波数帯域の原信号についてのみ、量子化雑音信号のモデル化を行うように制御することが可能となる。かかる制御により、必要な周波数帯域についてのみ量子化雑音信号のモデル化が行うことができるため、計算負荷を低減させながら量子化雑音を効果的に除去することが可能となる。なお、第2の実施形態に係る原信号モデル生成部19も、量子化雑音モデル生成部17と同様の制御を行うことができることは言うまでもない。
また、例えば、図5(a)では帯域番号16の正規化雑音エネルギーは、次数が1の時点で大きく低減し、それ以降の次数においてあまり変化が見られないが、帯域番号6、9では、推定次数が1、3と高次になるにつれ、正規化雑音エネルギーが減少している。
上記結果より、量子化雑音信号を多項式によりモデル化する場合、量子化雑音モデル生成部17は、周波数帯域毎に次数を決定することが有効といえる。即ち、量子化雑音モデル生成部17は、高い次数でモデル化することが好ましい周波数帯域は高い次数で、低い次数でモデル化することが好ましい周波数帯域は低い次数でモデル化するという制御が可能となる。かかる制御により、周波数帯域の特性に合わせたモデル化が行うことができるため、計算負荷を低減させながら量子化雑音を効果的に除去することが可能となる。具体的には、上記結果より、量子化雑音モデル生成部17は、高い周波数帯域では低い次数(例えば1次)で、低い周波数帯域では高い次数(例えば3次)でモデル化することにより、計算負荷を低減させながら量子化雑音を効果的に除去することが可能となる。なお、第2の実施形態に係る原信号モデル生成部19も、量子化雑音モデル生成部17と同様の制御を行うことができることは言うまでもない。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各機能部、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の機能部やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。
例えば、図5において一例を示すとおり、上述した量子化雑音モデル及び原信号モデルに基づく量子化雑音の低減は、周波数帯域ごとに行うことも可能である。すなわち、伝送装置1は、原信号及び復元信号を帯域通過フィルタで複数の帯域に分割し、帯域毎に、量子化雑音モデルの場合は式(4)、式(5)により、原信号モデルの場合は式(10)、式(11)により、モデルパラメータを求めることができる。この場合、受信装置2でも、復元信号を複数の帯域に分割し、帯域ごとに、量子化雑音モデルの場合は式(7)により、原信号モデルの場合は推定した原信号モデルとして、雑音を除去した信号を求めれば良い。
また、量子化雑音モデル及び原信号モデルのモデルパラメータの計算に関する時間区間[0、T]を、時間窓関数により複数の時間区間に分割して、当該時間区間毎に量子化雑音を除去することも可能である。さらに、周波数帯域の分割と、時間区間の分割とを併用することが可能であることも言うまでもない。
また、上記実施形態では、量子化雑音モデル及び原信号モデルの一例として、多項式を用いたモデル化を記載したが、量子化雑音モデル及び原信号モデルには、ヴォルテラ級数など、他の任意の非線形関数を用いることが可能である。また、上記実施形態では、伝送装置1及び受信装置2は、量子化雑音モデル及び原信号モデルの基礎的な情報を予め共有しているとして説明を行ったが、例えば、伝送装置1及び受信装置2がそれぞれ複数のモデルパターンを保持しており、制御メッセージなどにより使用するモデルパターンに関する情報を適宜交換することも可能である。さらに、使用するモデルパターンを受信装置2が保持していない場合、伝送装置1は、使用する新たなモデルパターンに関する情報を制御メッセージなどにより通知することも可能である。
また、上記実施形態では、多チャネル音響方式の原信号を22.2チャネル音響、行列変換後の伝送信号を2チャネルステレオ信号として説明を行ったが、本発明は、他の5.1チャネル音響、7.1チャネル音響など任意の多チャネル音響方式であって、符号化伝送に関し信号の行列変換を伴う処理全般に適応可能なことは言うまでもない。また、行列変換などの線形処理を伴う信号として、アンビソニックス等の音響信号に対しても適用可能である。
また、上記実施形態では、符号化方式としてAACを例に説明をしたが、本発明におけるAAC符号化とは、MPEG2−AAC、MPEG4−AAC、HE−AACなど、AACに関するあらゆるバージョンを包括するものである。また、本発明が対応可能な符号化はAACに限定されず、人間の聴覚特性に基づいて高品質に符号化する方式であれば、任意の符号化方式に対応可能である。
なお、本発明は、伝送装置1および受信装置2が有するプロセッサに同等の処理(ステップ)を実行させるプログラムとしても実現し得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。例えば、伝送装置1および受信装置2は、各機能を実現する処理内容を記述したプログラムを記憶部(図示せず)に格納しておき、中央演算処理装置(CPU)によって当該プログラムを読み出して実行することができる。
本発明によれば、多チャネル音響方式の原信号を行列変換した伝送信号を符号化する際に生じる量子化雑音を低減することが可能になるという有用性がある。
1 音響信号入力部
12 行列変換部
13 符号化部
14 復元部
15 復元用復号部
16 復元用逆行列変換部
17 量子化雑音モデル生成部(モデル生成部)
18 伝送部
19 原信号モデル生成部(モデル生成部)
2 受信装置
21 受信部
22 復号部
23 逆行列変換部
24 量子化雑音信号生成部
25 合成部
26 音響信号出力部
27 原信号生成部
ここで、本実施形態では、量子化雑音信号y(t)を式(2)に示す多項式でモデル化する。
Figure 2013167783
量子化雑音信号生成部24は、モデルパラメータに基づき、符号化により生じる量子化雑音信号を復元信号の関数としてモデル化して推定する。具体的には、量子化雑音信号生成部24は、伝送装置1から受信した式(4)及び式(5)で表されるモデルパラメータにより、量子化雑音信号を式(6)により推定し、推定した量子化雑音信号を合成部25に出力する。なお、Mは予め設定された多項式の次数である。
Figure 2013167783
合成部25は、逆行列変換部23からの復元信号及び量子化雑音信号生成部24が推定した量子化雑音信号に基づき、復元信号から量子化雑音信号を除去した22.2チャネル音響方式の再生用信号を生成する。具体的には、合成部25は、式(7)により、再生用信号を合成する。
Figure 2013167783
原信号モデル生成部19によるモデルパラメータの算出法として、以下に非線形推定による実施例を述べる。原信号をs(t)、復元信号をx(t)とし、本実施形態では、原信号s(t)を式(8)に示す多項式でモデル化する。
Figure 2013167783
原信号生成部27は、モデルパラメータに基づき、原信号を復元信号の関数としてモデル化して推定する。具体的には、原信号生成部27は、伝送装置1から受信した式(10)及び式(11)で表されるモデルパラメータにより、原信号を式(12)により推定し、推定した原信号を再生用信号として音響信号出力部26に出力する。なお、Mは予め設定された多項式の次数である。
Figure 2013167783

Claims (14)

  1. 多チャネル音響方式に対応した伝送装置及び受信装置を備える多チャネル音響システムであって、
    前記伝送装置は、
    前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、
    前記伝送信号を符号化した符号化信号を生成する符号化部と、
    前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、
    前記原信号と前記復元信号との差分である量子化雑音信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、
    前記符号化信号と、前記モデルパラメータとを前記受信装置に伝送する伝送部と、を備え、
    前記受信装置は、
    前記符号化信号と、前記モデルパラメータとを受信する受信部と、
    前記符号化信号を復号して復号信号を生成する復号部と、
    前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、
    前記モデルパラメータに基づき、前記量子化雑音信号を前記復元信号の関数としてモデル化して推定する量子化雑音信号生成部と、
    前記復元信号から推定した前記量子化雑音信号を除去する合成部と、を備える多チャネル音響システム。
  2. 多チャネル音響方式に対応した伝送装置及び受信装置を備える多チャネル音響システムであって、
    前記伝送装置は、
    前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、
    前記伝送信号を符号化した符号化信号を生成する符号化部と、
    前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、
    前記原信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、
    前記符号化信号と、前記モデルパラメータとを前記受信装置に伝送する伝送部と、を備え、
    前記受信装置は、
    前記符号化信号と、前記モデルパラメータとを受信する受信部と、
    前記符号化信号を復号して復号信号を生成する復号部と、
    前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、
    前記モデルパラメータに基づき、前記原信号を前記復元信号の関数としてモデル化して推定する原信号生成部と、を備える多チャネル音響システム。
  3. 前記モデル生成部は、周波数帯域毎に前記モデル化して前記モデルパラメータを求める、請求項1又は2に記載の多チャネル音響システム。
  4. 前記モデル生成部は、前記周波数帯域毎に、前記モデル化の要否を判定する、請求項3に記載の多チャネル音響システム。
  5. 前記モデル生成部は、前記モデル化を多項式で行い、前記周波数帯域毎に前記多項式の次数を決定する、請求項3又は4に記載の多チャネル音響システム。
  6. 前記モデル生成部は、高い周波数帯域ほど次数が低くなるように、前記多項式の次数を決定する、請求項5に記載の多チャネル音響システム。
  7. 多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、
    前記伝送信号を符号化した符号化信号を生成する符号化部と、
    前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、
    前記原信号と前記復元信号との差分である量子化雑音信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、
    前記符号化信号と、前記モデルパラメータとを伝送する伝送部と、を備える伝送装置。
  8. 多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信する受信部と、
    前記符号化信号を復号して復号信号を生成する復号部と、
    前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、
    前記モデルパラメータに基づき、前記量子化雑音信号を前記復元信号の関数としてモデル化して推定する量子化雑音信号生成部と、
    前記復元信号から推定した前記量子化雑音信号を除去する合成部と、を備える受信装置。
  9. 多チャネル音響方式に対応した伝送装置に、
    前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換するステップと、
    前記伝送信号を符号化した符号化信号を生成するステップと、
    前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成するステップと、
    前記原信号と前記復元信号との差分である量子化雑音信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるステップと、
    前記符号化信号と、前記モデルパラメータとを伝送するステップと、を実行させるための伝送用プログラム。
  10. 多チャネル音響方式に対応した受信装置に、
    前記多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信するステップと、
    前記符号化信号を復号して復号信号を生成するステップと、
    前記復号信号を逆行列変換して復元信号を生成するステップと、
    前記モデルパラメータに基づき、前記量子化雑音信号を前記復元信号の関数としてモデル化して推定するステップと、
    前記復元信号から推定した前記量子化雑音信号を除去するステップと、を実行させるための受信用プログラム。
  11. 多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換する行列変換部と、
    前記伝送信号を符号化した符号化信号を生成する符号化部と、
    前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成する復元部と、
    前記原信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるモデル生成部と、
    前記符号化信号と、前記モデルパラメータとを伝送する伝送部と、を備える伝送装置。
  12. 多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信する受信部と、
    前記符号化信号を復号して復号信号を生成する復号部と、
    前記復号信号を逆行列変換して復元信号を生成する逆行列変換部と、
    前記モデルパラメータに基づき、前記原信号を前記復元信号の関数としてモデル化して推定する原信号生成部と、を備える受信装置。
  13. 多チャネル音響方式に対応した伝送装置に、
    前記多チャネル音響方式の原信号を行列変換により原信号より少ないチャネルの伝送信号に変換するステップと、
    前記伝送信号を符号化した符号化信号を生成するステップと、
    前記符号化信号の復号及び逆行列変換を行い前記原信号の復元信号を生成するステップと、
    前記原信号を前記復元信号の関数としてモデル化してモデルパラメータを求めるステップと、
    前記符号化信号と、前記モデルパラメータとを伝送するステップと、を実行させるための伝送用プログラム。
  14. 多チャネル音響方式に対応した受信装置に、
    前記多チャネル音響方式の原信号より少ないチャネルに行列変換された伝送信号を符号化した符号化信号と、符号化により生じる量子化雑音信号をモデル化するモデルパラメータとを受信するステップと、
    前記符号化信号を復号して復号信号を生成するステップと、
    前記復号信号を逆行列変換して復元信号を生成するステップと、
    前記モデルパラメータに基づき、前記原信号を前記復元信号の関数としてモデル化して推定するステップと、を実行させるための受信用プログラム。
JP2012031368A 2012-02-16 2012-02-16 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム Pending JP2013167783A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012031368A JP2013167783A (ja) 2012-02-16 2012-02-16 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
PCT/JP2013/000837 WO2013121793A1 (ja) 2012-02-16 2013-02-15 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012031368A JP2013167783A (ja) 2012-02-16 2012-02-16 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム

Publications (1)

Publication Number Publication Date
JP2013167783A true JP2013167783A (ja) 2013-08-29

Family

ID=49178210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012031368A Pending JP2013167783A (ja) 2012-02-16 2012-02-16 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム

Country Status (1)

Country Link
JP (1) JP2013167783A (ja)

Similar Documents

Publication Publication Date Title
JP6869322B2 (ja) 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置
JP5292498B2 (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
CN101253557B (zh) 立体声编码装置及立体声编码方法
EP2973551B1 (en) Reconstruction of audio scenes from a downmix
US20130230176A1 (en) Method and an Apparatus for Encoding/Decoding a Multichannel Audio Signal
US20110112843A1 (en) Signal analyzing device, signal control device, and method and program therefor
JP5201375B2 (ja) チャネル間及び一時的冗長度抑圧を用いた音声信号符号化
EP2702775B1 (en) Processing stereophonic audio signals
JP2008033269A (ja) デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
EP3987516B1 (en) Coding scaled spatial components
EP2264698A1 (en) Stereo signal converter, stereo signal reverse converter, and methods for both
WO2013121793A1 (ja) 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
JP2014052415A (ja) 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
JP5345024B2 (ja) 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP2013167783A (ja) 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
CN111179951B (zh) 包括编码hoa表示的位流的解码方法和装置、以及介质
JP2006047561A (ja) オーディオ信号符号化装置およびオーディオ信号復号化装置
JP5483813B2 (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
CN105336334B (zh) 多声道声音信号编码方法、解码方法及装置
JP2006267943A (ja) ステレオオーディオ信号符号化方法およびステレオオーディオ信号符号化装置
JP5680391B2 (ja) 音響符号化装置及びプログラム
WO2021172054A1 (ja) 信号処理装置および方法、並びにプログラム
JP2006270649A (ja) 音声・音響信号処理装置およびその方法
JP2013050663A (ja) 多チャネル音響符号化装置およびそのプログラム
JP2013050658A (ja) 多チャネル音響符号化装置およびそのプログラム