WO2005122639A1

WO2005122639A1 - 音響信号符号化装置および音響信号復号装置

Info

Publication number: WO2005122639A1
Application number: PCT/JP2005/010811
Authority: WO
Inventors: Yoshiaki Takagi
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-06-14
Filing date: 2005-06-13
Publication date: 2005-12-22
Also published as: EP1768451A1; JP2005352396A; EP1768451A4; US20080052089A1

Abstract

ここに開示された音響信号符号化装置は、マルチチャンネル再生時の頭部伝達特性を模擬する２×Ｎの行列で表される係数を含む係数テーブル１７と、この係数テーブル１７にしたがってＮチャンネルの周波数領域信号をダウンミックスして２チャンネルのダウンミックス信号を生成する第１信号出力部１２と、前記ダウンミックス信号をマルチチャンネル信号に戻す補助情報を生成する第２信号出力部１４とを備えることにより、ダウンミックス信号が所望の伝達関数でフィルタ処理された信号となり、第１符号化信号のみで、マルチチャンネル信号の空間情報が反映され、且つ、第２符号化信号を用いることにより元のマルチチャンネル信号が再現できることとなる。

Description

明細書

音響信号符号化装置および音響信号復号装置

技術分野

[0001] 本発明は、マルチチャンネル信号を符号ィ匕する音響信号符号ィ匕装置および符号化された信号を復号する音響信号復号装置に関する。

背景技術

[0002] 従来から、マルチチャンネル信号を安価な再生装置、とりわけヘッドフォンなどに接続した 2チャンネルの再生装置で再生することができるような符号ィ匕信号を生成するオーディオエンコーダ (音響信号符号化装置)の研究開発が行われて、る。マルチチャンネル信号をチャンネル数の削減された信号に変換することを一般的にダウンミッタスと呼ぶ。例えば、 MPEG2オーディオ規格（ISO 13818— 3)に準拠したマルチチャンネル用エンコーダとマルチチャンネル用デコーダが研究開発されて、る。このマルチチャンネル用エンコーダは、以下の演算、すなわち

[0003] [数 1]

L₀ = L + l

R₀ = R + r

= -ι

(L、 R、 1、 rは、それぞれ受聴者に対する左前スピーカ、右前スピーカ、左後スピー力、右後スピーカから出力される信号を示す。 )

を用いてマルチチャンネル信号 L、 R、 1、 rを 2つのスピーカまたはヘッドフォンなどで再生できるように 2チャンネルにダウンミックスした信号 L0、 R0と、このダウンミックスされた信号 L0、 R0をマルチチャンネル信号に戻すための信号 10、 rOとを分けて、それぞれ第 1符号化信号、第 2符号ィ匕信号として符号ィ匕するようになつている。一方、従来の安価な 2チャンネル信号再生用のデコーダ (復号装置)は上記第 1符号化信号 L0 R0のみを復号する力マルチチャンネル用デコーダは、以下の演算、すなわち

[0005] [数 2]

= 0 + /₀ = + r₀

[0006] を用いて第 1符号化信号 LO RO、第 2符号化信号 10 rOから元のマルチチャンネル信号 L R 1 rを復号するようになっている。

[0007] また、 DVDオーディオのような媒体上のマルチチャンネル信号を扱うものとして、マルチチャンネル信号を入力し、 2チャンネルにダウンミックスした信号 L0 R0のサブストリームと、このダウンミックスされた信号 L0 R0をマルチチャンネル信号に戻すための信号 10 rOのサブストリームとの 2つのサブストリームに符号化した後に、一つのストリームに多重化するマルチチャンネル用エンコーダと、多重化されたストリームを 2 つの符号ィ匕されたサブストリームに分割し、一方の 2チャンネルにダウンミックスした信号 L0 R0のサブストリームを復号することによって 2チャンネル用デコーダがダウンミックスされた 2チャンネルの信号の復号ィ匕処理を実行できるようすると同時に、 2チヤンネルにダウンミックスした信号 L0 R0のサブストリームと、このダウンミックスされた信号 L0 R0をマルチチャンネル信号に戻すための信号 10 rOのサブストリームとの 2 つのサブストリームを用いて元のマルチチャンネル信号を復号できるようにしたマルチチャンネル用デコーダが開示されて、る（例えば特許文献 1参照)。 [0008] さらに、元の空間情報を再現した上で、ダウンミックスされた 2チャンネル信号を再生しようとした場合の従来の 2チャンネル用デコーダおよびマルチチャンネル用デコーダを構成する音響信号復号装置のブロック図を、図 7に示す。ここで所定の数のチヤンネル数のマルチチャンネル信号からダウンミックスにより変換されたチャンネル数の削減された信号を「ダウンミックス信号」と呼ぶものとする。

[0009] 図 7に示すように、音響信号復号装置 70は、ビットストリーム B力ダウンミックス符号ィ匕信号および補助情報符号ィ匕信号を抽出する逆多重化部 71と、前記ダウンミックス符号ィ匕信号から 2チャンネルの周波数領域のオーディオ信号であるダウンミックス信号 LO、 ROを生成する第 1復号部 72と、前記補助情報符号化信号から補助情報 10 、 rOを生成する第 2復号部 73と、前記ダウンミックス信号 LO、 ROと前記補助情報 10、 rOとからマルチチャンネル信号を生成する逆ミックス部 74と、前記マルチチャンネル信号力時間領域のオーディオ信号 L'、 R'、 1'、 r'を生成する周波数時間変換部 75 と、マルチチャンネル信号再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含む N X Nの正方行列の逆行列である係数テーブル 76と、周波数時間変換部 75に生成された時間領域のオーディオ信号を係数テーブル 76により頭部伝達関数に基づ、て空間情報をフィルタ処理して 2チャンネルのオーディオ信号 Ll、 R1 を生成する頭部伝達関数模擬部 77とを備え、頭部伝達関数模擬部 77にお、て空間情報の合成処理演算を行うことによりヘッドフォンなどで視聴可能な元の空間情報を再現した高品質の 2チャンネルのオーディオ信号 L 1、 R1を得られるようになつている。

特許文献 1：特表 2002— 541524号公報

発明の開示

発明が解決しょうとする課題

[0010] し力しながら、 MPEG2オーディオ規格では、復号されたダウンミックス信号は、各サンプル時刻ごとに所定のマトリックス演算によってダウンミックスされているので、もともとのマルチチャンネル信号の空間情報が失われている。したがって、元の空間情報を再現した高品質の 2チャンネル信号を再生しょうとする場合、つまり、仮想サラウンド処理を施した 2チャンネル信号を再生する場合、上記の音響信号復号装置のように、一旦、第 1符号化信号 L0、 R0と第 2符号ィ匕信号 10、 rOとを用いてマルチチャンネル信号を復号した後、頭部伝達関数模擬部 77により係数テーブル 76に模擬された頭部伝達関数に基づ、て空間情報をフィルタ処理する必要があり、このフィルタ処理に多大の演算処理を費やさなければならな、と、う問題があった。

[0011] 本発明は、このような従来の問題を解決するためになされたもので、ダウンミックス信号を再生するだけで元のマルチチャンネルの空間情報が再生できる符号化情報を生成する音響信号符号ィ匕装置および符号ィ匕情報カゝらダウンミックス信号を再生するだけで元のマルチチャンネルの空間情報を再生する音響信号復号装置を提供することを目的とする。

課題を解決するための手段

[0012] 本発明の第 1の態様に係る音響信号符号化装置は、 Nチャンネルの信号を周波数領域に変換する時間周波数変換手段と、前記 Nチャンネルの周波数領域信号をダゥンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力手段と、前記ダウンミックス信号をマルチチャンネル信号に戻すための補助情報を生成する第 2 信号出力手段と、前記ダウンミックス信号を符号化し第 1符号ィ匕信号を生成する第 1 符号化手段と、前記補助情報を符号化し第 2符号化信号を生成する第 2符号化手段と、前記第 1符号化信号と前記第 2符号化信号とを多重化する多重化手段と、伝達特性を実現する係数が周波数毎に記述された係数テーブルとを備え、前記 Nは 3以上の整数であり、前記係数テーブルは、 N X Nの正方行列であり、マルチチャンネル再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含み、残りの（N— 2) X Nの行列で表される係数は前記 2 X Nの行列で表される係数を符号反転および並び替えした値によって構成され、前記第 1信号出力手段は、前記係数テーブルにしたがって前記 Nチャンネルの周波数領域信号を前記 2チャンネルの信号にダウンミッタスし、前記第 2信号出力手段は、前記係数テーブルにしたがって前記ダウンミックス信号の前記補助情報を生成することを特徴とした構成を有している。

[0013] この構成により、ダウンミックス信号が所望の伝達関数でフィルタ処理された信号となり、第 1符号化信号のみを再生した場合でも、マルチチャンネル信号の空間情報が反映され、且つ、第 2符号ィ匕信号を用いることにより元のマルチチャンネル信号を再現する符号化信号を生成することができる。

[0014] また、本発明の音響信号符号化装置は、異なる前記伝達特性を実現する係数から構成される前記係数テーブルを複数備え、さらに、前記係数テーブルを用途に応じて選択する係数テーブル選択手段とを備え、前記多重化手段は、前記第 1符号化信号と前記第 2符号化信号とともに、前記係数テーブル選択手段に選択された前記係数テーブルを示す指標を多重化することを特徴とした構成を有しても良い。

[0015] この構成により、目的に応じて前記係数テーブルを選択し、選択した係数テーブルを特定する指標を多重化するので、マルチチャンネル再生時に必要な係数の種類を、少ないビット使用量で復号装置に伝達することができる。

[0016] さらに、本発明の第 2の態様に係る音響信号復号装置は、前記音響信号符号化装置によって生成されたビットストリーム力もダウンミックス符号のみを抽出する逆多重化手段と、前記ダウンミックス符号から 2チャンネルの周波数領域のオーディオ信号を生成する復号手段と、前記周波数領域のオーディオ信号から時間領域のオーディォ信号を生成する周波数時間変換手段とを備えたことを特徴とした構成を有している

[0017] この構成により、ダウンミックス信号と補助情報とが多重化されたビットストリームからダウンミックス符号のみを抽出し、前記ダウンミックス符号から 2チャンネルの周波数領域のオーディオ信号を生成して、ダウンミックス信号のみを復号し、補助情報に対しての復号処理を行わな、ので、少な、演算量でダウンミックス信号を再生することができる。

[0018] さらに、本発明の音響信号復号装置は、前記音響信号符号化装置によって生成されたビットストリーム力ダウンミックス符号および補助情報符号を抽出する逆多重化手段と、前記ダウンミックス符号から 2チャンネルの周波数領域のオーディオ信号であるダウンミックス信号を生成する第 1の復号手段と、前記補助情報符号から補助情報を生成する第 2の復号手段と、前記ダウンミックス信号と前記補助情報とからマルチチャンネル信号を生成する逆ミックス手段と、前記マルチチャンネル信号から時間領域のオーディオ信号を生成する周波数時間変換手段と、マルチチャンネル再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含む N X Nの正方行列の逆行列である係数テーブルとを備え、前記逆ミックス手段は、前記係数テーブルを用 V、て前記マルチチャンネル信号を生成することを特徴とした構成を有しても良!、。

[0019] この構成により、ビットストリーム力ダウンミックス符号および補助情報符号を抽出、復号し、頭部伝達特性を模擬する行列の逆行列である係数テーブルを用いて、ダウンミックス信号と補助情報とからマルチチャンネル信号を生成するので、ダウンミックス信号が伝達特性を含む信号であっても、元のマルチチャンネル信号を再生することがでさる。

[0020] さらに、本発明の音響信号復号装置は、前記ダウンミックス信号を出力するか前記マルチチャンネル信号を出力するかを選択的に切り替える出力チャンネル切替え手段を備え、前記周波数時間変換手段は、前記出力チャンネル切替え手段に選択出力された信号力前記時間領域のオーディオ信号を生成することを特徴とした構成を有しても良い。

[0021] この構成により、前記ダウンミックス信号を出力するか前記マルチチャンネル信号を出力するかを選択的に切り替え、この出力選択された信号力時間領域のオーディォ信号を生成するので、 2チャンネルのダウンミックス信号の再生とマルチチャンネル信号の再生とを、共通の構成要素で実現することができる。

[0022] さらに、本発明の音響信号符号化装置は、前記係数テーブルは、空間伝達特性を模擬する係数が含まれる構成を有しても良ヽ。

[0023] この構成により、 2つのスピーカを使用する場合など、部屋の大きさに応じて適切な仮想サラウンド処理を施した 2チャンネルの信号を再生することが可能となる。

発明の効果

[0024] 本発明は、 Nチャンネルの周波数領域信号をダウンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力手段と、前記ダウンミックス信号をマルチチヤンネル信号に戻すための補助情報を生成する第 2信号出力手段と、前記ダウンミックス信号を符号化し生成した第 1符号ィ匕信号と前記補助情報を符号化し生成した第 2 符号化信号とを多重化する多重化手段と、伝達特性を実現する係数が周波数毎に記述された係数テーブルとを備え、前記 Nは 3以上の整数であり、前記第 1信号出力手段および前記第 2信号出力手段は、前記係数テーブルにしたがって前記情報を生成することにより、ダウンミックス信号が所望の伝達関数でフィルタ処理された信号となり、第 1符号ィ匕信号のみを再生した場合でも、マルチチャンネル信号の空間情報が反映され、且つ、第 2符号ィ匕信号を用いることにより元のマルチチャンネル信号を再現することができるという効果を有する音響信号符号ィ匕装置および音響信号復号装置を提供することができるものである。

図面の簡単な説明

[0025] [図 1]本発明の第 1の実施の形態に係る音響信号符号化装置のブロック図

[図 2]頭部伝達関数を説明するための受聴者とスピーカの配置図

[図 3]本発明の第 2の実施の形態に係る音響信号符号化装置のブロック図圆 4]本発明の第 3の実施の形態に係る音響信号復号装置のブロック図

[図 5]本発明の第 4の実施の形態に係る音響信号復号装置のブロック図

[図 6]本発明の第 5の実施の形態に係る音響信号復号装置のブロック図

[図 7]従来の符号化信号により空間情報を再現する音響信号復号装置のブロック図符号の説明

[0026] 10、 20 音響信号符号化装置

11、 21 時間周波数変換部

12、 22 第 1信号出力部

13、 23 第 1符号化部

14、 24 第 2信号出力部

15、 25 第 2符号化部

16、 29 多重化部

17、 27 係数テーブル群

26 係数テーブル選択部

28 第 3符号化部

30、 40、 50 音響信号復号装置

31、 41、 51 逆多重化部

32 復号部

33、 45、 56 周波数時間変換部 42、 52 第 1復号部

43、 53 第 2復号部

44、 54 逆ミックス部

46、 57 係数テーブル

55 出力チャンネル切替え部

61 左前スピーカ

62 右前スピーカ

63 左後スピーカ

64 右後スピーカ

65 受聴者の頭部

70 音響信号復号装置

71 逆多重化部

72 第 1復号部

73 第 2復号部

74 逆ミックス部

75 周波数時間変換部

76 係数テーブル

77 頭部伝達関数模擬部

発明を実施するための最良の形態

[0027] 以下、本発明の実施の形態における音響信号符号化装置および音響信号復号装置について、図面を用いて説明する。

[0028] (第 1の実施の形態）

まず、本発明の第 1の実施の形態における音響信号符号化装置の構成を図 1を参照して説明する。

[0029] 図 1に示すように、本実施の形態に係る音響信号符号ィ匕装置 10は、 Nチャンネルのマルチチャンネル信号を周波数領域信号に変換する時間周波数変換部 11と、変換された Nチャンネルの周波数領域信号をダウンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力部 12と、前記ダウンミックス信号を符号化し第 1符号化信号を生成する第 1符号化部 13と、前記ダウンミックス信号を元の Nチャンネルのマルチチャンネル信号に戻すための補助情報を生成する第 2信号出力部 14と、前記補助情報を符号化し第 2符号化信号を生成する第 2符号化部 15と、前記第 1符号ィ匕信号と前記第 2符号ィ匕信号とを多重化する多重化部 16と、伝達特性を実現する係数が周波数毎に記述された、係数テーブル 17とを備えている。ここで Nは 3以上の整数とし、係数テーブル 17は図示されていないメモリなどの記憶媒体に記憶されているものとする。

[0030] 以上のように構成された音響信号符号ィ匕装置 10の動作について、以下に説明する。本実施の形態では理解を容易にするため、入力する Nチャンネルのマルチチヤンネル信号は、前方左側音響信号 L、前方右側音響信号 R、後方左側音響信号 1、後方右側音響信号 rの 4チャンネルの信号力構成されるものとする。

[0031] まず、時間周波数変換部 11は、入力された 4チャンネルの信号 L、 R、 1、 rをそれぞれ、フーリエ変換や、離散コサイン変換や、サブバンドフィルタ等に代表される手法を用いて、周波数領域の信号に変換する。

[0032] 次に、第 1信号出力部 12は、時間周波数変換部 11に変換された周波数領域の信号を、係数テーブル 17に格納された係数を用い、数式 (数 3)で表される演算によつてダウンミックスする。

[0033] [数 3]

L

a c a d R aL + cR + bl + dr

c a d b I cL + aR + dl + br

r

[0034] ここで用いられる係数 a、 b、 c、 dは、図 2に示される頭部伝達関数で、 2 X Nの行列で表されている。

[0035] 図 2において、受聴者の頭部 65に対して、左前スピーカ 61、右前スピーカ 62、左後スピーカ 63、右後スピーカ 64が設置されている。 Lは、左前スピーカから出力される信号、 Rは、右前スピーカから出力される信号、 1は、左後スピーカから出力される信号、 rは、右後スピーカから出力される信号、 Leは、左耳に到達した信号、 Reは、右耳に到達した信号を示す。

[0036] 係数 aは、左前スピーカ 61から左耳への伝達特性であり、係数 bは、右前スピーカ 6 2から左耳への伝達特性であり、係数 cは、左後スピーカ 63から左耳への伝達特性であり、係数 dは、右後スピーカ 64から左耳への伝達特性であり、これらを一組にしたものを「頭部伝達関数」という。

[0037] 音響信号符号化装置 10の動作説明に戻り、第 1符号化部 13は、第 1信号出力部 1 2から出力されたダウンミックス信号 LO、 ROを符号ィ匕し、第 1符号化信号を生成する。ここで、第 1符号ィ匕部 13による符号ィ匕は、例えば、 MPEG規格などで規定された符号化方式でも良い。

[0038] また、第 2信号出力部 14は、時間周波数変換部 11に変換された周波数領域の信号を、係数テーブル 17に格納される係数を用い、数式 (数 4)で表される演算によつて、前記ダウンミックスされた信号をマルチチャンネル信号に戻すための補助情報 10 、 rOを生成する。

[0039] [数 4]

L

a c b —d R aL + cR - bl - dr c a d b I cL -- aR - dl -- br

r

[0040] ここで用いられる係数 a、 b、 c、 dは（N— 2) X N、すなわち本実施の形態では 2 X N の行列で表されている。

[0041] 次に、第 2符号化部 15は、第 2信号出力部 14から出力された補助情報 10、 rOを符号化し、第 2符号化信号を生成する。第 2符号ィ匕部 15による符号ィ匕は、上記第 1符号ィ匕部 13と同様に、 MPEG規格などで規定された符号ィ匕方式でも良、。

[0042] そして、多重化部 16は、第 1符号化部 13に生成された第 1符号化信号と、第 2符号化部 15に生成された第 2符号ィ匕信号とを多重化し、 1つのビットストリーム Bを生成する。

[0043] よって、前記ビットストリーム Bに記述されて、る情報は、数式 (数 5)の行列式で表される。

[0044] [数 5] a c b d L aL + cR + ϋί + dr

c a d b R cL + aR+ dl + br

a c -b -d I aL-- cR-bl - dr

c a -d b r cL + aR - dl--br

[0045] ここで Hfを数式 (数 6)のように定義したとき、

[0046] [数 6]

[0047] 数式 (数 7)が得られる

[0048] [数 7]

[0049] ただし、（数 8)の逆行列が存在するため、受信側では、数式 (数 9)により元の 4チヤンネルの信号、 L、 R、 1、 rを抽出することが可能となる。

[0050] [数 8]

[0051] [数 9]

L ax -ex ax - cx

R -ex ax - cx ax

1 by -dy -by dy /。 r -dy by dy -by [0052] ここで x、 yは数式（数 10)で表される,

[0053] [数 10]

[0054] 上記のように、本実施の形態によれば、マルチチャンネル信号再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含む係数テーブル 17と、この係数テ一ブル 17にしたがって Nチャンネルの周波数領域信号をダウンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力部 12と、前記ダウンミックス信号をマルチチャンネル信号に戻すための補助情報を生成する第 2信号出力部 14とを備えることにより、ダウンミックス信号が所望の伝達関数でフィルタ処理された信号となり、第 1符号ィ匕信号のみを再生した場合でも、マルチチャンネル信号の空間情報が反映され、且つ、第 2符号ィ匕信号を用いることにより元のマルチチャンネル信号が再現できる符号ィ匕信号を生成することができることとなる。

[0055] (第 2の実施の形態）

次に、本発明の第 2の実施の形態における音響信号符号化装置の構成図を図 3に示し、説明する。

[0056] 図 3に示すように、本実施の形態に係る音響信号符号ィ匕装置 20は、 Nチャンネルのマルチチャンネル信号を周波数領域信号に変換する時間周波数変換部 21と、変換された Nチャンネルの周波数領域信号をダウンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力部 22と、前記ダウンミックス信号を符号化し第 1符号化信号を生成する第 1符号化部 23と、前記ダウンミックス信号をマルチチャンネル信号に戻すための補助情報を生成する第 2信号出力部 24と、前記補助情報を符号化し第 2符号化信号を生成する第 2符号化部 25と、目的に応じて第 1信号出力部 22 および第 2信号出力部 24で使用する伝達関数を選択する係数テーブル選択部 26と、各種の伝達特性を実現するための係数が周波数毎に記述された複数の係数テーブル群 27と、係数テーブル選択部 26が選択した係数テーブルを特定する指標となる第 3符号化信号を生成する第 3符号化部 28と、前記第 1符号化信号と前記第 2符号ィ匕信号と前記第 3符号ィ匕信号とを多重化する多重化部 29とを備えて、る。ここで Nは 3以上の整数とし、係数テーブル群 27は図示されて、な、メモリなどの記憶媒体に記憶されているものとする。また、時間周波数変換部 21、第 1信号出力部 22、第 1 符号化部 23、第 2信号出力部 24、第 2符号化部 25は、上記第 1の実施の形態で示した時間周波数変換部 11、第 1信号出力部 12、第 1符号化部 13、第 2信号出力部 1 4、第 2符号ィ匕部 15とそれぞれ同様のものである。

[0057] 以上のように構成された音響信号符号ィ匕装置 20の動作について、以下に説明する。本実施の形態では理解を容易にするため、入力する Nチャンネルのマルチチヤンネル信号を、前方左側音響信号 L、前方右側音響信号 R、後方左側音響信号 1、後方右側音響信号 rの 4チャンネルの信号力構成されるものとする。

[0058] まず、時間周波数変換部 21は、入力された 4チャンネルの信号をそれぞれ、フーリェ変換や、離散コサイン変換や、サブバンドフィルタ等に代表される手法を用いて、周波数領域の信号に変換する。

[0059] 次に、係数テーブル選択部 26は、第 1信号出力部 22において模擬せんとする伝達特性を構成する係数が記述された係数テーブルを、複数の係数テーブル群 27の中から選択する。複数の係数テーブル群 27には再生時の頭部伝達特性を模擬する各種係数が含まれている。これによりヘッドフォンや 2つのスピーカを使用する場合など、使用者の頭部の大きさに応じて適切な係数テーブルを選択することができるため、例えば使用者が大人の場合でも子供の場合でも適切な仮想サラウンド処理を施した 2チャンネルの信号を再生することが可能となる。さらに複数の係数テーブル群 27 には、模擬しょうとする頭部伝達係数だけでなぐ音響を聞く空間の空間伝達特性を模擬する空間伝達係数が含まれても良い。これにより、 2つのスピーカを使用する場合など、部屋の大きさに応じて適切な仮想サラウンド処理を施した 2チャンネルの信号を再生することが可能となる。

[0060] その後、第 1信号出力部 22は、時間周波数変換部 21に変換された周波数領域の信号を、係数テーブル選択部 26によって選択された係数テーブルに格納された係数を用い、

[0061] [数 11]

L

a c a d R aL + cR + bl + dr

c a d b I cL + aR + dl + br

r

[0062] の演算によってダウンミックスする。ここで用いられる係数 a、 b、 c、 dは 2 X Nの行列で表されている。

[0063] 次に、第 1符号ィ匕部 23は、第 1信号出力部 22から出力されたダウンミックス信号を符号化し、第 1符号化信号を生成する。ここで、第 1符号ィ匕部 23による符号ィ匕は、上記第 1の実施の形態における第 1符号ィ匕部 13と同様に、 MPEG規格などで規定された符号化方式でも良い。

[0064] また、第 2信号出力部 24は、時間周波数変換部 21に変換された周波数領域の信号を、係数テーブル選択部 26によって選択された係数テーブルに格納された係数を用い、

[0065] [数 12]

L

a c b —d R aL + cR - bl - dr c a d b I cL + aR - dl + br

r [0066] の演算によって、前記ダウンミックスされた信号をマルチチャンネル信号に戻すための補助情報を生成する。ここで用いられる係数 a、 b、 c、 dは (N— 2) X N、すなわち本実施の形態では 2 X Nの行列で表されて!/、る。

[0067] 次に、第 2符号化部 25は、第 2信号出力部 24から出力された補助情報を符号化し、第 2符号化信号を生成する。第 2符号ィ匕部 25による符号ィ匕は、上記第 1符号化部 2 3と同様に、 MPEG規格などで規定された符号ィ匕方式でも良い。

[0068] さらに、第 3符号ィ匕部 28によって、係数テーブル選択部 26で選択された係数がどのような伝達特性を模擬した力を参照可能とする、テーブル番号などの指標 nが第 3 符号化信号として記述される。

[0069] そして、多重化部 29は、第 1符号化部 23に生成された第 1符号化信号と、第 2符号化部 25に生成された第 2符号化信号と、第 3符号ィ匕部 28に生成された第 3符号ィ匕信号とを多重化し、 1つのビットストリーム Bを生成する。

[0070] 上記のように、本実施の形態によれば、各種の伝達特性を実現するための係数が周波数毎に記述された複数の係数テーブル群 27と、目的に応じて前記複数の係数テーブル群 27から所定の係数テーブルを選択する係数テーブル選択部 26と、選択された係数テーブルにしたがって Nチャンネルの周波数領域信号をダウンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力部 22と、係数テーブル選択部 26が選択した係数テーブルを特定する指標となる第 3符号化信号を生成する第 3符号ィ匕部 28とを備え、前記第 1符号ィ匕信号に加えて、ダウンミックス時に使用した係数テーブルを示す指標をビットストリーム上に配置することにより、マルチチヤンネル再生時に必要な係数の種類を、少な、ビット使用量で復号装置に伝達することがでさることとなる。

[0071] (第 3の実施の形態）

次に、本発明の第 3の実施の形態における音響信号復号装置の構成図を図 4に示し、説明する。

[0072] 図 4に示すように、本実施の形態に係る音響信号復号装置 30は、第 1符号化信号と第 2符号ィ匕信号とが多重化されたビットストリーム Bからダウンミックス信号が符号ィ匕された第 1符号ィ匕信号のみを抽出する逆多重化部 31と、前記第 1符号化信号から 2 チャンネルの周波数領域のオーディオ信号である第 1信号を生成する復号部 32と、前記第 1信号力時間領域のオーディオ信号 L'、R'を生成する周波数時間変換部 3 3とを備えている。

[0073] ここで、第 1符号化信号とは、ダウンミックス信号が符号化されている信号であり、第 2符号化信号とは、前記ダウンミックス信号をマルチチャンネル信号に戻すための補助情報が符号化されて、る信号である。

[0074] 以上のように構成された音響信号復号装置 30の動作について、以下に説明する。

[0075] まず、逆多重化部 31は、上記第 1または第 2の実施の形態に記載の音響信号符号化装置によって生成されたビットストリーム B (第 1符号ィ匕信号と第 2符号ィ匕信号とが多重化されている)から、第 1符号ィ匕信号のみを抽出する。

[0076] 次に、復号部 32は、逆多重化部 31に抽出されたダウンミックス符号である第 1符号化信号を復号して、 2チャンネルのダウンミックス信号が周波数領域で記述されて、る第 1信号 LO、 ROを生成する。

[0077] そして、周波数時間変換部 33は、復号部 32に生成された周波数領域のオーディォ信号である第 1信号 LO、 ROを、フーリエ変換や、離散コサイン変換や、サブバンドフィルタ等に代表される手法を用いて、時間領域のオーディオ信号に変換する。

[0078] 上記のように、本実施の形態によれば、ダウンミックス信号と補助情報とが多重化されたビットストリーム力もダウンミックス符号のみを抽出する逆多重化部 31と、前記ダゥンミックス符号から 2チャンネルの周波数領域のオーディオ信号を生成する復号部 32とを備え、ダウンミックス信号のみを抽出して復号し、補助情報に対しての復号処理を行わな、ことにより、少な、演算量でダウンミックス信号を再生することができることとなる。

[0079] (第 4の実施の形態）

以下、本発明の第 4の実施の形態における音響信号復号装置の構成図を図 5に示し、説明する。

[0080] 図 5に示すように、本実施の形態に係る音響信号復号装置 40は、第 1符号化信号と第 2符号ィ匕信号とが多重化されたビットストリーム Bから、ダウンミックス信号が符号化された第 1符号化信号および補助情報が符号化された第 2符号化信号を抽出する逆多重化部 41と、前記第 1符号ィ匕信号力 2チャンネルの周波数領域のオーディオ信号であるダウンミックス信号 LO、 ROを生成する第 1復号部 42と、前記第 2符号化信号から補助情報 10、 rOを生成する第 2復号部 43と、前記ダウンミックス信号と前記補助情報とからマルチチャンネル信号を生成する逆ミックス部 44と、前記マルチチャンネル信号から時間領域のオーディオ信号 L、 R、 1、 rを生成する周波数時間変換部 4 5と、マルチチャンネル信号再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含む N X Nの正方行列の逆行列である係数テーブル 46とを備えて、る。係数テーブル 46は図示されて、な、メモリなどの記憶媒体に記憶されて、るものとする。

[0081] 以上のように構成された音響信号復号装置 40の動作について、以下に説明する。

[0082] まず、逆多重化部 41は、上記第 1または第 2の実施の形態に記載の音響信号符号化装置によって生成されたビットストリームから、第 1符号ィ匕信号と第 2符号ィ匕信号とをそれぞれ抽出する。

[0083] 次に、第 1復号部 42は、逆多重化部 41に抽出されたダウンミックス符号である第 1 符号ィ匕信号を復号して、 2チャンネルのダウンミックス信号が周波数領域で記述されている第 1信号 LO、 ROを生成する。

[0084] また、第 2復号部 43は、逆多重化部 41に抽出された補助情報符号である第 2符号化信号を復号して、前記第 1信号からマルチチャンネル信号を生成するための補助情報となる第 2信号 10、 rOを生成する。

[0085] その後、逆ミックス部 44は、第 1復号部 42に生成された第 1信号 LO、 ROと、第 2復号部 43に生成された第 2信号 10、 rOとに対して係数テーブル 46を用いた行列演算を行うことにより、マルチチャンネル信号 L、 R、 1、 rを得る。ここで、係数テーブル 46に配置されている係数は、上記第 1の実施の形態で記述した行列の逆行列であり、例えば 4チャンネルの信号がダウンミックスされて、る場合では、数式 (数 13)で表される行列式により元の 4チャンネルの信号、 L、 R、 1、 rを抽出することが可能となる。

[0086] [数 13]

[0087] ここで x、 yは数式（数 14)で表される。

[0088] [数 14]

1

[0089] また、本実施の形態では、記憶媒体には一つの係数テーブル 46が記憶されていとしているが、本発明はこれに限定されるものではなぐ記憶媒体には複数の係数テーブルが記憶されていても良いことは言うまでもない。この場合、上記第 2の実施の形態に記載の音響信号符号ィ匕装置によって生成されたビットストリームを再生する際に、逆ミックス部 44はビットストリームに含まれる第 3符号ィ匕信号力ダウンミックス時に使用した係数を示す指標 nを取り出し、この指標 nに基づヽて複数の係数テーブルから適切な係数テーブルを選択することが可能である。

[0090] そして、周波数時間変換部 45では、逆ミックス部 44より出力された周波数領域のマルチチャンネル信号をそれぞれ、フーリエ変換や、離散コサイン変換や、サブバンドフィルタ等に代表される手法を用いて、時間領域のオーディオ信号 L、 R、 1、 rに変換する。 [0091] 上記のように、本実施の形態によれば、ビットストリーム力ダウンミックス符号および補助情報符号を抽出する逆多重化部 41と、ダウンミックス信号と補助情報とからマルチチャンネル信号を生成する逆ミックス部 44と、マルチチャンネル信号再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含む行列の逆行列である係数テーブル 46とを備え、逆ミックス部 44が係数テーブル 46を用いて、前記マルチチヤンネル信号を生成することにより、ダウンミックス信号が伝達特性を含む信号であつても、元のマルチチャンネル信号を再生することができる。

[0092] (第 5の実施の形態）

以下、本発明の第 5の実施の形態における音響信号復号装置の構成図を図 6に示し、説明する。

[0093] 図 6に示すように、音響信号復号装置 50は、第 1符号化信号と第 2符号化信号とが多重化されたビットストリーム Bから、ダウンミックス信号が符号化された第 1符号化信号および補助情報が符号化された第 2符号ィ匕信号を抽出する逆多重化部 51と、前記第 1符号ィ匕信号から 2チャンネルの周波数領域のオーディオ信号であるダウンミツタス信号 LO、 ROを生成する第 1復号部 52と、前記第 2符号化信号から補助情報 10、 rOを生成する第 2復号部 53と、前記ダウンミックス信号と前記補助情報とからマルチチャンネル信号を生成する逆ミックス部 54と、前記ダウンミックス信号を出力するか前記マルチチャンネル信号を出力するかを選択的に切り替える出力チャンネル切替え部 55と、前記出力チャンネル切替え部 55に選択出力された信号から時間領域のォ一ディォ信号を生成する周波数時間変換部 56と、マルチチャンネル再生時の頭部伝達特性を模擬する N X Nの正方行列の逆行列である 2 X Nの行列で表される係数を含む係数テーブル 57とを備えて、る。係数テーブル 57は図示されてヽな、メモリなどの記憶媒体に記憶されて、るものとする。

[0094] 以上のように構成された音響信号復号装置 50の動作について、以下に説明する。

[0095] まず、逆多重化部 51は、上記第 1または第 2の実施の形態に記載の音響信号符号化装置によって生成されたビットストリーム Bから、第 1符号ィ匕信号と第 2符号ィ匕信号とをそれぞれ抽出する。

[0096] 次に、第 1復号部 52は、逆多重化部 51に抽出されたダウンミックス符号である第 1 符号ィ匕信号を復号して、 2チャンネルのダウンミックス信号が周波数領域で記述されている第 1信号 LO、 ROを生成する。

[0097] また、第 2復号部 53は、逆多重化部 51に抽出された補助情報符号である第 2符号化信号を復号して、前記第 1信号からマルチチャンネル信号を生成するための補助情報となる第 2信号 10、 rOを生成する。

[0098] その後、逆ミックス部 54は、第 1復号部 52に生成された第 1信号 LO、 ROと、第 2復号部 53に生成された第 2信号 10、 rOとに対して係数テーブル 57を用いた行列演算を行うことにより、マルチチャンネル信号を得る。ここで、係数テーブル 57に配置されている係数は、上記第 1の実施の形態で記述した行列の逆行列であり、例えば 4チヤンネルの信号がダウンミックスされて、る場合では、数式 (数 15)で表される行列式により元の 4チャンネルの信号、 L、 R、 1、 rを抽出することが可能となる。

[0099] [数 15]

L ax - ex ax - cx

R - ex ax - cx ax

1 by - dy - by dy /。

r - dy by dy - by 、

[0100] ここで x、yは数式（数 16)で表される。

[0101] [数 16] 1

1

— 一 ' 2 j 2

2(b —— d )

[0102] また、本実施の形態では、記憶媒体には一つの係数テーブル 57が記憶されていとしているが、本発明はこれに限定されるものではなぐ記憶媒体には複数の係数テーブルが記憶されていても良いことは言うまでもない。この場合、上記第 2の実施の形態に記載の音響信号符号ィ匕装置によって生成されたビットストリーム Bを再生する際に、逆ミックス部 54はビットストリーム Bに含まれる第 3符号ィ匕信号力もダウンミックス時に使用した係数を示す指標 nを取り出し、この指標 nに基づヽて複数の係数テーブルカゝら適切な係数テーブルを選択することが可能である。

[0103] さら〖こ、出力チャンネル切替え部 55では、第 1復号部 52より出力された周波数領域のダウンミックス信号 LO、 ROを出力する力、逆ミックス部 54より出力された周波数領域のマルチチャンネル信号 L、 R、 1、 rを出力するかを選択的に切り替える。第 1復号部 52より出力された周波数領域のダウンミックス信号 LO、 ROを出力する力、逆ミックス部 54より出力された周波数領域のマルチチャンネル信号 L、 R、 1、 rを出力するかの出力チャンネル切替え部 55の設定は、例えばヘッドフォンや 2チャンネルのスピー力を使用する場合は第 1復号部 52より出力された信号 LO、 ROを出力し、 4チャンネルのスピーカを使用する場合は逆ミックス部 54から出力された信号 L、 R、 1、 rを出力するなど、用途に応じて切り替えることができる。例えば、出力側に接続された機器を検出する検出部を設け、ヘッドフォンや 2チャンネルのスピーカが出力側に接続されたことが検出された場合は、出力チャンネル切替え部 55を操作して、第 1復号部 52 より出力された信号 LO、 ROを出力し、 4チャンネルのスピーカが接続されたことが検出された場合は、出力チャンネル切替え部 55を操作して、逆ミックス部 54から出力された信号 L、 R、 1、 rを出力するようにしても良い。ここで、ダウンミックス信号 LO、 ROを出力する場合、第 2復号部 53と逆ミックス部 54と係数テーブル 57を保存するメモリなどの動作は停止させ、消費電力を削減することが望ましい。

[0104] そして、周波数時間変換部 56では、出力チャンネル切替え部 55に切り替えられ出力された周波数領域の信号 L、 R、 1、 r、または LO、 ROを、それぞれ時間領域のォーディォ信号に変換する。

[0105] 上記のように、本実施の形態によれば、ビットストリーム力もダウンミックス符号および補助情報符号を抽出する逆多重化部 51と、ダウンミックス信号と補助情報とからマルチチャンネル信号を生成する逆ミックス部 54と、前記ダウンミックス信号を出力するか前記マルチチャンネル信号を出力するかを選択的に切り替える出力チャンネル切替え部 55と、出力チャンネル切替え部 55に出力選択された信号から時間領域のォ一ディォ信号を生成する周波数時間変換部 56とを備えることにより、例えばヘッドフオンや 2つスピーカを使用する場合は 2チャンネルのダウンミックス信号を再生し、例えば 4つのスピーカを使用する場合はマルチチャンネル信号を再生する動作を、共通の構成要素で実現することができる。

[0106] また、上記の各実施の形態では説明の簡単ィ匕のため、マルチチャンネル信号のチヤンネル数として 4チャンネルの場合を例としてあげた力本発明はこれに限定されるものではなく、マルチチャンネル信号のチャンネル数は 3以上の場合であれば如何なるチャンネル数のマルチチャンネル信号でも良ぐ本発明は例えば一般的に広く普及して、る 5. 1チャンネルでも適応可能であることは言うまでもな!/、。

産業上の利用可能性

[0107] 以上のように、本発明にかかる音響信号符号化装置および音響信号復号装置は、ダウンミックス信号が所望の伝達関数でフィルタ処理された信号となり、第 1符号化信号のみを再生した場合でも、マルチチャンネル信号の空間情報が反映され、且つ、第 2符号ィ匕信号を用いることにより元のマルチチャンネル信号を再現することができるという効果を有し、マルチチャンネル信号をダウンミックスして符号ィ匕し、符号化されたダウンミックス信号を復号して空間情報が反映された 2チャンネル信号または元のマルチチャンネル信号を復元することができるので、安価なデコーダやヘッドフォンなど、特に機器の小型化が必要な携帯機器に応用できる。

Claims

請求の範囲

[1] Nチャンネルの信号を周波数領域に変換する時間周波数変換手段と、

前記 Nチャンネルの周波数領域信号をダウンミックスして 2チャンネルのダウンミックス信号を生成する第 1信号出力手段と、

前記ダウンミックス信号をマルチチャンネル信号に戻すための補助情報を生成する第 2信号出力手段と、

前記ダウンミックス信号を符号ィ匕し第 1符号ィ匕信号を生成する第 1符号ィ匕手段と、前記補助情報を符号化し第 2符号化信号を生成する第 2符号化手段と、前記第 1符号化信号と前記第 2符号化信号とを多重化する多重化手段と、伝達特性を実現する係数が周波数毎に記述された係数テーブルとを備え、前記 Nは 3以上の整数であり、前記係数テーブルは、 N X Nの正方行列であり、マルチチャンネル再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数と、前記 2 X Nの行列で表される係数を符号反転および並び替えした (N— 2) X Nの行列で表される値を含み、

前記第 1信号出力手段は、前記係数テーブルにしたがって前記 Nチャンネルの周波数領域信号を前記 2チャンネルの信号にダウンミックスし、

前記第 2信号出力手段は、前記係数テーブルにしたがって前記ダウンミックス信号の前記補助情報を生成することを特徴とする音響信号符号化装置。

[2] 異なる前記伝達特性を実現する係数から構成される前記係数テーブルを複数備え、さらに、前記係数テーブルを用途に応じて選択する係数テーブル選択手段とを備え、

前記多重化手段は、前記第 1符号化信号と前記第 2符号化信号とともに、前記係数テーブル選択手段に選択された前記係数テーブルを示す指標を多重化することを特徴とする請求項 1に記載の音響信号符号化装置。

[3] 請求項 1または請求項 2に記載の音響信号符号ィ匕装置によって生成されたビットストリーム力ダウンミックス符号のみを抽出する逆多重化手段と、

前記ダウンミックス符号から 2チャンネルの周波数領域のオーディオ信号を生成する復号手段と、前記周波数領域のオーディオ信号から時間領域のオーディオ信号を生成する周波数時間変換手段とを備えたことを特徴とする音響信号復号装置。

[4] 請求項 1または請求項 2に記載の音響信号符号ィ匕装置によって生成されたビットストリームからダウンミックス符号および補助情報符号を抽出する逆多重化手段と、前記ダウンミックス符号から 2チャンネルの周波数領域のオーディオ信号であるダウンミックス信号を生成する第 1の復号手段と、

前記補助情報符号から補助情報を生成する第 2の復号手段と、

前記ダウンミックス信号と前記補助情報とからマルチチャンネル信号を生成する逆ミックス手段と、

前記マルチチャンネル信号から時間領域のオーディオ信号を生成する周波数時間変換手段と、

マルチチャンネル再生時の頭部伝達特性を模擬する 2 X Nの行列で表される係数を含む N X Nの正方行列の逆行列である係数テーブルとを備え、

前記逆ミックス手段は、前記係数テーブルを用いて前記マルチチャンネル信号を生成することを特徴とする音響信号復号装置。

[5] 前記ダウンミックス信号を出力するか前記マルチチャンネル信号を出力するかかを選択的に切り替ええる出力チャンネル切替え手段を備え、

前記周波数時間変換手段は、前記出力チャンネル切替え手段に選択出力された信号力前記時間領域のオーディオ信号を生成することを特徴とした請求項 4に記載の音響信号復号装置。

[6] 前記係数テーブルは、空間伝達特性を模擬する係数が含まれることを特徴とする請求項 2に記載の音響信号符号化装置。