WO2006004048A1

WO2006004048A1 - オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム

Info

Publication number: WO2006004048A1
Application number: PCT/JP2005/012221
Authority: WO
Inventors: Kazuhiro Iida; Mineo Tsushima; Yoshiaki Takagi; Naoya Tanaka
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-07-06
Filing date: 2005-07-01
Publication date: 2006-01-12
Also published as: JPWO2006004048A1; US20070160236A1; CN1922655A

Abstract

　混入信号符号化部２０３および補助情報生成部２０４からなるオーディオ信号符号化装置であって、ある一定の予め定められた方法によって加算した混入信号を生成し、その混入信号を符号化し、混入信号情報２０６を出力する混入信号符号化部２０３と、第１入力信号２０１と、第２入力信号２０２、および、混入信号符号化部２０３で作られた混入信号と混入信号情報２０６を用いて補助情報２０５を生成する補助情報生成部２０４とを備える。補助情報生成部２０４は、人間の音源の方向知覚の特性や、拡がり感、および距離感に関する特徴を用いて、補助情報２０５を効率よく量子化する。

Description

明細書

オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム

技術分野

[0001] 本発明は、オーディオ信号の符号化装置、復号化装置、方法、および、プログラムに関するものである。

背景技術

[0002] 従来のオーディオ信号符号化方法、および、復号化方法としては、公知なものとして ISO/IECの国際標準方式、通称 MPEG方式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号ィ匕方式として、 ISO/IEC 13818— 7、通称 MPEG2 AAC (Advanced Audio Coding)などがあげられる。本方式の拡張規格も複数規格化が現在なされてヽる。

[0003] その一つとして、空間音響情報 (Spatial Cue Information)もしくは、聴覚的音響情報 (Binaural Cue)と呼ばれる情報を利用する技術がある。このような技術の例としては、 I SO国際標準規格である MPEG-4 Audio (ISO/IEC 14496-3)において定められたパラメトリックステレオ (Parametric Stereo)方式がある。また、別の例として、米国公開特許 US2003/00355OJ Backwards-compatible Perceptual Coding of Spatial Cues，において開示される方式がある。（非特許文献 1参照)。また、別の方式も提案されている（例えば、特許文献 1、特許文献 2等参照)。

非特許文献 1 : ISO/IEC 14496-3:2001 AMD2 "Parametric Coding for High Quality Audio

特許文献 1 :米国公開特許 US2003/0035553 "Backwards- compatible Perceptual Cod ing of Spatial Cues

特許文献 2 :米国公開特許 US2003/0219130 "Coherence- based Audio Coding and S ynthesis"

発明の開示

発明が解決しょうとする課題 [0004] しかしながら、従来のオーディオ信号符号化方法、および、復号化方法では、例えば背景技術に記載の AACなどでは、マルチチャンネルの信号を符号ィ匕する際に、チヤンネル間の相関を十分に生力しきれていないため、低ビットレートイ匕することが困難であった。チャンネル間の相関を用いて符号ィ匕を実施する場合においても、人間の音源の方向知覚の特性や、拡がり感に関する特徴をもちいることで得られる符号ィ匕効率の向上などの効果を、十分に量子化と符号化に活かしきれて!/、な、と、う課題かあつた。

[0005] また従来の方法では、マルチチャンネルの信号を符号ィ匕したものを復号ィ匕する際に、 2つのスピーカやヘッドホンなどで再生する場合において、一度、すべてのチヤンネルを復号ィ匕し、その後、ダウンミクスなどの方法を用いて、前記 2つのスピーカやヘッドホンで再生すべきオーディオ信号を加算により生成しなければならな力つた。このことは 2つのスピーカやヘッドホンで再生する場合に、多くの計算量や計算用のノッファを要し、ひいては、それを実装する DSPなどの計算手段の消費電力やコストを高める原因となった。

[0006] 本発明は、上記課題を解決するものであって、マルチチャンネルの信号を符号ィ匕する際の符号化効率を向上するオーディオ信号符号化装置、その装置から得られた符号を復号ィ匕するオーディオ信号復号ィ匕装置を提供することを目的とする。

課題を解決するための手段

[0007] 本発明のオーディオ信号符号化装置は、複数のチャンネルそれぞれの原音信号を、前記原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とに符号化するオーディオ信号符号化装置であつて、前記原音信号を混入して得た混入信号を符号化することによって前記混入信号情報を生成する混入信号符号化手段と、前記原音信号に基づ!ヽて前記特徴量を算出すると共に、各チャンネルの音声のリスナー力みた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる符号化方法を決定し、前記決定された符号化方法を用いて前記算出された特徴量を符号化することによって前記補助情報を生成する補助情報生成手段とを備える。 [0008] また、前記補助情報生成手段は、異なる量子化精度が得られる量子化点を定義する複数のテーブルを予め記憶しており、前記特徴量を、前記複数のテーブルのうちの前記チャンネル情報によって示される各再生位置の配置の関係に応じた一つによつて定義される量子化点に量子化することによって符号ィ匕してもよい。

[0009] また、前記補助情報生成手段は、前記原音信号間のレベル差及び位相差の少なくとも一方を算出して前記特徴量としてもよぐさらに、前記算出されたレベル差及び位相差に基づいて、リスナーが知覚すると推定される音像の方向を算出して前記特徴量としてもよい。

[0010] また、前記補助情報生成手段は、リスナーの正面方向から左右対称に設けられる量子化点を定義する第 1のテーブルと、リスナーの左方向から前後非対称に設けられる量子化点を定義する第 2のテーブルとを予め記憶しており、前記チャンネル情報力 Sリスナーの左前方と右前方とを示す場合には、前記特徴量を前記第 1のテーブルによって定義される量子化点に量子化することによって符号ィ匕し、前記チャンネル情報がリスナーの左前方と左後方とを示す場合には、前記特徴量を前記第 2のテープルによって定義される量子化点に量子化することによって符号ィ匕してもよい。

[0011] また、前記補助情報生成手段は、前記原音信号間の類似度を算出して前記特徴量としてもよぐまた、前記原音信号間の相互相関値、又はその絶対値を、前記類似度として算出してもよぐさらに、前記算出された類似度に基づいて、リスナーが知覚すると推定される音像の拡がり感及び距離感の少なくとも一方を算出して前記特徴量としてもよい。

[0012] 上記課題を解決するため、本発明のオーディオ信号復号化装置は、複数のチャンネルそれぞれの原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とを、前記複数のチャンネルそれぞれの再生信号に復号化するオーディオ信号復号化装置であって、各チャンネルの音声のリスナ一からみた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる復号化方法を決定する復号化方式切り替え手段と、前記決定された復号化方法を用いて前記補助情報を前記特徴量に復号化する信号間情報復号手段と、前記混入信号情報と前記復号化された特徴量とを用いて、前記複数のチャンネルそれぞれの再生信号を生成する信号合成手段とを備える。

[0013] また、前記補助情報は、前記特徴量を、異なる量子化精度が得られる量子化点を定義する複数のテーブルのうち前記チャンネル情報によって示される各再生位置の配置の関係に応じた一つによって定義される量子化点に量子化することによって符号化されており、前記信号間情報復号手段は、前記複数のテーブルを予め記憶しており、前記複数のテーブルのうちの前記チャンネル情報によって示される各再生位置の配置の関係に応じた一つを用いて、前記補助情報を前記特徴量に復号化してちょい。

[0014] また、前記特徴量は、前記原音信号間のレベル差、位相差、及び、リスナーが知覚すると推定される音像の方向の少なくとも一つを表し、前記信号間情報復号手段は、リスナーの正面方向から左右対称に設けられる量子化点を定義する第 1のテーブルと、リスナーの左方向から前後非対称に設けられる量子化点を定義する第 2のテープルとを予め記憶しており、前記チャンネル情報がリスナーの左前方と右前方とを示す場合には、前記第 1のテーブルを用いて前記補助情報を前記特徴量に復号化し、前記チャンネル情報がリスナーの左前方と左後方とを示す場合には、前記第 2のテーブルを用いて前記補助情報を前記特徴量に復号化してもょヽ。

[0015] また、前記特徴量は、前記原音信号間のレベル差、位相差、類似性、及び、リスナ一が知覚すると推定される音像の方向、拡がり感、並びに距離感の少なくとも一つを表すとしてもよい。

[0016] また、前記信号合成手段は、前記特徴量が、前記原音信号間のレベル差、位相差、及び類似性の少なくとも一つを表す場合に、前記混入信号情報によって表される音声信号に前記特徴量に応じたレベル差、位相差、及び類似性を与えることによつて、前記再生信号を生成してもよい。

[0017] また、本発明は、このようなオーディオ信号符号化装置及びオーディオ信号復号化装置として実現できるだけでなぐこのような装置が備える特徴的な手段によって実行される処理をステップとする方法として実現することも、また、それらのステップをコンピュータに実行させるプログラムとして実現することもできる。そして、そのようなプログラムは、 CD— ROM等の記録媒体やインターネット等の伝送媒体を介して配信できることはいうまでもない。

発明の効果

[0018] 本発明のオーディオ信号符号化装置及び復号化装置によれば、原音信号を混入して得られる混入信号から原音信号を近似する再生信号を分離するための補助情報を生成する際に、人間の音源の方向知覚の特性、拡がり感、及び距離感に関する特徴をもちいることによって、聴感上、違和感がない程度に信号の分離を達成でき、かつ非常に小さな補助情報を生成することが可能となる。

[0019] また、マルチチャンネルの原音信号から、前記混入信号として、左右 2チャンネルのダウンミクス信号を得るように構成すれば、 2チャンネル信号の再生系を有するスピー力やヘッドホンでの再生においては、補助情報を処理することなぐ前記ダウンミクス信号を復号するだけで、低演算量で高音質なステレオ再生が可能となる。

図面の簡単な説明

[0020] [図 1]図 1は、本発明の実施の形態に係るオーディオ信号符号化装置の機能的な構成の一例を示すブロック図である。

[図 2]図 2は、チャンネル情報が示すリスナーと音源の位置関係の一例を表す図である。

[図 3]図 3は、補助情報生成部の構成の一例を示す機能ブロック図である。

[図 4]図 4 (A)及び (B)は、知覚方向推定値の量子化に用いられるテーブルの一例を模式的に表す図である。

[図 5]図 5 (A)及び (B)は、信号間レベル差及び信号間位相差の量子化に用いられるテーブルの一例を模式的に表す図である。

[図 6]図 6は、補助情報生成部の構成の他の一例を示す機能ブロック図である。

[図 7]図 7は、信号間相関度、信号間類似度、及び拡がり感推定値の量子化に用いられるテーブルの一例を模式的に表す図である。

[図 8]図 8は、補助情報生成部の構成のさらに他の一例を示す機能ブロック図である [図 9]図 9は、本発明の実施の形態に係るオーディオ信号復号ィ匕装置の全体構成の機能的な構成の一例を示すブロック図である。

[図 10]図 10は、信号分離処理部の構成の一例を示す機能ブロック図である。符号の説明

混入信号復号化部

103 信号分離処理部

105 第 1出力信号

106 第 2出力信号

201 第 1入力信号

202 第 2入力信号

203 混入信号符号化部

204 補助情報生成部

205 補助情報

206 混入信号情報

207 チャンネル情報

303 信号間レベル差算出部

304 信号間位相差算出部

305 知覚方向推定部

306 符号化部

401 信号間相関度算出部

402 拡がり感推定部

403 符号化部

502 距離感推定部

503 符号化部

702 補助情報

704 混入信号復号化部

705 復号化方法切り替え部

706 信号間情報復号部

707 信号合成部発明の実施するための最良の形態

[0022] 以下、本発明の実施の形態について、図面を参照しながら説明する。

[0023] (オーディオ信号符号化装置）

図 1は、本発明のオーディオ信号符号化装置の機能的な構成の一例を示すブロック図である。このオーディオ信号符号化装置は、外部力与えられる第 1入力信号 20 1及び第 2入力信号 202を符号ィ匕して、混入信号情報 206を得ると共に、外部から与えられるチャンネル情報 207によって示される各チャンネルの音声の再生位置の配置の関係に応じて異なる符号ィ匕方法を用いて補助情報 205を得る装置であり、混入信号符号ィ匕部 203及び補助情報生成部 204からなる。

[0024] 混入信号情報 206及び補助情報 205は、後述するオーディオ信号復号化装置によって、第 1入力信号 201及び第 2入力信号 202それぞれを近似する信号に復号される情報であり、チャンネル情報 207は、復号されるそれぞれの信号がリスナーから見てどの方向力再生されるかを表す情報である。

[0025] 図 2は、信号再生用の音源とリスナーとの間の位置関係の一例を示す図である。この例は、 5チャンネル再生を行う場合に各チャンネルの音源となるスピーカそれぞれのリスナーから見た配置方向を示している。例えば、フロント Lチャンネルスピーカ及びフロント Rチャンネルスピーカが、リスナーの正面からそれぞれ左右 30° の方向に配置されることが示されている。この 2つのスピーカは、ステレオ再生にも用いられる。

[0026] チャンネル情報 207は、例えば、フロント Lチャンネルスピーカ及びフロント Rチャンネルスピーカから再生されるべき音声を符号ィ匕することを、具体的に、リスナーの正面を 0° として反時計回りに + 30° (フロント Lチャンネルスピーカ）及び 30° (フロント Rチャンネルスピーカ）といった音源の配置角度によって表す。また、実用的には 30° といった細かな角度情報ではなぐ各チャンネルの音源の配置角度を予め定めた上で、単にフロント Lチャンネル、フロント Rチャンネルといったチャンネノレ名によつて同じことを表すこともできる。

[0027] チャンネル情報 207は、どのチャンネルの音声を符号化するかを知っている外部の装置から適切に、本オーディオ信号符号化装置に与えられる。

[0028] 一つの典型例として、第 1入力信号 201及び第 2入力信号 202としてステレオの原音信号が与えられ、そこからモノラルの混入信号と補助情報とを生成する場合には、フロント Lチャンネル及びフロント Rチャンネルを示すチャンネル情報 207が与えられる。

[0029] 別の典型例として、 5チャンネルの原音信号力左右 2チャンネルの混入信号を生成する際に、第 1入力信号 201及び第 2入力信号 202としてそれぞれフロント Lチヤンネル及びリア Lチャンネルの信号を与えられ、そこから左チャンネルの混入信号と補助情報とを生成する場合には、フロント Lチャンネル及びリア Lチャンネルを示すチヤンネル情報 207が与えられる。

[0030] 再び図 1を参照して、第 1入力信号 201、および、第 2入力信号 202は、混入信号符号ィ匕部 203と補助情報生成部 204へと入力される。混入信号符号ィ匕部 203では、ある一定の予め定められた方法によって第 1入力信号 201、および、第 2入力信号 2 02を加算することによって混入信号を生成し、その混入信号を符号ィ匕して得られた混入信号情報 206を出力する。この符号化には、適宜周知の技術を用いることができるが、一例としては、背景技術の項で述べた AACなどの方法を用いてもよい。

[0031] 補助情報生成部 204では、第 1入力信号 201、第 2入力信号 202、混入信号符号化部 203で作られた混入信号、及び混入信号情報 206から、チャンネル情報 207を用いて補助情報 205を生成する。

[0032] ここで、補助情報 205は、混入信号から、混入前の原音信号である第 1入力信号 2 01及び第 2入力信号 202それぞれに聴感上できるだけ近い信号を分離するための情報である。補助情報 205を用いて、混入信号から混入前の第 1入力信号 201と、第 2入力信号 202と完全に同じ信号を分離できてもょ、し、聞、たところ差がな、ような程度の信号を分離できるのでもよい。聞いて差があつたとしても、その補助情報が信号分離のための情報である限り、本発明の範疇に含まれる。

[0033] 補助情報生成部 204は、チャンネル情報 207を用いることによって、聴感上違和感のない程度の信号を分離可能な補助情報を、少ない情報量で生成する。そのために、補助情報生成部 204は、チャンネル情報 207に応じて、補助情報を符号化する方法、具体的には符号ィ匕の量子化精度を切り替える。

[0034] 以下、補助情報生成部 204のいくつかの実施例について、詳細に説明する。 [0035] (実施例 1)

実施例 1に係る補助情報生成部について図 3から図 5を用いて説明する。

[0036] 図 3は、実施例 1の補助情報生成部の機能的な構成を示すブロック図である。

[0037] 実施例 1の補助情報生成部は、第 1入力信号 201及び第 2入力信号 202から、チヤンネル情報 207に応じて異なる符号化がなされた補助情報 205Aを生成する部であり、信号間レベル差算出部 303、信号間位相差算出部 304、知覚方向推定部 305 、及び符号ィ匕部 306からなる。

[0038] 補助情報 205Aは、信号間レベル差算出部 303で算出される信号間レベル差、信号間位相差算出部 304で算出される信号間位相差、知覚方向推定部 305で算出される知覚方向推定値のうちの少なくとも一つを量子化し符号ィ匕して得られる情報である。

[0039] 第 1入力信号 201と、第 2入力信号 202とは、信号間レベル差算出部 303、および、信号間位相差算出部 304へ入力される。

[0040] 信号間レベル差算出部 303では、第 1入力信号 201と、第 2入力信号 202との信号のエネルギー差を算出する。エネルギー差を算出する場合において、信号を複数の周波数バンドに区切って、その各々について算出してもよいし、全帯域で 1つ算出してもよい。また、算出する時間単位も特に限定しない。エネルギー差を表現する方法としても、オーディオ表現でよく用いられる指数関数値、たとえば dBとして差を表現してもよ、し、必ずしも限定しな、。

[0041] 信号間位相差算出部 304では、第 1入力信号 201と第 2入力信号 202との信号間の相互相関を算出し、その相互相関値をもとに、その値が大きくなる位相差を算出する。このような位相差算出方法は、当該技術者には公知である。また、必ずしも相互相関値の最大値をあたえる位相を位相差にしなくてもいい。それは、相互相関はデジタル信号をもとに算出する場合、離散値であるがゆえに、位相差についても離散値で得られるからで、その解決手段としては、相互相関値の分布をもとに、補間により推定される位相差であってもよヽ。

[0042] 信号間レベル差算出部 303から出力として得られる信号間レベル差、信号間位相差算出部 304から出力として得られる信号間位相差、およびチャンネル情報 207は、知覚方向推定部 305へ入力される。

[0043] 知覚方向推定部 305は、前記チャンネル情報 207と、信号間レベル差算出部 303 力も出力として得られる信号間レベル差、信号間位相差算出部 304から出力として得られる信号間位相差から、リスナーが知覚する音像の方向を推定する。

[0044] 一般に， 2個のスピーカから音響信号を提示した際にリスナーが知覚する方向は， 2個のスピーカの配置と， 2ch信号のレベル差および位相差で決定されることが知られている（「空間音響」，ィエンスブラウエルト，森本政之，後藤敏幸編著，鹿島出版会 (198b あるヽ ί , Spatial Hearing: The Psychophysics of Human Sound Localiza tion", revised edition, MIT Press, 1997) ₀知覚方向推定部 305は、例えばこの知見に基づいて、リスナーによる音像の知覚方向を推定し、その推定結果を表す知覚方向推定値を符号ィ匕部 306へ出力する。

[0045] 符号化部 306は、信号間レベル差、信号間位相差、及び知覚方向推定値のうちの少なくとも一つを、前述のチャンネル情報 207と知覚方向推定値に応じて異なる精度で量子化し、さらに符号ィ匕を実施して得た補助情報 205Aを出力する。

[0046] 従来、リスナーの知覚弁別特性につ!、て、次のことが知られて、る。一般に、リスナ一の知覚弁別特性は正面方向に対して左右対称であり、正面方向の知覚弁別特性が敏感で、フロント Lチャンネル方向（もしくはフロント Rチャンネル方向）に向かうにしたがって、鈍感になる傾向がある。また一般に、リスナーの知覚弁別特性は正面方向力反時計回りに背面方向まで前後非対称であり、正面方向の知覚弁別特性が敏感で、バックチャンネルに向力うにしたがって、鈍感になる傾向がある。

[0047] 符号ィ匕部 306は、このことを考慮して、知覚方向推定部 305から得られた知覚方向推定値が、知覚弁別特性が敏感な方向を示す場合には信号間レベル差、信号間位相差、及び知覚方向推定値を細かく量子化し、逆に、知覚弁別特性が鈍感な方向を示す場合には敏感な方向を示す場合にくらべて、荒く量子化する。

[0048] つまり、符号化部 306は、チャンネル情報 207力フロント Lチャンネルと Rチャンネルを示す場合は、知覚方向に関して左右方向に対称な量子化を実施し、フロント L チャンネルとバック Lチャンネルを示す場合は、知覚方向に関して前後方向に非対称な量子化を実施する。 [0049] このような量子化精度の切り替えを行うために、符号ィ匕部 306は、一例として、入力値を量子化値へ変換する複数のテーブルを予め保持しておき、その中からチャンネル情報 207に応じた一つを用いる。

[0050] 図 4は、符号ィ匕部 306に予め保持される、知覚方向推定値の量子化に用いられるテーブルの一例を模式的に表す図である。何れのテーブルも知覚方向推定値の量子化点の一例を表しており、 (A)はフロント Lチャンネル及びフロント Rチャンネル用の一例であり、 (B)はリア Lチャンネル及びフロント Lチャンネル用の一例である。

[0051] 符号ィ匕部 306は、チャンネル情報 207がフロント Lチャンネル及びフロント Rチャンネルを示す場合、図 4 (A)のテーブルに基づいて、知覚方向推定値を、知覚弁別特性が比較的敏感な正面方向の近傍では細力べ量子化し、知覚弁別特性が比較的鈍感な左右方向に向かうにつれて荒く量子化する。

[0052] また、チャンネル情報 207がリア Lチャンネル及びフロント Lチャンネルを示す場合、図 4 (B)のテーブルに基づいて、知覚方向推定値を、知覚弁別特性が比較的敏感な正面方向の近傍では細力べ量子化し、知覚弁別特性が比較的鈍感な背面方向に向力うにつれて荒く量子化する。

[0053] 図 5は、信号間レベル差及び信号間位相差の量子化に用いられるテーブルの一例を模式的に表す図である。何れのテーブルも所定の正規ィ匕がなされた信号間レベル差及び信号間位相差の量子化点の一例を表しており、 (A)はフロント Lチャンネル及びフロント Rチャンネル用のテーブルの一例であり、（B)はリア Lチャンネル及びフロント Lチャンネル用のテーブルの一例である。

[0054] 符号ィ匕部 306は、チャンネル情報 207がフロント Lチャンネル及びフロント Rチャンネルを示す場合、図 5 (A)のテーブルに基づいて、知覚方向推定値が知覚弁別特性の比較的敏感な正面方向の近傍を示す場合には、信号間レベル差及び信号間位相差を細かく量子化し、知覚方向推定値が知覚弁別特性の比較的鈍感な左右方向に向かうにつれて、信号間レベル差及び信号間位相差を荒く量子化する。

[0055] また、チャンネル情報 207がリア Lチャンネル及びフロント Lチャンネルを示す場合、図 5 (B)のテーブルに基づ、て、知覚方向推定値が知覚弁別特性の比較的敏感な正面方向の近傍を示す場合には、信号間レベル差及び信号間位相差を細かく量子化し、知覚方向推定値が知覚弁別特性の比較的鈍感な背面方向に向かうにつれて、信号間レベル差及び信号間位相差を荒く量子化する。

[0056] なお、図 4及び図 5のテーブルは何れも、本発明の特徴であるチャンネル情報 207 に応じて符号ィ匕方法を切り替えるための構成の一具体例を示したものであり、量子化点の分布を図示される内容に限定することを意図していない。チャンネル情報 207が、リア Lチャンネル及びリア Rチャンネルを示す場合など、リスナーの知覚弁別特性を反映した量子化点の他の分布を表すテーブルを用いる場合も本発明に含まれる。

[0057] このテーブルを切り替える構成の他に、例えば量子化の関数や、符号化の手続きそのものを切り替えることによって、チャンネル情報 207に応じた符号ィ匕方法の切り替えを実現することも考えられる。

[0058] 以上説明したように、符号ィ匕部 306は、チャンネル情報 207と知覚方向推定部 305 力も得られる知覚方向推定値とにもとづいて、リスナーの音像の知覚方向に関する弁別能力が反映された量子化精度 (つまり、正面方向には細かぐ左右から背面方向に向力につれて荒くなる量子化精度)を決定し、信号間レベル差、信号間位相差、及び知覚方向推定値のうちの少なくとも一つを量子化し符号化する。

[0059] これにより、量子化精度を切り替えない場合に比べてより少ない情報量で表された補助情報を得ることが可能となる。

量子化精度の決定にぉヽては、音源が静止してヽる場合の聴覚心理モデルに基づいて量子化テーブルや、量子化の関数を作成し量子化を実施してもよいし、実際の音源において、音像が移動することを考慮して、その音像の移動スピードや、量子化対象としている周波数帯域の特性に応じて、量子化精度を変えてもよい。特に時間分解能を適応的に変えることで、音源が静止している場合のモデルにあてはめて量子化し符号ィ匕することが可能となる。

[0060] このように構成された符号ィ匕方法を用いれば、人間の音の知覚方向の特性に基づいた符号ィ匕を実施でき、効率よく符号ィ匕を実施できる。

[0061] (実施例 2)

実施例 2に係る補助情報生成部について図 6および図 7を用いて説明する。

[0062] 図 6は、実施例 2の補助情報生成部の機能的な構成を示すブロック図である。 [0063] 実施例 2の補助情報生成部は、第 1入力信号 201及び第 2入力信号 202から、チヤンネル情報 207に応じて符号化された補助情報 205Bを生成する部であり、信号間相関度算出部 401、拡がり感推定部 402、及び符号ィ匕部 403からなる。

[0064] ここで、補助情報 205Bは、信号間相関度算出部 401で算出される信号間相関度、信号間類似度、拡がり感推定部 402で算出される拡がり感推定値のうちの少なくとも一つを量子化し符号ィ匕して得られる情報である。

[0065] 第 1入力信号 201と、第 2入力信号 202とは、信号間相関度算出部 401へ入力される。

[0066] 信号間相関度算出部 401では、第 1入力信号 201と、第 2入力信号 202との信号の相互相関値と各々の入力信号をもとに信号間の類似度 (コヒーレンス）を、例えば次に示す式 1

(式 1)

ICC = ∑ (x* (y+ τ ) ) / (∑ χ*χ - ∑y*y) "0. 5 などに従って算出する。

[0067] τは、両耳間の位相ずれを補正するための項であり、当業者には公知である。

[0068] 類似度を算出する場合において、信号を複数の周波数バンドに区切って、その各々について算出してもよいし、全帯域で 1つ算出してもよい。また、算出する時間単位も特に限定しない。

[0069] 信号間相関度算出部 401から出力として得られる信号間の類似度、およびチャンネル情報 207は、拡がり感推定部 402へ入力される。

[0070] 拡がり感推定部 402は、前記チャンネル情報 207と、信号間相関度算出部 401から出力として得られる信号間の類似度から、リスナーが知覚する音像の拡がりの程度を推定する。ここでは、リスナーが知覚する音像の拡がりの程度は、心理量としての大きさや小ささを適宜数値化して表現されるものとする。

[0071] 一般に，音の拡がり感は，リスナーの両耳に入力される音響信号の音圧レベルと両耳間相関度で説明できることが知られている (特許第 3195491号および特許第 321 4255号)。ここで，両耳間相関度 (DICC)とチャンネル間相関度 (ICCC)は、次の式 2 で表される関係にある。

[0072] (式 2) DICC = ICCC * Clr

ここで， Clrは HIと Hrの相関度であり， HIはスピーカなどの音源からリスナーの左耳までの伝達関数， Hrはスピーカなどの音源からリスナーの右耳までの伝達関数である。ここで，リスニングルームなどのようにスピーカ配置が左右対称である場合 Clrは 1 とみなせるので，音像の拡がり感は信号間相関度と音圧レベルで予測することができる。拡がり感推定部 402は、例えばこの知見に基づいて、リスナーが感じる音の拡がり感を推定し、その推定結果を表す拡がり感推定値を符号ィ匕部 403へ出力する。

[0073] 符号化部 403は、信号間相関度、信号間類似度、及び拡がり感推定値のうちの少なくとも一つを、前述のチャンネル情報 207に応じて異なる精度で量子化し、さらに符号化して得た補助情報 205Bを出力する。

[0074] 従来、両耳間相関度が同じでも，リスナーに到来する直接音の方向がリスナーの正面ではない場合は，直接音が正面力も到来する場合と比較して拡がり感が減少すること力 S知りれてヽる ( Relation between Auditory Source Widtn in Various bound Fiel ds and Degree of Interaural Cross— Correlation , M. Morimoto, K. Iida, and Y. Furu e, Applied Acoustics, 38 (1993) 291—301)。

[0075] これは、音声の再生が、フロント Lチャンネルとフロント Rチャンネルから行われる場合に比べて、フロント Lチャンネルとバック Lチャンネルから行われる場合には、再生音の拡がり感に対するリスナーの弁別能力が劣ることを意味している。

[0076] 符号ィ匕部 403は、このことを考慮して、チャンネル情報 207力フロント Lチャンネル及びフロント Rチャンネルを示す場合と、フロント Lチャンネル及びバック Lチャンネルを示す場合とで、異なる精度で量子化を実施する。

[0077] このような量子化精度の切り替えを行うために、符号ィ匕部 403は、一例として、入力値を量子化値へ変換する複数のテーブルを予め保持しておき、その中からチャンネル情報 207に応じた一つを用いる。

[0078] 図 7は、符号ィ匕部 403に予め保持される、信号間相関度、信号間類似度、及び拡力 Sり感推定値の量子化に用いられるテーブルの一例を模式的に表す図である。何れのテーブルも、所定の正規化がなされた信号間相関度、類似度、拡がり感推定値の量子化点の一例を表しており、 (A)はフロント Lチャンネル及びフロント Rチャンネル用の一例であり、 (B)はリア Lチャンネル及びフロント Lチャンネル用の一例である。

[0079] 符号ィ匕部 403は、チャンネル情報 207がフロント Lチャンネル及びフロント Rチャンネルを示す場合、図 7 (A)のテーブルに基づいて、信号間相関度、信号間類似度、及び拡がり感推定値を、比較的細力べ量子化し、チャンネル情報 207がリア Lチャンネル及びフロント Lチャンネルを示す場合、図 7 (B)のテーブルに基づいて、信号間相関度、信号間類似度、及び拡がり感推定値を、比較的荒く量子化する。

[0080] 以上説明したように、符号ィ匕部 403は、チャンネル情報 207に基づいて、リスナーの拡がり感に対する弁別能力が反映された量子化精度（つまり、正面方向には細かぐ左右から背面方向へ向かうにつれて荒くなる量子化精度)を決定し、決定された量子化精度で信号間相関度、信号間類似度、及び拡がり感推定値のうちの少なくとも一つを量子化し符号化する。

[0081] このように構成された符号ィヒ方法を用いれば、人間の音像の拡がり感の特性に基づ、た符号ィ匕を実施でき、効率よく符号ィ匕を実施できる。

[0082] (実施例 3)

実施例 3に係る補助情報生成部について図 8を用いて説明する。

[0083] 図 8は、実施例 3に係る補助情報生成部の機能的な構成を示すブロック図である。

[0084] 実施例 3の補助情報生成部は、第 1入力信号 201、第 2入力信号 202から、チャンネル情報 207に応じて符号化された補助情報 205Cを生成する部であり、信号間相関度算出部 401、距離感推定部 502、及び符号ィ匕部 503からなる。

[0085] ここで、補助情報 205Cは、信号間相関度算出部 401で算出される信号間相関度、信号間類似度、距離感推定部 502で算出される距離感推定値のうちの少なくとも一つを量子化し符号ィ匕して得られる情報である。

[0086] 第 1入力信号 201と、第 2入力信号 202とは、信号間相関度算出部 401へ入力される。

[0087] 信号間相関度算出部 401では、第 1入力信号 201と、第 2入力信号 202との信号の相互相関値と各々の入力信号をもとに信号間の類似度 (コヒーレンス）を前述した式 1などに従って算出する。 [0088] 類似度を算出する場合において、信号を複数の周波数バンドに区切って、その各々について算出してもよいし、全帯域で 1つ算出してもよい。また、算出する時間単位も特に限定しない。

[0089] 信号間相関度算出部 401から出力として得られる信号間の類似度、およびチャンネル情報 207は、距離感推定部 502へ入力される。

[0090] 距離感推定部 502は、前記チャンネル情報 207と、信号間相関度算出部 401から出力として得られる信号間の類似度から、リスナーが知覚する音像の距離感の程度を推定する。ここでは、リスナーが知覚する音像の距離感の程度は、心理量として感じられる遠さや近さを適宜数値化して表現されるものとする。

[0091] 従来、リスナーが知覚する音像の距離感と、前述した式 1によって算出される信号間相関度算出部 401からの出力値 (類似度)の正負の符号との間に関係があることが知られている。このことは、「2チャンネル音響信号の相関係数と音像の質：日本音響学会誌 39卷 4号（1983)」（黒住幸一ら）に記載されている。距離感推定部 502 は、例えばこの知見に基づいて、リスナーが知覚する音像の距離感を推定し、その推定結果を表す距離感推定値を符号ィ匕部 503へ出力する。

[0092] 符号化部 503は、信号間相関度、信号間類似度、及び距離感推定値のうちの少なくとも一つを、前述のチャンネル情報 207に応じて異なる精度で量子化し、さらに符号ィ匕して得た補助情報 205Cを出力する。

[0093] 再生音の距離感に関しても、音声の再生が、フロント Lチャンネルとフロント Rチャンネルから行われる場合と、フロント Lチャンネルとバック Lチャンネルから行われる場合とで、リスナーの弁別能力が異なることが予想される。

[0094] 符号化部 503は、このことを考慮して、チャンネル情報 207が、フロント Lチャンネル及びフロント Rチャンネルを示す場合と、フロント Lチャンネル及びバック Lチャンネルを示す場合とで、異なる量子化を実施する。

[0095] このような量子化精度の切り替えを行うために、符号ィ匕部 503は、一例として、入力値を量子化値へ変換する複数のテーブルを予め保持しておき、その中からチャンネル情報 207に応じた一つを用いる。このようなテーブルには、図 7で説明したテープルと同様のテーブルが使えるため、ここでは詳細な説明を省略する。 [0096] 以上説明したように、符号ィ匕部 503は、チャンネル情報 207に基づいて、リスナーが感じる音像までの距離感に関する弁別能力が反映された量子化精度 (つまり、正面方向には細かぐ左右から背面方向に向かうにつれて荒くなる量子化精度）を決定し、決定された量子化精度で、信号間相関度、信号間類似度、及び距離感推定値のうちの少なくとも一つを量子化し符号ィ匕する。

[0097] このように構成された符号ィ匕方法を用いれば、人間の音像の距離感の特性に基づいた符号ィ匕を実施でき、効率よく符号ィ匕を実施できる。

[0098] (実施例 4)

実施例 4のオーディオ信号符号化装置は、実施例 1と実施例 2、および実施例 3のオーディオ信号符号ィ匕装置を組み合わせて構成されるものである。

[0099] 実施例 4のオーディオ信号符号化装置は、図 3、図 6、および図 8に示される構成の全てを兼ね備え、 2つの入力信号カゝら信号間レベル差、信号間位相差、信号間相関度 (類似度)を算出し、チャンネル情報に基づいて、知覚方向および拡がり感、および距離感を推定し、チャンネル情報に応じて、量子化方法や量子化テーブルを切り替えて、符号化を実施する。

[0100] なお、実施例 4では、実施例 1から実施例 3のうち、いずれかの 2つを組み合わせてちょい。

[0101] (オーディオ復号化装置）

図 9は、本発明のオーディオ信号復号化装置の機能的な構成の一例を示すブロック図である。このオーディオ信号復号化装置は、前述のオーディオ信号符号化装置によって生成される混入信号情報 206、補助情報 205、及びチャンネル情報 207から、原音信号を近似する第 1出力信号 105及び第 2出力信号 106を復号する装置であり、混入信号復号ィ匕部 102及び信号分離処理部 103からなる。

[0102] 本発明は、オーディオ信号符号化装置からオーディオ信号復号化装置へ、混入信号情報 206、補助情報 205、及びチャンネル情報 207を移送する具体的な方法を限定しないが、一例としては、混入信号情報 206、補助情報 205、及びチャンネル情報 207が、一つの放送ストリームに多重化されて送信され、オーディオ信号復号化装置は、その放送ストリームを受信して多重分離することによって、混入信号情報 206、補助情報 205、及びチャンネル情報 207を得るとしてもよ、。

[0103] また、例えば、混入信号情報 206、補助情報 205、及びチャンネル情報 207が、記録媒体に蓄積されており、オーディオ信号復号化装置は、その記録媒体から、混入信号情報 206、補助情報 205、及びチャンネル情報 207を読み出すとしてもよい。

[0104] なお、チャンネル情報 207につ、ては、オーディオ信号符号化装置とオーディオ信号復号ィ匕装置の間でその規定値や規定の順番を予め取り決めておくことによって、伝送を省略することも考えられる。

[0105] 混入信号復号ィ匕部 102は、符号ィ匕データの形式で表される混入信号情報 206を、オーディオ信号の形式へと復号し、復号されたオーディオ信号を信号分離処理部 10 3へ出力する。混入信号復号ィ匕部 102は、前述のオーディオ信号符号化装置における混入信号符号ィ匕部 203の逆変換を行うものであり、例えば、混入信号符号化部 20 3が混入信号情報 206を AACに従って生成する場合には、混入信号復号ィ匕部 102 もまた AACに定められる逆変換を行って前記オーディオ信号を得る。前記オーディォ信号の形式は、時間軸上の信号形式、周波数軸上の信号形式、及び時間と周波数の両軸で表現される形式など力選択されるものとし、本発明ではその形式を限定しない。

[0106] 信号分離処理部 103は、混入信号復号ィ匕部 102から出力されるオーディオ信号から、補助情報 205及びチャンネル情報 207に基づいて、第 1出力信号 105と第 2出力信号 106とを生成し、出力する。

[0107] 以下、信号分離処理部 103の詳細について説明する。

[0108] 図 10は、この実施例に係る信号分離処理部 103の機能的な構成を示すブロック図である。

[0109] 信号分離処理部 103は、チャンネル情報 207に応じて異なる復号ィ匕方法を用いて補助情報 205を復号ィ匕し、その復号結果を用いて第 1出力信号 105及び第 2出力信号 106を生成する部であり、復号化方法切り替え部 705、信号間情報復号部 706、及び信号合成部 707からなる。

[0110] 復号ィ匕方法切り替え部 705は、チャンネル情報 207を入力されると、そのチャンネル情報 207に基づいて、信号間情報復号部 706に対して復号ィ匕方法の切り替えを指示する。

[0111] 信号間情報復号部 706は、復号化方法切り替え部 705からの指示に従って切り替えた復号ィ匕方法を用いて、補助情報 702を信号間情報に復号ィ匕する。この信号間情報は、実施例 1から実施例 3で説明した、信号間レベル差、信号間位相差、信号間相関度などである。信号間情報復号部 706は、オーディオ信号符号化装置における符号ィ匕部と同様に、量子化点を表すテーブルを切り替えることによって復号ィ匕方法を切り替えることができる。他にも、例えば量子化の逆関数や、復号ィ匕の手続きそのものを切り替えることによって復号ィ匕方法を切り替えてもよい。

[0112] 信号合成部 707は、混入信号復号ィ匕部 704の出力信号であるオーディオ信号から、前記信号間情報によって表される信号間レベル差、信号間位相差、及び信号間相関度を持った第 1出力信号 105と第 2出力信号 106とを生成する。この生成には、前記オーディオ信号を複製して得た 2つの信号に、前記信号間レベル差の半分をそれぞれ逆方向に与え、前記信号間位相差の半分をそれぞれ逆方向に与え、さらに、レベル差及び位相差を付与後の 2つの信号を前記信号間相関度に応じて混入する、 t 、つた周知の方法を適宜用いればょ、。

[0113] このように構成された復号ィ匕方法を用いれば、チャンネル情報を反映した効率のよ Vヽ復号化方法が達成でき、高音質な複数信号を得ることが可能となる。

[0114] また、この復号化方法は、 1チャンネルのオーディオ信号を 2チャンネルのオーディォ信号にすることだけでなぐ nチャンネルのオーディオ信号を、 nより多いチャンネルのオーディオ信号に生成することに用いることが可能である。たとえば、 2チャンネルのオーディオ信号から 6チャンネルのオーディオ信号を得る場合や、 1チャンネルのオーディオ信号から 6チャンネルのオーディオ信号を得る場合などでも有効である。産業上の利用可能性

[0115] また、本発明のオーディオ信号復号化装置、オーディオ信号符号化装置、及びそれらの方法は、オーディオ符号ィ匕されたビットストリームを伝送するシステム、例えば、放送コンテンツの伝送システム、 DVDや SDカードなどの蓄積媒体に音声情報を記録、再生するシステム、携帯電話に代表される通信機器に AVコンテンツを伝送するシステムなどに利用できる。また、インターネット上でやりとりされる電子データとして、オーディオ信号を伝送するシステムにお、ても利用できる。

Claims

請求の範囲

[1] 複数のチャンネルそれぞれの原音信号を、前記原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とに符号化するオーディオ信号符号化装置であって、

前記原音信号を混入して得た混入信号を符号化することによって前記混入信号情報を生成する混入信号符号化手段と、

前記原音信号に基づいて前記特徴量を算出すると共に、各チャンネルの音声のリスナ一からみた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる符号化方法を決定し、前記決定された符号ィ匕方法を用いて前記算出された特徴量を符号ィ匕することによって前記補助情報を生成する補助情報生成手段と

を備えることを特徴とするオーディオ信号符号ィ匕装置。

[2] 前記補助情報生成手段は、異なる量子化精度が得られる量子化点を定義する複数のテーブルを予め記憶しており、前記特徴量を、前記複数のテーブルのうちの前記チャンネル情報によって示される各再生位置の配置の関係に応じた一つによって定義される量子化点に量子化することによって符号化する

ことを特徴とする請求項 1に記載のオーディオ信号符号ィ匕装置。

[3] 前記補助情報生成手段は、前記原音信号間のレベル差及び位相差の少なくとも一方を算出して前記特徴量とする

[4] 前記補助情報生成手段は、前記原音信号間のレベル差及び位相差の両方を算出し、前記算出されたレベル差及び位相差に基づいて、リスナーが知覚すると推定される音像の方向を算出して前記特徴量とする

ことを特徴とする請求項 3に記載のオーディオ信号符号ィ匕装置。

[5] 前記補助情報生成手段は、リスナーの正面方向から左右対称に設けられる量子化点を定義する第 1のテーブルと、リスナーの左方向から前後非対称に設けられる量子化点を定義する第 2のテーブルとを予め記憶しており、前記チャンネル情報がリスナ一の左前方と右前方とを示す場合には、前記特徴量を前記第 1のテーブルによって定義される量子化点に量子化することによって符号ィ匕し、前記チャンネル情報がリスナ一の左前方と左後方とを示す場合には、前記特徴量を前記第 2のテーブルによつて定義される量子化点に量子化することによって符号化する

[6] 前記補助情報生成手段は、前記原音信号間の類似度を算出して前記特徴量とする

[7] 前記補助情報生成手段は、前記原音信号間の相互相関値、又はその絶対値を、前記類似度として算出する

ことを特徴とする請求項 6に記載のオーディオ信号符号化装置。

[8] 前記補助情報生成手段は、前記算出された類似度に基づいて、リスナーが知覚すると推定される音像の拡がり感及び距離感の少なくとも一方を算出して前記特徴量とする

[9] 複数のチャンネルそれぞれの原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とを、前記複数のチャンネルそれぞれの再生信号に復号化するオーディオ信号復号化装置であって、各チャンネルの音声のリスナー力みた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる復号化方法を決定する復号化方式切り替え手段と、

前記決定された復号化方法を用いて前記補助情報を前記特徴量に復号化する信号間情報復号手段と、

前記混入信号情報と前記復号化された特徴量とを用いて、前記複数のチャンネルそれぞれの再生信号を生成する信号合成手段と

を備えることを特徴とするオーディオ信号復号ィ匕装置。

[10] 前記補助情報は、前記特徴量を、異なる量子化精度が得られる量子化点を定義する複数のテーブルのうち前記チャンネル情報によって示される各再生位置の配置の関係に応じた一つによって定義される量子化点に量子化することによって符号ィ匕されており、

前記信号間情報復号手段は、前記複数のテーブルを予め記憶しており、前記複数のテーブルのうちの前記チャンネル情報によって示される各再生位置の配置の関係に応じた一つを用いて、前記補助情報を前記特徴量に復号化する

ことを特徴とする請求項 9に記載のオーディオ信号復号ィ匕装置。

[11] 前記特徴量は、前記原音信号間のレベル差、位相差、及び、リスナーが知覚すると推定される音像の方向の少なくとも一つを表し、

前記信号間情報復号手段は、リスナーの正面方向から左右対称に設けられる量子化点を定義する第 1のテーブルと、リスナーの左方向から前後非対称に設けられる量子化点を定義する第 2のテーブルとを予め記憶しており、前記チャンネル情報がリスナ一の左前方と右前方とを示す場合には、前記第 1のテーブルを用いて前記補助情報を前記特徴量に復号化し、前記チャンネル情報がリスナーの左前方と左後方とを示す場合には、前記第 2のテーブルを用いて前記補助情報を前記特徴量に復号ィ匕する

ことを特徴とする請求項 10に記載のオーディオ信号復号ィ匕装置。

[12] 前記特徴量は、前記原音信号間のレベル差、位相差、類似性、及び、リスナーが知覚すると推定される音像の方向、拡がり感、並びに距離感の少なくとも一つを表すことを特徴とする請求項 9に記載のオーディオ信号復号ィ匕装置。

[13] 前記信号合成手段は、前記特徴量が、前記原音信号間のレベル差、位相差、及び類似性の少なくとも一つを表す場合に、前記混入信号情報によって表される音声信号に前記特徴量に応じたレベル差、位相差、及び類似性を与えることによって、前記再生信号を生成する

ことを特徴とする請求項 12に記載のオーディオ信号復号ィ匕装置。

[14] 複数のチャンネルそれぞれの原音信号を、前記原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とに符号化するオーディオ信号符号化方法であって、

前記原音信号を混入して得た混入信号を符号化することによって前記混入信号情報を生成する混入信号符号化ステップと、前記原音信号に基づいて前記特徴量を算出すると共に、各チャンネルの音声のリスナ一からみた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる符号化方法を決定し、前記決定された符号ィ匕方法を用いて前記算出された特徴量を符号ィ匕することによって前記補助情報を生成する補助情報生成ステップと

を含むことを特徴とするオーディオ信号符号ィ匕方法。

[15] 複数のチャンネルそれぞれの原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とを、前記複数のチャンネルそれぞれの再生信号に復号ィ匕するオーディオ信号復号ィ匕方法であって、各チャンネルの音声のリスナー力みた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる復号化方法を決定する復号化方式切り替えステップと、

前記決定された復号化方法を用いて前記補助情報を前記特徴量に復号化する信号間情報復号ステップと、

前記混入信号情報と前記復号化された特徴量とを用いて、前記複数のチャンネルそれぞれの再生信号を生成する信号合成ステップと

を含むことを特徴とするオーディオ信号復号ィ匕方法。

[16] 複数のチャンネルそれぞれの原音信号を、前記原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とに符号ィ匕するための、コンピュータ実行可能なプログラムであって、

前記原音信号を混入して得た混入信号を符号化することによって前記混入信号情報を生成する混入信号符号化ステップと、

前記原音信号に基づいて前記特徴量を算出すると共に、各チャンネルの音声のリスナ一からみた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる符号化方法を決定し、前記決定された符号ィ匕方法を用いて前記算出された特徴量を符号ィ匕することによって前記補助情報を生成する補助情報生成ステップと

をコンピュータに実行させることを特徴とするプログラム。

[17] 複数のチャンネルそれぞれの原音信号の全体的な特徴を表す混入信号情報と、個々の原音信号間の関係に基づく特徴量を表す補助情報とを、前記複数のチャンネルそれぞれの再生信号に復号ィ匕するためのコンピュータ実行可能なプログラムであって、

各チャンネルの音声のリスナー力みた再生位置を示すチャンネル情報が与えられると、与えられたチャンネル情報によって示される各再生位置の配置の関係に応じて異なる復号化方法を決定する復号化方式切り替えステップと、

[18] 請求項 16及び請求項 17の少なくとも一方に記載のプログラムを格納していることを特徴とするコンピュータ読み取り可能な記録媒体。