WO2005081229A1

WO2005081229A1 - オーディオエンコーダ及びオーディオデコーダ

Info

Publication number: WO2005081229A1
Application number: PCT/JP2005/001968
Authority: WO
Inventors: Shuji Miyasaka; Yoshiaki Takagi; Kazutaka Abe
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-02-25
Filing date: 2005-02-09
Publication date: 2005-09-01
Also published as: US7613306B2; US20070162278A1; JPWO2005081229A1; CN1906664A

Abstract

　マルチチャネル信号をもとに、ステレオ信号を生成するオーディオエンコーダであって、ダウンミックス部１００は、２チャネルを超えるマルチチャネル信号を、２チャネルのステレオ信号にダウンミックスする。第１符号化部１０１は、ダウンミックスされたステレオ信号を符号化し、第１符号化信号を生成する。第２符号化部１０２は、ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第２符号化信号を生成する。符号量算出部１０３は、第２符号化信号の符号量を算出する。第１多重化部１０４は、第１符号化信号または第２符号化信号とのいずれかと、算出された符号量とを多重化する。これにより、デコーダは、上記符号量に基づいてマルチチャネル信号の符号化信号を簡単に抜き取れるので、ダウンミックス信号のみを再生するデコーダを安価に構成することができる。

Description

オーディオエンコーダ及びオーディオデコーダ

技術分野

[0001] 本発明は、マルチチャネル信号を符号ィ匕するオーディオエンコーダに関する。特に

、エンコードされたマルチチャネル信号を安価なデコーダで再生できるような符号ィ匕信号を生成するオーディオエンコーダに関する。

[0002] また、本発明は、そのようなオーディオエンコーダでエンコードされた符号ィ匕信号をデコードするオーディオデコーダに関する。特にマルチチャネル信号を 2チャネルで再生するようなオーディオデコーダに関する。

背景技術

[0003] 従来から、マルチチャネル信号を安価な再生装置、とりわけ 2チャネルの再生装置で再生することができるような符号ィ匕信号を生成するオーディオエンコーダの研究開発が行われている。例えば、 MPEG2オーディオ規格（IS013818— 3)では、マルチチャネル信号を 2チャネルにダウンミックスした信号と、当該ダウンミックスされた信号をマルチチャネル信号に戻すための信号とを分けて、それぞれ第 1符号化信号、第 2 符号化信号として符号化し、安価なデコーダでは上記第 1符号化信号のみを復号化することができる技術が開示されて、る (非特許文献 1参照)。

非特許文献 1： MPEG2オーディオ規格（ISO 13818-3)

発明の開示

発明が解決しょうとする課題

[0004] しかしながら、 MPEG2オーディオ規格では、上記第 1符号化信号と、上記第 2符号化信号とを分離することが容易ではな、と、う課題があった。

[0005] 図 1は、 MPEG2オーディオ規格における符号ィ匕信号 (ビットストリーム）の構造を示したものである。図 1において、フレームヘッダ情報 900は、 1152サンプルごとに符号化された 1フレームの符号ィ匕情報の開始位置を示している。第 1符号ィ匕信号 901 は、マルチチャネル信号を 2チャネルにダウンミックスしたステレオ信号を符号ィ匕した符号化信号である。第 2符号ィ匕信号 902は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕して得られる符号ィ匕信号である。

[0006] さてここで、第 1符号ィ匕信号 901のみをデコードしたいと欲する、例えば、 2チャネル再生のみを前提として設計された携帯電話機などのデコーダは、第 1符号ィ匕信号 90 1を取得し復号ィ匕した後、第 2符号ィ匕信号 902を読み飛ばしたいと欲するが、以下の理由によって容易には第 2符号ィ匕信号 902の量を取得することができず、従って、容易には第 2符号ィ匕信号 902を読み飛ばすことができない。なぜならば、各フレームのフレームサイズは各フレームのフレームヘッダ情報 900を解析することで容易に取得することができるが、第 1符号ィ匕信号 901の符号量は図に例示したようにフレームごとに可変であるので、必然的に第 2符号ィ匕信号 902の符号量も可変となる。従って、第 2符号化信号 902の符号量は、当該フレームのフレームサイズから当該フレームの第 1符号ィ匕信号 901の符号量を引くことによってしか知ることができない。従って第 1符号ィ匕信号 901をデコードする際、第 1符号ィ匕信号 901の符号量をいちいち算出しなければならな、こととなり、このことに多大の演算資源を費やさなければならな、とヽう課題がある。

[0007] また、従来の技術では、以下のような課題もある。

MPEG2オーディオ規格では、復号化されたダウンミックス信号は、サンプル時刻ごとに所定のマトリックス演算によってダウンミックスされているので、もともとのマルチチャネル信号の空間情報が失われているという。従って、元の空間情報を再現した上で、 2チャネルダウンミックスした信号を再生せんと欲した場合、つまり、仮想サラウンド処理を施した 2チャネル信号を再生せんと欲した場合、一旦、第 1符号化信号 90 1と第 2符号ィ匕信号 902とを用いてマルチチャネル信号を復号した後、頭部伝達関数に基づいて空間情報をフィルタ処理する必要があり、そのことに多大の演算資源を費やさなければならな、と、う課題がある。

[0008] 本発明は、このような従来の問題点に鑑みてなされたものであって、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィヒした符号ィヒ信号の符号量を簡単に知りえるような符号ィ匕信号を生成するオーディオエンコーダを提供することを目的とする。

[0009] さらに、本発明は、ダウンミックス信号を再生するだけで元のマルチチャネルの空間情報が再生できるような符号ィ匕情報を生成するオーディオエンコーダを提供することを第 2の目的とする。

[0010] また、そのようなオーディオエンコーダで符号化された符号ィ匕信号を少な、演算量で復号ィ匕するオーディオデコーダを提供することを目的とする。

課題を解決するための手段

[0011] 上記の課題を解決するため、本発明のオーディオエンコーダは、 2チャネルを超えるマルチチャネル信号を、 2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックスされたステレオ信号を符号ィ匕し、第 1符号化信号を生成する第 1符号化手段と、前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号ィヒし、第 2符号化信号を生成する第 2符号化手段と、前記第 2符号化信号の符号量を算出する符号量算出手段と、前記第 1符号化信号、前記第 2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段とを備えることを特徴とする。

[0012] また、前記多重化手段は、前記符号量算出手段で算出された符号量と、前記第 2 符号化信号とを多重化する第 1多重化部と、前記第 1符号化信号と、前記符号量が多重化された前記第 2符号化信号とを多重化する第 2多重化部とを備えるとしてもよい。

[0013] さらに、前記第 1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第 2符号ィ匕信号の先頭に配置して多重化するとしてもよい。

[0014] また、前記第 1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第 2符号化信号の開始を識別する記号の直後に配置するように多重化するとしてちょい。

[0015] さらに、前記第 1多重化部は、前記符号量算出手段で算出された前記符号量を表す信号を可変長で記述し、前記第 2符号化信号に多重化するとしてもよい。

[0016] また、前記ダウンミックス手段は、前記マルチチャネル信号に頭部伝達関数を用いた演算を行、、ダウンミックス処理を行うとしてもよ、。

[0017] また、前記ダウンミックス手段は、周波数軸上で、前記マルチチャネル信号に頭部伝達関数を用いた演算を行うとしてもよい。 [0018] さらに、前記第 2符号化信号は無効なデータを含み、前記符号量算出手段は、前記無効なデータを含む前記第 2符号化信号の符号量を算出するとしてもよい。

[0019] 上記の課題を解決するため、本発明のオーディオデコーダは、 2チャネルを超えるマルチチャネル信号力もダウンミックスされた 2チャネルのステレオ信号が符号ィ匕されて得られる第 1符号化信号と、前記ステレオ信号カゝらマルチチャネル信号を生成するための情報が符号化されて得られたものである第 2符号ィ匕信号と、前記第 2符号ィ匕信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、取得された前記符号ィ匕信号を復号化してステレオ信号を出力する復号ィ匕手段とを備える。

[0020] また、前記復号化手段は、取得された前記符号化信号から、前記第 1符号化信号を読み出す第 1符号化信号読み出し部と、前記第 2符号化信号の符号量を表す信号を、前記符号化信号から読み出す符号量読み出し部と、前記第 1符号化信号読み出し部によって読み出された前記第 1符号化信号を復号化して、前記ステレオ信号を出力する第 1復号化部とを備え、前記第 1符号化信号読み出し部は、前記符号量読み出し部によって読み出された前記符号量を表す信号に基づいて、第 2符号化信号を読み飛ばすとしてもよヽ。

[0021] また、前記第 1符号化信号は、頭部伝達関数を用いた演算によりあらかじめ仮想サラウンド効果が付与されたステレオ信号が符号化されたものであり、前記第 1復号ィ匕部は、仮想サラウンド効果の付与されたステレオ信号を出力するとしてもよい。

[0022] また、前記オーディオデコーダは、さらに、前記第 2符号化信号を前記符号化信号から読み出す第 2符号化信号読み出し部と、読み出された前記第 1符号化信号と前記第 2符号ィ匕信号とに基づいて、マルチチャネル信号を復号ィ匕する第 2復号ィ匕部と、前記復号ィ匕されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施し、仮想サラウンド効果が付与されたステレオ信号を出力するフィルタ部と、前記第 1復号ィ匕部から出力される前記ステレオ信号と、前記フィルタ部カゝら出力される前記仮想サラウンド効果が付与されたステレオ信号とのいずれかを選択する選択部とを備えるとしてもよ、。

[0023] さらに、前記第 1復号化部は、前記ステレオ信号の周波数軸信号を生成し、前記フィルタ部は、前記ステレオ信号の周波数軸信号力復元されたマルチチャネル信号の周波数軸信号に対し、頭部伝達関数に基づくフィルタ処理を行、2チャネルの周波数軸信号を生成した後、前記周波数軸信号を時間軸信号に変換するとしてもよい

[0024] また、前記オーディオデコーダは、さらに、少なくとも前記第 2復号化部を駆動する為の電力を供給する電力供給部を備え、前記選択部は、前記電力供給部からの電力供給量が所定の値を下回った場合、前記第 1復号化部からのステレオ信号を選択するとしてちょい。

[0025] さらに、前記符号量読み出し部によって読み出される前記第 2符号化信号の符号量を表す信号は、無効なデータを含む前記第 2符号化信号の符号量を表す信号であるとしてもよ、。

発明の効果

[0026] 本発明によれば、ダウンミックス信号をマルチチャネル信号に戻すために必要な情報を符号化して得られる第 2符号化信号の符号量を、オーディオデコーダで簡単に知りえるような符号ィ匕信号を生成することができることとなる。従って、ダウンミックス信号のみを再生する再生装置にお、ても、容易にダウンミックス信号のみを復号ィ匕して再生することができる。

[0027] 本発明によれば、前記第 2符号化信号の符号量を表す信号を、前記第 2符号化信号の開始位置の直後から入手することができることとなる。

[0028] 本発明によれば、前記第 2符号化信号の符号量を表す信号を、その値の大きさに応じて可変符号長で多重化できるので、符号量を表す信号多重化のためのビット数を節約することができることとなる。

[0029] さらに、本発明によれば、ダウンミックス処理を周波数軸上で行うことができるので、前記第 2符号化手段が周波数軸上の信号に対し符号化処理を行う場合、前記ダウンミックス処理と前記第 2符号ィ匕の処理とが効率的に実施できることとなる。

[0030] 本発明によれば、第 1符号化手段が、 1Z2以下の帯域の信号を扱うことになるので、圧縮率が向上できることとなる。また、第 1符号化手段で符号化された符号化信号のみを再生する場合、 1Z2以下の帯域の信号を扱うことになるので復号ィ匕の演算量が少なくて済むこととなる。また、近年広く研究開発が行われている帯域拡大技術 (I SOZIEC14496— 3)が 1Z2帯域の以下の帯域の信号を拡大する技術であるので、その技術とのインターフェースがとり易くなることとなる。

[0031] また、本発明によれば、ダウンミックス信号力頭部伝達関数のフィルタ処理された信号となり、第 1符号ィ匕信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。

[0032] さらに、本発明によれば、ダウンミックス信号力頭部伝達関数のフィルタ処理された信号となり、第 1符号ィ匕信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。し力も頭部伝達関数の処理を周波数軸上で実施するので、近年主流のオーディオ圧縮方式、例えば、 AAC方式 (ISOZIEC13818 -7)や AAC—SBR方式（ISOZIEC14496— 3)と組み合わせたとき、少な、演算量で処理が実行できることとなる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化してヽる方式であるからである。

[0033] また、本発明によれば、ダウンミックス信号のみを復号ィ匕した、と欲する場合、簡単な処理でマルチチャネルィ匕のために情報を取り去ることができることとなる。

[0034] さらに、本発明によれば、ダウンミックス信号の再生音と、マルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施した再生音とを選択できることとなる。

[0035] また、本発明によれば、周波数軸上で頭部伝達関数に基づくフィルタ処理を行!、2 チャネルの周波数軸信号を生成した後、当該周波数軸信号を時間軸信号に変換することができるので、近年主流のオーディオ圧縮方式、例えば、 AAC方式 (ISOZIE C 13818—7)や AAC— S BR方式（ISOZIEC 14496—3)と組み合わせたとき、少ない演算量で処理が実行できることとなる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化して!/ヽる方式であるからである。

[0036] さらに、本発明によれば、オーディオデコーダを駆動する為の電力が低下した場合、例えば電池寿命がつきかけている場合、自動的にダウンミックス信号の復号ィ匕のモードに入るので、電池寿命が延長することとなる。また、聴取者は音質の変化によつて電池寿命がつきかけていることを検知することができることとなる。

図面の簡単な説明

[0037] [図 1]図 1は、 MPEG2オーディオ規格における符号ィ匕信号 (ビットストリーム）の構造を示したものである。

[図 2]図 2は、本実施の形態 1におけるオーディオエンコーダの構成を示すブロック図である。

[図 3]図 3 (a)は、ダウンミックスの変換マトリックスを示す図である。図 3 (b)は、ダウンミックス信号を元のマルチチャネル信号に戻すための信号を生成するマトリックスを示す図である。図 3 (c)は、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスを示す図である。

[図 4]図 4 (a)は、図 3 (b)に示したマトリックスを頭部伝達関数に基づいて算出した場合のマトリックスの一例を示す図である。図 4 (b)は、図 4 (a)の逆行列であり、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスの一例を示す図である。

[図 5]図 5は、図 2の符号量算出部 103で算出された符号量を符号化信号に記述するための記述方法の一例を示す図である。

[図 6]図 6は、図 5に示した記述方法で符号量を符号ィ匕信号に記述する際のフローチヤートである。

[図 7]図 7は、本実施の形態 1、 2で生成される符号化信号のデータ構成を示す図である。

[図 8]図 8は、本実施の形態 2におけるオーディオエンコーダの構成を示す図である。

[図 9]図 9は、本実施の形態 3におけるオーディオデコーダの構成を示す図である。

[図 10]図 10は、図 5に示した符号量記述方法で記述されている符号量を表す信号をオーディオデコーダで読み取る場合の手順を示すフローチャートである。

[図 11]図 11は、本実施の形態 4におけるオーディオデコーダの構成を示す図である

[図 12]図 12は、本実施の形態 4におけるオーディオデコーダのもう 1つの構成を示す図である。

[図 13]図 13 (a)は、本発明のオーディオデコーダを内蔵するモノィルテレビの外観の一例を示す図である。図 13 (b)は、本発明のオーディオデコーダを内蔵する携帯電話機の外観の一例を示す図である。符号の説明

[0038] 100, 500 ダウンミックス部

101, 501 第 1符号化部

102, 502 第 2符号化部

103, 503 符号量算出部

104, 504 第 1多重化部

105, 505 第 2多重化部

600, 700, 800 第 1符号化信号取り出し部

601, 701, 801 第 2符号化信号取り出し部

602, 702, 802 第 1復号化部

603, 703, 803 符号量取り出し部

604, 704, 804 実体信号取り出し部

705, 805 第 2復号化部

706, 806 フィルタ部

707, 807 選択部

900 フレームヘッダ情報

901 第 1符号化信号

902 第 2符号化信号

発明を実施するための最良の形態

[0039] (実施の形態 1)

以下、本発明の実施の形態 1におけるオーディオエンコーダについて図面を参照しながら説明する。図 2は本実施の形態 1におけるオーディオエンコーダの構成を示す図である。図 2に示す実施の形態 1のオーディオエンコーダは、 1フレームがそれぞれ可変長の第 1符号ィ匕信号と第 2符号ィ匕信号とからなるフレームごとに、第 2符号化信号の先頭部に当該第 2符号化信号の符号量を表す信号を記述しておくオーディォエンコーダであって、ダウンミックス部 100、第 1符号化部 101、第 2符号化部 10 2、符号量算出部 103、第 1多重化部 104および第 2多重化部 105を備える。第 1符号ィ匕信号は、マルチチャネル信号をダウンミックスして得られる 2チャネルのステレオ信号を符号化して得られる。第 2符号化信号は、第 1符号ィヒ信号カゝら元のマルチチヤネル信号を復元するための情報を符号ィ匕して得られる。ダウンミックス部 100は、 M チャネル (Mは M > 2を満たす自然数）のマルチチャネル信号をステレオ信号にダウンミックスする。なお、以下では、マルチチャネル信号をダウンミックスして得られたステレオ信号のことを「ダウンミックス信号」という。第 1符号ィ匕部 101は、ダウンミックス信号を符号化し、第 1符号化信号を生成する。第 2符号ィ匕部 102は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕する。符号量算出部 103は、第 2 符号化部 102で符号化された信号の符号量を算出する。第 1多重化部 104は、符号量算出部 103で算出された符号量と第 2符号化部 102で生成された信号とを多重化し、第 2符号化信号を生成する。第 2多重化部 105は、第 1符号化信号と第 2符号ィ匕信号とを多重化する。

[0040] 以上のように構成されたオーディオエンコーダの動作について以下説明する。まず、ダウンミックス部 100は、本実施の形態では 4チャネル（前左 ch、前右 ch、後左 ch、後右 ch)のマルチチャネル信号を入力とし、ステレオ信号にダウンミックスする。その方法は例えば、図 3 (a)に示したマトリックス演算を実行し、（前左 ch+後左 ch)を新たに左 chとし、（前右 ch +後右 ch)を新たに右 chとする、というような変換マトリックスを用いる方法が一般的である。または、 MPEG2オーディオ規格で定められているように、入力の各チャネルの信号をフィルタバンクを用いて周波数軸信号に変換し、それぞれの周波数帯域ごとに定められた変換マトリックスに従ってダウンミックスしてもよい。または、入力の各チャネルの信号を FFT (Fast Fourier Transform)など直交変換方式を用いて周波数係数に変換し周波数係数ごとに定められた変換マトリックスに従つてダウンミックスしてもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。

[0041] 次に第 1符号ィ匕部 101は、周波数軸上または時間軸上でダウンミックスされたダウンミックス信号を符号ィ匕し、第 1符号化信号を生成する。ここで第 1符号ィ匕部 101による符号化は、例えば MPEG規格などで規定された符号ィ匕方式でょヽ。

[0042] 次に第 2符号ィ匕部 102は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。例えば、ダウンミックスに用いた変換マトリックス演算に対する逆変換マトリックス演算を成立させる為の補助マトリックス演算によって生成された信号を符号化する。最も単純な例を図 3 (b)に示した。すなわち、図 3 (b)の網掛け部分のマトリックス演算によって算出された左 ' ch、右 ' chの信号を符号化する。このような信号が符号化され、ダウンミックス信号を符号化した信号とともに伝送、または蓄積されていれば、図 3 (c)に示した逆マトリックス演算によって、もとの 4チャネル (前左 ch、前右 ch、後左 ch、後右 ch)のマルチチャネル信号にもどすことができる力である。図 4 (a)は、図 3 (b)に示したマトリックスを頭部伝達関数 HRTFに基づいて算出された係数力もなるマトリックスの一例を示す図である。図 4 (b)は、図 4 (a)の逆行列であり、ダゥンミックス信号を元のマルチチャネル信号に戻すためのマトリックスの一例を示す図である。図 4 (a)および (b)の a, b, c, d, e, f, g, h, i, j, k, 1, m, n, o, pは、頭部伝達関数 HRTFに基づ、て算出された係数である。このような頭部伝達関数に基づくマトリックスを用いることによって、左 chおよび右 chによって表される 2チャネルのステレオ信号に、もともとのマルチチャネルの空間情報が反映されることとなる。このような処理は入力の時間軸信号に対して行われても良いが、入力の時間軸信号をフィルタバンクなどを用いて周波数軸信号に変換し、それぞれの周波数帯域ごとに定められた変換マトリックスに従って行われてもよい。または、入力の時間軸信号を FFTなど直交変換方式を用いて周波数係数に変換し周波数係数ごとに定められた変換マトリックスに従って行われてもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。

[0043] 次に符号量算出部 103は、第 2符号化部 102で符号化された信号の符号量を算出する。ただし、符号量算出部 103は、第 2符号ィ匕部 102で符号化された信号を記述すべき領域が、第 2符号化部 102で符号化された信号以外の無効なデータ、例えば、 nullなどを含む場合には、その無効なデータを含んだ符号量を算出する。すなわち、請求項およびここでいう符号量とは、第 2符号化部 102で符号化された信号を記述すべき領域が、無効なデータを含む場合には、その無効なデータを含んだ符号量をいう。

[0044] 次に第 1多重化部 104は、符号量算出部 103で算出された符号量と、第 2符号ィ匕部 102で生成された信号とを多重化し、第 2符号化信号を生成する。図 5は、図 2の符号量算出部 103で算出された符号量を符号化信号に記述するための記述方法の一例を示す図である。図 6は、図 5に示した記述方法で符号量を符号化信号に記述する際のフローチャートである。ここで、符号量算出部 103で算出された符号量は、例えば図 5に示すように Aビット、または（A+B)ビットの可変長のビットフィールドで表現される。具体的には、算出された符号量が Aビットで表されるのであれば、 size_of_extだけで記述され、符号量が Aビットを超える場合には、 size_of_extと size_of_escとの 2つのフィールドで表される。例えば、 Aが 4、 Bが 8、符号量 sumが 14 バイトの場合、 14は 2進数 1110の 4ビットで表すことができるので（S401)、 size_of_extという 4ビットのフィールドに、 sum=14を表す2進数1110が書かれる（S40 2)。この条件を表す i戊では、 size_of_extの値 14が、（1 < < 4)— 1すなわち、 1を 4ビット左へシフトした値 16から 1を減算して得られる 15より小さいので、 size_of_escという 8ビットのフィールドは存在しな!、。すなわちこの場合 4ビットのビットフィールドで符号量を表す信号を多重化する。

[0045] また、例えば、 Aが 4、 Bが 8、符号量 sumが 100バイトの場合には（S401)、

size_of_extという 4ビットのフィールドに、 2進数1111カ書カれる 403)。この条件を表す if¾では、 size_of_extの値が、（1 < < 4)— 1すなわち 15と等しいので、 size_of_esc という 8ビットのフィールドに、 sum - size_of_ext + 1 = 100— (15— 1)の値が書かれる (S404)。すなわちこの場合 12ビットのビットフィールドで符号量を表す信号が多重化される。

[0046] 最後に第 2多重化部 105で、第 1符号ィ匕信号 901と第 2符号ィ匕信号 902とを多重化する。この処理を、逐次オーディオフレームごとに行うことによって、図 7に示すような、第 1符号ィ匕信号 901と第 2符号ィ匕信号 902とが交互に多重化され、且つ、第 2符号化信号 902の先頭部に符号量を表す信号が多重化されたような符号ィ匕信号が生成される。

[0047] 上記のように、本実施の形態によれば、 Mチャネル（M > 2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部と、ダウンミックス信号を符号ィ匕し第 1符号ィ匕信号を生成する第 1符号ィ匕部 101と、ダウンミックス信号をマルチチヤネル信号に戻すための情報を符号ィ匕する第 2符号ィ匕部 102と、第 2符号ィ匕部 102で符号化された信号の符号量を算出する符号量算出部 103と、符号量算出部 103で算出された符号量と第 2符号ィ匕部 102で生成された信号とを多重化し第 2符号ィ匕信号を生成する第 1多重化部 104と、第 1符号ィヒ信号と第 2符号ィヒ信号とを多重化する第 2多重化部 105とを備え、第 1多重化部 104は、符号量を表す信号が第 2符号化信号の先頭に配置されるように、符号量を表す信号を多重化することによって、第 1符号ィ匕信号のみを復号ィ匕しダウンミックス信号のみを再生せんと欲するデコーダにとつては、第 2符号ィ匕信号の符号量を示す情報が第 2符号ィ匕信号に含まれているので、容易に第 2符号ィ匕信号を全体の符号ィ匕信号力取り除くことができることとなる。

[0048] 勿論ここで、符号量を表す信号は、第 2符号化信号の開始を識別する記号の直後に配置するように、符号量を表す信号を多重化することが望ましい。なぜならば、第 1 符号ィ匕信号のみを復号ィ匕しダウンミックス信号のみを再生せんと欲するデコーダにとつては、第 2符号化信号の符号量を示す情報が、第 2符号化信号の先頭に配置されていれば、容易に第 2符号ィ匕信号を全体の符号ィ匕信号力取り除くことができるからである。なお、この第 2符号ィ匕信号の符号量は、 MPEG2の符号ィ匕信号の Fill Elementに記述されてもよい。この場合、第 2符号化信号の開始を識別する記号とは、 Fill Elementの開始を示す記号である。

[0049] また、算出された符号量を、当該符号量を表すためのビット量に応じた可変長のビットフィールドに多重化することによって、当該符号量を表す信号を多重化するためのビット数を削減できることとなる。

[0050] また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単ィ匕のために 4とした力 4でなくてもよく、一般的に広く普及している 5. 1チャネルであっても良いことはいうまでもない。

[0051] なお、算出された符号量を表す信号は、第 2符号化信号の先頭に記述されることが好ましいが、本発明はこれに限定されない。例えば、フレームヘッダ情報の中に記述されてもよい。また、フレームヘッダ情報の中に第 1符号化信号の符号量を表す信号が記述されるとしてもよい。なぜなら、フレームヘッダ情報の中にはフレーム全体の符号量が記述されているので、第 2符号化信号の符号量は簡単に算出することができるカゝらである。 [0052] (実施の形態 2)

以下本発明の実施の形態 2におけるオーディオエンコーダについて図面を参照しながら説明する。図 8は本実施の形態 2におけるオーディオエンコーダの構成を示す図である。図 8のオーディオエンコーダは、入力された時間軸上の 4チャネル信号を周波数軸上の信号に変換した後、ダウンミックスするオーディオエンコーダであって、ダウンミックス部 500、第 1符号ィ匕部 501、第 2符号ィ匕部 502、符号量算出部 503、第 1多重化部 504および第 2多重化部 505を備える。これにおいて、第 2符号化部 502 、符号量算出部 503、第 1多重化部 504および第 2多重化部 505は、実施の形態 1 で示したものと同様のものである。実施の形態 1で示したものと異なるものは、ダウンミックス部 500が、第 2符号ィ匕部 502の処理過程で生成される各入力チャネルの周波数軸信号を入力とし、該各入力チャネルの周波数軸信号の一部、または帯域の周波数軸信号をダウンミックスするように構成されている点と、第 1符号ィ匕部 501が、ダウンミックス部 500でダウンミックスされた信号を入力として当該信号を符号ィ匕するように構成されている点である。

[0053] 以上のように構成されたオーディオエンコーダの動作について以下に説明する。まず、第 2符号ィ匕部 502は、入力された 4チャネル信号を時間軸上の信号のサンプル数と同数のサンプル数力もなる周波数軸信号に変換する。これはフィルタバンクを用いても良いし、 FFTのような直交変換方式を用いて周波数係数に変換してもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。この各チヤネルの周波数軸信号をダウンミックス部 500に対し送出し、ダウンミックス部 500で所定の方法でダウンミックス処理が行われる。ここで、各チャネルの対応する周波数軸信号同士に対して実施されるダウンミックス処理は、実施の形態 1で述べたようなマトリックス演算によって実施すればよい。一方第 2符号化部 502では、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕する。この方法も、実施の形態 1で示した方法と同様でよ!、。

[0054] ここで本実施の形態では、ダウンミックス部 500は、受け取った各チャネルの周波数軸信号の一部の帯域のみに対しダウンミックス処理を実施するようにしてもよい。例えば、全周波数帯域の高域側の一部を取り除いた信号をダウンミックスする。このこと〖こよって、第 1符号ィ匕信号のみを復号ィ匕しダウンミックス信号のみを再生せんと欲するデコーダにとっては、符号ィ匕信号の周波数帯域が狭いので復号ィ匕に際しての演算量が少なくてすむことになる。また、全周波数帯域の 1Z2以下の周波数帯域の信号をダウンミックスすることとすれば、以下に示す理由によって、更に利便性を享受できる。すなわち、第 1符号ィ匕部 501は、例えば MPEG規格などで規定された符号ィ匕方式でよいが、特に、ここで、周波数帯域が全周波数帯域の 1Z2以下の周波数帯域であれば近年 MPEG4規格で検討されてヽる帯域拡大技術 (ISOZIEC14496— 3 )が前提としている周波数帯域と合致するので、当該技術とのインターフェースがとり易くなるからである。

[0055] 以降、符号量算出部 503の処理、第 1多重化部 504の処理、第 2多重化部 505の処理は、実施の形態 1で述べたのと同様でよい。

[0056] また、ダウンミックス部 500では、周波数成分に分解された信号に対し頭部伝達関数に基づいたフィルタ処理を実施しながらダウンミックスしてもよい。周波数成分に分解された信号に対する頭部伝達関数に基づ!/、たフィルタ処理は、特開平 11 0324 00号公報で述べられているような方法でよい。そうすることによって、第 1符号化部 5 01で符号化された符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなるからである。勿論このことは、本実施の形態 2での処理過程のみに適応されるわけではなぐ先の実施の形態 1での処理過程で実施しても良、ことは言うまでもな、。

[0057] 上記のように、本実施の形態によれば、 Mチャネル（M> 2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部 500と、ダウンミックス信号を符号化し第 1符号化信号を生成する第 1符号化部 501と、ダウンミックス信号をマルチチヤネル信号に戻すための情報を符号ィ匕する第 2符号ィ匕部 502と、第 2符号ィ匕部 502で符号化された信号の符号量を算出する符号量算出部 503と、符号量算出部 503で算出された符号量を表す信号と第 2符号ィ匕部 502で生成された信号とを多重化し第 2符号化信号を生成する第 1多重化部 504と、第 1符号化信号と第 2符号化信号とを多重化する第 2多重化部 505と、を有し、ダウンミックス部 500は、マルチチャネル信号をそれぞれ周波数軸信号に変換し該周波数軸信号の一部または全部の周波数帯域の信号をステレオ信号にダウンミックスすることによって、ダウンミックス処理を周波数軸上で行うことができるので、第 2符号ィ匕部 502が周波数軸上の信号に対し符号化処理を行う場合、ダウンミックス処理と第 2符号化の処理とが効率的に実施できることとなる。また、一部または全部の周波数帯域の信号をステレオ信号にダウンミツタスすれば、ダウンミックス処理を少ない演算量で行えることとなると同時に、第 1符号化部 501が、狭い帯域の信号を扱うことになるので、圧縮率が向上できることとなる。また、第 1符号化部 501で符号化された符号化信号のみを再生する場合、狭い帯域の信号を扱うことになるので復号ィ匕の演算量が少なくて済むこととなる。また、ダウンミックス処理を、もともとの周波数帯域の 1Z2の帯域で処理すれば、第 1符号化部 501 力 1Z2以下の帯域の信号を扱うことになるので、圧縮率がさらに向上できることとなると同時に、第 1符号化部 501で符号化された符号化信号のみを再生する場合、 1 Z2以下の帯域の信号を扱うことになるので復号ィ匕の演算量が少なくて済むこととなる。また、近年広く研究開発が行われている帯域拡大技術 (ISOZIEC14496— 3) 力帯域の以下の帯域の信号を拡大する技術であるので、その技術とのインターフェースがとり易くなることとなる。

[0058] また、上記ダウンミックス処理時に、頭部伝達関数のフィルタ処理も実施しておけば、第 1符号化部 501で符号化された符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。

[0059] 勿論、上記頭部伝達関数のフィルタ処理は周波数軸上で行わず、時間軸上で行つてもよ、ことは言うまでもな、。

[0060] また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単ィ匕のために 4とした力 4でなくてもよく、一般的に広く普及している 5. 1チャネルであっても良いことはいうまでもない。

[0061] (実施の形態 3)

以下本発明の実施の形態 3におけるオーディオデコーダについて図面を参照しな力 Sら説明する。本オーディオデコーダは、実施の形態 1または実施の形態 2で符号化された符号ィ匕信号を復号ィ匕するオーディオデコーダである。すなわち、 Mチャネル（ M > 2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号ィ匕した第 1符号ィ匕信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕した第 2符号ィヒ信号とが多重化された符号ィヒ信号を復号ィヒするオーディオデコーダである。ここで、第 2符号化信号には、当該第 2符号化信号の符号量を示す値が多重化されているものとする。

[0062] 図 9は本実施の形態 3におけるオーディオデコーダの構成を示す図である。図 9において、オーディオデコーダは、第 1符号化信号取り出し部 600、第 2符号化信号取り出し部 601、第 1復号ィ匕部 602、符号量取り出し部 603、および実体信号取り出し部 604を備える。第 1符号ィ匕信号取り出し部 600は、第 1符号化信号を取り出す。第 2符号ィ匕信号取り出し部 601は、第 2符号化信号を取り出す。第 1復号ィ匕部 602は、第 1符号化信号に基づいて、ダウンミックス信号を復号ィ匕する。符号量取り出し部 60 3は、第 2符号ィ匕信号に含まれている当該第 2符号ィ匕信号の符号量を表す信号を取り出す。実体信号取り出し部 604は、符号量取り出し部 603によって取り出された符号量を表す信号に基づ!ヽて、符号化信号から第 2符号化信号を取り出す。

[0063] 以上のように構成されたオーディオデコーダの動作について、以下に説明する。まず、第 1符号ィ匕信号取り出し部 600は、 4チャネルのマルチチャネル信号をダウンミツタスしたステレオ信号を符号ィ匕した第 1符号ィ匕信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第 2符号化信号とが多重化された符号ィ匕信号から、第 1符号化信号を取り出す。ここで、第 1符号化信号は、実施の形態 1、または実施の形態 2の第 1符号化部で生成された符号化信号であるので、当該第 1符号ィ匕信号取り出し部 600では、第 1符号ィ匕信号の符号ィ匕フォーマットに則って第 1符号ィ匕信号を取り出せばよい。例えば、第 1符号化部が、 MPEG規格 AAC方式に則つた符号ィ匕部なのであれば、当該第 1符号ィ匕信号取り出し部 600では、 AAC符号化フォーマットに則って第 1符号ィ匕信号を取り出せばよい。

[0064] 次に、第 1復号ィ匕部 602で第 1符号ィ匕信号に基づいて、ダウンミックス信号を復号化する。ここでの復号化の方法も、第 1符号化信号の符号化規格に則って復号化すればよい。

[0065] 図 10は、図 5に示した符号量記述方法で記述されている符号量を表す信号をォーディォデコーダで読み取る場合の手順を示すフローチャートである。次に、第 2符号化信号取り出し部 601に内蔵されて、る符号量取り出し部 603で、第 2符号化信号に含まれて、る当該第 2符号ィ匕信号の符号量を表す信号を取り出す (S501)。ここで当該符号量 sumは、図 5に示した Aビットまたは（A+B)ビットで表現されて!、るものとする。例えば、図 5に示した size_of_extが 4ビット、 size_of_escが 8ビット、 size_of_extの値が 2進数で 1010であるとする。この場合、 size_of_extの値が 10であり、（1 < < 4)— 1 = 15に等しくないので（S502)、 size_of_escの 8ビットは存在せず、符号量 sumは 10 ノイトということになる（S505)。また例えば、 size_of_ext力ビット、 size_of_escが 8ビット、 6_0 1:の値が2進数で1111の場合、 size_of_extの値が（1 < < 4)— 1 = 15なので（S502)、 size_of_escの 8ビットが存在することになる。符号量取り出し部 603は、さらに 8ビットの size_of_escを取り出す（S503)。ここで、 size_of_escの値が 2進数で 0000 1000の場合、符号量 sumは、 sum = size— of— ext + size— of— esc— 1 = 15 + 8— 1となり、 22ノィ卜となる（S504)。

[0066] 最後に、実体信号取り出し部 604で、符号量取り出し部 603によって取り出された符号量を表す信号に基づいて、符号化信号から第 2符号化信号を取り出す。例えば、符号量が、 20バイトなのであれば、以降の 20バイトの信号力ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第 2符号ィ匕信号の符号量と分かり、当該第 2符号ィ匕信号は、ダウンミックス信号のみを再生するデコーダにとっては不要なものであるので、そのサイズ分だけ、符号ィ匕信号を読み飛ばせばよいことになる。

[0067] ここで、当該第 2符号ィ匕信号に多重化されている当該符号量に応じた値は、必ずしも、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕した信号の符号量と丁度一致している必要はなぐそれと同じかそれより大きな値であればよい。例えば、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕した信号の正味の符号量が 18バイトの場合でも、例えば 2バイトの付カ卩的な情報を追加した場合は (これは実質的に無意味な情報でもよいが)、当該第 2符号ィ匕信号に多重化されている当該符号量に相当する値は 20となっているべきである。すなわち、第 2 符号ィ匕信号が付加的な情報または無意味な情報である 2バイトを含んでいるとした場合と同じである。そうすることによって、実体信号取り出し部は、符号化信号の内容については一切関知する必要がなくなるからである。

[0068] 以上の様に、本実施の形態のオーディオデコーダは、 Mチャネル（M> 2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号ィ匕した第 1符号ィ匕信号と、ダゥンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕した第 2符号ィ匕信号とが多重化された符号化信号に対し、第 1符号化信号を取り出す第 1符号化信号取り出し部 600と、第 2符号ィ匕信号を取り出す第 2符号ィ匕信号取り出し部 601と、第 1 符号ィ匕信号に基づいて、ダウンミックス信号を復号ィ匕する第 1復号ィ匕部 602とを有し、第 2符号ィ匕信号取り出し部 601は、第 2符号化信号に含まれる符号量を表す信号を取り出す符号量取り出し部 603と、符号量取り出し部 603によって取り出された符号量を表す信号に基づ!ヽて、符号化信号から第 2符号化信号を取り出す実体信号取り出し部 604をさらに備える。これによつて、ダウンミックス信号のみを復号ィ匕したいと欲するオーディオデコーダの場合、簡単な処理でマルチチャネルィヒのための情報を取り去るまたは読み飛ばすことができることとなる。

[0069] 勿論ここで、符号量を表す信号は、第 2符号化信号の先頭に配置されることが望ましい。なぜならば、第 1符号ィ匕信号のみを復号ィ匕しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第 2符号化信号の符号量を示す情報が、第 2符号化信号の先頭に配置されて、れば、容易に第 2符号化信号を全体の符号化信号から取り除くことができるからである。

[0070] またここで、第 1符号化信号が、先に述べた実施の形態 2のように、予め頭部伝達関数に基づくフィルタ処理によって本来のマルチチャネル信号が 2チャネル信号にダゥンミックスされていれば、第 1符号ィ匕信号のみを復号ィ匕しダウンミックス信号のみを再生せんと欲するデコーダにとっては、単に第 1符号ィ匕信号を復号ィ匕するだけで、もともとのマルチチャネルの空間情報が反映されたオーディオを再生できることとなる。

[0071] また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単ィ匕のために 4とした力 4でなくてもよく、一般的に広く普及している 5. 1チャネルであっても良いことはいうまでもない。

[0072] (実施の形態 4)

以下、本発明の実施の形態 4におけるオーディオデコーダについて図面を参照しながら説明する。

[0073] 本オーディオデコーダは、実施の形態 1または実施の形態 2で符号ィ匕された符号化信号を復号ィ匕するオーディオデコーダである。すなわち、 Mチャネル (M> 2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号ィ匕した第 1符号ィ匕信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕した第 2符号ィ匕信号とが多重化された符号ィ匕信号を復号ィ匕するオーディオデコーダである。ここで、第 2符号化信号には、当該第 2符号化信号の符号量を示す値が多重化されているものである。

[0074] 図 11は、本実施の形態 4におけるオーディオデコーダの構成を示す図である。図 1 1に示すように、実施の形態 4のオーディオデコーダは、第 1符号化信号取り出し部 7 00、第 2符号化信号取り出し部 701、第 1復号化部 702、符号量取り出し部 703、実体信号取り出し部 704、第 2復号ィ匕部 705、フィルタ部 706および選択部 707を備える。このうち、実施の形態 3と異なるのは、第 1符号ィ匕信号と第 2符号ィ匕信号とに基づいて、マルチチャネル信号を復号化する第 2復号化部 705と、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施すフィルタ部 706と、第 1復号ィ匕部 702で生成された信号か、フィルタ部 706で生成された信号かを選択する選択部 707とを備えたところである。それ以外の第 1符号ィ匕信号取り出し部 700 、第 2符号化信号取り出し部 701、第 1復号化部 702、符号量取り出し部 703および実体信号取り出し部 704は、実施の形態 3で述べたものと同様である。

[0075] 以上のように構成されたオーディオデコーダの動作について、以下に説明する。まず、第 1符号ィ匕信号取り出し部 700は、 4チャネルのマルチチャネル信号をダウンミツタスしたステレオ信号を符号ィ匕した第 1符号ィ匕信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第 2符号化信号とが多重化された符号ィ匕信号から、第 1符号化信号を取り出す。この動作は、実施の形態 3と同様である。

[0076] 次に、第 1復号化部 702で第 1符号化信号に基づいて、ダウンミックス信号を復号化する。この動作も、実施の形態 3と同様である。

[0077] 次に、第 2符号ィ匕信号取り出し部 701に内蔵されている符号量取り出し部 703で、第 2符号化信号に含まれてヽる当該第 2符号化信号の符号量を表す信号を取り出す。この動作は、実施の形態 3と同様である。

[0078] 次に符号量取り出し部 703によって取り出された符号量を表す信号に基づ、て、実体信号取り出し部 704が、符号化信号から第 2符号化信号を取り出す。この動作は、実施の形態 3と同様である。

[0079] 次に、第 2復号化部 705で、第 1符号化信号と第 2符号化信号とに基づいて、マルチチャネル信号を復号ィ匕する。

[0080] ここで、第 1符号化信号と第 2符号化信号は、実施の形態 1、または実施の形態 2のオーディオエンコーダで生成された符号ィ匕信号であるので、当該第 2復号ィ匕部 705 では、その符号ィ匕フォーマットに則って第 1符号ィ匕信号と第 2符号ィ匕信号とを復号しマルチチャネル信号を生成すればょヽ。

[0081] 次にフィルタ部 706で、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施す。

[0082] 最後に、選択部 707で、第 1復号化部で生成された信号か、フィルタ部で生成された信号かを選択する。

[0083] 以上の様に、本実施の形態では、 Mチャネル（M > 2)のマルチチャネル信号をダゥンミックスしたステレオ信号を符号ィ匕した第 1符号ィ匕信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号ィ匕した第 2符号ィ匕信号とが多重化された符号化信号に対し、第 1符号ィ匕信号を取り出す第 1符号ィ匕信号取り出し部 700と、第 2符号ィ匕信号を取り出す第 2符号ィ匕信号取り出し部 701と、第 1符号ィ匕信号に基づいて、ダウンミックス信号を復号化する第 1復号化部 702と、第 2符号化信号に含まれる符号量を表す信号を取り出す符号量取り出し部 703と、符号量取り出し部 703によつて取り出された符号量を表す信号に基づ！ヽて、符号化信号から第 2符号化信号を取り出す実体信号取り出し部 704と、第 1符号ィ匕信号と第 2符号ィ匕信号とに基づいて、マルチチャネル信号を復号化する第 2復号化部 705と、復号ィ匕されたマルチチヤネル信号に対し、頭部伝達関数に基づくフィルタ処理を施すフィルタ部 706と、第 1復号化部で生成された信号か、フィルタ部 706で生成された信号かを選択する選択部 707とを備えることによって、ダウンミックス信号の再生音と、マルチチャネル信号に対し頭部伝達関数に基づくフィルタ処理を施した再生音とを利用者が選択できることとなる。

[0084] 上記の処理において、第 2復号ィ匕部 705では各マルチチャネル信号の周波数軸信号を生成するようにし、当該各マルチチャネル信号の周波数軸信号に対し周波数軸上で頭部伝達関数に基づくフィルタ処理を行い 2チャネルの周波数軸信号を生成した後、当該周波数軸信号を時間軸信号に変換するようにしてもよい。例えば、特開平 11 032400号公報で述べられているような方法でもよい。そうすることによって、例えば、 AAC方式（ISOZIEC 13818—7)や AAC—SBR方式（ISOZIEC 14496—3 )と組み合わせたとき、演算量が大幅に削減できることになる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるので、周波数軸信号を時間軸信号に変換する処理が内蔵されている力周波数軸上でダウンミックスすることによって、周波数軸信号を時間軸信号に変換する処理が 2チャネル分のみで済むこと〖こなる力らである。

[0085] また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単ィ匕のために 4とした力 4でなくてもよく、一般的に広く普及している 5. 1チャネルであっても良いことはいうまでもない。

[0086] また、本実施の形態では、第 2復号化部は、第 1符号化信号と第 2符号化信号とを入力とし、それらを用いてマルチチャネル信号を復号ィ匕したが、第 1復号化部で復号化した信号を用いて、マルチチャネル信号を復号ィ匕するようにしてもよい。図 12は、本実施の形態 4におけるオーディオデコーダの他の構成を示す図である。その場合、図 12に示すような構成になる。

[0087] また、当該オーディオデコーダを駆動する為の電力が低下した場合、例えば電池寿命がつきかけている場合、そのことを検出し、自動的に上記選択部を、第 1復号ィ匕部で生成された信号で出力するように制御すれば、バッテリーがっきかけているときに、自動的にダウンミックス信号の復号ィ匕のモードに入るので、電池寿命が延長することとなる。また、聴取者は音質の変化によって電池寿命がつきかけていることを検知することができることとなる。

[0088] 図 13は、本発明のオーディオデコーダを備えるモバイルオーディォ機器の外観の一例を示す図である。（a)は、本発明のオーディオデコーダを内蔵するモバイルテレビの一例を示す図である。（b)は、本発明のオーディオデコーダを内蔵する携帯電話機の一例を示す図である。同図に示すような携帯型の機器では、単位時間あたりの演算量が大きいと、演算処理の並列化などのために回路規模が大きくなつてしまう

。そして、モバイルオーディォ機器では、いまだに 2チャネル再生が主流である。従つて、同図に示すようなモノィルオーディォ機器では、本発明のオーディオエンコーダによって符号化された符号化信号を復号化し、再生することによって、符号化信号の不要な部分を読み飛ばし、頭部伝達関数を用いてフィルタリングされた仮想サラゥンドオーディオを、低い負荷で再生することができる。

産業上の利用可能性

[0089] 本発明にかかるオーディオエンコーダは、マルチチャネル信号を符号ィ匕するォーディォエンコーダである力エンコードされたマルチチャネル信号を安価なデコーダで再生できるような符号ィ匕信号を生成するので、特に機器の小型化が必要な携帯機器に応用できる。

[0090] 本発明にカゝかるオーディオデコーダは、マルチチャネル信号を符号ィ匕した符号ィ匕信号を 2チャネルの再生部、例えば、ヘッドホンで再生するのに適しているので、特に機器の小型化が必要な携帯機器、例えば、モパイルテレビ、 MD、 SDおよび携帯電話機などに応用できる。

Claims

請求の範囲

[1] 2チャネルを超えるマルチチャネル信号を、 2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、

前記ダウンミックスされたステレオ信号を符号ィ匕し、第 1符号ィ匕信号を生成する第 1 符号化手段と、

前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第 2符号化信号を生成する第 2符号化手段と、

前記第 2符号化信号の符号量を算出する符号量算出手段と、

前記第 1符号化信号、前記第 2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段と

を備えることを特徴とするオーディオエンコーダ。

[2] 前記多重化手段は、

前記符号量算出手段で算出された符号量と、前記第 2符号化信号とを多重化する第 1多重化部と、

前記第 1符号化信号と、前記符号量が多重化された前記第 2符号化信号とを多重化する第 2多重化部と

を備えることを特徴とする請求項 1記載のオーディオエンコーダ。

[3] 前記第 1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第 2 符号化信号の先頭に配置して多重化する

ことを特徴とする請求項 2記載のオーディオエンコーダ。

[4] 前記第 1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第 2 符号化信号の開始を識別する記号の直後に配置するように多重化する

ことを特徴とする請求項 2記載のオーディオエンコーダ。

[5] 前記第 1多重化部は、前記符号量算出手段で算出された前記符号量を可変長で記述し、前記第 2符号化信号に多重化する

ことを特徴とする請求項 2記載のオーディオエンコーダ。

[6] 前記ダウンミックス手段は、前記マルチチャネル信号に頭部伝達関数を用いた演算を行い、ダウンミックス処理を行うことを特徴とする請求項 1記載のオーディオエンコーダ。

[7] 前記ダウンミックス手段は、周波数軸上で、前記マルチチャネル信号に頭部伝達関数を用いた演算を行う

ことを特徴とする請求項 6に記載のオーディオエンコーダ。

[8] 前記第 2符号化信号は無効なデータを含み、

前記符号量算出手段は、前記無効なデータを含む前記第 2符号化信号の符号量を算出する

ことを特徴とする請求項 1記載のオーディオエンコーダ。

[9] 符号化信号を復号化するオーディオデコーダであって、

2チャネルを超えるマルチチャネル信号からダウンミックスされた 2チャネルのステレォ信号が符号化されて得られる第 1符号化信号と、前記ステレオ信号カゝらマルチチヤネル信号を生成するための情報が符号化されて得られたものである第 2符号ィ匕信号と、前記第 2符号化信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、

取得された前記符号ィ匕信号を復号化してステレオ信号を出力する復号ィ匕手段とを備えることを特徴とするオーディオデコーダ。

[10] 前記復号化手段は、

取得された前記符号化信号から、前記第 1符号化信号を読み出す第 1符号化信号読み出し部と、

前記第 2符号化信号の符号量を表す信号を、前記符号化信号から読み出す符号量読み出し部と、

前記第 1符号化信号読み出し部によって読み出された前記第 1符号化信号を復号ィ匕して、前記ステレオ信号を出力する第 1復号ィ匕部とを備え、

前記第 1符号化信号読み出し部は、前記符号量読み出し部によって読み出された前記符号量に基づいて、第 2符号化信号を読み飛ばす

ことを特徴とする請求項 9記載のオーディオデコーダ。

[11] 前記第 1符号ィ匕信号は、頭部伝達関数を用いた演算によりあらかじめ仮想サラゥンド効果が付与されたステレオ信号が符号化されたものであり、前記第 1復号化部は、仮想サラウンド効果の付与されたステレオ信号を出力することを特徴とする請求項 10記載のオーディオデコーダ。

[12] 取得された前記符号化信号から読み出される前記第 2符号化信号の符号量を表す信号は、無効なデータを含む前記第 2符号化信号の符号量を表す信号であることを特徴とする請求項 9記載のオーディオデコーダ。

[13] 前記復号化手段は、さらに、

前記第 1符号化信号読み出し部によって読み出された前記第 1符号化信号を復号ィ匕して、前記ステレオ信号を出力する第 1復号ィ匕部と、

前記第 2符号化信号を前記符号化信号から読み出す第 2符号化信号読み出し部と読み出された前記第 1符号化信号と前記第 2符号化信号とに基づいて、マルチチャネル信号を復号化する第 2復号化部と、

前記復号ィ匕されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施し、仮想サラウンド効果が付与されたステレオ信号を出力するフィルタ部と、前記第 1復号化部から出力される前記ステレオ信号と、前記フィルタ部から出力される前記仮想サラウンド効果が付与された前記ステレオ信号とのいずれかを選択する選択部とを備える

ことを特徴とする請求項 9記載のオーディオデコーダ。

[14] 前記第 1復号化部は、前記ステレオ信号の周波数軸信号を生成し、

前記フィルタ部は、前記ステレオ信号の周波数軸信号から復元されたマルチチヤネル信号の周波数軸信号に対し、頭部伝達関数に基づくフィルタ処理を行!、2チヤネルの周波数軸信号を生成した後、前記周波数軸信号を時間軸信号に変換することを特徴とする請求項 13記載のオーディオデコーダ。

[15] 前記オーディオデコーダは、さらに、

少なくとも前記第 2復号化部を駆動する為の電力を供給する電力供給部を備え、前記選択部は、前記電力供給部からの電力供給量が所定の値を下回った場合、前記第 1復号化部からのステレオ信号を選択する

ことを特徴とする請求項 14記載のオーディオデコーダ。

[16] 2チャネルを超えるマルチチャネル信号を、 2チャネルのステレオ信号にダウンミックスし、

ダウンミックスされた前記ステレオ信号を符号ィ匕し、第 1符号ィ匕信号を生成し、ダウンミックスされた前記ステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第 2符号化信号を生成し、

前記第 2符号化信号の符号量を算出し、

前記第 1符号化信号、前記第 2符号化信号および算出された符号量を表す信号を多重化する

ことを特徴とするオーディオ符号ィ匕方法。

[17] 符号化信号を復号化するオーディオ復号化方法であって、

2チャネルを超えるマルチチャネル信号からダウンミックスされた 2チャネルのステレォ信号が符号化されて得られる第 1符号化信号と、前記ステレオ信号カゝらマルチチヤネル信号を生成するための情報が符号化されて得られたものである第 2符号ィ匕信号と、前記第 2符号化信号の符号量を表す信号とを含む符号化信号を取得し、取得された前記符号ィヒ信号を復号ィヒしてステレオ信号を出力する

ことを特徴とするオーディオ復号ィ匕方法。

[18] オーディオエンコーダのためのプログラムであって、コンピュータを

2チャネルを超えるマルチチャネル信号を、 2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックスされたステレオ信号を符号ィ匕し、第 1 符号化信号を生成する第 1符号化手段と、前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号ィ匕し、第 2符号化信号を生成する第 2 符号化手段と、前記第 2符号化信号の符号量を算出する符号量算出手段と、前記第 1符号化信号、前記第 2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段との各手段として機能させるプログラム。

[19] 符号ィ匕信号を復号ィ匕するオーディオデコーダのためのプログラムであって、コンビユータを 2チャネルを超えるマルチチャネル信号からダウンミックスされた 2チャネルのステレォ信号が符号化されて得られる第 1符号化信号と、前記ステレオ信号からマルチチヤネル信号を生成するための情報が符号化されて得られたものである第 2符号ィ匕信号と、前記第 2符号化信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、取得された前記符号化信号を復号化してステレオ信号を出力する複号化手段との各手段として機能させるプログラム。