WO2007116809A1

WO2007116809A1 - ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法

Info

Publication number: WO2007116809A1
Application number: PCT/JP2007/056955
Authority: WO
Inventors: Michiyo Goto; Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2006-03-31
Filing date: 2007-03-29
Publication date: 2007-10-18
Also published as: JPWO2007116809A1; US20090276210A1

Abstract

　ステレオ音声符号化のビットレートを減少しつつ、音質劣化を抑えることができるステレオ音声復号装置等を開示する。この装置においては、Ｌチャネル信号SL(n)のみが存在する区間０を特定し、ステレオ音声符号化側から伝送される区間０のモノラル信号を区間０のＬチャネル信号SL (0)(n)とし、区間０のＬチャネル信号SL (0)(n)をスケール調整して区間１のＲチャネル信号SR (1)(n)を予測し、区間１のモノラル信号から、予測した区間１のＲチャネル信号SR (1)(n)の寄与分を減ずることにより、区間１のＬチャネル信号SL (1)(n)を分離して求める。この装置は、続けて上記のスケール調整および分離処理を繰り返すことにより、すべての区間におけるＬチャネル信号SL(n)およびＲチャネル信号SR(n)を得る。

Description

明細書

ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法技術分野

[0001] 本発明は、ステレオ音声信号に対し符号化を施すステレオ音声符号化装置、これに対応するステレオ音声復号装置、およびこれらの方法に関する。

背景技術

[0002] 携帯電話機による通話のように、移動体通信システムにおける音声通信では、現在、モノラル方式による通信 (モノラル通信）が主流である。しかし、今後、第 4世代の移動体通信システムのように、伝送レートのさらなる高ビットレートイ匕が進めば、複数チヤネルを伝送するだけの帯域を確保できるようになるため、音声通信にぉ、てもステレォ方式による通信 (ステレオ通信）が普及することが期待される。

[0003] 例えば、音楽を HDD (ノヽードディスク)搭載の携帯オーディオプレーヤに記録し、このプレーヤにステレオ用のイヤホンやヘッドフォン等を装着してステレオ音楽を楽しむユーザが増えている現状を考えると、将来、携帯電話機と音楽プレーヤとが結合し、ステレオ用のイヤホンやヘッドフォン等の装備を利用しつつ、ステレオ方式による音声通信を行うライフスタイルが一般的になることが予想される。また、最近普及しつつある TV会議等の環境において、臨場感ある会話を可能とするため、やはりステレオ通信が行われるよう〖こなることが予想される。

[0004] 一方、移動体通信システム、有線方式の通信システム等にぉ、ては、システムの負荷を軽減するため、伝送される音声信号を予め符号化することにより伝送情報の低ビットレートイ匕を図ることが一般的に行われている。そのため、最近、ステレオ音声信号を符号ィ匕する技術が注目を浴びている。例えば、下記の式（1)を用いて、ステレオ信号を構成する一方のチャネル信号カゝら他方のチャネル信号を予測し、予測パラメ一タ aおよび dを符号ィ匕する技術がある (非特許文献 1参照)。

k

[数 1]

V ( ) = V x{n - d - k) * · · v 1 ) ここで、 aは予測誤差を最小にする予測パラメータとして、 k次の予測係数である。 d k

は 2つのチャネル信号の遅延時間差を表す。 x(n)は、サンプル番号 nにおける一方のチャネル信号を表し、 yXn)は、サンプル番号 nにおける予測された他方のチャネル信号を表す。

[0005] また、ステレオ通信が普及しても、依然としてモノラル通信も行われると予想される。

何故なら、モノラル通信は低ビットレートであるため通信コストが安くなることが期待され、また、モノラル通信のみに対応した携帯電話機は回路規模が小さくなるため安価となり、高品質な音声通信を望まないユーザは、モノラル通信のみに対応した携帯電話機を購入するだろうからである。よって、一つの通信システム内において、ステレオ通信に対応した携帯電話機とモノラル通信に対応した携帯電話機とが混在するようになり、通信システムは、これらステレオ通信およびモノラル通信の双方に対応する必要性が生じる。さらに、移動体通信システムでは、無線信号によって通信データをやりとりするため、伝搬路環境によっては通信データの一部を失う場合がある。そこで、通信データの一部を失っても残りの受信データ力元の通信データを復元することができる機能を携帯電話機が有していれば非常に有用である。

[0006] ステレオ通信およびモノラル通信の双方に対応することができ、かつ、通信データの一部を失っても残りの受信データ力元の通信データを復元することができる機能として、ステレオ信号とモノラル信号との両方を符号化'復号できるスケーラブル符号ィ匕がある。この機能を有したスケーラブル符号ィ匕装置の例として、例えば、非特許文献 2に開示されたものがある。

非特干文献 1 : Hendrik Fucns、 Improving Joint Stereo Audio し oding by Adaptive In ter— Channel Prediction 、 Applications of Signal Processing to Audio and Acoustics ^ Final Program and Paper Summaries ^ IEEE Workshop on Pages:39― 42、 (17— 20 Oct. 1993 )

非特許文献 2 : ISO/IEC 14496-3:1999 (B.14 Scalable AAC with core coder) 発明の開示

発明が解決しょうとする課題

[0007] し力しながら、非特許文献 1に開示の技術は、上述の式（1)で表されるような予測に基づいた符号ィ匕を行っていて、予測誤差を小さくする目的で予測係数の次数を上げると、すなわち、予測パラメータの個数を上げると、符号ィ匕ビットレートが増加してしまうという問題がある。また逆に、符号ィ匕ビットレートを抑制する目的で予測係数の次数を低減すると、予測性能が低下し、復号側で得られる音声信号に聴覚的な音質劣化が発生するという問題がある。また、非特許文献 2のようなスケーラブル符号化に、非特許文献 1の技術を適用すると、ステレオ信号だけでなくモノラル信号にっ、ても予測係数を求める必要があり、さらに符号ィ匕ビットレートが増大する。

[0008] 本発明の目的は、より少ない情報量を符号ィ匕し伝送することにより、ビットレートを減少しつつ、音質劣化を抑えることができるステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法を提供することである。

課題を解決するための手段

[0009] 本発明のステレオ音声復号装置は、 2つのチャネル力なるステレオ音声信号の時間的に先行する先行チャネル信号と、時間的に遅れる後続チャネル信号とが合成された、モノラル信号が符号化された符号ィ匕情報を復号するモノラル信号復号手段と、前記ステレオ音声信号の無音区間から有音区間に変わる立ち上がり位置が符号ィ匕された符号化情報を復号する立ち上がり位置復号手段と、前記先行チャネル信号と後続チャネル信号との遅延時間差が符号化された符号ィ匕情報を復号する遅延時間差復号手段と、前記後続チャネル信号と前記先行チャネル信号との振幅比が符号化された符号化情報を復号する振幅比復号手段と、前記モノラル信号と、前記遅延時間差と、前記立ち上がり位置とを用いて、前記先行チャネル信号を復号する先行チャネル信号復号手段と、前記先行チャネル信号と、前記振幅比とを用いて、前記後続チャネル信号を復号する後続チャネル信号復号手段と、を具備する構成を採る発明の効果

[0010] 本発明によれば、ステレオ音声符号ィ匕にぉ、て、両チャネル間の予測係数を符号化せず、ステレオ信号の立ち上がり位置、両チャネルの遅延時間差および振幅比に関するより少ない情報量を符号ィ匕し伝送することにより、ビットレートを減少しつつ、音質劣化を抑えることができる。図面の簡単な説明

[0011] [図 1]実施の形態 1に係るステレオ音声符号化装置の主要な構成を示すブロック図 [図 2]実施の形態 1に係るステレオ音声信号の立ち上がり位置を説明するための図 [図 3]実施の形態 1に係る Lチャネル信号と Rチャネル信号との遅延時間差および振幅比を説明するための図

[図 4]実施の形態 1に係るステレオ音声復号装置の主要な構成を示すブロック図 [図 5]実施の形態 1に係るステレオ信号復号部の詳細な構成を示すブロック図

[図 6]実施の形態 1に係るステレオ音声復号装置におけるステレオ音声信号の復号処理の原理を説明するための図

[図 7]実施の形態 1に係るステレオ音声信号をテーブルに纏めて示す図

[図 8]実施の形態 2に係るステレオ音声符号ィ匕装置の主要な構成を示すブロック図

[図 9]実施の形態 2に係る第 2レイヤデコーダの詳細な構成を示すブロック図

[図 10]実施の形態 2に係るステレオ音声復号装置の主要な構成を示すブロック図

[図 11]実施の形態 3に係るステレオ音声符号ィ匕装置の主要な構成を示すブロック図

[図 12]実施の形態 4に係るステレオ音声符号化装置の主要な構成を示すブロック図発明を実施するための最良の形態

[0012] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、 Lチャネルおよび Rチャネルの 2チャネルからなるステレオ音声信号を符号化する場合を例にとって説明する。

[0013] (実施の形態 1)

図 1は、本発明の実施の形態 1に係るステレオ音声符号化装置 100の主要な構成を示すブロック図である。

[0014] 図 1において、ステレオ音声符号化装置 100は、第 1レイヤ（基本レイヤ)エンコーダ 140および第 2レイヤ（拡張レイヤ)エンコーダ 150を備え、ステレオ音声信号のスケーラブル符号化を行う。第 1レイヤエンコーダ 140は、モノラル信号生成部 101およびモノラル信号符号ィ匕部 102を備え、モノラル信号の符号ィ匕を行う。第 2レイヤェンコーダ 150は、立ち上がり位置検出部 103、立ち上がり位置符号ィ匕部 104、遅延時間差算出部 105、遅延時間差符号化部 106、振幅比算出部 107、および振幅比符号化部 108を備え、ステレオ信号の符号ィ匕を行う。各レイヤエンコーダは、得られる符号化パラメータを後述のステレオ音声復号装置 200に伝送する。

[0015] モノラル信号生成部 101は、入力されるステレオ音声信号、すなわち、 Lチャネル信号 S (n)および Rチャネル信号 S (n)力もモノラル信号 S (n)を生成して、モノラル信

L R

号符号ィ匕部 102に出力する。モノラル信号 S (n)は、下記の式（2)に従い、 Lチャネル信号 S (n)および Rチャネル信号 S (n)の平均値を求めることにより生成される。

し R

S (n)= (S (n) + S (n)) /2 - (2)

L R

ここで、 nはステレオ音声信号のサンプル番号を示す。

[0016] モノラル信号符号ィ匕部 102は、モノラル信号生成部 101で生成されるモノラル信号 S (n)を CELP(Code Excited Linear Prediction)符号化方式で符号化し、得られるモノ

M

ラル信号符号ィ匕パラメータ Pをステレオ音声復号装置 200に伝送する。 CELP符号化方式においては、音声信号の声道情報については、 LSPパラメータを求めて符号化し、音声信号の音源情報については、予め記憶されている音声モデルの何れかを特定し、特定された音声モデルを示すインデックスにより符号化する。

[0017] 第 2レイヤエンコーダ 150は、ステレオ音声符号ィ匕装置 100に入力される Lチヤネル信号 S (n)および Rチャネル信号 S ( から、立ち上がり位置、 Lチャネル信号 S ( とし R し

Rチャネル信号 S (n)との遅延時間差、および Lチャネル信号 S (n)と Rチャネル信号 S

R し R

(n)との振幅比を求めて符号ィ匕し、得られる符号ィ匕パラメータ P 、 P、および Pをステレ

B T g ォ音声復号装置 200に伝送する。

[0018] 立ち上がり位置検出部 103は、入力される Lチャネル信号 S (n)および Rチャネル信し

号 S (n)から、ステレオ音声信号の立ち上がり位置を検出する。ステレオ音声信号の

R

立ち上がり位置について図 2を参照して説明する。

[0019] 通常、ステレオ音声信号には音声信号の振幅がゼロである無音区間、および音声信号の振幅がゼロでない有音区間が存在する。音声信号が無音区間から有音区間に移行し始める位置を立ち上がり位置 Bと称す。また、同一音源で発生した信号を異なる位置で取得した Lチャネル信号 S (n)と Rチャネル信号 S (n)は、音源からの距離がし R

異なるため、一方のチャネル信号が先行して先行チャネルとなるのに対して、他方のチャネル信号は後続チャネル信号となり、振幅も先行チャネル信号の振幅カゝら減衰している。例えば本実施の形態では Rチャネル信号 S (n)よりも Lチャネル信号 S ( の

R し方が音源に近いため、 Lチャネル信号 S (n)は Rチャネル信号 S (n)より時間的に先行し R

しており、振幅もより大きい。従って、立ち上がり位置力も所定の区間において、 Rチャネル信号 S (n)は存在せず、 Lチャネル信号 S (n)のみ存在する。図 2においては、 L

R し

チャネル信号 S (n)の振幅と Rチャネル信号 S (n)の振幅とがともにゼロでない区間のし R

始まり位置を時間軸 0で示す。

[0020] 立ち上がり位置検出部 103は、無音区間が終わり、 Lチャネル信号のみ存在する区間の始まり位置を立ち上がり位置 Bとして検出し、検出された立ち上がり位置 Bに関する情報を立ち上がり位置符号ィ匕部 104に出力する。ここで立ち上がり位置 Bに関する情報とは、音源力近く時間的に先行するチャネル信号が Lチャネル信号と Rチャネル信号の何れであるかを識別する情報、および先行チャネルの振幅がゼロから非ゼロに変わる位置を示す情報の両方を含む。

[0021] 立ち上がり位置符号ィ匕部 104は、立ち上がり位置検出部 103から入力される立ち上がり位置 Bに関する情報を符号ィ匕し、得られる立ち上がり位置符号ィ匕パラメータ P

B

をステレオ音声復号装置 200に伝送する。

[0022] 遅延時間差算出部 105は、ステレオ音声符号化装置 100に入力される Lチャネル信号 S (n)および Rチャネル信号 S (n)を用いて、下記の式（3)に従い、 Lチャネル信号し R

S (n)と Rチャネル信号 S (n)との遅延時間差 Tを算出する。

し R

[数 2]

N-1

0( ）

«=0 " · ("） … ( 3 ) ここで φ (πι)は、 Lチャネル信号 S (η)および Rチャネル信号 S (η)の相互相関関数をし R

示し、 Νは 1フレームに含まれるサンプル数を示し、 mは Lチャネル信号 S (n)に対するし

Rチャネル信号 S (n)のシフトサンプル数を示す。遅延時間差算出部 105は、 Lチヤネ

R

ル信号 S (n)と Rチャネル信号 S (n)との遅延時間差 Tとして、 φ (m)の値が最大となる m し R

の値を算出する。 Lチャネル信号 S (n)が Rチャネル信号 S (n)に対して先行している場し R

合には、 Tの値が正数となり、 Lチャネル信号 S 01)カ¾チャネル信号 S (n)に対して遅し R

れている場合には、 Tの値が負数となる。ここでは上述したように、 Lチャネル信号が Rチャネル信号に対して先行している場合を例にとるため、 Tの値は正数となる。遅延時間差算出部 105は、算出した遅延時間差 Tを遅延時間差符号ィ匕部 106および振幅比算出部 107に出力する。

[0023] 遅延時間差符号化部 106は、遅延時間差算出部 105から入力される遅延時間差 Tを符号ィ匕して、符号化パラメータ Pをステレオ音声復号装置 200に伝送する。

T

[0024] 振幅比算出部 107は、ステレオ音声符号ィ匕装置 100に入力される Lチャネル信号 S (n)、Rチャネル信号 S (n)、および遅延時間差算出部 105で算出された遅延時間差し R

Tを用いて、下記の式 (4)に従い、 Lチャネル信号 S (n)と Rチャネル信号 S (n)との振し R 幅比 gを算出する。

[数 3]

ここで、 Aおよび Aは、それぞれ Rチャネル信号 S (n)および Lチャネル信号 S ( の

R L R L

1フレームにおける平均振幅を示す。振幅比算出部 107は、算出された振幅比 gを振幅比符号化部 108に出力する。

[0025] 上記遅延時間差算出部 105および振幅比算出部 107それぞれで算出された、 Lチャネル信号 S (n)と Rチャネル信号 S (n)との遅延時間差 Tおよび振幅比 gについて図 3 し R

を用いて説明する。

[0026] 図 3は、同一音源で発生した信号を異なる位置で取得した Lチャネル信号 S (n)と R しチャネル信号 S (n)との遅延時間差および振幅比を示す図である。この図において、

R

図 3Aは Lチャネル信号 S (n)を示し、図 3Bは Rチャネル信号 S (n)と Lチャネル信号 S ( し R し n)との関係を示す。この図に示すように、 Lチャネル信号 S (n)を、遅延時間差算出部し

105で算出された遅延時間差 Tだけ遅延すると信号 S' (n)となる。ここで立ち上がり位し

置 Bから時間軸 0までの信号長は遅延時間差 Tと一致する。次に、信号 S' (n)の振幅しに、振幅比算出部 107で算出された振幅比 gを乗じれば、信号 S (n)は同一の音源でし

発生した信号であるため、理想的には Rチャネル信号 S (n)と一致する。例えばこの図において、およびは、それぞれ時間 tに対応する Rチャネル信号 S (n)の振幅お

R し R

よび Lチャネル信号 S (n)の振幅を示し、 /A¹ =gの関係を満たす。

し R し

[0027] 振幅比符号ィ匕部 108は、振幅比算出部 107から入力される振幅比 gを符号ィ匕し、得られる符号化パラメータ Pをステレオ音声復号装置 200に伝送する。

g

[0028] 上記のように、ステレオ音声符号ィ匕装置 100における符号ィ匕処理はフレーム単位で行われ、モノラル信号符号ィ匕パラメータ P、立ち上がり位置符号ィ匕パラメータ P 、

B

遅延時間差符号化パラメータ P、および振幅比符号化パラメータ Pを生成してステレ

T g

ォ音声復号装置 200に伝送する。

[0029] 図 4は、本実施の形態に係るステレオ音声復号装置 200の主要な構成を示すプロック図である。

[0030] 図 4にお、て、ステレオ音声復号装置 200は、ステレオ音声符号化装置 100と対応して、第 1レイヤ (基本レイヤ)デコーダ 240および第 2レイヤ（拡張レイヤ)デコーダ 2 50を備える。第 1レイヤデコーダ 240は、モノラル信号復号部 201を備え、ステレオ音声符号ィ匕装置 100から伝送されるモノラル信号符号ィ匕パラメータ Pを用いて、フレーム単位でモノラル信号の復号を行う。第 2レイヤデコーダ 250は、立ち上がり位置復号部 202およびステレオ信号復号部 203を備え、ステレオ音声符号ィ匕装置 100から伝送される立ち上がり位置符号ィ匕パラメータ P

B、遅延時間差符号化パラメータ P 、

T

および振幅比符号化パラメータ Pを用いて、遅延時間差 T単位でステレオ信号の復 g

号を行う。

[0031] 第 1レイヤデコーダ 240においてモノラル信号復号部 201は、ステレオ音声符号ィ匕装置 100のモノラル信号符号ィ匕部 102から伝送されるモノラル信号符号ィ匕パラメータ Pを用いて、モノラル信号の復号を行い、モノラル復号信号 S~ (n)を出力する。ここで

、モノラル信号復号部 201の復号方式として、モノラル信号符号ィ匕部 102で用いられる符号化方式に対応して CELP復号方式を用いる。第 2レイヤデコーダ 250におヽてステレオ信号の復号が行われな力つた場合、ステレオ音声復号装置 200におヽて生成されるステレオ音声復号信号はモノラル復号信号 S~ (n)のみからなり、モノラル音声信号となる。またモノラル信号復号部 201は、モノラル復号信号 S~ (n)をステレオ信号復号部 203に出力する。 [0032] 第 2レイヤデコーダ 250において立ち上がり位置復号部 202は、ステレオ音声符号化装置 100の立ち上がり位置符号ィ匕部 104から伝送される符号ィ匕パラメータ Pを復

B

号して、復号立ち上がり位置をステレオ信号復号部 203に出力する。ステレオ信号復号部 203は、ステレオ音声符号化装置 100の振幅比符号化部 108から伝送される振幅比符号化パラメータ P、ステレオ音声符号化装置 100の遅延時間差符号化 g

部 106から伝送される遅延時間差符号ィ匕パラメータ P、モノラル信号復号部 201から

T

入力されるモノラル復号信号 S~ (n)、および立ち上がり位置復号部 202から入力される復号立ち上がり位置^を用いて、ステレオ信号の復号を行い、 Lチャネル復号信号 (n)および Rチャネル復号信号^ (n)を出力する。

し R

[0033] 図 5は、本実施の形態に係るステレオ信号復号部 203の詳細な構成を示すブロック図である。

[0034] 図 5において、ステレオ信号復号部 203は、振幅比復号部 231、遅延時間差復号部 232、先行チャネル復号信号分離部 233、後続チャネル復号信号生成部 234、繰り返し演算制御部 235、先行チャネル復号信号記憶部 236、および後続チャネル復号信号記憶部 237を備える。

[0035] 振幅比復号部 231は、ステレオ音声符号ィ匕装置 100の振幅比符号ィ匕部 108から伝送される振幅比符号化パラメータ Pを復号し、得られる復号振幅比 g~を後続チヤネ g

ル復号信号生成部 234に出力する。

[0036] 遅延時間差復号部 232は、ステレオ音声符号化装置 100の遅延時間差符号化部 106から伝送される遅延時間差符号ィ匕パラメータ Pを復号し、得られる復号遅延時

T

間差を先行チャネル復号信号分離部 233および繰り返し演算制御部 235に出力する。

[0037] 先行チャネル復号信号分離部 233は、モノラル信号復号部 201から入力されるモノラル復号信号^ (n)、遅延時間差復号部 232から入力される復号遅延時間差 Τ"\立ち上がり位置復号部 202から入力される復号立ち上がり位置 B および後続チヤネル復号信号生成部 234から入力される後続チャネル復号信号 S~ (n)を用い、モノラル

R

復号信号 S~ (n)カゝら先行チャネル復号信号^ (n)を分離する。上述したように本実施

L

の形態では、 Lチャネルが先行チャネルとなり、 Rチャネルが後続チャネルとなる。先行チャネル復号信号分離部 233は、上記の分離処理において、繰り返し演算制御部 235の制御に基づき、すべての区間で同様の演算を繰り返す。先行チャネル復号信号分離部 233は、得られる Lチャネル復号信号^ (n)を後続チャネル復号信号生

し

成部 234、および先行チャネル復号信号記憶部 236に出力する。

[0038] 後続チャネル復号信号生成部 234は、振幅比復号部 231から入力される復号振幅および先行チャネル復号信号分離部 233から入力される Lチャネル復号信号 S ^ (n)を用い、後続チャネル復号信号、すなわち本実施の形態では Rチャネル復号信し

号 S~ (n)を生成する。後続チャネル復号信号生成部 234は、上記の処理において、

R

繰り返し演算制御部 235の制御に基づき、すべての区間で同様の演算を繰り返す。後続チャネル復号信号生成部 234は、生成される Rチャネル復号信号^ (n)を先行

R

チャネル復号信号分離部 233および後続チャネル復号信号記憶部 237に出力する

[0039] 繰り返し演算制御部 235は、遅延時間差復号部 232から入力される復号遅延時間差 T および立ち上がり位置復号部 202から入力される復号立ち上がり位置 ^を用いて、先行チャネル復号信号分離部 233、および後続チャネル復号信号生成部 23

4の繰り返し演算を制御し、復号遅延時間差以下遅延時間差 Tと見なす)単位で、

Lチャネル信号 S~ (n)および Rチャネル復号信号 S~ (n)を生成させる。

し R

[0040] 先行チャネル復号信号記憶部 236、および後続チャネル復号信号記憶部 237は、先行チャネル復号信号分離部 233、および後続チャネル復号信号生成部 234それぞれカゝら入力される Lチャネル復号信号 S~ (n)、および Rチャネル復号信号^ (n)それし R ぞれを記憶しておき、同一の遅延時間差 T単位に対応する Lチャネル復号信号 S~ (n) し

、および Rチャネル復号信号 S~ (n)を同時に出力することにより、ステレオ音声復号信

R

号を構成する。

[0041] ステレオ音声復号装置 200のステレオ音声信号の復号処理にお、て各チャネル信号を分離できる原理にっ、て図 6を用いて説明する。

[0042] 図 6において、 S (n)、および S (n)は、 Lチャネル信号、および Rチャネル信号それぞ

L R

れを示し、 nはサンプル番号を示す。なお、 1フレームは N個のサンプルからなる。図 6Aにおいては実線で Lチャネル信号 S (n)を示し、図 6Bにおいては破線で Rチヤネル信号 S (n)を示し、図 6Cにおいては実線および破線で、 Lチャネル信号 S (n)および

R し

Rチャネル信号 S (n)を同時に示している。

R

[0043] 図 6Aに示すように、本実施の形態では遅延時間差 Tが 1フレーム長より小さい場合を例にとり、立ち上がり位置 Bから最初の遅延時間差 Tまでの区間を区間 0と示す。図 6Aにおいて、 Lチャネル信号 S (n)の 1フレームは、遅延時間差 T毎に区間 1、区間 2 し

、…〖こ区切られる。ここで各区間の Lチャネル信号を S ⁽¹⁾(n)、 S ⁽²⁾(n)、…で示し、上付しし

文字の (1)、（2)は区間番号を示す。なお、フレーム長が遅延時間差 Tの整数倍になるとは限らないため、 1フレーム内の最後の区間は、遅延時間差 Tより短い場合がある。

[0044] 図 6Bに示すように、 Rチャネル信号 S (n)の 1フレームも遅延時間差 T毎に区間 1、

R

区間 2、…〖こ区切られる。各区間の Rチャネル信号を S ⁽¹⁾(n)、 S ⁽²⁾(n)、…で示し、上付

R R

文字の (1)、（2)は、区間番号を示す。なお、立ち上がり位置 Bから最初の遅延時間差 Tまでの区間 0において、 Rチャネル信号 S (n)は存在しない。すなわち、 S ^(Q)(n) = 0で

R R

ある。

[0045] 従って、ステレオ音声復号装置 200は、下記の式（5)に従、、モノラル復号信号^

(n)の区間 0に対応する部分の信号^ ^(Q)(n)を、区間 0の Lチャネル復号信号 S~ ^(Q)(_n)と

L

することができる。

S ⁰⁾(_n) = S ⁰⁾(n) ただし、一 T≤n< 0 - (5)

L

[0046] 図 6Cに示すように、破線で示す Rチャネル信号 S (η)の波形は、実線で示す Lチヤ

R

ネル信号 S (η)に対して遅延時間差 Τ分の遅延があり、 1区間遅れた信号となる。またし

、 Rチャネル信号 S (η)の振幅は、 Lチャネル信号 S (η)に対して振幅比 g (g≤l)が乗じ

R し

られた振幅となる。すなわち、 Lチャネル信号 S (n)と Rチャネル信号 S (n)とは、下記のし R

式 (6)に示す関係を満たす。

S (n) =g - S (n-T) - (6)

R し

[0047] 従って、ステレオ音声復号装置 200は、下記の式（7)を用いて、区間 0の Lチャネル復号信号 S~ ⁽ — T)をスケール調整して、区間 1の Rチャネル信号^ ⁽¹⁾(n)を求めるこし R

とがでさる。

S ¹) (n) = gヽ S~ (°)(n— T) ただし、 0≤n< T - {7)

R し

[0048] 次いで、モノラル復号信号^ (η)の区間 1に対応する部分の信号^ ⁽¹⁾(η)から、上記区間 1の Rチャネル復号信号 S~ ⁽¹⁾(n)を分離することにより、区間 1の Lチャネル復号信

R

号 S~ ⁽¹⁾(n)を求めることができる。再び、求められた区間 1の Lチャネル復号信号 S~ ⁽¹⁾(n しし

)に振幅比 gを掛けると、区間 2の Rチャネル信号^ ⁽²⁾(n)が得られる。このように同様の

R

演算を繰り返すことにより、ステレオ音声復号装置 200はステレオ音声を復号することができる。

[0049] すなわち、ステレオ音声復号装置 200は、まずモノラル信号 S (n)において、 Lチヤネル信号 S (n)と Rチャネル信号 S (n)とが混在している区間ではなぐ Lチャネル信号 S し R

(n)のみが存在する区間 0を特定する。次いでステレオ音声復号装置 200は、特定しし

た区間 0の Lチャネル信号 S ^(Q)(n)をスケール調整して次の区間 1の Rチャネル信号 S ^α し R

)(η)を予測する。次いで区間 1のモノラル信号 S ⁽¹⁾(n) (Lチャネル S ^G)(n)と Rチャネル S ⁽

L R

)とが混在する信号)から、予測した Rチャネル信号 S ^ω(η)の寄与分を減ずること〖こ

R

より、区間 1における Lチャネル信号 S ^ω(η)を求める。ステレオ音声復号装置 200は、し

続けて上記のスケール調整および分離処理を繰り返すことにより、各区間における L チャネル信号 S (n)および Rチャネル信号 S (n)を得る。

し R

[0050] 図 7は、図 6に示したステレオ音声信号をテーブルに纏めて示す図である。この図において第 1行目はフレームの順番を示し、第 2行目は区間番号を示す。第 3行目はサンプル番号 nの可能な値の範囲を示し、第 4行目および第 5行目は、それぞれ各区間に対応する Lチャネル信号および Rチャネル信号を示す。

[0051] 次に、ステレオ音声復号装置 200におけるステレオ音声信号の復号手順について詳細に説明する。

[0052] まずモノラル信号復号部 201は、モノラル信号符号ィ匕パラメータ Pを復号してモノラル復号信号 S~ (n)を得る。

[0053] 次いで立ち上がり位置復号部 202は、立ち上がり位置符号ィ匕パラメータ Pを復号し

B

て復号立ち上がり位置を得る。

[0054] 次いで、振幅比復号部 231は、振幅比符号ィ匕パラメータ Pを復号して復号振幅比 g g

'を得、遅延時間差復号部 232は、遅延時間差符号化パラメータ Pを復号して復号

T

遅延時間差を得る。

[0055] 次ヽで先行チャネル復号信号分離部 233は、復号遅延時間差 T モノラル復号信号 S~ (n)、復号立ち上がり位置を用いて、区間 0の Lチャネル復号信号 S~ ^(Q)(n)を得

L

る。区間 0では、 Lチャネル信号しか存在しないので、モノラル復号信号力チャネル復号信号となり、すなわち、上記の式（5)に従い、立ち上がり位置までの Lチャネル復号信号 (^Q)(n)が得られる。

し

[0056] 次いで後続チャネル復号信号生成部 234は、上記の式（7)に従い、区間 1における Rチャネル復号信号 S~ ^ω(η)を得る。

R

[0057] 次いで、ステレオ音声符号ィ匕装置 100においてモノラル信号 S (η)は Lチャネル信号 S (η)および Rチャネル信号 S (η)の平均値として求められたため、先行チャネル復し R

号信号分離部 233は、下記の式 (8)に従い、区間 1における Lチャネル復号信号^ ^α し

)(η)を得る。

⁽¹⁾ (η) = 2 · S~ ⁽¹⁾(n) ⁽¹⁾(n) = 2 · S~ ⁽¹⁾(n) gヽ S~ (°)(n— T) · · · (8)

L R L

ここで、 nは、 0≤n<Tである。なお式（8)においては、式（7)が代入されている。すなわち、先行チャネル復号信号分離部 233で求められた、区間 0の Lチャネル復号信号に相当する^ ⁽⁰⁾(n-T) (0≤n<T)が後続チャネル復号信号生成部 234においし

て用いられる。

[0058] 次ヽで先行チャネル復号信号分離部 233、および後続チャネル復号信号生成部 2 34は、繰り返し演算制御部 235の制御に基づき上記の式（7)および式 (8)に示す演算を区間 2以降において再帰的に繰り返しながら、すべての区間における Lチャネル復号信号（η)および Rチャネル復号信号（η)を得る。

し R

[0059] 具体的には、区間 2における Rチャネル信号^ ⁽²⁾(η)は、同様に、式（7)に示す演算

R

を区間 2で繰り返すことにより求められ、すなわち下記の式（9)に従い、 ⁽¹⁾(η— Τ)をしスケール調整して求められる。

S ²⁾(n) = g^^ ⁽¹⁾(n-T) … ）

R し

この式では、 Τ≤η< 2 ·Τであり、区間 1の Lチャネル復号信号に相当する^ ⁽¹⁾(η-Τ し

) (Τ≤η< 2 ·Τ)が区間 2で再帰的に用いられる。

[0060] 次、で、区間 2における Lチャネル復号信号 S~ ⁽²⁾(n)は、式 (8)に示す演算を区間 2 し

で繰り返すことにより求められ、すなわち下記の式（10)に従って求められる。

⁽²⁾ (n) = 2 ( )— S~ ⁽²⁾(n) = 2 ( )— gヽ S~ ⁽¹⁾(n— T) …（10) この式では、 Τ≤η<2·Τであり、区間 1の Lチャネル復号信号に相当する^ ⁽¹⁾(η-Τ し

) (Τ≤η< 2·Τ)が区間 2で再帰的に用いられる。

[0061] 区間 j+ 1における Lチャネル復号信号^ ^^(η)および Rチャネル復号信号^ ^"(η) し R は、区間 2における Lチャネル復号信号^ (²)(η)および Rチャネル復号信号^ (²)(η)のし R 求め方と同様に、区間 jの演算結果を再帰的に用いることにより求められる。具体的には、区間 j+1における Rチャネル復号信号^ °" )は、下記の式（11)に従い得ら

R

れる。

-τ) 〜（11)

この式で、 j'T≤n<(j+l)'T、 j=0,"-J— 1、 j'T≤n<Nであり、 Jは、 J'T≤n<Ci + l )·Τを満たす整数値である。

[0062] 次、で、区間 j+ 1における Lチャネル復号信号^ ¹^)は、下記の式（12)に従ヽ

L

求められる。

％) = 2 ％) S~ ⁽ⁱ⁺¹⁾(n) = 2-S'~ n) g T) -(12)

L R L

ただし、 j'T≤n<(j+l)'T j=(V"J— 1

j-T≤n<N j=J

j=(V"J J'T≤N<(J + 1)'Tを満たす整数値

[0063] なお、上記の式（12)において、 j=j 1にすると、下記の式（13)が得られる。

%) = 2-S^ )— g^S^n—丁) ...(13)

L L

[0064] また、 n=n Tにする場合の式（13)の結果を、式（12)の右辺第 2項に代入すると、下記の式（14)が得られる。

⁽ⁱ⁺¹⁾(n) = 2-S'~ ) g W T) gヽ S~ "~%-2·Ύ)} -(14)

L L

[0065] 式（13)において、 j叫 1とすると、下記の式（15)が得られる。

(ⁱ"¹⁾(n) = 2-S'~ ^(n)— g s4²⁾(_n—丁) … ₅)

L L

[0066] さらに、 n=n 2 ·Τにする場合の式（15)の結果を、式（14)の右辺第 3項に代入すると、下記の式（16)が得られる。

⁽ⁱ⁺¹⁾(n) = 2-S'~ )— 2'gヽ S~ !— T)— g — gつ {2 ^(η— 2·Τ)— gヽ S~ ^%

L L

-3-T)} ー（16)

[0067] 式（13)〜（16)の演算を繰り返すと、下記の式（17)が得られる。画

+ (-1) ⁺¹)'(g^A) +"· S ("- (ゾ + 1)· Γ)

= ^2·(-1)'·(^)'· S {n-i - T)

+ (_l) ₎a₊₁). s (_n-U ₊ l) · T) … (1 7)

ただ'し、ゾ · Γ_≤"< (ゾ + 1)· Γ ゾ =0,一，一 1

j'T_≤n<N j = J

j = ,...,J Jは J* T≤N<リ + Ϊ)• Γを満たす整数値

S (n): モノラル復号信号

S (n) ： Lチャネル復^言号この式において、右辺の S~ (n— (j+l)'T)は、つまり、区間 0のモノラル信号である。

[0068] すなわち、先行チャネル復号信号分離部 233は、上記の式（17)に従いモノラル復号信号 S~ (n)のみを用いて、 Lチャネル復号信号 S~ ^(n)を求めても良い。かかる場

L

合、 Rチャネル復号信号 S~ ^(n)は、 Lチャネル復号信号 S~ ^(n)をスケール調整して

R

求めれば良い。

[0069] このように、本実施の形態によれば、ステレオ音声符号化装置は、モノラル信号と、すべての区間における Lチャネル信号、 Rチャネル信号の予測情報を符号化するのに代えて、モノラル信号、立ち上がり位置、遅延時間差、および振幅比を符号化してステレオ音声復号装置に伝送する。ステレオ音声復号装置は、ステレオ音声符号ィ匕装置力も伝送される符号ィ匕情報を用いて繰り返しの演算を行いステレオ音声信号を復号する。すべての区間における Lチャネル信号、 Rチャネル信号の予測情報に比ベ、立ち上がり位置、遅延時間差、および振幅比の情報量はより少ないため、本実施の形態によれば予測係数を減少し、より低、ビットレートでステレオ音声信号の伝送を行うことができる。

[0070] なお、本実施の形態では、ステレオ音声信号力チャネル信号と Rチャネル信号と 2 チャネルからなり、 Rチャネル信号よりも Lチャネル信号が音源力も近、場合を例にとつて説明したが、 Lチャネル信号よりも Rチャネル信号が音源力近、場合でも本実施の形態を適応することができ、かかる場合、音声立ち上がり位置から最初の遅延時間差 Tまでの区間 0においては、 Lチャネル信号は存在せず、 Rチャネル信号のみ存在する。さらに、ステレオ音声信号が 3つ以上のチャネル信号力もなる場合でも、本実施の形態を適宜変更して適用することができる。

[0071] また、本実施の形態では、ステレオ復号装置で、区間 0の Lチャネル信号をスケール調整して区間 1の Rチャネル信号として復号を行う場合を例にとって説明したが、モデル的な波形を予め記憶してぉ、て区間 1の Rチャネル信号 (または Lチャネル信号）として用いても良い。

[0072] また、本実施の形態では、モノラル信号の符号ィ匕方式として CELP符号ィ匕方式を用いる場合を例にとって説明したが、 CELP符号ィ匕方式と異なる他の符号ィ匕方式を用いても良い。

[0073] また、本実施の形態では、モノラル信号の生成方法として Lチャネル信号と Rチヤネル信号との平均値を求める方法を例にとって説明したが、モノラル信号の生成方法として他の方法を使っても良ぐその一例を式で表すと S (n)=w S (n)+w S (n)である

1 L 2 R

。この式において w、 wは、 w +w = 1. 0の関係を満たす重み付け係数である。

[0074] また、本実施の形態では、ステレオ音声信号を符号化して伝送する場合を例にとつて説明したが、無音区間と有音区間からなるステレオオーディオ信号を符号ィ匕して伝送しても良い。

[0075] (実施の形態 2)

図 8は、本発明の実施の形態 2に係るステレオ音声符号化装置 300の主要な構成を示すブロック図である。なお、ステレオ音声符号化装置 300は、実施の形態 1に示したステレオ音声符号ィ匕装置 100 (図 1参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。ステレオ音声符号化装置 300は、第 1レイヤデコーダ 240a、第 2レイヤデコーダ 450a、誤差信号算出部 30 1、および誤差信号符号化部 302をさらに具備する点で、実施の形態 1に示したステレオ音声符号化装置 100と相違する。ステレオ音声符号化装置 300において、第 1 レイヤデコーダ 240a、第 2レイヤデコーダ 450a、誤差信号算出部 301、誤差信号符号化部 302、および第 2レイヤエンコーダ 150は、第 2レイヤエンコーダ 350を構成する。

[0076] ステレオ音声符号ィ匕装置 300において、ローカルデコーダとしての第 1レイヤデコーダ 240aは、実施の形態 1に係るステレオ音声復号装置 200が備える第 1レイヤデコーダ 240と同様な構成および機能を有する。すなわち、第 1レイヤデコーダ 240aは、モノラル信号符号ィ匕部 102で生成されたモノラル信号符号ィ匕パラメータ Pを入力とし、モノラル信号を復号して、得られるモノラル復号信号 S~ (n)を第 2レイヤデコーダ 4

50aに出力する。

[0077] ステレオ音声符号化装置 300の別のローカルデコーダとして第 2レイヤデコーダ 45 Oaは、第 1レイヤデコーダ 240aで生成されるモノラル復号信号 S~ (n)、立ち上がり位置符号化部 104で生成される立ち上がり位置符号化パラメータ P、遅延時間差符号

B

化部 106で生成される遅延時間差符号ィ匕パラメータ P、振幅比符号化部 108で生成

T

される振幅比符号化パラメータ P、誤差信号符号化部 302で生成される Lチャネル誤 g

差信号符号化パラメータ P

ALおよび Rチャネル誤差信号符号ィ匕パラメータ P

ARを用いてステレオ音声信号の復号を行う。第 2レイヤデコーダ 450aは、生成された Lチヤネル復号信号 S~ (n)および Rチャネル復号信号 S~ (n)を誤差信号算出部 301に出力すし R

る。第 2レイヤデコーダ 450aの詳細な構成については後述する。

[0078] 誤差信号算出部 301は、ステレオ音声符号ィ匕装置 300の入力信号である Lチヤネル信号 S (n)、 Rチャネル信号 S (n)、および第 2レイヤデコーダで生成される Lチヤネし R

ル復号信号 S~ (n)、 Rチャネル復号信号^ (n)を用いて、下記の式（18)および式（19 し R

)に従い、 Lチャネル誤差信号 A S (n)および Rチャネル誤差信号 A S (n)を算出する。

し R

A S (n) = S (n)-S^ (η) · '· (18)

ししし

A S (n) = S (n)-S^ (n) · '· (19)

R R R

誤差信号算出部 301は、算出された Lチャネル誤差信号 A S (n)および Rチャネルし

誤差信号 A S (n)を誤差信号符号ィ匕部 302に出力する。

R

[0079] 誤差信号符号ィ匕部 302は、誤差信号算出部 301で算出された Lチャネル誤差信号

A S (n)および Rチャネル誤差信号 A S (n)を符号ィ匕し、 Lチャネル誤差信号符号化パし R

ラメータ P および Rチャネル誤差信号符号化パラメータ P をステレオ音声復号装置

AL A R

400に伝送する。

[0080] 図 9は、本実施の形態に係る第 2レイヤデコーダ 450aの詳細な構成を示すブロック図である。なお、第 2レイヤデコーダ 450aは、実施の形態 1に示した第 2レイヤデコーダ 250 (図 4参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。第 2レイヤデコーダ 450aは、誤差信号復号部 401、および復号信号補正部 402をさらに具備する点で、実施の形態 1に示した第 2レイヤデコーダ 250と相違する。

[0081] 誤差信号復号部 401は、誤差信号符号化部 302から入力される Lチャネル誤差信号符号化パラメータ P および Rチャネル誤差信号符号ィ匕パラメータ P を復号して、生成される Lチャネル誤差復号信号 (n)および Rチャネル誤差復号信号 (n) し R を復号信号補正部 402に出力する。

[0082] 復号信号補正部 402は、誤差信号復号部 401で生成される Lチャネル誤差復号信号 (n)、 Rチャネル誤差復号信号 (n)、およびステレオ信号復号部 203で生し R

成される Lチャネル復号信号 S~ (n)、 Rチャネル復号信号 S~ (n)を用いて、下記の式（2 し R

0)および式（21)に従い、誤差補正された Lチャネル復号信号 S〃（n)および Rチヤネし

ル復号信号 S〃（n)を生成し、ステレオ信号復号部 203に出力する。

R

S^r/ (n) = S^ (n)+ A S^ (η) ' ·· (20)

ししし

S^r/ (n) = S^ (n)+ A S^ (n) ' ·· (21)

R R R

誤差補正された Lチャネル復号信号 S〃（n)および Rチャネル復号信号 S〃（n)は、スし R テレオ信号復号部 203の次の区間におけるステレオ音声信号の復号に用いられ、実施の形態 1に比べ誤差のより少な、Lチャネル復号信号 S~ (n)および Rチャネル復号し

信号 S~ (n)が得られる。

R

[0083] 上記のように、ステレオ音声符号化装置 300で生成されステレオ音声復号装置 40 0に伝送される符号化パラメータは、モノラル信号符号化パラメータ P、立ち上がり位置符号化パラメータ P

B、遅延時間差符号化パラメータ P

T、振幅比符号化パラメータ P g

、 Lチャネル誤差信号符号ィ匕パラメータ P 、および Rチャネル誤差信号符号ィ匕パラメ

Δし

ータ P である。

[0084] 図 10は、本実施の形態に係るステレオ音声復号装置 400の主要な構成を示すブロック図である。

[0085] 図 10において、ステレオ音声復号装置 400は、第 1レイヤデコーダ 240および第 2 レイヤデコーダ 450を備える。ステレオ音声復号装置 400の第 1レイヤデコーダ 240 は、図 4に示した第 1レイヤデコーダ 240と同一の構成および機能を有するため、ここでは説明を省略する。ステレオ音声復号装置 400の第 2レイヤデコーダ 450は、図 9 に示す第 2レイヤデコーダ 450aと同様の構成および機能を有する。すなわち第 2レイャデコーダ 450は、ステレオ音声符号化装置 300から伝送される立ち上がり位置符号化パラメータ P、遅延時間差符号化パラメータ P、振幅比符号化パラメータ P、 Lチ

B T g ャネル誤差信号符号化パラメータ P

Δしおよび Rチャネル誤差信号符号ィ匕パラメータ P

Δ

を入力とし、ステレオ信号の復号を行い、 Lチャネル復号信号^ (n)および Rチヤネ

R し

ル復号信号 S~ (n)を出力する。

R

[0086] このように、本実施の形態によれば、ステレオ音声符号化装置は、実施の形態 1に比べて Lチャネル誤差信号符号ィ匕パラメータ P および Rチャネル誤差信号符号ィ匕

Δし

ノラメータ P をさらに伝送し、ステレオ音声符号化装置は、より誤差の少ない Lチヤネル復号信号 S~ (n)および Rチャネル復号信号 S~ (n)を生成して出力することができるし R

[0087] なお、本実施の形態では、ステレオ符号化装置で立ち上がり位置符号化情報を求めてステレオ復号装置に伝送する場合を例にとって説明したが、ステレオ符号ィ匕装置が立ち上がり位置検出部および立ち上がり位置符号ィ匕部を備えず、またステレオ復号装置が立ち上がり位置復号部を備えず、ステレオ復号装置側の誤差信号補正部およびステレオ信号復号部の処理により立ち上がり位置を検出して復号を行っても良い。

[0088] また、本実施の形態では、 Lチャネル信号および Rチャネル信号両方の誤差信号を符号ィ匕する場合を例にとって説明したが、先行チャネル信号、本実施の形態では L チャネル信号の誤差信号のみを符号ィ匕してもよい。ただし、先行チャネル信号の誤差信号のみを符号ィ匕する場合よりも、 Lチャネル信号および Rチャネル信号両方の誤差信号を符号化する場合、ステレオ音声復号装置で復号されるステレオ音声信号の品質をさらに向上することができる。

[0089] また、本実施の形態では、ステレオ音声復号装置から出力される Lチャネル復号信号および Rチャネル復号信号力ステレオ信号復号部にフィードバックされない場合を例にとって説明したが、ステレオ音声復号装置力出力される Lチャネル復号信号および Rチャネル復号信号が遅延時間差単位でステレオ信号復号部にフィードバックされ用いられるようにしてもよぐ力かる場合ステレオ音声復号装置は、さらに誤差の少ない Lチャネル復号信号および Rチャネル復号信号を得て出力することができる。

[0090] (実施の形態 3)

図 11は、本発明の実施の形態 3に係るステレオ音声符号化装置 500の主要な構成を示すブロック図である。ステレオ音声符号化装置 500は、実施の形態 1に示したステレオ音声符号ィ匕装置 100 (図 1参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。ステレオ音声符号化装置 5 00は、遅延時間差補正値算出部 501、遅延時間差補正値符号化部 502、振幅比補正値算出部 503、および振幅比補正値符号化部 504をさらに具備する点で、実施の形態 1に示したステレオ音声符号ィ匕装置 100と相違する。

[0091] 遅延時間差補正値算出部 501は、 Lチャネル信号 S (n)と Rチャネル信号 S (n)とを、し R 遅延時間差算出部 105から入力される遅延時間差 Tに対応する長さで K個の区間に分割し、各区間における Lチャネル信号 S (kT+n)と Rチャネル信号 S (kT+n)との遅し R

延時間差 Tが遅延時間差 Tに対する変動量 Δ Τ、すなわち k区間における遅延時間 k k

差補正値 Δ Τを算出する（ここで kは、区間番号を示し、 k=0, 1, 2, 〜Kである）。

k

具体的に、遅延時間差補正値算出部 501は、まず、下記の式（22)を用いて、 k区間における Lチャネル信号 S (kT+n)および Rチャネル信号 S (kT+n)の相互相関関数し R

を算出する。

[数 5]

^(xt) = S_L {kT + n -x_k) * S_R (kT + ή) ... ( 2 2 )

rt=0 この式において、 Tは各区間に含まれるサンプル数を示し、ては Lチャネル信号 S ( k し n)に対する Rチャネル信号 S (n)のシフトサンプル数を示す。 φ ( て )は、 k区間におけ

R k k

る Lチャネル信号 S (kT+n)および Rチャネル信号 S (kT+n)の相互相関値を示し、遅し R

延時間差算出部 105は、 φ ( τ )の値が最大となる τ の値を、 k区間における Lチヤ k k k

ネル信号 S (kT+n)と Rチャネル信号 S (kT+n)との遅延時間差 Tとして算出する。こし R k のように、遅延時間差 Tは、 1フレーム全般における Lチャネル信号および Rチャネル信号の遅延時間差を示すのに対して、遅延時間差 Tは、 1フレーム内の各区間にお

k

ける Lチャネル信号および Rチャネル信号の遅延時間差を示す。次いで、遅延時間差補正値算出部 501は、下記の式（23)を用いて、遅延時間差 Tに対する k区間における遅延時間差 Tの変動量を k区間における遅延時間差補正値 Δ Τとして算出

k k

する。

Δ Τ =Τ -Τ - -- (23)

k k

[0092] 遅延時間差補正値算出部 501は、算出された遅延時間差補正値 Δ Τを遅延時間 k

差補正値符号ィ匕部 502に出力し、 k区間における遅延時間差 Tを振幅比補正値算 k

出部 503に出力する。

[0093] 遅延時間差補正値符号ィ匕部 502は、遅延時間差補正値算出部 501から入力される遅延時間差補正値 Δ Τを符号化し、生成される遅延時間差補正値符号ィ匕パラメ k 一タ P を本実施の形態に係るステレオ音声復号装置（図示せず）に伝送する。

[0094] 振幅比補正値算出部 503は、 Lチャネル信号 S (n)と Rチャネル信号 S (n)とを、遅延し R

時間差算出部 105から入力される遅延時間差 Tを長さとする K個の区間に分割し、遅延時間差補正値算出部 501から入力される遅延時間差 Tおよび振幅比算出部 1 k

07から入力される振幅比 gを用いて、各区間における Lチャネル信号 S (kT+n- Δ Τ し

)と尺チャネル信号 S (kT+n)との振幅比 gが振幅比 gに対する変動量 A g、すなわち k R k k k区間における振幅比補正値 A gを算出する。具体的に、振幅比補正値算出部 503 k

は、まず、下記の式（24)に従い、遅延時間差 Tを考慮した、 k区間における Rチヤネ k

ル信号 S (kT+n)と Lチャネル信号 S (kT+n)との振幅比 gを算出する。

R し k

[数 6]

[0095] このように、振幅比 gは、 1フレーム全般における Lチャネル信号および Rチャネル信号の振幅比を示すのに対して、振幅比 gは、 1フレーム内の各区間における Lチヤネ

k

ル信号および Rチャネル信号の振幅比を示す。次いで、振幅比補正値算出部 503 は、下記の式（25)を用いて、振幅比 gに対する k区間における振幅比 gの変動量を k k

区間における振幅比補正値 A gとして算出する。

k

すなわち、振幅比補正値算出部 503は、 k区間における Rチャネル信号 S (kT+n)

R

と Lチャネル信号 S (kT+n)との振幅比 gと、振幅比算出部 107から入力される振幅し k

比 gとの比を、振幅比補正値 A gとして算出する。振幅比補正値算出部 503は、算出 k

された振幅比補正値 Δ gを振幅比補正値符号ィ匕部 504に出力する。

k

[0096] 振幅比補正値符号ィ匕部 504は、振幅比補正値算出部 503から入力される振幅比補正値 Δ gを符号化し、生成される振幅比補正値符号ィ匕パラメータ P を本実施の k Agk

形態に係るステレオ音声復号装置に伝送する。

[0097] 本実施の形態に係るステレオ音声復号装置は、本発明の実施の形態 1に係るステレオ音声復号装置 200の基本的な構成及び機能を有し、遅延時間差補正値 Δ Τお k よび振幅比補正値 Δ gをさらに用いてステレオ音声を復号する点でステレオ音声復 k

号装置 200と相違する。例えば、遅延時間差復号部 232において、遅延時間差補正値符号化パラメータ P

ATkを復号し、得られる遅延時間差補正値 Δ T

kを用いて遅延時間差 Tを補正する。また、振幅比復号部 231において、振幅比補正値符号化パラメータ Ρ g

Agkを復号し、得られる振幅比補正値 Δ

kを用いて振幅比 gを補正する。ここでは、本実施の形態に力かるステレオ音声復号装置は図示せず、さらなる詳細な説明を省略する。

[0098] このように、本実施の形態によれば、ステレオ音声符号化装置は、遅延時間差丁に対応する長さで 1フレームのステレオ音声信号を複数の区間に分割し、各区間における遅延時間差 Tおよび振幅比 g力 1フレーム全般における遅延時間差 Tおよび k k

振幅比 gに対する変動量を遅延時間差補正値 Δ Τおよび振幅比補正値 A gとして伝 k k 送するため、ステレオ音声符号ィ匕の予測誤差をさらに低減することができる。ここで、遅延時間差補正値 Δ Τおよび振幅比補正値 A gは、 k区間における遅延時間差 T k k k および振幅比 gに比べ、値が小さいため、より低いビットレートでステレオ音声信号を k

符号ィ匕することができる。

[0099] なお、本実施の形態では、遅延時間差補正値算出部 501が式（22)に示すように、長さが遅延時間差 Tである k区間を演算範囲として相互相関値を算出する場合を例にとつて説明したが、これに限定されず、 k区間を含む (T— A a)〜(T— A b)範囲の区間を演算範囲として相互相関値を算出しても良い。

[0100] また、本実施の形態では、遅延時間差補正値符号ィ匕部 502は、各区間における遅延時間差補正値 Δ Τを個別に符号ィ匕し、 K個の遅延時間差補正値符号化パラメ k 一タ P を生成する場合を例にとって説明したが、 K個の遅延時間差補正値 Δ Τを纏

ATk k めて符号化し、 1つの遅延時間差補正値符号ィ匕パラメータ (例えば、 P

ΔΤと記す)を生成しても良い。

[0101] また、本実施の形態では、振幅比補正値符号ィ匕部 504は、各区間における振幅比補正値 Δ gを個別に符号ィ匕し、 K個の振幅比補正値符号ィ匕パラメータ P を生成す k Agk る場合を例にとって説明したが、 K個の振幅比補正値 A gを纏めて符号ィ匕し、 1つの k

振幅比補正値符号化パラメータ (例えば、 P と記す)を生成しても良、。

[0102] (実施の形態 4)

図 12は、本実施の形態に係るステレオ音声符号ィ匕装置 700の主要な構成を示すブロック図である。ステレオ音声符号化装置 700は、本発明の実施の形態 3に示したステレオ音声符号ィ匕装置 500 (図 11参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。ステレオ音声符号化装置 700の遅延時間差補正値符号ィ匕部 702、振幅比補正値符号化部 704と、ステレオ音声符号化装置 500の遅延時間差補正値符号化部 502、振幅比補正値符号化部 5 04とは処理の一部に相違点があり、それを示すために異なる符号を付す。

[0103] 遅延時間差補正値符号ィ匕部 702は、第 1符号ィ匕ビットテーブルをさらに内蔵し、内蔵の第 1符号ィ匕ビットテーブルを用いて、遅延時間差補正値算出部 501から入力される遅延時間差補正値を符号ィ匕する点で遅延時間差補正値符号ィ匕部 502と相違する。第 1符号ィ匕ビットテーブルは、遅延時間差補正値算出部 501から入力される各区間における遅延時間差補正値 Δ Τ (l≤k≤K)を符号ィ匕するための、各区間毎の符号 k

化ビット数を備える。 1フレーム内のすべての遅延時間差補正値 Δ Τを符号化するた k

めのビット総数を Mと示し、各区間 kにおける遅延時間差補正値 Δ Τを符号化するた k

めのビット数を TB(k)と示す場合、下記の式（26)および式（27)が満たされる。 TB(k)≥TB(k- 1) •(26)

[数 7]

M = TB(k) ... ( 2 7 ) ここで、例えば、各区間 kにおける遅延時間差補正値 Δ Τに対して量子化を行う場

k

合、 TB(k)は、スカラ量子化ビット数を示す。式（26)および式（27)に示すように、遅延時間差補正値符号ィ匕部 702は、フレームの先頭に近い区間よりもフレームの後尾に近い区間、すなわち、区間番号 kがより大きい区間における遅延時間差補正値 Δ Τ kの符号化に、より多くの符号化ビットを配分する。

[0104] 振幅比補正値符号ィ匕部 704は、第 2符号ィ匕ビットテーブルをさらに内蔵し、内蔵の第 2符号ィ匕ビットテーブルを用いて、振幅比補正値算出部 503から入力される振幅比補正値を符号化する点で振幅比補正値符号化部 504と相違する。第 2符号化ビットテーブルは、振幅比補正値算出部 503から入力される各区間における振幅比補正値 A g (l≤k≤K)を符号ィ匕するための、各区間毎の符号ィ匕ビット数を備える。 1フレー k

ム内のすべての振幅比補正値 Δ Τを符号ィ匕するためのビット総数を Nと示し、各区

k

間 kにおける振幅比補正値 A gを符号ィ匕するためのビット数を AB(k)と示す場合、下

k

記の式（28)および式（29)が満たされる。

AB(k)≥AB(k— 1) - - - (28)

[数 8]

AT-1

N = ^ AB(k) ... ( 2 9 ) ここで、例えば、各区間における振幅比補正値 A gに対して量子化を行う場合、 AB

k

(k)は、スカラ量子化ビット数を示す。式 (28)および式 (29)に示すように、振幅比補正値符号ィ匕部 704は、フレームの先頭に近い区間よりもフレームの後尾に近い区間、すなわち、区間番号 kがより大きい区間における振幅比補正値 A gの符号化に、よ

k

り多くの符号化ビットを配分する。

[0105] 本実施の形態に係るステレオ音声復号装置 800 (図示せず）は、式（17)に従いステレオ音声復号信号を求めて、さらに、遅延時間差補正値 Δ Τおよび振幅比補正値

k

A gを用いてステレオ音声復号信号の誤差を補正する。式（17)に示すように、ステ k

レオ音声復号装置 800は、 1フレーム内の各区間のステレオ音声復号信号を求めるために、遅延時間差 T、および振幅比 gを再帰的に用いるため、区間番号 kが増加するとともに、求められるステレオ音声復号信号の誤差も増加する。その理由は、区間番号 kが増加するとともに、遅延時間差補正値 Δ Τおよび振幅比補正値 A gが増加

k k するためである。従って、区間番号 kが増加するとともに、遅延時間補正値 Δ Τおよ

k び振幅比補正値 A gの符号ィ匕ビット数を増加させれば、予測誤差を低減し、ステレオ

k

音声復号信号の音質を向上することができる。

[0106] このように、本実施の形態によれば、ステレオ音声符号化装置は、フレームの先頭に近い区間よりもフレームの後尾に近い区間の振幅比補正値および振幅比補正値の符号化に、より多くの符号化ビットを配分するため、予測誤差を低減し、ステレオ音声復号信号の音質を向上することができる。

[0107] なお、本実施の形態においては、 1フレーム内の各区間毎にフレームの後尾に近いほど、符号ィ匕ビット数を増加する場合を例にとって説明したが、これに限定されず、 1フレーム内のすべての K個の区間を複数のブロックに分割し、各ブロック毎にフレームの後尾に近いほど符号ィ匕ビット数を増加しても良い。すなわち、同一のブロック内の各区間の遅延時間差補正値または振幅比補正値の符号ィ匕には同一の符号ィ匕ビット ¾cを用いる。

[0108] また、本実施の形態に係る符号ィ匕ビット配分の方法を本発明の実施の形態 2に適用しても、予測誤差を低減する効果が得られる。例えば、ステレオ音声符号化装置 3 00において、誤差信号符号ィ匕部 302が誤差信号算出部 301から入力される Lチヤネル誤差信号および Rチャネル誤差信号を量子化する場合、フレームの先頭よりもフレームの後尾に近いほど、より多くのビット数を用いて量子化を行えば良い。

[0109] 以上、本発明の各実施の形態について説明した。

[0110] 本発明に係るステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。

[0111] 本発明に係るステレオ音声符号化装置およびステレオ音声復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。また、本発明に係るステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法は、有線方式の通信システムにおいても利用可能である。

[0112] なお、本明細書では、本発明をモノラルステレオのスケーラブル符号ィ匕に適用する構成を例にとって説明したが、ステレオ信号に対して帯域分割符号ィ匕を行う場合の帯域別の各符号ィ匕 Z復号に本発明を適用するような構成としても良い。

[0113] また、本発明に係るステレオ信号符号ィ匕部と通常のステレオ信号符号ィ匕部の双方を有し、 Lチャネル信号と Rチャネル信号との相関度合いに基づいて、モード切替部力実際に使用するステレオ信号符号ィ匕部を切り替えるような構成としても良い。力カゝる場合、 Lチャネル信号と Rチャネル信号との相関度合いが閾値以下の場合、通常のステレオ信号符号ィ匕部を用いて、 Lチャネル信号および Rチャネル信号をそれぞれ別個に符号ィ匕し、 Lチャネル信号と Rチャネル信号との相関度合いが閾値より高い場合は、本発明に係るステレオ信号符号ィ匕部を用いて、 Lチャネル信号および R チャネル信号の符号ィ匕を行う。

[0114] また、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明した力本発明をソフトウェアで実現することも可能である。例えば、本発明に係るステレオ音声符号ィ匕方法の処理のアルゴリズムをプログラミング言語によって記述し、このプロダラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明のステレオ音声符号ィ匕装置と同様の機能を実現することができる。

[0115] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されていても良いし、一部または全てを含むように 1チップィ匕されてヽても良!、。

[0116] また、ここでは LSIとした力集積度の違いによって、 IC、システム LSI、スーパー L SI、ウノレ卜ラ LSI等と呼称されることちある。

[0117] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギユラブル ·プロセッサを利用しても良、。

[0118] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行っても良い。バイオ技術の適用等が可能性としてあり得る。

[0119] 2006年 3月 31曰出願の特願 2006— 99913の曰本出願および 2006年 10月 3曰出願の特願 2006— 272132の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

産業上の利用可能性

[0120] 本発明に係るステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法は、移動体通信システムにおける通信端末装置等の用途に適用できる。

Claims

請求の範囲

[1] 2つのチャネル力なるステレオ音声信号の時間的に先行する先行チャネル信号と、時間的に遅れる後続チャネル信号とが合成された、モノラル信号が符号化された符号化情報を復号するモノラル信号復号手段と、

前記ステレオ音声信号の無音区間から有音区間に変わる立ち上がり位置が符号ィ匕された符号化情報を復号する立ち上がり位置復号手段と、

前記先行チャネル信号と後続チャネル信号との遅延時間差が符号化された符号ィ匕情報を復号する遅延時間差復号手段と、

前記後続チャネル信号と前記先行チャネル信号との振幅比が符号化された符号ィ匕情報を復号する振幅比復号手段と、

前記モノラル信号と、前記遅延時間差と、前記立ち上がり位置とを用いて、前記先行チャネル信号を復号する先行チャネル信号復号手段と、

前記先行チャネル信号と、前記振幅比とを用いて、前記後続チャネル信号を復号する後続チャネル信号復号手段と、

を具備するステレオ音声復号装置。

[2] 前記先行チャネル信号のみが存在する、前記立ち上がり位置から前記遅延時間差分の第 1区間における前記モノラル信号を、前記第 1区間の前記先行チャネル信号とする、

請求項 1記載のステレオ音声復号装置。

[3] 前記後続チャネル信号復号手段は、

前記第 1区間の前記先行チャネル信号に前記振幅比を乗じて得られる信号を、前記第 1区間後に前記遅延時間差分だけ続く第 2区間の前記後続チャネル信号とする請求項 2記載のステレオ音声復号装置。

[4] 前記先行チャネル信号復号手段は、

前記第 2区間の前記モノラル信号から、前記第 2区間の前記後続チャネル信号の寄与分を減じて得られる信号を、前記第 2区間の前記先行チャネル信号とする、請求項 3記載のステレオ音声復号装置。

[5] 前記モノラル信号は、前記先行チャネル信号と、前記後続チャネル信号との平均値である、

請求項 1記載のステレオ音声復号装置。

[6] 前記遅延時間差は、前記先行チャネル信号と、前記後続チャネル信号との相互相関関数の値を最大にする、

請求項 1記載のステレオ音声復号装置。

[7] 前記振幅比は、所定の区間における前記先行チャネル信号の平均振幅と、前記先行チャネル信号の平均振幅との比である、

請求項 1記載のステレオ音声復号装置。

[8] 前記先行チャネル信号復号手段および前記後続チャネル信号復号手段の誤差信号が符号化された符号化情報を復号する誤差信号復号手段と、

前記誤差信号を用いて、前記先行チャネル信号および前記後続チャネル信号を誤差補正する誤差補正手段と、

をさらに具備する請求項 1記載のステレオ音声復号装置。

[9] 前記誤差信号が符号化された符号ィ匕情報は、フレームの後尾に近いほどより多くのビット数を用いられたものである、

請求項 8記載のステレオ音声復号装置。

[10] 2つのチャネル力なるステレオ音声信号の時間的に先行する先行チャネル信号と、時間的に遅れる後続チャネル信号とを合成してモノラル信号を生成するモノラル信号生成手段と、

前記モノラル信号を符号ィヒするモノラル信号符号ィヒ手段と、

前記ステレオ音声信号の無音区間から有音区間に変わる立ち上がり位置を符号ィ匕する立ち上がり位置符号化手段と、

前記先行チャネル信号と後続チャネル信号との遅延時間差を符号ィヒする遅延時間差符号化手段と、

前記後続チャネル信号と前記先行チャネル信号との振幅比を符号化する振幅比符号化手段と、

を具備するステレオ音声符号化装置。

[11] 前記遅延時間差は、 1フレーム全般における先行チャネル信号と後続チャネル信号との遅延時間差であって、

前記 1フレームの先行チャネル信号と後続チャネル信号とを、前記 1フレーム全般における遅延時間差を長さとする複数の区間に分割し、分割された前記先行チヤネル信号と前記後続チャネル信号との前記各区間における遅延時間差を算出し、前記

1フレーム全般における遅延時間差に対する前記各区間における遅延時間差の変動量を、前記各区間における遅延時間差補正値として算出する算出手段と、前記各区間における遅延時間差補正値を符号化する遅延時間差補正値符号ィ匕手段と、

をさらに具備する請求項 10記載のステレオ音声符号ィ匕装置。

[12] 前記算出手段は、

前記 1フレーム全般における遅延時間差と、前記各区間における遅延時間差との差を、前記各区間における遅延時間差補正値として算出する

をさらに具備する請求項 11記載のステレオ音声符号ィ匕装置。

[13] 前記遅延時間差補正値符号化手段は、

フレームの後尾に近いほど、前記各区間における前記遅延時間差補正値の符号化により多くの符号ィ匕ビットを用いる、

請求項 11記載のステレオ音声符号化装置。

[14] 前記振幅比は、 1フレーム全般における先行チャネル信号と後続チャネル信号との振幅比であって、

前記 1フレームの先行チャネル信号と後続チャネル信号とを、前記 1フレームにおける遅延時間差を長さとする複数の区間に分割し、前記先行チャネル信号と前記後続チャネル信号との前記各区間における振幅比を算出し、前記 1フレーム全般における振幅比に対する前記各区間における振幅比の変動量を、前記各区間における振幅比補正値として算出する算出手段と、

前記各区間における振幅比補正値を符号化する振幅比補正値符号化手段と、をさらに具備する請求項 10記載のステレオ音声符号ィ匕装置。

[15] 前記振幅比符号化手段は、前記 1フレーム全般における振幅比と前記各区間における振幅比との比を、前記各区間における振幅比補正値として算出する

をさらに具備する請求項 14記載のステレオ音声符号ィ匕装置。

[16] 前記振幅比補正値符号化手段は、

前記各区間のうちフレームの先頭に近い区間よりも、フレームの後尾に近い区間における前記振幅比補正値の符号ィ匕により多くの符号ィ匕ビットを用いる、

請求項 14記載のステレオ音声符号化装置。

[17] 2つのチャネル力なるステレオ音声信号の時間的に先行する先行チャネル信号と、時間的に遅れる後続チャネル信号とが合成された、モノラル信号が符号化された符号化情報を復号するステップと、

前記ステレオ音声信号の無音区間から有音区間に変わる立ち上がり位置が符号ィ匕された符号化情報を復号するステップと、

前記先行チャネル信号と後続チャネル信号との遅延時間差が符号化された符号ィ匕情報を復号するステップと、

前記後続チャネル信号と前記先行チャネル信号との振幅比が符号化された符号ィ匕情報を復号するステップと、

前記モノラル信号と、前記遅延時間差と、前記立ち上がり位置とを用いて、前記先行チャネル信号を復号するステップと、

前記先行チャネル信号と、前記振幅比とを用いて、前記後続チャネル信号を復号するステップと、

を具備するステレオ音声復号方法。