WO2006118179A1

WO2006118179A1 - 音声符号化装置および音声符号化方法

Info

Publication number: WO2006118179A1
Application number: PCT/JP2006/308813
Authority: WO
Inventors: Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-04-28
Filing date: 2006-04-27
Publication date: 2006-11-09
Also published as: US20090083041A1; CN101167126B; JPWO2006118179A1; CN101167126A; EP1876586B1; EP1876586A1; DE602006011600D1; US8428956B2; RU2007139784A; EP1876586A4; JP4907522B2

Abstract

　ステレオ音声の複数チャネル間の相関が小さい場合でも効率的にステレオ音声を符号化することができる音声符号化装置。この装置において、モノラル信号生成部（１１０）は、ステレオ信号に含まれる第１チャネル信号および第２チャネル信号を用いてモノラル信号を生成する。符号化チャネル選択部（１２０）は、第１チャネル信号および第２チャネル信号の一方を選択する。モノラル信号符号化部（１１２）、第１ｃｈ符号化部（１２２）、第２ｃｈ符号化部（１２４）およびスイッチ部（１２６）を含む符号化部は、生成されたモノラル信号を符号化して、コアレイヤ符号化データを得るとともに、選択されたチャネル信号を符号化して、コアレイヤ符号化データに対応する拡張レイヤ符号化データを得る。

Description

明細書

音声符号化装置および音声符号化方法

技術分野

[0001] 本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。

背景技術

[0002] 移動体通信や IP通信での伝送帯域の広帯域化、サービスの多様化に伴 1、、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号ィ匕が必須となる。

[0003] また、 IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号ィ匕方式が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をヽぅ。スケーラブルな構成を有する音声符号化方式における符号化処理は、階層化されており、コアレイヤに対応するものと拡張レイヤに対応するものとを含む。したがって、その符号化処理によって生成される符号ィ匕データも、コアレイヤの符号ィ匕データと拡張レイヤの符号ィ匕データとを含む。

[0004] ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側にぉ、て選択可能な、モノラルーステレオ間でのスケーラブル構成 (モノラル一ステレオ'スケーラブル構成）を有する音声符号化方式が望まれる。

[0005] このような音声符号ィ匕方式に基づく音声符号ィ匕方法としては、例えば、チャネル（以下、「ch」と略記することがある）間の信号の予測 (第 lch信号から第 2ch信号の予測、または、第 2ch信号力も第 lch信号の予測）を、チャネル相互間のピッチ予測により行う、すなわち、 2チャネル間の相関を利用して符号ィ匕を行うものがある（非特許文献 1参照)。

特干文献 1 : Ramprashad, ¾.A., 'Stereophonicし £LP coding using cross channel p rediction", Proc. IEEE Workshop on Speech Coding, pp.136- 138, Sep. 2000 発明の開示

発明が解決しょうとする課題

[0006] し力しながら、上記従来の音声符号化方法では、双方のチャネル間の相関が小さ Vヽ場合、十分な予測性能 (予測ゲイン)が得られず符号化効率が劣化することがある

[0007] 本発明の目的は、双方のチャネル間の相関が小さい場合でも効率的にステレオ音声を符号ィ匕することができる音声符号ィ匕装置および音声符号ィ匕方法を提供することである。

課題を解決するための手段

[0008] 本発明の音声符号化装置は、第 1チャネル信号および第 2チャネル信号を含むステレオ信号を符号化する音声符号化装置において、前記第 1チャネル信号および前記第 2チャネル信号を用いてモノラル信号を生成するモノラル信号生成手段と、前記第 1チャネル信号および前記第 2チャネル信号の一方を選択する選択手段と、生成されたモノラル信号を符号ィ匕してコアレイヤ符号ィ匕データを得るとともに、選択されたチャネル信号を符号化して前記コアレイヤ符号化データに対応する拡張レイヤ符号化データを得る符号化手段と、を有する構成を採る。

[0009] 本発明の音声符号化方法は、第 1チャネル信号および第 2チャネル信号を含むステレオ信号を符号化する音声符号化方法において、前記第 1チャネル信号および前記第 2チャネル信号を用いてモノラル信号を生成し、前記第 1チャネル信号および前記第 2チャネル信号の一方を選択し、生成されたモノラル信号を符号ィ匕してコアレイャ符号ィ匕データを得るとともに、選択されたチャネル信号を符号ィ匕して前記コアレイャ符号化データに対応する拡張レイヤ符号化データを得るようにした。発明の効果

[0010] 本発明によれば、ステレオ信号の複数チャネル信号間の相関が小さ!/、場合でも効率的にステレオ音声を符号ィ匕することができる。

図面の簡単な説明

[0011] [図 1]本発明の実施の形態 1に係る音声符号化装置の構成を示すブロック図

[図 2]本発明の実施の形態 1に係る音声復号ィ匕装置の構成を示すブロック図

[図 3]本発明の実施の形態 2に係る音声符号ィ匕装置の構成を示すブロック図

[図 4]本発明の実施の形態 3に係る音声符号ィ匕装置の構成を示すブロック図

[図 5]本発明の実施の形態 3に係る符号ィ匕チャネル選択部の構成を示すブロック図 [図 6]本発明の実施の形態 3に係る第 Ach符号ィ匕部の構成を示すブロック図

[図 7]本発明の実施の形態 3に係る第 Aチャネルのチャネル内予測バッファの更新動作の一例を説明するための図

[図 8]本発明の実施の形態 3に係る第 Bチャネルのチャネル内予測バッファの更新動作の一例を説明するための図

[図 9]本発明の実施の形態 4に係る音声符号ィ匕装置の構成を示すブロック図

[図 10]本発明の実施の形態 4に係る第 AchCELP符号ィ匕部の構成を示すブロック図 [図 11]本発明の実施の形態 4に係る適応符号帳更新動作の一例を示すフロー図 [図 12]本発明の実施の形態 4に係る第 Ach適応符号帳の更新動作の一例を説明するための図

[図 13]本発明の実施の形態 4に係る第 Bch適応符号帳の更新動作の一例を説明するための図

発明を実施するための最良の形態

[0012] 以下、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕に関する本発明の実施の形態について、添付図面を参照して詳細に説明する。

[0013] (実施の形態 1)

図 1は、本発明の実施の形態 1に係る音声符号ィ匕装置の構成を示すブロック図である。図 1の音声符号化装置 100は、スケーラブル構成のコアレイヤに対応する構成要素であるコアレイヤ符号ィ匕部 102と、スケーラブル構成の拡張レイヤに対応する構成要素である拡張レイヤ符号ィ匕部 104と、を有する。以下、各構成要素はフレーム単位で動作することを前提として説明する。

[0014] コアレイヤ符号ィ匕部 102は、モノラル信号生成部 110およびモノラル信号符号ィ匕部 112を有する。また、拡張レイヤ符号ィ匕部 104は、符号ィ匕チャネル選択部 120、第 lc h符号化部 122、第 2ch符号ィ匕部 124およびスィッチ部 126を有する。

[0015] コアレイヤ符号ィ匕部 102において、モノラル信号生成部 110は、ステレオ入力音声信号に含まれる第 lch入力音声信号 s_chl(n)および第 2ch入力音声信号 s_ch2(n) (伹し、 n=0〜NF-l ;NFはフレーム長)から、式（1)に示す関係に基づいてモノラル信号 s_ m_ono(n)を生成し、モノラル信号符号ィ匕部 112に出力する。ここで、本実施の形態で説明するステレオ信号は、 2つのチャネルの信号、すなわち第 1チャネルの信号および第 2チャネルの信号力成る。

[数 1]

, 、 s ch\(ri) + s chliri) , 、

s monoi n) =— = = … 1

[0016] モノラル信号符号ィ匕部 112は、モノラル信号 s_mono(n)をフレーム毎に符号ィ匕する。

符号化には任意の符号ィ匕方式が用、られて良、。モノラル信号 s_m_ono(n)の符号ィ匕によって得られた符号ィ匕データは、コアレイヤ符号化データとして出力される。より具体的には、コアレイヤ符号ィ匕データは、後述の拡張レイヤ符号化データおよび符号化チャネル選択情報と多重され、送信符号ィ匕データとして音声符号ィ匕装置 100から出力される。

[0017] また、モノラル信号符号ィ匕部 112は、モノラル信号 s_mono(n)を復号し、それによつて得られるモノラル復号音声信号を拡張レイヤ符号ィ匕部 104の第 lch符号ィ匕部 122 および第 2ch符号ィ匕部 124に出力する。

[0018] 拡張レイヤ符号ィ匕部 104において、符号ィ匕チャネル選択部 120は、第 lch入力音声信号 s_chl(n)および第 2ch入力音声信号 s_ch2(n)を用いて、第 1チャネルおよび第 2チャネルのうち、拡張レイヤでの符号化の対象のチャネルとして最適なチャネルを、所定の選択基準に基づき選択する。最適なチャネルは、フレーム毎に選択される。ここで、所定の選択基準は、拡張レイヤ符号ィ匕を高効率にまたは高音質 (低符号ィ匕歪み）に実現できるための基準である。符号ィ匕チャネル選択部 120は、選択されたチヤネルを示す符号化チャネル選択情報を生成する。生成された符号化チャネル選択情報は、スィッチ部 126に出力されるとともに、前述のコアレイヤ符号ィ匕データおよび後述の拡張レイヤ符号ィ匕データと多重される。

[0019] なお、符号ィ匕チャネル選択部 120は、第 1入力音声信号 s_chl(n)および第 2入力音声信号 s_ch2(n)を用ヽる代わりに、第 lch符号化部 122および第 2ch符号化部 124 での符号ィ匕の過程で得られる任意のパラメータまたは信号もしくは符号ィ匕の結果 (すなわち、後述の第 lch符号ィ匕データおよび第 2ch符号ィ匕データ)を用いても良い。

[0020] 第 lch符号化部 122は、第 lch入力音声信号およびモノラル復号音声信号を用いて第 lch入力音声信号をフレーム毎に符号ィ匕し、それによつて得られた第 lch符号化データをスィッチ部 126に出力する。

[0021] また、第 lch符号化部 122は、第 lch符号化データを復号して、第 lch復号音声信号を得る。但し、本実施の形態では、第 lch符号ィ匕部 122で得られる第 lch復号音声信号は、図示を省略する。

[0022] 第 2ch符号化部 124は、第 2ch入力音声信号およびモノラル復号音声信号を用いて第 2ch入力音声信号をフレーム毎に符号ィ匕し、それによつて得られた第 2ch符号化データをスィッチ部 126に出力する。

[0023] また、第 2ch符号化部 124は、第 2ch符号化データを復号して、第 2ch復号音声信号を得る。但し、本実施の形態では、第 2ch符号ィ匕部 124で得られる第 2ch復号音声信号は、図示を省略する。

[0024] スィッチ部 126は、符号ィ匕チャネル選択情報に従って、第 lch符号ィ匕データおよび第 2ch符号ィ匕データのうちいずれか一方をフレーム毎に選択的に出力する。出力される符号化データは、符号化チャネル選択部 120によって選択されたチャネルの符号ィ匕データである。よって、選択されたチャネルが、第 1チャネル力も第 2チャネルに、あるいは、第 2チャネル力も第 1チャネルに切り替わったとき、スィッチ部 126から出力される符号化データも、第 lch符号ィ匕データ力ゝら第 2ch符号ィ匕データに、あるいは、第 2ch符号ィ匕データ力第 lch符号ィ匕データに切り替わる。

[0025] ここで、前述したモノラル信号符号化部 112、第 lch符号化部 122、第 2ch符号ィ匕部 124およびスィッチ部 126の組み合わせは、モノラル信号を符号ィ匕してコアレイヤ符号ィ匕データを得るとともに、選択されたチャネル信号を符号ィ匕してコアレイヤ符号化データに対応する拡張レイヤ符号化データを得る、符号化部を構成する。

[0026] 図 2は、音声符号化装置 100から出力された送信符号化データを受信符号化データとして受信し復号してモノラル復号音声信号およびステレオ復号音声信号を得ることができる音声復号化装置の構成を示すブロック図である。図 2の音声復号化装置 1 50は、スケーラブル構成のコアレイヤに対応する構成要素であるコアレイヤ復号部 1 52と、スケーラブル構成の拡張レイヤに対応する構成要素である拡張レイヤ復号部 154と、を有する。

[0027] コアレイヤ復号部 152は、モノラル信号復号部 160を有する。モノラル信号復号部 1 60は、受信した受信符号化データに含まれるコアレイヤ符号化データを復号して、モノラル復号音声信号 sd_m_ono(n)を得る。モノラル復号音声信号 sd_m_ono(n)は、後段の音声出力部（図示せず)、第 lch復号部 172、第 2ch復号部 174、第 lch復号信号生成部 176および第 2ch復号信号生成部 178に出力される。

[0028] 拡張レイヤ復号部 154は、スィッチ部 170、第 lch復号部 172、第 2ch復号部 174 、第 lch復号信号生成部 176、第 2ch復号信号生成部 178およびスィッチ部 180、 1 82を有する。

[0029] スィッチ部 170は、受信符号ィ匕データに含まれる符号ィ匕チャネル選択情報を参照し、受信符号化データに含まれる拡張レイヤ符号化データを、選択されたチャネルに対応する復号部に出力する。具体的には、選択されたチャネルが第 1チャネルの場合は、拡張レイヤ符号ィ匕データは第 lch復号部 172に出力され、選択されたチヤネルが第 2チャネルの場合は、拡張レイヤ符号ィ匕データは第 2ch復号部 174に出力される。

[0030] 第 lch復号部 172は、スィッチ部 170から拡張レイヤ符号ィ匕データが入力されたとき、その拡張レイヤ符号ィ匕データおよびモノラル復号音声信号 sd_m_ono(n)を用いて第 lch復号音声信号 _Sd_chl(n)を復号し、第 lch復号音声信号 _Sd_chl(n)をスィッチ部 180および第 2ch復号信号生成部 178に出力する。

[0031] 第 2ch復号部 174は、スィッチ部 170から拡張レイヤ符号ィ匕データが入力されたとき、その拡張レイヤ符号ィ匕データおよびモノラル復号音声信号 sd_m_ono(n)を用いて第 2ch復号音声信号 sd— ch2(n)を復号し、第 2ch復号音声信号 sd— ch2(n)をスィッチ部 182および第 1 ch復号信号生成部 176に出力する。

[0032] 第 lch復号信号生成部 176は、第 2ch復号部 174から第 2ch復号音声信号 sd— ch2 (n)が入力されたとき、第 2ch復号部 174から入力された第 2ch復号音声信号 sd_ch2( n)およびモノラル復号音声信号 sd_mono(n)を用いて、次の式（2)に示す関係に基づいて、第 lch復号音声信号 _Sd_chl(n)を生成する。生成された第 lch復号音声信号 sd _chl(n)はスィッチ部 180に出力される。

[数 2] sd ch\(n) = 2 x sd monoin) - sd _ chlin ) ·· · ( 2 )

[0033] 第 2ch復号信号生成部 178は、第 lch復号部 172から第 lch復号音声信号 sd—chl (n)が入力されたとき、第 lch復号部 172から入力された第 lch復号音声信号 sd_chl( n)およびモノラル復号音声信号 sd_mono(n)を用いて、次の式（3)に示す関係に基づいて、第 2ch復号音声信号 _Sd_ch2(n)を生成する。生成された第 2ch復号音声信号 sd _ch2(n)はスィッチ部 182に出力される。

[数 3] sd chliri) = 2 sd _ monoin) - sd _ ch\{n) ·· · ( 3；

[0034] スィッチ部 180は、符号ィ匕チャネル選択情報に従って、第 lch復号部 172から入力された第 lch復号音声信号 _Sd_chl(n)および第 lch復号信号生成部 176から入力された第 lch復号音声信号 _Sd_chl(n)のいずれか一方を選択的に出力する。具体的には、選択されたチャネルが第 1チャネルの場合は、第 lch復号部 172から入力された第 lch復号音声信号 _Sd_chl(n)が選択され出力される。一方、選択されたチャネルが第 2チャネルの場合は、第 lch復号信号生成部 176から入力された第 lch復号音声信号 _Sd_chl(n)が選択され出力される。

[0035] スィッチ部 182は、符号ィ匕チャネル選択情報に従って、第 2ch復号部 174から入力された第 2ch復号音声信号 _Sd_ch2(n)および第 2ch復号信号生成部 178から入力された第 2ch復号音声信号 _Sd_ch2(n)のいずれか一方を選択的に出力する。具体的には、選択されたチャネルが第 1チャネルの場合は、第 2ch復号信号生成部 178から入力された第 2ch復号音声信号 _Sd_ch2(n)が選択され出力される。一方、選択されたチャネルが第 2チャネルの場合は、第 2ch復号部 174から入力された第 2ch復号音声信号 _Sd_ch2(n)が選択され出力される。

[0036] スィッチ部 180から出力される第 lch復号音声信号 sd_chl(n)およびスィッチ部 182 から出力される第 2ch復号音声信号 _Sd_ch2(n)は、ステレオ復号音声信号として後段の音声出力部（図示せず）に出力される。

[0037] このように、本実施の形態によれば、第 lch入力音声信号 s_chl(n)および第 2ch入力音声信号 s_ch2(n)から生成されたモノラル信号 s_m_ono(n)を符号ィ匕してコアレイヤ符号ィ匕データを得るとともに、第 1チャネルおよび第 2チャネルのうち選択されたチヤネルの入力音声信号 (第 lch入力音声信号 s_chl(n)または第 2ch入力音声信号 s_ch2(n ))を符号ィ匕して拡張レイヤ符号ィ匕データを得るため、ステレオ信号の複数チャネル間の相関が小さい場合に予測性能 (予測ゲイン)が不十分になることを回避することができ、効率的にステレオ音声を符号ィ匕することができる。

[0038] (実施の形態 2)

図 3は、本発明の実施の形態 2に係る音声符号ィ匕装置の構成を示すブロック図である。

[0039] なお、図 3の音声符号化装置 200は、実施の形態 1で説明した音声符号化装置 10 0と同様の基本的構成を有する。よって、本実施の形態で説明する構成要素のうち実施の形態 1で説明したものと同様のものには、実施の形態 1で用いたものと同一の参照符号を付し、その構成要素についての詳細な説明を省略する。

[0040] また、音声符号ィ匕装置 200から出力される送信符号ィ匕データは、実施の形態 1で説明した音声復号ィ匕装置 150と同様の基本的構成を有する音声復号ィ匕装置において復号することができる。

[0041] 音声符号化装置 200は、コアレイヤ符号ィ匕部 102および拡張レイヤ符号ィ匕部 202 を有する。拡張レイヤ符号ィ匕部 202は、第 lch符号ィ匕部 122、第 2ch符号ィ匕部 124、スィッチ部 126および符号ィ匕チャネル選択部 210を有する。

[0042] 符号化チャネル選択部 210は、第 2ch復号音声生成部 212、第 lch復号音声生成部 214、第 1歪み算出部 216、第 2歪み算出部 218および符号ィ匕チャネル決定部 22 0を有する。

[0043] 第 2ch復号音声生成部 212は、モノラル信号符号ィ匕部 112によって得られたモノラル復号音声信号および第 lch符号ィ匕部 122によって得られた第 lch復号音声信号を用いて、前述の式（1)に示す関係に基づいて、第 2ch推定信号としての第 2ch復号音声信号を生成する。生成された第 2ch復号音声信号は、第 1歪み算出部 216に出力される。

[0044] 第 lch復号音声生成部 214は、モノラル信号符号ィ匕部 112によって得られたモノラル復号音声信号および第 2ch符号ィ匕部 124によって得られた第 2ch復号音声信号を用いて、前述の式（1)に示す関係に基づいて、第 lch推定信号としての第 lch復号音声信号を生成する。生成された第 lch復号音声信号は、第 2歪み算出部 218に出力される。

[0045] 前述した第 2ch復号音声生成部 212および第 lch復号音声生成部 214の組み合わせは、推定信号生成部を構成する。

[0046] 第 1歪み算出部 216は、第 lch符号ィ匕部 122によって得られた第 lch復号音声信号および第 2ch復号音声生成部 212によって得られた第 2ch復号音声信号を用いて、第 1符号ィ匕歪みを算出する。第 1符号化歪みは、拡張レイヤでの符号化の対象チャネルとして第 1チャネルを選択した場合に生じる 2チャネル分の符号ィ匕歪みに相当する。算出された第 1符号ィ匕歪みは、符号ィ匕チャネル決定部 220に出力される。

[0047] 第 2歪み算出部 218は、第 2ch符号ィ匕部 124によって得られた第 2ch復号音声信号および第 lch復号音声生成部 214によって得られた第 lch復号音声信号を用いて、第 2符号ィ匕歪みを算出する。第 2符号化歪みは、拡張レイヤでの符号化の対象チャネルとして第 2チャネルを選択した場合に生じる 2チャネル分の符号ィ匕歪みに相当する。算出された第 2符号ィ匕歪みは、符号ィ匕チャネル決定部 220に出力される。

[0048] ここで、 2チャネル分の符号ィ匕歪み (第 1符号ィ匕歪みまたは第 2符号ィ匕歪み）の算出方法としては、例えば次の 2つの方法が挙げられる。 1つは、各チャネルの復号音声信号 (第 lch復号音声信号または第 2ch復号音声信号)の、対応する入力音声信号 (第 lch入力音声信号または第 2ch入力音声信号)に対する誤差パワーの比 (信号対符号化歪み比）の 2チャネル分の平均を、 2チャネル分の符号ィ匕歪みとして求める方法である。もう 1つは、前述した誤差パワーの 2チャネル分の総和を、 2チャネル分の符号ィ匕歪みとして求める方法である。

[0049] 前述した第 1歪み算出部 216および第 2歪み算出部 218の組み合わせは、歪み算出部を構成する。また、この歪み算出部および前述した推定信号生成部の組み合わせは算出部を構成する。

[0050] 符号化チャネル決定部 220は、第 1符号化歪みの値および第 2符号化歪みの値を相互比較し、第 1符号化歪みおよび第 2符号化歪みのうち、より小さい値を有するものを選択する。符号化チャネル決定部 220は、選択された符号化歪みに対応するチャネルを、拡張レイヤでの符号ィ匕の対象チャネル (符号ィ匕チャネル）として選択し、選択されたチャネルを示す符号化チャネル選択情報を生成する。より具体的には、符号ィ匕チャネル決定部 220は、第 1符号ィ匕歪みが第 2符号ィ匕歪みよりも小さい場合、第 1チャネルを選択し、第 2符号ィ匕歪みが第 1符号ィ匕歪みよりも小さい場合、第 2チヤネルを選択する。生成された符号ィ匕チャネル選択情報は、スィッチ部 126に出力されるとともに、コアレイヤ符号ィ匕データおよび拡張レイヤ符号ィ匕データと多重される。

[0051] このように、本実施の形態によれば、符号化チャネルの選択基準として、符号化歪みの大きさを使用するため、拡張レイヤの符号ィ匕歪みを低減することができ、効率的にステレオ音声を符号ィ匕することができる。

[0052] なお、本実施の形態では、対応する入力音声信号に対する各チャネルの復号音声信号の誤差パワーの比または総和を算出し、この算出結果を符号ィ匕歪みとして用いているが、その代わりに、第 lch符号ィ匕部 122および第 2ch符号ィ匕部 124での符号化の過程で得られる符号ィ匕歪みを用いても良い。また、この符号化歪みは、聴覚重み付きの歪みであっても良い。

[0053] (実施の形態 3)

図 4は、本発明の実施の形態 3に係る音声符号ィ匕装置の構成を示すブロック図である。なお、図 4の音声符号化装置 300は、前述した実施の形態で説明した音声符号化装置 100、 200と同様の基本的構成を有する。よって、本実施の形態で説明する構成要素のうち前述の実施の形態で説明したものと同様のものについては、前述の実施の形態で用いたものと同一の参照符号を付し、その詳細な説明を省略する。

[0054] また、音声符号ィ匕装置 300から出力される送信符号ィ匕データは、実施の形態 1で説明した音声復号ィ匕装置 150と同様の基本的構成を有する音声復号ィ匕装置において復号することができる。

[0055] 音声符号化装置 300は、コアレイヤ符号ィ匕部 102および拡張レイヤ符号ィ匕部 302 を有する。拡張レイヤ符号化部 302は、符号化チャネル選択部 310、第 lch符号ィ匕部 312、第 2ch符号ィ匕部 314およびスィッチ部 126を有する。

[0056] 符号ィ匕チャネル選択部 310は、図 5に示すように、第 lchチャネル内相関度算出部

320、第 2chチャネル内相関度算出部 322および符号ィ匕チャネル決定部 324を有する。

[0057] 第 lchチャネル内相関度算出部 320は、第 lch入力音声信号に対する正規化最大自己相関係数値を用いて、第 1チャネルのチャネル内相関度 corlを算出する。

[0058] 第 2chチャネル内相関度算出部 322は、第 2ch入力音声信号に対する正規化最大自己相関係数値を用いて、第 2チャネルのチャネル内相関度 cor2を算出する。

[0059] なお、各チャネルのチャネル内相関度の算出には、各チャネルの入力音声信号に対する正規化最大自己相関係数値を用いる代わりに、各チャネルの入力音声信号に対するピッチ予測ゲイン値を用いたり、 LPC (Linear Prediction Coding)予測残差信号に対する正規ィ匕最大自己相関係数値およびピッチ予測ゲイン値を用いたりすることができる。

[0060] 符号ィ匕チャネル決定部 324は、チャネル内相関度 corl、 cor2を相互比較し、これらのうち、より高い値を有するものを選択する。符号ィ匕チャネル決定部 324は、選択されたチャネル内相関度に対応するチャネルを、拡張レイヤでの符号ィ匕チャネルとして選択し、選択されたチャネルを示す符号化チャネル選択情報を生成する。より具体的には、符号ィ匕チャネル決定部 324は、チャネル内相関度 corlがチャネル内相関度 cor2よりも高い場合、第 1チャネルを選択し、チャネル内相関度 cor2がチャネル内相関度 corはりも高い場合、第 2チャネルを選択する。生成された符号化チャネル選択情報は、スィッチ部 126に出力されるとともに、コアレイヤ符号ィ匕データおよび拡張レィャ符号ィ匕データと多重される。

[0061] 第 lch符号ィ匕部 312および第 2ch符号ィ匕部 314は、互いに同様の内部構成を有する。よって、説明の簡略化のために、第 lch符号ィ匕部 312および第 2ch符号ィ匕部 3 14のうちいずれか一方を「第 Ach符号ィ匕部 330」として示し、その内部構成について図 6を用いて説明する。なお、「Ach」の「A」は 1または 2を表す。また、図中においておよび以下の説明において用いられる「B」も 1または 2を表す。但し、「A」が 1の場合「B」は 2であり、「A」が 2の場合「B」は 1である。

[0062] 第 Ach符号ィ匕部 330は、スィッチ部 332、第 Ach信号チャネル内予測部 334、減算器 336、 338、第 Ach予測残差信号符号ィ匕部 340および第 Bch推定信号生成部 342を有する。

[0063] スィッチ部 332は、第 Ach予測残差信号符号化部 340によって得られた第 Ach復号音声信号、または、第 Bch符号化部（図示せず）によって得られた第 Ach推定信号を、符号ィ匕チャネル選択情報に従って第 Ach信号チャネル内予測部 334に出力する。具体的には、選択されたチャネルが第 Aチャネルの場合は、第 Ach復号音声信号が第 Ach信号チャネル内予測部 334に出力され、選択されたチャネルが第 Bチャネルの場合は、第 Ach推定信号が第 Ach信号チャネル内予測部 334に出力される。

[0064] 第 Ach信号チャネル内予測部 334は、第 Aチャネルのチャネル内予測を行う。チヤネル内予測は、チャネル内の信号の相関性を利用して過去のフレームの信号力現在のフレームの信号を予測するものである。チャネル内予測の結果として、チャネル内予測信号 Sp(n)およびチャネル内予測パラメータ量子化符号が得られる。例えば 1 次のピッチ予測フィルタを用いる場合、チャネル内予測信号 Sp(n)は、次の式 (4)によつて算出される。

画

Sp(n) = gp Sin(n - T) … （4 ) ここで、 Sin(n)はピッチ予測フィルタへの入力信号、 Tはピッチ予測フィルタのラグ、 g pはピッチ予測フィルタのピッチ予測係数である。

[0065] 前述した過去のフレームの信号は、第 Ach信号チャネル内予測部 334の内部に設けられたチャネル内予測バッファ（第 Achチャネル内予測バッファ）に保持される。また、第 Achチャネル内予測バッファは、次フレームの信号の予測のために、スィッチ部 332から入力された信号で更新される。チャネル内予測バッファの更新の詳細については後述する。

[0066] 減算器 336は、第 Ach入力音声信号からモノラル復号音声信号を減算する。減算器 338は、減算器 336での減算によって得られた信号から、第 Ach信号チャネル内予測部 334でのチャネル内予測によって得られたチャネル内予測信号 Sp(n)を減算する。減算器 338での減算によって得られた信号、すなわち第 Ach予測残差信号は、第 Ach予測残差信号符号ィ匕部 340に出力される。

[0067] 第 Ach予測残差信号符号ィ匕部 340は、第 Ach予測残差信号を任意の符号ィ匕方式で符号化する。この符号ィ匕によって、予測残差符号化データおよび第 Ach復号音声信号が得られる。予測残差符号ィ匕データは、チャネル内予測パラメータ量子化符号とともに、第 Ach符号ィ匕データとして出力される。第 Ach復号音声信号は、第 Bch推定信号生成部 342およびスィッチ部 332に出力される。

[0068] 第 Bch推定信号生成部 342は、第 Ach復号音声信号およびモノラル復号音声信号から、第 Aチャネル符号ィ匕時の第 Bch復号音声信号として第 Bch推定信号を生成する。生成された第 Bch推定信号は、図示されない第 Bch符号ィ匕部のスィッチ部 (スイッチ部 332と同様）に出力される。

[0069] 次、で、チャネル内予測バッファの更新動作にっ、て説明する。ここでは、符号ィ匕チャネル選択部 310によって第 Aチャネルが選択された場合を例にとり、第 Aチヤネルのチャネル内予測バッファの更新動作例を図 7を用いて説明し、第 Bチャネルのチャネル内予測バッファの更新動作例を図 8を用いて説明する。

[0070] 図 7に示す動作例では、第 Ach予測残差信号符号ィ匕部 340によって得られた、第 i フレーム (iは任意の自然数)の第 Ach復号音声信号を用いて、第 Ach信号チャネル内予測部 334の内部の第 Achチャネル内予測バッファ 351が更新される（ST101)。そして、更新された第 Achチャネル内予測バッファ 351は、次フレームである第 i+ 1 フレームにつ、てのチャネル内予測に用いられる（ST102)。

[0071] 図 8に示す動作例では、第 iフレームの第 Ach復号音声信号および第 iフレームのモノラル復号音声信号を用いて、第 iフレームの第 Bch推定信号が生成される (ST2 01)。生成された第 Bch推定信号は、第 Ach符号ィ匕部 330から図示されない第 Bch 符号ィ匕部に出力される。そして、第 Bch符号ィ匕部において、第 Bch推定信号は、スィツチ部 (スィッチ部 332と同様)を経由して第 Bch信号チャネル内予測部（第 Ach信号チャネル内予測部 334と同様）に出力される。第 Bch信号チャネル内予測部の内部に設けられた第 Bchチャネル内予測バッファ 352は、第 Bch推定信号によって更新される（ST202)。そして、更新された第 Bchチャネル内予測バッファ 352は、第 i + 1フレームにつ、てのチャネル内予測に用いられる（ST203)。

[0072] あるフレームにお、て、第 Aチャネルが符号ィ匕チャネルとして選択された場合、第 B ch符号ィ匕部では、第 Bchチャネル内予測バッファ 352の更新動作以外の動作は要求されないため、そのフレームにおいては第 Bch入力音声信号の符号ィ匕を休止することができる。

[0073] このように、本実施の形態によれば、符号化チャネルの選択基準として、チャネル内相関度の高さを使用するため、チャネル内相関度が高いチャネルの信号を符号ィ匕することができ、チャネル内予測による符号ィ匕効率を向上させることができる。

[0074] なお、音声符号ィ匕装置 300の構成に、チャネル間予測を実行する構成要素を加えることもできる。この場合、音声符号化装置 300は、モノラル復号音声信号を減算器 3 36に入力する代わりに、モノラル復号音声信号を用いて第 Ach音声信号を予測するチャネル間予測を行、、それによつて生成されたチャネル間予測信号を減算器 336 に入力する構成を、採用することができる。

[0075] (実施の形態 4)

図 9は、本発明の実施の形態 4に係る音声符号ィ匕装置の構成を示すブロック図である。

[0076] なお、図 9の音声符号化装置 400は、前述の実施の形態で説明した音声符号化装置 100、 200、 300と同様の基本的構成を有する。よって、本実施の形態で説明する構成要素のうち前述の実施の形態で説明したものと同様のものについては、前述の実施の形態で用いたものと同一の参照符号を付し、その詳細な説明を省略する。

[0077] また、音声符号化装置 400から出力される送信符号化データは、実施の形態 1で説明した音声復号ィ匕装置 150と同様の基本的構成を有する音声復号ィ匕装置において復号することができる。

[0078] 音声符号化装置 400は、コアレイヤ符号ィ匕部 402および拡張レイヤ符号ィ匕部 404 を有する。コアレイヤ符号ィ匕部 402は、モノラル信号生成部 110およびモノラル信号 CELP (Code Excited Linear Prediction)符号化部 410を有する。拡張レイヤ符号ィ匕部 404は、符号化チャネル選択部 310、第 IchCELP符号ィ匕部 422、第 2chCELP 符号ィ匕部 424およびスィッチ部 126を有する。

[0079] コアレイヤ符号ィ匕部 402にお、て、モノラル信号 CELP符号ィ匕部 410は、モノラル信号生成部 110によって生成されたモノラル信号に対して CELP符号ィ匕を行う。この符号化によって得られた符号化データは、コアレイヤ符号化データとして出力される。また、この符号ィ匕によって、モノラル駆動音源信号が得られる。さらに、モノラル信号 CELP符号ィ匕部 410は、モノラル信号を復号し、それによつて得られるモノラル復号音声信号を出力する。コアレイヤ符号化データは、拡張レイヤ符号ィヒデータおよび符号ィ匕チャネル選択情報と多重される。また、コアレイヤ符号化データ、モノラル駆動音源信号およびモノラル復号音声信号は、第 IchCELP符号ィ匕部 422および第 2chCELP符号ィ匕部 424に出力される。

[0080] 拡張レイヤ符号ィ匕部 404において、第 IchCELP符号ィ匕部 422および第 2chCEL P符号ィ匕部 424は、互いに同様の内部構成を有する。よって、説明の簡略化のために、第 IchCELP符号化部 422および第 2chCELP符号化部 424のうち!/、ずれか一方を「第 AchCELP符号ィ匕部 430」として示し、その内部構成について図 10を用いて説明する。なお、前述したように、「Ach」の「A」は 1または 2を表し、図中においておよび以下の説明にお、て用いられる「B」も 1または 2を表し、「A」が 1の場合「B」は 2 であり、「A」が 2の場合「B」は 1である。

[0081] 第 AchCELP符号化部 430は、第 AchLPC (Linear Prediction Coding)分析部 43 1、乗算器 432、 433, 434, 435, 436,スィッチ部 437、第 Ach適応符号帳 438、第 Ach固定符号帳 439、加算器 440、合成フィルタ 441、聴覚重み付け部 442、歪最小化部 443、第 Ach復号部 444、第 Bch推定信号生成部 445、第 AchLPC分析部 446、第 AchLPC予測残差信号生成部 447および減算器 448を有する。

[0082] 第 AchCELP符号ィ匕部 430において、第 AchLPC分析部 431は、第 Ach入力音声信号に対する LPC分析を行ヽ、それによつて得られた第 AchLPCパラメータを量子化する。第 AchLPC分析部 431は、第 AchLPCパラメータとモノラル信号に対する LPCパラメータとの相関が一般に高いことを利用して、 LPCパラメータの量子化に際して、コアレイヤ符号ィ匕データ力もモノラル信号量子化 LPCパラメータを復号し、復号されたモノラル信号量子化 LPCパラメータに対する第 AchLPCパラメータの差分成分を量子化して、第 AchLPC量子化符号を得る。第 AchLPC量子化符号は、合成フィルタ 441に出力される。また、第 AchLPC量子化符号は、後述の第 Ach駆動音源符号ィ匕データとともに第 Ach符号ィ匕データとして出力される。差分成分の量子化を行うことにより、拡張レイヤの LPCパラメータの量子化を効率ィ匕することができる。

[0083] 第 AchCELP符号ィ匕部 430にお、て、第 Ach駆動音源符号ィ匕データは、第 Ach 駆動音源信号のモノラル駆動音源信号に対する残差成分を符号化することによって得られる。この符号ィ匕は、 CELP符号ィ匕における音源探索によって実現される。

[0084] つまり、第 AchCELP符号化部 430では、適応音源信号、固定音源信号およびモノラル駆動音源信号に、それぞれに対応するゲインが乗じられ、ゲイン乗算後のこれらの音源信号が加算され、その加算によって得られた駆動音源信号に対して、歪み最小化による閉ループ型音源探索 (適応符号帳探索、固定符号帳探索およびゲイン探索）が行われる。そして、適応符号帳インデクス (適応音源インデタス）、固定符号帳インデクス（固定音源インデタス)ならびに適応音源信号、固定音源信号およびモノラル駆動音源信号に対するゲイン符号が、第 Ach駆動音源符号ィ匕データとして出力される。コアレイヤの符号化、拡張レイヤの符号ィ匕および符号ィ匕チャネルの選択力 Sフレーム毎に行われるのに対し、この音源探索は、フレームを複数の部分に分割することによって得られるサブフレーム毎に行われる。以下、この構成についてより具体的に説明する。

[0085] 合成フィルタ 441は、第 AchLPC分析部 431から出力された第 AchLPC量子化符号を用いて、加算器 440から出力された信号を駆動音源として LPC合成フィルタによる合成を行う。この合成によって得られた合成信号は、減算器 448に出力される。

[0086] 減算器 448は、第 Ach入力音声信号カゝら合成信号を減算することにより誤差信号を算出する。誤差信号は、聴覚重み付け部 442に出力される。誤差信号は、符号ィ匕歪みに相当する。

[0087] 聴覚重み付け部 442は、符号化歪み (つまり、前述の誤差信号）に対して聴覚的な重み付けを行い、重み付け後の符号ィ匕歪みを歪最小化部 443に出力する。

[0088] 歪最小化部 443は、符号化歪みを最小とするような適応符号帳インデクスおよび固定符号帳インデクスを決定し、適応符号帳インデクスを第 Ach適応符号帳 438に、固定符号帳インデクスを第 Ach固定符号帳 439に、それぞれ出力する。また、歪最小化部 443は、それらのインデタスに対応するゲイン、具体的には、後述する適応べタトルおよび後述する固定ベクトルの各々に対するゲイン (適応符号帳ゲインおよび固定符号帳ゲイン)を生成し、適応符号帳ゲインを乗算器 433に、固定符号帳ゲインを乗算器 435に、それぞれ出力する。

[0089] また、歪最小化部 443は、モノラル駆動音源信号、ゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトルの間でゲインを調整するためのゲイン (第 1調整用ゲイン、第 2調整用ゲインおよび第 3調整用ゲイン)を生成し、第 1調整用ゲインを乗算器 432に、第 2調整用ゲインを乗算器 434に、第 3調整用ゲインを乗算器 436に、それぞれ出力する。これらの調整用ゲインは、好ましくは、相互に関係性を持つように生成される。例えば、第 lch入力音声信号と第 2ch入力音声信号との間のチヤネル間相関が高い場合は、モノラル駆動音源信号の寄与分が、ゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトルの寄与分に対して相対的に大きくなるように、 3つの調整用ゲインが生成される。逆に、チャネル間相関が低い場合は、モノラル駆動音源信号の寄与分がゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトルの寄与分に対して相対的に小さくなるように、 3つの調整用ゲインが生成される。

[0090] また、歪最小化部 443は、適応符号帳インデタス、固定符号帳インデタス、適応符号帳ゲインの符号、固定符号帳ゲインの符号および 3つのゲイン調整用ゲインの符号を、第 Ach駆動音源符号ィ匕データとして出力する。

[0091] 第 Ach適応符号帳 438は、過去に生成された合成フィルタ 441への駆動音源の音源ベクトルを内部バッファに記憶している。また、第 Ach適応符号帳 438は、記憶されている音源ベクトルから 1サブフレーム分のベクトルを適応ベクトルとして生成する。適応ベクトルの生成は、歪最小化部 443から入力された適応符号帳インデタスに対応する適応符号帳ラグ (ピッチラグまたはピッチ周期）に基づいて行われる。生成された適応ベクトルは、乗算器 433に出力される。

[0092] 第 Ach適応符号帳 438の内部バッファは、スィッチ部 437から出力された信号によつて更新される。この更新動作の詳細については後述する。

[0093] 第 Ach固定符号帳 439は、歪最小化部 443から出力された固定符号帳インデクスに対応する音源ベクトルを、固定ベクトルとして乗算器 435に出力する。

[0094] 乗算器 433は、第 Ach適応符号帳 438から出力された適応ベクトルに適応符号帳ゲインを乗じ、ゲイン乗算後の適応ベクトルを乗算器 434に出力する。

[0095] 乗算器 435は、第 Ach固定符号帳 439から出力された固定ベクトルに固定符号帳ゲインを乗じ、ゲイン乗算後の固定ベクトルを乗算器 436に出力する。

[0096] 乗算器 432は、モノラル駆動音源信号に第 1調整用ゲインを乗じ、ゲイン乗算後のモノラル駆動音源信号を加算器 440に出力する。乗算器 434は、乗算器 433から出力された適応ベクトルに第 2調整用ゲインを乗じ、ゲイン乗算後の適応ベクトルを加算器 440に出力する。乗算器 436は、乗算器 435から出力された固定ベクトルに第 3 調整用ゲインを乗じ、ゲイン乗算後の固定ベクトルを加算器 440に出力する。

[0097] 加算器 440は、乗算器 432から出力されたモノラル駆動音源信号と、乗算器 434から出力された適応ベクトルと、乗算器 436から出力された固定ベクトルと、を加算し、加算後の信号をスィッチ部 437および合成フィルタ 441に出力する。

[0098] スィッチ部 437は、加算器 440から出力された信号または第 AchLPC予測残差信号生成部 447から出力された信号を、符号ィ匕チャネル選択情報に従って第 Ach適応符号帳 438に出力する。より具体的には、選択されたチャネルが第 Aチャネルの場合は、加算器 440からの信号が第 Ach適応符号帳 438に出力され、選択されたチヤネルが第 Bチャネルの場合は、第 AchLPC予測残差信号生成部 447からの信号が第 Ach適応符号帳 438に出力される。

[0099] 第 Ach復号部 444は、第 Ach符号化データを復号し、それによつて得られた第 Ac h復号音声信号を第 Bch推定信号生成部 445に出力する。

[0100] 第 Bch推定信号生成部 445は、第 Ach復号音声信号およびモノラル復号音声信号を用いて、第 Ach符号化時の第 Bch復号音声信号として第 Bch推定信号を生成する。生成された第 Bch推定信号は、第 BchCELP符号化部（図示せず）に出力される。

[0101] 第 AchLPC分析部 446は、図示されない第 BchCELP符号ィ匕部から出力された第 Ach推定信号に対して LPC分析を行、、それによつて得られた第 AchLPCパラメ一タを、第 AchLPC予測残差信号生成部 447に出力する。ここで、第 BchCELP符号化部から出力された第 Ach推定信号は、第 BchCELP符号ィ匕部において第 Bch入力音声信号が符号化されたとき (第 Bch符号ィ匕時)に生成された第 Ach復号音声信号に相当する。

[0102] 第 AchLPC予測残差信号生成部 447は、第 AchLPC分析部 446から出力された第 AchLPCパラメータを用いて、第 Ach推定信号に対する符号化 LPC予測残差信号を生成する。生成された符号化 LPC予測残差信号は、スィッチ部 437に出力される。

[0103] 次いで、第 AchCELP符号化部 430および図示されない第 BchCELP符号化部での適応符号帳更新動作について説明する。図 11は、符号ィ匕チャネル選択部 310によって第 Aチャネルが選択された場合の、適応符号帳更新動作を示すフロー図である。

[0104] ここに例示されたフローは、第 AchCELP符号化部 430での CELP符号化処理（S T310)、第 AchCELP符号ィ匕部 430内の適応符号帳の更新処理（ST320)および第 BchCELP符号ィ匕部内の適応符号帳の更新処理 (ST330)に分けられる。また、ステップ ST310iま、 2つのステップ ST311、 ST312を含み、ステップ ST330iま、 4つのステップ ST331、 ST332, ST333, ST334を含む。

[0105] まず、ステップ ST311では、第 AchCELP符号化部 430の第 AchLPC分析部 431 によって、 LPC分析および量子化が行われる。そして、第 Ach適応符号帳 438、第 A ch固定符号帳 439、乗算器 432、 433、 434、 435、 436、カロ算器 440、合成フィルタ 441、減算器 448、聴覚重み付け部 442および歪最小化部 443を主に含む閉ループ型音源探索部によって、音源探索 (適応符号帳探索、固定符号帳探索およびゲイン探索）が行われる (ST312)。

[0106] ステップ ST320では、前述の音源探索によって得られた第 Ach駆動音源信号で第 Ach適応符号帳 438の内部バッファが更新される。

[0107] ステップ ST331では、第 AchCELP符号化部 430の第 Bch推定信号生成部 445 によって、第 Bch推定信号が生成される。生成された第 Bch推定信号は、第 AchCE LP符号ィ匕部 430から第 BchCELP符号ィ匕部に送られる。そして、ステップ ST332では、第 BchCELP符号ィ匕部の図示されない第 BchLPC分析部（第 AchLPC分析部 446の同等物）によって、第 Bch推定信号に対する LPC分析が行われ、第 BchLPC ノラメータが得られる。

[0108] そして、ステップ ST333では、第 BchCELP符号化部の図示されな!、第 BchLPC 予測残差信号生成部 (第 AchLPC予測残差信号生成部 447の同等物）によって、第 BchLPCパラメータが用いられ、第 Bch推定信号に対する符号化 LPC予測残差信号が生成される。この符号化 LPC予測残差信号は、第 BchCELP符号ィ匕部の図示されないスィッチ部 (スィッチ部 437の同等物）を経由して、図示されない第 Bch適応符号帳 (第 Ach適応符号帳 438の同等物）に出力される。そして、ステップ ST334 において、第 Bch適応符号帳の内部バッファが、第 Bch推定信号に対する符号化 L PC予測残差信号で更新される。

[0109] 続いて、適応符号帳更新動作についてより具体的に説明する。ここでは、符号化チャネル選択部 310によって第 Aチャネルが選択された場合を例にとり、第 Ach適応符号帳 438の内部バッファの更新動作例を図 12を用いて説明し、第 Bch適応符号帳の内部バッファの更新動作例を図 13を用いて説明する。

[0110] 図 12に示す動作例では、歪最小化部 443によって得られた、第 iフレーム内の第 j サブフレームについての第 Ach駆動音源信号を用いて、第 Ach適応符号帳 438の内部バッファが更新される（ST401)。そして、更新された第 Ach適応符号帳 438は、次サブフレームである第 j + 1サブフレームについての音源探索に用いられる（ST4 02)。

[0111] 図 13に示す動作例では、第 iフレームの第 Ach復号音声信号および第 iフレームのモノラル復号音声信号を用いて、第 iフレームの第 Bch推定信号が生成される (ST5 01)。生成された第 Bch推定信号は、第 AchCELP符号ィ匕部 430から第 BchCELP 符号ィ匕部に出力される。そして、第 BchCELP符号ィ匕部の第 BchLPC予測残差信号生成部において、第 iフレームについての第 Bch符号化 LPC予測残差信号 (第 Be h推定信号に対する符号化 LPC予測残差信号) 451が生成される (ST502)。第 Be h符号化 LPC予測残差信号 451は、第 BchCELP符号ィ匕部のスィッチ部を経由して第 Bch適応符号帳 452に出力される。第 Bch適応符号帳 452は、第 Bch符号化 LP C予測残差信号 451によって更新される（ST503)。更新された第 Bch適応符号帳 4 52は、次フレームである第 i+ 1フレームについての音源探索に用いられる（ST504)

[0112] あるフレームにおいて、第 Aチャネルが符号ィ匕チャネルとして選択された場合、第 B chCELP符号ィ匕部では、第 Bch適応符号帳 452の更新動作以外の動作は要求されな、ため、そのフレームにおヽては第 Bch入力音声信号の符号ィ匕を休止することができる。

[0113] このように、本実施の形態によれば、 CELP符号ィ匕方式に基づいて各レイヤの音声符号ィ匕を行った場合において、チャネル内相関度が高いチャネルの信号を符号ィ匕することができ、チャネル内予測による符号ィ匕効率を向上させることができる。

[0114] なお、本実施の形態では、 CELP符号ィ匕方式を採用した音声符号ィ匕装置において実施の形態 3で説明した符号ィ匕チャネル選択部 310を用いた場合を例にとって説明したが、実施の形態 1および実施の形態 2でそれぞれ説明した符号化チャネル選択部 120および符号ィ匕チャネル選択部 210を、符号ィ匕チャネル選択部 310の代わりに、あるいは、符号ィ匕チャネル 310とともに、使用することもできる。よって、 CELP符号化方式に基づ、て各レイヤの音声符号ィ匕を行った場合にぉ、て、前述の各実施の形態で説明した効果を実現することができる。

[0115] また、拡張レイヤの符号ィ匕チャネルの選択基準として、前述したもの以外のものを使用することもできる。例えば、あるフレームに関して、第 AchCELP符号ィ匕部 430の適応符号帳探索および第 BchCELP符号化部の適応符号帳探索をそれぞれ行い、それらの結果として得られる符号ィ匕歪みのうちょり小さい値を有するものに対応するチャネルを、符号ィ匕チャネルとして選択しても良い。

[0116] また、音声符号ィ匕装置 400の構成に、チャネル間予測を実行する構成要素を加えることもできる。この場合、音声符号化装置 400は、モノラル駆動音源信号に対して第 1調整用ゲインを直接乗算する代わりに、モノラル駆動音源信号を用いて第 Ach 復号音声信号を予測するチャネル間予測を行、、それによつて生成されたチャネル間予測信号に対して第 1調整用ゲインを乗算する構成を、採用することができる。

[0117] 以上、本発明の各実施の形態について説明した。上記実施の形態に係る音声符号化装置および音声復号化装置は、移動体通信システムにおいて使用される無線通信移動局装置および無線通信基地局装置などの無線通信装置に搭載することができる。

[0118] また、上記実施の形態では、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

[0119] また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されてもよいし、一部又は全てを含むように 1チップィ匕されてもょ、。

[0120] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレ卜ラ LSIと呼称されることちある。

[0121] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサで実現してもよい。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル'プロセッサーを利用してもよい。

[0122] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行ってもよい。バイオ技術の適応等が可能性としてありえる。

[0123] 本明細書は、 2005年 4月 28日出願の特願 2005— 132366に基づくものである。

この内容はすべてここに含めておく。産業上の利用可能性

本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システムなどにおける通信装置の用途に適用できる。

Claims

請求の範囲

[1] 第 1チャネル信号および第 2チャネル信号を含むステレオ信号を符号化する音声符号化装置において、

前記第 1チャネル信号および前記第 2チャネル信号を用いてモノラル信号を生成するモノラル信号生成手段と、

前記第 1チャネル信号および前記第 2チャネル信号の一方を選択する選択手段と生成されたモノラル信号を符号ィ匕してコアレイヤ符号ィ匕データを得るとともに、選択されたチャネル信号を符号化して前記コアレイヤ符号化データに対応する拡張レイャ符号ィヒデータを得る符号ィヒ手段と、

を有する音声符号化装置。

[2] 前記選択手段は、

前記第 1チャネル信号および前記第 2チャネル信号の一方をフレーム毎に選択し、前記符号化手段は、

前記モノラル信号および前記フレーム毎に選択されたチャネル信号を前記フレーム毎に符号化する、

請求項 1記載の音声符号化装置。

[3] 前記第 1チャネル信号が選択された場合に生じる第 1の符号ィ匕歪みと、前記第 2チャネル信号が選択された場合に生じる第 2の符号化歪みと、をそれぞれ算出する算出手段をさらに有し、

前記選択手段は、

算出された第 1の符号ィ匕歪みが算出された第 2の符号ィ匕歪みよりも小さい場合は前記第 1チャネル信号を選択し、算出された第 2の符号ィ匕歪みが算出された第 1の符号化歪みよりも小さい場合は前記第 2チャネル信号を選択する、

請求項 1記載の音声符号化装置。

[4] 前記符号化手段は、

前記第 1チャネル信号および前記第 2チャネル信号を符号化して第 1符号化データおよび第 2符号化データをそれぞれ得て、前記第 1符号化データおよび前記第 2符号ィ匕データのうち選択されたチャネル信号に対応するものを前記拡張レイヤ符号ィ匕データとして出力し、

前記符号ィヒ手段が前記モノラル信号を符号ィヒするときに得られるモノラル復号信号と、前記符号化手段が前記第 1チャネル信号を符号化するときに得られる第 1チヤネル復号信号と、を用いて、前記第 2チャネル信号に対応する第 2チャネル推定信号を生成するとともに、前記モノラル復号信号と、前記符号化手段が前記第 2チャネル信号を符号化するときに得られる第 2チャネル復号信号と、を用いて、前記第 1チヤネル信号に対応する第 1チャネル推定信号を生成する推定信号生成手段と、

前記第 1チャネル信号に対する前記第 1チャネル復号信号の誤差および前記第 2 チャネル信号に対する前記第 2チャネル推定信号の誤差に基づいて、前記第 1の符号ィ匕歪みを算出するとともに、前記第 1チャネル信号に対する前記第 1チャネル推定信号の誤差および前記第 2チャネル信号に対する前記第 2チャネル復号信号の誤差に基づいて、前記第 2の符号化歪みを算出する歪み算出手段と、

を有する請求項 3記載の音声符号化装置。

[5] 前記選択手段は、

前記第 1チャネル信号に対応する第 1チャネル内相関度と、前記第 2チャネル信号に対応する第 2チャネル内相関度と、をそれぞれ算出する算出手段を有し、算出された第 1チャネル内相関度が算出された第 2チャネル内相関度よりも高い場合は前記第 1チャネル信号を選択し、算出された第 2チャネル内相関度が算出された第 1チャネル内相関度よりも高い場合は前記第 2チャネル信号を選択する、請求項 1記載の音声符号化装置。

[6] 前記符号化手段は、

前記選択手段によって前記第 1チャネル信号が選択された場合には、第 1適応符号帳を用いて前記第 1チャネル信号の CELP (Code Excited Linear Prediction)符号化を行い、 CELP符号ィ匕結果を用いて前記拡張レイヤ符号ィ匕データを得るとともに、前記 CELP符号化結果を用いて前記第 1適応符号帳を更新する、

請求項 1記載の音声符号化装置。

[7] 前記符号化手段は、前記拡張レイヤ符号化データと、前記モノラル信号を符号ィヒするときに得られるモノラル復号信号と、を用いて、前記第 2チャネル信号に対応する第 2チャネル推定信号を生成し、

前記第 2チャネル推定信号の LPC (Linear Prediction Coding)予測残差信号を用 V、て、前記第 2チャネル信号の CELP符号ィ匕にぉ、て用いられる第 2適応符号帳を更新する、

請求項 6記載の音声符号化装置。

[8] 前記選択手段は、

前記第 1チャネル信号を、サブフレームを有するフレームに関連づけて選択し、前記符号化手段は、

前記モノラル信号および前記フレームに関連づけて選択された前記第 1チャネル信号についてサブフレーム毎に音源探索を行いながら、前記フレームの前記拡張レィャ符号化データを得る、

請求項 7記載の音声符号化装置。

[9] 前記符号化手段は、

前記第 1適応符号帳を前記サブフレームの単位で更新するとともに、前記第 2適応符号帳を前記フレームの単位で更新する、

請求項 8記載の音声符号化装置。

[10] 請求項 1記載の音声符号化装置を有する移動局装置。

[11] 請求項 1記載の音声符号化装置を有する基地局装置。

[12] 第 1チャネル信号および第 2チャネル信号を含むステレオ信号を符号化する音声符号化方法において、

前記第 1チャネル信号および前記第 2チャネル信号を用いてモノラル信号を生成し前記第 1チャネル信号および前記第 2チャネル信号の一方を選択し、

生成されたモノラル信号を符号ィ匕してコアレイヤ符号ィ匕データを得るとともに、選択されたチャネル信号を符号化して前記コアレイヤ符号化データに対応する拡張レイャ符号化データを得る、音声符号化方法。