WO2006070751A1

WO2006070751A1 - 音声符号化装置および音声符号化方法

Info

Publication number: WO2006070751A1
Application number: PCT/JP2005/023802
Authority: WO
Inventors: Koji Yoshida; Michiyo Goto
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2004-12-27
Filing date: 2005-12-26
Publication date: 2006-07-06
Anticipated expiration: 2007-06-27
Also published as: BRPI0516376A; EP1818911A1; KR20070092240A; JPWO2006070751A1; EP1818911A4; US7945447B2; ATE545131T1; CN101091208A; US20080010072A1; CN101091208B; EP1818911B1; JP5046652B2

Abstract

　モノラル－ステレオ・スケーラブル構成を有する音声符号化において、ステレオ信号の複数チャネル信号間の相関が小さい場合でも効率的にステレオ音声を符号化することができる音声符号化装置。この装置のコアレイヤ符号化部（１１０）において、モノラル信号生成部（１１１）は、第１ｃｈ音声信号および第２ｃｈ音声信号からモノラル信号を生成し、モノラル信号符号化部（１１２）は、モノラル信号に対する符号化を行い、モノラル信号復号部（１１３）は、モノラル信号の符号化データからモノラルの復号信号を生成して拡張レイヤ符号化部（１２０）に出力する。拡張レイヤ符号化部（１２０）において、第１ｃｈ予測信号合成部（１２２）は、モノラル復号信号と第１ｃｈ予測フィルタ量子化パラメータとから第１ｃｈ予測信号を合成し、第２ｃｈ予測信号合成部（１２６）は、モノラル復号信号と第２ｃｈ予測フィルタ量子化パラメータとから第２ｃｈ予測信号を合成する。

Description

明細書

音声符号化装置および音声符号化方法

技術分野

[0001] 本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。

背景技術

[0002] 移動体通信や IP通信での伝送帯域の広帯域化、サービスの多様化に伴い、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号化が必須となる。

[0003] また、 IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号ィ匕が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をレ、う。

[0004] よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側において選択可能な、モノラル一ステレオ間でのスケーラブル構成（モノラル一ステレオ.スケーラブル構成）を有する符号化が望まれる。

[0005] このような、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕方法としては、例えば、チャネル (以下、適宜「ch」と略す）間の信号の予測（第 lch信号から第 2 ch信号の予測、または、第 2ch信号から第 lch信号の予測）を、チャネル相互間のピツチ予測により行う、すなわち、 2チャネル間の相関を利用して符号ィ匕を行うものがある (非特許文献 1参照)。非特許文献 1： Ramprashad, S.A., "Stereophonic CELP coding using cross channel p rediction", Pro IEEE Workshop on Speech Coding, pp.136 - 138， Sep. 2000.

発明の開示

発明が解決しょうとする課題

[0006] しかしながら、上記非特許文献 1記載の音声符号化方法では、双方のチャネル間の相関が小さい場合には、チャネル間の予測の性能（予測ゲイン）が低下してしまい、符号化効率が劣化する。

[0007] 本発明の目的は、モノラルステレオ'スケーラブル構成を有する音声符号化において、ステレオ信号の複数チャネル信号間の相関が小さい場合でも効率的にステレォ音声を符号化することができる音声符号化装置および音声符号化方法を提供することである。

課題を解決するための手段

[0008] 本発明の音声符号化装置は、コアレイヤのモノラル信号を用いた符号ィ匕を行う第 1 符号化手段と、拡張レイヤのステレオ信号を用いた符号化を行う第 2符号化手段と、を具備し、前記第 1符号化手段は、第 1チャネル信号および第 2チャネル信号を含むステレオ信号を入力信号として、前記第 1チャネル信号および前記第 2チャネル信号からモノラル信号を生成する生成手段を具備し、前記第 2符号化手段は、前記モノラル信号から得られる信号に基づいて、前記第 1チャネル信号または前記第 2チャネル信号の予測信号を合成する合成手段を具備する構成を採る。

発明の効果

[0009] 本発明によれば、ステレオ信号の複数チャネル信号間の相関が小さレ、場合でも効率的にステレオ音声を符号化することができる。

図面の簡単な説明

[0010] [図 1]本発明の実施の形態 1に係る音声符号化装置の構成を示すブロック図

[図 2]本発明の実施の形態 1に係る第 lch、第 2ch予測信号合成部の構成を示すブロック図

[図 3]本発明の実施の形態 1に係る第 lch、第 2ch予測信号合成部の構成を示すブロック図

[図 4]本発明の実施の形態 1に係る音声復号装置の構成を示すブロック図

[図 5]本発明の実施の形態 1に係る音声符号化装置の動作説明図

[図 6]本発明の実施の形態 1に係る音声符号化装置の動作説明図

[図 7]本発明の実施の形態 2に係る音声符号化装置の構成を示すブロック図

[図 8]本発明の実施の形態 2に係る音声復号装置の構成を示すブロック図

[図 9]本発明の実施の形態 3に係る音声符号化装置の構成を示すブロック図

[図 10]本発明の実施の形態 3に係る第 lch、第 2chCELP符号化部の構成を示すブロック図

[図 11]本発明の実施の形態 3に係る音声復号装置の構成を示すブロック図

[図 12]本発明の実施の形態 3に係る第 lch、第 2chCELP復号部の構成を示すプロック図

[図 13]本発明の実施の形態 3に係る音声符号化装置の動作フロー図

[図 14]本発明の実施の形態 3に係る第 lch、第 2chCELP符号ィ匕部の動作フロー図 [図 15]本発明の実施の形態 3に係る音声符号化装置の別の構成を示すブロック図 [図 16]本発明の実施の形態 3に係る第 lch、第 2chCELP符号ィ匕部の別の構成を示すブロック図

[図 17]本発明の実施の形態 4に係る音声符号化装置の構成を示すブロック図

[図 18]本発明の実施の形態 4に係る第 lch、第 2chCELP符号化部の構成を示すブロック図

発明を実施するための最良の形態

[0011] 以下、モノラル—ステレオ'スケーラブル構成を有する音声符号化に関する本発明の実施の形態について、添付図面を参照して詳細に説明する。

[0012] (実施の形態 1)

本実施の形態に係る音声符号化装置の構成を図 1に示す。図 1に示す音声符号化装置 100は、モノラル信号のためのコアレイヤ符号化部 110とステレオ信号のための拡張レイヤ符号化部 120とを備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。 [0013] コアレイヤ符号化部 110において、モノラル信号生成部 111は、入力される第 lch 音声信号 s_chl(n)、第 2ch音声信号 s_ch2(n) (但し、 n=0〜NF_l ; NFはフレーム長)から、式（1)に従ってモノラル信号 s_mono(n)を生成し、モノラル信号符号ィ匕部 112に出力する。

[数 1]

s— mono (n) = ( s— chl (n) + s_ch2 (n) ) / 2 … （1 )

[0014] モノラル信号符号ィ匕部 112は、モノラル信号 s_mono(n)に対する符号化を行い、このモノラル信号の符号ィ匕データをモノラル信号復号部 113に出力する。また、このモノラル信号の符号化データは、拡張レイヤ符号化部 120から出力される量子化符号や符号化データと多重されて符号化データとして音声復号装置へ伝送される。

[0015] モノラル信号復号部 113は、モノラル信号の符号ィ匕データからモノラルの復号信号を生成して拡張レイヤ符号ィ匕部 120に出力する。

[0016] 拡張レイヤ符号化部 120において、第 lch予測フィルタ分析部 121は、第 lch音声信号 s_chl(n)とモノラル復号信号とから第 lch予測フィルタパラメータを求めて量子化し、第 1 ch予測フィルタ量子化パラメータを第 1 ch予測信号合成部 122に出力する。なお、第 lch予測フィルタ分析部 121への入力として、モノラル復号信号の代わりに、モノラル信号生成部 111の出力であるモノラル信号 s_mono(n)を用いてもよレ、。また、第 lch予測フィルタ分析部 121は、第 lch予測フィルタ量子化パラメータを符号ィ匕した第 lch予測フィルタ量子化符号を出力する。この第 lch予測フィルタ量子化符号は他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される。

[0017] 第 lch予測信号合成部 122は、モノラル復号信号と第 lch予測フィルタ量子化パラメータとから第 lch予測信号を合成し、その第 lch予測信号を減算器 123に出力する。第 lch予測信号合成部 122の詳細については後述する。

[0018] 減算器 123は、入力信号である第 lch音声信号と第 lch予測信号との差、すなわち、第 lch入力音声信号に対する第 lch予測信号の残差成分の信号 (第 lch予測残差信号)を求め、第 lch予測残差信号符号ィ匕部 124に出力する。

[0019] 第 lch予測残差信号符号化部 124は、第 lch予測残差信号を符号化して第 lch 予測残差符号化データを出力する。この第 lch予測残差符号化データは他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される

[0020] 一方、第 2ch予測フィルタ分析部 125は、第 2ch音声信号 s_ch2(n)とモノラル復号信号とから第 2ch予測フィルタパラメータを求めて量子化し、第 2ch予測フィルタ量子ィ匕パラメータを第 2ch予測信号合成部 126に出力する。また、第 2ch予測フィルタ分析部 125は、第 2ch予測フィルタ量子化パラメータを符号ィ匕した第 2ch予測フィルタ量子化符号を出力する。この第 2ch予測フィルタ量子化符号は他の符号ィ匕データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される。

[0021] 第 2ch予測信号合成部 126は、モノラル復号信号と第 2ch予測フィルタ量子化パラメータとから第 2ch予測信号を合成し、その第 2ch予測信号を減算器 127に出力する。第 2ch予測信号合成部 126の詳細につレ、ては後述する。

[0022] 減算器 127は、入力信号である第 2ch音声信号と第 2ch予測信号との差、すなわち、第 2ch入力音声信号に対する第 2ch予測信号の残差成分の信号 (第 2ch予測残差信号)を求め、第 2ch予測残差信号符号ィ匕部 128に出力する。

[0023] 第 2ch予測残差信号符号ィ匕部 128は、第 2ch予測残差信号を符号化して第 2ch 予測残差符号化データを出力する。この第 2ch予測残差符号化データは他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される

[0024] 次いで、第 lch予測信号合成部 122および第 2ch予測信号合成部 126の詳細について説明する。第 lch予測信号合成部 122および第 2ch予測信号合成部 126の構成は図 2 <構成例 1 >または図 3 <構成例 2 >に示すようになる。構成例 1および 2 のいずれも、第 l ch入力信号と第 2ch入力信号との加算信号であるモノラル信号と、各チャネル信号との間の相関性に基づき、モノラル信号に対する各チャネル信号の遅延差 (Dサンプル)および振幅比（g)を予測フィルタ量子化パラメータとして用いて、モノラル信号から各チャネルの予測信号を合成する。

[0025] ぐ構成例 1 >

構成例 1では、図 2に示すように、第 lch予測信号合成部 122および第 2ch予測信号合成部 1 26は、遅延器 201および乗算器 202を備え、式（2)で表される予測により、モノラル復号信号 sd_mono(n)から、各チャネルの予測信号 sp_ch(n)を合成する。

[数 2]

sp_ch、n) = g · sd— mono \n - D) … ( 2 )

[0026] <構成例 2 >

構成例 2では、図 3に示すように、図 2に示す構成にさらに、遅延器 203— 1〜P、乗算器 204— 1〜Pおよび加算器 205を備える。そして、予測フィルタ量子化パラメータとして、モノラル信号に対する各チャネル信号の遅延差 (Dサンプル）および振幅比（ g)の他に、予測係数列 { a(0)，a(l)， a(2), · · . , a(P) } (Pは予測次数、 a(0)= 1.0)を用い、式（3)で表される予測により、モノラル復号信号 sd_mono(n)から、各チャネルの予測信号 sp_ch(n)を合成する。

[数 3]

P

sp_ch (n) = ∑ { g * a (k) · sd_raono (n - Ό - k) } … ( 3 )

[0027] これに対し、第 l ch予測フィルタ分析部 121および第 2ch予測フィルタ分析部 1 25 は、式 (4)で表される歪み、すなわち、各チャネルの入力音声信号 s_ch(n) (n=0〜NF - 1)と上式（2)または（3)に従って予測される各チャネルの予測信号 sp_ch(n)との歪 Di stを最小とするような予測フィルタパラメータを求め、そのフィルタパラメータを量子化した予測フィルタ量子化パラメータを、上記構成を採る第 l ch予測信号合成部 122および第 2ch予測信号合成部 126に出力する。また、第 l ch予測フィルタ分析部 121 および第 2ch予測フィルタ分析部 1 25は、予測フィルタ量子化パラメータを符号ィ匕した予測フィルタ量子化符号を出力する。

[数 4]

NF-1

Di st = ∑ { s_ch (n) - sp_ch (n) } ² … （4 )

n=0

[0028] なお、構成例 1に対しては、第 l ch予測フィルタ分析部 121および第 2ch予測フィルタ分析部 1 25は、モノラル復号信号と各チャネルの入力音声信号との間の相互相関を最大にするような遅延差 Dおよびフレーム単位の平均振幅の比 gを予測フィルタパラメータとして求めてもょレヽ。

[0029] 次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声復号装置の構成を図 4に示す。図 4に示す音声復号装置 300は、モノラル信号のためのコアレイヤ復号部 310と、ステレオ信号のための拡張レイヤ復号部 320 とを備える。

[0030] モノラル信号復号部 311は、入力されるモノラル信号の符号化データを復号し、モノラル復号信号を拡張レイヤ復号部 320に出力するとともに、最終出力として出力する。

[0031] 第 lch予測フィルタ復号部 321は、入力される第 l ch予測フィルタ量子化符号を復号して、第 lch予測フィルタ量子化パラメータを第 lch予測信号合成部 322に出力する。

[0032] 第 lch予測信号合成部 322は、音声符号化装置 100の第 lch予測信号合成部 12 2と同じ構成を採り、モノラル復号信号と第 l ch予測フィルタ量子化パラメータとから第 lch音声信号を予測し、その第 lch予測音声信号を加算器 324に出力する。

[0033] 第 lch予測残差信号復号部 323は、入力される第 lch予測残差符号ィヒデータを復号し、第 lch予測残差信号を加算器 324に出力する。

[0034] 加算器 324は、第 lch予測音声信号と第 lch予測残差信号とを加算して第 l chの復号信号を求め、最終出力として出力する。

[0035] 一方、第 2ch予測フィルタ復号部 325は、入力される第 2ch予測フィルタ量子化符号を復号して、第 2ch予測フィルタ量子化パラメータを第 2ch予測信号合成部 326に出力する。

[0036] 第 2ch予測信号合成部 326は、音声符号化装置 100の第 2ch予測信号合成部 12 6と同じ構成を採り、モノラル復号信号と第 2ch予測フィルタ量子化パラメータとから第 2ch音声信号を予測し、その第 2ch予測音声信号を加算器 328に出力する。

[0037] 第 2ch予測残差信号復号部 327は、入力される第 2ch予測残差符号ィ匕データを復号し、第 2ch予測残差信号を加算器 328に出力する。

[0038] 加算器 328は、第 2ch予測音声信号と第 2ch予測残差信号とを加算して第 2chの復号信号を求め、最終出力として出力する。 [0039] このような構成を採る音声復号装置 300では、モノラル—ステレオ'スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号ィ匕データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号化データおよび量子化符号のすべてを用いて第 lch復号信号および第 2ch復号信号を復号して出力する。

[0040] ここで、本実施の形態に係るモノラル信号は、図 5に示すように、第 lch音声信号 s_ chlと第 2ch音声信号 s_ch2との加算によって得られる信号であるため、双方のチヤネルの信号成分を含む中間的な信号である。よって、第 lch音声信号と第 2ch音声信号とのチャネル間相関が小さい場合でも、第 lch音声信号とモノラル信号との相関および第 2ch音声信号とモノラル信号との相関は、チャネル間相関よりは大きくなるものと予想される。よって、モノラル信号力第 lch音声信号を予測する場合の予測ゲインおよびモノラル信号力第 2ch音声信号を予測する場合の予測ゲイン (図 5 :予測ゲイン B)は、第 lch音声信号から第 2ch音声信号を予測する場合の予測ゲインおよび第 2ch音声信号力第 lch音声信号を予測する場合の予測ゲイン (図 5：予測ゲイン A)よりも大きくなることが予想、される。

[0041] そして、この関係をまとめたのが図 6である。すなわち、第 lch音声信号と第 2ch音声信号とのチャネル間相関が十分大きい場合は、予測ゲイン Aおよび予測ゲイン B はそれほど変わらず双方とも十分大きい値が得られる。しかし、第 lch音声信号と第 2ch音声信号とのチャネル間相関が小さレ、場合は、予測ゲイン Aはチャネル間相関が十分大きい場合に比べ急激に低下するのに対し、予測ゲイン Bは、予測ゲイン Aよりも低下の度合いが小さぐ予測ゲイン Aよりも大きい値になるものと予想される。

[0042] このように、本実施の形態では、第 lch音声信号および第 2ch音声信号双方の信号成分を含む中間的な信号であるモノラル信号から各チャネルの信号を予測して合成するため、チャネル間相関が小さい複数チャネルの信号に対しても従来より予測ゲインが大きい信号を合成することができる。その結果、同等の音質をより低ビットレートの符号化により得ること、および、同等のビットレートでより高音質な音声を得ることができる。よって、本実施の形態によれば、符号ィ匕効率の向上を図ることができる。

[0043] (実施の形態 2) 図 7に本実施の形態に係る音声符号化装置 400の構成を示す。図 7に示すように、音声符号化装置 400は、図 1 (実施の形態 1)に示す構成から第 2ch予測フィルタ分析部 125、第 2ch予測信号合成部 126、減算器 127および第 2ch予測残差信号符号化部 128を取り除いた構成を採る。つまり、音声符号化装置 400は、第 lchと第 2c hのうち第 lchに対してのみ予測信号を合成し、モノラル信号の符号化データ、第 lc h予測フィルタ量子化符号および第 lch予測残差符号化データのみを音声復号装置へ伝送する。

[0044] 一方、本実施の形態に係る音声復号装置 500の構成は図 8に示すようになる。図 8 に示すように、音声復号装置 500は、図 4 (実施の形態 1)に示す構成から第 2ch予測フィルタ復号部 325、第 2ch予測信号合成部 326、第 2ch予測残差信号復号部 3 27および加算器 328を取り除き、代わりに、第 2ch復号信号合成部 331を加えた構成を採る。

[0045] 第 2ch復号信号合成部 331は、モノラル復号信号 sd_mono(n)と第 lch復号信号 sd_ chl(n)とを用いて、式（1)に示す関係に基づき、式（5)に従って第 2ch復号信号 sd_ch 2(n)を合成する。

[数 5]

sd— ch2 ui) = 2 · sd_mono (n)一 sd— chl i) … 6 )

[0046] なお、本実施の形態では拡張レイヤ符号化部 120が第 lchに対してのみ処理する構成としたが、第 lchに代えて第 2chに対してのみ処理する構成としてもよい。

[0047] このように、本実施の形態によれば、実施の形態 1に比べ装置構成を簡単にすることができる。また、第 lchおよび第 2chのうち一方のチャネルの符号化データのみの伝送で済むので、さらに符号化効率が向上する。

[0048] (実施の形態 3)

図 9に本実施の形態に係る音声符号化装置 600の構成を示す。コアレイヤ符号ィ匕部 110は、モノラル信号生成部 111およびモノラル信号 CELP符号化部 114を備え、拡張レイヤ符号化部 120は、モノラル駆動音源信号保持部 131、第 IchCELP符号化部 132および第 2chCELP符号化部 133を備える。

[0049] モノラル信号 CELP符号化部 114は、モノラル信号生成部 111で生成されたモノラル信号 s_mono(n)に対して CELP符号ィヒを行い、モノラル信号符号化データ、および、 CELP符号ィ匕によって得られるモノラル駆動音源信号を出力する。このモノラル駆動音源信号は、モノラル駆動音源信号保持部 131に保持される。

[0050] 第 IchCELP符号化部 132は、第 lch音声信号に対して CELP符号化を行って第 lch符号化データを出力する。また、第 2chCELP符号ィ匕部 133は、第 2ch音声信号に対して CELP符号化を行って第 2ch符号ィ匕データを出力する。第 IchCELP符号化部 132および第 2chCELP符号化部 133は、モノラル駆動音源信号保持部 13 1に保持されたモノラル駆動音源信号を用いて、各チャネルの入力音声信号に対応する駆動音源信号の予測、および、その予測残差成分に対する CELP符号化を行う

[0051] 次いで、第 IchCELP符号化部 132および第 2chCELP符号化部 133の詳細について説明する。第 IchCELP符号化部 132および第 2chCELP符号化部 133の構成を図 10に示す。

[0052] 図 10において、第 Nch (Nは 1または 2) LPC分析部 401は、第 Nch音声信号に対する LPC分析を行レ、、得られた LPCパラメータを量子化して第 NchLPC予測残差信号生成部 402および合成フィルタ 409に出力するとともに、第 NchLPC量子化符号を出力する。第 NchLPC分析部 401では、 LPCパラメータの量子化に際し、モノラル信号に対する LPCパラメータと第 Nch音声信号から得られる LPCパラメータ（第 N chLPCパラメータ）との相関が大きいことを利用して、モノラル信号の符号化データ力モノラル信号量子化 LPCパラメータを復号し、そのモノラル信号量子化 LPCパラメータに対する NchLPCパラメータの差分成分を量子化することにより効率的な量子化を行う。

[0053] 第 NchLPC予測残差信号生成部 402は、第 Nch量子化 LPCパラメータを用いて、第 Nch音声信号に対する LPC予測残差信号を算出して第 Nch予測フィルタ分析部 403に出力する。

[0054] 第 Nch予測フィルタ分析部 403は、 LPC予測残差信号およびモノラル駆動音源信号から第 Nch予測フィルタパラメータを求めて量子化し、第 Nch予測フィルタ量子化パラメータを第 Nch駆動音源信号合成部 404に出力するとともに、第 Nch予測フィルタ量子化符号を出力する。

[0055] 第 Nch駆動音源信号合成部 404は、モノラル駆動音源信号および第 Nch予測フィルタ量子化パラメータを用いて、第 Nch音声信号に対応する予測駆動音源信号を合成して乗算器 407— 1へ出力する。

[0056] ここで、第 Nch予測フィルタ分析部 403は、実施の形態 1 (図 1)における第 lch予測フィルタ分析部 121および第 2ch予測フィルタ分析部 125に対応し、それらの構成および動作は同様になる。また、第 Nch駆動音源信号合成部 404は、実施の形態 1 (図 1〜3)における第 lch予測信号合成部 122および第 2ch予測信号合成部 126に対応し、それらの構成および動作は同様になる。但し、本実施の形態では、モノラル復号信号に対する予測を行って各チャネルの予測信号を合成するのではなぐモノラル信号に対応するモノラル駆動音源信号に対する予測を行って各チャネルの予測駆動音源信号を合成する点において実施の形態 1と異なる。そして、本実施の形態では、その予測駆動音源信号に対する残差成分 (予測しきれない誤差成分)の音源信号を、 CELP符号ィ匕における音源探索により符号化する。

[0057] つまり、第 lchおよび第 2chCELP符号化部 132、 133は、第 Nch適応符号帳 405 および第 Nch固定符号帳 406を有し、適応音源、固定音源、およびモノラル駆動音源信号力予測した予測駆動音源の各音源信号にそれら各々のゲインを乗じてカロ算し、その加算によって得られた駆動音源に対して歪み最小化による閉ループ型音源探索を行う。そして、適応音源インデタス、固定音源インデタス、適応音源、固定音源および予測駆動音源信号に対するゲイン符号を第 Nch音源符号化データとして出力する。より具体的には、以下のようになる。

[0058] 合成フイノレタ 409は、第 NchLPC分析部 401から出力される量子化 LPCパラメータを用いて、第 Nch適応符号帳 405および第 Nch固定符号帳 406で生成された音源ベクトル、および、第 Nch駆動音源信号合成部 404で合成された予測駆動音源信号を駆動音源として LPC合成フィルタによる合成を行う。この結果得られる合成信号のうち第 Nchの予測駆動音源信号に対応する成分は、実施の形態 1 (図:!〜 3)において第 lch予測信号合成部 122または第 2ch予測信号合成部 126から出力される各チャネルの予測信号に相当する。そして、このようにして得られた合成信号は、減算器 410へ出力される。

[0059] 減算器 410は、合成フィルタ 409から出力された合成信号を第 Nch音声信号から減算することにより誤差信号を算出し、この誤差信号を聴覚重み付け部 411へ出力する。この誤差信号が符号化歪みに相当する。

[0060] 聴覚重み付け部 411は、減算器 410から出力された符号ィ匕歪みに対して聴覚的な重み付けを行い、歪最小化部 412へ出力する。

[0061] 歪最小化部 412は、第 Nch適応符号帳 405および第 Nch固定符号帳 406に対して、聴覚重み付け部 411から出力される符号化歪みを最小とするようなインデクスを決定し、第 Nch適応符号帳 405および第 Nch固定符号帳 406が使用するインデクスを指示する。また、歪最小化部 412は、それらのインデタスに対応するゲイン、具体的には、第 Nch適応符号帳 405からの適応ベクトルおよび第 Nch固定符号帳 406 力の固定ベクトルに対する各ゲイン (適応符号帳ゲインおよび固定符号帳ゲイン）を生成し、それぞれ乗算器 407— 2、 407— 4へ出力する。

[0062] また、歪最小化部 412は、第 Nch駆動音源信号合成部 404から出力された予測駆動音源信号、乗算器 407— 2でのゲイン乗算後の適応べ外ルおよび乗算器 407— 4でのゲイン乗算後の固定ベクトル、の 3種類の信号間のゲインを調整する各ゲインを生成し、それぞれ乗算器 407— 1、 407— 3および 407— 5へ出力する。それら 3種類の信号間のゲインを調整する 3種類のゲインは、好ましくはそれらのゲイン値間に相互に関係性をもたせて生成することが望ましい。例えば、第 lch音声信号と第 2ch 音声信号とのチャネル間相関が大きい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応べクトノレおよびゲイン乗算後の固定ベクトルの寄与分に対して相対的に大きくなるように、逆にチャネル間相関が小さい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定べタトノレの寄与分に対して相対的に小さくなるようにする。

[0063] また、歪最小化部 412は、それらのインデタス、それらのインデタスに対応する各ゲインの符号および信号間調整用ゲインの符号を第 Nch音源符号ィ匕データとして出力する。

[0064] 第 Nch適応符号帳 405は、過去に生成された合成フィルタ 409への駆動音源の音源ベクトルを内部バッファに記憶しており、歪最小化部 412から指示されたインデクスに対応する適応符号帳ラグ（ピッチラグ、または、ピッチ周期）に基づいて、この記憶されている音源ベクトルから 1サブフレーム分を生成し、適応符号帳ベクトルとして乗算器 407— 2へ出力する。

[0065] 第 Nch固定符号帳 406は、歪最小化部 412から指示されたインデタスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器 407— 4へ出力する。

[0066] 乗算器 407— 2は、第 Nch適応符号帳 405から出力された適応符号帳ベクトルに適応符号帳ゲインを乗じ、乗算器 407— 3へ出力する。

[0067] 乗算器 407-4は、第 Nch固定符号帳 406から出力された固定符号帳ベクトルに固定符号帳ゲインを乗じ、乗算器 407— 5へ出力する。

[0068] 乗算器 407— 1は、第 Nch駆動音源信号合成部 404から出力された予測駆動音源信号にゲインを乗じ、加算器 408へ出力する。乗算器 407— 3は、乗算器 407— 2 でのゲイン乗算後の適応べタトノレに別のゲインを乗じ、加算器 408へ出力する。乗算器 407— 5は、乗算器 407— 4でのゲイン乗算後の固定ベクトルに別のゲインを乗じ、加算器 408へ出力する。

[0069] 加算器 408は、乗算器 407— 1から出力された予測駆動音源信号と、乗算器 407

3から出力された適応符号帳ベクトルと、乗算器 407— 5から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ 409に出力する。

[0070] 合成フィルタ 409は、加算器 408から出力される音源ベクトルを駆動音源として LP

C合成フィルタによる合成を行う。

[0071] このように、第 Nch適応符号帳 405および第 Nch固定符号帳 406で生成された音源ベクトルを用いて符号化歪みが求められる一連の処理は閉ループとなっており、歪最小化部 412は、この符号ィ匕歪みが最小となるような、第 Nch適応符号帳 405および第 Nch固定符号帳 406のインデクスを決定し、出力する。

[0072] 第 lchおよび第 2chCELP符号化部 132、 133は、このようにして得られた符号化データ (LPC量子化符号、予測フィルタ量子化符号、音源符号化データ）を第 Nch 符号化データとして出力する。 [0073] 次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声復号装置 700の構成を図 11に示す。図 11に示す音声復号装置 700は、モノラル信号のためのコアレイヤ復号部 310と、ステレオ信号のための拡張レイヤ復号部 320とを備える。

[0074] モノラル〇£1^復号部312は、入力されるモノラル信号の符号化データを CELP復号し、モノラル復号信号、および、 CELP復号によって得られるモノラル駆動音源信号を出力する。このモノラル駆動音源信号は、モノラル駆動音源信号保持部 341に保持される。

[0075] 第 IchCELP復号部 342は、第 lch符号化データに対して CELP復号を行って第 lch復号信号を出力する。また、第 2chCELP復号部 343は、第 2ch符号化データに対して CELP復号を行って第 2ch復号信号を出力する。第 IchCELP復号部 342 および第 2chCELP復号部 343は、モノラル駆動音源信号保持部 341に保持されたモノラル駆動音源信号を用いて、各チャネルの符号化データに対応する駆動音源信号の予測、および、その予測残差成分に対する CELP復号を行う。

[0076] このような構成を採る音声復号装置 700では、モノラル—ステレオ'スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号ィ匕データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号化データのすべてを用いて第 lch復号信号および第 2ch復号信号を復号して出力する。

[0077] 次いで、第 IchCELP復号部 342および第 2chCELP復号部 343の詳細について説明する。第 IchCELP復号部 342および第 2chCELP復号部 343の構成を図 12 に示す。第 lchおよび第 2chCELP復号部 342、 343は、音声符号化装置 600 (図 9 )から伝送されたモノラル信号符号化データおよび第 Nch符号化データ（Nは 1または 2)から、第 NchLPC量子化パラメータの復号、第 Nch駆動音源信号の予測信号を含む CELP音源信号の復号を行い、第 Nch復号信号を出力する。より具体的には、以下のようになる。

[0078] 第 NchLPCパラメータ復号部 501は、モノラル信号符号化データを用いて復号されたモノラル信号量子化 LPCパラメータと第 NchLPC量子化符号とを用いて第 Nch LPC量子化パラメータの復号を行レ、、得られた量子化 LPCパラメータを合成フィルタ 508へ出力する。

[0079] 第 Nch予測フィルタ復号部 502は、第 Nch予測フィルタ量子化符号を復号し、得られた第 Nch予測フィルタ量子化パラメータを第 Nch駆動音源信号合成部 503へ出力する。

[0080] 第 Nch駆動音源信号合成部 503は、モノラル駆動音源信号および第 Nch予測フィルタ量子化パラメータを用いて、第 Nch音声信号に対応する予測駆動音源信号を合成して乗算器 506— 1へ出力する。

[0081] 合成フイノレタ 508は、第 NchLPCパラメータ復号部 501から出力される量子化 LPC パラメータを用いて、第 Nch適応符号帳 504および第 Nch固定符号帳 505で生成された音源ベクトル、および、第 Nch駆動音源信号合成部 503で合成された予測駆動音源信号を駆動音源として LPC合成フィルタによる合成を行う。得られた合成信号は、第 Nch復号信号として出力される。

[0082] 第 Nch適応符号帳 504は、過去に生成された合成フィルタ 508への駆動音源の音源ベクトルを内部バッファに記憶しており、第 Nch音源符号化データに含まれるインデタスに対応する適応符号帳ラグ（ピッチラグ、または、ピッチ周期）に基づいて、この記憶されている音源ベクトルから 1サブフレーム分を生成し、適応符号帳ベクトルとして乗算器 506— 2へ出力する。

[0083] 第 Nch固定符号帳 505は、第 Nch音源符号ィ匕データに含まれるインデタスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器 506— 4へ出力する。

[0084] 乗算器 506— 2は、第 Nch適応符号帳 504から出力された適応符号帳ベクトルに第 Nch音源符号化データに含まれる適応符号帳ゲインを乗じ、乗算器 506— 3へ出力する。

[0085] 乗算器 506— 4は、第 Nch固定符号帳 505から出力された固定符号帳ベクトルに第 Nch音源符号化データに含まれる固定符号帳ゲインを乗じ、乗算器 506— 5へ出力する。

[0086] 乗算器 506— 1は、第 Nch駆動音源信号合成部 503から出力された予測駆動音源信号に、第 Nch音源符号化データに含まれる、予測駆動音源信号に対する調整用ゲインを乗じ、加算器 507へ出力する。

[0087] 乗算器 506— 3は、乗算器 506— 2でのゲイン乗算後の適応ベクトルに、第 Nch音源符号化データに含まれる、適応べ外ルに対する調整用ゲインを乗じ、加算器 507 へ出力する。

[0088] 乗算器 506— 5は、乗算器 506— 4でのゲイン乗算後の固定ベクトルに、第 Nch音源符号化データに含まれる、固定べ外ルに対する調整用ゲインを乗じ、加算器 507 へ出力する。

[0089] 加算器 507は、乗算器 506— 1から出力された予測駆動音源信号と、乗算器 506 _ 3から出力された適応符号帳ベクトルと、乗算器 506— 5から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ 508に出力する。

[0090] 合成フイノレタ 508は、加算器 507から出力される音源ベクトルを駆動音源として LP C合成フィルタによる合成を行う。

[0091] 以上の音声符号ィ匕装置 600の動作フローをまとめると図 13に示すようになる。すなわち、第 lch音声信号と第 2ch音声信号とからモノラル信号を生成し（ST1301)、モノラル信号に対しコアレイヤの CELP符号化を行い（ST1302)、次いで、第 lchの C ELP符号化および第 2chの CELP符号化を行う（ST1303、 1304)。

[0092] また、第 lch、第 2chCELP符号化部 132、 133の動作フローをまとめると図 14に示すようになる。すなわち、まず、第 Nchの LPC分析と LPCパラメータの量子化を行い（ST1401)、次いで、第 Nchの LPC予測残差信号を生成する（ST1402)。次いで、第 Nchの予測フィルタの分析を行い（ST1403)、第 Nchの駆動音源信号を予測する（ST1404)。そして、最後に、第 Nchの駆動音源の探索とゲインの探索を行う（ ST1405)。

[0093] なお、第 lch、第 2chCELP符号ィ匕部 132、 133においては、 CELP符号化における音源探索による音源符号化に先立ち、第 Nch予測フィルタ分析部 403によって予測フィルタパラメータを求めていたが、予測フィルタパラメータに対する符号帳を別途設け、 CELP音源探索において、適応音源探索等の探索と共に、歪み最小化による閉ループ型の探索によって最適な予測フィルタパラメータをその符号帳に基づいて求めるような構成としてもよい。または、第 Nch予測フィルタ分析部 403において予測フィルタパラメータの候補を複数求めておき、 CELP音源探索における歪み最小化による閉ループ型の探索によって、それら複数の候補の中から最適な予測フィルタパラメータを選択するような構成としてもよい。このような構成を採ることにより、より最適なフィルタパラメータを算出することができ、予測性能の向上 (すなわち、復号音声品質の向上)を図ることができる。

[0094] また、第 lch、第 2chCELP符号化部 132、 133での CELP符号化における音源探索による音源符号化において、第 Nch音声信号に対応する予測駆動音源信号、ゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトル、の 3種類の信号間のゲインを調整するための各ゲインをそれぞれの信号に乗ずる構成としたが、そのような調整用のゲインを用いない構成、または、調整用のゲインとして第 Nch音声信号に対応する予測駆動音源信号に対してのみゲインを乗ずる構成としてもよい。

[0095] また、 CELP音源探索時に、モノラル信号の CELP符号化で得られたモノラル信号符号化データを利用し、そのモノラル信号符号化データに対する差分成分 (補正成分）を符号化する構成としてもよい。例えば、適応音源ラグや各音源のゲインの符号化時に、モノラル信号の CELP符号化で得られる適応音源ラグからの差分値、適応音源ゲイン'固定音源ゲインに対する相対比などを符号化対象として符号ィ匕する。これにより、各チャネルの CELP音源に対する符号化の効率を向上させることができる

[0096] また、音声符号化装置 600 (図 9)の拡張レイヤ符号化部 120の構成を、実施の形態 2 (図 7)と同様に、第 lchに関する構成だけとしてもよい。すなわち、拡張レイヤ符号化部 120では、第 lch音声信号に対してのみモノラル駆動音源信号を用いた駆動音源信号の予測および予測残差成分に対する CELP符号化を行う。この場合、音声復号装置 700 (図 11)の拡張レイヤ復号部 320では、実施の形態 2 (図 8)と同様に、第 2ch信号の復号を行うために、モノラル復号信号 sdjnono(n)および第 lch復号信号 sd_chl(n)を用いて、式（1)に示す関係に基づき、式（5)に従って第 2ch復号信号 s d_ch2(n)を合成する。

[0097] また、第 lch、第 2chCELP符号化部 132、 133および第 lch、第 2chCELP復号部 342、 343においては、音源探索における音源構成として、適応音源および固定音源のうち、いずれか一方だけを用いる構成としてもよい。

[0098] また、第 Nch予測フィルタ分析部 403において、第 Nch音声信号を LPC予測残差信号の代わりに、モノラル信号生成部 111で生成されたモノラル信号 s_mono(n)をモノラル駆動音源信号の代わりに用いて、第 Nch予測フィルタパラメータを求めるようにしてもよレ、。この場合の音声符号ィ匕装置 750の構成を図 15に、第 IchCELP符号ィ匕部 141および第 2chCELP符号化部 142の構成を図 16に示す。図 15に示すように、モノラル信号生成部 111で生成されたモノラル信号 s_mono(n)が、第 1 chCELP符号ィ匕部 141および第 2chCELP符号化部 142に入力される。そして、図 16に示す第 lch CELP符号ィ匕部 141および第 2chCELP符号化部 142の第 Nch予測フィルタ分析部 403において、第 Nch音声信号およびモノラル信号 s_mono(n)を用いて、第 Nch予測フィルタパラメータを求める。このような構成にすることによって、第 Nch量子化 LP Cパラメータを用いて第 Nch音声信号力も LPC予測残差信号を算出する処理が不要となる。また、モノラル駆動音源信号の代わりにモノラル信号 s_mon₀(n)を用いることで、モノラル駆動音源信号を用いる場合よりも時間的に後 (未来)の信号を用いて第 Nch予測フィルタパラメータを求めることができる。なお、第 Nch予測フィルタ分析部 403では、モノラル信号生成部 111で生成されたモノラル信号 s_mono(n)を用いる代わりに、モノラル信号 CELP符号化部 114での符号ィ匕で得られるモノラル復号信号を用いるようにしてもよい。

[0099] また、第 Nch適応符号帳 405の内部バッファに、合成フィルタ 409への駆動音源の音源ベクトルの代わりに、乗算器 407— 3でのゲイン乗算後の適応ベクトルと乗算器 407— 5でのゲイン乗算後の固定ベクトルのみを加算した信号ベクトルとを記憶するようにしてもよい。この場合は、復号側の第 Nch適応符号帳でも同様な構成とする必要がある。

[0100] また、第 lch、第 2chCELP符号化部 132、 133で行われる各チャネルの予測駆動音源信号に対する残差成分の音源信号の符号化では、 CELP符号化による時間領域での音源探索を行う代わりに、残差成分の音源信号を周波数領域へ変換し、周波数領域での残差成分の音源信号の符号化を行うようにしてもよい。 [0101] このように、本実施の形態によれば、音声符号化に適した CELP符号化を用いるため、さらに効率的な符号化を行うことができる。

[0102] (実施の形態 4)

図 17に本実施の形態に係る音声符号化装置 800の構成を示す。音声符号化装置

800は、コアレイヤ符号ィ匕部 110および拡張レイヤ符号ィ匕部 120を備える。なお、コァレイヤ符号化部 110の構成は実施の形態 1 (図 1)と同一であるため説明を省略する。

[0103] 拡張レイヤ符号化部 120は、モノラル信号 LPC分析部 134、モノラル LPC残差信号生成部 135、第 IchCELP符号化部 136および第 2chCELP符号化部 137を備る。

[0104] モノラル信号 LPC分析部 134は、モノラル復号信号に対する LPCパラメータを算出して、このモノラル信号 LPCパラメータをモノラル LPC残差信号生成部 135、第 lch CELP符号ィ匕部 136および第 2chCELP符号化部 137へ出力する。

[0105] モノラル LPC残差信号生成部 135は、 LPCパラメータを用いて、モノラル復号信号に対する LPC残差信号 (モノラル LPC残差信号)を生成して、第 IchCELP符号ィ匕部 136および第 2chCELP符号化部 137へ出力する。

[0106] 第 IchCELP符号化部 136および第 2chCELP符号化部 137は、モノラル復号信号に対する LPCパラメータおよび LPC残差信号を用いて、各チャネルの音声信号に対する CELP符号化を行い、各チャネルの符号化データを出力する。

[0107] 次いで、第 IchCELP符号化部 136および第 2chCELP符号化部 137の詳細について説明する。第 IchCELP符号ィ匕部 136および第 2chCELP符号ィ匕部 137の構成を図 18に示す。なお、図 18において実施の形態 3 (図 10)と同一の構成には同一符号を付し、説明を省略する。

[0108] 第^^111^〇分析部413は、第 Nch音声信号に対する LPC分析を行い、得られた L PCパラメータを量子化して第 NchLPC予測残差信号生成部 402および合成フィノレタ 409に出力するとともに、第 NchLPC量子化符号を出力する。第 NchLPC分析部 413では、 LPCパラメータの量子化に際し、モノラル信号に対する LPCパラメータと第 Nch音声信号から得られる LPCパラメータ（第 NchLPCパラメータ）との相関が大きレ、ことを利用して、モノラル信号 LPCパラメータに対する NchLPCパラメータの差分成分を量子化することにより効率的な量子化を行う。

[0109] 第 Nch予測フィルタ分析部 414は、第 NchLPC予測残差信号生成部 402から出力される LPC予測残差信号およびモノラル LPC残差信号生成部 135から出力されるモノラル LPC残差信号から第 Nch予測フィルタパラメータを求めて量子化し、第 N ch予測フィルタ量子化パラメータを第 Nch駆動音源信号合成部 415に出力するとともに、第 Nch予測フィルタ量子化符号を出力する。

[0110] 第 Nch駆動音源信号合成部 415は、モノラル LPC残差信号および第 Nch予測フィルタ量子化パラメータを用いて、第 Nch音声信号に対応する予測駆動音源信号を合成して乗算器 407— 1へ出力する。

[0111] なお、音声符号化装置 800に対する音声復号装置では、音声符号化装置 800と同様にして、モノラル復号信号に対する LPCパラメータおよび LPC残差信号を算出して、各チャネルの CELP復号部での各チャネルの駆動音源信号の合成に用いる。

[0112] また、第 Nch予測フィルタ分析部 414において、第 NchLPC予測残差信号生成部 402から出力される LPC予測残差信号およびモノラル LPC残差信号生成部 135から出力されるモノラル LPC残差信号の代わりに、第 Nch音声信号およびモノラル信号生成部 111で生成されたモノラル信号 s_mono(n)を用いて、第 Nch予測フィルタパラメータを求めるようにしてもよい。さらに、モノラル信号生成部 111で生成されたモノラル信号 s_mono(n)を用いる代わりに、モノラル復号信号を用いるようにしてもよい。

[0113] このように、本実施の形態によれば、モノラル信号 LPC分析部 134およびモノラル L PC残差信号生成部 135を備えるため、コアレイヤにおいて任意の符号化方式でモノラル信号が符号化される場合でも、拡張レイヤにおいて CELP符号ィ匕を用レ、ることができる。

[0114] なお、上記各実施の形態に係る音声符号化装置、音声復号装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。

[0115] また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。 [0116] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップィ匕されてもよいし、一部又は全てを含むように 1チップ化されてもよい。

[0117] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレトラ LSIと呼称されることもある。

[0118] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサで実現してもよい。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル'プロセッサーを利用してもょレ、。

[0119] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用レ、て機能ブロックの集積化を行ってもよレ、。バイオ技術の適応等が可能性としてありえる。

[0120] 本明糸田書 ίま、 2004年 12月 27曰出願の特願 2004— 377965および 2005年 8月 1

8日出願の特願 2005— 237716に基づくものである。これらの内容はすべてここに含めておく。

産業上の利用可能性

[0121] 本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。

Claims

請求の範囲

[1] コアレイヤのモノラル信号を用レ、た符号化を行う第 1符号化手段と、

拡張レイヤのステレオ信号を用いた符号ィヒを行う第 2符号ィヒ手段と、を具備し、前記第 1符号化手段は、第 1チャネル信号および第 2チャネル信号を含むステレオ信号を入力信号として、前記第 1チャネル信号および前記第 2チャネル信号からモノラル信号を生成する生成手段を具備し、

前記第 2符号化手段は、前記モノラル信号から得られる信号に基づいて、前記第 1 チャネル信号または前記第 2チャネル信号の予測信号を合成する合成手段を具備する、

音声符号化装置。

[2] 前記合成手段は、前記モノラル信号に対する前記第 1チャネル信号または前記第 2チャネル信号の遅延差および振幅比を用いて、前記予測信号を合成する、請求項 1記載の音声符号化装置。

[3] 前記第 2符号化手段は、前記予測信号と前記第 1チャネル信号または前記第 2チャネル信号との残差信号を符号化する、

請求項 1記載の音声符号化装置。

[4] 前記合成手段は、前記モノラル信号を CELP符号化して得られるモノラル駆動音源信号に基づいて、前記予測信号を合成する、

請求項 1記載の音声符号化装置。

[5] 前記第 2符号化手段は、前記第 1チャネル信号または前記第 2チャネル信号から第 1チャネル LPC残差信号または第 2チャネル LPC残差信号を算出する算出手段、をさらに具備し、

前記合成手段は、前記モノラル駆動音源信号に対する前記第 1チャネル LPC残差信号または前記第 2チャネル LPC残差信号の遅延差および振幅比を用いて、前記予測信号を合成する、

請求項 4記載の音声符号化装置。

[6] 前記合成手段は、前記モノラル駆動音源信号と、前記第 1チャネル LPC残差信号または前記第 2チャネル LPC残差信号とから算出される前記遅延差および前記振幅比を用いて、前記予測信号を合成する、

請求項 5記載の音声符号化装置。

[7] 前記合成手段は、前記モノラル信号に対する前記第 1チャネル信号または前記第 2チャネル信号の遅延差および振幅比を用いて、前記予測信号を合成する、請求項 4記載の音声符号化装置。

[8] 前記合成手段は、前記モノラル信号と、前記第 1チャネル信号または前記第 2チヤネル信号とから算出される前記遅延差および前記振幅比を用いて、前記予測信号を合成する、

請求項 7記載の音声符号化装置。

[9] 請求項 1記載の音声符号化装置を具備する無線通信移動局装置。

[10] 請求項 1記載の音声符号化装置を具備する無線通信基地局装置。

[11] コアレイヤにおいてモノラル信号を用いた符号化を行レ、、拡張レイヤにおいてステレオ信号を用いた符号化を行う音声符号化方法であって、

前記コアレイヤにおいて、第 1チャネル信号および第 2チャネル信号を含むステレォ信号を入力信号として、前記第 1チャネル信号および前記第 2チャネル信号からモノラル信号を生成する生成工程を具備し、

前記拡張レイヤにおいて、前記モノラル信号から得られる信号に基づいて、前記第 1チャネル信号または前記第 2チャネル信号の予測信号を合成する合成工程を具備する、

音声符号化方法。