WO2007105586A1

WO2007105586A1 - 符号化装置および符号化方法

Info

Publication number: WO2007105586A1
Application number: PCT/JP2007/054528
Authority: WO
Inventors: Tomofumi Yamanashi; Kaoru Sato; Toshiyuki Morii; Masahiro Oshikiri
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2006-03-10
Filing date: 2007-03-08
Publication date: 2007-09-20
Also published as: EP1988544A4; JPWO2007105586A1; EP1988544A1; US8306827B2; US20090094024A1; EP1988544B1; JP5058152B2

Abstract

　上位の階層において下位の階層の符号化結果に基づいた最適な符号化を柔軟に行い、限られた環境下で良質な音声信号をユーザに提供する符号化装置。この符号化装置では、基本レイヤ符号化部（２０２）は、入力信号を符号化して基本レイヤ情報源符号を生成し、符号化の際に算出されるパラメータであるＬＰＣおよび量子化ＬＰＣを拡張レイヤ制御部（２０５）に出力する。基本レイヤ復号化部（２０３）は、基本レイヤ情報源符号を復号化する。加算部（２０４）は、基本レイヤ復号化信号の極性を反転させて入力信号と加算して差分信号を算出する。拡張レイヤ制御部（２０５）は、ＬＰＣおよび量子化ＬＰＣに基づいて、拡張レイヤにおける符号化モードを示す拡張レイヤモード情報を生成する。拡張レイヤ符号化部（２０６）は、拡張レイヤ制御部（２０５）の制御により、加算器（２０４）から得られる差分信号に対して符号化を行う。

Description

明細書

符号化装置および符号化方法

技術分野

[0001] 本発明は、信号を符号ィ匕して伝送する通信システムに用いられる符号ィ匕装置および符号化方法に関する。

背景技術

[0002] 近年、音声信号、楽音信号の符号化において、符号化情報の一部からでも音声- 楽音信号を復号ィ匕でき、パケット損失が発生するような状況にお!、ても音質劣化を抑制することができるスケーラブル符号ィ匕技術が開発されている (例えば、特許文献 1 参照)。このスケーラブル符号化技術は、符号化情報の一部からでも音声、楽音信号を復号ィ匕できるように音声信号、楽音信号を符号ィ匕するものであり、パケット損失が発生するような状況においても音質劣化を抑制することができる。具体的には、第 1 階層で入力信号を符号化して符号化情報を生成し、上位の第 (i 1)目の階層 (iは 2以上の整数)で、入力信号と第 (i 1)階層の符号ィ匕情報に応じて得られる復号ィ匕信号との差である残差信号を生成し、さらに上位の第 i階層で残差信号に応じて符号化することを繰り返す方法が知られてヽる。

[0003] また、スケーラブル符号ィ匕技術を用いて、下位の階層における符号ィ匕結果と予め定められた閾値との比較結果に基づき上位の階層の符号化部の動作'非動作を切り替えるという方法も提案されている（例えば、特許文献 2参照)。

特許文献 1：特開平 10— 97295号公報

特許文献 2：特開 2005 - 80063号公報

発明の開示

発明が解決しょうとする課題

[0004] 上記特許文献 1の方法は、上位の階層におヽて残差信号を符号化する際、下位の階層における符号ィヒ結果を特に考慮せずに予め決められた符号ィヒ方式により残差信号を符号ィ匕する方法であり、下位と上位の階層間の関係は固定的なものであるから、限られた環境下で良質な音声信号を提供するにあたり最適な符号ィ匕を行っているとは言えない。

[0005] また、上記特許文献 2の方法は、下位の階層の符号ィ匕結果を考慮しているものの、その主たる目的は、回線が輻輳した場合に送信バッファのオーバーフローを避けるために上位の階層のビットレートを調整することであり、回線が輻輳していない場合においては良質な音声信号を提供するにあたり最適な符号ィ匕を行っているとは言えない。

[0006] 本発明の目的は、上位の階層において残差信号を符号ィ匕する際に、下位の階層の符号ィ匕結果を考慮し、それに基づいた最適な符号ィ匕を柔軟に行うことにより、限られた環境下で良質な音声信号をユーザに提供することである。

課題を解決するための手段

[0007] 本発明の符号化装置は、入力信号を n階層 (nは 2以上の整数)の符号化情報で符号化する符号化装置であって、入力信号を符号化して第 1階層の符号化情報を生成する基本レイヤ符号化手段と、第 i階層 (iは 1以上 n— 1以下の整数)の符号化情報を復号化して第 i階層の復号化信号を生成する第 i階層の復号化手段と、前記入力信号と第 1階層の復号化信号との差分である第 1階層の差分信号あるいは第 (i 1)階層の差分信号と第 i階層の復号ィ匕信号との差分である第 i階層の差分信号を求める加算手段と、第 i階層の差分信号を符号化して第 (i+ 1)階層の符号化情報を生成する第 (i+ 1)階層の拡張レイヤ符号化手段と、所定の階層の符号化手段の符号ィ匕パラメータに基づいて前記所定の階層よりも上位の階層の符号ィ匕手段における符号化方法を制御する拡張レイヤ制御手段と、を具備する構成を採る。

[0008] 本発明の符号化方法は、入力信号を n階層（nは 2以上の整数)の符号化情報で符号ィ匕する符号ィ匕方法であって、入力信号を符号化して第 1階層の符号化情報を生成する基本レイヤ符号化工程と、第 i階層（iは 1以上 n— 1以下の整数)の符号化情報を復号化して第 i階層の復号ィ匕信号を生成する第 i階層の復号ィ匕工程と、前記入力信号と第 1階層の復号化信号との差分である第 1階層の差分信号あるいは第 (i 1)階層の差分信号と第 i階層の復号ィ匕信号との差分である第 i階層の差分信号を求める加算工程と、第 i階層の差分信号を符号化して第 (i+ 1)階層の符号化情報を生成する第 (i+ 1)階層の拡張レイヤ符号ィ匕工程と、所定の階層の符号ィ匕パラメータに基づいて前記所定の階層よりも上位の階層における符号ィヒ方法を制御する拡張レイャ制御工程と、を具備する方法を採る。

発明の効果

[0009] 本発明によれば、スケーラブル符号ィ匕技術において、下位の階層の符号化結果を考慮し、下位の階層の符号ィ匕結果と上位の階層の符号ィ匕結果を組み合わせた上で最適な品質の音声信号となるように上位の階層の符号化方式を柔軟に切り替えることができるので、回線の輻輳状態に関係なぐユーザに対し良質な音声信号を提供することが可能となる。

図面の簡単な説明

[0010] [図 1]本発明の実施の形態 1に係る符号化装置および復号化装置を有する通信システムの構成を示す図

[図 2]本発明の実施の形態 1に係る符号ィ匕装置の構成を示すブロック図

[図 3]本発明の実施の形態 1に係る符号ィ匕情報のビットストリーム構造を示す図

[図 4]本発明の実施の形態 1に係る符号ィ匕装置の基本レイヤ符号ィ匕部の内部構成を示すブロック図

[図 5]本発明の実施の形態 1に係る符号ィ匕装置の基本レイヤ復号ィ匕部の内部構成を示すブロック図

[図 6]本発明の実施の形態 1に係る符号ィ匕装置の拡張レイヤ制御部の内部構成を示すブロック図

[図 7]本発明の実施の形態 1に係る符号ィ匕装置の拡張レイヤ符号ィ匕部の内部構成を示すブロック図

[図 8]本発明の実施の形態 1に係る復号ィ匕装置の構成を示すブロック図

[図 9]本発明の実施の形態 1に係る復号ィ匕装置の拡張レイヤ復号ィ匕部の内部構成を示すブロック図

[図 10]本発明の実施の形態 2に係る符号ィ匕装置の構成を示すブロック図

[図 11]本発明の実施の形態 2に係る符号ィ匕装置の拡張レイヤ制御部の内部構成を示すブロック図

[図 12]本発明の実施の形態 2に係る符号ィ匕装置の拡張レイヤ符号ィ匕部の内部構成を示すブロック図

[図 13]本発明の実施の形態 2に係る復号ィ匕装置の構成を示すブロック図

[図 14]本発明の実施の形態 2に係る復号ィ匕装置の拡張レイヤ復号ィ匕部の内部構成を示すブロック図

[図 15]本発明の実施の形態 3に係る符号ィ匕装置の構成を示すブロック図

[図 16]本発明の実施の形態 3に係る符号ィ匕装置の拡張レイヤ制御部の内部構成を示すブロック図

[図 17]本発明の実施の形態 3に係る復号ィ匕装置の構成を示すブロック図

[図 18]本発明の実施の形態 4に係る符号ィ匕装置の構成を示すブロック図

[図 19]本発明の実施の形態 4に係る復号ィ匕装置の構成を示すブロック図

発明を実施するための最良の形態

[0011] 以下、本発明の実施の形態について、図面を用いて説明する。なお、以下の説明において、符号化および復号化は、 CELP (Code- Excited Linear Prediction)方法を用いて、階層的に行われることとする。また、以下の説明では、基本レイヤと一つの拡張レイヤ力もなる二層のスケーラブル符号ィ匕技術を例に採る。ここで、各階層（以下、「レイヤ」という）は、下の方から、それぞれ、「基本レイヤ」、「第 1の拡張レイヤ」、「第 2 の拡張レイヤ」、「第 3の拡張レイヤ」、 · · ·といい、基本レイヤ以外のレイヤを「拡張レィャ」という。

[0012] スケーラブル符号ィ匕技術は、階層化することによって、通信速度を表すビットレートが充分確保できるときには、全てのレイヤのデータを送信し、ビットレートが充分確保できなくなったときには、ビットレートに応じて下位のレイヤから所定のレイヤまでのデータを送信し、スケーラビリティを確保する技術である。

[0013] (実施の形態 1)

図 1は、本発明の実施の形態 1に係る符号ィ匕装置および復号ィ匕装置を有する通信システムのブロック構成を示す図である。図 1において、通信システムは、符号化装置 101と復号ィ匕装置 103とを備える。

[0014] 符号化装置 101は、入力信号と伝送モード情報を入力し、伝送モード情報に基づいて入力信号を符号ィ匕し、伝送路 102を介して復号ィ匕装置 103に符号ィ匕情報を送信する。復号化装置 103は、伝送路 102を介して符号化装置 101から送信された符号ィ匕情報を受信して復号ィ匕し、復号化した伝送モード情報に基づいて出力信号を生成し、後工程の装置に出力する。ここで、伝送モード情報とは、符号化装置 101が復号化装置 103に伝送するビットレートを示し、 BR1、 BR2 (BR1 < BR2)のいずれかの値をとるものとする。

[0015] 図 2は、本実施の形態に係る符号ィ匕装置 101の構成を示すブロック図である。符号化装置 101は、図 2に示すように、符号化動作制御部 201と、基本レイヤ符号化部 2 02と、基本レイヤ復号化部 203と、加算部 204と、拡張レイヤ制御部 205と、拡張レィャ符号化部 206と、符号ィ匕情報統合部 207と、制御スィッチ 208、 209と、から主に構成される。

[0016] 符号ィ匕動作制御部 201には、伝送モード情報が入力される。符号化動作制御部 2 01は、入力した伝送モード情報に応じて、制御スィッチ 208、 209のオン Zオフ制御を行う。具体的には、符号ィ匕動作制御部 201は、伝送モード情報が BR2である場合、制御スィッチ 208、 209を全てオンにする。また、符号ィ匕動作制御部 201は、伝送モード情報が BR1である場合、制御スィッチ 208、 209を全てオフにする。なお、伝送モード情報は、上記のように符号ィ匕動作制御部 201に入力されるとともに、図 2のように符号化動作制御部 201経由力あるいは符号化動作制御部 201を経由せずに直接、符号ィ匕情報統合部 207にも入力される。このように、符号化動作制御部 201 が伝送モード情報に応じて制御スィッチ群をオン Zオフ制御することにより、入力信号の符号ィ匕に用いる符号ィ匕部の組み合わせが決定される。

[0017] 基本レイヤ符号ィ匕部 202は、音声信号等の入力信号に対して CELPタイプの音声符号化方法を用いて符号化を行って基本レイヤ情報源符号を生成し、生成した基本レイヤ情報源符号を符号ィ匕情報統合部 207および制御スィッチ 209に出力する。また、基本レイヤ符号ィ匕部 202は、入力信号の音声符号ィ匕の際に算出されるパラメ一タである LPC (線形予測係数)および量子化 LPCを拡張レイヤ制御部 205に出力する。なお、基本レイヤ符号ィ匕部 202の内部構成の詳細については後述する。

[0018] 基本レイヤ復号ィ匕部 203は、制御スィッチ 209がオンのとき、基本レイヤ符号化部 2 02から出力された基本レイヤ情報源符号に対して CELPタイプの音声復号ィ匕方法を用いて復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号を加算器 204に出力する。一方、基本レイヤ復号ィ匕部 203は、制御スィッチ 209がオフのときには何も動作しない。なお、基本レイヤ復号ィ匕部 203の内部構成の詳細については後述する。

[0019] 加算部 204は、制御スィッチ 208がオンのとき、基本レイヤ復号化信号の極性を反転させて入力信号と加算することにより差分信号を算出し、差分信号を拡張レイヤ符号ィ匕部 206に出力する。一方、加算部 204は、制御スィッチ 208がオフのときには何も動作しない。

[0020] 拡張レイヤ制御部 205は、基本レイヤ符号ィ匕部 202から出力された LPCおよび量子化 LPCに基づいて拡張レイヤモード情報を生成し、拡張レイヤモード情報を拡張レイヤ符号ィ匕部 206および符号ィ匕情報統合部 207に出力する。拡張レイヤモード情報とは、拡張レイヤにおける符号ィ匕モードを示す情報であり、復号化装置において拡張レイヤ情報源符号を復号ィ匕する際に利用される。なお、拡張レイヤ制御部 205の内部構成の詳細については後述する。

[0021] 拡張レイヤ符号ィ匕部 206は、制御スィッチ 208、 209がオンのとき、拡張レイヤ制御部 205の制御により、加算器 204から得られる差分信号に対して CELPタイプの音声符号ィ匕方法を用いて符号ィ匕を行って拡張レイヤ情報源符号を生成し、拡張レイヤ情報源符号を符号ィ匕情報統合部 207に出力する。一方、拡張レイヤ符号ィ匕部 206は、制御スィッチ 208、 209がオフのときには何も動作しない。なお、拡張レイヤ制御部 2 05による拡張レイヤ符号ィ匕部 206の制御方法の詳細については後述する。

[0022] 符号ィ匕情報統合部 207は、基本レイヤ符号ィ匕部 202および拡張レイヤ符号ィ匕部 2 06から出力された情報源符号と、拡張レイヤ制御部 205から出力された拡張レイヤモード情報と、符号ィ匕動作制御部 201から出力された伝送モード情報と、を統合して符号ィ匕情報を生成し、生成した符号ィ匕情報を伝送路 102に出力する。

[0023] 次に、伝送前符号ィ匕情報のデータ構造 (ビットストリーム）について図 3を用いて説明する。伝送モード情報が BR1である場合、符号化情報は、図 3Aに示すように、伝送モード情報、基本レイヤ情報源符号および冗長部によって構成される。伝送モード情報が BR2である場合、符号化情報は、図 3Bに示すように、伝送モード情報、基本レイヤ情報源符号、拡張レイヤ情報源符号、拡張レイヤモード情報および冗長部によって構成される。ここで、図 3中のデータ構造における冗長部とは、ビットストリーム中に用意される冗長的なデータ格納部であり、伝送誤り検出 ·訂正用のビットおよび、パケットの同期をとるためのカウンタ等に利用される。

[0024] 次に、図 2の基本レイヤ符号ィ匕部 202の内部構成について図 4を用いて説明する。

前処理部 401は、入力信号に対し、 DC成分を取り除くハイパスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理やプリエンファシス処理を行い、これらの処理後の信号 (Xin)を LPC分析部 402および加算部 405に出力する。

[0025] LPC分析部 402は、 Xinを用いて線形予測分析を行ヽ、分析結果である LPCを LP C量子化部 403および拡張レイヤ制御部 205に出力する。 LPC量子ィ匕部 403は、 L PC分析部 402から出力された LPCの量子化処理を行、、量子化 LPCを合成フィルタ 404および拡張レイヤ制御部 205に出力するとともに量子化 LPCを表す符号 (L) を多重化部 414に出力する。合成フィルタ 404は、量子化 LPCに基づくフィルタ係数により、後述する加算部 411から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、合成信号を加算部 405に出力する。加算部 405は、合成信号の極性を反転させて Xinに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部 412に出力する。

[0026] 適応音源符号帳 406は、過去に加算部 411によって出力された駆動音源をバッファに記憶しており、ノメータ決定部 413から出力された信号により特定される過去の駆動音源から 1フレーム分のサンプルを適応音源ベクトルとして切り出して乗算部 40 9に出力する。量子化利得生成部 407は、パラメータ決定部 413から出力された信号によって特定される量子化適応音源利得と量子化固定音源利得とをそれぞれ乗算部 409と乗算部 410とに出力する。固定音源符号帳 408は、パラメータ決定部 413 から出力された信号によって特定される形状を有するパルス音源ベクトルを選択し、そのパルス音源ベクトルを固定音源ベクトルとして乗算部 410に出力する。なお、選択したノルス音源ベクトルに拡散ベクトルを乗算して固定音源ベクトルを生成し、その固定音源ベクトルを乗算部 410に出力してもよい。 [0027] 乗算部 409は、量子化利得生成部 407から出力された量子化適応音源利得を、適応音源符号帳 406から出力された適応音源ベクトルに乗じて、加算部 411に出力する。乗算部 410は、量子化利得生成部 407から出力された量子化固定音源利得を、固定音源符号帳 408から出力された固定音源ベクトルに乗じて、加算部 411に出力する。加算部 411は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをべタトル加算し、加算結果である駆動音源を合成フィルタ 404および適応音源符号帳 406 に出力する。なお、適応音源符号帳 406に入力された駆動音源は、ノッファに記憶される。

[0028] 聴覚重み付け部 412は、加算部 405から出力された誤差信号に対して聴覚的な重み付けをおこない符号ィ匕歪みとしてパラメータ決定部 413に出力する。パラメータ決定部 413は、聴覚重み付け部 412から出力された符号ィ匕歪みを最小とする適応音源ベクトル、固定音源ベクトル及び量子化利得を、各々適応音源符号帳 406、固定音源符号帳 408及び量子化利得生成部 407から選択し、選択結果を示す適応音源べ外ル符号 (A)、固定音源べ外ル符号 (F)及び音源利得符号 (G)を多重化部 41 4に出力する。

[0029] 多重化部 414は、 LPC量子化部 403から量子化 LPCを表す符号 (L)を入力し、パラメータ決定部 413から適応音源ベクトルを表す符号 (A)、固定音源ベクトルを表す符号 (F)および量子化利得を表す符号 (G)を入力し、これらの情報を多重化して基本レイヤ情報源符号として出力する。

[0030] 次に、図 2の基本レイヤ復号ィ匕部 203の内部構成について図 5を用いて説明する。

多重化分離部 501は、入力した基本レイヤ情報源符号を個々の符号 (L、 A、 G、 F) に分離する。 LPC符号 (L)は LPC復号化部 502に出力され、適応音源ベクトル符号 (A)は適応音源符号帳 505に出力され、音源利得符号 (G)は量子化利得生成部 5 06に出力され、固定音源ベクトル符号 (F)は固定音源符号帳 507に出力される。

[0031] 適応音源符号帳 505は、多重化分離部 501から出力された符号 (A)で指定される過去の駆動音源から 1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算部 508に出力する。量子化利得生成部 506は、多重化分離部 501から出力された音源利得符号 (G)で指定される量子化適応音源利得と量子化固定音源利得を復号ィ匕し乗算部 508及び乗算部 509に出力する。固定音源符号帳 507は、多重化分離部 501から出力された符号 (F)で指定される固定音源ベクトルを生成し、乗算部 5 09に出力する。

[0032] 乗算部 508は、適応音源ベクトルに量子化適応音源利得を乗算して、加算部 510 に出力する。乗算部 509は、固定音源ベクトルに量子化固定音源利得を乗算して、加算部 510に出力する。加算部 510は、乗算部 508、 509から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルとの加算を行い駆動音源を生成し、これを合成フィルタ 503及び適応音源符号帳 505に出力する。

[0033] LPC復号ィ匕部 502は、多重化分離部 501から出力された符号 (L)から量子化 LP Cを復号ィ匕し、合成フィルタ 503に出力する。合成フィルタ 503は、 LPC復号化部 50 2によって復号化されたフィルタ係数を用いて、加算部 510から出力された駆動音源のフィルタ合成を行い、合成した信号を後処理部 504に出力する。後処理部 504は、合成フィルタ 503から出力された信号に対して、ホルマント強調やピッチ強調といつたような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、基本レイヤ復号化信号として出力する。

[0034] 次に、図 2の拡張レイヤ制御部 205の内部構成及び拡張レイヤ制御部 205による拡張レイヤ符号ィ匕部 206の制御方法について図 6を用いて説明する。拡張レイヤ制御部 205は、量子化歪み算出部 601と、閾値比較部 602と、拡張レイヤモード情報決定部 603と、から主に構成される。

[0035] 量子化歪み算出部 601は、まず、以下の式（1)により、入力した LPC力も LPCケプストラムを、量子化 LPCから量子化 LPCケプストラムをそれぞれ算出する。ここで、式 (1)中の aは、基本レイヤ符号ィ匕部 202から入力される p次の LPC (あるいは量子化 LPC)を表し、 cは、 LPCケプストラム（あるいは量子化 LPCケプストラム）を表す。

[数 1]

[0036] 量子化歪み算出部 601は、次に、以下の式（2)および式（3)により、上記式（1)で算出された LPCケプストラムと量子化 LPCケプストラムとの間の距離 (LPCケプストラム距離 (CD) )を算出する。算出された LPCケプストラム距離は、閾値比較部 602に出力される。ここで、式（2)中の c¹は LPCケプストラムを表し、 c²は量子化 LPCケプストラムを表す。

[数 2]

[数 3]

CD = 101og 10 · · · ( 3 )

[0037] 閾値比較部 602は、量子化歪み算出部 601から出力された LPCケプストラム距離と、内部に保持する予め定められた閾値とを比較し、比較結果を拡張レイヤモード情報決定部 603に出力する。なお、 LPCが 12次程度の場合には、閾値を 1. 0程度とするのが適当である。

[0038] 拡張レイヤモード情報決定部 603は、閾値比較部 602から出力された比較結果に応じて拡張レイヤにおける符号ィ匕モードを決定し、符号化モードを示す拡張レイヤモード情報を拡張レイヤ符号ィ匕部 206に出力する。具体的には、拡張レイヤモード情報決定部 603は、 LPCケプストラム距離が閾値よりも大きいという比較結果の場合、すなわち、 LPCの量子化誤差が大き、場合には拡張レイヤの符号ィ匕モードを Mode Aにし、 LPCケプストラム距離が閾値以下であるという比較結果の場合、すなわち、 L PCの量子化誤差が小さい場合には拡張レイヤの符号ィ匕モードを ModeBにする。 [0039] 次に、図 2の拡張レイヤ符号ィ匕部 206の内部構成について図 7を用いて説明する。前処理部 701は、残差信号に対し、 DC成分を取り除くハイパスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理やプリエンファシス処理を行い、これらの処理後の信号 (Xin)を LPC分析部 702および加算部 705に出力する。

[0040] LPC分析部 702は、 Xinを用いて線形予測分析を行ヽ、分析結果である LPCを LP C量子化部 703に出力する。 LPC量子化部 703は、拡張レイヤ制御部 205から出力される拡張レイヤモード情報を利用して、 LPC分析部 702から出力された LPCの量子化処理を行い、量子化 LPCを合成フィルタ 704に出力するとともに量子化 LPCを表す符号 (L)を多重化部 714に出力する。ここで、 LPC量子化部 703は、拡張レイャモード情報に基づヽて、 LPCの量子化に用いる符号帳 (LPC符号帳)を適宜切り替えるものとする。具体的には、 LPC量子化部 703は、拡張レイヤモード情報が Mo deAすなわち LPCの量子化誤差が大きい場合に予め備えられた LPC符号帳 Aを利用した量子化を行、、拡張レイヤモード情報が ModeBである場合すなわち LPCの量子化誤差が小さい場合に予め備えられた LPC符号帳 Bを利用した量子化を行う。ここで、 LPC符号帳 Bは、 LPC符号帳 Aよりもサイズが小さい符号帳である。なお、本実施の形態では、 LPC符号帳 Bのサイズをゼロ、すなわち拡張レイヤにおいては LP Cを用いな、とすることもできる。

[0041] 合成フィルタ 704は、量子化 LPCに基づくフィルタ係数により、後述する加算部 71 1から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、合成信号を加算部 705に出力する。加算部 705は、合成信号の極性を反転させて X inに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部 712に出力する。

[0042] 適応音源符号帳 706は、過去に加算部 711によって出力された駆動音源をバッファに記憶しており、ノメータ決定部 713から出力された信号により特定される過去の駆動音源から 1フレーム分のサンプルを適応音源ベクトルとして切り出して乗算部 70 9に出力する。量子化利得生成部 707は、パラメータ決定部 713から出力された信号によって特定される量子化適応音源利得と量子化固定音源利得とをそれぞれ乗算部 709と乗算部 710とに出力する。

[0043] 固定音源符号帳群 708は、複数の固定音源符号帳を備え、拡張レイヤ制御部 205 力出力される拡張レイヤモード情報に応じて一つの固定音源符号帳を選択する。具体的には、固定音源符号帳群 708は、拡張レイヤモード情報が ModeAすなわち LPCの量子化誤差が大きい場合に固定音源符号帳 Aを選択し、拡張レイヤモード情報が ModeBである場合すなわち LPCの量子化誤差が小さい場合に固定音源符号帳 Aのサイズよりも大きい固定音源符号帳 Bを選択する。ここで、各フレームにおける固定音源符号帳 Bと固定音源符号帳 Aのサイズ差 (ビット差)が、 LPC符号帳 Aと L PC符号帳 Bのサイズ差 (ビット差)と同じである場合、符号化に利用されるビットレートは等しくなる。例えば、 LPC符号は 1フレーム単位に算出し、固定音源符号は 1Z4 フレーム毎に算出する符号化方式において、 LPC符号帳 Aのサイズが 256、 LPC符号帳 Bのサイズが 16、固定音源符号帳 Aのサイズが 16、固定音源符号帳 Bのサイズが 32という場合がその例に該当する。

[0044] そして、固定音源符号帳群 708は、選択した固定音源符号帳に保存された複数のパルス音源ベクトルの中から、パラメータ決定部 713から出力された信号によって特定される形状を有するパルス音源ベクトルを選択し、そのノルス音源ベクトルを固定音源ベクトルとして乗算部 710に出力する。なお、選択したパルス音源ベクトルに拡散ベクトルを乗算して固定音源ベクトルを生成し、その固定音源ベクトルを乗算部 71 0に出力してもよい。

[0045] 乗算部 709は、量子化利得生成部 707から出力された量子化適応音源利得を、適応音源符号帳 706から出力された適応音源ベクトルに乗じて、加算部 711に出力する。乗算部 710は、量子化利得生成部 707から出力された量子化固定音源利得を、固定音源符号帳群 708から出力された固定音源ベクトルに乗じて、加算部 711に出力する。加算部 711は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをべクトル加算し、加算結果である駆動音源を合成フィルタ 704および適応音源符号帳 70 6に出力する。なお、適応音源符号帳 706に入力された駆動音源は、ノッファに記憶される。

[0046] 聴覚重み付け部 712は、加算部 705から出力された誤差信号に対して聴覚的な重み付けをおこない符号ィ匕歪みとしてパラメータ決定部 713に出力する。パラメータ決定部 713は、聴覚重み付け部 712から出力された符号ィ匕歪みを最小とする適応音源ベクトル、固定音源ベクトル及び量子化利得を、各々適応音源符号帳 706、固定音源符号帳群 708及び量子化利得生成部 707から選択し、選択結果を示す適応音源べ外ル符号 (A)、固定音源べ外ル符号 (F)及び音源利得符号 (G)を多重化部 714に出力する。

[0047] 多重化部 714は、 LPC量子化部 703から量子化 LPCを表す符号 (L)を入力し、パラメータ決定部 713から適応音源ベクトルを表す符号 (A)、固定音源ベクトルを表す符号 (F)および量子化利得を表す符号 (G)を入力し、これらの情報を多重化して拡張レイヤ情報源符号として出力する。

[0048] 次に、図 1の復号ィ匕装置 103の構成について図 8を用いて説明する。復号化装置 1 03は、復号化動作制御部 801と、基本レイヤ復号化部 802と、拡張レイヤ復号化部 803と、制御スィッチ 805と、カロ算咅 804と、力ら主に構成される。

[0049] 復号化動作制御部 801は、符号化装置 101から伝送路 102を介して伝送される符号ィ匕情報を入力する。復号化動作制御部 801は、符号ィ匕情報を、伝送モード情報、拡張レイヤモード情報および各レイヤの情報源符号に分離し、伝送モード情報に応じて制御スィッチ 805のオン Zオフ状態を制御する。また、復号ィ匕動作制御部 801は、基本レイヤ復号化部 802、拡張レイヤ復号化部 803に、それぞれ各レイヤに対応する情報源符号および拡張レイヤモード情報を出力する。具体的には、復号化動作制御部 801は、伝送モード情報が BR2である場合は、制御スィッチ 805をオン状態にし、基本レイヤ情報源符号を基本レイヤ復号ィ匕部 802に、拡張レイヤモード情報および拡張レイヤ情報源符号を拡張レイヤ復号ィ匕部 803に、それぞれ出力する。また、復号化動作制御部 801は、伝送モード情報が BR1である場合は、制御スィッチ 8 05をオフ状態にし、基本レイヤ情報源符号を基本レイヤ復号ィ匕部 802に出力する。またこの時、復号化動作制御部 801は、拡張レイヤ復号ィ匕部 803には何も出力しない。

[0050] 基本レイヤ復号ィ匕部 802は、復号ィ匕動作制御部 801から基本レイヤ情報源符号を入力し、これを CELPタイプの音声復号ィ匕方法により復号ィ匕し、復号化信号を基本レィャ復号ィ匕信号として加算部 804に出力する。なお、図 8の基本レイヤ復号化部 802 の内部構成は、図 5に示した基本レイヤ復号ィ匕部 203の内部構成と同一である。

[0051] 拡張レイヤ復号ィ匕部 803は、制御スィッチ 805がオン状態である場合、復号化動作制御部 801から拡張レイヤモード情報および拡張レイヤ情報源符号を入力し、拡張レイヤモード情報に応じて拡張レイヤ情報源符号を CELPタイプの音声復号ィ匕方法により復号化し、復号化信号を拡張レイヤ復号化信号として加算部 804に出力する。一方、拡張レイヤ復号ィ匕部 803は、制御スィッチ 805がオフ状態である場合、何も動作しない。なお、拡張レイヤ復号ィ匕部 803の構成については後述する。

[0052] 加算部 804は、制御スィッチ 805がオン状態である場合は、基本レイヤ復号化部 8 02から基本レイヤ復号化信号を入力し、また拡張レイヤ復号ィ匕部 803から拡張レイャ復号化信号を入力し、これらの信号を加算した後、これを出力信号として後工程の装置に出力する。一方、加算部 804は、制御スィッチ 805がオフ状態である場合は、基本レイヤ復号化部 802から基本レイヤ復号化信号を入力し、これを出力信号として後工程の装置に出力する。

[0053] 次に、図 8の拡張レイヤ復号ィ匕部 803の内部構成について図 9を用いて説明する。

図 9において、多重化分離部 901は、復号ィ匕動作制御部 801から出力された拡張レィャ情報源符号を個々の符号 (L、 A、 G、 F)に分離する。 LPC符号 (L)は LPC復号化部 902に出力され、適応音源ベクトル符号 (A)は適応音源符号帳 905に出力され、音源利得符号 (G)は量子化利得生成部 906に出力され、固定音源ベクトル符号（ F)は固定音源符号帳群 907に出力される。

[0054] LPC復号ィ匕部 902は、復号ィ匕動作制御部 801から出力された拡張レイヤモード情報を用いて、多重化分離部 901から出力された符号 (L)から量子化 LPCを復号ィ匕し、合成フィルタ 903に出力する。ここで、 LPC復号ィ匕部 902は、拡張レイヤモード情報に基づいて、 LPCの復号ィ匕に用いる符号帳 (LPC符号帳)を適宜切り替える。具体的には、 LPC復号ィ匕部 902は、拡張レイヤモード情報が ModeAである場合には、予め備えられた LPC符号帳 Aを利用した復号ィ匕を行い、拡張レイヤモード情報が ModeBである場合には、予め備えられた LPC符号帳 Bを利用した復号ィ匕を行う。ここで、 LPC符号帳 Bは、 LPC符号帳 Aよりもサイズが小さい符号帳である。なお、本実施の形態では、 LPC符号帳 Bのサイズをゼロ、すなわち拡張レイヤにおいては LP Cを用いな、とすることもできる。

[0055] 適応音源符号帳 905は、多重化分離部 901から出力された符号 (A)で指定される過去の駆動音源から 1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算部 908に出力する。量子化利得生成部 906は、多重化分離部 901から出力された音源利得符号 (G)で指定される量子化適応音源利得と量子化固定音源利得を復号ィ匕し乗算部 908及び乗算部 909に出力する。

[0056] 固定音源符号帳群 907は、複数の固定音源符号帳を備え、復号化動作制御部 80 1から出力される拡張レイヤモード情報に応じて一つの固定音源符号帳を選択する。具体的には、固定音源符号帳群 907は、拡張レイヤモード情報が ModeAである場合に固定音源符号帳 Aを選択し、拡張レイヤモード情報が ModeBである場合に固定音源符号帳 Bを選択する。そして、固定音源符号帳群 907は、選択した固定音源符号帳に保存された複数のパルス音源ベクトルの中から、多重化分離部 901から出力された符号 (F)で指定されるパルス音源ベクトルを選択し、そのパルス音源べタトルを固定音源ベクトルとして乗算部 909に出力する。なお、選択したパルス音源べクトルに拡散ベクトルを乗算して固定音源ベクトルを生成し、その固定音源ベクトルを乗算部 909に出力してもよい。

[0057] 乗算部 908は、適応音源ベクトルに量子化適応音源利得を乗算して、加算部 910 に出力する。乗算部 909は、固定音源ベクトルに量子化固定音源利得を乗算して、加算部 910に出力する。加算部 910は、乗算部 908、 909から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルとをベクトル加算し、加算結果である駆動音源を合成フィルタ 903及び適応音源符号帳 905に出力する。

[0058] 合成フィルタ 903は、 LPC復号ィ匕部 902によって復号ィ匕されたフィルタ係数を用いて、加算部 910から出力された駆動音源のフィルタ合成を行い、合成した信号を後処理部 904に出力する。後処理部 904は、合成フィルタから出力された信号に対して、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、拡張レイヤ復号化信号として出力する。 [0059] 以上説明したように、本実施の形態によれば、スケーラブル符号ィ匕技術を用いて符号ィ匕を行う符号ィ匕装置において、下位の階層の符号ィ匕結果に基づいて、 LPC、固定音源符号などのパラメータ間でのビットアロケーションを変更する等の上位の階層における符号ィ匕方法を柔軟に変更することができるので、下位の階層の符号ィ匕結果と組み合わせた場合により良質な音声信号をユーザに提供する通信システムを実現することができる。

[0060] なお、本実施の形態では、符号化装置において、下位の階層の LPCの歪み (LPC ケプストラム距離)を利用して、上位の階層の符号ィ匕時に、サイズの小さい LPC符号帳を用いることにより LPCに割り当てるビット数を減らすとともに、サイズの大きい固定音源符号帳を用いることにより固定音源符号に割り当てるビットを増やすと!ヽぅ場合を例に挙げて説明した力本発明はこれに限らず、上位の階層の符号ィ匕時に、サイズの大き、LPC符号帳とサイズの小さい固定音源符号帳を用いる場合にっヽても同様に適用される。

[0061] また、本実施の形態では、符号化装置において、下位の階層の LPCの量子化誤差に基づいて上位の階層における符号ィ匕モードを制御する場合を例に挙げて説明したが、本発明はこれに限らず、下位の階層の他のパラメータに基づいて上位の階層における符号ィ匕モードを制御することもできる。以下、例として、下位の階層の合成音の SNR (信号対雑音比）に基づ!/ヽて上位の階層における符号ィ匕モードを制御する場合について説明する。この場合、基本レイヤ符号ィ匕部 202内の合成フィルタ 404 において、 LPC量子化部 403から出力される LPC量子化係数と、適応音源符号帳 4 06から出力される適応音源符号に利得を乗じた値とから合成される合成音の SNR を算出し、これを拡張レイヤ制御部 205内の閾値比較部 602に出力する。閾値比較部 602は、入力された SNRと、内部に予め格納された閾値とを比較し、比較結果を拡張レイヤモード情報決定部 603に出力する。拡張レイヤモード情報決定部 603は、閾値比較部 602から出力された比較結果に応じて拡張レイヤモード情報を決定し、これを拡張レイヤ符号ィ匕部 206に出力する。具体的には、拡張レイヤモード情報決定部 603は、基本レイヤ符号ィ匕部 202から出力される SNRが閾値よりも大きい場合には、拡張レイヤモードを ModeAにし、基本レイヤ符号ィ匕部 202から出力される SN Rが閾値以下である場合には拡張レイヤモードを ModeBにする。

[0062] また、上述した LPCケプストラム距離を用いた拡張レイヤ制御方法、及び利得を乗じた適応音源符号と LPC係数カゝら合成される合成音の SNRを用いた拡張レイヤ制御方法を組合せることにより、上位の階層での符号ィ匕において、 LPC、適応音源符号、固定音源符号という 3つのパラメータ間でのビット調整も可能である。

[0063] (実施の形態 2)

上記実施の形態 1では、下位レイヤ、上位レイヤ共に CELPタイプの符号ィ匕方法を用いるスケーラブル符号ィ匕方式について説明したが、本発明はこれに限らず、上位レイヤにぉ、て CELPタイプ以外の符号ィ匕方法を用いるスケーラブル符号ィ匕方式においても同様に適用できる。実施の形態 2では、下位レイヤにて CELPタイプの符号化を行、、上位レイヤでは変換符号ィ匕を行う場合のスケーラブル符号ィ匕方式に本発明を適用する場合について説明する。本実施の形態に係る符号化装置および復号化装置を有する通信システムは、図 1と同一であるので説明を省略する。

[0064] 図 10は、本実施の形態に係る符号ィ匕装置 101の構成を示すブロック図である。符号化装置 101は、図 10に示すように符号ィ匕動作制御部 1001と、基本レイヤ符号ィ匕部 1002と、拡張レイヤ制御部 1003と、基本レイヤ復号化部 1004と、第 1周波数領域変換部 1005と、遅延部 1006と、第 2周波数領域変換部 1007と、拡張レイヤ符号化部 1008と、多重化部 1009と、から主に構成される。

[0065] 符号ィ匕動作制御部 1001には、伝送モード情報が入力される。符号化動作制御部 1001は、入力した伝送モード情報に応じて、制御スィッチ 1010〜1012のオン/ォフ制御を行う。具体的には、符号ィ匕動作制御部 1001は、伝送モード情報が BR2である場合、制御スィッチ 1010〜： L012を全てオンにする。また、符号化動作制御部 1 001は、伝送モード情報が BR1である場合、制御スィッチ 1010〜1012を全てオフにする。なお、伝送モード情報は、上記のように符号ィ匕動作制御部 1001に入力されるとともに、図 10のように符号ィ匕動作制御部 1001経由力あるいは符号化動作制御部 1001を経由せずに直接、多重化部 1009にも入力される。このように、符号化動作制御部 loo 1が伝送モード情報に応じて制御スィッチ群をオン Zオフ制御することにより、入力信号の符号ィ匕に用いる符号ィ匕部の組み合わせが決定される。 [0066] 基本レイヤ符号ィ匕部 1002は、音声信号等の入力信号に対して CELPタイプの音声符号ィ匕方法を用いて符号ィ匕を行って基本レイヤ情報源符号を生成し、生成した基本レイヤ符号ィ匕情報を多重化部 1009および制御スィッチ 1012に出力する。また、基本レイヤ符号ィ匕部 1002は、入力信号の音声符号ィ匕の際に算出されるパラメータである LPC (線形予測係数)および量子化 LPCを制御スィッチ 1011に出力する。なお、基本レイヤ符号ィ匕部 1002の内部構成は、図 4に示した基本レイヤ符号ィ匕部 202 のものと同一であるので、その説明は省略する。

[0067] 拡張レイヤ制御部 1003は、制御スィッチ 1011がオンのとき、基本レイヤ符号化部 1002から出力された LPCおよび量子化 LPCに基づいて拡張レイヤモード情報を生成し、拡張レイヤモード情報を拡張レイヤ符号ィ匕部 1008および多重化部 1009に出力する。拡張レイヤモード情報とは、拡張レイヤにおける符号ィ匕モードを示す情報であり、復号ィ匕装置において拡張レイヤ符号ィ匕情報を復号ィ匕する際に利用される。なお、拡張レイヤ制御部 1003の内部構成の詳細については後述する。また、拡張レイャ制御部 1003は、制御スィッチ 1011がオフの時には何も動作しない。

[0068] 基本レイヤ復号ィ匕部 1004は、制御スィッチ 1012がオンのとき、基本レイヤ符号ィ匕部 1002から出力された基本レイヤ符号ィ匕情報に対して CELPタイプの音声復号ィ匕方法を用いて復号化を行って基本レイヤ復号化信号を生成し、基本レイヤ復号化信号を第 1周波数領域変換部 1005に出力する。一方、基本レイヤ復号ィ匕部 1004は、制御スィッチ 1012がオフのときには何も動作しない。なお、基本レイヤ復号化部 100 4の内部構成は、図 5の基本レイヤ復号ィ匕部 203のものと同一であるので、その説明は省略する。

[0069] 第 1周波数領域変換部 1005は、基本レイヤ復号化部 1004から入力される基本レィャ復号ィ匕信号に対して修正離散コサイン変換 (MDCT)を行い、周波数領域のパラメータとして得られる基本レイヤ復号ィ匕 MDCT係数を拡張レイヤ符号ィ匕部 1008に出力する。

[0070] 第 1周波数領域変換部 1005は、 N個のノッファを内蔵し、まず、下記の式 (4)に従い、「0」値を用いて各バッファを初期化する。なお、式 (4)において、 buf (n=0、… 、 N— 1)は第 1周波数領域変換部 1005が内蔵している N個のバッファの中の n+ 1 番目を示す,

[数 4] buf_n = 0 (η = 0,···,Ν-ί) (4)

[0071] 次いで、第 1周波数領域変換部 1005は、下記の式 (5)に従い、基本レイヤ復号化信号 xl を修正離散コサイン変換して基本レイヤ復号ィ匕 MDCT係数 XI を求める。

n k

式（5)において、 kは 1フレームにおける各サンプルのインデックスを示す。なお、 xl，は、下記の式 (6)に従い、基本レイヤ復号ィ匕信号 xl とバッファ buf とを結合させたベクトルである。

[数 5]

( 。,·■·, N - 1) . . . (5)

[数 6]

_XV -\^buf" ("厂 ¹) 、 … （₆)

、η = Ν,··-2Ν—、

[0072] 次いで、第 1周波数領域変換部 1005は、下記の式（7)に示すようにバッファ buf ( η=0、 "·、Ν— 1)を更新する。

[数 7] buf_n = xl„ (" = 0,〜N— 1) . . . (7)

[0073] 次いで、第 1周波数領域変換部 1005は、求められた基本レイヤ復号化 MDCT係数 XIを拡張レイヤ符号ィ匕部 1008に出力する。

k

[0074] 遅延部 1006は、制御スィッチ 1010がオンのとき、入力される音声 'オーディオ信号を内蔵のバッファに記憶し、所定時間経過後に音声 ·オーディオ信号を第 2周波数領域変換部 1007に出力する。ここで、所定時間は、基本レイヤ符号ィ匕部 1002、基本レイヤ復号化部 1004、第 1周波数領域変換部 1005、および第 2周波数領域変換部 1007において生じるアルゴリズム遅延を考慮した時間である。また、遅延部 10 06は、制御スィッチ 1010がオフの時には何も動作しない。

[0075] 第 2周波数領域変換部 1007は、制御スィッチ 1010がオンのとき、遅延部 1006から入力される音声 'オーディオ信号に対して MDCTを行い、周波数領域のパラメータとして得られる入力 MDCT係数を拡張レイヤ符号ィ匕部 1008に出力する。ここで、第 2周波数領域変換部 1007における周波数変換方法は、第 1周波数領域変換部 100 5における処理と同様であるため説明を省略する。また、第 2周波数領域変換部 100 7は、制御スィッチ 1010がオフの時には何も動作しない。

[0076] 拡張レイヤ符号化部 1008は、制御スィッチ 1010、 1011、 1012がオンのとき、拡張レイヤ制御部 1003から入力される拡張レイヤモード情報と、第 1周波数領域変換部 1005から入力される基本レイヤ復号ィ匕 MDCT係数および第 2周波数領域変換部 1007から入力される入力 MDCT係数とを用いて拡張レイヤ符号ィ匕を行い、得られる拡張レイヤ符号ィ匕情報を多重化部 1009に出力する。拡張レイヤ符号ィ匕部 1008 の内部の構成および具体的な動作については後述する。また、拡張レイヤ符号化部 1008は、制御スィッチ 1010、 1011、 1012がオフの時には何も動作しない。

[0077] 多重化部 1009は、基本レイヤ符号化部 1002から入力される基本レイヤ符号化情報、拡張レイヤ制御部 1003から入力される拡張レイヤモード情報、拡張レイヤ符号化部 1008から入力される拡張レイヤ符号ィ匕情報、及び符号化動作制御部 1001から入力される伝送モード情報を多重化し、得られるビットストリームを復号ィ匕装置に送信する。

[0078] なお、伝送前符号化情報のデータ構造 (ビットストリーム）につ、ては、実施の形態 1で説明したものと同様であるため、ここでは説明を省略する。

[0079] 次に、図 10の拡張レイヤ制御部 1003の内部構成について図 11を用いて説明する。拡張レイヤ制御部 1003は、量子化歪み算出部 1101と、拡張レイヤモード情報決定部 1102と、から主に構成される。

[0080] 量子化歪み算出部 1101は、まず上記式（1)により、入力した LPC力 LPCケプストラムを、量子化 LPCから量子化 LPCケプストラムをそれぞれ算出し、次に、上記式（ 2)及び式（3)により、式（1)で算出された LPCケプストラムと量子化 LPCケプストラムとの間の距離 (LPCケプストラム距離 (CD) )を算出し、算出した LPCケプストラム距離を拡張レイヤモード情報決定部 1102に出力する。

[0081] 拡張レイヤモード情報決定部 1102は、量子化歪み算出部 1101から出力された L PCケプストラム距離と、内部に保持する予め定められた閾値とを比較し、その比較結果に応じて拡張レイヤにおける符号ィ匕モードを決定し、符号化モードを示す拡張レイャモード情報を拡張レイヤ符号ィ匕部 1008に出力する。具体的には、拡張レイヤモード情報決定部 1102は、 LPCケプストラム距離が閾値よりも大きいという比較結果の場合、すなわち、 LPCの量子化誤差が大きい場合には拡張レイヤの符号ィ匕モードを M odeAにし、 LPCケプストラム距離が閾値以下であるという比較結果の場合、すなわち、 LPCの量子化誤差が小さい場合には拡張レイヤの符号ィ匕モードを ModeBにする。なお、 LPCが 12次程度の場合には、閾値を 1. 0程度とするのが適当である。

[0082] 次に、図 10の拡張レイヤ符号ィ匕部 1008の内部構成について図 12を用いて説明する。拡張レイヤ符号ィ匕部 1008は、残差 MDCT係数算出部 1201と、帯域選択部 1 202と、シエイプ量子ィ匕咅 1203と、ゲイン量子ィ匕咅 1204と、多重ィ匕咅 1205と、から主に構成される。

[0083] 残差 MDCT係数算出部 1201は、第 1周波数領域変換部 1005から入力される基本レイヤ復号ィ匕 MDCT係数 XIと第 2周波数領域変換部 1007から入力される入力

k

MDCT係数 Xとの残差を求め、残差 MDCT係数 X2として帯域選択部 1202に出

k k

力する。

[0084] 帯域選択部 1202は、まず、残差 MDCT係数を複数のサブバンドに分割する。ここでは、 J Ciは自然数)個のサブバンドに均等に分割する場合を例に説明する。帯域選択部 1202は、 J個のサブバンドの中で連続する L (Lは自然数)個のサブバンドを選択し、 M (Mは自然数)種類のサブバンドのグループを得る。以下、この M種類のサブバンドのグノレープをリージョンと呼ぶ。

[0085] 次いで、帯域選択部 1202は、下記の式（8)に従い、 M種類の各リージョンの平均エネルギ E (m)を算出する。

[数 8] E(m) 1 1 (w = 0, ---, - l) ( 8 )

L

[0086] この式にぉ、て、 j ίお個の各サブバンドのインデックスを示し、 mは、 M種類の各リ一ジョンのインデックスを示す。なお、 S (m)は、リージョン mを構成する L個のサブバンドのインデックスのうちの最小値を示し、 B (j)は、サブバンド jを構成する複数の MD CT係数のインデックスのうちの最小値を示す。 W(j)は、サブバンド jのバンド幅を示し、以下の説明では、 J個の各サブバンドのバンド幅が全て等しい場合、すなわち W( j)が定数である場合を例にとって説明する。

[0087] 次、で、帯域選択部 1202は、平均エネルギ E (m)が最大となるリージョン、例えばサブバンド j "〜； T+L—1からなる帯域を量子化対象となる帯域 (量子化対象帯域)として選択し、このリージョンを示すインデックス m— maxを帯域情報としてシエイプ量子化部 1203、ゲイン量子化部 1204、および多重化部 1205に出力する。また、帯域選択部 1202は、残差 MDCT係数をシエイプ量子化部 1203に出力する。なお、残差 MDCT係数は、上記のように帯域選択部 1202に入力されるとともに、図 12のように、帯域選択部 1202経由力あるいは帯域選択部 1202を経由せずに直接、シエイプ量子化部 1203にも入力される。

[0088] シエイプ量子化部 1203は、帯域選択部 1202から入力される帯域情報 m— maxが示す帯域に対応する残差 MCDT係数に対して、拡張レイヤ制御部 1003から入力される拡張レイヤモード情報を利用して、サブバンド毎にシエイプ量子化を行う。具体的には、シエイプ量子化部 1203は、拡張レイヤモード情報が ModeAの場合には、 L 個の各サブバンド毎に、 SQA個のシエイプコードベクトルからなる内蔵のシエイプコードブックを探索して下記の式（9)の結果が最大となるシエイプコードベクトルのインデッタスを求める。

[数 9]

Shape一 q

[0089] この式（9)にお!/、て、 SCはシエイプコードブックを構成するシエイプコードベクトル k を示し、 iはシエイプコードベクトルのインデックスを示し、 kはシエイプコードベクトルの要素のインデックスを示す。

[0090] また、シエイプ量子化部 1203は、拡張レイヤモード情報が ModeBの場合には、 L 個の各サブバンド毎に、 SQB (SQBく SQA)個のシエイプコードベクトルからなる内蔵のシエイプコードブックを探索して下記の式（10)の結果が最大となるシエイプコードベクトルのインデックスを求める。

[数 10]

Shape _ q(f) =

[0091] シエイプ量子化部 1203は、上記の式（9)あるいは式（10)の結果が最大となるシェィプコードベクトルのインデックス S— maxをシエイプ符号化情報として多重化部 120 5に出力する。また、シエイプ量子化部 1203は、下記の式（11)に従い、理想ゲイン値 Gain— i (j )を算出してゲイン量子化部 1204に出力する。

[数 11]

^Λ k+BU) "し }

Gain_i(j) = ，…， + — ( 1 1 )

、、 ^ max ^ ー max

[0092] ゲイン量子化部 1204は、シヱイプ量子化部 1203から入力される理想ゲイン値 Gai n_i (j)に対して、拡張レイヤ制御部 1003から入力される拡張レイヤモード情報を利用して、ゲイン値のベクトル量子化を行う。具体的には、ゲイン量子化部 1204は、拡張レイヤモード情報が ModeAの場合には、理想ゲイン値を L次元ベクトルとして扱ヽ、 GQA個のゲインコードベクトルからなる内蔵のゲインコードブックを探索して下記の式（12)を最小にするコードブックのインデックスを求める。なお、上記の式（12)を最小にするコードブックのインデックスを G—minと記す。

[数 12] Gain _ q{i) = ^ ^J inJ + f) - GC) } (i = 0, -, GQA - l) . . . ( 1 2 )

[0093] また、ゲイン量子化部 1204は、拡張レイヤモード情報が ModeBの場合には、理想ゲイン値を L次元ベクトルとして扱!、、 GQB (CQB< CQA)個のゲインコードベクトル力なる内蔵のゲインコードブックを探索して下記の式（13)を最小にするコードブックのインデックスを求める。

[数 13]

Gain _ q(i) = ^ in _ i(j + j" ) - GC) } (i = 0, - - -, GQB - ί) . . . ( 1 3 )

[0094] ゲイン量子化部 1204は、式（12)あるいは式（13)の結果が最小となるゲインコードベクトルのインデックス G—minをゲイン符号ィ匕情報として多重化部 1205に出力する

[0095] 多重化部 1205は、帯域選択部 1202から入力される帯域情報 m—max、シエイプ量子化部 1203から入力されるシエイプ符号ィ匕情報 S—max、ゲイン量子化部 1204 力入力されるゲイン符号ィ匕情報 G—minを多重化し、得られるビットストリームを拡張レイヤ符号ィ匕情報として多重化部 1009に出力する。なお、これら情報を、多重化部 1205で多重化せず、多重化部 1009に直接入力して、多重化部 1009で多重化してちよい。

[0096] 図 13は、本実施の形態に係る復号化装置 103の主要な構成を示すブロック図である。図 13において、復号ィ匕装置 103は、分離部 1301と、基本レイヤ復号化部 1302 と、周波数領域変換部 1303と、復号化動作制御部 1304と、拡張レイヤ復号ィ匕部 13 05と、時間領域変換部 1306と、から主に構成される。

[0097] 分離部 1301は、符号ィ匕装置 101から伝送されるビットストリーム力も基本レイヤ符号化情報、拡張レイヤ符号化情報、伝送モード情報、及び拡張レイヤモード情報を分離し、基本レイヤ符号ィ匕情報を基本レイヤ復号ィ匕部 1302に出力し、拡張レイヤモード情報及び拡張レイヤ符号ィ匕情報を拡張レイヤ復号ィ匕部 1305に出力し、伝送モード情報を復号化動作制御部 1304に出力する。 [0098] 基本レイヤ復号ィ匕部 1302は、分離部 1301から出力された基本レイヤ符号ィ匕情報に対して CELPタイプの音声復号ィ匕方法を用いて復号ィ匕を行って基本レイヤ復号ィ匕信号を生成し、基本レイヤ復号ィ匕信号を周波数領域変換部 1303及び制御スィッチ 1307に出力する。なお、基本レイヤ復号ィ匕部 1302の内部構成は、図 5の基本レイャ復号ィ匕部 203のものと同一であるので、その説明は省略する。

[0099] 周波数領域変換部 1303は、基本レイヤ復号化部 1302から入力される基本レイヤ復号ィ匕信号に対して修正離散コサイン変換 (MDCT)を行い、周波数領域のパラメータとして得られる基本レイヤ復号ィ匕 MDCT係数を拡張レイヤ復号ィ匕部 1305に出力する。

[0100] 復号ィ匕動作制御部 1304は、分離部 1301から入力される伝送モード情報に応じて制御スィッチ 1307のオン Zオフの動作と、周波数領域変換部 1303、拡張レイヤ復号ィ匕部 1305、時間領域変換部 1306の動作を制御する。具体的には、伝送モード情報が BR2であった場合、復号化動作制御部 1304は、周波数領域変換部 1303、拡張レイヤ復号ィ匕部 1305、時間領域変換部 1306の動作をオン状態にし、また制御スィッチ 1307を時間領域変換部 1306側に接続する。また、伝送モード情報が BR1 であった場合、復号化動作制御部 1304は、周波数領域変換部 1303、拡張レイヤ復号化部 1305、時間領域変換部 1306の動作をオフ状態にし、また制御スィッチ 13 07を基本レイヤ復号ィ匕部 1302側に接続する。このように、復号ィ匕動作制御部 1304 が伝送モード情報に応じて制御スィッチ、及び処理ブロックをオン Zオフ制御することにより、符号ィ匕情報の復号ィ匕に用いる符号ィ匕部の組み合わせが決定される。

[0101] 拡張レイヤ復号ィ匕部 1305は、分離部 1301から拡張レイヤ符号ィ匕情報及び拡張レィャモード情報が入力され、また周波数領域変換部 1303から基本レイヤ復号ィ匕 M DCT係数 X"lが入力される。拡張レイヤ復号ィ匕部 1305は、復号化動作制御部 13

k

04によりオン状態に制御されているとき、入力された情報から、加算 MDCT係数 X"

k を算出し、これを時間領域変換部 1306に出力する。拡張レイヤ復号ィ匕部 1305は、復号ィ匕動作制御部 1304によりオフ状態に制御されているときは何も動作しない。拡張レイヤ復号ィ匕部 1305の処理の詳細につ、ては、後述する。

[0102] 時間領域変換部 1306は、復号ィ匕動作制御部 1304によりオン状態に制御されているとき、拡張レイヤ復号部 1305から入力される加算 MDCT係数 X"に対して IMD

k

CTを行ヽ、時間領域成分として得られる復号化信号を制御スィッチ 1307に出力する。時間領域変換部 1306は、復号ィ匕動作制御部 1304によりオフ状態に制御されているときは何も動作しない。

[0103] 以下、時間領域変換部 1306がオン状態に制御されているときの処理を説明する。

時間領域変換部 1306は、バッファ buf'を内部に有し、式（14)により初期化される。

k

[数 14] buf = 0 ( 0,'"，N - 1) . . . ( 1 4 )

[0104] 時間領域変換部 1306は、拡張レイヤ復号ィ匕部 1305から入力される加算レイヤ復号 MDCT係数 X"を用いて、下記の式（15)に従い拡張レイヤ復号ィ匕信号 Yを求め

k n る。この式（15)〖こおいて、 X，は、復号 MDCT係数 X"とバッファ buf とを結合させ

k k

たベクトルであり、下記の式（ 16)を用、て求められる。

[数 15]

[数 16]

[0105] 次いで、時間領域変換部 1306は、下記の式（17)に従いバッファ buf' を更新す

k

る。

[数 17] = X ( = 0 ..N— 1) · · · ( 1 7 )

[0106] 時間領域変換部 1306は、求められる拡張レイヤ復号ィ匕信号 Yを制御スィッチ 130 7に出力する。 [0107] 制御スィッチ 1307は、復号ィ匕動作制御部 1304の制御に基づいて、基本レイヤ復号ィ匕部 1302から出力された基本レイヤ復号ィ匕信号あるいは時間領域変換部 1306 力出力された拡張レイヤ復号ィ匕信号を出力信号として出力する。

[0108] 図 14は、拡張レイヤ復号ィ匕部 1305の内部構成を示す図である。拡張レイヤ復号化部 1305は、分離部 1401と、シエイプ逆量子化部 1402と、ゲイン逆量子化部 140 3と、加算 MDCT係数算出部 1404と、から主に構成される。

[0109] 分離部 1401は、分離部 1301から入力される拡張レイヤ符号ィ匕情報力も帯域情報、シエイプ符号化情報、及びゲイン符号化情報を分離し、帯域情報及びシエイプ符号化情報をシエイプ逆量子化部 1402に、ゲイン符号化情報をゲイン逆量子化部 14 03に出力する。なお、分離部 1401を設けずに、分離部 1301でこれら情報を分離して、これら情報を直接、シエイプ逆量子化部 1402、ゲイン逆量子化部 1403に入力してもよい。

[0110] シエイプ逆量子化部 1402は、シエイプ量子化部 1203が備えるシエイプコードブックと同様なシエイプコードブックを内蔵し、分離部 1401から入力されるシエイプ符号化情報 S— maxをインデックスとするシエイプコードベクトルを探索する。この時、シェイブ逆量子化部 1402は、分離部 1401から入力される拡張レイヤモード情報が Mod eAの時には、 SQA個のシエイプコードベクトルからなる内蔵のシエイプコードブックを探索し、探索されたコードベクトルを分離部 1401から入力される帯域情報 m_ma_X が示す量子化対象帯域の MDCT係数のシエイプの値としてゲイン逆量子化部 1403 に出力する。また、シエイプ逆量子化部 1402は、分離部 1401から入力される拡張レィャモード情報が ModeBの時には、 SQB個のシエイプコードベクトルからなる内蔵のシエイプコードブックを探索し、探索されたコードベクトルを、分離部 1401から入力される帯域情報 m— maxが示す量子化対象帯域の MDCT係数のシェイブの値としてゲイン逆量子化部 1403に出力する。ここでは、シェイブの値として探索されたシェィプコードベクトルを Shape— q (k) (k=B (j") , · ··, B (j" + L)— 1)と記す。

[0111] ゲイン逆量子化部 1403は、ゲイン量子化部 1204と同様なゲインコードブックを内蔵しており、下記の式（18)に従いゲインの値を逆量子化する。ここでは、ゲイン値を L次元ベクトルとして扱い、ベクトル逆量子化を行う。このとき、ゲイン逆量子化部 140 3は、分離部 1401から入力される拡張レイヤモード情報が ModeAの時には、 GQA 個のゲインコードベクトルからなる内蔵のゲインコードブックを探索し、ゲインの逆量子化を行う。また、ゲイン逆量子化部 1403は、分離部 1401から入力される拡張レイャモード情報が ModeBの時には、 GQB個のゲインコードベクトルからなる内蔵のゲインコードブックを探索し、ゲインの逆量子化を行う。

[数 18]

Gam_q'(j + f) = GC°-^mm (ゾ= 0，. - - ー1，) . . . （1 8 )

[0112] 次いで、ゲイン逆量子化部 1403は、逆量子化で得られるゲイン値、およびシエイプ逆量子化部 1402から入力されるシェイブの値を用いて、下記の式（19)に従い拡張レイヤ MDCT係数を算出する。ここでは、算出された復号 MDCT係数を X"と記す。

k

[数 19]

Gain q' (ゾ) - Shape q' (k) ( 1 9 )

[0113] ゲイン逆量子化部 1403は、上記の式（19)に従い算出された拡張レイヤ MDCT係数 X"2を加算 MDCT係数算出部 1404に出力する。

k

[0114] 加算 MDCT係数算出部 1404は、周波数領域変換部 1303から入力される基本レィャ復号 MDCT係数 X"lと、ゲイン逆量子化部 1403から入力される拡張レイヤ復

k

号 MDCT係数 X"2とを加算し、得られる加算結果を加算 MDCT係数 X" として時

k k

間領域変換部 1306に出力する。

[0115] 以上説明したように、本実施の形態によれば、下位レイヤで CELPタイプの符号ィ匕方法を用い、上位レイヤでは変換符号ィ匕方法を用いる場合のスケーラブル符号ィ匕方式にぉ、て、下位レイヤの符号ィ匕結果に応じて上位レイヤの符号ィ匕方法 (ビットァロケーシヨン)を切り替えることにより、良好な品質の出力信号を提供することができる。

[0116] また、本実施の形態では、符号化装置において、下位の階層の LPCの量子化誤差に基づいて上位の階層における符号ィ匕モードを制御する場合を例に挙げて説明したが、本発明はこれに限らず、下位の階層の他のパラメータに基づいて上位の階層における符号ィ匕モードを制御することもできる。以下、例として、下位の階層の合成音の SNR (信号対雑音比）に基づ!/ヽて上位の階層における符号ィ匕モードを制御する場合について説明する。この場合、基本レイヤ符号ィ匕部 1002内の合成フィルタ 404 において、 LPC量子化部 403から出力される LPC量子化係数と、適応音源符号帳 4 06から出力される適応音源符号に利得を乗じた値とから合成される合成音の SNR を算出し、これを拡張レイヤ制御部 1003内の拡張レイヤモード情報決定部 1102に出力する。拡張レイヤモード情報決定部 1102は、入力された SNRと、内部に予め格納された閾値とを比較し、比較結果に応じて拡張レイヤモード情報を決定し、これを拡張レイヤ符号ィ匕部 1008に出力する。具体的には、拡張レイヤモード情報決定部 1 102は、基本レイヤ符号ィ匕部 1002から出力される SNRが閾値よりも大きい場合には、拡張レイヤモードを ModeAにし、基本レイヤ符号ィ匕部 1002から出力される SNR が閾値以下である場合には拡張レイヤモードを ModeBにする。

[0117] また、拡張レイヤモードの決定方法は、逆でも構わない。つまり、基本レイヤ符号ィ匕部 1002から出力される SNRが閾値よりも大きい場合には、拡張レイヤモードを Mod eB〖こし、基本レイヤ符号ィ匕部 1002から出力される SNRが閾値以下である場合には拡張レイヤモードを ModeAにしてもよ!、。

[0118] なお、本実施の形態では、符号化装置において、下位レイヤで CELPタイプの符号化を行い、上位レイヤで変換符号ィ匕を行う場合について説明したが、本発明はこれに限らず、上位レイヤにおいて LPCパラメータを量子化し、さらに音源成分について変換符号ィ匕を行う場合に対しても同様に適用できる。具体的には、下位レイヤの C Dの大きさに応じて、上位レイヤの LPCパラメータに割り当てるビットと、音源成分の変換符号ィ匕に割り当てるビットを変更する、という例が挙げられる。

[0119] (実施の形態 3)

実施の形態 2では、下位レイヤで CELPタイプ符号ィ匕を行い、上位レイヤで変換符号ィ匕を行うスケーラブル符号ィ匕方式にぉ、て、下位レイヤの符号ィ匕結果を利用して上位レイヤの符号ィ匕方法 (ビットアロケーション)を変更する場合について説明した。その中で、下位レイヤの符号ィ匕結果として LPCパラメータの符号ィ匕歪みを利用する場合について説明したが、本発明はこれに限らず、下位レイヤの符号ィ匕結果としてピツチゲインの大きさなどのピッチに関する情報を利用して上位レイヤの符号ィ匕方法を変更する場合に対しても同様に適用できる。

[0120] 実施の形態 3では、下位レイヤにて CELPタイプの符号ィ匕を行い、上位レイヤでは変換符号化を行う場合のスケーラブル符号化方式に対して、下位レイヤにおいて算出されたピッチゲインの大きさを利用して上位レイヤの符号ィ匕方法を変更する場合について説明する。なお、本実施の形態に係る符号化装置および復号化装置を有する通信システムは、図 1と同一であるので説明を省略する。

[0121] 図 15は、本実施の形態に係る符号ィ匕装置 101aの構成を示すブロック図である。なお、図 15において、図 10と共通する部分には、図 10と同一の符号を付して説明を省略する。

[0122] 図 15に示す符号ィ匕装置 101aは、基本レイヤ符号ィ匕部 1502が制御スィッチ 1011 経由にて拡張レイヤ制御部 1503に量子化適応音源利得を出力する点で、図 10のものと異なる。また、図 15に示す符号ィ匕装置 101aは、拡張レイヤ制御部 1503の内部構成が、図 10の拡張レイヤ制御部 1003と異なる。また、図 15に示す符号化装置 10 laは、拡張レイヤ制御部 1503が、拡張レイヤモード情報を拡張レイヤ符号ィ匕部 1 008のみに出力する点で、図 10と異なる。また、図 15に示す符号ィ匕装置 101aは、多重化部 1509が、多重化する情報の数が異なる点で、図 10と異なる。

[0123] 図 16は、図 15の拡張レイヤ制御部 1503の内部構成を示す図である。拡張レイヤ制御部 1503は、ピッチ情報判定部 1601と、拡張レイヤモード情報決定部 1602と、から主に構成される。

[0124] ピッチ情報判定部 1601は、入力した量子化適応音源利得の値の絶対値を算出し、これを絶対値量子化適応音源利得として、拡張レイヤモード情報決定部 1602に出力する。

[0125] 拡張レイヤモード情報決定部 1602は、ピッチ情報判定部 1601から入力される絶対値量子化適応音源利得と、内部に保持する予め定められた閾値とを比較し、その比較結果に応じて拡張レイヤにおける符号ィ匕モードを決定し、符号化モードを示す拡張レイヤモード情報を拡張レイヤ符号ィ匕部 1008に出力する。具体的には、拡張レィャモード情報決定部 1602は、絶対値量子化適応音源利得が閾値よりも大きいという比較結果の場合、すなわち、音源成分の周期性が高い場合には拡張レイヤの符号ィ匕モードを ModeAにし、絶対値量子化適応音源利得が閾値以下であると!/、う比較結果の場合、すなわち、音源成分の周期性が低い場合には拡張レイヤの符号ィ匕モードを ModeBにする。

[0126] 図 17は、本実施の形態に係る復号ィ匕装置 103aの主要な構成を示すブロック図である。なお、図 17において、図 13と共通する部分には、図 13と同一の符号を付して説明を省略する。

[0127] 図 17の復号ィ匕装置 103aは、図 13に対して、拡張レイヤ制御部 1708を追カロした構成をとる。また、図 17の復号ィ匕装置 103aでは、分離部 1701から拡張レイヤ復号化部 1305に拡張レイヤモード情報は入力されず、図 13にお、て分離部 1301から拡張レイヤ復号ィ匕部 1305に拡張レイヤモード情報が入力される処理が、まず基本レィャ復号化部 1302から拡張レイヤ制御部 1708に量子化適応音源利得が入力され、次に拡張レイヤ制御部 1708から拡張レイヤ復号ィ匕部 1305に拡張レイヤモード情報が入力される処理に置き換わる。

[0128] また、拡張レイヤ制御部 1708の内部構成は、拡張レイヤ制御部 1503と同一であるため、説明を省略する。

[0129] 以上説明したように、本実施の形態によれば、下位レイヤで CELPタイプの符号ィ匕方法を用い、上位レイヤでは変換符号ィ匕方法を用いる場合のスケーラブル符号ィ匕方式において、下位レイヤの符号化結果 (量子化適応音源利得）に応じて上位レイヤの符号ィ匕方法 (ビットアロケーション)を切り替えることにより、良好な品質の出力信号を提供することができる。具体的には、下位レイヤの符号ィ匕結果から、量子化対象の信号の周期性が高い場合には、上位レイヤにおいて、シェイブの量子化に割り当てるビットを多くし、量子化対象の信号の周期性が低い場合には、上位レイヤにおいて、シェイブの量子化に割り当てるビットを少なくすることによって、より効率的に符号化を行うことができる。なお、以上の構成を採る場合には、実施の形態 2で説明した場合と異なり、ビットストリームに拡張レイヤモード情報を含める必要がなぐより低ビットレートで符号ィ匕することが可能である。

[0130] また、本実施の形態では、下位レイヤの符号ィ匕結果として、量子化適応音源利得を利用して上位レイヤの符号ィ匕方法を切り替える場合について説明したが、本発明はこれに限らず、下位レイヤで算出した適応音源ベクトルと、量子化対象の駆動音源ベクトルとから算出できる理想的な適応音源利得を使って上位レイヤの符号ィ匕方法を切り替える場合についても同様に適用できる。なお、この手法を採る場合には、符号化装置側の拡張レイヤ符号化部 1008から多重化部 1509に拡張レイヤモード情報を伝送する必要がある。また、この場合は、復号化装置側では、拡張レイヤ復号化部 1305は、分離部 1701から拡張レイヤモード情報を得るため、拡張レイヤ制御部 1 708を備える必要はない。

[0131] また、本発明の実施の形態では、符号化装置において、下位の階層の符号ィ匕結果である量子化適応音源利得を予め定められた一定の閾値と比較する場合について説明したが、本発明はこれに限らず、適応音源符号、固定音源符号、あるいはゲインなどのパラメータの歪みを利用する場合にも適用することができる。例えば、適応音源符号を利用する場合、下位レイヤの符号化結果である適応音源符号が示すピッチ周期の大きさに応じて、上位レイヤの符号ィ匕方法を切り替える場合が挙げられる。具体的には、下位レイヤの符号ィ匕結果である適応音源符号が示すピッチ周期がある閾値以下の場合、つまり量子化対象の信号の周期性が高い場合には、拡張レイヤモード情報を ModeAとし、上位レイヤにおけるシエイプの量子化に割り当てるビットを多くし、閾値よりも大きい場合、つまり量子化対象の信号の周期性が低い場合には、拡張レイヤモード情報を ModeBとし、上位レイヤにおけるシェイブの量子化に割り当てるビットを少なくする、という方法が考えられる。

[0132] なお、当然、拡張レイヤモード情報を決定する条件が逆であっても構わない。つまり、下位レイヤの符号ィヒ結果である適応音源符号が示すピッチ周期がある閾値以下の場合には拡張レイヤモード情報を ModeBとし、閾値よりも大き!/、場合には拡張レイヤモード情報を ModeAとしてもよい。この構成は、上述した構成において、利用する符号ィ匕結果が、量子化適応音源利得力適応音源符号に置き換わっただけであるため、ここでは説明を省略する。

[0133] また、本実施の形態では、下位レイヤの符号ィ匕結果である量子化適応音源利得が閾値よりも大きい場合には拡張レイヤモード情報を ModeAとし、閾値より小さい場合には拡張レイヤモード情報を ModeBとする場合について説明した力本発明はこれに限らず、下位レイヤの符号ィ匕結果である量子化適応音源利得が閾値よりも大きい場合には拡張レイヤモード情報を ModeBとし、閾値より小さ!/、場合には拡張レイヤモード情報を ModeAとする場合についても同様に適用できる。

[0134] (実施の形態 4)

実施の形態 2では、下位レイヤで CELPタイプ符号ィ匕を行い、上位レイヤで変換符号ィ匕を行うスケーラブル符号ィ匕方式にぉ、て、下位レイヤの符号ィ匕結果を利用して上位レイヤの符号ィ匕方法 (ビットアロケーション)を変更する場合について説明した。上述した説明では、下位レイヤと上位レイヤで量子化する帯域が同一であることを前提として説明したが、本発明はこれに限らず、下位レイヤと上位レイヤで量子化する帯域が異なる場合に対しても同様に適用できる。

[0135] 実施の形態 4では、下位レイヤと上位レイヤで量子化する帯域が異なる場合にお!ヽて、下位レイヤの符号ィ匕結果に応じて上位レイヤの符号ィ匕方法を切り替える構成について説明する。なお、本実施の形態に係る符号化装置および復号化装置を有する通信システムは、図 1と同一であるので説明を省略する。

[0136] 図 18は、本実施の形態に係る符号ィ匕装置 101bの構成を示すブロック図である。なお、図 18において、図 10と共通する部分には、図 10と同一の符号を付して説明を省略する。

[0137] 図 18の符号化装置 101bは、図 10に対して、ダウンサンプリング部 1813及びアツプサンプリング部 1814を追加した構成を採る。

[0138] ダウンサンプリング部 1813は、入力信号に対してダウンサンプリング処理を行い、入力信号のサンプリング周波数を Ratelから Rate2に変換し (Ratel >Rate2)、基本レイヤ符号ィ匕部 1002に出力する。

[0139] アップサンプリング部 1814は、基本レイヤ復号化部 1004から入力される基本レイャ復号化信号に対してアップサンプリング処理を行ヽ、基本レイヤ復号化信号のサンプリング周波数を Rate2から Ratelに変換して第 1周波数領域変換部 1005に出力する。

[0140] 図 19は、本実施の形態に係る復号ィ匕装置 103bの構成を示すブロック図である。なお、図 19において、図 13と共通する部分には、図 13と同一の符号を付して説明を省略する。

[0141] 図 19の復号化装置 103bは、図 13に対して、アップサンプリング部 1908を追加した構成を採る。

[0142] アップサンプリング部 1908は、基本レイヤ復号化部 1302から入力される基本レイャ復号化信号に対してアップサンプリング処理を行ヽ、基本レイヤ復号化信号のサンプリング周波数を Rate2から Ratelに変換し、周波数領域変換部 1303に出力する。

[0143] 以上説明したように、本実施の形態によれば、下位レイヤで CELPタイプの符号ィ匕方法を用い、上位レイヤでは変換符号ィ匕方法を用い、さらに下位レイヤと上位レイヤの帯域が異なる場合のスケーラブル符号ィ匕方式にぉヽて、下位レイヤの符号ィ匕結果に応じて上位レイヤの符号ィ匕方法 (ビットアロケーション)を切り替えることにより、良好な品質の出力信号を提供することができる。

[0144] また、本実施の形態では、符号化装置において、下位の階層の LPCの量子化誤差に基づいて上位の階層における符号ィ匕モードを制御する場合を例に挙げて説明したが、本発明はこれに限らず、下位の階層の他のパラメータに基づいて上位の階層における符号ィ匕モードを制御することもできる。以下、例として、下位の階層の合成音の SNR (信号対雑音比）に基づ!/ヽて上位の階層における符号ィ匕モードを制御する場合について説明する。この場合、基本レイヤ符号ィ匕部 1002内の合成フィルタ 404 において、 LPC量子化部 403から出力される LPC量子化係数と、適応音源符号帳 4 06から出力される適応音源符号に利得を乗じた値とから合成される合成音の SNR を算出し、これを拡張レイヤ制御部 1003内の拡張レイヤモード情報決定部 1102に出力する。拡張レイヤモード情報決定部 1102は、入力された SNRと、内部に予め格納された閾値とを比較し、比較結果に応じて拡張レイヤモード情報を決定し、これを拡張レイヤ符号ィ匕部 1008に出力する。具体的には、拡張レイヤモード情報決定部 1 102は、基本レイヤ符号ィ匕部 1002から出力される SNRが閾値よりも大きい場合には、拡張レイヤモードを ModeAにし、基本レイヤ符号ィ匕部 1002から出力される SNR が閾値以下である場合には拡張レイヤモードを ModeBにする。

[0145] また、拡張レイヤモードの決定方法は、逆でも構わない。つまり、基本レイヤ符号ィ匕部 1002から出力される SNRが閾値よりも大きい場合には、拡張レイヤモードを Mod eB〖こし、基本レイヤ符号ィ匕部 1002から出力される SNRが閾値以下である場合には拡張レイヤモードを ModeAにしてもよ!、。

[0146] なお、上記各実施の形態では、符号化装置において、下位の階層の符号ィヒ結果を利用して、上位の階層の符号ィ匕時に異なるサイズの符号帳を用いることにより符号化情報のビットアロケーションを変更する場合について説明したが、本発明は、符号帳のサイズ変更に留まらず、下位の階層の符号ィ匕結果と組み合わせた場合により良質な音声信号をユーザに提供するために、パラメータの取捨選択を含む、上位の階層における符号化方法を切り替える場合、あるヽは上位の階層におヽて同じサイズである別の符号帳と合わせた複数の符号帳から利用する符号帳を切り替えて選択する場合にち適用することがでさる。

[0147] また、上記各実施の形態では、符号化装置において、符号ィ匕に用いる情報量はほぼ一定と、う条件で符号ィ匕情報のビットアロケーションを変更する場合にっ、て説明したが、本発明はこれに限らず、符号ィ匕に用いることのできる情報量をある程度変更することが出来る場合にも同様に適用される。例えば、システム側、あるいはユーザ側からの指示等によりある閾値 (SNR等）が定められる場合においては、上述した拡張レイヤ制御方法により、その閾値を満たし、かつ最低限の情報量で入力信号を符号ィ匕することも可能である。これにより、回線使用率を抑えつつ、システムあるいはュ一ザの要求を満たす柔軟な符号ィ匕装置 ·方法を実現することができる。

[0148] また、上記各実施の形態では、符号化装置において、下位の階層の符号化結果である LPCケプストラム距離を予め定められた一定の閾値と比較する場合について説明したが、本発明はこれに限らず、 LPCの次数などの符号ィ匕方法に基づく値、ユーザ指示および回線状況に等応じて閾値を動的に変化させる場合にも適用することができる。

[0149] また、本発明は階層を限定するものではなぐ複数階層で構成された階層的な信号符号ィ匕または復号ィ匕方法において、下位レイヤでの入力信号と出力信号との差である残差信号を上位レイヤで符号ィ匕する全ての場合について適用することができる。

[0150] また、本発明を、コンピュータに信号処理動作を行わせる信号処理プログラムに適用することもできる。また、この信号処理プログラムを、メモリ、ディスク、テープ、 CD、 DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用 ·効果を得ることがでさる。

[0151] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部または全てを含むように 1チップィ匕されても良い。また、ここでは LSIとした力集積度の違いによって、 IC、システム LSI、スーパー LSI、ウルトラ LSI等と呼称されることもある。また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Progra mmable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギユラブル'プロセッサを利用しても良い。さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行っても良い。バイオ技術の適用等が可能性としてあり得る。

[0152] 2006年 3月 10曰出願の特願 2006— 066771および 2007年 2月 13曰出願の特願 2007— 032746の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

産業上の利用可能性

[0153] 本発明は、スケーラブル符号ィ匕技術を用いた通信システムにおける符号ィ匕装置、復号化装置に用いるに好適である。

Claims

請求の範囲

入力信号を n階層 (nは 2以上の整数)の符号化情報で符号化する符号化装置であつて、

入力信号を符号化して第 1階層の符号ィ匕情報を生成する基本レイヤ符号ィ匕手段と第 i階層 (iは 1以上 n— 1以下の整数)の符号ィ匕情報を復号化して第 i階層の復号ィ匕信号を生成する第 i階層の復号化手段と、

前記入力信号と第 1階層の復号化信号との差分である第 1階層の差分信号ある、は第 (i— 1)階層の差分信号と第 i階層の復号ィ匕信号との差分である第 i階層の差分信号を求める加算手段と、

第 i階層の差分信号を符号化して第 (i+ 1)階層の符号化情報を生成する第 (i+ 1) 階層の拡張レイヤ符号化手段と、

所定の階層の符号ィ匕手段の符号ィ匕パラメータに基づいて前記所定の階層よりも上位の階層の符号ィ匕手段における符号ィ匕方法を制御する拡張レイヤ制御手段と、を具備する符号化装置。

前記拡張レイヤ制御手段は、前記所定の階層の符号化手段の符号化パラメータに基づいて前記所定の階層よりも上位の階層の符号ィ匕手段におけるビットァロケーションを制御する請求項 1に記載の符号化装置。

前記符号化手段の少なくとも 1つが CELP型であって、前記拡張レイヤ制御手段は、前記所定の階層の符号化手段の LPCの量子化誤差が、所定の閾値より大きい場合には第 1の LPC符号帳を利用して量子化を行い、前記閾値以下の場合には前記第 1の LPC符号帳よりもサイズが小さい第 2の LPC符号帳を利用して量子化を行うように、前記所定の階層よりも上位の階層の符号ィヒ手段における符号ィヒ方法を制御する請求項 1に記載の符号化装置。

前記符号化手段の少なくとも 1つが CELP型であって、前記拡張レイヤ制御手段は、前記所定の階層の符号化手段の LPCの量子化誤差が、所定の閾値より大きい場合には第 1の固定音源符号帳を用いて符号ィ匕を行い、前記閾値以下の場合には前記第 1の固定音源符号帳よりもサイズが大きい第 2の固定音源符号帳を用いて符号化を行うように、前記所定の階層よりも上位の階層の符号ィ匕手段における符号ィ匕方法を制御する請求項 1に記載の符号化装置。

[5] 前記符号化手段の少なくとも 1つが CELP型であって、前記拡張レイヤ制御手段は、前記所定の階層の符号化手段の LPCの量子化誤差が、所定の閾値より大きい場合には第 1のシエイプ符号帳を利用して量子化を行い、前記閾値以下の場合には前記第 1のシエイプ符号帳よりもサイズが小さい第 2のシエイプ符号帳を利用して量子化を行うように、前記所定の階層よりも上位の階層の符号ィ匕手段における符号ィ匕方法を制御する請求項 1に記載の符号化装置。

[6] 前記符号化手段の少なくとも 1つが CELP型であって、前記拡張レイヤ制御手段は、前記所定の階層の符号化手段の LPCの量子化誤差が、所定の閾値より大きい場合には第 1のゲイン符号帳を利用して量子化を行い、前記閾値以下の場合には前記第 1のゲイン符号帳よりもサイズが小さい第 2のゲイン符号帳を利用して量子化を行うように、前記所定の階層よりも上位の階層の符号化手段における符号化方法を制御する請求項 1に記載の符号化装置。

[7] 前記符号化手段の少なくとも 1つが CELP型であって、前記拡張レイヤ制御手段は、前記所定の階層の符号ィ匕手段のピッチゲインの大きさが、所定の閾値より大きい場合には第 1のシエイプ符号帳を利用して量子化を行い、前記閾値以下の場合には前記第 1のシエイプ符号帳よりもサイズが小さい第 2のシエイプ符号帳を利用して量子化を行うように、前記所定の階層よりも上位の階層の符号ィ匕手段における符号ィ匕方法を制御する請求項 1に記載の符号化装置。

[8] 前記符号化手段の少なくとも 1つが CELP型であって、前記拡張レイヤ制御手段は、前記所定の階層の符号ィ匕手段のピッチゲインの大きさが、所定の閾値より大きい場合には第 1のゲイン符号帳を利用して量子化を行い、前記閾値以下の場合には前記第 1のゲイン符号帳よりもサイズが小さい第 2のゲイン符号帳を利用して量子化を行うように、前記所定の階層よりも上位の階層の符号化手段における符号化方法を制御する請求項 1に記載の符号化装置。

[9] 入力信号を n階層 (nは 2以上の整数)の符号ィ匕情報で符号ィ匕する符号ィ匕方法であつて、入力信号を符号化して第 1階層の符号ィ匕情報を生成する基本レイヤ符号ィ匕工程と第 i階層 (iは 1以上 n— 1以下の整数)の符号ィ匕情報を復号化して第 i階層の復号ィ匕信号を生成する第 i階層の復号化工程と、

前記入力信号と第 1階層の復号化信号との差分である第 1階層の差分信号ある、は第 (i— 1)階層の差分信号と第 i階層の復号ィ匕信号との差分である第 i階層の差分信号を求める加算工程と、

第 i階層の差分信号を符号化して第 (i+ 1)階層の符号化情報を生成する第 (i+ 1) 階層の拡張レイヤ符号化工程と、

所定の階層の符号化パラメータに基づいて前記所定の階層よりも上位の階層における符号化方法を制御する拡張レイヤ制御工程と、を具備する符号化方法。

コンピュータに、入力信号を n階層 (nは 2以上の整数)の符号化情報で符号化する符号ィ匕方法を実行させるプログラムであって、

入力信号を符号化して第 1階層の符号ィ匕情報を生成する基本レイヤ符号ィ匕手順と第 i階層 (iは 1以上 n— 1以下の整数)の符号ィ匕情報を復号化して第 i階層の復号ィ匕信号を生成する第 i階層の復号ィ匕手順と、

前記入力信号と第 1階層の復号化信号との差分である第 1階層の差分信号ある、は第 (i— 1)階層の差分信号と第 i階層の復号ィ匕信号との差分である第 i階層の差分信号を求める加算手順と、

第 i階層の差分信号を符号化して第 (i+ 1)階層の符号化情報を生成する第 (i+ 1) 階層の拡張レイヤ符号ィ匕手順と、

所定の階層の符号化パラメータに基づいて前記所定の階層よりも上位の階層における符号化方法を制御する拡張レイヤ制御手順と、を具備するプログラム。