WO2007043642A1

WO2007043642A1 - スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法

Info

Publication number: WO2007043642A1
Application number: PCT/JP2006/320444
Authority: WO
Inventors: Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-10-14
Filing date: 2006-10-13
Publication date: 2007-04-19
Also published as: JP5142723B2; CN101273403B; JPWO2007043642A1; US8069035B2; EP1933304A1; CN101273403A; EP1933304A4; US20090030677A1

Abstract

　ビットレートを増加させることなく、復号信号の品質劣化を抑えることができるスケーラブル符号化装置等を開示する。この装置において、コアレイヤ符号化部（１０１）と拡張レイヤ符号化部（１０２）とは、音声フレーム単位で入力信号に対して符号化を行う。過去のフレームから現フレームの入力信号の変化度合いが所定値以上であるか、または過去のフレームにおいて拡張レイヤ符号化処理による復号信号の品質改善度合いが所定レベル以下であると置換判定部（１０３）が判定する場合、置換部（１０５）は、現フレームのコアレイヤ符号化データで過去のフレームの拡張レイヤ符号化データの一部を置換する。即ち、送信部（１０８）は、現フレームのコアレイヤ符号化データをバックアップとして、前もって復号側に伝送する。

Description

明細書

スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法技術分野

[0001] 本発明は、スケーラブル符号ィ匕装置、スケーラブル復号装置、およびこれらの方法に関する。

背景技術

[0002] IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号ィ匕が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声デ一タの復号が可能な構成を、う。

[0003] スケーラブル符号ィ匕においては、送信側で入力音声信号に対しての階層的な符号ィ匕により、コアレイヤを含む低位レイヤ（lower layer)力ら拡張レイヤを含む高位レイヤ (higher layer)まで複数に階層化された符号化データを伝送する。受信側では低位レイヤ力も任意の階層までの符号ィ匕データを用いて復号を行うことができる（例えば、非特許文献 1参照)。

[0004] なお、 IPネットワーク上でのパケットロスに対する制御として、高位レイヤよりもコアレィャを含む低位レイヤの符号ィ匕データの損失率を抑えることによって、パケットロスへの耐性を高めることができる。

[0005] それでもコアレイヤを含む低位レイヤの符号ィ匕データが損失することを避けられない場合は、過去に受信した符号ィ匕データを用いて誤り補償を行うことができる (例えば、非特許文献 2参照)。つまり、入力音声信号に対しフレーム単位でスケーラブル符号ィ匕を行って得られた階層化符号ィ匕データの内、コアレイヤを含む低位レイヤの符号ィ匕データがパケットロスにより損失され受信できな力つた場合、受信側は過去に受信した過去のフレームの符号ィ匕データを用いて誤り補償を行い、復号を行うことができる。従って、パケットロスが発生した場合の復号信号の品質劣化をある程度抑えることがでさる。

非特許文献 l : ISO/IEC 14496-3:2001(E) Prt- 3 Audio(MPEG- 4) Subpart- 3 Speech Coding(CELP)

非特許文献 2 : ISO/IEC 14496-3:2001(E) Prt- 3 Audio(MPEG- 4) Subpart- 1 Main An nexl .B(Informative) Error Protection tool

発明の開示

発明が解決しょうとする課題

[0006] し力しながら、例えば音声信号の立ち上がり部のような変化が大きい音声信号のコァレイヤ符号化データを損失した場合は、上記のように過去のフレームの符号ィ匕データを用いて誤り補償を行っても、その補償の精度が著しく低下し、受信側の復号音声の品質は劣化してしまうという問題がある。

[0007] 本発明の目的は、コアレイヤ符号化データを損失し、過去のフレームの符号ィ匕データを用いる方法では精度良く誤り補償を行うことができない場合でも、復号信号の品質劣化を抑えることができるスケーラブル符号ィ匕装置、スケーラブル復号装置、およびこれらの方法を提供することである。

課題を解決するための手段

[0008] 本発明のスケーラブル符号ィ匕装置は、少なくとも低位レイヤと高位レイヤとからなるスケーラブル符号ィ匕装置であって、前記低位レイヤにおける符号ィ匕を行って低位レィャ符号化データを生成する低位レイヤ符号化手段と、前記高位レイヤにおける符号ィ匕を行って高位レイヤ符号ィ匕データを生成する高位レイヤ符号ィ匕手段と、前記低位レイヤ符号化データの複製データを生成する複製手段と、前記高位レイヤ符号化データの一部を前記複製データで置換する置換手段と、を具備する構成を採る。

[0009] 本発明のスケーラブル復号装置は、少なくとも低位レイヤと高位レイヤとからなるスケーラブル復号装置であって、高位レイヤ符号ィ匕データ力も低位レイヤ符号ィ匕デ一タの複製データを分離する分離手段と、フレーム損失を検出する検出手段と、フレーム損失を検出した場合、前記複製データを復号して第 1復号データを生成する低位レイヤ復号手段と、フレーム損失を検出した場合、前記第 1復号データを用いて損失フレームの補償を行い、第 2復号データを生成する高位レイヤ復号手段と、を具備する構成を採る。発明の効果

[0010] 本発明によれば、ビットレートを増加させることなく誤り補償を行って、復号信号の品質劣化を抑えることができる。

図面の簡単な説明

[0011] [図 1]実施の形態 1に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 2]実施の形態 1に係る置換判定部の置換判定処理の手順を示すフロー図

[図 3]拡張レイヤ符号ィ匕データ力コアレイヤ符号ィ匕データへの置換の詳細を説明する為の図

[図 4]実施の形態 1に係るスケーラブル復号装置の主要な構成を示すブロック図 [図 5]実施の形態 1に係るコアレイヤ復号部および拡張レイヤ復号部における誤り補償処理および復号処理の手順を示すフロー図

[図 6]実施の形態 1に係る復号処理を説明する為の図

[図 7]実施の形態 2に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 8]拡張レイヤ符号ィ匕データの一部が抽出コアレイヤ符号ィ匕データへと置換される処理について説明する為の図

[図 9]実施の形態 2に係るスケーラブル復号装置の主要な構成を示すブロック図 [図 10]実施の形態 2に係るコアレイヤ復号部および拡張レイヤ復号部における誤り補償処理および復号処理の手順を示すフロー図

[図 11]実施の形態 3に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 12]実施の形態 3に係るスケーラブル復号装置の主要な構成を示すブロック図 [図 13]実施の形態 3に係る復号処理の一連の手順を示すフロー図

発明を実施するための最良の形態

[0012] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

[0013] (実施の形態 1)

図 1は、本発明の実施の形態 1に係るスケーラブル符号ィ匕装置 100の主要な構成を示すブロック図である。スケーラブル符号ィ匕装置 100は、コアレイヤと拡張レイヤとの 2階層からなる構成を採り、入力される音声信号に対して音声フレームの単位でスケーラブル符号化処理を行う。以下、スケーラブル符号ィ匕装置 100に第 mフレーム（ mは整数)の音声信号 I (m)が入力される場合を例にとって説明する。

[0014] コアレイヤ符号ィ匕部 101は、入力音声信号のコア成分となる信号に対して符号ィ匕処理を行い、コアレイヤ符号化データを生成する。コア成分となる信号とは、例えば、入力音声信号が 7kHz帯域幅を有する広帯域音声信号で、帯域スケーラブル符号化の場合、この広帯域信号力も帯域制限によって生成される電話帯域 (3. 4kHz)幅の信号をいう。復号側では、このコアレイヤ符号ィ匕データだけを用いて復号を行っても、ある程度の復号信号の品質を保証することができる。コアレイヤ符号ィ匕部 101は、入力音声信号 I (m)を用いてコアレイヤ符号ィ匕処理を行、、第 mフレームのコアレイャ符号化データ Ec (m)を生成する。生成される Ec (m)は、遅延部 106に入力されると共に、置換部 105にも入力される。即ち、置換部 105に入力されるデータは遅延部 106に入力されるデータの複製データとなっている。なお、コアレイヤ符号ィ匕部 101 は、入力音声信号そのものに対して符号ィ匕処理を行うことによりコアレイヤ符号ィ匕データを生成する構成としても良ヽ。

[0015] 拡張レイヤ符号ィ匕部 102は、コアレイヤ符号ィ匕部 101から入力される Ec (m)を局部復号して復号信号を得、この復号信号と入力音声信号とを比較することにより、入力音声信号のうち Ec (m)で表現しきれて、な、残りの信号成分 (例えば、コアレイヤでの符号化誤差信号成分、帯域スケーラブル符号化の場合はコアレイヤで符号化されなかった高帯域信号成分等)を把握し、この成分に対して符号化処理を行い、拡張レイヤ符号化データを生成する。復号側では、コアレイヤ符号化データに加え、拡張レイヤ符号ィ匕データを用いて復号を行うことによって、復号信号の品質を向上させることができる。拡張レイヤ符号ィ匕部 102は入力音声信号 I (m)とコアレイヤ符号ィ匕部 101から入力される Ec (m)とを用いて、第 mフレームの拡張レイヤ符号化データ Ee ( m)を生成する。

[0016] 置換判定部 103は、置換部 105において、入力音声信号 I (m)、コアレイヤ符号ィ匕部 101から入力される Ec (m)、および拡張レイヤ符号ィ匕部 102から入力される Ee (m )を用いて、第 (m— 1)フレームの拡張レイヤ符号化データ Ee (m- 1)を第 mフレームのコアレイヤ符号ィ匕データ Ec (m)で置換する力否かの置換判定処理を行う。置換判定部 103は、この判定結果を示す置換判定フラグ flag (m- 1)を置換部 105および拡張レイヤ多重化部 107へ出力する。

[0017] 遅延部 104は、拡張レイヤ符号ィ匕部 102から第 mフレームの拡張レイヤ符号ィ匕データ Ee (m)が入力され、第 (m— 1)フレームの拡張レイヤ符号化データ Ee (m— 1) を出力する。即ち、遅延部 104が出力する Ee (m— 1)は、 1フレーム前の符号化処理において拡張レイヤ符号ィ匕部 102から入力された第 (m— 1)フレームの拡張レイャ符号化データ Ee (m— 1)を 1フレーム遅延させ、第 mフレームの符号化処理において出力したものである。

[0018] 置換部 105は、置換判定部 103から入力される置換判定フラグ flag (m—1)の値に基づき置換処理を行う。即ち、 flag (m—1)が 0である場合は、遅延部 104から入力される Ee (m—1)をそのまま拡張レイヤ多重化部 107に出力する。一方、 flag (m—1) 力 Siである場合、置換部 105は遅延部 104力も入力される Ee (m—1)の中身をコアレィャ符号ィ匕部 101から入力される Ec (m)で置換して、拡張レイヤ多重化部 107に出力する。

[0019] 遅延部 106は、コアレイヤ符号ィ匕部 101から入力される Ec (m)が入力され、 Ec (m —1)を出力する。即ち、遅延部 106が出力する Ec (m—1)は 1フレーム前の符号ィ匕処理においてコアレイヤ符号ィ匕部 101から入力された第 (m— 1)フレームのコアレイャ符号化データ Ec (m— 1)を 1フレーム遅延させ、第 mフレームの符号化処理において出力したものである。

[0020] 拡張レイヤ多重化部 107は、置換判定部 103から入力される置換判定フラグ flag ( m—1)、および置換部 105から入力される拡張レイヤ符号ィ匕データ Ee (m—1)に対して多重化処理を行う。

[0021] 送信部 108は、遅延部 106から入力されるコアレイヤ符号ィ匕データ Ec (m—1)、拡張レイヤ多重化部 107から入力される拡張レイヤ符号ィ匕データ Ee (m— 1)、および置換判定フラグ flag (m- 1)を多重化してスケーラブル復号装置 200 (図 4参照）に送信する。

[0022] 上記のようにスケーラブル符号ィ匕装置 100は、入力音声信号 I (m)に比べて 1フレーム遅延された第 (m— 1)フレームのコアレイヤ符号ィ匕データ Ec (m— 1)および拡張レイヤ符号化データ Ee (m- 1)をスケーラブル復号装置 200に送信する。なお、拡張レイヤ符号化データ Ee (m— 1)の中身は第 (m— 1)フレームの拡張レイヤ符号化データ Ee (m— 1)そのものである力或!、は第 mフレームのコアレイヤ符号化データ Ec (m)である。即ち、第 (m—l)フレームを現フレームとする場合、第 mフレームは未来のフレームとなり、スケーラブル符号ィ匕装置 100は現フレームの拡張レイヤ符号化データを未来のフレームのコアレイヤ符号ィ匕データの複製データで置換して、スケ一ラブル復号装置 200に伝送する。言い換えると、第 mフレームを現フレームとする場合、第 (m—l)フレームは過去のフレームとなり、スケーラブル符号ィ匕装置 100は現フレームのコアレイヤ符号化データの複製データで過去のフレームの拡張レイヤ符号ィ匕データを置換して、スケーラブル復号装置 200に伝送する。

[0023] 図 2は、置換判定部 103の置換判定処理の手順を示すフロー図である。

[0024] ステップ（以下、「ST」と省略する） 2001において、置換判定部 103は入力音声信号に対して分析を行って、入力音声信号のパワー、ピッチ分析パラメータ (ピッチ周期、ピッチ予測ゲイン）、 LPCスペクトルなどの特性パラメータの変化度合いを算出する。例えばフレーム単位で、入力音声信号のパワーと過去のフレームの入力音声信号のパワーとの差を算出し、入力音声信号の変化度合いを表すパラメータとする。

[0025] ST2002において置換判定部 103は、 ST2001において算出された入力音声信号の変化度合いが所定値以上である力否かを判定する。音声信号の立ち上がり部、無声非定常子音部など非定常信号における、過去のフレーム力の信号の変化が大きいフレームを損失した場合、復号側は過去のフレームの符号化データを用いて所定レベル以上の品質で誤り補償を行うことができない。従って、入力音声信号の変化度合いが所定値以上である場合 (ST2002 : YES)は、復号側が過去のフレームの符号ィ匕データを用いて所定レベル以上の品質で誤り補償を行うことができないと判定し、置換判定部 103は ST2006の処理に進む。一方、入力音声信号の変化度合いが所定値以上でない場合（ST2002 :NO)、置換判定部 103は ST2003の処理に進む。

[0026] ST2003において、置換判定部 103はコアレイヤ符号化処理のみを行った場合の符号化歪みと、拡張レイヤ符号化処理まで行った場合の符号化歪みとを算出する。

[0027] ST2004において、置換判定部 103は拡張レイヤ符号ィ匕処理による復号信号の品質改善度合いが所定レベル以下である力否かを判定する。具体的には、 ST2003において算出された 2つの符号ィ匕歪みの差が所定値以下であれば、拡張レイヤ符号化処理による復号信号の品質改善度合いが所定レベル以下であると判定する（ST2 004 : YES)。このとき、置換判定部 103は ST2006の処理に進む。一方、拡張レイャ符号化処理による復号信号の品質改善度合!ヽが所定レベル以下でな！、場合 (ST 2004 : NO)、置換判定部 103は ST2005の処理に進む。

[0028] ST2005において、置換判定部 103は置換判定フラグ flag (m—1)を「置換なし」を示す 0に設定する。 ST2006〖こおいて、置換判定部 103は置換判定フラグ flag (m 1)を「置換あり」を示す 1に設定する。

[0029] 上記のように、置換判定部 103は、拡張レイヤ符号ィ匕データ Ee (m— 1)を次フレームのコアレイヤ符号ィ匕データ Ec (m)で置換する力否かの判定条件として、第 mフレームの符号ィ匕データを損失した場合に、復号側が過去のフレームの符号ィ匕データを用いて所定レベル以上の品質で誤り補償を行うことができる力否か、または第 (m—1 )フレームの拡張レイヤ符号ィ匕処理による復号信号の品質改善度合、が所定レベル以下であるか否かを判断する。

[0030] 図 3は、スケーラブル符号ィ匕装置 100における、拡張レイヤ符号ィ匕データ力もコアレイヤ符号ィ匕データへの置換の詳細を説明する為の図である。ここでは、第 (m—3) 〜第 (m+ 1)フレームの入力音声信号に対する処理を例にとって説明する。

[0031] この図において、 1行目（1段目）はフレーム毎の入力音声信号を示し、 2行目と 3行目はそれぞれコアレイヤ符号化部 101が生成するコアレイヤ符号化データ、および拡張レイヤ符号化部 102が生成する拡張レイヤ符号化データを示す。

[0032] 4行目と 5行目はそれぞれ、置換部 105を設けな力たと仮定する場合の、送信部 108がスケーラブル復号装置 200に伝送するコアレイヤ符号ィ匕データおよび拡張レィャ符号化データを示す。図示されるように、送信部 108がスケーラブル復号装置 2 00に伝送する符号化データは、コアレイヤ符号ィ匕部 101および拡張レイヤ符号ィ匕部 102が 1フレーム前の符号ィ匕処理において生成した符号ィ匕データである。

[0033] 6行目は置換判定部 103の判定結果を示す置換判定フラグの値である。 7行目と 8 行目はそれぞれ、置換部 105が置換判定フラグの値に基づき置換処理を行った場合、送信部 108がスケーラブル復号装置 200に伝送するコアレイヤ符号ィ匕データおよび拡張レイヤ符号化データを示す。図示されるように置換判定フラグ flag (m—l) 力 Siである場合、 Ee (m—i;n¾Ec (m)に置換される。図中の矢印が示すように置換の結果、第 8行第 2列のデータは第 7行第 3列のデータと同一になり、第 8行第 4列のデータは第 7行第 5列のデータと同一になる。即ち、 Ec (m)をバックアップとして前もつて、スケーラブル復号装置 200に伝送する必要があると置換判定部 103が判定する場合、置換部 105は Ec (m)で Ee (m— 1)を置換する処理を施す。

[0034] 図 4は、スケーラブル復号装置 200の主要な構成を示すブロック図である。スケーラブル復号装置 200は、コアレイヤと拡張レイヤの 2階層からなる構成を採る。以下、スケーラブル復号装置 200がスケーラブル符号ィ匕装置 100から第 nフレームの符号ィ匕データを受信し、復号処理を行う場合について説明する。ここで nと mとは「n=m—l 」の関係にあるとする。

[0035] 受信部 201は、スケーラブル符号ィ匕装置 100から、コアレイヤ符号ィ匕データ Ec (n) 、拡張レイヤ符号ィ匕データ Ee (n)、および置換判定フラグ flag (n)が多重化された符号化データを受信する。

[0036] 拡張レイヤ逆多重化部 202は、受信部 201から入力される、拡張レイヤ符号化データ Ee (n)と置換判定フラグ flag (n)とが多重化されたデータに対し逆多重化処理を行ヽ、拡張レイヤ符号化データ Ee (n)と置換判定フラグ flag (n)とを分離する。

[0037] 切替部 203は、拡張レイヤ逆多重化部 202から入力される置換判定フラグ flag (n) の値に基づき、拡張レイヤ逆多重化部 202から入力される拡張レイヤ符号ィ匕データ Ee (n)の中身が Ee (n)そのものである力、それとも次フレームのコアレイヤ符号化データ Ec (n+ 1)であるか判定する。切替部 203はその判定結果に基づき、置換判定フラグ flag (n)が 1である場合、コアレイヤ符号ィ匕データ Ec (n+ 1)を遅延部 204に出力し、置換判定フラグ flag (n)が 0である場合、拡張レイヤ符号化データ Ee (n)を拡張レイヤ復号部 206に出力する。

[0038] 遅延部 204は、切替部 203から第（n+ 1)フレームのコアレイヤ符号化データ Ec (n

+ 1)が入力され、第 nフレームのコアレイヤ符号ィ匕データ Ec (n)を出力する。即ち、遅延部 204が出力する Ec (n)は、 1フレーム前の復号処理において切替部 203から入力された第 nフレームのコアレイヤ符号ィ匕データ Ec (n)を、 1フレーム遅延させ、第 (n+ 1)フレームの復号処理において出力したものである。

[0039] コアレイヤ復号部 205は、パケットロス検出部（図示せず)力も入力されるパケット口スフラグに基づいて、パケットロスがない場合は、受信部 201から入力されるコアレイャ符号化データ Ec (n)、および拡張レイヤ逆多重化部 202から入力される置換判定フラグ flag (n)を用いて復号処理を行い、コアレイヤ復号信号 Dc (n)を生成する。また、パケットロスが発生した場合、コアレイヤ復号部 205は、受信部 201から入力されるコアレイヤ符号ィ匕データ Ec (n)の代わりに、遅延部 204から入力されるコアレイヤ符号ィ匕データ Ec (n)を用いて復号処理を行う。コアレイヤ復号部 205における処理の詳細については後述する。

[0040] 拡張レイヤ復号部 206は、パケットロス検出部（図示せず)力も入力されるパケット口スフラグに基づいて、パケットロスがない場合は、切替部 203から入力される拡張レイャ符号化データ Ee (n)、拡張レイヤ逆多重化部 202から入力される置換判定フラグ f lag (n)、コアレイヤ復号部 205から入力されるコアレイヤ符号ィ匕データ Ec (n)、およびコアレイヤ復号部 205から入力されるコアレイヤ復号信号 Dc (n)を用いて復号処理を行い、拡張レイヤ復号信号 De (n)を出力する。また、パケットロスが発生した場合、拡張レイヤ復号部 206は、過去に受信した拡張レイヤ符号ィ匕データとコアレイヤ復号部 205で生成される補償データとを用いて誤り補償を行う。

[0041] 図 5は、コアレイヤ復号部 205および拡張レイヤ復号部 206における誤り補償処理および復号処理の手順を示すフロー図である。

[0042] ST5001にお!/、て、コアレイヤ復号部 205はパケットロスフラグに基づき、第 nフレームの符号ィ匕データを損失したか否かを判定する。フレームを損失しな力つたと判定する場合（ST5001 :NO)、コアレイヤ復号部 205は ST5002の処理に進み、フレームを損失したと判定する場合（ST5001： YES)は ST5006に進む。

[0043] ST5002において、コアレイヤ復号部 205は受信部 201から入力されるコアレイヤ符号ィ匕データ Ec (n)を用いて、コアレイヤ復号処理を行い、コアレイヤ復号信号 Dc ( n)を生成する。

[0044] ST5003において、拡張レイヤ復号部 206は置換判定フラグ flag (n)が 1であるか否かを判定する。 ST5003において置換判定フラグ flag (n)の値が 1であると判定する場合（ST5003 :YES)、拡張レイヤ復号部 206は ST5005の処理に進み、置換判定フラグ flag (n)の値が 0であると判定する場合（ST5003 :NO)は ST5004に進む

[0045] ST5004において、拡張レイヤ復号部 206は拡張レイヤ符号ィ匕データ Ee (n)を用 Vヽて拡張レイヤ復号処理を行!ヽ、拡張レイヤ復号信号 De (n)を生成する。

[0046] ST5005〖こおいて、拡張レイヤ復号部 206は切替部 203から拡張レイヤ符号化データ Ee (n)が入力されないため、コアレイヤ符号ィ匕データ Ec (n)、コアレイヤ復号信号 Dc (n)、 1フレーム前の復号処理にぉ、て受信した第 (n— 1)フレームの拡張レイャ符号化データ Ee (n— 1)、および第 (n— 1)フレームの拡張レイヤ復号信号 De (n 1)を用いて、誤り補償処理および復号処理を行い、第 nフレームの拡張レイヤ復号信号 De (n)を生成する。

[0047] ST5006において、コアレイヤ復号部 205は 1つ前のフレームの置換判定フラグ fla g (n- 1)の値が 1であるか否かを判定する。 flag (n- 1)の値が 1であると判定された場合（ST5006： YES)は、 1フレーム前の復号処理にぉ、て受信された第 (n— 1)フレームの拡張レイヤ符号化データ Ee (n— 1)の中身は第 nフレームのコアレイヤ符号化データ Ec (n)であることが判定できる。従って、コアレイヤ復号部 205は ST5007 の処理に進む。

[0048] ST5007において、コアレイヤ復号部 205は 1フレーム前の復号処理において受信した第 nフレームのコアレイヤ符号ィ匕データ Ec (n)を用いてコアレイヤ復号処理を行い、コアレイヤ復号信号 Dc (n)を生成する。

[0049] ST5008において、拡張レイヤ復号部 206は、コアレイヤ復号信号 Dc (n)と、 1つ前のフレーム、即ち第 (n— 1)フレームの拡張レイヤ符号ィ匕データ Ee (n— 1)と、拡張レイヤ復号信号 De (n—1)とを用いて、誤り補償処理および復号処理を行い、第 nフレームの拡張レイヤ復号信号 De (n)を生成する。

[0050] 一方、 ST5006において flag (n—l)の値力 Oであると判定された場合（ST5006 :

NO)、 1フレーム前の復号処理において受信された、第 (n— 1)フレームの拡張レイャ符号化データ Ee (n— 1)の中身は、第 nフレームのコアレイヤ符号化データ Ec (n) ではなく Ee (n- 1)そのものであると判定できるため、コアレイヤ復号部 205は ST50 09の処理に進む。

[0051] ST5009において、コアレイヤ復号部 205は 1つ前のフレーム、即ち第（n—l)フレームのコアレイヤ符号ィ匕データ Ec (n- 1)およびコアレイヤ復号信号 Dc (n- 1)を用いて、誤り補償処理および復号処理を行い、第 nフレームのコアレイヤ復号信号 Dc ( n)を生成する。

[0052] ST5010において、拡張レイヤ復号部 206は 1つ前のフレーム、即ち第（n— 1)フレームのコアレイヤ符号ィ匕データ Ec (n— 1)と、コアレイヤ復号信号 Dc (n— 1)と、拡張レイヤ符号ィ匕データ Ee (n—l)と、拡張レイヤ復号信号 De (n—l)とを用いて、誤り補償処理および復号処理を行、、第 nフレームの拡張レイヤ復号信号 De (n)を生成する。

[0053] この図 6は、スケーラブル復号装置 200における復号処理を説明する為の図である。ここでは、図 3に示したデータと基本的に同一のデータを用い、スケーラブル復号装置 200が受信する符号化データを追加して示し、パケットロスにより損失したフレームを区別して示す点が図 3と相違する。即ち、第 9行目はスケーラブル復号装置 200 が受信するコアレイヤ符号化データを示し、第 10行目はスケーラブル復号装置 200 が受信する拡張レイヤ符号化データを示す。なお、ここでは、第 (m— 3)フレームおよび第 mフレームの符号ィ匕データを損失して、る例を示して、る。

[0054] 図 6に示すデータを用いる場合、コアレイヤ復号部 205および拡張レイヤ復号部 20 6における復号処理の手順は以下の通りである。

[0055] スケーラブル復号装置 200が第 (m—4)フレームまたは第 (m— 2)フレームの符号ィ匕データを受信する場合、 ST5001、 ST5002、 ST5003、 ST5004の手順で復号処理を行う。

[0056] スケーラブル復号装置 200が第 (m— 1)フレームの符号化データを受信する場合は、 ST5001, ST5002, ST5003, ST5005の手順で誤り補償処理および復号処理を行う。

[0057] スケーラブル復号装置 200が第 (m— 3)フレームの符号化データを受信する場合は、 ST5001, ST5006, ST5009, ST5010の手順で誤り補償処理および復号処理を行う。

[0058] スケーラブル復号装置 200が第 mフレームの符号ィ匕データを受信する場合は、 ST 5001、 ST5006, ST5007, ST5008の手順で誤り補償処理および復号処理を行う

[0059] このように、本実施の形態によれば、スケーラブル符号ィ匕装置 100は、各フレームに対してコアレイヤ符号ィ匕データのバックアップを前もってスケーラブル復号装置 20 0に伝送する必要がある力否かの判定を行い、必要があると判定される特定のフレームに対しては、コアレイヤ符号化データで当該フレーム（現フレーム）よりも 1フレーム前 (過去のフレーム）の拡張レイヤ符号化データを置換する。

[0060] 即ち、過去のフレームの符号ィ匕データを用いて所定レベル以上の品質で誤り補償を行うことができない場合、または、過去のフレームにおいて拡張レイヤ符号ィ匕処理による復号信号の品質改善度合、が所定レベル以下である場合、スケーラブル符号化装置 100はコアレイヤ符号ィ匕データで過去のフレームの拡張レイヤ符号ィ匕データを置換してスケーラブル復号装置 200に伝送する。従って、スケーラブル復号装置 2 00はパケットロスにより現フレームの符号ィ匕データを受信できない場合、過去のフレ一ムの復号処理にぉ、て受信された現フレームのコアレイヤ符号ィ匕データを用いて復号処理を行うことができるため、ビットレートを増カロさせることなぐ復号信号の品質劣化を抑えることができる。

[0061] また、スケーラブル符号化装置 100は、未来のフレームのコアレイヤ符号化データをバックアップとして前もってスケーラブル復号装置 200に伝送する必要がないと判定されたフレームに対しては、拡張レイヤ符号化データ（現フレームのデータ）を 1フレーム後のコアレイヤ符号化データ（未来のフレームのデータ）で置換せずそのままスケーラブル復号装置 200に伝送する。従って、スケーラブル復号装置 200は、パケットロスが発生しな力つた場合、現フレームの符号ィ匕データを用いてコアレイヤカも拡張レイヤまでの復号処理を行うことができるため、復号信号の品質を向上させることができる。

[0062] なお、本実施の形態においては、 ST2002または ST2004の何れ力 1つの判定条件が満たされれば、符号ィ匕データの置換を行うと置換判定部 103が判定する場合を例にとっている力これらの 2つの条件が同時に満たされる場合のみに符号ィ匕データの置換を行うと判定するようにしても良、。

[0063] また、本実施の形態においては、復号側が過去のフレームの符号化データを用いて所定レベル以上の品質で誤り補償を行うことができる力否か判定するために、置換判定部 103が入力音声信号の変化度合いが所定値以上であるかを判定する場合を例にとっているが（ST2002)、置換判定部 103がパケットロスによりフレームを損失したことを想定して、実際に過去のフレームの符号ィ匕データを用いて誤り補償処理および復号処理を行うことにより判定を行っても良い。即ち、生成された復号信号と入力音声信号との間の誤差の大きさを示す数値が所定値以上である、すなわち誤差が所定値以上に大きい場合は、 ST2006の処理に進み、所定値以上でない場合は ST2 005の処理に進む。

[0064] また、本実施の形態においては、拡張レイヤ符号化処理による復号信号の品質改善度合いを判定するために置換判定処理の ST2003において、コアレイヤ符号ィ匕処理のみを行った場合の符号化歪みと、拡張レイヤ符号化処理まで行った場合の符号化歪みを算出する場合を例にとっている力符号ィ匕歪みの代わりに SNRを算出しても良い。このような場合 ST2004において、置換判定部 103は ST2003において算出された 2つの SNRの差が所定値以下である否かを判定すれば良い。

[0065] また、本実施の形態においては、拡張レイヤ符号化処理による復号信号の品質改善度合ヽを判定するために、コアレイヤ符号化処理のみを行った場合の符号化歪みと、拡張レイヤ符号化処理まで行った場合の符号化歪みと、の差を算出する場合を例にとっているが（ST2003および ST2004)、スケーラブル符号化装置 100が周波数帯域スケーラブルを実現する装置である場合は、入力音声信号の帯域の偏り、即ち、コアレイヤ符号ィ匕部 101の処理対象となる低域の信号のエネルギーの全帯域の信号のエネルギーに対する比率を算出しても良、。

[0066] また、本実施の形態においては、置換判定部 103において、入力音声信号 I (m)、コアレイヤ符号ィ匕データ Ec (m)、および拡張レイヤ符号ィ匕データ Ee (m)を用いる場合を例にとって説明した力 Ec (m)および Ee (m)にカ卩えて、コアレイヤ符号ィ匕および拡張レイヤ符号化により得られる復号音声信号や符号化処理過程で得られるパラメータを用いるようにしても良いし、 Ec (m)および Ee (m)の代わりに、コアレイヤ符号化および拡張レイヤ符号化により得られる復号音声信号や符号化処理過程で得られるパラメータを用いるようにしても良、。

[0067] また、本実施の形態にお!ヽては、復号処理の ST5005 (拡張レイヤ誤り補償処理および復号処理）において、コアレイヤ復号信号 Dc (n)、拡張レイヤ復号信号 De (n— 1)を用いる場合を例にとっている力 Dc (n)、 De (n—1)ではなぐ第 nフレームのコアレイャ復号処理で得られた復号パラメータ、および第 (n— 1)フレームの拡張レイヤ復号処理で得られた復号パラメータを用いても良い。同様に ST5008、 ST5009、 S T5010においても、復号信号の代わりに復号パラメータを用 V、て誤り補償処理および復号処理を行っても良ヽ。

[0068] また、本実施の形態にお!ヽては、スケーラブル符号ィ匕装置 100およびスケーラブル復号装置 200が 2階層力もなる構成を採る場合を例にとっているが、これに限定されるものではなぐ 3階層以上力なる構成を採っても良い。

[0069] また、本実施の形態においては、スケーラブル符号化装置 100が入力音声信号に比べ 1フレーム遅延された符号ィ匕データを復号側に送信する場合を例にとっている力これに限定されるものではなぐ 2フレーム以上遅延された符号ィヒデータを復号側に送信しても良い。即ち、拡張レイヤ符号ィ匕データを 2フレーム以上後のフレームのコアレイヤ符号ィ匕データで置換しても良い。これにより、バースト的なパケットロスが発生し、 2フレーム以上のフレームを連続して損失しても、所定レベル以上の品質で誤り補償処理および復号処理を行うことができる。

[0070] また、本実施の形態においては、スケーラブル符号ィ匕装置 100が生成するコアレイャ符号化データ Ec (m)のビット数と拡張レイヤ符号ィ匕データ Ee (m— 1)のビット数とが同一である場合を例にとっている力拡張レイヤ符号ィ匕データ Ee (m— 1)のビット数がコアレイヤ符号ィ匕データ Ec (m)のビット数より大き、場合は、 Ee (m— 1)の一部を Ec (m)で置換すれば良い。このような場合、 Ee (m— 1)の置換されなかった残りの一部はスケーラブル復号装置 200の復号処理に使われても良ぐ使われなくても良い。

[0071] (実施の形態 2) 図 7は、本発明の実施の形態 2に係るスケーラブル符号ィ匕装置 300の主要な構成を示すブロック図である。スケーラブル符号ィ匕装置 300は、実施の形態 1に係るスケーラブル符号ィ匕装置 100 (図 1参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。スケーラブル符号ィ匕装置 300は、抽出部 309をさらに具備する点において、スケーラブル符号ィ匕装置 100と相違する。なお、スケーラブル符号ィ匕装置 300の置換部 305と、スケーラブル符号ィ匕装置 100 の置換部 105とは処理の一部に相違点があり、それを示すために異なる符号を付す

[0072] 抽出部 309は、コアレイヤ符号ィ匕部 101から入力される Ec (m)の中から符号ィ匕品質への寄与が大き、部分を抽出して抽出コアレイヤ符号ィ匕データ Eca (m)を生成する。例えば CELP (Code Excited Linear Prediction)符号化方式の場合、 Ec (m)の中から、 LPC (線形予測係数)パラメータ、適応符号帳ラグ、およびゲインを抽出する。

[0073] 置換部 305は、置換判定部 103から入力される置換判定フラグ flag (m— 1)の値が 0である場合は、遅延部 104から入力される Ee (m- 1)をそのまま拡張レイヤ多重化部 107に出力する。一方、 flag (m— 1)が 1である場合、置換部 305は遅延部 104から入力される Ee (m— 1)の一部を抽出部 309から入力される抽出コアレイヤ符号ィ匕データ Eca (m)で置換して、拡張レイヤ多重化部 107に出力する。

[0074] 図 8は、スケーラブル符号化装置 300にお!/、て、第（m— 1)フレームの拡張レイヤ符号化データ Ee (m— 1)の一部が抽出コアレイヤ符号ィ匕データ Eca (m)へと置換される処理について説明する為の図である。

[0075] ここでは、フレーム長が 20msで、コアレイヤ符号化データのビットレートが 8kbps (1 60ビット Zフレーム）で、拡張レイヤ符号化データのビットレート力 kbps (80ビット Z フレーム）である場合を例にとって説明する。抽出部 309は、 160ビットの Ec (m)の内力も抽出コアレイヤ符号ィ匕データ Eca (m)を抽出する。即ち、 CELP符号化方式の場合は Ec (m)の中から、 LPCパラメータ、適応符号帳ラグ、およびゲインを抽出する。抽出する Eca (m)を例えば 3kbps (60ビット Zフレーム）とする場合、置換部 305は拡張レイヤ符号ィ匕データ Ee (m— 1)の内、符号化品質への寄与が大きい部分、即ち抽出拡張レイヤ符号ィ匕データ Eea (m—1)を lkbps (20ビット Zフレーム）に合わせて抽出する。 Eea (m—1)のビット数の 20ビット（フレーム当たり）は、 Ee (m—1)のビット数の 80ビット（フレーム当たり）と Eca (m)のビット数の 60ビット（フレーム当たり）との差である。置換部 305は Ee (m— 1)の内、 Eea (m— 1)以外の部分を Eca (m)で置換する。従って、置換部 305が拡張レイヤ多重化部 107に出力するデータは、 Ee a (m—l)と Eca (m)とのセットである。ここで、置換部 305における Eea (m— 1)の抽出方法は、抽出部 309における Eca (m)の抽出方法と同様である。

[0076] 上記のように、実施の形態 1においては、第 (m— 1)フレームの拡張レイヤ符号ィ匕データを第 mフレームのコアレイヤ符号化データ全体を用いて置換するのに対して、本実施の形態にぉ、ては、第 (m— 1)フレームの拡張レイヤ符号化データ Ee (m— 1 )の一部分を第 mフレームのコアレイヤ符号化データ Ec (m)の一部分を用いて置換する。

[0077] 図 9は、本実施の形態に係るスケーラブル復号装置 400の主要な構成を示すプロック図である。

[0078] スケーラブル復号装置 400は、実施の形態 1に係るスケーラブル復号装置 200 (図 4参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。スケーラブル復号装置 400の切替部 403、コアレイヤ復号部 4 05、および拡張レイヤ復号部 406はそれぞれ、スケーラブル復号装置 200の切替部 203、コアレイヤ復号部 205、および拡張レイヤ復号部 206と処理の一部に相違点があり、それを示すために異なる符号を付す。

[0079] 切替部 403は、拡張レイヤ逆多重化部 202から入力される置換判定フラグ flag (n) の値に基づき、拡張レイヤ逆多重化部 202から入力される拡張レイヤ符号ィ匕データ Ee (n)の中身が Ee (n)そのものである力、それとも抽出拡張レイヤ符号化データ Eea (n)と次フレームの抽出コアレイヤ符号化データ Eca (n+ 1)とのセットであるかを判断し、出力先を切り替える。具体的には、置換判定フラグ flag (n)が 1である場合、切替部 403は、 Eca (n+ 1)を遅延部 204に出力し、 Eea (n)を拡張レイヤ復号部 406 に出力する。一方、置換判定フラグ flag (n)が 0である場合、切替部 403は拡張レイャ符号化データ Ee (n)を拡張レイヤ復号部 406に出力する。

[0080] コアレイヤ復号部 405および拡張レイヤ復号部 406と、スケーラブル復号装置 200 のコアレイヤ復号部 205および拡張レイヤ復号部 206との処理上の相違点については、図 10のフロー図を用いて説明する。

[0081] 図 10は、コアレイヤ復号部 405および拡張レイヤ復号部 406における誤り補償処理および復号処理の手順を示すフロー図である。この図は、実施の形態 1に係るコアレイヤ復号部 205および拡張レイヤ復号部 206における誤り補償処理および復号処理を説明するフロー図（図 5)と基本的に同様のステップを有しており、同一のステツプには同一の符号を付し、その説明を省略する。図 10において、図 5と相違するステップは ST9005および ST9007である。

[0082] スケーラブル符号ィ匕装置 300において、第 nフレームの拡張レイヤ符号ィ匕データ E e (n)全体が次フレームのコアレイヤ符号化データで置換されるのではなぐ Eea (n) の部分は置換されずスケーラブル復号装置 400に伝送される為、 ST9005において、拡張レイヤ復号部 406は Eea (n)を用いて拡張レイヤ復号処理を行い、拡張レイヤ復号信号 De (n)を生成する。

[0083] ST9007において、コアレイヤ復号部 405は 1フレーム前の復号処理において受信された抽出コアレイヤ符号化データ Eca (n)を用いてコアレイヤ復号処理を行!ヽ、コアレイヤ復号信号 Dc (n)を生成する。

[0084] このように、本実施の形態によれば、符号ィ匕側で拡張レイヤ符号ィ匕データ全体ではなぐ拡張レイヤ符号ィ匕データの一部分だけを次フレームのコアレイヤ符号ィ匕データのうち符号ィ匕品質への寄与が大きい部分に限定したデータを用いて置換することによって、復号側では拡張レイヤ符号ィ匕データの置換されな力つた部分のデータを用いて拡張レイヤ復号を行うことができる。従って、復号信号の品質を向上させることができる。また、置換に用いるコアレイヤ符号ィ匕データとして符号ィ匕品質への寄与が大きヽ部分に限定することで、拡張レイヤ符号ィ匕よりコアレイヤ符号ィ匕のビットレートが大きい場合にも、本実施の形態を適用して、復号信号の劣化を抑えることができる。

[0085] なお、本実施の形態では、符号化側で、拡張レイヤ符号化データ全体ではなく拡張レイヤ符号ィ匕データの一部分だけを置換する構成を例にとって説明したが、拡張レイヤ符号ィ匕データの全体を次フレームのコアレイヤ符号ィ匕データのうち符号ィ匕品質への寄与が大き、部分に限定したデータを用いて置換するようにしても良、。 [0086] また、本実施の形態では、復号処理の ST9005にお、て、拡張レイヤ復号部 406 は Eea (n)を用いて拡張レイヤ復号処理を行う場合を例にとっている力 Eea (n)に加え、第 (n— 1)フレームの拡張レイヤ符号ィ匕データ Ee (n— 1)および拡張レイヤ復号信号 De (n— 1)も用いて復号処理を行っても良!、。

[0087] また、本実施の形態においては、抽出部 309がすべてのフレームに対して同様の抽出方法を用いる場合を例にとっている力各フレームに適応して異なる抽出方法を用いて、用いられた抽出方法に関する情報をスケーラブル復号装置 400に別途送信しても良い。これにより、スケーラブル復号装置 400において生成される復号信号の品質劣化をさらに抑えることができる。

[0088] (実施の形態 3)

実施の形態 1、 2では、符号ィ匕側において現フレームの拡張レイヤ符号ィ匕データを次フレーム (または次フレーム以降）のコアレイヤ複製データで置換した。よって、符号ィ匕側で 1フレーム（または 1フレーム以上)余分に遅延することとなる。一方、本実施の形態では、符号ィ匕側にて、現フレームの拡張レイヤ符号ィ匕データをこれよりも前のフレームのコアレイヤ複製データで置換する構成を採る。この構成を採ることにより、符号化側での余分な遅延が発生しな、代わりに復号側で 1フレーム余分に遅延することとなる。

[0089] 図 11は、本発明の実施の形態 3に係るスケーラブル符号ィ匕装置 500の主要な構成を示すブロック図である。スケーラブル符号ィ匕装置 500は、実施の形態 2に示したスケーラブル符号ィ匕装置 300 (図 7参照）と一部が同様の構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

[0090] スケーラブル符号ィ匕装置 500をスケーラブル符号ィ匕装置 300と比較すると、遅延部 104、 106が削除され、代わりに遅延部 501が追加されている点が大きく異なる。以下詳細に説明する。

[0091] コアレイヤ符号化部 101の出力である第 mフレームのコアレイヤ符号化データ Ec ( m)は、送信部 108へ直接出力される。また、拡張レイヤ符号ィ匕部 102の出力である第 mフレームの拡張レイヤ符号ィ匕データ Ee (m)は、置換部 502へ直接出力される。さらに、抽出部 309の出力である抽出コアレイヤ符号ィ匕データ Eca (m)は、遅延部 5 01を介すことにより 1フレーム遅延され、第 m—1フレームの抽出コアレイヤ符号ィ匕データ Eca (m—1)として、置換部 502へ出力される。

[0092] 置換判定部 503は、置換部 502において、入力音声信号、コアレイヤ符号ィ匕部 10 1から入力されるコアレイヤ符号ィ匕データ、および拡張レイヤ符号ィ匕部 102から入力される拡張レイヤ符号ィ匕データを用いて、第 mフレームの拡張レイヤ符号ィ匕データ E e (m)の一部を第 m— 1フレームのコアレイヤ符号化データ Ec (m— 1)の一部で置換するか否かの置換判定処理を行う。具体的には、置換判定部 503は、第 m— 1フレームの符号ィ匕データを損失した場合に、復号側が過去フレームの符号ィ匕データを用いて当該第 m—lフレームの復号信号に対して所定レベル以上の品質で誤り補償を行うことができな、か、または第 mフレームの拡張レイヤ符号ィ匕処理による復号信号の品質改善具合が所定レベル以下であるかを判断し、これらの判定条件に該当する場合に置換判定部 503は、上記置換を行うと判定する。置換判定部 503は、第 mフレームの判定結果を示す置換判定フラグ flag (m)を置換部 502および拡張レイヤ多重化部 107へ出力する。

[0093] 置換部 502は、置換判定部 503から入力される置換判定フラグ flag (m)の値が 0である場合、すなわち置換なしと判定された場合は、 Ee (m)をそのまま拡張レイヤ多重化部 107へ出力する。一方、 flag (m)が 1である場合、すなわち、置換ありと判定された場合は、置換部 502は、 Ee (m)の一部を抽出コアレイヤ符号ィ匕データ Eca (m— 1 )で置換して拡張レイヤ多重化部 107へ出力する。

[0094] 置換判定フラグ flag (m)および拡張レイヤ符号ィ匕データ Ee (m)は、拡張レイヤ多重化部 107において多重化され、送信部 108を介して復号側へ送信される。

[0095] なお、ここでは、スケーラブル符号ィ匕装置 500が、置換判定フラグ flag (m)が 1の場合に、コアレイヤ符号ィ匕データ Ec (m)から抽出部 309にて抽出された後に遅延された抽出コアレイヤ符号ィ匕データ Eca (m- 1)で、置換部 502にて拡張レイヤ符号ィ匕データ Ee (m)の一部を置換する構成として説明した力一部のデータを抽出することなくコアレイヤ符号化データ Ec (m)全体を 1フレーム遅延させたデータ Ec (m— 1) で Ee (m)の一部または全てを置換する構成としても良!、。

[0096] また、ここでは、置換判定フラグ flag (m)が 1の場合に、拡張レイヤ符号化部 102にて符号化された拡張レイヤ符号化データ Ee (m)の一部を、置換部 502にて抽出コアレイヤ符号化データ Eca (m- 1)で置換する構成として説明したが、置換判定フラグ f lag (m)が 1の場合に、拡張レイヤ符号ィ匕部 102にて、 flag (m)が 0の場合に比べて抽出コアレイヤ符号ィ匕データ _Eca (m—1)に相当するビット数だけ少ない符号ィ匕ビット数で、拡張レイヤ符号ィ匕を行い、その結果得られた拡張レイヤ符号ィ匕データ Eep ( m)と抽出コアレイヤ符号ィ匕データ Eca (m—1)を拡張レイヤ多重化部 107に出力するようにしても良い。

[0097] また、ここでは、置換判定部 503での判定の結果、置換判定フラグ flag (m)が 1の場合のみ、置換部 502で Ee (m)の一部を抽出コアレイヤ符号ィ匕データ Eca (m— 1) で置換する構成として説明したが、置換判定部 503での判定結果によらず、常に置換部 502で Ee (m)の一部を抽出コアレイヤ符号化データ Eca (m— 1)で置換するようにしても良い。

[0098] 次、で、スケーラブル符号化装置 500に対応する、本実施の形態に係るスケーラブル復号装置 600について説明する。

[0099] 図 12は、スケーラブル復号装置 600の主要な構成を示すブロック図である。なお、実施の形態 2に示したスケーラブル復号装置 400 (図 9参照）と同一の構成要素には同一の符号を付し、その説明を省略する。また、ここでは、スケーラブル符号ィ匕装置 5 00から送信された第 nフレームの符号化データを受信し、復号処理を行う場合を例にとつて説明する。 nと mとは「n=m」の関係にある。

[0100] 切替部 403aは、拡張レイヤ逆多重化部 202から入力される置換判定フラグ flag (n )の値に基づき、拡張レイヤ逆多重化部 202から入力される拡張レイヤ符号ィ匕データ Ee (n)の中身が Ee (n)そのものである力、それとも抽出拡張レイヤ符号化データ Eea (n)と前フレームの抽出コアレイヤ符号化データ Eca (n— 1)とのセットであるかを判断し、出力先を切り替える。具体的には、切替部 403aは、置換判定フラグ flag (n)が 1である場合、 Eea (n)と Eca (n— 1)とのセットを前フレームコアレイヤ復号部 601および拡張レイヤ復号部 406へ出力する。一方、置換判定フラグ flag (n)が 0である場合、切替部 403aは拡張レイヤ符号化データ Ee (n)を拡張レイヤ復号部 406へ出力する。 [0101] コアレイヤ復号部 405は、パケットロスフラグに基づいて処理を切り替え、第 nフレームにお、てパケットロスがな、場合、コアレイヤ符号ィ匕データ Ec (n)を用いて復号処理を行う。一方、第 nフレームにおいてパケットロスが発生した場合、過去に受信したコアレイヤ符号ィ匕データを用いて誤り補償処理を行ヽ、コアレイヤ復号信号 Dc (n)を生成する。

[0102] 前フレームコアレイヤ復号部 601は、パケットロスフラグと置換判定フラグ flag (n)の双方を用いて、第 n—lフレームでパケットロスが発生し、かつ、符号ィ匕データにおいて一部置換が行われた力否かを判断し、当該条件に該当する場合には、切替部 40 3aから入力される第 n— 1フレームの抽出コアレイヤ符号化データ Eca (n— 1)、コアレイヤ復号部 405から入力される第 nフレームのコアレイヤ符号ィ匕データ、および同じくコアレイヤ復号部 405から入力される第 nフレームより前のコアレイヤ符号ィ匕デ一タを用いて、第 n— 1フレームのコアレイヤ復号信号 Dc_r (n— 1)を生成する。

[0103] 遅延部 602は、コアレイヤ復号部 405から出力される第 nフレームのコアレイヤ復号信号 Dc (n)を 1フレーム遅延させて第 n— 1フレームの復号信号 Dc (n— 1)とした後、これを選択部 603へ出力する。

[0104] 選択部 603は、前フレームコアレイヤ復号部 601からコアレイヤ復号信号 Dc—r (n— 1)が出力されてくる場合は、この信号をコアレイヤ復号信号として出力し、そうでない場合、すなわち遅延部 602からコアレイヤ復号信号 Dc (n—1)が出力されてくる場合は、これを復号信号として出力する。

[0105] 拡張レイヤ復号部 406は、パケットロスフラグに基づ、て処理を切り替え、パケット口スがなヽ場合は通常の復号処理を行って拡張レイヤ復号信号 De (n)を出力する。また、パケットロスが発生した場合は、過去に受信した拡張レイヤ符号ィ匕データとコアレィャ復号部 405で生成される補償データとを用いて誤り補償を行う。通常の復号処理は、より詳細には、切替部 403aから入力される拡張レイヤ符号ィ匕データ Ee (n)もしくは抽出拡張レイヤ符号化データ Eea (n)、拡張レイヤ逆多重化部 202から入力される置換判定フラグ flag (n)、コアレイヤ復号部 405から入力されるコアレイヤ符号ィ匕データ Ec (n)、およびコアレイヤ復号部 405から入力されるコアレイヤ復号信号 Dc (n) を用いて復号処理が行われる。 [0106] 前フレーム拡張レイヤ復号部 604は、パケットロスフラグおよび置換判定フラグ flag (n)に基づき、第 n—1フレームでパケットロスが発生し、かつ、符号化データにおいて一部置換が行われた力否かを判断し、当該条件に該当する場合には、前フレームコアレイヤ復号部 601から入力される第 n— 1フレームのコアレイヤ符号化データ、コアレイャ復号信号、拡張レイヤ復号部 406から入力される第 nフレームの拡張レイヤ符号ィ匕データ、および同じく拡張レイヤ復号部 406から入力される第 nフレームより前の拡張レイヤ符号ィ匕データを用いて、拡張レイヤの誤り補償を行い、拡張レイヤ復号信号 De_r (n— 1)を生成する。

[0107] 遅延部 605は、拡張レイヤ復号部 406から出力される第 nフレームの拡張レイヤ復号信号 De (n)を 1フレーム遅延させて第 n— 1フレームの復号信号 De (n— 1)とした後、これを選択部 606へ出力する。

[0108] 選択部 606は、前フレーム拡張レイヤ復号部 604から拡張レイヤ復号信号 De—r(n —1)が出力されてくる場合は、この信号を拡張レイヤ復号信号として出力し、そうでない場合、すなわち遅延部 605から拡張レイヤ復号信号 De (n—1)が出力されてくる場合は、これを復号信号として出力する。

[0109] 図 13は、本実施の形態に係るスケーラブル復号装置 600の上記復号処理の一連の手順を示すフロー図である。

[0110] まず、スケーラブル復号装置 600は、コアレイヤ復号部 405および拡張レイヤ復号部 406において、パケットロスフラグに基づき、第 nフレームの符号ィ匕データを損失したか否かを判定する（ST3010)。

[0111] ST3010において第 nフレームの符号ィ匕データの損失ありと判定された場合、コアレイヤ復号部 405にお!/、て、第 n— 1フレームのコアレイヤ符号化データ Ec (n— 1) およびコアレイヤ復号信号 Dc (n- 1)を用いた誤り補償処理および復号処理が行われ、第 nフレームのコアレイヤ復号信号 Dc (n)が生成される（ST3020)。また、拡張レイヤ復号部 406で、第 n— 1フレームのコアレイヤ符号化データ Ec (n— 1)、コアレィャ復号信号 Dc (n— 1)、拡張レイヤ符号化データ Ee (n— 1)、および拡張レイヤ復号信号 De (n- 1)を用いた誤り補償処理および復号処理が行われ、第 nフレームの拡張レイヤ復号信号 De (n)が生成される (ST3030)。 [0112] コアレイヤ復号部 405で生成され、遅延部 602を経た第 n— 1フレーム、すなわち 1 フレーム前のコアレイヤ復号信号 Dc (n— 1)と、拡張レイヤ復号部 406で生成され、遅延部 605を経た第 n— 1フレームの拡張レイヤ復号信号 De (n— 1)とが各々出力される（ST3040)。

[0113] 一方、 ST3010において第 nフレームの符号ィ匕データに損失なしと判定された場合、スケーラブル復号装置 600は、コアレイヤ復号部 405において、第 nフレームのコアレイヤ符号化データ Ec (n)を用いたコアレイヤ復号処理を行、、第 nフレームのコアレイヤ復号信号 Dc (n)を生成する（ST3050)。

[0114] 次に、拡張レイヤ復号部 406において、第 nフレームの置換判定フラグ flag (n)が 1 であるか否かが判定される（ST3060)。

[0115] ST3060において置換判定フラグ flag (n)の値が 0の場合、すなわち「置換なし」の場合、拡張レイヤ復号部 406で第 nフレームの拡張レイヤ符号ィ匕データ Ee (n)を用いた拡張レイヤ復号処理が行われ、第 nフレームの拡張レイヤ復号信号 De (n)が生成される（ST3070)。

[0116] コアレイヤ復号部 405で生成され、遅延部 602を経た第 n— 1フレームのコアレイヤ復号信号 Dc (n— 1)と、拡張レイヤ復号部 406で生成され、遅延部 605を経た第 n— 1フレームの拡張レイヤ復号信号 De (n- 1)とが各々出力される（ST3080)。

[0117] 一方、 ST3060において、置換判定フラグ flag (n)の値が 1の場合、すなわち「置換あり」の場合、拡張レイヤ復号部 406で第 nフレームの抽出拡張レイヤ符号ィ匕データ Eea (n)を用いた拡張レイヤ復号処理が行われ、第 nフレームの拡張レイヤ復号信号 De (n)が生成される (ST3090)。

[0118] かかる場合さらに、前フレームコアレイヤ復号部 601において、第 n— 1フレームの符号ィ匕データが損失されたか否かが判定される（ST3100)。

[0119] ST3100において第 n— 1フレームの符号化データに損失がないと判定された場合、コアレイヤ復号部 405で生成され、遅延部 602を経た第 n—lフレームのコアレイャ復号信号 Dc (n— 1)と、拡張レイヤ復号部 406で生成され、遅延部 605を経た第 n 1フレームの拡張レイヤ復号信号 De (n- 1)とが各々出力される（ST3110)。

[0120] ST3100において第 n—1フレームの符号ィ匕データに損失があると判定された場合、前フレームコアレイヤ復号部 601で、第 n—lフレームの抽出コアレイヤ符号化データ Eca (n- 1)を用いて、第 n— 1フレームのコアレイヤ復号信号 Dc_r (n— 1)が生成される。また、前フレーム拡張レイヤ復号部 604で、拡張レイヤ復号部 406の第 n—1 フレームの拡張レイヤ補償処理で生成される補償データを用いて、第 _n— 1フレームの拡張レイヤ復号信号 De— r (n— 1)が生成される。生成されたコアレイヤ復号信号 D c_r (n- 1)および拡張レイヤ復号信号 De_r(n— 1)は、それぞれ選択部 603、 606を介して、第 n— 1フレームの復号信号として出力される（ST3120)。

[0121] なお、ここでは、前フレームコアレイヤ復号部 601の復号処理において必要となる復号状態データをコアレイヤ復号部 405から入力する場合を例にとって説明したが、前フレームコアレイヤ復号部 601およびコアレイヤ復号部 405の間で、双方の復号処理の過程で使用及び更新が必要となる復号状態データを入出力し合うようにしても良い。同様に、前フレーム拡張レイヤ復号部 604および拡張レイヤ復号部 406の間で、双方の復号状態データを入出力し合うようにしても良い。

[0122] また、第 n— 1フレームの拡張レイヤ復号信号 De_r (n— 1)として、前フレームコアレィャ復号部 601にお!/、て第 n— 1フレームの抽出コアレイヤ符号化データ Eca (n—1 )を用いて復号された第 n— 1フレームの低位レイヤ復号信号 Dc_r (n— 1)と同一の信号としても良い。

[0123] 以上説明したように、本実施の形態によれば、符号ィ匕側にて、現フレームの拡張レィャ符号ィ匕データをそれより前のフレームのコアレイヤ複製データで置換するため、符号ィヒ側での余分な遅延は発生しな、代わりに復号側で 1フレーム余分に遅延するようになる。

[0124] よって、本実施の形態は、次に説明するようなケースに最適である。すなわち、コアレイヤ符号化として CELP符号ィ匕を用い、変換符号化として変換長が符号ィ匕フレームの 2倍であるような MDCTを用いる場合、スケーラブル復号装置では、コアレイヤの復号処理に比べて拡張レイヤの復号処理において 1フレーム余分に遅延が発生する。すなわち、拡張レイヤの符号ィ匕 Z復号処理に要するアルゴリズムの遅延力コァレイヤの符号ィ匕 Z復号処理に要するアルゴリズムの遅延よりも必然的に大きくなる [0125] かかる場合、本実施の形態の構成によれば、復号側で余分に生じる遅延を、拡張レイヤの復号処理で元々必要なアルゴリズムに起因する 1フレームの遅延の範囲内に収めることにより、見かけ上遅延の発生を抑えることができる。例えば、上記のケースにおいては、スケーラブル復号装置 600の拡張レイヤ復号部 406において、第 nフレームの復号処理の結果、 1フレーム遅延された第 n— 1フレームの拡張レイヤ復号信号 De (n—1)が必ず生成され出力されることとなる。よって、本実施の形態で説明した遅延部 605は上記ケースにおいて不要となる。

[0126] このように、本実施の形態は、コアレイヤ符号化として CELP符号ィ匕を用い、拡張レィャの符号化として変換符号ィ匕を用いる場合のように、拡張レイヤの符号化 Z復号処理に要するアルゴリズムの遅延力コアレイヤの符号ィ匕 Z復号処理に要するアルゴリズムの遅延よりも大きくなる場合に最適である。

[0127] 以上、本発明の各実施の形態について説明した。

[0128] 本発明に係るスケーラブル符号ィ匕装置、スケーラブル復号装置、およびこれらの方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。

[0129] 本発明に係るスケーラブル符号化装置およびスケーラブル復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。

[0130] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るスケーラブル符号ィ匕方法およびスケーラブル復号方法のアルゴリズムをプログラミング言語によつて記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るスケーラブル符号ィ匕装置およびスケーラブル復号装置と同様の機能を実現することができる。

[0131] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部または全てを含むように 1チップィ匕されても良い。

[0132] また、ここでは LSIとした力集積度の違いによって、 IC、システム LSI、スーパー L SI、ウノレ卜ラ LSI等と呼称されることちある。

[0133] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギユラブル ·プロセッサを利用しても良、。

[0134] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行っても良い。バイオ技術の適応等が可能性としてあり得る。

[0135] 本明細書は、 2005年 10月 14日出願の特願 2005— 300777および 2005年 12月

28日出願の特願 2005— 379335【こ基づく。これらの内容 ίますべてここ【こ含めておく産業上の利用可能性

[0136] 本発明に係るスケーラブル符号ィ匕装置、スケーラブル復号装置、およびこれらの方法は音声符号ィ匕等の用途に適用することができる。

Claims

請求の範囲

[1] 少なくとも低位レイヤと高位レイヤとからなるスケーラブル符号ィ匕装置であって、前記低位レイヤにおける符号ィ匕を行って低位レイヤ符号ィ匕データを生成する低位レイヤ符号化手段と、

前記高位レイヤにおける符号ィ匕を行って高位レイヤ符号ィ匕データを生成する高位レイヤ符号化手段と、

前記低位レイヤ符号化データの複製データを生成する複製手段と、

前記高位レイヤ符号化データの一部を前記複製データで置換する置換手段と、を具備するスケーラブル符号ィ匕装置。

[2] 前記置換手段は、

特定フレームの低位レイヤ符号ィ匕データの前記複製データを用いて、当該特定フレームよりも前または後のフレームの前記高位レイヤ符号ィ匕データを置換する、請求項 1記載のスケーラブル符号化装置。

[3] 所定の判定条件に従って特定フレームを判定する判定手段をさらに具備し、前記置換手段は、

前記判定手段で判定された特定フレームの前記複製データを用いて前記置換を行う、

請求項 2記載のスケーラブル符号化装置。

[4] 前記判定手段は、

音声信号の立ち上がり部を含むフレーム、無声非定常子音部を含むフレーム、または非定常信号の音声フレームを前記特定フレームと判定する、

請求項 3記載のスケーラブル符号化装置。

[5] 前記判定手段は、

入力信号の特性を示すパラメータの変化幅が所定レベル以上であるフレームを前記特定フレームと判定する、

請求項 3記載のスケーラブル符号化装置。

[6] 前記判定手段は、

前記パラメータとして、音声信号のパワー、ピッチ周期、ピッチ予測ゲイン、または L PCパラメータを用いる、

請求項 5記載のスケーラブル符号化装置。

[7] 前記判定手段は、

前記低位レイヤ符号ィヒデータ力の復号データに含まれる符号ィヒ歪みと、前記低位レイヤ符号ィヒデータおよび前記高位レイヤ符号ィヒデータの双方からの復号データに含まれる符号化歪みと、を比較することにより、前記高位レイヤ符号ィ匕データの符号化歪み減少に対する寄与を判断し、当該寄与が所定レベル以下のフレームを前記特定フレームと判定する、

請求項 3記載のスケーラブル符号化装置。

[8] 前記判定手段は、

入力信号の低域エネルギーが全域エネルギーに占める割合を求め、当該割合が所定レベル以上のフレームを前記特定フレームと判定する、

請求項 3記載のスケーラブル符号化装置。

[9] 前記特定フレームの低位レイヤ符号ィ匕データから、一部のデータを抽出する抽出手段をさらに具備し、

前記複製手段は、

前記一部のデータの複製データを生成する、

請求項 2記載のスケーラブル符号化装置。

[10] 前記抽出手段は、

前記一部のデータとして、 LPCパラメータ、適応符号帳ラグ、およびゲインを含むデータを抽出する、

請求項 9記載のスケーラブル符号化装置。

[11] 前記置換手段は、

前記特定フレームよりも前または後のフレームの高位レイヤ符号ィ匕データのうち、一部のデータを前記複製データで置換する、

請求項 2記載のスケーラブル符号化装置。

[12] 前記置換手段は、

前記一部のデータとして、 LPCパラメータ、適応符号帳ラグ、ゲインのいずれもが含まれな!/ヽデータを選択する、

請求項 11記載のスケーラブル符号ィ匕装置。

[13] 少なくとも低位レイヤと高位レイヤとからなるスケーラブル復号装置であって、

高位レイヤ符号化データから低位レイヤ符号化データの複製データを分離する分離手段と、

フレーム損失を検出する検出手段と、

フレーム損失を検出した場合、前記複製データを復号して第 1復号データを生成する低位レイヤ復号手段と、

フレーム損失を検出した場合、前記第 1復号データを用いて損失フレームの補償を行い、第 2復号データを生成する高位レイヤ復号手段と、

を具備するスケーラブル復号装置。

[14] 前記分離手段は、

損失フレームよりも前または後のフレームの高位レイヤ符号ィ匕データ力前記複製データを分離する、

請求項 13記載のスケーラブル復号装置。

[15] 請求項 1記載のスケーラブル符号化装置を具備する通信端末装置。

[16] 請求項 13記載のスケーラブル復号装置を具備する通信端末装置。

[17] 請求項 1記載のスケーラブル符号化装置を具備する基地局装置。

[18] 請求項 13記載のスケーラブル復号装置を具備する基地局装置。

[19] コアレイヤ符号ィ匕データのバックアップデータを拡張レイヤ符号ィ匕データの一部と置換する、

ことを特徴とするスケーラブル符号化方法。

[20] 少なくとも低位レイヤと高位レイヤとからなるスケーラブル符号ィ匕装置において使用されるスケーラブル符号ィ匕方法であって、

前記低位レイヤにおける符号ィ匕を行って低位レイヤ符号ィ匕データを生成する工程と、

前記高位レイヤにおける符号ィ匕を行って高位レイヤ符号ィ匕データを生成する工程と、前記低位レイヤ符号化データの複製データを生成する工程と、

前記高位レイヤ符号化データの一部を前記複製データで置換する工程と、を具備するスケーラブル符号化方法。

少なくとも低位レイヤと高位レイヤとからなるスケーラブル復号装置において使用されるスケーラブル復号方法であって、

高位レイヤ符号化データから低位レイヤ符号化データの複製データを分離するェ程と、

フレーム損失を検出する工程と、

フレーム損失を検出した場合、前記複製データを復号して第 1復号データを生成する工程と、

フレーム損失を検出した場合、前記第 1復号データを用いて損失フレームの補償を行い、第 2復号データを生成する工程と、

を具備するスケーラブル復号方法。