WO2006035705A1

WO2006035705A1 - スケーラブル符号化装置およびスケーラブル符号化方法

Info

Publication number: WO2006035705A1
Application number: PCT/JP2005/017618
Authority: WO
Inventors: Michiyo Goto; Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-09-28
Filing date: 2005-09-26
Publication date: 2006-04-06
Also published as: BRPI0516201A; CN101027718A; EP1801782A1; JP4555299B2; EP1801782A4; JPWO2006035705A1; KR20070061843A; US20080255832A1

Abstract

　ステレオ音声信号に対し、ＣＥＬＰ符号化によるスケーラブル符号化を実現し、符号化効率を向上させることができるスケーラブル符号化装置を開示する。この装置において、加算器（１０１）および乗算器（１０２）は、第１チャネル信号ＣＨ１および第２チャネル信号ＣＨ２の平均を求め、モノラル信号Ｍとする。ＣＥＬＰ符号化部（１０３）は、モノラル信号Ｍに対しＣＥＬＰ符号化を行う。第１チャネル差分情報符号化部（１０４）は、第１チャネル信号ＣＨ１に対してＣＥＬＰ符号化に準じた符号化を行い、この過程で得られる符号化パラメータと、ＣＥＬＰ符号化部（１０３）から出力される符号化パラメータとの差分を求める。そして、第１チャネル差分情報符号化部（１０４）は、この差分に対して符号化を行い、得られた符号化パラメータを出力する。

Description

明細書

スケーラブル符号化装置およびスケーラブル符号化方法

技術分野

[0001] 本発明は、ステレオ音声信号に対し、 CELP方式による符号ィ匕（以下、単に CELP 符号化と略すことがある）によってスケーラブル符号ィ匕を実現するスケーラブル符号化装置およびスケーラブル符号化方法に関する。

背景技術

[0002] 携帯電話機による通話のように、移動体通信システムにおける音声通信では、現在、モノラル方式による通信 (モノラル通信）が主流である。しかし、今後、第 4世代の移動体通信システムのように、伝送レートのさらなる高ビットレートイ匕が進めば、複数チヤネルを伝送するだけの帯域を確保できるようになるため、音声通信にぉ、てもステレォ方式による通信 (ステレオ通信）が普及することが期待される。

[0003] 例えば、音楽を HDD (ノヽードディスク)搭載の携帯オーディオプレーヤに記録し、このプレーヤにステレオ用のイヤホンやヘッドフォン等を装着してステレオ音楽を楽しむユーザが増えている現状を考えると、将来、携帯電話機と音楽プレーヤとが結合し、ステレオ用のイヤホンやヘッドフォン等の装備を利用しつつ、ステレオ方式による音声通信を行うライフスタイルが一般的になることが予想される。また、最近普及しつつある TV会議等の環境において、臨場感ある会話を可能とするため、やはりステレオ通信が行われるよう〖こなることが予想される。

[0004] ところが、ステレオ通信が普及しても、依然としてモノラル通信も行われると予想される。何故なら、モノラル通信は低ビットレートであるため通信コストが安くなることが期待され、また、モノラル通信のみに対応した携帯電話機は回路規模が小さくなるため安価となり、高品質な音声通信を望まないユーザは、モノラル通信のみに対応した携帯電話機を購入するだろうからである。よって、一つの通信システム内において、ステレオ通信に対応した携帯電話機とモノラル通信に対応した携帯電話機とが混在するようになり、通信システムは、これらステレオ通信およびモノラル通信の双方に対応する必要性が生じる。 [0005] また、移動体通信システムは無線信号によって通信データをやりとりするため、伝搬路環境によっては通信データの一部を失う場合がある。そこで、力かる場合でも残りの受信データ力元の通信データを復元することができる機能を携帯電話機が有していれば非常に有用である。

[0006] ステレオ通信およびモノラル通信の双方に対応することができ、かつ、通信データの一部を失っても残りの受信データ力元の通信データを復元することができる機能として、ステレオ信号とモノラル信号とからなるスケーラブル符号ィ匕がある。この機能を有したスケーラブル符号ィ匕装置の例として、例えば、非特許文献 1に開示されたものがある。

非特許文献 l : ISO/IEC 14496-3:1999 (B.14 Scalable AAC with core coder) 発明の開示

発明が解決しょうとする課題

[0007] しかしながら、非特許文献 1に開示のスケーラブル符号ィ匕装置は、オーディオ信号を対象にしたものであり音声信号は想定していないため、音声信号に対しそのまま適用すると、符号ィ匕効率が低下するという問題がある。すなわち、音声信号に対しては、効率的な符号ィ匕が可能な CELP符号ィ匕を適用することが望まれるが、非特許文献 1には、 CELP方式を適用した場合の、特に拡張レイヤにおいて CELP符号ィ匕を適用する場合の具体的な構成は示されておらず、想定外である音声信号に対して最適化されている CELP符号ィ匕をそのまま適用しても、望ましい符号ィ匕効率を得るのは困難である。

[0008] よって、本発明の目的は、ステレオ音声信号に対し、 CELP符号ィ匕によるスケーラブル符号化を実現し、符号ィ匕効率を向上させることができるスケーラブル符号ィ匕装置およびスケーラブル符号ィ匕方法を提供することである。

課題を解決するための手段

[0009] 本発明のスケーラブル符号化装置は、ステレオ音声信号からモノラル音声信号を生成する生成手段と、前記モノラル音声信号を CELP方式で符号化して前記モノラル音声信号の符号化パラメータを得る第 1の符号化手段と、前記ステレオ音声信号の Rチャネルまたは Lチャネルの、ずれかを符号化対象チャネルとし、前記符号化対象チャネルに対し線形予測分析および適応音源符号帳探索を行って得られるノメータと前記モノラル音声信号の符号化パラメータとの差分をとり、前記差分力前記符号化対象チャネルの符号化パラメータを得る第 2の符号化手段と、を具備する構成を採る。

発明の効果

[0010] 本発明によれば、ステレオ音声信号に対し、 CELP符号ィ匕によるスケーラブル符号化を実現することができ、符号ィ匕効率を向上させることができる。

図面の簡単な説明

[0011] [図 1]実施の形態 1に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 2]モノラル信号と第 1チャネル信号および第 2チャネル信号との関係を示す図 [図 3]実施の形態 1に係る CELP符号ィ匕部内部の主要な構成を示すブロック図圆 4]実施の形態 1に係る第 1チャネル差分情報符号ィ匕部内部の主要な構成を示すブロック図

[図 5]実施の形態 2に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 6]実施の形態 2に係る第 2チャネル差分情報符号ィ匕部内部の主要な構成を示すブロック図発明を実施するための最良の形態

[0012] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、 2チャネル力なるステレオ音声信号を符号ィ匕する場合を例にとって説明し、また、以下に示す第 1チャネルおよび第 2チャネルとは、それぞれ Lチャネルおよび Rチャネル、またはその逆のチャネルのことを示して、る。

[0013] (実施の形態 1)

図 1は、本発明の実施の形態 1に係るスケーラブル符号ィ匕装置 100の主要な構成を示すブロック図である。このスケーラブル符号ィ匕装置 100は、加算器 101、乗算器 102、 CELP符号ィ匕部 103、および第 1チャネル差分情報符号ィ匕部 104を備える。

[0014] スケーラブル符号ィ匕装置 100の各部は以下の動作を行う。

[0015] 加算器 101は、スケーラブル符号ィ匕装置 100に入力された第 1チャネル信号 CH1 および第 2チャネル信号 CH2を加算し、和信号を生成する。乗算器 102は、この和信号に 1Z2を乗じてスケールを半分とし、モノラル信号 Mを生成する。すなわち、加算器 101および乗算器 102は、第 1チャネル信号 CH1および第 2チャネル信号 CH2 の平均信号を求め、これをモノラル信号 Mとする。

[0016] CELP符号化部 103は、このモノラル信号 Mに対し CELP符号化を行い、得られたモノラル信号の CELP符号ィ匕パラメータをスケーラブル符号ィ匕装置 100の外部および第 1チャネル差分情報符号ィ匕部 104に出力する。ここで、 CELP符号ィ匕パラメータとは、 LSPパラメータ、適応音源符号帳インデックス、適応音源ゲイン、固定音源符号帳インデックス、および固定音源ゲインのことである。

[0017] 第 1チャネル差分情報符号ィ匕部 104は、スケーラブル符号ィ匕装置 100に入力された第 1チャネル信号 CH1に対し、 CELP符号化に準じた符号化、すなわち、線形予測分析、適応音源符号帳探索、および固定音源符号帳探索による符号化を行い、この過程で得られる符号化パラメータと、 CELP符号ィ匕部 103から出力される CELP符号化パラメータとの差分を求める。なお、この符号ィ匕についても単に CELP符号ィ匕と呼ぶこととすると、上記の処理は、モノラル信号 Mと第 1チャネル信号 CH1とに対し、 CELP符号ィ匕パラメータのレベル (段階)で差分をとることに相当する。そして、第 1チャネル差分情報符号ィ匕部 104は、この第 1チャネルに関する差分情報 (第 1チャネル差分情報）に対して符号化を行い、得られた第 1チャネル差分情報の符号化パラメ一タをスケーラブル符号ィ匕装置 100の外部に出力する。

[0018] このスケーラブル符号ィ匕装置 100の 1つの特徴は、加算器 101、乗算器 102、および CELP符号ィ匕部 103によって第 1レイヤを、第 1チャネル差分情報符号ィ匕部 104によって第 2レイヤを構成し、第 1レイヤ力もは、モノラル信号の符号ィ匕パラメータが出力され、第 2レイヤからは、第 1レイヤ (モノラル信号)の符号ィ匕パラメータと併せて復号することによりステレオ信号を得ることができる符号化パラメータが出力されることである。すなわち、本実施の形態に係るスケーラブル符号ィ匕装置は、モノラル信号とステレオ信号とからなるスケーラブル符号ィ匕を実現する。

[0019] この構成により、上記の第 1レイヤおよび第 2レイヤ力もなる符号化パラメータを取得する復号装置は、ステレオ通信およびモノラル通信の双方に対応したスケーラブル復号装置であっても良いし、モノラル通信のみに対応した復号装置であっても良い。また、ステレオ通信およびモノラル通信の双方に対応したスケーラブル復号装置であつても、伝送路環境の悪化により、第 2レイヤの符号ィ匕パラメータを取得することができず、第 1レイヤの符号化パラメータしか取得できない場合も考えられる。しかし、力力る場合であっても、このスケーラブル復号装置は、低品質ではあるがモノラル信号を復号することができる。また、このスケーラブル復号装置が第 1レイヤおよび第 2レイャの符号ィ匕パラメータを取得することができた場合、これら双方のパラメータを用いて高品質なステレオ信号を復号することができる。

[0020] 以下に、スケーラブル符号ィ匕装置 100から出力される第 1レイヤおよび第 2レイヤの符号化パラメータによって、復号装置力 Sステレオ信号を復号することができる原理について説明する。図 2は、モノラル信号と第 1チャネル信号および第 2チャネル信号との関係について、符号ィ匕前後の状態を比較しながら示す図である。

[0021] モノラル信号 Mは、第 1チャネル信号 CH1および第 2チャネル信号 CH2の和に 1 Z2を乗じて、すなわち、次の（式 1)によって求めることができる。

M= (CHl + CH2) /2 …（式 1)

よって、モノラル信号 Mに対する CH1の差分 (第 1チャネル信号差分)を Δ CH1とすると、 CH1は、図 2Aに示すように、次の（式 2)の関係を満たす。

CH1 = M+ Δ ΟΗ1 …（式 2)

従って、 CH1が符号ィ匕パラメータであった場合、これを復号するためには Mおよび Δ CH1の双方の符号化パラメータを復号すれば良いことがわかる。

[0022] 同様に、第 2チャネル信号 CH2につ、ても、モノラル信号 Mに対する CH2の差分（第 2チャネル信号差分)を Δ CH2として、以下の（式 3)の関係がある。

CH2 = M+ A CH2 …（式 3)

そこで、以下の（式 4)のように近似することができれば、上記 (式 3)は（式 5)のようになる。

A CH1 = - A CH2 …（式 4)

CH2 = M- Δ ΟΗ1 …（式 5)

従って、上記 (式 4)の近似が成り立てば、 CH1の符号化パラメータと同様に、 CH2 の符号化パラメータを Mおよび Δ CH1の双方の符号化パラメータを復号することによって、間接的に復号することができることがわかる。

[0023] しかし、符号ィ匕を経ることにより、通常、符号化歪みが発生するため、図 2Bに示すように、符号ィ匕後においては厳密には A CHlと A CH2の大きさは異なってくる。よつて、上記 (式 4)の意味するところは、符号化後の第 1チャネル差分情報および第 2チャネル差分情報の大きさが等しいと近似すること、換言すれば、第 1チャネルおよび第 2チャネルをそれぞれ符号ィ匕した際の双方の符号ィ匕歪みが等しいと近似するということである。実際、これらの符号ィ匕歪みは、実機においても大きく異なることはないので、第 1チャネルおよび第 2チャネルの符号ィ匕歪みの差を無視して符号ィ匕を行っても、復号信号の音質の大きな劣化にはつながらないと考えることができる。

[0024] そこで、本実施の形態に係るスケーラブル符号ィ匕装置 100は、上記の原理を利用して、 Mおよび A CHlの 2つの符号ィ匕パラメータを出力する。これらを取得した復号装置は、 Mおよび A CHlを復号することによって、 CH1だけでなぐ CH2も復号することがでさる。

[0025] 図 3は、 CELP符号ィ匕部 103内部の主要な構成を示すブロック図である。

[0026] この CELP符号化部 103は、 LPC分析部 111、 LPC量子化部 112、 LPC合成フィルタ 113、加算器 114、聴感重み付け部 115、歪み最小化部 116、適応音源符号帳 117、乗算器 118、固定音源符号帳 119、乗算器 120、ゲイン符号帳 121、および加算器 122を備える。

[0027] LPC分析部 111は、乗算器 102から出力されたモノラル信号 Mに対して線形予測分析を施し、分析結果である LPCパラメータを LPC量子化部 112および聴感重み付け部 115へ出力する。

[0028] LPC量子化部 112は、 LPC分析部 111から出力された LPCパラメータを量子化に適した LSPパラメータに変換した後に量子化し、得られる量子化 LSPパラメータ（C ) しを CELP符号ィ匕部 103の外部に出力する。この量子化 LSPパラメータは、 CELP符号ィ匕部 103によって得られる CELP符号ィ匕パラメータの 1つである。また、 LPC量子化部 112は、この量子化 LSPパラメータを量子化 LPCパラメータに再変換後、これを LPC合成フィルタ 113へ出力する。

[0029] LPC合成フィルタ 113は、 LPC量子化部 112から出力される量子化 LPCパラメ一タを用いて、後述の適応音源符号帳 117および固定音源符号帳 119で生成された音源ベクトルを駆動音源として LPC合成フィルタによる合成を行う。得られた合成信号は、加算器 114へ出力される。

[0030] 加算器 114は、 LPC合成フィルタ 113から出力された合成信号の極性を反転させ、モノラル信号 Mに加算することにより誤差信号を算出し、この誤差信号を聴感重み付け部 115へ出力する。この誤差信号が符号化歪みに相当する。

[0031] 聴感重み付け部 115は、 LPC分析部 111から出力された LPCパラメータに基づいて構成される聴感重み付けフィルタを用いて、加算器 114から出力された符号ィ匕歪みに対して聴感的な重み付けを行、、この信号を歪み最小化部 116へ出力する。

[0032] 歪み最小化部 116は、聴感重み付け部 115から出力される符号ィ匕歪みが最小となるように、適応音源符号帳 117、固定音源符号帳 119、およびゲイン符号帳 121〖こ対し各種パラメータを指示する。具体的には、歪み最小化部 116は、適応音源符号帳 117、固定音源符号帳 119、およびゲイン符号帳 121に対して、使用するインデッタス (C 、C 、C )を指示する。

A D G

[0033] 適応音源符号帳 117は、過去に生成された LPC合成フィルタ 113への駆動音源の音源ベクトルを内部バッファに記憶しており、歪み最小化部 116から指示されたインデッタスに対応する適応音源ラグに基づいて、この記憶されている音源ベクトルから 1 サブフレーム分を生成し、適応音源ベクトルとして乗算器 118へ出力する。

[0034] 固定音源符号帳 119は、歪み最小化部 116から指示されたインデックスに対応する音源ベクトルを、固定音源ベクトルとして乗算器 120へ出力する。

[0035] ゲイン符号帳 121は、歪み最小化部 116から指示されたインデックスに対応するゲイン、具体的には、適応音源符号帳 117からの適応音源ベクトル、および固定音源符号帳 119からの固定音源ベクトル、に対する各ゲインを生成し、乗算器 118、 120 へそれぞれ出力する。

[0036] 乗算器 118は、ゲイン符号帳 121から出力された適応音源ゲインを、適応音源符号帳 117から出力された適応音源ベクトルに乗じ、加算器 122へ出力する。

[0037] 乗算器 120は、ゲイン符号帳 121から出力された固定音源ゲインを、固定音源符号帳 119から出力された固定音源ベクトルに乗じ、加算器 122へ出力する。 [0038] 加算器 122は、乗算器 118から出力された適応音源ベクトルと、乗算器 120から出力された固定音源ベクトルとを加算し、加算後の音源ベクトルを駆動音源として LPC 合成フィルタ 113に出力する。また、加算器 122は、得られた駆動音源の音源べタトルを適応音源符号帳 117へフィードバックする。

[0039] LPC合成フィルタ 113は、前述の通り、加算器 122から出力される音源ベクトル、すなわち、適応音源符号帳 117および固定音源符号帳 119で生成された音源ベクトルを駆動音源として LPC合成フィルタによる合成を行う。

[0040] このように、適応音源符号帳 117および固定音源符号帳 119で生成された音源べタトルを用いて符号ィ匕歪みが求められる一連の処理は、閉ループ (帰還ループ）となつており、歪み最小化部 116は、この符号ィ匕歪みが最小となるように、適応音源符号帳 117、固定音源符号帳 119、およびゲイン符号帳 121に対して指示を行う。そして、歪み最小化部 116は、符号ィ匕歪みが最小となる各種 CELP符号化パラメータ (C 、

A

C 、C )を CELP符号ィ匕部 103の外部に出力する。

D G

[0041] 図 4は、第 1チャネル差分情報符号ィ匕部 104内部の主要な構成を示すブロック図である。

[0042] この第 1チャネル差分情報符号化部 104は、第 1チャネル信号 CH1の音源成分のノラメータとスペクトル包絡成分のパラメータとをモノラル信号 Mからの差分として符号化する。ここで、音源成分のパラメータとは、適応音源符号帳インデックス、適応音源ゲイン、固定音源符号帳インデックス、および固定音源ゲインのことであり、また、スベクトル包絡成分のパラメータとは、 LPC分析を行って得られる LPCパラメータのことである。

[0043] なお、第 1チャネル差分情報符号化部 104において、 LPC分析部 131、 LPC合成フィルタ 133、加算器 134、聴感重み付け部 135、歪み最小化部 136、乗算器 138、乗算器 140、および加算器 142は、上記の CELP符号化部 103における、 LPC分析部 111、 LPC合成フィルタ 113、加算器 114、聴感重み付け部 115、歪み最小化部 116、乗算器 118、乗算器 120、および加算器 122とそれぞれ同様の構成であるため、説明を省略し、 CELP符号ィ匕部 103と異なる構成について以下詳細に説明する [0044] 差分量子化部 132は、 LPC分析部 131で得られる第 1チャネル信号 CH1の LPC パラメータ ω (i)と、 CELP符号化部 103で既に求められているモノラル信号 Mの LP Cパラメータ（C )との差分を求め、この差分を量子化することによって、第 1チャネル

し

差分情報のスペクトル包絡成分の符号ィ匕パラメータ Δ ω (i)とし、第 1チャネル差分情報符号ィ匕部 104の外部に出力する。また、差分量子化部 132は、第 1チャネル信号の LPCパラメータの量子化パラメータ ω (i)を LPC合成フィルタ 133に出力する。

[0045] ゲイン符号帳 143は、 CELP符号ィ匕部 103から出力されるモノラル信号用のゲイン符号帳インデックスに基づヽて、これに対応する適応音源ゲインおよび固定音源ゲインを生成し、乗算器 138、 140にそれぞれ出力する。

[0046] 適応音源符号帳 137は、過去のサブフレームにおいて生成された駆動音源を内部ノッファに蓄積している。有声音の場合、適応音源符号帳 137のバッファの過去の駆動音源は、現フレームのピッチ波形の駆動音源波形と強い相関があるため、適応音源符号帳 137は、このピッチ周期に相当する過去の駆動音源を切り出し、それを周期的に繰り返した信号を駆動音源としての第一近似とする。そして、適応音源符号帳 137は、このピッチ周期、すなわち、適応音源ラグを符号化する。特に、適応音源符号帳 137は、 CH1のピッチ周期を、 CELP符号ィ匕部 103で既に符号ィ匕されたモノラル信号 Mのピッチ周期からの差分として符号ィ匕する。これは、モノラル信号 Mは、第 1チャネル信号 CH1と第 2チャネル信号 CH2とから生成された信号であるため、自ずと第 1チャネル信号 CH1と類似性が高いと考えられるためである。すなわち、第 1 チャネル信号 CH1に対し、新たに適応音源符号帳探索を行うよりも、モノラル信号 M に対して得られたピッチ周期を基準として、このピッチ周期からの差分として第 1チヤネル信号 CH1のピッチ周期を表現した方が符号ィ匕効率か高いと考えられるためである。具体的には、モノラル信号に対して既に算出されたピッチ周期 T と、その値から

M

の差分パラメータである ΔΤとを用いて、 CH1のピッチ周期 Tを次の（式 6)で表し、 CH1に対する適応音源符号帳探索によって最適な Tを得るときの差分パラメータ Δ Tを符号化する。

[数 1]

Τ = Τ_Μ + ^ ··■ (式 6 ) [0047] 固定音源符号帳 139は、現フレームの音源成分のうち、適応音源符号帳 137で過去の音源に基づヽて生成される音源信号では近似できなヽ残差成分に対し、この成分を表現する音源信号を生成する。この残差成分は、適応音源符号帳 137で生成される成分に比べ、相対的に合成信号に対する寄与が少ない。また、既に述べたように、モノラル信号 Mと第 1チャネル信号 CH1との類似性は高い。よって、固定音源符号帳 139は、 CH1の固定音源符号帳インデックスとして、固定音源符号帳 119で使用されたモノラル信号 M用の固定音源符号帳インデックスを用いる。これは、 CH1の固定音源ベクトルをモノラル信号の固定音源ベクトルと同一信号とすることに相当する。

[0048] ゲイン符号帳 141は、 CH1用の適応音源ベクトルのゲインを、モノラル信号用の適応音源ゲインと、この適応音源ゲインに乗じる係数という 2つのパラメータによって特定する。また、 CH1用の固定音源ベクトルのゲインについても同様で、ゲイン符号帳 141は、モノラル信号用の固定音源ゲインと、この固定音源ゲインに乗じる係数という 2つのパラメータによって CH1用の固定音源ベクトルのゲインを特定する。しかも、これら 2つの係数は、共通のゲイン乗数値 γ として決定され、乗算器 144に出力される。 Ί の決定方法は、 CH1の合成信号と CH1の原信号との誤差が最小になるように、あらかじめ用意された CH1用のゲイン符号帳力も最適なゲインインデックスを選択するようにして行う。

[0049] 乗算器 144は、加算器 142から出力された駆動音源 ex 'に γ を乗算して exとし、 LPC合成フィルタ 133に出力する。

[0050] このように、本実施の形態によれば、ステレオ信号を構成する第 1チャネル信号 CH 1と第 2チャネル信号 CH2とからモノラル信号を生成し、モノラル信号の CELP符号化を行うと共に、 CH1を符号ィ匕する際には、モノラル信号の CELPパラメータからの差分として符号化を行う。よって、低ビットレートで、かつ品質のよいステレオ信号の符号ィ匕を実現することができる。

[0051] また、以上の構成において、 A CHlの符号ィ匕方法は、モノラル信号の CELP符号化パラメータとそれに対する差分パラメータとを用い、これらにより生成される CH1の合成信号と CH1の原信号との誤差が最小となるように、 CELP符号ィ匕の差分パラメータを決定する。

[0052] また、以上の構成において、第 2レイヤの符号ィ匕対象は、モノラル信号と第 1チヤネル信号との波形上における差分ではなぐ CELP符号ィヒパラメータの段階で差分をとつたものである。この理由は、 CELP符号ィ匕は、そもそも人間の声帯'声道をモデル化して符号化を行う技術であり、波形上で差分をとると、得られる差分情報は CELP 符号ィ匕のモデルとは物理的に対応しないものになってしまうと考えられるためである。よって、波形上の差分を対象に行う CELP符号化によっては効率的な符号化を行うことができないと考えられるため、本発明では CELP符号ィ匕パラメータの段階で差分をとる。

[0053] また、以上の構成にお!、て、モノラル信号に対する CH2の差分 Δ CH2は、上記の近似式 (式 4)によって求めることとし、符号ィ匕は行わない。そして、本実施の形態に係るスケーラブル符号ィ匕装置で生成された符号ィ匕パラメータを受信した復号装置は、受信した Δ CH1の符号化パラメータ力上記 (式 5)の計算によって復号信号を得ることがでさる。

[0054] なお、本実施の形態では、固定音源符号帳 139が、固定音源符号帳 119と同一のインデックスを用いる場合、すなわち、固定音源符号帳 139が、モノラル信号用の固定音源ベクトルと同一の固定音源ベクトルを生成する場合を例にとって説明した。しかし、本発明はこれに限定されず、例えば、モノラル信号の固定音源ベクトルに加算するような付加的な固定音源ベクトルを求めるため、固定音源符号帳 139に対し固定音源符号帳探索を行い、 CH1用に付加する固定音源符号帳インデックスを求めるようにしても良い。この場合、符号ィ匕ビットレートは増加するが、より高音質な CH1 の符号ィ匕を実現することができる。

[0055] また、本実施の形態では、ゲイン符号帳 141から出力される γ のように、適応音源ゲインに乗じる係数と固定音源ゲインに乗じる係数とが共通である場合を例にとって説明した。しかし、これら 2つの係数は共通でなくても良い。すなわち、適応音源ゲインに乗じる係数を γ

1、固定音源ゲインに乗じる係数を γ

2として、個別に符号ィ匕するような構成としても良い。力かる場合、 y の決定方法は、ゲインを共通とする場合と同様に、 CH1の合成信号と CH1の原信号との誤差が最小になるように、あらかじめ用意された CHI用のゲイン符号帳カゝら最適なゲインインデックスを選択するように行う。このとき、 γ の決定方法も γ の決定方法と同様に、 CH2の合成信号と CH2の原

2 1

信号との誤差が最小になるように、あら力じめ用意された CH2用のゲイン符号帳から最適なゲインインデックスを選択するようにして行う。

[0056] (実施の形態 2)

実施の形態 1においては、第 1チャネルの符号ィ匕歪みと第 2チャネルの符号ィ匕歪みとが近似的に等しいと仮定し、第 1レイヤおよび第 2レイヤの 2層によって符号ィ匕を行ぅスケーラブル符号ィ匕装置の構成を示した。本実施の形態では、 CH2をより精度良く符号ィ匕するために新たに第 3レイヤを設け、この第 3レイヤにおいて、第 1チャネルおよび第 2チャネルの符号ィ匕歪みの差の符号化、より具体的には、第 1チャネル差分情報に含まれる符号化歪みと第 2チャネル差分情報に含まれる符号化歪みとの差分をさらに符号化し、これを新たな符号化情報として出力する構成を示す。

[0057] 具体的には、 A CH1に含まれる量子化誤差 (符号ィ匕歪み）を減じるように以下の Δ CH2'を定義し、符号化を行う。より詳細には、第 1レイヤで符号化されたモノラル信号および第 2レイヤで符号化された Δ CH1から推定される CH2の予測信号 CH2' ( =Μ— A CHl)に対する CH2の差分信号 A CH2，（ = CH2— M+ A CHl)を符号化する。

[0058] ここで、 A CH2'の符号化方法は、モノラル信号の CELP符号化パラメータおよび第 2レイヤで符号化された差分 CELPパラメータの双方のパラメータを用いて推定される CH2の CELP符号ィ匕パラメータと、それに対する補正パラメータとを用い、これらにより生成される CH2の合成信号と CH2の原信号との誤差が最小になるように、上記の補正パラメータを決定する。第 2レイヤと同様に、波形上における差分そのものの CELP符号ィ匕を行わな、理由は、実施の形態 1と同様である。

[0059] これにより、モノラル信号とステレオ信号とでスケーラビリティを有し、精度の良い、し力も効率的なステレオ符号ィ匕が可能である。 CH2の CELP符号ィ匕パラメータを、モノラルのパラメータおよび CH1におけるモノラルに対する差分パラメータを用いて推定し、それに対する誤差分を符号化する構成とすることで、より効率的な符号化を行うことがでさる。 [0060] 図 5は、本発明の実施の形態 2に係るスケーラブル符号ィ匕装置 200の主要な構成を示すブロック図である。このスケーラブル符号ィ匕装置 200は、実施の形態 1に示したスケーラブル符号ィ匕装置 100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。新規な構成は、第 3レイヤを構成する第 2チャネル差分情報符号ィ匕部 201である。

[0061] 図 6は、第 2チャネル差分情報符号ィ匕部 201内部の主要な構成を示すブロック図である。

[0062] なお、この第 2チャネル差分情報符号ィ匕部 201において、 LPC分析部 211、差分量子化部 212、 LPC合成フィルタ 213、加算器 214、聴感重み付け部 215、歪み最小化部 216、適応音源符号帳 217、乗算器 218、固定音源符号帳 219、乗算器 22 0、ゲイン符号帳 221、加算器 222、ゲイン符号帳 223、および乗算器 224は、上記の第 1チャネル差分情報符号ィ匕部 104における、 LPC分析部 131、差分量子化部 1 32、 LPC合成フィルタ 133、加算器 134、聴感重み付け部 135、歪み最小化部 136 、適応音源符号帳 137、乗算器 138、固定音源符号帳 139、乗算器 140、ゲイン符号帳 141、加算器 142、ゲイン符号帳 143、および乗算器 144とそれぞれ同様の構成であるため、説明を省略する。

[0063] 第 2チャネルラグパラメータ推定部 225は、モノラル信号のピッチ周期 T と、 CH1

M

の CELP符号ィ匕パラメータである ΔΤとを用いて、 CH2のピッチ周期（適応音源ラグ )を予測し、予測値 T 'を適応音源符号帳 217に出力する。ここで、 CH1の CELP符

2

号化パラメータ ΔΤは、モノラル信号のピッチ周期 T に対する CH1のピッチ周期 T

1 M l の差分として求められる。

[0064] 第 2チャネル LPCパラメータ推定部 226は、モノラル信号の LPCパラメータ ω (i)

M

と、 CHIの LPCパラメータ ω (i)とを用いて、 CH2の LPCパラメータを予測し、予測値 ω ' (i)を差分量子化部 212に出力する。

2

[0065] 第 2チャネル音源ゲイン推定部 227は、モノラル信号の駆動音源が CH1および CH 2の駆動音源から上記 (式 1)によって求められることを利用し、 CH1のゲイン乗数値 Ύ 力 CH2のゲイン乗数値を逆算によって予測し、予測値 γ ，を乗算器 228に出

1 2

力する。この予測値 γ ，は、ゲイン符号帳 221から出力される第 2チャネル音源ゲイン Δγ に乗じられる。

2

歪み最小化部 216によって制御される閉ループの符号化、すなわち、第 2チャネル信号 CH2のピッチ周期 (適応音源ラグ) Τの符号化の方法は、すでに符号化された

2

モノラル信号のピッチ周期 Τ と、この Τ と CH1のピッチ周期 Τとの差分 ΔΤを用い

M M 1 1 て、 CH2のピッチ周期 Tを予測し (予測値 T，）、その予測されたピッチ周期 T，から

2 2 2 の差分 (誤差成分)を符号化することにより行われる。まず、次の (式 7)を仮定する。

[数 2]

T_M ^(T_{l +}T₂)/2 ■■■ (式 7)

また、以下の（式 8)の関係があるので、 Τの予測値 Τ 'は、上記（式 7)から（式 9)の

2 2

ように表される。

[数 3]

Τ_λ =Τ_Μ+ Τ, ··· (式 8)

画

Τ 2Τ_Μ-Ί … （式 9)

この（式 9)に (式 8)を代入すると、以下の（式 10)となる。

[数 5]

Τ₂' = Τ_Μ-ΑΤ, ··· (式 1 0 )

よって、 CH2のピッチ周期 Τを、その予測値 Τ，とそれに対する補正値 ΔΤにより

2 2 2

、以下の（式 11)で表す。

[数 6]

Τ₂ =Τ₂'+ΑΤ₂ … （式 1 1 )

(式 11)に（式 10)を代入して以下の（式 12)となる。

[数 7]

Τ₂ =(Γ -ΔΓ₁) + ΔΓ₂ … （式 1 2 )

本実施の形態に係るスケーラブル符号ィ匕装置は、 CH2に対する適応音源符号帳の探索を行い、最適な Τを得るときの補正パラメータ ΔΤを符号化する。ここで、 ΔΤ

2 2

は、モノラルのパラメータ Τ および CH1におけるモノラルに対する差分パラメータ Δ を用いて推定した予測値に対する誤差分であるので、 ΔΤ^に比べて微小な値であり、より効率的な符号ィ匕を行うことができる。

[0067] 固定音源符号帳 219は、第 1チャネル差分情報符号化部 104の固定音源符号帳 1 39と同様に、現フレームの音源成分のうち、適応音源符号帳 217で生成される音源信号では近似できない残差成分に対する音源信号を生成する。また、固定音源符号帳 219は、やはり固定音源符号帳 139と同様に、 CH2の固定音源符号帳インデックスとして、モノラル信号 Μの固定音源符号帳インデックスを用いる。すなわち、 CH2 の固定音源ベクトルをモノラル信号の固定音源ベクトルと同一信号とする。

[0068] なお、実施の形態 1と同様に、モノラル信号の固定音源ベクトルに加算するような付加的な固定音源ベクトルを求めるため、固定音源符号帳 219に対し固定音源符号帳探索を行い、 CH2用に付加する固定音源符号帳インデックスを求めるようにしても良い。この場合、符号化ビットレートは増加するがより高音質な CH2の符号化を実現できる。

[0069] ゲイン符号帳 221は、 CH2用の音源ベクトルのゲインを、モノラル信号用の適応音源ゲインおよび固定音源ベクトルのゲインの双方に共通に乗じるゲイン乗数値 y と

2 して特定する。具体的には、ゲイン符号帳 221は、 CELP符号ィ匕部 103においてモノラル信号用のゲインが、第 1チャネル差分情報符号ィ匕部 104において CH1用のゲイン乗数値 γ

1が既に求められているので、これらにより予測される予測推定値 γ

2 'を求め、この予測推定値 γ ，に対する補正値 Δ γ を決定することによって CH2の乗

2 2

数値 γ を特定する。補正値 Δ γ は、ゲイン符号帳に用意されているパターンのうち

2 2

、CH2の合成信号と CH2の入力信号との波形歪みが最小となるパターンを選択すること〖こよって決定される。

[0070] より詳細には、ゲイン符号帳 221は、まず、 CH2に対するゲイン乗数値 γ を、 CHI

2 のゲイン乗数値 γ 力推定する。モノラル信号の駆動音源を ex (n)、CHlの駆動

1 M

音源を ex (n)および CH2の駆動音源を ex (n)とすると、以下の（式 13)となる。

1 2

[数 8]

ex_M {n) =—{ex (n) + ex₂ (n)) … (式 1 3 ) ここで、 γ の予測値を γ ，とし、以下の（式 14) (式 15)を用いると、上記（式 13)は (式 16)となる。

[数 9]

ex_x\n) = 7j -ex^n) … 、ェ丄 4 )

ex₂(n) = y₂ ^,*^₂'(w) … (式 1 5 )

[数 10] e^xAⁿ) = -(rr^'(«) + γ₂'·^βχ2'(^η)) … （式 1 6 ) ここで ex '(η)と ex '(η)との相関が高いと仮定すると、（式 17)かつ（式 18)の関係を

1 2

満たすこととなる。

[数 11]

… (式 1 7 )

[数 12]

ί?χ,'(Μ)- = ^ ex₂'(nf - ^ ex_M(n) … （式 1 8 ) また、（式 16)の両辺を 2乗して和をとれば、以下の（式 19)が得られる。

[数 13]

2 ^exM (")² + 2y,マ₂ ' Y x_x ' (") · ex₂ ' ("))

… （式 1 9 ) よって、（式 19)に（式 17)および (式 18)を代入すると、以下の（式 20)となる。

[数 14]

5 ¾(")² = ∑¾(»)²(}'₁ ² + ₂ ^,2+27₁-7₂') … （式 2 0 )

(式 20)の方程式を解くことにより、以下の（式 21)の関係が得られる。

[数 15]

y₂'=2-_r, , -2-7, ··· (式 2 1 ) ここで 0 を、予測値 γ ，とそれに対する補正係数 Δ γ との積で表すと以下の（式 2

2 2 2

2)となる。 γ₂ = γ₂ '-Αγ₂ (ただし、 y₂'= 2— _7l ) … （式 2 2 )

そして、 CH2に対する最適な γ を得るときの補正係数 Δ γ をゲイン符号帳探索

2 2

により符号化する。ここで、 Δ γ は、モノラルのゲインおよび CHIにおけるモノラルに

2

対するゲイン乗数 γ を用いて推定した予測値に対する補正分であるので、 γ に比ベて、微小な値であり、より効率的な符号ィ匕を行うことができる。

[0071] スペクトル包絡成分は、 CH2信号の LPC分析を行って LPCパラメータを求め、すでに求められているモノラル信号の LPCパラメータおよびモノラル信号の LPCパラメータに対する CH1の LPCパラメータの差分成分を用いて、 CH2の LPCパラメータを推定し、その推定パラメータ力の補正分 (誤差成分)を量子化することによって、 C Η2のスペクトル包絡成分パラメータとする。

[0072] CH2の LSPパラメータ ω (i) (ただし、 i=0, 1, · ··, p— 1)を、モノラル信号の LSP

2

ノラメータ ω (i)、および第 1チャネル信号の LSPパラメータ ω (i)とモノラル信号の

M 1

LSPパラメータ ω (i)との差分 Δ ω (i)の双方から求める。

M 1

[0073] まず、以下の（式 23)を仮定する。

[数 17] ω_Μ(ί) (ω (ί) ₊ ω₂(ί)) … （式 2 3 ) また、 CH1の LSPパラメータ ω (i)は、以下の（式 24)で表される。

[数 18]

β>,( = ¾_ί( + Δί»₁( ■·· (式 2 4 )

よって、 ω (i)の予測値 ω '(i)は、（式 23)および（式 24)力以下の（式 25)となる。

2 2

[数 19]

ω₂ ^,(ί) = ω_Μ (ϊ) - Αο)_ι (ί) '·· (式 2 5 )

CH2の LSPである ω (i)を、その予測値 ω ，(i)およびそれに対する補正分 Δ ω (i

2 2 2

)を用いて、以下の（式 26)で表す。

[数 20]

«>₂( = β>₂'( + Δ«)₂( ··■ (式 2 6 )

(式 26)に (式 25)を代入することにより、以下の（式 27)が得られる。 [数 21]

ω₂ ( ) = ω_Μ ( ) - (?) + ω₂ (?) · · · ^ 2 7 )

本実施の形態に係るスケーラブル符号ィ匕装置は、 ω (i)

2 に対して量子化誤差を最小にするような Δ ω (i)を符号ィ匕する。ここで、 Δ ω (i)は、モノラルの LSPパラメ一

2 2

タおよび CH1におけるモノラルに対する差分パラメータ Δ ω (i)を用いて推定した予測値に対する誤差分であるので、 Δ ω (i)に比べて微小な値であり、より効率的な符号ィ匕を行うことができる。

[0074] このように、本実施の形態によれば、 A CH2，の符号ィ匕において、モノラル信号の CELP符号ィ匕パラメータおよび第 2レイヤで符号ィ匕された差分 CELPパラメータの双方のパラメータを用いて推定される CH2の CELP符号化パラメータと、それに対する補正パラメータとを用い、これらにより生成される CH2の合成信号と CH2の原信号との誤差が最小になるように、上記の補正パラメータを決定する。よって、 CH2をより精度よく符号ィ匕および復号することができる。

[0075] 以上、本発明に係る実施の形態 1、 2について説明した。

[0076] なお、上記各実施の形態において、モノラル信号 Mを CH1と CH2の平均信号とした力かならずしもこれに限ったものではな！/、。

[0077] また、適応音源符号帳は、適応符号帳と呼ばれることがある。また、固定音源符号帳は、固定符号帳、雑音符号帳、確率符号帳 (stochastic codebook)、または乱数符号帳（random codebook)と呼ばれることがある。

[0078] 本発明に係るスケーラブル符号化装置は、上記各実施の形態に限定されず、種々変更して実施することが可能である。

[0079] 本発明に係るスケーラブル符号ィ匕装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。

[0080] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

[0081] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されていても良いし、一部または全てを含むように 1チップィ匕されてヽても良!、。

[0082] また、ここでは LSIとした力集積度の違いによって、 IC、システム LSI、スーパー L

SI、ウノレ卜ラ LSI等と呼称されることちある。

[0083] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギユラブル ·プロセッサを利用しても良、。

[0084] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行っても良い。バイオ技術の適応等が可能性としてあり得る。

[0085] 本明細書は、 2004年 9月 28日出願の特願 2004— 282525に基づく。この内容はすべてここに含めておく。

産業上の利用可能性

[0086] 本発明に係るスケーラブル符号ィ匕装置およびスケーラブル符号ィ匕方法は、移動体通信システムにお、て、ステレオ信号に対しスケーラブル符号ィ匕を行う通信端末装置、基地局装置等の用途に適用できる。

Claims

請求の範囲

[1] ステレオ音声信号からモノラル音声信号を生成する生成手段と、

前記モノラル音声信号を CELP方式で符号化して前記モノラル音声信号の符号ィ匕ノラメータを得る第 1の符号ィ匕手段と、

前記ステレオ音声信号の Rチャネルまたは Lチャネルのいずれかを符号ィ匕対象チヤネルとし、前記符号ィヒ対象チャネルに対し線形予測分析および適応音源符号帳探索を行って得られるパラメータと前記モノラル音声信号の符号ィヒパラメータとの差分をとり、前記差分力前記符号ィ匕対象チャネルの符号化パラメータを得る第 2の符号化手段と、

を具備するスケーラブル符号ィ匕装置。

[2] 前記生成手段は、

前記 Rチャネルおよび前記 Lチャネルの平均を求めて前記モノラル音声信号とする請求項 1記載のスケーラブル符号化装置。

[3] 前記第 2の符号化手段は、

前記符号化対象チャネルの固定音源符号帳インデックスとして、前記モノラル音声信号の符号化パラメータの固定音源符号帳インデックスを用いる、

請求項 1記載のスケーラブル符号化装置。

[4] 前記 Rチャネルおよび前記 Lチャネルのうち、前記第 2の符号化手段の符号化対象チャネル以外のチャネルにつ、ては符号化を行わな、、

請求項 1記載のスケーラブル符号化装置。

[5] 前記 Rチャネルおよび前記 Lチャネルのうち、前記第 2の符号化手段の符号化対象チャネル以外のチャネルを符号ィ匕対象とし、前記第 1および第 2の符号化手段によつて得られる符号化パラメータを用いて合成信号を生成し、この合成信号の符号化歪みが最小となるように符号ィ匕を行う第 3の符号ィ匕手段、

をさらに具備する請求項 1記載のスケーラブル符号ィ匕装置。

[6] 請求項 1記載のスケーラブル符号ィ匕装置を具備する通信端末装置。

[7] 請求項 1記載のスケーラブル符号化装置を具備する基地局装置。ステレオ音声信号力モノラル音声信号を生成する生成ステップと、

前記モノラル音声信号を CELP方式で符号化して前記モノラル音声信号の符号ィ匕パラメータを得る第 1の符号化ステップと、

前記ステレオ音声信号の Rチャネルまたは Lチャネルのいずれかを符号ィ匕対象チヤネルとし、前記符号ィヒ対象チャネルに対し線形予測分析および適応音源符号帳探索を行って得られるパラメータと前記モノラル音声信号の符号ィヒパラメータとの差分をとり、前記差分力前記符号ィ匕対象チャネルの符号化パラメータを得る第 2の符号化ステップと、

を具備するスケーラブル符号化方法。