WO2006059567A1

WO2006059567A1 - ステレオ符号化装置、ステレオ復号装置、およびこれらの方法

Info

Publication number: WO2006059567A1
Application number: PCT/JP2005/021800
Authority: WO
Inventors: Michiyo Goto; Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-11-30
Filing date: 2005-11-28
Publication date: 2006-06-08
Also published as: BRPI0516658A; US7848932B2; EP1814104A1; KR20070085532A; US20090150162A1; RU2007120056A; JPWO2006059567A1; EP1814104A4

Abstract

　復号信号の音質の劣化を防ぎつつ、符号化ビットレートを低減することができるステレオ音声符号化装置を開示する。この装置において、空間情報分析部（１０１）は、Ｌチャネル信号およびＲチャネル信号の各空間情報を分析する。類似度向上部（１０２）は、空間情報分析部（１０１）の分析結果に従って、Ｌチャネル信号およびＲチャネル信号の各空間情報の違いを補正し、Ｌチャネル信号およびＲチャネル信号の類似度を向上させる。チャネル信号符号化部（１０３）は、両チャネル共通の音源を用いて、類似度を向上させた後のＬチャネル信号およびＲチャネル信号をそれぞれ符号化し、得られる単一の符号化情報を出力する。空間情報符号化部（１０４）は、空間情報分析部（１０１）の分析結果を符号化し、得られた符号化情報を出力する。

Description

ステレオ符号化装置、ステレオ復号装置、およびこれらの方法技術分野

[0001] 本発明は、ステレオ信号に対し符号ィ匕を施すステレオ符号ィ匕装置、これに対応するステレオ復号装置、およびこれらの方法に関する。

背景技術

[0002] 携帯電話機による通話のように、移動体通信システムにおける音声通信では、現在、モノラル方式による通信 (モノラル通信）が主流である。しかし、今後、第 4世代の移動体通信システムのように、伝送レートのさらなる高ビットレートイ匕が進めば、複数チヤネルを伝送するだけの帯域を確保できるようになるため、音声通信にぉ、てもステレォ方式による通信 (ステレオ通信）が普及することが期待される。

[0003] 例えば、音楽を HDD (ノヽードディスク)搭載の携帯オーディオプレーヤに記録し、このプレーヤにステレオ用のイヤホンやヘッドフォン等を装着してステレオ音楽を楽しむユーザが増えている現状を考えると、将来、携帯電話機と音楽プレーヤとが結合し、ステレオ用のイヤホンやヘッドフォン等の装備を利用しつつ、ステレオ方式による音声通信を行うライフスタイルが一般的になることが予想される。また、最近普及しつつある TV会議等の環境において、臨場感ある会話を可能とするため、やはりステレオ通信が行われるよう〖こなることが予想される。

[0004] 一方、移動体通信システム、有線方式の通信システム等にぉ、ては、システムの負荷を軽減するため、伝送される音声信号を予め符号化することにより伝送情報の低ビットレートイ匕を図ることが一般的に行われている。

[0005] そのため、最近、ステレオ音声信号を符号化する技術が注目を浴びて!/、る。例えば、 cross-channel predictionを使って、ステレオ音声信号の CELP符号化の重み付けされた予測残差信号の符号ィ匕効率を高める符号ィ匕技術がある (非特許文献 1参照）非特許文献 1 : S. A. Ramprashac 'Stereophonicし LP coding using cross channel p rediction, "ゝ In Proc. of the 2000 IEEE Workshopゝ pp. 136—138、 2000 発明の開示

発明が解決しょうとする課題

[0006] し力しながら、非特許文献 1に開示の技術は、 2つチャネルの音声信号に対し、それぞれ別個に適応符号帳、固定符号帳等を有しており、各チャネルごとに別々の駆動音源信号を発生させ、合成信号を生成している。すなわち、各チャネルごとに音声信号の CELP符号ィ匕を行い、得られた各チャネルの符号ィ匕情報を復号側に出力している。そのため、符号ィ匕情報がチャネル数分だけ生成されることとなり、符号化情報量 (符号ィ匕ビットレート)が増大すると、う問題がある。

[0007] よって、本発明の目的は、復号信号の音質の劣化を防ぎつつ、符号化情報量 (符号ィ匕ビットレート)を削減することができるステレオ符号ィ匕装置、ステレオ復号装置、およびこれらの方法を提供することである。

課題を解決するための手段

[0008] 本発明のステレオ符号ィ匕装置は、第 1チャネル信号および第 2チャネル信号の双方または一方を補正することによって前記第 1チャネル信号および前記第 2チャネル信号間の類似度を高める補正手段と、類似度が高まった前記第 1チャネル信号および第 2チャネル信号を単一の音源で符号化する第 1の符号化手段と、前記補正手段における補正に関する情報を符号ィヒする第 2の符号ィヒ手段と、を具備する構成を採る。

発明の効果

[0009] 本発明によれば、復号信号の音質の劣化を防ぎつつ、符号化情報量 (符号化ビットレート）を削減することができる。

図面の簡単な説明

[0010] [図 1]実施の形態 1に係るステレオ符号ィ匕装置の機能ブロック図

[図 2]同一発生源力の音を異なる位置で収音した信号の波形スペクトルの一例を示した図

[図 3]実施の形態 1に係るステレオ復号装置の機能ブロック図

[図 4]実施の形態 1に係るステレオ音声符号ィ匕装置の主要な構成を示すブロック図 [図 5]実施の形態 1に係る音声符号ィ匕部内部の主要な構成を示すブロック図

[図 6]実施の形態 1に係る空間情報処理部内部の主要な構成を示すブロック図

[図 7]実施の形態 2に係るステレオ音声符号ィ匕装置の主要な構成を示すブロック図 [図 8]実施の形態 3に係る音声符号ィ匕部の主要な構成を示すブロック図

[図 9]実施の形態 3に係る空間情報付与部内部の主要な構成を示すブロック図発明を実施するための最良の形態

[0011] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、 2チャネル力もなるステレオ信号を符号ィ匕する場合を例にとって説明する

[0012] (実施の形態 1)

図 1は、本発明の実施の形態 1に係るステレオ符号ィ匕方法のコンセプトを説明するための図、すなわち本実施の形態に係るステレオ符号ィ匕装置の機能ブロック図である。

[0013] 本実施の形態に係るステレオ符号ィ匕装置にぉ、て、まず、符号化対象であるステレオ信号の Lチャネル信号および Rチャネル信号の相互間の特性の違いが補正される。この補正処理により、両チャネル信号間の類似度は向上する。そして、後続の符号ィ匕処理において、両チャネルに共通な単一の音源を用いて補正後の両チャネル信号の符号化を行ヽ、単一の符号ィ匕パラメータ (単一の音源が複数の符号化パラメータで表現される場合には、一組の符号ィ匕パラメータ）を得る。両チャネル信号が互 Vヽに良く類似して、る状態となって、るため、両チャネル共通の音源を用いて符号ィ匕を行うことが可能となる。

[0014] 一般的に、同一発生源からの音であっても、マイクロフォンの置かれている位置、すなわち、収音位置によって、信号波形が異なる特性を示すようになる。簡単な例としては、発生源からの距離に応じて、ステレオ信号のエネルギーは減衰すると共に、到達時間に遅延も生じ、収音位置によって異なる波形スペクトルを示すようになる。このように、ステレオ信号は、収音環境という空間的な因子によって大きな影響を受ける。

[0015] この収音環境の違いによるステレオ信号の特性をより詳細に説明するために、図 2 に、同一発生源力の音を異なる 2つの位置で収音した信号 (Lチャネル信号 S、R チャネル信号 s )の波形スペクトルの一例を示す。

R

[0016] この図から、 Lチャネル信号および Rチャネル信号がそれぞれ異なる特性を示すことが見てとれる。この異なる特性を示す現象は、元の信号の波形に、収音位置によつて異なる新たな空間的な特性が加えられた後に、マイクロフォン等の収音機器により音が収音された結果と捉えることができる。この特性を本明細書では空間情報 (Spati al Information)と呼ぶこととする。例えば、図 2の例では、 Lチャネル信号 Sを時間 A t

L

だけ遅延すると Lチャネル信号 S 'となる。次に、 Lチャネル信号 S 'の振幅を一定の

しし

割合で減じて振幅差 Δ Aを消滅させれば、 Lチャネル信号 S 'は同一発生源からの

し

信号であるため、理想的には Rチャネル信号 Sと一致することが期待できる。すなわ

R

ち、 Lチャネル信号および Rチャネル信号の特性の違いは、両チャネルの空間情報の差をなくすことにより、補正することができると考えられる。

[0017] そこで、本実施の形態では、上記の Lチャネル信号および Rチャネル信号の各空間情報の双方または一方に適当な補正を加えることにより、 2つのチャネル信号の波形を近付け、これらの信号の類似度を向上させる。これにより、符号化処理で使用される音源を共有することができ、また、符号化パラメータとしても両チャネル信号に対しそれぞれの符号化パラメータを生成しなくとも、単一の（または一組の）符号ィ匕パラメータを生成することによって精度の良い符号ィ匕情報を得ることができる。

[0018] 空間情報についてより詳細に説明するならば、空間情報は、音の発生源と各集音機器との間の空間に関する情報である。例えば、集音機器の位置によって各チヤネル信号の振幅が変化したり位相が変化したりすることから、各チャネル信号は、音源力も各集音機器に至るまでの空間に関する情報を含んでいると考えることができる。そして、この空間情報により、ステレオ信号は人間の聴感に広がり感を与えるようになる。また、各チャネル間についても同様に考えることができ、例えば、 Lチャネル信号には、 Lチャネルと Rチャネルの各集音機器間の空間に関する情報が含まれていると考えることもできる。よって、各チャネル信号に含まれる空間情報を操作することにより、各チャネル信号を互いに類似させたり、各チャネル信号を音源信号に類似させたり、または各チャネル信号をある仮想チャネルの信号に類似させることもできる。この点に本発明者は注目し、本発明をするに至った。 [0019] なお、両チャネルの類似度が向上してヽれば、 Lチャネル信号と Rチャネル信号とで音源を共有することができる。よって、 Lチャネル信号および Rチャネル信号に対する補正としては、空間情報を補正するだけでなぐ空間情報以外の他の特性を補正することによって両チャネルの類似度を向上させることもできる。

[0020] 図 1に示した空間情報分析部 101、類似度向上部 102、およびチャネル信号符号化部 103は、以下の動作を行うことによって、上記の処理を実現する。

[0021] 空間情報分析部 101は、 Lチャネル信号 (S )および Rチャネル信号 (S )の各空間

L R

情報を分析し、分析結果を類似度向上部 102および空間情報符号化部 104に出力する。類似度向上部 102は、空間情報分析部 101から出力された分析結果に従って、 Lチャネル信号および Rチャネル信号の各空間情報の違、を補正することによって、 Lチャネル信号および Rチャネル信号の類似度を向上させる。類似度向上部 102 は、類似度を向上させた後の Lチャネル信号 (S ")および Rチャネル信号 (S ")をチ

L R

ャネル信号符号ィ匕部 103に出力する。チャネル信号符号ィ匕部 103は、両チャネル共通の音源を用いて、この S

L "および S

R "をそれぞれ符号化し、得られる一組の符号化情報 (チャネル信号符号ィ匕パラメータ)を出力する。空間情報符号化部 104は、空間情報分析部 101から出力された空間情報の分析結果を符号ィ匕し、得られた符号ィ匕情報 (空間情報符号化パラメータ)を出力する。

[0022] なお、上記の説明では、 Sおよび Sの双方の波形を補正し、これにより類似度を向

L R

上させた 2つの信号 (S "、 S ")を類似度向上部 102から出力する場合を例にとって

L R

説明したが、 Sおよび Sのいずれか一方の波形を、他方の波形に近付けるように補

L R

正しても良い。かかる場合、例えば Sに補正を加えたとすると、類似度向上部 102の

し

出力は、 S "、 Sとなる。すなわち、 Sが類似度向上部 102を経由せずにチャネル信

L R R

号符号ィ匕部 103に直接入力される構成と実質的に同一となる。

[0023] また、上記の空間情報の具体例としては、以下のものがある。

[0024] 例えば、 2チャネル間のエネルギー比および遅延時間差と!/、う 2つのパラメータを空間情報として使用することができる。これらは定量ィ匕のし易いパラメータである。また、バリエーションとして周波数帯域ごとの伝播特性、例えば、位相差、振幅比等を使用することちでさる。 [0025] 図 3は、上記のステレオ符号ィ匕装置に対応する本実施の形態に係るステレオ復号装置の機能ブロック図である。

[0026] 空間情報復号部 151は、空間情報符号化パラメータを復号し、得られた空間情報をチャネル信号復元部 153に出力する。チャネル信号復号部 152は、チャネル信号符号化パラメータを復号し、特定のチャネル信号を得る。このチャネル信号は、 Lチヤネル信号および Rチャネル信号の両チャネルの空間情報を補正し、 Lチャネルおよび Rチャネルに共通の両チャネル間の類似度を高めたチャネル信号となって、る。この Lチャネルおよび Rチャネル共通のチャネル信号は、チャネル信号復元部 153に出力される。チャネル信号復元部 153は、チャネル信号復号部 152から出力されたチャネル信号を、空間情報復号部 151から出力される空間情報を用いて Lチャネル信号および Rチャネル信号にそれぞれ復元し、出力する。

[0027] このように、本実施の形態に係るステレオ符号ィ匕方法およびステレオ復号方法によれば、ステレオ信号の各チャネル信号を補正することによって各チャネル信号の類似度を高めてから、各チャネル信号を各チャネル共通の音源を用いて符号ィ匕するので、符号ィ匕情報量 (符号ィ匕ビットレート)を削減することができる。また、符号化側は、各チャネルの空間情報の差も符号ィ匕して出力するため、復号側では、これを用いて各チャネル信号を精度良く再生することができる。

[0028] なお、上記の説明にお!/、ては、各チャネル信号の類似度を高めた後、各チャネル共通の音源を用いて各チャネルに対し符号ィ匕を施す場合を例にとって説明したが、両チャネルの類似度は高まって、るので、一方のチャネルのみを選択して符号ィ匕対象とし、この選択チャネルのみの符号ィ匕情報を出力しても良い。かかる場合でも、復号側では、選択チャネルの符号ィ匕情報を復号して、この選択チャネルの信号を再生することができると共に、符号ィ匕側で選択されな力た非選択チャネルにつ、ても、符号ィ匕側から出力された空間情報を用いて選択チャネル力この非選択チャネルを大きく品質を低下させることなく再生することができる。

[0029] また、類似度向上部 102における両チャネル信号の空間情報の補正の仕方には種々の方法がある。例えば、両チャネル信号から完全に空間情報を除去し、 Lチヤネル信号および Rチャネル信号を音源信号 (音源で生成された音声信号)に戻したり、 Lチャネル信号および Rチャネル信号の算術平均 [ (L +R) Z2]をモノラル信号と擬制し、両チャネル信号力もそれぞれ所定の空間情報を除去して、擬制モノラル信号に変換する方法がある。しかし、理論的には、 Lチャネル信号および Rチャネル信号を上記の音源信号や擬制モノラル信号に変換することは可能であっても、実際に音が取得されるのは実際に 2つのマイクロフォン (Lチャネルおよび Rチャネル）が設置されて、る場所のみであって、符号ィ匕装置が取得できるのは Lチャネル信号および R チャネル信号のみである。

[0030] そこで、本実施の形態のより詳細な実施例にぉ、ては、 Lチャネル信号または Rチャネル信号の一方をメインチャネル信号とし、他方をサブチャネル信号とし、サブチヤネル信号力所定の空間情報を除去することにより、この信号をメインチャネル信号に類似させる。符号化装置は、 Lチャネル信号および Rチャネル信号の双方を取得しているので、両チャネル信号を比較分析することにより、上記の所定の空間情報、すなわち、 Lチャネル信号および Rチャネル信号の空間情報の差を求めることができる

[0031] 次いで、図 4および図 5を用いて、本実施の形態に係るステレオ符号ィ匕方法について更に詳細に説明する。

[0032] 図 4は、本実施の形態に係るステレオ音声符号化装置、すなわち、図 1に示したステレオ符号化方法のコンセプトを具現化したステレオ音声符号化装置の主要な構成を示すブロック図である。ここで、以下に示す第 1チャネル音声信号および第 2チヤネル音声信号とは、それぞれ Lチャネル音声信号および Rチャネル音声信号、またはその逆のチャネルの音声信号のことを示す。

[0033] 本実施の形態に係るステレオ音声符号化装置は、音声符号化部 100、 MC選択部

105、および MC選択情報符号ィ匕部 106を備える。音声符号ィ匕部 100が、図 1に示した機能ブロック全体に対応した構成である。

[0034] MC選択部 105は、入力される第 1チャネル音声信号および第 2チャネル音声信号の一方をメインチャネル、他方をサブチャネルとし、メインチャネル信号（MC)およびサブチャネル信号 (SC)を音声符号ィ匕部 100に出力する。

[0035] 音声符号ィ匕部 100は、まず、メインチャネル信号とサブチャネル信号とを比較分析し、両チャネルの空間情報の差を求める。次に、音声符号化部 100は、サブチャネル信号から、この求まった空間情報の差を除去してメインチャネル信号に類似させた後、両チャネルに共通の音源を用いて、メインチャネル信号およびメインチャネル信号に類似させたサブチャネル信号の符号ィ匕を行ヽ、得られる符号化情報 (チャネル信号符号化パラメータ)を出力する。また、音声符号化部 100は、求まった空間情報の差に対しても符号化を行い、この符号ィ匕情報 (空間情報符号化パラメータ)も出力する。

[0036] MC選択情報符号化部 106は、 MC選択部 105でいずれのチャネルをメインチヤネルとしたのかを示す MC選択情報を符号ィヒし、この符号ィヒ情報 (MC選択情報符号ィ匕パラメータ）を出力する。この MC選択情報符号化パラメータは、音声符号化部 10 0で生成されたチャネル信号符号化パラメータおよび空間情報符号ィ匕パラメータと共に、符号ィヒ情報として復号装置に伝送される。

[0037] 図 5は、上記の音声符号ィ匕部 100内部の主要な構成を示すブロック図である。ここでは、音声信号の符号ィ匕方法として CELP符号ィ匕を用いる場合を例にとって説明する。

[0038] この音声符号ィ匕部 100は、大きく分けて、メインチャネル信号 (MC)を符号化する MC符号化部 110—1、サブチャネル信号 (SC)を符号化する SC符号化部 110— 2 、空間情報処理部 123、および両チャネルに共通の適応符号帳、固定符号帳等を備えている。また、空間情報処理部 123が、図 1に示した機能ブロックのうちの空間情報分析部 101、類似度向上部 102、および空間情報符号化部 104に対応している。

[0039] なお、 MC符号ィ匕部 110— 1と SC符号ィ匕部 110— 2とは、符号化対象の信号は異なるものの内部の基本的構成は同様である。よって、同一の構成要素に対しては、同一の符号に MC符号化部 110—1、 SC符号化部 110— 2の別を示す番号 1、 2をハィフンの後に付して示す。そして、 MC符号ィ匕部 110— 1側の構成の説明のみを行い、 SC符号ィ匕部 110— 2側にっ、ては基本的にその説明を省略する。

[0040] 音源符号化部 100は、声道情報と音源情報とからなるメインチャネル信号、サブチャネル信号を、声道情報については、 LPCパラメータ (線形予測係数)を求めることにより符号ィ匕し、音源情報については、予め記憶されている音声モデルのいずれを用いるかを特定するインデックス、すなわち、適応符号帳 117および固定符号帳 118 でどのような音源ベクトルを生成するかを特定するインデックスを求めることにより、音源情報を符号ィ匕する。

[0041] 具体的には、音声符号化部 100の各部は以下の動作を行う。

[0042] LPC分析部 111—1は、メインチャネル信号に対して線形予測分析を施し、スぺタトル包絡情報である LPCパラメータを求め、 LPC量子化部 112— 1および聴覚重み付け部 115— 1へ出力する。なお、 SC符号ィ匕部 110— 2の LPC分析部 111—2は、空間情報処理部 123によって所定の処理を施されたサブチャネル信号に対し、上記の処理を行う。空間情報処理部 123の処理については後述する。

[0043] LPC量子化部 112—1は、 LPC分析部 111— 1で得られる LPCパラメータを量子化し、得られる量子化 LPCパラメータを LPC合成フィルタ 113— 1へ出力し、量子化 LPCパラメータのインデックス (LPC量子ィ匕インデックス）を符号ィ匕パラメータとして出力する。

[0044] 一方、適応符号帳 117は、 LPC合成フィルタ 113— 1および LPC合成フィルタ 113

2の双方で共通に使用された過去の駆動音源を記憶しており、歪み最小化部 116 力指示されたインデックスに対応する適応符号帳ラグに従って、記憶して、る駆動音源から 1サブフレーム分の音源ベクトルを生成する。この音源ベクトルは、適応符号帳ベクトルとして乗算器 120へ出力される。

[0045] 固定符号帳 118は、所定形状の音源ベクトルを複数個予め記憶しており、歪み最小化部 116から指示されたインデックスに対応する音源ベクトルを、固定符号帳べクトルとして乗算器 121へ出力する。

[0046] なお、上記の適応符号帳 117は、有声音のように周期性の強、成分を表現するために使われ、一方、固定符号帳 118は、白色雑音のように周期性の弱い成分を表現するために使われる。

[0047] ゲイン符号帳 119は、歪み最小化部 116からの指示に従って、適応符号帳 117から出力される適応符号帳ベクトル用のゲイン (適応符号帳ゲイン)、および固定符号帳 118から出力される固定符号帳ベクトル用のゲイン（固定符号帳ゲイン)を生成し、それぞれ乗算器 120、 121へ出力する。 [0048] 乗算器 120は、ゲイン符号帳 119から出力される適応符号帳ゲインを、適応符号帳 117から出力される適応符号帳ベクトルに乗じ、加算器 122へ出力する。

[0049] 乗算器 121は、ゲイン符号帳 119から出力される固定符号帳ゲインを、固定符号帳 118から出力される固定符号帳ベクトルに乗じ、加算器 122へ出力する。

[0050] 加算器 122は、乗算器 120から出力される適応符号帳ベクトルと、乗算器 121から出力される固定符号帳べ外ルとを加算し、加算後の音源ベクトルを駆動音源として LPC合成フィルタ 113— 1および LPC合成フィルタ 113— 2に出力する。

[0051] LPC合成フィルタ 113— 1は、 LPC量子化部 112— 1から出力される量子化 LPC ノメータをフィルタ係数とし、適応符号帳 117および固定符号帳 118で生成される音源ベクトルを駆動音源としたフィルタ関数、すなわち、 LPC合成フィルタを用いて合成信号を生成する。この合成信号は、加算器 114 1へ出力される。

[0052] 加算器 114— 1は、 LPC合成フィルタ 113—1で生成される合成信号をメインチヤネル信号 (加算器 114— 2では、空間情報除去後のサブチャネル信号)から減ずることによって誤差信号を算出し、この誤差信号を聴覚重み付け部 115— 1へ出力する。なお、この誤差信号が符号ィ匕歪みに相当する。

[0053] 聴覚重み付け部 115—1は、 LPC分析部 111—1から出力される LPCパラメータをフィルタ係数とする聴覚重み付けフィルタを用いて、加算器 114— 1から出力される符号化歪みに対して聴覚的な重み付けを施し、歪み最小化部 116へ出力する。

[0054] 歪み最小化部 116は、聴覚重み付け部 115— 1および聴覚重み付け部 115— 2から出力される符号化歪みの双方を考慮し、双方の符号化歪みの和が最小となるような、適応符号帳 117、固定符号帳 118、およびゲイン符号帳 119の各インデックス（符号帳インデックス）をサブフレームごとに求め、これらのインデックスを符号ィ匕情報として出力する。

[0055] 具体的には、符号化歪みは、符号化対象となる元の信号と合成信号との差の 2乗によって表される。そのため、聴覚重み付け部 115— 1から出力される符号ィ匕歪みを a²とし、聴覚重み付け部 115— 2から出力される符号ィ匕歪みを b²とすると、歪み最小化部 116は、これら符号ィ匕歪みの和 a²+b²を最小とする、適応符号帳 117、固定符号帳 118、およびゲイン符号帳 119の各インデックス (符号帳インデックス）を求める。 [0056] なお、上記の適応符号帳 117および固定符号帳 118に基づいて合成信号を生成し、この信号の符号化歪みを求める一連の処理は、閉ループ（帰還ループ）となっており、歪み最小化部 116は、各符号帳に指示するインデックスを 1サブフレーム内において様々に変化させることによって各符号帳を探索し、最終的に得られる、両チヤネルの符号ィ匕歪みを最小とする各符号帳のインデックスを出力する。

[0057] また、符号ィ匕歪みが最小となる際の駆動音源は、サブフレームごとに適応符号帳 1 17へフィードバックされる。適応符号帳 117は、このフィードバックにより、記憶されている駆動音源を更新する。

[0058] 図 6は、空間情報処理部 123内部の主要な構成を示すブロック図である。この空間情報処理部 123には、メインチャネル信号およびサブチャネル信号の双方が入力される。

[0059] 空間情報分析部 131は、メインチャネル信号とサブチャネル信号とを比較分析することによって、両チャネル信号の空間情報の差を求め、得られた分析結果を空間情報量子化部 132に出力する。

[0060] 空間情報量子化部 132は、空間情報分析部 131で得られた両チャネルの空間情報の差に対し量子化を行、、得られる空間情報の符号化パラメータ (空間情報量子ィ匕インデックス）を出力する。また、空間情報量子化部 132は、空間情報分析部 131 で得られた両チャネルの空間情報の差を量子化した空間情報量子化インデックスに対して逆量子化を施して空間情報除去部 133に出力する。

[0061] 空間情報除去部 133は、空間情報量子化部 132から出力された逆量子化された空間情報量子化インデックス、すなわち、空間情報分析部 131で得られた両チヤネルの空間情報の差を量子化して逆量子化した信号を、入力されたサブチャネル信号力も減じることにより、サブチャネル信号をメインチャネル信号に類似した信号に変換する。この空間情報が除去されたサブチャネル信号は、 LPC分析部 111—2に出力される。

[0062] 次に、空間情報処理部 123の各部の処理を、数式を用いて詳細に説明する。まず、空間情報として、 2チャネル間のエネルギー比および遅延時間差を使用する場合を例にとって説明する。 [0063] 空間情報分析部 131は、 2チャネル間のフレーム単位のエネルギー比を算出する _c まず、メインチャネル信号およびサブチャネル信号の 1フレーム内のエネルギー E

MC

および E 1S 次の式（1)および式（2)に従って求められる。

[数 1]

… （ 1 )

[数 2]

¾c = ∑ ½c (»)² - ( 2 )

ここで、 ηはサンプル番号、 FLは 1フレームのサンプル数（フレーム長）である。また、 X (η)および X (η)は、各々メインチャネル信号およびサブチャネル信号の第 η

MC SC

サンプルの振幅を示す。

[0064] そして、空間情報分析部 131は、メインチャネル信号およびサブチャネル信号のェネルギー比の平方根 Cを次の式（3)に従って求める。

[数 3]

C = … ( 3 )

[0065] また、空間情報分析部 131は、サブチャネル信号のメインチャネル信号に対する 2 チャネル間の信号の時間的ずれの量である遅延時間差を、以下のように、 2チャネルの信号間で相互相関が最も高くなるような値として求める。具体的には、メインチヤネル信号およびサブチャネル信号の相互相関関数 Φが次の式 (4)に従って求められる。

[数 4]

x_MC (n) - x_sc (n -m) ■■■ 、4 ) ここで、 mはあらかじめ定めた min—mから max— mまでの範囲の値をとるものとし、 Φ (m)が最大となるときの m=Mをサブチャネル信号のメインチャネル信号に対する遅延時間差とする。

[0066] なお、上記のエネルギー比および遅延時間差を以下の式（5)によって求めても良い。式（5)では、メインチャネル信号と、メインチャネル信号に対する空間情報を除去したサブチャネル信号と、の誤差 Dを最小にするようなエネルギー比の平方根 Cおよび遅延時間差 mを求める。

[数 5]

^ = 2 Κκ («) - C - x_sc (« - m)f ■■■ ( 5 )

[0067] 空間情報量子化部 132は、上記 Cおよび mを予め定めたビット数で量子化し、量子化値をそれぞれ、 Cおよび M とする。

Q Q

[0068] 空間情報除去部 133は、サブチャネル信号から以下の式 (6)の変換式に従って空間情報を除去する。

[数 6]

xsc {n) = C_Q - x_sc (n -M_Q) … （6 )

(ただし、 " = 0,' - -,FL - l )

[0069] 以上説明したように、本実施の形態によれば、ステレオ信号の各チャネル信号を補正することによって各チャネル信号の類似度を高めてから、各チャネル信号を各チヤネル共通の音源を用いて符号ィ匕するので、符号ィ匕情報量 (符号ィ匕ビットレート)を削減することができる。

[0070] また、各チャネル信号を共通の音源を用いて符号ィ匕するので、各チャネル用に、適応符号帳、固定符号帳、およびゲイン符号帳のセットを 2セット設置する必要がなぐ 1セットの各符号帳で音源を生成することができる。すなわち、回路規模を削減することがでさる。

[0071] また、以上の構成において、歪み最小化部 116は、メインチャネル信号だけでなくサブチャネル信号も考慮し、双方のチャネルの符号ィ匕歪みが最小となるような制御を行う。よって、符号ィ匕性能が高まり、復号信号の音質を向上させることができる。

[0072] なお、本実施の形態の図 5では、ステレオ音声信号の符号ィ匕に CELP符号ィ匕が用 V、られる場合を例にとって説明したが、 Lチャネル信号および Rチャネル信号の類似度を高める補正を行い、事実上、単一のチャネル信号と擬制される状態にすることができれば、符号ィ匕情報量を削減することができるので、必ずしも CELP符号ィ匕のように予め定められた音源情報を符号帳として有する符号化方法でなくても良い。 [0073] また、本実施の形態においては、 2チャネル間のエネルギー比および遅延時間差という 2つのパラメータの双方を空間情報とする場合を例にとって説明したが、空間情報として、ずれか一方のパラメータだけを使用するようにしても良!、。 1つのパラメ一タのみを使用する場合は、 2つのパラメータを用いる場合と比較して 2つのチャネルの類似性を向上させる効果が減少するが、逆に符号ィ匕ビット数をさらに削減できるという効果がある。

[0074] 例えば、空間情報として 2チャネル間のエネルギー比のみを用いる場合、サブチヤネル信号の変換は、上記式（3)で求まるエネルギー比の平方根 Cを量子化した値 C

Q

を用いて、以下の式（7)に従って行う。

[数 7]

½： (") = ^ce . ½: (") "· ( ⁷ )

(ただし、 " = 0，· '·，/ϊ—1 )

[0075] 例えば、空間情報として 2チャネル間の遅延時間差のみを用いる場合、サブチヤネル信号の変換は、上記式 (4)で求まる Φ (m)を最大とする m=Mを量子化した値 Μ

Q

を用いて、以下の式 (8)に従って行う。

[数 8] x_sc (n) ^ x_sc(n -M_e) … 8 )

(ただし、《 = 0,··.,7¾ -1 )

[0076] (実施の形態 2)

図 7は、本発明の実施の形態 2に係るステレオ音声符号化装置の主要な構成を示すブロック図である。このステレオ音声符号化装置は、実施の形態 1に示したステレォ音声符号ィ匕装置（図 4参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

[0077] 本実施の形態に係るステレオ音声符号化装置は、第 1チャネルおよび第 2チャネルの双方の音声信号のエネルギーを算出し、エネルギーの大き、方のチャネルをメインチャネルとして選択する。ここで、エネルギーは各フレームごとに算出され、メインチャネルの選択も各フレームごとに行われる。以下、詳細に説明する。

[0078] エネルギー算出部 201は、第 1チャネル音声信号および第 2チャネル音声信号のフレームごとのエネルギー Eおよび Eを以下の式（9)および（10)に従って求め、 M

1 2

C選択部 105aに出力する。

[数 9]

£, =∑ , («)² … （9 )

[数 10] =ヌ¾(")² … （ 1 0 )

[0079] MC選択部 105aは、第 1チャネル音声信号および第 2チャネル音声信号のうち、いずれの信号をメインチャネル信号とするかを決定する。具体的には、 2チャネルのフレーム単位のエネルギー Eと Eとを比較し、エネルギーの大きい方のチャネルをメイ

1 2

ンチャネルとし、小さい方のチャネルをサブチャネルとする。すなわち、以下の式（11 )が示す条件の場合は、第 1チャネルをメインチャネル、第 2チャネルをサブチャネルとする。

[数 11]

E_x≥E₂ · · · ( 1 1 )

また、以下の式（12)が示す条件の場合は、第 2チャネルをメインチャネル、第 1チヤネルをサブチャネルとする。

[数 12]

E, < E₂ ·■■ ( 1 2 )

[0080] MC選択情報符号ィ匕部 106は、フレーム毎にメインチャネルおよびサブチャネルの選択が行われて、るため、 V、ずれのチャネル力メインチャネルに選択されたかの情報 (MC選択情報)を符号化する。

[0081] このように、本実施の形態によれば、両チャネルのフレーム毎のエネルギーを算出し、エネルギーの大きい方のチャネルをメインチャネルに選択する。ここで、一般的に、エネルギーの大きい信号の方がより多くの情報量を含んでいると推測される。よって、本実施の形態では、より情報量の多い方のチャネルをメインチャネルとすることにより、符号ィ匕誤差を小さくすることができる。

[0082] なお、本実施の形態では、各チャネルのエネルギーを算出し、これを基準としてメインチャネルを選択する場合を例にとって説明したが、直接的に各チャネルの情報量を認識し、情報量の多、方のチャネルをメインチャネルと選択するようにしても良、。

[0083] また、本実施の形態では、単にフレーム単位のエネルギーをメインチャネルの選択基準とする場合を例にとって説明したが、これに限定されず、例えば、エネルギーを平滑ィ匕した値を使用するようにしても良い。これにより、エネルギーの変動に伴ってメインチャネルおよびサブチャネルが過度に切り換えられることを抑えることができる。ここで、エネルギーを平滑ィ匕するためには、例えば、次の式（13)および（14)を用いて、平滑化されたエネルギー E および E を求める。

IS 2S

[数 13]

"' ( 1 3 )

[数 14]

E_1S = _lsE_2S + (l - a_2S )E₂ … （ 1 4 )

ここで、 α および α は、次の式（15)を満足する定数である。

IS 2S

[数 15]

0 < a_ls , _2S < 1 … ( 1 o )

[0084] (実施の形態 3)

本発明の実施の形態 1、 2では、 SC符号ィ匕部 110— 2の実際の符号ィ匕対象は、空間情報処理部 123によって空間情報が除去された後のサブチャネル信号である。具体的には、 SC符号ィ匕部 110— 2は、空間情報除去後のサブチャネル信号力も合成信号を生成し、この合成信号と、元の空間情報除去後のサブチャネル信号との間の符号ィ匕歪みが最小となるように符号化パラメータの最適化ループを回し、符号化を行つている。換言すると、実施の形態 1、 2は、サブチャネルの符号ィ匕において、空間情報除去後のサブチャネル信号を符号化対象とし、この空間情報除去後のサブチヤネル信号を符号ィ匕処理のターゲット信号として符号ィ匕を行っている。

[0085] 本発明の実施の形態 3では、サブチャネルの符号ィ匕にぉ、て、空間情報が除去される前のサブチャネル信号、すなわち空間情報を含んだままのサブチャネル信号を符号ィ匕処理のターゲット信号として符号ィ匕を行う。

[0086] なお、本実施の形態に係るステレオ音声符号化装置の基本的構成は、実施の形態 1に示したステレオ音声符号ィ匕装置（図 4参照）と同様であるので、その説明は省略し、実施の形態 1に示した音声符号ィ匕部 100 (図 5参照）と異なる構成である音声符号化部 300について以下説明する。

[0087] 図 8は、上記の音声符号ィ匕部 300の主要な構成を示すブロック図である。実施の形態 1に示した音声符号ィ匕部 100と同一の構成要素には同一の符号を付し、その説明を省略する。

[0088] SC符号化部 310は、空間情報処理部 123によって空間情報が除去されたサブチャネル信号に対し、空間情報付与部 301によって再度空間情報を付加する。すなわち、空間情報付与部 301は、空間情報処理部 123からサブチャネル信号についての空間情報が与えられ、これを LPC合成フィルタ 113— 2から出力される合成信号に付加し、加算器 114 2に出力する。

[0089] 加算器 114— 2は、空間情報付与部 301から出力される空間情報付与後の合成信号をサブチャネル信号力減ずることによって符号ィ匕歪みを算出し、この符号化歪みを聴覚重み付け部 115— 2を介して歪み最小化部 116へ出力する。

[0090] 歪み最小化部 116は、 MC符号化部 110— 1および SC符号化部 310から出力される符号化歪みに対し、前述の通り、双方の符号化歪みの和が最小となるような各符号帳のインデックスをサブフレームごとに求め、これらのインデックスを符号ィ匕情報として出力する。

[0091] また、 SC符号ィ匕部 310は、サブチャネル信号に対する聴覚重み付けを、サブチヤネル信号に基づ、て生成される LPC係数によって行うために、 LPC分析部 111 - 2 とは別個に LPC分析部 302を備える。

[0092] LPC分析部 302は、サブチャネル信号を入力として LPC分析を行ヽ、得られる LP

C係数を聴覚重み付け部 115— 2に出力する。

[0093] 聴覚重み付け部 115— 2は、 LPC分析部 302から出力される LPC係数を用いて、加算器 114— 2から出力される符号ィ匕歪みに対して聴覚重み付けを行う。

[0094] 図 9は、上記空間情報付与部 301内部の主要な構成を示すブロック図である。

[0095] 空間情報逆量子化部 321は、空間情報処理部 123から出力された空間情報量子ィ匕インデックスを逆量子化し、サブチャネル信号のメインチャネル信号に対する空間情報の差を空間情報復号部 322に出力する。

[0096] 空間情報復号部 322は、 LPC合成フィルタ 113— 2から出力される合成信号に対し、空間情報逆量子化部 321から出力される空間情報の差を適用し、空間情報付与後の合成信号を生成し、加算器 114 2に出力する。

[0097] 次に、空間情報付与部 301における空間情報を付与したサブチャネル信号を生成するための処理を、数式を用いて説明する。

[0098] まず、空間情報として、メインチャネル信号とサブチャネル信号との間のエネルギー比および遅延時間差を使用する場合について説明する。実施の形態 1と同様に、空間情報量子化インデックスであるエネルギー比と遅延時間差の量子化値をそれぞれ

C 、Mとすると、空間情報逆量子化部 321は、サブチャネル信号のメインチャネル

Q Q

信号に対する空間情報の差、すなわちエネルギー比 C'および遅延時間差 M'を求める。そして、空間情報復号部 322は、以下の式（16)によって空間情報付与後のサブチャネル信号を求める。

[数 16] xsc (") =— (" + ') ··· ( 1 6 )

(ただし、 7ί = 0, ···, ¾ - 1)

[0099] また、空間情報として、 2チャネル間のエネルギー比のみを用いる場合は、空間情報付与後のサブチャネル信号は、以下の式（17)によって求まる。

[数 17]

" 1

x_sc {n) =— -x_sc(n) ■■■ { 1 ( )

(ただし、 " = o,"',F∑~n

[0100] さらに、空間情報として、 2チャネル間の遅延時間差のみを用いる場合、空間情報付与後のサブチャネル信号は、以下の式（18)によって求まる。

[数 18]

( 1 8 )

(ただし、 n = 0,-';FL - Ό [0101] このように、本実施の形態によれば、サブチャネルの符号ィ匕において、空間情報が除去される前のサブチャネル信号を符号ィ匕処理のターゲット信号として符号ィ匕を行うので、以下の理由により実施の形態 1、 2よりもさらに符号ィ匕性能を向上させることができる。

[0102] すなわち、実施の形態 1、 2では、空間情報除去後のサブチャネル信号を実際の符号化対象とし、この符号ィ匕歪みを最小化している。しかし、復号信号として最終的に出力されるべき信号はサブチャネル信号であり、空間情報除去後のサブチャネル信号ではない。すると、空間情報除去後のサブチャネル信号を符号ィ匕処理のターゲット信号とすると、最終的な復号信号であるサブチャネル信号に含まれる符号化歪みは充分に最小化されていない可能性がある。例えば、サブチャネル信号の振幅がメインチャネル信号の振幅よりも大きい場合であっても、歪み最小化部 116に入力されるサブチャネル信号の符号ィ匕歪みは、メインチャネル信号とのエネルギー差を除去した後の信号に基づいて算出されるものである。ところが、復号装置においては、復号後のサブチャネル信号に別途復号された空間情報を付与して合成信号を生成することになる。そうすると、空間情報付与により、サブチャネル信号の振幅が増幅されることとなるので、これに元々含まれる符号ィ匕歪みも増幅されてしまうことになる。

[0103] 一方、本実施の形態では、空間情報が除去されていないサブチャネル信号そのものを符号化対象とし、最終的な復号信号を得る際に含まれ得る符号化歪みを対象に歪み最小化の処理を行う。よって、より符号ィ匕性能を向上させることができる。

[0104] また、以上の構成において、聴覚重み付け処理に用いる LPC係数は、 SC符号ィ匕部 310の入力信号であるサブチャネル信号を別途 LPC分析して求める。すなわち、最終的な復号信号であるべきサブチャネル信号そのものを反映した聴覚重みによつて聴覚重み付けを行う。よって、より聴覚的に歪みの小さい符号ィ匕パラメータを得ることがでさる。

[0105] 以上、本発明の各実施の形態について説明した。

[0106] 本発明に係るステレオ符号化装置およびステレオ符号化方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。

[0107] 本発明に係るステレオ符号ィ匕装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。また、本発明に係るステレオ符号化装置およびステレオ符号化方法は、有線方式の通信システムにおヽても利用可能である。

[0108] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るステレオ符号化方法の処理のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明のステレォ符号ィ匕装置と同様の機能を実現することができる。

[0109] また、適応符号帳（adaptive codebook)は適応音源符号帳と呼ばれることがあり、固定符号帳 (fixed codebook)は固定音源符号帳と呼ばれることがある。さらに、固定符号帳は、確率符号帳（stochastic codebook)または乱数符号帳（random codebook)と呼ばれることがある。

[0110] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されていても良いし、一部または全てを含むように 1チップィ匕されてヽても良!、。

[0111] また、ここでは LSIとした力集積度の違いによって、 IC、システム LSI、スーパー L

SI、ウノレ卜ラ LSI等と呼称されることちある。

[0112] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギユラブル ·プロセッサを利用しても良、。

[0113] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行っても良い。バイオ技術の適応等が可能性としてあり得る。

[0114] 本明細書は、 2004年 11月 30日出願の特願 2004— 347273および 2005年 3月 3

1日出願の特願 2005— 100850に基づく。これらの内容はすべてここに含めておく産業上の利用可能性

本発明に係るステレオ符号化装置、ステレオ復号装置、およびこれらの方法は、移動体通信システムにおける通信端末装置、基地局装置等の用途に適用できる。

Claims

請求の範囲

[1] 第 1チャネル信号および第 2チャネル信号の双方または一方を補正することによつて前記第 1チャネル信号および前記第 2チャネル信号間の類似度を高める補正手段と、

類似度が高まった前記第 1チャネル信号および第 2チャネル信号を単一の音源で符号化する第 1の符号化手段と、

前記補正手段における補正に関する情報を符号化する第 2の符号化手段と、を具備するステレオ符号化装置。

[2] 前記補正手段は、

前記第 1チャネル信号および前記第 2チャネル信号に含まれる空間情報の双方または一方を補正し、

前記第 2の符号化手段は、

前記空間情報の補正に関する情報を符号化する、

請求項 1記載のステレオ符号化装置。

[3] 前記空間情報は、

前記第 1チャネル信号および前記第 2チャネル信号のエネルギーおよび遅延時間の双方または一方を含む、

請求項 2記載のステレオ符号化装置。

[4] 前記第 1の符号化手段は、

1組の適応符号帳および固定符号帳を具備する、

請求項 1記載のステレオ符号化装置。

[5] 前記第 1の符号化手段は、

前記第 1チャネル信号および前記第 2チャネル信号の双方の符号化歪みの和を最小とする前記音源を求める、

請求項 1記載のステレオ符号化装置。

[6] 前記補正手段は、

前記第 1チャネル信号の空間情報と前記第 2チャネル信号の空間情報との差を求め、当該差を前記第 1チャネル信号または前記第 2チャネル信号のいずれか一方から除去する、

請求項 1記載のステレオ符号化装置。

[7] 前記補正手段は、

前記第 1チャネル信号および前記第 2チャネル信号のうち、情報量の多!、チャネル信号をメインチャネル信号とし、他方をサブチャネル信号とし、当該サブチャネル信号の波形を前記メインチャネル信号の波形に近付ける補正を行う、

請求項 1記載のステレオ符号化装置。

[8] 前記情報量の多!、チヤネノレ信号は、

エネルギーのより大き!/、方のチャネル信号である、

請求項 7記載のステレオ符号化装置。

[9] 前記補正手段は、

前記第 1チャネル信号および前記第 2チャネル信号のうち、一方をメインチャネル信号とし、他方をサブチャネル信号とし、メインチャネル信号の空間情報とサブチャネル信号の空間情報との差を求め、当該差をサブチャネル信号力除去し、

前記第 1の符号化手段は、

当該差が除去されたサブチャネル信号を符号ィ匕処理のターゲット信号とする、請求項 1記載のステレオ符号化装置。

[10] 前記補正手段は、

前記第 1の符号化手段は、

当該差が除去される前のサブチャネル信号を符号ィ匕処理のターゲット信号とし、当該差が除去されたサブチャネル信号力生成される合成信号を用いて符号ィ匕を行う、

請求項 1記載のステレオ符号化装置。

[11] 第 1チャネル信号および第 2チャネル信号の双方または一方に対して施された補正に関する情報を復号する第 1の復号手段と、前記補正が施され、類似度が高まった第 1チャネル信号および第 2チャネル信号に関する情報を復号する第 2の復号手段と、

前記補正に関する情報と、前記第 1チャネル信号および第 2チャネル信号に関する情報とを用いて、前記第 1チャネル信号および前記第 2チャネル信号を復元する復元手段と、

を具備するステレオ復号装置。

[12] 請求項 1記載のステレオ符号化装置を具備する通信端末装置。

[13] 請求項 11記載のステレオ復号装置を具備する通信端末装置。

[14] 請求項 1記載のステレオ符号化装置を具備する基地局装置。

[15] 請求項 11記載のステレオ復号装置を具備する基地局装置。

[16] 第 1チャネル信号および第 2チャネル信号の双方または一方を補正することによつて前記第 1チャネル信号および前記第 2チャネル信号間の類似度を高める補正ステップと、

類似度が高まった前記第 1チャネル信号および第 2チャネル信号を単一の音源で符号化する第 1の符号化ステップと、

前記補正ステップにおける補正に関する情報を符号ィ匕する第 2の符号化ステップとを具備するステレオ符号ィ匕方法。

[17] 第 1チャネル信号および第 2チャネル信号の双方または一方に対して施された補正に関する情報を復号する第 1の復号ステップと、

前記補正が施され、類似度が高まった第 1チャネル信号および第 2チャネル信号に関する情報を復号する第 2の復号ステップと、

前記補正に関する情報と、前記第 1チャネル信号および第 2チャネル信号に関する情報とを用いて、前記第 1チャネル信号および前記第 2チャネル信号を復元する復元ステップと、

を具備するステレオ復号方法。