JP4842147B2 - スケーラブル符号化装置およびスケーラブル符号化方法 - Google Patents

スケーラブル符号化装置およびスケーラブル符号化方法 Download PDF

Info

Publication number
JP4842147B2
JP4842147B2 JP2006550772A JP2006550772A JP4842147B2 JP 4842147 B2 JP4842147 B2 JP 4842147B2 JP 2006550772 A JP2006550772 A JP 2006550772A JP 2006550772 A JP2006550772 A JP 2006550772A JP 4842147 B2 JP4842147 B2 JP 4842147B2
Authority
JP
Japan
Prior art keywords
signal
channel
encoding
processing
monaural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006550772A
Other languages
English (en)
Other versions
JPWO2006070760A1 (ja
Inventor
道代 後藤
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006550772A priority Critical patent/JP4842147B2/ja
Publication of JPWO2006070760A1 publication Critical patent/JPWO2006070760A1/ja
Application granted granted Critical
Publication of JP4842147B2 publication Critical patent/JP4842147B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、ステレオ信号に対し符号化を施すスケーラブル符号化装置およびスケーラブル符号化方法に関する。
携帯電話機による通話のように、移動体通信システムにおける音声通信では、現在、モノラル方式による通信(モノラル通信)が主流である。しかし、今後、第4世代の移動体通信システムのように、伝送レートのさらなる高ビットレート化が進めば、複数チャネルを伝送するだけの帯域を確保できるようになるため、音声通信においてもステレオ方式による通信(ステレオ通信)が普及することが期待される。
例えば、音楽をHDD(ハードディスク)搭載の携帯オーディオプレーヤに記録し、このプレーヤにステレオ用のイヤホンやヘッドフォン等を装着してステレオ音楽を楽しむユーザが増えている現状を考えると、将来、携帯電話機と音楽プレーヤとが結合し、ステレオ用のイヤホンやヘッドフォン等の装備を利用しつつ、ステレオ方式による音声通信を行うライフスタイルが一般的になることが予想される。また、最近普及しつつあるTV会議等の環境において、臨場感ある会話を可能とするため、やはりステレオ通信が行われるようになることが予想される。
一方、移動体通信システム、有線方式の通信システム等においては、システムの負荷を軽減するため、伝送される音声信号を予め符号化することにより伝送情報の低ビットレート化を図ることが一般的に行われている。そのため、最近、ステレオ音声信号を符号化する技術が注目を浴びている。例えば、cross-channel predictionを使って、ステレオ音声信号のCELP符号化の重み付けされた予測残差信号の符号化効率を高める符号化技術がある(非特許文献1参照)。
また、ステレオ通信が普及しても、依然としてモノラル通信も行われると予想される。何故なら、モノラル通信は低ビットレートであるため通信コストが安くなることが期待され、また、モノラル通信のみに対応した携帯電話機は回路規模が小さくなるため安価となり、高品質な音声通信を望まないユーザは、モノラル通信のみに対応した携帯電話機を購入するだろうからである。よって、一つの通信システム内において、ステレオ通信に対応した携帯電話機とモノラル通信に対応した携帯電話機とが混在するようになり、通信システムは、これらステレオ通信およびモノラル通信の双方に対応する必要性が生じる。さらに、移動体通信システムでは、無線信号によって通信データをやりとりするため、伝搬路環境によっては通信データの一部を失う場合がある。そこで、通信データの一部を失っても残りの受信データから元の通信データを復元することができる機能を携帯電話機が有していれば非常に有用である。
ステレオ通信およびモノラル通信の双方に対応することができ、かつ、通信データの一部を失っても残りの受信データから元の通信データを復元することができる機能として、ステレオ信号とモノラル信号とからなるスケーラブル符号化がある。この機能を有したスケーラブル符号化装置の例として、例えば、非特許文献2に開示されたものがある。
Ramprashad, S. A.、"Stereophonic CELP coding using cross channel prediction"、Proc. IEEE Workshop on Speech Coding、Pages:136 - 138、(17-20 Sept. 2000) ISO/IEC 14496-3:1999 (B.14 Scalable AAC with core coder)
しかしながら、非特許文献1に開示の技術は、2つチャネルの音声信号に対し、それぞれ別個に適応符号帳、固定符号帳等を有しており、各チャネルごとに別々の駆動音源信号を発生させ、合成信号を生成している。すなわち、各チャネルごとに音声信号のCELP符号化を行い、得られた各チャネルの符号化情報を復号側に出力している。そのため、符号化パラメータがチャネル数分だけ生成され、符号化レートが増大すると共に、符号化装置の回路規模も大きくなるという問題がある。仮に、適応符号帳、固定符号帳等の個数を減らせば、符号化レートは低下し、回路規模も削減されるが、逆に復号信号の大きな音質劣化につながる。これは、非特許文献2に開示されたスケーラブル符号化装置であっても同様に発生する問題である。
よって、本発明の目的は、復号信号の音質劣化を防ぎつつ、符号化レートを削減し、回路規模を削減することができるスケーラブル符号化装置およびスケーラブル符号化方法を提供することである。
本発明のスケーラブル符号化装置は、第1チャネル信号および第2チャネル信号からモノラル信号を生成するモノラル信号生成手段と、前記第1チャネル信号を加工して前記モノラル信号に類似する第1チャネル加工信号を生成する第1チャネル加工手段と、前記第2チャネル信号を加工して前記モノラル信号に類似する第2チャネル加工信号を生成する第2チャネル加工手段と、前記モノラル音声信号、前記第1チャネル加工信号、および前記第2チャネル加工信号の全て又は一部を、共通の音源で符号化する第1の符号化手段と、前記第1チャネル加工手段および前記第2チャネル加工手段における加工に関する情報を符号化する第2の符号化手段と、を具備する構成を採る。
ここで、前記第1チャネル信号および前記第2チャネル信号とは、ステレオ信号におけるLチャネル信号およびRチャネル信号のこと、またはその逆の信号のことを指している。
本発明によれば、復号信号の音質劣化を防ぎつつ、符号化レートを削減し、符号化装置の回路規模を削減することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、LチャネルおよびRチャネルの2チャネルからなるステレオ信号を符号化する場合を例にとって説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係るスケーラブル符号化装置の主要な構成を示すブロック図である。本実施の形態に係るスケーラブル符号化装置は、第1レイヤ(基本レイヤ)においてモノラル信号の符号化を行い、第2レイヤ(拡張レイヤ)においてLチャネル信号およびRチャネル信号の符号化を行い、各レイヤで得られる符号化パラメータを復号側に伝送するスケーラブル符号化装置である。
本実施の形態に係るスケーラブル符号化装置は、モノラル信号生成部101、モノラル信号合成部102、歪み最小化部103、音源信号生成部104、Lチャネル信号加工部105−1、Lチャネル加工信号合成部106−1、Rチャネル信号加工部105−2、およびRチャネル加工信号合成部106−2を備える。なお、モノラル信号生成部101およびモノラル信号合成部102が上記の第1レイヤに分類され、Lチャネル信号加工部105−1、Lチャネル加工信号合成部106−1、Rチャネル信号加工部105−2、およびRチャネル加工信号合成部106−2が上記の第2レイヤに分類される。また、歪み最小化部103および音源信号生成部104は、第1レイヤおよび第2レイヤに共通の構成である。
上記のスケーラブル符号化装置の動作の概略は以下の通りである。
入力信号がLチャネル信号L1およびRチャネル信号R1からなるステレオ信号であるので、上記のスケーラブル符号化装置は、第1レイヤにおいて、これらLチャネル信号L1およびRチャネル信号R1からモノラル信号M1を生成し、このモノラル信号M1に対し所定の符号化を施す。
一方、第2レイヤにおいては、上記のスケーラブル符号化装置は、Lチャネル信号L1に後述の加工処理を施し、モノラル信号に類似したLチャネル加工信号L2を生成し、このLチャネル加工信号L2に対して所定の符号化を施す。同様に、上記のスケーラブル符号化装置は、第2レイヤにおいて、Rチャネル信号R1に後述の加工処理を施し、モノラル信号に類似したRチャネル加工信号R2を生成し、このRチャネル加工信号R2に対し所定の符号化を施す。
ここで、上記の所定の符号化とは、モノラル信号、Lチャネル加工信号、およびRチャネル加工信号に対し共通に符号化を施し、これら3つの信号に対し共通の単一の符号化パラメータ(単一の音源が複数の符号化パラメータで表現される場合には、一組の符号化パラメータ)を得て、符号化レートの低減を図る符号化処理のことである。例えば、入力信号に近似した音源信号を生成し、この音源信号を特定する情報を求めることにより符号化を行う符号化方法において、上記3つの信号(モノラル信号、Lチャネル加工信号、およびRチャネル加工信号)に対し単一(または一組)の音源信号を割り当てることによって符号化を行う。これは、Lチャネル信号およびRチャネル信号が共にモノラル信号に類似した信号となっているので、共通の符号化処理によって3つの信号を符号化できるものである。なお、この構成において、入力ステレオ信号は、音声信号であっても良いしオーディオ信号であっても良い。
具体的には、本実施の形態に係るスケーラブル符号化装置は、モノラル信号M1、Lチャネル加工信号L2、およびRチャネル加工信号R2のそれぞれの合成信号(M2、L3、R3)を生成し、元の信号と比較することによって3つの合成信号の符号化歪みを求める。そして、求まった符号化歪み3つの和を最小とする音源信号を探索し、この音源信号を特定する情報を符号化パラメータI1として復号側に伝送することによって、符号化レートの低減を図る。
また、ここでは図示していないが、復号側では、Lチャネル信号およびRチャネル信号の復号のために、Lチャネル信号に対し施された加工処理、およびRチャネル信号に対し施された加工処理、についての情報が必要であるため、本実施の形態に係るスケーラブル符号化装置は、これらの加工処理に関する情報についても別途符号化を行い、復号側に伝送する。
次に、上記のLチャネル信号またはRチャネル信号に施される加工処理について説明する。
一般的に、同一発生源からの音声信号またはオーディオ信号であっても、マイクロフォンの置かれている位置、すなわち、このステレオ信号を収音(受聴)する位置によって、信号の波形が異なる特性を示すようになる。簡単な例としては、発生源からの距離に応じて、ステレオ信号のエネルギーは減衰すると共に、到達時間に遅延も発生し、収音位置によって異なる波形スペクトルを示すようになる。このように、ステレオ信号は、収音環境という空間的な因子によって大きな影響を受ける。
図2は、同一発生源からの音を異なる2つの位置で収音した信号(第1信号W1、第2信号W2)の波形スペクトルの一例を示した図である。
この図に示すように、第1信号および第2信号でそれぞれ異なる特性を示すことが見てとれる。この異なる特性を示す現象は、元の信号の波形に、収音位置によって異なる新たな空間的な特性が加えられた後に、マイクロフォン等の収音機器で信号が取得された結果と捉えることができる。この特性を本明細書では空間情報(Spatial Information)と呼ぶこととする。この空間情報は、ステレオ信号に聴感的な広がり感を与えるものである。また、第1信号および第2信号は、同一発生源からの信号に空間情報が加えられたものであるため、次に示すような性質も帯びている。例えば、図2の例では、第1信号W1を時間Δtだけ遅延すると信号W1’となる。次に、信号W1’の振幅を一定の割合で減じて振幅差ΔAを消滅させれば、信号W1’は同一発生源からの信号であるため、理想的には第2信号W2と一致することが期待できる。すなわち、音声信号またはオーディオ信号に含まれる空間情報を修正する処理を施すことにより、第1信号および第2信号の特性の違い(波形上の差異)をほぼ取り除くことができ、その結果、両方のステレオ信号の波形を類似させることができる。なお、空間情報については後ほど更に詳述する。
そこで、本実施の形態では、Lチャネル信号L1およびRチャネル信号R1に対し、各空間情報を修正する加工処理を加えることにより、モノラル信号M1に類似したLチャネル加工信号L2およびRチャネル加工信号R2を生成する。これにより、符号化処理で使用される音源を共有化することができ、また、符号化パラメータとしても3つの信号に対しそれぞれの符号化パラメータを生成しなくとも、単一(または一組)の符号化パラメータを生成することによって精度の良い符号化情報を得ることができる。
次いで、上記のスケーラブル符号化装置の動作について、各ブロックごとに説明する。
モノラル信号生成部101は、入力されたLチャネル信号L1とRチャネル信号R1とから、両信号の中間的な性質を有するモノラル信号M1を生成し、モノラル信号合成部102に出力する。
モノラル信号合成部102は、モノラル信号M1と音源信号生成部104で生成される音源信号S1とを用いて、モノラル信号の合成信号M2を生成する。
Lチャネル信号加工部105−1は、Lチャネル信号L1とモノラル信号M1との差の情報であるLチャネル空間情報を取得し、これを用いてLチャネル信号L1に対し上記の加工処理を施し、モノラル信号M1に類似したLチャネル加工信号L2を生成する。なお、空間情報については後ほど詳述する。
Lチャネル加工信号合成部106−1は、Lチャネル加工信号L2と音源信号生成部104で生成される音源信号S1とを用いて、Lチャネル加工信号L2の合成信号L3を生成する。
Rチャネル信号加工部105−2およびRチャネル加工信号合成部106−2の動作については、Lチャネル信号加工部105−1およびLチャネル加工信号合成部106−1の動作と基本的に同様であるため、その説明を省略する。ただ、Lチャネル信号加工部105−1およびLチャネル加工信号合成部106−1の処理対象はLチャネルであるが、Rチャネル信号加工部105−2およびRチャネル加工信号合成部106−2の処理対象はRチャネルである。
歪み最小化部103は、音源信号生成部104を制御し、各合成信号(M2、L3、R3)の符号化歪みの和が最小となるような音源信号S1を生成させる。なお、この音源信号S1は、モノラル信号、Lチャネル信号、およびRチャネル信号に共通である。また、各合成信号の符号化歪みを求めるには、元の信号であるM1、L2、R2も入力として必要であるが、本図面においては説明を簡単にするために省略している。
音源信号生成部104は、歪み最小化部103の制御の下、モノラル信号、Lチャネル信号、およびRチャネル信号に共通の音源信号S1を生成する。
次いで、上記のスケーラブル符号化装置のさらに詳細な構成について以下説明する。図3は、図1に示した本実施の形態に係るスケーラブル符号化装置のさらに詳細な構成を示すブロック図である。なお、ここでは、入力信号が音声信号であり、符号化方式としてCELP符号化を用いるスケーラブル符号化装置を例にとって説明する。また、図1に示したものと同一の構成要素、信号には同一の符号を付し、基本的にその説明を省略する。
このスケーラブル符号化装置は、音声信号を声道情報と音源情報とに分け、声道情報については、LPC分析・量子化部(111、114−1、114−2)において、LPCパラメータ(線形予測係数)を求めることにより符号化し、音源情報については、予め記憶されている音声モデルのいずれを用いるかを特定するインデックス、すなわち、音源信号生成部104内の適応符号帳および固定符号帳でどのような音源ベクトルを生成するかを特定するインデックスI1を求めることにより、符号化を行う。
なお、図3において、LPC分析・量子化部111およびLPC合成フィルタ112が図1に示したモノラル信号合成部102に、LPC分析・量子化部114−1およびLPC合成フィルタ115−1が図1に示したLチャネル加工信号合成部106−1に、LPC分析・量子化部114−2およびLPC合成フィルタ115−2が図1に示したRチャネル加工信号合成部106−2に、空間情報処理部113−1が図1に示したLチャネル
信号加工部105−1に、空間情報処理部113−2が図1に示したRチャネル信号加工部105−2に、それぞれ対応している。また、空間情報処理部113−1、113−2においては、内部にてそれぞれLチャネル空間情報、Rチャネル空間情報を生成している。
具体的には、この図に示したスケーラブル符号化装置の各部は以下の動作を行う。なお、適宜図面を参照しながら説明を行う。
モノラル信号生成部101は、入力されたLチャネル信号L1およびRチャネル信号R1の平均を求め、これをモノラル信号M1としてモノラル信号合成部102に出力する。図4は、モノラル信号生成部101内部の主要な構成を示すブロック図である。加算器121がLチャネル信号L1およびRチャネル信号R1の和を求め、乗算器122がこの和信号のスケールを1/2にして出力する。
LPC分析・量子化部111は、モノラル信号M1に対して線形予測分析を施し、スペクトル包絡情報であるLPCパラメータを求めて歪み最小化部103へ出力し、さらに、このLPCパラメータを量子化し、得られる量子化LPCパラメータ(モノラル信号用LPC量子化インデックス)I11をLPC合成フィルタ112および本実施の形態に係るスケーラブル符号化装置の外部へ出力する。
LPC合成フィルタ112は、LPC分析・量子化部111から出力される量子化LPCパラメータをフィルタ係数とし、音源信号生成部104内の適応符号帳および固定符号帳で生成される音源ベクトルを駆動音源としたフィルタ関数、すなわち、LPC合成フィルタを用いて合成信号を生成する。このモノラル信号の合成信号M2は、歪み最小化部103へ出力される。
空間情報処理部113−1は、Lチャネル信号L1とモノラル信号M1とから、Lチャネル信号L1およびモノラル信号M1の特性の差を示すLチャネル空間情報を生成する。また、空間情報処理部113−1は、このLチャネル空間情報を用いてLチャネル信号L1に対し上記の加工処理を施し、モノラル信号M1に類似したLチャネル加工信号L2を生成する。
図5は、空間情報処理部113−1内部の主要な構成を示すブロック図である。
空間情報分析部131は、Lチャネル信号L1とモノラル信号M1とを比較分析することによって、両チャネル信号の空間情報の差を求め、得られた分析結果を空間情報量子化部132に出力する。空間情報量子化部132は、空間情報分析部131で得られた両チャネルの空間情報の差に対し量子化を行い、得られる符号化パラメータ(Lチャネル信号用空間情報量子化インデックス)I12を本実施の形態に係るスケーラブル符号化装置の外部に出力する。また、空間情報量子化部132は、空間情報分析部131で得られたLチャネル信号用空間情報量子化インデックスに対して逆量子化を施し、空間情報除去部133に出力する。空間情報除去部133は、空間情報量子化部132から出力された逆量子化された空間情報量子化インデックス、すなわち、空間情報分析部131で得られた両チャネルの空間情報の差を量子化して逆量子化した信号を、Lチャネル信号L1から減じることにより、Lチャネル信号L1をモノラル信号M1に類似した信号に変換する。この空間情報が除去されたLチャネル信号(Lチャネル加工信号)L2は、LPC分析・量子化部114−1に出力される。
LPC分析・量子化部114−1の動作は、入力をLチャネル加工信号L2とする以外は、LPC分析・量子化部111と同様であり、得られるLPCパラメータを歪み最小化
部103へ出力し、Lチャネル信号用LPC量子化インデックスI13をLPC合成フィルタ115−1および本実施の形態に係るスケーラブル符号化装置の外部に出力する。
LPC合成フィルタ115−1の動作も、LPC合成フィルタ112と同様であり、得られる合成信号L3を歪み最小化部103に出力する。
また、空間情報処理部113−2、LPC分析・量子化部114−2、およびLPC合成フィルタ115−2の動作も、処理対象をRチャネルとする以外は、空間情報処理部113−1、LPC分析・量子化部114−1、およびLPC合成フィルタ115−1と同様であるので、その説明を省略する。
図6は、歪み最小化部103内部の主要な構成を示すブロック図である。
加算器141−1は、モノラル信号M1から、このモノラル信号の合成信号M2を減ずることにより誤差信号E1を算出し、この誤差信号E1を聴覚重み付け部142−1へ出力する。
聴覚重み付け部142−1は、LPC分析・量子化部111から出力されるLPCパラメータをフィルタ係数とする聴覚重み付けフィルタを用いて、加算器141−1から出力される符号化歪みE1に対して聴覚的な重み付けを施し、加算器143へ出力する。
加算器141−2は、空間情報が除去されたLチャネル信号(Lチャネル加工信号)L2から、この信号の合成信号L3を減ずることにより、誤差信号E2を算出し、聴覚重み付け部142−2へ出力する。
聴覚重み付け部142−2の動作は、聴覚重み付け部142−1と同様である。
加算器141−3も加算器141−2と同様に、空間情報が除去されたRチャネル信号(Rチャネル加工信号)R2から、この信号の合成信号R3を減ずることにより、誤差信号E3を算出し、聴覚重み付け部142−3へ出力する。
聴覚重み付け部142−3の動作も、聴覚重み付け部142−1と同様である。
加算器143は、聴覚重み付け部142−1〜142−3から出力される聴覚重み付けがされた後の誤差信号E1〜E3を加算し、歪み最小値判定部144に出力する。
歪み最小値判定部144は、聴覚重み付け部142−1〜142−3から出力される聴覚重み付けがされた後の誤差信号E1〜E3の全てを考慮し、これら3つの誤差信号から求まる符号化歪みが共に小さくなるような、音源信号生成部104内部の各符号帳(適応符号帳、固定符号帳、およびゲイン符号帳)の各インデックスをサブフレームごとに求める。これらの符号帳インデックスI1は、符号化パラメータとして本実施の形態に係るスケーラブル符号化装置の外部に出力される。
具体的には、歪み最小値判定部144は、符号化歪みを誤差信号の2乗によって表し、聴覚重み付け部142−1〜142−3から出力される誤差信号から求まる符号化歪みの総和E1+E2+E3を最小とする、音源信号生成部104内部の各符号帳のインデックスを求める。このインデックスを求める一連の処理は、閉ループ(帰還ループ)となっており、歪み最小値判定部144は、音源信号生成部104に対し、各符号帳のインデックスをフィードバック信号F1を用いて指示し、1サブフレーム内において様々に変化させることによって各符号帳を探索して最終的に得られる各符号帳のインデックスI1
を本実施の形態に係るスケーラブル符号化装置の外部に出力する。
図7は、音源信号生成部104内部の主要な構成を示すブロック図である。
適応符号帳151は、歪み最小化部103から指示されたインデックスに対応する適応符号帳ラグに従って、1サブフレーム分の音源ベクトルを生成する。この音源ベクトルは、適応符号帳ベクトルとして乗算器152へ出力される。固定符号帳153は、所定形状の音源ベクトルを複数個予め記憶しており、歪み最小化部103から指示されたインデックスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器154へ出力する。ゲイン符号帳155は、歪み最小化部103からの指示に従って、適応符号帳151から出力される適応符号帳ベクトル用のゲイン(適応符号帳ゲイン)、および固定符号帳153から出力される固定符号帳ベクトル用のゲイン(固定符号帳ゲイン)を生成し、それぞれ乗算器152、154へ出力する。
乗算器152は、ゲイン符号帳155から出力される適応符号帳ゲインを、適応符号帳151から出力される適応符号帳ベクトルに乗じ、加算器156へ出力する。乗算器154は、ゲイン符号帳155から出力される固定符号帳ゲインを、固定符号帳153から出力される固定符号帳ベクトルに乗じ、加算器156へ出力する。加算器156は、乗算器152から出力される適応符号帳ベクトルと、乗算器154から出力される固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源信号S1として出力する。
図8は、上記のスケーラブル符号化処理の手順を説明するためのフロー図である。
モノラル信号生成部101は、Lチャネル信号およびRチャネル信号を入力信号とし、これらの信号を用いてモノラル信号を生成する(ST1010)。LPC分析・量子化部111は、モノラル信号のLPC分析および量子化を行う(ST1020)。空間情報処理部113−1、113−2は、それぞれLチャネル信号、Rチャネル信号に対し上記の空間情報処理、すなわち、空間情報の抽出および空間情報の除去を行う(ST1030)。LPC分析・量子化部114−1、114−2は、空間情報が除去されたLチャネル信号およびRチャネル信号に対して、モノラル信号と同様に、LPC分析および量子化を行う(ST1040)。なお、ST1010のモノラル信号の生成からST1040のLPC分析・量子化までの処理を総称して処理P1と呼ぶ。
歪み最小化部103は、上記3つの信号の符号化歪みが最小になるような各符号帳のインデックスを決定する(処理P2)。すなわち、音源信号を生成し(ST1110)、モノラル信号の合成・符号化歪みの算出を行い(ST1120)、Lチャネル信号およびRチャネル信号の合成・符号化歪みの算出を行い(ST1130)、符号化歪みの最小値の判定を行う(ST1140)。このST1110〜1140の符号帳インデックスを探索する処理は閉ループであり、全てのインデックスについて探索が行われ、全探索が終了した時点でループが終了する(ST1150)。そして、歪み最小化部103は、求まった符号帳インデックスを出力する(ST1160)。
なお、上記の処理手順において、処理P1はフレーム単位で行われ、処理P2はフレームをさらに分割したサブフレーム単位で行われる。
また、上記の処理手順では、ST1020とST1030〜ST1040とが、この順で行われる場合を例にとって説明したが、ST1020とST1030〜ST1040とは、同時に処理(すなわち、並列処理)されても良い。また、ST1120とST1130とに関しても同様で、これらの手順も並列処理であって良い。
次いで、上記の空間情報処理部113−1の各部の処理を、数式を用いて詳細に説明する。空間情報処理部113−2の説明は、空間情報処理部113−1と同様なので省略する。
まず、空間情報として、2チャネル間のエネルギー比および遅延時間差を使用する場合を例にとって説明する。
空間情報分析部131は、2チャネル間のフレーム単位のエネルギー比を算出する。まず、Lチャネル信号およびモノラル信号の1フレーム内のエネルギーELchおよびEが、次の式(1)および式(2)に従って求められる。
Figure 0004842147
Figure 0004842147
ここで、nはサンプル番号、FLは1フレームのサンプル数(フレーム長)である。また、xLch(n)およびx(n)は、各々Lチャネル信号およびモノラル信号の第nサンプルの振幅を示す。
そして、空間情報分析部131は、Lチャネル信号およびモノラル信号のエネルギー比の平方根Cを次の式(3)に従って求める。
Figure 0004842147
また、空間情報分析部131は、Lチャネル信号のモノラル信号に対する2チャネル間の信号の時間的ずれの量である遅延時間差を、以下のように、2チャネルの信号間で最も相互相関が最も高くなるような値として求める。具体的には、モノラル信号およびLチャネル信号の相互相関関数Φが次の式(4)に従って求められる。
Figure 0004842147
ここで、mはあらかじめ定めたmin_mからmax_mまでの範囲の値をとるものとし、Φ(m)が最大となるときのm=MをLチャネル信号のモノラル信号に対する遅延時間差とする。
なお、上記のエネルギー比および遅延時間差を以下の式(5)によって求めても良い。式(5)では、モノラル信号と、このモノラル信号に対して空間情報を除去したLチャネル信号と、の誤差Dを最小にするようなエネルギー比の平方根Cおよび遅延時間mを求める。
Figure 0004842147
空間情報量子化部132は、上記CおよびMを予め定めたビット数で量子化し、量子化されたCおよびMをそれぞれ、CおよびMとする。
空間情報除去部133は、Lチャネル信号から以下の式(6)の変換式に従って空間情報を除去する。
Figure 0004842147
なお、上記の空間情報の具体例としては、以下のものがある。
例えば、2チャネル間のエネルギー比および遅延時間差という2つのパラメータを空間情報として使用することができる。これらは定量化のし易いパラメータである。また、バリエーションとして周波数帯域ごとの伝播特性、例えば、位相差、振幅比等を使用することもできる。
以上説明したように、本実施の形態によれば、符号化対象の信号を互いに類似させて共通の音源で符号化するので、復号信号の音質劣化を防ぎつつ、符号化レートを削減して回路規模を削減することができる。
また、各レイヤにおいて共通の音源を用いて符号化するので、各レイヤごとに、適応符号帳、固定符号帳、およびゲイン符号帳のセットを設置する必要がなく、1セットの各符号帳で音源を生成することができる。すなわち、回路規模を削減することができる。
また、以上の構成において、歪み最小化部103は、モノラル信号、Lチャネル信号、Rチャネル信号の全ての符号化歪みを考慮し、これらの符号化歪みの総和が最小となるような制御を行う。よって、符号化性能が高まり、復号信号の音質を向上させることができる。
なお、本実施の形態の図3以降では、符号化方式としてCELP符号化が用いられる場合を例にとって説明したが、必ずしもCELP符号化のように音声モデルを用いる符号化である必要はないし、符号帳に予め登録された音源を利用する符号化方法でなくても良い。
また、本実施の形態では、モノラル信号、Lチャネル加工信号、およびRチャネル加工信号の3つの信号の符号化歪みの全てを考慮する場合を例にとって説明したが、モノラル信号、Lチャネル加工信号、およびRチャネル加工信号は互いに類似しているので、1チャネルのみ、例えば、モノラル信号のみの符号化歪みを最小とする符号化パラメータを求め、この符号化パラメータを復号側に伝送するようにしても良い。かかる場合でも、復号側では、モノラル信号の符号化パラメータを復号して、このモノラル信号を再生することができると共に、LチャネルおよびRチャネルについても、本実施の形態に係るスケーラ
ブル符号化装置から出力されたLチャネル空間情報またはRチャネル空間情報の符号化パラメータを復号して復号モノラル信号に対し上記の加工処理と逆の処理を施すことにより、大きく品質を低下させることなく両チャネルの信号を再生することができる。
さらに、本実施の形態においては、2チャネル間(例えば、Lチャネル信号とモノラル信号)のエネルギー比および遅延時間差という2つのパラメータの双方を空間情報とする場合を例にとって説明したが、空間情報としていずれか一方のパラメータだけを使用するようにしても良い。1つのパラメータのみを使用する場合は、2つのパラメータを用いる場合と比較して2つのチャネルの類似性を向上させる効果が減少するが、逆に符号化ビット数をさらに削減できるという効果がある。
例えば、空間情報として2チャネル間のエネルギー比のみを用いる場合、Lチャネル信号の変換は、上記式(3)で求まるエネルギー比の平方根Cを量子化した値Cを用いて、以下の式(7)に従って行う。
Figure 0004842147
式(7)におけるエネルギー比の平方根Cは、振幅比と言うこともできるので(ただし、符号は正のみ)、xLch(n)にCを乗じることによってxLch(n)の振幅を変換、すなわち、音源との距離によって減衰した振幅を補正することができるので、空間情報のうち距離による影響を除去したことに相当する。
例えば、空間情報として2チャネル間の遅延時間差のみを用いる場合、サブチャネル信号の変換は、上記式(4)で求まるΦ(m)を最大とするm=Mを量子化した値Mを用いて、以下の式(8)に従って行う。
Figure 0004842147
式(8)におけるΦを最大とするMは、時間を離散的に表した値なので、xLch(n)のnをn−Mに置き換えることによって時間をMだけさかのぼった(時間Mだけ前の)波形xLch(n)に変換したことになる。すなわち、Mだけ波形を遅延させることになるので、空間情報のうち距離による影響を除去したことに相当する。なお、音源の方向が違うということは距離も違うこととなるので、方向による影響も考慮したことになる。
また、空間情報を除去したLチャネル信号およびRチャネル信号に対して、LPC量子化部で量子化する際に、モノラル信号に対して量子化された量子化LPCパラメータを用いて、差分量子化や予測量子化等を行うようにしても良い。空間情報を除去したLチャネル信号およびRチャネル信号は、モノラル信号に近い信号に変換されているので、これらの信号に対するLPCパラメータは、モノラル信号のLPCパラメータとの相関が高いため、より低いビットレートで効率的な量子化を行うことが可能となるからである。
また、歪み最小化部103では、符号化歪みを算出する際に、モノラル信号またはステ
レオ信号のどちらかの符号化歪みの寄与を少なくするように、以下の式(9)のように、あらかじめ重み付け係数α、β、γを設定しておくこともできる。
符号化歪み=α×モノラル信号の符号化歪み+β×Lチャネル信号の符号化歪み
+γ×Rチャネル信号の符号化歪み …(9)
このように、符号化歪みの寄与を小さくしたい信号(高音質で符号化したい信号)に対する重み付け係数を他の信号の重み付け係数よりも大きくすることによって、使用環境に応じた符号化を実現することができる。例えば、復号する際に、モノラル信号よりもステレオ信号で復号される場合が多いことがあらかじめ想定される信号を符号化する場合には、重み付け係数として、αよりもβ、γを大きな値に設定し、このときβとγは同じ値を使用する。
また、上記の重み付け係数の設定方法のバリエーションとしては、ステレオ信号の符号化歪みのみを考慮し、モノラル信号の符号化歪みに関しては考慮しないようにすることもできる。この場合は、αを0に設定する。βおよびγは同じ値(例えば1)に設定する。
また、ステレオ信号のうち、一方のチャネルの信号(例えばLチャネル信号)に重要な情報が含まれる場合(例えば、Lチャネル信号は音声、Rチャネル信号は背景音楽)には、重み付け係数として、βをγより大きな値に設定する。
また、モノラル信号および空間情報を除去したLチャネル信号のみの2つの信号の符号化歪みを最小にするように、音源信号のパラメータを探索し、かつLPCパラメータも2つの信号についてのみ、量子化するようにすることもできる。この場合、Rチャネル信号は、次の式(10)から求めることができる。さらに、Lチャネル信号とRチャネル信号を逆にすることも可能である。
R(i)=2×M(i)−L(i) …(10)
ここで、R(i)はRチャネル信号、M(i)はモノラル信号、L(i)はLチャネル信号のi番目のサンプルの振幅値である。
また、モノラル信号、Lチャネル加工信号、Rチャネル加工信号が互いに類似していれば、音源を共有化することができる。よって、本実施の形態では、空間情報を除去する等の加工処理だけでなく、他の加工処理を利用しても上記と同様の作用・効果を得ることができる。
(実施の形態2)
実施の形態1においては、歪み最小化部103が、モノラル信号、Lチャネル、Rチャネルの全ての符号化歪みを考慮し、これらの符号化歪みの総和が最小となるような符号化ループの制御を行っていた。しかし厳密に言えば、歪み最小化部103は、例えばLチャネルについては、空間情報が除去されたLチャネル信号と、空間情報が除去されたLチャネル信号の合成信号と、の間の符号化歪みを求めて使用しており、これらの信号は空間情報が除去された後の信号であるため、Lチャネル信号というよりはモノラル信号に近い性質を有した信号である。すなわち、符号化ループのターゲット信号が、原信号ではなく、所定の処理を施した後の信号になっている。
そこで、本実施の形態では、歪み最小化部103における符号化ループのターゲット信号として、原信号を用いることとする。一方、本発明では原信号に対する合成信号が存在しないため、例えばLチャネルについては、空間情報が除去されたLチャネル信号の合成信号に、再び空間情報を付与する構成を設け、空間情報が復元されたLチャネル合成信号を求め、この合成信号と原信号(Lチャネル信号)とから符号化歪みを算出する。
図9は、本発明の実施の形態2に係るスケーラブル符号化装置の詳細な構成を示すブロック図である。なお、このスケーラブル符号化装置は、実施の形態1に示したスケーラブル符号化装置(図3参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態に係るスケーラブル符号化装置は、実施の形態1の構成に加え、さらに、空間情報付与部201−1、201−2、LPC分析部202−1、202−2を備え、また、符号化ループの制御を司る歪み最小化部の機能が実施の形態1と異なる(歪み最小化部203)。
空間情報付与部201−1は、LPC合成フィルタ115−1から出力される合成信号L3に対し、空間情報処理部113−1で除去された空間情報を付与し、歪み最小化部203に出力する(L3’)。LPC分析部202−1は、原信号であるLチャネル信号L1に対し線形予測分析を行い、得られるLPCパラメータを歪み最小化部203に出力する。歪み最小化部203の動作については後述する。
なお、空間情報付与部201−2、LPC分析部202−2の動作も上記と同様である。
図10は、空間情報付与部201−1内部の主要な構成について示すブロック図である。なお、空間情報付与部201−2の構成も同様である。
空間情報付与部201−1は、空間情報逆量子化部211および空間情報復号部212を備える。空間情報逆量子化部211は、入力されたLチャネル信号用の空間情報量子化インデックスCおよびMを逆量子化し、Lチャネル信号のモノラル信号に対する空間情報量子化パラメータC’およびM’を空間情報復号部212に出力する。空間情報復号部212は、空間情報が除去されたLチャネル信号の合成信号L3に対し、空間情報量子化パラメータC’およびM’を適用することにより、空間情報を付与したLチャネル合成信号L3’を生成し、出力する。
次いで、空間情報付与部201−1における処理を説明するための数式を以下に示す。なお、これらの処理は、空間情報処理部113−1における処理の逆処理にすぎないので、詳細な説明は省略する。
例えば、空間情報として、エネルギー比および遅延時間差を用いる場合は、上記式(6)に対応して、以下の式(11)となる。
Figure 0004842147
また、例えば、空間情報としてエネルギー比のみを用いる場合は、上記式(7)に対応して、以下の式(12)となる。
Figure 0004842147
また、例えば、空間情報として遅延時間差のみを用いる場合は、上記式(8)に対応して、以下の式(13)となる。
Figure 0004842147
なお、Rチャネル信号についても同様の数式によって説明される。
図11は、上記の歪み最小化部203内部の主要な構成を示すブロック図である。なお、実施の形態1で示した歪み最小化部103と同一の構成要素には同一の符号を付し、その説明を省略する。
歪み最小化部203には、モノラル信号M1とモノラル信号の合成信号M2、Lチャネル信号L1とこれに対する空間情報を付与された合成信号L3’、および、Rチャネル信号R1とこれに対する空間情報を付与された合成信号R3’が入力される。歪み最小化部203は、それぞれの信号間の符号化歪みを算出し、聴覚重み付けを行った上で、各符号か歪みの総和を算出し、この符号化歪みが最小となる各符号帳のインデックスを決定する。
また、聴覚重み付け部142−2には、Lチャネル信号のLPCパラメータが入力され、聴覚重み付け部142−2は、これをフィルタ係数として聴覚重み付けを行う。また、聴覚重み付け部142−3には、Rチャネル信号のLPCパラメータが入力され、聴覚重み付け部142−3は、これをフィルタ係数として聴覚重み付けを行う。
図12は、上記のスケーラブル符号化処理の手順を説明するためのフロー図である。
実施の形態1で示した図8との違いは、ST1130の代わりに、L/Rチャネル信号の合成および空間情報付与を行うステップ(ST2010)と、L/Rチャネル信号の符号化歪みの算出を行うステップ(ST2020)とが入っている点である。
このように、本実施の形態によれば、符号化ループのターゲット信号として、実施の形態1のような所定の処理を施した後の信号ではなく、原信号であるLチャネル信号およびRチャネル信号をそのまま用いる。また、ターゲット信号を原信号とするために、対応する合成信号としては、空間情報を復元したLPC合成信号を使用する。よって、符号化精度が向上することが期待される。
何故なら、例えば、実施の形態1では、Lチャネル信号およびRチャネル信号に対して、空間情報を除去した後の信号から合成される信号の符号化歪みを最小化するように、符
号化ループが動作していた。よって、最終的に出力される復号信号に対する符号化歪みは最小となっていないおそれがあるからである。
また、例えば、Lチャネル信号の振幅がモノラル信号の振幅に比べ著しく大きい場合、実施の形態1の方法では、歪み最小化部に入力されるLチャネル信号の誤差信号において、この振幅が大きいことによる影響が除去された後の信号となっている。よって、復号装置において、空間情報を復元する際に、振幅の増幅に伴って、不要な符号化歪みも増幅されることとなり、再生音質が劣化する。一方、本実施の形態では、復号装置で得られる復号信号と同一の信号に含まれる符号化歪みを対象に最小化を行っているので、このような問題は生じない。
また、以上の構成において、聴覚重み付けに用いるLPCパラメータは、空間情報を除去する前のLチャネル信号およびRチャネル信号から求まるLPCパラメータを用いる。すなわち、聴覚重み付けにおいては、原信号であるLチャネル信号およびRチャネル信号そのものに対する聴覚重みを適用するようにする。よって、Lチャネル信号およびRチャネル信号に対し、より聴覚的に歪みの小さい高音質な符号化を行うことができる。
以上、本発明の実施の形態について説明した。
本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、上記実施の形態に限定されず、種々変更して実施することが可能である。
本発明に係るスケーラブル符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。また、本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、有線方式の通信システムにおいても利用可能である。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るスケーラブル符号化方法の処理のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明のスケーラブル符号化装置と同様の機能を実現することができる。
なお、適応符号帳(adaptive codebook)は、適応音源符号帳と呼ばれることもある。また、固定符号帳(fixed codebook)は、固定音源符号帳と呼ばれることもある。また、固定符号帳は、雑音符号帳、確率符号帳(stochastic codebook)、あるいは乱数符号帳(random codebook)と呼ばれることもある。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されていても良いし、一部または全てを含むように1チップ化されていても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2004年12月28日出願の特願2004−381492および2005年5月31日出願の特願2005−160187に基づく。これらの内容はすべてここに含めておく。
本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、移動体通信システムにおける通信端末装置、基地局装置等の用途に適用できる。
実施の形態1に係るスケーラブル符号化装置の主要な構成を示すブロック図 同一発生源からの音を異なる位置で取得した信号の波形スペクトルの一例を示した図 実施の形態1に係るスケーラブル符号化装置のさらに詳細な構成を示すブロック図 実施の形態1に係るモノラル信号生成部内部の主要な構成を示すブロック図 実施の形態1に係る空間情報処理部内部の主要な構成を示すブロック図 実施の形態1に係る歪み最小化部内部の主要な構成を示すブロック図 実施の形態1に係る音源信号生成部内部の主要な構成を示すブロック図 実施の形態1に係るスケーラブル符号化処理の手順を説明するためのフロー図 実施の形態2に係るスケーラブル符号化装置の詳細な構成を示すブロック図 実施の形態2に係る空間情報付与部内部の主要な構成について示すブロック図 実施の形態2に係る歪み最小化部内部の主要な構成を示すブロック図 実施の形態2に係るスケーラブル符号化処理の手順を説明するためのフロー図

Claims (11)

  1. 第1チャネル信号および第2チャネル信号からモノラル信号を生成するモノラル信号生成手段と、
    前記第1チャネル信号を加工して前記モノラル信号に類似する第1チャネル加工信号を生成する第1チャネル加工手段と、
    前記第2チャネル信号を加工して前記モノラル信号に類似する第2チャネル加工信号を生成する第2チャネル加工手段と、
    前記モノラル信号、前記第1チャネル加工信号、および前記第2チャネル加工信号の全て又は一部を、共通の音源で符号化する第1の符号化手段と、
    前記第1チャネル加工手段および前記第2チャネル加工手段における加工に関する情報を符号化する第2の符号化手段と、
    を具備するスケーラブル符号化装置。
  2. 前記第1チャネル加工手段は、
    前記第1チャネル信号に含まれる空間情報に修正を加えて前記第1チャネル加工信号を生成し、
    前記第2チャネル加工手段は、
    前記第2チャネル信号に含まれる空間情報に修正を加えて前記第2チャネル加工信号を生成し、
    前記第2の符号化手段は、
    前記第1チャネル加工手段および前記第2チャネル加工手段において加えられた前記修正に関する情報を符号化する、
    請求項1記載のスケーラブル符号化装置。
  3. 前記第1チャネル信号に含まれる空間情報は、
    前記第1チャネル信号および前記モノラル信号の波形上の差に関する情報である、
    請求項2記載のスケーラブル符号化装置。
  4. 前記波形上の差に関する情報は、
    エネルギーおよび遅延時間の双方または一方に関する情報である、
    請求項3記載のスケーラブル符号化装置。
  5. 前記第1の符号化手段は、
    前記モノラル信号、前記第1チャネル加工信号、および前記第2チャネル加工信号の全て又は一部に共通の適応符号帳および固定符号帳を具備する、
    請求項1記載のスケーラブル符号化装置。
  6. 前記第1の符号化手段は、
    前記モノラル信号の符号化歪み、前記第1チャネル加工信号の符号化歪み、および前記第2チャネル加工信号の符号化歪み、の総和を最小とする前記共通の音源を求める、
    請求項1記載のスケーラブル符号化装置。
  7. 前記第1チャネル加工信号に対し、前記第1加工手段における加工と逆の処理を施して第1チャネル信号を得る第1逆処理手段と、
    前記第2チャネル加工信号に対し、前記第2加工手段における加工と逆の処理を施して第2チャネル信号を得る第2逆処理手段と、
    をさらに具備し、
    前記第1の符号化手段は、
    前記モノラル信号の符号化歪み、前記第1逆処理手段で得られる第1チャネル信号の符号化歪み、および前記第2逆処理手段で得られる第2チャネル信号の符号化歪み、の総和を最小とする前記共通の音源を求める、
    請求項1記載のスケーラブル符号化装置。
  8. 前記モノラル信号をLPC分析してモノラルLPCパラメータを得るモノラルLPC分析手段と、
    前記第1チャネル信号をLPC分析して第1チャネルLPCパラメータを得る第1チャネルLPC分析手段と、
    前記第2チャネル信号をLPC分析して第2チャネルLPCパラメータを得る第2チャネルLPC分析手段と、
    前記モノラル信号の符号化歪みに対し、前記モノラルLPCパラメータを用いて聴覚重み付けを施すモノラル聴覚重み付け手段と、
    前記第1逆処理手段で得られる第1チャネル信号の符号化歪みに対し、前記第1チャネルLPCパラメータを用いて聴覚重み付けを施す第1チャネル聴覚重み付け手段と、
    前記第2逆処理手段で得られる第2チャネル信号の符号化歪みに対し、前記第2チャネルLPCパラメータを用いて聴覚重み付けを施す第2チャネル聴覚重み付け手段と、
    をさらに具備する請求項7記載のスケーラブル符号化装置。
  9. 請求項1記載のスケーラブル符号化装置を具備する通信端末装置。
  10. 請求項1記載のスケーラブル符号化装置を具備する基地局装置。
  11. 第1チャネル信号および第2チャネル信号からモノラル信号を生成するモノラル信号生成ステップと、
    前記第1チャネル信号を加工して前記モノラル信号に類似する第1チャネル加工信号を生成する第1チャネル加工ステップと、
    前記第2チャネル信号を加工して前記モノラル信号に類似する第2チャネル加工信号を生成する第2チャネル加工ステップと、
    前記モノラル信号、前記第1チャネル加工信号、および前記第2チャネル加工信号の全て又は一部を、共通の音源で符号化する第1の符号化ステップと、
    前記第1チャネル加工ステップおよび前記第2チャネル加工ステップにおける加工に関する情報を符号化する第2の符号化ステップと、
    を具備するスケーラブル符号化方法。
JP2006550772A 2004-12-28 2005-12-26 スケーラブル符号化装置およびスケーラブル符号化方法 Expired - Fee Related JP4842147B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006550772A JP4842147B2 (ja) 2004-12-28 2005-12-26 スケーラブル符号化装置およびスケーラブル符号化方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2004381492 2004-12-28
JP2004381492 2004-12-28
JP2005160187 2005-05-31
JP2005160187 2005-05-31
JP2006550772A JP4842147B2 (ja) 2004-12-28 2005-12-26 スケーラブル符号化装置およびスケーラブル符号化方法
PCT/JP2005/023812 WO2006070760A1 (ja) 2004-12-28 2005-12-26 スケーラブル符号化装置およびスケーラブル符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006070760A1 JPWO2006070760A1 (ja) 2008-06-12
JP4842147B2 true JP4842147B2 (ja) 2011-12-21

Family

ID=36614877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006550772A Expired - Fee Related JP4842147B2 (ja) 2004-12-28 2005-12-26 スケーラブル符号化装置およびスケーラブル符号化方法

Country Status (6)

Country Link
US (1) US20080162148A1 (ja)
EP (1) EP1818910A4 (ja)
JP (1) JP4842147B2 (ja)
KR (1) KR20070090217A (ja)
BR (1) BRPI0519454A2 (ja)
WO (1) WO2006070760A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055169A1 (en) * 2005-01-26 2009-02-26 Matsushita Electric Industrial Co., Ltd. Voice encoding device, and voice encoding method
JP4969454B2 (ja) * 2005-11-30 2012-07-04 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2008016098A1 (ja) * 2006-08-04 2009-12-24 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
KR101398836B1 (ko) * 2007-08-02 2014-05-26 삼성전자주식회사 스피치 코덱들의 고정 코드북들을 공통 모듈로 구현하는방법 및 장치
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
US8235897B2 (en) 2010-04-27 2012-08-07 A.D. Integrity Applications Ltd. Device for non-invasively measuring glucose
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
EP2628298A1 (en) * 2010-10-12 2013-08-21 Dolby Laboratories Licensing Corporation Joint layer optimization for a frame-compatible video delivery

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002244698A (ja) * 2000-12-14 2002-08-30 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP2003516555A (ja) * 1999-12-08 2003-05-13 フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. ステレオ音響信号の処理方法と装置
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
CA2555182C (en) * 2004-03-12 2011-01-04 Nokia Corporation Synthesizing a mono audio signal based on an encoded multichannel audio signal
US20080275709A1 (en) * 2004-06-22 2008-11-06 Koninklijke Philips Electronics, N.V. Audio Encoding and Decoding
CN101031960A (zh) * 2004-09-30 2007-09-05 松下电器产业株式会社 可扩展性编码装置和可扩展性解码装置及其方法
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US8036390B2 (en) * 2005-02-01 2011-10-11 Panasonic Corporation Scalable encoding device and scalable encoding method
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003516555A (ja) * 1999-12-08 2003-05-13 フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. ステレオ音響信号の処理方法と装置
JP2002244698A (ja) * 2000-12-14 2002-08-30 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO

Also Published As

Publication number Publication date
EP1818910A1 (en) 2007-08-15
JPWO2006070760A1 (ja) 2008-06-12
US20080162148A1 (en) 2008-07-03
WO2006070760A1 (ja) 2006-07-06
KR20070090217A (ko) 2007-09-05
BRPI0519454A2 (pt) 2009-01-27
EP1818910A4 (en) 2009-11-25

Similar Documents

Publication Publication Date Title
JP4963965B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
US7848932B2 (en) Stereo encoding apparatus, stereo decoding apparatus, and their methods
JP5413839B2 (ja) 符号化装置および復号装置
JP4887279B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2006011091A (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JPWO2010016270A1 (ja) 量子化装置、符号化装置、量子化方法及び符号化方法
US20100121633A1 (en) Stereo audio encoding device and stereo audio encoding method
JPWO2008090970A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
EP3252763A1 (en) Low-delay audio coding
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111005

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees