JP4948401B2 - スケーラブル符号化装置およびスケーラブル符号化方法 - Google Patents

スケーラブル符号化装置およびスケーラブル符号化方法 Download PDF

Info

Publication number
JP4948401B2
JP4948401B2 JP2007518977A JP2007518977A JP4948401B2 JP 4948401 B2 JP4948401 B2 JP 4948401B2 JP 2007518977 A JP2007518977 A JP 2007518977A JP 2007518977 A JP2007518977 A JP 2007518977A JP 4948401 B2 JP4948401 B2 JP 4948401B2
Authority
JP
Japan
Prior art keywords
channel
encoding
signal
excitation
monaural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007518977A
Other languages
English (en)
Other versions
JPWO2006129615A1 (ja
Inventor
道代 後藤
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007518977A priority Critical patent/JP4948401B2/ja
Publication of JPWO2006129615A1 publication Critical patent/JPWO2006129615A1/ja
Application granted granted Critical
Publication of JP4948401B2 publication Critical patent/JP4948401B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Description

本発明は、ステレオ信号に対し符号化を施すスケーラブル符号化装置およびスケーラブル符号化方法に関する。
携帯電話機による通話のように、移動体通信システムにおける音声通信では、現在、モノラル方式による通信(モノラル通信)が主流である。しかし、今後、第4世代の移動体通信システムのように、伝送レートのさらなる高ビットレート化が進めば、複数チャネルを伝送するだけの帯域を確保できるようになるため、音声通信においてもステレオ方式による通信(ステレオ通信)が普及することが期待される。
例えば、音楽をHDD(ハードディスク)搭載の携帯オーディオプレーヤに記録し、このプレーヤにステレオ用のイヤホンやヘッドフォン等を装着してステレオ音楽を楽しむユーザが増えている現状を考えると、将来、携帯電話機と音楽プレーヤとが結合し、ステレオ用のイヤホンやヘッドフォン等の装備を利用しつつ、ステレオ方式による音声通信を行うライフスタイルが一般的になることが予想される。また、最近普及しつつあるTV会議等の環境において、臨場感ある会話を可能とするため、やはりステレオ通信が行われるようになることが予想される。
一方、移動体通信システム、有線方式の通信システム等においては、システムの負荷を軽減するため、伝送される音声信号を予め符号化することにより伝送情報の低ビットレート化を図ることが一般的に行われている。そのため、最近、ステレオ音声信号を符号化する技術が注目を浴びている。例えば、cross-channel predictionを使って、ステレオ音声信号のCELP符号化の重み付けされた予測残差信号の符号化効率を高める符号化技術がある(非特許文献1参照)。
また、ステレオ通信が普及しても、依然としてモノラル通信も行われると予想される。何故なら、モノラル通信は低ビットレートであるため通信コストが安くなることが期待され、また、モノラル通信のみに対応した携帯電話機は回路規模が小さくなるため安価となり、高品質な音声通信を望まないユーザは、モノラル通信のみに対応した携帯電話機を購入するだろうからである。よって、一つの通信システム内において、ステレオ通信に対応した携帯電話機とモノラル通信に対応した携帯電話機とが混在するようになり、通信システムは、これらステレオ通信およびモノラル通信の双方に対応する必要性が生じる。さらに、移動体通信システムでは、無線信号によって通信データをやりとりするため、伝搬路環境によっては通信データの一部を失う場合がある。そこで、通信データの一部を失っても残りの受信データから元の通信データを復元することができる機能を携帯電話機が有していれば非常に有用である。
ステレオ通信およびモノラル通信の双方に対応することができ、かつ、通信データの一部を失っても残りの受信データから元の通信データを復元することができる機能として、ステレオ信号とモノラル信号とからなるスケーラブル符号化がある。この機能を有したスケーラブル符号化装置の例として、例えば、非特許文献2に開示されたものがある。
Ramprashad S. A.、"Stereophonic CELP coding using cross channel prediction"、Proc. IEEE Workshop on Speech Coding、Pages:136 - 138、(17-20 Sept. 2000) ISO/IEC 14496-3:1999 (B.14 Scalable AAC with core coder)
しかしながら、非特許文献1に開示の技術は、2チャネルの音声信号に対し、それぞれ別個に適応符号帳、固定符号帳等を有しており、各チャネルごとに別々の駆動音源信号を発生させ、合成信号を生成している。すなわち、各チャネルごとに音声信号のCELP符号化を行い、得られた各チャネルの符号化情報を復号側に出力している。そのため、符号化パラメータがチャネル数分だけ生成され、符号化レートが増大すると共に、符号化装置の回路規模も大きくなるという問題がある。仮に、適応符号帳、固定符号帳等の個数を減らせば、符号化レートは低下し、回路規模も削減されるが、逆に復号信号の大きな音質劣化につながる。これは、非特許文献2に開示されたスケーラブル符号化装置であっても同様に発生する問題である。
よって、本発明の目的は、復号信号の音質劣化を防ぎつつ、符号化レートを削減し、回路規模を削減することができるスケーラブル符号化装置およびスケーラブル符号化方法を提供することである。
本発明のスケーラブル符号化装置は、第1チャネル信号と第2チャネル信号からなるステレオ信号からモノラル信号を生成するモノラル信号生成手段と、前記モノラル信号を符号化するモノラル符号化手段と、前記ステレオ信号を符号化するステレオ信号符号化手段と、を具備し、前記ステレオ信号符号化手段は、前記モノラル符号化手段の符号化で得られる駆動音源から、前記第1チャネル信号の駆動音源を予測する第1予測手段と、前記第1予測手段で予測される駆動音源を用いて、前記第1チャネル信号を符号化する第1チャネル符号化手段と、前記モノラル符号化手段および前記第1チャネル符号化手段の各符号化で得られる駆動音源から、前記第2チャネル信号の駆動音源を予測する第2予測手段と、前記第2予測手段で予測される駆動音源を用いて、前記第2チャネル信号を符号化する第2チャネル符号化手段と、を含む構成を採る。
本発明の通信端末装置は、上記スケーラブル符号化装置を具備する構成を採る。
本発明の基地局装置は、上記スケーラブル符号化装置を具備する構成を採る。
本発明のスケーラブル符号化方法は、第1チャネル信号と第2チャネル信号からなるステレオ信号からモノラル信号を生成するモノラル信号生成ステップと、前記モノラル信号を符号化するモノラル符号化ステップと、前記ステレオ信号を符号化するステレオ信号符号化ステップと、を有し、前記ステレオ信号符号化ステップでは、前記モノラル符号化ステップの符号化で得られる駆動音源から、前記第1チャネル信号の駆動音源を予測するステップと、前記第1予測ステップで予測される駆動音源を用いて、前記第1チャネル信号を符号化する第1チャネル符号化ステップと、前記モノラル符号化ステップおよび前記第1チャネル符号化ステップでそれぞれ得られる駆動音源から、前記第2チャネル信号の駆動音源を予測する第2予測ステップと、前記第2予測ステップで予測される駆動音源を用いて、前記第2チャネル信号を符号化する第2チャネル符号化ステップと、を含む。
本発明によれば、ステレオ音声信号に対し、復号信号の音質劣化を防ぎつつ、符号化レートを削減し、回路規模を削減することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係るスケーラブル符号化装置100の主要な構成を示すブロック図である。なお、ここでは、2チャネルからなるステレオ音声信号を符号化する場合を例にとって説明し、また、以下に示す第1チャネルおよび第2チャネルとは、それぞれLチャネルおよびRチャネル、またはその逆のチャネルのことを示している。
スケーラブル符号化装置100は、加算器101、乗算器102、モノラル符号化部103、およびステレオ符号化部104を備え、加算器101、乗算器102、およびモノラル符号化部103が基本レイヤを構成し、ステレオ符号化部104が拡張レイヤを構成する。
スケーラブル符号化装置100の各部は以下の動作を行う。
加算器101は、スケーラブル符号化装置100に入力された第1チャネル信号CH1および第2チャネル信号CH2を加算し、和信号を生成する。乗算器102は、この和信号に1/2を乗じてスケールを半分とし、モノラル信号Mを生成する。すなわち、加算器101および乗算器102は、第1チャネル信号CH1および第2チャネル信号CH2の平均信号を求め、これをモノラル信号Mとする。モノラル符号化部103は、このモノラル信号Mに対し符号化を行い、得られる符号化パラメータを出力する。ここで、符号化パラメータとは、例えばCELP符号化ならば、LPC(LSP)パラメータ、適応符号帳インデックス、適応音源ゲイン、固定符号帳インデックス、および固定音源ゲインのことである。また、モノラル符号化部103は、符号化の際に得られる駆動音源信号をステレオ符号化部104に出力する。
ステレオ符号化部104は、スケーラブル符号化装置100に入力された第1チャネル信号CH1および第2チャネル信号CH2に対し、モノラル符号化部103から出力される駆動音源信号を用いて後述の符号化を行い、得られるステレオ信号の符号化パラメータを出力する。
このスケーラブル符号化装置100の特徴の1つは、基本レイヤからは、モノラル信号の符号化パラメータが出力され、拡張レイヤからは、ステレオ信号の符号化パラメータが出力されることである。このステレオ信号の符号化パラメータは、復号装置において、基本レイヤ(モノラル信号)の符号化パラメータと併せて復号することによりステレオ信号を得ることができるものである。すなわち、本実施の形態に係るスケーラブル符号化装置は、モノラル信号とステレオ信号とからなるスケーラブル符号化を実現する。例えば、基本レイヤおよび拡張レイヤの符号化パラメータを取得した復号装置は、伝送路環境の悪化により、拡張レイヤの符号化パラメータを取得することができず、基本レイヤの符号化パラメータしか取得できなかったとしても、低品質ではあるがモノラル信号を復号することができる。また、復号装置が基本レイヤおよび拡張レイヤの双方の符号化パラメータを取得することができれば、これらを用いて高品質なステレオ信号を復号することができる。
図2は、上記のステレオ符号化部104内部の主要な構成を示すブロック図である。
ステレオ符号化部104は、LPC逆フィルタ111、音源予測部112、乗算器113、CELP符号化部114、音源予測部115、乗算器116、およびCELP符号化部117を備え、第1チャネル信号の処理をする系統(LPC逆フィルタ111、音源予測部112、乗算器113、CELP符号化部114)、および第2チャネル信号の処理をする系統(音源予測部115、乗算器116、CELP符号化部117)に大別される
まず、第1チャネル信号の処理について説明する。
音源予測部112は、基本レイヤのモノラル符号化部103から出力されるモノラル信号の駆動音源信号から第1チャネルの駆動音源信号を予測し、予測した駆動音源信号を乗算器113に出力すると共に、この予測に関する情報(予測パラメータ)P1を出力する。この予測方法については後述する。乗算器113は、音源予測部112で得られた第1チャネルの駆動音源信号に、CELP符号化部114からフィードバックされる予測音源ゲインを乗じ、CELP符号化部114に出力する。CELP符号化部114は、乗算器113から出力される第1チャネルの駆動音源信号を用いて、第1チャネル信号のCELP符号化を行い、得られる第1チャネル用のLPC量子化インデックスP2および符号帳インデックスP3を出力する。また、CELP符号化部114は、LPC分析およびLPC量子化によって得られる第1チャネル信号の量子化LPC係数を、LPC逆フィルタ111に出力する。LPC逆フィルタ111は、この量子化LPC係数を用いて第1チャネル信号に対する逆フィルタリング処理を施し、得られる第1チャネル信号の駆動音源信号を音源予測部112に出力する。
次に、第2チャネル信号の処理について説明する。
音源予測部115は、基本レイヤのモノラル符号化部103から出力されるモノラル信号の駆動音源信号と、CELP符号化部114から出力される第1チャネル信号の駆動音源信号とから、第2チャネルの駆動音源信号を予測し、予測した駆動音源信号を乗算器116に出力する。この予測方法についても後述する。乗算器116は、音源予測部115で得られた第2チャネルの駆動音源信号に、CELP符号化部117からフィードバックされる予測音源ゲインを乗じ、CELP符号化部117に出力する。CELP符号化部117は、乗算器116から出力される第2チャネルの駆動音源信号を用いて、第2チャネル信号のCELP符号化を行い、得られる第2チャネル用のLPC量子化インデックスP4および符号帳インデックスP5を出力する。
図3は、音源予測部112において行われる予測処理の手順を説明するフロー図である。
音源予測部112には、モノラル信号の駆動音源信号EXCおよび第1チャネル信号の駆動音源信号EXCCH1が入力される(ST1010)。音源予測部112は、これらの駆動音源信号の間の相互相関関数の値が最大となるような遅延時間差を算出する(ST1020)。ここで、EXCおよびEXCCH1の相互相関関数Φは、次の式(1)に従って求められる。
Figure 0004948401
nはフレーム内の音源信号のサンプル番号、FLは1フレームのサンプル数(フレーム長)である。また、mはサンプル数を示し、あらかじめ定められたmin_mからmax_mの範囲の値をとるものとし、Φ(m)が最大となるときのm=MをEXCCH1のEXCに対する遅延時間差とする。
次に、音源予測部112は、振幅比を以下のように求める(ST1030)。まず、EXCの1フレーム内のエネルギーEを以下の式(2)に従って、EXCCH1の1フ
レーム内のエネルギーECH1を以下の式(3)に従って求める。
Figure 0004948401
Figure 0004948401
ここで、式(1)と同様に、nはサンプル番号、FLは1フレームのサンプル数(フレーム長)である。また、EXC(n)およびEXCCH1(n)は各々モノラル信号の駆動音源信号および第1チャネル信号の駆動音源信号の第nサンプルの振幅を示す。次に、モノラル信号の駆動音源信号および第1チャネル信号の駆動音源信号のエネルギー比の平方根Cを次の式(4)に従って求め、これを振幅比とする。
Figure 0004948401
音源予測部112は、算出した遅延時間差Mおよび振幅比Cを、予め定めたビット数で量子化し、量子化された遅延時間差Mおよび振幅比Cを用いて、モノラル信号の駆動音源信号EXCから第1チャネル信号の駆動音源信号EXCCH1’を次の式(5)に従って求める(ST1040)。
Figure 0004948401
図4は、音源予測部115において行われる予測処理の手順を説明するフロー図である。
音源予測部115は、第2チャネルの駆動音源信号EXCCH2’を、モノラル信号の駆動音源信号EXCおよび第1チャネル信号の駆動音源信号EXCCH1”(n)を用いて、次の式(6)に従って求める。
Figure 0004948401
ただし、この式(6)は、モノラル信号を第1チャネル信号および第2チャネル信号の平均とした場合の式である。
図5は、ステレオ符号化部104内部の構成をより詳細に説明したブロック図である。
この図に示すように、ステレオ符号化部104は、第1チャネル用の適応符号帳127および固定符号帳128を備え、歪み最小化部126が制御する符号帳探索によって、第1チャネル用の駆動音源信号を生成する。
LPC分析部121は、第1チャネル信号に対して線形予測分析を施し、スペクトル包絡情報であるLPC係数を求める。LPC量子化部122は、このLPC係数を量子化し、得られる量子化LPC係数をLPC合成フィルタ123およびLPC逆フィルタ111へ出力すると共に、この量子化LPC係数を示すLPC量子化インデックスP2を出力する。
一方、適応符号帳127は、歪み最小化部126からの指示に従い、駆動音源を乗算器129へ出力する。固定符号帳128も同様に、歪み最小化部126からの指示に従い駆動音源を乗算器130へ出力する。乗算器129および乗算器130は、歪み最小化部126の指示に従い、適応符号帳ゲインおよび固定符号帳ゲインを、適応符号帳127および固定符号帳128からの出力に乗じ、加算器131へ出力する。加算器131は、音源予測部112で予測されたモノラル信号の駆動音源信号に、各符号帳から出力される駆動音源信号を加える。
LPC合成フィルタ123は、LPC量子化部122から出力された量子化LPC係数をフィルタ係数とし、加算器131から出力される駆動音源信号によってLPC合成フィルタとして駆動し、合成信号を加算器124に出力する。加算器124は、第1チャネル信号から合成信号を減じることにより、符号化歪みを算出し、聴感重み付け部125に出力する。聴覚重み付け部125は、LPC分析部121から出力されるLPC係数をフィルタ係数とする聴感重み付けフィルタを用いて、符号化歪みに対して聴覚的な重み付けを施し、歪み最小化部126へ出力する。
歪み最小化部126は、聴感重み付け部125を介して出力される符号化歪みが最小となるような、適応符号帳127および固定符号帳128の各インデックスをサブフレームごとに求め、これらのインデックスを符号化パラメータP3として出力する。なお、符号帳歪みが最小となるときの第1チャネル信号の駆動音源信号が、上記の式(6)において、EXCCH1”(n)と表わされている。
なお、符号化歪みが最小となる際の駆動音源(加算器131の出力)は、サブフレームごとに適応符号帳127へフィードバックされる。
一方、ステレオ符号化部104は、第2チャネル用に適応符号帳147および固定符号帳148を備え、符号帳探索によって、第2チャネル用の駆動音源信号を生成する。加算器151は、音源予測部115で予測されたモノラル信号の駆動音源信号に、各符号帳から出力される駆動音源信号を加える。ただし、これらの駆動音源信号には、乗算器116、149、150によって適当なゲインが乗じられている。
LPC合成フィルタ143は、LPC分析部141でLPC分析され、LPC量子化部142で量子化されたLPC係数を用いて、加算器151から出力される第2チャネルの駆動音源信号によって駆動し、合成信号を加算器144に出力する。加算器144は、第2チャネル信号から合成信号を減じることにより、符号化歪みを算出し、聴感重み付け部145に出力する。
歪み最小化部146は、聴感重み付け部145を介して出力される符号化歪みが最小となるような、適応符号帳147および固定符号帳148の各インデックスをサブフレームごとに求め、これらのインデックスを符号化パラメータP5として出力する。なお、符号
帳歪みが最小となるときの第1チャネル信号の駆動音源信号が、上記の式(6)において、EXCCH1”(n)と表わされている。
生成された符号化パラメータP1〜P5は、ステレオ信号の符号化パラメータとして、復号装置に送られ、第2チャネル信号を復号する際に用いられる。
このように本実施の形態によれば、拡張レイヤのステレオ符号化部104は、第1チャネルに対し第2チャネルよりも先に、モノラル信号を用いてCELP符号化を行い、第2チャネルに対しては、第1チャネルのCELP符号化の結果を用いて効率的に符号化を行う。特に、駆動音源について見れば、ステレオ信号を構成する各チャネル信号とモノラル信号との間に強い相関性があることに着目し、本実施の形態では、第1チャネルのCELP符号化において、音源情報についてはモノラル信号の駆動音源から第1チャネルの駆動音源を予測して予測効率を向上させると共に符号化レートを下げ、一方、声道情報については第1チャネルを通常通りそのままLPC分析して符号化する。よって、第1チャネルおよび第2チャネルの駆動音源の予測精度が高まり、ひいては、ステレオ音声信号に対し、復号信号の音質劣化を防ぎつつ、符号化レートを削減することができる。また、本実施の形態によれば、回路規模を削減することができる。
なお、本実施の形態では、遅延時間差Mを求めてから、振幅比Cを求める場合を例にとって説明したが、これらの処理は、同時あるいは逆の順に行うこともできる。
また、本実施の形態では、モノラル信号を第1チャネルおよび第2チャネルの平均として求める場合を例にとって説明したが、これに限定されず、他の方法で求めても良い。
また、本実施の形態に係るステレオ符号化部104は、第1チャネルに対し先にモノラル信号の駆動音源を用いてCELP符号化を行い、第2チャネルは、第1チャネルのCELP符号化の結果を用いて効率的に符号化を行う。よって、先に符号化を行う第1チャネルの符号化精度が第2チャネルの符号化精度にも影響してくる。従って、第2チャネルのCELP符号化よりも第1チャネルのCELP符号化に、より多くのビット数を配分すれば、符号化装置の符号化性能を向上させることができる。
(実施の形態2)
実施の形態1で用いた「第1チャネル」および「第2チャネル」とは、具体的には、ステレオ信号におけるRチャネルまたはLチャネルである。実施の形態1では、第1チャネルおよび第2チャネルが、RチャネルおよびLチャネルのいずれに該当するかについては特に限定せず、どちらにも該当しても良い場合について説明した。しかし、第1チャネルを以下に示すような方法により特定のチャネルに限定すると、すなわち、RチャネルおよびLチャネルの一方を第1チャネルとして選択すると、スケーラブル符号化装置の符号化性能をより向上させることができる。
図6は、本発明の実施の形態2に係るスケーラブル符号化装置の拡張レイヤの主要な構成を示すブロック図である。なお、実施の形態1に示したスケーラブル符号化装置と同一の構成要素には同一の符号を付して、その説明を省略する。
第1チャネル信号は、LPC分析部201−1においてLPC分析され、LPC量子化部202−1において量子化され、LPC逆フィルタ203−1において量子化LPC係数を用いて第1チャネル信号の駆動音源信号が算出され、チャネル信号判定部204に出力される。なお、LPC分析部201−2、LPC量子化部202−2、LPC逆フィルタ203−2は、第2チャネル信号に対し第1チャネル信号と同様の処理を施す。
チャネル信号判定部204は、入力された第1チャネル信号および第2チャネル信号の駆動音源信号と、モノラル信号の駆動音源信号との相互相関関数をそれぞれ次の式(7)、(8)に従って算出する。
Figure 0004948401
Figure 0004948401
チャネル信号判定部204は、算出されたΦCH1(m)およびΦCH2(m)が最大となるmをそれぞれ検索し、mがその値をとるときのΦCH1(m)およびΦCH2(m)の値を比較し、より大きな値を示すチャネル、すなわち相関性の高いチャネルの方を第1チャネルと選択する。この選択チャネルを示すチャネル選択フラグがチャネル信号選択部205に出力される。また、チャネル選択フラグは、LPC量子化インデックスや符号帳インデックスと共に、符号化パラメータとして復号装置にフレーム毎に出力される。
チャネル信号選択部205は、チャネル信号判定部204から出力されるチャネル選択フラグに基づいて、入力ステレオ信号(Rチャネル信号、Lチャネル信号)を、ステレオ符号化部104の入力である第1チャネル信号および第2チャネル信号として振り分ける。
このように、本実施の形態によれば、モノラル信号と相関性の高い方のチャネルを選択し、これをステレオ符号化部104の第1チャネルとする。これにより、符号化装置の符号化性能を向上させることができる。何故なら、ステレオ符号化部104は、第1チャネルに対し先にモノラル信号の駆動音源を用いてCELP符号化を行い、第2チャネルは、第1チャネルのCELP符号化の結果を用いて効率的に符号化を行う。よって、先に符号化を行う第1チャネルの符号化精度が第2チャネルの符号化精度にも影響してくるからである。すなわち、本実施の形態のように、モノラル信号と相関性の高い方のチャネルを第1チャネルとすれば、第1チャネルの符号化精度が向上することが容易に理解される。
また、同様の理由により、第2チャネルのCELP符号化よりも第1チャネルのCELP符号化に、より多くのビット数を配分すれば、符号化装置の符号化性能をさらに向上させることができる。
なお、チャネル選択フラグはフレームごとではなく、複数のフレームが同じチャネル信号を選択するように、まとめて送ることも可能である。または、はじめに数フレームの相互相関関数を算出した後に、いずれのチャネル信号を第1チャネルとするかを決定し、そのチャネル選択フラグを最初に送るようにしても良い。
(実施の形態3)
本発明の実施の形態3は、本発明に係るスケーラブル符号化装置においてビット配分を変化させる方法を開示する。
一般的に、符号化処理に配分される符号化ビットが多いほど符号化歪みは減少する。例えば、本発明に係るスケーラブル符号化装置は、第1チャネル信号の符号化および第2チ
ャネル信号の符号化を行うため、第1チャネルおよび第2チャネルの双方に配分する符号化ビットを多くすることができれば、第1チャネルの符号化歪みおよび第2チャネルの符号化歪みの双方を減少させることができる。しかし実際には、第1チャネルに配分するビット数と第2チャネルに配分するビット数との和には上限がある。従って、第1チャネルに配分するビット数が多くなると第1チャネル信号の符号化歪みは減少するが、第2チャネルに配分するビット数が少なくなるため第2チャネル信号の符号化歪みは増大する。
しかし、本発明に係るスケーラブル符号化装置では、第1チャネル用のビット数を増加させた場合の第2チャネルの符号化歪みに対する影響はマイナス面だけではない。何故なら、本発明に係るスケーラブル符号化装置において、第2チャネルの駆動音源信号は、モノラル信号の駆動音源信号および第1チャネル信号の駆動音源信号から予測されるため(図4参照)、第2チャネル信号の符号化歪みは第1チャネル信号の符号化歪みに依存する。従って、第1チャネルの符号化歪みと第2チャネルの符号化歪みとの相互の依存性を考慮すれば、第1チャネルに配分するビット数が多くなると、第1チャネルの符号化歪みの減少に伴い、第2チャネル信号の符号化歪みも減少する。すなわち、本発明に係るスケーラブル符号化装置において、第1チャネル用のビット数の増加が第2チャネルの符号化歪みに対する影響は、プラス面も含む。
そこで、本実施の形態に係るスケーラブル符号化装置では、第1チャネルおよび第2チャネルにビット数を適応的に配分することにより、スケーラブル符号化装置の全体的な符号化効率を向上させる。より詳細には、本実施の形態では、第1チャネルの符号化歪みと第2チャネルの符号化歪みとが均等になるように、第1チャネルおよび第2チャネルにビット数を適応的に配分する。
本実施の形態に係るスケーラブル符号化装置300は、実施の形態1に示したスケーラブル符号化装置100(図1参照)と同様の基本的構成を有するため、スケーラブル符号化装置300の構成を示すブロック図は略す。スケーラブル符号化装置300のステレオ符号化部304は、実施の形態1に示したステレオ符号化部104と一部の構成および動作に相違点があるため、異なる符号を付す。スケーラブル符号化装置300におけるビット配分はステレオ符号化部304の内部において行われる。
図7は、本実施の形態に係るステレオ符号化部304内部の主要な構成を示すブロック図である。ステレオ符号化部304は、実施の形態1に示したステレオ符号化部104(図2参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。本実施の形態に係るステレオ符号化部304は、符号帳選択部318をさらに有する点で実施の形態1に示したステレオ符号化部104と相違する。なお、CELP符号化部314およびCELP符号化部317は、実施の形態1に示したCELP符号化部114およびCELP符号化部117それぞれと同様の基本的構成を有しており、一部の構成および動作に相違点がある。以下、これらの相違点について説明する。
CELP符号化部314は、第1チャネル用のLPC量子化インデックスおよび第1チャネル用符号帳インデックスを符号化パラメータとして出力するのではなく、符号帳選択部318に出力する点で実施の形態1に示したCELP符号化部114と相違する。またCELP符号化部314は、さらに第1チャネル信号の最小符号化歪みを符号帳選択部318に出力し、符号帳選択部318から第1チャネル用の符号帳選択インデックスをフィードバックされる点で、実施の形態1に示したCELP符号化部114と相違する。ここで第1チャネルの最小符号化歪みとは、CELP符号化部314内部において第1チャネルの符号化歪みを最小化するために行われる閉ループの歪み最小化処理から得られる、第1チャネル信号の符号化歪みの最小値である。
CELP符号化部317は、第2チャネル用のLPC量子化インデックスおよび第2チャネル用符号帳インデックスを符号化パラメータとして出力するのではなく、符号帳選択部318に出力する点で実施の形態1に示したCELP符号化部117と相違する。またCELP符号化部317は、さらに第2チャネル信号の最小符号化歪みを符号帳選択部318に出力し、符号帳選択部318から第2チャネル用の符号帳選択インデックスをフィードバックされる点で、実施の形態1に示したCELP符号化部117と相違する。ここで第2チャネルの最小符号化歪みとは、CELP符号化部317内部において第2チャネルの符号化歪みを最小化するために行われる閉ループの歪み最小化処理から得られる、第2チャネル信号の符号化歪みの最小値である。
符号帳選択部318は、CELP符号化部314から、第1チャネル用のLPC量子化インデックス、第1チャネル用符号帳インデックス、および第1チャネル信号の最小符号化歪みが入力され、CELP符号化部317から、第2チャネル用のLPC量子化インデックス、第2チャネル用符号帳インデックス、および第2チャネル信号の最小符号化歪みが入力される。符号帳選択部318は、これらの入力を用いて符号帳選択処理を行い、CELP符号化部314に第1チャネル用の符号帳選択インデックスをフィードバックし、CELP符号化部317に第2チャネル用の符号帳選択インデックスをフィードバックする。符号帳選択部318における符号帳選択処理とは、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとが均等になるように、CELP符号化部314およびCELP符号化部317に配分するビット数を変化させ、ビット数の変化情報を第1チャネル用の符号帳選択インデックスおよび第2チャネル用の符号帳選択インデックスを用いて示す処理である。符号帳選択部318は、第1チャネル用のLPC量子化インデックスP2、第1チャネル用符号帳インデックスP3、第2チャネル用のLPC量子化インデックスP4、第2チャネル用符号帳インデックスP5、およびビット配分選択情報P6を符号化パラメータとして出力する。
図8は、本実施の形態に係るステレオ符号化部304内部の構成をより詳細に説明したブロック図である。この図は、主にCELP符号化部314内部の構成をより詳細に示し、CELP符号化部317内部の構成はCELP符号化部314内部の構成と同様のため、その表示および説明を略す。なお、この図において、実施の形態1の図5に示した構成と同様な部分については説明を略し、相違する部分についてだけ説明する。
固定符号帳328は、第1固定符号帳328−1〜第n固定符号帳328−nからなり、第1固定符号帳328−1〜第n固定符号帳328−nの何れかの駆動音源を出力する点、および駆動音源の出力先が乗算器130ではなく切替部321である点で、実施の形態1に示した固定符号帳128と相違する。第1固定符号帳328−1〜第n固定符号帳328−nは、互いにビットレートが異なるn個の固定符号帳であるため、固定符号帳328は、切替部321を用いて駆動音源出力を変更することにより、第1チャネル用の符号化ビット数を変化させる。
一般的に、適応符号帳が必要とするビット数よりも固定符号帳が必要とするビット数が多いため、ここでは適応符号帳127の配分ビット数を変更するよりも固定符号帳328の配分ビット数を変更することの方が符号化歪みの改善効果が高い。従って本実施の形態では、適応符号帳127の符号帳インデックスではなく固定符号帳328の固定符号帳インデックスを変更することにより、両チャネルに配分するビット数を変化させる。
LPC量子化部322は、第1チャネル用のLPC量子化インデックスを符号化パラメータとして出力するのではなく、符号帳選択部318に出力する点で、実施の形態1に示したLPC量子化部122と相違する。
歪み最小化部326は、第1チャネル用符号帳インデックスを符号化パラメータとして出力するのではなく符号帳選択部318に出力し、符号帳選択部318にさらに第1チャネル信号の最小符号化歪みを出力する点で、実施の形態1に示した歪み最小化部126と相違する。ここで第1チャネル信号の最小符号化歪みとは、符号帳選択部318が指示に基づき歪み最小化部326が第1固定符号帳328−1〜第n固定符号帳328−nを切替えながら、第1チャネルの符号化歪みを最小化するための閉ループの歪み最小化処理を行って、最終的に得られる第1チャネル信号の符号化歪みの最小値のことである。
符号帳選択部318は、LPC量子化部322から第1チャネル用のLPC量子化インデックスおよび第1チャネル用符号帳インデックスが入力され、歪み最小化部326から第1チャネル信号の最小符号化歪みが入力される。同様に符号帳選択部318は、CELP符号化部317から、第2チャネル用のLPC量子化インデックス、第2チャネル用符号帳インデックス、および第2チャネル信号の最小符号化歪みが入力される。符号帳選択部318は、これらの入力を用いて符号帳選択処理を行い、切替部321に第1チャネル用の符号帳選択インデックスをフィードバックし、CELP符号化部317に第2チャネル用の符号帳選択インデックスをフィードバックする。第1チャネル用の符号帳選択インデックスは、第1チャネルの符号化のために固定符号帳328が用いる、第1固定符号帳328−1〜第n固定符号帳328−nの各々を示すインデックスである。符号帳選択部318は、第1チャネル用のLPC量子化インデックスP2、第1チャネル用符号帳インデックスP3、第2チャネル用のLPC量子化インデックスP4、第2チャネル用符号帳インデックスP5、およびビット配分選択情報P6をそれぞれ符号化パラメータとして出力する。
切替部321は、符号帳選択部318から入力される符号帳選択インデックスに基づき、固定符号帳328と乗算器130との間の経路を切り替える。例えば、符号帳選択部318から入力される符号帳選択インデックスの示す符号帳が第2固定符号帳328−2である場合、切替部321は、第2固定符号帳328−2の駆動音源を乗算器130に出力させる。
図9は、符号帳選択部318におけるビット配分処理の手順を示すフロー図である。この図に示す処理はフレーム単位で行われ、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとが均等になるようにビット配分を行う。
まず、ST3010で符号帳選択部318は両チャネルともに、最小のビット数を配分して、ビット配分処理の初期化を行う。すなわち符号帳選択部318は、第1チャネル用の符号帳選択インデックスを介して、ビットレートが最小となる固定符号帳、例えば第2固定符号帳328−2を用いるように固定符号帳328に指示する。第2チャネルに対する符号帳選択部318の処理は、第1チャネルに対する処理と同様である。
次いで、ST3020で符号帳選択部318には、第1チャネル信号の最小符号化歪みおよび第2チャネル信号の最小符号化歪みが入力される。すなわち歪み最小化部326は、固定符号帳328として例えば第2固定符号帳328−2を用いる場合、かかる場合の第1チャネル信号の符号化歪みの最小値を求め、符号帳選択部318に出力する。ここで、固定符号帳328が用いる固定符号帳は、ST3020より前のステップにおいて符号帳選択部318から指示されたものである。ST3020で、第2チャネルにおける処理は第1チャネルにおける処理と同様である。
次いで、ST3030で符号帳選択部318は第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとを比較する。第1チャネル信号の最小符号化歪みが第2チャネル信号の最小符号化歪みより大きい場合、ST3040で符号帳選択部318は
、第1チャネル用のビット数を増加させる。すなわち符号帳選択部318は、第1チャネル用の符号帳選択インデックスを介して、ビットレートがより大きい固定符号帳、例えば第4固定符号帳328−4を用いるように固定符号帳328に指示する。一方、第1チャネル信号の最小符号化歪みが第2チャネル信号の最小符号化歪みより小さい場合、ST3050で符号帳選択部318は、第2チャネル用のビット数を増加させる。第2チャネル用のビット数の増加方法は、第1チャネル用のビット数の増加方法と同様である。
次いでST3060で、すでに両チャネルに配分したビット数の総和が上限値に達したか否かを判別する。両チャネルに配分したビット数の総和が上限値に達していない場合はST3020に戻り、両チャネルに配分したビット数の総和が上限値に達するまで、符号帳選択部318はST3020〜ST3060の処理を繰り返す。
上記のように符号帳選択部318は、最初に両チャネルともに最小のビットレートを配分し、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとの均等を保持しながら両チャネルに配分するビット数を次第に増加させ、最終的には所定上限のビット数を両チャネルに配分する。すなわち、両チャネルに配分するビット数の総和は最小値から、処理の進捗に従い次第に増加して最終的に所定の上限値に達する。
図10は、符号帳選択部318におけるビット配分処理の他の手順を示すフロー図である。この図に示す処理も図9に示す処理と同様にフレーム単位で行われ、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとが均等になるようにビット配分を行う。図9に示す処理は、両チャネルに配分するビット数の総和が最小値から、処理の進捗に従い次第に増加して最終的に所定の上限値に達するのに対して、この図に示す処理は、最初から所定上限のビット数を両チャネルに均等に配分し、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとが均等になるまで、両チャネル用のビット数の割合を調整する。なお、処理手順の各ステップにおける、スケーラブル符号化装置300の各構成部の詳細な動作については説明を略す(図10の説明参照)。
まず、ST3110で符号帳選択部318は所定上限のビット数を両チャネルに均等に配分して、ビット配分処理の初期化を行う。次いで、ST3120で符号帳選択部318は、第1チャネル信号の最小符号化歪みおよび第2チャネル信号の最小符号化歪みが入力される。次いで、ST3130で符号帳選択部318は、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとを比較する。第1チャネル信号の最小符号化歪みが第2チャネル信号の最小符号化歪みより大きい場合、ST3140で符号帳選択部318は、第1チャネル用のビット数を増加させると共に第2チャネル用のビット数を減少させる。かかる場合、第1チャネル用のビット数の増加分は、第2チャネル用のビット数の減少分と同様である。一方、第1チャネル信号の最小符号化歪みが第2チャネル信号の最小符号化歪みより小さい場合、ST3150で符号帳選択部318は、第1チャネル用のビット数を減少させると共に第2チャネル用のビット数を増加させる。かかる場合、第1チャネル用のビット数の減少分は、第2チャネル用のビット数の増加分と同様である。次いで、ST3160で符号帳選択部318は、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとの差が所定値以下であるか否かを判別する。すなわち符号帳選択部318は、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとの差が所定値以下であると判別すると、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとが均等であると判断する。これら2つの最小符号化歪みの差が所定値以下でない場合はST3120に戻り、これら2つの最小符号化歪みの差が所定値以下になるまで、符号帳選択部318はST3120〜ST3160の処理を繰り返す。
上記のように、この図に示す手順は、初期化において所定上限のビット数を両チャネル
に均等に配分する点で、図9に示したビット配分処理の初期化と相違するが、後続の処理の結果、図9に示した手順と同じく、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとが均等になるように、所定上限のビット数を両チャネルに配分する。
このように、本実施の形態によれば、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとが均等になるように、所定上限のビット数を両チャネルに適応的に配分するため、符号化装置の符号化歪みを低減させることができ、符号化装置の符号化性能を向上させることができる。
なお、本実施の形態では、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとが均等になるようにビット配分を行う場合を例にとって説明したが、第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとの和が最小になるように、ビット配分を行っても良い。第1チャネル信号の符号化歪みと第2チャネル信号の符号化歪みとの和が最小になるようにビット配分を行う方法は、ビット数の増加による、ある一方のチャネル信号の符号化歪みの改善度合いよりも、他方のチャネル信号の符号化歪みの改善度合いが著しく大きい場合に適用して最適である。かかる場合、ビット数の増加により符号化歪みが著しく改善される他方のチャネルに、より多くのビット数を配分する。なお、両チャネル信号の符号化歪みの和が最小になるような第1チャネル用のビット数と第2チャネル用のビット数との組み合わせは、この組み合わせの総当たりで符号化を行うことにより探索される。
また、本実施の形態では、ST3010およびST3110で両チャネルにビット数を均等に配分して、ビット配分処理の初期化を行う場合を例にとって説明したが、第2チャネル信号の符号化歪みが第1チャネル信号の符号化歪みに依存することを考慮して、第2チャネルよりも第1チャネルに、より多くのビットを配分して、ビット配分処理の初期化を行っても良い。さらに、モノラル信号と第1チャネル信号との相互相関関数の値、およびモノラル信号と第2チャネル信号との相互相関関数の値を求めて、相互相関関数の値が小さい方のチャネルに配分するビット数を適応的に増加させて、ビット配分処理の初期化を行っても良い。このように改善された初期化処理により、第1チャネル信号の最小符号化歪みと第2チャネル信号の最小符号化歪みとが均等になるまでに要するループ処理の回数を減らすことができ、ビット配分処理を短縮化することができる。
また、本実施の形態では、ビット配分を変化させる対象として固定符号帳インデックスを用いる場合を例にとって説明したが、ビット配分を変化させる対象として、固定符号帳インデックス以外の符号化パラメータにしても良い。例えば、LPCパラメータ、適応符号帳ラグ、音源ゲインパラメータなどの符号化情報を適応的に変化させても良い。
また、本実施の形態では、符号化歪みをもとにビット配分を行う場合を例にとって説明したが、符号化歪み以外の情報をもとにビット配分を行っても良い。例えば、音源予測部の予測ゲインをもとにビット配分を行っても良い。または、モノラル信号と第1チャネル信号との相互相関関数の値、およびモノラル信号と第2チャネル信号との相互相関関数の値などを用いてビット配分を行っても良い。かかる場合、モノラル信号と第1チャネル信号との相互相関関数の値、およびモノラル信号と第2チャネル信号との相互相関関数の値を求め、相互相関関数の値が小さい方のチャネルにより多くのビット数を配分する。またさらに、第2チャネル信号の符号化歪みが第1チャネル信号の符号化歪みに依存することを考慮して、第1チャネルに配分するビット数を適応的に増加させても良い。
以上、本発明の各実施の形態について説明した。
本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、上記各実施の
形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
また、固定符号帳は、固定音源符号帳、雑音符号帳、確率符号帳(stochastic codebook)、または乱数符号帳(random codebook)と呼ばれることもある。
また、適応符号帳は、適応音源符号帳と呼ばれることもある。
また、LSPは、LSF(Line Spectral Frequency)と呼ばれることもあり、LSPをLSFと読み替えてもよい。また、LSPの代わりにISP(Immittance Spectrum Pairs)をスペクトルパラメータとして符号化する場合もあるが、この場合はLSPをISPに読み替えればISP符号化/復号化装置として本発明を利用することができる。
また、本発明に係るスケーラブル符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るスケーラブル符号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るスケーラブル符号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2005年5月31日出願の特願2005−159685および2005年11月30日出願の特願2005−346665に基づく。これらの内容はすべてここに含めておく。
本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、移動体通信システムにおける通信端末装置、基地局装置等の用途に適用することができる。
実施の形態1に係るスケーラブル符号化装置の主要な構成を示すブロック図 実施の形態1に係るステレオ符号化部内部の主要な構成を示すブロック図 実施の形態1に係る音源予測部において行われる予測処理の手順を説明するフロー図 実施の形態1に係る音源予測部において行われる予測処理の手順を説明するフロー図 実施の形態1に係るステレオ符号化部内部の構成をより詳細に説明したブロック図 実施の形態2に係るスケーラブル符号化装置の拡張レイヤの主要な構成を示すブロック図 実施の形態3に係るステレオ符号化部内部の主要な構成を示すブロック図 実施の形態3に係るステレオ符号化部内部の構成をより詳細に説明したブロック図 実施の形態3に係る符号帳選択部におけるビット配分処理の手順を示すフロー図 実施の形態3に係る符号帳選択部におけるビット配分処理の他の手順を示すフロー図

Claims (12)

  1. 第1チャネル信号と第2チャネル信号からなるステレオ信号からモノラル信号を生成するモノラル信号生成手段と、
    前記モノラル信号を符号化するモノラル符号化手段と、
    前記ステレオ信号を符号化するステレオ信号符号化手段と、を具備し、
    前記ステレオ信号符号化手段は、
    前記モノラル符号化手段の符号化で得られる駆動音源から、前記第1チャネル信号の駆動音源を予測する第1予測手段と、
    前記第1予測手段で予測される駆動音源を用いて、前記第1チャネル信号を符号化する第1チャネル符号化手段と、
    前記モノラル符号化手段および前記第1チャネル符号化手段の各符号化で得られる駆動音源から、前記第2チャネル信号の駆動音源を予測する第2予測手段と、
    前記第2予測手段で予測される駆動音源を用いて、前記第2チャネル信号を符号化する第2チャネル符号化手段と、を含むスケーラブル符号化装置。
  2. 前記第2予測手段は、
    前記モノラル符号化手段の符号化で得られる駆動音源の2倍から前記第1チャネル符号化手段の符号化で得られる駆動音源を減じることにより、前記第2チャネル信号の駆動音源を予測する、
    請求項1記載のスケーラブル符号化装置。
  3. 前記第1予測手段は、
    モノラル信号と前記第1チャネル信号との間の、遅延時間差および振幅比の少なくとも一方を用いて前記予測を行う、
    請求項1記載のスケーラブル符号化装置。
  4. 前記第1チャネル信号の駆動音源は、前記第2チャネル信号の駆動音源よりも、モノラル信号の駆動音源との相関性が高い、
    請求項1記載のスケーラブル符号化装置。
  5. 前記第1チャネル信号の符号化歪みと前記第2チャネル信号の符号化歪みとが均等となるように、前記第1チャネル符号化手段と前記第2チャネル符号化手段とにビットを配分する処理を行うビット配分手段、
    をさらに具備する請求項1記載のスケーラブル符号化装置。
  6. 第1チャネルの符号化歪みと第2チャネルの符号化歪みとの和が最小となるように、前記第1チャネル符号化手段と前記第2チャネル符号化手段とにビットを配分する処理を行うビット配分手段、
    をさらに具備する請求項1記載のスケーラブル符号化装置。
  7. 前記第1チャネル符号化手段と前記第2チャネル符号化手段とにビットを配分する処理を行うビット配分手段、
    をさらに具備し、
    前記第1チャネル符号化手段および前記第2チャネル符号化手段は、
    ビットレートの異なる複数の固定符号帳をそれぞれ具備し、
    前記ビット配分手段は、
    前記第1チャネル符号化手段および前記第2チャネル符号化手段が用いる固定符号帳を変更することにより、前記ビットを配分する処理を行う、
    請求項1記載のスケーラブル符号化装置。
  8. 前記第1チャネル符号化手段と前記第2チャネル符号化手段とにビットを配分する処理を行うビット配分手段、
    をさらに具備し、
    前記ビット配分手段は、
    前記ビットを配分する処理の初期条件として、前記第2チャネル符号化手段よりも前記第1チャネル符号化手段に、より多くのビットを配分する、
    請求項1記載のスケーラブル符号化装置。
  9. 前記第1チャネル符号化手段と前記第2チャネル符号化手段とにビットを配分する処理を行うビット配分手段、
    をさらに具備し、
    前記ビット配分手段は、
    前記ビットを配分する処理の初期条件として、前記第2チャネル信号の駆動音源よりも前記第1チャネル信号の駆動音源がモノラル信号の駆動音源との相関性が高い場合、前記第1チャネル符号化手段よりも前記第2チャネル符号化手段に、より多くのビットを配分する、
    請求項1記載のスケーラブル符号化装置。
  10. 請求項1記載のスケーラブル符号化装置を具備する通信端末装置。
  11. 請求項1記載のスケーラブル符号化装置を具備する基地局装置。
  12. 第1チャネル信号と第2チャネル信号からなるステレオ信号からモノラル信号を生成するモノラル信号生成ステップと、
    前記モノラル信号を符号化するモノラル符号化ステップと、
    前記ステレオ信号を符号化するステレオ信号符号化ステップと、を有し、
    前記ステレオ信号符号化ステップでは、
    前記モノラル符号化ステップの符号化で得られる駆動音源から、前記第1チャネル信号の駆動音源を予測するステップと、
    前記第1予測ステップで予測される駆動音源を用いて、前記第1チャネル信号を符号化する第1チャネル符号化ステップと、
    前記モノラル符号化ステップおよび前記第1チャネル符号化ステップでそれぞれ得られる駆動音源から、前記第2チャネル信号の駆動音源を予測する第2予測ステップと、
    前記第2予測ステップで予測される駆動音源を用いて、前記第2チャネル信号を符号化する第2チャネル符号化ステップと、
    を含むスケーラブル符号化方法。
JP2007518977A 2005-05-31 2006-05-29 スケーラブル符号化装置およびスケーラブル符号化方法 Expired - Fee Related JP4948401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007518977A JP4948401B2 (ja) 2005-05-31 2006-05-29 スケーラブル符号化装置およびスケーラブル符号化方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2005159685 2005-05-31
JP2005159685 2005-05-31
JP2005346665 2005-11-30
JP2005346665 2005-11-30
JP2007518977A JP4948401B2 (ja) 2005-05-31 2006-05-29 スケーラブル符号化装置およびスケーラブル符号化方法
PCT/JP2006/310689 WO2006129615A1 (ja) 2005-05-31 2006-05-29 スケーラブル符号化装置およびスケーラブル符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006129615A1 JPWO2006129615A1 (ja) 2009-01-08
JP4948401B2 true JP4948401B2 (ja) 2012-06-06

Family

ID=37481544

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007518977A Expired - Fee Related JP4948401B2 (ja) 2005-05-31 2006-05-29 スケーラブル符号化装置およびスケーラブル符号化方法

Country Status (6)

Country Link
US (1) US8271275B2 (ja)
EP (1) EP1887567B1 (ja)
JP (1) JP4948401B2 (ja)
CN (1) CN101185123B (ja)
DE (1) DE602006015461D1 (ja)
WO (1) WO2006129615A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
JP5340261B2 (ja) * 2008-03-19 2013-11-13 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
EP2287836B1 (en) * 2008-05-30 2014-10-15 Panasonic Intellectual Property Corporation of America Encoder and encoding method
WO2009153995A1 (ja) * 2008-06-19 2009-12-23 パナソニック株式会社 量子化装置、符号化装置およびこれらの方法
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
US9183842B2 (en) * 2011-11-08 2015-11-10 Vixs Systems Inc. Transcoder with dynamic audio channel changing
GB2578625A (en) * 2018-11-01 2020-05-20 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP2586441B2 (ja) * 1994-07-27 1997-02-26 日本電気株式会社 移動電話機
DE727780T1 (de) * 1995-02-16 1997-02-13 Toshiba Kawasaki Kk Ausgabesteuerungssystem für umschaltbare Torkanäle
JP3705305B2 (ja) * 1996-05-16 2005-10-12 カシオ計算機株式会社 音声記憶再生装置
JP3364825B2 (ja) * 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
TW395142B (en) * 1997-05-15 2000-06-21 Matsushita Electric Ind Co Ltd Compressed code decoding device and audio decoding device
SE519976C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
RU2331933C2 (ru) * 2002-10-11 2008-08-20 Нокиа Корпорейшн Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
JP2005159685A (ja) 2003-11-26 2005-06-16 Nec Corp 送信電力制御システムおよび制御方法
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
JP2005346665A (ja) 2004-06-07 2005-12-15 Nogiwa Sangyo Kk 海岸線抽出方法及び海岸線抽出システム
DE602005009374D1 (de) * 2004-09-06 2008-10-09 Matsushita Electric Ind Co Ltd Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
CN101044554A (zh) * 2004-10-13 2007-09-26 松下电器产业株式会社 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US7830921B2 (en) * 2005-07-11 2010-11-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal

Also Published As

Publication number Publication date
WO2006129615A1 (ja) 2006-12-07
EP1887567A4 (en) 2009-07-01
CN101185123B (zh) 2011-07-13
EP1887567A1 (en) 2008-02-13
US8271275B2 (en) 2012-09-18
EP1887567B1 (en) 2010-07-14
US20090271184A1 (en) 2009-10-29
JPWO2006129615A1 (ja) 2009-01-08
DE602006015461D1 (de) 2010-08-26
CN101185123A (zh) 2008-05-21

Similar Documents

Publication Publication Date Title
JP5171256B2 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
JP5046652B2 (ja) 音声符号化装置および音声符号化方法
JP4850827B2 (ja) 音声符号化装置および音声符号化方法
EP1801783B1 (en) Scalable encoding device, scalable decoding device, and method thereof
JP5413839B2 (ja) 符号化装置および復号装置
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
US7848932B2 (en) Stereo encoding apparatus, stereo decoding apparatus, and their methods
CN106663432B (zh) 对压缩的hoa表示编码和解码的方法和装置
JP4887279B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4789430B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
CN106463132B (zh) 对压缩的hoa表示编码和解码的方法和装置
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120306

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4948401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees