JPWO2008016098A1 - ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法 - Google Patents

ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法 Download PDF

Info

Publication number
JPWO2008016098A1
JPWO2008016098A1 JP2008527783A JP2008527783A JPWO2008016098A1 JP WO2008016098 A1 JPWO2008016098 A1 JP WO2008016098A1 JP 2008527783 A JP2008527783 A JP 2008527783A JP 2008527783 A JP2008527783 A JP 2008527783A JP WO2008016098 A1 JPWO2008016098 A1 JP WO2008016098A1
Authority
JP
Japan
Prior art keywords
channel
lpc coefficient
lpc
signal
adaptive filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008527783A
Other languages
English (en)
Inventor
ジオン チョウ
ジオン チョウ
スア ホン ネオ
スア ホン ネオ
吉田 幸司
幸司 吉田
道代 後藤
道代 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2008016098A1 publication Critical patent/JPWO2008016098A1/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

ビットレートを削減することができるステレオ音声符号化装置等を開示する。この装置において、ステレオ音声符号化部(103)は、Lチャネル信号と、Rチャネル信号とに対してLPC分析を行い、LチャネルLPC係数とRチャネルLPC係数とを得、LPC係数適応フィルタ(105)は、LチャネルLPC係数とRチャネルLPC係数との平均二乗誤差を最小とするLPC係数適応フィルタパラメータを求め、LPC係数再構築部(106)は、LチャネルLPC係数と、LPC係数適応フィルタパラメータを用いてRチャネルLPC係数を再構築してRチャネル再構築LPC係数を得、ルート算出部(107)は、Rチャネル再構築LPC係数の安定性を示す多項式のルートを算出し、選択部(108)は、Rチャネル再構築LPC係数の安定性に基づき、LPC係数適応フィルタパラメータ、またはRチャネルLPC係数を選択して出力する。

Description

本発明は、移動体通信システムまたはインターネットプロトコル(IP:Internet Protocol)を用いたパケット通信システム等において、ステレオ音声信号の符号化/復号を行う際に用いられるステレオ音声符号化装置、ステレオ音声復号装置、及びこれらの方法に関する。
移動体通信システムまたはIPを用いたパケット通信システム等において、DSP(Digital Signal Processor)のディジタル信号処理速度の向上と帯域幅の拡大により高ビットレートの伝送が可能となってきている。伝送レートのさらなる高速化が進めば、複数チャネルを伝送するだけの帯域(広帯域)を確保できるようになるため、モノラル方式が主流の音声通信においても、ステレオ方式による通信(ステレオ通信)が普及することが期待される。広帯域のステレオ通信では、より自然なサウンド環境に関する情報を符号化することができ、ヘッドフォンあるいはスピーカーで再生すると、聴取者が知覚する空間イメージが生まれる。
ステレオ音声信号の符号化方法として、ステレオ音声信号を構成する複数のチャネル信号を独立に符号化して伝送する非パラメトリックな方法がある。例えば、音声符号化方法として、CELP符号化などの線形予測符号化(LPC:Linear Prediction Coefficient)方法が一般的に使用されており、ステレオ音声信号のCELP符号化においては、ステレオ音声信号を構成する左チャネルおよび右チャネル各々のLPC係数を求め、求められたLPC係数を量子化して復号器側に伝送する(例えば非特許文献1参照)。
Guylain Roy and Peter Kabal著、「Wideband CELP Speech Coding at 16 kbits/sec」 in Proc.ICASSP’91、Toronto Canada、1991年5月、p.17−20
しかし、ステレオ音声信号を構成する複数のチャネル、例えば、左、右チャネルの信号は近似しており、振幅および時間遅延のみにおいて相違するだけである。すなわち、チャネル信号間は相互相関が強く、左チャネルの符号化パラメータと、右チャネルの符号化パラメータとは重複の情報を含み、冗長性を表す。例えば、近似する左、右チャネル信号に対してCELP符号化を行って得られる両チャネルのLPC係数は、相互相関性が高く冗長性が高いため、ビットレートの浪費の原因となる。
そこで、ステレオ音声信号の符号化においては、複数チャネルの符号化パラメータに含まれている冗長性を取り除き、ビットレートを減少させる方法、すなわち、パラメトリックな符号化方法が考えられる。CELP符号化においては、左チャネルと右チャネルとの相互相関性に起因する、左チャネルのLPC係数と右チャネルのLPC係数との冗長性を取り除くことにより、ステレオ音声符号化のビットレートをさらに低減することが考えられる。
本発明の目的は、CELP符号化において、左チャネルと右チャネルとの相互相関性に起因する、左チャネルのLPC係数と右チャネルのLPC係数とに含まれている冗長性を除去し、ステレオ音声符号化のビットレートを低減することができるステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法を提供することである。
本発明のステレオ音声符号化装置は、ステレオ音声を構成する第1チャネル信号および第2チャネル信号に対してそれぞれLPC分析を行い、第1チャネルLPC係数と第2チャネルLPC係数とを得るLPC分析手段と、前記第1チャネルLPC係数と、前記第2チャネルLPC係数との平均二乗誤差を最小化するLPC係数適応フィルタパラメータを求めるLPC係数適応フィルタと、前記第1チャネルLPC係数と前記第2チャネルLPC係数と前記LPC係数適応フィルタパラメータとを用いて、第2チャネルLPC係数関連情報を得る関連情報決定手段と、を具備する構成を採る。
本発明のステレオ音声復号装置は、受信したビットストリームから、符号化装置においてステレオ音声を構成する第1チャネル信号および第2チャネル信号を用いて生成された、第1チャネルLPC係数と、第2チャネルLPC係数関連情報とを得る分離手段と、前記第2チャネルLPC係数関連情報がLPC係数適応フィルタパラメータであるか第2チャネルLPC係数であるかを判別し、前記第2チャネルLPC係数関連情報が前記LPC係数適応フィルタパラメータである場合には、前記LPC係数適応フィルタパラメータを用いて、前記第1チャネルLPC係数をフィルタリングし、得られる第2チャネル再構築LPC係数を出力し、前記第2チャネルLPC係数関連情報が前記第2チャネルLPC係数である場合には、前記第2チャネルLPC係数を出力する第2チャネルLPC係数決定手段と、を具備する構成を採る。
本発明によれば、ステレオ音声のCELP符号化において、第1チャネルLPC係数と、第2チャネルLPC係数との平均二乗誤差を最小化するLPC係数適応フィルタパラメータを求めて伝送することにより、左チャネルのLPC係数と右チャネルのLPC係数とに含まれている重複な情報を送ることを回避することができる。従って、伝送される符号化情報の冗長性を除去し、ステレオ音声符号化のビットレートを低減することができる。
本発明の一実施の形態に係るステレオ音声符号化装置の主要な構成を示すブロック図 本発明の一実施の形態に係るステレオ音声符号化部の内部の主要な構成を示すブロック図 本発明の一実施の形態に係るLPC係数適応フィルタを構成する適応フィルタの構成および動作を説明するための図 本発明の一実施の形態に係るステレオ音声符号化装置におけるステレオ音声符号化処理の手順の一例を示すフロー図 本発明の一実施の形態に係るステレオ音声復号装置の主要な構成を示すブロック図 本発明の一実施の形態に係るステレオ音声復号部の内部の主要な構成を示すブロック図 本発明の一実施の形態に係るステレオ音声復号装置におけるステレオ音声復号処理の手順の一例を示すフロー図 本発明の一実施の形態に係るステレオ音声符号化装置に入力されるステレオ音声信号の一例を示す図 本発明の一実施の形態に係るステレオ音声信号に対してLPC分析を行って得られるLPC係数を示す図 本発明の一実施の形態に係る直接LPC分析を行って生成されるLPC係数と、適応フィルタを用いて再構築される再構築LPC係数との比較を示す図
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係るステレオ音声符号化装置100の主要な構成を示すブロック図である。ここでは、ステレオ音声信号が左(L)チャネル信号および右(R)チャネル信号からなる場合を例にとって説明する。
モノラル信号生成部101は、入力されるLチャネル信号とRチャネル信号とを用いて、例えば、下記の式(1)に従ってモノラル信号(M)を生成し、モノラル信号符号化部102に出力する。
Figure 2008016098
この式において、nは時間軸上における信号のサンプル番号を示し、L(n)はLチャネル信号を、R(n)はRチャネル信号を、M(n)は生成されるモノラル信号を示す。
モノラル信号符号化部102は、モノラル信号生成部101から入力されるモノラル信号に対してAMR−WB(Adaptive MultiRate - WideBand)などの音声符号化処理を行い、得られるモノラル信号符号化パラメータを多重部110に出力し、また、符号化の過程において得られるモノラル駆動音源信号(exc)をステレオ音声符号化部103に出力する。
ステレオ音声符号化部103は、Lチャネル信号と、Rチャネル信号と、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)とを用いて、モノラル信号からLチャネル信号およびRチャネル信号を予測するLチャネル予測パラメータおよびRチャネル予測パラメータそれぞれを算出し、多重部110に出力する。また、ステレオ音声符号化部103は、Lチャネル信号に対してLPC分析を行い得られるLチャネルLPC係数(A)をLPC係数適応フィルタ105および第1量子化部104に出力する。また、ステレオ音声符号化部103は、Rチャネル信号に対してLPC分析を行い得られるRチャネルLPC係数(A)をLPC係数適応フィルタ105および選択部108に出力する。なお、ステレオ音声符号化部103の詳細については後述する。
第1量子化部104は、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)に対して量子化を行い、得られるLチャネル量子化パラメータを多重部110に出力する。
LPC係数適応フィルタ105は、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)およびRチャネルLPC係数(A)をそれぞれ入力信号および基準信号として用いて、入力信号と基準信号との平均二乗誤差(MSE:Mean Square Error)が最小となるような、適応フィルタパラメータを求める。LPC係数適応フィルタ105において求められた適応フィルタパラメータを以下、「LPC係数適応フィルタパラメータ」と称す。LPC係数適応フィルタ105は、求められたLPC係数適応フィルタパラメータをLPC係数再構築部106および選択部108に出力する。
LPC係数再構築部106は、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)をLPC係数適応フィルタ105から入力されるLPC係数適応フィルタパラメータによってフィルタリングし、RチャネルLPC係数を再構築する。LPC係数再構築部106は、得られるRチャネル再構築LPC係数(AR1)をルート算出部107に出力する。
ルート算出部107は、LPC係数再構築部106から入力されるRチャネル再構築LPC係数(AR1)を用いて、下記の式(2)が示す多項式の最大の根(z領域のルート)を算出し、選択部108に出力する。
Figure 2008016098
この式において、mはm>0の整数であり、AR1(m)はAR1の要素を示し、pはLPCフィル係数の次数を示す。
選択部108は、ルート算出部107から入力されるルートの値に基づき、ステレオ音声符号化部103から入力されるRチャネルLPC係数(A)または、LPC係数適応フィルタ105から入力されるLPC係数適応フィルタパラメータのうち何れかをRチャネルLPC係数関連情報として選択し、第2量子化部109に出力する。
具体的には、ルート算出部107から入力されるルートの最大値が単位円の内側にある場合、すなわち、ルートの絶対値の最大値が1以下である場合、選択部108は、LPC係数再構築部106において得られたRチャネル再構築LPC係数が所定の安定性を満たすと判断し、LPC係数適応フィルタパラメータをRチャネルLPC係数関連情報として第2量子化部109に出力する。ここで、LPC係数再構築部106において得られたRチャネル再構築LPC係数が所定の安定性を満たすということは、ステレオ音声復号側においてこのLPC係数適応フィルタパラメータを用いて復号を行う場合、得られるステレオ音声の復号信号が所定の品質を満たすことができることを意味する。一般的に、ステレオ音声信号を構成するLチャネル信号とRチャネル信号とは近似性が高いため、ステレオ音声符号化部103において求められるLチャネルLPC係数とRチャネルLPC係数との近似性も高く、LPC係数再構築部106において得られたRチャネル再構築LPC係数の安定性は高くなる。この場合、選択部108は、RチャネルLPC係数よりも情報量の少ないLPC係数適応フィルタパラメータをRチャネルLPC係数関連情報として選択する。ただし、ステレオ音声符号化装置100に入力されるステレオ音声信号を構成するLチャネル信号とRチャネル信号との近似性が低い場合等で、ルート算出部107から入力されるルートの最大値が単位円の外側になる、すなわち、ルートの絶対値の最大値が1より大きくなる場合がある。かかる場合、選択部108は、LPC係数再構築部106において得られたRチャネル再構築LPC係数が所定の安定性を満たさないと判断し、RチャネルLPC係数(A)をRチャネルLPC係数関連情報として選択する。選択部108において、RチャネルLPC係数が選択される場合は、ステレオ音声符号化装置100がLチャネルLPC係数とRチャネルLPC係数とを独立に送信することとなる。
第2量子化部109は、選択部108から入力されるRチャネルLPC係数関連情報に対して量子化を行い、得られるRチャネル量子化パラメータを多重部110に出力する。
多重部110は、モノラル信号符号化部102から入力されるモノラル信号符号化パラメータ、ステレオ音声符号化部103から入力されるLチャネル予測パラメータ、Rチャネル予測パラメータ、第1量子化部104から入力されるLチャネル量子化パラメータ、および第2量子化部109から入力されるRチャネル量子化パラメータを多重し、得られるビットストリームを送信する。
図2は、ステレオ音声符号化部103の内部の主要な構成を示すブロック図である。
第1LPC分析部131は、入力されるLチャネル信号に対してLPC分析を行い、得られるLチャネルLPC係数(A)をLPC係数適応フィルタ105に出力する。また、第1LPC分析部131は、Lチャネル信号と、LチャネルLPC係数を用いてLチャネル駆動音源信号(exc)を生成し、第1チャネル予測部133に出力する。
第2LPC分析部132は、入力されるRチャネル信号に対してLPC分析を行い、得られるRチャネルLPC係数(A)をLPC係数適応フィルタ105に出力する。また、第2LPC分析部132は、Rチャネル信号と、RチャネルLPC係数を用いてRチャネル駆動音源信号(exc)を生成し、第2チャネル予測部134に出力する。
第1チャネル予測部133は、適応フィルタからなり、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)、および第1LPC分析部131から入力されるLチャネル駆動音源信号(exc)をそれぞれ入力信号および基準信号として用いて、入力信号と基準信号との平均二乗誤差が最小となるような適応フィルタパラメータを求める。第1チャネル予測部133は、求められる適応フィルタパラメータを、モノラル信号からLチャネル信号を予測するLチャネル予測パラメータとして多重部110に出力する。
第2チャネル予測部134は、適応フィルタからなり、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)、および第2LPC分析部132から入力されるRチャネル駆動音源信号(exc)それぞれを入力信号および基準信号として用いて、入力信号と基準信号との平均二乗誤差が最小となるような適応フィルタパラメータを求める。第2チャネル予測部134は、求められる適応フィルタパラメータを、モノラル信号からRチャネル信号を予測するRチャネル予測パラメータとして多重部110に出力する。
図3は、LPC係数適応フィルタ105を構成する適応フィルタの構成および動作を説明するための図である。この図において、nは時間軸上におけるサンプル番号を示す。H(z)は、H(z)=b+b(z−1)+b(z−2)+…+b(z−k)であり、適応フィルタ、例えばFIR(Finite Impulse Response)フィルタのモデル(伝達関数)を示す。ここで、kは適応フィルタパラメータの次数を示し、b=[b,b,…,b]は適応フィルタパラメータを示す。x(n)は適応フィルタの入力信号を示し、LPC係数適応フィルタ105の場合、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)を用いる。また、y(n)は適応フィルタの基準信号を示し、LPC係数適応フィルタ105の場合、ステレオ音声符号化部103から入力されるRチャネルLPC係数(A)を用いる。
適応フィルタは、下記の式(3)に従って、入力信号と基準信号との平均二乗誤差が最小となるような、適応フィルタパラメータb=[b,b,…,b]を求めて出力する。
Figure 2008016098
この式において、Eは統計的期待演算子(statistical expectation operator)を表し、e(n)は予測誤差を示す。
上記の式(3)における入力信号および基準信号として、それぞれLチャネルLPC係数(A)およびRチャネルLPC係数(A)を用いて代入すると、下記の式(4)が得られる。
Figure 2008016098
この式において、mはLPC係数の次数を示し、wはLPC係数適応フィルタ105の適応フィルタパラメータを示し、qは適応フィルタパラメータwの次数を示す。
第1チャネル予測部133を構成する適応フィルタは、LPC係数適応フィルタ105を構成する適応フィルタと同様な構成および動作を有する。なお、入力信号x(n)として、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)を用い、基準信号y(n)として、第1LPC分析部131から入力されるLチャネル駆動音源信号(exc)を用いる点において、LPC係数適応フィルタ105を構成する適応フィルタと相違する。
第2チャネル予測部134を構成する適応フィルタは、LPC係数適応フィルタ105または第1チャネル予測部133を構成する適応フィルタと同様な構成および動作を有する。なお、入力信号x(n)として、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)を用い、予測信号y(n)として、第2LPC分析部132から入力されるRチャネル駆動音源信号(exc)を用いる点において、LPC係数適応フィルタ105または第1チャネル予測部133を構成する適応フィルタと相違する。
図4は、ステレオ音声符号化装置100におけるステレオ音声符号化処理の手順の一例を示すフロー図である。
まず、ステップ(以下、「ST」と省略する)151において、モノラル信号生成部101は、Lチャネル信号とRチャネル信号とを用いてモノラル信号(M)を生成する。
次いで、ST152において、モノラル信号符号化部102は、モノラル信号(M)を符号化して、モノラル信号符号化パラメータ、およびモノラル駆動音源信号(exc)を生成する。
次いで、ST153において、第1LPC分析部131は、Lチャネル信号に対してLPC分析を行い、LチャネルLPC係数(A)、およびLチャネル駆動音源信号(exc)を得る。
次いで、ST154において、第2LPC分析部132は、Rチャネル信号に対してLPC分析を行い、RチャネルLPC係数(A)、およびRチャネル駆動音源信号(exc)を得る。
次いで、ST155において、第1チャネル予測部133は、Lチャネル駆動音源信号(exc)とモノラル駆動音源信号(exc)との平均二乗誤差が最小となるようなLチャネル予測パラメータを求める。
次いで、ST156において、第2チャネル予測部134は、Rチャネル駆動音源信号(exc)とモノラル駆動音源信号(exc)との平均二乗誤差が最小となるようなRチャネル予測パラメータを求める。
次いで、ST157において、第1量子化部104は、LチャネルLPC係数(A)に対して量子化を行い、Lチャネル量子化パラメータを得る。
次いで、ST158において、LPC係数適応フィルタ105は、LチャネルLPC係数(A)とRチャネルLPC係数(A)との平均二乗誤差が最小となるようなLPC係数適応フィルタパラメータを求める。
次いで、ST159において、LPC係数再構築部106は、LチャネルLPC係数(A)およびLPC係数適応フィルタパラメータを用いて、RチャネルLPC係数を再構築し、Rチャネル再構築LPC係数(AR1)を生成する。
次いで、ST160において、ルート算出部107は、Rチャネル再構築LPC係数(AR1)を用いて、選択部108における選択処理用のルートを算出する。
次いで、ST161において、選択部108は、ルート算出部107から入力されるルートの最大値が単位円の内側にあるか否か、すなわち最大ルートの絶対値が1より小さいか否かを判定する。
最大ルートの絶対値が1より小さいと判定される場合(ST161:YES)、選択部108は、ST162においてLPC係数適応フィルタパラメータを第2量子化部109に出力する。一方、最大ルートの絶対値が1以上であると判定される場合(ST161:NO)、選択部108は、ST163においてRチャネルLPC係数(A)を第2量子化部109に出力する。
次いで、ST164において、第2量子化部109は、RチャネルLPC係数(A)、またはLPC係数適応フィルタパラメータに対して量子化を行い、Rチャネル量子化パラメータを得る。
次いで、ST165において、多重部110は、モノラル信号符号化パラメータ、Lチャネル予測パラメータ、Rチャネル予測パラメータ、Lチャネル量子化パラメータ、およびRチャネル量子化パラメータを多重し、得られるビットストリームを送信する。
上記のように、ステレオ音声符号化装置100は、LチャネルLPC係数とRチャネルLPC係数との間の予測パラメータであるLPC係数適応フィルタパラメータが式(2)による判定条件を満す場合、RチャネルLPC係数よりも情報量の少ないLPC係数適応フィルタパラメータをステレオ音声復号装置200に送る。
図5は、ステレオ音声復号装置200の主要な構成を示すブロック図である。
分離部201は、ステレオ音声符号化装置100から送信されるビットストリームに対して分離処理を行い、得られるモノラル信号符号化パラメータをモノラル信号復号部202に出力し、Lチャネル予測パラメータ、およびRチャネル予測パラメータをステレオ音声復号部207に出力し、Lチャネル量子化パラメータを第1逆量子化部203に出力し、Rチャネル量子化パラメータを第2逆量子化部204に出力する。
モノラル信号復号部202は、分離部201から入力されるモノラル信号符号化パラメータを用いてAMR−WBなどの音声復号処理を行い、生成されるモノラル駆動音源信号(exc’)をステレオ音声復号部207に出力する。
第1逆量子化部203は、分離部201から入力されるLチャネル量子化パラメータに対して逆量子化処理を行い、得られるLチャネルLPC係数をLPC係数再構築部206およびステレオ音声復号部207に出力する。また、第1逆量子化部203は、LチャネルLPC係数の長さを求め、切替部205に出力する。
第2逆量子化部204は、分離部201から入力されるRチャネル量子化パラメータに対して逆量子化を行い、得られるRチャネルLPC係数関連情報を切替部205に出力する。また、第2逆量子化部204は、RチャネルLPC係数関連情報の長さを求め、切替部205に出力する。
切替部205は、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の長さと、第1逆量子化部203から入力されるLチャネルLPC係数の長さとを比較して比較結果に基づき、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の出力先をLPC係数再構築部206またはステレオ音声復号部207へ切り替える。具体的には、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の長さと、第1逆量子化部203から入力されるLチャネルLPC係数の長さとが同様である場合は、第2逆量子化部204から入力されるRチャネルLPC係数関連情報がRチャネルLPC係数であると判断し、RチャネルLPC係数をステレオ音声復号部207に出力する。一方、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の長さと、第1逆量子化部203から入力されるLチャネルLPC係数の長さとが異なる場合は、第2逆量子化部204から入力されるRチャネルLPC係数関連情報がLPC係数適応フィルタパラメータであると判断し、LPC係数適応フィルタパラメータをLPC係数再構築部206に出力する。
LPC係数再構築部206は、第1逆量子化部203から入力されるLチャネルLPC係数と、切替部205から入力されるLPC係数適応フィルタパラメータとを用いてRチャネルLPC係数を再構築し、得られるRチャネル再構築LPC係数(A’’)をステレオ音声復号部207に出力する。
ステレオ音声復号部207は、分離部201から入力されるLチャネル予測パラメータ、Rチャネル予測パラメータ、モノラル信号復号部202から入力されるモノラル駆動音源信号(exc’)、第1逆量子化部203から入力されるLチャネルLPC係数(A’)、切替部205から入力されるRチャネルLPC係数(A’)、およびLPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)を用いて、Lチャネル信号およびRチャネル信号を再構築し、得られるLチャネル信号(L’)およびRチャネル信号(R’)をステレオ音声復号信号として出力する。ここで、ステレオ音声復号部207に、切替部205からのRチャネルLPC係数(A’)が入力される場合、LPC係数再構築部206からのRチャネル再構築LPC係数(A’’)は入力されず、逆に、ステレオ音声復号部207に、LPC係数再構築部206からのRチャネル再構築LPC係数(A’’)が入力される場合、切替部205からのRチャネルLPC係数(A’)は入力されない。すなわち、ステレオ音声復号部207は、切替部205から入力されるRチャネルLPC係数(A’)、またはLPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)を択一的に用いて、Lチャネル信号およびRチャネル信号を再構築する。
図6は、ステレオ音声復号部207の内部の主要な構成を示すブロック図である。
第2チャネル予測部271は、Rチャネル駆動音源信号を予測する方法として、モノラル信号復号部202から入力されるモノラル駆動音源信号(exc’)を、分離部201から入力されるRチャネル予測パラメータによってフィルタリングし、得られるRチャネル駆動音源信号(exc’)を第2LPC合成部272に出力する。
第2LPC合成部272は、切替部205から入力されるRチャネルLPC係数(A’)、LPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)、および第2チャネル予測部271から入力されるRチャネル駆動音源信号(exc’)用いてLPC合成を行い、得られるRチャネル信号(R’)をステレオ音声復号信号として出力する。ここで、第2LPC合成部272は、切替部205から入力されるRチャネルLPC係数(A’)、またはLPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)を択一的に用いる。すなわち、第2LPC合成部272に切替部205からのRチャネルLPC係数(A’)が入力される場合、LPC係数再構築部206からのRチャネル再構築LPC係数(A’’)は入力されず、逆に、第2LPC合成部272にLPC係数再構築部206からのRチャネル再構築LPC係数(A’’)が入力される場合、切替部205からのRチャネルLPC係数(A’)は入力されない。
第1チャネル予測部273は、分離部201から入力されるLチャネル予測パラメータ、およびモノラル信号復号部202から入力されるモノラル駆動音源信号(exc’)を用いてLチャネル駆動音源信号を予測し、生成されるLチャネル駆動音源信号(exc’)を第1LPC合成部274に出力する。
第1LPC合成部274は、第1逆量子化部203から入力されるLチャネルLPC係数(A’)、および第1チャネル予測部273から入力されるLチャネル駆動音源信号(exc’)を用いてLPC合成を行い、生成されるLチャネル信号(L’)をステレオ音声復号信号として出力する。
図7は、ステレオ音声復号装置200におけるステレオ音声復号処理の手順を示すフロー図である。
まず、ST251において、分離部201は、ステレオ音声符号化装置100から送信されるビットストリームを用いて分離処理を行い、モノラル信号符号化パラメータ、Lチャネル予測パラメータ、Rチャネル予測パラメータ、Lチャネル量子化パラメータ、およびRチャネル量子化パラメータを得る。
次いで、ST252において、モノラル信号復号部202は、モノラル信号符号化パラメータを用いてAMR−WBなどの音声復号処理を行い、モノラル駆動音源信号(exc’)を得る。
次いで、ST253において、第1逆量子化部203は、Lチャネル量子化パラメータに対して逆量子化処理を行い、得られるLチャネルLPC係数を得、また、LチャネルLPC係数の長さを求める。
次いで、ST254において、第2逆量子化部204は、Rチャネル量子化パラメータに対して逆量子化処理を行い、RチャネルLPC係数関連情報を得、また、得られるRチャネルLPC係数関連情報の長さを求める。
次いで、ST255において、切替部205は、LチャネルLPC係数の長さと、RチャネルLPC係数関連情報の長さとが同様であるか否かを判定する。
LチャネルLPC係数の長さと、RチャネルLPC係数関連情報の長さとが同様であると判定される場合(ST255:YES)、切替部205は、RチャネルLPC係数関連情報がRチャネルLPC係数であると判断し、ST256においてRチャネルLPC係数関連情報をステレオ音声復号部207内の第2LPC合成部272に出力する。
次いで、ST257において、第2チャネル予測部271は、モノラル駆動音源信号(exc’)をRチャネル予測パラメータによってフィルタリングし、Rチャネル駆動音源信号(exc’)を得る。
次いで、ST258において、第2LPC合成部272は、Rチャネル駆動音源信号(exc’)と、RチャネルLPC係数とを用いてLPC合成を行い、得られるRチャネル信号(R’)をステレオ音声復号信号として出力する。次いで、処理フローはST263に進む。
一方、LチャネルLPC係数の長さと、RチャネルLPC係数関連情報の長さとが異なると判定される場合(ST255:NO)、切替部205は、RチャネルLPC係数関連情報がLPC係数適応フィルタパラメータであると判断し、ST259においてRチャネルLPC係数関連情報をLPC係数再構築部206に出力する。
次いで、ST260において、LPC係数再構築部206は、LチャネルLPC係数をLPC係数適応フィルタリングパラメータによってフィルタリングし、Rチャネル再構築LPC係数(A’’)を得る。
次いで、ST261において、第2チャネル予測部271は、モノラル駆動音源信号(exc’)をRチャネル予測パラメータによってフィルタリングし、Rチャネル駆動音源信号(exc’)を得る。
次いで、ST262において、第2LPC合成部272は、Rチャネル駆動音源信号(exc’)と、Rチャネル再構築LPC係数(A’’)とを用いてLPC合成を行い、得られるRチャネル信号(R’)をステレオ音声復号信号として出力する。
次いで、ST263において、第1チャネル予測部273は、モノラル駆動音源信号(exc’)をLチャネル予測パラメータによってフィルタリングし、Lチャネル駆動音源信号(exc’)を得る。
次いで、ST264において、第1LPC合成部274は、Lチャネル駆動音源信号(exc’)と、LチャネルLPC係数(A’)とを用いてLPC合成を行い、得られるLチャネル信号(L’)をステレオ音声復号信号として出力する。
図8、図9、および図10は、本実施の形態に係るステレオ音声符号化方法によりビットレートが削減できる効果を示す図である。
図8は、ステレオ音声符号化装置100に入力されるステレオ音声信号の一例を示す図である。図8において、横軸はステレオ音声信号のサンプル番号を示し、縦軸はステレオ音声信号の振幅を示す。図8Aおよび図8Bそれぞれは、ステレオ音声信号を構成するLチャネル信号およびRチャネル信号それぞれを示す図である。図8に示すように、Lチャネル信号の振幅と、Rチャネル信号の振幅とは相違するものの、Lチャネル信号の波形と、Rチャネル信号の波形とは近似性を表す。
図9は、図8に示したステレオ音声信号に対してLPC分析を行って得られるLPC係数を示す図である。図9において、横軸はLPC係数の次数番号を示し、縦軸はLPC係数の各次の値を示す。図9は、LPC係数の次数が16次である場合を例示している。図9Aは、第1LPC分析部131において生成されるLチャネルLPC係数(A)を示し、図9Bは、第2LPC分析部132において生成されるRチャネルLPC係数(A)を示す。図9に示すように、LチャネルLPC係数(A)の値と、RチャネルLPC係数(A)の値とは相違するものの、LチャネルLPC係数(A)と、RチャネルLPC係数(A)とは全体的に近似性を表す。
図10は、直接LPC分析を行って生成されるRチャネルLPC係数と、適応フィルタを用いて再構築されるRチャネル再構築LPC係数との比較を示す図である。具体的には、実線は、第2LPC分析部132において生成されるRチャネルLPC係数(A)を示し、点線は、LPC係数再構築部106において再構築されるRチャネル再構築LPC係数(AR1)を示す。図10に示すように、本実施の形態に係るステレオ音声符号化方法を用いる場合、再構築されるLPC係数と、LPC分析を行って直接得られるLPC係数とは非常に近似している。すなわち、LPC係数再構築部106において得られたRチャネル再構築LPC係数の安定性は高く、選択部108においてRチャネルLPC係数よりもLPC係数適応フィルタパラメータが選択される確率がずっと高いため、ステレオ音声符号化装置100のビットレートを削減することができる。
図10においては、本実施の形態に係る第1LPC分析部を構成する適応フィルタおよび第2LPC分析部を構成する適応フィルタの次数が両方とも16次であり、LPC係数適応フィルタ105を構成する適応フィルタの次数が8次である場合を例示する。かかる場合、LチャネルLPC係数とRチャネルLPC係数とを直接送信するのに32ビットが必要であるのに対して、LチャネルLPC係数とLPC係数適応フィルタパラメータとを送信するのには24ビットだけが必要であるため、符号化処理の品質を保ちつつ、25%のビットレートを削減することができる。
このように、本実施の形態によれば、ステレオ音声符号化装置は、Lチャネル信号とRチャネル信号との相互相関性を用い、RチャネルLPC係数よりも情報量の少ないLPC係数適応フィルタパラメータを求めてステレオ音声復号装置に送信する。すなわち、LチャネルLPC係数と右チャネルのLPC係数とに含まれている重複情報を送信することを回避し、送信される符号化情報の冗長性を取り除くことができ、ステレオ音声符号化のビットレートを削減することができる。
さらに、本実施の形態によれば、LPC係数適応フィルタパラメータを用いてRチャネルLPC係数を再構築し、得られるRチャネル再構築LPC係数の安定性を判定し、Rチャネル再構築LPC係数の安定性が所定のレベル以下である場合には、両チャネルのLPC係数それぞれを独立に送信するため、ステレオ音声復号信号の品質をさらに向上することができる。
なお、本実施の形態では、図5においては、モノラル信号復号部202における復号処理により得られたモノラル信号(M’)はステレオ音声復号装置200の外部には出力されていないが、例えばLチャネル復号信号(L’)またはRチャネル復号信号(R’)の生成に失敗した場合に、モノラル信号(M’)をステレオ音声復号装置200の外部に出力し、ステレオ音声復号装置200の復号音声信号として用いても良い。
また、本実施の形態にかかるLチャネル信号に対する一連の処理とRチャネル信号に対する一連の処理を逆転させても良い。かかる場合、例えば、本実施の形態では、LチャネルLPC係数がLPC係数適応フィルタ105の入力信号として、RチャネルLPC係数がLPC係数適応フィルタ105の基準信号として用いられるのに対して、RチャネルLPC係数がLPC係数適応フィルタ105の入力信号として、LチャネルLPC係数がLPC係数適応フィルタ105の基準信号として用いられる。
また、本実施の形態では、LPC係数を求めて量子化する場合を例にとって説明したが、LPC係数と等価な他のパラメータ(例えばLSPパラメータ)を求めて量子化しても良い。
また、本実施の形態では、図4及び図7において、YES/NOの判断による分岐以外はシリアル的に各ステップの処理を行う例を示したが、順序の入れ替えや並列化が可能なステップもある。例えば、ST153とST154とは順序を逆にしても良く、あるいはST153の処理とST154の処理とを並列処理にしても良い。ST155及びST156の順序/並列化や、ST252とST253とST254との順序/並列化に関しても同様である。また、ST157の処理は、ST158〜ST164の処理の後でも良く、あるいは並列に処理しても良い。ST255〜ST262の処理とST263〜ST264の処理とに関しても同様である。
また、本発明に係るステレオ音声符号化装置およびステレオ音声復号装置は、移動体通信システムにおける通信端末装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置を提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るステレオ音声符号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るステレオ音声符号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2006年8月4日出願の特願2006−213963の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係るステレオ音声符号化装置、ステレオ音声復号装置、およびステレオ音声符号化方法は、移動通信端末におけるステレオ音声符号化等の用途に適用することができる。
本発明は、移動体通信システムまたはインターネットプロトコル(IP:Internet Protocol)を用いたパケット通信システム等において、ステレオ音声信号の符号化/復号を行う際に用いられるステレオ音声符号化装置、ステレオ音声復号装置、及びこれらの方法に関する。
移動体通信システムまたはIPを用いたパケット通信システム等において、DSP(Digital Signal Processor)のディジタル信号処理速度の向上と帯域幅の拡大により高ビットレートの伝送が可能となってきている。伝送レートのさらなる高速化が進めば、複数チャネルを伝送するだけの帯域(広帯域)を確保できるようになるため、モノラル方式が主流の音声通信においても、ステレオ方式による通信(ステレオ通信)が普及することが期待される。広帯域のステレオ通信では、より自然なサウンド環境に関する情報を符号化することができ、ヘッドフォンあるいはスピーカーで再生すると、聴取者が知覚する空間イメージが生まれる。
ステレオ音声信号の符号化方法として、ステレオ音声信号を構成する複数のチャネル信号を独立に符号化して伝送する非パラメトリックな方法がある。例えば、音声符号化方法として、CELP符号化などの線形予測符号化(LPC:Linear Prediction Coefficient)方法が一般的に使用されており、ステレオ音声信号のCELP符号化においては、ステレオ音声信号を構成する左チャネルおよび右チャネル各々のLPC係数を求め、求められたLPC係数を量子化して復号器側に伝送する(例えば非特許文献1参照)。
Guylain Roy and Peter Kabal著、「Wideband CELP Speech Coding at 16 kbits/sec」 in Proc.ICASSP’91、Toronto Canada、1991年5月、p.17−20
しかし、ステレオ音声信号を構成する複数のチャネル、例えば、左、右チャネルの信号は近似しており、振幅および時間遅延のみにおいて相違するだけである。すなわち、チャネル信号間は相互相関が強く、左チャネルの符号化パラメータと、右チャネルの符号化パラメータとは重複の情報を含み、冗長性を表す。例えば、近似する左、右チャネル信号に対してCELP符号化を行って得られる両チャネルのLPC係数は、相互相関性が高く冗長性が高いため、ビットレートの浪費の原因となる。
そこで、ステレオ音声信号の符号化においては、複数チャネルの符号化パラメータに含まれている冗長性を取り除き、ビットレートを減少させる方法、すなわち、パラメトリックな符号化方法が考えられる。CELP符号化においては、左チャネルと右チャネルとの相互相関性に起因する、左チャネルのLPC係数と右チャネルのLPC係数との冗長性を取り除くことにより、ステレオ音声符号化のビットレートをさらに低減することが考えられる。
本発明の目的は、CELP符号化において、左チャネルと右チャネルとの相互相関性に起因する、左チャネルのLPC係数と右チャネルのLPC係数とに含まれている冗長性を除去し、ステレオ音声符号化のビットレートを低減することができるステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法を提供することである。
本発明のステレオ音声符号化装置は、ステレオ音声を構成する第1チャネル信号および第2チャネル信号に対してそれぞれLPC分析を行い、第1チャネルLPC係数と第2チャネルLPC係数とを得るLPC分析手段と、前記第1チャネルLPC係数と、前記第2チャネルLPC係数との平均二乗誤差を最小化するLPC係数適応フィルタパラメータを求めるLPC係数適応フィルタと、前記第1チャネルLPC係数と前記第2チャネルLPC係数と前記LPC係数適応フィルタパラメータとを用いて、第2チャネルLPC係数関連情報を得る関連情報決定手段と、を具備する構成を採る。
本発明のステレオ音声復号装置は、受信したビットストリームから、符号化装置においてステレオ音声を構成する第1チャネル信号および第2チャネル信号を用いて生成された、第1チャネルLPC係数と、第2チャネルLPC係数関連情報とを得る分離手段と、前記第2チャネルLPC係数関連情報がLPC係数適応フィルタパラメータであるか第2チャネルLPC係数であるかを判別し、前記第2チャネルLPC係数関連情報が前記LPC係数適応フィルタパラメータである場合には、前記LPC係数適応フィルタパラメータを用いて、前記第1チャネルLPC係数をフィルタリングし、得られる第2チャネル再構築LPC係数を出力し、前記第2チャネルLPC係数関連情報が前記第2チャネルLPC係数である場合には、前記第2チャネルLPC係数を出力する第2チャネルLPC係数決定手段と、を具備する構成を採る。
本発明によれば、ステレオ音声のCELP符号化において、第1チャネルLPC係数と、第2チャネルLPC係数との平均二乗誤差を最小化するLPC係数適応フィルタパラメータを求めて伝送することにより、左チャネルのLPC係数と右チャネルのLPC係数とに含まれている重複な情報を送ることを回避することができる。従って、伝送される符号化情報の冗長性を除去し、ステレオ音声符号化のビットレートを低減することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係るステレオ音声符号化装置100の主要な構成を示すブロック図である。ここでは、ステレオ音声信号が左(L)チャネル信号および右(R)チャネル信号からなる場合を例にとって説明する。
モノラル信号生成部101は、入力されるLチャネル信号とRチャネル信号とを用いて、例えば、下記の式(1)に従ってモノラル信号(M)を生成し、モノラル信号符号化部102に出力する。
Figure 2008016098
この式において、nは時間軸上における信号のサンプル番号を示し、L(n)はLチャネル信号を、R(n)はRチャネル信号を、M(n)は生成されるモノラル信号を示す。
モノラル信号符号化部102は、モノラル信号生成部101から入力されるモノラル信号に対してAMR−WB(Adaptive MultiRate - WideBand)などの音声符号化処理を行い、得られるモノラル信号符号化パラメータを多重部110に出力し、また、符号化の過程において得られるモノラル駆動音源信号(exc)をステレオ音声符号化部103に出力する。
ステレオ音声符号化部103は、Lチャネル信号と、Rチャネル信号と、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)とを用いて、モノラル信号からLチャネル信号およびRチャネル信号を予測するLチャネル予測パラメータおよびRチャネル予測パラメータそれぞれを算出し、多重部110に出力する。また、ステレオ音声符号化部103は、Lチャネル信号に対してLPC分析を行い得られるLチャネルLPC係数(A)をLPC係数適応フィルタ105および第1量子化部104に出力する。また、ステレオ音声符号化部103は、Rチャネル信号に対してLPC分析を行い得られるRチャネルLPC係数(A)をLPC係数適応フィルタ105および選択部108に出力する。なお、ステレオ音声符号化部103の詳細については後述する。
第1量子化部104は、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)に対して量子化を行い、得られるLチャネル量子化パラメータを多重部110に出力する。
LPC係数適応フィルタ105は、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)およびRチャネルLPC係数(A)をそれぞれ入力信号および基準信号として用いて、入力信号と基準信号との平均二乗誤差(MSE:Mean Square Error)が最小となるような、適応フィルタパラメータを求める。LPC係数適応フィルタ105において求められた適応フィルタパラメータを以下、「LPC係数適応フィルタパラメータ」と称す。LPC係数適応フィルタ105は、求められたLPC係数適応フィルタパラメータをLPC係数再構築部106および選択部108に出力する。
LPC係数再構築部106は、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)をLPC係数適応フィルタ105から入力されるLPC係数適応フィルタパラメータによってフィルタリングし、RチャネルLPC係数を再構築する。LPC係数再構築部106は、得られるRチャネル再構築LPC係数(AR1)をルート算出部107に出力する。
ルート算出部107は、LPC係数再構築部106から入力されるRチャネル再構築LPC係数(AR1)を用いて、下記の式(2)が示す多項式の最大の根(z領域のルート)を算出し、選択部108に出力する。
Figure 2008016098
この式において、mはm>0の整数であり、AR1(m)はAR1の要素を示し、pはLPCフィル係数の次数を示す。
選択部108は、ルート算出部107から入力されるルートの値に基づき、ステレオ音声符号化部103から入力されるRチャネルLPC係数(A)または、LPC係数適応フィルタ105から入力されるLPC係数適応フィルタパラメータのうち何れかをRチャネルLPC係数関連情報として選択し、第2量子化部109に出力する。
具体的には、ルート算出部107から入力されるルートの最大値が単位円の内側にある場合、すなわち、ルートの絶対値の最大値が1以下である場合、選択部108は、LPC係数再構築部106において得られたRチャネル再構築LPC係数が所定の安定性を満たすと判断し、LPC係数適応フィルタパラメータをRチャネルLPC係数関連情報として第2量子化部109に出力する。ここで、LPC係数再構築部106において得られたRチャネル再構築LPC係数が所定の安定性を満たすということは、ステレオ音声復号側においてこのLPC係数適応フィルタパラメータを用いて復号を行う場合、得られるステレオ音声の復号信号が所定の品質を満たすことができることを意味する。一般的に、ステレオ音声信号を構成するLチャネル信号とRチャネル信号とは近似性が高いため、ステレオ音声符号化部103において求められるLチャネルLPC係数とRチャネルLPC係数との近似性も高く、LPC係数再構築部106において得られたRチャネル再構築LPC係数の安定性は高くなる。この場合、選択部108は、RチャネルLPC係数よりも情報量の少ないLPC係数適応フィルタパラメータをRチャネルLPC係数関連情報として選択する。ただし、ステレオ音声符号化装置100に入力されるステレオ音声信号を構成するLチャネル信号とRチャネル信号との近似性が低い場合等で、ルート算出部107から入力されるルートの最大値が単位円の外側になる、すなわち、ルートの絶対値の最大値が1より大きくなる場合がある。かかる場合、選択部108は、LPC係数再構築部106において得られたRチャネル再構築LPC係数が所定の安定性を満たさないと判断し、RチャネルLPC係数(A)をRチャネルLPC係数関連情報として選択する。選択部108において、RチャネルLPC係数が選択される場合は、ステレオ音声符号化装置100がLチャネルLPC係数とRチャネルLPC係数とを独立に送信することとなる。
第2量子化部109は、選択部108から入力されるRチャネルLPC係数関連情報に対して量子化を行い、得られるRチャネル量子化パラメータを多重部110に出力する。
多重部110は、モノラル信号符号化部102から入力されるモノラル信号符号化パラメータ、ステレオ音声符号化部103から入力されるLチャネル予測パラメータ、Rチャネル予測パラメータ、第1量子化部104から入力されるLチャネル量子化パラメータ、および第2量子化部109から入力されるRチャネル量子化パラメータを多重し、得られるビットストリームを送信する。
図2は、ステレオ音声符号化部103の内部の主要な構成を示すブロック図である。
第1LPC分析部131は、入力されるLチャネル信号に対してLPC分析を行い、得られるLチャネルLPC係数(A)をLPC係数適応フィルタ105に出力する。また、第1LPC分析部131は、Lチャネル信号と、LチャネルLPC係数を用いてLチャネル駆動音源信号(exc)を生成し、第1チャネル予測部133に出力する。
第2LPC分析部132は、入力されるRチャネル信号に対してLPC分析を行い、得られるRチャネルLPC係数(A)をLPC係数適応フィルタ105に出力する。また、第2LPC分析部132は、Rチャネル信号と、RチャネルLPC係数を用いてRチャネル駆動音源信号(exc)を生成し、第2チャネル予測部134に出力する。
第1チャネル予測部133は、適応フィルタからなり、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)、および第1LPC分析部131から入力されるLチャネル駆動音源信号(exc)をそれぞれ入力信号および基準信号として用いて、入力信号と基準信号との平均二乗誤差が最小となるような適応フィルタパラメータを求める。第1チャネル予測部133は、求められる適応フィルタパラメータを、モノラル信号からLチャネル信号を予測するLチャネル予測パラメータとして多重部110に出力する。
第2チャネル予測部134は、適応フィルタからなり、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)、および第2LPC分析部132から入力されるRチャネル駆動音源信号(exc)それぞれを入力信号および基準信号として用いて、入力信号と基準信号との平均二乗誤差が最小となるような適応フィルタパラメータを求める。第2チャネル予測部134は、求められる適応フィルタパラメータを、モノラル信号からRチャネル信号を予測するRチャネル予測パラメータとして多重部110に出力する。
図3は、LPC係数適応フィルタ105を構成する適応フィルタの構成および動作を説明するための図である。この図において、nは時間軸上におけるサンプル番号を示す。H(z)は、H(z)=b+b(z−1)+b(z−2)+…+b(z−k)であり、適応フィルタ、例えばFIR(Finite Impulse Response)フィルタのモデル(伝達関数)を示す。ここで、kは適応フィルタパラメータの次数を示し、b=[b,b,…,b]は適応フィルタパラメータを示す。x(n)は適応フィルタの入力信号を示し、LPC係数適応フィルタ105の場合、ステレオ音声符号化部103から入力されるLチャネルLPC係数(A)を用いる。また、y(n)は適応フィルタの基準信号を示し、LPC係数適応フィルタ105の場合、ステレオ音声符号化部103から入力されるRチャネルLPC係数(A)を用いる。
適応フィルタは、下記の式(3)に従って、入力信号と基準信号との平均二乗誤差が最小となるような、適応フィルタパラメータb=[b,b,…,b]を求めて出力する。
Figure 2008016098
この式において、Eは統計的期待演算子(statistical expectation operator)を表し、e(n)は予測誤差を示す。
上記の式(3)における入力信号および基準信号として、それぞれLチャネルLPC係
数(A)およびRチャネルLPC係数(A)を用いて代入すると、下記の式(4)が得られる。
Figure 2008016098
この式において、mはLPC係数の次数を示し、wはLPC係数適応フィルタ105の適応フィルタパラメータを示し、qは適応フィルタパラメータwの次数を示す。
第1チャネル予測部133を構成する適応フィルタは、LPC係数適応フィルタ105を構成する適応フィルタと同様な構成および動作を有する。なお、入力信号x(n)として、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)を用い、基準信号y(n)として、第1LPC分析部131から入力されるLチャネル駆動音源信号(exc)を用いる点において、LPC係数適応フィルタ105を構成する適応フィルタと相違する。
第2チャネル予測部134を構成する適応フィルタは、LPC係数適応フィルタ105または第1チャネル予測部133を構成する適応フィルタと同様な構成および動作を有する。なお、入力信号x(n)として、モノラル信号符号化部102から入力されるモノラル駆動音源信号(exc)を用い、予測信号y(n)として、第2LPC分析部132から入力されるRチャネル駆動音源信号(exc)を用いる点において、LPC係数適応フィルタ105または第1チャネル予測部133を構成する適応フィルタと相違する。
図4は、ステレオ音声符号化装置100におけるステレオ音声符号化処理の手順の一例を示すフロー図である。
まず、ステップ(以下、「ST」と省略する)151において、モノラル信号生成部101は、Lチャネル信号とRチャネル信号とを用いてモノラル信号(M)を生成する。
次いで、ST152において、モノラル信号符号化部102は、モノラル信号(M)を符号化して、モノラル信号符号化パラメータ、およびモノラル駆動音源信号(exc)を生成する。
次いで、ST153において、第1LPC分析部131は、Lチャネル信号に対してLPC分析を行い、LチャネルLPC係数(A)、およびLチャネル駆動音源信号(exc)を得る。
次いで、ST154において、第2LPC分析部132は、Rチャネル信号に対してLPC分析を行い、RチャネルLPC係数(A)、およびRチャネル駆動音源信号(exc)を得る。
次いで、ST155において、第1チャネル予測部133は、Lチャネル駆動音源信号(exc)とモノラル駆動音源信号(exc)との平均二乗誤差が最小となるようなLチャネル予測パラメータを求める。
次いで、ST156において、第2チャネル予測部134は、Rチャネル駆動音源信号(exc)とモノラル駆動音源信号(exc)との平均二乗誤差が最小となるようなRチャネル予測パラメータを求める。
次いで、ST157において、第1量子化部104は、LチャネルLPC係数(A)に対して量子化を行い、Lチャネル量子化パラメータを得る。
次いで、ST158において、LPC係数適応フィルタ105は、LチャネルLPC係数(A)とRチャネルLPC係数(A)との平均二乗誤差が最小となるようなLPC係数適応フィルタパラメータを求める。
次いで、ST159において、LPC係数再構築部106は、LチャネルLPC係数(A)およびLPC係数適応フィルタパラメータを用いて、RチャネルLPC係数を再構築し、Rチャネル再構築LPC係数(AR1)を生成する。
次いで、ST160において、ルート算出部107は、Rチャネル再構築LPC係数(AR1)を用いて、選択部108における選択処理用のルートを算出する。
次いで、ST161において、選択部108は、ルート算出部107から入力されるルートの最大値が単位円の内側にあるか否か、すなわち最大ルートの絶対値が1より小さいか否かを判定する。
最大ルートの絶対値が1より小さいと判定される場合(ST161:YES)、選択部108は、ST162においてLPC係数適応フィルタパラメータを第2量子化部109に出力する。一方、最大ルートの絶対値が1以上であると判定される場合(ST161:NO)、選択部108は、ST163においてRチャネルLPC係数(A)を第2量子化部109に出力する。
次いで、ST164において、第2量子化部109は、RチャネルLPC係数(A)、またはLPC係数適応フィルタパラメータに対して量子化を行い、Rチャネル量子化パラメータを得る。
次いで、ST165において、多重部110は、モノラル信号符号化パラメータ、Lチャネル予測パラメータ、Rチャネル予測パラメータ、Lチャネル量子化パラメータ、およびRチャネル量子化パラメータを多重し、得られるビットストリームを送信する。
上記のように、ステレオ音声符号化装置100は、LチャネルLPC係数とRチャネルLPC係数との間の予測パラメータであるLPC係数適応フィルタパラメータが式(2)による判定条件を満す場合、RチャネルLPC係数よりも情報量の少ないLPC係数適応フィルタパラメータをステレオ音声復号装置200に送る。
図5は、ステレオ音声復号装置200の主要な構成を示すブロック図である。
分離部201は、ステレオ音声符号化装置100から送信されるビットストリームに対して分離処理を行い、得られるモノラル信号符号化パラメータをモノラル信号復号部202に出力し、Lチャネル予測パラメータ、およびRチャネル予測パラメータをステレオ音声復号部207に出力し、Lチャネル量子化パラメータを第1逆量子化部203に出力し、Rチャネル量子化パラメータを第2逆量子化部204に出力する。
モノラル信号復号部202は、分離部201から入力されるモノラル信号符号化パラメータを用いてAMR−WBなどの音声復号処理を行い、生成されるモノラル駆動音源信号(exc’)をステレオ音声復号部207に出力する。
第1逆量子化部203は、分離部201から入力されるLチャネル量子化パラメータに
対して逆量子化処理を行い、得られるLチャネルLPC係数をLPC係数再構築部206およびステレオ音声復号部207に出力する。また、第1逆量子化部203は、LチャネルLPC係数の長さを求め、切替部205に出力する。
第2逆量子化部204は、分離部201から入力されるRチャネル量子化パラメータに対して逆量子化を行い、得られるRチャネルLPC係数関連情報を切替部205に出力する。また、第2逆量子化部204は、RチャネルLPC係数関連情報の長さを求め、切替部205に出力する。
切替部205は、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の長さと、第1逆量子化部203から入力されるLチャネルLPC係数の長さとを比較して比較結果に基づき、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の出力先をLPC係数再構築部206またはステレオ音声復号部207へ切り替える。具体的には、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の長さと、第1逆量子化部203から入力されるLチャネルLPC係数の長さとが同様である場合は、第2逆量子化部204から入力されるRチャネルLPC係数関連情報がRチャネルLPC係数であると判断し、RチャネルLPC係数をステレオ音声復号部207に出力する。一方、第2逆量子化部204から入力されるRチャネルLPC係数関連情報の長さと、第1逆量子化部203から入力されるLチャネルLPC係数の長さとが異なる場合は、第2逆量子化部204から入力されるRチャネルLPC係数関連情報がLPC係数適応フィルタパラメータであると判断し、LPC係数適応フィルタパラメータをLPC係数再構築部206に出力する。
LPC係数再構築部206は、第1逆量子化部203から入力されるLチャネルLPC係数と、切替部205から入力されるLPC係数適応フィルタパラメータとを用いてRチャネルLPC係数を再構築し、得られるRチャネル再構築LPC係数(A’’)をステレオ音声復号部207に出力する。
ステレオ音声復号部207は、分離部201から入力されるLチャネル予測パラメータ、Rチャネル予測パラメータ、モノラル信号復号部202から入力されるモノラル駆動音源信号(exc’)、第1逆量子化部203から入力されるLチャネルLPC係数(A’)、切替部205から入力されるRチャネルLPC係数(A’)、およびLPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)を用いて、Lチャネル信号およびRチャネル信号を再構築し、得られるLチャネル信号(L’)およびRチャネル信号(R’)をステレオ音声復号信号として出力する。ここで、ステレオ音声復号部207に、切替部205からのRチャネルLPC係数(A’)が入力される場合、LPC係数再構築部206からのRチャネル再構築LPC係数(A’’)は入力されず、逆に、ステレオ音声復号部207に、LPC係数再構築部206からのRチャネル再構築LPC係数(A’’)が入力される場合、切替部205からのRチャネルLPC係数(A’)は入力されない。すなわち、ステレオ音声復号部207は、切替部205から入力されるRチャネルLPC係数(A’)、またはLPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)を択一的に用いて、Lチャネル信号およびRチャネル信号を再構築する。
図6は、ステレオ音声復号部207の内部の主要な構成を示すブロック図である。
第2チャネル予測部271は、Rチャネル駆動音源信号を予測する方法として、モノラル信号復号部202から入力されるモノラル駆動音源信号(exc’)を、分離部201から入力されるRチャネル予測パラメータによってフィルタリングし、得られるRチャネル駆動音源信号(exc’)を第2LPC合成部272に出力する。
第2LPC合成部272は、切替部205から入力されるRチャネルLPC係数(A’)、LPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)、および第2チャネル予測部271から入力されるRチャネル駆動音源信号(exc’)用いてLPC合成を行い、得られるRチャネル信号(R’)をステレオ音声復号信号として出力する。ここで、第2LPC合成部272は、切替部205から入力されるRチャネルLPC係数(A’)、またはLPC係数再構築部206から入力されるRチャネル再構築LPC係数(A’’)を択一的に用いる。すなわち、第2LPC合成部272に切替部205からのRチャネルLPC係数(A’)が入力される場合、LPC係数再構築部206からのRチャネル再構築LPC係数(A’’)は入力されず、逆に、第2LPC合成部272にLPC係数再構築部206からのRチャネル再構築LPC係数(A’’)が入力される場合、切替部205からのRチャネルLPC係数(A’)は入力されない。
第1チャネル予測部273は、分離部201から入力されるLチャネル予測パラメータ、およびモノラル信号復号部202から入力されるモノラル駆動音源信号(exc’)を用いてLチャネル駆動音源信号を予測し、生成されるLチャネル駆動音源信号(exc’)を第1LPC合成部274に出力する。
第1LPC合成部274は、第1逆量子化部203から入力されるLチャネルLPC係数(A’)、および第1チャネル予測部273から入力されるLチャネル駆動音源信号(exc’)を用いてLPC合成を行い、生成されるLチャネル信号(L’)をステレオ音声復号信号として出力する。
図7は、ステレオ音声復号装置200におけるステレオ音声復号処理の手順を示すフロー図である。
まず、ST251において、分離部201は、ステレオ音声符号化装置100から送信されるビットストリームを用いて分離処理を行い、モノラル信号符号化パラメータ、Lチャネル予測パラメータ、Rチャネル予測パラメータ、Lチャネル量子化パラメータ、およびRチャネル量子化パラメータを得る。
次いで、ST252において、モノラル信号復号部202は、モノラル信号符号化パラメータを用いてAMR−WBなどの音声復号処理を行い、モノラル駆動音源信号(exc’)を得る。
次いで、ST253において、第1逆量子化部203は、Lチャネル量子化パラメータに対して逆量子化処理を行い、得られるLチャネルLPC係数を得、また、LチャネルLPC係数の長さを求める。
次いで、ST254において、第2逆量子化部204は、Rチャネル量子化パラメータに対して逆量子化処理を行い、RチャネルLPC係数関連情報を得、また、得られるRチャネルLPC係数関連情報の長さを求める。
次いで、ST255において、切替部205は、LチャネルLPC係数の長さと、RチャネルLPC係数関連情報の長さとが同様であるか否かを判定する。
LチャネルLPC係数の長さと、RチャネルLPC係数関連情報の長さとが同様であると判定される場合(ST255:YES)、切替部205は、RチャネルLPC係数関連情報がRチャネルLPC係数であると判断し、ST256においてRチャネルLPC係数
関連情報をステレオ音声復号部207内の第2LPC合成部272に出力する。
次いで、ST257において、第2チャネル予測部271は、モノラル駆動音源信号(exc’)をRチャネル予測パラメータによってフィルタリングし、Rチャネル駆動音源信号(exc’)を得る。
次いで、ST258において、第2LPC合成部272は、Rチャネル駆動音源信号(exc’)と、RチャネルLPC係数とを用いてLPC合成を行い、得られるRチャネル信号(R’)をステレオ音声復号信号として出力する。次いで、処理フローはST263に進む。
一方、LチャネルLPC係数の長さと、RチャネルLPC係数関連情報の長さとが異なると判定される場合(ST255:NO)、切替部205は、RチャネルLPC係数関連情報がLPC係数適応フィルタパラメータであると判断し、ST259においてRチャネルLPC係数関連情報をLPC係数再構築部206に出力する。
次いで、ST260において、LPC係数再構築部206は、LチャネルLPC係数をLPC係数適応フィルタリングパラメータによってフィルタリングし、Rチャネル再構築LPC係数(A’’)を得る。
次いで、ST261において、第2チャネル予測部271は、モノラル駆動音源信号(exc’)をRチャネル予測パラメータによってフィルタリングし、Rチャネル駆動音源信号(exc’)を得る。
次いで、ST262において、第2LPC合成部272は、Rチャネル駆動音源信号(exc’)と、Rチャネル再構築LPC係数(A’’)とを用いてLPC合成を行い、得られるRチャネル信号(R’)をステレオ音声復号信号として出力する。
次いで、ST263において、第1チャネル予測部273は、モノラル駆動音源信号(exc’)をLチャネル予測パラメータによってフィルタリングし、Lチャネル駆動音源信号(exc’)を得る。
次いで、ST264において、第1LPC合成部274は、Lチャネル駆動音源信号(exc’)と、LチャネルLPC係数(A’)とを用いてLPC合成を行い、得られるLチャネル信号(L’)をステレオ音声復号信号として出力する。
図8、図9、および図10は、本実施の形態に係るステレオ音声符号化方法によりビットレートが削減できる効果を示す図である。
図8は、ステレオ音声符号化装置100に入力されるステレオ音声信号の一例を示す図である。図8において、横軸はステレオ音声信号のサンプル番号を示し、縦軸はステレオ音声信号の振幅を示す。図8Aおよび図8Bそれぞれは、ステレオ音声信号を構成するLチャネル信号およびRチャネル信号それぞれを示す図である。図8に示すように、Lチャネル信号の振幅と、Rチャネル信号の振幅とは相違するものの、Lチャネル信号の波形と、Rチャネル信号の波形とは近似性を表す。
図9は、図8に示したステレオ音声信号に対してLPC分析を行って得られるLPC係数を示す図である。図9において、横軸はLPC係数の次数番号を示し、縦軸はLPC係数の各次の値を示す。図9は、LPC係数の次数が16次である場合を例示している。図9Aは、第1LPC分析部131において生成されるLチャネルLPC係数(A)を示
し、図9Bは、第2LPC分析部132において生成されるRチャネルLPC係数(A)を示す。図9に示すように、LチャネルLPC係数(A)の値と、RチャネルLPC係数(A)の値とは相違するものの、LチャネルLPC係数(A)と、RチャネルLPC係数(A)とは全体的に近似性を表す。
図10は、直接LPC分析を行って生成されるRチャネルLPC係数と、適応フィルタを用いて再構築されるRチャネル再構築LPC係数との比較を示す図である。具体的には、実線は、第2LPC分析部132において生成されるRチャネルLPC係数(A)を示し、点線は、LPC係数再構築部106において再構築されるRチャネル再構築LPC係数(AR1)を示す。図10に示すように、本実施の形態に係るステレオ音声符号化方法を用いる場合、再構築されるLPC係数と、LPC分析を行って直接得られるLPC係数とは非常に近似している。すなわち、LPC係数再構築部106において得られたRチャネル再構築LPC係数の安定性は高く、選択部108においてRチャネルLPC係数よりもLPC係数適応フィルタパラメータが選択される確率がずっと高いため、ステレオ音声符号化装置100のビットレートを削減することができる。
図10においては、本実施の形態に係る第1LPC分析部を構成する適応フィルタおよび第2LPC分析部を構成する適応フィルタの次数が両方とも16次であり、LPC係数適応フィルタ105を構成する適応フィルタの次数が8次である場合を例示する。かかる場合、LチャネルLPC係数とRチャネルLPC係数とを直接送信するのに32ビットが必要であるのに対して、LチャネルLPC係数とLPC係数適応フィルタパラメータとを送信するのには24ビットだけが必要であるため、符号化処理の品質を保ちつつ、25%のビットレートを削減することができる。
このように、本実施の形態によれば、ステレオ音声符号化装置は、Lチャネル信号とRチャネル信号との相互相関性を用い、RチャネルLPC係数よりも情報量の少ないLPC係数適応フィルタパラメータを求めてステレオ音声復号装置に送信する。すなわち、LチャネルLPC係数と右チャネルのLPC係数とに含まれている重複情報を送信することを回避し、送信される符号化情報の冗長性を取り除くことができ、ステレオ音声符号化のビットレートを削減することができる。
さらに、本実施の形態によれば、LPC係数適応フィルタパラメータを用いてRチャネルLPC係数を再構築し、得られるRチャネル再構築LPC係数の安定性を判定し、Rチャネル再構築LPC係数の安定性が所定のレベル以下である場合には、両チャネルのLPC係数それぞれを独立に送信するため、ステレオ音声復号信号の品質をさらに向上することができる。
なお、本実施の形態では、図5においては、モノラル信号復号部202における復号処理により得られたモノラル信号(M’)はステレオ音声復号装置200の外部には出力されていないが、例えばLチャネル復号信号(L’)またはRチャネル復号信号(R’)の生成に失敗した場合に、モノラル信号(M’)をステレオ音声復号装置200の外部に出力し、ステレオ音声復号装置200の復号音声信号として用いても良い。
また、本実施の形態にかかるLチャネル信号に対する一連の処理とRチャネル信号に対する一連の処理を逆転させても良い。かかる場合、例えば、本実施の形態では、LチャネルLPC係数がLPC係数適応フィルタ105の入力信号として、RチャネルLPC係数がLPC係数適応フィルタ105の基準信号として用いられるのに対して、RチャネルLPC係数がLPC係数適応フィルタ105の入力信号として、LチャネルLPC係数がLPC係数適応フィルタ105の基準信号として用いられる。
また、本実施の形態では、LPC係数を求めて量子化する場合を例にとって説明したが、LPC係数と等価な他のパラメータ(例えばLSPパラメータ)を求めて量子化しても良い。
また、本実施の形態では、図4及び図7において、YES/NOの判断による分岐以外はシリアル的に各ステップの処理を行う例を示したが、順序の入れ替えや並列化が可能なステップもある。例えば、ST153とST154とは順序を逆にしても良く、あるいはST153の処理とST154の処理とを並列処理にしても良い。ST155及びST156の順序/並列化や、ST252とST253とST254との順序/並列化に関しても同様である。また、ST157の処理は、ST158〜ST164の処理の後でも良く、あるいは並列に処理しても良い。ST255〜ST262の処理とST263〜ST264の処理とに関しても同様である。
また、本発明に係るステレオ音声符号化装置およびステレオ音声復号装置は、移動体通信システムにおける通信端末装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置を提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るステレオ音声符号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るステレオ音声符号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2006年8月4日出願の特願2006−213963の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係るステレオ音声符号化装置、ステレオ音声復号装置、およびステレオ音声符号化方法は、移動通信端末におけるステレオ音声符号化等の用途に適用することができる。
本発明の一実施の形態に係るステレオ音声符号化装置の主要な構成を示すブロック図 本発明の一実施の形態に係るステレオ音声符号化部の内部の主要な構成を示すブロック図 本発明の一実施の形態に係るLPC係数適応フィルタを構成する適応フィルタの構成および動作を説明するための図 本発明の一実施の形態に係るステレオ音声符号化装置におけるステレオ音声符号化処理の手順の一例を示すフロー図 本発明の一実施の形態に係るステレオ音声復号装置の主要な構成を示すブロック図 本発明の一実施の形態に係るステレオ音声復号部の内部の主要な構成を示すブロック図 本発明の一実施の形態に係るステレオ音声復号装置におけるステレオ音声復号処理の手順の一例を示すフロー図 本発明の一実施の形態に係るステレオ音声符号化装置に入力されるステレオ音声信号の一例を示す図 本発明の一実施の形態に係るステレオ音声信号に対してLPC分析を行って得られるLPC係数を示す図 本発明の一実施の形態に係る直接LPC分析を行って生成されるLPC係数と、適応フィルタを用いて再構築される再構築LPC係数との比較を示す図

Claims (5)

  1. ステレオ音声を構成する第1チャネル信号および第2チャネル信号に対してそれぞれLPC分析を行い、第1チャネルLPC係数と第2チャネルLPC係数とを得るLPC分析手段と、
    前記第1チャネルLPC係数と、前記第2チャネルLPC係数との平均二乗誤差を最小化するLPC係数適応フィルタパラメータを求めるLPC係数適応フィルタと、
    前記第1チャネルLPC係数と前記第2チャネルLPC係数と前記LPC係数適応フィルタパラメータとを用いて、第2チャネルLPC係数関連情報を得る関連情報決定手段と、
    を具備するステレオ音声符号化装置。
  2. 前記関連情報決定手段は、
    前記第1チャネルLPC係数を、前記LPC係数適応フィルタパラメータによってフィルタリングし、第2チャネル再構築LPC係数を得るLPC係数再構築手段と、
    前記第2チャネル再構築LPC係数の安定性を示す値を算出し、前記第2チャネル再構築LPC係数の安定性を示す値を用いて、前記LPC係数適応フィルタパラメータを前記第2チャネルLPC係数関連情報とするか、あるいは、前記第2チャネルLPC係数を前記第2チャネルLPC係数関連情報とするか、を選択する選択手段と、
    を具備する請求項1記載のステレオ音声符号化装置。
  3. 前記選択手段は、
    前記第2チャネル再構築LPC係数を用いて、式(1)
    Figure 2008016098
    に示す多項式のz領域におけるルートを、前記第2チャネル再構築LPC係数の安定性を示す値として算出し、
    前記ルートの最大絶対値が1以下である場合、前記第2チャネルLPC係数関連情報として前記LPC係数適応フィルタパラメータを選択し、前記ルートの最大絶対値が1より大きい場合、前記第2チャネルLPC係数関連情報として前記第2チャネルLPC係数を選択する、
    請求項2記載のステレオ音声符号化装置。
  4. 受信したビットストリームから、符号化装置においてステレオ音声を構成する第1チャネル信号および第2チャネル信号を用いて生成された、第1チャネルLPC係数と、第2チャネルLPC係数関連情報とを得る分離手段と、
    前記第2チャネルLPC係数関連情報がLPC係数適応フィルタパラメータであるか第2チャネルLPC係数であるかを判別し、前記第2チャネルLPC係数関連情報が前記LPC係数適応フィルタパラメータである場合には、前記LPC係数適応フィルタパラメータを用いて、前記第1チャネルLPC係数をフィルタリングし、得られる第2チャネル再構築LPC係数を出力し、前記第2チャネルLPC係数関連情報が前記第2チャネルLPC係数である場合には、前記第2チャネルLPC係数を出力する第2チャネルLPC係数決定手段と、
    を具備するステレオ音声復号装置。
  5. ステレオ音声を構成する第1チャネル信号および第2チャネル信号に対してそれぞれLPC分析を行い、第1チャネルLPC係数と、第2チャネルLPC係数とを得るステップと、
    前記第1チャネルLPC係数と、前記第2チャネルLPC係数との平均二乗誤差を最小化するLPC係数適応フィルタパラメータを求めるステップと、
    前記第1チャネルLPC係数と前記第2チャネルLPC係数と前記LPC係数適応フィルタパラメータとを用いて、第2チャネルLPC係数関連情報を得るステップと、
    を具備するステレオ音声符号化方法。
JP2008527783A 2006-08-04 2007-08-02 ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法 Withdrawn JPWO2008016098A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006213963 2006-08-04
JP2006213963 2006-08-04
PCT/JP2007/065133 WO2008016098A1 (fr) 2006-08-04 2007-08-02 dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci

Publications (1)

Publication Number Publication Date
JPWO2008016098A1 true JPWO2008016098A1 (ja) 2009-12-24

Family

ID=38997272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008527783A Withdrawn JPWO2008016098A1 (ja) 2006-08-04 2007-08-02 ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法

Country Status (3)

Country Link
US (1) US20100010811A1 (ja)
JP (1) JPWO2008016098A1 (ja)
WO (1) WO2008016098A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100372A1 (en) * 2007-01-26 2010-04-22 Panasonic Corporation Stereo encoding device, stereo decoding device, and their method
JP5153791B2 (ja) * 2007-12-28 2013-02-27 パナソニック株式会社 ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
WO2009116280A1 (ja) * 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
US7961415B1 (en) * 2010-01-28 2011-06-14 Quantum Corporation Master calibration channel for a multichannel tape drive
CN115132214A (zh) 2018-06-29 2022-09-30 华为技术有限公司 立体声信号的编码、解码方法、编码装置和解码装置
CN113571073A (zh) 2020-04-28 2021-10-29 华为技术有限公司 一种线性预测编码参数的编码方法和编码装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6356211B1 (en) * 1997-05-13 2002-03-12 Sony Corporation Encoding method and apparatus and recording medium
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
JP3598993B2 (ja) * 2001-05-18 2004-12-08 ソニー株式会社 符号化装置及び方法
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
SE527713C2 (sv) * 2003-12-19 2006-05-23 Ericsson Telefon Ab L M Kodning av polyfoniska signaler med villkorsbegränsade filter
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
ATE545131T1 (de) * 2004-12-27 2012-02-15 Panasonic Corp Tonkodierungsvorrichtung und tonkodierungsmethode
KR20070090219A (ko) * 2004-12-28 2007-09-05 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP4842147B2 (ja) * 2004-12-28 2011-12-21 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法

Also Published As

Publication number Publication date
US20100010811A1 (en) 2010-01-14
WO2008016098A1 (fr) 2008-02-07

Similar Documents

Publication Publication Date Title
JP4999846B2 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
US8457319B2 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
JP5413839B2 (ja) 符号化装置および復号装置
JP4934020B2 (ja) 可逆マルチチャネル・オーディオ・コーデック
JP5153791B2 (ja) ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
JPWO2007116809A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP4997098B2 (ja) スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール
JPWO2008016098A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
WO2006129615A1 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
WO2009122757A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
WO2008066071A1 (en) Decoding apparatus and audio decoding method
WO2006011445A1 (ja) 信号復号化装置
JPWO2008132826A1 (ja) ステレオ音声符号化装置およびステレオ音声符号化方法
JPWO2008090970A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
US7346503B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP5340378B2 (ja) チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
JP5574498B2 (ja) 符号化装置、復号装置、およびこれらの方法
JP2009134187A (ja) 符号化装置、復号装置、およびこれらの方法
KR19990053837A (ko) 오디오 신호의 에러 은닉 방법과 그 장치
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法
JP5722916B2 (ja) 符号化装置および符号化方法
JP2006345289A (ja) 中継装置および端末装置
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100324

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20120210