JP2008542807A - マルチチャネル信号の予測符号化 - Google Patents

マルチチャネル信号の予測符号化 Download PDF

Info

Publication number
JP2008542807A
JP2008542807A JP2008512964A JP2008512964A JP2008542807A JP 2008542807 A JP2008542807 A JP 2008542807A JP 2008512964 A JP2008512964 A JP 2008512964A JP 2008512964 A JP2008512964 A JP 2008512964A JP 2008542807 A JP2008542807 A JP 2008542807A
Authority
JP
Japan
Prior art keywords
matrix
reflection matrix
reflection
data
channel signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008512964A
Other languages
English (en)
Inventor
ブリンケル,アルベルテュス セー デン
ビスワス,アリジット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008542807A publication Critical patent/JP2008542807A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

マルチチャネル符号化器(100)は、マルチチャネル信号の線形予測符号化のマルチチャネル線形予測解析器(105)を備える。予測コントローラ(101)は、マルチチャネル信号の線形予測符号化パラメータ行列を生成する予測パラメータ生成器(301)を備える。前述の線形予測符号化パラメータ行列は次いで、反射行列に写像される。反射行列は特に、正規化された後方反射行列又は前方反射行列であり得る。反射行列は、反射パラメータ符号器(305)によって符号化され、他の符号化データと多重化器(109)において合成して、マルチチャネル信号の符号化データを生成する。反射パラメータ符号器(305)は特に、固有値分解又は特異値分解を用いて反射行列を分解することができ、結果として生じるデータは、伝送のために量子化することができる。復号化器(200)は、符号化データを受信し、逆演算を行うことによって予測パラメータを得る。

Description

本発明は、マルチチャネル信号の符号化及び/又は復号化に関し、特に、線形予測符号化を用いた符号化に関する。
種々のソース信号のディジタル符号化は、この数十年間に、アナログの表現及び通信がディジタル信号の表現及び通信によって次第に置き換えられるにつれて一層重要になってきている。例えば、GSM(ジーエスエム)などの移動体電話システムは、ディジタル音声符号化に基づいている。又、ビデオや音楽などのメディア・コンテンツの配信は一層、ディジタル・コンテンツ符号化に基づくようになってきている。
コンテンツ符号化において、かつ、特に、オーディオ及び音声の符号化において、線形予測符号化は、低データ・レートに対して高品質を提供するために、手段として用いられることが多い。線形予測符号化は従来、個々の信号に施されているが、マルチチャネル信号(例えば、ステレオ・オーディオ信号など)にも適用可能である。
単一チャネルの線形予測符号化は、信号における冗長性を削減し、これを予測パラメータに捕捉することによって、実効データ・レートを達成する。予測パラメータは符号化信号に含められ、冗長性が復号化器において線形予測合成フィルタによって回復される。
線形予測符号化システムの性能に重要なパラメータは、通信された予測パラメータの精度である。特に、特定の品質レベルに対する実効データ・レートを達成するために、予測パラメータは、効率的に符号化されなければならない。これは一般に、パラメータの量子化を含む。しかし、システムの性能は、この符号化及び量子化に対する感度が非常に高い。
単一チャネル信号の予測パラメータの量子化及び伝送のいくつかの手法が知られている。予測パラメータは個々に量子化されない。線形予測フィルタの個々の係数の量子化誤差はフィルタの応答をかなり変えることがあり得る。わずかな量子化誤差によっても、合成フィルタが不安定になってしまうこともあり得る。よって、前述のパラメータ量子化は符号化品質に影響をかなり与え得るものであり、関連した予測フィルタの周波数応答に対してもたらされる影響はわずかである。
その代わり、単一チャネル信号の予測パラメータは通常、伝達関数のコントロールを維持し、かつ/又は、量子化器の影響を最小にするために、反射係数、そのアークサイン表現、対数面積比(LAR)又は線スペクトル周波数(LSF)に写像される。更なる詳細は例えば、B. Kleijn及びK.K.Paliwalによって編集された、「Speech coding and synthesis(Elsevier, Amsterdam, 1995, Chapter 12, page 442−450)」と題する教科書で見つけることができる。
マルチチャネル信号の場合、線形予測は、符号化及び復号化にも用いることができる。これによって、マルチチャネル予測パラメータによって規定されるマルチチャネル解析及び合成システムがもたらされる。前述のマルチチャネル信号は例えば、ステレオ・オーディオ・データ及びマルチチャネル・オーディオ・データに生起するが、画像の別々の行でもあり得る。
解析システムの個々の伝達の次数が等しく、最適化が、入力データ・ウィンドウイングを用いて行われた場合、合成システムの安定性を保証することが可能であることが知られている。
しかし、マルチチャネル信号の予測パラメータを生成することが知られているが、これを効果的に符号化し、伝送する方法は知られていない。
マルチチャネル予測パラメータの符号化、及び、特に、量子化には、いくつかの課題が関係している。
特に、単一チャネルの場合と同様に、パラメータの直接の量子化によって可能になる、伝達特性に対するコントロールはわずかである。例えば、予測行列の行列式(重要な行列特性である)は前述の手法において容易に激変し得る。
更に、単一チャネルの場合について知られている量子化ストラテジ(アークサイン表現やLAR表現など)は、個々のスカラー値に関係し、マルチチャネルの場合の予測パラメータ行列に直接、施すことが可能でない。
別の課題はマルチチャネル・システムの場合、前方予測システム及び後方予測システムは、更なる知識なしでは、互いから直接構成することが可能でない。
よって、現在、マルチチャネル予測行列の符号化及び量子化について知られている効率的な手法はない。よって、マルチチャネル符号化/復号化の手法の改良は効果的であり、特に、柔軟性の増大、計算量の低減、実現形態の容易化、マルチチャネル予測パラメータの符号化/復号化の効率化、データ・レートの低減、品質の向上、及び/又は性能の向上は効果的になる。
よって、本発明は、好ましくは、上記欠点の1つ又は複数を単独で、又は何れかの組み合わせで緩和、軽減又は解消しようとするものである。
本発明の第1の局面によれば、マルチチャネル信号の線形予測符号化パラメータ行列を判定する手段と、線形予測符号化パラメータ行列から反射行列を生成する手段と、反射行列を符号化して、符号化された反射行列データを生成する符号化手段と、反射行列データを備える、マルチチャネル信号の符号化データを生成する手段とを備える、マルチチャネル信号を符号化する符号化器を提供する。
本発明は、マルチチャネル信号の符号化の改良を可能にし得る。符号化(及び復号化)処理の改良された品質及び/又は効率的なデータ・レートを達成することができる。品質対データ・レート比が高い、符号化信号の効率的な送信を達成することができる。
特に、予測データの改良された符号化を達成することができる。特に、符号化された反射行列を用いた、マルチチャネル信号の予測データの伝送は、信号の高性能符号化を可能にし得る。特に、符号化はパラメータの量子化を含み得るものであり、量子化誤差の影響は、反射行列の符号化によって軽減及び/又は制御することができる。
反射行列は、前方及び/又は後方反射行列であり得る。マルチチャネル信号は例えば、ステレオ若しくはサラウンド・サウンド・オーディオ信号であり得るか、又は、例えば、画像の別々の行であり得る。
本発明の任意的な特徴によれば、反射行列は、正規化された反射行列である。
これは、改良された性能を可能にし得るものであり、特に、符号化品質対データ・レート比の向上をもたらす符号化を可能にし得る。
本発明の任意的な特徴によれば、正規化された反射行列は、正規化された前方反射行列又は正規化された後方反射行列であり、符号化されたデータは、正規化された前方反射行列及び正規化された後方反射行列のパラメータをリンク付けする相関データを更に備える。
パラメータをリンク付けし得る相関データは例えば、正規化された前方反射行列及び後方反射行列と関連付けられた共分散行列である。パラメータをリンク付けする相関データは、正規化された反射行列から前方反射行列及び後方反射行列を再構成することができ得る。
これは、改良された性能を可能にし得るものであり、特に、符号化品質対データ・レート比の改良をもたらす符号化を可能にし得る。正規化された前方反射行列及び正規化された後方反射行列の一方のデータのみを含めればよいからである。
本発明の任意的な特徴によれば、符号化手段は、反射行列を分解して、分解された反射行列を生成し、分解された反射行列を符号化して、符号化された反射行列データを生成する手段を備える。
この特徴は、改良された符号化及び/又は実用的な実現形態を可能にし得る。予測データのより効率的な符号化を、行列分解の結果から達成することができる。多くの場合、同様な特性を、従来の単一チャネル予測データと同様に分解行列データについて達成することができ、同様な符号化及び特定の量子化手法を用いることができる。よって、改良された後方互換性を多くの場合に達成することができる。
本発明の任意的な特徴によれば、符号化手段は、分解された反射行列から特性多項式を求めるよう構成され、分解された反射行列の符号化は、特性多項式の符号化係数を備える。
本発明の任意的な特徴によれば、分解は、固有値分解である。
固有値分解は、特に効果的な性能をもたらすことができる。例えば、特に、符号化に適しており、かつ、特に量子化に適しているデータを生成することができ、それによって、高い品質対データ・レート比が可能になる。あるいは、又は更に、上記特徴は、実用的な実現形態を可能にし得る。
本発明の任意的な特徴によれば、符号化された反射行列データは、固有値データ及び固有ベクトル・データを有する群の少なくとも1つ又は複数の量子化データを備える。
固有値及び固有ベクトル・データは、予測データの符号化に特に効果的なデータをもたらし得る。固有ベクトル・データは例えば、固有ベクトルの角表示を含み得る。
本発明の任意的な特徴によれば、符号化手段は、少なくとも1つの固有値に応じて量子化特性を修正するよう動作可能である。
これは、性能を改良させることができ、マルチチャネル信号の現在の特性に対する符号化の動的な最適化を可能にし得る。
本発明の任意的な特徴によれば、分解は、特異値分解(SVD)である。
特異値分解は、特に効果的な性能をもたらし得る。例えば、特に、符号化に適しており、かつ、特に量子化に適しているデータを生成することができ、それによって、高い品質対データ・レート性能が可能になる。あるいは、又は更に、上記特徴は、実用的な実現形態を可能にし得る。
本発明の任意的な特徴によれば、符号化された反射行列データは、少なくとも1つの特異値の量子化データを備える。
特異値データは、予測データの符号化に特に効果的なデータをもたらし得る。
本発明の任意的な特徴によれば、符号化手段は、少なくとも1つの特異値に応じて量子化特性を修正するよう動作可能である。
これは、性能を改良させることができ、マルチチャネル信号の現在の特性に対する符号化の動的な最適化を可能にし得る。
本発明の任意的な特徴によれば、符号化手段は、分解された反射行列のパラメータの量子化によって、符号化された反射行列データを生成する手段を備える。
改良された性能を達成することができ、かつ/又は実現形態を容易にすることができる。量子化は、非線形写像及び/又は一様でない量子化を備え得る。特に、多くの実施例では、本発明は、通常の単一チャネル信号に施されるものと同様な量子化手法(対数面積比(LAR)やアークサイン表現など)を可能にし得る。
本発明の第2の局面によれば、マルチチャネル信号の符号化データを受信する手段であって、符号化データが、マルチチャネル信号の反射行列の符号化反射行列データを備える手段と、反射行列データを復号化することによって反射行列を判定する手段と、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から判定する手段と、線形予測符号化パラメータに基づいた線形予測復号化によってマルチチャネル信号を生成する手段とを備える、マルチチャネル信号を復号化する復号化器を提供する。
本発明は、マルチチャネル信号の復号化の改良を可能にし得る。符号化及び復号化処理の改良された品質及び/又は効率的なデータ・レートを達成することができる。品質対データ・レート比が高い、符号化信号の効率的な送信及び受信を達成することができる。
本発明の第3の局面によれば、マルチチャネル信号の線形予測符号化パラメータ行列を判定する工程と、線形予測符号化パラメータ行列から反射行列を生成する工程と、反射行列を符号化して、符号化された反射行列データを生成する工程と、反射行列データを備える、マルチチャネル信号の符号化データを生成する工程とを備える、マルチチャネル信号を符号化する方法を提供する。
本発明の第4の局面によれば、マルチチャネル信号の符号化データを受信する工程であって、符号化データが、マルチチャネル信号の反射行列の符号化反射行列データを備える工程と、反射行列データを復号化することによって反射行列を判定する工程と、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から判定する工程と、線形予測符号化パラメータに基づいた線形予測復号化によってマルチチャネル信号を生成する工程とを備える、マルチチャネル信号を復号化する方法を提供する。
本発明の第5の局面によれば、マルチチャネル信号の線形予測符号化パラメータ行列に関連した反射行列の符号化反射行列データを備える符号化マルチチャネル信号を提供する。
本発明の第6の局面によれば、マルチチャネル信号の符号化及び/又は復号化の方法を実行するコンピュータ・プログラム・プロダクトを提供する。
本発明の第7の局面によれば、マルチチャネル信号の線形予測符号化パラメータ行列を判定する手段と、線形予測符号化パラメータ行列から反射行列を生成する手段と、反射行列を符号化して、符号化された反射行列データを生成する符号化手段と、反射行列データを備える、マルチチャネル信号の符号化データを生成する手段と、符号化データを送信する手段とを備える、マルチチャネル信号を送信する送信器を提供する。
本発明の第8の局面によれば、マルチチャネル信号の符号化データを受信する手段であって、符号化データが、マルチチャネル信号の反射行列の符号化反射行列データを備える手段と、反射行列データを復号化することによって反射行列を判定する手段と、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から判定する手段と、線形予測符号化パラメータに基づいた線形予測復号化によってマルチチャネル信号を生成する手段とを備える、マルチチャネル信号を受信する受信器を提供する。
本発明の第9の局面によれば、マルチチャネル信号の線形予測符号化パラメータ行列を判定する手段と、線形予測符号化パラメータ行列から反射行列を生成する手段と、反射行列を符号化して、符号化された反射行列データを生成する符号化手段と、反射行列データを備える、マルチチャネル信号の符号化データを生成する手段と、符号化データを送信する手段とを備える送信器、及び、符号化データを受信する手段と、反射行列データを復号化することによって反射行列を判定する手段と、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から判定する手段と、線形予測符号化パラメータに基づいた線形予測復号化によってマルチチャネル信号を生成する手段とを備える、マルチチャネル信号を受信する受信器を備える、マルチチャネル信号を伝送する伝送システムを提供する。
本発明の第10の局面によれば、マルチチャネル信号の線形予測符号化を判定する工程と、線形予測符号化パラメータ行列から反射行列を生成する工程と、反射行列を符号化して、符号化反射行列データを生成する工程と、反射行列データを備える、マルチチャネル信号の符号化データを生成する工程と、符号化データを送信する工程とを備える、マルチチャネル信号を送信する方法を提供する。
本発明の第11の局面によれば、マルチチャネル信号の符号化データを受信する方法であって、符号化データが、マルチチャネル信号の反射行列の符号化反射行列データを備える工程と、反射行列データを復号化することによって反射行列を判定する工程と、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から判定する工程と、線形予測符号化パラメータに基づいた線形予測復号化によってマルチチャネル信号を生成する工程とを備える、マルチチャネル信号を受信する方法を提供する。
本発明の第12の局面によれば、マルチチャネル信号の線形予測符号化パラメータ行列を判定する工程と、線形予測符号化パラメータ行列から反射行列を生成する工程と、反射行列を符号化して、符号化反射行列データを生成する工程と、反射行列データを備える、マルチチャネル信号の符号化データを生成する工程と、符号化データを送信する工程と、マルチチャネル信号の符号化データを受信する工程と、反射行列データを復号化することによって反射行列を判定する工程と、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から判定する工程と、線形予測符号化パラメータに基づいた線形予測復号化によってマルチチャネル信号を生成する工程とを備える、マルチチャネル信号を送信し、受信する方法を提供する。
本発明の第13の局面によれば、前述の符号化器を備えるオーディオ記録装置を提供する。
本発明の第14の局面によれば、前述の復号化器を備えるオーディオ再生装置を提供する。
本発明の第15の局面によれば、マルチチャネル信号の符号化データを備えた符号化マルチチャネル信号を提供する。符号化データはマルチチャネル信号の反射行列の符号化反射行列データを備え、反射行列は、マルチチャネル信号に基づいた線形予測符号化の線形予測符号化パラメータ行列に対応する。
本発明の第16の局面によれば、前述の信号を記憶させた記憶媒体を提供する。
本発明の前述並びにその他の局面、特徴及び利点は、以下に記載する実施例から明らかであり、そうした実施例を参照しながら明らかになるであろう。
本発明の実施例は、添付図面を参照して、例としてのみ説明する。
以下の説明は、ステレオ・オーディオ信号の符号化及び復号化にあてはまる、本発明の実施例に焦点を当てる。しかし、本発明は、この出願に限定されないが、多くの他のマルチチャネル信号に適用することができる。
図1は、本発明の特定の実施例による、ステレオ・オーディオ信号の符号化器を示す。符号化器100は、x及びxによって表すディジタル化された(サンプリングされた)左及び右のオーディオ信号を受信する。明確かつ簡潔にするために、x及びxは実数値のみを含むものとするが、特定の実施例では、値は複素であり得る。
符号化器は、サンプリングされた入力信号x、xを個々のフレームにおいて処理する。よって、入力信号x、xは、特定のサイズ(例えば、20msecの間隔に対応する)のいくつかのサンプル・ブロックにセグメント化される。符号化器は次いで、個々のフレーム毎の予測データ及び残差信号の生成に進む。
ステレオ・サンプルx、xは、符号化及び復号化処理中に施される対象の、予測フィルタのパラメータを判定する予測コントローラ101に供給される。解析の結果を符号化して、結果として生じるデータbを生成する。このデータbは、パラメータ復号化器103に供給される。このパラメータ復号化器103は予測パラメータを符号化データbから再生成する。パラメータ復号化器103は特に、復号化器において施されるアルゴリズム及び規則と同じアルゴリズム及び規則を施し、それによって、符号化に用いる予測パラメータが、復号化に用いる予測パラメータと実質的に同じであることを確実にする。すなわち、予測コントローラ101によってもたらされる符号化誤差又は誤りは、符号化器及び復号化器の予測フィルタに同様に影響を及ぼす。
パラメータ復号化器103は、パラメータ復号化器103によって判定されるパラメータを用いて線形予測フィルタを実現する線形予測解析器105に結合される。線形予測解析器105は更に、入力信号サンプルx及びxを受信し、予測値と実際入力サンプルとの間の誤差信号y及びyを求める。
誤差信号y及びyは符号化装置107に供給される。符号化装置107は、信号y及びyを符号化し、量子化し、対応するビットストリームb及びbを生成する。更に、符号化装置107は、例えば、サンプル・レート、量子化特性等を含む種々の符号化又は信号特性を示す更なるデータbを生成することができる。
符号化装置107及び予測コントローラ101は多重化器109に結合される。多重化器109は、符号化器によって生成されたデータを合成された符号化信号bに合成する。特に、符号化データb、b、b及びbは、単一のビットストリームに合成することができる。
特に、線形予測解析器105は、
Figure 2008542807
によって表す誤差サンプルを生成することができる。
ここで、Nは予測次数(すなわち、予測に考慮される過去のマルチチャネル入力サンプルの数)である。予測行列A(k=1,…,N)は、
Figure 2008542807
によって表す。
z領域では、これは
Figure 2008542807
をもたらす。ここで、X(z)、X(z)、Y(z)及びY(z)は、x、x、y及びyそれぞれのz変換である。
式(4)及び(5)の遅延演算子z−1を全通過フィルタ
Figure 2008542807
に変えることによって、別の線形予測システムを達成することが可能である。
Figure 2008542807
ここで、|λ|<1である。これは、マルチチャネルの歪んだ線形予測(WLP)システムに対応する。更に、ラゲールベースの線形予測システムをWLPシステムに写像することが可能である。よって、提案された概念及び手法を、前述のシステムにおける予測行列に同様に施すことが可能である。
図2は、本発明の特定の実施例による、ステレオ・オーディオ信号の復号化器200を示す。
復号化器200は、ビットストリームbを復号化器100から受信する逆多重化器201を備える。逆多重化器201は次いで、別々のビットストリームb、b、b及びbにビットストリームbを分離する。
復号化器200は、ビットストリームb、b及びbが供給される逆符号化装置203を更に備える。逆符号化装置203は次いで、y及びyそれぞれの再構成である誤差信号y’及びy’を生成する。
復号化器200は、予測パラメータ・プロセッサ207を更に備える。予測パラメータ・プロセッサ207にはビットストリームbが供給され、そこから、予測パラメータが判定される。特に、予測パラメータ・プロセッサ207は好ましくは、符号化器100に用いる手法と実質的に同様にマルチチャネル信号を再構成するために用いる線形予測フィルタのフィルタ係数を判定する。
予測パラメータ・プロセッサ207及び逆符号化装置203は線形予測合成器205に結合される。線形予測合成器205は、予測パラメータ並びに誤差信号y’及びy’に基づいて、マルチチャネル信号をx’及びx’として再構成する。
図1及び図2の例では、符号化信号の予測パラメータは、マルチチャネル信号の線形予測符号化パラメータ行列に関連した反射行列の符号化反射行列データによって表される。
特に、予測コントローラ101は、予測行列Aを判定し、これを反射行列に写像することができる。反射行列を次いで、符号化予測データbに用いることができる。同様に、予測パラメータ・プロセッサ207は、受信ビットストリームbmから反射行列を判定することができ、次いで、反射行列を予測行列A’に変換することができる。反射行列は予測コントローラ101によって符号化され、反射行列の利用は、単位チャネルの場合の反射係数から分かる効果的なパラメータ特性の多くを維持することができる非常に効率的な符号化を可能にする。
図3は、図1の予測コントローラ101を更に詳細に示す。予測コントローラ101は、マルチチャネル信号の線形予測符号化パラメータ行列を生成する予測パラメータ生成器301を備える。特に、予測パラメータ生成器301は、ステレオ入力サンプルx、xを受信し、予測行列Aを生成する。
予測行列Aを判定する何れかの適切な方法を、本発明から逸脱することなく用いることができる。例えば、予測行列を、正規方程式を伴う、最小二乗による最適化の問題の解として求めることができる。入力データ・ウィンドウイング(自己相関法)の場合に正規方程式を解く効率的な手法は、P. Delsarte及びY.V.Geninによる「Multichannel singular predictor polynomials (IEEE Trans. Circuits Systems, Vol. 35, 1988, page 190−200)に開示されているようなブロック−レビンソン・アルゴリズムによって表される。
予測パラメータ生成器301は、線形予測符号化パラメータ行列から反射行列を生成する反射行列生成器303に結合される。ブロック−レビンソン・アルゴリズムが用いられる場合、予測パラメータ生成器301及び反射行列生成器303は通常、単一の機能ユニットに効果的に組み合わせられる。
単一のチャネル信号の場合、いくつかの反射係数によって、線形予測符号化に用いる予測フィルタを特徴付けることが知られている。音声信号では、予測フィルタは、種々の直径の管によって声動をエミュレートする物理モデルに基づく。各不連続点において、反射係数は、信号の一部分が前に送られる一方で別の部分が反射させられることを示し得る。
単一のチャネル信号の場合、反射係数モデルを用いることによっていくつかの利点を達成することができる。特に、反射係数の効率的な符号化を、例えば、アークサイン又はLAR(対数面積比)表現などの非線形写像を用いることによって達成することが可能である。
しかし、マルチチャネル信号の場合、予測パラメータの符号化(量子化を含む)を行う効率的なやり方は知られていない。反射係数に基づいた単純モデルの利用は実現可能でない。マルチチャネル・システムは、単純な係数によって高精度で表すことが可能でないからである。更に、予測行列値の量子化は、わずかな量子化誤差に対しても、周波数領域におけるかなりの歪みにつながり、非安定な合成フィルタにもつながり得る。
図1の符号化器100では、反射行列生成器303は、反射行列を生成する。特に、マルチチャネル信号の場合、同様な物理モデルを、単一チャネル符号化器と同様に用いることができるが、別々の信号が管の非連続点において相互作用し得るので、反射係数が反射行列によって置き換えられる。
よって、単一チャネルの場合の反射係数は反射行列に変えられる。しかし、この場合に反射係数が反射行列になったことは、反射係数の量子化ストラテジを直接用いることが不適切であることをもたらし得る。特に、アークサイン又はLARの表現を直接用いることは、望ましくない性能をもたらし得る。システムの特性及び性能の感度が、単純な反射係数の量子化誤差よりも、行列成分の量子化誤差に対して高いからである。
図1の符号器では、反射行列生成器303は反射パラメータ符号器305に結合される。反射パラメータ符号器305は、反射行列を符号して、符号化反射行列データを生成し、よってビットストリームbを生成する。反射パラメータ符号化器305は、多重化器109に結合される。多重化器109は、符号化装置107からのビットストリームb、b及びbとビットストリームbを多重化することによって、マルチチャネル信号の符号化データbを生成する。よって、符号化信号では、符号化及び復号化に用いる予測パラメータは、反射行列パラメータを示すデータによって表す。
図1の実施例では、反射行列は、直接生成される前方反射行列及び後方反射行列であり得る。特に、マルチチャネル・システムの場合、前方予測システム及び後方予測システムは、更なる知識なしでは、互いから直接構成することが可能でない。よって、復号化器が予測パラメータを反射行列から再構成することを可能にするために、前方反射行列及び後方反射行列を伝送することが可能である。
しかし、データ・レートを削減し、符号化効率を向上させるために、前方反射行列及び後方反射行列を、例えば、反射行列生成器303又は反射パラメータ符号器305によって、正規化された反射行列に写像することができる。前述の実施例では、反射パラメータ符号器305によって符号化され、ビットストリームbに含まれる反射行列は、前方反射行列及び後方反射行列の一方のみであり得る。更に、後方反射行列から前方反射行列を求め、その逆を行うことを可能にする更なる共分散行列を求めることができる。
特に、この1つの更なる共分散行列からの情報によって、正規化された反射行列を前方反射行列及び後方反射行列に変換することができる。
エントリri,j(i,j=1,2)を有する共分散行列Rは、入力信号から
Figure 2008542807
によって求めることができる。前方/後方行列、正規化された反射行列及び共分散行列間の関係は、P. Delsarte及びY.V.Geninによる「Multichannel singular predictor polynomial (IEEE Trans. Circuits Systems、 Vol. 35, 1988, page 190−200)」に開示されている。
よって、図1のシステムでは、符号化信号は、反射行列に基づいた、予測パラメータのデータを有する。特に、前方反射行列及び後方反射行列よりも、正規化された反射行列を共分散行列とともに用いることを提唱する。これは、符号化信号のデータ・レートを削減することができるからである。
特に、予測行列A(k=1,…,N)は、前方反射行列及び後方反射行列Γ及びΓ’それぞれに写像することができる。この写像は可逆であるが、この写像によって事実上、行列数が2倍になる。
好ましくは、予測行列Aは、正規化された前方反射行列E及び後方反射行列E’それぞれに写像される。EとE’との間の関係は、E =E’によって表される。ここで、「
は転置を表す。前述の単純な関係は、ΓとΓ’との関係の場合、存在せず、特に、{A}→{E}の写像を可逆にするよう施すことが可能である共分散行列Rを求めることができることを可能にする。この行列Rは、入力信号(又はそのスケーリングされたバージョン)の交差相関行列を含む。よって、正規化された反射行列(E又はE’)の一方、及びRを用いて、前方反射行列及び後方反射行列の伝送に必要になる2Nの代わりに伝送することが必要なN+1行列が生成される。
更に、正規化された反射行列は、効果的な特性を有する。予測パラメータが入力データ・ウィンドウイング(自己相関法としても知られている)を用いて導き出された場合、正規化された反射行列は、縮小行列(固有値及び特異値の絶対値は1未満である)であり、よって、関連した線形予測合成フィルタは安定であることが保証される。
図4は、図2の予測パラメータ・プロセッサ207を更に詳細に示す。予測パラメータ・プロセッサ207は、符号化反射行列データbを逆多重化器201から受信する受信エレメント401を備える。受信エレメント401は、反射行列再生成器403に結合される。反射行列再生成器403は、反射行列データを復号化することによって反射行列を求める。例えば、反射パラメータ符号器305による符号化が、一様でない量子化を含む場合、反射行列再生成器403は、一様でない逆関数を受信パラメータ値に施す。
反射行列再生成器403は更に、予測パラメータ再生成器405に結合される。予測パラメータ再生成器405は、マルチチャネル信号の線形予測符号化パラメータ行列を反射行列から求める。特に、予測パラメータ再生成器405は、正規化された反射行列(E又はE’)及び共分散行列Rから予測パラメータAを生成することができる。
予測パラメータ再生成器405は線形予測合成器205に結合される。線形予測合成器205には、再生成された予測パラメータA’kが供給される。線形予測合成器205は次いで、信号y’及びy’を処理するマルチチャネル線形予測合成フィルタにおいて予測パラメータA’を施すことによってマルチチャネル信号を再生成する。
特定の実施例では、反射行列を分解して、分解された反射行列を生成することができ、符号化された反射行列データは、符号化によって生成することができ、特に、分解された反射行列のパラメータを量子化することによって生成することができる。よって、特に、反射パラメータ符号器305(又は、同様に、反射行列生成器303)は特に、正規化された前方及び/又は後方反射行列を分解することによって分解反射行列を生成することができる。同様に、反射行列再生成器403は、分解の逆演算を行うことによって、正規化された前方反射行列及び/又は後方反射行列を生成することができる。
例では、反射行列を分解して、行列の主要な特徴付けを事実上維持する構造をもたらす。特に、固有値分解(EVD)及び/又は特異値分解(SVD)を用いることができる。
この手法の利点は、単一チャネル信号に用いる反射係数の多くの特性と概して同様な特性を固有値及び特異値が有することである。特に、量子化の影響は同様であり、よって、単一チャネル反射係数に用いるものと非常に類似した量子化処理を反射パラメータ符号化器305によって用いることができる。更に、前述の分解から生じる更なる情報(特に、EVDの固有値及びSVDのユニタリ行列)を効率的に量子化することが可能である。固有値又は特異値に応じて量子化精度を適合させた場合、特に効果的な性能を達成することができる。
以下では、反射行列の固有値分解が施される特定例について説明する。
固有値分解の場合、
=WEW−1 (7)
の式を用いることができる。
ここで、Wは、(適切に正規化された)固有ベクトルを有する行列であり、Eは、その対角線上に固有値(e及びe)を含み、2つの固有値が同一でないものとする対角行列である。Eの行列式は、行列式Eに等しい。固有値の特性は、単一チャネル信号の反射係数のものと同様である。しかし、実行列Eの場合、固有値は実数であり得るものであり、又は、複素共役対とし存在し得る。何れの場合にも、固有値の絶対値は1未満である。
実固有値の場合、単一チャネル信号の反射係数と同様に扱うことが可能であり、特に、範囲(−1,1)における一様でない量子化(アークサイン又はLARへの写像、及び前述の領域における一様な量子化を含む)を用いることができる。複素固有値の場合、種々のストラテジを用いることが可能である。例えば、実固有値と同様に半径を取得し、写像することができ、半径に依存する精度で、複素数の角度を判定し、量子化することができる。この場合、ビットストリームbは、値が実数か又は複素数かを示し得る。
他の実施例では、2つの固有値(複素共役固有値又は実固有値)を用いて、実二次多項式P(行列Eのいわゆる特性多項式)を生成する。この二次多項式のデータに対して次いで、反射係数への写像(を行い、アークサイン又はLAR表現を用いること)を行うか、又はLSFに写像し、次いで量子化を行うことによって伝送することができる。
固有ベクトルの場合、2つのケースを更に区別することができる。固有値が実であり、同一でない場合、2つの実固有ベクトルがWに存在する。Wは、2つの角度によって表すことが可能である。
Figure 2008542807
SVDの表現に対するここでの利点は、各固有値が固有ベクトルに結合されるので、角度の量子化の精度を、関連した固有値から直接求めることが可能であることである。あるいは、行列Wは、
W=W (9)
として表すことができ、Wは、
Figure 2008542807
による直交行列であり、Wは、
Figure 2008542807
によって表す。
ここで、一般性を失うことなく、0<|δ|<π/2である。α、βと、γ、δとの関係は座標の変換である。角度γは、事実上、αとβとの間の中間点である。角度δの2倍が、角度αと角度βとの間の差である。パラメータγにおけるばらつきは、システム全体の回転に等しいので、このパラメータは一様に量子化することが可能である。行列Wの考えられる不良条件は全て、Wにある。Wは行列式として−sin(2δ)を有する。したがって、δを量子化することは、行列式における相対的なばらつきがおおよそ一定であるように行うことが可能である。
複素固有値の場合には、複素固有ベクトルは2つの角度によって表すことも可能であるが、前述の角度の解釈は、明らかに、実固有ベクトルの場合と異なる。効率的なデータ伝送には、前述の角度の精度は好ましくは、複素固有値に結合され、特にその半径に結合される。あるいは、行列Wは、
Figure 2008542807
によって(すなわち、半径r、r、及び一角度φ(0<|φ|<πによって)表すことが可能である。
固有ベクトルのスケーリングが可能になることによって、これは、
W=W (13)
として書き直すことが可能である。ここで、
Figure 2008542807
であり、c∈R+であり、s=±1であり、
Figure 2008542807
である。
の行列式は±1であり、Wの判定式は2jsin(2φ)に等しい。パラメータcは対数スケール上で一様に量子化することができる。角度φはパラメータδと同様に扱うことができる。
固有値が実であり、同一である場合、分解式7はあてはまらない。その代わりに、以下の分解を用いることができる。
Figure 2008542807
ここで、e=e=eは、固有値であり、Iは単位行列であり、αは、固有ベクトルに関連した角度であり、dは定数である。固有値は、前述のように、二次多項式(P)に写像し、反射係数まに写像し、アークサイン又はLAR領域において量子化することが可能である。角度αは効率的に、一様に量子化することが可能である。パラメータdは、単位行列Iと比較して、αによって規定される行列の重みを示す比である。パラメータdは、対数領域において量子化することが可能である。
復号化器では、固有ベクトルの受信パラメータを解釈しなければならない。この解釈は、固有値の特性に依存する。実固有値及び同一でない固有値、複素固有値、及び、同一の固有値に対して、異なるパラメータが存在するからである。よって、受信器は、施される量子化の関数として、固有値がその特性を変えることによる(例えば、複素固有値の虚数値がゼロに量子化され、それによって、複素量子化値ではなく、実量子化値がもたらされることによる)誤差が生じないことを確実にしなければならない。
これを解決するために種々のストラテジを用いることが可能である。1つのオプションとして、ビットストリームにおいて固有値の元の特性を指示することがある。この指示は、量子化によって変えられた場合に、固有値の性質を回復するために復号化器によって用いることができる。別のオプションには、量子化された固有値の特性(実、複素、同一)が変わらない状態に留まるように固有値の量子化を制御することがある。例えば、複素値の量子化は、ゼロ値を含まないことがあり得る。なお別のオプションとして、量子化によって固有値の特性が変わったかを(符号化器において)確認し、新たな特性に対応する適切なパラメータを選ぶことがある。
後者の手順の例には、以下のものがある。固有値の量子化平面において、複素共役対及び実固有値が同じ表現(例えば、LAR)に写像された場合、推定するところ、この表現に写像される、e=eである固有値対も存在している。おおよそ、この量子化タイルの場合、積eは実質的に一定である。パラメータγ、δ又はφ、cはよって、除外し、最良のパラメータd,αによって置き換えることができる。量子化ストラテジが復号化器において分かっているので、復号化器は、量子化された固有値対毎に、量子化ストラテジが固有特性を変えることが可能であったか否かが分かる。その場合、2つの固有値が、受信された固有値(すなわち、実及び同一)の幾何平均であり、固有ベクトル情報がd及びαであるとして(正しく)解釈される。
図5は、本発明の特定の実施例による、符号化器の考えられる処理工程の特定例を示す図である。明らかに、多くの変形が考えられる(例えば、LAR写像は、アークサイン写像によって置き換えることができる)。入力行列からの固有ベクトル・パラメータの生成は、前述のパラメータe及びeによって駆動される。前述の通り、量子化による前述の値の特性(実/複素)における考えられる混乱は、固有ベクトル・パラメータを生成する場合に考慮に入れられる。より簡潔には、これは、量子化された固有値の特性に基づいて行うことができる。これは、復号化器において実際に利用可能な情報であるからである。
復号化器は、逆の処理を実現する。これは、量子化パラメータを受信し、e及びeを再構成する。前述の値によって、受信器は、どの固有ベクトル・データがビットストリームに含まれているかが分かる(γ、δあるいはs、c、φあるいはα、d)。行列Eを次いで、構成することが可能である。
以下では、反射行列の特異値分解が施される特定例について説明する。
特異値分解の場合、
=USV (17)
の式を用いることができる。ここで、通常、U及びVはユニタリ行列であり、Sは特異値を含む対角行列である。
Figure 2008542807
ここで、σ≧0である。Eが実行列であれば、行列U、S及びVは全て実である。
便宜上、わずかに異なる定義を、前述の特定例において用いる。この例では、Sの対角要素は、負でない数に制限されないが、その代わり、ユニタリ行列U及びVは回転行列に制限される。Sの対角要素は、特異値としてなお表される。
安定線形予測合成フィルタの場合、|σ|<1である。
特異値の特性は反射係数の特性と同様であり、よって、単一チャネル信号の反射係数と同様に扱うことが可能であり、特に、範囲(−1,1)における一様でない量子化(アークサイン又はLARへの写像、及び、それに続く、前述の領域における一様な量子化を含む)を用いることができる。
特定例として、最大の特異値は、アークサイン表現、LAR表現、又はLSF表現において量子化し、伝送することができるが、特異値の絶対値間の比r(0<r<1)を量子化し、符号パラメータとともに伝送することができる。好ましくは、rは、対数スケールに写像され、次いで、一様に量子化される。別の代替策では、2つの特異値を反射係数として解釈する場合、標準的なやり方(アークサイン、LAR又はLSF)で量子化し、伝送することが可能な二次最小位相多項式を構成することが可能である。
行列U及びVは回転に対応し、そういうものとして、前述それぞれは単一のパラメータ(すなわち、回転角)に結合される。前述の角度は、制限された範囲[0,2π]内にあり、特異値に依存する精度で量子化することが可能である。特異値がゼロに等しい極端な例では、いかなる角度でもよく、よって、要求される精度はない。特異値が大きい(1に近い)場合、非常に細かい分解能が適切である。
U及びVを表す角度の量子化グリッドの精度は、種々のストラテジに基づき得る。例えば、精度は、その絶対値の最大絶対特異値又は(算術若しくは幾何)平均に基づいて選ぶことが可能である。あるいは、U=R(α)及びV=R(−β)(α及びβは回転角である)と表せば、式
=R(α)SR(−β)=R((α+β)/2)R((α−β)/2)SR(−β−α)/2)R(−(β+α)/2) (19)
である。
このことから、システムI−z−1の行列式が(α+β)/2に依存しないことを示すことが可能である。したがって、角度γ=(α+β)/2を、一様な量子器で量子化することが可能である。角度δ=(α−β)/2は、行列式における因子であり、特異値に応じてうまく量子化することが可能である。
特に、δ=(α−β)/2は、行列関連の(、固有値を求める)特性式が変わらない状態に留まるように量子化することができる。これは、
Figure 2008542807
である反射係数kを導入することによって行うことが可能である。
反射係数を扱う単一チャネル手法(例えば、LAR領域又はアークサイン領域への写像)を用いることが可能である。好ましくは、kの計算におけるσ及びσは量子化されたものである。この関係を復号器において反転させなければならず、そこでは、量子化された特異値のみが利用可能であるからである。 復号器写像k→δは、あいまいである。このあいまい性を解決するために、一追加ビットを伝送することも可能である。
図6は、本発明の特定の実施例による、符号化器の考えられる処理工程の特定例を示す図である。明らかに、多くの変形が考えられる(例えば、LAR写像は、アークサイン写像によって置き換えることができる)。前述の通り、反射係数kは、δの関数であるのみならず、σ、σの関数でもあり、復号器における反転の場合、復号器において利用可能であるので、量子化値σ、σを用いることが効果的であり得る。
復号化器は、逆の処理を実現する。これは、量子化パラメータを受信し、σ及びσを再構成する。前述の値によって、受信器は、δをk及びsから再構成することができる。γ及びδから、回転行列U及びVを再構成することが可能である。後に、行列Eを再構成することが可能である。
一部の実施例では、固有値及び特異値の分解を併せて用いることができる。よって、反射行列を固有値及び特異値分解に分解することが可能である。二次多項式(P)における固有値を合成し、この多項式に属する反射係数(k及びk)を量子化することによって、特性式に対する高精度のコントロールが(EVD手法と同様に)与えられる。特異値は比c=|σ/σ|に写像することが可能である。前述の比は効率的に、対数スケール上で一様に量子化することが可能である。パラメータα及びβは、γ=(α+β)/2に(SVD手法と同様に)合成し、一様に量子化することが可能である。
図7は、本発明の特定の実施例による、符号化器の考えられる処理工程の特定例を示す図である。明らかに、多くの変形が考えられる(例えば、LAR写像は、アークサイン写像によって置き換えることができる)。
復号化器は、逆の処理を実現する。これは、量子化パラメータを受信し、e及びeを再構成する。前述の値及びcによって、受信器はSを再構成することができる。e、e、σ、σから、パラメータδを再構成することが可能である。SVDの場合と同様に、あいまい性が生じる。これは、追加ビットsによって解決することができる。δ及びγから、回転行列U及びVを構成することが可能である。
3つの例(すなわち、EVD、SVD、及びEVD/SVDの組み合わせ)全てにおいて、(正規化された)反射行列それぞれによって、2つの係数(Eにおける固有値、又はSにおける特異値)がもたらされる。この2つの係数は、多少の適合によって、単一チャネル線形予測システムにおける反射係数のように扱うことが可能である。付随する行列(V及びU、又はW)は、固有値又は特異値の特性に依存し得る精度(ビット数)及び/又は解釈で符号化することができる。
前述の通り、逆写像{e}→{P}は、共分散行列(正定値エルミート行列)の特性を有する更なる行列Rを必要とする。
Figure 2008542807
ここで、r12=r21である。これは、
Figure 2008542807
に書き直すことが可能である。ここで、
Figure 2008542807
であり、相関係数は、
Figure 2008542807
である。相関係数は、−1と1との間であり、一様でないグリッド上で効果的に量子化することが可能である。0値付近の精度は低い。値μは、dBスケール上で効果的に量子化することが可能である。値
Figure 2008542807
自体は、写像{E}→{P}の場合、関心対象でなく、伝送しなくてよい。
あるいは、行列Rは、前述の機構(SVD又はEVD)によって分解することができ、その場合、特異値(又は固有値)と一角度との比のみを伝送すればよい(この行列の特定の構造による)。
図8は、本発明の特定の実施例による、マルチチャネル信号の通信のための伝送システム800を示す。伝送システム800は、ネットワーク805(特にインターネットであり得る)を介して受信器803に結合された送信器801を備える。
この特定例では、送信器が信号記録装置であり、受信器が信号プレイヤ装置であるが、他の実施例では、送信器及び受信器を他のアプリケーションに用いることができる。例えば、送信器及び/又は受信器は、トランスコーディング機能の一部であり得るものであり、例えば、他の信号のソース又は送信先とのインタフェースを備え得る。
信号記録機能がサポートされる特定例では、送信器801は、アナログ・マルチチャネル信号(サンプリング及びアナログ・ディジタル変換によってディジタルPCM信号に変換される)を受信するディジタイザ807を備える。
送信器801は図1の符号化器100に結合される。符号化器109は、前述のようにPCM信号を符号化する。符号化器100はネットワーク送信器809に結合される。ネットワーク送信器809は符号化信号を受信し、インターネットとインタフェースして、符号化信号を受信器803にインターネット805を介して送信する。
受信器803は、インターネット805とインタフェースして、符号化信号を送信器801から受信するネットワーク受信器811を備える。
ネットワーク受信器811は、図2の復号器200に結合される。復号器200は、符号化信号を受信し、前述の通り、これを復号化する。
信号再生機能がサポートされる特定例では、受信器803は、復号化マルチチャネル信号を復号化器200から受信し、これをユーザに提示する信号プレイヤ813を更に備える。特に、信号プレイヤ813は、マルチチャネル・オーディオ信号の出力に必要なディジタル・アナログ変換器、増幅器及びスピーカを備え得る。
明確にするための上記説明によって、種々の機能ユニット及びプロセッサを参照して本発明の実施例を説明した。しかし、別々の機能ユニット又はプロセッサ間の何れかの適切な機能配分を本発明から逸脱ことなく用いることができることは明らかであろう。例えば、別個のプロセッサ又はコントローラによって行うものとして示された機能を同じプロセッサ又はコントローラによって行うことができる。よって、特定の機能ユニットへの参照は、厳密な論理的又は物理的構造若しくは編成を示すのではなく単に、前述の機能を提供する適切な手段への参照としてみなすものとする。
本発明は、ハードウェア、ソフトウェア、ファームウェアや、これらの何れかの組み合わせをはじめとする何れかの適切な形態で実現することが可能である。任意的には、本発明は、1つ又は複数のデータ・プロセッサ上及び/若しくはディジタル信号プロセッサ上で実行するコンピュータ・ソフトウェアとして少なくとも部分的に実現することができる。本発明の実施例の構成要素及び構成部分は、何れかの適切な方法で物理的に、機能的に、及び論理的に実現することができる。実際に、機能は、単一の装置において、複数の装置において、又は、他の機能的装置の一部として実現することができる。そういうものとして、本発明は、単一装置において実現することができ、又は、別々の装置及びプロセッサに物理的及び機能的に分散させることができる。
本発明は、特定の実施例に関して説明したが、本明細書及び特許請求の範囲記載の特定の形態に限定することを意図するものでない。むしろ、本発明の範囲は、特許請求の範囲によってのみ限定される。更に、特定の実施例に関して特徴を説明しているようにみえ得るが、前述の実施例の種々の特徴を本発明によって組み合わせることができることを当業者は認識するであろう。特許請求の範囲では、comprisingの語は、他の構成要素や工程が存在することを排除するものでない。
更に、個々に列挙されているが、複数の手段、構成要素又は方法工程は、例えば、単一の装置又はプロセッサによって実現することができる。更に、個々の特徴は、別々の請求項に備え得るが、場合によっては、効果的に組み合わせてもよく、別々の請求項に備えていることは、特徴の組み合わせが実現可能でないこと及び/又は効果的でないことを示唆するものでない。更に、一クレーム・カテゴリーに特徴を備えていることは、このカテゴリーに限定することを示唆するものでなく、むしろ、他のクレーム・カテゴリーに特徴が適宜、同様に適用可能であることを示す。更に、クレーム中の構成の順序は、構成を実施しなければならない何れかの特定の順序を示唆するものでなく、特に、方法クレームにおける個々の工程の順序は、この順序で工程を行わなければならないことを示唆するものでない。むしろ、工程は、何れかの適切な順序で行うことができる。更に、単数形の記載は、複数形を排除するものでない。よって、「a」、「an」、「first」、「second」等への参照は、複数形を排除するものでない。単に明瞭化する例として記載した、特許請求の範囲における参照符号は、特許請求の範囲を如何なる方法によって限定されるものとも解されないものとする。
本発明の特定の実施例による、ステレオ・オーディオ信号の符号化器を示す図である。 本発明の特定の実施例による、ステレオ・オーディオ信号の復号化器を示す図である。 本発明の特定の実施例による、ステレオ・オーディオ信号の符号化器の構成要素を示す図である。 本発明の特定の実施例による、ステレオ・オーディオ信号の復号化器の構成要素を示す図である。 本発明の特定の実施例による符号化器の考えられる処理工程の特定例を示す図である。 本発明の特定の実施例による符号化器の考えられる処理工程の特定例を示す図である。 本発明の特定の実施例による符号化器の考えられる処理工程の特定例を示す図である。 本発明の特定の実施例による、マルチチャネル信号の通信のための伝送システムを示す図である。

Claims (27)

  1. マルチチャネル信号を符号化する符号化器であって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を求める手段と、
    前記線形予測符号化パラメータ行列から反射行列を生成する手段と、
    前記反射行列を符号化して符号化反射行列データを生成する符号化手段と、
    前記反射行列データを備える、前記マルチチャネル信号の符号化データを生成する手段とを備える符号化器。
  2. 請求項1記載の符号化器であって、前記反射行列が、正規化された反射行列である符号化器。
  3. 請求項2記載の符号化器であって、前記正規化された反射行列は、正規化された前方反射行列又は正規化された後方反射行列であり、前記符号化データは、前記正規化された前方反射行列及び前記正規化された後方反射行列のパラメータをリンク付けする相関データを更に備える符号化器。
  4. 請求項1記載の符号化器であって、前記符号化手段は、前記反射行列を分解して、分解された反射行列を生成し、前記分解された反射行列を符号化して、前記符号化反射行列データを生成する符号化器。
  5. 請求項4記載の符号化器であって、前記符号化手段は、前記分解された反射行列から特性多項式を求めるよう構成され、前記分解された反射行列の前記符号化は、前記特性多項式の符号化係数を備える符号化器。
  6. 請求項4記載の符号化器であって、前記分解が固有値分解である符号化器。
  7. 請求項6記載の符号化器であって、前記符号化された反射行列データは、
    固有値データ及び
    固有ベクトル・データ
    を有する群の少なくとも1つ又は複数の量子化データを備える符号化器。
  8. 請求項6記載の符号化器であって、前記符号化手段は、少なくとも1つの固有値に応じて量子化特性を修正するよう動作可能である符号化器。
  9. 請求項4記載の符号化器であって、前記分解が固有値分解(SVD)である符号化器。
  10. 請求項9記載の符号化器であって、前記符号化反射行列データは、少なくとも特異値の量子化データを備える符号化器。
  11. 請求項9記載の符号化器であって、前記符号化手段は、少なくとも1つの特異値に応じて量子化特性を修正するよう動作可能である符号化器。
  12. 請求項4記載の符号化手段であって、前記符号化手段は、前記分解された反射行列のパラメータの量子化によって、前記符号化された反射行列データを生成する手段を備える符号化器。
  13. マルチチャネル信号を復号化する復号化器であって、
    前記マルチチャネル信号の符号化データを受信する手段であって、前記符号化データが、前記マルチチャネル信号の反射行列の符号化反射行列を備える手段と、
    前記反射行列データを復号化することによって反射行列を求める手段と、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を前記反射行列から求める手段と、
    前記線形予測符号化パラメータに基づいた線形予測復号化によって前記マルチチャネル信号を生成する手段とを備える復号化器。
  14. マルチチャネル信号を符号化する方法であって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を求める工程と、
    前記線形予測符号化パラメータ行列から反射行列を生成する工程と、
    前記反射行列を符号化して符号化反射行列データを生成する工程と、
    前記反射行列データを備える、前記マルチチャネル信号の符号化データを生成する工程とを備える方法。
  15. マルチチャネル信号を復号化する方法であって、
    前記マルチチャネル信号の符号化データを受信する工程であって、前記符号化データが、前記マルチチャネル信号の反射行列の符号化反射行列データを備える工程と、
    前記反射行列データを復号化することによって反射行列を求める工程と、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を前記反射行列から求める工程と、
    前記線形予測符号化パラメータに基づいた線形予測復号化によって前記マルチチャネル信号を生成する工程とを備える方法。
  16. 符号化マルチチャネル信号であって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列に関連した反射行列の符号化反射行列データを備える符号化マルチチャネル信号。
  17. 請求項14又は15に記載の方法を実行するコンピュータ・プログラム・プロダクト。
  18. マルチチャネル信号を送信する送信器であって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を求める手段と、
    前記線形予測符号化パラメータ行列から反射行列を生成する手段と、
    前記反射行列を符号化して符号化反射行列データを生成する符号化手段と、
    前記反射行列データを備える、前記マルチチャネル信号の符号化データを生成する手段と、
    前記符号化データを送信する手段とを備える送信器。
  19. マルチチャネル信号を受信する受信器であって、
    前記マルチチャネル信号の符号化データを受信する手段であって、前記符号化データが、前記マルチチャネル信号の反射行列の符号化反射行列データを備える手段と、
    前記反射行列データを復号化することによって反射行列を求める手段と、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を前記反射行列から求める手段と、
    前記線形予測符号化パラメータに基づいた線形予測復号化によって前記マルチチャネル信号を生成する手段とを備える受信器。
  20. マルチチャネル信号を伝送する伝送システムであって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を求める手段と、
    前記線形予測符号化パラメータ行列から反射行列を生成する手段と、
    前記反射行列を符号化して符号化反射行列データを生成する符号化手段と、
    前記反射行列データを備える、前記マルチチャネル信号の符号化データを生成する手段と、前記符号化データを送信する手段とを備える送信器と、
    マルチチャネル信号を受信する受信器であって、
    前記符号化データを受信する手段と、
    前記反射行列データを復号化することによって反射行列を求める手段と、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を前記反射行列から求める手段と、
    前記線形予測符号化パラメータに基づいた線形予測復号化によって前記マルチチャネル信号を生成する手段とを備える受信器とを備える伝送システム。
  21. マルチチャネル信号を送信する方法であって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を求める工程と、
    前記線形予測符号化パラメータ行列から反射行列を生成する工程と、
    前記反射行列を符号化して符号化反射行列データを生成する工程と、
    前記反射行列データを備える、前記マルチチャネル信号の符号化データを生成する工程と、
    前記符号化データを送信する工程とを備える方法。
  22. マルチチャネル信号を受信する方法であって、
    前記マルチチャネル信号の符号化データを受信する工程であって、前記符号化データが、前記マルチチャネル信号の反射行列の符号化反射行列データを備える工程と、
    前記反射行列データを復号化することによって反射行列を求める工程と、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を前記反射行列から求める工程と、
    前記線形予測符号化パラメータに基づいた線形予測復号化によって前記マルチチャネル信号を生成する工程とを備える方法。
  23. マルチチャネル信号を送信し、受信する方法であって、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を求める工程と、
    前記線形予測符号化パラメータ行列から反射行列を生成する工程と、
    前記反射行列を符号化して符号化反射行列データを生成する工程と、
    前記反射行列データを備える、前記マルチチャネル信号の符号化データを生成する工程と、
    前記符号化データを送信する工程と、
    前記マルチチャネル信号の前記符号化データを受信する工程と、
    前記反射行列データを復号化することによって反射行列を求める工程と、
    前記マルチチャネル信号の線形予測符号化パラメータ行列を前記反射行列から求める工程と、
    前記線形予測符号化パラメータに基づいた線形予測復号化によって前記マルチチャネル信号を生成する工程とを備える方法。
  24. 請求項1記載の符号化器を備えたオーディオ記録装置。
  25. 請求項13記載の復号化器を備えたオーディオ再生装置。
  26. 符号化マルチチャネル信号であって、前記マルチチャネル信号の符号化データを備え、
    前記符号化データは、前記マルチチャネル信号の反射行列の符号化反射行列データを備え、前記反射行列は、前記マルチチャネル信号に基づいた線形予測符号化の線形予測符号化パラメータ行列に対応する符号化マルチチャネル信号。
  27. 請求項26記載の信号を記憶させた記憶媒体。
JP2008512964A 2005-05-25 2006-05-09 マルチチャネル信号の予測符号化 Withdrawn JP2008542807A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05104475 2005-05-25
PCT/IB2006/051445 WO2006126115A2 (en) 2005-05-25 2006-05-09 Predictive encoding of a multi channel signal

Publications (1)

Publication Number Publication Date
JP2008542807A true JP2008542807A (ja) 2008-11-27

Family

ID=37452420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008512964A Withdrawn JP2008542807A (ja) 2005-05-25 2006-05-09 マルチチャネル信号の予測符号化

Country Status (9)

Country Link
US (1) US20090281798A1 (ja)
EP (1) EP1889256A2 (ja)
JP (1) JP2008542807A (ja)
KR (1) KR20080015878A (ja)
CN (1) CN101180675A (ja)
BR (1) BRPI0609897A2 (ja)
MX (1) MX2007014570A (ja)
RU (1) RU2007143418A (ja)
WO (1) WO2006126115A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017501440A (ja) * 2013-11-28 2017-01-12 ドルビー・インターナショナル・アーベー 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置
KR20200124010A (ko) 2019-04-23 2020-11-02 한양대학교 에리카산학협력단 다공성 전극을 구비하는 마이크로 유체 미생물 연료전지 및 이의 제조방법

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7831629B2 (en) * 2006-01-06 2010-11-09 Microsoft Corporation Method for building data encapsulation layers for highly variable schema
ATE557387T1 (de) * 2008-07-30 2012-05-15 France Telecom Rekonstruktion von mehrkanal-audiodaten
US9245529B2 (en) * 2009-06-18 2016-01-26 Texas Instruments Incorporated Adaptive encoding of a digital signal with one or more missing values
PL2904612T3 (pl) * 2012-10-05 2019-05-31 Fraunhofer Ges Forschung Urządzenie do kodowania sygnału mowy wykorzystujące ACELP w dziedzinie autokorelacji
WO2014096236A2 (en) * 2012-12-19 2014-06-26 Dolby International Ab Signal adaptive fir/iir predictors for minimizing entropy
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
CN103974076B (zh) * 2014-05-19 2018-01-12 华为技术有限公司 图像编解码方法和设备、系统
EP3699909A1 (en) * 2015-09-25 2020-08-26 VoiceAge Corporation Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel
CN109416912B (zh) * 2016-06-30 2023-04-11 杜塞尔多夫华为技术有限公司 一种对多声道音频信号进行编码和解码的装置和方法
WO2018189414A1 (en) * 2017-04-10 2018-10-18 Nokia Technologies Oy Audio coding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804350B1 (en) * 2000-12-21 2004-10-12 Cisco Technology, Inc. Method and apparatus for improving echo cancellation in non-voip systems
CN100343895C (zh) * 2002-05-30 2007-10-17 皇家飞利浦电子股份有限公司 音频编码方法和装置,音频解码方法和装置
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7243064B2 (en) * 2002-11-14 2007-07-10 Verizon Business Global Llc Signal processing of multi-channel data
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017501440A (ja) * 2013-11-28 2017-01-12 ドルビー・インターナショナル・アーベー 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置
US10244339B2 (en) 2013-11-28 2019-03-26 Dolby International Ab Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US10602293B2 (en) 2013-11-28 2020-03-24 Dolby International Ab Methods and apparatus for higher order ambisonics decoding based on vectors describing spherical harmonics
KR20200124010A (ko) 2019-04-23 2020-11-02 한양대학교 에리카산학협력단 다공성 전극을 구비하는 마이크로 유체 미생물 연료전지 및 이의 제조방법

Also Published As

Publication number Publication date
CN101180675A (zh) 2008-05-14
EP1889256A2 (en) 2008-02-20
US20090281798A1 (en) 2009-11-12
MX2007014570A (es) 2008-02-11
KR20080015878A (ko) 2008-02-20
RU2007143418A (ru) 2009-05-27
WO2006126115A3 (en) 2007-03-15
BRPI0609897A2 (pt) 2011-10-11
WO2006126115A2 (en) 2006-11-30

Similar Documents

Publication Publication Date Title
JP2008542807A (ja) マルチチャネル信号の予測符号化
JP6407928B2 (ja) オーディオ処理システム
ES2609449T3 (es) Decodificación de audio
KR101707125B1 (ko) 효율적인 다운믹싱을 이용하는 오디오 디코더 및 디코딩 방법
US8046214B2 (en) Low complexity decoder for complex transform coding of multi-channel sound
US8249883B2 (en) Channel extension coding for multi-channel source
AU2007208482B2 (en) Complex-transform channel coding with extended-band frequency coding
KR101346120B1 (ko) 오디오 인코딩 및 디코딩
US8190425B2 (en) Complex cross-correlation parameters for multi-channel audio
KR101135869B1 (ko) 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법
JP4603037B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
KR101108060B1 (ko) 신호 처리 방법 및 이의 장치
ES2717131T3 (es) Métodos, codificador y decodificador para codificación y decodificación predictiva lineal de señales de sonido tras transición entre tramas que tienen diferentes tasas de muestreo
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
BRPI0612218B1 (pt) codificação de áudio residual adaptativa
US8457958B2 (en) Audio transcoder using encoder-generated side information to transcode to target bit-rate
BRPI0606387B1 (pt) Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
KR20130007527A (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
JP7419388B2 (ja) 回転の補間と量子化による空間化オーディオコーディング
JP6179122B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
KR102654181B1 (ko) 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090507

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20091106