JP5032978B2 - ステレオコーディング及びデコーディングの方法及び装置 - Google Patents

ステレオコーディング及びデコーディングの方法及び装置 Download PDF

Info

Publication number
JP5032978B2
JP5032978B2 JP2007506882A JP2007506882A JP5032978B2 JP 5032978 B2 JP5032978 B2 JP 5032978B2 JP 2007506882 A JP2007506882 A JP 2007506882A JP 2007506882 A JP2007506882 A JP 2007506882A JP 5032978 B2 JP5032978 B2 JP 5032978B2
Authority
JP
Japan
Prior art keywords
signal
parameter
encoded
data
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007506882A
Other languages
English (en)
Other versions
JP2007531915A (ja
Inventor
ヘー ペー スハイエルス,エリク
イェー ブレーバールト,ディルク
ピー マイバーグ,フランソワ
デ ケルクホフ,レオン エム ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007531915A publication Critical patent/JP2007531915A/ja
Application granted granted Critical
Publication of JP5032978B2 publication Critical patent/JP5032978B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

発明の詳細な説明
本発明はデータコーディングの方法に関し、例えば、データ成分の可変角回転を利用したオーディオデータ及び/または画像データのコーディング方法に関する。さらに、本発明は、上記方法を利用するエンコーダと、このエンコーダにより生成されたデータをデコードするように動作するデコーダとを有する。さらに、本発明は、データ担体及び/または通信ネットワークを介して通信される、上記方法により生成されたエンコードデータにも関する。
オーディオ及び/または画像データを符号化して対応する符号出力データを生成する最新の方法が多数知られている。mp3の産業標準規格は、ISO/IEC JTC1/SC29/WG11 MPEG、IS11172−3、情報技術−約1.5Mbit/sまでのデジタル記憶媒体用の動画及び関連するオーディオの符号化、パート3:オーディオ、MPEG−1、1992年に記載されている。最新の方法の一部は、コーディング効率を改善するように構成されている。すなわち、中間/サイド(M/S)ステレオコーディングまたは和/差ステレオコーディングを利用することにより、エンハンス(enhance)されたデータ圧縮を提供する。これらの方法は、J.D. Johnston及びA. J. Ferreira著、「Sum-difference stereo transform coding」(Proc. IEEE, Int. Conf. Acoust., Speech and Signal Proc., San Francisco, CA, March 1992, pp. II: pp. 569-572)に記載されている。
M/Sコーディングでは、ステレオ信号は左右信号l[n]、r[n]を有しており、例えば、式1及び2に記載した処理を適用することにより、和信号m[n]と差信号s[n]としてそれぞれ符号化される。
Figure 0005032978
Figure 0005032978
信号l[n]とr[n]がほぼ等しい時には、M/Sコーディングは差信号s[n]がゼロに近づき、ほとんど情報を伝搬しないが、一方、和信号がほとんどの信号情報コンテントを効果的に含むという理由で大幅なデータ圧縮ができる。このような状況では、和・差信号を表すのに必要なビットレートは、信号l[n]とr[n]を独立に符号化するために必要なビットレートの約半分である。
式1と2は、式3のように回転行列により表すことができる。
Figure 0005032978
ここで、cは一定のスケーリング計数であり、クリッピングを防止するために使用されることが多い。
式3は、信号l[n]とr[n]の45°の角度の回転に有効に対応するが、式4に与えたように他の回転角も可能である。ここで、αは、信号l[n]とr[n]に適用して対応する符号化信号m’[n]、s’[n]を生成するための回転角である。以下、それぞれ主信号と残差信号として説明する。
Figure 0005032978
角αは可変とされ、残差信号s’[n]にある情報コンテントを減らし、主信号m’[n]に情報コンテントを集中することにより、すなわち、残差信号s’[n]のパワーを最小化し、その結果主信号m’[n]のパワーを最大化することにより、広いクラスの信号l[n]、r[n]をエンハンス圧縮する。
式1ないし4により表された符号化方法は、従来、ブロードバンド信号には適用されず、オーディオ信号を搬送するために使用する帯域幅の狭い一部だけを表すサブ信号に適用されている。さらに、式1ないし4の方法は、従来、信号l[n]、r[n]の周波数領域表示に適用されている。
米国特許公報第5,621,855号において、第1と第2の信号成分を有するデジタル信号をサブバンド符号化する方法が記載されている。デジタル信号はサブバンド符号化され、第1の信号成分に応じて第1のqサンプル信号ブロックを有する第1のサブバンド信号と、第2の信号成分に応じて第2のqサンプル信号ブロックを有する第2のサブバンド信号とを有する。第1と第2のサブバンド信号は同一のサブバンドにあり、第1と第2の信号ブロックは時間等価である。
第1と第2の信号ブロックを処理して、時間等価サンプルの点表示間の最小距離値を求める。その最小距離値が閾値距離値以下であれば、qサンプルにより構成された合成ブロックを求める。求めるには、第1ブロックの各サンプルにcos(α)をかけて、第2の信号ブロックの各サンプルに−sin(α)をかけた後に、第1と第2の信号ブロック中の時間等価サンプルのペアをそれぞれ加える。
上記回転角αの適用により45°回転を用いてM/Sコーディングの多くの欠点を無くすことができるが、このようなアプローチは信号のグループ(例えばステレオ信号のペア)信号に適用したとき、これらの信号に大きな相対的位相または時間オフセットがある時、問題があることが分かっている。本発明はこの問題の解消に関する。
本発明の一目的はデータ符号化方法を提供することである。
本発明の第1の態様によると、複数の入力信号を符号化して対応する符号化データを生成する方法が提供される。該方法は:
(a)前記入力信号(l、r)を処理して、前記信号(l、r)間の相対的な位相差と時間差の少なくとも一方を記述する第1のパラメータ(φ2)を決定し、これらの第1のパラメータ(φ2)を適用して前記入力信号を処理し、対応する中間信号を生成する段階と、
(b)前記中間信号及び/または前記入力信号(l、r)を処理し、主信号(m)と残差信号(s)を生成するために必要な前記中間信号の回転を記述する第2のパラメータを決定し、前記主信号(m)の大きさまたはエネルギーは前記残差信号(s)の大きさよりも大きく、これらの第2のパラメータを適用して前記中間信号を処理して、前記主信号(m)と残差信号(s)を生成する段階と、
(c)前記第1のパラメータと前記第2のパラメータとを量子化し、前記主信号(m)と前記残差信号(s)の少なくとも一部を符号化して、対応する量子化データを生成する段階と、
(d)前記量子化データを多重化して、前記符号化データを生成する段階と、を有する。
本発明は、データのより効率的な符号化を提供できるという点で有利である。
好ましくは、本方法において、前記残差信号(s)の一部のみが前記符号化データに含まれる。残余信号(s)をこのように部分的に含むことにより、符号化データにおいて達成することができるデータ圧縮を強化(enhance)することができる。
より好ましくは、本方法において、前記符号化データは、前記符号化データに含まれている前記残差信号の部分を示す1つ以上のパラメータも含む。このようなパラメータにより、符号化データの復号を複雑でなくすることができる。
好ましくは、本方法の段階(a)と(b)は、複素回転により実施され、前記入力信号(l[n]、r[n])は周波数領域(l[k]、r[k])で表される。複素回転の実施により、複数の入力信号間に生じる相対的時間及び/または位相差により効率的に対処することができる。より好ましくは、段階(a)と(b)は周波数領域またはサブバンド領域で実行される。「サブバンド」は、信号に必要な周波数帯域幅全体よりも狭い周波数領域と解釈すべきである。
好ましくは、本方法は、入力信号(l、r)を含む周波数範囲全体の一部分(sub-part)に適用される。より好ましくは、全周波数範囲の他の部分(sub-parts)は、例えば、上で説明した従来のM/S符号化などの別の符号化方法を用いて符号化される。
好ましくは、本方法は、段階(c)の後に、量子化データをロスレスで符号化する追加的ステップを含み、そのデータを段階(d)で多重化して符号化データを生成してもよい。より好ましくは、ロスレス符号化はハフマン符号化を用いて実施される。ロスレス符号化を用いることにより、潜在的に高いオーディオ品質を達成することができる。
好ましくは、本方法は、前記残差信号(s)にある知覚的に無関係の時間周波数情報を捨てることにより、前記残差信号(s)を操作する段階であって、前記操作された残差信号(s)は前記符号化データ(100)に貢献し、前記知覚的に無関係の情報は前記入力信号のスペクトル時間表現の選択された部分に対応するところの段階を含む。知覚的に関係のない情報を破棄することにより、本方法により、符号化データにおいてより高いデータ圧縮率を提供することができる。
好ましくは、本発明の段階(b)において、前記第2のパラメータ(α;IID、ρ)は、前記残差信号(s)の大きさまたはエネルギーを最小化することにより求められる。このようなアプローチにより、パラメータを求める別のアプローチと比較して第2のパラメータの生成が計算的に効率化される。
好ましくは、本方法において、前記第2のパラメータ(α;IID、ρ)はチャンネル間強度差パラメータとコヒーレンスパラメータ(IID、ρ)により表される。本方法をこのように実施することにより、既存のパラメトリックステレオ符号化及び関連する復号ハードウェアまたはソフトウェアとの後方互換性を提供することができる。
好ましくは、本方法の段階(c)と(d)において、前記符号化データは重要度のレイヤーに配置され、前記レイヤーは前記主信号(m)を搬送するベースレイヤーと、ステレオ分離パラメータに対応する第1及び/または第2のパラメータを含む第1のエンハンスメントレイヤーと、前記残差信号(s)の表示を搬送する第2のエンハンスメントレイヤーとを含む。 より好ましくは、前記第2のエンハンスメントレイヤーは、前記残差信号(s)の最も関係のある時間・周波数情報を搬送する第1のサブレイヤーと、前記残差信号(s)の関係のうすい時間・周波数情報を搬送する第2のサブレイヤーとにさらに分割される。これらのレイヤー及び必要に応じたサブレイヤーによる入力信号の表示により、符号化データの伝送エラーに対してよりロバスト(robustness)にすることができ、より単純な復号ハードウェアと後方互換とすることができる。
本発明の第2の態様によると、複数の入力信号を符号化して対応する符号化データを生成するエンコーダが提供される。該エンコーダは:
(a)前記入力信号(l、r)を処理して、前記信号(l、r)間の相対的な位相差と時間差の少なくとも一方を記述する第1のパラメータ(φ2)を決定する第1の処理手段であって、これらの第1のパラメータ(φ2)を適用して前記入力信号を処理し、対応する中間信号を生成する第1の処理手段と、
(b)前記中間信号を処理し、主信号(m)と残差信号(s)を生成するために必要な前記中間信号の回転を記述する第2のパラメータを決定する第2の処理手段であって、前記主信号(m)の大きさまたはエネルギーは前記残差信号(s)の大きさよりも大きく、これらの第2のパラメータを適用して前記中間信号を処理して、前記主信号(m)と残差信号(s)を生成する第2の処理手段と、
(c)前記第1のパラメータ(φ2)、前記第2のパラメータ(α;IID、ρ)、及び少なくとも主信号と残差信号の一部を量子化し、対応する量子化データを生成する量子化手段と、
(d)前記量子化データを多重化して、前記符号化データを生成する多重化手段と、を有する。
本エンコーダは、データのより効率的な符号化を提供できるという点で有利である。
好ましくは、本エンコーダは、前記残差信号(s)にある知覚的に無関係の時間周波数情報を捨てることにより、前記残差信号(s)を操作する処理手段であって、前記変換された残差信号(s)は前記符号化データ(100)に貢献し、前記知覚的に無関係の情報は前記入力信号のスペクトル時間表現の選択された部分に対応するところの処理手段を含む。知覚的に関係のない情報を破棄することにより、本エンコーダにより、符号化データにおいてより高いデータ圧縮率を提供することができる。
本発明の第3の態様によると、符号化データを復号して複数の入力信号(l’、r’)の対応表現を再生する方法であって、前記入力信号(l、r)は前記符号化データを生成するために事前に符号化される方法が提供される。該方法は:
(a)符号化データをデマルチプレックスして、対応する量子化データを生成する段階と、
(b)前記量子化データを処理して、対応する第1のパラメータ(φ2)と、第2のパラメータと、少なくとも主信号(m)と残差信号(s)とを生成する段階であって、前記主信号(m)の強さまたはエネルギーは前記残差信号(s)のそれよりも大きいところの段階と、
(c)第2のパラメータを適用して主信号(m)と残差信号(s)を回転して対応する中間信号を生成する段階と、
(d)第1のパラメータ(φ2)を適用することにより前記中間信号を処理して前記入力信号(l’、r’)の表示を再生する段階であって、前記第1のパラメータ(φ2)は前記信号(l、r)間の相対的位相差と時間差のうち少なくとも一方を記述するところの段階と、を有する。
本方法は、本発明の第1の態様による方法を用いて効率的に符号化されたデータを効率的に復号することができるという利点を提供する。
好ましくは、本発明の段階(b)は、残差信号(s)の失われた時間−周波数情報に主信号(m)から求めた合成残差信号を適宜補足する段階をさらに有する。合成信号の生成により、結果として符号化データの効率的復号をすることができる。
好ましくは、前記方法において、前記符号化データは、残差信号(s)のどの部分が符号化データに符号化されているかを示すパラメータを含む。このような表示パラメータを含めることにより、効率的にし、かつ計算負荷を減らすことができる。
本発明の第4の態様によると、符号化データを復号して複数の入力信号(l’、r’)の対応表現を再生するデコーダであって、前記入力信号(l、r)は前記符号化データを生成するために事前に符号化されるデコーダが提供される。該デコーダは:
(a)符号化データをデマルチプレックスして、対応する量子化データを生成するデマルチプレックス手段と、
(b)前記量子化データを処理して、対応する第1のパラメータ(φ2)と、第2のパラメータと、少なくとも主信号(m)と残差信号(s)とを生成する第1の処理手段であって、前記主信号(m)の強さまたはエネルギーは前記残差信号(s)のそれよりも大きいところの第1の処理手段と、
(c)第2のパラメータを適用して主信号(m)と残差信号(s)を回転して対応する中間信号を生成する第2の処理手段と、
(d)第1のパラメータ(φ2)を適用することにより前記中間信号を処理し前記入力信号(l、r)の表示を再生する第3の処理手段であって、前記第1のパラメータ(φ2)は前記信号(l、r)間の相対的位相差と時間差のうち少なくとも記述するところの第3の処理手段と、を有する。
好ましくは、前記第2の処理手段は、前記復号残差信号から失われた情報を提供するために、前記復号主信号(m)から求めた補完的合成残差信号を生成するように動作可能である。
本発明の第5の態様によると、本発明の第1の態様の方法により生成された符号化データであって、データ担体に記録された、及び通信ネットワークを介して通信可能である、いずれか一方である符号化データが提供される。
本発明の第6の態様によると、本発明の第1の態様の方法をコンピュータハードウェア上で実行するソフトウェアが提供される。
本発明の第7の態様によると、本発明の第3の態様の方法をコンピュータハードウェア上で実行するソフトウェアが提供される。
本発明の第8の態様によると、データ担体に記録された、及び通信ネットワークを介して通信可能である、少なくとも一方である符号化データが提供される。
前記データは、量子化された第1のパラメータと、量子化された第2のパラメータと、主信号(m)と残差信号(s)の少なくとも一部に対応する量子化されたデータと、を有し、前記主信号(m)の大きさまたはエネルギーは前記残差信号(s)のそれよりも大きく、前記主信号(m)と前記残差信号(s)は前記第2のパラメータにより中間信号を回転することにより求めることができ、前記中間信号は、複数の入力信号を処理することにより生成することができ、前記第1のパラメータにより記述された相対的位相及び/または時間遅延を補償する。
言うまでもなく、本発明の特徴は、添付した特許請求の範囲により画成される本発明の範囲から逸脱することなく、いかようにも組み合わせることができる。
添付した図面を参照して本発明の実施形態を例により説明する。
概略、本発明は、可変回転各を用いた上記のM/S符号化方法への進展を表すデータ符号化方法に関する。本発明は、位相及び/または時間オフセットが大きくても、信号グループに対応するデータをよりよく符号化できるように、発明者により工夫されている。さらに、本発明は、信号l[n]、r[n]がそれぞれ等価な複素数値周波数領域表示l[k]、r[k]で表されているときに使用できる、回転角αの値を利用する従来の符号化方法と比較して、有利である。
各αは実数値として構成することができ、l[n]、r[n]信号に相互に「一致(cohere)」するように適用されこれらの信号間の相互の時間及び/または位相遅延を合わせる実数値位相回転として構成することができる。しかし、回転角αとして複素数値を用いることにより、本発明の実施が容易になる。角度αによる回転を実施するこのような別のアプローチは、本発明の範囲内にあるものと解釈すべきである。
上記時間領域信号l[n]、r[n]の周波数領域表示は、ウィンドウ信号lq[n]、rq[n]を提供する式5と6に記載した時間的ウィンドウプロシージャを適用することにより求めることが好ましい。
Figure 0005032978
Figure 0005032978
ここで、q=連続する信号フレームを示すフレームインデックスであり、q=0、1、2、...である;
H=ホップサイズまたはアップデイトサイズである;
n=0とL−1の範囲にある値を有する時間インデックスであり、パラメータLはウィンドウh[n]の長さに等しい。
ウィンドウ信号lq[n]、rq[n]は、式7と8に記載したように、離散フーリエ変換(DFT)、または機能的に等価な変換を用いて周波数領域に変換可能である。
Figure 0005032978
Figure 0005032978
ここで、パラメータNはDFT長さを表し、N≧Lである。実数値シーケンスのDFTは対象であるから、最初のN/2+1個の点のみが変換後に保存される。DFTを実施するときに信号エネルギーを保存するため、式9と10に記載したスケーリングを利用することが好ましい:
Figure 0005032978
Figure 0005032978
本発明の方法は、式11に示した信号処理演算を実行して、式7と8の周波数領域信号表示l[k]、r[k]を、周波数領域の対応する回転された和・差信号m”[k]、s”[k]に変換する:
Figure 0005032978
ここで、α=実数値可変回転角であり;
φ1=関連する境界を越えて信号の連続性を最大化するために用いる共通角であり;
φ2=右信号r[k]を位相回転することにより残差信号s”[k]のエネルギーを最小化するために用いる角である。
角φ1の使用は任意的である。さらに、式11による回転は、好ましくはフレームごとに行われる。すなわち、動的にフレームステップで行われる。しかし、このようなフレームごとの回転の動的な変化により、和信号のm”[k]が不連続になるが、この不連続性は角φ1を好適に選択することにより少なくとも部分的には取り除くことができる。
さらに、式11の周波数範囲k=0...N/2+1は、好ましくはサブレンジすなわち領域に分割される。エンコード中に各領域についてそれが対応する角パラメータα、φ1、φ2を独立に決定し、符号化し、デコーダに送信または搬送して、後でデコードする。副分割すべき周波数範囲を準備することにより、信号特性をエンコード中によりよく捕捉することができ、結果的に圧縮比が高くすることができる。
式7から11によりマッピングを実施した後、信号m”[k]、s”[k]は、式12と13で記述したように逆離散フーリエ変換される。
Figure 0005032978
Figure 0005032978
ここで、
mq[n]=主時間領域表示;及び
sq[n]=残差(差)時間領域表示。
主表示及び残差表示は、次にウィンドウベースの表示に本方法で変換される。このウィンドウベースには、式14と15に記載したように処理動作により重なりを持たせる。
Figure 0005032978
Figure 0005032978
あるいは、式5ないし15に記載した本発明の方法の処理動作は、少なくとも部分的には、複素変調されたフィルタバンクを利用することにより実際に実施できる。コンピュータの処理ハードウェアに適用したデジタル処理を利用して、本発明を実施することができる。
本発明の方法を例示するために、本発明の信号処理例をここで説明する。この例では、2つの時間的信号を、本方法を用いて処理すべき初期信号として使用する。この2つの信号は式16と17で画成される:
Figure 0005032978
Figure 0005032978
ここで、z1[n]、z2[n]及びz3[n]は、相互に独立なホワイトノイズであって、分散は1である。本発明の方法の動作をよりよく理解するために、式16と17に記載した信号l[n]、r[n]の一部を図1に示した。
図2には、M/S変換信号m[n]とs[n]が例示されている。これらの変換信号は、式1と2による従来の処理により、式16と17の信号l[n]、r[n]から求められる。図2から分かるように、式16と17の信号から信号m[n]とs[n]を生成する従来のアプローチにより、式17では残差信号s[n]のエネルギーが入力信号r[n]のエネルギーよりも高くなる。明らかに、式16と17の信号に従来のM/S変換信号処理を適用すると、その結果の信号圧縮では効率的ではない。信号s[n]は無視できる大きさではないからである。
式4に記載した回転変換を利用することにより、図3に示すように、信号例l[n]、r[n]について対応する残差信号s[n]の残差エネルギーを抑え、主信号m[n]を対応して強調(enhance)することができる。式4の回転アプローチは、図2に示した従来のM/S処理よりよく実行できるが、信号l[n]、r[n]に相対的な位相及び/または時間シフトがある場合、十分ではないことが発明者により見いだされている。
式16と17のサンプル信号l[n]、r[n]が周波数領域に変換され、式5ないし15による複素最適化回転をする場合、図4に示したように、残差信号s[n]のエネルギーを比較的小さくすることができる。
式5ないし15により記述された信号処理を実施するように動作するエンコーダハードウェアの実施形態を次に説明する。
図5には、本発明によるエンコーダ(参照符号10で全体を指す)を示した。エンコーダ10は、左右の相補的入力信号を受信し、これらの信号を符号化して符号化ビットストリーム(bs)100を生成する。さらに、エンコーダ10は、位相回転部20、信号回転部30、時間/周波数セレクタ40、第1コーダ50、第2コーダ60、パラメータ量子化処理部(Q)70、及びビットストリームマルチプレクサ部80を含む。
入力信号l、rは位相回転部20の入力と結合し、それに対応する出力は信号回転部30に接続されている。信号回転部30の主・副信号はそれぞれm、sで示す。主信号mは第1コーダ50を介してマルチプレクサ部80に搬送される。さらに、残差信号sは時間/周波数セレクタ40を介して第2コーダ60に結合され、その後、マルチプレクサ部80に搬送される。位相回転部20からの角パラメータ出力φ1、φ2は、処理部70を介してマルチプレクサ部80に結合している。また、角パラメータ出力αは、信号回転部30から処理部70を介してマルチプレクサ部80に結合している。マルチプレクサ部80は、上記の符号化ビットストリーム出力(bs)100を有する。
動作時には、位相回転部20は信号l、rを処理して、その間の相対的位相差を補償して、それによりパラメータφ1、φ2を生成する。ここで、パラメータφ2は上記の相対的位相差を表す。パラメータφ1、φ2は、量子化して符号化ビットストリーム100に対応するパラメータデータとして含めるために処理部70に送られる。相対的位相差を補償する信号l、rは信号回転部30に送られる。この信号回転部30は、角αの最適値を決定して、信号エネルギーの最大量を主信号mに集中し、信号エネルギーの最小量が残差信号sに行くようにする。主・残差信号m、sは、次にコーダ50、60を通過し、ビットストリーム100に含むために好適なフォーマットに変換される。処理部70は角信号α、φ1、φ2を受け取り、コーダ50、60からの出力と一緒に多重化して、ビットストリーム出力(bs)100を生成する。このように、ビットストリーム(bs)100はデータのストリームを有する。このデータのストリームは、主・残差信号m、sの表示と、角パラメータデータα、φ1、φ2を含む。パラメータφ2は本質的であり、パラメータφ1は任意的であるが、それにもかかわらず含めた方がよい。
コーダ50、60は、好ましくは2つのモノオーディオエンコーダとして実施されるか、あるいは1つのデュアルモノエンコーダとして実施される。任意的に、例えば時間・周波数平面で表された時に識別され、ビットストリーム100に知覚的には貢献しない残差信号sの一部は、時間/周波数セレクタ40で破棄され、これによりスケーラブルなデータ圧縮を提供する。詳細は以下に説明する。
エンコーダ10は、任意的に、入力信号を含む周波数範囲の一部においてその入力信号を処理するために使用することができる。入力信号(l、r)の、エンコーダ10によりエンコードされないこれらの部分は、他の方法を用いて(例えば、上記のように、従来のM/S符号化を用いて)平行してエンコードされる。必要であれば、左(l)と右(r)の入力信号の個別の符号化を実施することもできる。
エンコーダ10はハードウェア(例えば、特定用途集積回路(ASIC)やそのような回路のグループ)で実施することができる。あるいは、エンコーダ10は、コンピュータハードウェア(例えば、独自のソフトウェア駆動の信号処理集積回路やそのような回路のグループ)上で実行されるソフトウェアで実施することもできる。
図6には、エンコーダ10と互換性のあるデコーダを参照符号200で示した。デコーダ200は、ビットストリームデマルチプレクサ210と、第1・第2デコーダ220、230と、パラメータを逆量子化する処理部240と、信号回転デコーダ部250と、入力信号l、rに対応する復号出力l’、r’をエンコーダ10に供給する位相回転復号部260とを有する。デマルチプレクサ210は、エンコーダ10により生成されたビットストリーム(bs)100を受信するように構成されている。このビットストリーム(bs)100は、例えば、CDやDVDなどの光ディスクデータ担体を介して、及び/またはインターネット等の通信ネットワークを介して、エンコーダ10からデコーダ200に搬送される。デマルチプレクサ210でデマルチプレックスされた出力は、デコーダ220、230、及び処理部240の入力に結合されている。第1・第2のデコーダ220、230は、それぞれ出力m’、s’を有する。これらは回転デコーダ部250に結合されている。さらに、処理部240は、回転角出力α’を含む。この回転角出力α’も回転デコーダ部250に結合されている。角α’はエンコーダ10に関する上記角αを復号したものに相当する。角出力φ1’、φ2’は、エンコーダ10に関する上記角φ1、φ2の復号されたものに相当する。これらの角出力φ1’、φ2’は、主・残差信号出力と共に、回転デコーダ部250から位相回転復号部260に搬送される。位相回転復号部260は、図示したように復号出力l’、r’を含む。
動作中、デコーダ200は、エンコーダ10内で実行される符号化ステップの逆を実行する。このように、デコーダ200では、ビットストリーム100がデマルチプレクサ210でデマルチプレックス(demultiplexed)され、主・残差信号に対応するデータを分離する。分離されたデータはデコーダ220、230で再構成され、復号主・残差信号m’、s’を生成する。これらの信号m’、s’は角α’により回転され、角φ1’、φ2’を用いて相対位相を補償し、左右信号l’、r’を生成する。角φ1’、φ2’、α’はデマルチプレクサ210でデマルチプレックスされたパラメータから再構成され、処理部240で分離される。
エンコーダ10において、及び当然デコーダ200においても、ビットストリーム100では、上記の角αよりも、IID値とコヒーレンス値ρを送信することが好ましい。IID値は、チャンネル間差異、すなわち、左右信号l、r間の周波数と時間の変化強度差を示すように構成されている。コヒーレンス値ρは周波数相違コヒーレンス、すなわち、同様に、位相同期語の左右信号l、r間のものを示す。しかし、例えばデコーダ200では、式18を適用することにより、IIDとρの値から角αを容易に求めることができる。
Figure 0005032978
パラメトリックデコーダは、図7において参照符号400で示されている。このデコーダ400は本発明によるエンコーダを補完するものである。デコーダ400は、ビットストリームデマルチプレクサ410と、デコーダ420と、無相関部430と、スケーリング部440と、信号回転部450と、位相回転部460と、逆量子化部470とを有する。デマルチプレクサ410は、ビットストリーム信号(bs)100を受信する入力と、信号m、sのデータ、角パラメータデータ、IIDデータ、及びコヒーレンスデータρの対応する4つの出力を有する。これらの出力は、図示したように、デコーダ420と逆量子化部470に接続されている。デコーダ420からの出力は、スケーリング機能440への入力する残差信号s’の表現を再生する無相関部430を介して結合されている。さらに、主信号m’の再生表現は、デコーダ部420からスケーリング部440に搬送される。スケーリング部440にも逆量子化部470からIID’とコヒーレンスデータρ’が供給される。スケーリング部440からの出力は、中間出力信号を生成する信号回転部450に結合される。これらの中間出力信号は、逆量子化部470で復号された角φ1’、φ2’を用いて位相回転部460で補正され、左右信号l’、r’の表現を再生する。
デコーダ400が図6のデコーダ200と相違する点は、デコーダ400が無相関部430内で実行される無相関プロセスにより、主信号m’に基づき残差信号s’を推定する無相関部430を含む点である。さらに、左右の出力信号l’、r’間のコヒーレンス量はスケーリング動作により決定される。スケーリング動作はスケーリング部440内で実行され、主信号m’と残差信号s’間の比率に係わる。
次に図8を参照して、エンハンスエンコーダを参照符号500で示した。エンコーダ500は、左右入力信号l、rを受信する位相回転部510と、信号回転部520と、時間/周波数セレクタ530と、第1・第2コーダ540、550と、量子化部560と、ビットストリーム出力(bs)100を含むマルチプレクサ570と、を有する。位相回転部510からの角出力φ1、φ2は、位相回転部510から量子化部560に結合している。さらに、位相回転部510からの位相補正された出力は、信号回転部520と時間/周波数セレクタ530を介して接続され、主・残差信号m、s、及びIIDとコヒーレンスρデータ/パラメータをそれぞれ生成する。IID及びコヒーレンスρデータ/パラメータは、量子化部560に結合され、主・残差信号m、sは第1・第2コーダ540、550を通過し、マルチプレクサ570の対応するデータを生成する。マルチプレクサ570は、角φ1、φ2、コヒーレンスρ、及びIIDを記述するパラメータデータを受信するようにも構成される。マルチプレクサ570は、コーダ540、550及び量子化部560からのデータを多重化してビットストリーム(bs)100を生成するように動作する。
エンコーダ500では、残差信号sがビットストリーム100に直接エンコードされる。任意的に、時間/周波数セレクタ部530は、残差信号sの時間/周波数平面のどの部分がビットストリーム(bs)100にエンコードされるか決定するように動作する。ユニット530は、これにより、残差情報がビットストリーム100に含まれる程度を決定し、エンコーダ500で達成できる圧縮とビットストリーム100内に含まれる情報の程度の間の妥協に影響する。
図9には、エンハンスパラメータデコーダを参照符号600で示した。デコーダ600は図8に示したエンコーダ500を補完する。デコーダ600は、デマルチプレクサ部610と、第1・第2デコーダ620、640と、無相関部630と、結合部650と、スケーリング部660と、信号回転部670と、位相回転部680と、逆量子化部690とを有する。デマルチプレクサ部610は、符号化ビットストリーム(bs)100を受信し、第1と第2のデコーダ620、640とデマルチプレクサ部690に対応するデマルチプレックスされた出力を供給する。無相関部630と結合部650と共にデコーダ620、640は、主・残差信号m’、s’の表示を再生するように動作する。これらの表示は、スケーリング部660でスケーリングプロセスを施され、信号回転部670で回転され、中間信号が生成される。この中間信号は、逆量子化部690により生成された角パラメータに応じて回転部680で位相回転され、左右信号l’、r’の表現を再生する。
デコーダ600では、ビットストリーム100は、主信号m’、残差信号s’、及びステレオパラメータの別々のストリームがデマルチプレックスされる。主・残差信号m’、s’は、次にデコーダ620、640でデコードされる。ビットストリーム100にエンコードされた残差信号s’のスペクトル/時間部分は、ビットストリーム100に送られる。この通知は、黙示的に、すなわち時間−周波数平面内の「空いている」領域を検出することにより行われるか、または明示的に、すなわちビットストリーム100から復号された代表シグナルパラメータ(representative signalling parameters)により行う。無相関部630と結合部650は、合成残差信号で、効果的に、復号残差信号s’中の空いている時間−周波数領域を埋めるように動作可能である。この合成信号は、復号された主信号m’と無相関部650からの出力を用いて生成される。他の全ての時間−周波数領域について、残差信号sを適用してこれらの領域の復号残差信号s’を構成する。これらの領域にはスケーリング部660ではスケーリンは適用されない。任意的に、これらの領域について、IIDとコヒーレンスρの替わりにエンコーダ500の上記角αを送信する点には利益がある。単一の角パラメータαを搬送するのに必要なデータレートは、等価なIIDとコヒーレンスρパラメータデータを搬送するのに必要なデータレートより小さいからである。しかし、IIDとρパラメータデータではなくビットストリームで角αパラメータを送信するので、エンコーダ500とデコーダ600は、上記IIDとコヒーレンスρデータを用いる従来のパラメトリックステレオ(PS)システムと後方互換性がなくなる。
エンコーダ10、500のセレクタ部40、530は、好ましくは、残差信号sのどの時間−周波数領域をビットストリーム100にエンコードする必要があるかを選択するときに、知覚モデルを利用するように構成されている。エンコーダ10、500の残差信号sの様々な時間−周波数面(aspects)を符号化することにより、ビットレートスケーラブルなエンコーダ及びデコーダを実現することができる。ビットストリーム100のレイヤーが互いに従属している場合、知覚的に最も関連のある時間−周波数面に対応する符号化データは、そのレイヤー中のベースレイヤーに含まれる。知覚的にそれほど重要でないデータは、そのレイヤー中の改良すなわちエンハンスメントレイヤーに入れられる。「エンハンスメントレイヤー」は「改良レイヤー」とも呼ばれる。このような構成では、好ましくは、ベースレイヤーは主信号mに対応するビットストリームを有し、第1のエンハンスメントレイヤーは上記の角α、φ1、φ2等のステレオパラメータに対応するビットストリームを有し、第2のエンハンスメントレイヤーは残差信号sに対応するビットストリームを有する。
このようなビットストリームデータ100のレイヤー構成により、残差信号sを搬送する第2のエンハンスメントレイヤーは任意的になくても破棄してもよい。さらに、図10に示したデコーダ600は、上記の通り、残りの復号されたレイヤーを合成残差信号と結合して、ユーザのために知覚的に意味のある残差信号を再生することができる。さらに、例えばコストや複雑性の制約によりデコーダ600に任意的に第2のデコーダ640が備えられていない場合、品質は低くなるが、残差信号sをデコードすることも可能である。
上記において、ビットストリーム(bs)100のビットレートをさらに低下させることも可能である。その中の符号化角パラメータφ1、φ2を破棄すればよい。このような状況において、デコーダ600中の位相回転部680は、固定値(例えばゼロ)のデフォルト回転角を用いて、再生出力信号l’、r’を再構成する。このようにビットレートをさらに低下させるには、人間の聴覚システムが高いオーディオ周波数では比較的位相に敏感であるという特徴を利用する。一例として、パラメータφ2をビットストリーム(bs)100で送信し、パラメータφ1は破棄して、ビットレートを低下させる。
上記の本発明によるエンコーダと補完的なデコーダは、潜在的に、広範囲の電子装置とシステムで使用することができる。たとえば、インターネットラジオ、インターネットストリーミング、電子音楽配信(EMD)、固体オーディオプレーヤ・レコーダ、及びテレビジョン、オーディオ製品一般等である。
入力信号(l、r)をエンコードしてビットストリーム100を生成する方法、及びビットストリーム100を復号する補完的方法を説明したが、言うまでもなく、本発明は2つより多い入力信号をエンコードするように適応させることができる。例えば、本発明は、マルチチャンネルオーディオ(例えば、5チャンネルドメスティックシネマシステム)のデータ符号化及び対応する復号を提供するように適応させることができる。
添付した特許請求の範囲では、括弧に入れた数字その他の記号は、請求項の理解を補助するために含めたものであり、請求項の範囲を何ら限定するためのものではない。
言うまでもなく、上記した本発明の実施形態は、添付した特許請求の範囲により画成した本発明の範囲から逸脱することなく、修正することができる。
「有する(comprise)」、「含む(include)」、「組み込む(incorporate)」、「含む(contain)」、「である(is)」、「有する(have)」との表現は、明細書と添付した特許請求の範囲の解釈にあたって、非排除的に解釈すべきである。すなわち、明示的に記載されていないアイテムや構成要素があってもよい。単数形であっても複数あるものと解釈すべきであるし、逆もしかりである。
相対的時間及び位相遅延を伴う信号l[n]、r[n]のシーケンス例を示す図である。 対応する和・差信号m[n]、s[n]を生成するために、図1の信号に適用した式1と2による従来のM/S変換の適用を示す図である。 対応する主信号m[n]と残差信号s[n]を生成するために、図1の信号に適用した、式4による回転変換の適用を示す図である。 対応する主信号m[n]と残差信号s[n]を生成するために、式5ないし15による本発明による複素回転変換の適用を示す図であり、相対的位相及び時間遅延を有する図1の信号に係わらず、残余信号の振幅は比較的小さい。 本発明によるエンコーダを示す概略図である。 本発明によるデコーダの概略図であり、図5のエンコーダと互換である。 数量化ステレオデコーダの概略図である。 本発明によるエンハンス数量化ステレオエンコーダを示す概略図である。 本発明によるエンハンス数量化ステレオデコーダの概略図であり、図9のエンコーダと互換である。

Claims (25)

  1. 複数の入力信号を符号化して対応する符号化データを生成する方法であって、前記入力信号はオーディオ信号または画像信号であり、前記対応する符号化データは対応する符号化オーディオデータまたは符号化画像データを含み、
    (a)前記入力信号を処理して、前記信号間の相対的な位相差と時間差の少なくとも一方を記述する第1のパラメータを決定し、これらの第1のパラメータを適用して前記入力信号を処理し、対応する中間信号を生成する段階と、
    (b)前記中間信号及び/または前記入力信号を処理し、主信号と残差信号を生成するために必要な前記中間信号の回転を記述する第2のパラメータを決定し、前記主信号の大きさまたはエネルギーは前記残差信号の大きさよりも大きく、これらの第2のパラメータを適用して前記中間信号を処理して、前記主信号と残差信号を生成する段階と、
    (c)前記第1のパラメータと前記第2のパラメータとを量子化し、前記主信号と前記残差信号の少なくとも一部を符号化して、対応する量子化データを生成する段階と、
    (d)前記量子化データを多重化して、前記符号化データを生成する段階と、を有することを特徴とする方法。
  2. 請求項1に記載の方法であって、
    前記残差信号の一部のみが前記符号化データに含まれることを特徴とする方法。
  3. 請求項2に記載の方法であって、
    前記符号化データは、前記残差信号のどの部分が前記符号化データに含まれているかを示す1つ以上のパラメータも含むことを特徴とする方法。
  4. 請求項1に記載の方法であって、
    段階(a)と(b)は複素回転により実施され、前記入力信号は周波数領域で表されることを特徴とする方法。
  5. 請求項4に記載の方法であって、
    ステップ(a)と(b)は、前記入力信号のサブバンドに対して独立に実行されることを特徴とする方法。
  6. 請求項5に記載の方法であって、
    前記方法により符号化されない他のサブバンドは、別の対処方法を用いて符号化されることを特徴とする方法。
  7. 請求項1に記載の方法であって、
    段階(c)において、前記方法は、前記残差信号にある知覚的に無関係の時間周波数情報を捨てることにより、前記残差信号を操作する段階であって、前記操作された残差信号は前記符号化データに貢献し、前記無関係の情報は前記入力信号のスペクトル時間表現の選択された部分に対応することを特徴とする方法。
  8. 請求項1に記載の方法であって、
    段階(b)の前記第2のパラメータは、前記残差信号の大きさまたはエネルギーを最小化することにより、求められることを特徴とする方法。
  9. 請求項1に記載の方法であって、
    前記第2のパラメータはチャンネル間強度差パラメータとコヒーレンスパラメータにより表されることを特徴とする方法。
  10. 請求項1に記載の方法であって、
    前記第2のパラメータは、回転角αと前記主信号と残差信号のエネルギー比とにより表されることを特徴とする方法。
  11. 請求項1に記載の方法であって、
    段階(c)と(d)において、前記符号化データは重要度のレイヤーに配置され、前記レイヤーは前記主信号を搬送するベースレイヤーと、ステレオ分離パラメータに対応する第1及び/または第2のパラメータを含む第1のエンハンスメントレイヤーと、前記残差信号の表示を搬送する第2のエンハンスメントレイヤーとを含むことを特徴とする方法。
  12. 請求項11に記載の方法であって、
    前記第2のエンハンスメントレイヤーは、前記残差信号の最も関係のある時間・周波数情報を搬送する第1のサブレイヤーと、前記残差信号の関係のうすい時間・周波数情報を搬送する第2のサブレイヤーとにさらに分割されることを特徴とする方法。
  13. 複数の入力信号を符号化して対応する符号化データを生成するエンコーダであって、前記入力信号はオーディオ信号または画像信号であり、前記対応する符号化データは対応する符号化オーディオデータまたは符号化画像データを含み、
    (a)前記入力信号を処理して、前記信号間の相対的な位相差と時間差の少なくとも一方を記述する第1のパラメータを決定する第1の処理手段であって、これらの第1のパラメータを適用して前記入力信号を処理し、対応する中間信号を生成する第1の処理手段と、
    (b)前記中間信号及び/または前記入力信号を処理し、主信号と残差信号を生成するために必要な前記中間信号の回転を記述する第2のパラメータを決定する第2の処理手段であって、前記主信号の大きさまたはエネルギーは前記残差信号の大きさよりも大きく、これらの第2のパラメータを適用して前記中間信号を処理して、前記主信号と残差信号を生成する第2の処理手段と、
    (c)前記第1のパラメータ、前記第2のパラメータ、及び少なくとも主信号と残差信号の一部を量子化し、対応する量子化データを生成する量子化手段と、
    (d)前記量子化データを多重化して、前記符号化データを生成する多重化手段と、を有することを特徴とするエンコーダ。
  14. 請求項13に記載のエンコーダであって、
    前記残差信号にある知覚的に無関係の時間周波数情報を捨てることにより、前記残差信号を操作する処理手段であって、前記操作された残差信号は前記符号化データに貢献し、前記知覚的に無関係の情報は前記入力信号のスペクトル時間表現の選択された部分に対応するところの処理手段を含むことを特徴とするエンコーダ。
  15. 請求項13に記載のエンコーダであって、
    前記残差信号は操作され、符号化され、符号化データに多重化されることを特徴とするエンコーダ。
  16. 符号化データを復号して複数の入力信号の対応表現を再生する方法であって、前記入力信号は前記符号化データを生成するために事前に符号化されており、前記入力信号はオーディオ信号または画像信号であり、前記符号化データは対応する符号化オーディオデータまたは符号化画像データを含み、該方法は、
    (d)符号化データをデマルチプレックスして、対応する量子化データを生成する段階と、
    (b)前記量子化データを処理して、対応する第1のパラメータと、第2のパラメータと、少なくとも主信号と残差信号とを生成する段階であって、前記主信号の強さまたはエネルギーは前記残差信号のそれよりも大きいところの段階と、
    (c)第2のパラメータを適用して主信号と残差信号を回転して対応する中間信号を生成する段階と、
    (d)第1のパラメータを適用して前記中間信号を処理して前記入力信号の表示を再生する段階であって、前記第1のパラメータは前記信号間の相対的位相差及び時間差の少なくとも一方を記述するところの段階と、を有することを特徴とする方法。
  17. 請求項16に記載の方法であって、
    段階(b)において、残差信号の失われた時間−周波数情報に主信号から求めた合成残差信号を適宜補足する段階をさらに有することを特徴とする方法。
  18. 請求項16に記載の方法であって、
    前記符号化データは、残差信号のどの部分が符号化データに符号化されているかを示すパラメータを含むことを特徴とする方法。
  19. 請求項16に記載の方法であって、
    前記デコーダは、時間/周波数平面に表されたとき、符号化信号の空いている領域を検出することにより、補足を必要とする符号化信号の部分を復号することを特徴とする方法。
  20. 請求項16に記載の方法であって、
    前記デコーダは、空いている領域を示すデータパラメータを検出することにより、代替または補足を要する符号化信号の部分を復号することを特徴とする方法。
  21. 符号化データを復号して複数の入力信号の対応表現を再生するデコーダであって、前記入力信号は前記符号化データを生成するために事前に符号化されており、前記入力信号はオーディオ信号または画像信号であり、前記符号化データは対応する符号化オーディオデータまたは符号化画像データを含み、該デコーダは、
    (a)符号化データをデマルチプレックスして、対応する量子化データを生成するデマルチプレックス手段と、
    (b)前記量子化データを処理して、対応する第1のパラメータと、第2のパラメータと、少なくとも主信号と残差信号とを生成する第1の処理手段であって、前記主信号の強さまたはエネルギーは前記残差信号のそれよりも大きいところの手段と、
    (c)第2のパラメータを適用して主信号と残差信号を回転して対応する中間信号を生成する第2の処理手段と、
    (d)第1のパラメータを適用することにより前記中間信号を処理する第3の処理手段であって、前記第1のパラメータは前記信号間の相対的位相差と時間差のうち少なくとも記述するところの手段と、を有することを特徴とするデコーダ。
  22. 請求項21に記載のデコーダであって、
    前記第2の処理手段は、前記復号残差信号から失われた情報を提供するために、前記復号主信号から求めた補完的合成残差信号を生成するように動作可能であることを特徴とするデコーダ。
  23. 請求項22に記載のデコーダであって、
    前記第1の処理手段は、前記残差信号の実質的に全体を生成するために、残差信号の失われた復号されていない部分を合成するために、残差信号のどの部分が復号されたかを決定するように動作可能であることを特徴とするデコーダ。
  24. 請求項1に記載の方法をコンピュータハードウェア上で実行するソフトウェア。
  25. 請求項16に記載の方法をコンピュータハードウェア上で実行するソフトウェア。
JP2007506882A 2004-04-05 2005-03-29 ステレオコーディング及びデコーディングの方法及び装置 Active JP5032978B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405.1 2004-04-05
EP04103168 2004-07-05
EP04103168.3 2004-07-05
PCT/IB2005/051058 WO2005098825A1 (en) 2004-04-05 2005-03-29 Stereo coding and decoding methods and apparatuses thereof

Publications (2)

Publication Number Publication Date
JP2007531915A JP2007531915A (ja) 2007-11-08
JP5032978B2 true JP5032978B2 (ja) 2012-09-26

Family

ID=34961999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007506882A Active JP5032978B2 (ja) 2004-04-05 2005-03-29 ステレオコーディング及びデコーディングの方法及び装置

Country Status (13)

Country Link
US (2) US7646875B2 (ja)
EP (3) EP1735778A1 (ja)
JP (1) JP5032978B2 (ja)
KR (1) KR101135726B1 (ja)
CN (2) CN1973320B (ja)
BR (1) BRPI0509108B1 (ja)
DK (1) DK3561810T3 (ja)
ES (1) ES2945463T3 (ja)
MX (1) MXPA06011396A (ja)
PL (1) PL3561810T3 (ja)
RU (1) RU2392671C2 (ja)
TW (1) TWI387351B (ja)
WO (1) WO2005098825A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101705113B (zh) * 2009-10-30 2012-12-19 清华大学 一种带引射器的气流床气化炉水冷循环系统

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3561810T3 (da) * 2004-04-05 2023-05-01 Koninklijke Philips Nv Fremgangsmåde til kodning af venstre og højre audioindgangssignaler, tilsvarende koder, afkoder og computerprogramprodukt
BRPI0517949B1 (pt) * 2004-11-04 2019-09-03 Koninklijke Philips Nv dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador
KR101183859B1 (ko) * 2004-11-04 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중채널 오디오 신호들의 인코딩 및 디코딩
CN101151659B (zh) * 2005-03-30 2014-02-05 皇家飞利浦电子股份有限公司 多通道音频编码器、设备、方法及其解码器、设备和方法
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US8422555B2 (en) * 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
KR101426271B1 (ko) * 2008-03-04 2014-08-06 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
CN101604524B (zh) * 2008-06-11 2012-01-11 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
US8473288B2 (en) * 2008-06-19 2013-06-25 Panasonic Corporation Quantizer, encoder, and the methods thereof
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
KR20100089705A (ko) * 2009-02-04 2010-08-12 삼성전자주식회사 3차원 영상 부호화/복호화 장치 및 방법
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
TWI451664B (zh) * 2009-03-13 2014-09-01 Foxnum Technology Co Ltd 編碼器組合
KR101710113B1 (ko) 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US8301803B2 (en) * 2009-10-23 2012-10-30 Samplify Systems, Inc. Block floating point compression of signal data
KR20110049068A (ko) * 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
WO2011080916A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 音声符号化装置および音声符号化方法
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
CN102226852B (zh) * 2011-06-13 2013-01-09 广州市晶华光学电子有限公司 一种数码体视显微镜的成像系统
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2875511B1 (en) 2012-07-19 2018-02-21 Dolby International AB Audio coding for improving the rendering of multi-channel audio signals
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
WO2014126689A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
GB2530311B (en) * 2014-09-19 2017-01-11 Imagination Tech Ltd Data compression
CN107251578B (zh) * 2015-02-25 2018-11-06 株式会社索思未来 信号处理装置
WO2017222582A1 (en) * 2016-06-20 2017-12-28 Intel IP Corporation Apparatuses for combining and decoding encoded blocks
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
US10839814B2 (en) 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
CN110556117B (zh) * 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
CN110556116B (zh) 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
FI3874492T3 (fi) 2018-10-31 2024-01-08 Nokia Technologies Oy Spatiaalisten äänten parametrikoodauksen ja siihen liittyvän dekoodauksen määrittäminen
TWI702780B (zh) 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JP4327420B2 (ja) * 1998-03-11 2009-09-09 パナソニック株式会社 オーディオ信号符号化方法、及びオーディオ信号復号化方法
US6556966B1 (en) * 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CA2323014C (en) * 1999-01-07 2008-07-22 Koninklijke Philips Electronics N.V. Efficient coding of side information in a lossless encoder
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
BR0304231A (pt) * 2002-04-10 2004-07-27 Koninkl Philips Electronics Nv Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos
ES2280736T3 (es) * 2002-04-22 2007-09-16 Koninklijke Philips Electronics N.V. Sintetizacion de señal.
AU2003244932A1 (en) 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
DK3561810T3 (da) * 2004-04-05 2023-05-01 Koninklijke Philips Nv Fremgangsmåde til kodning af venstre og højre audioindgangssignaler, tilsvarende koder, afkoder og computerprogramprodukt
BRPI0517949B1 (pt) * 2004-11-04 2019-09-03 Koninklijke Philips Nv dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101705113B (zh) * 2009-10-30 2012-12-19 清华大学 一种带引射器的气流床气化炉水冷循环系统

Also Published As

Publication number Publication date
RU2392671C2 (ru) 2010-06-20
MXPA06011396A (es) 2006-12-20
EP1944758A2 (en) 2008-07-16
KR101135726B1 (ko) 2012-04-16
TWI387351B (zh) 2013-02-21
EP1944758A3 (en) 2014-09-10
PL3561810T3 (pl) 2023-09-04
ES2945463T3 (es) 2023-07-03
CN1973320A (zh) 2007-05-30
CN101887726A (zh) 2010-11-17
BRPI0509108B1 (pt) 2019-11-19
CN101887726B (zh) 2013-11-20
US7646875B2 (en) 2010-01-12
US8254585B2 (en) 2012-08-28
EP1735778A1 (en) 2006-12-27
EP3561810B1 (en) 2023-03-29
US20110106540A1 (en) 2011-05-05
CN1973320B (zh) 2010-12-15
US20070171944A1 (en) 2007-07-26
EP3561810A1 (en) 2019-10-30
JP2007531915A (ja) 2007-11-08
WO2005098825A1 (en) 2005-10-20
DK3561810T3 (da) 2023-05-01
RU2006139036A (ru) 2008-05-20
KR20070001207A (ko) 2007-01-03
TW200603637A (en) 2006-01-16
BRPI0509108A (pt) 2007-08-28

Similar Documents

Publication Publication Date Title
JP5032978B2 (ja) ステレオコーディング及びデコーディングの方法及び装置
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
RU2416129C2 (ru) Масштабируемое многоканальное кодирование звука
JP5265358B2 (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
CA2603027C (en) Device and method for generating a data stream and for generating a multi-channel representation
RU2380766C2 (ru) Адаптивное остаточное аудиокодирование
US8804967B2 (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
JP6069208B2 (ja) 逆位相のチャネルに対する、改善されたステレオパラメトリック符号化/復号
TWI380286B (en) Multi-channel encoder
JP6978565B2 (ja) マルチチャネル・オーディオ・コンテンツの符号化
JP2007528025A (ja) オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
JPH09252254A (ja) オーディオ復号装置
US8781134B2 (en) Method and apparatus for encoding and decoding stereo audio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110624

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120629

R150 Certificate of patent or registration of utility model

Ref document number: 5032978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150706

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250