JP2008519306A - 信号の組のエンコード及びデコード - Google Patents
信号の組のエンコード及びデコード Download PDFInfo
- Publication number
- JP2008519306A JP2008519306A JP2007539672A JP2007539672A JP2008519306A JP 2008519306 A JP2008519306 A JP 2008519306A JP 2007539672 A JP2007539672 A JP 2007539672A JP 2007539672 A JP2007539672 A JP 2007539672A JP 2008519306 A JP2008519306 A JP 2008519306A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- residual signal
- residual
- decoded
- attenuated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002238 attenuated effect Effects 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000006243 chemical reaction Methods 0.000 claims abstract description 23
- 239000002131 composite material Substances 0.000 claims description 37
- 238000013139 quantization Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
エンコード装置1及び方法は、ほとんどの信号エネルギーを含む主要信号mと、残りの信号エネルギーを含む残留信号sと、変換に関連する信号パラメータIID,ICCとに信号の組を変換する。主要信号m及び残留信号sの選択部分はエンコードされる。残留信号の選択部分は、残留信号の知覚的に関連する部分を通し、残留信号の知覚的にそれ程関連しない部分を減衰し、残留信号の全く関連しない部分を除去する残留信号s´を含む。関連するデコード装置2及び方法は、デコードされた主要信号m´u及び残留信号s´modを夫々生成するようにエンコードされた主要信号及び残留信号をデコードする。合成残留信号s´synはデコードされた主要信号m´uから得られ、減衰された合成残留信号s´syn,modを生成するように減衰される。減衰された合成残留信号s´syn,mod及びデコードされた残留信号s´modは再構成された残留信号s´を生成するよう結合される。デコードされた主要信号m´及び再構成された残留信号s´は、次に出力信号l´,r´の組に変換される。
Description
本発明は、信号コーディング及びデコーディングに関する。更に具体的には、本発明は、入力信号の組をエンコードするための装置及び方法と、エンコードされた入力信号の組をデコードするための装置及び方法とに関する。
信号の組、例えば、2つの音声信号の組(ステレオ)をエンコードすることがよく知られる。MPEG−1レイヤーIII(MP3)などの従来の符号化方式は、符号化効率を改善するためにステレオ符号化ツールを用いる。そのような符号化ツールの1つは、アメリカ合衆国のサンフランシスコで1992年に開催されたPriceedings of the International Conference on Acoustics and Speech Signal Processing(ICASSP)における論文「Sum−difference stereo transform coding」(J.D.ジョンストン及びA.J.フェレイラ著)pp.II569−572で論じられる、ミッド/サイド(M/S)ステレオ符号化又は和−差(sum−difference)符号化として知られる。和−差符号化は、一般的に、一対のステレオ信号をエンコードするために用いられる。
(ほとんど)同一の信号l[n]及びr[n]に関して、これは、対応する差分(又は残留)信号s[n]が0に近く、一方、和信号は実質上全ての信号エネルギーを有するので、大きな符号化利得を与える。従って、この状況では、和信号及び差分信号を符号化するために必要とされるビットレートは、単一チャネルのみを符号化するために必要とされるビットレートに近い。
ここで、左信号及び右信号は、π/4の角度に亘って回転されている。和信号は、ラインl=r上への左右サンプルの予測として解釈され、一方、差分信号は、ラインl=−r上への左右サンプルの予測として解釈される。
幅広い分類の入力信号に関して残留信号の信号出力を最小限とするために(即ち、符号化利得を最大にするために)、回転角度は、信号依存であることを必要とする。以下の単位回転:
は、左右のチャネルへ適用されうる。なお、m[n]及びs[n]は、夫々、主要信号及び残留信号を表し、角度αは、残留信号の電力を最小限として、主要信号の電力を最大限にするよう選択される。
式(3)に従う回転は、残留信号の著しいビットレート低下を許容する。しかし、完全な再構成のために、角度α(又は、角度αを示すパラメータ)が必要とされ、夫々の時間セグメントに対する角度αの送信は、回転手法によって実現されるビットレート節約の大部分を無効にすることが分かっている。
更に、残留信号s[n]を捨てることによって所要のビットレートを低下させることが提案されている。しかし、(一般的に5kHzを下回る)比較的低い周波数では、残留信号s[n]の欠如は、音響信号の劣化を生じさせる。これは、極めて、低周波信号での位相又は時間オフセットに起因することが分かっている。このようなオフセットを許容するために、信号回転法は、左右の信号成分へと、複素数値位相回転を用いることによって拡張されうる。
左信号及び右信号は、それらの複素数値周波数領域表示l[k]及びr[k]によって表され、単一の信号セグメント又はフレームに制限されるとする。時間領域(ウィンドウ)の左右信号から周波数領域表示を、及びその逆に周波数領域の左右信号から時間領域表示を、得るために適用される方法は、離散フーリエ変換(DFT)、短時間(デジタル)フーリエ変換(STFT)及び複素変調フィルタバンクを含む。左右の信号の間の位相差を補償するために、信号モデルは、以下の方法:
で拡張される。
この式で、複素値位相変更行列は、左と右との間の位相差を補償するよう適用される。角度φ2は、右信号を(位相)回転することによって残留信号のエネルギーを最小限とするために使用される。共通角度φ1は、フレーム境界に亘って信号の連続性を最大とするために使用されうる。位相同期の測定及び適用の後、回転角度αは、(周波数及び時間によって変化する)チャネル間強度差(IID)及びチャネル間コヒーレンス(ICC)、又は左右の入力チャネル間の類似性から決定される。
信号マッピング及び/又は変更の後、主要な時間領域信号m[n]及び残りの時間領域信号s[n]は、最初に周波数領域表示m[k]及びs[k]で逆DFT(又は如何なる他の適切な逆変換)を適用することによって得られる。
パラメトリック・ステレオ符号化システムでは、ビットレートは、残留信号を捨てる(即ち、送信しない)ことによって著しく下げられる。デコード装置(受信機)では、合成残留信号は、一般的に、主要信号m[n]からこの信号を抽出することによって生成される。
パラメトリック・ステレオコーダは、低いビットレートで高い音声品質を得ることができるが、このようなコーダの主な欠点は、ビットレートの増大が音声品質の比例増加を生じさせないことである。これは、極めて、デコード装置によって生成された合成残留信号が、概して、類似する空間パラメータ(IID、ICC)を有する場合でさえ、捨てられた実際の残留信号に類似しないという事実に起因する。
より高いビットレートでの音声品質のこのような飽和を解消するために、残留信号の一部をエンコードすることが提案されている。結果として得られるシステムは、音声コーダが残留信号の特定の部分(例えば、低周波帯域)を符号化し、更に、残留信号の残りは両耳性(即ち、空間)パラメータに結合された合成残留信号によって提供されるので、ハイブリッドステレオコーダと呼ばれる。改善された音声品質を保ちながら残留信号を符号化することに起因するビットレートの増大を制限するために、音声品質に寄与する残留信号の時間−周波数部分のみが選択される。これは、残留信号の更なる時間−周波数部分が選択及び符号化をなされうる場合に、ビットレートの増大に伴って音声品質の増大を生じさせる。
しかし、残留信号の部分の選択は、所要のビットレートの比較的突然の変化を引き起こす。所要のビットレートにおけるこのような変化は、エンコード装置又は伝送チャネルのビットレート制限に起因して、常に適応されうるわけではない。結果として、信号品質は、悪影響を及ぼされることがある。更に、送信される残留信号と合成残留信号との間のデコード装置での如何なる急激な切替えも、音響スイッチング・アーティファクトを引き起こす。
「Sum−difference stereo transform coding」(J.D.ジョンストン及びA.J.フェレイラ著)pp.II569−572、Priceedings of the International Conference on Acoustics and Speech Signal Processing(ICASSP)、合衆国サンフランシスコ、1992年
「Sum−difference stereo transform coding」(J.D.ジョンストン及びA.J.フェレイラ著)pp.II569−572、Priceedings of the International Conference on Acoustics and Speech Signal Processing(ICASSP)、合衆国サンフランシスコ、1992年
本発明は、従来技術の上記及び他の問題を解決することと、信号の組をエンコードするための装置及び方法であって、送信された残留信号のそれ程突然ではない変化を可能にする装置及び方法を提供することとを目的とする。
更に、本発明は、信号の組をデコードするための装置及び方法であって、送信された残留信号の変化をより良く処理する装置及び方法を提供することを目的とする。
従って、本発明は、入力信号の組をエンコードするエンコード装置であって:
−大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号と、当該変換に関連する信号パラメータとに前記入力信号の組を変換する変換手段,
−前記残留信号の一部を選択する選択手段,及び
−前記主要信号と、前記残留信号の前記選択された部分とをエンコードするエンコード手段,
を有し、
前記選択手段は、前記残留信号の知覚的にそれ程関連しない部分を減衰し、前記残留信号の最も関連しない部分を除去して、前記残留信号の知覚的に関連する部分を実質的に通すよう配置される、エンコード装置を提供する。
−大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号と、当該変換に関連する信号パラメータとに前記入力信号の組を変換する変換手段,
−前記残留信号の一部を選択する選択手段,及び
−前記主要信号と、前記残留信号の前記選択された部分とをエンコードするエンコード手段,
を有し、
前記選択手段は、前記残留信号の知覚的にそれ程関連しない部分を減衰し、前記残留信号の最も関連しない部分を除去して、前記残留信号の知覚的に関連する部分を実質的に通すよう配置される、エンコード装置を提供する。
高い音声品質を得るために知覚的に極めて重要である前記残留信号の時間−周波数部分は、前記選択手段によって識別され、実質的に変更されないままである。前記残留信号のそれ程重要でない部分は、識別されて、適切に減衰され、一方、全く重要でない部分は除去される。前記残留信号のそれ程重要でない部分を減衰することによって、この信号を符号化するために必要とされるビットレートは低減され、一方、前記残留信号を符号化することによって得られる音声品質の増大は保たれる。
前記選択手段は、更に、利用可能な伝送速度によって制御される。即ち、その選択は、送信及び/又は記憶容量に依存して調整又は制御され、伝送速度が増す場合には前記残留信号の更なる部分を選択し、且つ/あるいは、選択された部分をより少なく減衰する。伝送速度が減じる場合には逆となる。これは、例えば、利用可能な伝送速度(ビットレート)に依存して知覚関連性閾値を作ることによって達成される。
更に、本発明は、大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号とを出力信号の組に変換する変換装置であって:
−合成残留信号を生成する無相関手段,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰手段,及び
−前記出力信号を生成するように前記主要信号及び前記減衰された合成残留信号を処理する処理手段,
を有し、
前記減衰手段は、前記残留信号によって制御されるよう配置される、変換装置を提供する。
−合成残留信号を生成する無相関手段,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰手段,及び
−前記出力信号を生成するように前記主要信号及び前記減衰された合成残留信号を処理する処理手段,
を有し、
前記減衰手段は、前記残留信号によって制御されるよう配置される、変換装置を提供する。
更に具体的には、本発明は、また、大部分の信号エネルギーを有するエンコードされた主要信号と、前記信号エネルギーの残りを有するエンコードされた残留信号と、関連する信号パラメータとを含む入力信号をデコードするデコード装置であって:
−デコードされた主要信号及びデコードされた残留信号を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコード手段,
−前記デコードされた主要信号から合成残留信号を得る無相関手段,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰手段,
−再構成された主要信号及びスケーリングされた減衰合成残留信号を生成するように前記デコードされた主要信号及び前記減衰された合成残留信号をスケーリングするスケーリング手段,
−再構成された残留信号を生成するように前記デコードされた残留信号及び前記スケーリングされた減衰合成残留信号を結合する結合手段,及び
−信号パラメータにより前記スケーリングされたデコードされた主要信号及び前記再構成された残留信号を出力信号の組に変換する変換手段,
を有し、
前記減衰手段は、前記デコードされた残留信号によって制御されるよう配置される、デコード装置を提供する。
−デコードされた主要信号及びデコードされた残留信号を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコード手段,
−前記デコードされた主要信号から合成残留信号を得る無相関手段,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰手段,
−再構成された主要信号及びスケーリングされた減衰合成残留信号を生成するように前記デコードされた主要信号及び前記減衰された合成残留信号をスケーリングするスケーリング手段,
−再構成された残留信号を生成するように前記デコードされた残留信号及び前記スケーリングされた減衰合成残留信号を結合する結合手段,及び
−信号パラメータにより前記スケーリングされたデコードされた主要信号及び前記再構成された残留信号を出力信号の組に変換する変換手段,
を有し、
前記減衰手段は、前記デコードされた残留信号によって制御されるよう配置される、デコード装置を提供する。
前記デコードされた残留信号に従って前記合成残留信号を減衰するための減衰手段を設けることによって、著しく改善された再構成出力信号が得られる。更に、前記合成残留信号から前記デコードされた残留信号への、及びその逆の段階的移行が得られ、如何なるスイッチング・アーティファクトも回避する。結果として、所与のビットレートで、従来技術に比べて、より一層高い音声品質が達成可能であり、あるいは反対に、同様の音声品質がより低いビットレートで達成可能である。
当該デコード装置では、前記デコードされた残留信号に含まれない、又は減衰された、前記残留信号の時間−周波数部分は、結合残留信号を得るよう適切に適合された合成残留信号によって補完される。可能ではあるが、前記合成残留信号のどの時間−周波数部分が、どれくらいデコーダで使用されるべきかを特定する付加的情報を提供することは必須ではない。代わりに、前記合成残留信号の減衰は、両耳性パラメータ(例えば、IID及びICC)、デコードされた変更残留信号及びデコードされた主要信号に基づくことができる。
本発明のデコード装置の好ましい実施例では、前記減衰手段は、前記デコードされた主要信号及び/又は(逆量子化された)信号パラメータを更に受信するよう配置される。
本発明のデコード装置は、更に、前記出力信号の逆位相回転を実行するための逆位相回転手段を有しても良い。
本発明に従うデコード装置の代替の実施例では、前記結合手段は、スケーリングの前に前記デコードされた残留信号及び前記減衰された合成残留信号を結合するように前記減衰手段と前記スケーリング手段との間に配置される。従って、この実施例では、前記デコードされた残留信号は、最初に、前記減衰された合成残留信号に結合され、次に、前記スケーリング手段へ供給される。好ましい実施例では、前記デコードされた残留信号は、前記スケーリングされた減衰合成残留信号に結合される。
本発明は、更に、入力信号の組をエンコードする方法であって:
−大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号と、当該変換に関連する信号パラメータとに前記入力信号の組を変換する変換ステップ,
−前記残留信号の一部を選択する選択ステップ,及び
−前記主要信号と、前記残留信号の前記選択された部分とをエンコードするエンコードステップ,
を有し、
前記選択ステップは、前記残留信号の知覚的にそれ程関連しない部分を減衰し、前記残留信号の最も関連しない部分を除去して、前記残留信号の知覚的に関連する部分を実質的に通すサブステップを有する、方法を提供する。
−大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号と、当該変換に関連する信号パラメータとに前記入力信号の組を変換する変換ステップ,
−前記残留信号の一部を選択する選択ステップ,及び
−前記主要信号と、前記残留信号の前記選択された部分とをエンコードするエンコードステップ,
を有し、
前記選択ステップは、前記残留信号の知覚的にそれ程関連しない部分を減衰し、前記残留信号の最も関連しない部分を除去して、前記残留信号の知覚的に関連する部分を実質的に通すサブステップを有する、方法を提供する。
本発明は、また更に、大部分の信号エネルギーを有するエンコードされた主要信号と、前記信号エネルギーの残りを有するエンコードされた残留信号と、関連する信号パラメータとを含む入力信号をデコードする方法であって:
−デコードされた主要信号及びデコードされた残留信号を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコードステップ,
−前記デコードされた主要信号から合成残留信号を得る無相関ステップ,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰ステップ,
−再構成された主要信号及びスケーリングされた減衰合成残留信号を生成するように前記デコードされた主要信号及び前記減衰された合成残留信号をスケーリングするスケーリングステップ,
−再構成された残留信号を生成するように前記合成残留信号及び前記減衰された合成残留信号を結合する結合ステップ,及び
−信号パラメータにより前記デコードされた主要信号及び前記再構成された残留信号を出力信号の組に変換する変換ステップ,
を有し、
前記減衰ステップは前記デコードされた残留信号によって制御される、方法を提供する。
−デコードされた主要信号及びデコードされた残留信号を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコードステップ,
−前記デコードされた主要信号から合成残留信号を得る無相関ステップ,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰ステップ,
−再構成された主要信号及びスケーリングされた減衰合成残留信号を生成するように前記デコードされた主要信号及び前記減衰された合成残留信号をスケーリングするスケーリングステップ,
−再構成された残留信号を生成するように前記合成残留信号及び前記減衰された合成残留信号を結合する結合ステップ,及び
−信号パラメータにより前記デコードされた主要信号及び前記再構成された残留信号を出力信号の組に変換する変換ステップ,
を有し、
前記減衰ステップは前記デコードされた残留信号によって制御される、方法を提供する。
本発明に従う更なる方法ステップは、以下の記載から明らかとなるであろう。
本発明は、更に、上述したようなエンコード及び/又はデコードの方法を実行するためのコンピュータプログラムプロダクトを提供する。コンピュータプログラムプロダクトは、例えばCD又はDVDなどのデータ媒体に記憶されたコンピュータが実行可能な命令の組を有する。そのコンピュータが実行可能な命令の組は、プログラム可能なコンピュータが上述されたような方法を実行することを可能にする命令の組であって、また、例えばインターネットを介して、遠くのサーバからダウンロードするために使用可能である。
以下、添付の図面に表される実施例を参照して本発明について更に説明する。
図1に示される従来技術のエンコード装置1´は、位相変更(P)ユニット10と、信号回転(R)ユニット11と、コーディング(C)ユニット12と、量子化(Q)ユニット13と、マルチプレクス(Mux)ユニット14とを有する。位相変更ユニット10は、ひと組の入力信号を受信する。示される例では、エンコード装置1´はステレオエンコーダであり、入力信号の組は左信号l及び右信号rから成る。一般的に、信号l及びrは、短時間周波数スペクトラム表示を生ずるよう短時間フーリエ変換(STFT)又は同様の変換に従いうる、例えば時間フレームのような時間セグメントから成る。以下で、信号l及びrは時間セグメントの周波数スペクトラム表示であり、時間/周波数ユニットから成ると考えられても良いとする。如何なるSTFT変換ユニット又は、例えばウィンドウユニット及びFFT(高速フーリエ変換)のような、それらと等価なものも図1に示されないが、存在しても良い。このような変換ユニットは当該技術において周知である。
位相変更ユニット10は、位相角φ1及びφ2を用いて、信号対l、rの位相調整を実行する。第1の共通位相角φ1は、フレーム(時間セグメント)境界に亘って信号の連続性を最大にするために使用可能であり、一方、第2の位相角φ2は、信号の一方、例えば右信号rを回転することによって、その信号の一方のエネルギー(一般的に、後述される残留信号)を最小にするために使用可能である。位相角φ1及びφ2は量子化ユニット13へ入力される。
信号回転(R)ユニット11は、位相調整された信号l及びrを受信し、信号回転を実行して、主要信号m及び残留信号sを生成する。信号l及びrは、主要信号mがほとんどの(好ましくは全ての)信号エネルギーを有し、残留信号sがほとんど(好ましくは全く)信号エネルギーを有さないように回転される。信号l及びrは、更に、主要信号mと残留信号sとの間の相関が信号l及びrの相関よりも低くなるように回転されても良い。
図1の例では、残留信号sは捨てられ、主要信号mのみが(エン)コーディングユニットCによってエンコードされる。信号回転ユニット11は、例えば、回転角α、チャネル間強度差パラメータIID及びチャネル間コヒーレンスパラメータICCなどの信号パラメータを生成する。パラメータの幾つか又は全ては、量子化ユニット13へ供給される。これらのパラメータは関連性を有するので、一般的に回転角αは必要とされない。
量子化ユニット13は、信号パラメータ、示される例では、位相角φ1及びφ2、回転角α並びにパラメータIID及びICCを量子化して、量子化パラメータを生成する。これらの量子化パラメータは、エンコードされた主要信号mと同様に、マルチプレクスユニット14へ供給され、ビットストリームBSにマルチプレクスされる。
従来技術に従う互換性のあるデコード装置は図2に示される。デコード装置2´は、デマルチプレクサ(Demux)20と、デコード(C−1)ユニット21と、無相関(D)ユニット22と、スケーリング(S)ユニット23と、逆信号回転(R−1)ユニット24と、逆位相変更(P−1)ユニット25と、逆量子化(Q−1)ユニット26とを有する。
デマルチプレクサユニット20は、ビットストリームBSを分割して、エンコードされた主要信号をデコードユニット21へ、及び量子化された信号パラメータを逆量子化ユニット26へ供給する。デコードユニット21は、デコードされた主要信号m´uを生成する。このデコードされた主要信号m´uは、無相関ユニット22及びスケーリングユニット23の両方へ供給される。無相関ユニット22は、信号s´synを生成する。この信号s´synは、デコードされた主要信号m´uの無相関化されたバージョンであり、本例では、送信されなかった残留信号sの代わりとしてスケーリングの後に機能を果たす。従って、この合成残留信号s´synは、また、デコードされた主要信号m´u並びに逆量子化された信号パラメータIID´及びICC´とともに、スケーリングユニット23へ供給される。スケーリングユニット23は、デコードされた主要信号m´u及び合成残留信号s´synをスケーリングし、結果として得られる信号m´及びs´の対を逆回転ユニット24へ供給する。逆回転ユニット24で、この信号対は、逆量子化された回転角α´を用いて逆回転される。スケーリングされた残留信号s´が、エンコード装置における残留信号sの近似であることは明らかである。
最後に、逆回転された信号の位相は、逆量子化された位相角φ1´及びφ2´を用いて、逆位相(P−1)変更ユニット25によって調整される。結果として得られた信号l´及びr´が出力される。信号l´及びr´は時間信号の時間/周波数表示であるから、それらは、その後、逆STFT又は同様の変換を用いて時間領域へ変換されても良い。
従来技術のエンコード装置1´及びデコード装置2´は、パラメータが量子化されて、残留信号が捨てられる場合に、高度のデータ圧縮を実現する。しかし、これらの既知の装置は、より高いビットレートに関して、より高い信号品質を可能にしないという欠点を有する。即ち、ビットストリームBSの伝送速度が増す場合に、出力信号l´及びr´の品質はほとんど上がらない。言い換えると、音声品質の飽和が生ずる。このことは、これらの既知の装置を、より高い伝送速度が利用可能であるところの用途にそれほど適さなくする。
上記従来技術の装置に対する改善は、信号品質を改善するよう、残留信号を捨てる代わりにその残留信号も送信するエンコード装置と、送信された残留信号を使用する能力を有するデコード装置とによって提供される。このような装置は、2004年6月5日に出願された欧州特許出願EP04103168.3(PHNL040762)及び対応する出願に記載されている。これら特許文献の全体的内容は本願に援用される。
エンコードされた主要信号及び量子化されたパラメータに加えて(エンコードされた)残留信号を送信するために必要とされる伝送速度を低下させるために、上記欧州特許出願では、残留信号の一部だけをエンコードして送信することが提案されている。即ち、選択がなされて、残留信号の知覚的に関連する部分のみがエンコードされて送信される。このことは、残留信号における知覚的に関連しない情報を捨てて、選択された部分のみをエンコードすることによって実現される。
上記欧州特許出願に従う選択は、図7に表される。図7は、重み付け関数W´を示す。残留信号の一部に割り当てられた重み付けwは適合率zに依存する。適合率zは、残留信号sの電力と、主要信号mの電力との比、即ち、z=P(s)/P(m)、又は、残留信号の(相対的な)知覚関連性を示す如何なる他の係数であっても良い。残留信号の相対電力がある閾値z0を超える場合、重み付け係数wは1に等しい。このことは、残留信号部分が完全にエンコードされて送信されることを意味する。残留信号の相対電力が閾値z0よりも小さい場合、重み付け係数wは0に等しく、残留信号の関連部分は捨てられる。
本発明者は、この選択が粗すぎて、従来技術に従う残留信号のオン及びオフの切替えがスイッチング・アーティファクトを引き起こすことに気付いた。具体的には、本発明者は、デコードされた信号の品質が、送信されたデータの品質を著しく高めることなく改善可能であることに気付いた。従って、本発明は、関連する部分と関連しない部分との間を区別するだけではなく、それ程関連しない部分、即ち、関連しないわけではないが、(最も)関連する部分と同程度に関連するわけではない部分も識別する残留信号の(部分の)選択を提供する。
本発明に従う重み付け関数Wの例は、図8及び9に示される。図8の例では、重み付け関数Wは、2つの閾値z0及びz1を有する。zがz0よりも小さいならば、重み付け係数wは0に等しく、従って、残留信号は完全に捨てられる。zがz0よりも大きいがz1よりも小さいならば、重み付け係数wは(本発明では)5に等しい(例えば0.25又は0.67などの他の値が使用されても良いことは明らかである。)。重み付け関数のこの領域では、残留信号は捨てられないが、減衰される。zがz1よりも大きいならば、wは1に等しく、全ての残留信号は、実質的に減衰されることなく使用される。
図9の例では、重み付け係数wは、0(z=z0の場合)から0.5(z=z1の場合)を介して1.0(z=1の場合)まで徐々に増大する。結果として、最も関連のある信号部分(z=1)のみが1に等しい重み付け係数を有し、z0よりも大きい適合率zを有する全ての信号部分は0ではない重み付け係数wを有する。当然、他の関数が、図8及び9で表されるもの以外で使用されても良い。一般に、重み付け関数は、元の信号対l、rの再構成の音声品質に対する重大な貢献を生じない残留信号の部分が除去され、中間の知覚関連性を有する残留信号の部分が減衰され、極めて重要な部分が実質的に減衰されずに通されるという特性を有しうる。
本発明に従うエンコード装置の単なる例としての実施例は、図3に表される。本発明のエンコード装置1は、同じく、位相変更(P)ユニット10と、信号回転(R)ユニット11と、コーディング(C)ユニット12と、量子化(Q)ユニット13と、マルチプレクス(Mux)ユニット14とを有する。更に、エンコード装置1は、選択及び減衰(S&A)ユニット15と、追加のコーディング(C)ユニット16とを有する。選択及び減衰ユニット15については、後に、図10を参照して更に詳細に説明する。
従来技術の装置と同様に、位相変更ユニット10は、ひと組の入力信号を受信する。図3に示される限定されない例では、エンコード装置1はステレオエンコーダであり、入力信号の組は左信号l及び右信号rから成る。一般的に、信号l及びrは、短時間周波数スペクトラム表示を生ずるよう短時間フーリエ変換(STFT)又は同様の変換に従いうる、例えば時間フレームのような時間セグメントから成る。以下で、信号l及びrは時間セグメントの周波数スペクトラム表示であり、時間/周波数ユニットから成ると考えられても良いとする。
図3のエンコード装置1では、信号回転ユニット11によって生成される残留信号sは捨てられないが、選択及び減衰(S&A)ユニット15へ供給される。選択及び減衰ユニット15は、次に、例えば図8又は図9に表される重み付け関数Wなどの重み付け関数に従ってフレームを選択する。本発明に従って、この選択は、また、減衰を含みうる。即ち、重み付け係数(図8のw)は、0から1までのいずれかの値を有し(重み付け係数は正規化されるとする。)、この場合に、0ではない値は選択の意味を含み、また、1よりも小さいが0ではない値は減衰の意味を含む。
選択及び減衰ユニット15は残留信号の時間/周波数単位を選択するよう配置されることが知られる。この単位は、便宜上、フレームと呼ばれる。しかし、これらの単位又は「フレーム」が、フレームを決定する如何なる既存のプロトコルにも応じることは必要ではない。
重み付けされた残留信号smodは、第2の、即ち追加の、エンコードユニット16へ供給される。エンコードユニット16の出力は、マルチプレクスユニット14へ供給されて、ビットストリームBSにマルチプレクスされる。
図3の例となるエンコード装置1は位相変更ユニット10を設けられているが、このようなユニットは必須ではなく、位相変更が必要とされないならば省略されても良い。同様に、量子化ユニット13は、量子化及び関連するデータ整理が必要とされないならば省略されても良い。
図3の装置1では、信号パラメータIID、ICC、位相角φ1及びφ2及びいずれかの他のパラメータ(例えば、回転角α)は、ユニット10及び11で決定され、位相及び/又は回転の調整のために使用され、次に、これらのパラメータの送信のために必要とされるデータ量を減らすよう量子化ユニット13で量子化される。代替の実施例では、パラメータは、本実施例と同じくユニット10及び11で決定されるが、次に量子化ユニット13で量子化され、その後、位相及び回転の調整を実行するよう位相及び信号回転ユニット10及び11へ帰還される。結果として、量子化されたパラメータは、量子化されていないパラメータの代わりに、ユニット10及び11によって使用される。このことは、位相及び回転の調整がデコード装置で使用されうるのと同じ(量子化)パラメータによって制御され、従って、量子化に起因する如何なる不一致も回避するという利点を有する。
上記欧州特許出願EP04103168.1(PHNL040462)は、同様の構造を有するエンコード装置を開示することが知られる。しかし、従来技術のエンコード装置では、フレームセレクタは、本発明の選択及び減衰ユニット15を置換する。従来技術のフレームセレクタは、知覚関連性の2つのレベル、即ち「関連がある」又は「ない」の間のみを区別するよう配置される。対照的に、本発明のエンコード装置は、例えば、「関連がある」、「それ程関連がない」及び「関連がない」、並びに、間にあるいずれかの追加の所望レベルなどの、知覚関連性の3又はそれ以上(一般には、複数)のレベルの間を区別するよう配置された選択及び減衰(S&A)ユニットを有する。
従って、本発明のエンコード装置1が、残留信号sの変更バージョンsmodを更にエンコードし、その変更が、所要の伝送速度を低下させるように選択(即ち、ある信号部分/ユニットを捨てること。)及び減衰(即ち、ある選択された信号部分/ユニットを減衰すること。)の両方を有することは明らかである。ある減衰された信号部分を更にエンコードすることによって、デコードされた信号の品質は改善されうる。
この点で、重み付け関数(図8及び9のW)が利用可能な帯域幅(最大伝送速度)に従って調整されうることは明らかである。例えば、図9の重み付け関数Wは、より大きい帯域幅が利用可能となる場合に左へシフトされて、減衰及び下位閾値z0を下げうる。反対に、関数Wは、利用可能な帯域幅(即ち、伝送容量)が低減される場合には、右へシフトされうる(あるいは、1よりも小さい正の数を乗じられる)。図8又は9の重み付け関数Wは、時間依存、周波数依存、又はそれら両方であっても良い。例えば、より低い周波数は、より高い周波数ほどに減衰され得ない。重み付け関数W又はその等価なものを用いて、制御される選択及び重み付けが実現される。
図3の選択及び減衰(S&A)ユニット15は、図10で更に詳細に示される。図10の単なる例となる選択及び減衰ユニット15は、信号解析(X)部151と、減衰(A)部152とを有するように示される。信号解析部151は、残留信号sを受信し、例えばその周波数領域毎の電力を決定することによって、その(知覚)関連性を決定する。図10には図示されていないが、この信号解析部151は、更に、残留信号sの知覚関連性の改善された推定を提供するよう主要信号を受信しても良い。
残留信号s及び関連性情報は、両方とも、減衰部152へ送られる。減衰部152は、信号解析部151による関連性情報の生成に依存して残留信号sを減衰する。ある信号部(例えば、時間/周波数セグメント)は減衰されることなく伝送され、他は完全に減衰され(従って、遮断され)、一方、更に残りは本発明に従って部分的に減衰される。即ち、これら残りの信号部分は通されるが、その電力は低減される。信号smodは、減衰されていない信号部分と、部分的に減衰された信号と、「空の」(完全に減衰された)信号部分とから成り、従って、元の残留信号sよりも低い電力(従って、より小さい振幅)を有しており、より有効に符号化可能である。
減衰部152は、減衰部が利用可能なビットレートに依存して減衰を調整することを可能にするビットレート(BR)情報を受信することもできる。
選択及び減衰ユニット15の他の実施例が、例えば、スイッチング機能が特定の信号部分を遮断するために存在するところの実施例など、考えられる。また、ビットレート(BR)情報は、減衰部152の代わりに選択部151へ供給されても良い。
上記エンコード装置に加えて、本発明は、また、本発明のエンコード装置を用いて、又は互換性のある装置を用いてエンコードされた信号をデコードするためのデコード装置を提供する。
上記EP04103168.3(PHNL040762)に記載されるデコード装置2″は、図4に表される。デコード装置2″は、デマルチプレクス(Demux)ユニット20と、第1のデコード(C−1)ユニット21と、第2のデコード(C−1)ユニット27と、無相関(D)ユニット22と、結合(+)ユニット28と、スケーリング(S)ユニット23と、逆回転(R−1)ユニット24と、逆位相変更(P−1)ユニット25と、逆量子化(Q−1)ユニット26とを有する。図4のデコード装置2″は、デコードされた変更残留信号s´modを生成する第2のデコーダ27が存在する点で、図2のデコード装置2´と異なる。このデコードされた変更残留信号s´modは、無相関ユニット22によって生成される合成残留信号s´synと結合されて、再構成された(スケーリングされていない)残留信号s´uを供給する。従って、デコード装置2″では、(再構成された)残留信号s´を生成するようスケーリングユニット23へ供給された(再構成されたが、スケーリングはされていない)残留信号s´uは、合成残留信号及びデコードされた変更された(即ち、選択されてスケーリングされた)残留信号の結合(一般的には和)である。
しかし、デコードされた変更残留信号s´modは、しばしば、0に等しいか、あるいは極めて小さい。この信号が0に等しい場合、スケーリングユニット23へ供給される残留信号s´uは、合成残留信号s´synに等しく、その振幅及び/又はエネルギーは、基本的にはデコードされた変更信号m´の振幅に等しい。デコードされた変更残留信号s´modが小さい場合には、デコード(量子化)雑音は比較的大きく、歪みを導入しうる。更に、結合ユニット28によって生成された結合残留信号s´uの電力は信号s´modに伴って変化する。これは、元の残留信号sとの更なる不一致を引き起こす。更に、2つの残留信号の間の「切替え(スイッチング)」は信号の不連続性を引き起こす。
本発明は、デコードされた残留信号s´modによって制御される減衰ユニットを設けることによってこの問題を解決する。このことは、合成残留信号s´syn(の電力及び/又は振幅)が、デコードされた変更残留信号s´mod(の電力及び/又は振幅)によって制御されることを可能にする。このようにして、これらの信号の結合された電力は、エンコード装置で生成される元の残留信号sの電力に対応し、如何なるスイッチング・アーティファクトも実質的に回避される。従って、送信されなかった元の残留信号sの如何なる部分も、合成残留信号s´synによって適切に補償可能である。
図5に限定されない例として示される本発明のデコード装置2は、上記構成要素に加えて、減衰(A)ユニット29を有する。この減衰ユニット29は、合成残留信号s´synを受信し、変更された合成残留信号s´syn,modを生成する。この変更合成残留信号s´syn,modはスケーリングユニット23へ供給される。減衰ユニット29は、デコードされた残留信号s´modによって制御され、また、(スケーリングされていない)デコードされた主要信号m´uと、随意的に、逆量子化された信号パラメータIDD´及びICC´を受信する。結果として、結合残留信号s´(これは、本実施例では、s´syn,mod及びs´modの和に等しい。)の電力(又は振幅)は、実質的に、元の残留信号sの振幅(又は電力)に等しくされうる。結果として、出力信号l´及びr´の空間特性は、元の信号l及びrの空間特性に整合するよう生成されうる。利用可能な場合には、受信された(デコードされた)残留信号s´modを用いることによって、正確な波形を有さない合成残留信号s´synによって引き起こされる如何なる悪影響も、最小限にされる。
この好ましい実施例では、変更された(即ち、減衰された)合成残留信号s´syn,modは、最初にスケーリングユニット23によってスケーリングされ、次に、デコードされた残留信号s´modと結合される。スケーリングユニット23は、逆量子化ユニット26からデコードされた信号パラメータ(例えば、IID´及びICC´)を受信しても良く、信号m´u及びs´syn,modをスケーリングし、それらの相対振幅(及び/又は相対電力)を然るべく調整する。
ここで、sin(γ)は合成残留信号に適用されるスケーリング係数であり、γは、チャネル間コヒーレンス及び強度差両耳性パラメータから導出される主要信号と(未変更の)残留信号との間の比であって:
と表される。なお、
である。
望ましくは、この減衰は、広帯域信号s´syn[n]に適用されず、むしろ、音声信号の全帯域幅のうちのより小さな部分のみを夫々表す信号(又は周波数領域表示)、即ち、適切な時間/周波数セグメントに適用される。
デコード装置2の幾つかのユニットは任意であることが知られる。例えば、逆位相ユニット25は、位相変更が必要とされないならば削除されても良い。このように変形されたデコード装置2は、図6に表される。図6のデコード装置では、結合ユニット28は、デコードされた残留信号s´modがスケーリングの前に減衰された合成残留信号s´syn,modに結合されるように、減衰ユニット29とスケーリングユニット23との間に配置されている。当然、図5及び6並びに他の図面の実施例の特徴は、表されない更なる実施例を提供するように置換されても良い。
逆量子化ユニット26は、送信されるパラメータが量子化されないならば削除されても良い。デマルチプレクサ20は、データパケットとして又は他の形式でビットストリームBSを受信するよう配置されても良い。
添付の図面は、主として装置に向けられているが、それらは、また、本発明に従う方法も反映する。更に具体的には、入力信号の組をエンコードする本発明の方法は:
−大部分の信号エネルギーを有する主要信号(m)と信号エネルギーの残りを有する残留信号(s)と、変換に関連する信号パラメータ(IDD,ICC)とに入力信号の組を変換する変換ステップ(ユニット10及び11)と、
−残留信号(s)の一部を選択する選択ステップ(ユニット15)と、
−主要信号(m)と、残留信号(s)の選択された部分とをエンコードするエンコードステップ(ユニット12及び16)とを有し、
選択ステップ(ユニット15)は、(図8及び9に表されるように、)残留信号(s)の知覚的にそれ程関連しない部分を減衰し、残留信号(s)の最も関連しない部分を除去して、残留信号(s)の知覚的に関連する部分を実質的に通すサブステップを有する。
−大部分の信号エネルギーを有する主要信号(m)と信号エネルギーの残りを有する残留信号(s)と、変換に関連する信号パラメータ(IDD,ICC)とに入力信号の組を変換する変換ステップ(ユニット10及び11)と、
−残留信号(s)の一部を選択する選択ステップ(ユニット15)と、
−主要信号(m)と、残留信号(s)の選択された部分とをエンコードするエンコードステップ(ユニット12及び16)とを有し、
選択ステップ(ユニット15)は、(図8及び9に表されるように、)残留信号(s)の知覚的にそれ程関連しない部分を減衰し、残留信号(s)の最も関連しない部分を除去して、残留信号(s)の知覚的に関連する部分を実質的に通すサブステップを有する。
更に、大部分の信号エネルギーを有するエンコードされた主要信号と、信号エネルギーの残りを有するエンコードされた残留信号と、関連する信号パラメータとを含む入力信号(BS)をデコードする方法は:
−デコードされた主要信号(m´)及びデコードされた残留信号(s´mod)を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコードステップ(ユニット21及び27)と、
−デコードされた主要信号(m´)から合成残留信号(s´syn)を得る無相関ステップ(ユニット22)と、
−減衰された合成残留信号(s´syn,mod)を生成するように合成残留信号(s´syn)を減衰する減衰ステップ(ユニット29)と、
−残留信号(s´)を生成するようにデコードされた残留信号(s´mod)及び減衰された合成残留信号(s´syn,mod)を結合する結合ステップ(ユニット28)と、
−信号パラメータ(IID´,ICC´)によりデコードされた主要信号(m´)及び再構成された残留信号(s´)を出力信号(l´,r´)の組に変換する変換ステップとを有する。
−デコードされた主要信号(m´)及びデコードされた残留信号(s´mod)を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコードステップ(ユニット21及び27)と、
−デコードされた主要信号(m´)から合成残留信号(s´syn)を得る無相関ステップ(ユニット22)と、
−減衰された合成残留信号(s´syn,mod)を生成するように合成残留信号(s´syn)を減衰する減衰ステップ(ユニット29)と、
−残留信号(s´)を生成するようにデコードされた残留信号(s´mod)及び減衰された合成残留信号(s´syn,mod)を結合する結合ステップ(ユニット28)と、
−信号パラメータ(IID´,ICC´)によりデコードされた主要信号(m´)及び再構成された残留信号(s´)を出力信号(l´,r´)の組に変換する変換ステップとを有する。
更なる方法ステップが、また、図面から導かれても良い。
本発明のエンコード方法及び装置並びにデコード方法及び装置は、オーディオシステム、(例えば、周知のMP3又はAACフォーマットを用いる)ソリッドステート・オーディオプレーヤ、電子音楽配信、インターネットラジオ、インターネットストリーミング、及び、音声コーディングが有利となりうる他の用途で利用されても良い。
本発明は、エンコード時に、残留信号が少なくとも3つのカテゴリ、即ち、知覚的に「関連性がある」、「それ程関連性がない」及び「全く関連性がない」に再分割され、更に、残留信号が適宜減衰されうるという見識に基づく。本発明は、デコード時に、デコードされた残留信号が、合成残留信号の減衰を制御して、再構成された残留信号を生成するために用いられうるという更なる見識から恩恵を受ける。
明らかなように、本願で用いられる如何なる用語も、本発明の適用範囲を限定するように解釈されるべきではない。具体的には、語「有する」は、特に挙げられていない如何なる要素も除外することを意味しているわけではない。単一の(回路)素子は、複数の(回路)素子又はそれらの等価なものにより置換されても良い。
当業者にとっては明らかなように、本発明は上記実施例に限定されず、多数の変更及び付加が添付の特許請求の範囲で定められる本発明の適用範囲から逸脱することなくなされうる。
Claims (26)
- 入力信号の組をエンコードするエンコード装置であって:
−大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号と、当該変換に関連する信号パラメータとに前記入力信号の組を変換する変換手段,
−前記残留信号の一部を選択する選択手段,及び
−前記主要信号と、前記残留信号の前記選択された部分とをエンコードするエンコード手段,
を有し、
前記選択手段は、前記残留信号の知覚的にそれ程関連しない部分を減衰し、前記残留信号の最も関連しない部分を除去して、前記残留信号の知覚的に関連する部分を実質的に通すよう配置される、エンコード装置。 - 前記選択手段は、少なくとも3つの別個の重み付け値を有する重み付け関数を与えられる、請求項1記載のエンコード装置。
- 前記重み付け関数は時間及び/又は周波数に依存する、請求項2記載のエンコード装置。
- 前記エンコードされた信号及び前記信号パラメータを結合出力信号にマルチプレクスするマルチプレクス手段を更に有する、請求項1記載のエンコード装置。
- 信号パラメータを量子化する量子化手段を更に有する、請求項1記載のエンコード装置。
- 大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号とを出力信号の組に変換する変換装置であって:
−合成残留信号を生成する無相関手段,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰手段,及び
−前記出力信号を生成するように前記主要信号及び前記減衰された合成残留信号を処理する処理手段,
を有し、
前記減衰手段は、前記残留信号によって制御されるよう配置される、変換装置。 - 前記処理手段は、結合残留信号を生成するよう前記残留信号及び減衰された合成残留信号を結合する結合手段を有する、請求項6記載の変換装置。
- 大部分の信号エネルギーを有するエンコードされた主要信号と、前記信号エネルギーの残りを有するエンコードされた残留信号と、関連する信号パラメータとを含む入力信号をデコードするデコード装置であって:
−デコードされた主要信号及びデコードされた残留信号を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコード手段,
−前記デコードされた主要信号から合成残留信号を得る無相関手段,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰手段,
−再構成された主要信号及びスケーリングされた減衰合成残留信号を生成するように前記デコードされた主要信号及び前記減衰された合成残留信号をスケーリングするスケーリング手段,
−再構成された残留信号を生成するように前記デコードされた残留信号及び前記スケーリングされた減衰合成残留信号を結合する結合手段,及び
−信号パラメータにより前記スケーリングされたデコードされた主要信号及び前記再構成された残留信号を出力信号の組に変換する変換手段,
を有し、
前記減衰手段は、前記デコードされた残留信号によって制御されるよう配置される、デコード装置。 - 前記減衰手段は、前記デコードされた主要信号を更に受信するよう配置される、請求項8記載のデコード装置。
- 前記減衰手段は、信号パラメータを更に受信するよう配置される、請求項8記載のデコード装置。
- 前記出力信号の逆位相回転を実行する逆位相回転手段を更に有する、請求項8記載のデコード装置。
- 前記結合手段は、スケーリングの前に前記デコードされた残留信号及び前記減衰された合成残留信号を結合するように前記減衰手段と前記スケーリング手段との間に配置される、請求項8記載のデコード装置。
- ビットストリームを分離するデマルチプレクスユニットと、量子化された信号パラメータを逆量子化する逆量子化ユニットとを更に有する、請求項8記載のデコード装置。
- 請求項1記載のエンコード装置を有するオーディオシステム。
- 請求項8記載のデコード装置を有するオーディオシステム。
- 入力信号の組をエンコードする方法であって:
−大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号と、当該変換に関連する信号パラメータとに前記入力信号の組を変換する変換ステップ,
−前記残留信号の一部を選択する選択ステップ,及び
−前記主要信号と、前記残留信号の前記選択された部分とをエンコードするエンコードステップ,
を有し、
前記選択ステップは、前記残留信号の知覚的にそれ程関連しない部分を減衰し、前記残留信号の最も関連しない部分を除去して、前記残留信号の知覚的に関連する部分を実質的に通すサブステップを有する、方法。 - 前記選択ステップは、少なくとも3つの別個の重み付け値を有する重み付け関数を含む、請求項16記載の方法。
- 前記重み付け関数は時間及び/又は周波数に依存する、請求項17記載の方法。
- 大部分の信号エネルギーを有する主要信号と、前記信号エネルギーの残りを有する残留信号とを出力信号の組に変換する方法であって:
−合成残留信号を生成する無相関ステップ,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰ステップ,及び
−前記出力信号を生成するように前記主要信号及び前記減衰された合成残留信号を処理する処理ステップ,
を有し、
前記減衰ステップは前記残留信号によって制御される、方法。 - 前記処理ステップは、結合残留信号を生成するよう前記残留信号及び減衰された合成残留信号を結合する結合する、請求項19記載の方法。
- 大部分の信号エネルギーを有するエンコードされた主要信号と、前記信号エネルギーの残りを有するエンコードされた残留信号と、関連する信号パラメータとを含む入力信号をデコードする方法であって:
−デコードされた主要信号及びデコードされた残留信号を夫々生成するように前記エンコードされた主要信号及び前記エンコードされた残留信号をデコードするデコードステップ,
−前記デコードされた主要信号から合成残留信号を得る無相関ステップ,
−減衰された合成残留信号を生成するように前記合成残留信号を減衰する減衰ステップ,
−再構成された主要信号及びスケーリングされた減衰合成残留信号を生成するように前記デコードされた主要信号及び前記減衰された合成残留信号をスケーリングするスケーリングステップ,
−再構成された残留信号を生成するように前記合成残留信号及び前記減衰された合成残留信号を結合する結合ステップ,及び
−信号パラメータにより前記デコードされた主要信号及び前記再構成された残留信号を出力信号の組に変換する変換ステップ,
を有し、
前記減衰ステップは前記デコードされた残留信号によって制御される、方法。 - 前記減衰ステップは、前記デコードされた主要信号及び/又は信号パラメータを更に有する、請求項21記載の方法。
- 前記デコードされた残留信号及び前記減衰された合成残留信号はスケーリングの前に結合される、請求項21記載の方法。
- 請求項16記載のエンコード方法を実行するコンピュータプログラム。
- 請求項19記載の変換方法を実行するコンピュータプログラム。
- 請求項21記載のデコード方法を実行するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04105527 | 2004-11-04 | ||
EP05103082 | 2005-04-18 | ||
PCT/IB2005/053548 WO2006048815A1 (en) | 2004-11-04 | 2005-10-31 | Encoding and decoding a set of signals |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008519306A true JP2008519306A (ja) | 2008-06-05 |
Family
ID=35530914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007539672A Pending JP2008519306A (ja) | 2004-11-04 | 2005-10-31 | 信号の組のエンコード及びデコード |
Country Status (5)
Country | Link |
---|---|
US (3) | US7835918B2 (ja) |
JP (1) | JP2008519306A (ja) |
BR (1) | BRPI0517949B1 (ja) |
MX (1) | MX2007005261A (ja) |
WO (1) | WO2006048815A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010078915A (ja) * | 2008-09-26 | 2010-04-08 | Fujitsu Ltd | オーディオ復号方法、装置、及びプログラム |
JP2010139671A (ja) * | 2008-12-11 | 2010-06-24 | Fujitsu Ltd | オーディオ復号装置、方法、及びプログラム |
JP2013502607A (ja) * | 2009-08-18 | 2013-01-24 | サムスン エレクトロニクス カンパニー リミテッド | マルチチャネルオーディオデコーディング方法及び装置 |
JP2013508770A (ja) * | 2009-10-23 | 2013-03-07 | サムスン エレクトロニクス カンパニー リミテッド | 位相情報と残余信号を用いる符号化/復号化装置及び方法 |
JP2013050540A (ja) * | 2011-08-30 | 2013-03-14 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US11978463B2 (en) | 2018-05-31 | 2024-05-07 | Huawei Technologies Co., Ltd. | Stereo signal encoding method and apparatus using a residual signal encoding parameter |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0509108B1 (pt) * | 2004-04-05 | 2019-11-19 | Koninklijke Philips Nv | método para codificar uma pluralidade de sinais de entrada, codificador para codificar uma pluralidade de sinais de entrada, método de decodificar dados, e decodificador |
US7649135B2 (en) * | 2005-02-10 | 2010-01-19 | Koninklijke Philips Electronics N.V. | Sound synthesis |
EP1866911B1 (en) * | 2005-03-30 | 2010-06-09 | Koninklijke Philips Electronics N.V. | Scalable multi-channel audio coding |
JP5122681B2 (ja) | 2008-05-23 | 2013-01-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ |
CN102084418B (zh) * | 2008-07-01 | 2013-03-06 | 诺基亚公司 | 用于调整多通道音频信号的空间线索信息的设备和方法 |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
CA3057366C (en) | 2009-03-17 | 2020-10-27 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
KR20110049068A (ko) * | 2009-11-04 | 2011-05-12 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법 |
JP5809066B2 (ja) * | 2010-01-14 | 2015-11-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置および音声符号化方法 |
WO2011095913A1 (en) * | 2010-02-02 | 2011-08-11 | Koninklijke Philips Electronics N.V. | Spatial sound reproduction |
CA2793140C (en) | 2010-04-09 | 2016-05-31 | Dolby International Ab | Mdct-based complex prediction stereo coding |
US9065576B2 (en) | 2012-04-18 | 2015-06-23 | 2236008 Ontario Inc. | System, apparatus and method for transmitting continuous audio data |
US9560444B2 (en) * | 2013-03-13 | 2017-01-31 | Cisco Technology, Inc. | Kinetic event detection in microphones |
BR122021009022B1 (pt) | 2013-04-05 | 2022-08-16 | Dolby International Ab | Método de decodificação para decodificar dois sinais de áudio, mídia legível por computador, e decodificador para decodificar dois sinais de áudio |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
US10580420B2 (en) | 2017-10-05 | 2020-03-03 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3776546B1 (en) * | 2018-04-05 | 2022-01-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Support for generation of comfort noise, and generation of comfort noise |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
GB8913758D0 (en) * | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5136650A (en) * | 1991-01-09 | 1992-08-04 | Lexicon, Inc. | Sound reproduction |
US5434989A (en) * | 1991-02-19 | 1995-07-18 | Matsushita Electric Industrial Co., Ltd. | Cache memory for efficient access with address selectors |
US5796849A (en) * | 1994-11-08 | 1998-08-18 | Bolt, Beranek And Newman Inc. | Active noise and vibration control system accounting for time varying plant, using residual signal to create probe signal |
US5771299A (en) | 1996-06-20 | 1998-06-23 | Audiologic, Inc. | Spectral transposition of a digital audio signal |
US5870480A (en) * | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
FI113147B (fi) * | 2000-09-29 | 2004-02-27 | Nokia Corp | Menetelmä ja signaalinkäsittelylaite stereosignaalien muuntamiseksi kuulokekuuntelua varten |
US8605911B2 (en) * | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US20040086130A1 (en) * | 2002-05-03 | 2004-05-06 | Eid Bradley F. | Multi-channel sound processing systems |
ATE377339T1 (de) * | 2002-07-12 | 2007-11-15 | Koninkl Philips Electronics Nv | Audio-kodierung |
WO2004086817A2 (en) * | 2003-03-24 | 2004-10-07 | Koninklijke Philips Electronics N.V. | Coding of main and side signal representing a multichannel signal |
US7330552B1 (en) * | 2003-12-19 | 2008-02-12 | Lamance Andrew | Multiple positional channels from a conventional stereo signal pair |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
BRPI0509108B1 (pt) | 2004-04-05 | 2019-11-19 | Koninklijke Philips Nv | método para codificar uma pluralidade de sinais de entrada, codificador para codificar uma pluralidade de sinais de entrada, método de decodificar dados, e decodificador |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
-
2005
- 2005-10-31 WO PCT/IB2005/053548 patent/WO2006048815A1/en active Application Filing
- 2005-10-31 US US11/718,239 patent/US7835918B2/en active Active
- 2005-10-31 BR BRPI0517949A patent/BRPI0517949B1/pt active IP Right Grant
- 2005-10-31 MX MX2007005261A patent/MX2007005261A/es not_active Application Discontinuation
- 2005-10-31 JP JP2007539672A patent/JP2008519306A/ja active Pending
-
2010
- 2010-10-08 US US12/900,733 patent/US8010373B2/en active Active
- 2010-10-08 US US12/900,722 patent/US8170871B2/en active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010078915A (ja) * | 2008-09-26 | 2010-04-08 | Fujitsu Ltd | オーディオ復号方法、装置、及びプログラム |
US8619999B2 (en) | 2008-09-26 | 2013-12-31 | Fujitsu Limited | Audio decoding method and apparatus |
JP2010139671A (ja) * | 2008-12-11 | 2010-06-24 | Fujitsu Ltd | オーディオ復号装置、方法、及びプログラム |
US8374882B2 (en) | 2008-12-11 | 2013-02-12 | Fujitsu Limited | Parametric stereophonic audio decoding for coefficient correction by distortion detection |
JP2013502607A (ja) * | 2009-08-18 | 2013-01-24 | サムスン エレクトロニクス カンパニー リミテッド | マルチチャネルオーディオデコーディング方法及び装置 |
JP2013508770A (ja) * | 2009-10-23 | 2013-03-07 | サムスン エレクトロニクス カンパニー リミテッド | 位相情報と残余信号を用いる符号化/復号化装置及び方法 |
JP2013050540A (ja) * | 2011-08-30 | 2013-03-14 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US11978463B2 (en) | 2018-05-31 | 2024-05-07 | Huawei Technologies Co., Ltd. | Stereo signal encoding method and apparatus using a residual signal encoding parameter |
Also Published As
Publication number | Publication date |
---|---|
US7835918B2 (en) | 2010-11-16 |
WO2006048815A1 (en) | 2006-05-11 |
US20110082699A1 (en) | 2011-04-07 |
US20090083040A1 (en) | 2009-03-26 |
BRPI0517949A (pt) | 2008-10-21 |
BRPI0517949B1 (pt) | 2019-09-03 |
MX2007005261A (es) | 2007-07-09 |
US8170871B2 (en) | 2012-05-01 |
US20110082700A1 (en) | 2011-04-07 |
US8010373B2 (en) | 2011-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008519306A (ja) | 信号の組のエンコード及びデコード | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
JP6407928B2 (ja) | オーディオ処理システム | |
EP2056294B1 (en) | Apparatus, Medium and Method to Encode and Decode High Frequency Signal | |
JP5238256B2 (ja) | 多チャンネル音声信号の符号化及び復号化 | |
RU2419171C2 (ru) | Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания | |
EP2378516B1 (en) | Analysis filterbank, synthesis filterbank, encoder, decoder, mixer and conferencing system | |
KR101192241B1 (ko) | 입력 데이터 스트림의 믹싱과 그로부터 출력 데이터 스트림의 생성 | |
US10255928B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
Hwang | Multimedia networking: From theory to practice | |
JP2019506633A (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
JP5295372B2 (ja) | デジタルオーディオ信号におけるプリエコーの減衰 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
AU2018200340A1 (en) | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding | |
Geurts | TU e technische universiteit |