JP2011527456A - オーディオのエンコーディング及びデコーディングにおける位相情報の効率的な使用 - Google Patents

オーディオのエンコーディング及びデコーディングにおける位相情報の効率的な使用 Download PDF

Info

Publication number
JP2011527456A
JP2011527456A JP2011517003A JP2011517003A JP2011527456A JP 2011527456 A JP2011527456 A JP 2011527456A JP 2011517003 A JP2011517003 A JP 2011517003A JP 2011517003 A JP2011517003 A JP 2011517003A JP 2011527456 A JP2011527456 A JP 2011527456A
Authority
JP
Japan
Prior art keywords
signal
phase
correlation
audio
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011517003A
Other languages
English (en)
Other versions
JP5587878B2 (ja
Inventor
ヒルペルト・ヨハネス
グリル・ベルンハルド
ノイジンゲル・マティアス
ロビリアルド・ユリアン
ルイス−バレロ・マリア
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2011527456A publication Critical patent/JP2011527456A/ja
Application granted granted Critical
Publication of JP5587878B2 publication Critical patent/JP5587878B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

第1及び第2の入力オーディオ信号の効率的なエンコード済み表現を、入力オーディオ信号の少なくとも第1又は第2の異なる特性を知らせる信号特性情報が追加で考慮される場合に、第1及び第2の入力オーディオ信号の間の相関を表わす相関情報を使用して導出することができる。入力オーディオ信号が第1の特性を有する場合に、第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報が導出される。入力オーディオ信号が第1の特性を有する場合には、位相情報及び相関の指標がエンコード済み表現に含められ、入力オーディオ信号が第2の特性を有する場合には、相関情報だけがエンコード済み表現に含められる。
【選択図】図4

Description

本発明は、オーディオエンコーディング及びオーディオデコーディングに関し、特に位相情報の再構成が知覚的に関係のある場合に位相情報を選択的に抽出及び/又は伝達するエンコーディング及びデコーディングの仕組みに関する。
バイノーラル・キュー・コーディング(BCC)、パラメトリックステレオ(PS)又はMPEGサラウンド(MPS)など、最近のパラメータによる多チャネルコーディングの仕組みは、空間知覚のために人間の聴覚系のキュー(cue)のコンパクトなパラメータ表現を使用する。これにより、2以上のオーディオチャネルを有するオーディオ信号を、レートに関して効率的に表現することができる。この目的のために、エンコーダが、M個の入力チャネルからN個の出力チャネルへのダウンミックスを実行し、抽出されたキューをダウンミックス信号とともに送信する。キューは、さらに、人間の知覚の原理に従って量子化され、すなわち人間の聴覚系にとって聞き取ることができないか又は識別することができない情報は、削除するか粗く量子化することができる。
ダウンミックス信号は「包括的(generic)」なオーディオ信号であるため、シングルチャネルのオーディオ圧縮器を使用してダウンミックス信号又はダウンミックス信号のチャネルを圧縮することによって、元のオーディオ信号のそのようなエンコード済みの表現によって消費される帯域幅をさらに減らすことができる。さまざまな種類のそのようなシングルチャネルのオーディオ圧縮器が、以下の段落においてコアコーダとして簡単に説明される。
2以上のオーディオチャネルの間の空間的な相互関係を記述するために使用される典型的なキューは、入力チャネル間のレベルの関係をパラメータ化するチャネル間レベル差(ILD)、入力チャネル間の統計的依存性をパラメータ化するチャネル間相関/コヒーレンス(ICC)、及び入力チャネルの類似の信号部分の間の時間差又は位相差をパラメータ化するチャネル間時間差/位相差(ITD又はIPD)である。
ダウンミックス及び上述のキューによって表現される信号の知覚品質を高く保つために、通常は、異なる周波数帯に対して個々のキューが計算される。すなわち、信号の一定の時間部分について、同じ特性をパラメータ化する複数のキューであって、各々のキューパラメータが信号の所定の周波数帯を表現している複数のキューが送信される。
それらのキューは、時間及び周波数に関して人間の周波数分解能に近い尺度に依存して計算することができる。多チャネルオーディオ信号が表現されるときは常に、対応するデコーダが、送信された空間キュー及びダウンミックス送信信号にもとづいて、M個のチャネルからN個のチャネルへのアップミックスを実行する(したがって、送信されるダウンミックスは搬送信号と呼ばれることが多い)。
一般に、得られるアップミックスチャネルは、送信されたダウンミックスをレベル及び位相に関して重み付けしたバージョンとして記述することができる。信号のエンコーディング時に生成された脱相関は、送信された相関パラメータ(ICC)によって示されるように、送信されたダウンミックス信号(「ドライ」信号)にダウンミックス信号から導出される脱相関信号(decorrelated signal)(「ウェット」信号)を混合し、かつダウンミックス信号を脱相関信号で重み付けすることによって合成することができる。その結果、アップミックスされたチャネルは、元のチャネルが有していたのと同様の互いの相関を有する。脱相関信号(すなわち、送信された信号と相互相関されたときにゼロに近い相互相関係数を有している信号)は、例えば全域通過フィルタ及び遅延線などの一連のフィルタへダウンミックス信号を供給することによって生成することができる。しかしながら、脱相関信号を生成するさらなる方法も使用可能である。
当然ながら、上述のエンコーディング/デコーディングの仕組みの特定の実施例においては、送信されるビットレート(理想的には可能なかぎり低い)と達成可能なエンコード後の信号の品質(理想的には可能なかぎり高い)との間の相対関係を成立させなければならない。
したがって、空間キューの一式すべてを送信するのではなく、1つの特定のパラメータの送信を省略するように決定することができる。さらには、この決定は、適切なアップミックスの選択によっても左右されうる。ある適切なアップミックスでは、例えば、送信されない空間キューを平均により再生することができる。すなわち、少なくとも全帯域幅の信号の長期部分においては、平均の空間特性は保存されている。
特に、パラメータによる多チャネルの仕組みのすべてがチャネル間の時間差又はチャネル間の位相差を利用しているわけではなく、それによってそれぞれの計算及び合成を避けている。MPEGサラウンドなどの仕組みは、ILDとICCの合成のみに依存している。チャネル間の位相差は脱相関(decorrelation)の合成によって暗黙のうちに近似され、脱相関の合成では、180°の相対の位相シフトを有している脱相関信号の2つの表現が、送信されたダウンミックス信号に混合される。IPDの送信が省略されることで、必要とされるパラメータ情報の量が少なくなるが、それと同時に再生の低下を受け入れている。
したがって、必要とされるビットレートを大きくは増加させることなく、信号のより良好な再構成品質をもたらす必要が存在している。
本発明の一実施の形態は、第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を該入力オーディオ信号の間の位相シフトが所定のしきい値を超える場合に導出する位相評価部を使用することによってこの目標を達成する。空間パラメータ及びダウンミックス信号を入力オーディオ信号のエンコード済み表現へと含ませる関連の出力インターフェイスが、位相情報の送信が知覚的見地から必要である場合にのみ、導出された位相情報を入力オーディオ信号のエンコード済み表現へと含ませる。
この目的のために、位相情報の割り出しを連続的に実行し、位相情報を含ませるべきか否かの判断だけを、しきい値にもとづいて行うことができる。そのしきい値は、例えば、追加の位相情報の処理を必要とせずに容認可能な品質の再構成信号を実現することができる許容可能な最大の位相シフトを表わすことができる。
あるいは、位相のしきい値を超えた場合に限って位相情報を導出するための適当な位相分析が行われるように、入力オーディオ信号の間の位相シフトを、位相情報の実際の生成とは別個独立に導出することができる。
あるいは、継続的に生成される位相情報を受信し、位相情報の条件が満たされる場合(例えば、入力信号の間の位相差が所定のしきい値を超える場合)に限って位相情報を含ませるように出力インターフェイスを制御する空間出力モード決定部を実装することができる。
すなわち、出力インターフェイスは、もっぱらICCパラメータ及びILDパラメータをダウンミックス信号とともに入力オーディオ信号のエンコード済み表現に含ませる。特定の信号特性を有する信号が生じたときに、エンコード済み表現を使用して再構成される信号をより高い品質で再構成できるよう、決定された位相情報が入力オーディオ信号のエンコード済み表現にさらに含められる。しかしながら、これは、位相情報が実際に送信されるのが重要な信号部分についてのみであるため、追加で送信される情報の量を最小限に抑えつつ達成することが可能である。
これにより、一方では高品質の再構成が可能になり、他方では低いビットレートの実現が可能になる。
本発明のさらなる実施の形態は、異なる信号種又は信号特性を有する入力オーディオ信号の間の区別を行う信号特性情報を導出するために信号を分析する。これは、例えば、スピーチ信号とミュージック信号の異なる特性とすることができる。位相評価部は、入力オーディオ信号が第1の特性を有する場合にのみ必要とすることができ、入力オーディオ信号が第2の特性を有する場合には位相の評価を不要にすることができる。したがって、出力インターフェイスは、容認できる品質の再構成信号をもたらすために位相合成が必要であるような信号がエンコードされるときにのみ、位相情報を含ませる。
例えば相関情報(例えば、ICCパラメータ)などの他の空間キューは、それらの存在が両方の信号種又は信号特性において重要である可能性があるため、常にエンコード済み表現に含められる。これは、例えば、2つの再構成チャネルの間のエネルギーの関係を本質的に表わすチャネル間のレベル差にも当てはまる可能性がある。
さらなる実施の形態においては、位相の評価は、第1及び第2の入力オーディオ信号の間の相関ICCなど、他の空間キューにもとづいて実行することができる。これは、信号特性についていくつかの追加の制約を含む特性情報が存在する場合に、実現可能にすることができる。その場合、ICCパラメータは、統計的情報の他に位相情報も抽出するために使用することができる。
さらなる実施の形態によれば、所定のサイズの位相シフトの適用を知らせるただ1つの位相スイッチが実装される点で、位相情報はビットに関してきわめて効率的に含ませることができる。それにもかかわらず、さらに詳しくは後述されるように、特定の信号種については再構成における位相関係の粗い再構成で充分である。さらなる実施の形態においては、位相情報は、はるかに高い分解能(例えば、10又は20の異なる位相シフト)にて知らせることができ、又は−180°〜+180°の間の考えられる相対位相角を与える連続的なパラメータとして知らせることさえ可能である。
信号特性がわかっているとき、位相情報は、ICC及び/又はILDパラメータの導出に使用された周波数帯域の数よりもはるかに少ない少数の周波数帯域についてのみ送信することができる。例えば、オーディオ入力信号がスピーチ特性を有することがわかっている場合、全帯域幅についてただ1つの位相情報だけしか必要でないかもしれない。さらなる実施の形態においては、ただ1つの位相情報は、例えば100Hz〜5kHzの間の周波数範囲について導出することができる。なぜならば、話し手の信号エネルギーが、主としてこの周波数範囲に分布していると推定されるからである。全帯域について共通の位相情報パラメータは、例えば、位相シフトが90度又は60度を超える場合に実行できるようにすることができる。
さらには、信号特性がわかっているとき、位相情報は、すでに存在するICCパラメータ又は相関パラメータから、これらのパラメータにしきい値基準を適用することによって直接導出することができる。例えば、ICCパラメータが−0.1よりも小さい場合に、さらに詳しくは後述されるように入力オーディオ信号のスピーチ特性が他のパラメータを制約するため、この相関パラメータは一定の位相シフトに対応すると結論付けることができる。
本発明のさらなる実施の形態においては、信号から導出されたICCパラメータ(相関パラメータ)は、位相情報をビットストリームへと含ませるときに、さらに調節又は事後処理される。これは、ICC(相関)パラメータが実際には2つの特性についての情報(すなわち、入力オーディオ信号間の統計的依存性についての情報及びそれらの信号間の位相シフトについての情報)を含む可能性があるという事実を利用する。したがって、追加の位相情報が送信されるとき、相関パラメータは、信号の再構成の際に位相及び相関が可能なかぎり良好に別個に考慮されるように調節することができる。
完全に下位互換(backwards compatible)な筋書きにおいては、そのような相関の調節は、本発明のデコーダの実施の形態によっても実行することができる。それは、デコーダが追加の位相情報を受信したとき行わせることができる。
そのような知覚的に優れた再構成を可能にするために、本発明のオーディオデコーダのいくつかの実施の形態は、オーディオデコーダの内部のアップミキサによって生成された中間信号に対して働く追加の信号プロセッサを備えることができる。そのアップミキサは、例えば、ダウンミックス信号及び位相情報以外のすべての空間キュー(ICC及びILD)を受信する。そのアップミキサは、空間キューによって記述されたとおりの信号特性を有する第1及び第2の中間オーディオ信号を導出する。この目的のため、脱相関信号部分(ウェット信号)及び送信されたダウンミックスチャネル(ドライ信号)を混合するために、追加の反響(脱相関)信号の生成を予見することができる。
しかしながら、前記の追加の信号プロセッサである中間信号ポストプロセッサは、位相情報がオーディオデコーダによって受信されたときに、中間信号の少なくとも1つに追加の位相シフトを適用する。すなわち、中間信号ポストプロセッサは、追加の位相情報が送信される場合に限って動作することができる。すなわち、本発明のオーディオデコーダのいくつかの実施の形態は、従来からのオーディオデコーダと完全な互換性をもつ。
デコーダのいくつかの実施の形態における処理は、エンコーダ側における処理と同様に、時間及び周波数に関して選択的な様相で実行することができる。すなわち、複数の周波数帯域を有している一連の隣接する時間スライスを処理することができる。したがって、オーディオエンコーダのいくつかの実施の形態は、時間的に連続したオーディオ信号がエンコーダによって出力されるよう、生成された中間オーディオ信号及び事後処理済みの中間オーディオ信号を組み合わせるための信号結合部を備えている。
すなわち、信号結合部は、第1のフレーム(時間部分)についてアップミキサによって導出された中間オーディオ信号を使用することができ、第2のフレームについて中間信号ポストプロセッサによって導出された事後処理済み中間信号を使用することができる。位相シフトの導入に加え、より高度な信号処理を中間信号ポストプロセッサに実装することも、当然ながら可能である。
これに代え、又はこれに加えて、オーディオデコーダのいくつかの実施の形態は、位相情報が追加で受信される場合に受信された相関情報ICCを事後処理するなどのために、相関情報プロセッサを備えることができる。次いで、事後処理された相関情報は、従来からのアップミキサによって、信号ポストプロセッサによって導入される位相シフトとの組み合わせにおいてオーディオ信号の自然に聞こえる再生を達成できるように、中間オーディオ信号を生成するために使用することができる。
次に、本発明のいくつかの実施の形態を、添付の図面を参照して以下で説明する。
ダウンミックス信号から2つの出力信号を生成するアップミキサを示している。 図1のアップミキサによるICCパラメータの使用の例を示している。 エンコードされるオーディオ入力信号の信号特性の例を示している。 オーディオエンコーダの実施の形態を示している。 オーディオエンコーダのさらなる実施の形態を示している。 図4及び図5のエンコーダのうちの1つによって生成されたオーディオ信号のエンコード済み表現の例を示している。 エンコーダのさらなる実施の形態を示している。 スピーチ/ミュージックのエンコーディングのためのエンコーダのさらなる実施の形態を示している。 デコーダの実施の形態を示している。 デコーダのさらなる実施の形態を示している。 デコーダのさらなる実施の形態を示している。 スピーチ/ミュージックのデコーダの実施の形態を示している。 エンコーディングのための方法の実施の形態を示している。 デコーディングのための方法の実施の形態を示している。
図1は、ダウンミックス信号6を使用して第1の中間オーディオ信号2及び第2の中間オーディオ信号4を生成するためにデコーダの実施の形態において使用することができるアップミキサを示している。さらに、追加のチャネル間相関情報及びチャネル間レベル差情報が、アップミックスを制御するための増幅器の制御パラメータとして使用される。
このアップミキサは、脱相関器(decorrelator)10、3つの相関関連の増幅器12a〜12c、第1のミキシングノード14a、第2のミキシングノート14b、並びに第1及び第2のレベル関連の増幅器16a及び16bを備えている。ダウンミックスオーディオ信号6は、脱相関器10並びに脱相関関連の増幅器12a及び12bの入力へと分配されるモノラル信号である。脱相関器10は、ダウンミックスオーディオ信号6を使用し、脱相関アルゴリズムによってダウンミックスオーディオ信号6の脱相関バージョンを生成する。脱相関されたオーディオチャネル(脱相関信号)は、相関関連の増幅器のうちの第3の増幅器12cへ入力される。ダウンミックスオーディオ信号のサンプルのみを含んでいるアップミキサの信号成分が、多くの場合に「ドライ」信号とも呼ばれ、脱相関信号のサンプルのみを含んでいる信号成分が、多くの場合に「ウェット」信号と呼ばれることに注目することができる。
ICC関連の増幅器12a〜12cは、送信されたICCパラメータに応じたスケーリングルールに従って、ウェット及びドライの信号成分を拡大/縮小する。基本的には、これらの信号のエネルギーが、加算ノード14a及び14bによるドライ及びウェットの信号成分の加算に先立って調節される。この目的のため、相関関連の増幅器12aの出力が第1の加算ノード14aの第1の入力へともたらされ、相関関連の増幅器12bの出力が加算ノード14bの第1の入力へともたらされる。ウェット信号に関する相関関連の増幅器12cの出力は、第1の加算ノード14aの第2の入力及び第2の加算ノード14bの第2の入力へもたらされる。しかしながら、図1に示されているように、加算ノードにおけるウェット信号の符号は、ウェット信号が負の符号にて第1の加算ノード14aへ入力され、一方、元の符号を有するウェット信号が第2の加算ノード14bへ入力される点で相違する。すなわち、脱相関信号が、元の位相にて第1のドライ信号成分に混合され、一方、逆の位相にて、すなわち180°の位相シフトを伴って、第2のドライ信号成分に混合される。
エネルギー比は、すでに述べたように、加算ノード14a及び14bから出力される信号が最初にエンコードされた信号の相関(送信されたICCパラメータによってパラメータ化されている)と同様の相関を有するように、相関パラメータに応じて前もって調節されている。最後に、第1のチャネル2と第2のチャネル4との間のエネルギーの関係が、エネルギー関連の増幅器16a及び16bを使用して調節される。両方の増幅器がILDパラメータに応じた関数によって制御されるように、エネルギーの関係はILDパラメータによってパラメータ化されている。
すなわち、このようにして生成された左チャネル2及び右チャネル4は、最初にエンコードされた信号の統計的依存と同様の統計的依存を有する。
しかしながら、送信されたダウンミックスオーディオ信号6に直接由来する生成された第1(左)出力信号2及び第2(右)出力信号4への寄与は、同一の位相を有している。
図1はアップミックスの広帯域の実施例を仮定しているが、さらなる実施例は、図4のアップミキサが元の信号の限られた周波数帯の表現について動作することができるように、複数の並行な周波数帯について個別にアップミックスを実行することができる。その後に、限られた帯域幅の出力信号のすべてを最終的な合成混合物へと足し合わせることによって、全帯域幅の再構成信号を得ることができる。
図2は、相関関連の増幅器12a〜12cを制御するために使用されるICCパラメータ依存の関数の例を示している。この関数を使用し、エンコードすべき元のチャネルからICCパラメータを適切に導出することによって、最初にエンコードされた信号の間の位相シフトを、(平均にて)粗く再生することができる。この検討のために、送信されるICCパラメータの生成についての理解が不可欠である。この検討のための基礎は、エンコードすべき2つの入力オーディオ信号の2つの対応する信号部分の間で導出され、以下のように定義される複素チャネル間コヒーレンスパラメータとすることができる。
Figure 2011527456
上記式において、「l」は処理される信号部分に含まれるサンプルの数を示し、一方、随意による指数「k」は、いくつかの特定の実施の形態によれば、ただ1つのICCパラメータによって表わすことのできるいくつかのサブ帯域のうちの1つを指す。換言すると、X1及びX2は2つのチャネルの複素値によるサブ帯域サンプルであり、「k」はサブ帯域のインデックスであり、「l」は時間のインデックスである。
複素値によるサブ帯域サンプルは、最初にサンプリングされた入力信号を、例えば64個のサブ帯域を導出するQMFフィルタバンクへ供給することによって導出することができ、各々のサブ帯域に含まれるサンプルが複素値による数によって表わされる。上述の式を使用して複素相互相関を計算することで、2つの対応する信号部分の特徴が、以下の特性を有する1つの複素値によるパラメータICCcomplexによって表わされる。
長さ│ICCcomplex│が、2つの信号のコヒーレンスを表わす。ベクトルが長いほど、2つの信号の間の統計的依存が大である。
すなわち、1つのグローバルなスケーリング係数は別として、ICCcomplexの長さ又は絶対値が1に等しいときは常に両方の信号が同一である。しかし、ICCcomplexの位相角によって与えられる相対の位相差が存在しうる。その場合、実軸に対するICCcomplexの角度が2つの信号の間の位相角を表わす。しかしながら、ICCcomplexの導出が2つ以上のサブ帯域を使用して実行されるとき(すなわち、k≧2のとき)、位相角は、結果的に、処理されたパラメータ帯域のすべての平均の角度である。
換言すると、2つの信号が統計的に強く依存している場合(│ICCcomplex│≒1)、実部Re{ICCcomplex}が、ほぼ位相角の余弦であり、したがって信号間の位相差の余弦である。
ICCcomplexの絶対値が1よりも大幅に小さい場合、ベクトルICCcomplexと実軸との間の角度Θを、もはや同一の信号の間の位相角であると解釈することはできない。それはむしろ、統計的にかなり独立した信号の間の最良に一致する位相である。
図3は、考えられるベクトルICCcomplexの3つの例20a、20b及び20cを示している。ベクトル20aの絶対値(長さ)は1に近く、ベクトル20aによって表わされる2つの信号はほぼ同じであるが、互いの位相がずれていることを意味している。換言すると、両方の信号がきわめてコヒーレントである。その場合、位相角30(Θ)は、ほぼ同一な信号の間の位相シフトに直接相当する。
しかしながら、ICCcomplexの評価がベクトル20bをもたらす場合、位相角Θの意味はもはや明確ではない。複素ベクトル20bが1よりも大幅に小さい絶対値を有するため、分析された両方の信号部分又は信号は統計的にかなり独立である。すなわち、観察された時間部分における信号は共通な形状を有していない。依然として、位相角30は、両方の信号の最良の一致に対応する位相シフトを多少は表わしている。しかしながら、信号がコヒーレントでないとき、2つの信号の間の共通の位相シフトはほとんど意味を持たない。
ベクトル20cは再び1に近い絶対値を有しているので、その位相角32(Φ)は、やはり2つの類似の信号の間の位相差として明確に特定することができる。さらに、90°よりも大きい位相シフトはベクトルICCcomplexの0よりも小さい実部に対応することが明らかである。
2つ以上のコード済み信号の統計的依存の正しい構成に注力するオーディオコーディングの仕組みにおいて、送信されたダウンミックスチャネルから第1及び第2の出力チャネルを生成するために考えられるアップミックスの手順が図1に示されている。
相関関連の増幅器20a〜20cを制御するためのICC依存の関数として、図2に示した関数が、完全に相関した信号から完全に脱相関な信号への滑らかな移行をいかなる不連続も導入することなく可能にするために頻繁に使用される。図2は、信号のエネルギーがドライ信号成分(増幅器12a及び12bを制御することによる)とウェット信号成分(増幅器12cを制御することによる)との間でどのように分配されるかを示している。これを実現するために、ICCcomplexの実部がICCcomplexの長さの指標として、したがって信号間の類似性の指標として、送信される。
図2においては、x軸は送信されるICCパラメータの値を与え、y軸はアップミキサの加算ノード14a及び14bによって混合されるドライ信号(実線30a)及びウェット信号(破線30b)のエネルギーの量を与える。すなわち、信号が完璧に相関(同じ形状、同じ位相)している場合は、送信されるICCパラメータは1である。したがって、アップミキサは、受信したダウンミックスオーディオ信号6を、いかなるウェット信号部分も加えることなく、出力へと分配する。この場合のダウンミックスオーディオ信号は基本的にはエンコードされた元のチャネルの合計であるため、再生は、位相及び相関に関して正確である。
しかしながら、信号が反相関(anti-correlated)(位相=180°、同じ信号形状)である場合には、送信されるICCパラメータは−1である。したがって、再構成された信号は、ドライ信号の信号部分を含まず、ウェット信号の信号部分だけを含む。ウェット信号部分が、生成された第1のオーディオチャネルへ加えられ、第2のオーディオチャネルから引かれるため、信号間の位相シフトが180°になるように正確に再構成されるが、再構成された信号はドライ信号部分をまったく含まない。これは、ドライ信号がデコーダへ送信されるすべての直接的な情報を実際に含んでいるため、不適当である。
したがって、その場合の再構成される信号の信号品質が低下する可能性がある。しかしながら、その低下はエンコードされる信号の種類に依存する可能性があり、すなわち基礎をなす信号の信号特性に依存する可能性がある。一般論として、脱相関器10によってもたらされる相関信号は反響状の音響特性を有している。すなわち、例えば、脱相関信号のみを使用することからの可聴ひずみは、反響状のオーディオ信号からの再構成が不自然な音につながるスピーチ信号に比べて、音楽信号においてはかなり小さい。
要約すると、上述したデコーディングの仕組みは、位相特性が最良でも平均にて回復されるだけであるため、位相特性を粗く近似するだけである。これはきわめて粗い近似である。というのは、加えられる信号部分が180°という相対の位相差をもち、デコーディングは加えられる信号のエネルギーを変化させることによってのみ達成されるからである。明らかに相関がなく、又は反相関(ICC≦0)ですらある信号については、この脱相関(すなわち、信号間の統計的独立)を復元するために、かなりの量の脱相関信号が必要である。一般に、全域通過フィルタの出力としての脱相関信号は、「反響状(reverb-like)」の音響を有するため、全体として達成できる品質は大きく損なわれる。
すでに述べたように、いくつかの信号の種類においては位相関係の復元はあまり重要でないかもしれないが、他の種類の信号においては正しい復元が知覚的に関係がある可能性がある。特に、信号から導出される位相情報が特定の知覚的動機による位相再構成基準を満足する場合に、元の位相関係の復元が必要とされる可能性がある。
したがって、本発明のいくつかの実施の形態は、特定の位相特性が満たされるとき、オーディオ信号のエンコード後の表現に位相情報を含ませる。すなわち、位相情報は、(レート−ひずみの評価における)利益が大きい場合に限って時々送信される。さらに、送信される位相情報は、必要とされる追加のビットレートの量が多くならないように、粗く量子化することができる。
送信された位相情報が与えられたとすると、ドライ信号成分間、すなわち元の信号から直接導出され、したがって知覚的にきわめて関係のある信号成分間の正しい位相関係をもって信号を再構成することができる。
もし、例えば、信号がICCcomplexベクトル20cでエンコードされる場合、送信されるICCパラメータ(ICCcomplexの実部)は、約−0.4である。すなわち、アップミックスにおいて、エネルギーの50%超が脱相関信号から導出される。しかしながら、可聴な量のエネルギーが依然としてダウンミックスオーディオチャネルから由来しているため、ダウンミックスオーディオチャネルから由来する信号成分の間の位相関係は、可聴であるため依然として重要である。すなわち、再構成信号のドライ信号部分の間の位相関係をより厳密に近似することが望ましいと考えられる。
したがって、ひとたび元のオーディオチャネルの間の位相シフトが所定のしきい値よりも大きいと判断されたならば、追加の位相情報が送信される。そのようなしきい値の例は、具体的な実施例に応じて、60°、90°又は120°とすることができる。しきい値に応じて、位相関係は高い分解能にて送信することができ、すなわち複数の所定の位相シフトのうちの1つが伝達され、あるいは連続的に変化する位相角が送信される。
本発明のいくつかの実施の形態においては、再構成される信号の位相を所定の位相角だけシフトさせるように知らせるただ1つの位相シフトインジケータ又は位相情報だけが送信される。一実施の形態によれば、この位相シフトは、ICCパラメータが所定の負の範囲内にある場合にのみ適用される。この範囲は、その位相しきい値の基準に応じて、例えば−1〜−0.3又は−0.8〜−0.3の範囲とすることができる。すなわち、わずか1ビットの位相情報だけでよい。
ICCcomplexの実部が正であるとき、再構成信号の間の位相関係は、ドライ信号成分の位相同一な処理により、平均で、図1のアップミキサによって正しく近似される。
しかしながら、もし、送信されるICCパラメータが0未満である場合には、元の信号の位相シフトが、平均で、90°よりも大きい。同時に、ドライ信号の依然として可聴な信号部分がアップミキサによって使用される。したがって、ICC=0から始まって、例えばICC=約−0.6までの領域において、固定の位相シフト(例えば、先に導入された間隔の中央に対応する位相シフトに対応する)が、わずか1ビットの送信という代価にて、再構成信号について大きく向上した知覚的品質をもたらすことができる。ICCパラメータが、例えば−0.6未満など、さらに小さい値へと進むときは、第1の出力チャネル2及び第2の出力チャネル4の信号エネルギーのうちのごく少量だけがドライ信号成分から由来する。したがって、これらの知覚的にあまり関係のない信号部分の間の位相特性の正しい復元は、ドライ信号部分がほとんど可聴ではないため、再びまったく省略することができる。
図4は、第1の入力オーディオ信号40a及び第2の入力オーディオ信号40bのエンコード済み表現を生成するための本発明のエンコーダの一実施の形態を示している。オーディオエンコーダ42は、空間パラメータ評価部44、位相評価部46、出力動作モード決定部48及び出力インターフェイス50を備えている。
第1の入力オーディオ信号40a及び第2の入力オーディオ信号40bが空間パラメータ評価部44及び位相評価部46へ分配される。空間パラメータ評価部は、例えばICCパラメータ及びILDパラメータなど、2つの信号のお互いに対する信号特性を示す空間パラメータを導出するように構成されている。導出されたパラメータは出力インターフェイス50へもたらされる。
位相評価部46は、2つの入力オーディオ信号40a及び40bの位相情報を導出するように構成されている。そのような位相情報は、例えば、2つの信号の間の位相シフトとすることができる。位相シフトは、例えば、2つの入力オーディオ信号40a及び40bの位相分析を直接実行することによって直接評価することができる。さらに別の実施の形態においては、空間パラメータ評価部44によって導出されたICCパラメータを、随意による信号線52を介して位相評価部へもたらすことができる。これにより、位相評価部46は、いずれにせよ導出されるICCパラメータを利用して位相差の割り出しを実行することができる。これは、2つのオーディオ入力信号の完全な位相分析の実施の形態と比べて、より複雑さの少ない実現を可能にする。
導出された位相情報は出力動作モード決定部48へ供給され、出力動作モード決定部48は出力インターフェイス50を第1の出力モードと第2の出力モードとの間で切り替えることができる。導出された位相情報は出力インターフェイス50へ供給される。出力インターフェイス50は、第1の入力オーディオ信号40a及び第2の入力オーディオ信号40bのエンコード済みの表現を、生成されたICC、ILD又はPI(位相情報)の各パラメータからなる特定の部分集合を含ませることによって生成する。第1の動作モードでは、出力インターフェイス50はICC、ILD及び位相情報PIをエンコード済みの表現54に含ませる。第2の動作モードでは、出力インターフェイス50はICC及びILDパラメータだけをエンコード済みの表現54に含ませる。
出力モード決定部48は、位相情報が第1のオーディオ信号40a及び第2のオーディオ信号40bの間の位相差が所定のしきい値よりも大きいことを示す場合に第1の出力モードを選択する。この場合の位相差は、例えば、信号の完全な位相分析を実行することによって割り出すことができる。これは、例えば、入力オーディオ信号をお互いに対してシフトさせ、各々の信号シフトについて相互相関を計算することによって実行することができる。最高の値を有する相互相関が位相シフトに対応する。
別の実施の形態においては、位相情報がICCパラメータから推定される。ICCパラメータ(ICCcomplexの実部)が所定のしきい値を下回る場合、位相差が大きいと推定される。検出のために考えられる位相シフトは、例えば60°、90°又は120°を超える位相シフトとすることができる。対照的に、ICCパラメータについての基準は、0.3、0又は−0.3というしきい値とすることができる。
エンコード済みの表現へ導入される位相情報は、例えば、所定の位相シフトを示すわずか1つのビットとすることができる。あるいは、送信される位相情報は、位相シフトの連続的な表現までのより細かい量子化にて位相シフトを送信することによって、より精密にすることができる。
さらに、図4のいくつかのオーディオエンコーダ43が並列に実装され、各々のオーディオエンコーダが元の広帯域の信号のうちの1つの帯域幅にフィルタ処理された信号に対して働くように、オーディオエンコーダが入力オーディオ信号の限られた帯域の複製に対して働くことができる。
図5は相関評価部62、位相評価部46、信号特性評価部66及び出力インターフェイス68を備えている本発明のオーディオエンコーダのさらなる実施の形態を示している。位相評価部46は、図4において紹介された位相評価部に相当する。したがって、不必要な冗長性を避けるために、位相評価部の特徴についてのさらなる説明は省略する。一般に、同じ又は類似の機能を有する構成要素には同じ参照番号が付されている。第1の入力オーディオ信号40a及び第2の入力オーディオ信号40bは信号特性評価部66、相関評価部62及び位相評価部46へ分配される。
信号特性評価部は、入力オーディオ信号の第1又は第2の異なる特性を示す信号特性情報を導出するように構成されている。例えば、スピーチ信号を第1の特性として検出することができ、ミュージック信号を第2の信号特性として検出することができる。その追加の信号特性情報は、位相情報の送信の必要性を判断するために使用することができ、又は、相関パラメータを位相関係に関して解釈するためにさらに使用することができる。
一実施の形態において、信号特性評価部66は、オーディオ信号(すなわち、第1の入力オーディオチャネル40a及び第2の入力オーディオチャネル40b)の現在の抽出物がスピーチ状であるか、又は非スピーチであるかについての情報を導出するために使用される信号分類器である。導出された信号特性に応じて、位相評価部46による位相の評価を、随意による制御リンク70を介してオン及びオフに切り替えることができる。あるいは、随意による第2の制御リンク72を介して出力インターフェイスを制御しつつ、入力オーディオ信号の第1の特性(例えば、スピーチの特性)が検出されたときにのみ位相情報74を含ませるように、位相の評価を常に実行することができる。
対照的に、ICCの割り出しは、エンコードされた信号のアップミックスに必要な相関パラメータをもたらすように、常に実行される。
オーディオエンコーダのさらなる実施の形態は、随意により、オーディオエンコーダ60によってもたらされるエンコード済み表現54に随意により含ませることができるダウンミックスオーディオ信号78を導出するように構成されたダウンミキサ76を備えることができる。別の実施の形態においては、位相情報は、図4の実施の形態に関してすでに述べたように、相関情報ICCの分析にもとづくことができる。この目的のために、相関評価部62の出力を、随意による信号線52を介して位相評価部46へもたらすことができる。
そのような判断は、例えば、信号がスピーチ信号とミュージック信号との間で区別される場合に、以下の考慮によるICCcomplexに基づくことができる。
信号特性情報66から信号がスピーチ信号であることが知られる場合、ICCcomplex
Figure 2011527456
を以下の考慮に従って評価することができる。スピーチ信号が確認される場合、スピーチ信号の発生源が点状であるため、人間の聴覚信号によって受け取られる信号は強く相関していると結論付けることができる。したがって、ICCcomplexの絶対値は1に近い。したがって、図3の位相角Θ(IPD)は、複素ベクトルICCcomplexの評価さえ必要とせずに、以下の式に従ってICCcomplexの実部についての情報だけを使用することによって評価することができる。
Figure 2011527456
位相情報はICCcomplexの実部にもとづいて得ることができ、ICCcomplexの虚部を決して計算することなく割り出すことができる。
要約すると、以下のように結論付けることができる。
Figure 2011527456
上記式において、cos(IPD)が図3のcos(Θ)に対応することに注目されたい。
デコーダ側で位相合成を実行する必要性も、より一般的には、以下の考慮に従って導出することができる。
すなわち、コヒーレンス(abs(ICCcomplex))が0よりも大幅に大きく、相関(Real(ICCcomplex))が1よりも大幅に小さく、又は位相角(arg(ICCcomplex))が0から大きく異なっている。
これらが一般的な基準であり、スピーチの存在において、abs(ICCcomplex)が0よりも大幅に大きいと暗黙裏に推定されることに注意されたい。
図6は図5のエンコーダ60によって導出されたエンコード済みの表現の例を示している。時間部分80a及び第1の時間部分80bに関して、エンコード済みの表現は相関情報だけを含んでおり、第2の時間部分80cに関しては、出力インターフェイス68によって生成されたエンコード済みの表現が相関情報及び位相情報PIを含んでいる。要約すると、オーディオエンコーダによって生成されたエンコード済みの表現は、第1及び第2の元の出力チャネルを使用して生成されたダウンミックス信号(簡単にするため、図示されていない)を含むことを特徴とすることができる。エンコード済みの表現は、さらに、第1及び第2の元のオーディオチャネルの間の相関を示す第1の相関情報82aを第1の時間部分80bに含んでいる。さらに、この表現は、第1及び第2のオーディオチャネルの間の脱相関を示す第2の相関情報82bを第2の時間部分80cに含んでおり、第2の時間部分について第1及び第2の元のオーディオチャネルの間の位相関係を示す第1の位相情報84を含んでおり、第1の時間部分80bについては、位相情報を含んでいない。説明を容易にするために、図6においては副情報のみが示されており、やはり送信されるダウンミックスチャネルが図示されていないことに注意されたい。
図7はオーディオエンコーダ90が相関情報調節部92をさらに備えている本発明のさらなる実施の形態を概略的に示している。図7の例は、空間パラメータ94がオーディオ信号96と一緒にもたらされるように、例えばパラメータICC及びILDの空間パラメータ抽出がすでに実行済みであると仮定している。オーディオエンコーダ90は、上述のように動作する信号特性評価部66及び位相評価部46をさらに備えている。信号の分類及び/又は位相の分析の結果に応じ、上側の信号経路によって示されている第1の動作モードに従って、位相パラメータが抽出されて提供される。あるいは、信号の分類及び/又は位相の分析によって制御されるスイッチ98が、供給された空間パラメータ94が調節されることなく伝達される第2の動作モードを作動させることができる。
しかしながら、位相情報の伝達を必要とする第1の動作モードが選択されるとき、相関情報調節部92は受信したICCパラメータから相関の指標を導出し、その導出された相関の指標がICCパラメータの代わりに送信される。その相関の指標は、第1及び第2の入力オーディオ信号の間の相対の位相シフトが割り出され、かつオーディオ信号がスピーチ信号であると分類されるとき、相関情報よりも大きくなるように選択される。さらに、位相パラメータが、位相パラメータ抽出部100によって抽出され送信される。
随意によるICCの調節、又は最初に導出されたICCパラメータの代わりに提示される相関の指標の決定は、0よりも小さいICCにおいて再構成信号が実際に元のオーディオ信号から直接導出される唯一の信号であるドライ信号を50%未満しか含まないという事実を考慮することで、さらに良好な知覚的品質という効果を有することができる。すなわち、オーディオ信号が位相シフトによってのみ有意に相違する可能性があることが知られているが、その場合の再構成は脱相関信号(ウェット信号)が支配的な信号をもたらす。ICCパラメータ(ICCcomplexの実部)が相関情報調節部によって増やされた場合は、位相の再生の必要性が出てきたときに、アップミックスがドライ信号からより多くの信号エネルギーを自動的に使用し、そのように「真の(genuine)」オーディオ情報をより多く使用することで、再生信号が元の信号にさらに近くなる。
換言すると、送信されたICCパラメータが、デコーダのアップミックスにおいて加えられる脱相関信号がより少なくなるような方法で調節される。ICCパラメータについて考えられる1つの調節は、ICCパラメータとして通常使用されるチャネル間相互相関の代わりに、チャネル間コヒーレンス(ICCcomplexの絶対値)を使用することである。チャネル間相互相関は、
Figure 2011527456
として定義され、チャネルの位相関係に依存する。しかしながら、チャネル間コヒーレンスは位相関係とは無関係であり、以下のように定義される。
Figure 2011527456
チャネル間の位相差は、計算されて残りの空間副情報と一緒にデコーダへ送信される。その表現は実際の位相値の量子化においてきわめて粗くすることができ、さらに、粗い周波数分解能を有することができ、図8の実施の形態から明らかなように広帯域の位相情報でも有益でありうる。
位相差は、以下のように複素チャネル間関係から導出することができる。
Figure 2011527456
位相情報がビットストリーム(すなわち、エンコード済みの表現54)に含まれる場合、デコーダの脱相関合成は、調節されたICCパラメータ(相関の指標)を使用して、反響音の少ないアップミックス信号を生成することができる。
もし、例えば、信号分類器がスピーチ及びミュージック信号の間の区別を行うのであれば、ひとたび信号の支配的なスピーチ特性が確認されたならば、位相合成が必要であるか否かの決定は以下の規則に従って行うことができる。
最初に、広帯域の指示値又は位相シフトインジケータを、ICC及びILDパラメータを生成するために使用されるパラメータ帯域のいくつかについて導出することができる。すなわち、例えば、スピーチ信号が支配的に存在する周波数範囲を評価することができる(例えば、100Hz〜2KHzの間)。考えられる1つの評価は、それらの周波数帯域のすでに導出されたICCパラメータにもとづいて、この周波数範囲における平均の相関を計算することであろう。この平均の相関が所定のしきい値よりも小さいことが明らかになった場合、その信号は位相がずれていると推定することができ、位相シフトが行われる。さらに、所望される位相の再構成の粒度に応じて異なる位相シフトを知らせるために、複数のしきい値を使用することができる。考えられるしきい値の値は、例えば0、−0.3、又は−0.5とすることができる。
図8は、エンコーダ150がスピーチ及びミュージック信号をエンコードすべく動作することができる本発明のさらなる実施の形態を示している。第1の入力オーディオ信号40aと第2の入力オーディオ信号40bがエンコーダ150へ供給され、エンコーダ150は信号特性評価部66、位相評価部46、ダウンミキサ152、ミュージックコアコーダ154、スピーチコアコーダ156及び相関情報調節部158を備えている。信号特性評価部66?は、第1の信号特性としてのスピーチ特性と第2の信号特性としてのミュージック特性との間の区別を行うように構成されている。信号特性評価部66は、制御リンク160を介し、導出された信号特性に応じて出力インターフェイス68を制御するように動作することができる。
位相評価部は、入力オーディオチャネル40a及び40bから直接に位相情報を評価するか、又はダウンミキサ152によって導出されるICCパラメータから位相情報を評価する。ダウンミキサはダウンミックスオーディオチャネルM(162)及び相関情報ICC(164)を生成する。先に説明した実施の形態に従い、位相情報評価部46は、代案として、供給されるICCパラメータ164から直接に位相情報を導出してもよい。ダウンミックスオーディオチャネル162は、ミュージックコアコーダ154及びスピーチコアコーダ156(どちらも、オーディオダウンミックスチャネルのエンコード済みの表現をもたらすための出力インターフェイス68へ接続されている)へ供給することができる。相関情報164は、一方では、出力インターフェイス68へ直接もたらされる。相関情報164は、他方では、相関情報調節部158の入力へもたらされる。相関情報調節部158は、もたらされた相関情報を調節し、調節によって得られた相関の指標を出力インターフェイス68へもたらす。
出力インターフェイスは、信号特性評価部66によって評価された信号特性に応じて、異なるパラメータからなる部分集合をデコード済みの表現に含ませる。第1(スピーチ)の動作モードにおいては、出力インターフェイス68は、スピーチコアコーダ156によってエンコードされたダウンミックスオーディオチャネル106のエンコード済み表現、並びに位相評価部46から導出された位相情報PI及び相関の指標を含ませる。相関の指標は、ダウンミキサ152によって導出された相関パラメータICCとすることができ、又は相関情報調節部158によって調節された相関の指標とすることができる。この目的のため、相関情報調節部158は、位相情報評価部46によって制御及び/又は作動させることができる。
ミュージックの動作モードにおいては、出力インターフェイスは、ミュージックコアコーダ154によってエンコードされたダウンミックスオーディオチャネル162及びダウンミキサ152から導出された相関情報ICCを含ませる。
異なるパラメータの部分集合の包含は、上述の特定の実施の形態のように異なった方法で実施してもよいことは言うまでもない。例えば、ミュージック及び/又はスピーチコーダは、信号特性評価部66から導出された信号特性に応じて、作動信号によって信号経路に入れられるまで非作動にすることができる。
図9は本発明によるデコーダの実施の形態を示している。オーディオデコーダ200は、エンコード済みの表現204から、第1のオーディオチャネル202a及び第2のオーディオチャネル202bを導出するように構成されている。エンコード済みの表現204は、ダウンミックスオーディオ信号206aと、ダウンミックス信号の第1の時間部分のための第1の相関情報208と、ダウンミックス信号の第2の時間部分のための第2の相関情報210とを含んでおり、位相情報212を第1又は第2の時間部分についてのみ含んでいる。
デマルチプレクサ(図示されていない)が、エンコード済み表現204の個々の成分を分離し、第1及び第2の相関情報をダウンミックスオーディオ信号206aと一緒にアップミキサ220へ供給する。アップミキサ220は、例えば、図1において述べたアップミキサとすることができる。しかしながら、異なる内部アップミキシングアルゴリズムを有する別のアップミキサも使用可能である。一般に、アップミキサは、第1の相関情報208及びダウンミックスオーディオ信号206aを使用して第1の時間部分のための第1の中間オーディオ信号222aを導出し、第2の相関情報210及びダウンミックスオーディオ信号206aを使用して第2の時間部分に対応する第2の中間オーディオ信号222bを導出するように構成される。
換言すると、第1の時間部分が脱相関情報ICC1を使用して再構成され、第2の時間部分がICC2を使用して再構成される。第1の中間信号222a及び第2の中間信号222bは中間信号ポストプロセッサ224へ供給され、中間信号ポストプロセッサ224は、対応する位相情報212を使用して第1の時間部分のための事後処理済み中間信号226を導出するように構成されている。この目的のために、中間信号ポストプロセッサ224は、位相情報212をアップミキサ220によって生成された中間信号とともに受信する。中間信号ポストプロセッサ224は、特定のオーディオ信号に対応する位相情報が存在するときに、中間オーディオ信号のオーディオチャネルのうちの少なくとも1つのオーディオチャネルであって、位相情報が存在するオーディオ信号のオーディオチャネルに位相シフトを加えるように構成されている。
すなわち、中間信号ポストプロセッサ224は、第1の中間オーディオ信号222aに位相シフトを加え、中間オーディオ信号222bには位相シフトを加えない。中間信号ポストプロセッサ224は、第1の中間オーディオ信号の代わりの事後処理済み中間信号226と、変更なしの第2の中間信号222bとを出力する。
オーディオデコーダ200は信号結合部230をさらに備えており、信号結合部230は中間信号ポストプロセッサ224から出力された信号を結合させて、オーディオデコーダ200によって生成される第1のオーディオチャネル202a及び第2のオーディオチャネル202bを導出する。
一特定の実施の形態においては、信号結合部は中間信号ポストプロセッサから出力された信号を連結し、最終的に第1及び第2の時間部分のためのオーディオ信号を導出する。さらなる実施の形態においては、信号結合部は、中間信号ポストプロセッサからもたらされる信号の間のフェーディングによって第1のオーディオ信号202a及び第2のオーディオ信号202bを導出するように、ある種のクロスフェーディングを実現することができる。当然ながら、信号結合部230の別の実施例も実現可能である。
図9に示したような本発明のデコーダの実施の形態を使用することで、エンコーダ信号によって知らせることができる追加の位相シフトを加え、又は信号を下位互換の様相でデコードするための柔軟性がもたらされる。
図10は、オーディオデコーダが送信された位相情報に応じて第1の脱相関規則及び第2の脱相関規則に従って動作することができる脱相関回路243を備えている本発明のさらなる実施の形態を示している。図10の実施の形態によれば、送信されたダウンミックスオーディオチャネル240から脱相関信号242を導出するための脱相関規則は、存在する位相情報に応じて切り替えることができる。
位相情報が送信される第1のモードにおいては、脱相関信号242を導出するために第1の脱相関規則が使用される。位相情報が受信されない第2のモードにおいては、第2の脱相関規則が使用され、第1の脱相関規則を使用して生成される信号よりもさらに脱相関した脱相関信号が生成される。
すなわち、位相合成が必要とされるとき、位相合成が必要とされない場合に使用される信号ほどには脱相関していない脱相関信号を導出することができる。すなわち、デコーダは、ドライ信号により類似した脱相関信号を使用することができ、アップミックスにおいて一層多くのドライ信号成分を有する信号が自動的に生成される。これは、脱相関信号をドライ信号により類似させることによって達成される。
さらなる実施の形態においては、随意による位相シフタ246を、位相合成を有する再構成のために生成された脱相関信号へ適用することができる。これは、ドライ信号に対する正しい位相関係をすでに有している脱相関信号をもたらすことによって、再構成信号の位相特性のより厳密な再構成をもたらす。
図11は分析フィルタバンク260と合成フィルタバンク262とを備えている本発明のオーディオデコーダのさらなる実施の形態を示している。このデコーダは、ダウンミックスオーディオ信号206を関連のICCパラメータ(ICC0、・・・、ICCn)と一緒に受信する。しかしながら、図11においては、異なるICCパラメータが異なる時間部分に組み合わせられるだけでなく、オーディオ信号の異なる周波数帯域にも組み合わせられる。すなわち、各々の時間部分の処理が、関連の一式のICCパラメータ(ICC0、・・・、ICCn)の全体を有する。
その処理が周波数選択的なやり方で実行されるため、分析フィルタバンク260は、送信されたダウンミックスオーディオ信号206の64個のサブ帯域表現を導出する。すなわち、帯域幅の限られた64個の(フィルタバンク表現の)信号が導出され、各々の信号が1つのICCパラメータに関係している。あるいは、限られた帯域幅のいくつかの信号が共通のICCパラメータを共有してもよい。サブ帯域表現の各々が、アップミキサ264a、264b、……によって処理される。各々のアップミキサは、例えば、図1の実施の形態によるアップミキサとすることができる。
したがって、限られた帯域幅の表現の各々について、第1及び第2のオーディオチャネル(どちらも帯域幅が限られている)が生成される。そのようにサブ帯域ごとに生成されたオーディオチャネルのうちの少なくとも1つが、例えば図9において説明した中間オーディオ信号ポストプロセッサのような中間オーディオ信号ポストプロセッサ266a、266b、……へ入力される。図11の実施の形態によれば、中間オーディオ信号ポストプロセッサ266a、266b、……は、同じ共通の位相情報212によって制御される。すなわち、サブバンド信号が合成フィルタバンク262によって合成されてデコーダによって出力される第1のオーディオチャネル202a及び第2のオーディオチャネル202bとなる前に、同一の位相シフトが各々のサブ帯域信号へ加えられる。
このようにして、ただ1つの追加の共通の位相情報を送信するだけで、位相合成を実行することができる。したがって、図11の実施の形態においては、元の信号の位相特性の正しい復元を、ビットレートをあまり増加させることなく実行することができる。
さらなる実施の形態によれば、共通の位相情報212が使用されるサブ帯域の数が信号に依存する。したがって、位相情報は、対応する位相シフトが適用されるときに、知覚的品質の向上が達成可能であるサブ帯域についてのみ評価することができる。これは、デコード後の信号の知覚的品質をさらに向上させることができる。
図12は、スピーチ信号又はミュージック信号のどちらであってもよい元のオーディオ信号のエンコード済みの表現をデコードするように構成されたオーディオデコーダのさらなる実施の形態を示している。すなわち、信号特性情報がエンコード済みの表現においてどの信号特性が送信されているかを示しながら送信されるか、又は信号特性がビットストリーム中の位相情報の存在によって黙示的に導出することができる。この目的のため、位相情報の存在がオーディオ信号のスピーチ特性を示すと考えることができる。送信されたダウンミックスオーディオ信号206は、その信号特性に応じて、スピーチデコーダ266又はミュージックデコーダ268のいずれかによってデコードされる。さらなる処理は、図11において図示及び説明したように実行される。したがって、さらなる実現の詳細については、図11の説明を参照されたい。
図13は、第1及び第2の入力オーディオ信号のエンコード済み表現を生成するための本発明の方法の実施の形態を示している。空間パラメータ抽出ステップ300において、ICC及びILDパラメータが第1及び第2の入力オーディオ信号から導出される。位相評価ステップ302において、第1及び第2の入力オーディオ信号の間の位相関係を示す位相情報が導出される。モードの決定304において、位相関係が第1及び第2の入力オーディオ信号の間の位相差が所定のしきい値よりも大きい旨を示している場合に第1の出力モードが選択され、位相差がしきい値よりも小さい場合に第2の出力モードが選択される。表現生成ステップ306において、第1の出力モードではICCパラメータ、ILDパラメータ及び位相情報がエンコード済みの表現に含められ、第2の出力モードでは位相関係を含まないICCパラメータ及びILDパラメータがエンコード済みの表現に含められる。
図14は、オーディオ信号のエンコード済み表現を使用して第1及び第2のオーディオチャネルを生成するための方法の実施の形態を示している。エンコード済み表現は、ダウンミックスオーディオ信号と、ダウンミックス信号の生成に使用された第1及び第2の元のオーディオチャネルの間の相関を示している第1及び第2の相関情報(第1の相関情報はダウンミックス信号の第1の時間部分についての情報を有しており、第2の相関情報は第2の別の時間部分についての情報を有している。)と、第1の時間部分について第1及び第2の元のオーディオチャネルの間の位相関係を示している位相情報とを含んでいる。
アップミックスステップ400において、第1の時間部分に対応し、第1及び第2のオーディオチャネルを含んでいる第1の中間オーディオ信号が、ダウンミックス信号及び第1の相関情報を使用して導出される。アップミックスステップ400においては、第2の時間部分に対応し、第1及び第2のオーディオチャネルを含んでいる第2の中間オーディオ信号も、ダウンミックス信号及び第2の相関情報を使用して導出される。
事後処理ステップ402において、事後処理済みの中間信号が、第1の時間部分について第1の中間オーディオ信号を使用して導出されるが、ここでは、位相関係によって示される追加の位相シフトが、第1の中間オーディオ信号の第1又は第2のオーディオチャネルの少なくとも一方へ加えられる。
信号結合ステップ404において、第1及び第2のオーディオチャネルが、事後処理済みの中間信号及び第2の中間オーディオ信号を使用して生成される。
本発明の方法の特定の実施の要件に応じて、本発明の方法はハードウェア又はソフトウェアにて実現することができる。その実現は、本発明の方法を実行するようにプログラマブルなコンピューターシステムと協働する電子的に読み取ることが可能な制御信号が保存されてなるデジタル記憶媒体(特に、ディスク、DVD又はCD)を使用して実行可能である。したがって、一般的に、本発明は、機械で読み取ることができる担体上に保存されたプログラムコードを含むコンピュータープログラム製品であり、そのプログラムコードは、このコンピュータープログラム製品がコンピューター上で実行されるときに、本発明の方法を実行するように動作することができるものである。したがって、換言すると、本発明の方法は、コンピューター上で実行されたときに本発明の方法のうちの少なくとも1つを実行するためのプログラムコードを有しているコンピュータープログラムである。
以上、本発明の特定の実施の形態に関して詳しく図示及び説明したが、本発明の技術的思想及び技術的範囲から離れることなく、形態及び細部において他のさまざまな変更が可能であることを当業者であれば理解できるであろう。本明細書に開示され、以下の特許請求の範囲に包含される一層広い概念から逸脱することなく、さまざまな実施の形態への適合においてさまざまな変更が可能であることを、理解すべきである。

Claims (25)

  1. 第1及び第2の入力オーディオ信号のエンコード済み表現を生成するためのオーディオエンコーダであって、
    前記第1及び第2の入力オーディオ信号の間の相関を表わす相関情報を導出するように構成された相関評価部と、
    前記入力オーディオ信号の第1又は第2の別々の特性を表わす信号特性情報を導出するように構成された信号特性評価部と、
    前記入力オーディオ信号が前記第1の特性を有する場合に、前記第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を導出するように構成された位相評価部と、
    前記入力オーディオ信号が前記第1の特性を有する場合に、前記エンコード済み表現に前記位相情報及び相関の指標を含ませ、又は、前記入力オーディオ信号が前記第2の特性を有する場合に、前記エンコード済み表現に前記相関情報を含ませ、前記位相情報を含ませないように構成されている出力インターフェイスと、
    を備えたオーディオエンコーダ。
  2. 前記信号評価部によって指示される前記第1の信号特性はスピーチ特性であり、
    前記信号評価部によって指示される前記第2の信号特性はミュージック特性である請求項1に記載のオーディオエンコーダ。
  3. 前記位相評価部は、前記相関情報を使用して前記位相情報を導出するように構成されている請求項1に記載のオーディオエンコーダ。
  4. 前記位相情報は前記第1及び第2の入力オーディオ信号の間の位相シフトを表わしている請求項1に記載のオーディオエンコーダ。
  5. 前記相関評価部は、脱相関情報として、前記第1及び第2の入力オーディオ信号のサンプリングされた信号部分の複素相互相関ICCcomplexの実部によって表わされるICCパラメータを生成するように構成されており、
    前記出力インターフェイスは、前記相関情報が所定のしきい値よりも小さい場合に、前記エンコード済み表現に前記位相情報を含ませるように構成されている請求項3に記載のオーディオエンコーダ。
    ここで、前記各々の信号部分が1個のサンプル値X(l)によって表わされるものとすると、前記ICCパラメータは以下の式によって表わすことができる。
    Figure 2011527456
  6. 前記所定のしきい値は0.3以下である請求項5に記載のオーディオエンコーダ。
  7. 前記相関情報の前記所定のしきい値は、90°を超える位相シフトに相当する請求項5に記載のオーディオエンコーダ。
  8. 前記相関評価部は前記相関情報として複数の相関パラメータを導出するように構成され、各々の相関パラメータは前記第1及び第2の入力オーディオ信号の対応するサブ帯域に関係しており、
    前記位相評価部は、前記相関パラメータに対応する前記サブ帯域のうちの少なくとも2つについて前記第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を導出するように構成されている請求項1に記載のオーディオエンコーダ。
  9. 前記相関の指標を前記相関情報よりも高い相関を表わすように導出するように構成された相関情報調節部をさらに備えており、
    前記出力インターフェイスは前記相関情報の代わりに前記相関の指標を含ませるように構成されている請求項1に記載のオーディオエンコーダ。
  10. 前記相関情報調節部は、前記相関の指標ICCとして前記第1及び第2の入力オーディオ信号の2つのサンプリングされた信号部分の複素相互相関ICCcomplexの絶対値を使用するように構成されている請求項9に記載のオーディオエンコーダ。
    ここで、前記各々の信号部分が1個の複素値サンプル値X(l)によって表わされるものとすると、前記相関の指標ICCは以下の式によって表わされる。
    Figure 2011527456
  11. 第1及び第2の入力オーディオ信号のエンコード済み表現を生成するためのオーディオエンコーダであって、
    前記第1及び第2の入力オーディオ信号の間の相関を表わすICCパラメータ又は前記第1及び第2の入力オーディオ信号の間のレベルの関係を表わすILDパラメータを導出するように構成された空間パラメータ評価部と、
    前記第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を導出するように構成された位相評価部と、
    前記位相関係が前記第1及び第2の入力オーディオ信号の間の位相差が所定のしきい値よりも大きい旨を示している場合に第1の出力モードを指示し、前記位相差が前記所定のしきい値よりも小さい場合に第2の出力モードを指示するように構成された出力動作モード決定部と、
    前記第1の出力モードにおいては前記エンコード済み表現に前記ICC又はILDパラメータと前記位相情報とを含ませ、前記第2の出力モードにおいては前記エンコード済み表現に前記ICC及びILDパラメータを含ませ、前記位相情報を含ませないように構成されている出力インターフェイスと、を備えているオーディオエンコーダ。
  12. 前記所定のしきい値は60°の位相シフトに相当する請求項11に記載のオーディオエンコーダ。
  13. 前記空間パラメータ評価部は複数のICC又はILDパラメータを導出するように構成され、各々のICC又はILDパラメータは前記第1及び第2の入力オーディオ信号のサブ帯域表現の対応するサブ帯域に関係しており、
    前記位相評価部は前記サブ帯域表現の前記サブ帯域のうちの少なくとも2つについて前記第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を導出するように構成されている請求項11に記載のオーディオエンコーダ。
  14. 前記出力インターフェイスはただ1つの位相情報パラメータを前記位相情報として前記表現に含ませるように構成され、該ただ1つの位相情報パラメータは前記サブ帯域表現の前記サブ帯域のうちの所定の部分群の前記位相関係を示している請求項13に記載のオーディオエンコーダ。
  15. 前記位相関係は所定の位相シフトを表わすただ1つのビットによって表現されている請求項11に記載のオーディオエンコーダ。
  16. オーディオ信号のエンコード済み表現を使用して第1及び第2のオーディオチャネルを生成するためのオーディオデコーダであって、前記エンコード済み表現が、ダウンミックスオーディオ信号と、該ダウンミックスオーディオ信号を生成するために使用された第1及び第2の元のオーディオチャネルの間の相関を表わしている第1及び第2の相関情報とを含んでおり、該第1の相関情報が前記ダウンミックス信号の第1の時間部分についての情報を有しており、前記第2の相関情報が第2の別の時間部分についての情報を有しており、前記エンコード済み表現が前記第1及び第2の時間部分についての位相情報をさらに含んでおり、該位相情報が前記第1及び第2の元のオーディオチャネルの間の位相関係を表わしているオーディオデコーダであり、
    前記第1の時間部分に対応し、第1及び第2のオーディオチャネルを含んでいる第1の中間オーディオ信号を、前記ダウンミックスオーディオ信号及び前記第1の相関情報を使用して導出し、前記第2の時間部分に対応し、第1及び第2のオーディオチャネルを含んでいる第2の中間オーディオ信号を、前記ダウンミックスオーディオ信号及び前記第2の相関情報を使用して導出するように構成されたアップミキサと、
    前記位相関係によって示される追加の位相シフトを前記第1の中間オーディオ信号の前記第1又は第2のオーディオチャネルのうちの少なくとも一方へ加えるように構成され、前記第1の中間オーディオ信号及び前記位相情報を使用して前記第1の時間部分について事後処理済み中間オーディオ信号を導出するように構成された中間信号ポストプロセッサと、
    前記事後処理済み中間オーディオ信号及び前記第2の中間オーディオ信号を組み合わせることによって前記第1及び第2のオーディオチャネルを生成するように構成された信号結合部と、
    を備えたオーディオデコーダ。
  17. 前記アップミキサは前記相関情報として複数の相関パラメータを使用するように構成されており、各々の相関パラメータは前記第1及び第2の元のオーディオ信号の複数のサブ帯域のうちの1つに対応しており、
    前記中間信号ポストプロセッサは前記位相関係によって示される前記追加の位相シフトを前記第1の中間オーディオ信号の前記対応するサブ帯域のうちの少なくとも2つへ加えるように構成されている請求項16に記載のオーディオデコーダ。
  18. 前記第1の相関よりも高い相関を表わす相関の指標を導出するように構成された相関情報プロセッサをさらに備えており、
    前記アップミキサは、前記位相情報が前記第1及び第2の元のオーディオチャネルの間の位相シフトが所定のしきい値よりも大きい旨を示している場合に、前記相関情報の代わりに前記相関の指標を使用する請求項16に記載のオーディオデコーダ。
  19. 前記第1の時間部分について第1の脱相関規則に従い、前記第2の時間部分について第2の脱相関規則に従って、前記ダウンミックスオーディオ信号から脱相関オーディオ信号を導出するように構成された脱相関器をさらに備えており、
    前記第1の脱相関規則は前記第2の脱相関規則よりも脱相関が少ないオーディオチャネルを生成する請求項16に記載のオーディオデコーダ。
  20. 前記脱相関器は位相シフタをさらに備えており、該位相シフタは前記位相情報に応じた追加の位相シフトを、前記第1の脱相関規則を使用して生成された前記脱相関オーディオチャネルへ加えるように構成されている請求項19に記載のオーディオデコーダ。
  21. 第1及び第2の入力オーディオ信号のエンコード済み表現を生成するための方法であって、
    前記第1及び第2の入力オーディオ信号の間の相関を表わす相関情報を導出するステップと、
    前記入力オーディオ信号の第1又は第2の別々の特性を表わす信号特性情報を導出するステップと、
    前記入力オーディオ信号が前記第1の特性を有する場合に、前記第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を導出するステップと、
    を含んでおり、さらに、
    前記入力オーディオ信号が前記第1の特性を有する場合に、前記エンコード済み表現に前記位相情報及び相関の指標を含ませるステップ、又は
    前記入力オーディオ信号が前記第2の特性を有する場合に、前記エンコード済み表現に前記相関情報を含ませ、前記位相情報を含ませないステップ、
    を含んでいる方法。
  22. 第1及び第2の入力オーディオ信号のエンコード済み表現を生成するための方法であって、
    前記第1及び第2の入力オーディオ信号の間の相関を表わすICCパラメータ又は前記第1及び第2の入力オーディオ信号の間のレベルの関係を表わすILDパラメータを導出するステップと、
    前記第1及び第2の入力オーディオ信号の間の位相関係を表わす位相情報を導出するステップと、
    前記位相関係として前記第1及び第2の入力オーディオ信号の間の位相差が所定のしきい値よりも大きい旨を示している場合に第1の出力モードを指示し、前記位相差が前記所定のしきい値よりも小さい場合に第2の出力モードを指示するステップと、
    前記第1の出力モードにおいては前記エンコード済み表現に前記ICC又はILDパラメータと前記位相情報とを含ませ、又は、前記第2の出力モードにおいては前記エンコード済み表現に前記ICC及びILDパラメータを含ませ、前記位相情報を含ませないステップと、
    を含んでいる方法。
  23. オーディオ信号のエンコード済み表現を使用して第1及び第2のオーディオチャネルを導出するための方法であって、前記エンコード済み表現が、ダウンミックスオーディオ信号と、該ダウンミックスオーディオ信号を生成するために使用された第1及び第2の元のオーディオチャネルの間の相関を表わしている第1及び第2の相関情報とを含んでおり、該第1の相関情報が前記ダウンミックス信号の第1の時間部分についての情報を有しており、前記第2の相関情報が第2の別の時間部分についての情報を有しており、前記エンコード済み表現が前記第1及び第2の時間部分についての位相情報をさらに含んでおり、該位相情報が前記第1及び第2の元のオーディオチャネルの間の位相関係を表わしている方法であり、
    前記第1の時間部分に対応し、第1及び第2のオーディオチャネルを含んでいる第1の中間オーディオ信号を、前記ダウンミックスオーディオ信号及び前記第1の相関情報を使用して導出するステップと、
    前記第2の時間部分に対応し、第1及び第2のオーディオチャネルを含んでいる第2の中間オーディオ信号を、前記ダウンミックスオーディオ信号及び前記第2の相関情報を使用して導出するステップと、
    前記第1の中間オーディオ信号及び前記位相情報を使用し、前記位相関係によって示される追加の位相シフトを前記第1の中間信号の前記第1又は第2のオーディオチャネルのうちの少なくとも一方へと加えることによって、前記第1の時間部分について事後処理済み中間信号を導出するステップと、
    前記事後処理済み中間信号及び前記第2の中間オーディオ信号を組み合わせ、前記第1及び第2のオーディオチャネルを導出するステップと、
    を含んでいる方法。
  24. オーディオ信号のエンコード済み表現であって、
    第1及び第2の元のオーディオチャネルを使用して生成されたダウンミックス信号と、
    第1の時間部分における前記第1及び第2の元のオーディオチャネルの間の相関を表わす第1の相関情報と、
    第2の時間部分における前記第1及び第2の元のオーディオチャネルの間の相関を表わす第2の相関情報と、
    前記第1の時間部分における前記第1及び第2の元のオーディオチャネルの間の位相関係を表わす位相情報と、を含んでおり、
    前記位相情報は前記第1及び第2の時間部分についての前記エンコード済み表現に含まれる唯一の位相情報であるエンコード済み表現。
  25. コンピューター上で実行されたときに請求項21から23に記載の方法のいずれかを実行するためのプログラムコードを有しているコンピュータープログラム。
JP2011517003A 2008-07-11 2009-06-30 オーディオのエンコーディング及びデコーディングにおける位相情報の効率的な使用 Active JP5587878B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7983808P 2008-07-11 2008-07-11
US61/079,838 2008-07-11
EP08014468A EP2144229A1 (en) 2008-07-11 2008-08-13 Efficient use of phase information in audio encoding and decoding
EP08014468.6 2008-08-13
PCT/EP2009/004719 WO2010003575A1 (en) 2008-07-11 2009-06-30 Efficient use of phase information in audio encoding and decoding

Publications (2)

Publication Number Publication Date
JP2011527456A true JP2011527456A (ja) 2011-10-27
JP5587878B2 JP5587878B2 (ja) 2014-09-10

Family

ID=39811665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011517003A Active JP5587878B2 (ja) 2008-07-11 2009-06-30 オーディオのエンコーディング及びデコーディングにおける位相情報の効率的な使用

Country Status (15)

Country Link
US (1) US8255228B2 (ja)
EP (2) EP2144229A1 (ja)
JP (1) JP5587878B2 (ja)
KR (1) KR101249320B1 (ja)
CN (1) CN102089807B (ja)
AR (1) AR072420A1 (ja)
AU (1) AU2009267478B2 (ja)
BR (1) BRPI0910507B1 (ja)
CA (1) CA2730234C (ja)
ES (1) ES2734509T3 (ja)
MX (1) MX2011000371A (ja)
RU (1) RU2491657C2 (ja)
TR (1) TR201908029T4 (ja)
TW (1) TWI449031B (ja)
WO (1) WO2010003575A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012503792A (ja) * 2008-09-25 2012-02-09 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
US8346379B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
JP2016522445A (ja) * 2013-05-24 2016-07-28 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
JP2016539358A (ja) * 2013-10-21 2016-12-15 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成のための脱相関器構造
JP2020512590A (ja) * 2017-03-31 2020-04-23 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
JP2022087124A (ja) * 2017-06-30 2022-06-09 華為技術有限公司 チャネル間位相差パラメータ符号化方法および装置
JP2022136263A (ja) * 2013-07-31 2022-09-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 空間的に拡散したまたは大きなオーディオ・オブジェクトの処理

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US9053701B2 (en) * 2009-02-26 2015-06-09 Panasonic Intellectual Property Corporation Of America Channel signal generation device, acoustic signal encoding device, acoustic signal decoding device, acoustic signal encoding method, and acoustic signal decoding method
CN102667918B (zh) * 2009-10-21 2015-08-12 弗兰霍菲尔运输应用研究公司 用于使音频信号混响的混响器和方法
CN102157152B (zh) 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
EP2609591B1 (en) 2010-08-25 2016-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for generating a decorrelated signal using transmitted phase information
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
EP2612322B1 (en) * 2010-10-05 2016-05-11 Huawei Technologies Co., Ltd. Method and device for decoding a multichannel audio signal
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US9219972B2 (en) * 2010-11-19 2015-12-22 Nokia Technologies Oy Efficient audio coding having reduced bit rate for ambient signals and decoding using same
JP5582027B2 (ja) * 2010-12-28 2014-09-03 富士通株式会社 符号器、符号化方法および符号化プログラム
JP6239521B2 (ja) * 2011-11-03 2017-11-29 ヴォイスエイジ・コーポレーション 低レートcelpデコーダに関する非音声コンテンツの向上
WO2013149670A1 (en) 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2717265A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding
KR101729930B1 (ko) * 2013-02-14 2017-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
KR20160015280A (ko) * 2013-05-28 2016-02-12 노키아 테크놀로지스 오와이 오디오 신호 인코더
JP5853995B2 (ja) * 2013-06-10 2016-02-09 トヨタ自動車株式会社 協調スペクトラムセンシング方法および車載無線通信装置
KR102192361B1 (ko) * 2013-07-01 2020-12-17 삼성전자주식회사 머리 움직임을 이용한 사용자 인터페이스 방법 및 장치
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
CN105612766B (zh) 2013-07-22 2018-07-27 弗劳恩霍夫应用研究促进协会 使用渲染音频信号的解相关的多声道音频解码器、多声道音频编码器、方法、以及计算机可读介质
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
WO2015059153A1 (en) * 2013-10-21 2015-04-30 Dolby International Ab Parametric reconstruction of audio signals
CN105765655A (zh) 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
JP6235725B2 (ja) 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
CA2987808C (en) 2016-01-22 2020-03-10 Guillaume Fuchs Apparatus and method for encoding or decoding an audio multi-channel signal using spectral-domain resampling
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN117392988A (zh) 2016-09-28 2024-01-12 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
MX2019005214A (es) 2016-11-08 2019-06-24 Fraunhofer Ges Forschung Mezclador y metodo para mezclar al menos dos canales y codificador multicanal y decodificador multicanal.
GB2568274A (en) * 2017-11-10 2019-05-15 Nokia Technologies Oy Audio stream dependency information
US11533576B2 (en) * 2021-03-29 2022-12-20 Cae Inc. Method and system for limiting spatial interference fluctuations between audio signals
EP4383254A1 (en) 2022-12-07 2024-06-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
JP2007507726A (ja) * 2003-09-29 2007-03-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の符号化

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
EP1914722B1 (en) * 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
RU2323551C1 (ru) * 2004-03-04 2008-04-27 Эйджир Системс Инк. Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования
CN1954362B (zh) * 2004-05-19 2011-02-02 松下电器产业株式会社 音频信号编码装置及音频信号解码装置
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US20070174047A1 (en) * 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
TWI297488B (en) * 2006-02-20 2008-06-01 Ite Tech Inc Method for middle/side stereo coding and audio encoder using the same
EP2054879B1 (en) * 2006-08-15 2010-01-20 Broadcom Corporation Re-phasing of decoder states after packet loss
US8265299B2 (en) * 2008-07-29 2012-09-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
JP2007507726A (ja) * 2003-09-29 2007-03-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の符号化

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346379B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
JP2012503792A (ja) * 2008-09-25 2012-02-09 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP2016522445A (ja) * 2013-05-24 2016-07-28 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
JP2022136263A (ja) * 2013-07-31 2022-09-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 空間的に拡散したまたは大きなオーディオ・オブジェクトの処理
JP7493559B2 (ja) 2013-07-31 2024-05-31 ドルビー ラボラトリーズ ライセンシング コーポレイション 空間的に拡散したまたは大きなオーディオ・オブジェクトの処理
US9848272B2 (en) 2013-10-21 2017-12-19 Dolby International Ab Decorrelator structure for parametric reconstruction of audio signals
JP2016539358A (ja) * 2013-10-21 2016-12-15 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成のための脱相関器構造
US11386907B2 (en) 2017-03-31 2022-07-12 Huawei Technologies Co., Ltd. Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
JP2020512590A (ja) * 2017-03-31 2020-04-23 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
US11894001B2 (en) 2017-03-31 2024-02-06 Huawei Technologies Co., Ltd. Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
JP2022087124A (ja) * 2017-06-30 2022-06-09 華為技術有限公司 チャネル間位相差パラメータ符号化方法および装置
JP7439152B2 (ja) 2017-06-30 2024-02-27 華為技術有限公司 チャネル間位相差パラメータ符号化方法および装置

Also Published As

Publication number Publication date
EP2301016A1 (en) 2011-03-30
RU2491657C2 (ru) 2013-08-27
KR20110040793A (ko) 2011-04-20
CN102089807B (zh) 2013-04-10
US8255228B2 (en) 2012-08-28
CN102089807A (zh) 2011-06-08
WO2010003575A1 (en) 2010-01-14
BRPI0910507A2 (pt) 2016-07-26
MX2011000371A (es) 2011-03-15
BRPI0910507B1 (pt) 2021-02-23
CA2730234C (en) 2014-09-23
RU2011100135A (ru) 2012-07-20
AU2009267478A1 (en) 2010-01-14
ES2734509T3 (es) 2019-12-10
JP5587878B2 (ja) 2014-09-10
EP2144229A1 (en) 2010-01-13
EP2301016B1 (en) 2019-05-08
KR101249320B1 (ko) 2013-04-01
TWI449031B (zh) 2014-08-11
AU2009267478B2 (en) 2013-01-10
AR072420A1 (es) 2010-08-25
US20110173005A1 (en) 2011-07-14
TW201007695A (en) 2010-02-16
TR201908029T4 (tr) 2019-06-21
CA2730234A1 (en) 2010-01-14

Similar Documents

Publication Publication Date Title
JP5587878B2 (ja) オーディオのエンコーディング及びデコーディングにおける位相情報の効率的な使用
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP5255702B2 (ja) 多チャネルオーディオ信号のバイノーラル・レンダリング
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP5166292B2 (ja) 主成分分析によりマルチチャネルオーディオ信号を符号化するための装置および方法
KR100682904B1 (ko) 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
TWI459380B (zh) 用以解碼信號之裝置及方法、和電腦可讀媒體
KR20070107698A (ko) 오디오 소스의 파라메트릭 조인트 코딩
CN101118747A (zh) 保真度优化的预回声抑制编码
JP2007528025A (ja) オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
CN116348951A (zh) 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140724

R150 Certificate of patent or registration of utility model

Ref document number: 5587878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250