JP5513887B2 - 多チャネル信号のためのスイートスポット操作 - Google Patents

多チャネル信号のためのスイートスポット操作 Download PDF

Info

Publication number
JP5513887B2
JP5513887B2 JP2009527939A JP2009527939A JP5513887B2 JP 5513887 B2 JP5513887 B2 JP 5513887B2 JP 2009527939 A JP2009527939 A JP 2009527939A JP 2009527939 A JP2009527939 A JP 2009527939A JP 5513887 B2 JP5513887 B2 JP 5513887B2
Authority
JP
Japan
Prior art keywords
spatial
audio signal
channel
channel audio
changing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009527939A
Other languages
English (en)
Other versions
JP2010504017A (ja
Inventor
イェルン ジー エイチ コッペンス
エリク ジー ピー スハイエルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2010504017A publication Critical patent/JP2010504017A/ja
Application granted granted Critical
Publication of JP5513887B2 publication Critical patent/JP5513887B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

本発明は、多チャネル信号のためのスイートスポット操作に関し、特に、限定するものではないが、MPEGサラウンド音声多チャネル信号のためのスイートスポット操作に関する。
ディジタル信号表現及び通信がアナログ表現及び通信にますます置き換わってきたため、種々のオーディオ信号のディジタルエンコードは、最近の数十年間で、ますます重要なものとなっている。例えば、ビデオ及び音楽のようなメディアコンテンツの配布は、ますますディジタルのコンテンツのエンコードに基づくものとなっている。
更に、最近の数十年間、多チャネルオーディオ、具体的には従来のステレオ信号を超えた空間オーディオへ移行する傾向がある。例えば、伝統的なステレオ記録は2つのチャネルのみを有するものであるが、現代の先進のオーディオシステムは典型的に、人気の高い5.1サラウンド音声システムにおけるように、5又は6個のチャネルを利用する。このことは、ユーザが音源に囲まれ得る、より臨場感のある聴取環境を提供する。
斯かる多チャネル信号の通信のため、種々の手法及び規格が開発されてきた。例えば、5.1サラウンドシステムを表す6個の離散的なチャネルは、Advanced Audio Coding(AAC)又はDolby Digital規格のような規格に従って送信され得る。
しかしながら、後方互換性を提供するため、多くの数のチャネルを、より少ない数のチャネルへとダウンミクス(down-mix)することが知られており、具体的には、5.1サラウンド音声信号をステレオ信号へとダウンミクスすることにより、ステレオ信号をレガシー(ステレオ)デコーダにより再生されるようにし、5.1信号をサラウンド音声デコーダにより再生されるようにすることが、頻繁に利用されている。
一例は、MPEG2後方互換のコーディング方法である。多チャネル信号は、ステレオ信号へとダウンミクスされる。補助データ部分に付加的な信号がエンコードされ、それによりMPEG2多チャネルデコーダが多チャネル信号の表現を生成することを可能とする。MPEG1デコーダは該補助データを無視し、従ってステレオのダウンミクスのみをデコードする。MPEG2において適用されるコーディング方法の主な欠点は、付加的な信号のために必要とされる付加的なデータレートが、ステレオ信号をコーディングするために必要とされるデータレートと同じオーダーの大きさである点である。ステレオを多チャネルオーディオへと拡張するための付加的なビットレートは、それ故大きくなる。
付加的な多チャネル情報を伴わない後方互換の多チャネル送信のための他の既存の方法は、典型的に行列によるマトリクスサラウンド(matrixed-surround)法として特徴付けられ得る。マトリクスサラウンドの音声エンコードの例は、Dolby Prologic II及びLogic-7のような方法を含む。これら方法の共通する原理は、多チャネルの入力信号を、適切な非正方行列により行列乗算し、それにより、より少ない数のチャネルを持つ出力信号を生成することである。具体的には、行列エンコーダが典型的にサラウンドチャネルに対して位相シフトを適用し、その後にこれらチャネルを前及び中央チャネルと混合する。
チャネル変換を行う他の理由は、コーディング効率である。例えばサラウンド音声オーディオ信号は、該オーディオ信号の空間特性を記述するパラメータビットストリームと組み合わせられたステレオチャネルオーディオ信号としてエンコードされることができることが見出されている。デコーダは、非常に十分な精度で、ステレオオーディオ信号を再生することができる。このようにして、かなりのビットレートの節約が得られ得る。
かくして、(パラメトリック)空間オーディオコーダ(エンコーダ)においては、パラメータが元のオーディオ信号から抽出され、それにより、削減された数のチャネル(例えば単一のチャネルのみ)と、元のオーディオ信号の空間特性を記述するパラメータのセットとを持つオーディオ信号を再生する。(パラメトリック)空間オーディオデコーダにおいては、元の空間多チャネル信号を再生成するため、送信された空間パラメータにより記述された空間特性が利用される。オーディオ信号の空間特性を記述するために利用され得る、幾つかのパラメータがある。斯かるパラメータのひとつは、ステレオ信号のための左チャネルと右チャネルとの間の相互相関のようなチャネル間相互相関である。他のパラメータは、チャネルのパワー比である。
斯かる手法の具体例は、多チャネルオーディオ信号を効率良くコーディングするためのMPEGサラウンド手法である。
MPEGサラウンドエンコーダは、Mチャネルの入力信号を、Nチャネルのダウンミクス信号へとダウンミクスし、空間パラメータを抽出する。ここで、N<Mである。ダウンミクス信号は一般に、例えばMP3又はAACエンコーダのようなレガシーのエンコーダを用いてエンコードされる。空間パラメータは、背後にあるダウンミクス信号をレガシーのデコーダが依然としてデコードできるような後方互換の方法で、ビットストリームにエンコードされ埋め込まれる。
MPEGサラウンドデコーダにおいては、ダウンミクス信号は最初にレガシーのデコーダを用いてデコードされる。次いで、ビットストリームから抽出された空間パラメータによって、多チャネル信号が再構築される。
以上に説明されたような典型的な多チャネルコーディングの他に、MPEGサラウンドは、例えば以下のような付加的な特徴の豊富なセットを提供する。
−非ガイドデコード:以上に説明された空間的な副情報が利用可能でない場合には、MPEGサラウンドデコーダは、ステレオ信号の多チャネルアップミクスを生成することが可能である。この方法においては、デコーダはステレオ信号のパワー比及び相関を算出し、これらの特性がテーブルのルックアップにより、必要とされる空間パラメータを得るために利用される。
−行列互換性:MPEGサラウンドエンコーダは、既存のマトリクスデコード方式を用いてデコードされ得るダウンミクスを生成することが可能である。マトリクスサラウンドのダウンミクスは、デコーダの性能に対する知覚的な妥協なく、MPEGサラウンドデコーダにより反転され得るように生成される。更に、マトリクスサラウンドのダウンミクスは、非ガイドモードの性能を改善する。
−両耳用デコード:MPEGサラウンドデコーダは、中間のステップとして多チャネル信号を算出するのではなく、空間パラメータを用いて、モノラル又はステレオのダウンミクス信号を、3次元の両耳用信号へと直接に変換することが可能である。
−アーティスティック(artistic)・ダウンミクス:MPEGサラウンドは、自動化されたMPEGサラウンドのダウンミクスではなく、手動で生成されたダウンミクスの送信を可能とする。
−任意の木構造:MPEGサラウンドビットストリームは、任意のアップミクス構造の定義をサポートし、任意の数の出力チャネルを可能とする。
MPEGサラウンドコーダは、例えば5.1設定のような所定のスピーカ設定に対して、可能な限り正確に元の多チャネル信号を表現することを目的としている。しかしながら、家庭において又は車両内において典型的に存在するような種々の聴取位置及び環境に対して、柔軟性を実現するものではない。
代替の聴取位置及び環境のための再生は、スイートスポット(sweet-spot)の操作(例えば移動及び/又は拡大)により改善され得る。しかしながら、スイートスポット操作は既知であるが、従来の手法は最適なものには及ばない傾向があり、一般に個々の出力チャネルの非常に複雑な処理を必要とする後処理ステップとして適用されるものである。
それ故、スイートスポットを操作するための改善されたシステムが有利となり、とりわけ増大された柔軟性、改善された音質、改善された聴取体験、低減された複雑性、容易化された処理及び/又は改善された性能を実現するシステムが有利となる。
従って、本発明は、上述した欠点の1つ以上を単独で又はいずれかの組み合わせで好適には緩和、軽減又は除去することを目的とする。
本発明の第1の態様によれば、空間Mチャネルオーディオ信号のスイートスポットを変更するための装置であって、Nチャネルオーディオ信号を受信する受信器であってN<Mである受信器と、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段と、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、を有する装置が提供される。
本発明は、改善された聴取体験を提供し得る。本発明は、空間パラメータをデコード処理の一部として直接に変更することにより、複雑性が低減されたスイートスポット操作を実現し得る。容易化され計算要件が低減された処理が、達成され得る。本装置は、具体的にはデコーダであっても良い。本発明は、デコードとスイートスポット操作とを有利な態様で統合することにより、改善された性能を可能とし得る。
前記Nチャネル信号は具体的にはモノラル又はステレオ信号であっても良く、前記Mチャネル信号は具体的には5.1、6.1又は7.1サラウンド音声信号であっても良い。前記空間パラメータは具体的には、空間Mチャネルオーディオ信号の種々のチャネルの特性をNチャネル信号の信号に(又はその逆)関連付ける、時間及び周波数によって変化するパラメータであっても良い。例えば、前記空間パラメータは、個々の時間周波数ブロックについてのレベル及び/又は相関パラメータを含んでも良い。前記Nチャネルオーディオ信号の前記空間Mチャネルオーディオ信号へのアップミクスは、連続したアップミクスであっても良い。
本発明の任意の特徴によれば、前記変更手段は、前記空間Mチャネルオーディオ信号の少なくとも1つの前チャネルと少なくとも1つの後チャネルとの間の強度差を示す第1の空間パラメータを変更することにより、前後バランスを変更するように構成される。
該特徴は、改善された聴取体験及び/又は容易化されたスイートスポット操作を提供し得る。とりわけ、該特徴は、単純な且つ複雑度の低い処理によって、(前/後の)中央でない聴取位置に対して、改善された聴取体験を実現し得る。
本発明の任意の特徴によれば、前記第1の空間パラメータは、前記少なくとも1つの前チャネルと前記少なくとも1つの後チャネルとの間のチャネル間強度差である。
該特徴は特に、複雑度の低い及び/又は効率の良い実装を実現し得る。とりわけ、スイートスポットが、デコード動作において既に利用された空間パラメータの単純な変更を用いて変更されることができる。
本発明の任意の特徴によれば、前記変更手段は、前記チャネル間強度差の量子化インデクスを変更するように構成される。
該特徴は特に、複雑度の低い及び/又は効率の良い実装を実現し得、とりわけ、人間のオーディオ知覚を反映しつつ、容易化された且つよりユーザフレンドリな操作を可能とし得る。前記量子化インデクスは、デコードに先立って変更されても良い。
本発明の任意の特徴によれば、前記変更手段は更に、前記第1のパラメータを変更することにより引き起こされる前記空間Mチャネルオーディオ信号についての前横チャネルの中央チャネルに対するエネルギー比の変化が低減されるように、少なくとも1つの前チャネルをスケーリングするように構成される。
該特徴は改善された聴取体験を実現し得、多くの場合において、最小限の知覚的な歪しか伴わずに操作されるスイートスポットを実現し得る。前記変更手段は具体的には、パラメータ変更後の前横チャネルと中央チャネルとのエネルギー比を、該変更前のものと略等しく保っても良い。前記変更手段は具体的には、中央チャネルをスケーリングしても良いし、又は例えば中央チャネルに対して横チャネルを略等しくスケーリングしても良く及び/又は横チャネルを異なるようにスケーリングしても良い。
本発明の任意の特徴によれば、前記変更手段は、中央チャネルと少なくとも1つの横チャネルとの間の、前記Nチャネルオーディオ信号の少なくとも1つのチャネルの信号の相対分散を示す第1の空間パラメータを変更することにより、中央分散を変更するように構成される。
該特徴は、改善された聴取体験及び/又は容易化されたスイートスポット操作を提供し得る。とりわけ、該特徴は、増大された空間的な聴取体験を可能とし得る。
幾つかの実施例において、前記変更手段は、Nチャネルオーディオ信号の少なくとも1つのチャネルと、空間Mチャネルオーディオ信号の少なくとも1つの前チャネルとの間のスケーリング値を示す、第1の空間パラメータを変更することにより、中央分散を変更するように構成されても良い。
Nチャネルオーディオ信号のアップミクスは具体的には、Nチャネル信号についての信号値の(K,N)アップミクス行列乗算による、Nチャネルオーディオ信号のKチャネル信号(N<K<=M)へのアップミクスを含んでも良く、前記第1の空間パラメータは、該アップミクス行列の行列係数であっても良い。
本発明の任意の特徴によれば、前記第1の空間パラメータはチャネル予測係数である。
該特徴は特に、複雑度の低い及び/又は効率的な実装を実現し得る。とりわけ、スイートスポットが、典型的にデコード動作において既に利用された空間パラメータの単純な変更を用いて変更されることができる。
本発明の任意の特徴によれば、前記変更手段は、少なくとも1つの右横チャネルと少なくとも1つの左横チャネルとの間の、前記Nチャネルオーディオ信号の少なくとも1つのチャネルの信号の相対分散を示す第1の空間パラメータを変更することにより、左右バランスを変更するように構成される。
該特徴は、改善された聴取体験及び/又は容易化されたスイートスポット操作を提供し得る。とりわけ、該特徴は、単純な且つ複雑度の低い処理によって、(左/右の)中央でない聴取位置に対して、改善された聴取体験を実現し得る。
本発明の任意の特徴によれば、前記第1の空間パラメータはチャネル予測係数である。
該特徴は特に、複雑度の低い及び/又は効率的な実装を実現し得る。とりわけ、スイートスポットが、デコード動作において既に利用された空間パラメータの単純な変更を用いて変更されることができる。
本発明の任意の特徴によれば、前記変更手段は、前記空間Mチャネルオーディオ信号の少なくとも1つの前チャネルと少なくとも1つの後チャネルとの間の相対的な相関を示す第1の空間パラメータを変更することにより、前後分散を変更するように構成される。
該特徴は、改善された聴取体験及び/又は容易化されたスイートスポット操作を提供し得る。とりわけ、該特徴は、増大された空間的な聴取体験を実現し得る。
本発明の任意の特徴によれば、前記第1の空間パラメータは、前記少なくとも1つの前チャネルと前記少なくとも1つの後チャネルとの間のチャネル間相関係数である。
該特徴は特に、複雑度の低い実装を可能とし得る。とりわけ、スイートスポットが、デコード動作において既に利用された空間パラメータの単純な変更を用いて変更されることができる。
本発明の任意の特徴によれば、前記Nチャネルオーディオ信号は、前記空間Mチャネルオーディオ信号のダウンミクスに対応し、前記受信器は、前記ダウンミクスされたNチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付けるエンコーダ空間パラメータを受信するように構成され、前記パラメータ手段は、前記エンコーダ空間パラメータから前記空間パラメータを決定するように構成される。
該特徴は、改善された聴取体験及び/又は容易化されたスイートスポット操作を提供し得る。とりわけ、該特徴は、Nチャネルオーディオ信号を生成するパラメトリックエンコーダを有するシステムにおいて、改善された聴取体験を実現し得る。
該エンコーダは、空間Mチャネルオーディオ信号をNチャネルオーディオ信号へとダウンミクスする際に、空間パラメータデータを生成しても良い。該空間パラメータデータは該装置に送信されても良く、該データを変更することによりスイートスポットが変更されても良い。該空間パラメータは具体的には、エンコーダ空間パラメータを有しても良い。Nチャネルオーディオ信号は具体的には、パラメトリックデータを有するMPEGサラウンド信号であっても良い。
本発明の任意の特徴によれば、前記パラメータ手段は、前記Nチャネルオーディオ信号のチャネルの信号の特性から前記空間パラメータを決定するように構成される。
該特徴は、改善された聴取体験及び/又は容易化されたスイートスポット操作を提供し得る。とりわけ、該特徴は、空間Mチャネルオーディオ信号についてパラメータデータを送信しない、明示的なパラメトリックコーダを用いないシステムにおいて、改善された聴取体験を実現し得る。Nチャネルオーディオ信号は具体的には、行列下位互換のダウンミクス信号のような、非ガイドMPEGサラウンド信号であっても良い。Nチャネルオーディオ信号はまた、例えばステレオMP3デコード信号又はステレオFMのような、レガシーのステレオ信号であっても良い。
本発明の他の態様によれば、空間Mチャネルオーディオ信号を受信するための受信器であって、Nチャネルオーディオ信号を受信する受信器であってN<Mである受信器と、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段と、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、を有する受信器が提供される。
本発明の他の態様によれば、オーディオ信号を送信するための送信システムであって、Nチャネルオーディオ信号を送信するように構成された送信器と、受信器と、を有し、前記受信器は、前記Nチャネルオーディオ信号を受信するための受信器と、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段であってN<Mであるパラメータ手段と、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、を有する送信システムが提供される。
本発明の他の態様によれば、空間Mチャネルオーディオ信号を再生するためのオーディオ再生装置であって、Nチャネルオーディオ信号を受信する受信器であってN<Mである受信器と、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段と、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、を有するオーディオ再生装置が提供される。
本発明の他の態様によれば、空間Mチャネルオーディオ信号のスイートスポットを変更する方法であって、Nチャネルオーディオ信号を受信するステップであってN<Mであるステップと、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するステップと、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するステップと、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するステップと、を有する方法が提供される。
本発明の他の態様によれば、空間Mチャネルオーディオ信号を受信するための方法であって、Nチャネルオーディオ信号を受信するステップであってN<Mであるステップと、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するステップと、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するステップと、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するステップと、を有する方法が提供される。
本発明の他の態様によれば、オーディオ信号を送信及び受信する方法であって、送信器が、Nチャネルオーディオ信号を送信するステップと、受信器が、前記Nチャネルオーディオ信号を受信するステップと、前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するステップであってN<Mであるステップと、前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するステップと、少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するステップと、を有する方法が提供される。
本発明のこれらの及びその他の態様、特徴及び利点は、以下に記載される実施例を参照しながら説明され明らかとなるであろう。
本発明の幾つかの実施例による、オーディオ信号の通信のための送信システムの図を示す。 本発明の幾つかの実施例による、空間Mチャネルオーディオ信号のスイートスポットを変更することが可能なデコーダの図を示す。 MPEGサラウンド音声システムのためのスピーカ設定の図を示す。 MPEGサラウンドデコーダの構造の図を示す。 本発明の幾つかの実施例による、空間Mチャネルオーディオ信号のスイートスポットを変更する方法の図を示す。
本発明の実施例が、図面を参照しながら、例としてのみ、以下に説明される。
以下の説明は、MPEGサラウンド音声オーディオシステムに適用可能な本発明の実施例に焦点を当てたものである。しかしながら、本発明のこの用途に限定されるものではなく、他の多くの多チャネルオーディオシステム及び規格において適用され得ることは、理解されるであろう。
図1は、本発明の幾つかの実施例による、オーディオ信号の通信のための送信システム100を示す。送信システム100は、具体的にはインターネットであっても良いネットワーク105を通して受信器103に結合された、送信器101を有する。
本例においては、送信器101は信号記録装置であり、受信器103は信号再生装置であるが、他の実施例においては、送信器及び受信器が他の用途において他の目的のために利用されても良いことは、理解されるであろう。例えば、送信器101及び/又は受信器103は、トランスコード機能の一部であっても良く、例えば他の信号源又は宛先に対するインタフェースを提供しても良い。
信号記録機能がサポートされる本例においては、送信器101は、サンプリング及びアナログ−ディジタル変換によりディジタルPCM(Pulse Code Modulated)信号へと変換されたアナログ多チャネル信号を受信するディジタイザ107を有する。
ディジタイザ107は図1のエンコーダ109に結合され、該エンコーダ109は、エンコードアルゴリズムに従ってPCM信号をエンコードする。本例においては、エンコーダ109は、Mチャネル信号をNチャネル信号としてエンコードするMPEGサラウンドエンコーダであり、ここでM>Nである。MPEGサラウンドデコーダは従って、Nチャネル信号と、デコーダがMチャネル信号を生成することを可能とする空間パラメトリックデータとを生成する。エンコーダ109は例えば、5.1、6.1又は7.1サラウンド音声信号を、ステレオ信号及び空間パラメトリックデータとしてエンコードしても良い。以下の説明は、5.1ステレオ信号が、ステレオ信号及び空間パラメトリックデータとしてエンコードされる状況に焦点を当てる。
エンコーダ109はネットワーク送信器111に結合され、該ネットワーク送信器111は、エンコードされた信号を受信し、インターネット105にインタフェース接続する。該ネットワーク送信器は、該エンコードされた信号を、インターネット105を通して受信器103に送信しても良い。
受信器103はネットワーク受信器113を有し、該ネットワーク受信器113は、インターネット105にインタフェース接続して、送信器101からエンコードされた信号を受信するように構成される。
ネットワーク受信器113は、デコーダ115に結合される。デコーダ115は、該エンコードされた信号を受信し、デコードアルゴリズムに従って該信号をデコードする。本例においては、該デコーダは、元の信号のスイートスポットを変更するために、受信されたパラメトリックデータが変更された後に、該パラメトリックデータを用いて、Nチャネル信号からMチャネル信号をデコードする。空間多チャネル信号のスイートスポットとは、空間的知覚が、例えば標準化された多チャネルスピーカ設定のためにスタジオエンジニアにより意図されるような、意図された空間的知覚から著しく逸脱しない、領域/位置である。
具体的には、本例においては、デコーダ115はガイドモードで動作するMPEGサラウンドデコーダであり、ここではデコードがエンコーダ109により生成された空間パラメトリックデータに基づく。しかしながら、他の実施例においては、空間パラメトリックデータはデコーダ自身により生成されても良く、デコーダ115はとりわけ非ガイドモードで動作するMPEGサラウンドデコーダであっても良いことは、理解されるであろう。
信号再生機能がサポートされる本例においては、受信器103は更に、デコーダ115からデコードされたオーディオ信号を受信し、ユーザに対して該信号を提示する、信号再生器117を有する。具体的には、信号再生器117は、該デコードされたオーディオ信号を出力するために必要とされる、ディジタル−アナログ変換器、増幅器及びスピーカを有しても良い。
図2は、デコーダ115を更に詳細に示す。
デコーダ115は、ネットワーク受信器113からビットストリームを受信する受信器ユニット201を有する。該受信器は、エンコードされたステレオ信号及びパラメトリックデータの両方を有する。
受信器ユニット201はパラメータユニット203に結合され、該パラメータユニット203は、ステレオ信号からサラウンド信号を生成するために利用されるべき空間パラメータを決定する。該空間パラメータはかくして、Nチャネル信号のチャネル信号の特性に対する、Mチャネル信号のチャネル信号の特性を記述する、パラメータデータである。該空間パラメータは具体的には、Mチャネル信号を生成するためにNチャネル信号がどのように処理されるべきかを示しても良い。
主な例においては、該空間パラメータは単に、受信されたビットストリームからこれらのパラメータを抽出することにより生成される。即ち、エンコーダ109により生成された空間パラメータが利用される。しかしながら、他の実施例においては、該空間パラメータは例えばデコーダ自身によって、例えば受信された信号からこれらのパラメータを推定することによって、決定されても良いことは、理解されるであろう。具体的には、デコーダ115は非ガイドモードで動作するMPEGサラウンドデコーダであっても良く、従って、受信されたステレオ信号のチャネル強度差及び相関特性のような、Nチャネル信号の特定の特性から該空間パラメータを生成しても良い。
受信器ユニット201はデコードユニット205にも結合され、該デコードユニット205は、ステレオ信号をデコードし該ステレオ信号をアップミクスして5.1チャネルサラウンド信号を生成する。該アップミクスは、本例においてはMPEGサラウンド規格に従って実行され、決定された空間パラメータに基づく。しかしながら、空間パラメータが直接に利用されるのではなく、デコーダ115はパラメータユニット203及びデコードユニット205に結合された変更ユニット207を有し、該変更ユニット207が、生成されるサラウンド信号のスイートスポットを変更するために1つ以上の空間パラメータを変更する。
かくして、図2のデコーダ115は、デコード/アップミクス処理において利用される1つ以上の空間パラメータを直接に変更することによって、出力サラウンド音声信号のスイートスポットの、単純で、効率的な、高性能で且つ複雑度の低い操作を可能とする。かくして、スイートスポット操作とデコード/アップミクスとを統合することにより、かなり容易化され且つ改善された性能が達成され得る。
本手法は、スイートスポットの形状及び位置を効率的に変更するために利用され得る。このことは、聴取者の位置が元のスイートスポット位置とは異なる家庭用の及び自動車用の用途に対して、特に有用である。また、異なる位置にいる複数のユーザに対して、同様の音像知覚を生成するためにも有用となり得る。かくして、本手法は、以下を含む音響ステージ制御のために最も望ましい特徴の、容易な操作を実現する。
−前後バランス制御が、前から後へと空間像を徐々に強調するために適用されることができる。
−中央分散制御が、中央チャネルのより小さい(大きい)方向的な知覚を生成するために適用されることができる。
−左右バランス制御が、左から右への強調の徐々の変化を提供するために適用されることができる。
−相関又は前後分散制御が、音声の知覚される広がりに寄与する前後相関の制御を可能とするために適用されることができる。
本手法は、スイートスポットを操作するための非常に複雑度の低い方法に帰着し、有利にも本手法は、MPEGサラウンドの全ての動作モードにおいて適用されることができる。更に、以下に説明されるように、FM及びAMラジオ放送におけるように、限られた品質のダウンミクス信号をデコードするときに、空間像を強調することも可能である。
以下、5.1MPEGサランドシステムを参照しながら、種々のスイートスポット操作のより詳細な例が説明される。
図3は、MPEGサラウンドアルゴリズムの6チャネル出力構成が基とする、スピーカ設定を示す。
図4は、受信されたステレオ信号及び空間パラメータから5.1サランド音声信号を生成するための、MPEGサラウンドアップミクス構造を示す。MPEGサラウンドにおいては、アップミクスは、第1のアップミクス段において、
Figure 0005513887
により与えられるプリゲイン3×2行列を用いて、最初に2つのチャネル予測係数(CPC)が利用されて左、中央及び右信号(L、C及びR)を生成する、連続した処理で実行される。
次いで、3つの中間チャネルのそれぞれが、2つの更なるチャネルへと変換される。具体的には、チャネル間強度差(IID)空間パラメータを用いて、中間中央チャネルが、中央チャネルと低周波拡張(LFE)チャネルとに分離される。更に、2つのIID及び2つのチャネル間相関係数(ICC)が利用されて、5×5混合行列により、中間左及び右信号のそれぞれを、前及びサラウンドチャネル(L、R及びL、R)へと分割する(ここで、ICCにより示される相関のレベルを導入するため、非相関された信号が利用される)。
幾つかの実施例においては、変更ユニット207は、空間Mチャネルオーディオ信号の少なくとも1つの前チャネルと少なくとも1つの後チャネルとの間の相対強度差を示す空間パラメータを変更することにより、前後バランスを変更しても良い。具体的には、該変更ユニットは、1つ以上のIIDパラメータを変更しても良い。
以下は、前と後との間で前後に空間像(スイートスポット)の強調を徐々に移動させるために、単純な調節パラメータがどのように設定され得るかを説明する。かくして、最適なサラウンド効果が聴取者の位置に対して知覚される位置/領域を移動させるために、単純な調節パラメータが利用されることができる。このことは、典型的な家庭用及び自動車用の用途におけるように、聴取者がラウドスピーカの中心位置の前又は後に位置している状況において、特に有用である。
図2の実施例においては、前後バランス制御は、IIDパラメータを変更して所望の効果を達成することにより制御される。IIDパラメータは一般に、対数のdBスケールで表現され、前チャネルとサラウンドチャネルとの間の相対的なエネルギー配分を示す。
以下の具体例においては、簡潔さ及び明確さのため、ICC及びIIDパラメータが左側と右側とで等しいものとみなされる。このことは一般に、MPEGサラウンドの非ガイドモードについて当てはまる。MPEGサラウンドのガイドモードについては、ICC及びIDDパラメータは一般に、左側と右側とで異なり、説明される手法は斯かる状況に対しても容易に拡張され得ることは理解されるであろう。特に、説明される手法は、同一の調節パラメータSFBを用いて、両方の側に対して独立に適用されても良い。
説明される手法において、信号の前後配分を変更するためにIIDパラメータが利用される。特に、IIDを増大させることは前横チャネルにより多くのエネルギーを配し、IDDを減少させることはサラウンドチャネルにより多くのエネルギーを割り当てる。
IIDはdBで表現され、オフセット値を加算することにより更新されることができる:
Figure 0005513887
該オフセット値ΔFBは、例えばユーザ又はオペレータにより手動で設定されたものであっても良い、単純な調節パラメータSFBから決定され得る。例えば、デコーダ115を有する再生装置103は、種々の音声環境エミュレーション設定間で選択を実行するための入力部を有しても良い。ここで各設定は、幾つかの所定のスイートスポット調節パラメータを関連付けられていても良い。
人間の聴覚システムは、基準値(正及び負)を増大させるIIDの変化に対して、減少する感度を持つ。例えば、以下の表は、IDDの変化に対する丁度可知差異(Just Noticeable Difference、JND)を示す:
Figure 0005513887
IIDの範囲全体について同等の強調効果を実現するため、当該非線形効果は、IIDの更新に組み込まれても良い:
Figure 0005513887
聴覚システムの非線形の振舞は、インデクス値をIIDパラメータにマッピングするためにMPEGサラウンドにおいて利用されるIID量子化ベクトルにおいても反映されるため、IID変更はインデクスドメインにおける線形の更新により実装されることができる。IIID,orgをIIDorgに対応するインデクスとすると、
Figure 0005513887
により与えられるインデクスに対応する新たなIIDを算出することにより、IIDが更新されることができる。
かくして、サラウンド音声信号のスイートスポットの前後バランスを変更するために、前後バランスシフトに対して線形な関係を持つ単純な調節パラメータSFBが設定されることができる。
IIDインデクスを直接利用することが現実的ではない場合(例えば変更ユニットにとって該インデクスが利用可能でないために)、二次多項式をIIDについてのMPEGサラウンド量子化ベクトル(の負でない部分)にフィッティングさせることにより、インデクスドメインに切り換え、戻すことも可能である:
Figure 0005513887
ここで、
=0.1444、
=1.1056、
=0.8272
である。
かくして、IIDは、
Figure 0005513887
により、インデクスドメインへとマッピングされて戻されることができる。
次いで、新たなインデクスが、SFBパラメータを加算することにより決定されることができ、かくしてIIDパラメータが
Figure 0005513887
として決定されることができる。
代替として、変更されたIIDを決定するために、量子化ベクトルに基づく補間が利用されても良い。
IID値を減少させることは、コヒーレンス及び全体のエネルギーを維持しつつ、前チャネルからサラウンドチャネルへとエネルギーをシフトさせることに帰着する。しかしながら、該変更は、中央(及びLFE)チャネルのエネルギーを変化させず、それ故空間像を或る程度変形させ得る。IIDを増大させることは、同様に空間像を変形させ得る。
この影響を低減させるため、前横チャネルと中央チャネルとの間のエネルギー比が、好適には保存される。中央チャネルのエネルギーを横チャネルへと混合させること、又はその逆は、コンテンツ(例えば音声)の横チャネルへの意図しない漏れを引き起こし、それ故空間像を変化させ得る。以下は、中央チャネルをスケーリングすることによって、前横対中央のエネルギー比を略保存し、中央のコンテンツが横チャネルへ漏れることを防ぐ方法を説明する。
本手法においては、前横チャネルと中央チャネルとの間のエネルギー比が保存されるという制約:
Figure 0005513887
の下で、前チャネルがスケーリングされる。
中央信号をスケーリングすることは全体のエネルギーに対して影響を与え、それ故、同時に左及び右の横チャネルが、エネルギー損失を補償するためにスケーリングされるべきである。かくして、全体のエネルギーが同様に好適に保存される:
Figure 0005513887
ここで、スケーリングは、
Figure 0005513887
により表される。
本例においては、左チャネルと右チャネルとは、同一の係数によりスケーリングされる。なぜなら、空間パラメータが2つの横信号について等しいと仮定されているからである(MPEGサラウンドの非ガイドモードに対応する)。かくして、これらチャネルは共に、同一の空間パラメータにより更に処理される。スケーリング係数μ及びλは、スケーリング式を、エネルギー保存要件に挿入することにより算出されることができる。このことは、
Figure 0005513887
を導出し、
Figure 0005513887
及び
Figure 0005513887
に帰着する。書き直すと、
Figure 0005513887
となり、従って
Figure 0005513887
となる。ここで、
Figure 0005513887
である。
かくして、μ及びλについての表現が、
Figure 0005513887
により与えられる。
全体の空間像を維持するためのエネルギー配分補償は、比較的複雑度の低い処理により実行されることができる。具体的には、MPEGサラウンドアップミクスアルゴリズムは、特定の更新レートTでパラメータを更新する。従って、T個のサンプルの各々について、新たなアップミクス行列が算出され、これら行列がサンプル間に補間される。アップミクスされた信号のスケーリングはプリゲイン行列と統合されることができ、従ってスケーリング値はT個のサンプル毎に一度決定される必要があるのみである。
パラメータの範囲:
Figure 0005513887
を用いて、知覚的に有意な意味において、調節パラメータ値と前後バランスにおいて知覚されるシフトとの間の略線形な関係を用いて、画像が後に完全に(−30)、及び前に完全に(+30)シフトされることができる。
更に、中間信号L、R及びCのエネルギーの比であるEratioの値から、スケーリング値が決定される。安定性の理由から、これらエネルギーは平滑化(ローパスフィルタリング)されても良い。しかしながら、MPEGサラウンドの非ガイドモードについては、ダウンミクス信号Ldmx及びRdmxの斯かるローパスフィルタリングされたエネルギーは、ダウンミクス信号のためのIDD及びICCパラメータを決定するために利用されているため、既に利用可能である。これらは、以下のように定義されるプリゲイン行列と組み合わせて利用されることができる:
Figure 0005513887
かくして、Eratioは、
Figure 0005513887
として記述されることができる。これにより、前後バランス制御のためのサンプル毎の計算の必要性を除去する。
例えば種々の式についてのルックアップテーブルを用いることにより、又は複雑度の低い近似関数を用いることにより、更なる複雑度の低減が得られる。
実施例においては、デコーダ115は更に、中央分散を調節して、それによりスイートスポットを増大させても良い。具体的には、より指向性の小さな中央を得るために中央チャネルの像を横チャネルへと分散させるために、中央分散調節パラメータが利用される。かくして、本手法は、空間パラメータを調節することにより、中央の知覚される広さの増大を可能とし、かくして空間パラメータはスイートスポットのサイズを操作するために利用される。
MPEGサラウンドにおいては、第1のアップミクス段が、プリゲイン行列を用いて、3つの中間信号L、C及びRを生成する(例えば図4を参照):
Figure 0005513887
中央の幅を増大させるため、中央信号Cの一部が、横チャネルL及びRに混合されても良い。具体的には、中央信号が左及び右信号と混合されるように、該第1のアップミクス段の空間パラメータCPC及びCPCが操作されても良い。プリゲイン行列から分かるように、CPCパラメータは、ステレオ信号のそれぞれのエネルギーの、中間チャネルのそれぞれへの相対的な分配を示す。従って、CPCパラメータを調節することは、中央チャネルから横チャネルへの(又は横チャネルから中央チャネルへの)エネルギーの徐々のシフトを可能とする。中央分散を変化させる場合、典型的には変更が対称的に実行され、かくしてCPC値が等しく変化させられる。
プリゲイン行列により明らかであるように、CPCパラメータが共に1に等しい場合には、下行は0のみを含み、それ故中央信号が生成されない。また、この設定については、左及び右信号についての利得係数(行列係数)が増大させられ、かくして中央信号全体が左及び右チャネルに完全に分散される。逆に、CPCを減少させる場合には、中央エネルギーは増大し、左及び右信号のエネルギーが減少する。
かくして、CPCパラメータ値を1に向けて増大させることにより、中央分散が増大させられることができる。このようにして、中央信号が横チャネルへと(部分的に)混合され、当該中央チャネル信号についてのより広い空間像に帰着する。
具体的には、新たなCPC値は、調節パラメータSCDから、
Figure 0005513887
に従って決定されることができる。
負の値のSCDについては、CPC値は−1に向かって変化し、それによりサラウンド信号の知覚的な幅を狭める。調節パラメータSCDの範囲は、好適には[−1,1]に設定されても良い。
実施例においては、デコーダ115は更に、空間音像を左に又は右にシフトさせることができ、それによりスイートスポットがそれに従って移動させられることを可能とする。このことは、聴取者が元のスイートスポットの左又は右に位置している場合に、特に有用となり得る。
信号エネルギーの左−右配分は、信号L、C及びRが予測パラメータCPC及びCPCを用いて生成される第1のアップミクス段において得られる。バランス制御は、これら予測パラメータを利用して、スイートスポット位置の複雑度の低い操作を実現する。
具体的には、CPCパラメータは左ダウンミクスチャネルの寄与を制御し、CPCパラメータが右ダウンミクスチャネルの寄与を制御するため、これらパラメータを互いに対して減少させることにより、バランスが左又は右へとシフトされることができる。かくして、CPCを減少させることは右へとバランスをシフトさせ、CPCを減少させることは左へとバランスをシフトさせる。
具体的には、バランス制御のためのCPCパラメータの調節は、中央分散制御パラメータによる中央幅減少のために利用された方法と同様の方法で実行されることができる。これらパラメータは、バランス制御調節パラメータSLRの符号に応じて、−1のCPC値に向けてシフトされるか、又は変更されないままとされる:
Figure 0005513887
パラメータの範囲:
Figure 0005513887
は、中央エネルギーに関連する知覚的な効果に悪影響を与えることなく、適度な量のバランス制御を提供する。
プリゲイン行列を評価することは、単にCPCパラメータを変更することによっては、中央信号のエネルギーを増大させることなく絶対的なバランススケールを生成することが不可能であることを示す。しかしながら、殆どの典型的なスイートスポット位置は中央聴取位置から比較的僅かに離れているだけであるため、低減されたバランス制御で一般に十分である。
実施例においては、デコーダ115は更に、前後配分を変更し、それにより音声の知覚される広さの制御を可能とし、かくしてスイートスポットを増大させる。
具体的には、左及び右側の前及びサラウンドチャネルを生成するためのアップミクスの第2の段において利用されるICCパラメータが、増大又は減少するように変更され、それにより前後分配に影響を与える。
具体的には、ICCパラメータの調節は、調節されるICCパラメータが0乃至1の範囲に限定される点を除いて、中央分散を制御するためのCPCパラメータの調節と同様である。かくして、前後分散調節パラメータSCRを用いて、新たな相関パラメータが、
Figure 0005513887
として決定されても良い。ここで、
Figure 0005513887
である。
以下の表は、種々のスイートスポット操作を実現するために変更される、具体的な空間パラメータの概要を示す。
Figure 0005513887
本実施例においては、調節パラメータの全てが同時に利用される。しかしながら、変更が適用される順序は、達成される品質に影響を与え得る。
具体的には、中央分散及び左右バランス制御は、同一の空間パラメータを用いるため、互いに対して影響を与える。バランス制御は中央チャネルに幾分かのエネルギーを維持し、中央分散は中央エネルギー(の一部)を左右両方に混合する。それ故、多くのエネルギーが横チャネルに行くこととなり、そのことは、バランス制御の後に中央分散が実行される場合に、バランス制御により軽減されるべきである。それ故、中央分散の調節が最初に実行されて、バランス制御が適切に動作することを可能としても良い。
前後バランス制御は、スケーリング係数の算出においてCPCパラメータを利用する。典型的には、アップミクス処理において利用されることとなる実際のパラメータが、該算出において利用されるべきである。それ故、前後バランス制御のための計算は、中央分散及び左右バランス制御のための計算の後に実行されても良い。
前後分散調節のための計算は、他の提示された調節パラメータのいずれによっても影響されない。また、相関調節も他の調節パラメータに影響しない。それ故、該パラメータの変更は、他の計算内で任意の順序で為されても良い。
説明された原理は、ガイドモードで動作する及び非ガイドモードで動作するMEGPサラウンドデコーダの両方において適用され得ることは、理解されるであろう。非ガイドモードで動作する場合には、空間パラメータは受信されたステレオ信号の特性に基づいてデコーダ自身により決定され、ガイドモードにおいては、空間パラメータはエンコーダから生成され受信される。
説明された手法が非ガイドモード動作に関連して改善された聴取体験を提供し得る具体例は、非常に明確な左及び右チャネルを持たないステレオ信号(例えば従来のステレオ信号)が受信される場合である。このタイプの信号についてサラウンド体験を最適化するため、特定の聴取設定又はモードが、本アルゴリズムにより提供されても良い。
従来、ラジオ局の不十分な受信は、受信器の2チャネル出力に対して、2種類の影響(両者の組み合わせも一般的である)に帰着し得る:
−ノイズの多い音声
−ステレオ音声が再生されないこと又はステレオとモノラルとの間の切り替わり
実験は、定常ノイズを持つステレオ信号が空間像に大きく影響を与えないことを示している。該ノイズは、ステレオ出力の場合と同様に全ての出力に行き着く。
しかしながら、より動的なノイズは、受信器出力の空間特性に対して、より明らかに影響を与える。殆どの場合、この種のノイズは、ラジオ受信器においてステレオ再生とモノラル再生との間の高速な切り替わりに帰着する。標準的なMPEGサラウンドの非ガイドアルゴリズムを用いる場合、斯かる信号は、入力がモノラルに切り替わったときに音声全体が中央スピーカへと折り畳まれる、空間的な不安定性に帰着する。
このことはまた、モノラルベースのFM局及び全てのAM局にとって不利である。なぜなら、モノラル信号(Ldmx=Rdmx)はチャネル間強度差及び完全相関を持たず、それ故空間パラメータが一定となるからである。CPCパラメータについての結果の値は、信号エネルギーの大半を中央チャネルにもたらしてしまい、不適切なサラウンド音声体験が提供されてしまう。
更に、FMステレオ信号が送信される方法によって(モノラル(和)信号及び差分信号)、不十分な受信に対して差分信号が最初に歪むものであるため、ダウンミクスの空間特性が低下させられる。従って、MPEGサラウンドの非ガイドアルゴリズムによる空間的な再構築は、通常のステレオ信号よりも、中央に向けられる傾向がある。
従って、非ガイドMPEGサラウンドシステムに対する音源としてラジオ信号を持つことの主な欠点は、該アルゴリズムを操作する空間特性が失われ、信号を前中央スピーカに集中させてしまい得る高い確率である。
しかしながら、説明されたデコーダは、提供されるサラウンド音声体験を改善し得る、複雑度の低いスイートスポット操作を提供する。具体的には、モノラル信号に対して十分な空間像を実現する複雑度の低い方法は、中央分散調節パラメータを利用し得る。該パラメータを例えば0.5に設定することは、中央信号に含められるはずだったエネルギーの部分を、横チャネルL及びRへと分散させる。モノラル信号については、0dBのIIDが、前後のスピーカ間で等しい配分をもたらす。
結果として、モノラル入力についても、本アルゴリズムは、全ての出力チャネルにわたって信号を効率的に分配することができる。ステレオ信号については、拡大が改善された空間像を生成する。
図5は、空間Mチャネルオーディオ信号のスイートスポットを変更する方法を示す。本方法は、Nチャネルオーディオ信号が受信される(N<M)ステップ501において開始する。
ステップ501はステップ503に後続され、ステップ503において、該Nチャネルオーディオ信号を空間Mチャネルオーディオ信号に関連付ける空間パラメータが決定される。
ステップ503はステップ505に後続され、ステップ505において、該空間パラメータの少なくとも1つを変更することにより、該空間Mチャネルオーディオ信号のスイートスポットが変更される。
ステップ505はステップ507に後続され、ステップ507において、該変更された少なくとも1つの空間パラメータを用いて該Nチャネルオーディオ信号をアップミクスすることにより、該空間Mチャネルオーディオ信号が生成される。
以上の記載は、明確さのため、種々の機能ユニット及びプロセッサと関連して本発明の実施例を説明したものであることは理解されるであろう。しかしながら、種々の機能ユニット又はプロセッサ間の機能のいずれの適切な分散もが、本発明から逸脱することなく利用され得ることは、明らかであろう。例えば、別個のプロセッサ又はコントローラにより実行されるように説明された機能は、同一のプロセッサ又はコントローラにより実行されても良い。それ故、特定の機能ユニットへの参照は、厳密な論理的又は物理的な構造を示すものではなく、単に説明された機能を提供するための適切な手段への参照として考えられるべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらのいずれかの組み合わせを含む、いずれの適切な形態で実装されても良い。本発明は任意に、少なくとも部分的に、1以上のデータプロセッサ及び/又はディジタル信号プロセッサ上で動作するコンピュータソフトウェアとして実装されても良い。本発明の実施例の要素は、物理的、機能的及び論理的に、いずれの適切な態様で実装されても良い。機能は単一のユニットで実装されても良いし、複数のユニットで実装されても良いし、又は他の機能ユニットの一部として実装されても良い。本発明は単一のユニットで実装されても良いし、種々のユニット及びプロセッサ間で物理的及び機能的に分散されても良い。
本発明は幾つかの実施例と関連して説明されたが、本発明はここで開示された特定の形態に限定されることを意図したものではない。本発明の範囲は、添付する請求項によってのみ限定される。加えて、特徴が特定の実施例に関連して説明されたが、説明された実施例の種々の特徴は、本発明に従って組み合わせられても良いことは、当業者は理解するであろう。請求項において、「有する(comprising)」なる語は、他の要素又はステップの存在を除外するものではない。
更に、複数の手段、要素又は方法ステップは、別個に列記されていても、例えば単一のユニット又はプロセッサにより実装されても良い。加えて、個々の特徴が異なる請求項に含められ得るが、これら特徴は有利に組み合わせられても良く、異なる請求項に含められていることは、これら特徴の組み合わせが利用可能ではない及び/又は有利ではないことを意味するものではない。或るカテゴリの請求項に特徴を含むことは、該カテゴリに対する限定を意味するものではなく、該特徴が他の請求項のカテゴリに適宜等しく適用可能であることを示す。更に、請求項における特徴の順序は、これら特徴が動作しなくてはならない順序を示すものではなく、またとりわけ、方法の請求項における個々のステップの順序は、これらステップが該順序で実行される必要があることを示すものではない。これらステップは、いずれの適切な順序で実行されても良い。加えて、単数形の参照は複数を除外するものではない。従って、「1つの(a、an)」、「第1の(first)」及び「第2の(second)」等への参照は、複数を除外するものではない。請求項における参照記号は単に例を明確にするためのものであり、いずれの態様においても請求項の範囲を限定するものとして解釈されるべきではない。

Claims (21)

  1. 空間Mチャネルオーディオ信号のスイートスポットを変更するための装置であって、
    Nチャネルオーディオ信号を受信する受信器であってN<Mである受信器と、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段と、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、
    を有する装置。
  2. 前記変更手段は、前記空間Mチャネルオーディオ信号の少なくとも1つの前チャネルと少なくとも1つの後チャネルとの間の強度差を示す第1の空間パラメータを変更することにより、前後バランスを変更するように構成された、請求項1に記載の装置。
  3. 前記第1の空間パラメータは、前記少なくとも1つの前チャネルと前記少なくとも1つの後チャネルとの間のチャネル間強度差である、請求項2に記載の装置。
  4. 前記変更手段は、前記チャネル間強度差の量子化インデクスを変更するように構成された、請求項3に記載の装置。
  5. 前記変更手段は更に、前記第1のパラメータを変更することにより引き起こされる前記空間Mチャネルオーディオ信号についての前横チャネルの中央チャネルに対するエネルギー比の変化が低減されるように、少なくとも1つの前チャネルをスケーリングするように構成された、請求項2に記載の装置。
  6. 前記変更手段は、中央チャネルと少なくとも1つの横チャネルとの間の、前記Nチャネルオーディオ信号の少なくとも1つのチャネルの信号の相対分散を示す第1の空間パラメータを変更することにより、中央分散を変更するように構成された、請求項1に記載の装置。
  7. 前記第1の空間パラメータはチャネル予測係数である、請求項6に記載の装置。
  8. 前記変更手段は、少なくとも1つの右横チャネルと少なくとも1つの左横チャネルとの間の、前記Nチャネルオーディオ信号の少なくとも1つのチャネルの信号の相対分散を示す第1の空間パラメータを変更することにより、左右バランスを変更するように構成された、請求項1に記載の装置。
  9. 前記第1の空間パラメータはチャネル予測係数である、請求項8に記載の装置。
  10. 前記変更手段は、前記空間Mチャネルオーディオ信号の少なくとも1つの前チャネルと少なくとも1つの後チャネルとの間の相対的な相関を示す第1の空間パラメータを変更することにより、前後分散を変更するように構成された、請求項1に記載の装置。
  11. 前記第1の空間パラメータは、前記少なくとも1つの前チャネルと前記少なくとも1つの後チャネルとの間のチャネル間相関係数である、請求項10に記載の装置。
  12. 前記Nチャネルオーディオ信号は、前記空間Mチャネルオーディオ信号のダウンミクスに対応し、前記受信器は、前記ダウンミクスされたNチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付けるエンコーダ空間パラメータを受信するように構成され、前記パラメータ手段は、前記エンコーダ空間パラメータから前記空間パラメータを決定するように構成された、請求項1に記載の装置。
  13. 前記パラメータ手段は、前記Nチャネルオーディオ信号のチャネルの信号の特性から前記空間パラメータを決定するように構成された、請求項1に記載の装置。
  14. 前記Nチャネルオーディオ信号はMPEGサラウンド信号である、請求項1に記載の装置。
  15. 空間Mチャネルオーディオ信号を受信するための受信器であって、
    Nチャネルオーディオ信号を受信する受信器であってN<Mである受信器と、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段と、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、
    を有する受信器。
  16. オーディオ信号を送信するための送信システムであって、
    Nチャネルオーディオ信号を送信するように構成された送信器と、
    受信器と、
    を有し、前記受信器は、
    前記Nチャネルオーディオ信号を受信するための受信器と、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段であってN<Mであるパラメータ手段と、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、
    を有する送信システム。
  17. 空間Mチャネルオーディオ信号を再生するためのオーディオ再生装置であって、
    Nチャネルオーディオ信号を受信する受信器であってN<Mである受信器と、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するためのパラメータ手段と、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するための変更手段と、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するための生成手段と、
    を有するオーディオ再生装置。
  18. 空間Mチャネルオーディオ信号のスイートスポットを変更する方法であって、
    Nチャネルオーディオ信号を受信するステップであってN<Mであるステップと、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するステップと、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するステップと、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するステップと、
    を有する方法。
  19. 空間Mチャネルオーディオ信号を受信するための方法であって、
    Nチャネルオーディオ信号を受信するステップであってN<Mであるステップと、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するステップと、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するステップと、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するステップと、
    を有する方法。
  20. オーディオ信号を送信及び受信する方法であって、
    送信器が、Nチャネルオーディオ信号を送信するステップと、
    受信器が、
    前記Nチャネルオーディオ信号を受信するステップと、
    前記Nチャネルオーディオ信号を前記空間Mチャネルオーディオ信号に関連付ける空間パラメータを決定するステップであってN<Mであるステップと、
    予め決定された設定に基づいて前記空間パラメータの少なくとも1つを変更することにより、前記空間Mチャネルオーディオ信号のスイートスポットを変更するステップと、
    少なくとも1つの前記変更された空間パラメータを用いて前記Nチャネルオーディオ信号をアップミクスすることにより、前記空間Mチャネルオーディオ信号を生成するステップと、
    を有する方法。
  21. 請求項18乃至20のいずれか一項に記載の方法を実行するためのコンピュータプログラム。
JP2009527939A 2006-09-14 2007-09-10 多チャネル信号のためのスイートスポット操作 Active JP5513887B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06120662.9 2006-09-14
EP06120662 2006-09-14
PCT/IB2007/053631 WO2008032255A2 (en) 2006-09-14 2007-09-10 Sweet spot manipulation for a multi-channel signal

Publications (2)

Publication Number Publication Date
JP2010504017A JP2010504017A (ja) 2010-02-04
JP5513887B2 true JP5513887B2 (ja) 2014-06-04

Family

ID=39184190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009527939A Active JP5513887B2 (ja) 2006-09-14 2007-09-10 多チャネル信号のためのスイートスポット操作

Country Status (6)

Country Link
US (1) US8588440B2 (ja)
EP (1) EP2070392A2 (ja)
JP (1) JP5513887B2 (ja)
CN (1) CN101518103B (ja)
RU (1) RU2454825C2 (ja)
WO (1) WO2008032255A2 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100889478B1 (ko) * 2007-11-23 2009-03-19 정원섭 다중 음상을 갖는 음향 장치
GB2457508B (en) 2008-02-18 2010-06-09 Ltd Sony Computer Entertainmen System and method of audio adaptaton
KR101334964B1 (ko) * 2008-12-12 2013-11-29 삼성전자주식회사 사운드 처리 장치 및 방법
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2012025431A2 (en) * 2010-08-24 2012-03-01 Dolby International Ab Concealment of intermittent mono reception of fm stereo radio receivers
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
US9522330B2 (en) 2010-10-13 2016-12-20 Microsoft Technology Licensing, Llc Three-dimensional audio sweet spot feedback
SG185850A1 (en) * 2011-05-25 2012-12-28 Creative Tech Ltd A processing method and processing apparatus for stereo audio output enhancement
KR20130014895A (ko) * 2011-08-01 2013-02-12 한국전자통신연구원 음원 분리 기준 결정 장치와 방법 및 음원 분리 장치와 방법
US9299355B2 (en) 2011-08-04 2016-03-29 Dolby International Ab FM stereo radio receiver by using parametric stereo
KR20150064027A (ko) * 2012-08-16 2015-06-10 터틀 비치 코포레이션 다차원 파라메트릭 오디오 시스템 및 방법
GB2507106A (en) * 2012-10-19 2014-04-23 Sony Europe Ltd Directional sound apparatus for providing personalised audio data to different users
EP2733965A1 (en) 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
TWI618051B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9565503B2 (en) 2013-07-12 2017-02-07 Digimarc Corporation Audio and location arrangements
CN110890101B (zh) * 2013-08-28 2024-01-12 杜比实验室特许公司 用于基于语音增强元数据进行解码的方法和设备
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
WO2016012037A1 (en) 2014-07-22 2016-01-28 Huawei Technologies Co., Ltd. An apparatus and a method for manipulating an input audio signal
DE102015104699A1 (de) * 2015-03-27 2016-09-29 Hamburg Innovation Gmbh Verfahren zur Analyse und Dekomposition von Stereoaudiosignalen
EP3680898B1 (en) * 2015-06-24 2024-03-27 Sony Group Corporation Audio processing apparatus and method, and program
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
CN116017263A (zh) 2017-12-18 2023-04-25 杜比国际公司 用于处理虚拟现实环境中的听音位置之间的全局过渡的方法和系统
US11523238B2 (en) 2018-04-04 2022-12-06 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US11212631B2 (en) 2019-09-16 2021-12-28 Gaudio Lab, Inc. Method for generating binaural signals from stereo signals using upmixing binauralization, and apparatus therefor
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
CN113030847B (zh) * 2021-04-13 2023-04-25 中国民用航空飞行学院 一种用于双通道测向系统的深度学习数据集生成方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
DE19900961A1 (de) * 1999-01-13 2000-07-20 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Wiedergabe von Mehrkanaltonsignalen
JP2001268700A (ja) * 2000-03-17 2001-09-28 Fujitsu Ten Ltd 音響装置
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
JP2006050241A (ja) * 2004-08-04 2006-02-16 Matsushita Electric Ind Co Ltd 復号化装置
JP2008514098A (ja) * 2004-09-22 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ制御
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1825713B1 (en) * 2004-11-22 2012-10-17 Bang & Olufsen A/S A method and apparatus for multichannel upmixing and downmixing
JP5144272B2 (ja) * 2004-11-23 2013-02-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声データ処理装置及び方法、コンピュータプログラム要素並びにコンピュータ可読媒体
JP4082421B2 (ja) * 2005-06-13 2008-04-30 ヤマハ株式会社 パラメータ設定装置
WO2007055464A1 (en) * 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
CN101263739B (zh) * 2005-09-13 2012-06-20 Srs实验室有限公司 用于音频处理的系统和方法

Also Published As

Publication number Publication date
WO2008032255A3 (en) 2008-10-30
RU2009113814A (ru) 2010-10-20
EP2070392A2 (en) 2009-06-17
US20090252338A1 (en) 2009-10-08
JP2010504017A (ja) 2010-02-04
US8588440B2 (en) 2013-11-19
CN101518103A (zh) 2009-08-26
RU2454825C2 (ru) 2012-06-27
WO2008032255A2 (en) 2008-03-20
CN101518103B (zh) 2016-03-23

Similar Documents

Publication Publication Date Title
JP5513887B2 (ja) 多チャネル信号のためのスイートスポット操作
KR101396140B1 (ko) 오디오 객체들의 인코딩과 디코딩
Faller Coding of spatial audio compatible with different playback formats
US9865270B2 (en) Audio encoding and decoding
JP5455647B2 (ja) オーディオデコーダ
JP5191886B2 (ja) サイド情報を有するチャンネルの再構成
EP2297978B1 (en) Apparatus and method for generating audio output signals using object based metadata
EP2805326B1 (en) Spatial audio rendering and encoding
JP4700467B2 (ja) 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
JP5106383B2 (ja) オーディオ符号化および復号化
US20060274900A1 (en) 5-2-5 matrix encoder and decoder system
US20100246832A1 (en) Method and apparatus for generating a binaural audio signal
KR102258784B1 (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JP2012234192A (ja) オーディオソースのパラメトリックジョイント符号化
MX2012005781A (es) Aparato para proporcionar una representacion de señal de mezcla ascendente con base en la representacion de señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio multicanal, metodos, programas informaticos y flujo de bits que representan una señal de audio multicanal usando un parametro de combinacion lineal.
JP2009536360A (ja) オーディオ復号
KR20220084113A (ko) 오디오 인코딩을 위한 장치 및 방법
US20100241434A1 (en) Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100902

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121102

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131004

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140328

R150 Certificate of patent or registration of utility model

Ref document number: 5513887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250