JP2023548570A - オーディオシステムの高さチャネルアップミキシング - Google Patents

オーディオシステムの高さチャネルアップミキシング Download PDF

Info

Publication number
JP2023548570A
JP2023548570A JP2023527086A JP2023527086A JP2023548570A JP 2023548570 A JP2023548570 A JP 2023548570A JP 2023527086 A JP2023527086 A JP 2023527086A JP 2023527086 A JP2023527086 A JP 2023527086A JP 2023548570 A JP2023548570 A JP 2023548570A
Authority
JP
Japan
Prior art keywords
audio
channel
computer program
height
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023527086A
Other languages
English (en)
Inventor
ジェームズ・トレイシー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bose Corp
Original Assignee
Bose Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bose Corp filed Critical Bose Corp
Publication of JP2023548570A publication Critical patent/JP2023548570A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Abstract

高さ関連符号化を含まないオーディオソースから2つ以上の高さチャネルを発生するように構成されている、オーディオシステムの高さチャネルアップミキシング。アップミキシングは、入力オーディオ信号間の相関及び正規化チャネルエネルギーを判定することを含む。少なくとも2つの高さチャネル(例えば、左及び右高さオーディオ信号)が、相関及び正規化エネルギーから発生する。

Description

(関連出願の相互参照)
本出願は、2020年11月3日に出願された出願第17/088,062号に対する優先権を主張するものであり、その開示全体は、全ての目的のために参照により本明細書に組み込まれる。
(発明の分野)
本開示は、サラウンドサウンドオーディオシステムにおいて音を仮想的に定位させることに関する。
サラウンドサウンドオーディオシステムは、聴取者の周囲及び上方に位置するオーディオドライバを使用して、サウンドソースを三次元で仮想化することができる。これらのオーディオシステムは、高価であり、聴取領域のためにカスタム設計される必要があり得る。
下記で言及される全ての実施例及び特徴は、任意の技術的に可能な方式で組み合わせることができる。
一態様では、符号化されたコンピュータプログラム論理を含む非一時的コンピュータ可読媒体を有するコンピュータプログラム製品であって、コンピュータプログラム論理が、少なくとも2つのオーディオドライバを有するオーディオシステム上で実施されたときに、少なくとも左及び右入力オーディオ信号を含むオーディオ信号を入力することと、ドライバに提供される少なくとも左及び右高さオーディオ信号をレンダリングすることと、を行うように構成されており、オーディオシステムに、入力オーディオ信号間の相関を判定することと、入力オーディオ信号の正規化チャネルエネルギーを判定することと、判定された相関及び正規化チャネルエネルギーから少なくとも左及び右高さオーディオ信号を発生させることと、を行わせる、コンピュータプログラム製品。
いくつかの例は、上記及び/若しくは下記の特徴のうちの1つ、又はそれらの任意の組み合わせを含む。いくつかの例では、コンピュータプログラム論理は、更に、オーディオシステムに、入力オーディオ信号に対してフーリエ変換を実施させる。一例では、相関は、フーリエ変換に基づく。一例では、フーリエ変換は、一連のビンをもたらし、相関は、ビンに基づく。一例では、正規化チャネルエネルギーは、フーリエ変換に基づく。
いくつかの例は、上記及び/若しくは下記の特徴のうちの1つ、又はそれらの任意の組み合わせを含む。いくつかの例では、フーリエ変換は、一連のビンをもたらす。一例では、コンピュータプログラム論理は、更に、オーディオシステムに、サブオクターブ間隔を使用してビンをパーティショニングさせる。一例では、相関及び正規化チャネルエネルギーは、ビンについて別個に判定される。一例では、コンピュータプログラム論理は、更に、オーディオシステムに、パーティションを時間平滑化及び周波数平滑化して、平滑化された相関及び平滑化された正規化チャネルエネルギーを発生させる。一例では、高さオーディオ信号は、平滑化された相関及び平滑化された正規化チャネルエネルギーの両方の関数として、パーティションについて抽出される。
いくつかの例は、上記及び/若しくは下記の特徴のうちの1つ、又はそれらの任意の組み合わせを含む。いくつかの例では、コンピュータプログラム論理は、オーディオシステムに、左前高さオーディオチャネル信号、右前高さオーディオチャネル信号、左後高さオーディオチャネル信号、及び右後高さオーディオチャネル信号を発生させる。いくつかの例では、コンピュータプログラム論理は、更に、オーディオシステムに、無相関左及び右チャネルオーディオ信号を発生させる。一例では、コンピュータプログラム論理は、更に、オーディオシステムに、無相関左及び右チャネルオーディオ信号に対してクロストークキャンセルを実施させる。一例では、クロストークキャンセルは、無相関左チャネルオーディオ信号の遅延、反転、及びスケーリングされたバージョンを右チャネルオーディオ信号に加算し、無相関右チャネルオーディオ信号の遅延、反転、及びスケーリングされたバージョンを左チャネルオーディオ信号に加算する。一例では、クロストークキャンセルは、左チャネルオーディオ信号を、別個の低帯域左チャネルオーディオ信号及び高帯域左チャネルオーディオ信号と、別個の低帯域右チャネルオーディオ信号及び高帯域右チャネルオーディオ信号と、に分割させ、高帯域左及び右チャネルオーディオ信号を、ヘッドシャドウフィルタ、遅延、及び反転スケーラを通じて処理して、フィルタリングされた高帯域左及び右チャネルオーディオ信号を発生させ、フィルタリングされた高帯域左及び右チャネルオーディオ信号を高帯域左及び右チャネルオーディオ信号と結合させて、第1の結合信号を発生させ、クロストークキャンセル信号を発生させるために、第1の結合信号を低帯域左及び右オーディオチャネル信号と結合させる。
別の態様では、オーディオシステムは、少なくとも左前オーディオ信号、右前オーディオ信号、中央前オーディオ信号、左高さオーディオ信号、及び右高さオーディオ信号を再生するように構成された複数のドライバと、入力オーディオ信号間の相関を判定することと、入力オーディオ信号の正規化チャネルエネルギーを判定することと、判定された相関及び正規化チャネルエネルギーから少なくとも左及び右高さオーディオ信号を発生させることと、左及び右高さオーディオ信号をドライバに提供することと、を行うように構成されているプロセッサと、を含む。
いくつかの例は、上記及び/若しくは下記の特徴のうちの1つ、又はそれらの任意の組み合わせを含む。いくつかの例では、プロセッサは、入力オーディオ信号に対してフーリエ変換を実施するように更に構成されており、相関及び正規化チャネルエネルギーは、フーリエ変換に基づく。いくつかの例では、フーリエ変換は、一連のビンをもたらし、プロセッサは、サブオクターブ間隔を使用してビンをパーティショニングすることと、ビンに対する相関及び正規化チャネルエネルギーを別個に判定することと、を行うように更に構成されている。一例では、プロセッサは、オーディオシステムに、無相関左及び右チャネルオーディオ信号を発生させることと、無相関左及び右チャネルオーディオ信号に対してクロストークキャンセルを実施させることと、を行うように更に構成されている。
高さチャネルアップミキシングを達成するように構成されているオーディオシステムの概略図である。 高さチャネルアップミキシングを達成するように構成されているサラウンドサウンドオーディオシステムの概略図である。 入力ステレオ信号から高さチャネルを発生させるアップミキサの態様の概略図である。 4軸サウンドバーとともに使用するための、アップミキサ及びクロストークキャンセラの概略図である。 図4のクロストークキャンセラのより詳細な概略図である。
オーディオ分野において周知であるように、サラウンドサウンドオーディオシステムは、聴取者の前方、側方、及び後方の水平面に多かれ少なかれ配置される複数のチャネル(多くの場合、5若しくは7チャネル、又はそれ以上)を有することができる。システムはまた、聴取者の上方から音を提供するように配置される複数の高さチャネル(多くの場合、2つ若しくは4つ、又はそれ以上)を有することができる。最後に、システムは、1つ以上の低周波数チャネルを有することができる。一例として、5.1.4システムは、水平面に、1つの低周波数チャネル、及び4つの高さチャネルの5つのチャネルを有する。
オブジェクトベースのサラウンドサウンド技術(例えば、ドルビーアトモス及びDTS:X)は、多数のトラックに加えて、関連付けられた空間オーディオ記述メタデータ(例えば、位置データ)を含む。各オーディオトラックは、オーディオチャネル又はオーディオオブジェクトに割り当てることができる。オブジェクトベースのオーディオのためのサラウンドサウンドシステムは、典型的な家庭用5.1システムよりも多くのチャネルを有し得る。例えば、オブジェクトベースのシステムは、3D位置仮想化を達成するために、複数のオーバーヘッドスピーカを含む10個のチャネルを有し得る。再生中、サラウンドサウンドシステムは、各音がラウドスピーカに対してその指定されたスポットから来るように、オーディオオブジェクトをリアルタイムでレンダリングする。
レガシーオーディオソースは、多くの場合、左及び右2つのチャネルのみを含む。このようなソースは、高さチャネルが現在の音響技術によって開発されることを可能にする情報を有していない。したがって、聴取者は、レガシーオーディオソースからの完全な没入型サラウンドサウンド体験を楽しむことができない。
本開示は、高さ関連符号化を含まないオーディオソース、例えば、左及び右オーディオ信号を有するステレオソースから2つ(以上)の高さチャネルを発生させるように構成されているアップミキサを含む。したがって、本アップミキシングは、聴取者が、ステレオ入力において他の方法で利用可能なものよりも没入感のあるオーディオ体験を楽しむことを可能にする。アップミキシングは、入力オーディオ信号間の相関及び正規化チャネルエネルギーを判定することを含む。少なくとも2つの高さチャネル(例えば、左及び右高さオーディオ信号)が、相関及び正規化エネルギーから発生する。
図1のオーディオシステム10は、オーディオソース18によってシステム10に提供されるオーディオコンテンツの高さチャネルアップミキシングを達成するために使用されるように構成されている。いくつかの例では、オーディオソース18は、左及び右チャネル(すなわち、ステレオ)オーディオ信号を提供する。他の例では、オーディオソースは、Dolby5.1互換オーディオなど、高さチャネルを含まないサラウンドサウンドオーディオ信号のオーディオソースを含む。オーディオシステム10は、オーディオ信号を受信し、本明細書の他の場所で説明されるようにそれらを処理し、音声を再生するために使用されるオーディオドライバのいくつか又は全てに、処理されたオーディオ信号を分配するプロセッサ16を含む。一例では、処理されたオーディオ信号は、1つ以上の高さ信号を含む。一例では、処理されたオーディオ信号は、少なくとも中央、左、右、及び低周波エネルギー(low frequency energy、LFE)信号を含む。いくつかの例では、システム10は、ドライバ12及び14を含み、これらは、サウンドバーの左及び右ドライバであり得るが、そうである必要はない。サウンドバーは、多くの場合、テレビシステム用の音を生成するために使用されるように設計される。サウンドバーは、2つ以上のドライバを含み得る。サウンドバーは、オーディオ分野において周知であり、よって、本明細書では十分に説明されていない。一例では、プロセッサ16からの出力信号は、5つの水平チャネル(中央、左、右、左サラウンド、及び右サラウンド)と、1つのLFEチャネルと、左及び右高さチャネルと、を有する5.1.2オーディオシステムを定義する。一例では、高さチャネルは、音を天井から反射する左及び右上方発射ドライバを用いて再生される。
プロセッサ16は、オーディオソース18によって提供されるオーディオ信号から、ドライバ12及び14にそれぞれ提供される少なくとも左及び右高さオーディオ信号を発生させるように構成されている、符号化されたコンピュータプログラム論理を有する非一時的コンピュータ可読媒体を含む。高さ関連情報(例えば、高さオブジェクト又は高さ符号化)を含まない入力オーディオ信号からの高さ信号の発生について、以下でより詳細に説明する。
図2のサウンドバーオーディオシステム20は、中央チャネルドライバ26と、左前チャネルドライバ28と、右前チャネルドライバ30と、左高さチャネルドライバ32と、右高さチャネルドライバ34と、をそれぞれ含むサウンドバーエンクロージャ22を含む。全てではないが多くの場合、ドライバ26、28、及び30は、それらの主放射軸がほぼ水平であり、エンクロージャ22から外向きに、例えば、それぞれ、聴取者の予想される位置に直接向かい、左及び右に向くように配向され、一方、ドライバ32及び34は、それらの放射が天井から跳ね返り、聴取者の視点からは天井から発せられるように見えるように上に向けられる。サウンドバーオーディオシステム20はまた、典型的にはエンクロージャ22に含まれないが、部屋の他の場所に位置し、LFEチャネルを再生するように構成されている、サブウーファ35を含む。最後に、サウンドバーオーディオシステム20は、オーディオソース36から受信した入力オーディオ信号を処理するように構成されているプロセッサ24(例えば、デジタル信号プロセッサ(digital signal processor、DSP))を含む。ほとんどの場合、入力オーディオ信号は、(例解を容易にするために)図2に示されず、入力信号をプロセッサ24に提供する信号受信及び処理成分によって受信されることに留意されたい。プロセッサ24は、(プログラミングを介して)本明細書で説明される機能を実施するように構成されており、ドライバ32及び34、並びにこのようなドライバがオーディオシステムに含まれる場合、他の高さドライバへの高さオーディオ信号の提供がもたらされる。また、本開示は、サウンドバーオーディオシステムとともに使用することに決して限定されるものではなく、むしろ、プロセッサによって発生する高さオーディオ信号を再生するために使用することができるオーディオドライバを含む他のオーディオシステムとともに使用することができることに留意されたい。このような他のオーディオシステムの例としては、耳、頭、又は胴体に装着し、外耳道に直接音を入れないオープンオーディオデバイス(オーディオメガネ及び耳装着型を含むが、これらに限定されない)、及びヘッドホンが挙げられる。
高さチャネルアップミキシング
本明細書で説明される例では、高さチャネルアップミキシングを使用して、高さ成分を含まないオーディオ信号から高さ成分が合成される。合成された高さ成分は、オーディオシステムの1つ以上のチャネルにおいて使用することができる。いくつかの例では、高さ成分は、入力ステレオ又は従来のサラウンドサウンドコンテンツから、左高さチャネル及び右高さチャネルを発生させるために使用される。いくつかの例では、高さ成分は、入力ステレオ又は従来のサラウンドサウンドコンテンツから、左前高さチャネル、右前高さチャネル、左後高さチャネル、及び右後高さチャネルを発生させるために使用される。合成された高さ成分は、当業者には明らかなように、他の方法で使用することができる。
いくつかの実装様態では、本明細書で説明される高さチャネルアップミキシング技法は、他の三次元又はオブジェクトベースのサラウンドサウンド技術(ドルビーアトモス及びDTS:Xなど)に加えて、又はその代替として使用することができる。具体的には、本明細書で説明される高さチャネルアップミキシング技法は、コンテンツがそのように符号化されないときでも、三次元又はオブジェクトベースのサラウンドサウンド技術によって提供される同様の高さ(又は垂直軸)体験を提供することができる。例えば、高さチャネルアップミキシング技法は、聴取者をオーディオコンテンツにより完全に没入させるために、ステレオ音響に高さ成分を追加することができる。加えて、チャネルアップミキシング技法を使用して、コンテンツが高さ成分を含まない場合、又はコンテンツを含む高さ成分が適切に復号/レンダリングされ得ない場合であっても、1つ以上の上向き発射ドライバ(又はサウンドバーの主平面に対して45度より大きいなど、水平よりも天井に向かって角度を付けられたものなど、相対的な上向き発射ドライバ)を含むサウンドバーが、音の高さ成分を追加するか、又は増加させることを可能にすることができる。例えば、多くのサウンドバーは、テレビへの単一のHDMI eARC接続を使用して、高さ成分(ドルビーアトモス又はDTS:Xコンテンツなど)を含むオーディオコンテンツを受信及び再生するが、HDMI eARCをサポートしないテレビの場合、このようなオーディオコンテンツは、テレビがオーディオコンテンツを受信することができるかどうかにかかわらず、テレビからサウンドバーに渡すことができない場合がある。したがって、本明細書で説明される高さチャネルアップミキシング技法は、このような問題に対処するために使用することができる。
図3は、入力左及び右ステレオ信号から最高4つの高さチャネルを発生させるように構成されている、例示的な周波数領域アップミキサ50の態様の概略図である。一例では、アップミキサ50は、図2のプロセッサ24などのプログラムされたプロセッサを用いて達成される。WOLA解析52では、入力信号は、連続関数のサンプルを解析するのに有用な重み付け、オーバーラップ、加算離散時間高速フーリエ変換を使用して処理される。WOLAへの入力として機能するオーディオデータのブロック(一例では、2048個のサンプルを含む)は、フレームと呼ばれることがある。WOLA解析技法は、この分野において周知であり、よって、本明細書ではこれ以上説明されていない。出力は、入力周波数にマッピングする分解された離散周波数又はビンである。次に、変換された信号は、複素相関及び正規化関数54とチャネル抽出計算機能60との両方に提供される。
複素相関及び正規化54では、以下の手法を使用して各FFTビンに対して相関が実施される。左及び右チャネルの各FFTビンを複素平面内のベクトルであると考える。次いで、一方のベクトルの他方へのスカラー投影が、式Dot(Left,Right)/(mag(Left)mag(Right))を使用して計算され、式中、mag(a)=Sqrt(Real(a)^2+Imag(a)^2)である。これは、負相関に対する-1から正相関に対する+1までの相関値の範囲をもたらす。正規化エネルギーは、以下の手法を使用して各FFTビン上で計算される。左チャネル正規化エネルギー=mag(Left)/(mag(Left)+mag(Right))。右チャネル正規化エネルギー=mag(Right)/(mag(Left)+mag(Right))。この結果、等しいエネルギーに対しては0.5の範囲となり、ハードパンニングされた場合には1.0又は0.0の範囲となる。
知覚パーティショニング56では、FFTビンは、サブオクターブ間隔(例えば、1/3オクターブ間隔)を使用してパーティショニングされ、相関値及びエネルギー値は、各パーティションについて計算される。各パーティションの相関値及びエネルギーは、その後、各合成チャネル出力に対するアップミキシングマップを計算するために使用される。利用可能な処理リソースに基づいて、他の知覚的に基づくパーティションスキームが使用され得る。一例では、パーティショニングは、1024個のビンを24個の一意の値又は帯域に低減するのに有効である。
時間及び周波数平滑化58では、各パーティション帯域は、以下の手法を使用して、時間軸及び周波数軸の両方上で指数関数的に平滑化される。時間平滑化のために、各パーティションの相関及び正規化エネルギーが、式:Psmoothed(i,n)=(1-alpha)Punsmoothed(i,n)+alphaPsmoothed(i,n-1)を使用して計算され、式中、alphaは、0:1とPsmoothed(i,n-1)との間の値を有することができ、i番目のパーティションに対する前のFFTフレーム結果を表す。周波数平滑化のために、各パーティションの相関値は、その最も近い近傍の加重平均によって平滑化される。Waverage(i)=Sum(Punsmoothed(j)/abs(j-i))のように、現在のパーティションに近いほど重みが大きくなり、j!=Iである全てのjについて、最終的な加重平均は、Psmoothed(i)=(Waverage(i)+Punsmoothed(i))/(1.0+Sum(1.0/(abs(j-i)))である。これは、周波数領域実装において存在することがあるミュージカルノイズアーチファクトを排除するのに役立つ。
チャネル抽出計算60では、チャネルは、相関及び正規化チャネルエネルギーの両方の関数として、エネルギー保存ベースで各パーティションについて抽出される。ハードパンニングされたコンテンツに対して、元のパンニングが保存されることを保証するための操作が存在し、これは、ハードパンニングされたコンテンツが相関=0.0を有するので必要である。計算60の出力は、標準のデータフォーマット、WOLA合成、及びバス管理技法(図示せず)を通じて処理されて、左前高さ、右前高さ、左後高さ、及び右後高さチャネルを含む5.1.4チャネル出力を作成する。4つの高さチャネル信号は、サウンドバーの左及び右高さドライバ、又は専用の高さドライバなどの適切なドライバに提供することができる。いくつかの例では、2つの高さチャネル(左及び右)があり、他の例では、4つより多くの高さチャネルがある。
一例では、入力された左及び右オーディオ信号は、オーディオシステムプロセッサによってアップミックスされて、5.1.4チャネル出力を作成する。5つの水平チャネルは、左及び右前チャネル、中央チャネル、及び左及び右サラウンドチャネルを含む。4つの高さチャネルは、左及び右前高さチャネル、及び左及び右後高さチャネルを含む。左チャネル、中央チャネル、及び右チャネルは、複素相関及び正規化関数52に関して上で説明されるように、-1.0と1.0との間の両耳間相関係数を判定し、左及び右正規化エネルギー値を判定することによって発生させることができる。中央チャネル信号は、左及び右チャネル入力の各々と別個に乗算された中央チャネル係数に基づいて判定される。中央チャネル係数は、両耳間相関係数が0より大きい場合は0より大きい値を有し、そうでない場合は0である。左及び右チャネル信号は、中央チャネルで使用されないエネルギーに基づく。入力が左及び右にハードパンニングされる場合、エネルギーは、適切な入力チャネル内に保持される。
一例では、これら左及び右チャネル信号は、左及び右前信号、左及び右サラウンド信号、左及び右前高さ信号、及び左及び右後高さ信号に更に分割される。これらの分割は、両耳間相関係数、及び入力が左又は右にパンニングされる程度に基づく。両耳間相関係数が0.5より大きい場合、コンテンツは、高さチャネル又はサラウンドチャネルに操作されない。そうでなければ、前係数、前高さ係数、サラウンド係数、及び後高さ係数は、両耳間相関係数の値、及び左又は右パンニングの程度に基づいて判定される。前係数は、新しい左及び右チャネル出力信号を判定するために使用される。左及び右前高さ信号は、それぞれの前高さ係数によって乗算されたこれらの新しい左及び右チャネル出力信号に基づき、一方、左及び右後高さ信号は、それぞれの後高さ係数によって乗算されたこれらの新しい左及び右チャネル出力信号に基づく。左及び右サラウンド信号は、それぞれのサラウンド係数によって乗算されたこれらの新しい左及び右チャネル出力信号に基づく。新しい左及び右チャネル出力信号は、左及び右チャネルを発生させるために、パンニングの程度によって修正されたときに元の左及び右入力信号とブレンドされる。
典型的なサウンドバーは、少なくとも3つの別個のオーディオドライバである左ドライバ、右ドライバ、及び中央ドライバを含む。高さチャネルをより良好に再生するために、サウンドバーはまた、左高さドライバ及び右高さドライバを含むことができる。高さドライバは、これらの一次音響放射軸が上に向くように物理的に配向され得、これにより、音が天井から反射され、その結果、音が上方から発せられることをユーザがより知覚しやすくなる。
クロストークキャンセル
サウンドバーの正常な使用では、ユーザは、遠距離音場において、サウンドバーのおおよそ前に位置する(ユーザが、オーディオドライバから少なくとも約2つの平均波長に位置することを意味する)。従来のステレオ再生は、左チャネルが左耳並びに右耳によって聞かれ、右チャネルが右耳並びに左耳によって聞かれる、音響クロストークによる空間歪みを導入する。クロストークは、両耳間クロストークキャンセルを達成するためにプロセッサを使用することによって改良することができ、クロストークキャンセルは、各チャネルの遅延、反転、及びスケーリングされたバージョンを反対のチャネル(すなわち、左から右、及び右から左)にルーティングすることによって、クロストークによって引き起こされる問題を改善するように設計されている。遅延及び利得は、追加の伝搬遅延及び周波数依存ヘッドシャドウを反対側の耳に近似するように設計されている。この追加の信号は、反対側の耳におけるクロストーク成分を音響的にキャンセルする。
しかしながら、このキャンセル手法は、相関信号成分(すなわち、左及び右チャネルに共通の信号成分)に、コーミングアーチファクトを出力に導入させる。コーミングは、信号が遅延され、それ自体に加えられるときに発生する。コーミングは、可聴異常をもたらし得るので、回避されるべきである。本クロストークキャンセル体制では、遅延されて一緒に加算される信号が無相関化され、それにより、コーミングアーチファクトが低減又は排除されることを確実にするためのステップがとられる。
図4は、左チャネル、右チャネル、中央チャネル、及びLFEチャネルを有する4軸(又は3.1)サウンドバーとともに使用するための、アップミキサ及びクロストークキャンセラの概略図である。典型的なステレオ入力は、無相関周波数依存成分及び相関周波数依存成分を有する。歪みのない、又はほぼ歪みのないキャンセルを保証するために、相関成分は、本明細書で説明される技法を使用して無相関成分から分離される。上で説明されるように、アップミキサ50aは、無相関左及び右信号を発生させるために使用することができる。オーディオ信号の無相関成分は、アップミキサを使用することなく発生させることができることを理解されたい。一例では、任意選択的なアップミキサ50a(リフォーマッタとみなされ得る)は、2つのチャネル入力を受け入れ、3.1を出力することができる(すなわち、この例示的な実装様態では、無相関左及び右チャネル、相関中央チャネル、及び低周波エネルギー(LFE)チャネル)。アップミキサ50aは、任意選択的であるので、いくつかの実装様態ではアップミキサを使用する必要はない。更に、いくつかの実装様態は、任意選択的なダウンミキサを使用して、再生前に入力チャネルの数を低減し得る。他の例では、無相関成分は、ランダム位相応答を有する一連の全域通過フィルタなどの無相関アルゴリズムを適用することによって発生する。本明細書で説明される技法は、2.0、2.1、3.0、3.1、5.0、5.1、7.0、7.1、5.1.2、5.1.4、7.1.2、7.1.4などを出力するためなど、任意の数の複数のチャネルを出力するシステムに使用され得ることに留意されたい。したがって、クロストークキャンセル技法は、オーディオにおける相関コンテンツの再生を改善するために、2スピーカデバイス又はシステムからのステレオ出力に使用することができる。また、本技法は、2チャネル(ステレオ)入力、6チャネル入力(例えば、5.1システム用)、8チャネル入力(例えば、5.1.2又は7.1システム用)、10チャネル入力(例えば、7.1.2システム用)など、任意の数の複数チャネルを有するオーディオ入力を受信するシステムに使用され得ることに留意されたい。
クロストークキャンセルを使用して、このようなソース位置を含まない入力信号からソース位置を仮想化することができる。本明細書で様々に説明されるクロストークキャンセル技法は、本明細書で様々に説明される高さチャネルアップミキシング技法とは別個に、又は一緒に使用することができる。
無相関左及び右信号は、クロストークキャンセル機能80に提供される。クロストークキャンセル機能の例は、図5に関連して以下に説明される。結果として得られる信号は、次いで、相関中央チャネル及びLFE信号とともに、サウンドバー100に提供される。
図5は、図4のクロストークキャンセラ80の一例のより詳細な概略図である。クロストークキャンセルは、例えば、入力オーディオ信号又はデータが所望の高さチャネル又は高さオブジェクトを既に定義している場合、又はクロストークキャンセルが、複数のサウンドソース位置を仮想化するために使用される両耳間空間オーディオレンダリングなど、高さチャネルアップミキシングとは別に使用されているとき、チャネルアップミキシングとは別個に使用され得ることに留意されたい。無相関左及び右信号は、低帯域左及び右信号及び高帯域左及び右信号を出力する低帯域/高帯域分割機能82に提供される。一例では、スプリッタ82は、当技術分野において既知であるタイプの帯域通過フィルタを使用して達成される。一例では、2つの帯域の周波数範囲は、ほとんどの低周波コンテンツが高度に相関するので、低周波応答の損失を抑制するように選択される。この例では、低周波数及び高周波数は、クロストークキャンセルが実施される前に分離される。1つの非限定的な例では、低帯域は、DCから約200Hzまでを包含し、高帯域は、約200からFs/2Hzまでを包含する。高帯域信号は、ヘッドシャドウフィルタ84に提供され、ヘッドシャドウフィルタ84は、事前定義された到着角に基づいて同側耳から対側耳への伝達関数をシミュレートし、次いで、加算器90によって元の高帯域信号と加算される前に、遅延並びに反転利得86及び88をそれぞれシミュレートするように意図される。出力は、加算器92において低帯域信号と加算され、次いで、サウンドバーに提供される。
図4に例解されるものなどのいくつかの例では、クロストークキャンセルは、高さチャネルアップミキシングとともに使用される。上で説明されるように、他の例では、クロストークキャンセルは、高さチャネルアップミキシングに関係なく使用される。
いくつかの例では、本明細書で様々に説明されるような高さチャネルアップミキシング技法及び/又はクロストークキャンセル技法は、例えば、オンデバイス制御、遠隔制御、及び/又はモバイルアプリを使用してデフォルト状態から変更され得る制御可能な機能として提示される。このようなユーザがカスタマイズ可能な制御は、機能を有効化/無効化すること、及び/又は所望に応じて機能をカスタマイズすること、を含むことができる。例えば、高さチャネルアップミキシングのためのユーザがカスタマイズ可能な機能は、仮想化された高さチャネルのためのデフォルト相対音量(すなわち、他のチャネルのうちの1つ以上の音量に対する)を変更することを含むことができる。別の例では、ユーザは、所与の空間において高さチャネルがどのように方向付けられるかを変更するために、仮想化された高さチャネルのための一次聴取位置の距離をカスタマイズすることができる。更に、いくつかの実装態様では、ユーザのカスタマイズは、入力ソース及び/又はオーディオコンテンツと関連付けることができる。例えば、ユーザは、入力が接続されたテレビからのものであるときなど、入力ソースがビデオ(audio for video、A4V)コンテンツのためのオーディオであるとき、高さチャネルアップミキシング機能を有効化することが可能であり得るが、入力が音楽ストリーミングサービスであるときなどは、音楽入力ソースのための機能を無効化することが可能であり得る。更に、ユーザは、音楽コンテンツを聴いているときに(入力ソースにかかわらず)高さチャネルアップミキシング機能を有効化することが可能であり得るが、ポッドキャスト及びオーディオブックコンテンツについては(やはり、入力ソースにかかわらず)その機能を無効化することが可能であり得る。
図面の要素は、ブロック図の個別要素として図示及び説明される。これらの要素は、アナログ回路又はデジタル回路の1つ以上として実装され得る。代替的に、又は追加的に、これらの要素は、1つ以上のマイクロプロセッサがソフトウェア命令を遂行して実装され得る。ソフトウェア命令は、デジタル信号処理命令を含むことができる。動作は、アナログ回路により、又はマイクロプロセッサが、アナログ動作と同等の動作を実行するソフトウェアを遂行することにより実行することができる。信号ラインは、個別のアナログ信号ライン又はデジタル信号ラインとして、別個の信号を処理することができる適切な信号処理を行う個別のデジタル信号ラインとして、及び/又は無線通信システムの要素として実装され得る。
ブロック図でプロセスが表現又は示唆されるときに、ステップは、1つの要素又は複数の要素によって実行され得る。これらのステップは、一括して実行される、又は異なる時点で行われ得る。活動を実行する要素は、物理的に同じであり得るか、若しくは互いに近接し得るか、又は物理的に別個であり得る。1つの要素は、1つのブロックよりも多くの活動を実行し得る。オーディオ信号は、符号化される場合又は符号化されない場合があり、デジタル形式又はアナログ形式のいずれかで伝送され得。従来のオーディオ信号処理装置及び動作は、図面から省略されている場合がある。
本明細書において説明されるシステム及び方法の例は、当業者には明白であろうコンピュータ構成部品及びコンピュータによる実装ステップを含む。例えば、コンピュータ実装ステップが、例えば、フロッピーディスク、ハードディスク、光ディスク、フラッシュROM、不揮発性ROM、及びRAMのコンピュータ可読媒体上にコンピュータ実行可能命令として記憶され得ることが当業者によって理解されるべきである。更に、コンピュータ実行可能命令が、例えば、マイクロプロセッサ、デジタル信号プロセッサ、ゲートアレイなどの様々なプロセッサ上で実行され得ることが当業者によって理解されるべきである。説明を容易にするために、システム及び方法の全てのステップ又は要素が、コンピュータシステムの一部として本明細書で説明されるわけではないが、各ステップ又は要素が、対応するコンピュータシステム又はソフトウェアコンポーネントを有し得ることを、当業者は認識するであろう。したがって、このようなコンピュータシステム及び/又はソフトウェアコンポーネントは、それらの対応するステップ又は要素(すなわち、それらの機能性)を説明することによって可能になり、かつ本開示の範囲内にある。
複数の実装形態を説明してきた。それにもかかわらず、本明細書において説明される本発明の概念の範囲から逸脱することなく、追加の改変を行うことができ、したがって、他の例も、以下の特許請求の範囲の範囲内にあることが理解される。

Claims (22)

  1. 符号化されたコンピュータプログラム論理を含む非一時的コンピュータ可読媒体を有するコンピュータプログラム製品であって、前記コンピュータプログラム論理が、少なくとも2つのオーディオドライバを有するオーディオシステム上で実施されたときに、少なくとも左及び右入力オーディオ信号を含むオーディオ信号を入力することと、前記ドライバに提供される少なくとも左及び右高さオーディオ信号をレンダリングすることと、を行うように構成されており、前記オーディオシステムに、
    入力オーディオ信号間の相関を判定することと、
    入力オーディオ信号の正規化チャネルエネルギーを判定することと、
    前記判定された相関及び正規化チャネルエネルギーから少なくとも左及び右高さオーディオ信号を発生することと、を行わせる、コンピュータプログラム製品。
  2. 前記コンピュータプログラム論理が、更に、前記オーディオシステムに、入力オーディオ信号に対してフーリエ変換を実施させる、請求項1に記載のコンピュータプログラム製品。
  3. 前記相関が、前記フーリエ変換に基づく、請求項2に記載のコンピュータプログラム製品。
  4. 前記フーリエ変換が、一連のビンをもたらし、前記相関が、前記ビンに基づく、請求項3に記載のコンピュータプログラム製品。
  5. 前記正規化チャネルエネルギーが、前記フーリエ変換に基づく、請求項2に記載のコンピュータプログラム製品。
  6. 前記フーリエ変換が、一連のビンをもたらし、前記正規化チャネルエネルギーが、前記ビンに基づく、請求項5に記載のコンピュータプログラム製品。
  7. 前記フーリエ変換が、一連のビンをもたらす、請求項2に記載のコンピュータプログラム製品。
  8. 前記コンピュータプログラム論理が、更に、前記オーディオシステムに、サブオクターブ間隔を使用して前記ビンをパーティションに分割させる、請求項7に記載のコンピュータプログラム製品。
  9. 前記相関及び正規化チャネルエネルギーが、前記ビンについて別個に判定される、請求項8に記載のコンピュータプログラム製品。
  10. 前記コンピュータプログラム論理が、更に、前記オーディオシステムに、前記パーティションを時間平滑化及び周波数平滑化させて、平滑化された相関及び平滑化された正規化チャネルエネルギーを発生させる、請求項9に記載のコンピュータプログラム製品。
  11. 前記高さオーディオ信号が、前記平滑化された相関及び前記平滑化された正規化チャネルエネルギーの両方の関数として、前記パーティションについて抽出される、請求項10に記載のコンピュータプログラム製品。
  12. 前記コンピュータプログラム論理が、前記オーディオシステムに、左前高さオーディオチャネル信号、右前高さオーディオチャネル信号、左後高さオーディオチャネル信号、及び右後高さオーディオチャネル信号を発生させる、請求項1に記載のコンピュータプログラム製品。
  13. 前記コンピュータプログラム論理が、更に、前記オーディオシステムに、無相関左及び右チャネルオーディオ信号を発生させる、請求項1に記載のコンピュータプログラム製品。
  14. 前記コンピュータプログラム論理が、更に、前記オーディオシステムに、前記無相関左及び右チャネルオーディオ信号に対してクロストークキャンセルを実施させる、請求項13に記載のコンピュータプログラム製品。
  15. 前記クロストークキャンセルが、前記無相関左チャネルオーディオ信号の遅延、反転、及びスケーリングされたバージョンを右チャネルオーディオ信号に加算し、前記無相関右チャネルオーディオ信号の遅延、反転、及びスケーリングされたバージョンを左チャネルオーディオ信号に加算する、請求項14に記載のコンピュータプログラム製品。
  16. クロストークキャンセルが、左チャネルオーディオ信号を、別個の低帯域左チャネルオーディオ信号及び高帯域左チャネルオーディオ信号と、別個の低帯域右チャネルオーディオ信号及び高帯域右チャネルオーディオ信号と、に分割させ、前記高帯域左及び右チャネルオーディオ信号を、ヘッドシャドウフィルタ、遅延、及び反転スケーラを通じて処理して、フィルタリングされた高帯域左及び右チャネルオーディオ信号を発生させ、前記フィルタリングされた高帯域左及び右チャネルオーディオ信号を前記高帯域左及び右チャネルオーディオ信号と結合させて、第1の結合信号を発生させ、クロストークキャンセル信号を発生させるために、前記第1の結合信号を前記低帯域左及び右オーディオチャネル信号と結合させる、請求項14に記載のコンピュータプログラム製品。
  17. ユーザが、前記少なくとも左及び右高さオーディオ信号のレンダリングを有効及び無効化することができる、請求項1に記載のコンピュータプログラム製品。
  18. ユーザが、前記オーディオシステムのメインボリュームに対する前記少なくとも左及び右高さオーディオ信号のボリュームをカスタマイズすることができる、請求項1に記載のコンピュータプログラム製品。
  19. オーディオシステムであって、
    少なくとも左前オーディオ信号、右前オーディオ信号、中央前オーディオ信号、左高さオーディオ信号、及び右高さオーディオ信号を再生するように構成された複数のドライバと、
    入力オーディオ信号間の相関を判定することと、入力オーディオ信号の正規化チャネルエネルギーを判定することと、前記判定された相関及び正規化チャネルエネルギーから少なくとも左及び右高さオーディオ信号を発生させることと、前記左及び右高さオーディオ信号を前記ドライバに提供することと、を行うように構成されている、プロセッサと、を備える、オーディオシステム。
  20. 前記プロセッサが、入力オーディオ信号に対してフーリエ変換を実施するように更に構成されており、前記相関及び前記正規化チャネルエネルギーが、前記フーリエ変換に基づく、請求項19に記載のオーディオシステム。
  21. 前記フーリエ変換が、一連のビンをもたらし、前記プロセッサが、サブオクターブ間隔を使用して前記ビンをパーティショニングすることと、前記ビンに対する前記相関及び正規化チャネルエネルギーを別個に判定することと、を行うように更に構成されている、請求項20に記載のオーディオシステム。
  22. 前記プロセッサが、前記オーディオシステムに、無相関左及び右チャネルオーディオ信号を発生させることと、前記無相関左及び右チャネルオーディオ信号に対してクロストークキャンセルを実施させることと、を行うように更に構成されている、請求項21に記載のオーディオシステム。
JP2023527086A 2020-11-03 2021-11-02 オーディオシステムの高さチャネルアップミキシング Pending JP2023548570A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17/088,062 US11373662B2 (en) 2020-11-03 2020-11-03 Audio system height channel up-mixing
US17/088,062 2020-11-03
PCT/US2021/057778 WO2022098675A1 (en) 2020-11-03 2021-11-02 Audio system height channel up-mixing

Publications (1)

Publication Number Publication Date
JP2023548570A true JP2023548570A (ja) 2023-11-17

Family

ID=79316729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023527086A Pending JP2023548570A (ja) 2020-11-03 2021-11-02 オーディオシステムの高さチャネルアップミキシング

Country Status (5)

Country Link
US (2) US11373662B2 (ja)
EP (1) EP4241465A1 (ja)
JP (1) JP2023548570A (ja)
CN (1) CN116686306A (ja)
WO (1) WO2022098675A1 (ja)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2610430C (en) * 2005-06-03 2016-02-23 Dolby Laboratories Licensing Corporation Channel reconfiguration with side information
US8306243B2 (en) 2007-08-13 2012-11-06 Mitsubishi Electric Corporation Audio device
US20130156431A1 (en) * 2010-12-28 2013-06-20 Chen-Kuo Sun System and method for multiple sub-octave band transmissions
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
WO2013111034A2 (en) 2012-01-23 2013-08-01 Koninklijke Philips N.V. Audio rendering system and method therefor
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
CN104604257B (zh) * 2012-08-31 2016-05-25 杜比实验室特许公司 用于在各种收听环境中渲染并且回放基于对象的音频的系统
EP3061268B1 (en) 2013-10-30 2019-09-04 Huawei Technologies Co., Ltd. Method and mobile device for processing an audio signal
CN110636415B (zh) * 2014-08-29 2021-07-23 杜比实验室特许公司 用于处理音频的方法、系统和存储介质
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
GB2581119A (en) * 2016-04-29 2020-08-12 Cirrus Logic Int Semiconductor Ltd Audio signal processing
US10575116B2 (en) 2018-06-20 2020-02-25 Lg Display Co., Ltd. Spectral defect compensation for crosstalk processing of spatial audio signals
US10796704B2 (en) * 2018-08-17 2020-10-06 Dts, Inc. Spatial audio signal decoder

Also Published As

Publication number Publication date
US20220139403A1 (en) 2022-05-05
WO2022098675A1 (en) 2022-05-12
US12008998B2 (en) 2024-06-11
EP4241465A1 (en) 2023-09-13
CN116686306A (zh) 2023-09-01
US20220328054A1 (en) 2022-10-13
US11373662B2 (en) 2022-06-28

Similar Documents

Publication Publication Date Title
AU2020203222B2 (en) Generating binaural audio in response to multi-channel audio using at least one feedback delay network
JP6130599B2 (ja) 第1および第2の入力チャネルを少なくとも1個の出力チャネルにマッピングするための装置及び方法
EP2891336B1 (en) Virtual rendering of object-based audio
JP5964311B2 (ja) ステレオイメージ拡張システム
US20190373397A1 (en) Generating Binaural Audio in Response to Multi-Channel Audio Using at Least One Feedback Delay Network
US9769589B2 (en) Method of improving externalization of virtual surround sound
TWI651973B (zh) 以保真立體音響格式所編碼聲訊訊號為l揚聲器在已知位置之解碼方法和裝置以及電腦可讀式儲存媒體
US10764709B2 (en) Methods, apparatus and systems for dynamic equalization for cross-talk cancellation
JP6820613B2 (ja) 没入型オーディオ再生のための信号合成
CN113170271B (zh) 用于处理立体声信号的方法和装置
JP6009547B2 (ja) オーディオ・システム及びオーディオ・システムのための方法
JP2014506416A (ja) オーディオ空間化および環境シミュレーション
JP6660982B2 (ja) オーディオ信号レンダリング方法及び装置
US11212631B2 (en) Method for generating binaural signals from stereo signals using upmixing binauralization, and apparatus therefor
US12008998B2 (en) Audio system height channel up-mixing
US11924623B2 (en) Object-based audio spatializer
KR20200128671A (ko) 주변 신호를 복수의 주변 신호 채널들에 분배하는 오디오 신호 프로세서, 시스템 및 방법들
KR20060026234A (ko) 입체 음향 재생 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240624