JP7038921B2 - サウンドステージを保全するオーディオチャネルの加算 - Google Patents

サウンドステージを保全するオーディオチャネルの加算 Download PDF

Info

Publication number
JP7038921B2
JP7038921B2 JP2021540183A JP2021540183A JP7038921B2 JP 7038921 B2 JP7038921 B2 JP 7038921B2 JP 2021540183 A JP2021540183 A JP 2021540183A JP 2021540183 A JP2021540183 A JP 2021540183A JP 7038921 B2 JP7038921 B2 JP 7038921B2
Authority
JP
Japan
Prior art keywords
component
oct
components
orthogonal
generate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021540183A
Other languages
English (en)
Other versions
JP2022516374A (ja
Inventor
アンソニー マリグリオ ザ サード ジョセフ
セルデス ザッカリー
Original Assignee
ブームクラウド 360 インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ブームクラウド 360 インコーポレイテッド filed Critical ブームクラウド 360 インコーポレイテッド
Publication of JP2022516374A publication Critical patent/JP2022516374A/ja
Application granted granted Critical
Publication of JP7038921B2 publication Critical patent/JP7038921B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2400/00Loudspeakers
    • H04R2400/01Transducers used as a loudspeaker to generate sound aswell as a microphone to detect sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2400/00Loudspeakers
    • H04R2400/03Transducers capable of generating both sound as well as tactile vibration, e.g. as used in cellular phones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/01Input selection or mixing for amplifiers or loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本開示は、一般にオーディオ処理に関連して、より具体的には、サウンドステージを保全するチャネルの加算に関連する。
オーディオのコンテンツは、通常、ステレオ再生のために設計されている。この仮定は、この慣習によって暗示される期待に適合しない再生ソリューションに対して問題がある。このような2つの場合は、制約のないメッシュに配列されたモノラルスピーカーおよび多様なスピーカーである。どちらの場合においても、一般的なソリューションは、ステレオオーディオ信号の左右両方のチャネルを加算することであり、これは、負の相関関係にある情報の損失という結果になる。さらに、制約のないメッシュの場合において、メッシュ形状についての知識が不足していると、元のコンテンツにおいて符号化されたサウンドステージの情報を保存するための機会が失われる結果になる。
実施形態は、サウンドステージを保全するチャネルの加算およびオーディオ信号の不規則なメッシュ拡散を提供するために非線形ユニタリフィルターバンクを用いることに関連する。直交相関変換を介したモノラルの加算(本明細書では「MON-OCT」とも称される)は、サウンドステージを保全するチャネルの加算を提供する。オーディオ信号にMON-OCTの適用することは、マルチ入力、マルチ出力の非線形ユニタリフィルターバンクを用いることを含んでよく、これは、最小の待ち時間および最適な過渡応答のために時間領域において実装されてよい。
ある実施形態において、直交相関変換を介したモノラルの加算のマルチバンドの実装は、非線形フィルターに関連付けられるアーティファクトを低減することに用いられる。ブロードバンドオーディオ信号は、例えば、位相補正された4次のLinkwitz-Rileyのネットワーク、または他のフィルターバンクトポロジー(例えば、ウェーブレット分解、または短時間フーリエ変換(STFT))を用いることによって、サブバンドへと分解されることができる。フィルターの非線形力学は、信号に依拠する時間変化する線形力学の観点から説明されることが可能である。ユニタリ制約は、すべての条件下でフィルターの安定性を保証する。
ある実施形態は、回路を含むシステムを含む。回路は、1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成し、第1の回転コンポーネントを用いて互いに位相がずれている左部直交コンポーネントを生成し、第2の回転コンポーネントを用いて、互いに位相がずれている右部直交コンポーネントを生成し、左部直交コンポーネントおよび右部直交コンポーネントに基づいて、直交相関変換(OCT)コンポーネントを生成することであって、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含み、1つまたは複数のOCTコンポーネントを用いてモノラル出力のチャネルを生成し、およびモノラル出力のチャネルを1つまたは複数のスピーカーに提供するように構成される。
ある実施形態は、方法を含む。回路によって、方法は、1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成するステップと、第1の回転コンポーネントを用いて互いに位相がずれている左部直交コンポーネントを生成するステップと、第2の回転コンポーネントを用いて互いに位相がずれている右部直交コンポーネントを生成するステップと、左部直交コンポーネントおよび右部直交コンポーネントに基づいて、直交相関変換(OCT)コンポーネントを生成するステップであって、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含むステップと、1つまたは複数のOCTコンポーネントを用いてモノラル出力のチャネルを生成するステップと、モノラル出力のチャネルを1つまたは複数のスピーカーに提供するするステップとを備える。
ある実施形態は、少なくとも1つのプロセッサによって実行された場合に、少なくとも1つのプロセッサに、1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成し、第1の回転コンポーネントを用いて互いに位相がずれている左部直交コンポーネントを生成し、第2の回転コンポーネントを用いて互いに位相がずれている右部直交コンポーネントを生成し、左部直交コンポーネントおよび右部直交コンポーネントに基づいて、直交相関変換(OCT)コンポーネントを生成することであって、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含み、1つまたは複数のOCTコンポーネントを用いてモノラル出力のチャネルを生成し、モノラル出力のチャネルを1つまたは複数のスピーカーに提供するように構成する命令を格納する非一時的なコンピュータ可読媒体を含む。
ある実施形態にかかる、オーディオ処理システムのブロック図である。 ある実施形態にかかる、オーディオ処理システムのブロック図である。 ある実施形態にかかる、周波数バンド分割器のブロック図である。 ある実施形態にかかる、サウンドステージを保全するチャネルの加算のためのプロセスのフローチャートである。 ある実施形態にかかる、サブバンド分解を用いてサウンドステージを保全するチャネルの加算のためのプロセスのフローチャートである。 ある実施形態にかかる、コンピュータのブロック図である。
図面は、説明だけを目的とするさまざまな実施形態を示す。当業者は、本明細書で説明される構造および方法の代替的な実施形態が、本明細書で説明される原理から逸脱することなく採用されることができることを以下の説明から容易に認識することとなる。
(オーディオ処理システム)
図1は、ある実施形態にかかる、オーディオ処理システム100のブロック図である。オーディオシステム100は、直交相関変換(「MON-OCT」)を介したモノラルの加算を用いて、サウンドステージを保全するチャネルの加算を提供する。オーディオ処理システム100は、回転プロセッサ102、直交プロセッサ104、直交相関変換(本明細書では「OCT」とも称される)プロセッサ106、およびコンポーネントセレクター108を備える。
回転プロセッサ102は、左部チャネルu(t)1および右部チャネルu(t)2を含む入力信号u(t)を受信する。回転プロセッサ102は、チャネルu(t)1およびチャネルu(t)2を回転させることによって、第1の回転コンポーネントx(t)1を生成して、チャネルu(t)1およびチャネルu(t)2を回転させることによって、第2の回転コンポーネントx(t)2を生成する。チャネルu(t)1およびu(t)2は、1組のオーディオ信号コンポーネントである。ある例示において、チャネルu(t)1は、ステレオオーディオ信号の左部チャネルであり、チャネルu(t)2は、右部チャネルである。
直交プロセッサ104は、回転されたコンポーネントのそれぞれのために直交フィルターを含む。直交フィルター112aは、第1の回転コンポーネントx(t)1を受け取り、互いの間に(例えば、90度の)位相関係を有する左部直交コンポーネントH(x(t)11およびH(x(t)12を生成して、それぞれが第1の回転コンポーネントx(t)1との単一の大きさの関係を有する。直交フィルター112bは、第2の回転コンポーネントx(t)2を受け取り、互いの間に(例えば、90度の)位相関係を有する右部直交コンポーネントH(x(t)21およびH(x(t)22を生成して、それぞれが第2の回転コンポーネントx(t)2との単一の大きさの関係を有する。
OCTプロセッサ106は、直交コンポーネントH(x(t)11、H(x(t)12、H(x(t)21、およびH(x(t)22を受け取り、重み付けを用いて組となる直交コンポーネントを組み合わせ、OCTコンポーネントOCT1、OCT2、OCT3、およびOCT4を生成する。OCTコンポーネントの数は、直交コンポーネントの数に対応してよい。それぞれのOCTコンポーネントは、入力信号u(t)の左部チャネルu(t)1および右部チャネルu(t)2からの寄与を含むが、左部チャネルu(t)1および右部チャネルu(t)2を単純に組み合わせることによって生じることとなる負の相関関係にある情報を消失することはない。直交コンポーネントの使用は、加算をもたらし、ここで、振幅ヌルは、位相ヌルへと変換される。
コンポーネントセレクター110は、1つまたは複数のOCTコンポーネントOCT1、OCT2、OCT3、およびOCT4を用いて、モノラル出力のチャネルOを生成する。ある実施形態において、コンポーネントセレクター110は、出力チャネルOに対するOCTコンポーネントのうちの1つを選択する。他の実施形態において、コンポーネントセレクター110は、複数のOCTコンポーネントの組み合わせに基づいて出力チャネルOを生成する。例えば、多様なOCTコンポーネントは、時間の経過とともに異なる重み付けをされている異なるOCTコンポーネントを用いて、出力チャネルOにおいて組み合わせられる。ここで、出力チャネルOは、多様なOCTコンポーネントの時間変化する組み合わせである。
そのため、オーディオ処理システム100は、左部チャネルu(t)1および右部チャネルu(t)2を含む入力信号u(t)から出力チャネルOを生成する。入力信号u(t)は、さまざまな数のチャネルを含んでよい。nチャネル入力信号に対して、オーディオ処理システム100は、2n直交コンポーネントおよび2nOCTコンポーネントを生成することができ、1つまたは複数の2nOCTコンポーネントを用いて出力チャネルOを生成する。
(直交相関変換による線形モノラルの加算)
ある実施形態において、(例えば、式7において定義されるように)線形の時不変系のOCTを用いて、多様な(例えば、n)チャネルを含むオーディオ信号からモノラル出力のチャネルを生成することができる。
ステレオオーディオ信号は、式1に従って定義されることができ、ここで、u(t)1は、ステレオオーディオ信号の左部チャネルLであってよく、u(t)2は、ステレオオーディオ信号の右部チャネルRであってよい。
Figure 0007038921000001
他の実施形態において、u(t)1およびu(t)2は、左部チャネルおよび右部チャネルの他の1組のオーディオ信号コンポーネントである。
この2次元信号からの線形射影が単一の次元へと適用される場合、ヌル空間を予期するであろう。両方のチャネルを加算する共通の解決法がこれを正確に行う。結果として、ヌル空間は、u(t)1=-u(t)2の形態のベクトルを含む。
入力オーディオ信号u(t)から回転コンポーネントx(t)を生成するために(例えば、回転プロセッサ102によって)、回転行列が適用される。n=2のチャネルに対して、2×2の直交回転行列は、式2によって定義され、ここで、θは、回転角を決定する。
Figure 0007038921000002
ある例示において、回転角θは、45°であり、その結果、それぞれの入力信号コンポーネントは、45°回転される。他の例示において、回転角は、-45°であってよく、その結果、反対方向に回転する。ある例示において、(例えば、以下の式11に示されるように)、回転角は、時間とともに、または入力信号に応答して変化する。しかしながら、具体的な場合において、式3によって定義されるように、回転は、一定であり、それは、u(t)に適用されて、結果としてx(t)となる。
Figure 0007038921000003
(例えば、直交プロセッサ104によって)直交コンポーネントを生成するために、それぞれのチャネルに対する1組の直交全域通過フィルター(例えば、直交フィルター112aおよび112b)を含む直交全域通過フィルターの関数H()が、連続した時間のプロトタイプを用いて定義される。例えば、チャネルx(t)1に対して、直交全域通過フィルターの関数は、式4に従って定義されることができ、ここで、H()は、2つの直交全域通過フィルターH()1およびH()2を含む線形演算子である。
Figure 0007038921000004
H()1は、H()2によって生成されるコンポーネントと90度の位相関係を有するコンポーネントを生成して、H()1およびH()2の出力は、直交コンポーネントと称される。x~(t)1は、x(t)1と同一の大きさのスペクトルを有する信号であるが、x(t)1との位相関係は制約されていない。
H(x(t)11およびH(x(t)12によって定義される直交コンポーネントは、互いに90度の位相関係を有しており、それぞれが入力チャネルx(t)1との単一の大きさの関係を有する。同様に、直交全域通過フィルターの関数H()は、チャネルx(t)2に適用されることができ、互いに90度の位相関係を有して、それぞれが入力チャネルx(t)2との単一の大きさの関係を有するH(x(t)21およびH(x(t)22によって定義される直交コンポーネントを生成する。
オーディオ信号u(t)は、2つ(例えば、左部およびと右部)チャネルに限定されことなく、n個のチャネルを含み得る。それ故に、また、x(t)の次元は、可変である。より一般的には、線形直交全域通過フィルターの関数Hn(x(t))は、n個のチャネルコンポーネントを含むn次元ベクトルx(t)に対するその作用によって定義されることができる。結果は、式5によって定義される2n次元の行ベクトルであり、ここで、H()1およびH()2は、上記の式4に従って定義される。
Figure 0007038921000005
ここで、オーディオ信号のnチャネルのそれぞれに対して、90度の位相関係を有する1組の直交コンポーネントが生成される。そのため、直交全域通過フィルターの関数Hn()は、オーディオ信号u(t)のn次元ベクトルを2n次元空間へと射影する。
直交コンポーネントから(例えば、OCTプロセッサ106によって)OCT出力を生成するために、回転がそれぞれの直交コンポーネントに適用される。回転行列は、式6によって定義されるように、置換行列を用いてブロック形式で適用され、一定の行列Pを生成する。
Figure 0007038921000006
一定の行列Pは、Hn(x(t))の直交コンポーネントを用いて乗算される。u(t)がステレオ信号(例えば、n=2)である場合に、このようにしてx(t)の次元も2であり、この4×4直交行列Pは、H2(x(t))の4次元ベクトル結果を4つの直交コンポーネントであるOCTコンポーネントによって定義される4次元基底へと変換する。例えば、第1の左部直交コンポーネントは、反転した第2の右部直交コンポーネントと組み合わされることができ、第1のOCTコンポーネントを生成して、第1の左部直交コンポーネントは、第2の右部直交コンポーネントと組み合わされることができ、第2のOCTコンポーネントを生成して、第2の左部直交コンポーネントは、反転した第1の右部直交コンポーネントと組み合わされることができ、第3のOCTコンポーネントを生成して、第2の左部直交コンポーネントは、第1の右部直交コンポーネントと組み合わされることができ、第4のOCTコンポーネントを生成する。そのため、組となる直交コンポーネントは、重み付けがされて、組み合わされてOCTコンポーネントを生成する。2つよりも多いチャネルを有するオーディオ信号u(t)に対して、より大きな回転行列および置換行列を用いて、正しいサイズの一定の行列を生成する。OCTコンポーネントを導き出すための一般式は、式7によって定義される。
Figure 0007038921000007
モノラル出力のチャネルを生成するために(例えば、コンポーネントセレクター110によって)、OCTから生成される出力のうちの1つが選択されることができる。モノラル出力のチャネルは、1つのスピーカーまたは多様なスピーカーに提供される。
(直交相関変換による非線形モノラルの加算)
上記のように2次元オーディオベクトルを単に変換して、単一の出力を選択することは、結果としていまだに、ヌル空間の中に存在することとなる。しかしながら、多くの実際の例示に対して、これらのサブスペースにおける知覚的に重要なオーディオ情報を有する確率は、L+RまたはL-Rのような位置における重要な情報を有する確率よりもより悪い。これは、業界基準となっている共通のミキシング技術のためである。
いまだにOCT出力が顕著な情報を失っていることとなる可能性はある。これに対処するために、非線形の加算が用いられることができ、これは、2つまたはそれより多くのOCT出力の信号依存、時間変化する組み合わせとして記載されることが可能である。
例えば、コンポーネントセレクター110は、OCT出力のうちの2つを選択することができ、選択されたOCT出力を用いることができ、非線形の加算を生成する。MON-OCTが2チャネルオーディオ信号u(t)に適用され、結果として4つのOCT出力となる場合に、可能な組み合わせを列挙するために、4×2の射影行列Πは、4つのOCT出力から1組のコンポーネントを選択することに用いられることができる。選択されたコンポーネントは、例えば、式8によって示されるように、射影行列においける非ゼロ指標に対応する。
Figure 0007038921000008
本例示において、射影行列Πは、式9よって示されるように、第2のOCT出力および第3のOCT出力を選択し、直交コンポーネントMa(u)およびMb(u)の2次元ベクトルを生成する。
Figure 0007038921000009
結果として2次元ベクトルは、組み合わせられ、入力信号依存する時間変化する回転を用いることによって、モノラル出力のチャネルを生成する。回転角における瞬時の変化の非線形効果を和らげるために、S(x)が線形または非線形ローパスフィルター、スルーリミッター、またはある同様な要素のような勾配制限の関数を表示する。このフィルターの動作は、結果として変調する正弦波の絶対周波数に上限を設定し、結果として回転から最大の非線形性を効果的に制限する。
局所最適性に対する多くの異なるテストが用いられ得るが、ある例示において、2つの直交コンポーネント間のピーク絶対値は、式10によって定義されるように、勾配制限の関数Sへの入力として用いられ、角度θuを決定する。
Figure 0007038921000010
他の実施形態は、勾配制限の関数S(x)への入力として最適性の異なる尺度を用いてよい。角度θuは、動的に変化する最適な所与のuを指す。この最適値は、式11によって定義されるように、射影を用いて抽出され、モノラル出力のチャネルM~ a,b(u)を生成する。
Figure 0007038921000011
射影行列Πは、MON-OCTから出力される4つの直交コンポーネントのうちの第2の直交コンポーネントおよび第3の直交コンポーネントを選択するように上記で説明されているが、任意のOCT出力は、それらの中で選択されることができ、モノラル出力のチャネルを生成する。ある実施形態において、多様なOCT出力が選択されることでき、異なるスピーカーに提供されることができる。ある実施形態において、直交コンポーネントは、RMSの最大化または他の関数のような他の要因に基づいた組み合わせのために選択されることができる。ある実施形態において、式11は、ベクトル[Ma(u)Mb(u)]を射影させるのではなく、単に回転させるだけであり、これは、結果としてマルチチャネル出力となる。
(サブバンド分解によるアーティファクトの最小化)
式11によって定義されるモノラル出力のチャネルは、θuの角速度によって周波数シフトの結果である非線形アーティファクトが含むことができる。これは、サブバンド分解を適用することによって軽減されることができ、ここで、ワイドバンドオーディオ信号u(t)は、周波数サブバンドコンポーネントへと分離される。次に、MON-OCTは、それぞれのサブバンドがモノラル出力のチャネルへと組み合わされることで、それぞれのサブバンドに対し実行されることできる。次に、MON-OCTは、それぞれのサブバンドがモノラル出力のチャネルへと組み合わされることで、それぞれのサブバンドに対し実行されることできる。周波数バンド分割器は、オーディオ信号をサブバンドへと分離することに用いられることができる。それぞれのサブバンドにMON-OCTを適用した後で、周波数バンド結合器は、サブバンドを出力チャネルへと結合することに用いられることができる。
サブバンド分解は、非線形アーティファクトの低減をもたらす。トレードオフが顕著な応答と過渡応答との間で発生することが可能であるが、すべての実用的な目的に対し、最適な領域は、十分に小さく、さらにパラメーター化することなく設定される。
図2は、ある実施形態にかかる、オーディオ処理システム200のブロック図である。オーディオ処理システム200は、周波数バンド分割器202、周波数バンド分割器204、オーディオ処理システム100(1)~100(4)、および周波数バンド結合器206を備える。
周波数バンド分割器202は、入力信号u(t)の左部チャネルu(t)1を受信して、左部チャネルu(t)1を左部サブバンドコンポーネントu(t)1(1)、u(t)1(2)、u(t)1(3)、およびu(t)1(4)へと分離する。4つの左部サブバンドコンポーネントu(t)1(1)、u(t)1(2)、u(t)1(3)、およびu(t)1(4)のそれぞれは、左部チャネルu(t)1の異なる周波数のオーディオデータを含む。周波数バンド分割器204は、入力信号u(t)の右部チャネルu(t)2を受信して、右部チャネルu(t)2を右部サブバンドコンポーネントu(t)2(1)、u(t)2(2)、u(t)2(3)、およびu(t)2(4)へと分離する。4つの右部サブバンドコンポーネントu(t)2(1)、u(t)2(2)、u(t)2(3)、およびu(t)2(4)のそれぞれは、右部チャネルu(t)2の異なる周波数のオーディオデータを含む。
オーディオ処理システム100(1)、100(2)、100(3)、および100(4)のそれぞれは、左部サブバンドコンポーネントおよび右部サブバンドコンポーネントを受け取って、左部サブバンドコンポーネントおよび右部サブバンドコンポーネントに基づいてサブバンドに対するモノラルサブバンドコンポーネントを生成する。図1に関連する上記のオーディオ処理システム100に関する説明は、演算がすべての左部チャネルu(t)1および右部チャネルu(t)2の代わりに、左部チャネルおよび右部チャネルのサブバンドに対して実行されることを除いて、オーディオ処理システム100(1)、100(2)、100(3)、および100(4)のそれぞれに適用されることができる。
オーディオ処理システム100(1)は、左部サブバンドコンポーネントu(t)1(1)および右部サブバンドコンポーネントu(t)2(1)を受け取って、モノラルサブバンドコンポーネントO(1)を生成する。オーディオ処理システム100(2)は、左部サブバンドコンポーネントu(t)1(2)および右部サブバンドコンポーネントu(t)2(2)を受け取って、モノラルサブバンドコンポーネントO(2)を生成する。オーディオ処理システム100(3)は、左部サブバンドコンポーネントu(t)1(3)および右部サブバンドコンポーネントu(t)2(3)を受け取って、モノラルサブバンドコンポーネントO(3)を生成する。オーディオ処理システム100(4)は、左部サブバンドコンポーネントu(t)1(4)および右部サブバンドコンポーネントu(t)2(4)を受け取って、モノラルサブバンドコンポーネントO(4)を生成する。オーディオ処理システム100(1)~100(4)によって実行される処理は、サブバンドコンポーネントに対して異なってよい。
周波数バンド結合器206は、モノラルサブバンドコンポーネントO(1)、O(2)、O(3)、およびO(4)を受け取って、これらのモノラルサブバンドコンポーネントをモノラル出力のチャネルOへと結合する。
図3は、ある実施形態にかかる、周波数バンド分割器300のブロック図である。周波数バンド分割器300は、周波数バンド分割器202または204のある例示である。周波数バンド分割器300は、コーナー周波数で、位相補正が適用される、4次のLinkwitz-Rileyのクロスオーバーネットワークである。周波数バンド分割器300は、オーディオ信号(例えば、左部チャネルu(t)1および右部チャネルu(t)2)をサブバンドコンポーネント318、320、322、および324へと分離する。
周波数バンド分割器は、出力でのコヒーレント加算を可能とする位相補正を伴う4次のLinkwitz-Rileyのクロスオーバーのカスケードを含む。周波数バンド分割器300は、ローパスフィルター302、ハイパスフィルター304、全域通過フィルター306、ローパスフィルター308、ハイパスフィルター310、全域通過フィルター312、ハイパスフィルター316、およびローパスフィルター314を含む。
ローパスフィルター302およびハイパスフィルター304は、コーナー周波数(例えば、300Hz)を有する4次のLinkwitz-Rileyのクロスオーバーを含み、全域通過フィルター306は、マッチングする2次の全域通過フィルターを含む。ローパスフィルター308およびハイパスフィルター310は、別のコーナー周波数(例えば、510Hz)を有する4次のLinkwitz-Rileyのクロスオーバーを含み、全域通過フィルター312は、マッチングする2次の全域通過フィルターを含む。ローパスフィルター314およびハイパスフィルター316は、別のコーナー周波数(例えば、2700Hz)を有する4次のLinkwitz-Rileyのクロスオーバーを含む。そのため、周波数バンド分割器300は、0~300Hzを含む周波数サブバンド(1)に対応するサブバンドコンポーネント318、300から510Hzを含む周波数サブバンド(2)に対応するサブバンドコンポーネント320、510~2700Hzを含む周波数サブバンド(3)に対応するサブバンドコンポーネント322、および2700Hz~ナイキスト周波数を含む周波数サブバンド(4)に対応するサブバンドコンポーネント324を含む。本例示において、周波数バンド分割器300は、n=4のサブバンドコンポーネントを生成する。サブバンドコンポーネントの数および周波数バンド分割器300によって生成されるそれらの対応する周波数の範囲は、変化してよい。周波数バンド分割器300によって生成されるサブバンドコンポーネントは、周波数バンド結合器206によるなどの偏りのない完全な加算を可能とする。
(制約のないメッシュネットワークの直交相関変換によるモノラル加算)
オーディオ処理システム100は、サウンドステージの知覚的に重要なコンポーネントを保存するよう設計されている多入力、多出力非線形フィルターバンクを提供し、(ある実施形態において、式(11)によって定義され、式(7)によって定義される線形形式を用いて)、ここで、1つよりも多い出力を用いることによって最適に条件が満たされてよい。これは、オーディオがシングルまたはマルチドライバースピーカーのメッシュに分配されることが可能であり、数や配置に関係なく、そのオーディオ信号の感動的だか、多様な中心の空間経験の再生をいまだに希望することを意味する。異なる非線形の加算は、サブバンドごとに選択されることができて、サブバンドと非線形の加算との間のこれらの接続は、出力ごとに並べ替えられることができる。例えば、4つの非線形の加算(a,b,c,d)は、それぞれ2つのサブバンドで構成される3つの独立した出力を生成することに用いられることができ、(例えば、出力1=[サブバンド1,サブバンド2])次に、それぞれのサブバンドに対する非線形の加算は、出力1=[a,b],出力2=[b,c],出力3=[c,d]を用いることで並べ替えられることができる。最適な条件および構成するサブバンドの数に応じて、これは、結果として多数の固有の信号となり得、それぞれの信号は、同一の知覚全体に対してわずかな変動を含む。それぞれが単独で再生された場合に、拡散信号は、それぞれサウンドステージ全体を再生する。多様なスピーカーのメッシュを用いるように、同時に再生された場合に、拡散信号は、偏りがないが、疑いようもなく空間的な品質を持つようになる。
ある実施形態において、スピーカーのメッシュに対して、MON-OCTを用いて生成される出力のうちの1つがそれぞれのスピーカーに提供されることができる。ある実施形態において、組となる直交コンポーネントは、異なるモノラル出力のチャネルがメッシュのそれぞれのスピーカーに提供されることを用いて、モノラル出力のチャネルを定義する非線形の加算(例えば、それぞれの加算は、式11によって定義されるモノラル出力のチャネルである)を生成することに用いられる。
(例示的なプロセス)
図4は、ある実施形態にかかる、サウンドステージを保全するチャネルの加算のためのプロセス400のフローチャートである。図4に図示されるプロセスは、オーディオ処理システム(例えば、オーディオ処理システム100)のコンポーネントによって実行されることができる。他のエンティティは、他の実施形態における図4のステップのうちのいくつかまたはすべてを実行することができる。実施形態は、異なるステップおよび/または追加のステップを含んでよく、または異なる順序でステップを実行してよい。
オーディオ処理システムは、1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成する405。ある例示において、1組のオーディオ信号コンポーネントは、ステレオオーディオ信号の左部オーディオ信号コンポーネントおよび右部オーディオ信号コンポーネントを含む。回転は、一定角度を用いてよく、または回転角度が時間とともに変化してもよい。左部コンポーネントは、(例えば、ワイドバンドの)左部チャネルを含んでよく、右部コンポーネントは、(例えば、ワイドバンドの)右部チャネルを含んでよい。ある実施形態において、図5を参照してより詳細に説明されるように、左部のコンポーネントは、左部サブバンドコンポーネントを含んでよく、右部コンポーネントは、右部サブバンドコンポーネントを含んでよい。1組のオーディオ信号コンポーネントは、左部チャネルおよび右部チャネルに限定されず、他のタイプのオーディオ信号および組となるオーディオ信号コンポーネントが用いられることができる。
オーディオ処理システムは、第1の回転コンポーネントを用いて互いに位相がずれた左部直交コンポーネントを生成する410。左部直交コンポーネントは、互いに90度の位相関係を有することができる。ある実施形態において、オーディオ処理システムは、第1の回転コンポーネントを用いてある他の位相関係を有するコンポーネントを生成して、これらのコンポーネントは、左部直交コンポーネントに対して本明細書で説明されるような同様の方法で処理されることができる。左部直交コンポーネントは、それぞれが第1の回転コンポーネントとの単一の大きさの関係を有することができる。オーディオ処理システムは、全域通過フィルター機能を適用することができ、第1の回転コンポーネントを用いて左部直交コンポーネントを生成する。
オーディオ処理システムは、第2の回転コンポーネントを用いて互いに位相がずれた右部直交コンポーネントを生成する415。右部直交コンポーネントは、互いに90度の位相関係を有することができる。ある実施形態において、オーディオ処理システムは、第2の回転コンポーネントを用いてある他の位相関係を有するコンポーネントを生成して、これらのコンポーネントは、右部直交コンポーネントに対して本明細書で説明されるような同様の方法で処理されることができる。右部直交コンポーネントは、それぞれが第2の回転コンポーネントとの単一の大きさの関係を有することができる。オーディオ処理システムは、全域通過フィルター機能を適用することができ、第2の回転コンポーネントを用いて右部直交コンポーネントを生成する。
オーディオ処理システムは、左部直交コンポーネントおよび右部直交コンポーネントに基づいて直交相関変換(OCT)コンポーネントを生成し、ここで、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含む420。例えば、オーディオ処理システムは、左部直交コンポーネントに重み付けおよび右部直交コンポーネントに重み付けを適用して、重み付けされた左部直交コンポーネントおよび右部直交コンポーネントを組み合わせ、OCTコンポーネントを生成する。重み付けされた左部直交コンポーネントおよび右部の直交コンポーネントの異なる組み合わせは、異なるOCTコンポーネントを生成することに用いられることができる。OCTコンポーネントの数は、直交コンポーネントの数に対応してよい。それぞれのOCTコンポーネントは、入力信号の左部チャネルおよび右部チャネルからの寄与を含むが、左部チャネルおよび右部チャネルを単純に組み合わせることで結果として生じることとなる負の相関関係にある情報が消失することはない。
オーディオ処理システムは、1つまたは複数のOCTコンポーネントを用いてモノラル出力のチャネルを生成する425。例えば、OCTコンポーネントのうちの1つは、モノラル出力のチャネルとして選択されることができる。別の例示において、出力チャネルは、2つまたはそれより多くのOCTコンポーネントの時間変化する組み合わせを含んでよい。
オーディオ処理システムは、1つまたは複数のスピーカーにモノラル出力のチャネルを提供する430。例えば、モノラル出力のチャネルは、単一のスピーカーシステムのスピーカーに提供されることができ、または多様なスピーカーシステムの多様なスピーカーに提供されることができる。ある実施形態において、異なるモノラル出力のチャネルは、生成され、メッシュの異なるスピーカーに提供されることができる。例えば、それぞれのOCTコンポーネントのうちの1つがそれぞれのスピーカーに提供されることができる。別の例示において、組となるOCTコンポーネントは、メッシュのそれぞれのスピーカーに異なる非線形の加算が提供されることを用いて、非線形の加算を生成することに用いられる。
プロセス400は、左部チャネルおよび右部チャネルを用いて説明されているが、オーディオ信号におけるチャネル数は、変化してよい。90度の位相関係を有する1組の直交コンポーネントは、オーディオ信号のn個のチャネルのそれぞれに対して生成されて、モノラル出力のチャネルは、直交コンポーネントに基づいて生成されることができる。
図5は、ある実施形態にかかる、サブバンド分解を用いてサウンドステージを保全するチャネルの加算のためのプロセス500のフローチャートである。図5に図示されるプロセスは、オーディオ処理システム(例えば、オーディオ処理システム200)のコンポーネントによって実行されることができる。他のエンティティは、他の実施形態における図5のステップのうちのいくつかまたはすべてを実行することができる。実施形態は、異なるステップおよび/または追加のステップを含んでよく、または異なる順序でステップを実行してよい。
オーディオ処理システムは、左部チャネルを左部サブバンドコンポーネントへと分離し、右部チャネルを右部サブバンドコンポーネントへと分離する505。ある例示において、左部チャネルおよび右部チャネルのそれぞれが4つのサブバンドコンポーネントへと分離される。サブバンドの数およびサブバンドの関連する周波数の範囲は、変化してよい。
オーディオ処理システムは、サブバンドごとにサブバンドの左部サブバンドコンポーネントおよびサブバンドの右部サブバンドコンポーネントを用いて、モノラルサブバンドコンポーネントを生成する510。例えば、オーディオ処理システムは、サブバンドごとにプロセス400のステップ405~425を実行することができ、サブバンドに対するモノラルサブバンドコンポーネントを生成する。ある実施形態において、OCTコンポーネントの異なる非線形の加算は、異なるサブバンドに対して選択されることができ、モノラルサブバンドコンポーネントを生成する。最適な条件および構成するサブバンドの数に応じて、これは、結果として多数の固有の信号となり得、それぞれの信号は、同一の知覚全体に対するわずかな変動を含む。
オーディオ処理システムは、それぞれのサブバンドのモノラルサブバンドコンポーネントをモノラル出力のチャネルへと結合する515。例えば、モノラルサブバンドコンポーネントは、モノラル出力のチャネルを生成することを加えることができる。
オーディオ処理システムは、1つまたは複数のスピーカーにモノラル出力のチャネルを提供する520。1つまたは複数のスピーカーは、単一のスピーカー、またはスピーカーのメッシュを含んでよい。ある実施形態において、オーディオ処理システムは、異なるスピーカーに対して異なるモノラル出力のチャネルを提供する。
(例示的なコンピュータ)
図6は、ある実施形態にかかる、コンピュータ600のブロック図である。コンピュータ600は、オーディオ処理システム100または200のようなオーディオ処理システムを実装する回路の例示である。図示されているのは、チップセット604に結合された少なくとも1つのプロセッサ602である。チップセット604は、メモリコントローラーハブ620および入力/出力(I/O)コントローラーハブ622を含む。メモリ606およびグラフィックアダプター612は、メモリコントローラーハブ620に結合されて、ディスプレイデバイス618は、グラフィックアダプター612に結合される。ストレージデバイス608、キーボード610、ポインティングデバイス614、およびネットワークアダプター616は、I/Oコントローラーハブ622に結合されている。コンピュータ600は、さまざまなタイプの入力または出力デバイスを含んでよい。コンピュータ600の他の実施形態は、異なるアーキテクチャを有する。例えば、ある実施形態において、メモリ606は、プロセッサ602に直接結合される。
ストレージデバイス608は、ハードドライブ、コンパクトディスク読み取り専用メモリ(CD-ROM)、DVD、またはソリッドステートメモリデバイスのような1つまたは複数の非一時的なコンピュータ可読記憶媒体を含む。メモリ606は、プロセッサ602によって用いられるプログラムコード(1つまたは複数の命令からなる)およびデータを保持する。プログラムコードは、図1~図5を参照して説明される処理の態様に対応することができる。
ポインティングデバイス614は、コンピュータシステム600へとデータを入力するためにキーボード610と組み合わせて用いられる。グラフィックアダプター612は、画像および他の情報をディスプレイデバイス618に表示する。ある実施形態において、ディスプレイデバイス618は、ユーザー入力および選択を受け取るためのタッチスクリーン機能を含む。ネットワークアダプター616は、コンピュータシステム600をネットワークに結合する。コンピュータ600のある実施形態は、図6に図示されるそれらのものとは異なるおよび/または他のコンポーネントを有する。
ある実施形態において、オーディオ処理システム100または200のようなオーディオ処理システムを実装する回路は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のタイプのコンピューティング回路を含んでよい。
(さらなる検討事項)
実施形態の前述の説明は、説明の目的で提示されており、網羅的であること、または開示された正確な形態に特許権を限定することに意図されていない。関連技術における当業者は、上記の開示を考慮することで、多くの修正例および変形例が可能となることを理解することが可能である。
本説明のある部分は、情報に対する演算のアルゴリズムおよび記号表現の観点から見ると、実施形態を説明している。これらのアルゴリズムの説明および表現は、データ処理技術における当業者によって一般的に用いられ、彼らの仕事の趣旨を効果的に他の当業者に伝える。これらの演算は、機能的、計算的、または論理的に説明されている一方で、コンピュータプログラム、または等価電気回路、マイクロコードなどによって実装されると理解される。さらに、普遍性を消失することなく、時にはこれらの演算の配列をモジュールと称すると便利であることが分かる。説明される演算およびそれらに関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの任意の組み合わせで具現化されてよい。
本明細書で説明される任意のステップ、演算、またはプロセスは、単独または他のデバイスと組み合わせることで、1つまたは複数のハードウェアまたはソフトウェアモジュールを用いて実行または実装されてよい。ある実施形態において、ソフトウェアモジュールは、コンピュータプログラムコードを含むコンピュータ可読媒体を備えるコンピュータプログラム製品を用いて実装され、これは、説明されるステップ、演算、またはプロセスのいずれかまたはすべてを実行するためにコンピュータプロセッサによって実行されることが可能である。
実施形態は、また、本明細書の演算を実行するための装置に関連してよい。本装置は、要求される目的のために特別に構築されてよく、および/または、コンピュータに格納されるコンピュータプログラムによって、選択的にアクティベートされるか、または再構成される汎用コンピューティングデバイスを備えてよい。このようなコンピュータプログラムは、非一時的な有形のコンピュータ可読記憶媒体、または電子命令を格納することに適する任意のタイプの媒体に格納されてよく、これは、コンピュータシステムバスに結合されてよい。さらに、本明細書において言及される任意のコンピューティングシステムは、単一のプロセッサを含んでよく、またはコンピューティング機能を高めるための多様なプロセッサ設計を採用するアーキテクチャであってもよい。
また、実施形態は、本明細書で説明されるコンピューティングプロセスによって生成される製品に関連してよい。このような製品は、コンピューティングプロセスから生じる情報を含んでよく、ここで、情報は、非一時的な有形のコンピュータ可読記憶媒体に格納され、本明細書で説明されるコンピュータプログラム製品または他のデータとの組み合わせの任意の実施形態を含んでよい。
最後に、明細書において用いられる文言は、主に読み易さおよび教育目的のために選択されており、本特許権を描写または制限するために選択されていないことがある。それ故に、本特許権の範囲は、本詳細な説明によってではなく、正しくは、本明細書に基づいた出願で発行される請求項によって制限されることが意図されている。したがって、実施形態の開示は、添付の特許請求の範囲に記載される本特許権の範囲を説明することを意図するものであり、限定することを意図するものではない。

Claims (33)

  1. システムであって、
    1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成し、
    前記第1の回転コンポーネントを用いて、互いに位相がずれている左部直交コンポーネントを生成し、
    前記第2の回転コンポーネントを用いて、互いに位相がずれている右部直交コンポーネントを生成し、
    前記左部直交コンポーネントおよび右部直交コンポーネントに基づいて、直交相関変換(OCT)コンポーネントを生成することであって、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含み、
    1つまたは複数のOCTコンポーネントを用いてモノラル出力のチャネルを生成し、
    前記モノラル出力のチャネルを1つまたは複数のスピーカーに提供するように構成される回路を備える、
    システム。
  2. 前記第1の回転コンポーネントを生成するよう構成される回路は、静的回転角を前記1組のオーディオ信号コンポーネントに適用するよう構成される回路を含む、
    請求項1に記載のシステム。
  3. 前記第1の回転コンポーネントを生成するよう構成される回路は、時間変化する回転角を前記1組のオーディオ信号コンポーネントに適用するよう構成される回路を含む、
    請求項1に記載のシステム。
  4. 前記左部直交コンポーネントは、互いに90度の位相関係を有しており、
    前記右部直交コンポーネントは、互いに90度の位相関係を有する、
    請求項1に記載のシステム。
  5. 前記左部直交コンポーネントは、前記第1の回転コンポーネントとの単一の大きさの関係を有しており、
    前記右部直交コンポーネントは、前記第2の回転コンポーネントとの単一の大きさの関係を有する、
    請求項1に記載のシステム。
  6. 前記OCTコンポーネントを生成するよう構成される回路は、
    第1の左部直交コンポーネントを反転した第2の右部直交コンポーネントと組み合わせて、第1のOCTコンポーネントを生成し、
    第1の左部直交コンポーネントを第2の右部直交コンポーネントと組み合わせて、第2のOCTコンポーネントを生成し、
    第2の左部直交コンポーネントを反転した第1の右部直交コンポーネントと組み合わせて、第3のOCTコンポーネントを生成し、
    第2の左部直交コンポーネントを第1の右部直交コンポーネントと組み合わせて第4のOCTコンポーネントを生成するよう
    構成される回路を含む、
    請求項1に記載のシステム。
  7. 前記モノラル出力のチャネルを生成するよう構成される回路は、前記OCTコンポーネントからOCTコンポーネントを選択するよう構成される回路を含む、
    請求項1に記載のシステム。
  8. 前記モノラル出力のチャネルを生成するよう構成される回路は、2つまたはそれより多くのOCTコンポーネントの時間変化する組み合わせを生成するよう構成される回路を含む、
    請求項1に記載のシステム。
  9. 前記2つまたはそれより多くのOCTコンポーネントの前記時間変化する組み合わせは、オーディオ信号の機能を入力として用いる勾配制限機能に依拠する、
    請求項8に記載のシステム。
  10. 前記モノラル出力のチャネルを生成するよう構成される回路は、前記OCTコンポーネントの第1の組の非線形の加算を決定するよう構成される回路を含み、
    前記モノラル出力のチャネルを前記1つまたは複数のスピーカーに提供するよう構成される前記回路は、前記モノラル出力のチャネルを第1のスピーカーに提供するよう構成される回路を含み、
    前記回路は、
    前記OCTコンポーネントの第2の組の非線形の加算を決定することによって、別のモノラル出力のチャネルを生成することであって、前記OCTコンポーネントの第1の組および第2の組は異なり、
    前記別のモノラル出力のチャネルを第2のスピーカーに提供するようさらに構成される、
    請求項1に記載のシステム。
  11. 第1のオーディオコンポーネントは、オーディオ信号の第1のサブバンドの左部サブバンドコンポーネントであり、第2のオーディオコンポーネントは、前記第1のサブバンドの右部サブバンドコンポーネントであり、
    前記OCTコンポーネントは、前記第1のサブバンドであり、
    前記モノラル出力のチャネルを生成するよう構成される前記回路は、
    前記1つまたは複数の前記OCTコンポーネントを前記オーディオ信号の第2のサブバンドのうちの1つまたは複数の他のOCTコンポーネントと組み合わせるよう構成される回路を含む、
    請求項1に記載のシステム。
  12. 方法であって、回路によって、
    1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成するステップと、
    前記第1の回転コンポーネントを用いて、互いに位相がずれている左部直交コンポーネントを生成するステップと、
    前記第2の回転コンポーネントを用いて、互いに位相がずれている右部直交コンポーネントを生成するステップと、
    前記左部直交コンポーネントおよび右部直交コンポーネントに基づいて、直交相関変換(OCT)コンポーネントを生成するステップであって、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含むステップと、
    1つまたは複数の前記OCTコンポーネントを用いてモノラル出力のチャネルを生成するステップと、
    前記モノラル出力のチャネルを1つまたは複数のスピーカーに提供するステップとを備える、
    方法。
  13. 前記第1の回転コンポーネントを生成するステップは、静的回転角を前記1組のオーディオ信号コンポーネントに適用するステップを含む、
    請求項12に記載の方法。
  14. 前記第1の回転コンポーネントを生成するステップは、前記1組のオーディオ信号コンポーネントに時間変化する回転角を適用するステップを含む、
    請求項12に記載の方法。
  15. 前記左部直交コンポーネントは、互いに90度の位相関係を有しており、
    前記右部直交コンポーネントは、互いに90度の位相関係を有する、
    請求項12に記載の方法。
  16. 前記左部直交コンポーネントは、前記第1の回転コンポーネントとの単一の大きさの関係を有しており、
    前記右部直交コンポーネントは、前記第2の回転コンポーネントとの単一の大きさの関係を有する、
    請求項12に記載の方法。
  17. 前記OCTコンポーネントを生成するステップは、
    第1の左部直交コンポーネントを反転した第2の右部直交コンポーネントと組み合わせて、第1のOCTコンポーネントを生成するステップと、
    第1の左部直交コンポーネントを第2の右部直交コンポーネントと組み合わせて、第2のOCTコンポーネントを生成するステップと、
    第2の左部直交コンポーネントを反転した第1の右部直交コンポーネントと組み合わせて、第3のOCTコンポーネントを生成するステップと、
    第2の左部直交コンポーネントを第1の右部直交コンポーネントと組み合わせて第4のOCTコンポーネントを生成するステップとを含む、
    請求項12に記載の方法。
  18. 前記モノラル出力のチャネルを生成するステップは、前記OCTコンポーネントからOCTコンポーネントを選択するステップを含む、
    請求項12に記載の方法。
  19. 前記モノラル出力のチャネルを生成するステップは、2つまたはそれより多くのOCTコンポーネントの時間変化する組み合わせを生成するステップを含む、
    請求項12に記載の方法。
  20. 前記2つまたはそれより多くのOCTコンポーネントの前記時間変化する組み合わせは、オーディオ信号の機能を入力として用いる勾配制限機能に依拠する、
    請求項19に記載の方法。
  21. 前記モノラル出力のチャネルを生成するステップは、前記OCTコンポーネントの第1の組の非線形の加算を決定するステップを含み、
    前記モノラル出力のチャネルを前記1つまたは複数のスピーカーに提供するステップは、前記モノラル出力のチャネルを第1のスピーカーに提供するステップを含み、
    前記方法は、
    前記OCTコンポーネントの第2の組の非線形の加算を決定するステップによって、別のモノラル出力のチャネルを生成するステップであって、前記OCTコンポーネントの第1の組および第2の組は異なるステップと、
    前記別のモノラル出力のチャネルを第2のスピーカーに提供するステップとをさらに備える、
    請求項12に記載の方法。
  22. 第1のオーディオコンポーネントは、オーディオ信号の第1のサブバンドの左部サブバンドコンポーネントであり、第2のオーディオコンポーネントは、前記第1のサブバンドの右部サブバンドコンポーネントであり、
    前記OCTコンポーネントは、前記第1のサブバンドであり、
    前記モノラル出力のチャネルを生成するステップは、前記1つまたは複数の前記OCTコンポーネントを前記オーディオ信号の第2のサブバンドのうちの1つまたは複数の他のOCTコンポーネントと組み合わせるステップを含む、
    請求項12に記載の方法。
  23. 非一時的なコンピュータ可読媒体であって、少なくとも1つのプロセッサによって実行された場合に、少なくとも1つのプロセッサに、
    1組のオーディオ信号コンポーネントを回転させることによって、第1の回転コンポーネントおよび第2の回転コンポーネントを生成し、
    前記第1の回転コンポーネントを用いて、互いに位相がずれている左部直交コンポーネントを生成し、
    前記第2の回転コンポーネントを用いて、互いに位相がずれている右部直交コンポーネントを生成し、
    前記左部直交コンポーネントおよび右部直交コンポーネントに基づいて、直交相関変換(OCT)コンポーネントを生成することであって、それぞれのOCTコンポーネントは、左部直交コンポーネントおよび右部直交コンポーネントの重み付けされた組み合わせを含み、
    1つまたは複数の前記OCTコンポーネントを用いてモノラル出力のチャネルを生成し、
    前記モノラル出力のチャネルを1つまたは複数のスピーカーに提供するように構成する命令を格納する、
    非一時的なコンピュータ可読媒体。
  24. 前記少なくとも1つのプロセッサを前記第1の回転コンポーネントを生成するよう構成する前記命令は、前記少なくとも1つのプロセッサが前記1組のオーディオ信号コンポーネントに静的回転角を適用するよう構成する命令を含む、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  25. 前記少なくとも1つのプロセッサを前記第1の回転コンポーネントを生成するよう構成する前記命令は、前記少なくとも1つのプロセッサが前記1組のオーディオ信号コンポーネントに時間変化する回転角を適用するよう構成する命令を含む、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  26. 前記左部直交コンポーネントは、互いに90度の位相関係を有しており、
    前記右部直交コンポーネントは、互いに90度の位相関係を有する、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  27. 前記左部直交コンポーネントは、前記第1の回転コンポーネントとの単一の大きさの関係を有しており、
    前記右部直交コンポーネントは、前記第2の回転コンポーネントとの単一の大きさの関係を有する、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  28. 前記OCTコンポーネントを生成するよう前記少なくとも1つのプロセッサを構成する前記命令は、前記少なくとも1つのプロセッサに、
    第1の左部直交コンポーネントを反転した第2の右部直交コンポーネントと組み合わせて、第1のOCTコンポーネントを生成し、
    第1の左部直交コンポーネントを第2の右部直交コンポーネントと組み合わせて、第2のOCTコンポーネントを生成し、
    第2の左部直交コンポーネントを反転した第1の右部直交コンポーネントと組み合わせて、第3のOCTコンポーネントを生成し、
    第2の左部直交コンポーネントを第1の右部直交コンポーネントと組み合わせて第4のOCTコンポーネントを生成するよう構成する命令を含む、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  29. 前記モノラル出力のチャネルを生成するよう前記少なくとも1つのプロセッサを構成する前記命令は、前記OCTコンポーネントからOCTコンポーネントを選択するよう前記少なくとも1つのプロセッサを構成する命令を含む、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  30. 前記モノラル出力のチャネルを生成するよう前記少なくとも1つのプロセッサを構成する前記命令は、2つまたはそれより多くのOCTコンポーネントの時間変化する組み合わせを生成するよう前記少なくとも1つのプロセッサを構成する命令を含む、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  31. 前記2つまたはそれより多くのOCTコンポーネントの時間変化する組み合わせは、オーディオ信号の機能を入力として用いる勾配制限機能に依拠する、
    請求項30に記載の非一時的なコンピュータ可読媒体。
  32. 前記モノラル出力のチャネルを生成するよう前記少なくとも1つのプロセッサを構成する前記命令は、前記OCTコンポーネントの第1の組の非線形の加算を決定するよう前記少なくとも1つのプロセッサを構成する命令を含み、
    前記モノラル出力のチャネルを前記1つまたは複数のスピーカーに提供するよう前記少なくとも1つのプロセッサを構成する前記命令は、前記モノラル出力のチャネルを第1のスピーカーに提供するよう前記少なくとも1つのプロセッサを構成する命令を含み、
    前記命令は、前記少なくとも1つのプロセッサに、
    前記OCTコンポーネントの第2の組の非線形の加算を決定することによって、別のモノラル出力のチャネルを生成することであって、前記OCTコンポーネントの第1の組および第2の組は異なり、
    前記別のモノラル出力のチャネルを第2のスピーカーに提供するようさらに構成する、
    請求項23に記載の非一時的なコンピュータ可読媒体。
  33. 第1のオーディオコンポーネントは、オーディオ信号の第1のサブバンドの左部サブバンドコンポーネントであり、第2のオーディオコンポーネントは、前記第1のサブバンドの右部サブバンドコンポーネントであり、
    前記OCTコンポーネントは、前記第1のサブバンドであり、
    前記モノラル出力のチャネルを生成するよう前記少なくとも1つのプロセッサを構成する前記命令は、前記1つまたは複数の前記OCTコンポーネントを前記オーディオ信号の第2のサブバンドうちの1つまたは複数の他のOCTコンポーネントと組み合わせるよう前記少なくとも1つのプロセッサを構成する命令を含む、
    請求項23に記載の非一時的なコンピュータ可読媒体。
JP2021540183A 2019-01-11 2020-01-10 サウンドステージを保全するオーディオチャネルの加算 Active JP7038921B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962791626P 2019-01-11 2019-01-11
US62/791,626 2019-01-11
PCT/US2020/013223 WO2020146827A1 (en) 2019-01-11 2020-01-10 Soundstage-conserving audio channel summation

Publications (2)

Publication Number Publication Date
JP2022516374A JP2022516374A (ja) 2022-02-25
JP7038921B2 true JP7038921B2 (ja) 2022-03-18

Family

ID=71517024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021540183A Active JP7038921B2 (ja) 2019-01-11 2020-01-10 サウンドステージを保全するオーディオチャネルの加算

Country Status (7)

Country Link
US (1) US10993061B2 (ja)
EP (1) EP3891737B1 (ja)
JP (1) JP7038921B2 (ja)
KR (1) KR102374934B1 (ja)
CN (1) CN113316941B (ja)
TW (1) TWI727605B (ja)
WO (1) WO2020146827A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006518482A (ja) 2003-02-11 2006-08-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
US20100131278A1 (en) 2008-11-21 2010-05-27 Polycom, Inc. Stereo to Mono Conversion for Voice Conferencing
JP2010540985A (ja) 2007-09-19 2010-12-24 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・オーディオのジョイント強化
US20110142155A1 (en) 2009-12-15 2011-06-16 Stmicroelectronics Pvt. Ltd. Quadrature signal decoding using a driver
WO2014044812A1 (en) 2012-09-21 2014-03-27 Dolby International Ab Coding of a sound field signal
WO2015000819A1 (en) 2013-07-05 2015-01-08 Dolby International Ab Enhanced soundfield coding using parametric component generation

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1606797B1 (en) * 2003-03-17 2010-11-03 Koninklijke Philips Electronics N.V. Processing of multi-channel signals
US7899191B2 (en) * 2004-03-12 2011-03-01 Nokia Corporation Synthesizing a mono audio signal
NO328256B1 (no) * 2004-12-29 2010-01-18 Tandberg Telecom As Audiosystem
BRPI0607303A2 (pt) * 2005-01-26 2009-08-25 Matsushita Electric Ind Co Ltd dispositivo de codificação de voz e método de codificar voz
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP3369093A4 (en) 2015-10-27 2019-07-17 Zalon, Zack J. AUDIO CONTENTS, AUDIOSISQUENCING, AUDIO SYSTEM AND METHOD
BR112018014724B1 (pt) 2016-01-19 2020-11-24 Boomcloud 360, Inc Metodo, sistema de processamento de audio e midia legivel por computador nao transitoria configurada para armazenar o metodo

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006518482A (ja) 2003-02-11 2006-08-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
JP2010540985A (ja) 2007-09-19 2010-12-24 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・オーディオのジョイント強化
US20100131278A1 (en) 2008-11-21 2010-05-27 Polycom, Inc. Stereo to Mono Conversion for Voice Conferencing
US20110142155A1 (en) 2009-12-15 2011-06-16 Stmicroelectronics Pvt. Ltd. Quadrature signal decoding using a driver
WO2014044812A1 (en) 2012-09-21 2014-03-27 Dolby International Ab Coding of a sound field signal
WO2015000819A1 (en) 2013-07-05 2015-01-08 Dolby International Ab Enhanced soundfield coding using parametric component generation

Also Published As

Publication number Publication date
TWI727605B (zh) 2021-05-11
EP3891737A4 (en) 2022-08-31
CN113316941A (zh) 2021-08-27
WO2020146827A1 (en) 2020-07-16
TW202034307A (zh) 2020-09-16
KR102374934B1 (ko) 2022-03-15
JP2022516374A (ja) 2022-02-25
KR20210102993A (ko) 2021-08-20
US10993061B2 (en) 2021-04-27
CN113316941B (zh) 2022-07-26
EP3891737B1 (en) 2024-07-03
US20200228910A1 (en) 2020-07-16
EP3891737A1 (en) 2021-10-13

Similar Documents

Publication Publication Date Title
Avni et al. Spatial perception of sound fields recorded by spherical microphone arrays with varying spatial resolution
US20220408188A1 (en) Spectrally orthogonal audio component processing
KR102578008B1 (ko) 심리음향적 주파수 범위 확장을 위한 비선형 적응성 필터뱅크
TWI787586B (zh) 用於空間音訊信號之串音處理之頻譜缺陷補償
Kassakian Convex approximation and optimization with applications in magnitude filter design and radiation pattern synthesis
Bai et al. Development and implementation of cross-talk cancellation system in spatial audio reproduction based on subband filtering
JP7038921B2 (ja) サウンドステージを保全するオーディオチャネルの加算
US20120020483A1 (en) System and method for robust audio spatialization using frequency separation
EP4278348A1 (en) All-pass network system for colorless decorrelation with constraints
Brunnström et al. Sound zone control for arbitrary sound field reproduction methods
CN117616780A (zh) 用于心理声学频率范围扩展的使用尺度依赖非线性的自适应滤波器组
JP2024526758A (ja) 音響心理学的周波数範囲拡張のためのスケール依存非線形性を使用する適応フィルタバンク
EP4327324A1 (en) Colorless generation of elevation perceptual cues using all-pass filter networks
Giller Implementation of a Super-Resolution Ambisonics-to-Binaural Rendering Plug-In

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210928

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210928

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220308

R150 Certificate of patent or registration of utility model

Ref document number: 7038921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150