JP7345460B2 - 3dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニング - Google Patents

3dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニング Download PDF

Info

Publication number
JP7345460B2
JP7345460B2 JP2020522308A JP2020522308A JP7345460B2 JP 7345460 B2 JP7345460 B2 JP 7345460B2 JP 2020522308 A JP2020522308 A JP 2020522308A JP 2020522308 A JP2020522308 A JP 2020522308A JP 7345460 B2 JP7345460 B2 JP 7345460B2
Authority
JP
Japan
Prior art keywords
sound
audio
sound source
crosstalk cancellation
binaural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020522308A
Other languages
English (en)
Other versions
JP2021500803A (ja
Inventor
テギョン ノー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS Inc
Original Assignee
DTS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DTS Inc filed Critical DTS Inc
Publication of JP2021500803A publication Critical patent/JP2021500803A/ja
Application granted granted Critical
Publication of JP7345460B2 publication Critical patent/JP7345460B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Description

(関連出願及び優先権の主張)
本出願は、全体が引用により本明細書に組み入られる、名称が「ラウドスピーカを用いた3Dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニングのシステム及び方法」の2017年10月18日に出願された米国仮出願第62/573,966号明細書に関し、これに対する優先権を主張するものである。
本明細書に記載される技術は、ラウドスピーカサウンド再生システムのオーディオ信号プレコンディショニングのためのシステム及び方法に関する。
3Dオーディオバーチャライザは、個々のオーディオ信号が様々な位置(例えば3D空間に定位される)から生じているという知覚を生成するのに用いることができる。3Dオーディオバーチャライザは、複数のラウドスピーカを用いるか又はヘッドフォンを用いてオーディオを再生する際に用いることができる。3Dオーディオバーチャライゼーションの一部の技術は、頭部伝達関数(HRTF)バイノーラル合成及びクロストークキャンセレーションを含む。HRTFバイノーラル合成は、耳、頭、及び他の身体的特徴によってサウンドがどのように変換されるかを再現することによってヘッドフォン又はラウドスピーカ3Dバーチャライゼーションで用いられる。ラウドスピーカからのサウンドが両耳に送られるので、クロストークキャンセレーションを用いて、左のスピーカからのサウンドが右の耳に到達するなど、1つのラウドスピーカからのサウンドが反対の耳に到達するのを低減又は排除する。ラウドスピーカからのオーディオ信号が3D空間において正しく定位されるという知覚を生成するために、クロストークキャンセレーションを用いて、サウンドの音響クロストークを低減又は排除して、リスナーの耳にて音源が中和できるようにする。クロストークキャンセレーションの目標は、音源が意図した位置から生じるかのように、3D空間においてバイノーラルで合成又はバイノーラルで録音されたサウンドを表現することであるが、実際の課題(例えば、リスナーの位置、クロストークキャンセレーション設計とは異なる音響環境)により、完璧なクロストークキャンセレーションを達成することは極めて難しい。この不完全なクロストークキャンセレーションは、不正確なバーチャライゼーションをもたらす可能性があり、ローカライゼーションエラー、望ましくない音色及びラウドネス変化、及び正しくない音場表現を生じる場合がある。必要とされるのは、3Dオーディオバーチャライゼーションに対する改善されたクロストークキャンセレーションである。
米国特許第5,974,380号明細書 米国特許第5,978,762号明細書 米国特許第6,487,535号明細書
例示的な実施形態による、オリジナルラウドネスの棒グラフを示す図である。 例示的な実施形態による、第1クロストークキャンセレーションラウドネスの棒グラフを示す図である。 例示的な実施形態による、第2CTCラウドネスの棒グラフを示す図である。 例示的な実施形態による、CTCラウドネスの折れ線グラフを示す図である。 例示的な実施形態による、プレコンディショニングラウドスピーカベースのバーチャライゼーションシステムを示すブロック図である。 例示的な実施形態による、プレコンディショニング及びバイノーラル合成ラウドスピーカベースのバーチャライゼーションシステムを示すブロック図である。 例示的な実施形態による、プレコンディショニング及びバイノーラル合成パラメトリックバーチャライゼーションシステムを示すブロック図である。
本発明の主題は、3Dオーディオバーチャライゼーションのクロストークキャンセレーションが直面する技術的問題に対する技術的解決策を提供する。1つの技術的解決策は、クロストークキャンセレーション特性に基づいて、及び3D空間の意図した位置でのサウンドソースの特徴に基づいて、オーディオ信号をプレコンディショングするステップを含む。この解決策は、3D音源のバーチャライゼーションの全体精度を改善し、正しくないローカライゼーション、チャネル間サウンドレベルインバランス、又は意図したものよりも高い又は低いサウンドレベルなどのオーディオアーティファクトを低減又は排除する。クロストークキャンセレーションに加えて、この技術的解決策はまた、バイノーラル合成及びクロストークキャンセレーションの組み合わされたカラーレーション及びラウドネス差を正確に考慮に入れたバイノーラルサウンドの改善された表現を提供する。改善されたバイノーラルサウンド表現に加えて、この解決策は、任意の環境における任意の再生システムに任意のリスナーの大幅に改善されたクロストークキャンセラを提供することによって、高度な融通性を提供する。例えば、この技術的解決策は、個人の頭部伝達関数(HRTF)のバリエーション、オーディオ再生のバリエーション(例えば、拡散又はフリーフィールド)、リスナー位置又はリスナーの数のバリエーション、又は再生デバイスのスペクトル応答のバリエーションに関わらず、大幅に改善されたクロストークキャンセレーションを提供する。
これらの技術的解決策を提供するために、本明細書で記載されるシステム及び方法は、オーディオバーチャライザ及びオーディオプレコンディショナを含む。詳細には、オーディオバーチャライザはクロストークキャンセラを含み、オーディオプレコンディショナは、クロストークキャンセレーションシステムの特性に基づき且つバイノーラル合成システムの特徴又は空間における意図された入力ソース位置に基づいて、オーディオ信号をプレコンディショニングする。本明細書で記載されるシステム及び方法は様々な利点を提供する。1つの実施形態では、バーチャライゼーションの改善された精度を達成することに加えて、本明細書で記載されるシステム及び方法は、クロストークキャンセラ又はクロストークキャンセラのフィルタを異なるバイノーラル合成フィルタのために再設計する必要がなく、代わりに、タップ及び利得を実施するために修正フィルタを活用する。別の利点は、入力チャネルの数を修正する能力、資源が制限される場合は値のグループを修正する能力、又は周波数ビンの数に基づいて周波数依存又は周波数に依存しないを修正する能力などを提供するシステム設計及びコンピューテーション資源の複雑さのスケーラビリティを含む。追加の利点は、オーディオソース位置、フィルタ応答、又はCTC方位角又はエレベーションを考慮するものを含む、様々な特定及び正規化クロストークキャンセラを解決策に提供する能力である。追加の利点は、様々な再生デバイス又は再生環境に対して融通性のあるチューニングを提供する能力であり、融通性のあるチューニングは、ユーザによって、相手先商標製品製造会社(OEM)によって、或いは別のパーティによって提供することができる。これらのシステム及び方法は、テレビジョン、サウンドバー、Bluetoothスピーカ、ラップトップ、タブレット、デスクトップコンピュータ、携帯電話、及び他のA/V製品を含む様々なオーディオ/ビデオ(A/V)製品における3Dオーディオバーチャライゼーションに改善されたクロストークキャンセレーションを提供することができる。
添付図面に関して以下に記載される詳細な説明は、本発明の主題の現在のところ好ましい実施形態の説明として意図するものであり、本発明の主題を構築又は利用できる唯一の形態を表すことを意図するものではない。本説明は、例証する実施形態に関して本発明の主題を構築し動作させる機能及びステップシーケンスを示す。同じ又は同等の機能及びシーケンスは、本発明の主題の範囲内に包含されるものとする異なる実施形態によって達成できる点を理解されたい。更に、関係を示す用語(例えば、第1、第2)の使用は、単に1つの構成要素を別の構成要素から区別するためだけに用いられ、何れかの実際のこのような関係又はこのような構成要素間の順序を必ずしも必要とするか又は示唆するものではない点を理解されたい。
図1は、例示的な実施形態による、オリジナルラウドネスの棒グラフ100を含む。グラフ100は、様々なオーディオソース方向(例えば、スピーカ位置)のオリジナル(例えば、未処理)のサウンドソースレベルを示す。各オーディオソース方向は、方位角及びエレベーション(elevation)によってリスナーに対して記述される。例えば、中心チャネル110は、0°方位角及び0°エレベーションにてリスナーの真正面に存在するが、上部後方左チャネル120は、145°方位角(例えば、中心から反時計方向に145°回転した)及び45°エレベーションにある。サウンドソースレベルは、各位置からの自然なサウンドレベルを表し、B加重との各方位角及びエレベーション角度の同側及び対側HRTFのパワーの和に基づいて計算される。様々な位置でのサウンドレベル間の差は、各オーディオソース方向からの異なる音色及びサウンドレベルに起因する。図1に示した未処理のサウンドソースレベルとは対照的に、バイノーラル合成サウンドは、図2及び図3に示すような関連の異なる音色及びサウンドレベルを有することになる。
図2は、例示的な実施形態による、第1クロストークキャンセレーションラウドネスの棒グラフ200を含む。各サウンドソース位置に対して、グラフ200は、オリジナルラウドネス210とクロストークキャンセレーション(CTC)によるラウドネス220の両方を示す。グラフ200に示した実施形態では、クロストークキャンセレーション220は、15°方位角及び0°エレベーションでのデバイスに向けて設計されている。図2から分かるように、オリジナルラウドネス210は、各サウンドソース位置に対するCTCによるラウドネス220よりも大きい。グラフ200は、音響クロストークキャンセレーションを含まないので、ラウドネスの差は、リスナーの両耳で全く同じではないが、それでも、各サウンドソースについてのラウドネスの差は、様々なサウンドソース位置の間で変化することは明らかである。ラウドネスの差のこの変動は、単一利得補償では、異なるサウンドソース位置におけるサウンドソースのラウドネスがオリジナルラウドネスレベルにまで回復しないことを示している。例えば、9dBのオーディオ利得は、中心チャネルのラウドネスを回復できるが、9dBの同じオーディオ利得は、グラフ200に示された他のチャネルを過度に補償することになる。
図3は、例示的な実施形態による、第2CTCラウドネスの棒グラフ300を含む。図2と同様に、図3は、オリジナルラウドネス310とCTCによるラウドネス320の両方を示しているが、CTCによるラウドネス320は、5°方位角及び0°エレベーションでのデバイスに向けて設計されている。図2と同様に、オリジナルラウドネス310は、各サウンドソース位置でのCTCによるラウドネス320よりも大きく、オリジナルラウドネス310とクロストークキャンセレーション320の間の変動は、各サウンドソース位置で異なるので、単一利得補償は、様々なサウンドソース位置においてサウンドソースのラウドネスを回復しないことになる。
単一利得補償の使用とは対照的に、本明細書で記載される技術的解決策は、別個の位置におけるCTCシステムとサウンドソースの両方の特徴を考慮した補償を提供する。これらの解決策は、カラーレーション(coloration)及びラウドネスの差を補償しながら、3D空間でのオリジナルサウンドソースの音色及びラウドネスを維持する。詳細には、これらの解決策は、クロストークキャンセラの前に実行される信号プレコンディショニング(例えば、フィルタプレコンディショニング)を含み、ここで信号プレコンディショニングは、クロストークキャンセラのスペクトル応答と、空間におけるバイノーラル合成システム又は意図した入力ソース位置の特徴との両方に基づいている。この信号プレコンディショニングは、バイノーラル合成及びクロストークキャンセレーション特性を決定するためのシステム全体の事前分析を含む。この事前分析は、オーディオ信号処理中又は処理の前に適用されるCTCデータセットを生成する。様々な実施形態では、生成されたCTCデータセットは、バイノーラル合成フィルタ又はシステムに組み込むことができる。例えば、バイノーラル合成システムは、生成されたCTCデータセットに基づいてバイノーラル合成及びクロストークキャンセレーション特性を実装するハードウェアとソフトウェアデバイスの組み合わせを含むことができる。プレコンディショニングのためのこの事前分析の実施例は、図4に関して記載されるようなラウドネス分析である。
図4は、例示的な実施形態による、CTCラウドネスの折れ線グラフ400を含む。上述のように、各方位角での単一利得値は、様々な意図した位置での様々なCTC及びサウンドソースについてのパワー又はラウドネスの差異を正確に補償することはできない。折れ線グラフ400は、別個の位置にあるサウンドソースに対するラウドネス値の曲線(例えば、軌跡)を示す。注目すべきは、CTCの方位角が増大したときに、ラウドネスの相対的変化(例えば、ラウドネスデルタ)は一貫していない。曲線及びラウドネスデルタはまた、クロストークキャンセラのエレベーションパラメータが変化したときに異なる。これらの非一貫性に対処するための例示的システムが、以下の図6-7に示されている。
図5は、例示的な実施形態による、プレコンディショニングラウドスピーカベースのバーチャライゼーションシステム500のブロック図である。別個の位置におけるサウンドソース間の非一貫性に対処するために、本発明の解決策は、CTCフィルタHx(A、E)の各セットに対して別個のオフセット値を使用し、ここで各CTCフィルタHx(A,E)は、方位角「A」及びエレベーション「E」でのサウンドソースの各々に対応する。図5に示すように、システム500は、CTCシステム及び利得補償アレイ520内の信号入力特性510を用いて、CTCフィルタHx(A,E)530を生成する。利得補償アレイ520は、音色を補償するために周波数依存利得補償アレイを含むことができ、又は周波数に依存しない利得補償アレイを含むことができる。CTCフィルタHx(A,E)530は、対応する利得Gによって各ソース信号SRC540を修正して、以下の式1に示すような、補償された信号SRC’550を生成することができる。
Figure 0007345460000001
SRC’550は、クロストークキャンセレーション560に提供される補償された信号であり、SRC540はオリジナルサウンドソース、Gは、サウンドソースの所与の方位角及びエレベーション(例えば、As及びEs)及びCTC(例えば、Ac及びEc)に対する定量化パワー差(例えば、利得)、及びWKは加重値である。入力補償信号SRC’550に基づいて、クロストークキャンセレーション560は、第1及び第2出力サウンドチャネルを含むバイノーラルサウンド出力570を生成する。クロストークキャンセレーション560はまた、オーディオ特性化フィードバック580を利得補償アレイ520に提供することができ、ここでオーディオ特性化フィードバック580は、CTC方位角及びエレベーション情報、各ラウドスピーカ(例えばサウンドソース)までの距離、リスナー位置、又は他の情報を含むことができる。利得補償アレイ520は、オーディオ特性化フィードバック580を用いて、CTCフィルタHx(A,E)530によって提供される補償を改善することができる。
図6は、例示的な実施形態による、プレコンディショニング及びバイノーラル合成ラウドスピーカベースのバーチャライゼーションシステム600のブロック図である。システム500と同様に、システム600は、CTCシステム特性及び信号入力特性を入力が記述する事前計算データモジュールによるプレコンディショニング処理を示す。システム500とは対照的に、システム600は、システム応答が公知であるように追加のバイノーラル合成645を含み、バイノーラル合成は、CTCシステム及び信号入力特性610を利得補償アレイ620に提供して、CTCフィルタHx(A,E)630を生成する。利得補償アレイ620は、音色を補償するための周波数依存利得補償アレイを含むことができ、又は周波数に依存しない利得補償アレイを含むことができる。CTCフィルタHx(A,E)630は、対応する利得Gによって各ソース信号SRC640を修正し、式1に示すように補償された信号SRC’650を生成することができる。入力補償信号SRC’650に基づいて、クロストークキャンセレーション660は、第1及び第2出力サウンドチャネルを含むバイノーラルサウンド出力670を生成する。クロストークキャンセレーション660はまた、オーディオ特性化フィードバック680を利得補償アレイ620に提供することができ、ここで利得補償アレイ620は、オーディオ特性化フィードバック680を用いてCTCフィルタHx(A,E)630によって提供される補償を改善することができる。
図7は、例示的な実施形態による、プレコンディショニング及びバイノーラル合成パラメトリックバーチャライゼーションシステム700のブロック図である。システム500及びシステム600は各入力信号の単一利得を含むが、システム700はラウドネスの利得コンディショニングに対して追加の選択肢を提供する。特にシステム700は、パラメータ補償アレイ720及びデバイス又は再生チューニングパラメータ725を含むことができる。パラメータ補償アレイ720は、音色を補償する周波数依存パラメータ補償アレイを含むことができるか、又は周波数に依存しないパラメータ補償アレイを含むことができる。再生チューニングパラメータ725は、ユーザ、サウンドエンジニア、マイクロフォンベースのオーディオ監査アプリケーション、又は他の入力によって提供することができる。再生チューニングパラメータ725は、特定の位置の部屋固有の反射を補償するためにオーディオ応答を修正するような利得を調整する能力を提供する。図2及び図3に示した実施形態では、再生チューニングパラメータ725は、オリジナルラウドネス(210、310)とCTCによるラウドネス(220、320)の間の一致を改善する能力を提供する。再生チューニングパラメータ725はユーザ(例えばパラメータを修正すること)によって直接提供することができるか、又はプログラマアクセス可能アプリケーションプログラミングインタフェース(API)を介してデジタル信号プロセッサ(DSP)内で実施することができる。
再生チューニングパラメータ725を用いて、修正されたCTCフィルタHx´(A,E)730を生成することができ、これを用いて対応する利得Gによって各ソース信号SRC740を修正して式1に示すように補償された信号SRC’750を生成することができる。入力補償信号SRC’750に基づいて、クロストークキャンセレーション760は第1及び第2出力サウンドチャネルを含むバイノーラルサウンド出力770を生成する。クロストークキャンセレーション760はまた、オーディオ特性化フィードバック780を利得補償アレイ720に提供することができ、利得補償アレイ720がオーディオ特性化フィードバック780を用いてパラメータ補償アレイ720によって提供された補償を改善することができる。
本明細書で記載されるように、オーディオソースは、複数のオーディオ信号(すなわち、物理的サウンドを表す信号)を含むことができる。これらのオーディオ信号は、デジタル電子信号によって表される。これらのオーディオ信号はアナログとすることができるが、本発明の主題の典型的な実施形態は、時系列のデジタルバイト又はワードとの関連において動作し、これらのバイト又はワードがアナログ信号の離散的近似又は最終的には物理的サウンドを形成する。離散的デジタル信号は、定期的にサンプリングされたオーディオ波形のデジタル表現に対応する。均一なサンプリングでは、波形は、関心のある周波数のナイキストサンプリング定理を満足させるのに十分な速度で又はこれよりも高い速度でサンプリングされる。典型的な実施形態では、1秒当たり約44,100サンプルの均一なサンプリングレート(例えば、44.1kHz)を用いることができるが、高サンプリングレート(例えば、96kHz、128kHz)を代わりに用いることもできる。定量化方式及びビット解像度は、標準的なデジタル信号処理技術に従って特定の応用の要件を満足させるように選択する必要がある。本発明の主題の技術及び装置は、典型的には複数のチャネルで互いに依存し合って適用されることになる。例えば、「サラウンド」オーディオシステム(例えば、2より多いチャネルを有する)の関連で用いることができる。
本明細書で用いる「デジタルオーディオ信号」又は「オーディオ信号」は、単なる数学的な抽象的概念を表すのではなく、代わりに機械又は装置により検出可能な物理的媒体にて具現化され又はこれによって搬送される情報を示す。これらの用語は、記録又は送信される信号を含み、パルスコード変調(PCM)又は他の符号化を含む何れの形式の符号化による伝達を含むものと理解すべきである。出力、入力、又は中間オーディオ信号は、MPEG、ATRAC、AC3、又は米国特許第5,974,380号、5,978,762号、及び6,487,535号に記載されるDTS社所有の方法を含む、様々な既知の方法の何れかによって符号化又は圧縮することができる。計算の一部の修正は、当業者には明らかなように、特定の圧縮又は符号化方法に対応するために必要となる場合がある。
ソフトウェアでは、オーディオ「コーデック」は、所与のオーディオファイルフォーマット又はストリーミングオーディオフォーマットに従ってデジタルオーディオデータをフォーマット化するコンピュータプログラムを含む。多くのコーデックが、QuickTimeプレーヤ、XMMS、Winamp、Windowsメディアプレーヤ、ProLogic、又は他のコーデックなどの1又は2以上のマルチメディアプレーヤに接続するライブラリとして実装される。ハードウェアでは、オーディオコーデックは、アナログオーディオをデジタル信号として符号化してデジタルをアナログに復号する1又は2以上のデバイスを指す。換言すると、コーデックは、共通クロックで動作するアナログ-デジタルコンバータ(ADC)及びデジタル-アナログコンバータ(DAC)の両方を包含する。
オーディオコーデックは、DVDプレーヤ、Blu-Rayプレーヤ、TVチューナ、CDプレーヤ、手持ち式プレーヤ、インターネットオーディオ/ビデオデバイス、ゲームコンソール、携帯電話、又は別の電子デバイスなどの消費者電子デバイスで実施することができる。消費者電子デバイスは、IBM PowerPC、Intel Pentium(x86)プロセッサ、又は他のプロセッサなどのプロセッサの1又は2以上の従来のタイプのものを表すことができる中央処理ユニット(CPU)を含む。ランダムアクセスメモリ(RAM)は、CPUによって実行されるデータ処理動作の結果を一時的に格納し、CPUは一般的に専用メモリチャネルを介してRAMに相互接続される。消費者電子デバイスは、入力/出力(I/O)バスを通じてCPUと通信するハードドライブなどの永久ストレージデバイスを含むこともできる。テープドライブ、光学ディスクドライブ、又は他のストレージデバイスなどの他の種類のストレージデバイスも接続することができる。ビデオバスを介してグラフィクスカードもCPUに接続することができ、グラフィクスカードがディスプレイデータを表す信号をディスプレイモニタに送信する。キーボード又はマウスなどの外部周辺データ入力デバイスをUSBポートを通じてオーディオ再生システムに接続することができる。USBコントローラがUSBポートに接続された外部周辺装置のCPUとの間でデータ及び命令を翻訳する。プリンタ、マイクロフォン、スピーカ、又は他のデバイスなどの追加のデバイスを消費者電子デバイスに接続することができる。
消費者電子デバイスは、ワシントン州レドモンドのマイクロソフト社製のWINDOWS、カリフォルニア州クパチーノのアップル社製のMAC OS、Androidなどのモバイルオペレーティングシステム用に設計されたモバイルGUIの様々なバージョン、又は他のオペレーティングシステムなどのグラフィクスユーザインタフェース(GUI)を有するオペレーティングシステムを用いることができる。消費者電子デバイスは1又は2以上のコンピュータプログラムを実行することができる。一般的には、オペレーティングシステム及びコンピュータプログラムは、コンピュータ可読媒体に有形で実施され、コンピュータ可読媒体は、ハードドライブを含む固定又は取り外し可能なデータストレージデバイスの1又は2以上を含む。オペレーティングシステム及びコンピュータプログラムの両方をCPUによる実行のために前述のデータストレージデバイスからRAMにロードすることができる。コンピュータプログラムは命令を含むことができ、この命令がCPUによって読み取られ実行されるときに、CPUにステップを実施させ本発明の主題のステップ又は特徴を実行する。
オーディオコーデックは、様々な構成又はアーキテクチャを含むことができる。何れかのこのような構成又はアーキテクチャは、本発明の主題の範囲から逸脱することなく容易に置き換えることができる。当業者であれば、上述のシーケンスがコンピュータ可読媒体で最も一般的に用いられるが、本発明の主題の範囲から逸脱することなく置き換えることができる他の既存のシーケンスも存在することを理解するであろう。
オーディオコーデックの1つの実施形態の要素は、ハードウェア、ファームウェア、ソフトウェア、又はこれらの何れかの組み合わせによって実施することができる。ハードウェアとして実施されたときに、オーディオコーデックを単一オーディオ信号プロセッサで利用できるか又は様々な処理構成要素間に分散させることができる。ソフトウェアで実施されるときは、本発明の主題の実施形態の要素が必要なタスクを実行するためのコードセグメントを含むことができる。ソフトウェアは、本発明の主題の1つの実施形態に記述される動作を実行するための実際のコードを含むか、又は動作を真似るか又はシミュレートするコードを含むのが好ましい。このプログラム又はコードセグメントは、プロセッサ又は機械アクセス可能媒体に格納するか又は送信媒体を通じて搬送波(例えば、キャリアによって変調される信号)で実施されるコンピュータデータ信号によって送信することができる。「プロセッサ可読又はアクセス可能媒体」又は「機械可読又はアクセス可能媒体」は、情報を格納、送信、又は転送することができる何れかの媒体を含むことができる。
プロセッサ可読媒体の実施例は、電子回路、半導体メモリデバイス、読取り専用メモリ(ROM)、フラッシュメモリ、消去可能プログラマブルROM(EPROM)、フロッピーディスケット、コンパクトディスク(CD)ROM、光学ディスク、ハードディスク、光ファイバ媒体、無線周波数(RF)リンク、又は他の媒体を含む。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバ、空気、電磁的、RFリンク、、又は他の伝送媒体などの伝送媒体を通じて伝播できる何れかの信号を含むことができる。コードセグメントは、インターネット、イントラネット、又は別のネットワークなどのコンピュータネットワークを介してダウンロードすることができる。機械アクセス可能媒体は、製造物品にて具現化することができる。機械アクセス可能媒体は、機械によってアクセスされたときに、以下に説明する動作を機械に実行させるデータを含むことができる。本明細書での用語「データ」は、機械可読目的で符号化される何れかの種類の情報を指し、プログラム、コード、データ、ファイル、又は他の情報を含むことができる。
本発明の主題の実施形態はソフトウェアによって実装することができる。ソフトウェアは、互いに結合された複数のモジュールを含むことができる。ソフトウェアモジュールは、別のモジュールに結合されて、変数、パラメータ、引数、ポインタ、結果、更新された変数、ポインタ、又は他の入力又は出力を生成、送信、受信、又は処理する。ソフトウェアモジュールはまた、プラットフォーム上で実行されるオペレーティングシステムと対話するためのソフトウェアドライバ又はインタフェースとすることもできる。ソフトウェアモジュールはまた、ハードウェアデバイスとの間でデータを構成、セットアップ、初期化、送信、又は受信するためのハードウェアドライバとすることができる。
本発明の主題の実施形態は、通常はフローチャート、流れ図、構造図、又はブロック図として表される処理として記述することができる。ブロック図は順次的処理として動作を記述することができるが、これらの動作の多くは、並列で又は同時に実行することができる。加えて、動作の順序は、並べ替えることができる。処理は、その動作が完了したときに終了することができる。処理は、方法、プログラム、手順、又はステップの他のグループに対応することができる。
特定の実施形態について、本明細書で例証し説明してきたが、同じ目的を達成するために計画されるあらゆる構成が、図示した特定の実施形態に対して置き換え得ることは、当業者には理解されるであろう。様々な実施形態は、本明細書で記載される実施形態の置換及び/又は組み合わせを用いる。上記の説明は、例証を意図しており、限定ではないこと、及び本明細書で用いる表現及び用語は説明の目的であることを理解されたい。上記の実施形態と他の実施形態の組み合わせは、上記の説明を学習した当業者には明らかであろう。本開示について、本開示の例示的な実施形態を参照しながら詳細に説明してきたが、様々な変更及び修正が実施形態の範囲から逸脱することなく本明細書にて行い得ることは当業者には明らかであろう。従って、本開示は、本開示の修正及び変形形態が添付の請求項及びそれらの均等物の範囲内にある場合、これらに及ぶものとする。本明細書にて引用又は言及される各特許及び特許公開は、個々にその全体が引用により組み入れられるか、又は全体が本明細書に記載されるのと同等に引用により本明細書に組み入れられる。本明細書の教示とのこれらの特許又は特許公開の何らかの不一致は、本明細書の教示によって管理される。
本明細書で開示される方法及び装置をより良好に例証するために、実施形態の非限定的なリストが提示される。
実施例1は、1又は2以上のプロセッサと、命令を含むストレージデバイスとを備えた没入型サウンドシステムであって、この命令は、1又は2以上のプロセッサによって実行されたときに、複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と各々が関連付けられる複数のオーディオサウンドソースを受信し、複数の補償利得を含む補償アレイ出力を複数の3次元サウンドソース位置に基づいて生成し、複数のオーディオサウンドソース及び複数の補償利得に基づいて複数の補償されたオーディオソースを生成する、ように1又は2以上のプロセッサを構成する。
実施例2では、実施例1の主題は、複数の補償オーディオソースに基づいてバイノーラルクロストークキャンセレーション出力を生成し、バイノーラルクロストークキャンセレーション出力に基づいてバイノーラルサウンド出力を変換する、ように1又は2以上のプロセッサを更に構成する命令を任意選択的に含む。
実施例3では、実施例2の主題は、サウンドソースメタデータを受信するよう1又は2以上のプロセッサを更に構成する命令を任意選択的に含み、複数の3次元サウンドソース位置は、受信されたサウンドソースメタデータに基づく。
実施例4では、実施例2-3のうちの何れか1又は2以上の実施例の主題は、任意選択的に複数のオーディオサウンドソースを含み、複数のオーディオサウンドソースが、標準的なサラウンドサウンドデバイスレイアウトに関連付けられ、複数の3次元サウンドソース位置が、事前に決められたサラウンドサウンドデバイスレイアウトに基づく。
実施例5では、実施例4の主題が任意選択的にサラウンドサウンドを含む。
実施例6では、実施例1-5のうちの何れか1又は2以上の実施例の主題は、チューニングパラメータを受信するよう1又は2以上のプロセッサを更に構成する命令を任意選択的に含み、補償アレイ出力の生成が、受信されたチューニングパラメータに基づく。
実施例7では、実施例6の主題は、ユーザチューニング入力を受信し、受信したユーザチューニング入力に基づいてチューニングパラメータを生成するよう1又は2以上のプロセッサを更に構成する命令を任意選択的に含む。
実施例8では、実施例1-7のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が音色を補償するために周波数依存補償アレイに基づくことを任意選択的に含む。
実施例9では、実施例1-8のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が周波数に依存しない補償アレイに基づくことを任意選択的に含む。
実施例10では、実施例3-9のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成がバイノーラルクロストークキャンセレーション出力に更に基づくことを任意選択的に含む。
実施例11では、実施例3-10のうちの何れか1又は2以上の実施例の主題は、バイノーラルクロストークキャンセレーション出力がCTC方位角及びエレベーション情報を含むことを任意選択的に含む。
実施例12では、実施例3-11のうちの何れか1又は2以上の実施例の主題は、バイノーラルクロストークキャンセレーション出力がリスナー位置及び複数のラウドスピーカの各々までの距離を含むことを任意選択的に含む。
実施例13は、複数のオーディオサウンドソースを受信するステップであって、複数のオーディオサウンドソースの各々が、複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と関連付けられる、ステップと、複数の3次元サウンドソース位置に基づいて、複数の補償された利得を含む補償アレイ出力を生成するステップと、複数のオーディオサウンドソース及び複数の補償された利得に基づいて複数の補償されたオーディオソースを生成するステップと、を含む没入型サウンド方法である。
実施例14では、実施例13の主題は、複数の補償されたオーディオソースに基づいてバイノーラルクロストークキャンセレーション出力を生成するステップと、バイノーラルクロストークキャンセレーション出力に基づいてバイノーラルサウンド出力を変換するステップとを任意選択的に含む。
実施例15では、実施例14の主題は、サウンドソースメタデータを受信するステップを任意選択的に含み、複数の3次元サウンドソース位置は、受信されたサウンドソースメタデータに基づく。
実施例16では、実施例14-15のうちの何れか1又は2以上の実施例の主題は、複数のオーディオサウンドソースが標準的なサラウンドサウンドデバイスレイアウトに関連付けられること、複数の3次元サウンドソース位置が、事前に決められたサラウンドサウンドデバイスレイアウトに基づくことを、任意選択的に含む。
実施例17では、実施例16の主題は、サラウンドサウンドを任意選択的に含む。
実施例18では、実施例13-17のうちの何れか1又は2以上の実施例の主題は、チューニングパラメータを受信するステップを任意選択的に含み、補償アレイ出力の生成が、受信されたチューニングパラメータに基づく。
実施例19では、実施例18の主題は、ユーザチューニング入力を受信するステップと、受信したユーザチューニング入力に基づいてチューニングパラメータを生成するステップとを任意選択的に含む。
実施例20では、実施例13-19のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が音色を補償するための周波数依存補償アレイに基づくことを任意選択的に含む。
実施例21では、実施例13-20のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が、周波数に依存しない補償アレイに基づくことを任意選択的に含む。
実施例22では、実施例15-21のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が、バイノーラルクロストークキャンセレーション出力に基づくことを任意選択的に含む。
実施例23では、実施例15-22のうちの何れか1又は2以上の実施例の主題は、バイノーラルクロストークキャンセレーション出力がCTC方位角及びエレベーション情報を含むことを任意選択的に含む。
実施例24では、実施例15-23のうちの何れか1又は2以上の実施例の主題は、バイノーラルクロストークキャンセレーション出力がリスナー位置及び複数のラウドスピーカの各々までの距離を含むことを任意選択的に含む。
実施例25は、コンピュータシステムによって実行されたときに実施例13-43の方法の何れかをコンピュータシステムに実行させる命令を含む1又は2以上の機械可読媒体である。
実施例26は、実施例13-24の方法の何れかを実行する手段を含む装置である。
実施例27は、複数の命令を含む機械可読ストレージ媒体であって、該命令は、デバイスのプロセッサによって実行されたときに、デバイスに、複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と各々が関連付けられる複数のオーディオサウンドソースを受信させ、複数の補償された利得を含む補償アレイ出力を複数の3次元サウンドソース位置に基づいて生成させ、複数のオーディオサウンドソース及び複数の補償された利得に基づいて複数の補償されたオーディオソースを生成させる。
実施例28では、実施例27の主題が、デバイスに、複数の補償されたオーディオソースに基づいてバイノーラルクロストークキャンセレーション出力を生成し、バイノーラルクロストークキャンセレーション出力に基づいてバイノーラルサウンド出力を変換させる命令を任意選択的に含む。
実施例29では、実施例28の主題は、サウンドソースメタデータをデバイスに受信させる命令を任意選択的に含み、複数の3次元サウンドソース位置が、受信されたサウンドソースメタデータに基づく。
実施例30では、実施例28-29のうちの何れか1又は2以上の実施例の主題は、複数のオーディオサウンドソースが標準的なサラウンドサウンドデバイスレイアウトに関連付けられること、及び複数の3次元サウンドソース位置が事前に決められたサラウンドサウンドデバイスレイアウトに基づくことを任意選択的に含む。
実施例31では、実施例30の主題は、サラウンドサウンドを任意選択的に含む。
実施例32では、実施例27-31のうちの何れか1又は2以上の実施例の主題は、チューニングパラメータをデバイスに受信させる命令を任意選択的に含み、補償アレイ出力の生成が、受信したチューニングパラメータに基づく。
実施例33では、実施例32の主題は、デバイスに、ユーザチューニング入力を受信させ、受信したユーザチューニング入力に基づいてチューニングパラメータを生成させる命令を任意選択的に含む。
実施例34では、実施例27-33のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が音色を補償するための周波数依存補償アレイに基づくことを任意選択的に含む。
実施例35では、実施例27-34のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成が周波数に依存しない補償アレイに基づくことを任意選択的に含む。
実施例36では、実施例29-35のうちの何れか1又は2以上の実施例の主題は、補償アレイ出力の生成がバイノーラルクロストークキャンセレーション出力に更に基づくことを任意選択的に含む。
実施例37では、実施例29-36のうちの何れか1又は2以上の実施例の主題は、バイノーラルクロストークキャンセレーション出力がCTC方位角及びエレベーション情報を含むことを任意選択的に含む。
実施例38では、実施例29-37のうちの何れか1又は2以上の実施例の主題は、バイノーラルクロストークキャンセレーション出力がリスナー位置及び複数のラウドスピーカの各々までの距離を含むことを任意選択的に含む。
実施例39は、複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と各々が関連付けられる複数のオーディオサウンドソースを受信する手段と、複数の3次元サウンドソース位置に基づいて、複数の補償された利得を含む補償アレイ出力を生成する手段と、複数のオーディオサウンドソース及び複数の補償された利得に基づいて複数の補償されたオーディオソースを生成する手段とを含む、没入型サウンドシステム装置である。
実施例40は、機械によって実行されたときに、実施例1-39の動作の何れかの動作を機械に実行させる命令を含む1又は2以上の機械可読媒体である。
実施例41は、実施例1-39の動作の何れかを実行する手段を含む装置である。
実施例42は、実施例1-39の何れかの動作を実行するシステムである。
実施例43は、実施例1-39の何れかの動作を実行する方法である。
上記の詳細な説明は、この詳細な説明の一部を形成する添付図面の参照を含む。図面は、例証として特定の実施形態を示す。これらの実施形態はまた、「実施例」として本明細書で参照される。このような実施例は、図示又は説明されたものに加えて要素を含むことができる。更に、本発明の主題は、特定の実施例(又はこの1又は2以上の態様)に関して、又は本明細書で図示又は説明された他の実施例(又はこの1又は2以上の態様)に関しての何れかにおいて、図示又は説明された要素(又はこの1又は2以上の態様)の何れかの組み合わせ又は置換を含むことができる。
本明細書において、用語「a」又は「an」は、特許文献で共通するように、「少なくとも1つ」又は「1又は2以上」の他の何れかの事例又は使用に関係なく1又は1よりも多いものを含むのに使用される。本明細書において、用語「or(又は)」は、非排他的であることを指すのに使用され、すなわち、別途指示がない限り、「A又はB」が「BではなくA」、「AではなくB」、及び「A及びB」を含むものとする。本明細書において、「including」及び「in which」は、それぞれの用語「comprising」及び「wherein」の一般的意味の等価物として使用される。また、以下の請求項において、用語「including」及び「comprising」は、非制限的なものであり、すなわち、請求項におけるこのような用語の後に列挙された用語に加えて要素を含むシステム、デバイス、製品、組成物、配合物、又はプロセスは、当該請求項の範囲内にあるものと見なされる。更に、以下の請求項において、「第1」、「第2」、及び「第3」などの用語は、単にラベルとして用いられ、これらの対象に対して数値的要件を課すものではない。
上記の説明は例証であり限定ではないものとする。例えば、上述の実施例(又はこの1又は2以上の態様)は、互いに組み合わせて用いることができる。上記の説明を読むと、当業者によってなど、他の実施形態を用いることができる。要約は、読んだ人が技術的開示の本質を迅速に確認できるようにするために提供される。この要約は、請求項の範囲又は意味を解釈又は限定するのに用いられないという了解の下で提示される。上記の詳細な説明では、様々な特徴を共にグループ化して、本開示を簡素化することができる。これは、特許請求されていない開示された特徴が何れかの請求項に必須であるという意図として解釈すべきではない。むしろ、本発明の主題は、特定の開示された実施形態の全ての特徴より少ない特徴にある。従って、以下の請求項は、本明細書で詳細な説明に組み入れられ、各請求項は、別個の実施形態として単独で成立しており、このような実施形態が様々な組み合わせ又は置換で互いに組み合わせ得ることが企図される。本発明の範囲は、このような請求項が与えられる均等物の全範囲と共に添付の請求項を参照して決定すべきである。

Claims (17)

  1. 没入型サウンドシステムであって、
    1又は2以上のプロセッサと、
    命令を含むストレージデバイスと、
    を備え、
    前記命令が、前記1又は2以上のプロセッサによって実行されたときに、
    複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と各々が関連付けられる複数のオーディオサウンドソースを受信し、
    前記複数の3次元サウンドソース位置に基づいて、複数の補償された利得を含む補償アレイ出力を生成し、
    前記複数のオーディオサウンドソース及び前記複数の補償された利得に基づいて複数の補償されたオーディオソースを生成し、
    バイノーラルクロストークキャンセレーションの入力信号として提供される前記複数の補償されたオーディオソースに基づいて、バイノーラルクロストークキャンセレーション出力を生成し、
    前記バイノーラルクロストークキャンセレーション出力に基づいてバイノーラルサウンド出力を変換する、
    ように前記1又は2以上のプロセッサを構成する、
    没入型サウンドシステム。
  2. 前記命令は更に、サウンドソースメタデータを受信するよう前記1又は2以上のプロセッサを構成し、前記複数の3次元サウンドソース位置は、前記受信したサウンドソースメタデータに基づく、
    請求項に記載の没入型サウンドシステム。
  3. 前記複数のオーディオサウンドソースは、標準的なサラウンドサウンドデバイスレイアウトに関連付けられ、
    前記複数の3次元サウンドソース位置は、事前に決められた前記サラウンドサウンドデバイスレイアウトに基づく、
    請求項に記載の没入型サウンドシステム。
  4. 前記標準的なサラウンドサウンドデバイスレイアウトは、5.1サラウンドサウンド、7.1サラウンドサウンド、10.2サラウンドサウンド、11.1サラウンドサウンド、及び22.2サラウンドサウンドのうちの少なくとも1つを含む、
    請求項に記載の没入型サウンドシステム。
  5. 前記命令が更に、チューニングパラメータを受信するよう前記1又は2以上のプロセッサを構成し、前記補償アレイ出力の生成は、受信した前記チューニングパラメータに基づく、
    請求項1に記載の没入型サウンドシステム。
  6. 前記命令が更に、
    ユーザチューニング入力を受信し、
    受信した前記ユーザチューニング入力に基づいて前記チューニングパラメータを生成する、
    よう前記1又は2以上のプロセッサを構成する、
    請求項に記載の没入型サウンドシステム。
  7. 前記補償アレイ出力の生成は、音色を補償するための周波数依存補償アレイに基づく、 請求項1に記載の没入型サウンドシステム。
  8. 前記補償アレイ出力の生成は、前記バイノーラルクロストークキャンセレーション出力に更に基づく、
    請求項に記載の没入型サウンドシステム。
  9. 前記バイノーラルクロストークキャンセレーション出力は、CTC方位角及びエレベーション情報を含む、
    請求項に記載の没入型サウンドシステム。
  10. 前記バイノーラルクロストークキャンセレーション出力は、リスナー位置及び複数のラウドスピーカの各々までの距離を含む、
    請求項に記載の没入型サウンドシステム。
  11. 複数のオーディオサウンドソースを受信するステップであって、該複数のオーディオサウンドソースの各々が、複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と関連付けられる、ステップと、
    前記複数の3次元サウンドソース位置に基づいて、複数の補償された利得を含む補償アレイ出力を生成するステップと、
    前記複数のオーディオサウンドソース及び前記複数の補償された利得に基づいて複数の補償されたオーディオソースを生成するステップと、
    バイノーラルクロストークキャンセレーションの入力信号として提供される前記複数の補償されたオーディオソースに基づいて、バイノーラルクロストークキャンセレーション出力を生成するステップと、
    前記バイノーラルクロストークキャンセレーション出力に基づいて、バイノーラルサウンド出力を変換するステップと、
    を含む、
    没入型サウンド方法。
  12. サウンドソースメタデータを受信するステップを更に含み、前記複数の3次元サウンドソース位置は、前記受信されたサウンドソースメタデータに基づく、
    請求項11に記載の没入型サウンド方法。
  13. 前記複数のオーディオサウンドソースは、標準的なサラウンドサウンドデバイスレイアウトに関連付けられ、
    前記複数の3次元サウンドソース位置は、事前に決められた前記サラウンドサウンドデバイスレイアウトに基づく、
    請求項11に記載の没入型サウンド方法。
  14. チューニングパラメータを受信するステップを更に含み、前記補償アレイ出力の生成は、受信された前記チューニングパラメータに基づく、
    請求項11に記載の没入型サウンド方法。
  15. ユーザチューニング入力を受信するステップと、
    受信した前記ユーザチューニング入力に基づいて前記チューニングパラメータを生成するステップと、
    を更に含む、
    請求項14に記載の没入型サウンド方法。
  16. デバイスのプロセッサによって実行されたときに前記デバイスに対して動作を実行させる複数の命令を含む機械可読ストレージ媒体であって、
    前記動作が、
    複数の3次元サウンドソース位置内の対応する意図されたサウンドソース位置と各々が関連付けられる複数のオーディオサウンドソースを受信するステップと、
    前記複数の3次元サウンドソース位置に基づいて、複数の補償された利得を含む補償アレイ出力を生成するステップと、
    前記複数のオーディオサウンドソース及び前記複数の補償された利得に基づいて複数の補償されたオーディオソースを生成するステップと、
    バイノーラルクロストークキャンセレーションの入力信号として提供される前記複数の補償されたオーディオソースに基づいて、バイノーラルクロストークキャンセレーション出力を生成するステップと、
    前記バイノーラルクロストークキャンセレーション出力に基づいてバイノーラルサウンド出力を変換するステップと、
    を含む、
    機械可読ストレージ媒体。
  17. 前記命令は、前記デバイスにチューニングパラメータを受信させ、前記補償アレイ出力の生成は、前記受信したチューニングパラメータに基づく、
    請求項16に記載の機械可読ストレージ媒体。
JP2020522308A 2017-10-18 2018-10-18 3dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニング Active JP7345460B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762573966P 2017-10-18 2017-10-18
US62/573,966 2017-10-18
PCT/US2018/056524 WO2019079602A1 (en) 2017-10-18 2018-10-18 PRECONDITIONING AUDIO SIGNAL FOR 3D AUDIO VIRTUALIZATION

Publications (2)

Publication Number Publication Date
JP2021500803A JP2021500803A (ja) 2021-01-07
JP7345460B2 true JP7345460B2 (ja) 2023-09-15

Family

ID=66096192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020522308A Active JP7345460B2 (ja) 2017-10-18 2018-10-18 3dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニング

Country Status (6)

Country Link
US (1) US10820136B2 (ja)
EP (1) EP3698555B1 (ja)
JP (1) JP7345460B2 (ja)
KR (1) KR102511818B1 (ja)
CN (1) CN111587582B (ja)
WO (1) WO2019079602A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102511818B1 (ko) 2017-10-18 2023-03-17 디티에스, 인코포레이티드 3d 오디오 가상화를 위한 오디오 신호 사전 설정
JP7285967B2 (ja) * 2019-05-31 2023-06-02 ディーティーエス・インコーポレイテッド フォービエイテッドオーディオレンダリング
US11341952B2 (en) 2019-08-06 2022-05-24 Insoundz, Ltd. System and method for generating audio featuring spatial representations of sound sources
CN113645531B (zh) * 2021-08-05 2024-04-16 高敬源 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
GB2609667A (en) * 2021-08-13 2023-02-15 British Broadcasting Corp Audio rendering
CN113660569A (zh) * 2021-08-17 2021-11-16 上海月猫科技有限公司 一种基于高音质网红麦克风的共享音频技术
CN117119358B (zh) * 2023-10-17 2024-01-19 武汉市聚芯微电子有限责任公司 一种声像偏侧的补偿方法、装置、电子设备及存储设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160134987A1 (en) 2014-11-11 2016-05-12 Google Inc. Virtual sound systems and methods

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5666424A (en) 1990-06-08 1997-09-09 Harman International Industries, Inc. Six-axis surround sound processor with automatic balancing and calibration
US6243476B1 (en) * 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
AU735233B2 (en) * 1997-06-19 2001-07-05 British Telecommunications Public Limited Company Sound reproduction system
GB2340005B (en) * 1998-07-24 2003-03-19 Central Research Lab Ltd A method of processing a plural channel audio signal
GB2342830B (en) * 1998-10-15 2002-10-30 Central Research Lab Ltd A method of synthesising a three dimensional sound-field
US7231054B1 (en) 1999-09-24 2007-06-12 Creative Technology Ltd Method and apparatus for three-dimensional audio display
US20030007648A1 (en) 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
KR100739798B1 (ko) * 2005-12-22 2007-07-13 삼성전자주식회사 청취 위치를 고려한 2채널 입체음향 재생 방법 및 장치
US8619998B2 (en) 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
EP1858296A1 (en) 2006-05-17 2007-11-21 SonicEmotion AG Method and system for producing a binaural impression using loudspeakers
US9088858B2 (en) 2011-01-04 2015-07-21 Dts Llc Immersive audio rendering system
EP2503800B1 (en) * 2011-03-24 2018-09-19 Harman Becker Automotive Systems GmbH Spatially constant surround sound
JP2013110682A (ja) 2011-11-24 2013-06-06 Sony Corp 音響信号処理装置、音響信号処理方法、プログラム、および、記録媒体
WO2013149867A1 (en) 2012-04-02 2013-10-10 Sonicemotion Ag Method for high quality efficient 3d sound reproduction
EP2891335B1 (en) 2012-08-31 2019-11-27 Dolby Laboratories Licensing Corporation Reflected and direct rendering of upmixed content to individually addressable drivers
CN104604257B (zh) 2012-08-31 2016-05-25 杜比实验室特许公司 用于在各种收听环境中渲染并且回放基于对象的音频的系统
JP6193468B2 (ja) * 2013-03-14 2017-09-06 アップル インコーポレイテッド スピーカアレイを用いた堅牢なクロストークキャンセル
EP2830332A3 (en) * 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
CN105766000B (zh) * 2013-10-31 2018-11-16 华为技术有限公司 用于评估声学传递函数的系统和方法
KR102511818B1 (ko) 2017-10-18 2023-03-17 디티에스, 인코포레이티드 3d 오디오 가상화를 위한 오디오 신호 사전 설정

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160134987A1 (en) 2014-11-11 2016-05-12 Google Inc. Virtual sound systems and methods

Also Published As

Publication number Publication date
US10820136B2 (en) 2020-10-27
CN111587582A (zh) 2020-08-25
US20190116451A1 (en) 2019-04-18
EP3698555A4 (en) 2021-06-02
WO2019079602A1 (en) 2019-04-25
KR102511818B1 (ko) 2023-03-17
EP3698555C0 (en) 2023-08-23
JP2021500803A (ja) 2021-01-07
EP3698555A1 (en) 2020-08-26
CN111587582B (zh) 2022-09-02
EP3698555B1 (en) 2023-08-23
KR20200089670A (ko) 2020-07-27

Similar Documents

Publication Publication Date Title
JP7345460B2 (ja) 3dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニング
CN112262585B (zh) 环境立体声深度提取
US10820134B2 (en) Near-field binaural rendering
US9832524B2 (en) Configuring television speakers
US9530421B2 (en) Encoding and reproduction of three dimensional audio soundtracks
EP2939443B1 (en) System and method for variable decorrelation of audio signals
CN113348677B (zh) 沉浸式和双耳声音的组合
WO2020127836A1 (en) Sound reproduction/simulation system and method for simulating a sound reproduction
KR102565131B1 (ko) 포비에이티드 오디오 렌더링
CN106463126B (zh) 基于对象的音频系统中的残差编码
Team SoundScape Renderer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211014

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221102

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230202

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230905

R150 Certificate of patent or registration of utility model

Ref document number: 7345460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150