JP2018537710A - パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 - Google Patents
パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 Download PDFInfo
- Publication number
- JP2018537710A JP2018537710A JP2018525387A JP2018525387A JP2018537710A JP 2018537710 A JP2018537710 A JP 2018537710A JP 2018525387 A JP2018525387 A JP 2018525387A JP 2018525387 A JP2018525387 A JP 2018525387A JP 2018537710 A JP2018537710 A JP 2018537710A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- dominant
- component
- signal
- estimate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 39
- 239000000203 mixture Substances 0.000 claims description 34
- 238000009877 rendering Methods 0.000 claims description 19
- 230000005236 sound signal Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 11
- 238000002156 mixing Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000004088 simulation Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 6
- 238000013459 approach Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 241000610375 Sparisoma viride Species 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008825 perceptual sensitivity Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S3/004—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Golf Clubs (AREA)
- Massaging Devices (AREA)
- Stereophonic Arrangements (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
Description
ステレオ混合zl、zr(例示的に、初期の出力呈示を具現する);
優勢成分wl,d、wr,dを推定するための係数(例示的に、優勢オーディオ成分重み付け因子を具現する);
優勢成分の位置または方向→pD;
そして任意的に、残差重みwi,j(例示的に、残差行列係数を具現する)。
図5は、デコーダ/レンダラー60の一つの形をより詳細に示している。デコーダ/レンダラー60は、アンパックされた入力情報zl、zr;wl,d、wr,d;→pD;wi,jから、聴取者71に対して出力するためのバイノーラル混合yl,yrを再構成することをねらいとするプロセスを適用する。よって、ステレオ混合zl、zrは第一のオーディオ表現の例であり、予測係数または重みwi,jおよび/または優勢成分信号^dの方向/位置→pDは、追加的なオーディオ変換データの例である。
上記の式の定式化から観察できるように、ステレオ呈示から無残響バイノーラル呈示を構築するための実効的な動作は、2×2行列70からなり、行列係数は伝送された情報wl,d、wr,d;→pD;wi,jおよび頭部追跡器の回転および/または並進に依存する。これは、プロセスの複雑さが比較的低いことを示す。優勢成分の分解がデコーダではなくエンコーダにおいて適用されるからである。
実施形態は、ステレオ・ダウンミックスの使用に限定されない。他のチャネル数を用いることもできる。
本明細書を通じて「一つの実施形態」「いくつかの実施形態」または「ある実施形態」への言及は、その実施形態との関連で記載されている特定の特徴、構造または特性が本発明の少なくとも一つの実施形態に含まれることを意味する。よって、「一つの実施形態において」「いくつかの実施形態において」または「ある実施形態において」という句が本明細書を通じた随所に現われることは、必ずしもみなが同じ実施形態を指しているのではないが、指していてもよい。さらに、特定の特徴、構造または特性は、いかなる好適な仕方で組み合わされてもよい。このことは、一つまたは複数の実施形態において、本開示から当業者には明白であろう。
〔EEE1〕
再生のためにチャネル・ベースまたはオブジェクト・ベースの入力オーディオをエンコードする方法であって:
(a)前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオを初期の出力呈示に初期にレンダリングし;
(b)前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオから優勢オーディオ成分の推定値を決定し、前記初期の出力呈示を前記優勢オーディオ成分にマッピングするための一連の優勢オーディオ成分重み付け因子を決定し;
(c)前記優勢オーディオ成分の方向または位置の推定値を決定し;
(d)前記初期の出力呈示、前記優勢オーディオ成分重み付け因子、前記優勢オーディオ成分の方向または位置を、再生のためのエンコードされた信号としてエンコードすることを含む、
方法。
〔EEE2〕
前記初期の出力呈示より前記優勢オーディオ成分もしくはその前記推定値のいずれかのレンダリングだけ小さいものである残差混合の推定値を決定することをさらに含む、EEE1記載の方法。
〔EEE3〕
前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオの無残響のバイノーラル混合を生成し、残差混合の推定値を決定することを含み、ここで、前記残差混合の推定値は、前記無残響のバイノーラル混合より、前記優勢オーディオ成分もしくはその前記推定値のいずれかのレンダリングだけ小さいものである、EEE1記載の方法。
〔EEE4〕
前記初期の出力呈示を前記残差混合の推定値にマッピングするための一連の残差行列係数を決定することをさらに含む、EEE2または3記載の方法。
〔EEE5〕
前記初期の出力呈示は、ヘッドフォンまたはラウドスピーカー呈示を含む、EEE1ないし4のうちいずれか一項記載の方法。
〔EEE6〕
前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオは、時間および周波数タイリングされ、前記エンコードする段階は、一連の時間ステップおよび一連の周波数帯域について繰り返される、EEE1ないし5のうちいずれか一項記載の方法。
〔EEE7〕
前記初期の出力呈示は、ステレオ・スピーカー混合を含む、EEE1ないし6のうちいずれか一項記載の方法。
〔EEE8〕
エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は:
・初期の出力呈示と;
・優勢オーディオ成分の方向および優勢オーディオ成分重み付け因子とを含み、
当該方法は:
(a)前記優勢オーディオ成分重み付け因子および初期の出力呈示を利用して、推定された優勢成分を決定し;
(b)前記優勢オーディオ成分の方向に従って、前記推定された優勢成分を、バイノーラル化により、意図される聴取者に対するある空間位置にレンダリングして、レンダリングされたバイノーラル化推定優勢成分を形成し;
(c)前記第一の出力呈示から残差成分推定値を再構成し;
(d)前記レンダリングされたバイノーラル化推定優勢成分および前記残差成分推定値を組み合わせて、出力空間化オーディオ・エンコード信号を形成する段階を含む、
方法。
〔EEE9〕
前記エンコードされたオーディオ信号はさらに、残差オーディオ信号を表わす一連の残差行列係数を含み、前記段階(c)はさらに:
(c1)前記残差行列係数を前記第一の出力呈示に適用して、前記残差成分推定値を再構成することを含む、
EEE8記載の方法。
〔EEE10〕
前記残差成分推定値は、前記第一の出力呈示から、前記レンダリングされたバイノーラル化推定優勢成分を引くことによって再構成される、EEE8記載の方法。
〔EEE11〕
前記段階(b)が、意図される聴取者の頭の配向を示す入力頭部追跡信号に基づく、前記推定された優勢成分の初期回転を含む、EEE8記載の方法。
〔EEE12〕
ヘッドフォンを使う聴取者のためのオーディオ・ストリームのデコードおよび再生のための方法であって、当該方法は:
(a)第一のオーディオ表現および追加的なオーディオ変換データを含むデータ・ストリームを受領する段階と;
(b)前記聴取者の配向を表わす頭部配向データを受領する段階と;
(c)前記第一のオーディオ表現および受領された変換データに基づいて一つまたは複数の補助信号を生成する段階と;
(d)前記第一のオーディオ表現および前記補助信号の組み合わせからなる第二のオーディオ表現を生成する段階であって、前記補助信号のうち一つまたは複数は、前記頭部配向データに応答して修正されている、段階と;
(e)前記第二のオーディオ表現を出力オーディオ・ストリームとして出力する段階とを含む、
方法。
〔EEE13〕
前記補助信号の前記修正は、音源位置から前記聴取者の耳までの音響経路のシミュレーションからなる、EEE12記載の方法。
〔EEE14〕
前記変換データは:行列処理係数と、音源位置または音源方向の少なくとも一方とからなる、EEE12または13記載の方法。
〔EEE15〕
変換プロセスは、時間または周波数の関数として適用される、EEE12ないし14のうちいずれか一項記載の方法。
〔EEE16〕
前記補助信号は、少なくとも一つの優勢成分を表わす、EEE12ないし15のうちいずれか一項記載の方法。
〔EEE17〕
前記変換データの一部として受領される前記音源位置または方向は、前記頭部配向データに応答して回転される、EEE12ないし16のうちいずれか一項記載の方法。
〔EEE18〕
最大回転量は、方位角または仰角において360度未満の値に制限される、EEE17記載の方法。
〔EEE19〕
前記二次表現は、前記第一の表現から、変換もしくはフィルタバンク領域において行列処理することによって得られる、EEE12ないし18のうちいずれか一項記載の方法。
〔EEE20〕
前記変換データはさらに、追加的な行列処理係数を含み、段階(d)はさらに、前記第一のオーディオ呈示および前記補助オーディオ信号を組み合わせるのに先立って、前記追加的な行列処理係数に応答して前記第一のオーディオ呈示を修正することを含む、EEE12ないし19のうちいずれか一項記載の方法。
〔EEE21〕
EEE1ないし20のうちいずれか一項記載の方法を実行するよう構成された、一つまたは複数のデバイスを有する装置。
〔EEE22〕
一つまたは複数のプロセッサによって実行されたときにEEE1ないし20のうちいずれか一項記載の方法を一つまたは複数のデバイスに実行させる、命令のプログラムを有するコンピュータ可読記憶媒体。
Claims (22)
- 再生のためにチャネル・ベースまたはオブジェクト・ベースの入力オーディオをエンコードする方法であって:
(a)前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオを初期の出力呈示に初期にレンダリングし;
(b)前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオから優勢オーディオ成分の推定値を決定し、前記初期の出力呈示を前記優勢オーディオ成分にマッピングするための一連の優勢オーディオ成分重み付け因子を決定して、前記優勢オーディオ成分重み付け因子および前記初期の出力呈示を利用して前記優勢成分の推定値を決定できるようにし;
(c)前記優勢オーディオ成分の方向または位置の推定値を決定し;
(d)前記初期の出力呈示、前記優勢オーディオ成分重み付け因子、前記優勢オーディオ成分の方向または位置を、再生のためのエンコードされた信号としてエンコードすることを含む、
方法。 - 前記初期の出力呈示より前記優勢オーディオ成分もしくはその前記推定値のいずれかのレンダリングだけ小さいものである残差混合の推定値を決定することをさらに含む、請求項1記載の方法。
- 前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオの無残響のバイノーラル混合を生成し、残差混合の推定値を決定することを含み、ここで、前記残差混合の推定値は、前記無残響のバイノーラル混合より、前記優勢オーディオ成分もしくはその前記推定値のいずれかのレンダリングだけ小さいものである、請求項1記載の方法。
- 前記初期の出力呈示を前記残差混合の推定値にマッピングするための一連の残差行列係数を決定することをさらに含む、請求項2または3記載の方法。
- 前記初期の出力呈示は、ヘッドフォンまたはラウドスピーカー呈示を含む、請求項1ないし4のうちいずれか一項記載の方法。
- 前記チャネル・ベースまたはオブジェクト・ベースの入力オーディオは、時間および周波数タイリングされ、前記エンコードする段階は、一連の時間ステップおよび一連の周波数帯域について繰り返される、請求項1ないし5のうちいずれか一項記載の方法。
- 前記初期の出力呈示は、ステレオ・スピーカー混合を含む、請求項1ないし6のうちいずれか一項記載の方法。
- エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は:
・初期の出力呈示と;
・優勢オーディオ成分の方向および優勢オーディオ成分重み付け因子とを含み、
当該方法は:
(a)前記優勢オーディオ成分重み付け因子および初期の出力呈示を利用して、推定された優勢成分を決定し;
(b)前記優勢オーディオ成分の方向に従って、前記推定された優勢成分を、バイノーラル化により、意図される聴取者に対するある空間位置にレンダリングして、レンダリングされたバイノーラル化推定優勢成分を形成し;
(c)前記初期の出力呈示から残差成分推定値を再構成し;
(d)前記レンダリングされたバイノーラル化推定優勢成分および前記残差成分推定値を組み合わせて、出力空間化オーディオ・エンコード信号を形成する段階を含む、
方法。 - 前記エンコードされたオーディオ信号はさらに、残差オーディオ信号を表わす一連の残差行列係数を含み、前記段階(c)はさらに:
(c1)前記残差行列係数を前記初期の出力呈示に適用して、前記残差成分推定値を再構成することを含む、
請求項8記載の方法。 - 前記残差成分推定値は、前記初期の出力呈示から、前記レンダリングされたバイノーラル化推定優勢成分を引くことによって再構成される、請求項8記載の方法。
- 前記段階(b)が、意図される聴取者の頭の配向を示す入力頭部追跡信号に基づく、前記推定された優勢成分の初期回転を含む、請求項8ないし10のうちいずれか一項記載の方法。
- ヘッドフォンを使う聴取者のためのオーディオ・ストリームのデコードおよび再生のための方法であって、当該方法は:
(a)第一のオーディオ表現および追加的なオーディオ変換データを含むデータ・ストリームを受領する段階と;
(b)前記聴取者の配向を表わす頭部配向データを受領する段階と;
(c)前記第一のオーディオ表現および受領された変換データに基づいて一つまたは複数の補助信号を生成する段階と;
(d)前記第一のオーディオ表現および前記補助信号の組み合わせからなる第二のオーディオ表現を生成する段階であって、前記補助信号のうち一つまたは複数は、前記頭部配向データに応答して修正されている、段階と;
(e)前記第二のオーディオ表現を出力オーディオ・ストリームとして出力する段階とを含む、
方法。 - 前記補助信号の前記修正は、音源位置から前記聴取者の耳までの音響経路のシミュレーションからなる、請求項12記載の方法。
- 前記変換データは:行列処理係数と、音源位置または音源方向の少なくとも一方とからなる、請求項12または13記載の方法。
- 変換プロセスは、時間または周波数の関数として適用される、請求項12ないし14のうちいずれか一項記載の方法。
- 前記補助信号は、少なくとも一つの優勢成分を表わす、請求項12ないし15のうちいずれか一項記載の方法。
- 前記変換データの一部として受領される前記音源位置または方向は、前記頭部配向データに応答して回転される、請求項12ないし16のうちいずれか一項記載の方法。
- 最大回転量は、方位角または仰角において360度未満の値に制限される、請求項17記載の方法。
- 前記二次表現は、前記第一の表現から、変換もしくはフィルタバンク領域において行列処理することによって得られる、請求項12ないし17のうちいずれか一項記載の方法。
- 前記変換データはさらに、追加的な行列処理係数を含み、段階(d)はさらに、前記第一のオーディオ呈示および前記補助オーディオ信号を組み合わせるのに先立って、前記追加的な行列処理係数に応答して前記第一のオーディオ呈示を修正することを含む、請求項12ないし19のうちいずれか一項記載の方法。
- 請求項1ないし20のうちいずれか一項記載の方法を実行するよう構成された、一つまたは複数のデバイスを有する装置。
- 一つまたは複数のプロセッサによって実行されたときに請求項1ないし20のうちいずれか一項記載の方法を一つまたは複数のデバイスに実行させる、命令のプログラムを有するコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020052041A JP6964703B2 (ja) | 2015-11-17 | 2020-03-24 | パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562256462P | 2015-11-17 | 2015-11-17 | |
US62/256,462 | 2015-11-17 | ||
EP15199854.9 | 2015-12-14 | ||
EP15199854 | 2015-12-14 | ||
PCT/US2016/062497 WO2017087650A1 (en) | 2015-11-17 | 2016-11-17 | Headtracking for parametric binaural output system and method |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020052041A Division JP6964703B2 (ja) | 2015-11-17 | 2020-03-24 | パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018537710A true JP2018537710A (ja) | 2018-12-20 |
JP6740347B2 JP6740347B2 (ja) | 2020-08-12 |
Family
ID=55027285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018525387A Active JP6740347B2 (ja) | 2015-11-17 | 2016-11-17 | パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 |
Country Status (15)
Country | Link |
---|---|
US (2) | US10362431B2 (ja) |
EP (3) | EP3378239B1 (ja) |
JP (1) | JP6740347B2 (ja) |
KR (2) | KR102586089B1 (ja) |
CN (2) | CN108476366B (ja) |
AU (2) | AU2016355673B2 (ja) |
BR (2) | BR122020025280B1 (ja) |
CA (2) | CA3005113C (ja) |
CL (1) | CL2018001287A1 (ja) |
ES (1) | ES2950001T3 (ja) |
IL (1) | IL259348B (ja) |
MY (1) | MY188581A (ja) |
SG (1) | SG11201803909TA (ja) |
UA (1) | UA125582C2 (ja) |
WO (1) | WO2017087650A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017035281A2 (en) | 2015-08-25 | 2017-03-02 | Dolby International Ab | Audio encoding and decoding using presentation transform parameters |
WO2018152004A1 (en) * | 2017-02-15 | 2018-08-23 | Pcms Holdings, Inc. | Contextual filtering for immersive audio |
CN111052770B (zh) * | 2017-09-29 | 2021-12-03 | 苹果公司 | 空间音频下混频的方法及系统 |
US11004457B2 (en) * | 2017-10-18 | 2021-05-11 | Htc Corporation | Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof |
EP3704875B1 (en) | 2017-10-30 | 2023-05-31 | Dolby Laboratories Licensing Corporation | Virtual rendering of object based audio over an arbitrary set of loudspeakers |
US11032662B2 (en) | 2018-05-30 | 2021-06-08 | Qualcomm Incorporated | Adjusting audio characteristics for augmented reality |
TWI683582B (zh) * | 2018-09-06 | 2020-01-21 | 宏碁股份有限公司 | 增益動態調節之音效控制方法及音效輸出裝置 |
CN111615044B (zh) * | 2019-02-25 | 2021-09-14 | 宏碁股份有限公司 | 声音信号的能量分布修正方法及其系统 |
CN113678473A (zh) * | 2019-06-12 | 2021-11-19 | 谷歌有限责任公司 | 三维音频源空间化 |
US11076257B1 (en) * | 2019-06-14 | 2021-07-27 | EmbodyVR, Inc. | Converting ambisonic audio to binaural audio |
DE112021004444T5 (de) * | 2020-08-27 | 2023-06-22 | Apple Inc. | Stereobasierte immersive codierung (stic) |
US11750745B2 (en) * | 2020-11-18 | 2023-09-05 | Kelly Properties, Llc | Processing and distribution of audio signals in a multi-party conferencing environment |
EP4292086A1 (en) | 2021-02-11 | 2023-12-20 | Nuance Communications, Inc. | Multi-channel speech compression system and method |
CN113035209B (zh) * | 2021-02-25 | 2023-07-04 | 北京达佳互联信息技术有限公司 | 三维音频获取方法和三维音频获取装置 |
US20240163629A1 (en) * | 2022-11-11 | 2024-05-16 | Bang & Olufsen, A/S | Adaptive sound scene rotation |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPO316296A0 (en) * | 1996-10-23 | 1996-11-14 | Lake Dsp Pty Limited | Dithered binaural system |
WO1999014983A1 (en) | 1997-09-16 | 1999-03-25 | Lake Dsp Pty. Limited | Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener |
JPH11220797A (ja) * | 1998-02-03 | 1999-08-10 | Sony Corp | ヘッドホン装置 |
JP4088725B2 (ja) * | 1998-03-30 | 2008-05-21 | ソニー株式会社 | オーディオ再生装置 |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
US6839438B1 (en) | 1999-08-31 | 2005-01-04 | Creative Technology, Ltd | Positional audio rendering |
JP5306565B2 (ja) | 1999-09-29 | 2013-10-02 | ヤマハ株式会社 | 音響指向方法および装置 |
US7660424B2 (en) | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US7076204B2 (en) | 2001-10-30 | 2006-07-11 | Unwired Technology Llc | Multiple channel wireless communication system |
GB0419346D0 (en) * | 2004-09-01 | 2004-09-29 | Smyth Stephen M F | Method and apparatus for improved headphone virtualisation |
JP2006270649A (ja) * | 2005-03-24 | 2006-10-05 | Ntt Docomo Inc | 音声・音響信号処理装置およびその方法 |
WO2007080212A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Controlling the decoding of binaural audio signals |
US20090052703A1 (en) | 2006-04-04 | 2009-02-26 | Aalborg Universitet | System and Method Tracking the Position of a Listener and Transmitting Binaural Audio Data to the Listener |
US8379868B2 (en) | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US7876903B2 (en) | 2006-07-07 | 2011-01-25 | Harris Corporation | Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system |
WO2008039038A1 (en) | 2006-09-29 | 2008-04-03 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
DE602007013415D1 (de) | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
ES2452348T3 (es) | 2007-04-26 | 2014-04-01 | Dolby International Ab | Aparato y procedimiento para sintetizar una señal de salida |
CN101889307B (zh) * | 2007-10-04 | 2013-01-23 | 创新科技有限公司 | 相位-幅度3d立体声编码器和解码器 |
KR101567461B1 (ko) * | 2009-11-16 | 2015-11-09 | 삼성전자주식회사 | 다채널 사운드 신호 생성 장치 |
US8587631B2 (en) | 2010-06-29 | 2013-11-19 | Alcatel Lucent | Facilitating communications using a portable communication device and directed sound output |
US8767968B2 (en) | 2010-10-13 | 2014-07-01 | Microsoft Corporation | System and method for high-precision 3-dimensional audio for augmented reality |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2904817A4 (en) | 2012-10-01 | 2016-06-15 | Nokia Technologies Oy | APPARATUS AND METHOD FOR REPRODUCING RECORDED AUDIO DATA WITH CORRECT SPACE ORIENTATION |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP3005344A4 (en) | 2013-05-31 | 2017-02-22 | Nokia Technologies OY | An audio scene apparatus |
ES2755349T3 (es) * | 2013-10-31 | 2020-04-22 | Dolby Laboratories Licensing Corp | Renderización binaural para auriculares utilizando procesamiento de metadatos |
EP3251116A4 (en) * | 2015-01-30 | 2018-07-25 | DTS, Inc. | System and method for capturing, encoding, distributing, and decoding immersive audio |
WO2017035281A2 (en) | 2015-08-25 | 2017-03-02 | Dolby International Ab | Audio encoding and decoding using presentation transform parameters |
-
2016
- 2016-11-17 CN CN201680075037.8A patent/CN108476366B/zh active Active
- 2016-11-17 KR KR1020187014045A patent/KR102586089B1/ko active IP Right Grant
- 2016-11-17 EP EP16806384.0A patent/EP3378239B1/en active Active
- 2016-11-17 BR BR122020025280-4A patent/BR122020025280B1/pt active IP Right Grant
- 2016-11-17 MY MYPI2018701852A patent/MY188581A/en unknown
- 2016-11-17 BR BR112018010073-0A patent/BR112018010073B1/pt active IP Right Grant
- 2016-11-17 EP EP20157296.3A patent/EP3716653B1/en active Active
- 2016-11-17 ES ES20157296T patent/ES2950001T3/es active Active
- 2016-11-17 CA CA3005113A patent/CA3005113C/en active Active
- 2016-11-17 SG SG11201803909TA patent/SG11201803909TA/en unknown
- 2016-11-17 US US15/777,058 patent/US10362431B2/en active Active
- 2016-11-17 CA CA3080981A patent/CA3080981C/en active Active
- 2016-11-17 JP JP2018525387A patent/JP6740347B2/ja active Active
- 2016-11-17 CN CN202110229741.7A patent/CN113038354A/zh active Pending
- 2016-11-17 UA UAA201806682A patent/UA125582C2/uk unknown
- 2016-11-17 KR KR1020237033651A patent/KR20230145232A/ko not_active Application Discontinuation
- 2016-11-17 AU AU2016355673A patent/AU2016355673B2/en active Active
- 2016-11-17 EP EP23176131.3A patent/EP4236375A3/en active Pending
- 2016-11-17 WO PCT/US2016/062497 patent/WO2017087650A1/en active Application Filing
-
2018
- 2018-05-11 CL CL2018001287A patent/CL2018001287A1/es unknown
- 2018-05-14 IL IL259348A patent/IL259348B/en active IP Right Grant
-
2019
- 2019-07-18 US US16/516,121 patent/US10893375B2/en active Active
-
2020
- 2020-01-22 AU AU2020200448A patent/AU2020200448B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020200448B2 (en) | Headtracking for parametric binaural output system and method | |
JP7119060B2 (ja) | マルチポイント音場記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト | |
JP5698189B2 (ja) | オーディオ符号化 | |
EP3569000B1 (en) | Dynamic equalization for cross-talk cancellation | |
JP2009522610A (ja) | バイノーラルオーディオ信号の復号制御 | |
JP2018529121A (ja) | オーディオ・デコーダおよびデコード方法 | |
JP6964703B2 (ja) | パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 | |
RU2818687C2 (ru) | Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190604 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200324 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6740347 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |