JP2020108143A - 複数の音響ストリームの空間的再位置決め - Google Patents

複数の音響ストリームの空間的再位置決め Download PDF

Info

Publication number
JP2020108143A
JP2020108143A JP2019221087A JP2019221087A JP2020108143A JP 2020108143 A JP2020108143 A JP 2020108143A JP 2019221087 A JP2019221087 A JP 2019221087A JP 2019221087 A JP2019221087 A JP 2019221087A JP 2020108143 A JP2020108143 A JP 2020108143A
Authority
JP
Japan
Prior art keywords
acoustic
brir
spatial
processing device
spatial acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019221087A
Other languages
English (en)
Inventor
ウォン フー シム
Wong Hoo Sim
ウォン フー シム
テック チー リー
Teck Chee Lee
テック チー リー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Creative Technology Ltd
Original Assignee
Creative Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Creative Technology Ltd filed Critical Creative Technology Ltd
Publication of JP2020108143A publication Critical patent/JP2020108143A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • H04R3/14Cross-over networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/07Use of position data from wide-area or local-area positioning systems in hearing devices, e.g. program or information selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】好ましくは室内応答を含む個人化された空間音響伝達関数と音響入力信号を組み合わせるプロセッサを具備する音響レンダリングシステムを提供すること。【解決手段】個人化された空間音響伝達関数は、複数の個人のインイヤーマイク測定結果に由来する複数の候補伝達関数データセットを有するデータベースから選択される。あるいは、個人化された伝達関数データセットは、受聴者の実際のインイヤー測定結果に由来する。フォアグラウンドおよびバックグラウンド方向および距離について、フォアグラウンドおよびバックグラウンド位置が指定されるとともに、選択データセットからの伝達関数対とのマッチがなされる。音声および音楽等の入力音響の2つのチャネルが処理される。電話等の音声通信を受けた場合は、個人化された伝達関数の使用により、レンダリング対象の音楽がフォアグラウンドから、バックグラウンド空間音響位置に対応するバックグラウンドチャネルへと移動する。音声通話は、同時にフォアグラウンドチャネルへ伝達される。【選択図】図2

Description

関連出願の相互参照
本願は、2018年1月7日に出願された米国特許出願第62/614,482号「METHOD FOR GENERATING CUSTOMIZED SPATIAL AUDIO WITH HEAD TRACKING」と、2015年12月31日に出願されたシンガポール特許出願第10201510822Y号「A METHOD FOR GENERATING A CUSTOMIZED/PERSONALIZED HEAD RELATED TRANSFER FUNCTION」の優先権の利益を主張する、2016年12月28日に出願された国際特許出願第PCT/SG2016/050621号「A METHOD FOR GENERATING A CUSTOMIZED/PERSONALIZED HEAD RELATED TRANSFER FUNCTION」と、の開示内容の全体を援用するものであり、そのすべての内容を本明細書に援用する。さらに、本願は、2018年5月2日に出願された米国特許出願第15/969,767号「SYSTEM AND A PROCESSING METHOD FOR CUSTOMIZING AUDIO EXPERIENCE」および2018年9月19日に出願された米国特許出願第16/136,211号「METHOD FOR GENERATING CUSTOMIZED SPATIAL AUDIO WITH HEAD TRACKING」の開示内容の全体を援用するものである。
本発明は、ヘッドフォンを介してレンダリングするために音響を生成する方法およびシステムに関する。より詳細には、本発明は、音響ストリームと併せて空間音響位置と関連付けられた室内インパルス応答情報を有する個人化された空間音響伝達関数のデータベースを用いるとともに、個人化された空間音響伝達関数を用いて空間音響位置を生成することにより、ヘッドフォンを介してよりリアルな音響レンダリングを生成することに関する。
ユーザは、電話機の着信時に音楽を聴いていることが多く、音楽を中断せずに聴き続けたい場合がある。残念ながら、ほとんどの電話機は、着信を受ける際に音楽を消音するように構成されている。そこで、着信を受ける際にも音楽等の音響を中断せずに聴き続けることができ、また、2つの異なる音響源をユーザが識別できるようにし得る改良されたシステムが求められている。
上記を実現するため、本発明は、様々な実施形態において、バイノーラル信号をヘッドフォンに与えるように構成されたプロセッサ・システムであって、フォアグラウンド位置等の第1の位置において、音響を第1の入力音響チャネルに配置する手段と、バックグラウンド位置等の第2の位置において、音響を第2の入力音響チャネルに配置する手段と、を備えた、システムを提供する。
本発明の実施形態のうちのいくつかにおいて、このシステムは、少なくとも2つの音響ストリームと併せて空間音響位置と関連付けられた室内インパルス応答情報(HRTFまたはBRIR等)を有する個人化された空間音響伝達関数のデータベースを含む。これと併せて、少なくとも2つの場所に関する個人化されたBRIRを2つの入力音響ストリームと併用することにより、フォアグラウンド空間音響源およびバックグラウンド空間音響源を確立して、受聴者がヘッドフォンを通じて没入型の体験を得られるようにする。
本発明のいくつかの実施形態に係る、処理された音響の空間音響位置を示した図である。 本発明のいくつかの実施形態に係る、異なる空間音響位置における複数の異なる種類のメディアおよび音声通信のいずれか等からの音響源を提示するシステムを示した図である。 本発明の実施形態に係る、カスタマイズ用のBRIRを生成し、カスタマイズ用の受聴者特性を取得し、受聴者のカスタマイズBRIRを選択し、BRIRにより修正された音響をレンダリングするシステムを示した図である。
以下、本発明の好適な実施形態を詳しく参照する。好適な実施形態の例を添付の図面に示す。本発明をこれら好適な実施形態に関連して説明するが、本発明をこのような好適な実施形態に限定する意図ではないことが理解される。むしろ、添付の特許請求の範囲により規定される本発明の主旨および範囲に含むことができる代替、改良、および同等物をカバーすることが意図される。以下の説明において、多くの具体的詳細は、本発明の十分な理解を可能にするために示している。本発明は、これら具体的詳細の一部または全部を伴わずに実施することができる。他の例では、本発明を不必要に分かりにくくすることのないように、周知のメカニズムを詳細には説明していない。
本明細書においては、さまざまな図面の全体にわたって、同じ番号が同じ部分を表すことに留意するものとする。本明細書において図示および説明するさまざまな図面は、本発明のさまざまな特徴を示すのに用いている。特定の特徴がある図面において示され、別の図面では示されていない限り、別段の指定または当該特徴の構造上の本質的な組み込み禁止がある場合を除いて、これらの特徴は、十分に図示されているかの如くその他の図に表された実施形態に含まれるように適応できることが理解されるものとする。別段の指定のない限り、図面は必ずしも原寸に比例していない。図面上の如何なる寸法も、本発明の範囲を制限することを意図したものではなく、ほんの一例に過ぎない。
バイノーラル技術は、両耳に関する技術または両耳に用いられる技術を一般的に表すが、ユーザによる3次元場での音響の認識を可能にする。これは、いくつかの実施形態においては、バイノーラル室内インパルス応答(BRIR)およびその関連するバイノーラル室内伝達関数(BRTF)の決定および使用により実現される。BRIRは、スピーカからの音波と受聴者の耳、頭部および胴体、さらには室内の壁および他の物体との相互作用をシミュレートする。あるいは、いくつかの実施形態においては、頭部伝達関数(HRTF)が用いられる。HRTFは、無響環境における相互作用を表すインパルス応答に対応する周波数領域の伝達関数である。すなわち、インパルス応答はここで、受聴者の耳、頭部および胴体との音の相互作用を表す。
HRTFまたはBRTFを決定する既知の方法によれば、実在の室内のいくつかのスピーカ位置それぞれについて、ステレオインパルス応答(IR)を記録するのに、実在のまたはダミーのヘッドマイクおよびバイノーラルマイクが用いられる。すなわち、各位置について、片耳に1つずつ、一対のインパルス応答が生成される。この対をBRIRと称する。そして、これらのBRIRを用いて音楽トラックまたは他の音響ストリームの畳み込み(フィルタリング)を行うとともに、結果をミキシングして、ヘッドフォンを介して再生することができる。正しいイコライゼーションが適用された場合は、BRIRが記録された室内のスピーカ位置で再生されているかのように、音楽のチャネルが聞こえることになる。
ユーザは、電話機の着信時に音楽を聴いていることが多く、着信を受ける際に音楽を中断せずに聴き続けたい場合がある。消音機能を呼び出すのではなく、2つの別個の音響信号すなわち電話および音楽を同じチャネルに供給することができる。しかしながら、人間にとって、一般的に、同じ方向から来る音源を識別することは難しい。この問題を解決するため、一実施形態によれば、電話の着呼時に、音楽が第1の位置から、バックグラウンド位置等の第2の位置におけるスピーカまたはチャネルへと向けられる。すなわち、音楽および音声通信は、異なる位置に配置される。残念ながら、これらレンダリング音響ストリームを位置決めする方法は、マルチスピーカセットアップと併用される場合に、音源の分離を可能にするものの、今日の音声通信の大部分は携帯電話経由であり、これらは通例、マルチチャネルスピーカセットアップに接続されていない。さらに、このような方法をマルチチャネルセットアップと併用する場合であっても、スピーカの物理的な位置と完全には一致しない位置に対して、パンにより音響源が指定される場合には、最適な結果が得られない。これは、知覚された音響位置をマルチチャネルスピーカ位置の間の場所に移動させる従来のパンの方法により、当該位置を近似する場合に、受聴者が空間音響位置を厳密に定位するのが困難である点に一部起因する。
本発明は、HRTF等の使用により、少なくとも個人の頭部、胴体、および耳が音響に及ぼす影響をシミュレートする伝達関数を用いて仮想化された位置を使用することにより、音声通話および音楽を異なる空間音響位置に自動的に位置決めすることによって、ヘッドフォンを介した音声通信の問題を解決する。より好ましくは、BRIRにより音響ストリームを処理することによって、音響に対する室内の影響が考慮される。しかしながら、個人化されていない市販のBRIRデータセットは、ほとんどのユーザに、良好ではない方向性の感覚、および知覚される音源に対する良好でない距離の感覚を与える。このことは、音源を区別するに際して困難性を生じさせるかもしれない。
これらの更なる問題を解決するため、本発明では、いくつかの実施形態において、個人化されたBRIRを使用する。一実施形態において、個人化されたHRTFまたはBRIRデータセットは、マイクを受聴者の耳に挿入し、記録セッションにおいてインパルス応答を記録することにより生成される。これは、時間の掛かるプロセスであり、携帯電話または他の音響ユニットの販売に含めるのが不都合となる場合がある。別の実施形態において、音声および音楽の音源は、個々の受聴者について、画像ベースの特性の抽出に由来する個人化されたBRIR(または、関連するBRTF)を用いることにより、第1(たとえば、フォアグラウンド)および第2(たとえば、バックグラウンド)の別個の場所に定位される。前記特性は、測定される複数の個人について、個人化された空間音響伝達関数の候補プールを有するデータベースから、適切な個人化されたBRIRを決定するのに用いられる。少なくとも2つの別個の空間音響位置それぞれに対応する個人化されたBRIRは、第1および第2の音響ストリームを2つの異なる空間音響位置へと向けるのに用いられるのが好ましい。
さらに、受聴者により2つの音源の一方がより近いと判定され、2つの音源の他方がより遠いと判断された場合に、人間は2つの音源をより良好に識別可能であることが知られているため、いくつかの実施形態においては、抽出された画像ベースの特性を用いて導出された個人化されたBRIRをて、バックグラウンド空間位置のある距離に音楽が自動的に配置され、より近くの距離に音声が配置される。
別の一実施形態において、抽出される画像ベースの特性は、携帯電話により生成される。別の実施形態において、音声通話の優先度が低いと判断され、例えばスイッチを作動させることにより生成される、受聴者からの制御信号が受信されると、音声通話がフォアグラウンドバックグラウンドへと向けられ、音楽がフォアグラウンドへと向けられる。さらに別の実施形態においては、音声通話の優先度が低いと判断され、且つ受聴者からの制御信号が受信されると、同じ方向の異なる距離に対応する個人化されたBRIRを用いて、音声通話の見かけの距離が増加され、音楽の見かけの距離が減少される。
本明細書の実施形態のほとんどがヘッドフォンと併用される個人化されたBRIRを記載していることが理解理解されるべきであるが、記載の音声通信と併せてメディアストリームを位置決めする技術は、図3に関して記載するステップに従って、ユーザに対してカスタマイズされた任意の適切な伝達関数にも拡張可能である。
本発明の範囲は、それぞれの第1の音響源および音声通信をユーザの周囲の任意の位置に配置することをカバーすることを意図するものであることが理解されるものとする。さらに、本明細書において用いられるフォアグラウンドおよびバックグラウンドは、受聴者の前方または受聴者の後方の各エリアに限定されるものであると意図されるものではない。むしろ、フォアグラウンドは、その最も一般的な意味において、2つの別個の位置の目立つまたは重要な方を表すものとして解釈されるべきであり、一方のバックグラウンドは、別個の位置の目立たない方を表す。さらに、本発明の範囲は、ごく一般的な意味において、本明細書に記載の技術に従ってHRTFまたはBRIRを用いて、第1の音響ストリームを第1のへに、第2の音響ストリームを第2の空間音響位置に向けることにあることに留意するものとする。さらに、本発明のいくつかの実施形態は、近い距離をフォアグラウンド位置に割り当て、遠い距離をバックグラウンド位置に割り当てる代わりに、信号の減衰の同時適用により、フォアグラウンド位置またはバックグラウンド位置のいずれかについて、ユーザの周囲の任意の方向位置の選択へと拡張可能であることに留意するものとする。以下、本発明の実施形態に係る、二対のBRIRの適用によりフォアグラウンド位置およびバックグラウンド位置を表すフィルタリング回路をその最も簡単な形態において最初に示す。
図1は、本発明のいくつかの実施形態に係る、処理された音響の空間音響位置を示した図である。まず、受聴者105は、ヘッドフォン103を通じて、音楽等の第1の音響信号を聴くことができる。第1の音響ストリームに適用されたBRIRを用いて、受聴者は、第1の音響ストリームが第1の音響位置102から到来していることを知覚する。いくつかの実施形態において、これは、フォアグラウンド位置である。一実施形態において、ある技術は、このフォアグラウンド位置を、受聴者105に対して0°位置に配置する。一実施形態における電話呼の着信等、トリガーとなるイベントが発生した場合は、第1の音響信号が第2の位置104へと案内される一方、第2のストリーム(たとえば、音声通信または電話呼)が第1の位置(102)へと案内される。図示の例示的な実施形態において、この第2の位置は、200°位置に配置されており、いくつかの実施形態においては、目立たないまたはバックグラウンド位置として説明される。200°位置は、非限定的な一例として選択されるに過ぎない。この第2の位置における音響ストリームの配置は、対象となる受聴者の第2の位置の方位角、仰角、および距離に対応するBRIR(または、BRTF)を用いて実現されるのが好ましい。
一実施形態においては、第1の音響ストリームの第2の位置(たとえば、バックグラウンド)への移行は、第1の音響ストリームが中間の空間位置を通って移動している感覚を一切与えることなく、突然発生する。これを、中間の空間位置を示さない経路110によって図示する。別の実施形態においては、音響が中間点112および114に短い異動期間で位置決めされ、フォアグラウンド位置102からバックグラウンド位置104まで直接、またはこれに換えて円弧状に移動する感覚を与える。好適な一実施形態においては、中間点112および114に対するBRIRを使用して、音響ストリームを空間的に位置決めする。代替実施形態において、移動の感覚は、フォアグラウンド位置およびバックグラウンド位置に対するBRIRを使用し、これらフォアグラウンド位置およびバックグラウンド位置に対応する仮想スピーカ間をパンすることによって実現される。いくつかの実施形態において、ユーザは、音声通信(たとえば、電話)が優先ステータスに値しないことを認識するとともに、電話を第2の位置(たとえば、バックグラウンド位置)あるいはユーザが選択する第3の位置へと格下げし、音楽を第1の(たとえば、フォアグラウンド)位置に戻すことを選ぶことができる。一実施形態において、これは、音楽に対応する音響ストリームをフォアグラウンド(第1の)位置102に送り返し、音声通信をバックグラウンド位置104へと送ることにより実行される。別の実施形態において、この優先度の再格付けは、音声通話を受聴者の頭部105から遠ざけ、音楽を近づけることによって実行される。これは、異なる距離で捕捉され、捕捉された測定結果からの計算または補間によって新たな距離を表す、受聴者についての新たなHRTFまたはBRTFを割り当てることにより行われるのが好ましい。たとえば、音楽の優先度をバックグラウンド位置104から高くするため、見かけの距離を空間音響位置118または116まで短くすることができる。このような距離の短縮は、音楽の音響ストリームの新たなHRTFまたはBRTFによる処理によって実現されるのが好ましいが、これにより、音声通信信号に対して音楽の音量が大きくなる。いくつかの実施形態においては、この場合も捕捉HRTF/BRTF値の選択または補間によって、受聴者の頭部105からの音声信号の距離を同時に増加させることができる。この補間/計算は、3つ以上の点を用いて行うことができる。たとえば、2本の線(ABおよびCD)の交点である点を得るためには、補間/計算には、点A、B、C、およびDを要する場合がある。
これに換えて、音声通信を生成する空間音響位置は、再格付けステップにおいて固定位置に維持されるか、または増加されることができる。いくつかの実施形態において、2つの別個の音響ストリームは、等しい目立つ度合いを享受する。
さらに他の実施形態において、ユーザは、ユーザインターフェースから、上記ストリームのうちの少なくとも1つに対する空間音響位置を選定可能であり、より好ましくは、上記ストリームのすべてに対する単一または複数の場所を選定可能である。
図2は、本発明のいくつかの実施形態に係る、異なる空間音響位置における音響源および音声通信をシミュレートするシステムを示した図である。図2は、第1の空間音響位置に対して別個のフィルタ対(すなわち、フィルタ207、208)を使用し、第2の空間音響位置に対してフィルタ209、210を使用することにより空間音響位置決めシステムに入る2つの異なるストリーム(202および204)を大略示している。すべてのフィルタリング済みストリームには、ヘッドフォンの左カップ用信号が加算器214で加算され、ヘッドフォン216の右カップ用のフィルタリング結果が同様に加算器215で加算される前に、利得222〜225を適用することができる。この一群のハードウェアモジュールは、関与する基本原理を示しているが、他の実施形態は、図3に示すように、(携帯電話等の)音響レンダリングモジュール730のメモリ732等のメモリに記憶されたBRRIまたはHRTFを使用する。いくつかの実施形態において、受聴者は、個人のHRTFのほか、室内応答を有する伝達関数を選択することによって第1および第2の空間音響位置が生成されるという事実により、これらの空間音響位置の識別が補助される。好適な実施形態において、第1および第2の位置は、受聴者に対してカスタマイズされたBRIRを用いて決定される。
ヘッドフォンを介してレンダリングするシステムおよび方法は、直接的なインイヤーマイク測定あるいはインイヤーマイク測定が用いられない場合の個人化されたBRIR/HRIRデータセットによりHRTFまたはBRTFが受聴者に対して個別化される場合に最も良く作用する。本発明の好適な実施形態によれば、BRIRを生成するあるカスタム法が用いられるが、これは、図3により大略示すように、画像ベースの特性のユーザからの抽出およびBRIR候補プールからの適切なBRIRの決定を含む。より詳細には、図3は、本発明の実施形態に係る、カスタマイズ用のHRTFを生成し、カスタマイズ用の受聴者特性を取得し、受聴者のカスタマイズHRTFを選択し、相対的なユーザ頭部の移動で正しく機能するように適応された回転フィルタを提供し、BRIRにより修正された音響をレンダリングするシステムを示している。抽出デバイス702は、受聴者の音響関連物理的特性を識別して抽出するように構成されたデバイスである。好適な実施形態においては、これらの特性(たとえば、耳の高さ)を直接測定するようにブロック702を構成可能であるが、関連する測定結果は、少なくともユーザの片耳または両耳を含むように取得されたユーザの画像から抽出される。これらの特性の抽出に必要な処理は、抽出デバイス702において行われるのが好ましいものの、他の場所で行われてもよい。非限定的な一例として、これらの特性は、画像センサ704からの画像の受信後に、リモートサーバ710のプロセッサにより抽出することも可能である。
好適な一実施形態においては、画像センサ704がユーザの耳の画像を取得し、プロセッサ706は、ユーザの関連する特性を抽出してリモートサーバ710に送信するように構成されている。たとえば、一実施形態においては、動的形状モデルの使用により、耳介画像中のランドマークを識別するとともに、これらのランドマーク、それぞれの幾何学的関係、および直線距離を用いて、記憶されたBRIRデータセットの集合すなわちBRIRデータセットの候補プールからのカスタマイズBRIRの生成に関連するユーザの特性を識別することができる。他の実施形態においては、RGTモデル(回帰ツリーモデル)の使用により、特性を抽出する。さらに他の実施形態においては、ニューラルネットワーク等の機械学習および他の形態の人工知能(AI)の使用により、特性を抽出する。ニューラルネットワークの一例は、畳み込みニューラルネットワークである。新たな受聴者の固有の物理的特性を識別する複数の方法の詳細については、2016年12月28日に出願された国際特許出願第PCT/SG2016/050621号「A Method for Generating a customized Personalized Head Related Transfer Function」に記載されており、そのすべての開示内容を本明細書に援用する。
リモートサーバ710は、インターネット等のネットワークを介してアクセス可能であることが好ましい。リモートサーバは、メモリ714にアクセスし、抽出デバイス702において抽出された物理的特性または他の画像関連特性を用いて、最もマッチするBRIRデータセットを決定する選択プロセッサ710を具備するのが好ましい。選択プロセッサ712は、複数のBRIRデータセットを有するメモリ714にアクセスするのが好ましい。すなわち、方位角および仰角と、おそらくは頭部傾斜についても、好ましくは適切な角度の点ごとに、候補プールの各データセットがBRIR対を有することになる。たとえば、方位角および仰角の3°ごとの測定結果の取得により、BRIR候補プールを構成する、サンプリング個人のBRIRデータセットを生成することができる。
上述の通り、これらは、中規模(すなわち、100人超)の集団に対するインイヤーマイクを用いた測定により導出されるのが好ましいものの、より小さな個人群でも正しく機能し得るとともに、各BRIRセットと関連付けられた類似の画像関連特性とともに記憶される。これらは、一部が直接測定により生成され、一部が補間により生成されて、BRIR対の球面グリッドを構成することができる。部分に測定され/部分的に補間されたグリッドであっても、適切な方位角および仰角値によって、BRIRデータセットからの点の適切なBRIR対が識別されたら、グリッド線上に位置しない別の点についても補間可能となる。たとえば、任意の適切な補間法を使用することができ、好ましくは周波数領域において、隣接線形補間、双線形補間、および球面三角補間が挙げられるが、これらに限定されない。
一実施形態において、メモリ714に記憶されたBRIRデータセットはそれぞれ、少なくとも受聴者の全球グリッドを含む。このような場合は、音源の配置に関して、(受聴者の周りの水平面上の、すなわち耳の高さにおける)方位角または仰角の如何なる角度をも選択することができる。他の実施形態においては、BRIRデータセットがより限定されており、一例においては、従来のステレオ配置にマッチする、室内におけるスピーカ配置(すなわち、まっすぐ前のゼロポジションに対して+30°および−30°、または、全球グリッドの別の部分集合において、5.1システムもしくは7.1システム等に限定されないマルチチャネル配置のためのスピーカ配置)の生成に必要なBRIR対に限定されている。
HRIRは、頭部インパルス応答である。これは、無響条件下における時間領域での音源から受信者までの音の伝播を完全に記述する。これに含まれる情報のほとんどは、測定対象の人物の生理機能および人体測定に関する。HRTFは、頭部伝達関数である。これは、周波数領域における記述である点を除いて、HRIRと同じである。BRIRは、バイノーラル室内インパルス応答である。これは、室内で測定されるため、捕捉された具体的構成の室内応答を付加的に包含する点を除いて、HRIRと同じである。BRTFは、BRIRの周波数領域版である。本明細書においては、BRIRをBRTFで容易に置き換え可能であり、同様に、HRIRをHRTFで容易に置き換え可能であるため、これらを具体的に記載していなくても、本発明の実施形態がこれら容易に置き換え可能なステップをカバーする意図であることが理解されるものとする。このため、たとえば記載内容が別のBRIRデータセットへのアクセスを表している場合は、別のBRTFへのアクセスがカバーされていることが理解されるものとする。
図3は、メモリに記憶されたデータについて、サンプルの論理関係をさらに示している。メモリは、列716に複数の個人のBRIRデータセット(たとえば、HRTF DS1A、HRTF DS2A等)を含むものとして示している。これらは、各BRIRデータセットと関連付けられた特性、好ましくは画像関連特性によりインデックス付けされ、アクセスされる。列715に示される関連特性は、新たな受聴者の特定と、測定され列716、717、および718に記憶されたBRIRと関連付けられた特性をマッチングすることができる。すなわち、これらの列に示すBRIRデータセットの候補プールのインデックスとして作用する。列717は、基準位置ゼロにおいて記憶されたBRIRを表し、BRIRデータセットのその他と関連付けられており、受聴者の頭部回転のモニタリングおよびその対応に際して回転フィルタと組み合わせることにより、効率的な記憶および処理が可能となる。この選択肢の詳細については、2018年9月19日に出願された同時係属出願第16/136,211号「METHOD FOR GENERATING CUSTOMIZED SPATIAL AUDIO WITH HEAD TRACKING」に詳しく記載されており、そのすべての内容を本明細書に援用する。
一般的に、BRIR(または、HRTF)データセットの候補プールにアクセスする1つの目的は、ある人物に対してカスタマイズされた音響応答特性(BRIRデータセット等)を生成することである。いくつかの実施形態においては、上述の通り、これらを使用して、第1の位置および第2の位置と関連付けられた空間音響を正確に認識するために、音声通信およびメディアストリーム等の入力音響信号を処理して位置決めする。いくつかの実施形態において、個人化されたBRIR等のカスタマイズされた音響応答特性を生成することは、個人のバイオメトリックデータ等の画像関連特性を抽出することを含む。たとえば、このバイオメトリックデータには、耳介、一般的には当該人物の耳、頭部、および/または肩と関連するデータを含み得る。別の実施形態においては、(1)マルチプルマッチ(multiple match)、(2)マルチプルレコグナイザ(multiple−recognizer)型、および(3)クラスタ(cluster)ベース等の処理方法の使用により、(複数のヒットが得られた場合に)後で組み合わされて個人のカスタマイズBRIRデータセットを生成する中間データセットを生成する。これらは、数ある方法の中でもとりわけ、加重和を用いて組み合わせ可能である。場合により、マッチするものが1つしかない場合は、中間結果を組み合わせる必要がない。一実施形態において、中間データセットは、抽出特性に対する(候補プールからの)引き出しBRIRデータセットのマッチの近さに少なくとも一部が基づく。他の実施形態においては、マルチプルレコグナイザマッチステップが用いられることにより、プロセッサは、バイオメトリックデータに対応する複数のトレーニングパラメータに基づいて、1つまたは複数のデータセットを引き出す。さらに他の実施形態においては、クラスタベースの処理方法が用いられることにより、抽出データ(たとえば、バイオメトリックデータ)に基づいて、潜在的なデータセットがクラスタリングされる。クラスタには、一体的なクラスタリングまたはグルーピングによって、画像からの抽出データ(たとえば、バイオメトリック)とマッチする対応するBRIRデータセットとともにモデルを構成する関係を有する複数のデータセットを含む。
本発明のいくつかの実施形態においては、2つ以上の距離球面が記憶される。これは、受聴者から2つの異なる距離に対して生成された球面グリッドを表す。一実施形態においては、2つ以上の異なる球面グリッド距離球面に対して、1つの基準位置BRIRが記憶されるとともに関連付けられる。他の実施形態においては、各球面グリッドがそれ自体の基準BRIRを有し、適用可能な回転フィルタと併用することになる。選択プロセッサ712は、新たな受聴者に関して抽出デバイス702から受信された抽出特性に対してメモリ714中の特性をマッチングさせるのに用いられる。正しいBRIRデータセットが由来され得るように、さまざまな方法の使用によって、関連特性をマッチングさせる。上述の通り、これらには、マルチプルマッチ(Multiple−match)ベース処理方法、マルチプルレコグナイザ(Multiple recognizer)処理方法、クラスタ(Cluster)ベース処理方法によるバイオメトリックデータの比較を含むほか、2018年5月2日に出願された米国特許出願第15/969,767号「SYSTEM AND A PROCESSING METHOD FOR CUSTOMIZING AUDIO EXPERIENCE」に記載の方法もあり、そのすべての開示内容を本明細書に援用する。列718は、第2の距離で測定された個人のBRIRデータセットの組を表す。すなわち、この列は、測定された個人について記録された第2の距離でのBRIRデータセットを示す。別の例として、列716の第1のBRIRデータセットは、1.0m〜1.5mで取得することができる一方、列718のBRIRデータセットは、受聴者から5mで測定されたデータセットを表すことができる。BRIRデータセットは、全球グリッドを構成するのが理想的ではあるものの、本発明の実施形態は、従来のステレオセット、5.1マルチチャネル配置、7.1マルチチャネル配置のBRIR対を含む部分集合、ならびに、方位角および仰角の両者において3°以下ごとのBRIR対のほか、密度が不規則な球面グリッドを含むその他すべての球面グリッドの変形および部分集合を含むが、これらに限定されないその他すべての球面グリッドの変形および部分集合を含む、全球グリッドのありとあらゆる部分集合に当てはまる。たとえば、受聴者の後方位置よりも前方位置でグリッド点の密度がはるかに高い球面グリッドを含む可能性もある。さらに、列716および718の内容の構成は、測定および補間に由来して記憶されたBRIR対のみならず、前者から回転フィルタを含むBRIRへの変換を反映したBRIRデータセットを生成することによりさらに改良されたBRIR対にも当てはまる。
1つまたは複数のマッチングするBRIRデータセットまたは演算されたBRIRデータセットの決定後、これらのデータセットが音響レンダリングデバイス730に送信され、新たな受聴者に関して上述したマッチングもしくは他の技術によって決まるBRIRデータセット全体、またはいくつかの実施形態においては、選択された立体化された(spatialized)音響位置に対応する部分集合が記憶される。次いで、音響レンダリングデバイスは、一実施形態において、所望の方位角または仰角の位置のBRIR対を選択し、これらを入力音響信号に適用して、空間音響をヘッドフォン735に提供する。他の実施形態において、選択されたBRIRデータセットは、音響レンダリングデバイス730および/またはヘッドフォン735に結合された別個のモジュールに記憶される。他の実施形態において、レンダリングデバイスの利用可能な容量が限られている場合、レンダリングデバイスは、受聴者に最もマッチする関連特性データの識別情報または最もマッチするBRIRデータセットの識別情報のみを記憶し、リモートサーバ710から必要に応じて、(選択された方位角および仰角の)所望のBRIR対を実時間でダウンロードする。上述の通り、これらのBRIR対は、中規模(すなわち、100人超)の集団に対するインイヤーマイクを用いた測定により導出され、各BRIRデータセットと関連付けられた類似の画像関連特性とともに記憶されるのが好ましい。これらは、7200個すべての点を取得するのではなく、一部が直接測定により生成され、一部が補間により生成されて、BRIR対の球面グリッドを構成することができる。部分的に測定され/部分的に補間されたグリッドであっても、適切な方位角および仰角値を用いて、BRIRデータセットからの点の適切なBRIR対が識別されたら、グリッド線上に位置しない別の点についても補間可能となる。
カスタム選択されたHRTFまたはBRIRデータセットが個人に対して選択されると、これら個人化された伝達関数の使用により、ユーザまたはシステムは、メディアストリームおよび音声通信をそれぞれ位置決めする少なくとも第1および第2の空間音響位置を与えることができる。言い換えると、第1および第2の空間音響位置それぞれに対して一対の伝達関数を使用することにより、これらのストリームを仮想的に配置し、それによって、それらの別個の空間音響位置により、受聴者が選好する音響ストリーム(たとえば、電話またはメディアストリーム)に集中することを可能とする。本発明の範囲は、これに限定されるものではないが、映像と関連付けられた音響および音楽を含むすべてのメディアストリームをカバーすることが意図される。
上記発明は、明瞭な理解を目的として少し詳しく説明したが、添付の特許請求の範囲内で一定の変更および改良を実現可能であることが明らかとなるであろう。したがって、本実施形態は、説明のためであって、何ら限定的なものではないと考えられるべきである。また、本発明は、本明細書に記載の詳細に限定されず、添付の特許請求の範囲および同等物の範囲内で改良できるものとする。
102 第1の音響位置(フォアグラウンド位置)
103 ヘッドフォン
104 第2の音響位置(バックグラウンド位置)
105 受聴者
110 経路
112 中間点
114 中間点
116 空間音響位置
118 空間音響位置
202 ストリーム
204 ストリーム
207 フィルタ
208 フィルタ
209 フィルタ
210 フィルタ
214 加算器
215 加算器
216 ヘッドフォン
222 利得
223 利得
224 利得
225 利得
702 抽出デバイス
704 画像センサ
706 プロセッサ
710 リモートサーバ
712 選択プロセッサ
714 メモリ
715 列
716 列
717 列
718 列
720 BRIR生成
730 音響レンダリングデバイス
732 メモリ
735 ヘッドフォン

Claims (20)

  1. 空間音響位置伝達関数データセットを用いてイベントを処理する音響処理デバイスであって、
    少なくとも第1の空間音響位置および第2の空間音響位置のうちの選択された位置において、少なくとも音声通信ストリームおよびメディアストリームをそれぞれ含む第1の音響信号および第2の音響信号を位置決めするように構成された音響レンダリングモジュールであって、前記第1の空間音響位置および前記第2の空間音響位置がそれぞれ、前記空間音響位置伝達関数データセットからの第1の伝達関数および第2の伝達関数をそれぞれ用いてレンダリングされる、音響レンダリングモジュールと、
    電話呼の着信を含む音声通信イベントの開始をモニタリングし、前記電話呼が開始されると、前記音声通信を前記第1の空間音響位置に位置決めし、前記メディアストリームを前記第2の空間音響位置に位置決めすることにより、前記第1の音響信号および前記第2の音響信号を処理するモニタリングモジュールと、
    2つの出力チャネルを介して、結果として得られる音響をヘッドフォンにレンダリングするように構成された出力モジュールと、
    を備えた、音響処理デバイス。
  2. 前記空間音響位置伝達関数データセットが、個人に対してカスタマイズされたデータセットである個人化された頭部インパルス応答(HRIR)データセットまたは個人化されたバイノーラル室内インパルス応答(BRIR)データセットの一方である、請求項1に記載の音響処理デバイス。
  3. 前記個人の画像ベースの特性を入力画像から抽出し、個人の集団に対して提供された複数のHRIRまたはBRIRデータセットの候補プールを有するメモリから、前記個人化されたHRIRデータセットまたは前記個人化されたBRIRデータセットを決定するように構成された選択プロセッサに前記画像ベースの特性を送信するように構成された第2のプロセッサであり、前記HRIRまたはBRIRデータセットがそれぞれ、対応する画像ベースの特性と関連付けられた、第2のプロセッサをさらに備えた、請求項2に記載の音響処理デバイス。
  4. 前記選択プロセッサが、前記個人の抽出された画像ベースの特性を前記候補プールの抽出特性に対して比較することにより、前記候補プールにアクセスすることによって、前記個人化されたBRIRデータセットを決定して、近さの尺度に基づいて1つまたは複数のBRIRデータセットを識別するとともに、使用する処理方法が、マルチプルマッチ、マルチプルレコグナイザ型、およびクラスタベースのうちの1つである、請求項3に記載の音響処理デバイス。
  5. 前記決定された個人化されたBRIRデータセットからの前記第1の空間音響位置および前記第2の空間音響位置が、前記メモリ中の捕捉データセットから補間または他の演算方法により導出され、前記第1の空間音響位置および前記第2の空間音響位置がそれぞれ、フォアグラウンド位置およびバックグラウンド位置を含む、請求項2に記載の音響処理デバイス。
  6. 前記個人の受聴者により前記音声通話の優先順位が低いと判断され、対応する制御信号が生成されると、前記音声通話が前記バックグラウンド位置へと向けられ、音楽が前記フォアグラウンド位置へと向けられる、請求項5に記載の音響処理デバイス。
  7. 前記個人の受聴者により前記音声通話の優先順位が低いと判断され、対応する制御信号が生成されると、同じ方向の異なる距離に対応する個人化されたBRIRを用いて、前記音声通話の見かけの距離が増加され、音楽の見かけの距離が減少される、請求項2に記載の音響処理デバイス。
  8. 前記音声通信および前記メディアストリームのそれぞれの初期位置から前記第1の空間音響位置および前記第2の空間音響位置への位置決めが、突然行われる、請求項2に記載の音響処理デバイス。
  9. 前記入力画像を取得するように構成された携帯用画像捕捉デバイスをさらに備え、前記音響処理デバイスが、前記画像を取得し前記画像ベースの特性を抽出する携帯電話、通信デバイス、またはタブレットのうちの1つである、請求項2に記載の音響処理デバイス。
  10. 前記音声通信ストリームが終了すると、前記メディアストリームを前記第1の空間音響位置に再位置決めするように構成された、請求項1に記載の音響処理デバイス。
  11. 前記メディアストリームが、音楽を含む、請求項1に記載の音響処理デバイス。
  12. 同じ方向の異なる距離に対応する個人化されたBRIRからの第1の空間音響位置音伝達関数および第2の空間音響位置音伝達関数をそれぞれ用いて、音声通話の見かけの距離が増加され、音楽の見かけの距離が減少される、請求項1に記載の音響処理デバイス。
  13. 前記出力モジュールが、無線接続および有線接続のうちの一方を介して前記ヘッドフォンに結合された、請求項1に記載の音響処理デバイス。
  14. 前記出力モジュールが、デジタル−アナログ変換器を備え、前記ヘッドフォンへの結合が、アナログポートを通じて行われる、請求項1に記載の音響処理デバイス。
  15. 前記出力モジュールが、デジタル信号を前記ヘッドフォンに受け渡すように構成され、前記ヘッドフォンが、デジタル−アナログ変換器を備えた、請求項1に記載の音響処理デバイス。
  16. 前記第1の空間音響位置および前記第2の空間音響位置の少なくとも一方の場所を選択するように構成されたユーザインターフェースをさらに備えた、請求項1に記載の音響処理デバイス。
  17. ヘッドフォンへの音響ストリームを処理する方法であって、
    少なくとも第1の空間音響位置および第2の空間音響位置のうちの選択された位置において、少なくとも音声通信ストリームおよびメディアストリームをそれぞれ含む第1の音響信号および第2の音響信号を位置決めすることであって、前記第1の空間音響位置および前記第2の空間音響位置がそれぞれ、空間音響位置伝達関数データセットからの第1の伝達関数および第2の伝達関数をそれぞれ用いてレンダリングされる、ことと、
    電話呼の着信を含む音声通信イベントの開始をモニタリングし、前記電話呼が開始されると、前記音声通信を前記第1の空間音響位置に位置決めし、前記メディアストリームを前記第2の空間音響位置に位置決めすることにより、前記第1の音響信号および前記第2の音響信号を処理することであって、前記第2の空間音響位置に対して、少なくとも1つの関連する室内インパルス応答が存在する、ことと、
    2つの出力チャネルを介して、結果として得られる音響をヘッドフォンにレンダリングすることと、
    を含む、方法。
  18. 前記空間音響位置伝達関数データセットが、個人に対してカスタマイズされたHRIRデータセットまたはBRIRデータセットの一方である、請求項17に記載の方法。
  19. 前記カスタマイズが、前記個人の画像ベースの特性を入力画像から抽出し、個人の集団に対して提供された複数のHRIRまたはBRIRデータセットの候補プールを有するメモリから、個人化されたHRIRデータセットまたは個人化されたBRIRデータセットを決定するように構成された選択プロセッサに前記画像ベースの特性を送信することを含み、前記HRIRまたはBRIRデータセットがそれぞれ、対応する画像ベースの特性と関連付けられた、請求項18に記載の方法。
  20. 前記個人化されたBRIRデータセットを決定することが、前記候補プールの既存のBRIRデータセット間の補間を含む、請求項19に記載の方法。
JP2019221087A 2018-12-07 2019-12-06 複数の音響ストリームの空間的再位置決め Pending JP2020108143A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/213,979 2018-12-07
US16/213,979 US10966046B2 (en) 2018-12-07 2018-12-07 Spatial repositioning of multiple audio streams

Publications (1)

Publication Number Publication Date
JP2020108143A true JP2020108143A (ja) 2020-07-09

Family

ID=68732857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019221087A Pending JP2020108143A (ja) 2018-12-07 2019-12-06 複数の音響ストリームの空間的再位置決め

Country Status (7)

Country Link
US (1) US10966046B2 (ja)
EP (1) EP3664477B1 (ja)
JP (1) JP2020108143A (ja)
KR (1) KR20200070110A (ja)
CN (1) CN111294724B (ja)
SG (1) SG10201911051PA (ja)
TW (1) TWI808277B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023058466A1 (ja) * 2021-10-06 2023-04-13 ソニーグループ株式会社 情報処理装置およびデータ構造

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG10201800147XA (en) 2018-01-05 2019-08-27 Creative Tech Ltd A system and a processing method for customizing audio experience
US10390171B2 (en) 2018-01-07 2019-08-20 Creative Technology Ltd Method for generating customized spatial audio with head tracking
US11418903B2 (en) 2018-12-07 2022-08-16 Creative Technology Ltd Spatial repositioning of multiple audio streams
WO2022108494A1 (en) * 2020-11-17 2022-05-27 Dirac Research Ab Improved modeling and/or determination of binaural room impulse responses for audio applications
US11871208B2 (en) * 2022-01-14 2024-01-09 Verizon Patent And Licensing Inc. Methods and systems for spatial rendering of multi-user voice communication
CN114696961B (zh) * 2022-05-23 2022-11-15 荣耀终端有限公司 一种多媒体数据传输方法和设备

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US984946A (en) * 1909-06-16 1911-02-21 Watson Simpson Lennon Car-coupling.
US6996244B1 (en) 1998-08-06 2006-02-07 Vulcan Patents Llc Estimation of head-related transfer functions for spatial sound representative
GB0419346D0 (en) 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
US7756281B2 (en) 2006-05-20 2010-07-13 Personics Holdings Inc. Method of modifying audio content
US7555354B2 (en) 2006-10-20 2009-06-30 Creative Technology Ltd Method and apparatus for spatial reformatting of multi-channel audio content
US8078188B2 (en) * 2007-01-16 2011-12-13 Qualcomm Incorporated User selectable audio mixing
EP2405670B1 (en) * 2010-07-08 2012-09-12 Harman Becker Automotive Systems GmbH Vehicle audio system with headrest incorporated loudspeakers
WO2012028906A1 (en) 2010-09-03 2012-03-08 Sony Ericsson Mobile Communications Ab Determining individualized head-related transfer functions
TWI573131B (zh) * 2011-03-16 2017-03-01 Dts股份有限公司 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器
US9030545B2 (en) 2011-12-30 2015-05-12 GNR Resound A/S Systems and methods for determining head related transfer functions
DK2834750T3 (en) 2012-04-02 2018-01-22 Sonova Ag Method for estimating the shape of an individual ear
CN104010265A (zh) * 2013-02-22 2014-08-27 杜比实验室特许公司 音频空间渲染设备及方法
DK2869599T3 (da) * 2013-11-05 2020-12-14 Oticon As Binauralt høreassistancesystem, der omfatter en database med hovedrelaterede overføringsfunktioner
EP3090576B1 (en) * 2014-01-03 2017-10-18 Dolby Laboratories Licensing Corporation Methods and systems for designing and applying numerically optimized binaural room impulse responses
DE102014214143B4 (de) * 2014-03-14 2015-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals im Frequenzbereich
US9900722B2 (en) 2014-04-29 2018-02-20 Microsoft Technology Licensing, Llc HRTF personalization based on anthropometric features
DE102014210215A1 (de) * 2014-05-28 2015-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Ermittlung und Nutzung hörraumoptimierter Übertragungsfunktionen
US9226090B1 (en) * 2014-06-23 2015-12-29 Glen A. Norris Sound localization for an electronic call
KR101627652B1 (ko) 2015-01-30 2016-06-07 가우디오디오랩 주식회사 바이노럴 렌더링을 위한 오디오 신호 처리 장치 및 방법
US9544706B1 (en) 2015-03-23 2017-01-10 Amazon Technologies, Inc. Customized head-related transfer functions
JP6754619B2 (ja) 2015-06-24 2020-09-16 三星電子株式会社Samsung Electronics Co.,Ltd. 顔認識方法及び装置
KR20180041668A (ko) 2015-08-14 2018-04-24 톰슨 라이센싱 포인트 클라우드로부터의 인간의 귀의 3d 복원
FR3040807B1 (fr) 2015-09-07 2022-10-14 3D Sound Labs Procede et systeme d'elaboration d'une fonction de transfert relative a la tete adaptee a un individu
CN108476370B (zh) 2015-10-26 2022-01-25 弗劳恩霍夫应用研究促进协会 用于生成实现仰角渲染的滤波后的音频信号的装置和方法
SG10201510822YA (en) 2015-12-31 2017-07-28 Creative Tech Ltd A method for generating a customized/personalized head related transfer function
SG10201800147XA (en) 2018-01-05 2019-08-27 Creative Tech Ltd A system and a processing method for customizing audio experience
US9774979B1 (en) 2016-03-03 2017-09-26 Google Inc. Systems and methods for spatial audio adjustment
FR3051951B1 (fr) 2016-05-27 2018-06-15 Mimi Hearing Technologies GmbH Procede d'elaboration d'un modele deformable en trois dimensions d'un element, et systeme associe
US9584946B1 (en) * 2016-06-10 2017-02-28 Philip Scott Lyren Audio diarization system that segments audio input
US10187740B2 (en) 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
US10219095B2 (en) * 2017-05-24 2019-02-26 Glen A. Norris User experience localizing binaural sound during a telephone call
US10390171B2 (en) 2018-01-07 2019-08-20 Creative Technology Ltd Method for generating customized spatial audio with head tracking

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023058466A1 (ja) * 2021-10-06 2023-04-13 ソニーグループ株式会社 情報処理装置およびデータ構造

Also Published As

Publication number Publication date
KR20200070110A (ko) 2020-06-17
US10966046B2 (en) 2021-03-30
US20200186954A1 (en) 2020-06-11
SG10201911051PA (en) 2020-07-29
TW202028929A (zh) 2020-08-01
CN111294724A (zh) 2020-06-16
TWI808277B (zh) 2023-07-11
EP3664477A1 (en) 2020-06-10
EP3664477B1 (en) 2024-07-03
CN111294724B (zh) 2023-08-15

Similar Documents

Publication Publication Date Title
CN111294724B (zh) 多个音频流的空间重新定位
KR102574082B1 (ko) 머리 추적 기능이 있는 맞춤형 공간 오디오 생성 방법
US9131305B2 (en) Configurable three-dimensional sound system
Algazi et al. Headphone-based spatial sound
US8073125B2 (en) Spatial audio conferencing
US11849303B2 (en) Spatial repositioning of multiple audio streams
EP3644628A1 (en) Systems and methods for modifying room characteristics for spatial audio rendering over headphones
US20150189455A1 (en) Transformation of multiple sound fields to generate a transformed reproduced sound field including modified reproductions of the multiple sound fields
US20110026745A1 (en) Distributed signal processing of immersive three-dimensional sound for audio conferences
CN104010265A (zh) 音频空间渲染设备及方法
CN112005559B (zh) 改进环绕声的定位的方法
US20190394596A1 (en) Transaural synthesis method for sound spatialization
CN113196805A (zh) 用于获得及再现双声道录音的方法
US10142760B1 (en) Audio processing mechanism with personalized frequency response filter and personalized head-related transfer function (HRTF)
Lee et al. A real-time audio system for adjusting the sweet spot to the listener's position
US20200059750A1 (en) Sound spatialization method
US10848898B2 (en) Playing binaural sound clips during an electronic communication
WO2012104297A1 (en) Generation of user-adapted signal processing parameters
JP2018152834A (ja) 仮想聴覚環境において音声信号出力を制御する方法及び装置
JP2023155921A (ja) 情報処理装置、情報処理端末、情報処理方法、およびプログラム
WO2023085186A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US11218832B2 (en) System for modelling acoustic transfer functions and reproducing three-dimensional sound
O’Dwyer Sound Source Localization and Virtual Testing of Binaural Audio
WO2023208333A1 (en) Devices and methods for binaural audio rendering
Tan Binaural recording methods with analysis on inter-aural time, level, and phase differences

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240501