JP7157985B2 - ユーザに再生するためのオーディオ信号をレンダリングするための装置および方法 - Google Patents
ユーザに再生するためのオーディオ信号をレンダリングするための装置および方法 Download PDFInfo
- Publication number
- JP7157985B2 JP7157985B2 JP2020559554A JP2020559554A JP7157985B2 JP 7157985 B2 JP7157985 B2 JP 7157985B2 JP 2020559554 A JP2020559554 A JP 2020559554A JP 2020559554 A JP2020559554 A JP 2020559554A JP 7157985 B2 JP7157985 B2 JP 7157985B2
- Authority
- JP
- Japan
- Prior art keywords
- head
- orientation
- user
- information
- optical sensor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/205—3D [Three Dimensional] animation driven by audio data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
- User Interface Of Digital Computer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
a)ユーザ向けの動画キャプチャセンサを備えた電子デバイス、
b)a)で説明した画像キャプチャデバイスの向きを決定する機能を提供するセンサ、
c)空間オーディオ信号を再生できるスピーカーシステム[任意選択]、
d)a)によってキャプチャされた画像シーケンスから頭の回転データを抽出し、その上このデータを目的の仮想オーディオ環境に適用して、レンダリングされた出力を、c)で説明したスピーカーシステムに提供するコントローラー。
Claims (24)
- 再生のためのオーディオ信号をユーザにレンダリングするための装置(10)であって、
前記装置(10)は、光学センサ(12)を使用して、前記ユーザの頭の向きに関する情報を決定するように構成され、
前記装置(10)は、前記光学センサ(12)に対して所定の位置関係で配置された配向センサ(14)を使用して、地球固定座標系における前記光学センサ(12)の向きに関する情報を決定するように構成され、
前記装置(10)は、前記光学センサ(12)の現在の向き、または前記光学センサ(12)を搭載または備える前記装置(10)の前記向きから実質的に独立し、地球固定座標系に対する前記頭の前記向きに関する少なくとも1つのパラメータを取得することによって、前記頭の前記向きに関する前記情報を決定するときに、前記光学センサ(12)の前記向きに関する前記情報を考慮するように構成され、
前記装置(10)は、前記ユーザの前記頭の前記向きに関する前記情報に応じて、オーディオ信号の空間レンダリングを実行するように構成される、装置(10)。 - 前記装置(10)が、前記ユーザの前記頭の前記向きに関する前記情報に応じてバイノーラルレンダリングを実行するように構成された、
請求項1に記載の装置(10)。 - 前記装置(10)が、前記光学センサ(12)を含むものであって、前記光学センサ(12)は、前記ユーザの頭を追跡するように配置されている、
請求項1または2に記載の装置(10)。 - 前記装置(10)が、前記ユーザの前記頭の正面方向と前記装置(10)の位置との間の角度を記述するヨー角情報を決定するように構成され、および/または
前記装置(10)が、前記ユーザの前記頭のロール角を記述するロール角情報を決定するように構成され、および/または
前記装置(10)が、前記ユーザの前記頭のピッチ角を記述するピッチ角情報を決定するように構成される、
請求項1から3のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記ユーザの前記頭の正面方向と前記装置(10)の位置との間のヨー角を記述するヨー角情報を決定するように構成され、前記ヨー角情報が、前記ユーザの前記頭の前記頭の正面方向と前記ユーザの前記頭から前記装置(10)への方向との間の方位角を記述する、
請求項1から4のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記ユーザの前記頭から前記装置への方向と前記光学センサの光軸の方向との間の偏差を少なくとも部分的に補償するように構成された、
請求項5に記載の装置(10)。 - 前記装置(10)が、垂直方向または頭の正面方向に対する前記ユーザの前記頭のロール角を記述するロール角情報を決定するように構成された、
請求項1から6のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記ユーザの前記頭の前記ロール角を記述する前記ロール角情報を決定するときに、前記光学センサ(12)の前記向きに関する前記情報に基づいて、前記装置(10)または前記光学センサのロール角を少なくとも部分的に補償するように構成された、
請求項7に記載の装置(10)。 - 前記装置(10)が、水平方向の配列に対する前記ユーザの前記頭のピッチ角を記述するピッチ角情報を決定するように構成された、
請求項1から8のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記ユーザの前記頭の前記ピッチ角情報を決定するときに、前記光学センサ(12)の前記向きに関する前記情報に基づいて、前記装置(10)または前記光学センサの前記向きを少なくとも部分的に補償するように構成された、
請求項9に記載の装置(10)。 - 前記装置(10)が、前記装置(10)内に配置された、または前記装置(10)に機械的に取り付けられたセンサからの情報に基づいて、前記頭の前記向きに関する前記情報を決定するように構成された、
請求項1から10のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記装置(10)内に配置された、または前記装置(10)に機械的に取り付けられたセンサからの情報に基づいて、前記頭の前記向きに関する前記情報を決定するように構成され、
前記装置(10)の外部にある1つ以上の追加センサに基づいている、
請求項1から11のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記光学センサ(12)からの前記情報に基づいて前記頭の前記向きに関する前記情報が確実には取得できないことが判明した場合にのみ、前記1つ以上の追加センサからの情報を考慮するように構成された、
請求項12に記載の装置(10)。 - 前記装置(10)が、前記頭から前記装置(10)への水平面への方向の投影である音響正面方向を決定するように構成され、
前記装置(10)が、前記音響正面方向に応じて前記オーディオ信号の前記空間レンダリングを実行するように構成された、
請求項1から13のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記頭から前記装置(10)への方向である音響正面方向を決定するように構成され、
前記装置(10)が、前記音響正面方向に応じて前記オーディオ信号の前記空間レンダリングを実行するように構成された、
請求項1から13のいずれか一項に記載の装置(10)。 - 前記装置(10)が、オーディオシーンの中心を前記音響正面方向にレンダリングするように構成された、
請求項14または15に記載の装置(10)。 - 前記装置(10)が、前記音響正面方向に対するピッチ角を記述する前記ピッチ角情報を決定するように構成された、
請求項14から16のいずれか一項に記載の装置(10)。 - 前記装置(10)が、仮想オーディオ環境の中心軸をユーザの頭と同じ高さに保つように構成された、
請求項1から17のいずれか一項に記載の装置(10)。 - 前記装置(10)が、前記頭の向きに関する前記情報を決定するときに、前記ユーザの頭と前記装置(10)との間の高さの差を残すように構成された、
請求項1から18のいずれか一項に記載の装置(10)。 - 前記装置(10)が携帯可能であり、および/または前記装置(10)がモバイル通信デバイスである、
請求項1から19のいずれか一項に記載の装置(10)。 - 前記装置(10)が、オーディオ会議またはオーディオ/ビデオ会議の複数の参加者からのオーディオ投稿を表す複数のオーディオ信号の空間レンダリングを実行するように構成され、および/または
前記装置(10)が、ブロードキャスト、またはローカル記憶メディア上のコンテンツ、またはストリーミングされたオーディオコンテンツの空間レンダリングを実行するように構成された、
請求項1から20のいずれか一項に記載の装置(10)。 - 前記装置(10)が、どの方位角位置で、およびどの高さまたは高度で、オーディオコンテンツがレンダリングされるべきかの情報を取得するように構成され、
前記装置(10)が、前記光学センサからの情報および前記光学センサ(12)の前記向きに関する前記情報を使用して、前記ユーザの視点から前記装置(10)の方位角位置に関する情報を決定するように構成され、
前記装置(10)が、前記光学センサ(12)からの前記情報および前記光学センサ(12)の前記向きに関する前記情報を使用して、地球固定座標系に対する前記頭の前記向きに関するパラメータを決定するように構成され、
前記装置(10)が、前記方位角位置に関する前記情報および前記地球固定座標系に対する前記頭の前記向きに関する前記パラメータを使用して、前記オーディオコンテンツをレンダリングするように構成された、
請求項1から21のいずれか一項に記載の装置(10)。 - 再生のためのオーディオ信号をユーザにレンダリングするための方法であって、
前記方法は、光学センサ(12)を使用して、前記ユーザの頭の向きに関する情報を決定することを含み、
前記方法は、前記光学センサ(12)に対して所定の位置関係で配置された配向センサ(14)を使用して、地球固定座標系における前記光学センサ(12)の向きに関する情報を決定することを含み、
前記方法は、前記光学センサ(12)の現在の向き、または前記光学センサ(12)を搭載または備える装置(10)の前記向きから実質的に独立し、地球固定座標系に対する前記頭の前記向きに関する少なくとも1つのパラメータを取得することによって、前記頭の前記向きに関する前記情報を決定するときに、前記光学センサ(12)の前記向きに関する前記情報を考慮することを含み、
前記方法は、前記ユーザの前記頭の前記向きに関する前記情報に応じて、オーディオ信号の空間レンダリングを実行することを含む、方法。 - コンピュータプログラムがコンピュータ上で実行されるときに、請求項23に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18169137 | 2018-04-24 | ||
EP18169137.9 | 2018-04-24 | ||
PCT/EP2019/060207 WO2019206827A1 (en) | 2018-04-24 | 2019-04-18 | Apparatus and method for rendering an audio signal for a playback to a user |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021522720A JP2021522720A (ja) | 2021-08-30 |
JP7157985B2 true JP7157985B2 (ja) | 2022-10-21 |
Family
ID=62110863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020559554A Active JP7157985B2 (ja) | 2018-04-24 | 2019-04-18 | ユーザに再生するためのオーディオ信号をレンダリングするための装置および方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11343634B2 (ja) |
EP (1) | EP3785452B1 (ja) |
JP (1) | JP7157985B2 (ja) |
CN (1) | CN112335264B (ja) |
BR (1) | BR112020021608A2 (ja) |
RU (1) | RU2759012C1 (ja) |
WO (1) | WO2019206827A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11304021B2 (en) * | 2018-11-29 | 2022-04-12 | Sony Interactive Entertainment Inc. | Deferred audio rendering |
US20220103965A1 (en) * | 2020-09-25 | 2022-03-31 | Apple Inc. | Adaptive Audio Centering for Head Tracking in Spatial Audio Applications |
US11750745B2 (en) | 2020-11-18 | 2023-09-05 | Kelly Properties, Llc | Processing and distribution of audio signals in a multi-party conferencing environment |
GB2601805A (en) * | 2020-12-11 | 2022-06-15 | Nokia Technologies Oy | Apparatus, Methods and Computer Programs for Providing Spatial Audio |
US20220225050A1 (en) * | 2021-01-13 | 2022-07-14 | Dolby Laboratories Licensing Corporation | Head tracked spatial audio and/or video rendering |
WO2023176389A1 (ja) * | 2022-03-15 | 2023-09-21 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及び記録媒体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130041648A1 (en) | 2008-10-27 | 2013-02-14 | Sony Computer Entertainment Inc. | Sound localization for user in motion |
US20150382130A1 (en) | 2014-06-27 | 2015-12-31 | Patrick Connor | Camera based adjustments to 3d soundscapes |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090219224A1 (en) * | 2008-02-28 | 2009-09-03 | Johannes Elg | Head tracking for enhanced 3d experience using face detection |
CN101350931B (zh) * | 2008-08-27 | 2011-09-14 | 华为终端有限公司 | 音频信号的生成、播放方法及装置、处理系统 |
JP5676487B2 (ja) | 2009-02-13 | 2015-02-25 | コーニンクレッカ フィリップス エヌ ヴェ | モバイル用途のための頭部追跡 |
EP2489195A1 (en) * | 2009-10-14 | 2012-08-22 | Nokia Corp. | Autostereoscopic rendering and display apparatus |
US9332372B2 (en) * | 2010-06-07 | 2016-05-03 | International Business Machines Corporation | Virtual spatial sound scape |
KR20130136566A (ko) * | 2011-03-29 | 2013-12-12 | 퀄컴 인코포레이티드 | 로컬 멀티-사용자 협업을 위한 모듈식 모바일 접속된 피코 프로젝터들 |
US9293138B2 (en) | 2013-05-14 | 2016-03-22 | Amazon Technologies, Inc. | Storing state information from network-based user devices |
CN103491397B (zh) * | 2013-09-25 | 2017-04-26 | 歌尔股份有限公司 | 一种实现自适应环绕声的方法和系统 |
CN113630711B (zh) * | 2013-10-31 | 2023-12-01 | 杜比实验室特许公司 | 使用元数据处理的耳机的双耳呈现 |
DE102014009298A1 (de) * | 2014-06-26 | 2015-12-31 | Audi Ag | Verfahren zum Betreiben eines Virtual-Reality-Systems und Virtual-Reality-System |
WO2016065137A1 (en) * | 2014-10-22 | 2016-04-28 | Small Signals, Llc | Information processing system, apparatus and method for measuring a head-related transfer function |
US9787846B2 (en) | 2015-01-21 | 2017-10-10 | Microsoft Technology Licensing, Llc | Spatial audio signal processing for objects with associated audio content |
US10705338B2 (en) | 2016-05-02 | 2020-07-07 | Waves Audio Ltd. | Head tracking with adaptive reference |
US10803642B2 (en) * | 2017-08-18 | 2020-10-13 | Adobe Inc. | Collaborative virtual reality anti-nausea and video streaming techniques |
WO2019046706A1 (en) * | 2017-09-01 | 2019-03-07 | Dts, Inc. | IDEAL POINT ADAPTATION FOR VIRTUALIZED AUDIO |
EP3486749B1 (en) * | 2017-11-20 | 2022-05-11 | Nokia Technologies Oy | Provision of virtual reality content |
US11082662B2 (en) * | 2017-12-19 | 2021-08-03 | Koninklijke Kpn N.V. | Enhanced audiovisual multiuser communication |
WO2019170874A1 (en) * | 2018-03-08 | 2019-09-12 | Sony Corporation | Electronic device, method and computer program |
-
2019
- 2019-04-18 CN CN201980040475.4A patent/CN112335264B/zh active Active
- 2019-04-18 RU RU2020138215A patent/RU2759012C1/ru active
- 2019-04-18 WO PCT/EP2019/060207 patent/WO2019206827A1/en active Search and Examination
- 2019-04-18 EP EP19717951.8A patent/EP3785452B1/en active Active
- 2019-04-18 JP JP2020559554A patent/JP7157985B2/ja active Active
- 2019-04-18 BR BR112020021608-9A patent/BR112020021608A2/pt unknown
-
2020
- 2020-10-22 US US17/077,740 patent/US11343634B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130041648A1 (en) | 2008-10-27 | 2013-02-14 | Sony Computer Entertainment Inc. | Sound localization for user in motion |
US20150382130A1 (en) | 2014-06-27 | 2015-12-31 | Patrick Connor | Camera based adjustments to 3d soundscapes |
Also Published As
Publication number | Publication date |
---|---|
EP3785452B1 (en) | 2022-05-11 |
JP2021522720A (ja) | 2021-08-30 |
EP3785452A1 (en) | 2021-03-03 |
RU2759012C1 (ru) | 2021-11-08 |
US20210044913A1 (en) | 2021-02-11 |
WO2019206827A1 (en) | 2019-10-31 |
CN112335264A (zh) | 2021-02-05 |
BR112020021608A2 (pt) | 2021-01-26 |
US11343634B2 (en) | 2022-05-24 |
CN112335264B (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7157985B2 (ja) | ユーザに再生するためのオーディオ信号をレンダリングするための装置および方法 | |
JP6799141B2 (ja) | 空間化オーディオを用いた複合現実システム | |
CN111466124B (zh) | 用于渲染用户的视听记录的方法,处理器系统和计算机可读介质 | |
CN109564504B (zh) | 用于基于移动处理空间化音频的多媒体装置 | |
US10681276B2 (en) | Virtual reality video processing to compensate for movement of a camera during capture | |
KR20190052086A (ko) | 공간화 오디오를 갖는 가상 현실, 증강 현실 및 혼합 현실 시스템들 | |
US20240098446A1 (en) | Head tracked spatial audio and/or video rendering | |
US20230179756A1 (en) | Information processing device, information processing method, and program | |
CN115699718A (zh) | 基于传声器方位对音频数据进行操作的系统、设备和方法 | |
CN110677781B (zh) | 利用编码光线引导扬声器阵列和麦克风阵列的系统和方法 | |
CN113906736A (zh) | 视频分发系统、视频分发方法和显示终端 | |
US20230283976A1 (en) | Device and rendering environment tracking | |
EP4221263A1 (en) | Head tracking and hrtf prediction | |
CN114866950A (zh) | 音频处理方法、装置、电子设备以及耳机 | |
JP6056466B2 (ja) | 仮想空間中の音声再生装置及び方法、並びにプログラム | |
CN115769566A (zh) | 基于显示方位进行声学回声消除的系统、设备和方法 | |
JP7047085B2 (ja) | 画像生成装置、画像生成方法、およびプログラム | |
CN115299026A (zh) | 基于显示器取向操纵音频数据的系统、设备和方法 | |
WO2021049356A1 (ja) | 再生装置、再生方法、及び記録媒体 | |
WO2024040571A1 (en) | Delay optimization for multiple audio streams | |
US20240196152A1 (en) | Spatial audio processing method and apparatus therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20201222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220930 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7157985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |