JP7489488B2 - オーディオシーンの関心空間を表現する方法および装置 - Google Patents
オーディオシーンの関心空間を表現する方法および装置 Download PDFInfo
- Publication number
- JP7489488B2 JP7489488B2 JP2022566119A JP2022566119A JP7489488B2 JP 7489488 B2 JP7489488 B2 JP 7489488B2 JP 2022566119 A JP2022566119 A JP 2022566119A JP 2022566119 A JP2022566119 A JP 2022566119A JP 7489488 B2 JP7489488 B2 JP 7489488B2
- Authority
- JP
- Japan
- Prior art keywords
- space
- audio
- syntax element
- audio scene
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 235000009508 confectionery Nutrition 0.000 claims description 12
- 238000009877 rendering Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 16
- 238000005096 rolling process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- General Health & Medical Sciences (AREA)
Description
本願は、2021年5月5日に出願された米国仮出願第63/184,571号「REPRESENTING SPACE OF INTEREST OF AUDIO SCENE」に対する優先権の利益を主張する、2021年9月29日に出願された米国特許出願第17/489,212号「METHOD AND APPARATUS FOR REPRESENTING SPACE OF INTEREST OF AUDIO SCENE」に対する優先権の利益を主張する。この出願は、先の出願の開示は、その全体が参照により本明細書に援用される。
本開示は、オーディオシーン表現に概ね関する実施形態を記載する。
Claims (13)
- オーディオシーンの関心空間を表す方法であって、
少なくとも1つのプロセッサが、前記オーディオシーンについてのオーディオシーンデータを復号化することであって、前記オーディオシーンデータは、(i)前記オーディオシーンを表す複数のアイテムについてのオーディオコンテンツと、(ii)前記複数のアイテムのサブセットのタイプが視聴者空間と関連するタイプであることを示す第1の構文要素と、(iii)前記視聴者空間のサブタイプが信号伝達されるかどうかを示す第2の構文要素と、を含む、復号化することと、
前記プロセッサが、前記第1の構文要素において示されるような、前記視聴者空間と関連する前記複数のアイテムの前記サブセットの前記タイプに基づいて前記複数のアイテムの前記サブセットについての前記オーディオコンテンツの部分を決定することと、
前記プロセッサが、前記オーディオコンテンツの前記決定される部分をレンダリングすることと、を含む、
方法。 - 前記オーディオシーンデータは、前記複数のアイテムの前記サブセットの数を示す第3の構文要素を含む、請求項1に記載の方法。
- 前記第3の構文要素は、前記複数のアイテムの前記サブセットの前記数が、1よりも大きいことを示し、前記オーディオシーンデータは、前記複数のアイテムの前記サブセットの各々についての識別インデックスを示す第4の構文要素を含む、請求項2に記載の方法。
- 前記第2の構文要素は、前記視聴者空間の前記サブタイプが信号伝達されることを示し、前記オーディオシーンデータは、前記視聴者空間の前記サブタイプを示す第5の構文要素を含む、請求項1に記載の方法。
- 前記第2の構文要素は、前記視聴者空間の前記サブタイプが信号伝達されないことを示し、前記視聴者空間の前記サブタイプは、ビデオシーンに基づいて決定される、請求項1に記載の方法。
- 前記視聴者空間の前記サブタイプは、前記オーディオシーンのスイートスポットと関連付けられるタイプまたは聴覚空間と関連付けられるタイプのうちの1つである、請求項1に記載の方法。
- オーディオシーンの関心空間を表す装置であって、
当該装置は、処理回路構成を含み、該処理回路構成は、
前記オーディオシーンについてのオーディオシーンデータを復号化するように構成され、前記オーディオシーンデータは、(i)前記オーディオシーンを表す複数のアイテムについてのオーディオコンテンツと、(ii)前記複数のアイテムのサブセットのタイプが視聴者空間と関連するタイプであることを示す第1の構文要素と、(iii)前記視聴者空間のサブタイプが信号伝達されるかどうかを示す第2の構文要素と、を含み、
前記第1の構文要素において示されるような、前記視聴者空間と関連する前記複数のアイテムの前記サブセットの前記タイプに基づいて前記複数のアイテムの前記サブセットについての前記オーディオコンテンツの部分を決定するように構成され、
前記オーディオコンテンツの前記決定される部分をレンダリングするように構成される、
装置。 - 前記オーディオシーンデータは、前記複数のアイテムの前記サブセットの数を示す第3の構文要素を含む、請求項7に記載の装置。
- 前記第3の構文要素は、前記複数のアイテムの前記サブセットの前記数が、1よりも大きいことを示し、前記オーディオシーンデータは、前記複数のアイテムの前記サブセットの各々についての識別インデックスを示す第4の構文要素を含む、請求項8に記載の装置。
- 前記第2の構文要素は、前記視聴者空間の前記サブタイプが信号伝達されることを示し、前記オーディオシーンデータは、前記視聴者空間の前記サブタイプを示す第5の構文要素を含む、請求項7に記載の装置。
- 前記第2の構文要素は、前記視聴者空間の前記サブタイプが信号伝達されないことを示し、前記視聴者空間の前記サブタイプは、ビデオシーンに基づいて決定される、請求項7に記載の装置。
- 前記視聴者空間の前記サブタイプは、前記オーディオシーンのスイートスポットと関連付けられるタイプまたは聴覚空間と関連付けられるタイプのうちの1つである、請求項7に記載の装置。
- 命令を含むコンピュータプログラムであって、前記命令は、少なくとも1つのプロセッサによって実行されるときに、請求項1~6のうちのいずれか1項に記載の方法を実行する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163184571P | 2021-05-05 | 2021-05-05 | |
US63/184,571 | 2021-05-05 | ||
US17/489,212 | 2021-09-29 | ||
US17/489,212 US11622221B2 (en) | 2021-05-05 | 2021-09-29 | Method and apparatus for representing space of interest of audio scene |
PCT/US2021/053000 WO2022235289A1 (en) | 2021-05-05 | 2021-09-30 | Method and apparatus for representing space of interest of audio scene |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023529788A JP2023529788A (ja) | 2023-07-12 |
JP7489488B2 true JP7489488B2 (ja) | 2024-05-23 |
Family
ID=83900776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022566119A Active JP7489488B2 (ja) | 2021-05-05 | 2021-09-30 | オーディオシーンの関心空間を表現する方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11622221B2 (ja) |
EP (1) | EP4122225A4 (ja) |
JP (1) | JP7489488B2 (ja) |
KR (1) | KR102711220B1 (ja) |
CN (1) | CN115589787A (ja) |
WO (1) | WO2022235289A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160066116A1 (en) | 2013-03-28 | 2016-03-03 | Dolby Laboratories Licensing Corporation | Using single bitstream to produce tailored audio device mixes |
JP2018532146A (ja) | 2015-08-25 | 2018-11-01 | クアルコム,インコーポレイテッド | コーディングされたオーディオデータのトランスポート |
WO2020187807A1 (en) | 2019-03-19 | 2020-09-24 | Koninklijke Philips N.V. | Audio apparatus and method therefor |
WO2021074007A1 (en) | 2019-10-14 | 2021-04-22 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7027982B2 (en) | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US8271107B2 (en) | 2006-01-13 | 2012-09-18 | International Business Machines Corporation | Controlling audio operation for data management and data rendering |
GB2474508B (en) | 2009-10-16 | 2015-12-09 | Norwell Sa | Audience measurement system |
EP2862370B1 (en) | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
WO2015150384A1 (en) | 2014-04-01 | 2015-10-08 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
EP3301951A1 (en) * | 2016-09-30 | 2018-04-04 | Koninklijke KPN N.V. | Audio object processing based on spatial listener information |
GB2567172A (en) * | 2017-10-04 | 2019-04-10 | Nokia Technologies Oy | Grouping and transport of audio objects |
GB2578715A (en) * | 2018-07-20 | 2020-05-27 | Nokia Technologies Oy | Controlling audio focus for spatial audio processing |
-
2021
- 2021-09-29 US US17/489,212 patent/US11622221B2/en active Active
- 2021-09-30 CN CN202180028709.0A patent/CN115589787A/zh active Pending
- 2021-09-30 WO PCT/US2021/053000 patent/WO2022235289A1/en unknown
- 2021-09-30 KR KR1020227041483A patent/KR102711220B1/ko active IP Right Grant
- 2021-09-30 JP JP2022566119A patent/JP7489488B2/ja active Active
- 2021-09-30 EP EP21936235.7A patent/EP4122225A4/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160066116A1 (en) | 2013-03-28 | 2016-03-03 | Dolby Laboratories Licensing Corporation | Using single bitstream to produce tailored audio device mixes |
JP2018532146A (ja) | 2015-08-25 | 2018-11-01 | クアルコム,インコーポレイテッド | コーディングされたオーディオデータのトランスポート |
WO2020187807A1 (en) | 2019-03-19 | 2020-09-24 | Koninklijke Philips N.V. | Audio apparatus and method therefor |
WO2021074007A1 (en) | 2019-10-14 | 2021-04-22 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
Also Published As
Publication number | Publication date |
---|---|
KR20230003091A (ko) | 2023-01-05 |
EP4122225A1 (en) | 2023-01-25 |
KR102711220B1 (ko) | 2024-09-30 |
CN115589787A (zh) | 2023-01-10 |
US20220360929A1 (en) | 2022-11-10 |
US11622221B2 (en) | 2023-04-04 |
EP4122225A4 (en) | 2023-10-11 |
WO2022235289A1 (en) | 2022-11-10 |
JP2023529788A (ja) | 2023-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11937070B2 (en) | Layered description of space of interest | |
JP7489488B2 (ja) | オーディオシーンの関心空間を表現する方法および装置 | |
JP7518191B2 (ja) | オーディオシーンのシグナリングラウドネス調整のための方法及び装置 | |
US11710491B2 (en) | Method and apparatus for space of interest of audio scene | |
JP7449405B2 (ja) | オーディオ処理における方法及び装置 | |
KR102705355B1 (ko) | 몰입형 미디어 상호운용성 | |
JP7505029B2 (ja) | 適応オーディオ配信およびレンダリング | |
US20230007349A1 (en) | Qualification test in subject scoring | |
KR20240110835A (ko) | 대칭 메시에 대한 적응적 양자화를 위한 방법 및 장치 | |
KR20230038272A (ko) | 몰입형 미디어 상용성 | |
JP2023525971A (ja) | 複数の測定による推定のための方法、装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7489488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |