RU2020116816A - Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала - Google Patents
Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала Download PDFInfo
- Publication number
- RU2020116816A RU2020116816A RU2020116816A RU2020116816A RU2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A
- Authority
- RU
- Russia
- Prior art keywords
- dominant
- component
- initial output
- residual
- audio component
- Prior art date
Links
- 230000004886 head movement Effects 0.000 title claims 2
- 230000005236 sound signal Effects 0.000 claims 13
- 238000009877 rendering Methods 0.000 claims 5
- 239000011159 matrix material Substances 0.000 claims 3
- 230000007774 longterm Effects 0.000 claims 2
- 238000013507 mapping Methods 0.000 claims 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S3/004—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Claims (37)
1. Система, выполненная с возможностью кодирования входного аудиосигнала, основывающегося на канале или объекте, для воспроизведения, причем система содержит:
один или более процессоров; и
машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают системе выполнять операции, содержащие:
рендеринг входного аудиосигнала, основывающегося на канале или объекте, в начальное выходное представление;
определение оценки доминантного аудиокомпонента из входного аудиосигнала, основывающегося на канале или объекте, каковое определение включает в себя:
определение последовательности весовых компонентов доминантного аудиокомпонента для отображения начального выходного представления в доминантный аудиокомпонент и
определение оценки доминантного аудиокомпонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;
определение оценки направления или положения доминантного аудиокомпонента; и
кодирование начального выходного представления, весовых коэффициентов доминантного аудиокомпонента и по меньшей мере одного из направления или положения доминантного аудиокомпонента в качестве кодированного сигнала для воспроизведения.
2. Система по п. 1, в которой операции дополнительно содержат определение оценки остаточного микса, представляющей собой начальное выходное представление за вычетом рендеринга либо доминантного аудиокомпонента, либо его оценки.
3. Система по п. 1, в которой операции дополнительно содержат генерирование безэхового бинаурального микса входного аудиосигнала, основывающегося на канале или объекте, и определение оценки остаточного микса, причем оценкой остаточного микса является безэховый бинауральный микс за вычетом либо рендеринга доминантного аудиокомпонента, либо его оценки.
4. Система по п. 2, в которой операции дополнительно содержат определение последовательности остаточных матричных коэффициентов для отображения начального выходного представления в оценку остаточного микса.
5. Система по п. 1, в которой начальное выходное представление содержит представление посредством наушников или представление посредством громкоговорителя.
6. Система по п. 1, в которой входной аудиосигнал, основывающийся на канале или объекте, разбивается на элементы разбиения по времени и частоте, и упомянутая операция кодирования повторяется в отношении последовательности временных шагов и последовательности полос частот.
7. Система по п. 1, в которой начальное выходное представление содержит микс стереогромкоговорителей.
8. Система, выполненная с возможностью декодирования аудиосигнала, причем система содержит:
один или более процессоров; и
долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более процессорам выполнять операции, содержащие:
прием кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:
- начальное выходное представление, содержащее стерео даун-микс,
- направление доминантного аудиокомпонента и
- весовые коэффициенты доминантного аудиокомпонента;
определение оценочного доминантного компонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;
формирование отрендеренного бинаурализированного оценочного доминантного компонента, включая выполнение рендеринга оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента;
реконструкцию оценки остаточного компонента из начального выходного представления; и
генерирование выходного пространственно ориентированного аудиосигнала посредством объединения отрендеренного бинаурализированного оценочного доминантного компонента и оценки остаточного компонента.
9. Система по п. 8, в котором кодированный аудиосигнал дополнительно включает в себя последовательность остаточных матричных коэффициентов, представляющих остаточный аудиосигнал, и упомянутая реконструкция оценки остаточного компонента дополнительно содержит применение упомянутых остаточных матричных коэффициентов к начальному выходному представлению, чтобы реконструировать оценку остаточного компонента.
10. Система по п. 8, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления.
11. Система по п. 8, в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.
12. Система по п. 8, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления, и в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.
13. Долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более устройствам выполнять операции, содержащие:
рендеринг входного аудиосигнала, основывающегося на канале или объекте, в начальное выходное представление;
определение оценки доминантного аудиокомпонента из входного аудиосигнала, основывающегося на канале или объекте, каковое определение включает в себя:
определение последовательности весовых компонентов доминантного аудиокомпонента для отображения начального выходного представления в доминантный аудиокомпонент и
определение оценки доминантного аудиокомпонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;
определение оценки направления или положения доминантного аудиокомпонента; и
кодирование начального выходного представления, весовых коэффициентов доминантного аудиокомпонента и по меньшей мере одного из направления или положения доминантного аудиокомпонента в качестве кодированного сигнала для воспроизведения.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562256462P | 2015-11-17 | 2015-11-17 | |
US62/256,462 | 2015-11-17 | ||
EP15199854 | 2015-12-14 | ||
EP15199854.9 | 2015-12-14 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018121757A Division RU2722391C2 (ru) | 2015-11-17 | 2016-11-17 | Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020116816A true RU2020116816A (ru) | 2020-07-28 |
RU2818687C2 RU2818687C2 (ru) | 2024-05-03 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
RU2018121757A3 (ru) | 2020-03-25 |
ES2779603T3 (es) | 2020-08-18 |
JP6964703B2 (ja) | 2021-11-10 |
IL274432A (en) | 2020-06-30 |
JP2020110007A (ja) | 2020-07-16 |
RU2722391C2 (ru) | 2020-05-29 |
RU2018121757A (ru) | 2019-12-19 |
MX2018006075A (es) | 2019-10-14 |
IL274432B (en) | 2021-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10893375B2 (en) | Headtracking for parametric binaural output system and method | |
KR102672762B1 (ko) | 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치 | |
RU2017118830A (ru) | Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля | |
MX351577B (es) | Aparato y método para realizar un desvanecimiento de un espectro mdct a ruido blanco antes de aplicar fdns. | |
MY192214A (en) | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal | |
JP2016523467A5 (ru) | ||
MY191340A (en) | Method for and apparatus for decoding an ambisonics audio soundfield representation for audio playback using 2d setups | |
RU2015104074A (ru) | Кодирование и декодирование аудиосигналов | |
JP2016501472A (ja) | 空間オーディオ信号の異なる再生スピーカ設定に対するセグメント毎の調整 | |
EP4284026A3 (en) | Method and device for rendering an audio soundfield representation | |
NZ726830A (en) | Reducing correlation between higher order ambisonic (hoa) background channels | |
EP4365894A3 (en) | Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder | |
RU2015133584A (ru) | Улучшение звукового сигнала при помощи оценочных пространственных параметров | |
RU2015116434A (ru) | Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением | |
WO2014202672A3 (en) | Time scaler, audio decoder, method and a computer program using a quality control | |
JP2017526957A5 (ru) | ||
JP2017501440A5 (ru) | ||
MX2016003500A (es) | Transformacion de audio multicanal usando matrices interpoladas. | |
JP2019519002A5 (ru) | ||
JP2019535207A5 (ru) | ||
RU2016105686A (ru) | Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов | |
RU2020116816A (ru) | Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала | |
JP2023072027A (ja) | 復号装置および方法、並びにプログラム | |
WO2019105436A1 (zh) | 音频编解码方法和相关产品 | |
EP3489953A3 (en) | Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values |