RU2020116816A - Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала - Google Patents

Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала Download PDF

Info

Publication number
RU2020116816A
RU2020116816A RU2020116816A RU2020116816A RU2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A RU 2020116816 A RU2020116816 A RU 2020116816A
Authority
RU
Russia
Prior art keywords
dominant
component
initial output
residual
audio component
Prior art date
Application number
RU2020116816A
Other languages
English (en)
Other versions
RU2818687C2 (ru
Inventor
Дирк Ерун Бребарт
Дэвид Мэттью Купер
Марк Ф. ДЭВИС
Дэвид С. МАКГРАТ
Кристофер ЧЕРЛИНГ
Харальд МУНДТ
Ронда Дж. УИЛСОН
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн, Долби Интернэшнл Аб filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2020116816A publication Critical patent/RU2020116816A/ru
Application granted granted Critical
Publication of RU2818687C2 publication Critical patent/RU2818687C2/ru

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Claims (37)

1. Система, выполненная с возможностью кодирования входного аудиосигнала, основывающегося на канале или объекте, для воспроизведения, причем система содержит:
один или более процессоров; и
машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают системе выполнять операции, содержащие:
рендеринг входного аудиосигнала, основывающегося на канале или объекте, в начальное выходное представление;
определение оценки доминантного аудиокомпонента из входного аудиосигнала, основывающегося на канале или объекте, каковое определение включает в себя:
определение последовательности весовых компонентов доминантного аудиокомпонента для отображения начального выходного представления в доминантный аудиокомпонент и
определение оценки доминантного аудиокомпонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;
определение оценки направления или положения доминантного аудиокомпонента; и
кодирование начального выходного представления, весовых коэффициентов доминантного аудиокомпонента и по меньшей мере одного из направления или положения доминантного аудиокомпонента в качестве кодированного сигнала для воспроизведения.
2. Система по п. 1, в которой операции дополнительно содержат определение оценки остаточного микса, представляющей собой начальное выходное представление за вычетом рендеринга либо доминантного аудиокомпонента, либо его оценки.
3. Система по п. 1, в которой операции дополнительно содержат генерирование безэхового бинаурального микса входного аудиосигнала, основывающегося на канале или объекте, и определение оценки остаточного микса, причем оценкой остаточного микса является безэховый бинауральный микс за вычетом либо рендеринга доминантного аудиокомпонента, либо его оценки.
4. Система по п. 2, в которой операции дополнительно содержат определение последовательности остаточных матричных коэффициентов для отображения начального выходного представления в оценку остаточного микса.
5. Система по п. 1, в которой начальное выходное представление содержит представление посредством наушников или представление посредством громкоговорителя.
6. Система по п. 1, в которой входной аудиосигнал, основывающийся на канале или объекте, разбивается на элементы разбиения по времени и частоте, и упомянутая операция кодирования повторяется в отношении последовательности временных шагов и последовательности полос частот.
7. Система по п. 1, в которой начальное выходное представление содержит микс стереогромкоговорителей.
8. Система, выполненная с возможностью декодирования аудиосигнала, причем система содержит:
один или более процессоров; и
долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более процессорам выполнять операции, содержащие:
прием кодированного аудиосигнала, причем кодированный аудиосигнал включает в себя:
- начальное выходное представление, содержащее стерео даун-микс,
- направление доминантного аудиокомпонента и
- весовые коэффициенты доминантного аудиокомпонента;
определение оценочного доминантного компонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;
формирование отрендеренного бинаурализированного оценочного доминантного компонента, включая выполнение рендеринга оценочного доминантного компонента с бинаурализацией в пространственном местоположении относительно целевого слушателя в соответствии с направлением доминантного аудиокомпонента;
реконструкцию оценки остаточного компонента из начального выходного представления; и
генерирование выходного пространственно ориентированного аудиосигнала посредством объединения отрендеренного бинаурализированного оценочного доминантного компонента и оценки остаточного компонента.
9. Система по п. 8, в котором кодированный аудиосигнал дополнительно включает в себя последовательность остаточных матричных коэффициентов, представляющих остаточный аудиосигнал, и упомянутая реконструкция оценки остаточного компонента дополнительно содержит применение упомянутых остаточных матричных коэффициентов к начальному выходному представлению, чтобы реконструировать оценку остаточного компонента.
10. Система по п. 8, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления.
11. Система по п. 8, в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.
12. Система по п. 8, в которой оценка остаточного компонента реконструируется вычитанием отрендеренного бинаурализированного оценочного доминантного компонента из начального выходного представления, и в которой упомянутое формирование отрендеренного бинаурализированного оценочного доминантного компонента включает в себя начальный поворот оценочного доминантного компонента в соответствии с входным сигналом слежения за движением головы, указывающим ориентацию головы целевого слушателя.
13. Долговременный машиночитаемый носитель, на котором сохранены инструкции, которые при их исполнении одним или более процессорами предписывают одному или более устройствам выполнять операции, содержащие:
рендеринг входного аудиосигнала, основывающегося на канале или объекте, в начальное выходное представление;
определение оценки доминантного аудиокомпонента из входного аудиосигнала, основывающегося на канале или объекте, каковое определение включает в себя:
определение последовательности весовых компонентов доминантного аудиокомпонента для отображения начального выходного представления в доминантный аудиокомпонент и
определение оценки доминантного аудиокомпонента на основе весовых коэффициентов доминантного аудиокомпонента и начального выходного представления;
определение оценки направления или положения доминантного аудиокомпонента; и
кодирование начального выходного представления, весовых коэффициентов доминантного аудиокомпонента и по меньшей мере одного из направления или положения доминантного аудиокомпонента в качестве кодированного сигнала для воспроизведения.
RU2020116816A 2015-11-17 2016-11-17 Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала RU2818687C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562256462P 2015-11-17 2015-11-17
US62/256,462 2015-11-17
EP15199854 2015-12-14
EP15199854.9 2015-12-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2018121757A Division RU2722391C2 (ru) 2015-11-17 2016-11-17 Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала

Publications (2)

Publication Number Publication Date
RU2020116816A true RU2020116816A (ru) 2020-07-28
RU2818687C2 RU2818687C2 (ru) 2024-05-03

Family

ID=

Also Published As

Publication number Publication date
RU2018121757A3 (ru) 2020-03-25
ES2779603T3 (es) 2020-08-18
JP6964703B2 (ja) 2021-11-10
IL274432A (en) 2020-06-30
JP2020110007A (ja) 2020-07-16
RU2722391C2 (ru) 2020-05-29
RU2018121757A (ru) 2019-12-19
MX2018006075A (es) 2019-10-14
IL274432B (en) 2021-05-31

Similar Documents

Publication Publication Date Title
US10893375B2 (en) Headtracking for parametric binaural output system and method
KR102672762B1 (ko) 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치
RU2017118830A (ru) Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля
MX351577B (es) Aparato y método para realizar un desvanecimiento de un espectro mdct a ruido blanco antes de aplicar fdns.
MY192214A (en) Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
JP2016523467A5 (ru)
MY191340A (en) Method for and apparatus for decoding an ambisonics audio soundfield representation for audio playback using 2d setups
RU2015104074A (ru) Кодирование и декодирование аудиосигналов
JP2016501472A (ja) 空間オーディオ信号の異なる再生スピーカ設定に対するセグメント毎の調整
EP4284026A3 (en) Method and device for rendering an audio soundfield representation
NZ726830A (en) Reducing correlation between higher order ambisonic (hoa) background channels
EP4365894A3 (en) Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
RU2015133584A (ru) Улучшение звукового сигнала при помощи оценочных пространственных параметров
RU2015116434A (ru) Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением
WO2014202672A3 (en) Time scaler, audio decoder, method and a computer program using a quality control
JP2017526957A5 (ru)
JP2017501440A5 (ru)
MX2016003500A (es) Transformacion de audio multicanal usando matrices interpoladas.
JP2019519002A5 (ru)
JP2019535207A5 (ru)
RU2016105686A (ru) Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов
RU2020116816A (ru) Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала
JP2023072027A (ja) 復号装置および方法、並びにプログラム
WO2019105436A1 (zh) 音频编解码方法和相关产品
EP3489953A3 (en) Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values