RU2023121473A - METHODS AND DEVICES FOR ENCODING AND/OR DECODING IMMERSION AUDIO SIGNALS - Google Patents

METHODS AND DEVICES FOR ENCODING AND/OR DECODING IMMERSION AUDIO SIGNALS Download PDF

Info

Publication number
RU2023121473A
RU2023121473A RU2023121473A RU2023121473A RU2023121473A RU 2023121473 A RU2023121473 A RU 2023121473A RU 2023121473 A RU2023121473 A RU 2023121473A RU 2023121473 A RU2023121473 A RU 2023121473A RU 2023121473 A RU2023121473 A RU 2023121473A
Authority
RU
Russia
Prior art keywords
reconstructed
metadata
channel
signal
channel signals
Prior art date
Application number
RU2023121473A
Other languages
Russian (ru)
Inventor
Дэвид С. МАКГРАТ
Майкл ЭККЕРТ
Хейко ПУРНХАГЕН
Стефан БРУН
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн, Долби Интернэшнл Аб filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2023121473A publication Critical patent/RU2023121473A/en

Links

Claims (38)

1. Способ для определения восстановленного многоканального сигнала из кодированных аудиоданных, указывающих множество восстановленных канальных сигналов, и из кодированных метаданных, указывающих метаданные объединенного кодирования, при этом способ содержит этапы, на которых:1. A method for determining a reconstructed multi-channel signal from encoded audio data indicating a plurality of reconstructed channel signals and from encoded metadata indicating merged encoding metadata, the method comprising the steps of: декодируют кодированные аудиоданные, чтобы предоставлять множество восстановленных канальных сигналов, и декодируют кодированные метаданные), чтобы предоставлять метаданные объединенного кодирования; иdecode the encoded audio data to provide a plurality of reconstructed channel signals, and decode the encoded metadata) to provide merged encoding metadata; And определяют восстановленный многоканальный сигнал из множества восстановленных канальных сигналов, с использованием метаданных объединенного кодирования.determining a reconstructed multi-channel signal from a plurality of reconstructed channel signals using the merged encoding metadata. 2. Способ по п. 1, в котором множество восстановленных канальных сигналов представляет собой амбиофонический сигнал первого порядка, а именно, в B-формате или в A-формате.2. The method according to claim 1, wherein the plurality of reconstructed channel signals is a first order ambiophonic signal, namely, in B-format or in A-format. 3. Способ по п. 1, в котором метаданные объединенного кодирования содержат:3. The method according to claim 1, in which the merged encoding metadata contains: данные повышающего микширования, а именно, матрицу повышающего микширования, обеспечивающую повышающее микширование множества восстановленных канальных сигналов в восстановленный многоканальный сигнал; и/илиupmix data, namely, an upmix matrix for upmixing a plurality of reconstructed channel signals into a reconstructed multi-channel signal; and/or декорреляционные данные, обеспечивающие возможность формировать восстановленный многоканальный сигнал, имеющий предварительно определенную ковариацию.Decorrelation data providing the ability to generate a reconstructed multichannel signal having a predetermined covariance. 4. Способ по п. 1, в котором метаданные объединенного кодирования содержат различные метаданные для различных подполос частот восстановленного многоканального сигнала.4. The method of claim 1, wherein the fusion encoding metadata comprises different metadata for different subbands of the reconstructed multi-channel signal. 5. Способ п. 1, в котором декодирование кодированных аудиоданных содержит этап, на котором декодируют на основе формы сигналов каждый из множества восстановленных канальных сигналов, в частности с использованием монодекодера для каждого восстановленного канального сигнала.5. The method of claim 1, wherein decoding the encoded audio data comprises decoding, based on the waveforms, each of the plurality of reconstructed channel signals, in particular using a mono decoder for each reconstructed channel signal. 6. Способ по п. 1, в котором кодированные метаданные декодируются с использованием энтропийного декодера.6. The method of claim 1, wherein the encoded metadata is decoded using an entropy decoder. 7. Способ по п. 1, в котором:7. The method according to claim 1, in which: восстановленный многоканальный сигнал содержит один или более восстановленных объектных сигналов одного или более аудиообъектов; иthe reconstructed multi-channel signal contains one or more reconstructed object signals of one or more audio objects; And способ содержит этап, на котором декодируют, в частности, с использованием энтропийного декодера, метаданные объектов для одного или более аудиообъектов из кодированных метаданных.the method comprises decoding, in particular using an entropy decoder, object metadata for one or more audio objects from the encoded metadata. 8. Способ по п. 1, в котором:8. The method according to claim 1, in which: множество восстановленных канальных сигналов формируют сигнал представления звукового поля, называемого "SR", а именно, амбиофонический сигнал K-го порядка, при K≥1;a plurality of reconstructed channel signals form a sound field representation signal called "SR", namely, a K-th order ambiophonic signal, with K≥1; восстановленный многоканальный сигнал определяется посредством повышающего микширования множества восстановленных канальных сигналов с использованием метаданных объединенного кодирования; иa reconstructed multi-channel signal is determined by upmixing a plurality of reconstructed channel signals using joint encoding metadata; And восстановленный многоканальный сигнал содержит восстановленный SR-сигнал, а именно амбиофонический сигнал L-ого порядка, при L≥K, и один или более восстановленных объектных сигналов одного или более аудиообъектов.the reconstructed multi-channel signal comprises a reconstructed SR signal, namely an L-th order ambiophonic signal, with L≥K, and one or more reconstructed object signals of one or more audio objects. 9. Способ по п. 1, в котором9. The method according to claim 1, in which метаданные объединенного кодирования сконфигурированы с возможностью выполнять инверсию операции энергетического уплотнения для множества восстановленных канальных сигналов; и/илиthe merged encoding metadata is configured to perform an inversion of the energy multiplex operation for the plurality of reconstructed channel signals; and/or метаданные объединенного кодирования сконфигурированы с возможностью выполнять операцию обратного прогнозирования, по меньшей мере, для некоторых из множества восстановленных канальных сигналов; и/илиthe merged encoding metadata is configured to perform an inverse prediction operation on at least some of the plurality of reconstructed channel signals; and/or метаданные объединенного кодирования сконфигурированы с возможностью выполнять инверсию преобразования Карунена-Лоэва, преобразования на основе анализа главных компонентов и/или преобразования на основе разложения по сингулярным значениям, по меньшей мере, для некоторых из множества восстановленных канальных сигналовThe fusion encoding metadata is configured to perform the inversion of the Karhunen-Loeve transform, the principal component analysis transform, and/or the singular value decomposition transform on at least some of the plurality of reconstructed channel signals 10. Способ по п. 1, в котором10. The method according to claim 1, in which способ (содержит этап, на котором определяют то, что восстановленный многоканальный сигнал должен определяться с использованием второго режима;method (comprising the step of determining that the reconstructed multi-channel signal should be determined using a second mode; во втором режиме, метаданные объединенного кодирования содержат прогнозирующие данные и/или данные преобразования, сконфигурированные с возможностью перераспределять энергию между различными восстановленными канальными сигналами;in the second mode, the merged encoding metadata comprises prediction data and/or transform data configured to redistribute energy between the various reconstructed channel signals; во втором режиме, определение восстановленного многоканального сигнала содержит этап, на котором перераспределяют энергию между различными восстановленными канальными сигналами (с использованием прогнозирующих данных и/или данных преобразования; иin the second mode, determining the reconstructed multi-channel signal comprises redistributing energy among the various reconstructed channel signals (using prediction data and/or transform data; and во втором режиме, восстановленный многоканальный сигнал содержит число каналов, идентичное числу каналов множества восстановленных канальных сигналов.in the second mode, the reconstructed multi-channel signal contains a number of channels identical to the number of channels of the plurality of reconstructed channel signals. 11. Способ по п. 10, в котором данные преобразования указывают инверсию преобразования Карунена-Лоэва, преобразования на основе анализа главных компонентов и/или преобразования на основе разложения по сингулярным значениям, которое должно применяться, по меньшей мере, к некоторым из множества восстановленных канальных сигналов для определения восстановленного многоканального сигнала.11. The method of claim 10, wherein the transformation data indicates the inverse of the Karhunen-Loeve transform, the principal component analysis transform, and/or the singular value decomposition transform that is to be applied to at least some of the plurality of reconstructed channel channels. signals to determine the reconstructed multi-channel signal. 12. Способ по п. 10, в котором12. The method according to claim 10, in which восстановленный многоканальный входной сигнал содержит последовательность кадров; иthe reconstructed multi-channel input signal contains a sequence of frames; And способ содержит этап, на котором определяют, для каждого кадра из последовательности кадров, то, должен или нет использоваться второй режим.the method comprises determining, for each frame of the sequence of frames, whether or not the second mode should be used. 13. Способ по п. 10, содержащий этапы, на которых13. The method according to claim 10, containing the steps of извлекают кодированные аудиоданные и кодированные метаданные из потока битов; иextracting encoded audio data and encoded metadata from the bitstream; And извлекают из потока битов индикатор, который указывает то, должен или нет использоваться второй режим.extracting from the bit stream an indicator that indicates whether the second mode should be used or not. 14. Способ по п. 10, содержащий этап, на котором подготавливают посредством рендеринга восстановленный многоканальный сигнал.14. The method according to claim 10, comprising the step of preparing a reconstructed multi-channel signal by rendering. 15. Блок декодирования для определения восстановленного многоканального сигнала из кодированных аудиоданных, указывающих множество восстановленных канальных сигналов, и из кодированных метаданных, указывающих метаданные объединенного кодирования, при этом блок декодирования выполнен с возможностью:15. A decoding unit for determining a reconstructed multi-channel signal from encoded audio data indicating a plurality of reconstructed channel signals and from encoded metadata indicating combined encoding metadata, wherein the decoding unit is configured to: декодировать кодированные аудиоданные, чтобы предоставлять множество восстановленных канальных сигналов;decode the encoded audio data to provide a plurality of reconstructed channel signals; декодировать кодированные метаданные, чтобы предоставлять метаданные объединенного кодирования; иdecode encoded metadata to provide merged encoding metadata; And определять восстановленный многоканальный сигнал из множества восстановленных канальных сигналов с использованием метаданных объединенного кодирования.determine the reconstructed multi-channel signal from the plurality of reconstructed channel signals using the merged encoding metadata.
RU2023121473A 2018-07-02 2019-07-02 METHODS AND DEVICES FOR ENCODING AND/OR DECODING IMMERSION AUDIO SIGNALS RU2023121473A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/693,246 2018-07-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2020130053A Division RU2802803C2 (en) 2018-07-02 2019-07-02 Methods and devices for coding and/or decoding diving audio signals

Publications (1)

Publication Number Publication Date
RU2023121473A true RU2023121473A (en) 2023-09-01

Family

ID=

Similar Documents

Publication Publication Date Title
IL307898A (en) Methods and devices for encoding and/or decoding immersive audio signals
KR100888474B1 (en) Apparatus and method for encoding/decoding multichannel audio signal
RU2355046C2 (en) Device and method for forming of multichannel signal or set of parametric data
RU2645271C2 (en) Stereophonic code and decoder of audio signals
US20080052089A1 (en) Acoustic Signal Encoding Device and Acoustic Signal Decoding Device
US11776552B2 (en) Methods and apparatus for decoding encoded audio signal(s)
EP3591649A1 (en) Method and apparatus for decompressing a compressed hoa signal
RU2017134619A (en) DECODER FOR DECODING THE ENCODED AUDIO AND THE DECODER FOR ENCODING THE AUDIO SIGNAL
KR102201951B1 (en) Audio encoder and decoder
TWI631554B (en) Encoding device and method, decoding device and method, and program
EP1175030A2 (en) Method and system for multichannel perceptual audio coding using the cascaded discrete cosine transform or modified discrete cosine transform
EP2688065A1 (en) Method and apparatus for avoiding unmasking of coding noise when mixing perceptually coded multi-channel audio signals
US20100114568A1 (en) Apparatus for processing an audio signal and method thereof
KR20080071971A (en) Apparatus for processing media signal and method thereof
JPH09252254A (en) Audio decoder
US9071919B2 (en) Apparatus and method for encoding and decoding spatial parameter
KR102437451B1 (en) Audio encoding and decoding methods and related products
KR20140075466A (en) Encoding and decoding method of audio signal, and encoding and decoding apparatus of audio signal
RU2023121473A (en) METHODS AND DEVICES FOR ENCODING AND/OR DECODING IMMERSION AUDIO SIGNALS
JPWO2020010072A5 (en)
CN105981100B (en) Method and apparatus for improving the encoding of side information required for encoding a higher order ambisonics representation of a sound field
EP2770505B1 (en) Audio coding device and method
RU2802803C2 (en) Methods and devices for coding and/or decoding diving audio signals
Kamamoto et al. An efficient lossless compression of multichannel time-series signals by MPEG-4 ALS
KR20140122990A (en) Apparatus and method for encoding/decoding multichannel audio signal