Claims (38)
1. Способ для определения восстановленного многоканального сигнала из кодированных аудиоданных, указывающих множество восстановленных канальных сигналов, и из кодированных метаданных, указывающих метаданные объединенного кодирования, при этом способ содержит этапы, на которых:1. A method for determining a reconstructed multi-channel signal from encoded audio data indicating a plurality of reconstructed channel signals and from encoded metadata indicating merged encoding metadata, the method comprising the steps of:
декодируют кодированные аудиоданные, чтобы предоставлять множество восстановленных канальных сигналов, и декодируют кодированные метаданные), чтобы предоставлять метаданные объединенного кодирования; иdecode the encoded audio data to provide a plurality of reconstructed channel signals, and decode the encoded metadata) to provide merged encoding metadata; And
определяют восстановленный многоканальный сигнал из множества восстановленных канальных сигналов, с использованием метаданных объединенного кодирования.determining a reconstructed multi-channel signal from a plurality of reconstructed channel signals using the merged encoding metadata.
2. Способ по п. 1, в котором множество восстановленных канальных сигналов представляет собой амбиофонический сигнал первого порядка, а именно, в B-формате или в A-формате.2. The method according to claim 1, wherein the plurality of reconstructed channel signals is a first order ambiophonic signal, namely, in B-format or in A-format.
3. Способ по п. 1, в котором метаданные объединенного кодирования содержат:3. The method according to claim 1, in which the merged encoding metadata contains:
данные повышающего микширования, а именно, матрицу повышающего микширования, обеспечивающую повышающее микширование множества восстановленных канальных сигналов в восстановленный многоканальный сигнал; и/илиupmix data, namely, an upmix matrix for upmixing a plurality of reconstructed channel signals into a reconstructed multi-channel signal; and/or
декорреляционные данные, обеспечивающие возможность формировать восстановленный многоканальный сигнал, имеющий предварительно определенную ковариацию.Decorrelation data providing the ability to generate a reconstructed multichannel signal having a predetermined covariance.
4. Способ по п. 1, в котором метаданные объединенного кодирования содержат различные метаданные для различных подполос частот восстановленного многоканального сигнала.4. The method of claim 1, wherein the fusion encoding metadata comprises different metadata for different subbands of the reconstructed multi-channel signal.
5. Способ п. 1, в котором декодирование кодированных аудиоданных содержит этап, на котором декодируют на основе формы сигналов каждый из множества восстановленных канальных сигналов, в частности с использованием монодекодера для каждого восстановленного канального сигнала.5. The method of claim 1, wherein decoding the encoded audio data comprises decoding, based on the waveforms, each of the plurality of reconstructed channel signals, in particular using a mono decoder for each reconstructed channel signal.
6. Способ по п. 1, в котором кодированные метаданные декодируются с использованием энтропийного декодера.6. The method of claim 1, wherein the encoded metadata is decoded using an entropy decoder.
7. Способ по п. 1, в котором:7. The method according to claim 1, in which:
восстановленный многоканальный сигнал содержит один или более восстановленных объектных сигналов одного или более аудиообъектов; иthe reconstructed multi-channel signal contains one or more reconstructed object signals of one or more audio objects; And
способ содержит этап, на котором декодируют, в частности, с использованием энтропийного декодера, метаданные объектов для одного или более аудиообъектов из кодированных метаданных.the method comprises decoding, in particular using an entropy decoder, object metadata for one or more audio objects from the encoded metadata.
8. Способ по п. 1, в котором:8. The method according to claim 1, in which:
множество восстановленных канальных сигналов формируют сигнал представления звукового поля, называемого "SR", а именно, амбиофонический сигнал K-го порядка, при K≥1;a plurality of reconstructed channel signals form a sound field representation signal called "SR", namely, a K-th order ambiophonic signal, with K≥1;
восстановленный многоканальный сигнал определяется посредством повышающего микширования множества восстановленных канальных сигналов с использованием метаданных объединенного кодирования; иa reconstructed multi-channel signal is determined by upmixing a plurality of reconstructed channel signals using joint encoding metadata; And
восстановленный многоканальный сигнал содержит восстановленный SR-сигнал, а именно амбиофонический сигнал L-ого порядка, при L≥K, и один или более восстановленных объектных сигналов одного или более аудиообъектов.the reconstructed multi-channel signal comprises a reconstructed SR signal, namely an L-th order ambiophonic signal, with L≥K, and one or more reconstructed object signals of one or more audio objects.
9. Способ по п. 1, в котором9. The method according to claim 1, in which
метаданные объединенного кодирования сконфигурированы с возможностью выполнять инверсию операции энергетического уплотнения для множества восстановленных канальных сигналов; и/илиthe merged encoding metadata is configured to perform an inversion of the energy multiplex operation for the plurality of reconstructed channel signals; and/or
метаданные объединенного кодирования сконфигурированы с возможностью выполнять операцию обратного прогнозирования, по меньшей мере, для некоторых из множества восстановленных канальных сигналов; и/илиthe merged encoding metadata is configured to perform an inverse prediction operation on at least some of the plurality of reconstructed channel signals; and/or
метаданные объединенного кодирования сконфигурированы с возможностью выполнять инверсию преобразования Карунена-Лоэва, преобразования на основе анализа главных компонентов и/или преобразования на основе разложения по сингулярным значениям, по меньшей мере, для некоторых из множества восстановленных канальных сигналовThe fusion encoding metadata is configured to perform the inversion of the Karhunen-Loeve transform, the principal component analysis transform, and/or the singular value decomposition transform on at least some of the plurality of reconstructed channel signals
10. Способ по п. 1, в котором10. The method according to claim 1, in which
способ (содержит этап, на котором определяют то, что восстановленный многоканальный сигнал должен определяться с использованием второго режима;method (comprising the step of determining that the reconstructed multi-channel signal should be determined using a second mode;
во втором режиме, метаданные объединенного кодирования содержат прогнозирующие данные и/или данные преобразования, сконфигурированные с возможностью перераспределять энергию между различными восстановленными канальными сигналами;in the second mode, the merged encoding metadata comprises prediction data and/or transform data configured to redistribute energy between the various reconstructed channel signals;
во втором режиме, определение восстановленного многоканального сигнала содержит этап, на котором перераспределяют энергию между различными восстановленными канальными сигналами (с использованием прогнозирующих данных и/или данных преобразования; иin the second mode, determining the reconstructed multi-channel signal comprises redistributing energy among the various reconstructed channel signals (using prediction data and/or transform data; and
во втором режиме, восстановленный многоканальный сигнал содержит число каналов, идентичное числу каналов множества восстановленных канальных сигналов.in the second mode, the reconstructed multi-channel signal contains a number of channels identical to the number of channels of the plurality of reconstructed channel signals.
11. Способ по п. 10, в котором данные преобразования указывают инверсию преобразования Карунена-Лоэва, преобразования на основе анализа главных компонентов и/или преобразования на основе разложения по сингулярным значениям, которое должно применяться, по меньшей мере, к некоторым из множества восстановленных канальных сигналов для определения восстановленного многоканального сигнала.11. The method of claim 10, wherein the transformation data indicates the inverse of the Karhunen-Loeve transform, the principal component analysis transform, and/or the singular value decomposition transform that is to be applied to at least some of the plurality of reconstructed channel channels. signals to determine the reconstructed multi-channel signal.
12. Способ по п. 10, в котором12. The method according to claim 10, in which
восстановленный многоканальный входной сигнал содержит последовательность кадров; иthe reconstructed multi-channel input signal contains a sequence of frames; And
способ содержит этап, на котором определяют, для каждого кадра из последовательности кадров, то, должен или нет использоваться второй режим.the method comprises determining, for each frame of the sequence of frames, whether or not the second mode should be used.
13. Способ по п. 10, содержащий этапы, на которых13. The method according to claim 10, containing the steps of
извлекают кодированные аудиоданные и кодированные метаданные из потока битов; иextracting encoded audio data and encoded metadata from the bitstream; And
извлекают из потока битов индикатор, который указывает то, должен или нет использоваться второй режим.extracting from the bit stream an indicator that indicates whether the second mode should be used or not.
14. Способ по п. 10, содержащий этап, на котором подготавливают посредством рендеринга восстановленный многоканальный сигнал.14. The method according to claim 10, comprising the step of preparing a reconstructed multi-channel signal by rendering.
15. Блок декодирования для определения восстановленного многоканального сигнала из кодированных аудиоданных, указывающих множество восстановленных канальных сигналов, и из кодированных метаданных, указывающих метаданные объединенного кодирования, при этом блок декодирования выполнен с возможностью:15. A decoding unit for determining a reconstructed multi-channel signal from encoded audio data indicating a plurality of reconstructed channel signals and from encoded metadata indicating combined encoding metadata, wherein the decoding unit is configured to:
декодировать кодированные аудиоданные, чтобы предоставлять множество восстановленных канальных сигналов;decode the encoded audio data to provide a plurality of reconstructed channel signals;
декодировать кодированные метаданные, чтобы предоставлять метаданные объединенного кодирования; иdecode encoded metadata to provide merged encoding metadata; And
определять восстановленный многоканальный сигнал из множества восстановленных канальных сигналов с использованием метаданных объединенного кодирования.determine the reconstructed multi-channel signal from the plurality of reconstructed channel signals using the merged encoding metadata.