RU2017114642A - Параметрическое кодирование и декодирование многоканальных аудиосигналов - Google Patents

Параметрическое кодирование и декодирование многоканальных аудиосигналов Download PDF

Info

Publication number
RU2017114642A
RU2017114642A RU2017114642A RU2017114642A RU2017114642A RU 2017114642 A RU2017114642 A RU 2017114642A RU 2017114642 A RU2017114642 A RU 2017114642A RU 2017114642 A RU2017114642 A RU 2017114642A RU 2017114642 A RU2017114642 A RU 2017114642A
Authority
RU
Russia
Prior art keywords
signal
channel
mix
encoding
coefficients
Prior art date
Application number
RU2017114642A
Other languages
English (en)
Other versions
RU2017114642A3 (ru
RU2704266C2 (ru
Inventor
Хейко ПУРНХАГЕН
Хайди-Мария ЛЕХТОНЕН
Януш КЛЕЙСА
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2017114642A publication Critical patent/RU2017114642A/ru
Publication of RU2017114642A3 publication Critical patent/RU2017114642A3/ru
Application granted granted Critical
Publication of RU2704266C2 publication Critical patent/RU2704266C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (100)

1. Способ (1200) декодирования аудио, включающий:
получение (1201) двухканального сигнала понижающего микширования (L1, L2) и параметров повышающего микширования (αL) для параметрической реконструкции М-канального аудиосигнала, имеющего заданную конфигурацию каналов (L, LS, LB, TFL, TBL), на основе сигнала понижающего микширования, где M ≥ 4;
получение (1202) сигнализации (S), указывающей выбранный формат из по меньшей мере двух форматов кодирования (F1, F2, F3) М-канального аудиосигнала, имеющего заданную конфигурацию каналов, причем указанный выбранный формат кодирования переключается между по меньшей мере двумя форматами кодирования, и при этом форматы кодирования соответствуют соответствующим разным разделениям каналов заданной конфигурации каналов М-канального аудиосигнала на соответствующие первую и вторую группы (601, 602) из одного или более каналов, при этом в указанном формате кодирования первый канал сигнала понижающего микширования соответствует линейной комбинации первой группы из одного или более каналов заданной конфигурации каналов М-канального аудиосигнала, а второй канал сигнала понижающего микширования соответствует линейной комбинации второй группы из одного или более каналов заданной конфигурации каналов М-канального аудиосигнала;
определение (1203) набора преддекорреляционных коэффициентов на основе указанного формата кодирования;
вычисление (1205) входного сигнала декорреляции (D1, D2, D3) путем линейного отображения сигнала понижающего микширования, причем к сигналу понижающего микширования применяют набор преддекорреляционных коэффициентов, при этом преддекорреляционные коэффициенты определяются так, чтобы первый канал (TBL) заданной конфигурации каналов М-канального аудиосигнала вносил вклад через сигнал понижающего микширования в первый фиксированный канал (D3) входного сигнала декорреляции по меньшей мере в двух форматах кодирования;
создание (1207) декоррелированного сигнала на основе входного сигнала декорреляции;
определение (1208) набора «влажных» и «сухих» коэффициентов повышающего микширования (γL, βL) на основе полученных параметров повышающего микширования и указанного формата кодирования;
вычисление (1210) «сухого» сигнала повышающего микширования (X1, X2) как линейного отображения сигнала понижающего микширования, при этом к сигналу понижающего микширования применяют набор «сухих» коэффициентов повышающего микширования;
вычисление (1211) «влажного» сигнала повышающего микширования (Y1, Y2) как линейного отображения декоррелированного сигнала, при этом к декоррелированному сигналу применяют набор «влажных» коэффициентов повышающего микширования; и
объединение (1213) «сухих» и «влажных» сигналов повышающего микширования для получения многомерного реконструированного аудиосигнала (
Figure 00000001
), соответствующего подлежащему реконструкции
М-канальному аудиосигналу.

2. Способ декодирования аудио по п. 1, в котором M = 5.

3. Способ декодирования аудио по п. 1, в котором каждый из входного сигнала декорреляции и декоррелированого сигнала содержит M – 2 каналов, причем канал декоррелированного сигнала создается на основе не более чем одного канала входного сигнала декорреляции, и при этом преддекорреляционные коэффициенты определяются так, чтобы в каждом из форматов кодирования в канал входного сигнала декорреляции был внесен вклад от не более чем одного канала сигнала понижающего микширования.

4. Способ декодирования аудио по любому из пп. 1-3, в котором преддекорреляционные коэффициенты определяются таким образом, чтобы второй канал (L) М-канального аудиосигнала дополнительно вносил вклад через сигнал понижающего микширования во второй фиксированный канал (D1) входного сигнала декорреляции по меньшей мере в двух форматах кодирования.

5. Способ декодирования аудио по любому из пп. 1-3, в котором полученная сигнализация указывает выбранный формат из по меньшей мере трех форматов кодирования, и при этом преддекорреляционные коэффициенты определяются таким образом, чтобы первый канал М-канального аудиосигнала вносил вклад через сигнал понижающего микширования в указанный первый фиксированный канал входного сигнала декорреляции по меньшей мере в трех форматах кодирования.

6. Способ декодирования аудио по любому из пп. 1-3, в котором преддекорреляционные коэффициенты определяются таким образом, чтобы пара каналов (LS, LB) М-канального аудиосигнала вносила вклад через сигнал понижающего микширования в третий фиксированный канал (D2) входного сигнала декорреляции по меньшей мере в двух форматах кодирования.

7. Способ декодирования аудио по любому из пп. 1-3, дополнительно включающий:
выполнение (1206) постепенного перехода от значений преддекорреляционных коэффициентов, ассоциированных с первым форматом кодирования, к значениям преддекорреляционных коэффициентов, ассоциированным со вторым форматом кодирования, в ответ на обнаружение переключения указанного формата кодирования из первого формата кодирования во второй формат кодирования.

8. Способ декодирования аудио по любому из пп. 1-3, дополнительно включающий:
выполнение (1212) интерполяции от значений «влажных» и «сухих» коэффициентов повышающего микширования, ассоциированных с первым форматом кодирования, к значениям «влажных» и «сухих» коэффициентов повышающего микширования, ассоциированным со вторым форматом кодирования, в ответ на обнаружение переключения указанного формата кодирования из первого формата кодирования во второй формат кодирования.

9. Способ декодирования аудио по п. 8, дополнительно включающий получение сигнализации (S), указывающей одну из множества интерполяционных схем для использования при интерполяции «влажных» и «сухих» параметров повышающего микширования, и использование указанной интерполяционной схемы.

10. Способ декодирования аудио по любому из пп. 1-3, в котором по меньшей мере два формата кодирования включают первый формат кодирования и второй формат кодирования, причем каждый коэффициент усиления, управляющий в первом формате кодирования вкладом канала М-канального аудиосигнала в одну из линейных комбинаций, которой соответствуют каналы сигнала понижающего микширования, совпадает с коэффициентом усиления, управляющим во втором формате кодирования вкладом указанного канала М-канального аудиосигнала в одну из линейных комбинаций, которой соответствуют каналы сигнала понижающего микширования.

11. Способ декодирования аудио по любому из пп. 1-3, в котором
М-канальный аудиосигнал содержит три канала (L, LS, LB), представляющих разные горизонтальные направления в среде воспроизведения М-канального аудиосигнала, и два канала (TFL, TBL), представляющих направления, отделенные по вертикали от направлений указанных трех каналов в указанной среде воспроизведения.

12. Способ декодирования аудио по п. 11, в котором в первом формате кодирования (F1) указанная вторая группа содержит указанные два канала.

13. Способ декодирования аудио по п. 11, в котором в первом формате кодирования (F1) указанная первая группа содержит указанные три канала, а указанная вторая группа содержит указанные два канала.

14. Способ декодирования аудио по п. 11, причем во втором формате кодирования (F2) каждая из первой и второй групп содержит один из указанных двух каналов.

15. Способ декодирования аудио по любому из пп. 1-3, причем в конкретном формате кодирования (F1, F2) указанная первая группа состоит из N каналов, где N ≥ 3, и при этом указанный формат кодирования представляет собой конкретный формат кодирования;
преддекорреляционные коэффициенты определяются так, чтобы N – 1 каналов декоррелированного сигнала создавались на основе первого канала сигнала понижающего микширования; а
«сухие» и «влажные» коэффициенты повышающего микширования определяются так, чтобы указанная первая группа реконструировалась как линейное отображение первого канала сигнала понижающего микширования и указанных N – 1 каналов декоррелированного сигнала, при этом к первому каналу сигнала понижающего микширования применяют поднабор «сухих» коэффициентов повышающего микширования, а к указанным N – 1 каналам декоррелированного сигнала применяют поднабор «влажных» коэффициентов повышающего микширования.

16. Способ декодирования аудио по п. 15, в котором полученные параметры повышающего микширования включают «влажные» параметры повышающего микширования и «сухие» параметры повышающего микширования, и причем определение наборов «влажных» и «сухих» коэффициентов повышающего микширования включает:
определение на основе «сухих» параметров повышающего микширования указанного поднабора «сухих» коэффициентов повышающего микширования;
заполнение промежуточной матрицы, имеющей больше элементов, чем количество полученных «влажных» коэффициентов повышающего микширования, на основе полученных «влажных» коэффициентов повышающего микширования и наличия информации о том, что промежуточная матрица относится к классу заданных матриц; и
получение указанного поднабора «влажных» коэффициентов повышающего микширования путем умножения промежуточной матрицы на заданную матрицу, при этом указанный поднабор «влажных» коэффициентов повышающего микширования соответствует матрице, полученной в результате умножения, и включает большее количество коэффициентов, чем количество элементов в промежуточной матрице.

17. Способ декодирования аудио по п. 16, в котором заданная матрица и/или класс заданных матриц связаны с указанным форматом кодирования.

18. Способ декодирования аудио, включающий:
получение сигнализации (S), указывающей одну из по меньшей мере двух заданных конфигураций каналов;
выполнение способа декодирования аудио по любому из пп. 1-3 в ответ на обнаружение полученной сигнализации, указывающей первую заданную конфигурацию каналов (L, LS, LB, TFL, TBL); и,
в ответ на обнаружение полученной сигнализации, указывающей вторую заданную конфигурацию каналов (LW, LSCRN, TFL, LS, LB, TBL),
получение двухканального сигнала понижающего микширования (L1, L2) и ассоциированных параметров повышающего микширования (α);
выполнение параметрической реконструкции первого трехканального аудиосигнала (LW, LSCRN, TFL) на основе первого канала (L1) сигнала понижающего микширования и по меньшей мере некоторых параметров повышающего микширования; и
выполнение параметрической реконструкции второго трехканального аудиосигнала (LS, LB, TBL) на основе второго канала (L2) сигнала понижающего микширования и по меньшей мере некоторых параметров повышающего микширования.

19. Система (1000) декодирования аудио, содержащая один или несколько компонентов, выполненных с возможностью выполнения способа по одному из пп. 1-3.

20. Система декодирования аудио по п. 19, отличающаяся тем, что один или несколько компонентов дополнительно выполнены с возможностью:
реконструкции дополнительного M-канального аудиосигнала (R, RS, RB, TFR, TBR) на основе дополнительного двухканального сигнала понижающего микширования (R1, R2) и ассоциированных дополнительных параметров повышающего микширования (αR);
получения сигнализации (S), указывающей выбранный формат из по меньшей мере двух форматов кодирования дополнительного М-канального аудиосигнала, при этом форматы кодирования дополнительного М-канального аудиосигнала соответствуют соответствующим различным разделениям каналов дополнительного М-канального аудиосигнала на соответствующие первую и вторую группы (603, 604) из одного или более каналов, при этом в указанном формате кодирования дополнительного М-канального аудиосигнала первый канал (R1) дополнительного сигнала понижающего микширования соответствует линейной комбинации первой группы из одного или более каналов М-канального аудиосигнала, а второй канал (R2) дополнительного сигнала понижающего микширования соответствует линейной комбинации второй группы из одного или более каналов дополнительного М-канального аудиосигнала;
определения дополнительного набора преддекорреляционных коэффициентов на основе указанного формата кодирования дополнительного М-канального аудиосигнала;
вычисления дополнительного входного сигнала декорреляции как линейного отображения дополнительного сигнала понижающего микширования, при этом к дополнительному сигналу понижающего микширования применяют дополнительный набор преддекорреляционных коэффициентов;
создания дополнительного декоррелированного сигнала на основе дополнительного входного сигнала декорреляции;
определения дополнительных наборов «влажных» и «сухих» коэффициентов повышающего микширования на основе полученных дополнительных параметров повышающего микширования и указанного формата кодирования дополнительного М-канального аудиосигнала;
вычисления дополнительного «сухого» сигнала повышающего микширования как линейного отображения дополнительного сигнала понижающего микширования, при этом к дополнительному сигналу понижающего микширования применяют дополнительный набор «сухих» коэффициентов повышающего микширования;
вычисления дополнительного «влажного» сигнала повышающего микширования как линейного отображения дополнительного декоррелированного сигнала, при этом к дополнительному декоррелированному сигналу применяют дополнительный набор «влажных» коэффициентов повышающего микширования; и
объединения дополнительных «сухих» и «влажных» сигналов повышающего микширования для получения дополнительного многомерного реконструированного аудиосигнала
Figure 00000002
, соответствующего подлежащему реконструкции дополнительному М-канальному аудиосигналу.

21. Система декодирования аудио по п. 19, отличающаяся тем, что один или несколько компонентов дополнительно выполнены с возможностью:
извлечения из битового потока (B) сигнала понижающего микширования параметров повышающего микширования, ассоциированных с сигналом понижающего микширования, и дискретно-кодированного аудиоканала (C); и
декодирования указанного дискретно-кодированного аудиоканала.

22. Способ (1700) кодирования аудио, включающий:
получение (1710) М-канального аудиосигнала (L, LS, LB, TFL, TBL), имеющего заданную конфигурацию каналов, где M ≥ 4;
повторяющийся выбор (1720) одного из по меньшей мере двух форматов кодирования (F1, F2, F3), которые соответствуют соответствующим разным разделениям каналов заданной конфигурации каналов М-канального аудиосигнала на соответствующие первую и вторую группы (601, 602) из одного или более каналов каждая, причем каждый из форматов кодирования определяет двухканальный сигнал понижающего микширования (L1, L2), в котором первый канал (L1) сигнала понижающего микширования образован в виде линейной комбинации первой группы из одного или более каналов заданной конфигурации каналов М-канального аудиосигнала, и при этом второй канал (L2) сигнала понижающего микширования образован в виде линейной комбинации второй группы из одного или более каналов заданной конфигурации каналов
М-канального аудиосигнала;
определение набора «сухих» коэффициентов повышающего микширования (βL) и набора «влажных» коэффициентов повышающего микширования (γL) для выбранного в настоящий момент формата кодирования;
вычисление (1730) двухканального сигнала понижающего микширования (L1, L2) на основе M-канального аудиосигнала в соответствии с выбранным в данный момент форматом кодирования;
вывод (1740) сигнала понижающего микширования выбранного в данный момент формата кодирования, при этом сигнал понижающего микширования сегментирован на временные интервалы, и дополнительной информации, позволяющей выполнить параметрическую реконструкцию М-канального аудиосигнала на основе сигнала понижающего микширования и декоррелированного сигнала, определенного на основе по меньшей мере одного канала сигнала понижающего микширования выбранного формата кодирования, при этом дополнительная информация содержит дискретные значения наборов «сухих» и «влажных» коэффициентов повышающего микширования (βL, γL), при этом выводится по меньшей мере одно дискретное значение на временной интервал; и
вывод (1750) сигнализации S, обозначающей выбранный в данный момент формат кодирования,
при этом в ответ на переключение с первого выбранного формата кодирования на второй, отличающийся, выбранный формат кодирования вычисляется сигнал понижающего микширования в соответствии со вторым выбранным форматом кодирования и выводится плавный переход сигнала понижающего микширования в соответствии с первым выбранным форматом кодирования и сигнала понижающего микширования в соответствии со вторым выбранным форматом кодирования вместо сигнала понижающего микширования, и
при этом параметрическая реконструкция М-канального аудиосигнала между дискретными значениями должна быть основана на интерполированных значениях наборов «сухих» и «влажных» коэффициентов повышающего микширования (βL, γL) в соответствии с заданным правилом интерполяции, причем плавный переход сигнала понижающего микширования и дискретные значения наборов «сухих» и «влажных» коэффициентов повышающего микширования выводятся таким образом, чтобы указанный плавный переход и интерполяция были синхронными.

23. Способ кодирования аудио по п. 22, в котором:
набор «сухих» коэффициентов повышающего микширования определяет линейное отображение соответствующего сигнала понижающего микширования, аппроксимирующее М-канальный аудиосигнал; и
набор «влажных» коэффициентов повышающего микширования определяет линейное отображение декоррелированного сигнала так, чтобы ковариация сигнала, полученного путем указанного линейного отображения декоррелированного сигнала, дополняла ковариацию М-канального аудиосигнала, аппроксимированного путем линейного отображения сигнала понижающего микширования выбранного формата кодирования.

24. Способ кодирования аудио по п. 22, дополнительно включающий:
определение набора «сухих» параметров повышающего микширования, определяющего линейное отображение соответствующего сигнала понижающего микширования, аппроксимирующего М-канальный аудиосигнал, для каждого из по меньшей мере двух форматов кодирования,
причем указанный выбор одного из форматов кодирования включает:
вычисление для каждого из форматов кодирования разности (ΔL) между ковариацией полученного М-канального аудиосигнала и ковариацией
М-канального аудиосигнала, аппроксимированного линейным отображением, определенным соответствующим набором «сухих» параметров повышающего микширования, и воздействие на соответствующий сигнал понижающего микширования; и
выбор одного из форматов кодирования на основе соответствующих вычисленных разностей.

25. Способ кодирования аудио по п. 24,
дополнительно включающий определение набора «влажных» параметров повышающего микширования, который определяет линейное отображение декоррелированного сигнала, сформированного на основе по меньшей мере одного канала сигнала понижающего микширования выбранного формата кодирования, так чтобы ковариация сигнала, полученного путем указанного линейного отображения декоррелированного сигнала, аппроксимировала разность между ковариацией полученного М-канального аудиосигнала и ковариацией М-канального аудиосигнала, аппроксимированного путем указанного линейного отображения сигнала понижающего микширования выбранного формата кодирования,
причем набор «сухих» параметров повышающего микширования и набор «влажных» параметров повышающего микширования выбранного формата кодирования включены в дополнительную информацию, позволяющую осуществить параметрическую реконструкцию М-канального аудиосигнала из сигнала понижающего микширования выбранного формата кодирования и из декоррелированного сигнала, сформированного на основе по меньшей мере одного канала сигнала понижающего микширования выбранного формата кодирования.

26. Способ кодирования аудио по любому из пп. 22–23, дополнительно включающий для каждого из по меньшей мере двух форматов кодирования:
определение набора «сухих» параметров повышающего микширования, определяющих линейное отображение соответствующего сигнала понижающего микширования, аппроксимирующее М-канальный аудиосигнал; и
определение набора «влажных» коэффициентов повышающего микширования (γL), который в совокупности с «сухими» коэффициентами повышающего микширования позволяет выполнить параметрическую реконструкцию
М-канального аудиосигнала из сигнала понижающего микширования и из декоррелированного сигнала, образованного на основе сигнала понижающего микширования, причем набор «влажных» коэффициентов повышающего микширования определяет линейное отображение декоррелированного сигнала, так чтобы ковариация сигнала, полученного путем линейного отображения декоррелированного сигнала, аппроксимировала разность между ковариацией полученного М-канального аудиосигнала и ковариацией М-канального аудиосигнала, аппроксимированного путем линейного отображения сигнала понижающего микширования,
при этом указанный выбор одного из форматов кодирования включает сравнение значений соответствующих определенных наборов «влажных» коэффициентов повышающего микширования.

27. Способ кодирования аудио по п. 26,
дополнительно включающий для каждого из по меньшей мере двух форматов кодирования вычисление суммы квадратов соответствующих «влажных» коэффициентов повышающего микширования и суммы квадратов соответствующих «сухих» коэффициентов повышающего микширования,
причем указанный выбор одного из двух форматов кодирования включает сравнение значений соответствующих вычисленных сумм квадратов для каждого из по меньшей мере двух форматов кодирования.

28. Способ кодирования аудио по п. 27, в котором указанный выбор одного из форматов кодирования включает сравнение для каждого из по меньшей мере двух форматов кодирования значений соотношения, с одной стороны, суммы квадратов соответствующих «влажных» коэффициентов повышающего микширования и, с другой стороны, суммы суммы квадратов соответствующих «сухих» коэффициентов повышающего микширования и суммы квадратов соответствующих «влажных» коэффициентов повышающего микширования.

29. Способ кодирования аудио по любому из пп. 22–25, в котором M-канальный аудиосигнал связан по меньшей мере с одним дополнительным аудиоканалом, причем:
указанный выбор одного из форматов кодирования дополнительно учитывает данные, относящиеся к указанному по меньшей мере одному дополнительному аудиоканалу; и
выбранный формат кодирования должен использоваться для кодирования М-канального аудиосигнала и дополнительного (-ых) аудиоканала (-ов).

30. Способ кодирования аудио по любому из пп. 22–25, в котором сигнал понижающего микширования, выводимый способом кодирования аудио, сегментирован на временные интервалы, и причем выбранный формат кодирования остается неизменным в течение по меньшей мере заданного количества временных интервалов, прежде чем будет выбран другой формат кодирования.

31. Способ кодирования аудио по любому из пп. 22–25, в котором в выбранном формате кодирования первая группа из одного или более каналов
М-канального аудиосигнала состоит из N каналов, где N ≥ 3, причем первая группа из одного или более каналов может быть реконструирована из первого канала сигнала понижающего микширования и N – 1 каналов указанного декоррелированного сигнала путем применения по меньшей мере некоторых «влажных» и «сухих» коэффициентов повышающего микширования,
при этом определение набора «сухих» коэффициентов повышающего микширования выбранного формата кодирования включает определение поднабора «сухих» коэффициентов повышающего микширования выбранного формата кодирования с целью определения такого линейного отображения первого канала сигнала понижающего микширования выбранного формата кодирования, которое аппроксимирует первую группу из одного или более каналов выбранного формата кодирования,
при этом определение набора «влажных» коэффициентов повышающего микширования выбранного формата кодирования включает определение промежуточной матрицы на основе разности между ковариацией первой группы из одного или более полученных каналов выбранного формата кодирования и ковариацией первой группы из одного или более каналов выбранного формата кодирования, аппроксимированных путем указанного линейного отображения первого канала сигнала понижающего микширования выбранного формата кодирования, при этом промежуточная матрица, умноженная на заданную матрицу, соответствует поднабору «влажных» коэффициентов повышающего микширования выбранного формата кодирования, определяющему линейное отображение указанных N – 1 каналов декоррелированного сигнала в рамках параметрической реконструкции первой группы из одного или более каналов выбранного формата кодирования, при этом указанный поднабор «влажных» коэффициентов повышающего микширования выбранного формата кодирования включает большее количество коэффициентов, чем количество элементов в промежуточной матрице, и
при этом дополнительная информация включает набор «сухих» параметров повышающего микширования, из которых можно получить указанный поднабор «сухих» коэффициентов повышающего микширования, и набор «влажных» параметров повышающего микширования, уникальным образом определяющих указанную промежуточную матрицу, при условии, что указанная промежуточная матрица относится к заданному классу матриц, при этом указанная промежуточная матрица содержит больше элементов, чем количество элементов в указанном поднаборе «влажных» параметров повышающего микширования выбранного формата кодирования.

32. Система (300) кодирования аудио, содержащая секцию (1400) кодирования, выполненную с возможностью кодирования М-канального аудиосигнала, имеющего заданную конфигурацию каналов (L, LS, LB, TFL, TBL), в виде двухканального сигнала понижающего микширования и ассоциированных параметров повышающего микширования, где M ≥ 4, причем секция кодирования содержит:
секцию (1411, 1412) понижающего микширования, выполненную с возможностью вычисления в соответствии с форматом кодирования двухканального сигнала понижающего микширования (L1, L2) на основе
М-канального аудиосигнала, причем сигнал понижающего микширования сегментирован на временные интервалы, при этом первый канал (L1) сигнала понижающего микширования формируется в виде линейной комбинации первой группы из одного или более каналов заданной конфигурации каналов
М-канального аудиосигнала, а второй канал (L2) сигнала понижающего микширования формируется в виде линейной комбинации второй группы из одного или более каналов заданной конфигурации каналов М-канального аудиосигнала, для по меньшей мере одного из по меньшей мере двух форматов кодирования (F1, F2, F3), которые соответствуют соответствующим разным разделениям каналов заданной конфигурации каналов М-канального аудиосигнала на соответствующие первую и вторую группы (601, 602) из одного или более каналов каждая;
секцию (1430) управления, выполненную с возможностью повторяющегося выбора одного из форматов кодирования;
интерполятор (1413, 1414) понижающего микширования, выполненный с возможностью создания плавного перехода между сигналом понижающего микширования в соответствии с первым форматом кодирования, выбранным секцией управления, и сигналом понижающего микширования в соответствии со вторым форматом кодирования, выбранным секцией управления сразу после первого формата кодирования;
при этом система кодирования аудио выполнена с возможностью определения для выбранного в данный момент формата кодирования набора «сухих» коэффициентов повышающего микширования (βL), и набора «влажных» коэффициентов повышающего микширования (γL), и выходной сигнализации (S), указывающей выбранный в данный момент формат кодирования, и дополнительной информации (i), которая позволяет выполнить параметрическую реконструкцию М-канального аудиосигнала на основе сигнала понижающего микширования и декоррелированного сигнала, определенного на основе по меньшей мере одного канала сигнала понижающего микширования выбранного формата кодирования, при этом дополнительная информация содержит дискретные значения наборов «сухих» и «влажных» коэффициентов повышающего микширования (βL, γL), при этом выводится по меньшей мере одно дискретное значение на временной интервал, и
при этом параметрическая реконструкция М-канального аудиосигнала между дискретными значениями должна быть основана на интерполированных значениях наборов «сухих» и «влажных» коэффициентов повышающего микширования (βL, γL) в соответствии с заданным правилом интерполяции, при этом система кодирования аудио выполнена с возможностью вывода плавного перехода сигнала понижающего микширования и дискретных значений наборов «сухих» и «влажных» коэффициентов повышающего микширования таким образом, чтобы указанный плавный переход и интерполяция были синхронными.

33. Система кодирования аудио по п. 32, выполненная с возможностью дополнительного кодирования M2-канального аудиосигнала (R, RS, RB, TFR, TBR),
причем секция управления выполнена с возможностью повторяющегося выбора одного из форматов кодирования с влиянием на М-канальный аудиосигнал и
M2-канальный аудиосигнал,
при этом система дополнительно содержит дополнительную секцию кодирования, соединенную с возможностью осуществления связи с секцией управления и выполненную с возможностью кодирования M2-канального аудиосигнала в соответствии с форматом кодирования, выбранным секцией управления.

34. Машиночитаемый носитель, содержащий компьютерный программный продукт с командами для выполнения способа по любому из пп. 1–3 и 22–25.
RU2017114642A 2014-10-31 2015-10-29 Параметрическое кодирование и декодирование многоканальных аудиосигналов RU2704266C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462073642P 2014-10-31 2014-10-31
US62/073,642 2014-10-31
US201562128425P 2015-03-04 2015-03-04
US62/128,425 2015-03-04
PCT/EP2015/075115 WO2016066743A1 (en) 2014-10-31 2015-10-29 Parametric encoding and decoding of multichannel audio signals

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2019131327A Division RU2798759C2 (ru) 2014-10-31 2015-10-29 Параметрическое кодирование и декодирование многоканальных аудиосигналов

Publications (3)

Publication Number Publication Date
RU2017114642A true RU2017114642A (ru) 2018-10-31
RU2017114642A3 RU2017114642A3 (ru) 2019-05-24
RU2704266C2 RU2704266C2 (ru) 2019-10-25

Family

ID=54705555

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017114642A RU2704266C2 (ru) 2014-10-31 2015-10-29 Параметрическое кодирование и декодирование многоканальных аудиосигналов

Country Status (9)

Country Link
US (1) US9955276B2 (ru)
EP (2) EP3213323B1 (ru)
JP (2) JP6640849B2 (ru)
KR (1) KR102486338B1 (ru)
CN (2) CN107004421B (ru)
BR (1) BR112017008015B1 (ru)
ES (1) ES2709661T3 (ru)
RU (1) RU2704266C2 (ru)
WO (1) WO2016066743A1 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2829413T3 (es) * 2015-05-20 2021-05-31 Ericsson Telefon Ab L M Codificación de señales de audio de múltiples canales
EP3337066B1 (en) 2016-12-14 2020-09-23 Nokia Technologies Oy Distributed audio mixing
CN107576933B (zh) * 2017-08-17 2020-10-30 电子科技大学 多维拟合的信源定位方法
US20200388292A1 (en) * 2019-06-10 2020-12-10 Google Llc Audio channel mixing

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
FR2862799B1 (fr) 2003-11-26 2006-02-24 Inst Nat Rech Inf Automat Dispositif et methode perfectionnes de spatialisation du son
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
JP2008529364A (ja) 2005-01-24 2008-07-31 ティ エイチ エックス リミテッド 周辺及び直接サラウンドサウンドシステム
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
EP1829424B1 (en) 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
MX2008000504A (es) * 2005-07-14 2008-03-07 Koninkl Philips Electronics Nv Codificacion y decodificacion de audio.
US8019614B2 (en) 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
BRPI0809760B1 (pt) * 2007-04-26 2020-12-01 Dolby International Ab aparelho e método para sintetizar um sinal de saída
WO2009049896A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
US8811621B2 (en) * 2008-05-23 2014-08-19 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
EP2345027B1 (en) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
WO2010115850A1 (en) 2009-04-08 2010-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
RU2011147119A (ru) * 2009-04-21 2013-05-27 Конинклейке Филипс Электроникс Н.В. Синтез аудиосигнала
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
EP2360681A1 (en) 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
KR101437896B1 (ko) * 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
TWI462087B (zh) * 2010-11-12 2014-11-21 Dolby Lab Licensing Corp 複數音頻信號之降混方法、編解碼方法及混合系統
US9219972B2 (en) 2010-11-19 2015-12-22 Nokia Technologies Oy Efficient audio coding having reduced bit rate for ambient signals and decoding using same
WO2012094338A1 (en) 2011-01-04 2012-07-12 Srs Labs, Inc. Immersive audio rendering system
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
TW202339510A (zh) 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
WO2013122388A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmission apparatus, data receiving apparatus, data transceiving system, data transmission method and data receiving method
EP2817802B1 (en) * 2012-02-24 2016-12-07 Dolby International AB Audio processing
JP5947971B2 (ja) * 2012-04-05 2016-07-06 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネルオーディオ信号の符号化パラメータを決定する方法及びマルチチャネルオーディオエンコーダ
KR20150032651A (ko) 2012-07-02 2015-03-27 소니 주식회사 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
EP4207817A1 (en) 2012-08-31 2023-07-05 Dolby Laboratories Licensing Corporation System for rendering and playback of object based audio in various listening environments
JP6186436B2 (ja) 2012-08-31 2017-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション 個々に指定可能なドライバへの上方混合されたコンテンツの反射されたおよび直接的なレンダリング
PL2896221T3 (pl) 2012-09-12 2017-04-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do i sposób zapewniania rozszerzonych możliwości kierowanego downmixu dla 3D audio
WO2014068583A1 (en) 2012-11-02 2014-05-08 Pulz Electronics Pvt. Ltd. Multi platform 4 layer and x, y, z axis audio recording, mixing and playback process
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
WO2014126689A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
CN110047496B (zh) * 2013-04-05 2023-08-04 杜比国际公司 立体声音频编码器和解码器
JP6479786B2 (ja) 2013-10-21 2019-03-06 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體

Also Published As

Publication number Publication date
RU2019131327A (ru) 2019-11-25
BR112017008015A2 (pt) 2017-12-19
JP2017536756A (ja) 2017-12-07
KR20170078648A (ko) 2017-07-07
CN111816194A (zh) 2020-10-23
RU2017114642A3 (ru) 2019-05-24
ES2709661T3 (es) 2019-04-17
WO2016066743A1 (en) 2016-05-06
US9955276B2 (en) 2018-04-24
BR112017008015B1 (pt) 2023-11-14
KR102486338B1 (ko) 2023-01-10
EP3213323B1 (en) 2018-12-12
CN107004421B (zh) 2020-07-07
EP3213323A1 (en) 2017-09-06
EP3540732A1 (en) 2019-09-18
JP6640849B2 (ja) 2020-02-05
EP3540732B1 (en) 2023-07-26
US20170339505A1 (en) 2017-11-23
RU2704266C2 (ru) 2019-10-25
JP2020074007A (ja) 2020-05-14
CN107004421A (zh) 2017-08-01
JP7009437B2 (ja) 2022-01-25

Similar Documents

Publication Publication Date Title
RU2016119563A (ru) Параметрическая реконструкция аудиосигналов
US10453462B2 (en) Method and apparatus for encoding and decoding 3-dimensional audio signal
JP5129368B2 (ja) スケーラブルチャンネル復号化方法
KR101218777B1 (ko) 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
CN102577384B (zh) 用相位信息和残差信息进行编码/解码的设备和方法
KR101356586B1 (ko) 다중 채널 오디오 신호를 생성하기 위한 디코더, 수신기 및 방법
JP2018010312A (ja) 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム
RU2017114642A (ru) Параметрическое кодирование и декодирование многоканальных аудиосигналов
JP2016537669A5 (ru)
RU2015133289A (ru) Способы управления межканальной когерентностью звуковых сигналов, подвергнутых повышающему микшированию
JP5681290B2 (ja) デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス
KR20080039474A (ko) 오디오 신호의 디코딩 방법 및 장치
JP2014520473A5 (ru)
US10170131B2 (en) Decoding method and decoder for dialog enhancement
RU2696952C2 (ru) Аудиокодировщик и декодер
JP2017536756A5 (ru)
JP2014038179A (ja) データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP4198972A1 (en) Stereo signal processing
RU2016115360A (ru) Структура декоррелятора для параметрического восстановления звуковых сигналов
TW201926318A (zh) 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質