RU2011145866A - Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации - Google Patents

Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации Download PDF

Info

Publication number
RU2011145866A
RU2011145866A RU2011145866/08A RU2011145866A RU2011145866A RU 2011145866 A RU2011145866 A RU 2011145866A RU 2011145866/08 A RU2011145866/08 A RU 2011145866/08A RU 2011145866 A RU2011145866 A RU 2011145866A RU 2011145866 A RU2011145866 A RU 2011145866A
Authority
RU
Russia
Prior art keywords
parameters
signal
rendering
audio
parameter
Prior art date
Application number
RU2011145866/08A
Other languages
English (en)
Other versions
RU2573738C2 (ru
Inventor
Юрген ХЕРРЕ
Андреас ХОЕЛЦЕР
Леонид ТЕРЕНТЬЕВ
Торстен КАСТНЕР
Корнелиа ФАЛХ
Хеико ПУРНХАГЕН
Йонас ЭНГДЕГАРД
Риддербуш ФАЛКО
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Фридрих-Александр-Университет Эрланген-Нюрнберг
Долби Интернэшионал АБ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., Фридрих-Александр-Университет Эрланген-Нюрнберг, Долби Интернэшионал АБ filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Publication of RU2011145866A publication Critical patent/RU2011145866A/ru
Application granted granted Critical
Publication of RU2573738C2 publication Critical patent/RU2573738C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

1. Устройство (100; 240; 320; 550) для оптимизации одного или более параметров (120; 222; 324; r', r) представления сигнала повышающего микширования (; 316; 522, 524; 522, 574) на основе представления сигнала понижающего микширования (212; 312; 524) и объектно-ориентированной параметрической информации (214; 314; 520), включающее в свою конструкцию: регулятор параметров (140; 240), выполненный с возможностью принимать один или более входных параметров (110; 242; 322; 552, 554; r) и на их основе генерировать один или более оптимизированных параметров (120; 222; 324; 542), причем регулятор параметров отличается тем, что генерирует один или более оптимизированных параметров в зависимости от одного или более входных параметров и объектно-ориентированной параметрической информации (130; 214а, 214b, 214c; 314; 520) таким образом, что искажение представления сигнала повышающего микширования, вызванное приложением неоптимальных параметров, уменьшается, по меньшей мере, для входных параметров, которые имеют отклонение от оптимальных параметров, выходящее за установленный допустимый диапазон отклонений.2. Устройство по п.1, характеризующееся тем, что оно принимает в качестве входных параметров (110; 242; 322; 552, 554; r) произвольно заданные (желаемые) параметры аудиорендеринга (r), описывающие желаемое масштабирование интенсивности множества сигналов аудиообъектов (x-x) по одному или более аудиоканалов, описанных в представлении сигнала повышающего микширования (; 316; 522, 524; 522, 574); и тем, что в его составе регулятор параметров генерирует один или более актуализованных параметров аудиорендеринга (r', r), исходя из одного или более желаемых параметров аудиорендеринга (r).3. Устройство по п.2, в составе которого �

Claims (34)

1. Устройство (100; 240; 320; 550) для оптимизации одного или более параметров (120; 222; 324; rm', rlim,m) представления сигнала повышающего микширования (
Figure 00000001
; 316; 522, 524; 522, 574) на основе представления сигнала понижающего микширования (212; 312; 524) и объектно-ориентированной параметрической информации (214; 314; 520), включающее в свою конструкцию: регулятор параметров (140; 240), выполненный с возможностью принимать один или более входных параметров (110; 242; 322; 552, 554; ri) и на их основе генерировать один или более оптимизированных параметров (120; 222; 324; 542), причем регулятор параметров отличается тем, что генерирует один или более оптимизированных параметров в зависимости от одного или более входных параметров и объектно-ориентированной параметрической информации (130; 214а, 214b, 214c; 314; 520) таким образом, что искажение представления сигнала повышающего микширования, вызванное приложением неоптимальных параметров, уменьшается, по меньшей мере, для входных параметров, которые имеют отклонение от оптимальных параметров, выходящее за установленный допустимый диапазон отклонений.
2. Устройство по п.1, характеризующееся тем, что оно принимает в качестве входных параметров (110; 242; 322; 552, 554; ri) произвольно заданные (желаемые) параметры аудиорендеринга (ri), описывающие желаемое масштабирование интенсивности множества сигналов аудиообъектов (x1-xN) по одному или более аудиоканалов, описанных в представлении сигнала повышающего микширования (
Figure 00000002
; 316; 522, 524; 522, 574); и тем, что в его составе регулятор параметров генерирует один или более актуализованных параметров аудиорендеринга (rm', rlim,m), исходя из одного или более желаемых параметров аудиорендеринга (ri).
3. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью генерировать одно или более пороговых значений параметров рендеринга
Figure 00000003
в зависимости от объектно-ориентированной параметрической информации (130; 214а, 214b, 214с; 314; 520) и информации понижающего микширования (214b; di), описывающих соотношение составляющих сигналов аудиообъектов (x1-xN) для представления сигнала понижающего микширования, при этом генерировать таким образом, что метрика искажений (dm1(m), dm2(m), dm5(m), dm6(m), DM1, DM2, DM3, DM4, DM5, DM6) находится в пределах заданного диапазона значений параметров рендеринга, удовлетворяющих интервалу значений, установленному предельными значениями параметров рендеринга, и в составе которого регулятор параметров выполнен с возможностью выведения актуализованных параметров аудиорендеринга (rm', rlim,m), исходя из желаемых параметров аудиорендеринга (ri) и одного или более пороговых значений параметров рендеринга таким образом, что актуализованные параметры рендеринга удовлетворяют интервалу значений, заданному предельными значениями параметров аудиорендеринга.
4. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью выведения одного или более пороговых значений параметров рендеринга
Figure 00000003
таким образом, что относительная составляющая сигнала объекта (x1-xN) в суперпозиции из множества сигналов объектов, сформированной в процессе аудиорендеринга с использованием одного или более параметров рендеринга (rm', rlim,m), отвечающих одному или более пороговым значениям параметров рендеринга, отличается от относительной составляющей сигнала объекта (x1-xN) в структуре микшированного с понижением сигнала (212; 312; 524) не больше, чем на расчетную разность.
5. Устройство по п.4, в составе которого регулятор параметров выполнен с возможностью расчета одного или более значений параметров рендеринга rm таким образом, что уравнение
Figure 00000004
выполняется для одного или более аудиообъектов, обозначенных индексом объекта m, где rm - параметр рендеринга, описывающий составляющую сигнала аудиообъекта с индексом m в определенном канале
Figure 00000005
микшированного с повышением сигнала, где dm - параметр понижающего микширования, описывающий составляющую сигнала объекта (x1-xN) с индексом m в микшированном с понижением сигнале, и где Xi - мера энергии аудиообъекта с индексом m, определяемая объектно-ориентированной параметрической информацией.
6. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга
Figure 00000003
таким образом, что мера искажения (DM3), описывающая когерентность даунмикс-сигнала, отраженную в представлении даунмикс-сигнала, и сигнала, полученного рендерингом с использованием одного или более параметров аудиорендеринга (rm), удовлетворяющих одному или более предельным значениям параметров рендеринга
Figure 00000003
, находится в пределах заданного диапазона.
7. Устройство по п.6, в составе которого регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга для
Figure 00000006
так, чтобы мера искажения
Figure 00000007
принимала заданное значение, где С определяется как
Figure 00000008
;
где
Figure 00000009
- матрица, в которой первый ряд параметров рендеринга r1 to rn и второй ряду параметров понижающего микширования d1 to dn описывают составляющие сигналов аудиообъектов в структуре представления сигнала понижающего микширования; где E - матрица ковариации объектов, сформированная с использованием параметров (OLD, IOC) объектно-ориентированной параметрической информации, и где "*" - комплексно-сопряженный оператор.
8. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью вычисления линейной комбинации квадрата желаемого параметра рендеринга (rm) и квадрата оптимального параметра рендеринга (ropt,m), для актуализации (генерации актуализованного) параметра аудиорендеринга (rlim,m); в составе которого регулятор параметров выполнен с возможностью расчета соотношения составляющих желаемого параметра рендеринга (rm) и оптимального параметра рендеринга (ropt,m) в линейной комбинации, исходя из заданного порогового параметра Т и метрики искажения (dm1, dm2, dm3, dm4, dm5, dm6), описывающей искажение, возможное в случае применения одного или более желаемых параметров аудиорендеринга (rm) - вместо оптимальных параметров рендеринга (ropt,m) - для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования.
9. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью вычисления уравнения
Figure 00000010
для актуализации (выведения актуализованного) параметра рендеринга lim,m, описывающего составляющую сигнала объекта с индексом m в данном апмикс-сигнале, где Т - расчетный предельный показатель искажения, где dmx(m) - метрика искажения, соотнесенная с желаемым параметром рендеринга rm, описывающим желаемую составляющую сигнала аудиообъекта с индексом объекта m в структуре канала апмикс-сигнала; где ropt,m - оптимальный параметр рендеринга, описывающий оптимальную составляющую сигнала аудиообъекта с индексом объекта m в канале апмикс-сигнала.
10. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения, находящейся в зависимости от соотношения составляющей сигнала объекта в суперпозиции множества сигналов объектов, образованной в процессе рендеринга с введением желаемых параметров рендеринга, и составляющей данного сигнала объекта в структуре даунмикс-сигнала, включающего в себя данный сигнал объекта.
11. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm1), зависящей от соотношения составляющей данного сигнала объекта (x1-xN) в суперпозиции множества сигналов объектов, сформированной в процессе рендеринга с использованием желаемых параметров рендеринга (rm), и составляющей данного сигнала объекта (x1-xN) в даунмикс-сигнале, включающем в себя данный сигнал объекта (x1-xN).
12. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения dmx(m) согласно
Figure 00000011
где rm и ri - произвольно заданные (желаемые) параметры рендеринга, соотнесенные с аудиообъектами, имеющими индексы объектов m и i, соответственно; где dm и di - параметры понижающего микширования, описывающие относительные составляющие сигналов аудиообъектов с индексами объектов m и i, соответственно, в даунмикс-сигнале в представлении даунмикс-сигнала; где Nob - количество выделенных аудиообъектов; где Xi - показатели уровня энергии, относящиеся к сигналам аудиообъектов с индексом объекта i.
13. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm2), находящейся в зависимости от разности между относительной составляющей данного сигнала объекта (x1-xN) в суперпозиции множества сигналов объектов, сформированной в процессе аудиорендеринга с использованием желаемых параметров рендеринга (rm) и относительной составляющей данного сигнала объекта (x1-xN) в структуре сигнала понижающего микширования, включающего в себя данный сигнал объекта (x1-xN).
14. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm2), находящейся в зависимости от отношения маска-сигнал (порога слышимости к сигналу) (msr), таким образом, что метрика искажения (dm2) убывает, служа показателем меньшего искажения, если отношение маска-сигнал возрастает.
15. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения на основании
Figure 00000012
или
Figure 00000013
где rm и ri - произвольно заданные (желаемые) параметры рендеринга, соотнесенные с аудиообъектами, имеющими индексы объектов m и i соответственно; где dm и di - параметры понижающего микширования, описывающие относительные составляющие сигналов аудиообъектов с индексами объектов m и i соответственно в даунмикс-сигнале в представлении даунмикс-сигнала; где N - количество выделенных аудиообъектов; где Xi и Xm - показатели уровня энергии, относящиеся к сигналам аудиообъектов с индексами объекта i и m соответственно; и где msr - отношение маска-сигнал.
16. Устройство по п.1, в составе которого регулятор параметров выполнен с возможностью генерировать один или более оптимизированных параметров в зависимости от вычислительной меры перцепционной деградации таким образом, что перцептивно оцениваемое искажение представления сигнала повышающего микширования, возбужденное введением неоптимальных параметров, и выраженное вычислительной мерой перцепционной деградации, ограничены.
17. Устройство по п.1, в составе которого регулятор параметров выполнен с возможностью приема информации о свойствах обособленного объекта, описывающей характеристики одного или более сигналов исходного объекта, которые составляют основу сигнала понижающего микширования, описанного посредством представления сигнала понижающего микширования; и в составе которого регулятор параметров выполнен с возможностью учета индивидуальных данных обособленного объекта и генерации оптимизированных параметров таким образом, что искажение представления сигнала повышающего микширования относительно идеального представления сигнала повышающего микширования уменьшается, по крайней мере, для входных параметров, имеющих отклонение от оптимальных параметров, превышающее расчетное отклонение.
18. Устройство по п.17, в составе которого регулятор параметров характеризуется тем, что принимает и учитывает в качестве индивидуальных данных аудиообъекта тональные характеристики сигнала объекта для формирования одного или более оптимизированных параметров.
19. Устройство по п.18, в составе которого регулятор параметров характеризуется тем, что оценивает тональные характеристики (N) апмикс-сигнала идеального рендеринга, исходя из полученной информации о тональных свойствах сигнала объекта и полученной информации о мощности объекта (OLD, P); и в составе которого регулятор параметров характеризуется тем, что генерирует один или более оптимизированных параметров с целью уменьшения различия между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более оптимизированных параметров, по сравнению с различием между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более входных параметров, или с целью сохранения различия между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более оптимизированных параметров в пределах заданного диапазона.
20. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что выполняет подстройку входных параметров по частоте и времени.
21. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что при формировании одного или более оптимизированных параметров учитывает также представление сигнала понижающего микширования.
22. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что определяет совокупную меру искажения, представляющую собой взвешенную совокупность мер искажения, описывающих множество типов артефактов; в составе которого регулятор параметров характеризуется тем, что определяет совокупную меру искажения как меру искажений, которые могли быть вызваны введением одного или более входных параметров рендеринга вместо оптимальных параметров рендеринга при формировании представления сигнала повышающего микширования на основе представления сигнала понижающего микширования.
23. Устройство по п.22, в составе которого регулятор параметров характеризуется тем, что объединяет, по меньшей мере, две из перечисленных ниже мер искажения для выработки совокупной меры искажения:
- мера, описывающая паразитное изменение тембра аудиообъекта;
- мера, описывающая паразитную модуляцию сигнала аудиообъекта;
- мера, описывающая присутствие паразитного музыкального тона;
- мера, описывающая наличие паразитного модулированного шума.
24. Декодер аудиосигнала (220, 240; 300) для представления в виде сигнала повышающего микширования множества аудиоканалов повышающего микширования (
Figure 00000001
; 316) на основе представления сигнала понижающего микширования (212; 312), объектно-ориентированной параметрической информации (214; 314) и параметров произвольно задаваемого (желаемого) рендеринга (242; 322), включающий в свой состав: повышающий микшер (220; 310), реализованный с целью формирования аудиоканалов повышающего микширования (
Figure 00000001
; 316) на основе представления сигнала понижающего микширования (212; 312) с учетом объектно-ориентированной параметрической информации (214; 314) и актуализованных данных рендеринга (222; 324), описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования; и устройство (100; 240; 320) для оптимизации одного или более параметров по одному из пп.1-23, характеризующееся тем, что принимает информацию о желаемом рендеринге (242; 322) в виде одного или более входных параметров (110) и генерирует один или более оптимизированных параметров (222; 324) в виде данных актуализированного рендеринга; и характеризующееся тем, что генерирует один или более оптимизированных параметров таким образом, что искажения аудиоканалов повышающего микширования (
Figure 00000001
; 316), вызванные использованием актуализованных параметров рендеринга (rm', rlim,m), которые имеют отклонения от оптимальных параметров рендеринга (ropt,m), уменьшаются, по крайней мере, для желаемых параметров рендеринга (ri), чье отклонение от оптимальных параметров рендеринга (ropt,m) превышает расчетное отклонение.
25. Транскодер аудиосигнала (500; 560) для представления в виде сигнала повышающего микширования (522) информации о параметрах каналов на основе представления сигнала понижающего микширования (524), объектно-ориентированной параметрической информации (520) и желаемых параметров рендеринга (552, 554), включающий в свой состав: транскодер служебной информации (540), реализованный с целью подготовки параметрических данных каналов (522) на основе представления сигнала понижающего микширования (524) с учетом объектно-ориентированной параметрической информации (520) и актуализованных данных рендеринга (542), описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации (522), для аудиоканалов повышающего микширования, описываемых информацией о параметрах каналов; и устройство (100; 550) для оптимизации одного или более параметров (542) по одному из пп.1-23, характеризующееся тем, что принимает желаемые параметры рендеринга (552, 554) как один или более входных параметров (110) и генерирует один или более оптимизированных параметров (120) в виде актуализованных данных рендеринга (542); и характеризующееся тем, что оно генерирует один или более оптимизированных параметров (120) таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга (542), имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга (552, 554), имеющих отклонение от оптимальных параметров рендеринга, превышающее расчетное отклонение.
26. Способ оптимизации одного или более параметров для представления сигнала повышающего микширования на основе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации, для осуществления которого: принимают один или более входных параметров и генерируют на их основе один или более оптимизированных параметров, причем генерацию одного или более оптимизированных параметров осуществляют на основе одного или более входных параметров с учетом объектно-ориентированной параметрической информации таким образом, что искажение представления сигнала повышающего микширования, вызванное использованием неоптимальных параметров, уменьшается, по крайней мере, для входных параметров, имеющих отклонение от оптимальных параметров, превышающее расчетное отклонение.
27. Способ представления в виде сигнала повышающего микширования множества аудиоканалов повышающего микширования на основе представления сигнала понижающего микширования, объектно-ориентированной пармаетрической информации и желаемых (произвольно задаваемых) параметров рендеринга, для осуществления которого: выполняют оптимизацию одного или более параметров по п.26, для чего принимают желаемые параметры рендеринга в виде одного или более входных параметров, и для чего один или более оптимизированных параметров генерируют в виде актуализованных параметров рендеринга, и для чего один или более оптимизированных параметров генерируют таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга, имеющих отклонение от оптимальных параметров рендеринга, превышающее заданное отклонение; и формируют аудиоканалы повышающего микширования на базе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации и актуализованных данных рендеринга, описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования.
28. Способ представления в виде сигнала повышающего микширования параметрических данных каналов на базе представления сигнала понижающего микширования, объектно-ориентированной параметрической информации и желаемых параметров рендеринга, для осуществления которого: выполняют оптимизацию одного или более параметров по п.26, для чего принимают желаемые параметры рендеринга в виде одного или более входных параметров, и для чего один или более оптимизированных параметров генерируют в виде актуализованных параметров рендеринга, и для чего один или более оптимизированных параметров генерируют таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга, имеющих отклонение от оптимальных параметров рендеринга, превышающее заданное отклонение; и получают параметрические данные каналов, которые описывают аудиоканалы повышающего микширования на основе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации и актуализованных данных рендеринга, отображающих пространственное расположение множества сигналов аудиообъектов, охарактеризованных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования, которые описаны параметрическими данными каналов.
29. Кодер аудиосигнала (600), предназначенный для формирования представления сигнала понижающего микширования (614) и объектно-ориентированной параметрической информации (616) на основе множества сигналов объектов (x1-xN), включающий в себя: понижающий микшер (620), генерирующий один или более даунмикс-сигналов на основании даунмикс-коэффициентов (d1-dN), соотнесенных с сигналами объектов (x1-xN), таким образом, что один или более даунмикс-сигналов отображают суперпозицию множества сигналов объектов; драйвер доступа к служебной информации (630), обеспечивающий дополнительные данные межобъектного соотношения (OLD, IOC), описывающие разности уровней и корреляционные характеристики сигналов объектов (x1-xN) и сопутствующие данные обособленного объекта, описывающие одно или более индивидуальных свойств сигналов обособленных объектов (x1-xN).
30. Устройство по п.29, в составе которого драйвер доступа к служебной информации (630) формирует сопутствующие данные обособленного объекта, описывающие тональные характеристики сигналов выделенных объектов (x1-xN).
31. Способ формирования представления сигнала понижающего микширования и объектно-ориентированной параметрической информации на материале массива сигналов объектов, для осуществления которого: формируют один или более даунмикс-сигналов в зависимости от даунмикс-коэффициентов, соотнесенных с сигналами объектов, таким образом, что один или более даунмикс-сигналов отображают суперпозицию совокупности сигналов объектов; и формируют дополнительные данные межобъектного соотношения, описывающие разности уровней и корреляционные характеристики сигналов объектов; и формируют сопутствующие данные обособленного объекта, описывающие одно или более индивидуальных свойств сигналов обособленных объектов.
32. Аудиобитстрим (поток двоичного представления звука) (700), представляющий множество сигналов объектов (x1-xN) в кодированной форме, содержащий в себе: представление даунмикс-сигнала (710), включающее в себя один или более даунмикс-сигналов, из которых, по меньшей мере, один даунмикс-сигнал отображает суперпозицию множества сигналов объектов; и служебную информацию о межобъектном соотношении (720), описывающую разности уровней и характеристики корреляции сигналов объектов; и сопутствующие данные обособленного объекта (730), описывающие одно или более индивидуальных свойств сигналов обособленных объектов.
33. Аудиобитстрим по п.32, в структуре которого сопутствующие данные обособленного объекта отображают тональные характеристики сигналов обособленных объектов.
34. Компьютерная программа для осуществления одного из способов по пп.26, 27, 28 или 31.
RU2011145866/08A 2009-04-28 2010-04-28 Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации RU2573738C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17345609P 2009-04-28 2009-04-28
US61/173,456 2009-04-28
PCT/EP2010/055717 WO2010125104A1 (en) 2009-04-28 2010-04-28 Apparatus for providing one or more adjusted parameters for a provision of an upmix signal representation on the basis of a downmix signal representation, audio signal decoder, audio signal transcoder, audio signal encoder, audio bitstream, method and computer program using an object-related parametric information

Publications (2)

Publication Number Publication Date
RU2011145866A true RU2011145866A (ru) 2013-05-27
RU2573738C2 RU2573738C2 (ru) 2016-01-27

Family

ID=42272162

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011145866/08A RU2573738C2 (ru) 2009-04-28 2010-04-28 Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации

Country Status (19)

Country Link
US (2) US8731950B2 (ru)
EP (2) EP2816555B1 (ru)
JP (2) JP5554830B2 (ru)
KR (1) KR101431889B1 (ru)
CN (1) CN102576532B (ru)
AR (1) AR076434A1 (ru)
AU (1) AU2010243635B2 (ru)
BR (1) BRPI1007777A2 (ru)
CA (2) CA2852503C (ru)
ES (2) ES2521715T3 (ru)
HK (2) HK1173551A1 (ru)
MX (1) MX2011011399A (ru)
MY (1) MY157169A (ru)
PL (2) PL2425427T3 (ru)
RU (1) RU2573738C2 (ru)
SG (1) SG175392A1 (ru)
TW (2) TWI560706B (ru)
WO (1) WO2010125104A1 (ru)
ZA (1) ZA201107895B (ru)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
CN102696070B (zh) 2010-01-06 2015-05-20 Lg电子株式会社 处理音频信号的设备及其方法
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
CN113490135B (zh) 2010-03-23 2023-05-30 杜比实验室特许公司 音频再现方法和声音再现系统
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
WO2013173080A1 (en) 2012-05-18 2013-11-21 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
PT2880654T (pt) * 2012-08-03 2017-12-07 Fraunhofer Ges Forschung Descodificador e método para um conceito paramétrico generalizado de codificação de objeto de áudio espacial para caixas de downmix/upmix multicanal
MX350687B (es) 2012-08-10 2017-09-13 Fraunhofer Ges Forschung Métodos y aparatos para adaptar información de audio en codificación de objeto de audio espacial.
WO2014043476A1 (en) * 2012-09-14 2014-03-20 Dolby Laboratories Licensing Corporation Multi-channel audio content analysis based upmix detection
CA2899134C (en) 2013-01-29 2019-07-30 Frederik Nagel Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
EP2804176A1 (en) * 2013-05-13 2014-11-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio object separation from mixture signal using object-specific time/frequency resolutions
EP2973551B1 (en) 2013-05-24 2017-05-03 Dolby International AB Reconstruction of audio scenes from a downmix
BR122020017152B1 (pt) 2013-05-24 2022-07-26 Dolby International Ab Método e aparelho para decodificar uma cena de áudio representada por n sinais de áudio e meio legível em computador não transitório
KR101760248B1 (ko) * 2013-05-24 2017-07-21 돌비 인터네셔널 에이비 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
WO2014187987A1 (en) * 2013-05-24 2014-11-27 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
EP3005353B1 (en) * 2013-05-24 2017-08-16 Dolby International AB Efficient coding of audio scenes comprising audio objects
GB2515089A (en) * 2013-06-14 2014-12-17 Nokia Corp Audio Processing
US9883311B2 (en) 2013-06-28 2018-01-30 Dolby Laboratories Licensing Corporation Rendering of audio objects using discontinuous rendering-matrix updates
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
JP6506764B2 (ja) 2013-09-12 2019-04-24 ドルビー ラボラトリーズ ライセンシング コーポレイション ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
EP2879131A1 (en) * 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
US10492014B2 (en) 2014-01-09 2019-11-26 Dolby Laboratories Licensing Corporation Spatial error metrics of audio content
BR122020020730B1 (pt) 2014-03-24 2022-10-11 Dolby International Ab Método e dispositivo para aplicação de compressão da gama dinâmica a um sinal ambisonics de ordem superior
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
KR102088337B1 (ko) 2015-02-02 2020-03-13 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 인코딩된 오디오 신호를 프로세싱하기 위한 장치 및 방법
CN105989845B (zh) 2015-02-25 2020-12-08 杜比实验室特许公司 视频内容协助的音频对象提取
KR101968456B1 (ko) * 2016-01-26 2019-04-11 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 양자화
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
CN110447243B (zh) * 2017-03-06 2021-06-01 杜比国际公司 基于音频数据流渲染音频输出的方法、解码器系统和介质
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
EP4243014A4 (en) * 2021-01-25 2024-07-17 Samsung Electronics Co Ltd APPARATUS AND METHOD FOR PROCESSING A MULTICHANNEL AUDIO SIGNAL

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090209A1 (en) * 2002-04-22 2003-10-30 Nokia Corporation Method and device for obtaining parameters for parametric speech coding of frames
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
EP1906706B1 (en) * 2005-07-15 2009-11-25 Panasonic Corporation Audio decoder
JP5507844B2 (ja) * 2005-10-20 2014-05-28 エルジー エレクトロニクス インコーポレイティド マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
WO2007083959A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
KR101396140B1 (ko) * 2006-09-18 2014-05-20 코닌클리케 필립스 엔.브이. 오디오 객체들의 인코딩과 디코딩
MX2008012250A (es) * 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US8634577B2 (en) * 2007-01-10 2014-01-21 Koninklijke Philips N.V. Audio decoder
KR20090115200A (ko) * 2007-02-13 2009-11-04 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
AU2008215232B2 (en) * 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
EP2082396A1 (en) * 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
TWI431611B (zh) * 2009-10-20 2014-03-21 Dolby Int Ab 用以基於下混信號表示型態提供上混信號表示型態之裝置、用以提供表示多聲道音訊信號的位元串流之裝置、使用失真控制發訊之方法、電腦程式與位元串流
JP5645951B2 (ja) * 2009-11-20 2014-12-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム

Also Published As

Publication number Publication date
PL2425427T3 (pl) 2015-02-27
US9786285B2 (en) 2017-10-10
KR101431889B1 (ko) 2014-08-27
JP5554830B2 (ja) 2014-07-23
US20140229187A1 (en) 2014-08-14
ES2572083T3 (es) 2016-05-30
WO2010125104A1 (en) 2010-11-04
MY157169A (en) 2016-05-13
JP2014206747A (ja) 2014-10-30
ZA201107895B (en) 2012-08-29
CA2760515A1 (en) 2010-11-04
MX2011011399A (es) 2012-06-27
KR20120018778A (ko) 2012-03-05
CA2852503C (en) 2017-10-03
SG175392A1 (en) 2011-12-29
EP2425427A1 (en) 2012-03-07
TWI560706B (en) 2016-12-01
BRPI1007777A2 (pt) 2017-02-14
EP2816555B1 (en) 2016-03-23
TW201104674A (en) 2011-02-01
CA2760515C (en) 2015-06-02
HK1205340A1 (zh) 2015-12-11
AU2010243635A1 (en) 2011-12-22
PL2816555T3 (pl) 2016-10-31
AR076434A1 (es) 2011-06-08
HK1173551A1 (zh) 2013-05-16
TWI529704B (zh) 2016-04-11
CN102576532A (zh) 2012-07-11
AU2010243635B2 (en) 2014-03-27
RU2573738C2 (ru) 2016-01-27
TW201443885A (zh) 2014-11-16
EP2425427B1 (en) 2014-09-10
JP2012525600A (ja) 2012-10-22
EP2816555A1 (en) 2014-12-24
US8731950B2 (en) 2014-05-20
US20120143613A1 (en) 2012-06-07
CA2852503A1 (en) 2010-11-04
ES2521715T3 (es) 2014-11-13
CN102576532B (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
RU2011145866A (ru) Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации
EP2950308B1 (en) Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
TWI324335B (en) Methods of signal processing and apparatus for wideband speech coding
Torcoli et al. Objective measures of perceptual audio quality reviewed: An evaluation of their application domain dependence
KR100904542B1 (ko) 멀티채널 합성장치 제어 신호를 발생하기 위한 장치 및방법과 멀티채널 합성을 위한 장치 및 방법
TWI484477B (zh) 參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
RU2586851C2 (ru) Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа
KR101672025B1 (ko) 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법
RU2669079C2 (ru) Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением
ES2673319T3 (es) Control de coherencia de fase para señales armónicas en códecs de audio perceptual
WO2013027630A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
EP2633520B1 (en) Parametric encoder for encoding a multi-channel audio signal
CN104321815A (zh) 用于带宽扩展的高频编码/高频解码方法和设备
RU2006146948A (ru) Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования
CN104221081A (zh) 带宽扩展音频信号的高频带扩展的生成
AU2011311659A1 (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
KR20160128871A (ko) 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치
US20070106505A1 (en) Audio coding
Lang et al. Novel low complexity coherence estimation and synthesis algorithms for parametric stereo coding
US20220208201A1 (en) Apparatus and method for comfort noise generation mode selection
EP4247011A1 (en) Apparatus and method for an automated control of a reverberation level using a perceptional model
Disch et al. Sinusoidal substitution—An integrated parametric tool for enhancement of transform-based perceptual audio coders
Brzuchalski et al. Energy balance in advanced audio coding encoder bit-distortion loop algorithm
RU2011102416A (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования

Legal Events

Date Code Title Description
FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20150723