RU2011145866A - Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации - Google Patents
Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации Download PDFInfo
- Publication number
- RU2011145866A RU2011145866A RU2011145866/08A RU2011145866A RU2011145866A RU 2011145866 A RU2011145866 A RU 2011145866A RU 2011145866/08 A RU2011145866/08 A RU 2011145866/08A RU 2011145866 A RU2011145866 A RU 2011145866A RU 2011145866 A RU2011145866 A RU 2011145866A
- Authority
- RU
- Russia
- Prior art keywords
- parameters
- signal
- rendering
- audio
- parameter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 7
- 238000004590 computer program Methods 0.000 title claims 2
- 238000009877 rendering Methods 0.000 claims abstract 79
- 239000000203 mixture Substances 0.000 claims abstract 18
- 230000005236 sound signal Effects 0.000 claims 3
- 230000015556 catabolic process Effects 0.000 claims 2
- 230000002596 correlated effect Effects 0.000 claims 2
- 238000006731 degradation reaction Methods 0.000 claims 2
- 239000011159 matrix material Substances 0.000 claims 2
- 230000000875 corresponding effect Effects 0.000 claims 1
- 230000007423 decrease Effects 0.000 claims 1
- 230000003247 decreasing effect Effects 0.000 claims 1
- 239000000463 material Substances 0.000 claims 1
- 230000003071 parasitic effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
1. Устройство (100; 240; 320; 550) для оптимизации одного или более параметров (120; 222; 324; r', r) представления сигнала повышающего микширования (; 316; 522, 524; 522, 574) на основе представления сигнала понижающего микширования (212; 312; 524) и объектно-ориентированной параметрической информации (214; 314; 520), включающее в свою конструкцию: регулятор параметров (140; 240), выполненный с возможностью принимать один или более входных параметров (110; 242; 322; 552, 554; r) и на их основе генерировать один или более оптимизированных параметров (120; 222; 324; 542), причем регулятор параметров отличается тем, что генерирует один или более оптимизированных параметров в зависимости от одного или более входных параметров и объектно-ориентированной параметрической информации (130; 214а, 214b, 214c; 314; 520) таким образом, что искажение представления сигнала повышающего микширования, вызванное приложением неоптимальных параметров, уменьшается, по меньшей мере, для входных параметров, которые имеют отклонение от оптимальных параметров, выходящее за установленный допустимый диапазон отклонений.2. Устройство по п.1, характеризующееся тем, что оно принимает в качестве входных параметров (110; 242; 322; 552, 554; r) произвольно заданные (желаемые) параметры аудиорендеринга (r), описывающие желаемое масштабирование интенсивности множества сигналов аудиообъектов (x-x) по одному или более аудиоканалов, описанных в представлении сигнала повышающего микширования (; 316; 522, 524; 522, 574); и тем, что в его составе регулятор параметров генерирует один или более актуализованных параметров аудиорендеринга (r', r), исходя из одного или более желаемых параметров аудиорендеринга (r).3. Устройство по п.2, в составе которого �
Claims (34)
1. Устройство (100; 240; 320; 550) для оптимизации одного или более параметров (120; 222; 324; rm', rlim,m) представления сигнала повышающего микширования (
; 316; 522, 524; 522, 574) на основе представления сигнала понижающего микширования (212; 312; 524) и объектно-ориентированной параметрической информации (214; 314; 520), включающее в свою конструкцию: регулятор параметров (140; 240), выполненный с возможностью принимать один или более входных параметров (110; 242; 322; 552, 554; ri) и на их основе генерировать один или более оптимизированных параметров (120; 222; 324; 542), причем регулятор параметров отличается тем, что генерирует один или более оптимизированных параметров в зависимости от одного или более входных параметров и объектно-ориентированной параметрической информации (130; 214а, 214b, 214c; 314; 520) таким образом, что искажение представления сигнала повышающего микширования, вызванное приложением неоптимальных параметров, уменьшается, по меньшей мере, для входных параметров, которые имеют отклонение от оптимальных параметров, выходящее за установленный допустимый диапазон отклонений.
2. Устройство по п.1, характеризующееся тем, что оно принимает в качестве входных параметров (110; 242; 322; 552, 554; ri) произвольно заданные (желаемые) параметры аудиорендеринга (ri), описывающие желаемое масштабирование интенсивности множества сигналов аудиообъектов (x1-xN) по одному или более аудиоканалов, описанных в представлении сигнала повышающего микширования (
; 316; 522, 524; 522, 574); и тем, что в его составе регулятор параметров генерирует один или более актуализованных параметров аудиорендеринга (rm', rlim,m), исходя из одного или более желаемых параметров аудиорендеринга (ri).
3. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью генерировать одно или более пороговых значений параметров рендеринга
в зависимости от объектно-ориентированной параметрической информации (130; 214а, 214b, 214с; 314; 520) и информации понижающего микширования (214b; di), описывающих соотношение составляющих сигналов аудиообъектов (x1-xN) для представления сигнала понижающего микширования, при этом генерировать таким образом, что метрика искажений (dm1(m), dm2(m), dm5(m), dm6(m), DM1, DM2, DM3, DM4, DM5, DM6) находится в пределах заданного диапазона значений параметров рендеринга, удовлетворяющих интервалу значений, установленному предельными значениями параметров рендеринга, и в составе которого регулятор параметров выполнен с возможностью выведения актуализованных параметров аудиорендеринга (rm', rlim,m), исходя из желаемых параметров аудиорендеринга (ri) и одного или более пороговых значений параметров рендеринга таким образом, что актуализованные параметры рендеринга удовлетворяют интервалу значений, заданному предельными значениями параметров аудиорендеринга.
4. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью выведения одного или более пороговых значений параметров рендеринга
таким образом, что относительная составляющая сигнала объекта (x1-xN) в суперпозиции из множества сигналов объектов, сформированной в процессе аудиорендеринга с использованием одного или более параметров рендеринга (rm', rlim,m), отвечающих одному или более пороговым значениям параметров рендеринга, отличается от относительной составляющей сигнала объекта (x1-xN) в структуре микшированного с понижением сигнала (212; 312; 524) не больше, чем на расчетную разность.
5. Устройство по п.4, в составе которого регулятор параметров выполнен с возможностью расчета одного или более значений параметров рендеринга rm таким образом, что уравнение
выполняется для одного или более аудиообъектов, обозначенных индексом объекта m, где rm - параметр рендеринга, описывающий составляющую сигнала аудиообъекта с индексом m в определенном канале
микшированного с повышением сигнала, где dm - параметр понижающего микширования, описывающий составляющую сигнала объекта (x1-xN) с индексом m в микшированном с понижением сигнале, и где Xi - мера энергии аудиообъекта с индексом m, определяемая объектно-ориентированной параметрической информацией.
6. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга
таким образом, что мера искажения (DM3), описывающая когерентность даунмикс-сигнала, отраженную в представлении даунмикс-сигнала, и сигнала, полученного рендерингом с использованием одного или более параметров аудиорендеринга (rm), удовлетворяющих одному или более предельным значениям параметров рендеринга
, находится в пределах заданного диапазона.
7. Устройство по п.6, в составе которого регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга для
так, чтобы мера искажения
где
- матрица, в которой первый ряд параметров рендеринга r1 to rn и второй ряду параметров понижающего микширования d1 to dn описывают составляющие сигналов аудиообъектов в структуре представления сигнала понижающего микширования; где E - матрица ковариации объектов, сформированная с использованием параметров (OLD, IOC) объектно-ориентированной параметрической информации, и где "*" - комплексно-сопряженный оператор.
8. Устройство по п.2, в составе которого регулятор параметров выполнен с возможностью вычисления линейной комбинации квадрата желаемого параметра рендеринга (rm) и квадрата оптимального параметра рендеринга (ropt,m), для актуализации (генерации актуализованного) параметра аудиорендеринга (rlim,m); в составе которого регулятор параметров выполнен с возможностью расчета соотношения составляющих желаемого параметра рендеринга (rm) и оптимального параметра рендеринга (ropt,m) в линейной комбинации, исходя из заданного порогового параметра Т и метрики искажения (dm1, dm2, dm3, dm4, dm5, dm6), описывающей искажение, возможное в случае применения одного или более желаемых параметров аудиорендеринга (rm) - вместо оптимальных параметров рендеринга (ropt,m) - для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования.
9. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью вычисления уравнения
для актуализации (выведения актуализованного) параметра рендеринга lim,m, описывающего составляющую сигнала объекта с индексом m в данном апмикс-сигнале, где Т - расчетный предельный показатель искажения, где dmx(m) - метрика искажения, соотнесенная с желаемым параметром рендеринга rm, описывающим желаемую составляющую сигнала аудиообъекта с индексом объекта m в структуре канала апмикс-сигнала; где ropt,m - оптимальный параметр рендеринга, описывающий оптимальную составляющую сигнала аудиообъекта с индексом объекта m в канале апмикс-сигнала.
10. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения, находящейся в зависимости от соотношения составляющей сигнала объекта в суперпозиции множества сигналов объектов, образованной в процессе рендеринга с введением желаемых параметров рендеринга, и составляющей данного сигнала объекта в структуре даунмикс-сигнала, включающего в себя данный сигнал объекта.
11. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm1), зависящей от соотношения составляющей данного сигнала объекта (x1-xN) в суперпозиции множества сигналов объектов, сформированной в процессе рендеринга с использованием желаемых параметров рендеринга (rm), и составляющей данного сигнала объекта (x1-xN) в даунмикс-сигнале, включающем в себя данный сигнал объекта (x1-xN).
12. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения dmx(m) согласно
где rm и ri - произвольно заданные (желаемые) параметры рендеринга, соотнесенные с аудиообъектами, имеющими индексы объектов m и i, соответственно; где dm и di - параметры понижающего микширования, описывающие относительные составляющие сигналов аудиообъектов с индексами объектов m и i, соответственно, в даунмикс-сигнале в представлении даунмикс-сигнала; где Nob - количество выделенных аудиообъектов; где Xi - показатели уровня энергии, относящиеся к сигналам аудиообъектов с индексом объекта i.
13. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm2), находящейся в зависимости от разности между относительной составляющей данного сигнала объекта (x1-xN) в суперпозиции множества сигналов объектов, сформированной в процессе аудиорендеринга с использованием желаемых параметров рендеринга (rm) и относительной составляющей данного сигнала объекта (x1-xN) в структуре сигнала понижающего микширования, включающего в себя данный сигнал объекта (x1-xN).
14. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения (dm2), находящейся в зависимости от отношения маска-сигнал (порога слышимости к сигналу) (msr), таким образом, что метрика искажения (dm2) убывает, служа показателем меньшего искажения, если отношение маска-сигнал возрастает.
15. Устройство по п.8, в составе которого регулятор параметров выполнен с возможностью расчета метрики искажения на основании
или
где rm и ri - произвольно заданные (желаемые) параметры рендеринга, соотнесенные с аудиообъектами, имеющими индексы объектов m и i соответственно; где dm и di - параметры понижающего микширования, описывающие относительные составляющие сигналов аудиообъектов с индексами объектов m и i соответственно в даунмикс-сигнале в представлении даунмикс-сигнала; где N - количество выделенных аудиообъектов; где Xi и Xm - показатели уровня энергии, относящиеся к сигналам аудиообъектов с индексами объекта i и m соответственно; и где msr - отношение маска-сигнал.
16. Устройство по п.1, в составе которого регулятор параметров выполнен с возможностью генерировать один или более оптимизированных параметров в зависимости от вычислительной меры перцепционной деградации таким образом, что перцептивно оцениваемое искажение представления сигнала повышающего микширования, возбужденное введением неоптимальных параметров, и выраженное вычислительной мерой перцепционной деградации, ограничены.
17. Устройство по п.1, в составе которого регулятор параметров выполнен с возможностью приема информации о свойствах обособленного объекта, описывающей характеристики одного или более сигналов исходного объекта, которые составляют основу сигнала понижающего микширования, описанного посредством представления сигнала понижающего микширования; и в составе которого регулятор параметров выполнен с возможностью учета индивидуальных данных обособленного объекта и генерации оптимизированных параметров таким образом, что искажение представления сигнала повышающего микширования относительно идеального представления сигнала повышающего микширования уменьшается, по крайней мере, для входных параметров, имеющих отклонение от оптимальных параметров, превышающее расчетное отклонение.
18. Устройство по п.17, в составе которого регулятор параметров характеризуется тем, что принимает и учитывает в качестве индивидуальных данных аудиообъекта тональные характеристики сигнала объекта для формирования одного или более оптимизированных параметров.
19. Устройство по п.18, в составе которого регулятор параметров характеризуется тем, что оценивает тональные характеристики (N) апмикс-сигнала идеального рендеринга, исходя из полученной информации о тональных свойствах сигнала объекта и полученной информации о мощности объекта (OLD, P); и в составе которого регулятор параметров характеризуется тем, что генерирует один или более оптимизированных параметров с целью уменьшения различия между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более оптимизированных параметров, по сравнению с различием между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более входных параметров, или с целью сохранения различия между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более оптимизированных параметров в пределах заданного диапазона.
20. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что выполняет подстройку входных параметров по частоте и времени.
21. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что при формировании одного или более оптимизированных параметров учитывает также представление сигнала понижающего микширования.
22. Устройство по п.1, в составе которого регулятор параметров характеризуется тем, что определяет совокупную меру искажения, представляющую собой взвешенную совокупность мер искажения, описывающих множество типов артефактов; в составе которого регулятор параметров характеризуется тем, что определяет совокупную меру искажения как меру искажений, которые могли быть вызваны введением одного или более входных параметров рендеринга вместо оптимальных параметров рендеринга при формировании представления сигнала повышающего микширования на основе представления сигнала понижающего микширования.
23. Устройство по п.22, в составе которого регулятор параметров характеризуется тем, что объединяет, по меньшей мере, две из перечисленных ниже мер искажения для выработки совокупной меры искажения:
- мера, описывающая паразитное изменение тембра аудиообъекта;
- мера, описывающая паразитную модуляцию сигнала аудиообъекта;
- мера, описывающая присутствие паразитного музыкального тона;
- мера, описывающая наличие паразитного модулированного шума.
24. Декодер аудиосигнала (220, 240; 300) для представления в виде сигнала повышающего микширования множества аудиоканалов повышающего микширования (
; 316) на основе представления сигнала понижающего микширования (212; 312), объектно-ориентированной параметрической информации (214; 314) и параметров произвольно задаваемого (желаемого) рендеринга (242; 322), включающий в свой состав: повышающий микшер (220; 310), реализованный с целью формирования аудиоканалов повышающего микширования (
; 316) на основе представления сигнала понижающего микширования (212; 312) с учетом объектно-ориентированной параметрической информации (214; 314) и актуализованных данных рендеринга (222; 324), описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования; и устройство (100; 240; 320) для оптимизации одного или более параметров по одному из пп.1-23, характеризующееся тем, что принимает информацию о желаемом рендеринге (242; 322) в виде одного или более входных параметров (110) и генерирует один или более оптимизированных параметров (222; 324) в виде данных актуализированного рендеринга; и характеризующееся тем, что генерирует один или более оптимизированных параметров таким образом, что искажения аудиоканалов повышающего микширования (
; 316), вызванные использованием актуализованных параметров рендеринга (rm', rlim,m), которые имеют отклонения от оптимальных параметров рендеринга (ropt,m), уменьшаются, по крайней мере, для желаемых параметров рендеринга (ri), чье отклонение от оптимальных параметров рендеринга (ropt,m) превышает расчетное отклонение.
25. Транскодер аудиосигнала (500; 560) для представления в виде сигнала повышающего микширования (522) информации о параметрах каналов на основе представления сигнала понижающего микширования (524), объектно-ориентированной параметрической информации (520) и желаемых параметров рендеринга (552, 554), включающий в свой состав: транскодер служебной информации (540), реализованный с целью подготовки параметрических данных каналов (522) на основе представления сигнала понижающего микширования (524) с учетом объектно-ориентированной параметрической информации (520) и актуализованных данных рендеринга (542), описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации (522), для аудиоканалов повышающего микширования, описываемых информацией о параметрах каналов; и устройство (100; 550) для оптимизации одного или более параметров (542) по одному из пп.1-23, характеризующееся тем, что принимает желаемые параметры рендеринга (552, 554) как один или более входных параметров (110) и генерирует один или более оптимизированных параметров (120) в виде актуализованных данных рендеринга (542); и характеризующееся тем, что оно генерирует один или более оптимизированных параметров (120) таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга (542), имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга (552, 554), имеющих отклонение от оптимальных параметров рендеринга, превышающее расчетное отклонение.
26. Способ оптимизации одного или более параметров для представления сигнала повышающего микширования на основе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации, для осуществления которого: принимают один или более входных параметров и генерируют на их основе один или более оптимизированных параметров, причем генерацию одного или более оптимизированных параметров осуществляют на основе одного или более входных параметров с учетом объектно-ориентированной параметрической информации таким образом, что искажение представления сигнала повышающего микширования, вызванное использованием неоптимальных параметров, уменьшается, по крайней мере, для входных параметров, имеющих отклонение от оптимальных параметров, превышающее расчетное отклонение.
27. Способ представления в виде сигнала повышающего микширования множества аудиоканалов повышающего микширования на основе представления сигнала понижающего микширования, объектно-ориентированной пармаетрической информации и желаемых (произвольно задаваемых) параметров рендеринга, для осуществления которого: выполняют оптимизацию одного или более параметров по п.26, для чего принимают желаемые параметры рендеринга в виде одного или более входных параметров, и для чего один или более оптимизированных параметров генерируют в виде актуализованных параметров рендеринга, и для чего один или более оптимизированных параметров генерируют таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга, имеющих отклонение от оптимальных параметров рендеринга, превышающее заданное отклонение; и формируют аудиоканалы повышающего микширования на базе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации и актуализованных данных рендеринга, описывающих пространственное расположение множества сигналов аудиообъектов, отображенных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования.
28. Способ представления в виде сигнала повышающего микширования параметрических данных каналов на базе представления сигнала понижающего микширования, объектно-ориентированной параметрической информации и желаемых параметров рендеринга, для осуществления которого: выполняют оптимизацию одного или более параметров по п.26, для чего принимают желаемые параметры рендеринга в виде одного или более входных параметров, и для чего один или более оптимизированных параметров генерируют в виде актуализованных параметров рендеринга, и для чего один или более оптимизированных параметров генерируют таким образом, что искажения аудиоканалов повышающего микширования, вызванные использованием актуализованных параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, уменьшаются, по крайней мере, для желаемых параметров рендеринга, имеющих отклонение от оптимальных параметров рендеринга, превышающее заданное отклонение; и получают параметрические данные каналов, которые описывают аудиоканалы повышающего микширования на основе представления сигнала понижающего микширования с учетом объектно-ориентированной параметрической информации и актуализованных данных рендеринга, отображающих пространственное расположение множества сигналов аудиообъектов, охарактеризованных в объектно-ориентированной параметрической информации, для аудиоканалов повышающего микширования, которые описаны параметрическими данными каналов.
29. Кодер аудиосигнала (600), предназначенный для формирования представления сигнала понижающего микширования (614) и объектно-ориентированной параметрической информации (616) на основе множества сигналов объектов (x1-xN), включающий в себя: понижающий микшер (620), генерирующий один или более даунмикс-сигналов на основании даунмикс-коэффициентов (d1-dN), соотнесенных с сигналами объектов (x1-xN), таким образом, что один или более даунмикс-сигналов отображают суперпозицию множества сигналов объектов; драйвер доступа к служебной информации (630), обеспечивающий дополнительные данные межобъектного соотношения (OLD, IOC), описывающие разности уровней и корреляционные характеристики сигналов объектов (x1-xN) и сопутствующие данные обособленного объекта, описывающие одно или более индивидуальных свойств сигналов обособленных объектов (x1-xN).
30. Устройство по п.29, в составе которого драйвер доступа к служебной информации (630) формирует сопутствующие данные обособленного объекта, описывающие тональные характеристики сигналов выделенных объектов (x1-xN).
31. Способ формирования представления сигнала понижающего микширования и объектно-ориентированной параметрической информации на материале массива сигналов объектов, для осуществления которого: формируют один или более даунмикс-сигналов в зависимости от даунмикс-коэффициентов, соотнесенных с сигналами объектов, таким образом, что один или более даунмикс-сигналов отображают суперпозицию совокупности сигналов объектов; и формируют дополнительные данные межобъектного соотношения, описывающие разности уровней и корреляционные характеристики сигналов объектов; и формируют сопутствующие данные обособленного объекта, описывающие одно или более индивидуальных свойств сигналов обособленных объектов.
32. Аудиобитстрим (поток двоичного представления звука) (700), представляющий множество сигналов объектов (x1-xN) в кодированной форме, содержащий в себе: представление даунмикс-сигнала (710), включающее в себя один или более даунмикс-сигналов, из которых, по меньшей мере, один даунмикс-сигнал отображает суперпозицию множества сигналов объектов; и служебную информацию о межобъектном соотношении (720), описывающую разности уровней и характеристики корреляции сигналов объектов; и сопутствующие данные обособленного объекта (730), описывающие одно или более индивидуальных свойств сигналов обособленных объектов.
33. Аудиобитстрим по п.32, в структуре которого сопутствующие данные обособленного объекта отображают тональные характеристики сигналов обособленных объектов.
34. Компьютерная программа для осуществления одного из способов по пп.26, 27, 28 или 31.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17345609P | 2009-04-28 | 2009-04-28 | |
US61/173,456 | 2009-04-28 | ||
PCT/EP2010/055717 WO2010125104A1 (en) | 2009-04-28 | 2010-04-28 | Apparatus for providing one or more adjusted parameters for a provision of an upmix signal representation on the basis of a downmix signal representation, audio signal decoder, audio signal transcoder, audio signal encoder, audio bitstream, method and computer program using an object-related parametric information |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2011145866A true RU2011145866A (ru) | 2013-05-27 |
RU2573738C2 RU2573738C2 (ru) | 2016-01-27 |
Family
ID=42272162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011145866/08A RU2573738C2 (ru) | 2009-04-28 | 2010-04-28 | Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации |
Country Status (19)
Country | Link |
---|---|
US (2) | US8731950B2 (ru) |
EP (2) | EP2816555B1 (ru) |
JP (2) | JP5554830B2 (ru) |
KR (1) | KR101431889B1 (ru) |
CN (1) | CN102576532B (ru) |
AR (1) | AR076434A1 (ru) |
AU (1) | AU2010243635B2 (ru) |
BR (1) | BRPI1007777A2 (ru) |
CA (2) | CA2852503C (ru) |
ES (2) | ES2521715T3 (ru) |
HK (2) | HK1173551A1 (ru) |
MX (1) | MX2011011399A (ru) |
MY (1) | MY157169A (ru) |
PL (2) | PL2425427T3 (ru) |
RU (1) | RU2573738C2 (ru) |
SG (1) | SG175392A1 (ru) |
TW (2) | TWI560706B (ru) |
WO (1) | WO2010125104A1 (ru) |
ZA (1) | ZA201107895B (ru) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2011011399A (es) | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
CN102696070B (zh) | 2010-01-06 | 2015-05-20 | Lg电子株式会社 | 处理音频信号的设备及其方法 |
US10158958B2 (en) | 2010-03-23 | 2018-12-18 | Dolby Laboratories Licensing Corporation | Techniques for localized perceptual audio |
CN113490135B (zh) | 2010-03-23 | 2023-05-30 | 杜比实验室特许公司 | 音频再现方法和声音再现系统 |
KR20120071072A (ko) * | 2010-12-22 | 2012-07-02 | 한국전자통신연구원 | 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 |
ITTO20120067A1 (it) * | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
WO2013173080A1 (en) | 2012-05-18 | 2013-11-21 | Dolby Laboratories Licensing Corporation | System for maintaining reversible dynamic range control information associated with parametric audio coders |
PT2880654T (pt) * | 2012-08-03 | 2017-12-07 | Fraunhofer Ges Forschung | Descodificador e método para um conceito paramétrico generalizado de codificação de objeto de áudio espacial para caixas de downmix/upmix multicanal |
MX350687B (es) | 2012-08-10 | 2017-09-13 | Fraunhofer Ges Forschung | Métodos y aparatos para adaptar información de audio en codificación de objeto de audio espacial. |
WO2014043476A1 (en) * | 2012-09-14 | 2014-03-20 | Dolby Laboratories Licensing Corporation | Multi-channel audio content analysis based upmix detection |
CA2899134C (en) | 2013-01-29 | 2019-07-30 | Frederik Nagel | Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information |
EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
EP2973551B1 (en) | 2013-05-24 | 2017-05-03 | Dolby International AB | Reconstruction of audio scenes from a downmix |
BR122020017152B1 (pt) | 2013-05-24 | 2022-07-26 | Dolby International Ab | Método e aparelho para decodificar uma cena de áudio representada por n sinais de áudio e meio legível em computador não transitório |
KR101760248B1 (ko) * | 2013-05-24 | 2017-07-21 | 돌비 인터네셔널 에이비 | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 |
WO2014187987A1 (en) * | 2013-05-24 | 2014-11-27 | Dolby International Ab | Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder |
EP3005353B1 (en) * | 2013-05-24 | 2017-08-16 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
GB2515089A (en) * | 2013-06-14 | 2014-12-17 | Nokia Corp | Audio Processing |
US9883311B2 (en) | 2013-06-28 | 2018-01-30 | Dolby Laboratories Licensing Corporation | Rendering of audio objects using discontinuous rendering-matrix updates |
EP2830048A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
JP6506764B2 (ja) | 2013-09-12 | 2019-04-24 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
US10492014B2 (en) | 2014-01-09 | 2019-11-26 | Dolby Laboratories Licensing Corporation | Spatial error metrics of audio content |
BR122020020730B1 (pt) | 2014-03-24 | 2022-10-11 | Dolby International Ab | Método e dispositivo para aplicação de compressão da gama dinâmica a um sinal ambisonics de ordem superior |
EP3127109B1 (en) | 2014-04-01 | 2018-03-14 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
KR102088337B1 (ko) | 2015-02-02 | 2020-03-13 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 인코딩된 오디오 신호를 프로세싱하기 위한 장치 및 방법 |
CN105989845B (zh) | 2015-02-25 | 2020-12-08 | 杜比实验室特许公司 | 视频内容协助的音频对象提取 |
KR101968456B1 (ko) * | 2016-01-26 | 2019-04-11 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 양자화 |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
CN110447243B (zh) * | 2017-03-06 | 2021-06-01 | 杜比国际公司 | 基于音频数据流渲染音频输出的方法、解码器系统和介质 |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
EP4243014A4 (en) * | 2021-01-25 | 2024-07-17 | Samsung Electronics Co Ltd | APPARATUS AND METHOD FOR PROCESSING A MULTICHANNEL AUDIO SIGNAL |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090209A1 (en) * | 2002-04-22 | 2003-10-30 | Nokia Corporation | Method and device for obtaining parameters for parametric speech coding of frames |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
EP1906706B1 (en) * | 2005-07-15 | 2009-11-25 | Panasonic Corporation | Audio decoder |
JP5507844B2 (ja) * | 2005-10-20 | 2014-05-28 | エルジー エレクトロニクス インコーポレイティド | マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置 |
WO2007083959A1 (en) * | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
KR101396140B1 (ko) * | 2006-09-18 | 2014-05-20 | 코닌클리케 필립스 엔.브이. | 오디오 객체들의 인코딩과 디코딩 |
MX2008012250A (es) * | 2006-09-29 | 2008-10-07 | Lg Electronics Inc | Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
US8634577B2 (en) * | 2007-01-10 | 2014-01-21 | Koninklijke Philips N.V. | Audio decoder |
KR20090115200A (ko) * | 2007-02-13 | 2009-11-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
AU2008215232B2 (en) * | 2007-02-14 | 2010-02-25 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
EP2082396A1 (en) * | 2007-10-17 | 2009-07-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
MX2011011399A (es) | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
KR101137360B1 (ko) * | 2009-01-28 | 2012-04-19 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
TWI431611B (zh) * | 2009-10-20 | 2014-03-21 | Dolby Int Ab | 用以基於下混信號表示型態提供上混信號表示型態之裝置、用以提供表示多聲道音訊信號的位元串流之裝置、使用失真控制發訊之方法、電腦程式與位元串流 |
JP5645951B2 (ja) * | 2009-11-20 | 2014-12-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム |
-
2008
- 2008-10-17 MX MX2011011399A patent/MX2011011399A/es active IP Right Grant
-
2010
- 2010-04-28 PL PL10716830T patent/PL2425427T3/pl unknown
- 2010-04-28 BR BRPI1007777A patent/BRPI1007777A2/pt not_active Application Discontinuation
- 2010-04-28 KR KR1020117028264A patent/KR101431889B1/ko active IP Right Grant
- 2010-04-28 PL PL14180279.3T patent/PL2816555T3/pl unknown
- 2010-04-28 JP JP2012507733A patent/JP5554830B2/ja active Active
- 2010-04-28 RU RU2011145866/08A patent/RU2573738C2/ru active
- 2010-04-28 WO PCT/EP2010/055717 patent/WO2010125104A1/en active Application Filing
- 2010-04-28 SG SG2011079464A patent/SG175392A1/en unknown
- 2010-04-28 CA CA2852503A patent/CA2852503C/en active Active
- 2010-04-28 ES ES10716830.4T patent/ES2521715T3/es active Active
- 2010-04-28 AR ARP100101428A patent/AR076434A1/es active IP Right Grant
- 2010-04-28 TW TW103126579A patent/TWI560706B/zh active
- 2010-04-28 EP EP14180279.3A patent/EP2816555B1/en active Active
- 2010-04-28 CA CA2760515A patent/CA2760515C/en active Active
- 2010-04-28 CN CN201080019185.0A patent/CN102576532B/zh active Active
- 2010-04-28 ES ES14180279T patent/ES2572083T3/es active Active
- 2010-04-28 AU AU2010243635A patent/AU2010243635B2/en active Active
- 2010-04-28 TW TW099113479A patent/TWI529704B/zh active
- 2010-04-28 MY MYPI2011005228A patent/MY157169A/en unknown
- 2010-04-28 EP EP10716830.4A patent/EP2425427B1/en active Active
-
2011
- 2011-10-28 ZA ZA2011/07895A patent/ZA201107895B/en unknown
- 2011-10-28 US US13/284,583 patent/US8731950B2/en active Active
-
2013
- 2013-01-10 HK HK13100446.5A patent/HK1173551A1/zh unknown
-
2014
- 2014-04-10 US US14/250,026 patent/US9786285B2/en active Active
- 2014-05-29 JP JP2014111756A patent/JP2014206747A/ja active Pending
-
2015
- 2015-06-23 HK HK15105962.6A patent/HK1205340A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2011145866A (ru) | Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации | |
EP2950308B1 (en) | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method | |
TWI324335B (en) | Methods of signal processing and apparatus for wideband speech coding | |
Torcoli et al. | Objective measures of perceptual audio quality reviewed: An evaluation of their application domain dependence | |
KR100904542B1 (ko) | 멀티채널 합성장치 제어 신호를 발생하기 위한 장치 및방법과 멀티채널 합성을 위한 장치 및 방법 | |
TWI484477B (zh) | 參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器 | |
RU2345506C2 (ru) | Многоканальный синтезатор и способ для формирования многоканального выходного сигнала | |
RU2586851C2 (ru) | Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа | |
KR101672025B1 (ko) | 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법 | |
RU2669079C2 (ru) | Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением | |
ES2673319T3 (es) | Control de coherencia de fase para señales armónicas en códecs de audio perceptual | |
WO2013027630A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
EP2633520B1 (en) | Parametric encoder for encoding a multi-channel audio signal | |
CN104321815A (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
RU2006146948A (ru) | Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования | |
CN104221081A (zh) | 带宽扩展音频信号的高频带扩展的生成 | |
AU2011311659A1 (en) | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC) | |
KR20160128871A (ko) | 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치 | |
US20070106505A1 (en) | Audio coding | |
Lang et al. | Novel low complexity coherence estimation and synthesis algorithms for parametric stereo coding | |
US20220208201A1 (en) | Apparatus and method for comfort noise generation mode selection | |
EP4247011A1 (en) | Apparatus and method for an automated control of a reverberation level using a perceptional model | |
Disch et al. | Sinusoidal substitution—An integrated parametric tool for enhancement of transform-based perceptual audio coders | |
Brzuchalski et al. | Energy balance in advanced audio coding encoder bit-distortion loop algorithm | |
RU2011102416A (ru) | Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FZ9A | Application not withdrawn (correction of the notice of withdrawal) |
Effective date: 20150723 |