RU2411594C2 - Кодирование и декодирование аудио - Google Patents
Кодирование и декодирование аудио Download PDFInfo
- Publication number
- RU2411594C2 RU2411594C2 RU2007139922/09A RU2007139922A RU2411594C2 RU 2411594 C2 RU2411594 C2 RU 2411594C2 RU 2007139922/09 A RU2007139922/09 A RU 2007139922/09A RU 2007139922 A RU2007139922 A RU 2007139922A RU 2411594 C2 RU2411594 C2 RU 2411594C2
- Authority
- RU
- Russia
- Prior art keywords
- channel
- signal
- data
- modifying
- relative
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 141
- 238000000034 method Methods 0.000 claims description 58
- 230000004044 response Effects 0.000 claims description 26
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000002441 reversible effect Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 239000011159 matrix material Substances 0.000 description 51
- 239000000203 mixture Substances 0.000 description 44
- 230000009466 transformation Effects 0.000 description 27
- 230000004048 modification Effects 0.000 description 19
- 238000012986 modification Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 230000002123 temporal effect Effects 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000013459 approach Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000007480 spreading Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Изобретение относится к кодированию и декодированию аудио для многоканальных сигналов. Техническим результатом является улучшение производительности, качества и/или отношения «качество к скорости передачи данных». Указанный технический результат достигается тем, что многоканальный аудиокодер (10) кодирует N-канальный аудиосигнал. Средство формирования (110) формирует первый кодированный М-канальный сигнал, например пространственное стереофоническое понижающее микширование, для N-канального сигнала (N>M). Блоки (115, 116, 117) формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала. Второй М-канальный сигнал, такой как художественное стереосведение, формируется для N-канального сигнала. Затем генератор (123) формирует модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала. Блок (120) формирует кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры. Генератор (123) может динамически выбирать между формированием модифицирующих параметров как в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала. Декодер (20) может выполнять обратную операцию и может применять модифицирующие параметры как абсолютные или относительные модифицирующие параметры в зависимости от индикации в принятом битовом потоке. 18 н. и 15 з.п. ф-лы, 11 ил.
Description
Изобретение относится к кодированию и/или декодированию аудио для многоканальных сигналов.
Многоканальный аудиосигнал - это аудиосигнал, имеющий два или более аудиоканалов. Хорошо известными примерами многоканальных аудиосигналов являются двухканальные стереоаудиосигналы и 5.1-канальные аудиосигналы, имеющие два передних аудиоканала, два задних аудиоканала, один центральный аудиосигнал и дополнительный канал низкочастотного усиления (LFE). Эти 5.1-канальные аудиосигналы используются в системах DVD (цифровых универсальных дисков) и SACD (усовершенствованных компакт-дисков). Вследствие возрастающей популярности многоканального материала эффективное кодирование многоканального материала становится более важным.
В области техники обработки звука широко распространено преобразовывать некоторое число аудиоканалов в другое число аудиоканалов. Это преобразование может быть выполнено по различным причинам. Например, аудиосигнал может быть преобразован в другой формат, чтобы предоставить более удобные возможности для пользователей. К примеру, традиционное стереокодирование содержит только два канала, тогда как современные усовершенствованные аудиосистемы типично используют пять или шесть каналов, как в популярных системах объемного звучания 5.1. Соответственно два стереоканала могут быть преобразованы в пять или шесть каналов, чтобы полностью использовать преимущества усовершенствованной аудиосистемы.
Другой причиной преобразования каналов является эффективность кодирования. Обнаружено, что, к примеру, аудиосигналы объемного звучания могут быть кодированы как стереоканальные аудиосигналы, комбинированные с параметрическим битовым потоком, описывающим многоканальные пространственные свойства аудиосигнала. Декодер может воспроизводить аудиосигналы объемного звучания с очень удовлетворительной степенью точности. Таким образом, может быть достигнута существенная экономия скорости передачи данных.
Известна система многоканального аудиокодирования 5.1-2-5.1. В этой известной системе аудиокодирования входной аудиосигнал 5.1 кодируется и представляется посредством двух каналов понижающего микширования и ассоциативно связанных параметров. Сигналы понижающего микширования совместно упоминаются как пространственное понижающее микширование. В известной системе пространственное понижающее микширование формирует стереоаудиосигнал, имеющий стереокартину, которая сравнима в отношении качества с фиксированным ITU-понижающим микшированием из входных каналов 5.1. Пользователи, имеющие только стереофоническое оборудование, могут прослушивать это пространственное стереофоническое понижающее микширование, тогда как слушатели с 5.1-Канальным оборудованием могут прослушивать 5.1-канальное воспроизведение, которое осуществляется с помощью этого пространственного понижающего микширования и ассоциативно связанных параметров. 5.1-канальное оборудование декодирует/восстанавливает 5.1-канальный аудиосигнал из пространственного стереофонического понижающего микширования (т.е. стереоаудиосигнала) и ассоциативно связанных параметров.
Тем не менее, пространственное стереофоническое понижающее микширование зачастую, как считается, имеет худшее качество в сравнении с исходным стереосигналом или явно сформированным стереосигналом. Например, профессиональные звуковые инженеры зачастую находят пространственное стереофоническое понижающее микширование нечетким и неинтересным. По этой причине зачастую формируется художественное стереофоническое понижающее микширование, которое отличается от пространственного стереофонического понижающего микширования. Например, добавляются дополнительная реверберация или источники, расширяется стереокартина и т.п. Чтобы пользователи могли пользоваться художественным стереофоническим понижающим микшированием, это художественное стереофоническое понижающее микширование в отличие от пространственного понижающего микширования может передаваться посредством носителя передачи или сохраняться на носителе данных. Тем не менее, поскольку параметрические данные для формирования сигнала 5.1 из стереосигнала основаны на исходном сигнале понижающего микширования, этот подход серьезно влияет на качество воспроизведения 5.1-канального аудиосигнала. В частности, входной 5.1-канальный аудиосигнал кодирует в пространственное стереофоническое понижающее микширование и ассоциативно связанные параметры. Посредством замены пространственного стереофонического понижающего микширования на художественное стереофоническое понижающее микширование пространственное понижающее микширование может быть более недоступно на стороне декодирования системы, и высококачественное восстановление 5.1-канального аудиосигнала невозможно.
Возможным подходом для того чтобы повысить качество 5.1-канального аудиосигнала, является включение в состав дополнительных данных сигнала пространственного понижающего микширования. Например, помимо художественного стереофонического понижающего микширования сигнал пространственного стереофонического понижающего микширования может быть включен в тот же битовый поток или может быть передан параллельно. Тем не менее, это существенно повышает скорость передачи данных и тем самым требования по полосе пропускания канала связи или хранению данных и снижает отношение "качество к скорости передачи данных" для кодированного многоканального сигнала.
Следовательно, улучшенная система кодирования/декодирования многоканального аудиосигнала должна быть полезна, в частности система, предоставляющая лучшую производительность, качество и/или отношение "качество к скорости передачи данных", должна быть полезна.
Следовательно, изобретение предпочтительно стремится уменьшить, облегчить или устранить один или более вышеупомянутых недостатков по отдельности или в любом сочетании.
Согласно первому аспекту изобретения, предусмотрен многоканальный аудиокодер для кодирования N-канального аудиосигнала, причем многоканальный аудиокодер содержит средство формирования первого M-канального сигнала для N-канального аудиосигнала, при этом M меньше N; средство формирования первых улучшающих данных для первого M-канального сигнала относительно N-канального аудиосигнала; средство формирования второго M-канального сигнала для N-канального аудиосигнала; улучшающее средство для формирования вторых улучшающих данных для второго M-канального сигнала относительно первого M-канального сигнала; средство формирования кодированного выходного сигнала, содержащего второй M-канальный сигнал, первые улучшающие данные и вторые улучшающие данные; при этом улучшающее средство выполнено с возможностью динамически выбирать между формированием вторых улучшающих данных как абсолютных улучшающих данных или как относительных улучшающих данных относительно второго M-канального сигнала.
Изобретение может предоставлять эффективное кодирование многоканального сигнала. В частности, может быть достигнуто эффективное кодирование с повышенным отношением "качество к скорости передачи данных". Изобретение может предоставлять возможность одному M-канальному сигналу заменить другой M-канальный сигнал с меньшим влиянием на многоканальное формирование на основе улучшающих данных, связанных с первым M-канальным сигналом. В частности, художественное понижающее микширование может передаваться вместо пространственного понижающего микширования, при этом обеспечивая эффективное многоканальное восстановление в декодере на основе улучшающих данных, ассоциативно связанных с пространственным понижающим микшированием. Динамический выбор улучшающих данных позволяет значительно снижать размер улучшающих данных и/или повышать качество сигнала, который может быть сформирован.
Абсолютные улучшающие данные описывают первый M-канальный сигнал без ссылки на второй M-канальный сигнал, тогда как относительные улучшающие данные описывают первый M-канальный сигнал со ссылкой на второй M-канальный сигнал.
Средство формирования первого и/или второго M-канального сигнала может формировать сигналы посредством обработки N-канального сигнала или, к примеру, посредством приема M-канального сигнала(ов) из внутренних или внешних источников.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью выбирать между абсолютными улучшающими данными и относительными улучшающими данными в ответ на характеристику N-канального сигнала.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Выбор может выполняться, к примеру, посредством оценки одного или более параметров, извлеченных из характеристики сегмента N-канального сигнала и, в частности, на основе одного или более параметров, извлеченных из первого и/или второго M-канального сигнала (которые сами могут быть извлечены из N-канального сигнала).
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью выбирать между абсолютными улучшающими данными и относительными улучшающими данными в ответ на относительную характеристику абсолютных улучшающих данных и относительных улучшающих данных.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию.
Согласно необязательному признаку изобретения, относительная характеристика - это энергия сигнала абсолютных улучшающих данных относительно энергии сигнала относительных улучшающих данных.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию. В частности, улучшающее средство может выбирать тип улучшающих данных с наименьшей энергией сигнала.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью разделять второй M-канальный сигнал на блоки сигналов и отдельно выбирать между абсолютными улучшающими данными и относительными улучшающими данными для каждого блока сигналов.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию. Блоки сигналов могут быть разделены во временной и/или частотной области, и каждый блок сигналов, в частности, может содержать группу временно/частотных мозаик. Разделение на блоки сигналов может быть применено к первому M-канальному сигналу и/или N-канальному сигналу.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью выбирать между абсолютными улучшающими данными и относительными улучшающими данными для блока сигналов на основе только характеристик, ассоциативно связанных с блоком сигналов.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию. В частности, улучшающее средство может выбирать тип улучшающих данных, которые имеют наименьшую энергию сигнала.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью формировать улучшающие данные как комбинацию абсолютных улучшающих данных и относительных улучшающих данных в ходе интервала времени переключения между формированием улучшающих данных как абсолютных улучшающих данных и как относительных улучшающих данных.
Это может обеспечить улучшенное переключение и, в частности, снизить искажения, ассоциативно связанные с переключением. Может быть достигнуто повышенное качество звука. Комбинация в ходе интервала времени переключения может быть применена при переключении от абсолютных к относительным улучшающим данным и/или от относительных к абсолютным улучшающим данным. Комбинация может быть достигнута с помощью методики перекрытия с суммированием.
Согласно необязательному признаку изобретения, комбинация содержит интерполяцию между абсолютными улучшающими данными и относительными улучшающими данными.
Это может обеспечить практичную и эффективную реализацию с высоким качеством. Может быть достигнуто повышенное качество звука.
Согласно необязательному признаку изобретения, средство формирования кодированного выходного сигнала выполнено с возможностью включать в себя данные, указывающие то, используются ли относительные улучшающие данные или абсолютные улучшающие данные.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию. Данные индикации, в частности, могут включать в себя индикацию выбора для каждого блока сигналов.
Согласно необязательному признаку изобретения, вторые улучшающие данные содержат первую часть улучшающих данных и вторую часть улучшающих данных, причем вторая часть предоставляет более высококачественное представление первого M-канального сигнала, чем первая часть.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных". Первая часть может иметь более низкую скорость передачи данных, чем вторая часть. Вторая часть может содержать данные, которые позволяют декодеру более точно восстанавливать первый M-канальный сигнал.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью динамически выбирать только между формированием второй части как абсолютных улучшающих данных или как относительных улучшающих данных.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных".
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью формировать относительные данные второй части относительно опорного сигнала, сформированного посредством применения улучшающих данных первой части к первому M-канальному сигналу.
Это может обеспечить эффективную производительность и, в частности, предоставить кодированному сигналу улучшенное отношение "качество к скорости передачи данных".
Согласно другому аспекту изобретения, предусмотрен многоканальный аудиодекодер для декодирования N-канального аудиосигнала, причем многоканальный аудиодекодер содержит средство приема кодированного аудиосигнала, содержащее первый M-канальный сигнал для N-канального аудиосигнала, причем M меньше N, первые улучшающие данные для многоканального расширения, причем первые улучшающие данные являются относительными ко второму M-канальному сигналу, отличному от первого M-канального сигнала; вторые улучшающие данные для первого M-канального сигнала относительно второго M-канального сигнала, причем вторые улучшающие данные содержат абсолютные улучшающие данные и относительные улучшающие данные относительно первого M-канального сигнала, и данные индикации, указывающие, являются вторые улучшающие данные для блока сигналов абсолютными улучшающими данными или относительными улучшающими данными; средство формирования для формирования M-канального многоканального сигнала расширения в ответ на первый M-канальный сигнал и вторые улучшающие данные; и средство формирования N-канального декодированного сигнала в ответ на M-канальный многоканальный сигнал расширения и первые улучшающие данные; при этом средство формирования выполнено с возможностью выбирать между применением вторых улучшающих данных как абсолютных улучшающих данных или относительных улучшающих данных в ответ на данные индикации.
Изобретение может предоставлять эффективное и высокопроизводительное декодирование многоканального сигнала. В частности, может быть достигнуто эффективное декодирование сигнала с улучшенным качеством для данной скорости передачи данных. Изобретение может предоставлять возможность одному M-канальному сигналу заменить другой M-канальный сигнал с меньшим влиянием на многоканальное формирование на основе улучшающих данных, связанных с первым M-канальным сигналом. В частности, художественное понижающее микширование может передаваться вместо пространственного понижающего микширования, при этом обеспечивая эффективное многоканальное восстановление в декодере на основе улучшающих данных, ассоциативно связанных с пространственным понижающим микшированием.
Абсолютные улучшающие данные описывают второй M-канальный сигнал без ссылки на первый M-канальный сигнал, тогда как относительные улучшающие данные описывают второй M-канальный сигнал со ссылкой на первый M-канальный сигнал.
Согласно необязательному признаку изобретения, средство формирования выполнено с возможностью применять вторые улучшающие данные к первому M-канальному сигналу во временной области.
Это может обеспечить эффективную производительность и, в частности, предоставить декодированному сигналу улучшенное качество для данной скорости передачи данных. Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию.
Согласно необязательному признаку изобретения, средство формирования выполнено с возможностью применять вторые улучшающие данные к первому M-канальному сигналу в частотной области.
Это может обеспечить эффективную производительность и, в частности предоставить декодированному сигналу улучшенное качество для данной скорости передачи данных. Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию.
В частности, во многих вариантах осуществления применение в частотной области может снижать требуемые частотно-временные преобразования. Частотной областью может, к примеру, быть область гребенки квадратурных зеркальных фильтров (QMF) или модифицированного дискретного косинусного преобразования (MDCT).
Согласно необязательному признаку изобретения, вторые улучшающие данные содержат первую часть улучшающих данных и вторую часть улучшающих данных, причем вторая часть предоставляет более высококачественное представление первого M-канального сигнала, чем первая часть.
Это может обеспечить эффективную производительность и, в частности, предоставить декодированному сигналу улучшенное качество для данной скорости передачи данных. Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию. Вторая часть может содержать данные, которые позволяют декодеру более точно восстанавливать первый M-канальный сигнал.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью динамически выбирать только между применением вторых улучшающих данных второй части как абсолютных улучшающих данных или относительных улучшающих данных.
Это может обеспечить эффективную производительность и, в частности, предоставить декодированному сигналу улучшенное качество для данной скорости передачи данных. Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию.
Согласно необязательному признаку изобретения, улучшающее средство выполнено с возможностью формировать M-канальное многоканальное расширение посредством применения относительных улучшающих данных второй части к сигналу, сформированному посредством применения улучшающих данных первой части к первому M-канальному сигналу.
Это может обеспечить эффективную производительность и, в частности, предоставить декодированному сигналу улучшенное качество для данной скорости передачи данных. Альтернативно или дополнительно это может обеспечить эффективную и/или несложную реализацию.
Согласно другому аспекту изобретения, предусмотрен способ кодирования N-канального аудиосигнала, при этом способ содержит формирование первого M-канального сигнала для N-канального аудиосигнала, при этом M меньше N; формирование первых улучшающих данных для первого M-канального сигнала относительно N-канального аудиосигнала; формирование второго M-канального сигнала для N-канального аудиосигнала; формирование вторых улучшающих данных для второго M-канального сигнала относительно первого M-канального сигнала; формирование кодированного выходного сигнала, содержащего второй M-канальный сигнал, первые улучшающие данные и вторые улучшающие данные; при этом формирование вторых улучшающих данных содержит динамический выбор между формированием вторых улучшающих данных как абсолютных улучшающих данных или как относительных улучшающих данных относительно второго M-канального сигнала.
Согласно другому аспекту изобретения, предусмотрен способ декодирования N-канального аудиосигнала, при этом способ содержит прием кодированного аудиосигнала, содержащего первый M-канальный сигнал для N-канального аудиосигнала, причем M меньше N, первые улучшающие данные для многоканального расширения, причем первые улучшающие данные являются относительными ко второму M-канальному сигналу, отличному от первого M-канального сигнала; вторые улучшающие данные для первого M-канального сигнала относительно второго M-канального сигнала, причем вторые улучшающие данные содержат абсолютные улучшающие данные и относительные улучшающие данные относительно первого M-канального сигнала, и данные индикации, указывающие, являются ли вторые улучшающие данные для блока сигналов абсолютными улучшающими данными или относительными улучшающими данными; формирование M-канального многоканального сигнала расширения в ответ на первый M-канальный сигнал и вторые улучшающие данные; и формирование N-канального декодированного сигнала в ответ на M-канальный многоканальный сигнал расширения и первые улучшающие данные; при этом формирование M-канального многоканального сигнала расширения содержит выбор между применением вторых улучшающих данных как абсолютных улучшающих данных или относительных улучшающих данных в ответ на данные индикации.
Согласно другому аспекту изобретения, предусмотрен кодированный многоканальный аудиосигнал для N-канального аудиосигнала, содержащий данные M-канального сигнала для N-канального аудиосигнала, причем M меньше N; первые улучшающие данные для многоканального расширения, при этом первые улучшающие данные являются относительными ко второму M-канальному сигналу, отличному от первого M-канального сигнала; вторые улучшающие данные для первого M-канального сигнала относительно второго M-канального сигнала, причем вторые улучшающие данные содержат абсолютные улучшающие данные и относительные улучшающие данные относительно первого M-канального сигнала, и данные индикации, указывающие, являются вторые улучшающие данные для блока сигналов абсолютными улучшающими данными или относительными улучшающими данными.
Согласно другому аспекту изобретения, предусмотрен носитель данных, имеющих сохраненный сигнал, описанный выше.
Согласно другому аспекту изобретения, предусмотрено передающее устройство для передачи кодированного многоканального аудиосигнала, причем передающее устройство содержит многоканальный аудиокодер, описанный выше.
Согласно другому аспекту изобретения, предусмотрено приемное устройство для приема многоканального аудиосигнала, причем приемное устройство содержит многоканальный аудиодекодер, описанный выше.
Согласно другому аспекту изобретения, предусмотрена система передачи, содержащая передающее устройство для передачи кодированного многоканального аудиосигнала посредством канала передачи в приемное устройство, при этом передающее устройство содержит многоканальный аудиокодер, описанный выше, а приемное устройство содержит многоканальный аудиодекодер, описанный выше.
Согласно другому аспекту изобретения, предусмотрен способ передачи кодированного многоканального аудиосигнала, причем способ содержит кодирование N-канального аудиосигнала, при этом кодирование содержит формирование первого M-канального сигнала для N-канального аудиосигнала, при этом M меньше N; формирование первых улучшающих данных для первого M-канального сигнала относительно N-канального аудиосигнала; формирование второго M-канального сигнала для N-канального аудиосигнала; формирование вторых улучшающих данных для второго M-канального сигнала относительно первого M-канального сигнала; формирование кодированного выходного сигнала, содержащего второй M-канальный сигнал, первые улучшающие данные и вторые улучшающие данные; при этом формирование вторых улучшающих данных содержит динамический выбор между формированием вторых улучшающих данных как абсолютных улучшающих данных или как относительных улучшающих данных относительно второго M-канального сигнала.
Согласно другому аспекту изобретения, предусмотрен способ приема кодированного многоканального аудиосигнала, при этом способ содержит декодирование кодированного многоканального аудиосигнала, при этом декодирование содержит прием кодированного аудиосигнала, содержащего первый M-канальный сигнал для N-канального аудиосигнала, причем M меньше N, первые улучшающие данные для многоканального расширения, причем первые улучшающие данные являются относительными ко второму M-канальному сигналу, отличному от первого M-канального сигнала; вторые улучшающие данные для первого M-канального сигнала относительно второго M-канального сигнала, причем вторые улучшающие данные содержат абсолютные улучшающие данные и относительные улучшающие данные относительно первого M-канального сигнала, и данные индикации, указывающие, являются ли вторые улучшающие данные для блока сигналов абсолютными улучшающими данными или относительными улучшающими данными; формирование M-канального многоканального сигнала расширения в ответ на первый M-канальный сигнал и вторые улучшающие данные; и формирование N-канального декодированного сигнала в ответ на M-канальный многоканальный сигнал расширения и первые улучшающие данные; при этом формирование M-канального многоканального сигнала расширения содержит выбор между применением вторых улучшающих данных как абсолютных улучшающих данных или относительных улучшающих данных в ответ на данные индикации.
Согласно другому аспекту изобретения, предусмотрен способ кодирования N-передачи и приема аудиосигнала, при этом способ содержит кодирование N-канального аудиосигнала, при этом кодирование содержит формирование первого M-канального сигнала для N-канального аудиосигнала, при этом M меньше N; формирование первых улучшающих данных для первого M-канального сигнала относительно N-канального аудиосигнала; формирование второго M-канального сигнала для N-канального аудиосигнала; формирование вторых улучшающих данных для второго M-канального сигнала относительно первого M-канального сигнала; при этом формирование вторых улучшающих данных содержит динамический выбор между формированием вторых улучшающих данных как абсолютных улучшающих данных или как относительных улучшающих данных относительно второго M-канального сигнала, формирующего кодированный выходной сигнал, содержащего второй M-канальный сигнал, первые улучшающие данные и вторые улучшающие данные; передачу кодированного выходного сигнала из передающего устройства в приемное устройство; прием в приемном устройстве кодированного выходного сигнала; декодирование кодированного выходного сигнала, при этом декодирование содержит формирование M-канального многоканального сигнала расширения в ответ на второй M-канальный сигнал и вторые улучшающие данные, при этом формирование M-канального многоканального сигнала расширения содержит выбор между применением вторых улучшающих данных как абсолютных улучшающих данных или относительных улучшающих данных, и формирование N-канального декодированного сигнала в ответ на M-канальный многоканальный сигнал расширения и первые улучшающие данные.
Согласно другому аспекту изобретения, предусмотрен машиночитаемый программный продукт, работающий для того, чтобы инструктировать процессор выполнять этапы способа, описанные выше.
Согласно другому аспекту изобретения, предусмотрен многоканальный аудиорекордер, содержащий многоканальный аудиокодер, описанный выше.
Согласно другому аспекту изобретения, предусмотрен многоканальный аудиопроигрыватель (60), содержащий многоканальный аудиодекодер, описанный выше.
Эти и другие аспекты, признаки и преимущества изобретения должны стать очевидными и должны истолковываться со ссылкой на описанные далее варианты осуществления.
Варианты осуществления изобретения описаны далее только в качестве примера со ссылкой на чертежи, из которых:
Фиг. 1 иллюстрирует блок-схему многоканального аудиокодера согласно некоторым вариантам осуществления изобретения;
Фиг. 2 иллюстрирует блок-схему многоканального аудиодекодера согласно некоторым вариантам осуществления изобретения;
Фиг. 3 иллюстрирует блок-схему системы передачи согласно некоторым вариантам осуществления изобретения;
Фиг. 4 иллюстрирует блок-схему многоканального аудиопроигрывателя/рекордера согласно некоторым вариантам осуществления изобретения;
Фиг. 5 иллюстрирует блок-схему многоканального аудиокодера согласно некоторым вариантам осуществления изобретения;
Фиг. 6 иллюстрирует блок-схему генератора улучшающих данных согласно некоторым вариантам осуществления изобретения;
Фиг. 7 иллюстрирует блок-схему многоканального аудиодекодера согласно некоторым вариантам осуществления изобретения;
Фиг. 8 иллюстрирует блок-схему элементов многоканального аудиодекодера;
Фиг. 9 иллюстрирует блок-схему элементов многоканального аудиодекодера согласно некоторым вариантам осуществления изобретения;
Фиг. 10 иллюстрирует блок-схему элементов многоканального аудиодекодера согласно некоторым вариантам осуществления изобретения; и
Фиг. 11 иллюстрирует блок-схему элементов многоканального аудиодекодера согласно некоторым вариантам осуществления изобретения.
Последующее описание посвящено вариантам осуществления изобретения, применимым к кодеру 5.1-к-2 и/или декодеру 2-к-5.1. Тем не менее, следует принимать во внимание, что изобретение не ограничено этим вариантом применения.
Фиг. 1 иллюстрирует блок-схему многоканального аудиокодера 10 согласно некоторым вариантам осуществления изобретения. Этот многоканальный аудиокодер 10 выполнен с возможностью кодирования N аудиосигналов 101 в M аудиосигналов 102 и ассоциативно связанных параметрических данных 104, 105. При этом M и N являются целыми числами, причем N>M и M≥1. Примером многоканального аудиокодера 10 является кодер 5.1-к-2, в котором N равно 6, т.е. 5+1 каналов, а M равно 2. Этот многоканальный аудиокодер кодирует 5.1-канальный входной аудиосигнал в 2-канальный выходной аудиосигнал, к примеру выходной стереоаудиосигнал, и ассоциативно связанные параметры. Другими примерами многоканального аудиокодера 10 являются кодеры 5.1-к-1, 6.1-к-2, 6.1-к-1, 7.1-к-2 и 7.1-к-1. Также допустимы кодеры, имеющие другие значения для N и M, пока N больше M и пока M больше или равно 1.
Кодер 10 содержит первый блок 110 кодирования и соединенный с ним второй блок 120 кодирования. Первый блок 110 кодирования принимает N входных аудиосигналов 101 и кодирует N аудиосигналов 101 на M аудиосигналов 102 и первые ассоциативно связанные параметрические данные 104. M аудиосигналов 102 и первые ассоциативно связанные параметрические данные 104 представляют N аудиосигналов 101. Кодирование N аудиосигналов 101 на M аудиосигналов 102, выполняемое первым блоком 110, также может упоминаться как понижающее микширование, а M аудиосигналов 102 также могут упоминаться как пространственное понижающее микширование 102. Блоком 110 может быть традиционный параметрический многоканальный аудиокодер, который кодирует многоканальный аудиосигнал 101 в аудиосигнал 102 моно- или стереофонического понижающего микширования и ассоциативно связанные параметры 104. Ассоциативно связанные параметры 104 позволяют декодеру восстанавливать многоканальный аудиосигнал 101 из аудиосигнала 102 моно- или стереофонического понижающего микширования. Следует отметить, что понижающее микширование 102 также может иметь более двух каналов.
Первый блок 110 предоставляет пространственное понижающее микширование 102 во второй блок 120. Второй блок 120 формирует из пространственного понижающего микширования 102 вторые улучшающие данные в форме вторых ассоциативно связанных параметрических данных 105. Вторые ассоциативно связанные параметрические данные 105 представляют пространственное понижающее микширование 102, т.е. эти параметры 105 содержат характеристики или свойства пространственного понижающего микширования 102, которые позволяют декодеру восстанавливать, по меньшей мере, часть пространственного понижающего микширования 102, к примеру, посредством синтезирования сигнала, аналогичного пространственному понижающему микшированию 102. Ассоциативно связанные параметрические данные содержат, по меньшей мере, первые и вторые ассоциативно связанные параметрические данные 104 и 105.
Вторые ассоциативно связанные параметрические данные 105 содержат модифицирующие параметры, обеспечивающие восстановление пространственного понижающего микширования 102 из K(=M) дополнительных аудиосигналов 103. Таким образом, декодер может выполнять даже лучшее восстановление пространственного понижающего микширования 102. Это восстановление может выполняться на основе альтернативного понижающего микширования 103, т.е. K дополнительных аудиосигналов 103, такого как художественное понижающее микширование. Декодер может применять модифицирующие параметры к сигналу 103 альтернативного понижающего микширования, с тем чтобы он был более похож на пространственное понижающее микширование 102.
Второй блок 120 может принимать на входах альтернативное понижающее микширование 103. Альтернативное понижающее микширование 103 может приниматься из источника, внешнего для кодера 10 (показанного на фиг. 1), или альтернативно альтернативное понижающее микширование 103 может формироваться в рамках кодера 10 (не показан), к примеру, из N аудиосигналов 101. Второй блок 120 может сравнивать, по меньшей мере, часть из пространственного понижающего микширования 102 с альтернативным понижающим микшированием 103 и формировать модифицирующие параметры 105, представляющие разность между пространственным понижающим микшированием 102 и альтернативным понижающим микшированием 103, к примеру, разность между свойством пространственного понижающего микширования 102 и свойством альтернативного понижающего микширования 103. В примере альтернативным понижающим микшированием 103 конкретно является художественное понижающее микширование, ассоциативно связанное с пространственным понижающим микшированием.
В этом примере второй блок 120 может дополнительно формировать модифицирующие параметры как абсолютные значения, которые непосредственно представляют пространственное понижающее микширование 102 без какой-либо ссылки на альтернативное понижающее микширование 103. Помимо этого, второй блок 120 содержит функциональность выбора между относительными и абсолютными модифицирующими параметрами для выходного сигнала декодера. В частности, этот выбор выполняется динамически и может осуществляться для отдельных блоков сигнала в зависимости от характеристик сигнала и/или параметрических данных.
Помимо этого, второй блок 120 может содержать функциональность для включения индикации того, какие модифицирующие параметры (абсолютные или относительные) использовались для различных секций кодированного сигнала. Например, для каждого блока сигналов может быть включен бит данных, чтобы указать то, относительные или абсолютные параметрические данные включены для этого блока сигналов.
Модифицирующие параметры 105 предпочтительно содержат (разность между) одно или более статистических свойств, таких как дисперсия, ковариантность и корреляция, либо отношение этих свойств, либо (разность между) для сигналов понижающего микширования. Следует отметить, что дисперсия сигнала эквивалентна энергии или мощности этого сигнала. Эти статистические свойства сигналов обеспечивают хорошее восстановление пространственного понижающего микширования.
Фиг. 2 иллюстрирует блок-схему многоканального аудиодекодера 20 согласно некоторым вариантам осуществления изобретения. Декодер 20 выполнен с возможностью декодирования K аудиосигналов 103 и ассоциативно связанных параметрических данных 104, 105 на N аудиосигналов 203. При этом K и N являются целыми числами, причем N>K и K≥1. K аудиосигналов 103, т.е. альтернативное понижающее микширование 103 и ассоциативно связанные параметрические данные 104, 105 представляют N аудиосигналов 203, т.е. многоканальный аудиосигнал 203. Примером многоканального аудиодекодера 20 является декодер 2-к-5.1, в котором N равно 6, т.е. 5+1 каналов, а K равно 2. Этот многоканальный аудиодекодер декодирует 2-канальный входной аудиосигнал, к примеру входной стереоаудиосигнал, и ассоциативно связанные параметры в 5.1-канальный выходной аудиосигнал. Другими примерами многоканального аудиодекодера 20 являются декодеры 1-к-5.1, 2-к-6.1, 1-к-6.1, 2-к-7.1 и 1-к-7.1. Также допустимы декодеры, имеющие другие значения для N и K, пока N больше K и пока K больше или равно 1.
Многоканальный аудиодекодер 20 содержит первый блок 210 и соединенный с ним второй блок 220. Первый блок 210 принимает альтернативное понижающее микширование 103 и улучшающие данные в форме модифицирующих параметров 105 и восстанавливает M дополнительных аудиосигналов 202, т.е. пространственное понижающее микширование 202 или его аппроксимацию, из альтернативного понижающего микширования 103 и модифицирующих параметров 105. При этом M является целым числом, причем M≥1. Модифицирующие параметры 105 представляют пространственное понижающее микширование 202. Первый блок 210, в частности, выполнен с возможностью определять то, являются модифицирующие параметры 105 абсолютными или относительными модифицирующими параметрами, и применять параметры соответствующим образом. В частности, первый блок 210 может определять, являются модифицирующие параметры 105 для отдельных блоков сигналов относительными или абсолютными параметрами, на основе явных данных в принимаемом битовом потоке. Например, один бит данных может быть включен для каждого блока сигналов, указывающий то, являются параметры абсолютными или относительными модифицирующими параметрами в этом блоке сигналов.
Второй блок 220 принимает пространственное понижающее микширование 202 из первого блока 210 и модифицирующие параметры 104. Второй блок 220 декодирует пространственное понижающее микширование 202 и модифицирующие параметры 104 на многоканальный аудиосигнал 203. Вторым блоком 220 может быть традиционный параметрический многоканальный аудиодекодер, который декодирует аудиосигнал 202 моно- или стереофонического понижающего микширования и ассоциативно связанные параметры 104 на многоканальный аудиосигнал 203.
Первый блок 210 может быть выполнен с возможностью определения того, необходимо или желательно восстанавливать сигнал 202 из входного сигнала 103. Это восстановление может быть неприменимо, когда сигнал 202 пространственного понижающего микширования предоставляется в первый блок 210 вместо альтернативного понижающего микширования 103. Первый блок 210 может определить это посредством формирования из входного сигнала 103 аналогичных или таких же свойств сигнала, как содержащиеся в модифицирующих параметрах 105, и посредством сравнения этих сформированных свойств сигнала с модифицирующими параметрами 105. Если это сравнение показывает, что сформированные свойства сигнала равны или практически равны модифицирующим параметрам 105, то входной сигнал 103 в достаточной степени похож на сигнал 202 пространственного понижающего микширования, и первый блок 210 может перенаправлять входной сигнал 103 во второй блок 220. Если сравнение показывает, что сформированные свойства сигнала не равны или практически равны модифицирующим параметрам 105, то входной сигнал 103 не похож в достаточной степени на сигнал 202 пространственного понижающего микширования, и первый блок 210 может восстанавливать/аппроксимировать сигнал 202 пространственного понижающего микширования из входного сигнала 103 и модифицирующих параметров 105.
Первый блок 210 может формировать из альтернативного понижающего микширования дополнительные модифицирующие параметры/свойства, представляющие альтернативное понижающее микширование 103. В этом случае первый блок 210 может восстанавливать пространственное понижающее микширование 202 из альтернативного понижающего микширования 103 и (разности между) модифицирующих параметров 105 и дополнительных модифицирующих параметров.
Модифицирующие параметры 105 и дополнительные модифицирующие параметры соответственно могут включать в себя статистические свойства пространственного понижающего микширования 202 и альтернативного понижающего микширования 103 соответственно. Эти статистические свойства, такие как дисперсия, корреляция и ковариантность и т.д., предоставляют хорошие представления сигналов, из которых они извлечены. Они полезны для восстановления пространственного понижающего микширования 202, к примеру, посредством преобразования альтернативного понижающего микширования таким образом, что его ассоциативно связанные свойства соответствуют свойствам, содержащимся в модифицирующих параметрах 105.
Фиг. 3 иллюстрирует блок-схему варианта осуществления системы 70 передачи согласно некоторым вариантам осуществления изобретения. Система 70 передачи содержит передающее устройство 40 для передачи кодированного многоканального аудиосигнала посредством канала 30 передачи, к примеру линии проводной или беспроводной связи, в приемное устройство 50. Передающее устройство 40 содержит многоканальный аудиокодер 10, описанный выше, для кодирования многоканального аудиосигнала 101 в пространственное понижающее микширование 102 и ассоциативно связанные параметры 104, 105. Передающее устройство 40 дополнительно содержит средство 41 передачи кодированного многоканального аудиосигнала, содержащего параметры 104, 105 и пространственное понижающее микширование 102 или альтернативное понижающее микширование 103, посредством канала 30 передачи в приемное устройство 50. Приемное устройство 50 содержит средство 51 приема кодированного многоканального аудиосигнала и многоканальный аудиодекодер 20, описанный выше, для декодирования альтернативного понижающего микширования 103 или пространственного понижающего микширования 102 и ассоциативно связанных параметров 104, 105 в многоканальный аудиосигнал 203.
Фиг. 4 иллюстрирует блок-схему варианта осуществления многоканального аудиопроигрывателя/рекордера 60 согласно некоторым вариантам осуществления изобретения. Аудиопроигрыватель/рекордер 60 содержит многоканальный аудиодекодер 20 и/или многоканальный аудиокодер 10 согласно некоторым вариантам осуществления изобретения. Аудиопроигрыватель/рекордер 60 может иметь собственное устройство хранения, например полупроводниковое запоминающее устройство или жесткий диск. Аудиопроигрыватель/рекордер 60 может также использовать съемное средство хранения, как (записываемые) DVD-диски или (записываемые) компакт-диски. Сохраненные кодированные многоканальные аудиосигналы, содержащие альтернативное понижающее микширование 103 и параметры 104, 105, могут быть декодированы посредством декодера 20 и проиграны или воспроизведены посредством аудиопроигрывателя/рекордера 60. Кодер 10 может кодировать многоканальные аудиосигналы для хранения в средстве хранения.
Фиг. 5 иллюстрирует блок-схему многоканального аудиокодера 10 согласно некоторым вариантам осуществления изобретения. Кодером по фиг. 5, в частности, может быть кодер 10 по фиг. 1. Кодер 10 содержит первый блок 110 и соединенный с ним второй блок 120. Первый блок 110 принимает 5.1-канальный многоканальный аудиосигнал 101, содержащий левый передний, левый задний, правый передний, правый задний, центральный аудиосигналы и аудиосигнал низкочастотного усиления lf, lr, rf, rr, co и lfe соответственно. Второй блок 120 принимает художественное стереофоническое понижающее микширование 103, содержащее левый художественный и правый художественный аудиосигналы la и ra соответственно. Многоканальный аудиосигнал 101 и художественное понижающее микширование 103 являются аудиосигналами временной области. В первом и втором блоке 110 и 120 эти сигналы 101 и 103 сегментируются и преобразуются в частотно-временную область.
В первом блоке 110 параметрические данные 104 извлекаются в три стадии. На первой стадии три пары аудиосигналов lf и rf, rf и rr и co и lfe соответственно сегментируются, и сегментированные сигналы преобразуются в частотную область в блоках 112, 113 и 114 сегментации и преобразования соответственно. Результирующие представления частотной области сегментированных сигналов показаны как сигналы частотной области Lf, Lr, Rf, Rr, Co и LFE соответственно. На второй стадии три пары этих сигналов частотной области Lf и Lr, Rf и Rr и Co и LFE соответственно низводятся в блоках 115, 116 и 117 понижающего микширования соответственно, чтобы сформировать моноаудиосигналы L, R и C соответственно и ассоциативно связанные параметры 141, 142 и 143 соответственно. Блоками 115, 116 и 117 понижающего микширования могут быть традиционные параметрические стереокодеры MPEG4. В завершение на третьей стадии три моноаудиосигнала L, R и C низводятся в блоке 118 понижающего микширования, чтобы получить пространственное стереофоническое понижающее микширование 102 и ассоциативно связанные параметры 144. Пространственное понижающее микширование 102 содержит сигналы Lo и Ro.
Параметрические данные 141, 142, 143 и 144 содержатся в первых улучшающих данных в форме первых ассоциативно связанных параметрических данных 104. Параметрические данные 104 и пространственное понижающее микширование 102 представляют входные сигналы 101 5.1.
Во втором блоке сигнал 103 художественного понижающего микширования, представленный во временной области посредством аудиосигналов la и ra соответственно, сначала сегментируется в блоке 121 сегментирования. Результирующий сегментированный аудиосигнал 127 содержит сигналы las и ras соответственно. Затем сегментированный аудиосигнал 127 преобразуется в частотную область посредством преобразователя 122.
Результирующий сигнал 126 частотной области содержит сигналы La и Ra. В завершение сигнал 126 частотной области, который является представлением частотной области сегментированного художественного понижающего микширования 103, и представление частотной области сегментированного пространственного понижающего микширования 102 предоставляются в генератор 123, который формирует дополнительные (вторые) улучшающие данные в форме модифицирующих параметров 105, которые позволяют декодеру модифицировать/преобразовывать художественное понижающее микширование 103 так, чтобы оно в большей степени было похожим на пространственное понижающее микширование 102.
В конкретном примере сегментированный сигнал 127 временной области также предоставляется в блок 124 выбора. Другими двумя входами в этот блок 124 выбора являются представление частотной области пространственного стереофонического понижающего микширования 102 и управляющий сигнал 128. Управляющий сигнал 128 определяет то, должен блок 124 выбора выводить художественное понижающее микширование 103 или пространственное понижающее микширование 102 в качестве части кодированного многоканального аудиосигнала. Пространственное понижающее микширование 102 может быть выбрано, когда художественное понижающее микширование недоступно. Управляющий сигнал 128 может быть задан вручную или может быть автоматически сформирован посредством изменения наличия художественного понижающего микширования 103. Управляющий сигнал 128 может быть включен в параметрический битовый поток, с тем чтобы соответствующий декодер 20 мог его использовать, как описано ниже. Таким образом, конкретный примерный кодер позволяет быть сформированным сигналу, который включает в себя пространственное понижающее микширование 102 или художественное понижающее микширование 103.
Выходной сигнал 102, 103 блока 124 выбора показан как сигналы lo и ro. Если художественное стереофоническое понижающее микширование 127 должно быть выведено посредством блока 124 выбора, сегментированные сигналы временной области las и ras объединяются в блоке 124 выбора посредством алгоритма перекрытия с суммированием в сигналы lo и ro. Если пространственное понижающее микширование 102 должно быть выведено, как указано посредством управляющего сигнала 128, блок 124 выбора преобразует сигналы Lo и Ro обратно во временную область и объединяет их посредством алгоритма перекрытия с суммированием в сигналы lo и ro. Сигналы временной области lo и ro формируют стереофоническое понижающее микширование кодера 10 5.1-к-2.
Далее представлено подробное описание генератора 123. Функция генератора 123 состоит в том, чтобы определять вторые улучшающие данные и, в частности, модифицирующие параметры, которые описывают преобразование художественного понижающего микширования 103, так чтобы он в некотором смысле походил на исходное пространственное понижающее микширование 102.
В общем, это преобразование может быть описано следующим образом:
[ L d R d]=[ L a R a A 1 … A N] T | (1) |
где L a и R a - это векторы, содержащие выборки временно/частотной мозаики левого и правого канала художественного понижающего микширования 103, а L d и R d - это векторы, содержащие выборки временно/частотной мозаики левого и правого канала модифицированного художественного понижающего микширования, A 1,..., A N содержат выборки временно/частотной мозаики необязательных вспомогательных каналов, а T - это матрица преобразования. Отметим, что вектор V задается как вектор-столбец. Модифицированное художественное понижающее микширование - это художественное понижающее микширование 103, которое преобразовано посредством преобразования таким образом, чтобы оно походило на исходное пространственное понижающее микширование 102. Вспомогательные каналы A 1,..., A N - это в описываемой системе сигналы пространственного понижающего микширования или их низкочастотное содержимое.
Матрица преобразования (N+2)x2 T описывает преобразование из художественного понижающего микширования 103 и вспомогательных каналов в модифицированное художественное понижающее микширование. Матрица преобразования T или ее элементы предпочтительно содержатся в модифицирующих параметрах 105, с тем чтобы декодер 20 мог восстанавливать, по меньшей мере, часть матрицы преобразования T. Затем декодер 20 может применять матрицу преобразования T к художественному понижающему микшированию 103, чтобы восстановить пространственное понижающее микширование 102 (как описано ниже).
Альтернативно модифицирующие параметры 105 содержат свойства сигнала, к примеру значения энергии или мощности или значения корреляции, пространственного понижающего микширования 102. Декодер 20 затем может формировать эти свойства сигнала из художественного понижающего микширования 103. Свойства сигнала пространственного понижающего микширования 102 и художественного понижающего микширования 103 позволяют декодеру 20 составлять матрицу преобразования T (описанную ниже) и применять ее к художественному понижающему микшированию 103, чтобы восстанавливать пространственное понижающее микширование 102 (также описанное ниже).
В частности, генератор 123 выполнен с возможностью формировать относительные и абсолютные данные модификации и выбирать между этими данными для отдельных блоков (или сегментов) сигналов. Таким образом, модифицирующие параметры 105 кодированного сигнала содержат и абсолютные данные модификации и относительные данные модификации для различных блоков сигналов. В отличие от абсолютных данных модификации относительные данные модификации описывают пространственное понижающее микширование 102 относительно художественного понижающего микширования 103. В частности, относительные данные модификации могут быть дифференциальными данными, которые позволяют выборкам художественного понижающего микширования быть модифицированными так, чтобы соответствовать (в большей степени) выборкам пространственного понижающего микширования, тогда абсолютные данные понижающего микширования могут непосредственно соответствовать выборкам пространственного понижающего микширования без какой-либо ссылки или базирования на выборках художественного понижающего микширования.
Следует принимать во внимание, что существует несколько способов модификации художественного стереофонического понижающего микширования 103, чтобы иметь сходство с исходным стереофоническим понижающим микшированием 102, в том числе:
I. Совпадение форм сигналов.
II. Совпадение статистических свойств:
a) совпадение энергии или мощности левого и правого канала;
b) совпадение ковариационной матрицы левого и правого канала.
III. Получение наилучшего совпадения формы сигнала в рамках ограничения совпадения энергии или мощности левого и правого канала.
IV. Сочетание вышеозначенных способов I-III.
Для простоты вспомогательные каналы A 1,..., A N по (1) сначала не рассматриваются, так что матрица преобразования T может быть записана следующим образом:
[ L d R d]=[ L a R a] T | (2) |
и относительные улучшающие данные, например, могут быть сформированы следующим образом:
I. Совпадение форм сигналов (способ I)
Совпадение форм сигналов художественного понижающего микширования 103 и пространственного понижающего микширования 102 может быть получено посредством выражения левого и правого сигнала модифицированного художественного понижающего микширования как линейной комбинации левого и правого сигнала художественного стереофонического понижающего микширования 103:
L d =α1 L a+β1 R a, R d=α2 L a+β2 R a | (3) |
Далее матрица T по (2) может быть записана следующим образом:
Способ, чтобы выбирать параметры α1, α2, β1 и β2, заключается в том, чтобы минимизировать квадрат евклидова расстояния между сигналами пространственного понижающего микширования Ls и Rs и их оценками (т.е. модифицированными сигналами художественного понижающего микширования L d и R d ), следовательно:
И
II. Совпадение статистических свойств (способ II)
Ниже описан способ II.a) совпадения энергии левого и правого сигнала. Модифицированный левый и правый сигнал художественного понижающего микширования, обозначенные как L d и R d соответственно, в таком случае вычисляются следующим образом:
L d =α L a, R d=β R a | (6) |
где в случае реальных параметров α и β задаются посредством:
так что матрица трансформации T может быть записана следующим образом:
При этих вариантах можно обеспечить то, что сигналы L d и R d соответственно имеют такую же энергию, как и сигналы L s и R s соответственно.
Способ II.b) Для совпадения ковариационных матриц художественного стереофонического понижающего микширования 103 и пространственного стереофонического понижающего микширования 102 эти матрицы могут быть разложены с помощью разложения по собственным значениям следующим образом:
C a =U a S a U a H,
C 0 =U 0 S 0 U 0 H, | (9) |
где ковариационная матрица художественного стереофонического понижающего микширования 103, C a, задается посредством:
C a =[ L a R a]H [ L a R a] | (10) |
U a - это единичная матрица, а S a - это диагональная матрица, C 0 - это ковариационная матрица пространственного стереофонического понижающего микширования 102, U 0 - это единичная матрица, а S 0 - диагональная матрица. При вычислении:
X aw =[ L aw R aw]=[ L a R a]U a S a -1/2 | (11) |
получается два взаимно некоррелированных сигнала L aw и R aw (вследствие умножения с матрицей U a), причем эти сигналы имеют единичную энергию (вследствие умножения с матрицей S a -1/2). Посредством вычисления:
X d =[ L d R d]=[ L a R a]U a S a -1/2 U r S 0 -1/2 U 0 H | (12) |
первая ковариационная матрица [ L a R a] преобразуется в ковариационную матрицу, которая равна единичной матрице, т.е. ковариационной матрице [ L a R a]U a S a -1/2. Применение любой произвольной единичной матрицы U r не изменяет ковариационную структуру, и применение S 0 1/2 U 0 H приводит к ковариационной структуре, равной структуре пространственного понижающего микширования 102.
Зададим матрицу S 0w и сигналы L 0w и R 0w следующим образом:
S 0w =[ L 0w R 0w]=[ L s R s]U 0 S 0 -1/2 | (13) |
Матрица U r может быть выбрана таким образом, чтобы наилучшее совпадение формы сигнала в отношении минимального евклидова расстояния в квадрате получалось между сигналами L 0w и L aw и сигналами R 0w и R aw, где L aw и R aw задаются посредством (11). При этом варианте U r совпадение формы сигнала в рамках статистического способа может быть использовано.
Из (12) можно видеть, что матрица преобразования T задается следующим образом:
T=U a S a -1/2 U r S 0 -1/2 U 0 H. | (14) |
III. Наилучшее совпадение формы сигнала в рамках ограничения по энергии (способ III)
При условии (3) параметры α1, α2, β1 и β2 могут быть получены посредством минимизации (4) и (5) в рамках ограничений по энергии:
IV. Способ сочетания (способ IV)
В отношении сочетания различных способов возможные комбинации включают в себя сочетание способов II.a) и II.b) или сочетание способов II.a) и III. Это можно осуществлять следующим образом:
a) Если совпадение формы сигнала между L s и L d и между R s и R d, которое получено при использовании способа II.b)/III, хорошее, использовать способ II.b)/III.
b) Если совпадение формы сигнала плохое, использовать способ II.a).
c) Обеспечить постепенный переход между двумя способами посредством соединения их матриц преобразования как функцию от качества этого совпадения формы сигнала.
Это может быть выражено математически следующим образом.
С помощью (3) и (2) матрица преобразования T может быть записана в своей общей форме следующим образом:
Эта матрица перезаписывается с помощью двух векторов, T L и T R, следующим образом:
Качество совпадения формы сигнала между L s и L d, получаемое посредством использования способа II.b) или способа III, выражается посредством γL. Она задается следующим образом:
Качество совпадения формы сигнала между R s и R d, получаемое посредством использования способа II.b) или способа III, выражается посредством γR. Она задается следующим образом:
И γL, и γR имеют значения от 0 до 1. Коэффициент смешивания левого канала δL и коэффициент смешивания правого канала δR могут быть заданы следующим образом:
где μL,min, μL,max, μR,min и μR,max - это значения от 0 до 1, и μL,min<μL,max μR,min,<μR,max. Уравнение (20) обеспечивает то, что коэффициенты смешивания δL и δR имеют значения от 0 до 1.
Задаем матрицу преобразования T способа II.a), II.b) и III соответственно, как T e , которая задается посредством (8), T a , которая задается посредством (14), и T ce соответственно. Каждая матрица преобразования может быть разделена на два сектора аналогично разделению T в (17) следующим образом:
T a=[ T a,L T a,R], T e=[ T e,L T e,R], T ce=[ T ce,L T ce,R]. | (21) |
Матрица преобразования T для объединения способа II.a) и способа II.b) получается следующим образом:
T=[ T L T R]=[δL T a,L +(1-δL) T e,L δR T a,R +(1-δR) T e,R]. | (22) |
Матрица преобразования T для объединения способа II.a) и способа III получается следующим образом:
T=[ T L T R]=[δL T ce,L +(1-δL) T e,L δR T ce,R +(1-δR) T e,R] | (23) |
Теперь с учетом двух вспомогательных каналов, соответствующих двум каналам улучшающего уровня, уравнение (1) выше может быть перезаписано следующим образом:
[ L d R d]=[ L a R a L enh R enh] T' | (24) |
где L a, R a (как и ранее) содержат выборки временно/частотной мозаики левого и правого канала художественного понижающего микширования, соответственно L d, R d содержат выборки временно/частотной мозаики левого и правого канала модифицированного художественного понижающего микширования соответственно, а L enh, R enh содержат выборки временно/частотной мозаики сигналов улучшающего уровня. Матрица преобразования 4x2 T', таким образом, описывает преобразование из художественного понижающего микширования и сигналов улучшающего уровня в модифицированное художественное понижающее микширование. В отношении уравнения (1) единственными двумя используемыми вспомогательными каналами являются сигналы улучшающего уровня L enh, R enh.
В конкретной примерной системе второй улучшающий уровень может содержать два различных уровня данных.
Первый тип данных содержит параметры, содержащиеся в матрице T уравнения (1). Эти параметры в данном примере вычисляются для полной полосы пропускания сигналов и преобразуют художественное стереофоническое понижающее микширование так, что оно в некотором смысле походит на пространственное понижающее микширование. Таким образом, этот тип параметров может предоставлять модифицированное художественное понижающее микширование, которое в большей степени напоминает исходное пространственное понижающее микширование, но не (обязательно) позволяет декодеру точно формировать пространственное понижающее микширование. Для каждой временно/частотной мозаики требуется только четыре параметра, а именно требуются значения T (T11, T12, T21 и T22). Эти параметры могут быть кодированы либо абсолютно либо дифференциально, и кодер 10 может, в частности, динамически переключаться между абсолютным и дифференциальным кодированием.
Второй тип данных соответствует фактическому пространственному понижающему микшированию и является конкретным примером представления версии с ограниченной полосой пропускания пространственного понижающего микширования. В частности, этот тип данных представляет низкочастотную часть пространственного понижающего микширования (к примеру, частоты ниже, скажем, 1,7 кГц). Это дает возможность очень точно восстанавливать эту часть пространственного понижающего микширования в декодере вместо просто формирования сигнала, который имеет такие же, к примеру, статистические свойства (как в случае с матрицей T). Этот тип данных может кодироваться абсолютно или относительно к художественному понижающему микшированию. В частности, этот тип данных может дифференциально кодироваться. Например, матрица преобразования T применяется к художественному понижающему микшированию (см., к примеру, уравнение (26)), и разность этого сигнала и пространственного понижающего микширования может быть кодирована.
Таким образом, в некоторых вариантах осуществления вторые улучшающие данные делятся на первую и вторую часть улучшающих данных, при этом первая часть описывает пространственное понижающее микширование менее точно, чем вторая часть. Типично соответствующая скорость передачи данных первой части вторых улучшающих данных ниже скорости второй части. Улучшающие данные второй части вторых улучшающих данных могут относиться только к части понижающего микширования и, в частности, могут относиться к низкочастотной части.
В некоторых вариантах осуществления генератор 123 может быть выполнен с возможностью выбирать между абсолютными и относительными данными для первой части и второй части вторых улучшающих данных отдельно или вместе. В других вариантах осуществления генератор 123 может выбирать только между абсолютными и относительными данными для одной из частей данных. В частности, в следующих вариантах осуществления описывается то, когда первая часть вторых улучшающих данных содержит параметры T, тогда как вторая часть содержит низкочастотное представление пространственного понижающего микширования, и динамический выбор между абсолютными и относительными данными применяется только ко второй части вторых улучшающих данных.
Относительные данные для второй части вторых улучшающих данных могут в этих вариантах осуществления, к примеру, быть сформированы как дифференциальные значения относительно художественного понижающего микширования после того, как улучшающие данные первой части применены (т.е. как дифференциальные значения относительно модифицированного художественного понижающего микширования).
Далее описываются варианты осуществления, в которых генератор 123 выбирает только между относительными и абсолютными данными для второй части вторых улучшающих данных.
Абсолютные улучшающие данные для части первой и второй части вторых улучшающих данных в этом примере могут быть извлечены для ассоциативно связанных временно/частотных мозаик посредством задания:
L enh= L s,
R enh= R s | (25) |
где L s, R s содержат выборки временно/частотной мозаики левого и правого канала пространственного стереофонического понижающего микширования соответственно. Таким образом, в конкретном примере абсолютные улучшающие данные просто соответствуют фактическим выборкам временно/частотных мозаик пространственного понижающего микширования 102, которые могут заменять соответствующие выборки временно/частотных мозаик художественного понижающего микширования 103.
Более того, для части первой и второй части вторых улучшающих данных относительные улучшающие данные для ассоциативно связанных временно/частотных мозаик могут быть, в частности, извлечены как дифференциальные данные посредством задания:
L enh= L s-T 11 L a-T 21 R a,
R enh= R s-T 12 L a-T 22 R a | (26) |
При этом параметры T11, T12, T21 и T22 составляют матрицу T по уравнению (2):
Таким образом, генератор 123 может формировать абсолютные улучшающие данные и относительные улучшающие данные для художественного понижающего микширования 103, позволяющие декодеру формировать модифицированное художественное понижающее микширование, которое в большей степени схоже с пространственным понижающим микшированием 102, используемым для формирования многоканальных улучшающих данных.
Генератор 123 дополнительно выполнен с возможностью выбирать между абсолютными и относительными улучшающими данными. Этот выбор в конкретном примере выполняется для отдельных блоков сигналов (к примеру, отдельных сегментов) и основан на характеристиках сигналов в рамках этих блоков сигналов. В частности, генератор 123 может оценивать характеристики абсолютных улучшающих данных и относительных улучшающих данных для данного блока сигналов и может принимать решение о том, какие данные следует включить в улучшающий уровень для данного блока сигналов. Помимо этого, генератор 123 может включать в себя указание того, какие данные выбраны, тем самым позволяя декодеру корректно применять принимаемые улучшающие данные.
В некоторых вариантах осуществления генератор 123 может оценивать декодирование, чтобы определять то, могут абсолютные улучшающие данные или относительные улучшающие данные быть наиболее эффективно кодированы (к примеру, с наименьшим числом битов для данной точности). Лобовой подход может быть использован для того, чтобы фактически кодировать оба типа улучшающих данных и сравнивать размер кодированных данных. Тем не менее, это может быть сложным подходом в некоторых вариантах осуществления, и в примерном кодере 10 генератор 123 оценивает энергию сигналов абсолютных улучшающих данных относительно энергии сигналов относительных улучшающих данных и выбирает, какой тип данных включить на основе сравнения между ними.
В частности, для аудиокодеров часто бывает полезным, в отношении скорости передачи данных кодировать сигнал с минимально малой энергией. Соответственно генератор 123 выбирает тип улучшающих данных, которые имеют наименьшую энергию сигнала. В частности, относительные улучшающие данные выбираются, когда:
и в противном случае выбираются абсолютные улучшающие данные.
Проблемы с переключением между различными улучшающими данными заключаются в том, что могут возникать определенные заметные помехи. В примерном кодере 10 генератор 123 также содержит функциональность для постепенного переключения между различными улучшающими данными. Таким образом, вместо непосредственного переключения от одного типа улучшающих данных в одном блоке сигналов к другому типу в следующем блоке сигналов переключение выполняется постепенно от одного набора данных к другому.
Таким образом, в течение интервала времени (который может иметь продолжительность менее или более одного блока сигналов) генератор 123 формирует улучшающие данные как комбинацию абсолютных улучшающих данных и относительных улучшающих данных. Комбинация может достигаться, например, посредством интерполяции между различными типами данных или может использовать методику перекрытия с суммированием.
В качестве конкретного примера вместо внезапного переключения между различными типами улучшающих данных:
L enh= L s-T 11 L a-T 21 R a, R enh= R s-T 12 L a-T 22 R a или L enh= L s, R enh= R s
улучшающие данные, которые передаются, могут быть сформированы следующим образом:
L enh= L s-αT 11 L a-αT 21 R a, R enh= R s-αT 12 L a-αT 22 R a | (29) |
где значение α для k-го кадра данных может быть определено следующим образом:
где αk обозначает значение α в k-том кадре, а δ - это скорость адаптации. Значение δ=0,33 позволяет предоставлять достоверно свободное от помех кодирование во многих сценариях. Сигналы L enh и R enh, представленные в уравнении (29), могут быть получены с помощью интерполяции параметров или методики перекрытия с суммированием и кодированы и добавлены в битовый поток. Помимо этого, решение касательно дифференциальных или абсолютных улучшающих данных включается в битовый поток, тем самым давая возможность декодеру извлекать то же значение α, что и используемое в кодере.
Следует принимать во внимание, что хотя описание ориентировано на использование дифференциальных и абсолютных режимов с (внутриканальным) кодированием каждого из этих M-каналов по отдельности, другие варианты осуществления могут использовать другой подход к кодированию. Например, для M=2 следующим шагом может быть то, чтобы применить, к примеру, M/S-кодирование (кодирование с выделением центрального и разностного кодирования, а именно кодирование суммирующего и разностного сигнала) при выполнении (внутриканального) кодирования стереосигнала. Во многих вариантах осуществления это может быть преимущественным как в дифференциальном, так и в абсолютном режиме (внутриканального) кодирования отдельных каналов.
Элементы матрицы преобразования T' могут быть действительными или комплексными. Эти элементы могут кодироваться на модифицирующие параметры следующим образом: элементы матрицы преобразования T, которые являются действительными и положительными, могут квантоваться логарифмически, аналогично HD-параметрам, используемым в параметрическом стерео MPEG4. Можно задавать верхний предел для значений параметров, чтобы не допустить избыточного усиления слабых сигналов. Этот верхний предел может быть либо фиксированным либо функцией от корреляции между автоматически сформированным левым каналом и художественным левым каналом и корреляции между автоматически сформированным правым каналом и художественным правым каналом. Из элементов T', которые являются комплексными, амплитуда может быть квантована с помощью HD-параметров, а фаза может быть квантована линейно. Элементы T', которые являются действительными и, возможно, отрицательными, могут быть кодированы посредством взятия логарифма абсолютного значения элемента, при этом предоставляя различение отрицательных и положительных значений.
Фиг. 6 подробнее иллюстрирует пример генератора 123 по фиг. 5. В примере генератор 123 содержит процессор 145 блоков сигналов, который принимает пространственные и художественные понижающего микширования 102, 126 частотной области и разделяет сигналы на блоки сигналов. Каждый блок сигналов соответствует интервалу времени заранее определенной длительности. В некоторых вариантах осуществления блоки сигналов альтернативно или дополнительно могут быть разделены в частотной области и, к примеру, подканалы преобразования могут быть сгруппированы в различных блоках сигналов.
Процессор 145 блоков сигналов соединен с процессором 146 абсолютных улучшающих данных, который формирует абсолютные улучшающие данные для отдельных блоков сигналов, как описано выше. Помимо этого, процессор 145 блоков сигналов соединен с процессором 147 относительных улучшающих данных, который формирует относительные улучшающие данные для отдельных блоков сигналов, как описано выше. Относительные и абсолютные улучшающие данные определяются на основе характеристик сигналов в рамках блока сигналов и, в частности, улучшающие данные для данной группы временно/частотных мозаик могут быть определены только на основе этой группы временно/частотных мозаик.
Процессор 146 абсолютных улучшающих данных соединен с процессором 148 первой энергии сигналов, который определяет энергию сигналов абсолютных улучшающих данных в каждом блоке сигналов, как описано выше. Аналогично процессор 147 относительных улучшающих данных соединен со вторым процессором 149 энергии сигналов, который определяет энергию сигналов относительных улучшающих данных в каждом блоке сигналов, как описано выше.
Первый и второй процессоры 148, 149 энергии сигналов соединены с процессором 150 выбора, который выбирает для каждого блока сигналов абсолютные или относительные улучшающие данные в зависимости от того, какой тип имеет наименьшую энергию сигналов.
Процессор 150 выбора предоставляется в процессор 151 улучшающих данных, который дополнительно соединен с процессором 146 улучшающих данных и процессором 147 относительных улучшающих данных. Процессор 151 выбора принимает управляющий сигнал, указывающий то, какой тип улучшающих данных выбран, и в соответствии с этим он формирует улучшающие данные в качестве выбранных улучшающих данных. Более того, процессор 151 выбора выполнен с возможностью осуществлять постепенное переключение, в том числе интерполяцию, между абсолютными и относительными параметрами в ходе интервала времени переключения.
Процессор 151 выбора соединен с процессором 152 кодирования, который кодирует улучшающие данные в соответствии с заданным протоколом. Помимо этого, процессор 152 кодирования кодирует данные, указывающие то, какой тип данных выбран в каждом блоке сигналов, например, посредством задания бита для каждого блока сигналов, чтобы указать тип данных. Кодированные данные из процессора 152 кодирования включаются в кодированный битовый поток, формируемый кодером 10.
Фиг. 7 иллюстрирует блок-схему другого варианта осуществления многоканального аудиодекодера согласно некоторым вариантам осуществления изобретения, которым, в частности, может быть аудиодекодер 20 по фиг. 2.
Декодер 20 содержит первый блок 210 и соединенный с ним второй блок 220. Первый блок 210 принимает сигналы понижающего микширования lo и ro и модифицирующие параметры 105 в качестве входов. Входы могут приниматься, например, как один битовый поток из кодера 10 по фиг. 1 или 5. Сигналы понижающего микширования lo и ro могут быть частью пространственного понижающего микширования 102 или художественного понижающего микширования 103.
Первый блок 210 содержит блок 211 сегментации и преобразования и блок 212 модификации понижающего микширования. Сигналы понижающего микширования lo и ro соответственно сегментируются и сегментированные сигналы преобразуются в частотную область в блоке 211 сегментации и преобразования. Результирующие преобразования частотной области сигналов понижающего микширования показаны как сигналы частотной области Lo и Ro соответственно. Затем сигналы частотной области Lo и Ro обрабатываются в блоке 212 модификации понижающего микширования. Функция блока 212 модификации понижающего микширования заключается в том, чтобы модифицировать входное понижающее микширование таким образом, чтобы оно напоминало пространственное понижающее микширование 202, т.е. восстанавливать пространственное понижающее микширование 202 из художественного понижающего микширования 103 и модифицирующих параметров 105.
Если пространственное понижающее микширование 102 принимается посредством декодера 20, блок 212 модификации понижающего микширования не должен модифицировать сигналы понижающего микширования Lo и Ro, и эти сигналы понижающего микширования Lo и Ro просто могут передаваться во второй блок 220 в качестве сигналов понижающего микширования Ld и Rd пространственного понижающего микширования 202. Управляющий сигнал 217 может указывать то, есть ли необходимость в модификации входного понижающего микширования, т.е. является входное понижающее микширование пространственным понижающим микшированием или альтернативным понижающим микшированием. Управляющий сигнал 217 может быть сформирован внутренне в декодере 20, к примеру, посредством анализа входного понижающего микширования и ассоциативно связанных параметров 105, которые могут описывать свойства сигналов требуемого пространственного понижающего микширования. Если входное понижающее микширование совпадает с требуемыми свойствами сигнала, управляющий сигнал 217 может быть установлен так, чтобы указывать то, что нет необходимости в модификации. Альтернативно управляющий сигнал 217 может быть установлен вручную или его значение может приниматься как часть кодированного многоканального аудиосигнала, к примеру, в наборе 105 параметров.
Если кодер 20 принимает художественное понижающее микширование 103, и управляющий сигнал 217 указывает то, что принимаемые сигналы понижающего микширования Lo и Ro должны быть модифицированы посредством блока 212 модификации понижающего микширования, декодер может работать двумя способами в зависимости от представления принимаемых модифицирующих параметров. Если параметры представляют относительное преобразование от художественного понижающего микширования к пространственному понижающему микшированию (т.е. если параметры являются относительными улучшающими данными), переменные преобразования получаются напрямую посредством применения модифицирующих параметров к художественному понижающему микшированию обратно операции, выполняемой в кодере. В различных вариантах осуществления это может быть применено, например, ко второй части вторых улучшающих данных.
С другой стороны, если передаваемые параметры представляют абсолютные свойства пространственного понижающего микширования, декодер может непосредственно заменять выборки художественного понижающего микширования посредством выборок пространственного понижающего микширования. Например, если вторая часть вторых улучшающих данных состоит просто в выборках временно/частотных мозаик пространственного понижающего микширования, декодер может непосредственно заменять соответствующие выборки временно/частотных мозаик художественного понижающего микширования на них. Следует принимать во внимание, что декодер также может сначала вычислить соответствующие свойства фактически передаваемого художественного понижающего микширования. С помощью этой информации (переданных параметров и вычисленных свойств переданного художественного понижающего микширования) затем определяются переменные преобразования, которые описывают преобразование от (свойств) переданного художественного понижающего микширования к (свойствам) пространственному понижающему микшированию. Более конкретно матрица преобразования T может быть определена либо с помощью способа II.a), либо (немного модифицированного) II.b), которые описаны выше.
Способ II.a) может быть использован, если абсолютная энергия передается в первой части вторых улучшающих данных. Переданные (абсолютные) параметры E Ls и E Rs представляют энергию левого и правого сигнала пространственного понижающего микширования соответственно и задаются следующим образом:
Энергия передаваемого понижающего микширования E DLs и E Drs вычисляется в декодере. С помощью этих переменных можно вычислить параметры α и β по (7) следующим образом:
Матрица преобразования T задается следующим образом:
В частности, блок 212 модификации понижающего микширования содержит функциональность для извлечения художественного понижающего микширования и модифицирующих параметров 105 из принимаемого битового потока. Художественное понижающее микширование делится на блоки сигналов (соответствующие блокам сигналов, используемых посредством декодера). Для каждого блока сигналов блок 212 модификации понижающего микширования оценивает индикацию принимаемых данных битового потока, чтобы определить, относительные или абсолютные улучшающие данные предоставляются для первой и второй части этого блока сигналов. Блок 212 модификации понижающего микширования затем применяет первую и вторую часть вторых улучшающих данных как абсолютные улучшающие данные или относительные улучшающие данные в ответ на данные индикации.
Обнаружилось, что низкая сложность, но высокая производительность может быть достигнута, когда элементы матрицы преобразования T12 и T21 задаются равными нулю. Далее некоторые конкретные реализации блока 212 модификации понижающего микширования описаны с этим ограничением. Тем не менее, следует принимать во внимание, что реализации легко могут быть расширены до случая, когда T12 и/или T21 отличны от нуля.
В случае, когда улучшающие данные второй части вторых улучшающих данных не передаются для сигнала художественного понижающего микширования, первый блок 210 может быть реализован так, как показано на фиг. 8. Каналы стереофонического понижающего микширования временной области lo и ro сначала сегментируются и преобразуются в частотную область посредством QMF-преобразования, приводя к тому, что сигналы La и Ra представляют временно/частотную мозаику художественного стереофонического понижающего микширования. Далее эти сигналы преобразуются с помощью матрицы преобразования T, приводя к сигналам T11La и T22Ra.
Следует принимать во внимание, что улучшающие данные могут быть сформированы и применены во временной и/или частотной области. Таким образом, можно включить кодированные улучшающие данные временной области (Lenh, Renh) в битовый поток. Тем не менее, в некоторых вариантах применения может быть полезно включить кодированные улучшающие данные частотной области вместо улучшающих данных временной области. Например, во многих кодерах улучшающие данные формируются в частотной области для временно/частотных мозаик, и чтобы сформировать сигнал временной области, преобразование из частотной во временную область необходимо в кодере. Более того, чтобы применять эти улучшающие данные, декодер преобразует данные из временной области в частотную область. Тем самым преобразования временных областей могут быть уменьшены посредством включения улучшающих данных в частотную область.
В некоторых вариантах осуществления различные временно-частотные преобразования могут быть использованы для художественного понижающего микширования и улучшающих данных. Например, кодирование художественного понижающего микширования может использовать QMF-преобразование, тогда как улучшающие данные используют MDCT-преобразование. В этом случае улучшающие данные могут быть включены в (MDCT) частотную область, и преобразование непосредственно между двумя частотными областями может выполняться посредством блока 212 модификации понижающего микширования, как проиллюстрировано на фиг. 9.
В примере матрицей преобразования T* может быть просто матрица преобразования T по уравнению (2). Тем не менее, чтобы уменьшить помехи переключения, T* может соответствовать матрице преобразования T по уравнению (2), но модифицированной для постепенного переключения. В частности, матрица T* может включать в себя коэффициент α, определенный посредством уравнения (30), где решение касательно абсолютных или относительных улучшающих данных извлекается из битового потока. Эта схема используется для тех блоков сигналов/частотных диапазонов, где данные улучшающего уровня второй части вторых улучшающих данных имеются, в противном случае может быть использован подход по фиг. 8.
Если улучшающие данные (Lenh, Renh) предоставляются во временной области, подход, аналогичный подходу по фиг. 9, может быть использован, как проиллюстрировано на фиг. 10. Тем не менее, в этом случае частотно-частотное преобразование заменяется временно-частотным преобразованием, которым особенно может быть преобразование из временной в QMF-область, когда QMF-преобразования используются для кодирования художественного понижающего микширования. Таким образом, в этом примере улучшающие данные применяются в частотной области.
Во многих вариантах осуществления может быть использована реализация декодера для улучшающих данных временной области, которые используют только одно преобразование из временной в частотную область в первом блоке 210.
В частности, могут быть использованы следующие параметры дифференциальных улучшающих данных:
при условии, что матрица T, заданная посредством уравнения (27), является несингулярной (следовательно, существует ее инверсия). Теперь уравнение (1) может быть изменено на следующее:
[ L d R d]=[ L a R a L enh R enh]T'T. | (35) |
Фиг. 11 иллюстрирует эффективную реализацию блока 212 модификации понижающего микширования для улучшающих данных временной области на основе уравнений (34) и (35). Для простоты T12 и T21 матрицы T задаются равными нулю. В сравнении с реализацией по фиг. 10 только одно преобразование из временной в QMF-область требуется посредством реализации по фиг. 11.
Таким образом, как описано выше, блок 212 модификации понижающего микширования формирует сигнал 202, который в значительной степени походит на пространственное понижающее микширование, используемое для многоканальных улучшающих данных. Это может быть эффективно использовано вторым блоком 220, чтобы расширить двухканальный аудиосигнал до полного многоканального сигнала объемного звучания. Более того, посредством динамического и гибкого выбора наиболее подходящего типа улучшающих данных (относительных или абсолютных) для каждого блока сигналов значительно более эффективное кодирование достигается, и достигается многоканальное кодирование/декодирование с улучшенным отношением "качество к скорости передачи данных".
Вторым блоком 220 может быть традиционный многоканальный кодер 2-к-5.1, который декодирует восстановленное пространственное понижающее микширование 202 и ассоциативно связанные параметрические данные 104 в 5.1-канальный выходной сигнал 203. Как описано выше, параметрические данные 104 содержат параметрические данные 141, 142, 143 и 144. Второй блок 220 выполняет обратную обработку относительно первого блока 110 в кодере 10. Второй блок 220 содержит блок 221 повышающего сведения, который преобразует стереофоническое понижающее микширование 202 и ассоциативно связанные параметры 144 в три моноаудиосигнала L, R и C. Далее каждый из моноаудиосигналов L, R и C соответственно декоррелируются в декорреляторах 222, 225 и 228 соответственно. Следовательно, матрица смешивания 223 преобразует моноаудиосигнал L, его декоррелированный эквивалент и ассоциативно связанные параметры 141 в сигналы Lf и Lr. Аналогично матрица 226 смешивания преобразует моноаудиосигнал R, его декоррелированный эквивалент и ассоциативно связанные параметры 142 в сигналы Rf и Rr, а матрица 229 смешивания преобразует моноаудиосигнал C, его декоррелированный эквивалент и ассоциативно связанные параметры 143 в сигналы Co и LFE. Наконец, три пары сегментированных сигналов частотной области Lf и Lr, Rf и Rf, Co и LFE соответственно преобразуются во временную область и комбинируются посредством алгоритма перекрытия с суммированием в обратных преобразователях 224, 227 и 230 соответственно, чтобы получить три пары выходных сигналов lf и lr, rf и rr и co и lfe соответственно. Выходные сигналы lf, lr, rf, rr, co и lfe формируют декодированный многоканальный аудиосигнал 203.
Многоканальный аудиокодер 10 и многоканальный аудиодекодер 20 может быть реализован посредством цифровых аппаратных средств или посредством программного обеспечения, которое приводится в исполнение посредством процессора цифровых сигналов или микропроцессора общего назначения.
Следует принимать во внимание, что вышеприведенное описание для понятности имеет описанные варианты осуществления со ссылкой на различные функциональные блоки и процессоры. Тем не менее, должно быть очевидным, что любое надлежащее распределение функциональности между различными функциональными блоками или процессорами может быть использовано без отступления от изобретения. Например, функциональность, проиллюстрированная так, чтобы быть выполненной посредством отдельных процессоров или контроллеров, может быть выполнена посредством одного процессора или контроллера. Следовательно, ссылки на конкретные функциональные блоки должны рассматриваться только как ссылки на надлежащее средство предоставления описанной функциональности, а не обозначать точную логическую или физическую структуру, или организацию.
Изобретение может быть реализовано в любой надлежащей форме, включая аппаратные средства, программное обеспечение, микропрограммное обеспечение или любое их сочетание. Необязательно изобретение может быть реализовано, по меньшей мере, частично как компьютерное программное обеспечение, выполняемое на одном или более процессоров данных и/или процессоров цифровых сигналов. Элементы и компоненты варианта осуществления изобретения могут быть физически, функционально и логически реализованы любым надлежащим образом. Фактически функциональность может быть реализована в одном блоке, множестве блоков или как часть других функциональных блоков. По существу, изобретение может быть реализовано в одном блоке или может быть физически и функционально распределено между различными блоками и процессорами.
Хотя настоящее изобретение описано в связи с некоторыми вариантами осуществления, оно не предназначено для того, чтобы быть ограниченным конкретной изложенной в данном документе формой. Вместо этого область применения настоящего изобретения ограничена прилагаемой формулой изобретения. Дополнительно, хотя признак, как предполагается, описан в данном документе в связи с конкретными вариантами осуществления, специалисты в данной области техники должны признавать, что различные признаки описанных вариантов осуществления могут быть комбинированы в соответствии с изобретением. В формуле изобретение термин "содержит" не исключает наличия других элементов или этапов.
Более того, хотя перечислены по отдельности, множество средств, элементов или этапов способа может быть реализовано посредством, к примеру, одного блока или процессора. Дополнительно, хотя отдельные признаки могут быть включены в различные пункты формулы изобретения, они могут быть с пользой объединены, и их включение в различные пункты формулы изобретения не подразумевает, что сочетание признаков не является выполнимым и/или полезным. Так же включение признака в одну категорию пунктов формулы изобретения не налагает ограничение на эту категорию, а вместо этого указывает то, что признак в равной степени применим к другим категориями по мере необходимости. Более того, порядок признаков в формуле изобретения не налагает какой-либо конкретный порядок, в котором признаки должны осуществляться, и, в частности, порядок отдельных этапов в пункте способа не подразумевает, что этапы должны выполняться в этом порядке. Вместо этого этапы могут выполняться в любом надлежащем порядке. Кроме того, ссылки в единственном числе не исключают множественность. Таким образом, ссылки на "первый", "второй" и т.д. не исключают множественность. Номера ссылок в формуле изобретения предоставлены просто в качестве поясняющего примера, и они не должны истолковываться как ограничивающие область применения формулы изобретения каким-либо образом.
Claims (33)
1. Многоканальный аудиокодер (10) для кодирования N-канального аудиосигнала, причем многоканальный аудиокодер (10) содержит:
средство формирования (110) первого М-канального сигнала для N-канального аудиосигнала, при этом М меньше N;
средство формирования (115, 116, 117, 118) ассоциативно связанных параметрических данных для первого М-канального сигнала относительно N-канального аудиосигнала;
средство формирования (121) второго М-канального сигнала для N-канального аудиосигнала;
генератор (123) модифицирующих параметров для формирования модифицирующих параметров для второго М-канального сигнала относительно первого М-канального сигнала;
средство формирования (120) кодированного выходного сигнала, содержащего второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры; и
при этом генератор (123) модифицирующих параметров выполнен с возможностью динамически выбирать между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала.
средство формирования (110) первого М-канального сигнала для N-канального аудиосигнала, при этом М меньше N;
средство формирования (115, 116, 117, 118) ассоциативно связанных параметрических данных для первого М-канального сигнала относительно N-канального аудиосигнала;
средство формирования (121) второго М-канального сигнала для N-канального аудиосигнала;
генератор (123) модифицирующих параметров для формирования модифицирующих параметров для второго М-канального сигнала относительно первого М-канального сигнала;
средство формирования (120) кодированного выходного сигнала, содержащего второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры; и
при этом генератор (123) модифицирующих параметров выполнен с возможностью динамически выбирать между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала.
2. Многоканальный аудиокодер (10) по п.1, в котором генератор (123) модифицирующих параметров выполнен с возможностью выбирать между абсолютными модифицирующими данными и относительными модифицирующими данными в ответ на относительную характеристику абсолютных модифицирующих данных и относительных модифицирующих данных.
3. Многоканальный аудиокодер (10) по п.2, в котором относительная характеристика представляет собой энергию сигнала абсолютных модифицирующих данных относительно энергии сигнала относительных модифицирующих данных.
4. Многоканальный аудиокодер (10) по п.1, в котором генератор (123) модифицирующих параметров выполнен с возможностью разделять второй М-канальный сигнал на блоки сигналов и отдельно выбирать между абсолютными модифицирующими данными и относительными модифицирующими данными для каждого блока сигналов.
5. Многоканальный аудиокодер (10) по п.4, в котором генератор (123) модифицирующих параметров выполнен с возможностью выбирать между абсолютными модифицирующими данными и относительными модифицирующими данными для блока сигналов только на основе характеристик, ассоциативно связанных с блоком сигналов.
6. Многоканальный аудиокодер (10) по п.1, в котором генератор (123) модифицирующих параметров выполнен с возможностью формирования модифицирующих параметров в качестве комбинации абсолютных модифицирующих данных и относительных модифицирующих данных в ходе интервала времени переключения между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных и в качестве относительных модифицирующих данных.
7. Многоканальный аудиокодер (10) по п.6, в котором комбинация содержит интерполяцию между абсолютными модифицирующими данными и относительными модифицирующими данными.
8. Многоканальный аудиокодер (10) по п.1, в котором средство формирования (120) кодированного выходного сигнала выполнено с возможностью включать в себя данные индикации, указывающие на то, используются ли относительные модифицирующие данные или абсолютные модифицирующие данные.
9. Многоканальный аудиокодер (10) по п.1, в котором модифицирующие параметры содержат первую часть модифицирующих данных и вторую часть модифицирующих данных, причем вторая часть предоставляет более высококачественное представление первого М-канального сигнала, чем первая часть.
10. Многоканальный аудиокодер (10) по п.9, в котором генератор (123) модифицирующих параметров выполнен с возможностью динамически выбирать только между формированием второй части в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных.
11. Многоканальный аудиокодер (10) по п.9, в котором генератор (123) модифицирующих параметров выполнен с возможностью формировать относительные данные второй части относительно опорного сигнала, сформированного посредством применения модифицирующих данных первой части к первому М-канальному сигналу.
12. Многоканальный аудиодекодер (20) для декодирования N-канального аудиосигнала, причем многоканальный аудиодекодер (20) содержит:
средство приема (210) кодированного аудиосигнала, содержащего:
первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала, и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными;
средство (212) формирования для формирования М-канального многоканального сигнала расширения в ответ на первый М-канальный сигнал и модифицирующие параметры; и
средство формирования (220) N-канального декодированного сигнала в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные; и
при этом средство (212) формирования выполнено с возможностью выбирать между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных в ответ на данные индикации.
средство приема (210) кодированного аудиосигнала, содержащего:
первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала, и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными;
средство (212) формирования для формирования М-канального многоканального сигнала расширения в ответ на первый М-канальный сигнал и модифицирующие параметры; и
средство формирования (220) N-канального декодированного сигнала в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные; и
при этом средство (212) формирования выполнено с возможностью выбирать между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных в ответ на данные индикации.
13. Многоканальный аудиодекодер (20) по п.12, в котором средство (212) формирования выполнено с возможностью применять модифицирующие параметры к первому М-канальному сигналу во временной области.
14. Многоканальный аудиодекодер (20) по п.12, в котором средство (212) формирования выполнено с возможностью применять модифицирующие параметры к первому М-канальному сигналу в частотной области.
15. Многоканальный аудиодекодер (10) по п.12, в котором модифицирующие параметры содержат первую часть модифицирующих данных и вторую часть модифицирующих данных, причем вторая часть предоставляет более высококачественное представление первого М-канального сигнала, чем первая часть.
16. Многоканальный аудиодекодер (20) по п.15, в котором средство (212) формирования выполнено с возможностью выбирать только между применением модифицирующих параметров второй части в качестве абсолютных модифицирующих данных или относительных модифицирующих данных.
17. Многоканальный аудиодекодер (20) по п.15, в котором средство (212) формирования выполнено с возможностью формировать М-канальное многоканальное расширение посредством применения относительных модифицирующих данных второй части к сигналу, сформированному посредством применения модифицирующих данных первой части к первому М-канальному сигналу.
18. Способ кодирования N-канального аудиосигнала, при этом способ содержит этапы, на которых:
формируют первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала;
формируют второй М-канальный сигнал для N-канального аудиосигнала;
формируют модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала;
формируют кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры; и
при этом формирование модифицирующих параметров содержит динамический выбор между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала.
формируют первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала;
формируют второй М-канальный сигнал для N-канального аудиосигнала;
формируют модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала;
формируют кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры; и
при этом формирование модифицирующих параметров содержит динамический выбор между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала.
19. Способ декодирования N-канального аудиосигнала, при этом способ содержит этапы, на которых:
принимают кодированный аудиосигнал, содержащий:
первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно-второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала, и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными;
формируют М-канальный многоканальный сигнал расширения в ответ на первый М-канальный сигнал и модифицирующие параметры; и
формируют N-канальный декодированный сигнал в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные; и
при этом формирование М-канального многоканального сигнала расширения содержит выбор между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных в ответ на данные индикации.
принимают кодированный аудиосигнал, содержащий:
первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно-второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала, и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными;
формируют М-канальный многоканальный сигнал расширения в ответ на первый М-канальный сигнал и модифицирующие параметры; и
формируют N-канальный декодированный сигнал в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные; и
при этом формирование М-канального многоканального сигнала расширения содержит выбор между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных в ответ на данные индикации.
20. Носитель данных, на котором сохранен кодированный многоканальный аудиосигнал для N-канального аудиосигнала, используемый в способе декодирования N-канального аудиосигнала, при этом кодированный многоканальный аудиосигнал содержит:
данные М-канального сигнала для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала; и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными.
данные М-канального сигнала для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала; и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными.
21. Передающее устройство (40) для передачи кодированного многоканального аудиосигнала, при этом передающее устройство (40) содержит многоканальный аудиокодер (10) по п.1.
22. Приемное устройство (50) для приема кодированного многоканального аудиосигнала, при этом приемное устройство (50) содержит многоканальный аудиодекодер (20) по п.12.
23. Система для передачи и приема аудиосигнала, содержащая передающее устройство (40) для передачи кодированного многоканального аудиосигнала посредством канала (30) передачи в приемное устройство (50), при этом передающее устройство (40) содержит многоканальный аудиокодер (10) по п.1, а приемное устройство содержит многоканальный аудиодекодер (20) по п.12.
24. Способ передачи кодированного многоканального аудиосигнала, причем способ содержит кодирование N-канального аудиосигнала, при этом кодирование содержит этапы, на которых:
формируют первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала;
формируют второй М-канальный сигнал для N-канального аудиосигнала;
формируют модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала;
формируют кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры; и
при этом формирование модифицирующих параметров содержит динамический выбор между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала.
формируют первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала;
формируют второй М-канальный сигнал для N-канального аудиосигнала;
формируют модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала;
формируют кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры; и
при этом формирование модифицирующих параметров содержит динамический выбор между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала.
25. Способ приема кодированного многоканального аудиосигнала, причем способ содержит декодирование кодированного многоканального аудиосигнала, при этом декодирование содержит этапы, на которых:
принимают кодированный многоканальный аудиосигнал, содержащий:
первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала, и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными;
формируют М-канальный многоканальный сигнал расширения в ответ на первый М-канальный сигнал и модифицирующие параметры; и
формируют N-канальный декодированный сигнал в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные; и
при этом формирование М-канального многоканального сигнала расширения содержит выбор между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных в ответ на данные индикации.
принимают кодированный многоканальный аудиосигнал, содержащий:
первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
ассоциативно связанные параметрические данные для многоканального расширения, причем ассоциативно связанные параметрические данные являются относительными ко второму М-канальному сигналу, отличному от первого М-канального сигнала;
модифицирующие параметры для первого М-канального сигнала относительно второго М-канального сигнала, причем модифицирующие параметры содержат абсолютные модифицирующие данные и относительные модифицирующие данные относительно первого М-канального сигнала, и
данные индикации, указывающие то, являются ли модифицирующие параметры для блока сигналов абсолютными модифицирующими данными или относительными модифицирующими данными;
формируют М-канальный многоканальный сигнал расширения в ответ на первый М-канальный сигнал и модифицирующие параметры; и
формируют N-канальный декодированный сигнал в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные; и
при этом формирование М-канального многоканального сигнала расширения содержит выбор между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных в ответ на данные индикации.
26. Способ передачи и приема аудиосигнала, при этом способ содержит этапы, на которых:
кодируют N-канальный аудиосигнал, при этом кодирование содержит этапы, на которых:
формируют первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала;
формируют второй М-канальный сигнал для N-канального аудиосигнала;
формируют модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала, при этом формирование модифицирующих параметров содержит динамический выбор между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала;
формируют кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры;
передают кодированный выходной сигнал из передающего устройства в приемное устройство;
принимают, в приемном устройстве, кодированный выходной сигнал;
декодируют кодированный выходной сигнал, при этом декодирование содержит этапы, на которых:
формируют М-канальный многоканальный сигнал расширения в ответ на второй М-канальный сигнал и модифицирующие параметры, при этом формирование М-канального многоканального сигнала расширения содержит выбор между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных, и
формируют N-канальный декодированный сигнал в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные.
кодируют N-канальный аудиосигнал, при этом кодирование содержит этапы, на которых:
формируют первый М-канальный сигнал для N-канального аудиосигнала, причем М меньше N;
формируют ассоциативно связанные параметрические данные для первого М-канального сигнала относительно N-канального аудиосигнала;
формируют второй М-канальный сигнал для N-канального аудиосигнала;
формируют модифицирующие параметры для второго М-канального сигнала относительно первого М-канального сигнала, при этом формирование модифицирующих параметров содержит динамический выбор между формированием модифицирующих параметров в качестве абсолютных модифицирующих данных или в качестве относительных модифицирующих данных относительно второго М-канального сигнала;
формируют кодированный выходной сигнал, содержащий второй М-канальный сигнал, ассоциативно связанные параметрические данные и модифицирующие параметры;
передают кодированный выходной сигнал из передающего устройства в приемное устройство;
принимают, в приемном устройстве, кодированный выходной сигнал;
декодируют кодированный выходной сигнал, при этом декодирование содержит этапы, на которых:
формируют М-канальный многоканальный сигнал расширения в ответ на второй М-канальный сигнал и модифицирующие параметры, при этом формирование М-канального многоканального сигнала расширения содержит выбор между применением модифицирующих параметров в качестве абсолютных модифицирующих данных или относительных модифицирующих данных, и
формируют N-канальный декодированный сигнал в ответ на М-канальный многоканальный сигнал расширения и ассоциативно связанные параметрические данные.
27. Носитель данных, на котором сохранен компьютерный программный продукт, функционирующий для того, чтобы предписывать процессору выполнять этапы способа по п.18.
28. Носитель данных, на котором сохранен компьютерный программный продукт, функционирующий для того, чтобы предписывать процессору выполнять этапы способа по п.19.
29. Носитель данных, на котором сохранен компьютерный программный продукт, функционирующий для того, чтобы предписывать процессору выполнять этапы способа по п.24.
30. Носитель данных, на котором сохранен компьютерный программный продукт, функционирующий для того, чтобы предписывать процессору выполнять этапы способа по п.25.
31. Носитель данных, на котором сохранен компьютерный программный продукт, функционирующий для того, чтобы предписывать процессору выполнять этапы способа по п.26.
32. Многоканальный аудиорекордер (60), содержащий многоканальный аудиокодер (10) по п.1.
33. Многоканальный аудиопроигрыватель (60), содержащий многоканальный аудиодекодер (20) по п.12.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05102515.3 | 2005-03-30 | ||
EP05102515 | 2005-03-30 | ||
EP05103085.6 | 2005-04-18 | ||
EP05103085 | 2005-04-18 | ||
EP06100245.7 | 2006-01-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007139922A RU2007139922A (ru) | 2009-05-10 |
RU2411594C2 true RU2411594C2 (ru) | 2011-02-10 |
Family
ID=36579565
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007139922/09A RU2411594C2 (ru) | 2005-03-30 | 2006-03-16 | Кодирование и декодирование аудио |
RU2007139918/09A RU2407073C2 (ru) | 2005-03-30 | 2006-03-16 | Кодирование многоканального аудио |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007139918/09A RU2407073C2 (ru) | 2005-03-30 | 2006-03-16 | Кодирование многоканального аудио |
Country Status (11)
Country | Link |
---|---|
US (1) | US8346564B2 (ru) |
EP (1) | EP1866912B1 (ru) |
JP (1) | JP4610650B2 (ru) |
KR (1) | KR101271069B1 (ru) |
AT (1) | ATE473502T1 (ru) |
BR (1) | BRPI0608945C8 (ru) |
DE (1) | DE602006015294D1 (ru) |
MX (1) | MX2007011915A (ru) |
PL (1) | PL1866912T3 (ru) |
RU (2) | RU2411594C2 (ru) |
WO (1) | WO2006103584A1 (ru) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2575390C2 (ru) * | 2011-03-18 | 2016-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер аудио и декодер, имеющий гибкие функциональные возможности конфигурации |
RU2592412C2 (ru) * | 2012-03-29 | 2016-07-20 | Хуавэй Текнолоджиз Ко., Лтд. | Способы и устройства кодирования и декодирования сигналов |
US9524722B2 (en) | 2011-03-18 | 2016-12-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frame element length transmission in audio coding |
US9646624B2 (en) | 2013-01-29 | 2017-05-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
US9699584B2 (en) | 2013-07-22 | 2017-07-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
US9743210B2 (en) | 2013-07-22 | 2017-08-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
RU2642376C2 (ru) * | 2013-07-22 | 2018-01-24 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ обработки аудиосигнала, блок обработки сигналов, стереофонический рендерер, аудиокодер и аудиодекодер |
RU2676233C2 (ru) * | 2013-07-22 | 2018-12-26 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием регулирования доли декоррелированного сигнала на основании остаточных сигналов |
US10249311B2 (en) | 2013-07-22 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
US9426596B2 (en) | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
US8788080B1 (en) | 2006-09-12 | 2014-07-22 | Sonos, Inc. | Multi-channel pairing in a media system |
US9202509B2 (en) | 2006-09-12 | 2015-12-01 | Sonos, Inc. | Controlling and grouping in a multi-zone media system |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) * | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
KR101111520B1 (ko) * | 2006-12-07 | 2012-05-24 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
JP5220840B2 (ja) * | 2007-03-30 | 2013-06-26 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
KR101449434B1 (ko) * | 2008-03-04 | 2014-10-13 | 삼성전자주식회사 | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 |
US8175295B2 (en) | 2008-04-16 | 2012-05-08 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
EP2111062B1 (en) | 2008-04-16 | 2014-11-12 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
KR101061128B1 (ko) | 2008-04-16 | 2011-08-31 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
CN102065265B (zh) * | 2009-11-13 | 2012-10-17 | 华为终端有限公司 | 实现混音的方法、装置和系统 |
US11265652B2 (en) | 2011-01-25 | 2022-03-01 | Sonos, Inc. | Playback device pairing |
US11429343B2 (en) | 2011-01-25 | 2022-08-30 | Sonos, Inc. | Stereo playback configuration and control |
SG193237A1 (en) | 2011-03-28 | 2013-10-30 | Dolby Lab Licensing Corp | Reduced complexity transform for a low-frequency-effects channel |
EP2560161A1 (en) | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
JP5930441B2 (ja) * | 2012-02-14 | 2016-06-08 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置 |
US9729115B2 (en) | 2012-04-27 | 2017-08-08 | Sonos, Inc. | Intelligently increasing the sound level of player |
US9008330B2 (en) | 2012-09-28 | 2015-04-14 | Sonos, Inc. | Crossover frequency adjustments for audio speakers |
CN105247613B (zh) * | 2013-04-05 | 2019-01-18 | 杜比国际公司 | 音频处理系统 |
ES2640815T3 (es) | 2013-05-24 | 2017-11-06 | Dolby International Ab | Codificación eficiente de escenas de audio que comprenden objetos de audio |
KR102033304B1 (ko) | 2013-05-24 | 2019-10-17 | 돌비 인터네셔널 에이비 | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 |
EP3023984A4 (en) * | 2013-07-15 | 2017-03-08 | Electronics and Telecommunications Research Institute | Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal |
KR102244379B1 (ko) | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
ES2710774T3 (es) * | 2013-11-27 | 2019-04-26 | Dts Inc | Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales |
US9226073B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9226087B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9756448B2 (en) | 2014-04-01 | 2017-09-05 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
US9948994B2 (en) | 2014-07-16 | 2018-04-17 | Crestron Electronics, Inc. | Transmission of digital audio signals using an internet protocol |
AU2015326856B2 (en) | 2014-10-02 | 2021-04-08 | Dolby International Ab | Decoding method and decoder for dialog enhancement |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
GB2554065B (en) * | 2016-09-08 | 2022-02-23 | V Nova Int Ltd | Data processing apparatuses, methods, computer programs and computer-readable media |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
CN111034225B (zh) | 2017-08-17 | 2021-09-24 | 高迪奥实验室公司 | 使用立体混响信号的音频信号处理方法和装置 |
EP3896995B1 (en) * | 2020-04-17 | 2023-09-13 | Nokia Technologies Oy | Providing spatial audio signals |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2047941C1 (ru) | 1992-03-17 | 1995-11-10 | Андрей Маркович Полыковский | Способ трансляции стереофонического сигнала |
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
US6694027B1 (en) | 1999-03-09 | 2004-02-17 | Smart Devices, Inc. | Discrete multi-channel/5-2-5 matrix system |
DK1173925T3 (da) | 1999-04-07 | 2004-03-29 | Dolby Lab Licensing Corp | Matriksforbedringer til tabsfri kodning og dekodning |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
RU2161868C1 (ru) | 2000-05-12 | 2001-01-10 | Федеральное государственное унитарное предприятие Научно-исследовательский институт радио Государственного комитета РФ по связи и информатизации | Способ трансляции стереофонического сигнала |
WO2004019656A2 (en) * | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1500084B1 (en) | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
KR100635022B1 (ko) * | 2002-05-03 | 2006-10-16 | 하만인터내셔날인더스트리스인코포레이티드 | 다채널 다운믹싱 장치 |
AU2003244932A1 (en) | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
-
2006
- 2006-03-16 MX MX2007011915A patent/MX2007011915A/es active IP Right Grant
- 2006-03-16 US US11/909,730 patent/US8346564B2/en active Active
- 2006-03-16 RU RU2007139922/09A patent/RU2411594C2/ru active
- 2006-03-16 KR KR1020077025173A patent/KR101271069B1/ko active IP Right Grant
- 2006-03-16 PL PL06711112T patent/PL1866912T3/pl unknown
- 2006-03-16 JP JP2008503632A patent/JP4610650B2/ja active Active
- 2006-03-16 BR BRPI0608945A patent/BRPI0608945C8/pt active IP Right Grant
- 2006-03-16 WO PCT/IB2006/050822 patent/WO2006103584A1/en active Application Filing
- 2006-03-16 RU RU2007139918/09A patent/RU2407073C2/ru active
- 2006-03-16 AT AT06711112T patent/ATE473502T1/de not_active IP Right Cessation
- 2006-03-16 DE DE602006015294T patent/DE602006015294D1/de active Active
- 2006-03-16 EP EP06711112A patent/EP1866912B1/en active Active
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9524722B2 (en) | 2011-03-18 | 2016-12-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frame element length transmission in audio coding |
RU2575390C2 (ru) * | 2011-03-18 | 2016-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер аудио и декодер, имеющий гибкие функциональные возможности конфигурации |
US9773503B2 (en) | 2011-03-18 | 2017-09-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder having a flexible configuration functionality |
US9779737B2 (en) | 2011-03-18 | 2017-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frame element positioning in frames of a bitstream representing audio content |
RU2592412C2 (ru) * | 2012-03-29 | 2016-07-20 | Хуавэй Текнолоджиз Ко., Лтд. | Способы и устройства кодирования и декодирования сигналов |
US9537694B2 (en) | 2012-03-29 | 2017-01-03 | Huawei Technologies Co., Ltd. | Signal coding and decoding methods and devices |
US10600430B2 (en) | 2012-03-29 | 2020-03-24 | Huawei Technologies Co., Ltd. | Signal decoding method, audio signal decoder and non-transitory computer-readable medium |
US9786293B2 (en) | 2012-03-29 | 2017-10-10 | Huawei Technologies Co., Ltd. | Signal coding and decoding methods and devices |
US9899033B2 (en) | 2012-03-29 | 2018-02-20 | Huawei Technologies Co., Ltd. | Signal coding and decoding methods and devices |
RU2641461C2 (ru) * | 2013-01-29 | 2018-01-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания |
US9646624B2 (en) | 2013-01-29 | 2017-05-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
RU2676233C2 (ru) * | 2013-07-22 | 2018-12-26 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием регулирования доли декоррелированного сигнала на основании остаточных сигналов |
US10715943B2 (en) | 2013-07-22 | 2020-07-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US9788136B2 (en) | 2013-07-22 | 2017-10-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US9955282B2 (en) | 2013-07-22 | 2018-04-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method for processing an audio signal, signal processing unit, binaural renderer, audio encoder and audio decoder |
RU2660638C2 (ru) * | 2013-07-22 | 2018-07-06 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для улучшенного пространственного кодирования аудиообъектов |
US9743210B2 (en) | 2013-07-22 | 2017-08-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US10249311B2 (en) | 2013-07-22 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US10277998B2 (en) | 2013-07-22 | 2019-04-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US9699584B2 (en) | 2013-07-22 | 2017-07-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
US10659900B2 (en) | 2013-07-22 | 2020-05-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US10701504B2 (en) | 2013-07-22 | 2020-06-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
RU2642376C2 (ru) * | 2013-07-22 | 2018-01-24 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ обработки аудиосигнала, блок обработки сигналов, стереофонический рендерер, аудиокодер и аудиодекодер |
US10848900B2 (en) | 2013-07-22 | 2020-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method for processing an audio signal, signal processing unit, binaural renderer, audio encoder and audio decoder |
US11227616B2 (en) | 2013-07-22 | 2022-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US11330386B2 (en) | 2013-07-22 | 2022-05-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
US11337019B2 (en) | 2013-07-22 | 2022-05-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US11445323B2 (en) | 2013-07-22 | 2022-09-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method for processing an audio signal, signal processing unit, binaural renderer, audio encoder and audio decoder |
US11463831B2 (en) | 2013-07-22 | 2022-10-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US11984131B2 (en) | 2013-07-22 | 2024-05-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US11910176B2 (en) | 2013-07-22 | 2024-02-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US11910182B2 (en) | 2013-07-22 | 2024-02-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method for processing an audio signal, signal processing unit, binaural renderer, audio encoder and audio decoder |
RU2803638C2 (ru) * | 2013-07-31 | 2023-09-18 | Долби Лэборетериз Лайсенсинг Корпорейшн | Обработка пространственно диффузных или больших звуковых объектов |
RU2827903C2 (ru) * | 2015-03-13 | 2024-10-03 | Долби Интернэшнл Аб | Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе |
Also Published As
Publication number | Publication date |
---|---|
EP1866912A1 (en) | 2007-12-19 |
BRPI0608945B8 (pt) | 2020-12-01 |
KR101271069B1 (ko) | 2013-06-04 |
RU2407073C2 (ru) | 2010-12-20 |
MX2007011915A (es) | 2007-11-22 |
EP1866912B1 (en) | 2010-07-07 |
BRPI0608945B1 (pt) | 2019-05-28 |
WO2006103584A1 (en) | 2006-10-05 |
US20100153097A1 (en) | 2010-06-17 |
RU2007139918A (ru) | 2009-05-10 |
PL1866912T3 (pl) | 2011-03-31 |
DE602006015294D1 (de) | 2010-08-19 |
KR20070118161A (ko) | 2007-12-13 |
JP4610650B2 (ja) | 2011-01-12 |
BRPI0608945A2 (pt) | 2010-11-16 |
JP2008535356A (ja) | 2008-08-28 |
ATE473502T1 (de) | 2010-07-15 |
US8346564B2 (en) | 2013-01-01 |
RU2007139922A (ru) | 2009-05-10 |
BRPI0608945C8 (pt) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2411594C2 (ru) | Кодирование и декодирование аудио | |
US7840411B2 (en) | Audio encoding and decoding | |
US11343631B2 (en) | Compatible multi-channel coding/decoding | |
JP5311597B2 (ja) | マルチチャンネル・エンコーダ | |
RU2367033C2 (ru) | Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией | |
AU2005204715B2 (en) | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal | |
US7916873B2 (en) | Stereo compatible multi-channel audio coding | |
JP5284638B2 (ja) | 方法、デバイス、エンコーダ装置、デコーダ装置、及びオーディオシステム | |
TWI413108B (zh) | 音訊解碼器、接收機與傳輸系統、音訊解碼方法、用於發射及接收音訊信號之方法及相關電腦程式產品與音訊播放裝置 |