RU2376726C2 - Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио - Google Patents

Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио Download PDF

Info

Publication number
RU2376726C2
RU2376726C2 RU2007136792/09A RU2007136792A RU2376726C2 RU 2376726 C2 RU2376726 C2 RU 2376726C2 RU 2007136792/09 A RU2007136792/09 A RU 2007136792/09A RU 2007136792 A RU2007136792 A RU 2007136792A RU 2376726 C2 RU2376726 C2 RU 2376726C2
Authority
RU
Russia
Prior art keywords
channel
stereo
uncoded
channels
signal
Prior art date
Application number
RU2007136792/09A
Other languages
English (en)
Other versions
RU2007136792A (ru
Inventor
Ян ПЛОГСТИС (DE)
Ян ПЛОГСТИС
Харальд МУНДТ (DE)
Харальд МУНДТ
Харальд ПОПП (DE)
Харальд ПОПП
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2007136792A publication Critical patent/RU2007136792A/ru
Application granted granted Critical
Publication of RU2376726C2 publication Critical patent/RU2376726C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Catalysts (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Изобретение относится к технологии многоканального аудио и, в частности, к приложениям многоканального аудио в соединении с технологиями головных телефонов. Устройство для формирования закодированного стереосигнала из многоканального представления включает в себя многоканальный декодер (11), формирующий три или более множественных каналов из по меньшей мере одного основного канала и параметрической информации. Упомянутые три или более множественных канала подвергаются обработке (12) сигналов головного телефона, чтобы сформировать некодированный первый стереоканал и некодированный второй канал стерео, которые затем подают на стереокодер (13), чтобы сформировать закодированный файл стерео на стороне выхода. Закодированный файл стерео может быть подан на любое подходящее устройство воспроизведения в форме проигрывателя CD или аппаратного устройства воспроизведения так, что пользователь устройства воспроизведения не только получает нормальное впечатление стерео, но и многоканальное впечатление. Технический результат - обеспечение эффективной концепции обработки сигналов, допускающей многоканальное качественное воспроизведение на головном телефоне на простых устройствах воспроизведения. 3 н. и 8 з.п. ф-лы, 11 ил.

Description

Настоящее изобретение относится к технологии многоканального аудио и, в частности, к приложениям многоканального аудио в соединении с технологиями головных телефонов.
Международные публикации патентных заявок WO 99/49574 и WO 99/14983 раскрывают технологии обработки аудиосигнала для возбуждения пары противоположно размещаемых громкоговорителей головного телефона (наушников) для того, чтобы пользователь получил пространственное восприятие аудиосцены через эти два головных телефона, которое является не только стереопредставлением, но и многоканальным представлением. Таким образом, слушатель получит с помощью его или ее головных телефонов пространственное восприятие аудиочасти, которая в лучшем случае эквивалентна его или ее пространственному восприятию, если бы пользователь находился в зале воспроизведения, который, например, оборудован аудиосистемой 5.1. Для этой цели для каждого громкоговорителя головного телефона каждый канал части многоканального аудио или многоканального потока данных аудио, как иллюстрируется на Фиг.2, снабжен отдельным фильтром, вследствие чего соответствующие фильтрованные каналы, относящиеся друг к другу, суммируются, как будет проиллюстрировано ниже.
Слева на Фиг.2 имеются многоканальные входы 20, которые вместе представляют многоканальное представление аудиочасти или потока данных аудио. Такой сценарий, например, схематично показан на Фиг.10. Фиг.10 изображает пространство 200 воспроизведения, в котором размещается так называемая аудиосистема 5.1. Аудиосистема 5.1 включает в себя центральный громкоговоритель 201, передний левый громкоговоритель 202, передний правый громкоговоритель 203, задний левый громкоговоритель 204 и задний правый громкоговоритель 205. Аудиосистема 5.1 содержит дополнительный сабвуфер 206, который также называется как низкочастотный канал расширения. В так называемом "пятне благозвучного воспроизведения" пространства 200 воспроизведения находится слушатель 207, носящий головной телефон 208, содержащий левый громкоговоритель 209 головного телефона (наушника) и правый громкоговоритель 210 головного телефона (наушника).
Средство обработки, показанное на Фиг.2, сформировано так, чтобы фильтровать каждый канал 1, 2, 3 многоканальных входных сигналов 20 фильтром HiL, описывающим звуковой канал от громкоговорителя на левый громкоговоритель 209 на Фиг.10, и дополнительно фильтровать тот же самый канал фильтром HiR, представляющим звук от одного из этих пяти громкоговорителей к правому уху или правому громкоговорителю 210 головного телефона 208.
Если, например, канал 1 на Фиг.2 был передним левым каналом, выдаваемым громкоговорителем 202 на Фиг.10, фильтр HiL будет представлять канал, обозначенный прерывистой линией 212, в то время как фильтр HiR будет представлять канал, обозначенный прерывистой линией 213. Как в качестве примера обозначено на Фиг.10 прерывистой линией 214, левый громкоговоритель 209 головного телефона не только принимает непосредственный (излученный прямо) звук, но также и ранние отражения на границе пространства воспроизведения и, конечно, также поздние отражения, выраженные в диффузной реверберации.
Такое представление фильтра проиллюстрировано на Фиг.11. В частности, Фиг.11 изображает схематический пример импульсной характеристики фильтра, такого как, например, фильтр HiL на Фиг.2. Непосредственный или первичный звук, проиллюстрированный на Фиг.11 линией 212, представлен пиком в начале фильтра, в то время как ранние отражения, как проиллюстрировано в качестве примера на Фиг.10 позицией 214, воспроизводятся центральной областью, имеющей несколько (дискретных) маленьких пиков на Фиг.11. Диффузная реверберация обычно больше не разрешается для индивидуальных пиков, так как звук громкоговорителя 202 в принципе отражается произвольно часто, причем энергия конечно уменьшается с каждым отражением и дополнительным путем распространения, как проиллюстрировано уменьшающейся энергией в задержанной части, которая на Фиг.11 названа как "Диффузная реверберация".
Каждый фильтр, показанный на Фиг.2, таким образом включает в себя импульсную характеристику фильтра, грубо имеющую профиль (очертание), как показано схематической иллюстрацией импульсной характеристики на фиг.11. Очевидно, что импульсная характеристика отдельного фильтра будет зависеть от пространства воспроизведения, позиционирования громкоговорителей, возможных особенностей ослабления в пространстве воспроизведения, например, из-за присутствия нескольких людей или из-за мебели в пространстве воспроизведения, и в идеале - также от характеристик отдельных громкоговорителей 201-206.
Тот факт, что сигналы всех громкоговорителей налагаются друг на друга в ухе слушателя 207, иллюстрируется сумматорами 22 и 23 на Фиг.2. Таким образом, каждый канал фильтруется соответствующим фильтром для левого уха, чтобы затем просто быть суммированными сигналами, выданными фильтрами, которые предназначены для левого уха, чтобы получить выходной сигнал головного телефона для левого уха L. По аналогии суммирование сумматором 23 для правого уха или правого громкоговорителя 210 головного телефона на Фиг.10 выполняется для того, чтобы получить выходной сигнал головного телефона для правого уха, посредством наложения друг на друга всех сигналов громкоговорителя, фильтрованных соответствующим фильтром, для правого уха.
Вследствие того факта, что кроме непосредственного звука имеются также ранние отражения и, в частности, диффузная реверберация, которая имеет особенно высокую важность для пространственного восприятия, для того чтобы тон не звучал синтетическим или "неуклюжим", но давал слушателю впечатление, что он или она фактически находится в концертном зале с его акустическими характеристиками, все импульсные характеристики отдельных фильтров 21 будут иметь значительные длительности. Свертка каждого отдельного множественного канала многоканального представления, имеющего два фильтра, уже приводит к значительной вычислительной задаче. Так как два фильтра требуются для каждого отдельного множественного канала, а именно один для левого уха и другой для правого уха, когда канал сабвуфера также обрабатывается отдельно, для воспроизведения многоканального представления 5.1 посредством головного телефона требуется общее количество из 12 полностью отличных фильтров. Все фильтры имеют, как становится очевидным из Фиг.11, очень длинную импульсную характеристику, чтобы быть способными не только рассматривать непосредственный звук, но также и ранние отражения и диффузную реверберацию, которая реально только придает аудиочасти правильное воспроизведение звука и хорошее пространственное впечатление.
Чтобы реализовать эту известную концепцию на практике, кроме устройства 220 многоканального воспроизведения, как показано на Фиг.10, требуется очень сложный блок 222 обработки виртуального звука, который обеспечивает сигналы для этих двух громкоговорителей 209 и 210, представленные линиями 224 и 226 на Фиг.10.
Системы головных телефонов для формирования многоканального звука головного телефона являются сложными, большими и дорогими, что является следствием высокой вычислительной мощности, высоких текущих требований для высокой вычислительной требуемой мощности и высоких требований к рабочей памяти для оценок импульсной характеристики, которые должны быть выполнены, и большого количества или дорогих элементов для устройства воспроизведения, подсоединенных к нему. Применения этого вида таким образом привязаны к звуковым платам домашнего персонального компьютера, или звуковым платам портативных компьютеров, или домашним стереосистемам.
В частности, многоканальный звук головного телефона остается недоступным для непрерывно увеличивающегося рынка мобильных проигрывателей, таких как, например, мобильные проигрыватели CD или, в частности, аппаратные устройства воспроизведения, так как требования к вычислениям для фильтрации множественных каналов, например, с 12 различными фильтрами не могут быть реализованы в этом ценовом сегменте ни в отношении ресурсов процессора, ни в отношении текущих требований к обычным устройствам с батарейным питанием. Это относится к ценовому сегменту в основании (нижнем конце) ценовой шкалы.
Однако этот сам ценовой сегмент экономически является очень интересным из-за большого количества компонентов.
Задача настоящего изобретения состоит в том, чтобы обеспечить эффективную концепцию обработки сигналов, допускающую многоканальное качественное воспроизведение на головном телефоне на простых устройствах воспроизведения.
Эта задача решается устройством для формирования закодированного стереосигнала согласно пункту 1 формулы изобретения, или способом для формирования закодированного стереосигнала согласно пункту 11 формулы изобретения, или компьютерной программой согласно пункту 12 формулы изобретения.
Настоящее изобретение основано на обнаружении того факта, что высококачественный и привлекательный многоканальный звук головного телефона (наушника) может быть сделан доступным всем доступным проигрывателям, таким как, например, проигрыватели CD или аппаратные устройства воспроизведения, подвергая многоканальное представление аудиочасти или потока данных аудио, то есть, например, представления 5.1 аудиочасти, обработке сигналов головного телефона вне аппаратного устройства воспроизведения, то есть, например, в компьютере поставщика, имеющем большую вычислительную мощность. Согласно изобретению результат обработки сигналов головного телефона, однако, не просто воспроизводится, но подается на обычный стереокодер аудио, который затем формирует закодированный стереосигнал из левого канала головного телефона и правого канала головного телефона.
Этот кодированный стереосигнал может быть затем, подобно любому другому закодированному стереосигналу, не содержащему многоканальное представление, подан на аппаратное устройство воспроизведения или, например, мобильный проигрыватель CD в форме CD. Устройство воспроизведения или проигрывания затем обеспечит пользователя многоканальным звуком головного телефона без каких-либо дополнительных ресурсов или средств, которые должны быть добавлены к устройствам, уже существующим. Что является изобретенным, результат обработки сигналов головного телефона, то есть сигнал левого и правого головного телефона (наушника), не воспроизводится в головном телефоне, как это имеет место согласно уровню техники, а кодируется и выводится в качестве закодированных стереоданных.
Такие выходные данные могут быть сохранены, переданы и т.п. Такой файл, имеющий закодированные стереоданные, может затем легко быть подан на любое устройство воспроизведения, предназначенное для воспроизведения стерео, без необходимости для пользователя выполнять какие-либо изменения на своем устройстве.
Изобретательная концепция формирования закодированного стереосигнала на основе результата обработки сигналов головного телефона, таким образом, допускает многоканальное представление, обеспечивающее значительно улучшенное и более реальное качество для пользователя, которое также должно использоваться на всех простых и широко распространенных и в будущем даже более широко распространенных аппаратных устройствах воспроизведения.
В предпочтительном варианте осуществления настоящего изобретения отправной точкой является закодированное многоканальное представление, то есть параметрическое представление, содержащее один или обычно два основных канала и дополнительно содержащее параметрические данные, чтобы сформировать множественные каналы многоканального представления на основе основных каналов и упомянутых параметрических данных. Так как основанный на частотной области способ для многоканального декодирования является предпочтительным, обработка сигналов головного телефона согласно изобретению не выполняется во временной области посредством свертки временного сигнала с импульсной характеристикой, а выполняется в частотной области посредством умножения на функцию передачи фильтра.
Это допускает возможность сэкономить на, по меньшей мере, одном повторном преобразовании перед обработкой сигналов головного телефона и имеет то специфическое преимущество, когда последующий стереокодер также работает в частотной области, так что стереокодирование стереосигнала головного телефона без какой-либо необходимости перехода к временной области может также иметь место без перехода к временной области. Обработка из многоканального представления в закодированный стереосигнал без использования временной области или по меньшей мере уменьшенное количество преобразований является интересной не только в отношении эффективности времени вычислений, но и задает предел потерям качества, так как меньшее количество этапов обработки вводит меньшее количество артефактов в аудиосигнал.
В частности, в основанных на блочной обработке способах, выполняющих квантование, рассматривая психоакустический порог маскирования, что является предпочтительным для стереокодера, важно предотвратить как можно больше тандемных артефактов кодирования, насколько это возможно.
В особенно предпочтительном варианте осуществления настоящего изобретения представление BCC, имеющее один или, предпочтительно, два основных канала, используется в качестве многоканального представления. Так как способ BCC работает в частотной области, множественные каналы не преобразуются во временную область после синтеза, как обычно делается в декодере BCC. Вместо этого спектральное представление множественных каналов в форме блоков используется и подвергается обработке сигналов головного телефона. Для этого используются функции преобразования фильтров, то есть преобразования Фурье импульсных характеристик, чтобы выполнить умножение спектрального представления множественных каналов на функции преобразования фильтров. Когда импульсные характеристики фильтров во времени являются более длинными, чем блок спектральных компонентов на выходе декодера BCC, предпочтительной является блочная обработка фильтра, когда импульсные характеристики фильтров отделяются во временной области и преобразуются блок за блоком, чтобы затем выполнить соответствующие взвешивания спектра, требуемые для метрик этого вида, как, например, раскрыто в публикации WO 94/01933.
Предпочтительные варианты осуществления настоящего изобретения подробно описаны ниже со ссылками на прилагаемые чертежи, на которых:
Фиг.1 показывает блок-схему предлагаемого устройства для формирования закодированного стереосигнала;
Фиг.2 является подробной иллюстрацией реализации обработки сигналов головного телефона согласно Фиг.1;
Фиг.3 показывает известный кодер объединенного стерео для формирования данных канала и параметрической многоканальной информации;
Фиг.4 является иллюстрацией схемы определения параметров ICLD, ICTD и ICC для кодирования/декодирования BCC;
Фиг.5 является иллюстрацией блок-схемы цепочки кодер/декодер BCC;
Фиг.6 изображает блок-схему реализации блока синтеза BCC согласно Фиг.5;
Фиг.7 изображает каскадирование между многоканальным декодером и блоком обработки сигналов головного телефона без какого-либо преобразования к временной области;
Фиг.8 изображает каскадирование между блоком обработки сигналов головного телефона и стереокодером без какого-либо преобразования к временной области;
Фиг.9 изображает принципиальную блок-схему предпочтительного стереокодера;
Фиг.10 является принципиальной иллюстрацией сценария воспроизведения для определения функций фильтра согласно Фиг.2, и
Фиг.11 является принципиальной иллюстрацией ожидаемой импульсной характеристики фильтра, определенного согласно Фиг.10.
Фиг.1 показывает принципиальную блочную диаграмму предлагаемого устройства для формирования закодированного стереосигнала аудиочасти или потока данных аудио. Стереосигнал включает в себя, в некодированной форме, некодированный первый стереоканал 10a и некодированный второй стереоканал 10b и является сформированным из многоканального представления аудиочасти или потока данных аудио, при этом многоканальное представление содержит информацию относительно более чем двух множественных каналов. Как описано ниже, многоканальное представление может быть в некодированной или закодированной форме. Если многоканальное представление находится в некодированной форме, оно будет включать в себя три или более множественных каналов. В предпочтительном сценарии применения многоканальное представление включает в себя пять каналов и один канал сабвуфера.
Если многоканальное представление представлено, однако, в закодированной форме, эта закодированная форма будет обычно включать в себя один или несколько основных каналов, а также параметры для синтеза трех или более множественных каналов из одного или двух основных каналов. Многоканальный декодер 11, таким образом, является примером средства для обеспечения более чем двух множественных каналов из многоканального представления. Если многоканальное представление находится, однако, уже в некодированной форме, то есть, например, в форме 5+1 каналов ИКМ, это средство для обеспечения соответствует входному терминалу для средства 12 для выполнения обработки сигналов головного телефона, чтобы сформировать некодированный стереосигнал с некодированным первым стереоканалом 10a и некодированным вторым стереоканалом 10b.
Предпочтительно средство 12 для выполнения обработки сигналов головного телефона сформировано так, чтобы оценивать каждый множественный канал многоканального представления посредством первой функции фильтра для первого стереоканала и второй функции фильтра для второго стереоканала и суммировать соответствующие оцененные множественные каналы, чтобы получить некодированный первый стереоканал и некодированный второй канал стерео, как иллюстрируется со ссылками на Фиг.2. Следующим после средства 12 для выполнения обработки сигналов головного телефона является стереокодер 13, который сформирован так, чтобы кодировать первый некодированный стереоканал 10a и второй некодированный стереоканал 10b, чтобы получить закодированный стереосигнал на выходе 14 стереокодера 13. Стереокодер выполняет снижение скорости передачи данных, так что скорость передачи данных, требуемая для передачи закодированного стереосигнала, является меньшей, чем скорость передачи данных, требуемая для передачи некодированного стереосигнала.
Согласно изобретению достигается концепция, которая позволяет выдавать многоканальный тональный сигнал, который также назван как "окружающий" (surround), на стереоголовные телефоны (наушники) с помощью простых проигрывателей, таких как, например, аппаратные устройства воспроизведения.
Сумма некоторых каналов может в качестве примера быть сформирована как простая обработка сигналов головного телефона, чтобы получить выходные каналы для стереоданных. Усовершенствованные способы работают с более сложными алгоритмами, которые, в свою очередь, дают улучшенное качество воспроизведения.
Должно быть упомянуто, что изобретательная концепция позволяет не выполнять этапы интенсивных вычислений для многоканального декодирования и для выполнения обработки сигналов головного телефона непосредственно в устройстве воспроизведения, но выполнять внешним образом. Результатом изобретательной концепции является закодированный файл стерео, который является, например, MP3 файлом, AAC файлом, HE-AAC файлом или некоторым другим стереофайлом.
В других вариантах осуществления многоканальное декодирование, обработка сигналов головного телефона и кодирование стерео (сигнала) могут быть выполнены в различных устройствах, так как выходные данные и входные данные соответственно отдельных блоков могут быть легко перенесены и сформированы и сохранены стандартизированным способом.
Ниже ссылка делается на Фиг.7, иллюстрирующую предпочтительный вариант осуществления настоящего изобретения, где многоканальный декодер 11 содержит набор фильтров или функцию FFT (быстрого преобразования Фурье), так что обеспечивается многоканальное представление в частотной области. В частности, отдельные множественные каналы формируются как блоки спектральных значений для каждого канала. Изобретенным является то, что обработка сигналов головного телефона не выполняется во временной области посредством свертки временных каналов с импульсными характеристиками фильтра, но выполняется перемножение представления в частотной области множественных каналов на спектральное представление импульсной характеристики фильтра. Некодированный стереосигнал получают на выходе (блока) обработки сигналов головного телефона, который, однако, представлен не во временной области, а включает в себя левый и правый каналы стерео, при этом такой стереоканал задается как последовательность блоков спектральных значений, причем каждый блок спектральных значений представляет кратковременный спектр стереоканала.
В варианте осуществления, показанном на Фиг.8, на вход блока 12 обработки сигналов головного телефона подаются данные или временной области, или частотной области. На стороне выхода некодированные каналы стерео формируются в частотной области, то есть снова в виде последовательности блоков спектральных значений. Стереокодер, который основан на преобразовании, то есть который обрабатывает спектральные значения без преобразования частота/время и последующего преобразования время/частота, необходим между блоком 12 обработки сигналов головного телефона и стереокодером 13, предпочтительно в качестве стереокодера 13 в этом случае. На стороне выхода стереокодер 13 затем выдает файл с закодированным сигналом стерео, который кроме дополнительной информации включает в себя закодированную форму спектральных значений.
В особенно предпочтительном варианте осуществления настоящего изобретения обработка в непрерывной частотной области выполняется на пути от многоканального представления на входе блока согласно Фиг.1 до закодированного стереофайла на выходе 14 из средства на Фиг.1 без преобразования во временную область и, возможно, обратного преобразования в частотную область, если в этом имеется необходимость. Когда кодер MP3 или кодер AAC используются в качестве стереокодера, будет предпочтительно преобразовать спектр Фурье на выходе блока обработки сигналов головного телефона к MDCT (модифицированное косинусное преобразование) спектру. Таким образом, согласно изобретению обеспечивается, что информация фазы, требуемая в точной форме для свертки/оценки каналов в блоке обработки сигналов головного телефона, преобразуется к MDCT представлению, не работающему в таком фазово-корректном способе, так что средство для преобразования из временной области в частотную область, то есть к MDCT спектру, не требуется для стереокодера в отличие от обычного MP3-кодера или обычного AAC-кодера.
Фиг.9 изображает общую блок-схему предпочтительного стереокодера. Стереокодер включает в себя, со стороны входа, модуль 15 объединенного стерео, который предпочтительно определяет адаптивным способом, обеспечивает ли обычное стереокодирование, например, в форме кодирования центрального/боковых каналов, более высокое усиление, чем отдельная обработка левых и правых каналов. Модуль 15 объединенного стерео может быть также сформирован так, чтобы выполнить стереокодирование интенсивности, в котором стереокодирование интенсивности, в частности, с верхними частотами, обеспечивает значительное усиление без возникновения слышимых артефактов. Выводной сигнал модуля 15 объединенного стерео затем обрабатывается, дополнительно используя различные другие сокращающие избыточность меры, такие как, например, TNS фильтрование, замещение шума и т.д., чтобы затем подать результаты на квантователь 16, который выполняет квантование спектральных значений, используя психоакустический порог маскирования. Размер шага квантователя здесь выбирают таким, что шум, введенный квантованием, остается ниже психоакустического порога маскирования, так что сокращение скорости передачи данных достигается без искажений, введенных квантованием с потерями, чтобы быть слышимыми. После квантователя 16 имеется статистический кодер 17, выполняющий статистическое кодирование без потерь квантованных спектральных значений. На выходе статистического кодера имеется закодированный стереосигнал, который кроме статистически кодированных спектральных значений включает в себя дополнительную информацию, требуемую для декодирования.
Ниже ссылка делается на предпочтительные варианты реализации многоканального декодера и на предпочтительные иллюстрации множественных каналов, используя Фиг.3-6.
Имеется несколько способов для сокращения количества данных, требуемых для передачи многоканального аудиосигнала. Такие способы также называются способами объединенного стерео. Для этой цели ссылка делается на Фиг.3, иллюстрирующую устройство 60 объединенного стерео. Это устройство может быть устройством, реализующим, например, методику стереоинтенсивности (IS) или методику кодирования бинаурального (стерео) сигнала (BCC). Такое устройство обычно принимает по меньшей мере два канала CH1, CH2, …, CHn в качестве входного сигнала и выдает единственный канал-носитель и параметрическую многоканальную информацию. Параметрические данные определены так, чтобы аппроксимация первоначального канала (CH1, CH2, …, CHn) могла быть вычислена в декодере.
Обычно канал-носитель будет включать в себя выборки поддиапазона, спектральные коэффициенты, выборки во временной области и т.д., которые обеспечивают относительно точное представление основного сигнала, в то время как параметрические данные не включают в себя такие выборки или спектральные коэффициенты, но управляют параметрами для управления некоторым алгоритмом восстановления, таким как, например, взвешивание перемножением, смещение во времени, смещение по частоте и т.д. Параметрическая многоканальная информация таким образом включает в себя относительно грубое представление сигнала или связанного канала. Выражая в числах, количество данных, требуемых каналом-носителем, находится в диапазоне от 60 до 70 кбит/сек, в то время как количество данных, требуемых параметрической дополнительной информацией для канала, находится в диапазоне от 1,5 до 2,5 кбит/сек. Должно быть упомянуто, что вышеупомянутые числа относятся к сжатым данным. Несжатый канал CD конечно требует приблизительно десятикратных скоростей передачи данных. Примером параметрических данных являются известные масштабные коэффициенты, информация стереоинтенсивности или параметры BCC, как описано ниже.
Методика кодирования интенсивности стерео описана в AES Preprint 3799 "Intensity Stereo Coding" J. Herre, K.H. Brandenburg, D. Lederer, февраль 1994, Амстердам. Вообще концепция стереоинтенсивности основана на преобразовании основной оси, которая должна применяться к данным от двух стереофонических аудиоканалов. Если большинство точек данных сконцентрировано вокруг первой основной оси, усиление кодирования может быть достигнуто посредством вращения обоих сигналов на некоторый угол прежде, чем кодирование будет иметь место. Однако это не всегда относится к способам воспроизведения реального стерео. Таким образом, эта методика модифицируется в том, что второй ортогональный компонент исключается из передачи в потоке битов. Таким образом, восстановленные сигналы для левого и правого каналов состоят из различным образом взвешенных или масштабированных версий одного и того же переданного сигнала. Тем не менее, восстановленные сигналы отличаются по амплитуде, но они идентичны относительно их фазовой информации. Огибающие времени энергии обоих первоначальных аудиоканалов, однако, поддерживается посредством избирательной операции масштабирования, обычно работающей частотно-избирательным способом. Это соответствует человеческому восприятию звука на высоких частотах, где доминирующая пространственная информация определяется огибающими энергии.
Кроме того, при практической реализации переданный сигнал, то есть канал-носитель, формируется из суммарного сигнала левого канала и правого канала вместо вращения обоих компонентов. Дополнительно эта обработка, то есть формирование параметров стереоинтенсивности для выполнения операций масштабирования, выполняется частотно-избирательным способом, то есть независимо для каждого диапазона масштабного коэффициента, то есть для каждого сегмента частоты кодера. Предпочтительно, оба канала объединяются, чтобы сформировать объединенный или канал "носитель" и, в дополнение к объединенному каналу, информацию стереоинтенсивности. Информация стереоинтенсивности зависит от энергии первого канала, энергии второго канала или энергии объединенного канала.
Методика BCC описана в AES Convention Paper 5574 "Binaural Cue Coding applied to stereo and multichannel audio compression" T. Faller, F. Baumgarte, May 2002, Мюнхен. При BCC кодировании множество входных каналов аудио преобразовывают в спектральное представление, используя основанное на DFT (дискретное преобразование Фурье) преобразование с перекрывающимися окнами. Результирующий спектр разделяется на не перекрывающиеся части (сегменты), из которых каждая имеет индекс. Каждый сегмент имеет ширину полосы, которая является пропорциональной, эквивалентной прямоугольной ширине полосы частот (ERB). Межканальные разности уровней (ICLD) и межканальные разности во времени (ICTD) определяются для каждого сегмента и для каждого кадра k. ICLD и ICTD квантуются и кодируются, чтобы в конечном итоге получить поток битов BCC в качестве дополнительной информации. Межканальные разности уровней и межканальные разности во времени задаются для каждого канала по отношению к опорному (эталонному) каналу. Затем параметры вычисляют согласно заранее определенным формулам в зависимости от конкретных сегментов сигнала, который должен быть обработан.
На стороне декодера декодер обычно принимает моносигнал и поток битов BCC. Моносигнал преобразуется в частотную область и подается в блок пространственного синтеза, который также принимает декодированные значения ICLD и ICTD. В блоке пространственного синтеза параметры BCC (ICLD и ICTD) используются, чтобы выполнить операцию взвешивания моносигнала, синтезировать многоканальные сигналы, которые после преобразования частота/время представляют реконструкцию первоначального многоканального аудиосигнала.
В случае BCC модуль 60 объединенного стерео работает для вывода информации дополнительного канала, так что параметрические канальные данные являются квантованными и кодированными параметрами ICLD или ICTD, причем один из первоначальных каналов используется как опорный канал для кодирования информации дополнительного канала.
Обычно сигнал-носитель формируют из суммы участвующих первоначальных каналов.
Вышеупомянутые способы, конечно, только обеспечивают монофоническое представление для декодера, который может только обрабатывать канал-носитель, но который не способен обработать параметрические данные для формирования одного или нескольких приближений более чем одного входного канала.
Методика BCC также описана в публикациях патентных заявок США US 2003/0219130 A1, US 2003/0026441 A1 и US 2003/0035553 A1. Дополнительно ссылка может быть сделана на экспертную публикацию "Binaural Cue Coding. Part II Schemes and Applications" T. Faller и F. Baumgarte, IEEE Trans. On Audio and Speech Proc., Vol. 11, № 6, ноябрь 2003.
Ниже обычная схема BCC многоканального аудиокодирования проиллюстрирована более подробно со ссылками на Фиг.4-6.
Фиг.5 изображает такую схему BCC для кодирования/передачи многоканальных аудиосигналов. Входной сигнал многоканального аудио на входе 110 кодера BCC 112 смешивается с уменьшением числа каналов в так называемом блоке 114 смешения с уменьшением. В этом примере первоначальный многоканальный сигнал во входе 110 является 5-канальным сигналом окружающего (surround) звука, имеющим передний левый канал, передний правый канал, левый канал окружающего звука, правый канал окружающего звука и центральный канал. В предпочтительном варианте осуществления настоящего изобретения блок смешения с уменьшением формирует суммарный сигнал посредством простого добавления этих пяти каналов в один моносигнал.
Другие схемы смешения с уменьшением известны в области техники, так что, используя многоканальный входной сигнал, получают канал смешения с уменьшением, имеющий единственный канал.
Этот единственный канал выводится на линию 115 суммарного сигнала. Дополнительная информация, полученная из блока анализа BCC, выводится на линию 117 дополнительной информации.
Межканальные разности уровней (ICLD) и межканальные разности во времени (ICTD) вычисляются в блоке анализа BCC, как было проиллюстрировано выше. Теперь блок 116 анализа BCC также способен вычислить значения межканальной корреляции (значения ICC). Суммарный сигнал и дополнительная информация передаются к декодеру 120 BCC в квантованном и закодированном формате. Декодер BCC разделяет переданный суммарный сигнал на множество поддиапазонов и выполняет масштабирование, вводит задержки и дальнейшие этапы обработки, чтобы обеспечить поддиапазоны многоканальных аудиоканалов, которые нужно вывести. Эта обработка выполняется так, что параметры (сигналы) ICLD, ICTD и ICC восстановленного многоканального сигнала на выходе 121 совпадают с соответствующими сигналами для первоначального многоканального сигнала на входе 110 в кодере BCC 112. Для этой цели декодер BCC 120 включает в себя блок синтеза BCC и блок обработки дополнительных данных.
Ниже внутренняя установка блока синтеза BCC иллюстрируется со ссылками на Фиг.6. Суммарный сигнал на линии 115 подается в модуль преобразования время/частота или блок 125 фильтров FB (БФ). На выходе блока 125 имеется количество N сигналов поддиапазонов или, в крайнем случае, блок спектральных коэффициентов, когда блок 125 аудиофильтров выполняет преобразование 1:1, то есть преобразование, формирующее N спектральных коэффициентов из N выборок временной области.
Блок 122 синтеза BCC также включает в себя каскад 126 задержки, каскад 127 модификации уровня, каскад 128 обработки корреляции 128 и каскад 129 инверсных фильтров IFB (КИФ). На выходе каскада 129 восстановленный многоканальный аудиосигнал, имеющий, например, пять каналов в случае 5-канальной системы окружающего звука, может быть выведен на набор 124 громкоговорителей, как проиллюстрировано на Фиг.5 или Фиг.4.
Входной сигнал sn преобразуется в частотную область или область блока фильтров посредством элемента 125. Сигнал, выданный элементом 125, копируется так, что получают несколько версий одного и того же сигнала, как иллюстрируется узлом 130 копирования. Количество версий исходного сигнала равняется количеству выходных каналов в выходном сигнале. Затем каждая версия исходного сигнала в узле 130 подвергается некоторой задержке d1, d2, …, di, …, dN. Параметры задержки вычисляются блоком 123 обработки дополнительных данных на Фиг.5 и получаются из межканальных разностей во времени, когда они были вычислены блоком 116 анализа BCC согласно Фиг.5.
То же самое применяется к параметрам a1, a2, …, ai, …, aN умножения, которые также вычисляются блоком 123 обработки дополнительной информации на основании межканальных разностей уровней, когда они были вычислены блоком 116 анализа BCC.
Параметры ICC, вычисленные блоком 116 анализа BCC, используются для управления функциональными возможностями блока 128 так, чтобы некоторые корреляции между задержанными сигналами и сигналами с управляемым уровнем были получены на выводах блока 128. Должно быть отмечено, что последовательность этапов 126, 127, 128 может отличаться от последовательности, показанной на Фиг.6.
Должно быть также отмечено, что в основанной на кадре обработке аудиосигнала анализ BCC также выполняют основанным на кадре, то есть изменяемым во времени, и что дополнительный основанный на частоте анализ BCC получают, как может быть замечено, делением блока фильтров на Фиг.6. Это означает, что параметры BCC получают для каждого спектрального диапазона. Это также означает, что в случае, когда блок 125 аудиофильтров разбивает входной сигнал на, например, 32 сигнала диапазонов, блок анализа BCC получает набор параметров BCC для каждого из этих 32 диапазонов. Конечно, блок 122 синтеза BCC согласно Фиг.5, который проиллюстрирован более подробно на Фиг.6, также выполняет восстановление, которое также является основанным, в качестве примера, на упомянутых 32 диапазонах.
Ниже сценарий, используемый для определения индивидуальных параметров BCC, проиллюстрирован со ссылками на Фиг.4. Обычно параметры ICLD, ICTD и ICC могут быть определены между парами каналов. Однако предпочтительно, чтобы параметры ICLD и ICTD были определены между опорным каналом и каждым другим каналом. Это иллюстрируется на Фиг.4A.
Параметры ICC могут быть определены различными способами. Обычно параметры ICC могут быть определены в кодере между всеми возможными парами каналов, как иллюстрируется на Фиг.4B. Имелось предложение вычислять только параметры ICC между двумя самыми сильными каналами в любой момент времени, как иллюстрируется на Фиг.4C, который показывает пример, в котором вычисляется в любой момент времени параметр ICC между каналами 1 и 2 и в другой момент времени вычисляется параметр ICC между каналами 1 и 5. Декодер затем синтезирует межканальную корреляцию между самыми сильными каналами в декодере и использует некоторые эвристические правила для вычисления и синтезирования межканальной когерентности для оставшихся пар каналов.
Относительно вычисления, например, параметров ai умножения на основании переданных параметров ICLD ссылка делается к AES Convention Paper № 5574. Параметры ICLD представляют распределение энергии первоначального многоканального сигнала. Без потери общности, предпочтительно, как показывается на Фиг.4A, брать 4 параметра ICLD, представляющие разности энергии между соответствующими каналами и передним левым каналом. В блоке 122 обработки дополнительной информации параметры ai, …, aN умножения получают из параметров ICLD так, чтобы полная энергия всех восстановленных выходных каналов была одной и той же (или пропорциональной энергии переданного суммарного сигнала).
В варианте осуществления, показанном на Фиг.7, обходятся без преобразования частота/время, полученного блоками 129 инверсных фильтров IFB на Фиг.6. Вместо этого используются спектральные представления отдельных каналов на входе этих блоков обратных фильтров и подаются на устройство обработки сигналов головного телефона согласно Фиг.7, чтобы выполнить оценку отдельных множественных каналов с соответствующими двумя фильтрами в расчете на множественный канал без дополнительного преобразования частота/время.
В отношении полной обработки, имеющей место в частотной области, должно быть отмечено, что в этом случае многоканальный декодер, то есть, например, блок 125 фильтров, согласно Фиг.6, и стереокодер должны иметь одну и ту же разрешающую способность время/частота. Дополнительно, предпочтительно использовать один и тот же блок фильтров, который имеет, в частности, преимущество в том, что только единственный блок фильтров требуется для полной обработки, как иллюстрируется на Фиг.1. В этом случае результатом является особенно эффективная обработка, так как преобразования в многоканальном декодере и кодере стерео не должны быть вычислены.
Входные данные и выходные данные, соответственно, в изобретательной концепции являются, таким образом, предпочтительно закодированными в частотной области посредством банка преобразования/фильтра и закодированными согласно психоакустическим рекомендациям, используя эффекты маскирования, при этом, в частности, в декодере должно иметься спектральное представление сигналов. Примерами этого являются MP3 файлы, AAC файлы или AC3 файлы. Однако входные данные и выходные данные, соответственно, могут также быть закодированы, формируя сумму и разность, как имеет место в так называемых матричных процессах. Примерами этого являются Dolby ProLogic, LogicV или Circle Surround. Данные, в частности, многоканального представления могут быть дополнительно закодированы посредством параметрических способов, как имеет место в окружающем звуке MP3, в котором этот способ основан на методике BCC.
В зависимости от обстоятельств изобретательный способ для формирования может быть осуществлен в виде или аппаратного, или программного обеспечения. Реализация может быть на цифровом носителе данных, в частности, на диске или CD, имеющем сигналы управления, которые могут быть считаны с помощью электроники, что может быть выполнено совместно с программируемой компьютерной системой так, что способ будет выполнен. В целом изобретение также заключается в компьютерном программном продукте, имеющем программный код, сохраненный на машиночитаемом носителе для выполнения изобретательного способа, когда компьютерный программный продукт выполняется на компьютере. С другой стороны, изобретение может также быть реализовано в виде компьютерной программы, имеющей программный код для выполнения способа, когда компьютерная программа выполняется на компьютере.

Claims (11)

1. Устройство для формирования кодированного стереосигнала аудиочасти или потока данных аудио, имеющего первый стереоканал и второй стереоканал из многоканального представления аудиочасти или потока данных аудио, содержащего информацию относительно более двух множественных каналов, содержащее:
средство (11) для формирования, по меньшей мере, трех множественных каналов на основе одного или нескольких основных каналов и параметрической информации из многоканального представления аудиочасти или потока данных аудио, содержащего один или несколько основных каналов, а также параметрическую информацию;
средство (12) для выполнения обработки сигналов головного телефона для формирования некодированного стереосигнала с некодированным первым стереоканалом (10а) и некодированным вторым стереоканалом (10b), причем средство (12) для выполнения сформировано для того, чтобы
оценивать каждый множественный канал посредством первой функции фильтра (НiL), полученной из виртуальной позиции громкоговорителя для воспроизведения этого множественного канала и виртуальной позиции первого уха слушателя, для первого канала стерео и второй функции фильтра (HiR), полученной из виртуальной позиции громкоговорителя и виртуальной позиции второго уха слушателя, для второго канала стерео, чтобы сформировать первый оцененный канал и второй оцененный канал для каждого множественного канала, причем две виртуальные позиции уха слушателя являются различными,
суммировать (22) оцененные первые каналы, чтобы получить некодированный первый стереоканал (10а), и
суммировать (23) оцененные вторые каналы, чтобы получить некодированный второй стереоканал (10b); и
стерео кодер (13) для кодирования некодированного первого стереоканала (10а) и некодированного второго стереоканала (10b), чтобы получить закодированный стереосигнал (14), причем стереокодер сформирован так, что скорость передачи данных, требуемая для передачи закодированного стереосигнала, является меньшей, чем скорость передачи данных, требуемая для передачи некодированного стереосигнала.
2. Устройство по п.1, в котором средство (12) для выполнения сформировано для того, чтобы использовать первую функцию фильтра (НiL,), рассматривающую непосредственный звук, отражения и диффузную реверберацию, и вторую функцию фильтра (HiR), рассматривающую непосредственный звук, отражения и диффузную реверберацию.
3. Устройство по п.2, в котором первая и вторая функции фильтра соответствуют импульсной характеристике фильтра, содержащей пик при малом значении времени, представляющий непосредственный звук, несколько меньших пиков при средних значениях времени, представляющих отражения, и непрерывную область, больше не разрешенную для отдельных пиков и представляющую диффузную реверберацию.
4. Устройство по п.1, в котором средство (11) для формирования сконфигурировано, чтобы сформировать на стороне выхода блочное представление в частотной области для каждого множественного канала, и
в котором средство (12) для выполнения сформировано для оценки блочного представления в частотной области посредством представления в частотной области первой и второй функций фильтра.
5. Устройство по п.1, в котором средство (12) для выполнения сконфигурировано, чтобы сформировать блочное представление в частотной области некодированного первого стереоканала и некодированного второго канала стерео, и
в котором стерео кодер (13) является основанным на преобразовании кодером и также сформирован, чтобы обработать блочное представление в частотной области некодированного первого стереоканала и некодированного второго стереоканала без преобразования из представления в частотной области во временное представление.
6. Устройство по п.1, в котором стереокодер (13) сформирован так, чтобы выполнять обычное стерео кодирование (15) первого и второго каналов стерео.
7. Устройство по п.1, в котором стереокодер (13) сформирован так, чтобы квантовать (16) блок спектральных значений, используя психоакустический порог маскирования, и подвергать его статистическому кодированию (17), чтобы получить закодированный стереосигнал.
8. Устройство по п.1, в котором средство (11) для формирования сконфигурировано как декодер ВСС.
9. Устройство по п.1, в котором средство (11) для формирования сконфигурировано как многоканальный декодер, содержащий блок фильтров, имеющий несколько выходов,
при этом средство (12) для выполнения сформировано так, чтобы оценить сигналы на выходах блока фильтров первой и второй функциями фильтра, и
при этом стереокодер (13) сформирован так, чтобы квантовать (16) некодированный первый стереоканал в частотной области и некодированный второй канал стерео в частотной области и подвергать его статистическому кодированию (17), чтобы получить закодированный стереосигнал.
10. Способ формирования закодированного стереосигнала аудиочасти или потока данных аудио, имеющего первый стереоканал и второй стереоканал, из многоканального представления аудиочасти или потока данных аудио, содержащего информацию относительно более двух множественных каналов, содержащий этапы:
формируют (11), по меньшей мере, три множественных канала на основе одного или нескольких основных каналов и параметрической информации из многоканального представления аудиочасти или потока данных аудио, содержащего один или несколько основных каналов, а также параметрическую информацию;
выполняют (12) обработку сигналов головного телефона, чтобы сформировать некодированный стереосигнал с некодированным первым стереоканалом (10а) и некодированным вторым стереоканалом (10b), при этом этап выполнения (12) содержит этапы:
оценивают каждый множественный канал первой функцией фильтра (HiL), полученной из виртуальной позиции громкоговорителя для воспроизведения множественного канала и виртуальной позиции первого уха слушателя, для первого канала стерео и второй функцией фильтра (НiR), полученной из виртуальной позиции громкоговорителя и виртуальной позиции второго уха слушателя, для второго канала стерео, чтобы сформировать первый оцененный канал и второй оцененный канал для каждого множественного канала, причем две виртуальные позиции уха слушателя являются отличающимися,
суммируют (22) оцененные первые каналы для получения некодированного первого стереоканала (10а), и
суммируют (23) оцененные вторые каналы, чтобы получить некодированный второй стереоканал (10b); и
выполняют стерео кодирование (13) некодированного первого стереоканала (10а) и некодированного второго стереоканала (10b), чтобы получить закодированный стереосигнал (14), при этом этап стереокодирования выполняется так, что скорость передачи данных, требуемая для передачи закодированного стереосигнала, является меньшей, чем скорость передачи данных, требуемая для передачи некодированного стереосигнала.
11. Машиночитаемый носитель информации, содержащий программируемый код, сохраненный на машиночитаемом носителе и исполняемый компьютером, и предназначенный для выполнения действий согласно способу по п.10.
RU2007136792/09A 2005-03-04 2006-02-22 Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио RU2376726C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005010057A DE102005010057A1 (de) 2005-03-04 2005-03-04 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
DE102005010057.0 2005-03-04

Publications (2)

Publication Number Publication Date
RU2007136792A RU2007136792A (ru) 2009-04-10
RU2376726C2 true RU2376726C2 (ru) 2009-12-20

Family

ID=36649539

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007136792/09A RU2376726C2 (ru) 2005-03-04 2006-02-22 Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио

Country Status (20)

Country Link
US (1) US8553895B2 (ru)
EP (2) EP2094031A3 (ru)
JP (1) JP4987736B2 (ru)
KR (1) KR100928311B1 (ru)
CN (1) CN101133680B (ru)
AT (1) ATE461591T1 (ru)
AU (1) AU2006222285B2 (ru)
BR (1) BRPI0608036B1 (ru)
CA (1) CA2599969C (ru)
DE (2) DE102005010057A1 (ru)
ES (1) ES2340796T3 (ru)
HK (1) HK1111855A1 (ru)
IL (1) IL185452A (ru)
MX (1) MX2007010636A (ru)
MY (1) MY140741A (ru)
NO (1) NO339958B1 (ru)
PL (1) PL1854334T3 (ru)
RU (1) RU2376726C2 (ru)
TW (1) TWI322630B (ru)
WO (1) WO2006094635A1 (ru)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2610416C2 (ru) * 2012-01-17 2017-02-10 Гибсон Инновейшенс Бельгиум Н.В. Воспроизведение многоканального аудио
RU2616161C2 (ru) * 2011-06-16 2017-04-12 Жан-Люк ОРЭ Способ обработки аудиосигнала для улучшенного преобразования
RU2635244C2 (ru) * 2013-01-22 2017-11-09 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов
RU2656717C2 (ru) * 2013-01-17 2018-06-06 Конинклейке Филипс Н.В. Бинауральная аудиообработка
RU2660611C2 (ru) * 2013-01-15 2018-07-06 Конинклейке Филипс Н.В. Стереофоническая обработка аудиосигналов

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
CN103460285B (zh) 2010-12-03 2018-01-12 弗劳恩霍夫应用研究促进协会 用于以几何为基础的空间音频编码的装置及方法
WO2012150482A1 (en) * 2011-05-04 2012-11-08 Nokia Corporation Encoding of stereophonic signals
JP6007474B2 (ja) * 2011-10-07 2016-10-12 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラムおよび記録媒体
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI847206B (zh) * 2013-09-12 2024-07-01 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
KR20230011480A (ko) 2013-10-21 2023-01-20 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
WO2016141023A1 (en) * 2015-03-03 2016-09-09 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
US10672408B2 (en) 2015-08-25 2020-06-02 Dolby Laboratories Licensing Corporation Audio decoder and decoding method
TWI577194B (zh) * 2015-10-22 2017-04-01 山衛科技股份有限公司 環境音源辨識系統及其環境音源辨識之方法
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
CA3043444A1 (en) * 2016-10-19 2018-04-26 Audible Reality Inc. System for and method of generating an audio image
US11523239B2 (en) 2019-07-22 2022-12-06 Hisense Visual Technology Co., Ltd. Display apparatus and method for processing audio
CN112261545A (zh) * 2019-07-22 2021-01-22 海信视像科技股份有限公司 显示装置

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US602349A (en) * 1898-04-12 Abrading mechanism
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JPH04240896A (ja) * 1991-01-25 1992-08-28 Fujitsu Ten Ltd 音場制御装置
FR2688371B1 (fr) * 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
US5703999A (en) 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
EP1304797A3 (en) 1992-07-07 2007-11-28 Dolby Laboratories Licensing Corporation Digital filter having high accuracy and efficiency
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JPH06269097A (ja) * 1993-03-11 1994-09-22 Sony Corp 音響装置
US5488665A (en) 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
US5659619A (en) * 1994-05-11 1997-08-19 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
US5982903A (en) * 1995-09-26 1999-11-09 Nippon Telegraph And Telephone Corporation Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5742689A (en) * 1996-01-04 1998-04-21 Virtual Listening Systems, Inc. Method and device for processing a multichannel signal for use with a headphone
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
CN1204692C (zh) * 1996-04-10 2005-06-01 皇家菲利浦电子有限公司 编码若干信息信号的编码装置
WO1999014983A1 (en) 1997-09-16 1999-03-25 Lake Dsp Pty. Limited Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
AUPP271598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Headtracked processing for headtracked playback of audio signals
CN1065400C (zh) 1998-09-01 2001-05-02 国家科学技术委员会高技术研究发展中心 兼容ac-3和mpeg-2的音频编解码器
CA2309077A1 (en) * 1998-09-02 2000-03-16 Matsushita Electric Industrial Co., Ltd. Signal processor
DE19932062A1 (de) 1999-07-12 2001-01-18 Bosch Gmbh Robert Verfahren zur Aufbereitung von quellcodierten Audiodaten sowie Sender und Empfänger hierzu
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
JP2002191099A (ja) 2000-09-26 2002-07-05 Matsushita Electric Ind Co Ltd 信号処理装置
JP3228474B2 (ja) * 2001-01-18 2001-11-12 日本ビクター株式会社 音声符号化装置及び音声復号化方法
JP2002262385A (ja) * 2001-02-27 2002-09-13 Victor Co Of Japan Ltd 音像定位信号の生成方法、及び音像定位信号生成装置
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
JP2003009296A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
WO2003086017A2 (en) 2002-04-05 2003-10-16 Koninklijke Philips Electronics N.V. Signal processing
ES2268340T3 (es) * 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
KR100522593B1 (ko) 2002-07-08 2005-10-19 삼성전자주식회사 다채널 입체음향 사운드 생성방법 및 장치
AU2003244932A1 (en) * 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
KR20040027015A (ko) * 2002-09-27 2004-04-01 (주)엑스파미디어 스트리밍시 오디오의 대역폭을 줄이기 위하여 몰입형오디오를 이용한 새로운 다운믹싱 기법
JP4084990B2 (ja) * 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
JP4369140B2 (ja) 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
FR2851879A1 (fr) * 2003-02-27 2004-09-03 France Telecom Procede de traitement de donnees sonores compressees, pour spatialisation.
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050276430A1 (en) * 2004-05-28 2005-12-15 Microsoft Corporation Fast headphone virtualization
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2616161C2 (ru) * 2011-06-16 2017-04-12 Жан-Люк ОРЭ Способ обработки аудиосигнала для улучшенного преобразования
RU2610416C2 (ru) * 2012-01-17 2017-02-10 Гибсон Инновейшенс Бельгиум Н.В. Воспроизведение многоканального аудио
RU2660611C2 (ru) * 2013-01-15 2018-07-06 Конинклейке Филипс Н.В. Стереофоническая обработка аудиосигналов
RU2656717C2 (ru) * 2013-01-17 2018-06-06 Конинклейке Филипс Н.В. Бинауральная аудиообработка
RU2635244C2 (ru) * 2013-01-22 2017-11-09 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов
US10482888B2 (en) 2013-01-22 2019-11-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation

Also Published As

Publication number Publication date
BRPI0608036A2 (pt) 2009-11-03
IL185452A (en) 2011-07-31
NO20075004L (no) 2007-10-03
TW200701823A (en) 2007-01-01
EP2094031A3 (de) 2014-10-01
KR20070100838A (ko) 2007-10-11
JP4987736B2 (ja) 2012-07-25
DE102005010057A1 (de) 2006-09-07
KR100928311B1 (ko) 2009-11-25
WO2006094635A1 (de) 2006-09-14
NO339958B1 (no) 2017-02-20
MX2007010636A (es) 2007-10-10
ATE461591T1 (de) 2010-04-15
CN101133680A (zh) 2008-02-27
US20070297616A1 (en) 2007-12-27
JP2008532395A (ja) 2008-08-14
CA2599969A1 (en) 2006-09-14
MY140741A (en) 2010-01-15
CA2599969C (en) 2012-10-02
DE502006006444D1 (de) 2010-04-29
AU2006222285A1 (en) 2006-09-14
BRPI0608036B1 (pt) 2019-05-07
EP1854334B1 (de) 2010-03-17
EP1854334A1 (de) 2007-11-14
HK1111855A1 (en) 2008-08-15
IL185452A0 (en) 2008-01-06
US8553895B2 (en) 2013-10-08
RU2007136792A (ru) 2009-04-10
ES2340796T3 (es) 2010-06-09
PL1854334T3 (pl) 2010-09-30
AU2006222285B2 (en) 2009-01-08
EP2094031A2 (de) 2009-08-26
CN101133680B (zh) 2012-08-08
TWI322630B (en) 2010-03-21

Similar Documents

Publication Publication Date Title
RU2376726C2 (ru) Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио
JP5081838B2 (ja) オーディオ符号化及び復号
CA2582485C (en) Individual channel shaping for bcc schemes and the like
CA2554002C (en) Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
AU2006212191B2 (en) Parametric joint-coding of audio sources
TWI555011B (zh) 處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
KR101215868B1 (ko) 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
CA2593290C (en) Compact side information for parametric coding of spatial audio
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
RU2409911C2 (ru) Декодирование бинауральных аудиосигналов
NO344093B1 (no) Kompatibel flerkanal-koding/dekoding.
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
CN101853660A (zh) 用于双声道提示码编码方案和类似方案的散射声音整形