RU2431940C2 - Аппаратура и метод многоканального параметрического преобразования - Google Patents

Аппаратура и метод многоканального параметрического преобразования Download PDF

Info

Publication number
RU2431940C2
RU2431940C2 RU2009109125/09A RU2009109125A RU2431940C2 RU 2431940 C2 RU2431940 C2 RU 2431940C2 RU 2009109125/09 A RU2009109125/09 A RU 2009109125/09A RU 2009109125 A RU2009109125 A RU 2009109125A RU 2431940 C2 RU2431940 C2 RU 2431940C2
Authority
RU
Russia
Prior art keywords
parameter
channel
parameters
sound
signal
Prior art date
Application number
RU2009109125/09A
Other languages
English (en)
Other versions
RU2009109125A (ru
Inventor
Йоханнес ХИЛПЕРТ (DE)
Йоханнес ХИЛПЕРТ
Карштайн ЛИНЦМАЙЕР (DE)
Карштайн ЛИНЦМАЙЕР
Юрген ХЕРРЕ (DE)
Юрген ХЕРРЕ
Ральф ШПЕРШНАЙДЕР (DE)
Ральф ШПЕРШНАЙДЕР
Андреас ХЁЛЬЦЕР (DE)
Андреас ХЁЛЬЦЕР
Ларс ВИЛЛЕМОЕС (SE)
Ларс ВИЛЛЕМОЕС
Йонас ЭНГДЕГАРД (SE)
Йонас ЭНГДЕГАРД
Хайко ПУРНАГЕН (SE)
Хайко ПУРНАГЕН
Кристофер КЁРЛИНГ (SE)
Кристофер КЁРЛИНГ
Йероен БРЕЕБААРТ (NL)
Йероен БРЕЕБААРТ
Вернер ООМЕН (NL)
Вернер ООМЕН
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Долби Свиден АБ
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., Долби Свиден АБ, Конинклейке Филипс Электроникс Н.В. filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Publication of RU2009109125A publication Critical patent/RU2009109125A/ru
Application granted granted Critical
Publication of RU2431940C2 publication Critical patent/RU2431940C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

Изобретение относится к многоканальному преобразованию параметров, в частности к генерированию параметров когерентности и параметров выходного уровня, которые указывают на пространственные свойства между двумя звуковыми сигналами, основанными на объектно-параметровом базовом представлении звукового воспроизведения в пространстве. Преобразователь генерирует параметры, определяющие соотношение между первым и вторым каналом многоканального звукового сигнала, связанные с конфигурацией многоканальной акустической системы. Параметры уровня генерируются на основе параметров объекта из множества звуковых объектов, связанных с каналом понижающего микширования, которые генерируются, используя звуковые сигналы объекта, ассоциирующиеся со звуковыми объектами. Параметры объекта содержат энергетический параметр, указывающий энергию звукового сигнала объекта. Для получения параметров когерентности и уровня использован параметрический генератор, который объединяет энергетический параметр и параметры воспроизведения объекта, которые зависят от желаемой конфигурации воспроизведения. Технический результат - уменьшение сложности применения различных систем, которые предназначены для кодирования и расшифровывания параметрических многоканальных звуковых потоков. 3 н. и 24 з.п. ф-лы, 10 ил.

Description

Область изобретения.
Данное изобретение относится к многоканальному преобразованию параметров, в частности к генерированию параметров когерентности и параметров выходного уровня, которые указывают на пространственные свойства между двумя звуковыми сигналами, основанными на объектно-параметровом базовом представлении звукового воспроизведения в пространстве.
Предпосылки создания изобретения и предшествующий уровень
Существует несколько подходов для параметрического кодирования многоканальных звуковых сигналов, типа «Параметрический Стерео», «Бинауральное (стереофонический) кодирование ВВС начального сигнала для Естественного Звучания и MPEG объемный звук, которые стремятся воссоздать многоканальный звуковой сигнал посредством понижающего смешанного сигнала (который может быть либо монофоническим, либо может состоять из нескольких каналов) и параметрическую дополнительную информацию (пространственный сигнал); все эти виды звучания характерны своим ощутимым объемным звуком.
Такие методы можно назвать - канал ориентируемыми (основанные на канале - звуковом тракте), то есть такие методы пробуют передать многоканальный сигнал, уже существующий или сгенерированный в битрейт параметре. Таким образом, пространственное звуковое поле смешивается с определенным количеством каналов перед трансляцией сигнала, это происходит для того, чтобы соответствовать определенной настройке акустической системы; эти методы направлены на сжатие звуковых каналов, подсоединенных к индивидуальным акустическим системам.
Техника параметрического кодирования основывается на устройстве уменьшения числа каналов (принудительное сокращение числа аудио каналов до обычного стерео для совместимости с немногоканальными аудиоустройствами), которое воспроизводит звуковое содержание вместе с параметрами, которые описывают пространственные свойства оригинального пространственного звукового поля и которые используются на приемной стороне, чтобы восстановить многоканальный сигнал или пространственное звуковое поле.
Близко связанная группа методов, например «ВВС для Естественного Звучания», разработана для эффективного кодирования индивидуальных звуковых объектов в большей степени, чем для каналов того же самого многоканального сигнала; это сделано для их интерактивного воспроизведения в произвольным пространственном положении, при этом независимо усиливая или подавляя отдельные объекты без аналого-цифрового преобразователя. В отличие от общих параметрических многоканальных аудио кодирующих методов, которые передают определенный набор индивидуальных сигналов от кодирующего устройства (аналого-цифрового преобразователя) к декодеру, техника по кодировке объекта позволяет воспроизводить декодированные объекты с любой установки, то есть пользователь на декодирующей стороне может свободно выбирать установку (настройку) для воспроизведения (например, стерео, 5.1 - объемный) согласно своему предпочтению.
По концепции кодирования объекта параметры могут быть заданы заранее, могут идентифицировать положение звукового объекта в пространстве и создавать гибкое звучание на стороне получения звука. Воспроизведение на стороне получения имеет свое преимущество в том, что даже неидеальные акустические системы или произвольные акустические системы могут использоваться для того, чтобы создать пространственное звуковое поле высокого качества. Кроме того, звуковой сигнал типа, например, из устройства уменьшения числа каналов (при понижающем микшировании), связанных с индивидуальными объектами, должен беспрепятственно транслироваться; это является основанием для воспроизведения звука на приемной стороне для слушателя.
Оба описанных выше подхода основываются на многоканальной акустической системе, которая обеспечивает впечатление высококачественного воспроизведения пространственного звучания оригинального пространственного звукового поля на приемной стороне.
Как уже было отмечено, есть несколько современных методов для параметрического кодирования многоканальных звуковых сигналов, которые могут воспроизводить пространственный звуковой образ (аудиограмму), это зависит от скорости передачи данных - более или менее сходных с оригинальным многоканальным звуковым содержанием.
Однако, учитывая некоторый предварительно закодированный звуковой материал (то есть объемное звучание, которое характеризуется определенным количеством индивидуальных сигналов), такой кодер-декодер не предлагает никаких средств и приспособлений для апостериорного (последовательного) и интерактивного воспроизведения единственных звуковых объектов в соответствии с предпочтениями слушателя. С другой стороны, существует еще и метод кодирования пространственного звукового объекта, который был разработан для последней описанной цели; но так как параметрическое воспроизведение, используемое в таких системах, отличается от воспроизведения для многоканальных звуковых сигналов, то потребуются отдельные декодеры, если возникнет необходимость использовать оба метода параллельно. Недостаток, который следует из всей этой ситуации, состоит в том, что, хотя обе системы выполняют одну и ту же задачу, которая заключается в воспроизведении пространственного звукового поля из акустической системы, они (системы) должны работать дублировано, то есть нужно два отдельных декодера, чтобы обеспечить обе функции.
Другое ограничение объекта прототипа кодирующей технологии выражается в нехватке средства для хранения и/или передачи пространственных звуковых объектных полей назад совместимым способом. Особенность возможности интерактивного расположения единичных звуковых объектов обеспечивается с помощью кодирующей парадигмы пространственного звукового объекта; это является скорее недостатком, когда эта особенность приводит к идентичному воспроизводству легко воспроизводимого звукового отрезка.
Подведя итоги, можно отметить неудачную ситуацию: хотя многоканальная среда воспроизведения (многоканальное воспроизведение записей) может присутствовать, что описывается в одном из вышеупомянутых подходов, дальнейшая среда воспроизведения может потребоваться, чтобы осуществить второй подход. Кроме того, можно отметить, что согласно более длинному описанию кодирующие схемы на основе канала намного более типичны и обычны для применения, например, известные 5.1 или 7.1/7.2 многоканальные сигналы, сохраненные на DVD или подобном устройстве. Таким образом, даже если многоканальный звуковой декодер и связанное с ним оборудование для воспроизведения (усилительный каскад и акустические системы) используются, пользователь нуждается в дополнительной полной установке (наборе), то есть, по крайней мере, в звуковом декодере, когда он хочет воспроизвести закодированные звуковые данные на основе объекта. Обычно, многоканальные звуковые декодеры непосредственно связаны с каскадами усиления, и пользователь не имеет прямого доступа к каскадам усиления, которые используются, чтобы запустить акустическую систему. Это, например, случай в большинстве обычно доступных многоканальных звуковых или мультимедийных приемниках. Пользователь, который желает послушать звук на имеющемся бытовом оборудовании, закодированный с помощью обоих подходов, должен был бы использовать второй набор усилителей и это, конечно, неудовлетворительная ситуация.
Краткое изложение сущности изобретения
Желательно применять один метод, чтобы уменьшить сложность применения различных систем, которые могут и расшифровывать параметрические многоканальные звуковые потоки, и параметрические закодированные пространственные звуковые потоки объекта.
Один из способов использования изобретения - это использование его в качестве многоканального параметрического преобразователя для генерирования параметра выходного уровня, который указывает на энергетическое соотношение между первым звуковым сигналом и вторым звуковым сигналом при воспроизведении многоканального пространственного звукового сигнала; преобразователь параметра содержит: провайдер объектного параметра для того, чтобы обеспечивать объектные параметры множеством звуковых объектов, связанных с устройством уменьшения числа каналов в зависимости от объекта звуковых сигналов, связанных со звуковыми объектами; параметры объекта содержат энергетический параметр для каждого звукового объекта, это определяет энергетическую информацию сигнала аудиообъекта; и генератор параметра для получения параметра выходного уровня с помощью комбинирования энергических параметров и параметров воспроизведения объекта, которые связаны с конфигурацией воспроизведения.
Согласно дальнейшему осуществлению данного изобретения преобразователь генерирует параметр когерентности (параметр последовательности) и параметр выходного уровня, определяя взаимосвязь или когерентность (последовательность) и энергетическое соотношение между первым и вторым звуковым сигналом многоканального звукового сигнала, связанного с многоканальным устройством воспроизводства звука. Корреляция - и параметры выходного уровня генерируются на основе провайдера (формирователь объектных параметров) объектных параметров, по крайней мере, для одного звукового объекта, связанного с понижающим микшированием канала (устройством уменьшения числа каналов), которое генерируется самостоятельно, используя сигнал звукового объекта, связанный со звуковым объектом, где параметры объекта содержат энергетический параметр, который определяет энергию сигнала звукового объекта. Чтобы получить когерентность и параметр выходного уровня, используется генератор параметра, который соединяет энергетический параметр и параметр воспроизведения дополнительных объектов, на которые, в свою очередь, влияет конфигурация воспроизведения. Согласно осуществлению изобретения параметры воспроизведения объектов заключают в себе характеристики громкоговорителя (акустической системы), которые определяют местоположение студийного громкоговорителя относительно слушателя. Согласно некоторым предназначениям (изобретения) параметры воспроизведения объекта указывают на местоположение объекта относительно положения, в котором находится слушатель. С этой целью генератор параметра использует сочетание эффектов из обеих пространственных звуковых кодирующих парадигм.
Согласно дальнейшей сути данного изобретения многоканальный преобразователь параметра работает для того, чтобы получить MPEG Окружающую когерентность и параметры выходного уровня (ICC и CLD форматы), которые могут использоваться, чтобы управлять декодером многоканальной стереофонии MPEG формата. Отмечено, что внутри - канальная когерентность / взаимная корреляция (ICC) - представляет когерентность (связь) или поперечную корреляцию между двумя входными каналами. Когда разница во времени (разновременность срабатывания) не учитывается, когерентность (связь) и корреляция это - то же самое. Названные по-разному, оба термина указывают на одну и ту же особенность, которая означает, что разновременность срабатывания соединительного канала или разность фаз соединительного канала не используется.
Таким образом, многоканальный преобразователь параметра вместе со стандартным преобразователем MPEG формата объемного звука может использоваться, чтобы воспроизвести закодированный звуковой сигнал на основе объекта. Изобретение имеет преимущество в том, что требуется только один дополнительный преобразователь параметра, который принимает закодированный звуковой сигнал пространственного звукового объекта (SAOC) и который преобразовывает параметры объекта таким образом, что они могут использоваться стандартным декодером формата объемного звука MPEG, чтобы воспроизвести многоканальный звуковой сигнал с помощью имеющегося воспроизводящего оборудования. Поэтому обычное воспроизводящее оборудование может использоваться без существенных изменений, чтобы также воспроизвести закодированное содержание пространственного звукового объекта.
Согласно дальнейшему применению данного изобретения выработанная когерентность (связь) и параметры выходного уровня объединяются из каналов в MPEG совместимый битовый поток (двоичный поток). Такой битовый поток (двоичный поток) может присоединяться к стандартному ДЕКОДЕРУ объемного звучания MPEG, не требуя дальнейших модификаций в имеющемся оборудовании воспроизведения.
Согласно дальнейшему применению данного изобретения выработанная когерентность (связь) и параметры выходного уровня передаются непосредственно к немного измененному ДЕКОДЕРУ объемного звучания MPEG, таким образом, что сложность вычисления многоканального преобразователя параметра может оставаться низкой.
Согласно дальнейшему применению данного изобретения выработанные многоканальные параметры (параметр когерентности и параметр выходного уровня) сохраняются после генерирования (выработки), таким образом, что многоканальный преобразователь параметра может также использоваться как средство для сохранения пространственной информации, полученной в ходе выступления (концерта). Такое выступление может, например, проходить в музыкальной студии, сигналы могут вырабатываться так, что многоканальный совместимый сигнал может быть произведен без любого дополнительного усилия, используя многоканальный трансформатор параметра, как описано более подробно в следующих параграфах. Таким образом, перечисленные случаи позволяют воспроизводить звук на легальном оборудовании.
Краткое описание чертежей
Прежде чем давать более детальное описание нескольких осуществлений данного изобретения, нужно привести короткий обзор многоканального звукового кодирования, техники кодирования аудиообъектов и техники кодирования пространственных аудиообъектов. В этом случае ссылка будет относиться к приложенным иллюстрациям.
Фиг.1а показывает прототип многоканальной аудиокодирующей схемы;
фиг.1b прототип объектной кодирующей схемы;
фиг.2 показывает кодирующую схему пространственного звукового объекта;
фиг.3 показывает воплощение многоканального трансформатора параметра;
фиг.4 показывает пример многоканальной конфигурации акустической системы для воспроизведения пространственного звукового содержания;
фиг.5 показывает пример возможного многоканального представления параметра пространственного звукового содержания;
фиг.6а и 6b показывают прикладные планы (сценарии) для закодированного содержания пространственного звукового объекта;
фиг.7 показывает воплощение многоканального параметрического преобразователя;
фиг.8 показывает пример метода для генерирования параметра когерентности и параметра корреляции.
Детальное описание предпочтительного варианта реализации изобретения
Фиг.1а схематически показывает многоканальную схему, кодирующую и расшифровывающую звук, тогда как фиг.1b схематически показывает схему обычного кодирования звукового объекта. Многоканальная кодирующая схема использует множество имеющихся звуковых каналов, то есть звуковые каналы уже смешаны, чтобы соответствовать заранее определенному количеству громкоговорителей (акустических систем). Многоканальное кодирующее устройство 4 (кодирование пространственного звука) производит низведение сигнала 6, который производится с помощью каналов 2а и 2b. Этот низведенный сигнал 6 может, например, быть монофоническим звуковым каналом или двумя звуковыми каналами, то есть сигналом стерео. Чтобы частично компенсировать потерю информации в течение низведения (операция понижающего микширования), используется многоканальное кодирующее устройство 4, которое выделяет многоканальные параметры, которые описывают пространственную взаимосвязь сигналов звуковых каналов 2а и 2b. Эта информация передается вместе с низведенным сигналом 6, потому так называемая информация о состоянии канала 8 связана с многоканальным декодером 10. Многоканальный декодер 10 использует многоканальные параметры информации о состоянии канала 8, чтобы создать каналы 12а и 12b с целью восстановления каналов 2а и 2b настолько точно, насколько это возможно. Это может, например, быть достигнуто при помощи передачи параметров выходного уровня и параметров корреляции, которые описывают отношение энергии между индивидуальными парами канала оригинальных звуковых каналов 2а и 2b и которые обеспечивают меру корреляции (связи) между парами звуковых каналов 2а и 2b.
Во время расшифровки эта информация может использоваться, чтобы перераспределить звуковые каналы, которые содержатся в низведенном сигнале на восстановленные звуковые каналы 12а и 12b. Можно отметить, что стандартная многоканальная звуковая схема воспроизводит то же самое число восстановленных каналов 12а и 12b, как число оригинальных звуковых каналов 2а и 2b, которые входят в многоканальное звуковое кодирующее устройство 4. Однако другие схемы расшифровки также могут осуществляться, воспроизводя больше или меньше обычных каналов, чем оригинальных звуковых каналов 2а и 2b.
В некотором смысле многоканальные звуковые методы схематично отображены на фиг.1а (например, недавно стандартизированная MPEG пространственная звуковая кодирующая схема, то есть MPEG Объемный звук), может рассматриваться как битрейт-эффективное и совместимое расширение имеющейся звуковой инфраструктуры, имеющей отношение к многоканальному звуковому/объемному звуку. Фиг.1b изображает уже существующий подход к звуковому кодированию на основе объекта. Как пример, кодирование звуковых объектов и способности "интерактивности, основанной на содержании", является частью понятия MPEG-4. Обычная техника кодирования звукового объекта, схематично показанная на фиг.1b, пользуется различными подходами, поскольку эта техника не передает множество уже существующих звуковых каналов, а передает полное звуковое поле, распределяя в пространстве многократные звуковые объекты 22а и 22d. С этой целью используется кодировщик обычных звуковых объектов 20, чтобы закодировать многократные звуковые объекты 22а и 22d в элементарные потоки 24а и 24d; каждый звуковой объект имеет связанный элементарный поток. Звуковые объекты 22а и 22d (звуковые источники) могут, например, быть представлены монофоническим звуковым каналом и связанными параметрами энергии, указывая относительный уровень звукового объекта относительно остающихся в пространстве звуковых объектов.
Конечно, в более сложном исполнении звуковые объекты не ограничены для воспроизведения монофоническими звуковыми каналами. Вместо этого, например, звуковые объекты стерео или многоканальные звуковые объекты могут быть закодированы. Обычный звуковой декодер 28 стремится воспроизводить звуковые объекты 22а и 22b, чтобы получать преобразованные звуковые объекты 28а и 28d. Компоновщик (редактор) звукового содержания (Scene composer) 30 в пределах обычного декодера звукового объекта позволяет разрозненное размещение преобразованных звуковых объектов 28а и 28d (источники) и адаптацию к различным установкам акустической системы (громкоговорителей). Пространство воспроизведения полностью определяется в соответствии с описанием 34 и связано со звуковыми объектами. Некоторые обычные компоновщики звукового содержания 30 предполагают описание музыкального эпизода на стандартизированном языке, например BIFS (двоичный формат для описания музыкального эпизода). На стороне декодера могут использоваться произвольные установки акустической системы (громкоговорителей); декодер обеспечивает звуковые каналы 32а и 32е для индивидуальных акустических систем, которые оптимально настроены для преобразования звукового поля, поскольку полная информация звукового поля доступна на стороне декодера. Например, бинауральное (стереофоническое) воспроизведение/предоставление выполнимо, и оно приводит к двум звуковым каналам, сгенерированным для предоставления впечатления пространственного звука при прослушивании через наушники.
Дополнительное использование компоновщика звукового содержания 30 (редактора музыкальных эпизодов) позволяет переустановку/панорамирование индивидуальных звуковых объектов на стороне воспроизводства. Кроме того, положения или уровни специально отобранных звуковых объектов могут быть изменены, например, можно увеличить ясность говорящего, когда окружающие шумовые объекты или другие звуковые объекты, связанные другими людьми, которые тоже разговаривают (все вместе) подавляются, то есть они уменьшены в своем уровне.
Другими словами, обычные звуковые шифровальщики объекта кодируют множество звуковых объектов в элементарные потоки; каждый поток связан с одним единственным звуковым объектом. Обычный декодер расшифровывает эти потоки и формирует звуковое поле под контролем описания поля (двоичного формата для описания музыкального эпизода), произвольно основываясь на взаимодействии пользователя с системой. В рамках практического применения этот подход страдает из-за определенных недостатков. Из-за отдельного кодирования каждого индивидуального звука (звукового объекта) необходимый битрейт для передачи целостного эпизода, который значительно выше, чем нормы, используемые для монофонической/стереофонической передачи сжатого аудио (звука). Очевидно необходимый битрейт растет приблизительно пропорционально с количеством переданных звуковых объектов, то есть со сложностью звукового эпизода.
Следовательно, из-за отдельной расшифровки каждого звукового объекта вычислительная сложность для процесса расшифровки значительно превышает ту сложность обычного моно/стерео звукового декодера. Необходимая вычислительная сложность для расшифровки растет приблизительно пропорционально с числом переданных объектов (принимая во внимание невысокую сложность процедуры составления структуры). Используя усовершенствованные возможности структуры и состава, то есть используя различные вычислительные узлы, эти недостатки в дальнейшем отягощаются сложностью, связанной с синхронизацией соответствующих звуковых узлов и со сложностью в управлении структурированным звуковым двигателем. Кроме того, так как полная система вовлекает несколько звуковых компонентов декодера и единицу двоичного формата для описания музыкального эпизода, сложность необходимой структуры это - препятствие к применению в реальности. Усовершенствованные возможности структуры и состава, кроме того, требуют применение структурированного звукового двигателя с вышеупомянутым препятствием.
Фиг.2 показывает осуществление изобретенной концепции кодирования пространственного звукового объекта, позволяющей эффективное звуковое кодирование объекта, обходя предварительно упомянутые неудобства. Из фиг.3 становится ясно, что концепция может применяться с помощью изменения существующего MPEG объемного звука. Однако использование объемного звука MPEG не принудительно, так как могут использоваться и другие общие многоканальные структуры зашифровывания/расшифровки, чтобы осуществить данное изобретение. При использовании имеющейся кодирующей структуры для многоканального аудио (звука), например MPEG объемный звук, концепция изобретения вовлекает битрейт-эффективное и совместимое расширение имеющейся звуковой инфраструктуры для воспроизведения звука на основе объекта. Чтобы отличаться от предшествующих подходов (изобретений), касающихся кодировки звукового объекта (КЗО) и пространственной кодировки звука (многоканальное кодирование аудио); данное изобретение будет в последующем именоваться понятием - пространственное звуковое кодирование объекта или сокращенно (ПЗКО).
Кодирующая схема для пространственных звуковых объектов, показанная на фиг.2, использует индивидуальные объекты аудиовхода от 50а до 50d. Кодирующее устройство для пространственного звукового объекта 52 вырабатывает один или больше низведенных сигналов 54 (например, моно или стерео сигналы) вместе с информацией о состоянии канала 55, при этом имея в наличии информацию о характеристиках оригинальной звуковой среды.
ПЗКО - декодер 56 получает низведенный сигнал 54 с информацией о состоянии канала 55. Основанный на низведенном сигнале (уменьшении числа каналов) 54 соединения и информации о состоянии канала 55; декодер пространственного звукового объекта 56 восстанавливает (перестраивает) ряд звуковых объектов от 58а до 58d. Восстановленные (перестроенные) звуковые объекты от 58а до 58d смешиваются для воспроизведения 60, на этапе воспроизведения - звуковое содержание представляет собой смешанные индивидуальные звуковые объекты от 58а до 58d, чтобы впоследствии сгенерировать необходимое число каналов вывода 62а и 62b, которые обычно соответствуют многоканальной установке акустической системы, предназначенной, чтобы использоваться для воспроизведения. Параметры устройства смешивания/воспроизводства звука 60 управляются непосредственно пользователем или с панели управления 64, чтобы получить интерактивное воспроизведение звука и таким образом обеспечить высокое гибкое кодирование звукового объекта. Концепция пространственного кодирования звукового объекта, показанного на фиг.2, имеет несколько значительных преимуществ по сравнению с другими вариантами многоканального преобразования. Передача (трансмиссия) достаточно битрейт-эффективна из-за использования низведенных (уменьшенных) сигналов и сопровождающих параметров объекта. Таким образом, информация о состоянии канала, базирующаяся на объекте, передается вместе с низведенным сигналом, который составлен из звуковых сигналов, связанных с индивидуальными звуковыми объектами. Поэтому требования к скорости передачи битов значительно уменьшается по сравнению с теми подходами, где сигнал каждого индивидуального звукового объекта отдельно закодирован и передан. Кроме того, концепция сравнима с уже существующими структурами передачи (звука). Легальные устройства воспроизводят (составляют) низведенный сигнал. Восстановленные звуковые объекты от 58а до 58d могут быть непосредственно переданы устройству смешивания/воспроизводства звука 60 (компоновщику эпизода). Вообще, восстановленные звуковые объекты от 58а до 58d могут быть связаны с любым внешним устройством смешивания (смешивания / воспроизводства 60), таким образом, что идея изобретения может быть легко осуществлена в уже существующей среде воспроизведения (звука). Индивидуальные звуковые объекты 58а…d могут использоваться как соло воспроизведение, то есть они воспроизводятся как единый звуковой поток, хотя они (эти звуковые объекты) не предназначены для создания высококачественного соло.
Чтобы отделить SAOC декодирование (ПЗКО - пространственное звуковое кодирование объекта) и последующее смешивание, объединенный ПЗКО - декодер и устройство для смешивания/воспроизводства чрезвычайно удобно, потому что с ним не возникает сложности при использовании. По сравнению с прямым подходом, полной расшифровки/реконструкции объектов от 58а до 58d в качестве промежуточного воспроизведения этого можно избежать. Необходимое вычисление главным образом связано с намеченным числом выходных каналов 62а и 62b. Из фиг.2 видно, что устройство смешивания/воспроизведения 60, связанное с ПЗКО - декодером, может в принципе быть любым алгоритмом, подходящим для объединения единичных звуковых объектов в одно звуковое поле, то есть подходящим для производства выходных звуковых каналов 62а и 6b, которые подключены к разным громкоговорителям или акустическим системам многоканальной установки. Таким устройством, это может быть, например, смеситель для амплитудного панорамирования (или амплитудного и отсроченного панорамирования), амплитудное панорамирование базируется на векторе (схемы VBAP) и бинауральном воспроизведении, то есть воспроизведении, которое направлено на пространственное устойчивое восприятие при использовании только двух акустических систем или наушников. Например, MPEG объемный звук формат использует для воспроизведения такие бинауральные методы. В общем, передача низведенных сигналов 54 связана с соответствующей информацией о звуковом объекте 55; сигналы могут быть объединены с техникой кодирования произвольного многоканального звука, такого как, например, параметрический стерео звук, бинауральный (стереофонический) код начального сигнала или MPEG.
Фиг.3 показывает осуществление данного изобретения, в котором параметры объекта передаются вместе с низведенным сигналом. В структуре ПЗКО декодера 120 MPEG декодер объемного звука может использоваться вместе с многоканальным преобразователем параметра, который производит параметры MPEG, используя полученные (приобретенные) параметры объекта. Эта комбинация создает пространственный звуковой декодер объекта 120 с чрезвычайно низкой сложностью (самого устройства). Другими словами, этот специфический пример предлагает метод для преобразования (пространственного звука) параметров объекта и панорамирования информации, связанной с каждым звуковым объектом в стандартном MPEG потоке битов (потоке двоичных сигналов); таким образом, расширяя применение обычных MPEG декодеров объемного звука: от воспроизведения многоканального звукового содержания до интерактивного воспроизведения закодированных эпизодов пространственных звуковых объектов. Эта система работает без применения модификации к MPEG декодеру объемного звука. Осуществление изобретения, показанное на фиг.3, не имеет те недостатки, которые есть у обычной технологии использования многоканального преобразователя параметра вместе с MPEG декодером объемного звука. В то время как MPEG декодер объемного (окружающего звука) - обычно доступная технология; многоканальный преобразователь параметра обеспечивает транскодирование (преобразование одного кода в другой) из пространственного звукового кодированного объекта в MPEG формат объемного звука. Это будет детально рассмотрено в следующих параграфах, которые дополнительно ссылаются на фиг.4 и 5, иллюстрируя определенные аспекты объединенных технологий. На фиг.3 декодер 120 содержит MPEG декодер объемного звука 100, который получает низведенный сигнал 102, имеющий некое звуковое содержание. Низведенный сигнал может быть произведен кодирующим устройством со стороны низведения (понижения количества) каналов с помощью объединения (или добавления) сигналов звукового объекта каждого звукового сигнала в импульсе по типовой манере. Альтернативно, процесс объединения может также иметь место в спектральной области или в области фильтр-банка (банк цифровых фильтров предназначен для разбиения входного сигнала на несколько подканалов). Низведенный канал может быть отделен от параметрического потока битов 122 или может быть в том же самом потоке битов как параметр потока битов.
MPEG декодер объемного звука 100 дополнительно получает пространственные сигналы 104 из MPEG объемного звука потока битов, как когерентность параметров внутриканальной когерентности (ICC) и параметры выходного уровня CLD, оба понятия означают характеристики сигналов между двумя звуковыми сигналами в рамках схемы зашифровывания/расшифровки объемного звука MPEG, которая показана на фиг.5 и которая будет объясняться более подробно ниже.
Многоканальный преобразователь параметра 106 получает параметры ПЗКО (параметры объекта) 122, связанные со звуковыми объектами, которые указывают свойства дополнительной цели звуковых объектов, содержавшихся в пределах низведенного (редуцированного) сигнала 102. Кроме того, преобразователь 106 получает параметры воспроизведения объекта через ввод параметров воспроизведения объекта. Эти параметры могут быть параметрами воспроизводящей матрицы или параметрами, которые могут использоваться для картографии звуковых объектов в сценарии воспроизведения. В зависимости от положений объекта, которые настроены пользователем и введены в блок 12, воспроизводящая матрица вычисляется (подготавливается) блоком 112. Вывод блока 112 вводится в блок 106 и в генератор параметра 108 для того, чтобы вычислить пространственные звуковые параметры. Когда конфигурация акустической системы (громкоговорителя) изменяется, воспроизводящая матрица или, по крайней мере, некоторые параметры воспроизведения объекта тоже изменяются. Таким образом, параметры воспроизведения зависят от конфигурации воспроизведения, которая включает конфигурацию громкоговорителя/конфигурацию воспроизведения или переданных, или выбранных пользователем положений объектов, оба положения могут быть подсоединены к блоку 112.
Генератор параметра 108 производит пространственные сигналы MPEG объемного звука 104, основанные на параметрах объекта, которые обеспечиваются с помощью провайдера параметров объекта (анализатор ПЗКО) 110. Генератор параметра 108 дополнительно использует параметры воспроизведения, которые вырабатываются генератором весового множителя 112. Некоторые или все параметры воспроизведения являются весовыми параметрами, описывающими разбивку звуковых объектов, содержавшихся в низведенном сигнале 102 на каналы, созданные декодером пространственного звукового объекта 120. Весовые параметры могут, например, быть организованы в матрице, так как они служат для того, чтобы картографировать определенное количество звуковых объектов N по определенному количеству звуковых каналов М, которые связаны с индивидуальными громкоговорителями многоканальной установки акустической системы, используемой для воспроизведения. Есть два типа входных данных на многоканальный преобразователь параметра (ПЗКО 2 MPS транскодер). Первый вход - поток битов пространственного звукового кодирования объекта 122; этот выход подсоединяет параметры объекта к индивидуальным звуковым объектам, которые указывают на пространственные свойства (например, энергетическая информация) звуковых объектов, связанных с переданной многообъектной звуковой сценой. Второй вход - параметры воспроизведения (весовые параметры (весовые коэффициенты)) 124, используемые для составления схемы объектов N к звуковым каналам М..
Как предварительно было указано, поток битов ПЗКО 122 содержит параметрическую информацию о звуковых объектах, которые были смешаны вместе, чтобы впоследствии создать вход низведенного сигнала 102 в MPEG декодер объемного звука 100. Параметры объектов потока битов ПЗКО 122 вырабатываются, по крайней мере, для одного звукового объекта, связанного с низведенным каналом 102, который был, в свою очередь, произведен, используя, по крайней мере, один сигнал звукового объекта, связанный со звуковым объектом. Подходящий параметр, например параметр энергии, указывает на энергию сигнала звукового объекта, то есть на силу вклада сигнала звукового объекта в низведенный канал 102. В случае, если используется низведенное стерео, может вырабатываться параметр направления для определения местоположения звукового объекта в пределах низведенного стерео. Однако другие параметры объекта, очевидно, также подходят и могут использоваться для осуществления этого.
Переданный низведенный звук не обязательно должен быть монофоническим сигналом. Это может быть также, например, сигнал стерео. В таком случае 2 параметра энергии могут передаваться как параметры объекта; каждый параметр указывает вклад каждого объекта в один из двух каналов сигнала стерео. Таким образом, например, если бы 20 звуковых объектов использовались для выработки низведенного стереосигнала, 40 энергетических параметров были бы переданы как параметры объекта.
ПЗКО потока двоичных сигналов 122 вводится в ПЗКО аналитический блок, то есть в провайдер параметра объекта 110, который восстанавливает параметрическую информацию, а последняя помимо фактического числа звуковых объектов имеет дело главным образом с возвратным уровнем огибающей параметров объекта (OLE), который описывает переменные во времени огибающие спектра каждого звукового существующего объекта.
Параметры ПЗКО типично зависят от времени, поскольку они передают информацию относительно того, как изменяется со временем многоканальное звуковое поле, например, когда выделяются определенные объекты, или другие объекты подавляются. Весовому коэффициенту воспроизводящей матрицы 124 часто не хватает достаточно времени или частотной зависимости. Конечно, если объекты входят или уходят, количество необходимых параметров резко изменяется, чтобы соответствовать количеству звуковых объектов поля. Кроме того, в приложениях под интерактивным управлением пользователя матричные элементы могут быть переменными во времени, поскольку они тогда зависят от фактического ввода пользователя. В дальнейшем осуществлении данного изобретения параметры, регулирующие изменение весового коэффициента, или параметры воспроизведения объекта, или изменяющееся во времени параметры воспроизведения объекта (весовые коэффициенты) непосредственно могут быть переданы в ПЗКО потоке битов, чтобы повлиять на изменение воспроизводящей матрицы 124. Весовой коэффициент или элементы воспроизводящей матрицы могут быть частотно зависимы, если нужна частотная зависимость воспроизводящих свойств (для примера, когда нужен частотно-избирательный усилитель определенного объекта).
На фиг.3 изображена матрица воспроизводства, которая генерируется генератором весового коэффициента 112 (генерирующий блок воспроизводящей матрицы), основанным на информации о конфигурации воспроизведения (которая является описанием поля). Это может быть, с одной стороны, информацией конфигурации воспроизведения, как, например, параметры акустических систем (громкоговорителя), указывающих местоположение или расположение в пространстве на отдельные громкоговорители и определенное количество акустических систем с многоканальной конфигурацией громкоговорителя, используемой для воспроизведения. Матрица воспроизведения, кроме того, вычисляется и основывается на параметрах воспроизведения объекта, например на информации, указывающей местоположение звуковых объектов и указывающей на увеличение или ослабление сигнала звукового объекта. Параметры воспроизведения объекта можно, с одной стороны, сопровождать потоком битов SAOC, если необходимо реалистическое воспроизведение многоканального звукового поля. Параметры воспроизведения объекта (например, параметры местоположения и параметры увеличения (параметры панорамирования)), могут альтернативно обеспечиваться в интерактивном режиме через пользовательский интерфейс. Естественно, желательная матрица воспроизведения, то есть желательные параметры весового коэффициента могут передаваться вместе с объектами, чтобы начать с естественно звучания воспроизводства звукового поля в качестве отправной точки для интерактивного воспроизводства на стороне декодера.
Генератор параметра (устройство воспроизведения сцены) 108 принимает и весовые коэффициенты, и параметры объекта (например, параметр энергии OLE), чтобы определить отображение отношения звуковых объектов N к выводному каналу М; причем М может быть больше, меньше, чем N или равным N и, кроме того, может даже изменяться во времени. При использовании стандартного MPEG декодера объемного звука 100 получаются пространственные сигналы (например, параметры когерентности и параметры выходного уровня), они могут быть переданы MPEG-декодеру 100 посредством стандартного окружающего потока битов, который соответствует низведенному сигналу, передающемуся вместе с SAOC потоком битов. Использование многоканального преобразователя параметра 106, как описано выше, позволяет использовать стандартный MPEG декодер объемного звука, чтобы обработать низведенный сигнал и преобразованные параметры, которые вырабатываются преобразователем 106, чтобы воспроизвести реконструкцию звукового поля через данные акустические системы. Это достигается с высокой гибкостью звукового подхода кодирования объекта, то есть позволяя серьезное взаимодействие пользователя на стороне воспроизведения. Как альтернатива воспроизведению многоканальной установки акустическая система может использоваться для бинаурального способа расшифровки MPEG декодера объемного звука, чтобы воспроизвести сигнал через наушники. Однако если производятся незначительные модификации MPEG декодера объемного звука 100, например, в пределах программной реализации (внедрение программного обеспечения), передача пространственных сигналов MPEG декодеру объемного звука может происходить непосредственно в области значения параметра. То есть вычислительные затраты многоканальной передачи в MPEG объемного звучания совместимого потока битов могут не совершаться. Помимо уменьшения вычислительной сложности, еще одно преимущество состоит в том, что снижение качества MPEG- квантования (дискретизации) соответствовавшего параметра не допускается, так как такое квантование (дискретизация) произведенных пространственных сигналов в этом случае больше не является необходимой. Как уже упоминалось, эти преимущества приводят к более гибкой работе MPEG декодера объемного звука, предлагая возможность прямой подачи параметра, а не чистой подачи потока битов. В другом осуществлении данного изобретения MPEG объемного звука совместимый битовый поток создается посредством произведенной многоканальной передачи (уплотнения каналов связи), которая генерирует пространственные сигналы низведенного соединения, таким образом, предлагая возможность воспроизводить звук через легальное оборудование. Многоканальный преобразователь параметра 106 может, таким образом, преобразовать закодированные данные звукового объекта в многоканальные закодированные данные на стороне кодирующего устройства. Дальнейшее осуществление данного изобретения, основанного на многоканальном преобразователе параметра, будет рассмотрено на фиг.3 в целях применения с определенным звуковым объектом и многоканального использования. Важные аспекты этого использования представлены на фиг.4 и 5.
Фиг.4 иллюстрирует подход в использовании амплитудного панорамирования, основанного на одном специфическом применении, используя параметры расположения как параметры воспроизведения объекта и энергетические параметры как параметры объекта. Параметры воспроизведения объекта указывает местоположение звукового объекта. В следующих параграфах, углы αi 150 будут использоваться как параметры воспроизведения (расположения) объекта, которые отображают направленность (акустический пеленгатор) звукового объекта 152 относительно слушателя 154. В следующих примерах представлен упрощенный двумерный: один единственный параметр, с одной точки зрения может использоваться, чтобы однозначно параметризовать направление и происхождение (акустический пеленгатор) звукового сигнала, связанного со звуковым объектом. Однако само собой разумеется, что общий трехмерный случай может быть реализован без внесения существенных изменений. Таким образом, имея для примера трехмерное пространство, можно использовать векторы, чтобы указать местоположение звуковых объектов в пределах пространственного звукового поля. Для случая, когда MPEG декодер объемного звука используется, чтобы осуществить идею изобретения; фиг.4 показывает дополнительно расположение акустической системы MPEG с пятью каналами многоканальной конфигурации громкоговорителей (колонок). Когда положение центра громкоговорителя 156а (С) определено, чтобы быть в 0°, правая часть колонки 156b расположена в 30°, а правая акустическая система объемного звучания 156с расположена в 110°, левая акустическая система объемного звучания 156d расположена в - 110° [и левая передняя акустическая система 156е расположена в - 30°.
Следующие примеры будут основаны на 5.1-канальной установке многоканальных звуковых сигналов как MPEG стандарт объемного звука, который определяет два возможных способа выработки параметров, которые визуально изложены в древовидной структуре (разветвленной структуре), показанной на фиг.5.
В случае передачи "моно низведенного сигнала" 160 MPEG декодер объемного звука использует древовидную (разветвленную) структуру параметризации. Дерево населено так называемыми ОТТ элементами (коробками) от 162а до 162е для первой параметризации и от 164а до 164е для второй параметризации.
Каждый ОТТ элемент повышает (возводит) моновходной сигнал в два выходных аудиосигнала. Чтобы осуществить повышение (восхождение), каждый ОТТ элемент использует параметр ICC, описывающий желательную поперечную корреляцию (кросс-корреляция) между выходным сигналом и CLD параметром, описывающим относительные перепады уровней (разность уровней) между двумя выходными сигналами каждого ОТТ элемента.
Несмотря на структурное сходство двух параметризаций на фиг.5, которые отличаются по способу распространения (распределения) содержания звукового канала из монофонического низведенного 160. Например, в левой структуре дерева первый ОТТ элемент 162а производит первый выходной канал 166а и второй выходной канал 166b. Согласно фиг.5 первый выходной канал 166а содержит информацию о звуковых каналах левого переднего (громкоговорителя), правого переднего (громкоговорителя), центрального (громкоговорителя) и низкочастотного обогащенного канала. Второй сигнал 166b содержит только информацию о каналах объемного звучания, то есть о левом канале объемного звука и правом канале объемного звука. По сравнению со вторым применением (изобретения) выход первого ОТТ элемента значительно отличается от содержащихся звуковых каналов. Тем не менее многоканальный преобразователь параметра может применяться, если он основан на любом из двух приведенных выше способах. Если идея изобретения понимается и применяется правильно, то изобретение может использоваться в других канальных конфигурациях, отличающихся от описанных ниже. Из-за своей краткости (описания) несколько возможных применений данного изобретения сосредоточены в левой параметризации на фиг.5 без ограничения общности. Можно, кроме того, отметить, что фиг.5 служит только соответствующим отображением звуковой идеи MPEG, и что вычисления обычно выполняются не последовательно, поскольку можно было поверить изображению на фиг.5. Вообще вычисления могут быть выполнены параллельно, то есть выходные каналы могут производиться в одном единственном вычислительном шаге. В пунктах, описанных выше, битовый поток ПЗКО содержит (относительные) уровни каждого звукового объекта в низведенном (редуцированном) сигнале (для каждой временной частоты - отдельные, как -общепринятая практика - в пределах использования структуры частотного интервала, например, как фильтр-банк или преобразование время - частота).
Кроме того, данное изобретение не ограничено определенным уровнем воспроизведения (представления) объектов; описанное ниже иллюстрирует один метод для вычисления пространственных сигналов MPEG двоичного потока объемного звука, который основан на измерении мощности объекта, которая может быть получена из параметризации ПЗКО (SAOC) объекта(ов).
Из фиг.3 видно, что матрица воспроизведения W, которая генерируется (вырабатывается) весовыми параметрами (весовыми коэффициентами) и используется генератором параметра 108, чтобы картографировать (составить схему) Oi объектов для нужного количества выходных каналов (каналов вывода) (например, определенное количество громкоговорителя (ей)), имеет множество весовых параметров (коэффициентов), которые зависят от определенного индексного объекта i и индекса канала(ов). Весовой параметр (весовой коэффициент) wS [бета] i обозначает смешанный коэффициент усиления объектов i (1<=i<=N) в выходе на громкоговоритель s (1<=s<=М). Таким образом, W преобразовывает (отмечает) объекты о=[ох…oN]<r>в громкоговорителях, производя выходящие сигналы для каждого громкоговорителя (здесь имеется в виду установка 5.1) y=[yLf yRfyc yLFEyLsyRs], таким образом:
Y=W0
Генератор параметра (устройство воспроизведения) 108 использует матрицу воспроизведения W, чтобы подсчитать все CLD и ICC параметры, основанные на данных ПЗКО σi2. Из изображения на фиг.5 становится понятным, что этот процесс должен быть выполнен отдельно для каждого ОТТ элемента. Детально рассмотрим первый ОТТ элемент 162а, так как информация в следующих разделах относится к оставшимся ОТТ элементам без дальнейшего изобретательского таланта.
Поскольку можно определить, что первый выходной сигнал 166а ОТТ элемента 162а в дальнейшем обрабатывается ОТТ элементами 162b, 162с и 162d, что приводит к появлению выходных каналов: LF, RF, С и LFE. Второй выходной канал 166b обрабатывается ОТТ элементом 162е, что приводит к возникновению выходных каналов LS (левый) и RS (правый). Замена ОТТ элементов на фиг.5 на одну единственную матрицу воспроизведения W может происходить при использовании следующей матрицы W:
Figure 00000001
Число N колонок матрицы W не установлено, поскольку N - число звуковых объектов, которые могут изменяться. Одна из возможностей получать пространственные сигналы - (CLD и ICC) для элемента ОТТ 162а состоит в том, что соответствующее применение каждого объекта к двум выходящим ОТТ элементам 0 было получено суммированием соответствующих элементов в W. Это суммирование дает матрице подпредставления W0 ОТТ элемент 0:
Figure 00000002
Проблема упрощается до оценки разности уровней, и корреляции для субвоспроизводства матрицы Wo (и для подобного определенного воспроизводства матриц Wi, W2, W3 и W4, связанного с элементами ОТТ 1, 2, 3 и 4 соответственно).
При условии, что сигналы объектов полностью несвязны (некогерентные) (то есть взаимно независимые), вычисленная мощность (ожидаемая мощность) первого выхода ОТТ элемента 0,/р0.i2 выражается:
Figure 00000003
Точно так же вычисленная мощность (ожидаемая мощность) второго выхода ОТТ элемента 0
Figure 00000004
выражается:
Figure 00000005
Перекрестная мощность R0 выражается:
Figure 00000006
CLD параметр для ОТТ элемента 0, следовательно, выражается:
Figure 00000007
и параметр ICC выражается:
Figure 00000008
На фиг.5 в левой части рассматриваются оба сигнала, для которых выходная мощность 1 и выходная мощность 2 определяются, как показано выше, - действительными сигналами (логическими сигналами), так как эти сигналы представляют комбинацию сигналов акустической системы и не составляют сами звуковые сигналы. В этом пункте подчеркивается, что древовидная структура на фиг.5 не используется для генерирования сигналов. Это означает, что в MPEG декодере объемного звука любые сигналы от одного до двух вместе не существуют. Вместо этого большая восходящая матрица (восхождения / возведения сигнала), использует низведение (редуцирование), и различные параметры, чтобы сгенерировать какие-либо сигналы в громкоговорителе (акустической системе). Ниже описана классификация или идентификация каналов левой конфигурации на фиг.5.
Для акустической колонки 162а первый виртуальный сигнал - это сигнал, представляющий комбинацию сигналов акустической системы lf, rf, с, lfe. Второй виртуальный сигнал - это виртуальный сигнал, представляющий комбинацию ls и rs.
Для акустической колонки 162b первый аудиосигнал является виртуальным сигналом и представляет группу, включающую левый фронтальный канал и правый фронтальный канал, и второй аудиосигнал является виртуальным и представляет группу, содержащую центральный канал и lfe канал.
Для акустической колонки 162е первый аудиосигнал является сигналом громкоговорителя для левого объемного канала и второй аудиосигнал является сигналом громкоговорителя для правого объемного канала.
Для акустической колонки 162с первый аудиосигнал является сигналом громкоговорителя для левого фронтального канала и второй аудиосигнал является сигналом громкоговорителя для правого фронтального канала.
Для акустической колонки 162d первый аудиосигнал является сигналом громкоговорителя для центрального канала и второй аудиосигнал является сигналом громкоговорителя для низкочастотного усиленного канала.
В данных акустических колонках значения весовых коэффициентов для первого аудиосигнала или второго аудиосигнала определяют при помощи комбинирования параметров воспроизведения объекта, связанных с каналами, представленными первым звуковым сигналом или вторым звуковым сигналом, как будет показано ниже.
Ниже описана группировка или идентификация каналов для правой конфигурации на фиг.5.
Для акустической колонки 164а первый звуковой сигнал - виртуальный сигнал, который представляет группу, включающую левый фронтальный канал, левый канал объемного звука, правый фронтальный канал и правый канал объемного звука; второй звуковой сигнал - виртуальный сигнал, который представляет группу, включающую центральный канал и низкочастотный усиленный канал.
Для акустической колонки 164b первый звуковой сигнал - виртуальный сигнал, который представляет группу, включающую левый фронтальный канал, левый канал объемного звука; второй звуковой сигнал - виртуальный сигнал и представляет группу, включающую правый фронтальный канал и правый канал объемного звука.
Для акустической колонки 164е первый звуковой сигнал - сигнал громкоговорителя для центрального канала, и второй звуковой сигнал - сигнал громкоговорителя (акустической системы) для низкочастотного усиленного канала.
Для акустической колонки 164с первый звуковой сигнал - сигнал громкоговорителя для левого фронтального канала, и второй звуковой сигнал - сигнал громкоговорителя для левого канала объемного звука.
Для акустической колонки 164d первый звуковой сигнал - сигнал громкоговорителя для правого фронтального канала, и второй звуковой сигнал - сигнал громкоговорителя для правого канала объемного звука.
В этих акустических колонках весовые коэффициенты (параметры) для первого звукового сигнала или второго звукового сигнала определяются при помощи комбинирования параметров воспроизведения объекта, связанных с каналами, представленными первым звуковым сигналом или вторым звуковым сигналом, это будет показано ниже.
Вышеупомянутые виртуальные сигналы являются виртуальными, так как им не обязательно участвовать в осуществлении изобретения. Эти виртуальные сигналы используются, чтобы показать процесс генерирования значения мощности или распределения энергии, которая определена с помощью CLD для всех акустических колонок, например, при использовании различных матриц Wi вторичного воспроизведения (далее - воспроизведения). При этом на фиг.5 первым приведено описание левой стороны.
Выше приведена воспроизводящая матрица Wo для акустической колонки 162а.
Для акустической колонки 162b воспроизводящая матрица определена в виде:
Figure 00000009
Для (акустической) коробки 162е воспроизводящая матрица определена в виде:
Figure 00000010
Для (акустической) коробки 162с воспроизводящая матрица определена в виде:
Figure 00000011
Для 162d воспроизводящая матрица определена в виде:
Figure 00000012
Для правой конфигурации на фиг.5 ситуация следующая.
Для акустической колонки 164 а воспроизводящая матрица определена в виде:
Figure 00000013
Для акустической колонки 164b воспроизводящая матрица определена в виде:
Figure 00000014
Для акустической колонки 164е воспроизводящая матрица определена в виде:
Figure 00000015
Для акустической колонки 164с воспроизводящая матрица выглядит так:
Figure 00000016
Для акустической колонки 164d воспроизводящая матрица выглядит так:
Figure 00000017
В зависимости от применения изобретения соответствующие CLD и ICC параметры могут быть квантованными (оцифрованными) и форматированными (отформатированными), чтобы вписаться в битовый поток MPEG объемного звука, который может подаваться в MPEG декодер 100 объемного звука. Наоборот - значения параметра можно передать MPEG декодеру объемного звука на уровне параметра выходного уровня, то есть без квантования и без форматирования сразу в битовый поток. Все это нужно, чтобы произвести не только согласование объектов, то есть распределение соответственно этих сигнальных энергий, которые могут быть выработаны, используя вышеупомянутый подход с использованием структуры MPEG-2 на фиг.5, также это используется, чтобы осуществлять ослабление или увеличение; так называемое низведенное усиление, может также генерироваться для модификации низведенной сигнальной энергии. Произвольно выбранные коэффициенты усиления при низведении (понижающем микшировании) (ADG) учитывают спектральную модификацию непосредственно низведенного сигнала, прежде чем он будет обработан одним из SAOC элементов. Таким образом, ADG сами по себе частотно зависимы. Для эффективного использования изобретения произвольно низведенные коэффициенты усиления (параметр, показывающий, во сколько раз выходной сигнал отличается от входного) представлены с тем же частотным разрешением и с теми же шагами квантователя (преобразователя непрерывных данных в дискретные или цифровые) как у CLD параметров. Главная цель применения ADGs состоит в том, чтобы видоизменить переданное низведение сигнала таким образом, чтобы распределение энергии во входящем низведенном сигнале входа было схоже с энергией низведения, проигрываемой системой выхода. Используя параметры весового коэффициента Wk,i матрицы воспроизведения W и передаваемых значений мощностей объекта σi2, можно вычислить соответствующие ADGs, используя следующее уравнение:
Figure 00000018
,
при этом предполагается, что мощность входящего низведенного сигнала равна сумме значений мощностей объекта (i = индекс объекта, k = индекс канала).
Как предварительно обсуждалось, при подсчете CLD и ICC параметров используются параметры весового коэффициента, указывающие на то, что часть энергии сигнала аудиообъекта, связанного с громкоговорителями многоканальной конфигурации акустической системы. Эти весовые коэффициенты в основном будут зависеть от данных звукового поля и данных конфигурации воспроизведения, то есть - от относительного местоположения звуковых объектов и громкоговорителей многоканальной установки акустической системы. В следующих разделах будет описана возможность определения параметров весового коэффициента, основанных на согласовании аудиообъекта, показанного на фиг.4, используя угол азимута и измерение коэффициента усиления как параметры объекта, связанные с каждым звуковым объектом.
Как уже было подчеркнуто выше, существуют независимые воспроизводящие матрицы для каждой ячейки времени/частоты; однако в последующем только одна единственная ячейка времени/частоты будет рассматриваться для внесения ясности. Матрица воспроизведения W имеет М линий (одна для каждого выходного канала) и N колонок (одна для каждого звукового объекта), где матричный элемент в линии s и колонке i представляет собой комбинацию, в которой специфический звуковой объект вносит свой вклад в соответствующий канал выхода:
Figure 00000019
Матричные элементы вычисляются из следующего описания звукового поля и параметров конфигурации акустической системы:
описание звукового поля (эти параметры могут варьироваться с течением времени):
- Число звуковых объектов: N>=1
- Азимутальный угол для каждого звукового объекта: αi(1<=i≤N)
- Полученные значения (значения коэффициента усиления) для каждого объекта: gi (I<i≤N)
Конфигурация акустической системы (обычно эти параметры являются инвариантными во времени):
- Число каналов выхода (=количеству громкоговорителей): М>=2
- Азимутальный угол для каждого громкоговорителя: θs (1<=s<=М)
- θs<=θs+1+∀s, где 1<=s<=M-l
Элементы матрицы смешения получаются из этих параметров, по следующей схеме для каждого звукового объекта i:
- Найти индекс s'(1<=s'<=М) с θs≤αi≤θs'+lм+i:= θl+2π)
- Применить амплитудное согласование (например, по формуле тангенса) между громкоговорителями s' и s'+1 (между громкоговорителями М и 1 в случае s'=М). В следующем описании переменные v - весовые коэффициенты согласования, то есть маштабирующие факторы, которые будут применены к сигналу, когда он распределяется между двумя каналами как, например, показано на фиг.4:
Figure 00000020
Figure 00000021
1≤p≤2.
Что касается вышеупомянутых уравнений, можно отметить, что в двумерном случае сигнал аудиообъекта, связанный со звуковым объектом пространственного звукового поля, будет распределен между двумя громкоговорителями многоканальной конфигурации акустической системы, которые находятся ближе всего к звуковому объекту. Однако параметры объекта, выбранные для вышеупомянутого действия, не единственные параметры объекта, которые могут использоваться, чтобы осуществить дальнейшие воплощения данного изобретения. Например, в трехмерном случае параметры объекта, указывающие на местоположение громкоговорителей или звуковых объектов, могут быть трехмерными векторами. Вообще, два параметра требуются для двумерного случая, и три параметра требуются для трехмерного случая, когда местоположение громкоговорителей должно быть однозначно определено. Однако даже в двумерном случае различные параметризации могут использоваться, например, для передачи двух координат в пределах прямоугольной системы координат. Кроме того, можно отметить, что дополнительный параметр согласования р, который находится в пределах диапазона 1-2, является произвольным стандартным линейным параметром, который устанавливается для отражения свойств акустики комнаты воспроизводящей системы/комнаты и который согласно некоторым функциям данного изобретения применяется дополнительно. Весовые параметры Ws/i могут определяться согласно следующей формуле, после того, как весовые параметры V1,i, и V2,i были получены согласно вышеупомянутым уравнениям. Матричные элементы окончательно определяются следующими уравнениями:
Figure 00000022
Предварительно введен коэффициент gi, который произвольно связан с каждым звуковым объектом, может использоваться, чтобы усилить или подавить индивидуальные объекты. Это может происходить уже на стороне приема сигнала, то есть в декодере, чтобы улучшать ясность индивидуально выбранных звуковых объектов.
Следующий пример звукового объекта 152 на фиг.4 опять таки должен использоваться, чтобы разъяснить применение вышеупомянутых уравнений. Пример использует ITU-R BS.775-1, соответствующий 3/2- каналу, что уже рассматривалось выше. Целью этого является получение направления согласования аудиообъекта, охарактеризованное азимутальным углом α1=60°, с произвольным согласованным коэффициентом усиления gi из 1 (то есть 0 децибелов). С этим примером комната воспроизведения должна показать некоторое отражение, согласованное с помощью параметра усиления р=2. Согласно фиг.4 установлено, что самые близко расположенные по отношению друг к другу громкоговорители - это правый фронтальный громкоговоритель 156b и правый громкоговоритель объемного звука 156с. Поэтому согласующие весовые параметры могут высчитываться с помощью следующего уравнения:
Figure 00000023
Figure 00000024
После некоторых математических подсчетов можно прийти к следующему решению:
v1,i≈0.8374; v2,i≈0.5466
Поэтому согласно вышеупомянутым инструкциям весовые параметры (матричные элементы) связаны с определенным звуковым объектом, который расположен по направлению αI, выражаются следующим образом:
W1=w2=w3=0; w4=0.8374; w5=0/5466
Вышеизложенное рассматривает применение данного изобретения в деталях. Для этого используются только те звуковые объекты, которые представляют собой монофонический сигнал, то есть точечные источники. Однако это гибкое понятие не ограничено применением с монофоническими звуковыми источниками. Наоборот, один объект или больше, которые должны рассматриваться как пространственно "разнесенные", также хорошо соответствует функции изобретения. Многоканальные параметры должны вырабатываться соответствующим образом, когда воспроизводятся источники или звуковые объекты, которые не являются точечными. Соответствующая мера для определения степени рассеянности между одним или более звуковыми объектами является ICC параметром поперечной корреляции объекта.
В системе SAOC все звуковые объекты должны быть точечными источниками, то есть парными некоррелированными монозвуковыми источниками без любого пространственного протяжения. Однако существуют дополнительные способы использования изобретения, в которых звуковые объекты могут содержать больше одного звукового канала и проявляя определенную степень попарной (де) корреляции. Самый простой и вероятно самый важный случай из всех перечисленных представлен стереообъектами, то есть объектами, состоящими из двух более или менее коррелированных каналов, которые соответствуют друг другу. Для примера, подобный объект может быть в виде пространственного представления, произведенного симфоническим оркестром. Чтобы выровнять стереообъекты в монозвуковые объекты системы, как это описано выше, оба канала стереообъекта рассматриваются как индивидуальные объекты. Взаимосвязь обоих объектов частично отражена дополнительным параметром поперечной корреляции, который вычисляется, основываясь на той же самой временной/частотной сетке, которая применяется для определения значения мощности дополнительной полосы σi2. Другими словами: стереообъект определяется рядом тремя параметрами {σi2, σj2, ICCij) временно/частотной ячейки, где ICCij обозначает попарную корреляцию между двумя воспроизведениями одного объекта. Эти две реализации обозначены как индивидуальные объекты i и j, имеющие в наличии попарную корреляцию ICCij).
Для корректного воспроизведения стереообъектов SAOC декодер должен обеспечить необходимые значения, чтобы установить правильную корреляцию между теми каналами воспроизведения, которые участвуют в воспроизведении стереообъектов, таким образом, чтобы вклад стереообъекта в соответствующие каналы показывал корреляцию в соответствии с ICCij параметра. От SAOC до MPEG транскодера объемного звука, который способен обрабатывать стереообъекты и, в свою очередь, должен определять параметры ICC для ОТТ колонок, которые участвуют в процессе воспроизведения связанных сигналов, таким образом, что количество декорреляций между каналами выхода MPEG декодера объемного звука соответствует данному условию.
Чтобы сделать так по сравнению с примером, данным в предыдущей разделе описания, необходимо произвести вычисление мощностей po,i и ро,2, а перекрестная мощность R0 должна измениться. Суммируя индексы двух аудиообъектов, которые вместе друг с другом формируют стереообъект i1 и i2, формула изменяется следующим образом:
Figure 00000025
,
Figure 00000026
,
Figure 00000027
.
Очевидно, что в случае ICCi1,i2 ∀ i1≠i2 и ICCi1,i2=1, в других случаях эти уравнения идентичны данным, указанным в предыдущих разделах.
Способность использования стереообъектов имеет очевидное преимущество, которое заключается в том, что качество воспроизведения пространственного звукового поля может быть увеличено в значительной степени, когда звуковые источники, кроме точечных источников, используются соответствующим образом. Кроме того, выработка пространственного звукового поля может выполняться более эффективно, когда есть возможность использования предварительно смешанных стереосигналов, которые широко доступны для большего числа звуковых объектов.
Следующие ниже положения покажут, что суть изобретения позволяет производить интеграцию точечных источников, которые имеют "врожденную" рассеянность. Помимо объектов, которые представлены точечными источниками как в предыдущих примерах, один или больше объектов могут также расцениваться как 'рассеяние'. Количество (степень) рассеяния может характеризоваться с помощью поперечной корреляции параметра ICCi,i, базированного на объекте. Для ICCi,i=1 объект i представляет собой точечный источник, в то время как для ICCi,i=0 объект максимально отражен. Данное объектно-зависимое рассеивание может быть суммировано в уравнениях, данных выше, при условии заполнения правильными показателями ICCi,i.
Когда используются стереообъекты, весовые факторы матрицы М должны быть адаптированы к этому. Однако адаптация может быть выполнена без использования данного изобретения; что касается обработки стереообъектов, два положения азимута (представляющие показатели азимута левого и правого "края" стереообъекта) преобразуются в матричные элементы воспроизведения.
Как уже было сказано, элементы воспроизводящей матрицы определяются индивидуально для различных ячеек времени/частоты и действительно отличаются друг от друга, независимо от типа звуковых используемых объектов.
Изменение в течение долгого времени может, например, отразить взаимодействие пользователя, через которое согласованные углы и значения коэффициента усиления для каждого индивидуального объекта могут изменяться произвольно в течение времени. Изменение по частоте позволяет влиять на различные особенности пространственного восприятия звукового поля, как частотная корреляция.
При осуществлении данного изобретения используется многоканальный преобразователь параметра, который позволяет достигнуть множество новых, не доступных до этого, применений и использований. В общем, функциональные возможности SAOC могут быть охарактеризованы как эффективное кодирование и интерактивное воспроизведение звуковых объектов. Изобретение может дать большие преимущества для многочисленных применений, требующих интерактивный звук, то есть используя изобретенный многоканальный преобразователь параметра или изобретенный метод для многоканального преобразования параметра.
Например, полностью интерактивные сценарии телеконференций становятся выполнимыми. Текущие телекоммуникационные инфраструктуры (телефон телеконференций и т.д.) являются монофоническими. Таким образом, классическое кодирование звукового объекта не может применяться, так как это потребует передачи одного элементарного потока через звуковой объект. Однако эти обычные каналы передачи могут быть расширены в своих функциональных возможностях с помощью SAOC с одним низведенным каналом. Телекоммуникационные терминалы оборудованы SAOC, который является главным образом многоканальным преобразователем параметра или изобретенным транскодером (преобразователем) параметра объекта, которые могут взять несколько звуковых источников (объектов) и смешать их в единый монофонический низведенный сигнал, который передается совместимым способом при использовании существующих кодировщиков (например, кодировщиков речи). Вспомогательная информация (пространственные звуковые параметры объекта или параметры объекта) может быть передана скрытым, обратным совместимым способом. В то время как такие передовые терминалы производят выходной поток объекта, содержащий несколько звуковых объектов, известные терминалы будут воспроизводить низведенный сигнал. И наоборот, исходящий сигнал, который производится известными терминалами (то есть только низведенный сигнал) будет рассматриваться транскодером SAOC как единый звуковой объект.
Этот принцип показан на фиг.6а.
В телеконференции могут принимать участие с одной стороны (позиция 200 на фиг.6) А объектов (говорящих), тогда как с другой стороны 202 - В объектов (говорящих). Согласно SAOC параметры объекта могут быть переданы от первый группы участников 200 вместе со связанным низведенным сигналом 204, тогда как низведенный сигнал 206 может быть передан от второго группы участников телеконференции 202 первой группе участников 200, связанных параметрами звукового объекта для каждого В объекта на второй стороне 202. Огромное преимущество заключается в том, что выходной сигнал от множества говорящих может передаваться при использовании одного низведенного канала; а также в том, что даже дополнительно говорящие могут быть выделены на приемной стороне как дополнительные аудиообъектные параметры, связанные с индивидуальными говорящим, передаваемые в рамках низведенного сигнала.
Это позволяет пользователю выделить одного интересующего говорящего, применяя объектно-ориентированные коэффициенты усиления gi таким образом, что остальные говорящие почти не слышны. Это было бы невозможно при использовании известных устройств многоканальной аудиотехники, так как они воспроизводят первоначальное звуковое поле наиболее естественно, насколько это возможно и не позволяют пользователю выделить для себя отдельные звуковые объекты. Фиг.6b иллюстрирует более сложный сценарий, в котором телеконференция выполняется из трех мест 200, 202 и 208. Так как каждый участник может только принимать и посылать один звуковой сигнал, инфраструктура использует так называемые многоточечные блоки управления MCU 210. Каждый участок (место) 200, 202 и 208 связан с MCU 210. От каждой стороны до MCU 210 идет единый поток, содержащий сигнал от каждой стороны. Идущий вниз поток для каждой стороны является смешанными сигналами от всех других сторон, кроме собственного сигнала (так называемый N-1 сигнал).
Согласно предварительно обсужденному осуществлению изобретения и изобретенным параметрам транскодеров формат битового потока SAOC поддерживает способность объединять два или более потока от объектов, то есть два потока, которые имеют низведенный канал и параметры звукового объекта. Все это связано в единый поток вычисленным достаточно эффективным способом, то есть способом, не требующим полной предварительной реконструкции пространственного звукового поля от посылающей звук стороны. Такая комбинация поддерживается без декодирования и перекодирования объектов согласно данному изобретению. Такой способ кодировки пространственного звукового объекта особенно удается при использовании коммуникационных MPEG кодирующих устройств с небольшой задержкой, таких как ААС.
Другая область данного изобретения, которая представляет особый интерес, - это интерактивный звук для игр и т.п. Из-за его низкой вычислительной сложности и независимости от воспроизводящей установки SAOC идеально подходит для воспроизведения интерактивного звука, такого как игровые приложения. Звук также может воспроизводиться в зависимости от выходного терминала. Так, например, пользователь/игрок может непосредственно влиять на воспроизведение/смешивание текущего звукового поля. Двигаясь вокруг виртуального звукового пространства, звуки отражаются адаптированными параметрами воспроизведения. Использование гибких установок последовательности/битового потока SAOC позволяет воспроизводить нелинейные игровые истории, которыми управляет пользователь. Согласно дальнейшим воплощениям данного изобретения изобретенный SAOC кодировщик применяется в рамках игр с большим количеством игроков, в которых пользователь взаимодействует с другими игроками в одном виртуальном мире/эпизоде. Видео и звуковое поле для каждого отдельного пользователя основано на его положении и ориентации в виртуальном мире и воспроизводится соответственно на его/ее местном терминале. Общие параметры игры и специфические пользовательские данные (положение, индивидуальный звук; чат и т.д.), обмениваются между различными игроками с использованием одного игрового сервера. При использовании известной техники каждый индивидуальный звуковой источник не доступен по умолчанию для каждого игрового устройства (особенно пользовательский чат, специальные звуковые эффекты), в игре поле должно быть закодировано и послано каждому игроку как индивидуальный звуковой поток. При использовании SAOC для каждого игрока может быть составлен/объединен в соответствующий звуковой поток на общем сервере игры, этот поток передается игроку как единый звуковой поток (содержащий все необходимые и релевантные объекты), поток воспроизводится в правильном пространственном положении для каждого звукового объекта {- звуки других игроков).
Согласно дальнейшему осуществлению данного изобретения SAOC используется для того, чтобы воспроизводить музыку из кинофильма под контролем, подобным многоканальному смешиванию, используя возможность приспособить относительный уровень, пространственное положение и слышимость инструментов согласно желанию слушателя. Слушатель (пользователь) может:
- подавлять/уменьшать определенные инструменты для того, чтобы определенный инструмент звучал отдельно (по типу Karaoke);
- изменять оригинальное соединение, чтобы настроить звук по своему предпочтению (например, больше барабанов и меньше струнных инструментов для танцевальной вечеринки, или меньше барабанов и большего вокала для расслабляющей музыки);
- выбирать между различными вокальными треками (женский ведущий вокал поверх мужского ведущего вокала) согласно своему предпочтению.
Вышеупомянутые примеры показывают, что данное изобретение предназначено для широкого и разнообразного использования в таких ситуациях и применениях, которые ранее были не доступны. Эти применения возможны при использовании многоканального преобразователя параметра, показанного на фиг.7, или при осуществлении метода для генерирования когерентного параметра, указывающего на взаимодействие между первым и вторым звуковым сигналом и параметром выходного уровня, как показано на фиг.8.
Фиг.7 показывает дальнейшее применение данного изобретения. Многоканальный преобразователь параметра 300 имеет провайдер параметра объекта 302, который используется для того, чтобы обеспечить параметры объекта, по крайней мере, одним аудиообъектом, связанным с низведенным каналом, который, в свою очередь, генерируется при использовании аудиосигнала аудиообъекта, связанного со звуковым объектом. Многоканальный преобразователь параметра 300 имеет генератор параметра 304 для выработки когерентного параметра и параметра выходного уровня. Параметр когерентности указывает на взаимодействие первого и второго звукового сигнала воспроизведения многоканального звукового сигнала, связанного с многоканальной конфигурацией громкоговорителя и параметром выходного уровня, который указывает на энергетическое взаимоотношение между звуковыми сигналами. Многоканальные параметры генерируются с использованием параметров объекта и дополнительных параметров акустической системы, указывающих на расположение громкоговорителей (колонок) акустической системы многоканальной конфигурации, которая используется для воспроизведения.
Фиг.8 показывает пример использования изобретенного метода для генерирования когерентного параметра, указывающего на корреляцию между первым и вторым звуковым сигналом многоканального звукового сигнала, связанного с многоканальной конфигурацией акустической системы для выработки параметра выходного уровня, указывающего на энергетическое взаимоотношение между звуковыми сигналами. Для реализации этапа 310 обеспечиваются параметры объекта, по меньшей мере, для одного звукового объекта, связанные с низведенным каналом, который генерируется, при использовании сигнала звукового объекта, связанного с самим звуковым объектом. Параметры объекта включают параметр направления, который указывает расположение звукового объекта и энергетический параметр, указывающий на энергию сигнала звукового объекта.
На этапе преобразования 312 определяются параметр когерентности и параметр выходного уровня в комбинации с параметром направления и энергетическим параметром с дополнительными параметрами акустической системы, указывающими на расположение громкоговорителей многоканальной конфигурации акустической системы, которая используется для воспроизведения.
Дальнейшее использование изобретения связано с транскодером параметра объекта, для генерирования когерентного параметра, определяющего связь между двумя звуковыми сигналами воспроизводства многоканального звукового сигнала, связанного с многоканальной конфигурацией акустической системы. Использование изобретения также связано с генерированием параметра выходного уровня, указывающего на энергетическое соотношение между двумя звуковыми сигналами, основанными на пространственном звуковом закодированном битовом потоке объекта. Это устройство имеет декомпозер битового потока, чтобы извлекать низведенный канал и связанные параметры объекта из пространственного звукового закодированного битового потока объекта и многоканального преобразователя параметра, как было описано выше.
Альтернативно или дополнительно, транскодер параметра объекта содержит многоканальный генератор битового потока, чтобы комбинировать низведенный канал, параметр когерентности и параметр выходного уровня для получения многоканального воспроизведения многоканального сигнала или интерфейса для непосредственного вывода параметра выходного уровня и параметра когерентности без квантизации и/или энтропийного кодирования. Другой транскодер параметра объекта имеет интерфейс выхода для дальнейшего оперативного вывода низведенного канала вместе с параметром когерентности и параметром выходного уровня или имеет интерфейс хранения, связанный с выводным интерфейсом для хранения параметра выходного уровня и параметра когерентности на носителе данных.
Кроме того, транскодер содержит многоканальный преобразователь параметра, как было описано выше, который работает для получения многократного когерентного параметра и параметра входного уровня для различных пар звуковых сигналов, представляющих различные громкоговорители многоканальной конфигурации акустической системы.
В зависимости от определенных требований применения изобретенных методов эти методы могут использоваться на жестких дисках или в программном обеспечении. Применение может быть реализовано с использованием цифровых носителей данных, в частности дисков DVD или CD, имеющих электронно-считываемый контроль сохраненных на них сигналов, которые работают совместно с компьютерной системой, запрограммированной с возможностью выполнения изобретенных методов. Вообще, существующее изобретение поэтому и является компьютерным программным продуктом с кодом программы, который хранится на машиночитаемом носителе, предназначенном для взаимодействия с программируемой компьютерной системой под действием считываемых управляющих сигналов в виде программных кодов. Другими словами, изобретенные методы - это компьютерная программа, имеющая программный код для того, чтобы выполнить, по крайней мере, один из изобретенных методов, когда компьютерная программа установлена на компьютере. Поскольку все ранее сказанное подробно показало и описало специфические применения данного изобретения, люди, сведущие в уровне техники, поймут, что другие изменения по форме и в деталях могут быть сделаны, не отступая от духа и возможностей изобретения. Необходимо также понимать, что различные изменения могут быть сделаны в рамках приспособления к различным осуществлениям данного изобретения, не отступая от более широких понятий, раскрытых и понятных из следующей ниже формулы.

Claims (27)

1. Многоканальный преобразователь параметра для генерирования параметра выходного уровня, который указывает на энергетическое соотношение между первым звуковым сигналом и вторым звуковым сигналом при воспроизведении многоканального пространственного звукового сигнала; характеризующийся тем, что он содержит преобразователь параметра объекта для обеспечения объектных параметров для множества звуковых объектов, подключенный к каналу понижающего микширования в зависимости от объектных звуковых сигналов, связанных со звуковыми объектами; при этом параметры объекта содержат энергетический параметр для каждого звукового объекта, определяющий энергетическую информацию сигнала звукового объекта; и генератор параметра для получения параметра выходного уровня с помощью комбинирования энергических параметров и параметров воспроизведения объекта, которые связаны с конфигурацией воспроизведения.
2. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что он выполнен с возможностью генерирования параметра когерентности, определяющего корреляцию между первым и вторым звуковым сигналом воспроизведения многоканального звукового сигнала; и в котором генератор параметра приспособлен для того, чтобы получать параметр когерентности, основанный на параметрах воспроизведения объекта и энергетическом параметре.
3. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что, он выполнен с возможностью воспроизведения параметров объекта в зависимости от параметров расположения объекта, указывающих расположение звукового объекта.
4. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что в нем конфигурация воспроизведения содержит конфигурацию многоканального громкоговорителя и, в соответствии с которой параметры воспроизведения объекта зависят от параметров акустической системы, указывающих на расположение громкоговорителей конфигурации многоканальной акустической системы.
5. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что преобразователь объектного параметра выполнен с возможностью функционирования для обеспечения параметров объекта дополнительным параметром направления, указывающим на расположение объекта относительно нахождения слушателя; генератор многоканального преобразователя параметра функционирует так, чтобы использовать параметры воспроизведения объекта в зависимости от параметров акустической системы, указывающих на расположение акустических систем относительно положения слушателя и в зависимости от параметра направления.
6. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что преобразователь объектного параметра выполнен с возможностью функционирования для получения пользовательских входных параметров объекта, дополнительно содержащих параметр направления, который указывает задаваемое пользователем расположение объекта относительно положения слушателя в пределах конфигурации акустической системы; и генератор параметра функционирует так, чтобы использовать параметры воспроизведения объекта в зависимости от параметров акустической системы, указывающих на расположение акустических систем относительно положения слушателя и в зависимости от параметра направления ввода пользователя.
7. Многоканальный преобразователь параметра по п.4, характеризующийся тем, что преобразователь параметра объекта и генератор параметра функционируют, чтобы использовать параметр направления, определяющий угол в рамках плоскости отсчета;
плоскость отсчета также содержит акустические системы, указывающие расположение параметров акустической системы.
8. Многоканальный преобразователь параметра в по п.1, характеризующийся тем, что генератор параметра приспособлен для использования первого и второго весового параметра в качестве параметра воспроизведения объектов, которые указывают на то, что определенная часть энергии звукового объекта распределяется между первым и вторым громкоговорителем многоканальной акустическая системы, первый и второй весовые параметры зависят от параметров акустической системы, указывающих на расположение громкоговорителей многоканальной конфигурации акустической системы, такой что весовые параметры не равны нулю, когда параметры акустической системы показывают, что первый и второй громкоговорители находятся наиболее близко к звуковому объекту по сравнению другими громкоговорителями этой акустической системы.
9. Многоканальный преобразователь параметра по п.8, характеризующийся тем, что генератор параметра выполнен с возможностью использования весовых параметров, определяющих большую часть энергии звукового сигнала для первого громкоговорителя, когда параметры акустической системы указывают на наиболее близкое расстояние между первым громкоговорителем и расположением звукового объекта, чем между вторым громкоговорителем и расположением звукового объекта.
10. Многоканальный преобразователь параметра по п.8, характеризующийся тем, что генератор параметра содержит: генератор весового коэффициента для того, чтобы подавать первый и второй весовые параметры w1 и w2 в зависимости от параметров акустической системы Θ1 и Θ2 в первый и второй громкоговорители и в зависимости от параметра направления α звукового объекта, где параметры акустической системы Θ1 и Θ2 и параметр направления α указывают расположение громкоговорителей и звукового объекта относительно положения слушателя.
11. Многоканальный преобразователь параметра по п.10, характеризующийся тем, что генератор весового коэффициента выполнен с возможностью обеспечения весовых параметров w1 и w2 таким образом, чтобы выполнялись следующие уравнения:
Figure 00000028

Figure 00000029

где p - дополнительный согласующий линейный параметр, который установлен для отражения акустических свойств комнаты воспроизводящей системы/комнаты и определен как 1≤р≤2.
12. Многоканальный преобразователь параметра по п.10, характеризующийся тем, что генератор выполнен с возможностью дополнительного измерения весовых параметров, применяя общий мультипликативный усилитель, связанный со звуковым объектом.
13. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что генератор выполнен с возможностью получения параметра выходного уровня или параметра когерентности, основанных на первой оценочной мощности pk,1 связанной с первым звуковым сигналом, где первый звуковой сигнал предназначен для громкоговорителя и является виртуальным сигналом, который представляет собой группу сигналов громкоговорителя, и основанных на второй мощности pk,2, связанной со вторым звуковым сигналом, второй звуковой сигнал предназначен для разных громкоговорителей и является виртуальным сигналом, представляющим группу сигналов из различных громкоговорителей, первая мощность pk,1 первого звукового сигнала зависит от энергетических параметров и весовых параметров, связанных с первым звуковым сигналом, а вторая мощность pk,2 связана со вторым звуковым сигналом и зависит от энергетических и весовых параметров, связанных со вторым звуковым сигналом, где k - целое число, указывающее пару из множества различных пар первого и второго сигналов, а весовые параметры зависят от параметров воспроизведения объекта.
14. Многоканальный преобразователь параметра по п.13, характеризующийся тем, что генератор параметра обеспечивает возможность вычисления параметра уровня или параметра последовательности для k пар различных первых и вторых звуковых сигналов, и в котором первая и вторая мощность оценивает pk,1 и pk,2, связанные с первым и вторым звуковыми сигналами, которые основаны на следующих уравнениях, зависящий от энергетических параметров σi2, от весовых параметров w1,i, связанных с первым звуковым сигналом, и весовых параметров w2,j, связанных со вторым звуковым сигналом:
Figure 00000030

Figure 00000031

где i - индекс, указывающий звуковой объект из множества звуковых объектов,
k - целое число, указывающее пару множества пар различных первых и вторых сигналов.
15. Многоканальный преобразователь параметра по п.14, в котором k является равным нулю, в котором первый звуковой сигнал является виртуальным сигналом и представляет группу, включающую левый фронтальный канал, правый фронтальный канал, центральный канал и Ife канал, и в которых второй звуковой сигнал является виртуальным сигналом и представляет группу, включающую левый объемный канал и правый объемный канал, или в котором k является равным единице, в котором первый звуковой сигнал является виртуальным сигналом и представляет группу, включающую левый фронтальный канал, правый фронтальный канал, и в которых второй звуковой сигнал является виртуальным сигналом и представляет группу, включающую центральный канал и Ife канал, или в котором k является равным двум, в котором первый звуковой сигнал является сигналом акустической системы для левого объемного канала, и в котором второй звуковой сигнал является сигналом акустической системы для правого объемного канала, или k является равным трем, в котором первый звуковой сигнал является сигналом акустической системы для левого фронтального канала, и в котором второй звуковой сигнал является сигналом акустической системы для правого фронтального канала, или k является равным четырем, в котором первый звуковой сигнал является сигналом акустической системы для центрального канала, и в котором второй звуковой сигнал является сигналом акустической системы для низкочастотного усиливающего канала, и в котором весовые параметры для первого или второго звуковых сигналов определяются комбинацией воспроизводящих параметров объекта, связанных с каналами первым или вторым звуковым сигналом.
16. Многоканальный преобразователь параметра по п.14, характеризующийся тем, что k является равным нулю, в котором первый звуковой сигнал является виртуальным сигналом и представляет группу, включающую левый фронтальный канал, левый объемный канал, правый фронтальный канал и правый объемный канал, и в котором второй звуковой сигнал является виртуальным сигналом и представляет группу, включающую центральный канал и низкочастотный канал усиления, или в котором k является равным одному, в котором первый звуковой сигнал является виртуальным сигналом и представляет группу, включающую левый фронтальный канал, и левый объемный канал, и в котором второй звуковой сигнал является виртуальным сигналом и представляет группу, включающую правый фронтальный канал, и правый объемный канал, или в котором k является равным двум, в котором первый звуковой сигнал является сигналом акустической системы для центрального канала, и в котором второй звуковой сигнал является сигналом акустической системы для низкочастотного канала усиления, или в котором k является равным трем, в котором первый звуковой сигнал является сигналом акустической системы для левого фронтального канала, и в котором второй звуковой сигнал является сигналом акустической системы для левого объемного канала, или в котором k является равным четырем, в котором первый звуковой сигнал является сигналом акустической системы для правого фронтального канала, и в котором второй звуковой сигнал является сигналом акустической системы для правого объемного канала, и в котором весовые параметры для первого звукового сигнала или второго звукового сигнала получены комбинированием параметров воспроизведения объекта, связанных с каналами, представленными первым звуковым сигналом или вторым звуковым сигналом.
17. Многоканальный преобразователь параметра по п.13, характеризующийся тем, что генератор параметра приспособлен для получения параметра выходного уровня CLDk, основанного на следующем уравнении:
Figure 00000032
.
18. Многоканальный преобразователь параметра по п.13, характеризующийся тем, что генератор параметра приспособлен, чтобы получить параметр когерентности, основанный на взаимной оценке мощности Rk, связанный с первым и вторыми звуковыми сигналами, зависящими от параметров энергии
Figure 00000033
и от весовых параметров w1, связанных с первым звуковым сигналом и весовых параметров w2, связанных со вторым звуковым сигналом, где i - индекс, указывающий на звуковой объект из множества звуковых объектов.
19. Многоканальный преобразователь параметра по п.18, характеризующийся тем, что генератор параметра адаптирован для использования или получения оценки взаимной мощности Rk, основанной на следующем уравнении:
Figure 00000034
.
20. Многоканальный преобразователь параметра по п.18, характеризующийся тем, что генератор параметра адаптирован для использования или получения параметра когерентности ICC на основе уравнения:
Figure 00000035
.
21. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что преобразователь параметра адаптирован для получения параметра энергии для каждого звукового объекта и для каждой или множества частотных полос, и в котором генератор параметра выполнен с возможностью вычисления параметра уровня или параметра когерентности для каждой из частоты из полосы частот.
22. Многоканальный преобразователь параметра по п.1, характеризующийся тем, что генератор параметра функционирует с возможностью использования использовать различных параметров воспроизведения объекта для различных временных интервалов звукового сигнала объекта.
23. Многоканальный преобразователь параметра по п.8, характеризующийся тем, что генератор весового коэффициента функционирует, чтобы вырабатывать для каждого объекта i, весовых коэффициентов wr,i для r-th громкоговорителя в зависимости от параметров направления объекта αi и параметров громкоговорителя Θ, основанного на следующих уравнениях: для индекса s' (1≤s'≤M), где
θs'≤αi≤θs'+1M+1:=θ1+2π)
Figure 00000036
;
Figure 00000037
; 1≤P≤2.
Figure 00000038
24. Многоканальный преобразователь параметра по п.8, характеризующийся тем, что преобразователь параметра объекта адаптирован для использования или получения параметров для стерео объекта, стерео объект, имеющий первый стерео подобъект и второй стерео подобъект, параметры энергии, имеющие первый параметр энергии для первого подобъекта стерео звукового объекта, второй параметр энергии для второго подобъекта стерео звукового объекта и параметра корреляции стерео, параметр корреляции стерео, указывающий корреляцию между подобъектами стерео объекта; и в котором генератор параметра функционирует, чтобы получить параметр когерентности или параметр выходного уровня, дополнительно используя второй параметр энергии и параметр стерео корреляции.
25. Многоканальный преобразователь параметра по п.24, характеризующийся тем, что генератор параметра функционирует, чтобы получить параметр выходного уровня и параметр когерентности, основанный на оценке мощности p0,1, связанной с первым звуковым сигналом и оценкой мощности р0,2, связанной со вторым звуковым сигналом и взаимной корреляцией мощности R0, используя первый параметр энергии
Figure 00000039
, второй параметр энергии
Figure 00000040
и параметр стерео корреляции ICCi,j такой, что оценка мощности и оценка взаимной корреляции мощности могут быть охарактеризованы следующими уравнениями:
Figure 00000041
,
Figure 00000042
,
Figure 00000043
.
26. Способ генерирования пространственных звуковых параметров, включая параметр выходного уровня, определяющий энергетическое соотношение между первым звуковым сигналом и вторым звуковым сигналом воспроизведения многоканального пространственного звукового сигнала, включающий: обеспечение параметров объекта для множества звуковых объектов, связанных с низведенным каналом в зависимости от сигналов звукового объекта, связанных со звуковыми объектами, параметры объекта, включающие энергетический параметр для каждого звукового объекта, указывающего на информацию энергии сигнала звукового объекта; обеспечивая воспроизведение параметров объекта, которые связаны с конфигурацией воспроизведения; и получение параметра выходного уровня с помощью комбинирования энергетических параметров и параметров воспроизведения объекта.
27. Машиночитаемый носитель информации, на котором хранится компьютерная программа, имеющая программный код для выполнения при работе на компьютере способа генерирования пространственных звуковых параметров, включая параметр выходного уровня, определяющий энергетическое соотношение между первым звуковым сигналом и вторым звуковым сигналом и вторым звуковым сигналом воспроизведения многоканального пространственного звукового сигнала, включающего обеспечение параметров объекта для множества звуковых объектов, связанных с каналом низведения в зависимости от сигналов звукового объекта, связанных со звуковыми объектами, параметры объекта, включающие энергетический параметр для каждого звукового объекта, определяющий энергетическую информацию сигнала звукового объекта; обеспечивая воспроизведение параметров объекта, которые связаны с конфигурацией воспроизведения; и получение параметра выходного уровня с помощью комбинирования энергетических параметров и параметров воспроизведения объекта.
RU2009109125/09A 2006-10-16 2007-10-05 Аппаратура и метод многоканального параметрического преобразования RU2431940C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US82965306P 2006-10-16 2006-10-16
US60/829,653 2006-10-16

Publications (2)

Publication Number Publication Date
RU2009109125A RU2009109125A (ru) 2010-11-27
RU2431940C2 true RU2431940C2 (ru) 2011-10-20

Family

ID=39304842

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009109125/09A RU2431940C2 (ru) 2006-10-16 2007-10-05 Аппаратура и метод многоканального параметрического преобразования

Country Status (15)

Country Link
US (1) US8687829B2 (ru)
EP (2) EP2437257B1 (ru)
JP (2) JP5337941B2 (ru)
KR (1) KR101120909B1 (ru)
CN (1) CN101529504B (ru)
AT (1) ATE539434T1 (ru)
AU (1) AU2007312597B2 (ru)
BR (1) BRPI0715312B1 (ru)
CA (1) CA2673624C (ru)
HK (1) HK1128548A1 (ru)
MX (1) MX2009003564A (ru)
MY (1) MY144273A (ru)
RU (1) RU2431940C2 (ru)
TW (1) TWI359620B (ru)
WO (1) WO2008046530A2 (ru)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2610416C2 (ru) * 2012-01-17 2017-02-10 Гибсон Инновейшенс Бельгиум Н.В. Воспроизведение многоканального аудио
RU2613731C2 (ru) * 2012-12-04 2017-03-21 Самсунг Электроникс Ко., Лтд. Устройство предоставления аудио и способ предоставления аудио
RU2630187C1 (ru) * 2015-08-11 2017-09-05 Сяоми Инк. Способ и устройство для осуществления записи объектного аудиосигнала и электронная аппаратура
RU2646375C2 (ru) * 2013-05-13 2018-03-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выделение аудиообъекта из сигнала микширования с использованием характерных для объекта временно-частотных разрешений
RU2655994C2 (ru) * 2013-04-26 2018-05-30 Сони Корпорейшн Устройство обработки звука и система обработки звука
US11968516B2 (en) 2013-04-26 2024-04-23 Sony Group Corporation Sound processing apparatus and sound processing system

Families Citing this family (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11106424B2 (en) 2003-07-28 2021-08-31 Sonos, Inc. Synchronizing operations among a plurality of independently clocked digital data processing devices
US8290603B1 (en) 2004-06-05 2012-10-16 Sonos, Inc. User interfaces for controlling and manipulating groupings in a multi-zone media system
US11650784B2 (en) 2003-07-28 2023-05-16 Sonos, Inc. Adjusting volume levels
US8234395B2 (en) 2003-07-28 2012-07-31 Sonos, Inc. System and method for synchronizing operations among a plurality of independently clocked digital data processing devices
US11294618B2 (en) 2003-07-28 2022-04-05 Sonos, Inc. Media player system
US11106425B2 (en) 2003-07-28 2021-08-31 Sonos, Inc. Synchronizing operations among a plurality of independently clocked digital data processing devices
US9977561B2 (en) 2004-04-01 2018-05-22 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to provide guest access
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8868698B2 (en) 2004-06-05 2014-10-21 Sonos, Inc. Establishing a secure wireless network with minimum human intervention
US8326951B1 (en) 2004-06-05 2012-12-04 Sonos, Inc. Establishing a secure wireless network with minimum human intervention
WO2007028094A1 (en) * 2005-09-02 2007-03-08 Harman International Industries, Incorporated Self-calibrating loudspeaker
US8249283B2 (en) * 2006-01-19 2012-08-21 Nippon Hoso Kyokai Three-dimensional acoustic panning device
KR101294022B1 (ko) * 2006-02-03 2013-08-08 한국전자통신연구원 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US9202509B2 (en) 2006-09-12 2015-12-01 Sonos, Inc. Controlling and grouping in a multi-zone media system
US8788080B1 (en) 2006-09-12 2014-07-22 Sonos, Inc. Multi-channel pairing in a media system
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
EP2092516A4 (en) 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
MX2008012918A (es) * 2006-11-24 2008-10-15 Lg Electronics Inc Metodo de codificacion y decodificacion de señal de audio y aparato para los mismo.
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
JP5209637B2 (ja) 2006-12-07 2013-06-12 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
EP2595150A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for coding multi-object audio signals
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
WO2008096313A1 (en) * 2007-02-06 2008-08-14 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
CN101542596B (zh) * 2007-02-14 2016-05-18 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
WO2008100098A1 (en) 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
KR20080082917A (ko) * 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
CN101675472B (zh) * 2007-03-09 2012-06-20 Lg电子株式会社 用于处理音频信号的方法和装置
US8639498B2 (en) * 2007-03-30 2014-01-28 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
US8385556B1 (en) * 2007-08-17 2013-02-26 Dts, Inc. Parametric stereo conversion system and method
BRPI0816669A2 (pt) * 2007-09-06 2015-03-17 Lg Electronics Inc Método e um aparelho de decodificação de um sinal de áudio
KR101244515B1 (ko) * 2007-10-17 2013-03-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 업믹스를 이용한 오디오 코딩
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
AU2013200578B2 (en) * 2008-07-17 2015-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
EP2194526A1 (en) * 2008-12-05 2010-06-09 Lg Electronics Inc. A method and apparatus for processing an audio signal
WO2010066271A1 (en) * 2008-12-11 2010-06-17 Fraunhofer-Gesellschaft Zur Förderung Der Amgewamdten Forschung E.V. Apparatus for generating a multi-channel audio signal
US8255821B2 (en) * 2009-01-28 2012-08-28 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8504184B2 (en) 2009-02-04 2013-08-06 Panasonic Corporation Combination device, telecommunication system, and combining method
BR122019023947B1 (pt) * 2009-03-17 2021-04-06 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
KR101805212B1 (ko) 2009-08-14 2017-12-05 디티에스 엘엘씨 객체-지향 오디오 스트리밍 시스템
WO2011039195A1 (en) 2009-09-29 2011-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
BR122021008665B1 (pt) * 2009-10-16 2022-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mecanismo e método para fornecer um ou mais parâmetros ajustados para a provisão de uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação lateral paramétrica associada com a representação de sinal downmix, usando um valor médio
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
WO2011061174A1 (en) 2009-11-20 2011-05-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
KR101405976B1 (ko) 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
CN113490133B (zh) 2010-03-23 2023-05-02 杜比实验室特许公司 音频再现方法和声音再现系统
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
US9078077B2 (en) * 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
US11429343B2 (en) 2011-01-25 2022-08-30 Sonos, Inc. Stereo playback configuration and control
US11265652B2 (en) 2011-01-25 2022-03-01 Sonos, Inc. Playback device pairing
WO2012122397A1 (en) * 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
MX2013010537A (es) 2011-03-18 2014-03-21 Koninkl Philips Nv Codificador y decodificador de audio con funcionalidad de configuracion.
EP2523472A1 (en) 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
WO2012164444A1 (en) * 2011-06-01 2012-12-06 Koninklijke Philips Electronics N.V. An audio system and method of operating therefor
PL2727381T3 (pl) 2011-07-01 2022-05-02 Dolby Laboratories Licensing Corporation Sposób i urządzenie do renderowania obiektów audio
RU2617553C2 (ru) * 2011-07-01 2017-04-25 Долби Лабораторис Лайсэнзин Корпорейшн Система и способ для генерирования, кодирования и представления данных адаптивного звукового сигнала
US9253574B2 (en) 2011-09-13 2016-02-02 Dts, Inc. Direct-diffuse decomposition
WO2013054159A1 (en) 2011-10-14 2013-04-18 Nokia Corporation An audio scene mapping apparatus
US9966080B2 (en) 2011-11-01 2018-05-08 Koninklijke Philips N.V. Audio object encoding and decoding
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
KR101945917B1 (ko) * 2012-05-03 2019-02-08 삼성전자 주식회사 오디오 신호 처리 방법 및 이를 지원하는 단말기
US9622014B2 (en) 2012-06-19 2017-04-11 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
KR101950455B1 (ko) * 2012-07-31 2019-04-25 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
CN104541524B (zh) * 2012-07-31 2017-03-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
KR101949756B1 (ko) * 2012-07-31 2019-04-25 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
KR101949755B1 (ko) * 2012-07-31 2019-04-25 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
US9489954B2 (en) * 2012-08-07 2016-11-08 Dolby Laboratories Licensing Corporation Encoding and rendering of object based audio indicative of game audio content
AU2013301864B2 (en) 2012-08-10 2016-04-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and methods for adapting audio information in spatial audio object coding
WO2014035902A2 (en) * 2012-08-31 2014-03-06 Dolby Laboratories Licensing Corporation Reflected and direct rendering of upmixed content to individually addressable drivers
AU2013314299B2 (en) * 2012-09-12 2016-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for providing enhanced guided downmix capabilities for 3D audio
WO2014053875A1 (en) 2012-10-01 2014-04-10 Nokia Corporation An apparatus and method for reproducing recorded audio with correct spatial directionality
KR20140046980A (ko) 2012-10-11 2014-04-21 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
WO2014099285A1 (en) * 2012-12-21 2014-06-26 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
US10068579B2 (en) * 2013-01-15 2018-09-04 Electronics And Telecommunications Research Institute Encoding/decoding apparatus for processing channel signal and method therefor
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
EP2974010B1 (en) 2013-03-15 2021-08-18 DTS, Inc. Automatic multi-channel music mix from multiple audio stems
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
KR102148217B1 (ko) * 2013-04-27 2020-08-26 인텔렉추얼디스커버리 주식회사 위치기반 오디오 신호처리 방법
US9905231B2 (en) 2013-04-27 2018-02-27 Intellectual Discovery Co., Ltd. Audio signal processing method
UA113692C2 (xx) 2013-05-24 2017-02-27 Кодування звукових сцен
EP3005356B1 (en) 2013-05-24 2017-08-09 Dolby International AB Efficient coding of audio scenes comprising audio objects
KR102033304B1 (ko) 2013-05-24 2019-10-17 돌비 인터네셔널 에이비 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
CN105229731B (zh) 2013-05-24 2017-03-15 杜比国际公司 根据下混的音频场景的重构
CN104240711B (zh) 2013-06-18 2019-10-11 杜比实验室特许公司 用于生成自适应音频内容的方法、系统和装置
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830335A3 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
PT3022949T (pt) * 2013-07-22 2018-01-23 Fraunhofer Ges Forschung Descodificador de áudio multicanal, codificador de áudio de multicanal, métodos, programa de computador e representação de áudio codificada usando uma descorrelação dos sinais de áudio renderizados
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
JP6212645B2 (ja) 2013-09-12 2017-10-11 ドルビー・インターナショナル・アーベー オーディオ・デコード・システムおよびオーディオ・エンコード・システム
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
ES2641538T3 (es) 2013-09-12 2017-11-10 Dolby International Ab Codificación de contenido de audio multicanal
US9071897B1 (en) * 2013-10-17 2015-06-30 Robert G. Johnston Magnetic coupling for stereo loudspeaker systems
WO2015059154A1 (en) * 2013-10-21 2015-04-30 Dolby International Ab Audio encoder and decoder
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US10034117B2 (en) 2013-11-28 2018-07-24 Dolby Laboratories Licensing Corporation Position-based gain adjustment of object-based audio and ring-based channel audio
US10063207B2 (en) * 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
JP6863359B2 (ja) * 2014-03-24 2021-04-21 ソニーグループ株式会社 復号装置および方法、並びにプログラム
EP2925024A1 (en) 2014-03-26 2015-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio rendering employing a geometric distance definition
JP6374980B2 (ja) 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
WO2015152661A1 (ko) * 2014-04-02 2015-10-08 삼성전자 주식회사 오디오 오브젝트를 렌더링하는 방법 및 장치
US10331764B2 (en) * 2014-05-05 2019-06-25 Hired, Inc. Methods and system for automatically obtaining information from a resume to update an online profile
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
WO2016004258A1 (en) 2014-07-03 2016-01-07 Gopro, Inc. Automatic generation of video and directional audio from spherical content
CN105320709A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 终端设备上的信息提示方法及装置
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
US9883309B2 (en) * 2014-09-25 2018-01-30 Dolby Laboratories Licensing Corporation Insertion of sound objects into a downmixed audio signal
EP3540732B1 (en) * 2014-10-31 2023-07-26 Dolby International AB Parametric decoding of multichannel audio signals
US9560467B2 (en) * 2014-11-11 2017-01-31 Google Inc. 3D immersive spatial audio systems and methods
WO2016126816A2 (en) 2015-02-03 2016-08-11 Dolby Laboratories Licensing Corporation Post-conference playback system having higher perceived quality than originally heard in the conference
WO2016126819A1 (en) 2015-02-03 2016-08-11 Dolby Laboratories Licensing Corporation Optimized virtual scene layout for spatial meeting playback
CN104732979A (zh) * 2015-03-24 2015-06-24 无锡天脉聚源传媒科技有限公司 一种音频数据的处理方法及装置
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
CA3219512A1 (en) 2015-08-25 2017-03-02 Dolby International Ab Audio encoding and decoding using presentation transform parameters
US9877137B2 (en) 2015-10-06 2018-01-23 Disney Enterprises, Inc. Systems and methods for playing a venue-specific object-based audio
US9949052B2 (en) 2016-03-22 2018-04-17 Dolby Laboratories Licensing Corporation Adaptive panner of audio objects
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
US10861467B2 (en) 2017-03-01 2020-12-08 Dolby Laboratories Licensing Corporation Audio processing in adaptive intermediate spatial format
AU2018368588B2 (en) 2017-11-17 2021-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions
US11032580B2 (en) 2017-12-18 2021-06-08 Dish Network L.L.C. Systems and methods for facilitating a personalized viewing experience
US10365885B1 (en) 2018-02-21 2019-07-30 Sling Media Pvt. Ltd. Systems and methods for composition of audio content from multi-object audio
GB2572650A (en) * 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2574667A (en) * 2018-06-15 2019-12-18 Nokia Technologies Oy Spatial audio capture, transmission and reproduction
JP6652990B2 (ja) * 2018-07-20 2020-02-26 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
CN109257552B (zh) * 2018-10-23 2021-01-26 四川长虹电器股份有限公司 平板电视机音效参数设计方法
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
JP7176418B2 (ja) * 2019-01-17 2022-11-22 日本電信電話株式会社 多地点制御方法、装置及びプログラム
JP7092050B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム
JP7092049B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム
JP7092048B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム
CN113366865B (zh) * 2019-02-13 2023-03-21 杜比实验室特许公司 用于音频对象聚类的自适应响度规范化
US11937065B2 (en) * 2019-07-03 2024-03-19 Qualcomm Incorporated Adjustment of parameter settings for extended reality experiences
JP7443870B2 (ja) * 2020-03-24 2024-03-06 ヤマハ株式会社 音信号出力方法および音信号出力装置
CN111711835B (zh) * 2020-05-18 2022-09-20 深圳市东微智能科技股份有限公司 多路音视频整合方法、系统及计算机可读存储介质
WO2022042908A1 (en) * 2020-08-31 2022-03-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel signal generator, audio encoder and related methods relying on a mixing noise signal
KR102363652B1 (ko) * 2020-10-22 2022-02-16 주식회사 이누씨 멀티 오디오 분리 재생 방법 및 장치
CN112221138B (zh) * 2020-10-27 2022-09-27 腾讯科技(深圳)有限公司 虚拟场景中的音效播放方法、装置、设备及存储介质
WO2024076829A1 (en) * 2022-10-05 2024-04-11 Dolby Laboratories Licensing Corporation A method, apparatus, and medium for encoding and decoding of audio bitstreams and associated echo-reference signals
CN115588438B (zh) * 2022-12-12 2023-03-10 成都启英泰伦科技有限公司 一种基于双线性分解的wls多通道语音去混响方法

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69429917T2 (de) 1994-02-17 2002-07-18 Motorola Inc Verfahren und vorrichtung zur gruppenkodierung von signalen
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
JP2005093058A (ja) 1997-11-28 2005-04-07 Victor Co Of Japan Ltd オーディオ信号のエンコード方法及びデコード方法
JP3743671B2 (ja) 1997-11-28 2006-02-08 日本ビクター株式会社 オーディオディスク及びオーディオ再生装置
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US6788880B1 (en) 1998-04-16 2004-09-07 Victor Company Of Japan, Ltd Recording medium having a first area for storing an audio title set and a second area for storing a still picture set and apparatus for processing the recorded information
EP1370114A3 (en) 1999-04-07 2004-03-17 Dolby Laboratories Licensing Corporation Matrix improvements to lossless encoding and decoding
KR100392384B1 (ko) * 2001-01-13 2003-07-22 한국전자통신연구원 엠펙-2 데이터에 엠펙-4 데이터를 동기화시켜 전송하는장치 및 그 방법
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP2002369152A (ja) 2001-06-06 2002-12-20 Canon Inc 画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムが記憶されたコンピュータにより読み取り可能な記憶媒体
DE60225819T2 (de) * 2001-09-14 2009-04-09 Aleris Aluminum Koblenz Gmbh Verfahren zur beschichtungsentfernung von schrottteilen mit metallischer beschichtung
JP3994788B2 (ja) 2002-04-30 2007-10-24 ソニー株式会社 伝達特性測定装置、伝達特性測定方法、及び伝達特性測定プログラム、並びに増幅装置
EP1523862B1 (en) 2002-07-12 2007-10-31 Koninklijke Philips Electronics N.V. Audio coding
US7542896B2 (en) 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
JP2004151229A (ja) * 2002-10-29 2004-05-27 Matsushita Electric Ind Co Ltd 音声情報変換方法、映像・音声フォーマット、エンコーダ、音声情報変換プログラム、および音声情報変換装置
JP2004193877A (ja) 2002-12-10 2004-07-08 Sony Corp 音像定位信号処理装置および音像定位信号処理方法
CN1765153A (zh) 2003-03-24 2006-04-26 皇家飞利浦电子股份有限公司 表示多信道信号的主和副信号的编码
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7555009B2 (en) 2003-11-14 2009-06-30 Canon Kabushiki Kaisha Data processing method and apparatus, and data distribution method and information processing apparatus
JP4378157B2 (ja) 2003-11-14 2009-12-02 キヤノン株式会社 データ処理方法および装置
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
EP1735779B1 (en) 2004-04-05 2013-06-19 Koninklijke Philips Electronics N.V. Encoder apparatus, decoder apparatus, methods thereof and associated audio system
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
JP2006101248A (ja) * 2004-09-30 2006-04-13 Victor Co Of Japan Ltd 音場補正装置
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP5106115B2 (ja) 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE602006015294D1 (de) 2005-03-30 2010-08-19 Dolby Int Ab Mehrkanal-audiocodierung
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
MX2008000122A (es) * 2005-06-30 2008-03-18 Lg Electronics Inc Metodo y aparato para codificar y descodificar una senal de audio.
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
JP5113049B2 (ja) * 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
US7765104B2 (en) * 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
WO2007032646A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR20080087909A (ko) * 2006-01-19 2008-10-01 엘지전자 주식회사 신호 디코딩 방법 및 장치
KR101294022B1 (ko) * 2006-02-03 2013-08-08 한국전자통신연구원 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치
WO2007089129A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
KR20080093422A (ko) 2006-02-09 2008-10-21 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치
TWI326448B (en) 2006-02-09 2010-06-21 Lg Electronics Inc Method for encoding and an audio signal and apparatus thereof and computer readable recording medium for method for decoding an audio signal
CN101411214B (zh) * 2006-03-28 2011-08-10 艾利森电话股份有限公司 用于多信道环绕声音的解码器的方法和装置
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
CA2656867C (en) 2006-07-07 2013-01-08 Johannes Hilpert Apparatus and method for combining multiple parametrically coded audio sources
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
BRPI0710923A2 (pt) 2006-09-29 2011-05-31 Lg Electronics Inc métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto
KR101012259B1 (ko) 2006-10-16 2011-02-08 돌비 스웨덴 에이비 멀티채널 다운믹스된 객체 코딩의 개선된 코딩 및 파라미터 표현

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2610416C2 (ru) * 2012-01-17 2017-02-10 Гибсон Инновейшенс Бельгиум Н.В. Воспроизведение многоканального аудио
RU2672178C1 (ru) * 2012-12-04 2018-11-12 Самсунг Электроникс Ко., Лтд. Устройство предоставления аудио и способ предоставления аудио
RU2613731C2 (ru) * 2012-12-04 2017-03-21 Самсунг Электроникс Ко., Лтд. Устройство предоставления аудио и способ предоставления аудио
US9774973B2 (en) 2012-12-04 2017-09-26 Samsung Electronics Co., Ltd. Audio providing apparatus and audio providing method
RU2695508C1 (ru) * 2012-12-04 2019-07-23 Самсунг Электроникс Ко., Лтд. Устройство предоставления аудио и способ предоставления аудио
US10341800B2 (en) 2012-12-04 2019-07-02 Samsung Electronics Co., Ltd. Audio providing apparatus and audio providing method
US10149084B2 (en) 2012-12-04 2018-12-04 Samsung Electronics Co., Ltd. Audio providing apparatus and audio providing method
RU2764884C2 (ru) * 2013-04-26 2022-01-24 Сони Корпорейшн Устройство обработки звука и система обработки звука
RU2655994C2 (ru) * 2013-04-26 2018-05-30 Сони Корпорейшн Устройство обработки звука и система обработки звука
US11272306B2 (en) 2013-04-26 2022-03-08 Sony Corporation Sound processing apparatus and sound processing system
US11412337B2 (en) 2013-04-26 2022-08-09 Sony Group Corporation Sound processing apparatus and sound processing system
US11968516B2 (en) 2013-04-26 2024-04-23 Sony Group Corporation Sound processing apparatus and sound processing system
US10089990B2 (en) 2013-05-13 2018-10-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio object separation from mixture signal using object-specific time/frequency resolutions
RU2646375C2 (ru) * 2013-05-13 2018-03-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выделение аудиообъекта из сигнала микширования с использованием характерных для объекта временно-частотных разрешений
US9966084B2 (en) 2015-08-11 2018-05-08 Xiaomi Inc. Method and device for achieving object audio recording and electronic apparatus
RU2630187C1 (ru) * 2015-08-11 2017-09-05 Сяоми Инк. Способ и устройство для осуществления записи объектного аудиосигнала и электронная аппаратура

Also Published As

Publication number Publication date
AU2007312597A1 (en) 2008-04-24
JP5646699B2 (ja) 2014-12-24
CA2673624C (en) 2014-08-12
CN101529504B (zh) 2012-08-22
BRPI0715312A2 (pt) 2013-07-09
ATE539434T1 (de) 2012-01-15
RU2009109125A (ru) 2010-11-27
US8687829B2 (en) 2014-04-01
CN101529504A (zh) 2009-09-09
HK1128548A1 (en) 2009-10-30
EP2082397A2 (en) 2009-07-29
TWI359620B (en) 2012-03-01
KR101120909B1 (ko) 2012-02-27
TW200829066A (en) 2008-07-01
BRPI0715312B1 (pt) 2021-05-04
EP2437257A1 (en) 2012-04-04
MY144273A (en) 2011-08-29
EP2437257B1 (en) 2018-01-24
EP2082397B1 (en) 2011-12-28
AU2007312597B2 (en) 2011-04-14
WO2008046530A3 (en) 2008-06-26
JP2013257569A (ja) 2013-12-26
WO2008046530A2 (en) 2008-04-24
JP2010507114A (ja) 2010-03-04
MX2009003564A (es) 2009-05-28
CA2673624A1 (en) 2008-04-24
US20110013790A1 (en) 2011-01-20
JP5337941B2 (ja) 2013-11-06
KR20090053958A (ko) 2009-05-28

Similar Documents

Publication Publication Date Title
RU2431940C2 (ru) Аппаратура и метод многоканального параметрического преобразования
US11184709B2 (en) Audio decoder for audio channel reconstruction
TWI443647B (zh) 用以將以物件為主之音訊信號編碼與解碼之方法與裝置
JP5134623B2 (ja) 複数のパラメータ的に符号化された音源を合成するための概念
RU2759160C2 (ru) УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, ОТНОСЯЩИХСЯ К ОСНОВАННОМУ НА DirAC ПРОСТРАНСТВЕННОМУ АУДИОКОДИРОВАНИЮ
Breebaart et al. Spatial audio object coding (SAOC)-The upcoming MPEG standard on parametric object based audio coding
US9584912B2 (en) Spatial audio rendering and encoding
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
TWI508578B (zh) 音訊編碼及解碼
JP2009524103A (ja) 信号デコーディング方法及び装置
Engdegård et al. MPEG spatial audio object coding—the ISO/MPEG standard for efficient coding of interactive audio scenes