RU2325046C2 - Аудиокодирование - Google Patents

Аудиокодирование Download PDF

Info

Publication number
RU2325046C2
RU2325046C2 RU2005104123/09A RU2005104123A RU2325046C2 RU 2325046 C2 RU2325046 C2 RU 2325046C2 RU 2005104123/09 A RU2005104123/09 A RU 2005104123/09A RU 2005104123 A RU2005104123 A RU 2005104123A RU 2325046 C2 RU2325046 C2 RU 2325046C2
Authority
RU
Russia
Prior art keywords
signal
audio signal
monophonic
sets
spatial parameters
Prior art date
Application number
RU2005104123/09A
Other languages
English (en)
Other versions
RU2005104123A (ru
Inventor
Эрик Г. П. СХЕЙЕРС (NL)
Эрик Г. П. СХЕЙЕРС
Арнолдус В. Й. ОМЕН (NL)
Арнолдус В. Й. ОМЕН
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2005104123A publication Critical patent/RU2005104123A/ru
Application granted granted Critical
Publication of RU2325046C2 publication Critical patent/RU2325046C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к аудиокодированию. При бинауральном кодировании кодируется только один монофонический канал. Дополнительный слой содержит параметры для получения левого и правого сигналов. Описан кодер, который связывает информацию о переходных процессах, извлекаемую из монофонического кодированного сигнала, с параметрическими многоканальными слоями. Местоположения переходных процессов также могут быть получены непосредственно из битового потока или могут быть вычислены на основе других закодированных параметров (например, флага переключения окна в случае mp3). Технический результат - повышение эффективности за счет использования информации о переходных процессах в параметрическом многоканальном слое. 7 н.п. и 6 з.п. ф-лы, 4 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к аудиокодированию.
Предшествующий уровень техники
В известных основывающихся на форме сигнала схемах кодирования аудиосигнала, таких как MPEG-LII, mp3 и AAC (усовершенствованное аудиокодирование MPEG-2), стереосигналы кодируются путем кодирования двух монофонических аудиосигналов в один битовый поток. Однако с использованием межканальных корреляций и избыточности с помощью таких методик, как mid/side стереокодирование (способ кодирования стереосигнала, при котором выделяются центральный и разностный каналы) и кодирование интенсивности, может быть достигнуто уменьшение битового потока.
В случае mid/side стереокодирования, стереосигнал с большим количеством монофонического содержимого может быть разделен на суммарный M=(L+R)/2 и разностный S=(L-R)/2 сигналы (где L - сигнал левого стереоканала, R - сигнал правого стереоканала). Такая декомпозиция иногда комбинируется с анализом основных компонентов или изменяющихся во времени масштабных коэффициентов. Сигналы затем кодируются независимо как с помощью параметрического кодера, так и с помощью кодера формы сигнала (например, кодер преобразования или поддиапазона). Для определенных частотных диапазонов данная методика может дать незначительно более высокую энергию или для сигнала S, или для сигнала M. Однако для определенных частотных диапазонов может быть достигнуто значительное уменьшение энергии или для сигнала М, или для сигнала S. Объем сокращаемой информации, достигаемый данной методикой, сильно зависит от пространственных характеристик исходного сигнала. Например, если исходный сигнал является монофоническим, разностный сигнал равен нулю и может быть отброшен. Однако если корреляция левого и правого аудиосигнала низкая (что часто случается в диапазонах высоких частот), данная схема дает лишь незначительную выгоду.
В случае стереокодирования интенсивности для определенного частотного диапазона только один сигнал I=(L+R)/2 кодируется вместе с информацией интенсивности для сигналов L и R. На стороне декодера этот сигнал I используется и для сигнала L и для сигнала R после масштабирования с соответствующей информацией интенсивности. Согласно этой методике высокие частоты (обычно выше 5 кГц) представлены одним аудиосигналом (т.е. моно), объединенным с изменяющимися во времени и частотно зависимыми масштабными коэффициентами.
В течение последних лет проявляется интерес к параметрическим описаниям аудиосигнала, особенно в области аудиокодирования. Показано, что передача (квантованных) параметров, которые описывают аудиосигнал, требует только малой пропускной способности для повторного синтезирования одинакового по восприятию сигнала на принимающей стороне. Однако текущие параметрические аудиокодеры ориентированы на кодирование монофонических сигналов, и стереосигналы часто обрабатываются как двойной моносигнал.
EP-A-1107232 раскрывает схему параметрического кодирования для генерации представления стереофонического аудиосигнала, который составлен из сигнала левого канала и сигнала правого канала. Для эффективного использования полосы пропускания для передачи такое представление содержит информацию, касающуюся только монофонического сигнала, который может быть или сигналом левого канала, или сигналом правого канала, и параметрическую информацию. Другой стереосигнал может быть восстановлен на основе упомянутого монофонического сигнала вместе с параметрической информацией. Параметрическая информация включает в себя признаки локализации стереофонического аудиосигнала, включая характеристики интенсивности и фазы для левого и правого каналов.
В бинауральном стереофоническом кодировании, подобном стереокодированию интенсивности, кодируется только один монофонический канал. Дополнительная информация содержит параметры для получения левого и правого сигнала. Заявка на Европейский патент №02076588.9, поданная в апреле 2002 года (код патентного поверенного №PHNL020356) раскрывает параметрическое описание многоканального аудиосигнала, связанное с моделью бинауральной обработки, представленной Breebaart и другими в "Binaural processing model based on contralateral inhibition. I. Model setup", J.Acoust. Soc. Am., 110, 1074-1088, август 2001, в "Binaural processing model based on contralateral inhibition. II. Dependence on spectral parameters", J.Acoust. Soc. Am., 110, 1089-1104, август 2001, и в "Binaural processing model based on contralateral inhibition. III. Dependence on temporal parameters", J.Acoust. Soc. Am., 110, 1105-1117, август 2001, где раскрыта модель бинауральной обработки. Это включает в себя разделение входного аудиосигнала на несколько ограниченных по полосе частот сигналов, которые линейно размещены на ERB-нормированной шкале (ERB - эквивалентная прямоугольная полоса частот). Полоса частот этих сигналов зависит от центральной частоты в зависимости от пропорции ERB. Далее, для каждого частотного диапазона, анализируются следующие характеристики входного сигнала:
интерауральная разность уровней (ILD) определяемая относительными уровнями ограниченного по полосе частот сигнала, воспринимаемого в левом и правом ухе,
интерауральная временная (или фазовая) разность (ITD или IPD), определяемая интерауральной задержкой (или сдвигом фазы), зависящей от пиков в интерауральной кросс-корреляционной функции,
подобия (различия) форм сигнала, которые не могут быть учтены разностями ITD или ILD, которые могут быть параметризованы посредством максимальной интерауральной кросс-корреляции (т.е. значения кросс-корреляции в позиции максимального пика). Поэтому из вышеприведенных описаний становится ясно, что пространственные атрибуты любого многоканального аудиосигнала могут быть описаны путем задания ILD, ITD (или IPD) и максимальной корреляции как функции от времени и частоты.
Эта методика параметрического кодирования дает достаточно хорошее качество для обычных аудиосигналов. Однако, особенно для сигналов, имеющих сильно нестационарное поведение, например звуков кастаньет, клавесина, глокеншпиля и т.д., для данной методики характерны артефакты опережающего эха (слышимого до воспроизведения самого звука).
Задачей данного изобретения является предоставление аудиокодера и декодера и соответствующих способов, которые уменьшают влияние артефактов при параметрическом многоканальном кодировании.
Описание сущности изобретения
В соответствии с настоящим изобретением предоставляется способ кодирования аудиосигнала в соответствии с п.1 и способ декодирования битового потока в соответствии с п.11.
В соответствии с аспектом изобретения параметризуются пространственные атрибуты многоканальных аудиосигналов. Предпочтительно пространственные атрибуты включают в себя разности уровней, временные разности и корреляции между левым и правым сигналом.
Используя данное изобретение, местоположения переходных процессов прямо или косвенно извлекаются из монофонического аудиосигнала и связываются с слоями параметрического многоканального представления. Использование этой информации о переходных процессах в параметрическом многоканальном слое позволяет повысить эффективность.
Известно, что во многих аудиокодерах информация о переходных процессах используется для управления процессом кодирования с целью повышения эффективности. Например, в синусоидальном кодере, описанном в W001/69593-A1, местоположения переходных процессов кодируются в битовом потоке. Кодер может использовать эти местоположения переходных процессов для адаптивного сегментирования (адаптивного кадрирования) битового потока. Также, в декодере, эти местоположения могут быть использованы с целью управления применением окна для синусоидального и шумового синтеза. Однако эти методики ограничиваются монофоническими аудиосигналами.
В предпочтительном варианте воплощения настоящего изобретения при декодировании битового потока, где монофоническое содержимое получено с использованием такого синусоидального кодера, местоположения переходных процессов могут быть получены непосредственно из битового потока.
В кодерах формы сигнала, таких как mр3 или ААС, местоположения переходных процессов непосредственно не кодируются в битовом потоке; напротив, в случае mр3, например, полагается, что эти переходные интервалы маркируются путем переключения на более короткие длины окна (переключение окна) в монофоническом слое и местоположения переходных процессов таким образом могут быть оценены из параметров, таких как флаг mр3 переключения окна.
Перечень фигур чертежей
Предпочтительные варианты воплощения настоящего изобретения будут описаны, в качестве примера, со ссылками на прилагающиеся чертежи, на которых:
Фиг.1 - схематическая диаграмма, иллюстрирующая кодер в соответствии с одним из вариантов воплощения изобретения;
Фиг.2 - схематическая диаграмма, иллюстрирующая декодер в соответствии с одним из вариантов воплощения изобретения;
Фиг.3 - местоположения переходных процессов, закодированные в соответствующих субкадрах монофонического сигнала и соответствующие кадры многоканального слоя; и
Фиг.4 - пример использования местоположения переходного процесса из монофонического кодированного слоя для декодирования параметрического многоканального слоя.
Описание предпочтительного варианта воплощения
На фиг.1 показан кодер 10 в соответствии с предпочтительным вариантом воплощения настоящего изобретения для кодирования стереофонического аудиосигнала, включающего в себя левый (L) и правый (R) входные сигналы. В предпочтительном варианте воплощения, как описано в заявке на Европейский патент №02076588.9, поданной в апреле 2002 года (код патентного поверенного №PHNL020356), кодер описывает многоканальный аудиосигнал с помощью:
одного монофонического сигнала 12, включающего в себя комбинацию множества входных аудиосигналов,
для каждого дополнительного слухового канала набор пространственных параметров 14, включающий в себя два признака локализации (ILD и ITD или IPD) и параметр (r), который описывает подобие или различие форм сигнала, которые не могут быть учтены с помощью разностей ILD и/или ITD (например, максимум кросс-корреляционной функции), предпочтительно для каждого временного/частотного элементарного интервала (слота).
Набор (наборы) пространственных параметров может быть использован аудиокодерами как слой расширения. Например, моносигнал передается, только если допустима низкая скорость передачи битов, в то время как декодер может воспроизводить стерео- или многоканальный звук посредством включения пространственного слоя (слоев) расширения.
В то время как в данном варианте воплощении набор пространственных параметров объединен с монофоническим (одноканальным) аудиокодером для кодирования стереофонического аудиосигнала, общая идея может быть применена к n-канальному аудиосигналу с n > 1. Таким образом, изобретение может быть в принципе использовано для генерирования n каналов из одного моносигнала, если переданы (n-1) наборов пространственных параметров. В таких случаях пространственные параметры описывают, как сформировать n различных каналов из одного моносигнала. Таким образом, в декодере, путем объединения следующего набора пространственных параметров с монофоническим кодированным сигналом, получается следующий канал.
Способы анализа
В общем кодер 10 включает в себя соответствующие модули 20 преобразования, которые разделяют каждый входной сигнал (L,R) на сигналы 16 поддиапазонов (предпочтительно с шириной полосы, увеличивающейся с частотой; в предпочтительном варианте воплощения модули 20 применяют окно во времени, за этим следует операция преобразования с целью осуществления квантования по времени/частоте, однако могут быть использованы и непрерывные во времени способы (например, блок фильтров).
Следующие этапы для определения суммарного сигнала 12 и извлечения параметров 14 реализуются в модуле 18 анализа и включают в себя:
нахождение разности уровней (ILD) соответствующих сигналов 16 поддиапазонов,
нахождение временной разности (ITD или IPD) соответствующих сигналов 16 поддиапазонов,
описание степени подобия или различия форм сигналов, которые не могут быть определены с помощью разностей ILD или ITD.
Анализ разностей ILD
ILD определяется по разности уровней сигналов в конкретный момент времени для заданной полосы частот. Одним из способов определения ILD является вычисление среднеквадратического значения для соответствующей полосы частот для обоих входных каналов и вычисление отношения среднеквадратических значений (предпочтительно выраженных в дБ).
Анализ разностей ITD
ITD определяется выравниванием по времени или фазе, которое дает лучшее совпадение между формами сигналов обоих каналов. Одним из способов получения ITD является вычисление кросс-корреляционной функции между двумя соответствующими сигналами поддиапазонов и поиск максимума. Задержка, которая соответствует этому максимуму в кросс-корреляционной функции, может быть использована как значение ITD.
Второй способ состоит в вычислении аналитических сигналов левого и правого поддиапазонов (т.е. вычисление значений фазы и огибающей) и использование разности фаз между каналами в качестве параметра IPD. Здесь используется комплексный блок фильтров (например быстрое преобразование Фурье (БПФ, FFT)) и с помощью рассмотрения определенного элемента дискретизации (участка полосы частот) может быть получена фазовая функция во времени. Осуществляя это для левого и правого каналов, может быть получена разность фаз IPD (так же как и кросс-корреляция двух отфильтрованных сигналов).
Анализ корреляции
Корреляцию получают посредством изначального нахождения ILD и ITD, которые обеспечивают наилучшее совпадение соответствующих сигналов поддиапазонов и последующего измерения подобия форм сигналов после компенсации ITD и/или ILD. Так, в данной схеме, корреляция определяется как подобие или различие соответствующих сигналов поддиапазонов, которое не может быть определено с помощью разностей ILD и/или ITD. Подходящей мерой для этого параметра является максимальное значение кросс-корреляционной функции (т.е. максимум на множестве задержек). Однако конечно могут быть использованы и другие меры, такие как относительная энергия разностного сигнала после компенсации ILD и/или ITD в сравнении с суммарным сигналом соответствующих поддиапазонов (предпочтительно, в отношении которого также выполнена компенсация разностей ILD и/или ITD). Этот разностный параметр является по сути линейным преобразованием (максимальной) корреляции.
Квантование параметров
Важным моментом при передаче параметров является точность представления параметров (т.е. размер ошибок квантования), которая напрямую связана с необходимыми пропускной способностью и качеством аудиосигнала. В этом разделе будут обсуждаться несколько моментов, связанных с квантованием пространственных параметров. Основная идея состоит в том, чтобы базировать ошибки квантования на так называемых JND (едва заметных различиях) пространственных признаков. Более точно, ошибка квантования определяется чувствительностью человеческой слуховой системы к изменениям параметров. Так как широко известно, что чувствительность к изменениям параметров сильно зависит от самих значений параметров, применяются следующие способы для определения дискретных шагов квантования.
Квантование разностей ILD
Как известно из психоакустических исследований, чувствительность к изменениям ILD зависит от самой ILD. Если ILD выражается в дБ, отклонение примерно в 1 дБ от опорного уровня в 0 дБ является обнаруживаемым, в то время как требуются изменения порядка 3 дБ, если разность относительно опорного уровня составляет 20 дБ. Поэтому ошибки квантования могут быть тем большими, чем большую разность уровней имеют левый и правый каналы. Например, это может быть применено путем первоначального измерения разности уровней между каналами, последующего нелинейного (компрессионного) преобразования полученной разности уровней и, наконец, применения процесса линейного квантования или путем использования таблицы поиска подходящих значений ILD, которые имеют нелинейное распределение. В предпочтительном варианте воплощения ILD (в дБ) квантуются к ближайшему значению из набора I:
I=[-19 -16 -13 -10 -8 -6 -4 -2 0 2 4 6 8 10 13 16 19]
Квантование разностей ITD
Чувствительность человека к изменению в ITD может быть охарактеризована как имеющая постоянный фазовый порог. Это означает, что для времен задержки шаги квантования ITD должны уменьшаться с частотой. В качестве альтернативы, если ITD представлена в форме разностей фаз, шаги квантования должны быть независимы от частоты. Одним из способов реализации этого является использование фиксированной разности фаз в качестве шага квантования и определение соответствующей временной задержки для каждого частотного диапазона. Это значение ITD затем используется как шаг квантования. В предпочтительном варианте осуществления шаги квантования ITD определяются постоянной разностью фаз в каждом поддиапазоне в 0.1 радиан (рад). Таким образом, для каждого поддиапазона, разность во времени, которая соответствует 0.1 рад относительно центральной частоты поддиапазона, используется в качестве шага квантования. Для частот выше 2 кГц информация о ITD не передается.
Другим способом является передача разностей фаз, который основывается на частотно независимой схеме квантования. Известно, что выше определенной частоты человеческая слуховая система не чувствительна к формам сигналов тонкой структуры. Этот феномен может быть использован путем передачи параметров ITD вплоть до определенной частоты (обычно 2 кГц).
Третий способ уменьшения битового потока состоит во введении шагов квантования ITD, которые зависят от ILD и/или от корреляционных параметров одного и того же поддиапазона. Для больших ILD, ITD может быть кодирована менее точно. Более того, известно, что если корреляция очень низкая, то человеческая чувствительность к изменениям ITD уменьшается. Отсюда следует, что при малой корреляции допускаются большие ошибки квантования. Предельным примером данной идеи является полный отказ от передачи разностей ITD, если корреляция становится меньше определенного порога.
Квантование корреляции
Ошибки квантования корреляции зависят (1) от собственно значения корреляции и (2), возможно, от ILD. Значения корреляции, близкие к +1, кодируются с высокой точностью (т.е. с малым шагом квантования), в то время как значения корреляции, близкие к 0, кодируются с низкой точностью (большой шаг квантования). В предпочтительном варианте воплощения множество нелинейно распределенных значений корреляции (r) квантуется к ближайшему значению из следующей совокупности: R:R=[1 0.95 0.9 0.82 0.75 0.6 0.3 0], что обходится в дополнительные 3 бита на каждое значение корреляции.
Если абсолютное значение (квантованной) ILD текущего поддиапазона составляет 19 дБ, то для данного поддиапазона не передается ни ITD, ни значение корреляции. Если (квантованное) значение корреляции для определенного поддиапазона составляет 0, то значение ITD для данного поддиапазона не передается.
Таким образом, каждый кадр требует максимум 233 бита для передачи пространственных параметров. При длине кадра в 1024 отсчета и частоте дискретизации в 44.1 кГц, максимальная скорость передачи битов составляет меньше чем 10,25 кбит/с [233·44100/1024=10,034 кбит/с]. Необходимо заметить, что при использовании статистического кодирования или дифференциального кодирования данная скорость передачи битов может быть дополнительно уменьшена.
Вторая возможность состоит в использовании шагов квантования для корреляции, зависящих от измеренной ILD этого же поддиапазона: чем больше разности ILD (т.е. один из каналов является доминантным по энергии), тем большими могут быть ошибки квантования корреляции. В предельном примере данного принципа значения корреляции для определенного поддиапазона вообще не передаются, если абсолютное значение ILD для этого поддиапазона превышает определенный порог.
Подробное описание реализации
Более детально, в модуле 20 левый и правый входные сигналы разделяются в разных временных кадрах (2048 отсчетов при частоте дискретизации 44.1 кГц) и обрабатываются методом окна при помощи окна Хеннинга (Hanning), соответствующего функции квадратного корня. Затем вычисляются преобразования БПФ. Отрицательные БПФ-частоты исключаются и результирующие БПФ делятся на группы или поддиапазоны из 16 элементов дискретизации БПФ. Количество элементов дискретизации БПФ, которые объединены в поддиапазон g, зависит от частоты: на высоких частотах объединяются больше элементов дискретизации, чем на низких частотах. В данной реализации группируются элементы дискретизации БПФ, соответствующие примерно 1,8 ERB, давая в результате 20 поддиапазонов, представляющих весь слышимый частотный диапазон. Результирующее количество элементов дискретизации БПФ S[g] для каждого последовательного поддиапазона (начиная с наиболее низкой частоты) является
S=[4 4 4 5 6 8 9 12 13 17 21 25 30 38 45 55 68 82 100 477]
Таким образом, первые три поддиапазона содержат 4 элемента дискретизации БПФ, четвертый поддиапазон содержит 5 элементов дискретизации БПФ и так далее. Для каждого поддиапазона модуль 18 анализа вычисляет соответствующие ILD, ITD и корреляцию (r). ITD и корреляция вычисляются просто установкой всех элементов дискретизации БПФ, которые принадлежат другим группам, в ноль, умножением результирующих (ограниченных по диапазону) БПФ из левого и правого каналов с последующим обратным быстрым преобразованием Фурье (ОБПФ). В отношении результирующей кросс-корреляционной функции выполняют поиск пиков в пределах межканальной задержки между -64 и +64 отсчетами. Внутренняя задержка, соответствующая пику, используется как значение ITD, а значение кросс-корреляционной функции в этом пике используется как интерауральная корреляция этого поддиапазона. И, наконец, ILD вычислятся просто как отношение мощностей левого и правого каналов для каждого поддиапазона.
Генерация суммарного сигнала
Анализатор 18 содержит генератор 17 суммарного сигнала, который выполняет коррекцию фазы (временное выравнивание) для левого и правого поддиапазонов перед суммированием сигналов. Эта коррекция фазы основывается на вычисленной для этого поддиапазона ITD и включает в себя задержку поддиапазона левого канала на величину ITD/2 и поддиапазона правого канала на величину -ITD/2. Задержка осуществляется в частотной области с помощью соответствующего применения фазового угла для каждого элемента дискретизации БПФ. Затем суммарный сигнал вычисляется путем сложения измененных по фазе версий сигналов левого и правого поддиапазонов. И, наконец, для компенсации некоррелированного или коррелированного сложения каждый поддиапазон суммированного сигнала умножается на корень квадратный из (2/(1+r)), с корреляцией (r) соответствующего поддиапазона, для генерации окончательного суммарного сигнала 12. Если необходимо, суммарный сигнал может быть преобразован во временную область посредством (1) введения комплексных сопряженных при отрицательных частотах, (2) обратного БПФ, (3) применения окна, и (4) алгоритма перекрытия с суммированием.
При наличии представления суммарного сигнала 12 во временной и/или частотной области, как описано выше, этот сигнал может быть кодирован в монофоническом слое 40 битового потока 50 несколькими известными способами. Например, для генерации монофонического слоя 40 битового потока может быть использован кодер mp3. Когда такой кодер обнаруживает быстрые изменения во входном сигнале, то он может изменить длину окна, которую он использовал для этого конкретного периода времени таким образом, чтобы улучшить временную и/или частотную локализацию при кодировании этой части входного сигнала. При этом в битовый поток встраивается флаг переключения окна, показывающий данное переключение декодеру, который впоследствии будет синтезировать сигнал. Для целей настоящего изобретения этот флаг переключения окна используется как оценка местоположения переходного процесса во входном сигнале.
Однако в предпочтительном варианте воплощения для генерации монофонического слоя 40 используется синусоидальный кодер 30 типа того, что описан в WO01/69593-A1. Кодер 30 включает в себя кодер 11 переходных процессов, синусоидальный кодер 13 и кодер 15 шума.
Когда сигнал 12 поступает на вход кодера 11 переходных процессов, для каждого интервала обновления данный кодер оценивает, имеется ли переходная компонента сигнала, а также ее местоположение, в пределах окна анализа (с точностью до отсчета). Если местоположение переходной компоненты сигнала определено, кодер 11 пытается извлечь переходную компоненту сигнала (или главную ее часть). Кодер 11 подбирает функцию формы для сегмента сигнала, начиная, предпочтительно, с оцененного местоположения, и определяет содержимое под этой функцией формы путем применения, например, некоторого (малого) числа синусоидальных компонент, и эта информация содержится в переходном коде CT.
Суммарный сигнал 12 без переходных компонентов направляется на синусоидальный кодер 13, где он анализируется для определения (детерминированных) синусоидальных компонентов. Вкратце, синусоидальный кодер кодирует входной сигнал как звенья цепочки синусоидальных компонентов, связанные от одного сегмента кадра к другому. Звенья цепочки изначально представлены начальной частотой, начальной амплитудой и начальной фазой для синусоиды, начинающейся в заданном сегменте - рождение. После этого звено цепочки представляется в последующих сегментах с помощью разностей частот, разностей амплитуд и, если возможно, разностей фаз (продолжительностей), до того сегмента, где цепочка заканчивается (смерть), и эта информация содержится в синусоидальном коде CS.
Предполагается, что сигнал без переходных и синусоидальных компонентов в основном содержит шум, и анализатор 15 шума в предпочтительном варианте воплощения выдает шумовой код CN как представление этого шума. Обычно, как, например, в WO01/89086-A1, спектр шума моделируется кодером шума с помощью параметров (pi,qi) комбинированного авторегриссивного (AR) фильтра скользящего среднего (МА) в соответствии со шкалой ERB. Внутри декодера упомянутые параметры фильтра передаются синтезатору шума, который, главным образом, является фильтром, который имеет частотную характеристику, приближенную к спектру шума. Синтезатор генерирует воссозданный шум путем фильтрации сигнала белого шума с параметрами (pi,qi) фильтра ARMA и впоследствии добавляет его к синтезированным переходному и синусоидальному сигналам для генерации оценки исходного суммарного сигнала.
Мультиплексор 41 выдает монофонический аудиослой 40, который делится на кадры 42, которые представляют перекрывающиеся временные сегменты длиной 16 миллисекунд (мс) и которые обновляются каждые 8 (мс), как показано на фиг.4. Каждый кадр включает в себя соответствующие коды CT, CS и CN, и в декодере упомянутые коды для последовательных кадров смешиваются в их перекрывающихся зонах при синтезировании монофонического суммарного сигнала. В настоящем варианте воплощения, подразумевается, что каждый кадр может иметь не более одного переходного кода CT и пример такого переходного процесса помечен номером 44.
Генерация наборов пространственных параметров
Анализатор 18 дополнительно включает в себя генератор 19 слоя пространственных параметров. Этот компонент выполняет квантование пространственных параметров для каждого кадра пространственных параметров, как описано выше. В общем генератор 19 делит каждый канал 14 пространственного уровня на кадры 46, которые представляют собой перекрывающиеся временные сегменты длиной 64 мс и которые обновляются каждые 32 мс, как показано на фиг.4. Каждый кадр включает в себя соответствующие ILD, ITD или IPD и корреляционные коэффициенты, и в декодере упомянутые значения в последовательных кадрах смешиваются в их перекрывающихся зонах с тем, чтобы определить параметры пространственного уровня для любого заданного момента времени при синтезировании сигнала.
В предпочтительном варианте воплощения местоположения переходных процессов, определенные с помощью кодера 11 переходных процессов в монофоническом слое 40 (или соответствующим модулем анализа в суммарном сигнале), используются генератором 19 для определения того, требуется ли неравномерное временное сегментирование в слое (слоях) 14 пространственных параметров. Если кодер использует кодер mp3 для генерации монофонического уровня, то присутствие флага переключения окна в монофоническом потоке используется генератором в качестве оценки местоположения переходного процесса.
Как показано на фиг.4, генератор 19 может принимать указание о том, что переходный процесс 44 должен быть закодирован в одном из последовательных кадров монофонического слоя, соответствующего временному окну слоя (слоев) пространственных параметров, для которого он собирается генерировать кадр(ы). Будет видно, что вследствие того что каждый слой пространственных параметров включает в себя кадры, представляющие перекрывающиеся временные сегменты, для любого заданного времени, генератор будет выдавать два кадра на каждый слой пространственных параметров. В любом случае генератор продолжает генерировать пространственные параметры для кадра, представляющего окно 48 меньшей длины вокруг местоположения переходного процесса. Необходимо заметить, что этот кадр будет иметь тот же формат, что и нормальные кадры слоя пространственных параметров, и будет рассчитываться тем же способом за исключением того, что он относится к более короткому временному окну вокруг местоположения 44 переходного процесса. Этот кадр с малой длиной окна обеспечивает увеличенное временное разрешение для многоканального образа. Кадр (кадры), которые сгенерированы до и после кадра окна переходного процесса, затем используются для представления специальных промежуточных окон 47, 49, соединяющих короткое окно 48 переходного процесса и окна 46, представленных нормальными кадрами.
В предпочтительном варианте воплощения кадр, представляющий окно 48 переходного процесса, является дополнительным кадром в битовом потоке 14 слоя пространственного представления, однако из-за того, что переходные процессы имеют место не очень часто, это обеспечивает лишь малое приращение к общей скорости передачи битов. Однако является критичным, что декодер при чтении битового потока, произведенного с использованием предпочтительного варианта воплощения, принимает во внимание этот дополнительный кадр, так как иначе синхронизация монофонического и пространственного представления будет нарушена.
Также в настоящем варианте воплощения подразумевается, что переходные процессы имеют место настолько редко, что только один переходный процесс на всем протяжении окна нормального кадра 46 может быть значимым для представления уровня (уровней) пространственных параметров. Даже если на протяжении нормального кадра будут иметь место два переходных процесса, подразумевается, что неравномерное сегментирование будет иметь место вокруг первого переходного процесса, как показано на фиг.3. Здесь показаны три переходных процесса 44, закодированные в соответствующих монофонических кадрах. Однако скорее второй, чем третий переходный процесс будет использоваться для индикации того, что кадр слоя пространственных параметров, представляющий тот же временной период (показан ниже этих переходных процессов), должен быть использован как первое промежуточное окно, предшествующее окну переходного процесса, полученному из дополнительного кадра слоя пространственных параметров, вставленного кодером, и за ним в свою очередь следует кадр, который представляет второе промежуточное окно.
Однако возможно, что не все местоположения переходных процессов, закодированные в монофоническом слое, будут значимыми для слоя (слоев) пространственных параметров, как в случае с первым переходным процессом 44 на фиг.3. Так, синтаксис битового потока либо для монофонического слоя, либо для пространственного представления может включать в себя индикаторы местоположения переходных процессов, которые значимы или не значимы для слоя пространственного представления.
В предпочтительном варианте воплощения именно генератор 19 осуществляет определение значимости переходного процесса для слоя пространственного представления путем рассмотрения разности между оцененными пространственными параметрами (ILD, ITD и корреляцией (r)), полученными из большего окна (например, 1024 отсчета), которое окружает местоположение 44 переходного процесса, и параметрами, полученными из меньшего окна 48, вокруг упомянутого местоположения переходного процесса. Если имеется значительное изменение между параметрами из короткого и длинного временных интервалов, тогда дополнительные пространственные параметры, оцененные вокруг местоположения переходного процесса, вставляются в дополнительный кадр, представляющий короткое временное окно 48. Если имеется небольшая разница, местоположение переходного процесса не используется в пространственном представлении и, соответственно, в битовый поток включается индикатор.
И, наконец, после генерации монофонического слоя 40 и слоя 14 пространственного представления эти слои записываются в битовый поток 50 мультиплексором 43. Этот аудиопоток 50 в свою очередь направляется, например, на шину данных, на антенную систему, на устройство хранения, и т.п.
Синтез
Как показано на фиг.2, декодер 60 включает в себя демультиплексор 62, который разделяет входной аудиопоток 50 на монофонический слой 40' и, в данном случае, на единственный слой 14' пространственного представления. Монофонический слой 40' считывается известным синтезатором 64, соответствующим кодеру, который сгенерировал слой для предоставления оценки исходного суммарного сигнала 12' во временной области.
Пространственные параметры 14', извлеченные демультиплексором 62, затем применяются модулем 66 последующей обработки к суммарному сигналу 12' для генерации левого и правого выходных сигналов. Модуль последующей обработки, соответствующий предпочтительному варианту воплощения, также считывает информацию монофонического слоя 14' для определения местоположения переходных процессов в этом сигнале. (В качестве альтернативы индикацию такого вида синтезатор 64 мог бы предоставлять модулю последующей обработки; однако это потребовало бы некоторых незначительных доработок в остальном обычного синтезатора 64).
В любом случае, когда модуль последующей обработки обнаруживает переходный процесс 44 внутри кадра 42 монофонического слоя, соответствующего нормальному временному окну кадра слоя (слоев) 14' уровня пространственных параметров, который он собирается обработать, он знает, что этот кадр представляет промежуточное окно 47 перед коротким окном 48 переходного процесса. Модуль последующей обработки знает местоположение во времени переходного процесса 44 и, таким образом, знает длину промежуточного окна 47, предшествующего окну переходного процесса, а также длину промежуточного окна 49 после окна 48 переходного процесса. В предпочтительном варианте воплощения модуль 66 последующей обработки включает в себя модуль 68 смешения, который для первой части окна 47 смешивает параметры для окна 47 с параметрами предыдущего кадра при синтезировании слоя (слоев) пространственного представления. С этого места и до начала окна 48 переходного процесса только параметры кадра, представляющего окно 47, используются в синтезировании слоя (слоев) пространственного представления. Для первой части окна 48 переходного процесса параметры промежуточного окна 47 и окна 48 переходного процесса смешиваются, и для второй части окна 48 переходного процесса параметры промежуточного окна 49 и окна переходного процесса 48 смешиваются, и так далее, до середины промежуточного окна 49, после которой межкадровое смешивание продолжается как нормальное.
Как объяснено выше, пространственные параметры, используемые в любой заданный момент времени, являются либо смесью параметров двух кадров нормального окна 46, либо смесью параметров нормального 46 и промежуточного кадра 47 и 49, либо только параметрами кадра промежуточного окна 47 и 49, либо смесью параметров кадра промежуточного окна 47 и 49 и параметров окна 48 переходного процесса. Используя синтаксис слоя пространственного представления, модуль 68 может выбирать эти переходные процессы, которые указывают на неравномерное временное сегментирование слоя пространственного представления, и эти соответствующие местоположения переходных процессов окна переходных процессов короткой длины обеспечивают лучшую временную локализацию в многоканальном образе.
Для модуля 66 последующей обработки полагается, что представление суммарного сигнала 12' в частотной области, как описано в разделе анализа, доступно для обработки. Это представление может быть получено путем операций применения окна и БПФ в отношении формы сигнала во временной области, сгенерированной синтезатором 64. Затем суммарный сигнал копируется в левый и правый сигнальные тракты. Далее корреляция между левым и правым каналом изменяется с помощью декоррелятора 69' и 69'' с использованием параметра r. Для детального описания того, как это может быть реализовано, приводится ссылка на заявку на Европейский патент, озаглавленную "Signal synthesizing", поданную 12 июля 2002 года, где D.J.Breebaart указан как первый изобретатель (код патентного поверенного PHNL020639). Эта заявка на Европейский патент раскрывает способ синтезирования первого и второго выходного сигналов из входного сигнала, причем этот способ включает в себя этапы, на которых фильтруют входной сигнал для генерации отфильтрованного сигнала, получают корреляционный параметр, получают параметр уровня, служащий показателем желаемого уровня разности между первым и вторым выходным сигналами, и преобразовывают входной сигнал и отфильтрованный сигнал с помощью операции матрицирования в первый и второй выходные сигналы, при этом операция матрицирования зависит от корреляционного параметра и параметра уровня. Далее на соответствующих этапах 70' и 70'', каждый поддиапазон левого сигнала задерживают на время -ITD/2, и правый сигнал задерживают на время ITD/2 при заданном (квантованном) ITD, соответствующем этому поддиапазону. И, наконец, левый и правый поддиапазоны масштабируют согласно ILD для этого поддиапазона на соответствующих этапах 71' и 71''. На соответствующих этапах 72' и 72'' преобразования затем преобразуют выходные сигналы во временную область путем выполнения следующих этапов: (1) введение комплексных сопряженных при отрицательных частотах, (2) выполнение обратного БПФ, (3) применение окна, и (4) выполнение алгоритма перекрытия с суммированием.
Предпочтительные варианты воплощения декодера и кодера были описаны в терминах получения монофонического сигнала, который является комбинацией двух сигналов - главным образом в случае, когда в декодере используется монофонический сигнал. Однако должно быть видно, что изобретение не ограничивается этими вариантами воплощения, и монофонический сигнал может соответствовать единственному входному и/или выходному каналу со слоем (слоями) пространственных параметров, применяемым к соответствующим копиям этого канала для получения дополнительных каналов.
Необходимо отметить, что настоящее изобретение может быть реализовано на специализированных аппаратных средствах, в программном обеспечении, выполняющемся на DSP (цифровом процессоре сигналов) или на компьютере общего назначения. Настоящее изобретение может быть воплощено на материальном носителе, таком как ПЗУ на компакт-диске (CD-ROM) или ПЗУ на цифровом многофункциональном диске (DVD-ROM), являющемся носителем машиноисполняемой программы для выполнения способа кодирования в соответствии с изобретением. Изобретение также может быть воплощено в виде сигнала, предаваемого по сети данных, такой как Интернет, или в виде сигнала, передаваемого широковещательной службой. Изобретение может найти конкретное применение в областях загрузки из Интернета, Интернет-радио, твердотельных аудиоустройствах (без механических деталей) (Solid State Audio (SSA)), схемах расширения полосы пропускания, например, mp3PRO, СТ-aacPlus (см. www.codingtechnologies.com) и в большинстве других схем аудиокодирования.

Claims (13)

1. Способ кодирования аудиосигнала, который включает в себя этапы, на которых генерируют монофонический аудиосигнал, из, по меньшей мере, двух аудиоканалов анализируют пространственные характеристики этих, по меньшей мере, двух аудиоканалов для получения одного или более наборов пространственных параметров для последовательных временных слотов, в качестве реакции на упомянутый монофонический сигнал, содержащий переходный процесс в заданное время, определяют неравномерное временное сегментирование упомянутых наборов пространственных параметров для периода, включающего в себя упомянутое заданное время, и генерируют кодированный аудиосигнал, включающий в себя монофонический аудиосигнал и упомянутые один или более наборов пространственных параметров.
2. Способ по п.1, в котором упомянутый монофонический сигнал генерируют с помощью синусоидального кодера, при этом упомянутый синусоидальный кодер генерирует кадры, соответствующие последовательным временным слотам упомянутого монофонического сигнала, а, по меньшей мере, некоторые из упомянутых кадров включают в себя параметры, представляющие местоположение переходного процесса, имеющего место в соответствующих временных слотах, представленных упомянутыми кадрами.
3. Способ по п.1, в котором упомянутый монофонический сигнал генерируют с помощью кодера формы сигнала, при этом упомянутый кодер формы сигнала определяет неравномерное временное сегментирование упомянутого монофонического сигнала для интервала, включающего в себя упомянутого заданное время.
4. Способ по п.3, в котором упомянутый кодер формы сигнала является кодером mp3.
5. Способ по п.1, в котором упомянутые наборы пространственных параметров включают в себя, по меньшей мере, два признака локализации.
6. Способ по п.5, в котором упомянутые наборы пространственных параметров дополнительно включают в себя параметр, который описывает подобие или различие форм сигналов, которые не могут быть учтены упомянутыми признаками локализации.
7. Способ по п.6, в котором параметр является максимумом кросс-корреляционной функции.
8. Кодер для кодирования аудиосигнала, который включает в себя: средства для генерации монофонического сигнала из, по меньшей мере, двух аудиоканалов, средства для анализа пространственных характеристик, по меньшей мере, двух аудиоканалов для получения одного или более наборов пространственных параметров для последовательных временных слотов, средства для определения, в качестве реакции на упомянутый монофонический сигнал, содержащий переходный процесс в заданное время, неравномерного временного сегментирования упомянутых наборов пространственных параметров для периода, включающего в себя упомянутое заданное время, и средства для генерации кодированного сигнала, включающего в себя монофонический сигнал и упомянутые один или больше наборов пространственных параметров.
9. Устройство для кодирования аудиосигнала, которое включает в себя: блок ввода для приема аудиосигнала, кодер по п.8 для кодирования аудиосигнала с целью получения кодированного аудиосигнала, и блок вывода для предоставления кодированного аудиосигнала.
10. Кодированный аудиосигнал, включающий в себя: монофонический сигнал, сгенерированный из, по меньшей мере, двух аудиоканалов и содержащий, по меньшей мере, один индикатор местоположения переходного процесса, имеющего место в заданное время в упомянутом монофоническом сигнале; и один или больше наборов пространственных параметров для последовательных временных слотов упомянутого сигнала, при этом упомянутые наборы пространственных параметров обеспечивают неравномерное временное сегментирование аудиосигнала для периода, содержащего упомянутое заданное время.
11. Способ декодирования кодированного аудиосигнала, который включает в себя этапы, на которых получают монофонический сигнал из кодированного аудиосигнала, причем монофонический аудиосигнал сгенерирован из, по меньшей мере, двух аудиоканалов, получают один или более наборов пространственных параметров из кодированного аудиосигнала, и в качестве реакции на упомянутый монофонический аудиосигнал, содержащий переходный процесс в заданное время, определяют неравномерное временное сегментирование упомянутых наборов пространственных параметров для периода, включающего в себя упомянутое заданное время, и применяют один или более наборов пространственных параметров к монофоническому сигналу для генерации многоканального выходного сигнала.
12. Декодер для декодирования кодированного аудиосигнала, включающий в себя: средства для получения монофонического сигнала из кодированного аудиосигнала, причем монофонический аудиосигнал сгенерирован из, по меньшей мере, двух аудиоканалов, средства для получения одного или более наборов пространственных параметров из кодированного аудиосигнала, и средства для определения, в качестве реакции на упомянутый монофонический сигнал, содержащий переходный процесс в заданное время, неравномерного временного сегментирования упомянутых наборов пространственных параметров для периода, включающего в себя упомянутое заданное время, и средства для применения упомянутых одного или более наборов пространственных параметров к монофоническому сигналу для генерации многоканального выходного сигнала.
13. Устройство для декодированного сигнала, которое включает в себя: блок ввода для приема кодированного аудиосигнала, декодер по п.12 для декодирования кодированного аудиосигнала для получения многоканального выходного сигнала, блок вывода для предоставления или воспроизведения многоканального выходного сигнала.
RU2005104123/09A 2002-07-16 2003-07-01 Аудиокодирование RU2325046C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02077871 2002-07-16
EP02077871.8 2002-07-16

Publications (2)

Publication Number Publication Date
RU2005104123A RU2005104123A (ru) 2005-07-10
RU2325046C2 true RU2325046C2 (ru) 2008-05-20

Family

ID=30011205

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005104123/09A RU2325046C2 (ru) 2002-07-16 2003-07-01 Аудиокодирование

Country Status (9)

Country Link
US (1) US7542896B2 (ru)
EP (1) EP1523863A1 (ru)
JP (1) JP2005533271A (ru)
KR (1) KR20050021484A (ru)
CN (1) CN1669358A (ru)
AU (1) AU2003281128A1 (ru)
BR (1) BR0305555A (ru)
RU (1) RU2325046C2 (ru)
WO (1) WO2004008806A1 (ru)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2468451C1 (ru) * 2008-10-29 2012-11-27 Долби Интернэшнл Аб Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала
US8494865B2 (en) 2008-10-08 2013-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, method for decoding an audio signal, method for encoding an audio signal, computer program and audio signal
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
RU2495503C2 (ru) * 2008-07-29 2013-10-10 Панасоник Корпорэйшн Устройство кодирования звука, устройство декодирования звука, устройство кодирования и декодирования звука и система проведения телеконференций
RU2550549C2 (ru) * 2010-08-03 2015-05-10 Сони Корпорейшн Устройство и способ обработки сигнала и программа
RU2562383C2 (ru) * 2012-01-20 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования и декодирования аудио, применяющие синусоидальную замену
RU2575393C2 (ru) * 2011-01-18 2016-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала
US9502040B2 (en) 2011-01-18 2016-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of slot positions of events in an audio signal frame
US10140997B2 (en) 2014-07-01 2018-11-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
RU2683487C1 (ru) * 2015-06-16 2019-03-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Сокращенное декодирование
RU2751104C2 (ru) * 2013-07-12 2021-07-08 Конинклейке Филипс Н.В. Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты

Families Citing this family (126)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
JP4939933B2 (ja) * 2004-05-19 2012-05-30 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号化装置
ATE474310T1 (de) * 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
CN101015230B (zh) 2004-09-06 2012-09-05 皇家飞利浦电子股份有限公司 音频信号增强
JP4809234B2 (ja) * 2004-09-17 2011-11-09 パナソニック株式会社 オーディオ符号化装置、復号化装置、方法、及びプログラム
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
US7761304B2 (en) 2004-11-30 2010-07-20 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126859A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
US8917874B2 (en) 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2009500657A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
AU2006266579B2 (en) 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8626503B2 (en) 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
KR100891686B1 (ko) 2005-08-30 2009-04-03 엘지전자 주식회사 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
WO2007027056A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. A method for decoding an audio signal
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
RU2473062C2 (ru) * 2005-08-30 2013-01-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
EP1946302A4 (en) 2005-10-05 2009-08-19 Lg Electronics Inc SIGNAL PROCESSING METHOD AND APPARATUS, ENCODING AND DECODING METHOD, AND ASSOCIATED APPARATUS
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
KR100813269B1 (ko) 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
CN102237094B (zh) * 2005-10-12 2013-02-20 三星电子株式会社 处理/发送比特流以及接收/处理比特流的方法和设备
EP2555187B1 (en) * 2005-10-12 2016-12-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data and extension data
US20080262853A1 (en) * 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US7716043B2 (en) 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
EP1946310A4 (en) * 2005-10-26 2011-03-09 Lg Electronics Inc METHOD FOR CODING AND DECODING A MULTI CHANNEL AUDIO SIGNAL AND DEVICE THEREFOR
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007080225A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
JP4806031B2 (ja) 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
CN101410891A (zh) 2006-02-03 2009-04-15 韩国电子通信研究院 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置
KR100983286B1 (ko) 2006-02-07 2010-09-24 엘지전자 주식회사 부호화/복호화 장치 및 방법
FR2899423A1 (fr) 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
DE102006017280A1 (de) 2006-04-12 2007-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
EP2070392A2 (en) * 2006-09-14 2009-06-17 Koninklijke Philips Electronics N.V. Sweet spot manipulation for a multi-channel signal
MX2008012251A (es) 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
RU2407072C1 (ru) * 2006-09-29 2010-12-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP5463143B2 (ja) 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
EP2102858A4 (en) 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
JP5554065B2 (ja) * 2007-02-06 2014-07-23 コーニンクレッカ フィリップス エヌ ヴェ 複雑さの軽減されたパラメトリックステレオデコーダ
KR101049143B1 (ko) 2007-02-14 2011-07-15 엘지전자 주식회사 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법
US20100121633A1 (en) * 2007-04-20 2010-05-13 Panasonic Corporation Stereo audio encoding device and stereo audio encoding method
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
ES2461601T3 (es) * 2007-10-09 2014-05-20 Koninklijke Philips N.V. Procedimiento y aparato para generar una señal de audio binaural
EP2214163A4 (en) * 2007-11-01 2011-10-05 Panasonic Corp CODING DEVICE, DECODING DEVICE AND METHOD THEREFOR
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US8548615B2 (en) 2007-11-27 2013-10-01 Nokia Corporation Encoder
CN101188878B (zh) * 2007-12-05 2010-06-02 武汉大学 立体声音频信号的空间参数量化及熵编码方法和所用系统
AU2008344073B2 (en) 2008-01-01 2011-08-11 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20100284549A1 (en) * 2008-01-01 2010-11-11 Hyen-O Oh method and an apparatus for processing an audio signal
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
EP2250641B1 (en) * 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
WO2009135532A1 (en) * 2008-05-09 2009-11-12 Nokia Corporation An apparatus
US8355921B2 (en) 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
US8644526B2 (en) 2008-06-27 2014-02-04 Panasonic Corporation Audio signal decoding device and balance adjustment method for audio signal decoding device
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
WO2010037427A1 (en) * 2008-10-03 2010-04-08 Nokia Corporation Apparatus for binaural audio coding
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
EP2378515B1 (en) 2009-01-13 2013-09-25 Panasonic Corporation Audio signal decoding device and method of balance adjustment
US8504378B2 (en) 2009-01-22 2013-08-06 Panasonic Corporation Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
US9053701B2 (en) 2009-02-26 2015-06-09 Panasonic Intellectual Property Corporation Of America Channel signal generation device, acoustic signal encoding device, acoustic signal decoding device, acoustic signal encoding method, and acoustic signal decoding method
CN102428512A (zh) 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011046329A2 (ko) * 2009-10-14 2011-04-21 한국전자통신연구원 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
CN102157152B (zh) * 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
CN102157150B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声解码方法及装置
EP2375410B1 (en) 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
CN103098131B (zh) 2010-08-24 2015-03-11 杜比国际公司 调频立体声无线电接收器的间歇单声道接收的隐藏
JP5753540B2 (ja) * 2010-11-17 2015-07-22 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法
ES2560402T3 (es) 2012-04-05 2016-02-18 Huawei Technologies Co., Ltd Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico
FR2990551A1 (fr) * 2012-05-31 2013-11-15 France Telecom Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires
WO2013184130A1 (en) * 2012-06-08 2013-12-12 Intel Corporation Echo cancellation algorithm for long delayed echo
CN104050969A (zh) 2013-03-14 2014-09-17 杜比实验室特许公司 空间舒适噪声
US10219093B2 (en) * 2013-03-14 2019-02-26 Michael Luna Mono-spatial audio processing to provide spatial messaging
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN106782573B (zh) * 2016-11-30 2020-04-24 北京酷我科技有限公司 一种编码生成aac文件的方法
GB2559200A (en) 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
GB2559199A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
CN109427337B (zh) 2017-08-23 2021-03-30 华为技术有限公司 立体声信号编码时重建信号的方法和装置
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
US11451919B2 (en) * 2021-02-19 2022-09-20 Boomcloud 360, Inc. All-pass network system for colorless decorrelation with constraints

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
WO1995018523A1 (en) * 1993-12-23 1995-07-06 Philips Electronics N.V. Method and apparatus for encoding multibit coded digital sound through subtracting adaptive dither, inserting buried channel bits and filtering, and encoding and decoding apparatus for use with this method
US5781130A (en) * 1995-05-12 1998-07-14 Optex Corporation M-ary (d,k) runlength limited coding for multi-level data
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6049766A (en) * 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
US6931291B1 (en) * 1997-05-08 2005-08-16 Stmicroelectronics Asia Pacific Pte Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
US6173061B1 (en) * 1997-06-23 2001-01-09 Harman International Industries, Inc. Steering of monaural sources of sound using head related transfer functions
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6430529B1 (en) * 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
ATE369600T1 (de) 2000-03-15 2007-08-15 Koninkl Philips Electronics Nv Laguerre funktion für audiokodierung
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
KR100701452B1 (ko) 2000-05-17 2007-03-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 스펙트럼 모델링
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
CN1240048C (zh) * 2001-04-18 2006-02-01 皇家菲利浦电子有限公司 音频编码
ATE334556T1 (de) * 2001-04-18 2006-08-15 Koninkl Philips Electronics Nv Audiokodierung mit partieller enkryption
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
CN1237507C (zh) * 2001-06-08 2006-01-18 皇家菲利浦电子有限公司 音频信号的编辑
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10014000B2 (en) 2008-07-11 2018-07-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal encoder and method for generating a data stream having components of an audio signal in a first frequency band, control information and spectral band replication parameters
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
US8731948B2 (en) 2008-07-11 2014-05-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer for selectively performing different patching algorithms
US10522168B2 (en) 2008-07-11 2019-12-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
RU2495503C2 (ru) * 2008-07-29 2013-10-10 Панасоник Корпорэйшн Устройство кодирования звука, устройство декодирования звука, устройство кодирования и декодирования звука и система проведения телеконференций
US8494865B2 (en) 2008-10-08 2013-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, method for decoding an audio signal, method for encoding an audio signal, computer program and audio signal
US8892450B2 (en) 2008-10-29 2014-11-18 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata
RU2468451C1 (ru) * 2008-10-29 2012-11-27 Долби Интернэшнл Аб Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала
RU2550549C2 (ru) * 2010-08-03 2015-05-10 Сони Корпорейшн Устройство и способ обработки сигнала и программа
RU2666291C2 (ru) * 2010-08-03 2018-09-06 Сони Корпорейшн Устройство и способ обработки сигнала и программа
US9502040B2 (en) 2011-01-18 2016-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of slot positions of events in an audio signal frame
RU2575393C2 (ru) * 2011-01-18 2016-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала
US9343074B2 (en) 2012-01-20 2016-05-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for audio encoding and decoding employing sinusoidal substitution
RU2562383C2 (ru) * 2012-01-20 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования и декодирования аудио, применяющие синусоидальную замену
RU2751104C2 (ru) * 2013-07-12 2021-07-08 Конинклейке Филипс Н.В. Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты
RU2676899C2 (ru) * 2014-07-01 2019-01-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Модуль вычисления и способ для определения данных фазовой коррекции для аудиосигнала
US10930292B2 (en) 2014-07-01 2021-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using horizontal phase correction
US10283130B2 (en) 2014-07-01 2019-05-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using vertical phase correction
US10140997B2 (en) 2014-07-01 2018-11-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
US10192561B2 (en) 2014-07-01 2019-01-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using horizontal phase correction
US10529346B2 (en) 2014-07-01 2020-01-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Calculator and method for determining phase correction data for an audio signal
US10770083B2 (en) 2014-07-01 2020-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using vertical phase correction
RU2683487C1 (ru) * 2015-06-16 2019-03-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Сокращенное декодирование
US10431230B2 (en) 2015-06-16 2019-10-01 Fraunhofer-Gesellschaft Zur Foerderung De Angewandten Forschung E.V. Downscaled decoding
US11062719B2 (en) 2015-06-16 2021-07-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downscaled decoding
US11341979B2 (en) 2015-06-16 2022-05-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downscaled decoding
US11341980B2 (en) 2015-06-16 2022-05-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downscaled decoding
US11341978B2 (en) 2015-06-16 2022-05-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downscaled decoding
US11670312B2 (en) 2015-06-16 2023-06-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downscaled decoding

Also Published As

Publication number Publication date
US7542896B2 (en) 2009-06-02
EP1523863A1 (en) 2005-04-20
BR0305555A (pt) 2004-09-28
RU2005104123A (ru) 2005-07-10
KR20050021484A (ko) 2005-03-07
WO2004008806A1 (en) 2004-01-22
AU2003281128A1 (en) 2004-02-02
CN1669358A (zh) 2005-09-14
JP2005533271A (ja) 2005-11-04
US20050177360A1 (en) 2005-08-11

Similar Documents

Publication Publication Date Title
RU2325046C2 (ru) Аудиокодирование
KR101049751B1 (ko) 오디오 코딩
JP5498525B2 (ja) 空間的オーディオのパラメータ表示
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
RU2551797C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
RU2384014C2 (ru) Формирование рассеянного звука для схем бинаурального кодирования с использованием ключевой информации (всс)
US8817992B2 (en) Multichannel audio coder and decoder
MXPA06014987A (es) Aparato y metodo para generar senal de control de sintetizador de multiples canales y aparato y metodo para sintetizar multiples canales.
KR20040080003A (ko) 파라메트릭 오디오 코딩
CN101010725A (zh) 多信道信号编码装置以及多信道信号解码装置
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
RU2420026C2 (ru) Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов
WO2023153228A1 (ja) 符号化装置、及び、符号化方法
Jean et al. Two-stage bit allocation algorithm for stereo audio coder

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20100702