RU2425340C2 - Оптимизированное по точности кодирование с подавлением упреждающего эхо - Google Patents

Оптимизированное по точности кодирование с подавлением упреждающего эхо Download PDF

Info

Publication number
RU2425340C2
RU2425340C2 RU2007121143/09A RU2007121143A RU2425340C2 RU 2425340 C2 RU2425340 C2 RU 2425340C2 RU 2007121143/09 A RU2007121143/09 A RU 2007121143/09A RU 2007121143 A RU2007121143 A RU 2007121143A RU 2425340 C2 RU2425340 C2 RU 2425340C2
Authority
RU
Russia
Prior art keywords
signal
decoded
signals
generating
main
Prior art date
Application number
RU2007121143/09A
Other languages
English (en)
Other versions
RU2007121143A (ru
Inventor
Стефан БРУН (SE)
Стефан БРУН
Ингемар ЙОХАНССОН (SE)
Ингемар ЙОХАНССОН
Аниссе ТАЛЕБ (SE)
Аниссе ТАЛЕБ
Даниель ЭНСТРЕМ (SE)
Даниель ЭНСТРЕМ
Original Assignee
Телефонактиеболагет Лм Эрикссон (Пабл)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303501A external-priority patent/SE0303501D0/xx
Application filed by Телефонактиеболагет Лм Эрикссон (Пабл) filed Critical Телефонактиеболагет Лм Эрикссон (Пабл)
Publication of RU2007121143A publication Critical patent/RU2007121143A/ru
Application granted granted Critical
Publication of RU2425340C2 publication Critical patent/RU2425340C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Endoscopes (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

Настоящее изобретение относится к кодированию аудиосигналов, в частности, к кодированию многоканальных аудиосигналов. Техническим результатом является повышение качества восприятия звуковых сигналов при передаче многоканальных сигналов на очень низких битовых скоростях. Указанный технический результат достигается тем, что способ кодирования многоканальных аудиосигналов содержит генерирование первого выходного сигнала (x'mono), представляющего параметры кодирования, характеризующие основной сигнал (хmono). Основной сигнал (xmono) является первой линейной комбинацией сигналов (16А, 16В), по меньшей мере, первого и второго каналов. Способ также содержит генерирование второго выходного сигнала (pside), представляющего параметры кодирования, характеризующие побочный сигнал (xside). Побочный сигнал (Xside) является второй линейной комбинацией сигналов (16А, 16В), по меньшей мере, первого и второго каналов в кадре кодирования. Генерирование второго выходного сигнала дополнительно содержит масштабирование побочного сигнала (xside) по контуру энергии основного сигнала (xmono). 5 н. и 12 з.п. ф-лы, 15 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к кодированию аудиосигналов, в частности к кодированию многоканальных аудиосигналов.
Предшествующий уровень техники
На рынке существует большая потребность передавать и сохранять аудиосигналы на низкой скорости передачи в битах, одновременно сохраняя высокое качество звука. В частности, в случаях, когда ресурсы передачи или объем памяти ограничены, работа с низкой скоростью передачи в битах является важнейшим фактором стоимости. В типовом случае это имеет место, например, в приложениях потоковой передачи и обмена сообщениями в системах мобильной связи, например GSM, UMTS или CDMA.
В настоящее время не существует стандартизированных кодеков, обеспечивающих высокое стереофоническое качество звука на скоростях передачи в битах, которые представляют экономический интерес для использования в системах мобильной связи. С помощью доступных кодеков возможна монофоническая передача звуковых сигналов. Также доступна стереофоническая передача в некоторой степени. Тем не менее, ограничения на скорость передачи в битах обычно требуют достаточно радикального ограничения на представление стерео.
Наиболее простой способ стереофонического или многоканального кодирования аудиосигналов - кодировать сигналы различных каналов по отдельности как отдельные и независимые сигналы. Еще один базовый способ, используемый при ЧМ-стереорадиопередаче, который обеспечивает совместимость с традиционными монофоническими радиоприемниками, - передавать суммарный и разностный сигнал двух используемых каналов.
Современные аудиокодеки, например MPEG-1/2 Layer III и MPEG-2/4 AAC, применяют так называемое объединенное стереокодирование. Согласно этому методу сигналы различных каналов обрабатываются совместно, а не отдельно и один за другим. Два наиболее часто используемых метода объединенного стереокодирования известны как стереокодирование по методу "Mid/Side" (M/S) и стереокодирование по интенсивности, которые обычно применяются на поддиапазонах стерео- или многоканальных сигналов, которые должны кодироваться.
M/S-стереокодирование аналогично описанной процедуре в ЧМ-стереорадиопередаче в том смысле, что оно кодирует и передает суммарный и разностный сигналы поддиапазонов канала и тем самым использует избыточность между поддиапазонами канала. Структура и работа кодера, основанного на M/S-стереокодировании, описана, например, в патенте США № 5285498, на имя J.D.Johnston.
Стереокодирование по интенсивности, с другой стороны, может использовать нерелевантность стерео. Оно передает объединенную интенсивность каналов (различных поддиапазонов) вместе с определенной информацией о местоположении, показывающей как интенсивность распределена между каналами. Стереокодирование по интенсивности не только предоставляет информацию о спектральной амплитуде каналов. Информация о фазах не передается. По этой причине и поскольку временная межканальная информация (более конкретно, межканальная разность времен) представляет важнейшую психоакустическую значимость, особенно на более низких частотах, стереокодирование по интенсивности может быть использовано только на высоких частотах около, к примеру, 2 КГц. Способ стереокодирования по интенсивности описан, к примеру, в Европейском патенте № 0497413, на имя R, Veldhuis et al.
Недавно разработанный способ стереокодирования описан, к примеру, в материалах конференции с названием C.Faller et al. "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, май 2002 года, Мюнхен, Германия, С. Фаллер и др. Этот способ представляет собой способ параметрического кодирования многоканального аудиосигнала. Базовый принцип состоит в том, что на стороне кодирования входные сигналы из N каналов C1, C2,..., CN объединяются в один моносигнал m. Моносигнал представляет собой аудиосигнал, закодированный с использованием любого традиционного монофонического аудиокодека звука. Параллельно извлекаются параметры из канальных сигналов, которые описывают многоканальное изображение. Параметры кодируются и передаются декодеру вместе битовым потоком аудиосигнала. Декодер сначала декодирует моносигнал m' и затем регенерирует канальные сигналы C1', C2',..., CN' на основе параметрического описания многоканального изображения.
Принцип способа стереофонического кодирования по меткам (BCC) заключается в том, что он передает закодированный моносигнал и так называемые параметры BCC. Параметры BCC содержат закодированные разности межканальных уровней и разности межканальных времен для поддиапазонов исходного многоканального входного сигнала. Декодер восстанавливает различные канальные сигналы посредством применения регулирования по поддиапазонам уровня фазы моносигнала на основе параметров BCC. Преимущество по сравнению с M/S- или стереокодированием по интенсивности заключается в том, что стереоинформация, содержащая временную межканальную информацию, передается на гораздо более низких скоростях в битах. Тем не менее, этот метод требует частотно-временных преобразований, требующих больших объемов вычислений, по каждому из каналов, как в кодере, так и в декодере.
Более того, BCC не использует тот факт, что значительная часть стереоинформации, особенно на низких частотах, рассеяна, т.е. она не поступает с какого-либо конкретного направления. Диффузные акустические поля существуют в обоих каналах стереозаписи, но они в значительной степени не совпадают по фазе по отношению друг к другу. Если такой алгоритм, как BCC применяется для записей с большим количеством диффузных акустических полей, воспроизведенное стереоизображение будет искаженным из-за скачков слева направо, поскольку алгоритм BCC может выбирать сигнал для отображения только в конкретных полосах частот слева или справа.
Возможным средством кодирования стереосигнала и обеспечения хорошего воспроизведения диффузных акустических полей является использование схемы кодирования, сходной с методом, использованным в ЧМ-стереорадиовещании, а именно кодирование моно- (левый+правый) и разностного (левый-правый) сигналов отдельно.
Способ, описанный в патенте США 5434948, на имя С. Е. Holt et al., использует аналогичный метод, как и в BCC, для кодирования моносигнала и дополнительной информации. В этом случае дополнительная информация состоит из фильтров предсказателей и факультативно остаточного сигнала. Фильтры предсказателей, оцененные посредством алгоритма наименьших квадратов, в применении к моносигналу, дают возможность предсказания многоканальных звуковых сигналов. С помощью этого способа можно реализовать кодирование на очень низких скоростях передачи в битах многоканальных источников звука, однако ценой снижения качества, как дополнительно описано ниже.
Наконец, для полноты следует упомянуть метод, используемый в трехмерном аудиосигнале. Этот метод синтезирует сигналы правого и левого каналов посредством фильтрации сигналов источника звука с помощью так называемых основанных на положении головы фильтров. Однако этот метод требует, чтобы сигналы различных источников звука были разделены, и таким образом не может быть, в общем случае, применен для стерео- или многоканального кодирования.
Сущность изобретения
Проблема в существующих схемах кодирования, основанных на кодировании кадров сигналов, в частности основного сигнала и одного или более побочных сигналов, заключается в существовании эффекта упреждающего эхо. Фиг.7a-b иллюстрируют этот дефект. Пусть компонент сигнала изменяется во времени, как показано кривой 100. Вначале, с момента t0, компонент сигнала не присутствует в аудиовыборке. Во время t между t1 и t2 компонент сигнала внезапно появляется. Когда компонент сигнала кодируется с использованием длины кадра t2-t1, появление компонента сигнала "размазывается" по всему кадру, как показано на кривой 101. Если осуществляется декодирование кривой 101, компонент сигнала появляется на время Δt раньше планируемого появления компонента сигнала и ощущается "упреждающее эхо".
Цель настоящего изобретения, следовательно, заключается в обеспечении способа и устройства кодирования, повышающих качество восприятия многоканальных звуковых сигналов, в частности, чтобы избежать дефектов, таких как упреждающее эхо. Дополнительная цель настоящего изобретения заключается в обеспечении способа и устройства кодирования, требующих меньшей вычислительной мощности и имеющих более постоянные требования к скорости передачи в битах.
Вышеуказанные цели достигаются посредством способов и устройств согласно формуле изобретения. В основном согласно первому аспекту способ кодирования многоканальных аудиосигналов содержит генерирование первого выходного сигнала, представляющего параметры кодирования, характеризующие основной сигнал. Основной сигнал является первой линейной комбинацией сигналов, по меньшей мере, первого и второго каналов. Способ дополнительно содержит генерирование второго выходного сигнала, представляющего параметры кодирования, характеризующие побочный сигнал. Побочный сигнал является второй линейной комбинацией сигналов, по меньшей мере, первого и второго каналов в кадре кодирования. Способ отличается тем, что генерирование второго выходного сигнала дополнительно содержит масштабирование побочного сигнала по контуру энергии основного сигнала.
Во втором аспекте способ декодирования многоканальных аудиосигналов содержит генерирование декодированного основного сигнала из параметров кодирования, представляющих основной сигнал. Основной сигнал является первой линейной комбинацией сигналов, по меньшей мере, первого и второго каналов. Способ также содержит генерирование декодированного побочного сигнала из параметров кодирования, представляющих побочный сигнал. Побочный сигнал является второй линейной комбинацией сигналов, по меньшей мере, первого и второго каналов в кадре кодирования. Способ дополнительно содержит объединение, по меньшей мере, декодированного основного сигнала и декодированного побочного сигнала в сигналы, по меньшей мере, первого и второго каналов. Способ отличается тем, что генерирование декодированного побочного сигнала дополнительно содержит масштабирование декодированного побочного сигнала по контуру энергии декодированного основного сигнала.
В третьем аспекте устройство для кодирования содержит средство ввода для многоканальных аудиосигналов, содержащих, по меньшей мере, первый и второй каналов. Устройство для кодирования содержит средство для генерации первого выходного сигнала, представляющего параметры кодирования, характеризующие основной сигнал. Основной сигнал является первой линейной комбинацией сигналов, по меньшей мере, первого и второго каналов. Устройство для кодирования также содержит средство для генерации второго выходного сигнала, представляющего параметры кодирования, характеризующие побочный сигнал. Побочный сигнал является второй линейной комбинацией сигналов, по меньшей мере, первого и второго каналов в кадре кодирования. Устройство для кодирования дополнительно содержит средство вывода. Устройство для кодирования отличается тем, что средство для генерации второго выходного сигнала дополнительно содержит средство для масштабирования побочного сигнала по контуру энергии основного сигнала.
В четвертом аспекте устройство для декодирования содержит средство ввода для параметров кодирования, представляющих основной сигнал, и параметров кодирования, представляющих побочный сигнал. Основной сигнал является первой линейной комбинацией сигналов первого и второго каналов. Побочный сигнал является второй линейной комбинацией сигналов первого и второго канала. Устройство для декодирования также содержит средство для генерации декодированного основного сигнала из параметров кодирования, представляющих основной сигнал, и средство для генерации декодированного побочного сигнала из параметров кодирования, представляющих побочный сигнал в кадре кодирования. Устройство для декодирования также содержит средство для объединения, по меньшей мере, декодированного основного сигнала и декодированного побочного сигнала в сигналы, по меньшей мере, первого и второго каналов, и средство вывода. Устройство для декодирования отличается тем, что средство для генерации декодированного побочного сигнала дополнительно содержит средство для масштабирования декодированного побочного сигнала по контуру энергии декодированного основного сигнала.
В пятом аспекте аудиосистема содержит, по меньшей мере, одно из устройства для кодирования согласно третьему аспекту и устройства для декодирования согласно четвертому аспекту.
Основное преимущество настоящего изобретения заключается в том, что повышается надежность восприятия звуковых сигналов. Более того, настоящее изобретение по-прежнему дает возможность передачи многоканальных сигналов на очень низких скоростях в битах.
Краткое описание чертежей
Изобретение вместе со своими дополнительными целями и преимуществами поясняются в последующем описании со ссылками на чертежи, из которых:
Фиг.1 - блок-схема системы передачи полифонических сигналов;
Фиг.2a - блок-схема кодера в передающем устройстве;
Фиг.2b - блок-схема декодера в передающем устройстве;
Фиг.3a - схема, иллюстрирующая кодирование кадров различной длины;
Фиг.3b и 3c - блок-схемы вариантов осуществления устройств кодирования побочных сигналов согласно настоящему изобретению;
Фиг.4 - блок-схема варианта осуществления кодера, использующего кодирование побочного сигнала с учетом коэффициента симметрирования;
Фиг.5 - блок-схема варианта осуществления кодера в многосигнальных системах;
Фиг.6 - блок-схема варианта осуществления декодера, подходящего для декодирования сигналов с устройства, показанного на фиг.5;
Фиг.7a и 7b - схемы, иллюстрирующие дефект упреждающего эхо;
Фиг.8 - блок-схема варианта осуществления устройства кодирования побочного сигнала согласно настоящему изобретению, использующего различные принципы кодирования в различных субкадрах;
Фиг.9 иллюстрирует применение различных принципов кодирования в различных поддиапазонах частот;
Фиг.10 - блок-схема последовательности основных этапов варианта осуществления способа кодирования согласно настоящему изобретению;
Фиг.11 - блок-схема последовательности основных этапов варианта осуществления способа декодирования согласно настоящему изобретению.
Подробное описание изобретения
Фиг.1 иллюстрирует типичную систему 1, в которой настоящее изобретение может быть преимущественно использовано. Передающее устройство 10 содержит антенну 12, включающую в себя аппаратные средства и программное обеспечение, обеспечивающие возможность передавать радиосигналы 5 приемному устройству 20. Передающее устройство 10 содержит, помимо других компонентов, многоканальный кодер 14, который преобразует сигналы ряда входных каналов 16 в выходные сигналы, подходящие для радиопередачи. Примеры подходящих многоканальных кодеров 14 подробнее описаны ниже. Сигналы входных каналов 16 могут быть предоставлены, к примеру, из памяти 18 аудиосигналов, например из файла данных цифрового представления аудиозаписей, аудиозаписи звука на магнитной ленте или виниловом диске и т.д. Сигналы входных каналов 16 также могут обеспечиваться "вживую", к примеру, из набора микрофонов 19. Аудиосигналы оцифровываются, если не находятся уже в цифровой форме, перед вводом в многоканальный кодер 14.
На стороне приемного устройства 20 антенна 22 со связанными аппаратными средствами и программным обеспечением обеспечивают обработку фактического приема радиосигналов 5, представляющих полифонические аудиосигналы. Реализуются типовые функциональные возможности, например коррекция ошибок. Декодер 24 декодирует принятые радиосигналы 5 и преобразует аудиоданные, передаваемые таким образом, в сигналы ряда выходных каналов 26. Выходные сигналы могут выдаваться, например, на громкоговорители 29 для немедленного представления или могут быть сохранены в памяти 28 аудиосигналов любого типа.
Системой 1 может быть, например, система телефонных конференций, система для предоставления аудиоуслуг или других аудиоприложений. В некоторых системах, таких как, к примеру, система телефонных конференций, обмен данными должен быть дуплексного типа, тогда как, к примеру, распространение музыки от поставщика услуг к абоненту должно быть, по существу, одностороннего типа. Передача сигналов от передающего устройства 10 к приемному устройству 20 также может выполняться любыми другими средствами, к примеру, посредством других видов электромагнитных волн, кабелей или оптоволокна, а также их сочетаний.
Фиг.2a иллюстрирует вариант осуществления кодера согласно настоящему изобретению. В данном варианте осуществления полифонический сигнал представляет собой стереосигнал, содержащий два канала a и b, принятый на входе 16A и 16B, соответственно. Сигналы канала a и b подаются в устройство 32 предварительной обработки, где могут выполняться различные процедуры предварительного формирования сигнала. Сигналы (возможно, модифицированные) из выхода устройства 32 предварительной обработки суммируются в устройстве 34 суммирования. Устройство 34 суммирования также делит сумму на два. Сигнал xmono, генерируемый таким образом, является основным сигналом из стереосигналов, поскольку он, по существу, содержит все данные из обоих каналов. В этом варианте осуществления основной сигнал таким образом представляет чистый "моно-" сигнал. Основной сигнал xmono подается на устройство 38 кодирования основного сигнала, которое кодирует основной сигнал согласно любым надлежащим принципам кодирования. Эти принципы известны из предшествующего уровня техники и поэтому дополнительно не описываются. Устройство 38 кодирования основного сигнала выдает выходной сигнал pmono, представляющий параметры кодирования, характеризующие основной сигнал.
В устройстве 36 вычитания разность (поделенная на два) канальных сигналов обеспечивается как побочный сигнал xside. В этом варианте осуществления побочный сигнал представляет разницу между двумя каналами в стереосигнале. Побочный сигнал xside подается в устройство 30 кодирования побочных сигналов. Предпочтительные варианты осуществления устройства 30 кодирования побочных сигналов дополнительно описываются ниже. Согласно процедуре кодирования побочных сигналов, которая подробнее описана ниже, побочный сигнал xside преобразуется в параметры кодирования pside, представляющие побочный сигнал xside. В некоторых вариантах осуществления данное кодирование осуществляется с использованием также информации основного сигнала xmono. Стрелка 42 показывает такую возможность, когда используется исходный некодированный основной сигнал xmono. В других вариантах осуществления информация основного сигнала, которая используется в устройстве 30 кодирования побочных сигналов, может быть выведена из параметров кодирования pmono, представляющих основной сигнал, как показано прерывистой линией 44.
Параметры кодирования pmono, представляющие основной сигнал xmono, являются первым выходным сигналом, а параметры кодирования pside, представляющие побочный сигнал xside, являются вторым выходным сигналом. В типичном случае эти два выходных сигнала pmono, pside, вместе представляющие полностью стереофонический звук, мультиплексируются в один сигнал 52 передачи в устройстве 40 мультиплексирования. В других вариантах осуществления передача первого и второго выходных сигналов pmono, pside может выполняться раздельно.
На фиг.2b вариант осуществления декодера 24 согласно настоящему изобретению проиллюстрирован как блок-схема. Принятый сигнал 54, содержащий параметры кодирования, представляющие информацию основного и побочного сигналов, подается в устройство 56 демультиплексирования, которое разделяет первый и второй входные сигналы, соответственно. Первый входной сигнал, соответствующий параметрам кодирования pmono основного сигнала, подается в устройство 64 декодирования основного сигнала. Традиционно параметры кодирования pmono, представляющие основной сигнал, используются, чтобы генерировать декодированный основной сигнал x''mono, который в максимальной степени подобен основному сигналу xmono (фиг.2a) кодера 14 (фиг.2a).
Аналогично, второй входной сигнал, соответствующий побочному сигналу, подается в устройство 60 декодирования побочных сигналов. Здесь параметры кодирования pside, представляющие побочный сигнал, используются для восстановления декодированного побочного сигнала x"side. В некоторых вариантах осуществления процедура декодирования использует информацию об основном сигнале x''mono, что показано стрелкой.
Декодированный основной и побочные сигналы x''mono, x"side подаются в устройство 70 суммирования, которое выдает выходной сигнал, который является представлением исходного сигнала канала a. Аналогично, разность, обеспеченная устройством 68 вычитания, является выходным сигналом, который является представлением исходного сигнала канала b. Эти канальные сигналы могут быть обработаны в постпроцессоре 74 согласно процедурам обработки сигналов предшествующего уровня техники. Наконец, канальные сигналы a и b подаются на выходы 26A и 26B декодера.
Как упоминалось при описании сущности изобретения, кодирование в типовом случае выполняется на покадровой основе. Кадр содержит аудиовыборки за заранее определенный период времени. В нижней части фиг.3a проиллюстрирован кадр SF2 длительностью L. Аудиовыборки в незаштрихованной области должны кодироваться вместе. Предшествующие выборки и последующие выборки кодируются в других кадрах. Деление выборок на кадры в любом случае приведет к некоторым неоднородностям в границах кадров. Смещение звуков приведет к смещению параметров кодирования, существенно изменяясь на границе каждого кадра. Это приведет к воспринимаемым ошибкам. Возможный способ, в какой-то степени компенсировать это, состоит в кодировании не только на основе выборок, которые должны быть закодированы, но также выборок в абсолютной окрестности кадра, как указано заштрихованными частями. Таким образом достигается более мягкий переход между различными кадрами. В качестве альтернативы или дополнения иногда также используются методы интерполяции для уменьшения дефектов восприятия, вызываемых границами кадров. Тем не менее, все эти процедуры требуют значительных дополнительных вычислительных ресурсов, и для некоторых специальных методов кодирования также может быть трудно обеспечить их определенными ресурсами.
С этой точки зрения выгодно использовать кадры настолько большой длины, насколько это возможно, поскольку число границ кадров будет небольшим. Также эффективность кодирования в типовом случае становится высокой, а необходимая скорость передачи в битах минимизируется. Тем не менее, кадры большой длины приводят к проблемам с дефектами упреждающего эхо и паразитным звукам.
Посредством использования более коротких кадров, например SF1 или даже SF0, имеющих длительность L/2 и L/4 соответственно, как понимают специалисты в данной области техники, эффективность кодирования может быть уменьшена, скорость передачи в битах, возможно, будет выше, и проблемы с дефектами границ кадров увеличатся. Тем не менее, более короткие кадры меньше подвержены, к примеру, другим дефектам восприятия, таким как паразитные звуки и упреждающее эхо. Чтобы иметь возможность минимизировать ошибки кодирования в максимальной степени, следует использовать кадр максимально короткой длины.
Согласно настоящему изобретению восприятие аудиосигналов улучшается посредством использования длины кадра для кодирования подобного сигнала, которая зависит от текущего содержимого сигнала. Поскольку влияние различных длин кадров на восприятие аудиосигнала различается в зависимости от характера звука, который должен кодироваться, улучшение может быть достигнуто посредством обеспечения возможности самого характера сигнала влиять на используемую длину кадра. Кодирование основного сигнала не является целью настоящего изобретению и поэтому не описывается подробно. Однако длины кадров, используемых для основного сигнала, могут равняться или не равняться длинам кадров, используемых для побочного сигнала.
Вследствие незначительных временных вариаций может быть выгодно, например, в некоторых случаях кодировать побочный сигнал с использованием относительно длинных кадров. Это может иметь место в случае с записями с большим количеством диффузного акустического поля, к примеру, концертными записями. В других случаях, например разговорах в режиме стерео, короткие кадры, возможно, предпочтительнее. Решение о том, какую длину кадра предпочесть, может приниматься двумя основными способами.
Один вариант осуществления устройства 30 кодирования побочных сигналов согласно настоящему изобретению проиллюстрирован на фиг.3b, в котором используется решение с обратной связью. Здесь используется базовый кадр кодирования длины L. Создается ряд схем 81 кодирования, отличающихся отдельным набором 80 субкадров 90. Каждый набор 80 субкадров 90 содержит один или более субкадров 90 равной или различной длины. Общая длина набора 80 субкадров 90, тем не менее, всегда равна длине базового кадра L кодирования. Согласно фиг.3b верхняя схема кодирования характеризуется набором субкадров, содержит только один субкадр длины L. Следующий набор субкадров содержит два кадра длины L/2. Третий набор содержит два кадра длины L/4, за которыми следует кадр L/2.
Сигнал xside, подаваемый на устройство 30 кодирования побочного сигнала, кодируется посредством всех схем 81 кодирования. В верхней схеме кодирования весь базовый кадр кодирования кодируется в полном кадре. Однако в других схемах кодирования сигнал xside кодируется в каждом субкадре независимо друг от друга. Результат от каждой схемы кодирования подается в селектор 85. Средство 83 измерения точности определяет измеренное значение точности для каждого из кодированных сигналов. Измеренное значение точности является объективным значением качества, предпочтительно мерой отношения "сигнал-шум" или взвешенным соотношением "сигнал-шум". Измеренные значения точности, связанные с каждой схемой кодирования, сравниваются, и результат управляет средством 87 переключения для выбора параметров кодирования, представляющих побочный сигнал, из схемы кодирования, обеспечивающие наилучшее измеренное значение точности, в качестве выходного сигнала pside из устройства 30 кодирования побочных сигналов.
Предпочтительно все возможные сочетания длины кадров тестируются, и выбирается набор субкадров, который обеспечивает наилучшее объективное качество, к примеру соотношение "сигнал-шум".
В настоящем варианте осуществления длина используемых субкадров выбирается согласно
Figure 00000001
,
где l sf - это длины субкадров, l f - длина кадра кодирования, а n - целое число. В настоящем варианте осуществления n выбирается от 0 до 3. Тем не менее, возможно использовать любую длину кадров, если общая длина набора сохраняется постоянной.
На фиг.3c проиллюстрирован другой вариант осуществления устройства 30 кодирования побочных сигналов. Здесь решение о длине кадра является решением без обратной связи, основанным на статистике сигнала. Другими словами, спектральные характеристики побочного сигнала используются в качестве базы для принятия решения о том, какая схема кодирования будет использована. Как и раньше, имеются различные схемы кодирования, характеризующиеся различными наборами субкадров. Однако в данном варианте осуществления селектор 85 предшествует фактическому кодирования. Входной побочный сигнал xside поступает в селектор 85 и блок 84 анализа сигналов. Результат анализа является входным сигналом переключателя 86, в котором используется только одна из схем 81 кодирования. Выходной сигнал этой схемы кодирования также является выходным сигналом pside устройства 30 кодирования побочных сигналов.
Преимущество решения без обратной связи заключается в том, что должно быть выполнено только одно фактическое кодирование. Недостаток заключается в том, что анализ характеристик сигнала может быть очень усложнен, и может быть трудно предсказывать возможные линии поведения заранее, чтобы иметь возможность предоставлять соответствующий выбор в переключателе 86. Большой объем статистического анализа звука должен быть выполнен и включен в устройство 84 анализа сигнала. Любое незначительное изменение в схемах кодирование может привести к кардинальному изменению статистической линии поведения.
Посредством выбора с обратной связью (фиг.3b) схемы кодирования могут заменяться без выполнения каких-либо изменений в остальном устройстве. С другой стороны, если должно быть проанализировано множество схем кодирования, то требования по вычислениям будут высокими.
Преимущество такого кодирования с переменной длиной кадра для побочного сигнала заключается в том, что можно осуществить выбор между точным временным разрешением и грубым частотным разрешением, с одной стороны, и грубым временным разрешением и точным частотным разрешением, с другой стороны. Вышеперечисленные варианты осуществления сохраняют стереоизображение наилучшим возможным образом.
Существуют также некоторые требования по фактическому кодированию, используемому в различных схемах кодирования. В частности, когда используется выбор с обратной связью, вычислительные ресурсы, чтобы выполнять ряд более или менее одновременных операций кодирования, должны быть значительными. Чем более сложен процесс кодирования, тем больше вычислительной мощности требуется. Более того, низкая скорость передачи в битах также предпочтительна.
Способ, представленный в патенте США № 5434948, использует фильтрованную версию моносигнала (основного), для воссоздания побочного или разностного сигнала. Параметры фильтрации оптимизированы и могут меняться во времени. Затем передаются параметры фильтрации, представляющие кодирование побочного сигнала. В одном варианте осуществления также передается остаточный побочный сигнал. Во многих случаях этот подход может быть возможен, чтобы использовать в качестве способа кодирования побочного сигнала в объеме настоящего изобретения. Тем не менее, этот подход имеет некоторые недостатки. Квантование коэффициентов фильтрации и любой остаточный побочный сигнал часто требуют относительно высоких скоростей передачи в битах, поскольку порядок фильтрации должен быть высоким, чтобы предоставлять точную оценку побочного сигнала. Оценка самой фильтрации может быть проблематична, особенно в случаях насыщенной музыки с множеством переходов. Ошибки оценки предоставляют модифицированный побочный сигнал, который иногда больше по амплитуде, чем немодифицированный сигнал. Это приводит к более высоким требованиям по скорости передачи в битах. Более того, если новый набор коэффициентов фильтрации вычисляется каждые N выборок, то коэффициенты фильтрации должны интерполироваться для достижения плавного перехода от одного набора коэффициентов фильтрации к другому, как описано выше. Интерполяция коэффициентов фильтрации является сложной задачей, и ошибки интерполяции будут проявляться в больших ошибках побочных сигналов, приводящих к более высоким скоростям передачи в битах, необходимым для кодера разностных сигналов ошибки.
Чтобы избежать необходимости в интерполяции, необходимо обновлять коэффициенты фильтрации для каждой выборки и использовать анализ с обратной совместимостью. Для получения хорошего результата необходимо, чтобы скорость передачи в битах кодера остаточного сигнала была достаточно высокой. Поэтому это не является оптимальной альтернативой стереокодированию с низкой скоростью передачи.
Существуют случаи, к примеру, достаточно часто в музыке, когда моносигналы и разностные сигналы практически некоррелированы. Оценка фильтрации в таком случае становится очень сложной с дополнительным риском ухудшения ситуации в кодере разностных сигналов ошибки.
Решение согласно патенту США 5434948 может работать достаточно хорошо в случаях, когда коэффициенты фильтрации изменяются очень медленно во времени, к примеру, в системах телефонных конференций. В случае музыкальных сигналов этот подход не работает оптимальным образом, поскольку фильтры должны изменяться очень быстро, чтобы отслеживать стереоизображение. Это означает, что должна быть использована длина субкадров с существенно различающейся величиной, т.е. число тестируемых комбинаций быстро возрастает. Это, в свою очередь, означает, что требования к вычислению всех возможных схем кодирования становятся невыполнимо высокими.
Поэтому в предпочтительном варианте осуществления кодирование побочного сигнала основано на идее снижения избыточности между моносигналами и побочными сигналами посредством использования простого коэффициента симметрирования вместо сложного фильтра предсказателя с высокими требованиями по скорости передачи в битах. Затем кодируется остаточный сигнал, получаемый в результате этой операции. Величина этого остаточного сигнала относительно мала и не требует очень высокой скорости передачи в битах. Данная идея очень подходит для сочетания с описанным выше подходом, основанным на наборе переменных кадров, поскольку вычислительная сложность невысока.
Использование коэффициента симметрирования в сочетании с подходом кадров переменной длины устраняет необходимость в сложной интерполяции и связанные проблемы, которые может вызывать интерполяция. Более того, использование простого коэффициента симметрирования вместо сложного фильтра вызывает меньше проблем с оценкой, поскольку возможные ошибки оценки для коэффициента симметрирования имеют меньшее влияние. Предпочтительное решение позволяет воспроизводить и панорамированные сигналы, и диффузные акустические поля с хорошим качеством и с ограниченными требованиями к скорости передачи в битах и вычислительным ресурсам.
Фиг.4 иллюстрирует предпочтительный вариант осуществления стереокодера согласно настоящему изобретению. Этот вариант во многом аналогичен показанному на фиг.2a, но с более детальным представлением устройства 30 кодирования побочных сигналов. Кодер 14 данного варианта осуществления не имеет устройства предварительной обработки, и входные сигналы подаются непосредственно на устройства 34, 36 суммирования и вычитания. Моносигнал xmono умножается на конкретный коэффициент симметрирования gsm в умножителе 33. В устройстве 35 вычитания умноженный моносигнал вычитается из побочного сигнала xside, т.е. фактически разности между двумя каналами для формирования остаточного побочного сигнала. Коэффициент симметрирования gsm определяется на основе содержимого моно- и побочных сигналов оптимизатором 37, чтобы минимизировать побочный остаточный сигнал согласно критерию качества. Критерием качества является предпочтительно критерий метода наименьших квадратов. Остаточный побочный сигнал кодируется в кодере 39 остаточных побочных сигналов согласно любым процедурам кодирования. Предпочтительно кодер 39 остаточных побочных сигналов представляет собой кодер с преобразованием на низких скоростях передачи в битах или линейный предикативный кодер с возбуждением по коду (CELP). Параметры кодирования pside, представляющие побочный сигнал, затем содержат параметры кодирования pside_residual, представляющие остаточный побочный сигнал и оптимизированный коэффициент симметрирования 49.
В варианте осуществления по фиг.4 моносигналом 42, используемым для синтеза побочных сигналов, является целевой сигнал xmono для кодера 38 моносигналов. Как упоминалось выше (в связи с фиг.2a), также может быть использован локальный синтезированный сигнал кодера 38 моносигналов. В последнем случае общая задержка в кодере может быть увеличена и вычислительная сложность побочного сигнала может возрасти. С другой стороны, качество может быть лучше, поскольку в таком случае можно устранять ошибки кодирования, обусловленные кодером моносигналов.
С математической точки зрения, базовая схема кодирования может быть описана следующим образом. Обозначим два канальных сигнала как a и b, которые могут быть левым и правым каналом стереопары. Канальные сигналы объединяются в моносигнал посредством суммирования и в побочный сигнал посредством вычитания. В форме уравнения операции описываются следующим образом:
Figure 00000002
Полезно уменьшить масштаб сигналов xmono и xside в два раза. При этом подразумевается, что имеются другие способы создания xmono и xside. Можно, к примеру, использовать:
Figure 00000003
В блоках входных сигналов модифицированный или остаточный побочный сигнал вычисляется согласно
Figure 00000004
,
где f(xmono, xside) - функция коэффициента симметрирования, которая на основе блока из N выборок, т.е. субкадра, побочных и моносигналов стремится увеличить долю сигнала, удаляемого из побочного сигнала. Другими словами, коэффициент симметрирования используется, чтобы минимизировать остаточный побочный сигнал. В специальном случае, когда она минимизируется в смысле наименьших квадратов, это эквивалентно минимизации энергии остаточного побочного сигнала xside residual.
В вышеупомянутом специальном случае f(x mono ,x side ) описывается как
Figure 00000005
где xside - побочный сигнал, xmono - моносигнал. Заметим, что функция основана на блоке, начинающемся в " начала кадра" и заканчивающемся в "конце кадра".
Можно добавить взвешивание в частотной области для вычисления коэффициента симметрирования. Это осуществляется посредством свертки сигналов xside и xmono с помощью импульсной характеристики фильтра взвешивания. Затем можно перенести ошибку оценки в частотный диапазон, где их легче расслышать. Это определяется как перцептуальное взвешивание.
Квантованная версия значения коэффициента симметрирования, заданного функцией f(x mono ,x side ), передается в декодер. Предпочтительно учитывать квантование уже после формирования модифицированного побочного сигнала. Затем получается выражение, представленное ниже:
Figure 00000006
где Q g (..) - функция квантования, которая применяется к коэффициенту симметрирования, заданному функцией f(x mono ,x side ). Коэффициент симметрирования передается по каналу передачи. В обычных панорамированных слева направо сигналах коэффициент симметрирования ограничен интервалом [-1,0... 1,0]. Если, с другой стороны, каналы не в фазе друг с другом, то коэффициент симметрирования может выйти за пределы этих ограничений.
Как дополнительное средство, чтобы стабилизировать стереоизображение, можно ограничить коэффициент симметрирования, если нормализованная взаимная корреляция между моно- и побочными сигналами задана следующим уравнением:
Figure 00000007
где
Figure 00000008
Эти ситуации возникают достаточно часто в случае, к примеру, классической музыки или студийной музыки с большим количеством диффузных звуков, где в некоторых ситуациях каналы a и b могут практически компенсировать друг друга при создании моносигнала. Влияние на коэффициент симметрирования заключается в том, что он может быстро изменяться, вызывая помехи в стереоизображении. Вышеописанное ограничение смягчает эту проблему.
Основанный на фильтровании подход согласно патенту США 5434948 имеет аналогичные проблемы, но в этом случае решение не является столь простым.
Если E s - функция кодирования (к примеру, кодер преобразования) остаточного побочного сигнала, а E m - функция кодирования моносигнала, то декодированные сигналы a" и b" в декодере могут быть описаны следующим образом (при условии, что γ=0,5):
Figure 00000009
Важное преимущество вычисления коэффициента симметрирования для каждого кадра заключается в том, что можно избежать использования интерполяции. Вместо этого обычно, как описано выше, обработка кадров осуществляется с помощью перекрывающихся кадров.
Принцип кодирования с помощью коэффициентов симметрирования работает особенно хорошо в случае музыкальных сигналов, где в типовом случае необходимы быстрые изменения, чтобы отслеживать стереоизображение.
В последнее время многоканальное кодирование стало популярным. Примером является 5.1-канальное объемное звучание в DVD-фильмах. Каналы при этом размещены следующим образом: левый фронтальный, центральный фронтальный, правый фронтальный, левый задний, правый задний и отдельный низкочастотный динамик (сабвуфер). На фиг.5 показан вариант осуществления кодера, который кодирует три фронтальных канала в такой конфигурации, используя межканальные избыточности, согласно настоящему изобретению.
Три канальных сигнала L, C, R предоставлены на трех входах 16A-C, и моносигнал xmono создается посредством суммирования этих трех сигналов. Добавлено устройство 130 кодирования центрального сигнала, которое принимает центральный сигнал xcentre. Моносигнал 42 в данном варианте осуществления представляет собой кодированный и декодированный моносигнал x''mono, умножаемый на определенный коэффициент симметрирования gQ в умножителе 133. В устройстве 135 вычитания умноженный моносигнал вычитается из центрального сигнала xcentre для получения центрального остаточного сигнала. Коэффициент симметрирования gQ определяется на основе содержимого моно- и центрального сигналов оптимизатором 137, чтобы минимизировать центральный остаточный сигнал согласно критерию качества. Центральный остаточный сигнал кодируется в кодере 139 центральных остаточных сигналов согласно любым процедурам кодирования. Предпочтительно кодер 139 центральных остаточных сигналов представляет собой кодер с преобразованием на низких скоростях передачи в битах или CELP-кодер. Параметры кодирования pcentre, представляющие центральный сигнал, в таком случае содержат параметры кодирования pcentre residual, представляющие центральный остаточный сигнал, и оптимизированный коэффициент симметрирования 149. Центральный остаточный сигнал и масштабированный моносигнал суммируются в устройстве 235 суммирования, создавая модифицированный центральный сигнал 142, компенсируемый с учетом ошибок кодирования.
Побочный сигнал xside, т.е. разность между левым L и правым R каналами, подается на устройство 30 кодирования побочных сигналов, как и в предыдущих вариантах осуществления. Однако здесь оптимизатор 37 также зависит от модифицированного центрального сигнала 142, обеспечиваемого устройством кодирования 130 центрального сигнала. Поэтому побочный остаточный сигнал создается как оптимальная линейная комбинация моносигнала 42, модифицированного центрального сигнала 142 и побочного сигнала в устройстве 35 вычитания.
Вышеописанная концепция кадров переменной длины может быть применена к любым из побочных и центральных сигналов, либо к обоим.
Фиг.6 иллюстрирует устройство декодирования, подходящее для приема кодированных аудиосигналов от устройства кодирования, показанного на фиг.5. Принятый сигнал 54 делится на параметры кодирования pmono, представляющие основной сигнал, параметры кодирования pcentre, представляющие центральный сигнал, и параметры кодирования pside, представляющие побочный сигнал. В декодере 64 параметры кодирования pmono, представляющие основной сигнал, используются для формирования основного сигнала x"mono. В декодере 160 параметры кодирования pmono, представляющие центральный сигнал, используются для формирования центрального сигнала x"centre на основе основного сигнала x"mono. В декодере 60 параметры кодирования pside, представляющие побочный сигнал, декодируются для получения побочного сигнала x"side на основе основного сигнала x"mono и центрального сигнала x"centre.
Эта процедура может быть математически выражена следующим образом:
Входные сигналы xleft, xrignt и xcentre объединяются в моноканал согласно
Figure 00000010
α, β и χ в оставшемся разделе установлены на 1.0 для простоты, но они могут устанавливаться на произвольные значения. Значения α, β и χ могут быть либо константами, либо зависимым от содержимого сигнала, чтобы выделить один или два канала, чтобы достичь оптимального качества.
Нормализованная взаимная корреляция между моно- и центральным сигналом вычисляется следующим образом:
Figure 00000011
где
Figure 00000012
где x centre - центральный сигнал, xmono - моносигнал. Моносигнал выводится из целевого моносигнала, но можно использовать также локальный синтез кодера моносигналов.
Центральный остаточный сигнал, который должен кодироваться, выражается следующим образом:
Figure 00000013
где Q g (..) - функция квантования, которая применяется к коэффициенту симметрирования. Коэффициент симметрирования передается по каналу передачи.
Если E c - функция кодирования (к примеру, кодер с преобразованием) центрального сигнала, E m - функция кодирования моносигнала, то декодированный сигнал x" centre в декодере может быть описан следующим образом:
Figure 00000014
Побочный остаточный сигнал, который должен кодироваться, выражается следующим образом:
Figure 00000015
где g Qsm и g Qsc - квантованные значения параметров g sm и g sc, которые минимизируют выражение:
Figure 00000016
.
ŋ может быть, например, равно 2 для минимизации ошибки по методу наименьших квадратов. Параметры g sm и g sc могут быть квантованы вместе или по отдельности.
Если E s - функция кодирования побочного остаточного сигнала, то декодированные канальные сигналы x" left и x" right задаются следующим образом:
Figure 00000017
Одним из наиболее раздражающих дефектов восприятия является эффект упреждающего эхо. На фиг.7a-b схемы иллюстрируют этот дефект. Пусть компонент сигнала изменяется во времени, как показано кривой 100. Вначале, с момента t0, компонент сигнала не присутствует в аудиовыборке. Во время t между t1 и t2 компонент сигнала внезапно появляется. Когда компонент сигнала кодируется с использованием длины кадра t2-t1, появление компонента сигнала "размазывается" по всему кадру, как показано на кривой 101. Если осуществляется декодирование кривой 101, компонент сигнала появляется на время Δt раньше планируемого появления компонента сигнала и ощущается "упреждающее эхо".
Дефекты упреждающего эхо становятся более акцентированными, если используются длинные кадры кодирования. Посредством использования более коротких кадров дефект в некоторой степени подавляется. Другой способ разрешать вышеописанные проблемы упреждающего эхо состоит в использовании того факта, что моносигнал имеется как в кодере, так и в декодере. Это дает возможность масштабировать побочный сигнал согласно контуру энергии моносигнала. В декодере выполняется инверсное масштабирование и, таким образом, некоторые из проблем упреждающего эхо могут быть смягчены.
Контур энергии моносигнала вычисляется по кадру следующим образом:
Figure 00000018
Figure 00000019
где w(n) - это функция окна. Наиболее простой функцией окна является прямоугольное окно, но могут быть более желательными и другие типы окон, например взвешивающая функция Хэмминга.
Побочный остаточный сигнал в таком случае масштабируется следующим образом:
Figure 00000020
,
Figure 00000021
В более общей форме вышеуказанное уравнение может быть записано следующим образом:
Figure 00000022
,
Figure 00000023
где f(..) - монотонная непрерывная функция. В декодере контур энергии вычисляется на декодированном моносигнале и применяется к декодированному побочному сигналу следующим образом:
Figure 00000024
,
Figure 00000025
Поскольку это масштабирование по контуру энергии в некотором смысле является альтернативой использованию более коротких кадров, данная концепция особенно хорошо подходит, для объединения с концепцией кадров переменной длины, дополнительно описанной выше. При наличии нескольких схем кодирования, которые применяют масштабирование по контуру энергии, из которых некоторые не применяют, а другие применяют масштабирование по контуру энергии только в течение определенных субкадров, может быть обеспечен более гибкий набор схем декодирования. На фиг.8 проиллюстрирован вариант осуществления устройства 30 кодирования сигналов согласно настоящему изобретению. Здесь различные схемы кодирования 81 содержат заштрихованные субкадры 91, представляющие кодирование, применяющее масштабирование по контуру энергии, и незаштрихованные субкадры 92, представляющие процедуры кодирования, не применяющие масштабирование по контуру энергии. Таким образом имеются комбинации не только субкадров различной длины, но также субкадров с различными принципами кодирования. В представленном поясняющем примере применение масштабирования по контуру энергии отличается в различных схемах кодирования. В более общем случае принципы кодирования могут быть объединены с концепцией переменой длины аналогичным способом.
Набор схем кодирования, показанный на фиг.8, содержит схемы, которые обрабатывают, например, дефекты упреждающего эхо различными способами. В некоторых случаях используются более длинные субкадры с минимизацией упреждающего эхо согласно принципу контура энергии. В других схемах используются более короткие субкадры без масштабирования по контуру энергии. В зависимости от содержимого сигнала одна из альтернатив может быть более выгодной. Для случаев существенного упреждающего эхо схемы кодирования, использующие короткие субкадры с масштабированием по контуру энергии, могут быть обязательными.
Предложенное решение может быть использовано в полном частотном диапазоне или в одном или более различных поддиапазонов. Использование поддиапазона может быть применено либо к обоим, основному и побочному, сигналам, либо к одному из них отдельно. Предпочтительный вариант осуществления содержит разделение побочного сигнала на несколько частотных диапазонов. Причина просто заключается в том, что легче удалить избыточность в изолированном частотном диапазоне, чем во всем частотном диапазоне. Это особенно важно при кодировании музыкальных сигналов с обогащенным спектральным содержимым.
Возможный вариант использования заключается в кодировании частотного диапазона ниже заранее определенного порога с помощью вышеописанного способа. Заранее определенным порогом предпочтительно может быть 2 КГц или даже более предпочтительно, 1 КГц. Для оставшейся части полезного частотного диапазона можно либо кодировать еще один дополнительный частотный диапазон с помощью вышеописанного способа, либо использовать совершенно другой способ.
Мотивация использования вышеописанного способа предпочтительно для низких частот состоит в том, что диффузные акустические поля обычно имеют небольшой запас энергии на высоких частотах. Естественная причина заключается в том, что звукопоглощение в типовом случае повышается с частотой. Кроме того, компоненты диффузных акустических полей, как считается, играют менее важную роль для слуховой системы человека на более высоких частотах. Поэтому полезно использовать это решение на низких частотах (ниже 1 или 2 КГц) и основываться на других, даже более эффективных в смысле битов, схемах кодирования на более высоких частотах. Тот факт, что схема применяется только на низких частотах, дает значительную экономию по скорости передачи в битах, поскольку необходимая скорость передачи в битах в предложенном способе пропорциональна требуемой пропускной способности. В большинстве случае кодер моносигналов может кодировать весь частотный диапазон, тогда как предложенное кодирование побочных сигналов, как предполагается, будет выполняться только в более низкой части частотного диапазона, как схематично проиллюстрировано на фиг.9. Ссылочной позицией 301 обозначена схема кодирования побочного сигнала согласно настоящему изобретению, ссылочной позицией 302 - любая другая схема кодирования побочного сигнала, ссылочной позицией 303 - схема кодирования побочного сигнала.
Также есть возможность использовать предложенный способ для нескольких различных частотных диапазонов.
На фиг.10 основные этапы варианта осуществления способа кодирования согласно настоящему изобретению проиллюстрированы в виде блок-схемы последовательности операций. Процедура начинается на этапе 200. На этапе 210 кодируется основной сигнал, выведенный из полифонических сигналов. На этапе 212 обеспечиваются схемы кодирования, которые содержат субкадры с различной длиной и/или порядком. Побочный сигнал, выведенный на этапе 214 из полифонических сигналов, кодируется посредством схемы кодирования, выбранной в зависимости, по меньшей мере, частично, от фактического содержимого текущих полифонических сигналов. Процедура завершается на этапе 299.
На фиг.11 основные этапы варианта осуществления способа декодирования согласно настоящему изобретению проиллюстрированы в виде блок-схемы последовательности операций. Процедура начинается на этапе 200. На этапе 220 декодируется принятый закодированный основной сигнал. На этапе 222 обеспечиваются схемы кодирования, которые содержат субкадры с различной длиной и/или порядком. Принятый побочный сигнал декодируется на этапе 224 посредством выбранной схемы кодирования. На этапе 226 декодированный основной и побочные сигналы объединяются в полифонический сигнал. Процедура завершается на этапе 299.
Вышеописанные варианты осуществления следует рассматривать как иллюстративные примеры настоящего изобретения. Специалистам в данной области техники должно быть очевидно, что различные модификации, комбинации и изменения могут быть выполнены в вариантах осуществления без отступления от объема применения настоящего изобретения. В частности, решения, касающиеся различных частей в разных вариантах осуществления, могут быть объединены в других конфигурациях, если технически осуществимо. Объем настоящего изобретения, определяется формулой изобретения.
Источники информации
ЕР 0497413.
Патент США 5285498.
Патент США5434948.
C.Faller et al., "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, май 2002 года, Мюнхен, Германия.

Claims (17)

1. Способ кодирования полифонических сигналов, содержащий этапы, на которых:
генерируют первый выходной сигнал, представляющий параметры кодирования, характеризующие основной сигнал на основе сигналов, по меньшей мере, первого и второго каналов; и
генерируют второй выходной сигнал, представляющий параметры кодирования, характеризующие побочный сигнал на основе сигналов, по меньшей мере, первого и второго каналов в кадре кодирования,
отличающийся тем, что этап генерирования второго выходного сигнала дополнительно содержит этап, на котором:
масштабируют побочный сигнал по контуру энергии основного сигнала.
2. Способ по п.1, отличающийся тем, что побочный сигнал масштабируют коэффициентом, являющимся монотонной непрерывной функцией контура энергии основного сигнала.
3. Способ по п.1, отличающийся тем, что этап генерирования второго выходного сигнала содержит этап создания побочного остаточного сигнала на основе симметрированной разности между побочным сигналом и основным сигналом, при этом побочный сигнал масштабирован по контуру энергии основного сигнала.
4. Способ по п.3, отличающийся тем, что побочный остаточный сигнал делится на коэффициент, являющийся монотонной непрерывной функцией контура энергии основного сигнала.
5. Способ декодирования полифонических сигналов, содержащий этапы, на которых:
генерируют декодированный основной сигнал из параметров кодирования, представляющих основной сигнал;
генерируют декодированный побочный сигнал из параметров кодирования, представляющих побочный сигнал; и
объединяют, по меньшей мере, декодированный основной сигнал и декодированный побочный сигнал в сигналы, по меньшей мере, первого и второго каналов,
отличающийся тем, что этап генерирования декодированного побочного сигнала дополнительно содержит этап, на котором
масштабируют декодированный побочный сигнал по контуру энергии декодированного основного сигнала.
6. Способ по п.5, отличающийся тем, что декодированный побочный сигнал масштабируют коэффициентом, являющимся монотонной непрерывной функцией контура энергии декодированного основного сигнала.
7. Способ по п.5, отличающийся тем, что этап генерирования декодированного побочного сигнала содержит этап генерирования декодированного побочного остаточного сигнала и генерирования декодированного побочного сигнала на основе декодированного побочного остаточного сигнала, при этом декодированный побочный остаточный сигнал масштабирован по контуру энергии декодированного основного сигнала.
8. Способ по п.7, отличающийся тем, что декодированный остаточный сигнал умножается на коэффициент, являющийся монотонной непрерывной функцией контура энергии основного сигнала.
9. Устройство для кодирования полифонических сигналов, содержащее:
средство ввода для полифонических сигналов, содержащих, по меньшей мере, первый и второй каналы,
средство для генерации первого выходного сигнала, представляющего параметры кодирования, характеризующие основной сигнал на основе сигналов, по меньшей мере, первого и второго каналов;
средство для генерации второго выходного сигнала, представляющего параметры кодирования, характеризующие побочный сигнал на основе сигналов, по меньшей мере, первого и второго каналов в кадре кодирования, и
средство вывода,
отличающееся тем, что средство для генерации второго выходного сигнала дополнительно содержит средство для масштабирования побочного сигнала по контуру энергии основного сигнала.
10. Устройство по п.9, отличающееся тем, что средство для масштабирования побочного сигнала выполнено с возможностью масштабирования побочного сигнала коэффициентом, являющимся монотонной непрерывной функцией контура энергии основного сигнала.
11. Устройство по п.9, отличающееся тем, что средство для генерации второго выходного сигнала дополнительно содержит средство для создания побочного остаточного сигнала на основе симметрированной разности между побочным сигналом и основным сигналом, при этом средство для масштабирования побочного сигнала обеспечивает масштабирование остаточного побочного сигнала по контуру энергии основного сигнала.
12. Устройство по п.11, отличающееся тем, что средство для масштабирования побочного сигнала выполнено с возможностью деления побочного остаточного сигнала на коэффициент, являющийся монотонной непрерывной функцией контура энергии основного сигнала.
13. Устройство для декодирования полифонических сигналов, содержащее:
средство ввода для параметров кодирования, представляющих основной сигнал, и параметров кодирования, представляющих побочный сигнал;
средство для генерации декодированного основного сигнала из параметров кодирования, представляющих основной сигнал;
средство для генерации декодированного побочного сигнала из параметров кодирования, представляющих побочный сигнал в кадре кодирования;
средство для объединения, по меньшей мере, декодированного основного сигнала и декодированного побочного сигнала в сигналы, по меньшей мере, первого и второго каналов, и
средство вывода,
отличающееся тем, что средство для генерации декодированного побочного сигнала дополнительно содержит средство для масштабирования декодированного побочного сигнала по контуру энергии декодированного основного сигнала.
14. Устройство по п.13, отличающееся тем, что средство для масштабирования декодированного побочного сигнала выполнено с возможностью масштабирования декодированного побочного сигнала коэффициентом, являющимся монотонной непрерывной функцией контура энергии основного сигнала.
15. Устройство по п.13, отличающееся тем, что средство для генерации декодированного побочного сигнала дополнительно содержит средство для генерации декодированного побочного остаточного сигнала и для генерации декодированного побочного сигнала на основе декодированного побочного остаточного сигнала, при этом средство для масштабирования декодированного побочного сигнала обеспечивает масштабирование декодированного побочного остаточного сигнала коэффициентом, являющимся монотонной непрерывной функцией контура энергии декодированного основного сигнала.
16. Устройство декодирования по п.15, отличающееся тем, что средство для масштабирования декодированного побочного сигнала выполнено с возможностью умножения декодированного побочного остаточного сигнала на коэффициент, являющийся монотонной непрерывной функцией контура энергии декодированного основного сигнала.
17. Аудиосистема, содержащая, по меньшей мере, одно из:
устройства для кодирования полифонических сигналов по любому из пп.9-12 и
устройства для декодирования полифонических сигналов по любому из пп.13-16.
RU2007121143/09A 2003-12-19 2007-06-05 Оптимизированное по точности кодирование с подавлением упреждающего эхо RU2425340C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
SE0303501A SE0303501D0 (sv) 2003-12-19 2003-12-19 Filter-based parametric multi-channel coding
SE0303501-1 2003-12-19
SE0400417-2 2004-02-20
SE0400417A SE527670C2 (sv) 2003-12-19 2004-02-20 Naturtrogenhetsoptimerad kodning med variabel ramlängd

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2005134365/09A Division RU2305870C2 (ru) 2003-12-19 2004-12-15 Оптимизированное по точности кодирование с переменной длиной кадра

Publications (2)

Publication Number Publication Date
RU2007121143A RU2007121143A (ru) 2008-12-10
RU2425340C2 true RU2425340C2 (ru) 2011-07-27

Family

ID=31996354

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2005134365/09A RU2305870C2 (ru) 2003-12-19 2004-12-15 Оптимизированное по точности кодирование с переменной длиной кадра
RU2007121143/09A RU2425340C2 (ru) 2003-12-19 2007-06-05 Оптимизированное по точности кодирование с подавлением упреждающего эхо

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2005134365/09A RU2305870C2 (ru) 2003-12-19 2004-12-15 Оптимизированное по точности кодирование с переменной длиной кадра

Country Status (15)

Country Link
EP (2) EP1845519B1 (ru)
JP (2) JP4335917B2 (ru)
CN (2) CN100559465C (ru)
AT (2) ATE443317T1 (ru)
AU (1) AU2004298708B2 (ru)
BR (2) BRPI0410856B8 (ru)
CA (2) CA2690885C (ru)
DE (2) DE602004008613T2 (ru)
HK (2) HK1091585A1 (ru)
MX (1) MXPA05012230A (ru)
PL (1) PL1623411T3 (ru)
RU (2) RU2305870C2 (ru)
SE (1) SE527670C2 (ru)
WO (1) WO2005059899A1 (ru)
ZA (1) ZA200508980B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2737465C1 (ru) * 2012-11-15 2020-11-30 Нтт Докомо, Инк. Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
WO2006126858A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007004830A1 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8121836B2 (en) 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP5111375B2 (ja) 2005-08-30 2013-01-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
JP4859925B2 (ja) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
WO2007040349A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
KR100857113B1 (ko) 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US8204740B2 (en) 2006-02-06 2012-06-19 Telefonaktiebolaget Lm Ericsson (Publ) Variable frame offset coding
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
JPWO2010016270A1 (ja) * 2008-08-08 2012-01-19 パナソニック株式会社 量子化装置、符号化装置、量子化方法及び符号化方法
US8676365B2 (en) * 2008-09-17 2014-03-18 Orange Pre-echo attenuation in a digital audio signal
JP5309944B2 (ja) 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
JP5793675B2 (ja) 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 符号化装置および復号装置
JP5295380B2 (ja) * 2009-10-20 2013-09-18 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
WO2011076285A1 (en) * 2009-12-23 2011-06-30 Nokia Corporation Sparse audio
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
EP2544466A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US10060955B2 (en) * 2014-06-25 2018-08-28 Advanced Micro Devices, Inc. Calibrating power supply voltages using reference measurements from code loop executions
ES2904275T3 (es) 2015-09-25 2022-04-04 Voiceage Corp Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
CN109215668B (zh) 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN115831130A (zh) 2018-06-29 2023-03-21 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
CN112233682B (zh) * 2019-06-29 2024-07-16 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
DE60209888T2 (de) * 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. Kodieren eines audiosignals
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
CN1219415C (zh) * 2002-07-23 2005-09-14 华南理工大学 一种5.1通路环绕声的耳机重发的信号处理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2737465C1 (ru) * 2012-11-15 2020-11-30 Нтт Докомо, Инк. Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио

Also Published As

Publication number Publication date
CA2527971C (en) 2011-03-15
RU2005134365A (ru) 2006-05-27
HK1115665A1 (en) 2008-12-05
EP1845519A2 (en) 2007-10-17
RU2007121143A (ru) 2008-12-10
EP1623411B1 (en) 2007-08-29
SE0400417L (sv) 2005-06-20
AU2004298708B2 (en) 2008-01-03
PL1623411T3 (pl) 2008-01-31
JP4589366B2 (ja) 2010-12-01
DE602004008613D1 (de) 2007-10-11
ATE371924T1 (de) 2007-09-15
SE527670C2 (sv) 2006-05-09
CN101118747B (zh) 2011-02-23
JP2008026914A (ja) 2008-02-07
BRPI0419281B1 (pt) 2018-08-14
ATE443317T1 (de) 2009-10-15
SE0400417D0 (sv) 2004-02-20
CN100559465C (zh) 2009-11-11
ZA200508980B (en) 2007-03-28
BRPI0410856A (pt) 2006-07-04
CN101118747A (zh) 2008-02-06
DE602004023240D1 (de) 2009-10-29
RU2305870C2 (ru) 2007-09-10
HK1091585A1 (en) 2007-01-19
CA2527971A1 (en) 2005-06-30
JP2007529021A (ja) 2007-10-18
EP1845519B1 (en) 2009-09-16
DE602004008613T2 (de) 2008-06-12
EP1845519A3 (en) 2007-11-07
BRPI0410856B1 (pt) 2019-10-01
MXPA05012230A (es) 2006-02-10
AU2004298708A1 (en) 2005-06-30
CA2690885C (en) 2014-01-21
CA2690885A1 (en) 2005-06-30
WO2005059899A1 (en) 2005-06-30
EP1623411A1 (en) 2006-02-08
CN1816847A (zh) 2006-08-09
BRPI0410856B8 (pt) 2019-10-15
JP4335917B2 (ja) 2009-09-30

Similar Documents

Publication Publication Date Title
RU2425340C2 (ru) Оптимизированное по точности кодирование с подавлением упреждающего эхо
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP4809370B2 (ja) マルチチャネル音声符号化における適応ビット割り当て
JP5277508B2 (ja) マルチ・チャンネル音響信号をエンコードするための装置および方法
JP5455647B2 (ja) オーディオデコーダ
JP5179881B2 (ja) オーディオソースのパラメトリックジョイント符号化
KR101183857B1 (ko) 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
US9626973B2 (en) Adaptive bit allocation for multi-channel audio encoding
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
US8817992B2 (en) Multichannel audio coder and decoder
US7725324B2 (en) Constrained filter encoding of polyphonic signals
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding
JP4323520B2 (ja) ポリフォニック信号の制約付きフィルタ符号化