RU2388068C2 - Временное и пространственное генерирование многоканальных аудиосигналов - Google Patents

Временное и пространственное генерирование многоканальных аудиосигналов Download PDF

Info

Publication number
RU2388068C2
RU2388068C2 RU2008118333/09A RU2008118333A RU2388068C2 RU 2388068 C2 RU2388068 C2 RU 2388068C2 RU 2008118333/09 A RU2008118333/09 A RU 2008118333/09A RU 2008118333 A RU2008118333 A RU 2008118333A RU 2388068 C2 RU2388068 C2 RU 2388068C2
Authority
RU
Russia
Prior art keywords
resolution
channel
waveform
representation
signal
Prior art date
Application number
RU2008118333/09A
Other languages
English (en)
Other versions
RU2008118333A (ru
Inventor
Саша ДИШ (DE)
Саша ДИШ
Юрген ХЕРРЕ (DE)
Юрген ХЕРРЕ
Маттиас НОЙЗИНГЕР (DE)
Маттиас НОЙЗИНГЕР
Ерун БРЕБАРТ (NL)
Ерун БРЕБАРТ
Герард ХОТО (NL)
Герард ХОТО
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф., Конинклейке Филипс Электроникс Н.В. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2008118333A publication Critical patent/RU2008118333A/ru
Application granted granted Critical
Publication of RU2388068C2 publication Critical patent/RU2388068C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

Изобретение относится к кодированию многоканальных аудиосигналов. Выбранный канал многоканального сигнала, который представляется посредством кадров, скомпонованных из значений дискретизации, имеющих высокое временное разрешение, может быть кодирован с высоким качеством, когда получают параметрическое представление формы сигнала, представляющее форму сигнала в представлении с промежуточным разрешением выбранного канала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров. Параметрическое представление формы сигналов с промежуточным разрешением может быть использовано для того, чтобы генерировать восстановленный канал для получения канала, имеющего огибающую сигнала, близкую к огибающей выбранного исходного канала. Временная шкала, на которой выполняется генерирование, короче временной шкалы покадровой обработки, тем самым повышая качество восстановленного канала. С другой стороны, временная шкала генерирования больше, чем временная шкала значений дискретизации, что значительно снижает объем данных, требуемый параметрическим представлением формы сигнала. Технический результат - улучшение пространственного восприятия восстановленного многоканального сигнала. 16 н. и 21 з.п. ф-лы, 16 ил., 1 табл.

Description

Область техники, к которой относится изобретение
Изобретение относится к кодированию многоканальных аудиосигналов и, в частности, к принципу для того, чтобы улучшать пространственное восприятие восстановленного многоканального сигнала.
Описание предшествующего уровня техники
Последние разработки в аудиокодировании предоставили возможность воссоздавать многоканальное представление аудиосигнала на основе стерео- (или моно-) сигнала и соответствующих управляющих данных. Эти способы значительно отличаются от предыдущих основанных на матрицах решений, таких как Dolby Prologic, поскольку дополнительные управляющие данные передаются для того, чтобы управлять воссозданием, также упоминаемым как повышающее микширование, каналов объемного звучания на основе передаваемых моно- и стереоканалов.
Следовательно, параметрические многоканальные аудиодекодеры восстанавливают N каналов на основе M передаваемых каналов, где N>M, и на основе дополнительных управляющих данных. Дополнительные управляющие данные представляют значительно меньший расход данных, чем передача всех N каналов, делая кодирование очень эффективным и при этом обеспечивая совместимость как с M-канальными устройствами, так и с N-канальными устройствами. M каналов могут быть одноканальным моно, стерео или 5.1-канальным представлением. Следовательно, можно иметь, к примеру, 7.2-канальный исходный сигнал, обработанный с помощью понижающего микширования до 5.1-канального обратно совместимого сигнала, и пространственные аудиопараметры, позволяющие пространственному аудиодекодеру воспроизводить очень похожую версию исходных 7.2 каналов при небольших дополнительных затратах по расходу битов (битрейту).
Эти способы параметрического кодирования объемного звучания обычно содержат параметризацию сигнала объемного звучания на основе ILD (межканальной разности уровней) и ICC (межканальной когерентности). Данные параметры описывают, к примеру, соотношения мощности и корреляцию между парами каналов исходного многоканального сигнала. В процессе декодирования воссозданный многоканальный сигнал получается посредством распределения энергии принимаемых каналов понижающего микширования между всеми парами каналов, описанными посредством передаваемых параметров ILD. Тем не менее, поскольку многоканальный сигнал может иметь равное распределение мощности между всеми каналами, хотя сигналы в различных каналах очень различаются, тем самым предоставляя впечатление прослушивания очень широкого (рассеянного) звука, корректная ширина (рассеянность) получается посредством микширования сигналов с их декоррелированными версиями. Это микширование описывается посредством параметра ICC. Декоррелированная версия сигнала получается посредством прохождения сигнала через всечастотный фильтр, такой как ревербератор.
Это означает, что декоррелированная версия сигнала создается на стороне декодера и не передается, как каналы понижающего микширования, от кодера к декодеру. Выходные сигналы из всечастотных фильтров (декорреляторов) имеют временную характеристику, которая обычно очень плоская. Следовательно, дираковский входной сигнал дает затухающий шумовой выброс. Следовательно, при микшировании декоррелированного и исходного сигнала важно для некоторых типов сигналов, таких как плотные переходы (сигналы аплодисментов), генерировать временную огибающую декоррелированного сигнала так, чтобы лучше соответствовать огибающей канала понижающего микширования, который зачастую также называется сухим сигналом. Невыполнение этого приводит к восприятию большего размера пространства и ненатурально звучащим переходным сигналам. При задании переходных сигналов и ревербератора как всечастотного фильтра даже артефакты типа эхо могут быть введены, когда генерирование декоррелированных (мокрых) сигналов опускается.
С технической точки зрения одна из ключевых сложностей при восстановлении многоканальных сигналов, как, например, в рамках синтеза MPEG-звука, состоит в надлежащем воспроизведении многоканальных сигналов с очень широкой звуковой картиной. Технически говоря, это соответствует генерированию нескольких сигналов с низкой межканальной корреляцией (или когерентностью), но при плотном управлении спектральными и временными огибающими. Примерами таких сигналов являются элементы "аплодисментов", которые предоставляют как высокую степень декорреляции, так и резкие переходные события (хлопки). Как следствие, эти элементы являются наиболее критичными для технологии объемного звучания MPEG, которая, к примеру, подробнее описана в "Report on MPEG Spatial Audio Coding RMO Listening Tests", ISO/IEC JTC1/SC29/WG11 (MPEG), документ N7138, Bu-san, Korea, 2005". Как правило, предыдущие работы фокусировались на ряде аспектов, связанных с оптимальным воспроизведением широких/рассеянных сигналов, таких как аплодисменты, посредством предоставления решений, которые:
1. Приспосабливают временную (и спектральную) форму декоррелированного сигнала к форме передаваемого сигнала понижающего микширования, чтобы предотвратить помехи опережающего эхо (примечание: это не требует отправки никакой побочной информации от пространственного аудиокодера в пространственный аудиодекодер).
2. Приспосабливают временные огибающие синтезированных выходных каналов к исходным формам огибающих (присутствующим на входе соответствующего кодера) с помощью побочной информации, которая описывает временные огибающие исходных входных сигналов и которая передается от пространственного аудиокодера в пространственный аудиодекодер.
В настоящее время эталонная модель объемного звучания MPEG уже содержит несколько средств, поддерживающих кодирование таких сигналов, к примеру:
- временное генерирование во временной области (TP);
- генерирование временной огибающей (TES).
В системе синтеза объемного звучания MPEG декоррелированный звук генерируется и сводится с "сухим" сигналом, чтобы контролировать корреляцию синтезированных выходных каналов согласно передаваемым значениям ICC. Далее декоррелированный сигнал упоминается как "рассеянный" сигнал, хотя термин "рассеянный" отражает свойства восстановленного пространственного звукового поля, а не свойства самого сигнала. Для переходных сигналов рассеянный звук, генерируемый в декодере, не соответствует автоматически точной временной форме сухих сигналов и комбинируется перцепционно оптимальным образом с сухим сигналом. Это приводит к плохому воспроизведению переходов по аналогии с проблемой опережающего эхо, которая известна из перцепционного аудиокодирования. Средство TP, реализующее временное генерирование во временной области, разработано так, чтобы разрешать проблему посредством обработки рассеянного звука.
Средство TP применяется во временной области, как проиллюстрировано на фиг. 14. Оно фактически состоит из оценки временной огибающей сухих и рассеянных сигналов с более высоким временным разрешением, чем разрешение, предоставляемое посредством группы фильтров кодера объемного звучания MPEG. Рассеянный сигнал перемасштабируется по своей временной огибающей, чтобы соответствовать огибающей "сухого" сигнала. Это приводит к значительному повышению качества звука для критичных переходных сигналов с широкой пространственной картиной/низкой корреляцией между сигналами каналов, таких как аплодисменты.
Генерирование огибающей (корректировка временного изменения энергии, содержащейся в канале) выполняется посредством согласования нормализованной кратковременной энергии "сырого" сигнала с энергией "сухого" сигнала. Это достигается посредством изменяющейся во времени функции усиления, которая применяется к рассеянному сигналу, так что временная огибающая рассеянного сигнала генерируется так, чтобы соответствовать огибающей "сухого" сигнала.
Отметим, что это не требует того, чтобы какая-либо побочная информация была передана от кодера в декодер, чтобы обрабатывать временную огибающую сигнала (только управляющая информация для выборочного включения/отключения TP передается посредством кодера объемного звучания).
Фиг. 14 иллюстрирует временное генерирование во временной области, применяемое к кодированию объемного звучания MPEG. Прямой сигнал 10 и рассеянный сигнал 12, которые должны быть сгенерированы, являются сигналами, которые должны быть обработаны, оба предоставляемые в области группы фильтров. В объемном звучании MPEG, в необязательном порядке, может быть доступен остаточный сигнал 14, который прибавляется к прямому сигналу 10 по-прежнему в рамках области группы фильтров. В специальном случае декодера объемного звучания MPEG генерируются только высокочастотные части рассеянного сигнала 12, тем самым низкочастотные части 16 сигнала добавляются к прямому сигналу 10 в области группы фильтров.
Прямой сигнал 10 и рассеянный сигнал 12 по отдельности преобразуются во временную область посредством устройств 18a и 18b синтеза группы фильтров. Фактическое временное генерирование во временной области выполняется после группы фильтров синтеза. Поскольку должны быть сгенерированы только высокочастотные части рассеянного сигнала 12, представления во временной области прямого сигнала 10 и рассеянного сигнала 12 вводятся в фильтры 20a и 20b верхних частот, которые гарантируют то, что только высокочастотные части используются в последующих этапах фильтрации. Последующее спектральное отбеливание сигналов может выполняться в спектральных отбеливателях (средствах отбеливания) 22a и 22b, чтобы обеспечить то, что соотношения амплитуды (энергии) полного спектрального диапазона сигналов учитываются в последующей оценке 24 огибающих, которая сравнивает соотношение энергий, которые содержатся в прямом сигнале и рассеянном сигнале, в заданном временном отрезке. Этот временной отрезок обычно задается посредством длины кадра. Оценка 24 огибающей имеет в качестве выходных данных коэффициент 26 масштабирования, который применяется к рассеянному сигналу 12 при генерировании 28 огибающей во временной области, чтобы гарантировать то, что огибающая сигнала фактически одинаковая для рассеянного сигнала 12 и прямого сигнала 10 в каждом кадре.
В завершение, рассеянный сигнал со сгенерированной огибающей повторно подвергается фильтрации верхних частот посредством фильтра 29 верхних частот, чтобы гарантировать то, что артефакты в полосах низких частот не содержатся для рассеянного сигнала со сгенерированной огибающей. Комбинирование прямого сигнала и рассеянного сигнала выполняется посредством сумматора 30. Выходной сигнал 32 в таком случае содержит части прямого сигнала 10 и рассеянного сигнала 12, при этом для рассеянного сигнала огибающая сгенерирована так, чтобы обеспечить то, что огибающая сигнала фактически одинаковая для рассеянного сигнала 12 и прямого сигнала 10, до комбинирования.
Проблема точного контроля временной формы рассеянного звука может быть разрешена посредством так называемого средства генерирования временной огибающей (TES), которое разработано так, чтобы быть несложной альтернативой средству временной обработки (TP). Хотя TP работает во временной области посредством масштабирования во временной области огибающей рассеянного звука, подход TES достигает такого же главного эффекта посредством управления огибающей временного звука в представлении спектральной области. Это выполняется аналогично подходу временного генерирования шума (TNS), известному из стандарта MPEG-2/4 Перспективное звуковое кодирование (AAC). Обработка точной временной огибающей рассеянного звука достигается посредством свертывания его спектральных коэффициентов по частоте с помощью надлежащего фильтра генерирования, полученного из LPC-анализа спектральных коэффициентов сухого сигнала. Вследствие достаточно высокого временного разрешения группы фильтров объемного звучания MPEG обработка TES требует только фильтрации нижнего порядка (комплексного прогнозирования первого порядка) и таким образом имеет небольшую вычислительную сложность. С другой стороны, вследствие ограничений, к примеру, связанных с временным наложением, он не может предоставить в полной степени временной контроль, который предлагает средство TP.
Отметим, что аналогично случаю TP, TES не требует передачу какой-либо побочной информации от кодера к декодеру, чтобы описать временную огибающую сигнала.
Оба средства, TP и TES, успешно разрешают проблему временного генерирования рассеянного звука посредством приспособления его временной формы к форме передаваемого сигнала понижающего микширования. Хотя это предотвращает опережающее эхо обнаружения, это не может компенсировать второй тип недостатка многоканального выходного сигнала, который обусловлен отсутствием пространственного перераспределения.
Сигнал аплодисментов состоит из плотной смеси переходных событий (хлопков), некоторые из которых типично попадают в один параметрический кадр. Очевидно, не все хлопки в кадре возникают из одного (или аналогичного) пространственного направления. Тем не менее, для декодера объемного звучания MPEG временная модульность декодера в значительной степени определяется размером кадра и временной модульностью параметрического такта. Таким образом, после синтеза все хлопки, которые попадают в кадр, показываются с одной пространственной ориентацией (распределением уровней между выходными каналами), в отличие от исходного сигнала, для которого каждый хлопок может быть локализован (и фактически воспринят) отдельно.
Чтобы также достичь хороших результатов в отношении пространственного перераспределения наиболее критических сигналов, таких как сигналы аплодисментов, временные огибающие подвергнутого повышающему микшированию сигнала должны быть сгенерированы с очень высоким временным разрешением.
Сущность изобретения
Цель настоящего изобретения заключается в том, чтобы реализовать концепцию кодирования многоканальных аудиосигналов, которая обеспечивает эффективное кодирование, предоставляющее улучшенное сохранение пространственного распределения многоканальных сигналов.
В соответствии с первым аспектом настоящего изобретения, эта цель достигается посредством декодера для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащего: блок повышающего микширования для генерирования множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения; и генерирователь для генерирования выбранного подвергнутого повышающему микшированию канала с помощью промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
В соответствии со вторым аспектом настоящего изобретения, эта цель достигается посредством кодера для генерирования параметрического представления формы сигнала канала многоканального сигнала, представляемого посредством кадров, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем кодер содержит: блок понижения временного разрешения для получения представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации; и блок вычисления параметров формы сигнала для вычисления параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом блок вычисления параметров формы сигнала выполнен с возможностью генерировать последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
В соответствии с третьим аспектом настоящего изобретения, эта цель достигается посредством способа генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, причем способ содержит: генерирование множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения; и генерирование выбранного подвергнутого повышающему микшированию канала с помощью промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
В соответствии с четвертым аспектом настоящего изобретения, эта цель достигается посредством способа генерирования параметрического представления формы сигнала канала многоканального сигнала, представляемого посредством кадров, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем способ содержит: получение представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации; и вычисление параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом при вычислении параметров формы сигнала генерируют последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
В соответствии с пятым аспектом настоящего изобретения, эта цель достигается посредством представления многоканального аудиосигнала на основе базового сигнала, полученного из многоканального аудиосигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров.
В соответствии с шестым аспектом настоящего изобретения, эта цель достигается посредством машиночитаемого носителя информации, имеющего сохраненным представление многоканального аудиосигнала на основе базового сигнала, полученного из многоканального аудиосигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного канала многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров.
В соответствии с седьмым аспектом настоящего изобретения, эта цель достигается посредством приемного устройства или аудиопроигрывателя, имеющего декодер для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащего: блок повышающего микширования для генерирования множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения; и генерирователь для генерирования выбранного подвергнутого повышающему микшированию канала с помощью промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
В соответствии с восьмым аспектом настоящего изобретения, эта цель достигается посредством передающего устройства или аудиорекордера, имеющего кодер для генерирования параметрического представления формы сигнала канала многоканального сигнала, представляемого посредством кадров, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем кодер содержит: блок понижения временного разрешения для получения представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации; и блок вычисления параметров формы сигнала для вычисления параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом блок вычисления параметров формы сигнала выполнен с возможностью генерировать последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
В соответствии с девятым аспектом настоящего изобретения, эта цель достигается посредством способа приема или воспроизведения аудио, причем способ имеет способ генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, при этом способ содержит: генерирование множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения; и генерирование выбранного подвергнутого повышающему микшированию канала с помощью промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
В соответствии с десятым аспектом настоящего изобретения, эта цель достигается посредством способа передачи или аудиозаписи, причем способ имеет способ генерирования параметрического представления формы сигнала канала многоканального сигнала, представляемого посредством кадров, при этом кадр содержит значения дискретизации, имеющие период дискретизации, при этом способ содержит: получение представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации; и вычисление параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом при вычислении параметров формы сигнала генерируют последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
В соответствии с одиннадцатым аспектом настоящего изобретения, эта цель достигается посредством системы передачи, имеющей передающее устройство и приемное устройство, при этом передающее устройство имеет кодер для генерирования параметрического представления формы сигнала канала многоканального сигнала, представляемого посредством кадров, при этом кадр содержит значения дискретизации, имеющие период дискретизации; и приемное устройство имеет декодер для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров.
В соответствии с двенадцатым аспектом настоящего изобретения, эта цель достигается посредством способа передачи и приема, при этом способ передачи имеет способ генерирования параметрического представления формы сигнала канала многоканального сигнала, представляемого посредством кадров, при этом кадр содержит значения дискретизации, имеющие период дискретизации; и способ приема имеет способ генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал организован в виде кадров, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров.
В соответствии с тринадцатым аспектом настоящего изобретения, эта цель достигается посредством компьютерной программы, имеющей программный код для осуществления любого из вышеуказанных способов, при исполнении на компьютере.
Настоящее изобретение основано на установлении того, что выбранный канал многоканального сигнала, который представляется посредством кадров, скомпонованных из значений дискретизации, имеющих высокое временное разрешение, может быть кодирован с высоким качеством, когда получают параметрическое представление формы сигнала, представляющее форму сигнала в представлении с промежуточным разрешением выбранного канала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров. Параметрическое представление формы сигналов с промежуточным разрешением может быть использовано для того, чтобы генерировать восстановленный канал, чтобы получать канал, имеющий огибающую сигнала, близкую к огибающей выбранного исходного канала. Временная шкала, на которой выполняется генерирование, точнее временной шкалы обработки касательно кадров, тем самым повышается качество восстановленного канала. С другой стороны, временная шкала генерирования более грубая, чем временная шкала значений дискретизации, чем значительно снижается объем данных, требуемый параметрическим представлением формы сигнала.
Параметрическое представление формы сигнала, подходящее для генерирования огибающей, в предпочтительном варианте осуществления содержит показатель интенсивности сигнала в качестве параметра, который указывает интенсивность сигнала в периоде дискретизации. Поскольку интенсивность сигнала в значительной степени связана с воспринимаемой громкостью сигнала, использование параметров интенсивности сигнала, следовательно, является подходящим вариантом для реализации генерирования огибающей. Два естественных параметра интенсивности сигнала - это, например, амплитуда или квадрат амплитуды, т.е. энергия сигнала.
Настоящее изобретение направлено на предоставление механизма для того, чтобы восстанавливать пространственное распределение сигналов с высокой степенью разрешения по времени и таким образом восстанавливать полное ощущение "пространственного распространения", поскольку это важно, к примеру, для сигналов аплодисментов. Важное дополнительное условие заключается в том, что улучшенные рабочие характеристики воспроизведения достигаются без недопустимо высокого увеличения объема передаваемой управляющей информации (побочной информации объемного звучания).
Настоящее изобретение, описанное в последующих разделах, относится в первую очередь к многоканальному восстановлению аудиосигналов на основе доступного сигнала понижающего микширования и дополнительных управляющих данных. На стороне кодера извлекаются пространственные параметры, представляющие многоканальные характеристики в отношении (заданного) понижающего микширования исходных каналов. Сигнал понижающего микширования и пространственное представление используются в декодере для того, чтобы воссоздавать очень похожее представление исходного многоканального сигнала посредством распределения комбинации сигнала понижающего микширования и его декоррелированной версии к восстанавливаемым каналам.
Изобретение применимо в системах, где желателен обратно совместимый сигнал понижающего микширования, таких как цифровая стереорадиопередача (DAB, спутниковое радио XM и т.д.), но также в системах, которые требуют очень компактного представления многоканального сигнала. В последующих разделах настоящее изобретение описывается в применении в рамках аудиостандарта объемного звучания MPEG. Само собой разумеется, что он также применим в рамках других систем многоканального аудиокодирования, как, к примеру, вышеупомянутые системы.
Настоящее изобретение основано на следующих соображениях:
- для оптимального воспринимаемого аудиокачества стадия синтеза объемного звучания MPEG должна не только предоставлять средство декорреляции, но также иметь возможность повторно синтезировать пространственное распределение сигнала при точной степени разрешения по времени.
- Это требует передачи побочной информации объемного звучания, представляющей пространственное распределение (огибающие канала) многоканального сигнала.
- Чтобы минимизировать требуемый битрейт для передачи отдельных временных огибающих канала, эта информация кодируется нормализованным и зависимым способом относительно огибающей сигнала понижающего микширования. Дополнительный этап энтропийного кодирования следует далее, чтобы дополнительно снизить битрейт, требуемый для передачи огибающей.
- В соответствии с этой информацией декодер объемного звучания MPEG генерирует прямой и рассеянный звук (либо комбинированный прямой/рассеянный звук), с тем, чтобы он соответствовал временной целевой огибающей. Это предоставляет независимое управление отдельными огибающими канала и воссоздает восприятие пространственного распределения с точной степенью разрешения по времени, которое очень похоже на оригинал (вместо основанной на кадрах пространственной обработки с низким разрешением посредством только методик декорреляции).
Принцип направляемого генерирования огибающих может быть применен и в спектральной, и во временной области, при этом реализация в спектральной области предоставляет меньшую вычислительную сложность.
В одном варианте осуществления настоящего изобретения выбранный канал многоканального сигнала представляется посредством параметрического представления, описывающего огибающую канала, при этом канал представляется посредством кадров значений дискретизации, имеющих высокую частоту дискретизации, т.е. высокое временное разрешение. Огибающая задается как эволюция во времени энергии, содержащейся в канале, при этом огибающая типично вычисляется для интервала времени, соответствующего длине кадра. В настоящем изобретении временной отрезок, в течение которого один параметр описывает огибающую, уменьшается относительно временной шкалы, заданной посредством кадра, т.е. временной отрезок - это промежуточный временной интервал, больший интервала дискретизации и короче длины кадра. Чтобы достичь этого, вычисляется представление с промежуточным разрешением, которое описывает кадр с меньшим временным разрешением в сравнении с разрешением, предоставляемым посредством параметров дискретизации. Огибающая выбранного канала оценивается с временным разрешением представления с низким разрешением, которое, с одной стороны, повышает временное разрешение представления с низким разрешением и, с другой стороны, уменьшает объем данных и вычислительную сложность, которая требуется в сравнении с генерированием во временной области.
В предпочтительном варианте осуществления настоящего изобретения представление с промежуточным разрешением выбранного канала предоставляется посредством группы фильтров, которая производит представление выбранного канала группой фильтров с пониженной частотой дискретизации. В представлении группы фильтров каждый канал разделяется на ряд конечных полос частот, причем каждая полоса частот представляется посредством ряда значений дискретизации, которые описывают временную эволюцию сигнала в рамках выбранной полосы частот с временным разрешением, которое меньше временного разрешения значений дискретизации.
Применение настоящего изобретения в области гребенок фильтров имеет ряд значительных преимуществ. Реализация оптимально подходит для существующих схем кодирования, т.е. настоящее изобретение может быть реализовано полностью обратно совместимо с существующими схемами аудиокодирования, такими как аудиокодирование объемного звучания MPEG. Более того, требуемое уменьшение временного разрешения предоставляется автоматически посредством свойств понижающей дискретизации группы фильтров, и отбеливание спектра может быть реализовано с гораздо меньшей вычислительной сложностью в области группы фильтров, чем во временной области. Дополнительное преимущество заключается в том, что отвечающая изобретению концепция может быть применена только к частям выбранного канала, которые требуют генерирования с точки зрения качества восприятия.
В дополнительном предпочтительном варианте осуществления изобретения получают параметрическое представление формы сигнала выбранного канала, описывающее соотношение между огибающей выбранного канала и огибающей сигнала понижающего микширования, полученного на стороне кодера. Получение представления формы сигнала на основе дифференциальной или относительной оценки огибающих имеет основное преимущество, заключающееся в дополнительном снижении битрейта, требуемого параметрическим представлением формы сигнала. В дополнительном предпочтительном варианте осуществления таким образом полученное параметрическое представление формы сигнала квантуется для того, чтобы дополнительно снизить битрейт, требуемый параметрическим представлением формы сигнала. Помимо этого, наиболее предпочтительно применять энтропийное кодирование к квантованным параметрам для большей экономии битрейта без дополнительной потери информации.
В дополнительном предпочтительном варианте осуществления настоящего изобретения параметры формы сигнала основаны на показателях энергии, описывающих энергию, содержащуюся в выбранном канале для заданного временного отрезка. Энергия предпочтительно вычисляется как возведенная в квадрат сумма параметров дискретизации, описывающих выбранный канал.
В дополнительном варианте осуществления настоящего изобретения изобретаемая концепция получения параметрического представления формы сигнала на основе представления с промежуточным разрешением выбранного аудиоканала многоканального аудиосигнала реализуется во временной области. Требуемое получение представления с промежуточным разрешением может быть достигнуто посредством вычисления (возведенного в квадрат) среднего от суммы энергий ряда последовательных значений дискретизации. Изменение числа последовательных значений дискретизации, которые усредняются, дает возможность удобной корректировки временного разрешения процесса генерирования огибающей. В модификации ранее описанного варианта осуществления только каждое n-ое значение дискретизации используется для получения параметрического представления формы сигнала, дополнительно снижая вычислительную сложность.
В дополнительном варианте осуществления настоящего изобретения получение параметров генерирования выполняется при сравнительно низкой вычислительной сложности в частотной области, при этом фактическое генерирование, т.е. применение параметров генерирования, выполняется во временной области.
В дополнительном варианте осуществления настоящего изобретения генерирование огибающей применяется только к тем частям выбранного канала, которые требуют генерирования огибающей с высоким временным разрешением.
Настоящее изобретение, описанное в предыдущих разделах, достигает следующих преимуществ:
- Улучшение пространственного качества звука для плотных переходных звуков, таких как сигналы аплодисментов, которые в настоящее время могут считаться самыми неблагоприятными сигналами.
- Только незначительное увеличение расхода побочной пространственной аудиоинформации (примерно 5 кбит/с для непрерывной передачи огибающих) благодаря очень компактному кодированию информации огибающих.
- Совокупный битрейт может быть дополнительно снижен посредством разрешения кодеру передавать огибающие, только когда это в плане восприятия необходимо. Предлагаемый синтаксис элемента потока битов огибающей учитывает это.
Отвечающая изобретению идея может быть описана как направляемое генерирование огибающей и вкратце может быть обобщена в нижеследующих разделах.
Направляемое генерирование огибающих восстанавливает широкополосную огибающую синтезированного выходного сигнала посредством выравнивания огибающей и восстановления первоначальной формы каждого выходного канала с помощью параметрической побочной информации широкополосной огибающей, содержащейся в потоке битов.
Для процесса восстановления исходной формы извлекают огибающие каналов понижающего микширования и выходных каналов. Чтобы получить эти огибающие, вычисляется энергия каждой параметрической полосы и каждого слота. Затем выполняется операция спектрального отбеливания, при которой значения энергии каждой параметрической полосы взвешиваются, так чтобы общая энергия параметрических полос была равной. В завершение, получается широкополосная огибающая посредством суммирования и нормирования взвешенных энергий всех параметрических полос, а долгосрочная усредненная энергия получается посредством фильтрации нижних частот с помощью долговременной константы.
Процесс восстановления исходной формы огибающей выполняет выравнивание и восстановление исходной формы выходных каналов в направлении целевой огибающей посредством вычисления и применения кривой усиления для части прямого и рассеянного звука каждого выходного канала. Следовательно, огибающие передаваемого канала понижающего микширования и соответствующего выходного канала получаются так, как описано выше.
Кривая усиления в таком случае получается посредством масштабирования соотношения полученной огибающей понижающего микширования и полученной выходной огибающей со значениями соотношения огибающих, передаваемыми в потоке битов.
Предлагаемое средство генерирования огибающих использует квантованную побочную информацию, передаваемую в потоке битов. Общая потребность по битрейту для побочной информации огибающей перечислена в таблице (при условии частоты дискретизации 44,1 кГц, 5-этапной квантованной побочной информации огибающей).
Оцененная скорость передачи битов для побочной информации огибающей
Способ кодирования Оцененный
битрейт
Сгруппированное PCM-кодирование ~8,0 кбит/с
Энтропийное кодирование ~5,0 кбит/с
Как указано выше, направляемое генерирование временной огибающей разрешает вопросы, которые ортогональны вопросам, разрешаемым посредством TES или TP. Хотя предлагаемое направляемое генерирование временных огибающих нацелено на улучшение пространственного распределения переходных событий, средство TES и TP имеет такую функциональность, чтобы генерировать огибающую рассеянного звука так, чтобы соответствовать сухой огибающей. Таким образом, для сценария высококачественного варианта применения рекомендуется комбинация предлагаемого средства с TES или TP. Для оптимальных рабочих характеристик направляемое генерирование временной огибающей выполняется до применения TES или TP в цепочке средств декодера. Более того, средства TES и TP в небольшой степени приспособлены по своей конфигурации для того, чтобы прозрачно интегрироваться с предлагаемым средством. По сути, сигнал, используемый для того, чтобы получать целевую огибающую в обработке TES или TP, изменяется с использования сигнала понижающего микширования в направлении использования отдельных сигналов повышающего микширования канала с восстановленной исходной формой.
Как уже упоминалось выше, серьезное преимущество отвечающей изобретению идеи состоит в возможности ее размещения в схеме кодирования объемного звучания MPEG. Отвечающая изобретению идея, с одной стороны, расширяет функциональность средства TP/TES, поскольку она реализует механизм временного генерирования, требуемый для надлежащей обработки переходных событий или сигналов. С другой стороны, средство требует передачи побочной информации, чтобы направлять процесс генерирования. Хотя требуемый средний битрейт побочной информации (5 кбит/с для непрерывной передачи огибающей) сравнительно небольшой, прирост в качестве восприятия значителен. Следовательно, новая идея предлагается как дополнение к существующим средствам TP/TES. В смысле поддержания вычислительной сложности, достаточно низкой при сохранении высокого качества аудио, комбинация новой предлагаемой идеи с TES является предпочтительным режимом работы. Что касается вычислительной сложности, следует отметить, что некоторые вычисления требуются для получения и восстановления исходной формы огибающих на покадровой основе кадра, в то время как другие приводятся в исполнение в каждом слоте (т.е. интервале времени в области группы фильтров). Сложность зависит от длины кадра, а также частоты дискретизации. При условии длины кадра в 32 слота и частоты дискретизации в 44,1 кГц, описанный алгоритм требует примерно 105000 операций в секунду (OPS) для извлечения огибающей для одного канала и 330000 OPS для восстановления исходной формы одного канала. Поскольку требуется одно извлечение огибающей на канал понижающего микширования, и одна операция восстановления исходной формы требуется для каждого выходного канала, это приводит к общей сложности в 1,76 MOPS для конфигурации 5-1-5, т.е. конфигурации, в которой 5 каналов многоканального аудиосигнала представляются посредством монофонического сигнала понижающего микширования, и 1,86 MOPS для конфигурации 5-2-5, использующей стереосигнал понижающего микширования.
Перечень фигур чертежей
Предпочтительные варианты осуществления настоящего изобретения далее описываются посредством ссылки на прилагаемые чертежи, из которых:
Фиг. 1 - отвечающий изобретению декодер.
Фиг. 2 - отвечающий изобретению кодер.
Фиг. 3A и 3B - таблицы, назначающие индексы фильтров для гибридной группы фильтров соответствующим индексам подполос.
Фиг. 4 - параметры различных конфигураций декодирования.
Фиг. 5 - схема кодирования, демонстрирующая обратную совместимость изобретаемой идеи.
Фиг. 6 - конфигурации параметров, выбирающие различные конфигурации.
Фиг. 7 - обратно совместимая схема кодирования.
Фиг. 7B - различные схемы квантования.
Фиг. 8 - дополнительная иллюстрация обратно совместимой схемы кодирования.
Фиг. 9 - таблица кодирования Хаффмана, используемая для эффективной реализации.
Фиг. 10 - пример конфигурации канала для многоканального выходного сигнала.
Фиг. 11 - отвечающее изобретению передающее устройство или аудиорекордер.
Фиг. 12 - отвечающее изобретению приемное устройство или аудиопроигрыватель.
Фиг. 13 - отвечающая изобретению система передачи.
Фиг. 14 - временное генерирование во временной области, отвечающее предшествующему уровню техники.
Подробное описание предпочтительных вариантов осуществления
Фиг. 1 иллюстрирует отвечающий изобретению кодер 40, имеющий блок 42 повышающего микширования и генерирователь 44.
Декодер 40 принимает в качестве входных данных базовый сигнал 46, получаемый из исходного многоканального сигнала, причем базовый сигнал имеет один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала. Декодер 40 принимает в качестве вторых входных данных параметрическое представление 48 формы сигнала, представляющее форму сигнала в представлении с низким разрешением выбранного исходного канала, при этом параметрическое представление 48 формы сигнала включает в себя последовательность параметров формы сигнала, имеющих временное разрешение, которое ниже временного разрешения значений дискретизации, которые организованы в виде кадров, причем кадры описывают базовый сигнал 46. Блок 42 повышающего микширования генерирует канал 50 повышающего микширования из базового сигнала, где повышающее микширование 50 - это оцененное представление с низким разрешением выбранного исходного канала исходного многоканального сигнала, который имеет меньшее временное разрешение, чем временное разрешение значений дискретизации. Формирователь 44 принимает канал 50 повышающего микширования и параметрическое представление 48 формы сигнала в качестве входных данных и получает сформированный подвергнутый повышающему микшированию канал 52, который формируется таким образом, что огибающая сформированного подвергнутого повышающему микшированию канала 52 корректируется, чтобы соответствовать огибающей соответствующего исходного канала в области допустимых значений, при этом временное разрешение задается временным разрешением параметрического представления формы сигнала.
Таким образом, огибающая сгенерированного подвергнутого повышающему микшированию канала может быть сгенерирована с временным разрешением, которое выше временного разрешения, задаваемого посредством кадров, составляющих базовый сигнал 46. Следовательно, пространственное перераспределение восстановленного сигнала обеспечивается с большей степенью разрешения по времени, чем посредством использования кадров, и воспринимаемое качество может быть повышено за счет незначительного увеличения битрейта вследствие представления 48 параметров формы сигнала.
Фиг. 2 иллюстрирует отвечающий изобретению кодер 60, имеющий блок 62 понижения временного разрешения и блок 64 вычисления параметров формы сигнала. Кодер 60 принимает в качестве входных данных канал многоканального сигнала, который представляется посредством кадров 66, причем кадры содержат значения 68a-68g дискретизации, при этом каждое значение дискретизации представляет первый период дискретизации. Блок 62 понижения временного разрешения получает представление 70 с низким разрешением для канала, в котором кадр имеет значения 72a-72d низкого разрешения, которые ассоциированы с периодом низкого разрешения, который больше периода дискретизации.
Блок 64 вычисления параметров формы сигнала принимает представление 70 с низким разрешением в качестве входных данных и вычисляет параметры 74 формы сигнала, при этом параметры 74 формы сигнала имеют временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого посредством кадров.
Параметры 74 формы сигнала предпочтительно зависят от амплитуды канала в рамках временного отрезка, задаваемого посредством периода низкого разрешения. В предпочтительном варианте осуществления параметры 74 формы сигнала описывают энергию, которая содержится в канале, в периоде низкого разрешения. В предпочтительном варианте осуществления параметры формы сигнала получаются таким образом, что показатель энергии, содержащийся в параметрах 74 формы сигнала, получаются относительно эталонного показателя энергии, который задается сигналом понижающего микширования, извлеченным отвечающим изобретению многоканальным аудиокодером.
Применение отвечающего изобретению идеи в контексте аудиокодера объемного звучания MPEG подробно описывается в последующих разделах, чтобы обрисовать отвечающие изобретению идеи.
Применение отвечающей изобретению идеи в области подполосы кодера MPEG предшествующего уровня техники дополнительно подчеркивает преимущественную обратную совместимость отвечающий изобретению идеи со схемами кодирования предшествующего уровня техники.
Настоящее изобретение (направляемое генерирование огибающей) восстанавливает широкополосную огибающую синтезированного выходного сигнала. Оно содержит модифицированную процедуру повышающего микширования, за которой следует выравнивание и восстановление исходной формы огибающей части прямого (сухого) и рассеянного (сырого) сигнала каждого выходного канала. Для управления побочной информацией используется восстановление исходной формы параметрической широкополосной огибающей, содержащееся в потоке битов. Побочная информация содержит соотношения (envRatio), связывающие огибающую передаваемых сигналов понижающего микширования с огибающей исходных сигналов входного канала.
Поскольку процесс генерирования огибающих использует операцию получения огибающих для различных сигналов, процесс получения огибающих сначала должен быть более подробно описан. Следует отметить, что в рамках схемы кодирования MPEG каналы обрабатываются в представлении, получаемом посредством гибридной группы фильтров, т.е. два последовательных фильтра применяются к входному каналу. Первая группа фильтров получает представление входного канала, в котором множество частотных интервалов описываются независимо посредством параметров, имеющих временное разрешение, которое ниже временного разрешения значений дискретизации входного канала. Эти параметрические полосы далее обозначаются буквой k. Некоторые из параметрических полос затем фильтруются посредством дополнительной группы фильтров, которая дополнительно подразделяет полосы частот первой группы фильтров на одну или более конечных полос частот с представлениями, которые в последующих разделах обозначаются k. Другими словами, каждая параметрическая полоса k может иметь ассоциированным более одного гибридного индекса k.
Фиг. 3A и 3B иллюстрируют таблицу, ассоциативно связывающую число параметрических полос с соответствующими гибридными параметрами. Гибридный параметр k задается в первом столбце 80 таблицы, в которой ассоциированная параметрическая полоса k задается в одном из столбцов 82a или 82b. Применение столбца 82a или 82b зависит от параметра 84 (decType), который указывает две возможные конфигурации группы фильтров MPEG-декодера.
Дополнительно следует отметить, что параметры, ассоциированные с каналом, обрабатываются покадрово, при этом один кадр имеет n временных интервалов и при этом для каждого временного интервала n один параметр y существует по каждому гибридному индексу k. Временные интервалы n также называются слотами, и ассоциированные параметры указываются как yn,k. Для оценки нормализованной огибающей энергии параметрических полос вычисляются с yn,k в качестве входного сигнала для каждого слота в кадре:
Figure 00000001
Суммирование включает в себя все k, приписываемые всем параметрическим полосам k, согласно таблице, показанной на фиг. 3A и 3B.
Затем общая энергия параметрических полос в кадре для каждой параметрической полосы вычисляется как:
Figure 00000002
Figure 00000003
Здесь α - весовой коэффициент, соответствующий IIR низких частот первого порядка с временной константой в 400 мс, t обозначает индекс кадра, sFreq - частота дискретизации сигнала, а 64 представляет коэффициент понижающей дискретизации группы фильтров. Средняя энергия в кадре вычисляется как:
Figure 00000004
при
Figure 00000005
и
Figure 00000006
.
Соотношение этих энергий определяется для того, чтобы получить веса для спектрального отбеливания:
Figure 00000007
Широкополосная огибающая получается посредством суммирования взвешенных вкладов параметрических полос, нормирования и вычисления квадратного корня:
Figure 00000008
После получения огибающей выполняется процесс генерирования огибающей, который состоит из выравнивания огибающей прямого и рассеянного звука для каждого выходного канала, после чего выполняется восстановление исходной формы в направлении целевой огибающей. Это приводит к применению кривой усиления к части прямого и рассеянного сигнала каждого выходного канала.
В случае схемы кодирования, совместимой с объемным звучанием MPEG, конфигурация 5-1-5 и конфигурация 5-2-5 должны быть различены.
Для конфигурации 5-1-5 целевая огибающая получается посредством оценки огибающей передаваемого понижающего микширования EnvDmx и последующего ее масштабирования с переданными кодером и повторно квантованными соотношениями огибающих envRatioL,Ls,C,R,Rs. Кривая усиления для всех слотов в кадре вычисляется для каждого выходного канала посредством оценки огибающей
Figure 00000009
прямого и рассеянного сигнала, соответственно, и связывания ее с целевой огибающей:
Figure 00000010
Для конфигураций 5-2-5 целевая огибающая для L и Ls получается из совместимой с левым каналом огибающей передаваемого сигнала понижающего микширования EnvDmxL, для R и Rs совместимый с правым каналом передаваемый сигнал понижающего микширования используется для того, чтобы получить EnvDmxR. Центральный канал получается из суммы совместимых с левым и правым каналом огибающих передаваемого сигнала понижающего микширования. Кривая усиления вычисляется для каждого выходного канала посредством оценки огибающей
Figure 00000011
прямого и рассеянного сигнала, соответственно, и связывания ее с целевой огибающей:
Figure 00000012
Для всех каналов кривая усиления корректировки огибающей применяется как:
Figure 00000013
При этом k начинается с переходной гибридной подполосы k0, и для n = 0,..., numSlots -1.
После отдельного генерирования огибающей сырого и сухого сигнала сгенерированный прямой и рассеянный звук сводится в рамках области подполосы согласно следующей формуле:
Figure 00000014
В предыдущих разделах показано, что преимущественно можно реализовать отвечающую изобретению идею в рамках схемы кодирования предшествующего уровня техники, которая основана на кодировании объемного звучания MPEG. Настоящее изобретение также использует уже существующее представление области подполос сигналов, которые должны быть обработаны, подразумевая небольшие дополнительные вычислительные затраты. Чтобы повысить эффективность реализации отвечающей изобретению идеи в многоканальном аудиокодировании MPEG, некоторые дополнительные изменения в повышающем микшировании и генерировании временной огибающей предпочтительны.
Если предоставляется направляемое генерирование огибающей, прямые и рассеянные сигналы синтезируются по отдельности с помощью модифицированного последующего микширования в гибридной области подполос согласно:
Figure 00000015
при этом k0 обозначает переходную гибридную подполосу.
Как можно видеть из вышеуказанных уравнений, прямые выводы содержат прямой сигнал, рассеянный сигнал для нижних полос и остаточный сигнал (если имеется). Рассеянные выводы предоставляют рассеянный сигнал для верхних полос.
Здесь k0 обозначает переходную гибридную подполосу согласно фиг. 4. Фиг. 4 иллюстрирует таблицу, которая задает переходную гибридную подполосу k0 в зависимости от двух возможных конфигураций декодера, указанных посредством параметра 84 (decType).
Если TES используется в комбинации с направляемым генерированием огибающей, обработка TES в незначительной степени адаптируется для оптимальной производительности.
Вместо сигналов понижающего микширования прямые сигналы повышающего микширования с восстановленной формой используются для генерирования оценки фильтрации:
xc = ydirect,c
Независимо от режима 5-1-5 или 5-2-5 все вычисления TES выполняются соответствующим образом на поканальной основе. Более того, в таком случае этап микширования прямого и рассеянного сигналов опускается в направляемом генерировании огибающей, поскольку он выполняется посредством TES.
Если TP используется в комбинации с направляемым генерированием огибающей, обработка TP в незначительной степени адаптируется для оптимальных рабочих характеристик.
Вместо общего понижающего микширования (полученного из исходного многоканального сигнала), прямой сигнал повышающего микширования с восстановленной формой для каждого канала используется для получения целевой огибающей для каждого канала.
Figure 00000016
Независимо от режима 5-1-5 или 5-2-5 все вычисления TP выполняются соответствующим образом на поканальной основе. Более того, этап микширования прямого и рассеянного сигналов опускается в направляемом генерировании огибающей, поскольку он выполняется посредством TP.
Чтобы дополнительно подчеркнуть и доказать обратную совместимость отвечающей изобретению идеи с аудиокодированием MPEG, следующие чертежи показывают определения и функции потока битов, заданные так, чтобы быть полностью обратно совместимыми и дополнительно поддерживающими данные восстановления исходной формы огибающей.
Фиг. 5 иллюстрирует общий синтаксис, показывающий конкретную пространственную конфигурацию потока битов.
В первой части 90 конфигурации переменные связаны с кодированием MPEG предшествующего уровня техники, задавая, например, то, применяется ли остаточное кодирование, или предоставляя индикацию о схемах декорреляции для применения. Эта конфигурация может быть легко расширена посредством второй части 92, описывающей модифицированную конфигурацию, когда применяется отвечающая изобретению идея направленного генерирования огибающей.
В частности, вторая часть использует переменную bsTempShapeConfig, указывающую конфигурацию генерирования огибающей посредством декодера.
Фиг. 6 иллюстрирует обратно совместимый способ интерпретации четырех битов, задействуемых упомянутой переменной. Как можно видеть из фиг. 6, значения переменной от 4 до 7 (указанные в строке 94) указывают применение отвечающей изобретению идеи и, более того, комбинации отвечающей изобретению идеи с механизмами генерирования предшествующего уровня техники TP и TES.
Фиг. 7 показывает предлагаемый синтаксис схемы энтропийного кодирования, поскольку оно используется в предпочтительном варианте осуществления настоящего изобретения. Дополнительно, побочная информация огибающей квантуется с помощью правила пятиэтапного квантования.
В первой части псевдокода, представленного на фиг. 7, генерирование временной огибающей предоставляется для всех требуемых выходных каналов, тогда как во второй части 102 кода запрашивается представленное восстановление исходной формы огибающей. Это указано посредством переменной bsTempShapeConfig, показанной на фиг. 6.
В предпочтительном варианте осуществления настоящего изобретения используется пятиэтапное квантование, и квантованные значения кодируются совместно с информацией, при этом появляется от одного до восьми последовательных идентичных значений в потоке битов параметров генерирования огибающей.
Следует отметить, что в принципе возможно более точное квантование, предлагаемое пятиэтапным квантованием, которое в таком случае может быть указано посредством переменной bsEnvquantMode, показанной на фиг. 7B. Хотя принципиально возможно, что настоящее изобретение вводит только одно допустимое квантование.
Фиг. 8 иллюстрирует код, который приспособлен для того, чтобы получать квантованные параметры из кодированного представления Хаффмана. Как уже упоминалось, комбинированная информация, касающаяся квантованного значения и числа повторений рассматриваемого значения, представляется посредством одного кодового слова Хаффмана. Следовательно, декодирование Хаффмана содержит первый компонент 104, инициирующий цикл по требуемым выходным каналам, и второй компонент 106, который принимает кодированные значения для каждого отдельного канала для передачи кодовых слов Хаффмана и приема ассоциированных значений параметров и повторяющихся данных, как показано на фиг. 9.
Фиг. 9 иллюстрирует ассоциированную таблицу кодирования Хаффмана, которая имеет 40 записей, поскольку для 5 различных значений параметров 110 подразумевается максимальная частота следования, равная 8. Каждое кодовое слово 112 Хаффмана, следовательно, описывает комбинацию параметра 110 и номера последовательного вхождения 114.
С учетом значений декодированных параметров, соотношения огибающих, используемые для направленного генерирования огибающих, получаются из передаваемых данных восстановления исходной формы согласно следующему уравнению:
Figure 00000017
где n=0,..., numSlots-1 и X и oc обозначают выходной канал согласно фиг. 10.
Фиг. 10 иллюстрирует таблицу, которая ассоциирует переменную oc 120 цикла, используемую в предыдущих таблицах и выражениях, с выходными каналами 122 восстановленного многоканального сигнала.
Как показано на фиг. 3A-9, применение отвечающей изобретению идеи к схемам кодирования предшествующего уровня техники легко допускается, приводя к повышению качества восприятия при сохранении полной обратной совместимости.
Фиг. 11 иллюстрирует отвечающее изобретению передающее аудиоустройство или рекордер 330, который имеет кодер 60, интерфейс 332 ввода и интерфейс 334 вывода.
Аудиосигнал может подаваться на интерфейс 332 ввода передающего устройства/рекордера 330. Аудиосигнал кодируется отвечающим изобретению кодером 60 в передающем устройстве/рекордере, и кодированное представление выводится в интерфейсе 334 вывода передающего устройства/рекордера 330. Кодированное представление затем может быть передано или сохранено в носителе записи.
Фиг. 12 иллюстрирует отвечающее изобретению приемное устройство или аудиопроигрыватель 340, имеющий отвечающий изобретению декодер 40, входной поток 342 битов и выходное аудио 344.
Поток битов может быть введен на вход отвечающего изобретению приемного устройства/аудиопроигрывателя 340. Затем поток битов декодируется посредством декодера 40, и декодированный сигнал выводится или воспроизводится на выходе 344 отвечающего изобретению приемного устройства/аудиопроигрывателя 340.
Фиг. 13 иллюстрирует систему передачи, содержащую отвечающее изобретению передающее устройство 330 и отвечающее изобретению приемное устройство 340.
Аудиосигнал, поступающий в интерфейс 332 ввода передающего устройства 330, кодируется и передается с выхода 334 передающего устройства 330 на вход 342 приемного устройства 340. Приемное устройство декодирует аудиосигнал и воспроизводит или выводит аудиосигнал на выходе 344.
Обобщая, настоящее изобретение предоставляет усовершенствованные решения посредством описания, к примеру, способа вычисления надлежащей и стабильной широкополосной огибающей, которая минимизирует воспринимаемое искажение; оптимизированного способа, чтобы кодировать побочную информацию огибающей таким образом, чтобы она представлялась относительно (нормализованно) к огибающей сигнала понижающего микширования, и тем самым минимизирует накладные расходы по битрейту, схемы квантования для информации огибающей, которая должна быть передана; надлежащего синтаксиса потока битов для передачи этой побочной информации, эффективного способа обработки широкополосных огибающих в области QMF-подполос; концепции того, как типы обработки (1) и (2), описанные выше, могут быть использованы единообразно в одной архитектуре, что позволяет восстанавливать точное пространственное распределение многоканальных сигналов во времени, если доступна пространственная побочная информация, описывающая исходные временные огибающие каналов. Если данная информация не отправляется в пространственном потоке битов (к примеру, вследствие ограничений на доступный битрейт для побочной информации), обработка возвращается обратно к обработке типа (1), которая по-прежнему позволяет осуществлять корректное временное генерирование декоррелированного звука (хотя не на основе отдельного канала).
Хотя отвечающая изобретению идея, описанная выше, подробно пояснена в применении к существующим схемам MPEG-кодирования, очевидно, что отвечающая изобретению идея может быть применена к любому другому типу кодирования, когда пространственные характеристики аудио должны быть сохранены.
Отвечающая изобретению идея, заключающаяся во введении или использовании промежуточного сигнала для генерирования огибающей, т.е. энергии сигнала с повышенным временным разрешением, может быть применена не только в частотной области, как проиллюстрировано посредством чертежей, но также во временной области, где, например, снижение временного разрешения, а следовательно, снижение требуемого битрейта может быть достигнуто посредством усреднения по последовательным временным фрагментам или только посредством учета каждого n-го значения дискретизации для представления выборки аудиосигнала.
Хотя отвечающая изобретению идея, проиллюстрированная в предыдущих разделах, задействует спектральное взвешивание обработанных сигналов, идея сигнала промежуточного разрешения также может быть включена без пространственного взвешивания.
В зависимости от конкретных требований к реализации отвечающих изобретению способов, отвечающие изобретению способы могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может быть выполнена с помощью цифрового носителя хранения, в частности, диска, DVD или CD, имеющего электронно-читаемые сигналы управления, сохраненные на нем, который взаимодействует с программируемой компьютерной системой, так чтобы выполнялись отвечающие изобретению способы. В общем, настоящее изобретение, таким образом, относится к компьютерному программному продукту с программным кодом, сохраненным на машиночитаемом носителе, при этом программный код приспособлен для осуществления изобретаемых способов, когда компьютерный программный продукт исполняется на компьютере. Другими словами, отвечающие изобретению способы, таким образом, относятся к компьютерной программе, имеющей программный код для осуществления, по меньшей мере, одного из способов, когда компьютерная программа исполняется на компьютере.
Несмотря на то, что вышеизложенное описание подробно показано и пояснено со ссылкой на его конкретные варианты осуществления, специалистам в данной области техники следует понимать, что различные другие изменения по форме и содержанию могут быть сделаны без отступления от существа и объема изобретения. Необходимо понимать, что различные изменения могут быть сделаны для адаптации к различным вариантам осуществления без отступления от более широких идей, раскрытых в данном документе и охватываемых прилагаемой формулой изобретения.

Claims (37)

1. Декодер для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащий:
блок повышающего микширования для генерирования множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения, и для получения представления с промежуточным разрешением базового сигнала, используемого для того, чтобы генерировать подвергнутые повышающему микшированию каналы; и
формирователь для получения эталонного параметрического представления формы сигнала для представления с промежуточным разрешением базового сигнала и для формирования выбранного подвергнутого повышающему микшированию канала с помощью эталонного параметрического представления формы сигнала и промежуточного параметрического представления формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
2. Декодер по п.1, в котором блок повышающего микширования дополнительно выполнен с возможностью получать представление с промежуточным разрешением базового сигнала.
3. Декодер по п.2, в котором блок повышающего микширования выполнен с возможностью получать представление с промежуточным разрешением базового сигнала с помощью группы фильтров, при этом получение представления с промежуточным разрешением базового сигнала осуществляется в области группы фильтров.
4. Декодер по п.3, в котором группа фильтров - это комплексно-модулированная группа фильтров.
5. Декодер по п.1, в котором блок повышающего микширования имеет один или более декорреляторов для получения одного или более декоррелированных сигналов из базового сигнала.
6. Декодер по п.5, в котором блок повышающего микширования выполнен с возможностью, чтобы генерирование подвергнутых повышающему микшированию каналов включало в себя линейную комбинацию каналов базового сигнала и упомянутого одного или более декоррелированных сигналов.
7. Декодер по п.6, в котором формирователь выполнен с возможностью формировать выбранный подвергнутый повышающему микшированию канал, так чтобы первая часть выбранного подвергнутого повышающему микшированию канала, полученного из базового сигнала, формировалась независимо от второй части выбранного подвергнутого повышающему микшированию канала, полученного из одного или более декоррелированных сигналов.
8. Декодер по п.1, в котором формирователь выполнен с возможностью использовать промежуточные параметры формы сигнала, описывающие показатель интенсивности сигнала представления с промежуточным разрешением выбранного канала.
9. Декодер по п.8, в котором формирователь выполнен с возможностью использовать промежуточные параметры формы сигнала, описывающие показатель интенсивности сигнала, имеющий амплитуду или показатель энергии.
10. Декодер по п.1, в котором формирователь выполнен с возможностью формировать выбранный канал повышающего микширования таким образом, чтобы формирование содержало комбинацию параметров из параметрического представления формы сигнала и из эталонного параметрического представления формы сигнала.
11. Декодер по п.1, в котором формирователь выполнен с возможностью получать спектрально-плоское представление представления с промежуточным разрешением базового сигнала, при этом спектрально плоское представление имеет плоский частотный спектр, и получать эталонное параметрическое представление формы сигнала из спектрально плоского представления.
12. Декодер по п.1, в котором формирователь дополнительно выполнен с возможностью формировать выбранный подвергнутый повышающему микшированию канал с помощью дополнительных параметров формы сигнала, имеющих низкое временное разрешение, задаваемое частотой следования кадров.
13. Декодер по п.1, дополнительно имеющий интерфейс вывода для того, чтобы генерировать многоканальный выходной сигнал, имеющий упомянутое высокое временное разрешение, с помощью сгенерированного выбранного подвергнутого повышающему микшированию канала.
14. Декодер по п.13, в котором интерфейс вывода выполнен с возможностью генерировать многоканальный выходной сигнал так, чтобы генерирование многоканального выходного сигнала содержало синтез представления группы фильтров множества сгенерированных подвергнутых повышающему микшированию каналов, приводя в результате к представлению во временной области множества сформированных подвергнутых повышающему микшированию каналов, имеющих упомянутое высокое временное разрешение.
15. Декодер по п.1, в котором формирователь имеет обратный квантователь для получения параметрического представления формы сигнала из его квантованного представления с помощью правила обратного квантования, имеющего менее 10 этапов квантования.
16. Декодер по п.15, в котором формирователь имеет энтропийный декодер для получения квантованного представления параметрического представления формы сигнала из его энтропийно кодированного представления.
17. Декодер по п.16, в котором энтропийный декодер выполнен с возможностью использовать таблицу кодирования Хаффмана для получения квантованного представления параметрического представления формы сигнала.
18. Декодер по п.3, в котором формирователь выполнен с возможностью формировать выбранный подвергнутый повышающему микшированию канал во временной области.
19. Кодер для генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем кодер содержит:
блок понижения временного разрешения для получения представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации, и для получения эталонного представления с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
блок вычисления параметров формы сигнала для вычисления параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом блок вычисления параметров формы сигнала выполнен с возможностью генерировать последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров, при этом блок вычисления параметров формы сигнала выполнен с возможностью вычислять параметры формы сигнала с помощью эталонного представления с низким разрешением и представления с низким разрешением канала.
20. Кодер по п.19, в котором блок понижения временного разрешения имеет группу фильтров для получения представления с низким разрешением канала, при этом получение представления с низким разрешением осуществляется в области группы фильтров.
21. Кодер по п.19, в котором блок вычисления параметров формы сигнала выполнен с возможностью, чтобы вычисление параметров формы сигнала содержало комбинацию амплитудных показателей эталонного представления с низким разрешением и представления с низким разрешением канала.
22. Кодер по п.19, в котором блок вычисления параметров формы сигнала имеет квантователь для получения квантованного представления параметров формы сигнала.
23. Кодер по п.22, в котором блок вычисления параметров формы сигнала имеет энтропийный кодер для получения энтропийно кодированного представления квантованного представления параметров формы сигнала.
24. Способ генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, при этом способ содержит этапы, на которых:
получают представление с промежуточным разрешением базового сигнала, используемое для того, чтобы генерировать подвергнутые повышающему микшированию каналы;
генерируют множество подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения;
получают эталонное параметрическое представление формы сигнала для предоставления с промежуточным разрешением базового сигнала; и
формируют выбранный подвергнутый повышающему микшированию канал с помощью эталонного параметрического представления формы сигнала и промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
25. Способ генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем способ содержит этапы, на которых:
получают представление с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации;
получают эталонное представление с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
вычисляют параметрическое представление формы сигнала, представляющее форму сигнала в представлении с низким разрешением, с помощью эталонного представления с низким разрешением и представления с низким разрешением канала, при этом параметрическое представление формы сигнала имеет временное разрешение, меньшее временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
26. Приемное устройство, имеющее декодер для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащий:
блок повышающего микширования для генерирования множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения, и для получения представления с промежуточным разрешением базового сигнала, используемого для того, чтобы генерировать подвергнутые повышающему микшированию каналы; и
формирователь для получения эталонного параметрического представления формы сигнала для представления с промежуточным разрешением базового сигнала и для формирования выбранного подвергнутого повышающему микшированию канала с помощью эталонного параметрического представления формы сигнала и промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
27. Передающее устройство, имеющее кодер для генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем кодер содержит:
блок понижения временного разрешения для получения представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации, и для получения эталонного представления с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
блок вычисления параметров формы сигнала для вычисления параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом блок вычисления параметров формы сигнала выполнен с возможностью генерировать последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров, при этом блок вычисления параметров формы сигнала выполнен с возможностью вычислять параметры формы сигнала с помощью эталонного представления с низким разрешением и представления с низким разрешением канала.
28. Способ приема сигналов, который имеет способ генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащий этапы, на которых:
получают представление с промежуточным разрешением базового сигнала, используемого для того, чтобы генерировать подвергнутые повышающему микшированию каналы;
генерируют множество подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения;
получают эталонное параметрическое представление формы сигнала для представления с промежуточным разрешением базового сигнала; и
формируют выбранный подвергнутый повышающему микшированию канал с помощью промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
29. Способ передачи сигналов, причем способ имеет способ генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем способ содержит этапы, на которых:
получают представление с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации; и
получают эталонное представление с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
вычисляют параметрическое представление формы сигнала, представляющее форму сигнала в представлении с низким разрешением, с помощью эталонного представления с низким разрешением и представления с низким разрешением канала, при этом параметрическое представление формы сигнала имеет временное разрешение, меньшее временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
30. Система передачи и приема сигналов, имеющая передающее устройство и приемное устройство, при этом передающее устройство имеет кодер для генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем кодер содержит:
блок понижения временного разрешения для получения представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации, и для получения эталонного представления с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
блок вычисления параметров формы сигнала для вычисления параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом блок вычисления параметров формы сигнала выполнен с возможностью генерировать последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров, при этом блок вычисления параметров формы сигнала выполнен с возможностью вычислять параметры формы сигнала с помощью эталонного представления с низким разрешением и представления с низким разрешением канала;
при этом приемное устройство имеет декодер для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащий:
блок повышающего микширования для генерирования множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения, и для получения представления с промежуточным разрешением базового сигнала, используемого для того, чтобы генерировать подвергнутые повышающему микшированию каналы; и
формирователь для получения эталонного параметрического представления формы сигнала для представления с промежуточным разрешением базового сигнала и для формирования выбранного подвергнутого повышающему микшированию канала с помощью эталонного параметрического представления формы сигнала и промежуточного параметрического представления формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
31. Способ передачи и приема сигналов, причем способ передачи имеет способ генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем способ содержит этапы, на которых:
получают представление с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации;
получают эталонное представление с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
вычисляют параметрическое представление формы сигнала, представляющее форму сигнала в представлении с низким разрешением, с помощью эталонного представления с низким разрешением и представления с низким разрешением канала, при этом параметрическое представление формы сигнала имеет временное разрешение, меньшее временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой повторения кадров; и
при этом способ приема имеет способ генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, причем способ содержит этапы, на которых:
получают представление с промежуточным разрешением базового сигнала, используемое для того, чтобы генерировать подвергнутые повышающему сведению каналы;
генерируют множество подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения;
получают эталонное параметрическое представление формы сигнала для представления с промежуточным разрешением базового сигнала; и
формируют выбранный подвергнутый повышающему сведению канал с помощью эталонного параметрического представления формы сигнала и промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему сведению каналу.
32. Компьютер, имеющий программный код для осуществления, при его исполнении на компьютере, способа по п.24.
33. Аудиопроигрыватель, имеющий декодер для генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащий:
блок повышающего микширования для генерирования множества подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения, и для получения представления с промежуточным разрешением базового сигнала, используемого для того, чтобы генерировать подвергнутые повышающему микшированию каналы; и
формирователь для получения эталонного параметрического представления формы сигнала для представления с промежуточным разрешением базового сигнала и для формирования выбранного подвергнутого повышающему микшированию канала с помощью эталонного параметрического представления формы сигнала и промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
34. Аудиорекордер, имеющий кодер для генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем кодер содержит:
блок понижения временного разрешения для получения представления с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации, и для получения эталонного представления с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
блок вычисления параметров формы сигнала для вычисления параметрического представления формы сигнала, представляющего форму сигнала в представлении с низким разрешением, при этом блок вычисления параметров формы сигнала выполнен с возможностью генерировать последовательность параметров формы сигнала, имеющих временное разрешение ниже временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров, при этом блок вычисления параметров формы сигнала выполнен с возможностью вычислять параметры формы сигнала с помощью эталонного представления с низким разрешением и представления с низким разрешением канала.
35. Способ аудиовоспроизведения, который имеет способ генерирования многоканального выходного сигнала на основе базового сигнала, полученного из исходного многоканального сигнала, имеющего один или более каналов, при этом число каналов базового сигнала меньше числа каналов исходного многоканального сигнала, причем базовый сигнал имеет кадр, кадр содержит значения дискретизации, имеющие высокое разрешение, и на основе параметрического представления формы сигнала, представляющего форму сигнала в представлении с промежуточным разрешением для выбранного исходного канала исходного многоканального сигнала, при этом параметрическое представление формы сигнала включает в себя последовательность промежуточных параметров формы сигнала, имеющих промежуточное временное разрешение ниже упомянутого высокого временного разрешения значений дискретизации и выше низкого временного разрешения, задаваемого частотой следования кадров, содержащий этапы, на которых:
получают представление с промежуточным разрешением базового сигнала, используемого для того, чтобы генерировать подвергнутые повышающему микшированию каналы;
генерируют множество подвергнутых повышающему микшированию каналов, имеющих временное разрешение выше промежуточного разрешения;
получают эталонное параметрическое представление формы сигнала для представления с промежуточным разрешением базового сигнала; и
формируют выбранный подвергнутый повышающему микшированию канал с помощью промежуточных параметров формы сигнала выбранного исходного канала, соответствующего выбранному подвергнутому повышающему микшированию каналу.
36. Способ аудиозаписи, который имеет способ генерирования параметрического представления формы сигнала канала многоканального сигнала, имеющего кадр, при этом кадр содержит значения дискретизации, имеющие период дискретизации, причем способ содержит этапы, на которых:
получают представление с низким разрешением канала с помощью значений дискретизации кадра, при этом представление с низким разрешением имеет значения с низким разрешением, имеющие ассоциированный период низкого разрешения, больший периода дискретизации; и
получают эталонное представление с низким разрешением базового сигнала, полученного из многоканального сигнала, при этом число каналов базового сигнала меньше числа каналов многоканального сигнала; и
вычисляют параметрическое представление формы сигнала, представляющее форму сигнала в представлении с низким разрешением, с помощью эталонного представления с низким разрешением и представления с низким разрешением канала, при этом параметрическое представление формы сигнала имеет временное разрешение, меньшее временного разрешения значений дискретизации и выше временного разрешения, задаваемого частотой следования кадров.
37. Компьютер, имеющий программный код для осуществления, при его исполнении на компьютере, способа по п.25.
RU2008118333/09A 2005-10-12 2006-08-31 Временное и пространственное генерирование многоканальных аудиосигналов RU2388068C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US72638905P 2005-10-12 2005-10-12
US60/726,389 2005-10-12
US11/363,985 2006-02-27
US11/363,985 US7974713B2 (en) 2005-10-12 2006-02-27 Temporal and spatial shaping of multi-channel audio signals

Publications (2)

Publication Number Publication Date
RU2008118333A RU2008118333A (ru) 2009-11-20
RU2388068C2 true RU2388068C2 (ru) 2010-04-27

Family

ID=37179043

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008118333/09A RU2388068C2 (ru) 2005-10-12 2006-08-31 Временное и пространственное генерирование многоканальных аудиосигналов

Country Status (16)

Country Link
US (3) US7974713B2 (ru)
EP (1) EP1934973B1 (ru)
JP (1) JP5102213B2 (ru)
KR (1) KR100947013B1 (ru)
CN (1) CN101356571B (ru)
AU (1) AU2006301612B2 (ru)
BR (1) BRPI0618002B1 (ru)
CA (1) CA2625213C (ru)
ES (1) ES2770146T3 (ru)
IL (1) IL190765A (ru)
MY (1) MY144518A (ru)
NO (1) NO343713B1 (ru)
PL (1) PL1934973T3 (ru)
RU (1) RU2388068C2 (ru)
TW (1) TWI332192B (ru)
WO (1) WO2007042108A1 (ru)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2651229C2 (ru) * 2013-07-22 2018-04-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для декодирования кодированного аудиосигнала
RU2763155C2 (ru) * 2017-11-17 2021-12-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования
RU2779415C1 (ru) * 2018-12-07 2022-09-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием диффузной компенсации
US11838743B2 (en) 2018-12-07 2023-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using diffuse compensation

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE444549T1 (de) * 2004-07-14 2009-10-15 Koninkl Philips Electronics Nv Tonkanalkonvertierung
CN101065795A (zh) * 2004-09-23 2007-10-31 皇家飞利浦电子股份有限公司 处理音频数据的系统和方法、程序单元和计算机可读介质
US7304586B2 (en) 2004-10-20 2007-12-04 Electro Industries / Gauge Tech On-line web accessed energy meter
US9080894B2 (en) 2004-10-20 2015-07-14 Electro Industries/Gauge Tech Intelligent electronic device for receiving and sending data at high speeds over a network
US7747733B2 (en) 2004-10-25 2010-06-29 Electro Industries/Gauge Tech Power meter having multiple ethernet ports
US8190381B2 (en) 2005-01-27 2012-05-29 Electro Industries/Gauge Tech Intelligent electronic device with enhanced power quality monitoring and communications capabilities
US8121801B2 (en) * 2005-01-27 2012-02-21 Electro Industries/Gauge Tech System and method for multi-rate concurrent waveform capture and storage for power quality metering
US8160824B2 (en) 2005-01-27 2012-04-17 Electro Industries/Gauge Tech Intelligent electronic device with enhanced power quality monitoring and communication capabilities
US8620608B2 (en) 2005-01-27 2013-12-31 Electro Industries/Gauge Tech Intelligent electronic device and method thereof
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR20080094710A (ko) 2005-10-26 2008-10-23 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
TWI340600B (en) * 2006-03-30 2011-04-11 Lg Electronics Inc Method for processing an audio signal, method of encoding an audio signal and apparatus thereof
KR100763920B1 (ko) * 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
DK1956589T3 (da) * 2007-02-06 2010-04-26 Oticon As Estimering af egenstemmeaktivitet i et høreapparatsystem ud fra forholdet mellem direkte lyd og efterklang
US10845399B2 (en) 2007-04-03 2020-11-24 Electro Industries/Gaugetech System and method for performing data transfers in an intelligent electronic device
US9989618B2 (en) 2007-04-03 2018-06-05 Electro Industries/Gaugetech Intelligent electronic device with constant calibration capabilities for high accuracy measurements
US11307227B2 (en) 2007-04-03 2022-04-19 Electro Industries/Gauge Tech High speed digital transient waveform detection system and method for use in an intelligent electronic device
US20130275066A1 (en) 2007-04-03 2013-10-17 Electro Industries/Gaugetech Digital power metering system
CN101308655B (zh) * 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
US8180062B2 (en) 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
WO2010003479A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
JP5316896B2 (ja) * 2010-03-17 2013-10-16 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
US8831515B2 (en) 2011-10-12 2014-09-09 Broadcom Corporation Shaped load modulation in a near field communications (NFC) device
MX2014004797A (es) 2011-10-21 2014-09-22 Samsung Electronics Co Ltd Método y aparato de codificación sin perdida de energia, método y aparato de codificación de audio, método y aparato de decodificación sin perdida de energia y método y aparato de decodificación de audio.
BR112014017457A8 (pt) * 2012-01-19 2017-07-04 Koninklijke Philips Nv aparelho de transmissão de áudio espacial; aparelho de codificação de áudio espacial; método de geração de sinais de saída de áudio espacial; e método de codificação de áudio espacial
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
WO2014034697A1 (ja) * 2012-08-29 2014-03-06 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
CN103871414B (zh) * 2012-12-11 2016-06-29 华为技术有限公司 一种多声道语音信号的时标调制方法和装置
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
CN104981867B (zh) 2013-02-14 2018-03-30 杜比实验室特许公司 用于控制上混音频信号的通道间相干性的方法
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
JP6146069B2 (ja) * 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
CN103680513B (zh) * 2013-12-13 2016-11-02 广州华多网络科技有限公司 语音信号处理方法、装置及服务器
US20160018443A1 (en) * 2014-07-21 2016-01-21 Tektronix, Inc. Method for determining a correlated waveform on a real time oscilloscope
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP3204945B1 (en) * 2014-12-12 2019-10-16 Huawei Technologies Co. Ltd. A signal processing apparatus for enhancing a voice component within a multi-channel audio signal
JP2016126037A (ja) * 2014-12-26 2016-07-11 ソニー株式会社 信号処理装置、および信号処理方法、並びにプログラム
MX2021005090A (es) * 2015-09-25 2023-01-04 Voiceage Corp Método y sistema para codificar una señal de sonido estéreo utilizando los parámetros de codificación de un canal primario para codificar un canal secundario.
EP3408851B1 (en) 2016-01-26 2019-09-11 Dolby Laboratories Licensing Corporation Adaptive quantization
ES2771200T3 (es) 2016-02-17 2020-07-06 Fraunhofer Ges Forschung Postprocesador, preprocesador, codificador de audio, decodificador de audio y métodos relacionados para mejorar el procesamiento de transitorios
US10958695B2 (en) * 2016-06-21 2021-03-23 Google Llc Methods, systems, and media for recommending content based on network conditions
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
CN109427337B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号编码时重建信号的方法和装置
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
EP4085660A1 (en) 2019-12-30 2022-11-09 Comhear Inc. Method for providing a spatialized soundfield
CN113702893B (zh) * 2021-09-23 2023-11-21 云南电网有限责任公司电力科学研究院 一种直流互感器暂态波形传变一致性评价方法及装置

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4189625A (en) * 1978-03-13 1980-02-19 Strandberg Terry W Method and apparatus for processing dual frequency digital information signals
DE2916308C3 (de) * 1979-04-23 1982-02-25 Deutsche Vereinigte Schuhmaschinen Gmbh, 6000 Frankfurt Klebepresse zum Ankleben von Laufsohlen an aufgeleistetes Schuhwerk
US4285058A (en) 1980-02-26 1981-08-18 Fisher Charles B Waveform correction by sampling
TW226035B (en) 1991-12-13 1994-07-01 Nat Science Committee A process for producing anisotropic ribbon of R-Fe-M-B and the produced anisotropic resin bond
FR2700383B1 (fr) 1993-01-11 1995-02-10 Framatome Sa Echangeur de chaleur dans lequel l'alimentation en fluide secondaire s'effectue en partie haute par un boîtier d'alimentation ouvert vers le bas.
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
KR0174084B1 (ko) 1995-09-25 1999-04-01 이준 Mpeg-2 다채널 오디오 복호화기의 역변환기
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE69724625T2 (de) * 1996-09-02 2004-06-24 Stmicroelectronics N.V. Verbesserungen bei, oder in bezug auf mehrträgerübertragungssysteme
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
SG144695A1 (en) 1999-04-07 2008-08-28 Dolby Lab Licensing Corp Matrix improvements to lossless encoding and decoding
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US7418043B2 (en) * 2000-07-19 2008-08-26 Lot 41 Acquisition Foundation, Llc Software adaptable high performance multicarrier transmission protocol
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
TW561451B (en) 2001-07-27 2003-11-11 At Chip Corp Audio mixing method and its device
SG108862A1 (en) * 2002-07-24 2005-02-28 St Microelectronics Asia Method and system for parametric characterization of transient audio signals
TWI226601B (en) 2003-01-17 2005-01-11 Winbond Electronics Corp System and method of synthesizing a plurality of voices
JP4431568B2 (ja) 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
CN1839426A (zh) * 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
TWI226035B (en) 2003-10-16 2005-01-01 Elan Microelectronics Corp Method and system improving step adaptation of ADPCM voice coding
TWI229318B (en) 2003-10-29 2005-03-11 Inventec Multimedia & Telecom Voice processing system and method
KR101190875B1 (ko) * 2004-01-30 2012-10-15 프랑스 뗄레콤 차원 벡터 및 가변 분해능 양자화
US7613306B2 (en) 2004-02-25 2009-11-03 Panasonic Corporation Audio encoder and audio decoder
SG10202004688SA (en) * 2004-03-01 2020-06-29 Dolby Laboratories Licensing Corp Multichannel Audio Coding
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2799033C1 (ru) * 2010-07-19 2023-07-03 Долби Интернешнл Аб Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов
US11735192B2 (en) 2013-07-22 2023-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10002621B2 (en) 2013-07-22 2018-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10276183B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10311892B2 (en) 2013-07-22 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain
US10332539B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10332531B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10347274B2 (en) 2013-07-22 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10515652B2 (en) 2013-07-22 2019-12-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10573334B2 (en) 2013-07-22 2020-02-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10593345B2 (en) 2013-07-22 2020-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US10847167B2 (en) 2013-07-22 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10984805B2 (en) 2013-07-22 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11049506B2 (en) 2013-07-22 2021-06-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10147430B2 (en) 2013-07-22 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11769513B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10134404B2 (en) 2013-07-22 2018-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11250862B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11257505B2 (en) 2013-07-22 2022-02-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11289104B2 (en) 2013-07-22 2022-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11769512B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
RU2651229C2 (ru) * 2013-07-22 2018-04-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для декодирования кодированного аудиосигнала
US11222643B2 (en) 2013-07-22 2022-01-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11367454B2 (en) 2017-11-17 2022-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
US11783843B2 (en) 2017-11-17 2023-10-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions
RU2763155C2 (ru) * 2017-11-17 2021-12-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования
RU2763313C2 (ru) * 2017-11-17 2021-12-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений
RU2779415C1 (ru) * 2018-12-07 2022-09-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием диффузной компенсации
US11937075B2 (en) 2018-12-07 2024-03-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewand Forschung E.V Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using low-order, mid-order and high-order components generators
US11838743B2 (en) 2018-12-07 2023-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using diffuse compensation
US11856389B2 (en) 2018-12-07 2023-12-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using direct component compensation

Also Published As

Publication number Publication date
US9361896B2 (en) 2016-06-07
ES2770146T3 (es) 2020-06-30
IL190765A (en) 2013-09-30
US20110106545A1 (en) 2011-05-05
CA2625213C (en) 2012-04-10
MY144518A (en) 2011-09-30
AU2006301612B2 (en) 2010-07-22
NO343713B1 (no) 2019-05-13
AU2006301612A1 (en) 2007-04-19
JP5102213B2 (ja) 2012-12-19
TW200746044A (en) 2007-12-16
CA2625213A1 (en) 2007-04-19
US8644972B2 (en) 2014-02-04
CN101356571B (zh) 2012-05-30
US7974713B2 (en) 2011-07-05
JP2009511966A (ja) 2009-03-19
TWI332192B (en) 2010-10-21
US20070081597A1 (en) 2007-04-12
KR20080059193A (ko) 2008-06-26
RU2008118333A (ru) 2009-11-20
IL190765A0 (en) 2008-11-03
NO20082176L (no) 2008-05-09
CN101356571A (zh) 2009-01-28
US20140126725A1 (en) 2014-05-08
BRPI0618002B1 (pt) 2021-03-09
BRPI0618002A2 (pt) 2011-08-16
EP1934973A1 (en) 2008-06-25
KR100947013B1 (ko) 2010-03-10
WO2007042108A1 (en) 2007-04-19
PL1934973T3 (pl) 2020-06-01
EP1934973B1 (en) 2019-11-13

Similar Documents

Publication Publication Date Title
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
US9812136B2 (en) Audio processing system
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
TWI566234B (zh) 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式
JP5189979B2 (ja) 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御
US8116459B2 (en) Enhanced method for signal shaping in multi-channel audio reconstruction
RU2376655C2 (ru) Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
JP4794448B2 (ja) オーディオエンコーダ
US20060140412A1 (en) Multi parametrisation based multi-channel reconstruction
US20060133618A1 (en) Stereo compatible multi-channel audio coding
Lindblom et al. Flexible sum-difference stereo coding based on time-aligned signal components