RU2653240C2 - Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов - Google Patents

Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов Download PDF

Info

Publication number
RU2653240C2
RU2653240C2 RU2016105686A RU2016105686A RU2653240C2 RU 2653240 C2 RU2653240 C2 RU 2653240C2 RU 2016105686 A RU2016105686 A RU 2016105686A RU 2016105686 A RU2016105686 A RU 2016105686A RU 2653240 C2 RU2653240 C2 RU 2653240C2
Authority
RU
Russia
Prior art keywords
signal
mix
modification
downmix
output
Prior art date
Application number
RU2016105686A
Other languages
English (en)
Other versions
RU2016105686A (ru
Inventor
Йоуни ПАУЛУС
Харальд ФУКС
Оливер ХЕЛЛЬМУТ
Адриан МУРТАЗА
Фалько РИДДЕРБУШ
Леон ТЕРЕНТИВ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2016105686A publication Critical patent/RU2016105686A/ru
Application granted granted Critical
Publication of RU2653240C2 publication Critical patent/RU2653240C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Abstract

Изобретение относится к кодированию аудиообъектов. Технический результат изобретения заключается в сокращении вычислительных ресурсов, что минимизирует обработку пространственного кодирования аудиообъектов SAOC. Устройство для декодирования кодированного аудиосигнала (100) для получения модифицированных выходных сигналов (160) содержит входной интерфейс (110) для приема переданного сигнала (112) понижающего микширования и параметрических данных (114); модификатор (116) понижающего микширования для модификации переданного сигнала понижающего микширования с использованием функции модификации понижающего микширования; средство (118) рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных для получения выходных сигналов; модификатор (120) выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала. 3 н. и 12 з.п. ф-лы, 9 ил.

Description

Настоящее изобретение относится к кодированию аудиообъектов и, в частности, к кодированию аудиообъектов с использованием сигнала понижающего микширования после мастеринга в качестве транспортного канала.
Недавно были предложены параметрические методы эффективной в отношении битовой скорости передачи/хранения аудиосцен, содержащих множество аудиообъектов, в области аудиокодирования [BCC, JSC, SAOC, SAOC1, SAOC2] и разделения информационных источников [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6]. Эти методы предназначены для реконструкции нужной выходной аудиосцены или объекта источника аудиосигнала на основании дополнительной вспомогательной информации, описывающей переданную/сохраненную аудиосцену и/или объекты источника в аудиосцене. Эта реконструкция происходит на декодере с использованием схемы параметрического разделения информационных источников.
Здесь, в основном, делается упор на операцию пространственного кодирования аудиообъектов (SAOC) [SAOC] MPEG, но те же принципы также справедливы для других систем. Основные операции системы SAOC представлены на фиг. 5. Без потери общности, для улучшения удобочитаемости уравнений, для всех введенных переменных индексы, обозначающие зависимость от времени и частоты, опущены в этом документе, если не указано обратное. Система принимает N входных аудиообъектов
Figure 00000001
и инструкции, как следует микшировать эти объекты, например, в форме матрицы D понижающего микширования. Входные объекты можно представить в виде матрицы S размером
Figure 00000002
. Кодер извлекает параметрическую и, возможно, также вспомогательную информацию на основе формы волны, описывающую объекты. В SAOC вспомогательная информация состоит, в основном, из информации относительной энергии объекта, параметризованной разностями на уровне объектов (OLD) и из информации корреляций между объектами, параметризованными межобъектными корреляциями (IOC). Необязательная вспомогательная информация на основе формы волны в SAOC описывает ошибку реконструкции параметрической модели. Помимо извлечения этой вспомогательной информации, кодер обеспечивает сигнал понижающего микширования
Figure 00000003
с M каналами, созданными с использованием информации в матрице понижающего микширования D размером
Figure 00000004
. Сигналы понижающего микширования можно представить в виде матрицы X размером
Figure 00000005
со следующим соотношением с входными объектами:
Figure 00000006
. Обычно выполняется соотношение
Figure 00000007
, но это не является строгим требованием. Сигналы понижающего микширования и вспомогательная информация передаются или сохраняются, например, с помощью аудиокодека, например MPEG-2/4 AAC. Декодер SAOC принимает сигналы понижающего микширования и вспомогательную информацию, и дополнительная информация рендеринга, часто в форме матрицы M рендеринга размером
Figure 00000008
, описывающей, как выводить
Figure 00000009
с K каналами, относится к исходным входным объектам.
Основные операционные блоки декодера SAOC изображены на фиг. 6 и будут кратко рассмотрены ниже. Сначала вспомогательная информация декодируется и надлежащим образом интерпретируется. Блок разделения (виртуальных) объектов использует вспомогательную информацию и пытается (виртуально) реконструировать входные аудиообъекты. Операция именуется “виртуальной”, поскольку обычно не требуется в явном виде реконструировать объекты, но следующий этап рендеринга может объединяться с этим этапом. Реконструкции (виртуальных) объектов
Figure 00000010
все же могут содержать ошибки реконструкции. Реконструкции (виртуальных) объектов можно представить в виде матрицы
Figure 00000011
размером
Figure 00000012
. Система принимает информацию рендеринга извне, например, из взаимодействия с пользователем. В контексте SAOC, информация рендеринга описана как матрица M рендеринга, задающая, как следует объединять реконструкции
Figure 00000013
объектов для создания выходных сигналов
Figure 00000014
. Выходные сигналы можно представить в виде матрицы Y размером
Figure 00000015
, которая является результатом применения матрицы M рендеринга к реконструированным объектам
Figure 00000016
в виде
Figure 00000017
.
Разделение (виртуальных) объектов в SAOC действует, в основном, с использованием параметрической вспомогательной информации для определения коэффициентов без микширования, которые затем будут применяться к сигналам понижающего микширования для получения реконструкций (виртуальных) объектов. Заметим, что полученное таким образом воспринимаемое качество может быть недостаточно для некоторых применений. По этой причине SAOC обеспечивает также режим улучшенного качества для до четырех исходных входных аудиообъектов. Эти объекты, именуемые расширенными аудиообъектами (EAO), связаны с сигналами коррекции во временной области, минимизирующими разность между реконструкциями (виртуальных) объектов и исходными входными аудиообъектами. EAO можно реконструировать с помощью очень малых разностей формы волны от исходного входного аудиообъекта.
Одно основное свойство системы SAOC состоит в том, что сигналы понижающего микширования
Figure 00000003
могут быть построены таким образом, что их можно слушать, и они образуют семантически значимую аудиосцену. Это позволяет пользователям без приемника, способного декодировать информацию SAOC, все же наследоваться основным аудиоконтентом без возможных улучшений SAOC. Например, будет возможно применять вышеописанную систему SAOC с радио или телевизионным вещанием с обратной совместимостью. Было бы практически невозможно обменять все приемники, установленные только для добавления некоторых несущественных функциональных возможностей. Вспомогательная информация SAOC обычно является довольно компактной, и ее можно включать в транспортный поток сигнала понижающего микширования. Традиционные приемники просто игнорируют вспомогательную информацию SAOC и выводят сигналы понижающего микширования, и приемники, включающие в себя декодер SAOC, может декодировать вспомогательную информацию и обеспечивать некоторые дополнительные функциональные возможности.
Однако, в особенности, в случае широковещательного использования, сигнал понижающего микширования, созданный кодером SAOC, будет дополнительно подвергаться последующей обработке широковещательной станцией по эстетическим или техническим соображениям до передачи. Возможно, что звукооператор захочет отрегулировать аудиосцену в соответствии со своим художественным видением, или сигнал нужно манипулировать для согласования со звуковым изображением товарного знака вещателя, или сигнал следует манипулировать для согласования с некоторыми техническими правилами, например, рекомендациями и правилами, касающимися громкости аудиосигнала. При манипулировании сигнала понижающего микширования, блок-схема операций над сигналом, показанная на фиг. 5, меняется на показанную на фиг. 7. Здесь предполагается, что исходная манипуляция понижающего микширования мастеринга сигнала понижающего микширования применяет некоторую функцию
Figure 00000018
к каждому из сигналов
Figure 00000019
понижающего микширования, получая манипулированные сигналы
Figure 00000020
понижающего микширования. Также возможно, что фактически передаваемые сигналы понижающего микширования не происходят из сигналов, созданных кодером SAOC, но целиком обеспечиваются извне, но эта ситуация включена в рассмотрение, поскольку также является манипуляцией созданного кодером сигнала понижающего микширования.
Манипуляция сигналов понижающего микширования может создавать проблемы на декодере SAOC при разделении (виртуальных) объектов, поскольку сигналам понижающего микширования на декодере больше не обязательно совпадать с моделью, передаваемой через вспомогательную информацию. В особенности, когда вспомогательная информация формы волны ошибки предсказания передается для EAO, она очень чувствительна к изменениям формы волны в сигналах понижающего микширования.
Следует отметить, что MPEG SAOC [SAOC] задан для максимального из двух сигналов понижающего микширования и одного или двух выходных сигналов, т.е.,
Figure 00000021
. Однако размеры распространены здесь на общий случай, поскольку это распространение довольно очевидно и помогает описанию.
В [PDG, SAOC] было предложено маршрутизировать манипулированные сигналы понижающего микширования также на кодер SAOC, извлекать некоторую дополнительную вспомогательную информацию и использовать эту вспомогательную информацию на декодере для снижения разностей между сигналами понижающего микширования, отвечающими модели микширования SAOC, и манипулированными сигналами понижающего микширования, доступными на декодере. Основная идея маршрутизации представлена на фиг. 8А с дополнительным соединением обратной связи от манипуляции понижающего микширования на кодер SAOC. Современный стандарт MPEG для SAOC [SAOC] включает в себя части предложения [PDG], в основном, фокусируясь на параметрической компенсации. Оценивание параметров компенсации здесь не описано, но читателю предлагается обратиться к информативному приложению D.8 стандарта MPEG SAOC [SAOC].
Вспомогательная информация коррекции упаковывается в поток вспомогательной информации и передается и/или сохраняется поблизости. Декодер SAOC декодирует вспомогательную информацию и использует вспомогательную информацию модификации понижающего микширования для компенсации манипуляций до основной обработки SAOC. Это представлено на фиг. 8В. Стандарт MPEG SAOC задает, что вспомогательная информация компенсации состоит из коэффициентов усиления для каждого сигнала понижающего микширования. Они обозначаются как
Figure 00000022
, где
Figure 00000023
– индекс сигнала понижающего микширования. Отдельные параметры сигнала можно собирать в матрицу
Figure 00000024
. Когда манипулированные сигналы понижающего микширования обозначаются как матрица
Figure 00000025
, скомпенсированные сигналы понижающего микширования, подлежащие использованию в основной обработке SAOC можно получить согласно
Figure 00000026
.
В [PDG] также предложено включать остаточные сигналы формы волны, описывающие разность между параметрически скомпенсированными манипулированными сигналами понижающего микширования и сигналами понижающего микширования, созданными кодером SAOC. Однако это не является частью стандарта MPEG SAOC [SAOC].
Преимущество компенсации состоит в том, что сигналы понижающего микширования, принятые блоком разделения (виртуальных) объектов SAOC, ближе к сигналам понижающего микширования, созданным кодером SAOC и лучше совпадают с переданной вспомогательной информацией. Часто это приводит к снижению артефактов в реконструкциях (виртуальных) объектов.
Сигналы понижающего микширования, используемые разделением (виртуальных) объектов, аппроксимируют неманипулированные сигналы понижающего микширования, созданные на кодере SAOC. В результате, выходной сигнал после рендеринга будет аппроксимировать результат, который был бы получен путем применения, часто заданных пользователем, инструкций рендеринга на исходных входных аудиообъектах. Если задано, что информация рендеринга должна быть идентична или очень близка к информации понижающего микширования, другими словами,
Figure 00000027
выходные сигналы будут напоминать созданные кодером сигналы понижающего микширования:
Figure 00000028
. Помня, что манипуляция сигнала понижающего микширования может осуществляться по веским причинам, может быть желательно, чтобы выходной сигнал напоминал манипулированный сигнал понижающего микширования, вместо
Figure 00000029
.
Проиллюстрируем это на более конкретном примере возможного применения улучшения диалога в широковещательной передаче.
Исходные входные аудиообъекты S состоят из (возможно, многоканального) сигнала заднего плана, например, шума публики и окружения в спортивной широковещательной передаче, и (возможно, многоканального) сигнала переднего плана, например, комментатора.
Сигнал X понижающего микширования содержит смесь заднего плана и переднего плана.
Сигнал понижающего микширования манипулируется согласно f(X), состоящей, в случае реального мира, например, из многополосного эквалайзера, компрессора динамического диапазона, и лимитера (любая производимая здесь манипуляция в дальнейшем именуется “мастерингом”).
На декодере, информация рендеринга аналогична информации понижающего микширования. Единственное отличие состоит в том, что баланс относительного уровня между сигналами заднего плана и переднего плана может регулироваться конечным пользователем. Другими словами, пользователь может ослаблять шум публики, чтобы голос комментатора был лучше слышен, например, для повышения разборчивости. В качестве противоположного примера, конечный пользователь может ослаблять голос комментатора, чтобы можно было сосредоточиться на акустической сцене мероприятия.
Если компенсация манипуляции понижающего микширования не используется, реконструкции (виртуальных) объектов могут содержать артефакты, обусловленные различиями между реальными свойствами принятых сигналов понижающего микширования и свойствами, переданными в качестве вспомогательной информации.
Если компенсация манипуляции понижающего микширования используется, мастеринг будет удален из выходного сигнала. Даже в случае, когда конечный пользователь не модифицирует баланс микширования, сигнал понижающего микширования по умолчанию (т.е. выходной сигнал приемников, не способных декодировать вспомогательную информацию SAOC) и выходной сигнал после рендеринга будут отличаться, возможно, весьма значительно.
В конце, вещатель получают следующие близкие к оптимальным возможности:
принимать артефакты SAOC из рассогласования между сигналами понижающего микширования и вспомогательной информацией;
не включать в себя никакие передовые функциональные возможности улучшения диалога; и/или
терять изменения мастеринга выходного сигнала.
Задачей настоящего изобретения является обеспечение усовершенствованного принципа декодирования кодированного аудиосигнала.
Эта задача решается посредством устройства для декодирования кодированного аудиосигнала по п. 1, способа декодирования кодированного аудиосигнала по п. 14 или компьютерной программы по п. 15.
В основе настоящего изобретения лежит тот факт, что усовершенствованный принцип рендеринга с использованием сигналов кодированных аудиообъектов получается, когда манипуляции понижающего микширования, примененные на этапе мастеринга не просто отвергаются для улучшения разделения объектов, но повторно применяются к выходным сигналам, генерируемым на этапе рендеринга. Таким образом, гарантируется, что никакие художественные или другие манипуляции понижающего микширования нельзя просто потерять в случае сигналов, кодированных аудиообъектами, но можно найти в окончательном результате операции декодирования. Для этого, устройство для декодирования кодированного аудиосигнала содержит входной интерфейс, последовательно подключенный модификатор понижающего микширования для модификации переданного сигнала понижающего микширования с использованием функции модификации понижающего микширования, средство рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных и окончательный модификатор выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала, где модификация происходит таким образом, что модификация посредством функции модификации понижающего микширования, по меньшей мере, частично обращается или, другими словами, манипуляция понижающего микширования восстанавливается, но повторно применяется не к сигналу понижающего микширования, а к выходным сигналам средства рендеринга объектов. Другими словами, функция модификации выходного сигнала, предпочтительно, обратна модификации сигнала понижающего микширования, или, по меньшей мере, частично обратна функции модификации сигнала понижающего микширования. Другими словами, функция модификации выходного сигнала такова, что операция манипуляции, применяемая к исходному сигналу понижающего микширования для получения переданного сигнала понижающего микширования, по меньшей мере, частично применяется к выходному сигналу, и, предпочтительно, применяется идентичная операция.
В предпочтительных вариантах осуществления настоящего изобретения, обе функции модификации отличаются друг от друга и, по меньшей мере, частично обратны друг другу. В дополнительном варианте осуществления, функция модификации понижающего микширования и функция модификации выходного сигнала содержат соответствующие коэффициенты усиления для разных временных кадров или полос частот, и либо коэффициенты усиления модификации понижающего микширования, либо коэффициенты усиления модификации выходного сигнала выводятся друг из друга. Таким образом, либо коэффициенты усиления модификации сигнала понижающего микширования, либо коэффициенты усиления модификации выходного сигнала могут передаваться, и тогда декодер способен выводить другие коэффициенты из переданных, обычно путем их инвертирования.
Дополнительные варианты осуществления предусматривают наличие информации модификации понижающего микширования в передаваемом сигнале в качестве вспомогательной информации, и декодер извлекает вспомогательную информацию, осуществляет модификацию понижающего микширования с одной стороны, вычисляет обратную или, по меньшей мере, частично или приблизительно обратную функцию и применяет эту функцию к выходным сигналам из средства рендеринга объектов.
Дополнительные варианты осуществления содержат передачу информации управления для избирательной активации/деактивации модификатора выходного сигнала, чтобы гарантировать, что эта модификация выходного сигнала осуществляется только когда она обусловлена художественными соображениями, тогда как модификация выходного сигнала, например, не осуществляется, когда она обусловлена чисто техническими соображениями, например манипуляцией, сигнала для получения более высоких характеристик передачи для определенных форматов передачи/ способов модуляции.
Дополнительные варианты осуществления относятся к кодированному сигналу, в котором сигнал понижающего микширования манипулирован путем осуществления операции оптимизации громкости, эквализации, многополосной эквализации, компрессии динамического диапазона или лимитирования, и в этом случае модификатор выходного сигнала выполнен с возможностью повторного применения операции эквализации, операции оптимизации громкости, операции многополосной эквализации, операции компрессии динамического диапазона или операции лимитирования к выходным сигналам.
Дополнительные варианты осуществления содержат средство рендеринга объектов, которое генерирует выходные сигналы на основании переданной параметрической информации и на основании информации положения, относящейся к размещению аудиообъектов на установке воспроизведения. Генерация выходных сигналов может осуществляться либо путем воссоздания сигналов отдельных объектов и затем, в необязательном порядке, модификации воссозданных сигналов объектов и затем распределения модифицированных, в необязательном порядке, реконструированных объектов по сигналам каналов для громкоговорителей согласно любого рода общеизвестному принципу рендеринга, например, амплитудному панорамированию на векторной основе и т.п. Другие варианты осуществления не опираются на явную реконструкцию виртуальных объектов, но осуществляют непосредственную обработку из модифицированного сигнала понижающего микширования в сигналы громкоговорителей без явного вычисления реконструированных объектов, поскольку оно известно в технике пространственного аудиокодирования, например, MPEG-Surround или MPEG-SAOC.
В дополнительных вариантах осуществления, входной сигнал содержит нормальные аудиообъекты и расширенные аудиообъекты, и средство рендеринга объектов выполнено с возможностью реконструкции аудиообъектов или непосредственной генерации выходных каналов с использованием нормальных аудиообъектов и расширенных аудиообъектов.
Затем, предпочтительные варианты осуществления настоящего изобретения описаны со ссылкой на прилагаемые чертежи, в которых:
фиг. 1 – блок-схема варианта осуществления аудиодекодера;
фиг. 2 – дополнительный вариант осуществления аудиодекодера;
фиг. 3 демонстрирует способ вывода функции модификации выходного сигнала из функции модификации сигнала понижающего микширования;
фиг. 4 демонстрирует процесс вычисления коэффициентов усиления модификации выходного сигнала из интерполированных коэффициентов усиления модификации понижающего микширования;
фиг. 5 демонстрирует основную блок-схему работы системы SAOC;
фиг. 6 демонстрирует блок-схему работы декодера SAOC;
фиг. 7 демонстрирует блок-схему работы системы SAOC, включающей в себя манипуляцию сигнала понижающего микширования;
фиг. 8А демонстрирует блок-схему работы системы SAOC, включающей в себя манипуляцию сигнала понижающего микширования; и
фиг. 8В демонстрирует блок-схему работы декодера SAOC, включающего в себя компенсацию манипуляции сигнала понижающего микширования до основной обработки SAOC.
Фиг. 1 демонстрирует устройство для декодирования кодированного аудиосигнала 100 для получения модифицированных выходных сигналов 160. Устройство содержит входной интерфейс 110 для приема переданного сигнала понижающего микширования и параметрических данных, относящихся к двум аудиообъектам, включенным в переданный сигнал понижающего микширования. Входной интерфейс извлекает переданный сигнал 112 понижающего микширования и параметрические данные 114 из кодированного аудиосигнала 100. В частности, сигнал 112 понижающего микширования, т.е. переданный сигнал понижающего микширования, отличается от сигнала понижающего микширования кодера, с которым связаны параметрические данные 114. Кроме того, устройство содержит модификатор 116 понижающего микширования для модификации переданного сигнала 112 понижающего микширования с использованием функции модификации понижающего микширования. Модификация понижающего микширования осуществляется таким образом, что модифицированный сигнал понижающего микширования идентичен сигналу понижающего микширования кодера или, по меньшей мере, более аналогичен сигналу понижающего микширования кодера по сравнению с переданным сигналом понижающего микширования. Предпочтительно, модифицированный сигнал понижающего микширования на выходе блока 116 идентичен сигналу понижающего микширования кодера, с которым связаны параметрические данные. Однако модификатор 116 понижающего микширования также может быть выполнен с возможностью не полностью обращать манипуляцию сигнала понижающего микширования кодера, но лишь частично удалять эту манипуляцию. Таким образом, модифицированный сигнал понижающего микширования, по меньшей мере, более аналогичен сигналу понижающего микширования кодера, чем переданный сигнал понижающего микширования. Сходство можно измерять, например, путем вычисления квадратичного расстояния между отдельными выборками либо во временной области, либо в частотной области, где разности формируются выборка за выборкой, например, между соответствующими кадрами и/или полосами модифицированного сигнала понижающего микширования и сигнала понижающего микширования кодера. Затем эта квадратичная мера расстояния, т.е., сумма по всем квадратам разностей, меньше соответствующей суммы квадратов разностей между переданным сигналом 112 понижающего микширования (сгенерированным блоком манипуляции понижающего микширования на фиг. 7 или 8a) и сигналом понижающего микширования кодера (генерируемым на блоке кодера SAOC на фиг. 5, 6, 7 8А.
Таким образом, модификатор 116 понижающего микширования может быть сконфигурирован аналогично блоку модификации понижающего микширования, рассмотренному в контексте фиг. 8В.
Кроме того, устройство на фиг. 1 содержит средство 118 рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и данных 114 параметров для получения выходных сигналов. Кроме того, важно, что устройство содержит модификатор 120 выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала. Предпочтительно, модификация выходного сигнала осуществляется таким образом, что модификация, применяемая модификатором 116 понижающего микширования, по меньшей мере, частично обращается. В других вариантах осуществления, функция модификации выходного сигнала обращается или, по меньшей мере, частично обращается в функцию модификации сигнала понижающего микширования. Таким образом, модификатор выходного сигнала выполнен с возможностью модификации выходных сигналов с использованием функции модификации выходного сигнала, таким образом, что операция манипуляции, применяемая к сигналу понижающего микширования кодера для получения переданного сигнала понижающего микширования, по меньшей мере, частично применяется к выходному сигналу и, предпочтительно, полностью применяется к выходным сигналам.
Согласно варианту осуществления, модификатор 116 понижающего микширования и модификатор 120 выходного сигнала выполнены таким образом, что функция модификации выходного сигнала отличается от функции модификации понижающего микширования и, по меньшей мере, частично обращена относительно функции модификации понижающего микширования.
Кроме того, вариант осуществления модификатора понижающего микширования содержит функцию модификации понижающего микширования, содержащую применение коэффициентов усиления модификации понижающего микширования к разным временным кадрам или полосам частот переданного сигнала 112 понижающего микширования. Кроме того, функция модификации выходного сигнала содержит применение коэффициентов усиления модификации выходного сигнала к разным временным кадрам или полосам частот выходных сигналов. Кроме того, коэффициенты усиления модификации выходного сигнала выводятся из обратных значений функции модификации сигнала понижающего микширования. Этот сценарий применяется, когда коэффициенты усиления модификации сигнала понижающего микширования доступны, например, посредством отдельного ввода на стороне декодера или доступны, поскольку они были переданы в кодированном аудиосигнале 100. Однако альтернативные варианты осуществления также содержат ситуацию, когда коэффициенты усиления модификации выходного сигнала, используемые модификатором 120 выходного сигнала, передаются или вводятся пользователем, и в этом случае модификатор 116 понижающего микширования выполнен с возможностью вывода коэффициентов усиления модификации сигнала понижающего микширования из доступных коэффициентов усиления модификации выходного сигнала.
В дополнительном варианте осуществления, входной интерфейс 110 выполнен с возможностью дополнительно принимать информацию о функции модификации понижающего микширования и эта информация 115 модификации извлекается входным интерфейсом 110 из кодированного аудиосигнала и поступает на модификатор 116 понижающего микширования и модификатор 120 выходного сигнала. Опять же, функция модификации понижающего микширования может содержать коэффициенты усиления модификации сигнала понижающего микширования или коэффициенты усиления модификации выходного сигнала и затем, в зависимости от того, какой набор коэффициентов усиления доступен, соответствующий элемент 116 или 120 выводит свои коэффициенты усиления из доступных данных.
В дополнительном варианте осуществления, осуществляется интерполяция коэффициентов усиления модификации сигнала понижающего микширования или коэффициентов усиления модификации выходного сигнала. Альтернативно или дополнительно, сглаживание также осуществляется таким образом, что ситуации, в которых эти данные передачи изменяются слишком быстро, не привносят никаких артефактов.
Согласно варианту осуществления, модификатор 120 выходного сигнала выполнен с возможностью вывода своих коэффициентов усиления модификации выходного сигнала путем инвертирования коэффициентов усиления модификации понижающего микширования. Затем, во избежание численных проблем, используется либо максимальный из инвертированного коэффициента усиления модификации понижающего микширования и постоянного значения, либо сумма инвертированного коэффициента усиления модификации понижающего микширования и того же или другого постоянного значения. Таким образом, функция модификации выходного сигнала не обязательно является обратной функции модификации сигнала понижающего микширования, но является, по меньшей мере, частично обратной.
Кроме того, модификатор 120 выходного сигнала управляется сигналом управления, указанным позицией 117 как флаг управления. Таким образом, существует возможность, что модификатор 120 выходного сигнала избирательно активируется или деактивируется для определенных полос частот и/или временных кадров. Согласно варианту осуществления, флаг является просто 1-битовым флагом, и когда сигнал управления таков, что модификатор выходного сигнала деактивируется, то это сигнализируется, например, состоянием "нуль" флага, и затем сигнал управления таков, что модификатор выходного сигнала активируется, то это сигнализируется, например, состоянием "единица" или состоянием "установлен" флага. Естественно, правило управления может быть обратным.
В дополнительном варианте осуществления, модификатор 116 понижающего микширования выполнен с возможностью снижения или отмены операции оптимизации громкости или эквализации или многополосной эквализации или компрессии динамического диапазона или лимитирования, применяемой к передаваемому каналу понижающего микширования. Другими словами, эти операции обычно применяются на стороне кодера блоком манипуляции понижающего микширования, показанным на фиг. 7, или блоком манипуляции понижающего микширования, показанным на фиг. 8А, для вывода переданного сигнала понижающего микширования из сигнала понижающего микширования кодера, генерируемого, например, блоком кодера SAOC, показанного на фиг. 5, кодера SAOC, показанного на фиг. 7, или кодера SAOC, показанного на фиг. 8А.
В этом случае, модификатор 120 выходного сигнала выполнен с возможностью повторного применения операция оптимизации громкости или эквализации или многополосной эквализации или компрессии динамического диапазона или лимитирования к выходным сигналам, генерируемым средством 118 рендеринга объектов для окончательного получения модифицированных выходных сигналов 160.
Кроме того, средство 118 рендеринга объектов может быть выполнено с возможностью вычисления выходных сигналов как сигналов каналов для громкоговорителей схемы воспроизведения из модифицированного сигнала понижающего микширования, параметрических данных 114 и информации 121 положения, которые могут, например, вводиться в средство 118 рендеринга объектов через интерфейс 122 пользовательского ввода или которые могут, дополнительно, передаваться от кодера на декодер по отдельности или в кодированном сигнале 100, например, как “матрица рендеринга”.
В этом случае, модификатор 120 выходного сигнала выполнен с возможностью применения функции модификации выходного сигнала к этим сигналам каналов для громкоговорителей, и затем модифицированные выходные сигналы 116 могут непосредственно ретранслироваться на громкоговорители.
В другом варианте осуществления, средство рендеринга объектов выполнено с возможностью осуществления двухэтапной обработки, т.е., чтобы, прежде всего, реконструировать отдельные объекты и затем распределять сигналы объектов по соответствующим сигналам громкоговорителей любым из общеизвестных средств, например, амплитудным панорамированием на векторной основе и т.п. Затем выходной сигнал 120 также может быть сконфигурирован для применения модификации выходного сигнала к сигналам реконструированных объектов до осуществления распределения на отдельные громкоговорители. Таким образом, выходные сигналы, генерируемые средством 118 рендеринга объектов на фиг. 1, могут быть либо сигналами реконструированных объектов, либо сразу (немодулированными) сигналами громкоговорителей каналов.
Кроме того, интерфейс 110 входного сигнала выполнен с возможностью приема расширенного аудиообъекта и нормальных аудиообъектов, например, известных из SAOC. В частности, расширенный аудиообъект является, как известно в технике, разностью форм волны между исходным объектом и реконструированной версией этого объекта с использованием параметрических данных, например, параметрических данных 114. Это допускает, что отдельные объекты, например, четыре объекта в наборе из, например, двадцати объектов и т.п. могут передаваться очень хорошо, естественно, ценой дополнительной битовой скорости вследствие необходимой информации для расширенного аудиосигнала. Затем средство 118 рендеринга объектов выполнено с возможностью использования нормальных объектов и расширенного аудиообъекта для вычисления выходных сигналов.
В дополнительном варианте осуществления средство рендеринга объектов выполнено с возможностью приема пользовательского ввода 123 для манипулирования одним или более объектами, например, для манипулирования объектом переднего плана FGO или объектом заднего плана BGO или обоими, и затем средство 118 рендеринга объектов выполнено с возможностью манипулирования одним или более объектами, определенными пользовательским вводом при осуществлении рендеринга выходных сигналов. В этом варианте осуществления, предпочтительно фактически реконструировать сигналы объектов и затем манипулировать сигналом объект переднего плана или ослаблять сигнал объекта заднего плана и затем происходит распределение по каналам, и затем сигналы каналов модифицируются. Однако, альтернативно, выходные сигналы уже могут быть сигналами отдельных объектов, и распределение сигналов объектов после осуществления модификации блоком 120 происходит до распределения сигналов объектов по сигналам отдельных каналов с использованием информации 121 положения и любого общеизвестного процесса для генерации сигналов громкоговорителей каналов из сигналов объектов, например амплитудного панорамирования на векторной основе.
Затем на фиг. 2 описан предпочтительный вариант осуществления устройства для декодирования кодированного аудиосигнала. Принимается кодированная вспомогательная информация, которая содержит, например, параметрические данные 114, показанные на фиг. 1, и информацию 115 модификации. Кроме того, принимаются модифицированные сигналы понижающего микширования которые соответствуют переданному сигналу 112 понижающего микширования. Из фиг. 2 можно видеть, что переданный сигнал понижающего микширования может быть единичным каналом или несколькими каналами, например M каналами, где M – целое число. Вариант осуществления, представленный на фиг. 2, содержит декодер 111 вспомогательной информации для декодирования вспомогательной информации в случае, когда кодируется вспомогательная информация. Затем декодированная вспомогательная информация ретранслируется на блок модификации понижающего микширования, соответствующий модификатору 116 понижающего микширования, показанному на фиг. 1. Затем скомпенсированные сигналы понижающего микширования ретранслируются на средство 118 рендеринга объектов, который состоит, в варианте осуществления, показанном на фиг. 2, из блока 118a разделения (виртуальных) объектов и блока 118b средства рендеринга, который принимает информацию M рендеринга, соответствующую информации 121 положения для объектов, показанной на фиг. 1. Кроме того, средство 118b рендеринга генерирует выходные сигналы или, как они называются на фиг. 2, промежуточные выходные сигналы, и блок 120 восстановления модификации понижающего микширования соответствует модификатору 120 выходного сигнала на фиг. 1. Окончательные выходные сигналы, генерируемые блоком 160 восстановления модификации понижающего микширования, соответствуют модифицированным выходным сигналам применительно к фиг. 1.
Предпочтительные варианты осуществления используют ранее включенную вспомогательную информацию модификации понижающего микширования и процесс, обратный модификации, после рендеринга выходных сигналов. Это представлено в виде блок-схемы на фиг. 2. Сравнивая ее с фиг. 8В, можно заметить, что добавление блока “восстановление модификации понижающего микширования” на фиг. 2 или модификатора выходного сигнала на фиг. 1 реализует этот вариант осуществления.
Созданный кодером сигнал X понижающего микширования манипулируется (или манипуляцию можно аппроксимировать) функцией f(X). Кодер включает информацию, касающуюся этой функции, во вспомогательную информацию, подлежащую передаче и/или сохранению. Декодер принимает вспомогательную информацию и инвертирует ее для получения функции модификации или компенсации. (В MPEG SAOC кодер осуществляет инверсию и передает инвертированные значения.) Декодер применяет функцию компенсации к принятым сигналам понижающего микширования
Figure 00000030
и получает скомпенсированные сигналы понижающего микширования, подлежащие использованию при разделении (виртуальных) объектов. На основании информации M рендеринга (от пользователя), выходная сцена реконструируется из реконструкций
Figure 00000031
(виртуальных) объектов согласно
Figure 00000032
. Можно включать дополнительные этапы обработки, например, модификацию ковариационных свойств выходных сигналов с помощью декорреляторов. Однако такая обработка не изменяет тот факт, что целью этапа рендеринга является получение выходного сигнала, который аппроксимирует результат применения процесса рендеринга к исходным входным аудиообъектам, т.е.
Figure 00000033
. Добавление предложено для применения функции, обратной функции компенсации
Figure 00000034
к выходному сигналу после рендеринга для получения окончательных выходных сигналов
Figure 00000035
, что позволяет аппроксимировать функцию
Figure 00000036
манипуляции понижающего микширования.
На фиг. 3 представлен предпочтительный вариант осуществления для вычисления функции модификации выходного сигнала из функции модификации сигнала понижающего микширования, и, в частности, в ситуации, когда обе функции представлены соответствующими коэффициентами усиления для полос частот и/или временных кадров.
Вспомогательная информация, касающаяся модификации сигнала понижающего микширования в системе SAOC [SAOC], ограничивается коэффициентами усиления для каждого сигнала понижающего микширования, что описано ранее. Другими словами, в SAOC, инвертированная функция компенсации передается, и скомпенсированные сигналы понижающего микширования можно получить, как проиллюстрировано в первом уравнении, показанном на фиг. 3.
Используя это определение для функции
Figure 00000037
компенсации, можно задать функцию, обратную функции компенсации, как
Figure 00000038
. В случае вышеприведенного определения
Figure 00000039
, это можно выразить вторым уравнением на фиг. 3. Если один или более параметров
Figure 00000040
компенсации могут быть равны нулю, нужно принять некоторые превентивные меры во избежание арифметический проблем. Для этого, например, можно прибавлять малую постоянную
Figure 00000041
(например,
Figure 00000042
) к каждой (неотрицательной) величине, как показано в третьем уравнении, представленном на фиг. 3, или использовать максимальную величину из параметра компенсации и малой постоянной, как показано в четвертом уравнении, представленном на фиг. 3. Существуют и другие способы определения значения
Figure 00000043
.
Что касается переноса информации, необходимой для повторного применения манипуляции понижающего микширования к выходному сигналу после рендеринга, никакой дополнительной информации не требуется, если параметры компенсации (в MPEG SAOC это PDG) уже переданы. Что касается добавления функциональных возможностей, можно также добавлять сигнализацию в битовый поток, если нужно применять восстановление манипуляции понижающего микширования. В контексте MPEG SAOC это можно осуществлять посредством следующего синтаксиса битового потока:
Figure 00000044
Когда переменная 117 bsPdgInvFlag битового потока принимает значение 0 или опущена, и переменная bsPdgFlag битового потока принимает значение 1, декодер действует, как указано в стандарте MPEG [SAOC], т.е. компенсация применяется к сигналам понижающего микширования, принятым декодером, до разделения (виртуальных) объектов. Когда переменная bsPdgInvFlag битового потока принимает значение 1, сигналы понижающего микширования обрабатываются как раньше, и выходной сигнал после рендеринга будет обрабатываться предложенным способом, путем аппроксимации манипуляции понижающего микширования.
На фиг. 4 представлен предпочтительный вариант осуществления для использования интерполированных коэффициентов усиления модификации понижающего микширования, которые также указаны как “PDG” на фиг. 4 и в этом описании изобретения. Первый этап содержит обеспечение текущих и будущих или предыдущих и текущих значения PDG, например, значения PDG текущего момента времени и значение PDG следующего (будущего) момента времени, указанного позицией 40. На этапе 42, интерполированные значения PDG вычисляются и используются в модификаторе 116 понижающего микширования. Затем, на этапе 44, коэффициенты усиления модификации выходного сигнала выводятся из интерполированных коэффициентов усиления, генерируемых блоком 42, и затем вычисленные коэффициенты усиления модификации выходного сигнала используются в модификаторе 120 выходного сигнала. Таким образом, очевидно, что в зависимости от того, какие коэффициенты модификации сигнала понижающего микширования рассматриваются, коэффициенты усиления модификации выходного сигнала не полностью обратны переданным коэффициентам, но являются только частично или полностью обратными интерполированным коэффициентам усиления.
Обработка PDG задана в стандарте MPEG SAOC [SAOC] для осуществления в параметрических кадрах. Это означает, что умножение компенсации происходит в каждом кадре с использованием постоянных значений параметров. В случае, когда значения параметров значительно изменяются между последовательными кадрами, это может приводить к нежелательным артефактам. Таким образом, желательно включать сглаживание параметров до применения их к сигналам. Сглаживание может осуществляться различными способами, например, низкочастотной фильтрацией значений параметров в зависимости от времени, или интерполированием значений параметров между последовательными кадрами. Предпочтительный вариант осуществления включает в себя линейную интерполяцию между кадрами параметров. Пусть
Figure 00000045
– значение параметра для i-го сигнала понижающего микширования в момент времени n, и
Figure 00000046
– значение параметра для того же канала понижающего микширования в момент времени n+J. Интерполированные значения параметров в моменты времени
Figure 00000047
можно получить из уравнения
Figure 00000048
. Когда используется такая интерполяция, инвертированные значения для восстановления модификации понижающего микширования следует получать из интерполированных значений, т.е. вычисляя матрицу
Figure 00000049
для каждого промежуточного момента времени и затем инвертируя каждый из них для получения
Figure 00000050
, которую можно применять к промежуточному выходному сигналу Y.
Варианты осуществления решают проблему, которая возникает, когда манипуляции применяются к сигналам понижающего микширования SAOC. Традиционные подходы будут либо обеспечивать близкое к оптимальному воспринимаемое качество в отношении разделения объектов, если не осуществляется компенсация мастеринга, или будут терять преимущества мастеринга в случае компенсации мастеринга. Это в особенности проблематично, если результат мастеринга представляет что-то, что было бы полезно сохранять в окончательном выходном сигнале, например, оптимизации громкости, эквализацию, и т.д. Основные преимущества предложенного способа включают в себя, но без ограничения:
Базовая обработка SAOC, т.е. разделение (виртуальных) объектов, может осуществляться на сигналах понижающего микширования, которые аппроксимируют исходные созданные кодером сигналы понижающего микширования точнее, чем сигналы понижающего микширования, принятые декодером. Это минимизирует артефакты обработки SAOC.
Манипуляция понижающего микширования (“результат мастеринга ”) остается в окончательном выходном сигнале, по меньшей мере, в приближенной форме. Когда информация рендеринга идентична информации понижающего микширования, окончательный выходной сигнал будет аппроксимировать сигналы понижающего микширования по умолчанию очень точно, если не идентично.
Поскольку сигналы понижающего микширования напоминают созданные кодером сигналы понижающего микширования более точно, можно использовать режим повышенного качества для объектов, т.е., включающие в себя сигналы коррекции формы волны для EAO.
Когда используются EAO, и реконструируются близкие приближения исходными входных аудиообъектов, предложенный способ также применяет к ним “результат мастеринга”.
Предложенный способ не требует никакой дополнительной вспомогательной информации, подлежащей передаче, если вспомогательная информация PDG MPEG SAOC уже передана.
При желании, предложенный способ можно реализовать в виде инструмента, который может активироваться или деактивироваться конечным пользователем или вспомогательной информацией, отправленной с кодера.
Предложенный способ требует очень малых вычислительных ресурсов по сравнению с разделением (виртуальных) объектов в SAOC.
Хотя настоящее изобретение описано в контексте блок-схем, где блоки представляют фактические или логические аппаратные компоненты, настоящее изобретение можно также реализовать посредством компьютерно-реализуемого способа. В последнем случае, блоки представляют соответствующие этапы способа, где эти этапы отражают функции, осуществляемые соответствующими логическими или физическими аппаратными блоками.
Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все этапы способа могут выполняться посредством (или с использованием) аппаратного устройства, например, микропроцессора, программируемого компьютера или электронной схемы. В некоторых вариантах осуществления, некоторые один или более из наиболее важных этапов способа может выполняться таким устройством.
В зависимости от определенных требований к реализации, варианты осуществления изобретения можно реализовать аппаратными средствами или программными средствами. Реализация может осуществляться с использованием цифрового носителя данных, например, флоппи-диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, где хранятся электронно считываемое сигналы управления, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой для осуществления соответствующего способа. Таким образом, цифровой носитель данных может быть компьютерно-считываемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронно считываемое сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, благодаря чему осуществляется один из описанных здесь способов.
В общем случае, варианты осуществления настоящего изобретения можно реализовать в виде компьютерного программного продукта с программным кодом, причем программный код предназначен для осуществления одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может храниться, например, на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из описанных здесь способов, хранящуюся на машиночитаемом носителе.
Другими словами, вариант осуществления способа, отвечающего изобретению предусматривает компьютерную программу, имеющую программный код для осуществления одного из описанных здесь способов, когда компьютерная программа выполняется на компьютере.
Таким образом, дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает носитель данных (или нетранзиторный носитель данных, например, цифровой носитель данных, или компьютерно-считываемый носитель), на котором записана компьютерная программа для осуществления одного из описанных здесь способов. Носитель данных, цифровой носитель данных или носитель записи обычно являются вещественным и/или нетранзиторным.
Таким образом, дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов может быть сконфигурирован, например, для переноса через соединение для передачи данных, например через интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для осуществления одного из описанных здесь способов.
Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для осуществления одного из описанных здесь способов.
Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, выполненное/ю с возможностью переноса (например, электронно или оптически) компьютерной программы для осуществления одного из описанных здесь способов на приемник. Приемником может быть, например, компьютер, мобильное устройство, запоминающее устройство и т.п. Например, устройство или система может содержать файловый сервер для переноса компьютерной программы на приемник.
В некоторых вариантах осуществления, программируемое логическое устройство (например, вентильная матрица, программируемая пользователем) может использоваться для осуществления некоторых или всех функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления, вентильная матрица, программируемая пользователем могут взаимодействовать с микропроцессором для осуществления одного из описанных здесь способов. В общем случае, способы, предпочтительно, осуществляются любым аппаратным устройством.
Вышеописанные варианты осуществления призваны иллюстрировать принципы настоящего изобретения. Следует понимать, что специалисты в данной области техники могут предложить модификации и вариации описанных здесь конфигураций и деталей. Поэтому они подлежат ограничению только объемом нижеследующей формулы изобретения, но не конкретными деталями, представленными посредством описания и объяснения рассмотренных здесь вариантов осуществления.
ЛИТЕРАТУРА
[BCC] C. Faller and F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications,” IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003.
[JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120th AES Convention, Paris, 2006.
[ISS1] M. Parvaix and L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010.
[ISS2] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of audio signals with a single sensor”, IEEE Transactions on Audio, Speech and Language Processing, 2010.
[ISS3] A. Liutkus and J. Pinel and R. Badeau and L. Girin and G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011.
[ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011.
[ISS5] S. Zhang and L. Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011.
[ISS6] L. Girin and J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42nd International Conference: Semantic Audio, 2011.
[PDG] J. Seo, S. Beack, K. Kang, J. W. Hong, J. Kim, C. Ahn, K. Kim, and M. Hahn, “Multi-object audio encoding and decoding apparatus supporting post downmix signal”, United States Patent Application Publication US2011/0166867, Jul 2011.
[SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: "From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio", 22nd Regional UK AES Conference, Cambridge, UK, April 2007.
[SAOC2] J. Engdegård, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Hölzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers and W. Oomen: " Spatial Audio Object Coding (SAOC) – The Upcoming MPEG Standard on Parametric Object Based Audio Coding", 124th AES Convention, Amsterdam 2008.
[SAOC] ISO/IEC, “MPEG audio technologies – Part 2: Spatial Audio Object Coding (SAOC),” ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2.

Claims (35)

1. Устройство для декодирования кодированного аудиосигнала (100) для получения модифицированных выходных сигналов (160), содержащее:
входной интерфейс (110) для приема переданного сигнала (112) понижающего микширования и параметрических данных (114), относящихся к аудиообъектам, включенным в переданный сигнал (112) понижающего микширования, причем переданный сигнал понижающего микширования отличается от сигнала понижающего микширования кодера, с которым связаны параметрические данные;
модификатор (116) понижающего микширования для модификации переданного сигнала понижающего микширования с использованием функции модификации понижающего микширования, причем модификация понижающего микширования осуществляется таким образом, что модифицированный сигнал понижающего микширования идентичен сигналу понижающего микширования кодера или более аналогичен сигналу понижающего микширования кодера по сравнению с переданным сигналом (112) понижающего микширования;
средство (118) рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных для получения выходных сигналов; и
модификатор (120) выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала, причем функция модификации выходного сигнала такова, что операция манипуляции, применяемая к сигналу понижающего микширования кодера для получения переданного сигнала (112) понижающего микширования, по меньшей мере, частично применяется к выходным сигналам для получения модифицированных выходных сигналов (160).
2. Устройство по п. 1, в котором модификатор (116) понижающего микширования и модификатор (120) выходного сигнала выполнены таким образом, что функция модификации выходного сигнала отличается от функции модификации сигнала понижающего микширования и обратна функции модификации сигнала понижающего микширования.
3. Устройство по п. 1, в котором функция модификации понижающего микширования содержит применение коэффициентов усиления модификации понижающего микширования к разным временным кадрам или полосам частот переданного сигнала понижающего микширования,
причем функция модификации выходного сигнала содержит применение коэффициентов усиления модификации выходного сигнала к разным временным кадрам или полосам частот выходных сигналов, и
при этом коэффициенты усиления модификации выходного сигнала выводятся из обратных значений коэффициентов усиления модификации понижающего микширования и коэффициенты усиления модификации понижающего микширования выводятся из обратных значений коэффициентов усиления модификации выходного сигнала.
4. Устройство по п. 1,
в котором входной интерфейс (110) выполнен с возможностью дополнительно принимать информацию о функции модификации понижающего микширования, при этом модификатор (116) понижающего микширования выполнен с возможностью использования информации о функции модификации понижающего микширования, причем модификатор (120) выходного сигнала выполнен с возможностью вывода функции модификации выходного сигнала из информации (115) о модификации сигнала понижающего микширования, или
в котором входной интерфейс (110) выполнен с возможностью дополнительно принимать информацию о функции модификации выходного сигнала, причем модификатор (116) понижающего микширования выполнен с возможностью вывода функции модификации понижающего микширования из информации о принятой функции модификации выходного сигнала.
5. Устройство по п. 4, в котором информация о функции модификации понижающего микширования содержит коэффициенты усиления модификации понижающего микширования, и
модификатор (116) понижающего микширования выполнен с возможностью применения коэффициентов усиления модификации понижающего микширования или применения интерполированных или сглаженных коэффициентов усиления модификации понижающего микширования, и
модификатор (120) выходного сигнала выполнен с возможностью вычисления коэффициентов усиления модификации выходного сигнала с использованием максимального из инвертированного коэффициента усиления модификации понижающего микширования или интерполированного или сглаженного коэффициента усиления модификации понижающего микширования и постоянного значения или с использованием суммы инвертированного коэффициента усиления модификации понижающего микширования или интерполированного или сглаженного коэффициента усиления модификации понижающего микширования и постоянного значения соответственно.
6. Устройство по п. 1, в котором модификатор (120) выходного сигнала управляется сигналом (117) управления, причем входной интерфейс (110) выполнен с возможностью приема информации управления для временных кадров полос частот переданного сигнала понижающего микширования, и
модификатор (120) выходного сигнала выполнен с возможностью вывода сигнала управления из информации управления.
7. Устройство по п. 6, в котором информация управления является флагом, при этом сигнал управления таков, что модификатор (120) выходного сигнала деактивируется, если флаг находится в состоянии "установлен", и модификатор (120) выходного сигнала активируется, когда флаг находится в состоянии "не установлен", или наоборот.
8. Устройство по п. 1, в котором модификатор (116) понижающего микширования выполнен с возможностью снижения или отмены оптимизации громкости, операции эквализации, операции многополосной эквализации, операции компрессии динамического диапазона или операции лимитирования, применяемых к переданному сигналу (112) понижающего микширования, и
модификатор (120) выходного сигнала выполнен с возможностью применения операции оптимизации громкости или эквализации или операции многополосной эквализации или операции компрессии динамического диапазона или лимитирования к выходным сигналам.
9. Устройство по п. 1, в котором средство (118) рендеринга объектов выполнено с возможностью вычисления сигналов каналов из модифицированного сигнала понижающего микширования, параметрических данных (114) и информации (121) положения, указывающей размещение аудиообъектов в схеме воспроизведения.
10. Устройство по п. 1,
в котором средство (118) рендеринга объектов выполнено с возможностью реконструкции аудиообъектов с использованием параметрических данных (114) и распределения аудиообъектов по сигналам каналов для схемы воспроизведения с использованием информации (121) положения, указывающей размещение аудиообъектов в схеме воспроизведения.
11. Устройство по п. 1,
в котором входной интерфейс (110) выполнен с возможностью приема расширенного аудиообъекта, который является разностью форм волны между исходным аудиообъектом и реконструированным аудиообъектом, причем реконструкция для получения реконструированного аудиообъекта осуществлялась на основании параметрических данных (114), и нормальными аудиообъектами,
в котором средство (118) рендеринга объектов выполнено с возможностью использования нормальных аудиообъектов и расширенного аудиообъекта для вычисления выходных сигналов.
12. Устройство по п. 1,
в котором средство (118) рендеринга объектов выполнено с возможностью приема пользовательского ввода (123) для манипулирования одним или более аудиообъектами, при этом средство (118) рендеринга объектов выполнено с возможностью манипулирования одним или более аудиообъектами, определенными пользовательским вводом при осуществлении рендеринга выходных сигналов.
13. Устройство по п. 12, в котором средство (118) рендеринга объектов выполнено с возможностью манипулирования аудиообъектом переднего плана или аудиообъектом заднего плана, включенным в кодированные аудиосигналы.
14. Способ декодирования кодированного аудиосигнала (100) для получения модифицированных выходных сигналов (160), содержащий этапы, на которых:
принимают (110) переданный сигнал (112) понижающего микширования и параметрические данные (114), относящиеся к аудиообъектам, включенным в переданный сигнал (112) понижающего микширования, причем переданный сигнал понижающего микширования отличается от сигнала понижающего микширования кодера, с которым связаны параметрические данные;
модифицируют (116) переданный сигнал понижающего микширования с использованием функции модификации понижающего микширования, причем модификация понижающего микширования осуществляется таким образом, что модифицированный сигнал понижающего микширования идентичен сигналу понижающего микширования кодера или более аналогичен сигналу понижающего микширования кодера по сравнению с переданным сигналом (112) понижающего микширования;
осуществляют рендеринг (118) аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных для получения выходных сигналов; и
модифицируют (120) выходные сигналы с использованием функции модификации выходного сигнала, причем функция модификации выходного сигнала такова, что операция манипуляции, применяемая к сигналу понижающего микширования кодера для получения переданного сигнала (112) понижающего микширования, по меньшей мере, частично применяется к выходным сигналам для получения модифицированных выходных сигналов (160).
15. Физический носитель данных, на котором сохранена компьютерная программа для осуществления способа по п. 14, когда компьютерная программа выполняется на компьютере или процессоре.
RU2016105686A 2013-07-22 2014-07-18 Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов RU2653240C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13177379.8A EP2830046A1 (en) 2013-07-22 2013-07-22 Apparatus and method for decoding an encoded audio signal to obtain modified output signals
EP13177379.8 2013-07-22
PCT/EP2014/065533 WO2015011054A1 (en) 2013-07-22 2014-07-18 Apparatus and method for decoding an encoded audio signal to obtain modified output signals

Publications (2)

Publication Number Publication Date
RU2016105686A RU2016105686A (ru) 2017-08-28
RU2653240C2 true RU2653240C2 (ru) 2018-05-07

Family

ID=48795521

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016105686A RU2653240C2 (ru) 2013-07-22 2014-07-18 Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов

Country Status (11)

Country Link
US (1) US10607615B2 (ru)
EP (2) EP2830046A1 (ru)
JP (1) JP6207739B2 (ru)
KR (1) KR101808464B1 (ru)
CN (1) CN105431899B (ru)
BR (1) BR112016000867B1 (ru)
CA (1) CA2918703C (ru)
ES (1) ES2869871T3 (ru)
MX (1) MX362035B (ru)
RU (1) RU2653240C2 (ru)
WO (1) WO2015011054A1 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101660004B1 (ko) * 2012-08-03 2016-09-27 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법
US10349196B2 (en) * 2016-10-03 2019-07-09 Nokia Technologies Oy Method of editing audio signals using separated objects and associated apparatus
CN109688497B (zh) * 2017-10-18 2021-10-01 宏达国际电子股份有限公司 声音播放装置、方法及非暂态存储介质
EP3881565A1 (de) * 2018-11-17 2021-09-22 ASK Industries GmbH Verfahren zum betreiben einer audioeinrichtung

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2417459C2 (ru) * 2006-11-15 2011-04-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
US20110106529A1 (en) * 2008-03-20 2011-05-05 Sascha Disch Apparatus and method for converting an audiosignal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
US20110166867A1 (en) * 2008-07-16 2011-07-07 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding apparatus supporting post down-mix signal
US20110200197A1 (en) * 2007-02-14 2011-08-18 Lg Electronics Inc. Methods and Apparatuses for Encoding and Decoding Object-Based Audio Signals

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101183862B1 (ko) * 2004-04-05 2012-09-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템
WO2007110101A1 (en) * 2006-03-28 2007-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enhanced method for signal shaping in multi-channel audio reconstruction
WO2008046531A1 (en) 2006-10-16 2008-04-24 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
CN101542595B (zh) * 2007-02-14 2016-04-13 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
KR101387902B1 (ko) * 2009-06-10 2014-04-22 한국전자통신연구원 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
EP2885929A1 (en) * 2012-08-16 2015-06-24 Turtle Beach Corporation Multi-dimensional parametric audio system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2417459C2 (ru) * 2006-11-15 2011-04-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
US20110200197A1 (en) * 2007-02-14 2011-08-18 Lg Electronics Inc. Methods and Apparatuses for Encoding and Decoding Object-Based Audio Signals
US20110106529A1 (en) * 2008-03-20 2011-05-05 Sascha Disch Apparatus and method for converting an audiosignal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
US20110166867A1 (en) * 2008-07-16 2011-07-07 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding apparatus supporting post down-mix signal

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
EBU UER: "LOUDNESS NORMALISATION AND PERMITTED MAXIMUM LEVEL OF AUDIO SIGNALS", 17.08.2011, pages 1-5. *

Also Published As

Publication number Publication date
MX2016000504A (es) 2016-04-07
CA2918703C (en) 2019-04-09
RU2016105686A (ru) 2017-08-28
KR101808464B1 (ko) 2018-01-18
KR20160029842A (ko) 2016-03-15
CN105431899A (zh) 2016-03-23
EP2830046A1 (en) 2015-01-28
JP6207739B2 (ja) 2017-10-04
US20160140968A1 (en) 2016-05-19
WO2015011054A1 (en) 2015-01-29
US10607615B2 (en) 2020-03-31
BR112016000867A2 (ru) 2017-07-25
JP2016530789A (ja) 2016-09-29
MX362035B (es) 2019-01-04
EP3025334B1 (en) 2021-04-28
CA2918703A1 (en) 2015-01-29
CN105431899B (zh) 2019-05-03
EP3025334A1 (en) 2016-06-01
BR112016000867B1 (pt) 2022-06-28
ES2869871T3 (es) 2021-10-26

Similar Documents

Publication Publication Date Title
JP6730438B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
US7573912B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
JP6117997B2 (ja) 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム
AU2016234987B2 (en) Decoder and method for a generalized spatial-audio-object-coding parametric concept for multichannel downmix/upmix cases
US11501785B2 (en) Method and apparatus for adaptive control of decorrelation filters
JP2016525716A (ja) 適応位相アライメントを用いたマルチチャネルダウンミックスにおけるコムフィルタアーチファクトの抑制
KR102482162B1 (ko) 오디오 인코더 및 디코더
US10607615B2 (en) Apparatus and method for decoding an encoded audio signal to obtain modified output signals