RU2381570C2 - Стереофонически совместимое кодирование многоканального звука - Google Patents

Стереофонически совместимое кодирование многоканального звука Download PDF

Info

Publication number
RU2381570C2
RU2381570C2 RU2007120634/09A RU2007120634A RU2381570C2 RU 2381570 C2 RU2381570 C2 RU 2381570C2 RU 2007120634/09 A RU2007120634/09 A RU 2007120634/09A RU 2007120634 A RU2007120634 A RU 2007120634A RU 2381570 C2 RU2381570 C2 RU 2381570C2
Authority
RU
Russia
Prior art keywords
parameters
spatial
stereo
signal
parameter
Prior art date
Application number
RU2007120634/09A
Other languages
English (en)
Other versions
RU2007120634A (ru
Inventor
Хейко ПУРНХАГЕН (SE)
Хейко ПУРНХАГЕН
Йероен БРЕБАРТ (NL)
Йероен БРЕБАРТ
Эрик СХЕЙЕРС (NL)
Эрик СХЕЙЕРС
Ларс ВИЛЛЕМОЕС (SE)
Ларс ВИЛЛЕМОЕС
Йонас РЕДЕН (SE)
Йонас РЕДЕН
Йонас ЭНГДЕГАРД (SE)
Йонас ЭНГДЕГАРД
Original Assignee
Коудинг Текнолоджиз Аб
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Коудинг Текнолоджиз Аб, Конинклейке Филипс Электроникс Н.В. filed Critical Коудинг Текнолоджиз Аб
Publication of RU2007120634A publication Critical patent/RU2007120634A/ru
Application granted granted Critical
Publication of RU2381570C2 publication Critical patent/RU2381570C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transceivers (AREA)

Abstract

Изобретение относится к кодированию многоканального звука, и в частности к генерированию и использованию параметрического представления многоканального звукового сигнала, которое обратно совместимо со средствами воспроизведения сигнала параметрического стерео. Параметрическое представление (12) многоканального звукового сигнала, содержащее параметры, подходящие для использования совместно с монофоническим сигналом, полученным понижающим микшированием для вычисления восстановления многоканального звукового сигнала, может быть эффективно получено обратно совместимым со стереофоническим сигналом образом при использовании блока (18) объединения параметров для генерирования параметрического представления (12) посредством объединения одного или нескольких пространственных параметров (20) и стереофонического параметра (22), дающего параметрическое представление (12), содержащее пригодный для использования декодером стереофонический параметр (24) и информацию об одном или нескольких пространственных параметрах (26), которое представляет совместно с пригодным для использования декодером стереофоническим параметром (24) один или несколько пространственных параметров (20). 17 н. и 14 з.п. ф-лы, 11 ил.

Description

Настоящее изобретение относится к кодированию многоканального звука, и в частности к идее генерирования и использования параметрического представления многоканального звукового сигнала, которое полностью обратно совместимо со средствами воспроизведения сигнала параметрического стерео.
Настоящее изобретение относится к кодированию многоканального представления звуковых сигналов, использующего параметры пространственного звука таким образом, который совместим с кодированием двухканальных стереофонических сигналов, использующих параметры параметрического стерео. Настоящее изобретение предоставляет новые способы эффективного кодирования как параметров пространственного звука, так и параметров параметрического стерео и встраивания закодированных параметров в двоичный поток обратно совместимым образом. В частности, изобретение направлено на минимизацию общей скорости передачи для параметров параметрического стерео и пространственного звука в обратно совместимом двоичном потоке без ухудшения качества декодированного стереофонического или многоканального звукового сигнала. В случае если допустимо некоторое ухудшение качества декодированного стереофонического сигнала, общую скорость передачи можно уменьшить еще больше.
С недавнего времени все большее значение приобретают способы воспроизведения многоканального звука. С целью эффективной передачи многоканальных звуковых сигналов, имеющих 5 или более отдельных звуковых каналов, было разработано несколько способов сжатия стереофонического или многоканального сигнала. Недавно разработанные подходы к параметрическому кодированию многоканальных звуковых сигналов (параметрическое стерео (ПС), бинауральное кодирование сигнала (БКС) и т. д.) представляют многоканальный звуковой сигнал посредством сигнала, полученного понижающим микшированием, (может быть монофоническим или содержать несколько каналов) и параметрической дополнительной информацией, называемой также "пространственной ключевой информацией", характеризующей его воспринимаемое пространственное объемное звучание.
Многоканальное устройство кодирования в целом принимает - в качестве входных сигналов - по меньшей мере два канала и выдает на выходе один или несколько каналов несущей частоты и параметрических данных. Параметрические данные получают таким образом, чтобы в декодере можно было вычислить приближенное значение первоначального многоканального сигнала. Обычно канал (каналы) несущей частоты включает отсчеты поддиапазона, спектральные коэффициенты, отсчеты временной области и т.д., которые обеспечивают сравнительно хорошее представление основного сигнала, в то время как параметрические данные не содержат таких отсчетов спектральных коэффициентов, но вместо этого включают в себя управляющие параметры для управления некоторым алгоритмом восстановления. Такое восстановление может содержать умножение на весовой коэффициент, временной сдвиг, частотный сдвиг, фазовый сдвиг и т. д. Таким образом, параметрические данные включают в себя лишь сравнительно грубое представление сигнала или связанного с ним канала.
Способ бинаурального кодирования сигнала (БКС) описан в ряде публикаций, например "Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES convention paper 5574, May 2002, Munich, в 2 публикациях Международной конференции по акустике, речи и обработке сигнала "Estimation of auditory spatial cues for binaural cue coding" и "Binaural cue coding: a normal and efficient representation of spatial audio", автором обеих являются C. Faller и F. Baumgarte, Orlando, FL, May 2002.
При кодировании способом БКС несколько входных звуковых каналов преобразуются в спектральное представление при помощи ДПФ (дискретного преобразования Фурье) на основе преобразования с перекрывающимися окнами. Затем полученный однородный спектр делится на неперекрывающиеся части. Ширина диапазона каждой части пропорциональна эквивалентной прямоугольной ширине диапазона (ERB). Затем для каждой части оцениваются пространственные параметры, называемые ICLD (межканальная разность уровней) и ICTD (межканальная временная разность). Параметр ICLD описывает разность уровней между двумя каналами, а параметр ICDT описывает временную разность (фазовый сдвиг) между двумя сигналами различных каналов. Разности уровней и временные разности обычно приводятся для каждого канала относительно опорного канала. После получения этих параметров параметры квантуются и, наконец, кодируются для передачи.
Хотя параметры ICLD и ICTD представляют наиболее важные параметры, характеризующие местоположение источника звука, пространственное представление, использующее эти параметры, можно улучшить введением дополнительных параметров.
Родственный способ, названный "параметрическим стерео", представляет собой параметрическое кодирование двухканального стереофонического сигнала на основе переданного монофонического сигнала вместе с дополнительной информацией, содержащей параметры. Вводятся три типа пространственных параметров, называемых межканальной разностью интенсивностей (МРИ), межканальной разностью фаз (МРФ) и межканальной согласованностью (МВК). Расширение набора пространственных параметров посредством введения параметра согласованности (параметра корреляции) обеспечивает параметризацию воспринимаемой пространственной "разбросанности" или пространственной "сжатости" в павильоне звукозаписи. Параметрическое стерео более подробно описано в работах: "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, pages 1305-1322, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116<th> Convention, Preprint 6072, Berlin, May 2004, и "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116th Convention, Preprint 6073, Berlin, May 2004.
Как указывалось выше, недавно были разработаны системы кодирования параметрического стерео, а также кодирования пространственного звука. Когда при параметрическом стерео двухканальный стереофонический звуковой сигнал представлен посредством монофонического сигнала, полученного понижающим микшированием, и дополнительной информации, которая несет в себе стереофонические параметры (см. заявку PCT/SE02/01372 "Efficient и scalable Parametric Stereo Coding for Low Bitrate Audio Coding Application"), обычный декодер параметрического стерео восстанавливает двухканальный стереофонический сигнал из монофонического сигнала и дополнительной информации.
В схемах кодирования пространственного звука многоканальный объемный звуковой сигнал представлен посредством монофонического или стереофонического звукового сигнала, полученного понижающим микшированием, и дополнительной информации, которая несет в себе параметры пространственного звука. Широко известным примером является конфигурация каналов 5.1, используемая в бытовых развлекательных системах.
Обычный декодер пространственного звука восстанавливает многоканальный сигнал схемы 5.1 на основе монофонического или стереофонического сигнала и дополнительных пространственных звуковых параметров.
Как правило, сигналы, полученные понижающим микшированием, применяемые в системах кодирования параметрического стерео или пространственного звука, подвергаются дополнительному кодированию способами низкоскоростного перцептуального кодирования звука (типа MPEG AAC) для дальнейшего снижения требуемой ширины полосы пропускания для передачи сигналов разного типа. Кроме того, сигнал, полученный понижающим микшированием, обычно объединяется в двоичном потоке с дополнительной информацией параметрического стерео или пространственного звука таким образом, чтобы обеспечить обратную совместимость с обычными декодерами, то есть с декодерами, которые не способны обрабатывать параметры параметрического стерео или пространственного звука. Таким образом, обычный звуковой декодер лишь восстанавливает монофонический или стереофонический переданный сигнал, полученный понижающим микшированием. Когда же используется декодер, реализующий кодирование параметрического стерео или кодирование пространственного звука, декодер также извлекает дополнительную информацию, встроенную в двоичный поток и восстанавливает двухканальный стереофонический сигнал или объемный сигнал с 5.1 каналами.
В случае использования кодирования пространственного звука на основе монофонического сигнала, полученного понижающим микшированием, желательно дополнительно повысить обратную совместимость, обеспечив такой сигнал, чтобы не только обычный перцептуальный декодер звука мог получить монофонический сигнал, полученный понижающим микшированием, но чтобы дополнительно было возможно декодирование параметрического стерео из такого двоичного потока при помощи декодера параметрического стерео, который не поддерживает декодирование пространственного звука.
Другой известный из уровня техники подход, одновременно включающий в себя и параметры параметрического стерео, и параметры пространственного звука, и дополнительную информацию, требует набора параметров пространственного звука, структура которых такова, что поднабор этих параметров позволяет восстановить двухканальный стереофонический сигнал из монофонического сигнала, полученного понижающим микшированием. Этот поднабор встроен в двоичный поток в качестве параметрической дополнительной информации таким образом, чтобы быть совместимым с двоичными потоками параметрического стерео, тогда как оставшиеся параметры пространственного звука, не входящие в этот набор, встроены в качестве дополнительной информации пространственного звука в двоичный поток, совместимый с кодировщиками пространственного звука. Со стороны декодера декодер, реализующий только параметрическое стерео, восстанавливает двухканальный стереофонический сигнал на основе поднабора параметров, который встроен в дополнительную информацию параметрического стерео. В то же время декодер, реализующий пространственный звук, извлекает поднабор параметрического стерео и остальные параметры пространственного звука. При наличии этого полного набора пространственных параметров можно восстановить многоканальный сигнал.
Однако эти подходы обладают тем недостатком, что они ухудшают качество звука либо при обратно совместимом восстановлении способом параметрического стерео, либо при многоканальном восстановлении. Это очевидно, поскольку в первом случае поднабор параметров, используемый также в качестве параметров пространственного звука, описывает взаимоотношения между двумя каналами сигнала, построенного по схеме 5.1. Естественнее всего было бы выбрать левый передний (l) и правый передний (r) каналы, которые, однако, могут существенно отличаться от верных значений, описывающих соотношение между левым (l0) и правым (r0) каналами стереофонического сигнала, полученного понижающим микшированием. Во втором случае указанный первый поднабор образуют верные значения стереофонического сигнала, полученного понижающим микшированием, а это означает, что они используются для описания соотношения между левым передним и правым передним каналами многоканального объемного сигнала. Однако такой подход ведет к искаженному восстановлению пространственного звука из-за квантования параметров, что необходимо для их встраивания в двоичный поток способом, совместимым с многоканальным сигналом.
Задача настоящего изобретения заключается в том, чтобы предоставить принцип создания и использования параметрического представления многоканального звукового сигнала, который позволяет обеспечить более эффективное представление, почти не влияющее ни на качество восстановления параметрического стерео, ни на качество восстановления пространственного звука.
Эта задача решается посредством декодера многоканального звука в соответствии с п. 1 формулы или кодировщика звука в соответствии с п. 11 формулы.
Настоящее изобретение основано на экспериментально обнаруженном факте, что параметрическое представление многоканального звукового сигнала, параметры которого можно использовать совместно с монофоническим сигналом, полученным понижающим микшированием, можно эффективно получить обратно совместимым образом в случае использования средства объединения параметров для создания параметрического представления посредством объединения набора пространственных параметров и стереофонического параметра, что приводит к параметрическому представлению, имеющему пригодные для использования декодером стереофонический параметр и информацию о наборе пространственных параметров, которая представляет совместно с пригодным для использования декодером стереофоническим параметром набор пространственных параметров.
При помощи соотношения между пространственными параметрами и стереофоническими параметрами, которые описывают стереофоническое понижающее микширование того же многоканального звукового сигнала, описываемого также пространственными параметрами, можно успешно определить поднабор пространственных параметров, основанный на параметрах параметрического стерео.
Поскольку двухканальный стереофонический сигнал, описываемый стереофоническими параметрами, представляет некую форму стереофонического понижающего микширования многоканального сигнала с 5.1 каналами, то, как указано выше, существуют зависимости между стереофоническими параметрами системы параметрического стерео и пространственными параметрами системы кодирования пространственного звука. Настоящее изобретение использует эти стереофонические параметры в сочетании с поднабором параметров пространственного звука для предсказания значений остальных параметров пространственного звука, не входящих в указанный поднабор. Затем необходимо лишь передать разность между предсказанными и фактическими значениями параметров пространственного звука. Энтропия этой разности (то есть ошибка предсказания) обычно меньше энтропии самого фактического параметра. Это обстоятельство можно использовать в системе, применяющей настоящее изобретение и некое последующее статистическое кодирование. Такая система требует меньшей скорости передачи дополнительной информации для параметров параметрического стерео и пространственного звука по сравнению с системой, которая просто независимо встраивает все параметры. Следует заметить, что в то же время такая система, применяющая настоящее изобретение, не ухудшает ни качество восстановления параметрического стерео, ни качество восстановления пространственного звука.
Поскольку целью является получение параметрического представления, которое обратно совместимо с декодерами параметрического стерео, предпочтительно использовать верные параметры, представляющие стереофоническое понижающее микширование, с тем, чтобы не ухудшить качество восстановления двухканального стереофонического сигнала при помощи декодера параметрического стерео. Однако в альтернативном варианте осуществления настоящего изобретения в кодировщике используется небольшое изменение параметров параметрического стерео на основе оцененных пространственных параметров с целью улучшения эффективности предсказания параметров для параметров пространственного звука. Ясно, что это изменение параметров параметрического стерео (ПС) ведет к небольшому снижению качества стереофонического сигнала, восстановленного декодером, который реализует только декодирование параметрического стерео. В этом варианте осуществления настоящего изобретения изменение параметров ПС не влияет на качество восстановленного пространственного звукового сигнала, тогда как полная скорость передачи, требуемая для передачи дополнительной информации ПС и пространственного звука, встроенной в совместимый двоичный поток, становится меньше.
В предпочтительном варианте осуществления настоящего изобретения используется кодировщик, предназначенный для получения параметрического представления многоканального звукового сигнала, который генерирует двоичный поток, в который полностью обратно совместимым способом встроены параметры пространственного звука, а также параметры параметрического стерео, относящиеся к стереофоническому понижающему микшированию многоканального сигнала. Иными словами, декодер параметрического стерео, способный только обрабатывать параметры параметрического стерео, сможет восстановить стереофонический сигнал с высоким качеством, используя параметры параметрического стерео. Кроме того, кодировщик согласно изобретению заменяет некоторые пространственные параметры разностным представлением фактических пространственных параметров и предсказанием пространственного параметра, причем предсказание пространственного параметра основано на стереофонических параметрах и на наборе незамененных параметров пространственного звука. Поскольку и представление параметрами пространственного звука, и представление параметрами параметрического стерео описывают разность и корреляцию уровней между парами каналов, существует взаимозависимость между параметрами пространственного звука и стереофоническими параметрами, поскольку и те, и другие получены на основе одних и тех же данных, а именно, из многоканального сигнала. Поэтому, используя для передачи разность между предсказанием и фактическим значением, можно сэкономить на скорости передачи, поскольку обычно энтропия разности гораздо меньше энтропии исходного параметра пространственного звука. При идеальном предсказании разность предсказания и фактического значения равна, очевидно, нулю, а это значит, что в качестве представления замененных пространственных параметров необходимо передать или сохранить в рамках параметрического представления лишь нулевые значения, что является весьма выгодным, когда в отношении представления выполняются дальнейшие этапы статистического кодирования, как обычно и происходит.
При использовании описанного выше принципа кодировщик или декодер согласно изобретению обладает очевидным преимуществом, заключающимся в том, что, несмотря на обратно совместимую передачу параметров пространственного звука и параметрического стерео без потери в точности, скорость передачи данных можно уменьшить по сравнению с вариантом, в котором параметры пространственного звука и параметры параметрического стерео просто передаются независимо в двоичном потоке.
В еще одном варианте осуществления настоящего изобретения перед предсказанием пространственных параметров и передачей измененных пространственных параметров параметры параметрического стерео подвергаются небольшим изменениям. Этот вариант обладает значительным преимуществом, заключающимся в том, что можно улучшить устойчивость предсказания при помощи небольших изменений параметров параметрического стерео и, следовательно, еще более уменьшить полную скорость передачи данных. Ценою этого является небольшое ухудшение качества стереофонического повышающего микширования, восстановленного при помощи измененных стереофонических параметров, поскольку в процессе кодирования действительно оптимальные параметры параметрического стерео изменяются.
В еще одном варианте осуществления настоящего изобретения кодировщик звука согласно изобретению содержит устройство пространственного понижающего микширования для генерации монофонического сигнала из поступающего в кодировщик многоканального сигнала. Затем монофонический сигнал сжимается кодировщиком звука при помощи, например, перцептуального сжатия звука для дальнейшего уменьшения скорости передачи данных, используемой монофоническим сигналом, полученным понижающим микшированием, во время передачи. Наконец, генератор двоичного потока генерирует двоичный поток, объединяющий монофонический сигнал, параметры пространственного звука и параметры параметрического стерео в единый двоичный поток, совместимый с параметрическим стерео.
В еще одном варианте осуществления настоящего изобретения параметрический кодировщик или декодер содержит блок управления, обеспечивающий дальнейшее уменьшение требуемой скорости передачи данных. Достижение этого обеспечивается посредством сравнения скорости передачи данных, необходимой для разностного представления пространственных параметров, полученных посредством разности фактического пространственного параметра и предсказания того же параметра, со скоростью передачи данных, необходимой для непосредственного кодирования пространственных параметров. Кодирование осуществляется посредством двухэтапной процедуры кодирования, содержащей сначала временное и (или) частотное дифференциальное кодирование отдельно каждого параметра с последующим статистическим кодированием (при помощи, например, кодировщика по алгоритму Хаффмана, арифметического кодировщика или кодировщика длин серий). В этом процессе используется предсказуемость (или избыточность) каждого параметра на основе его собственных прошлых значений (в отличие от описанного выше предсказания по набору параметров). В случае, когда разностное предсказательное кодирование приводит к более высокой скорости передачи данных, дополнительного снижения скорости передачи данных можно достигнуть прямой передачей пространственных параметров в течение данных временных интервалов. Решение о том, какая выбрана стратегия, может либо быть передано в двоичном потоке, подлежащем обработке на стороне декодера, либо декодер без уведомления может принять решение об изначально примененной стратегии посредством использования соответствующего алгоритма определения.
Как уже говорилось, сигнал, сгенерированный согласно настоящему изобретению, обладает большим преимуществом, поскольку он является обратно совместимым с декодером параметрического стерео и, кроме того, содержит информацию, требуемую для воспроизведения полного пространственного (объемного) сигнала, когда его передают на декодер согласно изобретению.
Поэтому декодер по изобретению, принимающий параметры параметрического стерео и параметры пространственного звука, может восстановить полный набор пространственных параметров, используя то же самое предсказание и обратное преобразование переданных разностным образом параметров пространственного звука для извлечения из двоичного потока по изобретению полного набора параметров пространственного звука, представляющих пространственное свойство многоканального сигнала.
Иными словами, правило объединения, используемое для объединения параметров параметрического стерео и принятых параметров пространственного звука для восстановления полного набора пространственных параметров, является обратным правилу, используемому на стороне кодировщика. В случае указанного выше дифференциального кодирования это означает, что сначала вычисляется предсказание требуемого параметра при помощи одного или нескольких параметров параметрического стерео и одного или нескольких принятых параметров пространственного звука. Затем вычисляется сумма предсказанного значения и переданного значения, причем эта сумма является требуемым параметром полного набора пространственных параметров.
В еще одном варианте осуществления настоящего изобретения декодер по изобретению может также восстановить стереофоническое представление многоканального сигнала при помощи параметров высококачественного параметрического стерео. Большое преимущество заключается в том, что декодер по изобретению можно сконфигурировать согласно потребностям, то есть в случае, если доступно только средство стереофонического воспроизведения, декодер по изобретению может воспроизводить высококачественный стереофонический сигнал, в то же время, если имеется в наличии средство многоканального воспроизведения, можно воспроизвести многоканальное представление сигнала и наслаждаться прослушиванием объемного звука.
В еще одном варианте осуществления настоящего изобретения кодировщик по изобретению включен в состав устройства передачи или звукозаписи, обеспечивая экономию на скорости передачи данных при хранении и передаче звукового сигнала, который можно воспроизвести с отличным качеством в виде стереофонического сигнала либо в виде полноценного объемного сигнала.
В еще одном варианте осуществления настоящего изобретения декодер по изобретению включен в состав устройства приема или звуковоспроизведения, обеспечивая прием или воспроизведение сигналов при помощи акустических систем с различной конфигурацией, причем звуковой сигнал можно воспроизводить в представлении, наилучшим образом подходящем для существующих средств воспроизведения.
Резюмируя, можно сказать, что настоящее изобретение обладает следующими преимуществами:
- совместимое кодирование многоканальных звуковых сигналов, в том числе,
на стороне кодировщика - понижающее микширование многоканального сигнала до одноканального представления,
на стороне кодировщика - на основе указанного многоканального сигнала определение параметров, представляющих многоканальный сигнал,
на стороне кодировщика - на основе указанного многоканального сигнала определение параметров, представляющих стереофоническое понижающее микширование многоканального сигнала,
на стороне кодировщика - встраивание обоих наборов параметров в двоичный поток обратно совместимым и экономичным с точки зрения скорости передачи данных образом,
на стороне декодера - извлечение встроенных параметров из двоичного потока,
на стороне декодера - восстановление параметров, представляющих многоканальный сигнал, из параметров, извлеченных из двоичного потока,
на стороне декодера - восстановление многоканальных выходных сигналов на основе параметров, восстановленных из данных двоичного потока, и указанного сигнала, полученного понижающим микшированием;
- встраивание в двоичный поток параметров, представляющих стереофоническое понижающее микширование, так чтобы их можно было декодировать (обычным) способом декодирования, который поддерживает лишь декодирование параметрического стерео;
- разделение набора параметров, представляющих многоканальный сигнал, на первый поднабор и второй поднабор;
- предсказание значений в указанном первом поднаборе параметров на основе указанного второго поднабора параметров и на основе параметров, которые представляют стереофоническое понижающее микширование многоканального сигнала;
- механизм управления, который автоматически определяет, закодирован ли непосредственно первый поднабор параметров или закодированы разности относительно предсказанных значений параметров;
- изменение параметров, которые представляют стереофоническое понижающее микширование, когда и первоначальные параметры, представляющие многоканальный сигнал, и первоначальные параметры, представляющие стереофоническое понижающее микширование, используются в качестве основы для получения измененных параметров;
- просмотровая таблица, используемая для поиска указанных предсказанных значений параметров;
- полиномиальная функция, используемая для поиска указанных предсказанных значений параметров;
- математическая функция, выведенная из способа, применяемого для генерации стереофонического понижающего микширования, используемая для поиска указанных предсказанных значений параметров.
Предпочтительные варианты осуществления настоящего изобретения описаны ниже со ссылкой на прилагаемые чертежи, среди которых:
фиг. 1 - блок-схема кодировщика согласно изобретению;
фиг. 2 - сгенерированный двоичный поток согласно настоящему изобретению;
фиг. 3 - еще один вариант осуществления кодировщика согласно изобретению;
фиг. 4 - подробная схема кодировщика согласно изобретению, приведенного на фиг. 3;
фиг. 5 - декодер по изобретению;
фиг. 6 - предпочтительный вариант многоканального декодера по изобретению;
фиг. 7 - подробная схема многоканального декодера по изобретению, изображенного на фиг. 6;
фиг. 8 иллюстрирует обратную совместимость сигнала согласно изобретению;
фиг. 9 - передатчик или устройство звукозаписи, содержащее кодировщик по изобретению;
фиг. 10 - приемник или устройство звуковоспроизведения, содержащее многоканальный декодер согласно изобретению; и
фиг. 11 - система передачи.
Описываемые ниже варианты осуществления являются просто иллюстрациями принципов настоящего изобретения для кодирования пространственного звука с улучшенной совместимостью с параметрическим стерео. Предполагается, что видоизменения и вариации взаимного размещения и частностей, описанных в настоящей заявке, являются очевидными для специалистов в данной области техники. Поэтому замысел изобретения ограничен только объемом приведенной ниже патентной формулы, а не частными подробностями, представленными с целью описания и объяснения вариантов осуществления, представленных в настоящей заявке.
На фиг. 1 приведен кодировщик 10 согласно изобретению для получения параметрического представления 12 из многоканального звукового сигнала. Кодировщик 10 содержит блок 14 вычисления пространственных параметров, блок 16 вычисления стереофонических параметров и блок 18 объединения параметров.
Блок 14 вычисления пространственных параметров вычисляет набор 20 пространственных параметров, описывающий пространственные свойства многоканального сигнала. Блок 16 вычисления стереофонических параметров вычисляет стереофонические параметры 22, описывающие пространственные свойства стереофонического понижающего микширования многоканального сигнала. Набор 20 пространственных параметров и стереофонические параметры 22 передаются блоку 18 объединения параметров, который выводит параметрическое представление 12, содержащее пригодный для использования декодером стереофонический параметр 24 и информацию о наборе пространственных параметров 26.
На фиг. 2 приведен пример для обратно совместимого двоичного потока, являющегося параметрическим представлением многоканального звукового сигнала, созданного кодировщиком по изобретению, изображенным на фиг. 1. Двоичный поток содержит участок 30 стереофонических параметров и участок 32 пространственных параметров. Участок 30 стереофонических параметров содержит стереофонический заголовок 34, находящийся в начале участка 30 стереофонических параметров, за которым следуют два пригодных для использования декодером стереофонических параметра 36a и 36b, которые могут использоваться декодером параметрического стерео для восстановления стереофонического сигнала. Декодер, способный обрабатывать только параметры параметрического стерео, определяет параметры 36a и 36b параметрического стерео по информации, содержащейся в стереофоническом заголовке 34.
Участок 32 пространственного звука начинается с пространственного заголовка 38 и содержит четыре параметра 40a-40d пространственного звука. Многоканальный декодер согласно настоящему изобретению может использовать пространственные параметры 40a-40d, определяя их при помощи пространственного заголовка 38, а также стереофонические параметры 36a и 36b, определяемые по стереофоническому заголовку 34. Как показано на фиг. 2, пространственный параметр 40a требует меньшей скорости передачи данных, чем пространственные параметры 40b-40d. В примере, приведенном на фиг. 2, пространственный параметр 40a представлен разностью исходного первоначального пространственного параметра и предсказанного пространственного параметра, полученного при помощи одного или нескольких стереофонических параметров 36a или 36b и одного или нескольких параметров 40b-40d пространственного звука. Поэтому многоканальный декодер согласно изобретению требует использования обоих стереофонических параметров 36a и 36b и пространственных параметров 40b-40d для восстановления пространственного параметра, лежащего в основе информации о пространственном параметре 40a, которая передается в двоичном потоке.
На фиг. 3 приведен предпочтительный вариант осуществления кодировщика 52 для получения параметрического представления многоканального звукового сигнала 50, который имеет три канала: левый канал l, правый канал r и центральный канал c.
Кодировщик 52 согласно изобретению содержит блок 54 пространственного понижающего микширования, блок 56 оценки пространственных параметров, блок 58 стереофонического понижающего микширования, блок 60 оценки параметров параметрического стерео, кодировщик 62 звука, блок 64 объединения параметров (блок совместного кодирования) и блок 66 вычисления скорости потока (мультиплексор).
Блок 54 пространственного понижающего микширования, блок 56 оценки пространственных параметров и блок 58 стереофонического понижающего микширования принимают в качестве входного сигнала многоканальный сигнал 50. Блок 54 пространственного понижающего микширования создает монофонический сигнал 68, полученный понижающим микшированием из многоканального сигнала 50, блок 56 оценки пространственных параметров получает пространственные параметры 70, описывающие пространственные свойства многоканального сигнала, а блок 58 стереофонического понижающего микширования создает стереофонический сигнал 72, полученный понижающим микшированием из многоканального сигнала 50.
Стереофонический сигнал 72, полученный понижающим микшированием, является входным сигналом блока 60 оценки параметров параметрического стерео, который выводит стереофонические параметры 74 из стереофонического сигнала, полученного понижающим микшированием, описывающие свойства стереофонического сигнала 72, полученного понижающим микшированием. Монофонический сигнал 68, полученный понижающим микшированием, является входным сигналом кодировщика 62 звука, который выводит звуковой двоичный поток 76, представляющий монофонический сигнал 68, полученный понижающим микшированием, посредством кодирования с использованием, например, способов перцептуального кодирования звука. Блок 64 объединения параметров принимает в качестве входных сигналов пространственные параметры 70, а также параметры 74 параметрического стерео, и выводит в качестве выходных сигналов пригодные для использования декодером стереофонические параметры 78 (дополнительную информацию параметрического стерео) и информацию 80 о пространственных параметрах (пространственную дополнительную информацию) посредством замены наборов пространственных параметров разностью предсказания пространственных параметров и самих пространственных параметров. Более подробно это описано на следующем чертеже.
Блок 66 вычисления двоичного потока принимает в качестве входных сигналов звуковой двоичный поток 76, информацию о наборе пространственных параметров 80 и пригодные для использования декодером стереофонические параметры 78 и объединяет указанные входные сигналы в двоичный поток 82, совместимый с параметрическим стерео, который может, например, содержать участки с параметрами, что подробно изображено на фиг. 2.
Блок 66 вычисления двоичного потока может представлять собой обычный мультиплексор. Однако для получения двоичного потока в соответствии с настоящим изобретением можно использовать и другие средства для объединения трех входных сигналов в совместимый двоичный поток.
Иными словами, на фиг. 3 приведен кодировщик, который берет в качестве входного сигнала многоканальный звуковой сигнал, содержащий каналы 1, r и c, и генерирует совместимый двоичный поток, который допускает декодирование пространственным декодером, а также обратно совместимое декодирование декодером ПС. Пространственное понижающее микширование заключается в том, что берется многоканальный сигнал 1, r, c и генерируется монофонический сигнал m, полученный понижающим микшированием. Затем этот сигнал можно закодировать дополнительным перцептуальным кодировщиком звука для получения компактного звукового двоичного потока, представляющего монофонический сигнал. Оценка пространственных параметров заключается в том, что берется многоканальный сигнал 1, r, c в качестве входного сигнала и генерируется набор квантованных пространственных параметров. Эти параметры могут быть функцией времени и частоты. Понижающее микширование до стереофонического сигнала дает двухканальное стереофоническое понижающее микширование l0, r0 многоканального сигнала, например, при помощи формул понижающего микширования ITU-R или альтернативных способов. Оценка параметров параметрического стерео заключается в том, что берется это стереофоническое понижающее микширование в качестве входного сигнала и генерируется набор квантованных параметров ПС, которые могут быть функцией времени и частоты. Блок совместного кодирования принимает в качестве входных сигналов пространственный параметр и параметр ПС и создает дополнительную информацию параметрического стерео (дополнительная информация ПС) и дополнительную пространственную информацию. Наконец, мультиплексор принимает в качестве входных сигналов звуковой двоичный поток и двоичные потоки с пространственной дополнительной информацией и дополнительной информацией ПС и встраивает дополнительную информацию в двоичный поток таким образом, чтобы сделать возможным обратно совместимое декодирование обычным декодером (реализующим только ПС).
На фиг. 4 подробно изображен блок 64 объединения параметров, изображенный на фиг. 3. Блок 64 объединения параметров содержит блок 90 разделения параметров, блок 92 изменения параметров параметрического стерео, блок 94 предсказания пространственных параметров, блок 96 объединения, блок 98 управления, блок 100 соединения пространственных параметров, первый дифференциальный кодировщик 102, второй дифференциальный кодировщик 104, третий дифференциальный кодировщик 106a и четвертый дифференциальный кодировщик 106b.
Блок 64 объединения параметров принимает в качестве входных сигналов пространственные параметры 70 и параметры 74 параметрического стерео. Параметры 74 параметрического стерео поступают на первый вход блока 92 изменения параметров параметрического стерео, а пространственные параметры 70 поступают на второй вход блока 92 изменения параметрического стерео. Пространственные параметры 70 дополнительно поступают на вход блока 90 разделения параметров. Блок 92 изменения параметров параметрического стерео является необязательным устройством, которое может использоваться для получения пригодных для использования декодером стереофонических параметров 110 посредством изменения параметров 74 параметрического стерео с использованием информации о пространственных параметрах.
Блок 90 разделения параметров делит пространственные параметры 70 на первый поднабор 112 пространственных параметров и второй поднабор 114 пространственных параметров, причем первый поднабор 112 является поднабором пространственных параметров, которые можно заменить разностным предсказанием в рамках окончательного параметрического представления многоканального сигнала.
Поскольку предсказание параметров в пределах первого поднабора выполняется при помощи пригодных для использования декодером стереофонических параметров 110 и второго поднабора 114 пространственных параметров, и пригодные для использования декодером параметры 110 и второй поднабор пространственных параметров 114 являются входными сигналами блока 94 предсказания пространственных параметров. Блок 94 предсказания пространственных параметров выводит предсказанные параметры 116 при помощи пригодных для использования декодером параметров 110 параметрического стерео и второго поднабора 114 пространственных параметров. Предсказанные параметры 116 представляют собой предсказание параметров первого поднабора 112 и подлежат сравнению с параметрами первого поднабора 112.
Таким образом, блок 96 объединения вычисляет для каждого параметра разность между предсказанными параметрами 116 и первым поднабором параметров 112, получая тем самым разностные параметры 118. Первый поднабор параметров 112 является входными сигналами третьего дифференциального кодировщика 106a, который выполняет дифференциальное кодирование первого поднабора параметров, применяя дифференциальное кодирование по времени или по частоте. Разностные параметры 118 являются входными сигналами дифференциального кодировщика 106b.
Согласно предпочтительно варианту осуществления настоящего изобретения, приведенному на фиг. 4, представление первого поднабора 112, подвергнутое дифференциальному кодированию, сравнивается в блоке 98 управления с представлением разностных параметров 118, подвергнутых дифференциальному кодированию, для того чтобы оценить, какое представление требует больше битов в двоичном потоке. Блок 98 управления управляет переключателем 120 для подачи на блок 100 соединения пространственных параметров того представления первого поднабора 112, которое требует меньше битов, причем информация о том, какое используется представление, дополнительно подается из блока 98 управления на блок 100 соединения пространственных параметров.
Второй поднабор 114 пространственных параметров также подвергается дифференциальному кодированию вторым дифференциальным кодировщиком 104, и представление второго поднабора 114, подвергнутое дифференциальному кодированию, является входным сигналом блока 100 объединения пространственных параметров 100, который, таким образом, получает полную информацию о пространственных параметрах 70. Наконец, блок 100 соединения пространственных параметров выводит информацию о пространственных параметрах 80 соединения представлений первого поднабора 112 и второго поднабора 114 в информацию о наборе пространственных параметров 80, которая содержит полную информацию о пространственных параметрах 70.
Окончательная информация о наборе пространственных параметров 80 содержит, таким образом, второй поднабор пространственных параметров, которые остаются неизменными, несмотря на то, что подвергаются дифференциальному кодированию, и представление первого поднабора пространственных параметров, которое может быть либо представлением непосредственно первого поднабора 112, подвергнутым дифференциальному кодированию, либо представлением разностных параметров 118, подвергнутым дифференциальному кодированию, в зависимости от того, какое представление требует более низкой скорости передачи данных.
Пригодные для использования декодером параметры 78 параметрического стерео, которые определяет блок 64 объединения параметров согласно изобретению, определяются первым дифференциальным кодировщиком 102. Первый дифференциальный кодировщик 102 принимает в качестве входных сигналов измененные параметры 110 параметрического стерео и определяет пригодные для использования декодером параметры 78 параметрического стерео посредством дифференциального кодирования измененных параметров 110 параметрического стерео.
Иными словами, фиг. 4 иллюстрирует блок совместного кодирования, который берет в качестве входных сигналов и пространственный параметр, и параметр ПС и генерирует и пространственную дополнительную информацию, и дополнительную информацию ПС. Необязательный блок изменения параметров ПС берет в качестве входных сигналов и пространственный параметр, и параметр ПС и генерирует измененный параметр ПС. Это позволяет обеспечить лучшее предсказание пространственного параметра за счет ухудшения качества двухканального стереофонического сигнала, восстановленного из измененного параметра ПС. Если блок изменения параметра ПС не используется, то поступающий параметр ПС непосредственно служит в качестве входного сигнала для блока предсказания пространственного параметра и для кодирования ПС. (Измененный) набор параметров ПС может быть закодирован при помощи временного дифференциального (dt) или частотно-дифференциального (df) кодирования, то есть при помощи кодирования разностей последующих параметров соответственно во временном и частотном направлении, и кодирования по алгоритму Хаффмана, то есть статистического кодирования без потери данных, для минимизации числа битов, требуемых для представления набора параметров. Блок разделения параметра разделяет набор пространственных параметров во втором поднаборе, который кодируется непосредственно, и дополняющий первый поднабор, который содержит все остальные параметры, и кодирование которого может осуществляться с использованием предсказания параметров. Блок предсказания пространственных параметров берет в качестве входных сигналов второй поднабор пространственного параметра и (измененного) параметра ПС и вычисляет предсказанные значения для первого поднабора пространственного параметра. Затем эти предсказанные значения вычитаются из фактических значений пространственных параметров, содержащихся в первом поднаборе, что дает набор значений ошибок предсказания.
Второй поднабор параметров может кодироваться при помощи временного или частотного дифференциального кодирования и кодирования по алгоритму Хаффмана для минимизации числа битов, требуемых для представления поднабора параметров. Первый поднабор параметров может кодироваться при помощи временного или частотного дифференциального кодирования и кодирования по алгоритму Хаффмана для минимизации числа битов, требуемых для представления поднабора параметров. Значения ошибок предсказания для первого поднабора параметров могут кодироваться при помощи временного или частотного дифференциального кодирования и кодирования по алгоритму Хаффмана для минимизации числа битов, требуемых для представления набора параметров. Блок управления выбирает, следует ли первый поднабор параметров кодировать непосредственно или следует кодировать ошибку предсказания для минимизации числа битов, требуемых для представления первого поднабора параметров. Этот выбор может быть сделан отдельно для каждого параметра из поднабора. Фактическое решение о выборе может быть либо передано в двоичном потоке в качестве дополнительной информации или может быть основано на правилах, которые являются составной частью предсказания пространственных параметров. В последнем случае, это решение не обязательно передавать в виде дополнительной информации. Наконец, мультиплексор объединяет все закодированные данные с получением пространственной дополнительной информации.
Для использования принципа кодирования и декодирования согласно изобретению можно осуществить различные варианты реализации предсказания параметров. Вообще говоря, имеется возможность использовать соответствующим образом составленные просмотровые таблицы для получения предсказания для первого набора пространственных параметров из стереофонических параметров и второго поднабора пространственных параметров, или, в альтернативном варианте, для получения пространственных параметров на основе знаний конкретных процессов понижающего микширования и способов получения пространственных параметров и стереофонических параметров можно применить аналитическую функцию. Следующие абзацы представляют собой обзор некоторых частных примеров получения соответствующего предсказания.
В этом обзоре за основу взят многоканальный сигнал, имеющий три канала,
- l: левый,
- c: центральный,
- r: правый,
который должен рассматриваться исключительно в качестве примера. Очевидно, что изложенные принципы можно также применить соответствующим образом и к другим конфигурациям каналов. Например, в случае конфигурации каналов 5.1, левый передний и левый задний каналы могут быть объединены при помощи модуля параметрического стерео с образованием левого сигнала (l), правый передний и правый задний каналы могут быть объединены при помощи модуля параметрического стерео с образованием правого (r) сигнала, а центральный канал и канал коррекции низкой частоты могут быть объединены при помощи модуля параметрического стерео с образованием центрального сигнала (c).
В нижеследующем описании более подробно обсуждается блок предсказания пространственных параметров. Два канала стереофонического сигнала, полученного понижающим микшированием, обозначены:
l0: левый сигнал, полученный понижающим микшированием,
r0: правый сигнал, полученный понижающим микшированием,
а монофонический сигнал, полученный понижающим микшированием, обозначен:
m: монофонический сигнал, полученный понижающим микшированием.
Блок предсказания выдает предсказанные значения ŝ1,...,ŝK первых K квантованных пространственных параметров s1,...,sk (то есть первый поднабор пространственных параметров) на основе квантованных измененных или неизмененных параметров
ПС p1, p2 и второго поднабора sK+1,sK+2...,sN остальных квантованных пространственных параметров.
В наиболее общем виде он состоит из табличной функции (просмотровой таблицы)
1,...,ŝK)=F(p1,p2,sK+1,sK+2...,sN) (1)
Тогда разностный сигнал равен ошибке предсказания
(d1,...,dK)=(s11,...,sKK) (2)
Первый способ построения функции F заключается в том, чтобы представить ее в виде табличной функции или полинома от многих аргументов для минимизации ошибки предсказания в смысле наименьших квадратов по большой базе данных параметров. В альтернативном варианте функция F может быть выбрана таким образом, чтобы минимизировать получившуюся скорость передачи данных, требуемую для представления первого поднабора пространственных параметров, когда для поиска оптимальной в этом смысле F в качестве обучающих данных используется большая база данных параметров. Перед использованием в блоке предсказания такая табличная функция или полином может быть подвергнута операции округления или дискретизации для получения целочисленных результатов.
Важным особым случаем такого подхода является использование линейного предсказания, когда функция F является полиномом первой степени.
Второй класс предсказывающих функций - это такие функции, которые учитывают фактическую структуру используемых параметров. В предпочтительном варианте осуществления изобретения K=2 и N=4, и параметры передают информацию в соответствии со следующими правилами:
p1: iid_l0_r0 межканальная разность интенсивностей (МРИ) между каналами l0 и r0;
p2: icc_l0_r0 межканальная согласованность или взаимная корреляция (МВК) между каналами l0 и r0;
s1: iid_l_r межканальная разность интенсивностей (МРИ) между каналами l и r;
s2: icc_l_r межканальная согласованность или взаимная корреляция (МВК) между каналами l и r;
s3: iid_lr_c межканальная разность интенсивностей (МРИ) между каналами l+r и c;
s4: icc_lr_c межканальная согласованность или взаимная корреляция (МВК) между каналами l+r и c.
Первым примером такой функции является особый случай указанной выше линейной предсказывающей функции, который заключается просто в том, что
ŝ1=p1, ŝ2=p2. (3)
Достоинство этой простой предсказывающей функции заключается в том, что она ведет к более устойчивой ошибке предсказания (а не к минимальной ошибке предсказания), что хорошо подходит для временного дифференциального и частотного дифференциального кодирования указанной ошибки предсказания. Это верно для всех предсказывающих функций типа упомянутых выше полиномов.
Второй пример основан на предположении, что стереофонический сигнал, полученный понижающим микшированием, имеет вид
l0=l+q·c, r0=r+q·c, (4)
где коэффициент усиления q центрального канала является известной величиной (обычно 1 или
Figure 00000001
). Все сигналы l, r, c являются векторами конечной длины, выведенными из временного и частотного интервала отчетов в поддиапазоне, полученных по результатам анализа комплексно-модулированного блока фильтров временных сигналов. Для комплексных векторов x, y, комплексное скалярное произведение и среднеквадратичная норма определяются формулой:
Figure 00000002
(5)
где звездочка обозначает комплексное сопряжение. Линейные и недискретизированные варианты параметров МРИ тогда принимаются равными
Figure 00000003
,
Figure 00000004
,
Figure 00000005
.
(6)
Для параметров МВК в случае взаимной корреляции, формулы имеют вид:
Figure 00000006
,
Figure 00000007
,
Figure 00000008
.
(7)
В случае наличия согласованности в формулах (7) операции над вещественными значениями заменяются на операции над абсолютными значениями (комплексной величиной).
Принимая для простоты, что <l,c>=<r,c>=0, получаем, что L0=L+q2C и R0=R+q2С, и эти выражения можно вставить в первую формулу (6). Решив два уравнения с двумя неизвестными, получаем следующие оценки для X=L/C и Y=R/C из P1 и S3:
Figure 00000009
,
Figure 00000010
(8)
Когда обе величины в формуле (8) являются положительными, оценка S1 имеет вид
Figure 00000011
. Здесь требуемые значения линейных параметров получены посредством деквантификации данных целочисленных параметров, и затем получают целочисленную оценку ŝ1 параметров посредством квантования Ŝ1.
Когда является приемлемым несколько пониженное качество декодированного стереофонического сигнала, общую скорость передачи данных можно еще больше уменьшить, используя изменения параметров параметрического стерео. Цель этого изменения заключается в том, чтобы обеспечить более устойчивое предсказание первого поднабора пространственных параметров и уменьшенную ошибку предсказания. Его можно рассматривать в качестве средства повысить устойчивость вышеприведенных расчетов. Предельный случай такого изменения параметров заключается в использовании выражений p1'=s1, p2'=s2, где p1', p2' обозначают измененные параметры параметрического стерео. Поскольку эта операция по изменению параметров проводится только на стороне кодировщика, на стороне декодера не нужно предпринимать никаких особых мер.
Более общий подход включает в себя полную информацию о структуре мощности и корреляции, доступную в P1, P2, S3, S4 через формулы (6) и (7) для получения оценок S1 и S2. В силу масштабной инвариантности параметров можно для целей расчетов предположить без нарушения общности, что C=1. Тогда, если обозначить
a=Re<l,c>, b=Re<r,c>, ρ=Re<l,r>, (9)
получается следующая система уравнений:
Figure 00000012
(10)
L, R, ρ являются интересующими нас неизвестными, требуемыми для оценки, a, b являются дополнительными неизвестными. Эту (неопределенную) систему уравнений можно использовать в качестве правила для получения множества предсказывающих форму, зависящих от выбора ограничений на пару a, b. Например, из первого и третьего уравнения (10) следует, что
Figure 00000013
(11)
поэтому вычисления, которые приводят к формулам (8), соответствуют случаю, когда
Figure 00000014
. В более общем виде ограничения на пару a, b определяются эвристическим параметром γ в соответствии с формулой
Figure 00000015
.
Следует вновь подчеркнуть, что вышеуказанные схемы предсказания являются лишь примерами возможных схем предсказания, которые могут быть реализованы как на стороне кодировщика, так и на стороне декодера.
На фиг. 5 приведен декодер 200 многоканального звука согласно изобретению для обработки параметрического представления 202.
Параметрическое представление 202 содержит информацию о наборе пространственных параметров 204, описывающих пространственные свойства многоканального сигнала и пригодных для использования декодером стереофонических параметров 206, описывающих пространственные свойства стереофонического понижающего микширования многоканального сигнала. Декодер 200 многоканального звука согласно изобретению имеет блок 208 восстановления параметров для объединения пригодных для использования декодером стереофонических параметров 206 и информации о наборе пространственных параметров для получения пространственных параметров 210.
На фиг. 6 приведен вариант осуществления декодера 220 многоканального звука согласно настоящему изобретению. Декодер 220 многоканального звука имеет блок 222 разложения двоичного потока (демультиплексор), декодер 224 звука, блок 226 восстановления параметров (совместный декодер) и блок 228 повышающего микширования.
Блок 222 разложения двоичного потока принимает обратно совместимый двоичный поток 230, содержащий звуковой двоичный поток 231, информацию о наборе 232 пространственных параметров и пригодных для использования декодером стереофонических параметрах (дополнительную информацию ПС) 234. Блок разложения двоичного потока раскладывает, или демультиплексирует, обратно совместимый двоичный поток 230 для получения звукового двоичного потока 231, информации о наборе 232 пространственных параметров и пригодных для использования декодером стереофонических параметров 234. Декодер 224 звука принимает в качестве входного сигнала звуковой двоичный поток 231 и получает из звукового двоичного потока 231 монофонический сигнал 236, полученный понижающим микшированием.
Блок 226 восстановления параметров принимает в качестве входных сигналов информацию о наборе 232 пространственных параметров и пригодных для использования декодером стереофонических параметрах 234. Блок 226 восстановления параметров объединяет информацию о наборе пространственных параметров и пригодных для использования декодером стереофонических параметрах для получения набора пространственных параметров 238, который служит в качестве входного сигнала для блока 228 повышающего микширования, который дополнительно получает в качестве второго входного сигнала монофонический сигнал, полученный понижающим микшированием. На основе пространственных параметров 238 и монофонического сигнала 236, полученного понижающим микшированием, блок 228 повышающего микширования получает на своем выходе восстановленный многоканальный сигнал 240.
Таким образом, на фиг. 6 приведен декодер пространственного звука, который принимает в качестве входного сигнала совместимый двоичный поток и генерирует многоканальный звуковой сигнал, содержащий каналы l, r и c. Сначала демультиплексор принимает в качестве входного сигнала совместимый двоичный поток и раскладывает его на звуковой двоичный поток и на пространственную дополнительную информацию и дополнительную информацию ПС. Если к монофоническому сигналу применяется перцептуальное кодирование звука, соответствующий декодер звука принимает в качестве входного сигнала звуковой двоичный поток и генерирует декодированный монофонический звуковой сигнал m, подверженный искажениям, введенным перцептуальным кодеком звука. Блок совместного декодирования принимает в качестве входных сигналов пространственную дополнительную информацию и дополнительную информацию ПС и восстанавливает пространственные параметры. Наконец, блок пространственного восстановления принимает в качестве входных сигналов декодированный монофонический сигнал m и пространственные параметры и восстанавливает многоканальный звуковой сигнал.
На фиг. 7 приведено подробное описание блока 226 восстановления параметров, используемого в многоканальном декодере 220 звука. Блок 226 восстановления параметров содержит блок 250 разъединения пространственных параметров, блок 252 управления, блок 254 предсказания пространственных параметров, блок 256 соединения пространственных параметров и первый дифференциальный декодер 258, второй дифференциальный декодер 260, третий дифференциальный кодировщик 262a и четвертый дифференциальный декодер 262b.
Блок 250 разъединения пространственных параметров принимает в качестве входного сигнала информацию о наборе 232 пространственных параметров и получает первый поднабор 266 и второй поднабор 268 из набора параметров 232 пространственного звука. Первый поднабор 266 содержит параметры, которые можно представить при помощи предсказательного разностного представления, выполненного на стороне кодировщика, а второй поднабор 268 содержит поднабор информации о наборе пространственных параметров, который передается в двоичном потоке в неизмененном виде.
Кроме того, блок 252 управления факультативно принимает управляющую информацию от блока разъединения пространственных параметров, указывающую, использовалось ли или нет во время кодирования предсказательное разностное представление. Эта информация факультативная в том смысле, что блок 252 управления может альтернативным образом определить при помощи соответствующих алгоритмов, было ли выполнено такое предсказание или нет, даже не имея доступа к указывающему параметру.
Второй поднабор параметров 268 является входным сигналом для второго дифференциального декодера 260, который подвергает дифференциальному декодированию второй поднабор для определения второго поднабора пространственных параметров 270.
Первый дифференциальный декодер 258 принимает в качестве входного сигнала пригодные для использования декодером стереофонические параметры 234 для определения из закодированного представления параметров 272 параметрического стерео. Блок 254 предсказания пространственных параметров действует аналогично аналогичному блоку на стороне кодировщика, поэтому он принимает в качестве первого входного сигнала параметры 272 параметрического стерео, а в качестве второго входного сигнала второй поднабор пространственных параметров 270 для определения предсказанных параметров 274.
Блок 252 управления управляет двумя возможными различными путями прохождения данных для первого поднабора информации о наборе пространственных параметров. Когда блок 252 управления указывает, что первый поднабор информации набора пространственных параметров был передан без использования предсказательного разностного кодирования, блок 252 управления устанавливает переключатели 278a и 278b таким образом, что первый поднабор 266 является входным сигналом для третьего дифференциального декодера 262a для определения первого поднабора набора пространственных параметров 280 без применения обратного предсказания. Затем первый поднабор пространственных параметров 280 поступает в качестве входного сигнала на второй вход блока 256 соединения пространственных параметров.
Если, однако, блок 252 управления указывает на разностным образом предсказанные параметры, первый поднабор 266 информации о наборе пространственных параметров является входным сигналом для четвертого дифференциального декодера 262b для определения разностного предсказанного представления первого поднабора 266 на выходе 282 дифференциального декодера. Затем сумматор 284 вычисляет сумму разностного представления и предсказанных параметров 274, выполняя таким образом операцию, обратную операции разностного предсказания, выполненной на стороне кодировщика. В результате на второй вход блока 256 соединения пространственных параметров поступает первый набор пространственных параметров. Блок 256 соединения пространственных параметров объединяет первый набор пространственных параметров 256 и второй набор пространственных параметров 270 для получения полного набора пространственных параметров 290 на его выходе, что является основой для многоканального восстановления закодированного сигнала.
Итак, на фиг. 7 приведен блок совместного декодирования, который принимает в качестве входных сигналов пространственную дополнительную информацию и дополнительную информацию ПС и восстанавливает пространственный параметр. Демультиплексор разделяет пространственную дополнительную информацию в закодированном втором поднаборе пространственного параметра и закодированном первом поднаборе пространственного параметра, и управляющую информацию. Блок декодирования принимает в качестве входного сигнала второй поднабор пространственного параметра и восстанавливает этот поднабор параметра. Эта операция включает в себя декодирование по алгоритму Хаффмана и временное дифференциальное (dt) или частотное дифференциальное (df) декодирование в случае, если такое декодирование применялось в кодировщике. Блок декодирования принимает в качестве входного сигнала дополнительную информацию ПС и восстанавливает (измененный) параметр ПС. Блок предсказания пространственных параметров принимает в качестве входных сигналов второй поднабор пространственных параметров и (измененный) параметр ПС и вычисляет предсказанное значение для первого поднабора пространственного параметра таким же образом, что и соответствующий блок в кодировщике. Блок управления определяет, какое решение о выборе было принято соответствующим блоком управления в кодировщике. В зависимости от сделанного выбора закодированный первый поднабор пространственного параметра либо декодируется непосредственно, либо декодируется с учетом предсказания. В обоих случаях эта операция включает в себя декодирование по алгоритму Хаффмана и временное или частотное дифференциальное кодирование в случае, если такое кодирование применялось в кодировщике. В случае если блок управления решил, что предсказание не использовалось, выходной сигнал блока считается восстановленным первым поднабором пространственного параметра. В противном случае выходной сигнал блока декодирования содержит значения ошибок предсказания, сгенерированные блоком предсказания пространственного параметра, для получения первоначальных значений первого поднабора пространственных параметров. Наконец, восстановленные первый и второй поднаборы пространственных параметров соединяются с образованием полного набора пространственных параметров.
На фиг. 8 показано, как совместимый двоичный поток согласно изобретению обрабатывается обычным декодером параметрического стерео для получения стереофонического повышающего микширования сигнала с целью подчеркнуть большое преимущество полной обратной совместимости, заложенной в идее изобретения.
Декодер 300 параметрического стерео принимает в качестве входного сигнала совместимый двоичный поток 302. Декодер 300 параметрического стерео содержит демультиплексор 304, декодер 306 звука, дифференциальный декодер 308 и блок 310 повышающего микширования. Демультиплексор 304 принимает из совместимого двоичного потока 302 звуковой двоичный поток 312 и пригодные для использования декодером параметры 314 параметрического стерео.
Поскольку декодер 300 параметрического стерео не может работать с параметрами пространственного звука, демультиплексор 304 просто игнорирует параметры пространственного звука, содержащиеся в совместимом двоичном потоке 302, например, пропуская в двоичном потоке поля заголовков и связанные с ними участки данных, неизвестные декодеру. Звуковой двоичный поток 312 является входным сигналом для декодера 306 звука, который получает монофонический сигнал 316, полученный понижающим микшированием, тогда как пригодные для использования декодером стереофонические параметры 314 подвергаются дифференциальному декодированию дифференциальным декодером 308 с целью получения параметров 318 параметрического стерео. Монофонический сигнал 316, полученный понижающим микшированием, и параметры 318 параметрического стерео являются входными сигналами для блока 310 повышающего микширования, которые получает стереофонический сигнал 320, полученный повышающим микшированием, используя монофонический сигнал 316, полученный понижающим микшированием, и параметры 318 параметрического стерео.
Иными словами, на фиг. 8 приведен декодер параметрического стерео (ПС), который принимает в качестве входного сигнала совместимый двоичный поток и генерирует двухканальный стереофонический звуковой сигнал, содержащий каналы l0 и r0. Сначала двоичный поток принимает в качестве входного сигнала демультиплексор и раскладывает его на звуковой двоичный поток и дополнительную информацию ПС. Поскольку пространственная информация стороны была встроена в совместимый двоичный поток обратно совместимым образом, она не влияет на демультиплексор. Если к монофоническому сигналу применялось перцептуальное кодирование звука, то соответствующий декодер звука принимает в качестве входного сигнала звуковой двоичный поток и генерирует декодированный монофонический звуковой сигнал m, подлежащий искажению, вводимому перцептуальным кодеком звука. Блок декодирования ПС принимает в качестве входного сигнала дополнительную информацию ПС и восстанавливает параметр ПС. Эта операция включает в себя декодирование по алгоритму Хаффмана и временное дифференциальное (dt) декодирование или частотное дифференциальное (df) декодирование в случае, если такое кодирование применялось в кодировщике. Наконец, блок восстановления ПС принимает в качестве входных сигналов декодированный монофонический сигнал m и параметры ПС и восстанавливает двухканальный стереофонический сигнал.
На фиг. 9 приведено устройство 330 передачи или записи звука согласно изобретению, которое имеет кодировщик 10 звука, входной интерфейс 332 и выходной интерфейс 334.
Звуковой сигнал может быть подан на входной интерфейс 332 устройства 330 передачи/записи. Звуковой сигнал кодируется кодировщиком 10 по изобретению, входящим в состав устройства передачи/записи, и закодированное представление выдается на выходной интерфейс 334 устройства 330 передачи/записи. Закодированное представление может затем быть передано или сохранено на носители записи.
На фиг. 10 приведено устройство 340 приема или звуковоспроизведения, имеющее декодер 180 звука согласно изобретению, вход 342 двоичного потока и звуковой выход 344.
Двоичный поток может поступать на вход 342 устройства 340 приема/звуковоспроизведения, и декодированный сигнал поступает на выход или воспроизводится на выходе 344 устройства приема/звуковоспроизведения согласно изобретению.
На фиг. 11 приведена передающая система, содержащая передатчик 330 согласно изобретению и приемник 340 согласно изобретению.
Входной звуковой сигнал на входном интерфейсе 332 из передатчика 330 кодируется и передается с выхода 334 передатчика 330 на вход 342 приемника 340. Приемник декодирует звуковой сигнал и воспроизводит или выводит звуковой сигнал на своем выходе 344.
Обобщая идею изобретения, можно сказать, что настоящее изобретение относится к кодированию многоканальных представлений звуковых сигналов, использующих параметры пространственного звука таким образом, который совместим с кодированием двухканальных стереофонических сигналов, использующих параметры параметрического стерео. Настоящее изобретение представляет новые способы эффективного кодирования, как параметров пространственного звука, так и параметров параметрического стерео, и встраивания закодированных параметров в двоичный поток обратно совместимым образом. В частности, изобретение направлено на минимизацию общей скорости передачи данных для параметров параметрического стерео и пространственного звука в обратно совместимом двоичном потоке без ухудшения качества декодированного стереофонического или многоканального звукового сигнала. Однако в случае приемлемости небольшого ухудшения качества декодированного стереофонического сигнала общую скорость передачи данных можно еще более сократить.
Хотя двоичные потоки, описывающие обратную совместимость сигнала по изобретению и его генерацию, не содержат параметров, описывающих монофонический сигнал, полученный понижающим микшированием, представляется само собой разумеющимся, что такие параметры могут быть легко встроены в указанный двоичный поток.
При помощи параметров параметрического стерео можно предсказать произвольное число параметров пространственного звука, если можно вывести соответствующее правило для предсказания параметров. Поэтому, должно быть ясно, что приведенные выше подробные правила предсказания являются лишь примерами. Очевидно, что можно ввести и другие правила предсказания, которые обеспечат такую же экономию битов, и потому настоящее изобретение ни в коей мере не ограничивается использованием одного из описанных выше правил предсказания.
Хотя блок 58 понижающего микширования параметрического стерео, который получает стереофоническое понижающее микширование многоканального сигнала, присутствует в приведенных примерах кодировщиков согласно изобретению, при практической реализации блок стереофонического понижающего микширования можно исключить, если известно правило понижающего микширования и когда поэтому можно получить параметры параметрического стерео непосредственно из многоканального сигнала.
В приведенных вариантах выполнения монофонический сигнал, полученный понижающим микшированием, дополнительно кодируется кодировщиком звука или декодируется на стороне декодера. Кодирование и декодирование являются необязательными операциями, то есть при отсутствии дополнительного сжатия монофонического сигнала, полученного понижающим микшированием, кодировщик и декодер также являются кодировщиком и декодером согласно изобретению, содержащими идею изобретения.
Блок управления в кодировщиках и декодерах по изобретению может быть исключен, и можно прибегнуть к общему решению для представления поднаборов пространственных параметров разностным образом предсказанными параметрами с целью экономии на блоке управления и за счет допущения в редких случаях несколько более высокой скорости передачи данных, когда разностным образом предсказанные параметры не дают экономии на скорости передачи данных.
Хотя в приведенных примерах дополнительные кодировщики, применяемые на путях прохождения сигнала, называются только дифференциальными кодировщиками и дифференциальными декодерами, ясно, что для сжатия параметров можно также использовать любой другой подходящий кодировщик или декодер, в частности, сочетание дифференциальных декодера и кодировщика с декодером и кодировщиком, работающим по алгоритму Хаффмана. Такое сочетание используется таким образом, что сначала параметры кодируются дифференциальным образом, а затем дифференциально закодированные параметры кодируются по алгоритму Хаффмана, что, в конечном счете, приводит к параметрическому представлению, использующему более низкие скорости передачи данных, поскольку разностным образом предсказанное представление имеет более низкую энтропию по сравнению с лежащими в их основе пространственными параметрами.
Если обобщить идеи изобретения, то настоящее изобретение позволяет получить следующее.
В своем первом варианте изобретение представляет собой способ совместимого кодирования многоканальных звуковых сигналов, отличающийся тем, что на стороне кодировщика осуществляют понижающее микширование многоканального сигнала до одноканального представления; на стороне кодировщика на основе указанного многоканального сигнала определяют параметры, представляющие многоканальный сигнал; на стороне кодировщика на основе указанного многоканального сигнала определяют параметры, представляющие стереофоническое понижающее микширование многоканального сигнала; на стороне кодировщика встраивают оба набора параметров в двоичный поток эффективным с точки зрения скорости передачи данных и обратно совместимым образом; на стороне декодера извлекают встроенные параметры из двоичного потока; на стороне декодера восстанавливают параметры, представляющие многоканальный сигнал, из параметров, извлеченных из двоичного потока; на стороне декодера восстанавливают многоканальные выходные сигналы на основе параметров, восстановленных из двоичного потока данных, и указанного сигнала, полученного понижающим микшированием.
Во втором варианте изобретение представляет собой способ по первому варианту, отличающийся тем, что встраивают в двоичный поток параметры, представляющие стереофоническое понижающее микширование, так что их можно декодировать (обычным) способом декодирования, который поддерживает только декодирование параметрического стерео.
В третьем варианте изобретение представляет собой способ по первому варианту, отличающийся тем, что разделяют наборы параметров, представляющих многоканальный сигнал, на первый поднабор и второй поднабор.
В четвертом варианте изобретение представляет собой способ по третьему варианту, отличающийся предсказанием значений в указанном первом поднаборе параметров на основе указанного первого поднабора параметров и на основе параметров, которые представляют стереофоническое понижающее микширование многоканального сигнала.
В пятом варианте изобретение представляет собой способ по четвертому варианту, отличающийся способом управления, который автоматически выбирает, закодирован ли первый поднабор параметров непосредственно или закодированы только разности относительно предсказанных значений параметров.
В шестом варианте изобретение представляет собой способ по третьему варианту, отличающийся изменением параметров, которые представляют стереофоническое понижающее микширование, когда и первоначальные параметры, представляющие многоканальный сигнал, и первоначальные параметры, представляющие стереофоническое понижающее микширование, используются в качестве основы для получения измененных параметров.
В седьмом варианте изобретение представляет собой способ по четвертому варианту, отличающийся тем, что для поиска указанных предсказанных значений параметров используется просмотровая таблица.
В восьмом варианте изобретение представляет собой способ по четвертому варианту, когда для поиска указанных предсказанных значений параметров в четвертом варианте используется полиномиальная функция.
В девятом варианте изобретение представляет собой способ по четвертому варианту, отличающийся тем, что для поиска указанных предсказанных значений параметров используется математическая функция, полученная способом, применяемым для генерации стереофонического понижающего микширования.
В десятом варианте изобретение представляет собой устройство для кодирования представления многоканального звукового сигнала, характеризующееся: средством для понижающего микширования многоканального сигнала до одноканального представления; средством для определения параметров, представляющих многоканальный сигнал; средством для определения параметров, представляющих стереофоническое понижающее микширование многоканального сигнала; средством для встраивания обоих наборов параметров в двоичный поток эффективным с точки зрения скорости передачи данных и обратно совместимым образом.
В одиннадцатом варианте изобретение представляет собой устройство для восстановления многоканального сигнала на основе сигнала, полученного понижающим микшированием, и наборов соответствующих параметров, характеризующееся: средством для извлечения набора параметров, встроенных в двоичный поток; средством для восстановления параметров, представляющих многоканальный сигнал, из параметров, извлеченных из двоичного потока; средством для восстановления многоканального выходного сигнала на основе набора параметров, восстановленного из двоичного потока данных, и указанного сигнала, полученного понижающим микшированием.
В зависимости от некоторых требований к реализации способов согласно изобретению способы согласно изобретению могут быть реализованы аппаратным или программным образом. Реализация может быть осуществлена при помощи цифрового носителя записи, в частности при помощи DVD-диска или компакт-диска, имеющего записанные на нем управляющие сигналы, считываемые электронным образом, который работает совместно с программируемой компьютерной системой, так что выполняются способы согласно изобретению. Поэтому в целом настоящее изобретение является компьютерным программным продуктом, содержащим программный код, хранящийся на машиночитаемом носителе, причем программный код работает так, что выполняет способы согласно изобретению, когда компьютерный программный продукт выполняется на компьютере. Иными словами, способы по изобретению являются поэтому компьютерной программой, имеющей программный код для выполнения по меньшей мере одного способа согласно изобретению, когда компьютерная программа выполняется на компьютере.
Хотя вышеприведенное изобретение было проиллюстрировано и описано со ссылкой на частные варианты его выполнения, специалистам в данной области техники должно быть ясно, что в его форму и частности могут быть внесены различные другие изменения с сохранением сущности и объема изобретения. Должно быть понятно, что можно внести различные изменения, позволяющие приспособить изобретение к различным вариантам осуществления, не отступая от замысла изобретения в самом широком понимании, охватываемого нижеприведенной формулой.

Claims (31)

1. Декодер (200) для обработки параметрического представления (202) многоканального звукового сигнала, причем параметрическое представление (202) содержит стереофонический параметр (206), описывающий пространственные свойства стереофонического понижающего микширования многоканального сигнала, и информацию об одном или нескольких пространственных параметрах (204), описывающих пространственные свойства многоканального сигнала, информация об одном или нескольких пространственных параметрах зависит от стереофонического параметра, причем информация об одном или нескольких пространственных параметрах (204) и стереофонический параметр (206), объединенные при помощи правила объединения, дают один или несколько пространственных параметров (210), при этом декодер содержит:
блок (208) восстановления параметров для объединения стереофонического параметра (206) и информации об одном или нескольких пространственных параметрах (204) при помощи правила объединения для получения одного или нескольких пространственных параметров (210).
2. Декодер (200) по п.1, в котором правило объединения таково, что объединение включает в себя замену первого поднабора параметров информации об одном или нескольких пространственных параметрах (204) заменяющими параметрами, полученными посредством объединения стереофонического параметра (206) и первого поднабора параметров.
3. Декодер (200) по п.2, в котором правило объединения таково, что заменяющий параметр получен посредством линейной комбинации соответствующего параметра из первого поднабора параметров и предсказания этого же параметра, причем предсказание получено при помощи параметров из второго поднабора информации об одном или нескольких пространственных параметрах (204), и стереофонического параметра (206), объединяя их при помощи правила предсказания.
4. Декодер (200) по п.3, в котором правило предсказания таково, что предсказание получают при помощи стереофонического параметра (206).
5. Декодер (200) по п.4, в котором правило предсказания таково, что стереофонический параметр (206) используется в качестве предсказания пространственного параметра.
6. Декодер (200) по одному из предыдущих пунктов, в котором стереофонический параметр (206) содержит первый параметр P1, описывающий разность интенсивностей между каналами стереофонического понижающего микширования, и второй параметр P2, описывающий корреляцию между каналами стереофонического понижающего микширования;
причем второй поднабор параметров содержит параметр S3, описывающий разность интенсивностей между суммой левого канала и правого канала многоканального сигнала и центральным каналом многоканального сигнала; и
правило предсказания таково, что параметр S1 из первого поднабора параметров, параметр, описывающий разность интенсивностей между левым каналом и правым каналом многоканального сигнала, предсказывается параметром предсказания Ŝ1 согласно следующим формулам:
Figure 00000016

где
Figure 00000017
Figure 00000018
7. Декодер (200, 220) по п.1, в котором блок (226) восстановления параметров дополнительно содержит блок (252) принятия решения для принятия решения о том, был ли заменен первый поднабор параметров заменяющими параметрами или нет.
8. Декодер (200, 220) по п.1, дополнительно содержащий блок (222) разложения двоичного потока для разложения представления стереофонического параметра (234) и представления информации на один или более пространственных параметров (232) из двоичного потока (230), причем двоичный поток (230) является обратно совместимым, чтобы допускать обработку обычными устройствами параметрического стерео.
9. Декодер (200, 220) по п.8, дополнительно содержащий статистический декодер и дифференциальный декодер (258, 260, 262а, 262b) для получения стереофонического параметра (272) и информации об одном или нескольких пространственных параметрах (266, 268) из представления стереофонического параметра (234) и из представления информации об одном или нескольких пространственных параметрах (232).
10. Декодер (220) по п.8, в котором блок (222) разложения двоичного потока дополнительно осуществлен с возможностью разложения полученного понижающим микшированием монофонического сигнала (236) из битового потока, причем полученный понижающим микшированием монофонический сигнал (236) является монофоническим понижающим микшированием многоканального сигнала; и
который дополнительно содержит блок (228) повышающего микширования для получения восстановления многоканального сигнала (240) при помощи полученного понижающим микшированием сигнала (236) и одного или нескольких параметров (238).
11. Декодер (220) по п.10, дополнительно содержащий декодер (224) звука для получения полученного понижающим микшированием монофонического сигнала (236) из закодированного представления полученного понижающим микшированием монофонического сигнала (231), полученного разложением из двоичного потока (230).
12. Кодировщик (10) для получения параметрического представления (12) многоканального звукового сигнала, причем параметрическое представление (12) содержит параметры, подходящие для использования совместно с монофоническим сигналом, полученным понижающим микшированием, кодировщик (10) содержит:
блок (14) вычисления пространственных параметров для вычисления одного или нескольких пространственных параметров (20), описывающих пространственные свойства многоканального сигнала;
блок (16) вычисления стереофонического параметра для вычисления стереофонического параметра (22), описывающего пространственные свойства стереофонического сигнала, полученного понижающим микшированием из многоканального сигнала; и
блок (18) объединения параметров для генерации параметрического представления (12) посредством объединения одного или нескольких пространственных параметров (20) и стереофонических параметров (22) при помощи правила объединения, причем блок (18) объединения параметров выполнен с возможностью применять правило объединения, дающее пригодный для использованием декодером стереофонический параметр (24) и информацию (26) об одном или нескольких пространственных параметрах, при этом информация об одном или нескольких пространственных параметрах зависит от стереофонического параметра, который представляет совместно с пригодным для использования декодером стереофоническим параметром (24) один или несколько пространственных параметров (20).
13. Кодировщик (10; 52) по п.12, в котором блок (16) вычисления стереофонического параметра дополнительно содержит блок (58) стереофонического понижающего микширования для получения стереофонического сигнала (72), полученного понижающим микшированием, из многоканального сигнала (50).
14. Кодировщик (10; 52) по п. 12 или 13, дополнительно содержащий блок (54) пространственного понижающего микширования для получения монофонического сигнала (68), полученного понижающим микшированием, из многоканального сигнала (50).
15. Кодировщик (10; 52) по п.12, дополнительно содержащий блок (66) вычисления двоичного потока для получения такого двоичного потока (82), содержащего параметрическое представление и монофоническое понижающее микширование, таким образом, что он является обратно совместимым с обычными декодерами параметрического стерео.
16. Кодировщик по п.14, в котором блок (54) пространственного понижающего микширования дополнительно содержит кодировщик (62) звука для сжатия монофонического сигнала (68), полученного понижающим микшированием, при помощи правила сжатия.
17. Способ обработки параметрического представления многоканального звукового сигнала, причем параметрическое представление содержит стереофонический параметр (206), описывающий пространственные свойства стереофонического понижающего микширования многоканального сигнала, и информацию об одном или нескольких пространственных параметрах, описывающих пространственные свойства многоканального сигнала, информация об одном или нескольких пространственных параметрах зависит от стереофонического параметра, причем информация об одном или нескольких пространственных параметрах и стереофонические параметры, объединенные при помощи правила объединения, дают один или несколько пространственных параметров, способ содержит этап, на котором:
объединяют стереофонический параметр и информацию об одном или нескольких пространственных параметрах при помощи правила объединения для получения одного или нескольких пространственных параметров.
18. Способ получения параметрического представления многоканального звукового сигнала, причем параметрическое представление содержит параметры, подходящие для использования совместно с монофоническим сигналом, полученным понижающим микшированием, способ содержит этапы, на которых:
вычисляют один или несколько пространственных параметров, описывающих пространственные свойства многоканального сигнала;
вычисляют стереофонический параметр, описывающий пространственные свойства стереофонического сигнала, полученного понижающим микшированием из многоканального сигнала; и
генерируют параметрическое представление посредством объединения одного или нескольких пространственных параметров и стереофонического параметра при помощи правила объединения, причем применение правила объединения дает пригодный для использования декодером стереофонический параметр и информацию об одном или нескольких пространственных параметрах, причем информация об одном или нескольких пространственных параметрах, зависящая от стереофонического параметра, представляет, совместно с пригодным для использования декодером стереофоническим параметром, упомянутый один или несколько пространственных параметров.
19. Считываемый компьютером носитель данных, хранящий многоканальный звуковой сигнал, содержащий параметрическое представление, причем параметрическое представление содержит параметры, подходящие для использования совместно с монофоническим сигналом, полученным понижающим микшированием, при этом параметрическое представление содержит пригодный для использования декодером стереофонический параметр, описывающий пространственные свойства стереофонического понижающего микширования многоканального сигнала, и информацию об одном или нескольких пространственных параметрах, сгенерированных посредством объединения одного или нескольких пространственных параметров, описывающих пространственные свойства многоканального звукового сигнала, и стереофонического параметра, так что информация об одном или нескольких пространственных параметрах представляет совместно с пригодным для использования декодером стереофоническим параметром упомянутый один или несколько пространственных параметров, при этом считываемый компьютером носитель предназначен для использования в декодере по п.1.
20. Устройство (330) передачи для передачи параметрического представления многоканального звукового сигнала, содержащее кодировщик для получения параметрического представления многоканального звукового сигнала по п.12.
21. Устройство (340) приема для приема параметрического представления многоканального звукового сигнала, содержащее декодер (200) многоканального звука по п.1.
22. Способ передачи параметрического представления многоканального звукового сигнала, причем способ содержит способ получения параметрического представления многоканального звукового сигнала по п.18.
23. Способ приема параметрического представления многоканального звукового сигнала, причем способ содержит способ обработки параметрического представления по п.17.
24. Передающая система для передачи параметрического представления многоканального звукового сигнала, содержащая передатчик (330) и приемник (340);
передатчик (330) содержит кодировщик для получения параметрического представления многоканального звукового сигнала по п.12 и
приемник (340) содержит декодер по п.1.
25. Способ приемопередачи параметрического представления многоканального звукового сигнала, причем способ включает в себя способ передачи, содержащий способ получения параметрического представления многоканального звукового сигнала по п.18, и способ приема, содержащий способ обработки параметрического представления по п.17.
26. Считываемый компьютером носитель данных, хранящий компьютерный программный продукт, который при выполнении на компьютере побуждает компьютер выполнять способ по п.17.
27. Считываемый компьютером носитель данных, хранящий компьютерный программный продукт, который при выполнении на компьютере побуждает компьютер выполнять способ по п.18.
28. Устройство (330) звукозаписи, содержащее кодировщик для получения параметрического представления многоканального звукового сигнала по п.12.
29. Устройство (340) звуковоспроизведения, содержащее декодер (200) многоканального звука по п.1.
30. Способ звукозаписи, причем способ содержит способ получения параметрического представления многоканального звукового сигнала по п.18.
31. Способ звуковоспроизведения, причем способ содержит способ обработки параметрического представления по п.17.
RU2007120634/09A 2004-11-02 2005-10-31 Стереофонически совместимое кодирование многоканального звука RU2381570C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0402650-6 2004-11-02
SE0402650A SE0402650D0 (sv) 2004-11-02 2004-11-02 Improved parametric stereo compatible coding of spatial audio

Publications (2)

Publication Number Publication Date
RU2007120634A RU2007120634A (ru) 2008-12-10
RU2381570C2 true RU2381570C2 (ru) 2010-02-10

Family

ID=33448766

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007120634/09A RU2381570C2 (ru) 2004-11-02 2005-10-31 Стереофонически совместимое кодирование многоканального звука

Country Status (13)

Country Link
US (2) US7916873B2 (ru)
EP (1) EP1784819B1 (ru)
JP (1) JP4616349B2 (ru)
KR (1) KR100936498B1 (ru)
CN (1) CN101036183B (ru)
AT (1) ATE393951T1 (ru)
DE (1) DE602005006424T2 (ru)
ES (1) ES2306235T3 (ru)
HK (1) HK1106606A1 (ru)
RU (1) RU2381570C2 (ru)
SE (1) SE0402650D0 (ru)
TW (1) TWI330825B (ru)
WO (1) WO2006048226A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2571608C2 (ru) * 2010-05-21 2015-12-20 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Создание заметок с использованием голосового потока
RU2581782C1 (ru) * 2013-04-30 2016-04-20 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное кодирование многоканального звука

Families Citing this family (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
CA3035175C (en) 2004-03-01 2020-02-25 Mark Franklin Davis Reconstructing audio signals with multiple decorrelation techniques
PL1769491T3 (pl) * 2004-07-14 2010-03-31 Koninl Philips Electronics Nv Przekształcanie kanałów audio
US7945447B2 (en) * 2004-12-27 2011-05-17 Panasonic Corporation Sound coding device and sound coding method
BRPI0519454A2 (pt) * 2004-12-28 2009-01-27 Matsushita Electric Ind Co Ltd aparelho de codificaÇço reescalonÁvel e mÉtodo de codificaÇço reescalonÁvel
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007004830A1 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101233571B (zh) * 2005-07-29 2012-12-05 Lg电子株式会社 处理音频信号的方法和装置
JP5113049B2 (ja) * 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100857107B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR100857113B1 (ko) * 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
WO2007040349A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
JP5161109B2 (ja) * 2006-01-19 2013-03-13 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
BRPI0707136A2 (pt) * 2006-01-19 2011-04-19 Lg Electronics Inc método e aparelho para processamento de um sinal de mìdia
US8560303B2 (en) * 2006-02-03 2013-10-15 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
KR101294022B1 (ko) 2006-02-03 2013-08-08 한국전자통신연구원 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치
CA2637722C (en) 2006-02-07 2012-06-05 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
ES2339888T3 (es) * 2006-02-21 2010-05-26 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de audio.
JP5254808B2 (ja) 2006-02-23 2013-08-07 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP2036204B1 (en) * 2006-06-29 2012-08-15 LG Electronics Inc. Method and apparatus for an audio signal processing
CN101485094B (zh) * 2006-07-14 2012-05-30 安凯(广州)软件技术有限公司 最大熵意义下后向兼容多通道音频编码与解码方法和系统
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
WO2008039045A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc., Apparatus for processing mix signal and method thereof
KR100891668B1 (ko) 2006-10-12 2009-04-02 엘지전자 주식회사 믹스 신호 처리 방법 및 장치
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
KR100891672B1 (ko) 2006-10-12 2009-04-03 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
WO2008060111A1 (en) 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100891669B1 (ko) 2006-12-01 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
KR100891671B1 (ko) 2006-12-01 2009-04-03 엘지전자 주식회사 믹스신호 제어 방법 및 장치
JP5270566B2 (ja) 2006-12-07 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
WO2008096313A1 (en) * 2007-02-06 2008-08-14 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
CN101647060A (zh) * 2007-02-13 2010-02-10 Lg电子株式会社 处理音频信号的方法和装置
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
TWI374671B (en) 2007-07-31 2012-10-11 Realtek Semiconductor Corp Audio encoding method with function of accelerating a quantization iterative loop process
KR101505831B1 (ko) 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP2232486B1 (en) * 2008-01-01 2013-07-17 LG Electronics Inc. A method and an apparatus for processing an audio signal
ES2391801T3 (es) * 2008-01-01 2012-11-30 Lg Electronics Inc. Procedimiento y aparato para procesar una señal de audio
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2111062B1 (en) 2008-04-16 2014-11-12 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN102007532B (zh) 2008-04-16 2013-06-19 Lg电子株式会社 用于处理音频信号的方法和装置
KR101061128B1 (ko) * 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2169666B1 (en) * 2008-09-25 2015-07-15 Lg Electronics Inc. A method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8479015B2 (en) * 2008-10-17 2013-07-02 Oracle International Corporation Virtual image management
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
US20110311063A1 (en) * 2009-03-13 2011-12-22 Fransiscus Marinus Jozephus De Bont Embedding and extracting ancillary data
CN105225667B (zh) * 2009-03-17 2019-04-05 杜比国际公司 编码器系统、解码器系统、编码方法和解码方法
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011045549A1 (fr) * 2009-10-16 2011-04-21 France Telecom Decodage parametrique stereo optimise
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102157152B (zh) 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
KR101748756B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
WO2012176084A1 (en) * 2011-06-24 2012-12-27 Koninklijke Philips Electronics N.V. Audio signal processor for processing encoded multi - channel audio signals and method therefor
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
KR101662680B1 (ko) * 2012-02-14 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치
JP6163545B2 (ja) 2012-06-14 2017-07-12 ドルビー・インターナショナル・アーベー 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え
KR101434206B1 (ko) 2012-07-25 2014-08-27 삼성전자주식회사 신호 복호화 장치
KR102173422B1 (ko) * 2012-11-15 2020-11-03 가부시키가이샤 엔.티.티.도코모 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
US9191516B2 (en) * 2013-02-20 2015-11-17 Qualcomm Incorporated Teleconferencing using steganographically-embedded audio data
BR122021009025B1 (pt) 2013-04-05 2022-08-30 Dolby International Ab Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio
WO2014191793A1 (en) * 2013-05-28 2014-12-04 Nokia Corporation Audio signal encoder
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
CN117037810A (zh) * 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
RU2648632C2 (ru) 2014-01-13 2018-03-26 Нокиа Текнолоджиз Ой Классификатор многоканального звукового сигнала
KR101500972B1 (ko) * 2014-03-05 2015-03-12 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
US9848275B2 (en) * 2014-04-02 2017-12-19 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US9674598B2 (en) 2014-04-15 2017-06-06 Fairchild Semiconductor Corporation Audio accessory communication with active noise cancellation
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10366695B2 (en) * 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
WO2023088560A1 (en) * 2021-11-18 2023-05-25 Nokia Technologies Oy Metadata processing for first order ambisonics
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9105987A (pt) 1990-09-19 1993-02-02 Philips Nv Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
CN1705980A (zh) 2002-02-18 2005-12-07 皇家飞利浦电子股份有限公司 参数音频编码
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
EP1500082B1 (en) * 2002-04-22 2007-02-14 Koninklijke Philips Electronics N.V. Signal synthesizing
BR0305555A (pt) * 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
ATE487213T1 (de) * 2003-03-17 2010-11-15 Koninkl Philips Electronics Nv Verarbeitung von mehrkanalsignalen
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2571608C2 (ru) * 2010-05-21 2015-12-20 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Создание заметок с использованием голосового потока
US9236047B2 (en) 2010-05-21 2016-01-12 Microsoft Technology Licensing, Llc Voice stream augmented note taking
RU2581782C1 (ru) * 2013-04-30 2016-04-20 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное кодирование многоканального звука

Also Published As

Publication number Publication date
DE602005006424D1 (de) 2008-06-12
DE602005006424T2 (de) 2009-05-28
US7916873B2 (en) 2011-03-29
US20110211703A1 (en) 2011-09-01
CN101036183B (zh) 2011-06-01
WO2006048226A1 (en) 2006-05-11
US8654985B2 (en) 2014-02-18
ES2306235T3 (es) 2008-11-01
SE0402650D0 (sv) 2004-11-02
JP2008519301A (ja) 2008-06-05
EP1784819B1 (en) 2008-04-30
TWI330825B (en) 2010-09-21
EP1784819A1 (en) 2007-05-16
JP4616349B2 (ja) 2011-01-19
HK1106606A1 (en) 2008-03-14
US20060133618A1 (en) 2006-06-22
RU2007120634A (ru) 2008-12-10
ATE393951T1 (de) 2008-05-15
TW200627379A (en) 2006-08-01
KR20070051915A (ko) 2007-05-18
CN101036183A (zh) 2007-09-12
KR100936498B1 (ko) 2010-01-13

Similar Documents

Publication Publication Date Title
RU2381570C2 (ru) Стереофонически совместимое кодирование многоканального звука
US10237674B2 (en) Compatible multi-channel coding/decoding
KR100955361B1 (ko) 적응 잔류 오디오 코딩
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
CN101120615B (zh) 多声道编码器和解码器以及相应的编码和解码方法
KR100946688B1 (ko) 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
JP2014089467A (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner