RU2420814C2 - Аудиодекодирование - Google Patents

Аудиодекодирование Download PDF

Info

Publication number
RU2420814C2
RU2420814C2 RU2008142752/09A RU2008142752A RU2420814C2 RU 2420814 C2 RU2420814 C2 RU 2420814C2 RU 2008142752/09 A RU2008142752/09 A RU 2008142752/09A RU 2008142752 A RU2008142752 A RU 2008142752A RU 2420814 C2 RU2420814 C2 RU 2420814C2
Authority
RU
Russia
Prior art keywords
channel
signal
data
valued
generating
Prior art date
Application number
RU2008142752/09A
Other languages
English (en)
Other versions
RU2008142752A (ru
Inventor
Ларс Ф. ВИЛЛЕМОЕС (NL)
Ларс Ф. ВИЛЛЕМОЕС
Эрик Г. П. СХЕЙЕРС (NL)
Эрик Г. П. СХЕЙЕРС
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Долби Свидн Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В., Долби Свидн Аб filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2008142752A publication Critical patent/RU2008142752A/ru
Application granted granted Critical
Publication of RU2420814C2 publication Critical patent/RU2420814C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к аудиодекодированию и в особенности к декодированию сигналов MPEG Surround. Аудиодекодер включает в себя приемник (801) для приема входных данных, состоящий из N-канального сигнала, соответствующего понижено микшированному сигналу М-канального аудиосигнала, M>N, с примененными матрицами кодирования комплекснозначных поддиапазонов в частотных поддиапазонах и параметрическими многоканальными данными. Группа фильтров поддиапазона (805) генерирует вещественнозначные частотные поддиапазоны для N-канального сигнала. Матричный процессор (809) определяет матрицы декодирования вещественнозначных поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным. Процессор компенсации (807) генерирует данные понижающего микширования, соответствующие понижено микшированному сигналу с помощью умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах. Данные понижающего микширования могут использоваться для генерации понижено микшированного сигнала и М-канального аудиосигнала. Декодер может вводить поправку на операции MPEG Матричной Окружающей Совместимости, выполняемые в кодере, используя вещественнозначные частотные поддиапазоны. Технический результат - эффективное осуществление и/или улучшение качества аудио. 10 н. и 10 з.п. ф-лы, 15 ил.

Description

Настоящее изобретение относится к аудиодекодированию и в особенности, но не исключительно, к декодированию сигналов MPEG Surround.
За последние десятилетия цифровое кодирование сигналов различных источников стало все более важным, в то время когда цифровое представление сигналов и коммуникация все больше и больше заменяла аналоговое представление и коммуникацию. Например, распространение медиа контента, такого как видео и музыка, все больше и больше основываются на цифровом кодировании контента.
Более того, в последнее десятилетие были тенденции в направлении многоканального аудио, особенно в направлении пространственного аудио, выходящего за рамки традиционных стереосигналов. Например, традиционные стереозаписи включали только два канала, тогда как современные продвинутые аудиосистемы обычно используют пять или шесть каналов, как в широко известных системах 5.1 звук вокруг. Это предусматривает более вовлеченное прослушивание, при котором пользователь может быть окружен источниками звука.
Для передачи таких многоканальных сигналов были разработаны различные технологии и стандарты. Например, шесть дискретных каналов, представляющих системы 5.1 звук вокруг, могут передаваться в соответствии со стандартами, такими как AAC (Advanced Audio Coding - улучшенное кодирование звука) или со стандартами Dolby Digital.
Однако для обеспечения обратной совместимости они известны для понижающего микширования большего числа каналов на меньшее число каналов, и особенно они часто используются для понижающего микширования сигналов 5.1 звук вокруг в стереосигнал, позволяя воспроизводить стереосигнал с помощью традиционных (стерео) декодеров, а 5.1 сигнал с помощью декодеров звук вокруг.
Одним из примеров является обратно совместимый способ кодирования MPEG2. Многоканальный сигнал понижено микшируется в стереосигнал. Дополнительные сигналы кодируются как многоканальные данные в дополнительные порции данных, позволяя MPEG2 многоканальному декодеру генерировать представление многоканального сигнала. MPEG1 декодер будет пренебрегать дополнительными данными и таким образом будет декодировать только понижающее микширование стерео. Основным недостатком метода кодирования, применяемого в MPEG2, является то, что скорость передачи дополнительных данных, необходимых для дополнительных сигналов, является величиной того же порядка, что и скорость передачи данных, требуемая для кодирования стереосигнала. Поэтому значительной является дополнительная скорость передачи битов для расширения стереосигнала в многоканальный аудиосигнал.
Другие существующие методы обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут обычно характеризоваться как матричные круговые методы. Примеры кодирования матричных круговых методов включают такие методы, как Dolby Prologic II и Logic-7. Общим принципом этих методов является то, что они матричным способом умножают множество каналов входного сигнала посредством подходящей матрицы, тем самым генерируя выходной сигнал с низким числом каналов. В особенности матричное кодирование обычно применяет фазовый сдвиг к окружающим каналам перед тем, как смешивать их с передним и центральным каналами.
Другой причиной для преобразования каналов является эффективность кодирования. Было выяснено, что, например, аудиосигналы звука вокруг могут кодироваться как аудиосигналы стереоканалов, объединенные с потоком битов параметров, описывающим пространственные свойства аудиосигнала. Декодер может воспроизводить аудио- стереосигналы с очень удовлетворительной степенью точности. Таким способом может быть получена значительная экономия в скорости передачи битов.
Существует несколько параметров, которые могут использоваться для описания пространственных свойств аудиосигналов. Одним из таких параметров является внутриканальная кросс-корреляция, такая как кросс-корреляция между левым каналом и правым каналом для стереосигналов. Другим параметром является отношение мощности каналов. В так называемых (параметрических) пространственных аудиокодерах, таких как кодеры окружающего MPEG, эти и другие параметры извлекаются из первоначальных аудиосигналов так, чтобы производить аудиосигнал с уменьшенным числом каналов, например только с одним каналом, плюс набор параметров, описывающих пространственные свойства первоначального аудиосигнала. В так называемых (параметрических) пространственных аудиодекодерах пространственные свойства переустанавливаются, как описывается посредством переданных пространственных параметров.
Такое пространственное аудиокодирование предпочтительно использует каскадную или древовидную иерархическую структуру, включающую в себя стандартные модули в кодере и декодере. В кодере эти стандартные модули могут быть понижающими микшерами, объединяющими каналы в меньшее число каналов, такими как 2 в 1, 3 в 1, 3 в 2 и т.д. понижающими микшерами, в то время как в декодере соответствующие стандартные модули могут быть повышающими микшерами, разбивающими каналы на большее число каналов, такими как 1 на 2, 2 на 3 повышающими микшерами.
На Фиг.1 представлена иллюстрация примера кодера для кодирования многоканальных аудиосигналов в соответствии с подходом, стандартизующимся в настоящее время MPEG под именем MPEG Surround (окружающий MPEG). Система окружающего MPEG кодирует многоканальный сигнал как моно- или стереопонижающее микширование, сопровождающееся набором параметров. Сигнал понижающего микширования может кодироваться посредством традиционного аудиокодера, такого как, например, кодер MP3 или ACC. Параметры представляют пространственное изображение многоканального аудиосигнала и могут кодироваться и встраиваться в обратно совместимой форме в традиционный аудиопоток.
На стороне декодера основной поток битов сначала декодируется, в результате чего генерируется моно или стереосигнал понижающего микширования. Традиционные декодеры, например декодеры, которые не используют декодирование окружающего MPEG, все еще могут декодировать этот сигнал понижающего микширования. Если несмотря на это доступен декодер окружающего MPEG, пространственные параметры переустанавливаются, что приводит к многоканальному представлению, которое воспринимается близко к начальному многоканальному входному сигналу. Пример декодера окружающего MPEG звука представлен на Фиг.2.
В стороне от основного пространственного кодирования/декодирования, как показано на Фиг.1 и на Фиг.2, система окружающего MPEG предлагает богатый набор особенностей, открывающих большую область применения. Одна из наиболее заметных особенностей относится к Матрице Соответствия или Матричной Окружающей Совместимости.
Примерами традиционных матричных окружающих систем являются Dolby Pro Logic I и II и Circle Surround. Эти системы работают, как показано на Фиг.3. Многоканальный PCM входящий сигнал преобразуется в так называемый матричный сигнал понижающего микширования с использованием обычно матрицы 5(.1) в 2. Идея систем матриц вокруг заключается в том, что передние и окружающие (задние) каналы смешиваются синфазно и не синфазно соответственно в стереосигнале понижающего микширования. В некотором роде это разрешает инверсию на стороне декодера, приводя к многоканальной реконструкции.
В матричных системах окружения стереосигнал может передаваться с использованием традиционных каналов, предназначенных для передачи стереосигналов. Поэтому, подобно системе окружающей MPREG, матричные системы окружения также предлагают форму обратной совместимости. Однако из-за специфичных фазовых свойств стереосигнала понижающего микширования, возникающего из матричного окружающего кодирования, эти сигналы часто не обладают высоким качеством звука, когда прослушиваются как стереосигналы из, например, динамиков или наушников.
В декодерах матричного окружения от M до N (где M=2, а N=5(.1)) матрица применяется для формирования многоканального PCM выходного сигнала. Однако, в общем, от N до M матричных систем, с (N>M) необратимо, и таким образом, матричные системы окружения, в общем, не способны точно восстановить первоначальные многоканальные PCM выходные сигналы, которые стремятся иметь очень заметные артефакты.
В отличие от таких традиционных матричных систем окружения Матричная Окружающая Совместимость MPEG Surround достигается посредством применения матрицы 2×2 к комплексным выборочным значениям в частотных поддиапазонах кодера MPEG Surround, который следует за окружным кодированием MPEG. Пример такого кодера представлен на Фиг.4. Матрица 2×2 обычно представляет собой матрицу комплексных значений с коэффициентами, зависящими от пространственных параметров. В такой системе пространственными параметрами являются как временные, так и частотные разновидности, и поэтому матрица 2×2 также временная и частотная. Таким образом, действие комплексной матрицы обычно применяется к частотно-временной мозаике.
Применение функции Матричной Окружающей Совместимости в кодерах MPEG окружения позволяет результирующему стереосигналу быть совместимым с сигналом, генерируемым посредством традиционных кодеров матричного окружения, таких как Dolby Pro-LogicTM. Это позволит традиционным декодерам декодировать круговые сигналы. Более того, действие Матричной Окружающей Совместимости может быть реверсировано в совместимый MPEG Surround декодер, тем самым обеспечивая высокое качество генерируемого многоканального сигнала.
Матрица кодирования матричной совместимости может быть описана следующим образом:
Figure 00000001
где L, R - традиционное MPEG стереопонижающее микширование, LMTX, RMTX - кодированное круговой матрицей понижающее микширование, и где hxy - комплексные коэффициенты, определенные в соответствии с многоканальными параметрами.
Основным преимуществом предоставления стереосигналов, совместимых с матрицей посредством матрицы 2×2, является тот факт, что эти матрицы могут быть инвертированы. В результате MPEG Surround декодер все еще может поставлять то же самое качество выходного аудиосигнала вне зависимости от того, используется ли в кодере понижающее микширование стереосигналов, совместимое с матрицей. Пример декодера, совместимого с круговым MPEG, представлен на Фиг.5.
Инверсная обработка на стороне декодера в обычном MPEG Surround декодере может определяться таким образом:
Figure 00000002
Таким образом, так как H может быть инвертировано, действие кодера матричной совместимости может быть перевернуто.
В системе MPEG Surround, обработка, включающая действия матричной совместимости, происходит в частотном домене. Более специфически, так называемые комплексно-экспоненциально модулированные группы квадратурных зеркальных фильтров (Quadrature Mirror Filter - QMF) используются для разделения частотной оси на несколько зон.
Во многих отношениях этот тип QMF групп может приравниваться к группе перекрывающихся дополнительных дискретных преобразований Фурье (Discrete Fourier Transform - DFT) или к ее эффективной копии - быстрому Фурье преобразованию (Fast Fourier Transform - FFT). Группа QMF, так же как группа DFT, совместно характеризуется следующими желаемыми свойствами для обработки сигнала.
- Представление частотного домена передискретизировано. Из-за этого свойства возможно применить манипуляции, такие как, например, компенсация (масштабирование индивидуальных зон) без введения ступенчатого искажения. Критически дискретизированные представления, такие как, например, известное модифицированное дискретное косинусное преобразование (Modified Discrete Cosine Transform - MDCT), которое, например, используется в AAC, не подчиняется этому свойству. Поэтому временная и частотная разновидности модификации MDCT коэффициентов перед синтезом приводит к ступенчатости, которая, в свою очередь, является причиной слышимых артефактов в выходном сигнале.
- Представление частотного домена комплексное. В отличие от вещественнозначных представлений комплексное представление дает возможность простой модификации фазы сигналов.
Несмотря на то что существует ряд преимуществ над критически дискретизированным вещественнозначным представлением на основе манипуляций с сигналом, значительным недостатком по сравнению с таким представлением является вычислительная комплексность. Основная часть комплексности MPEG Surround декодера вызвана QMF группами фильтров анализа и синтеза и соответствующей обработкой комплекснозначных сигналов.
Соответственно, предложено выполнять часть обработки в вещественнозначном домене в так называемом декодере малой мощности (Low Power - LP). Для этой цели комплексно модулированная группа фильтров была заменена вещественнозначной косинусной модулированной группой фильтров, за которой следует частичное расширение до комплекснозначного домена для низкочастотных зон. Такие группы фильтров представлены на Фиг.6.
В нормальном режиме работы MPEG Surround декодер применяет вещественнозначную обработку к выборкам области комплексных поддиапазонов, или в случае LP применяет ее к выборкам области вещественнозначных поддиапазонов. Однако особенность матричной совместимости в декодере включает сдвиги фаз, для того чтобы восстановить первоначальное стереопонижающее микширование в частотном домене. Эти сдвиги фаз выполнены посредством комплекснозначной обработки. Другими словами, матрица декодирования матричной совместимости H -1 является по своей природе комплексной, для представления требуемого сдвига фаз. Соответственно, в таких системах действие матричной круговой совместимости не может быть инвертировано в вещественнозначную часть представления LP частотного домена, приводящую к уменьшению качества декодирования.
Следовательно, улучшенное аудиодекодирование было бы благоприятным.
Соответственно, изобретение стремится к предпочтительному подавлению, облегчению и устранению одного или более из вышеуказанных недостатков, отдельно или в любой комбинации.
В соответствии с первым аспектом изобретения представлен аудиодекодер, включающий в себя средство для приема входных данных, включающих в себя N-канальный сигнал, соответствующий понижено микшированному сигналу M-канального аудиосигнала, где M>N, с матрицами кодирования комплекснозначных поддиапазонов, применяемых в частотных поддиапазонах, и с параметрическими, многоканальными данными, связанными с понижено микшированным сигналом; средства для генерации частотных поддиапазонов для N-канального сигнала, по крайней мере, некоторые частотные поддиапазоны являются вещественнозначными частотными поддиапазонами; средство определения матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным; средство для генерации данных понижающего микширования, соответствующих понижено микшированному сигналу, выполненному посредством умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.
Изобретение может делать возможным улучшенное и/или облегченное декодирование. В особенности изобретение может делать возможным существенное снижение комплексности, наряду с достижением высокого качества аудио. Изобретение может, например, делать возможным эффект, когда умножение матриц комплекснозначных поддиапазонов будет, по крайней мере, частично обратным в декодере с использованием вещественнозначных частотных поддиапазонов.
В качестве особого примера изобретение может, например, делать возможным кодирование Совместимое с Матрицей MPEG частично обратимым в круговом MPEG декодере с использованием вещественнозначных частотных поддиапазонов.
Декодер может включать в себя средства генерации сигнала понижающего микширования по данным понижающего микширования и может также включать в себя средства генерации M-канального аудиосигнала по данным понижающего микширования и параметрическим многоканальным данным. Изобретение может в таких вариантах реализации генерировать точный многоканальный аудиосигнал, по крайней мере, частично основываясь на вещественнозначных частотных поддиапазонах.
Различная матрица декодирования может быть определена для каждого частотного поддиапазона.
В соответствии с дополнительной особенностью изобретения средства определения организованы для определения инверсных матриц комплекснозначного поддиапазона матриц кодирования и для определения матриц декодирования по инверсным матрицам.
Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования.
В соответствии с дополнительной особенностью изобретения средства определения организованы для определения каждого коэффициента вещественнозначной матрицы декодирования по абсолютному значению коэффициента соответствующей инверсной матрицы.
Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования. Каждый вещественнозначный коэффициент матрицы декодирования может быть определен по абсолютному значению только соответствующего коэффициента инверсных матриц без рассмотрения других коэффициентов матрицы. Соответствующий коэффициент матрицы может быть коэффициентом, расположенным в том же месте инверсной матрицы для того же частотного поддиапазона.
В соответствии с дополнительной особенностью изобретения средства определения организованы для определения каждого коэффициента вещественнозначной матрицы, главным образом как абсолютное значение соответствующего коэффициента инверсных матриц.
Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования.
В соответствии с дополнительной особенностью изобретения средства определения организованы для определения матриц декодирования по матрицам переноса поддиапазонов, которые представляют собой умножение соответствующих матриц декодирования и матриц кодирования.
Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования. Соответствующие матрицы кодирования и декодирования могут быть матрицами кодирования и декодирования для одного и того же частотного поддиапазона. Средства определения могут в особенности быть организованными для выбора значений коэффициентов матриц декодирования таких, чтобы матрицы переноса обладали желаемыми характеристиками.
В соответствии с дополнительной особенностью изобретения средства определения организованы для определения матриц декодирования по величине, измеренной только в матрицах переноса.
Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования. В особенности средства определения могут быть организованы для игнорирования фазовых измерений при определении матриц декодирования. Это может снизить комплексность и при этом сохранить низкую воспринимаемую деградацию аудиокачества.
В соответствии с дополнительной особенностью изобретения матрицы переноса каждого поддиапазона имеют вид:
Figure 00000003
где G - поддиапазон матрицы декодирования, а H - поддиапазон матрицы кодирования, и средство определения организовано для выбора коэффициентов матрицы
Figure 00000004
так, что измерения мощности p12 и p21 удовлетворяют критерию.
Это может сделать возможным особенно эффективное осуществление и/или улучшенное качество кодирования. Матрица декодирования может быть выбрана для того, чтобы привести к тому, что измерение мощности будет ниже порогового значения (которое может быть определено по ограничивающему условию или другим параметрам), или может, например, быть выбрана как матрица декодирования, приводящая к минимальному измерению мощности.
В соответствии с дополнительной особенностью изобретения измерение амплитуды определяется по
Figure 00000005
Это может сделать возможным особенно эффективное осуществление и/или улучшенное качество кодирования.
В соответствии с дополнительной особенностью изобретения средство определения также организовано для выбора коэффициентов матрицы под действием ограничивающих условий амплитуды p11 и p22, равной по существу единице.
Это может сделать возможным особенно эффективное осуществление и/или улучшенное качество кодирования.
В соответствии с дополнительной особенностью изобретения сигнал понижающего микширования и параметрические многоканальные данные находятся в соответствии со стандартом окружающего MPEG.
Изобретение может давать возможность особо эффективной, низкой комплексности и/или улучшенного качества декодирования аудиосигнала для сигнала, совместимого с окружающим MPEG.
В соответствии с дополнительной особенностью изобретения матрица кодирования представляет собой матрицу кодирования Матричной Окружающей Совместимости MPEG, а первый N-канальный сигнал является сигналом Матричной Окружающей Совместимости MPEG.
Изобретение может давать возможность особо эффективной, низкой комплексности и/или улучшенного качества аудио и может в особенности давать возможность низко комплексному декодированию эффективно компенсировать операции Матричной Окружающей Совместимости MPEG, выполняемые в кодере.
В соответствии с другим аспектом изобретения обеспечен способ аудиодекодирования, способ включает в себя прием входных данных, включающих в себя N-канальный сигнал, соответствующий сигналу понижающего микширования M-канального аудиосигнала, M>N, с применением матриц кодирования комплекснозначного поддиапазона в частотных поддиапазонах и с параметрическими многоканальными данными, связанными с сигналом понижающего микширования; генерацию частотных поддиапазонов для N-канального сигнала, по крайней мере, несколько частотных поддиапазонов являются вещественнозначными частотными поддиапазонами; определение матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным; генерацию данных понижающего микширования, соответствующих сигналу понижающего микширования посредством умножения матриц декодирования вещественнозначного поддиапазона и данных N-канального сигнала в, по крайней мере, некоторых вещественных частотных поддиапазонах.
В соответствии с другим аспектом изобретения обеспечен приемник для приема N-канального сигнала, приемник включает в себя средство приема входных данных, включающих в себя N-канальный сигнал, соответствующий сигналу понижающего микширования M-канального аудиосигнала, M>N, с применением комплекснозначных матриц кодирования поддиапазона в частотных поддиапазонах и с параметрическими многоканальными данными, связанными с сигналом понижающего микширования; средство для генерации частотных поддиапазонов для N-канального сигнала, при этом, по крайней мере, несколько частотных поддиапазонов являются вещественнозначными; средство определения матриц декодирования вещественного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным; средство генерации данных понижающего микширования, соответствующих сигналу понижающего микширования посредством умножения вещественнозначных матриц декодирования поддиапазона и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.
В соответствии с другим аспектом изобретения обеспечена система передачи для передачи аудиосигнала, система передачи включает в себя передатчик, включающий в себя средство генерации N-канального сигнала понижающего микширования M-канального аудиосигнала, M>N, средство генерации параметрических многоканальных данных, связанных с сигналом понижающего микширования, средство для формирования первого N-канального сигнала посредством применения комплексных матриц кодирования поддиапазонов к N-канальному понижено микшированному сигналу в частотных поддиапазонах, средство генерации второго N-канального сигнала, включающего в себя первый N-канальный сигнал и параметрические многоканальные данные, и средство передачи второго N-канального сигнала на приемник; приемник, включающий в себя средство приема второго N-канального сигнала, средство для генерации частотных поддиапазонов для первого N-канального сигнала, по крайней мере, несколько частотных вещественнозначных поддиапазонов, средство определения вещественнозначных матриц декодирования поддиапазонов для компенсации приложения матриц кодирования по параметрическим многоканальным данным, и средство генерации данных понижающего микширования, отвечающих N-канальному сигналу понижающего микширования, посредством умножения вещественнозначных матриц декодирования поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.
Второй N-канальный сигнал может иметь дополнительный связанный канал, включающий в себя параметрические многоканальные данные.
В соответствии с другим аспектом изобретения обеспечен способ приема аудиосигнала из масштабируемого аудиопотока битов, способ включает в себя входные принимаемые данные, включающие в себя N-канальный сигнал, соответствующий сигналу понижающего микширования M-канального аудиосигнала, M>N, с применением комплекснозначных матриц кодирования поддиапазона в частотных поддиапазонах и с параметрическими многоканальными данными, связанными с сигналом понижающего микширования; генерацию частотных поддиапазонов для N-канального сигнала, по крайней мере, несколько из частотных поддиапазонов являются вещественнозначными; определение вещественнозначных матриц декодирования поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным и генерацию данных понижающего микширования, соответствующих понижено микшированному сигналу, посредством умножения вещественнозначных матриц декодирования поддиапазона и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.
В соответствии с другим аспектом изобретения обеспечен способ приема и передачи аудиосигнала, способ включает в себя передатчик, выполняющий следующие действия: генерацию N-канального понижено микшированного сигнала M-канального аудиосигнала, M>N, генерацию параметрических многоканальных данных, связанных с понижено микшированным сигналом, генерацию первого N-канального сигнала посредством применения комплекснозначных матриц кодирования поддиапазона к N-канальному понижено микшированному сигналу в частотных поддиапазонах, генерацию второго N-канального сигнала, включающего в себя первый N-канальный сигнал и параметрические многоканальные данные, и передачу второго N-канального сигнала на приемник; на приемнике выполняются следующие операции: прием второго N-канального сигнала; генерация частотных поддиапазонов для первого N-канального сигнала, по крайней, мере несколько частотных поддиапазонов являются вещественнозначными; определение вещественнозначных матриц декодирования поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным; генерация данных понижающего микширования, отвечающих N-канальному сигналу понижающего микширования посредством матричного умножения вещественнозначных матриц декодирования поддиапазона и данных N-канального сигнала в, по крайней мере, нескольких вещественнозначных частотных поддиапазонах.
Эти и другие аспекты, особенности и преимущества изобретения будут очевидны из и объясняться с помощью ссылок на вариант(ы) осуществления, описанные далее в этом документе.
Будут описаны варианты реализации изобретения, только в качестве примера, со ссылками на чертежи, которые иллюстрируют:
Фиг.1 - пример кодера для кодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;
Фиг.2 - пример декодера для декодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;
Фиг.3 - пример систем матричного окружного кодирования/декодирования в соответствии с предыдущим уровнем техники;
Фиг.4 - пример кодера для кодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;
Фиг.5 - пример декодера для декодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;
Фиг.6 - пример группы фильтров для генерации комплексных и вещественнозначных частотных поддиапазонов;
Фиг.7 - систему передачи для связи аудиосигнала в соответствии с некоторыми вариантами реализации изобретения;
Фиг.8 - декодер в соответствии с некоторыми вариантами реализации изобретения;
Фиг.9-14 - эксплуатационные характеристики декодера в соответствии с некоторыми вариантами реализации изобретения; и
Фиг.15 - способ декодирования в соответствии с некоторыми вариантами реализации изобретения.
Последующее описание сосредоточено на вариантах осуществления изобретения, применимых к декодеру для декодирования окружающего MPEG кодированного сигнала, включая кодирование Матричной Окружающей Совместимости. Несмотря на это будет оценено, что изобретение не ограничено этим применением, но может применяться ко многим другим стандартам кодирования.
На Фиг.7 представлена система передачи 700 для передачи аудиосигнала в соответствии с некоторыми вариантами реализации изобретения. Система передачи 700 включает в себя передатчик 701, который связан с приемником 703 посредством сети 705, которой, в частности, может быть Интернет.
В частном примере передатчик 701 представляет собой записывающее устройство, а приемник 703 представляет собой устройство проигрывания сигнала, но будет оценено по достоинству, что в других реализациях передатчик и приемник могут использоваться в других приложениях и для других целей.
В частном примере, где поддерживается функция записи сигнала, передатчик 701 включает в себя цифратор 707, который принимает аналоговый многоканальный сигнал, который преобразуется в цифровой PCM (Pulse Code Modulated - импульсно-кодовая модуляция) многоканальный сигнал посредством дискретизации и аналогово-цифрового преобразования.
Передатчик 701 связан с кодером 709, представленным на Фиг.1, который кодирует PCM сигнал в соответствии с алгоритмом кодирования окружающего MPEG, который включает в себя функциональность для кодирования Матричной Окружающей Совместимости (Matrix Surround Compatibility). Кодер 709 может, например, быть декодером известного уровня техники, представленным на Фиг.4. В примере кодер 709, в частности, генерирует стерео MPEG Матричной Окружающей Совместимости стереосигнала понижающего микширования.
Таким образом, кодер 709 формирует следующий сигнал:
Figure 00000006
где L, R - традиционное окружающий MPEG стереопонижающее микширование, а LMTX, RMTX - кодированное кодером 709 круговой матрицей понижающее микширование на выходе. Кроме того, сигнал, сгенерированный кодером 709, включает в себя многоканальные параметрические данные, сгенерированные посредством окружающего MPEG кодирования. Кроме того, hxy являются комплексными коэффициентами, определяемыми по многоканальным параметрам. Специалистами в технике будет очевидно, что обработка, выполняемая кодером 709, производится в комплекснозначных поддиапазонах и использует комплексные действия.
Кодер 709 связан с сетевым передатчиком 711, который принимает кодированный сигнал и является интерфейсом с сетью 705. Сетевой передатчик 711 может передавать кодированный сигнал на приемник 703 через сеть 705.
Приемник 703 включает в себя сетевой интерфейс 713, который находится на границе с сетью 705 и который организован для приема кодированного сигнала с передатчика 701.
Сетевой интерфейс 713 связан с декодером 715. Декодер 715 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования. В примере декодер 715 генерирует исходный многоканальный сигнал. В частности, декодер 715 сначала генерирует сбалансированное стереопонижающее микширование, соответствующее понижающему микшированию, сгенерированному посредством окружающего MPEG кодирования, предшествующего выполнению операций совместимых с окружающим MPEG матрицей. Затем из этого понижающего микширования и принятых многоканальных параметрических данных формируется декодированный многоканальный сигнал.
В частном примере, в котором поддерживается функция воспроизведения сигнала, приемник 703 также включает в себя устройство воспроизведения сигнала 717, которое принимает декодированный многоканальный аудиосигнал с декодера 715 и представляет его пользователю. В частности, устройство воспроизведения сигнала 717 может включать в себя цифроаналоговый преобразователь, усилители и динамики, как требуется для вывода декодированного аудиосигнала.
На Фиг.8 более подробно представлен декодер 715.
Декодер 715 включает в себя приемник 801, который принимает сигнал, сгенерированный кодером 709. Как упоминалось выше, сигнал представляет собой стереосигнал, который отвечает сигналу понижающего микширования, который был обработан посредством опорных комплексных значений в комплексных частотных поддиапазонах, умноженных на комплексную матрицу кодирования Н. Кроме того, принятый сигнал включает в себя многоканальные параметрические данные, которые отвечают сигналу понижающего микширования. В частности, принятый сигнал представляет собой кодированный окружающий MPEG сигнал с матричной окружающей совместимостью.
Приемник 801, кроме того, обеспечивает основное декодирование принятого сигнала для генерации РСМ сигнала понижающего микширования.
Приемник 801 связан с процессором параметрических данных 803, который извлекает из принятого сигнала многоканальные параметрические данные.
Приемник 801, кроме того, связан с набором фильтров поддиапазона 805, который преобразует принятый стереосигнал в частотную область. В частности, набор фильтров поддиапазона 805 генерирует множество частотных поддиапазонов. По крайней мере, несколько из этих частотных поддиапазонов являются вещественнозначными частотными поддиапазонами. Набор фильтров поддиапазона 805 может, в частности, соответствовать функциональности, проиллюстрированной на Фиг.6. Таким образом, набор фильтров поддиапазона 805 может формировать К комплекснозначных поддиапазонов и М-К вещественнозначных поддиапазонов. Вещественнозначные поддиапазоны будут типично поддиапазонами более высоких частот, таких как поддиапазоны выше 2 кГц. Использование вещественнозначных поддиапазонов по существу служат для генерации поддиапазона, так же как и операции, выполняемые на фрагментах этих поддиапазонов. Таким образом, в декодере 715 М-К поддиапазонов обрабатываются как вещественные данные и операции скорее, чем комплексные данные и операции, тем самым обеспечивая по существу комплексность и снижение стоимости.
Набор фильтров поддиапазона 805 связан с процессором компенсации 807, который генерирует данные понижающего микширования, отвечающие сигналу понижающего микширования. В частности, процессор компенсации 807, скомпенсированный для операций матричной окружной совместимости посредством попыток перевернуть умножение на матрицу кодирования Н в частотных поддиапазонах кодера 709. Эта компенсация выполняется посредством умножения значений данных поддиапазонов на матрицу декодирования поддиапазона G. Однако в отличие от обработки в кодере 709 умножение матриц в вещественнозначных поддиапазонах декодера 715 выполняется исключительно в вещественной области. Таким образом, не только выборочные значения вещественной выборки, но и матричные коэффициенты матрицы декодирования G являются вещественнозначными коэффициентами.
Процессор компенсации 807 связан с матричным процессором 809, который определяет матрицы декодирования, которые нужно применить в поддиапазонах. Для М комплекснозначных поддиапазонов матрица декодирования G может быть просто определена как обратная матрице кодирования Н в том же поддиапазоне. Однако для вещественнозначных поддиапазонов матричный процессор 809 определяет вещественные матричные коэффициенты, которые могут обеспечивать эффективную корректировку для матричных операций кодирования.
Таким образом, выходной сигнал процессора компенсации 807 соответствует представлению поддиапазона сигнала понижающего микширования, кодированного окружающего MPEG. Таким образом, эффект операций матричной окружающей совместимости может быть по существу уменьшен или снят.
Процессор компенсации 807 связан с набором фильтров поддиапазона синтеза 811, который генерирует сигнал понижающего микширования, декодированный РСМ окружающим MPEG во временной области из представления поддиапазона. В частном примере набор фильтров поддиапазона синтеза 811, таким образом, формирует копию набора фильтров поддиапазона 805 в преобразовании сигнала обратно во временную область.
Набор фильтров поддиапазона синтеза 811 подается на многоканальный декодер 813, который, кроме того, связан с процессором параметрических данных 803. Многоканальный декодер 813 принимает во временной области РСМ сигнал понижающего микширования и многоканальные параметрические данные и генерирует исходный многоканальный сигнал.
В примере набор фильтров поддиапазонов синтеза 811 преобразует сигнал поддиапазона, с которым производились матричные операции во временную область. Многоканальный декодер 813, таким образом, принимает окружающий MPEG кодированный сигнал, сравнимый с сигналом, который бы принимался в том случае, если бы в декодере не применялись операции совместимые с матричным окружением. Таким образом, тот же MPEG многоканальный алгоритм декодирования может использоваться для сигналов, совместимых с матричным окружением, и для сигналов, не совместимых с матричным окружением. Однако в других вариантах реализации многоканальный декодер 813 может непосредственно функционировать на фрагменте поддиапазона с последующей корректировкой процессором компенсации 807. В этом случае набор фильтров поддиапазона синтеза 811 может быть опущен или некоторая функциональность набора фильтров поддиапазона синтеза 811 может быть интегрирована в многоканальный декодер 813.
Таким образом, для того чтобы уменьшить комплексность, часто предпочитают оставаться в пределах поддиапазона, когда передают скомпенсированный сигнал в многоканальный декодер 813. По существу возможно избежать комплексности в наборе фильтров поддиапазона синтеза 811 и в анализе наборов фильтров, которые являются частью многоканального декодера 813.
На самом деле, если возможно, обычно предпочитается не двигаться вперед назад между частотными и временными областями, так как это приводит к большому объему вычислений. Поэтому в некоторых декодерах в соответствии с некоторыми вариантами реализации изобретения, после того как сигналы преобразуются в поддиапазон (частотной) области (которая, в свою очередь, определена посредством декодирования основного битового потока и применения группы фильтров к результирующим PCM сигналам), применяется матричная окружная инверсия в процессоре компенсации 807 (если применимо, то есть если регулируемо в битовом потоке), и затем результирующие сигналы области поддиапазона непосредственно используются для реконструкции многоканальных (области поддиапазона) сигналов. В конечном счете применяется группа фильтров синтеза для получения многоканальных сигналов во временной области.
Таким образом, в системе на Фиг.7 кодер 709 может генерировать сигнал, совместимый с матричным окружением, который может быть декодирован посредством существующих декодеров матричного окружения, таких как декодеры Dolby Pro Logic™. Несмотря на то что это требует искажения исходного кодированного окружающим MPEG сигнала понижающего микширования посредством операции совместимости матричного окружения, эта операция может быть эффективно удалена в MPEG многоканальном декодере, тем самым позволяя генерировать точное представление исходного многоканального сигнала с использованием параметрических данных.
Кроме того, декодер 715 дает возможность выполнения компенсации для операции совместимости матричного окружения в вещественнозначных частотных поддиапазонах, без требования комплекснозначных частотных поддиапазонов, тем самым снижая комплексность декодера 715, в то же время достигая высокого качества аудио.
Далее будут описаны примеры определения подходящих матричных коэффициентов для матриц декодирования.
Декодер 709 выполняет операцию совместимости матричного окружения посредством применения следующей комплексной матрицы кодирования в каждом поддиапазоне (тот факт, что каждый поддиапазон имеет различную матрицу кодирования, будет оценен по достоинству):
Figure 00000007
где L, R - традиционное MPEG стереопонижающее микширование, а LMTX, RMTX - кодированное матричным окружением понижающее микширование. Матрица кодирования Н дается:
Figure 00000008
Figure 00000009
Figure 00000010
Figure 00000011
где w1 и w2 зависят от пространственных параметров, генерируемых кодированием окружающего MPEG. В частности:
Figure 00000012
Figure 00000013
где w1,t и w2,t являются ненормализованными весовыми коэффициентами, которые определяются как:
Figure 00000014
где CLD1 и CLD2 представляют разницу в уровнях сигналов (выраженную в дБ) между парами каналов левым-передним и левым-окружающим и правым передним и правым окружающим соответственно. c1,MTX и c2,MTX являются матричными коэффициентами, которые являются функциями коэффициентов прогнозирования с1 и с2, используемыми для расчета промежуточного левого L, центрального С и правого R сигналов из левого LDMX и правого RDMX сигналов понижающего микширования в декодере, в следующем виде:
Figure 00000015
где c1,MTX и c2,MTX определяются как:
Figure 00000016
где x={0,1} соответственно.
Альтернативно MPEG окружающий декодер поддерживает режим, в котором коэффициенты с1 и с2 представляют отношение мощностей левого и лево-центрального и правого и право-центрального соответственно. В этом случае применяются различные функции для c1,MTX и c2,MTX.
Таким образом, для каждого частотно-временного фрагмента к комплексной выборке значений применяется комплексная матрица кодирования Н. Если передние сигналы преобладают в исходном многоканальном входном сигнале, весовые коэффициенты w1 и w2 будут близки к нулю. В результате матричное окружающее понижающее микширование будет близко к входному стереопонижающему микшированию. Если в исходном многоканальном входном сигнале будут доминировать окружающие (задние) сигналы, весовые коэффициенты w1 и w2 будут близки к единице. В результате матричный окружающий сигнал понижающего микширования будет содержать значительно не совпадающую по фазе версию исходного стереопонижающего микширования, предоставляемого MPEG Окружающим кодером.
Основным преимуществом предоставления совместимых с матрицей стереосигналов посредством матрицы 2×2 является тот факт, что эти матрицы могут быть инвертированы. В результате MPEG окружающий декодер все еще может предоставлять такое же качество аудиосигнала на выходе вне зависимости от того, использовал ли кодер совместимый с матрицей стереосигнал понижающего микширования или нет.
Обратная обработка на стороне декодера в декодере MPEG Surround, в котором все частотные поддиапазоны являются комплексными (например, использование комплексно-модулированной группы QMF), определяется:
Figure 00000017
где
Figure 00000018
где
Figure 00000019
Тем не менее, такая инверсная операция требует использования комплексных значений и поэтому не может применятся в декодере 715, представленном на Фиг.7, так как он, по крайней мере, частично использует вещественнозначные поддиапазоны. Таким образом, матричный процессор 809 генерирует вещественнозначную матрицу декодирования, которая может применяться для значительного снижения эффекта матрицы кодирования.
Общее воздействие матриц кодирования и декодирования в каждом поддиапазоне может быть представлено матрицей перехода Р, определяемой как:
Figure 00000020
где Н представляет собой матрицу кодирования, а G представляет собой матрицу декодирования.
Идеальный случай, когда G=H -1, так что P=H -1 ·H=I, единичная матрица. Из-за того что веса hx,y матрицы кодирования Н все являются комплексными, матрица не может быть инвертирована в декодере для вещественнозначных поддиапазонов.
Вещественнозначными обычно являются поддиапазоны более высоких частот, такие как поддиапазоны выше 2 кГц. На этих частотах взаимосвязь фаз по ощущениям намного менее важна, и поэтому матричный процессор 809 определяет коэффициенты матрицы декодирования, подходящие по величине (мощностью), без учета фазовых характеристик. В частности, матричный процессор 809 может определять вещественнозначные матричные коэффициенты, которые приведут к низкому по амплитуде или мощности значению перекрестных элементов р12 и р21, в предположении или ограничиваясь тем, что |p11|≈1 и |р22|≈1.
В некоторых вариантах реализации матричный процессор 809 может определять комплекснозначные поддиапазоны матрицы Н -1, обратной матрице кодирования, и может затем определить вещественнозначную матрицу декодирования G по матричным коэффициентам этой матрицы. В частности, каждый коэффициент матрицы G может быть определен по коэффициенту матрицы Н -1, с тем же индексом. Например, вещественнозначный коэффициент может быть определен из значения величины соответствующего коэффициенты матрицы Н -1. На самом деле, в некоторых вариантах реализации матричный процессор может определить коэффициенты матрицы Н -1, а потом определить коэффициенты матрицы G как абсолютные значения соответствующих матричных коэффициентов обратной матрицы Н -1.
Таким образом, матричный процессор 809 может определять:
Figure 00000021
Figure 00000022
Figure 00000023
Figure 00000024
Figure 00000025
где
Figure 00000026
Может быть показано, что это решение идеально удовлетворяет ограничению, упомянутому выше (|p11|=|p22|=1 и |p12|=|p12|=0) для определенных случаев, когда w1=w2=0 и w1=w2=1.
На Фиг.9 показано абсолютное значение основного элемента матрицы перехода (10log10|p11|2) для данного решения. На Фиг.10 представлен сдвиг по фазе p11, а на Фиг.11 показан перекрестный элемент (10log10|p21|2).
В частности, на Фиг.9 представлено отклонение в дБ величины основного элемента матрицы р11 по отношению к истинному значению |p11|=1 как функции от w1 и w2. Может наблюдаться, что максимальное отклонение истинного значения составляет величину меньше 1 дБ. На Фиг.10 показан угол p11 как функция от w1 и w2. Как может предполагаться из отличия от истинного комплекснозначного случая, фазовые сдвиги составляют величину до 90 градусов. На Фиг.11 представлена величина перекрестного элемента р21, измеренного в дБ как функция весовых коэффициентов w1 и w2. Необходимо отметить, что другие элементы матрицы перехода могут быть получены посредством взаимной перестановки весовых коэффициентов w1 и w2.
В некоторых вариантах реализации матричный процессор 809 может определять матрицу декодирования G для поддиапазона по матрице перехода поддиапазона P=G·H. В частности, матричный процессор может выбирать значения коэффициентов G так, чтобы для P достигалась заданная характеристика.
Кроме того, если значения фаз для вещественнозначных поддиапазонов проявляют тенденцию к низкому воспринимаемому весовому множителю, то иллюстративный декодер 715 рассматривает только абсолютные значения P. Высокое качество функционирования может быть достигнуто посредством использования матричного процессора 809, выбирающего коэффициенты матрицы декодирования таким образом, чтобы измерения мощности р12 и р21 удовлетворяли критерию, такому как, например, минимизация измеренной мощности или измеренная мощность находится ниже заданного критерия. Матричный процессор 809 может, например, искать в диапазоне возможных вещественных коэффициентов и выбирать такие, которые приводят к минимальным измерениям мощности р12 и р21. Кроме того, оценка может быть предметом других ограничений, таких как ограничение, что р11 и р22 по большей части равны единице (например, между 0,9 и 1,1).
В некоторых реализациях матричный процессор 809 может выполнять математический алгоритм для определения значений подходящих вещественных коэффициентов для метода декодирования. Определенный пример такого метода описан далее, где алгоритм старается минимизировать общий перекрестный вклад: |р12|2+|р21|2  с учетом ограничения: |р11|2=1 и |р22|2=1.
Эта задача может быть решена путем стандартных инструментов многовариантного математического анализа. В особенности он подходит для использования методов множителя функции Лагранжа, которые для каждой вектор строки v матрицы G сводят задачу к задаче нахождения матрицы собственных значений вида vAvB с требованием нормализации q(v)=1, задаваемой квадратичной формой q. Матрицы А и В и квадратичные формы q зависят от входных данных комплексной матрицы Н.
Ниже приведено решение для v=[g11 g12]. Также тривиально решить v=[g21 g22] посредством взаимной замены переменных w1 и w2 в решении, представленном ниже. Матрицы Лагранжа А и В определяются:
Figure 00000027
Figure 00000028
где q1 и q2 определяются как:
Figure 00000029
собственные значения определяются из:
det(AB)=0,
что приводит к корням квадратного полинома:
Figure 00000030
где
Figure 00000031
Figure 00000032
Figure 00000033
Теперь могут быть определены два варианта решения:
Figure 00000034
Окончательное решение определяется выражением v =c i ·v i, где i равно 1 или 2, так что |р11|2=1 и с минимальным взаимным влиянием. Сначала вычисляется ci как:
Figure 00000035
Затем для обоих решений рассчитывается параметр взаимного влияния |р12|2:
Figure 00000036
Индекс i, который обеспечивает минимальное взаимное влияние, дает v =c i ·v i. Без дальнейшего доказательства устанавливается, что независимо от переменных w1 и w2 индекс i всегда равен 2.
Для завершенности полное решение для G в форме аналитических уравнений представлено ниже. Следующие переменные определяются:
Figure 00000037
Затем переменная b рассчитывается как:
Figure 00000038
Два корня rα и rβ для двух строк матрицы G рассчитываются как:
Figure 00000039
Немасштабные решения могут vtemp,1 и vtemp,2 определяться как:
Figure 00000040
Figure 00000041
Figure 00000042
Figure 00000043
Постоянные нормализации с рассчитываются как:
Figure 00000044
Figure 00000045
В конце концов матрица G определяется как:
Figure 00000046
На Фиг.12, 13 и 14 проиллюстрирована работа данного решения. На Фиг.12 представлено отклонение в дБ абсолютного значения основного матричного элемента р11 от истинного значения |р11|=1 как функции w1 и w2. Как видно, из-за набора ограничений, применяемых к данному решению, абсолютное значение всегда является таким же, как истинное значение |р11|=1.
На Фиг.13 представлена фаза р11 как функция w1 и w2. Необходимо отметить, что из-за ограничений, наложенных всеми вещественными решениями, сдвиги по фазе здесь до 90 градусов.
На Фиг.14 представлено абсолютное значение матричного элемента взаимодействия р21, измеренное в дБ как функция весовых коэффициентов w1 и w2.
Как показано на чертежах, решение установки коэффициентов матрицы декодирования в абсолютное значение коэффициентов инверсной матрицы кодирования отклоняется только на +/- 1 дБ от результата решения более сложным методом минимизации взаимодействия как с точки зрения увеличения основного элемента, так и подавления взаимодействия.
На Фиг.15 представлен способ аудиодекодирования в соответствии с некоторыми вариантами реализации изобретения.
На этапе 1501 декодер принимает входные данные, включающие в себя N-канальный сигнал, отвечающий сигналу понижающего микширования М-канального аудиосигнала, M>N, после применения в частотных поддиапазонах матрицы кодирования комплекснозначного поддиапазона и с многоканальными параметрическими данными, связанными с сигналом понижающего микширования.
За этапом 1501 следует этап 1503, в котором частотные поддиапазоны генерируются для N-канального сигнала. По крайней мере, некоторые частотные поддиапазоны являются вещественнозначными.
За этапом 1503 следует этап 1505, в котором матрицы декодирования вещественнозначных поддиапазонов для компенсации применения матриц кодирования определяются по параметрическим многоканальным данным.
За этапом 1505 следует этап 1507, в котором сигнал понижающего микширования генерируется посредством умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.
Будет оценено, что представленное выше описание для ясности описало реализации изобретения со ссылкой на различные функциональные модули и процессоры. Однако будет очевидно, что любые подходящие распределения функциональности между различными функциональными модулями и процессорами могут использоваться без приуменьшения значения изобретения. Например, проиллюстрированная функциональность, предназначенная для выполнения посредством различных отдельных процессоров или контроллеров, может быть выполнена посредством тех же процессоров или контроллеров. Отсюда ссылки на определенные функциональные модули нужно рассматривать только как ссылки на подходящие средства для обеспечения описанной функциональности, а не как индикаторы строгой логической или физической структуры или организации.
Изобретение может быть реализовано в любой подходящей форме, включая аппаратное, программное, микропрограммное обеспечение или их любые комбинации. Изобретение может дополнительно быть реализовано, по крайней мере, частично в виде компьютерного программного обеспечения, запущенного на одном или более устройствах обработки данных и/или цифровых сигнальных процессорах. Элементы и компоненты реализации изобретения могут быть физически, функционально и логически реализованы любым подходящим способом. На самом деле, функциональность может быть реализована в одном модуле, во множестве модулей или как часть другого функционального модуля. По существу, изобретение может быть реализовано как в отдельном модуле, так и может быть физически и функционально распределено между различными модулями и процессорами.
Несмотря на то что настоящее изобретение было описано в связи с некоторыми вариантами реализации, оно не ограничивается определенной формой, изложенной здесь. Скорее, цель настоящего изобретения ограничивается только сопроводительными формулами изобретения. Кроме того, несмотря на то что особенности могут описываться в связи с отдельными реализациями, технический специалист может распознать, что различные особенности описанных вариантов реализации могут быть объединены в соответствии с изобретением. В формулах изобретения входящие пункты не исключают наличия других элементов или этапов.
Более того, несмотря на индивидуальное перечисление, множество этапов, средств, элементов или методов могут быть реализованы с помощью, например, отдельного модуля или процессора. Кроме того, несмотря на то что индивидуальные особенности могут быть включены в различные формулы изобретения, они могут по возможности быть преимущественно объединены, а включение в различные формулы изобретения не предполагает, что комбинация особенностей не является практически осуществимой и/или выгодной. Также включение особенностей в одну категорию формулы изобретения не предполагает ограничение этой категорией, а указывает на то, что особенности одинаково применимы к другим категориям соответствующих формул изобретения. Более того, порядок особенностей в формуле изобретения не предполагает некоторый определенный порядок, в котором особенности должны быть обработаны, и в особенности порядок отдельных этапов в формуле изобретения метода не предполагает, что этапы должны выполняться в этом порядке. Этапы могут выполняться в любом подходящем порядке. Кроме того, единичные ссылки не исключают множества. Таким образом, ссылки на «первый» или «второй» и так далее не предотвращают множественность. Знаки ссылки в формуле изобретения, обеспеченные просто как поясняющие примеры, не должны толковаться как ограничивающие любым способом цель формулы изобретения.

Claims (20)

1. Аудиодекодер (715), включающий в себя:
средство (801) для приема входных данных, включающих в себя N-канальный сигнал, соответствующий пониженно микшированному сигналу М-канального аудиосигнала, M>N, имеющий матрицы кодирования комплекснозначного поддиапазона, примененные в частотных поддиапазонах, и многоканальные параметрические данные, связанные с пониженно микшированным сигналом;
средство (803) для извлечения параметрических данных, при этом средство (803) для извлечения связано со средством (801) для приема и сконфигурировано для извлечения многоканальных параметрических данных из принятого сигнала;
средство (805) для генерации частотных поддиапазонов для N-канального сигнала, при этом средство (805) для генерации частотных поддиапазонов сконфигурировано для генерации, по меньшей мере, К комплекснозначных частотных поддиапазонов и М-К вещественнозначных частотных поддиапазонов;
средство (809) определения для определения матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным, извлекаемых средством (803) для извлечения; и
средство (807) для генерации данных понижающего микширования, соответствующих пониженно микшированному сигналу, посредством матричного умножения матриц декодирования вещественнозначного поддиапазона и данных N-канального сигнала в М-К вещественнозначных частотных поддиапазонах, генерируемых средством (805) для генерации частотных поддиапазонов для N-канального сигнала,
при этом средство (807) для генерации данных понижающего микширования связано со средством (809) определения для определения матриц декодирования вещественнозначного поддиапазона, и
при этом средство (807) для генерации данных понижающего микширования связано с набором фильтров синтеза (811) для генерации сигнала понижающего микширования, причем сигнал понижающего микширования выполняют подаваемым на многоканальный декодер (813), связанный со средством (803) для извлечения параметрических данных, при этом многоканальный декодер (813) принимает сигнал понижающего микширования во временной области и параметрические многоканальные данные и генерирует многоканальный выходной сигнал.
2. Аудиодекодер (715) по п.1, в котором средство (809) определения организовано для определения инверсных матриц комплекснозначного поддиапазона из матриц кодирования и для определения матриц декодирования по инверсным матрицам.
3. Аудиодекодер (715) по п.2, в котором средство (809) определения организовано для определения каждого вещественнозначного матричного коэффициента матриц декодирования по абсолютному значению соответствующих матричных коэффициентов инверсных матриц.
4. Аудиодекодер (715) по п.3, в котором средство (809) определения организовано для определения каждого вещественнозначного матричного коэффициента, по существу, как абсолютное значение соответствующих матричных коэффициентов инверсных матриц.
5. Аудиодекодер (715) по п.1, в котором средство (809) определения организовано для определения матриц декодирования по матрицам перехода поддиапазонов, которые являются произведением соответствующих матриц декодирования и матриц кодирования.
6. Аудиодекодер (715) по п.5, в котором средство (809) определения организовано для определения матриц декодирования только по измерениям абсолютных значений матриц перехода.
7. Аудиодекодер (715) по п.5, в котором матрицы перехода каждого поддиапазона задаются:
Figure 00000047

где G - матрица декодирования поддиапазона, и Н - матрица кодирования поддиапазона, а средство определения организовано для выбора матричных коэффициентов
Figure 00000048

так, что измерение мощности p12 и p21 удовлетворяет критерию.
8. Аудиодекодер (715) по п.7, в котором измерение абсолютного значения определяется по:
Figure 00000049
9. Аудиодекодер (715) по п.7, в котором средство (809) определения дополнительно организовано для выбора матричных коэффициентов по ограничению абсолютного значения р11 и р22, которые, по существу, равны единице.
10. Аудиодекодер по п.1, в котором пониженно микшированный сигнал и параметрические многоканальные данные находятся в соответствии со стандартом MPEG Surround.
11. Аудиодекодер по п.1, в котором матрица кодирования представляет собой матрицу кодирования MPEG Матричной Окружающей Совместимости, а первый N-канальный сигнал является MPEG Совместимым с Матричным Окружением сигналом.
12. Способ аудиодекодирования, при этом способ включает в себя:
прием (1501) входных данных, включающих в себя N-канальный сигнал, соответствующий пониженно микшированному сигналу М-канального аудиосигнала, M>N, имеющий матрицы кодирования комплекснозначного поддиапазона, примененные в частотных поддиапазонах, и многоканальные параметрические данные, связанные с пониженно микшированным сигналом;
извлечение многоканальных параметрических данных из принятого сигнала;
генерацию (1503) частотных поддиапазонов для N-канального сигнала, при этом, по меньшей мере, К комплекснозначных частотных поддиапазонов и М-К вещественнозначных частотных поддиапазонов генерируют на этапе генерации (1503) частотных поддиапазонов для N-канального сигнала;
определение (1505) матриц декодирования вещественнозначных поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным, извлекаемым на этапе извлечения; и
генерацию (1507) данных понижающего микширования, соответствующих пониженно микшированному сигналу, с помощью матричного умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в М-К вещественнозначных частотных поддиапазонах, генерируемых на этапе генерации,
при этом этап генерации данных понижающего микширования включает в себя использование набора фильтров синтеза (811) для генерации сигнала понижающего микширования, причем сигнал понижающего микширования используют на этапе мультиканального декодирования сигнала понижающего микширования во временной области, используя многоканальные параметрические данные для получения многоканального выходного сигнала.
13. Приемник (703) для приема N-канального сигнала, при этом приемник (703) включает в себя:
средство (801) для приема входных данных, включающих в себя N-канальный сигнал, соответствующий пониженно микшированному сигналу М-канального аудиосигнала, M>N, имеющий матрицы кодирования комплекснозначного поддиапазона, примененные в частотных поддиапазонах, и многоканальные параметрические данные, связанные с пониженно микшированным сигналом;
средство (803) для извлечения параметрических данных, при этом средство (803) для извлечения связано со средством (801) для приема и сконфигурировано для извлечения многоканальных параметрических данных из принятого сигнала;
средство (805) для генерации частотных поддиапазонов для N-канального сигнала, при этом средство (805) для генерации частотных поддиапазонов сконфигурировано для генерации, по меньшей мере, К комплекснозначных частотных поддиапазонов и М-К вещественнозначных частотных поддиапазонов;
средство (809) определения для определения матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным, извлекаемым средством (803) для извлечения;
средство (807) для генерации данных понижающего микширования, соответствующих пониженно микшированному сигналу с помощью матричного умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в М-К вещественнозначных частотных поддиапазонах, генерируемых средством (805) для генерации частотных поддиапазонов для N-канального сигнала,
при этом средство (807) для генерации данных понижающего микширования связано со средством (809) определения для определения матриц декодирования вещественнозначного поддиапазона, и
при этом средство (807) для генерации данных понижающего микширования связано с набором фильтров синтеза (811) для генерации сигнала понижающего микширования, причем сигнал понижающего микширования выполняют подаваемым на многоканальный декодер (813), связанный со средством (803) для извлечения параметрических данных, при этом многоканальный декодер (813) принимает сигнал понижающего микширования во временной области и параметрические многоканальные данные и генерирует многоканальный выходной сигнал.
14. Система (700) передачи для передачи аудиосигнала, при этом система передачи включает в себя:
передатчик (701), включающий в себя:
средство (709) для генерации N-канального пониженно микшированного сигнала из М-канального аудиосигнала, M>N;
средство (709) для генерации параметрических многоканальных данных, связанных с пониженно микшированным сигналом,
средство (709) для генерации первого N-канального сигнала с помощью применения матриц кодирования комплекснозначных поддиапазонов к N-канальному пониженно микшированному сигналу в частотных поддиапазонах,
средство (709) для генерации второго N-канального сигнала, включающего в себя первый N-канальный сигнал и параметрические многоканальные данные, и
средство (711) для передачи второго N-канального сигнала на приемник (703); и
приемник (703), включающий в себя:
средство (801) для приема второго N-канального сигнала,
средство (803) для извлечения параметрических данных, причем средство (803) для извлечения связано со средством (801) для приема и сконфигурировано для извлечения многоканальных параметрических данных из принятого сигнала;
средство (805) для генерации частотных поддиапазонов для первого N-канального сигнала, при этом средство (805) для генерации частотных поддиапазонов сконфигурировано для генерации, по меньшей мере, К комплекснозначных частотных поддиапазонов и М-К вещественнозначных частотных поддиапазонов,
средство (809) определения для определения матриц декодирования вещественнозначных поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным, извлекаемым средством (803) для извлечения, и
средство (807) для генерации данных понижающего микширования, соответствующих N-канальному пониженно микшированному сигналу, с помощью матричного умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по меньшей мере, нескольких вещественнозначных частотных поддиапазонах, генерируемых средством (805) для генерации частотных поддиапазонов для N-канального сигнала,
при этом средство (807) для генерации данных понижающего микширования связано со средством (809) определения для определения матриц декодирования вещественнозначного поддиапазона, и
при этом средство (807) для генерации данных понижающего микширования связано с набором фильтров синтеза (811) для генерации сигнала понижающего микширования, причем сигнал понижающего микширования выполняют подаваемым на многоканальный декодер (813), связанный со средством (803) для извлечения параметрических данных, при этом многоканальный декодер (813) принимает сигнал понижающего микширования во временной области и параметрические многоканальные данные и генерирует многоканальный выходной сигнал.
15. Способ приема аудиосигнала, при этом способ включает в себя:
прием (1501) входных данных, включающих в себя N-канальный сигнал, соответствующий пониженно микшированному сигналу М-канального аудиосигнала, M>N, имеющий матрицы кодирования комплекснозначного поддиапазона, примененные в частотных поддиапазонах, и многоканальные параметрические данные, связанные с пониженно микшированным сигналом;
извлечение многоканальных параметрических данных из принятого сигнала;
генерацию (1503) частотных поддиапазонов для N-канального сигнала, при этом, по меньшей мере, К комплекснозначных частотных поддиапазонов и М-К вещественнозначных частотных поддиапазонов генерируют на этапе генерации;
определение (1505) матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным, извлекаемым на этапе извлечения, и
генерацию (1507) данных понижающего микширования, соответствующих пониженно микшированному сигналу, с помощью матричного умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по меньшей мере, нескольких вещественнозначных частотных поддиапазонах, генерируемых на этапе генерации частотных поддиапазонов для N-канального сигнала,
при этом этап генерации данных понижающего микширования использует набор фильтров синтеза (811) для генерации сигнала понижающего микширования, причем сигнал понижающего микширования используют на этапе мультиканального декодирования сигнала понижающего микширования во временной области, используя многоканальные параметрические данные для получения многоканального выходного сигнала.
16. Способ передачи и приема аудиосигнала, при этом способ включает в себя:
в передатчике (701) выполнение следующих этапов:
генерацию N-канального пониженно микшированного сигнала из М-канального аудиосигнала, M>N,
генерацию параметрических многоканальных данных, связанных с пониженно микшированным сигналом,
генерацию первого N-канального сигнала с помощью применения матриц кодирования комплекснозначных поддиапазонов к N-канальному пониженно микшированному сигналу в частотных поддиапазонах,
генерацию второго N-канального сигнала, включающего в себя первый N-канальный сигнал и параметрические многоканальные данные, и
передачу второго N-канального сигнала на приемник (703); и
в приемнике (703) выполнение следующих этапов:
прием (1501) второго N-канального сигнала,
генерация (1503) частотных поддиапазонов для первого N-канального сигнала, при этом средство (805) для генерации частотных поддиапазонов сконфигрировано для генерации, по меньшей мере, К комплекснозначных частотных поддиапазонов и М-К вещественнозначных частотных поддиапазонов,
определение (1505) матриц декодирования вещественнозначных поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным, извлекаемым средством (803) для извлечения,
генерация (1507) данных понижающего микширования, соответствующих N-канальному пониженно микшированному сигналу с помощью матричного умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по меньшей мере, нескольких вещественнозначных частотных поддиапазонах, генерируемых средством (805) для генерации,
при этом средство (807) для генерации данных понижающего микширования связано со средством (809) определения для определения матриц декодирования вещественнозначного поддиапазона, и
при этом средство (807) для генерации данных понижающего микширования связано с набором фильтров синтеза (811) для генерации сигнала понижающего микширования, причем сигнал понижающего микширования выполняют подаваемым на многоканальный декодер (813), связанный со средством (803) для извлечения параметрических данных, при этом многоканальный декодер (813) принимает сигнал понижающего микширования во временной области и параметрические многоканальные данные и генерирует многоканальный выходной сигнал.
17. Носитель информации, содержащий компьютерное программное обеспечение, которое при запуске на одном или более устройствах обработки данных и/или цифровых сигнальных процессорах обеспечивает выполнение способа по п.12.
18. Устройство аудиовоспроизведения (703), включающее в себя декодер (715) по п.1.
19. Носитель информации, содержащий компьютерное программное обеспечение, которое при запуске на одном или более устройствах обработки данных и/или цифровых сигнальных процессорах обеспечивает выполнение способа по п.15.
20. Носитель информации, содержащий компьютерное программное обеспечение, которое при запуске на одном или более устройствах обработки данных и/или цифровых сигнальных процессорах обеспечивает выполнение способа по п.16.
RU2008142752/09A 2006-03-29 2007-03-23 Аудиодекодирование RU2420814C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06111916 2006-03-29
EP06111916.0 2006-03-29

Publications (2)

Publication Number Publication Date
RU2008142752A RU2008142752A (ru) 2010-05-10
RU2420814C2 true RU2420814C2 (ru) 2011-06-10

Family

ID=38318626

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008142752/09A RU2420814C2 (ru) 2006-03-29 2007-03-23 Аудиодекодирование

Country Status (13)

Country Link
US (1) US8433583B2 (ru)
EP (1) EP1999747B1 (ru)
JP (1) JP5154538B2 (ru)
KR (1) KR101015037B1 (ru)
CN (1) CN101484936B (ru)
BR (1) BRPI0709235B8 (ru)
ES (1) ES2609449T3 (ru)
HK (1) HK1135791A1 (ru)
MX (1) MX2008012217A (ru)
PL (1) PL1999747T3 (ru)
RU (1) RU2420814C2 (ru)
TW (1) TWI413108B (ru)
WO (1) WO2007110823A1 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2625939C2 (ru) * 2012-10-05 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов
RU2675073C2 (ru) * 2014-09-26 2018-12-14 Генелек Ой Устройство и способ экономии энергии в активном динамике
RU2695504C1 (ru) * 2010-12-03 2019-07-23 Долби Лабораторис Лайсэнзин Корпорейшн Способ аудиокодирования и способ аудиодекодирования

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
CA2760677C (en) 2009-05-01 2018-07-24 David Henry Harkness Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
KR101370870B1 (ko) * 2009-12-16 2014-03-07 돌비 인터네셔널 에이비 Sbr 비트스트림 파라미터 다운믹스
RU2559899C2 (ru) * 2010-04-09 2015-08-20 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
JP2013050663A (ja) * 2011-08-31 2013-03-14 Nippon Hoso Kyokai <Nhk> 多チャネル音響符号化装置およびそのプログラム
US8442591B1 (en) * 2011-09-29 2013-05-14 Rockwell Collins, Inc. Blind source separation of co-channel communication signals
EP3712889A1 (en) * 2013-05-24 2020-09-23 Dolby International AB Efficient coding of audio scenes comprising audio objects
CN117012210A (zh) * 2013-05-24 2023-11-07 杜比国际公司 对音频场景进行解码的方法、装置及计算机可读介质
US9892737B2 (en) 2013-05-24 2018-02-13 Dolby International Ab Efficient coding of audio scenes comprising audio objects
WO2015059153A1 (en) 2013-10-21 2015-04-30 Dolby International Ab Parametric reconstruction of audio signals
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
US10672408B2 (en) 2015-08-25 2020-06-02 Dolby Laboratories Licensing Corporation Audio decoder and decoding method

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
DE60210479T2 (de) * 2001-08-21 2007-04-12 Koninklijke Philips Electronics N.V. Audiokodierer mit unregelmässiger filterbank
WO2005031704A1 (en) 2003-09-29 2005-04-07 Koninklijke Philips Electronics N.V. Encoding audio signals
KR101106026B1 (ko) 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US8923785B2 (en) * 2004-05-07 2014-12-30 Qualcomm Incorporated Continuous beamforming for a MIMO-OFDM system
CN101248483B (zh) 2005-07-19 2011-11-23 皇家飞利浦电子股份有限公司 多声道音频信号的生成

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2695504C1 (ru) * 2010-12-03 2019-07-23 Долби Лабораторис Лайсэнзин Корпорейшн Способ аудиокодирования и способ аудиодекодирования
RU2625939C2 (ru) * 2012-10-05 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов
US9734833B2 (en) 2012-10-05 2017-08-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution spatial-audio-object-coding
US10152978B2 (en) 2012-10-05 2018-12-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
RU2675073C2 (ru) * 2014-09-26 2018-12-14 Генелек Ой Устройство и способ экономии энергии в активном динамике

Also Published As

Publication number Publication date
BRPI0709235A2 (pt) 2011-06-28
EP1999747A1 (en) 2008-12-10
HK1135791A1 (en) 2010-06-11
CN101484936A (zh) 2009-07-15
ES2609449T3 (es) 2017-04-20
US8433583B2 (en) 2013-04-30
WO2007110823A1 (en) 2007-10-04
CN101484936B (zh) 2012-02-15
KR20080105135A (ko) 2008-12-03
US20090240505A1 (en) 2009-09-24
TW200746046A (en) 2007-12-16
BRPI0709235B8 (pt) 2019-10-29
JP2009536360A (ja) 2009-10-08
KR101015037B1 (ko) 2011-02-16
PL1999747T3 (pl) 2017-05-31
EP1999747B1 (en) 2016-10-12
TWI413108B (zh) 2013-10-21
BRPI0709235B1 (pt) 2019-10-15
MX2008012217A (es) 2008-11-12
JP5154538B2 (ja) 2013-02-27
RU2008142752A (ru) 2010-05-10

Similar Documents

Publication Publication Date Title
RU2420814C2 (ru) Аудиодекодирование
US11343631B2 (en) Compatible multi-channel coding/decoding
RU2396608C2 (ru) Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
KR101016982B1 (ko) 디코딩 장치
KR101613975B1 (ko) 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR100745688B1 (ko) 다채널 오디오 신호 부호화/복호화 방법 및 장치
US20120163608A1 (en) Encoder, encoding method, and computer-readable recording medium storing encoding program
Hold et al. Optimizing higher-order directional audio coding with adaptive mixing and energy matching for ambisonic compression and upmixing
KR100891668B1 (ko) 믹스 신호 처리 방법 및 장치
AU2004306509B2 (en) Compatible multi-channel coding/decoding
KR100891670B1 (ko) 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner