RU2645271C2 - Стереофонический кодер и декодер аудиосигналов - Google Patents

Стереофонический кодер и декодер аудиосигналов Download PDF

Info

Publication number
RU2645271C2
RU2645271C2 RU2015147181A RU2015147181A RU2645271C2 RU 2645271 C2 RU2645271 C2 RU 2645271C2 RU 2015147181 A RU2015147181 A RU 2015147181A RU 2015147181 A RU2015147181 A RU 2015147181A RU 2645271 C2 RU2645271 C2 RU 2645271C2
Authority
RU
Russia
Prior art keywords
signal
signals
frequency
encoded
frequencies
Prior art date
Application number
RU2015147181A
Other languages
English (en)
Other versions
RU2015147181A (ru
Inventor
Хейко ПУРНХАГЕН
Кристофер ЧЕРЛИНГ
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Publication of RU2015147181A publication Critical patent/RU2015147181A/ru
Application granted granted Critical
Publication of RU2645271C2 publication Critical patent/RU2645271C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам стереофонического кодирования и декодирования аудиосигналов. Технический результат заключается в повышении эффективности использования полосы частот. Принимают первый сигнал и второй сигнал. Принимают параметры восстановления высоких частот. Расширяют упомянутый сигнала понижающего микширования до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот с использованием параметров восстановления высоких частот. Принимают параметры повышающего микширования. Микшируют первый и второй сигналы для генерирования левого и правого каналов стереосигнала. Причем для частот ниже первой частоты разделения микширование содержит выполнение обратного суммарно-разностного преобразования первого и второго сигналов, а для частот выше первой частоты разделения микширование содержит выполнение параметрического повышающего микширования упомянутого сигнала понижающего микширования с использованием параметров повышающего микширования. 6 н. и 7 з.п. ф-лы, 6 ил.

Description

Область техники, к которой относится изобретение
Описываемое в настоящем документе изобретение, в основном, относится к стереофоническому кодированию аудиосигналов. В частности, оно относится к декодеру и кодеру для гибридного кодирования, включающего в себя понижающее микширование и дискретное стереофоническое кодирование.
Уровень техники изобретения
При традиционном стереофоническом кодировании аудиосигналов возможные схемы кодирования включают в себя методы параметрического стереофонического кодирования, которые используются в сферах применения с низкой скоростью передачи данных. При промежуточных скоростях часто используется левое/правое (L/R) или среднее/боковое (M/S) стереофоническое кодирование формы сигналов. Существующие форматы распределения и соответствующие методы кодирования могут быть улучшены с точки зрения их эффективности использования полосы частот, особенно в сферах применения со скоростью передачи данных между средней скоростью передачи данных и промежуточной скоростью передачи данных.
Попытка повысить эффективность распределения аудиосигналов в стереофонической звуковой системе предпринята в стандарте Унифицированного кодирования речи и звука (USAC). Стандарт USAC вводит стереофоническое кодирование на основе низкоскоростного кодирования формы сигналов в совокупности с методами параметрического стереофонического кодирования. Однако в решении, предлагаемом в USAC, используются параметрические стереофонические параметры для проведения стереофонического кодирования в области модифицированного дискретного косинусного преобразования (MDCT), чтобы несколько повысить эффективность по сравнению с простым M/S кодированием или L/R кодированием. Недостаток такого решения состоит в том, что может оказаться сложным наилучшим образом использовать стереофоническое кодирование на основе низкоскоростного кодирования формы сигналов в области MDCT на основе параметрических стереофонических параметров, извлекаемых и вычисляемых в области Квадратурных зеркальных фильтров (QMF).
С учетом вышесказанного, может потребоваться дальнейшее усовершенствование для устранения или, по меньшей мере, уменьшения одного или нескольких недостатков, рассмотренных выше.
Краткое описание чертежей
Примеры осуществления описываются ниже со ссылкой на прилагаемые чертежи, на которых:
фиг.1 представляет собой обобщенную блок-схему системы декодирования в соответствии с одним из примеров осуществления;
фиг.2 иллюстрирует первую часть системы декодирования, изображенной на фиг.1;
фиг.3 иллюстрирует вторую часть системы декодирования, изображенной на фиг.1;
фиг.4 иллюстрирует третью часть системы декодирования, изображенной на фиг.1;
фиг.5 представляет собой обобщенную блок-схему системы декодирования в соответствии с первым примером осуществления;
фиг.6 представляет собой обобщенную блок-схему системы декодирования в соответствии со вторым примером осуществления.
Все чертежи являются схематическими и в целом иллюстрируют лишь детали, которые необходимы для объяснения изобретения, при этом другие детали могут упоминаться или только предполагаться. Если не указано иное, одинаковые ссылочные позиции на различных чертежах относятся к одинаковым деталям.
Подробное описание
I. Обзор - декодер
Используемое в настоящем документе лево-правое кодирование или шифрование означает, что левый (L) и правый (R) стереосигналы кодируются без выполнения какого-либо преобразования между сигналами.
Используемое в настоящем документе суммарно-разностное кодирование или шифрование означает, что сумма М левого и правого стереосигналов кодируется как один сигнал (сумма), а разность S между левым и правым стереосигналами кодируется как один сигнал (разность). Суммарно-разностное кодирование может также называться средне-боковым кодированием. При этом соотношение между лево-правой формой и суммарно-разностной формой представляет собой M=L+R и S=L-R. Можно отметить, что возможны различные нормализации и масштабирование при преобразовании левого и правого стереосигналов в суммарно-разностную форму и наоборот при условии, что преобразование в обоих направлениях совпадает. В данном описании, главным образом, используется M=L+R и S=L-R, но система, использующая иное масштабирование, например, M=(L+R)/2 и S=(L-R)/2 действует с тем же успехом.
Используемое в настоящем документе понижающе-дополняющее (dmx/comp) кодирование или шифрование означает подвергание левого и правого стереосигналов матричному умножению в зависимости от весового параметра перед кодированием. При этом dmx/comp кодирование может также называться dmx/comp/a кодированием. Соотношение между понижающе-дополняющей формой, лево-правой формой и суммарно-разностной формой обычно выражается как L+R=M и comp=(1-a)L-(1+a)R=-aM+S. Примечательно, что сигнал понижающего микширования в понижающе-дополняющем представлении при этом эквивалентен суммарному сигналу М суммарно-разностного представления.
Используемый в настоящем документе аудиосигнал может представлять собой чистый аудиосигнал, аудиокомпоненту аудиовизуального сигнала, либо мультимедийный сигнал, либо любое из вышеназванного в совокупности с метаданными.
В соответствии с первым аспектом, в примерах осуществления предлагаются способы, устройства и компьютерные программные продукты для декодирования аудиосигнала стереофонического канала на основе входного сигнала. Предлагаемые способы, устройства и компьютерные программные продукты могут, как правило, иметь одинаковые признаки и преимущества.
В соответствии с примерами осуществления, предлагается декодер для декодирования двух аудиосигналов. Декодер включает в себя каскад приема, выполненный с возможностью приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух аудиосигналов, причем первый сигнал содержит первый кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, и кодируемый по форме сигнал понижающего микширования, содержащий спектральные данные, соответствующие частотам выше первой частоты разделения, причем второй сигнал содержит второй кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения.
Декодер дополнительно содержит каскад микширования на выходе каскада приема. Каскад микширования выполнен с возможностью проверки, находятся ли первый и второй кодируемые по форме сигналы в суммарно-разностной форме для всех частот до первой частоты разделения, и если нет, преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму таким образом, что первый сигнал является комбинацией кодируемого по форме суммарного сигнала, содержащего спектральные данные, соответствующие частотам до первой частоты разделения, и кодируемого по форме сигнала понижающего микширования, содержащего спектральные данные, соответствующие частотам выше первой частоты разделения, а второй сигнал содержит кодируемый по форме разностный сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения.
Декодер дополнительно содержит каскад повышающего микширования на выходе каскада микширования, выполненный с возможностью повышающего микширования первого и второго сигналов для генерирования левого и правого каналов стереосигнала, причем для частот ниже первой частоты разделения каскад повышающего микширования выполнен с возможностью выполнения обратного суммарно-разностного преобразования первого и второго сигналов, а для частот выше первой частоты разделения каскад повышающего микширования выполнен с возможностью выполнения параметрического повышающего микширования сигнала понижающего микширования первого сигнала.
Преимущество наличия нижних частот, прошедших чистое кодирование формы сигналов, т.е. дискретного представления стерео-аудиосигнала, может состоять в том, что человеческое ухо более чувствительно к аудиокомпоненте, имеющей низкие частоты. Благодаря кодированию этой компоненты с более высоким качеством общее впечатление о декодированном аудиосигнале может улучшиться.
Преимущество наличия прошедшей параметрическое стереофоническое кодирование компоненты первого сигнала, т.е. кодируемого по форме сигнала понижающего микширования, а также упомянутого дискретного представления стерео-аудиосигнала состоит в том, что это может повысить качество декодированного аудиосигнала для определенных скоростей передачи данных по сравнению с использованием традиционного параметрического подхода к стереосигналу. При скоростях передачи данных около 32-40 килобит в секунду (кбит/с) параметрическая модель стереофонии может входить в насыщение, т.е. качество декодированного аудиосигнала ограничено недостатками параметрической модели, а не недостаточностью битов для кодирования. Следовательно, для скоростей передачи битов приблизительно от 32 кбит/с может оказаться более целесообразным использовать биты на нижних частотах кодирования формы сигналов. В то же время, гибридный подход к использованию и прошедшей параметрическое стереофоническое кодирование компоненты первого сигнала и дискретного представления распределенного стерео-аудиосигнала состоит в том, что это может повысить качество декодированного аудиосигнала для определенных скоростей передачи данных, например ниже 48 кбит/с, по сравнению с использованием подхода, при котором все биты используются для нижних частот кодирования формы сигнала, и использованием репликации полосы спектра (SBR) для остальных частот.
Декодер при этом предпочтительно используется для декодирования двухканального стерео-аудиосигнала.
В соответствии с еще одним вариантом осуществления, преобразование первого и второго кодируемых по форме сигналов в суммарно-разностную форму в каскаде микширования осуществляется в перекрывающейся оконной области преобразования. Перекрывающаяся оконная область преобразования может, например, представлять собой область модифицированного дискретного косинусного преобразования (MDCT). Это может оказаться целесообразным, поскольку преобразование других имеющихся форматов распределения аудиосигналов, таких как левая/правая форма или dmx/comp форма, в суммарно-разностную форму легко обеспечивается в области MDCT. Следовательно, сигналы могут кодироваться с использованием различных форматов, для, по меньшей мере, поднабора частот ниже первой частоты разделения в зависимости от характеристик кодируемого сигнала. Это может обеспечить повышенные качество кодирования и эффективность кодирования.
В соответствии с еще одним вариантом осуществления, повышающее микширование первого и второго сигналов в каскаде повышающего микширования выполняется в области Квадратурных зеркальных фильтров (QMF). Повышающее микширование выполняется для генерирования левого и правого стереосигналов.
В соответствии с еще одним вариантом осуществления, кодируемый по форме сигнал понижающего микширования содержит спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения. Параметры восстановления высоких частот (HFR) принимаются декодером, например, в каскаде приема, а затем отправляются в каскад восстановления высоких частот для расширения сигнала понижающего микширования первого сигнала до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот с использованием параметров восстановления высоких частот. Восстановление высоких частот может, например, включать в себя выполнение репликации полосы спектра, SBR.
Преимущество наличия кодируемого по форме сигнала понижающего микширования, который содержит лишь спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения, состоит в том, что требуемая скорость передачи данных для стереофонической системы может быть понижена. В соответствии с другим вариантом, биты, сохраняемые благодаря наличию кодируемого по форме сигнала понижающего микширования, используются для нижних частот кодирования формы сигналов, например квантование для этих частот может осуществляться более мелкими шагами, либо первая частота разделения может быть повышена.
Поскольку, как упоминалось выше, человеческое ухо более чувствительно к компоненте аудиосигнала, имеющей низкие частоты, высокие частоты, такие как компонента аудиосигнала, имеющие частоты выше второй частоты разделения, могут быть восстановлены путем восстановления высоких частот без снижения воспринимаемого качества звука декодированного аудиосигнала.
В соответствии с еще одним вариантом осуществления, сигнал понижающего микширования первого сигнала расширяется до диапазона частот выше второй частоты разделения перед тем, как осуществляется повышающее микширование первого и второго сигналов. Это может оказаться целесообразным, поскольку каскад повышающего микширования будет иметь входной суммарный сигнал со спектральными данными, соответствующими всем частотам.
В соответствии с еще одним вариантом осуществления, сигнал понижающего микширования первого сигнала расширяется до диапазона частот выше второй частоты разделения после преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму. Это может оказаться целесообразным, поскольку с учетом того, что сигнал понижающего микширования соответствует суммарному сигналу в суммарно-разностном представлении, каскад восстановления высоких частот будет иметь входной сигнал со спектральными данными, соответствующими частотам до второй частоты разделения, представленный в той же форме, т.е. в суммарной форме.
В соответствии с еще одним вариантом осуществления, повышающее микширование в каскаде повышающего микширования осуществляется с использованием параметров повышающего микширования. Параметры повышающего микширования принимаются декодером, например, в каскаде приема и отправляются в каскад повышающего микширования. Генерируется декоррелированная версия сигнала понижающего микширования, при этом сигнал понижающего микширования и декоррелированная версия сигнала понижающего микширования подвергаются матричной операции. Параметры матричной операции задаются параметрами повышающего микширования.
В соответствии с еще одним вариантом осуществления, кодируемые по форме первый и второй сигналы, принимаемые в каскаде приема, кодируются по форме в лево-правой форме, суммарно-разностной форме и/или понижающе-дополняющей форме, причем дополняющий сигнал зависит от весового параметра a, адаптивного к сигналу. Кодируемые по форме сигналы могут при этом кодироваться по различным формам в зависимости от характеристик сигналов и, тем не менее, быть декодируемыми декодером. Это может обеспечить повышенное качество кодирования и, следовательно, повышенное качество декодированного стерео-аудиосигнала при наличии определенной скорости передачи данных системы. Еще в одном варианте осуществления весовой параметр a является вещественным. Это может упростить декодер, поскольку не требуется никакой дополнительный каскад, аппроксимирующий мнимую компоненту сигнала. Еще одно преимущество состоит в том, что вычислительная сложность декодера может понизиться, что может также привести к уменьшенной задержке/запаздыванию декодирования декодера.
В соответствии с еще одним вариантом осуществления, кодируемые по форме первый и второй сигналы, принимаемые в каскаде приема, кодируются по форме в суммарно-разностной форме. Это означает, что первый и второй сигналы могут кодироваться с использованием перекрывающихся оконных преобразований с организацией независимых окон для первого и второго сигналов соответственно и тем не менее быть декодируемыми декодером. Это может обеспечить повышенное качество кодирования и, следовательно, повышенное качество декодированного стерео-аудиосигнала при наличии определенной скорости передачи данных системы. Например, если переходный процесс обнаруживается в суммарном сигнале и не обнаруживается в разностном сигнале, кодер формы сигнала может кодировать суммарный сигнал с более короткими окнами, а для разностного сигнала могут быть сохранены более длительные задаваемые по умолчанию окна. Это может обеспечивать более высокую эффективность кодирования по сравнению с тем случаем, когда боковой сигнал также кодировался бы с использованием последовательности более короткого окна.
II. Обзор - кодер
В соответствии со вторым аспектом, в примерах осуществления предлагаются способы, устройства и компьютерные программные продукты для кодирования аудиосигнала стереофонического канала на основе входного сигнала.
Предлагаемые способы, устройства и компьютерные программные продукты могут, как правило, иметь одинаковые признаки и преимущества.
Преимущества, касающиеся признаков и устройств и представленные в приведенном выше обзоре декодера, в целом могут иметь силу для соответствующих признаков и устройств кодера.
В соответствии с примерами осуществления, предлагается кодер для кодирования двух аудиосигналов. Кодер содержит каскад приема, выполненный с возможностью приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух сигналов, подлежащих кодированию.
Кодер дополнительно содержит каскад преобразования, выполненный с возможностью приема первого и второго сигналов с каскада приема и преобразования их в первый преобразованный сигнал, являющийся суммарным сигналом, и второй преобразованный сигнал, являющийся разностным сигналом.
Кодер дополнительно содержит каскад кодирования формы сигналов, выполненный с возможностью приема первого и второго преобразованных сигналов с каскада преобразования и осуществления с ними кодирования формы сигналов с получением первого и второго кодируемых по форме сигналов соответственно, причем для частот выше первой частоты разделения каскад кодирования формы сигналов выполнен с возможностью осуществления кодирования по форме первого преобразованного сигнала, а для частот до первой частоты разделения каскад кодирования формы сигналов выполнен с возможностью осуществления кодирования по форме первого и второго преобразованных сигналов.
Кодер дополнительно содержит каскад параметрического стереокодирования, выполненный с возможностью приема первого и второго сигналов с каскада приема и подвергания первого и второго сигналов параметрическому стереокодированию с целью извлечения параметрических стереопараметров, обеспечивающих восстановление спектральных данных первого и второго сигналов для частот выше первой частоты разделения.
Кодер дополнительно содержит каскад генерирования битового потока, выполненный с возможностью приема первого и второго кодируемых по форме сигналов с каскада кодирования формы сигналов и параметрических стереопараметров с каскада параметрического стереокодирования, а также генерирования битового потока, содержащего первый и второй кодируемые по форме сигналы и параметрические стереопараметры.
В соответствии с еще одним вариантом осуществления, преобразование первого и второго сигналов в каскаде преобразования выполняется во временной области.
В соответствии с еще одним вариантом осуществления, для, по меньшей мере, поднабора частот ниже первой частоты разделения кодер может преобразовывать первый и второй кодируемые по форме сигналы в лево-правую форму путем выполнения обратного суммарно-разностного преобразования.
В соответствии с еще одним вариантом осуществления, для, по меньшей мере, поднабора частот ниже первой частоты разделения кодер может преобразовывать первый и второй кодируемые по форме сигналы в понижающе-дополняющую форму путем выполнения матричной операции над первым и вторым сигналами, прошедшими кодирование формы сигналов, причем матричная операция зависит от весового параметра а. Весовой параметр а может после этого быть включен в битовый поток в каскаде генерирования битового потока.
В соответствии с еще одним вариантом осуществления, для частот выше первой частоты разделения кодирование формы сигналов первого и второго преобразованных сигналов в каскаде преобразования включает в себя кодирование формы сигналов первого преобразованного сигнала для частот между первой частотой разделения и второй частотой разделения и установку первого сигнала, прошедшего кодирование формы сигналов, в нуль выше второй частоты разделения. Сигнал понижающего микширования первого сигнала и второго сигнала может после этого подвергаться кодированию с восстановлением высоких частот в каскаде восстановления высоких частот с целью генерирования параметров восстановления высоких частот, обеспечивающих восстановление высоких частот сигнала понижающего микширования. Параметры восстановления высоких частот могут после этого быть включены в битовый поток в каскаде генерирования битового потока.
В соответствии с еще одним вариантом осуществления, сигнал понижающего микширования вычисляется на основе первого и второго сигналов.
В соответствии с еще одним вариантом осуществления, подвергание первого и второго сигналов параметрическому стереокодированию в каскаде параметрического стереокодирования осуществляется путем сначала преобразования первого и второго сигналов в первый преобразованный сигнал, являющийся суммарным сигналом, и второй преобразованный сигнал, являющийся разностным сигналом, а затем подвергания первого и второго преобразованных сигналов параметрическому стереокодированию, причем сигнал понижающего микширования, подлежащий кодированию с восстановлением высоких частот, является первым преобразованным сигналом.
III. Примеры осуществления
Фиг.1 представляет собой обобщенную блок-схему системы 100 декодирования, содержащей концептуальные части 200, 300 и 400, которые подробно будут объясняться в соответствии с приводимыми ниже фиг.2-4. В первой концептуальной части 200 битовый поток принимается и декодируется в первый и второй сигналы. Первый сигнал содержит как первый кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, так и кодируемый по форме сигнал понижающего микширования, содержащий спектральные данные, соответствующие частотам выше первой частоты разделения. Второй сигнал включает в себя лишь второй кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения.
Во второй концептуальной части 300 в том случае, если прошедшие кодирование формы сигналов компоненты первого и второго сигналов находятся не в суммарно-разностной форме, например в M/S форме, прошедшие кодирование формы сигналов компоненты первого и второго сигналов преобразуются в суммарно-разностную форму. После этого первый и второй сигналы преобразуются во временную область, а затем в область Квадратурных зеркальных фильтров, QMF. В третьей концептуальной части 400 первый сигнал восстановлен по высоким частотам (HFR). И первый, и второй сигналы затем подвергаются повышающему микшированию с получением левого и правого стереофонических выходных сигналов, которые имеют спектральные коэффициенты, соответствующие полному диапазону частот кодированного сигнала, декодируемого системой 100 декодирования.
Фиг.2 иллюстрирует первую концептуальную часть 200 системы 100 декодирования, изображенной на фиг.1. Система 100 декодирования содержит каскад 212 приема. В каскаде 212 приема кадр 202 битового потока декодируется и деквантуется в первый сигнал 204а и второй сигнал 204b. Кадр 202 битового потока соответствует временному интервалу двух декодируемых аудиосигналов. Первый сигнал 204а включает в себя первый сигнал 208, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам до первой частоты разделения kγ, и сигнал 206 понижающего микширования, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам выше первой частоты разделения kγ. Например, первая частота разделения kγ составляет 1,1 кГц.
В соответствии с некоторыми вариантами осуществления, сигнал 206 понижающего микширования, прошедший кодирование формы сигналов, содержит спектральные данные, соответствующие частотам между первой частотой разделения kγ и второй частотой разделения kχ. Например, вторая частота разделения kχ лежит в диапазоне 5,6-8 кГц.
Принимаемые первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, могут быть с кодированием формы сигналов в лево-правой форме, суммарно-разностной форме и/или понижающе-дополняющей форме, причем дополняющий сигнал зависит от весового параметра a, адаптивного к сигналу. Сигнал 206 понижающего микширования, прошедший кодирование формы сигналов, соответствует понижающему микшированию, подходящему для параметрического стерео, которое - в соответствии с приведенным выше описанием - соответствует суммарной форме. Однако сигнал 204b не имеет контента выше первой частоты разделения kγ. Каждый из сигналов 206, 208, 210 представлен в области модифицированного дискретного косинусного преобразования (MDCT).
Фиг.3 иллюстрирует вторую концептуальную часть 300 системы 100 декодирования, изображенной на фиг.1. Система 100 декодирования содержит каскад 302 микширования. Конструкция системы 100 декодирования требует, чтобы входной сигнал каскада восстановления высоких частот, который подробнее описывается ниже, находился в суммарной форме. Следовательно, каскад микширования выполнен с возможностью проверки, находятся ли первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, в суммарно-разностной форме. Если первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, не находятся в суммарно-разностной форме для всех частот до первой частоты разделения kγ, каскад 302 микширования полностью преобразует сигналы 208, 210, прошедшие кодирование формы сигналов, в суммарно-разностную форму. В случае если, по меньшей мере, поднабор частот входных сигналов 208, 210 каскада 302 микширования находится в понижающе-дополняющей форме, в качестве входного сигнала каскада 302 микширования требуется весовой параметр a. Можно отметить, что входные сигналы 208, 210 могут содержать несколько поднаборов частот, кодированных в понижающе-дополняющей форме, и что в этом случае каждый поднабор не обязательно должен кодироваться с использованием одного и того же значения весового параметра a. В этом случае в качестве входного сигнала каскада 302 микширования требуются несколько весовых параметров a.
Как указано выше, каскад 302 микширования всегда выдает суммарно-разностное представление входных сигналов 204a-b. Для того чтобы иметь возможность преобразовывать сигналы, представленные в области MDCT, в суммарно-разностное представление, организация окон сигналов с MDCT кодированием должна быть такой же. Это предполагает, что в случае, если первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, находятся в L/R или понижающе-дополняющей форме, организация окон для сигнала 204а и организация окон для сигнала 204b не могут быть независимыми.
Следовательно, в случае, если первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, находятся в суммарно-разностной форме, организация окон для сигнала 204а и организация окон для сигнала 204b не могут быть независимыми.
После каскада 302 микширования суммарно-разностный сигнал преобразуется во временную область путем применения обратного модифицированного дискретного косинусного преобразования (MDCT-1) 312.
Затем два сигнала 304a, b анализируются двумя блоками 314 QMF. Поскольку сигнал 306 понижающего микширования не содержит нижних частот, нет необходимости анализировать сигнал с помощью блока фильтров Найквиста для повышения разрешающей способности по частоте. Это можно сравнить с системами, в которых сигнал понижающего микширования содержит нижние частоты, например традиционное параметрическое стереодекодирование, такое как параметрическое стерео MPEG-4. В этих системах сигнал понижающего микширования должен анализироваться с помощью блока фильтров Найквиста с целью повышения разрешающей способности по частоте сверх того, что достигается с помощью блока QMF, и посредством этого лучшего согласования с частотной избирательностью слуховой системы человека, например представленной частотной шкалой барков.
Выходной сигнал 304 с блоков 314 QMF включает в себя первый сигнал 304а, который является комбинацией суммарного сигнала 308, прошедшего кодирование формы сигналов и содержащего спектральные данные, соответствующие частотам до первой частоты разделения kγ, и сигнал 306 понижающего микширования, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам между первой частотой разделения kγ и второй частотой разделения kχ. Выходной сигнал 304 дополнительно включает в себя второй сигнал 304b, который содержит разностный сигнал 310, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам до первой частоты разделения kγ. Сигнал 304b не имеет контента выше первой частоты разделения kγ.
Как будет описываться ниже, каскад 416 восстановления высоких частот (изображенный на фиг.4) использует нижние частоты, т.е. первый сигнал 308, прошедший кодирование формы сигналов, и сигнал 306 понижающего микширования, прошедший кодирование формы сигналов, из выходного сигнала 304 для восстановления частот выше второй частоты разделения kχ. Целесообразно, чтобы сигнал, на котором работает каскад 416 восстановления высоких частот, являлся сигналом аналогичного типа на всех нижних частотах. С этой точки зрения целесообразно, чтобы каскад 302 микширования всегда выдавал суммарно-разностное представление первого и второго сигналов 208, 210, прошедших кодирование формы сигналов, поскольку это означает, что первый сигнал 308, прошедший кодирование формы сигналов, и сигнал 306 понижающего микширования, прошедший кодирование формы сигналов, из выдаваемого первого сигнала 304а - одинакового характера.
Фиг.4 иллюстрирует третью концептуальную часть 400 системы 100 декодирования, изображенной на фиг.1. Каскад 416 восстановления высоких частот (HFR) расширяет сигнал 306 понижающего микширования входного сигнала 304а первого сигнала до диапазона частот выше второй частоты разделения kχ путем выполнения восстановления высоких частот. В зависимости от конфигурации каскада 416 HFR, входным сигналом для каскада 416 HFR является весь сигнал 304а или только сигнал 306 понижающего микширования. Восстановление высоких частот осуществляется путем использования параметров восстановления высоких частот, которые могут приниматься каскадом 416 восстановления высоких частот любым применимым способом. В соответствии с одним из вариантов осуществления, выполняемое восстановление высоких частот содержит выполнение репликации полосы спектра, SBR.
Выходным сигналом каскада 314 восстановления высоких частот является сигнал 404, содержащий сигнал 406 понижающего микширования с примененным расширением SBR. Восстановленный по высоким частотам сигнал 404 и сигнал 304b после этого подаются на каскад 420 повышающего микширования для генерирования левого L и правого R стереосигналов 412a, b. Для спектральных коэффициентов, соответствующих частотам ниже первой частоты разделения kγ, повышающее микширование содержит выполнение обратного суммарно-разностного преобразования первого и второго сигналов 408, 310. Это попросту означает переход от средне-бокового представления к лево-правому представлению, как указано выше. Для спектральных коэффициентов, соответствующих частотам выше первой частоты разделения kγ, сигнал 406 понижающего микширования и расширение 412 SBR подаются через декоррелятор 418. Сигнал 406 понижающего микширования и расширение 412 SBR, а также декоррелированная версия сигнала 406 понижающего микширования и расширения 412 SBR после этого подвергаются повышающему микшированию с использованием параметров параметрического микширования для восстановления левого и правого каналов 416, 414 для частот выше первой частоты разделения kγ. Может применяться любая известная процедура параметрического повышающего микширования.
Необходимо отметить, что в вышеописанном примере 100 осуществления кодера, изображенном на фиг.1-4, необходимо восстановление высоких частот, поскольку первый принимаемый сигнал 204а содержит лишь спектральные данные, соответствующие частотам до второй частоты разделения kχ. В других вариантах осуществления первый принимаемый сигнал содержит спектральные данные, соответствующие всем частотам кодированного сигнала. В соответствии с этим вариантом осуществления, восстановление высоких частот не требуется. Специалисту понятно, как адаптировать пример 100 кодера в этом случае.
На фиг.5 в качестве примера изображена обобщенная блок-схема системы 500 декодирования в соответствии с одним из вариантов осуществления.
В этой системе кодирования первый и второй сигналы 540, 542, подлежащие кодированию, принимаются каскадом приема (не показан). Эти сигналы 540, 542 соответствуют временному интервалу левого 540 и правого 542 стереофонических звуковых каналов. Сигналы 540, 542 представлены во временной области. Система кодирования содержит каскад 510 преобразования. Сигналы 540, 542 преобразуются в суммарно-разностный формат 544, 546 в каскаде 510 преобразования.
Система кодирования дополнительно содержит каскад 514 кодирования формы сигналов, выполненный с возможностью приема первого и второго преобразованных сигналов 544, 546 с каскада 510 преобразования. Каскад кодирования формы сигналов, как правило, работает в области MDCT. В связи с этим, преобразованные сигналы 544, 546 подвергаются преобразованию 512 MDCT перед каскадом 514 кодирования формы сигналов. В каскаде кодирования формы сигналов первый и второй преобразованные сигналы 544, 546 кодируются по форме с получением первого и второго сигналов 518, 520, прошедших кодирование формы сигналов соответственно.
Для частот выше первой частоты разделения kγ каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 с получением сигнала 552 с кодированием формы сигналов первого сигнала 518, прошедшего кодирование формы сигналов. Каскад 514 кодирования формы сигналов может быть выполнен с возможностью установки второго сигнала 520, прошедшего кодирование формы сигналов, в нуль выше первой частоты разделения kγ, либо не кодирования этих частот вообще. Для частот выше первой частоты разделения kγ каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 с получением сигнала 552 с кодированием формы сигналов первого сигнала 518, прошедшего кодирование формы сигналов.
Для частот ниже первой частоты разделения kγ в каскаде 514 кодирования формы сигналов принимается решение о том, какого рода стереокодирование использовать для двух сигналов 548, 550. В зависимости от характеристик преобразованных сигналов 544, 546 ниже первой частоты разделения kγ могут приниматься различные решения для различных поднаборов сигналов 548, 550, прошедших кодирование формы сигналов. Кодирование может представлять собой либо Левое/Правое кодирование, Среднее/Боковое кодирование, т.е. кодирование суммы и разности, либо dmx/comp/a кодирование. В случае если сигналы 548, 550 подвергались кодированию формы сигналов в каскаде 514 кодирования формы сигналов, сигналы 518, 520, прошедшие кодирование формы сигналов, могут кодироваться с использованием перекрывающихся оконных преобразований с независимой организацией окон для сигналов 518, 520 соответственно.
Одним из примеров первой частоты разделения kγ является 1,1 кГц, но эта частота может изменяться в зависимости от скорости передачи данных стереофонической звуковой системы или в зависимости от характеристик кодируемого аудиосигнала.
По меньшей мере два сигнала 518, 520 при этом выдаются с каскада 514 кодирования формы сигналов. В случае, если один или несколько поднаборов, либо весь диапазон частот сигналов ниже первой частоты разделения kγ кодируется в понижающе-дополняющей форме путем выполнения матричной операции в зависимости от весового параметра а, этот коэффициент также выдается в качестве сигнала 522. В случае нескольких поднаборов, кодируемых в понижающей/дополняющей форме, каждый поднабор не обязательно должен кодироваться с использованием одного и того же значения весового параметра а. В этом случае в качестве сигнала 522 выдаются несколько весовых параметров.
Указанные два или три сигнала 518, 520, 522 кодируются и квантуются 524 с получением единого составного сигнала 558.
Для того чтобы иметь возможность восстанавливать спектральные данные первого и второго сигналов 540, 542 для частот выше первой частоты разделения на стороне декодера, из сигналов 540, 542 должны извлекаться параметрические стереопараметры 536. С этой целью кодер 500 содержит каскад 530 параметрического стерео (PS) кодирования. Каскад 530 PS кодирования, как правило, работает в области QMF. Следовательно, перед вводом в каскад 530 PS кодирования первый и второй сигналы 540, 542 преобразуются в область QMF с помощью каскада 526 анализа QMF. Каскад 530 PS кодирования предназначен лишь для извлечения параметрических стереопараметров 536 для частот выше первой частоты разделения kγ.
Можно отметить, что параметрические стереопараметры 536 отражают характеристики сигнала, прошедшего параметрическое стереокодирование. При этом они являются частотно избирательными, т.е. каждый параметр из параметров 536 может соответствовать поднабору частот левого или правого входных сигналов 540, 542. Каскад 530 PS кодирования вычисляет параметрические стереопараметры 536 и квантует их либо с равномерным шагом, либо с неравномерным шагом. Эти параметры, как упоминалось выше, являются частотно избирательными, причем весь диапазон частот входных сигналов 540, 542 делится, например, на 15 диапазонов параметров. Они могут быть разнесены в соответствии с моделью частотного разрешения слуховой системы человека, например шкалой барков.
В примере осуществления кодера 500, изображенном на фиг.5, каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 для частот между первой частотой разделения kγ и второй частотой разделения kχ и установки первого сигнала 518, прошедшего кодирование формы сигналов, на ноль выше второй частоты разделения kχ. Это может осуществляться для дополнительного снижения требуемой скорости передачи данных звуковой системы, в состав которой входит кодер 500. Для того чтобы иметь возможность восстанавливать сигнал выше второй частоты разделения kχ, должны генерироваться параметры 538 восстановления высоких частот. В соответствии с этим примером осуществления, это выполняется путем понижающего микширования двух сигналов 540, 542, представленных в области QMF, в каскаде 534 понижающего микширования. Результирующий сигнал понижающего микширования, который, например, равен сумме двух сигналов 540, 542, подвергается после этого кодированию с восстановлением высоких частот в каскаде 532 кодирования с восстановлением высоких частот - HFR - с целью генерирования параметров 538 восстановления высоких частот. Параметры 538 могут, например, включать в себя огибающую спектра частот выше второй частоты разделения kχ, информацию о накоплении помех и т.д., также известные специалистам.
Одним из примеров второй частоты разделения kχ является 5,6-8 кГц, но эта частота может изменяться в зависимости от скорости передачи данных стереофонической звуковой системы или в зависимости от характеристик кодируемого аудиосигнала.
Кодер 500 дополнительно содержит каскад генерирования битовых потоков, т.е. мультиплексор 524 битовых потоков. В соответствии с примером осуществления кодера 500, каскад генерирования битовых потоков выполнен с возможностью приема кодированного и квантованного сигнала 544 и двух сигналов 536, 538 параметров. Они преобразуются в битовый поток 560 каскадом 562 генерирования битовых потоков для последующего распределения в стереофонической звуковой системе.
В соответствии с еще одним вариантом осуществления, каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 для всех частот выше первой частоты разделения kγ. В этом случае каскад 532 кодирования с HFR не требуется, и, следовательно, параметры 538 восстановления высоких частот не включаются в битовый поток.
На фиг.6 в качестве примера изображена обобщенная блок-схема системы 600 кодирования в соответствии с еще одним вариантом осуществления. Данный вариант осуществления отличается от варианта осуществления, изображенного на фиг.5, тем, что сигналы 544, 546, которые преобразуются каскадом 526 анализа QMF, находятся в суммарно-разностном формате. Следовательно, отдельный каскад 534 понижающего микширования не требуется, поскольку суммарный сигнал 544 уже находится в форме сигнала понижающего микширования. При этом для работы по суммарному сигналу 544 для извлечения параметров 538 восстановления высоких частот требуется лишь каскад 532 SBR кодирования. Каскад 530 PS кодирования предназначен для работы как по суммарному сигналу 544, так и по разностному сигналу 546 для извлечения параметрических стереопараметров 536.
Эквиваленты, расширения, альтернативы и прочее
После изучения приведенного выше описания специалисту станут очевидными другие варианты осуществления настоящего изобретения. Несмотря на то что настоящее описание и чертежи раскрывают варианты осуществления и примеры, изобретение не ограничивается этими конкретными примерами. Возможны различные другие варианты в пределах объема настоящего изобретения, который определяется в прилагаемой формуле изобретения. Любые ссылочные позиции в формуле изобретения не должны трактоваться как ограничивающие ее объем.
Кроме того, по результатам изучения чертежей, описания и прилагаемой формулы изобретения специалистом могут быть поняты и реализованы изменения в описываемых вариантах осуществления. В формуле изобретения слово «содержащий» не исключает другие элементы или этапы, а неопределенный артикль не исключает множества. Сам по себе тот факт, что некоторые критерии излагаются в различных зависимых пунктах формулы изобретения, не означает, что совокупность этих критериев не может использоваться с пользой.
Описанные выше системы и способы могут быть реализованы в виде программных средств, микропрограммных средств, аппаратных средств или их комбинации. При аппаратной реализации разделение задач между функциональными блоками, упоминаемыми в приведенном выше описании, не обязательно должно соответствовать разделению на физические блоки, напротив, один физический компонент может иметь множество функциональных назначений, при этом одна задача может выполняться несколькими физическими компонентами совместно. Некоторые компоненты или все компоненты могут быть реализованы в виде программных средств, исполняемых цифровым сигнальным процессором или микропроцессором, либо реализованы в виде аппаратных средств, либо в виде специализированной интегральной схемы. Такие программные средства могут быть распределены по считываемым компьютером носителям, которые могут включать в себя запоминающие среды компьютеров (или энергонезависимые среды) и среды передачи данных (или энергозависимые среды). Как известно специалистам, термин «запоминающие среды компьютеров» включает в себя и энергозависимые, и энергонезависимые, и съемные, и несъемные среды, реализуемые с помощью любого способа или технологии для хранения информации, такие как считываемые компьютером инструкции, структуры данных, программные модули и прочие данные. Запоминающие среды компьютеров включают в себя, помимо прочего, оперативное запоминающее устройство (ОЗУ), постоянное запоминающее устройство (ПЗУ), электрически стираемое программируемое постоянное запоминающее устройство (ЭСППЗУ), флэш-память или иную технологию памяти, постоянное запоминающее устройство на компакт-дисках (CD-ROM), универсальный цифровой диск (DVD) или иной накопитель на оптических дисках, магнитные кассеты, накопитель на магнитных дисках или иные магнитные запоминающие устройства, либо иную среду, которая может использоваться для хранения необходимой информации и доступ к которой может осуществляться компьютером. Кроме того, специалистам известно, что среды передачи данных, как правило, включают в себя считываемые компьютером инструкции, структуры данных, программные модули или иные данные в модулированном информационном сигнале, таком как несущая волна или иной механизм переноса, и включают в себя любые среды доставки информации.

Claims (43)

1. Способ декодирования для декодирования двух аудиосигналов, содержащий этапы:
приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух аудиосигналов, причем первый сигнал содержит первый кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, и сигнал понижающего микширования, содержащий кодируемые по форме спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения, причем второй сигнал содержит второй кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, причем принимаемые первый и второй кодируемые по форме сигналы кодируются по форме в лево-правой форме, в которой первый и второй кодируемые по форме сигналы кодируются без выполнения над ними какого-либо преобразования, суммарно-разностной форме, в которой сумма первого и второго кодируемых по форме сигналов кодируется как один суммарный сигнал и разность между первым и вторым кодируемыми по форме сигналами кодируется как один разностный сигнал, и/или понижающе-дополняющей форме, в которой первый и второй кодируемые по форме сигналы подвергаются матричной операции в зависимости от весового параметра a, который является адаптивным к сигналу и который принимается в дополнение к принимаемым первому и второму сигналам, причем суммарно-разностная форма соответствует конкретному значению весового параметра;
проверки, находятся ли первый и второй кодируемые по форме сигналы в суммарно-разностной форме для всех частот до первой частоты разделения, и если нет, преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму таким образом, что первый сигнал является комбинацией кодируемого по форме суммарного сигнала, содержащего спектральные данные, соответствующие частотам до первой частоты разделения, и упомянутого сигнала понижающего микширования, содержащего спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения, а второй сигнал содержит кодируемый по форме разностный сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения;
приема параметров восстановления высоких частот;
расширения упомянутого сигнала понижающего микширования до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот с использованием параметров восстановления высоких частот,
приема параметров повышающего микширования,
микширования первого и второго сигналов для генерирования левого и правого каналов стереосигнала, причем для частот ниже первой частоты разделения микширование содержит выполнение обратного суммарно-разностного преобразования первого и второго сигналов, а для частот выше первой частоты разделения микширование содержит выполнение параметрического повышающего микширования упомянутого сигнала понижающего микширования с использованием параметров повышающего микширования.
2. Способ декодирования по п. 1, в котором этап расширения упомянутого сигнала понижающего микширования до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот содержит выполнение репликации полосы спектра, SBR.
3. Способ декодирования по п. 1, в котором этап расширения упомянутого сигнала понижающего микширования до диапазона частот выше второй частоты разделения осуществляется после этапа преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму.
4. Способ декодирования по п. 1, в котором этап параметрического повышающего микширования упомянутого сигнала понижающего микширования содержит:
генерирование декоррелированной версии упомянутого сигнала понижающего микширования; и
подвергание упомянутого сигнала понижающего микширования и декоррелированной версии упомянутого сигнала понижающего микширования матричной операции.
5. Способ декодирования по п. 1, в котором весовой параметр a является вещественным.
6. Способ декодирования по п. 1, в котором принимаемые первый и второй кодируемые по форме сигналы кодируются по форме в суммарно-разностной форме, причем первый и второй сигналы кодируются с использованием перекрывающихся оконных преобразований с организацией независимых окон соответственно для первого и второго сигналов.
7. Считываемый компьютером носитель с инструкциями для осуществления способа по любому из предшествующих пунктов.
8. Декодер для декодирования двух аудиосигналов, содержащий:
каскад приема, выполненный с возможностью приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух аудиосигналов, причем первый сигнал содержит первый кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, и сигнал понижающего микширования, содержащий кодируемые по форме спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения, причем второй сигнал содержит второй кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, причем принимаемые первый и второй кодируемые по форме сигналы кодируются по форме в лево-правой форме, в которой первый и второй кодируемые по форме сигналы кодируются без выполнения над ними какого-либо преобразования, суммарно-разностной форме, в которой сумма первого и второго кодируемых по форме сигналов кодируется как один суммарный сигнал и разность между первым и вторым кодируемыми по форме сигналами кодируется как один разностный сигнал, и/или понижающе-дополняющей форме, в которой первый и второй кодируемые по форме сигналы подвергаются матричной операции в зависимости от весового параметра a, который является адаптивным к сигналу и который принимается в дополнение к принимаемым первому и второму сигналам, причем суммарно-разностная форма соответствует конкретному значению весового параметра;
каскад микширования на выходе каскада приема, выполненный с возможностью проверки, находятся ли первый и второй кодируемые по форме сигналы в суммарно-разностной форме для всех частот до первой частоты разделения, и если нет, преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму таким образом, что первый сигнал является комбинацией кодируемого по форме суммарного сигнала, содержащего спектральные данные, соответствующие частотам до первой частоты разделения, и упомянутого сигнала понижающего микширования, содержащего спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения, а второй сигнал содержит кодируемый по форме разностный сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения;
каскад восстановления высоких частот на выходе каскада микширования, выполненный с возможностью приема параметров восстановления высоких частот и расширения упомянутого сигнала понижающего микширования до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот с использованием параметров восстановления высоких частот, и
каскад микширования на выходе каскада восстановления высоких частот, выполненный с возможностью приема параметров повышающего микширования и микширования первого и второго сигналов для того, чтобы генерировать левый и правый каналы стереосигнала, причем для частот ниже первой частоты разделения каскад микширования выполнен с возможностью выполнения обратного суммарно-разностного преобразования первого и второго сигналов, а для частот выше первой частоты разделения каскад микширования выполнен с возможностью выполнения параметрического повышающего микширования упомянутого сигнала понижающего микширования с использованием параметров повышающего микширования.
9. Способ кодирования для кодирования двух аудиосигналов, содержащий этапы:
приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух аудиосигналов, подлежащих кодированию;
преобразования первого и второго сигналов в первый преобразованный сигнал, являющийся суммарным сигналом, и второй преобразованный сигнал, являющийся разностным сигналом, путем выполнения суммарно-разностного преобразования;
кодирования первого и второго преобразованных сигналов соответственно в первый и второй кодированные сигналы, причем для частот между первой частотой разделения и второй частотой разделения кодирование содержит кодирование по форме первого преобразованного сигнала, при этом для частот до первой частоты разделения упомянутое кодирование содержит:
для, по меньшей мере, поднабора частот ниже первой частоты разделения изменение первого и второго преобразованных сигналов путем выполнения обратного суммарно-разностного преобразования и/или для, по меньшей мере, поднабора частот ниже первой частоты разделения изменение первого и второго преобразованных сигналов путем преобразования первого и второго преобразованных сигналов в понижающе-дополняющую форму, в которой первый и второй преобразованные сигналы подвергаются матричной операции в зависимости от весового параметра а, причем конкретное значение весового параметра соответствует сохранению первого и второго преобразованных сигналов в виде суммарного сигнала и разностного сигнала; и
кодирование по форме измененных первого и второго преобразованных сигналов, и
причем для частот выше второй частоты разделения кодирование содержит установку первого кодированного сигнала в нуль;
генерирования, на основе первого преобразованного сигнала, параметров восстановления высоких частот, обеспечивающих восстановление высоких частот первого преобразованного сигнала для частот выше второй частоты разделения;
извлечения, на основе первого и второго сигналов, параметрических стереопараметров, обеспечивающих восстановление спектральных данных первого и второго сигналов, из первого преобразованного сигнала для частот выше первой частоты разделения;
генерирования битового потока, содержащего первый и второй кодированные сигналы, параметрические стереопараметры, параметры восстановления высоких частот и при необходимости весовой параметр а.
10. Способ кодирования по п.9, в котором этап преобразования первого и второго сигналов осуществляется во временной области.
11. Способ кодирования по любому из пп.9-10, в котором этап извлечения параметрических стереопараметров выполняется путем сначала выполнения этапа преобразования первого и второго сигналов в первый преобразованный сигнал и второй преобразованный сигнал, а затем извлечения параметрических стереопараметров на основе первого и второго преобразованных сигналов.
12. Считываемый компьютером носитель с инструкциями для осуществления способа по любому из пп.9-11.
13. Кодер для кодирования двух аудиосигналов, содержащий:
каскад приема, выполненный с возможностью приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух аудиосигналов, подлежащих кодированию;
каскад преобразования, выполненный с возможностью приема первого и второго сигналов с каскада приема и преобразования их в первый преобразованный сигнал, являющийся суммарным сигналом, и второй преобразованный сигнал, являющийся разностным сигналом, путем выполнения суммарно-разностного преобразования;
каскад кодирования, выполненный с возможностью приема первого и второго преобразованных сигналов с каскада преобразования и кодирования их в соответственно первый и второй кодированные сигналы, причем для частот между первой частотой разделения и второй частотой разделения каскад кодирования выполнен с возможностью кодирования по форме первого преобразованного сигнала, причем для частот до первой частоты разделения каскад кодирования выполнен с возможностью:
для, по меньшей мере, поднабора частот ниже первой частоты разделения изменения первого и второго преобразованных сигналов путем выполнения обратного суммарно-разностного преобразования и/или для, по меньшей мере, поднабора частот ниже первой частоты разделения изменения первого и второго преобразованных сигналов путем преобразования первого и второго преобразованных сигналов в понижающе-дополняющую форму, в которой первый и второй преобразованные сигналы подвергаются матричной операции в зависимости от весового параметра а, причем конкретное значение весового параметра соответствует сохранению первого и второго преобразованных сигналов в виде суммарного сигнала и разностного сигнала; и
кодирования по форме измененных первого и второго преобразованных сигналов, и
причем для частот выше второй частоты разделения каскад кодирования выполнен с возможностью установки первого кодированного сигнала в нуль;
каскад кодирования с восстановлением высоких частот, HFR, выполненный с возможностью генерирования, на основе первого преобразованного сигнала, параметров восстановления высоких частот, обеспечивающих восстановление высоких частот первого преобразованного сигнала для частот выше второй частоты разделения;
каскад параметрического стереокодирования, выполненный с возможностью извлечения, на основе первого и второго сигналов, параметрических стереопараметров, обеспечивающих восстановление спектральных данных первого и второго сигналов, из первого преобразованного сигнала для частот выше первой частоты разделения;
каскад генерирования битового потока, выполненный с возможностью приема первого и второго кодированных сигналов и при необходимости весового параметра а с каскада кодирования, параметрических стереопараметров с каскада параметрического стереокодирования и параметров восстановления высоких частот с каскада кодирования с HFR и генерирования битового потока, содержащего первый и второй кодируемые по форме сигналы, параметрические стереопараметры, параметры восстановления высоких частот и при необходимости весовой параметр а.
RU2015147181A 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов RU2645271C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361808684P 2013-04-05 2013-04-05
US61/808,684 2013-04-05
PCT/EP2014/056854 WO2014161993A1 (en) 2013-04-05 2014-04-04 Stereo audio encoder and decoder

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2017145579A Division RU2665214C1 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов

Publications (2)

Publication Number Publication Date
RU2015147181A RU2015147181A (ru) 2017-05-16
RU2645271C2 true RU2645271C2 (ru) 2018-02-19

Family

ID=50473291

Family Applications (3)

Application Number Title Priority Date Filing Date
RU2015147181A RU2645271C2 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов
RU2017145579A RU2665214C1 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов
RU2018127639A RU2690885C1 (ru) 2013-04-05 2018-07-27 Стереофонический кодер и декодер аудиосигналов

Family Applications After (2)

Application Number Title Priority Date Filing Date
RU2017145579A RU2665214C1 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов
RU2018127639A RU2690885C1 (ru) 2013-04-05 2018-07-27 Стереофонический кодер и декодер аудиосигналов

Country Status (9)

Country Link
US (5) US9570083B2 (ru)
EP (3) EP3528249A1 (ru)
JP (1) JP6019266B2 (ru)
KR (4) KR20150126651A (ru)
CN (6) CN116741188A (ru)
BR (4) BR122021009025B1 (ru)
HK (1) HK1214882A1 (ru)
RU (3) RU2645271C2 (ru)
WO (1) WO2014161993A1 (ru)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
CA3211308A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Coding of audio scenes
RU2630754C2 (ru) 2013-05-24 2017-09-12 Долби Интернешнл Аб Эффективное кодирование звуковых сцен, содержащих звуковые объекты
EP3005353B1 (en) 2013-05-24 2017-08-16 Dolby International AB Efficient coding of audio scenes comprising audio objects
EP2973551B1 (en) 2013-05-24 2017-05-03 Dolby International AB Reconstruction of audio scenes from a downmix
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
CN105556597B (zh) 2013-09-12 2019-10-29 杜比国际公司 多声道音频内容的编码和解码
WO2015036350A1 (en) * 2013-09-12 2015-03-19 Dolby International Ab Audio decoding system and audio encoding system
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
WO2016066743A1 (en) * 2014-10-31 2016-05-06 Dolby International Ab Parametric encoding and decoding of multichannel audio signals
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
TWI702594B (zh) 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN112951252B (zh) * 2021-05-13 2021-08-03 北京百瑞互联技术有限公司 一种lc3音频码流的混音方法、装置、介质及设备
WO2024147370A1 (ko) * 2023-01-02 2024-07-11 엘지전자 주식회사 디스플레이 장치 및 그의 오디오 신호 처리 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009115211A2 (en) * 2008-03-20 2009-09-24 Fraunhofer-Gesellchaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthensizing a parameterized representation of an audio signal
US20100094631A1 (en) * 2007-04-26 2010-04-15 Jonas Engdegard Apparatus and method for synthesizing an output signal
WO2011039195A1 (en) * 2009-09-29 2011-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
WO2011124621A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding
US20120002818A1 (en) * 2009-03-17 2012-01-05 Dolby International Ab Advanced Stereo Coding Based on a Combination of Adaptively Selectable Left/Right or Mid/Side Stereo Coding and of Parametric Stereo Coding
US8255231B2 (en) * 2004-11-02 2012-08-28 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
RU2011108927A (ru) * 2006-01-20 2012-09-20 Майкрософт Корпорейшн (Us) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2280736T3 (es) 2002-04-22 2007-09-16 Koninklijke Philips Electronics N.V. Sintetizacion de señal.
DE60326782D1 (de) 2002-04-22 2009-04-30 Koninkl Philips Electronics Nv Dekodiervorrichtung mit Dekorreliereinheit
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
DE60327039D1 (de) * 2002-07-19 2009-05-20 Nec Corp Audiodekodierungseinrichtung, dekodierungsverfahren und programm
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
DE602005022235D1 (de) 2004-05-19 2010-08-19 Panasonic Corp Audiosignalkodierer und Audiosignaldekodierer
WO2006000842A1 (en) 2004-05-28 2006-01-05 Nokia Corporation Multichannel audio extension
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
BRPI0517949B1 (pt) 2004-11-04 2019-09-03 Koninklijke Philips Nv dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador
CN101116136B (zh) 2005-02-10 2011-05-18 皇家飞利浦电子股份有限公司 声音合成的装置和方法
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2007110103A1 (en) * 2006-03-24 2007-10-04 Dolby Sweden Ab Generation of spatial downmixes from parametric representations of multi channel signals
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
JPWO2008132850A1 (ja) 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
DK2571024T3 (en) * 2007-08-27 2015-01-05 Ericsson Telefon Ab L M Adaptive transition frequency between the noise filling and bandwidth extension
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
ES2796552T3 (es) * 2008-07-11 2020-11-27 Fraunhofer Ges Forschung Sintetizador de señales de audio y codificador de señales de audio
CN102667920B (zh) 2009-12-16 2014-03-12 杜比国际公司 Sbr比特流参数缩混

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8255231B2 (en) * 2004-11-02 2012-08-28 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
RU2011108927A (ru) * 2006-01-20 2012-09-20 Майкрософт Корпорейшн (Us) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
US20100094631A1 (en) * 2007-04-26 2010-04-15 Jonas Engdegard Apparatus and method for synthesizing an output signal
WO2009115211A2 (en) * 2008-03-20 2009-09-24 Fraunhofer-Gesellchaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthensizing a parameterized representation of an audio signal
US20120002818A1 (en) * 2009-03-17 2012-01-05 Dolby International Ab Advanced Stereo Coding Based on a Combination of Adaptively Selectable Left/Right or Mid/Side Stereo Coding and of Parametric Stereo Coding
WO2011039195A1 (en) * 2009-09-29 2011-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
WO2011124621A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding

Also Published As

Publication number Publication date
BR122017006701B1 (pt) 2022-03-03
RU2665214C1 (ru) 2018-08-28
CN105103225A (zh) 2015-11-25
CN110047496B (zh) 2023-08-04
US11631417B2 (en) 2023-04-18
JP6019266B2 (ja) 2016-11-02
US10600429B2 (en) 2020-03-24
US10163449B2 (en) 2018-12-25
KR20160111042A (ko) 2016-09-23
CN116741186A (zh) 2023-09-12
CN110047496A (zh) 2019-07-23
BR122017006701A2 (pt) 2019-09-03
RU2015147181A (ru) 2017-05-16
US12080307B2 (en) 2024-09-03
KR20150126651A (ko) 2015-11-12
CN110010140B (zh) 2023-04-18
EP2981960B1 (en) 2019-03-13
EP2981960A1 (en) 2016-02-10
US20190088266A1 (en) 2019-03-21
KR20230020553A (ko) 2023-02-10
EP3528249A1 (en) 2019-08-21
CN116741188A (zh) 2023-09-12
WO2014161993A1 (en) 2014-10-09
BR112015025080B1 (pt) 2021-12-21
CN110010140A (zh) 2019-07-12
HK1214882A1 (zh) 2016-08-05
CN116741187A (zh) 2023-09-12
US20170133025A1 (en) 2017-05-11
EP4300488A3 (en) 2024-02-28
US20160027446A1 (en) 2016-01-28
RU2019116192A (ru) 2020-11-27
US20230245667A1 (en) 2023-08-03
BR112015025080A2 (pt) 2017-07-18
BR122021009025B1 (pt) 2022-08-30
RU2690885C1 (ru) 2019-06-06
EP4300488A2 (en) 2024-01-03
BR122021009022B1 (pt) 2022-08-16
CN105103225B (zh) 2019-06-21
US9570083B2 (en) 2017-02-14
KR20190134821A (ko) 2019-12-04
JP2016519786A (ja) 2016-07-07
US20200286497A1 (en) 2020-09-10

Similar Documents

Publication Publication Date Title
RU2645271C2 (ru) Стереофонический кодер и декодер аудиосигналов
EP1921606B1 (en) Energy shaping device and energy shaping method
US9514759B2 (en) Method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
US20080208600A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
US20080201152A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
CN101410889A (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
BR122018077099B1 (pt) método para decodificação de sinal de áudio e decodificador de sinal de áudio
WO2008035949A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
CN110648674B (zh) 多声道音频内容的编码
JP2021507316A (ja) オーディオ信号の高周波再構成技術の後方互換性のある統合
KR20240050483A (ko) 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
RU2641463C2 (ru) Структура декоррелятора для параметрического восстановления звуковых сигналов
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов