RU2392671C2 - Способы и устройства для кодирования и декодирования стереосигнала - Google Patents

Способы и устройства для кодирования и декодирования стереосигнала Download PDF

Info

Publication number
RU2392671C2
RU2392671C2 RU2006139036/09A RU2006139036A RU2392671C2 RU 2392671 C2 RU2392671 C2 RU 2392671C2 RU 2006139036/09 A RU2006139036/09 A RU 2006139036/09A RU 2006139036 A RU2006139036 A RU 2006139036A RU 2392671 C2 RU2392671 C2 RU 2392671C2
Authority
RU
Russia
Prior art keywords
signals
parameters
signal
generate
residual signal
Prior art date
Application number
RU2006139036/09A
Other languages
English (en)
Other versions
RU2006139036A (ru
Inventor
Эрик Г.П. СХЕЙЕРС (NL)
Эрик Г.П. СХЕЙЕРС
Дирк Й. БРЕБАРТ (NL)
Дирк Й. БРЕБАРТ
Франсуа П. МИБУРГ (NL)
Франсуа П. МИБУРГ
ДЕ КЕРКХОФ Леон М. ВАН (NL)
ДЕ КЕРКХОФ Леон М. ВАН
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2006139036A publication Critical patent/RU2006139036A/ru
Application granted granted Critical
Publication of RU2392671C2 publication Critical patent/RU2392671C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

Изобретение относится к способам кодирования данных, например к способу кодирования аудиоданных и/или видеоданных, используя переменные углы поворота для компонентов данных. Раскрыт способ кодирования входных сигналов (1, r) для генерации кодированных данных (100), содержит обработку входных сигналов (1, r) для определения первых параметров (φ1, φ2), описывающих относительную разность фаз и временную разность между сигналами (1, r), и применение этих первых параметров (φ1, φ2) для обработки входных сигналов для генерации промежуточных сигналов. Способ включает в себя обработку промежуточных сигналов для определения вторых параметров (α; IID, ρ), описывающих угловой поворот первых промежуточных сигналов для генерации основного сигнала (m) и остаточного сигнала (s), причем основной сигнал (m) имеет амплитуду или энергию большую, чем остаточный сигнал (s), причем вторые параметры выполнены с возможностью применения для обработки промежуточных сигналов для генерации основного (m) и остаточного (s) сигналов. Способ также содержит квантование первых параметров, вторых параметров и основного и остаточного сигналов (m, s) для генерации соответствующих квантованных данных для последующего мультиплексирования с целью генерации кодированных данных (100). Технический результат - обеспечение эффективного кодирования данных. 8 н. и 15 з.п. ф-лы, 9 ил.

Description

Настоящее изобретение относится к способам кодирования данных, например, к способу кодирования аудио и/или видеоданных, используя переменные углы поворота для компонентов данных. Более того, настоящее изобретение также относится к кодерам, использующим такие способы, и к декодерам, выполненным с возможностью декодирования данных, сгенерированных этими кодерами. Кроме того, настоящее изобретение относится к кодированным данным, передаваемым посредством носителей данных и/или сетей передачи данных, причем кодированные данные генерируются, согласно упомянутым способам.
Многочисленные, известные в настоящее время способы, отличаются тем, что кодируют аудио и/или видеоданные для генерации соответствующих выходных кодированных данных. Примером такого известного способа кодирования аудио является MPEG-1 Layer III, известный как MP3, и описанный в ISO/IEC JTC1/SC29/WG11 MPEG, IS 11172-3, Information Technology - Coding of Movie Pictures and Associated Audio for Digital Storage Media at up to about 1.5 Mbit/s, Part 3: Audio, MPEG-1, 1992. Некоторые из современных способов приспособлены для повышения эффективности кодирования, то есть обеспечения сжатия информации, используя (M/S) стереокодирование или кодирование суммарного/разностного сигнала, как описано J.D. Jonston и A.J. Ferreira, “Sum-difference stereo transform coding” in Proc. IEEE, Int. Conf. Acoust., Speech and Signal Proc., San Francisco, CA, March 1992, pp. II: pp. 569-572.
В M/S кодировании, сигнал состоит из левого и правого сигналов l[n], r[n], которые соответственно являются кодированными в виде суммарного сигнала m[n] и разностного сигнала s[n], например, путем применения обработки, описанной Уравнениями 1 и 2 (Eq. 1 and 2):
m[n]=r[n]+l[n] Eq.1
s[n]=r[n]-l[n] Eq.2
Если сигналы l[n] и r[n] являются практически одинаковыми, M/S кодирование способно обеспечить значительное сжатие данных, в связи с тем, что разностный сигнал s[n] стремится к нулю и, таким образом, передает относительно небольшой объем информации, в то время как суммарный сигнал эффективно включает в себя большую часть объема информации сигнала. В такой ситуации, скорость битовой передачи данных, необходимая для представления суммарных и разностных сигналов, близка к половине скорости, необходимой для независимого кодирования сигналов l[n] и r[n].
Уравнения 1 и 2 можно представить с помощью матрицы поворота, в виде Уравнения 3 (Eq.3):
Figure 00000001
Eq.3
где c представляет собой масштабный постоянный коэффициент, часто используемый для предотвращения ограничения.
Хотя Уравнение 3 эффективно относится к повороту сигналов l[n], r[n] на угол 45°, возможны другие углы поворота, как показано в Уравнении 4 (Eq. 4), где α представляет собой угол поворота, применяемый к сигналам l[n], r[n] для генерации соответствующих кодированных сигналов m'[n], s'[n], описанных далее в настоящем описании, в качестве основного и остаточного сигналов соответственно:
Figure 00000002
Eq.4
Угол α используется как переменный для обеспечения улучшенного сжатия для обширной категории сигналов l[n], r[n] путем уменьшения объема информации, представленного в остаточном сигнале s'[n], и следовательно, до предела увеличивая мощность основного сигнала m'[n].
Методы кодирования, представленные Уравнениями 1-4, обычно применяются не для широкополосных сигналов, а для подсигналов, каждый из которых представляет лишь малую часть всей полосы пропускания, используемой при передачи аудиосигналов. Более того, методы, основанные на Уравнениях 1-4, также обычно применяются для частотного представления сигналов l[n], r[n].
В опубликованном патенте США № US 5621855 описан способ подполосного кодирования цифрового сигнала, имеющего первый и второй компонент сигнала, цифровой сигнал закодирован с помощью подполосного кодирования для получения первого подполосного сигнала, содержащего первую q-выборку блока сигнала в ответ на первый компонент сигнала, и второго подполосного сигнала, содержащего вторую q-выборку блока сигнала в ответ на второй компонент сигнала, причем первый и второй подполосные сигналы находятся в одной и той же подполосе, а первый и второй блоки сигнала эквивалентны по времени.
Первый и второй блоки сигнала обрабатываются для получения минимального значения расстояния между точечными представлениями выборок, эквивалентных по времени. Когда минимальное значение расстояния меньше или равно пороговому значению расстояния, образуется составленный из q-выборок композитный блок путем добавления соответствующих пар выборок, эквивалентных по времени в первый и во второй блоки сигналов, после умножения каждой из выборок первого блока на cos(α), а каждой из выборок второго блока сигнала на -sin(α).
Хотя применение вышеупомянутого угла поворота α приводит к устранению многих недостатков M/S кодирования, при котором применяется только поворот на угол 45°, такие подходы становятся проблематичными для применения к группам сигналов, например к паре стереосигналов, если в этих сигналах появляются значительные относительные разности фаз или временные сдвиги. Настоящее изобретение направлено на решение этой проблемы.
Цель настоящего изобретения заключается в предоставлении способа кодирования данных.
Согласно первому аспекту настоящего изобретения, предоставляется способ кодирования множества входных сигналов (l, r) для генерации соответствующих закодированных данных, причем способ включает в себя следующие этапы:
(a) обработки входных сигналов (l, r) для определения первых параметров (φ2), описывающих, по меньшей мере, относительную разность фаз или временную разность между сигналами (l, r), и применение указанных первых параметров (φ2) для обработки входных сигналов для генерации соответствующих промежуточных сигналов;
(b) обработки промежуточных сигналов и/или входных сигналов (l,r) для определения вторых параметров, описывающих поворот промежуточных сигналов, требуемый для генерации основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m), имеет амплитуду или энергию большую, чем у разностного сигнала (s), и применение этих вторых параметров для обработки промежуточных сигналов для генерации основного (m) и остаточного (s) сигналов;
(с) квантования первых параметров, вторых параметров и кодирования, по меньшей мере, части основного сигнала (m) и остаточного сигнала (s) для генерации соответствующих квантованных данных; и
(d) мультиплексирования квантованных данных для генерации кодированных данных.
Настоящее изобретение имеет преимущество в том, что оно обеспечивает более эффективное кодирование данных.
Предпочтительно, в способе только часть остаточного сигнала (s) включена в кодированные данные. Такое неполное включение остаточного сигнала (s) позволяет улучшить сжатие данных, достигаемое при кодировании данных.
Более предпочтительно, в способе кодированные данные также содержат один или более параметров, указывающих на части остаточного сигнала, включенные в кодированные данные. Такие указывающие параметры позволяют выполнять последующее декодирование кодированных данных в более простом варианте.
Предпочтительно, этапы (a) и (b) настоящего способа осуществляются с помощью комплексного поворота входных сигналов (l[n], r[n]), представленных в частотном домене (l[k], r[k]). Реализация комплексного поворота позволяет более эффективно учитывать относительные временные и/или фазовые разности, возникающие между множеством входных сигналов. Более предпочтительно, если этапы (a) и (b) выполняются в частотном домене или подполосном домене. “Подполосный” следует толковать как частотный регион, меньший, чем полная полоса пропускания, необходимая для сигнала.
Предпочтительно, способ применяется в поддиапазонах полного диапазона частот, соответствующего входным сигналам (l, r). Более предпочтительно, если другие поддиапазоны полного диапазона частот будут кодированы с использованием альтернативных методов кодирования, например, общепринятого M/S кодирования, как описано выше.
Предпочтительно, после этапа (c) кодирования без потерь квантованных данных способ включает в себя дополнительный этап генерации кодированных данных с целью предоставления данных для мультиплексирования на этапе (d). Более предпочтительно, чтобы кодирование без потерь применялось с использованием кодирования по алгоритму Хаффмана. Использование кодирования без потерь потенциально дает возможность добиваться более высокого качества аудиосигнала.
Предпочтительно, способ включает в себя этап манипулирования остаточным сигналом (s), путем избавления от перцептуально нерелевантной частотно-временной информации, представленной в остаточном сигнале (s), причем указанный остаточный сигнал (s), над которым совершаются манипуляции, дает вклад в кодированные данные (100), и указанная перцептуально нерелевантная информация соответствует выбранным частям спектровременного представления входных сигналов. Устранение перцептуально нерелевантной информации позволяет способу обеспечить более высокий уровень сжатия данных в кодированных данных.
Предпочтительно, на этапе (b) способа, вторые параметры (α; IID, ρ) получают с помощью минимизации амплитуды или энергии остаточного сигнала (s). Такой подход обеспечивает большую вычислительную эффективность при генерации вторых параметров, по сравнению с альтернативными подходами получения параметров.
Предпочтительно, в способе вторые параметры (α; IID, ρ) представляют через параметры разности межканальной интенсивности и параметры когерентности (IID, ρ). Такая реализация способа обеспечивает совместимость с существующим вариантом параметрического стереокодирования и с соответствующим декодирующим аппаратным обеспечением или программным обеспечением.
Предпочтительно, на этапах (c) и (d) настоящего способа, кодированные данные размещены по “слоям” по своей значимости, причем указанные слои включают в себя базовый слой, передающий основной сигнал (m), первый слой расширения, включающий в себя первые и/или вторые параметры, согласно параметрам передачи стереосигнала, второй слой расширения, передающий представление остаточного сигнала (s). Более предпочтительно, второй слой расширения дополнительно подразделяется на первый подслой для передачи наиболее релевантной частотно-временной информации остаточного сигнала (s) и второй подслой для передачи менее релевантной частотно-временной информации остаточного сигнала (s). Представление входных сигналов с помощью этих слоев и подслоев позволяет, по мере необходимости, повысить устойчивость к ошибкам при передаче кодированных данных и осуществлять их обратно совместимое воспроизведение на простом декодирующем аппаратном обеспечении.
Согласно второму аспекту настоящего изобретения, предоставляется кодер для кодирования множества входных сигналов (l, r) для генерации соответствующих кодированных данных, причем кодер содержит:
(a) первое средство обработки для обработки входных сигналов (l, r) для определения первых параметров (φ2), описывающих, по меньшей мере, относительную разность фаз или временную разность, между сигналами (l, r), причем первое средство обработки используется для применения первых параметров (φ2), с целью обработки входных сигналов для генерации соответствующих промежуточных сигналов;
(b) второе средство обработки для обработки промежуточных сигналов для определения вторых параметров, описывающих поворот промежуточного сигнала, необходимый для генерации основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m), имеет амплитуду или энергию большую, чем остаточный сигнал (s), и второе средство обработки используется для применения вторых параметров с целью обработки промежуточных сигналов для генерации, по меньшей мере, основного (m) и остаточного (s) сигналов;
(с) средство квантования для квантования первых параметров (φ2), вторых параметров (α; IID, ρ) и, по меньшей мере, части основного сигнала (m) и остаточного сигнала (s) для генерации соответствующих квантованных данных; и
(d) средство мультиплексирования для мультиплексирования квантованных данных с целью генерации кодированных данных.
Преимущество настоящего кодера заключается в том, что он способен обеспечить более эффективное кодирование данных.
Предпочтительно, кодер содержит средства обработки для манипулирования остаточным сигналом (s) путем избавления от перцептуально нерелевантной частотно-временной информации, представленной в остаточном сигнале (s), указанный измененный остаточный сигнал (s) является частью кодированных данных (100) и указанная перцептуально нерелевантная частотно-временная информация соответствует выбранным частям спектровременного представления входных сигналов. Избавление от перцептуально нерелевантной информации позволяет кодеру обеспечить больший уровень сжатия кодированных данных.
Согласно третьему аспекту настоящего изобретения, предоставляется способ декодирования кодированных данных для преобразования соответствующих представлений множества входных сигналов (l', r'), причем указанные входные сигналы (l, r) заранее кодированы для генерации указанных кодированных данных, способ содержит следующие этапы:
(a) демультиплексирование кодированных данных для генерации соответствующих квантованных данных;
(b) обработка квантованных данных для генерации соответствующих первых параметров (φ2), вторых параметров и, по меньшей мере, основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m) имеет большую амплитуду или энергию, чем остаточный сигнал (s);
(c) поворот основного сигнала (m) и остаточного сигнала (s), используя вторые параметры для генерации соответствующих промежуточных сигналов; и
(d) обработка промежуточных сигналов, применяя первые параметры (φ2) для генерации указанных представлений указанных входных сигналов (l', r'), причем первые параметры (φ2) описывают, по меньшей мере, относительную разность фаз или временную разность между сигналами (l, r).
Способ выгоден тем, что позволяет эффективно декодировать данные, которые были эффективно кодированы с использованием способа по первому аспекту настоящего изобретения.
Предпочтительно, этап (b) включает в себя дополнительный этап, предназначенный для добавления пропущенной частотно-временной информации остаточного сигнала (s) с помощью искусственного остаточного сигнала, полученного из основного сигнала (m). Генерация искусственного сигнала обеспечивает эффективное декодирование кодированных данных.
Предпочтительно, в способе кодированные данные включают в себя параметры, указывающие, какие части разностного сигнала (s) кодированы в кодированные данные. Введение таких указывающих параметров позволяет выполнять эффективное декодирование с меньшими в вычислительном отношении требованиями.
Согласно четвертому аспекту настоящего изобретения, предоставляется декодер для декодирования кодированных данных с целью преобразования соответствующих представлений множества входных сигналов (l', r'), причем указанные сигналы (l, r) были кодированы с целью генерации кодированных данных, при этом декодер содержит:
(a) средства демультиплексирования для демультиплексирования кодированных данных для генерации соответствующих квантованных данных;
(b) первое средство обработки для обработки квантованных данных для генерации соответствующих первых параметров (φ2), вторых параметров и, по меньшей мере, основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m) имеет амплитуду или энергию большую, чем остаточный сигнал (s);
(с) второе средство обработки для поворота основного (m) и остаточного (s) сигналов, применяя вторые параметры для генерации соответствующих промежуточных сигналов; и
(d) третье средство обработки для обработки промежуточных сигналов, применяя первые параметры (φ2) для преобразования указанных представлений входных сигналов (l, r), причем первые параметры (φ2) описывают, по меньшей мере относительную разность фаз или временную разность между сигналами (l, r).
Предпочтительно, второе средство обработки выполнено с возможностью генерации дополнительного искусственного сигнала, полученного из декодированного основного сигнала (m) для добавления информации, пропущенной в декодированном остаточном сигнале.
Согласно пятому аспекту настоящего изобретения, предоставляются кодированные данные, генерированные, согласно способу по первому аспекту настоящего изобретения, причем данные, по меньшей мере, либо записаны на носитель данных, либо передаются через сеть передачи данных.
Согласно шестому аспекту настоящего изобретения, предоставляется программный продукт для выполнения способа по пятому аспекту настоящего изобретения на вычислительных аппаратных средствах.
Согласно седьмому аспекту настоящего изобретения, предоставляется программный продукт для выполнения способа по третьему аспекту настоящего изобретения на вычислительных аппаратных средствах.
Согласно восьмому аспекту настоящего изобретения, предоставляются кодированные данные которые, по меньшей мере, либо записаны на носитель данных, либо передаются через сеть передачи данных, причем указанные данные содержат результат мультиплексирования квантованных первых параметров, квантованных вторых параметров, и квантованных данных, соответствующих, по меньшей мере, части основного сигнала (m) и остаточному сигналу (s), причем основной сигнал (m) имеет амплитуду или энергию большую, чем у остаточного сигнала (s), указанный основной сигнал (m) и указанный остаточный сигнал (s) получаются с помощью поворота промежуточных сигналов, определяемого вторыми параметрами, причем указанные промежуточные сигналы генерируются путем обработки множества входных сигналов для компенсации относительных фазовых и/или временных задержек между сигналами, описанных первыми параметрами.
Очевидно, что особенности настоящего изобретения допускают комбинирование в любых сочетаниях без отклонения от сути настоящего изобретения, которая определяется прилагаемой формулой изобретения.
Ниже в виде примеров описаны варианты осуществления настоящего изобретения, со ссылками на следующие чертежи:
Фиг.1 представляет собой иллюстрацию последовательности выборок для сигналов l[n], r[n], имеющих относительные временные и фазовые задержки;
Фиг.2 представляет собой иллюстрацию приложения условного M/S преобразования, определяемого Уравнениями 1 и 2 и применяемого к сигналам по Фиг.1 для генерации соответствующих суммарного и разностного сигналов m[n],s[n];
Фиг.3 представляет собой иллюстрацию приложения преобразования поворота, определяемого Уравнением 4 и применяемого к сигналам по Фиг.1 для генерации соответствующих основного m[n] и остаточного s[n] сигналов;
Фиг.4 представляет собой иллюстрацию приложения комплексного преобразования поворота, согласно настоящему изобретению и определяемого Уравнениями 5-15, для генерации соответствующих основного m[n] и остаточного s[n] сигналов, причем разностный сигнал имеет относительно небольшую амплитуду несмотря на сигналы по Фиг.1, имеющие относительную фазовую и временную задержку;
Фиг.5 представляет собой принципиальную схему кодера согласно настоящему изобретению;
Фиг.6 представляет собой принципиальную схему декодера согласно настоящему изобретению, причем декодер совместим с кодером по Фиг.5
Фиг.7 представляет собой принципиальную схему параметрического стереодекодера;
Фиг.8 представляет собой принципиальную схему улучшенного параметрического стереокодера согласно настоящему изобретению; и
Фиг.9 представляет собой принципиальную схему улучшенного параметрического стереодекодера, согласно настоящему изобретению, причем декодер совместим с кодером по Фиг.8.
В общем, настоящее изобретение относится к способу кодирования данных, которые представлены с помощью M/S способов кодирования, описанных в описанном выше применении различных углов поворота. Способ был разработан для лучшего кодирования данных, относящихся к группам сигналов, подвергаемых значительному сдвигу фаз и/или во времени. Более того, способ имеет преимущества по сравнению с традиционными методами кодирования, применяя значения для угла поворота α, что может быть использовано, когда сигналы l[n], r[n] представляются с помощью их эквивалентных комплексных частотных представлений l[k], r[k] соответственно.
Угол α может быть представлен как вещественный, и вещественный поворот фазы применяется к взаимно “связанным” l[n], r[n] сигналам для того, чтобы согласовать временную и/или фазовую задержки между этими сигналами. Однако использование комплексных значений для угла поворота α позволяет легче осуществить реализацию настоящего изобретения. Такой альтернативный подход для реализации поворота на угол α не выходит за пределы объема настоящего изобретения.
Частотное представление указанных сигналов временной области l[n], r[n] предпочтительно получается с помощью применения временных оконных процедур, как описано Уравнениями 5 и 6 (Eq. 5 и 6) для предоставления обработанных методом окна сигналов lq[n], rq[n]:
lq[n]=l[n+qH]h[n] Eq.5
rq[n]=r[n+qH]h[n], Eq.6
причем
q = основной индекс, такой что q=0, 1, 2,… для индикации последующих сигналов;
H = размер интервала связи или дополненный размер; и
n = временной индекс, со значением от 0 до L-1, причем параметр L равен длине окна h[n].
Оконные сигналы lq[n], rq[n] могут быть преобразованы в частотный домен, с использованием Дискретного Преобразования Фурье (ДПФ), или функционально эквивалентного преобразования, как описано Уравнениями 7 и 8 (Eq. 7 и 8):
l[k]=
Figure 00000003
lq[n]exp
Figure 00000004
Eq.7
r[k]=
Figure 00000003
rq[n]exp
Figure 00000005
Eq.8
причем параметр N представляет собой длину ДПФ такую, что N≥L. Вследствие того, что ДФТ вещественной последовательности симметрична, после преобразования сохраняются только первые
Figure 00000006
точек. Для сохранения энергии сигнала во время применения ДПФ предпочтительно применяется следующее масштабирование, описанное Уравнениями 9 и 10 (Eq.9 и 10):
l[0]=
Figure 00000007
Eq.9
r[0]=
Figure 00000008
Eq.10
Способ настоящего изобретения, выполняющий действия по обработке сигнала, как показано Уравнением 11 (Eq.11) для преобразования частотного представления сигналов l[k], r[k] из Уравнений 7 и 8 в соответствующие повернутые суммарный и разностный сигналы m''[k], s''[k] в частотном домене:
Figure 00000009
Eq.11
причем
α = вещественный переменный угол поворота;
φ1 = стандартный угол, используемый для максимизации продолжения сигналов за пределы соответствующих границ; и
φ2 = угол, используемый для минимизации энергии остаточного сигнала s''[k] с помощью поворота фазы правого сигнала r[k].
Использование угла φ1 является необязательным. Более того, повороты согласно Уравнению 11 предпочтительно должны быть выполнены покадрово, то есть динамически для последовательных кадров. Однако такие динамические поочередные изменения по кадрам, потенциально, могут вызвать разрыв сигнала в суммарном сигнале m''[k], что может быть, по меньшей мере, частично устранено подходящим подбором угла φ1.
Более того, полоса частот k=0…
Figure 00000010
Уравнения 11 предпочтительно делится на подполосы, точнее диапазоны. Во время кодирования каждому диапазону соответствуют угловые параметры α, φ1 и φ2, которые затем независимо определяются, кодируются и, далее, пересылаются или иначе передаются на декодер для последующего декодирования. С помощью распределения полосы частот на подполосы характеристики сигнала могут быть лучше учтены во время кодирования, что потенциально может привести к более высокому коэффициенту сжатия.
После осуществленных преобразований с помощью Уравнений 7-11 сигналы m''[k], s''[k] подвергаются Дискретному Преобразованию Фурье, как описано в Уравнении 12 и 13 (Eq. 12 и 13):
mq[n]=
Figure 00000003
m[k]exp
Figure 00000011
Eq.12
sq[n]=
Figure 00000003
s[k]exp
Figure 00000012
Eq.13
причем
mq[n] = основное временное представление; и
sq[n] = остаточное (разностное) временное представление.
Основное и остаточное представления затем преобразуются в представления в оконном базисе, к которому применяется перекрывание, как предоставлено операциями по обработке, описанными Уравнениями 14 и 15 (Eq.14 и 15):
m[n+qH]=m[n+qH]+2Re{mq[n]h[n]} Eq. 14
s[n+qH]=s[n+qH]+2Re{sq[n]h[n]} Eq. 15
В качестве альтернативы, операции по обработке способа настоящего изобретения, как описано Уравнениями 5-15, допускают, по крайней мере, частично, что их можно выполнять, применяя блок фильтров с комплексной модуляцией. Для осуществления настоящего изобретения может использоваться цифровая обработка, реализуемая вычислительными аппаратными средствами.
Для иллюстрации способа настоящего изобретения, ниже будет описан пример обработки сигнала согласно настоящему изобретению. Например, в качестве начальных сигналов, предназначенных для обработки с использованием настоящего способа используются два временных сигнала, причем сигналы определяются Уравнениями 16 и 17 (Eq.16 и 17):
l[n]=0,5cos(0,32n+0,4)+0,05z1[n]+0,06z2[n] Eq. 16
r[n]=0,25cos(0,32n+1,8)+0,03z1[n]+0,05z3[n], Eq. 17
причем z1[n], z2[n] и z3[n] являются взаимно независимыми последовательностями белого шума с единичной дисперсией. Чтобы лучше оценить работу способа настоящего изобретения, некоторые части сигналов l[n], r[n], описанные Уравнениями 16 и 17, показаны на Фиг.1.
На Фиг.2 проиллюстрированы сигналы m[n] и s[n], подвергнутые M/S преобразованию, причем преобразованные сигналы извлекаются из сигналов l[n], r[n] Уравнений 16 и 17 с помощью традиционной обработки, согласно Уравнениям 1 и 2. Из Фиг.2 видно, что такой традиционный подход для генерации сигналов m[n] и s[n] из сигналов, описанных Уравнениями 16 и 17, приводит к тому, что энергия остаточного сигнала s[n] становится выше, чем энергия входного сигнала r[n] в Уравнении 17. Очевидно, что традиционная обработка M/S преобразованного сигнала, применяемая к сигналам, описанным Уравнениями 16 и 17, является безрезультатной для сжатия, поскольку сигнал s[n] не имеет пренебрежимо малую амплитуду.
Применяя преобразование поворота, как описано Уравнением 4, возможно, например, уменьшить остаточную энергию сигналов l[n], r[n] в их соответствующем остаточном сигнале s[n] и, соответственно, увеличить их основной сигнал m[n], как проиллюстрировано на Фиг.3. Хотя подход вращения по Уравнению 4 обеспечивает лучший результат, чем традиционная M/S обработка, как представлено на Фиг.2, сигналы l[n], r[n] подвергаются относительным фазовым и/или временным сдвигам.
Если образцовые сигналы l[n], r[n] по Уравнениям 16 и 17 подвергаются трансформации в частотной области, затем подвергаются оптимизирующему комплексному повороту по Уравнениям 5-15, то возможно уменьшение энергии остаточного сигнала s[n] до сравнительно небольшой амплитуды, как проиллюстрировано на Фиг.4.
Далее будут описаны варианты осуществления аппаратного обеспечения для кодера, выполненного с возможностью осуществления обработки сигналов, как описано Уравнениями 5-15.
На Фиг.5 показан кодер, согласно настоящему изобретению, указанный ссылочной позицией 10. Кодер 10 получает левый (l) и правый (r) взаимосвязанные входные сигналы и кодирует эти сигналы для генерации кодированного потока 100 битов (bs). Более того, кодер 10 включает в себя блок 20 поворота фаз, блок 30 поворота сигнала, частотный/временной селектор 40, первый кодер 50, второй кодер 60, блок (Q) обработки квантованных параметров 70 и мультиплексорный блок 80 потока битов.
Входные сигналы l, r объединяются для введения в блок 20 поворота фаз, чьи соответственные выходы связывают с блоком 30 поворота сигнала. Основной и остаточный сигналы блока 30 поворота сигнала обозначены соответственно m, s. Основной сигнал m передается через первый кодер 50 на мультиплексорный блок 80. Более того, остаточный сигнал s подают через частотно-временной селектор 40 на второй кодер 60 и, после этого, на мультиплексорный блок 80. Угловые параметры выходов φ1, φ2 блока 20 поворота фаз подают через блок 70 обработки на мультиплексорный блок 80. Более того, угловой параметр выхода α блока 30 поворота сигнала подают через блок 70 обработки на мультиплексорный блок 80. Мультиплексорный блок 80 содержит вышеупомянутый выходной поток 100 битов (bs).
При работе, блок 20 поворота фаз выполняет обработку сигналов l, r чтобы компенсировать относительные разницы фаз между ними, и, таким образом, генерирует параметры φ1, φ2, причем параметр φ2 представляет указанную относительную разность фаз, параметры φ1, φ2 пропускаются через блок 70 обработки для квантования и, таким образом, включаются в качестве соответствующих параметров данных в кодированный битовый 100 поток. Сигналы l, r с компенсированой относительной разностью фаз подают в блок 30 поворота сигнала, который определяет оптимизированное значение угла α для концентрации максимальной энергии сигнала в основном сигнале m и минимальной энергии сигнала в остаточном сигнале s. Основной и остаточный сигналы m, s затем передаются через кодеры 50, 60 для преобразования в подходящий формат для включения в поток 100 битов. Блок 70 обработки принимает углы сигналов α, φ1, φ2 и мультиплексирует их вместе с выходами кодеров 50, 60 для генерации выходного потока 100 битов (bs). Таким образом, поток 100 битов (bs) содержит поток данных, включающих в себя представления основного и остаточного сигналов m, s вместе с данными угловых параметров α, φ1, φ2, причем параметр φ2 является необходимым, а параметры φ1 являются необязательными, но обеспечивающими дополнительные преимущества.
Кодеры 50, 60 предпочтительно осуществляются в виде двух моноаудиокодеров, или, в качестве альтернативы, как один двойной моноаудиокодер. При желании, некоторые части остаточного сигнала s, например установленные во время представления в частотно-временной плоскости, и не влияющие ощутимо на поток 100 битов, могут быть исключены в частотно-временном селекторе 40, таким образом, обеспечивая масштабируемое сжатие информации, как это будет более детально описано ниже.
Кодер 10 при желании может быть использован для обработки входных сигналов (l, r) поверх части всей полосы частот, соответствующей входным сигналам. Эти части входных сигналов (l, r) не кодируются с помощью кодера 10, а кодируются далее, при параллельном кодировании, используя другие способы, например, используя традиционное M/S кодирование, как описано выше. При необходимости может быть выполнено отдельное кодирование левого (l) и правого (r) входных сигналов.
Кодер 10 доступен для реализации в аппаратном обеспечении, например, в качестве специализированной микросхемы или группы таких микросхем. В качестве альтернативы, кодер 10 может быть реализован в виде программного продукта, выполняемого на вычислительных аппаратных средствах, например, на интегральной микросхеме обработки сигнала со специализированным управляющим программным обеспечением или группе таких микросхем.
На Фиг.6 декодер, совместимый с кодером 10, указан ссылочной позицией 200. Декодер 200 содержит демультиплексор 210 потока битов, первый и второй декодеры 220, 230, блок 240 обработки для деквантованных параметров, блок 250 декодера поворота сигнала и декодирующий блок 260 поворота фаз, предоставляющий декодированные выходные сигналы l', r', соответствующие входным сигналам l, r, подающимся на кодер 10. Демультиплексор 210 принимает поток 100 битов (bs), генерируемых кодером 10, например, передаваемых с кодера 10 на декодер 200 с помощью носителя данных, например, с помощью оптического диска, такого как CD или DVD, и/или через сеть передачи данных, например Интернет. Демультиплексированные выходные сигналы демультиплексора 210 подаются на входы декодеров 220, 230 и на блок 240 обработки. Первый и второй декодеры содержат основной и остаточный декодированные выходы m', s', которые, соответственно, подаются на блок 250 поворота декодера. Более того, блок 240 обработки включает в себя выход угла поворота α', который также подается на блок 250 поворота декодера; угол α' соответствует декодированным версиям вышеупомянутого угла α, по отношению к кодеру 10. Выходные сигналы углов φ1', φ2' соответствуют декодированным версиям вышеупомянутых углов φ1, φ2 по отношению к кодеру 10; причем углы φ1', φ2' передаются вместе с декодированными основными и остаточными выходами сигнала из блока 250 поворота декодера в декодирующий блок 260 поворота фаз, который, как показано, включает в себя декодированные выходы l', r'.
При работе декодер 200 выполняет инверсию этапов кодирования, осуществленных на кодере 10. Таким образом, в декодере 200 поток битов 100 демультиплексируется в демультиплексоре 210 для разделения данных, соответствующих основному и остаточному сигналам, которые восстановлены с помощью декодеров 220, 230 для генерации декодированного основного и остаточного сигналов m', s'. Далее сигналы m', s' поворачивают на угол α' и затем корректируют их относительную фазу, используя углы φ1', φ2', для восстановления левого и правого сигналов l', r'. Углы φ1', φ2', α' восстанавливаются из параметров, демультиплексированных в демультиплексоре 210 и разделенных в блоке 240 обработки.
В кодере 10 и, таким образом, в декодере 200, предпочтительно передавать в потоке 100 битов IID значение и значение ρ когерентности, а не вышеупомянутый угол α. IID значение служит для представления межканальной разницы, то есть указывает частоту и временный вариант разницы амплитуд между левым и правым сигналами l, r. Значение ρ когерентности указывает на частотную когерентность, или подобие, между левым l и правым r сигналами после фазовой синхронизации. Однако, например, в декодере 200, угол α без труда извлекается из значений IID и ρ, применяя Уравнение 18 (Eq.18):
Figure 00000013
Eq.18
Параметрический декодер указан ссылочной позицией 400 на Фиг.7, причем этот декодер 400 является комплиментарным для кодеров согласно настоящему изобретению. Декодер 400 содержит демультиплексор 410 потока битов, декодер 420, блок 430 декорреляции, блок 440 масштабирования, блок 450 поворота сигнала, блок 460 поворота фаз и блок 470 деквантования. Демультиплексор 410 содержит вход для приема сигнала потока 100 битов (bs) и четыре соответствующих выхода для сигнала m, s данных, данных углового параметра, IID данных и данных ρ когерентности, эти выходы соединены с декодером 420 и с блоком 470 деквантования, как показано на фигуре. Выходной сигнал с декодера 420 подают через блок 430 декорреляции для восстановления представления остаточного сигнала s' на вход блока 440 масштабирования.
Помимо этого, восстановленное представление основного сигнала m' передается с блока 420 декодирования на блок 440 масштабирования. В блок 440 масштабирования также подают данные IID' и данные ρ' когерентности из блока 470 деквантования. Выходные сигналы блока 440 масштабирования подают в блок 450 поворота сигнала для генерации промежуточных выходных сигналов. Эти промежуточные выходные сигналы затем корректируются в блоке 460 поворота фаз, используя углы φ1, φ2, декодированные в блоке 470 деквантования для восстановления представления левого и правого сигналов l', r'.
Декодер 400 отличается от декодера 200 на Фиг.6 тем, что декодер 400 включает в себя блок 430 декорреляции для оценки остаточного сигнала s', основываясь на основном сигнале m' путем выполнения процесса декорреляции в блоке 430 декорреляции. Более того, уровень когерентности между левым и правым выходными сигналами l', r' определяется путем процесса масштабирования. Процесс масштабирования выполняется в блоке 440 масштабирования и связан с соотношением между основным сигналом m' и остаточным сигналом s'.
На Фиг.8 проиллюстрирован улучшенный кодер, обозначенный ссылочной позицией 500. Кодер 500 содержит блок 510 поворота фаз для полученных левого и правого входных сигналов l, r соответственно, блок 520 поворота сигнала, частотный/временной селектор 530, первый и второй кодеры 540, 550 соответственно, блок 560 квантования и мультиплексор 570, включающий в себя выход потока 100 битов (bs). Выходные сигналы углов φ1, φ2 блока 510 поворота фаз передают из блока 510 поворота фаз на блок 560 квантования. Помимо этого, выходные сигналы со скорректированными фазами из блока 510 поворота фаз пропускают через блок 520 поворота сигнала и через частотный/временной селектор 530 для генерации основного и остаточного сигналов m, s соответственно, а также IID и ρ данных/параметров когерентности. IID и ρ данные/параметры когерентности подают на блок 560 квантования, тогда как основной и остаточный сигналы m, s пропускают через первый и второй кодеры 540, 550 для генерации соответствующих данных для мультиплексора 570. Мультиплексор 570 также выполнен с возможностью получения параметров, описывающих углы φ1, φ2, когерентность ρ и IID. Мультиплексор 570 выполняет мультиплексирование данных из кодеров 540, 550 и блока 560 квантования для генерации потока битов 100 (bs).
В кодере 500, остаточный сигнал s кодируется непосредственно в поток 100 битов. При желании, блок 530 частотного/временного селектора может работать для определения того, какие части частотно-временной плоскости остаточного сигнала s кодированы в поток 100 битов (bs), блок 530, таким образом, определяет степень включения остаточной информации в поток 100 битов и, следовательно, влияет на баланс между достигаемым сжатием в кодере 500 и количеством информации, включенной в поток 100 битов.
На Фиг.9 улучшенный параметрический декодер обозначен ссылочной позицией 600, декодер 600 является комплиментарным кодеру 500, показанному на Фиг.8. Декодер 600 содержит блок 610 демультиплексирования, первый и второй декодеры 620, 640 соответственно, блок 630 декорреляции, блок 650 объединения, блок 660 масштабирования, блок 670 поворота сигнала, блок 680 поворота фаз и блок 690 деквантования. Блок 610 демультиплексирования связан с получением кодированного потока 100 битов (bs) и предоставляет соответствующие демультиплексированные выходные сигналы на первый и второй декодеры 620, 640 и также на блок 690 деквантования. Декодеры 620, 640 совместно с блоком 630 декорреляции и блоком 650 объединения действуют для восстановления представлений основного и остаточного сигналов m', s' соответственно. Эти представления подвергаются масштабированию в блоке 660 масштабирования, с последующими поворотами в блоке 670 поворота сигнала для генерации промежуточных сигналов, которые для восстановления представления левого и правого сигналов l', r' затем подвергаются повороту фаз в блоке 680 поворота в соответствии с угловыми параметрами, сгенерированными блоком 690 деквантования.
В декодере 600 поток битов 100 демультиплексируется в отдельные потоки для основного сигнала m', для остаточного сигнала s' и для стереопараметров. Основной и остаточный сигналы m', s' затем декодируются с помощью декодеров 620, 640 соответственно. Спектральные/временные части остаточного сигнала s', которые были кодированы в потоке 100 битов, передают в потоке 100 битов либо в неявном виде, то есть детектируя “пустые” области на плоскости время-частота, или в явном виде, то есть при помощи сигнальных параметров, декодированных из потока 100 битов. Блок 630 декорреляции и блок 650 объединения действуют для заполнения пустых областей время-частота в декодированном остаточном сигнале s' по существу с помощью искусственного остаточного сигнала. Этот искусственный сигнал генерируется с использованием декодированного основного сигнала m' и выходного сигнала из блока 650 декорреляции. Для всех других областей время-частота остаточный сигнал s применяется для создания декодированного остаточного сигнала s'; для этих областей не применяется масштабирование в блоке 660 масштабирования. Необязательно, для этих областей, дополнительные преимущества обеспечивает передача вышеупомянутого угла α в кодер 500, взамен IID и когерентности ρ, поскольку скорость передачи данных, необходимая для передачи одного параметра угла α, меньше, чем необходимая для передачи соответствующих данных IID и параметра ρ когерентности. Однако передача параметра угла α в потоке 100 битов вместо параметров IID и ρ приводит к отсутствию обратной совместимости кодера 500 и декодера 600 с традиционными Параметрическими Стереосистемами (PS), которые используют параметры IID и ρ.
Селекторные блоки 40, 530 кодеров 10, 500 соответственно предпочтительно выполнены с возможностью применения перцептуальной модели во время выбора областей время-частота остаточного сигнала s, нуждающихся в кодировании в поток 100 битов. С помощью различных аспектов кодирования время-частота остаточного сигнала s в кодерах 10, 500, возможно выполнение масштабируемых по скорости кодеров и декодеров. Если слои в потоке битов 100 взаимно зависимы, кодируемые данные, соответствующие перцептуально наиболее релевантному частотно-временному аспекту, включаются в базовый слой, при этом перцептуально менее релевантные данные перемещаются в уплотняющие слои или слои расширения; “слой расширения” также называется “слоем уплотнения”. В такой конфигурации, базовый слой предпочтительно содержит поток битов, относящийся к основному сигналу m, первый слой расширения содержит поток битов, соответствующий стереопараметрам, таким как указанные выше углы α, φ1, φ2, и второй слой расширения, содержит поток битов, относящийся к остаточному сигналу s.
Такая конфигурация слоев в данных потока 100 битов допускает потерю или удаление второго слоя расширения, передающего остаточный сигнал s; более того, декодер 600, проиллюстрированный на Фиг.10, способен комбинировать декодированные оставшиеся слои с искусственным остаточным сигналом, как описано выше, для восстановления остаточного сигнала, который имеет перцептуальный смысл для пользователя. Более того, если декодер 600 не обеспечивается (необязательно) вторым декодером 640, например, по причине ограничений, связанных со стоимостью и/или сложностью, то декодирование остаточного сигнала s возможно, хотя и с пониженным качеством.
Дополнительное уменьшение битовой скорости в потоке 100 битов (bs), как упомянуто выше, возможно с помощью отбрасывания кодированных параметров угла φ1, φ2. В такой ситуации блок 680 поворота фаз в декодере 600 реконструирует восстановленные выходные сигналы l', r', используя угол поворота, фиксированной величины, присвоенной по умолчанию, например с нулевым значением; такое дополнительное уменьшение битовой скорости использует особенности, связанные с тем, что человеческая слуховая система относительно нечувствительна к фазе высоких аудиочастот. Например, параметры φ2 могут передаваться в потоке 100 битов (bs), а параметры φ1 могут отбрасываются для уменьшения битовой скорости.
Кодеры и комплиментарные декодеры согласно настоящему изобретению, описанные выше, потенциально могут быть использованы в разнообразных электрических устройствах и системах, например, по меньшей мере, в одном из: Интернет-радио, потоковая передача сигнала через Интернет, Электронная Дистрибуция Музыки (EMD), плееры и рекордеры на базе твердотельных устройств, а также в телевидении и создании аудиопродукции.
Хотя выше описан способ кодирования выходных сигналов (l, r) для генерации потока 100 битов и также описаны комплиментарные способы декодирования потока 100 битов, необходимо учесть, что изобретение можно адаптировать для кодирования более чем двух входных сигналов. Например, настоящее изобретение может быть адаптировано для обеспечения кодирования данных и соответствующего декодирования данных для многоканального аудио, например, 5-канальной системы домашнего кинотеатра.
В прилагаемой формуле изобретения числа и другие символы, заключенные в скобки, включены для обеспечения лучшего понимания формулы изобретения и не ограничивают каким-либо образом объем формулы изобретения.
Необходимо учесть, что описанные выше варианты осуществления настоящего изобретения могут быть модифицированы без выхода за рамки сути настоящего изобретения, который определен прилагаемой формулой изобретения.
Выражения типа “содержит”, “включает в себя”, “включает”, “заключает”, “является” и “имеет” должны толковаться при интерпретации описания и прилагаемой формулы изобретения не исключающим способом, то есть при их толковании допускается возможность включения других, явно не определенных, элементов или компонентов. Ссылка на единственное число также должна рассматриваться как ссылка на множественное число и vice versa.

Claims (23)

1. Способ кодирования множества сигналов (1, r) для генерации соответствующих кодированных данных, способ, содержащий этапы
(a) обработки входных сигналов (1, r) для определения первых параметров (φ2), описывающих, по меньшей мере, относительную разность фаз или временную разность между сигналами (1, r), и применение этих первых параметров (φ2) для обработки входных сигналов для генерации соответствующих промежуточных сигналов;
(b) обработки промежуточных сигналов и/или входных сигналов (1, r) для определения вторых параметров, описывающих поворот промежуточных сигналов, требуемый для генерации основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m) имеет амплитуду или энергию большую, чем у разностного сигнала (s), и применение указанных вторых параметров для обработки промежуточных сигналов для генерации основного (m) и остаточного (s) сигналов;
(c) квантования первых параметров, вторых параметров и кодирования, по меньшей мере, части основного сигнала (m) и остаточного сигнала (s) для генерации соответствующих квантованных данных; и
(d) мультиплексирования квантованных данных для генерации кодированных данных.
2. Способ по п.1, в котором только часть остаточного сигнала (s) включается в кодированные данные.
3. Способ по п.2, в котором кодированные данные также включают в себя один или более параметров, указывающих, какая часть остаточного сигнала включена в кодированные данные.
4. Способ по п.1, в котором этапы (а) и (b) осуществляются с помощью комплексного поворота входных сигналов (1[n], r[n]), представленных в частотном домене (1[k], r[k]).
5. Способ по п.4, в котором этапы (а) и (b) выполняются независимо на подполосах входных сигналов (1[n], r[n]).
6. Способ по п.5, в котором другие подполосы, некодированные с помощью данного способа, кодируются с использованием альтернативных технологий.
7. Способ по п.1, в котором этап (с) указанного способа включает в себя этап манипулирования остаточным сигналом (s) путем отбрасывания перцептуально нерелевантной частотно-временной информации, представленной в остаточном сигнале (s), причем указанный остаточный сигнал (s), над которым совершаются манипуляции, дает вклад в кодированные данные, и указанная перцептуально нерелевантная информация соответствует выбранным частям спектрально-временного представления входных сигналов (1, r).
8. Способ по п.1, в котором вторые параметры на этапе (b) получают с помощью минимизации амплитуды или энергии остаточного сигнала (s).
9. Способ по п.1, в котором вторые параметры представлены в виде параметров межканальной разницы интенсивностей и параметров когерентности (IID, ρ).
10. Способ по п.1, в котором вторые параметры представлены в виде угла поворота α и соотношения энергий основного (m) и остаточного (s) сигналов.
11. Способ по п.1, в котором на этапах (с) и (d) кодированные данные размещены по слоям значимости, причем указанные слои включают в себя базовый слой, передающий основной сигнал (m), первый слой расширения, включающий в себя первые и вторые параметры, соответствующие параметрам, обеспечивающим стереоэффект, второй слой расширения, передающий представление остаточного сигнала (s).
12. Способ по п.11, в котором второй слой расширения дополнительно подразделяется на первый подслой для передачи наиболее важной частотно-временной информации остаточного сигнала (s) и второй подслой для передачи менее важной частотно-временной информации остаточного сигнала (s).
13. Кодер для кодирования множества входных сигналов (1, r) для генерации соответствующих кодированных данных, причем кодер содержит
(a) первое средство обработки для обработки входных сигналов (1, r) для определения первых параметров (φ2), описывающих, по меньшей мере, относительную разность фаз или временную разность между сигналами (1, r), причем первое средство обработки выполнено с возможностью применения указанных первых параметров (φ2) с целью обработки входных сигналов для генерации соответствующих промежуточных сигналов;
(b) второе средство обработки для обработки промежуточных сигналов для определения вторых параметров, описывающих поворот промежуточного сигнала, необходимый для генерации основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m) имеет амплитуду или энергию большую, чем остаточный сигнал (s), при этом второе средство обработки выполнено с возможностью применения указанных вторых параметров с целью обработки промежуточных сигналов для генерации, по меньшей мере, основного (m) и остаточного (s) сигналов;
(c) средство квантования для квантования первых параметров (φ2), вторых параметров (α; IID, ρ), и, по меньшей мере, части основного сигнала (m) и остаточного сигнала (s) для генерации соответствующих квантованных данных; и
(d) средство мультиплексирования для мультиплексирования квантованных данных с целью генерации кодированных данных.
14. Кодер по п.13, включающий в себя средство для манипуляции остаточным сигналом (s) путем отбрасывания перцептуально нерелевантной частотно-временной информации, представленной в остаточном сигнале (s), причем указанный подвергнутый манипуляции остаточный сигнал (s) вносит вклад в кодированные данные и указанная перцептуально нерелевантная информация относится к выделенным частям спектрально-временного представления входных сигналов.
15. Кодер по п.13, в котором остаточный сигнал (s) подвергается манипуляции, кодированию и мультиплексированию в кодированные данные.
16. Способ декодирования кодированных данных для восстановления соответствующих представлений множества входных сигналов (1', r'), при этом указанные входные сигналы (1, r) заранее кодированы для генерации указанных кодированных данных, причем способ содержит этапы:
(a) демультиплексирования кодированных данных для генерации соответствующих квантованных данных;
(b) обработки квантованных данных для генерации соответствующих первых параметров (φ2), вторых параметров (α; IID, ρ), и, по меньшей мере, основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m) имеет большую амплитуду или энергию, чем остаточный сигнал (s);
(c) поворота основного сигнала (m) и остаточного сигнала (s), используя вторые параметры для генерации соответствующих промежуточных сигналов; и
(d) обработки промежуточных сигналов, применяя первые параметры (φ2) для генерации указанных представлений указанных входных сигналов (1', r'), причем первые параметры (φ2) описывают, по меньшей мере, относительную разность фаз или временную разность между сигналами (1, r).
17. Способ по п.16, в котором в этап (b) включен дополнительный этап для соответственной замены утерянной частотно-временной информации остаточного сигнала (s) искусственным остаточным сигналом, извлеченным из основного сигнала (m).
18. Способ по п.16, в котором кодированные данные включают в себя параметры, указывающие, какая часть остаточного сигнала (s) кодирована в кодированные данные.
19. Способ по п.16, в котором декодер декодирует части кодированного сигнала, требующих дополнения, с помощью детектирования пустых областей кодированного сигнала при его представлении на частотно/временной плоскости.
20. Способ по п.16, в котором декодер декодирует части кодированного сигнала, требующие замены или дополнения, с помощью параметров детектированных данных, указывающих на пустые области.
21. Декодер для декодирования кодированных данных для восстановления соответствующих представлений множества входных сигналов (1', r'), причем указанные входные сигналы (1, r) заранее кодированы для генерации кодированных данных, декодер, содержащий
(а) средство демультиплексирования для демультиплексирования кодированных данных для генерации соответствующих квантованных данных;
(b) первое средство обработки для обработки квантированных данных для генерации соответствующих первых параметров (φ2), вторых параметров, и, по меньшей мере, основного сигнала (m) и остаточного сигнала (s), причем указанный основной сигнал (m) имеет амплитуду или энергию большую, чем остаточный сигнал (s);
(c) второе средство обработки для поворота основного (m) и остаточного (s) сигналов, применяя вторые параметры для генерации соответствующих промежуточных сигналов; и
(d) третье средство обработки для обработки промежуточных сигналов, применяя первые параметры (φ2) для преобразования указанных представлений входных сигналов (1, r), причем первые параметры (φ2) описывают, по меньшей мере, относительную разность фаз или временную разность между сигналами (1, r).
22. Декодер по п.21, в котором второе средство обработки выполнено с возможностью генерации дополнительного искусственного остаточного сигнала, извлекаемого из декодированного основного сигнала (m) для предоставления информации, утерянной из декодированного остаточного сигнала (s).
23. Декодер по п.22, в котором первое средство обработки выполнено с возможностью определения того, какая часть остаточного сигнала (s) уже декодирована для синтезирования утерянных недекодированных частей остаточного сигнала для генерации, по существу, целого остаточного сигнала (s).
RU2006139036/09A 2004-04-05 2005-03-29 Способы и устройства для кодирования и декодирования стереосигнала RU2392671C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP04101405.1 2004-04-05
EP04101405 2004-04-05
EP04103168.3 2004-07-05
EP04103168 2004-07-05

Publications (2)

Publication Number Publication Date
RU2006139036A RU2006139036A (ru) 2008-05-20
RU2392671C2 true RU2392671C2 (ru) 2010-06-20

Family

ID=34961999

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006139036/09A RU2392671C2 (ru) 2004-04-05 2005-03-29 Способы и устройства для кодирования и декодирования стереосигнала

Country Status (13)

Country Link
US (2) US7646875B2 (ru)
EP (3) EP1735778A1 (ru)
JP (1) JP5032978B2 (ru)
KR (1) KR101135726B1 (ru)
CN (2) CN1973320B (ru)
BR (1) BRPI0509108B1 (ru)
DK (1) DK3561810T3 (ru)
ES (1) ES2945463T3 (ru)
MX (1) MXPA06011396A (ru)
PL (1) PL3561810T3 (ru)
RU (1) RU2392671C2 (ru)
TW (1) TWI387351B (ru)
WO (1) WO2005098825A1 (ru)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2595541C2 (ru) * 2011-05-13 2016-08-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для генерирования выходного стереосигнала для обеспечения дополнительных выходных каналов
RU2614381C2 (ru) * 2013-02-14 2017-03-24 Долби Лабораторис Лайсэнзин Корпорейшн Декорреляция сигналов в системе обработки аудиоданных
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973320B (zh) * 2004-04-05 2010-12-15 皇家飞利浦电子股份有限公司 立体声编码和解码的方法及其设备
EP1810279B1 (en) * 2004-11-04 2013-12-11 Koninklijke Philips N.V. Encoding and decoding of multi-channel audio signals
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1866911B1 (en) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US8422555B2 (en) * 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8064624B2 (en) 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
KR101426271B1 (ko) * 2008-03-04 2014-08-06 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
CN101604524B (zh) * 2008-06-11 2012-01-11 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
EP2293292B1 (en) * 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
KR20100089705A (ko) * 2009-02-04 2010-08-12 삼성전자주식회사 3차원 영상 부호화/복호화 장치 및 방법
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
TWI451664B (zh) * 2009-03-13 2014-09-01 Foxnum Technology Co Ltd 編碼器組合
US8301803B2 (en) * 2009-10-23 2012-10-30 Samplify Systems, Inc. Block floating point compression of signal data
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN101705113B (zh) * 2009-10-30 2012-12-19 清华大学 一种带引射器的气流床气化炉水冷循环系统
KR20110049068A (ko) * 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
JP5511848B2 (ja) * 2009-12-28 2014-06-04 パナソニック株式会社 音声符号化装置および音声符号化方法
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CN102226852B (zh) * 2011-06-13 2013-01-09 广州市晶华光学电子有限公司 一种数码体视显微镜的成像系统
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
TWI590234B (zh) 2012-07-19 2017-07-01 杜比國際公司 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
GB2542511B (en) * 2014-09-19 2018-09-12 Imagination Tech Ltd Data compression
CN107251578B (zh) * 2015-02-25 2018-11-06 株式会社索思未来 信号处理装置
WO2017222582A1 (en) * 2016-06-20 2017-12-28 Intel IP Corporation Apparatuses for combining and decoding encoded blocks
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
US10839814B2 (en) 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
CN110556116B (zh) 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN110556117B (zh) 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置
JP7213364B2 (ja) * 2018-10-31 2023-01-26 ノキア テクノロジーズ オーユー 空間オーディオパラメータの符号化及び対応する復号の決定
TWI702780B (zh) * 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JP4327420B2 (ja) * 1998-03-11 2009-09-09 パナソニック株式会社 オーディオ信号符号化方法、及びオーディオ信号復号化方法
US6556966B1 (en) * 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CN100392981C (zh) * 1999-01-07 2008-06-04 皇家菲利浦电子有限公司 在无损编码器中边信息的有效编码方法
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
RU2316154C2 (ru) 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
AU2003216682A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
JP4322207B2 (ja) 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CN1973320B (zh) * 2004-04-05 2010-12-15 皇家飞利浦电子股份有限公司 立体声编码和解码的方法及其设备
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2595541C2 (ru) * 2011-05-13 2016-08-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для генерирования выходного стереосигнала для обеспечения дополнительных выходных каналов
US9913036B2 (en) 2011-05-13 2018-03-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
RU2614381C2 (ru) * 2013-02-14 2017-03-24 Долби Лабораторис Лайсэнзин Корпорейшн Декорреляция сигналов в системе обработки аудиоданных
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
US9830916B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Signal decorrelation in an audio processing system
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control

Also Published As

Publication number Publication date
JP5032978B2 (ja) 2012-09-26
BRPI0509108B1 (pt) 2019-11-19
US20070171944A1 (en) 2007-07-26
KR101135726B1 (ko) 2012-04-16
EP1944758A2 (en) 2008-07-16
US8254585B2 (en) 2012-08-28
EP3561810B1 (en) 2023-03-29
CN101887726B (zh) 2013-11-20
PL3561810T3 (pl) 2023-09-04
EP3561810A1 (en) 2019-10-30
DK3561810T3 (da) 2023-05-01
TWI387351B (zh) 2013-02-21
TW200603637A (en) 2006-01-16
CN101887726A (zh) 2010-11-17
MXPA06011396A (es) 2006-12-20
JP2007531915A (ja) 2007-11-08
ES2945463T3 (es) 2023-07-03
CN1973320B (zh) 2010-12-15
RU2006139036A (ru) 2008-05-20
US7646875B2 (en) 2010-01-12
US20110106540A1 (en) 2011-05-05
EP1735778A1 (en) 2006-12-27
BRPI0509108A (pt) 2007-08-28
EP1944758A3 (en) 2014-09-10
KR20070001207A (ko) 2007-01-03
CN1973320A (zh) 2007-05-30
WO2005098825A1 (en) 2005-10-20

Similar Documents

Publication Publication Date Title
RU2392671C2 (ru) Способы и устройства для кодирования и декодирования стереосигнала
US8804967B2 (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
RU2380766C2 (ru) Адаптивное остаточное аудиокодирование
RU2185024C2 (ru) Способ и устройство масштабированного кодирования и декодирования звука
JP6069208B2 (ja) 逆位相のチャネルに対する、改善されたステレオパラメトリック符号化/復号
JP5265358B2 (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
JP5366104B2 (ja) マルチチャネル・オーディオ信号の空間合成
KR20070098930A (ko) 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성
JP2019506633A (ja) 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法