RU2495505C2 - Гармоническое преобразование, усовершенствованное перекрестным произведением - Google Patents

Гармоническое преобразование, усовершенствованное перекрестным произведением Download PDF

Info

Publication number
RU2495505C2
RU2495505C2 RU2011133894/08A RU2011133894A RU2495505C2 RU 2495505 C2 RU2495505 C2 RU 2495505C2 RU 2011133894/08 A RU2011133894/08 A RU 2011133894/08A RU 2011133894 A RU2011133894 A RU 2011133894A RU 2495505 C2 RU2495505 C2 RU 2495505C2
Authority
RU
Russia
Prior art keywords
signal
frequency
subband
analyzed
frequency component
Prior art date
Application number
RU2011133894/08A
Other languages
English (en)
Other versions
RU2011133894A (ru
Inventor
Ларс ВИЛЛЕМОЕС
Пер ХЕДЕЛИН
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2011133894A publication Critical patent/RU2011133894A/ru
Application granted granted Critical
Publication of RU2495505C2 publication Critical patent/RU2495505C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Auxiliary Devices For Music (AREA)
  • Carbon And Carbon Compounds (AREA)
  • Fats And Perfumes (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)

Abstract

Изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR). Описана система и способ генерирования высокочастотной составляющей сигнала из низкочастотной составляющей сигнала. Система включает блок анализирующих фильтров, создающий набор сигналов анализируемых поддиапазонов низкочастотной составляющей сигнала. Она также включает блок нелинейной обработки, предназначенный для генерирования сигнала синтезируемого поддиапазона с синтезируемой частотой путем модификации фазы первого и второго сигналов анализируемых поддиапазонов из набора сигналов анализируемых поддиапазонов и комбинирования сигналов анализируемых поддиапазонов с модифицированной фазой. В конечном счете, она включает блок синтезирующих фильтров, предназначенный для генерирования высокочастотной составляющей сигнала из сигнала синтезируемого поддиапазона. Технический результат - улучшение эффективности кодирования традиционных кодеков воспринимаемых цифровых аудиосигналов. 4 н. и 25 з.п. ф-лы, 30 ил.

Description

ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ
Данное изобретение относится к системам звукового кодирования, использующим способ гармонического преобразования для высокочастотной реконструкции (HFR).
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
Технологии высокочастотной реконструкции, такие как технология репликации спектральных полос (SBR), позволяют значительно улучшить эффективность кодирования традиционных кодеков воспринимаемых цифровых аудиосигналов. В сочетании с перспективным звуковым кодированием MPEG-4 (ААС) она образует чрезвычайно эффективный аудиокодек, который уже используется в системах ХМ Satellite Radio и Digital Radio Mondiale. Комбинация ААС и SBR называется aacPlus. Она является частью стандарта MPEG-4, где именуется High Efficiency ААС Profile. В общем, технология HFR может сочетаться с любым кодеком воспринимаемых цифровых звуковых сигналов в порядке совместимости сверху вниз и снизу вверх, что, таким образом, предоставляет возможность осуществления модернизации уже установленных систем вещания, таких как система MPEG Layer-2, используемая в системе Eureka DAB. Способы HFR-преобразования также могут объединяться с вокодерами, допуская широкополосные речевые сигналы при сверхнизких скоростях цифрового потока.
Основополагающей идеей, лежащей в основе HRF, является наблюдение, что между характеристиками высокочастотного диапазона сигнала и характеристиками низкочастотного диапазона того же сигнала, как правило, существует сильная корреляция. Таким образом, хорошее приближение к представлению высокочастотного диапазона оригинального входного сигнала может достигаться путем преобразования сигнала из низкочастотного диапазона в высокочастотный диапазон.
Концепция преобразования была установлена в документе WO 98/57436 как способ воссоздания высокочастотного диапазона звукового сигнала из диапазона с меньшей частотой. С использованием этой концепции можно получить значительную экономию скорости битового потока при кодировании звуковых и/или речевых сигналов. В нижеследующем описании отсылка будет производиться к кодированию звуковых сигналов, однако следует учитывать, что описанные способы и системы равнозначно применимы для кодирования речевых сигналов и унифицированного кодирования звуковых и речевых сигналов (USAC).
В системе кодирования звуковых сигналов на основе HFR сигнал низкочастотного диапазона передается в базовый кодировщик формы сигнала, и более высокие частоты регенерируются на стороне декодера с использованием преобразования сигнала низкочастотного диапазона и дополнительной информации, которая, как правило, кодируется с чрезвычайно низкими скоростями битового потока и описывает форму целевого спектра. Для низких скоростей битового потока, где полоса пропускания базового кодированного сигнала является узкой, возрастающую важность приобретает воссоздание высокого диапазона, т.е. высокочастотного диапазона звукового сигнала, с приятными для восприятия характеристиками. Ниже упоминается два варианта способов реконструкции гармонических частот, где первый именуется гармоническим преобразованием, а второй - модуляцией сигнала с одной боковой полосой.
Принцип гармонического преобразования, определенный в документе WO 98/57436, заключается в том, что синусоида с частотой ω преобразуется в синусоиду с частотой Тω, где Т>1 - целое число, определяющее порядок преобразования. Привлекательной особенностью гармонического преобразования является то, что оно растягивает исходный частотный диапазон в целевой частотный диапазон с кратностью, равной порядку преобразования, т.е. с кратностью, равной Т. Гармоническое преобразование хорошо выполняется для сложного музыкального материала. Кроме того, гармоническое преобразование проявляет низкие частоты перехода, т.е. большой высокочастотный диапазон выше частоты перехода может генерироваться из относительно небольшого низкочастотного диапазона ниже частоты перехода.
В отличие от гармонического преобразования, HFR на основе модуляции сигнала с одной боковой полосой (SSB) преобразует синусоиду с частотой ω в синусоиду с частотой ω+Δω, где Δω - фиксированное смещение частоты. Наблюдалось, что для заданного базового сигнала с низким диапазоном частот в результате SSB-преобразования может возникать диссонирующий затухающий артефакт. Также следует учитывать, что для низкой частоты перехода, т.е. для малого исходного диапазона частот, гармоническое преобразование для заполнения требуемого целевого диапазона частот требует меньшего количества фрагментов, чем преобразование на основе SSB. Например, если требуется заполнить высокочастотный диапазон (ω, 4ω], то используемое гармоническое преобразование с Т=4 может заполнить этот частотный диапазон из диапазона частот 1 4 ω
Figure 00000001
, ω. С другой стороны, преобразование на основе SSB с использованием того же низкочастотного диапазона должно использовать смещение частоты Δ ω = 3 4 ω
Figure 00000002
, и для заполнения высокочастотного диапазона (ω, 4ω] необходимо четырехкратное повторение процесса.
С другой стороны, как недавно указано в документе WO 02/052545 А1, гармоническое преобразование обладает недостатками для сигналов с выраженной периодической структурой. Такие сигналы представляют собой суперпозиции гармонически связанных синусоид с частотами Ω, 2Ω, 3Ω, …, где Ω - основная частота. При гармоническом преобразовании порядка Т выходные синусоиды имеют частоты TΩ, 2TΩ, 3TΩ, …, что в случае Т>1 представляет собой лишь строгое подмножество требуемого полного гармонического ряда. В выражении результирующего качества звука, как правило, будет восприниматься «фантомный» основной тон, соответствующий преобразованной основной частоте TΩ. Часто гармоническое преобразование приводит в «металлическому» характеру звучания кодированного и декодированного звуковых сигналов. Данную ситуацию можно в некоторой степени смягчить путем добавления к HFR нескольких порядков преобразования T=2, 3, …, Tmax, но этот способ является сложным в вычислительном отношении, если необходимо избежать большинства провалов в спектре.
Альтернативное решение, позволяющее избежать появления «фантомных» основных тонов при использовании гармонического преобразования, представлено в документе WO 02/052545 А1. Решение заключается в использовании двух типов преобразования, т.е. традиционного гармонического преобразования и специального «импульсного преобразования». Описанный способ предлагает переключение на специальное «импульсное преобразование» для тех частей звукового сигнала, которые, как обнаруживается, являются периодическими и имеют характер последовательности импульсов. Трудность, связанная с данным подходом, заключается в том, что применение «импульсного преобразования» к сложному музыкальному материалу часто снижает его качество в сравнении с гармоническим преобразованием на основе блока фильтров высокого разрешения. Поэтому механизмы обнаружения должны регулироваться достаточно консервативно так, чтобы импульсное преобразование не использовалось для сложного материала. Речь и музыкальные инструменты с одним основным тоном неизбежно будут в некоторых случаях классифицироваться как комплексные сигналы, запуская этим гармоническое преобразование и, таким образом, приводя к потере гармоник. Кроме того, если переключение происходит в середине сигнала с одним основным тоном, или сигнала с основным тоном, доминирующим на более слабом сложном фоне, само переключение между двумя способами транспонирования, имеющими отличающиеся свойства заполнения спектра, будет генерировать слышимые артефакты.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Данное изобретение предусматривает способ и систему для заполнения гармонического ряда, возникающего в результате гармонического преобразования периодического сигнала. Преобразование в частотной области включает этап отображения нелинейно модифицированных сигналов поддиапазонов из блока анализирующих фильтров в выбранные поддиапазоны блока синтезирующих фильтров. Нелинейная модификация включает модификацию фаз, или вращение фаз, которая в области блока комплексных фильтров может быть получена по степенному закону с последующей коррекцией амплитуды. В то время как на текущем уровне техники преобразование отдельно модифицирует один анализируемый поддиапазон за раз, данное изобретение предлагает добавлять нелинейную комбинацию, по меньшей мере, двух различных анализируемых поддиапазонов к каждому синтезируемому поддиапазону. Расстояние между анализируемыми поддиапазонами, которые подвергаются комбинированию, может быть отнесено к основной частоте доминирующей составляющей сигнала, который подвергается преобразованию.
В наиболее общей форме математическое описание изобретения заключается в том, что набор частотных составляющих ω1, ω2, …, ωk используется для создания новой частотной составляющей:
ω=T1ω1+T2ω2+…+TKωK,
где коэффициенты T1, T2 …, TK - это целочисленные порядки преобразования, сумма которых представляет собой общий порядок преобразования T=T1+T2+ … +TK. Данный эффект получается путем модификации фаз K подходящим образом выбранных сигналов поддиапазонов посредством множителей T1, T2 …, TK и рекомбинации результата умножения в сигнал с фазой, равной сумме модифицированных фаз. Важно отметить, что все указанные операции с фазами вполне определены и точно выражены, поскольку индивидуальные порядки преобразования являются целыми числами, и некоторые из этих целых чисел даже могут быть отрицательными до тех пор, пока общий порядок преобразования удовлетворяет неравенству T≥1.
Способы согласно текущему уровню техники соответствуют случаю K=1, а данное изобретение предлагает использование K≥1. В тексте описания в основном рассматривается случай K=2, T≥2, поскольку этого достаточно для решения большинства имеющихся конкретных проблем. Однако следует отметить, что случаи K>2 рассматриваются как равным образом раскрываемые и охватываются настоящим документом.
Изобретение использует информацию от большего количества аналитических каналов низкочастотного диапазона, т.е. от большего количества сигналов анализируемых поддиапазонов, для отображения нелинейно модифицированных сигналов поддиапазонов из блока анализирующих фильтров в выбранные поддиапазоны блока синтезирующих фильтров. Преобразование не только отдельно модифицирует один поддиапазон за раз, но и добавляет к каждому синтезируемому поддиапазону нелинейную комбинацию, по меньшей мере, двух различных анализируемых поддиапазонов. Как уже упоминалось, гармоническое преобразование порядка T конструируется для того, чтобы отображать синусоиду с частотой ω в синусоиду с частотой Tω, где T>1. Согласно изобретению, т.н. усовершенствование перекрестного произведения с параметром основного тона Ω и индексом 0<r<T предназначается для отображения пары синусоид с частотами (ω, ω+Ω) в синусоиду с частотой (T-r)ω+r(ω+Ω)=Tω+rΩ. Следует учитывать, что для такого перекрестного произведения преобразования все парциальные частоты периодического сигнала с периодом Ω будут генерироваться путем добавления всех перекрестных произведений параметра основного тона Ω с индексом r, находящимся в интервале от 1 до T-1, к гармоническому преобразованию порядка T.
Согласно одной из особенностей изобретения, описывается система и способ генерирования высокочастотной составляющей сигнала из низкочастотной составляющей сигнала. Следует отметить, что особенности, описанные ниже в контексте системы, равным образом применимы к способу изобретения. Сигнал может представлять собой, например, звуковой и/или речевой сигнал. Система и способ могут использоваться для кодирования унифицированного речевого и звукового сигнала. Сигнал включает низкочастотную составляющую и высокочастотную составляющую, где низкочастотная составляющая включает частоты ниже определенной частоты перехода, а высокочастотная составляющая включает частоты выше определенной частоты перехода. При определенных условиях может потребоваться оценка высокочастотной составляющей сигнала, исходя из низкочастотной составляющей сигнала. Например, некоторые схемы звукового кодирования кодируют только низкочастотную составляющую звукового сигнала и направлены на реконструкцию высокочастотной составляющей этого сигнала исключительно из декодированной низкочастотной составляющей, возможно, с использованием определенной информации об огибающей оригинальной высокочастотной составляющей. Описываемые здесь система и способ могут использоваться в контексте указанных систем кодирования и декодирования.
Система для генерирования высокочастотной составляющей включает блок анализирующих фильтров, который создает набор сигналов анализируемых поддиапазонов низкочастотной составляющей сигнала. Блоки анализирующих фильтров могут включать набор полосовых фильтров с постоянной шириной полосы пропускания. Также, в особенности, в контексте речевых сигналов, может оказаться полезным использование набора полосовых фильтров с логарифмическим распределением полос пропускания. Целью блока анализирующих фильтров является разложение низкочастотной составляющей сигнала на ее частотные составляющие. Эти частотные составляющие будут отражаться в наборе сигналов анализируемых поддиапазонов, которые генерируются блоком анализирующих фильтров. Например, сигнал, включающий ноту, которая проигрывается музыкальным инструментом, будет разделяться на сигналы анализируемых поддиапазонов, имеющие достаточно высокие амплитуды для тех поддиапазонов, которые соответствуют гармонической частоте проигранной ноты, в то время как другие поддиапазоны будут проявлять сигналы анализируемых поддиапазонов с низкими амплитудами.
Система также включает блок нелинейной обработки, предназначенный для генерирования сигнала синтезируемого поддиапазона с конкретной синтезируемой частотой путем модификации или вращения фазы первого и второго сигналов из набора сигналов анализируемых поддиапазонов и путем комбинирования сигналов анализируемых поддиапазонов с модифицированной фазой. В общем случае, первый и второй сигналы анализируемых поддиапазонов отличаются. Иными словами, они соответствуют различным поддиапазонам. Блок нелинейной обработки может включать т.н. блок обработки скрещивающихся членов, в котором, как правило, генерируется сигнал синтезируемого поддиапазона. Сигнал синтезируемого поддиапазона включает синтезируемую частоту. Как правило, сигнал синтезируемого поддиапазона включает частоты из определенного диапазона синтезируемых частот. Синтезируемая частота представляет собой частоту, находящуюся в пределах этого частотного диапазона, т.е. центральную частоту частотного диапазона. Синтезируемая частота, а также диапазон синтезируемых частот, как правило, превышает частоту перехода. Аналогично, сигналы анализируемых поддиапазонов включают частоты из определенного диапазона анализируемых частот. Эти диапазоны анализируемых частот, как правило, находятся ниже частоты перехода.
Операция модификации фазы может заключаться в преобразовании частот сигналов анализируемых поддиапазонов. Как правило, блок анализирующих фильтров дает на выходе комплексные сигналы поддиапазонов, которые могут быть представлены как комплексные экспоненциальные функции, включающие амплитуду и фазу. Фаза комплексного сигнала анализируемого поддиапазона соответствует частоте сигнала поддиапазона. Преобразование этих сигналов поддиапазонов посредством определенного порядка преобразования T' может быть выполнено путем возведения сигнала поддиапазона в степень порядка преобразования T'. В результате получается фаза комплексного сигнала поддиапазона, умноженная на порядок преобразования T'. В результате преобразованный сигнал поддиапазона проявляет фазу, или частоту, которая в T' раз больше начальной фазы, или частоты. Такая операция модификации фазы также может называться вращением фазы или умножением фазы.
Кроме того, система включает блок синтезирующих фильтров, предназначенный для генерирования высокочастотной составляющей сигнала из сигнала синтезируемого поддиапазона. Иными словами, целью блока синтезирующих фильтров является объединение, возможно, набора сигналов синтезируемых поддиапазонов из, возможно, набора диапазонов синтезируемых частот и генерирование высокочастотной составляющей сигнала во временной области. Следует отметить, что для сигналов, содержащих основную частоту, например, основную частоту Ω, может быть полезно, чтобы блок синтезирующих фильтров и/или блок анализирующих фильтров проявлял разнос частот, который связан с основной частотой сигнала. В частности, может быть полезно выбирать блоки фильтров с достаточно низким разносом частот или достаточно высоким разрешением с целью разложения основной частоты Ω.
Согласно другой особенности изобретения, блок нелинейной обработки, или блок обработки скрещивающихся членов в блоке нелинейной обработки, включает блок преобразования первого и второго порядка с множеством входов и одним выходом, который генерирует сигнал синтезируемого поддиапазона из первого и второго сигналов анализируемых поддиапазонов, проявляющих, соответственно, первую и вторую анализируемые частоты. Иными словами, блок с множеством входов и одним выходом выполняет преобразование первого и второго сигналов анализируемых поддиапазонов и объединяет два преобразованных сигнала анализируемых поддиапазонов в сигнал синтезируемого поддиапазона. Первый сигнал анализируемого поддиапазона имеет модифицированную фазу, или его фаза является умноженной на первый порядок преобразования, при этом второй сигнал анализируемого поддиапазона имеет модифицированную фазу, или его фаза является умноженной на второй порядок преобразования. В случае комплексных сигналов анализируемых поддиапазонов указанная операция модификации фазы состоит в умножении фазы соответствующего сигнала анализируемого поддиапазона на соответствующий порядок преобразования. Два преобразованных сигнала анализируемых поддиапазонов комбинируются, давая комбинированный сигнал синтезируемого поддиапазона с синтезируемой частотой, которая соответствует первой анализируемой частоте, умноженной на первый порядок преобразования, плюс вторая анализируемая частота, умноженная на второй порядок преобразования. Этап комбинирования может состоять в перемножении двух преобразованных комплексных сигналов анализируемых поддиапазонов. Перемножение двух сигналов может состоять в перемножении их дискретных значений.
Вышеупомянутые особенности также могут быть выражены посредством формул. Пусть первая анализируемая частота - ω, а вторая анализируемая частота - (ω+Ω). Следует отметить, что эти переменные могут также представлять соответствующие диапазоны анализируемых частот двух сигналов анализируемых поддиапазонов. Иными словами, частота может подразумеваться как представляющая все частоты, заключаемые внутри конкретного частотного диапазона или частотного поддиапазона, т.е. первую и вторую анализируемые частоты также следует понимать как первый и второй диапазоны анализируемых частот или первый и второй анализируемые поддиапазоны. Кроме того, первым порядком преобразования может являться (T-r), а вторым порядком преобразования может являться r. Может оказаться полезным ограничить порядки преобразования так, чтобы T>1 и 1≤r<T. В этих случаях блок с множеством входов и одним выходом может давать на выходе сигналы синтезируемого поддиапазона с синтезируемой частотой (T-r)·ω+r·(ω+Ω).
Согласно еще одной особенности изобретения, система включает набор блоков с множеством входов и одним выходом и/или набор блоков нелинейной обработки, которые генерируют набор парциальных сигналов синтезируемых поддиапазонов, имеющих синтезируемую частоту. Иными словами, может генерироваться набор парциальных сигналов синтезируемых поддиапазонов, охватывающих тот же самый диапазон синтезируемой частоты. В этих случаях предусматривается блок суммирования поддиапазонов, предназначенный для комбинирования набора парциальных сигналов синтезируемых поддиапазонов. Тогда объединенные парциальные сигналы синтезируемых поддиапазонов представляют сигнал синтезируемого поддиапазона. Операция комбинирования может включать суммирование набора парциальных сигналов синтезируемых поддиапазонов. Также она может включать определение среднего сигнала синтезируемого поддиапазона из набора парциальных сигналов синтезируемых поддиапазонов, где парциальные сигналы синтезируемых поддиапазонов могут взвешиваться в соответствии с их значимостью для сигнала синтезируемого поддиапазона. Операция комбинирования также может включать выбор из набора одного или некоторых сигналов поддиапазонов, имеющих, например, амплитуду, которая превышает заранее заданное пороговое значение. Следует отметить, что может оказаться полезным, чтобы сигнал синтезируемого поддиапазона умножался на коэффициент усиления. Коэффициенты усиления, в особенности в тех случаях, когда присутствует набор парциальных сигналов синтезируемых поддиапазонов, могут вносить вклад в нормировку сигналов синтезируемых поддиапазонов.
Согласно еще одной особенности изобретения, блок нелинейной обработки также включает блок прямой обработки, предназначенный для генерирования дополнительного сигнала синтезируемого поддиапазона из третьего сигнала из набора сигналов анализируемых поддиапазонов. Указанный блок прямой обработки сигналов может реализовывать способы прямого преобразования, описанные, например, в документе WO 98/57436. Если система включает дополнительный блок прямой обработки, тогда может появиться необходимость в блоке суммирования поддиапазонов, предназначенном для комбинирования соответствующих сигналов синтезируемых поддиапазонов. Соответствующие сигналы синтезируемых поддиапазонов, как правило, представляют собой сигналы поддиапазонов, охватывающие один и тот же частотный диапазон и/или проявляющие одну и ту же синтезируемую частоту. Блок суммирования поддиапазонов может выполнять комбинирование в соответствии с описанными выше особенностями. Также он может игнорировать определенные сигналы синтезируемых поддиапазонов, в особенности сигналы, генерируемые блоками с множеством входов и одним выходом в тех случаях, когда минимальное значение амплитуды одного или нескольких сигналов анализируемых поддиапазонов, например, от скрещивающихся членов, вносящих вклад в сигнал синтезируемого поддиапазона, меньше заранее заданной доли амплитуды сигнала. Сигнал может представлять собой низкочастотную составляющую сигнала или отдельный сигнал анализируемого поддиапазона. Этот сигнал также может представлять собой отдельный сигнал синтезируемого поддиапазона. Иными словами, если энергия или амплитуда сигналов анализируемых поддиапазонов, используемых для генерирования сигнала синтезируемого поддиапазона, слишком мала, тогда этот сигнал синтезируемого диапазона может не использоваться для генерирования высокочастотной составляющей сигнала. Энергия, или амплитуда, может определяться для каждой дискретной составляющей или для набора дискретных составляющих сигналов анализируемых поддиапазонов, например, путем определения среднего по времени или среднего скользящего окна по ряду смежных дискретных значений.
Блок прямой обработки может включать блок третьего порядка преобразования T' с одним входом и одним выходом, генерирующий сигнал синтезируемого поддиапазона из третьего сигнала анализируемого поддиапазона, проявляющего третью анализируемую частоту, где третий сигнал анализируемого поддиапазона имеет модифицированную фазу, или его фаза умножена на третий порядок преобразования T', и где T' больше единицы. Тогда синтезируемая частота соответствует третьей анализируемой частоте, умноженной на третий порядок преобразования. Следует отметить, что этот третий порядок преобразования T', предпочтительно, равен системному порядку преобразования, представленному ниже.
Согласно еще одной особенности изобретения, блок анализирующих фильтров содержит N поддиапазонов c, в значительной мере, постоянным расстоянием между поддиапазонами Δω. Как указывалось выше, расстояние между поддиапазонами Δω может быть связано с основной частотой сигнала. Анализируемый поддиапазон связан с индексом анализируемого поддиапазона n, где n∈(1, …, N). Иными словами, анализируемые поддиапазоны блока анализирующих фильтров могут быть идентифицированы по индексу поддиапазона n. Сходным образом, сигналы анализируемых поддиапазонов, включающие частоты из частотного диапазона соответствующего анализируемого поддиапазона, могут быть идентифицированы по индексу поддиапазона n.
Блок синтезирующих фильтров на стороне синтеза содержит синтезируемый поддиапазон, который также связан с индексом синтезируемого поддиапазона n. Индекс синтезируемого поддиапазона также идентифицирует сигнал синтезируемого поддиапазона, который включает частоты из диапазона синтезируемых частот синтезируемого поддиапазона с индексом n. Если система имеет системный порядок преобразования, также называемый общим порядком преобразования Т, то синтезируемые поддиапазоны, как правило, обладают, в значительной мере, постоянным расстоянием между поддиапазонами Δω·T, т.е. расстояние между поддиапазонами для синтезируемых поддиапазонов в Т раз больше расстояния между поддиапазонами для анализируемых поддиапазонов. В этих случаях синтезируемый поддиапазон и анализируемый поддиапазон с индексом n содержат частотные интервалы, которые соотносятся друг с другом посредством множителя или системного порядка преобразования T. Например, если частотный диапазон для анализируемого поддиапазона с индексом n равен [(n-1)·ω, n·ω], то частотный диапазон для синтезируемого поддиапазона с индексом n равен [T·(n-1)·ω, T·n·ω].
Если сигнал синтезируемого поддиапазона связан с синтезируемым поддиапазоном с индексом n, то еще одна особенность изобретения заключается в том, что этот сигнал синтезируемого поддиапазона с индексом n генерируется в блоке со множеством входов и одним выходом из первого и второго сигналов анализируемых поддиапазонов. Первый сигнал анализируемого поддиапазона связан с анализируемым поддиапазоном с индексом n-p1, второй сигнал анализируемого поддиапазона связан с анализируемым поддиапазоном с индексом n+p2.
Ниже описано несколько способов выбора пары смещений индексов (p1, p2). Выбор может выполняться т.н. блоком выбора индексов. Как правило, оптимальная пара индексов выбирается с целью генерирования сигнала синтезируемого поддиапазона с заранее определенной синтезируемой частотой. В первом способе смещения индексы p1 и p2 выбираются из ограниченного перечня пар (p1, p2), хранящегося в блоке хранения индексов. Пара (p1, p2) может быть выбрана из этого ограниченного перечня пар смещений индексов так, чтобы максимизировать минимальное значение из набора, включающего амплитуду первого анализируемого поддиапазона и амплитуду второго анализируемого поддиапазона. Иными словами, для каждой возможной пары смещений индексов p1 и p2 может быть определена амплитуда соответствующих сигналов анализируемых поддиапазонов. В случае комплексных сигналов анализируемых поддиапазонов амплитуда соответствует абсолютному значению. Амплитуда может быть определена для каждого дискретного значения или для набора дискретных значений сигнала анализируемого поддиапазона, например, путем определения среднего по времени или среднего скользящего окна по ряду смежных дискретных значений. На выходе получаются первая и вторая амплитуды, соответственно, для первого и второго сигналов анализируемых поддиапазонов. Рассматриваются минимальные значения первой и второй амплитуд, и пара смещений индексов (p1, p2) выбирается для того значения, где минимальное значение амплитуды является наибольшим.
Во втором способе смещения индексов p1 и p2 выбираются из ограниченного перечня пар (p1, p2), где ограниченный перечень определяется по формулам p1=r·I и p2=(T-r)·I. В этих формулах I - положительное целое число, принимающее значения от 1 до 10. Данный способ особенно полезен в тех ситуациях, когда первый порядок преобразования, используемый для преобразования первого анализируемого поддиапазона (n-p1) равен (T-r), а второй порядок преобразования, используемый для преобразования второго анализируемого поддиапазона (n+p2), равен r. Предполагая, что системный порядок преобразования является фиксированным, параметры I и r могут выбираться так, чтобы максимизировать минимальное значение набора, включающего амплитуду сигнала первого анализируемого поддиапазона и амплитуду сигнала второго анализируемого поддиапазона. Иными словами, параметры I и r могут выбираться при помощи вышеописанного подхода (max-min)-оптимизации.
В следующем способе выбор первого и второго сигналов анализируемых поддиапазонов может основываться на характеристиках основного сигнала. В особенности в том случае, если сигнал включает основную частоту Ω, т.е. если сигнал является периодическим и имеет характер последовательности импульсов, может оказаться полезным выбирать смещения индексов p1 и p2, принимая во внимание характеристики указанного сигнала. Основная частота Ω может определяться из низкочастотной составляющей сигнала или из оригинального сигнала, включающего обе, низкочастотную и высокочастотную составляющие. В первом случае, основная частота Ω может определяться в декодере сигнала с использованием высокочастотной реконструкции, в то время как во втором случае основная частота Ω, как правило, может определяться в кодировщике сигнала и затем передаваться в декодер сигнала. Если используется блок анализирующих фильтров с расстоянием между поддиапазонами Δω, и если первым порядком преобразования, используемым для преобразования первого анализируемого поддиапазона (n-p1), является (T-r), а вторым порядком преобразования, используемым для преобразования второго анализируемого поддиапазона (n+p2), является r, то p1 и p2 могут быть выбраны так, чтобы их сумма p1+p2 приближенно равнялась частному Ω/Δω, а их частное p1/p2 приближенно равнялось r/(T-r). В частном случае p1 и p2 выбираются так, чтобы частное p1/p2 было равно r/(T-r).
Согласно еще одной особенности изобретения, система для генерирования высокочастотной составляющей сигнала также включает окно анализа, которое выделяет заранее определенный временной интервал низкочастотной составляющей около заранее определенного момента времени k. Система также может включать окно синтеза, которое выделяет заранее определенный интервал времени высокочастотной составляющей около заранее определенного момента времени k. Эти окна особенно полезны для сигналов с частотными компонентами, которые изменяются во времени. Они позволяют анализировать мгновенный частотный состав сигнала. В сочетании с блоками фильтров, типичный пример такого частотного анализа с временной зависимостью представляет кратковременное преобразование Фурье (STFT). Следует отметить, что часто окно анализа представляет собой версию окна синтеза с разбросом по времени. Для системы с системным порядком преобразования T окно анализа во временной области может являться версией окна синтеза во временной области с разбросом по времени с коэффициентом расширения T.
Согласно еще одному варианту осуществления изобретения описывается система для декодирования сигнала. Система принимает кодированную версию низкочастотной составляющей сигнала и включает блок преобразования, соответствующий системе, которая описана выше, и предназначенный для генерирования высокочастотной составляющей сигнала из низкочастотной составляющей сигнала. Как правило, подобные системы декодирования также включают базовый декодер, предназначенный для декодирования низкочастотной составляющей сигнала. Система декодирования также может включать повышающий дискретизатор, предназначенный для выполнения повышающей дискретизации низкочастотной составляющей, чтобы получить на выходе низкочастотную составляющую с повышенной дискретизацией. Это может потребоваться в случае, когда низкочастотная составляющая сигнала была подвергнута понижающей дискретизации в кодировщике, и использует тот факт, что низкочастотная составляющая, в сравнении с оригинальным сигналом, охватывает только диапазон пониженных частот. Кроме того, система декодирования может включать блок ввода, который предназначен для приема кодированного сигнала, включающего низкочастотную составляющую, и блок вывода, предназначенный для создания декодированного сигнала, включающего низкочастотную и генерированную высокочастотную составляющие.
Система декодирования также может включать регулятор огибающей, предназначенный для придания формы высокочастотной составляющей. Поскольку высокие частоты сигнала могут быть регенерированы из низкочастотного диапазона сигнала с использованием систем и способов высокочастотной реконструкции, описанных в настоящем документе, может оказаться полезным извлечение из оригинального сигнала информации, относящейся к огибающей спектра его высокочастотной составляющей. Информация об огибающей может затем передаваться в декодер с целью генерирования высокочастотной составляющей, являющейся хорошим приближением огибающей спектра высокочастотной составляющей оригинального сигнала. Эта операция, как правило, выполняется в регуляторе огибающей системы декодирования. Для приема информации, относящейся к огибающей высокочастотной составляющей сигнала, система декодирования может включать блок приема данных об огибающей. Регенерированная высокочастотная составляющая и декодированная и, возможно, подвергнутая повышающей дискретизации низкочастотная составляющая могут затем суммироваться в блоке суммирования составляющих, определяющем декодированный сигнал.
Как описано выше, система для генерирования высокочастотной составляющей может использовать информацию, относящуюся к сигналам анализируемых поддиапазонов, которые подвергаются преобразованию и комбинированию с целью генерирования индивидуального сигнала синтезируемого поддиапазона. Для этого система декодирования может дополнительно включать блок приема данных о выборе поддиапазона, предназначенный для приема информации, которая позволяет осуществлять выбор первого и второго сигналов анализируемых поддиапазонов, из которых будет генерироваться сигнал синтезируемого поддиапазона. Эта информация может относиться к определенным характеристикам кодированного сигнала, например, информация может быть связана с основной частотой Q сигнала. Информация также может быть непосредственно связанной с анализируемыми поддиапазонами, которые нужно выбрать. Например, информация может включать перечень возможных пар первых и вторых сигналов анализируемых поддиапазонов или перечень пар (p1, p2) возможных смещений индексов.
Согласно еще одной особенности изобретения описывается кодированный сигнал. Кодированный сигнал включает информацию, относящуюся к низкочастотной составляющей кодированного сигнала, где низкочастотная составляющая включает набор сигналов анализируемых поддиапазонов. Кроме того, кодированный сигнал включает информацию, относящуюся к тем двум сигналам анализируемых поддиапазонов, которые должны быть выбраны для генерирования высокочастотной составляющей декодированного сигнала путем преобразования двух выбранных сигналов анализируемых поддиапазонов. Иными словами, кодированный сигнал включает, возможно, кодированную версию низкочастотной составляющей сигнала. Кроме того, он предоставляет информацию, такую как основная частота Ω сигнала или перечень возможных пар смещений индексов (p1, p2), которая позволяет декодеру генерировать высокочастотную составляющую сигнала на основе способа гармонического преобразования, усовершенствованного перекрестным произведением, которое описано в настоящем документе.
Согласно еще одной особенности изобретения описана система для кодирования сигнала. Эта система кодирования включает блок разделения, предназначенный для разделения сигнала на низкочастотную составляющую и высокочастотную составляющую, и базовый кодировщик, предназначенный для кодирования низкочастотной составляющей. Он также включает блок определения частоты, предназначенный для определения основной частоты Ω сигнала, и кодировщик параметров, предназначенный для кодирования основной частоты Ω, где основная частота Ω используется в декодере для регенерирования высокочастотной составляющей сигнала. Система также может включать блок определения огибающей, предназначенный для определения огибающей спектра высокочастотной составляющей, и кодировщик огибающей, предназначенный для кодирования огибающей спектра. Иными словами, система кодирования удаляет высокочастотную составляющую оригинального сигнала и кодирует низкочастотную составляющую при помощи базового кодировщика, например, кодировщика ААС или Dolby D. Кроме того, система кодирования анализирует высокочастотную составляющую оригинального сигнала и определяет набор информации, которая используется в декодере для регенерирования высокочастотной составляющей декодированного сигнала. Набор информации может включать основную частоту Ω сигнала и/или огибающую спектра высокочастотной составляющей.
Система кодирования также может включать блок анализирующих фильтров, создающий набор сигналов анализируемых поддиапазонов низкочастотной составляющей сигнала. Кроме того, она может включать блок определения пары поддиапазонов, предназначенный для определения первого и второго сигналов поддиапазонов для генерирования высокочастотной составляющей сигнала, и кодировщик индексов, предназначенный для кодирования порядковых номеров, представляющих определенные первый и второй сигналы поддиапазонов. Иными словами, система кодирования может использовать способ высокочастотной реконструкции и систему, описанные в настоящем документе, для определения анализируемых поддиапазонов, из которых могут генерироваться высокочастотные поддиапазоны и, в конечном счете, высокочастотная составляющая сигнала. Информация об этих поддиапазонах, например ограниченный перечень пар смещений индексов, может затем кодироваться и передаваться в декодер.
Как подчеркивалось выше, изобретение также охватывает способы генерирования высокочастотной составляющей сигнала, а также способы декодирования и кодирования сигналов. Особенности, описанные выше в контексте систем, равным образом применимы к соответствующим способам. Ниже описываются некоторые особенности способов согласно изобретению. Аналогично эти особенности также применимы к системам, описанным в настоящем документе.
Согласно еще одной особенности настоящего изобретения описан способ выполнения высокочастотной реконструкции высокочастотной составляющей сигнала из низкочастотной составляющей сигнала. Этот способ включает этап создания первого сигнала поддиапазона низкочастотной составляющей из первого частотного диапазона и второго сигнала поддиапазона низкочастотной составляющей - из второго частотного диапазона. Иными словами, два сигнала поддиапазонов выделяются из низкочастотной составляющей сигнала, первый сигнал поддиапазона охватывает первый частотный диапазон, а второй сигнал поддиапазона охватывает второй частотный диапазон. Предпочтительно, частотные поддиапазоны отличаются. На следующем этапе сигналы первого и второго поддиапазонов преобразуются посредством, соответственно, первого и второго коэффициентов преобразования. Преобразование каждого из сигналов поддиапазонов может выполняться в соответствии с известными способами преобразования сигналов. В случае комплексных сигналов поддиапазонов преобразование может выполняться путем модификации фазы, или умножения фазы на соответствующий коэффициент преобразования или порядок преобразования. На следующем этапе преобразованные первый и второй сигналы поддиапазонов комбинируются, давая на выходе высокочастотную составляющую, которая включает частоты из высокочастотного диапазона.
Преобразование может выполняться так, чтобы высокочастотный диапазон соответствовал сумме первого частотного диапазона, умноженного на первый коэффициент преобразования, и второго частотного диапазона, умноженного на второй коэффициент преобразования. Кроме того, этап преобразования может включать этапы умножения первого частотного диапазона первого сигнала поддиапазона на первый коэффициент преобразования и умножения второго частотного диапазона второго сигнала поддиапазона на второй коэффициент преобразования. Для упрощения объяснения без ограничения объема изобретения изобретение иллюстрируется преобразованием отдельных частот. Следует, однако, отметить, что преобразование выполняется не только для отдельных частот, но и для целых частотных диапазонов, т.е. для множества частот, заключенных в пределах частотного диапазона. По существу, преобразование частот и преобразование диапазонов частот в данном документе следует понимать как равнозначные. Однако следует отдавать себе отчет в том, что частотные разрешения для блоков анализирующих и синтезирующих фильтров различны.
В вышеупомянутом способе этап создания может включать фильтрацию низкочастотной составляющей блоком анализирующих фильтров с целью генерирования первого и второго сигналов поддиапазонов. С другой стороны, этап комбинирования может включать перемножение первого и второго преобразованных сигналов поддиапазонов с получением сигнала высокого поддиапазона и ввод сигнала высокого поддиапазона в блок синтезирующих фильтров с целью генерирования высокочастотной составляющей. Другие преобразования сигнала в частотное представление и из частотного представления также возможны и находятся в пределах объема изобретения. Указанные преобразования сигналов включают преобразования Фурье (FFT, DCT), вейвлетные преобразования, квадратурные зеркальные фильтры (QMF) и т.д. Кроме того, эти преобразования также включают оконные функции, предназначенные для выделения уменьшенного временного интервала сигнала, предназначенного для преобразования. Возможные оконные функции включают взвешивающие функции Гаусса, косинусные взвешивающие функции, взвешивающие функции Хэмминга, взвешивающие функции Ханна, прямоугольные оконные функции, взвешивающие функции Барлетта, взвешивающие функции Блэкмана и др. В данном документе термин «блок фильтров» может включать любое из указанных преобразований, возможно, комбинированное с любой из указанных оконных функций.
Согласно другой особенности изобретения описан способ декодирования кодированного сигнала. Кодированный сигнал получается из оригинального сигнала и представляет только часть частотных поддиапазонов оригинального сигнала, расположенных ниже частоты перехода. Способ описывает этапы создания первого и второго поддиапазонов кодированного сигнала. Это может осуществляться путем использования блока анализирующих фильтров. Затем частотные поддиапазоны преобразуются посредством, соответственно, первого коэффициента преобразования и второго коэффициента преобразования. Это может осуществляться путем выполнения модификации фазы, или умножения фазы сигнала в первом частотном поддиапазоне на первый коэффициент преобразования, и путем выполнения модификации фазы, или умножения фазы сигнала во втором частотном поддиапазоне на второй коэффициент преобразования. В конечном итоге, из первого и второго преобразованных частотных поддиапазонов генерируется высокочастотный поддиапазон, который находится выше частоты перехода. Высокочастотный поддиапазон может соответствовать сумме первого частотного поддиапазона, умноженного на первый коэффициент преобразования, и второго частотного поддиапазона, умноженного на второй коэффициент преобразования.
Согласно еще одной особенности изобретения описан способ кодирования сигнала. Этот способ включает этапы фильтрации сигнала для выделения низкой частоты сигнала и кодирования низкочастотной составляющей сигнала. Кроме того, создается набор сигналов анализируемых поддиапазонов низкочастотной составляющей сигнала. Это может осуществляться с использованием блока анализирующих фильтров так, как описано в настоящем документе. Затем определяются первый и второй сигналы поддиапазонов, предназначенные для генерирования высокочастотной составляющей сигнала. Это может осуществляться с использованием способов высокочастотной реконструкции и систем, описанных в настоящем документе. В конечном итоге, информация, представляющая определенные первый и второй сигналы поддиапазонов, кодируется. Указанной информацией могут быть характеристики оригинального сигнала, например основная частота Ω сигнала, или информация, относящаяся к выбранным анализируемым поддиапазонам, например пары смещений индексов (p1, p2).
Следует отметить, что вышеупомянутые варианты осуществления и особенности изобретения могут произвольно комбинироваться. В частности, следует отметить, что особенности, описанные для системы, так же применимы и к соответствующему способу, охватываемому настоящим изобретением. Кроме того, следует отметить, что раскрытие изобретения также охватывает и другие сочетания пунктов формулы изобретения, а не только те сочетания пунктов формулы изобретения, которые в прямой форме даны обратными ссылками в зависимых пунктах формулы изобретения, т.е. пункты формулы изобретения и их технические особенности могут комбинироваться в любом порядке и любом сочетании.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКОГО МАТЕРИАЛА
Настоящее изобретение далее будет описано при помощи иллюстративных примеров, не ограничивающих объем изобретения. Оно будет описано с отсылкой к сопроводительным иллюстрациям, на которых:
Фиг.1 иллюстрирует функционирование декодера звуковых сигналов, усовершенствованного посредством HFR;
Фиг.2 иллюстрирует функционирование гармонического преобразователя, использующего несколько порядков;
Фиг.3 иллюстрирует функционирование гармонического преобразователя в частотной области (FD);
Фиг.4 иллюстрирует функционирование использования обработки скрещивающихся членов согласно изобретению;
Фиг.5 иллюстрирует прямую обработку на текущем уровне техники;
Фиг.6 иллюстрирует нелинейную обработку единичного поддиапазона на текущем уровне техники;
Фиг.7 иллюстрирует составляющие обработки скрещивающихся членов согласно изобретению;
Фиг.8 иллюстрирует функционирование блока обработки скрещивающихся членов;
Фиг.9 иллюстрирует нелинейную обработку согласно изобретению, содержащуюся в каждой из систем MISO по Фиг.8;
Фиг.10-18 иллюстрируют осуществление изобретения для гармонического преобразования иллюстративных периодических сигналов;
Фиг.19 иллюстрирует частотно-временное разрешение кратковременного преобразования Фурье (STFT);
Фиг.20 иллюстрирует иллюстративную временную прогрессию оконной функции и ее Фурье-преобразования, используемые на стороне синтеза;
Фиг.21 иллюстрирует STFT синусоидального входного сигнала;
Фиг.22 иллюстрирует оконную функцию и ее Фурье-преобразование по Фиг.20, используемые на стороне анализа;
Фиг.23 и 24 иллюстрируют определение надлежащих поддиапазонов блока анализирующих фильтров, предназначенных для усовершенствования поддиапазона диапазона синтезирующего фильтра посредством скрещивающихся членов;
Фиг.25, 26 и 27 иллюстрируют экспериментальные результаты способа гармонического преобразования прямых членов и скрещивающихся членов;
Фиг.28 и 29 иллюстрируют варианты осуществления, соответственно, кодировщика и декодера с использованием схем усовершенствованного гармонического преобразования, описанных в настоящем документе;
Фиг.30 иллюстрирует вариант осуществления блока преобразования, показанного на Фиг.28 и 29.
ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Описываемые ниже варианты осуществления изобретения являются лишь иллюстрациями принципов настоящего изобретения в отношении так называемого гармонического преобразования, усовершенствованного перекрестным произведением. Следует понимать, что модификации и изменения описанных здесь компоновок и деталей будут понятны специалистам в данной области. Поэтому имеется намерение ограничиться только объемом предстоящей формулы изобретения, а не конкретными деталями, представленными здесь с целью описания и разъяснения вариантов осуществления изобретения.
Фиг.1 иллюстрирует функционирование декодера звуковых сигналов, усовершенствованного HFR. Базовый декодер звуковых сигналов 101 выводит звуковой сигнал с низкочастотной полосой пропускания, который подается в повышающий дискретизатор 104, который может требоваться для получения вклада в конечный выходной звуковой сигнал с требуемой полной частотой дискретизации. Повышающая дискретизация требуется для систем с двумя частотами дискретизации, где базовый аудиокодек с ограниченным диапазоном функционирует на половине внешней частоты дискретизации звукового сигнала, в то время как подсистема HFR обрабатывается на полной частоте дискретизации. Соответственно, в системе с одной частотой дискретизации повышающий дискретизатор 104 опускается. Выходной сигнал с низкочастотной полосой пропускания из 101 также направляется к преобразователю, или блоку преобразования 102, который выводит преобразованный сигнал, т.е. сигнал, включающий требуемый высокочастотный диапазон. Форма преобразованного сигнала может корректироваться по времени и частоте регулятором огибающей 103. Конечный выходной звуковой сигнал представляет собой сумму базового сигнала с низкочастотной полосой пропускания и преобразованного сигнала со скорректированной огибающей.
Фиг.2 иллюстрирует функционирование гармонического преобразователя 201, который соответствует преобразователю 102 по Фиг.1, включающему несколько преобразователей с различным порядком преобразования Т. Сигнал, который подвергается преобразованию, проходит к блоку отдельных преобразователей 201-2, 201-3, …, 201-Tmax, имеющих порядки преобразования T=2, 3, …, Tmax соответственно. Как правило, порядок преобразования Tmax=3 является достаточным для большинства приложений, связанных с кодированием звуковых сигналов. Вклады от различных преобразователей 201-2, 201-3, …, 201-Tmax суммируются в 202, давая на выходе комбинированный выходной сигнал преобразователя. В первом варианте осуществления указанная операция суммирования может включать сложение отдельных вкладов. В другом варианте осуществления вклады взвешиваются с различными весами так, чтобы уменьшить влияние добавления нескольких вкладов в определенные частоты. Например, вклады третьего порядка могут добавляться с меньшим коэффициентом усиления, чем вклады второго порядка. Наконец, блок 202 суммирования может добавлять вклады селективно в зависимости от выходной частоты. Например, преобразование первого порядка может использоваться для первого, самого низкого целевого частотного диапазона, а преобразование третьего порядка может использоваться для второго, более высокого целевого частотного диапазона.
Фиг.3 иллюстрирует функционирование такого гармонического преобразователя в частотной области (FD) как одного из индивидуальных блоков 201, т.е. одного из преобразователей 201-T порядка преобразования T. Блок 301 анализирующих фильтров выводит комплексные поддиапазоны, которые подвергаются нелинейной обработке 302, которая модифицирует фазу и/или амплитуду сигнала поддиапазона в соответствии с выбранным порядком преобразования T. Модифицированные поддиапазоны подаются к блоку 303 синтезирующих фильтров, который выводит преобразованные сигналы во временной области. В случае нескольких параллельных преобразователей с разными порядками преобразования, как показано на Фиг.2, некоторые операции блока фильтров могут быть разделены между различными преобразователями 201-2, 201-3, …, 201-Tmax. Разделение операций блока фильтров может осуществляться для анализа или синтеза. В случае совместного синтеза 303, суммирование 202 может выполняться в области поддиапазона, т.е. перед синтезом 303.
Фиг.4 иллюстрирует функционирование обработки скрещивающихся членов 402 в дополнение к прямой обработке 401. Обработка скрещивающихся членов 402 и прямая обработка 401 выполняются параллельно в блоке нелинейной обработки 302 гармонического преобразователя в частотной области по Фиг.3. Преобразованные выходные сигналы комбинируются, например, складываются, обеспечивая совокупный преобразованный сигнал. Комбинирование преобразованных выходных сигналов может заключаться в суперпозиции преобразованных выходных сигналов. Факультативно селективное добавление скрещивающихся членов может быть реализовано при вычислении коэффициента усиления.
Фиг.5 более подробно иллюстрирует функционирование блока прямой обработки 401 по Фиг.4 в гармоническом преобразователе в частотной области по Фиг.3. Блоки (SISO) 401-1, …, 401-n, …, 401-N с одним входом и одним выходом отображают каждый анализируемый поддиапазон из исходного диапазона в один синтезируемый поддиапазон в целевом диапазоне. Согласно Фиг.5 анализируемый поддиапазон с индексом n отображается блоком SISO 401-n в синтезируемый поддиапазон с тем же индексом n. Следует отметить, что частотный диапазон поддиапазона с индексом n в блоке синтезирующих фильтров может варьироваться в зависимости от точной версии, или типа, гармонического преобразования. В версии или типе, показанных на Фиг.5, разнос частот анализирующего блока 301 в T раз меньше, чем разнос частот в синтезирующем блоке 303. Поэтому индекс n в синтезирующем блоке 303 соответствует частоте, которая в T раз больше, чем частота поддиапазона с тем же индексом n в анализируемом диапазоне 301. Например, анализируемый поддиапазон [(n-1)ω, nω] преобразовывается в синтезируемый поддиапазон [(n-1)Tω,nTω].
Фиг.6 иллюстрирует прямую нелинейную обработку единичного поддиапазона, содержащегося в каждом из блоков SISO 401-n. Нелинейная часть блока 601 выполняет умножение фазы комплексного сигнала поддиапазона на коэффициент, равный порядку преобразования T. Необязательный блок усиления 602 модифицирует амплитуду сигнала поддиапазона с модифицированной фазой. В математическом выражении выходной сигнал блока SISO 401-n может быть записан как функция входного сигнала x системы SISO 401-n и коэффициента усиления g следующим образом:
y = g v T , г д е v = x / | x | 1 1 / T ( 1 )
Figure 00000003
Это выражение также может быть записано как
y = g | x | ( x | x | ) T
Figure 00000004
.
Иными словами, фаза комплексного сигнала поддиапазона х умножается на порядок преобразования T, а амплитуда комплексного сигнала поддиапазона x модифицируется посредством коэффициента усиления g.
Фиг.1 иллюстрирует составляющие обработки скрещивающихся членов 402 для гармонического преобразования порядка T. Присутствует T-1 параллельных блоков обработки перекрестных членов 701-1, …, 701-r, … 701-(T-1), выходные сигналы которых суммируются в блоке суммирования 702, давая комбинированный выходной сигнал. Как уже указывалось во вводной части, целью является отображение пары синусоид с частотами (ω, ω+Ω) в синусоиду с частотой (T-r)ω+r(ω+Ω)=Tω+rΩ, где переменная r изменяется в пределах от 1 до T-1. Иными словами, два поддиапазона из блока анализирующих фильтров 301 должны отображаться в один поддиапазон высокочастотного диапазона. Для каждого отдельного значения r и данного порядка преобразования Т этап отображения выполняется в блоке скрещивающихся членов 701-r.
Фиг.8 иллюстрирует функционирование блока обработки скрещивающихся членов 701-r для фиксированного значения r=1, 2, …, T-1. Каждый выходной поддиапазон 803 получается в блоке с множеством входов и одним выходом (MISO) 800-n из двух входных поддиапазонов 801 и 802. Для выходного поддиапазона 803 с индексом n два входных сигнала блока MISO 800-n представляют собой поддиапазоны n-p1 801 и n+p2 802, где p1 и p2 - целые положительные смещения индексов, которые зависят от порядка преобразования T, переменной r и параметра Ω основного тона для усовершенствования посредством перекрестного произведения. Правило нумерации анализируемых и синтезируемых поддиапазонов поддерживается в соответствии с таковым по Фиг.5, т.е. расстояние между частотами анализирующего блока 301 в Т раз меньше, чем расстояние между частотами синтезирующего блока 303, и, соответственно, приведенные выше комментарии, касающиеся изменений коэффициента Т, сохраняют свое значение.
В связи с применением обработки скрещивающихся членов следует рассмотреть следующие замечания. Параметр основного тона Ω не может быть известен с высокой точностью и, конечно, с лучшим частотным разрешением, чем частотное разрешение, получаемое блоком анализирующих фильтров 301. Фактически, в некоторых вариантах осуществления настоящего изобретения лежащий в основе основного тона для усовершенствования посредством перекрестного произведения параметр Ω вообще не вводится в декодер. Вместо этого из перечня возможных кандидатов выбирается избранная пара целочисленных смещений индексов (p1, p2) в соответствии с таким критерием оптимизации, как максимизация выходной амплитуды перекрестного произведения, т.е. максимизация энергии выходного сигнала перекрестного произведения. Например, для заданных значений T и r может использоваться перечень кандидатов, задаваемый формулой (p1,p2)=(r1,(T-r)1), 1 ∈ L, где L - перечень положительных целых чисел. Это более подробно показано ниже в контексте формулы (11). Пригодными в качестве кандидатов, в принципе, являются все положительные целые числа. В некоторых случаях информация об основном тоне может помочь идентифицировать, какой из l следует выбрать в качестве надлежащих смещений индексов.
Кроме того, несмотря на то, что пример обработки перекрестного произведения, показанный на Фиг.8, предполагает, что применяемые смещения индексов (p1, p2) одинаковы для определенного диапазона выходных поддиапазонов, например, синтезируемые поддиапазоны (n-1), n и (n+1) составляются из анализируемых поддиапазонов, находящихся на фиксированном расстоянии p1+p2, это требование не является обязательным. В сущности, смещения индексов (p1, p2) могут отличаться для всех без исключения выходных поддиапазонов. Это означает, что для каждого поддиапазона n может выбираться отличающийся от всех остальных параметр Ω основного тона для усовершенствования посредством перекрестного произведения.
Фиг.9 иллюстрирует нелинейную обработку, содержащуюся в каждом из блоков MISO 800-n. Операция перемножения 901 создает сигнал поддиапазона с фазой, равной взвешенной сумме фаз двух комплексных входных сигналов поддиапазонов, и амплитудой, равной обобщенному среднему значению амплитуд двух дискретных входных значений поддиапазонов. Необязательный блок усиления 902 модифицирует амплитуду дискретных значений поддиапазонов с модифицированной фазой. В математическом описании выходной сигнал у может быть записан как функция входных сигналов блока MISO 800-n u1 801 и u1 802 и коэффициента усиления g следующим образом:
y = g ν 1 T 1 ν 2 T
Figure 00000005
, где ν m = u m / | u m | 1 1 / T д л я m = 1,2 ( 2 )
Figure 00000006
Это также можно записать как
y = μ ( | u 1 | , | u 2 | ) ( u 1 | u 1 | ) T 1 ( u 2 | u 2 | ) T
Figure 00000007
,
где µ(|u1|,|u2|) - функция генерирования амплитуды. Иными словами, фаза комплексного сигнала поддиапазона u1 умножается на порядок преобразования T-r, а фаза комплексного сигнала поддиапазона u2 умножается на порядок преобразования r. Сумма этих двух фаз используется в качестве фазы выходного сигнала y, амплитуда которого получается посредством функции генерирования амплитуды. В сравнении с формулой (2), функция генерирования амплитуды выражается как геометрическое среднее амплитуд, модифицированное коэффициентом усиления g, т.е. μ ( | u 1 | , | u 2 | ) = g | u 1 | 1 1 / T | u 2 | 1 / T
Figure 00000008
. Если допустить, что коэффициент усиления зависит от входных сигналов, оно, несомненно, охватывает все возможные варианты.
Следует отметить, что формула (2) получается в результате лежащей в основе цели - отображения пары синусоид с частотами (ω, ω+Ω) в синусоиду с частотой Tω+rΩ, которая также может быть записана как (T-r)ω+r(ω+Ω).
В нижеследующем тексте будет дано математическое описание настоящего изобретения. Для простоты будут рассматриваться непрерывные во времени сигналы. Предполагается, что блок синтезирующих фильтров 303 достигает совершенной реконструкции из блока 301 комплексных модулированных анализирующих фильтров с симметричной оконной функцией вещественных значений, или фильтром-прототипом, w(t). Блок синтезирующих фильтров в процессе синтеза часто, но не всегда, будет использовать такое же окно. Предполагается, что модуляция относится к равномерно пакетированному типу, при этом шаг по индексу нормируется на единицу, а разнос угловых частот синтезируемых поддиапазонов нормируется на n. Следовательно, целевой сигнал s(t) будет достигаться на выходе блока синтезирующих фильтров, если сигналы поддиапазонов на входе блока синтезирующих фильтров задаются сигналами синтезируемых поддиапазонов yn(k):
y n ( k ) = s ( t ) w ( t k ) exp [ i n π ( t k ) ] d t ( 3 )
Figure 00000009
Следует отметить, что формула (3) представляет собой нормированную стационарную математическую модель традиционных операций в обычном блоке анализирующих фильтров для комплексных модулированных поддиапазонов, такую как обрабатываемое методом окна дискретное преобразование Фурье (DFT), также известное как кратковременное преобразование Фурье (STFT). При небольшой модификации в аргументе комплексного показателя экспоненты в формуле (3) получаются стационарные модели для блока комплексных модулированных квадратурных зеркальных фильтров (QMF) и комплексифицированного модифицированного дискретного косинусного преобразования (Modified Discrete Cosine Transform, CMDCT), также называемого обрабатываемым методом окна неравномерным пакетированным DFT. Для случая непрерывного времени индекс поддиапазона n пробегает по всем неотрицательным целым числам. Для дискретных временных аналогов переменная времени t дискретизируется на этапе 1/N, а индекс поддиапазона n ограничивается N, где N - количество поддиапазонов в блоке фильтров, которое равно шагу блока фильтров по индексу дискретного времени. В случае дискретного времени для операции преобразования также требуется отнесенный к N нормировочный множитель, если он не вводится в масштабирование окна.
Для сигнала с вещественным значением существует столько же комплексных выходных дискретных значений поддиапазонов, сколько существует вещественных входных дискретных значений для выбранной модели блока фильтров. Поэтому существует общая двукратная передискретизация (или избыточность). Также могут использоваться блоки фильтров с большим уровнем передискретизации, однако в настоящем описании для ясности объяснения поддерживается небольшая передискретизация.
Основные этапы, включаемые в анализ блока модулированных фильтров, соответствующий формуле (3), заключаются в том, что сигнал умножается на окно, центрированное около времени t=k, и результирующий обработанный методом окна сигнал является коррелированным с каждой из комплексных синусоид exp[-inπ(t-k)]. В реализациях с дискретным временем эта корреляция эффективно реализуется посредством быстрого преобразования Фурье. Соответствующие алгоритмические этапы блока синтезирующих фильтров хорошо известны специалистам в данной области, и состоят из модуляции синтеза, обработки синтеза методом окна и операций сложения перекрываний.
Фиг.19 иллюстрирует положение во времени и с частотой, соответствующей информации, которую несет дискретное значение поддиапазона yn(k), для выбора значений индекса времени k и индекса поддиапазона n. Например, дискретное значение поддиапазона y5(4) представлено темным прямоугольником 1901.
Для синусоиды s(t)=Acos(ωt+θ)=Re{Cexp(iωt)} сигналы поддиапазонов по формуле (3) для достаточно больших n с хорошим приближением задаются формулой
y n ( k ) = C e i k ω w ( t ) exp [ i ( n π ω ) t ] d t = C e i k ω w ( n π ω ) ( 4 )
Figure 00000010
где «шляпка» обозначает Фурье-преобразование, т.е. w
Figure 00000011
- это Фурье-преобразование оконной функции w.
Строго говоря, формула (4) является истинной, если добавить член с -ω вместо ω. Этим членом пренебрегают на основе предположения о том, что частотная характеристика окна затухает достаточно быстро, и что сумма ω и n не стремится к нулю.
Фиг.20 изображает типичный вид окна w, 2001 и его Фурье-преобразования w
Figure 00000011
2002.
Фиг.21 иллюстрирует анализ единичной синусоиды, соответствующей формуле (4). Поддиапазонами, которые главным образом затрагиваются синусоидой ω, являются поддиапазоны с индексом n, и, таким образом, nπ-ω мал. Для примера по Фиг.21 частота составляет ω=6,25π, что показано горизонтальной штриховой линией 2101. В этом случае три поддиапазона с n=5, 6, 7, представленные, соответственно, ссылочными позициями 2102, 2103, 2104, содержат существенно ненулевые сигналы поддиапазонов. Затенение этих трех поддиапазонов отражает относительную амплитуду комплексных синусоид внутри каждого из поддиапазонов, полученных по формуле (4). Более темный фон означает большую амплитуду. В конкретном примере это означает, что амплитуда поддиапазона 5, т.е. 2102, меньше в сравнении с амплитудой поддиапазона 7, т.е. 2104, которая, в свою очередь, меньше амплитуды поддиапазона 6, т.е. 2103. Важно отметить, что наличие нескольких ненулевых поддиапазонов может вообще являться необходимым для того, чтобы иметь возможность синтезировать высококачественную синусоиду на выходе блока синтезирующих фильтров, особенно в тех случаях, когда окно имеет вид, аналогичный виду окна 2001 на Фиг.20, с относительно короткой длительностью и значительными боковыми лепестками в частоте.
Сигналы синтезируемых поддиапазонов yn(k) также могут быть определены в результате блока анализирующих фильтров 301 и нелинейной обработки, т.е. гармонического преобразователя 302, показанного на Фиг.3. На стороне блока анализирующих фильтров сигналы анализируемых поддиапазонов могут быть представлены как функция исходного сигнала z(t). Для преобразования порядка T к исходному сигналу z(t) прилагается блок комплексных модулированных анализирующих фильтров с окном wT(t)=w(t/T)/T, единичным шагом по индексу и шагом частоты модуляции, который в T раз меньше, чем шаг частоты на синтезирующем блоке. Фиг.22 иллюстрирует вид масштабированного окна wT 2201 и его Фурье-преобразования w T
Figure 00000012
2202. По сравнению с Фиг.20, временное окно 2201 растянуто, а частотное окно 2202 сжато.
Анализ посредством блока модифицированных фильтров в результате дает сигналы анализируемых поддиапазонов xn(k):
x n ( k ) = z ( t ) w T ( t k ) exp [ i n π T ( t k ) ] d t ( 5 )
Figure 00000013
Для синусоиды z(t)=Bcos(ξt+φ)=Re{Dexp(iξt)}, как можно убедиться, сигналы поддиапазонов по формуле (5) для достаточно больших n в хорошем приближении задаются формулой:
X n ( k ) = D exp ( i k ξ ) w ( n π T ξ ) ( 6 )
Figure 00000014
Тогда подача этих сигналов поддиапазонов в гармонический преобразователь 302 и применение закона прямого преобразования по формулам (1)-(6) приводит к формуле:
y ˜ n ( k ) = g D ( D | D | ) T 1 ( w ( n π T ξ ) | w ( n π T ξ ) | ) T 1 exp ( i k T ξ ) w ( n π T ξ ) ( 7 )
Figure 00000015
Сигналы синтезируемых поддиапазонов yn(k), задаваемые формулой (4), и сигналы нелинейных поддиапазонов, получаемые посредством гармонического преобразования y ˜ n ( k )
Figure 00000016
и задаваемые формулой (7), в идеале должны совпадать.
Для нечетных порядков преобразования Т коэффициент в формуле (7), содержащий влияние окна, равен единице, поскольку предполагается, что значение Фурье-преобразование окна является вещественным, а T-1 - четное число. Поэтому формула (7) может быть точно совмещена с формулой (4) с ω=Tξ для всех поддиапазонов так, чтобы выходной сигнал блока синтезирующих фильтров с входными сигналами поддиапазонов, соответствующими формуле (7), представлял собой синусоиду с частотой ω=Tξ, амплитудой A=gB и фазой θ=Tφ, где B и θ определяются по формуле D=Bexp{iφ), которая при подстановке дает g D ( D | D | ) T 1 = g B exp ( i T ϕ )
Figure 00000017
. Таким образом, получается гармоническое преобразование порядка T исходного синусоидального сигнала z(t).
Для четных T совпадение более приблизительно, но оно по-прежнему основывается на части частотной характеристики окна w
Figure 00000011
с положительным значением, которое для симметричного окна с вещественными значениями включает наиболее важный главный лепесток. Это означает, что гармоническое преобразование исходного синусоидального сигнала z(t) получено также и для четных значений T. В частном случае оконной функции Гаусса, w
Figure 00000011
всегда положительно, и, следовательно, для четных и нечетных порядков преобразования отличий в действиях нет.
Аналогично формуле (6), анализ синусоиды с частотой ξ+Ω, т.е. исходного синусоидального сигнала z(t)=B'cos((ξ+Ω)t+φ')=Re{Eexp(i(ξ+Ω)t)} представляет собой
x ' n ( k ) = E exp ( i k ( ξ + Ω ) ) w ( n π T ( ξ + Ω ) ) ( 8 )
Figure 00000018
Поэтому подача двух сигналов поддиапазонов, u1=xn-p1(k), которые соответствуют сигналу 801 по Фиг.8, и u2=x'n+p2(k), который соответствует сигналу 802 по Фиг.8, в обработку скрещивающихся членов 800-n, показанную на Фиг.8, и приложение формулы скрещивающихся членов (2), дает выходной сигнал поддиапазона:
y ˜ n ( k ) = g exp [ i k ( T ξ + r Ω ) ] M ( n , ξ ) ( 9 ) ,
Figure 00000019
где
M ( n , ξ ) = D T 1 E ' | D T 1 E ' | 1 1 / T w ( ( n p 1 ) π T ξ ) T 1 w ( ( n + p 2 ) π T ( ξ + Ω ) ) ' | w ( ( n p 1 ) π T ξ ) T 1 w ( ( n + p 2 ) π T ( ξ + Ω ) ) ' | 1 1 / T ( 10 )
Figure 00000020
Как видно из формулы (9), эволюция фазы выходного сигнала поддиапазона 803 системы MISO 800-n следует за эволюцией фазы при анализе синусоиды с частотой Tξ+rΩ. Это происходит независимо от выбора смещений индексов p1 и p2. Фактически, если сигнал поддиапазона по формуле (9) подается в канал поддиапазона n, соответствующий Tξ+rΩ, т.е. nπ≈Tξ+rΩ, тогда выходной сигнал будет являться вкладом в генерирование синусоиды с частотой Tξ+rΩ. Однако, преимущественно, необходимо удостовериться, что каждый из вкладов является существенным, и что сложение вкладов происходит благоприятным образом. Эти особенности будут обсуждены ниже.
При данном параметре Ω основного тона для усовершенствования посредством перекрестного произведения выбор подходящих смещений индексов p1 и p2 можно сделать так, чтобы комплексная амплитуда M(n, ξ) по формуле (10) приближенно равнялась w ( n π ( T ξ + r Ω ) )
Figure 00000021
для некоторого диапазона поддиапазонов n, и в этом случае конечный выходной сигнал будет приближенно равняться синусоиду на частоте Tξ+rΩ. Первое рассмотрение главных лепестков одновременно задает все три значения (n-p1)π-Tξ, (n+p2)π-T(ξ+Ω) и nπ-(Tξ+rΩ) как малые, что приводит к приближенным равенствам:
p 1 r Ω π
Figure 00000022
и p 2 ( T r ) Ω π ( 11 )
Figure 00000023
Это означает, что при известном параметре Ω основного тона для усовершенствования посредством перекрестного произведения смещения индексов могут приближенно выражаться формулой (11), что, таким образом, позволяет осуществлять простой выбор анализируемых поддиапазонов. Более доскональный анализ влияния выбора смещений индексов p1 и p2 согласно формуле (11) на амплитуду параметра M(n,ξ,) согласно формуле (10) может выполняться в важных специфических случаях оконных функций, таких как оконная функция Гаусса и синусоидальная оконная функция. Нетрудно установить, что требуемая аппроксимация w ( n π ( T ξ + r Ω ) )
Figure 00000021
чрезвычайно хороша для нескольких поддиапазонов с nπ≈Tξ+rΩ.
Следует отметить, что соотношение (11) калибровано для иллюстративной ситуации, в которой Блок 301 анализирующих фильтров имеет разнос угловых частот поддиапазонов π/T. В общем случае результирующая интерпретация формулы (11) состоит в том, что исходная разница между скрещивающимися членами p1+p2 является целым числом, которое приближенно равно базовой основной частоте Ω, измеренной в единицах расстояния между поддиапазонами в блоке анализирующих фильтров, а пара (p1, p2) выбирается как кратная (r, T-r).
Для определения пары смещений индексов (p1, p2) в декодере могут использоваться следующие режимы:
1. Значение Ω может быть получено в процессе кодирования и в прямой форме, с достаточной точностью передано в декодер для получения целочисленных значений p1 и p2 посредством подходящей процедуры округления, которая может следовать следующим принципам:
сумма p1+p2 приближенно равна Ω/Δω, где Δω - разнос угловых частот блока анализирующих фильтров; и
частное p1/p2 выбирается так, чтобы оно было приближенно равно r/(T-r).
2. Для каждого целевого дискретного значения поддиапазона пара смещений индексов (p1, p2) может быть получена в декодере из заранее определенного перечня значений-кандидатов так, чтобы (p1, p2)=(r1, (T-r)1), l∈L, r∈{1, 2, …, Т-1}, где L - перечень положительных целых чисел. Выбор может основываться на оптимизации выходных амплитуд скрещивающихся членов, например на максимизации энергии выходных сигналов скрещивающихся членов.
3. Для каждого целевого дискретного значения поддиапазона пара смещений индексов (p1, p2) должна быть получена из сокращенного перечня значений-кандидатов путем оптимизации выходной амплитуды скрещивающихся членов, где сокращенный перечень значений-кандидатов получается в процессе кодирования и передается в декодер.
Следует отметить, что модификация фазы сигналов поддиапазонов u1 и u2 выполняется с взвешиванием, соответственно, (T-r) и r, но расстояние между индексами p1 и p2 выбирается пропорционально, соответственно, r и (T-r). Поэтому поддиапазон, ближайший к синтезируемому поддиапазону n, подвергается наиболее сильной модификации фазы.
Преимущественный способ осуществления процедуры оптимизации в описанных выше режимах 2 и 3 может заключаться в рассмотрении (max-min)-оптимизации:
max { min } | x n p 1 ( k ) | , | x n + p 2 ( k ) | } : ( p 1, p 2 ) = ( r l , ( T r ) l ) , l L , r { 1,2, , T } } ( 12 )
Figure 00000024
и в использовании победившей пары совместно с соответствующим значением r для построения вклада перекрестного произведения в данный индекс целевого поддиапазона n. В ориентированных на поиск режимах декодера 2 и, частично, 3 добавление скрещивающихся членов для различных значений r, предпочтительно, осуществляется независимо, поскольку существует риск добавления содержимого к каждому диапазону по нескольку раз. Если же, с другой стороны, для выбора поддиапазонов используется основная частота Ω, как в режиме 1, или в допустимых пределах находится лишь узкий диапазон расстояний между индексами поддиапазонов, как может быть в случае режима 2, частного случая многократного добавления содержимого в один и тот же диапазон можно избежать.
Кроме того, также следует отметить, что для описанных выше вариантов осуществления схем обработки скрещивающихся членов может оказаться полезной дополнительная модификация декодером коэффициента усиления перекрестного произведения g. Например, она относится к входным сигналам поддиапазонов u1 и u2 в блок скрещивающихся произведений MISO, задаваемый формулой (2), и к входному сигналу поддиапазона х в блок преобразования SISO, задаваемый формулой (1). Если все три сигнала должны подаваться к одному и тому же выходному синтезируемому поддиапазону, как показано на Фиг.4, где прямая обработка 401 и обработка перекрестного произведения 402 обеспечивают составляющие одного и того же выходного синтезируемого поддиапазона, может оказаться желательным приравнивание коэффициента усиления перекрестного произведения g нулю, т.е. приравнивание нулю блока усиления 902 по Фиг.9, если
min ( | u 1 | , | u 2 | ) < q | x | ( 13 )
Figure 00000025
для заранее заданного порогового значения q>1. Иными словами, добавление перекрестного произведения выполняется только в том случае, когда амплитуда прямого члена входного диапазона |x| мала по сравнению с обоими входными членами перекрестного произведения. В этом контексте x представляет собой дискретное значение анализируемого поддиапазона для прямой обработки членов, которая приводит к выходному сигналу того же синтезируемого поддиапазона, что и рассматриваемое перекрестное произведение. Это может представлять собой предосторожность с целью не допустить дополнительного усиления гармонической составляющей, которая уже была доставлена путем прямого преобразования.
Ниже способ гармонического преобразования, описанный в настоящем документе, будет описан для иллюстративных спектральных конфигураций с целью иллюстрации улучшений относительно текущего уровня техники. Фиг.10 иллюстрирует осуществление прямого гармонического преобразования порядка T=2. Верхняя диаграмма 1001 описывает парциальные частотные составляющие оригинального сигнала вертикальными стрелками, расположенными на уровнях, кратных основной частоте Ω. Она иллюстрирует исходный сигнал, например, на стороне кодировщика. Диаграмма 1001 сегментирована на левосторонний исходный частотный диапазон с парциальными частотами Ω, 2Ω, 3Ω, 4Ω, 5Ω и правосторонний целевой частотный диапазон с парциальными частотами 6Ω, 7Ω, 8Ω. Исходный частотный диапазон, как правило, кодируется и передается в декодер. С другой стороны, правосторонний целевой частотный диапазон, который включает парциальные частоты 6Ω, 7Ω, 8Ω, превышающие частоту перехода 1005 способа HFR, как правило, в декодер не передается. Целью способа гармонического преобразования является реконструкция целевого частотного диапазона, находящегося выше частоты перехода 1005 из исходного сигнала в исходном частотном диапазоне. Соответственно, целевой частотный диапазон и, в частности, парциальные частоты 6Ω, 7Ω, 8Ω на диаграмме 1001 недоступны в качестве входного сигнала в преобразователь.
Как описано выше, целью способа гармонического преобразования является регенерирование составляющих сигнала 6Ω, 7Ω, 8Ω исходного сигнала из частотных составляющих, доступных из исходного частотного диапазона. Нижняя диаграмма 1002 показывает выходной сигнал преобразователя в правостороннем целевом частотном диапазоне. Указанный преобразователь может, например, располагаться на стороне декодера. Парциальные частоты 6Ω и 8Ω регенерируются из парциальных частот 3Ω и 4Ω посредством гармонического преобразования с использованием порядка преобразования T=2. В результате эффекта растягивания спектра при гармоническом преобразовании, показанного здесь пунктирными стрелками 1003 и 1004, целевая парциальная частота 7Ω теряется. Парциальная частота 7Ω не может быть регенерирована с использованием способа гармонического преобразования, на котором базируется текущий уровень техники.
Фигура 11 иллюстрирует осуществление изобретения для гармонического преобразования периодического сигнала в случае, когда гармонический преобразователь второго порядка усовершенствуется единичным скрещивающимся членом, т.е. когда T=2, r=1. Как описано в контексте Фиг.10, преобразователь используется для генерирования парциальных частот 6Ω, 7Ω, 8Ω в целевом частотном диапазоне выше частоты перехода 1105 на нижней диаграмме 1102 из парциальных частот Ω, 2Ω, 3Ω, 4Ω, 5Ω в исходном частотном диапазоне ниже частоты перехода 1105 по диаграмме 1101. В дополнение к выходному сигналу преобразователя на текущем уровне техники по Фиг.10, при комбинировании исходных парциальных частот 3Ω и 4Ω регенерируется парциальная частотная составляющая 7Ω. Осуществление добавления перекрестного произведения отображено штриховыми стрелками 1103 и 1104. В формульном выражении имеется ω=3Ω, поэтому (T-r)ω+r((ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω. Как можно видеть на данном примере, с использованием описанного в данном документе способа высокочастотной реконструкции согласно изобретению могут быть регенерированы все целевые парциальные частоты.
Фиг.12 иллюстрирует возможную реализацию гармонического преобразователя второго порядка в блоке модулированных фильтров для конфигурации спектра по Фиг.10. Условно изображенные частотные характеристики поддиапазонов блока анализирующих фильтров показаны пунктирными линиями, как, например, ссылочная позиция 1206, на верхней диаграмме 1201. Поддиапазоны нумеруются согласно индексам поддиапазонов, некоторые из которых, 5, 10 и 15, показаны на Фиг.12. Для данного примера основная частота Ω равна разносу частот анализируемых поддиапазонов, умноженному на 3,5. Это иллюстрируется тем фактом, что парциальная частота Ω на диаграмме 1201 располагается между двумя поддиапазонами с индексами 3 и 4. Парциальная частота 2Ω располагается в центре поддиапазона с индексом поддиапазона 7 и т.д.
Нижняя диаграмма 1202 показывает регенерированные парциальные частоты 6Ω и 8Ω с условно изображенными частотными характеристиками, как, например, ссылочная позиция 1207, выбранных поддиапазонов блока синтезирующих фильтров. Как описывалось ранее, эти поддиапазоны имеют в T=в 2 раза более грубый разнос частот. Соответственно, частотные характеристики также масштабируются на коэффициент T=2. Как будет описано ниже, способ прямой обработки членов на текущем уровне техники модифицирует фазу каждого анализируемого поддиапазона, т.е. каждого поддиапазона ниже частоты перехода 1205 на диаграмме 1201, на коэффициент T=2 и отображает результат в синтезируемый поддиапазон с тем же индексом, т.е. в поддиапазон выше частоты перехода 1205 на диаграмме 1202. Это символически изображается на Фиг.12 диагональными пунктирными стрелками, например, стрелкой 1208 для анализируемого поддиапазона 1206 и синтезируемого поддиапазона 1207. Результатом прямой обработки членов для поддиапазонов с индексами поддиапазонов 9-16 из анализируемого поддиапазона 1201 является регенерирование двух целевых парциальных частот 6Ω и 8Ω в синтезируемом поддиапазоне 1202 из исходных парциальных частот 3Ω и 4Ω. Как видно из Фиг.12, основной вклад в целевую парциальную частоту 6Ω вносится поддиапазонами с индексами поддиапазонов 10 и 11, т.е. ссылочными позициями 1209 и 1210, а основной вклад в целевую парциальную частоту 8Ω вносится поддиапазоном с индексом поддиапазона 14, т.е. ссылочной позицией 1211.
Фиг.13 иллюстрирует возможную реализацию дополнительного этапа обработки скрещивающихся членов в блоке модулированных фильтров по Фиг.12. Этап обработки скрещивающихся членов соответствует этапу, описанному в связи с Фиг.11 для периодических сигналов с основной частотой Ω. Верхняя диаграмма 1301 иллюстрирует анализируемые поддиапазоны, исходный частотный диапазон которых нужно преобразовать в целевой частотный диапазон синтезируемых поддиапазонов на нижней диаграмме 1302. В частном случае рассматривается генерирование синтезируемых поддиапазонов 1315 и 1316, которые окружают парциальную частоту 7Ω. Для порядка преобразования T=2 можно выбрать возможное значение r=1. Выбор перечня значений-кандидатов (p1, p2) как кратных (r, T-r)=(1,1), так, чтобы сумма p1+p2 приближенно равнялась Ω Δ ω = Ω ( Ω / 3,5 ) = 3,5,
Figure 00000026
т.е. основной частоте Ω в единицах разноса частот анализируемых поддиапазонов, приводит к выбору p1=p2=2. Как было описано в контексте Фиг.8, синтезируемый поддиапазон с индексом поддиапазона n может генерироваться из произведения перекрестных членов анализируемых поддиапазонов с индексами поддиапазонов (n-p1) и (n+p2). Следовательно, для синтезируемого поддиапазона с индексом поддиапазона 12, т.е. для ссылочной позиции 1315, перекрестное произведение формируется из анализируемых поддиапазонов с индексами поддиапазонов (n-p1)=12-2=10, т.е. из ссылочной позиции 1311, и (n+p2)=12+2=14, т.е. из ссылочной позиции 1313. Для синтезируемого поддиапазона с индексом поддиапазона 13 перекрестное произведение формируется из анализируемых поддиапазонов с индексами поддиапазонов (n-p1)=13-2=11, т.е. из ссылочной позиции 1312, и (n+p2)=13+2=15, т.е. из ссылочной позиции 1314. Процесс генерирования перекрестного произведения символически изображается парами штриховых/пунктирных стрелок, т.е. парами ссылочных позиций, соответственно, 1308, 1309 и 1306, 1307.
Как видно из Фиг.13, парциальная частота 7Ω первоначально размещается в поддиапазоне 1315 с индексом 12 и только во вторую очередь - в поддиапазоне 1316 с индексом 13. Следовательно, для получения более реалистичных частотных характеристик, около синтезируемого поддиапазона 1315 с индексом 12 будет больше прямых и/или скрещивающихся членов, добавление которых к высококачественной синусоиде с частотой (T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω более выгодно, чем добавление членов около синтезируемого поддиапазона 1316 с индексом 13. Кроме того, как подчеркивалось в контексте формулы (13), добавление всех скрещивающихся членов с p1=p2=2 вслепую может приводить к нежелательным составляющим сигнала для менее периодических и теоретических входных сигналов. Соответственно, явление неблагоприятных составляющих сигнала может потребовать применения такого адаптивного правила компенсации перекрестных произведений, как, например, правило, даваемое формулой (13).
Фиг.14 иллюстрирует осуществление гармонического преобразования порядка T=3 согласно текущему уровню техники. Верхняя диаграмма 1401 изображает парциальные частотные составляющие оригинального сигнала вертикальными стрелками, расположенными на уровнях, кратных основной частоте Ω. Парциальные частоты 6Ω, 7Ω, 8Ω, 9Ω находятся в целевом диапазоне выше частоты перехода 1405 способа высокочастотной реконструкции и поэтому недоступны в качестве входных сигналов преобразователя. Целью гармонического преобразования является регенерирование этих составляющих из сигнала в исходном диапазоне. Нижняя диаграмма 1402 показывает выходной сигнал преобразователя в целевом частотном диапазоне. Парциальные частоты 6Ω, т.е. ссылочная позиция 1407, и 9Ω, т.е. ссылочная позиция 1410, регенерируются из парциальных частот 2Ω, т.е. из ссылочной позиции 1406, и 3Ω, т.е. из ссылочной позиции 1409. В результате эффекта растягивания спектра при гармоническом преобразовании, показанного здесь пунктирными стрелками, соответственно, 1408 и 1411, целевые парциальные частоты 7Ω и 8Ω теряются.
Фиг.15 иллюстрирует осуществление изобретения для гармонического преобразования периодического сигнала в случае, когда гармонический преобразователь третьего порядка усовершенствуется двумя отличающимися скрещивающимися членами, т.е. T=3, r=1, 2. В дополнение к преобразователю согласно текущему уровню техники по Фиг.14 из комбинации исходных парциальных частот 1506 с частотой 2Ω и 1507 с частотой 3Ω посредством скрещивающегося члена для r=1 регенерируется парциальная частотная составляющая 1508 с частотой 7Ω. Выполнение добавления перекрестного произведения изображено штриховыми стрелками 1510 и 1511. В формульном выражении имеется ω=2Ω, (T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω. Аналогично парциальная частотная составляющая 1509 с частотой 8Ω регенерируется посредством скрещивающегося члена для r=2. Парциальная частотная составляющая 1509 в целевом диапазоне нижней диаграммы 1502 генерируется из парциальных частотных составляющих 1506 с частотой 2Ω и 1507 с частотой 3Ω в исходном частотном диапазоне верхней диаграммы 1501. Генерирование произведения скрещивающихся членов изображено стрелками 1512 и 1513. В формульном выражении имеется (T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+2Ω=8Ω. Как можно видеть, с использованием описанного в настоящем документе способа высокочастотной реконструкции могут быть регенерированы все целевые парциальные частоты.
Фиг.16 иллюстрирует возможную реализацию гармонического преобразователя третьего порядка согласно текущему уровню техники в блоке модулированных фильтров для спектральной ситуации по Фиг.14. Условно изображенные частотные характеристики поддиапазонов блока анализирующих фильтров показаны пунктирными линиями на верхней диаграмме 1601. Поддиапазоны пронумерованы в соответствии с индексами поддиапазонов 1-17, из которых с целью иллюстрации производится отсылка к поддиапазонам 1606 с индексом 7, 1607 с индексом 10 и 1608 с индексом 11. Для данного примера основная частота Ω равна разносу частот анализируемых поддиапазонов Δω, умноженному на 3,5. Нижняя диаграмма 1602 показывает регенерированные парциальные частоты в суперпозиции с условно обозначаемыми частотными характеристиками выбранных поддиапазонов блока синтезирующих фильтров. Например, производится отсылка к поддиапазонам 1609 с индексом поддиапазона 7, 1610 с индексом поддиапазона 10 и 1611 с индексом поддиапазона 11. Как было описано выше, эти поддиапазоны имеют в T=3 раза более грубый разнос частот Δω. Соответственно, надлежащим образом масштабированы частотные характеристики.
Прямая обработка членов согласно текущему уровню техники модифицирует фазу сигналов поддиапазонов посредством коэффициента T=3 для каждого анализируемого поддиапазона и отображает результат в синтезируемый поддиапазон с тем же индексом, что символически изображается диагональными пунктирными стрелками. Результатом прямой обработки членов для поддиапазонов 6-11 является регенерирование двух целевых парциальных частот 6Ω и 9Ω из исходных парциальных частот 2Ω и 3Ω. Как видно из Фиг.16, основной вклад в целевую парциальную частоту 6Ω вносится поддиапазоном с индексом 7, т.е. ссылочной позицией 1606, а основные вклады в целевую парциальную частоту 9Ω вносятся поддиапазонами с индексами 10 и 11, т.е. ссылочными позициями 1607 и 1608 соответственно.
Фиг.17 иллюстрирует возможную реализацию дополнительного этапа обработки скрещивающихся членов для r=1 в блоке модулированных фильтров по Фиг.16, который приводит к регенерированию парциальной частоты 7Ω. Как было описано в контексте Фиг.8, смещения индексов (p1, p2) могут быть выбраны как кратные (r, T-r)=(1,2) так, чтобы сумма p1+p2 приближенно равнялась 3,5, т.е. основной частоте Ω в единицах разноса частот анализируемых поддиапазонов Δω. Иными словами, относительное расстояние, т.е. расстояние на оси частот, разделенной разносом частот анализируемых поддиапазонов Δω, между двумя анализируемыми поддиапазонами, вносящими вклад в синтетический поддиапазон, который необходимо генерировать, должно наилучшим образом аппроксимировать основную частоту, т.е. основную частоту Ω, деленную на разнос частот анализируемых поддиапазонов Δω. Это также описывается формулами (11) и приводит к выбору p1=1, p2=2.
Как показано на Фиг.17, синтезируемый поддиапазон с индексом 8, т.е. ссылочная позиция 1710, получается из перекрестного произведения, сформированного из аналитических поддиапазонов с индексами (n-p1)=8-1=7, т.е. из ссылочной позиции 1706, и (n+p2)=8+2=10, т.е. из ссылочной позиции 1708. Для синтезируемого поддиапазона с индексом 9 перекрестное произведение формируется из анализируемых поддиапазонов с индексами (n-p1)=9-1=8, т.е. из ссылочной позиции 1707, и (n+p2)=9+2=11, т.е. из ссылочной позиции 1709. Процесс формирования перекрестных произведений символически изображен парами диагональных штриховых/пунктирных стрелок, т.е. парами стрелок 1712, 1713 и 1714, 1715 соответственно. Из Фиг.17 можно видеть, что парциальная частота 7Ω более выраженно располагается в поддиапазоне 1710, чем в поддиапазоне 1711. Следовательно, можно ожидать, что, при реалистичных характеристиках фильтров, около синтезируемого поддиапазона с индексом 8, т.е. поддиапазона 1710, будет больше скрещивающихся членов, добавление которых к высококачественной синусоиде с частотой (T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω будет более выгодно.
Фиг.18 иллюстрирует возможную реализацию дополнительного этапа обработки скрещивающихся членов для r=2 в блоке модулированных фильтров по Фиг.16, который приводит к регенерированию парциальной частоты 8Ω. Смещения индексов (p1, p2) могут быть выбраны как кратные (r, T-r)=(2,1) так, чтобы сумма p1+p2 приближенно равнялась 3,5, т.е. основной частоте Ω в единицах разноса частот анализируемых поддиапазонов Δω. Это приводит к выбору p1=2, p2=1. Как показано на Фиг.18, синтезируемый поддиапазон с индексом 9, т.е. ссылочная позиция 1810, получается из перекрестного произведения, сформированного из аналитических поддиапазонов с индексами (n-p1)=9-2=7, т.е. из ссылочной позиции 1806, и (n+p2)=9+1=10, т.е. из ссылочной позиции 1808. Для синтезируемого поддиапазона с индексом 10 перекрестное произведение формируется из анализируемых поддиапазонов с индексами (n-p1)=10-2=8, т.е. из ссылочной позиции 1807, и (n+p2)=10+1=11, т.е. из ссылочной позиции 1809. Процесс формирования перекрестных произведений символически изображен парами диагональных штриховых/пунктирных стрелок, т.е. парами стрелок 1812, 1813 и 1814, 1815 соответственно. Из Фиг.18 можно видеть, что парциальная частота 8Ω несколько более выраженно располагается в поддиапазоне 1810, чем в поддиапазоне 1811. Следовательно, можно ожидать, что, при реалистичных характеристиках фильтров, около синтезируемого поддиапазона с индексом 9, т.е. поддиапазона 1810, будет больше прямых и/или скрещивающихся членов, добавление которых к высококачественной синусоиде с частотой (T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+2Ω=8Ω будет более выгодно.
Ниже производится отсылка к Фигурам 23 и 24, которые иллюстрируют процедуру выбора на основе (max-min)-оптимизации по формуле (12) для пары смещений индексов (p1, p2) и r согласно этому правилу для T=3. Выбранный индекс целевого поддиапазона n=18, а верхняя диаграмма показывает пример амплитуды сигнала поддиапазона для заданного временного индекса. Перечень положительных целых чисел задается здесь семью значениями L={2, 3, …, 8}.
Фиг.23 иллюстрирует поиск кандидатов при r=1. Целевой, или синтезируемый, поддиапазон показан с индексом n=18. Пунктирная линия 2301 выделяет поддиапазон с индексом n=18 в высоком диапазоне анализируемых поддиапазонов и нижнем диапазоне синтезируемых поддиапазонов. Возможными парами смещений индексов являются пары (p1, p2)={(2,4), (3,6), …, (8,16)} для l=2, 3, …, 8, соответственно, и соответствующими парами индексов дискретных значений амплитуды анализируемых поддиапазонов, т.е. перечнем пар индексов поддиапазонов, которые рассматриваются как определяющие оптимальный скрещивающийся член, являются {(16,22), (15,24), …, (10,34)}. Ряд стрелок иллюстрирует рассматриваемые пары. Например, показана пара (15, 24), обозначенная ссылочными позициями 2302 и 2303. Нахождение минимума для этих пар амплитуд дает перечень (0, 4, 1,0, 0, 0, 0) соответствующих минимальных пар амплитуд для перечня возможных скрещивающихся членов. Поскольку второй элемент для l=3 является максимальным, пара (15, 24) побеждает среди кандидатов с r=1, и выбор изображен толстыми стрелками.
Фиг.24 сходным образом иллюстрирует поиск кандидатов с r=2. Целевой, или синтезируемый, поддиапазон показан с индексом n=18. Пунктирная линия 2401 выделяет поддиапазон с индексом n=18 в высоком диапазоне анализируемых поддиапазонов и в нижнем диапазоне синтезируемых поддиапазонов. В этом случае, возможными парами смещений индексов являются пары (p1, p2)={(4,2), (6,3), …, (16,8)}, и соответствующими парами индексов дискретных амплитуд анализируемых поддиапазонов являются пары {(14,20), (12,21), …, (2,26)}, среди которых пара (6, 24) представлена ссылочными позициями 2402 и 2403. Нахождение минимума для этих пар амплитуд дает перечень (0, 0, 0, 0, 3, 1, 0). Поскольку пятый элемент является максимальным, т.е. l=6, пара (6, 24) побеждает среди кандидатов с r=2, как показано толстыми стрелками. В целом, поскольку минимум соответствующей пары амплитуд меньше, чем минимум для выбранной пары поддиапазонов при r=1, окончательный выбор для индекса целевого поддиапазона n=18 падает на пару (15, 24)и r=1.
Кроме того, следует отметить, что, когда входной сигнал z(t) представляет собой гармонический ряд с основной частотой Ω, т.е. с основной частотой, которая соответствует параметру основного тона для усовершенствования посредством перекрестного произведения, и Ω достаточно велика по сравнению с разрешением по частоте блока анализирующих фильтров, сигналы анализируемых поддиапазонов x'n(k)„ задаваемые формулой (8), являются хорошими приближениями анализа входного сигнала z(t), где приближение является действительным в различных диапазонах поддиапазонов. Из сопоставления формулы (6) и формул (8-10) следует, что эволюция фазы гармоники вдоль оси частот входного сигнала z(t) будет корректно экстраполироваться настоящим изобретением. С точки зрения качества выходного звукового сигнала это является привлекательной особенностью для сигналов, имеющих характер последовательности импульсов, как, например, сигналы, вызванные человеческими голосами и некоторыми музыкальными инструментами.
Фиг.25, 26 и 27 иллюстрируют функционирование иллюстративной реализации преобразования согласно изобретению для гармонического сигнала в случае Т=3. Сигнал имеет основную частоту 282,35 Гц, спектр его амплитуды в рассматриваемом целевом диапазоне 10-15 кГц изображен на Фиг.25. Для реализации преобразований используется блок фильтров из N=512 поддиапазонов на частоте дискретизации 48 КГц. Спектр амплитуды выходного сигнала прямого преобразователя (T=3) изображен на Фиг.26. Как можно видеть, каждая третья гармоника воспроизводится с высокой точностью, как и предсказывает описанная выше теория, и воспринимаемым основным тоном будет основной тон 847 Гц, в три раза больший оригинального тона. Фиг.27 показывает выходной сигнал преобразователя, применяющего произведения скрещивающихся членов. Все гармоники воссоздаются вплоть до дефектов, связанных с особенностями приближений теории. В этом случае боковые лепестки находятся примерно на 40 Дб ниже уровня сигнала, и этого более, чем достаточно для регенерации высокочастотного содержимого, которое воспринимается неотличимо от оригинального гармонического сигнала.
Ниже делается отсылка к Фиг.28 и Фиг.29, которые иллюстрируют, соответственно, иллюстративный кодировщик 2800 и иллюстративный декодер 2900 для унифицированного кодирования речи и звука (USAC). Общая конструкция кодировщика USAC 2800 и декодера 2900 описывается следующим образом: в первую очередь - традиционная пред / постобработка, содержащая функциональный блок MPEG Surround (MPEGS), предназначенный для операций по обработке стереофонических и многоканальных сигналов, и усовершенствованные блоки SBR (eSBR) 2801 и 2901 соответственно, которые оперируют с параметрическим представлением более высоких звуковых частот входного сигнала и могут применять способы гармонического преобразования, описываемые в настоящем документе. Затем - две ветви, одна из которых состоит из траектории инструмента модифицированного перспективного звукового кодирования (Advanced Audio Coding, AAC), а вторая состоит из траектории на основе линейного предсказания (в области LP или LPC), которое, в свою очередь, характеризуется представлением остаточного продукта кодирования с линейным предсказанием (LPC) в частотной и временной областях. Все передаваемые спектры, как AAC, так и LPC, могут быть представлены в области MDCT с последующим квантованием и арифметическим кодированием. Представление во временной области использует схему кодового возбуждения ACELP.
Усовершенствованный блок репликации спектральных полос (eSBR) 2801 кодировщика 2800 может включать системы высокочастотной реконструкции, описанные в настоящем документе. В частности, блок eSBR 2801 может включать блок 301 анализирующих фильтров, предназначенный для генерирования ряда сигналов анализируемых поддиапазонов. Сигналы анализируемых поддиапазонов могут затем преобразовываться в блоке нелинейной обработки 302, генерируя ряд сигналов синтезируемых поддиапазонов, которые затем могут вводиться в блок синтезирующих фильтров 303 для генерирования высокочастотной составляющей. В блоке eSBR 2801 на стороне кодирования может определяться набор информации о том, как генерировать высокочастотную составляющую из низкочастотной составляющей так, чтобы высокочастотная составляющая наилучшим образом совпадала з высокочастотной составляющей оригинального сигнала. Набор информации может включать информацию о характеристиках сигнала, таких как преобладающая основная частота Ω, огибающая спектра высокочастотной составляющей, и информацию о том, как лучше всего комбинировать сигналы анализируемых поддиапазонов, т.е. такую информацию, как ограниченный набор пар смещений индексов (p1, p2). Кодированные данные, относящиеся к указанному набору информации, объединяются с другой кодированной информацией в мультиплексоре битового потока и направляются в виде кодированного потока аудиоданных в соответствующий декодер 2900.
Декодер 2900, показанный на Фиг.29, также включает усовершенствованный блок репликации спектральных полос (eSBR) 2901. Блок eSBR 2901 принимает кодированный поток аудиоданных, или кодированный сигнал, из кодировщика 2800 и использует способы, описанные в настоящем документе, для генерирования высокочастотной составляющей сигнала, которая объединена с кодированной низкочастотной составляющей, давая на выходе декодированный сигнал. Блок eSBR 2901 может включать различные компоненты, описанные в настоящем документе. В частности, он может включать блок 301 анализирующих фильтров, блок нелинейной обработки 302 и блок синтезирующих фильтров 303. Блок eSBR 2901 может использовать информацию о высокочастотной составляющей, предоставляемую кодировщиком 2800, для выполнения высокочастотной реконструкции. Эта информация может представлять собой основную частоту Ω сигнала, огибающую спектра оригинальной высокочастотной составляющей и/или информацию об анализируемых поддиапазонах, которые будут использоваться для генерирования сигналов синтезируемых поддиапазонов и, в особенности, высокочастотной составляющей декодированного сигнала.
Кроме того, Фиг.28 и 29 иллюстрируют возможные дополнительные компоненты кодировщика/декодера USAC, такие как:
инструмент демультиплексора полезной нагрузки битового потока, который разделяет полезную нагрузку битового потока на части для каждого инструмента и обеспечивает каждый из инструментов информацией о полезной нагрузке битового потока, связанной с данным инструментом;
инструмент декодирования масштабных коэффициентов с пониженным уровнем шума, который получает информацию из демультиплексора полезной нагрузки битового потока, выполняет грамматический разбор этой информации и декодирует масштабные коэффициенты, кодированные методами Хаффмана и DPCM;
инструмент декодирования спектра с пониженным уровнем шума, который получает информацию из демультиплексора полезной нагрузки битового потока, выполняет грамматический разбор этой информации, декодирует арифметически кодированные данные и реконструирует квантованные спектры;
инструмент обратного квантователя, который получает квантованные значения спектра и преобразовывает целочисленные значения в немасштабированные реконструированные спектры; данный квантователь предпочительно представляет собой компандирующий квантователь, коэффициент компандирования которого зависит от выбранного режима базового кодирования;
инструмент заполнения шума, который используется для заполнения спектральных разрывов в декодированных спектрах, которые возникают при квантовании спектральных значений в нуль, например, из-за сильного ограничения, налагаемого в кодировщике на битовые требования;
инструмент изменения масштаба, который преобразовывает целочисленное представление масштабных коэффициентов в фактические значения и умножает немасштабированные спектры, подвергнутые обратному квантованию, на соответствующие масштабные коэффициенты;
инструмент M/S, описанный в стандарте ISO/IEC 14496-3;
инструмент временной фильтрации и преобразования шума (TNS), описанный в стандарте ISO/IEC 14496-3;
блок фильтров / инструмент коммутатора блокировки, который применяет инверсию отображения частот, которая была проведена в кодировщике; для инструмента блока фильтров предпочтительно используется обратное модифицированное дискретное косинусное преобразование (IMDCT);
блок фильтров с деформацией шкалы времени / инструмент коммутатора блокировки, который замещает нормальный инструмент переключения блока фильтров при активации режима деформации шкалы времени; данный блок фильтров, предпочтительно, аналогичен (IMDCT) нормальному блоку фильтров с добавлением отображения дискретных значений во временной области, обрабатываемых методом окна, из области деформированной шкалы времени в линейную временную область путем зависящей от времени передискретизации;
инструмент MPEG Surround (MPEGS), который создает набор сигналов из одного или нескольких входных сигналов, применяя к входному (входным) сигналу (сигналам) сложную процедуру повышающего микширования, управляемую соответствующими пространственными параметрами; в контексте USAC, MPEGS предпочтительно используется для кодирования многоканального сигнала путем передачи сопутствующей параметрической информации совместно с передаваемым низведенным сигналом;
инструмент классификатора сигналов, который анализирует оригинальный входной сигнал и генерирует из него управляющую информацию, которая запускает выбор различных режимов кодирования; анализ входного сигнала, как правило, зависит от реализации и будет пытаться выбрать оптимальный режим базового кодирования для данного цикла входного сигнала; выходной сигнал классификатора сигналов может, необязательно, использоваться также и для влияния на поведение других инструментов, например, MPEG Surround, усовершенствованного SBR, блока фильтров с деформацией шкалы времени и др.;
инструмент фильтра LPC, который создает сигнал во временной области из сигнала в области возбуждений путем фильтрации реконструированного сигнала возбуждения через фильтр синтеза с линейным предсказанием; и
инструмент ACELP, который обеспечивает способ эффективного представления сигнала возбуждения во временной области путем комбинирования долговременного предсказателя (адаптивного кодового слова) с импульсовидной последовательностью (порождающего кодового слова).
Фиг.30 иллюстрирует вариант осуществления блоков eSBR, показанных на Фиг.28 и 29. Блок eSBR 3000 ниже будет описан в контексте декодера, где входной сигнал блока eSBR 3000 представляет собой низкочастотную составляющую, также известную как нижний диапазон, сигнала и, возможно, дополнительную информацию, относящуюся к специфическим характеристикам сигнала, таким как, например, основная частота Q и/или возможные значения смещений индексов (p1, p2). На стороне кодировщика входной сигнал блока eSBR, как правило, будет представлять собой полный сигнал, в то время как выходным сигналом будет дополнительная информация, относящаяся к характеристикам сигнала и/или значениям смещений индексов.
На Фиг.30 низкочастотная составляющая 3013 подается в блок фильтров QMF с целью генерирования частотных диапазонов QMF. Частотные диапазоны QMF не следует ошибочно принимать за анализируемые поддиапазоны, описываемые в настоящем документе. Частотные диапазоны QMF используются с целью манипуляций и объединения низко- и высокочастотной составляющих сигнала в частотной области, а не во временной. Низкочастотная составляющая 3014 подается в блок преобразования 3004, который относится к системам высокочастотной реконструкции, описанным в настоящем документе. Блок преобразования также может получать дополнительную информацию 3011, такую как основная частота Ω кодированного сигнала и/или возможные значения пар смещений индексов (p1, p2) для выбора поддиапазонов. Блок преобразования 3004 генерирует высокочастотную составляющую 3012, также известную как высокий диапазон сигнала, которая преобразовывается в частотную область блоком фильтров QMF 3003. Обе преобразованные в область QMF составляющие, низкочастотная и высокочастотная, подаются в блок манипуляций и объединения 3005. Блок 3005 может выполнять коррекцию огибающей высокочастотной составляющей и комбинирует скорректированную высокочастотную составляющую и низкочастотную составляющую. Комбинированный выходной сигнал преобразовывается обратно во временную область блоком обратных фильтров QMF 3001.
Как правило, блоки фильтров QMF включают 64 частотных диапазона QMF. Следует, однако, отметить, что может оказаться полезной понижающая дискретизация низкочастотной составляющей 3013 так, чтобы блок фильтров QMF 3002 требовал лишь 32 частотных диапазона QMF. В этом случае низкочастотная составляющая 3013 имеет ширину полосы пропускания fs/4, где fs - частота дискретизации сигнала. С другой стороны, высокочастотная составляющая 3012 имеет полосу пропускания fs/2.
Способ и система, описанные в настоящем документе, могут быть реализованы как программное обеспечение, встроенное программное обеспечение и/или аппаратное обеспечение. Некоторые компоненты могут, например, быть реализованы как программное обеспечение, которое запускается в процессоре или микропроцессоре цифровой обработки сигналов. Другие компоненты могут, например, быть реализованы как аппаратные средства и/или специализированные интегральные микросхемы. Сигналы, встречающиеся в описанных способах и системах, могут храниться на носителях данных, таких как память с произвольным доступом (оперативная память) или оптические запоминающие устройства. Они могут передаваться посредством сетей, таких как радиосеть, спутниковые сети связи, беспроводные сети или проводные сети, например, через Интернет. Типичные устройства, использующие способ и систему, описанные в настоящем документе, представляют собой дополнительные внешние устройства и другое оборудование на территории пользователя, которое декодирует звуковые сигналы. На стороне кодирования способ и система могут использоваться как радиовещательные станции, например, в головных узлах видеосистем.
Настоящий документ описывает способ и систему для выполнения высокочастотной реконструкции сигнала на основе низкочастотной составляющей сигнала. Используя комбинации поддиапазонов из низкочастотной составляющей, способ и система позволяют реконструировать частоты и диапазоны частот, которые не могут быть генерированы способами преобразования, известными на текущем уровне техники. Кроме того, описанные способ и система HTR позволяют использовать низкие частоты перехода и/или генерирование больших высокочастотных диапазонов из узких низкочастотных диапазонов.

Claims (29)

1. Система для генерирования высокочастотной составляющей звукового сигнала из низкочастотной составляющей звукового сигнала, которая содержит:
- блок (301) анализирующих фильтров, создающий набор сигналов анализируемых поддиапазонов низкочастотной составляющей звукового сигнала;
- блок (302) нелинейной обработки, содержащий блок (800-n) преобразования первого порядка (Т-r) и второго порядка r со многими входами и одним выходом, где Т>1; 1≤r<Т, предназначенный для генерирования сигнала (803) синтезируемого поддиапазона с синтезированной частотой (Т-r)ω+r(ω+Ω) путем:
- умножения фазы первого сигнала (801) анализируемого поддиапазона из набора сигналов анализируемых поддиапазонов с первой анализируемой частотой ω на первый порядок преобразования (Т-r);
- умножения фазы второго сигнала (802) анализируемого поддиапазона из набора сигналов анализируемых поддиапазонов со второй анализируемой частотой (ω+Ω) на второй порядок преобразования r и
- комбинирования первого и второго сигналов анализируемых поддиапазонов с умноженными фазами для получения сигнала (803) синтезируемого поддиапазона; и
- блок (303) синтезирующих фильтров, предназначенный для генерирования высокочастотной составляющей звукового сигнала из сигнала синтезируемого поддиапазона.
2. Система по п.1, которая также содержит:
- блок (902) усиления, предназначенный для умножения сигнала (803) синтезируемого поддиапазона на коэффициент усиления.
3. Система по любому из предыдущих пунктов, отличающаяся тем, что блок (302) нелинейной обработки содержит:
- набор блоков (800-n) со многими входами и одним выходом, которые генерируют набор парциальных сигналов (803) синтезируемых поддиапазонов с синтезируемой частотой; и
- блок (702) суммирования поддиапазонов, предназначенный для комбинирования набора парциальных сигналов синтезируемых поддиапазонов.
4. Система по любому из пп.1 и 2, отличающаяся тем, что блок (302) нелинейной обработки также содержит:
- блок (401) прямой обработки, предназначенный для генерирования дополнительного сигнала синтезируемого поддиапазона из третьего сигнала анализируемого поддиапазона из набора сигналов анализируемых поддиапазонов; и
- блок суммирования поддиапазонов, предназначенный для комбинирования сигналов синтезируемых поддиапазонов с синтезируемой частотой.
5. Система по п.4, отличающаяся тем, что
- блок суммирования поддиапазонов игнорирует сигналы синтезируемых поддиапазонов, генерируемые в блоках (800-n) со многими входами и одним выходом, если минимум абсолютного значения первого (801) и второго (802) сигналов анализируемых поддиапазонов меньше заранее заданной доли абсолютного значения сигнала.
6. Система по п.4, отличающаяся тем, что блок (401) прямой обработки содержит:
- блок (401-n) третьего порядка преобразования Т' с одним входом и одним выходом, генерирующий сигнал синтезируемого поддиапазона из третьего сигнала анализируемого поддиапазона, проявляющего третью анализируемую частоту, где
- третий сигнал анализируемого поддиапазона является сигналом с фазой, модифицированной посредством третьего порядка преобразования Т'; Т' больше единицы; и
- синтезируемая частота соответствует третьей анализируемой частоте, умноженной на третий порядок преобразования.
7. Система по п.6, отличающаяся тем, что
- звуковой сигнал содержит основную частоту и
- блок (301) анализирующих фильтров проявляет разнос частот, который связан с основной частотой звукового сигнала.
8. Система по п.6, отличающаяся тем, что
- блок (301) анализирующих фильтров содержит N анализируемых поддиапазонов с практически постоянным расстоянием Δω между поддиапазонами;
- анализируемый поддиапазон связан с индексом n анализируемого поддиапазона, где n∈{1,…,N};
- блок (303) синтезирующих фильтров содержит синтезируемый поддиапазон;
- синтезируемый поддиапазон связан с индексом n синтезируемого поддиапазона и
- каждый синтезируемый поддиапазон и анализируемый поддиапазон с индексом n содержат диапазоны частот, которые соотносятся друг с другом посредством коэффициента Т.
9. Система по п.8, отличающаяся тем, что дополнительно содержит блок выбора индексов, предназначенных для выбора индексов p1 и р2, где:
- сигнал (803) синтезируемого поддиапазона связан с синтезируемым поддиапазоном посредством индекса n;
- первый сигнал (801) анализируемого поддиапазона связан с анализируемым поддиапазоном посредством индекса n-p1;
- второй сигнал (802) анализируемого поддиапазона связан с анализируемым поддиапазоном посредством индекса n+р2.
10. Система по п.9, отличающаяся тем, что
- блок выбора индексов пригоден для выбора смещений индексов p1 и р2 из ограниченного перечня пар (p1, р2), который хранится в блоке хранения индексов.
11. Система по п.10, отличающаяся тем, что
- блок выбора индексов пригоден для выбора пары (p1, р2) так, чтобы минимальное значение набора, включающего абсолютное значение сигнала первого анализируемого поддиапазона и абсолютное значение сигнала второго анализируемого поддиапазона, было максимизировано.
12. Система по п.9, отличающаяся тем, что блок выбора индексов пригоден для определения ограниченного перечня пар (p1, р2) так, чтобы
- смещение индекса p1=r·I;
- смещение индекса р2=(Т-r)·I и
- I - положительное целое число.
13. Система по п.12, отличающаяся тем, что
- блок выбора индексов пригоден для выбора параметров I и r так, чтобы минимальное значение набора, включающего абсолютное значение сигнала первого анализируемого поддиапазона и абсолютное значение сигнала второго анализируемого поддиапазона, было максимизировано.
14. Система по п.9, отличающаяся тем, что блок выбора индексов пригоден для выбора смещений индексов p1 и р2 на основе характеристик сигнала.
15. Система по п.14, отличающаяся тем, что
- звуковой сигнал содержит основную частоту Ω;
- блок выбора индексов пригоден для выбора смещений индексов p1 и р2 так, чтобы
- сумма смещений индексов p1+p2 приблизительно равнялась частному Ω/Δω и
- частное p1/p2 было кратно r/(Т-r).
16. Система по п.14, отличающаяся тем, что
- звуковой сигнал содержит основную частоту Ω;
- блок выбора индексов пригоден для выбора смещений индексов p1 и р2 так, чтобы
- сумма смещений индексов p1+p2 приближенно равнялась частному Ω/Δω и
- частное p12 было равно r/(Т-r).
17. Система по п.14, которая также содержит:
- окно (2001) анализа, которое выделяет заранее определенный временной интервал низкочастотной составляющей в заранее определенный момент времени k; и
- окно (2201) синтеза, которое выделяет заранее определенный временной интервал высокочастотной составляющей в заранее определенный момент времени k.
18. Система по п.17, отличающаяся тем, что
- окно (2201) синтеза представляет собой масштабированную по времени версию окна (2001) анализа.
19. Система декодирования звукового сигнала, которая содержит:
- базовый декодер (101), предназначенный для декодирования низкочастотной составляющей звукового сигнала;
- блок (102) преобразования по п.1, предназначенный для генерирования высокочастотной составяющей звукового сигнала из низкочастотной составляющей звукового сигнала;
- повышающий дискретизатор (104), предназначенный для выполнения повышающей дискретизации низкочастотной составляющей, дающей на выходе низкочастотную составляющую с повышенной дискретизацией;
- регулятор (103) огибающей, предназначенный для придания формы высокочастотной составляющей; и
- блок суммирования составляющих, предназначенный для определения декодированного сигнала как суммы низкочастотной составляющей с повышенной дискретизацией и скорректированной высокочастотной составляющей.
20. Система по п.19, отличающаяся тем, что также содержит:
- блок приема данных для выбора поддиапазонов, предназначенный для приема информации, позволяющей сделать выбор первого (801) и второго (802) сигналов анализируемых поддиапазонов, из которых должен генерироваться сигнал (803) синтезируемого поддиапазона.
21. Система по п.20, отличающаяся тем, что
- информация связана с основной частотой Ω звукового сигнала.
22. Система по п.20, отличающаяся тем, что
- информация включает перечень пар первых (801) и вторых (802) сигналов анализируемых поддиапазонов.
23. Система по п.19, отличающаяся тем, что также содержит:
- блок приема данных об огибающей, предназначенный для приема информации, относящейся к огибающей высокочастотной составляющей сигнала.
24. Система по п.19, отличающаяся тем, что также содержит:
- блок ввода, предназначенный для приема сигнала, включающего низкочастотную составляющую; и
- блок вывода, предназначенный для предоставления декодированного сигнала, включающего низкочастотную и генерированную высокочастотную составляющие.
25. Способ генерирования высокочастотной составляющей из низкочастотной составляющей звукового сигнала, который включает:
создание (301) первого сигнала поддиапазона низкочастотной составляющей с первой частотой ω и второго сигнала поддиапазона низкочастотной составляющей со второй частотой (ω+Ω);
- умножение фазы первого сигнала (801) поддиапазона с первой частотой ω на первый порядок преобразования (Т-r) для получения первого преобразованного сигнала поддиапазона;
- умножение фазы второго сигнала (802) поддиапазона со второй частотой (ω+Ω) на второй порядок преобразования r для получения второго преобразованного сигнала поддиапазона, где Т>1; а 1≤r<Т; и
- комбинирование (303) первого и второго преобразованных сигналов поддиапазонов с умноженными фазами для получения высокочастотной составляющей с высокой частотой (T·r)·ω+r·(ω+Ω).
26. Способ по п.25, отличающийся тем, что этап создания включает:
- фильтрацию низкочастотной составляющей посредством блока (301) анализирующих фильтров для генерирования первого и второго сигналов поддиапазонов.
27. Способ по любому из пп.25 и 26, отличающийся тем, что этап комбинирования включает:
- умножение первого и второго преобразованных сигналов поддиапазонов для получения сигнала высокого поддиапазона и
- ввод сигнала высокого поддиапазона в блок синтезирующих фильтров для генерирования высокочастотной составляющей.
28. Способ по пп.25 и 27, отличающийся тем, что дополнительно включает:
- декодирование кодированного звукового сигнала для получения низкочастотной составляющей звукового сигнала, где кодированный сигнал получается из оригинального звукового сигнала и представляет только часть частотных поддиапазонов оригинального сигнала ниже частоты (1005) перехода.
29. Дополнительное внешнее устройство для декодирования принятого мультимедийного сигнала, включающего звуковой сигнал, которое содержит:
- базовый декодер (101), предназначенный для декодирования низкочастотной составляющей звукового сигнала;
- блок (102) преобразования по пп.1-24, предназначенный для генерирования высокочастотной составляющей звукового сигнала из низкочастотной составляющей звукового сигнала;
- повышающий дискретизатор (104), предназначенный для выполнения повышающей дискретизации низкочастотной составляющей, дающей на выходе низкочастотную составляющую с повышенной дискретизацией;
- регулятор (103) огибающей, предназначенный для придания формы высокочастотной составляющей; и
- блок суммирования составляющих, предназначенный для определения декодированного сигнала как суммы низкочастотной составляющей с повышенной дискретизацией и скорректированной высокочастотной составляющей.
RU2011133894/08A 2009-01-16 2010-01-15 Гармоническое преобразование, усовершенствованное перекрестным произведением RU2495505C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14522309P 2009-01-16 2009-01-16
US61/145,223 2009-01-16
PCT/EP2010/050483 WO2010081892A2 (en) 2009-01-16 2010-01-15 Cross product enhanced harmonic transposition

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2013119725A Division RU2638748C2 (ru) 2009-01-16 2013-04-29 Гармоническое преобразование, усовершенствованное перекрестным произведением

Publications (2)

Publication Number Publication Date
RU2011133894A RU2011133894A (ru) 2013-03-10
RU2495505C2 true RU2495505C2 (ru) 2013-10-10

Family

ID=42077387

Family Applications (5)

Application Number Title Priority Date Filing Date
RU2011133894/08A RU2495505C2 (ru) 2009-01-16 2010-01-15 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2013119725A RU2638748C2 (ru) 2009-01-16 2013-04-29 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2017135312A RU2646314C1 (ru) 2009-01-16 2017-10-05 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2018102743A RU2667629C1 (ru) 2009-01-16 2018-01-24 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2018130424A RU2765618C2 (ru) 2009-01-16 2018-08-22 Гармоническое преобразование, усовершенствованное перекрестным произведением

Family Applications After (4)

Application Number Title Priority Date Filing Date
RU2013119725A RU2638748C2 (ru) 2009-01-16 2013-04-29 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2017135312A RU2646314C1 (ru) 2009-01-16 2017-10-05 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2018102743A RU2667629C1 (ru) 2009-01-16 2018-01-24 Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2018130424A RU2765618C2 (ru) 2009-01-16 2018-08-22 Гармоническое преобразование, усовершенствованное перекрестным произведением

Country Status (21)

Country Link
US (9) US8818541B2 (ru)
EP (8) EP3598445B1 (ru)
JP (2) JP5237465B2 (ru)
KR (2) KR101589942B1 (ru)
CN (2) CN102282612B (ru)
AU (1) AU2010205583B2 (ru)
BR (3) BRPI1007050B1 (ru)
CA (7) CA3084938C (ru)
CL (1) CL2011001717A1 (ru)
ES (7) ES2885804T3 (ru)
HK (1) HK1162735A1 (ru)
MX (1) MX2011007563A (ru)
MY (1) MY180550A (ru)
PL (6) PL3992966T3 (ru)
RU (5) RU2495505C2 (ru)
SG (1) SG172976A1 (ru)
TR (1) TR201910073T4 (ru)
TW (2) TWI523005B (ru)
UA (1) UA99878C2 (ru)
WO (1) WO2010081892A2 (ru)
ZA (1) ZA201105923B (ru)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2493618C2 (ru) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
BRPI1007528B1 (pt) 2009-01-28 2020-10-13 Dolby International Ab Sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
JP5433022B2 (ja) 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
KR102020334B1 (ko) 2010-01-19 2019-09-10 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103155033B (zh) * 2010-07-19 2014-10-22 杜比国际公司 高频重建期间的音频信号处理
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
AU2015202647B2 (en) * 2010-09-16 2017-05-11 Dolby International Ab Cross product enhanced subband block based harmonic transposition
CA3191597C (en) * 2010-09-16 2024-01-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
CN103477387B (zh) 2011-02-14 2015-11-25 弗兰霍菲尔运输应用研究公司 使用频谱域噪声整形的基于线性预测的编码方案
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
AU2012218409B2 (en) * 2011-02-18 2016-09-15 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP3544006A1 (en) 2011-11-11 2019-09-25 Dolby International AB Upsampling using oversampled sbr
US20130162901A1 (en) * 2011-12-22 2013-06-27 Silicon Image, Inc. Ringing suppression in video scalers
US8917197B2 (en) * 2012-01-03 2014-12-23 Nucript LLC System and method for improving performance of photonic samplers
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
CN102584191B (zh) * 2012-03-22 2014-05-14 上海大学 用蛇纹石尾矿制备堇青石陶瓷的方法
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
JP5894347B2 (ja) * 2012-10-15 2016-03-30 ドルビー・インターナショナル・アーベー 転移器に基づく仮想ベース・システムにおけるレイテンシーを低減するシステムおよび方法
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
KR101775084B1 (ko) * 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
US9881624B2 (en) 2013-05-15 2018-01-30 Samsung Electronics Co., Ltd. Method and device for encoding and decoding audio signal
MX353240B (es) * 2013-06-11 2018-01-05 Fraunhofer Ges Forschung Dispositivo y método para extensión de ancho de banda para señales acústicas.
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
DE102014003057B4 (de) * 2014-03-10 2018-06-14 Ask Industries Gmbh Verfahren zur Rekonstruierung hoher Frequenzen bei verlustbehafteter Audiokomprimierung
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963646A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016180704A1 (en) 2015-05-08 2016-11-17 Dolby International Ab Dialog enhancement complemented with frequency transposition
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN108108333B (zh) * 2017-05-02 2021-10-19 大连民族大学 一种伪双谱分离具有相同谐波频率成分信号的方法
IL278223B2 (en) * 2018-04-25 2023-12-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
CN109003621B (zh) * 2018-09-06 2021-06-04 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN110244290A (zh) * 2019-06-17 2019-09-17 电子科技大学 一种距离扩展目标的检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052545A1 (en) * 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
EP1739658A1 (en) * 2005-06-28 2007-01-03 Harman Becker Automotive Systems-Wavemakers, Inc. Frequency extension of harmonic signals
RU2007116941A (ru) * 2004-11-05 2008-11-20 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Кодер, декодер, способ кодирования и способ декодирования

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4048443A (en) 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
US4998072A (en) * 1990-02-20 1991-03-05 John Fluke Mfg. Co., Inc. High resolution direct digital synthesizer
SE501305C2 (sv) 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
KR100289733B1 (ko) 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
JP3606388B2 (ja) 1994-10-31 2005-01-05 ソニー株式会社 オーデイオデータ再生方法及びオーデイオデータ再生装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
TW303410B (en) 1996-04-19 1997-04-21 Kok Hua Liow Improved construction products and methods
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5856674A (en) 1997-09-16 1999-01-05 Eaton Corporation Filament for ion implanter plasma shower
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
DE60019268T2 (de) 1999-11-16 2006-02-02 Koninklijke Philips Electronics N.V. Breitbandiges audio-übertragungssystem
GB0003954D0 (en) 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
EP1158494B1 (en) 2000-05-26 2002-05-29 Lucent Technologies Inc. Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
FR2821501B1 (fr) 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR2821475B1 (fr) 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
US7400651B2 (en) 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7065491B2 (en) 2002-02-15 2006-06-20 National Central University Inverse-modified discrete cosine transform and overlap-add method and hardware structure for MPEG layer3 audio signal decoding
CA2464408C (en) * 2002-08-01 2012-02-21 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression
JP3879922B2 (ja) 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
US20040083094A1 (en) 2002-10-29 2004-04-29 Texas Instruments Incorporated Wavelet-based compression and decompression of audio sample sets
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
SE0301272D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Adaptive voice enhancement for low bit rate audio coding
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
CN100507485C (zh) 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR101171098B1 (ko) 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100717058B1 (ko) 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US20070121953A1 (en) 2005-11-28 2007-05-31 Mediatek Inc. Audio decoding system and method
JP2007171339A (ja) * 2005-12-20 2007-07-05 Kenwood Corp オーディオ信号処理装置
JP4548348B2 (ja) 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US20070299655A1 (en) 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
JP2008033269A (ja) 2006-06-26 2008-02-14 Sony Corp デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
US20080109215A1 (en) 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
EP2048658B1 (en) 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
US20080243518A1 (en) 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8363842B2 (en) 2006-11-30 2013-01-29 Sony Corporation Playback method and apparatus, program, and recording medium
TWI308740B (en) 2007-01-23 2009-04-11 Ind Tech Res Inst Method of a voice signal processing
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4905241B2 (ja) * 2007-04-27 2012-03-28 ヤマハ株式会社 高調波生成装置、低音増強装置、およびコンピュータプログラム
US7886303B2 (en) 2007-05-18 2011-02-08 Mediatek Inc. Method for dynamically adjusting audio decoding process
CN101105940A (zh) 2007-06-27 2008-01-16 北京中星微电子有限公司 音频编解码的量化方法、反变换方法及音频编解码装置
UA99878C2 (ru) * 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
WO2002052545A1 (en) * 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
RU2007116941A (ru) * 2004-11-05 2008-11-20 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Кодер, декодер, способ кодирования и способ декодирования
EP1739658A1 (en) * 2005-06-28 2007-01-03 Harman Becker Automotive Systems-Wavemakers, Inc. Frequency extension of harmonic signals

Also Published As

Publication number Publication date
JP5237465B2 (ja) 2013-07-17
EP4145446B1 (en) 2023-11-22
CA2748003A1 (en) 2010-07-22
US20210366500A1 (en) 2021-11-25
EP3598445A1 (en) 2020-01-22
EP3598447B1 (en) 2021-12-01
KR101256808B1 (ko) 2013-04-22
EP3598446A1 (en) 2020-01-22
EP3598446B1 (en) 2021-12-22
PL4145446T3 (pl) 2024-04-08
US10192565B2 (en) 2019-01-29
RU2638748C2 (ru) 2017-12-15
US9799346B2 (en) 2017-10-24
US11935551B2 (en) 2024-03-19
ES2966639T3 (es) 2024-04-23
EP3992966B1 (en) 2022-11-23
KR20110128275A (ko) 2011-11-29
CA3162807C (en) 2024-04-23
RU2667629C1 (ru) 2018-09-21
US10586550B2 (en) 2020-03-10
US20140297295A1 (en) 2014-10-02
ES2734361T3 (es) 2019-12-05
EP2620941A1 (en) 2013-07-31
MY180550A (en) 2020-12-02
JP2013148920A (ja) 2013-08-01
MX2011007563A (es) 2011-09-06
RU2018130424A3 (ru) 2021-11-15
US20230298606A1 (en) 2023-09-21
SG172976A1 (en) 2011-08-29
US20180033446A1 (en) 2018-02-01
TWI523005B (zh) 2016-02-21
BR122019023684B1 (pt) 2020-05-05
ES2904373T3 (es) 2022-04-04
KR20130006723A (ko) 2013-01-17
CA3084938A1 (en) 2010-07-22
CN103632678B (zh) 2017-06-06
EP3598445B1 (en) 2021-07-07
RU2765618C2 (ru) 2022-02-01
CL2011001717A1 (es) 2012-07-20
CA2926491A1 (en) 2010-07-22
CA3124108C (en) 2022-08-02
EP3598447A1 (en) 2020-01-22
CA3009237C (en) 2020-08-25
JP5597738B2 (ja) 2014-10-01
US20240249739A1 (en) 2024-07-25
CA3084938C (en) 2021-08-24
EP2620941B1 (en) 2019-05-01
RU2013119725A (ru) 2014-11-10
RU2011133894A (ru) 2013-03-10
US11682410B2 (en) 2023-06-20
US12119011B2 (en) 2024-10-15
AU2010205583B2 (en) 2013-02-07
CA2748003C (en) 2016-05-24
PL2620941T3 (pl) 2019-11-29
US20190115038A1 (en) 2019-04-18
RU2646314C1 (ru) 2018-03-02
CA3124108A1 (en) 2010-07-22
ES2885804T3 (es) 2021-12-15
CA3009237A1 (en) 2010-07-22
EP4300495A2 (en) 2024-01-03
US20110305352A1 (en) 2011-12-15
ES2427278T3 (es) 2013-10-29
BRPI1007050B1 (pt) 2020-04-22
EP4300495A3 (en) 2024-02-21
BRPI1007050A2 (pt) 2019-03-26
JP2012515362A (ja) 2012-07-05
EP4145446A1 (en) 2023-03-08
TWI430264B (zh) 2014-03-11
WO2010081892A3 (en) 2010-11-18
PL3598446T3 (pl) 2022-03-28
CN102282612A (zh) 2011-12-14
ES2938858T3 (es) 2023-04-17
ZA201105923B (en) 2012-11-28
PL3992966T3 (pl) 2023-03-20
KR101589942B1 (ko) 2016-01-29
CA2926491C (en) 2018-08-07
UA99878C2 (ru) 2012-10-10
US20240194211A1 (en) 2024-06-13
CA3162807A1 (en) 2010-07-22
CN103632678A (zh) 2014-03-12
BR122019023704B1 (pt) 2020-05-05
US8818541B2 (en) 2014-08-26
HK1162735A1 (en) 2012-08-31
PL3598445T3 (pl) 2021-12-27
EP3992966A1 (en) 2022-05-04
US11031025B2 (en) 2021-06-08
EP2380172B1 (en) 2013-07-24
PL3598447T3 (pl) 2022-02-14
AU2010205583A1 (en) 2011-07-07
TW201128634A (en) 2011-08-16
US20200273476A1 (en) 2020-08-27
RU2018130424A (ru) 2020-02-25
CN102282612B (zh) 2013-07-24
CA3231911A1 (en) 2010-07-22
WO2010081892A2 (en) 2010-07-22
TR201910073T4 (tr) 2019-07-22
ES2901735T3 (es) 2022-03-23
TW201413709A (zh) 2014-04-01
EP2380172A2 (en) 2011-10-26

Similar Documents

Publication Publication Date Title
RU2667629C1 (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2825717C1 (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2806621C1 (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2778834C1 (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением