RU2671619C2 - Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями - Google Patents

Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями Download PDF

Info

Publication number
RU2671619C2
RU2671619C2 RU2015105671A RU2015105671A RU2671619C2 RU 2671619 C2 RU2671619 C2 RU 2671619C2 RU 2015105671 A RU2015105671 A RU 2015105671A RU 2015105671 A RU2015105671 A RU 2015105671A RU 2671619 C2 RU2671619 C2 RU 2671619C2
Authority
RU
Russia
Prior art keywords
subband
discrete values
input
analyzed
signal
Prior art date
Application number
RU2015105671A
Other languages
English (en)
Other versions
RU2015105671A (ru
RU2015105671A3 (ru
Inventor
Ларс ВИЛЛЕМОЕС
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2015105671A publication Critical patent/RU2015105671A/ru
Publication of RU2015105671A3 publication Critical patent/RU2015105671A3/ru
Application granted granted Critical
Publication of RU2671619C2 publication Critical patent/RU2671619C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)
  • Golf Clubs (AREA)
  • Vibration Dampers (AREA)
  • Complex Calculations (AREA)
  • Selective Calling Equipment (AREA)

Abstract

Изобретение относится к системам кодирования источников звукового сигнала. Технический результат – воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат. Для этого изобретение предусматривает гармоническое преобразование на основе блока поддиапазонов, где временной блок комплекснозначных дискретных значений поддиапазонов обрабатывается путем общеизвестной модификации фаз. Суперпозиция нескольких модифицированных дискретных значений дает результирующий эффект ограничения нежелательных комбинационных составляющих, посредством чего делается возможным использование более грубой разрешающей способности по частоте и/или меньшей степени передискретизации. В одном из вариантов осуществления изобретения, изобретение дополнительно содержит оконную функцию, пригодную для использования с HFR на основе блока поддиапазонов, усиленной перекрестными произведениями. Аппаратный вариант осуществления изобретения может включать блок (101) анализирующих фильтров, конфигурируемый управляющими данными (104), модуль (102) обработки поддиапазонов и блок (103) синтезирующих фильтров. 3 н. и 12 з.п. ф-лы, 9 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение относится к системам кодирования источников звукового сигнала, которые применяют способ гармонического преобразования для высокочастотной реконструкции (HFR) в процессорах цифровых эффектов, таких как эксайтеры, которые генерируют гармоническое искажение для добавления яркости в обрабатываемый сигнал, и в устройствах растягивания временной шкалы, которые увеличивают длительность сигнала с сохранением спектрального состава.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
В документе WO 98/57436 концепция преобразования была установлена как способ воссоздания высокочастотной полосы из низкочастотной полосы звукового сигнала. Путем использования этой концепции можно получить значительную экономию битовой скорости передачи данных при кодировании звукового сигнала. В системе кодирования звукового сигнала на основе HFR сигнал с низкочастотной полосой пропускания передается в базовый кодер формы сигнала, и более высокие частоты регенерируются с использованием преобразования и дополнительной вспомогательной информации, передаваемой с очень низкой битовой скоростью передачи данных, которая описывает целевую форму спектра на стороне декодера. Для низких битовых скоростей передачи данных, когда полоса пропускания базового кодированного сигнала является узкой, приобретает возрастающую важность воссоздание высокочастотной полосы с приятными для восприятия характеристиками. Гармоническое преобразование, определенное в документе WO №98/57436, очень хорошо выполняется для сложного музыкального материала в ситуации с низкой частотой перехода. Принцип гармонического преобразования заключается в том, что синусоида с частотой ω отображается в синусоиду с частотой Qϕω, где Qϕ больше 1 - целое число, определяющее порядок преобразования. Для сравнения, HFR на основе модуляции сигнала с одной боковой полосой отображает синусоиду с частотой ω в синусоиду с частотой ω+Δω. где Δω - фиксированный сдвиг частоты. Для любого данного базового сигнала с низкой полосой пропускания, в результате преобразования SSB будет возникать артефакт диссонирующего звона.
С целью достижения наилучшего возможного качества звукового сигнала способы высококачественной гармонической HFR на современном уровне техники используют для достижения требуемого качества звука блоки комплексных модулированных фильтров с очень высокой разрешающей способностью по частоте и высокой степенью передискретизации. Высокая разрешающая способность необходима для того, чтобы избежать нежелательного интермодуляционного искажения, возникающего в результате нелинейной обработки сумм синусоид. При достаточной узости поддиапазонов высококачественные способы стремятся к тому, чтобы в каждом поддиапазоне содержалось не более одной синусоиды. Высокая степень передискретизации по времени необходима для того, чтобы избежать искажений из-за недостаточной частоты дискретизации, а определенная степень передискретизации по частоте необходима для того, чтобы избежать опережающего эха для переходных сигналов. Очевидным недостатком является, то что вычислительная сложность становится при этом очень высокой.
Другой общеизвестный недостаток, связанный с гармоническими преобразованиями, проявляется для сигналов с выраженной периодической структурой. Эти сигналы представляют собой суперпозиции гармонически связанных синусоид с частотами Ω, 2Ω, 3Ω…, где Ω - основная частота. При гармоническом преобразовании порядка Qϕ выходные синусоиды имеют частоты QϕΩ, 2QϕΩ, 3QϕΩ…, что в случае Qϕ больше 1 представляет собой строгое подмножество желаемого полного гармонического ряда. В отношении результирующего качества звука, как правило, будет восприниматься «паразитный» основной тон, соответствующий преобразованной основной частоте QϕΩ. Часто гармоническое преобразование приводит к «металлическому» характеру звучания кодированного и декодированного звукового сигнала.
В документе WO 2010/081892. который ссылкой включается в настоящее описание, для обращения к решению описанной выше проблемы «паразитного» основного тона в случае высококачественного преобразования был разработан способ перекрестных произведений. Для заданной частичной или полной передаваемой информации о значении основной частоты преобладающей гармонической части сигнала, подлежащего преобразованию с высокой точностью, нелинейные модификации поддиапазонов дополняются нелинейными комбинациями по меньшей мере двух различных анализируемых поддиапазонов, где расстояния между индексами анализируемых поддиапазонов связаны с основной частотой. В результате генерируются недостающие гармоники преобразованного выходного сигнала, что, однако, происходит со значительными вычислительными затратами.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В виду описанных выше недостатков имеющихся в наличии способов HFR целью настоящего изобретения является создание более эффективной реализации HFR, усиленной перекрестными произведениями. В частности, целью является создание указанного способа, который допускал бы воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат по сравнению с имеющимися в доступе способами.
Настоящее изобретение достигает, по меньшей мере, одной из этих целей путем создания устройств и способов согласно независимым пунктам формулы изобретения.
В первом аспекте изобретение предусматривает систему, сконфигурированную для генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Система содержит:
- блок анализирующих фильтров, сконфигурированный для получения из входного сигнала некоторого количества Y сигналов анализируемых поддиапазонов, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;
- модуль обработки поддиапазонов, сконфигурированный для определения сигнала синтезируемого поддиапазона исходя из У сигналов анализируемых поддиапазонов с использованием коэффициента Q преобразования поддиапазонов и коэффициента S растягивания поддиапазонов, где по меньшей мере один из коэффициентов Q и S больше единицы, причем модуль обработки поддиапазонов включает:
- экстрактор блоков, сконфигурированный для:
- i) формирования Y кадров, состоящих из L входных дискретных значений, где каждый кадр извлекается из указанного ряда комплекснозначных дискретных значений в сигнале анализируемого поддиапазона, и длина кадра L, больше 1; и
- ii) применения величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед формированием следующего кадра, состоящего из L входных дискретных значений, посредством чего генерируется последовательность кадров входных дискретных значений;
- модуль нелинейной обработки кадров, сконфигурированный для генерирования на основе Y соответствующих кадров входных дискретных значений, сформированных в экстракторе блоков, кадра обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для по меньшей мере одного обрабатываемого дискретного значения:
- i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и
- ii) амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и
- модуль наложения и сложения, сконфигурированный для определения сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений; и
- блок синтезирующих фильтров, сконфигурированный для генерирования растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона.
Система может действовать при любом положительном целочисленном значении Y. Однако она действует при, по меньшей мере, Y=2.
Во втором аспекте изобретение предусматривает способ генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Способ включает:
- получение из входного сигнала некоторого количества Y>2 сигналов анализируемых поддиапазонов, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;
- формирование Y кадров, состоящих из L входных дискретных значений, где каждый кадр извлекается из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, и длина кадра L более 1;
- применение величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед получением следующего кадра, состоящего из L входных дискретных значений, посредством чего генерируется последовательность кадров входных дискретных значений;
- генерирование на основе Y соответствующих кадров входных дискретных значений кадра обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для, по меньшей мере, одного обрабатываемого дискретного значения:
- фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения по меньшей мере в одном из Y кадров входных дискретных значений; и
- амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений;
- определение сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений; и
- генерирование растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона.
Здесь Y - произвольное целое число больше единицы. Система согласно первому аспекту действует для осуществления способа, по меньшей мере, для Y=2.
Третий аспект изобретения предусматривает компьютерный программный продукт, который включает машиночитаемый носитель данных (или информационный носитель), в памяти которого хранятся команды программного обеспечения, предназначенные для того, чтобы вызывать исполнение программируемым компьютером способа согласно второму аспекту.
Изобретение основывается на понимании того, что общая концепция HFR, усиленной перекрестными произведениями, будет обеспечивать улучшенные результаты тогда, когда обрабатываются данные, упорядоченные в блоки, которые состоят из комплексных дискретных значений поддиапазонов. Помимо прочего, это делает возможным применение к дискретным значениям покадрового сдвига по фазе, что, как было обнаружено, в некоторых ситуациях ослабляет комбинационные составляющие. Также возможно применение регулировки амплитуды, что может приводить к похожим полезным эффектам. Реализация усиленной перекрестными произведениями HFR согласно изобретению включает гармоническое преобразование на основе блока поддиапазонов, что может значительно ослаблять комбинационные составляющие. Поэтому, несмотря на сохранение высокого воспринимаемого качества, может использоваться блок фильтров (такой как блок QMF-фильтров) с более грубой разрешающей способностью по частоте и/или меньшей степенью передискретизации. При обработке на основе блока поддиапазонов временной блок комплексных дискретных значений поддиапазонов обрабатывается путем общеизвестной модификации фаз, а суперпозиция нескольких модифицированных дискретных значений при формировании выходною дискретного значения поддиапазона дает совокупный эффект подавления комбинационных составляющих, которые иначе возникают тогда, когда сигнал входного поддиапазона состоит из нескольких синусоид. Преобразование, основанное на обработке поддиапазона на основе блока, имеет намного меньшую вычислительную сложность, чем у преобразователей с высокой разрешающей способностью, и для многих сигналов достигает почти такого же качества.
Для цели данного раскрытия отметим, что в вариантах осуществления изобретения, где Y>2, модуль нелинейной обработки использует в качестве входного сигнала Y «соответствующих» кадров входных дискретных значений в том смысле, что кадры являются синхронными или почти синхронными. Например, дискретные значения в соответствующих кадрах могут относиться к промежуткам времени, имеющим значительное перекрывание по времени между кадрами. Термин «соответствующие» также используется в отношений дискретных значений для указания того, что они являются синхронными или приблизительно являются таковыми. Кроме того, термин «кадр» будет использоваться взаимозаменяемо с термином «блок». Соответственно, «величина скачка блока» может быть равна длине кадра (возможно, скорректированной в отношении понижающей дискретизации, если она применяется) или может быть меньше длины кадра (возможно, скорректированной в отношении понижающей дискретизации, если она применяется), и в этом случае последовательные кадры накладываются в том смысле, что входное дискретное значение может принадлежать более чем одному кадру. Система необязательно генерирует каждое обрабатываемое дискретное значение в кадре путем определения его фазы и амплитуды на основе фазы и амплитуды всех Y соответствующих кадров входных дискретных значений; без отступления от изобретения система может генерировать фазу и/или амплитуду некоторых обрабатываемых дискретных значений на основе меньшего количества соответствующих входных дискретных значений или на основе только одного входного дискретного значения.
В одном из вариантов осуществления изобретения, блок анализирующих фильтров представляет собой блок квадратурных зеркальных фильтров (QMF), или блок псевдо-QMF, с любым количеством звеньев и точек. Например, он может представлять собой 64-точечный блок QMF. Блок анализирующих фильтров также может выбираться из класса оконных дискретных преобразований Фурье или вейвлет-преобразований. Преимущественно, блок синтезирующих фильтров согласуется с блоком анализирующих фильтров, являясь, соответственно, блоком обратных QMF, блоком обратных псевдо-QMF и т.д. Известно, что указанные блоки фильтров могут обладать достаточно грубой разрешающей способностью по частоте и/или относительно низкой степенью передискретизации. В отличие от текущего уровня техники, изобретение может осуществляться с использованием указанных относительно более простых компонентов, необязательно страдая от понижения качества на выходе; таким образом, указанные варианты осуществления изобретения обладают экономическим преимуществом перед текущим уровнем техники.
В одном из вариантов осуществления изобретения, для блока анализирующих фильтров верно одно или несколько следующих утверждений:
- шаг анализа по времени - ΔtA;
- разнос анализируемых частот - ΔfA;
- блок анализирующих фильтров включает N>1 анализируемых поддиапазонов, индексируемых по индексу анализируемого поддиапазона n=0,…, N-1;
- анализируемый поддиапазон связан с одной из частотных полос входного сигнала.
В одном из вариантов осуществления изобретения, для блока синтезирующих фильтров верно одно или несколько следующих утверждений:
- шаг синтеза по времени - Δts;
- разнос синтезируемых частот - Δfs;
- блок синтезирующих фильтров включает М>1 синтезируемых поддиапазонов, индексируемых по индексу синтезируемого поддиапазона m=0,…, М-1;
- синтезируемый поддиапазон связан с одной из частотных полос сигнала, растянутого во времени и/или преобразованного по частоте.
В одном из вариантов осуществления изобретения, модуль нелинейной обработки кадров адаптирован для ввода двух кадров (Y=2) с целью генерирования одного кадра обрабатываемых дискретных значений, и модуль обработки поддиапазонов включает модуль управления перекрестной обработкой, предназначенный для генерирования данных управления перекрестной обработкой. Определяя количественные и/или качественные характеристики обработки поддиапазонов таким образом, изобретение добивается гибкости и приспособляемости. Управляющие данные могут определять поддиапазоны (например, идентифицируемые по индексам), которые отличаются по частоте от основной частоты входного сигнала. Иными словами, индексы, идентифицирующие поддиапазоны, могут отличаться на целое число, служащее приближением частного указанной основной частоты, деленной на разнос анализируемых частот. Это будет приводить к приятному с психоакустической точки зрения выходному сигналу, поскольку новые спектральные составляющие, генерируемые путем гармонического преобразования, будут совместимы с рядом натуральных гармоник.
В дальнейшем развитии предшествующего варианта осуществления изобретения индексы (входного) анализируемого и (выходного) синтезируемого поддиапазонов выбираются так, чтобы удовлетворялось приводимое ниже уравнение (16). Появляющийся в этом уравнении параметр σ делает его применимым как к неравномерно, так и к равномерно скомпонованным блокам фильтров. Если индексы поддиапазонов получаются как приближенное (например, по методу наименьших квадратов) решение уравнения (16), новая спектральная составляющая, получаемая путем гармонического преобразования, вероятно, будет совместима с рядом натуральных гармоник. Таким образом, HFR, вероятно, будет обеспечивать достоверную реконструкцию оригинального сигнала, из которого было устранено высокочастотное содержимое.
Дальнейшее развитие предшествующего варианта осуществления изобретения предусматривает способ выбора параметра r, появляющегося в уравнении (16), и представления порядка преобразования с перекрестными произведениями. Для заданного индекса m выходного поддиапазона каждое значение порядка r преобразования будет определять два индекса n1, n2 анализируемых поддиапазонов. Такое дальнейшее развитие оценивает амплитуды двух указанных поддиапазонов для некоторого количества r вариантов и выбирает то значение, которое дает максимизацию минимальной из двух амплитуд анализируемых поддиапазонов. Такой способ выбора индексов может позволить избежать необходимости в воссоздании достаточной величины амплитуды путем усиления слабых составляющих входного сигнала, что на выходе может приводить к низкому качеству. В этой связи, амплитуды поддиапазонов могут рассчитываться способом, который известен сам по себе, таким как квадратный корень из квадратов входных дискретных значений, образующих кадр (блок) или часть кадра. Амплитуда поддиапазона также может рассчитываться как амплитуда центрального, или ближайшего к центральному, дискретного значения в кадре. Такой расчет может создавать простой, но в то же время адекватный количественный показатель амплитуды.
В дальнейшем развитии предшествующего варианта осуществления изобретения синтезируемый поддиапазон может принимать вклады от событий гармонического преобразования согласно как прямой обработке, так и обработке на основе перекрестных произведений. В этой связи, для определения того, подлежит ли использованию особая возможность восстановления недостающей гармоники путем обработки на основе перекрестных произведений, могут применяться критерии принятия решения. Например, указанное дальнейшее развитие может адаптироваться так, чтобы оно воздерживалось от использования одного модуля перекрестной обработки поддиапазонов в случае, когда выполняется одно из следующих условий:
a) соотношение амплитуды Ms члена анализируемого поддиапазона из прямого источника, приводящего к синтезируемому поддиапазону, и, по меньшей мере, амплитуды Мс в оптимальной паре членов из перекрестного источника, приводящих к синтезируемому поддиапазону, больше предварительно определенной постоянной;
b) синтезируемый поддиапазон уже принимает значительный вклад от модуля прямой обработки;
c) основная частота Ω0 меньше, чем разнос частот блока анализирующих фильтров ΔfA.
В одном из вариантов осуществления изобретения, изобретение включает понижающую дискретизацию (прореживание) входного сигнала. Более того, один или несколько кадров входных дискретных значений могут определяться путем понижающей дискретизации комплекснозначных дискретных значений в поддиапазоне, которая может выполняться экстрактором блоков.
В дальнейшем развитии предшествующего варианта осуществления изобретения подлежащие применению коэффициенты понижающей дискретизации удовлетворяют приводимому ниже уравнению (15). Равенство нулю обоих коэффициентов понижающей дискретизации не допускается, поскольку это соответствует тривиальному случаю. Уравнение (15) определяет взаимосвязь коэффициентов понижающей дискретизации D1, D2 с коэффициентом S растягивания поддиапазонов и коэффициентом Q преобразования поддиапазонов, а также с фазовыми коэффициентами T1, Т2, появляющимися в выражении (13) для определения фазы обрабатываемого дискретного значения. Это обеспечивает согласованность фазы обрабатываемых дискретных значений с другими составляющими входного сигнала, добавлению к которым подлежат обрабатываемые дискретные значения.
В одном из вариантов осуществления изобретения, кадры обрабатываемых дискретных значений перед их наложением и сложением подвергаются оконной обработке. Модуль оконной обработки может быть адаптирован для применения к обрабатываемым дискретным значениям оконной функции конечной длины. Подходящие оконные функции перечисляются в прилагаемой формуле изобретения.
Автор изобретения осознал, что способы перекрестных произведений, раскрытые в документе WO №2010/08892 изначально не вполне совместимы со способами обработки на основе блока поддиапазонов. Несмотря на то. что указанный способ может удовлетворительно применяться к одному из дискретных значений в блоке, он может приводить к артефактам наложения спектров, если его напрямую распространить на другие дискретные значения блока. С этой целью, один из вариантов осуществления изобретения применяет оконные функции, включающие оконные дискретные значения, которые, при их взвешивании посредством комплексных весовых коэффициентов и смещении на величину скачка, сводятся к, в значительной мере, постоянной последовательности. Величина скачка может представлять собой произведение величины скачка h блока на коэффициент растягивания поддиапазонов S. Использование указанных оконных функций ослабляет воздействие артефактов наложения спектров. В альтернативном варианте или в дополнение, указанные оконные функции также могут допускать и такие другие меры по ослаблению артефактов, как чередования фаз обрабатываемых дискретных значений.
Предпочтительно, следующие один за другим комплексные весовые коэффициенты, которые применяются к оконным дискретным значениям с целью оценивания их состояния, отличаются только на фиксированное чередование фазы. Также предпочтительно, чтобы указанное фиксированное чередование фазы было пропорционально основной частоте входного сигнала. Чередование фазы также может быть пропорционально подлежащему применению порядку преобразования перекрестных произведений и/или параметру физического преобразования, и/или разности Коэффициентов понижающей дискретизации, и/или шагу анализа по времени. Чередование фазы может иметь вид уравнения (21), по меньшей мере, в приближенном смысле.
В одном из вариантов осуществления изобретения, настоящее изобретение делает возможным гармоническое преобразование, усиленное перекрестными произведениями, путем модификации синтезирующей оконной обработки в ответ на параметр основной частоты.
В одном из вариантов осуществления изобретения, последовательные кадры обрабатываемых дискретных значений складываются с определенным наложением. Для выполнения подходящего наложения кадры обрабатываемых дискретных значений надлежащим образом смещаются на величину скачка, которая представляет собой величину скачка h блока, помноженную на коэффициент S растягивания поддиапазонов. Таким образом, если наложение последовательных кадров входных дискретных значений составляет L-h, то наложение последовательных кадров обрабатываемых дискретных значений может составлять S(L-h).
В одном из вариантов осуществления изобретения, система согласно изобретению действует не только для генерирования обрабатываемого дискретного значения на основе Y=2 входных дискретных значений, но также и на основе только Y=1 дискретного значения. Таким образом, система может восстанавливать недостающие гармоники не только посредством подхода на основе перекрестных произведений (как, например, по уравнению (13)), но также и посредством прямого подхода на основе поддиапазонов (как, например, по уравнению (5) или (11)). Предпочтительно, управляющий модуль сконфигурирован для управления действием системы, в том числе и тем, какой из подходов подлежит использованию для восстановления конкретной недостающей гармоники.
В дальнейшем развитии предшествующего варианта осуществления изобретения система также адаптируется для генерирования обрабатываемого дискретного значения на основе более, чем трех дискретных значений, т.е. для Y≥3. Например, обрабатываемое дискретное значение может быть получено путем вклада в обрабатываемое дискретное значение от нескольких событий гармонического преобразования на основе перекрестных произведений, путем нескольких событий прямой обработки поддиапазонов, или путем сочетания преобразования с перекрестными произведениями и прямого преобразования. Указанная возможность адаптации способа преобразования обеспечивает производительную и многофункциональную HFR. Соответственно, данный вариант осуществления изобретения действует для осуществления способа согласно второму аспекту изобретения для Y=3, 4, 5 и т.п.
Один из вариантов осуществления изобретения сконфигурирован для определения обрабатываемого дискретного значения как комплексного числа, имеющего амплитуду, которая представляет собой среднее значение соответствующих амплитуд соответствующих входных дискретных значений. Указанное среднее значение может представлять собой (взвешенное) арифметическое, (взвешенное) геометрическое или (взвешенное) гармоническое среднее двух или большего количества входных дискретных значений. В случае Y=2 среднее основывается на двух комплексных входных дискретных значениях. Предпочтительно, амплитуда обрабатываемого дискретного значения представляет собой геометрическое средневзвешенное значение. Более предпочтительно, геометрическое значение, как показано в уравнении (13). взвешивается при помощи параметров ρ и 1-ρ. Здесь параметр ρ геометрического взвешивания амплитуд представляет собой действительное число, обратно пропорциональное коэффициенту Q преобразования поддиапазонов. Параметр ρ также может быть обратно пропорционален коэффициенту S растягивания.
В одном из вариантов осуществления изобретения система адаптируется для определения обрабатываемого дискретного значения как комплексного числа, имеющего фазу, которая представляет собой линейную комбинацию соответствующих фаз соответствующих входных дискретных значений в кадрах входных дискретных значений. В частности, линейная комбинация может включать фазы, относящиеся к двум входным дискретным значениям (Y=2). Линейная комбинация двух фаз может применять целочисленные ненулевые коэффициенты, сумма которых равна коэффициенту S растягивания, умноженному на коэффициент Q преобразования поддиапазонов. Факультативно, фаза, полученная путем указанной линейной комбинации, дополнительно корректируется посредством фиксированного параметра коррекции фазы. Фаза обрабатываемого дискретного значения может иметь вид уравнения (13).
В одном из вариантов осуществления изобретения, экстрактор блоков (или аналогичный этап в способе согласно изобретению) адаптируется для интерполяции двух или большего количества анализируемых дискретных значений из сигнала анализируемого поддиапазона с целью получения одного входного дискретного значения, которое будет включено в кадр (блок). Указанная интерполяция может делать возможной понижающую дискретизацию входного сигнала посредством нецелочисленного коэффициента. Анализируемые дискретные значения, подлежащие интерполяции, могут быть или могут не быть следующими друг за другом.
В одном из вариантов осуществления изобретения, конфигурация обработки поддиапазонов может управляться посредством управляющих данных, доставляемых извне модуля, выполняющего обработку. Управляющие данные могут относиться к мгновенным акустическим свойствам входного сигнала. Например, сама система может содержать секцию, адаптированную для определения таких мгновенных акустических свойств сигнала, как (преобладающая) основная частота сигнала. Знание основной частоты обеспечивает руководство при выборе анализируемых поддиапазонов, из которых требуется получить обрабатываемые дискретные значения. Соответственно, разнос анализируемых поддиапазонов пропорционален указанной основной частоте входного сигнала. В качестве альтернативы, управляющие данные также могут доставляться извне системы, предпочтительно, путем включения в формат кодирования, подходящий для передачи в качестве битового потока по сети цифровой связи. В дополнение к управляющим данным указанный формат кодирования может содержать информацию, относящуюся к низкочастотным составляющим сигнала (например, к составляющим в поз. 701 на фиг. 7). Однако в интересах экономии полосы пропускания формат, предпочтительно, не включает полную информацию, относящуюся к высокочастотным составляющим (поз. 702), которые могут восстанавливаться согласно изобретению. Изобретение может, в частности, предусматривать систему декодирования с модулем приема управляющих данных, сконфигурированным для приема указанных управляющих данных, либо включенных в принимаемый битовый поток, который также кодирует входной сигнал, либо принимаемых как отдельный сигнал или битовый поток.
Один из вариантов осуществления изобретения предусматривает способ эффективного осуществления расчетов, обусловленных способом согласно изобретению. С этой целью аппаратная реализация может включать преднормализатор, предназначенный для изменения масштаба амплитуд соответствующих дискретных значений в некоторых из Y кадров, на которых будет основываться кадр обрабатываемых дискретных значений. После указанного изменения масштаба обрабатываемое дискретное значение может быть рассчитано как (взвешенное) комплексное произведение входных дискретных значений, подвергнутых изменению масштаба, и, возможно, не подвергнутых изменению масштаба. Входное дискретное значение, возникающее в произведении как коэффициент с измененным масштабом, обычно повторно не появляется как коэффициент с неизменным масштабом. За исключением, возможно, параметра θ коррекции фазы можно оценить уравнение (13) как произведение комплексных входных дискретных значений (возможно, с измененным масштабом). Это предоставляет вычислительное преимущество по сравнению с обработками амплитуды и фазы обрабатываемого дискретного значения по отдельности.
В одном из вариантов осуществления изобретения система, сконфигурированная для случая Υ=2, содержит два экстрактора блоков, адаптированных для формирования каждым из них одного кадра входных дискретных значений при параллельном действии.
В дальнейшем развитии вариантов осуществления изобретения, представляющих Y≥3, система может содержать ряд блоков обработки поддиапазонов, каждый из которых конфигурируется для определения сигнала промежуточного синтезируемого поддиапазона с использованием отличающегося коэффициента преобразования поддиапазонов и/или отличающегося коэффициента растягивания поддиапазонов, и/или способа преобразования, отличающегося тем, что он является основанным на перекрестном произведении или прямым. Для параллельного действия модули обработки поддиапазонов могут располагаться параллельно. В этом варианте осуществления изобретения система также может включать модуль слияния, расположенный за модулями обработки поддиапазонов и перед блоком синтезирующих фильтров. Модуль слияния может адаптироваться для слияния (например, путем смешивания) соответствующих сигналов промежуточных синтезируемых поддиапазонов с целью получения сигнала синтезируемого поддиапазона. Как уже отмечалось, промежуточный синтезируемый поддиапазон, который подвергается слиянию, может быть получен как путем прямого гармонического преобразования, так и путем преобразования на основе перекрестных произведений. Система согласно этому варианту осуществления изобретения также может содержать базовый декодер, предназначенный для декодирования битового потока во входной сигнал. Она также может включать модуль HFR-обработки, адаптированный для применения информации спектральной полосы, в особенности, путем выполнения формирования спектра. Действие модуля HFR-обработки может управляться информацией, закодированной в битовом потоке.
Один из вариантов осуществления изобретения предусматривает HFR многомерных сигналов, например, в системе. предназначенной для воспроизведения звука в стереофоническом формате, содержащем Ζ каналов, таких как левый, правый, центральный, окружающий и т.д. В одной из возможных реализаций обработки входного сигнала с несколькими каналами обрабатываемые дискретные значения каждого канала основываются на одинаковом количестве входных дискретных значений, хотя коэффициент S растягивания и коэффициент Q преобразования для каждой полосы может варьироваться между каналами. С этой целью реализация может включать блок анализирующих фильтров, предназначенный для генерирования Y сигналов анализируемых поддиапазонов из каждого канала, модуль обработки поддиапазонов, предназначенный для генерирования Ζ сигналов поддиапазонов, и блок синтезирующих фильтров, предназначенный для генерирования Ζ растянутых во времени и/или преобразованных по частоте сигналов, которые образуют выходной сигнал.
В изменениях предшествующего варианта осуществления изобретения выходной сигнал может содержать выходные каналы, которые основываются на различных количествах сигналов анализируемых поддиапазонов. Например, может оказаться целесообразной передача большего количества вычислительных ресурсов к HFR для акустически более выраженных каналов; например, каналам, предназначенным для воспроизведения источниками звука, расположенными перед слушателем, может отдаваться предпочтение перед окружающими или задними каналами.
Следует подчеркнуть, что изобретение относится ко всем сочетаниям приведенных выше характерных признаков, даже если они излагаются в разных пунктах формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
Настоящее изобретение будет описано ниже посредством иллюстративных примеров, не ограничивающих объем или суть изобретения, со ссылкой на сопроводительные графические материалы.
Фиг. 1 иллюстрирует принцип гармонического преобразования на основе блока поддиапазонов.
Фиг. 2 иллюстрирует действие нелинейной обработки блока поддиапазонов с одним входным поддиапазоном.
Фиг. 3 иллюстрирует действие нелинейной обработки блока поддиапазонов с двумя входными поддиапазонами.
Фиг. 4 иллюстрирует действие гармонического преобразования на основе блока поддиапазонов, усиленного перекрестными произведениями.
Фиг. 5 иллюстрирует пример сценария применения преобразования на основе блока поддиапазонов с использованием нескольких порядков преобразования в аудиокодеке, усиленном HFR.
Фиг. 6 иллюстрирует пример сценария действия преобразования нескольких порядков на основе блока поддиапазонов, применяющего 64-полосный блок анализирующих QMF-фильтров.
Фиг. 7 и 8 иллюстрируют экспериментальные результаты описываемого способа преобразования на основе блока поддиапазонов.
Фиг. 9 показывает детали блока нелинейной обработки согласно фиг. 2, включающего преднормализатор и умножитель.
ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Описываемые ниже варианты осуществления изобретения являются единственно иллюстрациями принципов настоящего изобретения «ГАРМОНИЧЕСКОЕ ПРЕОБРАЗОВАНИЕ НА ОСНОВЕ БЛОКА ПОДДИАПАЗОНОВ, УСИЛЕННОЕ ПЕРЕКРЕСТНЫМИ ПРОИЗВЕДЕНИЯМИ». Следует понимать, что специалистам в данной области будут очевидны модификации и изменения описываемых в данном описании схем и деталей. Поэтому намерение заключается в том, чтобы изобретение ограничивалось только объемом прилагаемой формулы изобретения, а не конкретными деталями, представленными в данном описании с целью описания и разъяснения вариантов осуществления изобретения.
Фиг. 1 иллюстрирует принцип преобразования, растягивания во времени или сочетания преобразования с растягиванием во времени на основе блока поддиапазонов. Входной сигнал во временной области подается в блок 101 анализирующих фильтров, который создает несколько комплекснозначных сигналов поддиапазонов. Эти сигналы подаются в модуль 102 обработки поддиапазонов, на действие которого могут оказывать влияние управляющие данные 104. Каждый выходной поддиапазон может быть получен путем обработки или одного, или двух входных поддиапазонов, или даже как суперпозиция результата для нескольких указанных обрабатываемых поддиапазонов. Множество комплекснозначных выходных поддиапазонов подается в блок 103 синтезирующих фильтров, который, в свою очередь, выводит модифицированный сигнал во временной области. Необязательные управляющие данные 104 описывают конфигурацию и параметры обработки поддиапазонов, которые могут быть адаптированы к сигналу, подлежащему преобразованию. В случае преобразования, усиленного перекрестными произведениями, эти данные могут нести информацию, относящуюся к преобладающей основной частоте.
Фиг. 2 иллюстрирует действие нелинейной обработки блока поддиапазонов с одним входным поддиапазоном. Для данных целевых значений физического растягивания во времени и преобразования, а также физических параметров блоков 101 и 103 анализирующих и синтезирующих фильтров выводятся параметры растягивания во времени и преобразования поддиапазонов, а также индекс исходного поддиапазона для каждого индекса целевого поддиапазона. Тогда целью обработки блока поддиапазонов является реализация соответствующего преобразования, растягивания во времени или сочетания преобразования с растягиванием во времени комплекснозначного сигнала исходного поддиапазона с целью генерирования сигнала целевого поддиапазона.
Экстрактор 201 блоков делает из комплекснозначного входного сигнала выборку конечного кадра, состоящего из дискретных значений. Кадр определяется положением входного указателя и коэффициентом преобразования поддиапазонов. Этот кадр претерпевает нелинейную обработку в секции 202 обработки и затем подвергается оконной обработке окнами конечной и, возможно, переменной длины в секции 203 оконной обработки. Результирующие дискретные значения добавляются к предыдущим выходным дискретным значениям в модуле 204 наложения и сложения, где положение выходного кадра определяется положением выходного указателя. Входной указатель увеличивается на фиксированную величину, и выходной указатель увеличивается на ту же величину, умноженную на коэффициент растягивания поддиапазонов. Повторение данной цепочки операций будет приводить к выходному сигналу с длительностью, которая представляет собой длительность входного сигнала поддиапазона, умноженную на коэффициент растягивания, вплоть до длины окна синтеза, и с комплексными частотами, преобразованными посредством коэффициента преобразования поддиапазонов. Управляющий сигнал 104 может оказывать влияние на каждую из трех секций 201, 202, 203.
Фиг. 3 иллюстрирует действие нелинейной обработки блока поддиапазонов с двумя входными сигналами поддиапазонов. Для заданных целевых значений физического растягивания во времени и преобразования и физических параметров блоков 101 и 103 анализирующих и синтезирующих фильтров выводятся параметры растягивания во времени и преобразования поддиапазонов, а также два индекса исходных поддиапазонов для каждого индекса целевого поддиапазона. В случае, когда нелинейная обработка блока поддиапазонов подлежит использованию для создания недостающих гармоник путем добавления перекрестных произведений, конфигурация секций 301-1, 301-2, 302, 303, а также значения двух индексов исходных поддиапазонов могут зависеть от выходного сигнала 403 модуля 404 управления перекрестной обработкой. Целью обработки блока поддиапазонов является реализация соответствующего преобразования, растягивания во времени или сочетания преобразования с растягиванием во времени для комбинации двух комплекснозначных сигналов исходных поддиапазонов с целью генерирования сигнала целевого поддиапазона. Первый экстрактор 301-1 блоков делает из первого комплекснозначного исходного поддиапазона выборку конечного временного кадра дискретных значений, а второй экстрактор 301-2 блоков делает выборку конечного временного кадра дискретных значений из второго комплекснозначного исходного поддиапазона. Кадры определяются общим положением входного указателя и коэффициентом преобразования поддиапазонов. Оба кадра претерпевают нелинейную обработку в секции 302 и затем подвергаются оконной обработке окном конечной длины в секции 303 оконной обработки. Модуль 204 наложения и сложения может характеризоваться конструкцией, аналогичной или идентичной модулю, представленному на фиг. 2. Повторение данной цепочки операций будет приводить к выходному сигналу с длительностью, равной длительности двух входных сигналов поддиапазонов, умноженной на коэффициент растягивания поддиапазонов (вплоть до длины окна синтеза). В случае, когда оба входных сигнала несут одинаковые частоты, выходной сигнал будет иметь комплексные частоты, преобразованные посредством коэффициента преобразования поддиапазонов. В случае, когда два входных сигнала несут различные частоты, настоящее изобретение указывает, что оконная обработка 303 может быть адаптирована для генерирования выходного сигнала, который имеет целевую частоту, пригодную для генерирования недостающих гармоник в преобразованном сигнале.
Фиг. 4 иллюстрирует принцип усиленного перекрестными произведениями преобразования на основе блока поддиапазонов, растягивания во времени или сочетания преобразования с растягиванием во времени. Модуль 401 прямой обработки поддиапазонов может относится к типу, уже описанному с отсылкой к фиг. 2 (секция 202) или фиг. 3. В модуль 402 перекрестной обработки поддиапазонов также подается множество комплекснозначных сигналов поддиапазонов, и на его действие оказывают влияние данные 403 управления перекрестной обработкой. Модуль 402 перекрестной обработки поддиапазонов выполняет обработку блоков поддиапазонов, относящуюся к типу обработки с двумя входными сигналами поддиапазонов, описанному на фиг. 3, и выходные целевые поддиапазоны добавляются к поддиапазонам из прямой обработки 401 поддиапазонов в сумматоре 405. Данные 403 управления перекрестной обработкой могут изменяться для каждого положения входного указателя и состоят из, по меньшей мере, следующих данных:
- выбранного списка индексов целевых поддиапазонов;
- пары индексов исходных поддиапазонов для каждого выбранного индекса целевого поддиапазона; и
- окна синтеза конечной длины.
Модуль 404 управления перекрестной обработкой доставляет указанные данные 403 управления перекрестной обработкой для заданной части управляющих данных 104, описывающих основную частоту, и множество комплекснозначных выходных сигналов поддиапазонов из блока 101 анализирующих фильтров. Управляющие данные 104 также могут нести другие зависящие от сигнала параметры конфигурации, которые оказывают влияние на обработку перекрестных произведений.
В нижеследующем тексте с отсылкой к фиг. 1-4 и при помощи добавления соответствующей математической терминологии будет дано описание принципов усиленного перекрестными произведениями растягивания во времени и преобразования на основе блока поддиапазонов.
Двумя главными параметрами конфигурации общего гармонического преобразователя и/или устройства растягивания во времени в целом являются:
- Sϕ - требуемый коэффициент физического растягивания во времени, и
- Qϕ - требуемый коэффициент физического преобразования.
Блоки 101, 103 фильтров могут относиться к любому типу модулированных фильтров с комплексной экспонентой, такому как QMF или оконное DFT, или вейвлет-преобразование. Блок 101 анализирующих фильтров и блок 103 синтезирующих фильтров может являться равномерно или неравномерно скомпонованным при модуляции и определяться из широкого диапазона фильтров-прототипов и/или окон. Несмотря на то, что все указанные варианты второго порядка влияют на такие детали при последующем проектировании, как коррекции фаз и управление отображением поддиапазонов, главные проектные параметры системы для обработки поддиапазонов, как правило, получаются из двух частных: ΔtS/ΔtА и ΔfS/ΔfA нижеследующих четырех параметров блоков фильтров, где все параметры измеряются в физических единицах. В приведенных выше частных:
- ΔtA - шаг или сдвиг по времени дискретного значения поддиапазона блока 101 анализирующих фильтров (например, измеряемый в секундах, [с]);
- ΔfA - разнос частот поддиапазонов блока 101 анализирующих фильтров (например, измеряемый в Герцах, [1/с]);
- ΔtS - шаг или сдвиг по времени дискретного значения поддиапазона блока 103 синтезирующих фильтров (например, измеряемый в секундах, [с]); и
- ΔfS - разнос частот поддиапазонов блока 103 синтезирующих фильтров (например, измеряемый в Герцах, [1/с]).
Для конфигурирования модуля 102 обработки поддиапазонов следует рассчитать следующие параметры:
- S - коэффициент растягивания поддиапазонов, т.е. коэффициент растягивания, который применяется в модуле 102 обработки поддиапазонов как соотношение входного и выходного дискретных значений с целью достижения общего физического растягивания во времени сигнала во временной области посредством коэффициента Sϕ;
- Q - коэффициент преобразования поддиапазонов, т.е. коэффициент преобразования, который применяется в модуле 102 обработки поддиапазонов с целью достижения общего физического преобразования сигнала во временной области посредством коэффициента Sϕ; и
- соответствие между индексами исходного и целевого поддиапазонов, где n обозначает индекс анализируемого поддиапазона, входящего в модуль 102 обработки поддиапазонов, и m обозначает индекс соответствующего синтезируемого поддиапазона как выходного сигнала модуля 102 обработки поддиапазонов.
С целью определения коэффициента S растягивания поддиапазонов сделано наблюдение, что входной сигнал в блок 101 анализирующих фильтров, имеющий физическую длительность D, соответствует количеству D/ΔtA дискретных значений анализируемых поддиапазонов на входе в модуль 102 обработки поддиапазонов. Эти D/ΔtA дискретных значений будут растягиваться до S⋅D/ΔtA дискретных значений модулем 102 обработки поддиапазонов, который применяет коэффициент S растягивания поддиапазонов. На выходе блока 103 синтезирующих фильтров эти S⋅D/ΔtA дискретных значений приводят к выходному сигналу, имеющему физическую длительность ΔtA⋅S⋅D/ΔtA. Поскольку эта последняя длительность должна соответствовать заданному значению Sϕ⋅D, т.е. поскольку длительность выходного сигнала во временной области должна быть растянута во времени по сравнению с входным сигналом во временной области посредством коэффициента Sϕ физического растягивания во времени, получается следующее правило проектирования:
Figure 00000001
С целью определения коэффициента Q преобразования поддиапазонов, который применяется в модуле 102 обработки поддиапазонов для достижения физического преобразования Qϕ, сделано наблюдение, что входная синусоида в блок 101 анализирующих фильтров с физической частотой Ω будет приводить к комплексному сигналу анализируемого поддиапазона с дискретной по времени угловой частотой ω=2πΩ⋅ΔtA, и главный вклад вносится от анализируемого поддиапазона с индексом n≈Ω/ΔfA. Выходная синусоида на выходе блока 103 синтезирующих фильтров с требуемой преобразованной физической частотой Ωϕ⋅Ω будет являться результатом подачи на синтезируемый поддиапазон с индексом m≈Ωϕ⋅Ω/Δfs комплексного сигнала поддиапазона с дискретной угловой частотой 2πQϕ⋅Ω⋅ΔtS. В этом контексте, следует проявлять осторожность с тем, чтобы избежать синтеза частот с наложением спектров, отличающихся от Qϕ⋅Ω. Как правило, этого можно избежать, делая соответствующие варианты второго порядка так, как это обсуждалось выше, например, путем выбора соответствующих блоков анализирующих и/или синтезирующих фильтров. Дискретная частота 2πQϕ⋅Ω⋅ΔtS на выходе модуля 102 обработки поддиапазонов должна соответствовать дискретной по времени частоте ω=2πQ⋅ΔtA на входе в блок 102 обработки поддиапазонов, умноженной на коэффициент Q преобразования поддиапазонов. Т.е. приравнивая 2πQΩΔtA к 2πQϕ⋅Ω⋅ΔtS, можно определить следующее соотношение между коэффициентом Qϕ физического преобразования и коэффициентом Q преобразования поддиапазонов:
Figure 00000002
Аналогично, соответствующий индекс n исходного, или анализируемого, поддиапазона модуля 102 обработки поддиапазонов для заданного индекса m целевого, или синтезируемого, поддиапазона должен удовлетворять следующему условию:
Figure 00000003
В одном из вариантов осуществления изобретения, верно, что Δfs/ΔfA=Qϕ, т.е. разнос частот блока 103 синтезирующих фильтров соответствует разносу частот блока 101 анализирующих фильтров, умноженному на коэффициент физического преобразования, и можно применить взаимнооднозначное отображение индекса анализируемого поддиапазона в индекс синтезируемого поддиапазона n=m. В других вариантах осуществления изобретения отображение индексов поддиапазонов может зависеть от деталей параметров блока фильтров. В частности, если частное разносов частот блока 103 синтезирующих фильтров и блока 101 анализирующих фильтров отличается от коэффициента Qϕ физического преобразования, то данному целевому поддиапазону может присваиваться один или два исходных поддиапазона. В случае двух исходных поддиапазонов может оказаться предпочтительным использование двух смежных исходных поддиапазонов с индексами n, n+1, соответственно. То есть первый и второй исходные поддиапазоны имеют вид или (n(m), n(m)+1), или (n(m)+1, n(m)).
Обработка поддиапазонов, представленных на фиг. 2, с единственным исходным поддиапазоном теперь будет описываться как функция параметров S и Q обработки поддиапазонов. Пусть х(k) - входной сигнал в экстрактор 201 блоков, и пусть h - входной шаг блока. Т.е. х(k) - комплекснозначный сигнал анализируемого поддиапазона с индексом n. Блок, извлекаемый экстрактором 201 блоков, можно без потери общности рассматривать как определяемый L=R1+R2 дискретными значениями:
Figure 00000004
где целое число l - индекс подсчета блоков, L - длина блока, и R1, R2 - неотрицательные целые числа. Отметим, что для Q=1 блок извлекается из следующих друг за другом дискретных значений, но для Q больше 1 - выполняется понижающая дискретизация таким образом, чтобы входные адреса растягивались посредством коэффициента Q. Если Q - целое число, эта операция, как правило, является выполняемой непосредственно, в то время как для нецелочисленных значений Q может потребоваться интерполяция. Это утверждение также справедливо и для нецелочисленных значений приращения h, т.е. для входного шага блока. В одном из вариантов осуществления изобретения, к комплекснозначному сигналу поддиапазона могут быть применены короткие интерполирующие фильтры, например, фильтры, имеющие два звена фильтра. Например, если требуется дискретное значение с дробным временным индексом k+0,5, достаточное качество может обеспечиваться двухзвенной интерполяцией в форме x(k+0,5)≈ax(k)+bx(k+1), где коэффициенты a, b могут представлять собой постоянные или могут зависеть от индекса поддиапазона (см., например, документы WO №2004/097794 и WO №2007/085275).
Интересным частным случаем формулы (4) является Ri=0, R2=1, где извлекаемый блок состоит из единственного дискретного значения, т.е. длина блока составляет L=1.
В полярном представлении комплексного числа z=|z| exp(i∠z), где |z| - амплитуда комплексного числа, и ∠z - фаза комплексного числа, модуль 202 нелинейной обработки, генерирующий выходной кадр у1 из входного кадра хi преимущественно, определяется коэффициентом модификации фаз T=SQ через:
Figure 00000005
,
где ρ∈[0,1] - геометрический весовой параметр амплитуды. Случай ρ=0 соответствует чистой модификации фаз извлекаемого блока. Особенно привлекательным значением взвешивания амплитуды является ρ=1-1/Т, для которого снятие некоторой вычислительной сложности получается независимо от длины блока L, и результирующая переходная характеристика несколько улучшается относительно случая ρ=0. Параметр θ коррекции фазы зависит от деталей блока фильтров, а также индексов исходного и целевого поддиапазонов. В одном из вариантов осуществления изобретения, параметр θ коррекции фазы может определяться экспериментально путем развертки набора входных синусоид. Кроме того, параметр θ коррекции фазы может быть получен путем изучения разности фаз смежных комплексных синусоид целевого поддиапазона или путем оптимизации производительности на входном сигнале типа импульса Дирака. Наконец, при подходящей конструкции блоков 101 и 103 анализирующих и синтезирующих фильтров параметр θ коррекции фазы может быть приравнен нулю или опущен. Коэффициент Т модификации фаз должен быть целым числом с тем. чтобы коэффициенты Т-1 и 1 были целыми числами в линейной комбинации фаз в первой строке формулы (5). При таком допущении, т.е. при допущении, что коэффициент Т модификации фаз является целым числом, результат нелинейной обработки является вполне определенным даже несмотря на то, что фазы являются неоднозначными из-за модуля идентификации 2π.
На словах, формула (5) устанавливает, что фаза дискретного значения выходного кадра определяется смещением фазы соответствующего дискретного значения входного кадра на постоянную величину смещения. Постоянная величина смещения может зависеть от коэффициента Т модификации, который сам по себе зависит от коэффициента растягивания поддиапазонов и/или от коэффициента преобразования поддиапазонов. Кроме того, постоянная величина смещения может зависеть от фазы особого дискретного значения входного кадра из входного кадра. Указанное особое дискретное значение входного кадра сохраняется неизменным для определения фаз всех дискретных значений выходного кадра для данного блока. В случае формулы (5) в качестве фазы особого дискретного значения входного кадра используется фаза центрального дискретного значения входного кадра.
Вторая строка формулы (5) устанавливает, что амплитуда дискретного значения выходного кадра может зависеть от амплитуды соответствующего дискретного значения входного кадра. Кроме того, амплитуда дискретного значения выходного кадра может зависеть от амплитуды особого дискретного значения входного кадра. Данное особое дискретное значение входного кадра может использоваться для определения амплитуды всех дискретных значений выходного кадра. В случае формулы (5), в качестве особого дискретного значения входного кадра используется центральное дискретное значение входного кадра. В одном из вариантов осуществления изобретения, амплитуда дискретного значения выходного кадра может соответствовать геометрическому среднему амплитуды соответствующего дискретного значения входного кадра и особого дискретного значения входного кадра.
В модуле 203 оконной обработки к выходному кадру применяется окно w длины L, что приводит к оконному выходному кадру:
Figure 00000006
Наконец, предполагается, что все кадры дополняются нулями, и операция 204 наложения и сложения определяется как
Figure 00000007
где следует отметить, что модуль 204 наложения и сложения применяет шаг блока Sh, т.е. шаг по времени, который в h раз больше, чем шаг h входного блока. По причине указанной разности в шагах по времени по формулам (4) и (7) длительность выходного сигнала z(k) в S раз больше длительности входного сигнала х(к), т.е. сигнал синтезируемого поддиапазона является растянутым посредством коэффициента S растягивания поддиапазонов по сравнению с сигналом анализируемого поддиапазона. Следует отметить, что данное наблюдение, как правило, применимо тогда, когда длина L окна пренебрежимо мала по сравнению с длительностью сигнала.
В случае, когда в качестве входного сигнала обработки 102 поддиапазонов используется комплексная синусоида, т.е. сигнал анализируемого поддиапазона соответствует комплексной синусоиде:
Figure 00000008
применяя формулы (4)-(7), можно определить, что выходной сигнал обработки 102 поддиапазонов, т.е. соответствующего сигнала синтезируемого поддиапазона, имеет вид:
Figure 00000009
независимо от ρ. Таким образом, комплексная синусоида с дискретной по времени частотой ω будет преобразовываться в комплексную синусоиду с дискретной по времени частотой Qω при условии, что окно синтеза смещается с шагом Sh, что в сумме для всех k приводит к одной и той же постоянной К:
Figure 00000010
Для иллюстрации рассмотрим частный случай чистого преобразования, где S=1 и T=Q. Если шаг входного блока h=1 и R1=0, R2=1, все вышеуказанное, т.е. формула (5), сокращается до поточечного или основанного на дискретных значениях правила модификации фаз:
Figure 00000011
Для задания определенных параметров обработки, т.е. длины блока в экстракторах блоков, модуль 102 обработки поддиапазонов может использовать управляющие данные 104.
Ниже описание обработки поддиапазонов будет расширено для охвата случая, представленного на фиг. 3, с двумя входными сигналами поддиапазонов. Пусть х(l)(k) - сигнал входного поддиапазона в первый экстрактор 301-1 блоков, и пусть х(2)(k) - сигнал входного поддиапазона во второй экстрактор 301-2 блоков. Каждый экстрактор может использовать отличающийся коэффициент понижающей дискретизации, что приводит к извлекаемым блокам:
Figure 00000012
Нелинейная обработка 302 генерирует выходной кадр у1 и может определяться как
Figure 00000013
обработка в 303 снова описывается формулами (6) и (7), и обработка 204 идентична обработке наложения и сложения, описанной в контексте случая с единственным входным сигналом.
Определение неотрицательных действительных параметров D1, D2, ρ, неотрицательных целочисленных параметров Т1, Т2 и окна синтеза w теперь зависит от требуемого рабочего режима. Отметим, что если на оба входа подается один и тот же поддиапазон, х(1)(k)=х(2)(k) и D1=Q, D2=Q, T1=1, Т2=Т-1, то операции по формулам (12) и (13) сокращаются до операций по формулам (3) и (4) в случае единственного входного сигнала.
В одном из вариантов осуществления изобретения, где соотношение разноса Δfs частот блока 103 синтезирующих фильтров и разноса ΔfA частот блока 101 анализирующих фильтров отличается от требуемого коэффициента Qϕ физического преобразования, может оказаться полезным определение дискретных значений синтезируемого поддиапазона с индексом m из двух анализируемых поддиапазонов, соответственно, с индексами n, n+1. Для заданного индекса m соответствующий индекс n может иметь вид целочисленного значения, получаемого путем усечения значения n анализируемого индекса, имеющего вид согласно формуле (3). Один из сигналов анализируемых поддиапазонов, например, сигнал анализируемого поддиапазона, соответствующий индексу n, подается в первый экстрактор 301-1 блоков, а другой сигнал анализируемого поддиапазона, например, сигнал, соответствующий индексу n+1, подается во второй экстрактор 301-2 блоков. На основе указанных двух сигналов анализируемых поддиапазонов путем описанной выше обработки определяется сигнал синтезируемого поддиапазона, соответствующий индексу m. Назначение смежных сигналов анализируемых поддиапазонов двум экстракторам 301-1 и 302-1 блоков может основываться на остатке, который получается при усечении значения индекса по формуле (3), т.е. на разности между точным значением индекса, имеющим вид согласно формуле (3), и усеченным целочисленным значением n, полученным по формуле (3). Если остаток больше 0,5, то сигнал анализируемого поддиапазона, соответствующий индексу n, может назначаться во второй экстрактор 301-2 блоков, в противном случае, этот сигнал анализируемого поддиапазона может назначаться в первый экстрактор 301-1 блоков. В данном рабочем режиме параметры могут проектироваться так, чтобы сигналы входных поддиапазонов совместно использовали одинаковую комплексную частоту ω:
Figure 00000014
что приводит к сигналу выходного поддиапазона, который представляет собой комплексную синусоиду с дискретной по времени частотой Qω. Оказывается, это происходит в том случае, когда верны следующие соотношения:
Figure 00000015
Для рабочего режима генерирования недостающих гармоник посредством перекрестных произведений проектные критерии отличаются. Возвращаясь к параметру Qϕ физического преобразования, целью добавления перекрестных произведений является генерирование выходного сигнала на частотах QϕΩ+rΩ0, где r=1,…,Qϕ-1, при заданных входных сигналах на частотах Ω и Ω+Ω0, где Ω0 - основная частота, принадлежащая к преобладающей составляющей основного тона входного сигнала. Как описывается в документе WO 2010/081892, селективное добавление этих членов будет приводить к заполнению гармонических рядов и значительному ослаблению артефакта паразитного основного тона.
Ниже будет описан конструктивный алгоритм работы управления 404 перекрестной обработкой. Для заданного индекса m целевого выходного поддиапазона, параметра r=1,…,Qϕ-1 и основной частоты Ω0 соответствующие индексы n1 и n2 исходных поддиапазонов можно получить путем решения в приближенном смысле следующей системы уравнений:
Figure 00000016
где σ=1/2 для неравномерно скомпонованной модуляции блока фильтров (которая обычно используется для блоков QMF- и MDCT- фильтров) и σ=0 для равномерно скомпонованной модуляции блока фильтров (которая обычно используется для блоков FFT-фильтров).
Для определений
- p=Ω0/ΔfA - основная частота, измеряемая в единицах разноса частот блока анализирующих фильтров;
- F=Δfs/ΔfA - отношение разносов частот синтезируемых и анализируемых поддиапазонов; и
- nf=((m+σ)F-rp)⋅Qϕ - σ - действительнозначный целевой индекс для низшего исходного индекса с целочисленным значением,
пример преимущественного приближенного решения системы уравнений (16) имеет вид выбора n1 как целого числа, ближайшего к nf, и n2 - как целого числа, ближайшего к nf+р.
Если основная частота меньше, чем разнос частот блока анализирующих фильтров, т.е. если р меньше 1, может оказаться преимущественной отмена добавления перекрестных произведений.
Как указывается в документе WO 2010/081892, перекрестное произведение не следует добавлять к выходному поддиапазону, который уже содержит значительный основной вклад от преобразования без перекрестных произведений. Более того, вклад в перекрестное произведение должен вносить, самое большее, один из случаев r=1,…, Qϕ-1. В данном описании эти правила могут осуществляться путем выполнения следующих трех этапов для каждого индекса m целевого выходного поддиапазона:
1. Рассчитать максимальную амплитуду Мс по всем вариантам r=1,…,Qϕ-1 минимальной из амплитуд исходных поддиапазонов-кандидатов |x(1)| и |x(2)|, оцененных в центральном кванте времени k=hl (или в его окрестности), где исходные поддиапазоны х(1) и х(2) могут иметь вид индексов n1 и n2, как в уравнении (16);
2. Рассчитать соответствующую амплитуду Ms для прямого исходного члена |x|, полученного из исходного поддиапазона с индексом n=(F/Qϕ)m (ср. уравнение (3));
3. Привести в действие перекрестный член из победившего варианта для Мс на приведенном выше этапе 1 только в том случае, если Мс больше qMs, где q - предварительно определенная пороговая величина.
В зависимости от конкретных параметров конфигурации системы могут оказаться желательными изменения этой процедуры. Одним из таких изменений является замена жесткого порога на этапе 3 более мягкими правилами, зависящими от частного Мcs. Другое изменение заключается в распространении максимизации на этапе 1 на более чем Qϕ-1 вариантов, например, определяемых конечным перечнем значений-кандидатов для основной частоты, измеренных в единицах p разноса анализируемых частот. Еще одно изменение заключается в применении других количественных показателей амплитуд поддиапазонов, таких как амплитуда фиксированного дискретного значения, максимальная амплитуда, средняя амплитуда, амплитуда в смысле lϕ-нормы и т.д.
Перечень целевых исходных полос m, выбранных для добавления перекрестного произведения, совместно со значениями n1 и n2 составляет основную часть данных 403 управления перекрестной обработкой. Остается описать параметры конфигурации D1, D2, ρ, неотрицательные целочисленные параметры T1, Т2, появляющиеся при чередовании фаз (13), и окно синтеза w, предназначенное для использования в перекрестной обработке 402 поддиапазонов. Вставка синусоидальной модели в ситуацию с перекрестным произведением приводит к следующим сигналам исходных поддиапазонов:
Figure 00000017
где ω=2πΩΔtA и ω0=2πΩ0ΔtA. Аналогично, требуемый выходной поддиапазон имеет форму
Figure 00000018
Вычисления обнаруживают, что данный целевой выходной сигнал можно получить, если выполнить условие (15) совместно с
Figure 00000019
Условия (15) и (19) эквивалентны следующему выражению:
Figure 00000020
которое определяет целочисленные коэффициенты T1, Т2 для модификации фаз в (13) и предоставляет некоторую свободу в проектировании при задании значений коэффициентов понижающей дискретизации D1, D2. Весовой параметр амплитуд преимущественно можно выбрать как ρ=r/Qϕ. Как видно, эти параметры конфигурации зависят только от основной частоты Q0 через выбор r. Однако для того, чтобы было верно уравнение (18), возникает новое условие для окна w синтеза, а именно:
Figure 00000021
Окно w синтеза, которое или точно, или приблизительно удовлетворяет условию (21), должно предусматриваться в последнем элементе данных 403 управления перекрестной обработкой.
Отметим, что приведенный выше алгоритм для расчета данных 403 управления перекрестной обработкой на основе таких входных параметров, как индекс т целевого выходного поддиапазона и основная частота Ω0 имеет чисто иллюстративную сущность и, как таковой, не ограничивает объем изобретения. Изменения данного раскрытия в пределах знаний и повседневного опыта специалистов в данной области, например, дополнительный способ обработки на основе блока поддиапазонов, создающий сигнал (18) как выходной сигнал в ответ на входные сигналы (17), полностью подпадают под объем настоящего изобретения.
Фиг. 5 иллюстрирует пример сценария для применения преобразования на основе блока поддиапазонов с использованием нескольких порядков преобразования в аудиокодеке, усиленном HFR. Передаваемый битовый поток принимается базовым декодером 501, который создает декодированный базовый сигнал с низкочастотной полосой пропускания. на частоте дискретизации fs. Декодированный сигнал с низкочастотной полосой пропускания повторно дискретизируется до выходной частоты дискретизации 2fs при помощи 32-полосного блока 502 комплексных модулированных анализирующих QMF, за которым следует 64-полосный блок 505 синтезирующих QMF (обратных QMF). Оба блока 502 и 505 фильтров совместно использую) одни и те же физические параметры Δts=ΔtA и Δfs=ΔfA, и модуль 504 HFR-обработки просто пропускает немодифицированные. низкочастотные поддиапазоны, соответствующие базовому сигналу с низкочастотной полосой пропускания. Высокочастотное содержимое выходного сигнала получается путем подачи более высокочастотных поддиапазонов в 64-полосный блок 505 синтезирующих QMF с выходными полосами из модуля 503 многократного преобразователя, подвергания формированию спектра и модификации, выполняемой модулем 504 HFR-обработки. Многократный преобразователь 503 принимает в качестве входного сигнала декодированный базовый сигнал и выводит множество сигналов поддиапазонов, которые представляют 64-полосный анализ суперпозиции, или комбинации нескольких преобразованных составляющих сигнала. Цель заключается в том, чтобы, если HFR-обработка обходится, каждая составляющая соответствовала целочисленному физическому преобразованию без растягивания базового сигнала во времени (Qϕ=2, 3…, и Sϕ=1). В сценарии согласно изобретению сигнал 104 управления преобразователем содержит данные, описывающие основную частоту. Эти данные могут либо передаваться посредством битового потока из соответствующего аудиокодера, либо выводиться путем обнаружения основного тона в декодере, либо получаться из сочетания передаваемой и обнаруживаемой информации.
Фиг. 6 иллюстрирует пример сценария работы преобразования нескольких порядков на основе блока поддиапазонов, применяющего единственный 64-полосный блок анализирующих QMF-фильтров. Здесь генерированию и доставке в область 64-полосного QMF, действующего на частоте дискретизации 2fs, подлежат три порядка преобразования Qϕ=2, 3, 4. Модуль 603 слияния просто выбирает и комбинирует значимые поддиапазоны из ветвей каждого из порядков преобразования в единое множество QMF-поддиапазонов, подлежащих подаче в модуль HFR-обработки. Целью, в особенности, является то, чтобы цепочка обработки, состоящая из 64-полосного QMF-анализа 601, модуля 602-Qϕ обработки поддиапазонов и 64-полосного QMF-синтеза 605, приводила к физическому преобразованию с коэффициентом Qϕ и Sϕ=1 (т.е. без растягивания). При идентификации трех указанных блоков посредством 101, 102 и 103 по фиг. 1 обнаруживается, что ΔtA=64fs и ΔfA=fs/128, поэтому ΔtS/ΔtA=1/2 и F=ΔfS/ΔfA=2. Проектирование конкретных параметров конфигурации для 602-Qϕ будет описываться для каждого из случаев Qϕ=2, 3, 4 отдельно. Для всех случаев шаг анализа выбирается как h=1, и предполагается, что известен нормализованный параметр основной частоты ρ=Ω0/ΔfA=128Ω0/fs.
В первую очередь, рассмотрим случай Qϕ=2. В этом случае, 602-2 должен выполнять растягивание поддиапазона с коэффициентом S=2 и преобразование поддиапазона с коэффициентом Q-1 (т.е. не выполнять преобразование), соответствие между исходным n и целевым m поддиапазонами для прямой обработки поддиапазонов имеет вид n=m. В сценарии добавления перекрестного произведения согласно изобретению существует только один тип перекрестных произведений для рассмотрения, а именно: r=1 (см. выше обсуждение после уравнения (15)), и уравнения (20) сокращаются до T1=T2=1 и D1+D2=1. Пример решения состоит из выбора D1=0 и D2=1. В качестве окна синтеза при прямой обработке может использоваться прямоугольное окно четной длины L=10 с R1=R2=5, поскольку оно удовлетворяет условию (10). Для окна синтеза при перекрестной обработке может использоваться короткое окно с L=2 звеньев и R1=R2=1 для того, чтобы поддерживать дополнительную сложность добавления перекрестных произведений на минимальном уровне. Тем не менее, благоприятный эффект использования длинного блока для обработки поддиапазонов является наиболее значительным в случае сложных звуковых сигналов, где подавляются нежелательные комбинационные члены; в случае преобладающего основного тона, возникновение указанных артефактов менее вероятно. Окно с L=2 звеньев является самым коротким из тех, которые могут удовлетворять условию (10), поскольку h=1 и S=2. Однако, согласно настоящему изобретению, окно преимущественно удовлетворяет условию (21). При имеющихся параметрах это эквивалентно следующему условию:
Figure 00000022
которое выполняется путем выбора w(0)=1 и w(-1)=exp(iα)=exp(iπp/2).
Для случая Qϕ=3 технические условия для 602-3, имеющие вид условий (1)-(3), таковы, что он должен выполнять растягивание поддиапазона S=2, преобразование поддиапазона Q=3/2, и соответствие между исходным n и целевым m поддиапазонами для обработки прямых членов имеет вид n≈2m/3. Существует два типа членов с перекрестным произведением - r=1, 2, - и уравнения (20) сокращаются до
Figure 00000023
Пример решения состоит из выбора параметров понижающей дискретизации как
- D1=0 и D2=3/2 для r=1;
- D1=3/2 и D2=0 для r=1.
В качестве окна синтеза при прямой обработке можно использовать прямоугольное окно четной длины L=8 с R1=R2=4. В качестве окна обработки перекрестных произведений может использоваться короткое окно с L=2 звеньев и R1=R2=1, удовлетворяющее условию
Figure 00000024
которое выполняется путем выбора w(0)=1 и w(-1)=exp(iα).
В случае Qϕ=4 технические условия для 602-4, имеющие вид условий (1)-(3), таковы, что он должен выполнять растягивание поддиапазона с коэффициентом S=2, преобразование поддиапазона с коэффициентом Q=2, и соответствие между исходным n и целевым m поддиапазонами для обработки прямых членов имеет вид n=2m. Существует три типа членов с перекрестным произведением, - r=1, 2, 3, - и уравнения (20) сокращаются до
Figure 00000025
Пример решения состоит в выборе
- D1=0 и D2=2 для r=1;
- D1=0 и D2=1 для r=2;
- D1=2 и D2=0 для r=3.
В качестве окна синтеза при прямой обработке можно использовать прямоугольное окно четной длины L=6 с R1=R2=3. В качестве окна обработки перекрестных произведений может использоваться короткое окно с L=2 звеньев и R1=R2=1, удовлетворяющее условию
Figure 00000026
которое выполняется путем выбора w(0=1) и w(-1)=exp(iα).
В каждом из вышеописанных случаев, где применимо более чем одно значение r, будет происходить выбор, например, аналогично трехэтапной процедуре, описанной перед уравнением (17).
Фиг. 7 изображает амплитудный спектр гармонического сигнала с основной частотой Ω0=564,7 Гц. Низкочастотная часть 701 сигнала подлежит использованию в качестве входного сигнала для многократного преобразователя. Целью преобразователя является генерирование сигнала, максимально возможно близкого к высокочастотной части 702 входного сигнала, поэтому передача высокочастотной части 702 становится необязательной, и доступная битовая скорость передачи данных может использоваться экономно.
Фиг. 8 изображает амплитудный спектр выходных сигналов из преобразователя, который содержит в качестве входного сигнала низкочастотную часть 701 сигнала, представленного на фиг. 7. Многократный преобразователь конструируется путем использования 64-полосных блоков QMF-фильтров и входной частоты дискретизации fs=14400 Гц в соответствии с описанием фиг. 5. Однако для ясности рассматривается только два порядка преобразования Qϕ=2, 3. Три разные панели 801-803 представляют конечный выходной сигнал, полученный путем использования разных установок данных управления перекрестной обработкой.
Верхняя панель 801 изображает выходной спектр, полученный тогда, когда отменена вся обработка перекрестных произведений, и активна только прямая обработка 401 поддиапазонов. Это будет тот случай, когда управление 404 перекрестной обработкой не принимает основной тон, или р=0. Преобразование посредством Qϕ=2 генерирует выходной сигнал в диапазоне 4-8 кГц, а преобразование посредством Qϕ=3 генерирует выходной сигнал в диапазоне 8-12 кГц. Как видно, созданные гармоники находятся на большом и возрастающем расстоянии друг от друга, и выходной сигнал существенно отклоняется от целевого высокочастотного сигнала 702. В результирующем выходном звуковом сигнале будут присутствовать слышимые артефакты удвоенного и утроенного «паразитного» основного тона.
Средняя панель 802 изображает выходной спектр, полученный тогда, когда обработка перекрестных произведений активна, используется параметр основного тона р=5 (который служит приближением 128Ω0/fs=5,0196), но для перекрестной обработки поддиапазонов используется простое двухзвенное окно синтеза с w(0)=w(-1)=1, удовлетворяющее условию (10). Это эквивалентно непосредственному сочетанию обработки на основе блока поддиапазонов и гармонического преобразования, усиленного перекрестными произведениями. Как видно, дополнительные составляющие выходного сигнала по сравнению с 801 не вполне совпадают с требуемым гармоническим рядом. Это показывает, что при использовании для обработки перекрестных произведений процедуры, унаследованной от прямой обработки поддиапазонов, обработка приводит к недостаточному для использования качеству звука.
Нижняя панель 803 изображает выходной спектр, полученный по тому же сценарию, что и для средней панели 802. но, в данном случае, с окнами синтеза при перекрестной обработке поддиапазонов, имеющими вид формул, описанных в случае Qϕ=2,3 согласно фиг. 5, то есть: двухзвенного окна синтеза в форме w(0)=1 и w(-1)=exp(iα), удовлетворяющего условию (21), и с указываемым настоящим изобретением характерным признаком, который заключается в том, что оно зависит от р. Как видно, комбинированный выходной сигнал очень хорошо совпадает с требуемым гармоническим рядом 702.
Фиг. 9 показывает участок нелинейной обработки модуля 202 обработки кадров, включающий секции, сконфигурированные для приема двух входных дискретных значений u1, u2 и для генерирования на их основе обрабатываемого дискретного значения w, амплитуда которого имеет вид геометрического среднего амплитуд входных значений, и фаза которого представляет собой линейную комбинацию фаз входных дискретных значений, т.е.:
Figure 00000027
Согласно данному описанию, обрабатываемое значение w можно получить путем предварительной нормализации каждого из дискретных значений u1, u2 в соответствующем преднормализаторе 901, 902 и умножения предварительно нормализованных входных дискретных значений ν1=u1/|u1|a, ν2=u2/|n2|b во взвешенном умножителе 910, который выводит w=v1 αv2 β. Ясно, что действие преднормализаторов 901, 902 и взвешенного умножителя 910 определяется входными параметрами а, b, α и β. Легко удостовериться, что уравнения (22) будут выполняться, если α=Т1, β=Τ2, а=1-ρ/Т1, b=1-(1-ρ)/Т2. Специалисты легко обобщат эту схему на произвольное количество N0 входных дискретных значений, где на умножитель подается N0 входных дискретных значений, некоторые или все из которых были подвергнуты нормализации. Затем можно будет обнаружить, что общая предварительная нормализация (а=b в предположении, что преднормализаторы 901, 902 генерируют одинаковые результаты) возможна, если ρ приравнять к ρ=T1/(T1+T2). Это приводит к вычислительному преимуществу тогда, когда рассматривается большое количество поддиапазонов, поскольку на всех поддиапазонах-кандидатах перед умножением может выполняться общий этап предварительной нормализации. В преимущественной аппаратной реализации ряд одинаково функционирующих преднормализаторов заменяется на единый модуль, который чередуется между дискретными значениями из разных поддиапазонов с разделением по времени.
Дальнейшие варианты осуществления настоящего изобретения станут очевидны специалистам в данной области после прочтения приведенного выше описания. И хотя настоящее описание и графические материалы раскрывают варианты и примеры осуществления изобретения, изобретение не ограничивается данными конкретными примерами. Многочисленные модификации и изменения могут быть сделаны без отступления от объема настоящего изобретения, который определяется сопроводительной формулой изобретения.
Раскрытые выше в данном описании системы и способы могут реализовываться как программное обеспечение, встроенное программное обеспечение, аппаратное обеспечение или их комбинация. Некоторые компоненты или все компоненты могут реализовываться как программное обеспечение, исполняемое процессором цифровой обработки сигналов или микропроцессором, или они могут реализовываться как аппаратное обеспечение или как интегральная микросхема специального назначения. Указанное программное обеспечение может распространяться на машиночитаемых носителях данных, которые могут включать компьютерные носители данных (или непреходящие носители) и средства связи (преходящие носители). Как хорошо известно специалистам в данной области, компьютерные носители данных включают энергозависимые и энергонезависимые, съемные и несъемные носители, реализованные посредством любого способа или технологии хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители данных включают в качестве неограничивающих примеров RAM, ROM, EEPROM, флэш-память или другую технологию памяти, CD-ROM, компакт-диски формата DVD или другой оптический дисковый носитель, магнитные кассеты, магнитную ленту, магнитные дисковые носители или другие магнитные запоминающие устройства, или любой другой носитель данных, который может быть использован для хранения требуемой информации и для доступа компьютера к ней. Как также хорошо известно специалистам в данной области, средства связи, как правило, включают машиночитаемые команды, структуры данных, программные модули или другие данные в модулированном сигнале данных, таком как несущая волна или другой механизм передачи, и включает любые средства доставки информации.

Claims (61)

1. Система, сконфигурированная для генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала, причем система содержит:
блок (101) анализирующих фильтров, сконфигурированный для получения некоторого количества Y≥1 сигналов анализируемых поддиапазонов из входного сигнала, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;
модуль (102) обработки поддиапазонов, сконфигурированный для генерирования сигнала синтезируемого поддиапазона из Y сигналов анализируемых поддиапазонов с использованием коэффициента Q преобразования поддиапазонов и коэффициента S растягивания поддиапазонов, причем по меньшей мере один из коэффициентов Q и S больше единицы, где модуль (102) обработки поддиапазонов содержит:
экстрактор (201) блоков, сконфигурированный для каждого из Y сигналов анализируемых поддиапазонов для:
i) формирования кадра, состоящего из L входных дискретных значений, извлекаемого из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, и длина кадра составляет L>1; и
ii) применения величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед формированием следующего кадра, состоящего из L входных дискретных значений:
модуль (202) нелинейной обработки кадров, сконфигурированный для генерирования на основе Y соответствующих кадров входных дискретных значений, сформированных экстрактором блоков, кадра обрабатываемых
дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для по меньшей мере одного обрабатываемого дискретного значения:
i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и
ii) амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений;
модуль (203) оконной обработки, сконфигурированный для применения к кадру обрабатываемых дискретных значений оконной функции конечной длины, содержащей ряд оконных дискретных значений, причем наложенные и сложенные оконные дискретные значения ряда оконных функций при взвешивании посредством комплексных весовых коэффициентов и сдвиге на величину скачка Sh образуют, в значительной мере, постоянную последовательность; и
модуль (204) сложения и наложения, сконфигурированный для определения сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений, подвергаемых оконной обработке;
и
блок (103) синтезирующих фильтров, сконфигурированный для генерирования растянутого во времени и/или преобразованного по частоте сигнала из по меньшей мере выходного сигнала синтезируемого поддиапазона посредством модуля обработки поддиапазонов,
где система действует, по меньшей мере, при Y=2.
2. Система по п. 1, отличающаяся тем, что
блок (101) анализирующих фильтров представляет собой один из следующего: блока квадратурных зеркальных фильтров, оконного дискретного преобразования Фурье или вейвлет-преобразования; и
блок (103) синтезирующих фильтров представляет собой блок соответствующих обратных фильтров или обратное преобразование.
3. Система по любому из предыдущих пунктов, отличающаяся тем, что блок (101) анализирующих фильтров применяет к входному сигналу шаг анализа по времени - ΔtA;
блок анализирующих фильтров имеет разнос анализируемых частот - ΔfA;
блок анализирующих фильтров содержит количество N анализируемых поддиапазонов, причем N>1, где n - индекс анализируемого поддиапазона, n=0…N-1;
анализируемый поддиапазон из числа N анализируемых поддиапазонов связан с частотной полосой входного сигнала;
блок (103) синтезирующих фильтров применяет к сигналу синтезируемого поддиапазона шаг синтеза по времени - Δts;
блок синтезирующих фильтров имеет разнос синтезируемых частот - Δfs;
блок синтезирующих фильтров содержит количество М синтезируемых поддиапазонов, причем М>1, где m - индекс синтезируемого поддиапазона, причем m=0, …, М-1; и
синтезируемый поддиапазон из числа М синтезируемых поддиапазонов связан с одной из частотных полос растянутого во времени и/или преобразованного по частоте сигнала.
4. Система по п. 3, отличающаяся тем. что модуль (102) обработки поддиапазонов сконфигурирован для Y=2 и дополнительно содержит модуль
(404) управления перекрестной обработкой, сконфигурированный для генерирования данных (403) управления перекрестной обработкой, определяющих индексы n1, n2 поддиапазонов, связанные с сигналами анализируемых поддиапазонов и с индексом m синтезируемого поддиапазона, где указанные индексы соотносятся как приближенные целочисленные решения системы уравнений
Figure 00000028
где Ω0 - основная частота входного сигнала;
σ=0 или ½;
Q=(ΔtS/ΔtA)⋅Qϕ,
Qϕ - коэффициент преобразования
r - целое число, удовлетворяющее неравенству 1≤r≤Qϕ-1.
5. Система по п. 4, отличающаяся тем, что модуль (404) управления перекрестной обработкой сконфигурирован для генерирования управляющих данных обработки так, чтобы индексы n1, n2 поддиапазонов основывались на значении r, которое максимизирует минимальную из амплитуд поддиапазонов двух кадров, сформированных путем извлечения анализируемых дискретных значений из сигналов анализируемых поддиапазонов.
6. Система по п. 5, отличающаяся тем, что амплитуда поддиапазона для каждого кадра, состоящего из L входных дискретных значений, представляет собой амплитуду центрального или ближайшего к центральному дискретного значения.
7. Система по пп. 1 или 2, отличающаяся тем, что экстрактор (201) блоков сконфигурирован для получения, по меньшей мере, одного кадра входных дискретных значений путем понижающей дискретизации комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона.
8. Система по п. 7, отличающаяся тем, что сконфигурирована для Y=2, где экстрактор блоков сконфигурирован для получения первого и второго кадров входных дискретных значений путем понижающей дискретизации комплекснозначных анализируемых дискретных значений, соответственно, в первом и втором сигналах анализируемых поддиапазонов посредством коэффициентов D1 и D2 понижающей дискретизации, удовлетворяющих
Figure 00000029
и неравенству D1≥0, D2>0 или D1>0, D2≥0,
и модуль (202) нелинейной обработки кадров сконфигурирован для определения фазы обрабатываемого дискретного значения на основе линейной комбинации с неотрицательными целочисленными коэффициентами Т1, Т2 соответствующих фаз соответствующего входного дискретного значения в первом и втором кадрах входных дискретных значений.
9. Система по пп. 1 или 2, отличающаяся тем, что следующие друг за другом комплексные весовые коэффициенты отличаются только на фиксированное чередование фаз, причем чередование фаз пропорционально основной частоте входного сигнала.
10. Система по пп. 1 или 2, отличающаяся тем, что модуль (204) наложения и сложения применяет величину скачка к следующим друг за другом кадрам обрабатываемых дискретных значений, причем величина скачка равна величине h скачка блока, умноженной на коэффициент S растягивания поддиапазонов.
11. Система по пп. 1 или 2, отличающаяся тем, что сконфигурирована для Y=2, причем модуль (202) обработки кадров сконфигурирован для определения амплитуды обрабатываемого дискретного значения как среднего значения амплитуды соответствующего входного дискретного значения в первом кадре входных дискретных значений и амплитуды соответствующего входного дискретного значения во втором кадре входных дискретных значений и/или для определения фазы обрабатываемого дискретного значения на основе линейной комбинации с неотрицательными целочисленными коэффициентами (T1, Т2) соответствующих фаз соответствующего входного дискретного значения в первом и втором кадрах входных дискретных значений.
12. Система по пп. 1 или 2, отличающаяся тем. что дополнительно содержит:
ряд модулей (401, 402; 503; 602-2, 602-3, 602-4) обработки поддиапазонов, каждый из которых сконфигурирован для определения сигнала промежуточного синтезируемого поддиапазона с использованием отличающегося значения коэффициента Q преобразования поддиапазонов и/или коэффициента S растягивания поддиапазонов; и
модуль (405; 603) слияния, расположенный за указанным рядом модулей обработки поддиапазонов и перед блоком (103) синтезирующих фильтров, сконфигурированный для слияния соответствующих сигналов промежуточных синтезируемых поддиапазонов с целью определения сигнала синтезируемого поддиапазона.
13. Система по пп. 1 или 2, отличающаяся тем, что
блок (101) анализирующих фильтров сконфигурирован для формирования Y×Z анализируемых поддиапазонов из входного сигнала;
модуль (102) обработки поддиапазонов сконфигурирован для генерирования Z сигналов синтезируемых поддиапазонов из Y×Z сигналов анализируемых поддиапазонов, применяя пару величин S и Q для каждой группы из Y сигналов анализируемых поддиапазонов, на которой основывается один сигнал синтезируемого поддиапазона; и
блок (103) синтезирующих фильтров сконфигурирован для генерирования Z растянутых во времени и/или преобразованных по частоте сигналов из Z сигналов синтезируемых поддиапазонов.
14. Способ генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала, причем способ включает этапы, на которых:
получают число Y≥2 сигналов анализируемых поддиапазонов из входного сигнала, причем каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;
для каждого из Y анализируемых поддипазонов:
формируют кадр, состоящий из L входных дискретных значений, причем кадр извлекают из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, а длина кадра составляет L>1; и
применяют величину скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед получением следующего кадра, состоящего из L входных дискретных значений;
генерируют на основе Y соответствующих кадров полученных таким образом входных дискретных значений кадр обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где по меньшей мере для одного обрабатываемого дискретного значения:
i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в Y кадрах входных дискретных значений; и
ii) амплитуда обрабатываемого значения основывается на амплитуде соответствующего входного дискретного значения в Y кадрах входных дискретных значений;
определяют сигнал синтезируемого поддиапазона путем применения оконной функции конечной длины к каждому кадру обработанных дискретных значений, затем накладывают и складывают дискретные значения последовательности, причем оконная функция содержит ряд оконных дискретных значений, причем наложенные и сложенные оконные дискретные значения ряда оконных функций при взвешивании посредством комплексных весовых коэффициентов и сдвиге на величину скачка Sh образуют, в значительной мере, постоянную последовательность; и
генерируют растянутый во времени и/или преобразованный по частоте сигнал из, по меньшей мере, сигнала синтезируемого поддиапазона.
15. Носитель данных, в памяти которого хранятся машиночитаемые команды, предназначенные для выполнения способа по п. 14.
RU2015105671A 2010-09-16 2011-09-05 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями RU2671619C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US38344110P 2010-09-16 2010-09-16
US61/383,441 2010-09-16
US41916410P 2010-12-02 2010-12-02
US61/419,164 2010-12-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2013117038/08A Division RU2551817C2 (ru) 2010-09-16 2011-09-05 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2018135675A Division RU2682340C1 (ru) 2010-09-16 2018-10-10 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями

Publications (3)

Publication Number Publication Date
RU2015105671A RU2015105671A (ru) 2015-08-20
RU2015105671A3 RU2015105671A3 (ru) 2018-08-27
RU2671619C2 true RU2671619C2 (ru) 2018-11-02

Family

ID=44720852

Family Applications (6)

Application Number Title Priority Date Filing Date
RU2015105671A RU2671619C2 (ru) 2010-09-16 2011-09-05 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2013117038/08A RU2551817C2 (ru) 2010-09-16 2011-09-05 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2018135675A RU2682340C1 (ru) 2010-09-16 2018-10-10 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2019101031A RU2685993C1 (ru) 2010-09-16 2019-01-16 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2019108565A RU2694587C1 (ru) 2010-09-16 2019-03-25 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2019117896A RU2720495C1 (ru) 2010-09-16 2019-06-10 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями

Family Applications After (5)

Application Number Title Priority Date Filing Date
RU2013117038/08A RU2551817C2 (ru) 2010-09-16 2011-09-05 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2018135675A RU2682340C1 (ru) 2010-09-16 2018-10-10 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2019101031A RU2685993C1 (ru) 2010-09-16 2019-01-16 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2019108565A RU2694587C1 (ru) 2010-09-16 2019-03-25 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2019117896A RU2720495C1 (ru) 2010-09-16 2019-06-10 Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями

Country Status (18)

Country Link
US (10) US9172342B2 (ru)
EP (6) EP3975178B1 (ru)
JP (10) JP5951614B2 (ru)
KR (12) KR102014696B1 (ru)
CN (2) CN104851429B (ru)
AU (1) AU2011304113C1 (ru)
BR (4) BR112013005676B1 (ru)
CA (10) CA3191597C (ru)
CL (1) CL2013000717A1 (ru)
DK (3) DK3975178T3 (ru)
ES (3) ES2938725T3 (ru)
IL (12) IL296448A (ru)
MX (1) MX2013002876A (ru)
MY (2) MY155990A (ru)
PL (4) PL2617035T3 (ru)
RU (6) RU2671619C2 (ru)
SG (3) SG188229A1 (ru)
WO (1) WO2012034890A1 (ru)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
EP2682941A1 (de) 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
KR101782916B1 (ko) 2013-09-17 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
WO2015060654A1 (ko) 2013-10-22 2015-04-30 한국전자통신연구원 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
WO2015099429A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
CN108600935B (zh) 2014-03-19 2020-11-03 韦勒斯标准与技术协会公司 音频信号处理方法和设备
KR101856127B1 (ko) 2014-04-02 2018-05-09 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
CN110266287B (zh) * 2019-05-05 2023-06-23 深圳信息职业技术学院 电子耳蜗分数延迟滤波器构造方法、存储介质及电子耳蜗
US10938444B2 (en) * 2019-07-12 2021-03-02 Avago Technologies International Sales Pte. Limited Apparatus and method for noise reduction in a full duplex repeater
US11344298B2 (en) 2019-12-06 2022-05-31 Covidien Lp Surgical stapling device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002041301A1 (en) * 2000-11-14 2002-05-23 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
RU2262748C2 (ru) * 2000-05-19 2005-10-20 Конексант Системз, Инк. Многорежимное устройство кодирования
RU2302665C2 (ru) * 2001-12-14 2007-07-10 Нокиа Корпорейшн Способ модификации сигнала для эффективного кодирования речевых сигналов
WO2010081892A2 (en) * 2009-01-16 2010-07-22 Dolby Sweden Ab Cross product enhanced harmonic transposition
WO2010086461A1 (en) * 2009-01-28 2010-08-05 Dolby International Ab Improved harmonic transposition

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774837A (en) 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6266003B1 (en) * 1998-08-28 2001-07-24 Sigma Audio Research Limited Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
JP3537807B2 (ja) * 2002-02-28 2004-06-14 株式会社神戸製鋼所 デジタルデータ処理装置,およびその方法
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
JP5129117B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
US20070078645A1 (en) * 2005-09-30 2007-04-05 Nokia Corporation Filterbank-based processing of speech signals
EP4178110B1 (en) 2006-01-27 2024-04-24 Dolby International AB Efficient filtering with a complex modulated filterbank
JP2007316254A (ja) * 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
EP2054876B1 (en) 2006-08-15 2011-10-26 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
KR102020334B1 (ko) * 2010-01-19 2019-09-10 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
ES2522171T3 (es) * 2010-03-09 2014-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio usando alineación de borde de patching

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2262748C2 (ru) * 2000-05-19 2005-10-20 Конексант Системз, Инк. Многорежимное устройство кодирования
WO2002041301A1 (en) * 2000-11-14 2002-05-23 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
RU2302665C2 (ru) * 2001-12-14 2007-07-10 Нокиа Корпорейшн Способ модификации сигнала для эффективного кодирования речевых сигналов
WO2010081892A2 (en) * 2009-01-16 2010-07-22 Dolby Sweden Ab Cross product enhanced harmonic transposition
WO2010086461A1 (en) * 2009-01-28 2010-08-05 Dolby International Ab Improved harmonic transposition

Also Published As

Publication number Publication date
IL291501B (en) 2022-12-01
EP3503100A1 (en) 2019-06-26
IL303921B1 (en) 2024-07-01
KR101924326B1 (ko) 2018-12-03
KR20140132370A (ko) 2014-11-17
CA3137515A1 (en) 2012-03-22
IL224785A (en) 2015-08-31
PL2617035T3 (pl) 2019-02-28
MX2013002876A (es) 2013-04-08
ES2933477T3 (es) 2023-02-09
JP6755426B2 (ja) 2020-09-16
CA3043428C (en) 2020-02-18
IL291501B2 (en) 2023-04-01
US20180182404A1 (en) 2018-06-28
EP2617035B1 (en) 2018-10-03
IL240068A0 (en) 2015-08-31
CA2961088A1 (en) 2012-03-22
IL285298B (en) 2022-04-01
DK2617035T3 (da) 2019-01-02
JP2024138185A (ja) 2024-10-07
US20170213563A1 (en) 2017-07-27
IL253387B (en) 2018-06-28
JP6429966B2 (ja) 2018-11-28
KR101744621B1 (ko) 2017-06-09
US20240046940A1 (en) 2024-02-08
PL3975178T3 (pl) 2023-03-13
IL303921A (en) 2023-08-01
US20160006406A1 (en) 2016-01-07
KR102564590B1 (ko) 2023-08-09
KR20240122593A (ko) 2024-08-12
IL278478B (en) 2021-08-31
US9940941B2 (en) 2018-04-10
KR102312475B1 (ko) 2021-10-14
EP4145445B1 (en) 2024-08-28
US10192562B2 (en) 2019-01-29
CL2013000717A1 (es) 2013-07-05
EP4148732A1 (en) 2023-03-15
RU2013117038A (ru) 2014-10-27
JP6218889B2 (ja) 2017-10-25
CA2808353A1 (en) 2012-03-22
EP2617035A1 (en) 2013-07-24
CA3168514A1 (en) 2012-03-22
RU2694587C1 (ru) 2019-07-16
KR20200013092A (ko) 2020-02-05
US20240312470A1 (en) 2024-09-19
MY155990A (en) 2015-12-31
MY176574A (en) 2020-08-17
JP2023086885A (ja) 2023-06-22
SG188229A1 (en) 2013-04-30
US20200395025A1 (en) 2020-12-17
CN103262164A (zh) 2013-08-21
KR102694615B1 (ko) 2024-08-14
EP3975177B1 (en) 2022-12-14
PL4148732T3 (pl) 2024-08-19
JP6849847B2 (ja) 2021-03-31
US11355133B2 (en) 2022-06-07
IL285298A (en) 2021-09-30
KR102014696B1 (ko) 2019-08-27
KR102439053B1 (ko) 2022-09-02
AU2011304113B2 (en) 2015-02-26
JP7273218B2 (ja) 2023-05-12
KR102073544B1 (ko) 2020-02-05
CA3067155A1 (en) 2012-03-22
AU2011304113A1 (en) 2013-03-07
BR122019025115B1 (pt) 2021-04-13
JP2013537322A (ja) 2013-09-30
ES2938725T3 (es) 2023-04-14
RU2720495C1 (ru) 2020-04-30
CN104851429B (zh) 2018-10-19
KR101980070B1 (ko) 2019-05-20
JP7053912B6 (ja) 2022-05-16
CN103262164B (zh) 2015-06-17
IL259070A (en) 2018-06-28
DK3975178T3 (da) 2022-12-05
US11817110B2 (en) 2023-11-14
IL265722A (en) 2019-05-30
US20190108850A1 (en) 2019-04-11
US9735750B2 (en) 2017-08-15
JP2020106867A (ja) 2020-07-09
EP3975177A1 (en) 2022-03-30
IL265722B (en) 2020-11-30
JP7053912B2 (ja) 2022-04-12
CA3168514C (en) 2023-04-11
JP2016173603A (ja) 2016-09-29
KR20190099092A (ko) 2019-08-23
KR20210124538A (ko) 2021-10-14
IL296448A (en) 2022-11-01
US10446161B2 (en) 2019-10-15
KR20170060191A (ko) 2017-05-31
KR20180058847A (ko) 2018-06-01
KR20130081290A (ko) 2013-07-16
CA3067155C (en) 2021-01-19
JP7537723B2 (ja) 2024-08-21
KR101863035B1 (ko) 2018-06-01
EP3975178B1 (en) 2022-11-16
IL291501A (en) 2022-05-01
US20220293113A1 (en) 2022-09-15
AU2011304113C1 (en) 2015-08-06
BR122019025121B1 (pt) 2021-04-27
RU2020111638A (ru) 2021-09-20
BR122019025142B1 (pt) 2021-04-27
CN104851429A (zh) 2015-08-19
US12033645B2 (en) 2024-07-09
RU2015105671A (ru) 2015-08-20
US9172342B2 (en) 2015-10-27
KR20190053306A (ko) 2019-05-17
KR20230119038A (ko) 2023-08-14
JP2022088591A (ja) 2022-06-14
IL253387A0 (en) 2017-09-28
JP2020190757A (ja) 2020-11-26
RU2551817C2 (ru) 2015-05-27
CA3220202A1 (en) 2012-03-22
DK3975177T3 (da) 2023-01-30
US20130182870A1 (en) 2013-07-18
CA3239279A1 (en) 2012-03-22
ES2699750T3 (es) 2019-02-12
US20190378525A1 (en) 2019-12-12
RU2682340C1 (ru) 2019-03-19
SG10201506914PA (en) 2015-10-29
CA3191597A1 (en) 2012-03-22
EP3975178A1 (en) 2022-03-30
JP5951614B2 (ja) 2016-07-13
CA3102325C (en) 2021-12-21
CA2808353C (en) 2017-05-02
CA3102325A1 (en) 2012-03-22
PL3975177T3 (pl) 2023-04-11
CA2961088C (en) 2019-07-02
JP6736634B2 (ja) 2020-08-05
KR20180128983A (ko) 2018-12-04
EP4148732B1 (en) 2024-06-26
EP4148732C0 (en) 2024-06-26
IL298230B1 (en) 2023-07-01
JP2019012295A (ja) 2019-01-24
KR101610626B1 (ko) 2016-04-20
CA3043428A1 (en) 2012-03-22
JP2018022178A (ja) 2018-02-08
BR112013005676B1 (pt) 2021-02-09
RU2685993C1 (ru) 2019-04-23
RU2015105671A3 (ru) 2018-08-27
EP4145445A1 (en) 2023-03-08
KR20220123752A (ko) 2022-09-08
IL313284A (en) 2024-08-01
US10706863B2 (en) 2020-07-07
IL298230A (en) 2023-01-01
WO2012034890A1 (en) 2012-03-22
CA3137515C (en) 2022-09-20
BR112013005676A2 (pt) 2016-05-03
IL298230B2 (en) 2023-11-01
JP2021081754A (ja) 2021-05-27
CA3191597C (en) 2024-01-02
SG10202103492XA (en) 2021-05-28
IL240068A (en) 2017-08-31

Similar Documents

Publication Publication Date Title
RU2720495C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2822612C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2810281C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2801960C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2796943C2 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями