RU2523035C2 - Audio encoder and bandwidth extension decoder - Google Patents
Audio encoder and bandwidth extension decoder Download PDFInfo
- Publication number
- RU2523035C2 RU2523035C2 RU2011126331/08A RU2011126331A RU2523035C2 RU 2523035 C2 RU2523035 C2 RU 2523035C2 RU 2011126331/08 A RU2011126331/08 A RU 2011126331/08A RU 2011126331 A RU2011126331 A RU 2011126331A RU 2523035 C2 RU2523035 C2 RU 2523035C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- frequency band
- audio signal
- input audio
- high frequency
- Prior art date
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41F—PRINTING MACHINES OR PRESSES
- B41F33/00—Indicating, counting, warning, control or safety devices
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41F—PRINTING MACHINES OR PRESSES
- B41F33/00—Indicating, counting, warning, control or safety devices
- B41F33/0036—Devices for scanning or checking the printed matter for quality control
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
Abstract
Description
Варианты осуществления изобретения связаны с обработкой аудио сигнала, а именно, с аудио кодером, способом получения выходного сигнала, декодером, который обеспечивает расширение диапазона частот, и способом получения аудио сигнала с увеличенным диапазоном частот.Embodiments of the invention relate to processing an audio signal, namely, an audio encoder, a method for producing an output signal, a decoder that provides an extension of the frequency range, and a method for producing an audio signal with an increased frequency range.
Кодирование аудио сигналов с учетом их последующего восприятия для того, чтобы уменьшить объем данных для эффективного хранения и передачи информации нашло применение во многих сферах. Известными алгоритмами кодирования являются, например, MPEG 1/2 LAYER 3 "МР3" или MPEG 4 ААС. Применение данных алгоритмов кодирования, особенно при самых низких битрейтах, приводит к снижению качества звука. Это часто вызвано тем, что кодер имеет ограниченный диапазон передаваемых частот. Сигнал, пропущенный через фильтр нижних частот, кодируется при помощи так называемого центрального кодера, а области с более высокими частотами представляются в виде параметров и затем восстанавливаются из области, пропущенной через фильтр нижних частот.The encoding of audio signals taking into account their subsequent perception in order to reduce the amount of data for efficient storage and transmission of information has found application in many fields. Known encoding algorithms are, for example,
Согласно WO 9857436 аудио сигнал подвергается процедуре уменьшения диапазона частот на стороне кодера, при этом кодируется только область низких частот аудио сигнала с помощью кодера высокого качества. Область высоких частот характеризуется очень примерно с помощью набора параметров, которые позволяют восстановить исходный спектр области высоких частот. Затем, на стороне декодера синтезируется полоса высоких частот. Для этой цели предлагается гармоническая транспозиция, когда полоса низких частот декодированного аудио сигнала направляется в банк фильтров. Каналы банка фильтров полосы низких частот соединяются с каналами банка фильтров полосы высоких частот, или «приводятся в соответствие», и каждый такой сигнал, пропущенный через полосно-пропускающий фильтр, подвергается корректировке. Синтезирующий банк фильтров, принадлежащий особому анализирующему банку фильтров, получает фильтрованный сигнал в диапазоне низких частот и скорректированный фильтрованный сигнал диапазона низких частот, который соответствует области высоких частот. Сигнал на выходе синтезирующего банка фильтров представляет собой сигнал, расширенный в соответствии с диапазоном частот аудио сигнала, переданного из кодера в декодер при низкой скорости передачи данных, т.к. вычисления банка фильтров и процесс определения соответствий между диапазонами высоких и низких частот представляет значительные трудности.According to WO 9857436, the audio signal undergoes a frequency range reduction procedure on the encoder side, and only the low frequency region of the audio signal is encoded using a high quality encoder. The high-frequency region is characterized very approximately using a set of parameters that allow you to restore the original spectrum of the high-frequency region. Then, on the decoder side, the high frequency band is synthesized. For this purpose, harmonic transposition is proposed when the low frequency band of the decoded audio signal is sent to the filter bank. The channels of the low-pass filter bank are connected to the channels of the high-pass filter bank, or “matched,” and each such signal passed through the pass-band filter is corrected. A synthesizing filter bank belonging to a special analyzing filter bank receives a filtered signal in the low frequency range and a corrected filtered signal in the low frequency range, which corresponds to the high frequency region. The signal at the output of the synthesizing filter bank is a signal expanded in accordance with the frequency range of the audio signal transmitted from the encoder to the decoder at a low data rate, because calculating the filter bank and the process of determining the correspondence between the high and low frequency ranges presents significant difficulties.
Менее затратные с точки зрения вычислений способы расширения диапазона частот аудио сигнала с ограниченным диапазоном частот применяют копирование низкочастотных областей сигнала (LF) в область высоких частот (HF) для того, чтобы приблизительно заполнить недостающую информацию, которая отсутствует из-за ограничения диапазона. Подобные способы описаны в следующих работах: М.Dietz, L.Liljeryd, K.Kjörling and 0.Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002; S.Meltzer, R. Böhm and F.Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112th AES Convention, Munich, May 2002; Т.Ziegler, A.Ehret, P.Ekstrand and М.Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3 PRO Algorithm," in 112th AES Convention, Munich, May 2002; International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002, or "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. US Patent Nr. 5,455,888.Less computationally expensive methods of expanding the frequency range of an audio signal with a limited frequency range use copying the low-frequency areas of the signal (LF) to the high-frequency areas (HF) in order to approximately fill in the missing information that is missing due to the range limitation. Similar methods are described in the following works: M. Dietz, L. Liljeryd, K. Kjörling and 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002; S. Meltzer, R. Böhm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as" Digital Radio Mondiale "(DRM)," 112th AES Convention, Munich, May 2002; T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3 PRO Algorithm," in 112th AES Convention, Munich, May 2002; International Standard ISO / IEC 14496-3: 2001 / FPDAM 1, "Bandwidth Extension," ISO / IEC, 2002, or "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. US Patent Nr. 5,455,888.
Данные способы не применяют гармоническую транспозицию. Согласно этим способам полосовой сигнал низкой частоты искусственно копируется в смежную область полосового сигнала высоких частот. Это приводит к неточному представлению диапазона высоких частот. Грубое приближение полученного сигнала к исходному сигналу затем корректируется на следующем этапе путем определения контрольных параметров на основе исходного сигнала. Например, стандарт MPEG-4 использует масштабные коэффициенты для корректировки спектральной огибающей, сочетание обратной фильтрации и добавления порога шума для корректировки тональности, а также вставку синусоидальныхных частей сигнала для добавления тональных компонентов.These methods do not use harmonic transposition. According to these methods, the low-frequency bandpass signal is artificially copied to an adjacent region of the high-frequency bandpass signal. This results in an inaccurate representation of the high frequency range. The rough approximation of the received signal to the original signal is then corrected in the next step by determining control parameters based on the original signal. For example, the MPEG-4 standard uses scale factors to adjust the spectral envelope, a combination of inverse filtering and the addition of a noise threshold to adjust tonality, and the insertion of sinusoidal parts of the signal to add tonal components.
Кроме этого существует так называемое «слепое расширение диапазона частот», описанное в работах Е.Larsen, R.M.Aarts, and М.Danessis, "Efficient high-frequency bandwidth extension of music and speech". Однако об этом способе не упоминалось на 112-й конференции AES в Мюнхене, Германия, май 2002 г. Также существует так называемый способ «искусственного расширения диапазона частот», который рассматривается в работе K.Käyhkö, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.In addition, there is the so-called "blind extension of the frequency range" described in the works of E. Larsen, R.M. Aarts, and M. Danessis, "Efficient high-frequency bandwidth extension of music and speech". However, this method was not mentioned at the 112th AES conference in Munich, Germany, May 2002. There is also the so-called “artificial bandwidth extension” method, which is discussed in K. Käyhkö, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
В работе J.Makinen et al.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP ′05 описывается способ расширения диапазона частот, при котором операция копирования компонентов низких частот в диапазон высоких частот производится с помощью зеркального отражения, получаемого при увеличении частоты дискретизации низкочастотного фильтрованного сигнала.J. Makinen et al .: AMR-WB +: a new audio coding standard for 3 rd generation mobile audio services Broadcasts, IEEE, ICASSP ′05 describes a method for expanding the frequency range in which the operation of copying low-frequency components to the high-frequency range is performed using specular reflection obtained by increasing the sampling frequency of the low-pass filtered signal.
В качестве альтернативы может применяться одностороння модуляция диапазона, которая в целом эквивалентна операции копирования в области фильтра. Способы, которые применяют гармоническое расширение диапазона? обычно используют этап определения тона (pitch tracking), этап нелинейного искажения (см. "U.Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, in: Proceedings of the IWAENC, Darmstadt, Germany, September 2001, pp.215-218") или применяют фазовые голосовые кодеры, что указано в заявке на патент F.Nagel, S.Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" with the application number US 61/025129.Alternatively, one-way range modulation can be applied, which is generally equivalent to the copy operation in the filter area. Ways that apply harmonic range extension? typically use the pitch tracking step, the nonlinear distortion step (see "U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, in: Proceedings of the IWAENC, Darmstadt, Germany, September 2001, pp. 215-218 ") or phase voice encoders are used, as described in the patent application F.Nagel, S. Disch:" Apparatus and method of harmonic bandwidth extension in audio signals "" with the application number US 61/025129.
Стандарт WO 02/41302 A1, например, описывает способ повышения эффективности кодирующих систем, которые применяют реконструкцию высоких частот. Он показывает, как повысить общую эффективность таких систем при помощи постепенной адаптации частоты перехода между полосой низких частот, кодированной основным кодером, и полосой высоких частот, кодированной системой, которая применяет реконструкцию диапазона высоких частот. Согласно этому способу, основной кодер должен работать с различными частотами перехода как на стороне кодера, так и на стороне декодера. Таким образом, структура основного кодера усложняется.WO 02/41302 A1, for example, describes a method for improving the efficiency of coding systems that employ high frequency reconstruction. It shows how to increase the overall efficiency of such systems by gradually adapting the transition frequency between the low-frequency band encoded by the main encoder and the high-frequency band encoded by a system that applies high-frequency band reconstruction. According to this method, the main encoder must work with different transition frequencies on both the encoder side and the decoder side. Thus, the structure of the main encoder is complicated.
Способы расширения диапазона частот описываются также в следующих работах: R.М.Aarts, E.Larsen, and О.Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003", E.Larsen and R.М.Aarts: Audio Bandwidth Extension - Application to psychoacoustics. Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004", E.Larsen, R.М.Aarts, and М.Danessis: Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002", "J.Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973", "United States Patent Application 08/951,029, Ohmori et al.: Audio band width extending system and method" and "United States Patent 6895375, Malah, D & Cox, R. VS.: System for bandwidth extension of Narrow-band speech.Ways to extend the frequency range are also described in the following works: R. M. Aarts, E. Larsen, and O. Oweltjes, A unified approach to low- and high-frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003 ", E. Larsen and R. M. Arts: Audio Bandwidth Extension - Application to psychoacoustics. Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004", E. Larsen, R. M. Arts, and M. Danessis: Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002 "," J. Mahoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21 (3), June 1973 "," United States Patent Application 08 / 951.029, Ohmori et al .: Audio band width extending system and method "and" United States Patent 6895375, Malah, D & Cox, R. VS .: System for bandwidth extension of Narrow-band speech.
Способы гармонического расширения диапазона частот обычно являются очень сложными, а при упрощении способов расширения диапазона частот ухудшается качество. В конкретном случае, когда низкий битрейт сочетается с небольшой полосой низких частот, могут появиться такие помехи, как резкие переходы и искажения тембра.Methods of harmoniously expanding the frequency range are usually very complex, and when simplifying the methods of expanding the frequency range, quality deteriorates. In a particular case, when a low bitrate is combined with a small low-frequency band, interference may occur such as sudden transitions and timbre distortions.
Причиной этому является то, что порция высоких частот часто получена приблизительно на основе операции копирования, которая не определяет гармонические соотношения между частями тонального сигнала. Это относится как к гармоническому соотношению между диапазонами низкой и высокой частот, так и к гармоническому соотношению между последующими патчами в пределах диапазона высоких частот. Например, в SBR соседнее расположение кодированных компонентов и копируемых компонентов, которое случается на границе полос высоких и низких частот, может стать причиной тому, что звук воспринимается как неравномерный. Это показано на фиг.18, где тональные порции, скопированные из диапазона низких частот в диапазон высоких частот, спектрально близко примыкают к тональным порциям диапазона низких частот.The reason for this is that a portion of the high frequencies is often obtained approximately based on the copy operation, which does not determine the harmonic relationships between the parts of the tone signal. This applies both to the harmonic relationship between the low and high frequency ranges, and to the harmonic relationship between subsequent patches within the high frequency range. For example, in SBR, the adjacent arrangement of encoded components and copied components, which occurs at the boundary of the high and low frequency bands, may cause the sound to be perceived as uneven. This is shown in Fig. 18, where the tonal portions copied from the low frequency range to the high frequency range are spectrally close to the tonal portions of the low frequency range.
Фиг.18A иллюстрирует исходную спектрограмму 1800A сигнала, состоящего из трех тонов. Фиг.18B показывает диаграмму 1800B сигнала с увеличенным диапазоном, который соответствует исходному сигналу на фиг.18A. Абсцисса указывает время, ордината - частоту. В частности, что касается последнего тона, то здесь можно наблюдать потенциальные проблемы 1810 (размытые линии 1810).Figa illustrates the
Если известные способы рассматривают гармоническое отношение, то это происходит всегда на основе F0-оценки. В этом случае успех этих способов в значительной мере зависит от надежности этой оценки.If the known methods consider the harmonic relationship, then this always happens on the basis of the F 0 estimate. In this case, the success of these methods largely depends on the reliability of this assessment.
В целом, известные способы увеличения диапазона частот позволяют получить аудио сигналы при низком битрейте, при высоком битрейте качество аудио сигнала не всегда может быть высоким.In general, well-known methods of increasing the frequency range allow you to get audio signals at low bitrate, with high bitrate the quality of the audio signal may not always be high.
Задачей настоящего изобретения является улучшение схемы кодирования аудио сигналов.An object of the present invention is to improve an audio signal coding scheme.
Эта задача решается при помощи аудио кодера согласно п.1, декодера, увеличивающего диапазон частот, согласно п.3 и п.8 и способу согласно п.12, 13 и 14.This problem is solved using an audio encoder according to
При осуществлении настоящего изобретения применяется аудио кодер, который генерирует выходной сигнал на основе входного аудио сигнала. Аудио кодер включает генератор патчей, компаратор и выходной интерфейс.In an embodiment of the present invention, an audio encoder is used that generates an output signal based on an input audio signal. The audio encoder includes a patch generator, a comparator, and an output interface.
Генератор патчей генерирует, как минимум, один сигнал с увеличенным диапазоном высоких частот. Сигнал с увеличенным диапазоном высоких частот включает полосу высоких частот, которая основана на низких частотах входного аудио сигнала.The patch generator generates at least one signal with an increased high-frequency range. A signal with an increased high-frequency range includes a high-frequency band, which is based on the low frequencies of the input audio signal.
Если создавались разные сигналы с увеличенным диапазоном высоких частот, то различные сигналы будут включать различные частоты.If you created different signals with an increased range of high frequencies, then different signals will include different frequencies.
Компаратор вычисляет множество сравнительных параметров. Сравнительный параметр вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с увеличенным диапазоном высоких частот. Каждый параметр из множества параметров сравнения вычисляется на основе отдельной частоты смещения между входным аудио сигналом и созданным сигналом с увеличенным диапазоном высоких частот. Далее компаратор выделяет параметр сравнения из множества параметров сравнения таким образом, что выделенный параметр соответствовал заранее заданному критерию.The comparator calculates many comparative parameters. The comparative parameter is calculated based on a comparison of the input audio signal and the generated signal with an increased high-frequency range. Each parameter from a plurality of comparison parameters is calculated based on a separate offset frequency between the input audio signal and the generated signal with an increased high-frequency range. Next, the comparator selects the comparison parameter from the set of comparison parameters so that the selected parameter corresponds to a predetermined criterion.
Иначе говоря, компаратор может быть сконфигурирован таким образом, что он будет определять тот параметр сравнения среди множества параметров сравнения, который наилучшим образом соответствует заданному критерию.In other words, the comparator can be configured in such a way that it will determine the comparison parameter among the set of comparison parameters that best suits the given criterion.
Выходной интерфейс обеспечивает выходной сигнал для его передачи или хранения. Выходной сигнал включает индикацию сигнала на основе частоты смещения, соответствующей определенному параметру сравнения.The output interface provides an output signal for transmission or storage. The output signal includes an indication of the signal based on a bias frequency corresponding to a specific comparison parameter.
Иначе говоря, выходной сигнал включает выбранный параметр сравнения, который указывает оптимальную частоту смещения.In other words, the output signal includes the selected comparison parameter, which indicates the optimal bias frequency.
Следующий вариант изобретения включает декодер, который увеличивает диапазон частот, для получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала. Параметрический сигнал содержит указание на частоту смещения и параметр плотности мощности. Декодер, увеличивающий диапазон частот, включает генератор патчей, блок объединения и выходной интерфейс.A further embodiment of the invention includes a decoder that increases the frequency range to obtain an audio signal with an increased frequency range based on the input audio signal and the parametric signal. The parametric signal contains an indication of the bias frequency and the power density parameter. A decoder that increases the frequency range includes a patch generator, a combiner, and an output interface.
Генератор патчей создает сигнал с увеличенным диапазоном высоких частот, который включает полосу высоких частот. Полоса высоких частот данного сигнала генерируется на основе одного или более сдвига полосы частот входного аудио сигнала. Сдвиги частот основаны на частоте смещения.The patch generator creates a signal with an increased high-frequency range, which includes the high-frequency band. The high frequency band of a given signal is generated based on one or more frequency band offsets of the input audio signal. Frequency offsets are based on the offset frequency.
Генератор патчей может расширять или уменьшать полосу высоких частот сигнала с увеличенным диапазоном высоких частот с помощью коэффициента, равного значению параметра плотности мощности или обратной величине параметра плотности мощности соответственно.The patch generator can expand or decrease the high-frequency band of a signal with an increased high-frequency range by using a coefficient equal to the value of the power density parameter or the reciprocal of the power density parameter, respectively.
Блок объединения соединяет сигнал с полосой высоких частот и входной аудио сигнал для того, чтобы получить сигнал с увеличенным диапазоном высоких частот.The combining unit connects the signal with the high frequency band and the input audio signal in order to obtain a signal with an increased high frequency range.
Выходной интерфейс обеспечивает выход сигнала с увеличенным диапазоном.The output interface provides an output signal with an increased range.
Следующий вариант реализации настоящего изобретения имеет декодер, увеличивающий полосу частот, для получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала. Декодер, увеличивающий полосу частот, включает генератор патчей, компаратор, блок объединения и выходной интерфейс.A further embodiment of the present invention has a bandwidth increasing decoder for receiving an audio signal with an increased frequency range based on an input audio signal. The bandwidth increasing decoder includes a patch generator, a comparator, a combining unit, and an output interface.
Генератор патчей создает, как минимум, один сигнал с полосой высоких частот, включающий полосу высоких частот, полученную на основе входного аудио сигнала. При этом нижняя предельная частота полосы высоких частот созданного сигнала оказывается ниже, чем верхняя предельная частота входного аудио сигнала. Если генерируются разные сигналы с полосой высоких частот, то полученные сигналы с полосой высоких частот имеют различные частоты в рамках своих высокочастотных полос.The patch generator creates at least one signal with a high-frequency band, including a high-frequency band, obtained on the basis of the input audio signal. In this case, the lower limit frequency of the high frequency band of the generated signal is lower than the upper limit frequency of the input audio signal. If different signals with a high-frequency band are generated, then the received signals with a high-frequency band have different frequencies within their high-frequency bands.
Компаратор вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе разных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот. Далее компаратор выделяет параметр сравнения из множества параметров сравнения так, чтобы определенный параметр соответствовал заранее заданному критерию.The comparator calculates many comparison parameters. The comparison parameter is calculated based on a comparison of the input audio signal and the generated signal with the high frequency band. Each comparison parameter from a plurality of comparison parameters is calculated based on different bias frequencies between the input audio signal and the generated signal with a high frequency band. Next, the comparator selects the comparison parameter from the set of comparison parameters so that a certain parameter matches a predetermined criterion.
Иначе говоря, компаратор определяет тот параметр сравнения среди множества параметров, который максимально соответствует заданному критерию.In other words, the comparator determines the comparison parameter among the set of parameters that meets the specified criterion as much as possible.
Блок объединения объединяет входной аудио сигнал и сигнал с полосой высоких частот для получения аудио сигнала с увеличенным диапазоном частот. При этом сигнал с полосой высоких частот, используемый для получения сигнала с увеличенным диапазоном частот, основывается на частоте смещения, соответствующей выделенному параметру сравнения.The combining unit combines the input audio signal and a signal with a high frequency band to obtain an audio signal with an increased frequency range. In this case, a signal with a high frequency band used to obtain a signal with an increased frequency range is based on the bias frequency corresponding to the selected comparison parameter.
Выходной интерфейс обеспечивает выход аудио сигнала с увеличенным диапазоном частот.The output interface provides an output of an audio signal with an increased frequency range.
Варианты реализации настоящего изобретения основываются на основной идее о том, что можно создавать сигнал с полосой высоких частот, который также называется патч, на базе исходного входного сигнала, а также их сравнивать. При помощи различных частот смещения сигнала с полосой высоких частот или нескольких сигналов с полосой высоких частот с различными частотами смещения может быть вычислено множество параметров сравнения, соответствующих этим частотам смещения. Параметры сравнения могут быть соотнесены с числом, которое ассоциируется с качеством аудио сигнала. Таким образом, при определении параметра сравнения гарантируется соответствие сигнала с полосой высоких частот и входного аудио сигнала, вследствие чего повышается качество звука.Embodiments of the present invention are based on the basic idea that it is possible to create a signal with a high frequency band, also called a patch, based on the original input signal, as well as compare them. Using various bias frequencies of a signal with a high frequency band or several signals with a high frequency band with different bias frequencies, a plurality of comparison parameters corresponding to these bias frequencies can be calculated. The comparison parameters can be correlated with a number that is associated with the quality of the audio signal. Thus, when determining the comparison parameter, the correspondence of the signal with the high-frequency band and the input audio signal is guaranteed, thereby improving the sound quality.
Битрейт для передачи и хранения кодированного аудио сигнала может быть уменьшен при помощи указания параметра на основе частоты смещения, соответствующего определенному параметру сравнения для реконструкции полосы высоких частот исходного входного аудио сигнала. В этом случае для хранения и передачи необходимы только порция низких частот входного аудио сигнала и индикация параметра.The bitrate for transmitting and storing the encoded audio signal can be reduced by specifying a parameter based on an offset frequency corresponding to a specific comparison parameter for reconstructing the high frequency band of the original input audio signal. In this case, only a portion of the low frequencies of the input audio signal and an indication of the parameter are required for storage and transmission.
Термины ′параметр сравнения′, ′частота перехода′ и ′индикация параметра′ будут определены позже.The terms “comparison parameter”, “transition frequency” and “parameter indication” will be defined later.
Некоторые варианты реализации настоящего изобретения включают компаратор, который использует взаимную корреляцию при сравнении входного аудио сигнала и созданного сигнала с полосой высоких частот для вычисления параметра сравнения.Some embodiments of the present invention include a comparator that uses cross-correlation when comparing the input audio signal and the generated signal with the high frequency band to calculate the comparison parameter.
Некоторые варианты реализации настоящего изобретения включают генератор патчей, который создает сигнал с полосой высоких частот во временной области на основе односторонней модуляции полосы частот.Some embodiments of the present invention include a patch generator that generates a signal with a high frequency band in the time domain based on one-way modulation of the frequency band.
Преимуществом предпочтительных форм реализации настоящего изобретения является улучшенная схема кодирования аудио сигналов, которая позволяет увеличить качество звука и/или уменьшить битрейт для передачи или хранения сигнала.An advantage of the preferred forms of implementation of the present invention is an improved coding scheme for audio signals, which allows to increase the sound quality and / or reduce the bitrate for transmitting or storing the signal.
Варианты реализации настоящего изобретения будут далее детально рассмотрены в соответствии со следующими фигурами, которые даны в приложении:Embodiments of the present invention will be further described in detail in accordance with the following figures, which are given in the appendix:
Фиг.1 - блок-схема аудио кодера;Figure 1 is a block diagram of an audio encoder;
Фиг.2 - схематическая иллюстрация процесса создания сигнала с полосой высоких частот, сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот, а также процесса адаптации мощности сигнала с полосой высоких частот;Figure 2 is a schematic illustration of the process of creating a signal with a high frequency band, comparing the input audio signal and the generated signal with a high frequency band, as well as the process of adapting the signal power with a high frequency band;
Фиг.3- схематическая иллюстрация процесса создания сигнала с полосой высоких частот, сравнения входного аудио сигнала и сигнала с полосой высоких частот, а также процесса адаптации мощности сигнала с полосой высоких частот;Figure 3 is a schematic illustration of the process of creating a signal with a high frequency band, comparing the input audio signal and the signal with the high frequency band, as well as the process of adapting the signal power with the high frequency band;
Фиг.4 - блок-схема кодера, увеличивающего полосу частот;4 is a block diagram of an encoder increasing the frequency band;
Фиг.5 - блок-схема декодера, увеличивающего полосу частот;5 is a block diagram of a decoder increasing the frequency band;
Фиг.6 - блок-схема декодера, увеличивающего полосу частот;6 is a block diagram of a decoder increasing the frequency band;
Фиг.7- схема способа получения выходного сигнала на основе входного аудио сигнала;7 is a diagram of a method of obtaining an output signal based on an input audio signal;
Фиг.8 - схема способа получения сигнала с увеличенным диапазоном частот;8 is a diagram of a method of obtaining a signal with an increased frequency range;
Фиг.9- схема способа получения выходного сигнала на основе входного аудио сигнала;Fig.9 is a diagram of a method of obtaining an output signal based on an input audio signal;
Фиг.10 - схема способа вычисления параметра сравнения;10 is a diagram of a method for calculating a comparison parameter;
Фиг.11 - схематическая иллюстрация интерполяции частоты смещения;11 is a schematic illustration of an offset frequency interpolation;
Фиг.12 - блок-схема декодера, увеличивающего полосу частот;12 is a block diagram of a decoder increasing a frequency band;
Фиг.13 - схема способа получения сигнала с увеличенным диапазоном частот;Fig. 13 is a diagram of a method for obtaining a signal with an increased frequency range;
Фиг.14 - блок-схема способа получения сигнала с увеличенным диапазоном частот;Fig - block diagram of a method of obtaining a signal with an increased frequency range;
Фиг.15 - блок-схема кодера, увеличивающего полосу частот;Fig - block diagram of an encoder that increases the frequency band;
Фиг.16A - спектрограмма трех тонов при использовании переменной переходной частоты;Figa - spectrogram of three tones using a variable transition frequency;
Фиг.16B - спектрограмма исходного аудио сигнала, состоящего из трех тонов;Figv - spectrogram of the original audio signal, consisting of three tones;
Фиг.17 - диаграмма спектра мощности исходного аудио сигнала и сигнала с увеличенным диапазоном частот, которые используют постоянную частоту перехода, и сигнала с увеличенным диапазоном частот, который использует переменную частоту перехода;17 is a power spectrum diagram of an original audio signal and an increased frequency range signal that use a constant transition frequency, and an increased frequency range signal, which uses a variable transition frequency;
Фиг.18A - спектрограмма трех тонов при использовании известного способа увеличения диапазона частот;Figa - spectrogram of three tones using a known method of increasing the frequency range;
Фиг.18B - спектрограмма исходного аудио сигнала, состоящего из трех тонов. Figv - spectrogram of the original audio signal, consisting of three tones.
В последующем описании объекты и функциональные модули, имеющие одинаковые или схожие функциональные свойства, будут указываться одними и теми же порядковыми номерами на схемах. Описания, касающиеся какой-либо схемы, будут относиться и к другим схемам во избежание повторов в описании вариантов изобретения.In the following description, objects and functional modules having the same or similar functional properties will be indicated by the same serial numbers on the diagrams. Descriptions relating to any scheme will apply to other schemes in order to avoid repetitions in the description of variants of the invention.
Фиг.1 показывает блок-схему аудио кодера 100 для получения выходного сигнала 132 в соответствии с настоящим изобретением, используя входной аудио сигнал 102. Выходной сигнал может применяться для расширения полосы частот на стороне декодера. Таким образом, аудио кодер также называется кодер увеличения полосы частот. Кодер увеличения полосы частот 100 включает генератор патчей 110, компаратор 120 и выходной интерфейс 130. Генератор патчей 110 соединяется с компаратором 120, а компаратор 120 соединяется с выходным интерфейсом 130.Figure 1 shows a block diagram of an
Генератор патчей 110 генерирует, как минимум, один сигнал с полосой высоких частот 112. Сигнал 112 имеет полосу высоких частот, которая создана на основе полосы низких частот входного аудио сигнала 102. В том случае, если генерируются различные сигналы с полосами высоких частот 112, то сигналы 112 имеют различные частоты в диапазоне высоких частот.The
Компаратор 120 вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала 102 и созданного сигнала с полосой высоких частот 112. Каждый параметр сравнения из множества параметров сравнения на основе разных частот смещения между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот 112. Далее компаратор определяет параметр сравнения из множества параметров сравнения так, чтобы он соответствовал заранее заданному критерию.
Выходной интерфейс 130 обеспечивает выходной сигнал 132 для последующей передачи или хранения. Выходной сигнал 132 имеет индикацию параметра на основе частоты смещения в соответствии с определенным параметром сравнения.The
При помощи вычисления множества параметров сравнения для различных частот смещения может быть найден сигнал с полосой высоких частот 122, который максимально соответствует исходному входному сигналу 102. Это достигается путем генерации множества сигналов с полосой высоких частот 112, каждый из которых имеет различную частоту смещения, или путем создания одного сигнала с полосой высоких частот 112 и дальнейшим сдвигом полосы высоких частот сигнала 112 при помощи различных частот смещения. Также возможна комбинация создания множества сигналов с полосой высоких частот 112 с различными частотами смещения и дальнейшего сдвига полос высоких частот этих сигналов при помощи других частот смещения. Например, генерируются пять различных сигналов с полосой высоких частот 112, и каждый их них сдвигается пять раз на определенную частоту смещения.By calculating a plurality of comparison parameters for different bias frequencies, a signal with a high-frequency band 122 that can best match the
На фиг.2 представлена схематическая иллюстрация 200 процесса создания сигнала с полосой высоких частот, сравнения сигнала с полосой высоких частот с входным сигналом и опциональную адаптацию мощности сигнала с полосой высоких частот в случае, если генерируется только один сигнал с полосой высоких частот, который сдвигается на величину различных частот смещения.FIG. 2 is a
Первая диаграмма «мощность vs. частота» 210 схематично показывает входной аудио сигнал 102. На основе этого входного сигнала 102 генератор патчей 110 может создавать сигнал с полосой высоких частот 112, например, при помощи сдвига 222 полосы низких частот входного аудио сигнала 102 в сторону более высоких частот (как указано порядковым номером на схеме). Например, полоса низкой частоты сдвигается на частоту, равную частоте перехода основного кодера, не показанного на фиг.1, который может быть частью кодера 100, увеличивающего полосу частот, или на другую заранее заданную частоту.The first diagram is “power vs. frequency "210 schematically shows the
Созданный сигнал с полосой высоких частот 112 затем может сдвигаться на различные частоты смещения 232, для каждой частоты смещения 232 (на схеме обозначено номером 230) компаратором 120 может быть вычислен параметр сравнения. Частота смещения 232 может быть определена, например, по отношению к частоте перехода основного кодера, по отношению к другой заданной частоте или как абсолютное частотное значение.The generated signal with a high-
Далее компаратор 120 определяет параметр сравнения, соответствующий заранее заданному критерию. Таким образом может быть определен сигнал с полосой высоких частот 112 с частотой смещения 242, соответствующей определенному параметру сравнения (на схеме указано номером 240).Next, the
Дополнительно может быть определен параметр плотности мощности 252 (на схеме указан номером 250). Параметр плотности мощности 252 показывает отношение полосы высоких частот созданного сигнала с частотой смещения согласно определенному параметру сравнения к соответствующей полосе частот входного аудио сигнала. Например, это отношение может быть представлено коэффициентом плотности мощности, коэффициентом мощности или другим коэффициентом, который относится к плотности мощности частотного диапазона.Additionally, the
В отличие от предыдущих схем, фиг.3 представляет собой схематическую иллюстрацию 300 процесса создания сигнала с полосой высоких частот, сравнения созданных сигналов с входным аудио сигналом и возможной адаптации мощности созданного сигнала с полосой высоких, если создается множество сигналов с полосами высоких частот, которые имеют различные частоты смещения.In contrast to the previous schemes, FIG. 3 is a
В отличие от последовательности, показанной на фиг.2, генератор патчей 110 создает множество сигналов с полосами высоких частот 112 с различными частотами смещения (показано номером 320). Это происходит, как и в предыдущем случае, с помощью частотного сдвига 222 полосы низких частот входного аудио сигнала 102 в диапазон высоких частот. Полоса низких частот входного аудио сигнала 102 может сдвигаться на постоянную частоту плюс индивидуальная частота смещения 232 каждого сигнала с полосой высоких частот 112. Постоянная частота может быть равной частоте перехода основного кодера или другой определенной частоте.In contrast to the sequence shown in FIG. 2,
Затем компаратором 120 вычисляется параметр сравнения для каждого созданного сигнала с полосой высоких частот 112, а также параметр сравнения 240, соответствующий заранее заданному критерию.Then, the
Параметр плотности мощности 250 определяется так, как это указано выше.The
Схемы, показанные на фиг.2 и 3, могут быть также скомбинированы.The circuits shown in FIGS. 2 and 3 can also be combined.
Сравнение входного аудио сигнала 102 и созданного сигнала с полосой высоких частот 112 может проводиться на основе взаимной корреляции обоих сигналов. В этом случае параметр сравнения может быть, например, результатом взаимной корреляции между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот 112 для определенной частоты смещения.Comparison of the
Индикация параметра выходного сигнала 132 может быть представлена самой частотой смещения, квантованной частотой смещения или другой величиной, основанной на частоте смещения.An indication of the parameter of the
При передаче или хранении только индикации параметра вместо полосы высоких частот входного аудио 102 битрейт для передачи или хранения может быть понижен. Выбор параметра, основанного на частоте смещения согласно параметру сравнения, соответствующего заданному критерию, приводит к улучшению качества звука по сравнению с декодированием аудио сигнала с ограниченной полосой частот.When transmitting or storing only an indication of a parameter instead of the high frequency band of the input audio, the 102 bit rate for transmission or storage may be lowered. Choosing a parameter based on a bias frequency according to a comparison parameter corresponding to a given criterion leads to an improvement in sound quality compared to decoding an audio signal with a limited frequency band.
Согласно заранее заданному критерию определяется параметр сравнения из множества параметров сравнения, который указывает, например, на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который соответствует входному аудио сигналу 102 лучше, чем остальные 70% сигналов с полосами высоких частот с другими частотами смещения. Параметр сравнения может также указывать на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который является одним из трех лучших соответствий входному аудио сигналу 102, или на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который максимально соответствует входному сигналу. Это относится к той ситуации, когда генерируется множество сигналов с полосой высоких частот 112 с различными частотами смещения или к ситуации, когда генерируется один сигнал с полосой высоких часто 112, который сдвигается при помощи разных частот смещения, или к комбинации этих схем.According to a predetermined criterion, a comparison parameter is determined from the set of comparison parameters, which indicates, for example, a signal with a
Параметр сравнения может быть результатом взаимной корреляции или другой величиной, которая указывает, как максимально сигнал с полосой высоких частот 112 с определенной частотой смещения соответствует входному аудио сигналу 102.The comparison parameter may be the result of cross-correlation or another value that indicates how the maximum signal with a high-
Кодер, увеличивающий диапазон частот, 100 может включать основной кодер для кодирования полосы низких частот входного аудио сигнала 102. Основной кодер может работать с частотой перехода, которая соответствует верхней предельной частоте кодируемой полосы низких частот входного аудио сигнала 102. Переходная частота основного кодера может быть постоянной или переменной. Применение переменной частоты перехода усложняет функционирование основного кодера, но может также увеличить гибкость процесса кодирования.The frequency
Процесс, показанный на фиг.2 и/или фиг.3 может повторяться для полос с более высокими частотами или патчей. Например, полоса низких частот входного аудио сигнала 102 имеет верхнюю предельную частоту 4 кГц. Таким образом, если полоса нижних частот входного аудио сигнала 102 сдвигается на величину, равную верхней предельной частоте полосы нижних частот, для того, чтобы получить сигнал с полосой высоких часто 112, то сигнал 112 имеет полосу высоких частот с нижней предельной частотой 4 кГц и верхней предельной частотой 8 кГц. Процесс можно повторить, если сдвинуть полосу нижних частот входного аудио сигнала 102 на величину, равную верхней предельной частоте полосы нижних частот, увеличенную в два раза. Так, созданный сигнал с полосой высоких частот 112 будет иметь полосу высоких частот с нижней предельной частотой 8 кГц и верхней предельной частотой 12 кГц. Этот процесс может повторяться до тех пор, пока не будет достигнута необходимая высокая частота.The process shown in FIG. 2 and / or FIG. 3 may be repeated for bands with higher frequencies or patches. For example, the low frequency band of the
В качестве альтернативы эту процедуру можно осуществить путем создания одного сигнала со множеством полос высоких частот.Alternatively, this procedure can be accomplished by creating a single signal with multiple high frequency bands.
Как показано на примере, ширина полосы низких частот входного аудио сигнала и ширина полосы высоких частот созданного сигнала одинаковы. В качестве альтернативы полоса низких частот входного аудио сигнала может быть растянута или сдвинута для того, чтобы получить сигнал с полосой высоких частот.As shown in the example, the low-frequency bandwidth of the input audio signal and the high-frequency bandwidth of the generated signal are the same. Alternatively, the low frequency band of the input audio signal may be stretched or shifted in order to obtain a signal with a high frequency band.
При определении сигнала с полосой высоких частот 112 с частотой смещения 232, соответствующей определенному параметру сравнения, может остаться пробел между полосой низких частот входного аудио сигнала 102 и полосой высоких частот созданного сигнала 112 в зависимости от частоты смещения 242. Этот пробел можно заполнить путем создания частотных порций, соответствующих пробелу и содержащих, например, шум, ограниченный по полосе. Пробел можно также оставить незаполненным, т.к. качество звука существенно не пострадает.When determining a signal with a high-
На фиг.4 показана блок-схема кодера, увеличивающего диапазон частот, 400, который создает выходной сигнал 132 в процессе обработки входного аудио сигнала 102 в соответствии с одним из вариантов реализации настоящего изобретения. Кодер, увеличивающий диапазон частот, 400 включает генератор патчей 110, компаратор 120, выходной интерфейс 130, основной кодер 410, полосовой фильтр 420 и блок выделения параметров 430. Основной кодер 410 соединен с выходным интерфейсом 130 и генератором патчей 110, генератор патчей 110 соединен с компаратором 120, компаратор 120 соединен с блоком выделения параметров 430, блок выделения параметров 430 соединен с выходным интерфейсом 130 и полосовой фильтр 420 соединен с компаратором 120.Figure 4 shows a block diagram of an encoder that increases the frequency range, 400, which creates an
Генератор патчей 110 может быть реализован как модулятор для создания сигнала с полосой высоких частот 112 на основе входного сигнала 102. Компаратор 120 выполняет сравнение входного аудио сигнала 102, отфильтрованного с помощью полосового фильтра 420, и созданного сигнала с полосой высоких частот 112 на основе их взаимной корреляции. Определение параметра сравнения, соответствующего заранее заданному критерию, может быть также названо вычислением отставания.The
Выходной интерфейс может также иметь функцию блока формирования битового потока и включать блок объединения для соединения низкочастотного сигнала, который обеспечивается основным кодером 410, и параметрического сигнала, включающего параметр, определенный на основе частоты смещения, который обеспечивается блоком выделения параметров 430. Далее выходной интерфейс 130 может включать энтропийный кодер или дифференциальный кодер для уменьшения битрейта выходного сигнала 132. Блок объединения и энтропийный или дифференциальный кодер могут быть частью выходного интерфейса 130, как показано в этом примере, или представлять собой отдельные блоки.The output interface may also have the function of a bitstream generating unit and include a combining unit for connecting the low-frequency signal provided by the
Аудио сигнал 102 может быть разделен на две части: с низкими частотами и высокими частотами. Разделение проводится с помощью фильтра нижних частот основного кодера 410 или полосового фильтра 420. Фильтр нижних частот может быть частью основного кодера 410 или быть независимым фильтром, соединенным с основным кодером 410.The
Низкочастотная часть обрабатывается основным кодером 410, подобным MPEG 1/2 Layer 3 "МР3" или MPEG 4 AAC standard или голосовым кодером.The low-frequency part is processed by the
Полоса низких частот сдвигается на фиксированную величину посредством преобразования полосы боковых частот или быстрого преобразования Фурье (FFT) в частотной области. Таким образом, она располагается выше исходной области низких частот в соответствующем патче. Кроме этого полоса низких частот может быть получена непосредственно из входного сигнала 102 с помощью независимого фильтра нижних частот, соединенного с генератором патчей 110.The low frequency band is shifted by a fixed amount by converting the sideband or fast Fourier transform (FFT) in the frequency domain. Thus, it is located above the original low-frequency region in the corresponding patch. In addition, the low frequency band can be obtained directly from the
В случае постоянных временных интервалов может быть вычислена взаимная корреляция между амплитудно-частотными характеристиками окон исходной высокочастотной полосы (исходного аудио сигнала) и полученной высокочастотной полосы (созданного сигнала с полосой высоких частот). Таким образом может быть определена задержка (частота смещения) для максимальной корреляции. Эта задержка означает корректирующий коэффициент в терминах исходного одностороннего преобразования частотного диапазона, т.е. одностороннее преобразование частотного диапазона может быть дополнительно скорректировано с помощью задержки для того, чтобы довести взаимную корреляцию до максимума. Иными словами, определяется частота смещения, также называемая задержкой, соответствующая параметру сравнения, который, в свою очередь, отвечает заранее заданному критерию. Таким образом, параметр сравнения соответствует взаимной корреляции, а задачей заранее заданного критерия является нахождение максимальной корреляции.In the case of constant time intervals, a cross-correlation between the amplitude-frequency characteristics of the windows of the original high-frequency band (the original audio signal) and the resulting high-frequency band (the generated signal with the high-frequency band) can be calculated. In this way, a delay (offset frequency) can be determined for maximum correlation. This delay means a correction factor in terms of the original one-way frequency range conversion, i.e. one-way frequency range conversion can be further adjusted by delay in order to maximize cross-correlation. In other words, a bias frequency, also called a delay, is determined, corresponding to the comparison parameter, which, in turn, meets a predetermined criterion. Thus, the comparison parameter corresponds to cross-correlation, and the task of a predetermined criterion is to find the maximum correlation.
Дополнительно определяется отношение между абсолютными значениями амплитудно-частотных характеристик. Так вычисляется коэффициент, на который уменьшается или увеличивается полученный высокочастотный сигнал. Иными словами, может быть определен параметр плотности мощности, который обозначает коэффициент мощности, плотностей мощности, абсолютных значений амплитудно-частотных характеристик или других величин, соотносимых с соотношением плотности мощности между полосой высоких частот созданного сигнала 112 и соответствующей полосы частот исходного входного аудио сигнала 102. Процедура проводится компаратором плотности мощности, который может быть частью блока извлечения параметров 430, как показано в данном примере, или независимым блоком. Для определения параметра плотности мощности может быть использован сигнал с полосой высоких частот 112, который был создан путем сдвига полосы низких частот входного аудио сигнала 102 на постоянную частоту или сигнал с полосой высоких частот 112, соответствующий определенному параметру сравнения, или другой созданный сигнал с полосой высоких частот 112. Соответствующая полоса частот в этом случае обозначает полосу частот с одинаковым частотным диапазоном. Например, если полоса высоких частот созданного сигнал включает частоты от 4 кГц до 8 кГц, то соответствующая полоса частот входного аудио сигнала также имеет диапазон от 4 кГц до 8 кГц.Additionally, the relationship between the absolute values of the amplitude-frequency characteristics is determined. This calculates the coefficient by which the received high-frequency signal decreases or increases. In other words, a power density parameter can be determined, which denotes a power factor, power densities, absolute values of amplitude-frequency characteristics or other values correlated with the ratio of the power density between the high frequency band of the generated
Полученные коэффициенты корректировки (частота смещения, параметр плотности мощности), соответствующие задержке и абсолютному значению амплитуды, могут быть интерполированы во времени. Иными словами, возможна интерполяция параметра, полученного для одного окна сигнала (для временного фрейма), на каждый временной период сигнала.The obtained correction factors (bias frequency, power density parameter) corresponding to the delay and the absolute value of the amplitude can be interpolated in time. In other words, it is possible to interpolate the parameter obtained for one window of the signal (for the time frame) for each time period of the signal.
Эта модуляция (контроль) сигнала (параметрического сигнала) или его параметрическая репрезентация может быть сохранена или передана в декодер. Иными словами, параметрический сигнал 432 может быть объединен с полосой низких частот входного аудио сигнала 102, обработанного основным кодером 410, для того, чтобы получить выходной сигнал 132, который может быть сохранен или передан в декодер.This modulation (control) of the signal (parametric signal) or its parametric representation can be stored or transmitted to the decoder. In other words, the
В дополнение могут быть определены параметры для адаптации, например, уровня шума и/или тональности. Вычисления проводятся блоком извлечения параметров 430. Дополнительные параметры добавляются к параметрическому сигналу 432.In addition, parameters for adaptation, for example, noise level and / or tonality, can be defined. The calculations are performed by the
Пример, показанный на фиг.4, иллюстрирует вычисления переменных во времени модуляций на стороне кодера. Переменные во времени модуляции в этом случае относятся к сигналам с полосой высоких частот 112 с различными частотами смещения. Частота смещения, соответствующая определенному параметру сравнения, который отвечает заранее заданному критерию, может изменяться во времени.The example shown in FIG. 4 illustrates the computation of time-varying modulations on the encoder side. Variables in modulation time in this case refer to signals with a high-
На фиг.5 показана блок-схема декодера, увеличивающего полосу частот, 500, для получения сигнала с увеличенным частотным диапазоном 532 на основе входного аудио сигнала 502 и параметрического сигнала 504 в соответствии с одним из вариантов реализации настоящего изобретения. Параметрический сигнал 504 включает показатель частоты смещения и параметр плотности мощности. Декодер, увеличивающий полосу частот, 500 включает генератор патчей 510, блок объединения 520 и выходной интерфейс 530. Генератор патчей 510 соединен с блоком объединения 520, а блок объединения 520 соединен с выходным интерфейсом 530.FIG. 5 shows a block diagram of a
Генератор патчей 510 генерирует сигнал с полосой высоких частот 512, который имеет полосу высоких частот, созданную на основе входного аудио сигнала 502. Полоса высоких частот созданного сигнала 512 генерируется на основе частотного сдвига полосы частот входного аудио сигнала 502, при этом частотный сдвиг производится на основе частоты смещения.The
Далее генератор патчей 510 увеличивает или уменьшает полосу высоких частот созданного сигнала 512 на коэффициент, равный значению параметра плотности мощности или обратный значению параметра плотности мощности.Next, the
Блок объединения 520 соединяет сигнал с полосой высоких частот 512 и входной аудио сигнал 502 для того, чтобы получить аудио сигнал с увеличенным диапазоном частот 532, а выходной интерфейс 530 выводит сигнал с увеличенным диапазоном частот 532.The
Создание сигнала с полосой высоких частот 112 на основе частоты смещения позволяет расширить диапазон высоких частот входного аудио сигнала, если, например, частота смещения определяется так, как было указано ранее. Это позволяет улучшить качество звука сигнала с увеличенным диапазоном частот 532.Creating a signal with a high-
Кроме этого плотность мощности при расширении полосы высоких частот входного аудио сигнала 502 устанавливается эффективным способом - путем увеличения или уменьшения полосы высоких частот созданного сигнала 112 на коэффициент плотности мощности. В этом случае нет необходимости в корректировке.In addition, the power density when expanding the high-frequency band of the
Генератор патчей 510 генерирует сигнал с полосой высоких частот 512 при помощи сдвига полосы частот входного аудио сигнала 512 на постоянную частоту, а также на частоту смещения. Если частота смещения указывает на частотный сдвиг к более низким частотам, то блок объединения может проигнорировать часть полосы высоких частот созданного сигнала 512, которая включает частоты ниже верхней предельной частоты входного аудио сигнала 502.The
Генератор патчей 510 создает сигнал с полосой высоких частот 512 во временной или частотной области. Во временной области генератор патчей 510 может создавать сигнал с полосой высоких частот 512 на основе одностороннего преобразования диапазона частот.The
Кроме этого выходной интерфейс может усиливать выходной сигнал.In addition, the output interface can amplify the output signal.
На фиг.6 показана блок-схема декодера, увеличивающего полосу частот, 600 для получения сигнала с увеличенным диапазоном частот 532 на основе входного аудио сигнала 502 и параметрического сигнала 504 согласно одному из вариантов реализации настоящего изобретения. Декодер, увеличивающий полосу частот, включает генератор патчей 510, блок объединения 520, выходной интерфейс 530, основной декодер 610 и блок извлечения параметров 620. Основной декодер 610 соединен с генератором патчей 510 и блоком объединения 520, блок извлечения параметров 620 соединен с генератором патчей 510 и выходным интерфейсом 530, генератор патчей 510 соединен с блоком объединения 520, а блок объединения 520 соединен с выходным интерфейсом 530.Figure 6 shows a block diagram of a decoder that increases the frequency band, 600 to obtain a signal with an increased
Основной декодер 610 декодирует полученный битовый поток 602 и направляет входной аудио сигнал 502 в генератор патчей 510 и блок объединения 520. Входной аудио сигнал 502 может иметь верхнюю предельную частоту, равную частоте перехода основного декодера 610. Частота перехода может быть постоянной или переменной во времени. Переменная во времени обозначает, что она меняется для различных временных интервалов или временных фреймов, но остается постоянной для одного временного интервала или временного фрейма.The main decoder 610 decodes the received bitstream 602 and directs the
Блок извлечения параметров 620 может отделять параметрический сигнал 504 от полученного битового потока 602 и направлять его в генератор патчей 510. Кроме этого параметрический сигнал 504 или выделенный параметр шума и/или тональности может быть направлен на выходной интерфейс 530.Parameter extraction unit 620 can separate the
Генератор патчей 510 может преобразовывать входной аудио сигнал 502 на основе частоты смещения для того, чтобы получить сигнал с полосой высоких частот 512, а также увеличивать или уменьшать сигнал с полосой высоких частот 512 на основе параметра плотности мощности, который находится в параметрическом сигнале 504. Сигнал с полосой высоких частот 512 направляется в блок объединения 530. Иными словами, генератор патчей 510 преобразовывает входной аудио сигнал 502 с помощью частоты смещения и параметра плотности мощности для того, чтобы получить высокочастотный сигнал. Процесс может происходить, например, во временной области с помощью одностороннего преобразования полосы частот 634 совместно с интерполяцией и/или фильтрованием 632 для каждого временного интервала.The
Блок объединения 520 соединяет входной аудио сигнал 502 и созданный сигнал с полосой высоких частот 512 для того, чтобы получить сигнал с расширенным диапазоном частот 532.The combining
Выходной интерфейс 530 выводит сигнал с расширенным диапазоном частот 532 и может дополнительно включать корректирующий блок. Корректирующий блок выполняет коррекцию тональности и/или шума на основе параметров, которые обеспечиваются блоком извлечения параметров 620. Корректирующий блок может быть частью выходного интерфейса 530, как показано на фиг.6, или отдельным блоком. Корректирующий блок может также располагаться между генератором патчей 510 и блоком объединения 520. В этом случае корректирующий блок корректирует тональность и/или шум только созданного сигнала с полосой высоких частот 512. Корректировка тональности и шума входного аудио сигнала 502 может не приниматься во внимание, т.к. входной аудио сигнал 502 соответствует исходному аудио сигналу.The
Обобщая, можно сказать, что декодер, увеличивающий полосу частот, 600 может синтезировать и формировать спектр сигнала с высокой частотой на основе выходного сигнала аудио декодера или основного декодера (входного аудио сигнала при помощи переданной функции преобразования. Переданная функция преобразования обозначает функцию преобразования на основе частоты смещения или параметра плотности мощности. Затем возможно соединение сигналов с высокой частотой и низкой частотой, далее возможно применение параметров для адаптации шума и тональности.Summarizing, it can be said that a band-increasing decoder 600 can synthesize and shape a high-frequency signal spectrum based on the output signal of an audio decoder or a main decoder (input audio signal using a transmitted conversion function. A transmitted conversion function denotes a frequency-based conversion function displacement or power density parameter. Then it is possible to connect signals with high frequency and low frequency, then it is possible to use parameters to adapt noise and tonal nnosti.
На фиг.7 показана схема способа 700 для получения выходного сигнала на основе входного аудио сигнала в соответствии с реализацией настоящего изобретения. Способ включает создание 710, как минимум, одного сигнала с полосой высоких частот, вычисление 720 множества параметров сравнения, выделение 730 параметра сравнения из множества параметров сравнения и обеспечение 740 выходного сигнала для последующей передачи или хранения.7 shows a diagram of a
Созданный сигнал с расширенной полосой частот имеет полосу высоких частот. Полоса высоких частот созданного сигнала основана на полосе низких частот входного аудио сигнала. Различные сигналы с расширенными полосами частот имеют различные частоты в рамках полосы высоких частот.The created signal with an extended frequency band has a high frequency band. The high frequency band of the generated signal is based on the low frequency band of the input audio signal. Different signals with extended frequency bands have different frequencies within the high frequency band.
Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров вычисляется на основе различных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот.The comparison parameter is calculated based on a comparison of the input audio signal and the generated signal with the high frequency band. Each comparison parameter from a plurality of parameters is calculated based on different bias frequencies between the input audio signal and the generated signal with a high frequency band.
Выделенный параметр сравнения соответствует заранее заданному критерию.The highlighted comparison parameter matches a predefined criterion.
Выходной сигнал включает индикацию параметра, основанного на частоте смещения, которая соответствует определенному параметру сравнения.The output signal includes an indication of a parameter based on a bias frequency that corresponds to a specific comparison parameter.
На фиг.8 показана схема способа 800 получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала согласно одному из вариантов реализации настоящего изобретения. В параметрическом сигнале имеется указание на частоту смещения и параметр плотности мощности. Способ включает создание 810 сигнала с полосой высоких частот, увеличение 820 или уменьшение полосы высоких частот сигнала с расширенной полосой частот, объединение 830 сигнала с полосой высоких частот и входного аудио сигнала для получения сигнала с расширенным диапазоном частот и вывод 840 сигнала с расширенным диапазоном частот.On Fig shows a diagram of a
Сигнал с расширенной полосой частот имеет полосу высоких частот. Полоса высоких частот сигнала с расширенной полосой частот создается 810 на основе сдвига полосы частот входного аудио сигнала. Частотный сдвиг происходит при помощи частоты смещения.An extended band signal has a high frequency band. The high frequency band of the extended band signal is created 810 based on the band shift of the input audio signal. The frequency shift occurs using the offset frequency.
Полоса высоких частот сигнала с расширенной полосой частот увеличивается 820 или уменьшается на коэффициент, равный значению параметра плотности мощности или обратный значению параметра плотности мощности.The high frequency band of a signal with an extended frequency band increases 820 or decreases by a factor equal to the value of the power density parameter or inverse to the value of the power density parameter.
На фиг.9 показана схема способа 900 получения и вывода сигнала на основе входного аудио сигнала согласно одному из вариантов реализации настоящего изобретения. Схема иллюстрирует возможность применения алгоритма на стороне кодера. Последовательность можно описать математически следующим образом. Сигналы реального времени обозначаются прописными латинскими буквами, сигналы, прошедшие этап трансформации Гилберта, обозначаются соответствующими буквами греческого алфавита, сигналы, прошедшие этап трансформации Фурье, - заглавными буквами латинского или греческого алфавита.FIG. 9 shows a diagram of a
Входной сигнал обозначен как f(n), выходной сигнал - о(n). указывает на трансформацию Фурье, j обозначает воображаемое число, трансформация Гилберта Н(.) определяется обычным образом:The input signal is denoted as f (n), the output signal is o (n). indicates the Fourier transform, j denotes an imaginary number, the Hilbert transform H (.) is defined in the usual way:
φ(m):=H(f(n))=F-1(-j·sgn(ω)·F(jω)),φ (m): = H (f (n)) = F -1 (-j sgn (ω) F (jω)),
гдеWhere
F(jω):=F(f(n))F (jω): = F (f (n))
xOver обозначает предельную частоту основного кодера, n∈N обозначает время. kmax>k∈N обозначает k-e расширение или патч. αk обозначает границу полосы воспринимаемых полос, относящихся к xOver в соответствии, например, со шкалой Барка или ERB. В качестве альтернативы αk может увеличиваться линейно, т.е. αk+1-αk≡константа. Трансформация Гилберта может быть эффективно вычислена при помощи фильтрации сигнала модулированным фильтром нижних частот.xOver denotes the limiting frequency of the main encoder, n∈N denotes time. k max > k∈N denotes ke extension or patch. α k denotes the border of the band of perceived bands related to xOver in accordance, for example, with the Bark scale or ERB. Alternatively, α k may increase linearly, i.e. α k + 1 -α k is a constant. Hilbert transform can be effectively calculated by filtering the signal with a modulated low-pass filter.
Во-первых, может быть создана аналитическая функция модулятора 902 с частотами модуляции αk и результирующими фазовыми инкрементами при временном инкременте (Fs указывает частоту выборки). Математически это можно описать с помощью следующих формул:First, an analytic function of
Сумму можно заменить только на n, если γk не зависит от n.The sum can be replaced only by n if γ k is independent of n.
Входной аудио сигнал 102 или реальный аудио сигнал f подвергается процессу фильтрации с помощью полосового фильтра до полосы αk+1-αk, что можно выразить следующим образом:The
fLF=f*filtLF f LF = f * filt LF
В этом случае каждый патч будет иметь одинаковую ширину полосы.In this case, each patch will have the same bandwidth.
В качестве альтернативы входной сигнал f 102 может быть отфильтрован с помощью полосового фильтра до полос αk с различной шириной, что выражается формулой:Alternatively, the
Затем определяются области исходного сигнала, которые должны быть реконструированы с помощью рассматриваемого способа. Области с ограниченными полосами обозначаются как:Then, the areas of the original signal that should be reconstructed using the method under consideration are determined. Bounded areas are designated as:
и располагаются в интервалах (αk, αk+1).and are located in the intervals (α k , α k + 1 ).
Преобразование входных сигналов, отфильтрованных с помощью фильтра нижних частот, 904 может происходить в частотной или временной области.The conversion of input signals filtered by a low-pass filter, 904 may occur in the frequency or time domain.
В частотной области входные сигналы сначала разбиваются на окна, что выражается следующим образом:In the frequency domain, the input signals are first divided into windows, which is expressed as follows:
где NFFT - число быстрых преобразований Фурье (например, с частотой дискретизации 512), ξ - количество окон, a win(.) - оконная функция. Окна или временные фреймы могут частично совмещаться в плане времени. Например, формула, приведенная выше, представляет наложение по времени, равное половине окна. N∈N временные интервалы исходного сигнала и связанные с ним множество амплитудно-спектральных характеристик Fξ(ω) при ξ≤N как абсолютные значения преобразования Фурьеwhere NFFT is the number of fast Fourier transforms (for example, with a sampling frequency of 512), ξ is the number of windows, and win (.) is the window function. Windows or time frames can be partially aligned in terms of time. For example, the formula above represents a time overlay equal to half the window. N∈N are the time intervals of the original signal and the associated set of amplitude spectral characteristics F ξ (ω) for ξ≤N as the absolute values of the Fourier transform
представляют показатель границы полосы k в процессе преобразования Фурье.represent the measure of the boundary of the strip k in the Fourier transform.
Затем сигнал преобразовывается в частотной области при помощи сдвига цифровых результатов FFT-преобразований (быстрых преобразований Фурье). В имплицитном преобразовании Гилберта здесь нет необходимости, но оно позволяет равноценно описать последующие шаги:Then, the signal is converted in the frequency domain by shifting the digital results of the FFT transforms (fast Fourier transforms). There is no need for an implicit Hilbert transform here, but it allows us to describe the next steps in an equivalent way:
для ω≥0 иfor ω≥0 and
Фξ(ω):=Ψξ(ω):≡0∀ω<0Φ ξ (ω): = Ψ ξ (ω): ≡0∀ω <0
Во временной области трансформация Гилберта 906 входного аудио сигнала f 102 для создания аналитического сигнала 908 производится в первую очередь.In the time domain, the transformation of
φ:=f+jH(f)φ: = f + jH (f)
иand
Затем аналитический сигнал подвергается преобразованию при помощи односторонней модуляции полосы частот 710 посредством модулятора µ(n) 902:Then analytical signal undergoes conversion using one-way modulation of the
илиor
ψ(n):=φLF(n)·µ(n)ψ (n): = φ LF (n)
В этом случае создается сигнал с расширенной полосой частот, который также называется модулированный сигнал 910.In this case, an extended bandwidth signal is created, which is also called modulated
Далее проводится разделение на окна (с возможным наложением) входного сигнала 912 и сигнала с расширенным диапазоном частот 914, а также преобразование Фурье:Next, the window is divided (with possible overlap) of the
иand
где NFFT - число цифровых результатов (bins) быстрого преобразования Фурье (например, 256, 512, 1024 или другое число в пределах от 24 до 232), ξ - количество окон, win(.) - оконная функция. Временные интервалы N∈N создаются на основе исходного сигнала и связанные с ним множество амплитудно-спектральных характеристик Фξ(ω), Ψξ(ω) при ξ≤N как абсолютные значения преобразования Фурье 916where NFFT is the number of digital results (bins) of the fast Fourier transform (for example, 256, 512, 1024 or another number ranging from 2 4 to 2 32 ), ξ is the number of windows, win (.) is the window function. The time intervals N∈N are created on the basis of the initial signal and the set of amplitude-spectral characteristics Ф ξ (ω), Ψ ξ (ω) associated with it at ξ≤N as absolute values of the
представляют показатель границы полосы k в процессе преобразования Фурье.represent the measure of the boundary of the strip k in the Fourier transform.
Процесс во временной области показан на фиг.9.The process in the time domain is shown in Fig.9.
Следующий этап - это вычисление 720 взаимной корреляции Rξ,k (параметр сравнения может быть равен результату взаимной корреляции) части амплитудно-спектральных характеристик исходного сигнала и сигнала с расширенным диапазоном частот, что математически выражается следующим образом:The next step is the calculation of 720 cross-correlation R ξ, k (the comparison parameter may be equal to the result of cross-correlation) of the amplitude-spectral characteristics of the original signal and the signal with an extended frequency range, which is mathematically expressed as follows:
приat
Фξ(ω):≡Ψξ(ω):≡0∀ω<0; v≤ΛΦ ξ (ω): ≡Ψ ξ (ω): ≡0∀ω <0; v≤Λ
δ обозначает максимальную задержку (максимальную частоту смещения), для которой рассчитывается взаимная корреляция. Если взаимная корреляция должна быть рассчитана со смещением, т.е. предпочтение отдается небольшим задержкам и, соответственно, большим наложениям, необходимо выбрать β=0. Наоборот, если необходимо компенсировать то, что меньшее число цифровых результатов быстрых преобразований Фурье (FFt-bins) накладываются друг на друга при больших задержках, то необходимо выбрать β=1. В целом, можно произвольно выбирать 0≤β∈P. Дополнительно или в качестве альтернативы можно принять 2<δ∈N; mod(δ,2)=0 для того, чтобы выбрать область взаимной корреляции несколько большую, чем созданная полоса частот (патч). При этом область, которая рассматривается при взаимной корреляции, может быть расширена с помощью с обоих сторон спектра определенной полосы (патча).δ denotes the maximum delay (maximum offset frequency) for which cross-correlation is calculated. If cross-correlation should be calculated with an offset, i.e. preference is given to small delays and, accordingly, large overlays, it is necessary to choose β = 0. On the contrary, if it is necessary to compensate for the fact that a smaller number of digital results of fast Fourier transforms (FFt-bins) overlap each other with large delays, then it is necessary to choose β = 1. In general, 0≤β∈P can be arbitrarily chosen. Additionally or alternatively, 2 <δ∈N; mod (δ, 2) = 0 in order to select the cross-correlation region slightly larger than the created frequency band (patch). Moreover, the region that is considered in cross-correlation can be expanded with on both sides of the spectrum of a certain band (patch).
На основе результатов взаимной корреляции определяется максимум взаимной корреляции 730Based on the results of cross-correlation, the maximum cross-correlation is determined 730
и lag dξ,k взаимной корреляцииand lag d ξ, k cross-correlation
Rξ,k(dξ,k)=mξ,k R ξ, k (d ξ, k ) = m ξ, k
Дополнительно определяются коэффициенты энергии или мощности в патче при помощи спектров плотности мощности:Additionally, energy or power factors in the patch are determined using power density spectra:
Если невозможно определить четкого максимума 924, задержка устанавливается обратно как 0 (на схеме показано под номером 922). В противном случае предполагаемая задержка 918 может оказаться задержкой, соответствующей максимальной взаимной корреляции. Для этого определяется подходящий пороговый критерий dξ,k>τ, где необходимо выбрать τ. Кроме этого может наблюдаться изгиб или ровная часть спектра (SFN) взаимной корреляции, например:If it is impossible to determine a clear maximum of 924, the delay is set back to 0 (the diagram shows number 922). Otherwise, the estimated
илиor
приat
Задержки dξ,k и параметры плотности мощности ζξ,k можно интерполировать 926 для того, чтобы получить значение для каждого временного интервала:Delays d ξ, k and power density parameters ζ ξ, k can be interpolated 926 in order to obtain a value for each time interval:
ζk(n)=interp(cξ,k); λk(n)=interp(dξ,k).ζ k (n) = interp (c ξ, k ); λ k (n) = interp (d ξ, k ).
Далее после модификаций, амплитудных преобразований и частотного сдвига определяется общая функция модуляции:Further, after modifications, amplitude transformations and frequency shift, the general modulation function is determined:
Общая функция модуляции или параметры общей функции модуляции обеспечиваются 740 вместе с выходным сигналом для дальнейшего хранения или передачи.A common modulation function or parameters of a common modulation function are provided 740 along with an output signal for further storage or transmission.
Дополнительно могут определяться параметры для корректировки шума и/или тональности.Additionally, parameters can be determined to adjust noise and / or tonality.
Модуляция на стороне декодера проводится согласно формуле:Modulation on the side of the decoder is carried out according to the formula:
а также дополнительно количество k частичных модуляций (если присутствует более чем один патч). Для этого общая функция модуляции µk(n) или µ(n) или параметры ζk(n) и λk(n) или cξ,k и dξ,k общей функции модуляции кодируются подходящим способом, например квантованием. Если есть необходимость, частота выборки может быть уменьшена и введен гистерезис.and also an additional number of k partial modulations (if more than one patch is present). For this, the common modulation function µ k (n) or µ (n) or the parameters ζ k (n) and λ k (n) or c ξ, k and d ξ, k of the general modulation function are encoded in a suitable way, for example, by quantization. If necessary, the sampling rate can be reduced and hysteresis introduced.
Вычисление задержки можно опустить, если отсутствует тональный сигнал, например период молчания, переходного момента, шума. В этих случаях задержка может быть установлена на значении 0.The delay calculation can be omitted if there is no tone, such as a period of silence, a transition moment, noise. In these cases, the delay can be set to 0.
На фиг.10 детально рассматривается пример 1000, где определяется задержка.10, an example 1000 is examined in detail where a delay is determined.
Для временного фрейма или окна ξ=i 1010 задержка v устанавливается на минус λ в качестве первоначального значения. Затем вычисляется взаимная корреляция Rξ,k(v) 720. Если v меньше, чем Λ 1030, v увеличивается 1032 и вычисляется 720 следующий параметр сравнения в рамках взаимной корреляции. Если v равен или больше, чем Λ 1030, может быть определена 730 задержка, соответствующая максимальной вычисленной взаимной корреляции. Если максимум четко определяется 924, то определенная задержка используется как параметр dξ,k 918. В противном случае задержка устанавливается на значении 0 и используется как параметр dξ,k=0922.For a time frame or window ξ = i 1010, the delay v is set to minus λ as the initial value. Then the cross-correlation R ξ, k (v) 720 is calculated. If v is less than
Далее весь процесс повторяется 1040 для следующего временного фрейма ξ=ξ+1 1050. Определенные задержки подвергаются интерполяции 926 для того, чтобы получить параметр для каждого временного интервала N.Next, the whole process is repeated 1040 for the next time frame ξ = ξ + 1 1050. Certain delays are interpolated 926 in order to obtain a parameter for each time interval N.
Вычисление множества параметров сравнения, например результатов взаимной корреляции, может проводиться параллельно, если используется необходимое количество компараторов. Обработка различных временных фреймов может проводиться также параллельно, если необходимое аппаратное обеспечение используется несколько раз. Цикл вычислений взаимной корреляции начинается при +Λ и может быть уменьшен при каждом цикле до v≤Λ.The calculation of many comparison parameters, for example, cross-correlation results, can be carried out in parallel if the required number of comparators is used. Processing of various time frames can also be carried out in parallel if the necessary hardware is used several times. The cross-correlation calculation cycle starts at + Λ and can be reduced at each cycle to v≤Λ.
На фиг.11 показана схематическая иллюстрация интерполяции 926 частот смещения разных временных фреймов, временных интервалов или окон. На фиг.11а показана интерполяция 1100, если временные фреймы не пересекаются. Задержка dξ,k определяется для всего временного фрейма 1110. Самым простым способом интерполяции параметра для каждого временного интервала 1120 является установка параметров временного фрейма 1110, равных соответствующей задержке dξ,k для всех временных интервалов 1120. На границах временного фрейма может быть выбрана задержка предыдущего или последующего временного фрейма. Например, параметры от λk(n) до λk(n+3) равны dξ,k, а параметры от λk(n+4) до λk(n+7) равны dξ+1,k.11 shows a schematic illustration of
Как альтернатива задержки временных фреймов 1110 могут интерполироваться линейно между временными фреймами, например:Alternatively, the delays of
λk(n+2)=dξ,k λ k (n + 2) = d ξ, k
На фиг.11В показан пример 1150 для пересекающихся временных фреймов 1110. В этом случае один временной интервал 1120 относится к более чем одному временному фрейму 1110. Таким образом, более чем одна определенная задержка относится к одному временному интервалу 1120. Так, определенные задержки могут интерполироваться 926 для того, чтобы получить один параметр для каждого временного интервала 1120. Определенные задержки, соответствующие одному временному интервалу 1120, могут интерполироваться линейно. Например, возможна следующая интерполяция:11B shows an example 1150 for intersecting
λk(n)=dξ-1,k λ k (n) = d ξ-1, k
λk(n+2)= dξ,k λ k (n + 2) = d ξ, k
В качестве альтернативы интерполяция может проводиться, например, с помощью медиального фильтрования.Alternatively, the interpolation can be carried out, for example, using medial filtering.
Интерполяция может проводиться с помощью особых средств, предназначенных для интерполяции. Эти средства могут быть частью блока извлечения параметров или выходного интерфейса, а также отдельным блоком.Interpolation can be carried out using special tools designed for interpolation. These tools can be part of a parameter retrieval unit or output interface, as well as a separate unit.
На стороне декодера расширение диапазона частот проводится согласно формуле:On the side of the decoder, the extension of the frequency range is carried out according to the formula:
После декодирования и φLF(N) как выходного сигнала основного кодера. Дополнительно может быть адаптирован с помощью параметров, полученных заранее от исходного сигнала, по уровню тональности и/или шума.After decoding and φ LF (N) as the output of the main encoder. Additionally can be adapted using parameters obtained in advance from the original signal, according to the level of tonality and / or noise.
Вычисление общей функции модуляции на стороне декодера производится согласно одной из двух формул, указанных ниже:The calculation of the total modulation function on the decoder side is performed according to one of the two formulas indicated below:
иand
ψ(n)=φLF(n)·µ(n)+noise(n)ψ (n) = φ LF (n) μ (n) + noise (n)
Воображаемая часть сигнала может быть опущена:The imaginary part of the signal can be omitted:
o(n)=Re(ψ(n))o (n) = Re (ψ (n))
Далее, как указывалось выше, может следовать корректировка тональности с помощью, например, обратного фильтрования.Further, as indicated above, a tonality adjustment may be followed by, for example, reverse filtering.
На фиг.12 показана блок-схема декодера, увеличивающего полосу частот, 1200 для получения аудио сигнала с расширенным диапазоном частот 532 на основе входного аудио сигнала 502 согласно одному из вариантов реализации настоящего изобретения. Декодер, увеличивающий полосу частот, 1200 включает генератор патчей 1210, компаратор 1220, блок объединения 1230 и выходной интерфейс 1240. Генератор патчей 1210 соединен с компаратором 1220, компаратор 1220 соединен с блоком объединения 1230, блок объединения 1230 соединен с выходным интерфейсом 1240.12 is a block diagram of a bandwidth increasing decoder 1200 for receiving an extended
Генератор патчей 1210 создает, как минимум, один сигнал с полосой высоких частот 1212, который имеет полосу высоких частот на основе входного сигнала 502, при этом нижняя предельная частота полосы высоких частот созданного сигнала 1212 ниже, чем верхняя предельная частота входного аудио сигнала 502. Различные сигналы с полосами высоких частот 1212 имеют различные частоты в пределах полосы высоких частот.The
Компаратор 1220 вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала 502 и созданного сигнала с полосой высоких частот 1212. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе различных частот смещения между входным аудио сигналом 502 и созданным сигналом с полосой высоких частот 1212. Далее компаратор выделяет параметр сравнения из множества параметров сравнения так, чтобы он соответствовал заранее заданному критерию.
Блок объединения 1230 соединяет входной аудио сигнал 502 и созданный сигнал с полосой высоких частот 1212 для того, чтобы получить сигнал с расширенным диапазоном частот 532, при этом созданный сигнал с полосой высоких частот основывается на частоте смещения, соответствующей выделенному параметру сравнения.The combining
Выходной интерфейс 1240 обеспечивает вывод сигнала с расширенным диапазоном частот 532.The
По сравнению с декодером, показанным на фиг.5, рассматриваемый декодер 1200 сам определяет частоту смещения. Таким образом, отсутствует необходимость в получении этого параметра с входным аудио сигналом 502. В этом случае битрейт для передачи или хранения аудио сигналов может быть уменьшен.Compared to the decoder shown in FIG. 5, the decoder 1200 in question itself determines the offset frequency. Thus, there is no need to obtain this parameter with the
Как указывалось при рассмотрении фиг.1, генератор патчей 1210 может создавать множество сигналов с полосой высоких частот с различными частотами смещения или один сигнал с полосой высоких частот, который сдвигается при помощи различных частот смещения. Возможно также использование комбинации двух этих возможностей.As indicated by referring to FIG. 1,
На фиг.13 показана схема способа 1300 получения сигнала с расширенным диапазоном частот согласно одному из вариантов реализации настоящего изобретения. Способ 1300 включает создание 1310, как минимум, одного сигнала с полосой высоких частот, вычисление 1320 мнжества параметров сравнения, выделение 1330 одного параметра из множества параметров сравнения, объединение 1340 входного аудио сигнала и созданного сигнала с полосой высоких частот, а также вывод 1350 сигнала с расширенным диапазоном частот.On Fig shows a diagram of a
Сигнал с расширенным диапазоном частот имеет полосу высоких частот, созданную на основе входного аудио сигнала. Нижняя предельная частота полосы высоких частот сигнала с расширенным диапазоном частот ниже, чем верхняя предельная частота входного аудио сигнала. Если генерируются различные сигналы, то сигналы с полосами высоких частот имеют различные частоты в пределах полосы высоких частот.A signal with an extended frequency range has a high frequency band created based on the input audio signal. The lower limit frequency of the high frequency band of the signal with the extended frequency range is lower than the upper limit frequency of the input audio signal. If different signals are generated, then signals with high frequency bands have different frequencies within the high frequency band.
Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе различных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот.The comparison parameter is calculated based on a comparison of the input audio signal and the generated signal with the high frequency band. Each comparison parameter from a plurality of comparison parameters is calculated based on different bias frequencies between the input audio signal and the generated signal with a high frequency band.
Выделенный параметр сравнения соответствует заранее заданному критерию.The highlighted comparison parameter matches a predefined criterion.
Созданный сигнал с полосой высоких частот, который соединяется с входным аудио сигналом для того, чтобы получить сигнал с расширенным диапазоном частот, основывается на частоте смещения, соответствующей выделенному параметру сравнения.The generated signal with a high frequency band, which is connected to the input audio signal in order to obtain a signal with an extended frequency range, is based on the offset frequency corresponding to the selected comparison parameter.
На фиг.14 показана схема способа 1400 для получения аудио сигнала с расширенным диапазоном частот согласно одному из вариантов реализации настоящего изобретения.On Fig shows a diagram of a
После получения 1402 битового потока, содержащего входной аудио сигнал, основной декодер декодирует 1410 входной аудио сигнал. На основе входного аудио сигнала генерируется 1310 сигнал с полосой высоких частот и вычисляется 1320 множество параметров сравнения в плане взаимной корреляции между входным аудио сигналом и созданным сигналом с полосой высоких частот. Затем определяется 1330 параметр сравнения, соответствующий заранее заданному критерию; параметр сравнения также называется предполагаемой задержкой.After receiving 1402 bit stream containing the input audio signal, the main decoder decodes 1410 the input audio signal. Based on the input audio signal, a 1310 signal with a high frequency band is generated and 1320 a plurality of comparison parameters are calculated in terms of mutual correlation between the input audio signal and the generated signal with a high frequency band. Then, a comparison parameter corresponding to a predetermined criterion is determined 1330; The comparison parameter is also called the estimated delay.
На основе частоты смещения, которая соответствует определенному параметру сравнения, модулятор модулирует 1420 входной аудио сигнал. Дополнительно может быть извлечен 1430 параметр из полученного битового потока 1402 для адаптации, например, плотности мощности модулированного сигнала. Модулированный сигнал затем соединяется 1340 с входным аудио сигналом. Кроме этого могут корректироваться 1440 тональность и шум сигнала с расширенным диапазоном частот. Этот этап может проводиться до объединения с входным сигналом. Затем аудио данные, а именно аудио сигнал с расширенным диапазоном частот, направляются 1350, например, для аудио воспроизведения.Based on a bias frequency that corresponds to a specific comparison parameter, the modulator modulates 1420 the input audio signal. Additionally, a
В данном случае вычисление модуляции, которая является непостоянной во времени, проводится на стороне декодера.In this case, the calculation of the modulation, which is variable over time, is carried out on the side of the decoder.
В отличие от модулятора, который модулирует 1420 входной аудио сигнал и создает патч, может использоваться, например, ранее созданный сигнал с полосой высоких частот, либо генератор патчей может создавать сигнал с полосой высоких частот (патч) на основе частоты смещения, которая соответствует определенному параметру сравнения.Unlike a modulator that modulates the
Иными словами, если низкая скорость передачи данных более приоритетна, чем сложная структура декодера, то определение частотной модуляции, которую выполняют модуляторы, может также проводиться на стороне декодера. Для этого на стороне декодера с некоторыми изменениями выполняется алгоритм, показанный на фиг.9. Так как на стороне декодера исходный сигнал не доступен для вычисления взаимной корреляции, корреляция вычисляется между исходным сигналом (входным аудио сигналом) и исходным сигналом (входным аудио сигналом), который подвергся сдвигу в области пересечения. Например, сигнал сдвигается между нулем и αk, например, αk делится на 2, αk делится на 3 или αk делится на 4. αk обозначает границу полосы k, например, α1 обозначает частоту перехода основного кодера.In other words, if a low data rate is more important than the complex structure of the decoder, then the determination of the frequency modulation that the modulators perform can also be done on the side of the decoder. To this end, on the decoder side, with some changes, the algorithm shown in Fig. 9 is executed. Since on the decoder side the original signal is not available for calculating cross-correlation, the correlation is calculated between the original signal (audio input signal) and the original signal (audio input signal), which has undergone a shift in the intersection area. For example, the signal shifts between zero and α k , for example, α k is divided by 2, α k is divided by 3 or α k is divided by 4. α k denotes the boundary of the strip k, for example, α 1 denotes the transition frequency of the main encoder.
Вычисления могут происходить аналогичным образом как на стороне кодера, так и на стороне декодера. На стороне декодера извлекаются параметры для формирования спектра, корректировки шума и/или тональности, которые затем передаются в декодер.Calculations can occur in the same way on the encoder side as well as on the decoder side. On the decoder side, parameters are extracted to form the spectrum, adjust noise and / or tonality, which are then transmitted to the decoder.
На фиг.15 показана блок-схема кодера, увеличивающего полосу частот, 1500 для получения выходного сигнала на основе входного сигнала согласно одному из вариантов реализации настоящего изобретения. Кодер 1500 соответствует кодеру, показанному на фиг.4. Однако кодер 1500 сам не обеспечивает выходной сигнал 132 с индикацией параметра на основе частоты смещения. Он может только определять параметр плотности мощности и факультативные параметры для коррекции тональности и шума и включать индикацию этих параметров в выходной сигнал 132. Параметр плотности мощности (как и другие параметры в случае их вычисления) определяются на основе частоты смещения, соответствующей выделенному параметру сравнения.On Fig shows a block diagram of an encoder that increases the frequency band, 1500 to obtain an output signal based on the input signal according to one embodiment of the present invention. Encoder 1500 corresponds to the encoder shown in FIG. However, the
Например, параметр плотности мощности может указывать соотношение между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот с частотой смещения, соответствующей определенному параметру сравнения. Таким образом, индикация параметра, которая соотносится с параметром плотности мощности и факультативно - с параметрами корректировки тональности и/или шума, основана на частоте смещения, соответствующей определенному параметру сравнения.For example, the power density parameter may indicate the relationship between the
Следующее различие между кодером 1500 и кодером, показанным на фиг.4, заключается в том, что генератор патчей 110 создает сигнал с полосой высоких частот таким же образом, что и генератор патчей декодера 1400. В этом случае кодер 1500 и декодер могут получать одинаковые частоты смещения, поэтому параметры, извлеченные кодером 1500, действительны и для патчей, созданных декодером.The next difference between the
Некоторые варианты настоящего изобретения реализуются посредством устройств и способа расширения полосы частот аудио сигналов во временной области с помощью модуляторов, изменяющихся во времени. Иными словами, патч генерируется с меняющейся предельной частотой, например, для каждого временного интервала, каждого временного фрейма, части временного фрейма или групп временных фреймов.Some variants of the present invention are implemented by means of devices and a method of expanding the frequency band of audio signals in the time domain using modulators that vary in time. In other words, a patch is generated with a changing limit frequency, for example, for each time interval, each time frame, part of a time frame, or groups of time frames.
Описанный способ расширения полосы частот аудио сигнала может применяться на стороне кодера и на стороне декодера, а также только на стороне декодера. В отличие от других известных способов, описанный новый способ может выполнять так называемое гармоническое расширение полосы частот, не требуя точной информации о фундаментальной частоте аудио сигнала. В отличие от так называемых гармонических расширений полосы частот, рассматриваемых, например, в заявке на патент на территории США "F.Nagel, S.Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" под номером US 61/025129, которые производятся при помощи фазовых голосовых кодеров, в данном случае спектр не подвергается расширению, поэтому плотность остается неизменной. Для обеспечения гармонии используется корреляция между расширенной и базовой полосами частот. Эта корреляция вычисляется как на стороне кодера, так и на стороне декодера в зависимости от возможности проведения вычислений, объемов памяти и скорости передачи данных.The described method of expanding the frequency band of an audio signal can be applied on the encoder side and on the decoder side, and also only on the decoder side. Unlike other known methods, the described new method can perform the so-called harmonic extension of the frequency band without requiring accurate information about the fundamental frequency of the audio signal. In contrast to the so-called harmonic bandwidth extensions, considered, for example, in the patent application in the United States "F.Nagel, S. Disch:" Apparatus and method of harmonic bandwidth extension in audio signals "" under the number US 61/025129, which are produced using phase voice encoders, in this case, the spectrum is not subject to expansion, so the density remains unchanged. To ensure harmony, a correlation is used between the extended and base frequency bands. This correlation is calculated both on the side of the encoder and on the side of the decoder, depending on the possibility of the calculations, the amount of memory and the data rate.
Например, расширение полосы частот может выполняться при помощи амплитудной модуляции (AM) или частотного сдвига посредством односторонней модуляции полосы частот (SSB). В ходе последующей обработки в соответствии с дополнительными параметрами предпринимается попытка приблизить огибающую спектра, уровень шума и другие параметры к исходным сигналам.For example, bandwidth expansion can be performed using amplitude modulation (AM) or frequency shift through one-way bandwidth modulation (SSB). In the course of the subsequent processing, in accordance with additional parameters, an attempt is made to bring the spectral envelope, noise level and other parameters to the original signals.
Новый способ преобразования сигналов позволяет избежать проблем, которые появляются при простом копировании или при операции зеркального отображения, т.к. в данном случае создается гармоническое корректное продолжение спектра при помощи меняющейся во времени предельной переходной частоты между диапазоном низких частот (LF) и диапазоном высоких частот (HF), а также между последующими полосами высоких частот, так называемыми патчами. Предельные частоты выбираются таким образом, что созданные патчи максимально соответствуют реальному гармоническому растру.The new signal conversion method avoids the problems that arise during simple copying or during the mirroring operation, as in this case, a harmonious correct continuation of the spectrum is created with the help of a time-varying transition frequency limit between the low frequency range (LF) and the high frequency range (HF), as well as between subsequent high frequency bands, the so-called patches. Limit frequencies are selected in such a way that the created patches match the actual harmonic raster as much as possible.
На фиг.16 показан модулятор с тремя меняющимися во времени амплитудами и предельными частотами, с помощью которых могут быть созданы три патча посредством односторонней модуляции базовых полос. На фиг.16А показана диаграмма 1600А спектра сигнала с расширенным диапазоном частот при использовании меняющихся во времени предельных частот 1610. На фиг.16В показана диаграмма 1600В спектра аудио сигнала, состоящего из трех тонов. В отличие от спектрограммы, показанной на фиг.18В, линии 1620 значительно менее размыты.On Fig shows a modulator with three time-varying amplitudes and limit frequencies, with which three patches can be created by one-way modulation of the base bands. On figa shows a diagram 1600A of the spectrum of the signal with an extended frequency range when using time-varying
На фиг.17 показана диаграмма 1700. Спектр плотности мощности трех тонов исходного аудио сигнала показан под номером 1710, сигнала с постоянной предельной частотой - под номером 1720, сигнала с переменной предельной частотой - под номером 1730. В отличие от использования постоянной предельной частоты, гармоническая структура сохраняется при использовании переменной предельной частоты 1730.17 shows a diagram 1700. The power density spectrum of the three tones of the original audio signal is shown at 1710, the signal with a constant limit frequency at 1720, the signal with a constant limit frequency at 1730. In contrast to using a constant limit frequency, harmonic the structure is preserved using a variable limiting frequency of 1730.
При гармоническом продолжении спектра можно избежать проблем в точке перехода между базовой полосой (основной кодер) и расширенной полосой, а также между последующими патчами. Без оценки F0, которая является необходимым условием функционирования системы, возможно гармоническое продолжение случайных сигналов без слышимых помех, при этом не нарушаются гармония и переходные звуковые моменты.With harmonious continuation of the spectrum, problems can be avoided at the transition point between the base band (main encoder) and the extended band, as well as between subsequent patches. Without an estimate of F 0 , which is a necessary condition for the functioning of the system, a harmonic continuation of random signals without audible interference is possible, while harmony and transient sound moments are not violated.
Варианты реализации настоящего изобретения относятся к способу, который подходит для всех аудио приложений, где не доступен полный диапазон частот.Embodiments of the present invention relate to a method that is suitable for all audio applications where the full frequency range is not available.
Например, способ можно применять для трансляции аудио информации с помощью цифрового радио, Интернет потока или приложений, применяющих аудио коммуникацию.For example, the method can be used to broadcast audio information using digital radio, the Internet stream or applications that use audio communication.
Другие варианты реализации настоящего изобретения относятся к декодеру, увеличивающему полосу частот, который получает сигнал с расширенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала, при этом параметрический сигнал указывает на частоту сдвига и параметр плотности мощности. Декодер, увеличивающий полосу частот, включает генератор патчей, блок объединения и выходной интерфейс. Генератор патчей создает сигнал с полосой высоких частот, при этом полоса высоких частот созданного сигнала генерируется на основе частотного сдвига полосы частот входного аудио сигнала. Частотный сдвиг производится на основе частоты смещения. Генератор патчей увеличивает или уменьшает полосу высоких частот созданного сигнала при помощи коэффициента, равного значению параметра плотности мощности или равного величине, обратной значению параметра плотности мощности. Блок объединения соединяет созданный сигнал с полосой высоких частот и входной аудио сигнал для получения аудио сигнала с расширенным диапазоном частот. Выходной интерфейс обеспечивает вывод сигнала с расширенным диапазоном частот.Other embodiments of the present invention relate to a bandwidth increasing decoder that receives a signal with an extended frequency range based on an input audio signal and a parametric signal, wherein the parametric signal indicates a shift frequency and a power density parameter. The bandwidth increasing decoder includes a patch generator, a combiner, and an output interface. The patch generator creates a signal with a high frequency band, and the high frequency band of the generated signal is generated based on the frequency shift of the frequency band of the input audio signal. Frequency offset is based on the offset frequency. The patch generator increases or decreases the high frequency band of the generated signal by using a coefficient equal to the value of the power density parameter or equal to the value inverse to the value of the power density parameter. The combining unit connects the generated signal with a high frequency band and an input audio signal to obtain an audio signal with an extended frequency range. The output interface provides a signal output with an extended frequency range.
Остальные варианты реализации настоящего изобретения относятся к декодеру, увеличивающему полосу частот, который был описан выше, при этом генератор патчей увеличивает или уменьшает полосу высоких частот сигнала с полосой высоких частот при помощи коэффициента, равного значению параметра плотности мощности или равного величине, обратной значению параметра плотности мощности. Параметр плотности мощности в данном случае указывается во входном аудио сигнале.Other embodiments of the present invention relate to a decoder increasing the frequency band as described above, wherein the patch generator increases or decreases the high frequency band of the signal with the high frequency band by a factor equal to the value of the power density parameter or equal to the reciprocal of the density parameter power. The power density parameter in this case is indicated in the input audio signal.
Несмотря на то что настоящее изобретение было описано в нескольких вариантах реализации, возможны другие изменения и варианты функционирования в рамках данного изобретения. Необходимо отметить, что существует множество альтернативных способов реализации способов, а также путей композиции настоящего изобретения. Предполагается, что нижеследующая формула включает все подобные опции и изменения, т.к. они не выходят за рамки объема и сущности настоящего изобретения.Despite the fact that the present invention has been described in several embodiments, other changes and functioning options are possible within the scope of this invention. It should be noted that there are many alternative ways to implement the methods, as well as the ways of composition of the present invention. The following formula is intended to include all such options and changes as they do not go beyond the scope and essence of the present invention.
Необходимо отметить, что в зависимости от условий схема изобретения может быть реализована в качестве программного обеспечения. Реализация изобретения может быть произведена на цифровых средствах хранения информации. Например, на гибком диске или CD, которые являются читаемыми и имеют возможность работы с программируемой компьютерной системой для того, чтобы выполнялся соответствующий способ. В целом, изобретение состоит из компьютерного программного продукта с программным кодом, который хранится на читаемом носителе, для осуществления изобретенного способа, когда программный продукт выполняется на компьютере. Иными словами, изобретение может быть реализовано как компьютерная программа с программным кодом для осуществления способа, когда компьютерный программный продукт выполняется на компьютере.It should be noted that, depending on the conditions, the scheme of the invention can be implemented as software. The implementation of the invention can be made on digital storage media. For example, on a floppy disk or CD, which are readable and have the ability to work with a programmable computer system in order to perform the corresponding method. In general, the invention consists of a computer program product with program code that is stored on a readable medium for implementing the inventive method when the program product is executed on a computer. In other words, the invention can be implemented as a computer program with program code for implementing the method when the computer program product is executed on a computer.
Claims (17)
компаратор (120) вычисляет множество параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудиосигнала (102) и созданного сигнала с полосой высоких частот (112); каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудиосигналом (102) и созданным сигналом с полосой высоких частот (112); компаратор (120) определяет один параметр сравнения из множества параметров сравнения так, чтобы выделенный параметр сравнения соответствовал заранее заданному критерию;
выходной интерфейс (130) обеспечивает выходной сигнал (132) для последующей передачи или хранения, при этом выходной сигнал (132) включает параметр на основе частоты смещения, который соответствует определенному параметру сравнения.1. Audio encoder (100), (400), (1500) to obtain the output signal (132) using the input signal (101), including a patch generator (110), designed to generate at least one high-frequency signal with an extended band frequencies (112), which contains a high frequency band based on the low frequency band of the input audio signal (102), while if different high-frequency signals with an extended frequency band (112) are generated, they contain different frequencies in their bands;
a comparator (120) calculates a plurality of comparison parameters, wherein the comparison parameter is calculated based on a comparison of the input audio signal (102) and the generated signal with the high frequency band (112); each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal (102) and the generated signal with a high frequency band (112); the comparator (120) determines one comparison parameter from the set of comparison parameters so that the selected comparison parameter corresponds to a predetermined criterion;
the output interface (130) provides an output signal (132) for subsequent transmission or storage, while the output signal (132) includes a parameter based on a bias frequency that corresponds to a specific comparison parameter.
блок объединения (529), который соединяет сигнал с полосой высоких частот (512) и входной аудио сигнал (502) для получения сигнала с расширенным диапазоном частот (532);
при этом блок объединения предусматривает возможность пренебрегать частью полосы высоких частот ВЧ-сигнала с расширенной полосой (512), где пренебрегаемая часть высокочастотной полосы ВЧ-сигнала с расширенной полосой (512) содержит частоты, более низкие, чем верхняя частота среза входного аудиосигнала (502); и
выходной интерфейс (530) обеспечивает вывод сигнала с расширенным диапазоном частот (532).4. The bandwidth expansion decoder (500), (600) for receiving an audio signal with an extended frequency range (532) based on the input audio signal (502) and the parametric signal (504), while the parametric signal (504) includes an indication of the frequency bias and power density parameter; a bandwidth increasing decoder including a patch generator (510) that generates a signal with a high frequency band (512), wherein the high frequency band of the signal with the high frequency band (512) is created based on the frequency shift of the frequency band of the input audio signal (502) ; frequency offset is based on the offset frequency; the patch generator (510) increases or decreases the high frequency band of the signal with the high frequency band (512) by a factor equal to the value of the power density parameter or, correspondingly, equal to the inverse of the power density parameter;
a combining unit (529) that connects the signal to the high frequency band (512) and the input audio signal (502) to obtain a signal with an extended frequency range (532);
however, the combining unit provides the ability to neglect part of the high frequency band of the RF signal with an extended band (512), where the neglected part of the high frequency band of the RF signal with an extended band (512) contains frequencies lower than the upper cut-off frequency of the input audio signal (502) ; and
the output interface (530) provides a signal output with an extended frequency range (532).
компаратор (1220) вычисляет множество параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудио сигнала (502) и созданного сигнала с полосой высоких частот (1212); каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом (502) и созданным сигналом с полосой высоких частот (1212);
компаратор (1220) определяет один параметр сравнения из множества параметров сравнения так, чтобы выделенный параметр сравнения соответствовал заранее заданному критерию;
блок объединения (1230) соединяет входной аудио сигнал (502) и сигнал с полосой высоких частот для получения сигнала с расширенным диапазоном частот (532), при этом созданный сигнал с полосой высоких частот, который используется для получения сигнала с расширенным диапазоном частот (532), основан на частоте смещения, соответствующей определенному параметру сравнения;
выходной интерфейс (1240) обеспечивает вывод сигнала с расширенным диапазоном частот (532).8. A bandwidth expansion decoder (1200) for receiving a signal with an extended frequency range (532) based on an input audio signal (502), including a patch generator (1210) that generates at least one signal with a high frequency band (1212) having a high frequency band based on an input signal (502), wherein the lower limit frequency of the high frequency band of the generated signal with the high frequency band (1212) is lower than the upper limit frequency of the input audio signal (502); if different signals with high frequency bands (1212) are generated, then signals (1212) have different frequencies within the high frequency bands;
a comparator (1220) calculates a plurality of comparison parameters, wherein the comparison parameter is calculated based on a comparison of the input audio signal (502) and the generated signal with the high frequency band (1212); each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal (502) and the generated signal with a high frequency band (1212);
the comparator (1220) determines one comparison parameter from the set of comparison parameters so that the selected comparison parameter matches a predetermined criterion;
the combining unit (1230) connects the input audio signal (502) and the signal with a high frequency band to obtain a signal with an extended frequency range (532), while the generated signal with a high frequency band that is used to obtain a signal with an extended frequency range (532) based on a bias frequency corresponding to a specific comparison parameter;
the output interface (1240) provides a signal output with an extended frequency range (532).
вычисление (720) множества параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот; каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот;
определение (730) параметра сравнения из множества параметров сравнения, при этом выделенный параметр сравнения соответствует заранее заданному критерию;
обеспечение (740) выходного сигнала для последующей передачи или хранения, при этом выходной сигнал включает индикацию параметра на основе частоты смещения, которая соответствует определенному параметру сравнения.12. A method (700) for obtaining an output signal using an input audio signal, including generating (710) at least one signal with an extended frequency band, wherein the generated signal has a high frequency band; the high frequency band of the generated signal is based on the low frequency band of the input audio signal; if different signals with high frequency bands are generated, then the created signals have different frequencies within the high frequency bands;
calculating (720) a plurality of comparison parameters, wherein the comparison parameter is calculated based on comparing the input audio signal and the generated signal with the high frequency band; each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal and the generated signal with a high frequency band;
determining (730) a comparison parameter from a plurality of comparison parameters, wherein the highlighted comparison parameter corresponds to a predetermined criterion;
providing (740) an output signal for subsequent transmission or storage, wherein the output signal includes an indication of a parameter based on an offset frequency that corresponds to a specific comparison parameter.
генерацию (810) ВЧ-сигнала с расширенной полосой частот, при этом полоса высоких частот созданного сигнала генерируется на основе частотного сдвига полосы частот входного аудио сигнала; частотный сдвиг, в свою очередь, основывается на частоте смещения;
увеличение (820) или уменьшение полосы частот сигнала с полосой высоких частот на коэффициент, равный значению параметра плотности мощности или равный обратному значению параметра плотности мощности;
объединение (830) сигнала с полосой высоких частот и входного аудио сигнала для получения аудио сигнала с расширенным диапазоном частот;
при этом частью полосы высоких частот ВЧ-сигнала с расширенной полосой частот (512) можно пренебречь, а пренебрегаемая часть высокочастотной полосы ВЧ-сигнала с расширенной полосой частот (512) содержит частоты, более низкие, чем верхняя частота среза входного аудио сигнала (502); и
вывод (840) аудиосигнала с расширенной полосой частот.13. A method (800) for generating an audio signal with an extended frequency band based on an input audio signal and a parametric signal containing an indication of the offset frequency and the power density parameter, including:
generating (810) an RF signal with an extended frequency band, wherein the high frequency band of the generated signal is generated based on the frequency shift of the frequency band of the input audio signal; the frequency shift, in turn, is based on the bias frequency;
increase (820) or decrease the frequency band of the signal with the high-frequency band by a factor equal to the value of the power density parameter or equal to the inverse of the power density parameter;
combining (830) a signal with a high frequency band and an input audio signal to produce an audio signal with an extended frequency range;
while part of the high-frequency band of the RF signal with the extended frequency band (512) can be neglected, and the neglected part of the high-frequency band of the RF signal with the expanded frequency band (512) contains frequencies lower than the upper cut-off frequency of the input audio signal (502) ; and
output (840) of an audio signal with an extended frequency band.
если генерируются разные сигналы с полосами высоких частот, то созданные сигналы имеют разные частоты в рамках полос высоких частот;
вычисление (1320) множества параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот; каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот;
определение (1330) параметра сравнения из множества параметров сравнения, приэтом выделенный параметр сравнения соответствует заранее заданному критерию;
объединение (1340) входного аудио сигнала и сигнала с полосой высоких частот для получения аудио сигнала с расширенным диапазоном частот; при этом сигнал с расширенным диапазоном частот основывается на частоте смещения, которая соответствует определенному параметру компенсации;
вывод (1350) аудио сигнала с расширенным диапазоном частот.14. A method (1300) for generating a signal with an extended frequency range based on an input audio signal, including generating (1310) at least one signal with a high frequency band based on the input audio signal, wherein the lower limit frequency of the high frequency band of the generated signal is lower than the upper limit frequency of the input audio signal;
if different signals with high frequency bands are generated, then the created signals have different frequencies within the high frequency bands;
calculating (1320) a plurality of comparison parameters, wherein the comparison parameter is calculated based on comparing the input audio signal and the generated signal with the high frequency band; each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal and the generated signal with a high frequency band;
determining (1330) the comparison parameter from the plurality of comparison parameters, wherein the highlighted comparison parameter corresponds to a predetermined criterion;
combining (1340) an input audio signal and a signal with a high frequency band to obtain an audio signal with an extended frequency range; wherein the signal with an extended frequency range is based on a bias frequency that corresponds to a specific compensation parameter;
output (1350) of an audio signal with an extended frequency range.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12252208P | 2008-12-15 | 2008-12-15 | |
US61/122,522 | 2008-12-15 | ||
PCT/EP2009/066980 WO2010069885A1 (en) | 2008-12-15 | 2009-12-11 | Audio encoder and bandwidth extension decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2011126331A RU2011126331A (en) | 2013-01-10 |
RU2523035C2 true RU2523035C2 (en) | 2014-07-20 |
Family
ID=42046434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011126331/08A RU2523035C2 (en) | 2008-12-15 | 2009-12-11 | Audio encoder and bandwidth extension decoder |
Country Status (2)
Country | Link |
---|---|
RU (1) | RU2523035C2 (en) |
WO (1) | WO2010070643A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL216903A (en) * | 2010-12-10 | 2016-09-29 | Advanced Vision Tech (A V T ) Ltd | Conveying apparatus with an imaging backing surface |
RU2608447C1 (en) | 2013-01-29 | 2017-01-18 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Device and method for generating extended by frequency signal using subranges time smoothing |
TWI557726B (en) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | System and method for determining a master scale factor band table for a highband signal of an audio signal |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2005106296A (en) * | 2002-08-08 | 2005-08-27 | Квэлкомм Инкорпорейтед (US) | ADAPTED TO BAND QUANTUM QUANTIZATION |
EP1636791B1 (en) * | 2003-06-25 | 2007-03-07 | Coding Technologies AB | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
RU2323469C2 (en) * | 2003-10-02 | 2008-04-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Device and method for processing at least two input values |
RU2325708C2 (en) * | 2003-10-02 | 2008-05-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Device and method for processing signal containing sequence of discrete values |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5448949A (en) | 1993-08-24 | 1995-09-12 | Heidelberger Druckmaschinen Ag | Method and device for adjusting a contact pressure between ink-carrying cylinders of a printing machine |
US6129015A (en) | 1993-11-23 | 2000-10-10 | Quad/Tech, Inc. | Method and apparatus for registering color in a printing press |
US5812705A (en) | 1995-02-28 | 1998-09-22 | Goss Graphic Systems, Inc. | Device for automatically aligning a production copy image with a reference copy image in a printing press control system |
US5790186A (en) * | 1995-12-27 | 1998-08-04 | Advanced Vision Technology (A.V.T.) Ltd. | Apparatus and method for reducing shade effects during print quality control |
US6166366A (en) | 1997-07-23 | 2000-12-26 | Cc1, Inc. | System and method for monitoring and controlling the deposition of pattern and overall material coatings |
DE19855177A1 (en) | 1998-11-30 | 2000-06-08 | Windmoeller & Hoelscher | Circumferential and lateral register adjustment method for printing roller of printing machine by comparing actual position of individual images with desired position and adjusting rollers accordingly |
DE20122584U1 (en) | 2001-03-27 | 2006-07-27 | Windmöller & Hölscher Kg | Print image setting device for rotary printing machine has camera feeding successively acquired print images to control or regulating unit that produces signals for participating rollers |
ATE418453T1 (en) * | 2004-03-23 | 2009-01-15 | Koenig & Bauer Ag | PRINTING MACHINE WITH AN INLINE INSPECTION SYSTEM |
-
2009
- 2009-12-11 RU RU2011126331/08A patent/RU2523035C2/en active
- 2009-12-15 WO PCT/IL2009/001192 patent/WO2010070643A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2005106296A (en) * | 2002-08-08 | 2005-08-27 | Квэлкомм Инкорпорейтед (US) | ADAPTED TO BAND QUANTUM QUANTIZATION |
EP1636791B1 (en) * | 2003-06-25 | 2007-03-07 | Coding Technologies AB | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
RU2323469C2 (en) * | 2003-10-02 | 2008-04-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Device and method for processing at least two input values |
RU2325708C2 (en) * | 2003-10-02 | 2008-05-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Device and method for processing signal containing sequence of discrete values |
Also Published As
Publication number | Publication date |
---|---|
WO2010070643A1 (en) | 2010-06-24 |
RU2011126331A (en) | 2013-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11670316B2 (en) | Audio encoder and bandwidth extension decoder | |
RU2523035C2 (en) | Audio encoder and bandwidth extension decoder | |
AU2015203736B2 (en) | Audio encoder and bandwidth extension decoder |